每天140 万亿的数字,让我们看到了中国ai的发展速度和潜力

2024年3月,中国日均Token也就是词元调用量超过了140万亿,相比年初的1000亿增长了1000多倍。这么大的增长,其实说明咱们国家的人工智能发展速度特别快,用AI的地方越来越多了。这个“十五五”开局之年也是数据要素价值释放的一年,大家就问了,这词元到底是什么?张向宏是国家数据专家咨询委员会的委员,也是北京交通大学的教授,他给我们解释了一下。张教授说词元是个特别新的概念,中文名字才出来半年。现在还在探索阶段呢。他觉得词元分两部分看,上游是高质量数据集和数据资源,下游就是智能体和大模型。从这个角度来说,词元就像是搭积木一样,一块一块搭起来才能变成智能体。 张教授还说以后3到5年的时间里,词元会变得像电和自来水一样方便。想用多少就买多少。随着社会发展越来越快,词元的意思也会越来越多。现在怎么给AI创造更多的应用场景呢?他觉得人工智能能不能活得久,主要看能不能在日常生活中用到它。 目前大家用得比较浅层的应用还不多见,特别是像制造业、金融、商贸流通这些行业里跟生产流程、供应链深度绑定的地方还需要加强。张教授也提到建设高质量数据集的时候会碰到一些问题和挑战。第一个是数据挑战:高质量数据虽然方便生活提升效率,但安全性如果不保证好就会有隐私泄露的风险。第二个是算力挑战:GPU虽然有进步但是还有提升空间;电力消耗也是个问题。当然现在绿电方面已经有布局了但还是得未雨绸缪。第三个是技术迭代的问题:这几年国家大模型技术发展快但跟实际应用还有一定距离。 总之吧,每天140万亿这个数字让我们看到了中国AI的发展速度和潜力,也说明我们在向更高水平迈进的过程中还面临着不少挑战和机遇呢。