中国大模型发展的新阶段

人工智能领域里,大家都在关注下一代大模型怎么发展。毕竟这个技术发展得挺快,学者们和业内人士都在盯着它的路径。最近的一些研究和行业会议,让我们更好地了解了中国大模型技术的动向和竞争局面。清华大学唐杰、姚顺雨、杨植麟还有林俊旸这几位专家,还有深度求索公司梁文峰、腾讯公司姚顺雨,在中关村国际创新中心举行的AGI-Next峰会上聚在一起探讨这个问题。这个峰会让业内人士看到了中国大模型发展的新阶段。 最近有报道说深度求索公司新模型马上就要出来了,市场期待很高。梁文峰在论文里提到了条件记忆模块,这是构建稀疏大模型的核心元素。这个模块被看成是窥探下一代技术路线图的重要线索。 另外,在消费级市场和企业级市场里,模型发展的逻辑不一样。姚顺雨指出,在消费端用户可能更想要好用的搜索功能而不是特别智能的功能。但在企业服务和生产力场景里,高性能模型能直接提高效率和经济效益。所以企业客户愿意为更强的模型支付溢价。 产业生态也发生了变化。以前一家公司同时拥有强大模型和顶尖应用被认为是理想模式。但现在情况有所不同。对于消费级应用来说垂直整合还是有效的,而在企业级市场就不一样了。打造卓越的基础大模型需要巨额投入和技术积累门槛很高,但是通用基础模型也会催生很多垂直领域的应用开发需求。 基于这个趋势腾讯公司升级了研发架构,设立了AI基础设施、数据和计算平台等部门来强化研发支撑体系。姚顺雨负责AI基础设施和大语言模型部门,公司意图加强底层技术能力与上层应用研发之间协同的战略考量。 同时提升用户体验有时候不是直接增加模型规模就可以实现的,而是需要更丰富的上下文、环境感知和与之适配的产品设计。所以技术发展必须与具体场景深度结合。 不管是研究还是应用层面都要给未来打好基础才能持续发展下去。未来中国人工智能产业将呈现双轨发展、模型层与应用层既竞争又合作的新型关系,以及持续的技术分化与融合这些特点共同塑造全球竞争力。 行业在仰望技术星辰的时候还得脚踏实地深耕场景才能把技术潜力转化为切实生产力和创新活力呢。