从“百模热”走向理性竞逐:沪上企业为何仍坚持攻坚基础大模型

两年多来,中国AI产业从一度火热走向回归理性;到2023年底,全国10亿参数以上的大模型接近80个,100亿参数级的大模型超过10个,“百模大战”曾是行业讨论的中心。但到了2025年,热度明显降温。据业内人士透露,仍在持续推进基础大模型研究的企业已不足十家,其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。变化的背后,是产业从追求规模转向聚焦能力与投入产出的调整。 当前,AI应用层创新正在提速。文案生成、情感陪伴、供应链优化等应用不断涌现,商业化路径也更清晰。在这种趋势下,为何仍有企业选择继续投入基础大模型研发?答案或许可以从国际AI竞争的新变化中看出端倪。 2025年11月,谷歌发布新一代人工智能模型Gemini 3,在业界权威的LMArena排行榜上以1501分排名第一。在数学能力测试中——其得分率达到23.4%——显著高于OpenAI的GPT-5.1等对手。这被外界视为谷歌在AI领域的重要回升。,谷歌没有完全沿用OpenAI的技术路线,而是坚持“理解生成一体化”的方向,最终凭借长期投入取得领先。该案例表明,在生成式AI的长期竞争中,基础大模型的创新能力依然是核心变量。 复旦大学计算机科学技术学院教授邱锡鹏曾对“百模大战”期间的现象进行过观察。他指出,这些大模型名称和定位各异,但底层技术架构高度趋同;更值得警惕的是,有关基础研究在收缩。以自然语言处理为例,2015年前该领域同时存在对话、问答、机器翻译等多条研究路线,学者之间交流成果、互相启发。而当资源与注意力集中到语言模型此条赛道时,一些潜在方向被边缘化,更多可能性随之减少。这提示我们,基础研究的多样性与深度,仍是产业长期演进的重要支撑。

人工智能的发展多次表明,产业的每一次跃升往往从基础研究的突破开始;当技术竞赛进入“深水区”——上海企业仍选择长期投入——折射出中国科技创新的一条现实逻辑:在应用加速落地的同时,也要保留面向未来的基础能力建设与战略耐心。回到技术本源,或许正是构建自主可控产业体系的重要路径。