从“百模热”走向理性竞逐：沪上企业为何仍坚持攻坚基础大模型

两年多来，中国AI产业从一度火热走向回归理性；到2023年底，全国10亿参数以上的大模型接近80个，100亿参数级的大模型超过10个，“百模大战”曾是行业讨论的中心。但到了2025年，热度明显降温。据业内人士透露，仍在持续推进基础大模型研究的企业已不足十家，其中包括商汤科技、稀宇科技、阶跃星辰等几家上海企业。变化的背后，是产业从追求规模转向聚焦能力与投入产出的调整。当前，AI应用层创新正在提速。文案生成、情感陪伴、供应链优化等应用不断涌现，商业化路径也更清晰。在这种趋势下，为何仍有企业选择继续投入基础大模型研发？答案或许可以从国际AI竞争的新变化中看出端倪。 2025年11月，谷歌发布新一代人工智能模型Gemini 3，在业界权威的LMArena排行榜上以1501分排名第一。在数学能力测试中——其得分率达到23.4%——显著高于OpenAI的GPT-5.1等对手。这被外界视为谷歌在AI领域的重要回升。，谷歌没有完全沿用OpenAI的技术路线，而是坚持“理解生成一体化”的方向，最终凭借长期投入取得领先。该案例表明，在生成式AI的长期竞争中，基础大模型的创新能力依然是核心变量。复旦大学计算机科学技术学院教授邱锡鹏曾对“百模大战”期间的现象进行过观察。他指出，这些大模型名称和定位各异，但底层技术架构高度趋同；更值得警惕的是，有关基础研究在收缩。以自然语言处理为例，2015年前该领域同时存在对话、问答、机器翻译等多条研究路线，学者之间交流成果、互相启发。而当资源与注意力集中到语言模型此条赛道时，一些潜在方向被边缘化，更多可能性随之减少。这提示我们，基础研究的多样性与深度，仍是产业长期演进的重要支撑。

人工智能的发展多次表明，产业的每一次跃升往往从基础研究的突破开始；当技术竞赛进入“深水区”——上海企业仍选择长期投入——折射出中国科技创新的一条现实逻辑：在应用加速落地的同时，也要保留面向未来的基础能力建设与战略耐心。回到技术本源，或许正是构建自主可控产业体系的重要路径。