一、问题:从“能对话”到“会办事”,产业竞争焦点发生转移 随着大模型能力从通用问答拓展到任务规划、工具调用、分步推理等复杂工作,行业正从对话式交互加速迈向智能体范式;智能体能够多轮目标约束下拆解任务、联动外部工具并完成闭环执行,其落地效果直接影响办公、编程、内容生产、终端服务等场景的效率提升。由于此,如何搭建面向智能体的底座能力,并以多模态、语音等关键能力形成协同组合,成为企业竞争的焦点。 二、原因:研发投入与工程化能力推动“模型家族”快速成形 小米当日发布的MiMo-V2-Pro定位为面向智能体时代的旗舰基座模型。雷军表示,该模型在全球大模型综合智能榜单Artificial Analysis中位列第八;按品牌维度统计位居全球第五,并称后续将持续迭代增强。同时,小米披露今年在人工智能领域的研发与资本投入将超过160亿元。持续投入为大规模训练与推理优化提供支撑,也让模型从“可用”更走向“可规模化部署”。 在技术路径上,小米介绍MiMo-V2-Pro总参数规模突破1万亿、激活参数约420亿,较前代扩大约3倍;沿用并强化混合注意力机制,进一步提高混合比例,在参数增长的同时兼顾推理效率,并支持约100万长度的超长上下文;同时通过轻量化多词元预测层提升生成速度。除文本能力外,小米同步推出全模态基座模型MiMo-V2-Omni与语音合成模型MiMo-V2-TTS,意在补齐“看、听、说、做”的关键环节,形成更贴近终端与业务系统的能力栈。 需要指出,此前两款未署名模型曾以“Hunter Alpha”“Healer Alpha”代号出现在海外接口聚合平台OpenRouter,在缺少公开宣传情况下调用量仍快速增长,一度引发外界对其来源的猜测。随后确认其为小米有关模型。这种“先试后发”的节奏,体现出企业先在真实流量环境中验证效果、再集中对外发布的策略,也从侧面说明智能体能力正从实验室指标走向工程化检验。 三、影响:带动智能体生态竞争升级,推动国内企业参与全球同台比拼 其一,智能体能力将改变应用开发方式。相比“提示词驱动”的单轮交互,智能体更依赖稳定的工具调用与多步推理,底座模型对复杂脚手架的适配能力将直接影响上层框架的可靠性与成本。小米称MiMo-V2-Pro围绕复杂多样的智能体脚手架进行了监督微调与强化学习优化,在PinchBench、ClawEval等评测中处于全球领先水平。若在真实业务中得到验证,将带动更多开发者围绕模型搭建可复用的工作流与插件体系。 其二,国内大模型竞争将加速向“全栈化”演进。单点能力领先难以形成长期壁垒,模型、数据、训练、推理、评测、工具链与终端部署的协同,正在成为决定体验与成本的关键。小米以“模型家族”同时覆盖文本、全模态与语音合成,有利于在手机、汽车、可穿戴设备及IoT场景中打通入口,强化端云协同的产品化空间。 其三,国际化评测与平台流量验证的重要性上升。匿名模型在海外平台被频繁调用,说明全球开发者对高性价比、可用性强的底座能力存在需求;也意味着国产模型若能在性能、稳定与合规之间取得平衡,将获得更大的增量市场。 四、对策:以开放测试、场景牵引与安全治理夯实可持续竞争力 面向智能体的规模化应用,业内普遍认为需同步推进三项工作:一是加强开放测试与开发者生态建设,通过稳定接口、清晰计费与工具规范降低集成门槛;二是以高频刚需场景牵引能力迭代,在编程、办公、终端助手、客服与内容生产等领域建立可量化的闭环指标;三是完善安全治理与质量控制,重点覆盖工具调用安全、数据合规、内容可信与可解释性等问题,避免“能做事”带来新的风险。 五、前景:智能体或成下一阶段产业化主线,模型迭代将更强调效率与可控 从行业趋势看,智能体将推动大模型从“信息生成”走向“任务执行”,对推理效率、长上下文、工具调用成功率与成本控制提出更高要求。小米上已明确后续将快速迭代增强。预计下一阶段竞争不只体现在参数规模,还将体现在推理优化、端侧适配、全模态协同,以及面向行业应用的可控与可审计能力。谁能在可用性、稳定性与规模化部署之间取得平衡,谁就更可能在智能体浪潮中占据先机。
小米此次技术进展展示了其在人工智能领域的持续投入与工程化能力,也为中国科技企业参与全球竞争提供了新的样本。面对不断升级的国际竞争环境,持续创新与更开放的合作,将成为中国企业赢得未来的重要支撑。