最近全球最大的API聚合平台OpenRouter上,有个叫Hunter Alpha的神秘大模型吸引了不少眼球,大家都在猜它是不是DeepSeek V4的早期版本。结果小米突然跳出来认领了,直接给咱们推出了MiMo-V2-Pro、Omni和TTS这三款大模型,大家可以免费体验一周。负责这个项目的罗福莉说了,这是小米第一次专门为智能体时代做的全栈产品。她管这次突破叫“悄悄伏击”,其实不是团队低调,是转型太快大家都没反应过来。为了提升长上下文的推理效率,团队在几个月前就开始训练1T的基础模型了。他们弄了个混合注意力机制,既保持了创新又没乱折腾技术。最终这个模型支持1M上下文窗口,还用MTP架构把延迟和成本都控制得很低。罗福莉说这些决策都是提前想好了的。 罗福莉还提到推动质变的一个关键节点是因为大家第一次接触复杂智能体框架时被震撼到了。为了让大家适应新玩法,她还给大伙下了死命令:24小时内每个人至少要测试100次对话。这招真管用,一下子把大家的创造力给激发出来了。罗福莉觉得研发效率能这么高主要靠四点:长期投基础设施的定力、产品直觉驱动的迭代能力、保持好奇心的探索精神还有对技术理想的全身心投入。她特别强调真正热爱技术才是突破创新瓶颈的关键动力。 在开源这块儿,小米承诺等MiMo-V2系列稳定下来就会开源。这事儿延续了他们在人工智能领域喜欢开放协作的习惯,也给开发者提供了新的研究参考。现在这三款模型都上线了,就看市场反馈怎么样了。