3月19日,小米不但发布了新一代的SU7,还一口气拿出了三个Agent时代的大模型,把AGI的大门又推开了一大步。这次直接宣布未来三年要往AI这块砸下超600亿元的巨资,雷军说了今年的投入就得有160亿。为了这个目标,小米今天直接把旗舰基座模型MiMo-V2-Pro、全模态模型MiMo-V2-Omni还有语音模型MiMo-V2-TTS给推出来了。这三个家伙里头,V2-Pro是小米做的第一个万亿级参数的MoE模型,用的是Attention架构,能处理百万级的上下文,现在已经开放体验了。 专门用来处理复杂多模态交互的V2-Omni很厉害,它不光看得懂听得到,脑子转得也快,还能动手动脚干活。V2-TTS则是在说话的时候融入了音律理解,让你跟机器聊天的时候感觉更自然。 现在小米正在忙着把这些AI大模型能力塞进自己的主营业务里。手机那边推出的“Xiaomi miclaw”已经在小范围测试了,小米17系列和红米K90这些机型都能用上最新的V2-Pro。在智能家居这块,去年出的Xiaomi Miloco全屋智能方案就是MiMo大模型在现实生活中的第一次实战。在智能电动车领域更是不得了,HAD系统升级到了最新的小米XLA认知大模型,基座模型就用的是MiMo-Embodied。 这个架构第一次让自动驾驶和具身机器人在认知层面达成了统一,让系统同时拥有强大的语言和空间推理能力。 接下来小米还要继续在AI、机器人、芯片这些硬科技上死磕到底,全面拥抱AGI,把虚拟世界的东西变成物理世界里的东西。