小米首款人形机器人成功进入工厂

小米首款人形机器人成功进入工厂的生产线,这标志着一种以90%成功率为代表的硬核技术首次在现实环境中得到应用。在这次重大突破中,雷军在发布会上亲自按下了启动按钮,使这个机器人正式踏入汽车制造领域。尽管它面临的第一个挑战看似简单——在76秒的生产节拍内,准确无误地完成双侧自攻螺母的装配任务——但其实这是一个需要高度精准和稳定的操作。在连续运行了三个小时后,该系统交出了90.2%的成功率,这一成绩有力地证明了实验室里开发的算法终于能够在充满粉尘和快节奏的工厂环境中站稳脚跟。 这款机器人面临的主要难点在于,它必须精准地定位并操作具有复杂结构的自攻螺母。这个螺母的内侧花键结构类似迷宫,每一次抓取角度都是随机变化的;而定位销轴自带磁性吸附力,稍不留神就会导致螺母卡住。传统的机械夹爪在这种情况下容易打滑,视觉算法如果稍有偏差就会导致针脚碰撞损坏零件。针对这一难题,小米团队采用了三步解决方案:首先让机器人“看到”花键槽的精确轮廓;然后通过柔顺控制让手指顺利滑入花键槽;最后用微震策略将螺母牢固地锁定在位置上。在这三小时里,它完成了近两千次操作循环,实现了零故障和零丢件。 实验室环境与真实生产环境之间存在着巨大的差距。在实验室里允许失败多次只为换取一次成功是很常见的做法,而工厂生产线却无法承受这样的等待。雷军形象地将这种落差描述为“节拍鸿沟”:如果机器人出现停顿或故障,整条生产线就会因为堆积物料而停产,造成巨大的经济损失。为了填补这个鸿沟,团队把通用视觉语言模型Xiaomi-Robotics-0引入到了工厂中。这个模型具备视觉、语言和动作三位一体的多模态感知能力,让机器人能够理解产线的节拍节奏。 此外,团队利用强化学习技术在虚拟环境中预演了十万种突发状况,将真实遥操作数据压缩到“可接受失败率”的水平。通过在手指上安装力矩传感器来实现触觉融合感知系统,“听得见”锁付成功时发出的“咔嗒”声,从而将失败风险降到最低。 通过拆解背后的技术架构可以看到支撑其高可靠性的四条“暗线”:通用VLA基座模型允许一套模型适应千种任务;VLA与强化学习联合训练减少了对真人数据的依赖;触觉闭环系统让手指拥有了“第六感”;全身运动控制架构实现了刚柔并济。 雷军把这次工厂实习看作是“第一阶段”,他的目光早已投向了家庭场景市场。他透露小米已经启动了家庭场景机器人计划,目标并不是炫耀技术而是通过AI高效解决扫地、买菜、照顾老人等日常需求。 在智能制造已成共识的今天,小米试图用同一套技术栈来连接家庭和工厂,“人形”将成为连接人、设备与场景的通用接口。 小米人形机器人在产线的初步落地标志着人工智能与传统产业的深度融合开始了第一步。当算法学会在76秒内不掉链子时,它就拥有了服务千行百业的能力。未来五年里随着成本快速下降和场景持续扩展,每一台设备、每一条产线甚至每一个家庭都可能隐藏着一台会思考的“人形伙伴”——这既是技术进步的终点也是产业升级的起点。