智元发布Act2Goal方案 机器人实现"以终为始"目标导向操作新范式

在机器人技术发展历程中,如何让机器理解并执行复杂任务始终是核心难题。

传统系统依赖精确编程指令,面对环境变化时需反复调试,仅2022年我国工业机器人调试成本就超12亿元。

这种"看一步走一步"的操作模式,严重制约机器人在柔性制造、家庭服务等场景的应用深度。

智元团队创新性地提出"以终为始"认知框架。

其核心技术在于三层突破:首先,构建多尺度时空建模系统,将二维目标图像解构为包含材质、空间关系的三维任务链;其次,采用离线模仿学习与在线自优化双阶段训练,使模型参数规模控制在传统方法的1/5;最后,独创轨迹重标注机制,即使任务失败也能转化为训练样本。

实验显示,在汽车零部件装配测试中,系统仅观察5分钟即可适应新型号工件,较传统方法效率提升17倍。

这项突破带来三方面产业变革:工业领域,家电龙头企业已试点该技术,生产线换型时间缩短83%;服务领域,导购机器人能根据顾客拍摄的陈列照片自主调整货架;医疗领域,手术辅助设备正测试基于视觉目标的器械定位。

据国际机器人联合会预测,此类技术将推动全球服务机器人市场规模在2025年突破1300亿美元。

技术实现路径包含三大创新点:一是建立动态因果推理模型,通过分析物体物理属性预测操作影响;二是开发轻量化参数微调模块,单个任务适配能耗降低60%;三是构建开放式目标库,支持百万级场景的快速匹配。

目前系统已积累涵盖制造、家居的280万组场景数据,其多模态理解能力达到国际领先水平。

行业专家指出,该技术标志着机器人从"程序执行"到"目标理解"的范式转变。

中国自动化学会理事长表示:"这不仅是操作方式的升级,更是机器认知哲学的变革,为人工智能与物理世界深度融合提供新范式。

" 从“教机器人每一步怎么做”到“告诉机器人最终要什么”,体现的是技术路线从指令驱动向目标驱动的转变。

其价值不仅在于提升单次任务成功率,更在于降低真实世界部署的门槛与成本。

未来竞争的关键,或将不再只是让机器人“能动起来”,而是让其在不确定环境中“能持续把事做成、把过程做稳”,以更可靠的方式融入生产与生活。