机器人能像人一样灵活地玩各种高难度动作

咱们北京的科研团队现在搞出了个挺厉害的东西,叫OmniXtreme框架,专门是为了让机器人能像人一样灵活地玩各种高难度动作。这事是3月5日我听说的。北京通用人工智能研究院把宇树科技给找来合作,就在这次联合发布会上,他们给大家看了个演示。这机器人可是学会了好多高难度的“极限运动”,比如后空翻、托马斯全旋、还有武术里的踢击动作。这些动作加起来有好几十个呢。结果大家都看到了,这些动作真的能在宇树科技的机器人上跑起来,成功率还挺高。 这个框架最牛的地方就是它能让机器人学会各种各样的复杂动作。以前科学家想让机器人像人一样灵活地动,这可是个老大难问题。大家以前总觉得要是想让机器人学会一个高难度动作容易,但如果要学几十个不同风格的动作,就难办了。因为一旦动作变多了,控制器就会变得保守起来,那种复杂的挑战动作就很难通过了。 这次新框架用了两种方法解决这个问题:先是用流技术预训练一个策略,然后再用“驱动感知残差强化学习”进行后训练。这个后训练特别关键,让机器真的能在现实世界里跑起来。 研究人员以前老是碰到一个瓶颈,叫泛化壁垒。当你把要学的动作库弄得大一点、复杂一点的时候,传统的统一学习方法就容易崩溃。这是因为在仿真环境里学习的时候会有很多干扰因素,加上到了真实世界里执行的时候还要受到物理限制。 OmniXtreme这个框架就把动作学习和物理执行这两个部分分开来做。它把预训练和后训练分成了两个步骤。为了看看这个系统是不是真的突破了泛化壁垒,研究团队做了个渐进式的测试:他们先给机器人10个动作学,然后加到20个,最后加到50个。然后用固定的前10个动作来比较一下表现怎么样。 结果真是让人惊喜:传统方法的成功率从100%直接掉到83.3%,再掉到73.9%。可OmniXtreme不一样啊!哪怕是在50个动作这么大的训练集下面,它对前10个核心动作的成功率还是稳稳地保持在93.3%。这就彻底打破了那种“动作多了准确率就会掉”的老观念。