机器人能像人一样灵活地玩各种高难度动作

咱们北京的科研团队现在搞出了个挺厉害的东西，叫OmniXtreme框架，专门是为了让机器人能像人一样灵活地玩各种高难度动作。这事是3月5日我听说的。北京通用人工智能研究院把宇树科技给找来合作，就在这次联合发布会上，他们给大家看了个演示。这机器人可是学会了好多高难度的“极限运动”，比如后空翻、托马斯全旋、还有武术里的踢击动作。这些动作加起来有好几十个呢。结果大家都看到了，这些动作真的能在宇树科技的机器人上跑起来，成功率还挺高。这个框架最牛的地方就是它能让机器人学会各种各样的复杂动作。以前科学家想让机器人像人一样灵活地动，这可是个老大难问题。大家以前总觉得要是想让机器人学会一个高难度动作容易，但如果要学几十个不同风格的动作，就难办了。因为一旦动作变多了，控制器就会变得保守起来，那种复杂的挑战动作就很难通过了。这次新框架用了两种方法解决这个问题：先是用流技术预训练一个策略，然后再用“驱动感知残差强化学习”进行后训练。这个后训练特别关键，让机器真的能在现实世界里跑起来。研究人员以前老是碰到一个瓶颈，叫泛化壁垒。当你把要学的动作库弄得大一点、复杂一点的时候，传统的统一学习方法就容易崩溃。这是因为在仿真环境里学习的时候会有很多干扰因素，加上到了真实世界里执行的时候还要受到物理限制。 OmniXtreme这个框架就把动作学习和物理执行这两个部分分开来做。它把预训练和后训练分成了两个步骤。为了看看这个系统是不是真的突破了泛化壁垒，研究团队做了个渐进式的测试：他们先给机器人10个动作学，然后加到20个，最后加到50个。然后用固定的前10个动作来比较一下表现怎么样。结果真是让人惊喜：传统方法的成功率从100%直接掉到83.3%，再掉到73.9%。可OmniXtreme不一样啊！哪怕是在50个动作这么大的训练集下面，它对前10个核心动作的成功率还是稳稳地保持在93.3%。这就彻底打破了那种“动作多了准确率就会掉”的老观念。