宇树科技ceo王兴兴:ai泛化能力不足,赛道才会迎来爆发式增长

2016年诞生的杭州企业宇树科技,早已成长为全球出货量最大的人形机器人厂商,他们为英伟达等公司开源了大量软件。这家公司已在2024年实现全球出货约五千台,其中1.3米高的轻量化机型已成为市场主流。对于这项技术未来的发展前景,宇树科技创始人、CEO王兴兴表示非常乐观。在他看来,随着全世界越来越多的人开始开发各种应用和软件,人形机器人的功能会越来越强大,受众也会越来越多。不过他也指出,人形机器人要真正进入家庭和工厂进行大规模应用,还需要一定的时间。因为就像当年的电脑刚出来时大家都用来打游戏一样,人形机器人现在也处于类似的阶段。 对于具身智能行业发展中的“GPT时刻”,王兴兴预计还需要2到3年的时间才能到来。在他看来,只有当机器人能够在80%陌生场景中仅凭语言指令完成80%的任务时,赛道才会迎来爆发式增长。比如把机器人带到一个完全陌生的地方,它不认识任何人,却能完成像帮忙拿水或找笔这样的任务。目前存在几个主要的挑战:首先是AI泛化能力不足的问题;其次是数据稀缺的问题;还有就是强化学习的功能需要进一步提升。针对这些挑战,宇树已经有了相应的解决思路。 为了提升AI泛化能力和数据采集量,宇树在去年下半年开发了全身遥操作系统,并计划在今年年底前部署数千台甚至一万台人形机器人,每天采集10小时数据。王兴兴相信最近一两年甚至两三年内就能完全解决数据问题。至于强化学习功能方面,全球范围内主要有两种技术流派:一种是在语言模型基础上叠加机器人模型的VLA方案;另一种是通过对世界进行预测建模的世界模型路线。王兴兴更看好后者,“如果AI生成的视频质量足够好,只要把这个视频对齐到机器人上,它就可以去干活了。”不过这个路线中也存在一个问题,就是视频和机器人动作没有办法很好地对齐和统一。 这个“GPT时刻”到来后会给人类生活带来巨大改变。就像智能手机一样,人形机器人可能会彻底重塑我们的生活方式。在这场全球竞速中,中国企业正凭借技术积累与开放生态抢占爆发式增长的前置位。正如王兴兴在发言中感慨的那样:“真的非常感谢这个时代有这么多优秀过去的企业家给我们做了很好的铺垫。”当下是AI与具身智能发展的黄金窗口,“如果再早个五年或者晚个五年其实都没有这么好的机会。” 2026亚布力中国企业家论坛年会于3月17日至19日在哈尔滨亚布力召开。作为论坛新一届理事的王兴兴与会发言时抛出了两项关键判断:一个是预计到今年年中时全球尤其中国人形机器人应该会跑得比人还快;另一个则是关乎具身智能行业发展的“GPT时刻”。“现在这个时候还需要2-3年的时间”,王兴兴给出了这样的判断。至于这个“GPT时刻”具体是什么时候到来?“当机器人能在80%陌生场景中仅凭语言指令完成80%任务时”,赛道才会迎来爆发式增长。 至于具体怎么实现呢?“把这个视频对齐到机器人上”,“它就可以去干活了”。不过现在还有几个主要的挑战:“首先是当前人形机器人面临的最大挑战是AI泛化能力不足”,“需要提高模型对整个机器人运动的表达能力”。“否则提前训练过的特定场景中成功率可达100%”,“但场景一旦更换成功率便急剧下跌”。“而数据稀缺则是另一道坎”,“与语言模型拥有互联网海量数据不同”,“机器人领域的数据非常非常稀缺”。“但这个问题”,“目前宇树已经有解决的思路”。“去年下半年宇树开发了全身遥操作系统”,“计划今年年底前部署数千台甚至一万台人形机器人”,“每天采集10小时数据”,“最近的一两年甚至两三年之内”,“人形机器人数据的问题就可以完全解决”。 除了这些挑战之外还有强化学习功能需要进一步提升等问题需要解决,“全球范围内具身智能或者机器人领域一些模型的进步”,“存在两大技术流派”:“一是在语言模型基础上叠加机器人模型的VLA方案”,“二是通过对世界进行预测建模的世界模型路线”。“而王兴兴个人更看好后者”,“如果AI生成的视频质量足够好”,“只要把这个视频对齐到机器人上”,“它就可以去干活了”。“但这个世界模型路线中也有个问题”,“就是视频和机器人动作没有办法很好的对齐和统一”。“王兴兴认为一旦这个问题被解决”,“机器人具身模型基本上就可以诞生了”。 除了技术上的挑战之外还有一些应用方面的问题需要注意:“真正让一款技术普及起来”,“最大的挑战之一是有更多的人用起来”,“就像当年的电脑一样”,“刚出来时大家都在用来打游戏”,“人形机器人也是如此”,“在他眼里”,“不论是如今用来跳舞还是表演武术”,“各种偏娱乐或者是偏商业都已经应用”,“但进入家庭或者是工厂大规模应用”,“还偏早期一点”。“王兴兴相信随着全世界有越来越多的人去开发各种的应用和软件”,“人形机器人的的功能越来越强”,“受众也将越来越多”,“整个规模体量也会更快的起来一下”,“这也是解决目前具身智能技术瓶颈的破局路径——全球合作”。“他强调当下的AI和机器人不是靠单家公司做的而是全球共创的结果”。 这次论坛中最让人期待的就是这两项关键判断了:一个是预计到今年年中时全球尤其中国人形机器人应该会跑得比人还快比博尔特更快一些;另一个则是关乎具身智能行业发展的“GPT时刻”。“现在这个时候还需要2-3年的时间”,“王兴兴给出了这样的判断”。至于这个“GPT时刻”具体是什么时候到来?“当机器人能在80%陌生场景中仅凭语言指令完成80%任务时”,赛道才会迎来爆发式增长。 这种技术一旦普及开来将给人类生活带来巨大改变:“真的非常感谢这个时代有这么多优秀过去的企业家给我们做了很好的铺垫”,“当下是AI与具身智能发展的黄金窗口”,“如果再早个五年或者晚个五年其实都没有这么好的机会”,“可以预见当2-3年后的‘GPT时刻’真正到来时”,“人形机器人或将如智能手机般重塑人类生活”。 在这场全球竞速中中国企业正凭借技术积累与开放生态抢占爆发式增长的前置位:“这个成立于2016年的杭州企业目前已成长为全球出货量最大的人形机器人厂商”,“其客户遍布全球顶尖科技公司、实验室和高校”,“据王兴兴透露宇树2024年全球出货约五千台人形机器人”,“其中1.3米高的轻量化机型成为市场主流”,“而使用宇树机器人、平台以及软件的客户越多也将会持续推动行业技术