英媒:中国搞人形机器人产业

话说英国那边的记者瑞安·麦克莫罗最近去武汉那边看了一眼,咱们国家搞的人形机器人实验室,《金融时报》这两天发了个文章,也就是3月12日的事儿。这家伙在武汉那儿待了一会儿,看到了好多学生模样的年轻人在那里折腾。这片占地1.2万平方米的新基地,可是花了2亿元人民币建起来的。你看看,在那里,有人形机器人送包子、擦桌子、叠衣服,学生们手上还拿着遥控器或者带传感器的家伙事儿来指挥这些机器人。这地方是个训练基地,各地政府也都在投钱建这种地方,目的是为了攒很多很多的训练数据。有个叫张嘉的小伙子是项目经理,今年才21岁,他说他们其实就像是老师,机器人就像是学生。教人类做事很快就会了,但是教机器人可不行,得反反复复地练上几百次、几千次,甚至是几万次。政府就想把这些数据攒起来,帮中国还在起步阶段的人形机器人产业一把。北京那边已经把具身智能列到2026年到2030年的五年规划里去了。 专家也说过了,现在搞人形机器人最大的难题就是数据不够用。你看ChatGPT还有DeepSeek这些大语言模型都是靠网上的文本数据喂出来的,可这玩意采集起来还是挺费劲的。北京也已经定了规矩要把这块数据的规模给搞大。不管是在沿海的杭州还是内陆的绵阳,到处都在忙着建新基地。有个叫杰伊·黄的分析师说了句话很有意思:“中国在扶持那些正在卡脖子的新产业这方面越来越有经验了。”他觉得政府出手把这些数据集中起来共享一下是好事儿。 再说回武汉张嘉那里吧,他手下管着70名年轻的操作员,一共操控着46台机器人。这些操作员轮班不停地干活儿,给同一个动作重复做上好几遍。旁边的人还在对着视频做标注呢,“向左转身”、“伸展手臂”,一秒钟就能搞定一个动作。张嘉说现在他们还在摸索阶段呢:先把数据采集整理好再上传到平台去处理。 他们想做的就是把传感器拍到的那些连续动作视频素材变成机器人能用的东西——行业里管这个叫视觉语言动作模型。这么干就是想让机器人学会像大语言模型那样厉害的本事,比如不用专门写代码就能自己去拿一瓶水喝。不过这事儿也挺难的:现在从这台机器上攒下来的数据用在那台硬件不一样的机器上可能就不行了;而且机器技术更新太快了,今年的机器用明年的新款可能就不灵了。 所以啊杰伊·黄也觉得跨设备迁移的数据技术才是现在的研究重点。就像谷歌深层思维公司搞出来的那个模型就在跨硬件平台迁移技能上有点眉目了。