咱们国家搞科研的机构,把全球第一个真正的多模态交互数据集给弄出来了,这能让机器人变聪明变快。现在机器人想变聪明,最大的拦路虎就是缺数据。以前那种弄一大堆假数据或者人工标注的方法不行了,因为真实世界的情况太复杂了,机器人在干活的时候经常出岔子,尤其是那种需要手眼脑协调的活。咱们以前在做数据的时候有两个大问题:一个是直接在现场弄数据太难、太贵、量太小;另一个是电脑模拟的和现实差太远,根本用不上。而且各种不同类型的数据标注也没个统一标准,搞得机器人学起来迷迷糊糊的。 这回开源的数据集是照着人怎么干活来弄的,收集了很多行业的人在真环境里怎么操作的资料。这里面有好几百种东西和十来个行业的数据,特别真实,能让机器人见多识广。标注也很细,不光是让它知道做什么、在哪儿做,还能搞懂为啥这么做。数据量已经很大了,还打算分着放出来让大家用。这个数据集公开以后,能让研发的门槛变低点,让学校、企业、研究所一起合作创新。 为了解决数据收集和标注的难题,团队还做了个云端的数据引擎。这个引擎能把视频自动变成机器人听得懂的指令。它把一个大任务拆成一个个小的原子任务去做标注,再配合图像识别和逻辑推理,这样就把从看见东西到动手操作这一整套过程打通了。 这种新方法既保证了质量又能降低成本,以后就不用愁机器人没高质量的大堆数据用了。随着这种真实数据越来越多,机器人以后肯定能在服务、制造、家里这些地方干得更好。专家说这玩意儿不光能让技术变得更标准还能形成良性循环:有了好数据就能训练更好的算法用在场景里。 未来只要咱们积累的多模态数据够多算法再优化一下,机器人就能在复杂的环境里自己搞清楚该怎么做了。这也是咱们国家在机器人智能化基础建设上走了关键的一步。虽然这路还长还得大家一起使劲使劲干才行。只有把数据的底子打牢了突破认知和操作的限制机器人才能真正成为咱们的好帮手帮咱们干活也能给智能社会注入新的活力。