今天早上刚看到消息,穹彻智能在1月12日推出了一款叫RoboPocket的新玩意,专门用来搞数据采集。这事儿其实挺有意思的,以前搞数据采集要么得靠专门的团队,要么就在实验室里折腾,成本高不说,还很难摸到真实世界里那种千变万化的样子。RoboPocket最大的亮点就是把门槛给降下来了,普通用手机的人都能上手。只要装上他们那个专门的App,大家在生活中遇到啥情况就能随手拍一拍,直接传到云端去处理。 技术层面这个系统也挺牛的。它能一边拍一边检查画面质量,要是拍得不好马上就能提示你怎么调整。而且它还能实时判断数据到底有没有用,这样就能省掉很多无效的垃圾数据。最绝的是它支持多个设备一起干活,还能通过快速空间对齐把不同视角的信息拼在一起。 业内有专家讲得挺实在,说数据质量决定模型好不好用。现在很多做智能的公司都在发愁没好的数据练手。RoboPocket出来后,不光能多搞点数据,质量和多样性也会上去。毕竟大家在外面拍的东西比实验室里的复杂多了,这对训练那种能适应真家伙的系统特别有帮助。 你要是翻翻他们的家底就会发现这家公司挺有想法的。2023年他们推出了RH20T数据集,到了2025年又搞出了CoMiner系统。这说明他们一直在想办法把从做数据到用数据的整个链条打通。而且他们是2023年11月才成立的,是由非夕科技集团孵出来的。联合创始人卢策吾之前在斯坦福人工智能实验室跟李飞飞还有Leo Guibas做博士后研究,学术底子很深厚。 说到钱袋子这边也挺猛,到现在已经完成5轮融资了,阿里巴巴和红杉资本这种大佬都投了进去。这说明资本也看好这个赛道。 从大趋势看,现在大模型技术都在往具身智能这块走,对高质量数据的需求蹭蹭往上涨。把采集任务扔给千千万万的用户去做,不光省钱还能摸到以前摸不到的冷门场景的数据。 不过这模式也不是没毛病。隐私保护、质量标准怎么定、怎么激励用户都是要解决的大问题。怎么让这些分布式采集回来的数据符合训练要求,建立一套行之有效的质量控制体系,这才是决定能不能普及的关键。 RoboPocket这一来算是把行业格局给搅活了。以前只有专业人士能干的事儿现在普通人也能干了。这不仅仅是个技术创新的问题,更是把做AI基础设施这件事变成了大家一起参与的事儿。 随着科技越来越深入社会生活的方方面面,怎么弄好高质量的数据就成了新的大课题。这种技术民主化的过程很可能会把未来的智能社会往一个更开放、更协同的方向带。