开源世界模型,人工智能产业的竞争格局给彻底重塑一遍

1月29日这天,蚂蚁集团旗下的灵波科技一口气放出了三个开源模型:LingBot-Depth、LingBot-VLA和LingBot-World。特别是这最后一个叫LingBot-World的,把全世界都给震住了。它可是行业里第一个能直接跟谷歌Genie 3对标的开源世界模型。为啥这么厉害?它能在几秒钟内生成高保真视频,生成速度达到了16帧每秒,端到端的延迟只有1秒。最绝的是,给它一张真实图片它就能弄出可交互的视频流,根本不用额外的训练数据。这种“零样本泛化”的能力,让视频动态范围和长时一致性都达到了顶尖水准。这就像是给机器人和自动驾驶准备了一个高精度的数字沙盘。 几乎就在同时,1月30日谷歌也向订阅了AI Ultra的用户开放了Genie 3的体验平台。两家公司虽然是各自闭门造车搞出来的东西,但在开放策略上却产生了奇妙的共鸣。海外网友们讨论得热火朝天,德国财经媒体AdHocNews都忍不住夸这是“全球机器人领域争夺主导权的战略性举措”。 灵波科技这次的动作特别有意思。他们先开源了专门用来处理透明物体抓取难题的LingBot-Depth,接着是刷新真机评测纪录的具身大模型LingBot-VLA,最后才是构建虚拟世界的LingBot-World。这三层模型体系凑在一块,刚好完成了从环境感知到任务执行再到世界模拟的一个技术闭环。“看清楚—做明白—想象世界”,这种递进式的释放方式,把他们在具身智能领域的全栈实力都展示出来了。 行业专家觉得这事儿影响太大了。首先它把世界模型的研发门槛给打下去了,让普通开发者也能玩起来;其次是逼着大家搞协作共建,技术迭代肯定会更快;最后是给那些下游产业(比如自动驾驶、工业机器人)提供了便宜又逼真的仿真环境,实实在在地推动了落地。 从大背景来看,中美企业这次的同步开放其实代表了人工智能发展方式的大转变。大家都在封闭环境里搞研发已经搞不动了,只有把技术拿出来共享、大家一起折腾才行。现在尖端技术从实验室走到开源社区里去了,变成了大家的公共资源。这种开放带来的创新活力会像几何级数一样暴涨。 不过现在也得好好琢磨琢磨:在全球协作里怎么完善治理规则?在技术共享时怎么保护大家的创新劲头?在生态共建里怎么守住安全底线?这都是摆在所有人面前的新难题。可以肯定的是,以后这就是个开源的世界了。这个以开源为纽带的新发展阶段,肯定会把未来十年人工智能产业的竞争格局给彻底重塑一遍。