李想认为,自动驾驶要是总是卡在那里,关键问题在于它缺少了3D认知能力。明明我们的车变得越来越聪明了,但开车的时候还是需要自己动手,这个问题真的很让人头痛。行业里投入了数千亿,然而进展并不明显。为什么自动驾驶总被卡住?我们来看看,人类从很小就能够理解3D空间,但AI在这个方面还需要努力。还记得小时候学骑自行车时吗?眼睛看到的不仅仅是路面,还有前后左右的距离和高度。这是人类大脑自然形成的3D认知能力。然而传统的BEV架构把高度信息给忽略了,OCC方案缺乏语义逻辑,AI就像是只看行车记录仪就上路了。那该怎么办呢?李想和他的团队给我们带来了一个解决方案。理想汽车推出了原生3DViT三维视觉编码器,给AI赋予了在3D世界中生存的能力。有了这个技术,AI能够通过VLA来感知周围环境、推理决策和行为建模。还有MindVLAo1系统具备多模态思考能力,让人感到未来的机器人也能像人一样理解这个世界。这套系统不仅仅应用在自动驾驶上,未来还可能成为通用物理智能体的基础。很多人会觉得这个技术太科幻了吧?其实李想直言不讳地说:如果没有3D空间认知能力,砸进去再多的钱也是没用的。现在汽车行业正在经历一场视觉革命,谁能掌握这个3D认知技术谁就能走在前面。 大家可能会好奇这个技术会怎么改变我们的出行方式呢?在他看来,3D认知才是自动驾驶真正的大脑没有它再强大的算力也是徒劳无功。你准备好迎接这个新世界了吗? 这就像你给自行车装上了一个特别厉害的芯片一样让感知范围扩展到了500米左右激光雷达变成了衡量标准一样可靠。 这场变革即将到来我们还在等什么呢?