英伟达GTC聚焦“物理智能”加速落地 元戎启行以基座模型重塑辅助驾驶技术路线

英伟达在今年GTC大会上做出了一个重要的产业宣示:AI的下一个战场,已经从数字世界转向物理世界。

这一转变体现在官方议程中,physical AI与agentic AI、AI factories被并列为大会主线,黄仁勋的发言也重点强调了机器人、仿真、世界模型和开放数据工厂等物理世界的AI应用。

这背后反映的是一个深层的产业认知升级:过去几年,AI主要解决的是文本理解、内容生成和辅助决策等虚拟层面的问题;未来的焦点将转向如何让AI系统真正进入现实空间,在复杂环境中完成感知、推理和行动,并对结果负责。

在这一大背景下,元戎启行CTO曹通易在GTC大会上介绍了一套以基座模型为核心的辅助驾驶技术体系重构方案。

这家公司的新定位值得关注:它不再把辅助驾驶仅仅视为一项功能产品,而是重新定义为物理世界AI的一种重要落地形态。

换言之,汽车不再只是AI应用的终点,而是成为智能世界的起点。

从技术层面看,元戎启行采用了400亿参数规模的VLA(视觉—语言—动作)基座模型作为核心,试图将场景理解、驾驶决策和安全评估统一到同一套模型架构中。

这一创新的关键在于突破了传统辅助驾驶系统的根本性局限。

过去一代自动驾驶方案采取模块化堆叠的架构:感知是一个独立模块,理解是另一个模块,决策再是一个模块,最后通过规则、工程经验和人工调参,将这些模块尽可能地焊接在一起。

这种"拼接式"系统在高速公路和标准化道路上勉强可行,但一旦进入城市复杂场景,就容易暴露两个核心问题:系统能够识别物体但不能真正理解场景的深层含义,系统能够执行动作但用户对其安全性缺乏信任。

元戎启行的新方案试图在一个统一的基础模型中融合"驾驶员"的执行能力、"分析师"的理解能力和"裁判员"的评估能力。

这意味着系统不仅仅是执行指令,而是先对物理场景形成统一的认知框架,再在此基础上输出相应的驾驶动作。

这种路径的核心变化在于,系统将首先建立对复杂场景的整体认知,然后调用不同的能力模块,而不是让各个模块各自为政。

从产业实践看,自动驾驶恰好是物理AI最严苛的试验场。

汽车每天在真实道路中运行,面临开放的场景、密集的变量和极低的容错率,这远比许多封闭环境中的机器人应用更加复杂。

元戎启行的选择在于,利用25万辆量产车产生的数据形成闭环,并将这个过程压缩至12小时,从而建立起一个持续迭代和优化的物理AI训练体系。

这种从量产车切入的路径,使得理论创新能够快速转化为实际应用,形成真正的产业闭环。

这一技术方向的推进也符合当前的市场需求。

消费者对自动驾驶的期待已经超越了简单的功能堆砌,而是希望系统能够像真正的驾驶员一样,既能理解路况,又能做出安全的决策。

统一基座模型的方案通过提升系统的整体智能水平,有望在提高用户体验和安全性上取得显著进展。

自动驾驶技术的发展正在经历从功能实现到系统智能化的深刻转变。

元戎启行在基座模型领域的探索,不仅是对技术瓶颈的突破,更是对智能驾驶未来发展方向的重新定义。

在物理AI时代,汽车将不再是简单的交通工具,而将成为连接数字世界与物理世界的重要节点,这一转变将为整个交通产业带来革命性的影响。