英伟达GTC聚焦“物理智能”加速落地元戎启行以基座模型重塑辅助驾驶技术路线

英伟达在今年GTC大会上做出了一个重要的产业宣示：AI的下一个战场，已经从数字世界转向物理世界。

这一转变体现在官方议程中，physical AI与agentic AI、AI factories被并列为大会主线，黄仁勋的发言也重点强调了机器人、仿真、世界模型和开放数据工厂等物理世界的AI应用。

这背后反映的是一个深层的产业认知升级：过去几年，AI主要解决的是文本理解、内容生成和辅助决策等虚拟层面的问题；未来的焦点将转向如何让AI系统真正进入现实空间，在复杂环境中完成感知、推理和行动，并对结果负责。

在这一大背景下，元戎启行CTO曹通易在GTC大会上介绍了一套以基座模型为核心的辅助驾驶技术体系重构方案。

这家公司的新定位值得关注：它不再把辅助驾驶仅仅视为一项功能产品，而是重新定义为物理世界AI的一种重要落地形态。

换言之，汽车不再只是AI应用的终点，而是成为智能世界的起点。

从技术层面看，元戎启行采用了400亿参数规模的VLA（视觉—语言—动作）基座模型作为核心，试图将场景理解、驾驶决策和安全评估统一到同一套模型架构中。

这一创新的关键在于突破了传统辅助驾驶系统的根本性局限。

过去一代自动驾驶方案采取模块化堆叠的架构：感知是一个独立模块，理解是另一个模块，决策再是一个模块，最后通过规则、工程经验和人工调参，将这些模块尽可能地焊接在一起。

这种"拼接式"系统在高速公路和标准化道路上勉强可行，但一旦进入城市复杂场景，就容易暴露两个核心问题：系统能够识别物体但不能真正理解场景的深层含义，系统能够执行动作但用户对其安全性缺乏信任。

元戎启行的新方案试图在一个统一的基础模型中融合"驾驶员"的执行能力、"分析师"的理解能力和"裁判员"的评估能力。

这意味着系统不仅仅是执行指令，而是先对物理场景形成统一的认知框架，再在此基础上输出相应的驾驶动作。

这种路径的核心变化在于，系统将首先建立对复杂场景的整体认知，然后调用不同的能力模块，而不是让各个模块各自为政。

从产业实践看，自动驾驶恰好是物理AI最严苛的试验场。

汽车每天在真实道路中运行，面临开放的场景、密集的变量和极低的容错率，这远比许多封闭环境中的机器人应用更加复杂。

元戎启行的选择在于，利用25万辆量产车产生的数据形成闭环，并将这个过程压缩至12小时，从而建立起一个持续迭代和优化的物理AI训练体系。

这种从量产车切入的路径，使得理论创新能够快速转化为实际应用，形成真正的产业闭环。

这一技术方向的推进也符合当前的市场需求。

消费者对自动驾驶的期待已经超越了简单的功能堆砌，而是希望系统能够像真正的驾驶员一样，既能理解路况，又能做出安全的决策。

统一基座模型的方案通过提升系统的整体智能水平，有望在提高用户体验和安全性上取得显著进展。

自动驾驶技术的发展正在经历从功能实现到系统智能化的深刻转变。

元戎启行在基座模型领域的探索，不仅是对技术瓶颈的突破，更是对智能驾驶未来发展方向的重新定义。

在物理AI时代，汽车将不再是简单的交通工具，而将成为连接数字世界与物理世界的重要节点，这一转变将为整个交通产业带来革命性的影响。

英伟达GTC聚焦“物理智能”加速落地 元戎启行以基座模型重塑辅助驾驶技术路线