问题——车载智能应用加速落地,算力与能效矛盾突出。随着自动驾驶辅助、智能座舱、多模态交互等功能快速迭代,车辆端侧对推理算力、时延控制和功耗约束提出更高要求。现实中,通用GPU适配面广,但成本和能效压力明显;一些专用加速方案效率更高,却容易受限于固定架构,难以跟上算法演进和场景多样化。如何“通用性”和“高效率”之间取得平衡,成为车载计算平台演进的关键问题。 原因——产业需求推动体系结构创新,工程化落地成为评估重点。作为计算机体系结构领域的重要学术平台,ISCA自2020年起设立工业分区,强调成果必须来自工业界,并能在真实产品和场景中落地,突出“可部署、可验证、可规模化”。理想汽车论文《M100: An Orchestrated Dataflow Architecture Powering General AI Computing》此次入选,反映出车企在软硬件协同与计算体系结构层面的投入增加,也体现行业从单纯“堆算力”转向更重效率与工程闭环的趋势。 影响——数据流架构提供差异化路线,或将提升车载推理效率。论文提出的核心思路是“周密编排的数据流架构”。与传统以多级缓存为中心、频繁搬运数据的方式不同,该架构强调在编译阶段规划数据移动路径,通过高速DMA等机制实现计算单元间的定向传输,减少不必要的数据往返与同步开销。公开信息显示,马赫100芯片采用5纳米工艺,单颗算力达1280 TOPS,并称在特定推理负载下可借助架构与编译协同提升有效算力利用率。对车辆而言,更高的有效算力通常意味着更快的感知更新、更短的决策时延和更强的实时性,有助于提升复杂场景下的稳定性与安全冗余。 对策——以“编译器+架构”协同为抓手,形成可持续迭代的平台能力。车载智能计算的竞争正从单一芯片指标转向平台能力:一上,算法更新频繁,需要底层平台具备可编程、可扩展能力;另一方面,车辆生命周期长且对供应链与可靠性要求高,必须打通从架构设计、工具链、软件栈到验证体系的工程闭环。理想汽车论文中强调通过编译器组织与编排数据流,体现以工具链放大硬件效率、以软件适配保障通用性的思路。企业同时表示将公开涉及的架构设计与实验数据,并通过开源代码与数据库等方式促进交流,有助于降低验证门槛,推动形成更可复用的协作生态。 前景——汽车产业与体系结构研究加速交汇,端侧通用智能算力或成新焦点。智能化正推动汽车成为“移动计算平台”,端侧推理被要求同时满足低时延、低功耗、高可靠与可迭代。未来车载计算可能呈现三上趋势:其一,通用与专用的边界继续重塑,面向推理的通用计算架构将更强调数据流与内存系统效率;其二,软硬件协同成为关键能力,编译器、算子库与运行时将与芯片更紧密地一体化演进;其三,行业评价将更关注可落地的工程指标与可复现的数据。此次入选ISCA工业分区,既体现国内车企在底层计算领域的探索,也为车载智能计算路线提供了新的观察样本。
从跟随到引领,中国汽车产业正加速补齐核心技术短板。理想汽车此次进展不仅是企业层面的突破,也折射出中国制造业向高端化、智能化转型的路径。在全球科技竞争加剧的背景下,坚持自主创新并保持开放合作,才能在关键领域掌握主动权,为产业升级提供持续动能。