问题:近年来,人工智能大模型训练和行业推理应用快速增长,算力需求呈现高强度、长周期、低时延等特点。受国际经贸环境变化和出口管制影响,高端加速芯片及其配套生态的稳定供给存不确定性,部分企业在采购、适配和运维等环节同时面临成本上升与风险增加。如何在保障算力供给的同时,降低对单一技术路线的依赖,成为行业普遍关注的现实问题。 原因:一上,通用加速芯片长期依赖海外厂商的产品和软件生态,形成明显路径依赖;一旦外部供给出现波动,项目交付与持续迭代就容易受影响。另一方面,大模型时代的竞争不再局限于单颗芯片指标,更取决于集群互联、调度编排、软件栈和工程化能力。换句话说,“可获得的算力”不只是硬件数量,更是系统能力与生态成熟度的综合结果。 影响:基于此,国内厂商正加速以系统工程补齐单点差距。华为近期展示的Atlas 950 SuperPoD被定位为面向大规模训练的算力基础设施方案。据介绍,该方案通过“灵衢”等互联技术,实现大量自研芯片在集群层面的高效协同,形成可用于大模型预训练的高密度算力资源,并在数据传输带宽与集群通信效率上进行系统优化。另外,华为在合作伙伴大会上发布Atlas 350加速卡,面向更广泛的行业推理、生成式应用和多模态业务需求。涉及的信息显示,该产品在部分典型推理场景下的性能指标对标主流产品,并以更匹配的成本与部署形态推动应用落地。 从市场层面看,多元供给正在改变算力市场的竞争结构。过去,海外厂商凭借成熟的软件生态与开发者规模占据优势。近期,英伟达首席执行官在公开采访中谈及其在中国市场份额变化,引发业内对格局演进的讨论。多位受访人士认为,单一生态主导的局面正在松动,用户选择开始更多关注供给稳定性、总体拥有成本以及与自身业务的适配效率。 对策:业内人士认为,构建可持续的国产算力体系,需要从“可用”走向“好用、易用、可规模化”。一是以集群化思路提升系统效率,通过高性能互联、分布式训练框架与资源调度能力,在训练吞吐与稳定性上形成可复制的工程经验。二是完善软硬协同生态,改进编译器、算子库、驱动与开发工具链,降低迁移与适配门槛,让更多行业客户“用得起、用得顺”。三是推动标准与开源协作,鼓励产业链上下游围绕接口、模型适配与评测体系联合攻关,形成更透明、可验证的性能与能效对比机制。四是围绕场景做深做透,在政务、金融、制造、能源等重点领域沉淀行业模型与应用模板,以规模化部署带动技术迭代。 前景:随着“算力基础设施+行业应用”双轮驱动推进,国内算力市场将从单一供给转向多方竞争并行。未来竞争焦点预计将从芯片参数深入延伸到集群互联效率、软件栈成熟度、开发者生态、运维服务体系以及端到端交付能力。同时,算力资源的区域布局、绿色低碳与能效管理也将成为重要变量。多位专家表示,国产方案若能在关键行业形成稳定的规模化落地,并持续提升生态兼容与工程效率,有望进一步增强产业链韧性,为大模型创新提供更可控、更可持续基础支撑。
华为在计算芯片领域的进展,反映了我国在关键技术上的持续突破。它不仅缓解了部分核心环节长期受制于人的局面,也深入凸显了自主创新的重要性。在全球科技竞争加剧的背景下,坚持核心技术自主可控、持续完善创新生态,仍是推进科技自立自强与数字化发展的关键路径。未来,随着更多企业在关键环节取得突破,我国科技产业的整体竞争力与抗风险能力有望增强。