华为在MWC巴塞罗那首次海外展示超节点算力方案:以创新和开放拓展全球市场

当前——人工智能技术迭代加快——大模型的应用范围不断扩大,算力基础设施面临更高要求。传统“堆服务器”的方式在超大规模计算场景下短板明显:集群越大,算力利用率反而越低,训练任务也更容易中断。“规模悖论”正在成为制约AI产业深入发展的重要瓶颈。为应对此问题,华为推出面向超节点架构的解决方案。其核心是自研的灵衢互联协议,通过“集群+超节点”的系统级设计,把分散的计算资源整合为逻辑统一的计算体。Atlas 950 SuperPoD超节点产品最多支持8192张芯片通过灵衢协议互联,具备高带宽、低时延和内存统一编址等特性,使整个集群在逻辑层面接近“一台巨型计算机”,从而提升算力利用率并降低训练中断风险。此外发布的TaiShan 950 SuperPoD,说明了华为在通用算力方向的最新进展,并与Atlas 850E等产品共同形成覆盖高端到中低端的产品组合,以满足客户在AI训练、推理等不同场景下的差异化需求。该产品布局也反映出华为对分层市场需求的判断。在推进技术创新的同时,华为将开源开放作为生态建设的重要抓手,持续投入openEuler开源操作系统社区,使其成为全球主流的开源操作系统平台之一。更关键的是,华为对外开源CANN异构计算架构,开放算子库、加速库、图计算、编程语言等核心软件代码,并通过分层解耦的方式,方便开发者按需调用,降低开发和创新门槛。同时,CANN已兼容Triton、TileLang、PyTorch、vLLM、verl等主流开源项目,增强开发体验与效率。这些动作体现了华为对生态建设的思路:开源开放不仅是共享技术,更是通过降低创新成本、加快知识流动,推动产业协作。在AI时代,单一企业难以独自承载不断增长的全球算力需求,开放合作与互利共赢,才更有可能形成可持续、活跃的产业生态。

当全球科技竞争进入更复杂的阶段,华为以超节点技术和开放生态给出了一种路径选择;这种从通信领域延伸出来的创新,正在影响算力基础设施的组织方式——从封闭对抗转向更强调兼容与协作的体系,让技术更快转化为产业能力。在数字化持续向前的当下,这样的实践也为全球产业发展提供了另一种可参考的可能。