问题:大模型竞赛进入“系统能力”比拼,CPU短板制约算力效率释放 随着千亿参数大模型持续迭代,算力竞争的焦点正从单一芯片性能转向“CPU+加速器+互联+软件栈”的系统化交付能力。超大规模集群中,CPU既承担通用计算任务,也负责对加速卡进行调度与数据组织。一旦CPU性能、内存与互联能力不足,集群吞吐、时延与资源利用率都会受到牵制,进而影响推理服务成本和交付稳定性。业内一度存在“自研加速卡仍需依赖海外CPU调度”的现实矛盾:硬件难以按整体架构目标协同优化,系统级竞争力也会被拉低。 原因:算力基础设施投入加码与生态选择叠加,推动高性能RISC-V走向服务器市场 达摩院此次发布玄铁C950,延续了阿里巴巴近年来在芯片领域的持续投入逻辑。一上,云计算与人工智能业务对算力供给的规模化需求日益突出,企业通过自研供应链安全、成本结构与产品迭代节奏上拥有更大主动权。另一上,面向大模型时代,算力底座需要“从芯片到系统”的一体化能力:不仅要有加速器,也要有能匹配集群规模、承担调度与通用计算压力的高性能CPU。 在架构选择上,RISC-V的开放性与可定制性为构建自主生态提供了更广阔的空间。过去较长时间里,RISC-V更多应用于物联网与嵌入式领域,受限于通用计算性能与软件生态厚度,难以进入高端服务器市场。此次玄铁C950在基准测试中实现单核通用性能突破,并以“原生支持千亿参数模型”为卖点,体现出RISC-V向高性能通用计算与AI计算加速两条主线同步迈进的路径:既要“算得快”,也要“用得顺”。 影响:补齐全栈算力关键环节,推动从单点突破转向体系化竞争 发布信息显示,玄铁C950基于RISC-V开源架构,刷新了RISC-V在通用性能上的纪录;同时,达摩院推出Vector与Matrix两款RISC-V原生AI计算引擎,并与玄铁CPU统一编址,面向大模型推理等场景优化。与C950同期亮相的还有高能效版本C925以及支持芯片企业自定义修改IP的Flex可扩展平台。至此,C925、C930、C950构成面向服务器级市场的产品序列,覆盖从边缘到高端的多层次需求。 该组合的关键意义在于:以统一架构与统一软硬件接口为牵引,把通用处理、AI计算引擎与生态开发工具纳入同一技术路线,减少“异构拼装”带来的系统开销,提升整体可交付性。对产业而言,高性能RISC-V服务器CPU与原生AI引擎的推进,有望带动编译器、操作系统、数据库与推理框架等关键软件加速适配,进而形成从芯片到应用的正向循环,扩大RISC-V在数据中心场景的可用边界。 对策:以“软硬协同+生态共建”降低迁移成本,以开放平台扩大产业参与度 从技术演进看,RISC-V走向高端市场的难点不止于芯片本身,更在于生态成熟度与工程化能力。要让企业“愿意换、换得动、用得稳”,必须在工具链、性能调优、兼容性与运维体系上持续投入。达摩院同步推出的Flex可扩展平台,释放了更强的可定制空间,有助于芯片企业、系统厂商与行业客户围绕特定业务需求进行差异化设计,缩短产品落地周期。 同时,面向大模型推理与智能体应用的兴起,未来算力基础设施将更强调集群级效率与能耗约束。通过在CPU侧增强调度与通用性能、在原生AI计算引擎侧提升特定算子与数据通路效率,并与模型侧进行针对性适配,可在“性能—成本—能耗”三角中争取更优解。业内人士认为,这一思路与全球算力产业向“平台化交付、系统级优化”的趋势一致。 前景:RISC-V服务器化迈入关键窗口期,体系化创新将决定上限 从产业周期看,国内算力基础设施投资持续加大,推动了服务器芯片与系统软件的迭代窗口。随着大模型应用进入规模化落地阶段,企业对可控、可扩展、可持续的算力底座需求深入提升。玄铁C950的发布,意味着RISC-V在“通用计算+AI计算”两场硬仗上迈出更实质一步,但其能否在数据中心形成广泛影响,仍取决于生态成熟速度、行业软件适配深度以及与整机、网络、存储等环节的协同效率。 可以预见的是,未来竞争将不止比拼单颗芯片指标,而是围绕“算力平台”的全链路能力展开:芯片只是起点,系统架构、软件栈、开发者生态和规模化交付能力将共同决定技术路线的上限与市场边界。
玄铁C950的发布不仅是一次产品迭代,也反映了中国企业在全球芯片产业格局中寻找突破口的实践。在数字经济竞争加速的背景下——坚持自主创新——同时推进开放合作,才能在核心技术领域提升话语权并实现跨越。该案例也说明,通过持续投入与真实场景牵引,中国企业有机会在高端技术领域取得进展,并在全球科技生态中贡献更多力量。