近年来,大模型训练与推理需求快速增长,算力基础设施与核心软件栈的重要性被进一步放大。
面对国际科技竞争加剧与供应链不确定性上升,“主权AI”从概念讨论走向现实考题:能否在关键环节形成可控、可用、可持续迭代的自主体系,直接关系到未来产业竞争力与国家科技安全。
问题在于,“主权AI”不是单点突破的工程,而是一条长链条、重协同的系统能力。
郑纬民在会上指出,决定成败的关键并非仅是硬件“能不能跑”,更在于是否能形成足够规模且愿意长期投入的开发者群体,让更多应用稳定运行在同一套技术栈之上。
这一判断直指痛点:如果生态不能支撑大规模应用落地,硬件性能优势也难以转化为市场优势与产业优势。
原因主要来自三方面。
一是传统芯片产业长期依赖全球化分工,架构设计、制造设备、代工、封装测试等环节高度耦合,在外部环境变化时容易暴露“卡点”。
二是国内产业在快速发展过程中出现“内卷与碎片化”现象:不同厂商接口不一、工具链差异明显,导致适配成本高、开发周期长,开发者需要投入大量重复劳动。
三是大模型时代的软件复杂度陡增,训练框架、算子库、编译器、驱动与系统调度等环节任何一处短板都会放大整体摩擦,使“能用”与“好用”之间产生明显落差。
影响层面,若生态分散、标准不统一,将直接推高应用迁移成本,削弱开发者信心,进而抑制应用供给与商业化闭环形成;若供应链风险不可控,则算力基础设施的建设与交付可能面临不确定性,影响科研与产业部署节奏;若算法与平台适配能力不足,大模型训练与优化难以充分释放硬件潜力,形成“算力投入高、产出效率低”的局面。
反过来看,一旦实现算力、算法、生态的协同推进,不仅有助于提升算力利用效率和模型训练能力,也将带动工具链、软件服务、行业应用的整体升级,形成更具韧性的产业体系。
对策上,郑纬民提出的路径更强调系统工程思维:以“算力自主、算法自强、生态自立”三位一体推进。
其中,算力自主至少包含三项硬指标:芯片设计能力自主、制造与供应链风险可控、系统与集群交付能力过硬,确保从单卡到集群的可用性与工程化落地。
算法自强则要求围绕GPU完成大模型适配、训练与优化,把模型能力转化为可规模化的训练效率与推理性能。
更重要的是生态自立——其内涵不是“跑通一个软件”即可,而是让平台具备“可开发、可维护、可迭代、可规模复制”的条件,让开发者愿意用、敢于用、长期用。
围绕生态建设,与会人士强调要把“降低开发者工作量”作为核心目标,通过产业联盟与软硬件协同设计推进接口与工具链的相对统一,减少重复适配,提升开发体验与迁移效率。
摩尔线程方面也表示,生态体系是GPU行业的核心价值所在,将依托统一计算架构持续加大研发投入,强化从硬件到软件的关键技术攻关,并通过开放合作深化与生态伙伴协同。
业内普遍认为,只有把开发环境、文档体系、兼容策略、性能调优工具、社区运营等“基础设施”做扎实,才能形成稳定的开发者正循环:应用越多、反馈越充分、迭代越快、平台越成熟。
前景判断上,大模型应用正在从通用能力竞争转向“工程能力与生态能力竞争”。
未来一段时期,“主权AI”的竞赛不只是算力规模比拼,更是平台标准化程度、软硬件协同效率、开发者活跃度和行业应用落地速度的综合较量。
随着产业链协同加强、应用牵引加速、统一生态逐步成形,国产计算平台有望在部分重点行业率先形成可复制的示范路径,并在持续迭代中提升国际竞争力。
同时也需看到,生态建设是一场“慢变量”工程,既需要长期投入,也需要规则共识与协作机制,避免重复建设与资源内耗。
主权AI的建设是一项长期的系统工程,需要在硬件、算法和生态三个维度同步推进。
郑纬民院士的论述深刻揭示了当前产业发展的关键瓶颈,即生态自立的紧迫性。
从某种意义上说,技术突破只是必要条件,而开发者生态的繁荣才是充分条件。
唯有通过产业界的团结协作,建立统一规范、易用友好的开发平台,才能吸引和培养足够的开发者队伍,形成自我强化的良性循环,最终实现主权AI从"能跑"到"好用"再到"广泛应用"的演进。
这一认识对于指导国产芯片产业的长远发展具有重要意义。