智能算力需求激增倒逼基础设施升级 专家呼吁构建中国特色"词元经济学"

问题:词元需求进入“倍增区间”,基础设施承压加剧 近期,智能体框架开发者和产业侧迅速普及,推动大模型应用从单轮、多轮对话,走向“分解任务—调用工具—执行计划—反馈迭代”的复杂工作流。业内人士指出,这个演进直接带来推理链路变长、调用环节增多,词元消耗也从“按次计”转向“按流程计”,对算力供给、调度效率、并发能力和稳定性提出更高要求。 无问芯穹联合创始人兼首席执行官夏立雪在采访中表示,智能体更像能帮助用户完成大型任务的“执行者”,应用边界被显著拓展,但词元消耗也随之放大。其平台与Mimo等合作方的运行数据显示,自今年1月底以来,日均词元调用量保持高速增长,几乎每两周翻一番,累计增幅约十倍。夏立雪将这一曲线类比为早期移动互联网流量爆发,认为行业正在进入以推理为核心的增长阶段。 原因:从“生成”到“推理+工具”,带来系统性消耗上移 多位从业者分析,词元需求快速上升并非单一因素所致,而是应用形态变化叠加的结果:一是智能体需要持续“思考与规划”,推理链更长;二是工具调用、检索增强、代码执行等流程提升了模型交互频次与上下文长度;三是企业级复杂任务对准确率与可控性要求更高,系统往往采用多轮校验、反思、重试等策略,更推高词元消耗;四是并发量上升放大“峰值压力”,对调度、缓存、编排与故障恢复提出更严苛要求。 ,行业还面临现实约束:一上,算力资源区域分布、结构供给和成本上并不均衡;另一上,推理负载对时延、吞吐和成本更敏感,单纯增加硬件难以从根本上解决“单位词元成本”和“单位能耗产出”的问题。夏立雪认为,现阶段行业的算力与系统能力整体仍难完全承接快速增长的需求,系统效率将成为能否跨越瓶颈的关键变量。 影响:从单点性能竞争转向“效率—成本—能耗”综合赛 词元需求倍增正在重塑竞争维度。对大模型企业而言,推理成本将更直接影响产品定价、用户规模和商业化路径;对下游行业而言,部署与调用成本决定应用能否规模化落地;对基础设施提供商而言,稳定供给与高效交付成为核心能力——谁能在同等资源下产出更多有效词元,谁就更具优势。 同时,能源与碳约束正成为无法回避的外部条件。全球可用于AI发展的能源与算力终究有限,如果能效与利用率提升不明显,产业可能面临成本上升、供给受限和扩张放缓等风险。因此,业界更关注“从硬件到系统到服务”的全链路效率优化。 对策:打造高能效“词元工厂”,以软硬件协同提升利用率 面对压力与机遇,基础设施企业正从多层面推进优化。夏立雪介绍,无问芯穹正在构建高能效“词元工厂”,通过打通国内外十余种芯片生态、对接数十个算力集群,进行软硬件协同调优,让算力资源更高效地被利用,提升整体利用率与服务稳定性。其重点思路包括:以更精细的调度与编排降低空转,以模型与系统联合优化提升吞吐,并通过工程化手段减少不必要的上下文与重复计算,从而降低单位词元成本。 更重要的是,业内也在重新评估传统云基础设施对智能体的适配性。夏立雪认为,传统云基础设施主要面向人类工程师与软件开发流程,如果仍按“人类操作系统的逻辑”来适配智能体,可能限制其能力释放。基于此,他提出中期到中长期基础设施将走向智能化:基础设施本身具备自主优化能力,能够根据任务特征自动调整资源配置、优化运行策略,推动算法与基础设施更深层的协同。 前景:以“可持续词元”推动产业长期发展,探索“词元经济学”链路 在增长趋势与资源约束并行的背景下,如何实现长期可持续已成为行业共识。夏立雪提出“可持续词元”概念,认为基础设施提供商的核心任务不仅是稳定、规模化提供词元服务,更要放眼全生态:打通从能源到算力、从算力到词元、从词元到产业价值的转化链路,形成面向未来的供给体系与效率体系。 他进一步提出,可依托能源与制造体系优势,通过高能效“词元工厂”提供更具性价比的词元服务,满足全球多元应用需求,推动“AI-Made in China”能力输出。这也反映出行业对未来竞争焦点的判断:不仅比拼模型能力,更比拼以能效与规模化交付为核心的基础设施体系。

从智能体带来的Token激增可以看到,产业发展正进入“应用牵引基础设施”的新阶段。未来的竞争不仅在模型参数与能力,也在系统工程、能效水平与供给体系的韧性。以更高效率、更强协同、更可持续的方式交付Token服务,将成为推动产业稳步前行的重要基础。