1. 华为云发布柔性智算 FlexNPU 及中小企业方案，直指智能体落地的算力与成本难题

问题——智能体加速落地，算力与成本成为“第一道门槛” 随着企业加快将智能能力嵌入研发、营销、客服、供应链等环节，能够自主规划、循环执行任务的智能体应用不断涌现。但实际部署中，不少企业遭遇两类突出矛盾：一上，长上下文、多轮推理、反复迭代使Token消耗迅速攀升，推理费用成为持续性支出压力；另一方面，部分企业自建或采购的推理资源池利用率不高，投入与产出不匹配，影响智能化项目扩面速度。会上，华为云对应的负责人指出，一些推理资源池平均利用率不足三成，算力“闲置”与业务“拥堵”并存，已成为阻碍企业规模化使用智能体的重要因素。原因——成本高山、技术门槛与场景错位交织，导致“用不起、用不好” 业内观察显示，当前企业智能化转型呈现明显分化：工具与模型快速迭代，但落地效果不均衡。其背后主要有三方面原因：一是算力供需波动大，业务高峰与低谷交替，传统静态分配方式难以匹配，导致资源浪费或拥塞；二是模型选择、微调、部署、运维链条长，中小企业缺少专业团队，技术门槛抬高了试错成本；三是场景与流程未形成闭环，智能能力难以打通ERP、API与业务系统，导致“能对话、难办事”，从而拉低投入产出比。华为云SMB业务负责人会上用“一半是海水，一半是火焰”形容此现状：先进工具层出不穷，但落地仍需穿越成本与工程化的双重障碍。影响——降本增效逻辑正在重塑企业智能化节奏与产业生态智能体应用从“单点试用”走向“流程再造”，对算力供给方式提出更高要求。若Token成本与算力效率问题得不到解决，企业智能化将可能停留在局部试验阶段，难以进入规模化复制；相反，一旦算力利用率提升、成本可预测性增强，智能体有望成为企业新的通用生产力工具，带动协同办公、营销运营、开发运维、内容生产等高频场景的持续升级。另外，面向中小企业的解决方案若能实现标准化交付，将深入推动“平台底座+伙伴行业方案”的分工协同，促进产业链上下游形成更稳定的应用生态。对策——以FlexNPU提升资源利用率，叠加四层方案打通从算力到应用的路径针对上述痛点，华为云在会上推出柔性智算操作系统FlexNPU。其核心思路是通过更灵活的算力调度能力，提高推理池有效利用率，在相近硬件投入下提升Token吞吐与服务能力，以此压降单位推理成本并增强供给弹性。华为云相关技术负责人将其概括为“可随需伸缩”的算力供给方式，即让NPU/GPU算力能够根据业务需求动态调整，减少资源闲置与排队等待。与此配套，华为云发布面向中小企业的AI解决方案，覆盖四个层级：在AI基础设施层，提供多代AI算力产品与自研基础软件能力，面向小模型训练与推理等需求强化弹性供给；在模型服务层，支持主流开源模型选择，并提供结合企业数据进行低成本微调的路径，降低专属模型门槛；在智能体平台层，提供相对易用的开发环境，便于围绕行业与场景构建企业级智能体；在智能体应用层，联合伙伴面向洞察分析、营销运营、协同办公、开发运维、内容制作等需求开展场景化落地，强调与业务系统对接，实现流程闭环。华为云上介绍，目前相关能力已在多个行业推进应用，累计覆盖较多企业与场景问题，形成可复制的落地经验。此外，华为云提出“加速智能化企业快成长行动2026”，计划从品牌、商业与技术等维度加大对中小企业及开发者的支持力度，推动伙伴共创与专业交付，增强“底座能力+行业方案”的协同效率。华为云相关负责人表示，将在未来提升算力服务的柔性与适配性，推动成本核算从粗放走向精细，让中小企业智能化从“试试看”走向“用得起、用得稳”。前景——算力将走向“精细化运营”，智能体规模化落地有望提速从产业趋势看，智能体应用对算力的要求正从“峰值能力”转向“持续可用与成本可控”，算力调度、资源池运营、模型服务与行业工程化将成为竞争焦点。柔性调度能力若能在更广泛场景验证其稳定性与经济性，将有望推动企业从“算力采购”思维转向“算力运营”思维，即以更高利用率、更强弹性和更可预测的成本结构支撑业务增长。面向中小企业的关键，在于降低门槛、减少试错并形成可交付的行业模板。随着平台能力完善和伙伴生态扩展，企业级智能体有望从单一岗位助手升级为跨部门流程的“数字员工”，进一步释放组织效率与数据价值。

算力成本一度是制约AI普及的关键瓶颈，而柔性计算的推进为中小企业打开了智能化转型的新窗口；在数字经济加速发展的背景下，技术创新与生态协作将共同推动产业升级。华为云的有关探索为行业提供了可借鉴的路径。面向未来，如何深入降低应用门槛、释放AI能力，仍有赖于产学研各方持续投入与联合推进。