1. 华为云发布柔性智算 FlexNPU 及中小企业方案,直指智能体落地的算力与成本难题

问题——智能体加速落地,算力与成本成为“第一道门槛” 随着企业加快将智能能力嵌入研发、营销、客服、供应链等环节,能够自主规划、循环执行任务的智能体应用不断涌现。但实际部署中,不少企业遭遇两类突出矛盾:一上,长上下文、多轮推理、反复迭代使Token消耗迅速攀升,推理费用成为持续性支出压力;另一方面,部分企业自建或采购的推理资源池利用率不高,投入与产出不匹配,影响智能化项目扩面速度。会上,华为云对应的负责人指出,一些推理资源池平均利用率不足三成,算力“闲置”与业务“拥堵”并存,已成为阻碍企业规模化使用智能体的重要因素。 原因——成本高山、技术门槛与场景错位交织,导致“用不起、用不好” 业内观察显示,当前企业智能化转型呈现明显分化:工具与模型快速迭代,但落地效果不均衡。其背后主要有三方面原因:一是算力供需波动大,业务高峰与低谷交替,传统静态分配方式难以匹配,导致资源浪费或拥塞;二是模型选择、微调、部署、运维链条长,中小企业缺少专业团队,技术门槛抬高了试错成本;三是场景与流程未形成闭环,智能能力难以打通ERP、API与业务系统,导致“能对话、难办事”,从而拉低投入产出比。华为云SMB业务负责人会上用“一半是海水,一半是火焰”形容此现状:先进工具层出不穷,但落地仍需穿越成本与工程化的双重障碍。 影响——降本增效逻辑正在重塑企业智能化节奏与产业生态 智能体应用从“单点试用”走向“流程再造”,对算力供给方式提出更高要求。若Token成本与算力效率问题得不到解决,企业智能化将可能停留在局部试验阶段,难以进入规模化复制;相反,一旦算力利用率提升、成本可预测性增强,智能体有望成为企业新的通用生产力工具,带动协同办公、营销运营、开发运维、内容生产等高频场景的持续升级。另外,面向中小企业的解决方案若能实现标准化交付,将深入推动“平台底座+伙伴行业方案”的分工协同,促进产业链上下游形成更稳定的应用生态。 对策——以FlexNPU提升资源利用率,叠加四层方案打通从算力到应用的路径 针对上述痛点,华为云在会上推出柔性智算操作系统FlexNPU。其核心思路是通过更灵活的算力调度能力,提高推理池有效利用率,在相近硬件投入下提升Token吞吐与服务能力,以此压降单位推理成本并增强供给弹性。华为云相关技术负责人将其概括为“可随需伸缩”的算力供给方式,即让NPU/GPU算力能够根据业务需求动态调整,减少资源闲置与排队等待。 与此配套,华为云发布面向中小企业的AI解决方案,覆盖四个层级:在AI基础设施层,提供多代AI算力产品与自研基础软件能力,面向小模型训练与推理等需求强化弹性供给;在模型服务层,支持主流开源模型选择,并提供结合企业数据进行低成本微调的路径,降低专属模型门槛;在智能体平台层,提供相对易用的开发环境,便于围绕行业与场景构建企业级智能体;在智能体应用层,联合伙伴面向洞察分析、营销运营、协同办公、开发运维、内容制作等需求开展场景化落地,强调与业务系统对接,实现流程闭环。华为云上介绍,目前相关能力已在多个行业推进应用,累计覆盖较多企业与场景问题,形成可复制的落地经验。 此外,华为云提出“加速智能化 企业快成长行动2026”,计划从品牌、商业与技术等维度加大对中小企业及开发者的支持力度,推动伙伴共创与专业交付,增强“底座能力+行业方案”的协同效率。华为云相关负责人表示,将在未来提升算力服务的柔性与适配性,推动成本核算从粗放走向精细,让中小企业智能化从“试试看”走向“用得起、用得稳”。 前景——算力将走向“精细化运营”,智能体规模化落地有望提速 从产业趋势看,智能体应用对算力的要求正从“峰值能力”转向“持续可用与成本可控”,算力调度、资源池运营、模型服务与行业工程化将成为竞争焦点。柔性调度能力若能在更广泛场景验证其稳定性与经济性,将有望推动企业从“算力采购”思维转向“算力运营”思维,即以更高利用率、更强弹性和更可预测的成本结构支撑业务增长。面向中小企业的关键,在于降低门槛、减少试错并形成可交付的行业模板。随着平台能力完善和伙伴生态扩展,企业级智能体有望从单一岗位助手升级为跨部门流程的“数字员工”,进一步释放组织效率与数据价值。

算力成本一度是制约AI普及的关键瓶颈,而柔性计算的推进为中小企业打开了智能化转型的新窗口;在数字经济加速发展的背景下,技术创新与生态协作将共同推动产业升级。华为云的有关探索为行业提供了可借鉴的路径。面向未来,如何深入降低应用门槛、释放AI能力,仍有赖于产学研各方持续投入与联合推进。