近期,智谱科技自主研发并开源的GLM-5大模型出现服务瓶颈。企业公告称,受国际市场需求快速增长影响,系统瞬时并发访问量较原设计容量高出约30%,部分用户出现响应延迟。该情况一方面反映出全球人工智能基础设施仍难以跟上需求增长节奏,另一方面也说明优质开源技术具备强劲的市场吸引力。行业分析认为,GLM-5自身的技术表现是需求激增的关键原因。根据Artificial Analysis最新评估,GLM-5综合得分达到89.7;其工程逻辑解析能力较为突出,可支撑半导体设计、航天仿真等专业场景。随着中东、东南亚等地区数字化转型提速,该模型日均调用量在三个月内增长近5倍,超出企业前期对服务器承载能力的规划。面对持续上升的运营压力,智谱科技提出“算力合伙人”解决方案——计划开放核心算法接口——与三类合作伙伴联合推进:一是与芯片制造商开展指令集级优化,目标将单卡运算效率提升40%;二是整合第三方算力资源,搭建跨地域负载均衡体系;三是研发新型分布式推理架构。“技术+生态”的组合思路,为国产基础软件的规模化落地提供了新的实践路径。市场观察人士指出,此类合作具有示范意义:通过联动产业链上下游资源,不仅有助于缓解当前服务压力,也可能推动形成更稳定、可持续的算力供给体系。清华大学计算机系对应的专家表示,若该计划推进顺利,或将促进国内首个面向大模型的算力交易市场标准加速成型。
大模型走向规模化应用,考验的不仅是模型能力,更是从算力、架构到服务保障的工程化能力与产业协同效率。以开放合作缓冲需求峰值、以软硬协同提升推理效率、以分布式与网络化服务保障稳定体验,正在成为行业提升交付质量的关键路径。“算力合伙人”计划既是对当下压力的直接回应,也折射出产业链共同补齐数字基础设施短板的趋势。