智谱GLM-5开源上线参数规模升至744亿已完成多芯片适配部署

（问题）大模型加速落地的背景下，行业普遍遇到两道现实门槛：一是高性能模型到应用交付之间仍存在“可用性鸿沟”，模型在真实业务中的稳定性、成本和迭代速度，直接决定能否顺利上线；二是算力与生态日益多元，模型若缺乏对不同硬件与工具链的适配，往往难以规模化部署；在合规前提下，开源模型如何做到高质量可用，成为产业关注的焦点。（原因）智谱此次宣布上线并开源GLM-5，核心意图是降低开发与部署门槛，加快生态扩张。一上，模型参数规模提升至744B（激活40B），能力覆盖与推理效率之间寻求新的平衡，既增强对复杂任务的处理能力，也尽量控制推理成本；另一上，面向产业端“多平台、异构化”的算力格局，企业加快与多家国产算力平台的深度推理适配，提升工程落地的可迁移性与交付确定性。同时，采用更为宽松的MIT许可开放权重，也体现出以更低的制度成本吸引开发者、扩大二次开发与商业应用的考虑。（影响）从供给侧看，模型开源并同步开放权重，有助于形成可复现、可验证、可改造的技术路径，推动工具链完善与行业基准评测的统一；从需求侧看，开发者可基于开源权重进行本地部署，并面向垂直场景微调与优化，缩短从实验到上线的周期。值得关注的是，智谱同时确认此前OpenRouter以“Pony”匿名发布的开源模型即为GLM-5。匿名上线带来的“先试后证”效应，使模型在公开讨论与真实调用中提前完成压力测试，积累了开发者反馈与应用案例。企业表示，已有开发者基于该模型做出“能用、能玩、能上线”的应用，一定程度上反映出模型工程化成熟度与生态可用性在提升。（对策）针对“用得起来、跑得稳定、管得住”目标，下一步关键在三上：其一，继续完善跨硬件、跨框架的推理优化与适配，形成更清晰的部署指引、性能基线与兼容矩阵，降低企业迁移成本；其二，在开放权重的同时，加强安全治理与合规边界的技术措施和使用规范，推动形成可追溯、可审计的应用管理机制，降低模型滥用风险；其三，推动从模型能力到产品能力的转化，通过套餐化服务和逐步扩围提升可获得性。按企业披露，GLM-5已纳入Max用户套餐，Pro套餐预计约5天内支持，并将逐步扩大覆盖范围，以兼顾开源生态与产品化服务的协同发展。（前景）业内人士认为，大模型竞争正从单纯比拼“参数规模”转向“能力—成本—生态”的综合较量。若开源模型能在国产算力平台上形成稳定、可复制的部署范式，将深入带动软硬件协同优化与应用创新扩散。随着更多开发者基于开源权重推出可交付产品，大模型的价值将更多体现在行业流程重构、数据资产激活与服务效率提升上。同时，生态扩张也对模型安全、版权合规与内容治理提出更高要求，涉及的规范建设预计将成为下一阶段的重要变量。

GLM-5的开源不只是一次技术迭代，也为国产人工智能基础设施建设提供了新的样本。在全球竞争与自主可控并行推进的背景下，这类进展既表明了我国科研机构与企业的创新能力，也为构建更安全、可控的技术生态积累了实践经验。随着技术创新与产业需求形成更紧密的互动，中国人工智能发展正在进入更注重落地与成效的新阶段。

智谱GLM-5开源上线 参数规模升至744亿 已完成多芯片适配部署

智谱GLM-5开源上线参数规模升至744亿已完成多芯片适配部署