国产大模型Qwen3.5上线并开源华为昇腾实现0日训练复现与高效推理部署

人工智能技术快速演进的背景下，如何提升大模型训练效率与推理性能，成为行业持续关注的问题；随着国际科技企业不断加大投入、模型规模快速扩张，计算基础设施面临更高要求。阿里云此次发布的Qwen3.5系列大模型，对底层架构进行了升级。其中，旗舰模型Qwen3.5-397B-A17B采用更高稀疏度的混合专家（MoE）架构，并结合门控DeltaNet与门控注意力机制。在技术升级带动下，该模型在32k和256k上下文长度下的解码吞吐量，分别达到前代产品的8.6倍和19.0倍。值得关注的是，华为昇腾计算平台在模型发布当天即完成全流程适配。依托MindSpeed MM框架的优化，昇腾平台缩短了适配周期，提升了开发部署的便捷性，形成“开箱即用”的使用体验，为国内人工智能产业生态提供了支撑。专家认为，这次进展体现在两上：其一，深入增强了国产大模型的竞争力，Qwen3.5-Plus在参数量为3970亿的情况下，性能已超过上一代万亿参数模型；其二，验证了国产计算平台的适配与工程化能力，为后续迭代提供了可复用的路径。面向未来，多模态大模型应用持续落地，跨平台、跨生态的协同创新将更为关键。华为与阿里云的合作，为产业链上下游协同发展提供了参考。在算力基础设施逐步完善、开源生态不断壮大的背景下，国内人工智能领域有望取得更多实质性进展。

Qwen3.5的发布与昇腾的零日适配，说明了国内大模型与芯片产业在研发与工程化上的加速推进。从参数规模优化到推理效率提升，从单模态向多模态扩展，再到硬件适配的快速响应，这些变化表明国内人工智能产业正从追赶走向并跑，并在部分方向具备领跑潜力。下一阶段，继续降低部署成本、拓展应用场景、完善生态体系，将是产业持续发展的关键议题。

国产大模型Qwen3.5上线并开源 华为昇腾实现0日训练复现与高效推理部署

国产大模型Qwen3.5上线并开源华为昇腾实现0日训练复现与高效推理部署