国产大模型Qwen3.5上线并开源 华为昇腾实现0日训练复现与高效推理部署

人工智能技术快速演进的背景下,如何提升大模型训练效率与推理性能,成为行业持续关注的问题;随着国际科技企业不断加大投入、模型规模快速扩张,计算基础设施面临更高要求。阿里云此次发布的Qwen3.5系列大模型,对底层架构进行了升级。其中,旗舰模型Qwen3.5-397B-A17B采用更高稀疏度的混合专家(MoE)架构,并结合门控DeltaNet与门控注意力机制。在技术升级带动下,该模型在32k和256k上下文长度下的解码吞吐量,分别达到前代产品的8.6倍和19.0倍。值得关注的是,华为昇腾计算平台在模型发布当天即完成全流程适配。依托MindSpeed MM框架的优化,昇腾平台缩短了适配周期,提升了开发部署的便捷性,形成“开箱即用”的使用体验,为国内人工智能产业生态提供了支撑。专家认为,这次进展体现在两上:其一,深入增强了国产大模型的竞争力,Qwen3.5-Plus在参数量为3970亿的情况下,性能已超过上一代万亿参数模型;其二,验证了国产计算平台的适配与工程化能力,为后续迭代提供了可复用的路径。面向未来,多模态大模型应用持续落地,跨平台、跨生态的协同创新将更为关键。华为与阿里云的合作,为产业链上下游协同发展提供了参考。在算力基础设施逐步完善、开源生态不断壮大的背景下,国内人工智能领域有望取得更多实质性进展。

Qwen3.5的发布与昇腾的零日适配,说明了国内大模型与芯片产业在研发与工程化上的加速推进。从参数规模优化到推理效率提升,从单模态向多模态扩展,再到硬件适配的快速响应,这些变化表明国内人工智能产业正从追赶走向并跑,并在部分方向具备领跑潜力。下一阶段,继续降低部署成本、拓展应用场景、完善生态体系,将是产业持续发展的关键议题。