阿里云发布新一代开源大模型 性能效率双突破引领技术革新

阿里云日前其官方平台低调上线Qwen3.5-Plus和Qwen3.5-397B-A17B两款新一代大语言模型。这两款产品分别定位为Qwen3.5系列最新版本和开源旗舰版本,均具备文本处理和多模态任务能力,代表了国内大模型技术发展的最新成果。 据技术资料显示,Qwen3.5系列实现了底层架构的全面革新。其中旗舰版Qwen3.5-Plus总参数规模达到3970亿,但每次推理仅需激活170亿参数,这个设计使其性能超越了参数量达万亿级别的前代Qwen3-Max模型。更为关键的是,新模型在部署时显存占用降低60%,最大推理吞吐量提升幅度达到19倍,有效解决了大规模模型部署成本高、运行效率低的行业痛点。 技术创新是此次产品升级的核心驱动力。Qwen3.5-397B-A17B采用了线性注意力机制与稀疏混合专家系统相结合的混合架构方案。这种架构设计在保持模型能力的前提下,通过参数激活优化实现了速度与成本的双重改善。同时,模型的语言支持范围从119种扩展至201种,覆盖更多语言和方言,词表规模从15万扩充至25万,在多数语言场景下编码和解码效率提升10%至60%。 从技术演进路径来看,Qwen3.5在三个维度实现了突破。在能力层面,模型基于更大规模的视觉-文本语料训练,强化了中英文、多语言、理工科知识及推理能力,通过严格的数据过滤确保质量。在效率层面,采用高稀疏度的混合专家系统、混合注意力机制以及多标记预测技术,使得在32k和256k上下文长度下,解码吞吐量分别达到前代产品的8.6倍和19倍。在通用性层面,通过早期文本-视觉融合技术实现原生多模态能力,在视频理解、理工科应用等场景表现优异。 业内分析认为,此次发布的模型在推理、编程、智能体构建及多模态理解等多项基准测试中表现突出,将为开发者和企业用户提供更高效的生产力工具。特别是在智能体应用场景中,高效的混合架构与原生多模态推理能力为构建新一代数字智能系统奠定了技术基础。 阿里云上表示,下一阶段的研发重点将从单纯追求模型规模转向系统整合能力提升。具体方向包括构建具备跨会话持久记忆的智能体系统、开发面向真实世界交互的具身接口、建立自我改进机制等。目标是打造能够长期自主运行、逻辑一致的智能系统,将当前以单一任务为边界的辅助工具升级为可持续、可信赖的智能伙伴。 从产业发展角度观察,大模型技术正在从参数规模竞赛转向效率优化和实用化部署阶段。Qwen3.5系列通过架构创新实现性能与成本的平衡,为大模型的规模化商业应用提供了可行路径。同时,开源旗舰版本的推出也将推动整个行业的技术共享与协同创新,加速智能应用在更多场景的落地。

大模型发展的下一阶段,关键不只是能力更强,还要应用更稳、成本更低、生态更活。从架构优化到多语言扩展,再到面向智能体的系统化布局,此次新品上线反映出行业从参数竞赛转向效率与落地的变化。谁能在开放生态、工程能力与安全治理之间找到可持续的平衡点,谁就更可能在新一轮智能化浪潮中占得先机。