我国企业发布万亿参数智能模型多项性能指标刷新国际纪录

面向新一轮通用推理能力竞争与行业落地需求，推理型大模型如何“更强能力”与“更低成本”之间取得平衡，已成为技术演进的重要议题。一上，复杂任务对事实核验、长链推理、指令遵循和多工具协同提出更高要求；另一方面，推理算力开销与响应时延直接影响部署成本与用户体验，进而制约规模化应用。基于此，阿里发布千问旗舰推理模型Qwen3-Max-Thinking。官方信息显示，该模型参数规模超万亿，预训练数据量达36T Tokens，定位为千问体系中规模最大、能力最强的推理模型之一。此前同系列预览版本在数学推理涉及的测评中表现突出，正式版在此基础上更加大强化学习后训练力度，围绕复杂推理、知识问答、偏好对齐、指令遵循与智能体能力等方向进行系统提升，并在涵盖多维能力的19项常用基准测试中取得多项领先表现。

千问旗舰推理模型的发布，体现出国内大模型在参数规模、推理能力与工程实现上的整体进展；面对全球AI竞争格局，该进展既反映了中国科技企业的技术积累，也意味着大模型应用将进入更务实、更强调效率的阶段。随着测试时扩展等机制的落地，以及Agent能力的持续完善，大模型有望在更多真实场景中发挥作用，推动人工智能技术向更深层次的应用转化。

我国企业发布万亿参数智能模型 多项性能指标刷新国际纪录

我国企业发布万亿参数智能模型多项性能指标刷新国际纪录