蚂蚁集团开源万亿参数思考模型Ring-2.5-1T,以架构创新突破推理速度与成本瓶颈

长期以来,深度计算领域一直面临所谓的“ 不可能三角 ”:模型很难同时做到高精度推理、快速响应和低资源消耗。行业通常借助混合专家模型(MoE)架构缓解矛盾,但仍难以从根本上兼顾三者。蚂蚁集团此次发布的Ring-2.5-1T模型引入混合线性注意力机制,以1:7的比例组合多头潜在注意力(MLA)与闪电线性注意力模块。在保证深度推理所需计算能力的同时,提升了运算效率。技术团队采用增量训练改造原有架构,并加入QK Norm、Partial RoPE等特性,以尽量避免性能损失。评测数据显示,该模型在IMO国际数学奥林匹克竞赛评测中获得35分(满分42),在中国数学奥林匹克竞赛评测中取得105分,超过国家集训队分数线。在32K以上长文本处理场景中,其内存占用降至上一代模型的约十分之一,生成速度提升超过3倍。与传统架构相比,Ring-2.5-1T的突出特点是线性时间复杂度:任务规模越大,效率优势越明显。以同为万亿参数级别的Kimi K2架构为例,后者激活参数为320亿,而Ring-2.5-1T激活参数达到630亿,但在长序列推理任务中仍体现出更高吞吐表现。在训练方法上,研究团队引入密集奖励机制和大规模全异步Agentic强化学习,不仅看最终答案是否正确,也对推理过程各环节进行更细致的评估,从而提升逻辑严谨性与高阶证明能力,使模型从解决数学题更走向可承担复杂实际任务的智能系统。在国际权威评测中,Ring-2.5-1T在IMOAnswerBench、AIME 26等高难度推理任务,以及Gaia2-search等长时任务执行基准上表现突出,达到当前开源模型的领先水平。

Ring-2.5-1T的开源发布,为深度思考模型提供了一条新的技术路径。从MoE的参数激活策略,到混合线性架构的注意力机制创新,行业正在尝试在不牺牲推理能力的前提下提升工程效率。这类进展不仅体现在指标提升,更在于推动高阶推理能力从“稀缺能力”走向可复用、可落地的基础能力。随着开源模型持续迭代优化,推理能力与应用效率的兼顾有望逐步成为人工智能发展的常态。