
蚂蚁正式发布 Ring-2.6-1T,一款面向真实复杂任务场景打造的万亿级旗舰思考模型。
随着大模型逐步进入 Agent、工程开发、科研分析与企业工作流等真实生产环境,行业对“推理能力”的需求正在发生变化:并非所有任务都需要同等级别的思考深度。一次简单的格式转换,与一道复杂数学竞赛题,对推理资源的要求截然不同。

因此,Ring-2.6-1T 引入可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度,让开发者能够根据任务复杂度灵活控制模型思考深度,在效果、速度与成本之间取得更优平衡。其中,
- high 面向高频 Agent 工作流,具备更低 Token 开销与更快多步执行能力,适合多轮交互、工具协作、任务拆解和生产级默认调用;
- xhigh 面向数学、科研、复杂逻辑分析与多路径探索等高难任务,为复杂推理提供更充分的思考空间。
在真实任务执行类评测中,Ring-2.6-1T high 表现突出:
- PinchBench 得分 87.60,显著高于 GPT-5.4 xHigh、Gemini-3.1-Pro high 与 Claude-Opus-4.7 xhigh;ClawEval 得分 63.82,在可比模型中位居前列;Tau2-Bench Telecom 达到 95.32,与最高分模型差距不足 1 分,体现出其在复杂业务流程、工具协作与行业任务中的稳定执行能力。
在高难推理任务上,Ring-2.6-1T xhigh 展现出更高能力上限:
- ARC-AGI-V2 得分 77.78,与 Gemini-3.1-Pro high 和 Claude-Opus-4.7 xhigh处于同一水位;AIME 26 得分 95.83,接近多家头部模型水平;GPQA Diamond 达到 88.27,体现出稳健的科学知识理解与复杂推理能力。
总体来看,Ring-2.6-1T 希望解决的不只是“模型是否足够聪明”,更是“模型能否以合理推理成本,在真实复杂工作流中稳定、高效地完成任务”。
目前,Ring-2.6-1T 已上线 OpenRouter(https://openrouter.ai/inclusionai/ring-2.6-1t:free),并开放限时一周免费体验。可在 Agent、Coding 与复杂工作流场景中进行真实测试与反馈。模型也将在近期正式开源。
mingzhi
Latest posts by mingzhi (see all)- AI PC从概念转入主流应用:AMD以全栈方案引领变革 – 2026年5月9日
- 面向真实复杂任务场景,蚂蚁Ring-2.6-1T 正式发布 – 2026年5月9日
- 权威认证|东软添翼稳居中国医疗大模型第一梯队 – 2026年5月8日
来源:数字经济
The End
免责声明:本文内容来源于第三方或整理自互联网,本站仅提供展示,不拥有所有权,不代表本站观点立场,也不构成任何其他建议,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容, 请及时联系我们进行处理。