阿里发布千问旗舰推理模型Qwen3-Max-Thinking

2026年01月27日 来源：阿里云

关键字：阿里云大模型 AI

1月26日，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿（1T），预训练数据量高达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。

千问新模型通过总参数、强化学习、推理计算的极致规模扩展，实现了性能的大幅飞跃，在多项关键性能基准测试中刷新全球新纪录。同时，该模型采用全新测试时扩展机制，推理性能提升同时更经济，并大幅增强原生Agent能力，模型对话时可自主调用工具。

目前，开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型，企业可通过阿里云百炼获取新模型API服务，普通用户也可通过千问PC端和网页端试用模型。此外，千问APP也即将接入新模型，所有用户都可免费体验千问最强模型。

体验地址??

Qwen Chat：https://chat.qwen.ai/

百炼API：https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

千问APP网页版：https://www.qianwen.com/

规模最大、能力最强的千问推理模型

Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型，其总参数量超万亿（1T），预训练数据量高达36T Tokens。

此前，预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分，推理性能已让人惊艳；在此基础上，阿里通义团队进行了更大规模的强化学习后训练，全面提升了正式版Qwen3-Max-Thinking性能。

其中，在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中，千问旗舰推理模型刷新了数项最佳表现（SOTA）纪录，整体性能可媲美国际顶尖AI大模型。

测试时扩展机制，推理性能提升且更经济

在关键的模型推理能力提升中，千问新模型采用了一种全新的测试时扩展（Test-time Scaling）机制，推理性能提升的同时还更经济。

业界普遍的推理时计算，只会简单增加并行推理路径，重复推导已知结论很常见，冗余推理效率低下；而千问采用的这一机制，可对此前推理的结果进行“经验提取”式的提炼，并据此进行多轮自我迭代，在相同的上下文中实现更高效的推理计算，因此获得更智能的推理结果。

基于这一推理技术创新，千问推理性能和推理效率大为提升，比如在启用工具的“人类最后的测试”HLE中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8，录得当前所有模型的最高分。

大幅增强原生Agent能力，对话时自主调用工具

面向即将到来的智能体Agent时代，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

这种自适应的工具调用能力可在QwenChat上完整体验，Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能，提供专业人士一样水平的回答，更合用户心意、更智能、更流畅；同时，模型幻觉也大为降低，为解决真实复杂任务打下基础。

该能力源自于通义团队专门设计的训练流程。具体而言，在完成初步的工具使用微调后，团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练，使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

???????

责任编辑：邓珊珊

您可以：

排行榜

编辑推荐: • 研华与高美馆首度跨界合作以边缘 AI 打造生成...; • 九科信息智能体bit-Agent：企业数字化的下一代...; • 聚力同心共跃2026 台达IA中国区渠道商大会成...; • 和利时成功入选“国家知识产权示范企业”创建...; • 微软推出下一代AI芯片Maia 200; • 阿里发布千问旗舰推理模型Qwen3-Max-Thinking; • 罗克韦尔自动化石安：以“提质”为牵引，中国...; • 首个低代码国家标准发布，2026年7月1日实施; • 腾讯云智能体开发平台升级：做深平台、做厚内...; • PTC 通过全新的ALM版本为软件驱动型产品开发交...; • 银河通用机器人成为总台2026春晚指定具身大模...; • 工信部拟制定标准规范数字人身份标识

文章推荐: • 物理AI加速渗透，机器人迈入“能思考、会干活...; • 基于IDEF0的单相异步电机并行设计过程建模; • 变局与重构：2025工业机器人产业发展热点观察; • 基于“整车DMU”工具的开发与应用; • 汽车零件设计可制造性智能检查研究及实践; • 备受追捧的MCP协议，凭什么成为AI Agent的“万...; • 仪表板总成定频振动耐久试验失败原因分析及仿...; • 一文详解：PID控制中的P、I、D都应怎么调？; • 机械产品智能演变设计的挑战与实现路径; • 基于PLM的数智化协同工艺开发平台建设研究及实...; • 浅谈机床的正向设计; • 多品种、小批量、大规模定制难题何解？在海康...

阿里发布千问旗舰推理模型Qwen3-Max-Thinking

系列微信

旗下机构

旗下其他网站

特色服务