1. e-works数字化企业网
  2. 新闻
  3. IT要闻 > 软件动态

阿里发布千问旗舰推理模型Qwen3-Max-Thinking

 
2026年01月27日 来源:阿里云
关键字:阿里云  大模型  AI  
 
       1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。

       千问新模型通过总参数、强化学习、推理计算的极致规模扩展,实现了性能的大幅飞跃,在多项关键性能基准测试中刷新全球新纪录。同时,该模型采用全新测试时扩展机制,推理性能提升同时更经济,并大幅增强原生Agent能力,模型对话时可自主调用工具。

1
 
       目前,开发者可在QwenChat上免费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。此外,千问APP也即将接入新模型,所有用户都可免费体验千问最强模型。

       体验地址??

       Qwen Chat:https://chat.qwen.ai/

       百炼API:https://bailian.console.aliyun.com/cn-beijing/?tab=model#/model-market/detail/qwen3-max-2026-01-23

       千问APP网页版:https://www.qianwen.com/

       规模最大、能力最强的千问推理模型

       Qwen3-Max-Thinking是目前阿里规模最大、能力最强的千问推理模型,其总参数量超万亿(1T),预训练数据量高达36T Tokens。

       此前,预览版Qwen3-Max-Thinking斩获数学推理AIME 25和HMMT 25的国内首个双满分,推理性能已让人惊艳;在此基础上,阿里通义团队进行了更大规模的强化学习后训练,全面提升了正式版Qwen3-Max-Thinking性能。

       其中,在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美国际顶尖AI大模型。

       测试时扩展机制,推理性能提升且更经济

       在关键的模型推理能力提升中,千问新模型采用了一种全新的测试时扩展(Test-time Scaling)机制,推理性能提升的同时还更经济。

       业界普遍的推理时计算,只会简单增加并行推理路径,重复推导已知结论很常见,冗余推理效率低下;而千问采用的这一机制,可对此前推理的结果进行“经验提取”式的提炼,并据此进行多轮自我迭代,在相同的上下文中实现更高效的推理计算,因此获得更智能的推理结果。

       基于这一推理技术创新,千问推理性能和推理效率大为提升,比如在启用工具的“人类最后的测试”HLE中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,录得当前所有模型的最高分。

       大幅增强原生Agent能力,对话时自主调用工具

       面向即将到来的智能体Agent时代,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。

       这种自适应的工具调用能力可在QwenChat上完整体验,Qwen3-Max-Thinking模型会自主选用「搜索」、「个性化记忆」和「代码解释器」等三个核心的Agent工具功能,提供专业人士一样水平的回答,更合用户心意、更智能、更流畅;同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。

       该能力源自于通义团队专门设计的训练流程。具体而言,在完成初步的工具使用微调后,团队对模型进一步在大量多样化任务上进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

2???????
责任编辑:邓珊珊
您可以:
排行榜
  1. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  2. PTC 推出领先的产品开发 ALM 解决方案 Codebeamer 3.0
  3. 奥哲获CIC灼识认证:中国低代码市场第一品牌!
  4. 怀信科技WMS智能仓储管理系统,为制药及批次流程行业数字化升级按下 “加速键”
  5. DeepSeek发布新版R1 称能力接近国际顶尖模型
  6. 美国对华断供EDA?暗藏怎样的科技博弈?
  7. SAP发布2024年第四季度及全年财报
  8. 国产IEC61499工业控制软件AIOSYS重磅发布
  9. 达索系统3D UNIV+RSES亮相巴黎航展,AI助推转型
  10. U9 cloud重塑价值定位:数智制造成本管理专家
编辑推荐
• 研华与高美馆首度跨界合作 以边缘 AI 打造生成...
• 九科信息智能体bit-Agent:企业数字化的下一代...
• 聚力 同心 共跃2026 台达IA中国区渠道商大会成...
• 和利时成功入选“国家知识产权示范企业”创建...
• 微软推出下一代AI芯片Maia 200
• 阿里发布千问旗舰推理模型Qwen3-Max-Thinking
• 罗克韦尔自动化石安:以“提质”为牵引,中国...
• 首个低代码国家标准发布,2026年7月1日实施
• 腾讯云智能体开发平台升级:做深平台、做厚内...
• PTC 通过全新的ALM版本为软件驱动型产品开发交...
• 银河通用机器人成为总台2026春晚指定具身大模...
• 工信部拟制定标准规范数字人身份标识
文章推荐
• 物理AI加速渗透,机器人迈入“能思考、会干活...
• 基于IDEF0的单相异步电机并行设计过程建模
• 变局与重构:2025工业机器人产业发展热点观察
• 基于“整车DMU”工具的开发与应用
• 汽车零件设计可制造性智能检查研究及实践
• 备受追捧的MCP协议,凭什么成为AI Agent的“万...
• 仪表板总成定频振动耐久试验失败原因分析及仿...
• 一文详解:PID控制中的P、I、D都应怎么调?
• 机械产品智能演变设计的挑战与实现路径
• 基于PLM的数智化协同工艺开发平台建设研究及实...
• 浅谈机床的正向设计
• 多品种、小批量、大规模定制难题何解?在海康...

系列微信

数字化企业网
PLM之神
e-works制信科技
MES百科
工业自动化洞察
智能制造IM
AI智造圈
智能工厂前线
工业机器人洞察
智造人才圈
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2026  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2026  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看