1. e-works数字化企业网
  2. 新闻
  3. 资讯

高通发布两款AI推理芯片,明年起商用

2025年10月29日 来源:高通
关键字:高通  

2025年10月28日,高通宣布推出面向数据中心的下一代AI推理优化解决方案:基于AI200与AI250芯片的加速卡及机架系统。依托公司在NPU技术领域的优势,这些解决方案提供机架级性能与卓越的内存容量,能够以出色的每美元每瓦特的高性能赋能高速生成式AI推理,为推动各行业可扩展、高效率、高灵活性的生成式AI部署树立重要里程碑。

AI200带来专为机架级AI推理打造的解决方案,旨在为大语言模型(LLM)与多模态模型(LMM)推理及其他AI工作负载提供低总体拥有成本与优化性能。每张加速卡支持768GB LPDDR内存,实现更高内存容量与更低成本,为AI推理提供卓越的扩展性与灵活性。

AI250解决方案将首发基于近存计算(Near-Memory Computing)的创新内存架构,实现超过10倍的有效内存带宽提升并显著降低功耗,为AI推理工作负载带来能效与性能的跨越性提升。该架构支持解耦式AI推理,实现硬件资源的高效利用,同时满足客户性能与成本需求。

两款机架解决方案均支持直接液冷散热,以提升散热效率,支持PCIe纵向扩展与以太网横向扩展,并具备机密计算,保障AI工作负载的安全性,整机架功耗为160千瓦。

高通技术公司高级副总裁兼技术规划、边缘解决方案和数据中心业务总经理马德嘉(Durga Malladi)表示:“凭借AI200与AI250,我们正在重新定义机架级AI推理的可能性。这些创新的AI基础设施解决方案能够让客户以业界先进的总体拥有成本部署生成式AI,同时满足现代数据中心对灵活性与安全性的要求。我们拥有丰富的软件栈与开放生态支持,能够支持开发者和企业更加轻松地基于我们的优化AI推理解决方案,集成、管理并扩展完成训练的AI模型。基于与主流AI框架的无缝兼容性和一键模型部署功能,AI200与AI250旨在支持无缝应用与快速创新。”

我们的超大规模级AI软件栈,覆盖从应用层到系统软件层的全链路,专为AI推理优化。该软件栈支持主流机器学习(ML)框架、推理引擎、生成式AI框架,以及解耦服务等LLM/LMM推理优化技术。开发者可通过高通技术公司的高效Transformer库(Efficient Transformers Library)与 Qualcomm® AI Inference Suite,实现模型无缝接入及Hugging Face模型的一键部署。我们的软件提供开箱即用的AI应用与智能体、完善工具、库、API接口及AI运营化服务。

AI200与AI250预计将分别于2026年和2027年实现商用。未来,高通技术公司将致力于按照年度迭代节奏,持续推进公司数据中心产品技术路线图,聚焦业界先进的AI推理性能、能效与总体拥有成本优势。

责任编辑:王力
您可以:
广告区域
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• 以数智之力构建智慧集成供应链,第十七届中国...
• 华为中国行2025·广西人工智能峰会成功举办
• SAP商业AI获乌镇峰会精品案例奖
• 施耐德电气“电力+冷却”双创新方案亮相进博会
• 八赴进博会 | ABB电气多款新品首发,智启零碳...
• 持续增长 广受认可 | Fortinet发布2025年第三...
• Brother于第八届进博会举办ESG交流活动
• 浪潮信息刘军:AI超节点的商业价值核心是Toke...
• 斯凯孚亮相第八届进博会 推出中国首款近零碳轴...
• 打造数字化供应链,专业实训班在厦门成功举办
• ABB低压传动 50 周年:以创新与节能增效推动可...
• 科德宝进博发布全新品牌中文标识,多线布局本...
文章推荐
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人
• 聊聊MES生产绩效的设计与应用
• 工装夹具全揭秘:让制造企业效率翻15倍,成本...
• 供应链降本的三层境界
• 高通收购Arduino,物联网与机器人开发生态要变...

系列微信

数字化企业网
PLM之神
制信科技
MES百科
工业自动化洞察
智能制造IM
智能装备观察
智能工厂前线
工业机器人洞察
工业创新
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看