1. e-works数字化企业网
  2. 新闻
  3. IT要闻 > 硬件动态

Arm 计算平台加持,全新 Llama 3.2 LLM实现AI 推理的全面加速和扩展

2024年09月29日 来源:Arm
关键字:Arm  
Arm与Meta 展开紧密合作,在 Arm CPU 上启用新的Llama 3.2 LLM,集成开源创新与 Arm 计算平台的优势,显著推进了解决AI挑战的进程。
       人工智能 (AI) 的迅猛发展意味着大语言模型 (LLM) 的新版本不断推陈出新。要充分发挥 AI 的潜力并抓住其带来的机遇,需要实现 LLM 从云端到边缘侧的广泛部署,而这也伴随着对计算和能源需求的大幅增长。整个生态系统正携手寻找应对这一挑战的解决方案,不断推出新的更加高效的开源 LLM,以便大规模实现各种 AI 推理工作负载,加快为用户带来全新、快速的 AI 体验。

       为此,Arm与Meta 展开紧密合作,在 Arm CPU 上启用新的Llama 3.2 LLM,集成开源创新与 Arm 计算平台的优势,显著推进了解决AI挑战的进程。得益于Arm 的持续投资及与新型LLM 的合作, Arm CPU运行 AI 的优势在生态系统中脱颖而出,使Arm成为 AI 推理开发者的首选平台。

加速云到边缘侧的 AI 性能

       小型 LLM(如 Llama 3.2 1B 和 3B)能够支持基于文本的基础生成式 AI 工作负载,对于大规模 AI 推理的实现至关重要。通过 Arm CPU 优化内核在 Arm 技术驱动的移动设备上运行新的 Llama 3.2 3B LLM,可让提示词处理速度提高五倍,词元 (token) 生成速度提高三倍,在生成阶段实现每秒 19.92 个词元。这将直接减少了在设备上处理 AI 工作负载的延迟,大大提升了用户整体体验。此外,当边缘侧能处理的 AI 工作负载越多,往返云端传输数据所节省的电量就越多,进而节省了能源和成本。
 
       除了在边缘侧运行小型模型,Arm CPU同样支持在云端运行更大的模型(如 Llama 3.2 11B 和 90B)。11B 和 90B 的模型非常适合云端基于 CPU 的推理工作负载,可生成文本和图像,其中,在 Arm Neoverse V2 上的测试结果展现出了更大的性能提升。在基于 Arm 架构的 AWS Graviton4 上运行 11B 的图像和文本模型,可以在生成阶段实现每秒 29.3 个词元的表现,远远超出了人类大约每秒阅读五个词元的速度。
 
AI 将通过开源创新和生态系统协作迅速扩展

       能公开获取新的 LLMs(如Llama 3.2)至关重要。开源创新正以迅猛速度发展,在之前的版本中,开源社区在不到 24 小时的时间内便能在 Arm 上部署并运行新的 LLM。
 
       Arm将通过 Arm Kleidi 进一步支持软件社区,让整个 AI 技术栈能够充分发挥这一优化的 CPU 性能。Kleidi 可在任何 AI 框架上解锁 Arm Cortex 和 Neoverse CPU 的 AI 功能和性能,无需应用程序开发者进行额外的集成工作。
 
       通过最近的 Kleidi 与 PyTorch 集成以及正在推进的与 ExecuTorch 集成,Arm正在为基于 Arm CPU的开发者提供从云端到边缘侧的无缝 AI 性能。得益于Kleidi 与 PyTorch 的集成,在基于 Arm 架构的 AWS Graviton 处理器上运行 Llama 3 LLM 的词元首次响应时间加快了 2.5 倍。

       同时,在端侧,与参考实现相比,在 KleidiAI 库的加持下,使用 llama.cpp库在新的 Arm Cortex-X925 CPU 上运行 Llama 3 的词元首次响应时间加快了 190%。
 
构建 AI 的未来

       Arm 与 Meta 的合作成为了行业合作的新标杆,汇聚了 Arm 计算平台的灵活性、普及性和 AI 功能,以及 Meta 等行业巨头的技术专长,共同解锁AI 广泛应用的新机遇。无论是利用端侧 LLM 满足用户的个性化需求,如根据用户所处的位置、日程和偏好来执行任务,还是通过企业级应用来优化工作效率,让用户能够更专注于战略性任务,Arm 技术的集成都为未来奠定了基础。未来,设备不再只是命令和控制工具,更是能在提升用户整体体验方面扮演积极的作用。
 
       在 Arm CPU 上运行 Meta 最新 Llama 3.2 版本,其AI 性能实现了显著提升。这类开放式合作是实现无处不在的 AI 创新、促进 AI 可持续发展的最佳途径。通过新的 LLM、开源社区和 Arm 的计算平台,Arm 正在构建 AI 的未来, 到 2025 年,将有 1000 多亿台基于 Arm 架构的设备支持 AI。

关于 Arm

       Arm 作为业界性能最强、能效最高的计算平台,以无可比拟的规模,覆盖全球 100% 的联网人群。Arm 提供先进的解决方案以满足对计算永无止尽的需求,进而赋能全球领先的科技公司释放前所未有的人工智能体验和性能。Arm 携手全球最广泛的计算生态系统和 2,000 万软件开发者,共同在 Arm 平台上构建人工智能的未来。
责任编辑:胡竞丹
您可以:
广告区域
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• 以数智之力构建智慧集成供应链,第十七届中国...
• 华为中国行2025·广西人工智能峰会成功举办
• SAP商业AI获乌镇峰会精品案例奖
• 施耐德电气“电力+冷却”双创新方案亮相进博会
• 八赴进博会 | ABB电气多款新品首发,智启零碳...
• 持续增长 广受认可 | Fortinet发布2025年第三...
• Brother于第八届进博会举办ESG交流活动
• 浪潮信息刘军:AI超节点的商业价值核心是Toke...
• 斯凯孚亮相第八届进博会 推出中国首款近零碳轴...
• 打造数字化供应链,专业实训班在厦门成功举办
• ABB低压传动 50 周年:以创新与节能增效推动可...
• 科德宝进博发布全新品牌中文标识,多线布局本...
文章推荐
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人
• 聊聊MES生产绩效的设计与应用
• 工装夹具全揭秘:让制造企业效率翻15倍,成本...
• 供应链降本的三层境界
• 高通收购Arduino,物联网与机器人开发生态要变...

系列微信

数字化企业网
PLM之神
制信科技
MES百科
工业自动化洞察
智能制造IM
智能装备观察
智能工厂前线
工业机器人洞察
工业创新
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看