1. e-works数字化企业网
  2. 新闻
  3. 资讯

信通院发布《高质量大模型基础设施研究报告(2024年)》

 
2025年01月16日 来源:中国信通院
关键字:高质量大模型基础设施研究报告(2024年)  

随着大模型技术的飞速发展,模型参数量急剧增长,模型能力持续增强,智能应用百花齐放。基础设施的可用性决定了大模型研发及服务的效率,大模型服务的可用性又决定了智能应用的服务质量。在此背景下,高质量大模型基础设施成为推动大模型应用落地的关键要素。为充分发挥大模型基础设施的赋能作用,更好支撑大模型发展,推动大模型应用落地,特编制此研究报告。

1月8日,在大模型工程化成果发布会上,中国信息通信研究院(简称“中国信通院”)人工智能研究所发布《高质量大模型基础设施研究报告(2024年)》,由中国信通院人工智能研究所平台与工程化部主任曹峰解读。

1

报告聚焦大模型基础设施的五大核心能力领域:计算、存储、网络、开发工具链和运维管理,系统梳理了大模型发展对基础设施提出的新需求,剖析了基础设施发展的关键技术,并提出体系化评价指标。同时,报告通过分析业界典型实践案例,为企业建设高质量大模型基础设施提供了参考。

报告核心观点

1. 计算资源分配粗放,高效异构算力融合调度成为新需求。一是异构资源统一纳管。算力资源利旧带来不同架构AI芯片纳管需求,大模型在科学、工业仿真等领域应用加深带来CPU和AI芯片纳管需求。华为、移动、电信等厂商积极推动异构智算管理平台研发,通过统一编程接口、智能调度等技术,实现对多类异构算力资源协同管理,提高算力利用率。二是智能化调度实现算力经济最大化。通过自动化监控、预测、自适应调度等技术优化资源利用,采用“AI+历史数据+实时数据”分析,实现算力需求精准预测,动态调度。

2. 海量数据处理低效,高性能大模型存储技术成为新关键。一是长记忆存储助力推理降本增效。通过高性能存储的大范围全局共享和持久化KV Cache能力,可实现高性价比推理加速,经企业实践验证,推理吞吐提速可超50%,推理成本显著下降。二是加速卡直通存储实现数据直达。通过加速卡和存储设备的数据一跳直达,可以消除CPU处理瓶颈,极大提升数据从存储到加速卡的数据传输效率,经企业实践验证,可实现TB/s级带宽和亿级IOPS,每个机架单元的存储性能可达50GB/s以上,大幅提升集群可用度。三是数据编织技术提高全流程效率。通过数据编织技术,实现全局数据可视可管,跨域统一视图。

3. 并行计算规模攀升,高通量大规模网络技术成为新方案。一是负载均衡技术助力解决“算等网”问题。经企业实践验证,逐流方案通过定制化的xCCL配合网络路径优化,在保证网络高可靠性的同时,网络链路利用率可达90%以上。逐包方案通过自适应路由等技术,可实现整网吞吐达到90%以上。二是参数面、存储面/样本面、业务面、带外管理面网络互联有效提升大模型训练效率。在训前、训中、训后,多网络面互联解决训练过程涉及的数据、模型、模型参数、检查点等的写入和导出问题。

4. 模型参数急剧增长,高效能大模型开发技术成为新解法。一是训练加速技术涌现支撑大模型高效构建。计算资源优化方法通过混合精度计算等方式,减少计算和存储需求,有效提升模型效率。计算优化策略通过算子融合、梯度积累技术等实现模型执行效率提升。二是推理技术提升模型推理效率。模型压缩通过低比特量化、稀疏化等方式实现模型训中、训后的低损与高效压缩。推理引擎技术进一步提升推理性能和兼容性。

5. 基础设施故障率高,高容错大模型运维技术成为新手段。一是训前健康检查保障作业零隐患运行。通过全栈隐患排查,降低作业启动失败频率,避免计算资源损失。二是训中故障可预测、可恢复。通过智能监控告警技术,进行端侧监控、拥塞分析等辅助故障定位,基于既有运维知识库,实现异常预测、RCA根因定位,有效提升集群稳定运行时长。

责任编辑:王力
您可以:
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• PTC:管理嵌入式软件的开发
• Allegro与英诺赛科联合推出全GaN参考设计, 赋...
• 施耐德电气新一代Galaxy PX UPS亮相CDCC
• 联想中国交出第二财季成绩单:个人AI业务持续...
• Fortinet 发布《2026年度CISO预测报告》
• PTC深化与Garrett Motion的合作关系,加速新产...
• Fortinet 发布安全人工智能数据中心解决方案
• 对话Gian Paolo:SOLIDWORKS 2026创新密码与AI...
• 智算时代,企业需要怎样的AI基础设施?
• 艾默生公布 2025 财年第四季度和全年业绩,并...
• 和利时智能仪表与XMagital®智能系统解决方案交...
• 2025年第十六届德国工业4.0考察正式启航
文章推荐
• 融资热 VS 倒闭潮:人形机器人产业发展“冷思...
• 优必选 VS Figure AI:一场“造假”风波,揭开...
• “超级生产团队”上线:懂生产,更懂怎么干
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 国际芯片大厂的战略新锚点:机器人与物理AI
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人

系列微信

数字化企业网
PLM之神
e-works制信科技
MES百科
工业自动化洞察
智能制造IM
AI智造圈
智能工厂前线
工业机器人洞察
智造人才圈
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看