1. e-works数字化企业网
  2. 新闻
  3. 资讯

对话华为樊杰:AI落地浪潮下的存力革新

2025年11月11日 来源:通信世界网作者:刘启诚  
关键字:AI  

随着大模型的规模落地,AI发展的主战场正从“模型训练”转向“行业推理”,解决推理效率瓶颈成为释放AI产业价值的关键。近日,在由中国信息通信研究院组织的“存力中国行-北京站”活动中,华为数据存储产品线副总裁樊杰在接受工信智媒体记者专访时指出,AI大模型正从通用大模型向细分行业小模型渗透,数据的归集、清洗、精调是关键,华为通过端到端的存储技术方案,解决行业模型落地中的存力、运力、算力瓶颈,持续赋能千行百业。

image.png

华为数据存储产品线副总裁樊杰(右)接受

工信智媒体总编刘启诚(左)专访

行业模型落地仍处于“爬坡阶段”

当前,我国存力建设成效显著,截至2024年底存力总规模已达1580EB,先进存储占比28%,今年6月底更是增至1680EB,国产存储在技术研发与产业应用上已具备领先实力。但行业模型的落地仍处于“爬坡阶段”,高质量数据集建设、数据可信流通、跨行业应用适配等诸多领域仍需探索。

樊杰表示,与覆盖广泛场景、参数量动辄数十亿甚至上百亿的通用大模型不同,行业模型聚焦细分领域深耕细作,比如人脸识别模型的参数量仅需3B~10B,却能在专属场景中实现高精度应用。这种“小而专”的特性,决定了行业模型必须依赖高质量的行业数据进行训练与精调,而数据的存取、管理与高效利用,成为行业模型落地见效的核心关键。

据悉,模型发展中数据处理有三个关键阶段。

汇集阶段:打破孤岛,构建AI数据湖

这一阶段的核心是将分散在多园区、多院区、多数据中心的异构数据进行数字化、标准化汇聚。这些数据格式各异、存储分散,形成了“数据孤岛”。要让行业模型获得充足的训练素材,就必须打破这些壁垒,将各类数据归集形成统一的“AI数据湖”,为后续的模型训练奠定基础。

训练阶段:突破瓶颈,提升算力利用率

数据汇集后,需经过清洗、加载、训练、存档的反复循环过程。传统存储方式难以应对这一阶段的高频数据读写需求,导致GPU或NPU的利用率仅能达到30%左右,70%的时间都在等待数据加载与存档,形成了“算力闲置”的浪费。此时,单纯堆砌算力已无济于事,必须通过高性能的存储与高速运力网络,解决数据“供给不畅”的问题。

推理阶段:优化体验,实现高效实用

训练成熟的模型进入实际应用后,推理阶段的性能直接决定用户体验与商业价值。如今的推理场景已从简单的短句问答,转向长文档分析、复杂业务决策等需求,比如让AI通读上万字的博士论文或上百页的医疗案卷。这不仅要求模型具备超长文本处理能力,还需解决响应延迟、并发处理、重复计算等问题,让AI真正成为行业从业者的得力助手。

华为端到端解决方案:

破解全流程痛点

针对行业模型落地的核心需求,华为推出了覆盖数据全生命周期的组合解决方案,从语料汇集到推理应用,全方位提升效率、降低成本。

比如在语料归集环节,华为可提供AI数据服务,帮助行业客户高效整合异构数据,打破数据孤岛,实现数据的标准化与统一管理,为模型训练提供高质量、高可用的“原料”。

在训练阶段,华为推出OceanStor A800、OceanStor A600等高性能AI存储产品,凭借极致的性能表现破解训练瓶颈。其中,OceanStor A800在MLPerf Storage V1.0基准测试中,以整系统性能、单机性能和单位空间性能三项指标全球第一的成绩,成为全球AI数据存储领域的标杆产品。通过这一系列高性能存储方案,模型训练的算力利用率从30%提升至60%,大幅缩短了训练周期,减少了算力空转浪费。

在推理阶段,华为的“双引擎”——UCM推理记忆数据管理技术与AI SSD,构建了软硬件协同的优化方案,系统性解决了“内存墙”与“容量墙”难题。

据介绍,UCM并非简单的缓存,而是智能的数据调度与管理系统,通过三大核心特性实现推理加速:一是连接生态,提供插件式灵活对接多样引擎与多元算力;二是记忆管理,通过KV Cache动态多级管理,系统化创新加速算法;三是存储协同,高性能数据直通与PB级容量分级,实现KV记忆数据卸载。

作为硬件支撑,华为AI SSD并非通用存储,而是为AI工作负载深度优化的专用硬件。其中OceanDisk SP 560高性能盘的随机写性能最高可达1500K IOPS,随机写时延低于7μs,为推理数据提供极速读写通道。它与UCM协同构建HBM-DRAM-AI SSD三级缓存架构,将非活跃的KVCache从昂贵的显存智能卸载至大容量AI SSD中,使推理序列长度提升2.5倍,让模型具备处理超长文本的记忆能力。

对于不同规模的推理场景,华为方案也具备灵活适配性,比如边缘场景如县级医院的小型推理需求,仅需在服务器中挂载几块高性能AI SSD即可满足;大型推理场景则可采用AI存储整机,保障大规模并发处理能力。

开源与生态:

推动AI推理技术普惠落地

为降低行业应用门槛,华为已将UCM核心技术在魔擎社区正式开源并在GitHub上开放下载。这一举措不仅让广大开发者和企业能以更低成本、更便捷的方式获得领先的AI推理加速能力,更推动了推理加速领域的技术标准化与接口统一,避免生态碎片化,为全产业协同创新搭建了开放平台。

在开源基础上,华为将进一步完善数据存储、数据管理、AI工具链以及资源管理的全链条能力,以平台化赋能千行百业。同时,华为也积极参与“先进存力AI推理工作组”,与产业链伙伴共同推进技术研究、方案落地、标准制定与生态构建,凝聚产业合力。

AI时代的到来,让数据从“成本”转变为“核心资产”,高质量数据的留存率大幅提升,为存储产业带来了蓬勃发展的机遇。未来,随着技术的持续迭代与生态的不断完善,存力将成为支撑金融、电信、医疗、能源等行业转型升级的关键力量。华为将持续以技术创新与开放合作,降低AI推理应用门槛,让高效、经济的AI推理能力走进更多细分场景,助力千行百业实现智能化转型,释放AI产业的真正价值。

责任编辑:王力
您可以:
广告区域
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• 西门子与 NEC 携手加速智能工厂创新
• 和利时与互时科技达成战略合作,共拓流程工业...
• 对话华为樊杰:AI落地浪潮下的存力革新
• 1.59亿大订单再破纪录!优必选Walker人形机器...
• 西门子携手达诺巴特及autonox推出SINUMERIK机...
• 十一连冠!联想再获中国HPC TOP100年度数量份...
• Omdia观察:AI推动上行容量需求 5G低频段频谱...
• 以数智之力构建智慧集成供应链,第十七届中国...
• 进博会现场直击:欧姆龙健康以'数智心生'战略
• ABB在2025进博会首发AI+电力系统失效预测解决...
• 华为中国行2025·广西人工智能峰会成功举办
• SAP商业AI获乌镇峰会精品案例奖
文章推荐
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人
• 聊聊MES生产绩效的设计与应用
• 工装夹具全揭秘:让制造企业效率翻15倍,成本...
• 供应链降本的三层境界
• 高通收购Arduino,物联网与机器人开发生态要变...

系列微信

数字化企业网
PLM之神
制信科技
MES百科
工业自动化洞察
智能制造IM
智能装备观察
智能工厂前线
工业机器人洞察
工业创新
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看