1. e-works数字化企业网
  2. 新闻
  3. 资讯

积算科技上线赤兔推理引擎服务,创新解锁FP8大模型算力

 
2025年07月30日 来源:积算科技
关键字:积算科技  

近日,北京积算科技有限公司(以下简称"积算科技")宣布其算力服务平台上线赤兔推理引擎。积算科技PowerFul-AI应用开发平台与赤兔合作,打造高性价比的模型轻量化部署方案。用户通过远程算力平台预置的模型镜像与AI工具,仅需50%的GPU算力即可解锁大模型推理、企业知识库搭建、智能体开发,加速大模型在智能问答、报告生成、客服助手、智能体等典型行业场景的落地。

赤兔推理引擎由北京清程极智科技有限公司(以下简称"清程极智")开发,并联合清华大学团队发布开源版本。其核心价值在于,打破了FP8模型原生部署时GPU必须支持FP8精度的要求。通过底层算子优化(如GeMM、MoE的指令级重构)和编译技术创新,赤兔早在今年三月即首次实现在非FP8精度卡上原生运行FP8高精度模型,并确保推理过程几乎零精度损失。

积算科技联合清程极智,完成了赤兔推理引擎在积算科技PowerFul-AI应用开发平台上的验证测试。测试结果表明,赤兔推理引擎在积算科技PowerFul-AI平台上运行稳定、性能表现优异,满足双方兼容性认证的各项标准,能够快速完成DeepSeek、Qwen等大模型推理部署,并支持基于非FP8精度GPU卡实现FP8模型部署,相比于使用BF16精度部署,GPU算力需求减半。以部署DeepSeek-R1-671B为例,原需4台8卡机2560GB显存,现仅需2台8卡机1280GB显存即可满足要求。

积算科技PowerFul-AI平台携手赤兔推理引擎,将为AI大模型应用开发打造"成本减半、零性能损耗"的解决方案,提供构建企业知识库开发、智能体搭建等功能,助力企业用户灵活快速构建大模型通用应用及个性化端到端解决方案。

PowerFul-AI是积算科技的大模型应用落地解决方案,能够为AI大模型落地应用提供高效、易用、安全的端到端开发平台,帮助企业及科研机构高效开发部署AI大模型应用。目前,PowerFul-AI已经全面适配DeepSeek R1、DeepSeek V3等模型。用户只需选择镜像和模型文件,并配置模型所需的算力资源,即可快速完成模型部署,实现DeepSeek的"分钟级"上线。

积算科技诞生于全球生成式AI浪潮,专注于智能算力服务市场,致力于成为中国最具价值的智能算力服务商,聚焦互联网、运营商、高校、新能源汽车等领域的多家头部客户提供算力服务。公司拥有万卡级先进智能算力资源池,提供裸金属、智能算力系统、专属智能算力系统等算力服务产品,适用于大模型训练与推理、算法研究、大数据分析、自动驾驶、智能科学计算等多元场景。其运维和服务团队具备大规模智能算力系统设计建设、大模型开发应用及性能优化能力,可提供全栈大模型应用开发服务支持,并根据客户需求提供灵活服务模式。

责任编辑:王力
您可以:
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• PTC:管理嵌入式软件的开发
• Allegro与英诺赛科联合推出全GaN参考设计, 赋...
• 施耐德电气新一代Galaxy PX UPS亮相CDCC
• 联想中国交出第二财季成绩单:个人AI业务持续...
• Fortinet 发布《2026年度CISO预测报告》
• PTC深化与Garrett Motion的合作关系,加速新产...
• Fortinet 发布安全人工智能数据中心解决方案
• 对话Gian Paolo:SOLIDWORKS 2026创新密码与AI...
• 智算时代,企业需要怎样的AI基础设施?
• 艾默生公布 2025 财年第四季度和全年业绩,并...
• 和利时智能仪表与XMagital®智能系统解决方案交...
• 2025年第十六届德国工业4.0考察正式启航
文章推荐
• 融资热 VS 倒闭潮:人形机器人产业发展“冷思...
• 优必选 VS Figure AI:一场“造假”风波,揭开...
• “超级生产团队”上线:懂生产,更懂怎么干
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 国际芯片大厂的战略新锚点:机器人与物理AI
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人

系列微信

数字化企业网
PLM之神
e-works制信科技
MES百科
工业自动化洞察
智能制造IM
AI智造圈
智能工厂前线
工业机器人洞察
智造人才圈
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看