1. e-works数字化企业网
  2. 新闻
  3. 资讯

中国联通开源国内首个安全增强满血版DeepSeek-R1并上线元景MaaS平台

2025年05月30日
关键字:中国联通  
        DeepSeek-R1模型凭借其卓越的推理性能与开源战略,正在重塑全球人工智能的未来格局。然而,业界大量评测工作显示开源的DeepSeek-R1满血版模型存在安全短板,这制约了DeepSeek-R1实际落地应用。此外,DeepSeek-R1满血版模型参数量大,涉及底层技术多,对其微调资源消耗大、技术门槛高,因此中国联通数据科学与人工智能研究院秉持央企担当持续攻坚克难,于近日完成了DeepSeek-R1满血版安全增强模型研发,实现保持模型原始推理能力的同时,安全能力显著提升。

        目前,DeepSeek-R1满血版安全增强模型作为多模共生的元景模型家族的一员,已上线元景MaaS平台并对外开放试用,提供普惠速成的大模型开发应用工具。
 
https://www.e-works.net.cn/News/articleimage/20255/133930659051680736_new.png
安全增强版模型DeepSeek-R1-Safe上线元景MaaS平台

        安全增强前后实际效果对比

        下图示例展示了DeepSeek-R1安全增强前后的能力差异。可以看到,在涉及社会主流价值观等方面的问题,DeepSeek-R1安全增强版都能给出更安全、更符合社会主义核心价值观的回答。
 
https://www.e-works.net.cn/News/articleimage/20255/133930659712309964_new.png

        保持原始推理能力,显著提升安全能力

        中国联通采用自主研发的中文安全评测基准CHiSafetyBench对原版DeepSeek-R1及其安全增强版本进行安全能力评测。该基准评测任务分为两大类型:风险内容识别的选择题与风险问题拒答的问答题。同时,为评估安全改造后的模型的推理能力,采用MATH-500、GPQA、LiveCodeBench三个推理权威基准对模型进行测试,以观察安全增强方法对DeepSeek-R1的推理能力的影响。
 
https://www.e-works.net.cn/News/articleimage/20255/133930660096531173_new.png
安全基准评测结果

https://www.e-works.net.cn/News/articleimage/20255/133930660375751710_new.png
推理基准评测结果

        从评测结果可见,在对DeepSeek-R1进行安全微调增强后,模型在风险内容识别准确率上提升近20%,对风险问题的拒答率提升超13%,责任回复率提升超11%,有害回复数量降至0,实现回复完全无害。同时模型在数学、逻辑、代码生成等方面的推理能力未受明显影响。

        安全增强方法

        针对DeepSeek-R1的安全性问题,中国联通数据科学与人工智能研究院使用自主构建的专用安全思维链数据对模型微调,在国产化平台上对DeepSeek-R1满血版进行微调训练。其中,安全增强数据由两部分组成:聚焦歧视、侵权等关键领域的安全数据以及通用思维链推理数据。安全数据显著拓展模型安全的广度与深度,更全面地覆盖潜在的安全风险场景。思维链推理数据的加入可确保提升模型安全性能的同时,保持其原始推理能力,从而实现安全与推理能力的平衡优化。

        基于DeepSeek-R1模型做再训练是实现DeepSeek-R1安全改造的关键能力,中国联通数据科学与人工智能研究院基于此能力已形成元景大模型MaaS平台上的“改模型”工具,打造了端到端模型服务安全工具链,MaaS平台及其关键组件RAG、智能体均获得工信部中国软件测评中心大模型安全性测评4+级(最高级)认证。

        未来,中国联通将持续推进DeepSeek-R1模型的安全研究,不断优化模型安全增强方法和评测基准,并向业界持续公开最新研究成果。中国联通愿与行业伙伴携手,共同提升大模型的安全可信能力,加速大模型普惠化进程,为人工智能赋能千行百业保驾护航。
责任编辑:陈苗
您可以:
广告区域
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• 以数智之力构建智慧集成供应链,第十七届中国...
• SAP商业AI获乌镇峰会精品案例奖
• 施耐德电气“电力+冷却”双创新方案亮相进博会
• 八赴进博会 | ABB电气多款新品首发,智启零碳...
• 持续增长 广受认可 | Fortinet发布2025年第三...
• Brother于第八届进博会举办ESG交流活动
• 浪潮信息刘军:AI超节点的商业价值核心是Toke...
• 斯凯孚亮相第八届进博会 推出中国首款近零碳轴...
• 打造数字化供应链,专业实训班在厦门成功举办
• ABB低压传动 50 周年:以创新与节能增效推动可...
• 科德宝进博发布全新品牌中文标识,多线布局本...
• 戴尔科技集团亮相第八届中国国际进口博览会
文章推荐
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人
• 聊聊MES生产绩效的设计与应用
• 工装夹具全揭秘:让制造企业效率翻15倍,成本...
• 供应链降本的三层境界
• 高通收购Arduino,物联网与机器人开发生态要变...

系列微信

数字化企业网
PLM之神
制信科技
MES百科
工业自动化洞察
智能制造IM
智能装备观察
智能工厂前线
工业机器人洞察
工业创新
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看