1. e-works数字化企业网
  2. 新闻
  3. 资讯

SuperBench九月榜单发布:山海大模型引领AI智能新纪元

 
2024年09月30日 来源:天极网
关键字:SuperBench  山海大模型  

9月26日,国内人工智能权威机构清华大学基础模型研究中心发布SuperBench九月综合榜单。本次评测选取海内外24个具有代表性的大模型,结果显示,山海大模型对齐、智能体、安全等多项能力全球领跑。

持续升级,多项能力全球领跑

作为国内权威通用大模型综合性测评基准,SuperBench由清华大学人工智能研究院基础模型研究中心联合中国人民大学、中关村实验室共同发起,旨在为大模型领域提供一套客观、科学的评测标准,促进大模型技术、应用和生态健康发展。

此次SuperBench评测数据集包含语义、对齐、代码、智能体、安全、数理逻辑和指令遵循,共涵盖七大类,32个子类。评测数据显示:

人类对齐能力评测中,山海大模型3.0得分8.21分,排名全球第五、国内第二。其中,山海大模型在中文语言方面的表现极为出色,以8.41分的成绩与o1-preview并列全球第二。在中文语言细分项中,山海大模型在基本任务、综合问答、文本写作3项分类评测中均跻身Top3,并在文本写作评测中荣获第一。

https://img2.danews.cc/upload/images/20240929/3c11dc2e89ab524b4e3e77d65f4e2ff7.png

https://img2.danews.cc/upload/images/20240929/160cf1404c239222c14757ad33b547ab.png

https://img2.danews.cc/upload/images/20240929/4966cbceab51d57979cc24dbc0a53a3b.png

智能体能力评测中,山海大模型3.0得分3.44分,排名全球第七、国内第五。其中,山海大模型在网络购物方面的表现超过70分,位列全球第二,对比国外模型领先优势明显。

https://img2.danews.cc/upload/images/20240929/bb1646d931ee1b81bcb29540f9bfaeb8.png

https://img2.danews.cc/upload/images/20240929/28b939c9f53ea7749e45dfdbd9a318d9.png

安全和价值观能力评测中,山海大模型3.0得分89.4分,位居全球第二。其中,山海大模型在伦理道德、攻击冒犯、身体健康、隐私财产四个细分评测项中均位列三甲,并在身体健康和隐私财产评测中获得第一。

https://img2.danews.cc/upload/images/20240929/b280b9ab869e21a37a3f41d39b22a8ea.png

https://img2.danews.cc/upload/images/20240929/9070745ba61cfc30498565009b5c925a.png

自2023年5月问世以来,山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测等多个权威评测中屡创佳绩,充分展现出业界一流的通用能力和领先于世界的行业大模型能力。

此次评测,是山海大模型综合能力的又一次集中展现,也标志着其技术迭代和创新发展达到了一个新的高度。

加速落地,拥抱更多应用场景

大模型必须结合实际场景才能真正创造价值。作为大模型产业化落地的先行者,云知声也在积极推动山海大模型与具体行业场景的深度结合,将理论中的技术创新转化为新质生产力,为各行各业带来前所未有的效率提升和价值创造。

目前,山海大模型已在智慧医疗、智慧座舱、智慧交通、智慧营销、智慧政务、智慧司法等场景实现落地应用。

在智慧医疗领域,云知声基于山海大模型,打造门诊病历生成系统、手术病历撰写助手、商保智能理赔系统等医疗产品,专注医疗服务提质增效,为患者带来更优质均衡的医疗体验。例如,针对门诊场景中的病历撰写需求,门诊病历生成系统可实现诊室复杂环境下的降噪、医患角色区分、信息摘要及病历自动生成等功能,有效提升病历书写效率,切实为医务人员减负。目前,门诊病历生成系统已在北京友谊医院上线应用,得到院方的高度认可和一致好评。

在智慧座舱领域,云知声依托山海大模型重构语音识别、语义理解、语音合成的全链路语音方案,基于大模型的理解与生成能力,赋能用车、出游、主动关怀、健康、通用聊天等多个细分场景,让座舱体验从简单的语音交互迈向全面智能的个性化交互。

在智慧交通领域,云知声以山海大模型为核心,数据和创新为两大引擎,云知声构建起覆盖轨道交通、公交交通、航空交通、交通枢纽、道路交通等多个细分场景的智慧大交通全景图,全方位、多维度赋能交通产业,驱动城市交通向智能化、高效化方向迈进。目前,包括厦门高崎机场数智客服、厦门地铁智能客服系统、南宁火车东站智慧客服屏、青岛全息屏智能交互服务终端等在内的多款交通创新应用已投入使用,共同引领未来交通出行新体验。

在智慧营销领域,云知声基于山海大模型,融合积累多年的智能语音技术,打造蓝藻AI内容创作平台,为用户提供AI声音克隆、AI文字配音、AI文案创作、AI智播等服务,助力内容生产更快,更好,更具个性化,打造内容营销新质生产力。

随着技术提升和应用场景的不断拓展,未来大模型市场竞争将持续加剧,进一步推动技术创新和产业升级。接下来,云知声将继续保持大模型能力稳步提升,以山海为抓手,在产业侧实现加速落地,引领千行百业向更智能、更高效、更可持续的方向发展。

责任编辑:王力
您可以:
排行榜
  1. 联想工程师登上中国冰雪之夜舞台,讲述冬奥“0故障”背后的故事
  2. 让IT运维实现轻交付 联想ServiceForce突破行业难题
  3. 奥哲孟凡俊:融合AI的低代码成为企业数智化核心引擎
  4. 以生态融合注入创新力,OpenUSD奠定企业数字化转型新里程碑
  5. 《中国制造业走向2025》白皮书
  6. 聚焦数字化变革,联想用“新IT”赋能企业数字化转型升级
  7. e-works网站VIP社区E币规则
  8. 西部数据进一步扩展旗下智慧视频解决方案
  9. 什么是数字化?有哪些成功案例?
  10. 角逐智能制造赛道,联想如何以新IT引擎突围
编辑推荐
• PTC:管理嵌入式软件的开发
• Allegro与英诺赛科联合推出全GaN参考设计, 赋...
• 施耐德电气新一代Galaxy PX UPS亮相CDCC
• 联想中国交出第二财季成绩单:个人AI业务持续...
• Fortinet 发布《2026年度CISO预测报告》
• PTC深化与Garrett Motion的合作关系,加速新产...
• Fortinet 发布安全人工智能数据中心解决方案
• 对话Gian Paolo:SOLIDWORKS 2026创新密码与AI...
• 智算时代,企业需要怎样的AI基础设施?
• 艾默生公布 2025 财年第四季度和全年业绩,并...
• 和利时智能仪表与XMagital®智能系统解决方案交...
• 2025年第十六届德国工业4.0考察正式启航
文章推荐
• 融资热 VS 倒闭潮:人形机器人产业发展“冷思...
• 优必选 VS Figure AI:一场“造假”风波,揭开...
• “超级生产团队”上线:懂生产,更懂怎么干
• 别把生命当“公测”:造车新生代狂飙下的安全...
• PTC:高科技企业数字化转型的4个案例
• 国际芯片大厂的战略新锚点:机器人与物理AI
• 钣金加工企业数字化管理系统的研究与应用
• 疲劳仿真:产品寿命的“预言家”
• 会叠衣服的中美机器人,谁离具身智能更近?
• 什么是线束设计?
• 大型PLC市场萎缩,但头部企业仍在死磕国产化?
• 众为兴重磅发布智能协作机器人

系列微信

数字化企业网
PLM之神
e-works制信科技
MES百科
工业自动化洞察
智能制造IM
AI智造圈
智能工厂前线
工业机器人洞察
智造人才圈
工业软件应用
智能制造网博会
ERP之家
供应链指南针
© 2002-2025  武汉制信科技有限公司  版权所有  ICP经营许可证:鄂B2-20030029-1(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号 法律声明及隐私权政策     投诉举报电话:027-87592219

关于我们    |    联系我们    |    隐私条款

ICP经营许可证:鄂B2-20080078
(于2003年首获许可证:鄂B2-20030029)
鄂公网安备:420100003343号
© 2002-2025  武汉制信科技有限公司  版权所有
投诉举报电话:027-87592219

扫码查看