在人工智能热潮的今天,越来越多的智能系统和智能产品不断涌现,从聊天机器人,家庭服务机器人到智能音箱,AI手机,扫地机器人,无人驾驶汽车,等等等等。面对不断智能化的世界,如何衡量这些智能产品的智能水平。如何区分哪些产品是AI产品,哪些是伪智能产品。AI的智商问题由此提出。

    科学院虚拟经济与数据科学研究中心和未来智能实验室研究团队在研究中发现,人类在讨论AI的时候,关键目的并不相同,从而导致在评估AI智商时的评价体系也会出现差异,第一个主要目的是评判当前的AI系统,机器人是否在智力上超越人类 ,第二个主要目的是了解当一个智能产品在服务人类时,究竟有多么聪明,和要付出多少价格。根据这一关键区别,研究人员提出AI系统应该存在三种智商,分别是通用智商、服务智商和价值智商。相关英文论文与2017年12月19日发表在美国康奈尔大学的预印本网站arxiv.org上。

    据研究团队成员,互联网进化论作者,计算机博士刘锋介绍:从1950年图灵测试提出以来,科学家已经为人工智能发展的评价体系做了很多工作。1950年,图灵提出了著名的图灵实验,采用提问和人类裁判的方法,判断一台计算机是否具有同人相当的智力。作为最被广泛应用的人工智能测试方法,但图灵测试并不检验Ai的智能发展水平,只是判断智能系统能否与人类智能相同,而且受人为因素干扰太多,严重依赖于裁判者和被测试者的主观判断,因此往往有人在没有得到严格验证的情况下宣称其程序通过图灵测试。

    对智能系统包括人类和人工智能系统的智力能力进行评测面临两个重要挑战:第一,人工智能系统目前没有形成统一的模型;第二,人工智能系统与以人类为代表的生命体之间的比较目前没有统一的模型。

    针对这一问题,2014年 ,未来智能实验室研究团队,科学院虚拟经济与数据科学研究中心刘锋博士,石勇,刘颖教授参考冯·诺伊曼结构、戴维·韦克斯勒人类智力模型、知识管理领域DIKW模型体系等。提出“标准智能模型”,统一描述人工智能系统和人类的特征和属性,将任何一个智能体视为同时具有“知识的获取,掌握,创新和反馈”的系统。

    基于标准智能模型,为了解决AI究竟能否超越人类的智慧,研究团队建立AI智商测试量表,分别与2014年和2016年对包括谷歌、Siri、百度、Bing等50多个人工智能系统和6岁,12岁和18岁人群进行AI智商测试。从测试结果看,谷歌、百度等人工智能系统的性能比两年前已有大幅提高,但仍与6岁儿童有一定差距。