科大讯飞AI研究院联席院长李世鹏:人工智能发展趋势及应用落地

2018年10月18日,由亿欧公司主办,思贝克联合主办的“引擎·引领”2018大湾区国际科创峰会(Bay Areas Tech Innovation Summit,简称BATi)在深圳万科前海国际会议中心举办。

本次峰会以“引擎·引领” 为主题,现场聚集超过2000位人工智能、生物医药等行业人士,共同探讨生物医药、智能制造、智能产品、智慧城市、智慧安防、智慧交通等一众热点话题,分析科技创新未来趋势,盘点技术革命下的发展契机。峰会采取“1+2”的组织架构,除了10月18日的2018大湾区国际科创峰会外,19日将举办包括智能制造·智能产品论坛和智慧城市论坛在内的2场垂直峰会。

在2018大湾区国际科创峰会上,科大讯飞AI研究院联席院长李世鹏发表了《人工智能发展趋势及应用落地》的演讲。他提到:

1、人工智能之所以火起来,从根本上说是技术发展到一定程度的自然现象。它取决于三个因素:一是大数据、互联网、社交网络互联网、物联网的爆炸性增长;二是计算机的处理能力;三是关键的算法。

2、人工智能也是渐进的,从没有计算的智能到感知智能,未来一定是认知智能。

3、从底层到用户交互,再到数据、知识、服务层,都要有一些标准把数据统一在一起,从而训练出来的神经网络就会有更多的了解,做出更智能的事情。

4、数据变成人工智能最大的瓶颈,这就是为什么各个AI公司最大的消耗是在整合数据上,催生了很多以前装配线的厂,他们现在变成数据标注公司,这是一个很大的产业。

5、最大的成功、最大的潜力是AI的各种应用场景,反过来也是特别不容易的事情,数据在这里起了关键的作用。一个行业如果没有一定的数据水平,效果可能并不好,这个市场虽然很大,也需要一些新的资源、新的能力来做。

李世鹏,科大讯飞,李世鹏,AI

【李世鹏现场演讲实录】

大家下午好!很高兴有这样的机会跟大家分享科大讯飞在AI方面的思路。

AI现在特别热,李世石和Alpha Go的对决一下子证明AI比人还聪明,那怎么办呢?各个国家,包括美国、中国、欧洲、日本等很多国家已经把人工智能当成战略,我们国家更是如此。我们制定了特别雄伟的三步计划,到2030年在很多领域要在世界上领先,可以看到国家在这方面的决心很大。

到底AI的现状是什么样?有多少是真正能帮我们做些事情的?下面给大家稍微解析一下。第一,什么是AI?AI的官方定义也不统一,每个人都有自己的解读,我另外一只脚在学术,我比较喜欢从事情的本质看。人工智能跟以前也没什么区别,只不过是新的计算方式,以前的计算是人来编程、机器来做,人工智能是机器可以通过大数据的学习自己做一些事情,这是最大不一样的地方。

为什么人工智能突然变热了?除了李世石对战Alpha Go一下子引爆的大家对人工智能的热度之外,从根本上说是技术发展到一定程度的自然现象。它取决于三个因素:一是大数据、互联网、社交网络互联网、物联网的爆炸性增长;二是计算机的处理能力,最近几年随着CPU、GPU和专业的计算能力,云计算带来很多传统我们想算又算不出来的能力;三是关键的算法,2007年之后一直在产业、学术界引爆很多新的思路,包括最开始在语音识别上的应用。

说起AI,一直有两种方法:一种是最近几年火的,根据大数据在深度神经网络里做的AI。第二种是对人脑的研究。为什么有这两种研究?大数据、深度学习最近以来确实能解决我们的问题。现在人工智能的框架很大程度上还不足以满足很多要求,比如说人脑对少量的数据能归纳出做一些总结,人脑大概需要20瓦的能量可以保证它的正常运转,今天需要在现在的人工智能深度学习网络里有大量的数据,才能达到人脑的相似水平。

人工智能也是渐进的,从没有计算的智能到感知智能,未来一定是认知智能。除了对人脸识别、声音识别之后,我们转成文字以后,文字的内涵是什么?我们需要在认知层面上进一步做很多工作,很不幸的是认知智能现在还是初期。

我个人把这三步引申得更深一点,每一层次需要的数据是原来的很多倍,分别是通知、感知、认知、预知、绝知。前面三个层次大家很容易体会到,认知这个层次的时候,单一信号源的数据已经不足以实现智能,而是需要多个信号源,比如说对文字内容的认知,不单需要对文字本身的认识,需要对很多传统的知识一些理解,这个特别关键。

再往上是预知,人工智能在你还没有说话、发出指令之前,它就知道你要做什么事情,给你提前准备好很多东西,最难的是通用人工智能,机器可以帮你做决定。虽然今天机器可以在炒股方面帮你做决定,为什么还不能达到完全让机器帮我们做所有的决定?因为机器的了解有限,我们对机器行为的了解也有限,我们不知道它会做出什么样的结果。

刚才讲了所有的人工智能,现在的框架大概都是在大数据基础上,怎么样能有效的发挥这些数据的力量?单靠一家公司、一个人是远远做不到的,所以就需要能把各种各样的数据融合在一起,这就涉及到人工智能方面数据的融合问题、数据的互相兼容问题,这里分了几个层次,从底层到用户交互,再到数据、知识、服务层都要有一些标准把数据统一在一起,从而训练出来的神经网络就会有更多的了解,做出更智能的事情。

这里对数据的特点有六个总结:一致性、连续性、基于上下文、兼容性、完整性、控制。控制特别重要,谁在数据里有控制权?这是很有争议的话题。AI的趋势是这样,这里面有好消息,也有坏消息。今天的AI神经网络框架我们已经可以做很多事情,现在很成功的语音识别、语音合成、自然语言的翻译,从一种文字到另外一种文字的翻译,这都是做得很成功的。数据变成人工智能最大的瓶颈,这就是为什么各个AI公司最大的消耗是在整合数据上,催生了很多以前装配线的厂,他们现在变成数据标注公司,这是一个很大的产业。

另外一块也是特别关键的一点,所有的AI讨论里人必须在里面发挥积极的作用,也就是说不能离开人,不管今天自动驾驶做得多么好、多么完备,如果有事故或是倾向出事故的时候,人怎么把控制权拿回来?同时人跟自动设备、机器之间怎么和谐的相处、工作,互相增进?这也是特别有意思的话题、特别重要的话题。

为什么需要人在里面?人可以在机器不工作的情况下提供人的反馈,下一次机器会知道下次遇到这种问题会怎么处理。在欧洲和一些先进国家在讨论AI伦理这块,人在环路里成为必须的一部分。

AI的基础技术现在一般掌握在一些大公司,比如说微软、亚马逊、Google,小公司在这方面的创新不多。现在大家看到AI公司的成功是基于感知、人脸识别、语音识别、物体识别,它可以用在很多的应用。最大的成功、最大的潜力是AI的各种应用场景,反过来也是特别不容易的事情,数据在这里起了关键的作用,一个行业如果没有一定的数据水平,效果可能并不好,这个市场虽然很大,也需要一些新的资源、新的能力来做。

科大讯飞在很多领域已经有很多应用。第一个领域是在医疗领域,医考机器人可以配合一些医生在复杂的症状给医生一些建议。人类医生一定先入为主,他认为可能是某种病,机器人会给出一、二、三、四种可能性,同时建议病人要不要做这几项检查,检查完以后再返回来了,AI机器人会做新的排列,我们在医生发现之前给他指出了很好的建议。

教育方面我们习惯的教育是课堂式的,上面一个老师,下面几十个学生,没有办法做到个性化教育,他不可能对每个学生进行个性化。通过AI机器人,我们会对每个学生的试卷、作业进行分析,找出学生不同的知识薄弱点,从而制定一些个性化的教案和作业。

科大讯飞除了在赛道里做了很多了工作,其中一个是在深圳大湾区里做得最多的云交互,大家可以用科大讯飞的AI、UI平台建自己的应用,可以调我们语音识别的功能和语音合成的功能、翻译的功能,同时我们在消费者这块也有一些硬件布局。

相关领域
商业