中科院张文生:人工智能不是一个游戏,核心是做复杂信息处理

2017年04月21日,中国人工智能学会与亿欧联合主办“新科技·划时代”峰会在深圳举行,此次峰会基于大数据、人工智能成为传统产业的新动力,因此集合学会、企业、政府之力,将人工智能和产业融合,提升企业效率和带动产业升级。

出席此次峰会的嘉宾包括奇点汽车战略合作总监高华、将门CEO高欣欣、智童时刻创始人郭长琛等。

中科院自动化所副总工程师、博士生导师张文生就“人工智能遇到了大数据时代”发表了演讲,以下为张文生现场主要观点提炼:

1、人工智能是做复杂信息处理的;

2、人工智能困难重重;

3、人工智能最关键的是大脑;

4、人工智能是一个产业,并不仅仅是一个游戏;

5、技术的发展和需求造成了大数据的出现;

6、人工智能的任务是使用计算机来研究人的思维活动的规律。

中科院自动化所副总工程师、博士生导师,张文生,人工智能,大数据,机器学习,张文生

以下为张文生就“人工智能遇到了大数据时代”的演讲内容整理:

一、人工智能是人造的智能

首先,人工智能是人造的智能。人造的智能和真正的智能是不同的,首先得承认它们的不同。人工智能60年间,演绎了很多激动人心的故事,包括刚才说的国际象棋的比赛,围棋的比赛,以及各种各样的机器人。到底什么是人工智能?

1956年的Dartmouth会议已经告诉了大家,人工智能是做复杂信息处理的。什么是复杂信息?如果你处理的信息不是复杂信息,用人工智能处理有没有意义?要处理复杂信息,毫无疑问要有一个载体,目前用的电脑,也就是计算机。

二、人工智能应用拉动了理论发展

人工智能追求的大脑,希望人造一个大脑,来实现或者是逼近人类的大脑。这个事情我个人觉得是永无止境的,很多事情并不是人工智能做的事情,但是大家硬是往这个方面拉,每个人的观点不一样,说法也不一样,我们要把握它的本质是什么。

在人工智能产生之后的十几年,当时大家没有看到这条路很难,就出现了很多乐观的想法,包括Nemell和Simon。20年过去了,人造的智能仍然没有实现。是人类不聪明,还是机器不行?这是我们要思考的问题。

遇到这个问题的原因是人工智能困难重重,比如说人类要证明一个两个连续函数之和仍然是连续函数,这个非常重要,但是要让人工智能来做,甚至做到几十万个语句的归结,仍然出不来结果。这说明了什么问题?这样的问题用人工智能现代的逻辑体系做推理,是非常难的。

后来的人工智能解决复杂信息的处理,就涉及到了组合爆炸问题,这个问题我们如果是硬算,显然会算死人。怎么办?

比如说国际象棋最早大家都不敢碰,就因为是一个组合爆炸的问题。现在能做了,为什么能做?是因为我们避开了这个问题,找了另外一个方法,近似算法,只要有了近似算法,比人精准,比人快,就战胜了世界冠军。

这个过程拉动了人工智能的再次起飞,在80年代的模式识别,故障诊断,预测和智能控制,多个领域都得到了应用。是应用拉动了理论的发展。到了90年代出现了各种各样的人机大战,也就是游戏。做人工智能就是做游戏吗?不是。

三、人工智能是一个产业,并不仅仅是一个游戏

机器人是人工智能的一个展示平台,它并不是人工智能。最关键的还是大脑,大脑不但可以处理听觉,视觉,触觉,还有其他的功能。后来人们觉得不过瘾,还想做到形似的机器人,形象是了,但是神还不是。

值得一提的是在这样的模拟的过程中,具有质的变化的是IBM的Watson,他提出了认知计算的理念,他做的是理解自然语言。另外做了动态分析假设,分析问题,做优化,做迭代,精准的个性化分析,在短时间内发现新的模式。

四、人工智能的核心是处理复杂信息

人工智能最早就是做复杂信息处理的,复杂信息又是怎么做到的?

人类做复杂信息,孩子聪明不聪明主要是三个方面:第一是表示。如果你看了很多书,能够把这本书提炼得很简短,简短的东西能够涵盖整个书的内容,你的表示能力就极强。最常见的是速记,速记的人可以把人说的话用简单的符号记下来,就是表示能力很强。第二是推理,表示简单的东西推理就很快。

第三是搜索,在做推理的时候就涉及到搜索,比如说你要高考,这么多本书看完了,这么多门学科看完了,能不能考好,得把这些书表示得简洁,考试的时候如果是见过这些题,进行搜索脑袋里面的东西立即拿出来写上。如果没有见过怎么办?就把我见过的类似的东西进行推理,得到了一个新的答案。

这是人类的过程。机器同样也是要做这个过程的,这就是人工智能的核心,这个核心遇到了大量的问题。

人类的大脑能装的内容、信息不外乎是看到的、学到的。看到、学到的永远是有限的,你要对付复杂的外界的看不到的东西的时候,你就很难得到结果,得不到结果,你的聪明,智能就体现不出来。

五、大数据中的人工智能

什么是大数据?大数据是一个集合,这个集合又大又复杂,以至于现在手上的工具难以触及,这就说明了这个问题是一个复杂的问题。复杂的问题怎么用人工智能的方法来解决?

大数据是在2010年左右提出来的。实际上大数据是客观存在的,不是到2010年才出现,是很早就有的。只不过存储、采集、传输的技术都没有,计算能力很差,所以没法对这样的东西做记录。另外,即使是记录下来了,十几年前的很多事情我们也不关心。技术的发展和需求造成了大数据的出现。

为什么原来不关心?原来看病,只要拿着体温表一测,血一化验就可以了,现在不行了,要基因测序,看问题看得更细了,实际上是告诉大家,看微观的和看宏观的是一样的难。大数据在这个例子中就可以看到,看远的和看近的,两者之间有没有相关的关系?如果有,这就是大数据给我们带来的贡献。

这个过程有大数据,但是重视大数据和拥有大数据的人都非常尴尬。大家都知道我的行业是大数据,但是我们又拿不到大数据,比如说阿里的是大数据,但是我们能拿到吗?比如说中国的很多数据是大数据,我们能拿到吗?都拿不到。拥有大数据的人不知道怎么处理,这样的壁垒以安全、隐私等等来限制,当然有这个问题,但是未来会发生变化。这样的过程,做人工智能、机器学习、识别、数据挖掘的人要进入这个领域。

人工智能的任务,就是根据人类信息加工的原理,设计一个计算系统,以完成复杂问题的处理任务。使用计算机来研究人的思维活动的规律,这是人工智能的任务。

六、人工智能的机遇和挑战

我们要看人脑背后的门道,到底这里面是一个什么门道?门道在于他们能够快速的理解问题,能够识别人类的语言,能够微妙的分析出来讽刺,谜语,联想。人类的思考问题是开放性的,原来的计算系统都是封闭系统,两个是不一样的,我们要用封闭的系统做开放系统的问题,只能做识别。

第二个是可以模仿人类针对问题的策略性的思考,得到精准的答案,给出可信的回答。

对比沃森和原来的国际象棋,包括ALphaGO,它的计算能力是深蓝的一千倍,这说明要下过世界冠军,他需要理解这样的语言,要比下过世界冠军计算能力高得多。

深蓝解决的是一个确定问题,而沃森解决的是一个模糊问题,模糊问题更体现智能。这是一个不同的里程碑,深蓝体现了数学上的处理能力,而沃森体现的是对常识的理解,人类对常识的理解非常有限。

这样的一个架构用了这么多的计算,用了这么多的存储才能战胜,如果不是技术的发展,我们永远做不到。你的算法再好,也要依赖于硬件的技术。这说明问题很复杂,我们要达到这个问题,达到这个复杂度需要这样的技术。

ALphaGo也是做这样的问题,他选的人,李世石,他的核心背后就是这样两个网络,深度学习实际上是在做表示,把每个棋盘解析成一步步的走,主要做前端,后端的只是包装。这个做好就推动了认知,分区、分层次的处理,这是非常有意义的。如果从理论上来说没有多大的创新,但是从技术上说,对人工智能还是有很大的推进的,让大家热起来。

相关领域
商业