明略数据吴明辉:感知技术与认知技术结合才会有真正的人工智能 | WISE 2018演讲实录

明略数据吴明辉:感知技术与认知技术结合才会有真正的人工智能 | WISE 2018演讲实录

算法能达到的精度准度都是没办法满足应用需求,这是人工智能面临的一个大问题。

2018年11月27日-28日,第六届WISE大会——“WISE 2018新经济之王”如期而至。在这个不断变化、充满焦虑和不安、却又英雄辈出的时代,我们一起见证着新经济之王的诞生。我们认为主要由科技创新和资本扩张所驱动增长的经济模型可以被认为是新经济,这个领域里有许多正在高速成长的,了不起的新经济公司。从任何角度来看,他们既颠覆了行业,也推动了行业发展,更深刻地改变着我们每个人的生活。

11月27日,面向AI的大数据公司明略数据董事长吴明辉在36氪WISE峰会上表示,人工智能的局限就在于他无法处理不透明的数据,比如AI下围棋,对手的每一步它能看到,就能做出相应的回应;但让AI去玩游戏,它就很难玩得好,对手的动作就是不透明的数据。吴明辉表示,突破人工智能的局限就要将机器的认知和感知结合起来。

吴明辉举例称,目前公安系统抓捕嫌疑人很大程度上就靠面部识别,但是人工智能的面部识别错误率较高,而借助民警的侦察思维,先将嫌疑人的范围进一步缩小,再进行面部识别,成功率就高很多,目前要培养的就是AI的认知思维。

演讲原文如下

各位来宾大家上午好,非常荣幸今天和大家一起分享我的一点体会。很多朋友都知道,明略是最开始把大数据和人工智能技术引入到安防。我自己北大人工智能科班毕业,那时候在学校里面读人工智能专业并不是特别火的方向,自从AlphaGo出来下围棋下好了,很多产业界里面包括媒体、投资圈等等,几乎所有的朋友都把关注的目光放在人工智能上。回过头看,我们明略在公共安全领域已经取得了很多进展,自从我们部署第一套系统在某一个地市的公安局之后,基本上只要是明略客户,就会不断的得各种各样科技赋能的表彰奖励。我们有一个客户对我说,我当警察能得的奖基本上都拿到了。

展开全文

但是回过头来看绝大多数的AI公司,今天好像也都只在安防领域取得了巨大的进展,大家都在讲人工智能要改变世界,我们要助力新经济的发展,但是并不是很轻易就能找到公共安全领域以外的应用场景,这一直是我反思的问题,也希望跟大家去探讨。

我自己在读人工智能专业的时候,在人工智能实验室具体的细分专业叫模式识别图像处理,或者叫生物特征识别。那时候人脸识别还不是特别火,当时我在实验室做的课题是掌纹识别、指纹识别、指静脉识别。我所在北大计算机系人工智能实验室,是全球第一个高校利用这项识别技术进行考勤的。以前北大每一个学生要求每星期在北大燕园里跑操,北大四五体育场有一个打卡机,跑完你要拿着学生证打卡。我们以前宿舍同学完成跑操都很简单,我们有六个同学,有一个同学拿着六个学生证打卡就好了。但是自从实验室把打卡机变成了指静脉打卡,学生同学都在说我们的实验室的技术杜绝了代打卡。这可以算是早期的人工智能应用了。

今天,算法能达到的精度准度都是没办法满足应用需求,这是人工智能面临的一个很大的问题。前一段时间张䥽院士有一篇文章非常火,讲人工智能虽然取得了一些进展,但是有非常大的局限性,大家基本上都在讨论深度学习,而深度学习本身的算法是不可解释、不可理解。深度学习包括早期的统计学习在具体的场景里面应用的时候,它有很多的前提条件,它被很多事情所约束。

就像大家看到用深度学习的算法下围棋的下的很好,是因为围棋所有的信息公开透明,可以看到竞争对手跟你下围棋的所有步骤,当然你不知道他怎么想,但是至少围棋怎么下是看得见的。如果用人工智能玩游戏,比如说打魔兽争霸,到今天都没有做的特别好,原因很简单你的竞争对手在做什么你不知道,信息不透明,因此很难把最终效果做出来,这是我们绝大多数行业里面人工智能商业化应用没有更好的取得进展一个最重要的原因。在安防里面,我们现在只是比对一下看看抓获的是不是犯罪嫌疑人。此外更多的场景里面AI还是一个很局限性的单一的技术,在局限性的环境里面是解决不了这样那样的商业问题。而我们明略数据一直是在思考如何去帮助我们的行业客户解决他们最核心的业务问题。

所以单一技术的发展,它发展的再复杂也会有一定局限。很多行业里面都有人非常热衷于刷分,我要第一名,我要分比你再高。但是真正要在实际应用场景中看,这个分数指标最高百分之百都不能解决这问题。

我给大家举一个例子,比如说我们屏幕上这个照片,这是真实公安要破案的场景,犯罪嫌疑人有反侦察的经验,他把遮阳板遮起来,摄像头拍不到脸。这个车牌号被摄像头拍下来后,嫌疑人开到一半就把车扔掉了,所以这个人花了半年多才抓着。在公安我们遇到的真实场景都是这样的场景。大家以为我们今天的人脸识别算法很好用,但是你在全国十几亿人口里面,会有几千个人跟你长的像,我们每一个人人脸放到全国人脸库比对一下,你会发现有很多人跟你很像,所以单纯的图像识别算法是解决不了这问题。在我们真实破案的场景里的另外一个案例里,一个小区里面很多电梯的控制面板都被偷走卖掉了,因为控制系统也很贵。

我们用人脸识别根本就识别不出来犯罪嫌疑人是谁,后来我们通过其他维度的数据一起进行研判,用公安的逻辑推理得出结论,做这个犯罪行为的人应该是电梯行业从业人员,普通人都不知道电梯的控制面板在哪。而整个地区有几千个电梯从业人员,在几千人里面如何把犯罪嫌疑人找到,就需要通过这几个人行为异常进行判断,这背后是基于更多维度的数据跟人脸识别的视频数据融合在一起,最后结合起来产生的效果。

我们今年9月份在市场上推出了我们新一代的AI系统 - 明智系统2.0,这个系统的目标就是把这类问题解决掉,把感知和认知打通,把我们的深度学习算法为代表的这一些音频、视频识别的数据跟其他维度的数据融合在一起,中间最重要就是,用符号把数据连接在一起。

大家都知道其实很多案件是由不同的110接警,不同的警察接待,而这一些数据之前散落在不同的案件笔录系统里面,我们通过人工智能自然语言的处理技术是可以把不同的案件笔录里面的关键信息找出来,联系到一起,最后把不同的情报汇聚到一个案件上,这是一个非常非常重要的技术。

而更多的情报线索来自于什么呢?来自于原来公安系统各种多源异构的数据库,比如户口薄等等。这些数据在原有的各种各样的系统里面,我们需要把这些系统关键的信息以符号的方式提取出来,最后融合到前面提及的视频、音频、文本的这些数据里,只有这些数据融合到一起,才有可能真正的解决复杂问题。

就像张䥽院士讲的,今天的数据算法很多情况下局限于数据不够,很多情况是小数据没有大数据,而在这种情况下我们需要使用人类原有的知识系统。我们明略是可以解决一个这样的系统的研发设计,将行业知识积累起来,而且这个过程其实是给各行各业构建行业知识图谱,这不仅仅在公安行业,在所有的行业都可以应用这个方法。

当我们准备好之后,多源异构数据是通过一个统一的符号体系,不仅仅是音频、视频文本等等,存到多源异构的数据库里面,最后形成一个符合我们下一代人机交互系统中,在这样的人机交互系统里面我们可以直接通过人类的自然语言向系统发问,我们可以问“这个人是谁”,我们甚至可以问更复杂,“他在哪里,他跟谁在一起”。甚至也可以通过这一套系统来问“他准备去哪”,我们可以通过各种各样的信息进行提问,“为什么”,这些信息是已经通过明智系统将所有的多源异构的数据进行了结构化处理。

我们在很多的领域里面并不只是通过深度学习去分析。我觉得这个人是坏人,但是你必须要解释清楚这个人为什么是坏人,这背后是有逻辑的。包括明略在工业领域,当我们发现一个火车坏了,它的哪一个零部件坏了,什么原因我们是要解释清楚、分析清楚,这都是今天为什么人工智能在这一些领域里面没有很好落地的原因。所以明智系统2.0就是致力于要打造这样一个环境,让我们能够去探索新一代人工智能的技术,把感知技术和认知技术连接起来才真正形成行业大脑。

这是明略数据首席科学家吴信东教授和我本人写的一篇学术文章,前两天刚在2018 IEEE ICDM国际数据挖掘学术大会上发布,我们叫HAO智能模型,我们提出,AI落地创造价值,唯有从大数据开始,凝练大知识,协同HI(人类智能)、AI(人工智能)和OI(组织智能)三者合一的HAO智能,以人机同行、行业服务为抓手,将明略数据的大AI思想落地到行业应用场景中。大智慧始于大数据,凝结大知识,带来更便利的人机交互,最后才能形成一个完整的闭环,以解决复杂问题。我们需要多种AI技术进行多链路的打通,而这一套模型打通了感知、认知,把最先进的技术连接到一起。我们也不需要百分之百准确的感知智能的算法,可能70%就够了,但是通过多维数据的打通,感知和认知的打通,最终形成一个完整的商业应用,实现一个最好的效果。

相关领域
人物