顺丰科技数据总监余何:人工智能“江湖”

2018年1月25日,由物流沙龙主办的“2018数字化供应链峰会暨LOG年会”在深圳举办。

“纵观整个人工智能的发展历程可以发现,我们是站在过往先辈的肩膀上在做这件事情”,顺丰科技数据总监余何在大会上的演讲开头如此强调。

作为顺丰数据中心、服务中心,基础的IT设施数据负责管理者,理论与实践并重,他从人工智能的定义说起,紧接着从人工智能的发展历程、技术框架以及应用场景等内容延伸开来,阐释了人工智能在供应链数字化下的应用。

在业内有着“大师兄”昵称的余何,令人忍不住联想到武侠小说里门派中的大师兄,接下来,我们一起来看一看他的人工智能“江湖”,学个一招半式。

余何 顺丰科技,顺丰科技,人工智能,智慧物流,物流仓储

人工智能是什么?

人工智能是什么?余何给出了自己的解读——人工智能是指计算机能够替代人类实现识别、认知、分析和决策的多种功能,它主要包括三个阶段,依次分别是:逻辑计算、学习认知与意识情感。

1)逻辑计算。通过运用布尔代数、符号逻辑建立算法公式,再通过计算机进行计算,以达到释放人脑计算的目的。

2)学习认知。包括时空感知、经验抽象与想象创造三个部分。

3)意识情感。什么是意识情感?我知道我就是我,我知道自己的存在。我们在电影中看到的人工智能是什么?就是机器人有自己的意识会毁灭人类。而在余何看来,人工智能是可以模拟满足人类的情感需求,对人类自己缺乏的情感进行补充,要能证明自己的意识以及满足人类的情感才是真正的人工智能。

人工智能的发展历程

“纵观整个人工智能的发展历程可以发现,我们是站在过往先辈的肩膀上在做这件事情,很多伟大的科学家都在无关乎商业的象牙塔里做过研究。”余何表示。

人工智能的发展历程

人工智能的发展经历了三个阶段:

1、第一阶段:人工智能起步期

整个人工智能是从1956年开始的,当时最年轻的科学家只有29岁,名气最大的科学家当时不是讨论有什么样的科研结果或者什么产出?而只是做了一些假设:即什么是人工智能,可以通过哪些方式实现,有无相关标准?1956年,马文·明斯基组织达特茅斯会议标志AI诞生。

实际上,关于如何模拟人工智能当时分为两派,一派认为可以通过逻辑符号、布尔代数模拟;一派则主张完全打破原来计算的结构,仿造人类的大脑做神经网络。

1957年,心理学家罗森布拉特发明了神经网络模型Perceptron感知机,论文发表后引起了社会轰动,并得到商业界诸多投资。但与此同时,整个学术界亦对其进行非常激烈的批评,其中以马文·明斯基尤甚,马文·明斯基将对罗森布拉特的批评直接写到书中。

直至1970年,整个对人工智能的投资就像2000年互联网一样被打入寒冬。但无论如何,他们仍旧是人工智能的先驱。

2、第二阶段:机器学习时期

1982年,霍普菲尔德提出复合型的神经网络递归(复发型)网络,但当时投入到工业和商业的价值并不是很大;1986年,Rumelhar、Hinton等人提出了反向传播BP算法,解决了两层神经网络所需要的复杂计算量问题;90年代,DARPA人工智能计算机研究失败,SVM(Support Vector Machines,支持向量机)算法诞生,迅速打败了神经网络算法成为主流。

3、第三阶段:深度学习时期

2006年,Geoffrey Hinton发表了论文,首次提出了“深度学习”神经网络,人工智能在此兴起;2010年,举办ImageNet挑战赛;2012年,Andrew Ng建造最大的神经网络,骨骼大脑;2013深度学习算法在语音和视觉识别上都有重大突破;2016,AlphaGo击败人类职业围棋选。

尤其值得一提的是,1986年,“深度学习之父”Geoffrey Hinton当时在一所大学当教授,在这个时期,由于计算能力能够满足之后,他把人类的神经网络进行扩张,并且带出了很多学生,其中包括华裔李非非。

李非非做了一件事,她将1500多万张图片放到互联网上,通过分布式的管理方式让学生和科学家对这些图片进行标注,分成2200个分类,通过神经网络来快速识别图片,识别图片的正确率提高了2倍。“可以发现它不是一个算法的问题,而是数据问题,只要数据量足够大,正确率就高。”余何这样说道。

目前基本上是到了这样的阶段,我们的数据量已经足够,有了云计算的资源来支撑,至少在某个专业领域已经取得相应的成功。

人工智能的技术框架

很多人想自己做人工智能,或者成立一个团队去做和人工智能这个行业的相关工作,在这个行业中整个技术框架是怎样的?

人工智能技术框架

1、大数据、云计算

大数据和云计算是整个AI的基础,先要信息化、数字化,这两个基础是最难的。和以往相比,现在获取数据的手段更多速度更快;在计算能力这块有顺丰云,在单位空间中计算能力越强越好。

2、算法、模型

在算法和模型这块,可以发现很多科学家采用的方式完全不一样,比如在神经网络这块,在没有计算能力和数据量的情况下可能是剑走边锋。

算法主要包括三种类型,分别为:无监督学习、监督学习和强化学习。

无监督学习是给定数据,从数据中发现信息。通过对这些事情分析后发现神经网络中只要看到有猫的视频存在,某部分神经元就会产生反应,自动辨别哪个是猫,这个时候是没有人去干预的。

监督学习会给定数据,预测这些数据的标签。它会告诉我们大量的信息是什么,并进行归类,比如前面李非非做的项目,1500万图片都是经过大量的人工去处理和达标的,识别率达到90%。

强化学习是给定数据,选择动作以最大化长期激励,是这几个阶段中最复杂的。类似于在玩一个游戏,这个时候不需要任何人告诉他游戏的规则,整个激励和角度在于是否做得好。

3、技术方向

技术方向比较明确的是计算机视觉,人脸现在也非常普及,此外还包括语言工程、自然语言处理以及决策规划。

人工智能技术方向

4、瓶颈与研究

当前应用这些技术会遇到很多问题,如计算机视觉和语音工程会有很多噪音和干扰,这样的情况下通过什么方式让你的机敏度更高?机器与自然语言翻译这一块要求语量的信息要足够丰富;决策规划方面,目前我们要做的是,把应用场景中基于原来信息化、数据化和不断在变化的内容糅合在一起。

人工智能发展瓶颈

人工智能的应用场景

人工智能在物流领域有哪些应用?余何总结归纳了四个应用场景,包括收派、中转、运输、仓储。

其中,收派做了手写体的识别,原来是有人工跟单的,要去识别各种各样的人的字体,识别率可能在60%左右,现在完成第一轮的翻译后,结合现有的技术库历史数据进行识别,识别率可能是90%。

中转主要是网络的选址和路径规划。这是一个决策系统,要将整个全国全网的网点整个大的数据实现整个流转流向非常难。

当时做了一个切割,比如分为华东、华北,根据具体的业务场景做摸索,原来的人工智能也可以很好的运用,如计算机视觉可以在整个中转场有整套人工智能的识别系统,可以快速看到包裹的真实物流位置、捕捉单号;甚至可以在整个中转场看到人工作业的情况,如有无高空抛物或者按照制定位置认真工作;也可以通过计算机系统去完成具体场景,只要大的整套系统明确便可以很快运用。

相关领域
商业