顺丰科技数据总监余何：人工智能“江湖”

2018年1月25日，由物流沙龙主办的“2018数字化供应链峰会暨LOG年会”在深圳举办。

“纵观整个人工智能的发展历程可以发现，我们是站在过往先辈的肩膀上在做这件事情”，顺丰科技数据总监余何在大会上的演讲开头如此强调。

作为顺丰数据中心、服务中心，基础的IT设施数据负责管理者，理论与实践并重，他从人工智能的定义说起，紧接着从人工智能的发展历程、技术框架以及应用场景等内容延伸开来，阐释了人工智能在供应链数字化下的应用。

在业内有着“大师兄”昵称的余何，令人忍不住联想到武侠小说里门派中的大师兄，接下来，我们一起来看一看他的人工智能“江湖”，学个一招半式。

余何顺丰科技,顺丰科技,人工智能,智慧物流,物流仓储

人工智能是什么？

人工智能是什么？余何给出了自己的解读——人工智能是指计算机能够替代人类实现识别、认知、分析和决策的多种功能，它主要包括三个阶段，依次分别是：逻辑计算、学习认知与意识情感。

1）逻辑计算。通过运用布尔代数、符号逻辑建立算法公式，再通过计算机进行计算，以达到释放人脑计算的目的。

2）学习认知。包括时空感知、经验抽象与想象创造三个部分。

3）意识情感。什么是意识情感？我知道我就是我，我知道自己的存在。我们在电影中看到的人工智能是什么？就是机器人有自己的意识会毁灭人类。而在余何看来，人工智能是可以模拟满足人类的情感需求，对人类自己缺乏的情感进行补充，要能证明自己的意识以及满足人类的情感才是真正的人工智能。

人工智能的发展历程

“纵观整个人工智能的发展历程可以发现，我们是站在过往先辈的肩膀上在做这件事情，很多伟大的科学家都在无关乎商业的象牙塔里做过研究。”余何表示。

人工智能的发展历程

人工智能的发展经历了三个阶段：

1、第一阶段：人工智能起步期

整个人工智能是从1956年开始的，当时最年轻的科学家只有29岁，名气最大的科学家当时不是讨论有什么样的科研结果或者什么产出？而只是做了一些假设：即什么是人工智能，可以通过哪些方式实现，有无相关标准？1956年，马文·明斯基组织达特茅斯会议标志AI诞生。

实际上，关于如何模拟人工智能当时分为两派，一派认为可以通过逻辑符号、布尔代数模拟；一派则主张完全打破原来计算的结构，仿造人类的大脑做神经网络。

1957年，心理学家罗森布拉特发明了神经网络模型Perceptron感知机，论文发表后引起了社会轰动，并得到商业界诸多投资。但与此同时，整个学术界亦对其进行非常激烈的批评，其中以马文·明斯基尤甚，马文·明斯基将对罗森布拉特的批评直接写到书中。

直至1970年，整个对人工智能的投资就像2000年互联网一样被打入寒冬。但无论如何，他们仍旧是人工智能的先驱。

2、第二阶段：机器学习时期

1982年，霍普菲尔德提出复合型的神经网络递归（复发型）网络，但当时投入到工业和商业的价值并不是很大；1986年，Rumelhar、Hinton等人提出了反向传播BP算法，解决了两层神经网络所需要的复杂计算量问题；90年代，DARPA人工智能计算机研究失败，SVM（Support Vector Machines，支持向量机）算法诞生，迅速打败了神经网络算法成为主流。

3、第三阶段：深度学习时期

2006年，Geoffrey Hinton发表了论文，首次提出了“深度学习”神经网络，人工智能在此兴起；2010年，举办ImageNet挑战赛；2012年，Andrew Ng建造最大的神经网络，骨骼大脑；2013深度学习算法在语音和视觉识别上都有重大突破；2016，AlphaGo击败人类职业围棋选。

尤其值得一提的是，1986年，“深度学习之父”Geoffrey Hinton当时在一所大学当教授，在这个时期，由于计算能力能够满足之后，他把人类的神经网络进行扩张，并且带出了很多学生，其中包括华裔李非非。

李非非做了一件事，她将1500多万张图片放到互联网上，通过分布式的管理方式让学生和科学家对这些图片进行标注，分成2200个分类，通过神经网络来快速识别图片，识别图片的正确率提高了2倍。“可以发现它不是一个算法的问题，而是数据问题，只要数据量足够大，正确率就高。”余何这样说道。

目前基本上是到了这样的阶段，我们的数据量已经足够，有了云计算的资源来支撑，至少在某个专业领域已经取得相应的成功。

人工智能的技术框架

很多人想自己做人工智能，或者成立一个团队去做和人工智能这个行业的相关工作，在这个行业中整个技术框架是怎样的？

人工智能技术框架

1、大数据、云计算

大数据和云计算是整个AI的基础，先要信息化、数字化，这两个基础是最难的。和以往相比，现在获取数据的手段更多速度更快；在计算能力这块有顺丰云，在单位空间中计算能力越强越好。

2、算法、模型

在算法和模型这块，可以发现很多科学家采用的方式完全不一样，比如在神经网络这块，在没有计算能力和数据量的情况下可能是剑走边锋。

算法主要包括三种类型，分别为：无监督学习、监督学习和强化学习。

无监督学习是给定数据，从数据中发现信息。通过对这些事情分析后发现神经网络中只要看到有猫的视频存在，某部分神经元就会产生反应，自动辨别哪个是猫，这个时候是没有人去干预的。

监督学习会给定数据，预测这些数据的标签。它会告诉我们大量的信息是什么，并进行归类，比如前面李非非做的项目，1500万图片都是经过大量的人工去处理和达标的，识别率达到90%。

强化学习是给定数据，选择动作以最大化长期激励，是这几个阶段中最复杂的。类似于在玩一个游戏，这个时候不需要任何人告诉他游戏的规则，整个激励和角度在于是否做得好。

3、技术方向

技术方向比较明确的是计算机视觉，人脸现在也非常普及，此外还包括语言工程、自然语言处理以及决策规划。

人工智能技术方向

4、瓶颈与研究

当前应用这些技术会遇到很多问题，如计算机视觉和语音工程会有很多噪音和干扰，这样的情况下通过什么方式让你的机敏度更高？机器与自然语言翻译这一块要求语量的信息要足够丰富；决策规划方面，目前我们要做的是，把应用场景中基于原来信息化、数据化和不断在变化的内容糅合在一起。

人工智能发展瓶颈

人工智能的应用场景

人工智能在物流领域有哪些应用？余何总结归纳了四个应用场景，包括收派、中转、运输、仓储。

其中，收派做了手写体的识别，原来是有人工跟单的，要去识别各种各样的人的字体，识别率可能在60%左右，现在完成第一轮的翻译后，结合现有的技术库历史数据进行识别，识别率可能是90%。

中转主要是网络的选址和路径规划。这是一个决策系统，要将整个全国全网的网点整个大的数据实现整个流转流向非常难。

当时做了一个切割，比如分为华东、华北，根据具体的业务场景做摸索，原来的人工智能也可以很好的运用，如计算机视觉可以在整个中转场有整套人工智能的识别系统，可以快速看到包裹的真实物流位置、捕捉单号；甚至可以在整个中转场看到人工作业的情况，如有无高空抛物或者按照制定位置认真工作；也可以通过计算机系统去完成具体场景，只要大的整套系统明确便可以很快运用。