2018年05月25日,由亿欧举办的“GIIS安防AI创新峰会”在北京千禧酒店盛大召开。其中,海康威视高级副总裁、研究院院长浦世亮的演讲题目是《视觉大数据在传统行业升级中的应用》。浦世亮,法国国家科学研究院博士,曾获第十九届求是杰出青年奖、浙江省有突出贡献中青年专家、浙江省、湖北省科学技术进步一等奖等多项荣誉,负责开发并完成多个科研项目。现任海康威视高级副总裁、研究院院长,负责公司在人工智能及大数据领域的技术研究。
在演讲现场,浦世亮以“智能助力传统行业升级”为主题,指出阻碍传统产业智能升级的三大瓶颈,明示目前智能升级的举步维艰以及智能需求的碎片化,提出海康威视AI开放平台,接着介绍开放数据服务、计算服务、应用服务三大能力,最后讲解了在智能升级方面,开放的必要性以及海康威视在多个行业领域的业务应用和平台愿景。
【浦世亮现场演讲实录(有删减)】
各位来宾,各位安防界的同仁们,大家上午好!首先我要感谢主办方给我这个机会,让我能在这里与大家分享海康威视是如何利用视频大数据助力传统行业智能升级的。今天峰会的主题是安防智能,而我所演讲的主题是智能助力传统行业升级。看起来有一点跑题,但是我这个题目描绘了我们公司所面临的一个趋势。
传统产业面临三大瓶颈,智能升级举步维艰
我们现在每天利用视觉技术、人工智能技术给各个行业提供多种服务,这些服务里有部分是落在传统的安防领域,但是更多的是落在助力传统行业智能升级的范畴。举例来说,我们的机器人物流仓储、行车辅助系统、路边停车自动收费系统,以及无人零售系统,都属于传统行业智能升级的范畴。
下面我们来看传统产业升级的现状。由于我国人口红利的消失,国家重资产行业及传统制造产业的盈利能力逐年下降。根据报道,如果把中国制造跟美国制造相对比,将劳动效率的差异考虑在内,中国制造与美国制造之间的成本差异只有几个百分点,因此中国产业的升级势在必行。物联网和人工智能技术是传统行业升级的核心技术,其中视觉智能有着非常广阔的应用前景。
因为在物联网信息空间中80%的数据是视觉数据,利用视觉智能对场景进行感知可以延伸出非常多的应用,但是我们在智能升级的过程中,需求强烈而落地实现却很少。因为传统产业的智能升级面临三大瓶颈。
第一个是数据瓶颈,发展智能技术需要积累海量的数据,传统产业很难具备这一方面。
第二个是计算瓶颈,发展智能技术需要有优秀的算法设计能力和庞大的计算进行算法的训练及迭代。
第三个是应用能力,在传统行业进行智能的落地,需要打通前后端的产品,提供整体的解决方案,这些方面传统行业都难以具备。
AI Cloud将共享、开放进行到底
另外我们知道现在的人工智能技术还是处于弱人工智能时代,大量的智能需求是以碎片化、场景化的形式出现。在传统领域进行智能功能的升级,往往需要很多产业人的参与。首先需要积累面向场景的数据,第二个需要工程师开发面向场景的算法,第三需要大规模的训练系统进行算法的训练,第四需要前后端的产品来承载智能算法。最后需要一个平台软件来对接智能功能和行业的需求。这些能力很难有一家企业全部具备,因此要实现在传统产业大规模的智能落地,我们就需要构建一个开放的AI生态体系。
为了应对物联网在AI推动下与信息化系统融合带来的挑战,为了构建一个开放共享、可持续发展的AI生态,海康威视推出AI Cloud,它不仅仅意味着云计算,也不仅仅意味着基础设施,它是开放的基础设施、数据资源、平台服务和应用软件的总和。AI Cloud的技术特征包括边缘感知、按需汇聚、多层认知和分级应用。
边缘感知是指AI Cloud主要在边缘端部署基础的感知能力,从而获得最快的响应速度和较低的部署代价。按需汇聚是指我们不需要把所有的数据都上传中心,而是按照应用需要逐级汇聚数据,以降低云中心的数据传输压力和存储压力。多层认知和分级应用指的是我们会将多维数据挖掘所获得的智能认知能力,和面向需求的应用能力分级部署在系统的各个层级,以更好地适配场景化应用,并为用户带来价值。
AI Cloud会打造“两池一库四平台”等产品来实现基础能力和数据的开放。我们通过计算存储资源池和算法仓库实现基础设施的开放,通过物联网数据资源池和大数据资源池实现数据资源的开放,并通过智能分析服务和大数据服务实现平台服务的开放,通过智能应用平台和综合应用平台实现应用接口的开放。在AI Cloud这个平台上,设备厂商、基础软件厂商、算法厂商、数据供应商、应用开发商、安全服务商、运维服务商、技术标准规范工作团队等都有用武之地。
AI开放平台的数据、计算、应用服务三大能力
之前提到,我们传统产业的升级面临数据、计算、应用三大瓶颈,因此海康威视在AI Cloud上开发了AI开放平台。开放平台提供数据服务、计算服务及应用服务三大能力,旨在用来突破三个瓶颈,助力传统行业的智能升级。在AI开放平台的架构上,我们在基础设施层建设了感知能力、存储能力和计算能力,在资源层我们通过视觉词典、数据资源池和算法仓储来汇聚资源,并在服务层向我们的客户提供三大服务能力。
接下来,我会逐一介绍这三种服务能力。
首先介绍数据服务能力,我们的平台面向行业客户的应用,打造了视觉词典。视觉词典数据库为用户提供了一个人工智能开发的数据基础。我们希望未来行业应用中的万事万物在视觉词典中都将有相应的标签和数据样本,行业客户可以根据应用需要抽取相应的样本进行算法训练,迅速地实现行业智能升级从0到1的突破。
此外,数据服务还包括数据存储服务和数据标注服务,用户可以使用平台的数据产线对数据进行标注和测试。
第二是计算服务,我们通过公有云开放大规模训练系统,客户可以利用客户平台的训练能力进行自有算法的训练。第二种非常重要的计算服务是我们提供了算法的编译服务,因为用户的算法从开发到技术完成,往往需要面向特定的平台进行算法的优化编译。从而实现算法在产品上的部署,这往往是一个艰巨的过程,为了加速客户在产品上面算法的快速部署,我们开发了一款算法编译器,可以将智能算法面向不同的计算平台,实现快速的优化编译。
我们的计算服务还包括迁移学习服务,迁移学习可以在小样本的基础上快速地实现智能算法,在不同的应用场景之间切换。例如我们可以用少量海外车牌的样本实现国内车牌识别算法和欧美车牌识别算法之间的切换。
最后一种计算服务是增量学习。物品识别是经常用到的一种智能功能,客户会经常需要增加物品分类的种类。例如在商业零售领域,我们的用户经常需要不断地增加商品的种类,这就会涉及增量学习。但是增量学习现在所面临的一个问题是灾难性遗忘,灾难性遗忘是指在增量学习的过程中,智能算法会遗忘原有物品的特征,从而导致算法精度下降。海康威视设计了一款算法架构可以更好地解决这类灾难性遗忘的问题。
以我们增量学习的一个实验结果为例,我们首先对五百类物品进行了训练,然后在这个基础上进行增量学习。我们发现大量的算法随着增量学习种类数的增加,其识别精度迅速下降。而我们的算法则可以保持跟全量学习差不多的识别精度,我们会在平台上提供这一功能。
第三种服务是应用服务,我们的平台提供了大量的基础人工智能服务。包括对人和物的精度感知,其中有人脸识别、车牌识别、物品识别和多达几十种的人车属性识别能力。包括行人的年龄、性别、衣着,这些能力可以帮助客户实现目标在线下的数据化。需要重点指出的是我们还支持上百个国家的车牌识别,海外用户利用我们的平台已经在多个国家实现了本地化的智能交通方案。我们的应用服务还包括跨媒体的感知能力,其中有文本识别、音频识别和多维感知能力。最后我们的应用服务还包括了多维大数据的挖掘能力,我们的平台可以在用户的多维大数据上实现数据的治理、数据的抽象、知识图谱的构建及图计算和图挖掘能力,从而在用户的多维大数据上实现智能的认知。例如实现交通态势的预测、物流仓储的优化,以及商业数据群的分析、销售策略的优化。
实现行业智能升级,开放平台必不可少
我们的平台将在海康威视的萤石云平台上提供服务,这是海康威视在公有云上提供服务的云平台,它在全球有数千万终端用户的接口、千万级的用户。其中50%的用户是来自于各个传统产业,因此它有非常好的服务于传统产业的基础。
我会结合几个行业作为实例,来介绍用户是如何利用我们的开放平台,去实现行业智能升级。首先是智慧交通,我们的用户利用平台的智能能力实现了多种智慧交通的方案。其中有大家所熟悉的交通违章事件的监测、交通态势的预测、交通诱导城市级的交通方案。另外还实现了室外停车收费系统,多种车内智能方案,例如驾驶员的违章驾驶行为检测、疲劳驾驶的行为检测等。
在商超零售领域也开发了多种智能解决方案。包括利用商品识别、人脸识别和行为识别所开发的无人零售方案,在大型超市中所开发的物品防损方案和客户群分析方案。另外还开发了在连锁行业的无人值守自动巡店的方案。
在智能制造领域我们的机器视觉摄像机实现了条码分析,工件的缺陷检测、尺寸及形状检测,以及工件的三维定位等。我们的物流机器人还助力实现了仓储物流的自动化,在我们自己的生产基地,通过有效利用机器人,人力成本下降约50%,效率提升近80%。我们的智能能力还帮助教育、家居、零售、能源、旅游等多个行业实现行业的智能升级。
我们的平台愿景是让万物可视,让万物可知,以视觉感知为起点,助力传统行业的智能升级,谢谢大家!