陆永青:通过开放平台打造生态系统可以降低AI应用开发成本

2018年09月17日,“人工智能赋能新时代“2018世界人工智能大会在上海徐汇西岸盛大启幕,本届大会为期三天,由国家发展和改革委员会、科学技术部、工业和信息化部、国家互联网信息化办公室、中国科学院、中国工程院、上海市人民政府共同主办

大会上,英国帝国理工学院教授、英国皇家工程院院士、美国电子电气工程师协会(IEEE)会士、英国计算机学会(BCS)会士、中国人工智能产业创新联盟专业委员会主任委员及鲲云科技联合创始人、首席科学家陆永青发表主题演讲。陆永青的主要观点如下:

1、开发高质量的深度学习需要深度AI知识、复杂的工具、高性能的电脑、比较先进的软件和应用领域的专长知识,但是通过个性化和定制化的平台就可以将这个过程变得简化。

2、如何让AI技术更简单易用,需要做到三步:首先是要把人工智能的需求转化成个性化的架构;第二是把这些架构再转化成为可个性化、定制化的平台,使得可以自动生成类似的架构;第三是使用这些平台来支持一个生态系统,让不是AI专家、芯片技术专家、硬件专家的人,可以从硬件技术进步中获利。

3、深度学习只是AI技术的一个部分。

陆永青,鲲云科技,陆永青,人工智能

陆永青现场演讲实录

陆永青:非常感谢给我这样的机会,我在过去二十五年一直在英国帝国理工学院工作,过去几年感觉非常激动,为什么这么说呢?像姚教授已经谈到的,我有很多非常优秀的学生,他们建立了一家公司,就在上海,我们也通过这家公司来做一些前沿的研究,将研究变为一些现实应用,希望可以跟大家分享一下我们所做的工作。

在这里的图片给大家看到的是我们一直在使用深度学习的技术,希望能够检测到有没有非法倒垃圾的行为,主要是监测特殊类型的卡车,这些卡车可以将垃圾和其他不想看到的物体,静悄悄地倒在某个地方。不过一旦在摄像头里面装上AI芯片,让它更加聪敏和智能之后,这些摄像头就可以找到这种类型的卡车,这样也可以提示警察,卡车在不应该的时间出现在了不应该的地点,这在浦东的城市管理当中已经用到了。

在最左边的一张图片中,大家看到的是C919大飞机,这个项目也是在上海做的,我们和商飞进行合作,在C919飞机进行试航时,看飞机是不是有不稳定和不正常的情况出现。当中这张图片主要是分析卫星的图像,希望能够在卫星上进行分析。这样就可以通过找到一些模式,大大减少需要的电力,或者努力把数据进行压缩之后传送到地球进行分析。这些都是非常有趣的应用,也都用到了深度学习的技术。

但是我们要开发高质量的深度学习需要深度AI知识、复杂的工具、高性能的电脑、比较先进的软件以及应用领域的专长知识,这样才能够找到应用的要求和需求。但是其实完全有方法可以将这个过程变得更加简化,更加简单。我们现在所使用的方法,是所谓个性化和定制化,那么如何做定制化的硬件和软件,满足AI应用需求,并且尽可能自动化呢?

稍微讲一下定制化的问题,传统的计算机和电脑,从一个程序开始,就是将程序放到一个固定的处理器当中,从左边到右边,使用的是传统的软件工具。但是现在,处理器有可能已经不再是固定的了,所以如果处理器的技术也可以个性化、定制化,就可以把这个过程逆向倒过来,有一个定制化、个性化的处理器,它可以为专门的领域应用。通过结合软件和硬件的工具,把整个处理器进行微调,来满足应用的需求。在很多情况下做一些专门领域的项目,可以定制化一些数据的表示方法、储存的方式等等,这取决于应用场景。

我们也可以定制化硬件,这个过程也是基于FPGA的技术,这个不会给大家讲的太具体,FPGA也就是现场可编程门阵列,有很多要素和元素,可以进行个性化定制,无论是在静止的时候还是在运行的时候,实施一些算法或者说是运算单位之间的连接,做到定制化和个性化。

前面讲了我们所做的工作,可以变成三个很简单的步骤。首先是要把人工智能的需求转化成个性化的架构,里面既有软件又有硬件,而且针对某个领域。第二是如何把这些架构再转化成为可个性化、定制化的平台,使得可以自动生成类似的架构。第三,一旦有了这些平台之后,我们是不是能够使用这些平台来支持一个生态系统,其目的是让其他人就算不是AI方面的专家、芯片技术方面的专家、硬件方面的专家,依然可以从硬件技术进步中获利。

下面我们看第一个步骤,可定制化的参数。什么东西可以定制化呢?有很多的参数,譬如说算法、数据的表示,也可能是应用程序、设备特定的参数。除此之外,也可以把计算分割成不同的分类,并且进行编译,根据不同的应用和不同设备技术进行分类。还有架构本身其实也可以定制化,无论是编译时间还是定制时间,这个取决于使用什么技术。我们想要做的就是找到一个平衡点,满足设计的需求,满足某一个特定的应用场景,这个需求可能是速度、资源、准确性、能源、电力,或者越来越多的现在也会考虑到的隐私问题、安全问题等等。当然,个性化和定制化也可以为某一个储存技术或者储存能量来做。

这里有一个很简单的例子,个性化深度学习加速器。就像前面所说,这当中可以用来控制并且个性化定型的层级很多,在计算层面也就是最小的层面,是可以进行定制化的,可以做不同的解释,也可以在全连接、就是FC这里显示的;或者也可以在最上面一层卷积层来做定制化。这些是不同的参数集,不过可以在这个架构当中列出一系列类似这样的参数。这些参数都是不一样的,我们可以找到一个最优化的数值,使得它能够成为适用于某个任务的最优化的参数。根据这个架构打造出一个模型,使得可以找到最优化的模型到底是什么,以及现在的系统和最优化系统之间有什么差距。

我们看到各种各样不同的架构,这些都是可个性化和定制化的。一边是一个二元化的深度学习神经网络,在不同的应用中,比如手写、书写的识别,大概速度提高了三百多倍,所需要的电力是所有核心CPU的三分之一;另外一边是一套深度学习的网络,它不仅仅可以识别图片,同时也可以识别一些行动,就像李飞飞教授前面谈到的,能够认出一些病人的行动、行为或者是其他的一些想要监测的模型和模式。

深度学习只是AI技术的一个部分,我们还可以看其他的AI架构,其中一个叫做支持矢量机器SVM,另一个叫增量的SVM,可以使用它们来做一些财务工作,比如说股票交易和金融的运用。此外,还有一种所谓的单种类SVM,把它用在网络安全的应用上,希望在整个网络当中可以找到一些不正常的行为。。再比如,好友有一些额外的AI架构,例如所谓的遗传算法;还有一些可以用来解决一些销售人员的复杂问题的架构。同时更有加强学习的加速器,能够优化和加快整个培训过程,适用于各种各样的机器人,把它们的培训加速。

第一个部分可定制化的架构已经完成,有了这些架构之后,我们需要考虑的是有没有办法提高生产能力,让它们越来越快,同时更优化?我们提供的是一个多层级的优化技术,做成可定制化的处理器。当我们设计实际应用、进行开发的时候,有可能并不能满足时间或其他限制的需求,所以就需要提供各种各样的反馈,从编译的版本再回到高层级的描述,让设计者可以修饰设计,这样实施的结果就可以更快、更好、更安全、更具有韧性和保障。

深度学习的算法也需要调试培训,才能适用于各种各样不同的应用场景,我们一直在想办法来支持各种各样不同的深度学习的应用。比如说我们希望找到办法自动调试算法,抽取出一些网络参数,这来自于高层级的描述,同时也可以自动生成低层级的硬件模块,提供一些可以让设计者挑选的最好最优化的硬件设计。这是从应用层开始的,使用的是深度学习的描述。进入到算法层,这也符合生成一些相应的网络,同时不断升级,如果在高层的描述上有变化,就会自动进行升级。在这个例子中,就会得出一个可以编程的硬件。如果需要一个非常好的FPGA,也可以做到。

现在我们开发的硬件非常小、像信用卡那么大的,但是里面已经集合了整个摄影、摄像头和网络的界面,大概是二到五瓦功耗,我们希望进一步降低,可以做实时目标检测、实时目标分割以及手势的识别。因此,一个非常重要的要素就是要对它进行编译,如果只是一个芯片的话,是没有办法设计和产生的,很多人就没有办法用。但是我们完全有办法定义好这个网络,比如说通过高层级的描述,通过算法、培训、验证之后,打造一个深度学习的网络,再把它进行。比如SBAS的网络,为了能够变小,需要增加网络内部的效率。我们也做了自动化硬件空间的探索,希望可以找到最好的网络或者最好的实用场景是什么。现在我们的实用就是里面能够含有FPGA,这就可以进行编程,而且在最细节的地方进行编程,使它的性能和其他的参数都能够达到最优。

像李飞飞教授所说的,我们也找到很多可能性,做迁移学习,通过迁移学习优化培训以及它的推理,我们设定了一些标准或者是基干,有些东西如果从零开始培训是比较困难的,而且结果不是最佳,也比较费时,所以我们尝试各种各样不同的方法,调试一个事先训练好的网络,它的速度就会更快,同时更准确性,能够用于各种各样不同的应用。我们可以调试和微调一些事先训练过的网络,把这个过程自动化,把它们结合在一起,共同得出所谓的硬件应用。

这是一个图,大家可以看到上面是领域的知识,我们可以对各个层级进行优化。在下面是我们的硬件模块,有硬件的产生和设计。除此之外学习的技巧也可以获益于一些新的硬件设计,我们有新的迁移学习,对于新的设计可以自动识别,通过从数据库当中找到现有的设计,哪一些结构跟它是最为接近、类似,就可以自动把之前的设计洞察用到新的设计上。比如说我们的影像,可以把效率提高四到五倍,但是设计时间却不需要那么长。

最后一步是打造平台,通过平台我们可以打造一个生态系统,不断加速,同时降低AI应用开发的成本。

前面已经讲过了,我们有这样定制化的平台,越来越多不断往上走,也就是在描述层。比如城市管理人员,他们可能对于深度学习是不知道的,对于硬件也是不了解的,但是他们依然能够使用我们的界面,定义一些案例,以满足他们在什么时候想要使用这个培训,使用怎样的培训。同时他们也可以使用培训的结果,想办法找到各种各样不同的模式或者规则,来判断某一些活动,即使这些活动和行为是他们不想看到的。我们现在端对端的部署和开发锻炼,可以让那些就算是非专业、非人工智能或者硬件设计的人,也可以从最新的AI进步当中获利。

这就是为什么在过去几年当中,我们感到非常鼓舞,看到各种各样不同的应用出现,无论是试航还是卫星图像的压缩,还是气候监测和数据中心加速,或者一些金融财务的模型。除此之外,我们也和其他大学进行合作,包括斯坦福大学,看了各种各样不同的应用,无论从我们的遗传学、量子化学、气候监测和环境变化,有了刚才提到的能力,可以打造平台,可以进一步创建一个生态系统,应用的打造者、芯片的开发者和算法的开发者、应用开发者,这就是一个生态系统。希望到了最后,这是一个融合的社区,我们希望这也是一个智能的社区,就像前面提到的整个社区可以变得更加智能,这就得益于前面描述的技术进步。

非常感谢大家的聆听。

相关领域
商业