北京大学黄铁军:新一代人工智能开源开放平台与开放问题(上)
黄铁军:新一代人工智能开源开放平台与开放问题(上)
大数据分析技术创新中心 前天
在4月20日的“大数据分析与应用技术创新论坛2019——暨大数据分析与应用技术国家工程实验室2019年会”上,北京大学信息科学技术学院教授、北京智源人工智能研究院院长黄铁军进行了题为“新一代人工智能开源开放平台与开放问题”的特邀报告,介绍了“智能为用、机器为体、学习为魂”人工智能理念,以及以开源开放为原则的中国新一代人工智能发展路径。
以下为报告实录:
智能为用 机器为体 学习为魂
首先讲概念。人工智能很容易被大家想象成是人工设计的智能,就是人在背后控制的模型,人工智能是人造的智能,这种理解是片面的,它不利于产业人工智能产业发展。
人工智能未来的发展中,人的色彩会越来越淡化,甚至完全跟人无关的智能潜力才最大。比如深度学习的模型,人当然是要调节模型,但是现在都是自动调整模型的,这种模型比人调出来的还要好,未来的智能通过自我演化的方式会产生更强的智能,所以我们更喜欢称之为“机器智能”。
我喜欢“机器智能”这个词还有一个原因,是因为这样我们能够把目光不仅聚焦在“智能”上,而且聚焦在“机器”上,即实现智能的物理载体,这是比智能本身还要重要的一个问题。
为什么这么说?纵观人工智能120年的发展历史:如果我们只看1956年到现在的60多年的话,是远远不全面的,这60年中大家的目光主要集中在智能上,1956年到1986年左右的前30年是经典人工智能,符号主义主流的阶段,符号系统、知识工程、专家系统占主导地位;在后30年里,出现了神经网络,到2006年的深度学习带来神经网络的复兴,机器学习成为重要学术方向,2006年到2016年这十年,基本就是以深度学习为主、在神经网络上做机器学习的这样一套方法与实际结合、与大数据结合,在现实中成功应用的阶段。
我国的新一代人工智能是从2016年到2030年15年进行的,差不多在2030年之后,我们可能就要认真地讨论一个问题,就是人工智能的终极目的,即制造强人工智能、全面超越人类的人工智能。
我认为更重要的是机器,就是在一个什么样的物理载体上实现智能。现在的人工智能基本上大家假定就是在计算机上,通过算法、模型实现智能,但长远来看,计算机只是实现人工智能的机器,只是其中一个历史阶段,而且它不是一个好的一个实验平台。如果你人工智能发展的最近60年,大概会你会越来越相信计算机是实现智能的物理平台,但是如果往前看30年或往后看30年,就会发现计算机从最初它都不是实现智能的一个曾经希望的平台,未来它也不是真正的能够实现强人工智能的合理平台。
所以我们总结为“智能为用、机器为体、学习为魂”,即智能是用途和功效,机器是载体,学习是智能与载体之间的衔接,通过与复杂环境的交互中学习训练而提高智能的能力。
以开源开放为原则发展新一代人工智能
我国人工智能的规划是在2030年总体达到世界领先水平,作为一个国家战略,我国发展新一代人工智能的原则之一就是开源开放,即建一个足够强大的平台,整体通过开源开放的方式,使得人工智能发展起来,而不是靠几个算法、几项成果。
为实现这一目标,科技部等部门有全面布局,即“1+N”人工智能项目群,其中新一代人工智能重大科技项目是重点。按照去年的指南,设计了基础理论、支撑体系、关键技术、创新应用四个层次,基础理论包括直觉感知、综合推理、博弈决策等,支撑体系包括智能芯片、智能操作系统和智能硬件,关键技术包括大数据智能、跨媒体智能、群体智能、混合增强智能和自主智能系统,创新应用今年的重点是医疗。
为什么开源开放很重要?芯片和软件是我国人工智能绕不开的问题,芯片问题的解决已经看到曙光,但开源软件平台近期可能都很难说能解决到什么程度。比如现在大家做人工智能通常是在网上找各种开源项目,然后再次基础上发展,出现了一些全球影响很大的开源项目,但长远看,如果一个开源生态是围绕一个公司的利益或取向时,就会出现问题,我们不能把整个产业的命运绑在少数项目中。
2017年7月23日,新一代人工智能产业技术创新战略联盟成立,核心工作就是建设新一代人工智能开源开放平台,其中绝大部分技术是免费的,如果大家愿意保留一定的知识产权,甚至收费都是可以的,但都是公开的。目前我们正在按照国际惯例进行开源社区的运营管理,已经有4个开源项目,分别来自鹏城实验室、华为、国防科技大学和百度。无论大家是想使用,还是想做贡献,这里都是中国人工智能发展的基础性平台。