专访中国科学院陆汝钤院士
追踪科技前沿,关注产业发展
▎院士访谈
潜心享受做科研的快乐
专访中国科学院陆汝钤院士
© 黄晓艳/文
陆汝钤
计算机科学家。
中国科学院数学与系统科学研究院数学研究所研究员。在知识工程和基于知识的软件工程方面做了系统的、创造性的工作,是我国该领域研究的开拓者之一。倡导并主持完成了以软件的机械化生成和移植为目标的系列软件计划(XR计划),推动了当时国产机软件缺乏问题的解决。设计并主持研制了知识工程语言TUILI和大型专家系统开发环境《天马》。首次把异构型DAI和机器辩论引进人工智能领域。研究出基于类自然语言理解的知识自动获取方法,把ICAI生成技术推进到以自动知识获取为特征的第三代,并开发出基于知识的应用软件自动生成技术。研究出能把中文童话故事自动转换成动画片的计算机动画全过程自动生成技术,在艺术创造领域内推进了人工智能。
1999年当选为中国科学院院士。
陆汝钤。 © 马珉/摄
作者按:2018年11月1日,记者从中国人工智能学会发布的《奖励通报》获悉,中国科学院数学与系统科学研究院研究员、中国科学院院士陆汝钤凭借其在知识工程方面取得的系统性创新成就,特别是在全过程动画自动生成、专家系统开发环境、软件自动生成、少儿图灵测试、知件、大知识特征刻画等方面取得的多项为国际公认的领先成果,成为首位“吴文俊人工智能最高成就奖”获得者,获颁100万元人民币奖金。 这是2016年12月23日采访陆汝钤院士的稿子。
移动互联网、大数据的普及和应用,对人工智能的需求变得越来越迫切,也给人工智能的研究提供了更加广阔的舞台,作为人工智能领域重要研究方向的知识工程也迎来了大好的发展时机。
作为我国人工智能领域研究的开拓者之一,陆汝钤院士在知识工程和基于知识的软件工程方面做了系统的、创造性的工作。如今,81岁高龄的陆院士,矢志不渝、桑榆未晚,仍然坚持在科研、教学的第一线,还亲自加入到大数据知识工程项目研究团队,践行着对自己的期望:潜心科研,脚踏实地去多做事情。
计算智能一枝独秀
黄晓艳:作为中国人工智能领域研究的开拓者之一,请您首先给读者科普一下人工智能知识?您对我国当前比较火热的人工智能产业怎样看待?
陆汝钤:智能在不同的生物物种上都有体现,而在人类身上达到极致,是人类最主要特征之一。人工智能研究的一个主要目的是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。然而,什么是人类智能,科学界至今还没有给出令人满意的定义。既然人类智能无法被精确定义,对什么是人工智能这一关键问题也就很难回答。
从人工智能发展的几个阶段以及人们对问题的讨论来看,我归纳出智能的三个层次:其中最普遍的一种看法是,凡是需要计算机来模拟人的大脑思维去做事情就是智能。比如计算机做计算、做文字的解读、做推理、写文章、作曲、绘画等都属于这个范畴。计算机科学元老图灵在1950年提出的著名“图灵测试”——让一个人类裁判和处于另一个房间的另一个人(A)加一台计算机(B)通过网络书面谈话。每一场谈话算是一次测试。如果在大量测试中,有相当比例的“中等智力”裁判无法通过书面谈话区分A和B中谁是人,谁是计算机,则称该计算机通过了图灵测试。研究如何使计算机具有智能相当于研究如何使计算机通过图灵测试。它是关于智能标准的一个明确定义。
窄一点来说,也可以认为计算机能进行创造性思维才是智能的。计算机做一些固定的、有规律的计算任务,并不需要“聪明才智”,不算是智能。只有在不确定的条件下,计算机还能适当运用并能去解决问题的,才是智能。
广一点来说,凡是需要涉及到用人脑(不一定是大脑)去完成的任务,也都可以算是体现了智能。美国的仿生机器人“大狗”能够在复杂地形上负重快跑,其身体平衡能力的掌控就模拟了人类小脑的功能。上述的这三种对智能的定义,大多数情况下人们更多地认可第一种理解。
人工智能是一门研究人类智能的机理以及如何用机器模拟人的智能的学科,是人编程、造机器来仿照人的智能行为。若问什么方是发展人工智能的最有效途径,专家们大致有三种不同的观点。
第一种,符号主义。是一种基于逻辑推理的智能模拟方法。这方面的代表人物有纽维尔和西蒙,他们提出了著名的“物理符号系统假设”,认为世界上存在着一种物理符号系统,只要充分发现和建设好这个系统,一切的智能系统就能用这个系统来描述和模拟。
第二种,行为主义。认为人工智能源于控制论,只要求计算机能够控制机器或物体去模拟人所要求的行为,而不需要太注重它的大脑意识是如何操作的,这就是行为主义。行为主义方面的代表人物首推布鲁克斯,他的“无表示智能”工作在第12届国际人工智能联合大会上获得“计算机与思维奖”。在此基础上设计的六足行走机器人,被看作是新一代的“控制论动物”,是一个基于“感知—动作模式”模拟昆虫行为的控制系统。
第三种,计算智能。认为无论什么事情都能通过计算来解决和达到。如果智能没达到,可能是计算理念没达到或计算速度没达到。计算智能的基础包含仿生学。它把世界上各种生物的智能行为,总结成神经智能、蚁群智能、鸟群智能等仿生模型,通过大量的计算来实现。霍普菲尔德和欣顿也许可以算是计算智能的代表人物,是他们带来了上世纪80年代初神经网络学派的强势回归。
人工智能最初是专注计算机实现一定的算法来进行问题求解。传统的人工智能强调研究人类思维的普遍规律,研究通用的推理算法,强调解决问题的策略。斯坦福大学的费根鲍姆教授发现这样的思路具有很大的局限性,它不能解决现实世界中许多复杂的问题。仅凭规则而没有丰富的知识是无法达到人们所预期的美好愿景。
上世纪六十年代末至七十年代初,费根鲍姆开始研究以专家知识为核心的专家系统技术。1977年他在第五届国际人工智能联合大会上正式提出了知识工程的概念。此概念很快被人工智能界接受。一批批实用专家系统的问世,产生了较大的经济效益和社会影响。1994年费根鲍姆因此获得图灵奖,世界性的成功使得知识工程似乎成了实现人工智能的第四条途径。
进入新世纪,特别是大数据时代以后,人们对如何实现人工智能也有了新的认识。在前面提到的人们认为可以实现人工智能的多条可能途径中,计算智能展现出越来越大的潜力。随着高性能计算机的出现、各种各样高科技软环境,尤其是深度学习的崛起,加上各种智能化技术越来越多地依靠计算,使得计算智能在人工智能的众多技术中显现出一枝独秀的趋势。
以知识工程为代表的、基于知识的智能化研究正在逐步和计算智能合流。正如吴信东教授指出的,知识获取的来源已经从知识工程初期的主要从专家获得,逐步转变为主要向大数据挖掘索取,基于海量计算的从大数据里提炼知识成为知识获取的重要途径,这是人工智能的一个重要发展方向。以上这些是我对现代人工智能发展的理解和看法。
陆汝钤院士与本文作者合影。 © 马珉/摄
潜心知识工程的研究和开拓
黄晓艳:知识工程是人工智能的原理和方法,它强调以人类知识作为机器智能的基础,研究知识的表示、获取、转换、推理和应用,被视作推动技术进步的关键手段。为了解决知识工程中的瓶颈问题,您做了哪些基础研究和开拓性的工作?
陆汝钤:我是1980年从国外教授做的报告中第一次听到这个名词。
我们在知识工程这个领域主要做了三件事情。
第一件事情是1983年后期~1990年初,主要是关注于知识工程的工具、技术和开发环境。首先设计并主持研制了知识工程语言TUILI。TUILI是一个基于谓词逻辑的人工智能语言,具有自然的说明性知识表示方式,能够运用这种说明性知识进行多种组合式推理。它将说明性的产生式语言风格和过程性的逻辑程序设计语言风格结合起来,可以动态调用深度优先、广度优先和最佳优先策略,实行混合的向前和向后推理,在知识程序的模块化结构、元级推理以及计算功能等方面引进了新的控制结构。根据我们当时掌握的资料,知识表示语言的这种设计理念乃我们首创。TUILI曾被一些气象台采用,在当时的反常气象预报中有了很好的应用。其次,我们做了集成多种技术和工具的大型专家系统开发环境《天马》。天马系统是国家七五攻关课题项目,也是当时国内最大的专家系统开发工具包,其规模与文献中报道的当时国际上最大型专家系统开发工具相当。已经推广应用在国防和经济的20多个领域、50多家单位,取得重要的经济和社会效益,荣获1992年中科院科技进步一等奖,1993年国家科技进步二等奖。
1990年代,我们做的第二件事情,就是知识的自动获取和知识系统的自动开发。那时对知识工程的理解,专家们普遍认为知识工程的瓶颈问题和最主要难点就是知识获取——从专家那里获取知识。专家知识的来源主要有两种:专家本人口授和专家提供的文献资料,这两种来源都需要通过自然语言的理解这个关卡。众所周知,完全的自然语言理解太困难了,目前还做不到。于是我们研究并设计了基于类自然语言理解的一套知识自动获取技术。类自然语言是一种适度规范化的自然语言。给定一篇文章,类自然语言的语义体现在它的关键字和关键字结构中,关键字以外的文字的语义则可以从关键字结构的语义推出。例如在句子“血球分为红血球和白血球两类”中,“A分为B和C两类”就是关键字结构。计算机从中可以知道A、B、C是三类对象,其中B和C是A的子类,除此之外并不需要明白A、B、C是什么。这就是类自然语言理解的本质。利用类自然语言技术,计算机能够很快把一本专业书籍变成一个结构化的知识库,并进而自动生成一个基于知识的应用系统,即通常所说的智能化计算机辅助XX系统,例如ICAI系统(智能化计算机辅助教学系统)。这个方法有利于把ICAI生成技术从手工编制(第一代),用写作软件编制(第二代)向基于知识自动获取的快速生成(第三代)推进。我们曾用这项技术做过一个ICAI系统的自动开发平台“天蜂”。我们还把这项技术应用于基于知识的应用软件自动生成,特别是MIS系统(管理信息系统)的自动生成。
进入21世纪,人类对智能科学的摸索逐渐深入。我们又做了第三件事情,就是提出了“知件”概念。在承担国家攻关任务项目中,我们发现了问题:开发应用软件时,软件里面会含有许多领域知识和应用架构,需要软件工程师和开发人员向领域专家学习不同领域的知识并掌握需求,这个过程是很困难的;再加上开发出来的程序代码和相关的领域知识混合在一起,很难区分开,不利于开发,不利于维护,也不利于在开发新的应用时重复使用程序代码和领域知识。
于是2005年,我们提出“知件”的概念。通过“知件”的形式,可以把软件中的知识含量分离出来,把“知件”作为独立的、计算机可操作的、商品化的、可被软件调用的知识模块。我们研究了“知件”的结构,语义和生命周期模型。提出了一种新的中间件—知识中间件,作为知件和软件协同操作的平台。总的来说,我们主张领域知识应该独立于硬件、软件之外,使硬件、软件和知件在IT产业中三足鼎立。我们的知件研究成果得到一些国内外专家的认同和跟进,产生了一系列后续工作。北京大学高可信软件教育部重点实验室把知件作为重点研究方向之一。其中金芝教授领导的团队先后和浙江大学、东北大学合作,研究知件的实现技术及其推广应用,取得一系列成果并获教育部科技进步一等奖。
从今年开始我们做了知识工程的第四件事情,就是大数据知识工程。国家重点研发计划“云计算与大数据”重点专项——大数据知识工程基础理论及其应用研究启动,项目首席科学家、合肥工业大学研究团队学科带头人吴信东教授邀请我们参加。我支持吴教授关于从大数据获取大知识的思想,重点研究了大知识的内涵界定,并且提出了大知识工程的主张,有关研究正在进行中。
黄晓艳:据了解,您曾研究并主持实现了一套全过程计算机辅助动画生成技术,在艺术创造领域内推进了人工智能。能不能具体就这方面谈谈。
陆汝钤:计算机辅助动画生成技术是从1990年开始做的,那个时候我特别喜欢看动画片,这带给我两个很深的感受。一是国内的动画片市场基本上都被国外动画片占领,二是动画片开发周期长,费用高昂。我发现利用计算机技术可以推进动画片生产的自动化,人工智能在其中就大有可为。这是人工智能技术的重要试金石。我设计并主持实现了一套全过程计算机辅助动画自动生成技术,其特点是从受限自然语言理解开始,把中文童话故事自动转换成动画片,使计算机模拟脚本改编、电影导演和摄影师的功能。
从1990年到1995年,我们基本上走通了这条技术路线,开发出动画自动生成软件《天鹅》。该软件接受以受限中文自然语言形式输入的儿童故事,首先是自然语言理解,其次是故事情节的理解和分析,涉及到故事的主角、配角、线索、主题思想等,都要进行分析。再就是各种各样的规划,包括情节规划、角色规划、场景规划等,再加上导演规划,布局规划、摄影规划等,每一层规划都产生新的故事表示,最后转换成汇编格式的脚本语言程序,由商用渲染软件生成可放映的动画片。到1995年,就有了第一个自动生成的动画片——《三兄弟》,曾在中央电视台少儿节目《大风车》中播出。刚开始时技术比较简单,人物也是木偶型,没有表情,到后来《后羿射日》就有配音和表情,技术有了很大的改进。
2000年,我们跟北京工业大学合作,建立了动画实验室,张松懋研究员主持做了两项研究。一个是将全过程计算机辅助动画自动生成技术应用于中国古建筑领域,利用动画形式把古代建筑的施工过程再现出来。经过艰苦的学习,学生们硬是把宋代官方建筑的规范《营造法式》改编成知识库,已经完成的《天燕》系统可以自动生成180种不同的古建搭建过程动画。另一个就是做手机动画自动生成,把它作为手机应用软件,可以自动理解短信内容并生成相应的短动画,和短信一起发送。其实我认为动画自动生成技术有着很大的应用潜力,像电子游戏,虚拟现实,慕课教学等都是应用动画自动生成的好方向,甚至于充满符号,非常难懂的体检报告也不妨以动画的形式来解释其内容。当然,动画自动生成想要真正成为成熟商业模式,还需要努力研究,还需要人力、财力的投入。
陆汝钤院士题字
创新来自漫长的积淀
黄晓艳:在推进人工智能的研究和应用过程中,我国目前发展状况如何?与世界先进国家存在的差距有多大?
陆汝钤:我可能是过于埋头在具体研究工作中了,对整个学科宏观发展的关注不够。但我最近看到国外公司的一份调研报告,他们根据对国际上855家其业务内容涵盖人工智能十三大类方向的企业进行调研的结果,用不同深浅的颜色在地图上标识这些人工智能企业在全世界的分布和实力。由于颜色的深浅变化是连续的,直观上只能粗略地划分成三个梯队,第一梯队是美国和西欧部分国家,第二梯队是加拿大,澳大利亚和印度,第三梯队才是中国、俄罗斯等,当然这种总结不可能是全面的,但由此多少能看到一些差距。
谈到我国人工智能目前的发展状况,我的观点是,做人工智能要么在做实上下功夫,要么在创新上下功夫。以机器人为例,常见展览会上有些机器人外表很漂亮,能唱会跳,非常会抓眼球。但我觉得能够在复杂地形上负重行军的机器“大狗”更令我感兴趣。我相信后者的难度要大大超过前者。另外,技术创新要从源头开始,阿尔法狗的下棋过程给人很深的印象:传统的下棋程序局限于逐步计算每步棋带来的棋局变化,从而受困于复杂性陷阱,而阿尔法狗能够以计算机擅长的图像识别来模仿人类棋手对棋盘上双方棋子形成的“势”的判断,这就是源头的创新。最后,我想指出,世界各国的普遍做法是:许多新技术最早都是在军方、在国防里应用,然后再转民用。相信我们国家也会用人工智能加强国防实力,许多成果只要国防用上了,民间迟早也会用上。
黄晓艳:您对人工智能技术在家居里的应用,包括对电器家居智能化有什么看法吗?
陆汝钤:在这方面我没有做过研究,我想说的是,判断人工智能技术是否真正在家居里应用,要看家人能否自己设计和自己编程家电控制程序,让家电能听懂我们说话,能观察我们的手势和脸色。家电应该满足人们的个性化、特性化的需求。我相信将会出现具有医疗功能的佩戴式计算机,根据实时测到的老人或孩子生理指标,如血压、脉搏、体温,甚至脑电波活动等主动调节住房环境以利健康。我也相信未来房地产商在盖房子时,会把电器家居智能化提前考虑进去,这样人工智能技术在家居里的应用会更广,前景也会很美好
黄晓艳:在科研领域,您获得了很多的荣誉和重大奖项。如中国计算机学会终身成就奖等,您对现在的年轻科研人有些怎样的建议?
陆汝钤:我曾在为凌晓峰教授和杨强教授合写的《学术研究你的成功之道》一书的序言中谈到过“科研年轻人如何做好研究”这个问题,此处摘引几句。
一个人步入研究生阶段,不意味着他将来一定要终身从事科研事业。他可以从政、从商、从军、从教、从工、从农,在国企、外企,干哪一行都行。因为,社会各行各业都需要具有丰富学识的高智商人才。但有一点,在研究生期间,就一定要认真学习,努力钻研,心无旁骛,培养起比较强的独立科研工作能力。这种能力可能在任何行业都能发挥作用。
一个人的价值观是很重要的。研究生做研究,就像工人务工、农民务农、学生学习、军人卫国一样,是自己的本职工作,科研年轻人应该有这个基本的义务观。
其次,年轻人做研究一定要有创新精神和创新意识。创新是科研工作的核心和灵魂。寻找创新点就是寻找以前没有人做过,或可能没有人做过的,有可能成为突破点的新理论、新技术。事实上,许多开创性的工作都是建立在跟踪的基础之上。一般都是先有跟踪,后有创新。我们要提倡为了创新而跟踪,不是仅仅为了写几篇论文而跟踪。
科研年轻人在选择一个科研题目时,不妨优先考虑那些在简单情况下已经有解,而在复杂情况下尚未解决的课题。
每个成功的科研人,都会在专门的领域中,具有科研实力并形成影响力。科研年轻人要沉下心去搞科研,要有探索难题的勇气,长时间磨炼自己,脚踏实地去做好学问,做深研究,同时,掌握过硬的真功夫。有付出自然就会有回报,我相信,随着时间的积累,就一定能在业内产生影响,也会收获到成功的喜悦和快乐。
陆汝钤院士 © 马珉/摄
院士专访 点击打开
杨叔子 陈俊亮 钟群鹏
李 骏 吴 澄 陈立泉
李家洋 高从堦 岳国君
徐光宪 鄂维南
长按二维码,即可垂注
出品人:黄晓艳