对话清华大学孙茂松：第三代人工智能要处理“可解释性”问题

正如人类会综合利用视觉、听觉、触觉、语言等信息，让人工智能（AI）从多角度、多模态、多学科学习自然语言也是清华大学人工智能研究院的目标与任务。

2019年7月1日，清华大学人工智能研究院第八个研究中心：自然语言处理与社会人文计算研究中心（以下简称中心）在校本部FIT楼举行成立仪式。中心主任由清华大学人工智能研究院常务副院长、国家重点基础研究发展计划（973计划）项目首席科学家孙茂松教授担任。

7月3日，澎湃新闻（www.thepaper.cn）记者走进清华园，与孙茂松教授聊了聊这个名字格外长的中心成立的背景、担负的使命、以及当下人工智能的发展、困境与解决方法。

孙茂松教授接受澎湃新闻（www.thepaper.cn）记者采访

AI诗人、人工智能辅助法官与未来的诺贝尔经济学奖获得者

语言是人类智能的重要标志，在人类文明中的地位与作用毋庸置疑，自然语言处理，通俗地解释就是“让计算机学习人类语言”。清华大学新设立的中心旨在通过加强人工智能的基础研究及其与人文社科学科的交叉合作，建立更强大的机器用知识库，进而提升人工智能对语言的学习和处理的能力。

孙茂松认为，目前人工智能同社会科学和人文科学的结合有两个主要的桥梁，一个是狭义的数据，比如说金融市场上的数据，可根据数据来预测市场行为；另一个就是语言文字形成的文本，比如新闻、消息、用户在社交网络上反映观点和情绪的各种“短信息”等等。

基于人类语言文字这一桥梁，自2015年底起，他指导一个最初以两位本科生为主体的课题小组，通过深度神经网络的方法，让机器对全部古代诗歌进行“阅读”并“理解”，在此基础上，推出了会作诗的AI——“九歌”，使人工智能“跨界”到了文学创作领域。由于公众的关注与参与，到目前为止“九歌”已经产生了差不多400万首诗，“从古流传至今的诗歌总量估计达不到400万首，如果这么想，效果也还不错。”小组目前正在研究现代诗的生成，以期满足大众越来越多样的“作诗要求”。

“九歌”在CCTV-1《机智过人》节目上创作出藏头诗

社会人文学科是一个很宽广的概念。除了文学外，今年以来人工智能研究院正在与清华大学法学院合作，在原有的法学基础上更多地加入计算与人工智能的成分。法学院越来越认识到，“计算法学”是未来法学研究的一个发展趋势。孙茂松也提到，近年来最高人民法院领导的案卷卷宗数字化、公开化是计算法学发展的一个重要基础。

当澎湃新闻（www.thepaper.cn）记者问未来是否会有“AI法官”时，孙茂松说，“应该会有‘人工智能辅助法官’。虽然本质上机器的能力肯定超不过优秀的法官，但机器确实有它的长处，比如说它可以快速阅读大量的卷宗，人有时候会判断有片面性、情绪上会有所波动、法官水平也会参差不齐，机器则不会。”

孙茂松指出，人工智能目前基于大数据的深层神经网络方法（也叫深度学习方法，见后）有可能为某些社会人文领域带来研究范式的改变。虽然清华人工智能研究院目前刚刚开始进行外汇兑换率预测的研究，但他认为人工智能与金融、经济的深度融合可望带来极具震撼力的成果，一旦深度学习方法被创造性地、系统性地应用到这个领域，甚至“这几年国际上能出一个诺贝尔经济学奖”。

针对金融、经济系统的高度复杂性，孙茂松认为，当把各类相关信息都涵盖进来，并且有高超的手段对这些信息进行“大一统”式的有效处理时，这个复杂系统的可预测性便会显著上升。他举了个例子，“蚂蚁王国有自己的一套运作规律，但这个规律有时会变得非常脆弱，因为可能突然来一个人，啪地来一脚，便给这个王国带来了灭顶之灾。仅仅从蚂蚁的世界来看，这个突发事件是不可预测的。但如果把人的因素包含进来，细致了解这个人的秉性，比如他是否是一个有爱心的人、是否是一名佛教徒等等，他的行为的可预测性就会大大提高，蚂蚁王国的不可预测性也会随之大大降低”。

在孙茂松看来，经典金融学或经济学的研究范式主要是依靠人的理性思辨和求解方程（无论是线性还是非线性方程）。但复杂且庞大的金融和经济系统里充满了不确定性，很多现象难以用方程显式地刻画。但深度学习方法具有高度的非线性性质，在大数据的驱动下，理论上它能隐式地模拟任何复杂的方程，更加有效地处理系统的不确定性。这就使得一种全新的金融学或经济学研究范式的产生成为可能。

把“黑盒子”变成“灰盒子”

孙茂松的书架上摆着金融、语言、逻辑等各领域的书籍

“当代人工智能教父”、2018年图灵奖得主约书亚·本吉奥（Yoshua Bengio）认为，人工智能领域在近些年出现巨大变革要归功于 “深度学习”（deep learning）的出现。他在一篇名为《深度学习：人工智能的复兴》的署名文章中说，“近年来，深度学习已经成为了驱动人工智能领域发展的最主要力量，各大信息技术公司在这方面共掷下了数十亿美元的资金。”

本吉奥此前接受澎湃新闻（www.thepaper.cn）记者专访时表示，现有的自然语言处理系统掌握了大量的词汇量和语言转换的技巧，但是却并不理解句子的真正含义，机器“会犯一些非常愚蠢的错误，甚至没有两岁小孩的理解能力”。同时他认为，模拟人脑的神经网络以期能够实现类人工智能的机器学习技术，即神经网络技术对于新时代的意义是巨大的。

尽管意义巨大，但目前的深层神经网络系统存在着一个重大不足：给定一个输入，系统给出相应结果的深刻原因对人来说是不透明的，从这个意义上来说，它基本上是一个“黑盒子”。这就导致系统的稳健性会变大打折扣，系统的适用范围也会缩窄。当我们深究机器为什么犯错时（如机器翻译系统为什么把一句话翻成这样、而不翻成那样），机器却无法给出解释，“反正我就翻成这样，你看着用吧。”

此外，深度学习最擅长处理的是关联性：当输入“公鸡打鸣”这个词语时，它会自动联想到“太阳升起来了”这句话。这体现了一种关联性，但显然前者不是导致后者的原因。深度学习现在基本上没有因果推理能力。孙茂松说，深度学习只是在统计意义上“觉得”某两个东西是相关的，但两者之间到底有没有逻辑关系，它却浑然不知。

孙茂松进一步阐释，自然语言处理研究面临着同样的难题，实际上，“可解释性”是整个人工智能领域目前面临的困境，也是目前的国际学术研究前沿。研究者们正在努力让这个人工智能“黑盒子”至少变成一个“灰盒子”。孙茂松认为，在自然语言处理方面，知识库的构建或许是一个解决方法。以古诗词写作举例：“灞桥”后接“折柳”，深度学习应该能从诗库中捕捉到这个知识关联，但其它众多知识关联是否都能学到，就不好说了。但如果我们自觉地把跟“灞桥”相关的东西全预先列出来，如“灞水、驿站、销魂、断肠、长安、关中八景、李白、李商隐、孟浩然…”，建立起一个知识图谱，那么，机器就可以根据这个知识图谱比较自觉地去写诗，针对性更强，写诗过程也便具有了一定的可解释性。

根据人工智能研究院院长张钹院士的说法，人工智能在其发展史上已经先后经历了理性主义和经验主义两代。第三代人工智能应该是这两者的完美结合。解决可解释性问题，是其核心研究任务之一。

因为知识天然地具有一定解释性，知识库就带有一种可解释性。

“通专虽应兼顾，而重心所寄, 应在通而不在专”

以人工智能和大数据为标志的第四次工业革命到来之际，国内多所高校开始布局人工智能教育。2017年5月，中国科学院大学成立人工智能技术学院，成为我国人工智能技术领域首个全面开展教学和科研工作的新型学院；2018年，上海交通大学与南京大学先后建立了人工智能研究院与人工智能学院，南京大学还招收了首批人工智能专业本科学生。

而作为中国顶尖的高等学府，清华大学对顶尖人才培养一贯高度重视。2005年设立的计算机科学实验班（因其创始人、“图灵奖”唯一华人获奖者姚期智而得名“姚班”）是全国乃至全球领先的计算机人才培养的摇篮。一流的高等教育有责任助力计算机科学和人工智能达至下一个令人鼓舞的高度，更应该能够给这个时代带来颠覆性的影响。

那么，人工智能本科专业的设置是否必要？人工智能要不要在本科阶段就独立成系？

“通专虽应兼顾，而重心所寄, 应在通而不在专”，孙茂松用清华大学老校长梅贻琦的一句话为澎湃新闻记者解释了国内顶尖高校对于人工智能本科教育或许应有的态度。在参考了全球名校如MIT（麻省理工学院Massachusetts Institute of Technology）、斯坦福大学、CMU（卡耐基梅隆大学Carnegie Mellon University）等的课程建构后，孙茂松认为人工智能不应贸然独立于计算机科学技术的一级学科。当然，各个高校根据各自不同的情况和需要制定自己的发展策略，也是可以理解的。

“清华主要的还是要稳，没有特殊的需求不要变，一变反而变乱了，两拨人可能无序竞争了。” 整体稳定、积极探索是清华大学在人工智能本科教育上的方针。

今年，清华大学在“姚班”之外新设立了“智班”，全称为“清华学堂人工智能班”，在计算机教育结构大体不变的前提下，这个规模不大的实验班将对人工智能人才、特别是顶尖人才本科阶段的培养进行深度探索。而人工智能研究院的工作主要定位在研究生阶段，特别是博士生阶段的培养。

在本中心之前，清华大学陆续成立了人工智能研究院基础理论研究中心、智能机器人研究中心等七个研究机构。

孙茂松说，这八个中心的核心力量主要对应着人工智能研究的“初心”，也就是研究人的感知和认知。感知最重要的通道是视觉和听觉，所以设立了视觉智能和听觉智能中心；而认知体现人的语言、推理、逻辑、学习的能力，所以设立了基础理论中心、知识智能中心和自然语言处理中心等。再向外探索就是智能人机交互与智能多模态信息交互乃至机器人的相关研究，中心和中心之间是紧密联系、相互合作的。

刚满一周岁的清华人工智能研究院已基本实现了“整合力量、统筹安排”的目标。孙茂松表示，接下来的两个中心会分别以“社交网络大数据”和“人工智能芯片”为关键词。