2017年5月21日,由中国人工智能学会、中文信息学会主办,亿欧承办的2017全球人工智能技术大会在北京国家会议中心拉开帷幕。
5月22日上午,脑科学与人工智能分论坛正式开始。
大会上,四川大学计算机学院教授唐华锦进行了“仿脑GPS:基于神经科学的机器人定位与导航”的演讲。
【唐华锦现场演讲实录】
大家好,很高兴有机会跟大家分享我的工作,刚才几位老师较多的讨论了神经科学方面的很多深入的研究,我这里主要结合说怎么样从神经科学或者脑科学到人工智能,今天主要谈一下机器人的智能。
先解释一下仿脑GPS,是指在大脑里面也有一个类似的GPS系统,这里是有一个神经科学的基础。我是在四川大学计算机学院,这个神经形态计算广范围的类脑计算研究中心,大致做了这样几个方面:
从电脑计算的基础出发,宋森老师谈到很多,跟他们学到很多东西这是计算神经学的范畴。在此基础上做感知信息处理,神经形态的智能硬件。人工视网膜、人工听觉处理信息。
并在此基础上构造大规模认知的计算网络,怎么样模拟基于脉冲的计算程式实现大范围复杂的计算,大家知道深度学习是个显学,大致门口浏览了一下人比较多,但是我觉得下一步怎么样真正从大脑的计算结构里面建立这样一个更加高效、更加智能的计算网络是类脑计算主要的目标之一。
另外把它硬件化,实现一个类脑芯片、类脑软件。潘老师提到他们在类脑芯片里面做的比较多,还有IBM的比较了解。其实跟类脑计算结合非常紧密的就是智能机器人,因为我们知道智能最终的表现形式是一个叫做载体或者交互实现的,机器人是一个真正智能的载体。
这次大会是人工智能,所以我谈一下结合人工智能,刚才赵总提了这个报告,2030年的人工智能,这里面提到一个概念,专门把神经形态计算列作下一代的人工智能技术之一,大家如果对这个领域比较陌生的话,关注去年的这份人工智能报告。在之前神经形态计算是非常冷门的一个术语甚至一个课题。
从我的理解来说,神经形态计算主要做这几方面,从微观到宏观,微观的角度探索是神经电路、单个神经元的角度,和宋森老师讲的神经环路,还有神经的编码机制,记忆编码机制,突出学习机制,这是微观角度这一块。
第二从宏观来说怎么样从底层电路、神经元他们之间的连接来实现高级智能?这就需要有很多种方式,比如通过一些具体的任务,我们主要着力点在于做机器人认知。今年5月刚刚出版了一本书《Neuromorphic Cognitive Systems》,系统地介绍了这方面的研究成果。
今天侧重点讲机器人,机器人经历了这样的发展方式,当然每个人总结有不同的方式,从工业机器人主要注重规划控制方面,到特种机器人注重移动和多地的适应性,现在比较热的是服务机器人,大家在大厅里可以看到非常漂亮的机器人,适应性和环境感知。再往后达到终极目标是智能机器人,给机器人一个类人的大脑,具有自我感知,理解和学习能力。
为什么我们认为机器人要用神经科学方法或者类脑的方法做呢?做一个比较,目前的机器人所谓的对空间环境的感知能力是依赖于对世界的精确建模,需要一个精确的世界模型,需要对空间有比较精准的理解,比如还有依赖精确的感知传感器,激光、视觉这些,甚至雷达,如果智能驾驶会依赖更加昂贵的传感器。
人在环境下有非常好的空间地位感知导航能力,其实人的视觉、听觉都是非精确的传感器,但是能够帮助人完成一个非常精确可靠、自适应的空间的认知能力。
所以这里神经认知机器人就是从信息获取处理到执行,依赖的是脑科学里面对于空间感知这一块,海马体脑皮层神经回路的理解。
这里归纳一下,目前在神经科学里面甚至一些生理学里面得出的动物导航理论,研究比较多的是大鼠,潘老师提到大鼠导航的神经科学研究比较多,其实在之前还有研究蜜蜂、鸽子和海豚的导航,归纳了几种,一个叫beaconing,蝙蝠的能力。
路径导航的方式,昆虫和蜜蜂可能运用这几种方式。另外结合了path integration,鸽子做路径积分找回路径甚至返回。还有鸟类长距离迁徙和定位,依赖于地磁场。
这是一种看法,我们关注在哺乳动物,左侧下处两个例子,蝙蝠和老鼠具有准确的空间定位。为什么研究蝙蝠和老鼠呢,因为在神经科学里面它们都属于哺乳动物,都具有类似的神经科学机制。举个例子,蝙蝠从一个洞里跑到树上寻找食物,科学家发现它的位置细胞精度是不断变化的,或者它的位置感受会从细到粗,从粗到细,取决于当地的丰富程度和精细度,粗糙的图象或者周围的地标不丰富的情况下,它的位置感知也会增大,变的模糊,这是对环境的自适应能力,造成多尺度空间表达的特点。
举了两个哺乳动物的例子,大鼠和蝙蝠它们具有类似神经科学的基础,发现了几种细胞,位置细胞、网格细胞、边界细胞、头方向细胞。人或者动物具有一个方向的感受性,专门有一个细胞做这个事情。
对人的位置细胞没有办法像大鼠一样真正进行大脑的解剖,之前人的大脑有没有存在这样的,之前也没有很好的研究,大概08年神经科学做了一些实验,证明人大脑里也有这样的细胞。
比如人通常做的定位与感知也是这个方面,你看到一个图象,依据周围的图象环境来判定你在哪里。到了另外一个位置,负责另外一个位置的细胞被激活,告诉你另外一个位置,这是自我感知的方式。最大的技术就是路径积分,比如我闭上眼睛走到门口,视觉已经不接受信息了,这个就叫路径积分。
一开始本身并没有说要做一个机器人,纯粹从解析大脑的认知计算机理出发,最早德国的科学家提出一个概念叫认知地图,直到1972年诺贝尔生理医学奖也提出一个基于大脑的设备,最早叫类脑设备的概念,提出智能必须通过与物理世界的交互来实现。
另外一个HMAX的深度学习网络感知模型,提出感知的深度网络。右侧的年轻科学家他依据大鼠的生物模型构造了空间的感知。
这里提到三个科学家,2014年获得诺贝尔生理医学奖,因为前期70年代发现了位置细胞,但是直到2000年左右才发现另外一个细胞网格细胞,有网格细胞,人才能闭眼从这里走到门口的功能。这代表神经科学巨大的进步,怎么样从简单的神经元获得高级的认知功能。
通常之前研究的神经科学、神经元只是计算,至于认知和记忆怎么从神经元产生,没有具体的模型,对空间认知这应该是第一个完整的模型,从单个神经元到复杂认知的完整形式。
大脑GPS系统从位置细胞、构建空间模型到下一代,到05年发现grid cell完成解析了大脑的GPS系统。简单来说特定位置对特定空间有个感受有发放的特性。随着大鼠走到固定位置就会监测不同的神经元发放,不同的环境具有非常可靠的环性,在不同位置监测都会监测到这个性能。
网格细胞的特点就是它在空间的发放可以存在六边型或者网格状,海马体左侧灰色的结构,网格细胞在蓝色的结构,靠内嗅皮层,网格细胞通过长时间的实验之后发现老刷具有这样一个特性,这个网格细胞对这个空间里面呈现的网格发放的特性,如果记录完这个神经元的活动之后把图画下来呈六边形。
所以基于这样一个生物机理构建一个肌体里面路径积分的模型,来构造机器人的轨迹,从A到B到C三个发放特性就可以推测机器人的轨迹。但是并没有给出网格细胞、位置细胞的连接方式,告诉他们之间有连接,但是中间如何连接、如何学习这是我们做大量的计算模型来得出的,所以构造一个模型就是依据海马体获得自定义信息,网格细胞路径积分的功能,共同协作来产生对空间的记忆,构造认知导航模型。
依据神经的斯达姆系统有头朝向细胞、网格细胞、位置细胞,位置细胞接触网格细胞的输入,同时反馈给网格细胞进行所谓的校准作用,走道一个路径发现路径有偏差了,是靠视觉信息重新做一个纠正功能,这就是位置细胞给网格细胞一个反馈。当然在机器人里面不可能完全实现神经科学所有神经元的模型。
前面提到一个澳洲科学家做的ratSLAM模型,是基于位置信息做的模型,后期我们做了一个能够结合网格细胞的功能,更加准确的在复杂环境下、实际环境做导航。
一个模型的例子,我们构造了机器人的位置导航系统,一个视频就是它所接受的视觉输入完全模拟大脑对空间的定位系统、对空间的反应。
这个导航叫gSLAM,它完整实现了大脑的GPS系统,具有非常好的数据生物的拟合性对实际空间的可靠的导航能力。
当然还有很多问题没有解决,或者我们团队继续做了一些东西,一是grid cell和place cell的关系;另外是如何提取记忆及识别环境中的关键信息,what和where的协作,大家谈的是模式识别的智能,但是被空间感知是另外一个重要的人工智能,人工智能有包含多个成分。
其中逻辑、语言大家了解的比较多,但是对空间智能了解的不多。另外一个是如何建立语义、知识空间与place cell和grid cell的结合,这个系统可以展现的功能会变的更加强大,它是一个开放的系统,不需要打补丁的方式做。
当然构造机器人的大脑需要多学科的共同努力,需要从大量神经科学中获得有用的知识,向他们学习。另外人工智能、机器学习的模型,做CMOS芯片、纳米神经形态器件芯片怎么样实现。另外还有感知信息处理,需要多个领域多个科学家的合作,神经科学、机器人科学家、做机器、硬件的科学家合作。
今天人工智能在脑科学里面做的工作还远远不够,举个例子,跳蜘蛛非常不起眼,但是它有非常好的空间处理能力,还有非常好的视觉精度,对这样一个大脑只有大概几毫米,我们对它的理解还是非常少,所以神经科学或者脑科学里面包含了非常多的、非常好的智能算法需要学习。
大脑的复杂性使得应用神经科学非常困难,正因为此,这样的工作成就都会让人非常兴奋,欢迎大家投入到脑科学和人工智能工作中来,为我们这个论坛做一个号召。