2017年4月27日到5月1日,“GMIC北京2017”在北京举行,为期五天,包括GMIC行业峰会、GMIC X年度盛典和极、科技庙会三部分。
GMIC上,来自IBM Watson Developer Labsand AR/VRLabs的项目总监Mr.Michael Ludden就VR与AI的融合发表了精彩的演讲。
【Michael Ludden现场演讲实录】
大家好!我是IBM的Mr.Michael Ludden,在我们的团队当中我们有一个创意称为AI、VR实验室,利用AI和VR的Watson技术。去年我也来到这里,非常有意思。
我会给大家介绍AI,我们应该去定义一下AI,因为有一些人使用AI,还有大数据、云这样的词。我还听到了人们对AI特别有意思的定义,实际上AI已经成为一个流行词了,因此现在是特别流行的。我会给大家介绍一下公司在AI领域当中所采用不同的方法。
接下来我会介绍VR当中的AI,这是我发言的主题,介绍一下IBM Watson的趋势,还有其他的趋势。最后我会给大家进行一些AI成绩的预测。
AI的定义
首先看一下术语,很多人谈到了AI,各各种各样不同的方式谈AI,尤其在Watson,我们会谈AI。我们会说Watson可以做这些,可以做那些,是万能的。既然我们谈的是很有针对性的一个东西,很独特的东西,当然并不是专门针对IBM的,是覆盖整个行业的一个AI。
首先我们要知道的,机器学习大家是否知道机器学习?机器学习是什么意思?谁知道?我想很多人应该是知道它是什么意思。机器学习基本上来说,我觉得当人们谈人工智能的时候,是觉得机器学习的算法,当人们谈到AI的时候,就会谈到机器学习的算法,谷歌会教你怎么样去培训机器学习的算法,大家知道AlphaGo是谷歌创建的机器人,和围棋大师下围棋,因为有太多的战术要去计算。
在90年代的时候,IBM所做的就是深蓝,在世界的舞台上来去下国际象棋,所有这些都是机器学习算法的例子,并不一定是通用的AI。它是一种狭义的AI,或者是机器学习算法,我们在这里所谈的就是,你是利用一些学习的方法,来对AI进行培训。在深蓝当中来学习象棋,AlphaGo是学习围棋,但是我们在这里谈的并不是通用的AI,这是我们发展的一个方向,我们可以拿这样的系统,找到一个围棋的棋手,让他教你怎么样去约会,这是不行的。他们不能够有多项任务,只能有一项专注的任务。
因此我们有广义的AI和狭义的AI。当然我们希望实现的就是广义的AI,我希望你给我洗洗衣服,它说我不能给你洗衣服,因为我太累了。我们将来希望实现广义的,它们可以有自己的想法,它们也可以根据它的状况,可以说不。
而深度学习是一种技术可以去培训机器学习的算法,还有认知,实际上它是一个覆盖一切广义的数据,它实际上是AI的一个同义词。IBM还有很多的国家他们都利用认知这样一种术语。机器学习作为一种服务,实际上也是一种服务,还有微软认知的这些,他们都是机器学习作为服务的一种平台,他们是基于云的平台,它不会去迫使你自己去培训你的机器学习的算法,你可以利用其他人的算法,而且有非常好的功能。比如说界面的互动,自然的语言,还有基于云平台,你可以跟他们互动,如果你是开发人员的话,你可以和他们进行互动。这样的话可以减少时间到价值之间的差距,你可以培训,学习算法。
我们要获得结果的话,可能时间是比较长,但是这里是有好处的,你拥有这样的算法,如果不是你的话,你可以利用其他人的平台,用别人的算法,这里是有一种折中的。我希望大家了解到不同的术语和不同的词。
目前的方法,人工智能目前的方法,这些都是我看到的,有基于云的,比如说Watson,还有微软,你可以说这个人是有语音识别,还有视觉的识别,还有苹果等等。这些大家要真正的拥有自己的是需要花很长时间的,现在我们可以有自己的选择,如果大家不想进行原型的制造,你可以有选择,这里有非常多的开源,我们可以支持他们。但是比较重要的是,这些都是简单的开源的数据库和框架,可以让你自己培训自己机器学习的算法,并不是说把这些公司所提供的秘密的配方向别人去披露。
我们可以把这些进行细分,由GPU加速的培训,我不知道大家是否听过CUDER,利用GPU会更快,还可以利用你自己拥有的资源,就像超级计算机,或者计算机集群的网络。有一些公司,他们所做的就是这样的,我们有一些开源的开发人员,我们可以为机器学习算法做出贡献,你们可以免费的去用。但是他们是如何创建自己的商务的呢?从金钱的角度来说,必须要证明是成功的,能够赚钱,他们实际上是在开源产品周围创建了一系列的服务,你所获得的东西是免费的,但是你要有效的利用它的话,你必须要和公司签署一个解决方案协议,在这方面他们会赚钱的。
这里是我所看到AI的四个主要方法,它们都有自己的价值和好处。对于小型的初创公司和大的跨国公司,像IBM,他们所做的是退出自己的AI认知、解决方案。
接下来看一下VR当中的AI,我参加了美国的一个活动,在纽约,当时AI还有VR是很火的,有一些容易摘的果实,比如说互动、语音、见面,你可以和一个系统沟通,它可以跟你进行对话,可以帮助你采取行动,这是一种自然的沟通,你可以去进行一般性的对话,不要去讲特别模糊的语言。Watson现在也在提供这些,我们随后再介绍一下互动语音识别还有视觉识别。
现在人们开展很多的工作,来界定怎么做是符合职业道德的,还有另外一个,如何把用户的信息放在VR当中,我们必须要知道每个人他的足迹,还有他们的一些特征。我们有两地的图像进行分析,我们有语音识别,实际上是把AI嵌入到VR当中,我们Watson是有视觉识别的,给你提供两个图片,它们就可以识别出这是什么,比如说是一个果树,有几个苹果。
我们现在可以利用视觉识别来进行分析,它们可以识别出用户在做些什么,是在看还是在摸,他们的眼神在看哪里,很多公司他们都在做这些业务,包括认知VR也在做非常有意思的东西。还有分析和VR的视觉识别,我们现在也推动了一些研发项目来解决这些问题。当然还有数据分析,还有其他的例子。我总是听到大家讲这些例子。我们有VR和AI,这里确实有一些价值的,因为你知道,人脸识别,我们现在有着空间的记忆,人们可以看数据,就像是空间的3D一样,可以进行空间的记忆,这样自动就可以识别数据当中的信息。
VR游戏中的AI
这里有非常多的游戏公司,他们要看AI解决方案的提供商,像IBM在VR空间当中,他们说我们如何去传见AI,然后去替代MPC。现在当你去玩儿游戏的时候,他们有自己的行为,如果我去睡觉或者射击他们都会做出回应,这都是硬编码的行为。我们在AI当中预测的一些行为,在游戏设计当中的AI,我们可以去找到那些坏蛋,然后可以让他们做一些随即的事情,可能和游戏当中的情景并不相匹配。
在游戏行业一直有一些非选手还有非玩家的一些人物,但是这里有一个非常重要的区分,他们是不能够完全的嵌入其中,因为在游戏当中,一定要遵守一些严格的规则,否则的话用户不会玩儿得特别的开心,当然这里也有一些兴趣点,我们可以利用真正的机器学习的算法和狭义的AI来进行游戏的设计,我非常期待和VR当中的一些人进行对话,他们可以帮助我进行测试。
人们会经常提到他们,因为他们可以去确定一个系统是否是一个人还是不是人,如果说你可以去欺骗图灵检测的话,你真的是太棒了。现在有AI,有传感器。
语音控制
接下来我再给大家介绍一下我的团队所做的工作,我们开展了一些工作,我们不把它称之为认知VR,这是一个视频,现在无法放这个视频,如果大家感兴趣的话可以拷一下。这是针对开发人员的演示,可以看到Watson在VR当中互动的语音。在这种情况下,它是一种命令和控制的界面,你可以随便指任何的地方,你说你可以去创建一个大龙,编码服务可以马上提供给你,你可以说给我一个大的龙,它可以帮你创建一只大的黑龙,然后自动化的调节它的尺寸,最后调节它的纹理,这样就是为了给一些开发人员一定的启发。
如果任何的VR开发人员,你们感兴趣可以联系我,这里有一些代码的样品,或者大家可以等一下,明天在美国会正式推出。你可以去思考一下,你听到的东西,看到的东西,你以各种各样的方法进行互动,都是进入式的,但是大部分时间都没有声音,但是任何一个VR的耳机,都是有麦克风的,因此我们可以进行更多语音的互动,尤其利用我们的技术。如果大家比较感兴趣,可以随后跟我沟通,我们现在在VR还有AI当中做了大量的工作。
VR与AI的全面融合
我描述了这样一种哲学理念,我觉得VR将来会成为全尺寸的AI,我们的耳机会变得越来越小,我现在甚至可以戴眼镜,可以像隐形眼镜一样,我可以知道你们会做些什么,这样的眼镜会变得越来越小,它和VR没有什么太大的区别。
这是一个特别有意思的例子,Watson VR当中的视觉识别,我们有一个资深的游戏设计师,他给大家展示你可以怎么样重新培训,使我们的服务识别VR当中的三维物体,这个视频是比较奇怪的,有一些人在一个虚拟世界当中画一个钥匙,然后去点击,接下来一个三维的钥匙就打印出来了,这是早期的例子,而且是特别有意思的一个使用案例,我们希望看到能够看到开发人员能够做些什么,我们今年随后会有一些大的计划的宣布。
未来的趋势,我觉得这是我自己特别喜欢的东西,请大家耐心一点,我特别喜欢预测VR的未来,我觉得下一代的孩子他们会看我们,就像我们看我们的父母一样,他们生活在一个不同的世界,将来我们的孩子也会这样看我们。我们的孩子他们所成长的世界当中,物理的现实并不一定是惟一他们能够体验的真正的东西,如果你整个生活当中,你看到一些人,看到他们的名字,还有他们的社会身份,他们和其他人的联系,像VR、AI一样,我们必须要和他们进行互动,我们会看到一个完全新的过去不存在的世界。这将是一种特别有意思的文化鸿沟,作为我们过去5年和将来10年在VR和AI当中所做的工作的结果。如果大家有问题的话可以举手。
VR医疗
提问:我是重点关注在Watson癌症领域,卫生医疗领域,因为我们现在在这方面做的工作是比较类似的,我们想了解一下,你们可以提供什么样的服务给我们?要利用IBM Watson,在中国是比较难的,因为你们没有来自中国的数据,你们所利用的数据是来自SMK这样的公司。
Mr.Michael Ludden:Watson开发云平台的人员,我们可以和他们进行合作,在Watson Hous方面了解的并不多,他们必须要遵守政府的规则和规章制度,这些是有隐私保护的,因此跟他们打交道并不是容易,有些是来自Watson IT,当然在发言之后,如果你要进行这部分的沟通,我非常愿意跟你沟通,我对于Watson物联网、卫生医疗并不是特别的熟悉,如果你想沟通我们可以随后再沟通。
VR教育
提问:我有一个问题,是涉及到VR教育项目的,你们如何充分利用VR技术来应用在教育领域当中?
Mr.Michael Ludden:确实我们对这个领域特别感兴趣,我觉得VR可以推动教育的革命,实现个性化的教育,可以有一种不会受到干扰的教育环境。而不像我们那样阅读老的教科书,现在我们可以在VR当中建造大恐龙,就像是这些喷气式发动机在领域当中所做的一样,我们可以有一些虚拟的恐龙,还有课堂等等。我们可以利用VR应用在教育领域当中。
在这个市场上有很大的潜力,还没有人真正的看法。我的意思就是说,大家一定要去探索一下这样的市场。我在教育领域当中工作过,在谷歌工作,很多人会去建立和开发教育的应用,他们当然是要改变全世界,他们有这样的愿望,但是并不是说明天就去赚很多钱,如果大家要建立VR教育解决方案,并不会像VR金融解决方案一样那么快会赚钱,我希望我的孩子长大以后,当然我也非常嫉妒他们,他们会有非常好的教育的应用。
我们这里有很多非常好的教育领域当中的应用案例。我们可以了解一下这个恐龙,这个部分是什么,你是否能够给我提供一些提示,这些东西都是VR能够做的,而且在教育领域当中是能够帮我们实现的,我们这里有很多的公司,包括美国初创的公司,他们都投入到治疗、康复和教育领域当中,我们已经看到有一些非常有意思的工作已经开展了。
你知道有一些人出现了中风,他们身体一部分功能丧失了,VR可以触发你的大脑,去建立一些连接点,我不知道这方面的科学是什么样的,可以让你的大脑来重新生长一些神经元。真的让我们感到特别的兴奋,因为在这里有太多的潜力可以进一步的推动人类社会变得越来越好。如果大家对教育、治疗、康复、培训感兴趣,对于这些领域当中的VR感兴趣,大家一定要投入其中。现在就开始着手探索吧,因为我想这将成为下一个最大的竞争平台。非常感谢各位!