北大信息科学技术学院软件研究所副所长黄罡:软件定义的数据智能

北大信息科学技术学院软件研究所副所长黄罡:软件定义的数据智能

9月23日,第二届北大创新论坛在北京大学国际关系学院秋林报告厅盛大开幕。北京大学信息科学技术学院软件研究所副所长黄罡出席论坛并从自身研究领域阐释“软件定义的数据智能”。

黄罡表示,北大信息科学技术学院近年在探索用一套操作系统打破信息孤岛,从而把云上的任何软件系统、端上的任何软件系统、以及在管道上的这些软件系统都能把它在授权情况下形成数据结构,从而形成任何的数据资源,这就是软件定义的数据智能。

请点击此处输入图片描述

北京大学信息科学技术学院软件研究所副所长黄罡

以下为黄罡精彩演讲的主要内容:

在过去的三年里我们做了一些工作,正好是智能方面的工作,就是用一套操作系统打破信息孤岛。我们知道,过去,所有有价值的数据,不管大小、个人的还是公众的,都储存在软件系统里面,这些软件系统因为是不同的开发商基于不同的技术开发的,把数据拿出来就会有各种各样的问题,而我们天天都在讲大数据,但实际上我们手里没有大数据,这就是传统互联网时代的信息孤岛。现在我们发明了这套系统,不需要开放后台,不需要后台服务器和数据库,也不需要源代码,从前端、客户端通过一些行为就能够把内部业务系统里的数据结构和算法自动截取,进而进行相关的数据挖掘。

贵阳是我们国家首个大数据功能示范区,过去两年贵阳开放了5个委办局的15个系统,放到贵阳数据共享交换平台。贵阳市一级的重要政务系统有53家单位315个系统。两年只开放了15个,剩下300多个怎么办?用传统技术几乎不可能实现。因为传统数据需要把后台数据都打开,需要拿到源码,但是利用了我们的技术,5名工程师2个月就可以把贵阳53个委办局的315个系统全部共享开放,并形成一个目录。在这个目录里可以看到每一个委办局的重要信息系统和常用数据。所有的数据都是实时的,我们可以从相关委办局的后台信息孤岛里把数据拿出来,还可以写进去,这就是这套系统的核心技术。

打破信息孤岛,目前我们已经做了17个省、直辖市和省一级的系统。最近,国务院39号文要求中央部委和省一级政务信息系统实现资源共享。上周,我们做完了三个部委的。

以上这些例子,看似跟数据智能没关系,但我们是先解决了数据,再看智能。今天,真正有代表性的人工智能除了无人驾驶意外,其他还没有真正进入我们的生活,我们每一个用户能体验到的数据智能实际上就存在我们的手机里面。2015年8月份iOS8发布了一个siri云识别软件,苹果希望它通过云变成一个入口,能把苹果手机上的任何应用数据拿出来,而且也能写进去,通过这个入口把相关第三方应用边界孤岛打开。

今年,苹果收购了一家公司,这家公司可以把第三方应用数据拿出来以后,通过一个工作流把多个应用于不同部分的数据串起来完成一个个性化的需求。这个也就是我们经常说的面向场景的数据智能。

这些大家可能不太了解,因为苹果正式推出这个技术也就两年,目前只能解决自己APP的数据,大的APPiOS是打不开的。其实,这些数据对苹果来讲就是一个个的信息孤岛。除此之外,谷歌的安卓系统、亚马逊的智能音箱,它们的智能不是说有几个云识别系统,而是其背后的上万个Sgool。例如,亚马逊智能音箱的能力在于把你家里各种不同品牌的家电打通了,同时通过互联网连接到了你的冰箱系统里面,使得你在不用手机产品的情况下也能享受到互联网的魅力。

这就是我们所说的,通过各种技术把相关数据打开以后,再做相关的智能。我们的技术不仅可以把BS技术打开,也可以把AS技术打开。我们可以在用户授权的情况下把你内部数据的读和写打开,我们还可以把国内TOP100的应用,包括京东、易道、美团等等的接口打通,实现数据共享。比如说我搜了一个电影,然后会自动跳到美团电影或者豆瓣点评,同时也能感知到你看电影的影院地址,给你推荐滴滴的打车服务,这样就真正实现了APP之间的信息孤岛问题。

刚才讲的是把现在的APP和绑定的场景智能化打破了,其实,我们真正想做的是用户可以通过软件定义自己的智能。比如,我们可以用我们的软件把家里的家具连上智能网络,定义成一个智能家居,早上起来,我要锻炼,系统就会自动给你推荐一个健身的器材;早晨起来我要喝水,智能系统就会自动帮我把水烧到80度,等等。

目前的人工智能是每一个APP厂商通过各种手段强制把你的数据拿到手,用自己的思路去给你定了一个他认为你应该要的。这些智能是被定义的智能,不是我们要的智能。而我们是可以把APP里你要的数据都还给你,同时你可以根据自己的需要自己去定义智能,让用户真正控制智能,而不是智能控制用户。

我们技术已经生成了中国前100的APP、1000多个API,并且已经在做产业化尝试。比如,北京顺义有的别墅的智能家居就是采用我们的中控,我们的系统可以装到一些BOS机里,帮不同商家做流水整合,还可以给智能冰箱提供一些其他第三方的智能数据。

总结一下。我们真正想做的,是可以把云上的任何软件系统、端上的任何软件系统、以及在管道上的软件系统都能在它授权的情况下形成数据结构,从而形成数据资源。这才是软件定义的数据智能。

来源:企智网

相关领域
人物