GET2017|朗播网创始人杜昶旭:人工智能和大数据如何影响在线教育

GET2017|朗播网创始人杜昶旭:人工智能和大数据如何影响在线教育

11月15日,在以“共建·让更好的教育来得更快”为主题的GET2017教育科技大会“学术发展论坛”上,朗播网创始人杜昶旭以“人工智能和大数据如何影响在线教育”为题进行了主题演讲。

杜昶旭首先从时间的角度切入,阐述了人工智能和大数据影响下的时代变化。其次,他介绍了未来的四种学习场景。他认为,AI+大数据+教育可以实现“四化”,即从服务导向转为产品导向的标准化、从结果管理转为过程管理的过程化、大规模行为数据采集和分析的数据化,以及自适应学习系统推动精准学习的个性化。最后,他介绍了人工智能和大数据的应用场景。

以下是杜昶旭演讲实录:

大家下午好,特别高兴跟大家做这个分享,没想到今天这场这么多人,看来大家对AI这个话题比较感兴趣。

我上午在艾瑞的一个活动上,他们在讨论说,现在教育投资到底往哪个赛道上走,他们提出人工智能和大数据是一个大家比较关注的赛道。我说你们的提法错了,因为人工智能和大数据不应该是赛道,而应该是技术。所以它必须要和某个产业方向结合的。

所以今天想跟大家分享,AI、大数据是如何影响教育本身的,包括我们看到有越来越多的在线化趋势,这是一个什么样的状况。

这是一个怎样的时代

如今我们所面临的时代和很多年前特别不一样,所以我们才有机会讨论AI和大数据到底是怎么一回事。那么,这到底是一个怎样的时代?

第一,这是一个中国的互联网基础建设已经在全球领先的时代。我们刚开始接触到互联网这个概念,应该是在90年代末、21世纪初期。那个时候的互联网,我们不可能谈论跟教育有关的东西,因为教育是一种副媒体的形态,它有视频、音频和图片。那时大家下载一张图片要花很长时间,所以我们很难讨论大数据和和智能化。

但今天,我们使用的手机已经足够方便实现联网,并且我们可以通过手机看到许多精彩的视频。甚至现在大家对流量都没那么关注了,一个月包月下来很多人是用不完的,所以现在运营商也推出这个月用不完,就导到下个月的服务,这些服务都是让大家有更好的网络基础环境。下面是一组数据,从这组数据你可以看到中国这几年整个互联网的增速非常快。

第二,这是一个在不知不觉中,互联网正在不断地改造各个传统行业的时代。很多事情在互联网时代下,已经变得越来越容易,我不愿意去区分是互联网还是移动互联网,因为这个不重要,它无非一个终端的问题。其实这就是由于网络发展,信息传达效率变高了,我们看到了很多的变化。

你会发现过去你可能在街边打车,但现在你都用滴滴,过去你在线下买东西,但现在你都在线上买东西。我觉得这些都是我们可以看到的、很典型的,衣食住行方面的互联网的应用。但事实上,我觉得无论是教育,还是医疗,目前改造的还不够彻底,所以这个过程还会继续。

第三,这是一个在线支付变得越来越便捷的时代。我记得很多年前,我在一个分享上讲到,支付这个环节可能会成为教育在线化过程中一个很重要的制约因素,因为消费者不好付钱这件事是挺痛苦的,但是今天大家可以看到,这个已经完全不能成为一个问题,因为我们有各种各样的支付方式。

朗播大概是从2007年开始做在线教育的,毫不夸张地讲,我们可能算国内最早去考虑教育在线化的公司之一。但那时候支付不方便是一件很痛苦的事情,我们只能想各种各样的办法来解决。

今天你会发现,像共享单车这种模式它能够跑起来的原因其实很简单,就是支付很方便。我拿一个二维码,用支付宝和微信扫一扫都可以支付。而且对于大家来说,你可能还没有意识到你在支付时你就已经支付了,这带来的负面效应就是每个月发现信用卡要还账的时候非常多。

第四,这是一个用户对于“屏幕”的依赖不断加剧的时代。我觉得这个也是我们今天讨论在线教育的一个前提,包括在座的老师在内,我们对于屏幕的依赖变得越来越重。其实我在讲,各位老师拿着手机在拍,这就是依赖屏幕的一个表现,你会发现大家对于屏幕越来越依赖。

在过去80年代,家里面有一台电视机就很了不起了,但是后来事情发生了变化。家里有了电脑,你会发现,大家开始把屏幕依赖从过去的电视转到电脑上,而且那个时候的电脑基本上是以固化的PC为主。然后再往后,你会发现现在的家庭状况是你有PC、笔记本、Pad和手机,所以每个人家里至少有2到3块这样的屏幕。

大家注意到我这上面画的图都是一样的,我们来思考一个问题,就是所有的学习是不是可以通过跨屏幕去实现数据的共享和一致。比如,我们今天在看一个课程,哪怕它就是一个简单的视频课,以前我们就在手机上看,或者是在Pad上看。有没有一种可能是,我们把这个课程搬到家庭的环境里,父母和孩子一起坐在电视跟前,然后就在电视上看,也把这个课也学了。而且,这个过程结束后,后续在iPad上的进度、数据又是一致的。

所以你发现,今天大家已经有了很明显的在线化的趋势,于是很多人开始进入到这个行业里面来。但很不幸的是,出现了一个我认为可能也算正常,但却不希望看到的状态:很多在线教育的公司,或者是做在线教育的人,他们把在线教育认为是把过去的教育的服务给线上化。我个人不太赞同这个观点。

大家可能不太熟悉什么叫服务线上化,过去我们在教室里教学,现在我们搬到线上教学,这个东西就叫服务线上化。所以每次有人跟我讨论说,你到底是大班课、小班课还是一对一,在我看来都一样,因为在他们眼里这都叫服务线上化。但我们的观点是在线教育不仅仅是服务的线上化。

举个例子,以前我在传统培训机构工作了十多年,我当时在新东方教了11年的课,是一线名师。我们过去是在线下讲课,今天如果说你给我弄一个网,我在网上讲课,本质上是没有区别的,如果这件事情最终也能够成为在线教育成功的理由,那电大早就成了。

所以我们的观点是在线教育不仅仅是服务的线上化。那我们今天看一下,如果真的把教育或者是学习这件事情放到线上去,应该是一个什么场景。

未来的学习场景应该是一个什么状态

第一,没有人在意学习场景是线上还是线下。任何一个新兴事物刚出现的时候,大家总是喜欢先讨论概念用以区隔,大家开始讨论到底是线上好还是线下好。这个问题在过去几年所有的论坛、会议都在讨论的,但今年这个声音已经小了很多了,好像大家已经默认接受线上是一个很正常、很自然的学习方式。

第二,没有人在意学习行为是在PC端还是移动端。这个也是过去很多人在讨论的问题,我记得我创业这么多年的时间里,在早期时候大家都在说,你们这个东西是在网站上还是手机上,但今天我们已经不再讨论这个问题了。到底是网页、H5还是小程序、APP,已经不再重要了,重要的是你到底通过这些媒介得到了什么。

第三,没有人在意直播和录播哪个更好。不会有人去讨论直播录播哪个更好,很多人说课程到底直播好还是录播好,我告诉你们朗播的课程既有直播也有录播,我们从第一天开始就是这样的,我们跟消费者说你自由选择,直播无非就是你感觉更像线下,如果你是一个比较传统的人,这更适合你。录播时间比较自由,你愿意怎么听就怎么听,本质上是没有区别的,因为里面有一些概念,核心不是在于形态的问题,而是在于你对过程的切分、把控、数据的切割是否合理,所以这个东西也不会有人在意。

很多不同的教学场景和学习场景中间有一个共性,而把所有的东西连起来的就是数据。因为这个人在学习过程和教学过程中,会产生大量的行为数据和教学数据,这些数据都应该被一套系统管理起来,这样的话他们就形成了一个整体。也就是说,这个学习者的所有状态都是可以被处理、量化、管控的。

所以,我们所有学员的学习过程都是这个样子的,你完全可以随时随地地做,你所有的数据我们在后台都是通的。任何时间、地点你都可以去完成你的学习过程,这个就叫Any Time Any Where。

第四,“班级”概念消失,每个人都是独立的学习个体。“班级”这个概念其实是不对的,过去我们所有人讨论的都是到底是一对一好、小班好,还是大班好,这里面的问题不出在大班、小班的人数上,而是出在你对教学过程有没有拆分和管理。

从教学本身的角度来说,对于所有的人都需要知道的知识,它可以通过一对多的信息传达方式来实现,而有一种情况是每一个人都不一样,这需要有个性化的过程。如果你从这个角度想,你就会发现“班级”这个概念根本不对,而恰恰互联网是没有边界的,我们应该打破这种边界感。

AI+大数据+教育:实现“四化”

我们来看一下在这样一个模式下,我们怎么把AI、数据、教育结合起来,我提出四点供大家参考。

第一,标准化,从服务导向转为产品导向。这个词已经被说烂了,刚才我提到今天很多人做在线教育是把服务从线下翻到了线上,我认为这个不对,因为你这样做永远不可能成标准化。比如说今天是张老师讲、李老师讲或是王老师讲,因为讲法不一样,所以我如果要去学,我得到的东西肯定也不一样。企业能不能做到把整个教学过程全部产品化后,再讨论其他东西是个问题。

第二,过程化,从结果管理转为过程管理。以前大家只看结果,这个没错,教育肯定要为结果服务的。但是不谈过程只谈结果,这样做是不对的。以前就是从结果倒推,一个学期结束后,家长一看孩子成绩70分,就把孩子叫过来一顿胖揍,但这中间到底出了什么问题,我们很难知道。

第三,数据化,数据会涉及到大规模的数据采集和分析。数据采集和分析中有一定的维度,比如说什么样的数据有效,什么样的数据无效,从相对专业的角度来说就是数据纯净度。

那么,什么样的数据纯净度比较高呢?比如说我今天跟你讲了某个知识,然后让你去做某个题,你在做这个题的过程中犹豫了,你的鼠标滑过的数据显示你焦虑了,或者说你在做题过程中,我们发现你可能先选了某个典型的错误答案,后来又改回了一个正确答案,这样的数据反而是有效的。所以,我们要考虑哪些数据是有效的,这个事情对于做数据、做评价、做分析的人来说非常重要也非常困难。

第四,个性化,通过自适应学习系统推动精准学习。大家思考一下,如果我们今天要想针对某个人制定适合他的东西,那首先我们是不是得有个定义,你应该从哪些维度评价他,然后才是评价过程,最后是结合结果去做相应产品推送。简单说,应该是这么一个过程,当然这个过程也许是分离的,也许是整合的,这个都有可能。

人工智能和大数据的应用场景

我们来看一下,人工智能和大数据到底会在什么场景下有应用。我们认为大概有这么几个场景。

第一,测评技术优化。如今做测评的企业有很多,像我们就是更多地专注语言能力的测评。关于语言能力测评,我们正在解决几个问题。比如说我们怎样去优化测评的题库,因为测评的题库和大家过去看到的考试题完全不一样。举一个简单的例子,比如,你做一个英文的阅读理解题,做完了以后你说我错了,但不知道是什么原因错的。那我能不能通过一些测评题测出来,你到底是因为单词不会,还是句子没看懂,还是逻辑不清楚。这个东西需要专门的测评题库,而一旦涉及到题库,麻烦就来了,信度、效度检测做不做都是难题,这些东西非常专业。

第二,语音图像识别和NLP。这个领域我觉得更多是能做一些对于语音的评价,图像识别其实在拍题、扫题的领域做得比较多,像我们更多的就是语音识别,包括语义的一些处理,还有在自然语言处理这一块,有一部分会涉及到机器学习和深度学习。

机器学习和深度学习是什么意思呢,简单来说,一个是基于规则,一个是积累数据。我举个例子:

  1. 机器学习。我要教会你语法,首先要讲语法规则,我把规则一条一条讲明白了,然后你听完之后会了,这就是机器学习,它是基于规则的。

  2. 深度学习。你从小到大学说话,这个是深度学习,将大量的预料放进去,“你怎么学会的?”“不知道”。“会不会?”“会”。这个是深度学习。

第三,过程性评价。就是你怎样去把行为数据进行有效地采集、分析,然后对教育结构做预测。

非常感谢大家!

相关领域
人物