乂学教育张栖铭:人工智能时代的个性化学习

乂学教育张栖铭:人工智能时代的个性化学习

1月6日,在由希鸥网联合中国创业者中心主办“2017年第二届中国CEO新年峰会”上海乂学教育产品副总裁张栖铭先生发表了关于人工智能时代的个性化学习主题演讲,以下为演讲实录:

我们公司成立于2015年6月,专注于中学生课外辅导。成立之初就获得了3100W的天使轮融资,近期我们还会有一笔大额融资到位。我们开发了基于人工智能和大数据的自适应学习系统,现在在国内有一百多家新型的学习中心,这是一种创新型学校的模式。和海外一些机构,也联合成立了一些自适应学习的研究组织,聘请了一些国际知名的科学家和我们一起研究人工智能和自适应学习。

做教育,首先要回答两个根本问题。

第一是培养什么人,也就是教育目标,第二是怎么培养人,包括课程体系,大小课程观,课程包括课程资源、教学、活动、评价等等。

教育是由社会经济需求驱动的。最初的教育,应该说是依葫芦画瓢,原始社会,子女模仿父母,同族长辈,随着社会的发展,有了学徒制教育,徒弟模仿师傅,这是职业学校教育模式的雏形。语言的出现,文字的出现,活字印刷术与书籍的大范围出现,老师不再是唯一的知识来源,突破了地域限制,人们可以接触到各地各种老师的观点。现在我们在线教育的各种情况,其实都可以拿那个时候做一些类比。

随着工业化和城市化水平的提升,政府主动承担起发展教育的社会职能,逐步的标准化,从国家的综合国力提升、国家竞争力层面,来定义,我们需要培养什么人。

了解这些历史,我们就有机会去预测,以后的5年、10年,可能需要什么样的人。

我们现在做的,是在现有的大课程观小教学论的框架下面,怎么去做好资源、教学、活动、评价等等。能够培养出以后需要的人才。

我们大家都知道的孔子,是在春秋战国时期,办私学最大的一家机构。天子失官,学在四夷。孔子是个大教育家,在春秋时期,孔子是春秋战国时期最大的私学的代表人物。

办私学,就类似于现在的私立学校,培训班。孔夫子,在2500年前,就提出了:

因材施教,教无定法:从学生的实际情况、个别差异出发,有的放矢地进行有差别的教学,使每个学生都能扬长避短,获得最佳发展。

但是在现在,我们除了有一对一的业务能够做到因材施教,很难大规模化。我们就想能不能通过通过人工智能的方法来实现因材施教。

现在我国教育形式,雏形大概是在甲午战争前后,借鉴西方教育。西方教育的雏形,有一种说法是普鲁士的柏林洪堡大学。他们形成了标准化教育的雏形。

按照年龄入学,分班,学习对于国家发展最有利的内容课程,不同学科划分,教材版本划分,有课表,排出各种课表,一节课四五十分钟,有寒暑假,有作业,有考试等等方式。这在当时的社会经济条件下,是一种非常好的一种发明。

标准化是实现包容的方式,为教育提供了一个测量标准,实现了人人教育的目标,为真正的英才教育打下了基础,也使得哪些劣质教育更容易被识别,从而消除其影响与危害,学生不会再被单一的观念和错误所误导了。

但随着社会、经济的发展,这样的标准化教学逐渐暴漏出了很多弊端。

去年年初,我拜访了北京某小学,当时一位家长到了办公室,老师一见到家长就开始抱怨,说“你看你的孩子,上课都在打瞌睡,然后成绩也上不去”。家长听完很生气,说“你看我孩子学习比较慢,然后你们就给他布置很多作业,然后作业每天晚上都要做到十二一点,那第二天他能不打瞌睡吗?他成绩能上去吗?”

我当时听了是非常有感触的。

课堂,这是孩子在学校呆的最多的地方。

老师在上课的时候,面向的是一个群体,北京很多学校是小班制,有30名学生,一些二三四线城市,一个班级可能有70名以上的学生。那么上课会怎么上呢?老师正常会按照自己认为的,中等偏上的水平,来讲课。

老师在课堂上问一个问题,1+1=?,80%的学生可能还在琢磨老师之前说的话,有一些学生都在走神开小差,某个反应很快的学生,大声喊出:老师很开心,竟然有人知道答案,然后继续往下讲。这种情况有什么后果呢,简单来看,成绩好的吃不饱,成绩差一些的跟不上,反应快的很自豪,反应慢的会挫败。

老师也会有一种错觉,我教的很好,这届学生不错。

然后到某场考试,直接扇脸。老师很难拿到一些实时反馈,来调整自己的教学,这种情况,我们称之为课堂黑洞。

像我现在站在这边,对着大家来讲解东西,有很多是我个人经历延伸出来的一些想法,我根本不知道大家能不能听懂。

我们的教材的编制仔细琢磨一下也非常有意思,我们学生物的时候,遗传是用到概率的,但是我们生物和数学两个是分开的学科,有学生生物没学好的时候,他潜在的有可能是数学没有学好,一个物理学家,可能首先他数学要非常好。

学生如果要继续掌握更高难度的知识,就必须深入了解最为基本的概念,要把眼下的知识学好。赶不上的孩子怎么办?

在传统的学习中,用于学校的时间是常量,而学生对于概念的理解掌握程度却是个变量。

实际的,常量应该是学生对于知识和概念的高水平理解,而变量才是学生为理解问题所花费的时间。

学习的快慢是个人习惯问题。课堂的进度应该按照每个学生不同的需求来制定,而不是人为规定一个统一的进度

在这样的一些情况下,我们也在反思现在的教育到底是怎么样的,它到底能迎合什么样的一个经济情况和实际的一些发展?

在这样的教学模式下,更多的是一种工厂化的教育。这种教育,是为了适应当时的社会经济发展情况而设计、构思和创建的。更多针对的,类似于工业革命时候的经济环境。

所有的学生都被打上了标签,哪一年哪一班出厂。

实际上,学生是千人千面的。

有些学生像猴子一样好动,聪慧敏捷,但坐不住;有些孩子像大象一样缓慢,但一步一个脚印;有些学生像牛一样,踏实勤奋。

在不同的学习场合之中,不同类型、不同能力水平学生的学习表现是极为复杂的。

教育是由经济需求驱动的。传统的教学模式,在现在的经济条件下,已经逐步满足不了需求了。

在西方也有很多这样的探索。

这是100年前,有人在畅想,是否有一天,会有一个机器,可以把所有的知识装进去,灌输到人脑里面,这样,每个学生出来都是博学多才的。什么知识点都能掌握的。

上面讲了很多现有教育的弊端,这些都是沿袭以前的教学模式产生的。

在最近这些年里,技术的发展,已经给教育带来了不少的变化。从1990年开始,有一些单机的计算机辅助教学的软件出来,2000年左右,一些教育资讯,内容,录播视频逐步开始线上化,2010年后,商业模式和产品模式不断的丰富,移动技术等等的发展,满足了一部分需求场景。

我们也一直在研究,希望通过一些方法,看是否有办法逐步解决这些问题。我们相信以后几年,以人工智能为典型的技术,将会与教学不断结合,改革和优化现有的教学模式,实现自适应学习。

早在2007年,国外就已经开始开展自适应学习研究,比尔盖茨梅琳达基金会从2013年开始对自适应学习技术展开了研究和效果的验证。在深入研究之后,该基金会提出:“自适应学习是当下我们在教育领域最需要的东西。

国外也有数十家做的很好的公司,例如Knewton,RealizeIT等等。

我们乂学教育,在人工智能和自适应方面,也做了大量的探索。下面给大家简单介绍一下。

我们来看一个实际的例子,拿一位普通学生来举例子吧,小明,在学习某个数学专题的时候,遇到了一些困难。有很多东西他听不懂,可能是抛物线看不懂,可能是反函数看不懂,那我们怎么来对它进行一个更好的教育?

我们首先需要确定的是,他当前的状态到底是什么,状态是指,他对于数学基本的了解和能力状态。数学部分,可能有非常多的知识点。

我们姑且假如数学有5个知识点,ABCDE,方便大家来理解。

5个知识点,那么小明可能有32个不同的状态。2的5次方。

但实际上,有一些状态是不可能出现的。例如必须学会A,才能学会B,那么有可能就不会存在BC\BD\BE这样的状态。我做文章的阅读可能做一个很浅的阅读才能再做一个深一点的阅读。这一切都是概率,所有也有可能有一些意外的小概率情况。例如认识一个个字,才可看懂词语,看懂词语,才可以连成句子,才能做好阅读。这是通常的认知。我一老乡,普通话讲不好,和别人沟通的时候口音很重,但唱歌的时候,发音很准,连粤语歌都很准。

我们去掉一些不可能的状态以后,可能是去掉了很多种可能性的。

这时候假如有这么多状态,简单可以认为,学了A,才可以学习C、D,A、B是没有前置条件的,或者说前置条件已经满足。

我们可以看到不同的状态。

就像alphago一样,棋盘是19*19的,每个点有三种状态,考虑所有可能性的话,在现有技术条件下,很难达成。所以会先把大量的棋谱输入进去,进行训练。然后大量的对弈,与人,与自身,把很多不可能的状态去掉。其实它跟我们的知识点一些对应非常类似。

实际上,数学的知识点,非常多。

我们将这些知识点,有序排列好以后,筛选出所有靠谱的状态后,可能形成了一张多维的图。

我们对于知识点,尽可能做到细化分解,纳米级分解。

所谓“纳米级”,是指把一个知识点拆成最基础的内容,变成最简单的颗粒, 然后针对每一个知识颗粒进行专门的视频讲解、专项练习和专题测试,常见错因分析等等。 就像一位拥有几十年教学经验的优秀教师,对学生的知识掌握情况进行精细的把握,并相应地给予指导。

智适应教育的知识图谱均由多年教学经验的教学专家编撰制订,以七年级英语语法为例,共计拆分出217个纳米级知识点。被动语态中有23个纳米级知识点。

分解以后,有什么好处呢?

例如说,追及类问题,简单可以分为8个细分点。有时钟追及问题、火车追及问题、流水追及等等。

一般情况下,常见题库、教育类产品,对于知识点的分类为三级,这个粒度非常粗。如果发现孩子流水追及类问题不会,推了一个时钟追及的学习内容过来,那么有可能就达不到效果,效率很低。

这种细分,我们按照alphago来对应的话,就是棋盘落点+棋谱+机器学习,准确判断当前局势,制定当前棋盘下的最佳策略。

对于自适应学习系统,就是知识图谱+人的经验输入+信息论,精准定位学生知识点掌握状态,制定当前学生状态下的最佳策略。

我们还在做更复杂,但紧贴实际的一些设计,例如能力点,认知层次等等。

不同的孩子在学习的时候,我们给他形成完全不一样的学习路径,这种学习路径是怎么来定义的?我们在每个知识点上,都会有一个能力值,这个能力值就是一种概率,我们来猜测,这个知识点会的话另外一个知识点掌握的概率大概有多大。

每个学生在不同的学习路径上面我们推荐的内容也不一样。因为每个学生的学习习惯都不一样,他们怎么学习,其实非常复杂的。在这种情况下我们针对每一些知识点都会有不同的一些单元里头复习视频、讲义练习题。每个学生,我们都会根据他的实际的一些能力值和所处的状态,去推荐不一样的学习内容,做到真正的因材施教。

自适应系统的另一个特征是会给学生采用循序渐进的方式进行学习。

根据学生的知识掌握状态和目标,自适应学习系统会自动规划最适合该学生的学习难度和顺序,不会让学生因为目标过高而丧失信心,也不会因为目标过低而失去挑战的欲望。通过这样的方式,让40分水平的同学可以逐渐提高到60分,让70分水平的同学逐渐提高到80分、90分,最终使得所有不同水平的学生都能够循序渐进地提高到较高的水平。

学生通过自适应学习系统的使用能够获得和自己最匹配、效率最高的学习方式和内容。在自适应学习过程中,每一位老师的教学、每一份学习资料、每一个教学工具都是根据每一个学生的学习状态、学习特征来订制的。

这对于课堂的管理、组织,参与的老师,都带来了新的挑战。在现有的条件下,也刚好可以把机器的优势,和人的优势,有效的做出结合。

机器去做个性化学习,人去做教学设计,做机器解决不了的复杂决策,情感激励,现场管理,引领创新….

我们也在做一些数据采集系统,我们目前还在起步阶段,但我们也希望能够达到美国国安局的一个口号:收集一切,分析一切,预测一切。

我们有哪一些东西可以预测的?举一个简单的例子,例如说有一道填空题,正确答案是5,然后有1000个学生,做完以后,我们发现有200个学生做出来的答案是2,那么我们就可以反向的去推,为什么有这么多的学生的答案集中在2?

那在这种情况下,我们其实就会反思自己的一些教学内容,我们是不是在讲的时候有一些应该区分的点没有区分出来,是不是应该进一步的细化,以此来对我们自己的内容进行一些优化,然后也更好的优化我们的个性化的推荐引擎。

对学习报告方面,我们也是给每个小孩子都会生成完全不一样的学习报告,这跟传统进公校的一些报告还不一样,我们生成的报告,是绝对个性化的,因为每个人做的内容,学习的路径,都是不一样的。然后我们也会生成不同层级的一些报告,例如说学生个人的某一个小组的老师的,学校的,然后以及我们总部的,对各种各样的一些数据进行分析。

为了迎合这样的一个学习模式,我们给老师设计了一个非常强大的一个教师端,我们可以做到什么程度?一个班级的学生在上课,老师只需要看电脑就可以看到学生当前进行到什么状态,在做哪一道题每道题的时间,我们会给他推荐,现在哪些学生需要你去看一下,去辅导一下哪些学生你可以现在去夸他一下了,然后这样的一些功能我们全部都添加上来,让老师尽可能做得轻松一些。

自适应学习不是简单的技术,仅有技术是不能够做成自适应学习系统的。技术不仅需要结合优秀教师的经验,还需要将以知识空间理论为代表的教育测量学以及大数据充分地结合起来,才能打造一个高效的自适应学习系统。

智适应教育设计的智能自适应学习引擎有五项核心模块:实时能力水平评估、精准知识状态检测、最优学习路径规划、最佳学习内容推荐、学生画像和学习内容侧写

我们会不停地收集学生的很多行为和做题数据,然后形成他的学生画像,我们也实时的进行能力水平评估,进行先行后行知识点及相关知识点的能力水平分析。学生做这一道题之前,我们并不知道它下一道题会推荐什么东西,所有的东西都是按照实时的做题数据在跑。进而准确地推送最适合于学生当前情况的学习路径和学习内容。

然后包括我们会有很精准的一个知识状态的检测以及最优的学习路径的规划,最核心的事情,知道下面最精准的一个落点在哪里。

在学生不断使用智适应学习系统的学习过程中,通过学生的数据反馈,智适应学习系统将不断通过大数据分析进行自动地或者人为手动的去调整知识图谱、试题内容、算法模型。

我们整个系统开发初始的时候,也做了很多的测试,我们在上海,在郑州,在其他的一些地方的一些公立校做测试,也拿我们的系统和友军的一些系统以及真人教学的效果进行一些对比,事实证明,我们还是有比较好的一些效果。

我们的整个愿景是希望能够点亮学生的知识星空,我们经常会把每一个知识点比喻成一颗星,然后学生每做每学完一个知识点,我们就会点亮她的一颗新星。目前我们才刚刚起步,人工智能和自适应学习,需要对于教学非常了解,需要强大的技术支持,也需要大量数据的收集、分析,需要很强大的教研团队。其难度,也远远不是这几页PPT可以表达的,任重道远,后续还需要继续白天脚踏实地,晚上仰望星空。

谢谢大家!

©️希鸥网原创内容。希鸥网是领先的创业社群媒体,平台活跃着近十万创业者和数百位投资人。免费为创业者发布创业故事、产品信息、融资新闻。小编微信zxx993394894(添加请注明公司+职位)

希鸥网是界面新媒体成员,除自己网站外,已入驻百度百家、搜狐科技、界面、网易新闻订阅、腾讯新闻订阅、今日头条、一点资讯、天天快报、创头条等平台。

相关领域
人物