专访丨首都师范大学远程教育研究所所长、数字化学习实验室主任方海光教授

专访丨首都师范大学远程教育研究所所长、数字化学习实验室主任方海光教授

2018年413日,教育部印发《教育信息化2.0行动计划》,提出要实施“教育治理能力优化行动”,充分利用云计算、大数据、人工智能等新技术,构建全方位、全过程、全天候的支撑体系,助力教育、管理和服务的改革发展。为了解大数据在教育领域的应用情况及发展潜力,本刊对首都师范大学远程教育研究所所长、数字化学习实验室主任方海光教授进行了专访。方海光教授兼任国家新闻出版广电总局融合发展重点实验室学术委员会主任、北京师范大学智慧学习研究院智慧学习首席研究员。

教育大数据是整个教育活动过程中所产生的以及根据教育需要采集到的、一切用于教育发展并可创造巨大潜在价值的数据集合

尊敬的方海光教授,您好!很高兴您能接受我们的专访。首先,请您谈谈什么是教育大数据。

方海光:大数据理念的传播逐渐使其不再是“象牙塔”中的雕塑,也不再是信息技术(IT)精英们追踪的并行算法的优化,更不再是创业咖啡厅中谈论的话题,今天的大数据的范畴和理解越来越普适化和大众化,甚至最初提出大数据概念的企业和精英们都会愕然其远远“漂移”出最初他们的设想和规划。这样的发展就是最正确的发展方向,因为大数据在逐渐落地,逐渐走入大众的生活,我们对大数据的理解也不再拘泥于初始的研究和技术的限制,经过不断的实践总结而遵循的实事求是和与时俱进,才是理解大数据的最好出发点。

实际上,大数据被认为不仅仅是一种技术,也是一种能力,即从海量复杂的数据中寻找有意义关联、挖掘事物变化规律、准确预测事物发展趋势的能力;同时,它更是一种崭新的思维方式,即让数据开口说话,让数据成为人类思考问题、决策行为的基本出发点。大数据经过互联网特别是移动互联网的加速发展,正在演变为一种社会文化方式,即人人生产数据、人人共享数据、人人热爱数据、人人管理数据的方式——这种文化正在潜移默化地影响着各个行业。教育领域虽然长期“保守”,但在大数据文化的冲击下,总有一些先知先觉勇于创新的组织和学校在加速走向开放、执着相信并热烈拥抱大数据。

简单地说,我们认为目前国内外对教育大数据有两种基本的定义,虽然界限不是特别的清晰,但是两种定义的出发点对实践的指导意义是完全不同的。

第一种教育大数据的定义是指大数据应用在教育行业中,可以翻译为“Big Data in Education”(简称为BDE)。这种定义特指教育领域应用大数据技术和方法,它强调了大数据及大数据技术在教育行业中的应用,是一种技术引导教育变革的基本想法。

第二种教育大数据的定义是指教育行业中的大数据,可以翻译为“Educational Big Data”(简称为EBD)。这种定义特指教育领域的大数据,即教育和学习过程中所伴随的各类数据的总称,它强调了教育行业本身特有的大数据带来的新方法,是一种通过教育应用技术解决问题的基本想法。

无论是哪一种定义,教育大数据的根本目标是一致的,即整个教育活动过程中所产生的以及根据教育需要采集到的、一切用于教育发展并可创造巨大潜在价值的数据集合。教育大数据直接产生于各种教育活动(教学活动、管理活动、科研活动、校园活动等),每个教育利益相关者既是教育数据的生产者也是教育数据的消费者。

教育大数据具有明确的目标指向性,即指向教育发展,能在提升教育质量、促进教育公平、实现个性化学习、优化教育资源配置、辅助教育科学决策等方面发挥有效作用。通过研究,我们认为,(教育大数据不仅仅是大数据在教育领域的应用;而是通过教育领域反向驱动大数据技术分化为独立的分支),从而带来了对传统教育技术领域长期研究问题的新解决途径,甚至可以跨越传统个性化学习的精确逻辑推理过程而直接分析全样本学习者特征。这样来促进教育管理科学化变革、促进教学模式改革、促进个性化教育变革、促进教育评价体系改革、促进科学研究变革等。

教育大数据是指全学习过程数据、教育大数据系统、共建共享思想

那么,教育大数据可以分成几个层面进行理解?

方海光:我们认为,无论是教育管理部门,还是校长、教师,以及学生和家长,都可以通过教育大数据获得针对不同应用的个性化分析报告。通过教育大数据的分析来优化教育机制,做出更科学的决策,这将带来潜在的教育革命。谁能在其中把握好大数据,谁就能在将来的竞争中赢得主动权。

一方面,在数字化课堂教学过程中,可以对学习过程进行数据形式化采集和描述,并基于课堂单元和学期单元进行学习过程的大数据挖掘和分析。教师通过这些数据和分析结果,可以即时进行教学控制和教学反思,从而提高课堂教学水平。学习者通过这些数据和分析结果,也可以尽快发现自己学习中的不足,进而提高学习水平。

另一方面,对于不同层面的决策者,教育大数据都会带来惊喜。对于教育行政部门、学校而言,教育大数据将帮助他们在管理行为上做出更加科学而非经验判断式的决策;对于教育研究者来说,他们能够重新审视学生的需求,通过高新的技术以及细致的分析,探究怎样的课程、课堂、教师能够更加吸引学生;对于学生而言,新技术能够解放他们本来就有的学习能力和天分,人力资本将成倍地增长。 

总之,教育大数据将让学习变成一种服务。我们对教育大数据有三个层次的理解:第一个层次,教育大数据是指全学习过程数据;第二个层次,教育大数据是指教育大数据系统;第三个层次,教育大数据是指共建共享思想。

也就是说,教育大数据是面向教育全过程的多种类型的全样本的数据集合。教育大数据不仅是分析全过程学习数据,还是建设教育大数据中心,更是一种共享的生态思想。

教育大数据和大数据一样同样具有4V特性①,传统数据收集方法注重收集结构化数据(如学籍、财务、分数等),而常常忽略非结构化数据(如环境信息、个人化信息等)和一些暗含着数据的资源。与用传统方法收集的教育数据相比,教育大数据有更强的实时性、连续性、综合性和自然性,并使用不同的应用程序来分析和处理不同复杂程度和深度的数据。传统教育数据收集的大多是阶段性的数据,而且大多在用户知情的情况下收集,使用的分析方法也通常是简单的统计分析方法。教育大数据收集的是整个教育教学过程中静态和动态的所有数据,可以在不影响教师和学生活动的情况下,连续记录整个教学活动的所有数据,如教学资料、互动反映和学生在每个知识点上停留的时间等。

教育大数据应用是一个生态环境,有提供技术的,有提供分析的。在技术产品之外,教育大数据的生态环境推广模式也十分重要,如何与教育信息化建设相对接,如何与智慧教育相融合,这些都是亟待考虑的问题。基于教育大数据的思想,可以产生一种不同于商业互联网的模式,一种能够平衡教育和技术使用的模式,特别是未来可以考虑的是数据分享、共建共享的模式。

教育资源的信息化共建共享,就是要通过互联网把教育资源进行数据整合和优化配置,让优质教育资源形成一种流动的良性循环,让分享和贡献资源的渠道越来越多,让学习资源发挥的效用越来越大,受用地域和受用人群越来越广,最终形成一个互通有无、交流共享、共同提升的教育资源信息化共建共享群体生态环境。在这个群体生态环境中,学习者可以通过文字、图片、音视频等不同方式实现知识学习的目的,教学者可以通过多元数据库工具、远程教学平台、多媒体教学设备实现教学管理的目的,并形成教育大数据支撑的个人学习反馈、学习中心汇聚分析、教育治理共享决策,从而构建更加人性化、个性化的交互式网络学习环境,使得整体教育大数据生态环境良性发展起来。

教育数据挖掘技术、学习分析技术、数据可视化技术、决策支持技术是教育大数据的关键技术

教育大数据存在哪些关键技术?

方海光:2012年,美国联邦教育部发布了题为《通过教育数据挖掘和学习分析技术来提高教与学:问题简述》的报告。该报告特别强调了教育数据挖掘和学习分析技术两大类技术应用。根据该报告的观点,在采集和处理教育数据后,就要对其进行深度价值挖掘,这里主要用的是教育数据挖掘和学习分析,之后教育大数据的需求和发展越来越系统化了。随着近些年教育大数据积累、分析和挖掘应用增多,诸多新的主题成为发展的关键技术,例如:数据如何呈现,数据如何进行科学治理,数据如何变现,数据如何剖析。其中,数据可视化技术和决策支持系统也伴随着教育大数据的发展成为主要关键技术之一。因此,我们认为目前教育大数据的关键技术主要包括四类:教育数据挖掘技术、学习分析技术、数据可视化技术、决策支持技术。

第一,教育数据挖掘技术是一个将来自各教育系统的原始数据转换为有用信息的过程,这些有用信息可为教师、学生、家长、教育研究人员以及教育软件系统开发人员所利用。传统教育数据挖掘的多是结构化、单一对象的小数据集,其挖掘更侧重根据先验知识预先人工建立模型,然后依据既定模型进行分析。对于非结构化、多源异构的教育大数据集的分析,往往缺乏先验知识,很难建立显式的数学模型,这就需要发展更加立体化、全息高维的数据挖掘方法与技术。

第二,学习分析技术是指通过测量、收集、分析、汇报学习者和他们所处环境的数据,以理解和优化学习以及学习发生的环境。学习分析和教育数据挖掘密切相关,应用的分析方法也较为相似。学习分析是综合运用信息科学、社会学、计算机科学、心理学和学习科学的理论和方法,通过对广义教育大数据的处理和分析,利用已知模型和方法去解释影响学习者学习的重大问题,评估学习者学习行为,并为学习者提供人为的适应性反馈。例如,教师和学校根据学习分析的结果,调整教学内容、对有学习失败风险的学生进行干预等。学习分析一般包括数据采集、数据存储、数据分析、数据表示和应用服务五个环节。

第三,数据可视化是关于图形或图形格式的数据展示。在一个连贯而简短的报告中体现大量的信息。数据可视化不仅涉及数据的使用,而且能可视化各种各样的信息,你可以将自己的想法、猜想与他人交流。人类已经使用数据可视化技术很长一段时间了,图像和图表已被证明是一种有效的方法来进行新信息的传达与教学。信息的视觉化表达是一种古老的分享创意与体验的方法。图表和地图是一些早期数据可视化技术的重要例证。有研究表明,80%的人还记得他们所看到的,但只有20%的人记得他们所阅读的。数据可视化甚至可以把思想和事件传给后代。技术的发展进一步提高了数据可视化带给人们的机遇。

数据可视化的最重要益处是能够帮助人们更快地理解数据。你可以在一个图表中突出显示一个大的数据量,并且人们可以快速地发现关键点。如果以书面形式呈现,那么可能需要数小时来分析所有的数据及联系。

此外,有效展示巨量数据的能力是数据可视化的另一个优点。一张图表可能会突出显示一些不同的事项,人们可以在数据上形成不同的意见。这自然能为商业开辟新的途径。人们或许能从数据中发现一些意想不到的东西。数据的可视化展示,提高了解释信息的能力。从海量的数据和信息中寻找联系并不容易,但是图形和图表可以在几秒内提供信息,一望便知。

第四,传统的决策支持技术是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它是管理信息系统向更高一级发展而产生的先进信息管理系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。而教育决策支持技术则主要是利用分析模型分析教育管理信息系统里所有的教育大数据,为教育决策者提供一些备选方案,以提高教育政策的质量,进行有效的计划评价和监督的技术应用。

技术挑战和伦理道德、数据安全和知识产权方面的挑战需要进一步克服

您认为在教育大数据发展的过程中,面临哪些挑战?

方海光:虽然教育大数据处于高速发展阶段,很多技术还会层出不穷地从各个方面支持教育大数据发展,使得教育大数据呈现出各种特色应用和成果,但是,教育大数据还面临诸多挑战。

一方面,教育大数据在整体发展和实际应用过程中还存在很多技术挑战。如:如何平衡学生的发展不确定性和教育大数据决策的指向性;如何平衡学习规律的研究和学生个人数据的隐私性;如何在数据采集、数据挖掘及学习分析的重要环节把握好数据源的真正内涵;面对海量教育数据,数据的存储、处理和分析都存在技术挑战;另外,由于目前没有统一的数据规范,不同系统之间的兼容也是一大问题。从全局考虑,我国的教育大数据系统应遵循顶层设计原则,由国家对数据格式、数据存储等问题制定统一规范,下级企业、学校按照统一规范去设计自己的系统,这样可以从全局高度最大化地节省国家资源,这也带来了更多的新的技术挑战。

另一方面,教育大数据还存在伦理道德、数据安全和知识产权方面的挑战。教育大数据关系着学习者和教育工作者的隐私权,其潜在的安全隐患无法用常用办法评估,甚至无法通过独立的方法进行评估。如果教育大数据处理不当,将导致严重的安全漏洞,甚至会影响区域教育政策的制定。此外,数据的权属问题不是传统的财产、知识产权等可以涵盖的,数据可能成为国家间争夺的资源。教育大数据是一种无形资产,国家和教育部门不仅应当保障教育大数据不外泄、不被恶意使用,而且还要兼顾部分数据向公众开放,发挥数据应用的社会价值。

教育大数据应用前景广阔,精准教育、精准教学、个性学习必将给教育带来根本性的变化

在教育发展的新时代,教育大数据有哪些典型应用?

方海光:我们在日常生活中已经习惯了一些教育大数据应用的场景。比如,在一个亚马逊的学习网站,研究者可以通过大数据分析学习者在学哪一章节,“你可以了解到他是否在回过头再看之前的章节,或者他在哪一个章节看的时间更多等”。教学者可以通过对学习者行为的分析,改善教材、改善学生学习的方法,使学生在整个教育环境中有更好的发展。

在个性化英语教育领域,传统上教师需要花费大量时间分析个体学生的学情动态,逐一制定相应的教学解决方案,因此,备课时间和教学成本较高。但“教育大数据”让这一切变得更简单了。以培生集团最新出版的全球少儿美语旗舰课程“Big English”为例,这套课程引入了首款应用于少儿英语学习领域的“My English Lab”在线学习辅导系统,应用大数据技术全程实时分析学生个体和班级整体的学习进度、学情反馈和阶段性成果,从而及时找到问题所在,对症下药,实现对学习过程和结果的动态管理。

近期以来,一个名为“Knewton”的自适应学习平台逐渐被人们所熟知,它集数据科学、统计学、心理测量、内容绘图和机器学习于一身,旨在最大限度地实现个性化。平台可以对学生的学习表现和活动完成质量给予及时反馈,以在正确的时间、基于正确的内容提供合适的学习指导,来最大化学生获得学习内容的可能性;同时,基于给定活动的完成情况,自适应学习系统应能持续性地逐步引导学生进入下一个活动。“Knewton”系统无论最终成功与否,它都已成为教育大数据具体应用的一个典型自适应学习案例,具有很好的参考意义。

北京市在雾霾红色预警期间,市教委提出中小学“停课不停学”,对于自觉和主动性较弱的基础教育阶段的学生来说,自学和家庭辅导英语有一定困难,教师教学也面临挑战。由于大数据时代在容量、速度、多样性和价值等方面的突出特点,不仅为广大师生提供海量资源,还可以提供个性化定制、学习行为记录和课程详情分析服务。大数据技术使得学习行为的记录更加完整和精细化,它可以准确记录每一位用户使用学习资源的过程和细节,例如:浏览资源的时间点、停留了多长时间、答对了多少道题、资源的回访率等信息。教师可以通过这些大数据量化总体的学习状况以及每个学生的学习进度,精准掌握总体和个体的学习情况和效果,从而调整自己的教学。教师可以利用大数据平台在雾霾期间尝试翻转课堂,并结合大数据提供的信息进行教学分析及教学反思。

在学校大数据学情分析分级管理中,山西省太原十二中学通过全年级各班各学科教学情况、学生的学习情况,重新审视课堂和教学过程,为年级整体教育教学情况提供一个找出问题、分析问题、解决问题的依据。这样的数据分析,不是为了评判一个教师的水平高或低、好或坏,而是要对教师的教学进行数据分析,帮助他们发现自己在教学中存在的问题,找出其所教授的不同班级的学习特点,不同学生的学习特点,以及所教授学科各知识点的落实情况,进一步提高教育的精准性,提高教师的教学效率和水平。

在学校大数据智慧治理决策中,辽宁省沈阳市第四十中学也在进行具有挑战性的创新应用,将建校理念融入学校大数据平台建设,将学生学习过程数据、测试数据、个人能力数据与学生画像基础数据进行综合分析和挖掘,为学校教育教学科学决策、教师教学能力提升、学生个性化学习指导、家校协作共同体建设等多方面提供决策依据,实现学校跨场域的智慧校园建设新模式。

通过以上不同场景的应用案例,我们可以发现以往发现不了的教育教学规律,找到以往没有办法找到的学习薄弱环节,解决以往教育教学过程中无法解决的问题,甚至可以指导教师更专业的职业成长,通过大数据跨场域整合实现深度融合的智慧校园创新特色应用。

因此,通过教育大数据带来的精准教育、精准教学、个性学习必将给教育带来根本性的变化,教育大数据让教师的教学过程和学生的学习体验变得更轻松、更有效。

注释:

4V特性指规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value)。

来源:世界教育信息杂志2018年第09期

转载请注明来源:世界教育信息微信公众号

相关领域
人物