教育学论文

您当前的位置:学术堂 > 教育论文 > 教育学论文 >

教育数据分析的三个层次分析

来源:教育导刊 作者:郑焕
发布于:2020-03-13 共8480字

  摘    要: 在大数据时代,很多国家已经把教育大数据的重要性提升到国家战略层面,目前人们主要是从技术的角度研究教育大数据。基于教育数据的特殊性,从专业发展内涵的角度研究教育数据分析,提出教育数据分析的三个层次:第一层是基于个别指标的分析;第二层是基于模式的分析;第三层是基于对象的分析。探讨每个层次的特征及其在教育领域中的使用,以便人们对教育数据分析的专业发展内涵有清晰的结构化认识。

  关键词: 教育大数据; 指标分析; 基于模式的分析; 基于对象的分析;

  随着计算机的普及和信息技术的快速发展,数据的收集和处理方式也发生了根本性的改变,联合国在2012年发布的大数据白皮书《Big Data for Development:Challenges&Opportunities》中指出大数据时代已经到来,大数据的出现将会对社会各个领域产生深刻影响[1]。大数据的方法和技术已经成功地应用于商业、金融业和市场营销等领域。大数据得到了世界各国学术界、工业界和政府机构的高度重视。

  各国政府已经意识到发展教育大数据对提高教育信息化水平,加快推进教育现代化建设具有重要意义。各式各样的教育系统和教育信息数据库中积累了大量的数据,如果将大数据方法和技术应用于教育教学领域,就能从这些数据中挖掘出大量有价值的规律来指导和发展教育,从而促进教育教学决策的科学化。

  目前,大数据分析和教育产生交集主要有这六个领域:(1)课堂,生成性教学课堂即时反馈;(2)学生,学生成长记录电子档案;(3)教学,个性化学习智能数据处理;(4)教师,教师发展与评测;(5)管理,智慧校园教育管理;(6)决策,学业与职业抉择辅助。

  虽然很多国家已经把教育大数据的重要性提升到国家战略层面,但是人们对教育大数据的研究及使用依然是处于起步阶段。国内外关于教育大数据的文献主要是从技术的角度去分析大数据方法怎么应用于教育领域,文献中出现比较频繁的词是:数据挖掘、学习分析、智慧校园,表明人们关注的主要是如何收集更加详细的信息,并对这些信息进行有效管理,或者模仿大数据在商业中的应用模式,对某些教育行为进行数据挖掘。但由于教育数据的独特性,使这些应用很难得到推广,这个问题在基础教育领域更加明显。

  在大数据时代,我们需要重新审视教育数据分析的内涵和特征,才能更好地利用教育大数据。笔者通过文献研究发现,很少有文章从教育数据分析的专业内涵角度,研究它的目标、需求、方法和发展规律等等。限于篇幅,本文不能全面地论述教育数据分析的专业内涵。而任何研究领域的专业化都会经历从低层次到高层次的发展过程,本文尝试从层次性的角度来阐述教育数据分析的专业发展内涵及其在教育领域中的使用,以便人们对教育数据分析的专业发展内涵有更加清晰的结构化认识。根据笔者长期的实践和思考,本文把教育数据分析分为三个层次:第一层是基于个别指标的分析;第二层是基于模式的分析;第三层是基于对象的分析。下面分别对这三个层次进行论述。

  一、基于个别指标的分析及其使用

  基于个别指标的分析主要是指根据某些指标的实测值,判断其达标情况,或比较不同对象之间相应指标的差异。

  在教育测量与评估的发展过程中,人们很大程度上受自然科学领域测量方法的影响,习惯把测量的对象分解成不同的维度(或者影响因素),每个维度都有可量化的指标,然后设计相应的量表对这些指标进行测量并赋值。例如,最早的智力理论之一是英国心理学家和统计学家查尔斯·斯皮尔曼(Charles Spearman)在1927年提出的双因素理论。斯皮尔曼认为智力包含两个因素:一般智力,他称之为g因素;以及某个具体测试中包含的某种因素,他称之为s因素[2]。又如,我国教育部基础教育质量监测中心自2015年起,每三年一个周期开展国家义务教育质量监测工作,监测以四年级、八年级学生为对象。监测中心组织研发了义务教育阶段德育、语文、数学、科学、体育与健康、艺术六个学科领域的监测指标体系。其中,数学学业质量监测分为运算能力、推理能力、空间想象力、问题解决能力、数据分析能力等五个维度[3]。
 

教育数据分析的三个层次分析
 

  基于指标体系的测评是教育评价比较常见的形式,因此指标分析是教育数据分析的基础。在日常生活中,人们如果想了解一个对象的物理特征,常常只需测量该对象的几个物理属性即可。例如,只需测量一个长方体的长、宽和高,就可以知道它的大小。在教育领域,人们也常常通过个别指标来了解对象在某方面的发展水平。所以,基于个别指标的分析在教育领域中的使用比较广泛。基于个别指标的分析的有效性完全依赖于指标体系设计的科学性。或者说,基于个别指标的分析在多大程度上能说明问题取决于这些指标在多大程度上体现测量对象的真实属性。

  基于个别指标的数据分析主要用到描述性统计,也就是把原始数据组织并整理成更容易处理、更容易理解的形式,例如,把数据做成图表,描述数据的集中趋势等等。

  由于教育测量与评价在我国基础教育领域的起步相对较晚,许多教育工作者并没有接受过专业的测评培训,缺乏对学生测评数据的内涵的理解。所以,很多教育工作者对教育数据分析的认识仅停留在这个层次,认为教育数据分析就是计算各个指标值,然后对这些指标值进行比较或排名。

  教育数据分析的目的之一是向学生提供反馈信息,使学生能够将反馈融入学习过程,并让教师评估学生的学习需求,探索导致学生学习困难的原因。但如果对教育数据分析的认识仅局限于个别指标分析,就很容易导致对数据分析结果的使用简单化、片面化。虽然很多教育测评都有相应的指标体系,但由于指标体系中各指标之间的关联性不是很明确,人们使用测评结果的时候,往往只关注个别指标值。如,在现实中,考试成绩是学校教育中的主要数据,很多学校领导评价教师的教学质量的主要依据是考试平均分和优秀率(或上线率),教师评价学生的学业水平的主要依据是成绩排名。学校普遍缺乏对测评数据的二次分析,包括不同学生群体差异化分析,不同学科之间的配合情况分析,对结果进行适当的情境化分析,整体水平的稳定性分析等等。这样,即使测评的次数比较频繁,对改进课堂教学质量的效果也是很有限的。

  由于教育领域的数据主要涉及人的教育行为和认知发展,其结构的复杂性是商业领域的营销数据不可比拟的,因此基于个别指标的分析也容易导致人们误以为数据结果是抽象的、机械的、乏味的,与人性化教育相去甚远。很多教师面对这些数据结果往往无所适从,因为他们看不到任何规律,也缺乏结果使用的详细指导和说明。

  在使用基于个别指标的分析时,为了避免只关注个别指标或使用个别指标对整体作定性判断,首先要确保测评指标体系具有良好的结构,各指标解释的范围和程度要做明确的界定,数据分析结果的报告必须要清晰化、情境化、结构化,这样才有助于促进学生学习,并为教育系统不同层面的决策提供信息;其次,必须向教师提供深入的专业学习机会,提升教师实施测评和使用测评结果的能力。这样才能充分利用测评数据分析结果来改进教育教学。

  二、基于模式的分析及其使用

  模式是主体行为的一般方式,具有一般性、简单性、重复性、结构性、稳定性、可操作性的特征。

  与基于个别指标的分析相比,基于模式的分析主要是在数据分析方法和技术上的提升,也就是在数据的描述性统计分析和数据分类的基础上,通过更加科学的方法和先进的技术来分析数据的结构和寻找数据的内在规律。

  基于模式的分析主要有两种情况,一种是理论实验模式,另一种是数据挖掘模式。

  (一)理论实验模式

  理论实验模式主要是指先提出理论假设,然后通过实验数据进行论证。教育和心理现象中的数量关系与空间形式是非常复杂的,大量因素或变量很难清晰界定、关联性复杂多变,于是人们往往是先通过理论研究提出某种模型假设,然后设计实验来检验理论假设。检验的方式之一是定量分析,即通过收集样本资料,使用统计方法寻求整体性规律。

  这种情况的数据分析主要用到推断性统计,即运用概率与统计的理论进行分析、论证,在一定可靠程度上,对总体的特征进行估计或推测。推断统计主要内容包括概率与概率分布、参数估计、假设检验、抽样调查、方差分析、相关与回归分析、因子分析、统计预测、统计决策等。

  理论实验模式的使用在学术界比较常见,因为实验是教育与心理研究的一种重要实证方法。例如,在认知能力研究中,心理学家们从各种不同的角度对人的智力提出假设,然后通过因子分析方法来确定智力不同的维度,形成了众多不同的理论。

  国际上标准化教育测评的发展趋势是除了测试学生的学习成果,还通过问卷调查的形式收集可能影响学生学习成果的信息,包括学生家庭背景、个人能力及态度、教学的组织形式及传达效果、学校实践及教育系统的特点。然后从学生、教师、学校和教育系统等层面对测试结果进行深层次分析[4]。这一类数据分析从技术方法的角度也属于理论实验模式的范畴,因为标准化教育测评首先必要有一个明确的理论框架,所有的数据分析都基于该理论框架,例如,不同学生群体的学业成就差异性分析,不同影响因素与学业成就的相关性分析等等。

  理论实验模式的使用比较容易忽视的一个问题是:统计分析方法前提条件的充分性。因为推断统计往往是建立在逻辑严密的概率与统计理论上的,每种统计分析方法都受到一定条件的限制,例如,进行方差分析的前提条件是:总体服从正态分布、变异的相互独立性、各实验处理内的方差要一致。如果不能满足某种统计分析方法的前提条件,原则上是不能进行这种分析的。在实际使用中,许多人往往不太关心前提条件的充分性,只在乎结果是否符合预期的目的。

  另外,因为理论假设一般都有严谨的逻辑结构,所以理论实验模式对数据质量的要求比较高。数据质量是指数据的完整性、一致性、准确性。在数据收集过程中,被试可能会受到一些不相关因素的干扰,导致某些数据产生偏差。为了保证数据分析的科学性和合理性,必须进行前期的数据清理工作,主要是对错误或异常值、缺省值进行处理。

  (二)数据挖掘模式

  数据挖掘(Data Mining)指从大型数据库中提取出有意义的、隐含的、先前未知并有潜在价值的信息或模式的非平凡过程[5]。这里的数据挖掘模式主要是指数据挖掘在教育领域中的应用。

  教育信息化的发展,特别是网络教育资源的开发,导致教育领域的数据迅速增长,常规的数据分析方法已经很难应对海量的数据和复杂多变的数据类型。于是人们开始研究如何把已经成功应用于商业、金融业和市场营销等领域的数据挖掘方法应用到教育领域中,目的是从教育大数据中挖掘出对教育者和学习者有用的信息,发现数据中隐藏的教育规律和模式,提高教育管理绩效和学习效率。

  教育数据挖掘常用的技术方法有分类分析、聚类分析、贝叶斯模型、关系挖掘和用模型来发现数据中有意义的信息。

  在大数据时代到来之前,教育数据分析主要是属于教育统计学的范畴,教育统计学是对教育现象进行定量分析的统计学与教育学互相融合的交叉学科。现在教育数据分析又与数据科学这个新兴的研究领域产生融合。并且这种融合不仅仅是技术上的,还有思维上的。例如,数据挖掘应用于教育领域,不但丰富了教育数据分析的技术方法,也给教育数据分析带来了新的视角。

  数据挖掘应用于教育领域的一个典型案例是在线学习系统的研究和开发。研究者通过采集学习者与在线学习系统的交互数据,包括学习者系统应答正确率、回答问题花费时间、请求帮助的数量和性质,以及错误应答的重复率等,这部分数据可以是课程层面的、学习单元层面的或知识点层面的。通过数据挖掘和分析,构建学习者知识模型,然后通过自动或人工反馈,为学习者在合适的时间,选择合适的方式,提供合适的学习内容[6]。这方面的研究为将来实现大范围的个性化学习提供了技术上的保障和发展的方向。这些学习者信息在传统课堂中是很难收集的,并且如果不借助大数据的技术方法,很难从这些数据中挖掘出对学习者有用的信息。

  虽然数据挖掘在某些教育情境中的应用已经有成功的案例,但是数据挖掘在教育领域所产生的效益还远远比不上其在商业领域中的应用。因为教育领域许多对象的属性难以量化描述,大多数量化信息也具有隐含性和模糊性,很多情况下即使通过数据挖掘能够获知学习者的行为方式,也很难解释学习者产生这种行为的原因,从而提不出合理的预测和解决方案。这需要人们站在更高的层面来整合教育领域的知识、方法和行为,从可量化的角度去理解和分析教育的内在规律,才能使得数据挖掘更好地为教育教学服务。

  三、基于对象的分析及其使用

  基于对象的分析是指把相关的数据和方法组织为一个整体来看待,从更高的层次进行系统建模,使分析结果更贴近事物的自然运行模式。简单来说,就是用什么数据和什么方式来描述和分析一个对象。对象可以是客观世界中存在的人、事、物体等实体,也可以是行动或思考时的目标。对象可能包含各种属性的指标、各种行为方式的一个或多个模型,关键是如何把这些构成统一的整体。从教育评价的角度,就是要关注活生生的人、把学校看作一个有机的整体。

  基于个别指标的分析主要是分析对象的某些属性;基于模式的分析主要是分析对象的结构特征或某些行为方式。虽然基于模式的分析经常会建立各种模型,这些模型也可以看作一个对象,但很多时候建立模型(对象)不是最终目的,最终目的是这个模型是否能解释或解决现实问题。而基于对象的分析不完全是为了解释某些现象,主要是为了促进对象的发展。因此,与前面两个层次相比,基于对象的分析更多的是观念的提升,其次才是技术水平的提高。所以教育数据分析的第三个层次主要是回归教育的本质,但这并不是抛开数据,回到经验主义,而是在充分的数据分析的基础上,思考如何培养人,如何促进人的发展。有些人可能认为这是数据分析结果使用者考虑的问题,数据分析只需提供相关结果。但笔者在实践的过程中意识到,如果没有经历数据分析的过程,就很难对数据的内在联系形成深刻的感受,从而很难产生对数据的洞察力。同样,如果数据分析工作者不具备一定的教育学和心理学的学科素养,就很难理解教育数据背后的含义,从而导致数据结果很难说明问题。所以,只把教育专家和数据分析师撮合在一起很难解决教育领域的根本性问题。

  基于对象的分析在技术方面的提升主要是教育领域人工智能的研究及应用,也就是尽可能模拟人类的思维方式,使得数据分析尽可能接近人类认识世界、解决现实问题的方法和过程,呈现的结果尽可能与客观世界中的实体相一致。但基于对象的分析也不是完全依托人工智能,因为人工智能侧重的是机器模仿人类的思维方式解决现实中的问题,而不是让机器来研究人如何培养。人工智能主要是在解决问题的方式和方法上给教育数据分析带来新的视角,促使教育数据分析朝着智能化的方向发展,这样产生的分析结果更加容易被人们接受。即使教育领域完全实现了智能化,关于人的发展的问题又将会面临新的挑战。因此,基于对象的分析不是在技术层面就能完全解决的问题。它是一个螺旋上升的过程,在这个过程中需要不断提升理念,牢牢抓住问题的本质,综合使用多种数据来源,从不同的角度对目标对象进行分析。虽然很多时候我们还不能对目标对象建立完全的模型,但是通过不同角度的综合分析,我们可以对目标对象形成相对完整的感知,并在这个基础上做出相对合理的判断或决策。所以,基于对象的分析并不一定是要给目标对象建立一个独立的模型,而是要以目标对象为中心开展相对全面的分析,并在分析的基础上形成对目标对象的整体性认识或者认识的深化。

  目前,在教育领域中基于对象的分析的案例还比较少,但人们已经逐渐意识到这方面的重要性。例如,经济合作与发展组织(OECD)在研究国际化的教育测评发展趋势时指出:“评估和测量的全部潜力只有在框架被完全整合并被视为一个统一整体时,才能实现。这需要一个整体的方法来建立一个统一的评估和测评框架,以期在其组成部分之间产生协同作用,避免程序重复和目标不一。”[4]测评框架的整体性其实就是要以测评对象为中心,使用多种方法整合对象各方面的信息,做出整体上可靠的判断。

  使用基于对象的分析的一个典型案例是智慧校园建设。智慧校园建设是以学校为对象,通过信息化手段有效集成、整合和优化校园内各类资源,实现资源的有效配置和充分利用、校务管理过程更优化协调。2018年6月,国家市场监督管理总局中国国家标准化管理委员会公布了《智慧校园总体框架(GB/T36342-2018)》,对智慧校园的总体架构及建设进行了明确规范。从文件中的智慧校园总体架构图(如图1所示)可以看出,数据处理与数据管理是总体架构的核心,为智慧校园的各类应用服务提供驱动和支持[8]。在智慧校园的总体架构中,数据分析是为了促进学校各组成部分的协同发展,而不仅仅是为了解决某一方面的问题。

  图1 智慧校园总体架构图
图1 智慧校园总体架构图

  面向未来的智慧校园是教育信息化发展的主要趋势,但目前还处于技术实现阶段。如果不站在较高的层次来审视教育领域的问题,那么很多技术性的工作只是达到提高效率的目的,而没有解决人在高效的环境中如何更好发展的问题。例如,许多教育科技公司推出的智慧课堂对知识的呈现确实比传统课堂要高效和丰富,课堂表现的反馈也更加及时。但学生对知识能内化多少、能力比以往是否有大的提升,这些很多时候只是停留在人们的想象中,还缺乏充分的实证研究。高效有时候带来的只是疲于应对更多的信息来源,而没有闲暇思考这些信息的内涵与功能。

  基于对象的分析要避免面面俱到的分析方式,类似于数学建模的过程,数学模型一般不是反映现实问题的一切具体特征,它的建立常常既需要人们对现实问题做细微的观察和深入的分析,又需要人们对事物特征和变化规律进行简化和抽象,使得模型更普遍、更集中、更深刻地描述事物的特征。面面俱到的分析往往容易使人纠结于一些非本质的细节,失去对主要关系的把握,从而觉得问题无章可循。

  四、结语

  本文主要是从教育数据分析的层次性角度理清技术、方法和观念之间的关系。在实际应用中,这三个层次并没有绝对的优劣之分,只是在不同的需求和情境中发挥各自的作用。例如,如果只是判断一个学生的体重是否正常,可能基于这项指标的分析即可。另外,这三个层次通常是相互转化、相互依存的。例如,基于模式的分析建立好一个预测模型后,在模型使用过程中,可能只需计算相应的指标值(或参数),然后代入模型即可进行预测;而基于对象的分析往往也需要计算各种指标值,或建立各种模型。

  无论人类社会发展到什么程度,都不可能完全解决人的发展的问题,从不同的方面、用不同的方式解决教育领域中的问题将是一个长期的过程。但在这个过程中,关注研究对象的整体性将对教育数据分析工作起到引领性的作用。

  教育数据分析的第三个层次主要是体现了教育领域的特殊性。与一般的商业行为不同,教育行为的最终指向是人的发展,而人的发展是一个缓慢且复杂的过程,很难有快速的投入产出模式。这是目前为什么很多大数据方法在教育领域没有产生明显效益的原因之一。而这里也关系到教育数据分析的人才需求和培养。在很多行业,做数据分析可能只要熟悉相关的业务,和掌握一定的大数据分析方法或工具即可。但在教育领域,只熟悉相关业务和掌握大数据分析方法或工具很多时候还不够,必须要对人的发展规律有较广泛的了解和深入思考,形成一定的教育直觉,才能从数据中分析出更多有用的信息。正如耶鲁大学计量经济学家伊恩·艾瑞斯所说:“超级大数据分析的崛起并不意味着直觉判断的消亡,也不是说工作中累计的经验不重要。相反,我们将看到一个崭新的时代:最优秀、最聪明的人对于运用统计与直觉都游刃有余。”[9]例如,进行教育测评数据分析时,如果只是熟悉教育测评流程和数据统计要求,并掌握了相关的统计方法和工具,而对数据的内涵没有深入的理解,可能得出的数据结果很难有效地说明问题或解决问题。当我们从培养的人的角度重新审视教育测评,就会发现很多结果不是那么绝对的,我们应该在结果相对可解释的范围内寻求改进教学的更有效的方法,而不是给事情下定性的结论。所以,教育数据分析的人才需求和培养必须结合教育领域的特殊性,才能充分发挥教育大数据的价值。

  在大数据时代,教育数据分析的涉及面将越来越广,可能还有很多领域没有关注到,笔者将在后续的研究中加以完善。

  参考文献

  [1]United Nations Global Pulse.Big Data for Development:Challenges & Opportunities[DB/OL].(2012-05-01)[2019-11-25].http://www.unglobalpulse.org/sites/default/files/BigDataforDevelopme nt-UNGlobal Pulse June2012.pdf.
  [2](美)罗伯特·M.桑代克,特雷西·桑代克-克莱斯特.教育评价(第八版)[M].方群,吴瑞芬,陈志新,译.北京:商务印书馆,2018:399.
  [3] 教育部基础教育质量监测中心.中国义务教育质量监测报告[R].北京,2018:1-9.
  [4][7]经济合作与发展组织编.为了更好的学习---教育评价的国际新视野[M].窦卫霖,等译.上海:上海教育出版社,2019:87,108.
  [5]李婷,傅钢善.国内外教育数据挖掘研究现状及趋势分析[J].现代教育技术,2010(10):21-25.
  [6]徐鹏,王以宁,刘艳华,张海远.大数据视角分析学习变革---美国《通过教育数据挖掘和学习分析促进教与学》报告解读及启示[J].远程教育杂志,2013(6):11-17.
  [8]中国国家标准化管理委员会.智慧校园总体框架(GB/T36342-2018)[S].
  [9](美)伊恩·艾瑞斯.大数据思维与决策[M].宫相真,译.北京:人民邮电出版社,2014:18.

作者单位:广州市教育研究院
原文出处:郑焕.教育数据分析的层次性及其使用[J].教育导刊,2020(01):35-41.
相关内容推荐
相关标签:
返回:教育学论文