如何促进的教育改革如何促进教育的发展

2022-05-10 版权声明 我要投稿

摘要:本文提出了“证据驱动的教育改革”的基本概念和基本原理,比较了证据驱动的教育改革在中国、美国、英国的发展状况,指出了证据驱动的改革可以帮助各国学习如何让证据在教育决策中发挥更加重要的作用,并提出了促进全球证据驱动的教育改革发展的建议,可供各国学者参考。

关键词:证据驱动的教育改革;实验;国家比较;元分析;研究设计

证据驱动的教育改革(Bridgeland&Orszag,2013;Gueron&Rolston,2013;Slavin,2008,2013,2017,2019;Slavin&Cheung,2017b)特指教育工作者及政策制定者将关于有效性的证据作为标准,遴选各类教育方案、教育产品及教育实践。有效性的证据要基于严格的教育实验,其会持续较长时间(例如一个学期或更长时间),实验组学生将与使用传统方法的控制组学生比较成绩。理想情况下,学生、教师或学校会被随机分配到实验组或控制组(Bucks&McGee,2015;Gueron&Rolston,2013)。最低要求是需要实验组和控制组学生在成绩、人口统计学变量等前测中是匹配的。需要注意的是,该定义并不是为了简单地传播关于有效教育实践的一般性原则,因为这些信息通常不会对实践或结果产生多大影响(如,HemsleyBrown&Sharp,2003;Weissetal.,2008),相反,该定义是指支持使用某些特定方案的改革,这些方案通过与控制组对比进行评估,结果发现是有效的和可复制的。

尽管证据驱动的改革会用到所有类型的研究方法,但是能够与常规实践相对比以确定创新方法效果的独特工具,正是实验或准实验研究。在教育实验中,学校、班级、教师或学生被随机分配到采用创新方法的实验组,或继续采用常规实践的控制组。准实验与实验具有相似性,但准实验没有采用随机分配,而是根据先前成绩和其他因素匹配学校、班级、教师或学生。在这两种情况下,分组的水平都很重要。在学校水平随机分配或匹配是最理想的,因为在学校内部进行随机分配或匹配时,往往会担心实验方案外溢的问题。例如,控制组教师可能会听说实验组采用的新方法,并开始在自己的课堂上使用。然而,在学校、班级、教师水平进行分组时,结果分析必须将数据的不同水平考虑在内,因此在学校水平分组的研究通常需要40至50个单位(学校或班级)。这里不会详细讨论具体方法,重要的是想表达,大多数实验和准实验由于使用分层数据而具有相当大的规模。

一、证据何以重要

为什么关于有效性的证据应成为选择教育产品和服务的主要标准?最重要的答案就是,按照验证性研究中的方式实施具备强有力证据基础的方案,很可能会给学生带来更好的成效。而且,将证据作为选定方案的基础,将会使教育进入到创新、评估和逐步改进的良性循环,就像医学、农业和技术领域的转型一样(Haskins,2014;Kolada,2013)。证据驱动改革的核心是一个简单的理念,这意味着要囊括四项基本行动(Slavin,2013):

1.使用严格的实验方法评估创新方案,为每个科目和每个年级找出最有效的方案;

2.使教育工作者和政策制定者了解行之有效的方案和实践;

3.提供资源和激励措施,使学校领导能够实施行之有效的方案和实践;

4.制定政策和制度,不断积累有关知识和有效实践。

这四项原则支撑着许多大规模、快速且持续发展领域的政策和实践。例如,在过去的一个世纪中,医学和公共卫生领域的惊人进步归功于循证医学,在这一领域,政府大力支持新药物、新技术、新设备和公共卫生政策的研究与开发,资助检验他们有效性的严格评估,并主动推广被证明有效的治疗方案和有关政策。结果是,中国和其他国家的人均预期寿命显著增长,疾病得以治愈,预防措施(例如天花疫苗)得以制度化。

在农业领域,类似的转变已然发生。在中国,稻米生产效率的提高(过去50年来每公顷生产率翻了3倍)改变了人们的生活。这些以及其他农业领域的进步,正是源于科学家开发和检验新种子、新肥料和新害虫防治方法,以及改良动物品种、兽医方法、饲料等。因为有效的方法已经过科学证实,所以它们被推广给农民,从而使得农业更加高效、更有利润,并解决了国民的吃饭问题。技术、工程和其他许多领域的进步都遵循相同的模式,即研究、开发、评估和推广。

直到最近,教育领域在证据驱动的实践或政策方面仍然进展缓慢。然而这并不是教育不能像医学、农业、技术和工程一样,开始以严格证据为基础建立其政策和实践的理由。有人可能会说教育与医学或农业不一样,因为一种药丸或一种新品种的牛很容易复制,而教育创新总要涉及许多人在不同情况下行为的动态改变。然而,这种复杂局面也会出现在医学和农业领域,如医师在开展新药研发以最大程度地适应人类生活方式或服药方式的变化,农民使用新的耕作或水资源管理方式来提高产量。教育有其自身的证据基础来显示有效方法(如补习和合作学习)的积极作用和可复制性,因此人们没有理由认为这些经研究证明的方法不会对教育成果产生深远影响。

证据驱动的改革正在转变世界上许多地方的教育研究和实践。近年来,中国研究者也开始强调使用严格的证据来评估各类教育方案和实践。本文将首先讨论中国的实证教育改革,随后讨论证据驱动的教育改革在其他国家的发展,最后讨论中西方研究者和决策者的合作将如何有利于鼓励证据驱动改革的地区教育发展。

二、中国教育的实证改革

过去三十年,教育实证研究一直是中国学术界的关键词。在中国知识基础设施工程(ChinaNation-alKnowledgeInfrastructure,CNKI)中输入中文短语“教育实证研究”,会产生约5000篇包含该短语的文章。毫无疑问,过去二十年,教育实证研究在中国学术界得到了极大发展。例如,从1990到2002年,每年只有少数的教育实证文章研究发表,其中1990年仅有两份此类刊物,2002年仅有24篇文章。然而,自2003年以来,实证研究发文数量急剧增加,这表明实证研究思想已逐渐扎根于中国教育研究。

图1说明了基于证据驱动的学术文章的逐年情况。

在中国,从义务教育到职业教育再到高等教育,面向不同教育层次的研究人员都在使用实证研究方法。实证取向研究的题材和主题也很广泛,包括学生满意度、教育公平、教育财政、教育支出以及思想政治教育等方面。

最近几年,除了出版物的数量激增之外,中国学者越来越重视与教育实证研究有关的各种问题讨论。例如,华东师范大学作为中国教育科学领域的领导性高等教育机构,自2015年以来已连续举办教

育实证研究论坛。其中仅2019年第五届论坛便召集了全国众多学者并邀请国际知名专家参会。共有16所中国大学参与并共同组织了多场平行论坛,每个论坛侧重于将实证思想和方法应用于教育研究的一个特定方面,例如田野研究、案例研究、文本分析、视频分析等。许多亚领域正在采用实证方法,以使其研究结果更具有说服力和稳健性。

再如,南京师范大学教育科学学院与全球领先的高等教育机构(例如美国的约翰斯·霍普金斯大学和香港中文大学)联合组建了全球“卓越实证研究概述”(Best-Evidence-in-Brief)网络,旨在定期向中国和全球一线教育者传播基于证据的研究发现。每两周,学校行政人员、老师乃至家长可以通过“卓越实证研究概述”网络的成员大学,获取全球最先进的证据驱动教育研究成果,用以改善自身教育实践、提升教育质量。南京师范大学教育科学学院是中国内地第一个实施该机制的教育科学研究单位,该机制作为研究与教学之间的桥梁,能使一线教育者了解世界范围内可改善学生学习效果的最佳教育实践(http://www.cnbeb.org.cn:81/en/about)。

南京师范大学等中国大学也积极组织证据驱动研究的国际会议和论坛,其目的在于增强中国学者运用证据驱动方法进行教育研究的意识。例如,在2019年南京师范大学举办的“追求教育卓越的理念和行动”国际研讨会上,“循证”是出现最多的关键词。会议讨论的重点领域包括“国际循证研究的前沿”“循证教育研究的方法论发展”“中国循证教育研究与改革”“循证教育改革与发展”及“循证学校改进”等。

中国教育学会副会长、华东师范大学教育学部主任袁振国教授的观点代表了中国学者对证据驱动教育研究的重要性和本质的理解:实证研究是学科从思辨到科学的转折点;是学术深化的里程碑;是理论创新的支柱;是平息争论取得共识的唯一手段;是建立现代智库的可靠支撑(袁振国,2017)。

尽管实证研究的出版物迅速增多,但是许多中国学者仍然认为实证研究在中国教育学术界的研究成果中所占比例很小,而且许多人指出实证研究的发展速度不如非实证研究(谭翀,2017;王兴宇,2017)。王兴宇(2017)认为,实证研究除了要有坚实的理论基础外,还应该依靠收集的高质量数据和经过验证的统计方法来检验既定的教育假设,并论证教育投入和产出之间的因果关系和影响。另一方面,非实证的研究方法主要是基于个人认识对某教育主题的价值进行推理的理论性阐释,或对国外教育实践与政策的简单描述。还指出在五份《中国社会科学引文索引》(CSSCI)期刊的出版物中,即《高等教育研究》《清华大学教育研究》《中国高教研究》《北京大学教育评论》和《复旦教育论坛》,实证研究的文章仅占2012至2016年论文总数的20%(表1)。考虑到中国教育科学研究者的总产出,袁振国(2017)认为实证研究在所有出版物中所占比例低于10%。这些比例可能是准确的,在证据驱动研究占主导地位的美国和英国,可能也存在类似比例。因为证据驱动研究的花费很高,所以如果将硕士和博士论文包括在内,那么非量化研究的数量通常占比更大。但是,在美国和英国获得资助的研究中,严格的实验研究是最普遍的。

中国学术界已经采取的上述措施,以及对更多实证研究的呼吁,表明了当代中国教育研究者对下列议题的强烈兴趣:即理解全球证据驱动教育研究的发展、现状和实践,开展证据驱动研究的相关困难与可能的解决方案,以及中国自身如何在教育研究和改革中实施和应用证据驱动的理念。因此,2017年元月,共有14所大学和32种CSSCI期刊发布了“教育实证研究华东师范大学行动宣言”(以下简称《宣言》),内容涉及加强实证教育研究和促进研究范式的转变。《宣言》特别确定了未来几年为提高中国教育研究质量而应采取的十项措施,包括:

1.加强教育实证研究课程建设与青年教师培训;

2.提高教育实证研究论文的数量与质量;

3.办好全国教育实证研究论坛;

4.编译出版国际教育实证研究优秀成果;

5.集辑出版我国教育实证研究优秀论文;

6.改进教育研究成果评价标准;

7.加大教育实证研究项目比重;

8.设立“教育实证研究优秀成果奖”;

9.发布中国教育实证研究年度报告;

10.加大教育数据公布力度(华东师范大学等,2017)。

三、中国学界对教育实证研究的质疑

尽管许多中国学者开展教育实证研究的意识日益增强,但仍有人对其开展的可行性和影响政策的有效性持怀疑态度。以下总结了怀疑论者的一些观点。

一是关于“实证”的定义。一些学者认为,“实证”可以从狭义和广义两个角度来理解。例如,史静寰(2017)认为如果从广义上理解“实证”,即研究人员收集和观察相关数据以提出和验证假设,那么中国学术界一直以来都在从事“实证”研究。然而,如果从狭义的角度来解释“实证”,即使用程序化、操作化、量化方法得出某些教育和社会现象的结论,那么大多数中国的教育研究者并未从事实证研究。

关于“证据”的定义可能非常广泛,致使许多中国学者发表了文章,呼吁对基于证据的研究进行深度透视。例如,李均(2018)提醒到,实证研究不应落入“统计主义”窠臼。他指出,随着对开展实证研究愈发重视,有一种趋势将“实证”等同于数字和统计,他称之为“统计主义”。他认为,这种思路和方法“将教育研究过程简化为统计学的操作过程,而对难以量化的教育思想、价值和情感等采取排斥态度”。他将统计主义的特征概括为:“方法中心,问题边缘;数据中心,事实边缘;格式中心,思想边缘。”因此,他认为应该重新思考经验研究和实证研究的内涵。

王卫华(2019)回应了这一观点,他认为实证研究通常无法处理包括教育在内各领域中与价值相关的问题。他认为,价值关注人类的未来,特别是人们面对利益冲突应该做出的选择,而现有实证研究则倾向于关注当前现实,而忽略了人类的主观性和想象力。因此他认为,教育思辨研究应作为教育实证研究的前提,同时可以整合实证研究的发现。

同样,潘洪建(2018)认为有必要区分与实证研究或循证研究的近似概念。他认为,基于证据的研究不应等同于定量研究,尽管他承认量化是大规模基于证据的研究的基础。他认为,严格的定性方法可以验证某些假设,也可以使研究人员获得真实的证据,并有助于解决教育问题。他特别强调了产生新理论的扎根法和民族志研究的价值。因此,他认为,由于教育问题的复杂性和多维性,不应将教育研究降维至实证研究或定量研究。

二是收集真实证据的方法。其他一些学者对在教育环境中收集“真实”证据的可行性表示怀疑(刘选,2017;阳泽等,2019)。例如,阳泽等(2019)认为,尽管研究共同体理解开展实证研究(例如实验或准实验)的正常程序,但现实的教育环境可能并不总是允许严格执行这些程序,因为存在一些条件限制。他们列举了数据收集过程中经常遇到的一些困难,例如对高质量数据的访问受限、收集纵向数据的成本、收集数据的程序和标准不清晰,以及对研究人员的培训不足导致的数据收集质量较低。这些作者专门强调了从事数据收集的个人研究者面临的困境,并指出了其对数据分析和研究结论的负面影响。

类似地,刘选(2017)指出,由于实证研究通常认为任何概念只有在简化为个体经历的经验内容时才有意义,而教育本身涉及很多难以简化的复杂问题与抽象概念,因此,他对实证研究方法(例如使用量表)的可信性和有效性表示怀疑,即是否能有效地把握某些教育概念(如道德和幸福)的本质。按照刘选的观点,教育科学中的许多重要概念,例如教育目的、伦理和价值观,都难以量化和观察。因此,他坚信经验对于建立一套教育研究范式的重要性。

四、美国证据驱动的教育改革

美国的教育研究状况与中国有很多相似之处。教育研究长期以来使用多种方法了解教育政策、实践和成果。这些方法包括量化研究,例如实验、相关研究和调查,还包括质性设计,例如系统的观察、调查和访谈以及混合方法研究。像中国一样,在西方国家,所有这些类型的研究今天仍在全面推行。

然而,最近二十年的重大变化是,政府的政策高度关注通过教育研究工具来评估学校课程实践。这类研究不仅寻求智慧,而且致力于获得有效性的证据,从而直接让教育者和决策者了解一项方案或政策可能对学生成就的影响。这类研究的问题类似于:与常规实践相比,一项特定的教育技术方案对学生生物成绩有何影响;一项特定的学生分组策略对读写成绩有何影响;教授教师在数学课堂使用特定形式的合作学习会对学生学习有何影响?

对于这类问题,需要使用定量方法加以回答,因为这些都是“多少”的问题。理想情况下,研究会随机分配有关学校,教师或学生按照实验的程序,或留在传统上受教的对照组中。如果不可能进行随机分配,则可以在“准实验”开始时匹配学校、教师或学生。此类研究通常使用混合方法,包括观察或民族志,以增加对研究的理解,但主要重点是在学习或其他结果方面对一组与另一组研究对象进行定量比较。

政策对实验研究有利,原因是能为重要教育问题提供实际解决方案的研究受到政治上的支持。政策制定者更希望提高学生成就,而不是填满教育期刊的版面。各国对教育研究的资助普遍不足,然而有一类研究的发展进步使得对教育研究的资助达到了历史性水平,这就是能够为特定、可复制方法的有效性提供可靠证据的研究。如前所述,这类实验所采用的方法主要源于医学领域,由于坚持对新药

上一篇:保护非物质文化遗产和继承中国传统文化的方法下一篇:混合教学法基于Miller金字塔原理在内科护理教学中的应用