遵循循证原则制定教育政策_荟萃分析论文

遵循循证原则制定教育政策_荟萃分析论文

遵循循证原则 制订教育政策,本文主要内容关键词为:原则论文,政策论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

[中图分类号]G40—011.8 [文献标识码]A [文章编号]1002—4808(2007)07—0011—05

循证实践(evidence-based practice),也称为以证据为基础的实践或基于证据的实践,是近年来国外最热门的研究方法之一。循证教育(evidence-based education)已成为教育研究中最新的领域,[1] 美国总统布什在2004年底签署的美国2005财年预算资助九大研发优先领域中,针对教育的资助重点是要成功开发和执行2002年《不让一个孩子落后法》中提出了循证教育大纲和方法。[2] 循证已成为各种研究的最新方法,有循证教学、循证培训、循证政策等。

一 循证政策研究由来

(一)循证概念的提出

循证概念起源于“循证医学”(evidence-based medicine),这个概念是由英国威尔士的医学研究委员会流行病研究分会主任科克伦(Archibald Leman Cochrane)在1972年出版的《效果和效率:健康服务中随机问题的思考》提出的,该书对当时的医学实践提出了尖锐批评,指责当时医学实践中的许多诊治措施缺乏足够的证据。1991年加拿大麦克马斯特大学内科学系的顾亚特(Gordon H.Guyatt)在为美国内科医师学会主办的内科年报所撰写的一篇评论中首次提出了“循证医学”的概念。随着循证医学影响的不断扩大,医学中的临床实践、相关的健康领域各个方面以及健康政策和管理均广泛采取了循证的取向。短短十余年时间,循证医学席卷了整个医学界和全世界。在以后的10年里,循证医学的原则,在英国各个公共部门中以循证实践的名义被迅速和普遍地采纳,进一步发展出了循证实践的概念,并逐步应用到教育、教学、培训、政策等领域,成为一种跨学科的研究方法。

(二)循证政策研究

自20世纪90年代以来,循证政策(evidence-based policy)的概念在英国政界越来越得到重视。英国政府在1999年制订的“政府现代化”(Modernizing government)白皮书中明确采用了循证政策作为其行为准则:“本届政府对政策制定者有更多的期望。期望有更多的新思维,更主动地质疑传统的行为方式,更好地利用证据和研究的方法来制定政策,更多地专注于能产生长期影响的政策”。[3]

在教育领域中,近年来流行的质的研究或其他量化研究,不见得具有足够的说服力来对教育政策发挥影响,既往的一些研究也有其因果关系不明以及实证缺乏的问题,因而凸显了教育研究中证据不充分的困难,表明了急需突破困境、发展以证据为基础的政策的重要性。另外,由于近年来公众对于知情权的要求越来越强烈,公众并不像以前那样认为政府和专家制订的政策具有天然的正确性,而是要求政策的制订者提供足够的理由来说明为什么该项政策是正确的,以及该项政策实施后可能产生的效果。

虽然教育并不是一门有着严格逻辑关系的自然科学,但它的重要性不允许其政策的制订建立在不确定的理论基础上,不管这种理论是由政治家、教师、研究人员或其他人员提出的,因此教育政策的制订必须是建立在充分证据的基础上,同时在将证据应用到政策中时需要解决一些问题,如我们的理解与该证据的相关性如何,该证据的代表性、可靠性和依据如何,这些问题对于循证研究是至关重要的。[4]

二 循证政策中的证据

(一)证据的定义

证据是可以得到的事实或信息群组,用于表明一种理念或建议的真实性和有效性。因此证据的关键特征是其可获得性及有效性。[4]

(二)证据的种类

对政策制订和项目决策有影响的证据按照其性质可分为四类,即描述性资料、分析性资料、评估性资料和政策分析预测。[5]

1 描述性资料

长久以来,一些经济学指标如日常生活消费水平、税收状况、股票市场情况、失业状况、福利状况、贸易赤字对政府政策有很大的影响。在教育领域,目前引起政府关注的有中小学生辍学情况、毕业生就业情况、学校经济情况以及青少年犯罪等问题,这些资料对政府教育政策的制定有很大的影响。政府官员对于这些社会问题并不是总能找到解决的方法,但他们对这些问题发生的数量、地点及未来的变化趋势非常重视。

2 分析性资料

这类资料是指一些研究结果,可以揭示与某种情况发生相关的一些因素。分析性研究可以发现与社会犯罪、校园暴力等问题发生的相关因素,有些研究结果甚至还可以发现何种因素导致了问题的发生,揭示出因果关系,从而通过控制相关因素来增加或减少某种情况的发生。但有些研究常常揭示出一些结构性因素,使得政策制订者至少在短期内难以有所作为,如有研究发现恶意拖欠学费者大多是家境贫困者,而政府不可能在短期内消除社会贫穷现象。需要指出的是,即使研究结果提出了可行性的措施,将其转变为政策还需要更多的努力,首先要将研究结果转变为可操作的政策提案,然后要寻求政治上的支持将提案转化为政府的政策。

3 评估性资料

评估性资料可以对现行政策的有效性进行直接评价,这对于政策制订有特别重要的意义。但另一方面,由于该项政策已经实施,任何负面的结果都会招致包括提案的提出者、政策的制订者和政策的受益者等各方面广泛的反对。由于存在对负面结果的广泛抵制,评估性资料对政策的影响力也是不断变化的,一些对评估性资料所支持的立场持肯定态度的人往往倡导对政策进行评估,并用评估结果来促使政策的改变。由于在政策制订过程中有很多其它因素的参与,因此有资料支持的提案不一定比没有资料支持的提案有更多成功的可能性。但根据目前的形势,几乎每项新的项目在实施前都要进行评估,而得到评估资料支持的项目则具有发展为政策的优势。

4 政策分析预测

这是对未来政策选择的分析,有时政策分析与循证建议(evidence-based advice)相结合,在未来可能实施的多项方案中选出可能产生最好结果的方案。政策分析者仔细研究每项方案,根据现有的资料预测每项方案的有利和不利方面,可能的花费和收益,然后提出预测结果的综合报告。很显然,政策分析者需要丰富的资料才能提出有价值的报告。政策分析报告的影响力受许多因素的影响,一个因素是报告所依据的资料的公正性,更重要的因素是政策分析者所处的位置,如果该政策分析者与该项目越接近,该报告的影响力就越大,另一个重要的因素是政策制订者对该政策分析者的信任程度,政策制订者对该政策分析者的报告越信任,该报告的影响力就越大。由于一些政策分析者是由政府工作人员担当的,他们与政治人物有着密切的关系,因此,他们的影响力是难以估计的。另外一些在政府以外的智囊机构、大学的研究中心以及其它机构的政策分析人员,他们的分析报告的影响力取决于其引起社会关注的能力,能够引起社会的广泛关注和讨论是其发挥影响力的一个重要因素,而更重要的是要引起政策制订者的重视。由于政策分析的重要性,近年来智囊机构在世界范围内大量扩增,这同时也是证据影响力增大的一个象征。

(三)证据对政策制订的影响

1 证据对政策和实践发挥影响所必需的条件[6]

首先具有关于证据性质的共识。证据的来源多种多样,英国政府内阁办公室将专家意见、公开发表的研究结果、现有的统计结果、相关人员的磋商结果、先前的政策评估结果、互联网上的信息、可供选择的政策选项的花费、经济和统计模型的运算结果等均作为制订政策的证据,[7] 这种将各种不同来源的证据一视同仁的做法实际上是一种折中的做法。按照循证实践的要求,证据应该根据其性质按照影响力进行分类。在教育领域,证据的影响力是和所需要解决的问题以及环境因素密切相关的,所以在教育政策的制订过程中,采取循证实践原则,必须要对证据的构成、证据所处的环境以及证据要解决的政策问题的类型达成共识,才能使循证政策具有可行性。

其次具有创建证据并建立知识积累体系的战略性措施。目前在政策制订过程中研究性证据是不足的,现有的研究往往在方法上也存在不少问题,而且资料的积累也是由研究的实施者进行,而不是由研究的使用者进行。要解决这些问题必须发展研发战略,这就需要解决以下问题:1)对于每个特殊的研究课题,怎样设计最合理的研究方案,以及寻找说服力强的研究的方法学特点;2)综合平衡经过二次分析的现有研究结果和开展新研究的关系;3)综合平衡对于实践指导性研究结果的准确性和及时性的关系;4)采取措施识别现有知识的缺陷,并对这些缺陷按照优先顺序排列;5)如何开展和管理实验研究来弥补发现的知识缺陷;6)如何开发研究能力来快速增加可获得的基于研究的信息量;7)如何处理研究人员渴望独立及避免过多的政治干扰、要求研究结果提供者和使用者密切合作之间的关系;8)如何进行研究结果的交流,更重要的是如何使研究结果的使用者参与到研究过程中从而使研究结果更容易被采用。解决这些问题需要研究人员更多地了解政策制订过程,而政策制订人员需要详细深入地了解研究过程和时程,双方长期共同协作才能加深相互的了解。

再次具有有效的知识传播途径,并建立获取知识的有效方法。循证政策和实践的基础是搜索、合成、然后传播目前研究得到最优知识。因此系统综述的形成是循证机构的核心工作。目前的循证机构在教育领域有英国教育和就业部证据支持政策中心(Centre for Evidence Informed Policy,DfEE)。当前循证机构面临的主要问题是证据的传播。传播是指一种革新在一个社会系统中的交流,并被该系统成员所采用或拒绝的过程。传播有三个不同的水平,一是最优实践的传播,是指更多地采用循证技术和实践,鼓励放弃那些有证据表明无效的技术和实践;二是证据理念的传播,是指在政策制订者以及政策执行者中培育一种重视证据的理念,使之能够对证据进行正确的评价并将证据的采信作为决策的常规程序;三是机构革新的传播,是指公开机构的结构、程序和策略,鼓励最优证据的产生、寻找、评价及应用。明确传播的水平可以帮助了解不同人员在不同时间对不同证据的需求。

最后具有在政策制订和实施过程中尽可能多地采用证据的思想。根据经验,在下列情况下证据更容易被应用到政策中:研究适时,证据明确且相关,方法学没有明显异议;结果支持现有的理念,且对于当权者是方便且没有竞争性的;政策制订者认为证据是抗衡专家意见的重要力量;研究结果得到广泛认可;研究结果的使用者(即政策制订者)参与了证据的产生过程;研究结果的实施可产生重要影响;结果的实施在必要时是可逆的。

2 证据的可靠性[8]

证据按质量和可靠程度可分为五级(可靠性依次降低)。一级:所有随机对照试验的系统综述/荟萃分析;二级:单个的样本量足够的RCT结果;三级:设有对照组但未用随机方法分组;四级:无对照的个案观察;五级:专家意见。系统综述(systematic review,SR)是按照特定的研究对象,全面收集所有相关、可靠的随机对照试验并进行科学的定量合成(荟萃分析)从而得出综合可靠的结论。在社会学领域,越来越多的社会学研究者也认识到随机性实验可提供比其它任何准实验(quasi-experiment)方法更有说服力的证据来证明因果关系,但在社会政策领域这种随机性实验还是比较少的,因此非随机研究如调查性研究也可成为循证政策的证据。[9]

3 证据对政策的影响

实验研究或政策评估的结果可以通过许多途径进入政策领域影响政策的制订。证据性信息通常并不是通过学术报告或报告摘要进入到政策领域的,政策制订者往往是通过一些非正式的渠道得到这些信息的关键性结论,比如通过会议、通过与同事的谈话、通过大众媒体、通过小道消息、通过一些专业人士或业余爱好者的非正式网络、通过与社会学者的私人交流、通过培训、或者通过朋友甚至自己上学的孩子来得到这些信息,久而久之,这些信息广为人知后就成为广为接受的新理念。人们认为,大部分研究或评估的结果不能成为制订政策的基础,但通过这些非正式渠道的渗透,会对政策的制订有启迪作用。

证据对政策的影响还受其它因素的干扰。首先是政策制定者个人意识形态的干扰;第二是个人和组织的自身利益的干扰;第三是机构的干扰;最后是先前信息的干扰。

(四)应注意的问题

1 研究结果的偏倚性[5]

教育学和其它社会科学一样,不同于自然科学。自然科学的实验结果是一种有待于科学研究人员去发现的客观存在,社会科学研究结果的构建与其定义、界定、资料收集方法、分析方法以及解释方法有密切关系,许多资料收集人员和社会科学研究人员都有自己的偏好,而且他们为之工作的机构也对资料的表达方式有机构性的偏好,因此社会科学的研究结果往往存在一定的偏差。

2 研究方法的可靠性[10,11]

对于证据本身也是有争议的,一个人的证据对于另外的人可能毫无意义,但是正如在自然科学和法学中所表述的证据也是有争议的,然而这并不影响其作为决策的基础。有价值的证据来源于实验,在教育中有很多事例是似是而非的,学校由于其本身的复杂性,对于一项措施的实施结果很难进行可靠的预测,因此需要进行有良好对照的实地实验研究,因而有人认为依靠目前在教育研究中普遍采用的调查或相关性研究是不够的,因为很多因素的相关性是受到许多主观和客观因素影响的,而且这种研究也不能发现干预措施的改变所带来的影响。有时阴性的实验结果比阳性结果更有意义,因为它可以证明所研究的策略是有缺陷的,这可以使我们避免浪费时间和经费去推行一项有缺陷的政策。[10] 当然,实验研究本身是有一定难度的,为了得到有显著性的结果而必须采用大的实验样本,这也是有困难的。但这种困难可以通过一种称为“荟萃分析(meta-analysis)”的方法来解决。[12,13]

三 循证政策研究的方法学

(一)荟萃分析

荟萃分析亦称为元分析、整合分析、汇总分析、二次分析、集成分析、再分析、汇后分析、meta分析,是一种强有力的研究工具,可以将不同实验的结果结合到一起,将各个实验作为一个总体实验的一部分,根据可得到的证据的平均水平来评估一项证据的“效力大小”(effect size)。荟萃分析还可以识别发生效力所依赖的因素,如果有的研究发现某因素对某项效力的发生有影响,而有的研究证明两者没有关系,荟萃分析也可以帮助找出原因。虽然一个学校的小样本实验的效力不大,但如果将其他各个学校所做的同样的实验结合起来进行荟萃分析,得到的总体结果则具有重大效力。[14]

荟萃分析的基本内容包括[15]:1)提出需要解决的问题,明确荟萃分析的目的,其目的必须简单、明确;2)制定分析标准,即在资料收集前制订一系列的标准,规定研究资料的来源、范围和内容,其中包括研究设计的类型、文献的种类、研究抽样的地点、文献发表所用的语言、研究个体的选择条件、变量的测量、研究结果应记录的统计量、可能影响研究结果的非处理因素等;3)资料收集,要确定文献查找的方法和查阅范围,要尽可能找到所有有关的文献(包括发表的和未发表的);4)资料的统计学分析,将收集到的各个研究的统计结果及统计指标进行加权合并,计算合并后的平均统计量即效应大小;5)分析结果的综合、解释和讨论,要把分析结果综合列表,并对各研究的选择和剔除标准、各研究的可合并性、各研究的质量评估以及荟萃分析结果的可靠性进行讨论,形成系统综述。荟萃分析本质上是一种观察性研究,因此荟萃分析过程中出现各种偏倚在所难免,对其结果的解释必须十分小心,特别是社会科学研究中有些结果是似是而非或相互矛盾的,在讨论荟萃分析的结果时,应结合研究背景和实际意义及专业知识进行讨论,必要时也可以比较大样本的单独研究和荟萃分析结果的一致性,往往大样本多中心的随机对照研究比荟萃分析的结果具有更大的可靠性。[16]

荟萃分析的主要步骤包括[17]:1)对多个独立研究的统计量进行一致性检验,若一致则可加权合并,若不一致,则剔除某些特大、特小或方向相反的统计量后再合并,资料分布必须符合正态性分布;2)对具有一致性的统计量进行加权合并,综合估计出效力大小;3)对综合估计出的统计量进行统计检验和判断,并做出合理的解释;4)计算某些统计指标的95%可信区间,并以图示表示。

(二)效力大小和统计学显著性[17]

效力大小是荟萃分析的一个重要统计量,用于定量描述各个因素对结果的影响力,也可以描述两实验组之间差别的大小。在对实验结果的统计学分析中,常用“统计学显著性”来进行描述,用于分析两组之间差异是由抽样误差所导致的可能性大小。从同一个群体中进行两次抽样,这两个抽样的结果总会有差别存在,统计学显著性往往以概率“p值”来描述这种差别是否是由于抽样误差所致,一般认为p<0.05是有显著性,也就是说两个样本的差别是由于抽样误差所导致的可能性小于5%,如果p>0.05则认为无显著性。这种“显著性检验”的最主要问题是p值受效力大小和样本大小两个因素的影响,因此这种显著性既可以是因为效力很大(即使样本很小)所致,也可以是样本很大(即使实际的效力很微小)所致。根据统计学的显著性,我们可以从实验结果中得出肯定的结论,但是统计学显著性并不能回答我们实验因素影响力的大小这个重要问题,因此我们需要用“效力大小”及其“可信区间”来解决这个问题。

四 遵循循证原则制订教育政策

教育是一个非常复杂的系统,一点微小的背景差别可以导致某项政策或措施产生完全不同的效果。在教学中一个有趣的现象是,一个人的教学方法可能不适用于另一个人,甚至当其本人下次再用时可能也是不适用的,这就要求证据必须详细说明其背景特征及结果产生所需要的条件,当证据的意义不明确时,循证教育要求明确矛盾产生的背景并设计进一步的实验来解决此问题,但在目前的教育研究中很少进行这样的研究。[11] 因此,循证教育必须由三部分组成,首先要制订循证教育政策,第二是采用循证实践的原则,第三要培养“证据文化”(culture of evidence)[18]。

目前政府部门或其它管理机构在制订教育政策并要求学校贯彻执行时,几乎没有或很少有证据表明该项政策实施的可能成本和效益。而在一项政策实施之前进行实验评估并不困难,也不昂贵,因此应当在教育政策的制订过程中常规采用。在公共政策的制订过程中有越来越多的公众参与行为,在学校中,有时也要求教师和家长对学校的决策发表意见。但是,公众的广泛参与往往会削弱证据的效力,因为在最初参与决策过程时,人们往往首先按照自己的利益关系进行投票,也许事后他们会坐下来研究有关的证据,但起码在开始时,他们常常是首先寻求方法来解决自己所不满意的问题。这种公众参与政策制订的趋势,要求从事政策研究、评估和分析的人员要用更多的时间、想更多的办法将他们所发现的证据传播到公众中去,而仅仅将证据报告给当权者是远远不够的。因此,各类政策研究人员和证据提供者必须改变观念,掌握与各种类型的听众进行交流的艺术,将他们的发现传播给更广泛的公众。在公众参与政策制订的情况下,将研究获得的证据传播给广大的社会公众并使其信服,是真正实施循证政策的关键。[5]

表明一种实践是好行为的证据与将它制订成为一种政策是有重要区别的,对于前者来说,教师可以决定该行为是否适用于其班级及采用该行为是否可以产生最好成果。对于自愿参加某项改革措施的那些学校来说,它们之间可能是有联系的,如果该措施适用于一个学校,那它很可能也适用于另外的学校。但如果作为一项政策来实施,所有的学校都必须进行改变,因此作为制订政策的证据要更加有力,仅仅从表面看该行为效果良好是不够的,还要参加实验的学校证明不论该校处于任何情况下,该行为都能使学校得到改善。作为证明一项行为可以成为政策的证据,必须证实该行为对那些最难以管理、最难施加影响、不愿参加任何改革实验的学校或那些已经很好而不愿作任何改变的学校也是有益无害的。[19]

[收稿日期]2007—01—04

[基金项目]北京市留学人员科技择优资助项目“预防青少年网络错罪成瘾的循证政策研究”(005400602)。

标签:;  ;  ;  ;  

遵循循证原则制定教育政策_荟萃分析论文
下载Doc文档

猜你喜欢