国际教学评价研究:发展动态、热点与前沿-基于WebofScience数据库的知识图谱分析论文

国际教学评价研究:发展动态、热点与前沿*
——基于Web of Science 数据库的知识图谱分析

薛 辉 徐文彬

摘 要: 本研究运用CiteSpace 与传统文献计量学方法,对WOS 核心合集下载的2221 篇教学评价研究文献进行知识图谱可视化分析。结果发现,美国是教学评价研究成果最多的国家,其中伊利诺伊大学是贡献最大、最为活跃的机构,Marsh HW 教授是教学评价领域中最有影响力的核心作者;教学评价研究的热点主题是教师教学评价、医学教学评价、心理学视角下的教学评价机制、语言学教育教学评价四个主题。教学评价研究的前沿主题是学生评教、学习评价、居民评价、教学评价工具的制定与修订,构成此研究前沿的知识基础主要有学生评教的目的与方式、学生评教的偏见问题及有效性和评价结果的解释与使用。其未来发展走向可能是,扩大学术共同体,加强基础教育教、研、评一体化建设;关注人才发展的需求,制定人才培养政策;吸取教育学、心理学、医学和语言学领域的精华,加强教学评价多维领域的跨学科研究;运用多种评价方式,提高教学评价结果的公平性,发挥教学评价的正向效用。

关键词: 教学评价研究;知识图谱分析;研究热点;研究前沿

教学评价是教学的有机组成部分,是指对教学过程、教学结果所进行的价值判断。教学评价问题是教师教学工作的内容之一,也是国内外研究者关注的重点领域。对已有教学评价研究进行分析与探讨,是推进教学评价研究深入发展的基础,可以帮助研究者厘清国际教学评价研究的发展脉络与前沿,预测可能的未来发展走向,为进一步研究开拓思路。

南水北调受水区是全国地下水超采最严重的地区。因此,应按照水利部《南水北调受水区地下水压采总体方案》,根据压采目标,采取不同的压采措施和保障措施,严格控制地下水开采。对严重超采区、重点保护区尤其要严格控制开采量,主要是压缩地下水开采量。同时要充分利用南水北调来水、雨季洪水、再生水、微咸水和咸水等替代水源,减少地下水开采量。

2.2 两组患者裸眼视力比较 治疗前,两组患者裸眼视力比较,差异无统计学意义(P>0.05);治疗后,两组患者的裸眼视力高于本组治疗前(P<0.05),且B组高于A组(P<0.05)。见表2。

近年来,国内有些学者对国外教学评价研究进行了相关方面的文献梳理,比如,郭莲就对国外教学评价策略进行了整理,指出国外学校普遍采用的教学评价策略主要包括教学档案、学生评分、同行评价、个别信访、课程档案和课堂评价等形式。[1]王红艳等人则分析了影响发展性课堂教学评价的因素,认为教育研究、大规模评估、评价研究、教育政策、教师专业发展和教师信念是影响发展性课堂教学评价的六大因素,时间问题和教师自主权问题也会影响到发展性课堂教学评价的实施。[2]邢倩倩和孟凡玉则从课堂气氛的视角梳理了国外课堂教学评价的低推论测量研究倾向与建构主义研究倾向。[3]已有的文献梳理通常都是把国外研究与国内研究割裂开,且以某一种教学评价策略或某一视角对国外教学评价进行论述,大多建立于个体的阅读经验之上,缺乏实证数据的支撑,带有一定的主观色彩,甚至理论取向。

鉴于此,在全球视野下,借助可视化统计工具对国际教学评价领域的文献进行计量分析,通过文献来体现国际教学评价研究在21 世纪以来的发展变化,以大数据客观呈现该研究领域的样态,探寻教学评价领域演化的知识基础及其热点主题,并通过一系列可视化图谱的绘制,[4]形成对教学评价研究前沿的探测,想必会对未来教学评价的理论与实践研究具有一定的借鉴或启发。

一、数据来源与研究方法

(一)数据来源

本研究以Web of Science (简称WOS)核心合集作为文献搜索引擎,采用标题检索策略,Title(标题词)=“teaching evaluation” or“teaching assessment” or “teaching appraisal”or“instructional evaluation” or “instructional assessment” or “instructional appraisal”,即将检索结果限制在以教学评价为标题的文献,数据库的时间跨度为2000 年至2019 年,检索时间为2019 年3 月11 日。检索结果得到4296 篇文献记录。但鉴于只有“article”类型的文献才能更好地从科研角度反映研究现状,因此,以“article”文献类型为限制,最终获得文献2221篇。

通过分析发现,国际教学评价研究的热点主题主要集中在4 个方面:

在阅读时,读到精妙处,忍不住击节叫好;读到伤感处,忍不住泪眼婆娑;读到激愤处,耐不住拍案而起;读到诙谐处,禁不住哑然失笑。有了知识的滋润,视野也开阔了许多,人也就逐渐强大起来。

(二)研究方法

本研究一方面采用传统文献计量学方法对文献增长规律进行统计分析,另一方面采用知识图谱方法,从词频共现和共被引角度对国际教学评价研究的内容特征进行分析,以了解该领域的发文影响力,试图发现此领域研究的热点主题、研究前沿与知识基础,从宏观上把握该领域的研究态势。

2.机构影响力分析

二、发展动态

主要包括横向影响力分析和纵向发展分析两个方面。

1.学生评教的目的与方式

(一)横向影响力分析

主要包括国家、机构和作者等三个层面的影响力分析。

1.国家影响力分析

第一,在小学语文课程的教学当中,语言文字的应用能力是语言应用的核心内容,然而关于语言文字能力的特点,它是由语言和文字共同完成的语言活动并且能够熟练应用的一项基本技能。只有小学生能够将语言文字能力掌握,才能加强语感能力,使沟通更加顺利,同时为阅读的理解能力打定基础。

利用CiteSpace 将收集的文献所属的国家进行可视化分析发现(可参见表1),发文量最多的是美国,2000-2019 年间一共发表了744 篇与教学评价相关的文献;排名第二的英国发文量仅为156 篇;澳大利亚排名第三,发表了123 篇相关文献。由此可见,美国对教学评价研究文献的贡献率占国际教学评价研究总文献的三分之一,是教学评价研究中最强势的国家,在教学评价研究中占据主导地位,对其研究主题进行密切关注与追踪,基本上就可以掌握整个国际教学评价研究的大体趋向。

表1 发文量前十的国家

知识图谱绘制方法如下:采用CiteSpace Ⅱ将从WOS 中下载的2221 篇文献导入其中,绘制科学知识图谱。参数设置为:时区分割(Time Slicing)设定为2000-2019,单个时间分区的长度(Years Per Slice)设定为1年,即在时间区间内,以每一年为一个时间分区对数据进行分析;标题词来源选择为标题(Title)、摘要(Abstract)与关键词(Author Keywords 与Keywords Plus);共词类型(Term Type)选择突发性探测(Burst Detection);节点类型(Node Types)分别选为 国 家(Country)、机 构(Institution)、作 者(Author)、作者共被引(Cited Author)、文献共被引(Cited Reference)、关键词(Keyword);分析对象数据之间的连接强度(Links)为夹角余弦距离(Cosine);节点阈值的选择(Selection Criteria)为Top N%=27%,每一时间分区的最大数值为100,即选择每一时间片段中被引用最多的前27%的数据,最多选取100 个数据。

通过发文机构的分析,可以探测教学评价研究主题在不同国家中的主要研究力量布局,可对教学评价研究机构或研究者之间的交流与合作提供参考信息。对发文数量较为靠前的机构进行统计(可参见表2),在被引量排名前十的机构中,美国有七所,这与国家发文量排名的结果较为一致。美国是教学评价研究影响力最大的国家,其中伊利诺伊大学是贡献最大、最为活跃的机构,该机构关于教学评价研究的文献可以说是后继研究者的重要参考资料。

表2 发文量前十的机构

3.作者影响力分析

作者的共被引分析可以得到某个领域中高被引作者的分布,既可以确定该领域有影响的核心学者,也可以作为研判研究共同体形成状况的重要依据。从作者共被引来看(可参见表3),Marsh HW 以245 次的被引频次排在首位,是第二位Feldman KA 的三倍多,这说明Marsh HW 是教学评价研究领域的核心作者,在该领域具有较高的影响力。Marsh HW曾在澳大利亚西悉尼大学任教,2006 年进入英国牛津大学,致力于对自我概念和教学评价的实证性研究,他还从方法论、有效性、可靠性、维度、潜在偏差等角度研究了大学生对教学的评价,为国际教学评价研究的知识基础的奠定、交流与传播做出了重要的贡献,其研究方法和观点对基础教育教学评价研究具有重要的参考价值。

表3 共被引频次排名前十的作者

由表3 可知,21 世纪以来,该十位作者是教学评价研究领域比较有影响的专家,是我们在教学评价研究中资源获取的主要对象,他们的研究著作、学术论文是研究教学评价领域的学者无法忽视的研究成果,对他们研究成果的深入分析与借鉴,可为该领域的研究提供重要的知识参考,值得研究者们学习与消化、借鉴与反思,批判与创新。

(二)纵向发展分析

科学文献的增长及其规律反映了科学知识量的增长情况。对教学评价研究文献增长规律的分析可以准确反映该主题领域科学知识量的发展与变化(可参见图1)。因此,国际教学评价研究的纵向发展,可以从该领域的文献增长规律中窥见一斑。

图1 文献增长规律

数据显示,国际教学评价研究发文量在2000年至2019 年间,整体上处在上升趋势,但是还不够稳定。2000 至2014 年,教学评价研究的发文量呈现缓慢增长状态,最低发文量是46 篇,最高发文量是126 篇。尽管经过十几年的历程,但教学评价研究发展缓慢且不温不火,这说明,此时国际上对教学评价没有太多的关注,也没有得到研究者的重视。但是,此期间的研究成果对后期的研究走向具有奠基性的参考价值。自2015 年开始,国际教学评价研究的发文量出现了急剧增长,仅2015 年就比2014 年增加了近一倍。此后两年继续快速增长,达到2000 年以来教学评价研究发文量的高峰,这说明,国际上对教学评价研究的关注度越来越大,相关研究增长速度很快,进入快速发展时期。这提醒相关研究者要密切关注教学评价及其相关领域的新进展,发现教学评价研究存在的问题并全面分析其原因,以实现教学评价研究的新突破。

7.2.4 中医证候疗效评价标准 临床痊愈:证候积分减少率≥90%;显效:90%>证候积分减少率≥60%;有效:60%>证候积分减少率≥30%;无效:证候积分减少率<30%。其中,证候积分减少率=[(治疗前证候积分和-治疗后证候积分和)/治疗前证候积分和]。

三、研究热点

研究热点是在某个领域中学者共同关注的一个或者多个话题,其保持时间有长有短。研究主题的热点可以通过词频反应出来,词频越高,研究热度越高。词频是指所分析的文档中词语出现的次数。词频分析方法就是在文献信息中提取能够表达文献核心内容的关键词或主题词频次的高低分布,来研究该领域发展动向和研究热点的方法。

运用CiteSpace 对2000-2019 年间关于教学评价研究的2221 篇文献进行关键词聚类分析发现,随着时间的推移,教学评价研究的内容越来越宽泛,并且产生了很多与教学评价相关的关键词。尤其是近十年发展比较迅速,教学评价主题的研究不断深入扩大,越来越成为教育研究工作者关注的重点。出现频率最高的前十个关键词如表4 所示。与此同时,近二十年在研究教学评价的主题过程中,出现了高等教育(Higher Education)、网络(Internet)、教 学质量评价(Teaching Quality Evaluation)、学校(Schools)、在线(Online)、自我效能感(Selfefficacy)、幼儿(Young-children)、时间(Time)、有效性(Validity)、教师(Teachers)等十个词汇的突现性,以这些突现性词汇为主的论文曾经在某一时期对教学评价研究产生了转折性的影响。

表4 高频关键词词频排序(排名前十)

第二,缺乏经营品牌。常言道,酒香不怕巷子深。品牌是企业的活招牌,更是其屹立于市场的“杀手锏”和其自身软实力的象征。但南通鹏越纺织有限公司虽然在理念上追求品牌建设,但实践滞后,无法真正使得品牌成为其隐形财富。

完善的内部控制制度是加强内部控制的基础,有效的执行是发挥内部控制作用的关键。首先要提高公司领导对内部控制的重视力度,把内部控制严格实施到房屋租赁管理的全过程当中;其次,公司在实施房屋租赁业务内部控制过程中,需要各部门负责人以及公司全体人员的共同参与。第三,实际运行管理过程中,不断对内部控制进行评估,及时进行完善补充,不断提高内部控制的效率,将企业风险控制在可接受范围之内。

·教师教学评价,涉及教学评价有效性、教学评价意识和教育、研究生培养、助教在评价中的作用、导入心理学(比如将心理学统计方法运用到教学评价领域的实践与尝试)、教师绩效评估、学生对教师的评价、学生互评、教师互评。

·医学教学评价,在医学教育领域,尤其是临床教学中,通常把医生称为教师,患者称为学生,该研究的主题涉及师生关系、教师的专业精神、突发性坏消息、医学教育、随机对照试验、沟通策略和技巧、癌症、肿瘤学、教师对学生进行访谈、学生表现、检查人员、研讨会、临床医师评价。

·心理学视角下的教学评价机制,涉及心理模型、基于模型的学习、表征、物质、教师知识、视觉素养、学习进展、化学教育、科学教师、高中生、探究。

·语言学教育教学评价,涉及体裁、第二语言写作、表现、框架、学生素养。

由此可见,国际教学评价研究内容形式多样,领域广泛,宏观上跨越了教育学、心理学、医学、语言学等四大领域,微观上包括了教学评价的类型、方法、工具、影响因素等一系列研究。

四、研究前沿

教学评价研究的前沿反映了教学评价领域的发展状况,研究前沿的所有前期文献集合称为知识基础,研究前沿和知识基础之间的关系本质上是对应的。同一组文献可作为不同研究领域的知识基础,某个研究前沿可将以前彼此不相干的文献集中在一起而形成自己的知识基础,一个研究领域可以被概念化为一个从研究前沿到知识基础的时间映射。

(一)研究的前沿主题

对于第三人侵权的雇主责任的承担方式,《侵权责任法》无明确规定,仅在条文理解与适用提出三种观点。第一种观点为无行为即无责任,第二种观点为雇主和侵权第三人为连带责任,第三种观点为受害的雇员主张赔偿具有选择权,既可以向雇主主张,也可以向第三人主张。

1.学生评教

施引文献也称原文献,研究前沿由引用知识基础的施引文献集合组成,是正在兴起的理论趋势和新主题的涌现。通过对原文献进行分析发现,教学评价研究的前沿主题主要有以下四个。

学生评教的方法有很多,最常用的方式是通过调查问卷让学生进行评教。由于问卷的信度、效度、维度、解释方法等会影响学生评教的效果,况且有些学生评教问卷的适用范围也有一定的局限性,比如Onyebuchi A.Arah 等人编制的医学教师教学质量系统评价工具只适用于医学教师,[5]因此,对于学生评教的有效性至今争论不休。众多研究者通过元分析模型验证和实证分析对此进行了研究,Stephen L.等人认为,学生评教是有效的,在很大程度上不受性别偏见的影响,当在实施咨询策略的时候最有效。[6]也有很多研究者非常怀疑学生评教的有效性,比如Pieter Spoore在研究中指出,虽然学生评教的研究做了很多,但是到目前为止,现有研究未能就学生评教的有效性的一些关键问题提供明确的答案,[7]如维度辩论和偏向问题以及新的研究路线(例如,在线学生评教的效用,影响学生评教的教师个人特征),因此,对学生评教的过程及其结果的有效性和有用性应该继续受到质疑,需要开展进一步的研究与探索。

2.学习评价

近年来,学习评价在英国、澳大利亚和我国香港地区的课程政策声明中越来越受到关注。英国学者Black 和 Wiliam 通过研究文献的影响力分析得出,学习评价可以给学生的学习带来实质性的收益。学习评价强调课堂中的学习功能,是寻找和解释证据以供学习者和他们的老师用来决定学习者在学习中的位置,他们需要去哪里,以及如何最好地到达那里的过程。在澳大利亚,学习评价是课程改革的中心环节,国家课程框架把学习和教学的提高作为评价的主要功能。在学习评价中,学习本身就是一个目标,而评价是实现目标的手段,教师在课堂上实施学习评价时应将教学、学习和评价结合起来。评价是连续的,因为教师应该不断地利用评价中的信息来微调他们的教学,提高学习,并促进下一个教学周期的规划。学习评价不仅可以提高学生自我评价的能力,使学生在评价中变得独立和学会反思,而且还可以增强学习者的积极性和自主性。比如,在写作课堂上,学生可以通过对日记进行自我-同伴评价来提高未来的日记写作水平,通过参与评价反馈表单或检查表的开发来发挥自身的积极主动性。[8]因此,评价是教学和学习不可分割的一部分,通过学习评价,教学、学习和评价形成一种共生关系。

3.居民评价

通过对云计算、大数据和人工智能等高新技术对学生个性化学习行为数据的分析,各高校能够真正实现学习的富媒体化。在分析学生的学习过程与结果的基础上,向学生推送个性化教学资源,为学生定制个性化的学习安排,以便更有效地进行因材施教。

这里的居民主要指住院病人,是临床教师(主治医师)和实习医生的服务对象。居民评价是一种民意测验,是居民作为学生角色来评价临床教师和实习医生,包括对需要改进的领域的评价,是医学教育的重要组成部分。居民在临床环境中之所以被定位为有效的学生,是因为他们可以强调自己护理的实际方面,也了解自己的需要。众所周知,反馈对改进教学很重要,评价和反馈的结合与教学成绩的实质性提高有关。虽然居民可能不具备有效地教授实习医生所需要的实际的技能,但是可以通过居民的反馈结果来改进医学教学。大量研究表明,教学分数越高,学习效果越好,因此,可使用来自居民的反馈来提高临床教师的教学质量,以此提高学生的学习效果。居民评价目前在医学教育领域运用得比较多,其客观性特点弥补了自我评价带来的严重高估自己能力的缺陷,但是依然存在很多的局限性,研究者需要对居民评价进行深层次的研究,探索改进居民评价的程序和路径,通过提高居民的评价技能来提高教师的教学质量。

在文献共被引中,出现了引用量突然上升或突现下降的突发性文献,代表了教学评价研究在某一时期的转变。通过对突发性文献的分析得出,对教学评价曾产生过突发性影响的“前沿”研究主题有:学生评教(现状、研究方法和有效性)、临床教学评价、教学评价的统计分析方法(比如潜变量的统计分析、协方差结构分析中拟合指数的截断准则、贝叶斯分析等)。

(3)将第3行对角元以右的2个元素赋值给对角元以下的2个元素;再对第3行的2个元素规格化;继而对第3列元素消元,仅计算虚线框中的3个元素,见图5上图。

国际教学评价的前沿文献以量化研究为主,量化研究离不开研究工具的使用。在前沿文献中,评价工具的开发与校准的文献占有很大比例,比如中学教学中使用的教学技能评估工具的校准和验证,[9]利用学生评教问卷对教师的教学质量进行多元分析,[10]教学质量系统评价的新工具的制定,[11]评估工具的校准及其在预测学生学业投入中的价值。[12]研究工具是研究人员用来收集、处理和解释资料的一种手段,可以帮助研究者缩短研究进程,提高研究效率。教学评价研究领域的范围不断扩大对已有研究工具的改进和新工具的需求起着强大的推动作用,因此,教学评价工具的制定与开发受到研究者的重视,成为教学评价研究的前沿主题。

3.很多学生有完美主义倾向,尤其是女孩子在使用错题本时,常常是外在大于实际,把错题本弄得美美的,当成“艺术品”来对待,反而没有关注到错题本的本质;

4.教学评价工具的制定与开发

女人转身上楼,高跟鞋发出哒哒的响声。我不明白她为什么不承认内裤是她的,这么新的一条内裤,说不定连穿都没穿过呢。我把那条内裤装进纸盒,拎着下楼去。既然那个女人不承认是她的,我只好把它交还给老陈了。

(二)研究的知识基础

从文献共被引角度看,国际教学评价研究的知识基础是由早期被引频次较高的奠基性文献组成。高被引文献投射的是不同时期研究前沿中的知识与概念在后期文献中的利用情况。持续被高引用的文献称为经典文献,这些文献构成了该研究领域的知识基础。通过对高被引文献进行分析可知,教学评价研究属于综合性的多学科研究,以教育学、心理学、医学和语言学研究为主,既是教育学研究的重点,也是医学研究的内容。整体来看,引用频次最高的文献以教学评价的有效性、偏见等为主要研究内容,评价的类型以学生评教的研究最多,研究对象以大学生对教师教学的评价为主。具体来说,教学评价研究的知识基础主要有三个。

1920年底,国内战争和抗击国外武装干涉已经结束,苏维埃政权获得了有利的喘息机会。但此时国内却面临着严重的政治和经济危机。这成为俄共(布)必须解决的重大问题。为此,列宁酝酿如何把工作重心转到经济建设上来。

对教学评价研究最多的当属学生评教,学生对教学进行评价可以对老师的教学给予反馈,有助于改进教学方法,提高教学质量。学生评教主要通过课堂评价的方式来实现,课堂评价不仅能够对教学进行及时反馈,提高评价的时效性,还能够让学生清晰地制定自己的学习目标并进行自我比较而不是与其他学生进行比较来监控和调整目标,提高学习效果。只有当学生融入到教学评价中作为评价的一员时,评价的成效才是最大的。学生评教的使用增加了卓越教学得到认可和警戒的可能性,[13]通过课堂评价不仅可以发挥学生评教的正向作用,还可以提高学生的学习成绩和教师的教学效果。[14]

2.学生评教的“偏见”问题及其有效性

学生评教的分数受学生个人偏见的影响,对学生而言,教师的教学风格、教学艺术比教学设计和教学方法更能影响学生对教学效果的评价,学生评价更多的反映了教授课程本身的教师的有效性而不是课程或教学本身的有效性。[15]学生评教除了受学生个人偏好的影响,也与学生的学习成就密切相关。学生评分已被证明是与学生的学习成就呈正相关,也就是说,学生对让他们所学到的东西最多的老师评价最高。[16]因此,学生评教的有效性成为众多研究者关注的主要问题,而学生评教工具的有效性则是学生评教有效性的首要问题。评价工具不仅应当具有良好的信度和效度,还应当是多维的,评分等级与评价工具理应反映多维的实际教学,比如一个教师或许教学设计得很好但教学过程却缺乏热情,这就需要对评价工具的结构效度予以重视。[17]学生评教有效性的衡量标准不是唯一的,在不同背景和测试中有不同的标准。[18]为保障教学评价结果的有效性,不能仅仅依靠学生评价来衡量教学效果,应当与其他教学评价方式相结合进行多元教学评价。比如,在使用评价工具过程中,不但让学生根据量表对教师的教学效果进行评价,而且让教师使用与学生相同的量表对自己的教学质量进行自评,同时根据由学生完成的教学效果评价量表与教师自评量表进行对比,以此改进教学方法,提高教学效果。

3.学生评教结果的解释与使用

学生评教分数会受评分等级宽度的影响,但问题的关键不是评分等级的划分,也不是其正确性与否,而是如何解释与使用学生评教分数。虽然已有研究者都赞成使用评分等级,但是对与评级分数的解释与使用的相关争议点却存在异议。比如,Marsh 和Roche 关注评分的概念结构,主要从有效教学观作为切入点研究评分的多维建构,提倡使用评级措施来设计这些维度的广度和多样性。[19]D’Apollonia 和 Abrami 则以聚合效度为主要聚焦点,认为通过考试来衡量的评级措施通常与学生的成绩具有实质相关性。[20]Greenwald和 Gillmore 更专注于区分效度,从多个理论和统计的角度分析了定期观察到的学生评教等级与预期课程成绩等级之间的相关性,认为等级宽度的严格性是影响等级评定的最重要因素,使用统计校正来消除由宽松评价等级所产生的不必要影响是合理的。[21]MckeachieWJ 完全赞同评价等级的聚合效度和区分效度问题的重要性,然而关心的却是结果效度,即如何有效地使用评价分数。[22]他认为使用评价分数主要有两个目的,即评估教师和改进教学,但评价分数在很多环境中并没有被有效利用。因此,在学生评教中,应该更多地关注确保更有效使用评价分数的方法。

五、研究展望

回顾教学评价研究成果,从文献计量学角度,结合文本分析进行全面审视,不仅在于客观呈现国际教学评价研究的概貌,而且更要反思其不足,分析原因并探索破解的路径,为教学评价理论的深化和实践运用的改善厚植根基。

(一)扩大学术共同体,加强基础教育教、研、评一体化建设

美国是教学评价研究成果最多的国家,引领了该领域的发展;英国在教学评价研究中取得了很大的发展;澳大利亚的成果虽然不及美国和英国两个国家,但研究成果的影响力却在教学评价中具有重要地位。美国的伊利诺伊大学位居教学评价文献发文机构榜首,是对教学评价研究贡献最大、最为活跃的机构。发文数量最多的前10 所机构全部为高校,发文最多的前十位作者也全部来自高校,这个结果在一定程度上反映出如下问题:教学评价研究核心力量单一和合作缺乏,中小学一线教师或“教研员”并未投入到教学评价的研究当中,对论文的贡献度不够。也许是中小学一线教师教学任务繁重,没有更多时间投入到系统的研究中,又或者是自身的学术科研能力有限,较难写出符合学术标准的较高质量的论文。因此,应适当“减少甚至去除”中小学一线教师的教学之外的“负担”,让教师有充分的时间和自由进行科学研究,通过各级各类课题资助、培育核心研究团队和鼓励多种力量参与研究等路径扩大教学评价研究共同体;同时,加强一线教师和高校科研工作者的合作,让专家带领教师在教学中做科研,加强一线教师教学、科研与评价一体化建设。除此之外,还应通过专门系统的培训来提高中小学教师的科研水平,提升理论素养,充分发挥自身深入中小学教学实践中的优势进行实证研究,不断探索改进教学评价的方法,探索教学评价研究的新路径。

(二)关注人才发展的需求,制定人才培养政策

教学评价研究在2000 年至2017 年的发文量随着年份增加也在发生变化,整体处于上升趋势,2015 年开始至2017 年,发文量突飞猛进,呈现出21 世纪以来教学评价转折性的发文高峰。教学评价研究论文数量突飞猛进,说明该领域引起了众多研究者的广泛关注,引起研究者对教学评价研究热情高涨的原因与各国尤其是美国甚至中国对人才培养的要求息息相关。2015 年12 月10 日,美国总统奥巴马签署了基础教育新法案《每个学生都成功》(Every Student Succeeds Act,简称ESSA),并于2016 年1 月6 日开始在全美范围内实施。该法案规定应该采用多样的不断更新的学业测评技术,考察学生高级逻辑思维技巧和理解能力等,同时关注残疾学生及英语学习者的学业评价,允许评价结果因各州、地方政府、学校的主体民族与少数民族、学生家庭经济状况、性别、移民地位、英语熟练程度、残疾学生与否等而产生差异。同时,联邦教育部应该为每个州每年度提供不少于150 万美元的拨款津贴,用以审计州评价体系。[23]同年,根据社会最新发展的动态,美国联邦教育部颁布了《为未来准备的教育:重塑技术在教育中的作用——美国2016 年教育技术规 划》(Future Ready Learning:Reimagining the Role of Technology in Education,2016)。该规划提出评价的目标为:教育系统在各个层面上都将发挥技术的力量,对重要的事情进行测量,并且使用评价数据提高学习效率。[24]2016年6月,我国教育部颁布的《教育信息化“十三五规划”》提出要基本实现教育信息化对学生全面发展的促进作用,提升教育信息化支撑教育教学的水平,促进教学理念、教学模式和教学内容改革。[25]美国和中国对人才培养的新要求和对教学的新期望对教学评价研究产生了巨大冲击,有力地推动了该领域的迅猛发展。由此可见,国家教育政策的变化影响着教学评价研究的风向与研究者的热情,应当密切关注人才发展的需求,通过制定符合新时期的人才培养政策来促进教学评价研究领域的新发展。

(三)吸取教育学、心理学、医学和语言学等领域的精华,加强教学评价多维领域的跨学科研究

教学评价的热点文献可以反映该主题的研究动态,当前教学评价研究的热点问题集中在教师教学评价、医学教学评价、心理学视角下的教学评价机制、语言学教育教学评价等四个主题,涉及教育学、医学、心理学和语言学四个研究领域。这说明教学评价领域具有学科交叉性,来自不同学科的学者都在研究该主题,并且带来他们各自学科对这一主题的研究方法和研究视角。每一个学科都有各自的优势和不足,教学评价作为一个整体的研究主题,不能在没有其他学科智慧的情况下被成功地诠释,这就需要进行教学评价的跨学科研究。跨学科具有超越交叉学科的自由,不是单纯的学科之间的结合,而是学科与学科之间的相互合作与融合。跨学科打破了传统单学科的局限性,跨学科研究是当代科学探索的一种新范型,越来越成为一种未来教学与学术研究的趋势。比如,教学评价的干预与治疗路径以及非均质性教学和临床教学评价就为未来教学评价研究提供了新的视角。教学评价结果作为衡量教学质量的重要指标,应当吸取教育学、心理学、医学和语言学等不同学科研究的精华,加强多维领域的跨学科研究,从不同角度审视该领域,开辟教学评价研究的新视角、新方法、新路径。

(四)运用多种评价方式,提高教学评价结果的公平性,发挥教学评价的正向效用

教学评价的前沿文献可以反映该主题的研究趋势,教学评价研究的前沿主题主要有学生评教、学习评价、居民评价、教学评价工具的制定与修订。构成教学评价研究前沿的知识基础主要由有学生评教的目的与方式、学生评教的偏见问题及有效性和评价结果的解释与使用。其中,英国牛津大学的Marsh HW 教授对教学评价研究知识基础的贡献最大,不仅其发表的论文数量最多而且被引用次数也最多,是教学评价领域的领军人物,该作者的研究文献对教学评价研究领域具有奠基性作用,与其它组成教学评价研究知识基础的经典文献和突发性文献都是该领域重要的参考文献,值得学者们认真研读并在此基础上进行深入探讨。

学生评教研究不仅是教学评价研究的前沿主题,也是教学评价知识基础的主要组成部分。学生评教大多适用于形成性评价和总结性评价,其目的主要有三个:提高教学质量、为评价活动提供投入(例如,任期/晋升决定)、为机构问责制提供证据(例如,证明有足够的程序保证教学质量)。学生评教已被用作衡量世界各地几乎所有高等教育机构的教师教学表现,大学已经发展了收集、分析和解释这些数据的相对复杂的程序和仪器,这些数据是教学质量的主要指标甚至是唯一指标。然而,学生评教在中小学教学评价中的运用还不够成熟,与在大学中的使用情况相差甚远。之所以出现这种现象,或许是因为学生评教是通过学生对教师进行评价,这就要求评价主体具有独立的判断能力和全面的分析能力,作为成年人的大学生价值观已然形成,逻辑思维具有理论性的抽象概括性,辩证思维也已经形成,他们能从一般原则出发,进行判断、推理,做出论证,对各种经验材料做出确定性的说明,可以正确使用评价工具对教师进行教学评价,评价结果具有一定的可靠性。而中小学生的思维处于具体形象思维和感性经验占主导的思维阶段,思维中的表象成分起着较大作用,在中小学阶段使用学生评教这一手段对教师进行教学评价的适切性还有待进一步探索与研究。

教学评价方式除了学生评教,还有教师自我评价、多元文化评价、居民评价、综合评价、差异性评价、对比评价等不同方式,每种教学评价方式都有各自的优点和缺点,任何一种教学评价结果的反馈都有助于教师改进教学策略,提高教学质量。但是,若仅使用单一评价方式的结果来衡量教学效果或决定教师职业生涯的晋升未免有失偏颇。因为教学评价的有效性不仅受到评价工具的影响,还受到评价者的经验、被评价者的状态、自我效能感、非言语行为、社会福利政策、环境等多种因素的影响。因此,应当理性、客观地使用评价结果,采取多种评价方式相结合的策略,以提高教学评价结果的公平性,根据评价结果的反馈采取一定的针对措施来开展个性化教学,提高教学质量和学习效果,以发挥教学评价的正向效用。

概而言之,研究者们应当保持高度的敏感性,密切关注教学评价研究主题的发展变化,立足重点,抓住热点,紧跟前沿,全面透彻剖析教学评价领域的问题并探寻其解决之道和发展之路,促使教学评价研究更好地为教学实践服务。

参考文献:

[1]郭莲.国外教学评价策略研究[J].理论研究,2017,(1):23-24.

[2]王红艳,吴志华,宫红英.国外发展性课堂教学评价实施的影响因素研究[J].外国教育研究,2012,(7):3-11.

[3]邢倩倩,孟凡玉.国外课堂教学评价最新研究的述评:基于课堂气氛的微观视角[J].中国农业教育,2017,(6):81-86.

[4]李杰,陈超美.Cite Space:科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社,2016,(1):3.

[5][11]Arah OA,Hoekstra JBL,Bos AP,Lombarts KM.New Tools for Systematic Evaluation of Teaching Qualities of Medical Faculty:Results of an Ongoing Multi-Center Survey[J].Plos One,2011,6(10):e25983.

[6]Wright S L,Jenkins-Guarnieri M A .Student evaluations of teaching:combining the metaanalyses and demonstrating further evidence for effective use[J].Assessment &Evaluation in Higher Education,2012,37(6):683-699.

[7]Spooren P,Brockx B,Mortelmans D .On the Validity of Student Evaluation of Teaching:The State of the Art[J].Review of Educational Research,2013,83(4):598-642.

[8]Icy Lee.Assessment for Learning:Integrating Assessment,Teaching,and Learning in the ESL/EFL Writing Classroom[C].The Canadian Modern Language Review,2007(9):199-214.

[9][12]Grift WVD,Helms-Lorenz M,Maulana R.Teaching skills of student teachers:Calibration of an evaluation instrument and its value in predicting student academic engagement[J].Studies in Educational Evaluation,2014,43:150-159.

[10]Mónica Martínez-Gómez,Sierra J M C,José Jabaloyes,et al.A multivariate method for analyzing and improving the use of student evaluation of teaching questionnaires:a case study[J].Quality &Quantity,2011,45(6):1415-1427.

[13]Aleamoni LM.Student ratings of instruction[A].in:J.MILLMAN (Ed.) Handbook of Teacher Evaluation[C].Beverly Hills,Sage,1981:110-145.

[14]Wiliam D.Enculturating learners into communities of practice:raising achievement through classroom assessment [C].European Conference on Educational Research(ECER),1998.

[15]Marsh HW.Students’ Evaluations of University Teaching:Dimensionality,Reliability,Validity,Potential Biases and Usefulness[A].In:Perry R.P.,Smart J.C.(eds.).The Scholarship of Teaching and Learning in Higher Education:An Evidence-Based Perspective [C].Springer,Dordrecht,2007:319-383.

[16]Cohen PA.Student Ratings of Instruction and Student Achievement:A Meta-Analysis of Multisection Validity Studies [J].Review of Educational Research,1981,51(3):281-309.

[17]Marsh HW.Students' evaluations of University teaching:Research findings,methodological issues,and directions for future research[J].International Journal of Educational Research,1987,11(3):253-388.

[18]Marsh HW.Students' evaluations of University teaching:Dimensionality,reliability,validity,potential baises,and usefulness [J].Journal of Educational Psychology,1984,76 (5):707-754.

[19]Marsh HW,Roche LA.Making students'evaluations of teaching effectiveness effective:The criticalissues of validity,bias,and utility [J].American Psychologist,1997,52 (11):1187-1197.

[20]D’Apollonia S,Abrami PC.Navigating student ratings of instruction[J].American Psychologist,1997,52(11):1198-1208.

[21]Greenwald AG,Gillmore GM.Grading leniency is a removable contaminant of student ratings[J].American Psychologist,1997,52(11):1209-1217.

[22]Mckeachie WJ.Student ratings:The validity of use [J].American Psychologist,1997,52(11) :1218-1225.

[23]U.S.Department of Education.Every Student Succeeds Act[Z].2005-12-1201.

[24]U.S.Department of Education.Future Ready Learning:Reimagining the Role of Technology in Education.2016 NATIONAL EDUCATION TECHNOLOGY PLAN [EB/OL].2016,01:51-62.http://tech.ed.gov.

[25]中华人民共和国教育部办公厅.教育信息化“十三五”规划[EB/OL].http://www.moe.edu.cn/srcsite/A16/s3342/201606/t20160622_269367.html,2016.06.

International Study of Teaching Evaluation:Development Trends,Hotspots and Frontiers——Based on the Knowledge Mapping Analysis of the Web of Science Data

XUE Hui XU Wenbin

Abstract: By using the method of Cite Space and the traditional bibliometrics,this paper gives a knowledge mapping visualization analysis on 2221 teaching evaluation study literature from WOS collection downloaded.It finds that,US is the country that has the most products of teaching evaluation study,University of Illinois is the most active institute that contributes the most,and prof.Marsh HW is the most influential writer in the field of teaching evaluation.The hot topics of teaching evaluation study are teaching evaluation of teacher,medical teaching evaluation,teaching evaluation system in the perspective of psychology and teaching evaluation of linguistics education.The frontier topics are student's evaluation of teaching,learning evaluation,inhabitants evaluation,and the adopt and revision of the teaching evaluation instruments.The future trends may be:stress the unification construction of teaching,research and evaluation on basic education;make policy of cultivating personnels according to the needs of manpower development;emphasize the interdisciplinary study of teaching evaluation in various fields.etc.

Keywords: teaching evaluation study;knowledge mapping analysis;study hotspots;research frontier

作者简介: 薛 辉/南京师范大学课程与教学研究所博士研究生(南京210097) 徐文彬/南京师范大学课程与教学研究所教授,博士生导师(南京210097)

*本文系全国教育科学规划“十三五”2018年度国家一般项目“中小学STEM教育基本理论与本土实践问题研究”(编号:BHA180126)的研究成果。

标签:;  ;  ;  ;  ;  

国际教学评价研究:发展动态、热点与前沿-基于WebofScience数据库的知识图谱分析论文
下载Doc文档

猜你喜欢