减轻负担背景下的考核改革_课程标准论文

减负背景下的评价与考试改革,本文主要内容关键词为:评价论文,考试论文,背景下论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

       [中图分类号]G40 [文献标识码]A [文章编号]1002-0209(2014)04-0023-07

       评价是按照一定的价值标准,对受教育者的发展变化及构成其变化的诸种因素进行价值判断的正式方法①;考试则是一种常见的评价方式,它以标准程序和方式考核学生在特定范畴所具有的知识与技能水平。从一般意义上来看,有效的评价与考试可以评判学生达成既定学习目标的程度,监控学生在认知、情意、生理等方面的进步,诊断学生在发展中的优势与不足,分析影响学生学习与发展的因素,为改进学生的学与教师的教提供依据。在当前教育质量与公平备受关注,教育问责呼声日渐高涨的背景下,评价与考试还可以作为教师绩效评估、学校办学质量评估、区域教育质量监控的重要手段,为有关决策提供信息支持。评价与考试在教学管理和教育质量保障体系中扮演重要角色。但值得注意的是,近些年来,中小学生学业负担长期居高不下,社会各界都给以深切关注,许多人将矛头指向评价与考试,认为它们是造成学生过重负担的主要来源之一。为破解减负难题,上海②、北京③等省(自治区、直辖市)相继出台有关文件对评价与考试工作进行规范。在相关政策推动下,不少地区和学校开始行动起来,评价与考试领域出现了一些新的改革动向,比如减少考试次数,实施分层评价,推动游戏入考。究竟减负背景下的评价与考试应何去何从,如何看待这些改革动向,如何开展评价与考试才能既切实减轻学生负担又不影响学生发展?本文拟从教育评价学科视角,对当前有关改革动向进行观察、分析和评论,以抛砖引玉,希望更多的教育者、研究者和管理者积极参与有关讨论,共同探讨有利于减负的评价改革策略。

       一、减少考试次数

       “考考考,教师的法宝;分分分,学生的命根。”考试频繁被认为是学生负担过重的重要原因之一。早在1995年,有研究者就撰文指出,“我国现行的中小学考试制度,陈旧落后,如同枷锁”,“牵住改革考试制度这个‘牛鼻子’,我们中小学生过重的课业负担方能得以减轻”,而改革的具体建议,首当其冲就是“减少考试科目和次数”④。最近一项面向12个省41所中学13619名学生进行的有关调查显示,中学生几乎每周都有考试(测验),不少学校每周举行多次考试,有些学生在访谈中对考试表现出恐惧和厌倦情绪,他们表示,最不想听到教师说的一句话是“要考试了”,感到最痛苦的事是“考试”⑤。在这样的情况下,减少考试次数似乎顺理成章地成为减轻学生负担的主要举措。

       上海市于2010年3月颁布《上海市教育委员会关于进一步规范课程教学工作深入实施素质教育的若干意见》(沪教委基[2010]23号),明确指出“要严格控制考试次数和科目”,具体规定是:“小学一至三年级不得进行全学区、全区县范围的任何形式的学科统考统测(包括学业质量监测);四至八年级不得进行全区县范围的学科统考统测;区县若要进行学业质量监测,每学年不超过1次,且只能随机抽样监测,随机抽取的学生比例不超过本年级的30%;严禁学校组织中小学生参加任何形式的联考或月考;学校内部的过程管理性考试应严格按照市教委颁发的中小学课程计划规定实施,并由所属区县严格加以规范和科学指导。”北京市教育委员会、北京市人民政府教育督导室于2013年2月颁布了《关于切实减轻中小学生过重课业负担的通知》(京教基一[2013]2号),要求各区县“严格规范考试和评价工作”,严格控制义务教育学段的考试次数,“区县不得在小学各年级组织选拔性或与升学挂钩的统一考试。小学除语文、数学、英语每学期期末可以举行一次全校或全年级学科考试外,其他课程不得组织考试。除组织初中毕业升学考试外,区县不得在初中其他年级组织统一考试。初中各年级每学期只能组织期中、期末2次全校或全年级的学科考试。”山东、江苏、广东等省(自治区、直辖市)也都纷纷出台有关文件,对中小学考试次数做出明确限制。

       但是,是否减负就要减少考试次数?减少考试次数是否最终有利于学生的学习与发展?

       从理论上来看,评价是课程质量管理体系中的重要环节。“现代课程理论之父”泰勒(Ralph W.Tyler)于1949年在《课程与教学的基本原理》(Basic Principles of Curriculum and Instruction)一书中开宗明义地指出,开发任何课程和教学计划必须回答四个基本问题:学校应该试图达到什么教育目标?提供什么教育经验最有可能达到这些目标?怎样有效组织这些教育经验?我们如何确定这些目标正在得以实现⑥?这四个问题刚好对应了课程质量管理的四个环节:明确课程目标、开发课程资源、实施课程、评估课程效果。四个环节依次展开,互相影响,互为依据,是一个循环往复的过程。其中,评价是十分重要的一环,它考察教育目标的达成程度,既可以是对前一阶段教育的终结性评价,又可以是整个学习进程中的一次形成性评价,为下阶段的课程开发和调整提供依据。评价是课程的重要组成部分。没有评价,或者仅有终结性评价而没有在过程中动态、多次实施的形成性评价,教育者就不能及时发现课程目标达成中的问题并予以有针对性地校正,课程质量将无法获得有效的保障。没有评价,或者仅有教师自编测验而没有在一定范围内举行的统一考试,教师绩效评估和学校办学质量评估将因缺乏一个统一的参照点而难以实施。

       从实践视角来看,适度频率的考试也是学生成绩的重要保障。许多研究者曾通过准实验研究考察考试次数对学生学业成绩的影响。1991年,美国学者邦吉特庄斯(Robert L.Bangert-Drowns)等人对29项有关研究进行元分析,探讨在一学期内教师开展考试的次数与学生学习成就改善之间的关系,结果(参见表1)发现:(1)考试从无到有,对学生学习成就产生的影响很大,效果量⑦为0.34,使实验组学生学习成就百分等级提升了13.5;(2)考试的频率与学习成就改善幅度有显著相关,在一个学期中教师开展考试的次数越多,学生学习成就水平提高得越多;(3)当考试次数增加到5次以上,随着考试次数的增加,效果量的增长速度有所下降⑧。豪斯奈克(John P.Hausknecht)等人于2007年对107项有关准实验研究进行元分析,也发现了相似的结果,这些研究的平均效果量达到0.26,学习成就水平提高了10个百分等级⑨。由此可见,评价与考试是教学的有机组成部分,是学生发展的必要条件,对学生学习成就具有正向促进作用。最近一项基于PISA数据所进行的跨国比较研究也进一步证实,用于教学改进的评价与考试有助于学生学习素养的提高⑩。

      

       不难发现,评价与考试是一把“双刃剑”。过多的考试会加重学生学业负担,而没有考试或考试次数过少使师生无法得到及时的反馈,也会在一定程度上影响学生的学习与发展。对待考试,教育工作者需要保持科学的态度,不能简单行事,不能非此即彼,不能从一个极端走向另外一个极端,要保留必要的、数量适当的评价与考试。

       教育行政部门为切实减轻中小学生过重学业负担而从行政上规定考试次数,有关规定属于规范性文件,具有一定的强制性,教育工作者必须遵守。但需要指出的是,有关规定严格控制的考试主要指全年级、全校或县域内统一组织的考试,特别是选拔性或与升学挂钩的考试,教师自编测验与区域性教育质量监测考试不在禁止范围。所以,教师可以基于教学需要,根据课程目标自编测验,在不依据测验成绩对学生进行排名,也不将测验结果与升学挂钩的前提下,通过形成性评价和终结性评价监控学生学习进展,分析自身教学得失。这是教师的权力,也是教师的义务。教师不仅可以,而且应该采用自编测验对学生学习进行评价。学校要为教师提供必要的专业支持,帮助教师掌握编制测验双向细目表、设计表现性评价任务、开发评分规则、效度分析等相关技术,使自编测验准确、有效,以充分发挥评价的导向、督促、诊断、反馈、激励和改进等多重积极功能。与此同时,为确保区域内学校办学质量,教研部门可以自行组织或委托第三方组织区域性教育质量监测,通过多阶段随机抽样或概率比例抽样选取学生样本组织考试,以评估各校学生达成课程标准的程度,帮助学校及时发现教学中的问题并予以改进。惟其如此,对考试次数的控制才能实现减负与增效的平衡,也就是既减轻学生过重学业负担,又有利于学生的学习与发展。

       二、实施分层评价

       学生过重的负担不仅来自于考试本身,而且与考试结果的应用有关。目前,不少学校经常根据学生考试成绩对学生进行排名,有些学校还会将排名结果直接或变相公布,给学生身心带来很大压力。这种将一名学生的成绩与其他学生进行比较的方法叫相对评价。学生的学业成绩有差异,名次有先后,这是客观事实。相对评价能区分和比较学生的学业成就水平,以此为依据实行奖惩,可在一定程度上激励先进和鞭策后进。但相对评价也有很大的局限性,由于相对评价的着眼点放在个体间的比较上,因此会在无形中增加了学生个体的心理负担,导致学生争分数、争名次,引发学生间的不当竞争,在一定程度上妨碍学生的学习与发展。这是减轻学生过重负担,深入推进素质教育亟待解决的一个问题。

       为了克服相对评价的局限性,淡化社会比较,有些地区和学校开始尝试开展分层评价。比较常见的做法是教师针对不同表现水平的学生编制不同难度的评价任务,高水平对应高难度,低水平对应低难度,不同水平的学生考不同难度的题目。这种做法可以让不同水平的学生都能在评价中获得高分数,在一定程度上减缓表现不好学生的学习焦虑。但这种做法能否真正减轻学生过重心理负担,让每个学生都体验成功,引导学生更好地学习和发展呢?

       分层评价脱胎于分层教学。在班级授课制模式下,教师在备课、授课、作业、辅导、评价和反馈等各个环节,很少照顾学生的差异,不同表现水平、不同发展潜力、不同学习风格的学生统一接受同样的教育,使得有些学生接受不到符合其需要的教育。为有效克服班级授课制的局限,体现因材施教的教育原则,分层教学应运而生,并且得到巴班斯基“教学最优化”理论、布卢姆“掌握学习”理论、罗杰斯“人本主义教育”理论等教育思想的支持,逐渐成为中西方教育改革中备受关注的领域之一。但需要指出的是,分层教学从初步兴起,经历几次沉浮,在各个发展阶段中都面临很大争议。不少反对者旗帜鲜明地指出,分层教学确实给少数表现好的学生提供了更多的学习与发展机会,但不能从整体上改善学生学业表现、人际关系和学习态度(11)。更重要的是,这些少数学生的发展是以牺牲表现不好的同伴为代价才获得的,有悖于教育公平原则。有研究表明,同样是低能力学生,在低能力组就读的学生,在标准化考试中的分数明显低于在混合班或高能力组就读的学生(12)。

       分层评价作为分层教学的一个环节,同样遭到很多质疑和批评。归结起来,分层评价存在的问题主要有:(1)在整体上不是减轻学生负担而是加重了学生的学习负担。在分层评价中,为高水平学生编制的评价任务通常会高出课程标准的要求,这虽然使高水平学生“吃饱了”,有了显示身手的机会,但同时也在无形中增加了这些学生的学业负担。而对于那些低水平学生而言,他们通常不会因为自己在低难度评价中获得高分而获得成功感,学习压力却因此不降反升。(2)不能准确评判所有学生达成课程标准的程度。课程标准是界定课程内容标准和表现标准的法定文件,它规定学生在经过一段时间学习后应该知道什么和能做什么,是大多数学生经过努力能达成的基本标准。而在分层评价中,不同水平的学生接受不同难度的评价,评价活动所依据的标准是不同的,有可能存在高出或低于课程标准的情况,使评价背离了标准参照的基本属性,不能准确评判学生达成课程标准的程度及教学的有效性程度。(3)不符合伦理原则。在分层评价中,为了迁就低水平学生,让他们获得理想分数和所谓积极的学习体验,教育者为其提供的低难度评价任务有可能低于课程标准要求。若真如此,在这样的评价体系中,即便低水平学生获得了理想分数,学生也并未达到课标要求。换而言之,学校和教师没有提供有效的教学,但学生却可以获得理想的分数,一部分不明就里的家长还以为学校教育令人满意,这其中包含着一定的欺骗成分,有悖于基本的教育伦理,是不道德的。

       实际上,从结果解释方式来看,义务教育阶段中小学所组织的评价与考试,包括随堂测验、单元测试、期中考试和期末考试等,其主要目的是衡量学生达成既定教育目标的程度,要依据国家课程标准解释结果,具有标准参照性质。因此,理想的评价要基于统一的课程标准而设计。无论是教学前的诊断性评价,还是教学过程中进行的形成性评价,抑或是教学结束后的终结性评价,学校和教师在自编测验时都要依据课程标准开发双向细目表,然后才选择合适的任务类型,设计评价题目,编辑与合成测验。2011年教育部制订的义务教育课程标准对各学科的内容标准和表现标准都做了明确的界定。比如,语文学科在内容上分为“识字与写字”、“阅读”、“写作”、“口语交际”和“综合性学习”等五个领域,而在不同学段各内容领域的具体目标也有清晰的描述。教师可以据此开发双向细目表,从内容和目标两个维度上确定评价范围和规划评价设计。除课程标准之外,2001年安德森(Anderson,L.W.)等人发布的布卢姆教育目标分类学修订版也可为此提供重要的参考(13)。新版分类学将认知目标区分为“知识”与“认知过程”两个维度,其中“知识”维度包括“事实性知识”、“概念性知识”、“程序性知识”和“元认知知识”等四个二级亚类;“认知过程”维度包括“记忆”、“理解”、“应用”、“分析”、“评价”和“创造”等六个亚类。教师可结合课程标准,采用这一分类体系从知识和认知过程两个维度上开发双向细目表,作为测验编制的基本蓝图。

       只有依据课程标准和双向细目表编制测验,才能准确有效地评价每个学生达成目标的程度,从而为教与学的改进以及教师绩效评估提供可靠依据。而在统一评价情况下,不同表现水平的学生获得不同,甚至差异很大的分数,学生之间的横向比较很难避免,但由此给学生带来的压力可通过分数隐私保护予以缓解。在这方面美国的经验可资借鉴。美国1974年颁布的《巴克利修正案》规定:教师不能张贴学生的等级排名;教师不能把学生作品作为好或坏的样例展示出来;教师不能允许学生对其他学生的作业进行评分或修改;教师不可以让回答正确或错误的学生举手;教师不能以任何其他同学可以看到分数的方式发试卷(14)。美国将“分数隐私保护”的原则性规定转化成一些具体行为条款,使之更具操作性。在我国,比较可取的做法是教师将学生个人分数、班级平均分、班级最高分,乃至排名等信息放在信封里提供给学生本人,这样每个人仅知道自己的分数和排名,每个人的分数隐私都可以获得有效保护,测验和考试所带来的压力可以在很大程度上得以缓解。

       当然,推行基于标准的统一评价,并不是说完全忽视学生的个体差异。相反,教师可通过课上和课下的双重努力回应学生的个性化学习需求。一方面,教师要有意识地改变传统的整齐划一教学模式,在课上引入生生互动与合作学习,推动异质学生之间的交流和互助,构建学生相互切磋、彼此激励的互惠文化,促进所有学生共同发展;另一方面,教师还要在课下指导学生,尤其是表现优秀、学习困难或学习风格与众不同的学生,通过参与选修课程、课下辅导和课外活动等渠道拓展或深化学习,帮助每个学生达成最佳表现。

       三、推动游戏入考

       形式单一,是当前评价与考试受人指摘较多的另一问题(15)。在绝大多数中小学,无论是形成性评价(包括平时测验、月考和期中考试等),还是终结性评价(包括单元验收、期末考试等),基本上都采取纸笔测验,题目类型相对稳定,以填空、选择、判断、连线、计算等答案唯一的客观题目为主,辅以少量简答、论述、写作文等建构反应类的主观题目。这些测验考查的主要是低水平的知识以及孤立的技能,难以评价学生在真实世界中运用所学知识和技能分析问题与解决问题的能力。为了应付这种评价与考试,教师通常布置大量作业和练习,学生则陷入题海之中,负担加重,苦不堪言。

       为创新评价形式,使评价与考试过程变得生动有趣,以改善学生参与评价与考试的情绪体验,在今年年初的期末考试中,北京、郑州、宁波等地不少学校积极推出没有试卷,不计分数的特色考试,用“玩游戏”代替了传统的期末纸笔考试。以北京市育才学校小学部为例,该校低年级小学生人手一张“智慧闯关快乐遨游”体验卡,他们可以尝试“把耳朵叫醒”、“蚂蚁搬家”、“分秒不差”、“奇思妙想”等多个项目关卡,每通过一项体验,家长志愿者评委便会给他们几颗代表得分的小星星(16)。以往严肃紧张的期末考试俨然变成了“期末嘉年华”,受到孩子们的热烈欢迎。实际上,游戏入考并不是新鲜事,早在本轮课改初期,为了淡化评价的甄别功能,使学生乐学和乐考,武汉市江汉区、长沙市开福区、柳州市等课改实验区已开始探索考试形式改革,由原来的学科统一考试变成分项考核,由原来的纸笔测验变成活动评价,游戏也已悄然进入期末考试。以江汉区红领巾学校为例,该校一年级语文考试分“我会写”(拼音、识字、书写)、“糖葫芦”(句子)、“露一手”(特长)、“我能读”(朗读)和“试一试”(选做题)等五个项目,考场也进行了精心布置,营造了一种欢快、亲切、宽松、和谐的氛围,创设了趣味化的情境(17)。

       游戏入考是否能切实改善学生的考试体验,使学生乐考?能否替代传统的期末考试?考试形式改革有哪些更好的举措呢?

       毋庸置疑,让学生不快乐的教育不是好的教育。在某些西方国家,教育督导机构将“学生喜爱受教育的程度”作为学校督导评估的重要指标,个别国家(如英国)甚至直接将其设置为“一票否决”式评估指标,如果某所学校的学生声称他们的学习体验不快乐,不喜欢所在的学校,那么这所学校即便学生学业成绩优异也会被认定为不合格学校(18)。在我国,在新课程理念的指导下,越来越多的学校开始关注学生的学习情感体验,重视愉快教育,游戏入考即可以被视作推进愉快教育的一种尝试。从媒体的报道来看,这种考试形式的变革似乎取得了立竿见影的效果,孩子们感觉考试也可以很有趣、很好玩,“孩子的参与方式和学习激情得到显著提高,酝酿和生产出更多快乐”(18)。但需要指出的是,愉快只是教育的目标之一,不是教育的全部。如果学生愉快了,可更多的认知目标和情意目标却没有得到落实,那么教育仍然不能称其为成功的教育。

       游戏式考试最容易被人质疑的是它的效度。效度是一个测量学概念,指的是对于一个既定的目标,测量在做出推论和提供解释过程中的有用性程度,也有人将其定义为一个测验实际能测出其所要测特质的程度。效度是测量和评估的根本。一个评价或考试如果效度不高,信度再高,难度再适当,也没有多大实际意义。游戏式考试的效度不良主要体现在两个方面:(1)内容效度(content validity)。尽管游戏式考试分项设计,每个考核项目基本对应了学科测量的一些主要领域,每一个游戏活动也都在一定程度上反映了学生在特定项目领域学习与发展的情况,但由于这些活动设计并没有严格依照课程标准和双向细目表,在整体上代表欲测学习领域的程度有限,其内容效度不能保证。(2)结构效度(construct validity)。具体到特定的游戏式考试题目,由于设计者要照顾活动的趣味性和选择性,题目测量的目标指向不够明确和清晰,在很大程度上破坏了题目的结构效度。例如,在某小学举行的数学期末游戏式考试中,有一个学生同伴互考的“比一比”活动,两个同桌小朋友互为合作伙伴,先是右边的同学做“主考”考左边的同学,每次两人各抽取一张纸牌,由被考者自由选择用加法或减法进行计算,可口算,也可笔算,主考认为被考者算对一次,就用印章给他盖一面小红旗,10分钟后双方互换角色进入新一轮活动(20)。这种考核活动不能准确描述学生在加法、减法、口算或笔算等方面达成既定标准的程度,结构效度不合乎要求。基于学生在这一活动中所得的小红旗数量,教师和家长很难对学生运算能力形成一个准确、有效的评判,管理者也很难据此客观分析教师的教学质量与工作绩效。

       必须警惕的是,效度不良的考试不仅不能准确评判学生达成课程标准的程度,而且不能及时发现学生学习与发展中亟待关注的问题,从而限制评价诊断、激励、发展功能的发挥,从长远来看必将在一定程度上影响教育质量和学生发展,最后反而加重学生的学习焦虑和负担。因此,游戏入考带给学生愉快的情绪体验,但它还不能全面替代传统的期末考试。在小学低年级如果将游戏式考试与传统考试结合起来,是较为可行的选择。教师可以加强形成性评价,在平时通过作业、随堂测验、单元验收测验等方式对学生达成阶段性目标的程度进行考核,期末考试时则用游戏方式进一步评价、欣赏学生的成就。学生们功在平时,乐在期末。学生在每个阶段的学习中都取得了积极的进展,都体验到学习的成就感和价值,心理负担少了,愉快高效地学习才能真正实现。

       综上所述,减少考试次数、实施分层评价和推动游戏入考,可以在短期内缓解学生的心理压力,但由于这些举措影响了评价反馈的及时性、公平性及效度,从长远效果来看并不利于学生的学习与发展,反而在一定程度上进一步增加学生的学习负担。教育者要本着育人为本、科学务实的态度,对每一项改革措施进行谨慎思考和深入论证,分析改革的利与弊,“两利相衡取其重,两弊相衡取其轻”,探寻更为合理、可行的改革路径。从整体来看,要彻底减轻学生过重负担,不能将目光局限于评价方式与考试次数上,更重要的是加强顶层设计,完善区域教育质量监测制度、学校督导评估制度及升学考试招生制度等关键制度。与整体政治经济体制改革一样,我国教育改革已经进入攻坚期和深水区,但只要各级教育行政部门锐意改革,勇于担当,就能逐渐破解减负难题。上海市于2011年推出中小学生学业质量绿色指标,对4年级、9年级学生进行抽样测评,评估、分析与比较各区县的学生学业水平指数、学生学习动力指数、学生学业负担指数、学生品德行为指数、身心健康指数以及上述各项指标的跨年度进步指数等多个指数(21)。这一举措稍加转化亦可向学校和学生个体层面延伸,以引导中小学校在全面质量观指导下开展教学与评价活动,既减轻学生课业负担,又促进学生全面发展,从而实现减负增效。

       [收稿日期]2014-03-17

       注释:

       ①刘本固:《教育评价的理论与实践》,杭州:浙江教育出版社,2000年版,第54-58页;[美]Popham W.J.:《促进教学的课堂评价》,国家基础教育课程改“促进教师发展与学生成长的评价研究”项目组译,北京:中国轻工业出版社,2003年版,第7页。

       ②上海市教委:《上海市教育委员会关于进一步规范课程教学工作深入实施素质教育的若干意见》(沪教委基[2010]23号)。

       ③北京市教委、北京市人民政府教育督导室:《关于切实减轻中小学生过重课业负担的通知》(京教基一[2013]2号)。

       ④逢超:《牵住改革考试制度这个“牛鼻子”——关于中小学生课业负担过重问题的再思考》,《基础教育研究》,1995年第5期,第38-39页。

       ⑤陈传锋:《中学生课业负担过重:程度、原因与对策——基于全国中学生学习状况与课业负担的调查》,《中国教育学刊》,2011年第7期,第11-16页。

       ⑥[美]泰勒:《课程与教学的基本原理》,黄炳煌编译,台北:桂冠图书公司出版社,1981年版,第6页。

       ⑦效果量(effective size)通常用d表示,其计算方法是用实验组平均数和对照组平均数的差除以对照组标准差。传统的实验效果分析多通过推论统计检验进行,但这种分析方法受样本量大小的影响很大。有时候,实验组和对照组的差异即使非常小,但由于样本量足够大,检验后也可能达到显著性水平。而效果量是一个不依赖样本大小,能客观反映自变量和因变量关联强度的指标。美国心理学会很早就明确要求所有公开发表的研究报告在分析实验效果时必须提供效果量的测定结果。资料来源:权朝鲁:《效果量的意义及测定方法》,《心理学探新》,2003年第2期,第39-44页。

       ⑧Bangert-Drowns R.L.,Kulik J.A.Kulik C.C.Effects of frequent classroom testing.The Journal of Educational Research,1991,85 (2):89-99.

       ⑨Hausknecht J.P.et.al.Retesting in selection:A meta-analysis of coaching and practice effects for tests of cognitive ability.Journal of Applied Psychology,2007,92 (2):373-385.

       ⑩Shin S.,Slater C.L.& Backhoff E.Principal perceptions and student achievement in reading in Korea,Mexico,and the United States:Educational leadership,school autonomy,and use of test results.Educational Administration Quarterly,2012,49 (3):480-527.

       (11)Oakes J.Keeping track:How schools structure inequality (2 edition).New Haven,CT:Yale University Press,2005:61-149; [日]佐藤学:《“分层教学”有效吗》,钟启泉译,《全球教育展望》,2010年第5期,第3-7页。

       (12)Hallinan M.T.The detracking movement:Why children are still grouped by ability.Education Next,2004,4 (4):72-76.

       (13)[美]安德森等:《布卢姆教育目标分类学修订版》,蒋小平等译,北京:外语教学与研究出版社,2009年版,第30-70页。

       (14)[美]萨克斯:《教育和心理的测量与评价原理(第四版)》,王昌海等译,南京:江苏教育出版社,2002年版,第38页。

       (15)张云霞:《中小学考试评价制度存在的问题与对策》,《教学与管理》(理论版),2011年第11期,第48-49页。

       (16)雷泓霈:《“游戏入考”激活孩子潜能》,《新京报》,2014年1月14日,第A02版。

       (17)(19)刘晓鸣:《让考试成为学生愉快的经历——学期末看武汉市江汉区小学考试试点改革》,《成才》,2002年第2期,第33-35页。

       (18)Ofsted.The framework for school inspection in England under section 5 of the Education Act 2005,from September 2009.London:Ofsted,2009:9.

       (20)雷泓霈:《“游戏入考”:考试评价也可“麻辣鲜香”》,《教师报》,2014年1月22日,第01版。

       (21)上海市教委:《上海市教育委员会关于〈上海市中小学生学业质量绿色指标(试行)〉的实施意见》(沪教委基[2011]86号)。

标签:;  ;  ;  ;  ;  ;  

减轻负担背景下的考核改革_课程标准论文
下载Doc文档

猜你喜欢