项目反应理论在标准化试题库中组卷策略和参数模型研究论文

项目反应理论在标准化试题库中组卷策略和参数模型研究

王俊臣1,贾少青2,王广超3

(1.德州市招生考试委员会办公室,山东 德州;2.德州市教育和体育局,山东 德州;3.德州学院 信息管理学院,山东 德州)

摘 要: 用项目反应理论来研究标准化试题库系统,主要是探究教育大规模招生考试的新理论应用,探讨了项目反应理论论指导标准化试题库组卷策略分析,探讨了标准化试题库系统关键参数模型设计,为试题库系统因材施教的基础上制定出考试方案和计划。

关键词: 标准;题库;项目反应理论;参数模型

一 引言

在互联网+、云计算和大数据快速发展的今天,通过计算机网络在线标准化试题库考试系统得到广泛的应用,无论是计算机自适应组卷测试系统,还是计算机题库智能组卷系统得到广泛的应用,都得到广泛的应用。项目反应理论(Item Response Theory,IRT)指导下的标准化试题系统通过经典测量理论(CTT)方法、信息量分析和特征曲线,获得试题选题策略、参数估计方法等,来设计标准化系统的难度和区分度的要求、试题的类型和质量,主要通过特征曲线描述试题参数的特征和能力参数,有效地克服了经典测量理论(CTT)无法建立试题参数与被试者得分之间的函数关系的局限性。

在标准化试题库建设的过程中,采用项目反应理论最大似然参数估计法是工作中难度最大,研究人员如何确定项目反应的模型是一维还是多维?是单参数模型、双参数模型还是三参数模型?是多值分布还是0、1分布?为解决上述问题,需要考虑使用什么软件进行项目参数方法估计是解决问题的关键。

二 项目反应理论指导标准化试题库组卷策略分析

项目反应理论组卷策略和经典测量理轮组卷策略从教育学、心理学分析来说在测量能力层次、内容、目标等方面存在相同的特征,因此下面主要研究标准化试题库中组卷策略的技术和理论分析。

1.标准化测试系统设计

应用项目反应理论进行标准化试题库组卷,需要考虑选择那一个测验模型。模型的选择根据测验的现实进行需求分析,确定测验的潜在特质是多维还是单维模型,同时选择是多值分模型还是双值记分模型,这完全是由标准化测试系统的题型所决定的。参数模型的选择关系到系统的设计模型,如果系统中导入的题型是双值记分题,则可以选择较容易的双分值记分模型;如果系统中导入的题型是多值记分模型,则可以选择多值记分模型。根据考试不同层次的需要,选择不同的参考模型是实现系统设计的关键。

1.被测试者能力参数值估计

标准化测试试题库项目参数的设计是建立在等值参数基础上,通过基本应用统计方法实现将系统的一个参数向另一个参数转换,因此实现该策略主要的工作是做好等值测试。

在理论上取值范围在0到1之间,对被测试者能力较高的影响不大,但对于能力较低的被测试者答对的正确的影响较大,在现实中题目质量较差的取值范围一般在0到0.5之间,的值经过多次迭代,到项目结束收敛一个足够小的值,最终收敛的值就是被测试者能力估值。

2.标准化测试项目参数等值策略方法

当细白的蟹肉与Bin311在舌尖上不期而遇,便开始成就一场味蕾的盛宴:霞多丽清新而爽口的果香,弥漫着桃子与梨皮的气息,化解了蟹膏的浓腻,唇齿留香;冷凉产区溯源地的葡萄提供了脆爽而持久的酸度,不仅解腻而且还提升了蟹的鲜美;经由橡木桶的“画龙点睛”而呈现出燧石的复杂度与乳脂般质地的酒体,更是与蟹的甜美交相呼应并将其所有的鲜味唤醒,令人愉悦。一眨眼的功夫,佐以干白,几屉蟹便已全部食得干净,回味无穷。

三 标准化试题库系统关键参数模型设计

分别向空白猕猴桃和土壤样品中添加4个水平的螺虫乙酯及其4种代谢产物的混合标准溶液,添加水平分别为0.05、1.0和2.0 mg/kg。按1.3节方法进行前处理,按1.4节条件检测,计算添加回收率及相对标准偏差(RSD)。

品牌农业区域效应逐步显现。卧龙区通过发展龙头企业、培育农业品牌等举措,充分发挥品牌农业企业的产业链优势,提高标准化、区域化、产业化经营水平,提高农业经济整体效益,有力地推进区域经济的增长。如石桥的月季,现已发展到卧龙区的各个乡镇;石桥的老姜历史悠久,姜质优良,在石桥的各个村都有不同规模的种植;谢庄龚河的玫瑰花、董营的红薯已发展到周边村种植;蒲山的桃、潦河坡的石榴、潦河的葡萄等因特色不同,形成了不同的旅游观光区,而且由于产品品质优良,在南阳乃至武汉、上海等大中城市备受欢迎,品质优良价位高,品牌效应有所显现。

分布于长江南岸,主要由长江冲积物构成,次为河湖堆积物,厚度20~25 m左右,局部35m。堆积物具“二元结构”,上部黏土及粉质黏土,下部砂层及砂砾石层。由于受丘陵影响,呈窄长带状分布,平均宽度大于1 000 m,表面平坦,略向长江倾斜,坡降小于1‰。

表示被测试者能力为θ的考生的猜测度为ci、区分度为ai、难度为bi进行对标准化试题库进行作答,其作答正确的概率为Pi(θ)。三参数的项目特征曲线如图1所示:

图1 三参数项目特征曲线

在标准化试题库测试过程中被测试群体的不同,导致项目估计的参数不同。在构建一个大型题库的过程中,不同被试群体进行项目测试,其项目的参数参照系存在很大的差异。在经典测量理论试题库中对参数参照系的统一性是完全难以解决的现实问题。在项目反应理论标准化测试中实现参照系的统一完全通过项目参数的等值策略方法来完成。

标准化试题库在建设的过程中我们对被试者能力参数估计主要采用了三参数Logistic模型:

2.标准化试题库抽题策略参数控制

绿色设计是当今社会现状设计师们必须考虑的问题,我们现在面对的诸多环境问题,与城市交通压力,让我们作为设计师不得不去考虑,如何将摆在面前的诸多问题解决、重组、再统一。在“绿色小型代步工具”设计中设计师以“绿色”作为出发点,本着“回收利用最大化,拆卸重组完全化,材质选择零污化”的原则将设计作品最终完成。取其前人的经验,去其自身方案的糟粕。笔者认为,在设计中,应该打破保守思想,但也要注意不要喧宾夺主。应该以新知识新观念为依据,大胆使用绿色环保新材料,力求不断推出大方实用、新颖美观和别具特色的小型代步工具,为设计作品增加亮点,为后人做出榜样。

在标准化试题库中我们随机求取六个难度不同的题目,采用三参数最大似然估计法来对被试者进行能力估计,当被测试者出现完全对和答错的情况下,其能力值无法估出,针对这种情况我们采用了两条策略:第一,随机抽取的六个题目中,为了防止被测试者答题出现全错或全对的情况,抽取难中易的题目各占两道;第二,当被测试者在答题的过程中,出现全错或全对的情况,这时我们将答题全对的测试能力的值加三,答题全错的测试能力的值减三。这仅仅是三参数极大似然估计的一种补救策略。

经过参数模型优化后的选题策略是:根据信息量优先的情况下,题目的知识点相对均匀,降低重复使用的题目。通过初始值估计出与被测试者能力相应的所有项目的信息量。在项目中信息量大的题目被选中的概率优先级别概率越高。在标准化试题库中根据选题的次数和知识点的分布,来设置题库中参数的估计能力,从而实现知识点均匀分布,降低重复题目的概率。

四 结语

通过对标准化试题库的策略分析和参数模型设计分析,如何建立一个合理的项目测试目标难度区间,被测试者能力控制在一个什么区间范围合适,从而提高招生考试的效率和信度,利用先进的项目测试理论指导考试改革,实现考试标准化需要我们认真探讨和研究,创造出一套适合我国教育发展的考试理论和方法。

参考文献

[1] 黄建丹.项目反应理论简介[J].学理论,2011,17:271-272.

[2] 李映红.项目反应理论在构建标准化考试题库系统中的应用[J].邵阳学院学报( 社会科学版),2012,10:91-93.

[3] 潘浩.高阶IRT模型-项目反应理论的新进展[J].考试研究 ,2014,2:59-61.

[4] 吕岚.基于项目反应理论的自适应考试系统设计[J].陕西理工学院学报,2013,4:50-52.

[5] 詹沛达,王文中,王立君.项目反应理论新进展之题组反应理论[J].心理科学进展,2013,21:2265-2280.

本文引用格式: 王俊臣,等.项目反应理论在标准化试题库中组卷策略和参数模型研究[J]. 教育现代化 ,2019,6(48):221-222.

doi: 10.16541/j.cnki.2095-8420.2019.48.094

基金项目: 山东省教育科学规划“教育招生考试科学研究专设课题”。

作者简介 :王俊臣,男,山东德州人,德州市招生考试委员会办公室,主任;贾少青,男,山东德州人,德州市教育和体育局,主任科员;王广超,男,山东枣庄人,德州学院信息管理学院,讲师。

标签:;  ;  ;  ;  ;  ;  ;  

项目反应理论在标准化试题库中组卷策略和参数模型研究论文
下载Doc文档

猜你喜欢