基本认知能力测验的编制与标准化_工作记忆论文

“基本认知能力测验”的编制及标准化工作,本文主要内容关键词为:认知论文,能力测验论文,标准化工作论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号B841.7

1 前言

近期国际老年心理学领域关于认知老化的研究进展很快。我们近10年来在毕生发展观点的指导下,围绕认知老化及其机制问题做了一系列研究,已取得较系统的研究成果。在认知老化行为学方面,除了对记忆、运算、归纳推理、空间定向等一般认知能力老化规律的研究外[1-3],还着重对认知速度(包括知觉速度及复杂认知活动的加工速度)和工作记忆的老化过程、年龄敏感性、及其在认知老化机制中的作用做了探讨[4-9],并对认知速度的显著减慢、记忆能力的严重减退、以及运算困难对于脑血管疾病认知功能障碍的临床检测价值做了应用性研究[10]。就国外和我们的研究工作所取得的成果来看,除了对一般认知能力老化问题的研究外,特别需要强调的是关于认知速度和工作记忆的研究,以及对其应用价值的探讨。

早期的大量工作已观察到在毕生发展过程中反应时随增龄呈"V"字型变化,在成年之前反应时随增龄而缩短,在成年之后反应时则随增龄而延长。但是,长期以来对于反应速度在评价认知功能年龄差异方面的价值一直被忽视,直到20世纪80年代以后才引起老年认知心理学家的重视。关于认知速度的老化是近20年来老年认知心理学研究的一个热点,大量结果不仅证明认知速度与年龄呈函数关系,速度是评价认知功能年龄差异的一项重要指标和决定因素;而且阐明速度因素是认知老化机制的重要调节因子,认知速度已被看作是一种特殊能力[6-8,11-13]。而且,业已发现阿尔兹海默型老年性痴呆症(Senile Dementia of Alzheimer Type)患者认知速度严重减慢[14,15]。

20世纪90年代以来,关于工作记忆老化的研究成为老年认知心理学领域继认知速度老化研究之后的另一个热点。大量研究已观察到工作记忆与年龄及其认知功能之间关系密切,工作记忆可能是评价认知功能年龄差异的另一项重要指标[16-19]。由于工作记忆是一种对信息进行暂时性加工和储存的能力和系统,工作记忆是认知活动的加工资源(Processing Pesource),从广义上讲工作记忆是“脑的工作台”(Desktop of the Brain)[19,20],因此,工作记忆对于复杂认知活动的完成应该起非常重要的作用。目前正在深入探讨工作记忆在认知老化机制中的作用,有人认为工作记忆是一般认知能力的另一个决定和调节因素[21,22]。Baddeley将工作记忆分为“中央执行子系统”、“语音环”和“视觉空间成分”三个子系统[23]。业已发现阿尔兹海默型老年性痴呆症患者认知速度严重减慢的同时,工作记忆也严重受损,并且语言障碍是工作记忆严重受损的结果[24];早期患者尽管工作记忆系统的“语音环”保持完好,但其“中央执行子系统”已有实质性的损害[26,27]。上述结果说明,认知速度的严重减慢和工作记忆能力的受损,对于认知功能障碍的临床检测和老年性痴呆症的早期诊断可能有重要意义。

近期国际关于认知老化及其心理机制的研究进展迅速,其主要原因之一是由于计算机技术的发展而推动了心理学实验方法的改进。在微机上进行认知测验才使其对认知速度的研究成为可能。我们在进行认知老化实验研究的工作中深刻体会到,在微机上以人机对话方式进行认知能力测验是一种很好的方式,主要具有以下优点:(1)每项测验前指导语呈现在屏幕上,主试者可根据被试者的情况作适当讲解,这较言语—操作方式测验时指导语由主试者讲解或用录音机播放效果更好,既保证了指导语的一致性,又便于被试者对指导语的理解;(2)计算机具有准确记录反应时(或完成时间)和测验成绩,并立即对数据进行计算统计等优点,这对于考查认知速度和认知效率尤其重要;(3)测验刺激以随机方式呈现,由此可得到多套等价测验,以替代言语—操作方式测验至少需要编制性质相同、难度相当的两套测验来满足实际工作的需要。上述优点为理论研究和实际应用带来许多方便。

将已取得的理论研究成果尽可能快地应用于实践,这应该是应用基础研究的最终目的。因此,我们在进行认知老化及其机制理论研究的同时,希望能建立一套便于在通用的微机上进行的有新特点的反映基本认知能力的测验;同时也希望将新的测验技术和测验方法用于认知能力测验。为此目的,我们在有关认知老化前期研究工作的基础上,自1996年开始,陆续重新设计了10余项认知能力测验,其软件程序用C语言编写,并对所设计的测验项目的年龄敏感性做了比较和筛选工作,为建立这套在微机上进行的“基本认知能力测验”奠定了丰厚的基础。经过充分的准备之后,于1998年开始编制这套测验,并从下半年开始在全国范围内取样实验及其标准化工作,全部工作历经两年多时间完成。

2 设计思想和编制原则

总的设计思想和编制原则:该测验除了应包括一般认知能力测验外,要尝试对理论研究新成果的应用;并要应用新的测验技术和测验方法;建立一套有新特点的实用的基本认知能力测验。具体考虑如下:

(1)近期研究成果证明,认知速度是认知能力年龄差异的一项重要指标和决定因素,认知速度已被视为一种特殊能力,因此,该测验应设计项目测查认知速度及认知效率。

(2)最新研究表明,工作记忆是认知能力年龄差异的另一项敏感指标,且在复杂的认知活动中起非常重要的作用,因此,该测验应设计项目测查工作记忆能力。

(3)记忆是一般认知能力的重要组成部分,为全面考查记忆能力,该测验设计的记忆分测验应包括语文、数字和图形记忆三方面内容。

(4)思维和空间能力也是一般认知能力的重要组成部分,因此,该测验应设计项目分别测查思维和空间能力。

(5)知觉和表象是认知活动的基本过程,设计测验项目时也应加以考虑。

(6)由于测验内容和测验在微机上进行的需要,被试者需要具有一定教育程度。为了适用于尽可能宽的年龄范围,又能满足测验要求,考虑测验的设计定位在最低具有小学4年级教育程度可以完成,相应的年龄范围定为10-90岁。

(7)由于在微机上进行测验具有诸多优点,因此,该全套测验设计在微机上以人机对话方式进行,测验刺激采用随机方式呈现,以提供多套等价测验满足实际工作的需要。

(8)由于测验在微机上进行,记忆分测验采用再认测验方式。

(9)为了适宜于少年儿童、老年及临床应用,测验难度既要适当,但又有鉴别作用;分测验不宜过多,测验时间不宜过长。

3 测验及其软件的编制

3.1 测验的编制

根据上述设计思想和编制原则,在大量研究工作的基础上,选择并编制了以下7项分测验,测验时间30分钟左右。分测验1测查知觉速度,分测验2测查思维效率,分测验3以测查心理旋转效率反映空间表象效率,分测验4测查工作记忆能力,分测验5测查语文记忆能力,分测验6测查数字记忆能力,分测验7测查图形记忆能力。7项分测验具体内容如下:

3.1.1 数字鉴别 屏幕中央随机显示单个数字,要求被试尽快选择小键盘上相应的数字键回答,共10次。记录反应时,并统计平均反应时和标准差。

3.1.2 心算 随机的2个1位数的加减(3题)、2个2位数相减(4题)和3个2位数的加减(3题)运算题,答案均为1位数,共10题。要求被试尽快按小键盘上的数字键回答,共10次。上述三类题目各题分别为1、2、3分,满分20分。记录测验成绩和完成时间,并以测验成绩除以完成总时间计算出心算效率。

3.1.3 汉字旋转 屏幕中央随机单个显示旋转不同角度的正写或反写的简单汉字,要求被试判定所呈现的刺激是“正”或“反”字,尽快选择键盘上设置的“正”、“反”键回答,共10次,其中0°正、反字各2次,90°正、反字各1次,-90°(即270°)正、反字各1次,180°正、反字各1次。0°正、反字分别为1分,90°和-90°正、反字分别为2分,180°正、反字分别为4分,满分20分。记录测验成绩和完成时间,并以测验成绩除以完成总时间计算出汉字旋转效率。

3.1.4 数字工作记忆 要求被试在完成2个1位数加减的同时记住答案,并在完成数题后将各题答案按顺序用数字键回答出来。心算从1道题开始,逐题增加,至2次算错或记错终止。记录数字工作记忆广度。

3.1.5 双字词再认 屏幕上先定时随机序列呈现20个双字词(目标刺激),要求被试记住,然后再随机逐个呈现包括20个未见过的双字词(混入刺激)在内的共40个双字词,要求被试按设置键回答再认结果。正确再认1个双字词得0.5分,虚报1个双字词扣0.5分。记录再认正确数及虚报数,并以再认正确分减去虚报分后再乘以2,得出双字词再认成绩,满分20分,最低成绩0分。

3.1.6 三位数再认 屏幕上先定时随机序列呈现10个随机组成的3位数(目标刺激),要求被试记住。测验时再随机逐个呈现包括10个未见过的3位数(混入刺激)在内的共20个3位数,要求被试按设置键回答再认结果。正确再认1个3位数得1分,虚报1个3位数扣1分。记录再认正确数及虚报数,并以再认正确分减去虚报分后再乘以2,得出3位数再认成绩,满分20分,最低成绩0分。

3.1.7 无意义图形再认 屏幕上先定时随机序列呈现10个无意义图形(目标刺激),要求被试记住。测验时再随机逐个呈现包括10个未见过的无意义图形(混入刺激)在内的共20个无意义图形,要求被试按设置键回答再认结果。正确再认1个图形得1分,虚报1个图形扣1分。记录再认正确数及虚报数,并以再认正确分减去虚报分后再乘以2,得出无意义图形再认成绩,满分20分,最低成绩0分。

3.2 测验软件的编制

测验软件用C语言编写,包括测验应用程序和测验结果的计算统计及打印程序。该软件可在486或586微机上应用,用中文打印结果。

4 测验标准化

4.1 取样

4.1.1 区域 取样包括华北、东北、华东、中南、西南和西北六大行政区,在2个直辖市和20个省份共在27个市县取样。各行政区取样不少于300人,共取样2443人。全国各地区取样人数见表1。

表6 各分测验之间的相关系数(r)

注:除了双字词再认与汉字旋转分测验之间的相关性p=0.003外,其他分测验之间的相关性均p<0.001。

4.1.2 年龄、分组及性别 该测验适用于具有小学4年级以上教育程度的儿童、青少年和中老年人,10至90岁;分为学生和成人两部分:学生部分包括小学生组(4-6年级,约10-12岁)、初中生组(约13-15岁)、高中生组(约16-18岁)、大学生组(约19-23岁),共834人;成人部分20-90岁,以10岁段划分为7个年龄组,共1609人;男女取样比例为1:1(男1222人,女1221人)。取样数据见表2。

4.1.3 职业及教育程度 职业大致分为学生(即学生样本,共834人)、科技、文教、行管、医护、财会及工农兵等七类(后六类为成人样本,共1609人);教育程度包括小学程度(4-6年级,共319人)、中学程度(共1134人)和大学程度(共990人)。取样数据见表3。

4.2 区分度及难度分析

取北京及河北省样例200例(男、女各100例),选取每项测验的高分组和低分组各50例(各占25%),计算出每组各个项目的通过率。两组通过率之差为鉴别指数,以鉴别指数表示区分度(鉴别指数越大,其区分度越大),以高分组与低分组通过率之和的平均值作为各分测验的难度指数(难度指数越小,其难度越大)。由表4数据看出,各项分测验的鉴别指数均在0.330以上,表明区分度均良好;双字词再认和无意义图形再认难度稍小(难度指数值分别为0.644和0.634),其他分测验难度均适当(难度指数值在0.490-0.557范围)。

4.3 再测信度检验

以高初中学生(13-19岁)、青年组(20-39岁)、中年组(40-59岁)、老年组(60-89岁)各20-30人,共100人(男41人,女59人)作为被试。在完成第一次测验后间隔4至6周,再做第二次测验。将两次测验结果做相关分析,以检验再测信度。由表5数据看出,各项分测验的再测相关系数值在0.592至0.920范围(p<0.001),相关显著,表明各项分测验再测信度均良好。

4.4 测验的内部一致性:分测验间的相关分析

以北京及河北省样例200例(10-90岁,男、女各100例)测验结果做分测验间的相关分析。由表6数据可以看出,各项分测验之间的相关系数值在0.209至0.733范围,表明除了个别分测验之间相关偏高外,多数分测验之间相关适当,说明该测验的内部一致性良好。

4.5 效度检验

4.5.1 测验结果与学习成绩的相关分析

以北京某中学初中两个班85名(男57名,女28名)学生作为被试,将测验结果与学习成绩做相关分析。由表7数据可看出以下几点:(1)三科学习成绩与各项分测验结果的相关系数值在0.244至0.599范围(p<0.05至p<0.001),表明学习成绩与认知能力相关显著;(2)三科学习成绩与心算效率和数字工作记忆广度相关系数的平均值(0.550和0.436)大于与其他测验相关系数平均值(0.320至0.379),表明思维效率和工作记忆能力较其他能力对于学习更为重要;而且,数学和英语成绩与心算效率和数字工作记忆广度的相关系数值(0.597和0.599,0.487和0.446)分别大于语文与心算效率和数字工作记忆广度的相关系数值(0.453,0.375),表明思维效率和工作记忆能力对于数学和英语的学习又较对于语文的学习更为重要;(3)数学和英语成绩与无意义图形再认能力的关系(相关系数分别为0.462和0.411)较与其他两项记忆能力的关系(相关系数为0.313至0.359)更大;(4)数学和英语成绩与空间表象能力的关系也较大(与汉字旋转的相关系数分别为0.417和0.425),语文成绩与空间表象能力的关系较小(与汉字旋转的相关系数为0.244)。

4.5.2 三项记忆分测验与临床记忆量表的相关分析

中老年被试71名(男26名,女45名),45-79岁,在完成临床记忆量表测验1-2周后再进行认知能力测验。将临床记忆量表测验结果与认知能力测验三项记忆分测验结果做相关分析。由表8数据可以看出以下几点:(1)认知能力测验的“双字词再认”与临床记忆量表的“无意义图形再认”及总分相关显著(p<0.05);(2)认知能力测验的“三位数再认”与临床记忆量表的“人像特点回忆”及总分相关显著(p<0.05);(3)认知能力测验的“无意义图形再认”与临床记忆量表的“无意义图形再认”及总分相关极为显著(p<0.001),并与临床记忆量表的“人像特点回忆”相关显著(p<0.01);(4)认知能力测验三项记忆分测验总分与临床记忆量表总分及“人像特点回忆”的相关极为显著(p<0.001),并与临床记忆量表的“无意义图形再认”和“联想学习”相关显著(p<0.01和p<0.05)。

4.5.3 测验结果与年龄的回归分析

全样本2443例测验结果与年龄之间做回归分析。令年龄为X变量,各分测验的测验结果为Y变量,回归分析结果为Y是LogX的二次函数,表明各分测验的测验结果随年龄的对数呈抛物线变化,最优拟合方程如下:

4.6 等值年龄测验分的换算及换算表的编制

4.6.1 等值年龄测验分的换算及换算表的编制

等值年龄测验分的换算包括学生和成人两个部分,两部分的换算方法相同。参考“临床记忆量表”手册年龄量表分的换算方法[27],根据该测验的具体情况,分别以学生和成人样本每个年龄组各分测验的平均值为参照点,规定为及格分(即12分),原则上增加(或减少)一个标准差增加(或减少)4分,满分20分,但前4项分测验的分数上不封顶,仍按上述标准加分;最低0分。根据此原则分别编制学生和成人各年龄组量表分换算表。

4.6.2 加权处理

为了保证知觉速度、思维能力、空间表象能力、工作记忆和记忆五个方面能力在测验评分中占同等的比重,在计算测验总分时需作加权处理。具体的作法是:先将换算后的三项记忆分测验的等值年龄量表分相加之和除以3,得出记忆能力的评分;然后与前4项分测验的等值年龄量表分相加,得出测验总分,满分100分。特别优秀者可超过100分。

5 讨论

我们在多年来大量研究工作的基础上编制了这套基本认知能力测验。该套测验包括对记忆、思维、空间表象等一般认知能力的测验,同时还包括对知觉速度、认知效率、以及工作记忆能力的测验。该测验的特点是既保证了对一般认知能力的测验,又尝试了对理论研究新成果和新的测验技术和测验方法的应用。全套测验设计在微机上以人机对话方式进行,刺激以随机方式呈现,由此提供了多套等价测验以满足实际工作的需要。

该测验在全国六大行政区取样共2443人。区域和性别取样均衡,各行政区取样人数占总人数的13.7%至20.3%,男女比例为1:1。学生部分共834人(占总人数的34.1%),取样均衡,4个组的人数分别占学生样本的25.0%左右(24.0%-26.0%);成人部分共1609人(占总人数的65.9%),取样基本均衡,除了70和80岁组人数偏少(分别占成人组样本的8.6%和3.1%)及20岁组人数偏多(占成人样本的22.9%)外,其余4个年龄组分别占成人样本的16.0%左右(15.3%-17.1%)。职业分类及其取样合理,成人样本划分为6种职业,其中行管和工农兵等人数偏多(分别占成人样本的24.2%和23.9%),科技和文教人数适中(分别占成人样本的16.0%和18.0%),医护和财会人数偏少(分别占成人样本的11.2%和6.8%)。由于该测验适用于具有小学4年级以上教育程度的儿童、青少年和中老年人(10至90岁),而且主要用于城市,因此,教育程度的取样大致合理,其中小学程度较少(占总人数的13.1%),中学程度较多(占总人数的46.4%),大学程度居中(占总人数的40.5%)。成人样本各年龄组间的教育程度大致匹配,各年龄组大学程度人数占该年龄组人数的40.0%至59.3%。此外,各行政区的取样均包括所有职业及各年龄分组。因此,从上述数据看出该测验的取样是比较全面的和合理的。值得指出的是,在微机上完成在全国六大行政区包括2个直辖市和20个省份共27个市县取样2443例的测验,其工作难度是比较大的。

项目分析考查了该测验的区分度及难度、再测信度、以及内部稳定性。结果表明:(1)该测验的区分度良好(各项分测验的鉴别指数均在0.330以上),难度适当(难度指数值在0.490-0.644范围,其中双字词再认和无意义图形再认难度稍小)。(2)该测验的再测信度良好,各项分测验的再测相关系数(r)值在0.592至0.920范围(p<0.001),其中数字鉴别、心算及数字工作记忆的再测信度尤其好(r值为0.790-0.920)。(3)该测验的内部一致性良好,各分测验之间的相关数值在0.209至0.733范围(p值为0.003至0.001),表明各项分测验之间相关较好。

效度检验考查了测验结果与学习成绩的相关、认知能力测验的三项记忆分测验与临床记忆量表的相关、以及测验结果与年龄的相关。主要结果为:(1)测验结果与学习成绩之间的相关显著。首先观察到语文、数学和英语三科学习成绩与各项分测验结果的相关均好(r值为0.244-0.599,p<0.05至p<0.001);并且发现三科学习成绩与心算效率和数字工作记忆广度相关系数平均值(0.550和0.436)大于与其他分测验相关系数平均值(0.320-0.379),表明思维效率和工作记忆能力较其他能力对于学习更为重要;而且,数学和英语成绩与心算效率的相关系数值(0.579和0.599)以及与数字工作记忆广度的相关系数值(0.487和0.446)分别大于语文与心算效率和数字工作记忆广度的相关系数值(0.453和0.375),表明思维效率和工作记忆能力对于数学和英语的学习又较对于语文的学习更为重要。该结果证明思维效率和工作记忆能力对于学习,尤其是对于数学和英语的学习有重要意义;并证明思维效率和工作记忆能力较其他认知能力指标更有应用价值;(2)认知能力测验的三项记忆分测验与临床记忆量表的相关显著。认知能力测验的三项记忆分测验总分与临床记忆量表总分之间、认知能力测验的各项记忆分测验与临床记忆量表总分之间、以及两套测验的某些记忆分测验之间相关显著(p<0.05至p<0.001),证明该认知能力测验的三项记忆分测验的有效性。(3)在10-90岁范围,各项分测验的测验结果随年龄的对数呈抛物线变化,符合实际情况。一般来说,从10到20岁左右,基本认知能力随增龄而提高;从20岁左右到90岁,基本认知能力将随增龄而逐渐下降。

从上述讨论可以看出,该测验的取样全面、合理,难度适当,其区分度、再测信度、内部一致性和效度均良好。尤其需要强调指出的是,从中学生测验结果与学习成绩之间的相关分析、以及测验结果与年龄之间回归分析可以看出,认知速度和工作记忆对于评价认知功能及其年龄差异具有非常重要的意义。结合已得到的临床研究结果[10],说明认知速度和工作记忆对于超常儿童的鉴别、人才的选拔、基本认知能力的年龄差异和老化程度及其障碍的临床检测有重要应用价值。而且,反映认知速度、认知效率和工作记忆的前4项分测验的年龄等值测验分换算采取上不封顶的方法,显然对于超常儿童的鉴别和人才的选拔有重要意义。

最后,需要说明的是,该套测验选择的测验项目并不能包括所有的基本认知能力,而只是我们多年来理论研究成果的一次应用性尝试,为进一步编制完善的基本认知能力量表或认知能力量表打下一个基础。尽管该套测验不可避免地会有这样或那样的缺点,但是,该套测验在测验内容和测验方法上,尤其是将认知速度和工作记忆用于对基本认知能力的评价方面,具有创新特点。因此,这是一套有新特点的、较全面的、实用的基本认知能力测验,有重要应用价值。

致谢:王玮雯、杨炯炯、李红参加部分实验工作,孙才、莫林峰、周亮、李锐协助编写和修改软件程序,全国取样实验得到49个单位50多位同志的协助,特在此致谢。

标签:;  ;  

基本认知能力测验的编制与标准化_工作记忆论文
下载Doc文档

猜你喜欢