建立中国应用能力评价体系的构想与思考_系统评价论文

建立中文应用能力测评系统的构想和思考，本文主要内容关键词为：中文论文,能力论文,系统论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

一研究背景

语言测试目前是应用语言学领域的一个热点，近几年来，与语言测试相关的理论与实践更是取得了长足的进步和发展。各种语言测试（包括母语水平测试、外语水平测试、语言教学的评估与测试等）不断涌现，常模参照测试与标准参照测试、客观性测试与主观性测试、经典测试理论(CTT)与项目反应理论(IRT)此消彼长，互相促进。从与语言教学的关系看，语言测试一般可分为两大类：一类是针对具体的教学大纲、教学目标、教学内容以至某种教材的测试；另一类是不专门针对任何具体教学，而是着眼于人掌握语言、运用语言的能力和水平的测试。前一类大致属于标准参照测试；后一类大致属于常模参照测试。

目前在我国内地围绕新的课程标准而开展的各种课程评估就是针对具体教学目标的评价，测试手段是其中一个重要的组成部分，另外还包括观察、记录、问卷调查等，评价内容涉及“知识与技能”“过程与方法”“情感与态度”等方面。类似的评价在我国台、港、澳以及其他国家和地区都在开展，而对中国语文科的评价则是我国特有的领域。课程评价最显著的特点是针对明确的课程标准和教学目标，针对具体的教学内容和教学过程。这类评估基本上属于标准参照的范畴，当然，教学评估有时也采用百分等级或年级当量等方法，这就属于常模参照的范畴了。测验方法一般分为两种：一种是以判断、填空、选择和简答等题型为主的客观性测验；另一种是以整合信息资源、完成实验任务、书面习作等形式为主的表现性评价，也就是主观性测验。课程评价最重要的作用是对教学的反馈，一方面对教师的教学活动提供参考；另一方面对学生的学习活动提供参考，具有衡量教学效果和学习效果、并间接表明教学和学习的得与失等作用。可以说，课程评价越来越成为一切有计划、有目的的各科教学的一个不可或缺的重要组成部分。

另一方面，针对不同人群的各种语言水平测试近年来也方兴未艾，比如我国的“汉语水平考试(HSK)”“普通话水平测试(PSC)”，美国的TOFEL等。这些语言测试都是独立于任何具体教学的水平测试，其着眼点是人的语言能力以及所掌握的语言知识及掌握的程度等。在绝大多数较大规模的语言测试中，出于对测试条件、测试效率、测试成本等因素的考虑，一般都以客观性试题为主，选择题、判断题、填空题等占了相当大的比重。当然，对于这种状况，一直都存在着两种截然不同的意见：赞成的一方强调客观性测试的信度，强调测试内容的典型、广泛和平衡；不赞成的一方指出客观性测试的效度不够理想，不能真实反映应试人的水平和能力。这些争论虽然各执一端，都不尽全面和合理，但是客观上却推动了语言测试向更深的方向发展。目前已经出现了书面作文的计算机评分系统，诚然这样的系统还有待实践的检验和进一步完善。

当然，任何一种测试都是为特定目的服务的，比如针对语文课程标准的评价，其中的“知识与技能”范畴主要是评价教学活动是否实现了预期的教学目标，学生是否掌握了课程内容、是否达到了某种教学要求等。而从语言文字应用能力着眼，全面描述学习者在不同学习阶段的行为表现，以及这种行为表现在层次和程度上显现出的差异等，则并不完全属于课程评价的范畴。HSK是一种标准化的语言水平考试，评价对象是母语非汉语的学习者，对象明确，用途明确，评价范围和评价指标主要是听力理解、阅读理解、语法结构和词语用法等，而识字写字、口语表达和书面表达等内容则没有列入初等、中等的考试范围，只有高等汉语水平考试中有作文和口语。

在我国，针对国家通用语言文字的国家级测试目前只有“普通话水平测试(PSC)”和“汉字应用水平测试(HZC)”。“普通话水平测试”根据自身的测试目的，其测试内容绝大多数针对普通话语音、词汇、语法等所占的比例并不大。“汉字应用水平测试”则主要针对应试人在阅读、书面表达等活动中能够掌握和运用规范汉字的数量，以及运用的正确程度和准确程度，词语、句子等较大语言单位只是作为汉字出现的语言环境，服务于衡量汉字应用水平的需要。这两种测试都属于中文应用能力测评的范畴，但还不是全面的中文应用能力测评。与此同时，各种外语测试在我国却开展得如火如荼，特别是一些部门和单位已经把某些外语测试定为资格认证和考核的依据或指标，例如大学英语的四六级考试等。反观国外，许多国家和地区针对本国人、本民族语言的测试和认证开展得十分普遍和广泛，例如在美国，有许多机构提供衡量学习者英语能力的测评服务，而且这些测评已经成为他们国民教育的重要组成部分。这种现象给我们提出了许多值得思考的东西，也提供了许多值得借鉴的宝贵经验。因此，根据汉语汉字的规律和特点，以及学习者、使用者学习和使用汉语汉字的规律和特点，研制全面衡量学习者、使用者使用中文水平的测评系统，已经到了必须起步的时候了。

二研究的目的、意义和作用

“中文应用能力测评”的最终目的是建立一整套科学的、标准化的中文应用能力测评体系，这个系统应当包括中文应用能力等级标准和测试大纲，包括试题、试卷、题库和评分标准等。整个系统应当具有标准明确、操作性强等特征，能够通过测试的方式对中文学习者和中文使用者的中文应用水平提供客观的描述和评价。

“中文应用能力测评”的对象理论上涵盖所有中文学习者和中文使用者，其中既包括母语为汉语的人，也包括母语非汉语的人。测评对象的中文程度从零起点一直到熟练准确使用。其中零起点有两层含义：一层是语言零起点，指的是母语非汉语的人在学习中文之前的状态；另一层是文字零起点，指的是以汉语为母语的人在学习汉字之前的状态。前一种是真正意义上的零起点；而后一种是特定含义上的零起点，姑且称之为准零起点。因此，测评标准和测评方法应当充分考虑这两种不同情况，明确对象，明确任务，加强针对性。

零起点和准零起点在测评内容方面既有互相重叠的部分，也有彼此独立的部分，其中最明显的差别应当是口语和汉字。相对而言，零起点的测评内容大致是口语重而汉字轻；准零起点则是汉字重而口语轻。这种情况与作为母语的中文教学现状和作为第二语言或外语的中文教学现状是完全一致的，因为这两类中文教学的教学目标就存在着明显差别，这些差别从我国部分民族地区的汉语教学、对外汉语教学、其他国家和地区的中文教学与我国大部分地区（包括台港澳地区）的中文教学对比中就可以清楚地看到。当然，针对两种不同类型的中文教学，测评内容上虽然各有侧重，但是作为衡量中文应用能力的基本测评指标应当是一个完整统一的体系，例如口语交际（包括聆听理解、口语表达）的测评指标、阅读理解的测评指标、书面表达的测评指标等，都应当是由低渐高的统一序列，只不过不同的应试群体在中文应用能力的不同侧面各有其特殊的表现，因此测评内容的构成应当适应这种特殊性。

如上所述，“中文应用能力测评”是要建立一个最基本的、统一的中文应用能力测评体系，其中包括由口语和书面语两大部分构成的综合测评标准，同时根据需要，口语和书面语两个标准序列也可以独立使用。这个体系在实施过程中，通过标准化的测试手段，并根据应试人在聆听理解、口头表达、阅读理解、书面表达等不同部分的测试表现和所获得的分数，应当能够推断并描写应试人在现实语言生活中使用中文时所具有的能力和所能达到的水平。

建立中文应用能力测评体系是一项基础性工程，它应当能够把静态的中文知识和动态的中文应用规律统一到使用者身上，通过对使用者中文应用能力和中文应用水平的标准化描述，比较客观、全面地反映学习中文和使用中文的不同层次或不同阶段。这个体系能够为针对特定人群或针对某些特别范畴的中文类测试提供基础性参照。与此同时，测评的后效也将通过为各类中文教学提供测评服务而显现出来，等级标准、测试大纲以及相关的中文知识序列和不同水平人群典型的言语表现等将会与现阶段的中文教学产生交互影响，促进中文教学向着更加科学、规范、高效、有序的方向发展。另外，由于中文相对于其他语言的特殊性，中文应用能力测评在试题类型、试卷构成以及测试方法等方面一定会形成自身的特色，从而使语言测试这门科学的内涵更加丰富，内容更加充实。

中文应用能力测评首先能够满足中文学习者和中文使用者自我衡量的需求，在测评结果报告中通过定量描述和定性描述相结合的方法使应试者了解自己的中文应用水平，确定今后的发展目标，使他们参与测评、学习中文的主动性进一步提高，同时使他们掌握和使用中文的水平也不断提高；其次，中文应用能力测评还可以满足各有关单位和部门的教学或其他需求，使他们能够了解和掌握某些受测群体或个体使用中文的能力和水平，为他们的各种决策服务，例如测评结果可以对各种中文类课程的教学效果提供反馈，对某些行业录用人员、审核人员资格提供参照性标准，等等。另外，测评标准、测评范围和测评方法等还可以根据特殊领域、特定范畴的需求衍生或开发出具有一定针对性的子系统，比如针对某种行业群体的专业性测评等，从而满足某些方面的特别需求。因此，本项目作为中文类测评的一项基础性工程，它的社会影响以及使用价值将是巨大和深远的。

三研究框架的初步构想

建立中文应用能力测评系统的科研工作大致可以划分为三个部分：第一部分是研制中文应用能力等级标准；第二部分是研制中文应用能力测试大纲；第三部分是编制试题、试卷，确定评分标准及细则，建立题库等。

研究工作的重点及相关步骤是：

1.运用计算语言学、语料库语言学等观念和方法对具有一定代表性的中文语料进行用字、用语等方面的统计分析，并建立相应的数据库。在遴选语料过程中着重当代文献资料，其中既包括全社会通行的一般文献，也包括适应中小学生生理、心理发展水平的课本和读物；既涵盖内地的中文应用现状，也涵盖台、港、澳及其他国家和地区的中文应用现状。按照不同类别对语料进行汇总处理，最后对来源于不同类别语料的基本数据进行对比分析，以字、词等的出现频率及分布情况为指标，拟定初步的量化界标，从语言文字应用的实际出发，为制定等级标准提供划分等级的客观依据。

2.研究和分析若干种中文教学的教学大纲或课程标准，既重视作为母语的中文教学现状，也重视作为第二语言或外语的中文教学现状；既关注内地的中文教学，也关注台、港、澳及海外的中文教学。研究和分析的重点是各学习阶段、各年级的教学目标和教学要求，并在研究分析教材的基础上，使教学目标和教学要求具体化，特别是细化语言文字的各项要素和各项知识，从教学实践的角度为制定等级标准提供划分等级的客观依据。

3.了解部分人群掌握和使用中文的一般水平，例如我国（包括台、港、澳）的中小学生（包括民族聚居地区的学生）、大专院校学生、具有一定代表性的行业人群、海外华人华侨以及其他国家和地区学习中文的人士等，通过调查、测验等方式，界定用于中文应用能力测评的内容范围，研制用于测评的知识指标和能力指标，明确应试群体具有等级差别的测验表现和行为表现，并对这些表现进行标准化描写。

4.研究分析当前通行的中文课程评价体系和已有的包括中文在内的各类语言测试，根据本项目自身的目的充分发掘和借鉴其中比较成熟的经验和方法，并通过比较、筛选、补充、完善，逐渐形成自己的完整体系。

5.综合上述几个方面的研究，按照口语和书面语两条主线，确定聆听理解、口语表达、阅读理解、书面表达等测评范畴，建立用于测评的中文知识序列和中文应用能力序列，并以此为基础研制等级标准，研制试题、试卷及测试大纲，建立题库。

研究工作的难点主要有两个：一个是如何廓清中文应用能力测评与中文教学课程评价以及适用于特定目的、特定人群的中文类测试的关系；另一个是如何综合不同国家和地区的中文教学现状，综合不同文化背景、不同母语背景的人掌握和使用中文的一般水平。针对这两个难点，本项研究首先要明确自身的定位和测评目的是着眼于一切中文学习者和中文使用者掌握和使用中文的能力，而不针对具体的课程标准和特定的人群；同时也要明确各种用于教学的课程标准以及不同人群掌握中文和应用中文的现状是研究工作的基础。因此，语言学、语言教学、语言测试等领域的已有成果，特别是汉语本体研究的理论与实践，可以成为中文应用能力水平等级划分的科学依据。此外，不同人群使用中文的现状，以及整个社会对不同人群中文应用能力的评价与需求，则可以成为等级划分的客观依据。

确定中文应用能力水平等级，实际上就是建立一种评价体系。而建立语言水平评价体系，首要的是明确在现实言语生活中交际活动的主要任务类型和具体情况，词语、句子以及语法规则等自身的特征及其使用状况，然后把这些因素的区别性特征依照实际情况和科学系统的分析，逐渐固化为层次性特征，例如简单的交际活动和复杂的交际活动，简单的语言形式和复杂的语言形式，等等。这些具有层次性特征的交际活动和语言形式就可以成为评价语言使用者能力水平的依据和参照。依照上述层次性特征构建的语言水平评价体系，应当具有以下几方面主要特征：第一，语言能力的综合性评价与单项能力评价并重，既针对使用者使用目的语的一般能力水平，也针对听、说、读、写等不同领域或范畴的能力水平；第二，言语交际任务与语言要素并重，既着眼于交际活动所需要的完成既定任务或实现预期目的的能力，也着眼于使用者驾驭不同语言成分和语言规则的能力；第三，能力水平的层次性与连续性并重，既注重不同能力水平的区别特征，又注重它们之间的连贯及序列特征，由入门至纯熟，环环相扣，渐次上升；第四，理论依据与实际需求并重，既以语言学、语言教学与测试等理论研究为指导，也从实际调研中获取数据、了解社会需求，使评价体系的针对性、实用性得到最大程度的体现。

从上述几方面的思考中不难看出，建立中文应用能力评价体系需要处理好几种关系，每一种关系所涉及到的对象都是互补的，而不能简单看成是对立的。在实际操作中，它们一定有矛盾的情况，但是究其实质，它们都是构成完整的评价体系所必需的，是整体的有机组成部分，而且每个部分都与相对的部分互有关联，互相补充。惟其如此，才能构成更加全面、更加完整的评价体系。

下面是建立中文应用能力评价体系的初步构想：

名称可定为“中文应用能力水平等级”，总体上分为四级：入门水平；基础水平（或称初级水平）；进展水平（或称中级水平）；熟练水平（或称高级水平）。

各水平等级的综合描述大致如下：

入门水平：在比较熟悉或特定的情境或语境中，能够用有限的较常用词语和简单句进行非连贯性交际应答。词汇量在1000以下。根据需要，能够看懂或写出有限的较常用词语，用于简单的交际目的。能够应对最基本的自我介绍、问路、购物等交际问题，但听、说的语速都比正常语速明显慢，且常常需要重复。

基础水平：在特定的情境或语境中，或者在自己熟悉的领域和话题内容方面，能够用一定范围内的基础词语和完整句子进行简单的连贯性应答。词汇量在1000～5000之间。能够理解书面形式的简单句子或由它们构成的片段，能够用比较简单的句子或简单句的组合进行书面表达。能够应对日常生活、工作或学习中的一般交际问题，如个人爱好、习惯、家庭情况、生活环境等，听、说的语速比正常语速稍慢，有时还需要重复。

进展水平：在自己的工作、学习领域或一般性社交场合，能够顺畅、连贯地进行表达和交流。词汇量达到5000～10000左右。能够理解文章的基本意思，并能以片段或短文的形式进行连贯性表达，书面表达的准确和熟练程度往往因体裁而异，显现出受体裁制约的痕迹。能够应对交际中的绝大多数问题，明显脱离了对情境和语境的依赖，听、说的语速趋于正常，且能在非正式场合承担目的语与母语（或自己熟悉的语言）之间的一般性话题的翻译任务。

熟练水平：在各种交际场合，均能够以多种表达方式灵活、恰当地进行表达和交流。词汇量超过10000。能够准确理解文章的基本意思和深层含义，并能根据需要以各种类型的文章进行书面表达。能够应对交际中的所有问题，比正常语速稍快的听、说任务也应付自如，在自己的专业领域或一般性话题方面，能够承担目的语与母语（或自己熟悉的语言）之间的正式翻译任务。

各水平等级内部，根据我国和国际上目前影响较大的几种语言水平等级资料，同时参考我们将来在实际调研和试测中所收集到的数据，再细分若干层次，例如入门水平1、入门水平2、入门水平3等等。表1是参考包括汉语、英语、日语、德语等若干种语言的若干种水平等级资料，并经过小范围调研和征求专家意见后，初步形成的一个样例。这个样例还需要通过更大范围的取样、收集数据、统计分析之后，再进一步修正和完善，最终形成中文应用能力水平等级的试行标准。

入门水平主要针对从零起点或准零起点起步习得或学习中文的人群，在听、说、读、写等方面所达到的程度大致相当于内地幼儿和开始接受小学教育的学生；基础水平主要针对已经达到入门水平的人群，在听、说、读、写等方面所能达到的程度大致相当于接受内地小学教育的中高年级学生；进展水平主要针对已经达到基础水平的人群，在听、说、读、写等方面所能达到的程度大致相当于接受完内地小学教育并正在接受初中教育的学生；熟练水平主要针对已经达到进展水平的人群，在听、说、读、写等方面所能达到的程度大致相当于接受完内地高中教育并接受高等教育的学生，或者从事有关行业工作的从业人员等。

按照《中文应用能力水平等级》的预想框架，中文应用能力水平测试显然应当采用标准化的测量工具和测量方法，测试结果应当是客观的、稳定的，而且也是有效的。与此同时，测试系统应当具有比较强的可操作性，简明、实用。要建立这样的测试系统，首先必须处理或解决好以下一些关键问题：第一，测试的范围，特别是语言知识与语言能力的关系；第二，测试的形式，特别是客观性试题与主观性试题的选择及其比例；第三，评分的依据和标准，特别是主观性试题的评分标准；第四，测试环境与语言应用环境的关系，主要是测试中的作答任务与现实言语交际活动的相关性；第五，测试结果的解释及利用，主要是应试人测试分数差异性的认定以及测试分数的意义。

表1

第一个问题涉及到语言本体研究、语言测试理论以及现实言语生活中语料的采集、整理和分析等。首先，语言水平测试(proficiency test)就建立在语言研究和测试理论的基础上，词汇、语法、语义、语用等方面的研究已经为构建测试内容的总体框架提供了理论依据；同时语言测试理论关于能力水平的描述、内容信度的界定等也为测试内容的确定奠定了基础。其次，由于语言的应用性本质，衡量人的能力水平不能只注重静态的语言材料，如语音成分、词汇、语法成分等等，同时还应当重视动态的语言生活，也就是现实语言生活中语言应用的状况，特别是不同类型、不同交际情境的语言素材以及这些素材所反映的客观现实和规律性。

第二个问题与测试的目的、性质以及预期的效率等都有关系。客观性试题由于测试内容覆盖范围广、标准化程度高、信度可靠、阅卷过程简捷等特性，在一般情况下，是较大规模测试必然采用的一种形式。主观性试题由于更能发挥应试人的主动性、能更准确地反映应试人的能力水平等特点，现在已成为一些较大规模测试选用的趋势。应当认识到的是，客观性试题阅卷相对简单，但编制试题的要求很高；主观性试题编制试题的要求相对简单，但阅卷评分则比较复杂。二者各有所长，也各有所短，应当在整个测试系统中各司其职，互相补充。

第三个问题主要涉及语言文字的静态规范和动态规范等。这里面既包括社会上通行的语言文字规范标准以及全体使用者的约定、习惯，也包括绝大多数使用者的评价、态度，等等。因此，评分的依据和标准既有绝对的一面，也有相对的一面，关键是这些依据和标准一要为大多数人所认同，二要明确告知应试人和测试的使用者。

第四个问题主要涉及对现实语言生活的研究以及试题内容和作答任务的针对性等。一般认为，测试就是通过创设情境引出应试人反应的一整套程序。因此，语言应用能力测试中所创设的情境，以及要求应试人完成的任务，应当与语言文字应用的现实状况是一致的、接近的，应当尽量避免背离交际情境、交际任务的情况，比如要求应试人描述初生婴儿的感受这一类作答任务显然就值得怀疑，并且也是难以被接受的。当然，这个问题与测试的目的性也高度相关，比如一种考察想象力的测试，如果设置类似的问题则是可以考虑的。

第五个问题主要涉及对预期应试群体的调研和试测数据的整理、分析等。预期应试群体就测试的实施而言，就是测试对象。对这个群体进行调研，主要涉及几个方面：一是相关的背景信息，比如他们的职业、受教育程度、学习中文的时间，等等；二是目前中文教学中不同教学阶段的教学目标、教学要求等；三是不同职业、不同工作岗位对从业人员中文水平的需求等。这些基于实际调查所获得的数据，与测试对象在试测中的表现进行比较和参照，就可以使不同应试人群的测试分数显现出特别的含义，同时也使不同分数的差异性得到体现，例如初中学生或文化程度与此相当的应试人，他们在试测中所得分数的分布情况、集中趋势等；还有他们的分数分布状况与小学生所得分数的分布状况之间的关系，等等。

按照以上种种思考，构建中文应用能力测试框架，既要注重理论研究，依照科学规律开展工作，比如语言学、教育测量学等领域的探究；同时也要注重现实语言生活的调研，比如相关人群学习中文和使用中文的现状，以及社会上对有关人群中文应用能力的预期和要求，等等。整个测试体系应当包括听、说、读、写及综合运用几个方面，由聆听理解、口语表达、阅读理解、书面表达等几个分测验构成。根据需要，各分测验既可以单独使用，也可以通过不同的组合方式使用，以满足不同的应试群体和使用测试的机构，满足有各种需求或目的的测试使用者，例如根据需要，可以使用口语表达分测验衡量口语表达能力，使用聆听理解分测验衡量聆听理解能力，也可以同时使用这两种分测验衡量口语交际能力。

四研究工作的现状、规划及预期成果

这项研究从2004年11月国家语委科研领导小组办公室下达“中文应用能力测评可行性论证”项目通知书起正式开始启动。课题组在项目指导组各位领导和专家的指导下，开展了几方面的工作：

1.收集了现阶段我国内地中小学语文课本、香港中小学中文课本、海外儿童及成人中文课本、对外汉语教学基础教材和中小学生课外读物、报刊文献等若干种；同时收集整理了中文教学方面的若干种课程标准和教学大纲，收集整理了教材中的教学要求和学习重点，以及教学中的测验、练习、学生作业等资料；并且建立了部分数据库作为项目研究的基础资源。

2.课题组会同有关专家对相关行业和职业从业人员及学生中文应用现状问题进行了多次研讨，并编制了针对政府机关、一般企事业单位、各级各类学校的有关人员、教师和学生中文应用能力的调查问卷三种，准备进行问卷调查并汇总、分析数据，建立相应的数据库。

3.收集整理了美国、欧洲、日本、韩国和我国台、港、澳地区等数十种语言测试文献资料，其中包括美国的SAT，（英文、数学）、中文AP、日本的日语能力考试以及不同国家和地区的中文考试等。

4.针对阅读理解测试、书面表达测试问题查阅了大量资料，进行了多次研讨，初步形成了阅读理解测试、书面表达测试的考查框架，并编制了一部分用于试测的中文阅读和书面表达试题，经过反复讨论、修改后确定了上百道试题，准备进一步征求有关专家意见后开展一定样本量的试测工作。

5.访问了美国、日本、香港等地的有关高校、学术机构和团体，了解了他们在语言测试、中文教学与测试领域的科研情况，并向他们介绍了建立中文应用能力测评框架的总体构想以及现阶段的进展情况；同时接待了这些国家和地区语言教学、语言测试领域的专家学者来语用所进行学术访问，与这些学者及机构建立了稳定的交流渠道和机制。

关于下一步研究工作的要点，我们的设想是：

1.进一步收集相关语料，扩充基础资源，完善各种数据库。

2.用编制好的调查问卷和阅读理解、书面表达部分试题，选择几个省市开展调研，并对调研结果进行整理和分析，写出调研报告。

3.根据调研情况，召开不同规模研讨会，重点研究建立等级标准等问题。

4.以初步形成的阅读理解测试、书面表达测试考查框架为基础，建立并完善听、说、读、写全方位的总体考查框架，并进一步补充试题，构建题库管理、运行系统，完成标准试卷若干套。

5.确定评分标准及规则，确定导出分数体系，并明确分数的差异性及其意义。

6.采取走出去、请进来以及合作召开研讨会、出版相关论文集等多种方式，进一步加强与国内外相关科研机构和高等院校的学术交流与合作。

7.研制中文应用能力等级标准、中文应用能力测试大纲等，形成比较完整的测评体系。

研究过程中的阶段性成果和最终成果预计有：

1.中文应用能力等级标准。

2.中文应用能力测试大纲。

3.试题、标准试卷及考核要点、命题规则等。

4.评分标准、评分细则及阅卷评分系统。

5.题库的管理、运行（包括生成试卷）系统。

6.调研报告、论文及论文集、专著等。

7.其他（如数据库等）。

标签：系统评价论文; 教学评价论文; 英语论文; 职业测评论文; 语言表达论文; 系统学习论文; 思考方法论文;

建立中国应用能力评价体系的构想与思考_系统评价论文

猜你喜欢