英语专业应试真题中阅读文本易读性的实证研究论文_沈莹,周飞

沈莹 周飞 广西大学

[摘要]分析文本的阅读易读性特征,已经在英语语篇多维度分析中占据了越来越重要的地位。为英语阅读教材以及阅读考试题目编辑人员提供一些可借鉴的参考数据是本研究的最终目的。为了挖掘正确选择阅读文本以及决定语言测试中阅读文本的易读性水平的统计学依据,本研究用在线语料库分析软件Coh-Metrix 3.0和统计分析软件SPSS 19.0探讨了英语专业四级和八级测试真题中的阅读文本的易读性倾向,希望此研究成果对将来的语言测试学理论的构建和实践提供建设性参考。

[关键词]弗莱士-金凯德易读度模型; 弗莱士-金凯德等级水平; 第二语言文本的易读性指数; 易读性;专业四级和八级

一、引言

英语专业四级和八级测试是用来检测英语专业学生的英语综合能力的一种能力测试手段。前者的目标是检测英语专业二年级学生的英语综合能力,后者是检测英语专业四年级学生的英语综合能力。根据高校英语专业本科教学大纲要求,这两种考试的总体目标是检验不同阶段英语专业学生的语言能力和语言表达。

在中国,专业四级和八级测试已经成为评估大学英语专业教学质量和语言水平最重要的方法。其中,阅读理解已经成为语言教学中的重要组成部分之一。阅读理解是专业四级和八级测试中的一个关键部分,各占总分的20%。高校英语专业本科教学大纲 (2000) 的要求是1)学生可以阅读英文报纸上的文章和评论以及说英语国家出版的带有难度的历史传记和文学作品;2)学生可以抓住阅读材料中的主旨、文本框架、语言特色和修辞方式;3)学生的阅读速度应该达到每分钟140至180个单词。随着中国英语教学的全球化和发展,对英语专业也提出了更多的要求。为了达到专业四级和八级理解文本的要求,对专业四级和八级阅读文本进行易读性分析,会给阅读文本的选择和未来语言测试的评估带来一定启示。

国内已经有很多学者对英语阅读文本的易读性进行了研究。例如,林铮[1]认为,英文易读性指的是读者能在多大程度上理解某篇英文的意义, 它与英文难度, 即读者在理解某篇英文中遇到的困难程度, 成反比例关系, 即一篇英文的易读性愈大, 其难度就愈小。” 李绍山[2]曾指出:“易读性是指文本易于阅读和理解的程度或性质, 易读性的测量不仅要考虑简单的文本因素如词长、句长等, 还要考虑影响阅读的读者特征、环境特征等因素。”

英国《卫报》(2013) 利用Flesch-Kincaid readability tests (易读性测试) 追踪了历届总统的国情咨文,结果发现,奥巴马去年的国情咨文的易读性测试分数只是8年级水平。相反,美国第四届总统詹姆斯·麦迪逊 (James Madison) 1815年的国情咨文的易读性分数达到了 23.5。

易读性研究的成果主要以易读性公式体现, 至今易读性公式已经有上百种之多, 根据研究方法划分, 可以将这些公式分为两大类:1) 通过测量词长和句长来计算易读性和 2) 通过测量词汇难度分布来计算易读性。本研究的具体研究设计如下。

二、研究设计

2.1 研究对象

本研究选取2000-2014年专业四级和八级阅读理解作为研究对象。在2016年改革之前,专业四级测试包括六大部分:听写、听力理解、语言知识、完形填空、阅读理解和写作。专业八级考试包括五大部分:听力理解、阅读理解、语言运用、翻译和写作。

2.2 研究方法

本研究通过从网上,图书馆和相关书籍收集数据的方法,建立了小型语料库。语料库包括了2000-2014年英语专业四级和八级阅读文本的测试内容。根据Coh-Metrix 3.0[注1]和SPSS 19.0[注2]的结果,对2000-2014年专业四级和八级阅读文本的易读性进行对比分析。本研究所探讨的文本易读性包括1) Flesch-Kincaid Reading Ease (RDFRE:弗莱士-金凯德易读度模型); 2) Flesch-Kincaid Grade Level (RDFKGL:弗莱士-金凯德等级水平); 3) Readability Index for Second Language Texts。(RDL2:第二语言文本的易读性指数)

2.3 研究问题

本研究拟回答以下问题:

1) 2000-2014年专业四级测试真题中阅读理解文本的易读性有哪些特征?

2) 2000-2014年专业八级测真题中试阅读理解文本的易读性有哪些特征?

3) 2000-2014年专业四级和八级测试真题中阅读文本的易读性之间是否存在差异?如果存在,差异在哪里?

三、易读性以及易读性测量方法

3.1易读性

根据《朗文语言教学及应用语言学词典》, 易读性的定义是“文字材料能被阅读和理解的容易程度。可读性取决于很多因素,包括 1)一篇短文中句子的平均长度;2)一篇短文所包含的新单词的数量;3)被用来检测可读性的语言的语法复杂性,被称作可读性公式。” Read [3]把易读性定义为文本的不同方面使得读者易读或者难读。

“易读性主要是指文本材料的可理解程度。易读性依赖于多种因素, 主要包括文章的句子平均长度、生词数和语法复杂度。用于测量易读性的方法被称为易读性公式 (a readability formula)”。Richards & Schmidt [4]还认为该定义不仅能指明易读性的内涵, 还能指出影响易读性的主要因素, 如平均句长、生词数、语法复杂度等。Fry [5] 指出, 大部分有关易读性的研究主要与两个因素有关,即句法难度 (语法复杂度), 通常通过测量句长来确定;语义难度 (意义或是词义), 通常通过测量词长或是词频分布来确定。

与易读性相关的研究可以用来帮助语言教学和语言测试。Graesser, McNamara & Kulikowich[6]在2011年指出对文本的语言和语篇特征的自动分析,除了发展阅读和理解的科学理论,在教育方面也有着巨大的实践价值。自动文本分析应用之一就是便于那些正在学习阅读和通过阅读来学习的学生衡量和挑选文本。文本的选择确实也是教师,相关负责人和主管关注主要问题之一。

3.2 易读性的测量方法概述

从20世纪50年代开始文本易读性模型开始受到关注,到20世纪90年代超过200个易读性运算被研发,并且有着一千多篇支持性的研究。最受欢迎的度量有弗莱士-金凯德等级水平或易读度公式。易读性的测量都是高度相关的,因为他们都是以同样的研究参数为基础,即他们都是研究文本里每个单词的难度和每个句子的复杂度。(DuBay, W. H)[7]

在Coh-Mertrix语料库分析软件面,测量文本易读性的主要有三个指数。第一是弗莱士-金凯德易读度模型,计算公式为 [206.835 - (1.015 * 句长) - (84.6 * 词长]。句长指的是文本中每句话的平均字数,词长指的是每个单词的平均音节数(这与平均字母数紧密联系)。第二是弗莱士-金凯德等级水平,计算公式为 [(0.39 * 句长) + (11.8 * 词长) - 15.59]。第三是 第二语言文本的易读性指数,易读指数普遍使用下列公式计算:

- 45.032 + (52.230×CRFCWO1)

+ (61.306×SYNSTRUT)

+ (22.205×WRDFRQmc)

(McNamara, et al.)[8]

弗莱士-金凯德等级水平是按美国中学年级水平 (总共12等级), 越高分意味着越易读。它可解释美国0-100级的水平,它可以使教师、家长、图书馆员以及其他人更为容易判断各种书籍和文章的易读性。它也意味着,当该文本用这个公式计算的结果大于12时所需的教育年限是多少。对1930 年以来美国国民阅读能力调查显示,成年人的平均阅读能力相当于8年级的水平。许多学生的阅读能力低于所在年级的水平。例如,许多高中学生的阅读能力相应当8年级水平,而大学毕业生的阅读能力相当于10年级水平。通过练习,没有怎么受过正规教育的读者往往也能成为高水平的阅读者

第二语言文本的易读性指第二语言文本的易读性的一个指标。文本的分数越高,第二语言文本就越好理解。

弗莱士-金凯德易读性等级如表1所示。

四、英语专业四级和八级测试真题阅读文本的易读性

4.1 Coh-Metrix对专业四级测试真题中阅读文本易读性的测量及讨论

表2显示,弗莱士-金凯德易读度从2000年的54.64到2009年的73.53之间变化。根据表1中的弗莱士-金凯德易读度公式的参考范围,专业四级阅读文本的水平就像是《文摘》杂志里的一般的描述性风格。弗莱士-金凯德等级水平变化范围是从2009年的6.37到2000年的10.67。这说明2009年的阅读文本的易读性分数是最低的,只达到美国中学6年级水平,即还没有达到美国平均高中生阅读等级 (8年级)。然而,2000年的是最高的,已经达到美国中学10年级水平,即已经达到美国大学毕业生平均阅读等级 (10年级)。关于二语文本的易读性指数,2000年是最低分(10.20),2007年是最高分(19.28)。这意味着2000年的专业四级阅读要比2007年的难得多。从表3可以得知,专业四级测试真题中阅读文本的弗莱士-金凯德易读度的标准方差是6.32136,与弗莱士-金凯德等级水平(1.41123)和二语文本的可读性指数(2.31064) 的标准方差相比高出很多。此结果证明专业四级阅读文本的难易程度相差比较大,有些的题目过难,而一些年的题目又过于容易。

4.2Coh-Metrix 测量的专业八级测试真题中阅读文本的易读性及讨论

从表4可以看出,弗莱士-金凯德易读度变化范围是从2014年的50.16到2000年的67.16。具有这样的阅读易读度的文本,在一定程度上已经达到了相当难的具有描述风格的文本水准,例如已经达到了《品质》这本杂志的阅读易读性水平。弗莱士-金凯德等级水平变化范围是从2004年的8.11到2009年的11.95。换句话说,2009年阅读文本分数等级是最高的,几乎达到美国中学12年级水平,即已经超过了美国大学毕业生的平均阅读等级 (10级)。相比之下,2004年的是最低的,只达到美国中学8年级水平,也就是只达到美国高中生平均阅读等级。第二语文本的易读性指数在2010年是最低的,这意味着当年的专业八级阅读文本是最难的。

表5表明,与专业四级出现雷同之处是,专业八级阅读文本的弗莱士-金凯德易读度的标准方差是4.84556,与弗莱士-金凯德等级水平 (1.20063) 和第二语言文本的易读性指数 (2.16627) 的标准方差相比也高出许多。此结果表明专业八级阅读文本的难易程度相差还是比较大,有些年的题目过难,而一些年的题目又过于容易。

五、专业四级和专业八级阅读文本的弗莱士-金凯德易读性对比研究

为了进一步探讨专业四级和八级阅读文本的易读性之间的相同点以及异同点,本研究进行了独立样本t检验,结果表明,弗莱士易读度,弗莱士-金凯德等级水平和第二语言文本的易读性指数的显著性水平分别为0.05,0.010,和0.002。这三种测量的显著性水平都低于0.05。所以,结果表明,专业四级和八级阅读测试真题易读性之间存在显著性差异。专业八级阅读测试真题的难度水平是2.763,高于专业四级阅读测试真题。在弗莱士-金凯德易读度方面,从t值来看2000-2014年专业四级阅读文本是3.026,比专业八级阅读测试真题要简单。从第二语文本的可读性指数来看,专业四级阅读测试真题是3.5,要容易些。

六、结语

根据以上专业四级和八级阅读测试真题易读性的检测结果,我们可以得出以下结论:

从弗莱士-金凯德易读度来看,专业四级测试真题中阅读文本的弗莱士-金凯德易读度的平均分数是63.891,然而,专业八级测试真题中阅读文本的是57.667。两种文本的弗莱士-金凯德易读度分数相差6.224。由此可见,专业八级阅读文本比专业四级的要难得多。

专业八级测试真题中阅读文本的弗莱士-金凯德等级平均水平 (7.79) 与专业四级(8.47) 相差不显著。但是,专业四级测试的弗莱士-金凯德等级水平的标准方差达到6.32,即2009年等级水平是6.37,低于美国高中平均阅读等级8级,而2000年的等级水平达到10.67,高于美国大学毕业生的平均阅读等级10级。此结果表明我国四级阅读真题每年的题目难易度程度很不均衡。

专业四级测试真题中的第二语言文本的易读性的平均指数是14.63,而专业八级的是11.765。由此可见,专业四级阅读测试真题显然简单一些。

从标准方差的统计结果来看,专业四级和八级测试真题中阅读文本的弗莱士-金凯德易读度的标准方差比弗莱士-金凯德等级水平和第二语言文本的易读性指数的标准方差大,此结果可以表明专业四级和八级在2000-2014年的阅读测试真题的理解难易度方面存在一定的差距,即有些年度的专四专八阅读测试真题较容易理解,而有些年度的题目较难理解。

根据独立样本t检验的结果来分析,专业四级和八级测试真题中的弗莱士-金凯德易读度,弗莱士-金凯德等级水平和第二语言文本的易读性指数的显著性水平分别为0.05,0.010,和0.002。这三种测量的显著性水平都低于0.05。所以,专业四级和八级测试真题中阅读文本易读性之间存在统计上的显著性差异。

七、启示

以上的研究结果给我们的启示是:

首先,阅读文本的易读性水平应该符合测试者的语言能力水平,不宜太难,也不宜太容易。每年的出题难度不宜相差太大。

其次,我们在今后的编写教材时应当适当地权衡一下难易度,适用于教师和学生的教材选择标准。教材中的每篇文章理应在一个合适的水平,那样才能让语言学习者最受益。

再次,多方面的研究显示,各种流行的易读性公式也没有百分之百的精准,而只是为阅读文本所需的技能给出一个不错的粗略估计。易读性公式已经帮助了全世界数以百万计、讲不同语言的读者。如果说这些公式还有什么问题,那也只能说是应用得还不够充分。

最后,虽然文本的易读性的量化统计有其客观性的一面,也有其一定的局限性。例如文本的易读性会受阅读环境以及阅读人的背景知识的影响。尽管如此,文本易读性量化研究仍不失为一项比较客观的文本研究手法。当然,为了使得文本易读性量化研究更有可信度,可以用不同的体裁进行文本易读性研究,例如:记叙文、说明文和议论文等。除此之外,从各种现在既存的各大语料库中得来的数据可以被用来检验文本易读性的有效性。

注1:Coh-Metrix 3.0

Coh-Metrix是Automated Cohesion Metric Tool Based On Computer Technology的缩略词。本研究用这个软件对文本中的易读性进行自动评估。

注2:SPSS 19.0

SPSS是Statistical Package for Social Science的简称。它是最广泛使用和最有力的数据分析软件包之一。本研究将使用其中的t检验评估专业四级和专业八级阅读文本易读性的异同点。

参考文献

[1] 林铮. 1995. 英文易读性的测试[J]. 《外语教学与研究》(4): 38-42.

[2] 李绍山. 2000. 易读性研究概述[J]. 《解放军外国语学院学报》(4):1-5.

[3] Read, J.2005. Assessing Vocabulary[M].Oxford:Oxford University Press.

[4] Richards, J.C. et al. 2003. Longman Dictionary of Language Teaching and Applied Linguistics(Third Ed)[K], 北京:外语教学与研究成版社.

[5] Fry Edward. 2002. Readability versus leveling[J]. The Reading Teacher (4): 1-5.

[6] Graesser, A. C.,&McNamara, D. S.2011. Computational analyses of multilevel discourse comprehension[J]. Topics in Cognitive Science(3):pp. 371-398.

[7] DuBay, W. H. 2006. National Assessment of Adult Literacy[Z].

[8] McNamara, D.S., Graesser, A.C., McCarthy, P. M., & Zhiqiang Cai.2014. Automated Evaluation of Text and Discourse with Coh-Metrix[M]. Cambridge:Cambridge University Press.

论文作者:沈莹,周飞

论文发表刊物:《语言文字学》2018年第3期

论文发表时间:2018/4/27

标签:;  ;  ;  ;  ;  ;  ;  ;  

英语专业应试真题中阅读文本易读性的实证研究论文_沈莹,周飞
下载Doc文档

猜你喜欢