初中语文实验教材选文频率的统计分析--兼论如何实现3500个普通汉字_常用字论文

初中语文实验教材选文字频统计分析——兼谈我们应当怎样落实3 500常用字,本文主要内容关键词为:字频论文,选文论文,常用字论文,统计分析论文,初中语文论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

修回日期:2010-01-20

中图分类号:G623.2 文献标志码:B 文章编号:1000-0186(2010)04-0046-04

作为国家语委“十五”规划重点项目的重要内容,我们对人教版、语文版、苏教版、作家版四套初中语文实验教材的选文进行了字频统计分析。我们分别统计了四套教材选文中每一个汉字出现的次数和频率。分析的要点有三:一是频率较高的字;二是选文中出现的非常用字;三是选文中未出现的常用字。

一、频率最高的字较为集中

四套教材选文中频率最高的字均为“的”字,远远高于其他字;其次均为“一”字。频率最高的前11个字均为“的”“一”“我”“了”“是”“不”“在”“他”“又”“这”“人”,只是顺序稍有不同。四套教材频率最高的前100个字当中,有82个字相同(音序排列):

把不成出从大到道得的地都对多而儿个过好和很后还会家见就开看可来里了么没们面那能你年起前去然人如上生时是水说所他它天头为我无下想小心样要也一以有又于在这之只中种着子自

这说明,每套教材二十多万字的语料足够大。或者说,从用字的角度来看,语文教材选文的容量是恰当的。

由于篇幅所限,这里不可能列出全部统计资料。下面呈现四套教材全部语料中频率最高的前50个字的出现次数和频率(%)。(其中有47个字相同。共出现53个字。某套教材中不在前50的,这里未列出其出现次数和频率。)

二、非常用字不多,选文不偏

下表是四套教材选文全部语料中非常用字的具体数据:

在这些非常用字中,频率较高的有“曰”“吾”“矣”“汝”等文言用字。这些文言字的出现是必要的。这些数据的意义不大。我们又对四套教材现代文选文中的非常用字分别进行了统计。数据如下:

数据显示,四套教材现代文选文中非常用字的字数和出现次数较少,频率较低。这说明从用字的角度看选文不偏。

三、非常用字与“教育用字”

我们曾指出,语文教材中某些非常用字的出现是有益的,如“蔡”“迪”“卉”“驶”等,并提出了确定多于常用字的“教育用字”(比如3800或4000)的建议。为了便于这方面的研究,这里列出四套教材中均出现的228个非常用字:

甭迸炳蔡诧踌瞅躇茨蹿惮迪凋峨弗骸亨瑚卉槛踞娟撅柯婪阑涟撂廖麓戮嘛抿霓拈涅哦瞥蔷颧茹莎噬朔擞蓑眺哇惟吾毋嘻霄眩丫焉彦噎耶曳矣翌荫虞驭垣苑曰哉湛肇瞩拽渍兀廿剌仃伫偌匍匐讪讷谛塾壑垠馨茏荇莓萋萦萼蓦蓓尬尴捋叱叩呱咄哔哝哧哽唔喏喃喽喙嘟嗫嗬嗝嗯嗳噗噢噔噤嚅嚓峋崛嶂嶙巅猝猹獾怅忸怩怡恺悖悚惬惘惚愣汩浏浒淙潇漪漉潼潺瀚咫娅娓婷嬷驿绮缈缥珑瑙璀璋璞璨桢楠楂榭橹斓炷煦祀祺忑忐恣矶砥砦眸睢睿瞌瞟铿镂锵黏皎皓鸪鹁鹭瘠穹褛褴皲聆虔蜿舐笠箧篝簌袅粼翡跚踮蹑蹒髀魅髦髻黛黯皑盎翱

这228个非常用字大部分应当进入教育用字。经过逐个分析,我们认为有116个字应当进入“教育用字”:

甭迸炳蔡诧踌瞅躇蹿惮迪凋峨弗骸亨瑚卉槛踞娟撅柯婪阑涟撂廖麓戮嘛抿霓拈涅哦瞥蔷颧茹莎噬朔擞蓑眺哇惟吾毋嘻霄眩丫焉彦噎耶曳矣翌荫虞驭垣苑曰哉湛肇瞩拽渍兀廿剌仃伫偌匍匐讪讷谛塾壑垠馨茏荇莓萋萦萼蓦蓓尬尴捋叱叩呱咄哔哝哧哽唔喏喃喽喙嘟嗫嗬嗝嗯嗳噗噢噔噤嚅嚓峋崛嶂嶙巅猝怅忸怩怡恺悖悚惬惘惚愣汩浏浒淙潇漪漉潼潺瀚咫娓婷驿绮缈缥珑瑙璀璋璞璨桢楠楂榭橹斓炷煦祀祺忑忐恣矾砥眸睿瞌瞟铿镂锵皎皓鹭瘠穹褛褴皲聆虔蜿舐笠篝簌袅粼翡跚踮蹑蹒魅髦髻黛黯皑盎翱

这些字可以分为以下几种情况:

1.口语用字,如:“甭”“撅”“撂”。

2.姓氏用字,如:“蔡”“廖”“虞”。

3.人名用字,如:“婷”“彦”“璋”“璞”“桢”。

4.文言字,如:“吾”“矣”“哉”“曰”。

5.文学意味较强的字,如:“花卉”的“卉”、“诧异”的“诧”、“聆听”的“聆”、“咫尺”的“咫”。

6.民族文化常识中的重要字,如:“浒”(名著用字)、“祺”(尺牍用字)、“仃”(名诗用字)。

7.词素或语素用字,如:“噬”“斓”“悚”“噤”“噎”。

8.地名用字,如:“峨眉山”的“峨”。

9.物名用字,如:“翡翠”的“翡”、“玛瑙”的“瑙”。

10.象声词用字,如:“哔”“哧”“嚓”。

11.叹词用字,如“嗳”“嗯”。

这些字由于不同的原因使用频率并不很高,因此未能进入常用字,然而对于一个人的语文素养而言又是不可或缺的。

其中11个字我们认为不宜进入教育用字:

“茨”“娅”“嬷”“猹”“獾”“鹁”“鸪”“砦”“睢”“髀”“箧”

这些字大致可以分为三类:

1.“茨”“娅”“箧”“髀”“睢”“嬷”,这是使用频率较低的文言字。这些字在现代汉语中不能单用,又不能做词素或语素构词。它们与“噬”“悚”不同。“噬”用于“吞噬”,“悚”用于“毛骨悚然”。“睢”也可以用作地名和姓,但使用频率较低。

2.“猹”“獾”“鹁”“鸪”,很少用到的动物名。与“鹭”不同。

3. “砦”,异体字。“砦”是“寨”的异体字。

当然,教育用字的确定,应当是十分慎重的事,有待有关部门组织力量专门研究。这里的资料及其分析可供参考。

四、常用字的落实情况不容乐观,亟待改进

统计资料中最重要的数据是选文中未出现的常用字的情况。数据显示,四套教材选文中未出现的常用字均不少,最多达277个,最少也有249个。下面是四套教材中未出现的常用字的具体数据:

下面是四套教材中至少有三套教材未出现的常用字(163个):

溉涝殃氮涤嫡碘碉谍痘囤贰樊矾氨肛捍焊夯沪蛔妓钾玖拷榔捌儡瘤铝氯锰螟钠撵镊脓硼谴蛆叁搪誊鸵瓮铣楔锌邢酗癣蚜耙鸯肄蛹鸳耘嘁浠檩昙锉衩螃蟥笤翎麸鳍蓖痹畴姥厕侨渠轧贷芍赊甥虱祟谭椭桅紊晤涎淆侈蝎匈薛唁椿醇姚粤蚤痊铡樟蔗疹蛀谆匕茉荸幔岖涮漩昵掰瓤鹉跷鳄褥苫杉赡靶讹筏肪钙耿汞沽硅焙涣彪膘剿酵兢靖臼炬竣坷傀坤擂痢磷赁硫埠抡糜闽孽碴啤柒崎迄

五、落实3 500常用字当勉力为之

《全日制义务教育语文课程标准(实验稿)》在第四学段提出了“认识常用汉字3 500个”的课程目标。这是语文课程标准务实的一个表现。初中语文实验教材应当认真落实这3 500个常用字,这是责无旁贷的事情。而目前初中语文实验教材落实3 500常用字的情况亟待改进。在此我们提出如下建议:

1.落实3 500常用字应当成为教材编写自觉的目标追求

这里所选四套教材,在语文实验教材中,水平是较高的,具有相当的代表性。尤其是在选取文质兼美的篇目方面,成绩斐然。然而在落实常用字方面却差距不小,或许与这一方面的目标不够明确有关。因此,我们建议在修订教材时,应当将落实3 500常用字作为教材编写的自觉目标。

2.常用字的落实情况可以通过计算机技术准确把握

长期以来,对选文的用字情况往往只能直观、模糊地把握。在计算机技术相当发达的今天,语文教材可以也应当以先进的方法自觉地落实常用字。在教材定稿之前,编者可以自行统计3 500常用字的落实情况,并及时补足未出现的常用字。

3.坚持呈现常用字的语境原则

选文未能涵盖3 500常用字,可否将遗漏的常用字单独列出让学生学习呢?回答应当是否定的。中学语文教材历来坚持让学生在选文中学习字词,因为文本中有自然生动的学习语境。我们应当坚持这一语境原则。

4.以更换或适当增加选文的方式提高常用字的覆盖率

既然我们清楚地知道有哪些常用字尚未落实,那么我们不妨有意识地选取能覆盖这些常用字的选文来更换其他选文,或者适当增加选文。当然,这样的文本仍然应当是文质兼美的。

5.修改选文提高常用字的覆盖率

修改选文,也是提高常用字覆盖率的方法。教材编者可以将尚未覆盖的常用字告诉选文的作者,请他们在不影响表意的情况下修改文章,尽可能多用一些或几个常用字。

6.编写覆盖某些常用字的课文

以更换选文的方式提高常用字的覆盖率是很难的,有时更换一篇选文,只能增加几个常用字,而且越到最后越困难。因此,我们还可以考虑专门编写覆盖某些常用字的课文。叶圣陶先生、朱自清先生都曾经编写过课文。当年他们编写课文的目的或许不是出于常用字的考虑,但这种方法值得借鉴。

7.在相关练习中落实其余常用字

以上方法均未能落实的常用字,是否可以考虑编写相关练习?答案是肯定的。在练习中呈现某些常用字,与直接列出这些常用字是有区别的。因为练习也有一定的语境。尽管这样的语境不如选文,但这也许是不得已而为之的方法。这样的练习也许无法依附于课文,但“练习必须依附于课文的时代应当结束了”。

如何较好地在初中语文教材中落实3 500常用字,是一个不应回避的问题,值得深入研究。据了解,《大学生英语》教材能覆盖四级考试规定词汇的99%。那么,初中语文教材能否覆盖3 500常用字的99%呢?98%呢?

注释:

①此为饶杰腾先生与笔者交谈时提出的。

标签:;  ;  

初中语文实验教材选文频率的统计分析--兼论如何实现3500个普通汉字_常用字论文
下载Doc文档

猜你喜欢