当代汉字系统优化的基本原则_第一批异体字整理表论文

当代汉字系统优化的基本原则,本文主要内容关键词为:汉字论文,基本原则论文,系统优化论文,当代论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      汉字系统优化是指汉字系统通过自身调节和人工干预,使其内部结构及外部效用都达到最佳状态。依靠自身调节的优化称作自然优化,依靠人工干预的优化称作整理优化。本文所讨论的汉字系统优化专指整理优化。

      对汉字系统进行整理优化由来已久,从秦始皇的“书同文”到汉代的《熹平石经》,再到唐代的字样学,都对汉字的发展产生了重要影响。进入近现代以来,出于政治文化变革的需要,社会上掀起了一场以拼音化为终极目标的汉字改革运动,针对汉字难学、难记、难写、难读的缺点提出了一系列调整方案。新中国成立以来,这项工作得到了延续,并受到政府的高度重视,于1954年专门成立中国文字改革委员会,确定了当时文字改革的三大任务:简化和整理汉字,推广普通话,制订和推行汉语拼音方案。在汉字简化和整理工作方面与文化部联合发布《第一批异体字整理表》(1955年),公布《汉字简化方案》(1956年),编制《简化字总表》(1964年),更改了35个较为繁难的地名用字(1964年),又与文化部联合发布《印刷通用汉字字形表》(1964年)。1985年中国文字改革委员会更名为国家语言文字工作委员会,于1986年修订并重新发表《简化字总表》,于1988年相继发布《现代汉语常用字表》《现代汉语通用字表》。此外,中国文字改革委员会还编印了《第二批异体字整理表(初稿)》(1956年)、《异体字整理表(修订稿)》(1965年)、《第二批异体字整理表(征求意见稿)》(1976年),发布了《第二次汉字简化方案(草案)》(1977年)。后几个字表由于社会环境及字表自身的原因,有的未能正式发布实施,有的发布后又宣布废止。从已经正式实施的几个字表所产生的社会效果看,确实对社会用字起到了重要的规范作用,初步实现社会用字的标准化,推动了我国教育、文化和科技事业的发展。但由于这些规范文件最晚也是在20多年前制订的,而随着国家现代化、信息化事业的快速推进,我国语言生活发生了巨大变化,旧有的规范已经不能完全适应现代社会的需要。因此,对此前的汉字规范工作重新审视,研制新的汉字规范标准,是非常必要的。这也是国务院当前颁布实施《通用规范汉字表》的重要原因。

      任何系统都是由一些相互联系、相互制约的若干部分结合而成、具有特定功能的有机整体。作为书写符号系统的汉字也是如此,它由一定数量相互联系、相互影响的字符集合而成,发挥着记录汉语的功能。正如王宁(2004)所说:“汉字不是个别字符的随意堆积,它必须形成一个适应汉语词汇意义系统的构形系统,才能全面完成记录汉语的任务。汉字的优化,不仅仅是个别字符的优选,还必须在个别字符优选的基础上,达到字系的优化。”在当代,处于实际应用状态下的汉字系统,虽然经过了几次大规模的整理和规范,但如果用优化的标准去衡量,仍然有进一步调整的必要。对当代汉字系统进行优化调整,必须坚持三项基本原则,即共时原则、通语原则和效度原则。

      一 共时原则

      衡量某一时代汉字系统的优化程度,首先要坚持共时的原则。也就是说,在界定某一时代的汉字系统时,只能包括那个时代实际应用的汉字,而不是那个时代所存留的所有汉字总和。

      汉字在发展的过程中,其数量呈逐渐累增的趋势。这一点从历代字书的收字情况可以得到印证。例如:公元100年东汉许慎的《说文解字》收字9353个,加上重文共计10516字;公元543年南朝梁顾野王编的《玉篇》收16917个;公元997年辽行均编的《龙龛手鉴》收字26430个,其中俗字较多;公元1011年宋陈彭年等编的《广韵》收字26194个;公元1066年宋司马光等编的《类篇》收字31319个;公元1067年宋丁度等编的《集韵》收字53525个;公元1212金韩道昭编的《改并五音聚韵四声篇海》收字56001个;公元1615年明梅膺祚编的《字汇》收字33179个;公元1671年明张自烈编的《正字通》收字33549个;公元1716年清张玉书编的《康熙字典》收字47035个,加上古文字字头共49030字;1915年陆费逵等编的《中华大字典》收字48000多个;1971年张其昀主编的《中文大辞典》收字49888个;1990年徐仲舒主编的《汉语大字典》收字54678个;1994年冷玉龙等编的《中华字海》收字87019个。

      但另一方面,汉字在各个历史时期的实际应用数量却是有限的。例如:《十三经》的不重复单字数为6544个;《史记》的不重复单字数为6000个;18401首宋诗的不重复单字数为4520个;《毛泽东选集》四卷的不重复单字数为2981个;新华社1986年4000万新闻稿的不重复单字数为6001个;国家语委9100万字符的《现代汉语平衡语料库》(1919-2002),其不重复单字数仅为8288个。这说明,汉字在各历史时期的实际应用数量基本上维持在6000字左右,这与字书日渐累增的收字数量是相当悬殊的。

      那么,字书超出实际用字量的那些汉字从何而来呢?研究表明,其中大部分是不同历史层面不同字体的积淀、重复造的字,甚至有一些是错别字,例如《汉语大字典》中“国”字有以下不同写法:

      

      

      國:《说文》:“國,邦也;从口从或。”高鸿缙《中国字例》:“國之初字,从口,一为地区之通象,合之为有疆界之地区之意为通象,故为象意而属指事符;益之以戈声,故为指事符加声之形声字。周时借用为或然之或,乃加口(即围字)为意符作國……徐灏日:‘邦谓之國,封疆之界谓之域,古但以或字为之’是也。”

      

      对这类字,《简化字总表》《现代汉语通用字表》清理得并不彻底。例如,《简化字总表》收录了一些已经废除的旧称用字和现代已没有使用价值的文言用字:

      鳆:鳆鱼,鲍的古称。

      钶:化学元素铌的旧称。

      :化学元素“锿”的旧译。

      :化学元素“铽”的旧译。

      唡:英美制重量单位,常衡1唡是1磅的1/16,约合28.35克。也写作“英两”。现用“盎司”。

      喎:口眼歪斜。

      :赐予。

      《现代汉语通用字表》也收录了一些此类的字:

      甙:有机化合物“苷”的旧称。

      簦:古代有柄的笠,类似现在的雨伞。

      臁:小腿的两侧。

      庀:具备,治理。

      榀:房架一个叫一榀。

      揾:用手指按住;擦。

      塈:用泥涂屋顶;休息;取。

      朘:zuī,男孩生殖器;juān,缩,减。

      这些字或仅存于古代文献,或已经为新标准明确废除,在现代汉语通用层面上是不会使用的,因而均不应该纳入当代汉字系统之中。这些现象明显违背汉字系统优化的共时原则,必须进行认真审核和清理。

      二 通语原则

      中国是一个多方言的国家,自古以来就有专门为方言造字的现象。汉代杨雄的《方言》,就是一部专门收录方言用字的重要小学文献。随着方言和通语之间的交融,有些方言用字所记录的词汇可能被通语所吸收,这些方言用字也会随之进入通用汉字的范围。如《说文解字》就收录了一部分《方言》中的方言字。但是,从历史和现实的情况看,更多的方言用字只是停留在方言的范围内,始终未能成为当时的通用汉字。如《方言》所收的字,很多都不见于当时的经典文献,也就是没能进入那个时代实际应用的汉字系统。

      

      

      我们今天整理当代的汉字系统,必须考虑记录通语的基本原则,即只有记录普通话词汇或已被普通话吸收的方言词汇的汉字,才有资格成为通用汉字。无论方言字的来源如何,只要它所记录的词语不属于通语,这些字就不能纳入当代汉字的系统之中。

      在《简化字总表》和《现代汉语通用字表》中,都存在一些不符合这一原则的字。如《简化字总表》“”“挜”二字《新华字典》的释义为:

      :〈方〉①(—儿)用绳子、带子等拴成的结:活~儿,死~儿。②拴,系(jì):~个儿,把牲口~上。

      挜:〈方〉硬把东西送给或卖给别人。

      《现代汉语通用字表》“礤”等字《新华字典》的释义为:

      礤:粗石。[礤床儿]把瓜、萝卜等擦成丝的器具。

      膪:[囊膪]猪的胸腹部肥而松软的肉。

      塃:〈方〉开采出来的矿石。

      囝:(一)jiǎn〈方〉儿子。(二)nān〈方〉同“囡”。

      氽:〈方〉①漂浮:木头在水上~。②用油炸:油~花生米。

      塮:〈方〉猪羊等家畜國里积下的粪便。

      揎:捋起袖子露出胳膊:~拳捋袖。

      这些字,《新华字典》有些明确标有“〈方〉”,有些虽然没有明确标“〈方〉”,但其方言色彩依然是非常浓厚的。它们明显属于方言用字的范围,是当代汉字系统优化所需要淘汰的。

      三 效度原则

      记录汉语的效度是衡量汉字系统是否优化的一个重要指标,具体表现为能否用最适量的汉字去最大限度地满足记录汉语的需求。把握“最适量”的程度,是以记词职能的有效表达为标准的。在此标准指导下,对那些记词职能完全相同或非常接近的汉字进行合并认同,以求得汉字系统的简约;对那些因承担记词职能过多而影响表达的汉字进行分化别异,以求得字词关系的清晰。汉字系统的简约和字词关系的清晰,是汉字系统优化的效度原则的两个必要方面,只有二者在对立中实现统一,才能实现汉字系统优化的最佳效度。

      过分强调汉字系统的简约,过度精简汉字的字数,必然会影响汉字记词职能的清晰;而过分强调汉字记词职能的细微差异,不及时整理和归并汉字的冗余信息,就会使汉字的数量越积越多,从而加重使用者的记忆负担。这两个方面的问题在现行汉字规范文件中都有存在。

      (一)需要归并而没有归并

      在《简化字总表》和《现代汉语通用字表》中,都有一些字是需要与其他字进行合并认同的。如《简化字总表》中的“硷”“挢”等字:

      硷:同“碱”。 挢:同“矫”。

      铓:“锋铓”同“锋芒”。 鲶:同“鲇”。

      谉:同“审”。 谘:同“咨”。

      :同“宴”。

      再如《现代汉语通用字表》中的“舨”“拚”等字:

      舨:“舢舨”作“舢板”。 拚:同“拼”。

      缏:同“辫”。 篊:同“荭”。

      蹓:同“遛”。 垅:同“垄”。

      (二)不该归并而归并

      新中国成立之初,汉字改革的主要任务之一就是要精简字数,对汉字进行归并。这一点在《简化字总表》和《第一批异体字整理表》中得到明确的体现。《简化字总表》中最典型的就是“同音替代”和“几字共简为一形”的情况。同音替代的情况如:闆—板,彆—别,蔔—卜,衝—冲,醜—丑,齣—出,鬥—斗,範—范,穀—谷,後—后,裏—里,麵—面;几字共简为一形的情况如:發、髪—发,復、複—复,乾、斡—千,飢、饑—饥,保、繫—系,隻、祗、衹—只。据统计,《简化字总表》中这两种类型共有98组,共精简汉字106个。《第一批异体字整理表》是1955年12月由文化部和文字改革委员会联合发布,并决定从1956年2月起在全国实施的。发布时的说明中说:“表内所列异体字共810组,每组最少2字,最多6字,合计共1865字。经过整理后共精简去1055字。”

      《简化字总表》和《第一批异体字整理表》对部分汉字进行归并,在一定程度上达到了减少字数的目的,对于减轻使用者记忆和分辨的负担有积极作用。但是,这两个字表都有对汉字过度归并的倾向。

      《简化字总表》同音替代和几字共简为一形造成了“一简对多繁”的现象,即一个简化字对应多个繁体字(或传承字)。如果将两个本来都十分常用的字归并在一起,很容易导致使用上的歧义,如“干”对应“干、乾、斡”等;同时在计算机简繁自动转换和文言文印刷等应用领域,由于简繁关系不能一一对应而常常产生错误,如把“头发(頭髪)”错转为“頭發”、把“干净(乾凈)”错转为“斡净”等。因此,这些简化的方式招致了较多的批评,不少人呼吁重新恢复这类被归并的字。如吉常宏(2014)说:“同音替代人为地破坏了汉字的表意体系。简化字的制定不能只顾书写方便,不管汉字的形、音、义三位一体的完整体系,而轻易加以破坏。”裘锡圭(1991)认为:“使用同音代替的方法时,如果被代替的字和代替它的字的意义有可能混淆,也会引起麻烦。”

      《第一批异体字整理表》在对汉字进行归并方面问题更为突出。该字表发布时的《联合通知》指出:“从实施日起,全国出版的报纸、杂志、图书一律停止使用表中括号内的异体字。但翻印古书须用原文原字的,可作例外。一般图书已经制成版的或全部中分册尚未出完的可不再修改,等重排再版时改正。机关、团体、企业、学校用的打字机字盘中的异体字应当逐步改正。”这个文件明确了异体字属于“不规范字”的范围,在通用层面书写现代汉语文本时,不能使用异体字。所以需要从记词职能完全相同而字形不同的一个字种的多个字样中,选择一个通用的字形作正字,规定其他字不再使用。该字表的发布大大缓解了当时的用字混乱现象,精简了汉字字数,减轻了学习者的负担,加强了社会用字规范。但由于历史和时代的因素,《第一批异体字整理表》中确定的“异体字”,从现代汉语通用层面上来看,有些并不是严格异体字。特别是在姓氏人名、地名和科学技术术语用字中,一些非严格异体字尚有无法取代的使用价值。把这些字都列入“不规范字”的范围而取消,对意义的精确表达会产生不好的影响,也不符合科学认同的原则。

      《第一批异体字整理表》中的“异体字”可以区分为严格异体字和非严格异体字两大类型:

      1.严格异体字

      《第一批异体字整理表》中的严格异体字还可分为异写字和异构字。

      (1)异写字。异写字是指同一个字种因写法不同而造成形体差异的两个字样。主要有两种情况:一是因笔画组合方式、数量不同而形成的形体差异。例如:册[冊]、污[汚]、插[揷]、冉[冄]、厮[廝]。二是因构件位置不同而形成的形体差异。例如:鞍[鞌]、岸[

]、稿[稾]、够[夠]、峰[峯]、辣[辢]。

      (2)异构字。异构字指在任何情况下音与义都相同,而在构件、构件数量、构件功能等方面至少有一项存在差别的两个字样。例如:碇[矴]、凳[櫈]、睹[覩]、妒[妬]、桌[槕]。

      对于严格异体字,《第一批异体字整理表》在每组字中确立一个正体,淘汰其余的异体,这样处理对于优化汉字的共时系统是十分必要的。

      2.非严格异体字

      《第一批异体字整理表》中的非严格异体字情况比较复杂。包括如下几种类型:

      (1)分化字。分化字指原来用一个字记录的词和义,为了区别,分开用两个或两个以上的字来记录。分化字在发展中会出现两种结果:一种是分化之后两个字的记词职能明确,在义项上不再相互通用;另外一种是分化之后母字在记词职能上仍然能够涵盖分化字,此类型又可称为分化未遂。在《第一批异体字整理表》中,涉及的分化字大多属于第二种情况。例如:“赞[讚]”,“讚”分化了“赞”的“称赞;文体的一种”等意义,但这种分化并没有持续下来,在现代汉语共时层面,“赞”既可以表示“称赞;文体的一种”,又可以表示“赞助”义,完全包含“讚”的义项。“志[誌]”,“誌”分化了“志”的“记在心里;记号”等意义,在现代汉语共时层面,“志”既可以表示“记在心里;记号”等意义,又可以表示“志向”义,完全包含“誌”的义项。

      (2)通假字。通假字包括同音借用字和同源通用字。同音借用字指在本字已经存在的情况下,借用音同或音近而意义无关的字来替代本字。同源通用字是指因词的派生而孳乳出的新字在尚未完全惯用的过渡阶段,与源字通用或者新字之间混用的现象。根据两字在现代汉语共时层面上义项的异同,《第一批异体字整理表》中的通假字又可细分为以下四种情况:

      第一,由于长期使用中的义项通用,使两个字在现代汉语共时层面上的义项完全相同。例如:“鋤[耡]”,两者本义不同,“鋤”本字作“组”,表“锄头”,《说文·金部》:“鉏,立薅所用也。”而“耡”原指“古代的一种税赋制度”,《说文·耒部》:“耡,商人七十而耡。”在使用过程中,由于读音相同,“鋤”与“耡”在“锄头”义项上通用,在现代汉语共时层面,两者的义项已完全相同。“罵[傌]”,“罵”本用作“责骂”义,“傌”用作“汉代的刑罚”等义。因为读音相同,“傌”与“罵”通用,具有了“责骂”义。在现代汉语共时层面,“傌”所记录的“汉代的刑罚”等义项已成为生僻义不再使用,两者的义项已完全相同。

      第二,义项部分相同,且正字义项可以涵盖非正字义项。例如:“煙[菸]”,两者在来源上各有本义。由于读音相同,两者在“烟草制成品;鸦片”等义项上通用,其他义项不通用。在现代汉语共时层面,“煙”的义项可以涵盖“烟”的义项,但在“烟火;像烟的东西”等义项上只作“煙”。“吃[喫]”,两者在来源上各有本义。《说文·口部》:“吃,言蹇难也。”《说文新附》:“喫,食也。”由于读音相近,两者在“吃饭;吸收(液体)”等义项上通用,其他义项不通用。在现代汉语共时层面,“吃”的义项包含“喫”的义项,但在“口吃”义上只作“吃”。

      第三,义项部分相同,且正字义项无法涵盖非正字义项。例如:“修[脩]”,两者在“修饰;钻研”等义项上完全通用,但在表示“束脩”时只能用“脩”,不能用“修”。“捍[扞]”,两者在“捍卫、保卫”义项上完全通用,但在表示“扞格”义时只能用“扞”,不能用“捍”。

      第四,义项完全不同。两个字在历史上存在过通用现象,但在现代汉语共时层面义项完全不同,分工明确,职能清晰。例如:“淡[澹]”,历史上,两者在“含某种成分少、稀薄”等意义上通用,但在现代汉语共时层面,“淡”的义项为“含的盐分少;含某种成分少、稀薄;不热心;营业不旺盛”等,“澹”的义项为“水波起伏;安静”,两个字的义项已完全不同。“雕[凋]”,历史上,两者在“修饰”意义上通用,但在现代汉语共时层面,“雕”的义项为“一种鸟类;雕琢;用彩画装饰”等,“凋”的义项为“草木零落、衰落”,两个字的义项已完全不同。

      (3)历史上某个时段中曾经是严格异体字,在现代汉语共时层面上义项略有差别,但正字义项可以包含非正字义项的字组。例如:“岳[嶽]”,《说文·山部》“嶽”下以“岳”作“嶽”的古文,《说文·页部》“

,前面岳岳也。”段玉裁注:“岳,古文嶽。”可见它们都是为“山岳”义所造之字,为严格异体字。但在现代汉语共时层面,“称妻的父母及伯父、叔父”及作姓氏时只用“岳”来记录,不能写作“嶽”。“眷[睠]”,《说文·目部》:“眷,顾也。”《玉篇·目部》:“睠”,同“眷”。两者为严格异体字。但在现代汉语共时层面,表示“亲属”义只能用“眷”来记录,不能写作“睠”。

      (4)音义无关字。例如:“挪[挼]”,“挪”读nuó,义为“移动”;“挼”读ruó,义为“揉搓”。两者音义均不相关。“婀[婐]”,“婀”读ē,义为“轻盈柔美貌、依违阿曲”;“婐”读wǒ,义为“侍候”。两者音义均不相关。

      对于以上非严格异体字,《第一批异体字整理表》也不加区分地一律采取用“正字”代替“异体”的方式处理,这样处理使得在现代汉语层面仍然有用的字被人为淘汰了。不该合并的字硬性合并之后,严重影响了汉字记词职能的清晰度,违反了汉字系统优化的效度原则,给社会用字带来了很多不便。因此,对当代汉字进行系统优化,就应该对这些“异体字”进行重新审视,根据不同情况作出合理的处理:对于义项完全能够被正字包含的非正字,应认可为异体字;对于义项与正字完全不同的非正字,不再将其视为异体字;对于义项无法被正字完全包含的非正字,应该在特定意义上恢复其正字的地位。特别是一些姓氏用字,如“耑”“氾”“仝”“甯”等,如果按《第一批异体字整理表》作为异体字淘汰,就等于强迫这些家族改姓,这是与中华传统文化的价值取向相违背的。

      可见,对当代汉字系统进行优化,不是单纯减少字数的问题,而是如何使汉字系统更好地完成记录汉语的任务。在共时原则、通语原则、效度原则的共同指导下,淘汰冗余的字,恢复有用的字,才是优化当代汉字系统的正确做法。国务院2013年9月颁布的《通用规范汉字表》很好地遵循了这三项基本原则,在以前汉字规范工作的基础上,根据新时代标准化的理念,对已有的规范文件进行整合和优化,科学定量,合理分级,立足现实,尊重传承,有效促进了当代汉字系统优化水平的提高。

标签:;  ;  ;  ;  ;  ;  ;  ;  

当代汉字系统优化的基本原则_第一批异体字整理表论文
下载Doc文档

猜你喜欢