汉语叙事词的构词研究_构词法论文

汉语叙词构词法的研究,本文主要内容关键词为:构词法论文,汉语论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

Abstract The paper studies the word-formation and ambiguity of theChinese descriptors with the Mechanical and Electrical Engineering Thesaurus.All word-formative methods of the Chinese natural language areused in the word-formation of the Chinese descriptors.The word-combinative descriptors only have structure of coordination and structure ofmodification.The ambiguity of the Chinese descriptors can be avoided by scientific and normalized word-formation. Keyword Chinese Thesaurus/Word-formative method

0 前言

近20年来不论国内外,大型叙词表的编制量一直在增长。据统计80年代比70年代增长了283%。同时对叙词法的研究也愈加深入和广泛。在我国近10几年的情报学术刊物上,发表了大量有关叙词表编制技术、计算机辅助编表技术和自动标引技术以及主题分析、组配技术等文章。叙词法的研究在我国取得了不少丰硕的成果。

目前,叙词法的研究是向两个方面深入发展:一是利用现代思维科学的研究成果,探讨叙词法的逻辑思维规律,使叙词法具有更严密的科学理论作为指导;二是开始研究叙词法与汉语语法的关系。当前,这项工作还只是刚刚起步,有待于我国图书情报工作者作大量细致和艰苦的工作,特别是汉语叙词和汉语词法、句法的关系,没有什么国外的成果可以借鉴,只有靠我们自己的探索和努力。笔者这篇文章就是一个尝试。

1 研究汉语叙词构词法的意义

叙词法是一种利用规范化的自然语言的词汇作为标引和检索标识符号的情报检索语言。汉语叙词直接取自汉语的日常和专业化的词汇(术语)。就某一学科而言,该学科的叙词表就是概括了该学科及相关领域在语义和类属关系上相关的规范化的名词术语的集合。这种情报检索语言与自然语言之间的区别,首先是表现在词类范围上的差异。

叙词主要是采用名词、名词性词组、名词化了的动词即动名词,以及少量的形容词。由于叙词是表达概念的语词形式,叙词的语义必须和概念这一思维单元相对应。叙词没有感叹词、副词、数词、量词、代词、连词等,比自然语言的词类范围要狭窄得多。如将汉语的词按实词、半实词(半虚词)、虚词来划分,叙词属于实词。也可以说叙词是自然语言的一个子集。它是从自然语言中脱胎出来,按照情报检索语言的特殊要求,被编制成一个复杂而又精确的逻辑语义网络——叙词表。它是一个特定的社会集团——文献标引者和检索者之间进行交流的特殊语言符号。尽管叙词表不直接提供每个叙词所表达的概念是什么,但通过这种逻辑语义网络,间接地提供了叙词的词义——词表语义。这种语义是有别于叙词本身在自然语言中所指的概念。但又不能违背这个语词在自然语言中最通用的、原始的、本质的那个概念。

叙词中大部分是术语,而术语是语词与概念结合的统一体。因此叙词所表示的概念,不能和这个词汇在术语学中所表达的概念相违背。术语或自然语言的语词形式进入叙词表以后,形成了一种检索标识符号,但其原来所具有的那些属性,并没有发生多大的变化,这正是人们可以用自然语言的词法和句法来研究叙词的基础。

著名语言学家德·索绪尔在他的《普通语言学教程》中说:“当情报检索语言学的内容和范围确定之后,构成情报检索语言的核心应当是词汇学(术语学)、句法学和语义学的问题。”用词汇学的观点和方法来研究情报检索语言的标识符号,是理所当然的。研究汉语叙词的构词法首先可以使我们更准确地掌握叙词的词汇意义,对正确理解叙词所指称的概念是有裨益的。这对减少标引误差、提高检索效率都很有帮助。而研究汉语叙词的字面成族对建立和完善叙词表的词族关系和逻辑语义网络有重要的补充和参考作用。而且研究汉语叙词的构词法还对叙词表的编制、字频和词频统计、计算机辅助编叙词表和辅助标引(自动标引)都有直接的指导作用。

2 汉语叙词构词法

自然语言的词汇进入叙词表以后,它原来所具有的那些属性,并没有发生多大的变化。即这个词的音和形没有改变,其次这个词与其他词的结合能力,以及词性、词类、词汇意义也没有发生多大变化,可能专指度提高了(对一词多义者来说)。因此,我们完全可以用研究自然语言中语词的构成方法来研究叙词的构词法。下面以《机械工程叙词表1990年版》(以下简称《机表》为例,具体探讨汉语叙词的构词法。

叙词主要采用名词和名词性词组。而汉语的词汇是由词素构成的,按照词素的数目,可以把叙词分成单纯叙词与合成叙词。

2.1 单纯叙词

单纯叙词在《机表》中有两种情况:

2.1.1 单音单纯叙词(一字叙词) 它本身既是词素又是词。可以和其他词素构成复合叙词。《机表》中:声、光、热、力、钢、轴、孔、键、轮、管、梁、杆及化学元素名称均为单音单纯叙词,约有147个,占叙词总量的1.03%。

2.1.2 多音单纯叙词 这种叙词有音译的国家名称,如:意大利,澳大利亚,印度尼西亚等。还有近代传入我国已成为自然语言中常用的不易辨别的一些音译外来语也大量进入叙词表。《机表》有:透平、雷达、拷贝、科学等。这些叙词虽然由两个(或两个以上)汉字组成,但只是一个词素,不能把它们拆开来,每个汉字的意义和词的指称没有任何联系,只仅仅借用这个汉字的音而已。在叙词表中还有很多音译词后面加上汉语的实词或虚词,或直接采用阿拉伯数字、外语字母(拉丁字母、希腊字母等)后面加汉语的词素构成叙词。这种叙词比日常语言中所采用的数量要多得多。这是由于叙词一般专业性很强,专指度很高所决定的。在《机表》中。奥氏体,γ相,X射线,O形圈,F级绝缘,PN结,APL语言,135照相机,45°轧机,CNC,CAD,CPU,FMS等均是。严格地讲,这些叙词处于单纯叙词与合成叙词之间。

2.2 合成叙词

由两个或两个以上的词素构成的叙词叫合成叙词。又可细分为复合叙词和派生叙词。在两字和三字叙词中绝大部分属于合成叙词。它是叙词表的主体。由这些合成叙词添加前后缀构成词组性叙词,形成字面成族的叙词结构。

2.2.1 复合叙词 实词素和实词素一起构成的叙词叫复合词。又可分成两大类构成方式。

①联合式:在这种叙词中两个实词素的地位是平等的,一般相互没有修饰、支配的作用。《机表》中:计算,运输,开关,摩擦,燃烧,紧固,联结,技术,检索,间隙,分离,排放,陶瓷,粉末等。在自然语言和叙词表中这类复合词所占比例均不大。

②偏正式:这是自然语言也是叙词当中最普遍的一种构词法。这种叙词中的两个词素,其中有一个是中心词素,另一个词素或修饰、限定中心词素;或被中心词素所支配;或表示中心词素的状态、动作等。语言学家往往又细分为谓宾式和主谓式。如中心词素是名词性的在后面,而前面的词素修饰和限定中心词素,很象句法中定语和主语的关系。《机表》中:激光,夹具,合金,卡规,光缆,电压表,齿轮油等。有的中心词素是动词性的,位置也在后面。《机表》有:摆振,并联,预烧,衍射,对流等。而象车辆,熔化,击穿等叙词,中心词素位置在前面,后面的词素起着修饰作用。如果中心词素是动词性,位置在前面又支配后面的词素,很象句法中谓语和宾语的关系。这就是所谓的谓宾式,其实质也是偏正式的一种。《机表》有:加工,变电,导热,排污,渗碳,铰孔,选矿,除尘,励磁,升压,换向等均属这一类。如果前面的词素是中心词素,是名词性的,后面的词素是动词性的,用来表示中心词素的状态、动作、类属等关系,很象句法中主语和谓语的关系,这就是主谓式的又一种类型的偏正式。《机表》中有:水击,液封,碳势,光刻,金属,炉龄,孔型,螺距,声发射等。《机表》中3字以上的叙词(音译叙词除外)全部是偏正式结构,加上两字叙词中大部分也是偏正式。估计偏正式结构叙词占全部叙词的80%以上。这个结论是和汉语日常用词当中数量最多的为偏正式结构这一情况相吻合的。

2.2.2 派生叙词 由实词素和虚词素构成的叙词叫派生叙词。实词素当然是中心词素。虚词素可在前也可在后,也可前后都有。现代汉语中普遍使用的“非”,“反”,“过”,“超”,“半”,“不”,“单”等虚词素,大量进入科技术语和叙词表中。《机表》有:过电压,超合金,逆变,反挤压,非晶硅,不锈钢,单晶等。而“度”,“性”,“素”,“率”,“化”等虚词素进入叙词词尾,构成词尾式派生叙词。《机表》有:塑性,酸度,损失率,元素,传动比等。而象不平行度,超塑性,过载量,非线性等叙词就属于词头词尾式派生叙词了。

简称在现代汉语词汇中也在日益增加,叙词表中:数控,维修,节能,监测,能耗,遥控,农机具等均是。他们有的属于联合式,有的属于偏正式。

3 词组性叙词的分类与结构

叙词表是一种先组式的检索语言。随着科技的发展,许多非常专业化的术语不断产生,也不断进入叙词表。这些术语除少量采用新字新词来表达外,大部分以词组性质的词汇出现,用以表达专指度很强的新概念。这也是汉语科技词汇发展的一个特点。随之而来的叙词表的先组度也不断增加。据统计国内大型叙词表的先组度都在60%以上。大量多级结构的词组性叙词进入叙词表。以《机表》为例,1990年版4字以上的叙词占总词量的65%以上,高于1979年版的61.1%。可以毫不夸张的说,词组性叙词已经成为现化叙词表的主角。研究它的分类和结构就具有很现实的意义。

3.1 词组性叙词的分类

由两个或两个以上的单纯叙词或合成叙词,以一定的语法规则组合而成的词组称为词组性叙词。大致可分为联合式词组性叙词和偏正式词组性叙词。

3.1.1 联合式词组性叙词 由两个地位平等,互相没有修饰、限定作用的叙词再加一后缀组成。在科技术语中一般不用连词而用“-”或“/”来表示联合关系。《机表》中:数/模转换器,电压/频率变换器,交-直-交变频调速,液-液分离,泵/水轮机,焦铁比等,均属此类。

3.1.2 偏正式词组性叙词 这种词组性叙词有一个中心词,在它的前面或后面的词(或词组)都是说明、修饰、限定中心词的。在日常汉语中偏正词组情况很复杂,语言学家又细分为定心词组、状心词组和补心词组。而在叙词中只出现定心词组,笔者尚未发现后两种词组。定心偏正式词组是以名词或动名词做中心语,一般放在词组最后面,前面的词或词组均与中心语发生关系,起着说明、限定、修饰的作用。还有一种短语(或称短句)结构的词组性叙词。它有主语、谓语、宾语很象一个句子。《机表》中的“以铝代铜”就是这种结构。不过这种短语式的叙词是较罕见的,大量的占绝大多数的是偏正式词组性叙词。

3.2 词组性叙词的层次结构

例1:

这里只分析偏正式词组的结构。

开关设备是中心语,其本身就是一个词组。“金属”和“封闭”组合起来共同修饰“开关设备”,构成第二级。“气体”和“绝缘”组合起来又共同去修饰“金属封闭开关设备”,构成第三级。

例2:

从例1、2可以看出词组性叙词的层次结构虽然比较复杂,但因都是定心词组,中心语在最后,一般不会出现一种表层结构可能表示多种深层结构的情况。但例3很可能出现两种结果,从而造成歧义。避免歧义的产生主要靠使用者的专业知识。“层压板”和“层压管”是常用的电工绝缘材料,因此第二种结构分析是错的。

4 叙词字面成族及歧义的研究

叙词的字面成族有两种情况。一种是违背术语概念体系的纯字面成族。

例4:

·泵

··气泵

··热泵

“泵”是输送液体或使液体增压的机械。“气泵”和“热泵”中的“泵”已经失去了“泵”的本义。只是一种形象思维的延伸,表示将“气”或“热”从低能位向高能位传递。“气泵”是印刷机的一个部件,它不同于“压缩机”这个词的概念,有它自己的特殊内涵。笔者认为这种字面成族反而造成概念的混乱,有碍于对叙词语义的了解,但许多词表中尚未完全杜绝这种现象。第二种字面成族是符合术语概念体系的字面成族,前面的例1、2每一级修饰语加中心语按顺序排列就形成词族,这就是建立叙词语义网络的重要手段之一的属分关系。

例5:

·塑料

··增强塑料

···纤维增强塑料

····玻璃纤维增强塑料

····金属纤维增强塑料

·····金属玻璃纤维增强塑料

这种成族在全显示的叙词表中得到充分的体现。本例是前面加修饰语的成族方式,也可以采用加后缀的成族来研究中心语的转移。这种叙词词族表(词族索引)汇集成层次分明的等级体系能及时发现词表的不足,便于今后修改,也能用于控制词表总词量。例5中“金属玻璃纤维增强塑料”因为词频很低,《机表》就没有收入,在标引实践中用组配方法来解决。但《机表》中缺少“纤维增强塑料”这一中间环节,笔者感到这一叙词还是有一定使用频率的。以上分析可以看出汉语叙词的字面成族对叙词的构成、叙词等级体系的完善、词量的控制等都有不可替代的补充作用,当然对自动标引中叙词库的组成,叙词的自动切分也是很有用的。

叙词发生歧义也有两种情况。一种是词表编纂者在建立属分类系和用代关系中,处理不当,使标引者和检索者对叙词语义的理解发生偏差,甚至错误,造成概念的混乱。如《机表》中对“不锈钢”和“不锈耐酸钢”的处理,及例4就是这种情况。第二种是叙词本身构词方法所引起的费解或歧义。本文只研究第二种情况。

如前所述词组性叙词大部分为定心偏正式词组。中心语为名词或动名词,处在叙词最后。但当动词性名词做修饰语时,很容易将其视为谓宾结构的词组。

例6:

焊接转子 检测机器人

从词汇学角度来分析这两个叙词可以看作谓宾词组:“焊接”、“检测”是谓语;“转子”、“机器人”是宾语。从而理解为焊接加工转子,检验测试机器人,这样就造成了歧义。实际上汉语的“动词+名词”这一表层结构,不仅能表示谓宾关系,也能表示“限制+被限制”的定心偏正关系,这两个叙词只能理解为焊接结构型式的转子和用于检验测试的机器人。

还有一种是构词不科学,从而造成费解,进而引起歧义。

例7:

气体压缩机 超薄带

众所周知,压缩机是输送气体和提高气体压力的一种从动的流体机械。在压缩机前面加“气体”来限定、修饰压缩机,反而使人对“压缩机”这个词所表示的概念变得含糊不清了。难道还有液体压缩机吗?这种不科学的画蛇添足式的构词方法,并没有从各种叙词表中彻底铲除。“超薄带”这个叙词很容易被纳入各种传动带(三角带、齿形带、平形带)的属分关系中,而实际上在《机表》中它是一种“带材”中一种材料,不是传动带。笔者在标引一篇有关超薄带传动的文献时,就误用了这个叙词。如果改为“超薄带材”,就不会被误解了。《机表》中“切削性能”这个叙词也是不太科学的。象这种类似的情形,在许多叙词表中时有出现,使标引和检索者往往是小心谨慎,生怕误入“陷阱”。在《机表》中还有一个特别的例子值得一提,就是用同一个字面形式,不加任何介词,人为地让其产生歧义,用来表示两个不同的概念。“塑料模”一是指铸造用模样,用塑料制造或在基材上喷涂塑料制成;二是指塑料成型模(不属于冲模),一般用合金制造。

笔者认为这有背于构词法,也有损于叙词的信息交流及检索功能。其实问题很容易解决,当表示第二个概念时,应直接用正式术语“塑料成型模”,如果还想包括加工塑料板材或型材的冲模这一概念,最好采用“塑料用模(具)”这一叙词。可见如何用好介词“式”、“用”、“上”、“型”等也是汉语叙词构词中不可忽视的环节。《机表》中电工类叙词对介词的处理比机械类叙词好。在叙词构法中,如何用好介词、助词对避免歧义,发挥汉字构词的生动、简练、望词生义等独有的特点,起着“画龙点睛”的作用。

5 结论

本文用汉语汇学的方法研究了汉语叙词的构词法及一些歧义现象。结论如下:

1)日常汉语的各种构词法均出现于汉语取词的构词中;

2)词组性叙词只有联合式与定心结构的偏正式,没有偏正式的状心词组和补心词组,也没有谓宾词组、主谓词组;

3)词组性叙词的表层结构也可能表示多种深层结构而造成歧义;

4)构词的科学性和规范化是避免歧义的根本方法。

标签:;  ;  

汉语叙事词的构词研究_构词法论文
下载Doc文档

猜你喜欢