“选择”的词类标注问题探讨-一项基于双层词类范畴化理论的实证研究论文

“选择”的词类标注问题探讨
——一项基于双层词类范畴化理论的实证研究

吴 铭,李 蕾

(四川外国语大学 研究生院,重庆 400031)

摘 要: 现代汉语中词类划分标准到底是语法还是语义或者二者并存,尚存争议,这使得兼类问题的讨论更为激烈。兼类问题处理不当将直接影响词典编撰的准确率,误导学习者。基于双层词类范畴化理论,以国家语委现代汉语语料库和BCC语料库为研究工具,以“选择”作为个案研究的检索关键词,探讨了该词在语言和言语两个层面的词类归属,认为该词具有动名兼类现象,建议在词典和语料库中增添其为名词的词类或词性标注。

关键词: 选择;词类标注;双层词类范畴化理论;动名兼类词

引言

现代汉语词类的划分标准一直被视为是一个哥德巴赫猜想式的老大难问题[1]。而兼类问题(同一词汇归属不同的词类属性),尤其是动、名兼类和形、名兼类问题,尤为突出[2]。由于汉语理论学界争议不断,因此,基于不同的汉语理论而实施的各类实证研究也众说纷纭,导致汉语单语和以汉语单语词典为依据编写的汉外双语学习词典的词类标注问题存在巨大分歧。

通过具有反义、同义或类义关系的词项的词类标注和释/译义即“对称性原则”,可快速检验一部词典中兼类词的处理效果[3],因为这些词项通常会在词义演变方面发生类同引申的情况[4-5]。当然,此处的对称是相对的。因为,语言是动态发展的,词义也会经过历时发展在共时层面得以改变,词义的确定最终取决于某一社群团体对该词的使用频率。

b.对上级和权威的态度.在我国,企业强调和维护上级管理者的权威,下级员工应无条件执行管理者的指令.而在西方,大多数企业的下级对上级有一定的建议权、质疑权.

汉语词典大多遵循“词义不变,词类不变”的原则进行编撰,单独将兼类词中自指义项标注出来并进行释义的情况相对较少。规约化(conventionalization)在语用学领域指字面义,具有概括性,能够涵盖那些未必成句的语言表达形式的意义[6]。一般而言,规约含义或常规含义(conventional implicature)常有两种意义,一种指语法化过程的第一步,特定的句法结构逐步用于特定的功能;另一种指在语法化的初期,特定的组合形式或结构表达用于表现某种意义或特定功能,常由词语的常规意义所决定。历史语言学家认为“conventionalization”与“idiomatization”或“routinization”常等同[7]

然而,对于在语言社群层面中已经达到规约化或已发生相变的自指用法,应当单独设立自指义项[8]。但是,汉语语法研究者和汉语词典编纂方面的学者尚未形成一种理论上的共识和实践上的自觉,对于自指义项的设立相对较少。

鉴于此,本研究拟基于双层词类范畴化理论,以国家语委现代汉语语料库和北京语言大学语料库(BCC)为研究工具,以“选择”为检索词,探讨该词在语言和言语两个层面的词类归属,分析现存词典中对其标注不一致的原因及解决对策,以期更好地探讨词类归属问题,为汉外双语学习词典的编撰提供合理的建议。

对挑选出的语料,坚持以命题言语行为功能为主、语义为辅的词性判断标准,逐一分析语法功能并推断其命题言语行为功能。例如,在“他们各自选择了自己喜爱的不同的乐段,离开自己的座位,进行表演。”这条索引中,“选择”在句子中作谓语,表陈述,属于动词词性,语义为“按照自己的喜好选择乐段进行表演”。依照此方法,经过分析整理,得出如表3所示的词类分布数据。

一、研究问题

双层词类范畴化理论[9]遵循索绪尔提出的语言和言语两个层面,一反牛顿经典力学中的经典二值论逻辑,基于量子力学中的观点,认为光既然兼具波粒二象性,那么,分析语中词类范畴化也应当发生在个人言语层面中的个体词和社群语言系统层面中的概括词两个范畴。前者指个人的命题言语行为(包括指称、陈述、修饰等),后者指一个语言集体无意识的自组织规划化或相变的过程。社群语言层面词库中概括词或词项的词类属性是随着个体词例在言语层面句子中反复使用而发生的,因此,要判断个体词的词类属性必须基于语料库的方法对概括词进行使用模式的调查,以使规划化程度得以量化。

由表3可知,“选择”表陈述,作谓语,属于动词词性的情况在国家语委现代汉语语料库中的频次为368次,占73.6%;BBC中为235,占47%;表指称,作主宾语,属于名词词性在前者中频次为103,占20.6%;后者中为264,占52.8%;而表修饰,作定语,属于形容词词性的在两个语料库中所占比较少。由此可见,“选择”一词在语料库中既具有动词用法也具有名词用法,且使用频率较高。具有形容词用法,但使用频率相对较低。若想继续弄清“选择”是否具有形容词用法,未来的研究中,可进一步扩大样本容量,分析“选择”的所有索引条。

(2)类型频率

表1 汉语词典对“选择”的词类标注

表2 汉英词典对“选择”的词类标注

《现代汉语常用词表》中“选择”一词的频序为592,使用频率较高。而使用频率与兼类成正相关,因此,对于各部词典中标注不一的“选择”一词,是否存在动名兼类现象或者应采取少数服从多数的原则,将“选择”一词只处理为动词,还需作进一步的探讨。

①故意漏标。一贯地遵循“简约原则”,认为兼类词不存在或应当尽可能地减少这类词的存在。

二、研究理论和方法

在所选取的8部汉语词典以及4部汉英词典中,通过以“选择”为关键词进行逐一筛选,发现各部词典对该词的词类标注存在巨大分歧:8部汉语单语词典中存在差异,4部汉英词典中也存在差异,汉语单语词典和汉英双语词典对该词的标注也存在不同。选取的12部词典分别为《现代汉语词典》(第5、6、7版)、《商务馆学汉语词典》(2006)、《现代汉语规范词典》(第1、2版)、《应用汉语词典》(2006)、《当代汉语词典》(2009)、《外研社·现代汉英英汉词典》、《558易用汉英词典》、《外研社·汉英词典》(第三版)和《英语辞书大系·新编汉英词典》。

本文选取国家语委现代汉语语料库和BCC语料库对“选择”进行检索并分析。根据规约化的标准,从个例频率和类型频率两方面对其用法的规约化程度进行分析。首先,分析“选择”在句中的命题言语行为功能,分别标注为指称、陈述和修饰;然后,针对“选择”的各种用法(包括指称、陈述、修饰等),统计其在句法环境中的搭配类型频率,从而对各用法尤其是指称用法的规约化程度做出判断。

三、研究结果及讨论

1.研究结果

词的规约化用法只有通过概率统计的方法,对搭配和配价运用在多个语料库中进行多种统计分析后才能确保研究的信度和效度[10]。国家语委现代汉语料库语料来源光、时间跨度大、支持在线检索,同时可以进行分词和词性标注,十分便利。BCC语料库主要以汉语为主,总字数约为150亿,包括报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,足以全面地概括语言的全貌[11]。因此,挑选这两个语料库分别对“选择”一词进行检索,发现在国家语委现汉语料库中共有1794条索引;BCC语料库中共297786条。考虑到索引条总数较多,若逐一分析耗时费力;而语料库本身属于随机抽样,因此,各抽取两个语料库中的前500条进行分析,若前500条中有不符合筛选条件的,自动跳到下一条,选出1000条样本进行分析。

(1)个例频率

李金枝还想继续在我身上发泄怒气,被李老黑制止了。李老黑冲刚进来的老婆摆了摆手,李老黑的老婆就连劝带拉地把李金枝弄出去了。

表3 国家语委现代汉语语料库和 BCC语料库 中“选择”索引词类分析结果

表5所示为制备的活性炭基脱氯剂与国内某牌号的丙烯用活性炭基脱氯剂AC-101的性能对比。分析可知,CT-01I不仅强度、磨耗、孔容及比表面积等均明显优于AC-101,而且其穿透氯容和饱和氯容亦远高于AC-101,分别高约3.13%和4.59%。因此,该活性炭基脱氯剂更适合于丙烯深度脱氯。

汉语单语词典中,《现代汉语词典》(第5,6,7版)、《商务馆学汉语词典》(2006)、《应用汉语词典》(2006)、《当代汉语词典》(2009)和《外研社·现代汉英英汉词典》都将“选择”一词标注为动词,而《现代汉语规范词典》(第1、2版)中出现了名词用法,表示“挑选的结果”;汉英双语词典中,《外研社·现代汉英英汉词典》《558易用汉英词典》和《英语辞书大系·新编汉英词典》都将“选择”标注为动词,而《外研社·汉英词典》(第三版)中出现了名词用法;将8部汉语单语和4部汉英双语词典对比也发现“选择”一词的词类标注存在显著差异。见表1和表2。

类型频率有助于将结构类型扩展到不同的词汇项中。国家语委现代汉语语料库和BCC中“选择”表陈述的用法有“NP+选择”“NP+的+选择”“VP+选择”三种结构,分别占总数的 23.9%、45.4% 和30.7%,可见搭配类型多种多样。

表4 两个语料库中“选择”表陈述的结构类型

2.讨论

(1)概括词“选择”的词类归属

从图6(a)可见,与纯膨润土压实试样相比,孔径大于0.1μm的混合试样孔隙累计曲线,均处于纯膨润土试样的下方,说明添加纳米氧化物后起到了充填大孔隙的作用。当孔径小于0.1μm时,单掺入4%纳米氧化钙或6%纳米氧化硅后的试样孔隙累计曲线,依然处于纯膨润土试样的下方;但同时掺入两者的试样累计曲线却处于上方,说明孔径小于0.1μm的孔隙体积增多。具体表现为图6(b)中孔径大于0.1μm的孔隙分布曲线峰值向左平移,而孔径小于0.1μm的分布曲线峰值向右平移。

分析语(如英、汉语)中的规约化程度取决于个例频率、类型频率、历时和语域分布[12]。现代汉语中一般选择前三个作为参考标准。根据“选择”在语料库中的个例频率和类型频率来识别其词类属性,并判断其规约化程度是否足以进入语言系统层面,从而被收入词典。

由表3可知,500条“选择”语料在国家语委现代汉语语料库中命题言语功能分别为表陈述、指称、修饰的频序为368、103和29;BCC中为235、264和1。另外有603条(国家语委现代汉语语料库和BCC中分别为368和235 条)索引中的“选择”可以单独作主宾语,表陈述。由表4可知,两个语料库中“选择”一词的名词性用法已形成规约化的典型使用模式。“选择”表陈述结构中“NP+的+选择”和“VP+选择”所占比例较高(分别为45.4%和30.7%)。其中有367条“选择”以“提供/放弃/作出/进行/做出……”,或者以具体的数额为宾语。总之,与“选择”搭配的词语类型丰富,并呈现出一定的规律。因此,现代汉语中“选择”一词在汉语社群语言层面词库(即语文词典)中的词类应当同时标记为动词和名词,可考虑形容词词性。《现代汉语规范词典》(第1、2版)将“选择”处理为动名兼类的做法是合理的。

(2)词类漏标原因探讨

由于MIF地图文件中获得的数据是位于地球椭球面上的经纬度坐标,所以需要转化成平面坐标数据,才能绘制地图。转换方法如下:

②忽视性漏标。认为词类的范畴化只出现在个体词或概括词的某一种,忽略了词类范畴化可能同时出现在个体词和概括词两个不同的语言范畴上,从而导致标识错误。

③未考虑使用频率的影响。语言是一种文化传承的产物,是一种动态变化的复杂适应系统,应该基于使用频率,对于个人言语层面中高频的或者已经达到规约化的词的个例或词性应当收录进由个体词高度抽象化后得到的概括词即词典中的词目词或义项中。

总的来说,西方发达国家的高校在大型仪器设备的管理和使用方面,都保持的开放共享的态度,注重与大型企业和国家级科研院所的合作,保持着各机构间的资源调度与合理利用以达到双赢的基本共识;发展中国家也在积极探索符合本国国情的大型科学仪器设备的开放共享模式。

结语

通过对“选择”一词词类标注与译义的研究,发现“选择”这一概括词在词典中的词类属性应当为动名兼类词,而大部分语文词典及汉英词典的编撰中只收录了其动词用法。一方面,建议修正这一错误的标注,提高词典编撰的准确性。另一方面,由于语料库在进行词性标注时,选择的标准不一,因此,对于词性的标注也存在分歧。此时,亟需一个统一的词类划分标准作为依据来降低词性或词类标注的错误率。

物理学中的胡克定律,是描述弹簧的弹性系数可以通过对其施加的外力和它自身的形变程度测出,但弹性系数本身取决于弹簧的材质,与所施外力大小和形变程度无关。其表达式如下:

由于大多数词典在编撰时遵循了“简略原则”,未采取双层词类范畴化理论,导致各大中型双语词典中词类标注相互矛盾,标注不准确,不完善;语料库中的词性标注也与词典中的配例矛盾。因此,汉语单语词典词类标注以及汉语单语语料库词性标注的准确性是汉英甚至其他汉外学习词典或语料库的先决条件。为了保证词典编撰和语料库标注的准确性,应当遵循语言的使用原则,将语言视为文化的产物,结合语料库这一工具,注重使用频率,实事求是,不受“简约原则”的错误指导,基于全面而系统的理论基础以及语料库的调查模式,提高词典编撰和语料库标注的准确性,从而更有效地促进母语或外语学习者的学习。

参考文献

[1]陆俭明.现代汉语语法研究教程(第4版)[M].北京:北京大学出版社,2013:34.

[2]胡明扬.词类问题考察[M].北京:北京语言文化大学出版社,1996.

[3]王仁强.汉英词典词类标注与译义的对称性研究——兼评《ABC汉英大词典》的词类标注与译义[J].广东外语外贸大学学报,2005(b11):92-96.

[4]江蓝生.近代汉语探源[M].北京:商务印书馆,2000.

[5]张博.现代汉语同形同音词与多义词的区分原则和方法[J].语言教学与研究,2004(4):36-45.

[6]Levision,Stephen C.Pragmatics [M].Cambridge:Cambridge University Press,1983.

[7]方梅.负面评价表达的规约化[J].中国语文,2017(02):5-21+128.

[8]王仁强.语法隐喻与汉语词典自指义项的设立——一项基于语料库的研究[J].外国语文,2009(1):100-108.

[9]王仁强,黄昌宁.从双层词类范畴化理论看现代汉语自指词项的兼类问题[J].外国语文,2017(1).

[10]Teubert W.Hanks,P.Lexical Analysis:Norms and Exploitations[J].International Journal of Corpus Linguistics,2016,21(2):272-283.

[11]管新潮,陶友兰.语料库与翻译[M].上海:复旦大学出版社,2017.

[12]王仁强,陈和敏.基于语料库的动词与构式关系研究——以sneeze及物动词用法的规约化为例[J].外语教学与研究,2014(1):19-31.

Word Class Labeling of “选择”in Modern Chinese Based on Two -level Word Class Categorization Theory

Wu Ming,Li Lei

(Graduate School,Sichuan International Studies University,Chongqing 400031,China)

Abstract :There is a controversy over whether the standard of classifying parts of speech in modern Chinese should be based on syntax,semantics or both,which makes the discussion of the problem of classifying parts of speech more intense.Improper handling of heterosemy will directly affect the accuracy of dictionary compilation and mislead learners.Based on the theory of Two-level Word Class Categorization category,with Corpus of National Language Committee of China and BCC,the Chinese word“选择” is used as a case study of keywords retrieval,we try to specify the word class of “选择” in the lexicon at language and speech,these two levels of parts of speech,and the word “选择” should be a verb-noun heterosemy and it would be advisable to add it as a noun in the dictionary and corpus during the course of parts of speech or part-of-speech tagging.

Key words :Chinese word“选择”;word class labeling;Two-level Word Class Categorization Theory;verb-noun heterosemy

中图分类号: H16

文献标识码: A

作者简介: 吴铭,在读硕士,四川外国语大学外国语言学及应用语言学专业。研究方向:语料库语言学、二语习得、语言病理学。

李蕾,在读硕士,四川外国语大学外国语言学及应用语言学专业。研究方向:语料库语言学、语言病理学。

基金项目: 2018年重庆市研究生科研创新项目“英汉双语心理词库中名词、动词及动名兼类词的ERP对比研究”(编号:CYS18265);外国语言文学市级一流学科2018年研究生科研创新项目“语境对高熟练度汉-英双语者动名兼类词词类歧义消解影响的ERP研究”(编号:SISUWYXY201818)。

文章编号: 2096-3874(2019)08-0152-05

Class No .:H16

Document Mark: A

(责任编辑:蔡雪岚)

标签:;  ;  ;  ;  ;  

“选择”的词类标注问题探讨-一项基于双层词类范畴化理论的实证研究论文
下载Doc文档

猜你喜欢