语言数据库中的类型学概念_复数论文

语言库藏类型学构想,本文主要内容关键词为:库藏论文,语言论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1.为什么要设立语言库藏类型学

语言库藏(linguistic inventory,或译为“语言库藏清单”),是指特定语言系统或某一层级子系统所拥有的语言手段的总和,包括语音及韵律要素、词库、形态手段,句法手段,包括虚词、句法位置等。语言库藏因语言而异,并且会导致语种之间形义关系的显著差异,不但深刻影响到语义范畴的形式表达,而且深刻影响语义范畴的存在状况和“显赫性”(mightiness)。因此,我们提议设立语言库藏类型学,以揭示语言之间因库藏而导致的类型差异。本文便是有关这一学科的初步构想。

Inventory指语言手段总和的用法,在语言学英文文献中早已有例,但在中文文献中还非常少见。下面是笔者在网上搜得的一些使用inventory一词的英文文献,涉及语音、词汇、语法各方面(中译文为笔者所作):

列举不同语言的库藏差异不足以成为语言类型学的一个有价值的分支。我们提倡语言库藏类型学,部分受到凸显类型学(prominence typology,Sasse 1995)的启发。凸显类型学主要探讨话题凸显(Li and Thompson 1976等)、焦点凸显(Kiss 1981,1984,1987,1993等系列论文,转引自Sasse 1995;徐烈炯2002)等类型现象,即一种语言的基本结构是注重表现话题或焦点这种来自语用、话语的范畴,还是注重表现与施事、受事等语义范畴更相关的主语、宾语这类句法范畴。我们对语言库藏的想法也起步于此,但是当我们把凸显现象放入语言库藏的大框架来思考,其思路已完全超越了现有凸显类型学的范围:(1)库藏类型学超越话题、焦点这些个别领域,而覆盖语言的所有方面,可以形成一种涉及整个语法乃至整个语言的研究视角和框架。(2)库藏类型学超越从语义出发寻找形式表现的传统,注重形式和范畴间的双向视角,而且以形式到语义语用范畴的视角为出发点,因为库藏首先是形式手段。(3)库藏类型学认为,特定语言中的任何领域都有某些范畴凭借自身的库藏优势扩展用途成为显赫范畴,而另一些语言则会有另一些范畴成为家大业大的显赫范畴。所谓显赫,不仅凸显,而且强势,它会在使用中“侵占”其他语义语用范畴的领地,带来语言间形-义关系错综复杂的局面,并成为语种间类型差异的重要肇因。

本文主要关注语法库藏,但库藏类型学框架也适合于语音、词汇这些层面。因此我们倡导整体性的语言库藏类型学。下面更具体地说明一下设立该分支学科的理由。

任何语言都存在语言库藏的有限性和表达需求无限性的矛盾,因此,语言库藏常常一物多用。以某范畴为核心义的手段常常会扩张领地,用于偏离或超越其范畴核心的领域。语义本身具有人类共性,但是哪些范畴能成为扩张力强的显赫范畴,有很大的语种差异,这是导致类型差异的重要因素。

关于库藏显赫的观察,首先来自对汉语话题优先特点的研究。刘丹青(2009)指出汉语话题优先的特征,不仅表现在语用上的话题常被句法位置和话题标记等显性表达,而且话题表达手段还常用来表达在其他语言里属于其他范畴的语义;另一方面,其他语言也有自己的被凸显的范畴并扩张到其他语义域。

人类社会需要表达的思想感情、需要完成的交际任务,在大类方面是相通的。人类语言语法库藏的核心功能具有一定的共性,它们首先用来表达人类交际中最重要的语义范畴、完成人类交际战略层面的共同任务①。表面差异较大的库藏,也在蕴涵关系中体现出其间的共性。Greenberg(1966[1963])有多条关于形态范畴优先等级的共性,如:

(4)32条:只要动词跟名词性主语或宾语有性的一致关系,总也有数的一致关系。

36条:一种语言如果有性的范畴,它总具有数的范畴。

30条:如果一种语言里动词有人称-数的范畴或有性的范畴,那么它总有时-式的范畴。

共性32和36条表明,有性范畴或性一致关系的语言,必然有数,反之则不然,有数未必有性。可见在人类语言中,作为语法范畴的“数”是比“性”更优先获得形态表达的范畴。共性30则表明人称-数范畴或性范畴和时-式范畴之间也存在这样的优先等级。

另一方面,形态手段的使用并不限于其原型功能。在向非原型功能扩张方面,语言会更多地展示个性,使形-义的跨语言对应大大复杂化。一些学者对基本的词类是否有普遍性(如Bhat 2000,Rijkhoff 2000对形容词普遍性的否定)、句法关系是否有普遍性(Dryer 1997),都严加质疑,其根本原因应该就是库藏显赫性的语种差异带来的形-义关系的复杂性。

以动词的体为例。人类语言多有以表示动作完成为原型功能的手段,但这一手段能扩展到哪些功能的表达,随语种而异。如以完成义为原型的完整体标记“”,它由完成义可以转表完成后状态的持续,如“书包里藏了一个游戏机”,又可以表示动作产生的消失性结果,实际上是“”与北京口语中的“喽”[lou]在普通话中的混同形式(马希文1982),如“杀了这只鸡”。这些功能在其他有完成体或完整体标记的语言中未必表现为完成体或完整体。“”还有离体范畴更远的用法,如“这双鞋大了一号、汤做咸了”,“”表过量,很难再归入时体范畴,是汉语完整体特有的边缘功能。这类功能更难在其他语言的完成体/完整体系统中获得对应的表征。进行体也有类似的情况。如英语He is dying(他快要死了)就是进行体的扩展功能。汉语有进行体,但不能有“他在死、他死着呢”的说法。

语言之间在库藏扩展方面存在显著的差异;但扩展的潜在方向,仍然呈现出语言共性,因为库藏扩展是由人类共同的认知、语用规律推动的。新兴的语义地图理论(Haspelmath 2003)已经显示这类各有差异的演变遵循着共同的方向和线路。

语言库藏的形态-句法属性对其适用域和扩张方向有很大的制约。

语义具有人类共性,但其表达手段的形式属性存在着显著的语种差异。一个范畴是用词汇手段、形态手段还是句法手段?用什么样的形态手段和句法手段?其强制性、类推性如何?这些形式特征会强烈制约相关范畴表达手段的适用范畴和扩张方向,造成类型差异。

例如,任何语言都有表达名词的数量范畴的需求,但是表示单复数等数概念的手段却有显著的语种差异,由此造成数形态在不同语言中显赫性的差异及相关后果。英语中复数除少量例外,都用附加后缀s表示,是具有类推性和强制性的显赫范畴。复数手段由此派生出多种偏离复数核心义的功能。例如,复数名词常常用来表达类指(刘丹青2002):

(5)Cats are friends of human beings.I like cats.

这里两处cats都不是为了表示数的分别,而是要表示猫的类指义。在汉语普通话中,只有人类及高等动物有复数后缀“们”可加,并兼表有定含义,它不能表示类指。如:

(6)盲人们都过了马路。

(7)盲人?(们)是困难人群,他经常提出帮助盲人*(们)的提案。

例(6)谈论特定事件,“盲人们”指特定的若干盲人,不是类指。例(7)前一个“盲人”本来倾向表类指,加了“们”反而难以表类指,而倾向实指(specific),指特定的一群盲人;后一个“盲人”只能表类指,更不能加“们”。至于低生命度对象,没有复数形态,只能用词汇单位表示复数(一些柳树、很多石头),这些复数词语完全不能表类指。

数范畴的例子显示,表达手段的形式属性对库藏扩张的能力和方向有显著的制约。总体上,一种语言手段的语法性或语法化程度越高、使用频率越高、能产性和强制性越大,其扩张力和适用域就越广,它就越有资格成为显赫库藏,大致表现为(>指强于):

(8)形态手段>句法手段>词汇

其他如有定、全量、名词类别等范畴,都可以看到由相关手段的显赫性差别导致的类型差别。其中有些将在后面各节讨论。因此,语言库藏类型学的建立,便于将库藏显赫性及其句法后果用作观察人类语言的类型差异及其深层共性的一个有用的新视窗。

2.形态库藏类型学

形态,尤其是构形形态,是语法性最强的语言库藏。以形态表达的范畴,多为语言系统中较显赫的范畴。前文所举英语的进行体、复数等都是英语中的显赫形态。在形态现象内部,类推性和使用强制性越大的范畴,其显赫性越强。下面再举两例。

2.1 构形形态:英语中的比较级范畴

英语的比较级是用来表示差比范畴的形态手段。这种手段的类推性和强制性都很强。除了个别异干法构成的比较级词形(如good-better),英语比较级根据词根的不同使用两种可以类推的基本表达手段。一种是加后缀-er,另一种是在形容词前加more,属分析性形态。英语差比句对比较级词形有强制性要求。虽然句法上已有“than+基准”句式标明其为差比句,但形容词进入该句式必须取比较级,He is taller/more diligent than me绝不能说成He is tall/diligent than me。这种强制性不但使比较级形式具有更显著的形态特征,而且使它在英语中成为非常显赫的形态手段和范畴。凭借这种显赫性,比较级词形经常超越典型的差比功能,用于很多扩展功能或边缘功能。对比汉语,如刘丹青(2009)所举的no longer(不再)、earlier/later than X(在X之前/之后)、higher wage!shorter working time!(提高工资!缩短工时!)等都由比较级形态表达。差比句靠特定的虚词“比”及带“比”的特定句法结构来表示,如“他比我高”中,“高”为原形,形容词没有比较级形态,比较义的显赫度不如英语比较级。于是,上文所举英语比较级的扩展用法,在汉语中都使用与差比范畴无关的手段来表示。由此可见,英汉两种语言的差比范畴的显赫性大相径庭,所占领地范围迥异。

2.2 构词形态:英语副词构词形态的能产性

当构词形态具有较强的类推性和强制性时,构词形态也能成为显赫的语言库藏,在语言中发挥超越其原型功能的诸多功能。英语的副词构词法就是这样的一例。

除了少数单语素的副词如soon,very之外,英语副词大多由形容词按规则派生而来,绝大部分形容词都可以通过加后缀-ly构成副词,如greatly,happily,fortunately,因而其能产性和类推性很强。这一派生还有链条的更前段:形容词本身又可以由名词派生出来,从而形成“名→形→副”的派生构词链。如history>historical>historically,tradition>traditional>traditionally,marriage>marital>maritally,language>linguistic>linguistically②。这一派生链强化了英语副词功能域的扩展。下面就分析一项与这一派生链有关的功能扩张。

副词的基本功能是充当动词/谓词的加接成分(adjunct)或算子(operator,如焦点算子only)。但是,在具有“名→形→副”能产派生链的语言中,显赫的副词状语还能像介词短语一样具有引介题元、包括某些间接论元的作用,就是让本属名词的题元通过两次派生以副词的形式出现于句法结构。如以下几例的副词都包含了一个名词间接论元,等号后是换用介词引介论元的句式,括号中是名词到副词的派生过程:

例(10-11)也显示用派生副词引介间接论元,特别适合用于定语位置的谓语(以分词形式出现),因为这是内嵌的句法位置,排斥过“重”的成分,用一个副词引进论元,比用一个介宾短语更加简洁。非论元的加接性题元,以副词引进更加常见,如:

(12)Traditionally(≈According to tradition)the wife lives with her husband's family.“传统上妻子跟丈夫的家人一起居住。”

(13)The conclusion is correct theoretically(≈in theory).“这一结论理论上是正确的。”

正是凭借几乎无限能产的副词派生构词法在英语中的显赫性,英语副词能发挥其他一些语言的副词所难以发挥的作用。汉语就很难将论元以能产的方式放在副词中表达。

3.词类库藏类型学:量词个案

2.2节谈到副词构词法显赫性的语法后果。本节讨论词类本身的显赫性。不同语言之间在词类方面有同有异。词类语种个性的一大表现是词类库藏的差异。有些语言拥有其他语言所没有的词类,有些语言的某个词类比其他语言中的同一词类显赫得多,可以在语言中扮演超出其原型功能的活跃角色,构成显著的类型特点。我们以量词为例加以分析。

世界上很多语言的数词可以直接限制名词,没有汉语那样的个体量词。至于单位量词,常可根据其形态句法表现而归入名词。汉语和一批亚洲语言具有个体量词,这些语言的单位量词和个体量词具有基本相同的语法特点,共同构成“量词”这个大类,在西方文献中被称为分类词(classifier)。在量词语言和非量词语言之间,是有无量词的词类库藏区别。在量词语言之间,是量词库藏是否显赫的问题,其中汉语普通话大致处于量词语言的中间态。

有些语言的量词远不如汉语普通话显赫,如多数藏缅语,尤其是藏语和喜马拉雅语群等偏西的语言,量词很不显赫。马学良(2003:134)在论述古藏语(体现为13世纪之前的藏文文献)时明确断言其“没有量词”,并举出名词和数词直接组合的例子。在论述现代藏语诸方言与古藏语相比的特点时,也没有提到量词的出现。不过,据王志敬(1994:111),现代拉萨藏语是有量词的,包括个体量词和单位量词等,只是“藏语量词为数有限”。而且从王志敬(1994:295-6)语料看,数词无须借助量词就可以限制其前的名词,量词不是名-数之间的必要成分。羌语支普遍有量词。“除嘉戎语外,其他语言量词都比较丰富”(马学良2003:244),不过,“有些语言在一些情况下数词可以不带量词直接修饰名词”,如道孚语、蓝坪普米语、嘉戎语等(同上247)。总体上,藏缅语的量词不如普通话显赫,不但因为汉语量词词库丰富,更因为数、名之间的量词在句法上是强制性的,这是量词是否显赫的关键句法指标,也是影响量词在实际话语中出现频率的关键因素。

另一方面,很多语言及方言的量词比普通话量词更加显赫,如壮侗语言和粤语等汉语南方方言。先看壮侗语。量词在数名组合中是句法所强制出现的。量词也是指示词和数词组合时句法所强制要求的成分(而普通话允许指示词和名词直接组合,如“这书、那房间、这苹果、那鱼”等)。此外,量词还有如下多种功能,以壮语为例,大体代表了壮侗语的共性:

首先,量词可以脱离数词和指示词单用,在特定的句式中表示数量为“一”的个体(不定量词则表示不定复数)或周遍性的“每一”等,如(张元生、覃晓航1993:53):

些 鸭子 这 个 只 “这些鸭子,每人一只”

例中的量词各自代表一个完整的名词语,具有名词代替语(Pro-forms)即代名词的性质,语义上以其类别义和语境的结合分别指“每个人”和“一只鸭”。

其次,量词可以脱离数词和指示词单独接受后面定语的修饰,充当被修饰代名词,有名词化(转指)功能。这种功能在有些语言中是由被修饰代词或名词化后缀如英语的one和汉语的“者”等充当的,但one的解读完全取决于语境,而壮语量词则提供了名词的类别信息,如以下三例的量词分别代表人类、动物和植物(张元生、覃晓航1993:57):

个 年轻 “年轻人” 只 肥 “肥的(动物)” 棵 黄“黄的(植物)”

这样的语序,也符合壮侗语定语基本后置的类型特点。这类量词用法,张元生、覃晓航(1993:57)就称为名词化。此外,书中还举了量词加在动词和其他短语前使之名词化的例子(此处拼法按张、覃书,其音节末的z,j,x,q,h代表调类):

(18)cat(heuj)>fagcat (19)da fangz>bouxdafangz

刷(牙) 量词.刷“刷子” 眼瞎 量词.眼.瞎“盲人”

例(19)中的boux就是例(15)中的表人量词。由以上例子也可以看出,在“量词+指示词/疑问代词”的组合中,甚至在“量词+名词”的组合中,量词都是被修饰限制的核心,表示类别,后面的成分限制量词,如下面四个“量+X”在结构上高度一致,都是以前面量词为核心的受后面名词修饰的结构:

只 这 只 哪 只 这只 猪“这只是什么?——这只是猪”(材料引自韦庆稳1982)

按汉语语感,“(一)只猪”中的“猪”像是核心,但在壮语里,与其他带量词的结构比,(只+猪)中显然在后的“猪”是定语,短语字面义近于“猪的一只”。在例(20)的表语位置,“量+名”表示类指,换用其他语言,译为“猪”即可。从这类类指名词的变化形式也可以看出前面的量词是核心。比较:

棵 枫 树 枫(材料引自韦庆稳1982)

在两种指枫树的组合中,量词占据的正是(树)的核心名词位置,都表示植物类别。

第三,用于类指的被修饰量词进一步虚化为表类指的前缀,念轻声,如:

羊 干净 过于 猪 “羊比猪干净”(材料引自梁敏、张均如1996:887)

例(22)中的表示羊和猪的名词前的实际上就来自例(16,20)中作为被修饰代词的指动物的量词就是例(20)中的(只+猪)的读音弱化。由于量词在类指名词中的语义作用淡化,所以读音弱化,核心名词被重新分析为类指前缀,保留轻微的类别义和类指义。这一虚化可能是因为量词的高频使用导致的。壮语及其他壮侗语中还有很多类指前缀是由与该名词相配的量词虚化来的(游汝杰1982)。

第四,“量+名”除了作为类指名词语,还常作为有定名词语。如游汝杰(1982)所举的武鸣壮语之例:

位 县官 叫 他去 晚 这“那位县官叫他今晚去。”

于 是 个 缸 也 坏 “于是那个缸也坏了。”

我们认为这类在前的量词在句法上可能也是名词短语的核心,当短语整体为有定义时,量词则被重新分析为类似定冠词的成分。

以上4项,量词除了表示类别外,还分别具有独立代名词、被修饰代名词及名词化标记、类指前缀和定冠词的语法功能,这在没有个体分类量词或量词不显赫的语言中是需要用其他手段表示的。这4项还不足以全面反映壮侗语量词的功能,但与普通话相比,已足以显示其在语法系统中的显赫地位,因为这些功能都是官话系绝大部分方言的量词所没有的。

在粤语、吴语及部分湘语、徽语方言中量词功能比较多样,词类地位显赫,所以刘丹青(2002)将粤语等方言称为量词强势的方言,而普通话等官话方言是指示词强势的方言。以粤语为例(刘丹青2000,2002,2008b),其量词的显赫地位至少表现在以下普通话量词所不具备的方面:(1)指示词和名词之间的量词像数-名之间的量词一样也是强制性的。(2)量词可以不依赖数词、指示词单独作宾语、动量补语等句法成分。(3)量词可以脱离数词、指示词单独限制主语或宾语名词,其中在主语位置时表示有定。(4)可以作为被修饰代词受领属名词、形容词、关系从句等修饰,有的起着无核关系从句或名词化的标记作用。(5)可以在上述定语和名词之间代替结构助词“既”充当定语标记。(6)在实指名词语中,量词不能省略。(7)当名词语为复数时,由不定量词“啲”起上述作用。“啲+名词”结构不但常表有定,也常用于类指。苏州话等吴语与粤语情况接近,只是“量+名”的使用频率稍不如粤语,但吴语量词表定指时还可以单独充当主语、状语,单独做定语标记也比粤语常见(此时粤语常用数量词组),这是比粤语量词更显赫的地方(石汝杰、刘丹青1985)。

粤语及吴语的以上几点,有些与壮侗语量词的功能相同或接近。但是两者的语序类型不同,南方汉语方言属定语前置型,“量+名”都是量词限制名词,而壮侗语是定语后置型,因此“量+名”应分析为量词受名词修饰。当核心名词同时受其他定语修饰时,粤语吴语量词和其他定语都在名词之前,量词在其他定语和名词之间便于兼做定语标记;而壮侗语量词和其他定语一般分别在名词之前和之后,量词并不居中,难起定语标记的作用。

前面提到,英语常用复数形态表类指,而粤语则除了用光杆名词之外也可以用复数无定量词“啲”(核心意义同普通话“些”)表示类指,这里略举数例:

(25)啲女人都中意买衫。“女人都喜欢买衣服。”

(26)啲的猫係人类嘅朋友。我好中意啲猫。“猫是人类的朋友。我很喜欢猫。”

(27)啲唐楼都係旧楼,人哋唔中意住啲唐楼。“旧式无电梯楼房都是旧楼,大家不爱住。”

此外,英语可以用定冠词表示类指,如The panda eats bamboo。而粤语量词也有定指用法。复数、定指双重因素更便于“啲”发展出类指功能。这里的共性在于都用显赫的复数和定指形式表示类指。区别在于英语显赫的是复数形态和定冠词,粤语显赫的是兼有定指作用的复数量词。普通话量词既不能定指,显赫度也不如粤语,因此难以发展出类指用法。

量词和复数的关系,还引出另一个与显赫性有关的类型学问题。不少学者都提到类型学上以形态表现的个体量词(numeral classifiers)和数形态存在着互补相斥现象,即有个体量词总是缺乏数形态,或数形态是非强制性的并限于少数名词。对此,Aikhenvald(2000:249)指出这一预测不乏例外,如Yuki、Nootka、Tlingit及达罗毗荼语系众多语言都是既有量词也有强制性数形态的。验诸汉语周边,例外也不难发现。根据马学良(2003:234,244),“羌语支各语言都有数范畴”,是用后缀表达的形态手段,“除史兴语外,大部分语言表数的后缀,既可以加在表示有生命事物同的名词后面,也可加在表示无生命事物的名词后面。更重要的是,羌语支绝大多数语言的数范畴还通过一致关系延伸到动词、形容词上。充当谓语的动词、形容词要在人称和数上与主语(有的还包括宾语)保持一致,使用手段是词缀(包括前缀和后缀)”。这是典型的数形态语言。与此同时,羌语种语言又都拥有个体量词,“除嘉戎语外,其他语言量词都比较丰富”。可见,典型的数范畴和典型的个体量词这两种语言库藏并不存在简单的相斥关系。我们认为,与数范畴相斥的,未必是量词的存在,而可能是量词的显赫性。量词显赫度高的语言方言,确实对数形态排斥。例如壮侗语没有数形态,更没有数一致关系。粤语的人称代词虽然可以通过后加“哋”构成复数代词“我哋、你哋、佢哋”,但是粤语名词不能加“哋”:*学生哋、*教师哋、*人客哋。这种互补关系在类指表达上得到集中表现。数形态语言使用复数形态表类指,而量词显赫的语言中用量词表类指。普通话因为量词还不够显赫,所以不能单用“量+名”表示类指。因此,我们将原来的蕴涵关系进行如下改写,以更准确地反映量词和数形态的跨语言表现:

(28)学界原来认定的蕴涵关系:量词(+)数(-)

(29)新的蕴涵关系:量词(++)数(-)(:蕴涵;+:存在;++:显赫;-:不存在)

上面这个例子说明,语言共性和类型预测以往主要依据某现象的有无,这是不够的,因为还可能取决于现象的显赫与否。这是库藏类型学的价值所在。当然,库藏类型学要尽量为不同范畴提供显赫度的合理测试标准。

4.句法结构库藏类型学:并列/连动结构个案

句法结构是比较普遍的语言现象,比如一般语言都有主谓、动宾、定中、状中、并列等结构。但是,在不同语言中,句法结构仍然存在显赫度的差异。

古代汉语和英语都被认为是并列结构发达的语言(梅广2003),而现代汉语普通话虽然有并列结构,但它的并列结构是不发达的。刘丹青(2008a)显示,汉语普通话表现出并列结构受限的诸多现象:虚化的词语并列结构受限;动词的并列严重受限,既有直接并列的严重受限,又根本不存在能广泛应用于动词并列的连词;并列结构还受到词长、句法位置等方面的限制。种种限制使普通话成为一种并列结构很不显赫的结构。但是,普通话的情况完全不代表古代汉语的情况。梅广(2003)从并列连词“而”的多样性功能中发现了古代汉语并列结构的显赫性,指出“历史上汉语句法结构的整个发展趋势就是从并列到主从,上古汉语是一种以并列为结构主体的语言;中古以降,汉语变成一种以主从为结构主体的语言”。我们则发现,普通话并列结构的不发达,不一定代表所有现代方言的情况。

“而”的基本作用是用作动词和形容词性成分乃至分句的并列连词。这一连接谓词的连词用法,本身在普通话口语中就没有对应手段可用(刘丹青2008a)。实际上其语义作用,还远远超出并列的范围,与同属并列型语言的英语and的多能性相类。梅广(2003)所举的非并列的用法包括了以下几种情况(引用时术语有所调整):

用在偏正两个成分之间:古者十一税|则天下之民皆引领望之矣|尽心里为之|遵海南|旦旦伐之

用在话题结构中,表条件:管仲知礼,孰不知礼|施诸己不愿,亦勿施诸人

用在宾语(或补语)提升结构中作轻声垫字:何事不达?何为不成?|诸侯之门仁义存焉

梅广(2003)据此认为上古汉语是并列型语言,与并列连词and用途广泛的英语一样;而中古以后的汉语是主从型语言,因为“而”、and的很多功能都由主从(偏正)类标记所表示。上古汉语正是并列范畴因为显赫而显著扩张其使用领域的好例。

此外,如刘丹青(2003:126)所引,即使偏的部分是介词短语,即标明了从属语属性的成分,在先秦西汉文献中也不乏再加“而”的例子,如:

以上这些“而”在后代的汉语(尤其是口语)中没有相应的连词可用,只有书面语有时部分地沿用了文言“而”的功能。这更加凸显了并列连接手段在上古汉语中的显赫性。

“而”和and的泛化用法,不仅扩张到其他语言须用偏正结构表达的内容(并列型对主从型),也扩张到某些语言用连动句表达的内容(并列型/非连动型对连动型)。那些介于典型的并列和主从之间的内容,或以发生时间为序,或可归入主次关系(cosubordination)。这两类关系在现代汉语和许多南岛语、壮侗语和非洲尼日尔-刚果语系中都倾向于由动词语直接组合构成连动结构,它们都是连动型语言。例如非洲Anyi-Sanvi语(Aikhenvald 2006,序号重编):

狗 抓(惯常体)鸡 吃 “狗(常)抓鸡吃”

这一连动句的两个动词语句法地位相当,主从标记和并列标记都没出现。译成汉语,也适合用连动句来表示,而英语作为非连动型语言在翻译时必须用并列连词and或从属语(不定式状语)标记to,如:

回到古代汉语。与现代汉语普通话或其他连动型语言中此类连动句子相应的内容,古汉语也常需要用并列连词“而”连接,如例(36)大概会说成“犬捕鸡而食之”而不是“犬捕鸡食”。所以古汉语也是一种非连动型语言。下面转引蒲立本(2006:49-51),附转引者今译:

(37)犹缘木求鱼也……缘木求鱼,虽不得鱼,无后灾。(《孟子1A/7》:好比攀着树[ ]抓鱼……)

(38)弃甲曳兵走。(《孟子1A/3》:丢了铠甲拖着武器[ ]逃跑)

(39)此率兽食人也。(《孟子1A/4》:这是带着野兽[ ]吃人)

这些例子在古汉语中以用“而”为常,不宜使用连动句,例(37)只在第二次出现时才省略“而”。它们所对应的现代汉语,没有与“而”对应的虚词可用(见空“[ ]”处),用直接组合的连动句是最自然的翻译。

王力(1989:255-6)曾说古汉语很早就有连动式。但是,从该书所举的37例先秦连动式看,“再拜稽首而问曰”其实不是连动结构(“再拜稽首”为并列结构,其后则有“而”连接),其余36例全都是“来、往”二字与其他动词的连用。由此至少可以看出,此时连动式远不是广泛使用的句式,而主要限于个别动词所在的句子。我们赞同张敏、李予湘(2009)的判断,先秦汉语不是连动型语言或至少不是典型的连动型语言。

古汉语的并列型、非连动型特征被后起的主从型和连动型所取代,现代汉语各大方言的情况大抵是取代之后的状况。然而,我们发现仍有方言部分地存在并列型的特征,不过所用虚词不是“而”字。老派上海方言与它的后置连词“咾”就反映了这种类型特点。

老派上海话、尤其是20世纪上叶的上海话,有两套并列连词(刘丹青2003:200,其他北部吴语类似),一套是跟普通话“和”等同义同用的前置连词,包括20世纪以来先后盛行的“搭、脱、交、帮”等。另一个是后置连词“咾”(新上海话趋向少用),来自近代汉语两个动词间的“了”(钱乃荣2003)。“咾”作为并列连词常用在两个名词语之间,如“老张咾老王”。“搭”的前置性和“咾”的后置性表现在停顿出现时的位置,如:

(40)a.老张,搭老王~*老张搭,老王

b.老张咾,老王~*老张,咾老王

更重要的是,“咾”的作用远多于“搭”类和普通话“和”类连词:第一,在语类方面,“咾”是全能连词,可以自由地连接名动形各类成分及小句。如例(41-43)分别用来连接动词、形容词和分句(均取自香港城市大学上海话语料库中的部分20世纪早期的宗教文献和上海话教材):

(41)皇帝就……指定皇后闹话。“皇帝就指着皇后又发怒又责骂。”

(42)伊拉常庄拣身体长大个,一则因为长大个保镖力气来得大。“他们常挑选身体又高又大的,一则因为又高又大的保镖力气较大。”

(43)王家向来是做生意人家张家末历代做官人家。“王家向来是做生意人家,张家则是历代做官人家。”

第二,在关系方面,“咾”的作用远远不止于并列。如例(44-46)中“咾”像“而”一样在状语和主要动词之间起连接作用,这在其他方言的并列连词中是不多见的:

第三,在现代汉语中一般实现为连动句的内容,在老派上海话中常常不采用连动的形式,而要用“咾”来关联,如(译句的空方括[ ]显示普通话相应位置不用连接词):

(47)伊是靠鬼王赶脱鬼个。“他是靠鬼王[ ]赶走鬼的。”

(48)今朝既然巧极大家侪到拉此地,格末多坐一歇歇谈谈。“今天既然巧极了大家都到了这里,那就多坐一会儿[ ]聊聊。”

这些情况显示在老派上海话中连动式不如普通话发达,它和古汉语一起跟普通话构成并列型和连动型的对立。

第四,“咾”还可以表达某些普通话宜加停顿,但没有合适连词可用的复句关系(译句中加了括号和逗号),如:

(49)我连忙开枪末,已经来勿及哉勿曾打着。“我连忙开枪,已经来不及了[,]没有打着”

(50)不过倘使剃和尚头末,光秃秃忒啥难看哉。“不过假如剃了光头,光秃秃的[,]太难看了”

“而”、老上海话“咾”和英语and都显示,作为普遍性范畴的并列结构可以在某些语言中成为显赫库藏,因而能够大大扩展其用途,而在另一些语言中成为受限范畴,必须依靠其他手段帮助来完成全面的并列表达(连动、停顿、对称格式等等)。

5.从语义语用角度看库藏类型学

库藏类型学有两种观察角度:一是从库藏形式出发观察语义、语用范畴在不同语言中的语法实现状况及显赫度;二是从语义、语用角度出发来观察库藏类型,即考察哪些语义语用内容能在大量语言中进入语法库藏,甚至成为显赫库藏,哪些语义语用内容没有机会或只在极少语言中得以“入库”,而需要靠库藏中其他语义语用内容的表达手段来兼顾。据此,我们既可以探讨不同语义语用内容对人类语言的不同重要性,又可以探讨语义语用范畴“入库”或显赫的类型后果。

前文提到,复数形态或量词语言中的复数量词常被用来表达类指。这个问题换一个角度便是:哪些指称义有机会入库?哪些指称义经常不被明示或借用其他手段来表示?根据类型学研究的成果及我们的观察,下列指称库藏现象值得注意。

有定和无定的表达手段最常成为语言库藏。冠词是表达有定无定的最显著的专用手段。很多语言的库藏中具备冠词(或比冠词独立性更弱的指称词缀),而冠词的基本功能是做有定和无定标记。定冠词多来自指示词,不定冠词多来自指“一”的数词(Himmelmann 2001)。两者之中,又是有定最容易进入语法库藏。请看德国Konstanz大学共性档案库(The Universals Archive,Plank 2009)第1163条:

(51)如果一种语言有语法化的不定冠词,那么它很可能也有定冠词,反之则不必然。

这表明单有定冠词语言多于单有不定冠词的语言。在两种冠词齐备的语言中,也是定冠词更加显赫。例如在英语中,定冠词在单数名词语和复数名词语上都要用,而不定冠词只用在单数名词语上,复数无定名词语不带指称标记。

冠词作为有定无定标记的强势还表现在语言接触中的强势,见上引共性库第557条:

(52)当有冠词和没有冠词的语言接触时,更常见的情况是非冠词语言接受冠词语言的冠词,而不是冠词语言丢弃冠词。

这一共性说明有定无定是很容易以冠词的身份进入人类语言库藏的语义范畴。

与此形成对比的是,类指(generic或kind-denoting,又称通指)虽然是语义学中的重要内容,却很难正式进入语法库藏。至今未见报道有语言将冠词这类指称专用的语法手段用于类指。Himmelmann(2001)是概述冠词的类型学成果之文,没有提到任何语言有以类指为原型义的冠词。再如Rijkhoff(2002)考察了以50种语言为语种样本库的名词短语类型并引用了库外的很多语言,该书有9处提到类指义,有几十处提到冠词,但是没有一处提到有专表类指的冠词。这些事实足以说明类指义难以像有定无定一样进入语言库藏。

类指并非从来得不到语法形式的表征。人类语言确实有一些表类指的手段。重要的是,可表类指的手段都不以类指为其原型语义,而要借用其他语法手段兼表类指。例如,英语中可表类指的库藏有:定冠词(The panda eats bamboo,熊猫吃竹子)、不定冠词(A horse is a mammal,马是哺乳动物)、不带冠词的复数形式(见第1节例5)。现代汉语及北京话中可表类指的库藏有:光杆名词(女人就爱买衣服)、定冠词化的轻读指示词“这”(这女人就爱买衣服)、无定冠词化的数量短语“一个”等(一个人要讲良心);此外还有粤方言中似定冠词的不定复数量词“啲”(啲女人都中意买衫)③,吴语中似定冠词的泛用个体量词“个”(个女人就欢喜买衣裳)(方梅2002;刘丹青2002)。以上这些手段的名称已经表明了它们各自的核心语义和功能,特别是有定、无定和复数。不是专表有定无定的非复数形式也是先获得了有定无定的类冠词作用再兼表类指,如普通话的“这”、吴语的量词“个”、壮侗语的弱化量词等。这恰恰说明有定无定这些指称语义比类指显赫,能更优先入库。

库藏类型学除了关注语义语用内容是否容易入库之外,还要进一步关注入库的范畴有多显赫。

有定、无定在很多语言中入库成为冠词的原型语义。没有典型冠词的语言,也会有一些手段以表有定与否为基本功能之一。主要用来直指(deixis)的指示词同时也必然表示有定,可以视为以有定为基本语义之一的词类。当指示词在使用中主要用于回指而非直指并依附于名词(不独立使用)时,它们就会朝定冠词的方向发展,从而成为定冠词的最常见来源。而指示词是比冠词更加普遍的词类。这也强化了有定语义的显赫性。数量词语天然带有无定的属性。当其中的“一”不用来强调数量时,其无定的作用就被凸显,进而可能成为无定冠词的来源。不强调数量的“一”是比不定冠词分布更广的现象,这也强化了无定义的显赫性。汉语虽然一般被视为无冠词语言,但实际上正在形成分别来自指示词和数词“一”的定冠词和不定冠词(方梅2002、刘丹青2002及所引文献)。

更进一步来说,有机会入库的表示有定无定义的语法手段,还可能在语言中扩展用途,扮演更活跃的角色,表现得更加显赫。例如,北京话口语中兼表定指、有冠词化倾向的指示词“这”,不但能表示类指,还可以标记话题或将动词的谓词性弱化(方梅2002)。粤语、吴语则由冠词化的量词担此功能(刘丹青2002)。英语定冠词the作为强制性专用有定标记,有很多与定指有关的话语功能——情景作用、语篇作用、示踪作用、认同作用(相关概念参看方梅2002),也有一些有定以外的扩展功能,如the可以用于类指(参看第1节),还有将形容词名词化兼类指的作用,如the rich and the poor(富人和穷人),the disabled(残障人士)。

除了有定无定和类指之外,指称义中还有实指和非实指的区别。尼日尔-刚果语系和南岛语言等较常用冠词来标记实指(Himmelmann 2001,Rijkhoff 2002:95)。也有学者认为粤语量词的指称功能主要是实指而不是有定(Matthews and Pacioni 1997),但量词只是兼表实指,在有定和无定非实指名词语中也可以出现量词。总体上标记实指的手段远不如标记有定无定的手段常见。

据此,按照跨语言的入库能力和显赫度,我们可以将基本指称义排出一个等级序列:

(53)有定>无定>实指>类指

这个序列并不是完整的。其实与实指相对的是非实指,与类指相对的是个体指(individual),此外还有一些指称义类别。但这些指称义通常在指称的标记系统中不占独立地位,要分解或归并为其他指称义,如非实指可能是类指或非指称(non-referential),个体指可能是有定或无定,实指或非实指。这些非独立指称义在排列库藏类型时可以略去。

按这样的思路,很多相关的语义语用内容都可以经过跨语言考察得出上面那样的等级序列。例如,在格标记系统的跨语言考察中,可以列出不同题元的入库度和显赫度。在复句中,可以列出不同逻辑关系的入库度和显赫度。在信息结构中,也可以列出不同地位的信息——已知信息、新信息,话题、焦点、偶现信息等——的入库度和显赫度等等。

总结出等级序列仍然是研究的一个阶段性成果,它概括了人类语言中存在的重要现象。库藏类型学下一步还应当对相关现象做出科学合理的解释。

6.小结:语言库藏类型学作为语言类型学的一个分支

语言库藏类型学是语言类型学的一个分支,它在跨语言学考察的基础上,总结人类语言在语言库藏方面的共性和类型差异。

人类语言需要表达的语义是无限的,能进入语言库藏的语义语用范畴只占其中很小一部分。库藏类型学关注哪些范畴在人类语言中普遍性地进入库藏,哪些范畴只在少数或个别语言中进入库藏,哪些范畴从来不进入库藏,而要借助标示其他范畴的手段来表达。

对于只进入少数语言的库藏的范畴,库藏类型学要研究这些范畴与所在语言其他类型特征可能存在的蕴涵或和谐关系。

库藏类型学还要研究各种范畴所用库藏手段的显赫度,因为显赫的库藏手段在语言中可以扩展用途、以此范畴表彼范畴,凭借显赫的库藏铸就显赫的范畴。库藏类型学特别关注同样的范畴在语种间的显赫性差异,因为显赫度可能产生重要的类型后果,使同样的语义语用内容在不同语言中以范畴归属非常不同的手段来表示,导致形-义更为复杂的关系。

库藏类型学根据相关范畴的跨语言入库能力和显赫度可以将不同的语义语用内容排出等级序列。库藏类型学在总结特征间的蕴涵关系时,不仅关注类型学传统所重视的特征的存在与否,还要关注范畴的显赫度。

库藏类型学所探求的跨语言蕴涵关系和等级序列,语言共性和类型差异,都符合类型学的目标、路径和方法。另一方面,它也从库藏分布和显赫度的角度拓展了类型学的研究领域和视野,改进了类型学的研究方式,从而有条件成为语言类型学一个前景广阔的新分支。

初稿曾在香港城市大学学术讲座(2010年2月)、“中国语言研究的新方法与新视野——中国语言的比较与类型学研究国际研讨会”(香港科技大学2010年5月)、全国语言学暑期高级讲习班(南开大学,2010年7月)、法国社会科学院东亚语言所SinoTyp课题组(2011年2月)等处报告,同行讨论使笔者受益良多,另获审稿专家指正,一并感谢。尚存错谬均归笔者。

注释:

①“战略层面”一语及其含义借自陆丙甫及其合作者的一些论文,如陆丙甫、郭中(2005)。

②名词本身也可以由动词派生而来,派生链可以更长,如:educate>education>educational>educationally。其中动词到名词这一节与这里的讨论关系不大。

③粤语更常用光杆名词表示类指,如“女人都中意买衫”。两种表达似稍有差别。加“啲”的,倾向于指说话人所在群体之外的类别,如“啲女人都中意买衫”通常由男人或不爱买衣服的女人所说。光杆名词语没有这样的限制。香港科技大学姚玉敏博士同意这一分析。有学者认为“啲+NP”本身是表有定的,类指是靠全量词“都”赋予的。我们承认全量算子有利于强化类指解读,但不是表类指必需的,语料中存在不用“都”也表类指的实例,如“啲老板级真係开心,唔使做!”(老板级的人真开心,不需要干活)。另外,普通话即使加“都”也不能让有定复数表类指,如“那些女人都喜欢买衣服”。

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

语言数据库中的类型学概念_复数论文
下载Doc文档

猜你喜欢