“汉语方言声调数据库”的设计与理论基础_方言论文

“汉语方言声调资料库”的设计及其理论基础,本文主要内容关键词为:汉语论文,声调论文,方言论文,理论基础论文,资料库论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

壹 导言

《方言》杂志创刊二十年来,发表了近千种方言描写的第一手材料。这些材料是研究普通语言学理论的宝贵素材。理论语言学不仅注重考察语言的共性与个性,而且注重解释两者之间的关系。这就离不开各种语言或方言之间的比较。资讯科技的发展为进行大规模语言或方言材料的比较研究提供了方便。如建立电脑资料库,将大量的方言材料分门别类地输入电脑,然后进行分析、概括,并在此基础上建立或修正语言学理论。基于这样的考虑,我们设计了“汉语方言声调资料库”(以下简称“声调库”),计划将《方言》杂志创刊以来发表的方言材料及其他学术刊物上发表的方言材料收入其中。声调库建成之后,将会放在国际网络上供全世界对汉语方言和语言学理论有兴趣的人士使用。这样,《方言》作者和编者们辛勤耕耘二十年的硕果将会得到更加充分的利用,汉语方言研究将会促进语言学理论研究的繁荣与发展。理论的研究反过来又可以促进汉语方言的研究,使汉语方言研究更加繁荣昌盛。本文从总体目标和考察范围两方面论述“汉语方言声调资料库”的设计及其理论基础。

贰 总体目标

“汉语方言声调资料库”的建立旨在考察声调的普遍行为,检验前人所概括的有关声调的普遍规律(tone universals), 在深入认识声调行为的一般性(unmarked)与特殊性(marked)的基础上,验证或修正声调学理论。半个世纪以来,探索人类语言的普遍规律、解释语言现象的共性与个性是各种语言学派所追求的共同目标。1967至1976十年间,Greenberg 和Ferguson 领导了斯丹福大学题为“语言普遍规律 ( Language Universals)”的研究项目。这一项目先后聚集了四十多名研究人员,分析、整理了当时所能收集到的各种语言材料,分别从音系、形态、句法等方面概括了一系列普遍规律。音系方面如:如果一种语言有鼻化元音,那么,鼻化元音的出现频率总是低於非鼻化元音的出现频率。形态方面如:如果一个语言里主语或宾语必须在性别上与动词保持一致,那么,这个语言里的形容词也必须与名词的性别保持一致。与此同时,以Chomsky 为首的生成语言学派注重从人脑机制的角度探索语言的普遍规律。Chomsky根据儿童习得语言的容易性, 假定人的大脑里有一种语言机制。这一语言机制里储存着人类语言的共同特点,即普遍语法(Universal Grammar)。 语言学理论的任务就是要探求这一普遍语法到底包含了哪些具体内容。尽管不同学派对语言性质的假设不同,但大家所关注的问题是共同的:什么样的语言是人类可能有的?什么样的语言是人类不可能有的?语言作为人类区别於其他动物的特征,是否有一些共性?如果有,哪些特点是人类语言共有的?哪些特点是个别语言特有的?不同语言间的差异是否受到一定的制约?如果是,哪些因素制约着语言间的差异?

随着对语言现象考察的深入,对语言特点认识的加深,特别是近三十年来跨语言研究对材料积累范围的拓展,为检验和挑战旧有规律、建立新规律提供了条件。汉语是一种声调语言,汉语方言的声调现象极为复杂。当年斯丹福大学“语言普遍规律”研究项目进行的时候,有关汉语方言声调的材料极为有限。今天,经过《方言》作者和编者们二十年的努力,我们积累了大量有关汉语方言声调的第一手材料。因此,有必要对前人建立的声调普遍规律进行检验。三十多年来,有关声调的论文层出不穷,声调学理论不断发展。这些理论需要通过大规模汉语方言材料来检验。“汉语方言声调资料库”的设计和建立希望在前人研究的基础上对声调的普遍规律做进一步考察。

声调的普遍规律表现在哪些方面呢?对这一问题的认识直接影响到声调库的设计及其检索功能。Maddieson 曾经在斯丹福“语言普遍规律”研究项目中负责考察声调。他将声调的普遍规律概括为三方面:(一)声调系统;(二)变调过程;(三)声调与非声调的关系。后来学者们考察声调的普遍规律也都围绕着这三个方面。下面逐项讨论前人建立的声调普遍规律以及这些规律所面临的汉语方言材料的挑战。

(一)声调系统。每种声调语言都有它独特的声调系统。但将各种不同语言的声调系统加以比较,就会发现人类语言的声调系统具有某些带普遍性的规律。第一条规律是音高对声调系统的限制。Maddieson (1978)提出,语言的声调系统最多只能区别五度平调。这一观点与赵元任(1930)将声调的音高分为五级的做法不谋而合。有些方言的声调系统多於五个平调,如广西容县话(周1987)和广西横县平话(闭1994)分别都有七个平调。这些方言似乎对Maddieson 总结的上述规律提出了反例。可是,仔细分析这两种方言的声调系统,我们发现,所谓七个平调实际上包括了入声。入声与舒声的分别有时主要表现为有无塞音韵尾的对立,在声调的调值上可能并无差别。广西容县话和横县平话恰好属于这一类的方言,因此七个平调的声调系统实际上没有超过五级平调。Maddieson总结的这条规律目前还没有遇到真正的反例。

第二条规律是不同声调系统之间的蕴涵关系。Maddieson(1978 )在比较不同语言声调系统的基础上提出,有简单的降调或升调的语言就一定有平调,反之则不然;有降升调或升降调的语言就一定有简单的降调或升调,反之则不然。郑锦全和蒋平在考察汉语方言声调系统的基础上分别提出:有“升-降”调的语言就一定有简单的升调,反之则不然(Cheng 1973);有低平调的语言就一定有高平调, 反之则不然(Jiang-King 1998a)。可是,从《方言》发表的材料来看, 这几条蕴涵关系都有反例。首先,有简单降调或升调的方言不一定有平调,如山西平遥(侯 1980)、江西宁岗(颜 1986)、江苏徐州(李 1980)、 湖南益阳(曾 1995)、河南泌阳(李 1996)、陕北延川(张 1992 )等方言都有降调和升调,但没有平调。光有降调而没有平调的声调系统有大连(贺 1986)、牟平(罗 1995)等方言。其次,有“升-降”调的语言不一定有简单的升调,如山西阳曲(孟 1991)和牟平(罗 1995)方言。第三,有低平调的语言不一定有高平调,如陕西孝义(郭 1989)和安徽太平仙源(张 1991)方言。

第三条规律是声调跨语言分布的不对称性。蒋平(1999b )考察了不同声调在汉语诸方言声调系统中的分布,发现各声调的出现频率是不对称的。首先是高平调的出现频率高於中平调,中平调的出现频率又高於低平调。其次是半降调和半升调的出现频率高於全降调和全升调。再次是降-升调的出现频率高於升-降调。这些声调分布的不对称性是否具有普遍性还有待於通过大规模方言比较研究来证实。

(二)变调过程。变调过程指声调在语境中的变化。不同语言中声调的变化同样有一定的规律。首先是变调的性质。声调在语境中的变化通常被看作是受临近声调的影响而产生的。大多数学者如Bao(1990 ),Chen(1996)都将变调看作同化过程或异化过程。这一观点值得重新检讨。余蔼芹(Yue-Hashimoto 1987)考察了83 种汉语方言的变调现象。她的结论是,同化和异化只能解释极少数变调现象。大多数汉语方言声调的变化过程只是反映了某种调型的趋势。变化后的调型与它邻近的声调没有关系,因而都不能用同化或异化来解释。Yue-Hashimoto的这一观点值得重视,应该通过大规模的方言考察来检验。

第二是变调的方向。Hyman & Schuh(1974)对非洲语言声调变化的考察显示,顺向同化比逆向同化出现的频繁高,因此认为声调的逆向同化现象“不自然”。可是,Maddieson(1978)认为, 在大多数汉语方言里(除吴语之外),声调的逆向同化现象占主导地位。到底汉语方言的变调现象是否如Maddieson所说的那样逆向同化占主导地位, 非洲语言与汉语方言是否确实存在变调方向上的差异性,还有待於进一步的考察。

第三是变调的结果。不同声调在变调过程中的行为并不相同。有些声调比较容易被同化,而有些声调则拒绝被同化。Pike(1948), Mak(1953),Cheng(1968), Hyman & Schuh(1974)等学者分别考察了不同语言中的变调现象。他们发现,在声调的同化过程中,其他声调被同化成高平调情况多於高平调被同化为其他声调的情况。可见,高平调在变调过程中具有稳固性。在汉语方言中是否大量存在类似现象还需深入考察。

(三)声调与非声调的关系。声调与非声调的关系表现在三个方面。第一是声调与音段,即声调与辅音或与元音的关系。声调与辅音的相互作用是双向的。辅音的清浊影响声调的分化在汉语方言中是屡见不鲜的。辅音的清浊影响声调发展的现象在非洲语言和亚洲其他语言中都有发现。声调影响辅音的现象多出现在东南亚语言(Maddieson 1976)。声调与元音的对应关系表现在调型与元音的长短上:带低平调和升调的元音比带高平调和降调的元音长(Maddieson 1975)。在泰语诸方言里,元音长短的分化分别受声调高低降升的影响:升调和低调引发长元音,降调和高调引发短元音(Gandour 1978)。

第二是声调与音节。Hyman(1988 )认为音节结构对调型起制约作用,因此,迄今为止,全世界的声调语言中没有发现拐两道弯的调型(如5151调或1515调)。除了音节对调型的制约作用外,长短音节与不同调型之间也有一定的对应关系。端木三(Duanmu 1990 )认为汉语方言中的音节结构分为两大类:以北京话为代表的方言都是双韵素音节,因此,这些方言都有曲折调;而以上海话为代表的方言都是单韵素音节,因此,这些方言没有曲折调。蒋平(Jiang-King 1995,1996)认为福州一带汉语方言中元音鬆紧与声调的对应关系和东南亚语言中的元音长短与声调的对应关系都反映了调型与音节重音之间的对应关系。

第三是声调与重音。声调与重音的交互作用在非洲语言和亚洲语言中都存在。汉语方言中声调与重音的交互作用表现在两个方面。一是重音对声调的影响。重音常常决定多音节词中变调位置,重读音节一般不变调(Kennedy 1953,Wright 1983,Chan 1985,Jiang-King 1996)。在重叠式里, 如果一个重叠语素重读, 它常常吸引高平调(Jiang-King 1998b)。重音对声调的制约作用还反映在借词里。如英语里的重音节在借入广州话时读高平调(Kiu 1977,张1986)。二是声调对重音的影响。郑锦全(Cheng 1973 )、 Meredith (1990 )和王志洁(Wang 1998)的研究都显示,在北京话词汇中, 高调音节常常吸引重音。以上所述声调与非声调的关系是否具有普遍性还有待於在汉语方言材料进行检验。

特别值得提到的是,儿童声调习得同样反映出某种规律。比如在普通话里,高平调和高降调在儿童语言习得的过程中最早出现,升调比平调和降调难于习得(Li & Thompson 1977)。在广州话里, 阴平调(55)和阳平调(21)在儿童语言习得的过程中最早出现,其他声调次之,低升调(13)和次低平调(22)最晚出现(Tse 1978)。在台湾话里,高平调和高降调在儿童语言习得的过程中最早出现(King 1982)。

了解前人概括的声调普遍规律及声调研究的现状是我们设计“汉语方言声调资料库”的基础。在设计的过程中,许多细节反映出我们对以资料库为辅助工具的大规模比较研究的思考。下面以考察范围为线索介绍“汉语方言声调资料库”的考察范围及各范围的检索功能。

叁 考察范围

为了全面考察声调的行为,我们设计了三大范畴作为考察的重点:(一)声调系统;(二)连调;(三)重叠变调。总体设计见图一。图一中,左边的功能键用于输入或更新资料,右边的功能键用于检索资料。下面分别介绍每一范畴里对材料安排、考察项目、检索功能的设计。

图一:考察范围

(一)声调系统。设计这一范畴是为了考察不同声调的跨语言分布。一个资料库是否能有效地发挥作用与设计时如何安排材料密切相关。首先,凡收入声调库的方言点都尽量输入该方言所属的方言大区(如果已确知该方言分区的话)。根据李荣(1989)的分区,汉语方言分为官话、晋语、吴语、徽语、赣语、湘语、闽语、粤语、平话、客家话十个大区。这样做有助于各方言区之间声调特征的比较研究。

第二,所有的方言词条都输入该词条的出处。因为同一种方言可能有好几位学者描写或研究过,而且不同学者对同一种方言声调系统的描写不完全相同。如《方言》杂志分别在1982年第3期、1983年第1期和1984年第1期上发表过三篇关于苏州方言的文章。 这三篇文章对苏州方言的声调系统的描写是有差别的。前两篇认为苏州方言有七个声调,没有阳上,后一篇认为有阳上,共有八个声调。再者,不同学者对同一种方言里同一类声调调值的描写也不一样。以苏州方言为例, 1982 年和1983年的两篇文章认为阴去和阳去的调值分别是12和31,而1984年的文章则认为阴去和阳去的调值分别是513和313。这里的差别相当大。按前者的描写,阴去与阳去应该是低升调和中降调,而按后者的描写则应该是高降升和低降升,是两个复杂的曲折调型。因此,从可靠性出发,我们要确保材料来源准确无误,以便研究者核对原材料。

第三,我们设计了调类、调值和调型三个考察范畴,因为不同方言的声调系统在这三方面的表现并不一样。从《方言》发表的对各方言声调系统的描写来看,不同方言声调系统的差异主要表现在两个方面。一是不同声调系统所含调类的多寡不一。北方方言大多数没有入声,而南方方言大多数都有入声。如广州话有九个调,银川话只有三个调。第二个差异是同一个调类在不同声调系统中有不同的调值和调型。比如,阴平调在北京话里的调值是55,调型是高平,而在天津话里调值是21,调型是低降。需要强调的是调型的考察在声调理论研究中非常重要,声调的一般性与特殊性常常表现为调型分布的不对称性。

第四,每一个词条都输入国际音标和英语意译,以便对理论研究有兴趣而又不懂汉语的学者可以用这些材料,将汉语方言的研究推向国际化。图二显示声调系统的检索功能。

图二:声调系统检索

根据以上的设计,在考察声调系统的一般性与特殊性时,我们可以做多项检索。图二显示声调系统的不同检索功能。

首先,我们可以进行全面检索,即不输入任何参项,只按“查询”键。这样,声调库里所有的资料都会调出来,而且电脑自动给出统计数字。第二,我们也可以作单项考察。如果输入某个方言点的名称,该方言的所有材料都会列出来。如果输入某方言区的名称,该方言区所有的资料都会列出来。这样就方便了不同方言区之间的比较研究。如果我们想考察不同调类或调型在汉语方言中分布的情况,我们可以输入某个调类或调型的名称,该调类或调型的统计数字及资料可以自动调出。第三,我们还可以通过输入两个或多个参项,缩小考察范围。如果我们想考察某个方言区的某个调型或调类,只要输入该方言区的名称及调型,声调库就会自动将有关资料列出,并给出统计数字。比如:有高平调的声调系统在吴语中有多少种方言,有低平调的声调系统在闽语中有多少种方言,等等。而且,声调库检索出来每一条资料都会自动列出该词语的材料来源。这样一来,考察不同调类、调型出现的频率及不同声调在数百种方言声调系统中分布的情况就不过是举手之劳了。

(二)连调类型。连调指声调在某一语言范围(domain)中的变化。影响连调的因素很多,可能是语音环境,可能是构词或构形因素,也可能是句法因素。考察连调的类型反映了声调分布的一个方面,所以,考察连调的类型对认识声调的一般性与特殊性非常重要。

图三:连调检索

Yue-Hashimoto(1987)认为,汉语方言的连调类型主要有三种。第一种是“首音节主宰型”。这一类型的特点是在一个多音节词语里,第一音节的调型决定整个多音节词语的调型。具体来说,如果第一音节的声调是中平调,那么,整个多音节词的调型就是中平调。这种连调主要出现在吴语里。第二种连调类型是“末音节主宰型”。这种连调的特点是在一个多音节词语里,除了末尾音节的声调外,其他音节的声调都要变调。变调的结果或者是产生一个新的声调,或者是某类声调的简化,或者是无调。大多数闽语(如福州话、福清话)和南部吴语(如温州话)的变调属于这一类型。第三种连调的类型是“局部调整型”。这一类型的特点是某个声调因邻近音节的声调而发生变化。吴语和闽语以外的汉语方言的连调大都属于这一类型。如北京话的上声变调,前一音节的上声因后一音节的上声而变化。那么,除了这三种连调类型之外,汉语方言的连调还有没有其他的类型呢?如果还有,都有些什么类型?引起或制约连调的因素有哪些?声调库设计连调这一考察范畴就是要弄清这些问题。图三是连调检索的图示。

首先,我们将连调的最大范围限制在四个音节之内。这是因为汉语的词(包括短语词)大多数不超过四个音节。超过四个音节的语言单位通常含有两个以上的连调范围(tone sandhi domain)。在考察连调类型时,除了考察某方言点或方言区的连调类型外,我们还可以作单项考察。比如,如果我们要查询某一个方言的连调情况,我们可以输入某方言点的名称,该方言的连调类型便会出来。如果我们要考察某个方言区的连调类型,我们可以输入该方言区的名称。如果我们想知道变调发生在连调范围的左边缘还是右边缘,我们可以输入具体音节的参项(如:第一音节或第二音节),有该类连调的方言材料便会统计出来。总之,有了声调库的帮助,考察连调类型的工作便会变得不那么繁重。

(三)重叠变调类型。重叠是一种常见的构词或构形的手段。重叠变调与连调不一样,连调通常发生在语流中,而重叠变调则发生在构词或构形的过程中。比如北京话的连调规则“两上连读,前上变阳平”在形容词重叠式中就不适用。在“好好儿的”、“小小儿的”等重叠式里,不是第一个“好”和“小”变调,而是第二个“好”和“小”的声调发生变化。图四是重叠变调检索。

图四:重叠变调检索

首先,我们将基式的最大范围设计为两个音节。Chiang(1992)认为汉语里可以重叠的词只有单音节和双音节两种。三个音节的词不会整体重叠。象“红彤彤、白花花”这类重叠式只能看作一个单音节的形容词加上一个双音节的重叠后缀。其次,我们将重叠式设计为四个音节。据《方言》所发表的有关重叠的材料来看,单音节词可以有单叠式、双叠式和多叠式,而双音节词通常只叠一次。因此,四个音节是大多数重叠式的最大形式。第三,我们设计了“其他音节”一项来收容那些四叠式、五叠式和六叠式的特殊现象。

重叠变调的检索可以有多种方式。如图四所示,可以按方言点或方言区检索,也可以按基式检索,还可以按重叠式检索。比如,如果我们想考察哪些方言重叠后第二个音节变高平调,我们可以在重叠式第二音节一栏里输入“H”,然后按“查询”键, 声调库就会自动将凡是第二音节是高平调的重叠式列出来,并给出统计数字。

肆 结语

“汉语方言声调资料库”的建立旨在检验前人概括的声调普遍规律。检验的结果不论是证实前人的结论还是修正前人的结论,都会使我们对声调的行为及其规律有更加深入的认识。希望对汉语方言研究有兴趣的人士能给我们提出好的建议,使这一庞大的工程更完善,对汉语方言和语言学理论的研究更有裨益。

标签:;  ;  ;  ;  

“汉语方言声调数据库”的设计与理论基础_方言论文
下载Doc文档

猜你喜欢