中国历史研究中的类型学与信息化_类型学论文

汉语史研究中的类型学和信息化,本文主要内容关键词为:汉语论文,史研究论文,类型论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

汉语史研究历来强调扎实的材料和细致的描写,这个传统再怎么强调也不为过,这是汉语史研究的基础。但是,我们也应该认识到,汉语史研究不限于此,还应该以揭示语言规律为己任。这就是说,汉语史研究还要解释语言现象背后的成因,探寻语言的一般规律。这需要理论的指导与创新。目前,在理论指导这一问题上,比较明显的偏差有三类:第一,研究成果多为材料堆积,缺乏理论的概括与升华。第二,不重视语言事实的挖掘,对语言材料的理解不够深入,甚至一味地以西方语言学理论驾驭汉语事实。第三,虽然有材料,也有理论,但是材料与理论缺少有机联系,生搬硬套。对此,学界有过讨论,不一一论列。在这种学术语境下,我们认为当下汉语史研究应该更关注历时类型学研究和汉语史研究的信息化问题。由于历时类型学牵涉的面很广,难以驾驭,也难以深入,而目前学界汉译佛典语言研究又很流行,进行历时类型学研究的空间也很大,因此,我们以汉译佛典语言的类型学研究为例,作为“麻雀”剖析。

一、汉译佛典语言的类型学研究

我国的佛教典籍非常丰富,大体上有汉译、藏译和傣译三个系统,学界比较关注的是汉译佛典。目前,汉译佛典语言研究在研究方法上有两个总的倾向:一是收集用例,归纳性地阐明语义;二是停留在与佛典以外的文献(主要是中土文献)相类似用法的比较,没有充分表明汉译佛典的特征。其实,汉译佛典是翻译的文献,我们可以把它同与之相关的各种语言,如梵语、巴利语、藏语等文献进行类型学比较,或是把不同译者翻译的佛典(同经异译)进行对比,从而发现汉译佛典中一些特殊的词汇、语法现象。汉译佛典之所以能进行类型学的比较,是因为佛教传播地域广泛,佛典异本多,语言丰富,具有可比性。季羡林认为:“原始佛教采取了放任的语言政策,一方面它不允许利用婆罗门教的语言梵文;另一方面,也不把佛所利用的语言摩揭陀语神圣化,使它升为经堂语而定于一尊。他允许比丘们利用自己的方言俗语来学习、宣传佛教教义。这对于接近群众、深入群众有很大的好处。据我看,佛教初起时之所以能在人民群众中有那样大的力量,能够传播得那样快,是与它的语言政策分不开的;另一方面,后来佛典异本很多,语言很杂,不像婆罗门教那样能基本上保持圣典的统一和纯洁,这也是与放任的语言政策分不开的。”①

佛教的这种语言倾向随着它的传播遍布世界各地。佛教向外传播有南传与北传两条线路。北传一条经中亚传入中国内地;一条传入我国西藏,再到蒙古、苏联等地。南传遍布斯里兰卡、缅甸、泰国、柬埔寨、老挝、马来西亚、印度尼西亚以及我国云南傣族等少数民族地区。北传佛教经典大多是经由中亚诸民族的文字以及后来印度的梵文翻译为汉文和藏文的,而我国东汉、魏晋的汉译佛典大多由中亚的语言文字翻译而来,远早于梵语写本。梵语既属于印度阿利安语,也属于印度欧洲语系(英语、德语、拉丁语)之一种,古代印度的重要文化都用梵文写成。特别是佛教的大乘经论,所谓一万七千部(或六千卷)汉译佛典大都是从梵文原典翻译而来。

南传佛教经典大多用巴利文写成。巴利语属印欧语系印度语族,和梵语有着亲属关系,它是原始佛教的神圣语言,南传佛教典籍通过它而保存下来。缅甸、泰国、老挝、柬埔寨和我国云南傣族的音译巴利佛典,大多一方面用自己本民族的文字字母拼写佛典,同时也用自己的语言翻译,因此,除了音译的巴利佛典外,还有意译的佛典。我们可以以汉译佛典为中心,参照藏译本、中亚各语言译本、巴利佛典、梵文佛典等,对汉译佛典中的一些语言现象进行类型学比较。

如,汉译佛典中既有“男女”一词,也有“女男”一词,“女男”用例明显少于“男女”,“女男”以唐宋时期为多。玄奘译经以“男女”为常,但也有“女男”,义净译经只有“女男”,没有“男女”,玄奘、义净(《梵语千字文》作者)是通晓梵文的,为什么会有这样的语言现象呢?我们认为可能有两个原因,一是个人的翻译风格使然;二是为了忠实梵文原典的语言。

但为什么最终还是以“男女”为常呢?这很有可能与并列式词语词序确定的原则有关。汉语并列式词语词序确定的原则一般认为与调序有关。除属同一声调外,其排列大致以平上去入为序。这可以从发音的生理要求上来解释。人们说话的时候,有一种本能的要求,在不影响表达思想的前提下,发音尽可能省力一点。平声发音最省力,上去次之,入声最费力。因此,两个字连起来发音的时候,省力的声音在前,费力的声音在后,就是顺口省力,反之费力。“男”《广韵》平声,“女”《广韵》上声。按照调序原则,“男女”组合为正常搭配。汉语并列式词语词序确定的又一原则一般认为与意义有关,即把用来指称好、大、重要、习用一类事物的词语放在前面,把用来指称坏、小、次要、罕见义一类事物的词语放在后面。按照中国传统男尊女卑的封建习俗,一般用“男女”组合。具体到汉译佛典的“男女”一词,我们认为还与梵文的音节数有关,音节多的置后。“男”梵文一般转写为nara,“女”转写为duhit,从音节数看,“男”少于“女”。

再如,通过语言比较,对汉译佛典的一些现象可以有比较清楚的认识,对“已”的认识就是这样。蒋绍愚认为:“在佛典译文中用‘已’(‘’)来翻译梵文的绝对分词之后,‘已’的性质就起了变化,它产生了一种新的语法功能:表示动作的完成(或实现)。换句话说,就是产生了‘’。这种功能是原来汉语所没有的,是受梵文的影响而产生的。”②通过汉语的“已”与梵文“tvā”的比较,就发现这种“已”大多数与梵语的绝对分词相对应。这种类型学的比较尽管前景广阔,但是困难重重,最大原因就是佛典所涉及的这些语言大都时代久远,有的甚至已近消亡,学习起来非常困难。

二、汉语史研究的信息化问题

汉语史研究的信息化是当今语言学领域的一个重大课题。无论是全文语料检索,还是关系数据库建设,都还不尽如人意,大量冷僻字、多音节词的处理还存在问题;众多的异体字、联绵字、通假字、古今字、等义词等的数字化,还未能有效地解决;汉语史计算机辅助研究,对汉字的正误,标点的有无,往往难于取舍。信息化时代大量典籍文献的可接受性研究,也是值得关注的。问题相当之多,我们认为古文字的数字化问题和汉语史信息处理中的语法学问题亟待引起学界重视。

古文字的数字化问题。汉字的数字化是中文信息处理的最基本工作,目前,汉字的数字化问题已经基本解决,有了超大字符集的支持,但是,甲金简帛文献中的古文字、写卷碑刻和俗文学中的俗字别字、辞典韵书中极冷僻的字,在计算机处理中还有不能顺利输出的问题,古文字的数字化与现代通用汉字相比处于相对落后的状态,涉及古文字的出版物,有的缺漏特有的古文字,有的图文混排,用图片剪贴方式来处理古文字,有的采用造字软件造字,有的干脆全部用手写的图像版的形式。这表明古文字还没有完全实现数字化。作为汉语史研究者,古文字的数字化需要特别引起重视。

汉字是一种古老的文字,古文字是其重要组成部分。古文字是出土文献的载体。把古文字纳入国际标准字符集,中国传统文化遗产中的这一重要内容才有可能在当今信息时代获得通用传播平台,从而在国内外发扬光大。

古文字的数字化涉及古文字字库建设、古文字整理、古文字编码等方面的工作。虽然国内学术界对古文字的数字化处理做了大量的工作,并卓有成效,但是还有大量的工作需要继续去做。我们认为可以分三步走。第一步,古文字各类别系统内的信息处理;第二步,古文字整体的信息处理;第三步,整个汉字系统的信息处理。目前,甲骨文、金文、楚国文字、简帛文字、小篆等古文字都已经具备各自的资料库、检索系统与输入法,第一步已经完成,然而,彼此独立,没有形成古文字的大系统,更没有与现代通用汉字系统接轨,即第二步与第三步都还没有完成,因此使用上多有不便。当然这是古文字数字化初级阶段的必然之路。古文字的数字化是一个系统庞大的工程,据统计,甲骨文、金文、陶文、货币文、玺印文、简帛文、石刻文、小篆等八大类的古文字字形16万左右,对这么多古文字字形的收集、整理、考释、编码,需要广大汉语史研究者的努力,才能实现资料系统的数字化与研究手段的数字化,使得任何古文字资料都可以通过检索软件甚至互联网轻松获取,可以按研究所需进行筛选、排序等,研究的结论也可以得到质和量的验证。

汉语史信息处理中的语法学问题。汉语信息处理过程中,语法问题是一个重要的内容,是汉语句处理的一个基础工作。这是一个跨学科的研究,但是我们看到,讨论这一问题的主要是信息科学领域的学者,语言学界研究者较少,汉语史研究领域涉及者就少之又少。这需要信息科学相关专家与语言学的相关专家共同努力才能解决。而涉及汉语史的一些问题,更需要汉语史的学者为此做一些基础性的工作。现代汉语的相关工作,如北京大学计算语言学研究所和北京大学中文系开发的《现代汉语语法信息词典》和配套的《现代汉语语法信息词典详解》(以下简称《详解》),目标就是为了实现汉语句子的自动分析与自动生成,这一项目是计算机科学与语言学密切结合的典范,研究成果意义重大,但是还有一些问题需要加以改进。

以副词为例,《详解》中有照应(含搭配)关系的副词组142组,我们认为这类副词组现代汉语大约还有25组。《详解》中共收录693个副词,并且认为只有28个副词可以修饰名词。但我们认为大约还有64个副词可以修饰名词,如:非常、很、极、太等。

现代汉语语法的信息处理尚且如此困难,汉语史的语法信息处理就更为困难了。以词性标注为例,在汉语史的背景下,词性的不确定性因素非常多,一个词难以确定其词性。古汉语中,不仅有所谓名词、形容词、数词的使动用法,还有形容词的意动用法,数量最多的名、动、形三类词之间区分非常困难。同时,从历时来看,汉语发展的历史非常悠久,语言的变化相当之大,使得词性的确定也非常困难。但是,这一切又不是完全不能解决的,在特定的语言环境中,词性的确定是完全可能的,所以,“依句辨品”是可信的,当然,“离句无品”又太绝对化。要使汉语史的语法信息处理可行,需要汉语史研究者做更多的基础性工作。

以“相”为例,目前,对“相”的词性认定有两种观点:一是作代词,一是作副词。“代词说”从语义出发,认为行为动作偏指一方,翻译时甚至可以译为“你、我、他”等。“副词说”从功能出发,认为“相”作状语,修饰动词。王力先生《古汉语常用字字典》只解释词义,不认定词性,认为“相”表示动作偏指一方,举的例子是《列子·汤问》:“杂然相许。”我们认为,“相”为副词,这是由于“相”的句法功能和语义的系统性决定的。从句法功能看,“相”作状语,主要修饰动词,特别是单音节动词。这点一般没有争议。存在争议的是语义,其实,从“相”语义的系统性来看,就能得出结论。

《说文·目部》:“相,省视也。”说文段注:“目接物曰相,故凡彼此交接皆曰相。”可见,“相”含有“彼此交接”的意思,由此引申出“相”的副词义,这种副词义修饰的动作行为总要涉及两个主体,但是涉及的方式却有不同,并因此而产生不同的意义。如果两个(或多个)主体是彼此互为施受,“相”就表示“互相”义;如果两个主体一个为施事,一个为受事,也就是说两个主体是单独施事,“相”就兼有指代接受动作一方的作用,也就是王力先生所说的“表示动作偏指一方”;如果两个(或多个)主体是彼此共同施事,“相”就表示“共同”义。如:

例(1)最大的特点是“相”所在的句子具有“交互性”,可以从两方面来看:第一,“相”所修饰的动词“往来”具有“交互性”,也就是从甲可以到乙,从乙可以到甲,形成一个循环。第二,从篇章所体现的信息看,“相”的所指对象“民”也具有“交互性”,“民”是两个或者两个以上的个体,这些个体既是施事者,也是受事者。

例(2)最大的特点是“相”所在的句子具有“单向性”,表现在两方面:第一,从篇章所传递的信息看,“相”所修饰的动词“许”不具有“交互性”,而是具有“单向性”,只能从甲到乙,不能从乙到甲。也就是说,只能“子孙许愚公”,不能理解为“愚公许子孙”。第二,“相”的所指对象“子孙”与“愚公”具有“单向性”,“子孙”是施事者,“愚公”是受事者,不是两个互为施受。同时,“相”既作“许”的状语,也暗指“许”的对象“愚公”。

例(3)最大的特点是“相”所在的句子具有“共同性”:第一,从篇章所传递的信息看,“相”修饰的动词“娱乐”所隐含的语义既不强调“交互性”,也不强调“单向性”,而是强调“共同性”,所谓“与民同乐”是也。这既可以从本句看出,也可从上一句看出,上句为:“世尊!我从今日于佛法中,欢喜行于清净梵行。世尊!今者已许报我,我今实欲当未来世生于此处,共此五百诸婇女等,共相娱乐。”“共相娱乐”与“以相娱乐”前后共现,“相”即“共”也。第二,“相”的所指对象“我”与“五百婇女”都是施事者,没有受事者,施事的结果是共同娱乐。

副词“相”的语义系统图示如下:

从“相”的语义相关性可以看出,“相”应该作副词而不是代词。以“相”为例,我们认为只要做好深入细致的基础工作,汉语史信息化的一些问题是可以解决的。

三、理论构建:中西兼顾,自主创新

以上用两个问题来说明汉语史研究中亟待关注和解决的问题。但对于语言事实的研究除了致用以外,如果能为理论语言学的研究提供研究成果则更有意义。中国语言学界对西方语言学理论并不陌生,引进和运用也不会有阻力。西方语言学理论对汉语的事实有一定的解释力,不少学者借鉴西方语言学理论取得了可喜的成绩。吴福祥运用“类型学”理论分析了粤语的差比式“X+A+过+Y”,认为这种差比式“是粤语区别于其他方言的一个显著特征”,“源于自身的独立创新而非古汉语特征的承继”。③这样的理论借鉴今后仍将为中国语言学界所重视。而根据汉语自身特点进行理论的自主创新在当今的学术语境下显得尤为重要。汉语史的理论创新需要体现自身特点。汉语与西方语言不同,有自己的特色。深入理解研究对象,是汉语史理论创新的前提。王宁认为:“科学的研究在哲学方法论层面上固然会有一些共同的认识和理念,但是说到具体方法,没有一种研究方法可以不考虑研究对象的特点的。”④语言学研究的原始创新必然在第一手材料的基础上才能做到。汉语史的理论创新需要体现自主性。中国传统语言学出于为经学服务的目的,重视语言材料,忽视语言理论的概括,但这反而为我们今天语言学理论的自主创新提供了便利,打下了坚实的基础。

汉语史的研究应当主要依靠自身的力量,充分继承中国传统语言学的成果,自主创新,不能完全依赖引进。对汉语史理论的自主创新,有识之士一直在积极呼吁并身体力行。徐通锵、王洪君通过对汉语方言中的文白异读现象的分析研究,提出一种“叠置式音变”的理论,以区分连续式、扩散式二种不同的音变方式,作为历史比较法和词汇扩散理论的补充与发展,⑤为学界所关注。汉语史谈词义发展的途径总是提到“引申”与“假借”,假借与词义演变关系不大,引申也不一定是词义演变的唯一途径,还应该有多种途径,蒋绍愚从汉语词语相互关系方面讨论词义演变的另一种途径,提出了“相因生义”的理论,⑥为学界认同。总之,汉语史的研究,既要借鉴西方语言学理论,更要立足自身进行理论的自主创新。这样,就能使汉语史研究既具有理论性,更能使这些理论真正指导汉语史的研究。

①季羡林:《原始佛教的语言问题》,《季羡林学术论著自选集》,北京:北京师范学院出版社,1991年,第39—40页。

②蒋绍愚:《〈世说新语〉、〈齐民要术〉、〈洛阳伽蓝记〉、〈贤愚经〉、〈百喻经〉中的“已”、“竟”、“讫”、“毕”》,《语言研究》2001年第1期。

③吴福祥:《粤语差比式“X+A+过+Y”的类型学地位——比较方言学和区域类型学的视角》,《中国语文》2010年第3期。

④王宁:《古代语言学遗产的继承与语言学的自主创新》,《语言科学》2006年第2期。

⑤徐通锵、王洪君:《说“变异”——山西祁县方言音系的特点及其对音变理论研究的启示》,《语言研究》1986年第1期。

⑥蒋绍愚:《论词的“相因生义”》,《汉语词汇语法史论文集》,北京:商务印书馆,2001年,第93—109页。

标签:;  ;  ;  ;  ;  

中国历史研究中的类型学与信息化_类型学论文
下载Doc文档

猜你喜欢