浅谈西方翻译语料库研究_自然语言处理论文

浅谈西方翻译语料库研究_自然语言处理论文

浅谈西方翻译语料库研究,本文主要内容关键词为:语料库论文,浅谈论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

0.概述

西方的英语翻译语料库(Translational English Corpus,以下简称TEC)实际上是在语料库 语言学理论的基础上产生出来的一项用于翻译理论研究的实用方法。英语翻译语料库大都是 把译成英语的各种真实的正式出版物汇集起来,对语言现象用计算机进行统计、比较和分析 。语料库取材于广泛的职业翻译作品,因此,这一资源为探讨翻译文本的性质、译者的个人 风格、源语对目的语(英语)句型的影响、源语对文本类型的影响,以及其他一些翻译学者和 语言学家感兴趣的问题提供了广泛的研究空间。更重要的是,作为一种具体而又详细的资源 ,它还可以为研究者验证理论上的翻译性质是否有效、实践中的翻译方法是否可行。本文的 阐述旨在说明语料库作为一种研究方法已经广泛地应用在西方翻译领域内,并取得了一定的 成 果,这是值得我们注意的。

1.TEC的理论基础及其产生背景

翻译语料库的产生应当说是从语言学翻译理论发展而来的。众所周知,早在20世纪30年代 ,语言学已经形成了系统化研究。人们期待必要的理论工具来解决实际遇到的问题。正如语 言学家乔姆斯基所说的那样“必须迈出一大步,即,从直觉到科学,要把译者在实践基础上 总结的个人思想归结到系统的科学上来。”(Klaudy 1991:92)

到50年代和60年代中期,翻译研究在西方呈现出一个高潮。首先是俄国语言学家A.Fjodoro v在他出版的《翻译理论导言》(1953)一书中声称“翻译是一种语言操作”。显然这种偏激 的言论招致四面楚歌,被斥责为“语言学的叛逆”,但确实使得译坛异常活跃。后来,R.Ja kobson,I.I.Rovzin和V.J.Rosenzweig,J.Catford,E.Nida等人纷纷著书立说阐明自己的观点 。这其中对于翻译研究的科学论述最有影响且最深刻的当属尤金·奈达先生的《走向科学的 翻译》(1964)。

任何一门成熟的学科都必须与其发展的理论相一致,同时必须经得起实践的检验,并具有 科学的数据和方法。翻译学也不例外。近年来,国内外许多学者相互学习,理论联系实际, 积极探索翻译学的方法论。其中建立翻译语料库便是这一研究的具体体现。

随着计算机技术的迅速发展,语料库已经开始在各个领域中发挥了重要的作用。第一个机 读语料库由Nelson Francis和Henry Kucera于1961年在Brown大学编制而成(汇集了美国英语 1 00万词汇)。其姊妹语料库“英国英语”(Lancaster-Oslo-Bergen)于70年代后期问世。它们 代表了语料库语言学历史中“突出而且成熟”的成就(Clear 1993:164),成为语言学家极为 宝贵的资源。后来,由伯明翰大学建立的COBUILD项目得到了柯林斯出版社的资助,在语 言研究方面取得了重大进展。到了80年代,人们在这一领域的兴趣有增无减,运转语篇的大 型语料库越来越体现出其存在的价值和用途。1989年汇集了1亿词的英国国家语料库问世, 并广泛应用于工业和科研领域中(Clear 1993:167)。同时,人们希望有新的语料库资源能对 翻译产生深远的影响。

把语料库技术应用到翻译研究领域中起始于90年代初期。最早产生的翻译语料库是1996年 由英国曼彻斯特科技大学(University of Manchester Institute of Science and Technol ogy缩写为UMIST)的Laviosa-Braithwaite制作的,并发表了“英语比较语料库:翻译实践研 究的资源与方法”(The English Comparable Corpus(ECC):A Resource and a Methodology for the Empirical Study of Translation)。这是一篇博士论文。随后,该学校的Doroth y Kenny,Mona Baker等人先后改进了翻译语料库。在此基础上,Mona Baker教授建立了翻 译语料库的基本理论并成立了翻译研究中心。Mona Baker(1992:395)提供的证据说明了语 料库技术的发展对翻译现象和性质进行理论研究具有强大的刺激性。众所周知,目的语和源 语在表达方式上总会有一些显著不同的特点。TEC的基本理论则正是针对这些差异建立的。

2.TEC的分类

翻译语料库按照研究目标分为两种类型:描述型和实用型。

描述型是把语料库设计成译文文本分析语料库,并把它们与源文本语料库进行比较,以发 现译文所具有的特点,特别是源语—目的语的结合点(Gelllerstan 1996)以及有可能具有普 遍 意义的译文文本(Baker 1998,Laviosa 1998)。

实用型则是利用语料库来探索人工翻译和机器翻译的过程。基于这样的目标,TEC又可以分 为三种主要形式:

单一语种语料库(Monolingual Corpora)包括某一种语言的文本,可能是某一项翻译的源语 文本,也可能是译文文本。普通的语料库文本类型可以非常广泛;但特殊的语料库则限定文 本风格和/或主题范围。不论哪一种,都必须能在文本群中提供样品,也能够理想地反映该 群体的各种变体(Biber 1993)。

比较语料库(Comparable Corpora)的设计同单一语种语料库相似,只是用于两种和更多的 语言比较。它们可能被当作一些成份。目前比较语料库大都针对不同的文化,在社会语言相 似的文本类型和范围内探索相关的语言变体。(少数例子除外)

平行语料库(Parallel Corpora或Bilingual Corpora)是把包括源语文本及其译本的两种或 更多的语言作为一些成份来进行研究。同样,大多数平行语料库都是专门设计的。主要有两 种形式:

单向平行语料库(Unidirectional Parallel Corpora)包括一种语言的文本和将该文本译成 其他语言的文本。既然按照定义A语言语料库受到B语言译本的限制,一般不在A语言文本群 中选取样品(Aijmer et al 1996)。当然,即使在B语言成份中选取译文样品,其选用的标准 也有争议。总之,这两个成份都是按照段与段或句与句来排列的,每一个文本的句子或段落 所加载的信息与另一个成份的平行文本的句子或段落相关(排列步骤见网址http://www.lpl.univ-aix.fr/projects/arcade/)。

双向(或相互)平行语料库(Bidirectional or Reciprocal Parallel Corpora)包括四个成 份:A语言的源文本及其译入B语言的译文本,B语言的源文本及其译入A语言的译文本。因此 它们结合了单向平行语料库和比较语料库的特点:如果对两种语言采用相同的设计标准,那 么,在两种语言中就可以包括源文本的可比性的集合(A1和B1),同样在两种语言中也包括了 译 语文本的可比性集合(A2和B2),进而可以在同一语言中对源语和译入语进行比较(A1和A2 ;B1和B2)(Johansson and Ebeling 1996)。

图示:

比较语料库和平行语料库

A语言 B语言

比较语料库 A语言专用语料库

同样设计的B语言专用语料库

单向平行语料库 A语言专用语料库

在A库中所含的B语言译文本

双向平行语料库 A1语言专用语料库 与A1设计相同的B1语言专用语料库

B1的译入语A2语料库A1的译入语B2语料库 比较语料库与平行语料库的区别在于:前者包括“同一语言的两个不同的文本集合”;后 者则是“A语言的源语文本和B语言的译入语文本”组合。(Baker 1994:9)

语料库的研究模式究竟对翻译有什么帮助呢?Mona Baker指出,开发语料库这种连贯的方法 “来识别翻译的语言特征,其目的不仅仅是揭示‘第三代码’的本质,而且更重要的是找出 理解影响翻译行为并造成其特殊语言的连贯性质,压力和动力”。

语料库对翻译文本的量化研究可以提供各种机会,如:词频、功能性语法、各种语言成份 的搭配,等等。它可以在语法和词汇现象之间架起实验调查的通道。由于在巨大的库内运行 文本,这样可以测试语言理论及其假设,借助于统计方法,找出语言特点和类型,为语言分 析提供新视角。

既然TEC是一种资源,它还可以被用来准备教学材料,通过TEC可以获得并证实译文模式和 翻译知识,也可以为翻译培训服务。但更重要的是,它可以作为翻译理论研究的工具。

在教学上,通过对源语和目的语的比较,学生可以认识句型、比较句型。比如,在教汉译 英的课程中,教师往往凭直觉来判断学生句子的地道不地道,或者自然不自然。而语料库则 给教师提供了极具说服力的证据。 在翻译实践中,译者可以对不同的表达法做出最佳的、明智的选择。

目前,大多数的学者都是用语料库来进行各种理论性的或描述性的研究。他们根据自己的 工作或兴趣,建立起一个理论框架。这个框架必然会受到下面三个因素的影响:公众的期望 、理论家的假设或要求、职业翻译的实际操作。例如,UMIST的Mona Baker通过TEC对一些译 文引起的公众反映和理论家的评论进行了分析,从而证实了语料库可以检验翻译理论对实践 的有效性。

语料库的言外特征划分非常细致,如:译者的性别、民族、职业、翻译方向、源语、译本 出版社,等等。这些信息都会对翻译的结果产生影响。

3.TEC的用途

TEC的另一个明显作用就是作为传统词典和语法的补偿,为译者提供工具。请看下面这个例 子:

An hour before dawn on March 7th 1974,Kaspar Joachim Utz died of a second and l ong-expected stroke,in his apartment at No.5 Sirok Street,overlooking the Old Je wish Cemetery in prague.

Bruce Chatwin's Utz(1989a:7)

如果我们查一下100,000,000词的英国国家语料库(British National Corpus)(HTTP://i nfo.ox.ac.uk/bnc),我们就会发现当apartment与overlook在一起使用时,其后面的宾语大 多为:mountains,rivers,oceans,ports,squares以及gardens等。所有这些词的含义均为积 极意义的,只有作为讽刺意义时才有可能搭配ugly这样的词。而各种词典对此均未提到,甚 至母语是英语的译者也会忽略。了解这一点有助于对原文的理解。人们因此也会提出问 题:作者Chatwin让读者体会布拉格墓地是作为一个美丽的景点呢,还是一种讽刺,或者他 是有意作此模糊的描述。

TEC与词典的不同还在于它可以提供内容十分丰富的语言学习环境。读者可以从大量数据中 了解到一些搭配用法和它们的使用环境,进而增加了深入学习的可能性。说得通俗一点,就 是把人们的注意力吸引到不同的表达法上来,让学习者对短语、语域和词频更加敏感。由于 任何搭配都可能含有一些读者未知或不熟悉的用法,因此,在查询TEC的过程中,还可能产 生出乎意料的学习收获。而这些都是其它语言工具难以做到的。

由于TEC汇集了大量的源语和/或译语文本,特别适用于调查特殊文本的形式和意义(包括术 语、文本结构、语域特征等)。根据语料库提供了词汇密度和重复的文本类型,使用者可以 借助类型/词次百分比和st(源语文本)和/或tt(译语文本)的比值对说明翻译文本的规范提供 有用的数据。

4.西方各国研究动态

英国UMIST的TEC包含有4个子库:小说、传记、报纸以及杂志,总共有5500万单词,按照目 前的工作速度,到2001年底将达到2000万条词汇。这也只是一个中型语料库。比较理想的规 模应该在5000万条词汇以上。研究者通过两个工具对语料库进行搜索:一个是词语索引(con cordances);另一个是词表(word lists),研究人员可以根据不同的工作要求选用下列搜索 范围:

1)选择源语

UMIST的语料库中包含的源语文本大多为西方各国的语言,如德语,法语,意大利语,西班 牙语,等等。研究者可以从目的语为英语的文本中来调查源语的影响。

2)选择译者

语料库中包含了典型译者的几种文本。研究者可以据此调查某一译者的风格或语言类型。

3)选择子库

研究者还可以从语料库的功能中检索出很多言外特征,如:译者的性别、民族、职业、翻 译方向、译本的出版商,等等。这些信息分别列在每一个文本的文件标题上。

此后,西方一些国家的翻译学者先后建立了自己的TEC,有关TEC的研究论文也在逐年增加 。

意大利的Federico Zanettin利用双语比较语料库对译者进行培训(见Meta,XLⅢ,4,1998) ;挪威的Sandra Halverson用TEC对翻译文本进行理论性/描述性的分类,并且界定了研究目 标的概念(见Meta,XLⅢ,4,1998);爱尔兰的Dorothy Kenny利用TEC分析译文的“语义”特 征(见Meta XLⅢ,4,1998);芬兰的Jarmo Jantunen建立了芬兰语的比较语料库进行翻译理 论的假设论证。还有芬兰的Hannu Kemppanen通过TEC寻找关键词来探索译入芬兰语的历 史文本,等等。

利用语料库方法论来研究口译已经是许多西方学者尝试的一个题目,他们探索口语类型、 口译目标,以及在不同压力和语境下的语际过程模式。Shlesinger借助于翻译语料库开发了 两种研究口译的方法。第一种是采用直接的平行语料库的数据进行口语类型比较;第二种是 应用目前的单语语料库提炼出口译研究的实验材料。

5.结论

TEC的研究在西方也只是刚刚起步,留给研究人员的问题还有很多。如:译者怎样利用TEC 改 进译文;语料库的文本汇集标准怎样界定;A语言与B语言的对等比较模式等等。不论是赞成 还是反对TEC的观点都还处于理论性的探讨之中。就目前的研究结果来看,TEC作为翻译和学 习的工具,其有效性还有许多不尽如人意之处。但是从获得正确使用语言信息(包括术语和 习惯用法等等)的角度来说,其使用价值要比双语词典大得多。(Bowker:1998)

对于以往语料库翻译研究进展缓慢的原因,Mona Baker提出,这是受到传统语言学主流研 究方法的影响,使得研究者的着眼点往往落在语言的结构形态上,而没有把语言的句型同使 用语言的译者、译者的思想、社会,以及语境联系起来(Baker 1996a,1999)。

笔者认为,作为翻译文本的研究,关键是“对比”。对比两种语言所表达的意思。如果研 究者脱离了原文和译文的比较,只就其中之一的文字意思加以评论,都不算是研究翻译,只 能说是评论作文。

目前西方翻译语料库大多还在单一语种文本(Monolingual Text)上进行各项研究,如:译 者的写作风格、词语的搭配习惯、词频统计等等。这显然并没有突破语料库语言学的基本研 究范围。

另外,由于西方一些国家的拼音文字有许多共同的特点,因此在翻译研究中,语料库提供 的“可比性”要比中文明显。目前中文的单一语种语料库建设还很不完善,因此,作为中英 翻译的语料库还有一段艰苦的历程。

标签:;  ;  ;  ;  ;  ;  

浅谈西方翻译语料库研究_自然语言处理论文
下载Doc文档

猜你喜欢