基于语料库的英汉开始类词语的语言差异性探究-以start,begin和开始为例论文

基于语料库的英汉开始类词语的语言差异性探究
——以start,begin和开始为例

李佳 夏云

【摘 要】 运用语料库语言学的研究方法,分别对start,begin和开始三个节点词进行检索,通过分析节点词在语料库的不同语域中的词频分布差异,观察它们在检索行中所呈现的语义韵特点及其搭配词的所属分类等语言特征,以厘清它们之间存在的差异。研究发现:(1)start一词偏非正式化、口语语体,begin一词偏正式化,汉语对应词开始没有呈现出显著的语体倾向。(2)start,begin和开始三个节点词语义韵特征不明显,整体呈现出中性语义韵的特点。(3)start,begin和开始三个节点词搭配习惯上存在差异性。

【关键词】 语料库;语域;语义韵;搭配

引言

随着语料库语言学的研究发展,人们日益关注词汇的纵深信息。对于词汇深度知识的构成,内申(Nation,1990)认为掌握一个词意味着了解它的形式(口头、书面)、位置(语法句型、搭配)、功能(频率、得体性)和意义(概念、联想)。掌握一个外语词远非仅仅了解“符号—意义”一对一的简单过程,而是涉及对一个词全部特征的了解、熟悉和掌握。此外,语料库证据表明,每一个词项都有独特的搭配行为(Partington 1998:27),同义词也不例外,它们一般只在概念意义上相同或接近,但在搭配词选择上并不能随意替换(Conzett 1997)。例如,powerful car和strong tea是典型搭配,而powerful tea和strong car则不符合英语表达习惯(Halliday 1976)。本文以start,begin和开始等具有代表性的一对英语同义词和汉语对应词为例,观察其在不同语域中的词频分布差异、语义韵特征及其搭配词的所属分类,挖掘词汇纵深信息,厘清英汉“开始”类词语的语言差异性。

成矿母岩往往具有多期多相的复杂结构,一般岩石具有斑状结构。在产状较复杂的花岗岩中,常含有多层中粒及细粒斑状花岗岩,前者为第1期,后者为第2期。无论是第1期还是第2期,它们在成分上都有显著的差异变化,如第2期有细晶岩、花岗斑岩、微斜花岗岩、闪长玢岩以及煌斑岩岩脉。

一、研究方法

(一)研究工具

本研究所用的语料库包括两个部分:第一部分是英语国家语料库(British National Corpus,简称BNC),词容量超过一亿,能够较好地体现以英语为母语的本族学习者的语言特点;第二部分是兰卡斯特汉语语料库(The Lancaster Corpus of Mandarin Chinese,简称LCMC),是一个100万词次的现代汉语书面语通用型平衡语料库。本研究选用的start,begin和开始在BNC语料库和LCMC语料库中基本高频出现。因此,它们能够在一定程度上反映出“开始”类词语的语言特征。AntConc 3.2.2语料库分析软件为本研究的检索工具。

(二)研究步骤

本研究分别从BNC语料库和LCMC语料库中提取真实数据,分析start,begin和开始在不同语域中的词频分布差异、语义韵特征及其搭配词的语义搭配行为。该研究主要分以下三个步骤进行:

首先,分析start,begin和开始三个节点词在不同语域中的词频分布差异。观察BNC语料库中start,begin两个节点词在不同语域中的分布频率。通过AntConc 3.2.2语料库分析软件,检索开始一词在LCMC语料库中15个不同文本类型中的分布情况,参照BNC语料库中的语体分类标准,观察其在不同语域中的分布频率。

其次,对start,begin和开始三个节点词进行义韵标注。根据上下文语境信息把节点词的语义韵特征标注为消极语义韵、中性语义韵和积极语义韵三类。在标注过程中,对于少数不能明确反映节点词语义韵特征的索引行,从原文中获取上下文语境信息进行观察。

最后,提取start,begin和开始三个节点词的搭配词。在BNC语料库中,分别检索start,begin两个节点词,按搭配词出现的频率检索出前100位搭配词,人工分析三个节点词与搭配词共现的索引行,剔除重复行和不符合义项要求的部分,再对其有效索引行的搭配词进行定性分类,可归纳为以下9类:时间类、动作类、评价类、状态类、工具类、心理类、事件类、价格类及其他;用AntConc 3.2.2软件在LCMC语料库中分别检索开始节点词出现的总频数,人工分析该节点词与搭配词共现的索引行,剔除无效或不符合义项要求的部分,并对其搭配词进行定性分类和分析,分类标准与start,begin搭配词分类标准保持一致,并对比start,begin和开始三个节点词搭配行为的差异。

二、基于语料库的语言差异性探究

(一)start,begin和开始在语料库不同语域中的词频分布差异

语域(Register)这个概念最初是里德(Reid)在1956年研究双语现象时提出来的。关于语域的内涵,哈利迪和哈森(Halliday&Hasan,1985)明确指出:“语域是个语义概念,是与某一特定的话语范围、话语方式和话语基调情景有关的意义组合。”语言使用的领域有很多,如新闻广播、演说语言、广告语言、课堂用语、办公用语、日常谈话、口头自述等,在不同的领域会有不同的语体。由于同义词在不同的语域中往往会呈现出不同的频率特征,所以统计出start,begin和开始三个节点词在不同语域中的频率差异,能够加深学习者对词汇深度的理解,促进其对同义词的合理运用。

LCMC语料库中涵盖15个文本类型,如小说、学术、新闻报道等。开始一词在各个文本中的分布较为平衡,语体差异不显著。

微课的实际运用过程中,为提高应用效果,就要和教学内容相结合来评估指标,通过加强课件内容的质量监控,才能真正保障微课运用的整体质量.做好微课课件内容的审核工作,查看课件内容和教学的要求是不是符合,以及在技术层面有没有存在问题,这些都是提高微课运用质量的基础.

图1:start,begin在BNC语料库中的分布频率

9.一九八九年以来,各级审计机关陆续开始对一些重点企事业单位实行经常性审计监督制度。

(二)start,begin和开始语义韵差异研究

在英汉两种语言中,许多词语通过自身的含义就可以标示出词语的态度附加功能,如褒义、贬义或中性的特点。然而,语言系统中还有很多概念意义单一的词汇,其态度标示功能就比较隐含,如start,begin和开始。为了对该类词语的态度标示功能进行准确“定性”,需要引入词语搭配的语义韵研究,并以此为基础进行辨析。

数据加密技术是确保计算机网络安全的重要手段之一,主要是在数据传输的过程中通过加密算法对信息进行重新编码,以提高信息的隐蔽性。目前比较常用的数据加密有数据存储加密和数据传输加密,存储加密是对每一份存储数据进行加密并且对权限进行设置。传输加密包括端到端加密、链路加密以及节点解密3种。

在BNC语料库中,start,begin两个节点词在不同语域中的分布呈现出不同倾向(见图1)。

2.Although we got off to start everyone is getting it together now.

1.After a few starts he found his rhythm and everyone began to clap in time.

从BNC语料库中提取的索引证据显示,当start作名词时,该词前经常伴有一个评价性单词,如unpleasant/unpromising/ill-fated/unconvincing/bad/shaky/rocky/nervy/nervous/hesitant/wretched/disjointed/inauspicious;promising/bright/good/super/perfect/fresh/new;quick/early/immediate等。该节点词所吸引的搭配词呈现出消极语义的居多,见例1—3:

财政部副部长程丽华代表财政部向黑龙江北大荒农垦集团总公司成立表示祝贺。她表示,经国务院同意,授权财政部代表国务院对黑龙江北大荒农垦集团总公司履行出资人职责,标志着黑龙江垦区体制机制的重大转变,翻开了黑龙江农垦发展崭新的一页。希望北大荒农垦集团总公司勇担重任,继续为实施乡村振兴战略作出应有的贡献;再接再厉,继续将农垦改革不断引向深入;不辱使命,全力打造具有全球竞争力的世界一流企业;采取有力措施,切实加强国有资产监管。财政部将认真落实党中央、国务院决策部署,与黑龙江省委省政府和国家有关部委一道,进一步推动黑龙江农垦的改革发展。

3.The BBC told him he’d madestart.

4.They had gone out to Jamaica to start

当 start作动词时,常与 new,again,next连用,表示阶段性的重新开始,一般具有积极的语义韵,见例4—5:

5.Would you like to start and try a different way?

从BNC语料库中检索begin发现,该节点词语义糅杂,既搭配消极涵义的词项,又搭配积极涵义的词项,但大多数搭配词为中性语义,如seep,sprout,discern,proliferate,creep,stir,film shipments,deliveries,rehearsals等,呈现出一种错综的语义韵,见例6—8:

6.It was in factbeginning,for the cast wasenormousand hiscrowd work wasnot exceptional.

兵源技术含量高,但优势发挥不充分。经济功能区是高新技术企业聚集地,员工综合素质较高、专业技能较强,各型技术装备充足,特别是一些军民融合产业园区,军事专业对口人才和相关装备器材更多,为民兵专业力量编组提供了良好条件。但是,从统计了解情况看,当前各经济功能区编组民兵专业和特殊力量较少,有的编建了专业力量,却没有依托相关行业企业编组,民兵专业岗位需求与企业人才潜力优势对接不够,专业技术优势没有充分发挥出来。

语义韵是指具有相同或相似语义特点的搭配词习惯性地、循环往复地与节点词在文本中共现,节点词也就被“传染上”了有关的语义特点,整个跨距内就弥漫着一种特殊的语义氛围(Louw 1993)。词语搭配形成的语义韵大体上可以分为消极语义韵、中性语义韵和积极语义韵三类(Stubbs 1996)。以下分别对start,begin和开始这三个节点词进行语义韵描述。

7.The great line of the centuries begins...

8.It is scheduled to begin within the next six month.

在LCMC语料库中,开始节点词共出现了447次,将搭配跨距界定为-4/+4,即取节点词开始左右各4个词为其搭配环境,搭配词出现频率设置为不低于3次,检索出217行索引行。逐一检查索引行,剔除重复行和不符合义项要求的部分,观察其语义韵的特点。检索结果显示,开始节点词的搭配词多为中性语义词汇,其语义特点既不消极又不积极,如思考、发展、走向、接触、建设、实行、实施等,见例9—11:

ODC元素中,“中国”是其主攻对象。“各国”一词语义范围包括但是大于中国,表明特朗普仇视任何与其利益有冲突的国家。此外,前几任总统及政府虽然是美国的组成部分,但受到了特朗普的猛烈批判,被视为“不作为、无成效”的政府,因而,“历任总统”也成为ODC的特殊部分,从而与特朗普在立场上有鲜明区分,突出本届政府的能力和独特意义,以期获得选民的赞誉。

start,begin在BNC语料库中的分布频率结果显示,这对同义词在不同语域中的分布频率存在很大的差异:start一词在SPOKEN语域中分布频率最高,在ACDEMIC语域中分布频率最低,偏非正式化、口语语体;begin一词则在SPOKEN语域中分布频率最低,偏正式化、书面语体。汉语对应词开始在各个语域中分布较为平衡,没有明显的语体倾向。所以,对于start,begin和开始的辨析如果仅仅从概念意义出发,则很难辨析出同义词之间的细微差异;如果以节点词在不同语域中的频率分布情况为出发点,就可以发现其差异性,使学习者对同义词的辨析有更加理性的认识。

10.辽宁省许多有识之士已开始认真思考,他们开始承认自己的不足与落后。

由于种种原因,高职院校的特色资源先天积累不足,后续建设相对滞后,笔者基于高职院校的自身特征,发展方向,人才培养目标,在总结和分析国内高职院校特色资源发展研究成果基础上,提出以下四种协同创新模式,这四种模式并不是独立存在和运行,在实践中完全可以交叉和并行发展。

11.发展西部的工作,在“七五”就已开始实施。

基于语料库,对start,begin和开始这三个节点词进行举例分析,可以看出这三个词的语义韵特征不明显,整体呈现出中性语义韵的特点,但值得注意的是,start作名词时,常与具有消极意义的评价性形容词构成固定或半固定短语,同时需要更多详实的数据,以进行更科学而全面的描述。

1.1.2 培养细胞 人乳腺癌细胞系MDA-MB-468购买自上海舜冉生物科技有限公司,培养于含有10%胎牛血清和1%青链霉素的DMEM培养基中,细胞在37℃、5%CO 2环境下培养。

(三)start,begin和开始搭配词分类情况

词语搭配指的是词与词结伴使用的语言现象。弗思(Firth,1957)提出的一个著名论断是“由词之结伴可知其词”。语言的词汇并不是单独和孤立地使用的,而是和别的一些词构成习惯性和典型性的结伴关系一起使用的。本文采用卫乃兴(2002)对搭配的定义:“词语搭配是在文本中实现的一定的非成语意义并以一定的语法形式因循组合使用的一个词语序列,构成该序列的词语相互预期,以大于偶然的几率共现。”本研究从语料库中提取真实数据来分析start,begin和开始三个节点词的典型搭配词,并对其搭配词进行分类,以归纳以上三个节点词的异同之处。

在我国输变电工程实际施工中,传统的成本控制方式主要是采用事后控制的方式,然而事后控制对施工成本起到的控制作用微乎其微,要想节省工程成本,就要加强成本的事前控制,要在工程开始之前了解相关资料,对施工成本进行预测和设计。施工企业一般不具备成本控制的能力,也不能对成本有一个准确的预测,过分依赖于个人经验,而没有一个完善的资金使用规划,也不能从整体上准确把握施工成本,这就造成在施工过程中资金的滥用和浪费。再加上输变电工程施工过程是一个动态的长期过程,在施工中会受到多方面因素的影响,假如在施工前期没有一个合理的成本规划,就无法对成本进行有效的控制。

BNC语料库结果显示,start一词的有效索引行为2,081行,begin一词的有效索引行为1,601行。LCMC语料库结果显示,开始一词的有效索引行为53行。由此可见,三个节点词的搭配词分类情况存在差异(见图2)。

图2:BNC语料库和CLEC语料库中start,begin和开始搭配词分类情况

根据以上数据可以得出:start搭配词分类范围最广,与时间类搭配词搭配使用最频繁。start与动作类搭配词搭配的使用情况明显多于状态类搭配词的使用,与评价类、工具类和事件类搭配词搭配的使用情况也比较多。begin一词与时间类搭配词搭配使用最频繁,与状态类搭配词搭配的使用情况明显多于动作类搭配词的使用,使用情况恰好与start相反。begin与心理搭配词搭配使用的情况也较多,但与评价类、事件类搭配词搭配使用的情况较少。值得注意的是,没有出现与工具类、价格类搭配词搭配。“开始”一词搭配词分类范围偏少,主要与状态类搭配词搭配使用,其次为时间类、评价类、动作类。

结语

本文的研究遵循“从语料库到认知”的原则,分别对start,begin和开始三个节点词进行了语料分析,具体包括如下三个方面:其一,通过观察start,begin和开始三个节点词在语料库的不同语域中的分布频率,揭示出三个节点词的语体特征;其二,通过对节点词的语义韵分析,厘清了同义词依据搭配语境所显示的不同的词语态度标示功能;其三,通过对节点词的典型搭配词进行归类,归纳出节点词搭配词的分类特点。研究结果发现:(1)start,begin两个节点词呈现出不同的语体倾向,start一词偏非正式化、口语语体,begin一词偏正式化,而汉语对应词开始没有呈现出显著的语体倾向。(2)start,begin和开始这三个节点词语义韵特征不明显,整体呈现出中性语义韵的特点。(3)start,begin和开始这三个节点词在搭配习惯上存在差异。start节点词的搭配词分类范围最广,常搭配时间类搭配词,而begin和开始更多的是与状态类搭配词搭配。以上研究方法对传统的同义词辨析方法起到了有效的补充作用,能够解决在理解和运用过程中产生的部分困惑,对语言学习者在英语同义词差异辨析方面起到了一定的指导作用。

引用文献

卫乃兴.2002.词语搭配的界定与研究体系[M].上海:上海交通大学出版社.

Conzett,J.1997.Integrating collocation into a reading and writing course [C].//J.Coady&T.Huckins (eds.).Second Language Vocabulary Acquisition.Cambridge:Cambridge University Press,70-87.

Firth,J.R.1957.Papers in Linguistics 1943-1951[M].London:Oxford University Press.

Halliday,M.A.K.1976.System and Function in Language[M].Oxford:Oxford University Press.

Halliday,M.A.K.,&Hasan,R.1985.Language,Text and Context:Aspects of Language in a Social Semiotic Perspective [M]. Geelong:Deakin University Press.

Louw,B.1993.Irony in the text or insincerity in the writer? The diagnostic potentialofsemantic prosodies [C].//M.Baker,G.Francis& E.Tognini-Bonelli.Text and Technology:In Honour of John Sinclair.Amsterdam:John Benjamins:157-176.

Nation,I.1990.Teaching and Learning Vocabulary[M].New York:Newbury House Publishers.

Partington,A.1998.Patternsand Meanings-Using CorporaforEnglish LanguageResearch and Teaching[M].Amsterdam:John Benjamins:27.

Stubbs,M.1996.Text and Corpus Analysis[M].Oxford:Blackwell Publishers.

注:本文系山东省研究生导师指导能力提升项目“翻译硕士兼职导师立体管理模式构建”(SDYY17143)的阶段性成果。

作者信息: 276800,山东日照,曲阜师范大学翻译学院

标签:;  ;  ;  ;  ;  

基于语料库的英汉开始类词语的语言差异性探究-以start,begin和开始为例论文
下载Doc文档

猜你喜欢