面向德语科技文献的人工智能翻译论文

面向德语科技文献的人工智能翻译论文

面向德语科技文献的人工智能翻译

徐林峰

(上海应用技术大学,上海 201418)

摘 要: 科技文献作为存储和传播科技信息的资料,具有客观性、科学性、抽象性和概括性等特征,科技德语尤其具有概念准确、逻辑缜密、行文简练、重点突出、结构严整等特点。将人工智能翻译应用于德语科技文献前景可观,但现阶段仍需在“统计进路”等方面寻求突破。

关键词: 人工智能;翻译;科技德语

在现代社会,跨语言交流成为日益普遍的现象,与之相伴的是对优质高效翻译的日趋强烈的需求。在这种需求之下,机器翻译应运而生。从最初的只能翻译单词,到翻译句子基本符合语法,继而逐渐符合基本逻辑关系,再到一定程度上可以照顾上下文进行语篇翻译,机器翻译的功能不断改观。网络技术的发展和人工智能技术的广泛应用,为跨语言交流带来了新的机遇。随着人工智能在机器翻译中的应用,自然语言处理实现了新的突破。与人工翻译相比,人工智能翻译具有速度快、成本低、即时性与易控性等优点,尤其在科技文献翻译中,还显示出译本一致性强、专业术语准确率高等优势,因而具有较大的应用与发展前景。

1 德语科技文献机译需求

进入21世纪以来,社会可持续发展越来越依赖于科学技术高度发展所形成的巨大力量。科技活动逐渐由国家规模向国际规模扩展,并向社会机体全面渗透,对外交流成为各国科技发展的必然选择,就连科技实力强大的美、日、德等国,也不可能完全独立地发展科技,而需广泛寻求国际科技合作。对于我国而言,粗放型的对外贸易增长方式所带来的贸易摩擦风险,伴随着经济发展和国力渐强形成的新的、甚至更为严峻的外交形势,使得我国科技对外开放的意义尤为深远。

作为欧洲最大的经济体,德国科技实力雄厚,众多科技成果在世界上处于领先水平。德国在基础科学与科技应用研究方面十分发达,主要工业部门有电子、航天、汽车、精密机械、装备制造等。中德双方在各领域的合作日益频繁,对许多重大国际问题形成共识,加强对德科技交流既是我国经济社会发展的需要,也具备良好的基础。人们越来越多地看到,国内企业大量参考德国技术资料,同时与德国企业开展技术合作。在这个过程中,德汉科技文献的翻译不可或缺。而新的科技发展态势也对德汉科技翻译提出了新的要求。单是自然科学与应用科学领域的词汇已达到天量,传统的人工翻译已难以满足科技文献因其较强的专业性而对翻译的有效性提出的较高要求,而计算机辅助翻译依靠强大的记忆、处理优势能够很好地弥补这一不足。

总是到了社会思变的时候,那些有前瞻力的人在苦闷的现实中四处碰壁后,他们渴望一把火烧掉陈腐,再塑新世界。今天的我们自然知道,六十年前这把火已经烧得干净了;可是今天的我们也要知道,如果不能以史为鉴吸取教训,自然会有新的火出现。

2 德语科技文献的特点

科技语言是一种概念性的精确语言,其主要功能是承载科技思想,记录科技信息,阐发、论证科技现象发生、发展的内在规律,促进科学交流与科技进步。科技文献作为存储和传播科技信息的资料,具有客观性、科学性、抽象性和概括性等特征。德语素以语法严密、结构严谨著称,科技德语尤其具有概念准确、逻辑缜密、行文简练、重点突出、结构严整等特点。从科技德语文献的句法结构来看,句式比较单一,变化不频繁,多为直陈式,较少出现虚拟、假设、探问等情况;而句子结构又十分严密,多采用扩展简单句与主从复合句,被动态的使用频率也比较高。构词方面则大量使用复合词、派生词等形式。

2.1 主从复合句

概率论作为大部分高等院校理工科、经济类专业本科期间唯一一门研究随机现象的课程,其思维方式独特,发展历史悠久,与科技前沿结合紧密,存在大量文献可以作为教学的辅助材料。笔者在概率论教学中尝试引入了文献阅读的方法,通过精心设计各个环节,取得了较好的教学效果。

科技语言中通常用较为复杂的语法关系来表达严密抽象的思维,通过对文本的研究可以发现,德语科技文献中主从复合句被频繁使用,甚至同一个句子中出现多重复合结构。句子以动词为核心,每个句子只有一个实义动词,其他成分通过名词化、介词短语或从句等手段组合,例如:

(3)Die Stromzufuhr ist unterbrechbar,wenn ein bestimmter Hitzegrad erreicht ist.

So findet man in den langen Ölleitungen im Orient die so präparierten Reinigungsschaber,die sich mit dem Öl durch die Leitungen bewegen,wenn sie sich irgendwo festgeklemmt haben,wieder,indem man mit einem Flugzeug,das ein Zählrohrträgt,die Leitung abfliegt.

此句为扩展简单句,介词短语unter Verwendung von festkernreaktoren充当了条件状语。

我国在电气工程中运用最普遍的技术是现场总线监控技术,这项技术具有高效性。这种技术是在电气工程实际应用的前提之下建立的,在各种不同的间隔中应用相对的技术方法。

(2)Die Stromzufuhr ist zu unterbrechen,wenn ein bestimmter Hitzegrad erreicht ist.

2.2 扩展简单句

使用包含分词、形容词、二格名词、同位语或介词短语等定语的扩展简单句也是科技德语中较为常见的句型,其功能在于用严密精确的语言阐明事物间错综复杂的关系。例如:

(2) DieFirmanimmtdiefürdamaligeBedingungenkaum zu überwindenden Geländeschwierigkeiten und Kosten in Kauf,um das Ziel zu erreichen.

因此,高等教育供给侧改革在技术向度上要充分地因应这种数字化教学的趋势。例如在微观教学过程中,要依靠新媒体教学实现“交互主体性”教学模式的实现,摒弃灌输式教育的思维;在教育资源“合作治理”方面,可以通过建立协同创新中心实现教育资源的在线共享;在培育个性化学生、满足教育需求的个性化问题方面,高校要加大投入和制度引导力度,通过各种差异化的“教育云桌面”或“教育APP”、微信公众号等数字化载体实现对学生个性化教育需求的及时回应。

(1)Unter Verwendung von Festkernreaktoren lässt sich ein spezifischer Impuls bis zu 800 Sekunden erreichen.

此句使用分词短语 kaum zu überwindend作为名词 Geländeschwierigkeiten的定语,使得表达更为简洁凝练。

2.3 被动句

科技文献注重说明推理,通常要求客观地、以非人称化形式叙述事物或行为的目的、过程、关联及结果。被动句具有隐藏行为发起者,突出动因,突显实意动词,使句子简洁紧凑等特点,因而在科技文献中被大量使用。但由于德语语法的复杂性,被动语态的句型并非单一易辨,而是以不同的形式出现。例如表达“当达到一定的热度时,电流输送就被切断了。”这个意思,就会出现以下种不同形式的被动句:

(1)Die Stromzufuhr wird unterbrochen,wenn ein bestimmter Hitzegrad erreicht ist.

此句为多重复合句,第一层关系是So findet man die Reinigungsschaber wieder,indem man...abfliegt,即由indem引导的方式状语从句,这部分主句的宾语受到die sich...bewegen这个定语从句的限定,同时主句还受到wenn sie sich...festgeklemmt haben这个条件状语从句的修饰,而indem这个状语从句中还包含了一个定语从句。这种空间嵌套排列的结构形式在汉语中是不存在的,后者句中的定语可以依次排列于中心词前,形成线性结构。因此,要将这段文字译成表达条理清楚,逻辑关系明确的中文,远比单纯对科技词汇进行翻译复杂得多。

2.2 实践工作坊的实施 “实践工作坊”要求多人参与,共同研习、共同合作操作。教师根据课程内容及大纲要求布置实践任务,各坊根据教师布置的学习任务进行研习与讨论,合作制定实验方案,协同完成实验,在实验完成后各坊展示实验产品,在展示过程中指出在实验过程中遇到的难点以及解决方案。展示完毕后,教师组织与实验课上其他工作坊对该实验方案的制定依据和实验过程中存在的问题进行讨论,并发表见解。经过几轮实验实训后,大部分学生会对果蔬加工工艺学有较为透彻的理解,实践操作水平大大提高,学生合作力、组织力、协调力、领导力等能力明显增强。

1.借助单位圆推到诱导公式二,特别是学习从单位圆的对称性与任意角终边的对称性中,发现问题,提出研究方法;

(4)Die Stromzufuhr lässt sich unterbrechen,wenn ein bestimmter Hitzegrad erreicht ist.

2.4 复合词

在科技德语的专业词汇中,复合词十分常见。复合词由两个及两个以上的单词或词组组合而成,构词形式多样,基本词通常为形容词、名词或动词等词性,如luftgekühlt(风冷的),Niveauregulierung(水平调整),reifenfressen(轮胎损耗)等,限定词可以是形容词、名词、数词、介词等词性。此外,科技德语中也包含多个单词的长复合词,如Gesprächskosten-abfrage(通话费用查询),Zündstromunterbrecher(点火电流切断器),Wechselbeanspruchungsfestigkeitswert(交变负荷疲劳强度)等。由于许多此类复合词并未收录于科技词典工具书或辞典类翻译软件,因而增加了文献翻译难度。

3 应用现状分析

翻译作为跨语言交际的实现手段,由早期相对机械的机器翻译,发展到当今计算机辅助翻译,反映了人工智能技术在翻译理论及实践领域的有效应用。我国计算机辅助翻译虽起步较晚,但已得到科技人员和翻译工作者的密切关注,同时在翻译实践中得以推广应用,在专业翻译公司内部的应用尤为广泛。

当前,机器翻译的主流思路,分为“符号进路”和“统计进路”两种。“符合进路”基于双语语料库的搭建,当系统触发到一个特定词汇,会形成与之相关的语义框架,并由此实现语义推理。就“符号进路”的机器翻译路径而言,需要编程员预先对大量双语语料对应关系及各个词汇自身的语义框架进行建模。而事实上,现有的翻译系统远未达到对整个科技语篇进行宏观把握的程度。“统计进路”主要由“深度学习”系统实现,其基本工作原理是,在亚符号层面上将语义对象解析为一个复杂的特征簇,进而通过精神元网络的多层次加工,从中逐层将高阶语义重新构造出来。由于允许系统对具有相似关系的语义作出模糊处理,“深度学习”在灵活性方面优于“符合进路”系统,但也必须具备大量的实例样本,以帮助其在源语词汇与目标语词汇之间搭建起具有一定相关性的关系簇。简言之,无论是对于何种翻译系统,实例样本的覆盖率在很大程度上决定了翻译的质量,即双语对齐的语料库越大,机器翻译结果的准确率就越高。

目前,能够应用于德语科技文献的网络翻译工具主要有:国外的Duden Online,PONS和国内的德语助手、迈迪德汉词典、灵格斯词霸、Leo、谷歌、百度在线翻译等。整体而言,几种在线翻译工具更加适用于进行词汇查找与简单句的翻译,难以应对科技德语中的复合词与较长的句子或篇章。能用于德语科技文献的相对比较成熟的计算机辅助翻译软件主要有Trados,Visual Transmate等。Trados比较适合专业人士使用,翻译功能比较强大,能提升翻译内容质量的一致性,有效降低翻译项目成本,但这个软件需要有人将待翻译内容和译文输入,过程非常繁琐漫长,所以普通用户使用起来相对困难。Visual Transmate的运行主要基于Microsoft Office插件方式,操作简易,并可以自动处理Word、Excel和PPT中的原有格式,但实例样本的覆盖率略显不足。

4 发展前景探究

机器能够击败最好的象棋手,但人工智能驱动的语言翻译尚无法达到令人满意的效果,如在2018年博鳌兖州论坛上,由腾讯公司提供的部分论坛的人工智能同声传译中,就暴露出不少问题和低级翻译错误。究其原因,主要在于语言规则本身的复杂性和灵活性。而源语与目的语若来自不同语系,比如汉语和德语这两种语言,实现其语言转换的条件则更为繁复。鉴于人工智能翻译应对科技德语文献的不足之处,未来人工智能翻译在很长时间内不可能完全取代人工翻译,为了弥补人工智能的不足,许多翻译技术公司已经在尝试开辟新的模式,如人工智能与翻译众包的结合,这也许是短期内科技德语文献机器翻译的发展趋势。

参考文献

[1]白春礼.21世纪科技发展趋势:跨门类科学与技术整合化[N].海南日报,2004-11-21.

[2]蔡玉兰.浅谈德语科技文献资料的翻译[J].中国科技翻译,1990(2):11.

[3]徐英瑾.从陆谷孙翻译智慧看人工智能的“正道”[N].解放日报,2016-8-2.

作者简介: 徐林峰(1981-),女,湖北黄冈人,上海应用技术大学副教授,硕士,研究方向:德语文学、翻译学。

收稿日期: 2019年3月15日。

标签:;  ;  ;  ;  

面向德语科技文献的人工智能翻译论文
下载Doc文档

猜你喜欢