语料库语言学的发展与研究现状*_自然语言处理论文

语料库语言学的发展及研究现状*,本文主要内容关键词为:语料库论文,语言学论文,现状论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

1.0 引言

“语料库语言学已经成为语言研究的主流。基于语料库的研究不再是计算机专家的独有领域,它正在对语言研究的许多领域产生愈来愈大的影响。”这是J.Thomas等人1996年为祝贺语料库语言学的主要奠基人和倡导者G.Leech六十诞辰而出的语料库语言学研究论集的开场白。 近年来,对语料库语言学类似的评说频频见于导论和方法论的书及教科书中,它不仅仅是语料库语言学家们的自誉,而正在成为整个语言学界的共识。

2.0 语料库语言学的定义

关于语料库语言学的定义,现引述三例:

a.“根据篇章材料对语言的研究称为语料库语言学。”(K.Aijmer & B.Aitenberg,1991,p.1)

b.“基于现实生活中语言运用的实例进行的语言研究称为语料库语言学。”(T.McEnery & A.Wilson,1996,p.1)

c.“以语料为语言描写的起点或以语料为验证有关语言的假说的方法称为语料库语言学。”(D.Crystal,1991,p.86)

由上述几个定义可见,语料库语言学不是研究语言自身某个方面,而是一种以语料库为基础的语言研究方法。它实际上包括两个方面:一是对自然语料进行标注,二是对已经标注的语料的研究和利用的方法。从方法论的角度,它不仅可以用于研究语言系统的各个层面,而且可以应用于语言学之外的其他领域。

3.0 语料库语言学的历史发展

语料库语言学作为一种研究语言的方法,可以追溯到上个世纪,甚至更为久远。现在一般以乔姆斯基转换生成语法的兴衰时间为参照,将其发展大致分为以下几个阶段:

3.1 语料库语言学的早期发展

早期的语料库语言学指的是本世纪五十年代中期以前,即乔姆斯基提出转换生成语法理论之前的所有基于语言材料的语言研究。此类研究主要集中在以下几个方面:

(1)语言习得是应用语料研究方法较早且较普遍的领域。19 世纪70年代在欧洲兴起了儿童语言习得研究的第一个热潮,当时的许多研究就是基于父母详细记载其子女话语发展的大量日记的。据悉,这些日记作为原始材料,不仅是当时W.Preyer和W.Stern 等人的理论假说的依据,而且时至今日仍是许多学者的研究语料之一。自本世纪30年代以来,语言学家和心理语言学家提出了众多关于儿童在不同年龄段的语言发展模式。这些模式大都是建立在对儿童自然话语大量材料的研究分析上的。

(2)利用自然语料开展音系研究, 在西方当首推美国早期的结构主义语言学家,如F.Boas和E.Sapir等人。他们注重“野外工作”, 强调语料获取的自然性和语料分析的客观性。这些都为后来的语料语言学所继承和发展。

(3)方言学从其产生以来就与语料结下不解之缘。在西方, 方言学脱胎于19世纪的历史比较语言学,最初兴趣主要是研究运用直接法所获取的有关单音不同分布的事实来绘制方言地图。“方言研究者手持笔记本,后来是手提录音机,记下或录下他所遇到的一切方言材料。此种取样法至今仍为某些业余研究者所用,它对于研究方言词汇的分布有一定价值。”(Francis,1983:49—50)在我国, 运用语料的方法远至周秦。据应劭《风俗通义序》“周、秦常以岁八月遣輶轩之使,求异代方言”。我国汉语方言学第一部著作《方言》就是这种方法的产物。据载,扬雄非常喜爱方言,他利用考廉(略等于后代的举人)和士兵们集中在首都的方便,普遍地进行走访,不断积累材料,坚持编纂整理,经过27年的艰苦努力,终成《輶轩使者绝代语释别国方言》。

3.2 新的语料库语言学

1959 年, R.Quirk 着手建立“英语用法”语库( Survey ofEnglish Usage)。该项目旨在收集大量的风格题材各异的语料作为对英国英语口语和书面语进行系统描写的基础。 几乎与此同时, 以 N.Francis 和 H.Kucera 为首的一批语言学家和计算机专家汇集在美国的布朗大学合力攻关,并于1961年建成了当今最早的机读语料库——布朗语库(Brown Corpus)。这两个库可以说是现代语料库语言学的开端。

3.3 语料库语言学与乔姆斯基转换生成语法

50年代中前期,在实证主义和行为主义思潮的影响下,语言研究总体上是经验主义占主导,这种氛围无疑促进了对语料的重视,使其成为当时的热点之一。特别在美国,以Z.HaRRis等人为代表的后布龙菲尔德结构主义语言学家视语料为语言学的唯一研究对象。在他们看来,直觉证据是第二位的,是靠不住的,应该放弃。但是这种状况随着乔姆斯基1957年《句法理论》及其以后的一系列论著的发表被根本转变。笛卡尔主义的理性主义占据主导地位,经验主义几乎无立足之地,被视为经验主义产物的语料研究自然被完全否定。乔姆斯基及其转换生成语法学派否定早期语料研究主要有两点:

(1)语料研究的方向有误。乔姆斯基认为, 语言研究的主要目标是建立一种能反映说话人心理现实的语言认知模式,简言之,语言能力模式。因为只有语言能力才能对说话人的语言知识作出解释和描述,而语言运用只是语言能力的外在证据,它往往会因超语言因素的影响而发生变化,因此,它不能确切地反映语言能力。语料从本质上只是外在化的话语的汇集,基于语料的研究所建立的经验模式充其量只能对语言能力作出部分解释,因而语料不是语言学家从事语言研究的得力工具。

(2)语料的不充分性, 乔姆斯基在《句法理论》一书中首次发现英语短语结构规则具有递归性。这种递归性表明,自然语言的句子是无限的,而作为语料基本单位的句子的无限性决定了语料是难以穷尽的,换言之,语料永远是不完整的,不充分的。

转换生成语法学派的上述批评从根本上改变了50年代结构主义语言学的研究方向。在此后的近20年里,整个语言学界几乎唯直觉是从,唯思辨独尊,语料研究方法几乎名誉扫地。但是语料研究并未完全终止。除了R.Quirk和N.Francis等语言学家凭其非凡的学术勇气,顶着无形的压力,继续其研究项目并不断取得进展之外,另有十多项小的研究也在展开,特别是1975年,以J.Svartvik为首的一批语言学家汇集于瑞典的隆德大学,开始对R.Quirk语料的口语部分作韵律标注, 并最终实现了机读,建成了伦敦—隆德语料库(London—Lund Corpus )。 对此,G.Leech(1991:9)认为“作为英语口语研究的语料源, 它至今仍无与伦比。”上述项目的持续进行为80年代语料库语言学的复兴奠定了基础。

4.0 语料库语言学的复兴

在相对沉寂了近20年后,语料库语言学自80年代以来,迅猛发展,空前繁荣,主要表现是:

4.1 第二代语料库的建成

以伯明翰英语语料库为代表的一大批语料库80年代以来相继建成。这些机控语库,尽管规模、设计和研究目的各异,但大多采用了较新的KDEM(Kurzweil Data Entry Machine)光电符号识别技术, 使语料的编码和编辑得以从繁重的人工输入中解脱出来,大大加快了语料的标注处理,促进了语料的分析和利用,故称第二代语料库。根据美国加州大学伯克莱分校的语言学家J.Edwards1993年的不完全统计,80 年代以来建成并投入使用的各类语料库达50多个〔1〕,按语种分布如下:

英语 24 法语 4意大利语 2 丹麦语 2

德语 7

西班牙语 2芬兰语2 瑞典语 2

此外,还有葡萄牙语,南斯拉夫语和爱脱尼亚语等也都建立了语库。在这些语料库中,规模较大且特点较鲜明的有:

(1)兰卡斯特——奥斯陆/卑尔根语库(The Lancaster—Oslo/Bergen,简称LOB)。在G.Leech的领导下,70年代始建,1983年建成。包括五百个语篇,每个语篇约两千词。其数据模式与布朗语料库相同,但有其独到之处:可以比较不同的英语文体。

(2)法语语料库(Tresor de la Langue Francaise,简称TLF)。该库是法国国家科学研究中心与美国芝加哥大学的合作项目,语料包括从17至20世纪书面法语各种文体的两千个语篇,词汇量达到1.5亿,有关数据已制成光盘,并可通过UNIX软件系统查阅。

(3)赫尔辛基历史英语语料库(The Helsinki Corpus of Historical English)。该库是以M.RiSSanen 等为首的一批语言学家在赫尔辛基大学所建。语料包括自850至1720年这一时期的各类英语语篇, 并以每百年分段,词汇量达1.6千万。作为第一个历时语库, 它对于从社会语言学、方言学及语用学角度研究英语的变迁均具有重要作用。

(4)国际英语语料库(The International Corpus of English,简称ICE)。该库于1988年由伦敦大学学院英语系承建, 旨在为从事世界范围内英语的民族变体的比较研究提供数据。语料分别取自所有英语国家,并采用统一的分类和编码系统。每个国家的语料字数限定一百万,口语和书面语各占一半。语料取样时间限定在1990—1993年之内。语料采样对象为18岁以上接受英语教育成长起来的成年人。

4.2 基于语料的研究项目增多

大批语料库的建成极大地促进了基于语料的研究项目的迅速开展。下表的统计数字就充分说明了这一点:

1959—1991年语料研究项目统计表(据JohanSSon,1991:312)

起止年限研究项目数

1959—1965

10

1966—1970

20

1971—1975

30

1976—1980

80

1981—1985 160

1986—1991 320

事实证明,机控语库是开展大范围语言研究的极好料源,因为它所提供的语料较之先前的材料更具有真实性,其层级结构更加明晰,因而更有助于对语言的不同层面进行描写研究,更有助于对不同语体的比较研究和开展量化与概率统计研究。

上述的许多研究项目取得重要成果,有的深化了原有的研究,有的则是拓宽了原有的研究领域。如J.Svartvik(1996)和M.HaLLiday (1991)等人的概率语法研究;G.Tottie(1991)的英国英语和美国英语话语风格研究以及J.Sinclair(1985)等人关于英语搭配的量化研究等。

80年代以来英语语料库语言学复兴的原因,近年来多有评说,概而言之,主要有两条:

(1 )计算机科学的飞速发展与计算机技术的迅速普及和应用为语料库语言学的复兴提供了物质基础。80年代以来语料库语言学的发展进入了一个良性循环:计算机程序和软件的不断开发应用加快了语料库的建设,提高了语料的处理能力和层次;大量经过加注的语料的可得又促进了语料研究和利用;研究的深入转而又导致更为先进的研究方法和语言学模式的产生,许多先前需要人工处理的工作现在可以通过计算机程序及其软件自动或半自动地完成。在这一循环中,计算机显然是重要的一环。

(2)转换生成学派等对语料库语言学的批评和否定,经过20 年的实践验证,有的是错误的,如指责计算机分析语料是伪技术;有的是片面的,如对语料数据价值的否定;有的则是正确的,如乔氏关于自然语言无限性的观点。对于乔氏倡导的唯理方法,人们经过跟从、应用和反思之后,也逐步发现其不足,如其不可验证性等。因此,80年代以来语料库语言学的复兴,在很大程度上反映了语言学界的一种较普遍的心态,想要恢复语言研究中人工数据和自然数据的平衡。既然语料研究方法和内省的唯理方法各有所长,亦各有所短,为什么不让二者共存或结合使用,发挥其互补优势呢?为了达到这种有益的平衡,许多语言学家作出呼吁,如:

“语料研究在语言的理论探索中具有中心位置,对语料的开发途径很多,……并非一种。”(M.Halliday 1991,p.41)

“从科学方法的角度,语料研究方法是一种更为强有力的方法,因为其结果是可以验证的。”(G.Leech 1993,p.106)

即使像C.Fill more这样曾对语料库语言学有过诸多批评的语言学家,也对语料库语言学作出了颇为公允的表述:

“我不认为有这样的语料库:它能包括有关我要探究的英语词汇和语法领域的所有信息不论其有多大。……[诚然],每每有机会探查语料库,无论多小,总使我获得一些用其它方法无法得到的事实。我的结论是:两类语言学家相互需要。”(FiLLmore 1992,p.32)

5.0 语料库语言学的几个基本问题

5.1 语料与语料的标注原则

语料(corpus)一词源于拉丁语,本意为“躯体”(body)。其引伸的宽泛之意可指任意数量的语篇,但在当今语料库语言学文献中,语料并非语篇的简单堆砌或集合,它应具有以下几个基本特征:

(1)样本代表性 选取语料应考虑到广泛性和代表性。

(2)规模有限性 从理论上讲,语料的数量越多, 越具代表性,但鉴于语句的无限性及语言的不断变化,语料的收集是不能穷尽的,代表性也是相对而言。因此,从量化研究的需要出发,语料的规模应是有限的。当然这与语料库的开放性并不矛盾。

(3)机读形式化 机器可读是当今语料库最重要的特征。 与原始语料相比,机读化的语料有两大优点:首先便于检索,在书本形式的语料中查找某个词需逐页地查找,而使用检索软件,从上亿万的字符中调阅某一个或某几个词项只需几秒钟。其次是便于增补新的语言信息。

要实现语料的机读化,提高语料的利用价值,关键是语料的标注。对此,G.Leech(1993)提出了以下七条基本原则:

(1)所作标注可以删除,恢复到原始语料。

(2)所作标注可以单读抽出,另处存储。

(3)语料库使用者应该知道标注原则和标注符号的意义。

(4)在语料的使用说明或文件中, 应该说明标注是何人用何种方法所作。如,是人工标注还是计算机标注,是一人标注还是多人标注。

(5)应向用户声明,语料标注并非绝对无误, 它只是一种可能有用的工具。

(6)标注模式应不依赖于某一家之言,尽可能中立。

(7)任何标注模式都不能作为第一标准。即使有, 也只能通过实践在大量比较中形成。

语料的标注和语料的利用是一对矛盾。从用户的角度,语料标注得越详尽越好,而标注者则还需考虑标注的可行性。因此,任何标注模式都是在二者之间求得的一种妥协的产物。目前应用较为广泛的标注模式是OCP(Oxford Concordance Program)和TEI(Text Encoding Initiative),特别是后者, 被认为更能反映当前语料库语言学家致力于建立更具形式化的机读语篇信息编码国际标准的动向。 使用 TEI 模式标注的大型语料库包括单词量多达一亿的“英国国家语料库”(The British National Corpus)和语料取自多个英语国家的“国际英语语料库”。值得特别指出的是,欧盟已经建立了一个名为“语言工程标准专家顾问团”(EAGLES)的专门班子,负责检查对欧盟诸官方语言已作的编码和标注,进而建立具体的语料标注的欧洲标准,供今后欧盟资助的项目所用。该班子由许多专家工作小组组成,包括语料小组,词汇小组和计算语言形式化小组等。语料小组将特别关注可统一用于所有欧盟语言的标准标注模式。

5.2 语料的分析处理模式

语料的分析处理实际上就是人、计算机和语料数据之间的相互作用,简言之,人机对话。根据分析者的参与程度及分析者赋予计算机的分析深度,语料的分析处理有四种基本模式:

(1)数据检索模式(Data retrieval model)

计算机只对语料进行分类统计或只提供基本数据,具体的数据分析全由分析者完成。

(2)共生模式(Symbiotic model)

把语言学家的专业知识程序化并输入到计算机系统,计算机分析处理语料,分析结果反馈给语言专家。如有错误,语言学家对原有知识或程序或二者作相应修改,修改后的程序及分析系统再对语料进行处理。整个过程可图示如下:

由于这一处理过程实际上导致两个结果:业经改进的分析机制和业经分析的语料,因此称为共生模式。这一模式中,在人参与下,计算机与语料的相互作用是显而易见的:分析机制导致语料的分析,分析的语料又促进分析机制的改进或优化。但是无论在初始阶段,还是在反馈阶段,该模式均需要大量的人力参与。

(3)自行组合模式(Self—organizing model)

语言学家只提供分析系统的参数和软件,计算机分析数据并反复改进分析系统。该模式是L.R.Bahl等人针对共生模式之不足于1983年提出的,它可避免诊断及反馈阶段的人力参与。基本思路是训练计算机“学会”根据分析的数据改进语言模式。尽管该模式目前尚不能完全避免人力参与,而且只能在极少数大型计算机上完成,但是其前景喜人。随着计算机存储及处理能力的提高,自行组合模式将会更多地取代人力参与。

(4)发现程序模式(Discovery procedure model)

语言学家只提供软件,即赋予计算机程序编辑能力,计算机发现自己的分析类别并用其分析数据。此模式的应用目前只限于诸如根据词汇的分布发现特定语言的词性等简单的分析。结果表明,计算机的词性分类与传统语法的认定很接近。同时也发现,计算机对词的多重词性现象尚无法作出解释。

5.3 语料库的利用

“现代语料的巨大包容性及开发语料的种种手段的出现构成了深化我们对语言的认识和理解的强大力量。”(HaLLiday 1991:41—42 )语料的标注和处理模式固然重要,但是如何在具体研究中充分有效地利用两者则是关键之所在。目前已经展开语料研究的语言层面及其相关领域很多,以下所述只是语料研究成果较多的几个层面和领域的研究情况。

5.3.1 语料库与言语研究

语料库在言语研究中的作用有二:首先,语料能提供空前广泛的言语素材,使对口头语言的概括和对特定语言内方言变异的研究成为可能。其次,现代口语语料所提供的是自然的而不是人工诱导出的言语,这意味着语料研究更有可能反映实际生活中真正使用的语言的特点。此外,业经标注的口语语料不仅方便了对言语的单层面大规模量化分析,而且有利于研究不同语言层面间的相互关系。

利用口语语料库研究言语,目前主要集中在韵律层面。这些研究大致可以分为三种类型:

(1 )探究韵律的实质以及言语的韵律成分如何与其它语言层面相联系。关于语调群的分界有各种不同假说,口语语料的运用使得研究者能够用量化的方法根据实际数据验证上述假说是否成立,或用归纳的方法从语料中生成假说,然后用更新更多的语料作进一步的验证。

(2)探究韵律标注的基础。韵律标注产生的问题是, 所感觉并标注的韵律与言语的声学现实之间有无或有多大差距? 在此类研究中,Knowles(1991)发现, 不同的语言学家对同一语段的语调群界的感知差异很大。WichmaNN(1989)则发现不同的语言学家对降声调的感知也很不一致,并认为实际上并不存在真正的高低感知范畴。

(3)从韵律的角度探究语篇的类型。如WichmaNN (1989 ),对The Lancaster/IBM Spoken English Corpus 语库中诵诗和诵祷文两种言语行为类型进行了韵律分析,推翻了Crystal & Davy(1969)提出的高频率的平调是诵祷文的突出特征的观点,认为语调模式与言语行为类型不相关,而与受话人或听众的话语角色有关。

5.3.2 语料库与词汇研究

引述实例是词典编纂的传统,机读语料库的出现改变了词典编纂者利用语料的方式,他只需坐在计算机终端前就可以从数百万字的语篇语料中调出某个词或短语的用法实例。这不仅意味着词典的编纂和修订速度大大加快了,能及时提供新的语言信息,而且大量的自然语言实例会使词的定义更加完整和确切。

5.3.3 语料库与句法研究

句法是目前利用语料库开展研究最多的语言层面。这首先是由于语料标注和计算机检索手段的发展使得对句法的量化分析更为容易,越来越多的研究者试图通过量化分析对过去靠主观判断所论及的句法现象作出较为客观的描述。句法层面语料研究的空前繁荣主要是因为语料库已成为唯理语法理论和描写语法理论的交汇点。50年代以来形成的唯理和描写两种截然不同的研究方法,从80年代中期以来呈现出前所未有的相互交融,即出现了一大批难以简单归于上述两大研究传统的研究者。他们既不是通过内省的方法构建语法理论,也不是通过描写归纳生成新的语法理论, 它们致力于利用语料库验证唯理派的语法理论。 如在荷兰的Nijmegen大学以J.AArts为首的一批研究者,他们首先根据语言学家的内省及现有的语法描述设计了一套形式语法,将该语法装入计算机分析器在语料库中运行,以检验该语法对语料库数据的解释程度,然后根据所得语料分析结果修订语法。他们认为,这种研究方法可以探查出唯理语法能够在多大程度上解释语料库数据以及要完全解释这些数据需对其作多少修订。

5.3.4 语料库与语义研究

语料库用于语义研究主要有以下两点:

(1)语料库可用来为词项赋义提供客观标准,如Mindt(1991),他指出,在语义学中,词项和语言结构的意义往往是根据语言学家自己的直觉描写的,事实上语义区别是与句法、词法和韵律等上下文的语篇相关的,通过语料库来调查这些相关成分,可以找到特定语义区别的客观指示。

(2)语料库有助于建立语义的模糊范畴的梯度概念。 心理研究表明,认知范畴是存在模糊界的。语义区别作为一种范畴认知,实际上也不是绝对的,也是模糊界的。具体讲来,义项之间不是简单的包容与非包容关系,而是一种与包容比例相关的梯度关系。语料对于判断和揭示这种梯度的存在及其大小具有重要作用。

5.3.5 语料库与社会语言学

社会语言学作为一个经验研究领域,主要依赖于具体的语料数据。但是如何尽可能地减少数据的诱导因素,提高数据的代表性和自然性,一直是困扰社会语言学家的难题。大容量机读语库的启用为上述难题的解决提供了可能。利用语料库开展的社会语言学研究目前主要集中在语言与性别领域。

6.0 语料库语言学的发展方向及前景

对于语料库语言学的发展前景,特别是下一世纪的发展方向,近年来语料库语言学家多有论及。如J.Svartvik(1992)预测“计算机将运行更快,体积更小,价格更低;语料库将规模更大,质量更好,利用率更高”。T.McEnery(1996 )则认为语料库语言学今后的发展将主要受语料库规模、类型、国际关注和计算机发展等四方面力量的左右。基于语料库语言学的研究现状,总观各家之说,语料库语言学的发展方向将主要体现在以下三个方面:

(1)基础语料库的发展。90年代以来, 由于对民族语料资源价值的认识的深化,特别是在欧洲,许多国家的政府或学术机构从维护、发展和规范本民族语的角度纷纷投资建立大型语料库,如英国的国家语料库由牛津大学出版社牵头,参建单位包括兰卡斯特大学,英国朗曼出版有限公司和英国皇家图书馆等。再如,日本的教育科学文化部于1989年组织了三百多位各方面专家,历时五年建成了“日语方言语和数据库”(SCDJD),该库语料已制成22张光盘,其中言语库19张,数据库3张。这种建库势头仍将持续下去。鉴于大型语料库语料标注工作的滞后,有人认为今后一段时间还应着力发展小型专用语料库,例如M.Short (1996)为研究言语和思维的表达所建立的语体研究语料库。此外,口语语料库的发展应加大力度,以克服目前书面语料库和口语语料库发展的失衡,促进口语研究的发展。Wilson(1996)预测在不久的将来会有多媒体语料库问世。

(2)语料标注的发展。 语料标注是对语言进行多维多层分析的基础,而且此种分析并不仅限于原标注者,因而语料的有效利用在很大程度上有赖于语料标注的层次和质量。为此,G.Leech(1992)提出, 语料标注发展的着力点应主要包括:

a.把语料标注过程中所体现的语言分析图式文件化, 如JohanSSon(1982)的词类标定图式和Sampson(1987b)的语法分析图式。b.今后的分析图式应包括某种“会商”过程,使特定专业圈内感兴趣的成员之间进行磋商,以确保所标注的语料能为尽可能多的潜在使用者所使用。

c.不同分析图式之间应力求调和,即尽可能使用普遍认同的标签;图式与图式投射或部分投射时应提供已有信息。

d.目前语言各层面的标注发展很不平衡,发展较快的层面有词汇层,句法层,语音和音位层等;今后应重点加强语义层和语用层的标注。

(3)语料处理工具的发展。“作为一种独特而强大的技术工具,计算机使得这种新的语言学(语料库语言学)成为可能。”(Leech,1992a:106)语料库分析有赖于计算机环境的支持,即软件工具从语料库中检索数据并对语料进行处理。目前的软件工具尽管有了一定数量,但多数工具的文件化程度不够,且适用范围有限。

通讯地址:Copenhagen University

Engelsk

Institut,Njalsgade 80DK—2300,Copenhagen,Denmark

E—mail:xinshan@coco.ihi.ku.dk

注释:

*本文承蒙哥本哈根大学翻译与词典学研究中心主任C.DoLLerup 博士提供有关欧洲语料库网络的材料,特此致谢。

〔1〕有的语料库语言学家主张区分语料库(corpus )和语篇库(textbank),认为二者在规模、构成、使用目的及其代表性诸方面均有差异。本文未作严格区分。

标签:;  ;  ;  ;  ;  ;  

语料库语言学的发展与研究现状*_自然语言处理论文
下载Doc文档

猜你喜欢