祝贺召开全国语言文字工作会议(1)_语言学论文

祝贺召开全国语言文字工作会议(1)_语言学论文

祝贺全国语言文字工作会议召开(之一),本文主要内容关键词为:语言文字论文,会议召开论文,全国论文,工作论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

几点想法

展望21世纪,我们语言工作者都在思考如何为社会主义建设事业作出新的贡献。在汉语语法研究方面,我想到的是:

第一,无论是探讨汉语规范化问题,还是考虑词典的编纂问题,无论是研究中文信息处理问题,还是思量语言教学问题,都会遇到一种瓶颈现象,那就是如何实现词的切分。

关于这个问题,过去着重讨论“词是什么”,于是出现种种定义。今后应该研究“什么是词”,让理论的阐述与实际操作紧密地结合起来。从理论上讲,词的存在有客观依据,同时在一定范围内可以有人为的规定。如何使这个人为的规定合理合宜,正须群策群力加以探讨。依我看,应该制订三个词表:封闭性词表、半封闭性词表、开放性词表。

第二,词类问题仍旧是个热点。现代汉语词类的次范畴须进一步研究。一方面要发现新的次范畴,一方面对已有的次范畴要重新认识。单纯以意义为标准而缺乏形式标志的次类能不能成立,宜深入讨论。要建立两个新的词类系统,一是文言词类系统,一是便于机器识别的词类系统。建立这两个系统,关键在突破现有的词类框架。特别是后者,不妨大胆违背“常识”。

第三,在信息处理方面,光有了词表还不能解决分词的问题。歧义类型,消除歧义的方法有待进一步研究。这种研究可以先在特定的文体范围内进行,文学作品的语句切分工作宜稍缓开展。

第四,要编写一部或者几部系统描写现代汉语语法的著作,以适应国内外各方面的需要。丁声树等人编著的《现代汉语语法讲话》是1961年出版的,赵元任的《A Grammar of spoken Chinese》是1968 年出版的,两部著作的内容丰富,人们至今还常常引用。可是语言在发展,有些现象在改变,近二十来年的研究成果也有待整理,亟宜组织人力,编写出新的现代汉语语法专著。

重视宏观规划

增进中文信息处理和语言文字学研究的结合

加速国民经济信息化的进程

一、信息化社会的基本构成

集成电路是信息社会的细胞

通信网络是信息社会的神经

计算机是信息社会的大脑

信息资源建设是信息社会的血浆

人工智能技术是信息社会的营养

安全技术是信息社会的免疫系统

二、21世纪初信息技术的发展预测

1971年一块芯片集成2500个晶体管。今天产品级已达880 万个晶体管,且尚有提高潜力,将继续遵循Intel 公司的创始人之一的戈登·摩尔预测,集成在芯片上的二极管的数量将每两年增长一倍。

随着处理器芯片功能的增强,PC机功能也发生变化,预计2011年用0.1微米工艺,每秒处理10亿条指令。

2002年研制成100万亿(100Teraflops)超级计算机,20 年内研制成1000万亿次计算机。

网络计算成为主流,计算机走入千家万户。从网络上交换数据,到交换应用,到交换感受。

人工智能技术将有很大的发展

克服传统信息技术的“瓶颈”

由“计算”扩大到“算计”

由单维的数字化到多维(多媒体)信息处理

由基于逻辑到基于内容

由被动处理到主动处理

缩小了人与计算机之间的隔阂

由定量逐步实现定性与定量的结合

虚拟现实技术(灵境技术)使人能得到身临其境感

三、863—306(智能计算机)的战略目标

为智能应用研制高性能的计算机系统

为建立和谐的人机环境而努力

多媒体技术、多模式人机接口

网络计算环境

中文信息处理

各类智能应用系统

发展高科技,实现产业化

“顶天立地”的发展战略

四、在中文信息处理方面的主要工作

自1987年起,863 计划信息领域的智能计算机专题一直把智能化的中文信息处理作为重点课题,共累计支持:

语音识别与合成——24项

汉字识别——15项

机器翻译——16项

自动文摘——3项

其他(如基础理论等)——15项

通过全国评比(不仅仅限于863的项目),逐步选优。

五、主要体会

醒得不算晚——不走“五代机”的路,较早认识中文信息处理的重要性。

起得不算慢——许多重要课题在1987、1988年就立项了,在力所能及的情况下也有一定的支持面。

跑得不够猛——在组织规划上、经费支持强度上,在系统集成上,在推广应用上,在产品开发上,都未达到国家级的强度。

六、863计划信息领域近期内的设想

863以信息技术为先导

在信息领域内,以四大关键技术及产品为跨越发展的“龙头”

芯片设计技术

高性能信息网络

先进计算机

中文信息处理平台

(简称“一芯、一网、一机、一台”)

中文信息处理平台

面向中文的信息源建设的理论、技术及产品

汉语语音、文字(包括印刷体和手写体)的识别技术及产品

基于内容的智能化中文输入、校对和检索查询技术及产品

中文信息变换与编码技术及产品

机器翻译技术及产品等

构成中文信息处理平台及相应产品

七、建议

需求牵引、技术推动

面向信息化建设主战场,面向网络计算的挑战,面向中文信息处理的巨大市场

中文信息处理如何适应千家万户

信息系统的安全性是最关心的问题

实用(要“雪里送炭”)

特定领域的应用

以软补硬、精品集成

用理论的优势,争取领先和跨越发展(如机译系统等)

用算法的优势弥补芯片开发的劣势(如手写汉字识别、语音识别等)

用综合的优势实现精品集成,弥补投资强度的劣势(如 OCR、听写机等)

重视对中文信息处理的现代汉语词汇学的研究。汉语词汇学研究是中文信息处理一切其他课题和产品开发的基础。

汉语信息处理的困难

没有词的界限标记,需要解决词的自动切分

没有形态变化标记,难以分析词与词之间的句法、语法关系

词类划分和兼类情况复杂,词性自动判别和标注困难

汉语句子和语义层次的分析很困难

但又是中文信息处理一切其他课题和产品开发的基础

八、紧急呼吁

应加强领导和规划,尽早实现“宏观有序,整体最优”

是一项战略性计划,是国民经济信息化的基础

是一项系统工程,必须长远规划,逐步实现

是一个巨大的潜在市场,将兴起一大批新型的电子产业

九、小结

加强领导,制定中文信息处理国家性的计划;增强信息技术界和语言文字学界的联合;把我国的中文信息处理提高到新的水平;为促进我国国民经济信息化的进程而努力。

从信息技术革命看语言研究

白硕

一场深刻的信息技术革命正在迅速地改变着我们这个世界的面貌。在这场信息技术革命中,语言文字信息通过Internet在全球范围内的空前广泛的、不受地理距离约束的传播,恐怕是本世纪末给人印象最深的科技进展之一了。虽然由于种种原因,中国的老百姓目前还不能普遍享受到这一进展带来的实惠,但,率先接触到它的人都普遍认为,国民经济和社会生活的信息化,是一个不可抗拒的大趋势。

语言文字信息的数字化刺激了处理数字化的语言文字的技术和产业的高度繁荣。从文字的输入和简繁体的转换、语音的识别和合成、文字的识别和排版印刷、文稿的校对、语言文字信息的检索、过滤、订阅、文摘、分类、聚类、理解、生成和翻译,有一大批跨越信息科学技术和语言学的边界进行不懈探索的“两栖”型研究人员在这些领域脱颖而出。这些人明显的实用技术背景,给传统的语言研究带来了新的动力和生长点;这些人独特的知识结构和价值标准,也给传统的语言研究带来了研究方法上的新的冲击。

我们一些习惯于过去那种“做学问”方式的语言研究者往往认为:语言的内在规律性是独一无二地摆在语言事实里的,只要我们遵循语言事实,最后都会走到那个内在规律性上面去。谁做得越深刻,谁离那个内在规律性越近,谁的学问就做得越好。比如语义理论,当然是语义描述越精确、越细致、越能揭示表层结构与深层结构的潜在映射关系的就越有“水平”。

可是,作为一个处理数字化的语言文字信息的实用技术研究开发人员,我却不是这样看待语言的。我不认为语言有独一无二的内在规律。我认为,同样的语言事实,在不同需求背景的参照下表现出不同的规律——以母语教学、跨语言沟通、人机交互和全球信息互联为隐含的需求背景,看到的是不同的“内在规律性”!如果只是以母语教学为背景,我们恐怕至今还不会发展出像样的语法理论。如果只是把语言处理的主体局限在人类,更会把具有上千条语法规则的语法理论体系早就斥之为“烦琐哲学”了!过去往往从纯理论的角度探讨词与词组的界限,但在语言信息处理的许多实际应用中都须要处理一类结构紧凑的字串,如果严格抠定义的话,说它们是词也有问题,说它们是词组也有问题。难道这类结构紧凑的字串就没有什么“内在规律性”了?对Internet上语言文字信息的检索来说,语义的研究是非常需要的,但真正有价值的语义描述不是微观的句子一级的语义结构,而是更高级别的、可以直接说明一个完整文本的5W+1H(when,where,what,who,why,how)的宏观结构,而要对宏观语义结构有所把握,不一定非得先搞清楚微观的语义结构,完全可以有另外的途径。因此,不见得在一个隐含的需求背景下适用的学术价值标准也非得适用于另一个隐含的需求背景下的价值标准,不要用本身存在性都值得怀疑的独一无二的“内在规律性”的尺子去衡量不同需求背景下的研究成果,更不要因为一项工作从自己熟悉或偏爱的隐含需求背景看价值不大就轻率地从整体上予以否定。

信息革命使语言研究同高新技术之间形成了一种互相促进的关系。我深深地感到,我们今天所享用的许多产品和服务中都凝聚着语言研究的成果和语言学家的心血。我工作中的很多成绩也都得益于我所学习的语言学理论和我所接触的语言学家。同时,我也感到要想真正在与高新信息技术的结合中体现语言研究的价值,语言研究自身的价值标准一定要宽容和多元化,一定要透过学术主张看其背后隐含的需求背景。这样去想问题,可以最大限度地避免交流中的误解,增加相互的理解,寻找到更多的合作机会。

中西语言学的结合应以字的研究为基础

世界的语文研究有三大传统,即希腊—罗马传统、印度传统和中国的小学传统。每一个传统都有自己的研究重点。希腊—罗马传统是“主语—谓语”的语法结构和与此相关联的名、动、形的划分,重点研究词的形态变化。印度传统以巴尼尼语法为代表,重点研究构词法和语音。这两个传统的研究对象都是印欧系语言,而研究重点又呈互补的状态,因而随着资本主义的发展,它们走上了相互结合的道路,其最重要的标志就是历史比较语言学的诞生和发展。结合,这是语言学发展的催化剂,19世纪印欧语两大研究传统的结合使语言研究走上了独立发展的道路。19世纪末、20世纪初,以《马氏文通》的出版为标志,中国语言学也开始走上与印欧语研究传统相结合的道路,诞生了现代意义的中国语言学。但是,由于汉语的结构与印欧语存在着原则的差异,这一“结合”艰难而曲折,虽有成就,但语言研究的一些基本问题却始终得不到合理的解决。这说明,我们今天还没有找到一种有效的“结合”途径。百年来,中国语言学家在“结合”道路上的艰难摸索已经积累了丰富的经验和教训,需要我们去总结。这是21世纪发展中国语言学不得不考虑的一个重要问题。

中国的语言研究传统俗称小学,以字为基础研究文字、音韵和训诂,核心的问题是语义。我们没有印欧语研究传统的那种语法学。鸦片战争以后,西学东渐,我们学习西方语言学,自然就用印欧语的语法理论和方法来研究汉语,解决汉语研究传统中从来没有碰到过的主、谓、宾和名、动、形以及它们之间的相互关系问题。这样,语言理论和语言事实就产生了尖锐的矛盾,其中最突出的问题就是语言结构的性质和它的基本结构单位。汉语的结构核心是语义,传统小学的重大成就就是这种语义性的最好说明。印欧语的结构核心是语法,它的研究传统和其所取得的重大成就也为此作出了强有力的注释。用印欧语的语法理论来分析汉语以语义为核心的结构,自然难以解决汉语语法的基本问题,像主、谓、宾和名、动、形以及它们之间的相互关系,中国语言学家虽经艰苦探索,仍然困难重重,至今也没有找到一条可以摆脱困境的出路。这不是中国语言学家无能,也不是没有学习西方的语言理论,而是汉语结构的顽强抗议,要求语言学家改变他的研究思路,集中研究语义和语法结构的关系;汉语的语法必须以语义为基础建立它的理论和方法,不能照搬以形态变化为特征的印欧语语法理论。21世纪,我们需要建立汉语的语义句法学。

与语言结构的性质相联系的问题就是语言的基本结构单位。印欧语的基本结构单位是词,而汉语的基本结构单位是字,传统的小学就是以字为基础进行它的研究并取得重要的成就的。字的性质是形、音、义三位一体,听觉单位、书写单位、结构单位三位一体,其突出的特点是它的顽强的表义性。对字的认识,现在人们有一个很大的误解,以为字是写的,不是说的。否!字首先是说的,写的字只是把说的字书面化而已。“吐字清楚”“字正腔圆”的字是说的;七言诗、万言书的“言”就是字;你叫一个人说话说得慢一点,也只能叫他“一个字一个字慢慢说”,绝不会是“一个词一个词慢慢说”,不管是语言学的泰斗还是文盲,都是如此,绝不会有例外。这说明,字是汉语社团中具有心理现实性的单位,首先是说的,不能因形、音、义三位一体,听觉单位、书写单位、结构单位三位一体而模糊它的性质。确定一种语言现象是不是语言的基本结构单位必需符合三条标准:现成的,拿来就能用;离散的,很容易和别的语言单位相区别;在语言社团中具有心理现实性,即使是一个没有文化的老太太也能说清楚一句话中有几个结构单位。字是汉语中唯一符合这三条标准的结构单位。词是印欧语的基本结构单位,不是汉语的基本结构单位,因为“汉语中没有词”“按西方语言学家的眼光来分析汉语并确定像结构词这样的单位可能有用……,但这不是汉人想问题的方式,汉语是不计词的,至少直到最近还是如此。在中国人的心目中‘字’是中心主题”(赵元任,《汉语词的概念及其结构和节奏》);“‘词’在欧洲语言里是现成的……汉语恰恰相反,现成的是‘字’……汉语里的‘词’之所以不容易归纳出一个令人满意的定义,就是本来没有这样一种现成的东西”(吕叔湘:《语文常谈》)。前辈学者从他们的长期研究中总结出来的经验和结论对我们很有启示,说明“词”在汉语社团中没有心理现实性,也没有现成的、离散性的特点,即使是专家也说不清楚什么是词,“归纳不出一个令人满意的定义”。以“词”为基本结构单位来研究汉语,实际上已经离开了汉语的结构现实。至于语素,即使在印欧语社团中它也没有心理现实性,也没有现成的、离散性的特点,因而它的分离成为印欧系语言研究的一个难点。它是本世纪初叶才创造出来的一个概念,是词的一种构成成分,不是语言的基本结构单位,在汉语的研究中更没有它的地位,应该扬弃。

可能有人会就此提出这样的问题:先生,根据您的说法,《马氏文通》以来中国语言学与西方语言学的结合是不是错了,应该放弃?否!结合是中国语言学发展的必由之路,是中国语言学能否与国际语言学发展思潮相衔接的关键,问题只在于结合基点的选择。回顾百年来的结合历程,我们结合的基点基本上是印欧语的结构,用印欧语的理论、方法来分析汉语,因而在汉语的研究中产生了一种“印欧语的眼光”,把印欧语的一套结构原则强加给汉语。中国语言学家,从初期的模仿到用西方的语言理论、方法来分析汉语、到80年代语义指向的提出和运用,基本上都是顺着摆脱“印欧语的眼光”的束缚的方向发展的。在这一艰苦的探索过程中虽然取得了重要的成就,但还没有找到汉语研究与西方语言理论相结合的基点,因而也难以从根本上摆脱“印欧语的眼光”的束缚。90年代初,不同地区、不同层次、不同年龄的语言学家在相互没有任何联系的情况下差不多都不约而同地把目光转向字,提出汉语研究的字本位理论。这说明学术研究的客观条件已经成熟,要求语言学家根据汉语的特点来研究汉语。字是汉语结构的枢纽,是语音、词义、语汇、语法的交汇点,以字为本位来研究汉语,这是经过百年的探索、决心摆脱“印欧语的眼光”的束缚而向汉语的回归,是一种否定的否定的过程。中西语言学的结合的基点应该建立在字的研究基础上。这样,结合就不应该是套用印欧语的理论、方法来分析汉语,而应该是参照印欧语理论的立论精神从汉语的研究中提炼相应的理论和方法,使结合迈上一个新的台阶。印欧语的研究传统主要是语法,汉语的研究传统是语义,相互呈互补的状态。这为结合敞开了人们用武的大门。语义是语言最深层的结构,即使是印欧系语言的语法结构,也得以语义为基础。要实现两种研究传统的有效结合,就需要以语义为基础,为结合寻找一种结构框架,以便有效地处理各种不同性质的语言现象。

以字为基点,以语义为重心,吸收西方语言理论的立论精神,从汉语的研究中提炼相应的理论和方法,这应该是21世纪中国语言学实现与西方语言学相结合的一条根本途径。

语言学就是语言学

这次笔谈会的题目是“把语言文字研究全面推向21世纪”。《语言文字应用》编辑部要我就21世纪现代语言学研究发表意见。以下意见集中于这一领域,不涉及我并不了解的文字学。题目中并未出现“中国”两字。希望可以认为笔谈会的组织者和许多同行都接受以下观念:语言学和其他科学一样并不存在国界。这是一个巨大的、可喜的进步。语言学研究要在21世纪迅速发展取得成就,这一认识是先决条件。

笔谈会在中国举行,组织者是中国人,参加者大概也都是中国人,以促进语言学在中国土地上发展为目的,是十分自然和合理的。而要使语言学在中国土地上发展,这语言学必须是与国际接轨的语言学。说得更加正确些,必须是和其他国家土地上发展的语言学一样的科学。并不是不能说“中国的语言学”,但这一说法的意思只能是:在中国的语言学。我们也可以说“中国的生物学”,意思也一定是:在中国的生物学,而不可能指一种特殊的科学叫做中国生物学。生物学家当然可以研究某些只有中国土地上才有的动物和植物,例如熊猫,但是这种研究的性质、目标和方法是和研究其他生物一样的。没有人会提出“建立有中国特色的生物学”这类口号。语言学研究也一样。语言学家当然可以把研究对象限于汉语,中国人可以这样做,外国人也可以。研究结果必然会发现许多汉语和其他语言共同的规律,也必然会发现一些汉语与其他语言不同的规律。可以说后者属于汉语语言学,但是汉语语言学既不一定由中国人来研究,也不一定要在中国土地上研究。

无论从研究汉语出发还是从研究别的语言出发,都可以提出一些理论假说来解释人类语言的某些共性,就像遗传学的理论可以基于用豌豆做的实验,也可以基于用其他植物做的实验。某甲以汉语为材料对某一现象提出一个普遍的假说,某乙以另外一种语言为材料对同一现象提出另一个假说。甲和乙可以交流,可以辩论,可以竞争,最终应该是甲接受乙的假说或者乙接受甲的假说。如果甲的假说只适用于汉语,而乙的假说只适用于另一种或几种语言,那就都不是普遍性的理论。至于语言学的研究性质、目标和方法,更加不会是不同的语言各有一套。语言学就是语言学。如果还要提倡“有中国特色的语言学”,在21世纪就会落后于别人。

过去,在中国进行的汉语研究在许多方面不同于对其他语言的研究,甚至也不同于在中国以外进行的汉语研究。这很大程度上是由于历史、地理等原因造成的。还有一些其他原因,我认为比较重要的有三条:一是我们很少注意汉语以外的语言现象。欧美大学语言学系往往要求学生必须对非印欧语系的语言有些了解,甚至必须写篇有关的论文。外国人研究汉语的并不少,有一些也很有成就。二是学汉语的学生似乎不像学生物的学生那样,认为不会顺利阅读英文文献不能从事本专业研究工作。三是我国大学的学生很少学科学哲学,文科学生尤其如此。结果是甚至不知道就现代科学而言,仅仅记录现象、把材料分类等不能算科学研究。相信这几方面都正在逐渐有所改进。

21世纪是国际信息交流的时代,在中国的语言学家可以通过网络、传真、电子邮递等现代通讯工具迅速了解其他地方语言学家的研究成果;反之,其他地方的语言学家也可以迅速了解中国的语言学家取得的研究成果。先进的技术使世界的距离大大缩小了。相互访问,共同举办或参加学术会议的机会也大大增加。在这一方面香港回归祖国以后更便于起学术交流的桥梁作用。希望到了21世纪,在中国研究的语言学和研究汉语的语言学都融入世界语言学研究的潮流,相互学习,共同前进。

标签:;  ;  ;  ;  ;  

祝贺召开全国语言文字工作会议(1)_语言学论文
下载Doc文档

猜你喜欢