西方语言产生研究中的几个主要问题_语义分析论文

西方语言产生研究中的几个主要问题_语义分析论文

西方语言产生研究中的几个主要问题,本文主要内容关键词为:几个论文,语言论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B842.5

1 前言

语言产生(说话)与语言理解、语言获得并列为心理语言学的三大研究领域,不过相对于心理语言学的其他两个领域而言,语言产生领域的研究最少[1]。虽然在日常生活中,说并不比听和读的频率低,而且人们也并没有花更多的时间在听和读上,但人们对语言产生过程和加工机制的研究仍然是最薄弱的[2]。人们在研究语言产生时感到困难的一个重要原因是,要对某个思想“如何说(即如何表达)”进行控制相对比较困难,毕竟人们可以用不同的语言来表达同一个意思。另一个原因是,语言产生不仅仅是提取出所需要的目标词汇并把它们说出来,还必须对所说出的词语进行合理的句法结构安排,否则别人就会不知所云。尽管语言产生研究的难度较大,但各种与之有关的语言现象,如语误、舌尖现象和语言表达过程中的犹豫、停顿等现象仍然引起了研究者的浓厚兴趣,尤其是近年来各种特殊群体在语言产生方面出现的加工困难更激起了大量对语言产生过程,特别是正常人语言产生机制的研究。本文将对西方有关语言产生研究中的研究进程、语言产生的基本过程、主要理论及其争论作简要介绍。

2 西方语言产生研究的传统

西方语言产生的研究有两个传统,其中一个是通过分析自然语误(日常生活中收集到的语误speech error材料)或在实验室诱发的语误所提供的信息来分析正常语言产生所需要的加工过程[2,3]。

在自然语误的研究中,收集语误材料的方法主要有3种,一是通过记录所有听到的、在自然发音过程中出现的语误材料来建立语料库;二是在一个较短的时间段中集中探测语误材料(没有把要分析的言语材料记录下来);三是先记录下言语资料(录音方式),然后再对这些录音资料进行逐句分析。前两种方法都容易遗漏掉许多不太易分辨的语误材料,目前建立语误语料库都是采用第三种方法。

Meringer和Mayer 1895年[4]通过记录所有听到的语误材料建立了第一个系统的语料库,这个库和由他们所提供的相应分析就是语言产生中语误研究传统的开始。他们首先区分了语义替换与语音替换两类语误,如美国总统福特在会见埃及首相时说"the great people ofIsrael-Egypt,excuse me"和"It is my great pleasure to prevent-I mean,present…",前者是一种典型的语义替换错误,即用语义相关词代替原词,而后者则是语音替换错误,即用语音相关词代替原词。另外他们还把语误分成了交换型(如left hemisphere被替换成heft lemisphere)、前置型(如a reading list被替换成a leading list)、后置型(如beef noodle被替换成beef needle)和混合型(如rat被替换成cat)等几种类型。许多研究者继承了这一研究传统,并在20世纪六七十年代掀起了真正的研究高潮。1973年,Fromkin出版了一本颇具影响力的语误研究论文集,并在其后附上了她所收集的语料库;另一个有影响的语料库也建立在70年代,即MIT-CU,通过对这个语料库的研究,Garrett发现词交换可以跨越短语边界,并在大多数情况下保留其语法范畴和语法功能(如,he forgot it and left it behind被替换成heleft it and forgot it behind),而忽略语法范畴的情况多发生在相近词上。Shattuck-Hufnagel[5]在此库研究基础上提出的扫描-复制模型首次涉及了语言产生中的语音表征。随后其他语程的语料库也逐渐开始建立并得到相应的分析。不过通过这种耗时的工作所得到的语误材料,对于建立语言产生模型所需的量化材料而言仍然是不够的,如Garnham[6]等1981年通过对20万个单词的资料进行分析,最后只得到了不足200条语误。而且也有研究者[7]对语误收集和鉴别的方法提出了疑问,认为语误识别过程中容易漏掉不易辨别的语误材料,基于这种数据得到的结论是有限的。正是由于这两个原因,一些研究者[8]开始在实验控制条件下有目的地诱发语误,并通过这种语误材料来推断语言产生的加工过程。

语言产生的另一个研究传统则是反应时研究范式。这个范式的方法准备起源于图形命名实验范式和stroop实验范式,前者被认为是一个标准的语言产生过程,而后者则被用来探测语言产生的时间进程。图形命名实验起源于1885年Cattel[9]对词和图的命名反应时差异的研究。Stroop实验范式则起源于1935年Stroop[10]的实验研究,他发现当词的书写颜色与词的意义不同,如用红笔写“黑”字时,颜色命名会被延迟,被试命名颜色“红”时严重受到词的影响,而对词的命名则没有受到词的颜色的干扰。Rosinski等首次把这个实验范式改成词—图干扰范式,对图形的命名需要忽略印在图形中的词的干扰。另一个范式就是命名词而忽略图形,不过研究者发现前者对语义更为敏感。Glaser和Dungelhoff[11]首次研究了词—图干扰范式中语义交互作用的时间进程,通过改变SOA,他们得到了不同SOA的图形命名、图形分类和词语命名曲线。另一个研究方法上的改进是Schriefers[11]等的听觉范式,这里干扰词成了不同SOA上呈现的听觉材料,这种词—图干扰研究成为目前语言产生研究的标准范式。

3 现代西方语言产生研究的范式

现代西方语言产生的研究从研究范式上看,主要有3种类型,一种是继承前面通过语误和反应时等行为研究(包括采用ERP)方法的传统,并发展出新的行为实验方法来进一步构建和检验所构建的语言产生模型。行为研究方法中除了继续采用自然和诱发语误推测语言产生的加工过程外,还在标准的词—图干扰范式上发展出许多新的研究变式。一种方法是采用内隐启动的方法,这种方法通过学习词对的方式进行研究,词对中的前一个词为启动词,后一个词则为目标词,被试的任务是在见到启动词后进行目标词的命名。一个反应序列中的目标词则分为同质类与异质类两种,同质类表示这个反应序列中的所有目标词均共有首音或者尾音,异质类则表示这一反应序列中的目标词之间没有上述关系。这种实验范式可以对语言产生中语音加工的方式进行研究,如Meiyer[12]在实验采用词对single-loner,place-local,fruit-lotus or captain-major,cards-maker,tree-maple,通过不同的组合可形成同质和异质两种反应序列。另一种类似的方法是采用符号命名,与内隐启动不同的是,在符号命名中学习的则是特定符号(如“++”)与词(如“土地”)之间的联接。这两种方法虽然突破了图片命名实验中图形实验材料的限制,但由于难以保证纯粹的语言产生过程(即语言产生应该是一个先有要表达的某种意图,然后找到相应的词条,最后提取相应的语音信息并组织发音的过程),而容易受到攻击。为了克服这一困难,一些研究者采用了翻译的方法,其中启动词是一种语言的词汇,而目标词则是另一种语言的对应词汇。因为双语研究发现熟练双语者进行语言之间的转换时需要有概念进行中介,所以通过选取合适的被试,可以获得相对有效的语言产生过程。如,Jescheniak等人[13]采用把英语启动词翻译成相应荷兰语的方法研究了语言产生中的频率效应。第三种研究变式则是对词—图干扰范式的改进,它不是对目标图形进行命名,而是对干扰字进行命名。它是在目标图形呈现后的不同时间点上呈现干扰字或者“?”号,被试看到干扰字时命名字,看到“?”时则命名图。为了保证一个相对完整的语言产生过程,即被试不是消极等待干扰出现后才决定是否对图形进行语言产生的加工,而是一看到目标图形就进行图形命名的准备,这种实验范式一般要求被试在较短的时间内完成命名工作,如果被试等待干扰符号才决定的话,是很难达到这个要求的。如Peterson等人[14]对语言产生中语义加工与语音加工阶段之间相互关系的研究就是采用这种研究方法。

第二种研究范式的类型则采用认知神经科学对病人的研究,通过利用失语症病人出现的语言产生困难和各种表征与加工之间的分离现象来推断语言产生所需要的加工过程,并用这些事实证据来支持或反对语言产生研究过程中建立起来的各种模型。在获得性语言障碍(失语症)的研究中发现了语言产生过程中大量不同类型的损伤与障碍,这些障碍不仅能够反映语言产生错误的类型,而且能够反映不同刺激特性(如词频、词长等)对语言产生的影响和语言产生中各种加工模块之间的分离。这些研究为语言产生模型的评估和发展提供了很好的手段。在失语症病人的研究中,其研究方法主要是通过各种命名、阅读和理解任务,观察不同病人在这些任务上表现出现出来的障碍状态,对语言产生中词汇系统的表征状态和加工过程进行推测。在这些任务中观察到的两种现象对语言产生的词汇表征状态有很大的贡献:通道特异性命名/理解障碍和范畴特异性命名/理解障碍,前者是指在命令或理解任务中出现的通道选择性损伤现象,如视觉物体命名很好但触觉命名损伤或者刚好相反的现象;后者则指病人在不同类型词语中表现出来的选择性损伤问题,如命名有生命的物体感到困难,但其他类型的词词则没有问题。这些现象表明词汇系统中的语义、语音、词形、句法等信息的表征可能是相对分离的,而且在不同的通道上,还存在通道特异性的词汇表征系统。这使得语言产生研究中在构建相应的模型时,对语言产生所需要的词汇系统和加工阶段的考虑就不得不对这些事实材料进行整合。

第三种研究范式的类型则是计算机模拟的方法,虽然计算机模拟的方式并不能够为我们的语言产生模型提供相应的经验证据,但是它可以通过对现有经验证据的拟和来为各种复杂理论的正确性提供证据。在语言产生的研究中,一般不存在独立于产生理论的计算机模拟,相反,在语言产生的两个大的理论争论阵营都将计算机模拟作为一种重要的理论支持方法。如Levelt(1999)[15]构建的WEAVER++模型和Dell(1997)[16]的激活扩散模型。这些模型通过对语言产生不同表征层内部和表征层之间的激活或抑制以及联接之间的权重关系进行表示,来模拟现有的来自于语误、行为实验和认知神经心理学研究中得到的经验证据。

4 语言产生的基本加工过程

目前的语言产生研究一般认为,语言产生过程大致可以分为3个层次,最高层次是概念化(conceptualization),此过程确立说话的意图和想表达的意思;中间阶段是言语组织(formulation),即将要表达的意图转换为相应的词汇概念并提取出来的过程;最后一个是发音过程(articulation),即用发音器官执行语音编码的过程。一个完整的语言产生过程可以分为这样几个部分:概念准备(conceptual preparation)、词条选择(lexical selection)、语音编码与音节化(phonological encoding and syllabification)、音位编码(Phonetic encoding)、发音过程以及加工进程中一定的监控机制。

概念准备:话语者想要表达的意义是由相应的词汇概念来表达的,而概念准备就是话语者所要表达的意义与心理词典中的词汇概念之间的匹配问题,这个概念必须对应心理词典中的词或词素。概念准备阶段存在一个视角的问题,同一个事物如“椅子”,可以被命名为家具、椅子和厨房椅子或其他什么名称。一般情况下其基础名称(椅子)是语言产生过程中最先得到提取的,同时这也取决于语境、语用等信息的制约。

词条选择:词条选择是对特定的词或词汇的选择。对于要表达的意图,通常会有许多相关的词汇被激活,而词条选择则是对目标词汇的选择。一般认为,在词汇概念和语音之间存在一个抽象的中间层lemma,它是每个词汇概念的句法信息包,目标词汇得到激活后,将会激活与自己紧密相连的lemma,因此词条选择在某种意义上说就是lemma的选择。它会给需要表达的概念正确的语法信息,比如性、数、时态等信息。

语音编码与音节化:前面主要涉及语言产生过程中的语义加工,从现在开始涉及语言产生过程中的语音加工问题。语音编码与音节化是指为所选定的词汇在特定的韵律环境下如何发音进行编码的过程,即所谓的lexeme的编码过程。它需要提取3个方面的内容,一是确定词的词形构成,如果是动词进行时就需要动词本身和一个ing形式;二是韵律信息,即目标词有几个音节,重音的位置等;三是语音成分(音素)。在得到这些语言信息之后就可以利用这些语音成分和相应的韵律结构,将这些音素插入到韵律结构之中,形成相应的音节,这个过程被称为音节化的过程。

音位编码:这个过程是对要发音的音节所需要的发音姿势进行编码和计划。一个目标音节需要有一个相应的发音姿势或发音动作来完成它,一般认为存在一个发音姿势库(syllabary),不过并不是每一个音节都能够在这个发音姿势库中找到相应的发音姿势,这个库是由常用的发音姿势所构成的,那些不常用的发音姿势或动作,则需要在音位编码中进行相应的规定。

发音过程:这个过程是在词汇语音加工之后,由它发出运动指令驱动发音系统来完成。发音系统不仅仅是由受肌肉控制的肺、喉和声带等部分构成,它还包括控制这个高度复杂的运动系统并执行发音功能的神经系统。

自我监控:在语言产生过程中,同时还包含一定程度的语音监控,这使得我们有时能够发现语言产生过程中的错误(即语误)。当然我们的监控系统也并不是完全有效的,不然就不会出现语误现象了。

5 语言产生的主要理论模型及其争论

目前的语言产生研究主要涉及两个问题,第一个问题与语言产生中语义和语音两个加工阶段之间的关系有关;第二个问题则是在语言产生的过程中,语法信息的提取是否必须,即语音的加工是否必须要有一个句法中介的问题。对这两个问题的不同回答,相应地形成三大理论模型:不连续两阶段模型(discrete two-stage model)[17]、交互式激活模型(interactiveactivation model)[1-3]和Caramazza(1997)[18]的独立网络(independent network)模型。前两个模型与第三个模型之间的区别主要在对第二个问题的回答上,而前两个模型之间的区别则在对第一个问题的回答上。

5.1 语义和语音加工阶段的关系

对于语义和语音加工的关系,它包括两个问题,一是非目标词汇的语音是否也能够得到一定程度的激活(如语义相关词的语音能否得到激活,这就是所谓的是否存在语音共激活现象);二是语音信息的激活能否向上反馈到特定的词汇表征层,即语义加工阶段和语音加工阶段是否存在交互作用的问题。

不连续两阶段模型认为不同的加工阶段以一种严格的分层和序列方式起作用,信息的传递是单向的,每个加工阶段仅接受前一个加工阶段传出的信息。语音激活是附随在词汇概念的选择上的,也就是说语音激活被严格限制在目标词汇上。尽管语义竞争词汇可能会在词汇概念水平被激活,但他们的语音表征并没有得到激活,也就是说并没有语音共激活现象的发生,只有目标词汇的语音才会被激活。交互式激活模型则认为在语义与语音两个加工阶段之间存在双向的信息流,心理词典中的概念—词汇系统(conceptual-lexical system)是一个交互连接的网络,来自外界的激活可以在这些固定的连接之间自由地传递与扩散。词汇通达由激活从概念输入节点向lemma(特定词汇信息表征层)节点开始传递,如同不连续两阶段模型中一样,不仅目标lemma被激活,其语义竞争者的lemma也会被激活到一定程度。接着,被激活的lemma将其激活扩散到与之相连的语音表征lexeme上,而这些lexeme表征在下一步中也会将激活回传至与之相连的lemma上。

Levelt等(1991)[17]采用听觉词汇判断任务,实验系统控制了听觉干扰词与目标图形名称之间的关系,如目标图形"sheep",其干扰词分别为:完全一致,如"sheep";语音相关词,如"sheet";语义相关词,如"goat";语义相关词的语音相关词,如"goal"和无关控制词,如"knife"。结果发现在SOA=73ms时,语义和语音干扰词均表现出抑制效应,而与语义相关的语音相关词(goal)则没有效应。研究者认为尽管目标词的语义竞争词得到了激活,但它的语音形式却没有得到激活,实验结果支持不连续两阶段模型。但Dell等人(1992)[2]则认为这种实验并不能证明语言产生中没有语音共激活现象的存在,而只是由于中介启动的效应非常小,在这种实验范式中不足以观察到语音的共激活现象,如果采用某种方式放大这种效应,就应该能观察到语音共激活现象。

Peterson等[14]通过在实验中使用一种特殊的材料,即同一幅目标图形同时存在支配性和非支配性两个名称,如图形"sofa"、也被称为"couch",前者为非支配性名称,后者为支配性名称来放大语音启动的效应。实验采用视觉呈现启动词的方法,被试的任务是命名启动词。结果发现在支配性名称和非支配性名称上获得了相同的语音启动效应,只是在一个非常晚的时间点上,语音启动效应才被限制在支配性名称上。这被认为是两个可选名称在语音上均被激活,只是在词汇通达过程的很晚阶段即在命名刚启动时非支配性名称的激活才被抑制,实验结果支持了交互式激活模型,认为在语言产生中存在语音共激活现象。不过Levelt等(1999)认为这个实验并不能说明语言产生中非目标概念的语音也得到了激活,理由有两个:一是此效应仅在这种特殊实验材料中发现;二是在这种实验条件下,目标图形的两个名称有可能同时得到选择,从而出现语音共激活现象。

为了检验语义加工和语音加工阶段是否存在交互作用的问题,Starreveld等(1995)[19]在实验中采用词—图干扰的图形命名技术,结果发现语义干扰条件下图形的命名时间延长了,但当语义干扰词与目标语音之间存在形似时,语义干扰效应被显著降低了。Starreveld将这个实验结果解释为在语音和语义加工之间存在交互作用,不过,Levelt等(1999)反驳说,由于存在词形到语音之间的转换规则,词形相似能够导致目标语音的部分激活,加快语音的提取,从而降低语义的干扰效应,而不是由于语音与语义加工之间的交互作用所致。

一些研究者采用语误材料来研究语言产生两个加工阶段是否存在交互作用的问题。语误研究发现,在语误中有两种现象,一是语误的词汇偏向(lexicality bias),目标词发生语误时,最后所发出的语音可能是词,也可能是非词,词汇偏向是指语误词是词的可能性大于几率水平。交互式激活模型能够很好地解释这个现象,由于在语音和语义层之间存在交互作用,因此,来自语音表征的激活可以反馈到语义表征,使那些包含部分目标语音的非目标词的激活程度更高,因此它们得到选择的机会将高于没有词汇表征层的非词。不过,Baars等人[20]的诱发语误实验研究发现,并不是语误产生时必然发生词汇偏向,在他们的实验中就没有词汇偏向的出现。另一种现象则是混合型语误问题,如shirt被替换成skirt,snake被替换成snail。这种语误类型的发生,也是高于几率水平的。对于混合型语误,交互式激活模型同样也能够很好的进行解释。然而这种现象并不排除不连续两阶段加工模型,在两阶段加工模型中,通常有一个“编辑者editor”对语误进行检查的机制,但这种机制对于真词就可能会有很大遗漏。

来自认知神经科学的证据也是有矛盾的,首先就在于对词汇偏向现象是否相对稳定地存在于失语症患者身上还存在着许多争议[19,20]。同时在许多失语症病人身上发现他们在语言产生过程中存在许多与目标词语音相关的真词,但这种现象在交互式激活模型中并不能得到很好的解释。而采用编辑者机制的不连续两阶段加工模型也预测在所有的失语症病人身上都会出现同样的词汇偏向现象(如果编辑者未受损害的情况下),但这与实际观察到的现象也不符合。Rapp和Goldrick(2000)[21]认为语言产生模型要整合这些来自认知神经科学的资料,至少需要两个加工机制:一是允许语义竞争词的语音也得到相应的激活,这样混合型语误的出现就可以高于几率水平了;二是允许语音表征的激活向语义表征的反馈的存在,其实这两个加工机制在现有的产生模型(如交互式激活模型)中都已经有了,尽管交互式激活模型能够较为自然地解释这些现象,但它并不能排除不连续两阶段模型对这些现象的解释。对于语音编码中是否存在语音共激活现象,语误研究和认知神经科学对此还比较难以分清。

5.2 关于句法中介的问题

对于语言产生研究中的第二个问题,即有关句法中介的问题是区分独立网络模型与其他两种模型的关键。独立网络模型认为从词汇语义就可以直接通达语音节点和词形节点,并进行相应的输出,没有必要通过句法中介节点(lemma);而不连续两阶段模型和交互式激活模型则认为句法中介在语言产生中是必须的。

Schriefers(1993)[22]让被试在实验中用短语描述涂有颜色的物体图片,在荷兰语中冠词需要根据名词的性来决定,当干扰词与图片物体句法所要求的性一致时,则能够加快图片命名的速度,实验结果获得了名法一致性效应。不过Lescheniak(1994)[23]随后在研究中发现,当被试不需要提取冠词时,句法一致性效应则消失了,这表明句法信息在语言产生中并不是必须的,除非我们的实验任务要求被试提取句法信息。

来自舌尖现象(TOT)的证据显示,在TOT状态中提取语音信息出现了失败,但还是能够提取包括词汇语义、语音和句法的部分信息。采用对罕见词定义的方法,Miozza等(1997)[24]在实验中发现被试能够比较准确地报告目标词汇的句法信息和部分语音信息,这表明句法信息和语音信息在语言产生中是相对独立的,对一种信息的成功提取并不依赖于对另一种信息的提取。

Badecker等(1995)[25]对失语症病人的研究也发现句法和语音加工的相对独立性,在病人Dante身上发现其理解和书写能力保存良好,但命名能力很差。在对一幅目标图命名失败后,Dante没有任何有关目标图形的语音和词形信息,但在对目标图形的句法性进行选择时却非常准确。这些材料也表明句法和语音信息在语言产生中是可分离的,不过对于是否需要句法信息作为语音加工的中介,研究者认为还需要做进一步的研究。

从以上的分析可以看出,不但在实验研究中还存在着激烈的争论,而且要在语误分析和反应时模型之间达成一致也还尚需一段时日。目前本领域的研究工作除了试图对这两者进行整合之外,还在努力整合来自认知神经科学的研究成果,期望通过多维的研究,对语言产生的基本过程和各个层次在语言产生过程中的关系有一个相对一致的看法。

标签:;  ;  ;  ;  

西方语言产生研究中的几个主要问题_语义分析论文
下载Doc文档

猜你喜欢