汉语双音节同音词词汇歧义消解过程研究_语义分析论文

汉语双音节同音词词汇歧义消解过程研究_语义分析论文

汉语双音节同音词词汇歧义消解过程的研究,本文主要内容关键词为:同音词论文,汉语论文,歧义论文,词汇论文,过程论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

分类号 B842

1 引言

词汇歧义(lexical ambiguity )是语言中的一个比较普遍的现象。例如,汉语口语中有一些发音相同,但意义不同的词,书面语中有一些字面相同,但意义不同的词,这两类词分别称作同音词(homophones)和同形词(homographs)。当人们孤立地听或看到这些词时,会在理解上产生歧义。例如,听觉呈现的双音节词/falyan2 /对应着“发言”和“发炎”两个不同的意义。然而,当在语境中听到同音词,例如,在句子语境“全场顿时变得安静起来,因为现在已经开始……”中听到同音词/falyan2/时,词的意义是明确的, 表明语境在词汇识别中起了作用。词汇歧义消解研究中长期争论的焦点问题是,听者或读者如何确定歧义词的符合语境的意义,即在词汇识别早期,听者或读者是选择性地只通达歧义词的一个意义,还是同等地通达两个或多个意义。合适的句子语境无疑会起到帮助作用,问题是,这种作用是在词汇识别之前就发生(因而语境较早地参与歧义词意义通达过程),还是在词汇识别之后的整合阶段发生(因此语境只是起到选择的作用)[1—5]?

近年来,研究者对词汇歧义消解问题作了大量的探讨,取得了不少有意义的成果,但迄今为止,不同研究的结果之间仍然存在很大分歧。一些研究发现,当歧义词与探测词呈现的时间间隔(stimulus

onsetasynchrony,简称SOA(注:SOA这一概念主要用于视觉呈现启动刺激和目标刺激的实验。))较短时,即使是在有句子语境的情况下,歧义词的两个意义也都得到激活,然而,当SOA较长时, 只有符合语境的意义才得到激活[3]。这些结果支持了多重通达模型(multiple

accessmodel),即无论歧义词各个意义的相对频率如何, 也无论是否提供句子语境,在歧义词识别的早期,其多重意义都得到激活,因此,句子水平的信息并不影响词汇通达。然而,也有研究表明,即使是在SOA 很短的情况下,也只是符合语境的意义才得到激活[6]。 这些实验结果支持了选择通达模型(selective access model),即在歧义词识别早期,只是符合语境的意义才被通达,这样,句子水平的信息能够较早地参与歧义词意义通达过程。此外,还有一些研究表明,在更短的SOA 条件下,歧义词的两个意义的激活程度受它们的相对频率的影响,在激活的时序上主要意义先于次要意义[5,7,8]。 这样的结果符合重排序通达模型(reordered access model)的预期,即歧义词的各个意义按相对频率的高低顺次激活,句子水平的信息通过提高歧义词符合语境意义的激活水平来影响意义通达。

在人类自然语言理解研究领域,词汇歧义消解的时间进程引起了研究者浓厚的兴趣和广泛的关注,最主要的原因在于,这方面的工作有助于了解人类语言加工系统的一般机制,特别是有助于探讨认知心理学中一个更大的理论争论,即不同水平的心理加工是相互作用的还是模块化的[9,10]。 句子语境较早地参与歧义词意义通达过程的发现将为相互作用理论提供证据,而句子语境只影响词汇通达后的整合过程将提供证据支持模块化理论。

到目前为止,有关词汇歧义消解的研究主要是在英语中进行的。我们注意到汉语语言学界所公认的一个事实,即西方语言的同音词很少,而汉语的同音词很多,辨析同音词是汉语语音处理的关键,因此,非常需要有关这方面的汉语认知角度的研究。Li和Yip 曾使用跨通道启动范式,以母语为广东话的人为被试,考察了句子语境对汉语单音节同音词意义通达和选择的影响[11—13],结果表明,句子语境在同音词识别的早期就起作用。本研究系统地考察了汉语双音节同音词意义通达的时间进程以及句子语境对意义通达的影响。我们使用跨通道语义启动范式和词汇判断任务,在两个实验中分别探讨在无句子语境(实验一)和有句子语境(实验二)的条件下,同音词意义通达的时间进程。我们采用了两种探测的时间点,一是在同音词词尾点立即呈现视觉探测词,即听觉词词尾点和视觉探测词起始点之间的时间间隔(interstimulusinterval,简称ISI(注:ISI这一概念主要用于听觉呈现启动刺激,视觉呈现目标刺激的实验。)为0毫秒。 考虑到在一个口语词的词尾结束之前被试就能识别这个词[14,15],我们还设置了ISI为-150 毫秒的条件,即在大约位于双音节同音词第一个音节已经结束,第二个音节的辅音刚好出现的时间点上呈现视觉探测词,目的是观察同音词识别的更早阶段,其意义通达的情况以及句子语境在其中所起的作用。另外,我们使用了主要意义与次要意义频率相差悬殊的同音词作实验材料,以探讨歧义词意义的相对频率在歧义词意义通达中的作用。

2 实验一

2.1 方法

2.1.1 被试 80名北京师范大学本科生。 这些被试裸视或矫正视力正常,没有任何言语或听力障碍。实验后每名被试均获少量报酬。

2.1.2 设计与材料 实验一主要探讨三个因素的作用, 第一个因素为探测词类型,即探测词与同音词的主要意义有关和与同音词的次要意义有关;第二个因素为启动词类型,即启动词与探测词有关和与探测词无关; 第三个因素是启动词词尾点与探测词起始点的时间间隔, 即ISI为0毫秒和ISI为-150毫秒。前两个因素为被试内因素,后一个因素为被试间因素(因此,80名被试根据随机分派原则分成两组,每组40名,分别参加ISI为0毫秒和-150毫秒两种不同条件的实验)。

首先,我们选择了200个同音词,这些同音词有以下特点:第一, 每个同音词只对应两个词条,如/falyan2 /只对应“发言”和“发炎”;第二,每个同音词所对应的两个词条都是常用词;第三,每个同音词所对应的两个意义完全不同,如/falyan2 /所对应的“发言”和“发炎”,意义完全不同。为了确定同音词两个意义的相对频率,我们进行了一个集体听写测验,要求31名本科生迅速写下所听到的每一个词。最后确定了12个主要意义与次要意义频率相差悬殊的同音词,在所有被试写下的两个词条中,5 名以下被试写出的词条为歧义词的次要意义,25人以上写出的词条为歧义词的主要意义。第二步,为了确定语义有关的探测词,我们对与同音词的两个意义语义相关的词进行了评定,即要求44名本科生在9 点量表上分别对启动词与探测词的语义相关进行评定。最后确定了24个探测词,其中12个在语义上与同音词的主要意义高相关(平均等级大于8),另外12 个在语义上与同音词的次要意义高相关(平均等级大于8)。这样, 每个同音词都有两个相应的探测词(分别与同音词的主要意义和次要意义有关)。为获得精确的启动效应,探测词在语义有关和语义无关条件下是完全相同的。此外,我们另选了24个词作控制条件下的启动词,这些词与同音词的主要或次要意义在频率上匹配,但在语义上则没有任何关系(见表1)。

表1 同音词两种意义的语义启动实验材料举例

材料类型 启动词(听觉) 探测词(视觉)

有关 /dian4yuan2/(电源) 开关

无关 /lun2tai1/(轮胎)开关

有关 /dian4yuan2/(店号) 伙计

无关 /chan3pin3/(产品)

伙计

将48对实验材料按拉丁方分成两组(这样每组有24对材料),分组的目的是保证同样的启动词(如“dian4yuan2”)或同样的探测词(如“开关”)不出现在同一组材料内。例如,如果“dian4yuan2—开关”和“chan3pin3—伙计”出现在第一组材料中,那么,“lun2tai1 —开关”和“dian4yuan2—伙计”只能出现在第二组材料中。实验时,每名被试只接受其中一组材料。为了在词汇判断任务中平衡被试的“是”和“否”两种反应,除了关键材料以外,另选择探测词为假词(如“位带”、“汤自”)的24对填充材料,其中,一半的材料以其它一些同音词为启动词,另一半的材料以无歧义的词为启动词。这样,每名被试共接受48对材料,其中有24对关键材料和24对填充材料。每个被试共做48次词汇判断,其中真假词汇判断各半。

2.1.3 仪器和程序 实验使用跨通道语义启动范式。 听觉和视觉刺激的呈现分别由Vmaster和Dmaster系统控制。听觉启动词事先由一名讲标准普通话的研究者按正常的速度用数字录音机录好,然后经A/D转换存储在计算机硬盘上。Vmaster的作用是控制声卡输出听觉刺激, 同时向Dmaster输出控制信号, 以精确控制听觉启动词的词尾点与随后呈现的视觉探测词的起始点之间的时间间隔,即控制ISI为0毫秒或- 150毫秒。实验时,被试坐在距显示器约50厘米处,左右两手的食指分别放在反应盒的“否”和“是”两个键上,指导语要求被试通过耳机听听觉呈现的启动词,同时通过按键尽可能快和准确地对计算机屏幕上所出现的汉语双字词作“是”或“否”的词汇判断,即判断这些词是否是真词,如果是真词,就按反应盒的“Yes”键,如果是假词,则按“No ”键,计算机自动记录被试按键的反应时间和错误率。正式实验前,每个被试先做12次练习。整个实验大约持续15分钟。

表2 无语境条件下同音词主要与次要意义的语义启动

(毫秒)

材料类型有关无关 启动量

ISI=0毫秒

主要意义570 605 +35

次要意义580 621 +43

ISI=-150毫秒

主要意义504 542 +38

次要意义513 552 +39

2.2 结果与讨论

我们首先计算了所有被试在各种条件下对探测词正确反应的反应时平均数,并计算了语义启动量,结果如表2所示。从模式上看, 语义有关时探测词的反应时均短于语义无关时探测词的反应时。

首先对ISI为0毫秒条件下的启动效应进行分析。本研究的主要目的是通过测量有关与无关两种条件之间反应时的差异,即启动效应,来考察各种条件下同音词主次两种意义的通达情况。因此,我们对表2 中的反应时平均数作了有计划的成对比较(planned pairwisecomparisons),这种比较实际上是实验开始之前就计划好了的, 故称之为“有计划的”。结果表明,当探测词与同音词的主要意义有关时,语义启动量为35毫秒,差异显著,t(39)=2.067,P<0.05; 当探测词与同音词的次要意义有关时,语义启动量为43毫秒,差异也显著, t(39)=2.231,P<0.05。这些结果说明,当ISI为0毫秒时,孤立呈现的同音词的两个意义都得到了激活。

进一步对ISI为-150毫秒条件下的启动效应进行分析。结果发现,与ISI为0毫秒时类似,无论探测词与同音词的主要意义有关还是与同音词的次要意义有关,启动效应量均达到显著水平,与主要意义有关时,t(39)=2.122,P<0.05;与次要意义有关时,t(39)=3.59,P <0.01。可以看出,孤立呈现的同音词在加工的更早期,其主要意义和次要意义也都受到了同等水平的激活。四种条件下同样的语义启动结果模式表明,在无语境的条件下,汉语双音节同音词的听觉加工具有多重激活的特点,或者说同音词两个意义的激活并未受其相对频率的影响。然而,如果当同音词出现在句子语境中,这种多重激活现象是否依然存在?这是一个更有理论意义的问题。实验二将主要探讨这一问题。

3 实验二

3.1 方法

3.1.1 被试 另外80名北京师范大学本科生参加了实验二。 这些被试裸视或矫正视力正常,没有任何言语或听力障碍。实验后每名被试均获少量报酬。类似于实验一。这80名被试也按照随机分派原则分成两组(每组40名)。

3.1.2 设计与材料 实验二采用类似实验一的设计, 探讨四个因素的作用,其中三个因素,即探测词类型,启动词类型,以及启动词词尾点与探测词起始点的时间间隔,与实验一完全相同。第四个因素是语境类型,即语境一致(语境所启动的同音词的意义与探测词所探测的同音词的意义一致)和语境不一致,它属于被试内因素。

首先,用实验一中的同音词造句,每一个词造两个句子,句子均由两个分句构成,同音词总是处于第二个分句的句尾。句子语境或者支持同音词的主要意义,或者支持同音词的次要意义。将句子按拉丁方分为两组进行预测,40名本科生参加了这项预测,这些被试每人只接受两组句子中的一组,他们的任务是认真听句子,然后写下每个句子的最后一个词。最后确定24个实验句,其中一半支持同音词的主要意义,另一半支持同音词的次要意义。实验二中的探测词均来自实验一,即探测同音词的主要意义或次要意义。语境类型与探测词类型形成四种组合,即探测主要意义且语境一致(句子语境支持同音词的主要意义),探测次要意义且语境一致,探测主要意义且语境不一致(句子语境支持同音词的次要意义),探测次要意义且语境不一致。为了精确测定启动量,我们为每个语义有关的实验句配置了语义无关的实验句作为基线,并且保证两种条件下句子语境完全一样,探测词也完全相同,只是句尾的启动词不同。例如,在表3中,有关与无关条件下唯一的差别是句尾词, 分别为“发言”和“放映”。

表3 句子语境中同音词两种意义语义启动实验材料举例

语境种类(听觉呈现)

探测主要意义且语境一致

有关全场顿时变得安静起来,因为现在已经开始发言/falyan2/

无关全场顿时变得安静起来,因为现在已经开始放映/fang4ying4/

探测次要意义且语境一致

有关医生给病人开了些针药,因为现在已经开始发炎/falyan2/

无关医生给病人开了些针药,因为现在已经开始降温/jiang4wen1/

探测主要意义且语境不一致

有关医生给病人开了些针药,因为现在已经开始发炎/falyan2/

无关医生给病人开了些针药,因为现在已经开始降温/jiang4wenl/

探测次要意义且语境不一致

有关全场顿时变得安静起来,因为现在已经开始发言/falyan2/

无关全场顿时变得安静起来,因为现在已经开始放映/fang4ying4/

探测词(视觉呈现)

探测主要意义且语境一致

(讲话)

(讲话)

探测次要意义且语境一致

(化脓)

(化脓)

探测主要意义且语境不一致

(讲话)

(讲话)

探测次要意义且语境不一致

(化脓)

(化脓)

将全部48个实验句按拉丁方分成两组,使同一启动词、同一探测词在同一组材料内只出现一次,每名被试接受其中一组材料的测试。另选24个句子做填充材料,其中,一半的句子中,句尾启动词为其它一些同音词,另一半的句子中句尾词是无歧义的词,探测词均为假词。这样,每名被试共接受48个听觉句子,其中24个实验句和24个填充句。每个被试共做48次词汇判断,其中真词、假词判断各半。

3.1.3 仪器和程序 实验方法和仪器基本上类似于实验1。只有一点区别,即被试通过耳机听到的是句子而不是孤立的词。整个实验大约持续35分钟。

3.2 结果与讨论

计算所有被试在各种条件下对探测词正确反应的平均反应时,并计算启动量,结果如表4所示。

表4 句子语境条件下同音词主要与次要意义的语义启动 (毫秒)

条件 有关 无关 启动量

ISI=0毫秒

探测主要意义且语境一致545573 +28

探测次要意义且语境一致567600 +33

探测主要意义且语境不一致 553572 +19

探测次要意义且语境不一致 600617 +17

ISI=-150毫秒

探测主要意义且语境一致581616 +35

探测次要意义且语境一致613610

-3

探测主要意义且语境不一致 586606 +20

探测次要意义且语境不一致 631639

+8

对ISI为0毫秒条件下,语义有关与语义无关的探测词反应时之间差异进行有计划的成对比较,结果表明,在探测主要意义且语境一致和探测次要意义且语境一致两种条件下,语义有关的探测词的反应时都短于语义无关的探测词的反应时,语义启动效应分别为28毫秒和33毫秒,均达到边缘显著,探测主要意义时,t(39)=1.841,0.05<P<0.10, 探测次要意义时,t(39)=1.735,0.05<P<0.10。 在另外两种条件下,即探测主要意义且语境不一致和探测次要意义且语境不一致两种条件下,语义有关与语义无关的探测反应时之间的差异不显著,P 值均大于0.10。上述结果说明,当ISI为0毫秒时,符合句子语境的同音词主要和次要两个意义的激活程度都相对较高,表明句子语境起了作用。

对ISI为-150毫秒条件下语义有关与语义无关的探测词反应时差异进行有计划的成对比较,结果表明,只有在探测主要意义且语境一致的条件下,语义有关与语义无关的探测词反应时之间的差异才达到显著,t(39)=2.521,P<0.05。其它三种条件下, 有关与无关之间的差异均不显著,P值均大于0.10。这说明,当ISI为-150毫秒时, 对于两个意义频率相差悬殊的同音词来说,符合语境的主要意义受到激活。然而,次要意义即使与语境一致,也并未受到激活。后面这一结果表面看起来有些令人费解,在没有语境的情况下,次要意义即使在ISI=-150毫秒时也得到激活,为什么当出现在一致的语境中时,反而得不到激活(启动量为-3毫秒,见表4)?我们考虑,这可能是同音词不同意义的相对频率与句子语境这两种信息相互冲突所导致的。由于同音词主要意义有着较高的相对频率,所以,当同音词以次要意义出现在句子语境中时,得到快速激活的主要意义与支持次要意义的句子语境之间发生冲突,这样,被试可能怀疑最初对句子语境的理解结果,尽管这种怀疑可能只是持续一个短暂的瞬间,但已经足够使得次要意义激活的时间点向后推迟,因此当ISI为-150毫秒时,实验观察不到次要意义在一致语境中的激活,而在ISI为0毫秒时则观察到激活(启动量为33毫秒,见表4)。 总之,上述结果集中表明,语境的作用要依赖同音词不同意义的相对频率。

4 综合讨论

综合两个实验的结果可以看出,在两种时间间隔条件下,无论探测主要意义还是探测次要意义,与启动词语义有关的探测词的反应时显著短于与启动词语义无关的探测词,这表明甚至在非常早的阶段,汉语双音节同音词相对频率不同的两个意义都得到了激活。然而,在句子语境中,实验结果产生了变化。当ISI为0毫秒时,频率相差悬殊的同音词的两个意义,无论是主要意义,还是次要意义,只要与语境一致,都得到激活,而与语境不一致的意义,都未得到激活。但是,当ISI为-150毫秒时,只有同音词符合语境、并且相对频率占优势的意义才处于激活状态。显然,在汉语双音节同音词加工的早期(ISI=-150毫秒),语境和频率都影响同音词的意义通达,但是,在稍晚的阶段,只观察到语境的作用。这些结果说明,在同音词意义通达的非常早的阶段,语境能引导通达,但是这种引导与同音词的意义频率之间存在相互作用。语境的作用在词汇识别的稍后期变得更强,可能不再依赖于频率。本研究的结果与一些研究者使用同形异义词在英文中进行研究所得到的结果是一致的,支持了相互作用的观点[5,6]。 重排序通达模型最能解释本研究的发现。

本文初稿收到日期:1998—04—13,修改稿收到日期:2000—01—02

标签:;  ;  ;  

汉语双音节同音词词汇歧义消解过程研究_语义分析论文
下载Doc文档

猜你喜欢