文本阅读的动态理解观及计算机仿真应用_计算机模拟论文

篇章阅读的动态理解观和计算机模拟的应用，本文主要内容关键词为：篇章论文,计算机论文,动态论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

分类号B842

1前言

阅读理解研究一直都是心理学研究的重要内容，而篇章阅读更是最受关注的一个方面，因为其与人们的生活学习息息相关。篇章阅读研究的实质是探讨读者在阅读文章时所从事的信息加工活动，探明读者在阅读过程和阅读后头脑中发生了何种变化[1]。随着人类认识的不断发展，篇章阅读研究的具体问题在不断的变换，新的理论模型产生往往还带动了新的研究方法和技术，而研究技术的不断精细和深入也会影响理论模型的进一步改进。就在近期，有关篇章阅读研究的理论模型和研究方法都有了崭新的发展，动态理解观和计算机模拟即是该阶段的典型代表。篇章阅读的理论模型开始趋向于理解阅读加工中信息激活的整个时间进程，而不再是只关注其中的某一点活动或单一的影响因素；同时对阅读过程和阅读产物也不再是分离的孤立的进行探讨，而是分析两者之间相互影响的关系。研究者还提出了篇章阅读是一个动态表征的观点。与此同时，受到人工智能技术和理论发展的影响，利用计算机模型模拟阅读过程也开始了初步尝试。计算机模拟是由人编制程序以实现被模拟事物的表象。以前普遍认为人的内在特性是无法通过模拟方式真实体现的，而今模拟技术不仅仅应用于机器人制造、航空技术等方面，并且已逐渐开始模拟人类思维这一内在过程。通过向计算机程序输入一些文章基本信息和变量，计算机就可以预测一系列有关阅读加工的重要内容，如文章概念在阅读全过程的激活波动情况，概念之间的联结力量变化以及概念被读者提取的顺序等等。由于理论模型的发展和研究方法的改进一直都是篇章阅读研究领域的两个主线，同时也是相辅相成的，因而本文在总结先前研究历史的基础上，分别从理论模型和研究方法两方面重点介绍了现阶段最新的动态理解观和计算机模拟技术的核心思想与应用价值。

2动态理解观——对经典篇章阅读理论模型的统合

早期的篇章阅读理论模型主要是为了定义被试所回忆内容的特征，并总结由阅读所得的记忆表征的本质。有一系列的模型强调记忆中自上而下的影响，着重于读者头脑中的图式在整个篇章结构中所起的作用，如故事语法理论、脚本理论等；另一类模型则强调自下而上的影响，即每一个文本元素和其他元素在保持连贯性时所起的作用[2，3]。到了20世纪80年代中期，篇章阅读研究的注意力逐渐从阅读产物转为阅读加工本身。这一阶段的理论模型主要描述了阅读过程中的即时认知加工：如读者在常规情况下会做出什么推理，阅读时有限的注意力资源和理解的需要之间是如何相互作用的等等。各个理论之间虽然取得了一定共识，但对于加工的具体细节还存在较大争议。有些理论模型认为阅读过程中读者会随当前阅读的内容不断主动激活背景知识和文章相关信息，使得当前信息与已有信息进行整合从而建构和更新情境模型，如建构主义理论和追随更新假设。而另一些研究模型则认为由于篇章阅读中会经常出现概念重叠，新信息通过这种被动的方式激活长时记忆中所有相关信息从而达到信息整合以及情境模型的更新，如记忆基础文本加工观。还有一些理论模型从情境模型的内容出发，将情境模型细分为多个不同维度并具体分析了每一维度在阅读中的作用，如事件指针模型[4～6]。

以上两个阶段的研究都还在继续，而20世纪90年代后期又产生了第三种研究——动态的文本理解观(dynamic text comprehension view)。这一新阶段的研究目的是将阅读的即时和延时方面相整合，焦点是理解信息加工与记忆表征之间复杂的相互关系[7,8]。因为在读者阅读和理解文章的过程中心理表征会不断改变，而不断变化的表征本身又为读者理解接下来的内容提供重要线索，因而对新信息的理解既能更新记忆表征，又能影响文本加工。风景模型(landscape model)便是这个阶段的代表，其试图抓住阅读过程中即时和延时表征以及它们之间动态的关系[9～12]。此外，先前阅读理解加工观往往是从某一方面(如推理、信息激活等)来分析阅读理解的，没有具体到文本中每一信息的加工，而风景模型则综合各种文本因素和读者因素，解释了每一信息在整个阅读中激活程度不断变化的过程。

2.1风景模型对阅读过程即时加工的分析

风景模型认为阅读过程的本质就是概念激活，读者在加工文章时会激活故事中提及的主要概念以及这些概念间的关系。然而由于有限的注意力，读者在任何时间都不能同时注意所有概念或概念之间的关系。故事中每一个信息或概念在读者头脑中的激活程度都会随着阅读进程而不断的波动。是什么因素决定了阅读的每一时刻有哪些概念被激活？根据风景模型，读者阅读篇章的过程是周期性的，每一个句子或分句就是一个阅读周期。在每一阅读周期中都会有4个潜在的来源影响概念激活：第一个是当前正在加工的文章内容；第二是前一个阅读周期，当读者进入新的阅读周期时前一周期的信息至少有部分会延续下去并能够被激活；第三个是读者可能会再次激活之前更早的阅读周期中已经加工过的信息；最后一个就是读者有可能通达和激活背景知识[9]。

图1阅读中概念激活的“地形图”

在篇章阅读过程中，上述的4种概念激活来源(文本因素)和读者有限的注意力资源(阅读者因素)的相互作用是文章中概念激活不停变化的根本原因。每一阅读周期中新的概念被激活，有些旧的也保留下来，另一些则从注意焦点或工作记忆中移去。当同时考虑每一概念激活的“顶峰”和“低谷”时就形成了一个关于概念激活的“地形图”(参看图1)。图1模拟了读者读一篇故事时故事中的主要概念在整个阅读过程中的激活变化情况：垂直轴是概念激活程度，一个水平轴是文章中的概念，另一水平轴是阅读周期。垂直面的交叉区域表示哪些概念超过了激活阈限以及什么时候超过的。每个阅读周期与垂直面的交叉区域表示在那个周期有哪些概念被激活；而每个概念与垂直面的交叉区域表示概念在整个阅读过程中激活程度的变化过程。阅读中概念激活不断波动的现象不仅仅反映了文章本身的特点，同时它也是读者的注意力、背景知识、理解和提取标准等等各种因素相互作用的结果[10]。

风景模型还提出阅读中概念激活的方式有两种：群体激活(cohort activation)和基于连贯的提取(coherence-based retrieval)。群体激活是从当前被激活的信息向相关信息被动激活的过程，其类似于共振模型所描述的信息共振，是一个迅速的没有策略性的过程。而基于连贯的提取是策略性的经过准备的，信息提取是为了理解当前文本的需要，保持文章的连贯性，它类似于建构主义理论所支持的“意义搜索”。信息的激活究竟采取两种方式中的哪一种主要是决定于读者不断变化的“连贯性标准”。连贯性标准反映了读者阅读文章的具体目标、期望、工作记忆容量等等，同时也受文章因素的影响，如文章体裁、呈现速度、任务变量等[9]。因此不同的读者甚至同一读者在不同的阅读情境下所保持的连贯性标准都会有差异。这些标准会影响读者对文章信息的加工程度，因而导致概念不同的激活方式。如果激活的信息足以达到读者的连贯性标准，那么信息之间的联结就能够非常容易并且快速的建立；如果激活的信息不能满足连贯性标准，读者就需要进行耗时的策略性加工以达到这些标准。

2.2风景模型对阅读延时表征的分析

风景模型认为成功的阅读结果是建构一个连贯的心理表征，这与先前有关的阅读理论的观点是相一致的。而风景模型进一步认为这些表征类似于概念联结的网络模型。阅读进程中概念的即时激活是动态地、逐步地建构表征的。概念之间通过形成具有方向性的联结网络，使得记忆表征能够编码概念的相互联系以及它们的激活水平，并能使模型在预测回忆内容时重新建构先前所输入的信息。研究者还提出心理表征的建构是一个符合渐进学习原则的过程，概念之间联结力量的变化与概念激活的新异程度成正比。如果一个概念的激活情况在故事现有表征中已有完美预期的话，就不会改变其表征；相反如果概念的激活没有得到很好的预期，则联结网络就需要进行更新以更好地捕捉故事中概念激活的动态性。与此同时，概念之间为获取激活的优势性也会进行相互竞争，这种同伴间的竞争能够保证故事表征的动态性和简洁性。例如，一个概念与另一概念联结很强的话(即概念的激活和联结能很准确地预计另一概念的激活)，那么第三个概念建立连接的可能性就很小了，因为这样会造成表征的冗余[10]。

个别概念的激活、渐进学习原则与同伴竞争这三个因素共同决定了概念在每一周期联结力量的变化。在整个阅读过程中，读者不断学习各种概念以及它们之间的联系，从而建构和更新表征。并且更新过程不是单个概念和联结的改变，而是整个表征网络的重构过程，当读者遇到与文章之前信息不连贯的内容时重构就会更明显。通过这种方式所形成的记忆表征可以在阅读中或阅读后得到通达。

2.3风景模型的理论和实践意义

风景模型与先前阅读加工模型相比，最重要的一点就是其并非孤立地检测阅读中的一个方面，而是将阅读加工的即时过程和阅读后的记忆结果统合起来，并且其理论框架和体系能够同时检测各种因素(如：不同的关系类型，连贯性标准，学习曲线等)，因而更类似于人们的真实阅读情形。风景模型在各方面都表现为动态的：首先，它描述了整个阅读进程中参与理解的各种认知加工过程而不是个别因素的影响；其次，其抓住了各种因素间的相互作用，模型中允许同时检验各种影响阅读加工的因素；第三，其认为在每一阅读周期中建构的记忆表征都是信息激活来源并会影响之后的激活模式，而这种循环的动态激活也会改变现有的表征情况，最后逐渐形成一个情境式的表征，使得传统的阅读过程和结果之间的分离变为两者的相互关系[11]。

对于每一个具体篇章，在阅读过程的每一点上，研究者都可以根据风景模型的构想对这一点的阅读加工内容进行预测，并通过实际阅读过程的结果检验风景模型假设的合理性。对风景模型理论框架已有的实证支持就是通过比较风景模型的模拟数据与被试真实阅读结果而获得的。许多行为学实验只是在阅读的某些点上评估了概念的通达性，而风景模型中具体概念的激活可以在整个阅读过程中被追踪。此外，风景模型的计算操作使得研究者可以检验他们自己的理论假设。模型中的激活来源以及它们的值都可以根据研究者对加工的假设而进行改变。例如：根据事件指针模型，读者有5个连贯性标准，风景模型的输入参数则可以改为含有这些标准。当经验结果表明有些标准要强于另些标准，还可以给每个标准附上不同的值。

风景模型还是一种相互作用的动力观，试图在理论和经验上将不同的加工观统一。根据风景模型的假设，当在阅读理解中正确结合文本和读者变量后，任何一种推理都可以进行。例如：风景模型认为，阅读理解过程中记忆基础加工和建构主义不是相矛盾而是相融合的。两种加工能够同时存在并相互作用，依赖于读者的连贯性标准和推理条件。如果读者使用严格的标准，建构主义加工就更普遍发生，这有利于深加工，但会耗费读者更多精力；如果读者使用相对轻松的标准，建构主义加工就很少发生，这会耗费读者较少的精力但有可能连贯的文本表征也变少。此外，当进行特定推理所需的信息可以通过记忆基础加工直接获得时，就没有必要进行建构主义加工。如果某些推理如主题推理和其他抽象推理需要各种信息同时激活，并且这些信息仅仅通过记忆基础加工不能立即通达时，就会需要更多的建构主义加工[12]。先前之所以将两种观点对立，一个原因是人们倾向于把它们分别等同于自下而上加工和自上而下加工。

3计算机模拟阅读过程——在传统研究方法基础上的新技术

正如前言所提，篇章阅读研究中理论模型的发展和研究方法的改进是紧密相连、相互影响的。由于每一阶段的理论研究所关注的内容都有不同，因此也伴随着相应的研究方法。早期篇章阅读理论完全考虑的是阅读结果，即由于实验操作的变量引起的心理表征定量或定性的变化，因此典型研究方法主要是延时测量技术，如让读者写出他们能从篇章中回忆起来的所有东西，记录自由回忆任务中所回忆的观点数量，问题回答任务以及在新情境中利用知识等。20世纪80年代以来，篇章阅读理论开始关注阅读过程，着重于研究实时阅读中的认知活动和影响因素，因此各种来自认知科学和认知神经科学的即时测量技术开始普遍应用到篇章阅读的研究中[13,14]。如利用探测技术记录读者对相关和无关刺激的反应时间以及眼动轨迹追踪技术能够帮助研究者在不打断阅读过程的情况下测量读者对目标信息的加工和精确的时间进程，而脑成像技术(如事件相关电位和功能性核磁共振成像)更能直接探测行为过程中大脑的生理变化，具有精确的时间和空间定位[15,16]。伴随着篇章阅读第三个研究阶段的产生，动态理解观尤其是风景模型关心的重点则是阅读过程和阅读结果的相互关系，以及每一概念单元在阅读中不断变化的激活过程。这一阶段研究的特点是既从阅读的整体出发，又关心阅读中细小单元的加工变化，因此更需要研究方法上的突破。无论是原始的纸笔测验还是最近的神经科学技术，往往所能关注的都只是阅读中信息加工或阅读后记忆特征的某一部分内容，只是记录的内容或是行为学的或是脑生理的变化。而计算机模型则是根据阅读理论和分析大量行为学数据的基础上构建的，能够反映阅读过程和记忆表征的细微变化与整体变化，将抽象的加工数量化。因此计算机模拟技术更符合动态理解研究阶段所探讨的阅读内容，这种崭新的研究方法已逐渐被应用于篇章阅读研究领域。

风景模型作为当前研究阶段的代表，对计算机模型的使用是最为系统和充分的。风景模型的研究者根据其理论假设，采用C++语言设计了一套能够模拟阅读加工全过程以及记忆表征的计算机模型。通过向程序输入文章内容，每一阅读周期的关键概念，以及概念在每一阅读周期的激活情况，计算机程序就会输出有关篇章加工的一系列重要信息，包括概念激活矩阵，概念间联结力量矩阵以及概念提取顺序等等[17]。概念激活矩阵中包含了文本所有概念以及它们在每一阅读周期中的激活值，每一行就代表一个概念在所有阅读周期的激活历史，而每一列则表示一个阅读周期中有哪些概念激活以及激活的程度。这个矩阵反映了理解一篇文章时所有主要概念激活波动的全过程。联结力量矩阵则包含了文本中各个概念之间的联结力量，形成了一个联结网络模式。矩阵中不同的联结值代表了概念之间联结力量的变化。对角线是每个概念与其自身的联结力量。这些自身联结值既代表了概念在整个阅读进程中总的激活情况，也是概念与其他概念间联结程度的体现。同时计算机模型还能给出文本中概念的提取顺序。基于两阶段提取假设，模型先是通过计算概念在所有阅读周期的激活总量提取出第一个概念单元，然后再搜索和提取与第一个概念单元有最大联结力量的其他概念。这一搜索和提取过程一直进行，直到所有概念都提取出来或达到了提取阈限。除了能够提供这些信息，研究者还可以根据自己的需要改变模型的参数，例如，可以通过加入一个参数使得模型能够辨别一个阅读周期结束和下一个阅读周期开始前的停留空白，这样，模型最后得到的心理表征也会受到影响。同时，一篇文章中获得的概念联结矩阵也可以作为参考利用到其他篇章理解的过程中。

研究者还进行了一系列实验，比较计算机模型的模拟数据与阅读中被试的实际反应数据，从而验证了模型对阅读中即时加工和延时表征的有效预测[18]。对于模拟篇章即时加工的验证方法，是让被试阅读简单的记叙文故事，然后评定故事中每个概念在每一句的激活强度。平均被试的评定从而得出人们对于概念激活的一个真实“地形图”。将指代和因果关系作为连贯性标准比较计算机模型的模拟数据与人们的真实“地形图”，结果发现模型和经验中激活值的相关非常高(r=0.73，p<0.01)，说明了计算机模型能够像读者所报告的那样准确捕捉阅读中概念的激活情况。对于最终的文本表征，模型通过计算概念和联结力量所输出的对被试回忆内容的预测值与读者所报告的真实回忆率也有高相关(r=0.70，p<0.01)，同时模型所预测的概念提取顺序也与被试真实的回忆顺序是一致的。因此，这一系列实验说明了根据风景模型的理论基础设计的计算机模型是具有经验效度的，预测的即时激活与人们的实际阅读情况相匹配，而预测的延时提取也符合读者的回忆。此外，实验还证明这一计算机模型能够模拟更为复杂的阅读情境，例如读者的阅读目的对其记忆表征的影响，读者在阅读中对不连贯信息的检测等等。通过分析实验材料中每一句子与其他句子间的关系，计算机模型能够预测在以学习为目的和以娱乐为目的时读者分别会加工哪些关系，然后计算不同阅读目的下各个阅读周期中主要概念的激活值，结果表明，当阅读目的不同时，概念的激活总量也是有差异的。当以学习为目的时，对于句子信息的激活会有更高的保持(t(62)=2.59，p=0.006)。行为学实验结果也表明，以学习为目的的读者会加工更多的因果关系(t(2120)=-1.68，p=0.045)[9]。这一量化的行为结果与计算机模拟的结果是一致的。

就在最近，不断涌现出一些研究，利用计算机模拟技术重新考察各自的阅读加工理论，并且将模型模拟的数据与先前行为学数据进行对比，通过模拟结果与被试实际认知情况的匹配来证实理论的合理性和可操作性。例如，Trabasso和Wiley(2005)在先前反应时实验的基础上，通过模拟数据的方法，再次检验了因果推理在理解含有复杂目标计划的记叙文中的作用[19]。采用和先前行为学实验中相同的故事材料，研究者对这些材料进行目标过程分析和各成分间的因果关系分析，并得出概念间相互关系的一个网络图。然后利用Langston和Trabasso所提出和设计的联结主义模型对探测词的激活值进行预测。最后进行回归分析，用模型所得到的探测词通达数据预测先前行为学实验中探测词再认结果和句子启动结果。分析结果表明，这种数据模拟的方法成功预测了先前4个行为学实验中文本信息通达的结果，说明读者的确是运用活动和结果的目标计划知识来解释故事中事件和活动为什么会发生以及发生的过程。此外，Wolfe(2005)基于建构整合模型和语义联结网络，也采用了数据模拟的方法检验语义知识和文章结构对记叙文和说明文记忆的影响[20]。实验中的语义联结被操作定义为由潜在语义分析公式(LSA)计算得出的独个文本概念和整个文本之间语义相关的余弦；文章结构则根据建构整合模型进行分析，从而得出文本中的概念在长时记忆的联结力量值。通过线性回归的统计方法，用语义相关余弦值和概念的联结力量系数来预测被试对文章的回忆量，结果表明文本概念之间的语义联结对记忆有独立影响，当概念在文章结构中更重要或与主题和上下文的语义相关较高时回忆得更好。这些实验都成功地验证了研究者们的理论假设和行为学实验结果，说明利用计算机模型预测和模拟篇章阅读的各种加工特点的确是一种有效的研究方法，因而会逐步被更多研究者采纳并应用于其所关注的内容之上。

4小结

本文在回顾篇章阅读研究历史的同时，将焦点放在了文本阅读加工研究中的一个崭新突破——考察阅读加工全过程的动态理解观和利用计算机模型模拟的研究方法。有研究者曾指出，在过去的20年中，认知科学对文章理解研究产生了重要影响，但最重要的贡献还没到来，未来的阅读研究将会更进一步地受到认知科学观点和方法的影响。而今，动态理解和模拟加工的逐步发展已经开始验证这一观点。在理论研究方面，70年代的研究者更多关注文章阅读后读者头脑表征的内容；到了80年代，研究者逐渐利用各种认知科学技术转而集中于阅读即时加工的一些具体内容：而近年来，研究者则开始结合前两阶段的研究结果，将实时加工和延时表征联系起来而不是分离开，试图动态地理解篇章阅读加工的全过程。在研究方法上，从最早的对阅读后问题回答的记录，到80年代探测技术和眼动技术等认知科学方法的引入，至当前愈加广泛的脑成像技术，篇章阅读理解的研究方法有了很大转折；进入21世纪后，计算机模型模拟技术这一人工智能技术也开始渗入到阅读理解研究领域中。计算机模型是建立在大量行为学研究数据基础上的，可以模拟和量化人们阅读加工的时间进程，并同时检验各种影响因素，通过这种方法获得的结果更符合人们的真实阅读情境，并且有可能帮助研究者在不需要利用真实被试的反应结果的基础上就能很好地预测人们的阅读理解过程，同时也能探索阅读加工中的各种具体内容。

然而篇章阅读的动态理解观还处于一个雏形，尚未形成一套成熟而丰富的理论体系；相应的计算机模型和模拟技术在阅读研究中的应用也才刚刚起步，同时，理论的不完善也会影响具体模型对真实行为预测的准确性。因为将理论框架具体化为计算机模型需要非常清晰而准确的理论思想，同时还要找到能够量化的指标才能进行正确的数据模拟。并且只有当计算机模型所预测的数据能够与大多数行为学指标和生理学指标的结果相一致时，才能证明模型的有效性与适用范围，而这一验证过程是复杂的，费时的，因为其中需要不断加入新的变量或修改之前的变量，以完善理论模型和计算机模型。因此，无论是篇章阅读的动态理解观还是计算机模拟研究方法，都需要更多的实验和数据给予支持并帮助改进，才能得到更具有生态学意义的结果。尽管存在一定的难度，但仍然能够预计，在未来的篇章阅读研究中，动态理解观和计算机模型的应用将会越来越受到研究者们的重视，这方面的理论和实证研究也会有更重要的发展。

标签：计算机模拟论文; 信息加工理论论文; 文本分析论文; 预测模型论文; 标准模型论文; 信息加工论文; 读书论文; 动态模型论文;

文本阅读的动态理解观及计算机仿真应用_计算机模拟论文

猜你喜欢