三维物体识别的心理表征：角度依赖还是角度独立_启动效应论文

三维物体识别的心理表征：角度依赖还是角度独立，本文主要内容关键词为：角度论文,表征论文,物体论文,独立论文,心理论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

分类号B842

1 前言

物体识别过程中存在知觉恒常性。当物体呈现的角度或者观察者的观察角度发生变化时，物体在视网膜上形成的几何形状也会随之发生变化，但人们仍然能够完成物体识别。那么，当角度变化时，视觉系统是如何实现物体恒常识别的呢？这就是物体识别领域中关注的焦点——角度启动效应(view prime effects)。角度启动效应是指人们能够很容易地从记忆中提取出原型或典型角度下的常见物体(如汽车模型、房子模型等)。Biederman和Bar(1999)通过操纵物体的基本特征(nonaccidental properties，简称NAPs)(如直的或弯曲的小几何体)考察物体识别过程中的加工资源分配问题，结果发现表征不同角度需要耗费不同的加工资源。Murray，Jolicoeur,McMullen和Ingleton(1993)研究发现，人们在特定角度下多次学习一个物体，在该角度下呈现另一个物体时，原先的角度学习对新近的物体识别也能起到易化作用。这均说明物体识别过程中存在角度启动效应。角度启动效应的大小受到形状信息和空间关系信息(Newell，Sheppard，Edelman，& Shapiro，2005)、照明强度(Hayward & Tarr，1997)、纹理信息(Dosher & Lu，2006)等多种因素的影响。

有关物体识别的理论解释主要存在两种对立的观点：以物体为中心理论(object-centered theory)和以观察者为中心理论(view-centered theory)。这两种理论是基于“物体识别是角度独立还是角度依赖”的假设提出的。以物体为中心理论认为物体识别是依据原始部分的形状信息和这些部分之间的空间关系信息来实现识别的一种定性表征过程(Hummel & Biederman，1992)。物体识别是角度独立的，角度变化不会影响识别任务。其中，最早提出的成分认知模型(recognition-by-components，简称RBC)(Biederman，1987)把原始部分定义为类属子成分，假定每个物体由30个小几何体(Geometrical ion，简称Geon)组成。后因RBC模型无法解释人们如何完成同一范畴内不同样例水平的物体识别现象，Biederman和Gerhardstein(1993)进一步提出了几何体结构描述模型(geon structural description，简称GSD)，把原始部分定义为基本特征(NAPs)，NAPs能够把物体的不同样例及原始部分之间的联结关系区分开来。那么究竟这些部分之间是如何联结的？典型假设是John和Irv的模型(简称JIM模型)(Hummel & Biederman，1992)，JIM模型从神经生理机制方面提出了物体识别的动态捆绑假设，认为物体识别是通过捆绑构成每个部分的形状单元和具体操作的关系单元实现的。后来，Hummel(2001)将JIM模型修正为JIM.3模型，将动态捆绑机制拓展为动态和静态视网膜定位相结合的机制。当物体缺乏必要的NAPs时，人们会依据测量学属性(metric properties，简称MPs)来区分物体。根据GSD模型，如果满足以下三个条件，则物体识别与角度无关：(1)物体可分解成小几何体；(2)每个物体的GSD是独特的；(3)同一物体的两个样例可以得到相同的GSD。Biederman和Gerhardstein(1993)进行了熟悉物体的命名启动实验、小几何体的系列匹配实验和新异物体的异同判断实验，结果均支持了角度独立的三个条件。

但是，另一些研究者设计同样满足以上三个条件的实验，却得出了角度依赖的结论(Hayward & Tarr，1997)。于是，他们提出了以观察者为中心理论。认为物体识别是对一组不同角度下的样例模块进行匹配的过程，模块匹配依赖于具体的表征角度。物体识别是角度依赖的，角度变化会影响识别成绩，角度不同识别成绩不同。例如，多角度转换模型(multiple-views-plus-transformation)认为物体是以一系列熟悉角度表征的，每种特殊角度都与一种视图相对应。当人们识别新异角度下的物体时，先对该物体进行心理旋转，使其可以与最接近的熟悉角度下的物体进行匹配。基于表象模型(image-based models)认为角度依赖性是通过直接匹配知觉表征角度和记忆储存角度之间的相似性来实现的(Serre，Wolf，Bileschi，Riesenhuber，& Poggio，2007；Vuong，Friedman，& Plante，2009)。Edelman和Intrator(2003)提出CoF模型(chorus of fragments)，用视网膜定位的静态捆绑取代了原来的暂时捆绑，实现了对结构的精确表征。不过，需要强调的是，此处的静态捆绑是建立在以观察者为中心理论基础之上的，不同于以物体为中心理论中所描述的JIM.3模型。

可见，以物体为中心理论强调结构信息，以观察者为中心理论强调视图信息。但也有研究表明，结构信息和视图信息在三维物体识别中是同时起作用的(Fazl，Grossberg，& Mingolla，2009；Blumberg & Kreiman，2010)。综上所述，物体识别过程中角度独立和角度依赖之间的争论从未停止过，各自的理论模型也不断得到发展完善(Wong & Hayward，2005；Lazareva，Wasserman，& Biederman，2008)，但是他们对物体的考察都不够全面，均不能独立完整地解释物体识别的所有现象。如对以物体为中心理论的质疑：如何解释深度旋转之后物体识别速度发生变化的现象？对以观察者为中心理论的质疑：如何解释种类一般化等涉及抽象信息表征的现象？引起角度问题争论的可能原因是双方都没有弄清楚物体识别的心理表征机制(Stankiewicz，2003)。因此，有必要对角度问题进行更深入的研究。

研究从提高生态效度出发，借鉴Behrmann，Peterson，Moscovitch和Suzuki(2006)研究中的三维物体制作思想，采用启动范式考察结构信息和视图信息对三维物体识别的影响机制，在验证角度启动效应的基础上进一步分析三维物体识别的心理表征过程，试图从更加综合的视角予以解释。研究探讨以下三个问题。第一，形状和空间关系信息对物体识别的影响。当物体的呈现角度不发生变化时，以物体为中心理论认为形状和空间关系信息将交织在一起联合表征；以观察者为中心理论认为形状将独立于空间关系信息表征。我们认为，人们会优先依据形状信息表征，在形状信息不足时，人们会联合空间关系信息表征物体。第二，角度信息对物体识别的影响。当物体的呈现角度发生变化时，经典的以物体为中心理论认为不会出现角度启动效应。相反，经典的以观察者为中心理论认为将出现角度启动效应。我们认为，比较角度变化前后的识别成绩，若差异不显著，则角度信息不影响物体识别，支持以物体为中心理论；若差异显著，则角度信息影响物体识别，支持以观察者为中心理论。若存在角度启动效应，则继续深入考察角度启动效应的影响因素，即角度大小、任务难度和旋转方式对角度依赖性大小的影响。第三，将进一步从理论上探讨角度依赖性问题与物体识别问题两者之间的联系与区别，结合已有研究深入分析物体识别的两大理论之间的对立与统一，尝试为物体识别理论的融合提供实证依据和理论思考。

2 实验1 形状和空间关系信息对三维物体识别的影响

自制三维物体实验材料，采取在屏幕左右两侧呈现刺激的启动范式，操纵形状和空间关系信息，设置两种启动刺激，考察结构信息对三维物体识别的影响，检验以物体为中心理论，为后续的角度启动效应实验奠定基础。

2.1 被试

随机选取大学生34人，16名男生和18名女生。平均年龄20.8岁(18岁～23岁)。均为右利手，视力或矫正视力正常，身体健康，均没有参加过类似实验。

2.2 实验仪器与材料

依据Biederman(1987)提出的“小几何体”思想，每个小几何体的制作均考虑弯曲、平行、对称、共线性和共端性五个参照点，借鉴Behrmann等人(2006)的三维材料制作思想，采用3DMAX 6.0自制实验材料(见图1)。每个物体由2个独立的小几何体组成，其中一个是对整个物体起支持作用的小几何体。任何两个物体都不存在共同的小几何体，每个材料可以独立地代表一个物体范畴。

图1 实验1材料示例

启动刺激的制作：①启动刺激Ⅰ是改变物体的组成部分即PC(part-changed)刺激。PC刺激由目标刺激的一个小几何体和另一个目标刺激的一个小几何体共同组成。为保证物体的基本结构不发生变化，对整个目标刺激起支持作用的小几何体不发生变化的，只是另一个小几何体按照随机方式各出现2次，组成8张PC刺激。PC刺激用来评估被试对小几何体的形状辨别能力。②启动刺激Ⅱ是改变组成部分之间的空间关系即RC(relation-changed)刺激。RC刺激由目标刺激的2个小几何体在变化了空间排列关系之后重新组合而成。每个目标刺激组成部分之间的空间关系也是各变化2次，组成8张RC刺激。RC刺激用来评估被试对小几何体的空间关系辨别能力。每个小几何体约22.5(正视图)，渲染后的像素大小为260像素×300像素(前视图)，文档大小为9.17cm×10.59cm，分辨率为72像素/英寸。照明强度的主光、辅光和补光倍增依次设置为1.0、0.6、0.3，屏幕背景照明51.4cd/。材料颜色全部为土黄色，屏幕背景为白色。马赛克掩蔽刺激由8个小几何体随机化堆砌而成，其物理属性均等同于目标刺激。

2.3 实验设计

单因素四水平实验设计。水平1：不启动；水平2：重复启动；水平3：部分启动；水平4：空间关系启动。

2.4 实验程序

E-prime 2.0软件编程，计算机呈现，标准外接键盘反应。采用启动范式，在屏幕左侧呈现启动刺激80次，右侧呈现目标刺激80次，组成80个刺激单元，呈现顺序随机化。启动刺激和目标刺激组合模式共4种，分别为完全不一样(不启动)、完全一样(重复启动)、部分改变(空间关系启动)和空间关系改变(部分启动)。正式实验前，先呈现一组由20个刺激单元组成的简短练习，让被试熟悉实验程序。用于练习的刺激单元不出现在正式实验中。

每个被试单独进行实验。被试端坐在计算机屏幕前，右手食指和中指分别放在标准外接键盘中央的G、H键上，眼睛与屏幕齐平，视距为60cm左右。实验首先在屏幕左侧呈现一个注视点“+”字(500ms)，接着在注视点位置呈现启动刺激(1440ms)，随后在启动刺激位置出现马赛克掩蔽刺激(1000ms)，之后，在屏幕右侧出现需要做出按键反应的目标刺激(直到按键反应后才消失)。要求被试判断左右图形是否一样，如果形状一样，就按G键；如果形状不一样，就按H键。

2.5 实验结果

剔除平均数三个标准差之外及错误反应的数据(占全部数据的5.9%)后，进行方差分析。准确率分析结果表明，四种条件之间差异显著，F(3，124)=3.74，p＜0.05。多重比较LSD表明，重复启动分别与不启动、空间关系启动之间差异显著，p＜0.001，p＜0.05，其他差异不显著(见图2)。反应时分析结果表明，四种条件之间差异显著，F(3，124)=10.31，p＜0.001。多重比较LSD表明，重复启动分别与不启动、部分启动和空间关系启动之间差异显著(p＜0.001，p＜0.001，p＜0.01)；空间关系启动快于部分启动(p＜0.05)；部分启动也快于不启动(p＜0.05)(见图2)。

图2 不同启动条件下的准确率(%)和反应时(ms)

2.6 讨论

实验1以重复启动的四种水平为自变量，以反应时和准确率为因变量进行数据分析。主要考察形状和空间关系信息在物体识别中所起的作用。结果发现，重复启动条件下反应时最短，说明刺激重复出现时，启动效应会自动发生。空间关系启动条件下的反应时次之，说明空间关系信息能够易化物体识别。部分启动条件下的反应时快于不启动，说明形状的高度相似性能够促进物体识别。再结合准确率分析结果综合来看，形状和空间关系信息都是影响物体识别的主要因素，但两者在物体识别过程中所起的促进作用可能是不一样的。也许当形状信息不足时，人们可以借助空间关系信息实现物体识别。

3 实验2角度信息对三维物体识别的影响

实验1采用正立的刺激考察了形状和空间关系信息对物体识别的影响，故在实验2中，我们将启动刺激进行平面和深度旋转，要求被试通过角度匹配分别在间接任务和直接任务下完成物体识别任务。目的是考察角度启动效应，检验以观察者为中心理论。

3.1 被试

另外随机选取大学生40人，16名男生和24名女生。平均年龄21.3岁(19～24岁)。右利手，视力或矫正视力正常，身体健康，均没有参加过类似实验。

3.2 实验仪器与材料

与实验1基本材料相同，也是由2个独立的小几何体组成，但启动刺激的制作不同。在实验2中，除了继续使用实验1中的PC刺激和RC刺激外，还制作了除0°之外其他5种角度下的实验材料。具体为平面旋转方式下制作90°和180°，深度旋转方式下制作-30°、30°和60°，如图3所示。实验材料的物理属性均和实验1相同。

图3 实验2材料示例

3.3 实验设计

采取6(旋转角度：-30°、0°、30°、60°、90°、180°)×4(组合模式：DoDv、DoSv、SoDv、SoSv)×2(任务类型：间接任务、直接任务)三因素混合设计。其中角度和组合模式为被试内因素，任务类型为被试间因素。

3.4 实验程序

E-prime 2.0软件编程，计算机呈现，标准外接键盘反应。实验范式及流程同实验1。启动刺激和目标刺激的组合模式共4种，分别为DoDv(a different object in a different view)模式(不同物体不同角度)；DoSv(a different object in the same view)模式(不同物体相同角度)；SoDv(the same object in a different view)模式(相同物体不同角度)；SoSv(the same object in the same view)模式(相同物体相同角度)。假设：SoSv模式下的角度启动效应最大，而实验最希望在DoSv模式下获得角度启动效应。每张图形在每种角度下呈现6次，即4×6×6=144次，再从实验1启动刺激中随机选取6张，每种角度下呈现1次，即6×6=36次。总共呈现刺激单元180次，中途休息一次。正式实验前，先呈现由30个刺激单元组成的简短练习，让被试熟悉正式实验。同样，用于练习的刺激单元不出现在正式实验中。

将实验1中的异同判断任务拓展为两种难度不同的测验任务。一种为间接(启动)任务，要求被试不管图形的呈现角度如何，只要两侧图形的形状一样，就按G键；形状不一样，就按H键。另一种为直接(匹配)任务，要求被试只有当两侧图形的形状一样并且角度也一样时，才按G键；若形状不一样或者角度不一样或者两者都不一样，均按H键。被试随机分为两组，一组被试完成间接任务，一组被试完成直接任务。

3.5 实验结果与分析

剔除平均数三个标准差之外及错误反应的数据(占全部数据的5%)后，进行方差分析。准确率分析结果表明，(1)角度主效应显著，F(5，180)=9.06，p＜0.001。均数比较显示，除0°和30°外，两两差异均显著，ps＜0.05。(2)组合模式主效应显著，F(3，108)=63.94，p＜0.001。均数比较显示，SoSv模式高于DoSv、SoDv两种模式，F值分别为F(1，36)=22.67，p＜0.001；F(1，36)=65.70，p＜0.001。(3)任务类型主效应显著，F(1，36)=78.79，p＜0.001。(4)角度和组合模式交互作用显著，F(15，540)=7.29，p＜0.001。简单效应检验显示，角度在四种组合模式上差异均显著，ps＜0.05；组合模式在六种角度上差异也均显著，ps＜0.05(见图4)。(5)角度和任务类型交互作用显著，F(5，180)=7.44，p＜0.001。(6)组合模式和任务类型交互作用也显著，F(3，108)=14.20，p＜0.001；简单效应检验显示，组合模式在两种任务类型上差异均显著，ps＜0.01，任务类型在四种组合模式上差异也均显著，ps＜0.01(见图5)。(7)三者交互作用也显著，F(15，540)=3.67，p＜0.001。

图4 不同角度、不同组合模式下的准确率(%)和反应时(ms)

图5 不同任务类型、不同组合模式下的准确率(%)和反应时(ms)

反应时分析结果表明，(1)角度主效应显著，F(5，180)=5.23，p＜0.001。均数比较显示，90°和180°差异显著，F(1，36)=8.97，p＜0.01。(2)组合模式主效应显著，F(3，108)=14.43，p＜0.001。均数比较显示，SoSv模式快于DoSv、SoDv两种模式，F值分别为F(1，36)=22.51，p＜0.001；F(1，36)=27.81，p＜0.001。DoSv模式快于DoDv模式，F(1，36)=8.30，p＜0.01；SoDv模式快于DoDv模式，F(1，36)=10.87，p＜0.01。(3)任务类型主效应显著，F(1，36)=78.41，p＜0.001。(4)角度和组合模式交互作用显著，F(15，540)=5.49，p＜0.001。简单效应检验显示，角度在SoDv和SoSv模式上差异均显著，F值分别为F(5，185)=7.74，p＜0.001；F(5，185)=4.97，p＜0.01；组合模式在-30°、0°、90°和180°水平上差异均显著，ps＜0.01(见图4)。(5)角度和任务类型交互作用不显著。(6)组合模式和任务类型交互作用显著，F(3，108)=17.99，p＜0.001；简单效应检验显示，组合模式在两种任务类型上差异均显著，ps＜0.001，任务类型在四种组合模式上差异也均显著，ps＜0.01(见图5)。(7)三者交互作用也显著，F(15，540)=3.47，p＜0.001。

为比较旋转类型对物体识别的影响，将数据合并后分析结果表明，(1)间接任务中，平面旋转和深度旋转的识别准确率和反应时差异均不显著。(2)直接任务中，平面旋转和深度旋转的识别准确率差异显著，t(18/2)=5.79，p＜0.001。反应时差异也显著，t(18/2)=2.67，p＜0.05。

3.6 讨论

为了考察角度启动效应，将实验1中的自变量刺激类型(判断两张图形的形状是否一样)拓展为“不管呈现角度”的包含测验和“只有角度也相同”的排除测验两种。同时将Gauthier和Tarr(1997)在二维实验材料中采用的组合模式的设计思想应用到本研究中的三维实验材料中。研究结果显示，不同组合模式下识别成绩不同。因SoSv模式是相同的刺激重复表征，角度启动效应会自动发生，故其识别成绩相对最好；因DoSv模式下的识别速度显著快于DoDv模式，故存在角度启动效应；因SoDv模式下的识别速度显著快于DoDv模式，故存在形状启动效应；因DoSv模式下的角度反应时差异不显著，故存在跨范畴的角度启动效应。因在SoDv模式下，被试需要进一步对物体进行心理旋转，特别是进行深度旋转，这样的操作会使任务难度增加，故识别成绩相对降低。因深度旋转方式更接近人们的日常生活经验，故识别成绩相对好于平面旋转。

4 总讨论

研究发现，在三维物体识别中，形状、空间关系和角度信息对识别成绩均有显著影响，结构信息和视图信息都是影响物体识别的主要因素。

4.1 形状等结构信息对三维物体识别的影响

形状、空间关系等结构信息能够揭示物体识别任务中的扫描时间和扫描距离之间的关系。实验1发现，代表形状信息的部分启动和代表空间信息的空间关系启动均对识别起到了易化作用。形状信息代表小几何体的原型特征，这说明原型在视网膜上的成像对物体识别起关键作用。空间关系信息代表小几何体的空间排列特征，例如上下结构或左右结构，说明识别物体时人们并没有对关键属性进行坐标轴式的定量描述，只是把这些代表关键属性的原型小几何体通过一定的空间编码之后独立地表征出来了。形状和空间关系启动均与视网膜成像具有观察角度不变的特性有关，是物体识别不受角度影响的证据。所以，形状对三维物体识别的影响，支持了以物体为中心理论的“小几何体”思想。另外，有研究认为角度变化不影响物体识别的原因是空间关系表征可以把物体的空间结构保留下来(Kosslyn，Flynn，Amsterdam，& Wang，1990)。这样，角度的变化就不会改变物体的空间结构，结构不变就不会影响物体识别。依据Kosslyn的视觉空间关系表征理论可知，空间关系表征分为类别空间关系和数量空间关系两个相对独立的加工子系统。我们实验1中设计的空间关系变量是Kosslyn理论中所言的类别空间关系。因为类别空间关系描述的是一个客体相对于另一个客体的位置、方向等空间特征，我们研究中的小几何体是一个客体，对小几何体的操作是对客体空间特征的操作。因为类别空间关系是以等量级的方式表征客体空间关系一般特征的(如连接的/非连接的、上/下、左/右、内/外)，这样可以降低物体在测量学上距离和位置的变化，有助于人们更好的识别物体。Cooper和Brooks(2004)研究进一步显示，基础水平的物体识别更多涉及类别空间关系，样例水平的物体识别更多涉及更精确的数量空间关系。也有研究发现非生物的识别更多利用类别空间关系，生物的识别更多利用数量空间关系(Lg，Hveem，Ruud，& Laeng，2006)。综上可知，实验1实际操纵的是类别空间关系，其对物体识别的启动效应支持了以物体为中心理论的基本观点。那么数量空间关系是怎么影响物体识别的？以物体为中心理论能否解释数量空间关系对物体识别的影响机制呢？则有待于进一步研究。

4.2 角度等视图信息对三维物体识别的影响

操作物体的旋转角度可以反映物体识别的心理旋转过程。实验2首先验证了视觉表象具有可操作性的特点。三维物体识别中发现了角度启动效应，说明人们完成心理旋转等具体形式的物体识别任务时需要有意识地对呈现角度进行加工。实验2也发现角度启动效应的大小受到了任务难易程度的影响，在有意识关注角度的直接任务下识别速度快，当任务难度变化后，识别速度会变慢。这也许因为物体识别的信息加工并不是一个单一的过程，它至少可以按照时间进程分为产生、保持和转换三个彼此相连的过程(Kosslyn，Thompson，& Ganis，2006)，其中扫描和深度旋转是最主要的信息转换过程(Liu，Agam，Madsen，& Kreiman，2009)。本研究发现在信息转换过程中出现了角度启动效应，那么在产生和保持两个过程中是否也存在角度启动效应呢？

(1)角度和形状信息的表征。Tarr(1995)认为角度和形状信息的编码是相互独立的，人们通过知觉抽象参照系来完成物体识别。同时，Tarr提出输入到大脑中的抽象参照系和形状之间存在一个前联合阶段，可以实现这两种信息的独立表征。Gauthier和Tarr(1997)操纵提示线索的具体化程度(由抽象线索变为视觉相似的角度线索)研究发现二维物体识别中的角度启动效应是角度和形状信息联合表征的结果。本研究发现三维物体识别中角度和形状信息的表征可能是相互独立的。因为在DoSv模式下，人们对先呈现物体的角度表征能够易化角度相同但形状不同的其他物体的识别，即形状发生变化时，角度启动效应仍然存在。这说明角度表征可能独立于形状表征。也有研究者提出物体识别的两种机制：抽象参照系下的二维物体识别机制与具体旋转角度下的一般化机制(Beymer & Poggio，1996)。那么，抽象参照系可以实现角度和形状信息的独立表征，一般化机制则可能在三维物体表征过程的某一个或几个阶段中实现角度和形状信息的联合表征。有研究者(Jeffery，Rhodes，& Busey，2007)使用更为复杂的三维面孔材料，进行了初步的类似研究。另外，本研究中呈现在屏幕上的目标刺激是直到按键反应后才消失的，从信息加工角度来看，被试有足够的时间完成信息产生和保持的加工任务，若把两个阶段分离开来进行研究，可能会有助于澄清形状和角度信息之间的表征关系，并进一步验证上面提出的一般化机制。综上，我们预测，形状和角度信息之间可能既不是完全的独立表征也不是简单的联合表征，它们之间可能是一种较为精确的非线性函数关系。所以未来研究可按照时间进程分阶段设计实验，对形状和角度信息进行更纯净的研究。

(2)旋转方式对角度启动效应的影响。三维物体识别研究中除了对平面旋转方式进行操作外，对深度旋转方式进行的研究具有更鲜明的应用价值和生态效度。研究发现当人们完成无意识关注角度的间接任务时，旋转方式对物体识别影响不大；当人们完成有意识关注角度的直接任务时，不同旋转方式下识别成绩不同。这是因为变化旋转方式是对变化角度的一种操作，对旋转方式进行加工就是对角度信息进行加工，故旋转方式影响到了需要关注角度时的识别成绩，这符合人们的生活常识。也有研究证明角度的深度旋转更接近三维物体旋转的真实情况(Busey & Zaki，2004)，故深度旋转方式下的识别成绩更好。

我们的研究认为，在某种程度上以观察者为中心理论能够更好地解释三维物体的深度旋转现象。以往研究也发现当物体进行不同角度旋转之后，几个图形按照角度的大小顺序以序列(与物理旋转一致)方式呈现时识别成绩好于按随机顺序呈现时(Vuong & Tarr，2004)。也就是说，视觉图形的真实呈现方式与模拟心理旋转的出现顺序一致时，有利于物体识别，心理旋转是导致角度依赖性的原因。神经心理学的研究也发现，角度变化的识别任务不仅激活了腹侧视觉通路，也激活了背侧视觉通路(Ganis，Schendan，& Kosslyn，2007)，这均与以观察者为中心理论的观点一致。然而，也有研究指出，角度依赖性的事实并不是支持以观察者为中心理论的充分条件，它也许只是反映了神经元对相同表征的激活会表现出不同的敏感性，对相同角度的物体，神经元的激活程度也会不同(Bar，2001)。那么角度依赖性在多大程度上能代表以观察者为中心理论的基本观点，以观察者为中心理论除了角度依赖性这个必要条件外，还存在哪些特征，则有待于未来研究。

我们的研究说明也许角度独立现象和角度依赖现象分别出现在物体识别的不同加工阶段。因为角度依赖性的测量范围应该包括从几乎完全的角度独立到几乎完全的角度依赖。但是，事实上我们却在实验研究中看到要么是角度独立的要么是角度依赖的。这与我们的期待相反。而且，角度独立或角度依赖效应的大小还依赖于识别任务的难易程度。我们研究发现，直接任务下识别成绩较好。也有研究发现采用样例匹配任务，定性区别三维物体的特征并在每次实验后给出反馈，这样识别成绩就接近于角度独立时(Biederman & Gerhardstein，1993)。然而，采用不同的识别任务，如序列匹配、物体命名、不给予反馈三种任务，识别相同的三维物体则是角度依赖的(Hayward & Tarr，1997)。也有一些研究检验了在多大程度上是角度依赖多大程度上是角度独立的一些情况，结果发现做任何这样的解释，都是牵强的。例如，研究发现当物体的两维特征能够由独立的一维特征以顺序区分时，识别是角度独立的；当仅能使用两维特征来区别时，识别是角度依赖的(Tarr & Pinker，1990)。类似地，研究也发现仅包括独立部分的三维物体比包括部分之间空间关系的三维物体识别表现出更少的角度依赖性(Tarr，Bülthoff，Zabinski，& Blanz，1997)。Jokisch，Daum和Troje(2006)认为基础水平的物体识别更多表现出角度独立性，高水平的物体识别更多表现为角度依赖性。物体识别究竟是角度独立还是角度依赖需要考虑物体的表征类型和具体的表征水平(Foster & Gilson，2002)。新近，Teramoto和Riecke(2010)研究发现采用观察者的自我旋转代替物体自身的客体旋转可以使物体识别的角度依赖性降低甚至消失。所以，一个可行的物体识别模型必须能够解释从角度独立到角度依赖的连续性，也要能够解释物体识别在一种情况下的多种不同价值。

基于以上综合分析，我们认为物体识别既离不开结构信息的表征也离不开视图信息的表征。只考察形状信息的结构描述和只关注角度信息的视图识别均是片面的，物体识别是多因素综合作用的结果。基于丰富两种理论的思考，研究者们进行了多方面的努力(Peissig & Tarr，2007；Lee，Kim，K.，Kim，J.Y.，Kim，M.，& Yoo，2010)。Newell等人(2005)提出形状和位置联合表征的识别模型。生理机制方面的研究也支持了两种理论整合的设想。Fazl等人(2009)提出的ARTSCAN(Adaptive Resonance Theory of Scanning)模型认为人们把识别角度信息作为识别物体的一个眼动扫描过程，从“what”和“where”两条通路来联合表征形状和角度信息的。最新研究结果也支持了物体识别是形状表征系统和位置表征系统联合作用的观点(Lee & Spelke，2010)。Grossberg和Vladusich(2010)提出的CRIB(Circular Reactions for Imitative Behavior)模型也认为儿童是通过颞叶的“what stream”、顶叶的“where stream”和额叶的“how stream”联合表征识别物体的。所以，进一步的研究应注重把行为研究与能进行实时监控的眼动、脑成像等研究结合起来，发展出能更全面揭示物体识别心理表征机制的理论模型。

最后，本研究也如多数物体识别研究一样，通过分析旋转角度和识别成绩的关系来间接推测物体识别的过程。但是，识别成绩的直接影响因素是图形本身的变化，完善的实验研究应该是分析物体变化与识别成绩的直接关系，而且应该全面分析物体随着深度旋转角度的变化而发生变化的趋势。

5 结论

研究发现，(1)形状和类别空间关系信息影响物体识别，表明以物体为中心理论对物体识别表征机制解释的合理性。(2)角度可能独立于形状信息表征，深度旋转方式下的识别成绩优于平面旋转，表明以观察者为中心理论能够更好的解释深度旋转现象。(3)也许角度独立和角度依赖现象分别出现在物体识别的不同加工阶段，只考察形状信息的结构描述和只关注角度信息的视图识别均是片面的。研究为更全面系统的分析物体识别的心理机制提供了实证依据。

标签：启动效应论文; 组合模式论文;

三维物体识别的心理表征：角度依赖还是角度独立_启动效应论文

猜你喜欢