“递归假设”及其证据:基于儿童递归能力发展的实验研究_递归论文

“唯递归假说”及其证据———项基于儿童内递归能力发展规律的实验研究,本文主要内容关键词为:递归论文,假说论文,发展规律论文,证据论文,实验研究论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

      在数学与计算机科学中,递归指在函数的定义中重复使用函数自身的方法。例如,“成吉思汗的后代”的定义是:如果某个人的父亲是成吉思汗,或者某个人的父亲或母亲是成吉思汗的后代,那么这个人就是成吉思汗的后代。从上世纪中期起,递归这一概念开始进入语言学领域,例如生成语法将递归看成是句子生成的重要计算机制(Chomsky 1957/2002,1995),功能语法指出短语、句子、语篇和语用中皆存在递归现象(Levinson 2013,2014;陆丙甫1983;黄国文1998;钱冠连2001)。2002年,Hauser、Chomsky和Fitch在《科学》杂志上发表文章,提出“唯递归假说”(the Recursion-Only Hypothesis,ROH),将递归在语言中的地位提升到前所未有的高度。ROH认为,狭义上的语言机能只包括递归这一计算机制,且递归为人类自然语言所特有,是人脑的先天属性,其他动物的交际系统中没有递归。

      人们对ROH的理解和著名的“乔氏层级假说”密切相关①。“乔氏层级假说”指出:语法有“有限状态语法”(Finite-State Grammar,FSG,即下页图1中的小圆)和“语境无关语法”(Context-Free Grammar,CFG,即图1中的大圆)两个不同层级;FSG包括

语法(也称迭代(iteration)),可生成并列结构和尾递归结构(尾递归(tail recursion)又包括左递归和右递归),比如图1中的

(即ABAB);而CFG还包括

语法(也称内递归(center-embedded)),生成内递归结构,比如图1中的

(即AAABBB)(参见Fitch & Hauser 2004:378;Petersson et al.2012:84)。“乔氏层级假说”提出后,人们一直在思考和争议:人类自然语言的语法到底是FSG还是CFG(Pullum & Gazdar 1982;Roche & Schabes 1997)?是否只有人类自然语言中存在

语法/内递归,其他动物的交际系统中不存在该语法(Liberman 2004;Martins & Fitch 2014:21)?对此,绝大多数研究者(如Gentner et al.2006;Hochmann et al.2008;Lai & Poletiek 2010;Poletiek 2011;Abe & Watanabe 2011;Levinson 2013,2014;Lowenthal & Lefebvre 2014:V)都自然而然地认为,ROH中的递归实质上就是内递归。虽也有研究者(如Fitch 2010;Roeper 2011;Pérez-Leroux et al 2012;Martins & Fitch 2014)认为ROH中的递归既包括了内递归,也包括了尾递归和其他递归,但可以肯定的是,内递归在ROH中具有核心地位。

      Fitch & Hauser(2004)采用“人工语法学习范式”对成人和棉顶猴进行对比实验②,尝试从声学型式角度来证明内递归为人类自然语言所特有,因此人类自然语言的语法是CFG。这一研究被很多人(比如Gentner et al.2006;Hochmann et al.2008;Abe & Watanabe 2011:Lowenthal & Lefebvre 2014和Levinson 2013,2014)认为就是用来证实ROH的。

      

      反对ROH的人主要从两个角度来证伪ROH:其一,认为八哥等其他动物也能习得

语法/内递归。Gentner et al.(2006)做了与Fitch & Hauser(2004)思路相似的实验,但得出了相反结论。他们断定八哥能后天习得(acquire postnatually)内递归。Abe & Watanabe(2011)也对八哥做了类似实验并支持该结论。其二,认为人类是在使用的基础上习得内递归的,也就是说,内递归的习得过程是一种后天经验积累的过程,内递归不是人类生来就有的知识,不是人脑的先天属性,此为“基于使用的内递归假说”。其中,Christiansen & MacDonald(2009)在连接主义心理语言学视角下设计了一个基于使用的内递归“简单循环电脑网络”(Simple Recurrent Network,SRN)。他们发现,SRN对内递归结构的处理与人脑对内递归结构的处理极为相似,且SRN能很好地预测人脑对内递归结构的使用规律,尤其是不同级别内递归(如

)的使用规律,因此他们认为,人脑和电脑其实是一样的,都能在使用的基础上从经验中总结规律并逐步学会内递归语法,所以内递归不是人脑的先天属性。

      然而,Lowenthal & Lefebvre(2014:V)指出,以往研究都从未对“递归”给出确切的界定,因此结论之间缺乏可比性和连贯性,语言和递归的关系也就至今不明确。Martins & Fitch(2014:16-17)指出,以往的递归研究主要存在三个问题。其一,不同研究领域对“递归”的界定不同,导致结论之间缺乏可比性和连贯性。其二,递归涉及运算(algorithm)、结构(structure)、思维复现能力(mental representational ability)等不同层面,一个层面的结论不一定适合于另外的层面。例如,递归运算和迭代运算都可生成递归结构。又如,个体虽能产出递归结构,却有可能没有该结构的思维复现能力,就像个体能产出心跳时间系统却没有该系统的思维复现能力一样。其三,如果要弄清语言与递归的关系,从而解决模块论-超模块论(modularity-supramodularity)之争,就必须有一个适合于这两个理论假设的递归定义,然而从未有人给出这样的定义。Pérez-Leroux et al.(2012)指出,儿童语言递归能力的发展研究对揭秘语言-递归关系非常重要,然而这方面的研究甚少,只有Roeper & Snyder(2005)和Roeper(2011)等几篇文章。而且Roeper和Pérez-Leroux等人的研究只涉及尾递归,没有涉及更为重要的内递归。

      基于以上研究现状,本文试图在明确“递归”定义的前提下,通过调查儿童内递归结构理解和产出能力的发展规律来推测该递归界定下ROH的合理性。

      2.什么是递归?

      Martins & Fitch(2014:16-18)认为,要了解语言与递归的关系,必须有一个既适合于模块论又适合于超模块论的递归定义。他们尝试通过厘清递归、嵌套(hierarchical embedding)和迭代三者的关系来给出这样的定义:迭代是指程序中对指令的重复,分三小类,即非嵌套性迭代(比如“ABC…”)、嵌套性兼非递归性迭代(比如“[[[A]B]C]…”)、嵌套性兼递归性迭代(比如“[ALPHA[ALPHA[ALPHA]]]...”);嵌套是指成分之间的控制-从属(dominance-subordination)关系,分四小类,即非递归性兼非迭代性嵌套(比如“[B[A]]”)、递归性兼非迭代性嵌套(比如“[ALPHA[ALPHA]]”)、迭代性兼递归性嵌套(即嵌套性兼递归性迭代)、非递归性兼迭代性嵌套(即嵌套性兼非递归性迭代);而递归是指同一类型成分之间的嵌套,分两小类,即非迭代性递归(即递归性兼非迭代性嵌套,也称“一级递归”)和迭代性递归(即嵌套性兼递归性迭代,也称“二级及以上递归”)。图2标示了这三者的关系和例子。

      

      

      Martins & Fitch(2014:17)进一步指出,“典型的递归既涉及嵌套也涉及迭代”,也就是说,只有迭代、嵌套和递归的交集部分(见图2)才是典型的递归。因此,非迭代性递归(即一级递归)不是典型的递归,只有迭代性递归(即二级及以上递归)才是。与此类似,Roeper(2011)也认为,二级及以上递归才是真正的递归,因此至少要二级递归能力的获得才能真正反映儿童递归能力的获得。他们还强调说,在运算、结构、思维复现能力三个层面中,思维复现能力最为重要,因为解码任何一种运算或结构都需要具备相应的思维复现能力,例如解码递归运算或递归结构就需要具备递归的思维复现能力;而反映某一个体具备某一思维复现能力的标志性行为特征就是该个体能在低一级结构的输入后创造出输入中并不存在的高一级结构。这一标志性行为特征也就成为研究者探索个体递归能力的重要研究对象。因此递归的更为确切的定义是:“递归是指同一类型成分进行迭代性嵌套的思维复现能力,该能力使个体能在低一级递归结构的输入基础上创造出输入中并不存在的高一级递归结构”(Martins & Fitch 2014:17)。

      3.儿童内递归能力发展规律的调查实验

      以上递归界定表明,Fitch & Hauser(2004)、Gentner et al.(2006)和Abe & Watanabe(2011)的声学型式上的所谓“内递归”都不是递归。这是因为,其一,这种声学型式上的所谓“内递归”并不是嵌套(Martins & Fitch 2014:21);其二,他们所测试的并不是思维复现能力,因为他们并没有测试猴子或八哥对那些比训练的结构还要高一级的新结构的识别能力。因此他们的实验证明不了其他动物能否习得内递归,也就无法证实或证伪ROH(Corballis 2007,2011)。本文接下来通过实验来研究3~10岁儿童内递归能力的发展规律,并尝试从这一角度来推测ROH的合理性。

      3.1 实验思路

      首先,根据Martins & Fitch(2014)和Roeper(2011)的观点,二级递归才是真正的递归,至少要二级递归能力的获得才能真正反映儿童递归能力的获得。因此,本文旨在研究儿童二级递归能力发展规律,并通过与一级递归能力发展规律的比较来突出二级递归能力的发展规律。

      其次,大多数研究者认为,ROH中的递归实质上指内递归。因此,本文旨在研究儿童内递归能力的发展规律,并根据这些规律来推测ROH的合理性。

      再次,Karlsson(2007)指出,在Brown书面语语料库中,虽然57%的英语句子中有递归,但从未出现过像

这样的二级及以上内递归;英语口语中也从未出现过这样的二级及以上内递归。就汉语而言,陆丙甫(1983:25)也指出,汉语书面语和口语中存在各种递归结构,但“[这是[想打[咬猪]的狗]的猴]”和“[这是[赶走了[吃了[放在房子里]的麦芽]的耗子]的猫]”等二级及以上内递归是“完全不合格的”,“实在不堪记忆,所以在口语中是绝对通不过的”。本文则认为,二级及以上内递归完全合乎语法且意义明确(另见Chomsky & Miller 1963),之所以这类表达不大可能被使用,是因为日常生活中很难出现支持这类表达的复杂语境;只要在实验中设计出相关的复杂语境,这类表达就容易使用。有意思的是,儿童平时虽有一级内递归结构的输入但没有二级及以上内递归结构的输入这一特殊情况给本实验提供了很好的思路,本文正好调查,在这种特殊情况下,儿童到底能否习得以及何时习得二级内递归结构?这些问题的回答与ROH是否合理直接相关。

      最后,Chomsky & Miller(1963)以及Folia et al.(2011)指出,二级及以上内递归结构虽然不大可能被使用,但它确实完全合乎语法且意义明确,只是某些信息处理因素(如短时记忆)会限制其使用。Adani(2011)也指出,语法能力、信息处理和语用这三方面的因素都有可能影响语言使用,所以在测试儿童某一语法能力时我们首先必须尽可能排除信息处理和语用因素的干扰。为了有效地调查出3~10岁儿童内递归能力的发展规律,尽可能地减少信息处理和语用因素对实验结果的干扰,本研究采用两种实验方法:“看图-诱导产出”法和“看图-听题-选图”法。

      3.2 实验一“看图-诱导产出”实验

      实验一包括测试题1和2。每一测试题都包含诱导语和图片,做成动画后用电脑播放。由于受试儿童首先必须理解诱导语中的内递归结构及其语境,然后才能产出预期的内递归结构,所以本实验能测试儿童内递归结构的“理解+产出”能力。由于本实验重点是测试儿童内递归结构的产出能力,因此采用偏见性(biased)语料④,以促进儿童顺利地产出预期答案。测试题1的预期答案是一级内递归:(这个是)想吃骨头的狗。测试题2的预期答案是二级内递归:(这个是)牵着戴帽子的狗的哥哥或(这个是)牵着没戴眼镜的狗的哥哥。

      测试题1 诱导语:图中有两只狗(此时动画中的两只狗同时闪烁),这(此时动画中有一个手形图指着左边的狗)是想吃肉的那只狗,那这个(此时动画中的手形图移向右边的狗)呢?

      测试题2 诱导语:图中有两个哥哥(此时动画中的两个哥哥同时闪烁)。这(动画中有一个手形图指着左边的哥哥)是牵着戴眼镜的狗的那个哥哥。那这个(动画中的手形图移向右边的哥哥)呢?

      

      

      受试包括天津176名3~6岁儿童和陕西西安88名7~10岁儿童,有效人数共259人,其中3岁儿童30人(平均年龄(M)=3;06.0),4岁儿童53人(M=4;06.3),5岁儿童45人(M=5;05.2),6岁儿童43人(M=6;05.3),7岁儿童20人(M=7;05.1),8岁儿童21人(M=8;05.8),9岁儿童20人(M=9;06.7),10岁儿童27人(M=10;04.2),男女比例基本一致。同时对21名20~26岁成人做了对比实验。计分方式是1和0,用预期答案回答的计为1,采用其他答案或未答的计为0。数据采用SPSS进行分析。结果如下:

      

      表1是各测试题中各年龄段受试的得分平均值,也就是各年龄段受试中能给出预期答案的受试的百分比,比如就测试题1而言,3岁受试中有60%的受试能给出预期答案。由表1可知,测试题1中,3岁起就有大多数受试能用预期的一级内递归来回答,即“(这个是)想吃骨头的狗”。其他答案中,大部分是“骨头、骨头狗”等碎词,少数是“想吃骨头”等陈述句。就测试题2而言,7岁起才有较多受试能用预期的二级内递归来回答,即“(这个是)牵着戴帽子的狗的哥哥”或“(这个是)牵着没戴眼镜的狗的哥哥”。其他答案中,大部分虽然含有以“哥哥”为中心语的关系结构,但不是预期的内递归结构,比如“他的狗不戴眼镜所以他是不戴眼镜的哥哥”,“戴帽子的狗的那个哥哥”,“狗没戴眼镜的哥哥”;少数含有以“狗”为中心语的关系结构,比如“不戴眼镜的狗”;少数是陈述句,比如“戴眼镜的哥哥拉着戴帽子的狗”。

      

      

      

      Tukey事后比较检验进一步表明,测试题1中,3岁受试与成人受试间有显著差异(p=.000),但4~10岁受试都分别与成人受试间无显著差异(p值分别是.937,.506,.951,1.000,1.000,1.000,1.000),可见,总的说来4岁起儿童具备了一级内递归结构的“理解+产出”能力;而测试题2中,3~7岁受试都分别与成人受试之间有显著差异(p值分别是.000,.000,.000,.000,.002),但8~10岁受试都分别与成人受试之间无显著差异(p值分别是.726,.154,.104),说明8岁起儿童才具备二级内递归结构的“理解+产出”能力。

      3.3 实验二“看图-听题-选图”实验

      实验二包括测试题3和4。每一测试题都包含提问和图片,做成动画后用电脑播放。本实验旨在调查儿童内递归结构的理解能力,因此采用非偏见性语料,以减少语用因素对实验结果的干扰。在正式测试前,训练受试对“圈出来”的理解和操作,同时让受试熟悉动画中的动物,以减少其他因素对测试结果的干扰。

      测试题3:哪个是正在追兔子的那只狗?请把它圈出来。

      测试题4:哪个是想打咬猪的狗的那只猴?请把它圈出来。

      

      

      表4是各测试题中各年龄段受试的得分平均值,也就是各测试题中各年龄段受试中能给出正确答案的受试的百分比。由表4可知,测试题3中,4岁起受试中就有绝大多数能给出正确答案;而测试题4中,7岁起才有大部分受试能给出正确答案。

      

      进一步对数据进行重复测量方差分析。主体内因子为两个测试题,主体间因子为九个年龄组。Mauchly球形度检验表明条件没有满足(p=.000),因此采用主体间效应检验(表5)和主体内对比检验(表6)来分析结果。表5显示年龄存在显著的主效应(

,p=.000),说明受试年龄的不同会显著地影响成绩(即正确答案的出现)。表6显示测试题也存在显著的主效应(

,p=.000),说明测试题3与4之间也存在显著差异。

      

      

      Tukey事后比较检验结果进一步表明,测试题3中,3岁受试与成人受试间有显著差异(p=.000),但4~10岁受试都分别与成人受试间无显著差异(p值分别是.183,.335,.430,1.000,.995,1.000,1.000),可见,总的说来4岁起儿童已具备一级内递归结构的理解能力;测试题4中,3~6岁受试都分别与成人受试间有显著差异(p值分别是.000,.001,.008,.002),但7~10岁受试都分别与成人受试间无显著差异(p值分别是.874,1.000,.874,.837),这说明7岁起儿童才具备二级内递归结构的理解能力。

      Gentner et al.(2006)和Abe & Watanabe(2011)认为八哥在短短几小时的训练后就能习得内递归,因此证伪ROH。本研究不支持他们的观点。原因如下:

      其一,递归必须是一种嵌套(Martins & Fitch 2014),而Gentner et al.(2006)和Abe & Watanabe(2011)实验中的声学型式上的“内递归”不是嵌套,也就不是内递归,他们的实验也就证明不了八哥能习得内递归,更证伪不了ROH。

      其二,本文实验数据显示,虽然儿童4岁时就已具备一级内递归结构的理解和产出能力,但7岁时才具备二级内递归结构的理解能力,8岁时才具备二级内递归结构的产出能力。既然二级递归才是真正的递归,二级递归能力的获得才能真正反映儿童递归能力的获得(Roeper 2011;Martins & Fitch 2014),那么本文实验结果表明,儿童获得内递归能力的时间很晚,要到7、8岁。而且,实验一测试题2中预期答案以外的其他答案也清楚地显示,7、8岁前的儿童因还没习得二级内递归结构,所以很难像成人那样轻而易举地效仿诱导语中的二级内递归结构而产出相应的二级内递归结构。大多数答案虽也含有以“哥哥”为中心语的关系结构,但不是预期的结构。这些答案可分为四类。第一类如“他的狗不戴眼镜所以他是不戴眼镜的哥哥”,“不戴眼镜的哥哥”,“戴帽子的哥哥”。值得注意的是,因为在图4中“哥哥”戴眼镜但不戴帽子,而“狗”不戴眼镜但戴帽子,所以这类表达中的“不戴眼镜/戴帽子”实质上是指“狗不戴眼镜/狗戴帽子”。“他的狗不戴眼镜所以他是不戴眼镜的哥哥”这一答案更是直接支持这一点。这类表达不合成人语法。第二类比如“戴帽子的狗的那个哥哥”,“没戴眼镜的那个狗的哥哥”。这类表达比第一类表达略好,但也不合成人语法。第三类比如“狗没戴眼镜的哥哥,狗戴帽子的哥哥”。这类表达比前两类好,合乎成人语法(类似于“女儿有出息的老妇”,“叶子掉光了的大树”等表达)。第四类比如“这是牵着没戴眼镜的哥哥”,“牵着戴帽子的哥哥”。由于在图4中“哥哥”戴眼镜但不戴帽子,“狗”不戴眼镜但戴帽子,所以这类表达表明受试正尝试着产出预期答案“这是牵着没戴眼镜/戴帽子的狗的哥哥”,但最终还是失败,这类表达也不合成人语法。其他答案,比如“不戴眼镜的狗”等以“狗”为中心语的关系结构和“戴眼镜的哥哥拉着戴帽子的狗”,“哥哥牵着没有眼镜的狗”等陈述句则表明受试没能理解诱导语中的二级内递归结构,也就不会产出相应的二级内递归结构了。总之,儿童二级内递归能力的获得很晚,要到7、8岁,而在此之前,儿童很难理解并产出二级内递归结构。由此可以推测,Gentner et al.(2006)和Abe & Watanabe(2011)所认为的其他动物能在短短几小时的训练后就能获得二级甚至三级内递归(即

)能力的结论并不可信。

      Christiansen & MacDonald(2009)等的“基于使用的内递归假说”认为递归是基于使用的偶然出现,与递归结构的经验接触息息相关,是后天经验的积累,不是人脑的先天属性。本研究也不支持这种观点。根据Karlsson(2007)的统计和陆丙甫(1983)的分析,英、汉语(尤其是口语)中都不可能出现二级内递归结构,也就是说,儿童不可能听过或读过二级内递归结构。如果递归真的是基于使用的偶然出现,是后天经验的积累,那么儿童就不可能习得二级内递归结构。可本实验结果清楚地显示,从4岁起,每个年龄阶段中都有或多或少的儿童(详见表1和4中的数据)能理解和产出从未听过或读过的二级内递归结构。这显然是“基于使用的递归假说”所无法解释的。而且,不管是在实验一还是实验二中,本文实验结果都显示,年龄存在显著的主效应,即受试年龄的不同会显著地影响预期答案或正确答案的出现。既然所有受试都从未听过或读过二级内递归结构,那么年龄存在显著的主效应的事实也是“基于使用的内递归假说”所无法预料和解释的。这两个事实都充分说明,内递归是人脑的先天知识和先天属性。Christiansen等人的“基于使用的内递归假说”也就不攻自破了。

      根据Martins & Fitch(2014)的观点,判断某儿童是否具有内递归能力的标准就是看他能否在已经习得一级内递归结构的基础上创造性地习得不曾听过或读过的二级内递归结构。本研究的实验结果表明,虽然儿童4岁时就已获得一级内递归结构的“理解+产出”能力,但要到8岁时才能创造性地获得不曾听过或读过的二级内递归结构的“理解+产出”能力;虽然儿童4岁起已获得一级内递归结构的理解能力,但要到7岁时才能创造性地获得不曾听过或读过的二级内递归结构的理解能力。在8岁之前,儿童很难理解并产出二级内递归结构;而在8岁之后,儿童能轻而易举地理解并产出二级内递归结构。这样的儿童内递归能力发展规律,只能用乔氏语言习得理论体系下的关于儿童语言能力和其他生理器官一样经历特定发育成熟过程的“儿童语言发育成熟理论”(the Maturation Theory)(Wexler 1990,2004)才能得到合理解释。按照这一理论,内递归能力是儿童的天赋能力,但需要一个逐步发展成熟的过程,而且一定要到特定时段才能自然而然地习得,正如儿童一定要到6岁左右才开始换牙一样。这样的语言能力发展规律一直是儿童语言习得研究中用来证明语言天赋假说的一个重要证据,本研究揭示的儿童内递归能力的发展规律只能在递归天赋假说即ROH中才能得到合理的解释。

      ①“乔氏层级假说”(Chomsky Hierarchy)(Chomsky 1959)指出四种形式语法,对应四个层级。除了本文提到的两个层级外,还有第三个层级“语境相关语法”(Context-Sensitive Grammar)和第四个层级“递归性可枚举语法”(Recursively Enumerable Grammar)。

      ②实验过程大致如下:有A、B两类音节,A类包括{ba,di,yo,tu,la,mi,no,wu},由女声朗读,B类包括{pa,li,mo,nu,ka,bi,do,gu},由男声朗读。从A、B中随机抽取音节,构成第一组64个(

音串(如1a),第二组64个

音串(如1b)。从第一组中拿出60个音串来给第一群猴听20分钟,从第二组中拿出60个音串来给第二群猴听20分钟。剩下的8个音串用于第二天的正式测试。其结果是,第一群猴听到

音串后有34%扭头看,听到

音串后有72%扭头看,两者之间有显著差异;第二群猴的相应数据为29%和31%,无显著差异。说明棉顶猴能习得

语法,不能习得

语法。对比实验显示成人能习得两种语法。

      (1)a.

:no li ba pa;

:la pa wu mo no li

      b.

:yo la pa do;

:ba la tu li pa ka

      ③二级递归不同于二级左/右/内递归,前者可以是混合型的,后者不是。

      ④以“吃肉的狗”为例,即使说成“肉吃的狗”,也会被理解成“吃肉的狗”,此为偏见性语料。“追猫的兔子”则是非偏见性(unbiased)语料。

标签:;  

“递归假设”及其证据:基于儿童递归能力发展的实验研究_递归论文
下载Doc文档

猜你喜欢