认知偏差与理性选择--基于最后通牒博弈实验的认知博弈_最后通牒博弈论文

认知偏差与理性选择——基于“最后通牒博弈”实验的认知博弈，本文主要内容关键词为：认知论文,最后通牒论文,偏差论文,理性论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

“最后通牒博弈”(Ultimatum Game)实验的形成可以追溯到谢林(Schelling，1957)的工作。(注：谢林为两个参与人准备了100元，每个人写一个要求得到的数字。如果两人总和小于100元，按个人要求给报酬。如果两人要求之和大于100元，则双方什么也得不到。这个实验后来被改编成最后通牒博弈实验。该实验有不同的版本，论文引用的是高鸿帧主编的《实验经济学》教材。)最早进行“最后通牒博弈”实验的是德国洪堡大学谷斯(Cuth et al.，1982)等人。桑塔菲研究所博厄得等(Boyd et al.,2001)15位人类学家和经济学家历时10年，以横跨15个不同国家、不同民族、不同文化背景为样本进行 “最后通牒博弈”实验，结论大致为，低于20%的要约有40%—60%的概率被拒绝。根据经济学的理性假设，处于1%—20%之间的要约是符合纳什均衡的，不应该被拒绝。许多经济学家用追求公平的动机来解释这种拒绝正收益的行为。同时，许多游戏参与者也表示因为害怕过低要约被拒绝，因此主动提供一种较“公平”的要约(Guth et al.,1982; Camerer and Thaler,1995;Roth,1995;Camerer,2003)。霍夫曼和麦卡布(Hoffman and McCabe，1998)的实验表明，真实收益的大小对最后通牒博弈行为几乎没有任何影响。卡麦拉(Camerer，1999)在印尼进行的“最后通牒博弈”实验也大致证明了这一点。图尔博格(Tullberg，1999)的最后通牒实验考察了不同教育背景的被试对“公平”的理解差异。此外，许多经济学家认为，“听话博弈(Dictator Game,DG)”(Forsythe，1994) 、“礼物交换博弈”(Fehr et al.，1993)和“信任博弈(Trust Games,TG)”(Berg et al.，1995)均可看成是“最后通牒博弈”实验的扩展。

实验经济学在我国刚刚起步。汪丁丁、叶航等学者曾引用过“最后通牒博弈”实验。但是，国内还没有学者对“最后通牒博弈”进行过实验。经济学家大多用“最后通牒博弈”实验说明公平等非理性因素对选择行为的影响，以此来否定主流经济学的“理性人假设”。本文运用“最后通牒博弈”实验主要检验决策中的认知偏差与思维的路径依赖性。行为经济学证明，在不确定性条件下人们的选择会系统偏离理性。本文通过实验问卷发现，即使在确定性条件下，也存在不同程度的认知偏差与框架效应。

论文由三部分构成。第一部分介绍问卷实验的理论假设、总体设计与实验的内容；第二部分通过对实验结果的总体分析验证我们的理论假设；第三部分是结论与实验需要进一步探索的问题。

一、理论假设与实验设计

(一)理论假设

1.有限理性

阿马蒂亚.森指出，主流经济学定义理性行为的方法有两种，其一是把理性视为选择的内部一致性；其二是把理性等同于自利最大化。(注：Amartya Sen，1987：《伦理学与经济学》(中译本)，商务印书馆2000年，第18页。)我们的理性兼有这两方面的含义。西蒙(Simon 1957)认为，人是“有预期理性的，只不过是有限度而已”。西蒙的有限理性假设和“把理性选择看成是决策”的观点是我们问卷实验的理论基础。

如果把理性简单地定义为“约束条件下的最大化”，那么由于有限理性的原因导致人们对约束条件的认知不充分。在“最后通牒博弈”实验中，有两种权力——分配权(“ 先行者优势”)与否决权(“后发优势”，即最后通牒性)，这两种权力的价值是不同的。参与人A、B对这两种权力的认知评价可能存在偏差，如：A需要“设身处地”思考B的否决权及B对自己分配权的认同，如果A无法从B的私有信息中判断B的类型，那么A不得不以自身对这种权力的认知作为参照。同样，对于B，存在一个对A的分配权认同以及A 对自己否决权认知的预期问题。

2.主观博弈模型

主流博弈论研究参与主体之间的行为均衡。德泽和诺斯、青木昌彦(Denzau & North,1 994;Masahiko Aoki,2001)等人强调个体参与人主观博弈模型与其他参与人的主观博弈模型之间的互动。我们认为，实际博弈行为在很大程度上是一种认知信念的博弈，是不同行为主体的认知均衡。在“最后通牒博弈”实验中，仅仅是理性的逻辑推理不足以说明均衡的形成。博弈的均衡很大程度上取决于A、B对权力认知和评价而产生的信念是否一致。这种信念又是以自身为参照的。在下图1对否决权的认知中，作为提出分配方案的A，如果面临的状况是a、b，就会提出比较公平的分配方案。如果是d，可能会提出接近(99，1)理性最大化分配方案。如果是c，那么交易无法达成。

3.认知偏差与框架效应

卡内曼和特维斯基(Kahneman and Tversky,1979,1986)通过一系列实验(简称KT实验) 证明人们的实际决策行为偏离传统期望效用理论。由于框架效应、分离效应和可得性启发法等认知偏差使得人们无法做出符合传统理性决策模型的行为。框架效应指在不确定状态下，行为人的选择不仅与不同行动方案的预期效用有关，更与这些行动方案与基准点的偏离方向有关。根据基准点，当行动方案代表的是“收益”时，行为人是风险厌恶的，当行动方案代表的是“损失”时，行为人是风险偏好的。可得性(availability)启发法指人们倾向于根据一个客体或事件在知觉或记忆中的可得性程度来评估其相对频率，容易知觉到的或回想起的被判定为经常出现。这是一种典型的根据认知难易程度来选择和加工信息。我们定义的框架效应比行为经济学家要广。我们把框架效应理解为：行为主体不是或较少依赖新信息，而是依赖过去经验或赋予过去经验更高权重的一种信息加工方式。它实质上是一种认知或思维的路径依赖。

(二)概念说明

为了简化，本文对一些专门述语特作说明。“一般条件”指对这一笔钱的来源、A和B 的个人信息未作任何说明。本实验中，我们设计了三种分配权的不同表述：一是A提出分配方案X，B得X，简称为“A提B得X”；二是B提出分配方案X，A得X，简称为“B提A得 X”；三是A提出分配方案，A得X，简称“A提A得X”。

(三)实验总体设计

整个实验分四次进行。第一次时间持续了20分钟至30分钟。第二次持续了10—15分钟。第三次用了5—6分钟。第四次，未知。因为经费问题，没有采用货币手段激励被试，而是用平时和期末成绩来激励学生。成绩的评价标准是陈述的理由与选择结果的一致性。

参加实验的学生都不知道在作实验。我们把它设计为三次课堂小测验和期末考试题，类似于企业的问卷调查和企业新产品试验。但不同的是，实验主持人对实验的背景和指导语实施了控制，与纯粹“客观”的问卷调查不同。表1是实验的总体设计。

(四)实验内容介绍

第一次实验内容：

实验1：现有100元奖金给A和B分享，由A先提出分配方案，即提出一个数X(以元为单位，0＜X＜100)，A得(100 - X)元，B得X元，再由B决定是否接受该方案，如果B接受，则按该方案分配奖金，如果B不接受则取消奖金，A和B两人均得0元。问：(1)如果你是A，你确定X为多少?(2)如果你是B，你接受的X数是多少?

实验2：(1)如果一富翁给乞丐A和B奖金100元，作为A，你该如何分配?作为B，你接受的X是多少?(第二组无此题)

第二次实验：实验1与第一次的实验1没有差别。但实验2是A提出方案，A得X。B接受的钱数设定了区间。我们故意漏掉了(51—60)这一区间。这样设计的目的是观察被试是否注意这一信息。实验2：

如果一个富翁给A和B两乞丐施舍100元，由乞丐A提出分配方案，即提出一个数X(以元为单位，0＜X＜100)，A得X元，B得100—X元，再由B决定是否接受该方案，如果B接受，则按该方案分配奖金，如果B不接受，富翁把钱收回。(1)如果你是乞丐A，将如何提出分配方案?(2)如果你是乞丐B，接受的钱数在下面哪个区间(要求单选，如果多选，只能双选，且必选之一有第10项)：

①(1—10)元； ②(11—20)元； ③(21—30)元；

④(31—40)元； ⑤(41—50)元； ⑥(61—70)元；

⑦(71—80)元； ⑧(81—90)元； ⑨(91—100)元；

⑩自己确定的具体数目( )

第三次实验与第二次实验设计的不同之处表现为：(1)实验1和实验2在谁先提出分配问题上也发生变化。实验1是由B先提出分配方案A得X。实验2由A先提出分配方案A得X。(2 )第一组的实验1在钱数的选项上增加了第二次实验中“漏掉”的区间(51—60)元，设为选项6。同样，第二组实验2也增加了(5100—6000)元选项。(3)第二组实验1和实验2在钱数上发生了变化。第一次、第二次实验的总钱数都是100。现在改为1000和10000。

第四次实验是期末考试的最后一个考题。除了对“奖金来源未告知”及在钱数上的差别外，它和第一次实验没有什么区别。在210名考生中，有效的被试只有113名。下面引用试卷的最后一道原题：

现有1000元奖金(奖金来源未告知)给A和B分享，由A先提出分配方案，即提出一个数X( 以元为单位，0＜X＜1000)，A得(1000 - X)元，B得X元，再由B决定是否接受该方案，如果B接受，则按该方案分配奖金，如果B不接受则取消奖金，A和B两人均得0元。问：( 1)你认为均衡解是什么?为什么?(2)请说明哪些因素会改变均衡。

二、实验的总体分析

(一)分配的总体分布

从表2可知，样本被试主要集中在40%与50%的分配区间。在一般条件下，随着实验次数的增加，愿意给予对方40%以下的奖金人数从20%左右下降到10%以下；愿意给予对方40% —50%钱数的被试趋于上升；愿意“给予”对方50%以上奖金的被试也趋于下降。在乞丐条件下，随着实验次数的增加，愿意给予对方50%以下钱数的被试人数呈上升趋势；愿意给予对方50%和50%以上钱数的被试呈下降趋势。

(二)对权力的认知偏差：“先行者优势”与“后发优势”

“最后通牒博弈”实验中，先提出分配方案的A或B可能具有“先行者优势”，接受或拒绝分配方案的被试具有否决权。样本被试是如何认知和评价这两种权力的?(见表3)

表3 分配权的认知与分配比例的变化

一般条件乞丐条件

第一次第一组

A提B得X：45.56A提B得X：35.53

实验 A为64.47

第二组

A提B得X：42.44

第二次第一组

A提B得X：43.56A提A得X：61.4

实验

A为56.44 B为38.6

第二组

A提B得X：44.28A提A得X：57.92

A为55.72 B为42.28

第三次第一组

B提A得X：48.01A提A得X：66.99

实验

B为51.99 B为33.01

第二组

B提A得X：473.58

A提A得X：6403.24

B为526.42 B为3596.76

第四次全体 A提B得X：460.23

实验 113名

我们的问卷实验表明，同一个群被试在不同的分配权力下表现为不同的行为特征。总体而言，先提出分配方案的被试，其行为特征表现为“少给”和“多得”，具有典型的经济人特征。在一般条件下，提出分配方案的被试如果是“给”对方钱数X，那么其均值总是小于钱数的50%，如45.56——42.44——43.56——44.28——48.01——473.58— —460.23。如果是自己提出分配方案，自得X，那么X的均值总是大于钱数的50%。在乞丐条件下表现得更加明显，主动提出分配方案者给对方分得更少，如35.53元，自己获得更多，如61.4元、66.99元和6403.24元。如表3所示。

图2是第一组被试在一般条件下在第一、二、三次实验中B所得分布。前100内样本数是第一次实验，第二次实验样本被试在第二个100中，200—300内的样本数是第三次实验的被试。从散点图可以看出，在“A提B得X”与“B提A得X”两种不同分配权下，B的所得存在差异。第一、二次实验中的B所得分布比较分散，大部分集中在50元以下；第三次实验中的B所得分布在40元以上，主要集中在50元以上。

图3是乞丐条件下，两种不同表达方式X的分布，“A提B得X”在第1—100内；“A提A得 X”在200—500之间。它说明同一组被试对无论站在哪一方都存在对先提出分配者“多得”的信念和认同。

但是，“先行者优势”受到“后发优势”即最后的否决权约束。在实验中主要表现为：(1)存在对否决权的高估或者说对分配权的低估现象。我们不能断定提出平均分配方案的参与者是因为对否决权的敏感性，但从四次实验中发现，有不少拥有分配权的被试愿意给予对方50%以上的钱数说明他们对否决权存在高估现象或对否决权过于敏感。图4表示不同实验组次中高估否决权的被试数。

(2)实验中有不少被试提出的X小于另一些被试接受的X，导致博弈失败。一般而言，只有博弈一方“给予的X”大于或等于另一方“接受的X”才能达成交易。以第一组为例，除乞丐条件外，第一、二、三次实验中，分别有8人、1人、15人接受的X大于另一方提出的X。

(3)从一般条件看，实验中给予对方钱数40%以下的被试不到20%。这说明，在被试博弈群体中，最大化理性的群体只是少数。大部分被试在利益最大化时考虑了另一方行使否决权的约束。

(二)锚定效应、框架效应与可得性启发法

(1)根据经济人假设，完全理性的参与人不会被表面的信息所“迷惑”，会始终如一地保持选择的一致性。但在实验中我们通过不同表述方式的变化观察被试的选择，结果表明，通过观察第四次实验的113名被试，总计只有18人(占总数的15.25%)在第一、二、三、四次实验中没有改变分配比例，其余84.75%被试的选择行为是根据我们设计的条件变化而变化。这说明被试对这些条件信息进行了认知加工。

图5表明，当实验主持人把实验的条件或情境改变后，X的分布发生了变化。前400的被试属于“A提B得X”，第400至500之间的被试属于“B提A得X”。

情境理性(situated rationality)还可以通过“一般条件”与“乞丐条件”比较说明。图6是第一组在第一、二、三次实验中“一般条件”与“乞丐条件”下不同分配区间被试分布的百分比，系列1表示一般条件，系列2为乞丐条件。最明显的特征是被试在“ 乞丐条件”下更理性，表现为给予对方钱数40元以下的被试超过了40%。

在KT前景理论中，发现人们对损失和获得的敏感程度不同。我们的实验也证明了这一点。在乞丐条件下，第一、二次实验“A提B得X”与“A提A得X”两种不同提法下A的所得变化。前者A与B的分配比例是1.82∶1，后者为1.38∶1。或者是B∶A从0.55∶1上升到0.73∶1。为什么A会多给?因为被试在不同的基准点方向上表现了不同的风险态度。前者是从损失的角度提出问题，对损失的感受是直接的，相对多得。后者是从收益获得的角度提出问题，被试感觉损失比较间接，相对多给。这都是行为人避免损失的心理反映。但框架效应不如KT实验那么明显和稳定。

(2)博弈的经验或认知记忆形成锚定效应(Anchoring Effect)。卡内曼和特维尔斯基

(Kahneman & Tversky，1973，1974)指出和证实了调整和锚定现象。它指在判断过程中，人们最初得到的信息会产生“锚定”。通过分析180名被试的第三次实验和113名被试的第四次实验，结论如下：在293人次中，有36名被试存在锚定效应，其中有两个被试出现两次锚定效应，占总被试人数的12.29%；总锚定效应次数为38次，占总次数的12.9 7%。锚定效应的类型为：对钱数值大小的依赖、对分配方式表述的依赖和对题目的依赖等。图4表明，大部分属于数值型锚定，说明前面几次不同钱数实验在被试中留下了认知记忆，导致被试没有根据新信息(1000元)加工信息，而是直接依赖于前几次的数值加工和处理信息。锚定效应还表现在实验1和实验2的理解上相互干扰，表现为把实验1的假设条件与实验2相混淆，出现了选择结果与陈述的理由刚好相反现象，违背了选择的内在一致性。同时，有少数被试在对问题的理解上存在“锚定效应”，即在分配上仍然 “锚”在“A提B得X”上，而没有发现分配方式的表达已改为“A提A得X”。

(3)框架效应与可得性偏差。主要表现为：第一、在第三次实验中，我们“故意”对实验2第2问的设计留有“问题”。一些区间不在选择之中，如0—100、1000—1100、2000 —2100之间的数，等等。在时间比较少的情况下，很少有被试多选。多选被试中，无一人选择选项之外的数值。显然这些数值是可能的。这说明被试存在对所列选项参照点的依赖。

第二、我们在实验2(第二次实验)选择区间的设定上“漏掉”了(50—60)元。统计结果是，第一组只有1人在自己确定的具体数目中填上了这个区间的数字51元。第二组有6人选择了这个区间。两组加在一起7人，占整个被试人数的4.38%。但在第三次实验中，我们在设计上把“漏掉的(50—60)元设为选项6。根据实验统计，第一组有20人选择了选项6，占总数(89人)的22.22%。第二组有15人选择了选项6，占总被试(89人)数的16.85% 。与第二次实验只有4.38%的被试相比，第三次实验总计有35人选择了选项6，占总人数的19.66%。如图7：

三、结论与进一步要思考的问题

为什么“最后通牒博弈”实验的参与人没有按照(99，1)理性最大化方式分配?可能有认知的原因。

(1)有限理性的参与人对竞争对手或自己在分配中的权力认知不充分，即存在认知和评价权力的信念不一致。实验中表现为对权力的认知偏差。被试普遍存在“先行者优势” 的认知，体现在同一群被试在行使分配权时表现出“多得”和“少给”的行为特征。分配权导致“给予”对方的钱数小于50%，“给予”自己的钱数大于50%。但是，这种优势是不充分的，也就是说，“先行者”并没有充分利用自己的优势提出最大化的理性分配方案。原因是受到“后发优势”——否决权的认知评价和约束。部分被试存在对否决权的高估现象。一般而言，否决权“约束”对方偏离平均分配方案10%左右，大部分均衡收敛于50%±10%内。实验的结果并不意味着拒绝理性假设，只不过有限度而已。

(2)博弈的经验可能会产生认知偏差影响博弈选择。在确定性条件下，同一类参与人在重复同一实验时，博弈的认知记忆(博弈经验)会产生锚定效应。实验的次数越多，越显著。大部分锚定现象表现为对钱数数值的思维路径依赖。不同分配方式表达的变化引起被试行为的变化说明人们的决策规则是理性逻辑与认知逻辑的统一。

(3)在确定性条件下可能存在损益敏感性问题，但不如KT实验明显和稳定。实验表明，从自身获得收益的角度表达问题，理性最大化的结果不是获得更多，而是失去得更多。而从损失的角度表达同一问题，获得相对更多。这种框架依赖说明初始信息的设定影响认知加工。主流经济学和信息经济学的一个基本观点是信息无偏性，即人们会“一视同仁”地对待所有的信息。我们认为，由于有限理性和时间约束，博弈中的参与人面临心智的稀缺性，于是，不同信息之间存在一场争夺心智的竞争。凡是具有可感知性的信息 (Kahneman，2002)或与认知结构(图式)密切相关的信息通常具有认知上的优势，因而首先被认知加工。所以，行为主体不可能“一视同仁”地对待所有的信息。我们把情景依赖、参照点依赖和启发式策略等视为一种解决心智稀缺性的手段和方式。它们在节省心智上有效，但可能会产生认知偏差。从心智成本最小化原理(卿志琼，2003)角度，框架效应和易得性启发法在节省认知资源上具有一致性。

本次问卷实验因受到许多方面的限制在结论上可能不完全。尽管我们的问卷实验兼有实验经济学家的实验、企业新产品试验和调查问卷的特征，但其有效性是我们进一步需要探究的问题。与实验经济学家的实验相比，我们的问卷实验有如下优缺点：实验经济学家的实验有一个无法克服的弱点，被试知道是在做实验。虽然可以通过货币激励满足突显性要求来消除这一点，但是，被试作为实验的角色并没有发生变化，只不过是实验主持人希望被试暂时“忘记”了自己的角色。事实上被试的选择是无法完全脱离个人特征的。这一点可能会影响实验结果。所以，问题的关键是突显性能否完全做到使被试个人特征与实验无涉。同时，如何理解突显性也是值得思考的问题。我们认为，只要被试的行动与报酬(货币的或非货币的)的关系能突出显示实验主持人所希望的制度设计就可以说满足了突显性。当然有货币激励，效果可能更好。在无实验经费的前提下，需要寻找替代的方法。一种是用成绩等非货币的报酬来替代货币报酬，这样可能弱化突显性。我们通过另一种方式弥补不足，即让我们的被试不知道自己在做实验，类似于市场中的购买行为。被试把实验的问题作为决策任务来解决。从这个角度说，我们的问卷实验似乎更真实地反映人们的选择行为。因此，实验与试验的结合不仅是实验技巧的掌握问题，而且是一种新的理论方法如何建立的问题。从更广阔的视域看，我们需要探索的是一条不同于演化经济学的行为经济学与博弈论相结合的路径。

标签：最后通牒博弈论文; 认知偏差论文; 博弈论文; 认知心理学论文;

认知偏差与理性选择--基于最后通牒博弈实验的认知博弈_最后通牒博弈论文

猜你喜欢