决策逻辑中的悖论研究_投票悖论论文

决策逻辑中的悖论研究，本文主要内容关键词为：悖论论文,逻辑论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：B815 文献标识码：A 文章编号：1001-5019(2006)05-0006-07

导言：作为社会科学基础的决策逻辑

如果说逻辑学主要是研究推理的话，决策逻辑则主要研究的是理性主体在决策中如何合理地进行推理。更确切地说，决策逻辑主要研究的是决策者如何在策略空间中进行策略选择以使自己的利益最大化。当然，决策逻辑不研究人们实际中是如何推理的——这是实证科学的任务，而是研究人们应当如何推理。

社会科学力图对社会科学进行说明，即探询社会现象之间的因果关系。社会现象是由多个人的行动所形成的，而决策是行动的前提。从这个意义上说，社会科学研究社会中的多个决策者是如何实际进行决策的。我们看一下经济学。今天经济学无疑是最活跃也是最具科学性的学科。斯蒂格利茨这样说：“经济学研究的是：我们社会中的个人、厂商、政府和其他组织是如何进行选择的，这些选择又怎样决定社会资源如何被利用。”[1]保罗·萨缪尔森和威廉·诺德豪斯则认为：“经济学研究的是社会如何利用稀缺性资源以生产有价值的商品，并将它们分配给不同的个人。”即对稀缺性的资源进行权衡或决策，以满足人的无限性的欲望。[2]

研究人们应当如何进行策略选择的决策逻辑本身不是社会科学，但它是社会科学的一个理性内核，或者说它构成社会科学的基础。它的研究可以大大推动社会科学的发展。

决策分个人决策和群体决策。个人决策分个人面对自然的决策和个人面对他人的决策。后者便是博弈(game)，对之研究便是博弈论的内容。群体决策是指，一个由两个或以上的人群集合体如何根据各个决策者的决策而形成一个总的决策，以便集体行动。然而，决策逻辑中也存在悖论，尽管它们与严格意义上的悖论存在一定的区别。

期望效用理论上的两个悖论：阿莱斯悖论和交换悖论

期望效用理论指的是决策者在不确定条件下如何决策的规范理论。

在多个备选策略中，根据期望得益最大原则，理性的决策者选择使自己的期望得益最大的那个策略。然而这个理论遭受着悖论。

我们先来看“阿莱斯悖论”。法国经济学家阿莱斯(M.Allais)在1952年提出了一个决策例子，这个例子“构成了对期望效用理论的最古老的、同时也是最著名的挑战”。[3]这个例子所反映的问题被称为“阿莱斯悖论”。

阿莱斯提出了这样一个思想实验：有三种货币奖励，一等奖250万元，二等奖50万元，三等奖0元。决策者面临两个选择测验。

第二种选择的意思是，10%的机会获得250万美元，90%的机会一无所得，与11%的机会获得50万美元、89%的机会一无所得相比，人们偏好前者。前者一无所得的机会尽管比后者大1%，但前者可能获得的收益（250万美元）是后者的（50万美元）5倍，而获得这样的收益的可能性只比后者小1%。作出这样的选择也有“理由”的。

对这个悖论有不同的解释。我们自然会想到，期望效用理论是规范性的理论，按照这种决策是合理的，实际中的决策是“描述性的”，实际中的决策与规范理论不一致，表明实际中的决策中存在错误，实际中的决策通过逻辑分析可以修正自己的错误。这也是萨维奇(L.Savage)等人的观点。

现在我们来论述另一个我们称之为“交换悖论”的悖论。迪克西特和奈尔伯夫在《策略思维》(Thinking strategically)一书中举了这样一个“别人的信封总是更诱人的”例子。有两个分别装有一定数量的钱的信封，要将之给阿里和巴巴。他们事先不知道各个信封中的具体数目，而只知道钱数为5、10、20、40、80、160美元中的一个，并且知道其中一个信封中的钱数为另外一个信封中的两倍——这两点是他们的公共知识。他们各自打开自己的信封后观察到自己信封中的钱数，当然一方是不知道另外一方信封中的钱数的。现在假定给他们一个与对方交换的机会，问他们是否应当交换？[4]

我们假定巴巴拿到手的是20美元，阿里拿到手的是40美元。我们看他们根据期望得益理论的推理。巴巴想，我信封中的是20元，那么对方的信封中可能是10元和40元。即，巴巴和阿里信封中的钱数的可能组合是：(20,10)和(20,40)。由于他不知道他们手中所拿的钱数的组合是其中的哪一种，于是他对它们赋予相同的概率。即50%的可能性为(5,10)，50%的可能性为(20,10)。——这便是确定初始概率的无差别原理。这样，巴巴作这样的推理，如果我“交换”的话，期望收益为：10×50%+40×50%=25（美元）这个数值大于“不交换”的20美元。这样，“交换”与“不交换”相比，“交换”是合理的选择。所以巴巴得出“应当交换”的结论。

阿里拿到40元，他也作同样的推理。在他看来，他与巴巴的组合可能是(40,20)和(40,80)中的一种。那么他如果“交换”的话，期望收益为：20×50%+80×50%=50。同样大于“不交换”的收益（40美元）。“不交换”与“交换”相比，阿里也应当选择“交换”。

问题出现了，由于巴巴和阿里手里的钱的总数是一定的，不可能出现这样的情况：通过交换，两个人的收益均增加。谁计算错误？还是两人均计算有误？

阿里和巴巴将对方手中的钱数猜成自己手中钱数的一半或二倍的可能性即概率各为0.5，这是正确的，因为他们“没有理由”认为其中一个可能性高于另外一个。而问题是，交换的发生是以对方愿意交换为前提的，并且对方交换也是以我愿意交换为前提的。对方“愿意交换”的情况下和对方“不愿意交换”的情况下，对方拿的钱数为“我”（阿里和巴巴）的一半还是两倍的概率是不同的。他们应当比较在对方“愿意交换”前提下，自己“交换”和“不交换”的收益变化。具体分析如下：

假定，其中一人拿到的信封里装着的是160元，另外一人的信封里装着的是80元。即两人的钱的组合为(160,80)。拿到160元，那么他肯定不愿意交换，这样，交换是不能发生的。在(160,80)这种情况下，不会发生交换是双方的公共知识。

由于有了上面的分析，我们来分析钱数为(80,40)的组合。拿到80元的一方想：对方的钱数可能为160和40；如果对方的钱数是160元的话，必定不愿意交换；如果对方愿意交换的话，对方手里的钱数只能是40元；如果对方手里的钱数为40元，我选择“交换”的话，则要吃亏。因此，拿到80元的一方不会选择“交换”。在(80,40)这种情况下，交换也不会发生，这也是双方的公共知识。

我们同样可以得出在(40,20)、(20,10)组合的情况下，没有人愿意交换。只有在(10,5)的组合下，拿到5美元的一方愿意交换，此时对方即拿到10美元的人是不愿意交换的，在这种组合下交换也不能发生。

通过以上分析，任何一人拿到信封后，他拿到的钱数为160,80,40,20,10中的任何一个数均不愿意交换。唯一愿意交换的情况是，拿到5元钱的人愿意，因为他交换只有可能获得更大的收益10元，而不可能更少。但此时对方是不愿意交换的。

通过上述分析，巴巴和阿里拿到的钱的组合无论是上述哪一种情况，均不可能发生交换现象。

迪克西特和奈尔伯夫用上述分析解决了这个问题。

然而，问题并没有到此就结束。我们将前提做一定的修改，麻烦再次出现。如果我们对双方所拿到的钱的范围没有限定，而只假定一个人所拿到的钱数是另外一个人的两倍。这样，任何一个人当拿到装有钱的信封时——假定他的钱为a，他判断另外一个人的钱数只有两个可能性，为2a与a/2，并且由于他没有任何其他的信息可以判断，2a与a/2哪个可能性更大，他给这两种可能性各配置概率1/2。对方愿意交换的情况和不愿意交换的情况并没有影响他的概率配置。根据期望收益理论，并且在对方愿意交换的情况下，他应当选择“交换”。这样，我们发现通过交换双方期望收益均增加。事实上，这是不可能的。这里，我们无法用上述的逆推的方法来解决。这构成一个悖论，我们可以将之称为“交换悖论”。

在期望效用理论问题上还存在圣彼得堡赌局难题，[5]这里我们不做分析。

二、互动决策中的逆向归纳法悖论与由纽柯姆难题产生的盖夫曼—孔斯悖论

博弈论研究多个（两个或以上的）主体在互动中(interaction)是如何决策的，博弈分为静态博弈和动态博弈。在动态博弈中，求解完美且完全信息动态博弈的解的方法是逆向归纳法。然而它也产生悖论。

为了分析这个悖论，我们看一个被称为蜈蚣博弈的动态博弈。

蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。它是指这样一个博弈：两个参与者A、B轮流进行策略选择：可供选择的策略有“合作”和“不合作”两种。假定A先进行策略选择，然后是B，接着是A，如此交替进行。A、B之间的博弈的可能次数为一有限次，比如198次。这个博弈的博弈树如下：

图1 蜈蚣博弈（“c”表示“合作”策略，“nc”表示“不合作”策略）

这个博弈的特点是，只要有人选择“不合作”策略，该博弈即告结束。因博弈树的形状像一只蜈蚣，而被命名成蜈蚣博弈。在蜈蚣博弈中参与人A、B应当如何进行策略选择呢？

根据逆向归纳法，在博弈的最后一步即第198步：B在“合作”和“不合作”之间作选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“不合作”。在第198步B选择“不合作”的结论是A、B之间的公共知识。但是，要经过第197步才到第198步，在197步，A考虑到B在第198步时会选择“不合作”——此时A的收益是98，小于B合作时的100——那么在第197步，他的最优策略是“不合作”——因为“不合作”的收益99大于“合作”的收益98。……如此推论下去。最后的结论是：在第一步A将选择“不合作”策略——这构成子博弈纳什均衡。在这点上，A、B各自的收益均为1！

双方各得益1，这是理性的选择结果。根据逆向归纳法推得的结果是令人悲伤的，从逻辑推理来看，逆向归纳法是严密的。但结论是违反直觉的。直觉告诉我们，一开始就停止的策略只能获取1，而采取合作性策略有可能获取100，当然A一开始采取合作性策略有可能获得0，但1或者0与100相比实在是太小了。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看，A一开始应选择“不合作”的策略。

是逆向归纳法错了，还是直觉错了？

似乎逆向归纳法不正确。然而，我们会发现，即使双方开始均采取合作策略，这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑，肯定在某一步采取不合作策略。逆向归纳法肯定在某一步要起作用。此时只要逆向归纳法起作用，合作便不能进行下去。因此，我们不能怀疑逆向归纳法的合理性，它的推理过程严密，符合逻辑。然而如果我们用逆向归纳法来求解蜈蚣博弈，则博弈结果则是不合理的。

逆向归纳法由于是完全归纳法，是演绎的，这个悖论因此是演绎性的悖论。对这个悖论仁者见仁，智者见智。有博弈论专家认为它是一个需要解决的悖论：理性人得出不理性的结果；也有专家认为，蜈蚣博弈所反映的不是悖论，逆向归纳法作为求解动态博弈的方法，是有效的，尽管用这样的方法求得的结果不是我们所期望的，但它是均衡结果，是完全理性的参与人的博弈结果。[6]

在博弈中存在另外一个决策“难题”：纽科姆难题(Newcomb problem)。

1960年，物理学家威廉·纽科姆(William Newcomb)提出了一个策略选择难题。哲学家诺齐克在1969年《纽科姆难题和两个选择原则》中转述了这个难题，并称之为纽科姆难题。然而，“人们从未看到纽科姆本人就该疑难发表文章”，并认为它“是一个漂亮的难题。我真希望它是我提出的”。

不管纽科姆难题是谁提出来的，但它的提出引起了人们尤其是哲学家的广泛争论。它所反映的是理性人决策时的两个原则“期望效用原则最大化”(Maximum Expected Utility)与“占优策略原则”(Dominant Strategy)之间的冲突。纽科姆难题是这样的：

假定有两个黑色的盒子，人们无法看到盒子里的东西。1号盒子里面有1000元钱；2号盒子里面或者有1000000元，或者为0元（这由神来确定）。一个选择者有两个选择：(1)选择两个盒子全部，即1号和2号盒子；(2)只选择2号盒子。

假设一个有预测力的神，能够预测选择者将作出的选择。如果神预测他将“选择两个盒子”，神事先不在2号盒子里放钱，即神使盒子里面的钱数为0；如果神预测到选择者“只选择2号盒子”，神将1000000元钱放进2号盒子里。如果神预测选择者将使用随机的方法做出选择，神仍使2号盒子空着。

我们假定了这个神能够准确预测。有可能的是，这个神的预测能力可能不是100%准确，但足够准确，如90%的准确。具有这个能力的可以是神，或者精灵，或者某个超级生物。这是人和神之间的一个博弈。该选择者将“选择两个盒子”还是“只选择2号盒子”？

表1 在神与人的博弈中人的得益

预测取两个盒子预测取1个盒子

取两个盒子 10001001000

只取2号盒子0

1000000

根据占优策略原则，该选择者应当选择“取两个盒子”的策略。

因为，神的预测是过去做出的。2号盒子里的钱的多少是不可更改的，与选择者现在的选择无关。如果神预测到选择者将“取两个盒子”，而选择者“只取了2号盒子”，选择者所得为0元，而选择“取两个盒子”的策略的所得为1000元，“取两个盒子”的所得比“只取1个盒子”的收益多1000元。此时，选择者应当“取两个盒子”。而如果神预测到选择者“只取2号盒子”，他在2号盒子里面放了1000000元，选择者如果“只取2号盒子”，选择者的所得为1000000元，而如果“取两个盒子”，选择者的所得为1001000元，“取两个盒子”比“只取一个盒子”多1000元。此时，选择者应当“取两个盒子”。综上所述，“取两个盒子”是占优策略。选择者应当选择“取两个盒子的策略”。

而如果根据期望效用最大化原则，选择者应当选择“只取一个盒子”的策略。

因为，假定选择者选择“取两个盒子”，神已经预测到这点，他使2号盒子里面为0，选择者的所得是1000元；选择者“只取2号盒子”，神预测到这一点，那么神在2号盒子里面放了1000000元，这样选择者的所得为1000000元。选择“只取2号盒子”比“取两个盒子”的所得多1000000元。因此，选择者应当选择“只取2号盒子”的策略。

即使神的预测不是100%的准确，只要神的预测准确度超过一定的概率，根据期望效用最大化原则，选择者还是应当选择“只取2号盒子”的策略。因为：假定神的预测是90%的准确，“取两个盒子策略”的期望得益为：0.9×1000+0.1×1001000=101000（元）

“只取2号盒子”的期望所得为：0.1×0+0.9×1000000=900000（元）

此时，应当选择“只取2号盒子”。

通过计算，只要神预测的准确性超过0.5005，根据最大期望效用原则，我们应当选择“只取2号盒子”。

这两个选择均有理由，但它们不可能同时正确。究竟应当选择“取两个盒子”还是“只取2号盒子”的策略？

加得呐(Matin Gardner)1973年在《科学美国人》杂志数学游戏栏目中邀请读者给出这个难题的答案以及建议，有明确答案的126封来信中，89封信说选择2号盒子，37封信说他们选择取两个盒子，另外有18人认为这个难题的条件不能满足。笔者也进行了一个实验，让学生进行选择，实验结果是，选择“只取2号盒子”的人多，其人数占总的实验人数的80%左右，实验的具体结果见潘天群《博弈论中理性假设的困境》（载《经济学家》2003年第4期）。

对这个难题，哲学家诺齐克、莱维(Isaac Levi)均认为应当选择“取两个盒子”，纽约大学政治系著名政治学家勃拉姆兹(Steven Brams)以及纽科姆本人认为应当选择“只取2号盒子”。

在本人看来，纽科姆难题涉及人的意志是否是自由的问题。在博弈论中，博弈论专家预设了博弈参与人具有理性决策能力。但更为基本的是，博弈论预设了人可以“自由地”选择策略，即人的意志是自由的。然而在纽科姆难题中，由于假定了人的行为是神所可以预测的，人的意志便不是自由的，疑难便产生了。

纽科姆难题还不是严格意义的逻辑悖论，但经由盖夫曼(H.Gaifmann)和孔斯(R.C.Koons)的改造，它便成为了一个严格的逻辑悖论。在这个改造中，一个超现实的超级生物或神被消除掉了。

甲向乙提出，乙可以选择盒子A（空的）和盒子B（1000元），但不能两者都选。甲保证：如果乙作出了一个不合理的选择，甲将给他奖励1000元。甲、乙都是理性人，我们假定A总能够兑现诺言。乙如何选择？

如果我们假定选择A是不合理的，则这样选择将使乙比选择B多9000元，这又使得选择A成为合理的行为；反之，如果选择A不是不合理的，则选择盒子A将至少比选择盒子B少1000元，所以选择A又是不合理的。这样，选择A是不合理的，当且仅当选择A是合理的。

这便与说谎者悖论有明显的类似。这个悖论被张建军教授称为“盖夫曼—孔斯悖论”。该悖论成为连接严格的逻辑悖论研究与决策逻辑悖论研究的一座桥梁。[7]

三、群体决策的阿罗悖论

一个群体根据一定的规则由群体成员的偏好关系确定出一个总的决策便是群体决策。群体决策的得出往往通过投票来进行。

投票博弈(voting game)是一种特殊的博弈。在投票博弈中，每个投票人对候选人或者候选方案存在着偏好，并且可以对之进行排序。一个理性人组成的群体在加总个体的选择时存在理性的方法吗？

对于理性，研究社会选择的经济学家一般将之定义在偏好关系上。理性的偏好关系，根据经济学家的观点，体现在关于偏好关系“≥（弱优于）”的两个基本假设即完备性和传递性之中。具体地说，如果“≥”满足：

(1)完备性。任何两个备选对象a、b，它们的关系或者是a≥b，或者是b≥a。二者必居其一。

(2)传递性假定。对于任意的三个备选对象，如果a≥b，b≥c，那么a≥c。

则称偏好关系≥是理性的。

阿罗将这两个假定看作公理。满足完备性假定的偏好关系被他称为连通(connected)关系，满足传递性偏好关系被他称为传递性的(transitive)关系。[8]

然而，当群体加总各个个体的偏好关系时，会出现“不理性”的结果。

举一个例子。假定有3个群体（可以是3个人），他们对备选方案A、B、C进行表决。方法是两两进行比较，即让投票者对3个方案中的两个进行分别表决，然后再根据大多数规则决定哪个方案胜出。假定这3个群体的偏好关系如下：

表2 一个可能的偏好顺序

群体1 群体2 群体3

B C

C A

A B

我们先让投票者对A和B进行投票。由于群体1和群体3均认为“A优于B”，群体2认为“B优于A”，这样，在这轮投票中A以2比1战胜B。

我们再让这三个群体对B和C进行投票。群体1和群体2认为“B优于C”，群体3认为：“C优于B”，投票结果是：B以2比1战胜C。

既然A战胜了B，B又战胜了C，似乎是，如果对A与C进行投票，A应当战胜C。对于任何一个理性的投票人，这是自然的。但是，当群体对A和C进行投票时，C以2比1战胜了A！

这就是阿罗悖论，又称为孔多塞投票悖论、循环投票悖论。当然，投票中不是任何时候都会产生投票悖论。3个群体对3个方案的可能偏好状态为216个，出现悖论的状态是6个，即悖论的可能性是1/36即2.78%。

投票悖论这个现象所反映的问题具有重大的理论意义，它反映了在社会加总成员偏好过程中，存在致命的缺陷，这正是著名的“阿罗不可能性定理”所揭示的。

结语

本文所分析的只是决策逻辑中的部分悖论——如果它们都可以被称之悖论的话，还有一些悖论与决策逻辑存在关联，如突然考试悖论（或突然演习悖论）、公共知识悖论（协同进攻难题）[9]等等，我们这里没有叙述。

悖论是人类理性暂时的难题。人类的智力在不断地消解这些难题。在历史上，悖论的产生和消解促进了逻辑学、数学等学科的发展，本人相信，随着决策逻辑中的这些悖论（以及其他的决策悖论）的研究与消解（如果这种消解不是原则不可能的话），建立在决策逻辑基础上的社会科学必将得到发展，当然这些决策逻辑悖论的研究和消解也必将促进逻辑学本身的发展。

收稿日期：2005-12-12

标签：投票悖论论文; 理性选择理论论文; 群体行为论文; 关系逻辑论文;

决策逻辑中的悖论研究_投票悖论论文

猜你喜欢