贝叶斯决策理论与归纳逻辑_贝叶斯论文

贝叶斯决策理论与归纳逻辑，本文主要内容关键词为：归纳论文,逻辑论文,理论论文,贝叶斯论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

[中图分类号]F812.3 [文献标识码]A [文章编号]1002-0209(2005)02-0108-06

一、贝叶斯决策理论的产生

贝叶斯决策理论是关于人在风险条件下或面临不确定性因素的情况下应该如何进行抉择的理论。

有三位学者对贝叶斯决策理论的建立作出了重要贡献，他们是蓝姆塞(E.P.Ramsey)、萨维奇(L.J.Savage)、杰弗里(R.Jeffrey)。

1921年英国经济学家凯恩斯出版《论概率》一书，建立了第一个概率逻辑体系，这标志着现代归纳逻辑的诞生。凯恩斯想借助于数理逻辑和概率论来刻画或然性推理的前提与结论之间的逻辑联系，他认为，如果这些推理客观上是正确的，那么在推理的前提与结论之间存在着唯一的概率关系。蓝姆塞和凯恩斯一样，都是剑桥的精英，但是他反对凯恩斯的逻辑概率概念。蓝姆塞在1926年写了《真理与概率》一文，提出主观概率的概念，并且通过人的选择行为来确定概率和效用。他首先提出了“伦理中立的命题”这一概念。一个命题s对某个人而言是伦理中立的(ethically neutral)，是说有两个可能世界，这两个世界的差别仅仅在于s在一个世界中为真，在另一个世界中为假，而这两个世界对于这个人的价值是相同的。或者说，如果命题s的真假不会影响一个人对行动方案的选择，那么这个命题对于他是伦理中立的。比如某人在疗养院休假，清晨起来考虑今天是去登山，还是留下打保龄球。这时从一副扑克中抽出一张牌，命题“抽出的是一张黑桃”是真还是假不会影响他的选择，因而对他是伦理中立的。但是如果他不知道今天是否下雨，命题“今天将有雨”对于他就不是伦理中立的。

伦理中立的命题为真的概率可以是0到1之间的任何实数。蓝姆塞专门选择了概率为1/2 的伦理中立的命题。一个伦理中立的命题s具有1/2概率的标准如下：假设a和b是行为的结果，某人对a和b的喜好程度不同；再假设他对于(1)“如果s则b，如果非s则a”和(2) “如果s则b，如果非s则a”两个方案(赌博)没有偏好，则他对s的相信度(概率)为1/2。例如，在登山和打保龄球两项运动中，一个人更喜欢打保龄球；随手从围棋盒中抓出一把白棋子，命题“抓得棋子的数目是偶数”为伦理中立的命题。有两个赌博：

(1)如果抓出的棋子是偶数则登山，否则打保龄球。

(2)如果抓出的棋子是偶数则打保龄球，否则登山。

如果这个人对两个赌博并无偏好，那么他认为命题“抓得棋子的数目是偶数”为真的概率是1/2。

蓝姆塞利用概率为1/2的伦理中立的命题来确定行为或结果的效用，建立起相对于主体的一个效用标度序列。有了效用标度之后，反过来利用行为或结果的效用值确定命题的概率，包括那些不是伦理中立的命题的概率，从而建立起主观概率的理论。蓝姆塞对贝叶斯决策理论的贡献在于初步提出了效用理论，并且给出了测度概率的方法。不过蓝姆塞的主要目的是要建立一种主观概率的理论，他要表明这种理论是与逻辑相似的理论，而不是探讨决策问题。效用理论对于蓝姆塞而言可以说是无心插柳柳成行。

萨维奇系统地研究了决策理论，他认为归纳推理的思想与人在面对不确定性的证据时的决策行为有关。他在1954年出版的《统计学基础》一书中“发展了，解释了，并辩护了一种关于高度理想化的人在不确定情况下的行为的抽象的理论”[1](P5)。从蓝姆塞到萨维奇之间，还有两项重要的工作：一项是德·菲尼蒂独立地提出并发展了主观概率的理论(1937年)；另一项是1944年数学家冯·诺依曼与经济学家摩根斯坦合作出版了《对策论和经济行为》一书，建立了现代效用理论。萨维奇是在这两项工作的基础上开展研究的。

萨维奇理论的初始概念是行为之间的二元关系≥，这种关系表示每一对行为是可比较的，并且关系≥是传递的。一个决策问题包含以下要素：

(1)世界状态的集合S。S含有元素s,t,…。S的子集E，F，…被称为事件。

(2)结果的集合C。C含有元素c,d,…。

(3)行为或行动方案的集合A。A含有元素f,g,…。

(4)一个行为f在一个状态s中实施，产生结果，结果是行为—状态对。因此行为是函数，它是从状态到结果的函数。萨维奇也用f(s)表示结果。

(5)两个行为之间的二元关系≥。≥的意思是“…比…更好，或者…与…之间无差别” 。

萨维奇使用了许多定义和假设。他的基本做法是，先通过所谓“恒定行为”用行为之间的偏好关系≥定义结果之间的偏了关系≥，这样就把关系≥从行为集合推广到结果集合，然后根据个人对行为的结果的偏好来确定他对行为的偏好。接下来，萨维奇又利用结果之间的偏好关系以及行为之间的偏好关系来定义事件出现的可能性大小(概率)。我们来看其中的一个定义，这个定义非常有特色：

事件E至少与事件F同样可能(用E≥F表示)，当且仅当

如果(i)c和d是两个结果，并且c＞d；

那么f≥g。

这个定义是说，如果一个人在结果c和d中更偏好c；在他采取行动f的情况下，事件E出现能够产生结果c，事件E不出现会产生结果d；而在采取行动g的情况下，事件F出现能够产生结果c，事件F不出现会产生结果d；这个人采取行动f，表明他认为事件E出现的可能性比F出现的可能性要大；如果他认为f和g两个行动方案没有区别，则表明他认为事件E和F出现的可能性是一样的。比如，有两种赌博游戏，如果在游戏中获胜所得到的奖金是相同的，一个想赢得奖金的人会考虑玩哪一种游戏获胜的可能更大，从他的行为可以看出他对两个事件出现的可能性的想法。

萨维奇假设，两个事件出现的可能性的大小是可以比较的，这被他称为定性的概率。萨维奇进一步表明，在定性的概率与概率的数学性质之间有着一种密切的数学上的对应，他希望从这种对应中得到数值的概率，即提出定量的概率。要做到这点，还需要一个新的假设。德·菲尼蒂等人曾经用到一个假设，这个假设是说，集合S可以被划分为任意多个相等的子集，根据这个假设，就可以对S上的事件指派数值概率。但是这个假设常常被认为是特设性的，因此萨维奇采用了一个逻辑上更强的但是比较容易接受的假设，萨维奇的假设蕴涵了德·菲尼蒂的假设。萨维奇讨论了一系列的条件，根据这些条件，可以从定性的概率导出定量的概率。

我们可以看到，萨维奇的概率是主观的。在定性的概率方面，他利用人对行为的偏好来定义事件出现的可能性大小(概率)。在定量的概率方面，他迂回曲折地使用了无差别原则。

萨维奇通过赌博引进了效用概念。赌博也是一种行为，这种行为的结果是不确定的，有几个可能的结果。萨维奇证明了关于效用几个的定理，表明了效用的存在和效用的性质。最后他得到以下结果：

对于任何满足公理的偏好关系≥，存在着一个概率函数和一个效用函数，使得对于任何行动方案f和g，f≥g，当且仅当EU(f)≥EU(g)。

其中EU(f)和EU(g)分别是f和g的期望效用。这就是著名的期望效用原则。由于萨维奇的工作，贝叶斯决策理论的基本框架形成了。

杰弗里是对贝叶斯决策理论作出重要贡献的又一位学者。杰弗里曾经在卡尔那普那里学习确证理论，又在亨普尔的研究班中知道了蓝姆塞和萨维奇，从而对决策理论产生了浓厚的兴趣。他于1965年出版了《决策逻辑》一书。杰弗里的理论更接近于蓝姆塞的理论。在蓝姆塞和萨维奇的理论中，偏好是行为之间的关系或者是结果之间的关系，杰弗里则把偏好处理为命题之间的关系。他用陈述句来刻画行为，并且把行为与陈述句所表达的命题视为同一的。一个行为是这样一种命题：在主体能力的范围内，如果他愿意，他就能够使这个命题转变为真的。杰弗里讨论了两种命题态度——相信和期望。蓝姆塞和萨维奇把概率归属于世界状态或事件，也可以把概率归属于命题，这是对命题的相信的态度。蓝姆塞和萨维奇把效用归属于结果或行为，杰弗里则引进了“命题期望”(

desirability of a proposition)的概念，把效用归属于命题。一个人是否希望一个命题为为真，这是对命题期望的态度。杰弗里把命题解释为新闻，根据一个人认为各条新闻中哪些是好的，哪些是坏的，哪些是无关紧要的，根据他对各条新闻的态度，是热烈的欢迎还是较为热情，是反感、抱怨、愤怒，还是漠不关心，可以对命题进行排序，从而确定命题之间的偏好关系。蓝姆塞和萨维奇测度效用和概率所必需的一个环节是赌博，而在杰弗里的决策理论中，命题的逻辑运算(否定、合取、析取)代替了形式赌博在蓝姆塞和萨维奇理论中的作用。杰弗里把波克(E.Bolker)的数学理论用于自己的偏好理论，建立了决策理论的公理系统。这个系统以偏好关系为初始概念，也得到了与萨维奇的期望效用原则同样的结果。此外，杰弗里还讨论了决策者的行为对世界状态的概率产生影响的情况。

从贝叶斯决策理论的创建过程可以看出，贝叶斯决策理论是主观贝叶斯派归纳理论的有机组成部分。主观贝叶斯派是在同逻辑贝叶斯派的竞争中发展起来的。以凯恩斯、卡尔那普和欣迪卡为代表的逻辑贝叶斯派致力于用形式语义学的方法来刻画归纳推理前提与结论之间的逻辑联系，他们系统地发展了归纳确证的理论。以蓝姆塞、德·菲尼蒂、萨维奇和杰弗里为代表的主观贝叶斯派致力于建立主观概率的理论，他们发展了效用理论，发展了决策理论。

二、贝叶斯决策理论对归纳逻辑的影响

贝叶斯决策理论对现代归纳逻辑的发展产生了深刻的影响。

一般认为科学研究的目的是探索普遍性的规律，人们根据普遍规律解释各种现象并且预测未来，认为科学活动是寻求真理的过程或者逐渐接近真理的过程。传统观点认为，归纳推理与发现一般规律，特别是发现因果规律有关。现代归纳逻辑虽然放弃了归纳的发现作用，但仍然强调归纳推理求真的作用，运用归纳推理虽然不能从前提必然推出真的结论，但是前提可以给予结论一定程度的支持，这可以用概率来刻画。因此归纳理论本质上是确证的理论，首先是归纳概率的理论。这种对归纳推理的认识属于追求真理的传统。

由于归纳推理不能保证结论一定是真的，因此经过归纳确证的科学假说或理论的接受问题就成为一个重要问题。根据什么样的条件或标准，能够把一个经过检验的假说纳入已有的知识集合呢?最初提出的归纳接受规则是概率接受规则，经过检验的假说要达到一定程度的概率之后才能被接受。然而同时承认概率接受规则和演绎封闭条件会导致接受不一致的命题，这就是著名的凯伯格悖论，也叫做彩票悖论。

后来有一部分学者认识到，科学研究的目的不仅仅是追求真理，还追求其他的东西。评价科学假说或理论时不仅要看它的真实程度，还要看它具有的信息量、解释力、简单性等等。这些学者认为，可以用贝叶斯决策理论的基本思想来解决科学假说的接受和拒斥的问题。亨普尔提出“科学知识的信息模型”，这种模型并不要求描述科学知识的陈述在给定时刻是真的，而是把科学知识解释为在给定时刻被适当的科学程序证明为合理的并且被接受的信念的总和。莱维把科学假说的接受问题看做风险情况下的决策问题，他说：“在一种较弱的，但有趣的意义上，科学家也进行赌博。只不过所下的赌注是真理、信息、简单性、解释力和可能性。因此，对这些赌注的特性进行分析，连同合理赌博的理论一道会导致关于归纳推理的有趣的结论”[2](Pviii)莱维仿照贝叶斯决策模型建立了贝叶斯认知决策模型，他详细地讨论了认知效用、期望认知效用、强最大期望认知效用等概念，最后给出了归纳接受规则。莱维所说的认知效用综合了假说的真和假说的信息，但是没有容纳假说的解释力、假说的简单性等因素。芬兰学派的学者欣迪卡、希尔庇宁(R.Hilping)、皮塔瑞恩(J.Pietarinen)等人进一步讨论了语义信息概念，并且把假说的语义信息作为假说的认知效用。罗森克兰兹(R.Rosenkrantz)在讨论认知决策理论时把简单性纳入了认知效用概念。

莱维的接受规则既不要求所接受的假说或理论在给定时刻是真的，也不要求它达到某个限度的概率。从认知的角度看要求它有高的认知效用，从逻辑的角度看只是要求它进入原有的知识集合后不产生矛盾，即新的知识集合是一致的。莱维把进入知识集合的命题都作为真的命题看待，由于不再把概率作为归纳接受的唯一标准，也不把归纳接受的命题作为具有某种归纳支持度(概率)的命题来处理，于是演绎封闭条件可以得到满足，彩票悖论被化解。

用归纳的方式将一个假说或新的理论纳入知识集合是要冒风险的，尽管进入知识集合的命题被当作真命题，但是它们仍然可能被证伪。当有可靠的观察命题进入知识集合并且与某个理论发生矛盾时，或者有某个更具认知价值的理论出现时，知识集合都会发生变化。莱维研究了知识集合的扩充和收缩等问题，其他学者，如阿尔罗若(C.E.

Alchourron)、加德福斯(P.Gardenfors)和梅金森(D.Makinson)则发展了信念修正的理论。信念修正的理论引起了人工智能领域学者的浓厚兴趣，20世纪80年代以来，计算机科学和人工智能界的许多学者提出了各种信念修正的理论和方法。

从研究归纳确证的理论到提出认知决策的模型，再到信念修正的理论；从早期单纯追求真理到后来考虑其他具有认知价值的因素；从只考察归纳推理前提与结论之间的逻辑关系到比较全面地刻画归纳推理的动态认知过程，现代归纳逻辑理论的发展呈现出一种新的面貌。而贝叶斯决策理论是其中承上启下的重要一环。

三、对贝叶斯决策理论的检验和修正

贝叶斯决策理论产生了广泛的影响，特别是萨维奇的理论，这个理论被看成是对冯· 诺依曼—摩根斯坦理论的发展，它与冯·诺依曼—摩根斯坦的理论一道，成为合理决策的规范性模型被大多数人所接受。但是，并不是所有的人都接受了贝叶斯决策理论。贝叶斯决策理论有若干基本假设。这种理论假设决策者是完全理性的人，他了解所有备选的行动方案，知道每一个行动方案所产生的结果；各个结果的价值是由一个效用测度确定的，这个效用测度给每个结果指派数字的效用。决策者还知道与他的选择相关的各种世界状态，他对于世界状态的信念，可以用定义在这些状态上的唯一的概率测度来表示。决策者根据结果的效用和概率计算出每个行动方案的期望效用，从中选择具有最大期望效用的方案。

蓝姆塞的概率逻辑理论是一个公理系统，萨维奇和杰弗里的决策理论也都是公理系统。这些系统中的初始定义和公理实际上都是假设。逻辑学家们从初始的定义和假设(公理)出发，经过逻辑推理或计算，得到期望效用原则，并且告诉人们，应当如何进行决策。然而，这些假设是正确的吗?人们实际上是像这些假设所说的那样行动的吗?贝叶斯决策理论的一些假设以及期望效用原则受到了检验和质疑。

首先受到批评的是所谓“确定性事件原则”，萨维奇使用了这个原则作为自己理论的一个初始定义。阿莱(M.Allais)在1953年提出了一个测试，结果大多数人的选择违反了确定性事件原则，这个测试被称为阿莱悖论。第二个受到质疑的是关于概率的假设，贝叶斯决策理论假定了决策者关于世界状态的信念可以用定义在这些状态上的唯一的概率测度来表示。1961年伊尔斯伯格(D.Ellsberg)设计了另一种选择测试，测试表明，大部分人的选择既违反了确定性事件原则，又否定了关于概率的假设，这个测试被称为Ells berg悖论。

有许多学者对贝叶斯决策理论进行了检验，并且提出了各种修正的理论。其中有一位大名鼎鼎的西蒙(H.A.Simon，也译作司马贺)，他是心理学家，又是人工智能的创立者之一。西蒙自20世纪40年代起，从批评“经济人假设”入手来研究人的决策行为，他批评了冯·诺依曼—摩根斯坦的对策论，也批评了萨维奇的统计决策论。西蒙认为，人的知识是有限的，人的计算能力有限，计算机的计算能力也有限，人和计算机只具备有限的信息收集和处理能力。古典的决策理论要求决策者了解有关抉择问题的一切备选方案，要求决策者了解每一个方案所导致的后果，要求决策者能够用某种一致的效用尺度对后果进行比较，而不管这些后果的种类多么繁杂，性质多么不同。西蒙的出发点是，人们在决策时可能没有一个完整的备选方案的集合，甚至不得不搜索备选方案；面对外部世界的不确定性，由于计算能力有限，决策者对备选方案的结果仅仅有非常不完全的了解；决策者不具备用以比较不同方案不同结果的普遍而一致的效用函数。总之，人的理性是有限的。西蒙从有限理性论出发，提出了简单效用函数：所有的结果只取(1，0)两值之一，他把1和0分别解释为满意和不满意。西蒙提出了自己的理性决策的程序：决策者首先在可能的结果集合中寻找一组结果，使这些结果的效用值都是满意的；然后在备选的行动方案中寻找一个方案，这个行动方案可能的结果都是满意的。西蒙用“有限理性”取代了“全面理性”，用“满意原则”取代了“最优原则”。西蒙的理论被称为管理决策理论，西蒙本人称它为行为主义理论。

西蒙把贝叶斯决策理论称为新古典决策理论，认为这种理论属于全面理性和追求最优的理论。贝叶斯决策理论的特色，是在确定状态的概率时采用了先验的主观概率，并且根据新的信息对概率进行修正。西蒙认为这个理论“要求对决策者所具备的，有关概率分布的信息做出英雄般大胆的假设，无非是把决策者所面临的计算问题又提高了几个数量级。”[3](P87)西蒙认为古典理论和新古典理论都没有在人类的实际决策活动中得到验证。他为验证自己的理论而进行了很多心理学方面的研究，并且对组织和企业环境中的时间决策过程作了许多经验观察。

心理学家卡尼曼(D.Kahneman)和特维尔斯基(A.Tversky)自20世纪70年代起为检验贝叶斯决策理论作了大量问卷调查。他们发现在不确定条件下人们对概率的判断与决策系统地偏离“冯诺伊曼—摩根斯坦—萨维奇”的决策理论，而这种偏离是有规律的。他们提出了“前景理论”来描述人们的决策。

关于人在不确定条件下的判断情况。卡尼曼和特维尔斯基认为，人们通常没有能力对环境作出经济学的和概率的总体严格分析，人们的推断往往依靠某种顿悟或经验，人们在不确定条件下进行判断时经常偏离概率理论。也不是像贝叶斯定理描述的那样，由先验概率到条件概率，而是往往忽视先验概率。

关于人在不确定情况下的决策问题。卡尼曼和特维尔斯基发现，人们对结果的绝对水平(比如金钱本身的绝对数量)并不敏感，而是对结果相对于某个参照点的变化更为敏感。并且相对于某个参照点，人们对于损失的反应比对于等量的收益的反应更为强烈。在赢利的情况下，大多数人表现为厌恶风险；而在损失的情况下，大多数人表现为追求风险。这些都违反了贝叶斯决策理论的期望效用原则。

卡尼曼和特维尔斯基在1979年发表的论文《前景理论：风险决策的一种分析方法》中提出了一个新的决策模型。这个模型对贝叶斯决策理论的期望效用原则进行了修正。与期望效用原则相比，前景理论所作的预期能够与心理学测试的结果相符。

卡尼曼和特维尔斯基的理论是描述性理论。心理学家根据人实际的选择行为对贝叶斯决策理论的假设和原则进行质疑，并且提出修正了的理论或者提出新的决策理论来描述人实际的决策行为，这无疑具有重要的价值。因为了解人实际上是怎样想的，了解人实际上是怎样行动的，这对于单位、部门、团体的管理者有现实意义；对于厂家、商家的决策，以至于对于政府制定政策都有着现实意义。比如中央银行在提高人民币存贷款利率之前，一定要对这一措施产生的影响进行充分的预测，这就需要知道各种人会怎样想，怎样做。

但是，多数人实际上是这样做的，并不意味着这样做就一定是合理的，否则，我们就会说，赌徒们在一夜之间把身上的钱输个精光是合理的了。贝叶斯决策理论是规范性理论，不是描述性理论，它是从逻辑和推理的角度阐述人们应该如何去做，而不是描述人们实际是怎样做的。这就像逻辑的功能不是描述思维，而是规范思维一样，我们不能因为多数人在实际思维中常常使用某种错误的推理，就说逻辑是不合理的。如果有心理学家对那些按照贝叶斯决策模型进行决策的个人或团体进行研究，看看他们是否成功，这将是一件非常有意义的工作。总之，对于贝叶斯决策理论，还有许多问题需要进行深入研究。

最后，顺便提一句，西蒙由于对经济组织内的决策程序所进行的开创性研究，获得瑞典皇家科学院颁发的1978年诺贝尔经济学奖。特维尔斯基于1996年去世，他的合作者卡尼曼获得了2002年的诺贝尔经济学奖。西蒙和卡尼曼作为心理学家获得诺贝尔经济学奖，的确令人感到惊异。不过，有一位富有洞察力的学者似乎早就预见到了这一点，他是法国数学家波瑞尔(E.Borel)，1924年他在评论凯恩斯的《论概率》一书时写道：“对于某种博弈的深入研究可能会导致概率理论的新篇章，起源于博弈的这种理论又返回去研究最简单的机遇博弈。这将是一门新的科学，在这门科学中，心理学的作用不会比数学的作用少。”[4](P252)

收稿日期：2004-11-05

标签：贝叶斯论文; 决策理论论文; 期望效用函数理论论文; 贝叶斯定理论文; 效用理论论文; 命题的否定论文; 概率计算论文; 命题逻辑论文; 归纳演绎论文; 关系逻辑论文; 决策能力论文; 西蒙论文; 概率论论文;

贝叶斯决策理论与归纳逻辑_贝叶斯论文

猜你喜欢