进化博弈论与经济系统演化_博弈论论文

进化博弈论与经济体制的演进,本文主要内容关键词为:经济体制论文,博弈论论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

中图分类号:F224.32 文献标识码:A 文章编号:1008-3146(2001)03-0044-05

进化博弈论(Evolutionary Game Theory)是近年来博弈理论的新发展,最初产生于生物学领域。它放弃了传统博弈论的充分理性假说,将生物体视为有限理性(Bounded Rational)的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成(Maynard Smith,J.1982年)。随后,经济学家将之引入经济分析中(青木昌彦,1999年),将人也视为有限理性的生物体,认为社会制度并非是人为设计的结果,而是大量有限理性的个人在相互博弈的基础上形成的一种适应环境变化和社会发展的均衡态,它们不断被保存下来,又不断向前进化,即在所谓适应性进化(Adaptive Evolution)的过程中产生并发展起来的。

一个社会中存在多种多样的经济制度,它们在相互作用的同时完成自身的形成与进化。这些制度之间具有战略互补性,即某一项制度的产生与存在同其他制度之间相互依赖、共同发展。按照博弈的观点,经济制度正是博弈主体之间形成的一种均衡。传统博弈论告诉我们一个博弈存在多个可能的纳什均衡,进化博弈论则进一步指出哪一个才是现实中真正实现的均衡,它并不一定是帕累托最优的均衡。所以,经济体制有可能长期陷于低水平均衡的陷阱而无法自拔。同时,进化博弈论还告诉我们,采取何种策略可以使经济体制从非帕累托均衡向帕累托均衡跃进。

一、传统博弈论的局限

在博弈论的发展过程中,为了验证理论同现实的一致性,有的学者设计了一些由许多人参加的博弈实验,对他们的实际策略选择加以观察,看其是否符合博弈论的理论预测,即实验博弈论(Experimental Game Theory)。但实验结果往往并不和理论预测完全一致。我们可以通过一个现实的案例来分析一下传统博弈论的局限。

Rothetal(1991年)在美国、以色列、日本、南斯拉夫进行了所谓最后通牒的博弈实验。双方参与实验,共同分配1000元。前者提出一个分配方案,然后由后者决定是否接受此方案,如果后者拒绝,则二人均无所获,如果接受,则按方案进行分配。并且,前者提出的分配方案必须以1元为单位。为了能让参与者发挥学习的效果,他们重复进行该实验,同时也进行严密的控制,以免其成为参与者依赖过去的经验而选择行动的一种重复性实验。

显然,根据传统的博弈论,这里存在着多种纳什均衡,一个极端的分配方案是前者提出自己分999元,后者分1元,即(999,1)或者(998,2),(997,3),……,(1,999)。传统博弈论纳什均衡解精确化(Refinement)的研究并未对这些均衡解加以区分,那么,究竟那一种均衡可以在现实中实现呢?传统博弈论对此无法回答,只是将之简单归结为双方讨价还价的地位对比。

实验结果是,所有国家的参与者几乎都是各取一半。具体情况是在美国和南斯拉夫各取50%,而在日本和以色列则是首先提议的参与者分取60%,后者分取40%。这说明,精确化了的解概念所预测的结果与实际结果有可能大相径庭,如果我们用理论预测的结果去解释现实经济问题,是极可能起误导作用的。对此,进一步的研究认为,当参与者以1对1的谈判博弈分配此金额时,对社会公平性这一概念的理解方式在很大程度上影响着分配结果,人们心灵深处存在着某种公平性的观念,实际上是人们在历史上无数次博弈中形成的规则,即影响人们行为的习惯、文化或制度,它们指导着人们在社会中遇到千变万化的战略性状况时应该如何行动。

所以,传统博弈论的局限可概括为如下几点:

(一)当人们日常处于类似博弈的情况下而采取战略性手段时,并不具有博弈理论家对博弈进行理性分析时所具有的理性。合理的博弈论的解概念(Solution Concept)是以参与者将博弈的构造(对策树及各个参与者的利益)完全作为一种常识(Common knowledge)为前提的。而且,所有的参与者都是理性的这一点也有必要成为常识。某件事情成为常识并非如我们平常理解的只要所有的人都知道这件事情就可以了。而是意味着所有的参与者都知道、知道其他人知道、知道其他人知道自己知道,这样一直进行下去。这个过程需要充分的信息交流,要实现这一点并不象想象中的那样容易。

(二)人们并非是如传统博弈理论家所假设的那样,将一个博弈视为一个孤立的博弈来采取行动,而是自觉或不自觉地将它当作社会中各种各样博弈中的一个来采取行动的。于是,人们在日常生活中所培养起来的习惯、信仰、理念、道德等都将作为影响策略选择的规则而加入到博弈当中去,而传统的博弈论却忽略了这一点,将博弈规则简单化、抽象化,所以,据此而导出的纳什均衡解存在着多个答案也就不足为奇了。

二、进化博弈论的产生

进化博弈论最初是在生物学领域取得成功的。 Maynard Smith和Price(1973年)最早用博弈论来解释生物体的进化现象。他们认为,首先,生物体在行动中是不可能具有理性的,它们的行动按现在的观点来看是由遗传基因决定的;其次,在博弈中,生物体的支付用适应度(Fitness)来表示,即它们的繁殖能力、子孙数量;第三,博弈对手不象传统博弈论那样是确定的、具体的,而是随机的,当局者仅知道其战略分布,即社会中采取某种战略的参与者占总人口的比例;第四,博弈并不是一次性的,而是无限重复进行的;第五,在这个重复的博弈过程中,有可能发生某些变异(Mutation),即个体有可能放弃按照博弈规则已得出的最佳策略,而采取其他策略。在这些假设条件下,分析下面这个博弈模型。

两只同种动物围绕着将适应度提高V的资源进行博弈。所谓鸽策略(D)是指耀武扬威,但对方挑起战斗便逃跑;鹰策略(H)是指一直与对方战斗,直至对方逃跑,或自己受伤。初期,这两种策略由基因决定同时存在与动物体中。从以上矩阵图可以看出,如果双方均采取鹰策略,则两败俱伤,平分资源,各得(V—C)/2,C为因受伤而导致的适应度降低;如果一方采取鹰策略,另一方采取鸽策略,则鹰获得全部的V,鸽得0;如果双方全部采取鸽策略,则平分资源,各得V/2。

设战略分布已知,即集体内采取鹰策略的比率为p,采取鸽策略的为1-p,则采取鹰策略的个体的期望收益为:

采用鸽策略的个体的期望收益为:

当V>C时,无论p为多少,EU[,H]>EU[,D],鹰策略为支配策略,所有个体均会采取鹰策略。这也是唯一的一个纳什均衡,但它不是帕累托最优的均衡,类似于囚徒困境。

当V<C时,情况则比较复杂。可用下图来进行说明:

当 p<p*时,  EU[,H]>EU[,D],采取鹰策略者将获得更高的收益,此时采取鹰策略的个体数目将会如箭头的方向增加;反之,当p> p*时,EU[,H]<EU[D],采取鸽策略者将会获得更高收益,从而,采取鸽策略的个体数目将会增加。这就意味着,p*为稳定的采取鹰策略的个体占总体的比例,p*=V/C。所以,当我们从最佳响应动力的角度出发,社会中的策略分布无论从哪一点出发,采取鹰策略的个体比率最终都将收敛到P*上来,从这个意义上说,P*具有进化安定性。

三、进化安定策略(ESS)

事实上,上面的p*=V/C也可用混合博弈的分析方法得出它是一个纳什均衡。所谓混合博弈是指一个参与者采取一定的概率选择某个策略时的博弈。但是,是不是所有的纳什均衡都表现出进化安定性呢?答案是否定的。Maynard Smith的杰出贡献正在于他提出了纳什均衡基础上的进化安定策略(Evlutionarily Stable Strategies,ESS)。它是纳什均衡中最容易实现、最稳定的策略。ESS一定是纳什均衡,但纳什均衡不一定都是ESS。通过下面这个博弈,我们很容易看出这一点。

显然,(a)的博弈具有(L,L)和(R,R)两个纳什均衡,但它们中的哪一个更容易实现、更稳定呢?若社会中采取L策略的人数为p,则EU[,L]=1+p,EU[,R]=1-p,由(b)图可知,当p=0时,EU[,L]=EU[,R],R与L均为最佳反应,但它不是ESS,因为,一旦发生变异,只要有人选择策略L,即使人数极少,策略L也会优于R,p值上升,最终达到p=1,即所有的人均采取L策略。而如果社会在(L,L)处达到均衡,即使发生变异,有人选择R策略,社会也最终会回到(L,L)上来。所以,尽管(L,L)和(R,R)均为纳什均衡,但它们的命运是极不相同的。(L,L)为进化安定策略,社会最终收敛于(L,L);(R,R)是不稳定的均衡,一旦发生变异,就会偏离均衡点,越离越远。

四、从进化博弈论看经济体制的演进

社会中的人们无时无刻不在进行着各式各样的博弈,这一状况自从人类出现就一直延续下来。在这个过程中,基于不同的历史初期条件,作为博弈规则的社会制度在世界各国及其内部出现、进化、变迁并最终固定下来,形成了千差万别的社会体制,这一点同生物进化并无不同。进化博弈论告诉我们,立足于初期基础条件上不断演进并伴随着淘汰的进化过程不一定带来效率性的结果,那么,如何从低效率的均衡迈向高效率的均衡呢?在此,可能有如下几种途径:

第一,社会中的创意和实验,这实际上就是所谓的变异

一个社会中必然存在某些不满于现状的个体,他们对社会中既有规则的破坏促使其他博弈主体采用相应的策略,并最终形成进化安定策略,这使得经济由一种均衡向另一种更为稳定的均衡过度。当然,这种稳定的均衡也未必就是帕累托最优的均衡。也就是说,变异的结果具有两面性。例如,我国改革开放最初始于安徽凤阳一群农民自发的分田到户,相对于原有的人民公社而言,这种承包制是一种更具稳定性的进化安定策略,也是一种更具帕累托效率的制度安排,所以迅速在全国得到普及并形成一种新的稳态均衡。又如,我国目前的道德滑坡也可用进化博弈论来加以解释。在改革开放初期,整个社会维持一种较高的道德水平,表现为强烈的利他主义。然而,这是一种非稳态均衡,如果有少数人放弃利他主义而采用利己主义,在缺少相应的监督与惩罚等制度下,他们可以借此获得更大的个人收益,所以,越来越多的人将会放弃利他主义而采用利己主义。从这个意义上讲,利己主义是进化安定策略,这个博弈促使人们逐渐放弃原有的利他主义而采用更为自利的行为准则,整个社会道德风气下滑。因此,通过限制不利于帕累托改进的创意和实验和鼓励有利于帕累托改进的创意和实验就可以实现经济体制向更高水平的跃进。

第二,政府的政策性介入

政府是制度的最大供给者,它为社会中博弈各方提供博弈规则,或对现有的博弈规则进行修改,进而可以改变博弈主体的支付,使得原有的进化安定策略失去其稳定性,打破原有的均衡。例如,国有企业在计划经济下形成一种低效率的均衡,因为政府提供的各项国有企业改革措施使得这种低效率均衡无法继续维持,主动竞争、消费者至上等策略成为进化安定策略,整个经济在更高水平上达到均衡。但是,由于政府的公共政策影响面极宽,其后果也绝非理论预测的那样简单,所以在政策设计时必须小心谨慎,充分考虑到它对方方面面的影响。

第三,与不同文化的交流

与不同文化的交流实际上扩大了博弈主体的策略空间,使得博弈主体可以在更为宽广的范围内进行策略选择,所以有可能从中发现更加稳定的进化安定策略。现实情况也证明了这一点。例如,在全球化的背景下,我们现有的一些传统和制度受到很大的冲击,其他国家的某些先进或颓废的现象也陆续在我国出现并得到大众认可,不论其先进或颓废,相对于传统而言,它们均是进化安定策略,更具稳定性。

由此可见,进化博弈论对于我国正在进行的经济体制和政治体制改革具有明显的借鉴意义。各种制度之间具有互补性,如果制度间的变革不能得到快调,作为制度复合体的体制即使是非效率的,其进化将是极为困难的,尤其是向着更具帕累托效率的方向。如果我们缺少富有效率性的制度创新,那就有可能长期均衡在低效率的陷阱里。

标签:;  ;  ;  

进化博弈论与经济系统演化_博弈论论文
下载Doc文档

猜你喜欢