个体偏好与系统的协同进化：一种新的理论探索_博弈论论文

个体偏好与制度的共同演化：一个新的理论探索，本文主要内容关键词为：个体论文,理论论文,制度论文，此文献不代表本站观点，内容供学术参考，文章仅供参考阅读下载。

中图分类号：F06 文献标识码：A

在新古典经济学中，很长一段时间以来，个体偏好和制度都是外生给定的，经济学家主要关注既定偏好和制度下的资源配置效率问题①。随着新制度经济学的兴起和发展，制度逐渐纳入主流经济学的解释范畴(Joskow，2008)。当前，比较流行的将制度内生化的研究有以下几个方面：其一，新制度经济学在新古典经济学范式的基础上，放松了“交易费用为零”的假设，建立了制度与交易费用的关联，通过比较交易费用的大小，将制度内生于个体的理性选择中。并且，随着理论的进一步发展，将完全理性选择拓展到有限理性选择(Coase，1937；Williamson，1975，1985；Libecap，1989；North，1990)。其二，随着博弈论的发展，制度被视为一种博弈的均衡结果而内生于参与者的策略互动中(Schotter，1981；Aoki，2001，2007；Grief，2006)。制度的博弈论分析既包含遵循完全理性假设的经典博弈论分析(Grief，2006；Binmore，2009)，也包含遵循有限理性假设的演化博弈论分析(Young，1998，2007；黄凯南，2009)。其三，随着信息经济学的发展，借助博弈论和社会选择理论，机制设计理论将制度视为一种博弈形式(game form)内生于参与者的理性设计中。无论是完全合同理论中的最优合同设计，还是不完全合同理论中的最优产权结构设计都体现了机制设计理论的思想(Jensen & Meckling，1976；Grossman & Hart，1986；Hart & Moore，1990，1999，2008；博尔顿和德瓦特里庞，2008)。机制设计理论也是当前主流的制度理论。实际上，上述这些制度内生化的研究在本质上都是遵循新古典经济学“个体主义”的研究方法，仅仅从个体选择或博弈的视角来解释制度的生成与变迁，而没有考虑制度本身对个体偏好生成和变化的塑造和影响。尽管这种分析方法有助于我们了解个体的微观动机是如何推动制度的生成和变迁的，但是，由于缺少对于这些微观动机的形成和变化的解释，越来越多的学者认为，这种单一维度的研究很难解释大量复杂的社会经济变迁现象，并且在方法论上容易陷入还原主义的窠臼(North，2005；Hodgson，2007a，2007b，2010)。

关于偏好问题的研究长期受到经济学的忽视，它通常被认为是生物学、心理学和社会学等的研究领域。针对众多偏好变化的现象，许多主流经济学家都接受了加里·贝克尔(Gary Becker，1992)的观点，认为可以通过构造一个包含人力资本和社会资本变化的元偏好(metapreference)函数或者扩展的效用函数，将许多看似变化的偏好(被称为次偏好)纳入元偏好稳定的解释体系中②。因此，在贝克尔看来，基于效用最大化的理性选择模型依旧适合于解释许多次偏好或口味变化的现象。例如，个体通过控制未来人力资本的存量可以理性地选择其未来的次偏好。这种次偏好的内生化实际上是通过构建一个更加复杂的超级理性选择模型来实现的。尽管如此，贝克尔本人也不反对发展其他更具有解释力的理论来解释偏好变化现象(贝克尔，2000)。近些年来，随着脑科学、认知心理学、神经科学和演化心理学等认知科学与经济学的紧密结合③，越来越多的经济学家尝试打开个体决策行为的黑箱，抛弃新古典经济学“偏好外生给定”的假设，重视对偏好形成和变化的研究(Kahneman，2003；Damásio，2005；Lichtenstein & Slovic，2006；Martins，2008)。同样地，更多的研究不仅仅停留在考察制度对个体行为约束的影响，而是更加重视制度对个体偏好本身的影响(Bowles，1998，2008，2009a；Hodgson & Knudsen，2004；North，2005；Witt，2005；Carlos、Ricardo & Juan，2006；Alberto & Nicola，2007)。Hodgson(2007b，2010)将此研究方法称为“向下因果关系”(Downward Causation)，有别于“向上因果关系”(Upward Causation)，后者是指仅仅从个体的视角来研究个体与制度的因果关系。但是，同样地，仅仅从此单一维度考察制度对个体偏好的影响容易被贴上集体主义方法论的标签，进而被视为制度或文化决定论。

霍奇逊(Hodgson，2007a)指出，在本体论层面上，个体和制度是共生存在的，它们构成了经济研究的二重本体，经济学的方法论必须突破纯粹的“个体主义”以及纯粹的“集体主义”(或“制度主义”)，而转向“个体与制度的互动主义”。近年来，如何从两个维度互动的视角来内生地解释个体偏好与制度的生成和变化是当前经济学理论研究的前沿(North，2005；Hodgson，2007b；Binder，2008；Hodgson & Huang，2011)。随着现代演化经济学的复兴，共同演化理论为解释多层级互动的复杂系统演化提供良好的分析视角(Volberda & Lewin，2003；Jouhtio，2006；Silva & Teixeira，2009；黄凯南，2008，2010b)。一些学者也开始尝试从共同演化的视角来分析个体偏好与制度的内生互动关系(Van den Bergh & Stagl，2003；Bowles、Choi & Hopfensitz，2003；Hodgson & Knudsen，2004；Binder，2008；Bowles，2004，2009)。但是，当前对个体偏好与制度的共同演化还处于起步阶段。许多研究更多停留在对现象的描述和归纳上，尚未能够深入探讨偏好与制度的互动关系，进而也未能够深入剖析两种的共同演化机制(Bergh & Stagl，2003；Binder，2008)。还有为数不多的模型研究主要是运用基于智能体的模型(Agent-based Model)或简单的演化博弈模型(如复制者动态模型)来仿真偏好与制度的共同演化过程，也缺乏对其共同演化机制进行深入的理论研究(Bowles，Choi & Hopfensitz，2003；Hodgson & Knudsen，2004；Bowles，2004，2009)。

本文尝试进一步探索该领域的理论研究。在重新考察偏好和制度的基础上，本文尝试深入剖析偏好演化机制和制度演化机制，进而构建两者的共同演化机制。论文结构安排如下：第二部分重新考察偏好和制度的概念；第三部分在探讨偏好演化和制度演化的基础上，构建偏好与制度共同演化的机制；第四部分尝试运用一个简要的模型来描述偏好与制度共同演化的逻辑关系；第五部分是本文的结论与未来研究的展望。

二、偏好和制度的再考察

(一)偏好的再考察

1.主流偏好理论遇到的挑战

在许多学科中④，偏好都是非常重要的概念，并且不同学科对偏好的定义也不相同。在当前的主流经济学中，偏好通常被定义为一套逻辑严密的排序体系，它满足完备性、反省性、传递性、连续性、局部非厌足性(locally non-satiation)、单调性和凸性等逻辑性质。通过在偏好关系上构建效用函数，并将最大化效用函数作为个体选择的行为模式，新古典经济学建立了偏好与行为的数理逻辑关系，创建了理性选择的研究范式。而且，在显示性偏好理论的推动下，偏好与行为之间的关系是可逆的，这使得新古典经济学似乎克服了主观偏好难以客观描述的问题。进一步，在冯·纽曼和摩根斯坦的推动下，期望效用理论将理性选择运用到不确定性的行为决策中。基于上述偏好性质的理性选择理论不仅仅在经济学中广泛运用，还被广泛运用到现代政治学、社会学、哲学和法学等社会科学中，一度成为社会科学研究的流行范式(Hedstr

m & Stern，2008)。

但是，随着行为经济学、实验经济学和神经元经济学等的兴起和发展，大量研究发现，个体偏好在许多情况下并不满足新古典经济学所描述的逻辑性质。行为经济学的研究表明，个体偏好存在系统性的背离上述逻辑性质，存在诸如“偏好逆转”(preference reversals)、“锚固效应”(anchor effect)、“禀赋效应”(endowment effect)、“损失厌恶”(loss aversion)、“现状偏见”(status quo bias)、“镜像效应”(reflection effect)和框架效应(framing effects)等现象(Kahneman & Tversky，1979；Tversky & Kahneman，1986，1991；Kahneman，2003)。在实验经济学方面，“最后通牒博弈”的跨文化实验研究发现，个体的偏好并不是孤立的逻辑体系，而是受到社会文化制度的系统性影响和塑造(Henrich，2000；Henrich & Boyd & Bowles，2001；Henrich，2003)；“公共物品自愿供给”实验研究表明，个体不仅拥有利己偏好，还拥有大量包含公平、正义、道德、规范等内在价值的社会性偏好(social preferences)，这些偏好都受到制度的影响，并且它们在许多情况下都不是独立的，一些显性、外在的激励机制在激励利他偏好的同时，可能会损害社会性偏好，造成挤出效应(crowding out)，进而在总体上降低公共物品的自愿供给水平(Bowles，2008；Bowles & Hwang，2008；Ingela & Weibull，2010)。此外，还有一些研究表明，在许多情况下，个体偏好并不是外生给定不变的，而是内生于个体的行为选择或决策过程中的，偏好在被引出的过程中(process of elicitation)也同时被内生地构建(Lichtenstein & Slovic，2006)。而且，偏好的改变或构建也会发生在许多无意识的行为过程中(Coppin & Delplanque et al.，2010)。近年来，一些由心理学家提出的有关内生偏好和偏好变化的命题也被大量的脑科学研究所证实，有关偏好形成和变化的认知特征的研究也受到越来越多的重视⑤(Schkade & Johnson，2006；Sharot、De Martino and Dolan，2009)。

当前，经济学的许多前沿基础理论研究都在试图放松和超越新古典经济学对偏好的数理化定义，结合其他学科的研究进展，越来越重视对个体偏好实质内涵的研究，进而构建各种基于有限理性的个体行为决策模型(Gigerenzer & Selten，2002；Brenner，2006)。正如完全理性的行为模型只有效用最大化一种，而有限理性的行为模型却具有无穷多种，因而很难为后者构建一个具有普适性的基准模型，同样地，一旦放弃新古典经济学的偏好假设，我们也很难给出一个统一并具有普适性或一般性的偏好定义，因为拥有不同认知模式的个体可能具有不同的偏好特征⑥。

2.偏好的四个维度

从广义上讲，偏好可以被认为是用来解释个体行为产生的原因，它包括个体的一系列诸如生理、文化和心理等特征，这些特征能够用来解释个体在特定的场景中所采取的行动(Bowles，1998，2004；Binder，2008)。偏好不仅包括新古典经济学所主张的享乐主义效用，还包括各种由基因遗传的本能、个体心理倾向、内化的社会道德、价值和习惯等(Arthur & North，1993；Bowles，1998；Gintis，2003，2007；North，2005；Hodgson，2010)。因此，偏好不仅包括享乐主义的心理偏好，还包括各种生理偏好、社会和文化偏好等。

从偏好形成的视角，可以不严格地用以下四个维度来阐释偏好的内涵：其一是生物演化的维度，即人类作为物种在漫长的自然选择中演化形成的各种基本偏好。对于个体而言，这些偏好是先天存在并由基因传递的(如各种本能的行为倾向)。这方面的研究主要集中在基因遗传学和演化生物学等领域(Robson，2002；Damásio，2005；Martins，2008)。其二是基因与文化协同演化的维度，即个体某些偏好是在基因与文化协同演化过程中形成的(Bergh & Stagl，2003；Cochran & Harpending，2009)。对于个体而言，这些偏好也是先天存在并由基因传递的。但是，较之于前一类偏好，这种偏好还受到早期人类文化制度的影响⑦，具体表现为许多社会性的本能(如一些公平、互惠和利他的偏好以及对社会地位和权力的偏好等)，它们几乎在更新世晚期已经形成了(Kock，2010)。这方面的研究主要集中在社会生物学、演化心理学、生物经济学、群体选择理论和双重遗传理论(Dual Inheritance)等领域(Wilson & Sober，1994，1998；Richerson & Boyd，2005)。其三是社会文化制度维度，即个体的某些偏好受到社会文化制度的塑造。这种社会文化制度既包括习俗、惯例、社会结构和意识形态等非正式制度，也包括政治体制、宪政和法律等正式制度，它们系统地影响了个体的价值观和社会态度(Henrich，2003；Alesina & Fuchs-Schundeln，2007；Binder，2008；Bowles，2004，2009)。尽管流行的偏好可能在个体出生之前就已经存在了，但是，对于个体而言，这些偏好并非由基因传递的，而是由文化传递的，它们是个体在后天的社会互动过程中学习获得的。Gintis(2003)归纳了三种类型的文化传递模型：垂直传递(从父母到儿女)、倾斜传递(通过包括世俗、宗教仪式、学校和传播媒体的社会制度)和水平传递(同辈之间)。其四是个体认知心理维度。行为经济学和实验经济学的大量研究表明，在许多情况下，个体的偏好受到个体认知心理状态的影响⑧(Tversky & Kahneman，1986；Kahneman，2003)。这种类型的偏好既不是由基因传递，也不是由文化传递，通常是由个体学习获得的，个人经历会直接影响此类偏好(如个人独特的口味)。随着个体信息和知识的更新，这种类型的偏好会发生变化。

通常来讲，在上述四种维度中，偏好的稳定程度依次递减。生物演化维度的偏好是最为稳定的⑨，反之，个体认知心理维度的偏好则是最容易发生变化的。第一种和第二种维度的偏好是人类共同拥有的，它体现了人类的同质性。第三种维度的偏好是拥有相同社会文化制度的人们共同拥有的，它体现了同一文化群体中个体间的同质性，以及不同文化群体中个体间的异质性。第四种维度的偏好则凸显了个体的独特性和异质性。但是，必须注意，对于这四种维度的区分仅仅是为了理论阐述的便利，它们并非截然分开，而是相互影响。例如，个体认知心理维度既受到生物演化维度的影响，也受到基因与文化协同演化维度以及社会文化维度的影响。这四种维度之间存在复杂的相互影响关系，共同作用于个体，塑造了个体的具体偏好。个体后天形成的偏好既受到先天基因遗传的影响，也受到文化传递的影响，以及个体自身认知心理的影响。至今为止，人类对于这四个维度相互关系的了解还相当匮乏，这方面知识的改善还有待各种相关学科的发展和融合。

(二)制度的再考察

1.博弈论视角下的制度与局限

当前，有关制度的定义众多，尚未形成一个广泛共识的制度定义⑩。但是，随着博弈论被广泛地运用到制度分析中，越来越多的研究尝试从博弈论的视角来阐释制度(Schotter，1981；North，1990；Grief，1993，2006；Hurwicz，1993；Aoki，2001；Binmore，2009)。制度通常被视为博弈的规则(North，1990；Hurwicz，1993；Weingast，1997)、博弈的参与者(Penard，2008)或者博弈的均衡结果(Aoki，2001，2007)。制度的博弈规则观是将制度视为博弈的外生规则，它是所有参与者事前必须共同遵循的规则，是参与者之间有关博弈场景的共同知识。这方面的研究集中在机制设计理论中。但是，如果将制度视为博弈规则，对于制度的实施和生成只能诉诸于一个更高层级的博弈(meta-game)，而后者博弈规则的生成和实施又必须再次诉诸于更高层级的博弈，如此递推直至无穷，很难真正回答制度生成问题(Aoki，2001)。制度的博弈参与者观实际上是将制度视为一个特殊的参与者，通过引入这个参与者(例如，政府)，能够改变其他参与者的策略集合、支付集合、信息集和博弈的次序等，亦即能够改变原有博弈的外生规则，这实际上是形成新的博弈规则(Penard，2008)。在这个意义上，所谓的博弈参与者观实际上也可以被认为是一种博弈规则观。许多学者也明确反对将制度视为博弈的参与者(11)。制度的博弈均衡观是将制度视为一种内生于博弈过程的均衡结果，既包括博弈策略均衡结果，也包括有关博弈如何进行或如何达到某一具体策略均衡的共有信念(12)(Schotter，1981；Aoki，2001，2007；Grief，2006)。这种制度均衡的实现既可能是源自经典博弈论的重复博弈，也可能源自演化博弈论的动态演进过程。Grief(2006)尝试整合上述三种制度观，给出一个更为综合的制度概念，将制度定义为由规则、信念、习俗和组织等组成的系统，它能够形成有规律的社会行为。但是，由于Grief没有在学理上深入阐释这种制度系统是如何构成的，他的制度观显得比较繁杂，更多停留在对各种制度类型的罗列(Badun，2009)。

尽管博弈论能够为我们理解制度的内涵提供有益的洞见，但是，博弈论却还存在固有的局限。无论是经典博弈论还是演化博弈论，博弈规则都是外生给定的，这意味着当前流行的制度博弈分析都是基于某种外生给定的制度(即博弈规则)，参与者都是这种外生制度的接受者，并不会对这种外生制度产生影响，该理论也不能解释这种外生制度，亦即制度是独立了该理论的解释体系(黄凯南，2009)。因此，当前流行的博弈论(包括经典博弈论和演化博弈论)并不能彻底解释制度生成和演变等问题。此外，由于仅仅从个体的视角研究制度，偏好被视为外生给定，博弈论完全忽略了制度对个体偏好的影响(Hodgson，2007b)。因此，从博弈论的视角来阐释制度还存在一定的局限。

2.参与者互动视角下的制度

为了摆脱博弈论的困境，这里从参与者互动的视角来阐释制度。参与者之间的互动是一个更为宽泛的概念，它指两个或多个参与主体之间的行动存在直接或间接的相互影响关系，它既包括经典博弈论所描述的策略博弈，也包括演化博弈论所描述的策略学习，还包括其他并非博弈论所描述的各种社会互动(13)。参与者之间的互动不是在外生给定的互动规则下进行的，所有的规则都是内生于参与者的互动之中，而这种互动规则一旦形成了，对于某个具体的参与者而言，它便构成了他与其他参与者互动的外生规则，但是，这种规则不是给定不变的，随着互动场景的变化和参与者认知的变化，这种规则会进一步演化。例如，在某些互动场景中，参与者之间可能不拥有有关互动场景的共同知识，参与者凭借各自的主观认知模型来理解和解释互动场景，随着互动的展开(14)，参与者之间可能形成共同的主观认知模型，这便构成了参与者之间的互动规则，这种共同的主观认知模型又会进一步强化和塑造个体的偏好和认知，并且随着参与者自身主观认知模型的变化，作为共同认知模型的互动规则也可能发生变化(黄凯南，2010a)。因此，从互动的视角能够内生地解释互动规则的生成和演变(15)。此外，由于这种互动不仅发生在个体之间，还发生在个体与群体或个体与制度之间，因此，它也考虑了个体偏好与制度的相互影响关系。

制度可以被定义为参与者之间互动形成的规则系统，而这种规则系统一旦形成又会进一步协调、组织和约束参与者之间的互动，从而降低互动过程中的不确定性(Hodgson，2006，2010)。作为互动规则系统的制度包含以下几个层面的规则：其一是行为层面上的规则，即共同遵循的行为规则，它刻画了参与者之间的行为均衡，是可以观察的层面。其二是信念层面上的规则，即共享信念(shared belief)(Aoki，2001，2009)，它描述了参与者之间对互动场景的状态不确定性的共享信念。当存在多种可能的互动结果时，它描述了参与者之间有关达至某一具体结果的共同信念，刻画了参与者之间的信念均衡。其三是价值层面上的规则，即参与者之间拥有的共享价值观，描述了参与者之间对行动意义和重要性拥有共同的评判标准，它通常塑造了参与者的行为动机。其四是认知结构层面上的规则，即参与者之间对互动场景的共同认知模式或共享心智模型(shared mental model)(Arthur & North，1993；North，2005)。它是指参与者之间对互动场景的信息拥有共同的信息加工和处理模式(即共同的信息结构)，包括共同的信息编码规则、抽象规则和解码规则(布瓦索，2003)，刻画了参与者之间认知模式的均衡。它使得参与者之间能够运用相同的心智模型来感知和解释其所处的互动场景。在这四种规则中，除了行为规则外，其他层面的规则都是很难被直接观察，但是，其他层面的规则都会直接或间接地作用在行为规则上，并且会影响行为规则的稳定性。

上述四种类型的规则相互作用，共同构成了一个包含行动规则、共享信念、共享价值和共享心智模型等在内的规则系统。这种规则系统会影响和塑造参与者之间的互动模式、互动过程以及互动结果。在这个意义上讲，制度实际上很难被明确地区分为正式和非正式(North，1990)，任何制度都是包含所谓正式规则和非正式规则的规则系统。

三、共同演化分析

(一)偏好演化和制度演化

1.偏好演化

在许多研究中，偏好变化并不等于偏好的演化，而对于偏好变化的解释也不一定要诉诸于演化的方法。一些研究通过改造效用函数而将偏好变化纳入更高层次的偏好稳定分析中。这些主要集中在新古典经济学的广义效用函数理论和行为经济学等研究中。例如，由偏好相关性引起的偏好变化以及由认知心理因素引起的偏好变化。前者主要集中在“偏好的相互依赖性”(preference interdependence)模型和“习惯形成”(habit formation)模型中(16)(Schulkin，1991；Hansson，2004)，Becker(1992，2000)进一步将这两类偏好的变化归结为社会资本的变化和人力资本的变化(17)；后者主要集中在时间偏好变化模型(temporal preference change models)(18)、保持一致性的偏好变化模型(consistency-preserving preference change models)(19)和偏好逆转模型等(Tversky & Kahneman，1986；Loewenstein，2000；Kahneman，2003)，偏好的变化通常被解释为合乎人类某种稳定的认知心理因素，因此，构造包含更多认知心理因素的效用函数成为此研究的重点。

偏好演化是指从演化理论的视角来考察偏好的变化。从个体或微观的视角看，偏好演化可以被简单地描述为个体放弃某一种偏好而转向另一种偏好，而这种偏好变化不是完全理性的选择，而是一种有限理性的学习过程或调整过程，也是个体对其演化环境的适应过程。因此，偏好演化实际上是参与者对更具有适应性或者更好的偏好的学习或搜寻过程。所谓的更具有适应性或更好的偏好是指，对于特定的演化环境，这种偏好能够给参与者带来更高的收益，这种收益既包括可货币化的物质收益，也包括各种诸如道德感和正义感的内在价值收益等。根据不同的学习规则(如创新和模仿)，偏好演化既包括个体在已经存在的偏好空间模仿更具有适应性的偏好，即在既定偏好空间中从一种偏好转向另一种偏好，也包括个体通过创新产生新的偏好，促使偏好空间不断扩展。从群体或宏观的视角看，偏好演化可以被描述为不同偏好类型在群体中比重分布的演变，这也是一种统计量的历时变化。

这里简单归纳四种类型的偏好演化动力机制：首先是物质收益变化驱动的偏好演化，这也是较为简单的演化机制，即由于行动结果的物质报酬变化而引起的个体偏好演化。例如，相对价格、制度或博弈规则等的变化会导致具体行动结果收益变化，从而导致个体改变原有的偏好(Ostrom，2000；Heifetz，Shannon and Spiegel，2007)。其次是信念变化驱动的偏好演化。即便个体对具体行动结果的偏好是不变的，但是，在不确定性的场景中，个体对自然状态分布信念的变化也会导致个体期望收益的变化，这会改变个体偏好。这方面的研究也体现在诱导性偏好变化模型(derivational preference change models)(20)或者信念的偏好变化模型(doxastic preference change models)(21)(Elster，1983；Hill，2009)。再次是价值变化驱动的偏好演化。较之于前两种偏好变化，由这种类型的偏好变化并不一定涉及行动或结果物质收益的变化，而是涉及对行动或结果的价值判断发生变化(Grune-Yanoff & Hansson，2009)。最后是心智模型(mental model)或认知结构变化驱动的偏好演化(布瓦索，2003；North，2005)。较之于前几种演化机制，这种偏好演化机制最为复杂。由于心智模型的变化较为缓慢，这种类型的偏好演化也较为缓慢，但是，一旦心智模型发生本质的变化，个体的信念和价值都可能发生变化，个体偏好可能发生结构性的转变。

在上述四种偏好演化动力机制中，信念变化驱动的偏好演化是由个体期望收益变化引起的偏好变化，它本质上也属于物质收益变化驱动的偏好演化，而价值变化驱动的偏好演化实际上也是价值收益变化驱动的偏好演化。因此，前三种实际都是由收益(包括外在物质收益和内在价值收益)变化驱动的偏好演化。收益变化通常会引起偏好适应度的变化，参与者会通过学习过程搜寻更具有适应性的偏好。而心智模型或认知结构变化驱动的偏好演化则涉及参与者认知模式或学习规则本身的变化。学习规则决定了参与者采取何种信息搜寻和处理模式以改变原有的偏好，决定了偏好演化的方向和速度。

2.制度演化

制度是由参与者互动形成的规则系统，制度演化则是指该制度下的参与者们放弃了原有的规则系统，转向另一种规则系统，它经历了原有规则系统的失衡、参与者之间的互动学习以及新规则系统的形成等过程，前后两种制度存在路径依赖的特征。制度演化本质上是旧共同知识瓦解和新的共同知识形成的过程，这实际上也是参与者之间互动学习的过程。这种学习不仅仅包括对新的行为规则的学习，还可能包括对新的共享信念、共享价值和共享心智模型的学习。由于涉及参与者之间共同知识的演化，制度演化比个体偏好更为复杂。从制度群体视角看，制度演化可以被描述为不同制度类型在群体中比重分布的变化，也是一种统计量的历时变化。制度演化既包括参与者们在既定的制度空间从一种制度转向另一种制度，即制度模仿，也包括制度空间的扩展，即制度创新。

在许多情况下，制度的演化是一个复杂系统的演化，它不仅包含着可观察的行为规则的变化，还可能包含着不可观察的共享信念、共享价值和共享心智模型的演化。一个完整的制度演化涵盖上述四个层面的规则演变。在制度的这四层规则中，均衡的稳定程度通常是依次递增的，即行为规则比较容易变化，而共享心智模型则是最为稳定的。因此，在制度失衡过程中，通常情况下，参与者首先会偏离原有的行为规则和共享信念，然后再偏离原有的共享价值和共享心智模型；在新制度的形成过程中，参与者通常会先形成新的共享心智模型和共享价值，再形成新的行为规则和共享信念。在某些制度演化中，参与者之间的共享心智模型可能较为稳定或者变化较小，制度演化主要涉及行为层面和信念层面的规则的变化，在这种情况下，新制度形成的速度较为迅速。如果制度演化涉及共享价值和共享心智模型较为深刻的变化，制度演化或转型将是一个较为漫长的过程。前一种类型通常表现为一些具体制度安排的变化，后一种类型则表现为更为宏大的制度环境的变化。此外，制度与制度之间可能存在较强互补关系，某些制度演变可能促使其他相关制度的演变，而后者的演变又可能进一步影响前者的演化，制度间的这种协同关系可能进一步推动更大的制度系统的演化(Aoki，2009)。

一个启发式的制度演化过程可以简单描述如下：首先，随着互动环境的变化，某些创新者发现偏离原有行动规则能够获得更高的预期收益，如果这种行动偏离不影响原有共享价值和共享心智模型，而且其他参与者也发现偏离原有行动规则能够获得更高的预期收益，他们会学习创新者的行动，偏离原有的行为规则，进而参与者之间有关如何进行互动的共享信念也会被打破，制度中的行动规则和共享信念将会失衡。而新的行动规则和共享信念将在参与者之间的互动过程中产生。由于此时参与者之间的共享价值和共享心智模型还较为稳定，参与者之间可能不需要耗费太多的时间而达至新的行动规则和共享信念；如果创新者的行动背离了参与者之间的共享价值和共享心智模型，例如，创新者的行动被认为是不道德或者不具有合理性，即便偏离原有行动规则能够获得较高的物质收益，其他参与者也可能不会去模仿创新者的行动。当创新行动的收益足够大、创新者的数量达到一定的阈值、创新者的谈判能力和权力足够大或者该群体遇到其他群体激烈的竞争，其他参与者才可能去学习、响应或顺从创新者的行动。随着偏离原有行动规则的人数越来越多，参与者之间原有的共享价值和共享心智模型可能被瓦解。原有的规则系统就失衡。此时，参与者之间的互动将充满不确定性，新的规则系统将在参与者之间较为漫长的互动中形成。共享价值和共享心智模型的演化可能受到个体选择和群体选择的共同作用(Whitman，2004；黄凯南，2008)。参与者的学习规则将更加丰富，制度演化也将更加复杂。

(二)共同演化机制

上述研究表明，尽管个体有些偏好是由基因遗传决定的，但是，许多后天形成的偏好是内生于个体的学习过程中的，这包括个体学习和社会学习(包括文化传递)，并且在许多情况下，社会制度对偏好的演变会产生影响。同样，制度也不是外生给定的，而是内生于参与者之间的互动或者学习过程中，而制度一旦形成便构成了参与者之间共享的行为规则、共享信念、共享价值和共享心智模型，直接影响和塑造了参与者的偏好。我们通常能够在个体偏好中看到制度的影响因素，也能够在制度中看到个体偏好的影响因素。当某种偏好被广泛传播而成为一种流行的偏好或习惯时，这种共享的偏好本身也就构成了一种制度。正如凡勃伦指出的，制度是一种流行的思维习惯(Rutherford，2001)。同样地，一些内化的社会规则(如道德和规范)本身也构成了个体的偏好。在这些情况下，制度与偏好很难被明确区分开来。因此，在讨论偏好与制度的关系中，很难仅仅从单向维度去论述，在社会经济系统中，并不存在外生给定不变的个体偏好，也不存在外生给定不变的制度。随着互动环境的变化以及参与者认知的变化，偏好与制度都可能发生变化。

1.两者如何相互影响

在探讨共同演化机制之前，必须先理清两者的相互影响机制。制度是由个体间互动形成的规则系统，个体的偏好毫无疑问会影响到制度的生成和演变。个体偏好通过以下一些途径来影响制度：其一，偏好会通过影响参与者的行动或策略选择来影响具体制度的形成。这方面的研究广泛存在于制度的博弈论分析中。其二是偏好通过塑造参与者的行为动机来影响制度。不同类型的偏好会塑造参与者不同的行为动机。例如，利他偏好促使参与者只关注行动结果给自身带来的效用；而道德、公平、正义和利他等社会性偏好促使参与者关注行动本身的价值及其合理性等，参与者的行为动机通常表现出服从某一种道德标准或社会价值。公共物品自愿供给制度的研究发现，在参与者群体中，不同类型的偏好分布会对制度的形成产生重要的影响。其三是偏好通过影响参与者的心智模型来影响制度。对于个体而言，这是最为内在的影响机制。个体的心智模型决定了其对互动环境的信息编码、抽象和解码等规则，它塑造了参与者的学习规则等。在具体的社会互动场景中，如果参与者之间各自拥有不同的心智模型，他们对于互动环境的认知模式存在差异，在互动过程中可能会存在认知冲突。心智模型的差异越大，参与者之间形成共享心智模型的互动学习时间就越长。一旦形成了共享心智模型，参与者之间对于互动场景拥有相同的感知、理解和解释模式，对于相同的信息，参与者之间不会存在认知上的冲突，这有助于参与者之间的交流和学习，进而形成有关互动场景的共同知识。而随着参与者心智模型的演变，这种共同知识也会发生演变，制度也随之演变。在上述偏好影响制度的三种途径中，主流经济学主要从第一个途径来研究偏好对制度的影响，而随着实验经济学和行为经济学的发展，大量的研究关注偏好对行为动机的影响，社会性偏好受到更多学者的重视。较之于前两种，有关个体心智模型对制度影响的研究还相对较少。格伦-亚诺夫和汉森(Grune-Yanoff and Hansson，2009)指出，心智模型对个体学习规则和决策规则的影响将受到越来越多的重视。

制度是参与者之间互动形成的规则系统，这个规则系统包含参与者之间的行动规则、共享信念、共享价值和共享心智模型等。制度一旦形成了，也会影响和塑造个体的偏好。制度对偏好的影响主要体现在以下几个方面：其一，制度通过影响行动报酬来影响偏好。制度决定了参与者行动的成本与收益，构成了参与者偏好的选择机制。在许多情况下，参与者会学习或搜寻行动报酬高的偏好，放弃行动报酬低的偏好。其二，制度作为浓缩信息装置或者均衡的概要表征(Aoki，2001)，可以通过影响参与者的信念来影响偏好。当存在多重均衡时，制度作为共享信念能够在一定程度上降低参与者之间互动的不确定性，直接塑造了参与者对其互动状态概率分布的信念，这会影响参与者的期望收益，从而影响参与者的行动偏好。这体现了制度的信息功能。其三，制度通过塑造参与者的价值观来影响偏好。制度通过各种社会奖惩机制强化了对某种社会价值的遵循，而这种社会价值会塑造参与者对某些行动的价值评判，从而影响参与者的行动偏好。当某种偏好被认为是符合社会价值时，这种偏好会被更多人接受，反之，当偏好不符合社会价值时，即便这种偏好能够带来较高的物质报酬，也可能被摒弃。那些符合社会价值的偏好会被选择出来，并通过各种社会机制传递和扩散。其四，制度通过塑造参与者的心智模型来影响偏好。心智模型决定了参与者的认知模式，塑造了参与者的学习规则，它会影响到参与者偏好的生成与演变。这充分体现了制度所具有的认知功能(黄凯南和黄少安，2009)。

因此，偏好与制度之间存在复杂的相互影响关系。在某些情况下，偏好与制度相互强化，即参与者依据各自偏好进行互动形成制度，而制度又会强烈塑造偏好，某些偏好与制度就可能锁定在较为稳定的状态中。

2.两者如何共同演化

共同演化是指两个或多个互动者(interactor)之间的演化轨迹(evolutionary trajectory)相互影响，而这种相互影响是指改变彼此的适应图景(fitness landscape)(Andersen，2003；Jouhtio，2006)。当互动者之间的相互影响不改变彼此的演化轨迹，这种相互影响就不构成共同演化。因此，尽管偏好与制度之间存在复杂的相互影响关系，但是，这并不意味着两者一定存在共同演化关系，在许多情况下，偏好演化未必会影响制度演化，制度演化也未必会影响偏好演化。只有当偏好演化或者制度演化能够确切改变对方的适应度(fitness)，两者才存在共同演化关系。

这里归纳两类重要的共同演化机制。一种是由参与者收益变化驱动的共同演化。如上所述，这里的收益既包括可货币化的物质收益，也包括各种诸如道德感和正义感等内在的价值收益或效用。必须强调，外在的货币收益和内在的价值收益并非总是相互独立的，它们可能具有互补或替代关系。例如，鲍尔斯(Bowles，2008，2009)研究表明，许多制度在激励参与者物质收益的同时可能会损害参与者的价值收益，从而产生挤出效应(crowding out)。参与者的收益构成了其行为的基本动机和激励，这是最为直接的机制。无论是偏好演化还是制度演化都可能涉及参与者收益的变化，收益变化也会促使参与者改变偏好和制度。这种共同演化逻辑可以简要描述如下：当制度发生变化时，行动报酬、信念和价值都可能发生变化，如果这些变化降低了参与者原有偏好的收益，达到某一阈值时，参与者会有激励去学习或搜寻获益更高的偏好。上述四种偏好演化动力机制，前三种都可以被认为是由参与者收益变化驱动的。同样，当偏好发生变化时，如果偏好变化会降低参与者在原有制度下的收益时，达到某一阈值时，创新者会有激励偏离原有的制度，一旦偏离原有制度能够获得更高的收益，越来越多的参与者就可能跟随创新者偏离原有的制度，原有制度就失衡，通过互动学习，参与者之间可能建立另一个制度。

另一种是由学习规则变化驱动的共同演化。如上所述，无论是偏好还是制度，其演化过程都可以被描述为参与者的学习过程。因此，学习规则的变化会改变偏好和制度的演化轨迹。近些年来，越来越多的学者关注个体的学习规则。索贝尔(Sobel，2000)将学习规则简单分为两类：自我试错和模仿。根据个体学习过程中意识的强弱，布伦纳(Brenner，2006)区分了三种类型的学习规则：一是无意识的学习(non-conscious learning)，包括强化学习和参数化的自动学习；二是弱意识的模仿学习(learning by imitation)；三是强意识的信念学习(belief-based leaning)，包括虚拟行动(fictitious play)、随机学习动态、随机信念学习、遗传编程(genetic programming)、神经网络、贝叶斯理性学习和经历加权吸引模型等。杨(Young，2009)研究了三种类型的学习规则，即传染病模型(contagion model)、社会阈值模型(social threshold model)和社会学习模型(social learning model)；萨珐辛斯卡和凡-登伯格(Safarzynska and Bergh，2010)归纳了三种类型的学习规则：一是演化博弈和选择动态，包括复制者动态(replicator dynamics)、最优响应动态(best response dynamics)、平滑最优响应(smoothed best replies)、布朗—冯·诺依曼—纳什动态(Brown-von Neumann-Nash dynamics)、模仿动态(imitation dynamics)、选择—变异动态(selection-mutation dynamics)和适应性动态(adaptive dynamics)；二是演化算法(evolutionary computation)，包括遗传算法(genetic algorithms)、学习分类器系统(learning classifier systems)、遗传编程；三是多智能体模型(multi-agent models)。不同的学习规则描述了参与者不同的信息搜寻和处理模式，进而刻画了偏好和制度不同的演化动态过程。如上所述，制度作为共享心智模型塑造了参与者的认知模式，进而塑造了参与者的学习规则。当制度发生演变时，如果共享心智模型也发生变化，参与者的学习规则也可能发生变化。一旦学习规则发生变化了，参与者的偏好演化轨迹和速度可能受到系统性的影响。同样，如上所述，偏好也会影响参与者的心智模式。当偏好发生演变，如果参与者的心智模型也发生变化，参与者的学习规则就可能发生变化，这同样会对制度演化的轨迹和速度产生系统性的影响。

在许多情况下，上述两种机制可能共同作用于偏好与制度的共同演化，即两者的共同演化由参与者收益变化和学习规则变化共同驱动，共同演化过程将是一个十分复杂的过程。

四、一个简要的共同演化描述模型

如上所述，偏好与制度之间存在复杂的相互影响关系，偏好和制度的共同演化可能受到参与者收益变化或学习规则变化等的驱动，本质是一个多层级的复杂演化过程。当前，尚未有很好的数理模型能够用来描述这样复杂的演化过程。有些研究主要是运用多智能体模型来仿真模拟偏好与制度的共同演化过程(Bowles，Choi and Hopfensitz，2003；Hodgson & Knudsen，2004)。但是，这些研究也都是仅仅从物质收益层面考察偏好与制度的关系，无论在理论上还是模型上，它们都从未从诸如信念、价值、心智模型等更为复杂的层面来探讨偏好与制度的关系，也没有较为深入地阐释偏好与制度的共同演化机制。较之于以往的研究，我们在理论上较为深刻地阐释偏好与制度的共同演化机制，但是，同样地，这里也无法建立一个很好描述上述复杂演化过程的模型。为了简化分析，这里并不考察由学习规则变化驱动的共同演化，而是仅仅考察由参与者收益变化(包括物质收益和价值收益)驱动的共同演化模型，即偏好演化和制度演化通过影响彼此的收益而形成共同演化关系，并且通过一个简单的学习规则来描述这种共同演化动态，目的是想通过这个简要模型来描述偏好与制度共同演化的逻辑关系。

我们这里不考虑偏好或制度的创新问题(22)，偏好空间和制度空间都是既定的，偏好演化是指从既定偏好空间的某一个偏好转向另一个偏好，制度演化是指从既定制度空间的某一制度转向另一个制度。

通过上述的假设，可以得到偏好与制度之间的收益影响关系(见表1)。

从表1可知，当制度变化时，偏好的收益会发生变化，同样，当偏好发生变化时，制度的收益也会发生变化，这构成了由参与者偏好变化驱动的共同演化关系。

可以认为，这里实际上存在两个群体，即买者和卖者，买者和卖者内部分别又存在两种类型：

和

。

方程(7)和方程(9)表明，制度演化(如

的变化)会影响偏好的适应度，同样地，偏好演化(如

的变化)也影响制度的适应度。从这个角度上讲，这两个动力方程描述了偏好与制度共同演化的逻辑关系。

五、结论与展望

本文得出如下结论：(1)偏好不仅包括新古典经济学所主张的享乐主义效用，还包括各种由基因遗传的本能、个体心理倾向、内化的社会道德、价值和习惯等。可以不严格地用以下四个维度来阐释偏好的内涵：生物演化的维度、基因与文化协同演化的维度、社会文化制度维度和个体认知心理维度。这四种维度之间存在复杂的相互影响关系，共同作用于个体，塑造了个体的具体偏好。(2)制度可以被定义为参与者之间互动形成的规则系统，而这种规则系统一旦形成又会进一步协调、组织和约束参与者之间的互动，从而降低互动过程中的不确定性。作为互动规则系统的制度包含参与者之间的行动规则、共享信念、共享价值和共享心智模型等。(3)偏好演化可以被简单地描述为个体放弃某一种偏好而转向另一种偏好，而这种偏好变化不是完全理性的选择，而是一种有限理性的学习过程或调整过程，也是个体对其演化环境的适应过程。存在四种类型的偏好演化动力机制：物质收益变化驱动、信念变化驱动、价值变化驱动和心智模型变化驱动等。在这四种动力机制中，前三种实际都是由收益(包括外在物质收益和内在价值收益)变化驱动的偏好演化，后一种则涉及学习规则的变化。(4)制度演化本质上是旧共同知识瓦解和新的共同知识形成的过程，这实际上也是参与者之间互动学习过程。在许多情况下，制度的演化是一个复杂系统的演化，它不仅包含着可观察的行为规则的变化，还可能包含着不可观察的共享信念、共享价值和共享心智模型的演化。一个完整的制度演化涵盖上述四个层面的规则演变。(5)个体偏好通过影响参与者行动、动机和心智模型来影响制度，同样地，制度通过影响行动报酬、信念、价值观和心智模型来影响偏好。(6)只有当偏好演化或者制度演化能够确切改变对方的适应度，偏好与制度才具有共同演化关系。存在两种类型的共同演化机制，即由参与者收益变化驱动的共同演化和由学习规则变化驱动的共同演化，在许多情况下，这两种机制共同作用于偏好与制度的共同演化过程。

尽管本文积极深入探索偏好与制度的共同演化理论，但是，依旧还有许多问题有待深入研究，未来进一步的研究主要集中在以下一些问题：(1)在跨学科研究的视角下，深入考察偏好四个维度的相互作用机制，并着重考察认知过程或学习过程在偏好生成和演变中的作用。(2)深入考察制度生成和演变过程中行为规则、共享信念、共享价值和共享心智模型的演变规律及其相互作用机制，着重研究参与者认知在制度生成和演变中的作用。(3)基于认知科学的前沿进展，描述心智模型演变对偏好和制度演变的影响与作用，着重阐释共享心智模型或共同知识的生成与演变。(4)构建一个能够全面描述偏好与制度共同演化的模型，这种模型必须涵盖参与者收益变化和学习规则变化，并能够阐释两者变化的关联机制。这种共同演化模型必须超越现在流行的演化博弈模型。(5)通过行为实验、仿真模拟和计量等方法，实证研究和检验偏好与制度的共同演化理论。上述这些研究都具有挑战性，任何一项研究的实质性进展都会给经济学的基础理论研究带来新的发展，能够为我们理解现实复杂的经济现象提供重要的分析视角。

①当然，在经济学说史上，并非所有的经济理论都将个体偏好和制度视为外生。最为典型的例外是以凡勃伦、康芒斯、米切尔和艾尔斯等为代表的旧制度学派，该学派长期关注个体偏好(如本能和习惯)和制度问题，并且在20世纪初至第二次世界大战结束之前曾经有一段时间成为流行的研究范式。但是，在第二次世界大战以后，随着一般均衡理论、计量经济学和行为主义心理学的发展，新古典经济学在形式逻辑和经验研究上都大大超越了旧制度学派，并迅速成为主流的研究范式，个体偏好和制度也被视为外生给定的变量而不予研究(如霍奇逊，2007；黄凯南和黄少安，2009)。

②例如，元偏好是稳定的，所谓偏好的变化是次偏好的变化，它主要是由于参与者的人力资本和社会资本存量的变化引起的。

③这种结合产生了许多基于认知科学的经济学理论。例如，行为经济学、神经元经济学、心智经济学(economics of mind)和跨学科综合学派等(参见黄凯南和程臻宇，2008)。

④例如，经济学、社会学、道德哲学、政治学、心理学、法学和社会生物学等。

⑤例如，Sharot，De Martino and Dolan(2009)研究表明，当个体在原先两个价值相近的选项做出选择后，个体会改变对原先两个选项的偏好，会赋予被选择对象更高的价值。这种偏好的变化也反映在生理上的变化，即有关预期效用刺激及其情感反应之间的变化。这种变化可以通过磁共振脑成像技术在尾状核区位观测得到，具体表现为血氧水平独立信号在被选择对象和淘汰对象之间的差异在选择后得到很大的强化。

⑥这种缺乏一般形式化的困境也是许多新兴的经济理论至今无法取代新古典经济学主流地位的重要原因，后者在一般形式化上太过于完美了。

⑦例如，人类采集和狩猎时期的平均主义制度。

⑧例如，Tversky & Kahneman(1991)指出，无论是价值函数还是概率函数，都受到个体认知心理状态的影响；价值函数具有“基点依赖”(reference dependence)、“损失厌恶”(loss aversion)、“敏感度逐渐缩小”(diminishing sensitivity)等特征，而概率函数则具有“次确定性”(subcertainty)和“次比例性”(subproportionality)等特征。

⑨当然，也不能排除基因变异的可能性，这会导致偏好的变化。

⑩霍奇逊(Hodgson，2006)指出，由于很难得到一个广泛接受的制度定义，许多研究都不再关注制度定义问题，而是转向研究更为具体的制度问题。

(11)例如，诺思(North，1990)区分了制度和组织，认为组织不是制度，它是博弈的参与者，而制度是博弈的规则。

(12)由于博弈存在多重均衡，仅仅依靠原有博弈规则并不能预测具体的博弈结果，制度作为一种内生于博弈的制度化规则(institutionalized rules)或者达到某一均衡策略的共有信念，能够指导参与者采用某一均衡策略，从而降低博弈的不确定性，以解决参与者之间的策略协调问题。

(13)例如，日常的社会交往、不平等的权力关系等。

(14)这时候的互动就不能用博弈论来描述，因为不存在外生的博弈规则。

(15)有些学者将这种互动称为主观博弈(subjective games)或者归纳博弈(inductive games)(如Kaneko & Kline，2008；黄凯南，2010)。

(16)“偏好的相互依赖性”是指其他人当前消费会影响某一个体未来的消费，“习惯形成”是指个体当前的消费会影响未来的消费。

(17)这实际上是将偏好的变化视为商品生产能力的变化，从而会影响商品的影子价格，而影响个体对该商品的消费量。

(18)这类模型通常指在其他条件都不变的情况下，仅仅由于时间的不同而导致偏好的变化。例如，在

时刻消费A和B，个体偏好于A，而在

时刻消费A和B则偏好于B。双曲线贴现模型通常被用来描述个体的这种时间偏好变化的现象。造成这种时间偏好变化的原因通常被归纳为个体的不耐心程度随时间递减、认知偏差和意志薄弱等认知心理因素(如Leowenstein & Prelec，1992；Laibson，1997)。

(19)这类模型通常指为了保持认知的一致性，当存在认知冲突时，个体就可能会改变原有的某些偏好。

(20)即某种新偏好的形成是源自另一个更为基础的偏好，而这两种偏好之间的关联在一定程度上解释了偏好的变化(如Hill，2009)。

(21)例如，存在两种信念偏好变化类型：一种是当状态X能够导致渴求的状态Y时，即X∧Y优于

，一旦给定X状态Y的概率上升，则个体对X的偏好程度将会上升，反之则下降；另一种是即便状态X和状态Y之间自然发生的概率是不相关的，但是X∧Y优于

，则状态X发生的概率上升会导致个体对状态Y偏好的上升，反之则下降。

(22)实际上，如何将创新内生化一直以来是构建演化模型面临的难题(Witt，2010)。但是，这里主要想描述偏好与制度共同演化的逻辑关系，不考虑创新问题并不会影响我们的分析。

标签：博弈论论文; 演化博弈论论文; 理性选择理论论文; 新古典经济学论文; 制度理论论文; 理论经济学论文; 微观经济学论文; 文化维度论文; 空间维度论文; 制度文化论文; 认知过程论文; 经济学论文;

个体偏好与系统的协同进化：一种新的理论探索_博弈论论文

猜你喜欢