解决商业战争中的“囚徒困境”_囚徒困境论文

商战“囚徒困境”有解,本文主要内容关键词为:囚徒论文,商战论文,困境论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。

改革开放推动了中国经济的快速发展,但随之也浮现出一批野蛮生长的企业,滋生了一群急功近利的企业主。它们在短期利益与长期利益、个体利益与群体利益之间难以平衡以致矛盾重重,陷入“囚徒困境”。在百度检索关键词“价格战”,马上能找到400多万条相关新闻。从最早的冰箱、彩电、空调、微波炉等家电产品,到近几年的电商大战,此起彼伏,硝烟不止。这些价格战无一不以追求单方利益最大化为目的,导致两败俱伤。时至今日,企业家迫切需要摆脱急功近利的心态,着眼未来,重建合作精神,避免频繁陷入“囚徒困境”。

1986年,我在中科院自动化所攻读博士学位时第一次拜读了罗伯特·阿克塞尔罗德教授(Robert Axelrod,密歇根大学政治和公共政策学院教授、美国科学院院士)的著作《合作的进化》(The Evolution of Cooperation),深深为其论证方法之精巧、分析之透彻、结论之精彩所折服,它促使我开始对合作问题的研究。1993年,我有幸赴美师从阿克塞尔罗德教授做博士后研究,1994年回国后,立即着手将这本已被译成十几种语言的经典之作翻译成中文。

“一报还一报”破解“囚徒困境”

罗伯特·阿克塞尔罗德教授的研究始于“囚徒困境”的故事。两个嫌疑犯(A和B)作案后被警察抓住,并隔离申讯。如果两人都坦白则各判轻刑;如果一人坦白另一人不坦白,则坦白的放出去,不坦白的判重刑;如果两人都不坦白则因证据不足各判短期监禁。两个嫌疑犯将如何选择?

为了将问题简化,并用博弈论的语言进行描述,我们假设在“囚徒困境”的游戏中,有两个对弈者,他们都有两个选择:合作(不坦白)或背叛(坦白)。而且每个人都必须在不知道对方选择的情况下做出自己的选择。在这样的假设前提下,就可以得出一个“囚徒困境”博弈的矩阵图(图1)。在矩阵中,如果双方都选择合作,双方都能得到较好的结果“R”,即“对双方合作的奖励”。假定R为3分,代表参赛者得到的奖金数。如果一方合作而另一方背叛,那么背叛者得到5分(对背叛的诱惑,T=5),合作者则得到0分(给笨蛋的报酬,S=0)。如果双方都背叛,那么各得1分(对双方背叛的惩罚,P=1)。

对A来说有两种选择:一是假设B选择背叛(坦白),这时如果他也背叛(坦白)则得到“P=1”,而如果他合作(不坦白),则得到“S=0”,选择背叛是较好的策略;二是假设B选择合作(不坦白),这时如果他也选择合作(不坦白),则得到“R=3”,如果他背叛(坦白),则得到“T=5”,选择背叛依然是较好的策略。以上推理同样适用于B。这样,两人在分析后都选择背叛(坦白)策略,结果是两人都得到“P=1”(被判徒刑)。“困境”由此产生:双方从自己的角度考虑,背叛是最好的选择,却无法实现对双方而言更好的结果“R=3”。所谓的困境就是:如果双方都背叛,其结果比双方都合作更糟。

因此,如果只进行一次博弈,没有人会选择合作。但如果博弈要进行多次呢?其中一方是否要选择合作以诱导对方也合作,从而获得更好的结果?对于这个问题,罗伯特·阿克塞尔罗德教授的研究结果是:只要双方知道要进行博弈的次数,双方就仍然没有合作动机。因为在个体利益最大化的驱动下,在有限的博弈次数中,最后一次博弈没有人会选择合作。那倒数第二次,双方依然没有合作动机,因为他们都预知对方在最后一次会背叛,倒数第二次也只能选背叛。如此推理下去,只要博弈次数已知,从第一次博弈开始双方都会选择背叛,直到最后一次。

然而,如果博弈次数无限次,或者双方都不知道何时终止博弈时(称为“重复囚徒困境”),双方要如何选择?再进一步,如果在多人之间相互进行“重复囚徒困境”,又该选择何种策略?事实上,与多人相互进行“重复囚徒困境”最为贴近企业竞争与合作的现实境况。对此,罗伯特·阿克塞尔罗德教授采取了一个新颖的方法进行试验:计算机竞赛。他邀请各领域的专家提交他们的策略(程序)参加“重复囚徒困境”的比赛,每个策略与其他所有策略(包括它自己)逐个对局(每局进行无限次博弈,基于计算机程序的特性,设定为多次博弈,如200次),最后选择出得分最高的策略。

在第一轮竞赛中,一共有15个程序(也即15种博弈策略)参赛,令人惊讶的是,最后获胜的策略是所有策略中最简单的:“一报还一报”(Tit forTat)。这个策略在与任何对手的第一次博弈中都选择合作,在接下来所有次数的博弈中,都选择与对方上一次与自己博弈时相同的策略。也即:对方上一次博弈选择合作,则在下一次与他的博弈中选择合作,反之亦然。此后不久,罗伯特·阿克塞尔罗德教授再次发起第二轮竞赛。这次共有63个参赛程序,都是各领域的专家提交的,此时他们已经知道了第一轮竞争中获胜程序的策略。但最终的竞赛结果显示,依然是“一报还一报”的策略以最高分胜出。罗伯特·阿克塞尔罗德教授由此得出在多人“重复囚徒困境”博弈中,最佳策略具有的四个特征:

●善良性:不要首先背叛。“一报还一报”策略的第一次博弈都选择合作,后续策略选择都与对方上一次相同,因此做到了绝不首先背叛。

●可激怒性:对无理背叛进行报复。如果对方上一次选择背叛,按“一报还一报”的策略,在下次博弈中就会选择背叛。

●宽容性:在对背叛给予反击后,如果对方恢复合作,立刻回以合作策略。也即它是不记仇的。

●清晰性:博弈行为清晰简单,对方很容易就能辨识。第一次给予合作,后续选择都取决于对方的策略,对手很容易辨识,进而能够做出让双方都获益最大的策略选择。

可乐百年竞争史的启示

我们经常看到企业为了争夺市场而发生恶斗,如三一重工和中联重科,王老吉和加多宝。这些企业都将市场竞争看作“零和博弈”,你之所得就是我之所失。事实上市场竞争是“非零和博弈”。如“重复囚徒困境”一样,在竞争中,只要企业明确地认识到“单方面追求自身利益的恶性竞争行为,必然招来对手的报复而最终导致两败俱伤”的事实,就能摆脱通过背叛谋求单方利益的诱惑,就有可能通过合作达到双赢。

在“重复囚徒困境”中,合作的必要条件是持续的关系和相互的回报。罗伯特·阿克塞尔罗德教授的忠告是:只要你和竞争对手要在市场中长期共存,而且针对你的任何不合作行为,对方都有报复能力时,最好的策略就是合作。在这方面,可口可乐和百事可乐之间的合作共赢是典范案例。这两家企业的商品具有极高的同质性,它们也曾有过激烈竞争,从美国打到全球,但纵观其一百多年的竞争和合作的进化,依然值得很多企业学习。

首先是良性竞争。在长达百年的竞争中,两家企业虽然时有关于商标、广告、包装等的诉讼,但从来没有发生过你死我活的恶性攻击和诽谤。2006年7月5日,可口可乐公司出现“内鬼”,企图将可口可乐的秘方和包括其新饮料样品在内的商业机密出售给百事可乐,但百事可乐拒绝了,并将这一信息通报给可口可乐,由此赢得全球赞誉。

其次是逐步进化的合作。1929年,百事可乐为了生存,掀起第一次价格战,不惜将价格降至5美分,仅为可口可乐的一半。但价格战并没有让百事可乐摆脱落后局面,两家公司逐步明白价格战终将导致两败俱伤,市场竞争开始更多体现在客户定位、渠道、区域和营销策略上。1964年,百事可乐旗帜鲜明地打出取悦于年轻一代的“百事可乐新一代”口号,建立差异化,一举在业绩上拉近了与可口可乐的距离,并在1978年第一次成功超越可口可乐。在促销价格上,今天两家公司的价格竞争理性得多。在超市中,可口可乐和百事可乐一般不在同一时间降价促销,而是轮流进行促销,促销降价都控制在10%左右。这既避免了同时促销导致的两败俱伤,又维持了碳酸饮料的价格优势,通过激烈竞争建立起来的知名度有助于商品销售,更有助于与非碳酸饮料竞争。

经过一百多年的激烈竞争和商业理性的进化,两家公司都意识到:它们之间不是一场你死我活、非此即彼的战争,真正的竞争对手是非碳酸饮料,它们完全可以通过合作实现共赢。可以这么说:如果只有可口可乐一家独大,碳酸饮料远不可能像今天这么普及。

其实,我之前所在的物美集团,其所处的零售行业合作问题更加突出。在原料供应商、生产商、经销商和零售商形成的纵向的商品供应链中,也有类似的“重复囚徒困境”。20世纪80年代以来,随着商品从供不应求转向供过于求,商品流通领域的话语主导权由生产企业转向零售企业。零售商存在压低商品进价,增加对供应商的各种收费和延长结账周期的诱惑:供应商则存在原料以次充好,降低成本的诱惑,同时还会利用延迟送货等办法“报复”零售商。从单方面看,双方的“背叛行为”都对自己有利,但往往引起对方的不合作或“报复”,破坏彼此之间的信任关系,轻则增加交易成本,影响整个供应链的效率,重则使得双方终止合作,两败俱伤。从整个商品供应市场来看,零供关系就是一个多人的“重复囚徒困境”:每个供应商要和多个零售商合作,每个零售商也要和多个供应商合作。这和“重复囚徒困境”计算机竞赛一样,能否取胜,取决于你和所有参赛程序能否和平相处,共同获得高分,而不是在与单个对手对局时获得比对方更高的分数。

中国连锁经营协会近期发布的一份调查报告显示:尽管零供矛盾仍时有发生,但总体来看,正逐渐从相互挤压争利的博弈转变到共同提升供应链效率、协作创造更大的共同价值。零售商逐渐在改变以往的盈利模式,更多地谋求与供应商在消费者研究、新品开发、品类管理、客户服务能力、采购、物流、库存管理、信息化建设等方面的协作,以提高供应链效率,拓展更广阔的利润空间。零供双方合作行为越来越多,商业文明和企业理性在长期的竞争中也逐步提升,这是一个逐步进化的过程。

企业家合作观“四句忠告”

根据研究成果,罗伯特·阿克塞尔罗德教授就竞争与合作中的“重复囚徒困境”给出了四条忠告:

第一,不要妒忌对方的成功。企业面临的“囚徒困境”不是零和博弈,通过合作完全可以实现共赢。由于“一报还一报”的策略不会首先背叛,所以在每次博弈中都不会获得比对方更高的分数,而是通过诱导对方的合作共同获得高分。这也是罗伯特·阿克塞尔罗德教授从计算机竞赛中发现的有意思的一点:一个在每次博弈中从来不获得比对手更高分数的选手,最终赢得了竞赛。正如李嘉诚所说:在合作中,如果拿10%的股份是公正的,拿11%也可以,那你就拿9%的股份,有钱大家赚,利润大家享,就会有更多的人愿意和你合作。

第二,不要首先背叛。在“囚徒困境”中,如果妒忌对手,想比对手得分更高,那就只有先背叛,但这会引起不必要的冲突和循环不断的报复,导致两败俱伤。与此同时,企业还要背负挑起争端的责任,受到社会和舆论的谴责。

第三,对合作和背叛都做出回报。如果不对背叛做出报复行动,就会鼓励背叛者继续进行挑衅。例如,中国如果不启动对欧盟葡萄酒的反倾销和反补贴调查程序,欧盟也就可能继续提高对光伏产品的反倾销税率。同时,企业对于合作也要及时给予回报。人们往往急于对背叛行为做出报复,但对对方背叛后的示好与合作行为未必及时报以合作。这会让对方在背叛后希望重归于好的努力受到打击,也就不可能重新恢复合作。因此,可激怒性和宽容性是持续合作的两个保证,缺一不可。

第四,不要耍小聪明。总有一些企业希望通过自认为高明的办法占对方便宜,其实是非常不明智的。所谓“聪明”的企业行为表现往往过于复杂,使对方无所适从,这样就不能鼓励对方与你合作。简单清晰的竞争策略由于容易识别,也就最容易与对方建立互信并维持合作。“大智若愚”说的就是这个道理。

“一报还一报”合作策略给企业家的启示是:第一,在任何一场对局中,不是你赢他或者他赢你,而是要让更多人愿意跟你持续合作;第二,一个稳定可持续的合作是建立在对方成功的基础上,先让对方成功你才能成功;第三,绝不首先违规;第四,对对方的背叛和违规行为坚决给予打击,但一旦对方表现出合作意向则给予重归合作的机会;第五,在合作上,企业态度和策略一定要清晰,让对方容易辨识。

“一报还一报”道德吗

在“一报还一报”策略的四大特征中,很多企业家对其中“可激怒性”是否符合商业道德存疑。要回答这个问题,首先必须明晰什么是道德的标准。对此,北京大学伦理学教授王海明的观点是:道德的终极标准是增进每一个人的利益。在利益冲突情况下,道德的终极标准是“最大利益净余额”。也即:你的策略是不是道德的,就看策略引起的最大利益净余额是否最大。“一报还一报”促使人们达成合作,以及双方利益达到最大,所以是符合道德标准的。

王海明教授还认为,公正的总原则是“等利害交换”。你增进社会和他人的利益,就等于增进自己的利益,这样每个人要增进自己的利益就必须增进他人的利益;每个人要实现自己的利益最大化,就必须使社会和他人的利益最大化。当然还有等害交换:避免人们之间伤害的最重要、最有效的原则是等害交换原则:你损害社会和他人就等于损害自己,要使自己不受损害就必须不损害社会和他人。因此,“一报还一报”的策略不仅符合道德性,还符合公正性。

诚然,“无私利他”是最崇高的善,却不是最大的、最重要的善,也不是最重要的善原则和道德原则;“为己利他”虽不是崇高的原则,但却是最大的善,是最重要的善,是最重要的善原则和道德原则。“一报还一报”正是为己利他的具有优秀道德的策略。

随着信息技术的普及,人们相互间交往的信息日益透明,信息反馈时间迅速缩短,人们重复交易的机会和相互影响大大增加,这使得基于回报的策略的作用增强。新近出现的网络协作、众筹等新模式表明:树立正确的合作观已成为企业尽快进入新经济模式的基本能力,企业家必须抛弃急功近利的竞争者,加强沟通,建立互信,形成崇尚合作、互利共赢的竞争理念。

一部人类文明史,就是不断创造“囚徒困境”,又不断走出“囚徒困境”的历史,这个进化过程是漫长和艰苦的,西方企业历经数百年仍在进化。但罗伯特·阿克塞尔罗德教授的研究为我们理解合作的真谛提供了一盏明灯,企业家应建立正确的合作观,才能避免一次又一次陷入“囚徒困境”。这需要企业家群体一起达成共识,付诸行动,加快商业文明进程,为中国经济转型提供更多动力。

标签:;  ;  ;  ;  ;  ;  

解决商业战争中的“囚徒困境”_囚徒困境论文
下载Doc文档

猜你喜欢