第3章囚徒困境：如何突破两败俱伤的窘境

书名：博弈论的智慧
作者名：张影
本章字数：10993字
更新时间：2016-08-29 10:55:28

假设有两个小偷被警察抓住，警方将两人分别审讯并给出政策：如果两个犯罪嫌疑人都坦白了罪行，证据确凿，两人都被判有罪，则两人各被判刑8年；如果另一个犯罪嫌疑人没有坦白而是抵赖，则以妨碍公务罪再加刑2年，而坦白者有功被立即释放。如果两人都抵赖，则警方因证据不足而只能以私入民宅的罪名将两人各判入狱1年。从理性的角度出发，“坦白”是任一犯罪嫌疑人的占优战略，但结果却是两人都被判刑8年。

最经典的博弈案例：“囚徒困境”

有一位富翁在家中被伤，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人A和B，并从他们的住处搜出枪支和受害人家中丢失的财物。但是，他们都矢口否认曾伤过人。于是警方将两人隔离审讯。为了分化瓦解对方，警方告诉他们，如果主动坦白，可以减轻处罚；顽抗到底，一旦同伙招供，就要受到严惩。当然，如果两人都坦白，那么所谓“主动交代”就没有价值了，两人还是要受到严惩，只不过比顽抗到底要处罚轻一些。在这种情形下，两个囚犯都可以作出自己的选择：或者供出他的同伙，即与警察合作，从而背叛他的同伙；或者保持沉默，也就是与他的同伙合作对抗警察。

这样，就会出现以下几种情况：

（1）如果两人都不坦白，警察会以非法携带枪支罪和盗窃罪将两人各判刑2年；

（2）如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判10年；

（3）如果两人都招供，则两人都会因有罪各判8年。

一般读者可能都会认为，对于两个囚犯来说最好的结果就是都不招供，两人都只被判刑2年，因此两个囚犯都选择不招供就是这个博弈的最优结果。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果——只判刑2年。但，两个犯罪嫌疑人同样是聪明而精明的，他们在作决定的时候肯定也会仔细斟酌对方可能采取的策略。问题就这样开始了，A、B两个人都十分精明且有私心（这或许也是人类的通病），他们都只关心减少自己的刑期，并不在乎对方被判多少年。

A会这样推理：假如B不招，我只要一招供，马上可以获得自由，而不招却要坐2年牢，显然招比不招好；假如B招了，我若不招，则要坐10年牢，显然还是招供好。无论B招与不招，我的最佳选择都是招供。

自然，B也同样精明，也会如此推理。于是两人都作出招供的选择，这对他们两个人来说都是最佳的，即最符合他们个体的理性选择。按照博弈论的说法，这是这个问题的唯一平衡点，只有在这一点上，任何一人单方面改变选择，他只会得到较差的结果。而在别的点，比如两人都拒绝承认的情况下，都有一人可以通过单方面改变选择，来减少自己的刑期。

也就是说，对方背叛，你也背叛将会更好些。这意味着，无论对方如何行动，如果你认为对方将合作，你背叛能得到更多；如果你认为对方将背叛，你背叛也能得到更多。你背叛总是好的——这确实是一个让有些让人寒心的结论。

为什么狡猾的囚犯，无法得到对于他们来说最佳的结果呢？在这个案例中，两个人都招供，对这两个人而言并不是集体最优的选择。无论对哪个人来说，两个人都不招供，要比两个人都招供好得多。

在“囚徒困境”中，当各方在博弈之中处于不对等地位的时候，博弈的局势就会很容易发生偏移，即从合作型的博弈走向非合作型的博弈。不过，这种偏移并非必然发生，因为影响博弈走向的，不仅仅是双方的地位对比，还有局面的变化。产生不良结局的原因是因为囚犯二人都基于自私的角度开始考虑，这最终导致合作没有产生。如果你处于这样类似的困境中，你又应当如何做呢？设想你认为对方将合作，你可以选合作，那么你将得到“对双方合作的奖励”。当然，你也可以选背叛，得到“对双方背叛的惩罚”。

换言之，如果你认为对方合作，那么你背叛将能得到更多的好处。反过来，如果你认为对方将背叛，那么你也有两个选择，你选择合作，那么你就是“笨蛋”；你选择背叛，就会得到“对双方背叛的惩罚”。因此，对方背叛，你也背叛将会更好些。这就是说，无论对方如何行动，你背叛总是好的。到现在为止，你似乎知道该怎样做了吧！但是，或许对方也正是这样想的，要知道相同的逻辑对另一个人也同样适用。因此，另一个人也将背叛而不管你如何做。这样，你们将是双方背叛。这就是最经典的博弈案例——囚徒困境。

为了继续阐明这个问题，我们再援引一个流传在哈佛大学的小故事：在物理系有两位过从甚密的学生，他们的成绩一直非常优异，小考、实验和中考成绩都是A，但在期末考试的前一天晚上，由于同学聚会睡过了头，来不及准备参加第二天上午的化学期末考试了。他们只好向教授撒谎说，他们原本从位于郊外的别墅往学校赶，并且已经安排好了时间复习准备考试，但是在赶回途中车胎爆了。由于没有备用胎，他们只好整夜待在路边等待救援。他们现在实在是疲惫不堪，并请求教授允许他们隔天补考。教授想了想，点头同意了。第二天补考，教授安排两个人分别坐在两间教室作答。第一个题目在考卷第一页，占了10分，非常简单。两人都非常轻易地写出了正确答案，心情舒畅地翻到了第二页。在第二页上只有一个问题，占了90分，题目是：“请问爆的是哪只轮胎？”结果，自然两个学生只好乖乖地向教授认错。

怎么样？现在你对“囚徒困境”有所了解了吧！

机关算尽太聪明

第二次世界大战胜利在望之际，美国的一个飞行大队的指挥官为了给自己捞取政治资本而没完没了地提高部下的任务定额。他的部下有一个叫约翰逊的士兵，总是千方百计地逃避去执行，只会干既定的作战任务，因为他不想在胜利前夕永久地倒下去。他的行为没有逃脱指挥官犀利的目光。指挥官质问约翰逊：“我亲爱的孩子，假如所有的士兵都像你这样想的话，那又还有谁去执行作战任务呢？”约翰逊答道：“但假如我不这样想的话，那我岂不就是一个大傻瓜？”

在约翰逊的思维里面，实际上就揭示了一个形成囚徒困境的机制——担心自己成为傻瓜。通过研究这种机制，我们知道处于囚徒困境的时候，没有什么十全十美的好办法能让自己从困境中逃脱出来，同时又能够获得利益，只能尽量做到自己不受侵害，正所谓“两害相权取其轻”。比如，下面的“旅行者困境”案例就是由哈佛大学巴罗教授提出的著名的经典博弈案例：两个旅行者从中国的景德镇旅行归来，他们都买了当地出产的有名的细瓷花瓶。但在提取行李的时候，发现花瓶被摔坏了，于是他们向航空公司索赔。航空公司知道花瓶的价格大概在八九十美元的价位浮动，但是不知道两位旅客买的时候的确切价格是多少。于是，航空公司请两位旅客在100美元以内自己写下花瓶的价格。如果两人写的一样，航空公司将认为他们讲真话，就按照他们写的数额赔偿；如果两人写的不一样，航空公司就认定写得低的旅客讲的是真话，并且原则上按照这个低的价格赔偿。同时，航空公司对讲真话的旅客奖励2美元钱，对讲假话的旅客罚款2美元。

就为了获取最大赔偿而言，本来甲乙双方最好的策略，就是都写100美元，这样两人都能够获赔100美元。可是不，A很聪明，他想：如果我少写1美元，变成99美元，而B会写100美元，这样我将得到101美元。何乐而不为？所以他准备写99美元。可是B更加聪明，他算计到A 要算计他写99美元，于是他准备写98美元。想不到A还要更聪明一个层次，估计到B要写98美元来坑他，于是他准备写97美元……在花瓶索赔的例子中，如果两个人都能看透十几步甚至几十步上百步，那么其“精明比赛”的结果，是每个人都只写一两美元的地步。

巴罗教授所提出的这个案例旨在警示世人：一方面，它启示人们在为私利考虑的时候不要太“精明”，告诫人们精明不等于高明，太精明往往会坏事；另一方面，它对于理性行为假设的适用性提出了警告。

有了这个假设，我们就可以按照这个明确的比较取舍标准来推理，但是推断出来的结论是否符合实际，依赖于应用“理性行为”假设的程度。如果你的论证像“旅行者困境”那样，假设当事人彻底理性，能够算计到十几步甚至几十步，那么你推论出的结果，未必符合现实。

话说郑板桥在做县令期间，有一次外出途中遇到一老一少两人在路边争吵不休。一问之下才知道，原来老者拾获一个钱袋，并在原地等候遗失者前来认领。而这个年轻人说这个钱袋是他的，并反咬一口说钱袋原来装有50两银子，而不是现在的10两银子。郑板桥在弄清楚事情的原委之后，走向前去并表明身份，对老者发问：“你捡到这个钱袋，有没有离开原地？”老者回答说：“没有。”郑板桥又问：“那你可有人证吗？”立刻就有部分围观的群众愿意为老者作证。郑板桥于是胸有成竹地说：“现在本县宣判，老者捡到的钱袋里装有10两银子，这个钱袋就不是这位年轻人装有50两银子的钱袋。这位老者拾金不昧，精神可嘉，现在本县就将这个钱袋赏给你了。而至于这位年轻人，你的50两银子的钱袋还是赶紧再到其他地方去找一找吧。”年轻人聪明反被聪明误，只好自认倒霉，在人们的讥笑声中，灰头土脸地离开了人群。

可见，生活中人们在为私利考虑的时候不要太“精明”，因为精明不等于高明，太精明有时反而还会坏事。

让对方陷入困境

唐朝时候，李德裕任浙西观察使。当地甘露寺的和尚向官府控诉前任知事僧在移交常住物时，私吞了黄金若干两，并引以前几任知事僧的证言为证。他们一任接一任地往下移交，都有文书账簿。新卸任的知事僧已经承认了盗取黄金之罪，但是却没有交代出金子被用到什么地方去了。李德裕怀疑新卸任的知事僧说的不是实话，于是就对案件进行重新审理。那个知事僧才诉冤：“其实多年以来，寺内移交的都是空账本，黄金早就不存在了。众僧人孤立我，想赶我走，才借此陷害我。”李德裕说：“这事不难查清楚的。”他即刻找来历届知事僧前来对证。僧人们被要求坐在便轿里，轿门都朝着墙壁，互相之间不得见面。然后，差役们各给僧人一些黄泥让他们各自捏出交付给下一任知事僧的黄金形状，并声称要以此作为给案犯定罪的证据。结果，由于那些僧人并没有见过金子的形状，自然也都捏不出来。这样，他们诬陷的罪行便表露无疑了，众僧人也都一一认罪。

以上例子给我们一种启发，通过设计改变博弈参与者的格局，造成一种压力，那么他们很有可能改变原来同谋共犯的合作关系，转而从原来的合作型博弈走向非合作型博弈。当然，能够促成这种局面的设计可能有很多种，但是最常用也是最有效的一种就是有意地制造信息的不对称。

比如在囚徒困境中，两个囚犯都十分清醒地意识到自己所处的环境，以及每一种策略可能得到的结果，因此其策略选择都是可以预知的。而在现实生活中，这种完全信息的理想模式是无法实现的，因为存在大量的干扰因素。但也正是由于这些干扰因素的存在，我们就可以通过巧妙的布局设计，人为创造出一种囚徒困境的环境，迫使对方做出对自己有利的行动。

在《战国策》中就记载了这样一个故事，可以作为这种策略的最佳注解：春秋时楚国杰出的军事家伍子胥由于触怒了楚平王而被迫出走。在逃亡中，伍子胥在边境上被守关的斥候抓住了。斥候对他说：“你是逃犯，我必须抓你去面见楚王！”伍子胥说：“楚王确实正在抓我，但是你知道楚王为什么要抓我吗？是因为有人跟楚王说，我有一颗宝珠。楚王一心想得到我的宝珠，可我的宝珠已经丢失了。但楚王不相信，我只好逃跑。现在你抓住了我，还要把我交给楚王，那我将在楚王面前说是你夺去了我的宝珠，并吞到肚子里去了。楚王为了得到宝珠就一定会先把你杀掉，并且还会剖开你的肚子，把你的肠子一寸一寸地剪断来寻找宝珠。这样我活不成，而你会死得更惨。”斥候信以为真。他还怎么敢把伍子胥交给楚王呢？于是伍子胥终于顺利逃出了楚国。

在被斥候抓住以后，伍子胥是处于一种绝对的劣势地位。他要想改变这一局面，就必须采取一个策略。伍子胥宣布自己将会在楚王面前采取报复行动，这就使原本同时出招的博弈变成相继出招的博弈，而且还是伍子胥先行。试想，如果伍子胥若是不宣布进行报复，或者甚至宣布不会进行报复，他是不会得到任何好处的。

从这我们可以看出来，诬陷和释放分别是伍子胥和斥候的严格优势策略。斥候能够得到的最好结果是把伍子胥押送给楚王，而伍子胥不诬陷他吞了宝珠。这样伍子胥就会被杀掉，而斥侯可以得到楚王的奖赏。但是如果伍子胥诬陷他的话，那么他的结局就和伍子胥一样，失去生命。伍子胥已经告诉他，如果他选择押送，自己就会选择诬陷。因为对于伍子胥来说，在这种情况下无论是否诬陷，自己的结局是不变的。对于这一点，斥候也十分清楚。因此，伍子胥的威胁是可信的。

从博弈论角度来看，人都是理性的，所以斥候一定会选择与伍子胥合作的策略。由此可见，要想策略地行动，你必须保证自己不要采取在同时出招博弈里的均衡策略。伍子胥的这一策略行动改变了斥候的预期，进而改变了他的行为。

其实，生活中也大抵如此。人们面对可能出现的潜在的危机，总是会抱着“宁可信其有，不可信其无”的态度，这是一种预期的支付，以保证自己能够免于陷入困境。这种预期支付心理，恰恰给了处于显性困境者以机会，或用欺骗方式，或夸大其词，让对方作出预期支付，帮助自己摆脱困境。

正是由于这个原因，伍子胥三言两语巧妙地转换了自己的劣势处境，并且把个人的困境与对手的困境捆绑在了一起，迫使其作出了帮助自己解围的理性选择。

这对于我们每个人在处于劣势时转换思维方式，是很有启示的。创造一种困境，使对方陷入与你一样无法全身而退的困境，那么即便在这种困境出现之前，他本来拥有拿走你所有的一切的优势，此时他也只能被迫进行理性的决策，与你合作。

在假意顺从中获得反抗时机

春秋时期的吴国和越国，僻处东南一隅，往往被中原的几个大诸侯国视为化外之邦。到了吴王阖闾在位的时候，一方面，是因为经过几代吴王的积累，吴国的兵马和财富已经有所增加；另一方面，吴国在伍子胥的协助之下国力迅速增强，开始加入到争霸的行列之中。

越国逐渐意识到了吴国的举动，越王允常趁吴国还在为打败老牌强国楚国而沾沾自喜时，率先发难，偷袭了吴国，并取得了一定程度的胜利，由此拉开了两国角逐的序幕。

公元前496年，吴王阖闾派兵攻打越国，妄图占领越国的土地，掠夺财富，但被越国击败。吴王阖闾的脚趾受伤，终因感染不治身亡。从此两国结下深仇大怨。

阖闾死后，他的儿子夫差继位。为了替父报仇，他丝毫没有懈怠，经过两年的准备，吴王以伍子胥为大将，伯喜否为副将，倾国内全部的精兵，经太湖向越国杀来。越王勾践错误地高估了自己的实力，结果在双方的对垒中处于明显的劣势，几番交手都落败，大将军也战死沙场。范蠡出策，假装投降，“留得青山在不愁没柴烧”。勾践走投无路，为了保住自己的性命，不得已，在手下范蠡和文种的谋划下，通过收买吴王的宠臣伯喜否，才达成了和议。勾践答应以割地、赔款、进献美女等极为优厚的条件向吴王投降。在这些利益的诱惑之下，夫差拒听老臣伍子胥的劝告，同意越国投降，把勾践夫妻作为俘虏押回吴国。

越王勾践和他的妻子及随行的大夫范蠡来到吴国后，吴王夫差让勾践夫妇为自己养马。勾践夫妇住的是一座破烂的石屋，冬天如冰窟，夏天似蒸笼。勾践每天除了一身泥土以外，就是两手马粪。勾践夫妇和大夫范蠡在这里一直生活了三年。吴王夫差出门坐车时，勾践还得在前面为他拉马。每当从人群中走过的时候，就会有人唧唧喳喳地讥笑：

“看，那个牵马的就是越国国王！”面对这样的讥笑，面对一国之君变成阶下囚的窘境，勾践却忍了下来。为了日后的崛起，他假意顺从着。勾践的高明之处就在这里，面对一切屈辱，能从容自若。因为他非常明白，目前的情况只有顺从，才有可能抓住机会，以图日后东山再起；如果不顺从，恐怕连命都保不住。

勾践一方面假意顺从吴王夫差，一方面离间吴王君臣之间的关系。他抓住了吴国君臣贪财好色的弱点，让留在国内的大夫文种不断地向吴王进贡一些珍禽异兽、瑰宝美女，同时还不断向伯喜否贿赂。伯喜否收了越国的贿赂，不断地在吴王夫差面前为勾践说情，吴王夫差慢慢对勾践放松了警惕。

后来有一个绝好的机会，为勾践回国创造了条件。一次，夫差受了风寒，在宫中养病。勾践知道后，假意带着焦急的神情前来探望。当他进门时，夫差正在大便，为避免尴尬，夫差赶紧钻进被窝。勾践走到跟前，观察了一下粪便的颜色，再去闻粪便，最后竟蘸了粪便放在嘴里尝一下，然后对夫差说：“恭喜大王，大王的病已无大碍，马上就会好了。”夫差被他的异常之举搞糊涂了，忙问：“你怎么知道的？”

勾践回答说：“我看大王的粪便是黑色的，闻了以后有奇臭，尝了以后却带了一丝苦味，说明肚中的毒物已经经过粪便排出。毒物既出，大王的病也就没有大碍了。”

后来，吴王的病真的好了，勾践此时已彻底取得了吴王的信任，吴王见勾践真的顺从了自己，就赦免了他。

勾践回国后，苦心经营，把苦胆挂床头，睡在稻草铺成的床铺之上。他亲身耕作，他的夫人亲手织布，吃饭从未有荤菜，从不穿两层华丽的衣服，对贤人彬彬有礼，能委曲求全，招待宾客热情诚恳，能救济穷人，悼慰死者，与百姓共同劳作。

十年教训，十年生聚，越国恢复了元气。而吴王夫差则一心想争霸天下，连年用兵，不仅耗损了国力，还逐渐失去民心。能臣伍子胥因直言苦劝，被迫自刎而死。

公元前482年，吴王夫差到北部的黄池去会诸侯。吴国的精锐部队全部跟随吴王赴会了，独留老弱残兵和太子留守吴都。勾践趁机起兵攻吴，夫差被迫陷入两线作战的境地，只好求和。勾践深知，当时自己也没有足够的能力消灭夫差，就答应了议和。这以后四年，越国又攻打吴国。吴国军民疲惫不堪，精锐士兵都在与齐、晋之战中死亡，吴军彻底失败。越国军队把吴王围困在姑苏山上。最终，吴王夫差自刎身亡。

在和吴王夫差的数十年的博弈较量中，勾践忍别人所不能忍，在自己兵败被迫为奴后，假意顺从吴王，卑躬屈膝。尝粪问疾等“非常行为”最终赢得了夫差的信任，他得以返回越国，并励精图治，一举灭掉了吴。二十年！勾践能在如此长的时间内，忍人所不能忍之辱，受人所不能受之苦，从而成就了中国千年文明史中的经典故事。

公共资源的囚徒困境

有一个关于牧民与草地的故事，说的是当草地向牧民完全开放时，每一个牧民都想多养一头牛。因为多养一头牛增加的收入大于其供养成本，很明显这是有利可图的事情。

虽然对于单个牧民来说，他增加一头牛是有利的；但是如果所有的牧民都这样想的话，那么草地将被过度放牧，这将最终导致所有牧民的牛都会被饿死。

这个故事就是公共资源的悲剧，即哈定悲剧。这是由英国留学生哈定（Garrit Hadin），1968年在《科学》杂志上发表的文章《公共策略》（Tragedy of Commons ）中提出的。他在文中指出：“在共享公有物的社会中，每个人，也就是所有人都追求各自利益的最大化。这就是悲剧的所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都奔向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自己的最大利益。公有物自由给所有人带来了毁灭。”

事实上，公共资源和私人物品的性质确实很不一样。私人物品是私有私用，除了像他穿得整齐你看着也舒坦那种十分间接的效应以外，别人很难从中得到直接的利益。公共资源则不一样，不管是谁提供出来的，许多人都可以享用。比如路灯，经过此地的人都可以受益，哪怕他没有为此贡献过一分钱。

设想农村某地有一个只有A、B两户人家的小居民点，由于道路情况不好，与外界的交通比较困难。如果修一条路出去，每家都能得到“3”那么多好处，但是修路的成本相当于“4”。要是没有人协调，两家各自打是否修路的小算盘，那么两家博弈的形势如下：如果两家联合修路，每家分摊成本“2”，各得好处“2”，两家的纯“赢利”都是“1”；如果一家修另一家坐享其成，修路的一家付出“4”而得到“3”，“赢利”是“-1”，坐享其成的一家可以白赢利“3”；如果两家都不修路，结果两家的得益都是“0”。

在这个博弈中，修路是A的严格劣势策略，我们应该把它消去；修路也是B的严格劣势策略，所以也应该把它消去。这样运用严格劣势策略消去法，我们就得到这个博弈的严格优势策略均衡：即两家都不动手，大家受益都是0。

一般来说，如果在这个地方只有A、B两家人的话，他们多半会守望相助，关系比较好。这样的两家自然会商量好修路的问题，一起把路修好，大家都能得到收益。相反，如果这两个邻居相处得不是那么友善的话，那就很麻烦了。毋庸置疑，在修路的问题上，两家肯定会陷入喋喋不休的争吵之中。但是，博弈论讨论所牵涉的局中人，都是经济学上所讲的“理性人”，他们只为己，但是并不刻意害人。现在城市公寓里面的不少居民在邻居关系上，有时候就是这种“理性人”的关系——对于他们来说，即使左邻右舍也是形同陌路。如果没有公寓物业管理方面的制度，新公寓家家装修一流，可是楼道却杂乱无章，路灯坏了，往往长久没有人修理。这就是公共资源供给的囚徒困境：如果大家都只从自己得益的角度考虑问题，大家都只打自己的小算盘，结果就是谁也不作为，对局锁定在“三个和尚没水吃”的局面，排除了合作双赢的前景。

比如，税收，它取之于民，用之于民。任何一项交易活动都要赋税，这是税收的原则。然而，作为经济人的个人或企业为了自身的利益会发生偷税行为，或者不自觉地发生漏税行为，尽管这种行为不是普遍性的现象。因此，防止偷税、漏税是政府税收部门的一项重要工作。

税务部门运用了一个防止逃税的策略：设立发票刮奖活动。众所周知，企业向消费者提供发票是企业的义务，消费者索要发票是消费者的权利。但某些企业为了少缴税，借各种理由不给顾客发票。许多时候，消费者索要发票的意义不是很大，也不再要求企业提供发票。这样一来，企业便没有向税务部门交纳它应缴纳的税。

政府监督饭店、宾馆等企业逃税的难度较大。谁来监督更有效率？当然是顾客。有何办法能使顾客主动成为企业缴纳税收的监督者？发票刮奖制度的设立便是一个有效的方法。政府通过宣传，告知消费者，企业不给发票是违法行为。对于消费者来说，他索要发票是不费成本的，但存在“可能收益”或“期望收益”：如果他幸运，他可能刮到大奖。而对于政府来说，通过设立一些奖项将使全社会主动来监督企业，其收益远远大于成本。政府的这个策略是成功的。消费者在这个博弈中没有损失，只有所得；政府是最大的受益者，通过这样的机制，税收增加了；在这个博弈中，企业只是做了它应当做的事——缴税。

所以，公共资源问题一定要有人协调和管理，把看起来很琐碎但是弄不好则有损工作和生活环境的事情做好。

让囚徒走出困境

从博弈论的角度来看，对于个人来讲，在人生、事业一筹莫展的时候，如何才能寻找到一个快速突破困境的办法呢？

博弈论者认为，在这种情况下首先要寻找一个合理的策略，而这个合理的策略，势必要建立在一个牢固的基点之上，才能切实可行。如果在困境之中，有人与你因为同样的原因无法抽身，那么是否能够和这个人一起摆脱不利的处境，在合作的基础上走向双赢呢？

《红楼梦》里面描写四大家族的时候曾经用“一荣俱荣，一损皆损”来形容，就是因为这四个家族你中有我，我中有你，相互之间有利益的合作，也有亲缘关系，所以结成一个牢固的联盟。

那么，如果两个同时处在困境中的人，也有这种利益和亲缘的双重关系，他们合作起来就会更加容易，而且形成的合力就会更大。正所谓“二人同心，其利断金”。而要做到“同心”，只有利益上的合作是不够的，还需要一种近乎亲情的亲缘关系。显然，这是可遇而不可求的，因为亲缘关系不是能够随便形成的。

在“囚徒困境”中，我们已经了解这样一个道理：如果你总是想赢对方，结果可能得不偿失。因为对方也会全力反击，造成“两败俱伤”的局面。而且，敌对态势一旦形成，双方都难以全身而退。这个时候，即使双方都没有继续对抗下去的意愿，也只能咬牙坚持彼此背叛的行为。

即使是“一报还一报”这种有效破解“囚徒困境”的理想策略，也难免陷入“两败俱伤”的危险。“一报还一报”的核心就是对任何行为都要给予及时有效的回报，当遭遇他人侵犯时一定要以牙还牙。当然，这种策略的前提是“不主动侵犯他人”，这大大降低了它们相互伤害的机会。但是，这种前提是理论性的。当“一报还一报”的策略纠缠在一起时，终将陷入“循环报复”的局面，难以脱身。在陷入“囚徒困境”中应如何表现？下面我们给出3个简单的建议：

（1）不要嫉妒。在一局博弈中，人们考虑更多的就是关注于自己的输赢结局。一个很好的例子就是下棋比赛。为了能赢，一个参赛者必须在大部分时间里比对手做得更好。

然而，生活中的大多数情况并非如下棋一样，一个人赢，另一个就必须输。双方可以都做得很好，也可以都做得很差。双方的合作是可能的，但并不是总能实现。这就是为什么“囚徒困境”是各种各样的日常情形的有用模型。

人们倾向于采用相对的标准，这个标准经常把对方的成功与自己的成功对立起来。这种标准导致了嫉妒，嫉妒导致每个人都企图抵消对方已经得到的优势。在“囚徒困境”的形式下，抵消对方优势只能通过背叛来实现。但是背叛会导致更多的背叛和对双方的惩罚。因此嫉妒是自我毁灭。

因此在现实生活当中，我们没有必要一定要求自己非得比对方做得好，因为这本身就不是一个很好的标准，除非你的目的是消灭对方。否则在大多数情况下，这个目的是不可能实现的，特别当你要和许多不同的对手打交道时更是这样。只要你自己能做得好，就没有理由去嫉妒对方的成功。

譬如在生意场上，一个从供应商那儿买来商品的公司，妒忌供方的利润是完全没有意义的。任何通过不合作行为（如不按时付账）来减少这种利润的企图，都将激起供方的报复行动。报复行为可以采用多种惩罚形式，诸如拖延发货、较低的质量保证、不愿意打折扣，或者不交换市场条件变化的信息。这种报复使得嫉妒代价很大。因此对于买者来说，担心卖方的相对利润毫无意义，不如考虑是否有其他更好的购买策略。

（2）不要首先背叛。你必须要知道，只要对方合作你也合作，你的收益将是最大化的。当然，你可以尝试更保险的方式，即先背叛，直到对方合作，才开始合作。然而，这实际上是一个很有风险的策略，因为你的最初的背叛可能引起对方的报复，并使你处于要么被占便宜要么双方背叛的两难境地。如果你惩罚对方的报复，这种反应就会一直延续下去。如果你宽恕了对方，你的收益将会受到损失。

（3）不要耍小聪明。在“囚徒困境”的情况下，人们往往更容易耍小聪明，然而你应该知道往往复杂的策略并不比简单的规则做得更好。事实上，这些策略的共同问题是，使用一些复杂的方法来推断对方，而这些推断常常是错误的。一部分问题是对方经常用试探性的背叛来表明它不会被引诱而合作，但是问题的关键是这些策略没有考虑到自身的行为是否会引起对方的变化。对方对你的行为是有反应的，对方将把你的行为看做你是否回报合作的信号。因此，你自己的行为将会反射到你的身上。

另一个过分聪明的方式是使用“永久报复”的策略。这个策略是只要对方合作自己就合作，但是一旦对方背叛一次，自己就决不合作。由于这个策略的出发点是善良的，在与其他善良的策略相遇时，将会获得很好的结局，并且与那些完全随机的策略相遇时也不错。但在与那些偶尔背叛但准备一旦受惩罚就撤回的策略相比，它太快放弃了合作。“永久报复”看起来似乎很聪明，因为它为避免背叛提供了最大的激励，但是它为了自己的利益显得太严厉了。

当然，在许多事务中，一个使用复杂策略的人可以向对方解释每一个选择的理由。然而，当对方可能怀疑其所提供的这些理由时，对方将认为不值得有任何反应。对方会把一个显得不可预测的策略看做是不可改造的，结果自然是导致背叛。

第3章 囚徒困境：如何突破两败俱伤的窘境

第3章囚徒困境：如何突破两败俱伤的窘境