第五章 博弈论及其应用

第一节 博弈论

一、名词解释

1纳什均衡(上海大学2010研;中山大学2012研;中国海洋大学2012研;厦门大学2006、2013研;厦门大学2013研;北京师范大学2014研;中央财经大学2012、2014、2015研;湘潭大学2014、2015研)

答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。

2混合策略(Mixed Strategy)(厦门大学2010研;西安交通大学2014研;湘潭大学2016研)

答:混合策略(mixed strategy)指参与人使他们的策略选择随机化——即对每项选择都指定一个概率,并按照这些概率选择策略。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。混合策略是相对于纯策略而言的。并不是所有的博弈都存在纯策略纳什均衡,但是混合策略均衡总是存在的。

3合作博弈(厦门大学2012研;中山大学2013研)

答:合作博弈是指各博弈方可以谈定能使它们设计联合策略的有约束力的合同的博弈。厂商之间进行的经济博弈既可以是合作的也可以是非合作的。如果不可能谈判并执行有约束力的合同,博弈就是非合作的;如果能设计出合同,则是合作的。

合作博弈的一个例子是买方和卖方之间就一块地毯的价格讨价还价。如果地毯生产成本为100美元,而买方对其评价是200美元,因为双方同意以101~199美元之间任一价格成交都将最大化买方的消费者剩余与卖方的利润之和,并使双方都得到好处,因此该博弈可能有合作的解。

合作和非合作博弈之间的基本差别在于签订合同的可能性,在合作博弈中有约束力的合同是可能存在的,而在非合作博弈中它们是不可能的。

二、单项选择题

1考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为(  )。(电子科技大学2010、2012研)

A.(U,L)

B.(D,R)

C.(U,R)

D.(D,L)

【答案】B

【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为5>3;当B选择D时,A会选择R,因为2>0。当A选择L时,B会选择U,因为4>3;当A选择R时,B会选择D,因为1>0。因此,依据纳什均衡定义,可知(D,R)是纳什均衡。

2下列说法错误的是(  )。(中山大学2009研)

A.占优策略均衡一定是纳什均衡

B.纳什均衡不一定是占优策略均衡

C.占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应

D.纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应

【答案】C

【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。

3甲乙两人各在纸片上写上“上”或“下”,然后双方同时翻开纸片,如果两人的字相同,那么甲赢2块钱,乙输两块钱;如果写的字不同,那么乙赢1块钱,甲输1块钱。下列关于该博弈纳什均衡的描述哪一项是正确的?(  )(上海财经大学2009研)

A.甲以1/2概率选择“上”;乙以1/2概率选择“上”

B.甲以1/3概率选择“上”;乙以1/3概率选择“上”

C.甲以1/3概率选择“上”;乙以1/2概率选择“上”

D.甲以1/2概率选择“上”;乙以1/3概率选择“上”

【答案】A

【解析】根据题目条件可以得出甲乙两人的收益矩阵,如表5-1所示。

表5-1 甲乙两人的收益矩阵

可以看出,当甲选择写“上”时,乙必然会选择写“下”。同理,当甲选择写“下”时,乙必然会选择写“上”。因此,两个人选择写“上”的概率都为1/2时才能达到均衡。

4考虑下面的策略式博弈:

这里a,b和c是不确定的数字。为保证(M,L)是占优策略,a,b和c应在什么区间?(  )。(上海财经大学2008研)

A.a>2,b<3,c任意

B.a>2,b>3,c任意

C.a>2,b>3,c<2

D.都不对

【答案】C

【解析】占优策略是指不论其他参与人如何选择,每个参与人都有一个最优策略。要保证(M,L)成为占优策略,则对于行参与人,无论列参与人选择L还是R,行的最优选择都是M。当列参与人选择L时,行最优选择是M,则有a>2;当列选择R时,行最优选择是M,则有c<2;同理,当行选择T、M、B时,列的占优选择都是L,则有b>3。

5考虑一个囚徒困境的重复博弈。下列哪种情况将增加出现合作结果的可能性?(  )(上海财经大学2007研)

A.参与人对未来收益的评价远低于对现期收益的评价

B.参与人之间的博弈是频繁发生的

C.欺骗不容易被发现

D.从一次性欺骗中得到的收益比欺骗的成本更大

【答案】B

【解析】如果博弈重复无限次,就会有办法影响对手的行为:如果这次拒绝合作,那么下一次对手也可以拒绝合作。只要双方都充分关心将来的收益,那么,将来不合作的威胁就足以使他们采取帕累托有效率的策略。如果参与人之间的博弈是频繁发生的,他们希望合作会引致将来的进一步合作,所以会增加合作结果的可能性。

6比较上策均衡和纳什均衡,以下论断正确的是(  )。(中山大学2005研)

A.纳什均衡是比上策均衡要求更为严格的均衡解

B.上策均衡是比纳什均衡要求更为严格的均衡解

C.上策均衡等价于纳什均衡

D.无法判断两者中哪一个更为严格

【答案】B

【解析】上策均衡就是严格占优均衡,是指博弈中一个参与人的最优策略不依赖于其他人的策略选择,不论其他人选择什么策略,他的最优策略是唯一的。上策均衡是比纳什均衡更强的一个博弈均衡概念。纳什均衡只要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。

7假定甲乙两个企业同时选择“合作”或“抗争”的经营策略。若两个企业都选择“合作”的策略,则每个企业的收益均为100;若两个企业都选择“抗争”的策略,则两个企业的收益都为零;若一个企业选择“抗争”的策略,另一个企业选择“合作”的策略,则选择“合作”策略的企业的收益为S,选择“抗争”策略的企业的收益为T。要使“抗争”成为占优策略,S和T必须满足条件(  )。(上海财经大学2005研)

A.S+T>200

B.S<T与T>100

C.S<0与T>100

D.以上都不是

【答案】C

【解析】根据已知条件可以写出甲乙两个企业的收益矩阵,如表5-2所示。

表5-2 甲乙两个企业的收益矩阵

当甲选择合作时,由于乙的占优策略是抗争,所以T>100;当甲选择抗争时,乙的占优策略也是抗争,所以S<0。因此,要使“抗争”成为占优策略,S和T必须满足条件:S<0与T>100。

三、计算题

1请根据下面给出的五个博弈回答问题:

(1)假设企业1和企业2进行同步博弈,请找出5个博弈中具有多重均衡的博弈,并给出均衡的描述。

(2)如果两个企业进行的是序贯博弈,请找出5个博弈中企业1具有先动优势的博弈,并给出均衡的描述。(中山大学2013研)

解:(1)博弈和博弈具有多重均衡博弈。其中博弈和博弈的均衡都为(策略B,策略Y)、(策略A,策略Z)。

在博弈中,先考虑企业1的策略选择,若企业2选择策略Y,则企业1的最优策略为B,此时支付矩阵为(6,6),若企业2选择策略Z,则企业1的最优策略为策略A,此时支付为(6,6);同理,再考虑企业2的策略选择,若企业1选择策略A,则企业2的最优策略为Z,若企业1选择策略B时,企业2的最优策略为Y。因此,纳什均衡为(策略B,策略Y)、(策略A,策略Z),对应的支付矩阵分别为(6,6)、(6,6)。

在博弈中,先考虑企业1的策略选择,若企业2选择策略Y,则企业1的最优策略为B,此时支付矩阵为(2,8),若企业2选择策略Z,则企业1的最优策略为策略A,此时支付为(4,6);同理,再考虑企业2的策略选择,若企业1选择策略A,则企业2的最优策略为Z,若企业1选择策略B时,企业2的最优策略为Y。因此,纳什均衡为(策略B,策略Y)、(策略A,策略Z),对应的支付矩阵分别为(2,8)、(4,6)。

(2)序贯博弈是指一个参与人首先采取行动,另一个参与人再作出反应。分析这种博弈,必须从博弈的终结开始由后往前推算。企业1具有先动优势的博弈为博弈

图5-1 序贯博弈

如图5-1所示,先考虑企业2的选择,若企业1选择策略A,则企业2的最优策略为Z,此时纳什均衡的支付矩阵为(4,6),若企业1选择策略B,则企业2的最优策略为Y,此时纳什均衡的支付矩阵为(2,8)。如果企业1先选择策略A,则企业1得到的支付为4,大于后行动的2,企业2的威胁是不可置信的,如果它威胁企业1如果企业1选择A策略,它将选择Y策略,那么它自己的得益为5,小于选择Z策略时的得益。此时企业1具有先动优势,最终的均衡为(策略A,策略Y),对应的支付矩阵为(4,6)。

2表5-3为两竞争对手的博弈结果矩阵:

表5-3 两竞争对手的博弈结果矩阵

请问:什么是纳什均衡?求出该博弈的所有可能的纳什均衡,利用图形说明求出的纳什均衡的意义。(中央财经大学2010研)

解:纳什均衡又称为非合作博弈均衡,指如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定参与人B的选择,参与人A的选择是最优的,并且给定参与人A的选择,参与人B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择。

从表5-3该博弈结果矩阵可知存在两个可能的纳什均衡:两竞争对手均奋争,两竞争对手均妥协。

不论A、B均奋争还是均妥协,总的博弈支付为3,比一方奋争另一方妥协的支付大,如表5-4所示。

从表5-4可以看出,两竞争对手均奋争和两竞争对手均妥协都是纳什均衡解,并且带来的总支付一样。

表5-4 博弈状态及其支付

3甲、乙两个学生决定是否打扫宿舍。无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。

(1)请用一个博弈简单描述上述情景。

(2)找出该博弈的所有纳什均衡。(中山大学2010研)

解:(1)共有以下四种情况:

当甲乙都参与时,每个人的收益均为5×2-8=2。

当甲参与乙不参与时,甲收益为5×1-8=-3;

乙收益为5×1-0=5。

当甲不参与乙参与时,甲收益为5×1-0=5;

乙收益为5×1-8=-3。

当甲乙都不参与时,每个人的收益均为0。

具体博弈矩阵如表5-5所示:

表5-5 博弈的收益矩阵

(2)从表5-5中可以看出,该博弈的纳什均衡是甲不参与乙也不参与,这一均衡解也是占优策略均衡。从参与人甲的角度看,不论参与人乙参与不参与打扫宿舍,不参与打扫宿舍都是参与人甲的较好的选择。同样的情形,从参与人乙的角度看,不参与打扫宿舍也是参与人乙的较好的选择。所以,这是一个占优策略均衡,即双方都没有动力去改变这一局面,最后谁都不去打扫宿舍。

可以看出,如果甲乙两人都参与打扫宿舍,则他们的境况就要比在其他选择下更好一些。(参与,参与)是帕累托有效率的策略组合,而(不参与,不参与)则是帕累托低效率的策略组合。双方从自己的理性出发的最优策略,从社会看来是最糟糕的策略。

4已知参与者A的策略集合为(T,M,B),参与者B的策略集合为(L,C,R),双方博弈的支付矩阵如表5-6所示。

表5-6 博弈的支付矩阵

根据以上条件,回答以下问题:

(1)何谓占优策略?博弈双方是否都具有占优策略?

(2)何谓Nash均衡?该博弈的纳什均衡是什么?

(3)纳什均衡与占优策略的联系如何?(上海交通大学2006研)

解:(1)占优策略是指博弈中一个参与人的最优策略不依赖于其他人的策略选择,不论其他人选择什么策略,他的最优策略是唯一的。

根据占优策略的定义,在如表5-6所示的博弈中,对于参与者A而言,当参与者B选择策略L时,他的最优策略是B,当参与者B选择策略C或R时,他的最优策略是M,所以A不存在占优策略;对于参与者B而言,存在着策略C占优于策略L和R,因此策略C是他的占优策略。

(2)纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定B的选择,A的选择是最优的,并且给定A的选择,B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择。

该博弈的纳什均衡是(M,C)。因为如果参与者A选择M,则参与者B会选择C;如果参与者B选择C,则参与者A会选择M。所以,(M,C)是一个纳什均衡。

(3)纳什均衡与占优策略的联系

占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者的任何策略选择来说,其最优策略都是唯一的。而纳什均衡只要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。

5某外资企业计划在北京和上海建立生产基地,如果两个地区的地方政府都不推出税收返还政策,那么,外资企业将选择在北京建立一个大的生产基地,在上海建立一个小型生产基地,这将分别为两个地区带来30和10的税收收入。如果其中一个政府推出返还10的税收政策,而另一个政府没有推出相应的政策,那么企业将把大型生产基地设立在具有税收优惠的地区。如果两个地方政府同时推出返还10的税收政策,那么企业的选择将与完全没有税收优惠时相同。

(1)建立一个博弈描述上述地方政府的招商引资行为。

(2)求出上述博弈的Nash均衡。(中山大学2012研)

解:(1)这个博弈可以用表5-7来表示。

表5-7 地方政府招商引资博弈收益矩阵

(2)纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。

由(1)中的收益矩阵可知:当北京选择“返还10税收”时,上海选择“不返还税收”;当北京选择“不返还税收”时,上海选择“返还10税收”;当上海选择“不返还税收”时,北京也选择了“不返还税收”;当上海选择“返还10税收”时,北京也选择了“返还10税收”,从这个分析,可以得出,因为在给出对方的选择时,己方的选择不是一致的,因此该博弈不存在纯策略纳什均衡。

下面求混合策略纳什均衡。假设北京选择返还税收和不返还税收的概率分别是p和1-p,上海选择返还税收和不返还税收的概率分别是q和1-q。

北京的期望支付为:EB=20pq+20p(1-q)+10(1-p)q+30(1-p)(1-q)=10p(2q-1)-20q+30

上海的期望支付为:ES=10p(1-q)+20(1-p)q+10(1-p)(1-q)=10q(1-2p)+10

因此,北京的混合策略为:

上海的混合策略为:

如图5-2所示,混合策略纳什均衡是北京和上海都分别以0.5的概率选择返还税收。

图5-2 混合策略均衡

第二节 博弈论的应用

一、单项选择题

1下列博弈中的混合策略均衡是(  )。(上海财经大学2007研)

A.1采取A的概率是3/7,采取B的概率是4/7;2采取U的概率是3/7,采取D的概率是4/7

B.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是4/7,采取D的概率是3/7

C.1采取A的概率是4/7,采取B的概率是3/7;2采取U的概率是3/7,采取D的概率是4/7

D.1采取A的概率是1/2,采取B的概率是1/2;2采取U的概率是1/2,采取D的概率是1/2

【答案】C

【解析】设1选A的概率为p,则选B的概率为1-p;2选U的概率是q,则选D的概率为1-q。根据1选A、B无差异,2选U、D无差异,可列出以下方程式:

解得:p=4/7,q=3/7。

2考虑两个竞争厂商的博弈,初始,企业X在区域1,企业Y在区域2。两个企业考虑是否进入对方的市场。不同情形下,他们的净利润由下面的表格描述:

如果企业Y进入区域1是一个占优战略,那么有(  )。(上海财经大学2012研)

A.10>D和20>E

B.F>B和10>D

C.C>A和20>E

D.A>C和B>F

【答案】C

【解析】由于“进入区域1”是企业Y的一个占优策略,则不论企业X选择何种策略,企业Y都会选择“进入区域1”,从而必有:C>A,20>E。

3在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个博弈有两个纯策略纳什均衡和(  )。(上海财经大学2008、2013研)

A.一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以20%的概率选择“冲过去”

B.两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去

C.一个混合策略纳什均衡,即一人以80%的概率选择“避让”,另一人以20%的概率选择“冲过去”

D.一个混合策略纳什均衡,即两人都以40%的概率选择“避让”,以60%的概率选择“冲过去”

【答案】A

【解析】根据题中条件可写出两人的收益矩阵,如表5-8所示。

表5-8 两人的收益矩阵

从收益矩阵可看出,这个博弈有两个纯策略纳什均衡(9,0),(0,9)。设甲选择“冲过去”的概率为r,乙选择“冲过去”的概率为c。甲的期望收益为-36cr+9(1-c)r=(9-45c)r,可见当c=0.2时,甲对于任何的0≤r≤1无差异。同理可得当r=0.2时,乙对于任何的0≤c≤1无差异。所以,存在一个混合策略纳什均衡(0.2,0.2)。

4假设有两家企业各要招聘一个工人,工资报酬都为1,假设有两个工人同时去应聘,但他们只能选择应聘一家企业。如果一家企业只有一个工人应聘,那么他得到这份工作;如果有两个工人同时应聘,那么各有一半的可能得到这份工作。工人的偏好是风险中性的。下面哪一个判断是正确的?(  )(上海财经大学2010研)

A.只有两个纳什均衡,即两个工人应聘不同的企业

B.只有一个混合纳什均衡,即两个工人各以1/2的概率随即选择其中一个企业

C.有两个纯策略均衡和一个混合策略均衡,混合策略均衡时的期望支付大于纯策略时的支付

D.有两个纯策略均衡和一个混合策略均衡,混合策略均衡时的期望支付小于纯策略时的支付

【答案】D

【解析】假定甲乙两人应聘A、B的收益矩阵如下所示:

由划线法可知,存在两个纯策略纳什均衡(A,B)、(B,A)。设甲应聘企业A的概率为p,乙应聘企业A的概率为q。对于甲来说,应聘企业A的期望收益等于应聘企业B的期望收益,即(1/2)pq+p(1-q)=1-p+(1/2)(1-p)(1-q);对于乙来说,应聘企业A的期望收益等于应聘企业B的期望收益,即(1/2)pq+1×q(1-p)=1-q+(1/2)(1-q)(1-p)。联立解得p=0.5,q=0.5。所以,存在一个混合策略纳什均衡(0.5,0.5)。混合策略均衡的期望支付显然小于纯策略时的支付。

二、计算题

1找出下列标准式博弈(normal-form game)的混合策略纳什均衡,并绘出两个参加者各自的反应曲线。(中山大学2008研)

解:(1)各自的期望收益

令r表示Mr.I选择“T”的概率,那么,(1-r)就表示他选择“B”的概率。同样,令c表示Miss J选择“R”的概率,那么(1-c)就表示他选择“L”的概率。当r和c等于0或者1时,相应的策略就是纯策略,除此之外就是混合策略均衡。

计算当Mr.I按概率r选择“T”,而Miss J按概率c选择“R”时,Mr.I的期望收益排列如下:

所以,Mr.I的期望收益为:2rc+(1-r)c+0+3(1-r)(1-c)=4cr-2c-3r+3;假定r增加了∆r,Mr.I的收益变化=4c∆r-3∆r=(4c-3)∆r。

当4c>3时,上式取正值;当4c<3时,上式取负值。因此,当c>0.75时,Mr.I会提高r值;而当c<0.75时,Mr.I会降低r;当c=0.75时,他对于任意的0≤r≤1无差异。

同理Miss J的期望收益为2c+2r-3cr,假定c增加了∆c,Mr.I的收益变化=2∆c-3r∆c=(2-3r)∆c。

当2>3r时,上式取正值;当2<3r时,上式取负值。因此,当r<2/3时,Miss J会提高c值;而当r>2/3时,Miss J会降低c值;当r=2/3时,她对于任意的0≤c≤1无差异。

(2)绘制反应曲线

先从Mr.I开始。如果Miss J选择c=0,那么,Mr.I就会使r值尽可能的小,所以,r=0就是c=0时Mr.I的最优反应。并且,r=0一直都是Mr.I的最优反应,直到c=0.75时为止。当c=0.75时,位于0和1之间的任意r值都是最优反应。对于所有的c>0.75,Mr.I的最优反应是r=1。

同理,对于Miss J来说,如果Mr.I选择r=0,那么,Mr.I就会使r值尽可能的大,所以,c=1就是r=0时Miss J的最优反应。并且,c=1一直都是Miss J的最优反应,直到r=2/3时为止。当r=2/3时,位于0和1之间的任意c值都是最优反应。对于所有的r>2/3,Miss J的最优反应是c=0。

图5-3显示的是他们各自的反应曲线。不难发现,它们相交于点(2/3,3/4),该点即为混合策略纳什均衡。

图5-3 最优反应曲线

2王刚和李梅作为一个小组完成作业。该作业通过与否是按照小组来评判的。通过对二人的效用都是3,没通过的效用是0。二人可以选不努力(N),低努力(L),和高努力(H)。对于李梅,三种努力的成本分别是0,1,2;对于王刚三种努力的成本分别是0,2,4。只有当至少一个人选择H或者两人都选择L时,小组才能顺利通过。

(1)写出所有博弈策略矩阵,并找出所有纳什均衡。

(2)如果李梅可以观察王刚的策略后再选择自己的,写出子博弈精炼纳什均衡。

(3)如果王刚可以先观察李梅的策略,再选择自己的策略,求子博弈精炼纳什均衡。

(4)王刚会更偏好哪一个策略?(北京大学光华管理学院2013研)

解:(1)本题中,只有当至少一个人选择H或者两人都选择L时,小组才能顺利通过,即只有(L,L),(H,L),(L,H)和(H,H),(H,N),(N,H)六种情况下,李梅和王刚两人才能获得效用(本题策略组合左侧代表李梅,右侧代表王刚)。根据题意,李梅和王刚的博弈策略矩阵如下:

所谓纳什均衡指的是在该策略组合上,任何参与人单独改变策略都不会得到好处。或者换个说法:如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。所以此时的纳什均衡策略是(H,N)和(L,L)。

(2)如果李梅可以观察王刚的策略后再选择自己的策略,则由王刚先做出决策,李梅再做出决策,可得到决策树如下:

运用逆向法,在王刚选择N时,李梅选择H。在王刚选择L时,李梅选择L。在王刚选择H时,李梅选择N。再由王刚来做选择,王刚会选择N,所以子博弈精炼纳什均衡为(H,N)。

(3)如果王刚可以观察李梅的策略后再选择自己的策略,则由李梅先做出决策,王刚再做出决策,同上题方法,可得到子博弈精炼纳什均衡为(L,L)。

(4)王刚会选择对于自己来说能得到最大效用,同时付出成本最小的策略,即(H,N)策略。此时他的效用为3,成本为0。

3找出如下博弈中A、B两人的Nash-Equilibrium(含混合策略的均衡)(北京大学国家发展研究院2006研)

解:使用严格剔除劣策略法来求解。

对于B来讲,乙严格占优于甲,因此B肯定不会选择甲,于是剔除甲策略。在剩余的矩阵中,对于A来讲,β严格占优于α,所以A不会选择α,于是再剔除α策略。

重复严格剔除劣策略后,矩阵变为:

(1)分析如下:

A选β时,B最优的选择是丙,因为8>6;

A选γ时,B最优的选择是乙,因为9>8;

B选乙时,A最优的选择是γ,因为10>7;

B选丙时,A最优的选择是β,因为9>7。

可得出(γ,乙),(β,丙)是纯策略均衡。

(2)另外该博弈还有一个混合策略均衡,求解如下:

设A以p的概率选择策略β,B以q的概率选择策略乙,则根据同等支付原则有:7q+9(1-q)=10q+8(1-q);6p+9(1-p)=8p+8(1-p)。

解得:p=1/3,q=1/4。

因此,(1/3,1/4)是一个混合策略均衡,表示A以1/3的概率选择β,2/3的概率选择γ;B以1/4的概率选择乙,3/4的概率选择丙时,这个混合策略组合就构成了一个纳什均衡。