- 博弈论与无线传感器网络安全
- 沈士根
- 2183字
- 2021-03-19 17:19:14
2.1 博弈论基本概念
博弈论(Game Theory)是现代数学的一个新分支,也是运筹学的重要构成内容之一。博弈论主要研究具有相互依赖行为的参与者的策略选择。现在通常所说的博弈论一般是指非合作博弈理论,认为参与者是理性的,即参与者之间都会在一定的约束条件下最大化自身的利益,同时参与者之间在交互时利益有冲突,行为相互有影响,而且不同参与者掌握的信息常常是不对称的。在这种情况下,博弈论研究参与者的行为、交互时的策略和策略的均衡问题[19,20]。当然,现代博弈论还包括合作博弈。合作博弈强调的是团体理性、集体的效率、公正和公平[19]。
博弈论作为研究多人谋略和策略问题的理论。首先,一个博弈问题必须至少有两个参与博弈的参与者,在博弈过程中他们都有各自的切身利益。由于各自利益的驱动,他们在做出自己各自的决策时,总想使用最优策略;其次,博弈中的各个参与者之间总不可避免地存在着竞争。竞争贯穿了整个博弈的全过程,同时这种竞争又将博弈的参与者紧紧地联系在一起,相互较量,相互依存;再次,既然参与者之间要进行较量,那么每一个博弈参与者都会尽量掌握对手的特点及其已经采取或可能采取行动的相关知识和信息;最后,就是博弈参与者最为关心的博弈结果[15,16,21]。博弈结果随不同参与者采取策略的不同而不同,通常用支付(Payoff)来描述博弈结果。因此,博弈论就是从理论上对博弈参与者之间的行为和交互过程进行研究和分析,为博弈参与者预测出一个理想的结局。这种预测结局的正确性主要体现在博弈参与者都能自愿选择博弈理论为其推导出的策略,并且没有博弈参与者愿意独自偏离其依照博弈理论已选定的策略。所以,每个博弈参与者所选策略是针对其他参与者所选策略的最优反应。
下面介绍博弈论中的一些基本概念。
1)参与者
参与者(Player)是指一个博弈中独立决策、独立承担后果的决策主体,通常又称为局中人或参与人。参与者参加博弈的目的是通过各自合理地选择相应的行动,以便最大化自己的支付(或效用)水平。参与者可以是个人,也可以是具有智能管理能力的设备(如无线传感器网络中的传感器节点)、团队、企业、国家,甚至是国家组成的集团。为了研究和分析博弈问题的需要,通常还会引入一个虚拟参与者——“自然”(Nature)。这里的“自然”指的是独立于博弈参与者的外生事件。“自然”选择的是外生事件的各种可能现象,并且用概率分布来描述“自然”的选择机理[17]。
2)信息
信息(Information)是指参与者在博弈过程中能了解到和观察到的知识,这些知识包括“自然”的选择、其他参与者的特征和行动等[17]。信息是整个博弈过程中非常重要的一个变量,一旦信息结构变化了,博弈双方的所有结果都有可能发生变化。
3)共同知识
共同知识(Common Knowledge)是指“所有参与者知道,所有参与者知道所有参与者知道,所有参与者知道所有参与者知道所有参与者知道……”的知识[17]。
4)完全信息
完全信息(Complete Information)是指所有参与者各自选择的策略的不同组合所决定的各参与者的收益对所有参与者来说是共同知识[17]。简单、通俗地说,完全信息是指每一个参与者完全了解自己以及其他参与者的策略,完全了解各参与者选择的策略组合产生的效用。
5)完美信息
完美信息(Perfect Information)是指所有参与者在选择各自策略时,其他参与者的博弈进程对所有参与者而言是共同知识,也就是说,拥有完美信息就是完全了解其他参与者的行动;相反,不完美信息意味着参与者在博弈进程信息的掌握程度上具有不对称性。
6)静态
如果在博弈过程中各参与者同时选择各自的策略,则称这类博弈是静态(Static)的。这里所说的“同时”具有双层含义:一种含义就是“同时”的字面解释,也就是不同的参与者在同一时间一起行动;另一种含义是不同的参与者行动虽然有先后,但后行动者并不知道先行动者采取了什么样的具体行动[17]。
7)动态
动态(Dynamic)是指不同参与者的行动有先后顺序,并且后行动者能够观察到先行动者所选择的行动[17]。
8)策略
策略(Strategy)是指参与者可选择的全部行为的集合,即规定每个参与者在进行决策时可以选择的做法。在一个静态博弈(Static Game)中,一个策略是参与者的一个给定的可能行动;在动态博弈(Dynamic Game)中,一个策略是参与者在每个决策点选择的一个完整计划,它告诉参与者在什么时候应选择什么行动[17]。
9)支付
支付(Payoff)是指参与者在一个特定的策略组合中得到或失去的效用,它通常是参与者策略的函数,其值可以是正数也可以是负数。如果结果是随机的,那么支付通常用概率来加权平均,即期望支付(Expected Payoff)[17]。
10)均衡
均衡(Equilibrium)是指所有参与者的最优策略的组合。需要注意的是,不同的博弈类型通常具有不同的均衡形态。达到博弈均衡意味着相关量处于稳定状态,这种稳定状态在博弈过程中是可以预测的。
11)理性
如果一个参与者寻求以一种最大化自己支付的方式进行博弈,那么,这个参与者就是理性(Rationality)的[17]。以参与者个体利益最大化为目标的被称为“个体理性”,而追求集体利益最大化的被称为“集体理性”;有完美的分析判断能力和不会犯选择行为错误的称为“完全理性”,反之称为“有限理性”[19]。
12)纯策略
纯策略(Pure-strategy)是指每个参与者在博弈过程中可以选择采用的行动方案,每个参与者均有可供其选择的多种策略[17]。
13)混合策略
混合策略(Mixed-strategy)是指参与者在纯策略空间上的一种概率分布,表示参与者实际博弈时根据这种概率分布在纯策略空间中随机选择行动方案并加以实施[17]。
14)零和
如果对任何策略组合,所有参与者的支付和为零,则称该博弈是零和(Zero)的[17]。