2.2.2 均衡分析
均衡,代表处于一个稳定的状态,即“稳态”的意思。在非合作博弈中,纳什均衡是一个非常重要的概念,它已成为非合作博弈的中心概念和赖以建立的基础[78],并且反映一个稳定的博弈结果。纳什均衡的定义如下。
定义 2.2(纳什均衡):给定一个 N 人非合作博弈G={N,{An}n∈N,{μn}n∈N},策略集合是一个纳什均衡,当且仅当∀n∈N 时,∀an∈nA,满足条件:
其中, an表示用户 n 的策略,表示除参与者 n 之外的参与者的策略集合, N 表示博弈中的N个参与者,{An}表示策略空间,μn表示参与者n的效用函数。
如果参与者从它的可选行动集中固定地选择一个行动,那么称为纯策略。除了纯策略,参与者也可按照一定的概率分布在行动集中进行选择策略,此时称为混合策略。纯策略纳什均衡可认为是混合策略纳什均衡的特殊形式。参与者n的混合策略可记为σn,其中σn(an)表示参与者n选择行动an的概率。可知,参与者n的混合策略空间为,0≤σn(an)≤1}。所有参与者的混合策略集合可记为σ=(σ1,…,σN),类似地,σ-n代表除n之外所有用户的混合策略集合。在使用混合策略时,用户n的效用函数为un(σn,σ-n)=。
需要指出的是,对于一个非合作博弈而言,并不一定存在纯策略纳什均衡。另外,即使存在纯策略纳什均衡,也有可能不唯一,可能存在多个纯策略纳什均衡解,面临均衡解不唯一的问题。若存在多个纯策略纳什均衡解,经过博弈之后系统进入某个均衡状态后保持稳态。在非合作博弈中,每个参与者的目标是最大化各自的效用函数。为了研究参与者之间的相互影响和“利己主义”的结果,需要对博弈的稳态解进行分析。纳什均衡具有策略稳定性,从纳什均衡的定义可以看出,当一个博弈处于纳什均衡时,没有任何一个参与者能够通过单方面的改变策略得到效用提升。然而,博弈追求“稳态”,而决策优化问题追求“最优”,“稳态”和“最优”之间不是等价关系。系统处于纳什均衡状态,并不意味着系统性能高效,有时可能会出现由于参与者的自私行为导致稳定时系统性能较低,这就涉及博弈模型的设计问题,在2.4节中将讨论博弈模型的设计。博弈模型的设计作为一个关键问题,可通过博弈机制设计,使得博弈稳态解接近或成为系统最优解。此外,除了纳什均衡,还衍生出了其他均衡解的概念,如Staclekberg均衡(Staclekberg Equilibrium)、相关均衡(Correlated Equilibrium)、演化稳定策略(Evolutionary Stable Strategy)等。对于合作博弈来说,较为常用的博弈均衡解有讨价还价解、核(Core)等。