交通大学博弈论课程概要 (III)
第四部分
:不完全信息扩展式博弈
1. 一般扩展式博弈的定义(F-T 3.3.1)
一个一般扩展式博弈由(有向)博弈树表示。博弈树由点和联结点的枝组
成。前点和后点。起点无前点,终点无后点。除起点外,每点有唯一
的直接前访点。
除终点外的点代表决策点,每点 x 只属于一个博弈者 i(x),从这点出发
的枝代表 i(x)在 x 处的行动集 A(x) 。
博弈者 i(x)在 x 处拥有的信息由信息集 h(x)表示。h(x)包括了所有 i(x)不
能同 x 区分开来的点。对所有的 h(x)中的点 x’,A(x’) = A(x) 。因此我们
可以将行动集记为 A(h) 。
“
”
对一个不完全信息的扩展式博弈来说,起点代表 自然 ,从自然出发
的枝代表外生随机事件,概率分布是给定的,不受博弈者选择的影响。
每一终点处给出所有博弈者的收益。(当博弈进行无穷阶段时,所有博
弈者的收益由博弈的历史决定。)
2. 一般扩展式博弈的策略式博弈表示(F-T 3.4)
每一个博弈者的一个策略罗列了他在他的每一信息集上的行动,是一
个从信息集到行动的映射。如果每一博弈者都选取一个特定的策略,
我们可以用它们确定行动的历史,从而求出每人的收益。这样我们就
得到了一般扩展式博弈的策略式博弈表示。
3. 混合策略和行为策略。混合策略在整个博弈尚未开始以前混合,行为
策略在博弈开始后每一决策点处混合。对具有完美记忆的博弈,混合
策略和行为策略是等价的(Kuhn 定理)。(F-T 3.4)
4. 一般扩展式博弈的求解。Nash 均衡和 Nash 均衡的精细:逆向归纳法和
子博弈完美。(F-T 3.5)
5. 重要例子:行动可观察无限重复博弈与无名氏定理:只要博弈者足够
耐心,任何一个满足个人理性的可行的收益分配可以由一个无限重复
博弈的 Nash 均衡(或子博弈完美 Nash 均衡)实现。(F-T 5.1.1, 5.1.2)
)
(
)
(
,
:
i
i
i
i
h
A
h
s
A
H
s
∈
→