交通大学博弈论课程概要 (III)

第四部分

：不完全信息扩展式博弈

1. 一般扩展式博弈的定义(F-T 3.3.1)

一个一般扩展式博弈由(有向)博弈树表示。博弈树由点和联结点的枝组

成。前点和后点。起点无前点，终点无后点。除起点外，每点有唯一
的直接前访点。

除终点外的点代表决策点，每点 x 只属于一个博弈者 i(x)，从这点出发

的枝代表 i(x)在 x 处的行动集 A(x) 。

博弈者 i(x)在 x 处拥有的信息由信息集 h(x)表示。h(x)包括了所有 i(x)不

能同 x 区分开来的点。对所有的 h(x)中的点 x’，A(x’) = A(x) 。因此我们

可以将行动集记为 A(h) 。

“

”

对一个不完全信息的扩展式博弈来说，起点代表自然，从自然出发
的枝代表外生随机事件，概率分布是给定的，不受博弈者选择的影响。

每一终点处给出所有博弈者的收益。(当博弈进行无穷阶段时，所有博

弈者的收益由博弈的历史决定。)

2. 一般扩展式博弈的策略式博弈表示(F-T 3.4)

每一个博弈者的一个策略罗列了他在他的每一信息集上的行动，是一
个从信息集到行动的映射。如果每一博弈者都选取一个特定的策略，
我们可以用它们确定行动的历史，从而求出每人的收益。这样我们就
得到了一般扩展式博弈的策略式博弈表示。

3. 混合策略和行为策略。混合策略在整个博弈尚未开始以前混合，行为

策略在博弈开始后每一决策点处混合。对具有完美记忆的博弈，混合
策略和行为策略是等价的（Kuhn 定理）。(F-T 3.4)

4. 一般扩展式博弈的求解。Nash 均衡和 Nash 均衡的精细：逆向归纳法和

子博弈完美。(F-T 3.5)

5. 重要例子：行动可观察无限重复博弈与无名氏定理：只要博弈者足够

耐心，任何一个满足个人理性的可行的收益分配可以由一个无限重复
博弈的 Nash 均衡（或子博弈完美 Nash 均衡）实现。(F-T 5.1.1, 5.1.2)

)

(

)

(

∈

→