background image

 

交通大学博弈论课程概要 (III)

第四部分

 

:不完全信息扩展式博弈

1. 一般扩展式博弈的定义(F-T 3.3.1)

一个一般扩展式博弈由(有向)博弈树表示。博弈树由点和联结点的枝组

成。前点和后点。起点无前点,终点无后点。除起点外,每点有唯一
的直接前访点。

除终点外的点代表决策点,每点 只属于一个博弈者 i(x),从这点出发

的枝代表 i(x)在 处的行动集 A(x) 。

博弈者 i(x)在 处拥有的信息由信息集 h(x)表示。h(x)包括了所有 i(x)不

能同 区分开来的点。对所有的 h(x)中的点 x’,A(x’) = A(x) 。因此我们

可以将行动集记为 A(h) 。

对一个不完全信息的扩展式博弈来说,起点代表 自然 ,从自然出发
的枝代表外生随机事件,概率分布是给定的,不受博弈者选择的影响。

每一终点处给出所有博弈者的收益。(当博弈进行无穷阶段时,所有博

弈者的收益由博弈的历史决定。)

2. 一般扩展式博弈的策略式博弈表示(F-T 3.4)

每一个博弈者的一个策略罗列了他在他的每一信息集上的行动,是一
个从信息集到行动的映射。如果每一博弈者都选取一个特定的策略,
我们可以用它们确定行动的历史,从而求出每人的收益。这样我们就
得到了一般扩展式博弈的策略式博弈表示。

3. 混合策略和行为策略。混合策略在整个博弈尚未开始以前混合,行为

策略在博弈开始后每一决策点处混合。对具有完美记忆的博弈,混合
策略和行为策略是等价的(Kuhn 定理)。(F-T 3.4)

4. 一般扩展式博弈的求解。Nash 均衡和 Nash 均衡的精细:逆向归纳法和

子博弈完美。(F-T 3.5)

5. 重要例子:行动可观察无限重复博弈与无名氏定理:只要博弈者足够

耐心,任何一个满足个人理性的可行的收益分配可以由一个无限重复
博弈的 Nash 均衡(或子博弈完美 Nash 均衡)实现。(F-T 5.1.1, 5.1.2)

)

(

)

(

,

:

i

i

i

i

h

A

h

s

A

H

s