background image

是一个基本博弈,或阶段博弈。我们研究 的无限期重复博弈。

0 阶段: 

 

每一个博弈者可以独立选择一个行动 .   

1 阶段: 

 

历史 被所有博弈者观察到,每一博弈者再独立选择一个行

动.

…………

 阶段: 历史被所有博弈者观察到,每一博弈者再独立选择一个行动.

博弈永不中止.

无限重复博弈中收益的计算

(1)

 

折现: ;

(2) 平均:.      无限耐心

个人理性由最小最大值,或最低保证收益,来表示:

 .

注意:博弈者 在任何一个无限重复博弈的 Nash 均衡至少获得。

可行的收益分配当然包括所有可以由 生成的收益分配。如果我们允

许公共观察的随机混合装置,可行的收益分配还包括所有可以由 

成的收益分配的凸组合。

无名氏定理(Nash 均衡):任给一个满足的可行的收益分配 v,  

要足够接近 1就可以由一个无限重复博弈的 Nash 均衡实现。

满足的 的子博弈完美 Nash 均衡的实现较为复杂。一个较弱但容易证

{

}

n

i

i

i

g

A

G

,...,

1

;

=

=

i

i

A

a

0

)

,

,

(

0

0

1

0

1

n

a

a

a

h

=

=

i

i

A

a

1

)

,

,

,

(

1

1

0

=

t

t

a

a

a

h

i

t

i

A

a

1

,

)

1

(

0

<

=

=

=

δ

δ

δ

t

t

t

t

g

u

=

=

=

T

t

t

t

T

g

T

u

0

1

lim





=

)

,

(

max

min

i

i

i

a

i

a

g

v

i

i

α

α

i

v

)

i

v

v

i

i

> δ

)

i

v

v

i

i

>