是一个基本博弈,或阶段博弈。我们研究 G 的无限期重复博弈。
0 阶段:
每一个博弈者可以独立选择一个行动 .
1 阶段:
历史 被所有博弈者观察到,每一博弈者再独立选择一个行
动.
…………
t 阶段: 历史被所有博弈者观察到,每一博弈者再独立选择一个行动.
博弈永不中止.
无限重复博弈中收益的计算
(1)
折现: ;
(2) 平均:. 无限耐心
个人理性由最小最大值,或最低保证收益,来表示:
.
注意:博弈者 i 在任何一个无限重复博弈的 Nash 均衡至少获得。
可行的收益分配当然包括所有可以由 g 生成的收益分配。如果我们允
许公共观察的随机混合装置,可行的收益分配还包括所有可以由 g 生
成的收益分配的凸组合。
无名氏定理(Nash 均衡):任给一个满足的可行的收益分配 v, 只
要足够接近 1,v 就可以由一个无限重复博弈的 Nash 均衡实现。
满足的 v 的子博弈完美 Nash 均衡的实现较为复杂。一个较弱但容易证
{
}
n
i
i
i
g
A
G
,...,
1
;
=
=
i
i
A
a
∈
0
)
,
,
(
0
0
1
0
1
n
a
a
a
h
=
=
i
i
A
a
∈
1
)
,
,
,
(
1
1
0
−
=
t
t
a
a
a
h
i
t
i
A
a
∈
1
,
)
1
(
0
<
−
=
∑
∞
=
=
δ
δ
δ
t
t
t
t
g
u
∑
=
=
∞
→
=
T
t
t
t
T
g
T
u
0
1
lim
=
−
−
)
,
(
max
min
i
i
i
a
i
a
g
v
i
i
α
α
i
v
)
( i
v
v
i
i
∀
> δ
)
( i
v
v
i
i
∀
>