是一个基本博弈，或阶段博弈。我们研究 G 的无限期重复博弈。

0 阶段:

每一个博弈者可以独立选择一个行动 .

1 阶段:

历史被所有博弈者观察到，每一博弈者再独立选择一个行

动.

…………

t 阶段: 历史被所有博弈者观察到，每一博弈者再独立选择一个行动.

博弈永不中止.

无限重复博弈中收益的计算

（1）

折现：；

（2）平均：. 无限耐心

个人理性由最小最大值，或最低保证收益，来表示：

.

注意：博弈者 i 在任何一个无限重复博弈的 Nash 均衡至少获得。

可行的收益分配当然包括所有可以由 g 生成的收益分配。如果我们允

许公共观察的随机混合装置，可行的收益分配还包括所有可以由 g 生

成的收益分配的凸组合。

无名氏定理（Nash 均衡）：任给一个满足的可行的收益分配 v, 只

要足够接近 1，v 就可以由一个无限重复博弈的 Nash 均衡实现。

满足的 v 的子博弈完美 Nash 均衡的实现较为复杂。一个较弱但容易证

{

}

n

i

i

i

g

A

G

,...,

1

;

=

=

i

i

A

a

∈

0

)

,

,

(

0

0

1

0

1

n

a

a

a

h



=

=

i

i

A

a

∈

1

)

,

,

,

(

1

1

0

−

=

t

t

a

a

a

h



i

t

i

A

a

∈

1

,

)

1

(

0

<

−

=

∑

∞

=

=

δ

δ

δ

t

t

t

t

g

u

∑

=

=

∞

→

=

T

t

t

t

T

g

T

u

0

1

lim









=

−

−

)

,

(

max

min

i

i

i

a

i

a

g

v

i

i

α

α

i

v

)

( i

v

v

i

i

∀

> δ

)

( i

v

v

i

i

∀

>