background image

http://www.paper.edu.cn 

- 3 -

 

12 

A,D 

13 

C,D 

14 

A,C,E 

15 

A,C,D 

运用 Apriori 算法,找出最小支持度为 25%和长度为 3 的频繁项目集。过程如图 1 所示。 

数据库 DA 

Sales-Item Goods 

01 

A,D,E 

02 

A,B,C,E 

03 

A,C,D,E 

04 A 

05 

A,B,C,D,E

06 

A,B,D 

07 

A,B,D,E 

08 

A,E 

09 

A,C 

10 

A,B,C 

11 

C,E 

12 

A,D 

13 

C,D 

14 

A,C,E 

15 

A,C,D 

C

2

 

Goods Support 

{A,C} 

46% 

{A,D} 

46% 

{A,E} 

46% 

{C,D} 

26% 

{C,E} 

33% 

{D,E} 

26% 

C

3

 

Goods Support 

{A,C,D} 

20% 

{A,C,E} 

26% 

{A,D,E} 

26% 

{C,D,E} 

13% 

图 1  Apriori 算法的实例 

在上例中,销售数据库 DA 经扫描、筛选、联合、剪枝的过程,最后得到所需的频繁集

L

3

={A,C,E}  和 L

3

={A,D,E};在此基础上再给出可信度为 76%和约束条件“推导式右

边只含一个商品”,则可以得出关联规则如表 2。 

Goods Support 

{A} 86% 

{B} 33% 

{C} 60% 

{D} 53% 

{E} 53% 

Goods Support 

{A} 86% 

{C} 60% 

{D} 53% 

{E} 53% 

Goods Support 

{A,C} 

46% 

{A,D} 

46% 

{A,E} 

46% 

{C,E} 

33% 

Goods Support 

{A,C,E} 

26% 

{A,D,E} 

26% 

联合、剪枝、扫描 DA

联合、剪枝、扫描 DA

筛选 

筛选

 

联合、剪枝、扫描 DA

筛选 

C

1

L

1

L

2

L

3