http://www.paper.edu.cn
- 3 -
12
A,D
13
C,D
14
A,C,E
15
A,C,D
运用 Apriori 算法,找出最小支持度为 25%和长度为 3 的频繁项目集。过程如图 1 所示。
数据库 DA
Sales-Item Goods
01
A,D,E
02
A,B,C,E
03
A,C,D,E
04 A
05
A,B,C,D,E
06
A,B,D
07
A,B,D,E
08
A,E
09
A,C
10
A,B,C
11
C,E
12
A,D
13
C,D
14
A,C,E
15
A,C,D
C
2
Goods Support
{A,C}
46%
{A,D}
46%
{A,E}
46%
{C,D}
26%
{C,E}
33%
{D,E}
26%
C
3
Goods Support
{A,C,D}
20%
{A,C,E}
26%
{A,D,E}
26%
{C,D,E}
13%
图 1 Apriori 算法的实例
在上例中,销售数据库 DA 经扫描、筛选、联合、剪枝的过程,最后得到所需的频繁集
L
3
={A,C,E} 和 L
3
={A,D,E};在此基础上再给出可信度为 76%和约束条件“推导式右
边只含一个商品”,则可以得出关联规则如表 2。
Goods Support
{A} 86%
{B} 33%
{C} 60%
{D} 53%
{E} 53%
Goods Support
{A} 86%
{C} 60%
{D} 53%
{E} 53%
Goods Support
{A,C}
46%
{A,D}
46%
{A,E}
46%
{C,E}
33%
Goods Support
{A,C,E}
26%
{A,D,E}
26%
联合、剪枝、扫描 DA
联合、剪枝、扫描 DA
筛选
筛选
联合、剪枝、扫描 DA
筛选
C
1
L
1
L
2
L
3