background image
我们接下来就用这个布尔向量集合来分析元素之间的关联关系、相关关系和
挖掘模式。表示这些模式的最常用的方法之一是通过关联规则,其中的一个例子
如下:
milk => bread [support = 25%, confidence = 60%]
我们怎么知道一条规则的价值究竟有多少呢?这时候就需要用到支持度和
置信度这两个指标了。
支持度是度量模式或者物品成对出现的绝对次数。在上面的例子里,25%
的支持度表示牛奶和面包被共同购买的次数占到所有交易次数的 25%。
置信度是度量模式或者物品成对出现的相对次数。在上面的例子里,60%
的置信度表示购买牛奶的客户中,有 60%的客户同时也购买了面包。
在一个给定的场景中,通常需要置信度和支持度都大于设定的阈值,这条关
联规则才能成立,这条规则才有利用价值。
Apriori