background image

3. 聚类:数据库中的记录可划分为一系列的有意义的子集。
4. 概念描述:
5. 偏差检测:偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。

数据挖掘常用的技术:
1. 决策树:
2. 神经网络
3. 遗传算法
4. 关联规则挖掘算法

数据挖掘分析方法:
1. 关联分析
2. 序列分析
3. 分类分析
4. 聚类分析
5. 预测
6. 时间序列分析

数据挖掘的流程:
1. 问题定义:要想充分发挥数据挖掘的价值,必须对目标要有一个清晰明确的定义,即

决定到底想干什么

2. 建立数据挖掘库:把要挖掘的数据都收集到一个数据库中,而不是采用原有的数据库

或数据仓库。因为大部分情况下需要修改要万巨额的数据,而且还会遇到采用外部数据
的情况。另外还需要对数据进行各种纷繁复杂的统计分析,而数据仓库可能不支持这些
数据结构。

3. 分析数据:通常所进行的对数据深入调查的过程。
4. 调整数据
5. 模型化
6. 评价与解释

数据库建模

使用数据模型比使用过程模型的优越性:

1. 数据模型有助于分析员快速地确定业务词汇(比过程模型确定的更全面)
2. 数据模型几乎总是比过程模型构造的快
3. 一个完整的数据模型可以记录在一页纸上,而过程模型要十几页纸
4. 过程模型经常使人容易陷入不必要的细节中
5. 现有系统和建议系统的数据模型之间的相似性远比他们的过程模型的相似性高。