域。
(三)机器学习(
Machine Learning)
机器学习方法经过多年的研究已相对完善,通过建立人类的认识模型、模仿人类的学习
方法从海量数据中提取信息与知识,在很多领域已取得了一些较满意的成果。因此利用目前
比较成熟的机器学习方法可以提供数据挖掘效率。
(四)数据汇总
数据库中的数据和对象经常包含原始概念层上的详细信息,将数据集通过数据立方体
和面向对象的归纳方法由低概念层抽象到高概念层,并对数据归纳为更高概念层次信息的
数据挖掘技术。
(五)人工神经网络(
Artificial Neural Networks)
神经网络是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模
型。近年来在解决数据挖掘中遇到的问题越来越受到人们的关注,源于人工神经网络具有良
好的自组织自适应性、并行处理、分布式存储和高容错等特性,并通过调整内部大量节点之
间相互连接的关系,达到处理信息的目的。
(六)遗传算法(
Genetic Algorithm)
遗传算法(
Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生
物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,是一种受生物
进化启发的学习方法,通过变异和重组当前己知的最好假设来生成后续的假设。遗传算法可
直接对结构对象进行操作,不存在求导和函数连续性的限定,能自动获取和指导优化的搜
索空间,自适应地调整搜索方向。遗传算法已被人们广泛地应用于多种学科领域。
(七)粗糙集
粗糙集是一种刻划不完整性和不确定性的数学工具,能有效地分析不精确,不一致
(
inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,
从中发现隐含的知识,揭示潜在的规律。粗糙集理论应用于数据挖掘中的分类、发现不准确
数据或噪声数据内在的结构联系。
四、数据挖掘技术发展趋势
当前,数据挖掘技术不断创新与发展,数据挖掘技术开发研究人员、系统应用人员所面
对的主要问题:高效、有效的数据挖掘方法和相应系统的开发;交互和集成的数据挖掘环境
的建立以及在实际应用中解决大型问题。
五、小结
数据挖掘技术涉及到多种学科技术,如:数据库技术、统计学、机器学习、高性能计算、
模式识别、神经网络、数据可视化、信息检索及空间数据分析等。因此,数据挖掘是非常有前
景的研究领域,随着数据挖掘技术的不断发展,它将会广泛而深入地应用到人类社会的各
个领域。
参考文献:
[1]罗可,蔡碧野.数据挖掘及其发展研究[J].计算机工程与应用,2002
[2]赵丹群.数据挖掘:原理、方法及其应用[J].现代图书情报技术,2000
[3]刘毅勇.情报分析智能辅助决策方法及其军事应用[M].北京:国防大学出版社,2001
[4]唐晓萍.数据挖掘技术及其在指挥控制系统中的应用[J].火力与指挥控制,2002
[5]Alex Berson , Stephen J . Smith , Data Warehousing , Data Mining,&OLAP[M],
McCraw-Hill Book Co,1997
[6]吴修霆.SAS 数据挖掘技术的实现[J].微电脑世界,2000, Vol.14:pp44-45
[7] INDERPAL BHANDARI, EDWARD COLET, JENNIFER PARKER, ZACHARYPINES,
RAJIV PRATAP, KRISHNAKMAR RAMANUJAM. Advanced Scout: Data Mining and