background image

  1.2.2

 

应用数据挖掘技术进行数据处理

  数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数
据中,

 

提取潜在有用的信息和知识的过程。

  1) 

 

建立数据库

  将收集到的所有的 XLS/DOC 格式文件中的数据进行汇总整理,按统一标准存放,建立

 

一个土建工程项目数据库。
  2)

 

数据的预处理

  对于各种工程的历史数据采用的预处理方法主要有:空缺值的填补、平滑噪声数据、数

 

据过滤等。
  例如在描述地基状况时,利用加权平均方式将属性转换成标准值属性,如式 1-3

 

所示。

  地基状况标准值=wl×桩基础工程量+w2×挖基础土方+w3×带型基础工程量+w4×场地

 

平整 (1-3) 式中:wl,w2,w3,w4

 

是对应的加权系数。

  3)

 

相关性检验

  在 SPSS 中进行属性的相关分析,以此来验证属性特征与最后单价之间是否存在线性

 

的关联。
  2.

 

模型算法

  2.1.RBP 

 

神经网络估算模型

  以 RBP 径向基神经网络为估算模型的方法是近一段时期国外估算领域探讨的热点。
它在预测、评价等方面, 

 

其准确性优于其他模型。

  基于 RBP 神经网络的工程概算模型从大量过去的工程参数资料中自动提取工程特征
与预算资料的规律关系,速度快, 估算结果准确度高,操作简单。由于神经网络具有高度的容
错性,

 

因而对于工程资料中的差错有自动纠偏功能。

  2.2

 

模型的创建仿真

  2.2.1

 

基于神经网络的工具

  Matlab 是美国 MathWorks 公司生产的工程计算和仿真软件,其径向基神经网络(RBF-
network)工具箱提供了两个函数:newrb 和 newrbe。这两个函数是 MATLAB 提供的用于实现
RBF 网络,

 

它们都采用无导师和非监督学习算法。

  用 MATLAB 来编写各种网络设计与训练的子程序,可以使用户从繁琐的编程中解脱
出来,

 

提高了工作效率和解题质量。

  2.2.2 

 

分析判断

  根据在仿真界面中得出的误差,如果误差值在允许范围内且曲线比较平滑,可以判断所
建的模型是有效的,否则就要重新调整建模中的各项参数,

 

直到满足要求为止。

  参考文献: 
  [1] 苏新宁,杨建林,江念南,栗湘.数据仓库和数据挖掘[M]. 北京:清华大学出版社,2006 
  [2] 

 

刘大海 ,

 

李宁 ,晃阳. SPSS15.0 统计分析从入门到精通[M] .北京:清华大学出版

社,2008:152-153 
  [3] 王洪元,史国栋.人工神经网络技术及其应用[M].中国石化出版社,2002