background image
聚类分析是根据事物本身的特征,通过统计方法对事物进行分类的多元统计方法,其中,
层次聚类分析应用的最为广泛,其实质在于通过研究对象之间的亲疏关系将相似的对象划分
为一类,不相似的对象划分到不同的类别.考虑到水质样本点之间的差异性与相似性,本文
采用层次聚类的方法对样本点进行分组.亲疏程度的计算包括样本间距离和组间距离两类,
前者的测量方法有欧氏距离平方、切比雪夫距离、绝对距离等,后者的测量方法有最邻近法、
最远距离法、重心法、离差平方和法(Ward 法)等.本研究中采用的是离差平方和法.
离差平方和法(Ward 法)以差异度作为衡量标准来进行对象(组)之间的合并,在聚类过
程中将与上一合并阶段的差异度相比变化最小的对象(组)合并起来,形成新的组.Ward 法的
目的在于使合并后同一类内各样本间的差异度最小,不同类之间样本的差异度较大.其中,
差异度是用组内样本间的离差平方和来表示的,对于组 g 样本间离差平方和 Vg 的算法如下:
式中,xijg 是组 g 中对象 i 中变量 j 的观察值,
jg 为组 g 中变量 j 的观察值的平均
值.
2.4 水质标识指数评价法 2.4.1 单项指标水质标识指数的确定
单项指标水质标识指数 Pi 由一位整数和小数点后两位有效数字组成,其中,整数部分
代表水质指标的水质类别,小数部分代表监测数据在此类水质变化区间中所处的位置(徐祖
信,2005).单项指标水质标识指数公式表示如下:
式中,Ki 表示第 i 项水质指标所处的水质类别,可以通过与《地表水环境质量标准》
(GB3838—2002)的比较来确定,取值为 1,2,…,6;ρi 为第 i 项指标的实测质量浓度,ρ
ik 下≤ρi≤ρik 上,ρik 下为第 i 项水质指标第 Ki 类水区间质量浓度的下限值,ρik
上为第 i 项水质指标第 Ki 类水区间质量浓度的上限值.在《地表水环境质量标准》(GB3838
—2002)中列示的水质指标中,只有溶解氧为递减性指标,其水质标识指数用公式(7)来计算;
其余的递增性水质指标用公式(6)来计算.
当水体质量劣于Ⅴ类水时,递增性水质指标和溶解氧指标的水质标识指数分别用公式(8)
和公式(9)来计算.