主成分分析法是利用降维的方法,在损失很少信息的前提下把多个原始变
量转化为几个主成分,每个主成分都是原始变量的线性组合,这样在研究复杂
问题时就可以只考虑少数几个主成分而不至于损失太多信息。目前已经被广泛应
用于河流、湖泊及沿海水域的水质评估、污染物来源确定等生态环境的研究中。因
此北海区河口区域评价指标的初步筛选采用主成分分析法。
主成分分析法的一般过程
主成分分析法是将原始的多个变量,通过线性组合,提炼出较少几个彼此
独立的新变量的一种多元统计分析方法。主要经过数据标准化,计算特征值、贡
献率和累积贡献率、因子载荷,主成分分析等几个步骤。具体过程如下。
1) 数据标准化
更为合理地表征了各因素的水平和对环境的污染程度,因此各要素的计算
取用各监测因素的单因子评价值。
2) 计算特征向量
各主成分所提供的信息量多少,常用其方差的大小
(即特征根 λi)来衡量,
λi 愈大,该主成分提供的信息量就愈大。
11
12
1
21
22
2
1
2
=
M
M
M
p
p
p
p
pp
r
r
r
r
r
r
R
r
r
r
Λ
Λ
Λ
(式 3-1)
r
ij
(
i,j=1,2,…,p)为原变量 x
i
与
x
j
的相关系数,
r
ij
=r
ji
,其计算公式为
1
2
2
1
1
(
)(
)
(
)
(
)
n
ki
i
kj
j
k
ij
n
n
ki
i
kj
j
k
k
x
x x
x
r
x
x
x
x
=
=
=
−
−
=
−
−
∑
∑
∑
(式 3-2)
解特征方程
0
R
λΙ − =
,常用雅可比法(
Jacobi)求出特征值,并使其按大
小 顺 序 排 列
1
2
0
p
λ λ
λ
≥
≥ Λ ≥
≥
; 分 别 求 出 对 应 于 特 征 值
i
λ
的 特 征 向 量