background image

主成分分析法是利用降维的方法,在损失很少信息的前提下把多个原始变

量转化为几个主成分,每个主成分都是原始变量的线性组合,这样在研究复杂

问题时就可以只考虑少数几个主成分而不至于损失太多信息。目前已经被广泛应

用于河流、湖泊及沿海水域的水质评估、污染物来源确定等生态环境的研究中。因

此北海区河口区域评价指标的初步筛选采用主成分分析法。

主成分分析法的一般过程

主成分分析法是将原始的多个变量,通过线性组合,提炼出较少几个彼此

独立的新变量的一种多元统计分析方法。主要经过数据标准化,计算特征值、贡

献率和累积贡献率、因子载荷,主成分分析等几个步骤。具体过程如下。

1) 数据标准化

更为合理地表征了各因素的水平和对环境的污染程度,因此各要素的计算

取用各监测因素的单因子评价值。

2) 计算特征向量

各主成分所提供的信息量多少,常用其方差的大小

(即特征根 λi)来衡量,

λi 愈大,该主成分提供的信息量就愈大。

11

12

1

21

22

2

1

2

=

M

M

M

p

p

p

p

pp

r

r

r

r

r

r

R

r

r

r

Λ

Λ

Λ

     

                      (式 3-1)       

r

ij

ij=1,2,…,p)为原变量 x

i

x

j

的相关系数,

 r

ij

=r

ji

,其计算公式为

1

2

2

1

1

(

)(

)

(

)

(

)

n

ki

i

kj

j

k

ij

n

n

ki

i

kj

j

k

k

x

x x

x

r

x

x

x

x

=

=

=

=

     

(式 3-2)

解特征方程

0

R

λΙ − =

,常用雅可比法(

Jacobi)求出特征值,并使其按大

小 顺 序 排 列

1

2

0

p

λ λ

λ

≥ Λ ≥

; 分 别 求 出 对 应 于 特 征 值

i

λ

的 特 征 向 量