background image

第 10 期

杨广全等: 基于粒子群 K 均值聚类算法的电梯交通模式识别

法. 交通流的模式识别是以当前采样的交通流数据

x 作为待分类的数据, 粒子群聚类算法的聚类结果
作为分类样本, 通过判断采样数据与聚类中心的距
离, 将其划分到最短距离的类中. 该类对应的模式即
为采样数据 x 所对应的模式.

基于粒子群 K 均值算法的交通模式识别流程

如下:

St ep1: 设定交 通流样本数据点的聚类中 心数

为 K , 采用 K 均值算法进行一次聚类, 将 K 均值算
法的聚类结果作为一个粒子的位置, 其余粒子的位
置 X

i

和速度 V

i

随机产生, 其中位置 X

i

= ( c

i, 1

, c

i, 2

,

, c

i, K

) 代表聚类中心集合.

St ep2: 根据式( 5) 判断每个数据点归属的聚类

中心.

St ep3: 根据式( 6) 计算每个粒子的适应度值.

St ep4: 由下式更新每个粒子的最好位置 P

t+ 1
i

:

P

t+ 1

i

=

X

t+ 1
i

, F( X

t+ 1
i

)

F( P

t
i

) ;

P

t

i

, F( X

t+ 1

i

) < F( P

t

i

) .

( 7)

将每个粒子求得的适应函数值与其所记忆的适应函

数值进行比较, 若当前的适应函数值较之前最优结
果为佳, 则以当前位置取代粒子记忆的最好所在位
置, 以当前适应函数值取代粒子记忆的最优值.

St ep5: 由下式更新粒子群全局最好位置 P

t+ 1
g

:

P

t+ 1

g

=

P

t+ 1
i

, F( P

t+ 1
i

)

F ( P

t
g

) ;

P

t

g

, F( P

t+ 1

i

) < F ( P

t

g

) .

( 8)

比较由粒子最优解所求得的适应函数值是否优于粒

子群所记忆的最优值, 若判断条件成立, 则将群体所
记忆的最好位置与最优值重设为当前的结果.

St ep6: 根据式( 1) 和( 2) 调整所有粒子的移动

速度和位置.

St ep7: 重复执行 Step2 ~ St ep7, 直到满足终止

条件. 若终止条件成立, 则输出每一类别的聚类中心
坐标.

St ep8: 根据最近邻原则判断待分类数据 x 的交

通模式. 若 x 和 j 满足

1 - e

(-

x- c

j

2

)

=

m in

k= 1, 2,

, K

( 1 - e

(-

x- c

k

2

)

) ,

则 x 属于 j 模式.

5

仿真实验及结果

仿真所用样本数据采用笔者所调查的 上海某

多租户办公大厦 7 天内的交通流数据. 图 1 中的 3 条
曲线描述了一个典型工作日 7: 00 ~ 19: 00 的 12 h
内办公大厦交通流统计数据. 其中: ① 为进 门厅人
数, ② 为出门厅人数, ③ 为层间人数. 从图 1 可以看
出, 该大厦层间人数少, 层间交通需求率很低. 这是
因为各楼层由不同的公司所占用, 各楼层之间人员

交流少. 取采样周期 5 min, 每天得到 144 个交通流
数据, 用于模式聚类的数据点共有 1 008 个. 采集的
数据点表示为( x

1

, x

2

, x

3

) , x

1

, x

2

和 x

3

分别表示在 5

m in 采样周期内进门厅人数、出门厅人数和层间人
数.

图 1

某大厦电梯交通流特征数据曲线

采用粒子群 K 均值聚类算法对样本数据进行

模式分类. 算法的参数设置为: 粒子群数 N = 10, 聚
类中心 K = 5, 惯性权值 = 0. 75, 学习参数

1

=

2

= 1. 5; 适应度函数中的参数 r

0

= 10, eps = 10

- 1 0

.

该办公大厦交通流特征数据的聚类结果如图 2

所示. 由于层间交通需求 率低, 层间交通模式不明
显, 对聚类结果影响甚微. 为使聚类结果的显示更加
清晰, 图 2 中忽略了层间模式显示. 聚类结果的聚类
中心 点分 别为: Ⅰ ( 93. 672 1, 7. 86 05, 1. 666 5) ,
Ⅱ ( 15. 283 3 , 73. 803 9 , 1. 784 9 ) , Ⅲ ( 48. 850 3,

71. 832 0,

2. 699 4) ,

Ⅳ ( 58. 631 4,

25. 675 9,

2. 987 5) , Ⅴ( 27. 7, 30. 502 5, 3. 459 2) . 第 Ⅰ 类为
上行高峰交通模式, 第 Ⅱ 类为下行高峰交通模式,
第 Ⅲ 类为午间交通前半段以下行交通为主的混合

交通模式, 第 Ⅳ 类为午间交通后半段以上行交通为
主的混合交通模式, 第 Ⅴ 类为上行交通和下行交通
的混合交通模式, 主要发生在非高峰交通时段.

图 2

某大厦交通流特征数据聚类结果

采用粒子群 K 均值聚类算法( PSOKCA) , 粒子

群聚类算法( PSOCA) 和免疫规划 K 均值聚类算法

( IEK CA ) , 分别识别电梯交通流模式的适应度变化
曲线如图 3 所示. P SOCA 算法和 PSOKCA 算法采
用相同的参数设置, 其参数值是经反复试验得到的

1141