background image

析 .NET 数据库。

二、基于神经网络的基金分类模型

该基金分类模型首先是利用 SOM 神经网络对基金进行聚类;然后利用该

结果训练 LVQ 神经网络,从而建立完整的基金分类模型。由于SOM 神经网络本
身无法决定聚类数目,因此,在决定最佳分类数方面采用轮廓系数算法(silhouette 

coefficient) 来评估。

1.SOM 神经网络
SOM 神经网络是由芬兰赫尔辛基大学神经网络专家 Kohonen 教授在 1981

年提出的类似大脑思维的一种人工神经网络方法,它是一种竞争学习算法,可以
被认为是一种从 N维模式空间各点到输出空间少数点的映射。这一映射由系统本
身完成,没有外部的监督,即聚类是以自组织的方式实现的。 SOM 采用无监督
方式训练,训练完成后,分类信息存储在网络各节点连接权值向量中,与权值向
量相似的输入向量将分为一类。具体算法见⑸。

2.轮廓系数

(silhouette coefficient)

由于 SOM 采用无监督方式训练,无法事先确定分类的数目,因此必须采用

某 种 分 类 效 果 的 参 数 进 行 评 价 。 本 文 采 用 常 用 的 轮 廓 系 数
( Kaufman , Rousseeuw 1990 )

来评估 SOM 网络的分类效果。在计算轮

廓系数时,先考虑在各个分类数 k 下,每个点 ( 样本 ) 分到适当的类中的效率,
然后把对求平均值,的值越接近 1 说明把样本分成 k 类的效果越好。某个点的
计算方法如下:记 a 为点 i 与所在类中其它点的平均距离,记 b 为点 i 与最接
近点 i 所在类的类中各点的平均距离,则当时,,当时,,一般来说第二种情况
是不会出现的。的取值范围聚类效果关系如表 1.

轮廓系数

聚类效果

0.71-1.00

分类是高效率的、令人信服

0.51-0.71

分类合理

0.26-0.50

分类缺乏说服力

≤0.25

没有任何实际的分类

表 1.轮廓系数与聚类效果关系

3.LVQ 神经网络
LVQ 神经网络是相当新的类神经网络模式,自 1988 年 Kohonen 提出此

模式以来,由于这种网络学习速度比倒传递网络 (BPN) 快,而且可以提高 SOM

i

S

i

S

k

S

k

S

i

S

b

a

p

b

a

S

i

=

1

b

1

=

b

a

S

i

k

S

k

S

2