析 .NET 数据库。
二、基于神经网络的基金分类模型
该基金分类模型首先是利用 SOM 神经网络对基金进行聚类;然后利用该
结果训练 LVQ 神经网络,从而建立完整的基金分类模型。由于SOM 神经网络本
身无法决定聚类数目,因此,在决定最佳分类数方面采用轮廓系数算法(silhouette
coefficient) 来评估。
1.SOM 神经网络
SOM 神经网络是由芬兰赫尔辛基大学神经网络专家 Kohonen 教授在 1981
年提出的类似大脑思维的一种人工神经网络方法,它是一种竞争学习算法,可以
被认为是一种从 N维模式空间各点到输出空间少数点的映射。这一映射由系统本
身完成,没有外部的监督,即聚类是以自组织的方式实现的。 SOM 采用无监督
方式训练,训练完成后,分类信息存储在网络各节点连接权值向量中,与权值向
量相似的输入向量将分为一类。具体算法见⑸。
2.轮廓系数
(silhouette coefficient)
由于 SOM 采用无监督方式训练,无法事先确定分类的数目,因此必须采用
某 种 分 类 效 果 的 参 数 进 行 评 价 。 本 文 采 用 常 用 的 轮 廓 系 数
( Kaufman , Rousseeuw 1990 )
⑹
来评估 SOM 网络的分类效果。在计算轮
廓系数时,先考虑在各个分类数 k 下,每个点 ( 样本 ) 分到适当的类中的效率,
然后把对求平均值,的值越接近 1 说明把样本分成 k 类的效果越好。某个点的
计算方法如下:记 a 为点 i 与所在类中其它点的平均距离,记 b 为点 i 与最接
近点 i 所在类的类中各点的平均距离,则当时,,当时,,一般来说第二种情况
是不会出现的。的取值范围聚类效果关系如表 1.
轮廓系数
聚类效果
0.71-1.00
分类是高效率的、令人信服
0.51-0.71
分类合理
0.26-0.50
分类缺乏说服力
≤0.25
没有任何实际的分类
表 1.轮廓系数与聚类效果关系
⑺
3.LVQ 神经网络
LVQ 神经网络是相当新的类神经网络模式,自 1988 年 Kohonen 提出此
模式以来,由于这种网络学习速度比倒传递网络 (BPN) 快,而且可以提高 SOM
i
S
i
S
k
S
k
S
i
S
b
a
p
b
a
S
i
−
=
1
b
a
1
−
=
b
a
S
i
k
S
k
S
2