析 .NET 数据库。

二、基于神经网络的基金分类模型

该基金分类模型首先是利用 SOM 神经网络对基金进行聚类；然后利用该

结果训练 LVQ 神经网络，从而建立完整的基金分类模型。由于SOM 神经网络本
身无法决定聚类数目，因此，在决定最佳分类数方面采用轮廓系数算法(silhouette

coefficient) 来评估。

1.SOM 神经网络
SOM 神经网络是由芬兰赫尔辛基大学神经网络专家 Kohonen 教授在 1981

年提出的类似大脑思维的一种人工神经网络方法，它是一种竞争学习算法，可以
被认为是一种从 N维模式空间各点到输出空间少数点的映射。这一映射由系统本
身完成，没有外部的监督，即聚类是以自组织的方式实现的。 SOM 采用无监督
方式训练，训练完成后，分类信息存储在网络各节点连接权值向量中，与权值向
量相似的输入向量将分为一类。具体算法见⑸。

2.轮廓系数

(silhouette coefficient)

由于 SOM 采用无监督方式训练，无法事先确定分类的数目，因此必须采用

某种分类效果的参数进行评价。本文采用常用的轮廓系数
（ Kaufman ， Rousseeuw 1990 ）

⑹

来评估 SOM 网络的分类效果。在计算轮

廓系数时，先考虑在各个分类数 k 下，每个点 ( 样本 ) 分到适当的类中的效率，
然后把对求平均值，的值越接近 1 说明把样本分成 k 类的效果越好。某个点的
计算方法如下：记 a 为点 i 与所在类中其它点的平均距离，记 b 为点 i 与最接
近点 i 所在类的类中各点的平均距离，则当时，，当时，，一般来说第二种情况
是不会出现的。的取值范围聚类效果关系如表 1.

轮廓系数

聚类效果

0.71-1.00

分类是高效率的、令人信服

0.51-0.71

分类合理

0.26-0.50

分类缺乏说服力

≤0.25

没有任何实际的分类

表 1.轮廓系数与聚类效果关系

⑺

3.LVQ 神经网络
LVQ 神经网络是相当新的类神经网络模式，自 1988 年 Kohonen 提出此

模式以来，由于这种网络学习速度比倒传递网络 (BPN) 快，而且可以提高 SOM

−

a 

−