background image

一、问题重述

问题背景:

如今,癌症越来越多,发病率越来越高,不断威胁着人们的生命安全,

其中乳腺癌就是其中一种严重威胁女性生命的癌症之一,全世界每年约有
120 万妇女患乳腺癌,50 万人死于乳腺癌,乳腺癌已经成为全球女性发病率
最高的恶性肿瘤。

下面是某医院乳腺肿瘤患者的一组数据(具体数据见附录),其中前面 9

 

个指标分别表示乳腺肿瘤肿块的厚度、细胞大小的均匀性、细胞形状的均匀性、
边缘的粘连、单层上皮细胞的大小、裸核、温和的染色质、正常的核仁、有丝分裂,
尾数 0

表示确诊为 良性 ,1

表示确诊为 恶性 ,数据已经归一化为 0 到 10

之间的自然数。

所要解决的问题如下:
问题一、通过以上数据,建立一种或多种判别方法,用来判断乳腺肿瘤是属于

” 

 “

良性 还是 恶性 ,并检验这些方法的正确性。

问题二、现有一组乳腺肿瘤患者的九个指标数据如下,根据问题一中提出的方

” 

法分别判别属于 良性 还是 恶性

10, 4,7,2,2,8,6,1,1       5,1,1,1,2,1,3,1,2,
5,2,2,2,2,1,2,2,1         5,4,6,6,4,10,4,3,1

8,6,7,3,3,10,3,4,2        1,1,1,1,2,1,1,1,1
6,5,5,8,4,10,3,4,1        1,1,1,1,2,1,3,1,1

1,1,1,1,1,1,2,1,1         8,5,5,5,2,10,4,3,1
10,3,3,1,2,10,7,6,1       1,1,1,1,2,1,3,1,1

2,1,1,1,2,1,1,1,1         1,1,1,1,2,1,1,1,1

7,6,4,8,10,10,9,5,3       1,1,1,1,2,1,1,1,1
1,1,1,1,1,1,1,3,1         3,4,4,10,5,1,3,3,1

4,2,3,5,3,8,7,6,1         5,1,1,3,2,1,1,1,1

问题三、试确定区分乳腺肿瘤是 良性 还是 恶性 的主要指标,并采用主要指

” “

” 

标建立区分 良性 和 恶性 乳腺肿瘤的模型,以便用于乳腺肿瘤的
辅助诊断时可以减少化验的指标。