background image

 

1.  问题的重述 

确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员

在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒
的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检
测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题目附件一给出了某一年
份一些葡萄酒的评价结果,题目附件二和题目附件三分别给出了该年份这些葡萄酒
的和酿酒葡萄的成分数据。题目要求尝试建立数学模型讨论下列问题: 

1.  分析题目附件一中两组评酒员的评价结果有无显著性差异,并讨论哪一组结果

更可信。 

2.  根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 

3.  分析酿酒葡萄与葡萄酒的理化指标之间的联系。 

4.  分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和

葡萄酒的理化指标来评价葡萄酒的质量。 

 

2.  问题的分析 

2.1  问题一的分析 

该问题要求分析题目附件一中两组评酒员的评价结果有无显著性差异,并分析

哪一组的结果更可信。 

显著性差异是统计学上有量度的对数据差异性的或然评价。分析评酒员的评价

结果有无显著性差异,即反映需研究评酒员对酒样评分的数值序列是否有较大的偏
差。根据题意,葡萄酒的质量评价是通过评酒员的品评进行评分从而得到评价的,
考虑到评酒员之间可能存在个人评酒风格等主观差异因素,若不同评酒员之间的主
观因素差异过大,可能导致不同评酒员对于同一葡萄酒样的评价差异悬殊,影响酒
样的质量鉴定,因此需要对主观因素的影响程度进行检验。 

对于数据的偏差性检验和影响因素的挖掘,可采用方差分析对数据序列进行处

理,通过将方差分析中的检验量与显著性水平下的检验值相比较从而验证差异性是
否显著。考虑到涉及主观因素的差异性对酒样评分的影响是否显著,还可通过分别
构造以评酒员为组别、元素为单个酒样的评分方差数据序列和以酒样为组别,元素
为单个评酒员对全部酒样的评分方差数据序列,基于两类数据序列进行双向显著性
检验,通过比较两者的检验量进行分析。若以评酒员为组别的序列的差异性检验量
显著高于以酒样为组别的序列,则表明评酒员之间主观因素造成的葡萄酒质量评价
差异更显著,则需要对数据进行处理降低这种差异性。 

数据处理的方法有多种,如标准化处理、聚类处理和区间收敛处理等,可根据