Statistics and Application
Vol.06 No.01(2017), Article ID:20051,7
pages
10.12677/SA.2017.61012
Wine Evaluation Model
Yuming Xu
Jiangxi University of Finance and Economics, Nanchang Jiangxi
ABSTRACT
Based on large amounts of data which I get from the National Mathematical Modeling Contest, by using cluster analysis and principal component analysis, I established a variance model and regression model to find the relationship between wine grape and wine quality and what indicators can affect the quality of the wine. I get the relevant index system affect wine quality and the equations. The results obtained enable people to learn more about the relationship between wine grapes and wine, much quicker and easier to analyze and evaluate the quality of the wine.
Keywords:Variance Model, Clustering Analysis, Principal Component Analysis, Regression Model
葡萄酒评价模型
徐宇明
江西财经大学,江西 南昌
收稿日期:2017年3月10日;录用日期:2017年3月27日;发布日期:2017年3月30日
Copyright ? 2017 by author and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
1. 问题的重述
1) 分析两组评酒员的评价结果有无显著性差异/p>
2) 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3) 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4) 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量/p>
2. 问题的假设
1) 假设所有品酒师对酒样品的评价都很可靠。
2) 假设两组品酒师品的样品酒都对应的完全相同。
3) 假设用仪器检测出的成分都真实有效。
4) 假设各样品的测量不考虑附件外的指标影响。
3. 符 说明
表1为相关符 说明。
4. 模型的建立和求解
4.1. 问题(1)的分析和求解
问题(1)的第一问是分析两组评酒员的评价结果有无显著性差异。通过建立协方差模型,有无显著性差异的分析可运用检验统计量
Table 1. Symbol description
表1. 符 说明
服从自由度为
Table 2. Red Wine is divided into three classes
表2. 红葡萄酒分为三类时
Table 4. White Wine is divided into three classes
表4. 白葡萄酒分为三类时
根据得到的相关系数表,删除一些相关性都不好的噪音元素(即某一行或者某一列的
此时再考虑能否建立一个数学函数来表达它们之间的联系。分析后发现,可以建立回归模型。首先把红葡萄酒的6个成分定义为自变量用SPSS进行主成分分析,分析后然后用MATLAB [2] 对得到的主成份进行拟合得到的函数关系式为:
白葡萄的关系式为:
Figure 1. Relationship of strong correlation index
图1. 强相关性指标的关系
4.4. 问题(4)的分析与求解
要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,考虑到各理化指标对葡萄酒质量的不同方面的影响不同,因此将葡萄酒质量分为外观,口感,香气,整体5方面单独考虑 [3] 。又由于理化指标较多且相互联系紧密,信息重叠量大,所以先对理化指标用主成分分析法,并按各指标对主成分的载荷大小排序筛选出一些有代表性的指标。对每一方面而言,由于酿酒葡萄和葡萄酒的各理化指标对它的影响方式和影响大小未知,故选用多元线性回归分析法对数据进行拟合,确立影响较大的几个指标,再利用这些指标建立多元线性回归模型,从而得到理化指标对葡萄酒某方面质量的具体函数关系,得到酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
由于理化指标较多且相互联系紧密,信息重叠量大,所以先对理化指标用主成分分析法,并按各指标对主成分的载荷大小排序筛选出一些有代表性的指标。
选取葡萄和葡萄酒的理化指标共38个指标,以27种红葡萄和红葡萄酒的这38个指标的含量值为原始数据,利用SPSS软件求得其主成分矩阵,在SPSS软件中主成分分析分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。在主成分载荷矩阵中对每一主成分下的各指标排序,按大小确定每一主成分主要代表的指标i,从而得到少量的代表性的指标。由此,对上述9个主成分下指标分别排序,取每个主成分下载荷较大的几项构成新的指标,从而筛选出花色苷(酒)、单宁(酒)、总酚(酒)、白藜芦醇(酒)、DPPH(酒)果穗质量、A、干物质含量、pH、可溶性固形物、还原糖、总糖、总黄酮共13个指标。
1) 多元线性回归分析分类筛选
下面以口感评价得分的主要影响因素筛选为例进行分析,各自变量
同理可得出葡萄酒的香气质量可由葡萄酒的单宁及葡萄的还原糖、总黄酮和干物质总量评价,其评价模型为
Table 6. Results of SPSS analysis
表6. SPSS分析结果表
5. 模型的评价与应用
第(2)问中由于葡萄的各种理化指标繁多,我们采用主成分分析法。主成分分析法作为统计上的一种多元分析方法 [5] ,我们是利用降维思想把主成分多指标转化为少数几个综合指标不仅能消除指标间信息的重叠,而且能根据指标所提供的原始信息生成客观的绩效得分。采用单因素方差分析法,主要缺点是如果假设不成立,只能获得X个相关变量具有差异性,而不能说明是哪几个具有差异,或者差异程度有多少。主成分分析法的主要缺点是当采样数据较多时,协方差阵的计算,求解特征值以及特征向量时的运算量会很大。
文章引用
徐宇明. 葡萄酒评价模型
Wine Evaluation Model[J]. 统计学与应用, 2017, 06(01): 104-110. http://dx.doi.org/10.12677/SA.2017.61012
参考文献 (References)
1. 张磊, 毕靖, 郭莲英. SPSS实用教程[M]. 北京: 人民邮电出版 , 2008.
2. 司守奎, 孙玺菁. 数学建模算法与应用[M]. 北京: 国防工业出版 , 2011.
3. 李记明, 李华. 葡萄酒成分分析与质量研究[J]. 食品与发酵工业, 1994(2): 30-35.
4. 李丽, 梁芳华, 孙爱东. 葡萄酒中的特征性香气成分的形成及其影响因素[J]. 饮料工业, 2009(5): 13-16.
5. 王学民. 应用多元分析[M]. 上海: 上海财经大学出版 , 2009.
相关资源:糖烟茶酒行业管理软件 烟酒进销存店铺销售收银管理系统
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!