葡萄酒的评价matlab代码,葡萄酒评价模型

Statistics and Application

Vol.06 No.01(2017), Article ID:20051,7

pages

10.12677/SA.2017.61012

Wine Evaluation Model

Yuming Xu

Jiangxi University of Finance and Economics, Nanchang Jiangxi

htmlimages%5C1-2890033x%5Cf4daa762-ba39-44c9-b439-8965414d84df.png

ABSTRACT

Based on large amounts of data which I get from the National Mathematical Modeling Contest, by using cluster analysis and principal component analysis, I established a variance model and regression model to find the relationship between wine grape and wine quality and what indicators can affect the quality of the wine. I get the relevant index system affect wine quality and the equations. The results obtained enable people to learn more about the relationship between wine grapes and wine, much quicker and easier to analyze and evaluate the quality of the wine.

Keywords:Variance Model, Clustering Analysis, Principal Component Analysis, Regression Model

葡萄酒评价模型

徐宇明

江西财经大学,江西 南昌

收稿日期:2017年3月10日;录用日期:2017年3月27日;发布日期:2017年3月30日

80e3f530f602dad58d3ca62c4c11a56e.png

Copyright ? 2017 by author and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

image.hanspub.org:8080%5CHtml%5Chtmlimages%5C1-2890033x%5Ce898c85e-ffc4-45c9-b817-14224a4d6960.png

1. 问题的重述

确定葡萄酒的质量一般是由专业评酒员通过品尝对葡萄酒的口味各项指标进行打分,最后求和得出总分进行评判。由于不同评酒员对葡萄酒的偏好和侧重不尽相同,在打分上不可避免有着主观性和局限性,再加上葡萄酒口味与许多条件有关,包括葡萄、产地、年份等,因此一般还会通过对酒液中的理化指标进行测定分析,以得出葡萄酒内部理化指标与口味之间的联系,进一步的得出可信度较高的葡萄酒质量分类。本文数据建立来源于2012年全国大学生数学建模,通过数学模型讨论下列问题:

1) 分析两组评酒员的评价结果有无显著性差异/p>

2) 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3) 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4) 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量/p>

2. 问题的假设

1) 假设所有品酒师对酒样品的评价都很可靠。

2) 假设两组品酒师品的样品酒都对应的完全相同。

3) 假设用仪器检测出的成分都真实有效。

4) 假设各样品的测量不考虑附件外的指标影响。

3. 符号说明

表1为相关符号说明。

4. 模型的建立和求解

4.1. 问题(1)的分析和求解

问题(1)的第一问是分析两组评酒员的评价结果有无显著性差异。通过建立协方差模型,有无显著性差异的分析可运用检验统计量

cf69a0d8ab9b9f62114738e0159ead2e.png

d6174b15999c0041ff3a0bb77ffeef48.png;又设

61597fdad5d1ff7208825ab3935217d0.png,其中

e83021f78f4794ed5c4782651da88d3b.png

cf1d59869c9811ad19126b8ebdb6acbe.png分别是总体X和总体Y的均值向量。其中可以通过检验假设:

08a93478cfcdad37192d1a051a0775d6.png,从而将两个总体的均值比较检验的情形转化为一个总体的情形。当原假设

8768684dd769dd6ec7bb579563f38a7b.png。其中

8b2a9e44a6b9874c918661fc10e87d62.png

Table 1. Symbol description

表1. 符号说明

服从自由度为

22b6f2757d8f78d3b8d639074a1d82aa.png的F分布,对给定的显著性水平

64252178a2676fbd66bd80859c4a9a26.png,则有显著性差异;反之,则无显著性差异。

8b2a9e44a6b9874c918661fc10e87d62.png

Table 2. Red Wine is divided into three classes

表2. 红葡萄酒分为三类时

8b2a9e44a6b9874c918661fc10e87d62.png

Table 4. White Wine is divided into three classes

表4. 白葡萄酒分为三类时

1b0c2e77421ef77338025d22ea176512.png个指标和红葡萄第

aa9799002366776f67c6ecbdd07955ff.png,第一次求出的相关相关系数情况。

根据得到的相关系数表,删除一些相关性都不好的噪音元素(即某一行或者某一列的

728818e8bef18b35515537506fa705c5.png里的元素为红葡萄指标中的酒石酸、柠檬酸、白藜芦醇、总糖、还原糖、PH值、可滴定酸、果穗质量、百粒质量、果皮颜色a和果皮颜色b,这些都是弱相关指标,即噪音指标。删除掉这些元素后,剩下的都是相关系数处于区间

9fd3b74b09a2aec20ff1fe80c7520204.png里的有花色苷和总酚,表明它们对酿出的葡萄酒的理化指标有强相关性。处于

e878d5d995605505c1caec2e191435e9.png的是可溶性物质,固酸比和干物质含量,这些指标都相关性不大。删除掉这些相关性弱的指标后进行最后的相关系数分析,由此可以比较出大约

077fd764d75c6a7d77e305f37ad3207f.png有蛋白质、褐变度、DPPH自由基、葡萄酒总黄酮、黄酮醇、果梗比和果皮质量,这些都与其它指标成相关性。它们的理化指标分布情况如下图1所示。

此时再考虑能否建立一个数学函数来表达它们之间的联系。分析后发现,可以建立回归模型。首先把红葡萄酒的6个成分定义为自变量用SPSS进行主成分分析,分析后然后用MATLAB [2] 对得到的主成份进行拟合得到的函数关系式为:

白葡萄的关系式为:

87cf12e78ac842bb42b057a6e04fac51.png.

b8efdffba38e7c11e54be5d063957e5d.png

Figure 1. Relationship of strong correlation index

图1. 强相关性指标的关系

4.4. 问题(4)的分析与求解

要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,考虑到各理化指标对葡萄酒质量的不同方面的影响不同,因此将葡萄酒质量分为外观,口感,香气,整体5方面单独考虑 [3] 。又由于理化指标较多且相互联系紧密,信息重叠量大,所以先对理化指标用主成分分析法,并按各指标对主成分的载荷大小排序筛选出一些有代表性的指标。对每一方面而言,由于酿酒葡萄和葡萄酒的各理化指标对它的影响方式和影响大小未知,故选用多元线性回归分析法对数据进行拟合,确立影响较大的几个指标,再利用这些指标建立多元线性回归模型,从而得到理化指标对葡萄酒某方面质量的具体函数关系,得到酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

由于理化指标较多且相互联系紧密,信息重叠量大,所以先对理化指标用主成分分析法,并按各指标对主成分的载荷大小排序筛选出一些有代表性的指标。

选取葡萄和葡萄酒的理化指标共38个指标,以27种红葡萄和红葡萄酒的这38个指标的含量值为原始数据,利用SPSS软件求得其主成分矩阵,在SPSS软件中主成分分析分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。在主成分载荷矩阵中对每一主成分下的各指标排序,按大小确定每一主成分主要代表的指标i,从而得到少量的代表性的指标。由此,对上述9个主成分下指标分别排序,取每个主成分下载荷较大的几项构成新的指标,从而筛选出花色苷(酒)、单宁(酒)、总酚(酒)、白藜芦醇(酒)、DPPH(酒)果穗质量、A、干物质含量、pH、可溶性固形物、还原糖、总糖、总黄酮共13个指标。

又由参考文献 [4] 可知,芳香物质中可筛选出乳酸乙酯、己醇、庚醇3个影响葡萄酒香气的指标。综上,将葡萄与葡萄酒理化指标及芳香物质指标简化为16个影响指标。为进一步将这16个主要理化指标对应于葡萄酒不同评分项目得分的主要影响因素,因为第二组评价的分数较为可靠,故我们选择第二组评分为葡萄酒的分数。本文以各评分项目得分为因变量,以16个主要理化指标为自变量,初步建立全体主要理化指标对不同评分项目得分的多元线性回归模型。利用多元线性回归分析中的Sig(显著性水平)大小比较来确定主要影响因素(理化指标)与主要理化指标的对应。

1) 多元线性回归分析分类筛选

下面以口感评价得分的主要影响因素筛选为例进行分析,各自变量

264b596d1b040228ca47933655e42d0a.png

同理可得出葡萄酒的香气质量可由葡萄酒的单宁及葡萄的还原糖、总黄酮和干物质总量评价,其评价模型为

943c194b76411c11e6c8c41200a1c32f.png。平衡/整体质量可由葡萄酒的乳酸乙酯、单宁、白藜芦醇以及葡萄的PH评价。其评价模型为

8b2a9e44a6b9874c918661fc10e87d62.png

Table 6. Results of SPSS analysis

表6. SPSS分析结果表

5. 模型的评价与应用

第(2)问中由于葡萄的各种理化指标繁多,我们采用主成分分析法。主成分分析法作为统计上的一种多元分析方法 [5] ,我们是利用降维思想把主成分多指标转化为少数几个综合指标不仅能消除指标间信息的重叠,而且能根据指标所提供的原始信息生成客观的绩效得分。采用单因素方差分析法,主要缺点是如果假设不成立,只能获得X个相关变量具有差异性,而不能说明是哪几个具有差异,或者差异程度有多少。主成分分析法的主要缺点是当采样数据较多时,协方差阵的计算,求解特征值以及特征向量时的运算量会很大。

文章引用

徐宇明. 葡萄酒评价模型

Wine Evaluation Model[J]. 统计学与应用, 2017, 06(01): 104-110. http://dx.doi.org/10.12677/SA.2017.61012

参考文献 (References)

1. 张磊, 毕靖, 郭莲英. SPSS实用教程[M]. 北京: 人民邮电出版社, 2008.

2. 司守奎, 孙玺菁. 数学建模算法与应用[M]. 北京: 国防工业出版社, 2011.

3. 李记明, 李华. 葡萄酒成分分析与质量研究[J]. 食品与发酵工业, 1994(2): 30-35.

4. 李丽, 梁芳华, 孙爱东. 葡萄酒中的特征性香气成分的形成及其影响因素[J]. 饮料工业, 2009(5): 13-16.

5. 王学民. 应用多元分析[M]. 上海: 上海财经大学出版社, 2009.

相关资源:糖烟茶酒行业管理软件 烟酒进销存店铺销售收银管理系统

来源:Z198

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年2月15日
下一篇 2021年2月15日

相关推荐