CN113406251A - 预测白酒储存年份的方法 - Google Patents

预测白酒储存年份的方法 Download PDF

Info

Publication number
CN113406251A
CN113406251A CN202110724822.4A CN202110724822A CN113406251A CN 113406251 A CN113406251 A CN 113406251A CN 202110724822 A CN202110724822 A CN 202110724822A CN 113406251 A CN113406251 A CN 113406251A
Authority
CN
China
Prior art keywords
white spirit
storage
predicting
sample
ethyl
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110724822.4A
Other languages
English (en)
Other versions
CN113406251B (zh
Inventor
许正宏
张晓娟
翟伟绩
陆震鸣
柴丽娟
史劲松
王松涛
沈才洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Luzhou Pinchuang Technology Co Ltd
Original Assignee
Jiangnan University
Luzhou Pinchuang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University, Luzhou Pinchuang Technology Co Ltd filed Critical Jiangnan University
Priority to CN202110724822.4A priority Critical patent/CN113406251B/zh
Publication of CN113406251A publication Critical patent/CN113406251A/zh
Application granted granted Critical
Publication of CN113406251B publication Critical patent/CN113406251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8686Fingerprinting, e.g. without prior knowledge of the sample components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Library & Information Science (AREA)
  • Engineering & Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明涉及白酒年份预测领域,具体涉及一种预测白酒储存年份的方法,实现了对白酒储存年份快速准确地预测。本发明预测白酒储存年份的方法,包括:采用GC‑MS获取不同储存时间白酒的挥发性风味组分指纹图谱;然后通过极端随机森林回归以及sklearn特征在指纹图谱中筛选出建模特征;再将建模特征作为XGboost回归模型的特征建立预测模型;最后通过预测模型预测白酒储存年份。本发明适用于快速准确地预测白酒储存年份。

Description

预测白酒储存年份的方法
技术领域
本发明涉及白酒年份预测领域,具体涉及一种预测白酒储存年份的方法。
背景技术
酒往往是越陈越香的,针对这一特点,如今市场上出现了许多“年份酒”,价格也相对昂贵。可是目前不乏一些企业存在年份标注较随意的情况,增加了年份酒市场的混乱程度,影响了白酒行业的形象。因此消费者强烈呼吁加强对白酒年份酒市场规范,而酒企也在加大投入研发力量,以期建立鉴别年份的方法,明正视听。在这种市场需求下,解析年份酒的高品质特征,用科学的语言和数据展示年份酒的产品品质,建立稳定的、操作性高的年份酒鉴别方法是如今白酒行业势必考虑的问题。
在白酒年份酒监管鉴别技术研究领域,目前尚无适用的国家标准,研究人员提出的主要鉴别技术包括:徐占成提出了白酒年份鉴别挥发系数法,通过构建白酒年份酒存储年限与挥发物含量间的函数关系,实现白酒年份鉴定。杨涛等提出,利用年份酒中Al、Fe、Cu等金属离子在不同年份酒中含量变化关系,利用酒体黏度与白酒贮存时间关系,利用白酒中微量共轭不饱和双键分子与年份酒贮存时间关系,多个方面鉴别年份酒。秦人伟提出利用碳-14衰变率与年份酒贮存时间关系,鉴别确定年份酒生产年份。以上研究方法,为白酒年份酒鉴别提供了多种鉴别方案,不过这些方法,或需要较为专业的大型仪器设备,或分析步骤较为繁琐、分析时间较长。
此外,白酒是一个复杂的系统,挥发组分受多种因素的影响,因此,老化的信息经常淹没在嘈杂的背景中。目前白酒年份鉴定常用的红外光谱、荧光光谱、拉曼光谱或电化学方法,通过整个挥发组分的数据集来判别白酒年龄,较难剔除噪声的干扰,并且检测准确度不高。因此,对特定标记化合物的科学统计分析、量化关联仍存在较大研究空间。目前,白酒年份酒市场日益庞大,待检样品数量日益增多,如何发展简单、快速准确的检测鉴别技术,成为新的迫切需求。
发明内容
本发明的目的是提供一种预测白酒储存年份的方法,实现了对白酒储存年份快速准确地预测。
本发明采取如下技术方案实现上述目的,预测白酒储存年份的方法,包括:
步骤1、采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱;
步骤2、通过极端随机森林回归以及sklearn特征在指纹图谱中筛选出建模特征;
步骤3、将建模特征作为XGboost回归模型的特征建立预测模型;
步骤4、通过预测模型预测白酒储存年份。
进一步的是,步骤1中,采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱的具体方法包括:
步骤101、以不同储存时间的白酒基酒为待测样品,采用超纯水将白酒样品酒精度降度至设置值以下,并同时加入氯化钠和内标物,得到待测样;
步骤102、使用顶空固相微萃取方法,通过萃取头从待测样中顶空萃取挥发性化合物;
步骤103、萃取头在进样口解析吸附后,采用GC-MS采集挥发性成分指纹图谱信息,统计相应数据,得到不同储存时间白酒的挥发性风味组分指纹图谱。
进一步的是,步骤101中,得到待测样的具体方法包括:
以不同陈酿时间的白酒为待测样品,将白酒样品降度至5~10%vol,取4~8mL置于进样瓶中,加入0.2g/mL氯化钠至溶液饱和,并加入10μL内标物,得待测样;其中所述内标物为叔戊醇;所述内标物的浓度为8.05g/L。
进一步的是,步骤102中,顶空固相微萃取的参数为:40~60℃平衡1~25min,提取时间为5~180min。
进一步的是,步骤103中,GC分析条件为:使用60m×0.25mm×0.50μm TG-WAXMS毛细管气相色谱柱,载气为高纯氦气,流速为1.0mL/min,分流比:20:1,程序升温为:起始50℃维持2min,以3℃/min升温至145℃,再以15℃/min升温至230℃并保持3min,进样口温度保持在250℃。
步骤103中,MS分析条件为:传输线温度200℃,离子源温度260℃,扫描质量范围m/z:33~350amu,电离方式:EI+;电子能量:70eV。
进一步的是,步骤2中,通过极端随机森林回归以及sklearn特征筛选在指纹图谱中筛选出建模特征的具体方法包括:
步骤201、按照设置比例将统计的相应数据划分为测试集与训练集;
步骤202、对训练集采用极端随机森林回归模型,筛选对白酒储存年份回归分析贡献度前N1-N2的特征,N1、N2为正整数,N1<N2;
步骤203、利用sklearn特征选择模块中的F_regression和mutual_info_regression筛选与白酒储存年份最相关的前N1-N2的特征;
步骤204、获取步骤202与步骤203筛选出的交集特征,交集特征作为建模特征。
进一步的是,步骤3中,预测模型的模型评估指标为R2,其中有效特征为步骤202与步骤203筛选出的前N3个特征中共有的特征,N3为正整数,N1<N3<N2。
进一步的是,步骤4中,通过预测模型预测白酒储存年份的具体方法包括:
将步骤202与步骤203筛选出的前N3个特征进行韦恩分析,并以其中共有的N4种特征作为建模特征建立预测模,并将预测模型应用到测试集中进行预测,N4为正整数,N4<N3。
进一步的是,建模特征包括反油酸乙酯、亚油酸乙酯、十一醇、乙酸2-苯乙酯、1-亚甲基-1H-茚、丁酸、3-己烯酸乙酯、己酸、异丁醛、十五酸乙酯、丁二酸二乙酯、庚酸3-甲基丁酯、十六酸乙酯、植物酮、9-十六碳烯酸乙酯、辛酸辛酯、十三酸乙酯、L(-)-乳酸乙酯、己酸-2-苯乙酯、3-甲基丁酸辛酯、反式-4-癸酸乙酯、庚酸、糠醛、2,4-二叔丁基苯酚、戊酸丁酯、2-十五烷酮、乙酸正丙酯、丁酸辛酯、己酸1-甲基己基酯、十一烷酸乙酯、十四酸乙酯以及辛酸3-甲基丁酯。
本发明处理步骤简单,操作方便,适用于大规模样品的处理和筛选,气相色谱质谱联用仪(GC-MS)技术稳定成熟,仪器分析的精度较高,样品之间的误差小,重复性高,结果可靠,分析通量大;利用极端随机森林回归、sklearn特征筛选有效的特征建模,成功实现特征空间维数的压缩,有效、可靠地提高了建模质量;XGboost算法具有允许缺失值为缺失值、支持多线程计算、内部的正则化可有效防止过拟合等优势,可显著提高鉴定白酒储存年份的准确性。
附图说明
图1是本发明预测白酒储存年份的方法流程图。
图2是本发明各取59个特征的韦恩分析实施例。
图3是将预测模型应用到测试集中进行预测的实施例示意图。
图4训练集上筛选特征建模前后的准确率对比示意图。
图5是测试集上筛选特征建模前后模型分类混淆矩阵的示意图。
具体实施方式
本发明预测白酒储存年份的方法如图1,包括:
步骤S1、采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱;
步骤S2、通过极端随机森林回归以及sklearn特征在指纹图谱中筛选出建模特征;
步骤S3、将建模特征作为XGboost回归模型的特征建立预测模型;
步骤S4、通过预测模型预测白酒储存年份。
步骤S1中,采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱的具体方法包括:
步骤101、以不同储存时间的白酒基酒为待测样品,采用超纯水将白酒样品酒精度降度至设置值以下,并同时加入氯化钠和内标物,得到待测样;
步骤102、使用顶空固相微萃取方法,通过萃取头从待测样中顶空萃取挥发性化合物;
步骤103、萃取头在进样口解析吸附后,采用GC-MS采集挥发性成分指纹图谱信息,统计相应数据,得到不同储存时间白酒的挥发性风味组分指纹图谱。
步骤101中,得到待测样的具体方法包括:
以不同陈酿时间的白酒为待测样品,将白酒样品降度至5~10%vol,取4~8mL置于进样瓶中,加入0.2g/mL氯化钠至溶液饱和,并加入10μL内标物,得待测样;其中所述内标物为叔戊醇;所述内标物的浓度为8.05g/L;叔戊醇性质稳定,不易发生不必要的反应影响结果,同时,不会因为存放发生变化,是合适的内标选择,且理化性质和白酒中易挥发组分相近,能够降低误差。
步骤102中,顶空固相微萃取的参数为:40~60℃平衡1~25min,提取时间为5~180min。
步骤103中,GC分析条件为:使用60m×0.25mm×0.50μm TG-WAXMS毛细管气相色谱柱,载气为高纯氦气,流速为1.0mL/min,分流比:20:1,程序升温为:起始50℃维持2min,以3℃/min升温至145℃,再以15℃/min升温至230℃并保持3min,进样口温度保持在250℃。
步骤103中,MS分析条件为:传输线温度200℃,离子源温度260℃,扫描质量范围m/z:33~350amu,电离方式:EI+;电子能量:70eV。
步骤S2中,通过极端随机森林回归以及sklearn特征筛选在指纹图谱中筛选出建模特征的具体方法包括:
步骤201、按照设置比例将统计的相应数据划分为测试集与训练集;
步骤202、对训练集采用极端随机森林回归模型,筛选对白酒储存年份回归分析贡献度前N1-N2的特征,N1、N2为正整数,N1<N2;
步骤203、利用sklearn特征选择模块中的F_regression和mutual_info_regression筛选与白酒储存年份最相关的前N1-N2的特征;
步骤204、获取步骤202与步骤203筛选出的交集特征,交集特征作为建模特征。
其中根据极端随机森林回归算法得出的特征变量重要性排序见表2;
根据sklearn特征选择模块中的f_regression得出的特征变量重要性排序见表3;
根据sklearn特征选择模块中的mutual_info_regression得出的特征变量重要性排序见表4。
步骤S3中,预测模型的模型评估指标为R2,其中有效特征为步骤202与步骤203筛选出的前N3个特征中共有的特征,N3为正整数,N1<N3<N2。
步骤S4中,通过预测模型预测白酒储存年份的具体方法包括:
将步骤202与步骤203筛选出的前N3个特征进行韦恩分析,并以其中共有的N4种特征作为建模特征建立预测模,并将预测模型应用到测试集中进行预测,N4为正整数,N4<N3。
建模特征包括反油酸乙酯、亚油酸乙酯、十一醇、乙酸2-苯乙酯、1-亚甲基-1H-茚、丁酸、3-己烯酸乙酯、己酸、异丁醛、十五酸乙酯、丁二酸二乙酯、庚酸3-甲基丁酯、十六酸乙酯、植物酮、9-十六碳烯酸乙酯、辛酸辛酯、十三酸乙酯、L(-)-乳酸乙酯、己酸-2-苯乙酯、3-甲基丁酸辛酯、反式-4-癸酸乙酯、庚酸、糠醛、2,4-二叔丁基苯酚、戊酸丁酯、2-十五烷酮、乙酸正丙酯、丁酸辛酯、己酸1-甲基己基酯、十一烷酸乙酯、十四酸乙酯以及辛酸3-甲基丁酯,当以上述32种化合物建模,通过次模型对测试集的预测结果与实际值的R2可达至0.987。
实施例1
本实施例预测白酒储存年份的方法包括:
A、白酒样品制备:将7个生产批次的浓香型白酒基酒降度至52%vol并过滤,每个批次分装至10个样品瓶,并依次储存0个月、2个月、4个月、6个月、9个月、12个月、15个月、17个月、21个月和24个月,7个批次不同储存时间的样本点共计70个;
B、萃取样品制备:以不同储存时间的白酒基酒为待测样品,采用超纯水将白酒样品酒精度降度至10%vol以下,并同时加入氯化钠和内标物,得待测样;
C、挥发性化合物萃取:使用顶空固相微萃取方法,通过萃取头从步骤B所得待测样中顶空萃取挥发性化合物;
D、指纹图谱采集:萃取头在进样口解析附后,采用GC-MS采集挥发性成分指纹图谱信息,统计相应数据;
气相色谱分(GC)析条件:
使用60m×0.25mm×0.50μm TG-WAXMS毛细管气相色谱柱,载气为高纯氦气,流速为1.0mL/min,分流比:20:1,程序升温为:起始50℃维持2min,以3℃/min升温至145℃,再以15℃/min升温至230℃并保持3min,进样口温度保持在250℃。
质谱(MS)分析条件:
传输线温度200℃,离子源温度260℃,扫描质量范围m/z:33~350amu,电离方式:EI+;电子能量:70eV。
E、以8:2的比例将数据集划分为测试集和训练集;
F、在测试集上,采用极端随机森林回归算法,收集对白酒储存年份回归分析贡献度前25-80特征(第一种特征筛选方法);利用sklearn特征选择模块中的F_regression和mutual_info_regression筛选与白酒储存年份最相关的前25-80重要特征的交集,(第二种特征筛选方法);取所述两种特征筛选方法得出的交集特征作为XGBoost回归模型的特征建立模型,模型评估指标为R2,最终最有效的建模特征为三种筛选方法前59个特征中共有的特征;
其中将两种特征筛选方法得出的前25-80重要特征的交集,按照8:2划分训练集和测试集后,对训练集进行10折交叉验证的数据见表5。
G、将步骤F中两种特征筛选方法前59个特征进行韦恩分析,并以其中的交集作为建模特征建模,应用到测试集中进行预测。其中韦恩分析图如图2,特征分别来自ExtraTrees(极端随机树极端随机树)回归,sklearn特征选择模块中的F_regression和mutual_info_regression筛选出的特征。
将在训练集上表现较好的模型应用到测试集上进行预测的分析示意图如图3,图3中横坐标是真实值,纵坐标是预测值,MSE是均方差,值越小说明拟合程度越高,如果拟合曲线是y=x的话说明预测值和实际值完全相同,越接近这个拟合曲线说明拟合程度越高。
图4训练集上筛选特征建模前后的准确率对比示意图,可以看出优化特征对应的准确率比全特征对应的准确率高出很多。
经本发明方法筛选后,最有效的建模特征为反油酸乙酯、甲酸乙酯、己酸丁酯等32种化合物(见表1),并且利用此模型对测试集的预测结果与实际值的R2可达至0.987。
表1两种筛选方法筛选共有化合物
Figure BDA0003138152210000061
Figure BDA0003138152210000071
表2根据极端随机森林回归算法得出的特征变量重要性排序
Figure BDA0003138152210000081
Figure BDA0003138152210000091
Figure BDA0003138152210000101
表3根据sklearn特征选择模块中的f_regression得出的特征变量重要性排序
Figure BDA0003138152210000102
Figure BDA0003138152210000111
Figure BDA0003138152210000121
表4根据sklearn特征选择模块中的mutual_info_regression得出的特征变量重要性排序
Figure BDA0003138152210000122
Figure BDA0003138152210000131
Figure BDA0003138152210000141
表5前25-80重要特征的交集,按照8:2划分训练集和测试集后,对训练集进行10折交叉验证的结果
Figure BDA0003138152210000142
Figure BDA0003138152210000151
实施例2
本实施例预测白酒储存年份的方法包括:
A、取5个品牌的浓香型瓶装白酒,根据出厂标签分为4组:0~1年、1~2年、2~3年和3~4年,每个年份1个样品,共20个样品,每个样品平行测定6次。其余分析均与实施例1一致;
B-D、获得白酒挥发性风味物质指纹图谱的方法与实施例一的步骤B到步骤D一致;
E、以8:2的比例将数据集划分为测试集和训练集;
F、在测试集上,采用极端随机森林分类模型,收集对白酒储存年份分类分析贡献度前25-80特征(第一种特征筛选方法);利用sklearn特征选择模块中的F_classif和mutual_info_classif筛选与白酒储存年份分类最相关的前25-80特征(第二种特征筛选方法);取两种特征筛选方法得出的交集特征作为XGBoost分类模型的特征建立模型,模型评估指标为准确率(accuracy)。
图5是测试集上筛选特征建模前后模型分类混淆矩阵的示意图,图5中a是全特征建模,b是优化特征建模,其中数字体现的是该类别中样品的个数,例如1表示真实值和预测值相同类别有1个,2表示真实值和预测值相同的类别有2个,如果都在对角线上说明预测和实际的类别是一致的,b图中,对角线上的数字比a中多,说明优化特征建模相对于全特征建模的分类效果要好。
经过特征筛选后,分类模型的准确率获得了大幅提高。并且应用到测试集上的分类效果较未经特征筛选前的分类模型,同样有显著的提升。
综上所述,本发明实现了对白酒储存年份快速准确地预测。

Claims (10)

1.预测白酒储存年份的方法,其特征在于,包括:
步骤1、采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱;
步骤2、通过极端随机森林回归以及sklearn特征在指纹图谱中筛选出建模特征;
步骤3、将建模特征作为XGboost回归模型的特征建立预测模型;
步骤4、通过预测模型预测白酒储存年份。
2.根据权利要求1所述的预测白酒储存年份的方法,其特征在于,步骤1中,采用GC-MS获取不同储存时间白酒的挥发性风味组分指纹图谱的具体方法包括:
步骤101、以不同储存时间的白酒基酒为待测样品,采用超纯水将白酒样品酒精度降度至设置值以下,并同时加入氯化钠和内标物,得到待测样;
步骤102、使用顶空固相微萃取方法,通过萃取头从待测样中顶空萃取挥发性化合物;
步骤103、萃取头在进样口解析吸附后,采用GC-MS采集挥发性成分指纹图谱信息,统计相应数据,得到不同储存时间白酒的挥发性风味组分指纹图谱。
3.根据权利要求2所述的预测白酒储存年份的方法,其特征在于,步骤101中,得到待测样的具体方法包括:
以不同陈酿时间的白酒为待测样品,将白酒样品降度至5~10%vol,取4~8mL置于进样瓶中,加入0.2g/mL氯化钠至溶液饱和,并加入10μL内标物,得待测样;其中所述内标物为叔戊醇;所述内标物的浓度为8.05g/L。
4.根据权利要求2所述的预测白酒储存年份的方法,其特征在于,步骤102中,顶空固相微萃取的参数为:40~60℃平衡1~25min,提取时间为5~180min。
5.根据权利要求2所述的预测白酒储存年份的方法,其特征在于,步骤103中,GC分析条件为:使用60m×0.25mm×0.50μmTG-WAXMS毛细管气相色谱柱,载气为高纯氦气,流速为1.0mL/min,分流比:20:1,程序升温为:起始50℃维持2min,以3℃/min升温至145℃,再以15℃/min升温至230℃并保持3min,进样口温度保持在250℃。
6.根据权利要求5所述的预测白酒储存年份的方法,其特征在于,步骤103中,MS分析条件为:传输线温度200℃,离子源温度260℃,扫描质量范围m/z:33~350amu,电离方式:EI+;电子能量:70eV。
7.根据权利要求2所述的预测白酒储存年份的方法,其特征在于,步骤2中,通过极端随机森林回归以及sklearn特征筛选在指纹图谱中筛选出建模特征的具体方法包括:
步骤201、按照设置比例将统计的相应数据划分为测试集与训练集;
步骤202、对训练集采用极端随机森林回归模型,筛选对白酒储存年份回归分析贡献度前N1-N2的特征,N1、N2为正整数,N1<N2;
步骤203、利用sklearn特征选择模块中的F_regression和mutual_info_regression筛选与白酒储存年份最相关的前N1-N2的特征;
步骤204、获取步骤202与步骤203筛选出的交集特征,交集特征作为建模特征。
8.根据权利要求7所述的预测白酒储存年份的方法,其特征在于,步骤3中,预测模型的模型评估指标为R2,其中有效特征为步骤202与步骤203筛选出的前N3个特征中共有的特征,N3为正整数,N1<N3<N2。
9.根据权利要求8所述的预测白酒储存年份的方法,其特征在于,步骤4中,通过预测模型预测白酒储存年份的具体方法包括:
将步骤202与步骤203筛选出的前N3个特征进行韦恩分析,并以其中共有的N4种特征作为建模特征建立预测模,并将预测模型应用到测试集中进行预测,N4为正整数,N4<N3。
10.根据权利要求9所述的预测白酒储存年份的方法,其特征在于,建模特征包括:反油酸乙酯、亚油酸乙酯、十一醇、乙酸2-苯乙酯、1-亚甲基-1H-茚、丁酸、3-己烯酸乙酯、己酸、异丁醛、十五酸乙酯、丁二酸二乙酯、庚酸3-甲基丁酯、十六酸乙酯、植物酮、9-十六碳烯酸乙酯、辛酸辛酯、十三酸乙酯、L(-)-乳酸乙酯、己酸-2-苯乙酯、3-甲基丁酸辛酯、反式-4-癸酸乙酯、庚酸、糠醛、2,4-二叔丁基苯酚、戊酸丁酯、2-十五烷酮、乙酸正丙酯、丁酸辛酯、己酸1-甲基己基酯、十一烷酸乙酯、十四酸乙酯以及辛酸3-甲基丁酯。
CN202110724822.4A 2021-06-29 2021-06-29 预测白酒储存年份的方法 Active CN113406251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110724822.4A CN113406251B (zh) 2021-06-29 2021-06-29 预测白酒储存年份的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110724822.4A CN113406251B (zh) 2021-06-29 2021-06-29 预测白酒储存年份的方法

Publications (2)

Publication Number Publication Date
CN113406251A true CN113406251A (zh) 2021-09-17
CN113406251B CN113406251B (zh) 2022-05-17

Family

ID=77680011

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110724822.4A Active CN113406251B (zh) 2021-06-29 2021-06-29 预测白酒储存年份的方法

Country Status (1)

Country Link
CN (1) CN113406251B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113984846A (zh) * 2021-10-25 2022-01-28 上海来伊份股份有限公司 基于气味指纹图谱预测调味料关键挥发成分的方法及系统
CN114924169A (zh) * 2022-05-09 2022-08-19 重庆大学 基于随机森林的油纸绝缘老化诊断方法及热化罐
CN115078573A (zh) * 2022-06-09 2022-09-20 江苏洋河酒厂股份有限公司 预测绵柔型白酒基酒质量等级的方法
CN115598276A (zh) * 2022-10-27 2023-01-13 江南大学(Cn) 基于挥发性化合物含量及其比例判断酱香型白酒质量等级的方法
CN115691691A (zh) * 2022-12-03 2023-02-03 湖南大学 一种基于机器学习的新污染物反应活性预测方法
WO2023040391A1 (zh) * 2021-09-18 2023-03-23 天地壹号饮料股份有限公司 一种基于气相色谱法的测定酒类中乙醇含量的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240090A (zh) * 2018-11-08 2019-01-18 浙江大学 一种基于时间差分的增量学习xgboost模型的自适应软测量建模方法
US20200309746A1 (en) * 2019-03-29 2020-10-01 Shimadzu Corporation Method for determining food-product quality and food-product quality determination device
WO2021028453A1 (en) * 2019-08-14 2021-02-18 F. Hoffmann-La Roche Ag Method for determining process variables in cell cultivation processes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240090A (zh) * 2018-11-08 2019-01-18 浙江大学 一种基于时间差分的增量学习xgboost模型的自适应软测量建模方法
US20200309746A1 (en) * 2019-03-29 2020-10-01 Shimadzu Corporation Method for determining food-product quality and food-product quality determination device
WO2021028453A1 (en) * 2019-08-14 2021-02-18 F. Hoffmann-La Roche Ag Method for determining process variables in cell cultivation processes

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
CHAO YE 等: "A new red wine prediction framework using machine learning", 《JOURNAL OF PHYSICS: CONFERENCE SERIES》 *
KATHERINE A.OVERMYER 等: "Large-Scale Multi-omic Analysis of COVID-19 Severity", 《CELL SYSTEMS》 *
M.L. XU 等: "Quality assessment of Chinese liquor with different ages and prediction analysis based on gas chromatography and electronic nose", 《SCIENTIFIC REPORTS》 *
XIAO-JUAN ZHANG 等: "Identification of age-markers based on profiling of Baijiu volatiles over a two-year maturation period: Case study of Lu-flavor Baijiu", 《LWT》 *
万顺 等: "多粮浓香型白酒生产数据挖掘及分析研究", 《酿酒科技》 *
周孟然 等: "LIF技术和XGBoost算法在假酒识别中的应用", 《应用激光》 *
宋普 等: "白兰地酒龄模型的构建", 《食品科学》 *
拱健婷 等: "基于电子鼻气味指纹图谱与XGBoost算法鉴别姜黄属中药", 《中国中药杂志》 *
马燕红 等: "清香型白酒酒龄鉴别的方法研究", 《食品科学》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023040391A1 (zh) * 2021-09-18 2023-03-23 天地壹号饮料股份有限公司 一种基于气相色谱法的测定酒类中乙醇含量的方法
CN113984846A (zh) * 2021-10-25 2022-01-28 上海来伊份股份有限公司 基于气味指纹图谱预测调味料关键挥发成分的方法及系统
CN113984846B (zh) * 2021-10-25 2024-04-02 上海来伊份股份有限公司 基于气味指纹图谱预测调味料关键挥发成分的方法及系统
CN114924169A (zh) * 2022-05-09 2022-08-19 重庆大学 基于随机森林的油纸绝缘老化诊断方法及热化罐
CN115078573A (zh) * 2022-06-09 2022-09-20 江苏洋河酒厂股份有限公司 预测绵柔型白酒基酒质量等级的方法
CN115598276A (zh) * 2022-10-27 2023-01-13 江南大学(Cn) 基于挥发性化合物含量及其比例判断酱香型白酒质量等级的方法
CN115691691A (zh) * 2022-12-03 2023-02-03 湖南大学 一种基于机器学习的新污染物反应活性预测方法

Also Published As

Publication number Publication date
CN113406251B (zh) 2022-05-17

Similar Documents

Publication Publication Date Title
CN113406251B (zh) 预测白酒储存年份的方法
Jia et al. Foodomics analysis of natural aging and gamma irradiation maturation in Chinese distilled Baijiu by UPLC-Orbitrap-MS/MS
Alañón et al. Wine science in the metabolomics era
Howard et al. Validation of a solid-phase microextraction method for headspace analysis of wine aroma components
CN113203803B (zh) 多元线性逐步回归鉴别白酒储存时间的方法
CN109781918B (zh) 一种不同企业生产的黄酒的气相离子迁移谱鉴别方法
CN108445094A (zh) 气相离子迁移谱快速鉴别黄酒酒龄的建立方法以及应用
CN111398470A (zh) 一种基于香气物质指纹图谱的gc-ims梨果产地区分方法
Martins et al. An ancient winemaking technology: Exploring the volatile composition of amphora wines
CN111521722A (zh) 一种馥郁香型成品白酒瓶贮年份的鉴定方法
CN111060642A (zh) 一种对同品种不同产地烟叶分类鉴别的方法
CN113917014A (zh) 一种基于gc-ims指纹图谱快速区分茉莉香葡萄产地的方法
CN104820052A (zh) 一种快速预警烟草及烟草制品霉变的方法
CN113533549A (zh) 白酒口味物质鉴定分析系统
Roullier-Gall et al. Chemical messages from an ancient buried bottle: metabolomics for wine archeochemistry
Moyano et al. Optimization and validation of a DHS-TD-GC-MS method to wineomics studies
Karabagias et al. Volatilome of white wines as an indicator of authenticity and adulteration control using statistical analysis
CN116110503A (zh) 基于gc-ms和机器学习模型的白酒陈酿时间检测方法
CN113075316B (zh) 一种靖西大果山楂酒窖藏时间的鉴定方法
CN113237977A (zh) 白酒挥发性风味物质的检测方法
CN110927269A (zh) 定量检测酒中dl-2-羟基-4-甲基戊酸乙酯的方法
CN110514757A (zh) 一种快速解析白酒中挥发性风味组分的方法
Tsapou et al. Volatile Profile in Greek Grape Marc Spirits with HS-SPME-GC-MS and Chemometrics: Evaluation of Terroir Impact
Haggerty et al. Optimisation and validation of a high‐throughput semi‐quantitative solid‐phase microextraction method for analysis of fermentation aroma compounds in metabolomic screening studies of wines
CN113917013A (zh) 一种内标法测定水果蒸馏酒中甲醇和5种高级醇的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant