CN112697745A - 一种白酒酒精含量测定方法 - Google Patents

一种白酒酒精含量测定方法 Download PDF

Info

Publication number
CN112697745A
CN112697745A CN202110072918.7A CN202110072918A CN112697745A CN 112697745 A CN112697745 A CN 112697745A CN 202110072918 A CN202110072918 A CN 202110072918A CN 112697745 A CN112697745 A CN 112697745A
Authority
CN
China
Prior art keywords
white spirit
alcohol content
sample
data
measuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110072918.7A
Other languages
English (en)
Inventor
林珂
王志强
彭成
张睿挺
马琳
乔宗伟
张强
王洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Wuliangye Yibin Co Ltd
Original Assignee
Xidian University
Wuliangye Yibin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University, Wuliangye Yibin Co Ltd filed Critical Xidian University
Priority to CN202110072918.7A priority Critical patent/CN112697745A/zh
Publication of CN112697745A publication Critical patent/CN112697745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

一种白酒酒精含量测定方法,包括以下步骤:样品光谱采集步骤,配置不同浓度的乙醇溶液,采集不同浓度的乙醇溶液的红外光谱;模型建立步骤,用Scikit‑learn库对采集到的样品的红外光谱数据划分为训练数据集和测试数据集,将训练数据集的数据进行归一化处理后,作为输入变量导入随机森林模型进行训练,得到预测模型;酒精度测定步骤,采集被测白酒的红外光谱,利用预测模型测定被测白酒的酒精度。本发明方法不需样品预处理,操作简单,只需采集被测白酒的光谱图即可,完整利用了所有光谱数据,可实现白酒酒精度的无损、快速、准确检测。

Description

一种白酒酒精含量测定方法
技术领域
本发明涉及酒精含量的测定,特别涉及一种白酒酒精含量的测定方法。
背景技术
我国是白酒消费大国,随着生活水平的提高,人们对酒的品质要求也越来越高。白酒是由原料经发酵、蒸馏而获得,乙醇和水是白酒的主要成分,含量占98%以上,其他香味物质的含量为1%~2%。在白酒中,乙醇的体积百分比越高,白酒的酒精度就越高,酒性也越强烈。测定白酒中乙醇含量对于控制白酒质量具有重要意义。
近红外光谱技术具有无需对样品进行预处理,操作简单、无损耗并且能够同时分析多个组成的特点,已应用到多个分析领域。近年来,近红外光谱技术在白酒测定领域也得到了应用,如专利号为201310034485.1的中国发明专利利用红外光谱鉴定白酒的品质,申请号为200910228700.5的中国发明专利申请利用红外光谱鉴定白酒的香型,申请号为201610421078.X的中国发明专利申请利用近红外光光谱测定白酒浓度,以上方法都是基于红外吸收光谱测定白酒,但以上方法在测定的过程中,有的需要用到恒温箱,或需要进行冷冻干燥处理等,操作过程繁复,而且需要大量白酒样品,成本高,处理数据时还需要进行预处理,并通过人工视觉对特征峰进行比较,主观性影响较大,无法对红外吸收谱的每个特征峰合理利用,消耗时间长,无法实现无损快速检测。
发明内容
本发明的目的是提供一种可以快速测定白酒中酒精含量的方法。
为了实现上述目的,本发明采取如下的技术解决方案:
一种白酒酒精含量测定方法,包括以下步骤:
样品光谱采集步骤,配置不同浓度的乙醇溶液,采集不同浓度的乙醇溶液的红外光谱;
模型建立步骤,用Scikit-learn库对采集到的样品的红外光谱数据划分为训练数据集和测试数据集,将训练数据集的数据进行归一化处理后,作为输入变量导入随机森林模型进行训练,得到预测模型;
酒精度测定步骤,采集被测白酒的红外光谱,利用预测模型测定被测白酒的酒精度。
更具体的,所述样品光谱采集步骤中,所采集的红外光谱是波数在750~4000cm-1范围内的光谱。
更具体的,随机森林模型的决策树的数量为100。
优选的,所述训练数据集为样品的1044cm-1的C-OH键和/或1088cm-1的C-C-O键和/或800cm-1的C-C-O键谱峰波段的红外光谱数据。
由以上可知,本发明基于红外光谱结合随机森林算法对白酒酒精度进行预测,在测定前只需采集一次不同浓度乙醇溶液的红外光谱作为训练集,训练集可以重复使用,在测定真实白酒酒精度时只需要测量微量白酒样品的红外光谱,使用由随机森林模型建立的预测模型即可快速完成预测。本发明无需对样本和光谱数据进行预处理,能够合理利用每一个样本的所有峰位数据,相比于使用其他模型建立的预测模型来进行酒精度的预测,其它模型在训练集上的表现和测试集/真实数据上的表现一般会有差异,如在训练集上表现不错,但是真实数据上表现不好,会因为模型对数据进行过度解读而产生过拟合现象,而随机森林模型在预测过程中有三个随机过程,即产生决策树的样本是随机生成,构建决策树的特征值是随机选取,树产生过程中裂变的时候是选择N个最佳方向中的随机一个裂变的,因此当随机森林产生的树的数目趋近无穷的时候,理论上根据大数定理可以证明训练误差与测试误差是收敛到一起的,从而采用随机森林模型建立的预测模型来预测可以避免其它模型存在的过拟合现象,预测模型具有抗过拟合和抗噪声的特性,本发明方法快速简便,成本低,能够准确快速地对酒精度进行预测。
附图说明
图1为本发明方法的流程图;
图2为乙醇溶液的近红外光谱原始图;
图3为使用随机森林模型和支持向量机模型进行预测的RMSE和准确率结果对比图;
图4为使用随机森林模型对30个验证样本的预测结果与真实值的拟合曲线图;
图5为使用不同的波段的样品图谱训练得到的预测模型进行预测的RMSE对比图。
以下结合附图对本发明的具体实施方式作进一步详细地说明。
具体实施方式
为了让本发明的上述和其它目的、特征及优点能更明显,下文特举本发明实施例,并配合所附图示,做详细说明如下。
本发明基于红外光谱,并结合随机森林模型对白酒的酒精浓度进行测定,图1为本发明的流程图,下面结合图1,对本发明方法进行说明,如图1所示,本发明方法步骤如下:
采集样品光谱;配置不同浓度的乙醇样品,如,配置浓度为10%~100%的乙醇溶液,采集不同浓度的乙醇溶液的红外光谱,每种浓度的溶液可采集多张光谱,样品溶液的红外光谱图用于在后续建模步骤的机器学习中训练优化预测模型;可以使用傅里叶红外光谱仪来采集红外光谱,采集的红外光谱是波数在750~4000cm-1范围内的光谱;采集光谱前可以先采集背景,通过减去背景信息去除噪音和客观因素的干扰;
建立模型;本发明使用基于Python的Scikit-learn库进行建模,随机森林模型中CART决策树的特征空间数据为近红外光谱矩阵X,近红外光谱矩阵X中包括m个自变量:x1,x2,……,xm,自变量x1,x2,……,xm分别表示上一步骤中采集到的第1张、第2张,……,第m张样品光谱图谱,Scikit-learn库对样品集的划分方法是自动划分,从而可以尽可能提高划分的随机性,提高预测模型的预测能力,如对样品集划分时,将样品光谱中75%的样本作为训练数据集,其余25%的样本作为测试数据集,训练数据集D为{(x1,y1),(x2,y2),…,(xn,yn)},n<m,n为训练数据集中样本的数量,y1,y2,…,yn为随机森林模型的输出变量,表示乙醇浓度;将训练数据集的数据进行归一化处理后,作为输入变量导入随机森林模型进行训练,训练后得到预测模型;
测定酒精度;采集被测白酒的红外光谱,利用预测模型对被测样品进行酒精度的测定。
下面以一个具体实施例对本发明方法作进一步的说明:
首先配置样品溶液,用于样品光谱的采集,本实施例配置了浓度分别为10%、20%、30%、40%、50%、60%、70%、80%、90%、100%的乙醇溶液,使用傅里叶红外光谱仪对每种浓度的样品溶液分别采集30张光谱,光谱仪的工作参数为:光谱范围750~4000cm-1,分辨率4cm-1,扫描时间为32s,共采集了300张光谱,将750~4000cm-1光谱范围的数据导出,导出为CSV格式的EXCEL文件;图2为乙醇溶液的近红外光谱原始图;
用Scikit-learn库对采集到的样品光谱数据划分为训练数据集和测试数据集,将训练数据集的数据作为输入变量导入随机森林模型进行训练,为了验证本发明方法的效果,同时将训练数据集的数据作为输入变量导入支持向量机模型进行训练,分别得到由两种模型训练后建立的预测模型。
使用均方根误差(RMSE)对两种预测模型的预测准确率进行评价,均方根误差是预测值与实际值的偏差的平方和样本数的比值最后开根号得到的结果,
Figure BDA0002906542160000041
评价结果如图3所示,图3中的RF表示随机森林模型训练后得到的预测模型,SVM表示支持向量机模型训练后得到的预测模型。从图3可以看出,随机森林预测模型相比支持向量机预测模型,具有更高的准确率和更低的误差值,能够更好的对样品进行预测。
进一步的,通过网格搜索确定随机森林模型的决策树的最优数量为100个。为了使预测模型达到最佳状态,得到较好的预测效果,还可以用均方差评价预测模型的整体性能,对预测模型进行优化。发明人发现,选取不同波数段的样品光谱数据对预测模型进行训练得到的预测模型进行预测时,会得到不同的测定结果和准确率。本实施例中分别使用了不同浓度样品的不同波数段的光谱数据进行训练,得到不同的预测模型,使用这些预测模型进行预测,然后使用均方根误差来评估这些预测模型的性能和鲁棒性。如图5所示,图5是分别使用C-OH和C-C-O波段的光谱数据、O-H波段的光谱数据(乙醇的主要特征峰为这三个波段),以及联合使用C-OH、C-C-O和O-H波段的光谱数据对随机森林模型进行训练后,得到的预测模型进行预测的RMSE对比结果,从图5可以看出,使用1044cm-1的(C-OH)键,1088cm-1和800cm-1的(C-C-O)键的光谱数据训练得到的预测模型可以将均方根误差数值降到最低,因此可将1044cm-1的(C-OH)键,1088cm-1和800cm-1的(C-C-O)键为最佳特征选择区,使用以上谱峰波段的样品光谱数据作为训练数据集,导入随机森林模型中进行训练优化,以得到最优的预测模型。
图4为用优化后的预测模型对样品光谱的测试数据集进行预测的结果图,图4中,横坐标为样品的实际浓度(真实度数),纵坐标为模型预测结果,用黑色X符号作为样本点来表示数据,虚线为最终拟合曲线,样本涵盖10%-100%10个浓度,准确度越高,黑色X符号重合度越高,拟合曲线的理想结果为y=x。从图4可以看出,优化后的预测模型的预测结果和真实度数重合度较高。
用优化后的预测模型对被测白酒样品的酒精浓度进行测定,以验证测定效果,被测白酒样品分别为从市场上购买的酒精度为42°洋河蓝曲、45°牛栏山、45°西风、52°二锅头和56°二锅头,分别采集被测白酒样品750~4000cm-1光谱范围的红外光谱,将红外光谱数据输入优化后的预测模型中进行酒精度测定,测定结果见下表。
样品编号 白酒厂商 标称值 测量值
1 洋河蓝曲 42° 41.9°
2 二锅头 52° 51.1°
3 二锅头 56° 55.9°
4 牛栏山 45° 44.7°
5 西风 45° 44.7°
由以上测定结果可知,本发明方法可以较为准确地测定出白酒的酒精含量。本发明以酒精样品的近红外光谱信息为对象,采用随机森林的回归方法建立预测模型,其均方差和预测值准确率数值均很优异,可以有效的预测白酒中的酒精度。本发明操作简单,省时省力,不需要对样品进行预处理,直接扫描样品的红外谱图在一分钟内就可以获得样品的检测结果。本发明检测成本低,可实现无损快速检测。
以上所述,仅是本发明的较佳实施例而已,并非对本发明做任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (4)

1.一种白酒酒精含量测定方法,其特征在于,包括以下步骤:
样品光谱采集步骤,配置不同浓度的乙醇溶液,采集不同浓度的乙醇溶液的红外光谱;
模型建立步骤,用Scikit-learn库对采集到的样品的红外光谱数据划分为训练数据集和测试数据集,将训练数据集的数据进行归一化处理后,作为输入变量导入随机森林模型进行训练,得到预测模型;
酒精度测定步骤,采集被测白酒的红外光谱,利用预测模型测定被测白酒的酒精度。
2.根据权利要求1所述的白酒酒精含量测定方法,其特征在于:所述样品光谱采集步骤中,所采集的红外光谱是波数在750~4000cm-1范围内的光谱。
3.根据权利要求1所述的白酒酒精含量测定方法,其特征在于:随机森林模型的决策树的数量为100。
4.根据权利要求1所述的白酒酒精含量测定方法,其特征在于:所述训练数据集为样品的1044cm-1的C-OH键和/或1088cm-1的C-C-O键和/或800cm-1的C-C-O键谱峰波段的红外光谱数据。
CN202110072918.7A 2021-01-20 2021-01-20 一种白酒酒精含量测定方法 Pending CN112697745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110072918.7A CN112697745A (zh) 2021-01-20 2021-01-20 一种白酒酒精含量测定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110072918.7A CN112697745A (zh) 2021-01-20 2021-01-20 一种白酒酒精含量测定方法

Publications (1)

Publication Number Publication Date
CN112697745A true CN112697745A (zh) 2021-04-23

Family

ID=75515802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110072918.7A Pending CN112697745A (zh) 2021-01-20 2021-01-20 一种白酒酒精含量测定方法

Country Status (1)

Country Link
CN (1) CN112697745A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114279991A (zh) * 2021-12-30 2022-04-05 宜宾五粮液股份有限公司 白酒品牌鉴定的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105911014A (zh) * 2016-06-15 2016-08-31 安徽有果信息技术服务有限公司 一种白酒浓度的在线检测技术
CN109520962A (zh) * 2017-09-19 2019-03-26 江南大学 一种葡萄酒近红外光谱检测方法
CN110987865A (zh) * 2019-12-13 2020-04-10 齐鲁工业大学 一种基于近红外光谱检测无花果品质的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105911014A (zh) * 2016-06-15 2016-08-31 安徽有果信息技术服务有限公司 一种白酒浓度的在线检测技术
CN109520962A (zh) * 2017-09-19 2019-03-26 江南大学 一种葡萄酒近红外光谱检测方法
CN110987865A (zh) * 2019-12-13 2020-04-10 齐鲁工业大学 一种基于近红外光谱检测无花果品质的方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DIPANJAN SARKAR ET AL: "《Practical Machine Learning with Python》", 22 December 2017 *
JAMES LARGE,ET AL.: "Detecting forged alcohol non-invasively through vibrational spectroscopy and machine learning", 《PACIFIC-ASIA CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 *
余丽娟 等: "傅里叶变换红外光谱法测定白酒中乙醇含量", 《广州化工》 *
彭帮柱 等: "用偏最小二乘法及傅立叶变换近红外光谱快速检测白酒酒精度", 《农业工程学报》 *
李茂刚 等: "近红外光谱结合小波变换-随机森林法快速定量分析甲醇汽油中甲醇含量", 《分析化学》 *
郭涵雅: "基于红外光谱的白酒指纹图谱研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114279991A (zh) * 2021-12-30 2022-04-05 宜宾五粮液股份有限公司 白酒品牌鉴定的方法
CN114279991B (zh) * 2021-12-30 2023-05-12 宜宾五粮液股份有限公司 白酒品牌鉴定的方法

Similar Documents

Publication Publication Date Title
CN107219188B (zh) 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN105630743A (zh) 一种光谱波数的选择方法
CN109253985B (zh) 基于神经网络的近红外光谱识别古筝面板用木材等级的方法
CN103487411A (zh) 一种随机森林算法结合激光诱导击穿光谱识别钢材牌号的方法
CN104020127A (zh) 一种利用近红外光谱快速测量烟叶中无机元素的方法
CN105486655A (zh) 基于红外光谱智能鉴定模型的土壤有机质快速检测方法
CN108844917A (zh) 一种基于显著性假设检验和偏最小二乘法的近红外光谱数据分析方法
CN111693487A (zh) 基于遗传算法和极限学习机的水果糖度检测方法及系统
CN102937575B (zh) 一种基于二次光谱重组的西瓜糖度快速建模方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
CN106950192A (zh) 一种基于近红外光谱分析技术的植物蛋白饮料中主要成分含量快速检测的方法
CN111504942A (zh) 一种提高牛奶中蛋白质预测精度的近红外光谱分析方法
CN115905881B (zh) 黄珍珠分类的方法以及装置、电子设备、存储介质
CN107247033A (zh) 基于快速衰减式淘汰算法和plsda鉴别黄花梨成熟度的方法
CN115993344A (zh) 一种近红外光谱分析仪质量监测分析系统及方法
CN112697745A (zh) 一种白酒酒精含量测定方法
CN118380066A (zh) 基于梯度提升集成学习算法与三维荧光的水质氨氮快速检测方法及设备
CN108169162B (zh) 一种茶园土壤肥力水平的快速评价方法
CN106226263A (zh) 基于红外光谱技术的浓香型白酒基酒等级快速判别方法
CN113252641A (zh) 一种拉曼光谱下基于残差分析的物质鉴别方法
CN111912823A (zh) 一种多成分农药残留荧光检测分析方法
CN114354666B (zh) 基于波长频次选择的土壤重金属光谱特征提取、优化方法
CN113049526B (zh) 一种基于太赫兹衰减全反射的玉米种子水分含量测定方法
CN113418889B (zh) 一种基于深度学习的干菜水分含量和菌落总数的实时检测方法
CN114414524A (zh) 快速检测航空煤油性质的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210423

RJ01 Rejection of invention patent application after publication