CN112001129B - 一种基于支持向量机的酱香型白酒酿造工艺的判别方法 - Google Patents
一种基于支持向量机的酱香型白酒酿造工艺的判别方法 Download PDFInfo
- Publication number
- CN112001129B CN112001129B CN202010976162.4A CN202010976162A CN112001129B CN 112001129 B CN112001129 B CN 112001129B CN 202010976162 A CN202010976162 A CN 202010976162A CN 112001129 B CN112001129 B CN 112001129B
- Authority
- CN
- China
- Prior art keywords
- maotai
- support vector
- vector machine
- brewing process
- flavor liquor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000000796 flavoring agent Substances 0.000 title claims abstract description 48
- 238000013124 brewing process Methods 0.000 title claims abstract description 25
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 11
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 11
- 238000001228 spectrum Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 238000009499 grossing Methods 0.000 claims description 7
- 239000013078 crystal Substances 0.000 claims description 5
- 238000011282 treatment Methods 0.000 claims description 5
- 238000005102 attenuated total reflection Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000004566 IR spectroscopy Methods 0.000 claims description 2
- 238000004483 ATR-FTIR spectroscopy Methods 0.000 claims 1
- 235000014101 wine Nutrition 0.000 abstract description 37
- 235000019634 flavors Nutrition 0.000 abstract description 3
- 244000068988 Glycine max Species 0.000 abstract description 2
- 235000010469 Glycine max Nutrition 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 abstract description 2
- 239000004576 sand Substances 0.000 description 11
- 235000013555 soy sauce Nutrition 0.000 description 8
- 235000019441 ethanol Nutrition 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 235000013339 cereals Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 235000020068 maotai Nutrition 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 235000020097 white wine Nutrition 0.000 description 4
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 3
- BTANRVKWQNVYAZ-UHFFFAOYSA-N butan-2-ol Chemical compound CCC(C)O BTANRVKWQNVYAZ-UHFFFAOYSA-N 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000003205 fragrance Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- LRHPLDYGYMQRHN-UHFFFAOYSA-N N-Butanol Chemical compound CCCCO LRHPLDYGYMQRHN-UHFFFAOYSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000855 fermentation Methods 0.000 description 2
- 230000004151 fermentation Effects 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- ZXEKIIBDNHEJCQ-UHFFFAOYSA-N isobutanol Chemical compound CC(C)CO ZXEKIIBDNHEJCQ-UHFFFAOYSA-N 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- BDERNNFJNOPAEC-UHFFFAOYSA-N propan-1-ol Chemical compound CCCO BDERNNFJNOPAEC-UHFFFAOYSA-N 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 206010013911 Dysgeusia Diseases 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 241000609666 Tuber aestivum Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000001760 fusel oil Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000010025 steaming Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Manufacturing & Machinery (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本申请公开了白酒判别技术领域中的一种基于支持向量机的酱香型白酒酿造工艺的判别方法,包括对酱香型白酒进行红外光谱分析,根据不同酿造工艺下酱香型白酒的差异,对红外光谱图集X进行处理,并通过支持向量机的方法建立聚类模型,此模型为不同酿造工艺的判别模型,对未知样品进行处理,得到其酿造工艺。本发明可区分正宗大曲酱香与非正宗大曲酱香酒,判别正确率达94%以上,且判别仅需要10min,时间短,检测成本低,便于推广应用。
Description
技术领域
本发明涉及白酒判别技术领域,具体涉及一种基于支持向量机的酱香型白酒酿造工艺的判别方法。
背景技术
酱香型白酒,亦称茅香型,是我国白酒主要香型之一,酒体风格上呈现“酱香突出、幽雅细腻、酒体醇厚、回味悠长,空杯留香持久”的特点。酱香型白酒是复杂物系的典型代表,组分复杂,且不同酿造工艺的白酒品质、价格差异大。常见的酱香型白酒可以分为坤沙酒、碎沙酒、翻沙酒和串沙酒。坤沙酒,即“捆子酒”,是传统的酱香型白酒工艺,也就是常说的正宗大曲酱香白酒。将破碎率为15%-20%的本地红缨子糯高粱加大曲严格按照“一二九八七”工艺(一年一次生产周期,两次投料,九次蒸煮,八次发酵,七次取酒),再经过三至五年的储存,勾调,出厂。这种工艺出酒率低,口感细腻、丰满,是最好的酱香型白酒工艺。
非正宗大曲酱香酒(二代酒)包括碎沙酒、翻沙酒、麸曲酱酒、混合酱酒,以及串蒸酱酒等等。它们不是严格按照一二九八七工艺生产的,其中,碎沙酒是将高粱完全粉碎,加大曲、糖化酶,烤两到三次将所有的酒全部取完;翻沙酒,是坤沙酒取完七次后剩下的糟醅,再加入新的粮食进去,一次性取完所有的酒;串沙酒,是指用坤沙酒酿造工艺第9次蒸煮后丢弃的酒糟加入食用酒精蒸馏后的产品,工艺比较随意。
不同的酱香型白酒酿造工艺的差异会直接影响产品的质量,加之其时间成本、物料成本差异巨大,进而反映在产品品质与售价上也是天壤之别。市场上有很多商家以碎沙酒、翻沙酒等非正宗大曲酱香白酒冒充正宗的大曲酱香白酒牟利,导致酱香型白酒市场上存在着不规范现象。
目前,酱香型白酒市场上对于未知酒样的工艺判别,主要以感官评价来判别,但是感官评价存在主观性强、模糊不确定的因素,且受限于评价人的经验。现有技术也有使用气相色谱法(GC)来对白酒成分进行分析的,但是该方法主要是注重于白酒微观化学成分的研究,如果要依此来判别正宗大曲酱香(坤沙酒)与非正宗大曲酱香酒(二代酒)的工艺,需要花大量的时间找出工艺的差异,同时对未知样品的检测也需要时间动辄一两小时,花费的时间也较长。
因此,通过科学手段,客观、准确地辨别酱香型白酒的酿造工艺,成为规范行业和市场、实现白酒领域食品安全有效监管的迫切需要。
发明内容
本发明针对现有技术的不足,设计一种基于支持向量机的酱香型白酒酿造工艺的判别方法。
本发明的一种基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,包括以下步骤:
步骤a:收集30个以上已知酿造工艺的酱香型白酒样品,用衰减全反射红外光谱法采集同样温度下不同样品的光谱图,得到光谱图集X;
步骤b:对光谱图集X做预处理,得到新的光谱图集X1、X2、X3……;
步骤c:对X1、X2、X3……建立SVM模型,网格搜索最适gamma与c参数值,考察验证精度,验证精度大于可接受数值时,此模型为不同酿造工艺的判别模型M,该判别模型M的谱图处理方式为选取的谱图处理方式;若验证精度低于可接受数值时则需对模型进行优化;
步骤d:对未知样品进行判别时,采集ATR-FTIR光谱数据,得到光谱图P,将P代入判别模型M中,运行步骤c选取的谱图处理方式,得到未知样品的酿造工艺。
本申请的模型M,记载了步骤c选取的谱图处理方式,即:代入M后,运行时会首先进行谱图处理,且运行的是选取的谱图处理方式。如果软件不能自带运行上述最优的谱图处理方式,则需要自己选择谱图处理方式。
为了减少温度因素对实验结果的影响,控制环境温度,确保每次实验保持在相同的温度下,且步骤d的实验温度与步骤a的一致。
当已知样本的量越多的时候,所建模型越准确,但是样本量越大,花费的时间越长,基于此,本申请选择30个以上已知样本,在该数量的样本下,模型的准确率基本达到90%,满足建模要求。
本发明的工作原理:复杂的原料与工艺,生产出组分复杂、种类繁多的酱香型白酒。正宗大曲酱香酒中含有几百种成分,包括酯类、酸类、醇类、酮类、醛类等。正宗酱酒与非正宗酒的生产,因原料不同,破碎度不同,用曲量不同,发酵次数不同,机械化程度不同,导致淀粉含量不同,微生物也不尽相同,反映在产品上,是各类工艺酱酒产品组分种类与含量的差异。诸如,碎沙、翻沙在投料时,添加糖化酶,使得正丁醇、正丙醇、2-丁醇、异戊醇、异丁醇等杂醇油含量有明显降低。酱香型白酒98%以上都是水和乙醇,仅有的不到2%的成分是决定酒体质量的关键成分,且这些组分间仍有相互作用,酒体在缓慢地、不断地变化,并且会反映在红外光谱的数据上。本申请并未对红外光谱上的某些特征峰单独分析,而是采用化学计量学对于红外数据做整体分析,这规避了分析微观成分而割裂了整体的缺陷。
SVM是一种有监督的模式识别方法,借助于化学计量学,对上千个自变量做信息挖掘,通过调整模型参数,得到有效的分类模型,在预测未知样本时,仅需要以同样方法采集ATR-FTIR数据,代入模型,即可作出类别预测。
红外光谱技术具有整体性、便捷性等特点,本发明通过对不同工艺的酱香型白酒进行红外光谱分析,经过处理后获得不同工艺的酱香型白酒的判定模型,依据模型并最终得到能快速判别不同工艺酱香型白酒的方法。
本发明能达到的效果:(1)本发明判别的正确率高,可区分正宗大曲酱香型白酒(坤沙酒)与非正宗大曲酱香型白酒(二代酒),判别正确率达94%以上;
(2)本发明判别时间短,成本低,使用本发明判别正宗大曲酱香酒,在建立判别模型以后,对未知样本预测仅需10min,相比于色谱分析动辄一两小时,至少可节约85%时间成本。并且无需额外标准品等试剂,平均每一样品需用乙醇20mL,乙醇价格为5元/500mL,实验中试剂成本不足1元,且该发明不耗费大量样本,分析所用样本体积仅为2mL。
(3)本发明具有重要的意义,由于高档正宗大曲酱香酒售价千余元,低端串沙酒仅售十余元,可帮助经销商、消费者判定品质,理性选购,对于整个行业,具有整治乱象的积极作用;同时助于净化酱香型白酒市场环境,维护仁怀市酱香型白酒核心产区的口碑与品质。
进一步,所述步骤a中,红外光谱的采集背景为空气或乙醇。
进一步,所述步骤a中,ATR晶体为Ge,17次反射。
进一步,所述步骤a中,红外光谱的采集参数为:波段范围为4000~700cm-1,扫描次数为16次、32次或者64次,分辨率为1cm-1、2cm-1、4cm-1或者8cm-1。
进一步,所述步骤b中,预处理的方式为无处理(RAW)、平滑(Smoothing)、标准化(Normalize)、基线校正(Baseline)、一阶导数(1st Derivative)、二阶导数(2ndDerivative)、SNV、Spectroscopic、De-trending或者MSC中的一种单独使用或多种叠加使用,无处理的意思是不处理。
进一步,所述步骤c中,验证精度的可接受数值为0.90以上。
进一步,所述步骤c中优化方式包括谱图处理、选取有效波段或者选取最适gamma与C参数值。
进一步,对步骤a得到的红外光谱图集X进行Hotelling’s T2分析,剔除置信水平95%之外的样本。即剔除光谱性质差异大的样本。
本发明的术语:
衰减全反射(Attenuated Total Refraction,ATR),基于光内反射原理而设计。从光源发出的红外光经过折射率大的晶体再投射到折射率小的试样表面上,当入射角大于临界角时,入射光线就会产生全反射。事实上红外光并不是全部被反射回来,而是穿透到试样表面内一定深度后再返回表面。在该过程中,试样在入射光频率区域内有选择吸收,反射光强度发生减弱,产生与透射吸收相类似的谱图,从而获得样品表层化学成份的结构信息。
衰减全反射红外光谱(ATR-FTIR)简化了样品的制作和处理过程,制样简单,无破坏性,对样品的大小、形状、含水量没有特殊要求;并且,在常规FTIR上配置ATR附件即可实现测量,仪器价格相对低廉,操作简便。
支持向量机(Support Vector Machine,SVM)是一种在数据挖掘应用中得到广泛应用的模式识别方法,是一种有监督的分类方法。支持向量机最初是针对可分离数据的线性分类而发展起来的,但由于使用了核函数,因此适用于非线性数据。支持向量机被用于机器学习、优化、统计学、生物信息学和其他使用模式识别的领域。
SVM的基本算法将待解决的模式识别问题转化成为一个二次规划的寻优问题,理论上保证它得到了全局最优解。SVM算法的目的在于寻找一个超平面,这个超平面使得训练样本集中的区域正好落在它的两侧,同时,超平面两侧的空白区域理应越大越好,空白区域越大说明样本越集中,分类效果也越好。
支持向量机原理
支持向量机是一种基于统计学习的分类方法,其中确定了一个描述类最佳分离超平面的函数。由于线性函数并不总是能够对这种分离进行建模,因此将数据映射到一个新的特征空间中,并对由点积表示的数据对象使用对偶表示。核函数用于从原始空间映射到特征空间,并且可以有多种形式,从而提供处理非线性分类案例的能力。核可以看作是非线性数据到高维特征空间的映射,同时通过允许线性算法处理高维特征空间,提供了一种计算快捷方式。支持向量被定义为来自核的简化训练数据。
与神经网络等分类方法相比,支持向量机具有独特的优势,与其他非线性分类方法相比,它具有较少的过拟合倾向。当然,模型验证是避免任何方法过度拟合的关键。支持向量机是一种有效的非线性数据建模方法,对参数的变化相对不敏感。支持向量机采用迭代训练算法来实现不同类的分离。
网格搜索(Grid Search)
Grid Search是用在Libsvm中的参数搜索方法,就是在C,gamma组成的二维参数矩阵中,依次实验每一对参数的效果。
Grid Search实际上是一种正交分析。正交的两个参数分别为Gamma和C值。C值是惩罚参数,也称为对错误的容忍度。C太高,容易过拟合。C太小,容易欠拟合,C过大或过小,泛化能力都会变差。因此通过grid search,选出最适合的C与gamma。
gamma是选择RBF函数作为kernel后,该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布,gamma越大,支持向量越少,gamma值越小,支持向量越多。
支持向量的个数影响训练与预测的速度。
优点:①可以得到全局最优;②(C,gamma)相互独立,便于并行化进行。
附图说明
图1为本发明一种基于支持向量机的酱香型白酒酿造工艺的判别方法的技术路线图;
图2为本发明实施例1 SVM Classification示意图;
图3为本发明实施例2 SVM Classification示意图。
具体实施方式
下面通过具体实施方式进一步详细说明:
本发明的技术路线如图1所示。
实施例1
1.收集贵州省茅台镇不同厂家的酱酒样品(正宗大曲酱香酒30个,非正宗大曲酱香酒37个),采集红外光谱图。仪器:Bruker Tensor 27傅里叶变换红外光谱仪,ATR晶体为Ge,17次反射。采集参数:4000-650cm-1,分辨率8cm-1,扫描32次。扫描背景为无水乙醇,洗液为无水乙醇。
表1样品明细
2.Hotelling’s T2分析,未发现异常样本点,全部数据进入下一步建模。
3.SVM模型建立
(1)将数据导入The Unscrambler 10.4,保留650cm-1和4000-700cm-1做谱图预处理,包括以下处理(单独或叠加):无处理(RAW)、平滑(Smoothing)、标准化(Normalize)、一阶导数(1st Derivative)、二阶导数(2nd Derivative)、基线校正(Baseline)、SNV、Spectroscopic、De-trending、MSC等,其中图2为实施例1SVM Classification示意图。
(2)在各谱图处理方式下建立SVM聚类模型,网格搜索最适gamma与c参数值,考察验证精度,具有最高验证精度(且要求达到95%)的谱图处理方式与建模参数为最优模型。
表2不同谱图处理方式下的模型精度
训练精度(%) | 验证精度(%) | |
RAW | 100 | 92 |
Area Normalization | 76 | 67 |
Mean Normalization | 100 | 88 |
SG一阶 | 94 | 87 |
SG一阶SNV | 91 | 91 |
SG一阶MSC | 92 | 90 |
SG二阶 | 94 | 86 |
SG二阶SNV | 97 | 90 |
Baseline Offset | 98 | 92 |
Linear Baseline Correction | 94 | 89 |
Baseline Offset&Linear Baseline Correction | 95 | 91 |
Spectroscopic Transform | 98 | 97 |
Basic ATR Correction | 100 | 97 |
Detrend_SNV | 100 | 91 |
Baseline+Spectroscopic | 100 | 92 |
其中,Basic ATR Correction为选择的谱图处理方式,在Basic ATR Correction处理下建模过程中的网格搜索,如表3所示:
表3 grid search
经实验,样品红外光谱图经Spectroscopic(Type:Basic ATR Correction)时,在4000-650cm-1上建立SVM模型(C-SVC,Kernel type:Radial basis function),Gamma:0.1,C value:100。Training accuracy:100%,Cross-validation accuracy:97.015%。
4.预测
收集新样本80个(正宗大曲酱香38个,非正宗大曲酱香42个),按照上述相同实验步骤收集红外光谱数据,代入模型,与实际工艺比对、统计,正确率达95%。
表1未知样本预测结果
实施例2
1.收集贵州省茅台镇不同厂家的碎沙酒18个,坤沙酒30个,采集红外光谱图。仪器:Bruker Tensor 27傅里叶变换红外光谱仪,ATR晶体为Ge,17次反射。采集参数:4000-650cm-1,分辨率8cm-1,扫描32次。扫描背景为无水乙醇,洗液为无水乙醇。
2.Hotelling’s T2分析,未发现异常样本点,全部数据进入下一步建模操作(比步骤仅做数据验证,并非每一实验都要剔除样本)。
3.光谱数据处理
(1)将数据导入The Unscrambler 10.4,对4000-700cm-1做谱图预处理,包括以下处理(单独或叠加):无处理(RAW)、平滑(Smoothing)、标准化(Normalize)、一阶导数(1stDerivative)、二阶导数(2nd Derivative)、基线校正(Baseline)、SNV、Spectroscopic、De-trending、MSC;其中图3为实施例2SVM Classification示意图。
(2)在各谱图处理方式下建立SVM模型,网格搜索方式选取最佳gamma与c的参数值。原始谱图建立的SVM模型,c=10,gamma=10,训练精度与验证精度为100%与97%。
5.预测未知样本
收集贵州省茅台镇不同厂家酱酒样品58个非正宗(碎沙)20个,正宗(坤沙)38个。按相同实验方法采集待测样品红外光谱图,代入至判别模型,预测。
表2未知样品预测结果
模型判定类别与真实类别比对,经统计,该模型预测正确率为94.83%。
Claims (6)
1.一种基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,包括以下步骤:
步骤a:收集30个以上已知酿造工艺的酱香型白酒样品,用衰减全反射红外光谱法采集同样温度下不同样品的光谱图,得到光谱图集X;
步骤b:对光谱图集X做预处理,得到新的光谱图集X1、X2、X3……;
步骤c:对X1、X2、X3……建立SVM模型,网格搜索最适gamma与c参数值,谱图处理方式为Basic ATR Correction,考察验证精度,验证精度为0.90以上,此模型为不同酿造工艺的判别模型M,该判别模型M的谱图处理方式为选取的谱图处理方式;若验证精度低于0.9时则需对模型进行优化,优化方式包括谱图处理、选取有效波段或者选取最适gamma与c参数值;
步骤d:对未知样品进行判别时,采集ATR-FTIR光谱数据,得到光谱图P,将P代入判别模型M中,运行步骤c选取的谱图处理方式,得到未知样品的酿造工艺。
2.根据权利要求1所述的基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,所述步骤a中,红外光谱的采集背景为空气或乙醇。
3.根据权利要求2所述的基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,所述步骤a中,ATR晶体为Ge,17次反射。
4.根据权利要求3所述的基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,所述步骤a中,红外光谱的采集参数为:波段范围为4000~700cm-1,扫描次数为16次、32次或者64次,分辨率为1cm-1、2cm-1、4cm-1或8cm-1。
5.根据权利要求4所述的基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,所述步骤b中,预处理的方式为无处理、平滑、标准化、一阶导数、二阶导数、基线校正、SNV、Spectroscopic、De-trending或者MSC中的一种单独使用或多种叠加使用。
6.根据权利要求5所述的基于支持向量机的酱香型白酒酿造工艺的判别方法,其特征在于,对步骤a得到的红外光谱图集X进行Hotelling’s T2分析,剔除置信水平95%之外的样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010976162.4A CN112001129B (zh) | 2020-09-16 | 2020-09-16 | 一种基于支持向量机的酱香型白酒酿造工艺的判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010976162.4A CN112001129B (zh) | 2020-09-16 | 2020-09-16 | 一种基于支持向量机的酱香型白酒酿造工艺的判别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112001129A CN112001129A (zh) | 2020-11-27 |
CN112001129B true CN112001129B (zh) | 2023-06-06 |
Family
ID=73474281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010976162.4A Active CN112001129B (zh) | 2020-09-16 | 2020-09-16 | 一种基于支持向量机的酱香型白酒酿造工艺的判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001129B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113567639B (zh) * | 2021-07-13 | 2023-05-16 | 中国食品药品检定研究院 | 中药材质量综合评价方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1910959A1 (en) * | 2005-07-25 | 2008-04-16 | Metanomics GmbH | Means and methods for analyzing a sample by means of chromatography-mass spectrometry |
JP2010182287A (ja) * | 2008-07-17 | 2010-08-19 | Steven C Kays | 適応型インテリジェント・デザイン |
CN102023137A (zh) * | 2009-09-18 | 2011-04-20 | 贵州仁怀茅台镇金士酒业有限公司 | 一种白酒鉴别方法 |
CN103235030A (zh) * | 2013-03-25 | 2013-08-07 | 江苏易谱恒科技有限公司 | 基于支持向量机和飞行时间质谱的白酒品牌鉴别方法 |
CN109060712A (zh) * | 2018-08-29 | 2018-12-21 | 贵州国台酒业有限公司 | 一种用红外光谱分析鉴定白酒的方法 |
CN109359678A (zh) * | 2018-10-09 | 2019-02-19 | 四川理工学院 | 一种白酒图谱的高精度分类识别算法 |
CN111426636A (zh) * | 2020-04-09 | 2020-07-17 | 米诺杰科技(江苏)有限公司 | 酒类化学组分含量快速分析仪 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107655841B (zh) * | 2017-08-11 | 2020-03-31 | 浙江中医药大学 | 一种基于紫外光谱快速测定郁金-栀子水蒸气蒸馏提取过程多种成分含量的方法 |
-
2020
- 2020-09-16 CN CN202010976162.4A patent/CN112001129B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1910959A1 (en) * | 2005-07-25 | 2008-04-16 | Metanomics GmbH | Means and methods for analyzing a sample by means of chromatography-mass spectrometry |
JP2010182287A (ja) * | 2008-07-17 | 2010-08-19 | Steven C Kays | 適応型インテリジェント・デザイン |
CN102023137A (zh) * | 2009-09-18 | 2011-04-20 | 贵州仁怀茅台镇金士酒业有限公司 | 一种白酒鉴别方法 |
CN103235030A (zh) * | 2013-03-25 | 2013-08-07 | 江苏易谱恒科技有限公司 | 基于支持向量机和飞行时间质谱的白酒品牌鉴别方法 |
CN109060712A (zh) * | 2018-08-29 | 2018-12-21 | 贵州国台酒业有限公司 | 一种用红外光谱分析鉴定白酒的方法 |
CN109359678A (zh) * | 2018-10-09 | 2019-02-19 | 四川理工学院 | 一种白酒图谱的高精度分类识别算法 |
CN111426636A (zh) * | 2020-04-09 | 2020-07-17 | 米诺杰科技(江苏)有限公司 | 酒类化学组分含量快速分析仪 |
Non-Patent Citations (1)
Title |
---|
基于SVM的白酒红外光谱分析方法研究;姜安 等;《计算机与应用化学》;233-236 * |
Also Published As
Publication number | Publication date |
---|---|
CN112001129A (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ríos-Reina et al. | Spectralprint techniques for wine and vinegar characterization, authentication and quality control: Advances and projections | |
Pérez-Caballero et al. | Authentication of tequilas using pattern recognition and supervised classification | |
Wu et al. | Rapid determination of process variables of Chinese rice wine using FT-NIR spectroscopy and efficient wavelengths selection methods | |
CN112001129B (zh) | 一种基于支持向量机的酱香型白酒酿造工艺的判别方法 | |
Miao et al. | Classification of rice based on storage time by using near infrared spectroscopy and chemometric methods | |
Hu et al. | Age discrimination of Chinese Baijiu based on midinfrared spectroscopy and chemometrics | |
Liu et al. | Discrimination of producing areas of Auricularia auricula using visible/near infrared spectroscopy | |
Yang et al. | Rapid discrimination of beer based on quantitative aroma determination using colorimetric sensor array | |
Yu et al. | Prediction of enological parameters and discrimination of rice wine age using least-squares support vector machines and near infrared spectroscopy | |
Jiang et al. | Rapid nondestructive detecting of wheat varieties and mixing ratio by combining hyperspectral imaging and ensemble learning | |
Jiang et al. | Detecting total acid content quickly and accurately by combining hyperspectral imaging and an optimized algorithm method | |
Wang et al. | Towards robustness and sensitivity of rapid Baijiu (Chinese liquor) discrimination using Raman spectroscopy and chemometrics: Dimension reduction, machine learning, and auxiliary sample | |
Petrovic et al. | Viability of IR spectroscopy for the accurate measurement of yeast assimilable nitrogen content of grape juice | |
Zou et al. | Research on non-destructive testing of hotpot oil quality by fluorescence hyperspectral technology combined with machine learning | |
Jiang et al. | Olfactory sensor combined with chemometrics analysis to determine fatty acid in stored wheat | |
Tian et al. | Multi-classification identification of PLS in rice spectra with different pre-treatments and K/S optimisation | |
Shen et al. | Discrimination of blended Chinese rice wine ages based on near-infrared spectroscopy | |
CN114062306B (zh) | 一种近红外光谱数据分段预处理方法 | |
Xie et al. | Ultraviolet spectroscopy method for classifying vinegars | |
Chen et al. | Monitoring green tea fixation quality by intelligent sensors: comparison of image and spectral information | |
Xu et al. | Detection of apple varieties by near‐infrared reflectance spectroscopy coupled with SPSO‐PFCM | |
Petrovic et al. | Unravelling the complexities of wine: A big data approach to yeast assimilable nitrogen using InfraRed spectroscopy and chemometrics | |
CN112163327B (zh) | 一种基于偏最小二乘法判别酱香型白酒酿造工艺的方法 | |
Fernández-Lozano et al. | Multivariate classification techniques to authenticate Mexican commercial spirits | |
Zhu et al. | Discrimination of Brands of Strong Aroma Type Liquors Using Synchronous Fluorescence Spectroscopy and Chemometrics Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 564501 Renhuai City, Zunyi, Guizhou Province, Maotai Town Applicant after: Guizhou Guotai Liquor Group Co.,Ltd. Address before: 564501 Renhuai City, Zunyi, Guizhou Province, Maotai Town Applicant before: Guizhou Guotai Liquor Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |