CN108399433B - 一种基于白酒指纹图谱特征的分类方法 - Google Patents
一种基于白酒指纹图谱特征的分类方法 Download PDFInfo
- Publication number
- CN108399433B CN108399433B CN201810214038.7A CN201810214038A CN108399433B CN 108399433 B CN108399433 B CN 108399433B CN 201810214038 A CN201810214038 A CN 201810214038A CN 108399433 B CN108399433 B CN 108399433B
- Authority
- CN
- China
- Prior art keywords
- matrix
- data
- white spirit
- fingerprint
- equal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种基于白酒指纹图谱特征的分类方法,包括以下步骤:选取M个白酒样本,对M个样本分别选取N个共有指纹图谱数据;对所述N个图谱数据进行归一化处理,得到由所述M个样本的N个归一化后的图谱数据组成的数据矩阵X;利用误差分析计算矩阵X的误差矩阵E,设定阈值T,确定矩阵E中数值小于阈值T的非对角元素的数目,得到粗分类个数L;根据粗分类个数L对矩阵X进行非负矩阵分解,得到基矩阵W和系数矩阵H;对所述基矩阵W进行聚类,得到矩阵X的细分类结果;本发明所述分类方法能够消除无关图谱特征对白酒分类的影响,显著降低数据的维数,使对白酒的分类更加准确客观。
Description
技术领域
本发明涉及白酒分类技术领域,具体涉及一种基于白酒指纹图谱特征的分类方法。
背景技术
指纹图谱是指某些复杂物质或某生物体的DNA、蛋白质等经适当处理后,采用一定的技术分析手段,获得的能够标示其化学特征的色谱图或光谱图。指纹图谱能够展示出不同物质鲜明的特异性和典型性。指纹图谱是一种综合的评价方法,它建立在研究样本复杂成分体系的基础上,具有采样精度高,特征明显、专属性强、重现性好的特点,且操作方便、快速且识别能力强。白酒独有的多香型、多产地特性决定了同种香型、相同产地的白酒所具有的整体相似性,决定了指纹图谱应用在白酒研究上的适用性和广泛性。白酒在酿造过程中由于原材料、酒曲、酒母、环境以及技术等因素的影响,使白酒在风味及口感上存在较大的差异。其表现具体为:不同生产厂商生产的白酒风味口感的不同;同一生产厂商内部酒的档次不同。由于不同厂、不同时间、批次中的白酒图谱存在差异,不同方式检测得到的图谱具有不同的特性。目前,我国已经形成了浓香型、酱香型、清香型等众多风味的酒类。白酒是多种化学成分的混合物,该混合物98%为水和乙醇,除此之外,还包括:醇类、酯类、酸类、氨基酸类、醚类、醛类等微量成分。微量成分约占2%,但种类很多,随着科学技术的进步,现已发现决定着白酒的香味风格的微量成分约300余种,其中有180余种已被定量分析出。
在这些微量成分是构成白酒典型特征的物质基础;微量成分在酒体中的含量和配比决定了白酒的香型、口感和质量。传统的白酒品评方法本是在感官评价,即视觉、嗅觉、味觉,对产品的色、香、味进行观察、分析、描述、定级,辅以理化分析,并做出综合评价。由于感官鉴评易受人为因素的影响,所以单凭感官对白酒基酒进行质量等级的划分,存在很多不确定的元素。由于感官分辨精度有限、操作规范不一致、人为等操作因素,使得白酒品质难以区分,等级难以界定。因此,需要客观评价机制对白酒指纹图谱进行分析。客观评价主要是运用数学方法对白酒的指纹图谱进行分析、判断及分类识别等。白酒的指纹图谱是指通过色谱或光谱等技术手段获得能够表示白酒特性的谱图或图像,包括气相色谱法、近红外方法、核磁共振等方法。白酒图谱可以视为一个由白酒特征为元素组成的n维向量,通过对白酒图谱特征的提取,可以对白酒的品质特性进行分类与识别。模式识别是根据白酒所含化学成分用数学手段对其进行分类或描述,其中回归分析、聚类分析、判别分析、相关分析、主成分分析等多元统计方法及用于非线性体系的人工神经网络技术等在白酒质量控制中得到很好的应用。目前,指纹图谱研究较多,但真能够正成为比较准确的质量控制标准,尚有些问题需要解决,白酒指纹图谱分类的研究难点集中在以下几个方面。
第一是如何获得良好的白酒指纹图谱。关键之一是选择性能优良的气相色谱仪,高分离效能的色谱柱,使其满足白酒香气组分全分析要求。
第二是如何更好地对指纹图谱进行分析。在现有的技术下,需要对图谱识别分类方法、相似度计算方法以及图谱的计算机辅助分析方法等不断地进行改进优化,使图谱分析更加规范化、科学化。
第三是如何把指纹图谱的信息与白酒的人工感官品评结合起来。白酒作为一种食品,只有同人的感官评价相结合,才能更全面地了解不同种类白酒的香味特征。
发明内容
本发明的目的在于解决上述现有技术中存在的缺陷,提供一种更加准确的基于指纹图谱特征的白酒分类方法。
为实现上述发明目的,本发明所采用的技术方案是:
一种基于白酒指纹图谱特征的分类方法,包括以下步骤:
(1)选取M个白酒样本,对M个样本分别选取N个共有图谱数据;所述图谱数据为白酒成分的含量数据;
(2)对所述N个图谱数据进行归一化处理,得到由所述M 个样本的N个归一化后的图谱数据组成的数据矩阵
(3)利用误差分析计算所述数据矩阵X的误差矩阵
(4)根据所述粗分类个数L对数据矩阵X进行非负矩阵分解,得到基矩阵WM×L和系数矩阵HL×N,其中,矩阵X与WM×LHL×N的差异函数处于最小值;
(5)对所述基矩阵WM×L进行聚类,得到数据矩阵X的细分类结果。
优选的,步骤(3)中所述误差分析为平均绝对误差分析或均方误差分析。
优选的,步骤(4)中所述差异函数为Euclidean距离、相对熵或 K-L散度。
优选的,步骤(5)中对所述基矩阵WM×L进行聚类的方法为K- 均值聚类或谱聚类。
本发明所述分类方法通过归一化处理能够消除白酒样品图谱数据标度相差大而引起的权重分配差异,先通过误差分析对白酒指纹图谱数据进行粗分类,确定粗分类的个数,再根据粗分类的结果对白酒图谱数据进行非负矩阵分解,提取白酒图谱数据中的特征和相应的权重数据,最后通过聚类方法对分解后的数据矩阵进行细分类。本发明所述分类方法能够消除无关图谱特征对白酒分类的影响,显著降低数据的维数,使对白酒的分类更加准确客观,具有极大的应用价值。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
某型白酒基于指纹图谱特征的分类方法包括以下步骤:
(1).白酒样本和指纹图谱数据的选取:
选取该型白酒的20个样本,每个样本的成分图谱数据包括36 个共有的白酒指纹图谱数据(mg/L),每个样本的图谱数据包括乙醛 (z1)、甲酸乙酯(z2)、乙酸乙酯(z3)、乙缩醛(z4)、甲醇(z5)、叔戊醇(z6)、丁酸乙酯(z7)、仲丁醇(z8)、正丙醇(z9)、乙酸丁酯(z10)、异丁醇(z11)、乙酸异戊酯(z12)、戊酸乙酯(z13)、正丁醇(z14)、乙酸正戊酯(z15)、2-甲基丁醇(z16)、异戊醇(z17)、己酸乙酯(z18)、正戊醇(z19)、庚酸乙酯(z20)、乳酸乙酯(z21)、正己醇(z22)、辛酸乙酯(z23)、糠醛(z24)、乙酸(z25)、壬酸乙酯(z26)、丙酸(z27)、丁酸(z28)、异戊酸(z29)、戊酸(z30)、2-乙基丁酸(z31)、己酸(z32)、β-苯乙醇(z33)、庚酸(z34)、辛酸(z35)、十六酸乙酯(z36)。
(2).对所述图谱数据进行归一化处理:
表1给出了白酒成分乙醛标准化前后的图谱数据。
表1白酒成分乙醛标准化前后的图谱数据
(3).对所述数据矩阵X进行误差分析:
得到的误差矩阵E中数值小于0.03的非对角矩阵元素为e16,19和e19,16,其值为0.0217,对应第16和19组白酒样本,可以理解为该两组酒样为同一类,则粗分类的个数L为19。
(4).对数据矩阵X进行非负矩阵分解:
根据步骤(3)中得到的粗分类的个数L=19对矩阵X进行非负矩阵分解,以Euclidean距离作为差异函数:
对该差异函数f(W,H)进行极小化,得到基矩阵W20×19和系数矩阵
(5).对所述基矩阵W20×19进行聚类:
利用K-均值聚类对基矩阵W20×19中的各个行向量进行聚类,准
其中,K为细分类的个数,ck为相应的聚类中心,通过上式得到细分类的个数K,表2为细分类的结果。
表2.K-均值聚类对基矩阵W20×19的细分类结果
从表2中可以看出,在之前的粗分类结果基础上,第17组和第 18组酒样为一类,则细分类的个数K=18。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种基于白酒指纹图谱特征的分类方法,其特征在于,包括以下步骤:
(1)选取M个白酒样本,对M个样本分别选取N个共有指纹图谱数据;所述指纹图谱数据为白酒成分的含量数据;
(3)利用误差分析计算所述数据矩阵X的误差矩阵 其中,元素em,n表示第m个和第n个白酒样本数据之间的误差值,1≤m≤M,1≤n≤M;设定阈值T,确定所述矩阵E中数值小于阈值T的元素em,n的数目O,其中m≠n,粗分类个数L=M-O/2;
(4)根据所述粗分类个数L对数据矩阵X进行非负矩阵分解,得到基矩阵WM×L和系数矩阵HL×N,其中,矩阵X与WM×LHL×N的差异函数处于最小值;
(5)对所述基矩阵WM×L进行聚类,得到数据矩阵X的细分类结果。
2.根据权利要求1所述的一种基于白酒指纹图谱特征的分类方法,其特征在于,步骤(3)中所述误差分析为平均绝对误差分析或均方误差分析。
5.根据权利要求1所述的一种基于白酒指纹图谱特征的分类方法,其特征在于,步骤(4)中所述差异函数为Euclidean距离、相对熵或K-L散度。
7.根据权利要求1所述的一种基于白酒指纹图谱特征的分类方法,其特征在于,步骤(5)中对所述基矩阵WM×L进行聚类的方法为K-均值聚类或谱聚类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810214038.7A CN108399433B (zh) | 2018-03-15 | 2018-03-15 | 一种基于白酒指纹图谱特征的分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810214038.7A CN108399433B (zh) | 2018-03-15 | 2018-03-15 | 一种基于白酒指纹图谱特征的分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108399433A CN108399433A (zh) | 2018-08-14 |
CN108399433B true CN108399433B (zh) | 2021-11-12 |
Family
ID=63092533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810214038.7A Active CN108399433B (zh) | 2018-03-15 | 2018-03-15 | 一种基于白酒指纹图谱特征的分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108399433B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359678B (zh) * | 2018-10-09 | 2022-08-30 | 四川轻化工大学 | 一种白酒图谱的高精度分类识别算法 |
CN109376805A (zh) * | 2018-12-21 | 2019-02-22 | 四川理工学院 | 一种基于白酒基酒指纹图谱特征的分类方法 |
CN110009053A (zh) * | 2019-04-12 | 2019-07-12 | 浙江树人学院(浙江树人大学) | 一种基于bp深度神经网络的黄酒综合类别判断方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101149362A (zh) * | 2007-09-27 | 2008-03-26 | 北京市产品质量监督检验所 | 酿造白酒与酒精勾兑白酒的鉴别方法 |
CN102023137A (zh) * | 2009-09-18 | 2011-04-20 | 贵州仁怀茅台镇金士酒业有限公司 | 一种白酒鉴别方法 |
CN102222164A (zh) * | 2011-05-30 | 2011-10-19 | 中国标准化研究院 | 一种食品感官质量评价方法及系统 |
CN103293141A (zh) * | 2013-03-25 | 2013-09-11 | 江苏省质量安全工程研究院 | 基于离子迁移谱/质谱/拉曼光谱融合技术的白酒年份识别方法 |
CN106053701A (zh) * | 2016-07-25 | 2016-10-26 | 四川理工学院 | 一种白酒鉴别方法 |
CN106645254A (zh) * | 2016-12-26 | 2017-05-10 | 厦门出入境检验检疫局检验检疫技术中心 | 一种鉴定葡萄酒的葡萄品种和年份的方法 |
CN107796783A (zh) * | 2017-10-17 | 2018-03-13 | 天津工业大学 | 一种白酒香型的快速、准确鉴别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10124917B4 (de) * | 2001-05-28 | 2007-03-22 | Bionorica Ag | Verfahren zur Klassifizierung von Wein und Kaffee |
-
2018
- 2018-03-15 CN CN201810214038.7A patent/CN108399433B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101149362A (zh) * | 2007-09-27 | 2008-03-26 | 北京市产品质量监督检验所 | 酿造白酒与酒精勾兑白酒的鉴别方法 |
CN102023137A (zh) * | 2009-09-18 | 2011-04-20 | 贵州仁怀茅台镇金士酒业有限公司 | 一种白酒鉴别方法 |
CN102222164A (zh) * | 2011-05-30 | 2011-10-19 | 中国标准化研究院 | 一种食品感官质量评价方法及系统 |
CN103293141A (zh) * | 2013-03-25 | 2013-09-11 | 江苏省质量安全工程研究院 | 基于离子迁移谱/质谱/拉曼光谱融合技术的白酒年份识别方法 |
CN106053701A (zh) * | 2016-07-25 | 2016-10-26 | 四川理工学院 | 一种白酒鉴别方法 |
CN106645254A (zh) * | 2016-12-26 | 2017-05-10 | 厦门出入境检验检疫局检验检疫技术中心 | 一种鉴定葡萄酒的葡萄品种和年份的方法 |
CN107796783A (zh) * | 2017-10-17 | 2018-03-13 | 天津工业大学 | 一种白酒香型的快速、准确鉴别方法 |
Non-Patent Citations (3)
Title |
---|
基于HPLC-ECD 法与聚类分析的中国白酒品质鉴别;于静 等;《农业机械学报》;20180131;第49卷(第1期);第315-321页 * |
基于质谱与化学计量学的浓香型白酒等级鉴别;程平言 等;《食品与发酵工业》;20131231;第39卷(第6期);第169-173页 * |
指纹图谱在白酒中的应用研究进展;袁洁 等;《食品科学》;20081231;第29卷(第11期);第680-684页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108399433A (zh) | 2018-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108399433B (zh) | 一种基于白酒指纹图谱特征的分类方法 | |
Weng et al. | Hyperspectral imaging for accurate determination of rice variety using a deep learning network with multi-feature fusion | |
De Luca et al. | Derivative FTIR spectroscopy for cluster analysis and classification of morocco olive oils | |
CN110243806B (zh) | 拉曼光谱下基于相似度的混合物组分识别方法 | |
Indahl et al. | Multivariate strategies for classification based on NIR-spectra—with application to mayonnaise | |
CN110378374B (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN106951914B (zh) | 一种优化模糊鉴别向量提取的电子鼻鉴别食醋品种方法 | |
CN110967428A (zh) | 一种基于高效液相指纹图谱信息建立评价中药化橘红质量的模式识别方法 | |
CN109376805A (zh) | 一种基于白酒基酒指纹图谱特征的分类方法 | |
CN109685098B (zh) | 一种模糊簇间分离聚类的茶叶品种分类方法 | |
Yan et al. | Nondestructive phenolic compounds measurement and origin discrimination of peated barley malt using near-infrared hyperspectral imagery and machine learning | |
Urtubia et al. | Using data mining techniques to predict industrial wine problem fermentations | |
Llobet et al. | Efficient feature selection for mass spectrometry based electronic nose applications | |
De Carvalho et al. | Determination of the geographical origin and ethanol content of Brazilian sugarcane spirit using near-infrared spectroscopy coupled with discriminant analysis | |
CN107192686B (zh) | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 | |
CN113989525A (zh) | 自适应随机块卷积核网络的高光谱中药材鉴别方法 | |
CN107273919B (zh) | 一种基于置信度构造类属字典的高光谱无监督分类方法 | |
Ortega-Gavilán et al. | Application of chemometric tools combined with instrument-agnostic GC-fingerprinting for hazelnut quality assessment | |
CN107862348B (zh) | 一种基于白酒特性的图谱相似度计算方法 | |
Giang et al. | Rapid classification of rice in Northern Vietnam by using FTIR spectroscopy combined with chemometrics methods | |
CN111426657B (zh) | 一种溶解性有机物三维荧光谱图的识别比对方法 | |
CN111595804A (zh) | 一种模糊聚类的茶叶近红外光谱分类方法 | |
Dong et al. | Quantitative and classification analysis of red wine by infrared spectra and gas chromatography–mass spectrometry data coupling with a new variable selection method | |
CN108169204B (zh) | 一种基于数据库的拉曼光谱预处理方法 | |
CN109359678B (zh) | 一种白酒图谱的高精度分类识别算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20190203 Address after: 646000 Airentang Square, Luzhou City, Sichuan Province, China Liquor Golden Triangle Liquor Industry Park Applicant after: Luzhou Laojiao Limited Company Applicant after: Sichuan University of Science & Engineering Address before: 643000 No. 180, Xue Yuan Street, Huxing Road, Zigong, Sichuan. Applicant before: Sichuan University of Science & Engineering |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |