CN113361610A - 葡萄酒产地智能识别方法及系统 - Google Patents

葡萄酒产地智能识别方法及系统 Download PDF

Info

Publication number
CN113361610A
CN113361610A CN202110646730.9A CN202110646730A CN113361610A CN 113361610 A CN113361610 A CN 113361610A CN 202110646730 A CN202110646730 A CN 202110646730A CN 113361610 A CN113361610 A CN 113361610A
Authority
CN
China
Prior art keywords
wine
prediction model
spectrogram
training
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110646730.9A
Other languages
English (en)
Other versions
CN113361610B (zh
Inventor
韦海成
塔娜
陈涛
吕新宇
蒋艳煜
肖明霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North Minzu University
Original Assignee
North Minzu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North Minzu University filed Critical North Minzu University
Priority to CN202110646730.9A priority Critical patent/CN113361610B/zh
Publication of CN113361610A publication Critical patent/CN113361610A/zh
Application granted granted Critical
Publication of CN113361610B publication Critical patent/CN113361610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3577Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing liquids, e.g. polluted water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • G01N2201/129Using chemometrical methods
    • G01N2201/1296Using chemometrical methods using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及一种葡萄酒产地智能识别方法及系统,该方法包括步骤:采集待检测葡萄酒的光谱数据,并绘制光谱图;对所述光谱图进行预处理,所述预处理包括降维和去噪;利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地;所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。与传统的近红外光谱检测不同,本发明结合了化学检测及机器学习技术,可以消除传统光谱检测所存在的噪声的影响,因此可以提高葡萄酒产地识别的准确性。

Description

葡萄酒产地智能识别方法及系统
技术领域
本发明涉及食品检测技术领域,具体涉及一种葡萄酒产地智能识别方法及系统。
背景技术
随着人民生活水平的提高,葡萄酒的消费量持续增长,由于葡萄酒是一种地域性很强的食品,使得有地理标志的葡萄酒受到市场的广泛认可。在此背景下,为了牟取不当利益,假冒伪劣葡萄酒大量涌现,常有以非地理标志保护的葡萄酒冒充地理标志保护的葡萄酒进行销售。为提高地理标志保护葡萄酒的品牌效应和经济效益,维护消费者的合法权益,葡萄酒的原产地智能识别技术至关重要。
目前为止,国内外已有多种检测技术应用于葡萄酒的产地识别,主要从酚类物质、氨基酸、挥发性成分、微量元素、同位素、感官特性等角度对葡萄酒进行分析,再结合化学计量学方法,追溯葡萄酒原产地。光谱分析是一种快速、灵敏的检测技术,利用化学物质(原子、基团、分子及高分子化合物)所具有的发射、吸收或散射光谱的特征,来确定其性质、结构或含量。但是可见/近红外光谱技术受外界环境干扰较大,所以红外光谱信息中包含有许多与样本信息无关的噪声,在使用可见/近红外光谱建模时,会影响建模的效率以及模型的预测性能。
发明内容
本发明的目的在于改善现有技术中的可见/近红外光谱检测时容易受无关噪声干扰而影响建模效率和预测性能的不足,提供一种葡萄酒产地智能识别方法及系统,通过对可见/近红外光谱中的特征变量进行筛选,选择对模型贡献较大的变量,从而简化模型、提高建模准确率,以便实现葡萄酒快速检测。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
一方面,本发明实施例提供了一种葡萄酒产地智能识别方法,包括以下步骤:
采集待检测葡萄酒的光谱数据,并绘制光谱图;
对所述光谱图进行预处理,所述预处理包括降维和去噪;
利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地;
所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。
在更细化的方案中,所述预测模型通过以下步骤训练而得:
S201,收集若干份不同产地的葡萄酒样品,并随机将葡萄酒样品划分为训练集和测试集;
S202,针对于训练集和测试集,采集葡萄酒样品的光谱数据,并绘制光谱图,以及对光谱图进行预处理;
S203,利用初始搭建的预测模型对训练集中预处理之后的光谱图进行特征变量提取和预测分类;
S204,采用四极飞行时间质谱仪对葡萄酒中的酚类成分及花色苷成分进行检测;
S205,通过步骤204中所得的检测结果对步骤S203中得到的特征变量的分类进行校正,对预测模型进行优化,得到优化后的预测模型,然后返回步骤S203,且在步骤S203中,利用优化后的预测模型对原样本的光谱图重新提取特征和预测分类;
循环执行步骤S203-S205,直至训练结束。
另一方面,本发明实施例还提供了一种葡萄酒产地智能识别系统,包括:
光谱图绘制模块,用于采集待检测葡萄酒的光谱数据,并绘制光谱图;
预处理模块,用于对所述光谱图进行预处理,所述预处理包括降维和去噪;
产地识别模块,用于利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地;
所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。
再一方面,本发明实施例提供了一种计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时使处理器执行本发明实施例中任一实施方式所述的葡萄酒产地智能识别方法中的操作。
另一方面,本发明实施例提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本发明实施例中任一实施方式所述的葡萄酒产地智能识别方法。
与现有技术相比,本发明方法具有以下技术优势:
本发明中对葡萄酒的可见/近红外光谱数据,采用融合支持向量机分析的RBM串联多层BP神经元网络架构的算法进行分类和预测,寻找不同产区葡萄酒的特有成分,实现产地识别。具体方法是:首先,采用RBM串联多层BP神经元网络架构对葡萄酒的可见/近红外光谱数据进行特征提取和分类。其次,Q-TOF等化学计量手段可对可见/近红外光谱建立的检测模型进行校正,通过深度学习技术将化学检测与光谱检测结果融合修正,提高检测效率和精度。
与传统的近红外光谱变量的筛选和校正模型不同,本发明方法更加科学和精准。在检测方面,可见/近红外光谱技术与色谱技术相比更加简单便捷,可进行实时检测。
本发明所具有的其他优势将会在具体实施例中进行相应说明。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为实施例中举例的一种葡萄酒产地智能识别方法的流程图。
图2为实施例中所述预测模型的训练方法流程图。
图3为RBM的基本结构图。
图4为实施例中所述预测模型的结构示意图。
图 5a、图5b、图5c、图5d为实施例中举例的葡萄酒产地检测结果图。
图6为实施例中一种葡萄酒产地智能识别系统的功能模块图。
图7为模型训练模块的功能模块图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本实施例中提供了一种葡萄酒产地智能识别方法,包括以下步骤:
S10,采集待检测葡萄酒的光谱数据,并绘制光谱图。
待检测葡萄酒就是指欲识别产地的葡萄酒,此处利用可见/近红外光谱光纤采集设备采集葡萄酒原液的光谱数据,然后绘制葡萄酒原液的光谱图。在光谱图的不同区域包含着各类信息,每一个光吸收倒峰都有相应的官能团,对应着不同的成分。光谱数据的采集以及光谱图的绘制都是现有技术,本实施例中对此不做细述。
实验发现,不同产区的葡萄酒在出峰位置上未见明显差异,但是在光吸收强度上则差异明显,因此理论上可以通过光谱图实现产地识别。但真正应用过程发现,可见/近红外光谱存在成分或官能团吸光强度混叠问题,继而影响了识别效果,因此本实施例中不是直接基于光谱图进行产地识别,而是从光谱图中提取出特征变量,然后再基于特征变量以及配合机器学习方法进行产地识别。
S20,对所述光谱图进行预处理,所述预处理包括降维和去噪。
在提取特征变量之前先对光谱图进行预处理,以提高光谱图质量,继而更好地提取特征变量。本实施例中预处理包括数据降维和去噪。
例如,用Savitzky.Golay(简称S-G)方法进行平滑滤波,可以提高光谱的平滑性,并降低噪音的干扰。S-G平滑滤波的效果,随着选取窗宽不同而不同。假设窗口大小为5,即每次取5个点,包括自身和前后2个点。把光谱一段区间的等波长间隔的5个点记为X集合,多项式平滑就是利用在波长点为Xk−2,Xk−1,Xk,Xk+1,Xk+2的数据的多项式拟合值来取代Xk,k表示轨迹点上的第k个点,然后依次移动,直到把光谱遍历完。
数据降维例如可以使用主成分分析(Principal components analysis,简称PCA)方法。PCA算法是在数据空间中找出一组向量,用此向量尽可能地表达数据的方差,将数据从高维降到低维,其利用K-L变换获得逼近原数据空间的最低维识别空间,并使之投影后方向相互正交。主成分大小根据方差大小依次提取。该方法是一种无监督的降维算法,无需考虑数据类别属性,通过某种线性投影变化获得综合变换,综合变量最大化反应了原始光谱数据中所反映的大致规律。数据降维的特征选择需要通过最小化目标函数进行变量选择,构建稀疏字典。再将实时深度学习模型引入到光谱特征领域中,实现了高维特征间非线性函数的特征识别。
S30,将预处理后的光谱图输入预先训练好的预测模型,输出得到识别结果。即是说,利用预先训练好的预测模型从光谱图中提取出特征变量,并对提取出的特征变量进行分类,以及基于各特征变量的分类确定出葡萄酒的产地。
该预测模型是预先训练好的模型,此处是一种支持向量机分析的RBM串联多层BP神经元网络模型,即结合支持向量机分析、多层RBM串联和BP神经网络三种技术共同训练得到的模型。
请参阅图2,所述预测模型的训练过程包括以下步骤:
S201,收集若干份不同产地的葡萄酒样品,同一产地的葡萄酒样品可以有多份,并随机将葡萄酒样品划分为训练集和测试集。
在收集样品时,最好是尽可能多地收集各个产地的样品,使得训练出来的预测模型可以对各个产地的葡萄酒都能进行很好的识别。
S202,针对于训练集和测试集,采集葡萄酒样品的光谱数据,并绘制光谱图,以及对光谱图进行预处理。所述预处理包括降维和去噪,具体的实施可以参考步骤S20中的相关描述。
S203,利用初始搭建的预测模型对训练集中预处理之后的光谱图进行特征变量提取和预测分类。
RBM(Restricted Boltzmann Machine的简称,受限玻尔兹曼机)的基本结构如图3所示,神经元是两层神经网络,第一层是可视层,第二层是隐藏层。由于不存在层级间通信,所以在前传过程中与全连接区别不大,但实际上还存在一个反向过程,是一种无向图。RBM以一种无监督方式通过自身来重建数据,在重建阶段,隐藏层的激活状态与每个连接边相同的权重相乘,这些乘积的和在每个可见节点处与可视层的偏置项相加,每一次重建过程都是对原始输入的一个逼近。该模型的最底层可视层为可观测变量,最顶部的连接是无向的,目的是获取可观测变量下,推断未知变量的状态,并调整隐藏状态以重构出可观测数据。
如图4所示,本实施例中对RBM的结构进行了改进,将多个RBM进行多层串联作为前向算法,后项的更新算法则为BP算法,并融合支持向量机算法,提出了一种支持向量机分析的RBM串联多层BP神经元网络模型。利用逐层无监督方法进行预训练,每次只对一个RBM进行训练,即只对相邻两层的结构进行训练,在对所有层训练结束后,通过顶层的支持向量机算法进行分类。在分类器的集成方面,选用改进后的Boosting算法簇串行算法,这是一种Adaboost算法,其算法原理是通过调整样本权重和弱分类器权值,从训练出的弱分类器中筛选出权值系数最小的弱分类器组合成一个最终强分类器。将0/1损失函数用数学性质更好的指数损失函数替代,更多的“关注”被错分的样品,侧重选择性能好的弱分类器,每次循环,错误分类的样品赋予较大权值,被正确分类的样品权值较小,每次的循环产生一个弱分类器,并调整每个分类器的权值,最后采用加权投票法对分类器集成,得到具有更优分类效果的分类器。上述模型能够更好的提升分类的准确性。
更具体地,本步骤包括以下处理步骤:
(1)预训练单层RBM,然后再多层叠加形成网络。
输入预处理后的光谱数据,分别单独无监督的训练每一层RBM网络,确保特征向量映射到不同特征空间,尽可能的保留特征信息;通过一个非监督贪婪逐层方法预训练获得权重,不要类标,不断拟合输入,依次逐层(即先单独预训练每一层RBM,然后再依次逐层叠加)。在此过程中,数据经过可见层,生成一个向量V,再由权值w传给隐藏层,得到h,由于隐藏层之间是无连接的,因此能够并行得到隐藏层所有节点值。通过能量函数来度量网络的稳定性,优化函数是根据求能量函数求指数后,归一化,然后最大似然得到。以单层的RBM训练为例,可见层是用来接收输入信号,隐藏层用来提取特征。
(2)在网络(即多层RBM网络叠加后形成的网络)的最后一层设置 BP 网络,接收RBM 的输出特征向量作为它的输入特征向量,有监督地训练实体关系分类器(实体关系分类器就是对提取的特征向量进行分类的分类器)。每一层 RBM 网络只能确保自身层内的权值对该层特征向量映射达到最优,并不是对整个多层RBM网络的特征向量映射达到最优,所以反向传播网络还将错误信息自顶向下传播至每一层 RBM,微调整个多层RBM网络。RBM 网络训练模型的过程可以看作对一个深层 BP 网络权值参数的初始化,使多层RBM网络克服了 BP 网络因随机初始化权值参数而容易陷入局部最优和训练时间长的缺点,因此可以加快建模效率,并提高预测精度。
(3)将上述模型算法与SVM+Boosting算法融合,提升分类精度和泛化能力。SVM+Boosting算法是将Boosting与SVM算法结合,使用小训练样本对SVM进行训练,得到分类器,进一步使用Boosting方法提高SVM泛化能力。BP网络是基于传统统计学的基础,传统统计学研究的内容是样本无穷大时的渐进理论,即当样本数据趋于无穷多时的统计性质,而实际问题中样本数据往往是有限的.因此,若样本数据无穷多,并以此推导出的各种算法很难在样本数据有限时取得理想的应用效果。融合SVM+Boosting算法不但可以克服BP网络难以避免的问题,而且具有较强的逼近能力和泛化能力。
S204,采用Q-TOF(四极飞行时间质谱仪)对葡萄酒中的酚类成分及花色苷成分进行检测。
Q-TOF化学检测是现有技术,对样品进行前制样(0.22微米过滤葡萄酒原液)并配置流动相(甲醇,5mmol甲酸铵),分别设置色谱和质谱条件进行测试。一级质谱MS结果用于寻找差异成分,二级质谱MS/MS用于验证差异成分。由于Q-TOF是现有技术,故此处不再赘述。
实验中,以甘城子、红寺堡和银川这三个产区葡萄酒为例,测试结果如图 5a、图5b、图5c、图5d所示。图 5a是甘城子、红寺堡和银川三个产区葡萄酒的近红外光谱图,虽然每个出峰位置对应的波数相近,但是其反射比略有差异。在指纹图谱区这种差异表现更明显。图5b、图5c、图5d分别是三个产区葡萄酒的Q-TOF代谢组成分,其中甘城子产区与红寺堡的葡萄酒有15种(3-吡啶丙酸、奎宁、利多卡因、普鲁卡因胺、黄体酮、乙酰甲胺四乙酸、可的松、吉非贝齐、4-氨基苯甲酸酯、甲磺氮卓脲、沙丁胺醇、鹅去氧胆酸、拉贝洛尔、乙酰唑胺和炔诺酮),银川产区的葡萄酒有19种(3-吡啶丙酸、利多卡因、普鲁卡因胺、黄体酮、乙酰甲胺四乙酸、可的松、吉非贝齐、吲哚、己基丁基、4-氨基苯甲酸酯、甲磺氮卓脲、沙丁胺醇、鹅去氧胆酸、拉贝洛尔、乙酰唑胺、炔诺酮、利血平、特布他林和苯基丁酮);银川和红寺堡产区葡萄酒有5种差异成分(奎宁、吲哚、利血平、特布他和苯基丁酮)。
S205,通过步骤204中所得的检测结果对步骤S203中得到的特征变量的分类进行校正,对预测模型进行优化,得到优化后的预测模型,然后返回步骤S203,且在步骤S203中,利用优化后的预测模型对原样本的光谱图重新提取特征和预测分类。循环执行步骤S203-S205,直至训练结束,即直至预测模型收敛到局部最优点。
此处需要注意的是,由于步骤S204的检测结果在每次循环过程中都是一样的,因此步骤S204优选可以只执行一次,而在每一次循环中直接调用该检测结果即可,以此来降低运算量。
校正时,寻找Q-TOF检测显示的差异成分对应的近红外光谱波数范围,对比该特征波数范围与预测模型提取特征范围是否一致,若不一致,则对预测模型进行参数的调整或增加隐藏层,达到模型修正的目的。若一致,则保留当前模型结构。
S206,利用测试集对训练结束后得到的预测模型进行测试,验证预测模型的准确性。本步骤可作为训练时的可选步骤。
请参阅图6和图7,本实施例中同时提供了一种葡萄酒产地智能识别系统,包括:
模型训练模块,用于训练得到预测模型,所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。由于模型训练模块在应用中是不需要的,仅是在应用前需要,因此在图6中以虚线框进行表示。
光谱图绘制模块,用于采集待检测葡萄酒的光谱数据,并绘制光谱图。
预处理模块,用于对所述光谱图进行预处理,所述预处理包括降维和去噪。
产地识别模块,用于利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地。
其中,如图7所示,模型训练模块包括:
样本收集子模块,用于收集若干份不同产地的葡萄酒样品,并随机将葡萄酒样品划分为训练集和测试集;
预处理子模块,用于针对于训练集和测试集,采集葡萄酒样品的光谱数据,并绘制光谱图,以及对光谱图进行预处理;
预测子模块,用于利用初始搭建的预测模型对训练集中预处理之后的光谱图进行特征变量提取和预测分类;
检测子模块,采用四极飞行时间质谱仪对葡萄酒中的酚类成分及花色苷成分进行检测;
修正子模块,通过所得的检测结果对预测子模输出的特征变量的分类进行校正,对预测模型进行优化;
结束判断子模块,用于判断训练是否结束,如果未结束,则驱动预测子模块利用优化后的预测模型对原样本的光谱图重新提取特征和预测分类,以及驱动修正子模块对预测模型进行优化,直至判断出训练结束。
葡萄酒产地智能识别系统是基于葡萄酒产地智能识别非法相同的发明构思而提出的,对于系统不清楚之处,请参见前述方法实施例中的相关描述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种葡萄酒产地智能识别方法,其特征在于,包括以下步骤:
采集待检测葡萄酒的光谱数据,并绘制光谱图;
对所述光谱图进行预处理,所述预处理包括降维和去噪;
利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地;
所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。
2.根据权利要求1所述的葡萄酒产地智能识别方法,其特征在于,所述预测模型通过以下步骤训练而得:
S201,收集若干份不同产地的葡萄酒样品,并随机将葡萄酒样品划分为训练集和测试集;
S202,针对于训练集和测试集,采集葡萄酒样品的光谱数据,并绘制光谱图,以及对光谱图进行预处理;
S203,利用初始搭建的预测模型对训练集中预处理之后的光谱图进行特征变量提取和预测分类;
S204,采用四极飞行时间质谱仪对葡萄酒中的酚类成分及花色苷成分进行检测;
S205,通过步骤204中所得的检测结果对步骤S203中得到的特征变量的分类进行校正,对预测模型进行优化,得到优化后的预测模型,然后返回步骤S203,且在步骤S203中,利用优化后的预测模型对原样本的光谱图重新提取特征和预测分类;
循环执行步骤S203-S205,直至训练结束。
3.根据权利要求2所述的葡萄酒产地智能识别方法,其特征在于,所述步骤S203中,包括步骤:
(1)输入预处理后的光谱数据进行预训练,分别单独无监督的训练每一层RBM网络,然后将多层RBM网络叠加;
(2)在多层RBM网络的最后一层设置BP网络,接收RBM的输出特征向量作为输入特征向量,有监督地训练分类器;
(3)融合Boosting与SVM算法训练分类器,得到所述预测模型。
4.根据权利要求2所述的葡萄酒产地智能识别方法,其特征在于,所述步骤S205中,校正时,寻找四极飞行时间质谱仪检测显示的差异成分对应的近红外光谱波数范围,对比该近红外光谱波数范围与预测模型提取特征范围是否一致,若不一致,则对预测模型进行参数的调整或增加隐藏层,以实现预测模型修正。
5.根据权利要求2所述的葡萄酒产地智能识别方法,其特征在于,在步骤S205之后还包括步骤:S206,利用测试集对训练结束后得到的预测模型进行测试,以验证预测模型的准确性。
6.一种葡萄酒产地智能识别系统,其特征在于,包括:
光谱图绘制模块,用于采集待检测葡萄酒的光谱数据,并绘制光谱图;
预处理模块,用于对所述光谱图进行预处理,所述预处理包括降维和去噪;
产地识别模块,用于利用预先训练好的预测模型从预处理后的光谱图中提取出特征变量,并对提取出的特征变量进行分类,基于各特征变量的分类确定出葡萄酒的产地;
所述预测模型为支持向量机分析的RBM串联多层BP神经元网络模型,所述预测模型通过将多个RBM进行多层串联作为前向算法,后项的更新算法采用BP算法,并融合支持向量机算法而训练得到。
7.根据权利要求6所述的葡萄酒产地智能识别系统,其特征在于,还包括模型训练模块,用于训练得到所述预测模型;所述模型训练模块包括:
样本收集子模块,用于收集若干份不同产地的葡萄酒样品,并随机将葡萄酒样品划分为训练集和测试集;
预处理子模块,用于针对于训练集和测试集,采集葡萄酒样品的光谱数据,并绘制光谱图,以及对光谱图进行预处理;
预测子模块,用于利用初始搭建的预测模型对训练集中预处理之后的光谱图进行特征变量提取和预测分类;
检测子模块,采用四极飞行时间质谱仪对葡萄酒中的酚类成分及花色苷成分进行检测;
修正子模块,通过所得的检测结果对预测子模块输出的特征变量的分类进行校正,对预测模型进行优化;
结束判断子模块,用于判断训练是否结束,如果未结束,则驱动预测子模块利用优化后的预测模型对原样本的光谱图重新提取特征和预测分类,以及驱动修正子模块对预测模型进行优化,直至判断出训练结束。
8.根据权利要求7所述的葡萄酒产地智能识别系统,其特征在于,修正子模块在校正时,寻找四极飞行时间质谱仪检测显示的差异成分对应的近红外光谱波数范围,对比该近红外光谱波数范围与预测模型提取特征范围是否一致,若不一致,则对预测模型进行参数的调整或增加隐藏层,以实现预测模型修正。
9.一种计算机可读指令的计算机可读存储介质,其特征在于,所述计算机可读指令在被执行时使处理器执行权利要求1-5任一所述方法中的操作。
10.一种电子设备,其特征在于,包括:
存储器,存储程序指令;
处理器,与所述存储器相连接,执行存储器中的程序指令,实现权利要求1-5任一所述方法。
CN202110646730.9A 2021-06-10 2021-06-10 葡萄酒产地智能识别方法及系统 Active CN113361610B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110646730.9A CN113361610B (zh) 2021-06-10 2021-06-10 葡萄酒产地智能识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110646730.9A CN113361610B (zh) 2021-06-10 2021-06-10 葡萄酒产地智能识别方法及系统

Publications (2)

Publication Number Publication Date
CN113361610A true CN113361610A (zh) 2021-09-07
CN113361610B CN113361610B (zh) 2023-01-31

Family

ID=77533638

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110646730.9A Active CN113361610B (zh) 2021-06-10 2021-06-10 葡萄酒产地智能识别方法及系统

Country Status (1)

Country Link
CN (1) CN113361610B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090246427A1 (en) * 2008-03-28 2009-10-01 Hincks Daniel A Product labels having removable portions having adhesive and backing thereon
CN103235057A (zh) * 2013-04-27 2013-08-07 江南大学 一种利用气相色谱-质谱不解析化合物鉴别白酒原产地的方法
CN105044198A (zh) * 2015-07-03 2015-11-11 中国农业大学 一种基于矿质元素指纹鉴别葡萄酒原产地的方法
CN106560841A (zh) * 2016-10-20 2017-04-12 中国计量大学 基于深度学习的武夷岩茶产地鉴别方法
CN107219188A (zh) * 2017-06-02 2017-09-29 中国计量大学 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN108489927A (zh) * 2018-01-24 2018-09-04 仲恺农业工程学院 鱼类产地溯源方法、电子设备、存储介质及装置
CN109520962A (zh) * 2017-09-19 2019-03-26 江南大学 一种葡萄酒近红外光谱检测方法
CN111563558A (zh) * 2020-05-13 2020-08-21 宿州学院 一种葡萄酒产地及品牌的快速识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090246427A1 (en) * 2008-03-28 2009-10-01 Hincks Daniel A Product labels having removable portions having adhesive and backing thereon
CN103235057A (zh) * 2013-04-27 2013-08-07 江南大学 一种利用气相色谱-质谱不解析化合物鉴别白酒原产地的方法
CN105044198A (zh) * 2015-07-03 2015-11-11 中国农业大学 一种基于矿质元素指纹鉴别葡萄酒原产地的方法
CN106560841A (zh) * 2016-10-20 2017-04-12 中国计量大学 基于深度学习的武夷岩茶产地鉴别方法
CN107219188A (zh) * 2017-06-02 2017-09-29 中国计量大学 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN109520962A (zh) * 2017-09-19 2019-03-26 江南大学 一种葡萄酒近红外光谱检测方法
CN108489927A (zh) * 2018-01-24 2018-09-04 仲恺农业工程学院 鱼类产地溯源方法、电子设备、存储介质及装置
CN111563558A (zh) * 2020-05-13 2020-08-21 宿州学院 一种葡萄酒产地及品牌的快速识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
VINCENT: "RBM(限制玻尔兹曼机)、DBN(深度信念网络)介绍", 《CSDN》 *
王静等: "基于深度信念网络的烟叶部位近红外光谱分类方法研究", 《红外与激光工程》 *

Also Published As

Publication number Publication date
CN113361610B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
Singh et al. Comparative study ID3, cart and C4. 5 decision tree algorithm: a survey
US20220254350A1 (en) Method, apparatus and device for voiceprint recognition of original speech, and storage medium
CN109934269B (zh) 一种电磁信号的开集识别方法和装置
CN110243806B (zh) 拉曼光谱下基于相似度的混合物组分识别方法
EA036070B1 (ru) Способ распознавания сигнала о вторжении в пределы оптоволоконного периметра, устройство распознавания и система сигнализации о вторжении в пределы оптоволоконного периметра
Luinge Automated interpretation of vibrational spectra
CN108766464B (zh) 基于电网频率波动超矢量的数字音频篡改自动检测方法
WO2022257458A1 (zh) 车险理赔行为识别方法、装置、设备及存储介质
CN112613536A (zh) 一种基于smote和深度学习的近红外光谱柴油牌号识别方法
CN115358481A (zh) 一种企业外迁预警识别的方法、系统及装置
CN113408616B (zh) 基于pca-uve-elm的光谱分类方法
CN113361610B (zh) 葡萄酒产地智能识别方法及系统
CN111666999A (zh) 一种遥感图像的分类方法
CN111398238A (zh) 一种食用油掺杂蓖麻油的激光诱导荧光光谱识别方法
CN114863286B (zh) 一种基于多算法协同选优的混合废塑料分类方法
CN114062306B (zh) 一种近红外光谱数据分段预处理方法
US11525774B2 (en) Sensory evaluation method for spectral data of mainstream smoke
CN112326574B (zh) 一种基于贝叶斯分类的光谱波长选择方法
CN114694771A (zh) 样品分类方法、分类器的训练方法、设备和介质
CN111474124A (zh) 一种基于补偿的光谱波长选择方法
Henriksson et al. Housing Price Prediction over Countrywide Data: A comparison of XGBoost and Random Forest regressor models
CN114826764B (zh) 一种基于集成学习的边缘计算网络攻击识别方法及系统
CN115908773A (zh) 葡萄酒产地智能识别方法及系统
CN117557917B (zh) 水质检测方法和装置
Xu et al. User Intention Prediction Method Based on Hybrid Feature Selection and Stacking Multi-model Fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant