CN114418041B - 一种基于ig-hsic-svm的电子舌白酒检测方法 - Google Patents

一种基于ig-hsic-svm的电子舌白酒检测方法 Download PDF

Info

Publication number
CN114418041B
CN114418041B CN202210329148.4A CN202210329148A CN114418041B CN 114418041 B CN114418041 B CN 114418041B CN 202210329148 A CN202210329148 A CN 202210329148A CN 114418041 B CN114418041 B CN 114418041B
Authority
CN
China
Prior art keywords
matrix
feature
characteristic
liquor
area value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210329148.4A
Other languages
English (en)
Other versions
CN114418041A (zh
Inventor
章伟
朱亚龙
刘嘉明
朱晓龙
胡雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210329148.4A priority Critical patent/CN114418041B/zh
Publication of CN114418041A publication Critical patent/CN114418041A/zh
Application granted granted Critical
Publication of CN114418041B publication Critical patent/CN114418041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/14Beverages
    • G01N33/146Beverages containing alcohol
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Food Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于IG‑HSIC‑SVM的电子舌白酒检测方法。步骤如下:利用集成电极获得白酒的原始响应数据进行面积值特征提取形成特征样本矩阵;对特征样本矩阵进行归一化预处理得到特征矩阵;基于特征矩阵,结合SVM模型迭代进行各列面积值特征的IG计算并剔除面积值特征,得到初步白酒年份分类模型、初步特征矩阵;针对初步特征矩阵,结合初步白酒年份分类模型迭代进行各列面积值特征的HSIC计算并剔除面积值特征,得到最优白酒年份分类模型对白酒年份进行分类检测,并得到最优特征矩阵。本发明解决了单一特征选择算法进行电子舌白酒特征选择时特征优化数量少以及准确率低的技术问题,提高了白酒年份分析的效率及正确率。

Description

一种基于IG-HSIC-SVM的电子舌白酒检测方法
技术领域
本发明属于电子舌领域,具体涉及一种基于IG-HSIC-SVM的电子舌白酒检测方法。
背景技术
电子舌现代智能感应仪器,工作原理为电极响应样品并输出时序信息,结合算法进行分类。由于待测样品成分的自然复杂性和可变性以及阵列中传感器的交叉敏感性,不可避免地会产生冗余信息,从而极大地影响计算复杂度和时间的消耗。为了减少冗余信息并提高识别的效率,须对其进行优化,因此,选择最佳的特征组合对于电子舌的成功应用非常重要。
发明内容
本发明针对现有技术的不足,提出了一种基于IG-HSIC-SVM的电子舌白酒检测方法,利用电子舌中的集成电极采集白酒样品信息,结合IG-HSIC-SVM的检测方法对数据进行分析,达到对白酒样本检测的目的,提高了白酒成份分析的效率及正确率。
为解决现有技术问题,本发明采取的技术方案为:
一种基于IG-HSIC-SVM的电子舌白酒检测方法,基于包括有集成电极的电子舌,针对已知不同年份的各白酒样本,执行以下步骤,得到电子舌的最优白酒年份分类模型实现对白酒年份的分类检测:
步骤S1:利用集成电极获得各白酒样本的原始响应数据并进行面积值特征提取形成特征样本矩阵A
步骤S2:对特征样本矩阵A进行归一化预处理得到特征矩阵D
步骤S3:针对特征矩阵D,结合SVM模型迭代进行各列面积值特征的信息增益计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的初步白酒年份分类模型,以及初步白酒年份分类模型对应的初步特征矩阵F IG
上述步骤S3中针对特征矩阵D,迭代执行步骤S3.1至步骤S3.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的SVM模型作为初步白酒年份分类模型,并得到初步白酒年份分类模型对应的输入特征矩阵,即初步特征矩阵F IG
步骤S3.1:以特征矩阵D为输入,各白酒样本的年份分类为输出,训练SVM模型,并得到该SVM模型对应的白酒年份分类准确率;
步骤S3.2:基于特征矩阵D,进行各列面积值特征的信息增益计算,并基于各列面积值特征的信息增益,得到特征矩阵D内各列面积值特征贡献度排名,将特征矩阵D中预设列数的面积值特征进行低贡献度剔除,更新特征矩阵D,返回步骤S3.1;
步骤S4:针对初步特征矩阵F IG ,结合初步白酒年份分类模型迭代进行各列面积值特征的希尔伯特施密特经验估计值计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的最优特征矩阵F IG-HSIC
作为本发明的一种优选技术方案,所述步骤S1具体过程为:基于集成电极包括的预设个数电极获得各白酒样本的原始响应数据,针对各电极分别对应的原始响应数据的每个向上响应峰的后预设个数数据点进行面积值特征提取形成特征样本矩阵A,如下公式所示
Figure DEST_PATH_IMAGE001
其中,
Figure 34366DEST_PATH_IMAGE002
为预设个数的电极测量白酒一个样本的原始响应 数据进行特征提取后横向拼接构成的一个特征样本数据;
Figure DEST_PATH_IMAGE003
为各白酒测量样本的总数量;
Figure 443482DEST_PATH_IMAGE004
为预设个数的电极测量白酒一个样本的原始响应数据进行特征提取后的总点数。
作为本发明的一种优选技术方案,所述面积值特征提取采用积分面积法进行提取。
作为本发明的一种优选技术方案,所述步骤S2中对特征样本矩阵A进行归一化预处理得到特征矩阵D的过程如下;
将特征样本矩阵A采用如下公式进行归一化处理,得到特征矩阵D
Figure DEST_PATH_IMAGE005
其中,D为归一化处理后的特征矩阵,
Figure 170130DEST_PATH_IMAGE006
为特征样本矩阵每列的最大值,
Figure DEST_PATH_IMAGE007
为特征样本矩阵每列的最小值,
Figure 678603DEST_PATH_IMAGE008
为特征样本矩阵。
作为本发明的一种优选技术方案,所述步骤S3.2中各列面积值特征的信息增益计算,执行以下步骤:
步骤S3.2.1:计算特征矩阵D的经验熵
Figure DEST_PATH_IMAGE009
Figure 716966DEST_PATH_IMAGE010
其中,D为特征矩阵,
Figure DEST_PATH_IMAGE011
表示特征矩阵D的白酒样本个数,
Figure 667123DEST_PATH_IMAGE012
表示第k类白酒,K表 示共有K类白酒年份,
Figure DEST_PATH_IMAGE013
为属于类
Figure 248277DEST_PATH_IMAGE012
的白酒样本个数,
Figure 849023DEST_PATH_IMAGE014
步骤S3.2.2:计算第X列面积值特征对特征矩阵D的经验条件熵
Figure DEST_PATH_IMAGE015
Figure 656573DEST_PATH_IMAGE016
其中,第X列面积值特征包含n个不同的取值
Figure DEST_PATH_IMAGE017
,基于第X列面积值特 征的取值将D横向划分为n个子集D 1 D 2 ,···,D n
Figure 673070DEST_PATH_IMAGE018
为第a个子集
Figure DEST_PATH_IMAGE019
的白酒样本个数, 1≤a≤n
Figure 108731DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
Figure 349219DEST_PATH_IMAGE019
的经验熵;
步骤S3.2.3:计算第X列面积值特征的信息增益
Figure 706382DEST_PATH_IMAGE022
Figure DEST_PATH_IMAGE023
作为本发明的一种优选技术方案,所述步骤S4中针对初步特征矩阵F IG 、以及初步白酒年份分类模型,迭代执行步骤S4.1至步骤S4.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的初步白酒年份分类模型作为最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的输入初步特征矩阵,即最优特征矩阵F IG-HSIC
步骤S4.1:以初步特征矩阵F IG 为输入,各白酒样本的年份分类为输出,训练初步白酒年份分类模型,并得到该初步白酒年份分类模型对应的白酒年份分类准确率;
步骤S4.2:基于初步特征矩阵F IG ,进行各列面积值特征的希尔伯特施密特经验估计值计算,并基于各列面积值特征的希尔伯特施密特经验估计值,得到初步特征矩阵F IG 内各列面积值特征独立性排名,将初步特征矩阵F IG 中预设列数的面积值特征进行低独立性剔除,更新初步特征矩阵F IG ,返回步骤S4.1。
作为本发明的一种优选技术方案,所述步骤S4.2中各列面积值特征的希尔伯特施密特经验估计值计算,执行以下步骤:
步骤S4.2.1:计算再生希尔伯特空间
Figure 789220DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE025
Y、Z分别表示初步特征矩阵F IG 中的两列面积 值特征,r表示Y对应的核函数,l表示Z对应的核函数,
Figure 79387DEST_PATH_IMAGE026
Y到再生希尔伯特空间F的映射,
Figure DEST_PATH_IMAGE027
Z到再生希尔伯特空间G的映射,映射关系均为高斯核函数,
Figure 959619DEST_PATH_IMAGE028
表示内积;
步骤S4.2.2:计算希尔伯特施密特经验估计值
Figure DEST_PATH_IMAGE029
其中
Figure 335236DEST_PATH_IMAGE030
RY的核矩阵,LZ的核矩阵,核矩阵R、L的第一个维度均为m, 即
Figure DEST_PATH_IMAGE031
H为中心矩阵,
Figure 427957DEST_PATH_IMAGE032
I为单位矩阵,e为元素值全为1的列向量。
本发明的有益效果:本发明提出了一种基于IG-HSIC-SVM的电子舌白酒检测方法,采用电子舌中的集成电极采集白酒样品信息,在上位机中利用IG-HSIC-SVM算法对白酒样本进行分析,减少了冗余信息并提高识别的效率,解决了机器学习算法手工提取特征后,计算量大、准确率不高的技术问题。
附图说明
图1为本发明基于IG-HSIC-SVM的电子舌白酒检测算法流程图;
图2为单个样本的单个电极响应数据图;
图3为实施例中三种特征选择方法以及特征数目未优化前准确率对比。
具体实施方式
下面的实施例可使本专业技术人员更全面地理解本发明,但不以任何方式限制本发明。
一种基于IG-HSIC-SVM的电子舌白酒检测方法,基于包括有集成电极的电子舌,针对已知不同年份的各白酒样本,执行以下步骤,如图1所示,得到电子舌的最优白酒年份分类模型实现对白酒年份的分类检测。
本实施例所用的数据为电子舌测得的五种勾兑的不同年份白酒数据,过程中训练集、验证集和测试集的比例为6:2:2。实现电子舌对白酒2015、2016、2017、2018、2019、2020五种年份的分类检测,集成电极采集的数据数量如表1所示。
Figure DEST_PATH_IMAGE033
步骤S1:利用集成电极获得各白酒样本的原始响应数据并进行面积值特征提取形成特征样本矩阵A
所述步骤S1具体过程为:基于集成电极包括的预设个数电极获得各白酒样本的原始响应数据,针对各电极分别对应的原始响应数据的每个向上响应峰的后预设个数的数据点进行面积值特征提取形成特征样本矩阵A,本实施例中集成电极包括6个电极,针对各电极分别对应的原始响应数据的每个向上的响应峰的后20个数据点进行面积值特征提取,如图2所示,该图共有21个向上的响应峰,在840处有一个向上的峰,很小。
如下公式所示
Figure 697265DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE035
为预设个数的电极测量白酒一个样本的原始响应数据进 行特征提取后横向拼接构成的一个特征样本数据;
Figure 482818DEST_PATH_IMAGE036
为各白酒测量样本的总数量;
Figure DEST_PATH_IMAGE037
为预设 个数的电极测量白酒一个样本的原始响应数据进行特征提取后的总点数。所述面积值特征 提取采用积分面积法进行提取。本实施例中各白酒测量样本的总数量
Figure 80153DEST_PATH_IMAGE036
为500,各电极分别 对应的原始响应数据的每个向上的响应峰的后20个数据点
Figure 835619DEST_PATH_IMAGE036
进行面积值特征提取得到21个 面积特征值,总点数
Figure 38061DEST_PATH_IMAGE038
为126。
步骤S2:对特征样本矩阵A进行归一化预处理得到特征矩阵D,过程如下:
将特征样本矩阵A采用如下公式进行归一化处理,得到特征矩阵D
Figure DEST_PATH_IMAGE039
其中,D为归一化处理后的特征矩阵,
Figure 119150DEST_PATH_IMAGE040
为特征样本矩阵每列的最大值,
Figure DEST_PATH_IMAGE041
为 特征样本矩阵每列的最小值,
Figure 194991DEST_PATH_IMAGE042
为特征样本矩阵。
步骤S3:针对特征矩阵D,结合SVM模型迭代进行各列面积值特征的信息增益计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的初步白酒年份分类模型,以及初步白酒年份分类模型对应的初步特征矩阵F IG
所述步骤S3中针对特征矩阵D,迭代执行步骤S3.1至步骤S3.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的SVM模型作为初步白酒年份分类模型,并得到初步白酒年份分类模型对应的输入特征矩阵,即初步特征矩阵F IG
步骤S3.1:以特征矩阵D为输入,各白酒样本的年份分类为输出,训练SVM模型,并得到该SVM模型对应的白酒年份分类准确率。
步骤S3.2:基于特征矩阵D,进行各列面积值特征的信息增益计算,并基于各列面积值特征的信息增益,得到特征矩阵D内各列面积值特征贡献度排名,信息增益越大贡献度越高,将特征矩阵D中预设列数的面积值特征进行低贡献度剔除,本实施例中迭代进行一列面积值特征的剔除,更新特征矩阵D,返回步骤S3.1。
各列面积值特征的信息增益计算,执行以下步骤:
步骤S3.2.1:计算特征矩阵D的经验熵
Figure DEST_PATH_IMAGE043
Figure 895094DEST_PATH_IMAGE044
其中,D为特征矩阵,
Figure DEST_PATH_IMAGE045
表示特征矩阵的样本容量,即面积值特征样本个数;
Figure 748781DEST_PATH_IMAGE046
表示第k类白酒,K表示共有K类白酒年份,
Figure DEST_PATH_IMAGE047
为属于类
Figure 735191DEST_PATH_IMAGE046
的面积值特征样本数,
Figure 41539DEST_PATH_IMAGE048
步骤S3.2.2:计算第X列面积值特征对特征矩阵D的经验条件熵
Figure DEST_PATH_IMAGE049
Figure 279753DEST_PATH_IMAGE050
其中,第X列面积值特征包含n个不同的取值
Figure DEST_PATH_IMAGE051
,默认一列中各白酒样 本的面积值特征均不相同,基于第X列面积值特征的取值将D横向划分为n个子集D 1 D 2 ,···D n
Figure 112580DEST_PATH_IMAGE052
为第a个子集
Figure DEST_PATH_IMAGE053
的面积值特征样本数,1≤a≤n
Figure 410837DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
Figure 204481DEST_PATH_IMAGE056
的经验熵;
步骤S3.2.3:计算第X列面积值特征的信息增益
Figure DEST_PATH_IMAGE057
Figure 371020DEST_PATH_IMAGE058
步骤S4:针对初步特征矩阵F IG ,结合初步白酒年份分类模型迭代进行各列面积值特征的希尔伯特施密特经验估计值计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的最优特征矩阵F IG-HSIC
所述步骤S4中针对初步特征矩阵F IG 、以及初步白酒年份分类模型,迭代执行步骤S4.1至步骤S4.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的初步白酒年份分类模型作为最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的输入初步特征矩阵,即最优特征矩阵F IG-HSIC
步骤S4.1:以初步特征矩阵F IG 为输入,各白酒样本的年份分类为输出,训练初步白酒年份分类模型,并得到该初步白酒年份分类模型对应的白酒年份分类准确率。
步骤S4.2:基于初步特征矩阵F IG ,进行各列面积值特征的希尔伯特施密特经验估计值计算,并基于各列面积值特征的希尔伯特施密特经验估计值,得到初步特征矩阵F IG 内各列面积值特征独立性排名,将初步特征矩阵F IG 中预设列数的面积值特征进行低独立性剔除,本实施例中迭代进行一列面积值特征的剔除,更新初步特征矩阵F IG ,返回步骤S4.1。
各列面积值特征的希尔伯特施密特经验估计值计算,执行以下步骤:
步骤S4.2.1:计算再生希尔伯特空间
Figure DEST_PATH_IMAGE059
其中,
Figure 933720DEST_PATH_IMAGE025
Y、Z分别表示初步特征矩阵F IG 中的两列面积 值特征,r表示Y对应的核函数,l表示Z对应的核函数,
Figure 134369DEST_PATH_IMAGE060
Y到再生希尔伯特空间F的映射,
Figure DEST_PATH_IMAGE061
Z到再生希尔伯特空间G的映射,映射关系均为高斯核函数,
Figure 539943DEST_PATH_IMAGE062
表示内积;
步骤S4.2.2:计算互协方差算子
Figure DEST_PATH_IMAGE063
Figure 385539DEST_PATH_IMAGE064
其中,
Figure DEST_PATH_IMAGE065
分别表示对相应变量进行求期望,
Figure 68324DEST_PATH_IMAGE066
表示张量积;
步骤S4.1.3:计算算子范数
Figure DEST_PATH_IMAGE067
其中,
Figure 973963DEST_PATH_IMAGE068
Y、Z的概率分布;
步骤S4.1.4:计算希尔伯特施密特经验估计值
Figure DEST_PATH_IMAGE069
其中
Figure 742199DEST_PATH_IMAGE070
RY的核矩阵,LZ的核矩阵,核矩阵R、L的第一个维度均为m, 即
Figure 984962DEST_PATH_IMAGE031
H为中心矩阵,
Figure 256674DEST_PATH_IMAGE032
I为单位矩阵,e为元素值全为1的列向量。
本实施例运行的环境为实验的实施环境为在DellT792计算机上编写实现,WinDows10,因特尔至强20核处理器,64G运行内存,2*11GRTX2080Ti,Pycharm2019,Python3.7,scikit-learn0.21.3。
Figure DEST_PATH_IMAGE071
为了验证IG-HSIC-SVM模型相较于单一特征选择算法在性能上的优越性,进行对比实验,表2显示了IG-HSIC-SVM模型相单一特征选择算法分类结果对比结果,结果如图3所示。
由表可以看出本发明的IG-HSIC-SVM模型的确率为94%,准确率提高了3%,优化特征数为14;IG-SVM模型准确率为93%,准确率提高了2%,优化特征数为12;HSIC-SVM模型准确率为91%,准确率未提高,优化特征数为8。
本发明设计了一种基于IG-HSIC-SVM的电子舌白酒检测方法,采用电子舌中的集成电极采集白酒样品信息,在上位机中利用IG-HSIC-SVM算法对白酒样本进行分析,减少了冗余信息并提高识别的效率,解决了机器学习算法手工提取特征后,计算量大、准确率不高的技术问题。
以上所述仅为本申请的部分优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,基于包括有集成电极的电子舌,针对已知不同年份的各白酒样本,执行以下步骤,得到电子舌的最优白酒年份分类模型实现对白酒年份的分类检测:
步骤S1:利用集成电极获得各白酒样本的原始响应数据并进行面积值特征提取形成特征样本矩阵A
步骤S2:对特征样本矩阵A进行归一化预处理得到特征矩阵D
步骤S3:针对特征矩阵D,结合SVM模型迭代进行各列面积值特征的信息增益计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的初步白酒年份分类模型,以及初步白酒年份分类模型对应的初步特征矩阵F IG
上述步骤S3中针对特征矩阵D,迭代执行步骤S3.1至步骤S3.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的SVM模型作为初步白酒年份分类模型,并得到初步白酒年份分类模型对应的输入特征矩阵,即初步特征矩阵F IG
步骤S3.1:以特征矩阵D为输入,各白酒样本的年份分类为输出,训练SVM模型,并得到该SVM模型对应的白酒年份分类准确率;
步骤S3.2:基于特征矩阵D,进行各列面积值特征的信息增益计算,并基于各列面积值特征的信息增益,得到特征矩阵D内各列面积值特征贡献度排名,将特征矩阵D中预设列数的面积值特征进行低贡献度剔除,更新特征矩阵D,返回步骤S3.1;
步骤S4:针对初步特征矩阵F IG ,结合初步白酒年份分类模型迭代进行各列面积值特征的希尔伯特施密特经验估计值计算并剔除预设列数面积值特征,得到以剔除后的特征矩阵为输入、各白酒样本的年份分类为输出的最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的最优特征矩阵F IG-HSIC
2.根据权利要求1所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述步骤S1具体过程为:基于集成电极包括的预设个数电极获得各白酒样本的原始响应数据,针对各电极分别对应的原始响应数据的每个向上响应峰的后预设个数数据点进行面积值特征提取形成特征样本矩阵A,如下公式所示
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
为预设个数的电极测量白酒一个样本的原始响应数据进行特征提取后横向拼接构成的一个特征样本数据;
Figure DEST_PATH_IMAGE006
为各白酒测量样本的总数量;
Figure DEST_PATH_IMAGE008
为预设个数的电极测量白酒一个样本的原始响应数据进行特征提取后的总点数。
3.根据权利要求2所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述面积值特征提取采用积分面积法进行提取。
4.根据权利要求1所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述步骤S2中对特征样本矩阵A进行归一化预处理得到特征矩阵D的过程如下;
将特征样本矩阵A采用如下公式进行归一化处理,得到特征矩阵D
Figure DEST_PATH_IMAGE010
其中,D为归一化处理后的特征矩阵,
Figure DEST_PATH_IMAGE012
为特征样本矩阵每列的最大值,
Figure DEST_PATH_IMAGE014
为特征样本矩阵每列的最小值,
Figure DEST_PATH_IMAGE016
为特征样本矩阵。
5.根据权利要求1所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述步骤S3.2中各列面积值特征的信息增益计算,执行以下步骤:
步骤S3.2.1:计算特征矩阵D的经验熵
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE020
其中,D为特征矩阵,
Figure DEST_PATH_IMAGE022
表示特征矩阵D的白酒样本个数,
Figure DEST_PATH_IMAGE024
表示第k类白酒,K表示共有K类白酒年份,
Figure DEST_PATH_IMAGE026
为属于类
Figure 717556DEST_PATH_IMAGE024
的白酒样本个数,
Figure DEST_PATH_IMAGE028
步骤S3.2.2:计算第X列面积值特征对特征矩阵D的经验条件熵
Figure DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE032
其中,第X列面积值特征包含n个不同的取值
Figure DEST_PATH_IMAGE034
,基于第X列面积值特征的取值将D横向划分为n个子集D 1 D 2 ,···,D n
Figure DEST_PATH_IMAGE036
为第a个子集
Figure DEST_PATH_IMAGE038
的白酒样本个数,1≤a ≤n
Figure DEST_PATH_IMAGE040
Figure DEST_PATH_IMAGE042
Figure 789024DEST_PATH_IMAGE038
的经验熵;
步骤S3.2.3:计算第X列面积值特征的信息增益
Figure DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE046
6.根据权利要求1所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述步骤S4中针对初步特征矩阵F IG 、以及初步白酒年份分类模型,迭代执行步骤S4.1至步骤S4.2,直到分类准确率连续三次低于未剔除面积值特征的特征矩阵D对应的分类准确率,选择分类准确率最高的初步白酒年份分类模型作为最优白酒年份分类模型对白酒年份进行分类检测,并得到最优白酒年份分类模型对应的输入初步特征矩阵,即最优特征矩阵F IG-HSIC
步骤S4.1:以初步特征矩阵F IG 为输入,各白酒样本的年份分类为输出,训练初步白酒年份分类模型,并得到该初步白酒年份分类模型对应的白酒年份分类准确率;
步骤S4.2:基于初步特征矩阵F IG ,进行各列面积值特征的希尔伯特施密特经验估计值计算,并基于各列面积值特征的希尔伯特施密特经验估计值,得到初步特征矩阵F IG 内各列面积值特征独立性排名,将初步特征矩阵F IG 中预设列数的面积值特征进行低独立性剔除,更新初步特征矩阵F IG ,返回步骤S4.1。
7.根据权利要求6所述的一种基于IG-HSIC-SVM的电子舌白酒检测方法,其特征在于,所述步骤S4.2中各列面积值特征的希尔伯特施密特经验估计值计算,执行以下步骤:
步骤S4.2.1:计算再生希尔伯特空间
Figure DEST_PATH_IMAGE048
其中,
Figure DEST_PATH_IMAGE050
Y、Z分别表示初步特征矩阵F IG 中的两列面积值特征,r表示Y对应的核函数,l表示Z对应的核函数,
Figure DEST_PATH_IMAGE052
Y到再生希尔伯特空间F的映射,
Figure DEST_PATH_IMAGE054
Z到再生希尔伯特空间G的映射,映射关系均为高斯核函数,
Figure DEST_PATH_IMAGE056
表示内积;
步骤S4.2.2:计算希尔伯特施密特经验估计值
Figure DEST_PATH_IMAGE058
其中
Figure DEST_PATH_IMAGE060
RY的核矩阵,LZ的核矩阵,核矩阵R、L的第一个维度均为m,即
Figure DEST_PATH_IMAGE062
H为中心矩阵,
Figure DEST_PATH_IMAGE064
I为单位矩阵,e为元素值全为1的列向量。
CN202210329148.4A 2022-03-31 2022-03-31 一种基于ig-hsic-svm的电子舌白酒检测方法 Active CN114418041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210329148.4A CN114418041B (zh) 2022-03-31 2022-03-31 一种基于ig-hsic-svm的电子舌白酒检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210329148.4A CN114418041B (zh) 2022-03-31 2022-03-31 一种基于ig-hsic-svm的电子舌白酒检测方法

Publications (2)

Publication Number Publication Date
CN114418041A CN114418041A (zh) 2022-04-29
CN114418041B true CN114418041B (zh) 2022-06-21

Family

ID=81264542

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210329148.4A Active CN114418041B (zh) 2022-03-31 2022-03-31 一种基于ig-hsic-svm的电子舌白酒检测方法

Country Status (1)

Country Link
CN (1) CN114418041B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007183281A (ja) * 2007-01-15 2007-07-19 Microdent:Kk 健康計測診査装置、方法
CN102192970A (zh) * 2010-03-02 2011-09-21 (株)科学技术分析中心 臭味测定方法及臭味测定系统
CA2838711A1 (en) * 2013-01-11 2014-07-11 Cgg Services Sa A system and method for the removal of shallow water multiples using a hybrid multi-channel prediction method
CN110118809A (zh) * 2019-04-29 2019-08-13 山西农业大学 基于电子鼻与电子舌的不同陈酿年份山西老陈醋快速检测方法
CN111060633A (zh) * 2019-12-30 2020-04-24 北京工商大学 基于特征风味组分对油煎过程中油脂判废模型的建立方法及判废方法
WO2020223064A1 (en) * 2019-05-01 2020-11-05 Blackthorn Therapeutics, Inc. Systems and methods for processing mri data
CN113313150A (zh) * 2021-05-17 2021-08-27 南京益得冠电子科技有限公司 一种基于pca及随机森林的电子舌检测方法及系统
CN113537278A (zh) * 2021-05-17 2021-10-22 南京益得冠电子科技有限公司 一种基于1d-cnn电子舌的酒检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9201068B2 (en) * 2008-09-03 2015-12-01 Clarkson University Bioelectronic tongue for food allergy detection

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007183281A (ja) * 2007-01-15 2007-07-19 Microdent:Kk 健康計測診査装置、方法
CN102192970A (zh) * 2010-03-02 2011-09-21 (株)科学技术分析中心 臭味测定方法及臭味测定系统
CA2838711A1 (en) * 2013-01-11 2014-07-11 Cgg Services Sa A system and method for the removal of shallow water multiples using a hybrid multi-channel prediction method
CN110118809A (zh) * 2019-04-29 2019-08-13 山西农业大学 基于电子鼻与电子舌的不同陈酿年份山西老陈醋快速检测方法
WO2020223064A1 (en) * 2019-05-01 2020-11-05 Blackthorn Therapeutics, Inc. Systems and methods for processing mri data
CN111060633A (zh) * 2019-12-30 2020-04-24 北京工商大学 基于特征风味组分对油煎过程中油脂判废模型的建立方法及判废方法
CN113313150A (zh) * 2021-05-17 2021-08-27 南京益得冠电子科技有限公司 一种基于pca及随机森林的电子舌检测方法及系统
CN113537278A (zh) * 2021-05-17 2021-10-22 南京益得冠电子科技有限公司 一种基于1d-cnn电子舌的酒检测方法及系统

Also Published As

Publication number Publication date
CN114418041A (zh) 2022-04-29

Similar Documents

Publication Publication Date Title
TU et al. Selection for high quality pepper seeds by machine vision and classifiers
Erisoglu et al. A new algorithm for initial cluster centers in k-means algorithm
CN108846338B (zh) 基于面向对象随机森林的极化特征选择及分类方法
CN103942562B (zh) 基于多分类器组合的高光谱图像分类方法
Bonifacio et al. Determination of common Maize (Zea mays) disease detection using Gray-Level Segmentation and edge-detection technique
CN106503727A (zh) 一种高光谱图像分类的方法及装置
CN113793319B (zh) 基于类别约束字典学习模型的织物图像瑕疵检测方法及系统
CN104820841B (zh) 基于低阶互信息和光谱上下文波段选择的高光谱分类方法
Yang et al. A synthetic datasets based instance segmentation network for High-throughput soybean pods phenotype investigation
CN106886793A (zh) 基于判别信息和流形信息的高光谱图像波段选择方法
Bezabh et al. Classification of pumpkin disease by using a hybrid approach
Balasubramaniyan et al. Color contour texture based peanut classification using deep spread spectral features classification model for assortment identification
Alfons et al. Tandem clustering with invariant coordinate selection
CN114418041B (zh) 一种基于ig-hsic-svm的电子舌白酒检测方法
Dheer et al. Identification of Indian rice varieties using machine learning classifiers.
CN112382342A (zh) 一种基于集成特征选择的癌症甲基化数据分类方法
CN107943916B (zh) 一种基于在线分类的网页异常检测方法
CN110321787A (zh) 基于联合稀疏表示的病害识别方法、系统及存储介质
CN111275100B (zh) 一种基于训练集样本低秩筛选的图像特征鉴别方法
CN107704880A (zh) 一种基于特征选择的农作物病害识别方法
CN109444360B (zh) 基于细胞神经网络和电子鼻特征提取的果汁贮藏期检测算法
CN110827919A (zh) 一种应用于基因表达谱数据的降维方法
CN114062305A (zh) 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统
Wei et al. Credit risk evaluation using: Least squares support vector machine with mixture of kernel
CN111967424A (zh) 一种基于卷积神经网络的荞麦病害识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant