CN111126575B - 基于机器学习的气体传感器阵列混合气体检测方法及装置 - Google Patents
基于机器学习的气体传感器阵列混合气体检测方法及装置 Download PDFInfo
- Publication number
- CN111126575B CN111126575B CN202010023373.6A CN202010023373A CN111126575B CN 111126575 B CN111126575 B CN 111126575B CN 202010023373 A CN202010023373 A CN 202010023373A CN 111126575 B CN111126575 B CN 111126575B
- Authority
- CN
- China
- Prior art keywords
- gas
- model
- sensor array
- component
- mixed gas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 238000010801 machine learning Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012549 training Methods 0.000 claims abstract description 33
- 239000007789 gas Substances 0.000 claims description 186
- 238000004422 calculation algorithm Methods 0.000 claims description 26
- 238000000605 extraction Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 18
- 238000013527 convolutional neural network Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 10
- 238000012360 testing method Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 238000012706 support-vector machine Methods 0.000 description 7
- 238000000513 principal component analysis Methods 0.000 description 6
- 238000003909 pattern recognition Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 229910044991 metal oxide Inorganic materials 0.000 description 2
- 150000004706 metal oxides Chemical class 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000287196 Asthenes Species 0.000 description 1
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000011151 fibre-reinforced plastic Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/20—Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)
Abstract
本发明涉及一种基于机器学习的气体传感器阵列混合气体检测方法及装置,其中方法包括:步骤S1:根据可能存在的气体种类,建立多个第二模型,其中,各第二模型分别对应于不同成分的混合气体下的各气体的检测;步骤S2:建立用于识别混合气体中各气体浓度范围的第一模型;步骤S3:对第一模型和各第二模型完成训练;步骤S4:获取气体传感器阵列采集的数据序列;步骤S5:利用训练完成的第一模型根据气体传感器阵列采集的数据序列检测混合气体中各成分气体的浓度区间;步骤S6:根据各成分气体的浓度区间,基于气体传感器阵列采集的数据序列,选择对应的第二模型分别对各成分气体进行定量检测。与现有技术相比,本发明具有精度高等优点。
Description
技术领域
本发明涉及一种机器嗅觉领域,尤其是涉及一种基于机器学习的气体传感器阵列混合气体检测方法及装置。
背景技术
“电子鼻系统”也被称为人工嗅觉系统,是一种模仿生物鼻的系统,它的目的是为了实现对气体的识别。“电子鼻系统”结构分为三个层次(1)气敏传感器阵列;(2)信号预处理单元;(3)模式识别单元。目前,机器嗅觉的主要研究方向包括敏感材料的研制和相关模式识别算法的研究。金属氧化半导体(metal oxide semiconductor,MOS)气体传感器作为气敏传感器在气体检测领域运用广泛,具有成本较低、响应速度快、使用寿命长等优点。MOS传感器在接触到氧化性或还原性气体后,其电阻特性会发生变化,故可对气体进行识别和检测。但是MOS传感器有显著的交叉敏感性。由于化学反应的复杂性,人们认识到,只对一种气体敏感的气敏传感器是不存在的。解决这个问题的方法之一就是采用多个具有交叉敏感性不同类型的气敏传感器组成传感器阵列,可以分别对多种气体进行测量并给出整体的测量结果。但是,仅仅通过研制传感器和探索测量方式往往并不能带来令人满意的效果。
在信号预处理方面,近年来机器嗅觉领域使用的相空间(PS)、能量矢量(EV)和功率密度谱(PSD)等特征提取方法,并提出了一些建议和新的思路。在模式识别方面,基于线性核主成分分析(KPCA)的线性判别分析(LDA)改善了气体传感器响应信号非线性对模式识别的影响;独立成分分析(ICA)也常用于分析MOS传感器阵列响应数据的方法,实现了对不同种类气体的分类;有学者采用改进的支持向量机(ISVMEN)来解决电子鼻中的多分类问题,将平均分类精度提高到92.58%,达到了较好的分类和泛化性能;有学者利用核主成分分析(KPCA)对多路非线性特征提取,后使用提取的特征使用k最近邻域(KNN)分类器或RBF网络建模识别目标气体,气体识别准确率达到了98.33%。
尽管上述方法在一定程度上提高了机器嗅觉系统对气体识别和浓度检测的准确度,但是依旧存在相应的缺点和问题。常用的主成分分析(PCA)、奇异值分解(SVD)和线性判别分析(LDA)都属于线性特征提取和分类方法,在处理MOS传感器非线性响应信号时往往达不到较高的精度。KNN算法进行分类往往存在样本容量大时计算量比较大、样本不均衡时预测偏差较大和超参数K的选取问题。而常见的基于支持向量机(SVM)的分类方法对大规模训练样本难以实施,对常见多分类问题可能需要多个二类支持向量机组合解决,并且往往需要对支持向量机的参数进行优化,不同气体测量参数的选取可能发生变化,这些都会在一定程度下影响测量的精度。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于机器学习的气体传感器阵列混合气体检测方法及装置,针对MOS气体传感器对气体浓度相应曲线的非线性特性,提出一种气体识别卷积神经网络GRCNN(Gas recognition convolutionalneural network),卷积神经网络本质是一个多层感知机,其采用的局部连接和权值共享方式,这种方式一方面减小了权值数量,使网络易于优化;另一方面降低了模型的复杂度,减小了过拟合的风险;同时,卷积神经网络具有一些传统机器学习方法所没有的优点:如具有良好的容错能力、泛化能力、避免人工进行特征提取等。针对混合气体浓度估计的平均相对误差较大的问题,此外提出一种基于KPCA和GBDT结合的浓度估计方法。GBDT通过加法模型及不断减小训练过程产生的残差来将数据分类或回归,能够建立阵列式气体传感器与对应气体浓度复杂的非线性关系,具有鲁棒性高,解释性好等优点。首先使用GRCNN对气体分类,后根据混合气体情况使用不同GBDT模型进行浓度预测。一般而言,利用模式识别方法对气体进行定性识别和定量识别受到训练样本质量、数量及不同浓度配比影响较大,最后采用加州大学动态混合气体气体传感器阵列数据集进行验证。数据集包含95种不同CH4与C2H4混合气体浓度配比和近万条的稳态数据,有助于反映气体传感器阵列在测量范围内的真实测量情况。
本发明的目的可以通过以下技术方案来实现:
一种基于机器学习的气体传感器阵列混合气体检测方法,包括:
步骤S1:根据可能存在的气体种类,建立多个第二模型,其中,各第二模型分别对应于不同成分的混合气体下的各气体的检测;
步骤S2:建立用于识别混合气体中各气体浓度范围的第一模型;
步骤S3:对第一模型和各第二模型完成训练;
步骤S4:获取气体传感器阵列采集的数据序列;
步骤S5:利用训练完成的第一模型根据气体传感器阵列采集的数据序列检测混合气体中各成分气体的浓度区间;
步骤S6:根据各成分气体的浓度区间,基于气体传感器阵列采集的数据序列,选择对应的第二模型分别对各成分气体进行定量检测。
所述第二模型的个数为:
其中:u为可能存在的气体种类的数目。
所述第一模型为卷积神经网络。
所述第二模型为结合KPCA特征提取算法和GBDT算法的模型。
所述步骤S6具体包括:
步骤S61:选择所有所处浓度区间超过设定的第一阈值的成分气体作为混合气体中的有效成分气体,得到待测气体的成分;
步骤S62:选择各有效气体成分对应的第二模型分别对各有效成分气体进行定量检测。
所述步骤S62中对于每一种有效气体成分的定量检测过程具体包括:
步骤S621:利用对应的第二模型的核函数进行KPCA特征提取;
步骤S622:选择对应的第二模型的GBDT回归模型获取该有效气体成分的浓度。
所述GBDT算法通过加法模型及不断减小训练过程产生的残差来将数据分类或回归,建立阵列式气体传感器与对应气体浓度复杂的非线性关系。
一种基于机器学习的气体传感器阵列混合气体检测装置,包括气体传感器阵列、处理器、存储器,以及程序,所述处理器与气体传感器阵列连接,执行所述程序时实现以下步骤:
步骤S1:根据可能存在的气体种类,建立多个第二模型,其中,各第二模型分别对应于不同成分的混合气体下的各气体的检测;
步骤S2:建立用于识别混合气体中各气体浓度范围的第一模型;
步骤S3:对第一模型和各第二模型完成训练;
步骤S4:获取气体传感器阵列采集的数据序列;
步骤S5:利用训练完成的第一模型根据气体传感器阵列采集的数据序列检测混合气体中各成分气体的浓度区间;
步骤S6:根据各成分气体的浓度区间,基于气体传感器阵列采集的数据序列,选择对应的第二模型分别对各成分气体进行定量检测。
与现有技术相比,本发明具有以下有益效果:
1)针对传统模式识别方法对非线性问题达不到较高精度,模型复杂、对数据量较大的情况学习能力不足且鲁棒性不强的特点,提出基于卷积神经网络的气体所处浓度区间识别方法,算法较容易实现且可处理较大的样本量,不仅实现了对混合气体的定性识别,而且实现对气体所处浓度区间的识别;同时针对气体识别中的特征提取问题,卷积神经网络将气体传感器信息映射到高维空间,从而避免了特征提取且达到了较好的效果。
2)在二元混合气体定性测试识别率达到了98.6%以上,对二元混合气体所处浓度区间识别准确率在95.4%以上,具有一定的产品化价值,对比BP神经网络,模型具有较高的精度和鲁棒性。
3)在浓度检测方面,提出了KPCA结合GBDT的浓度检测算法,对单一气体和混合气体训练不同的模型,根据前面定性识别的结果,使用不同的模型进行浓度检测,相对于单一模型,检测鲁棒性和准确性增强。在二元混合气体测试条件下,测试平均相对误差小于4.1%,相对于弹性网络回归、支持向量机回归,所提出的KPCA结合GBDT浓度定量检测算法平均相对误差分别降低了19.8%,6.4%。方案在二元混合气体测试中浓度回归相对误差远小于传统SVR模型和Elastic Net模型。
附图说明
图1为GRCNN结构框图;
图2为二元混合气体GRCNN结构框图;
图3为GBDT算法模型训练流程图;
图4为混合气体定性定量检测流程图;
图5为在二元混合气体条件下定性检测准确率对照折线图;
图6为在二元混合气体条件下定量检测相对误差对比折线图;
图7为本发明整体流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
一种基于机器学习的气体传感器阵列混合气体检测方法,该方法以计算机软件的形式,由对应的监测装置运行,包括气体传感器阵列、处理器、存储器,以及程序,处理器与气体传感器阵列连接,如图4和图7所示,执行程序时实现以下步骤:
步骤S1:根据可能存在的气体种类,建立多个第二模型,其中,各第二模型分别对应于不同成分的混合气体下的各气体的检测,因此第二模型的个数为:
其中:u为可能存在的气体种类的数目。
第二模型为结合KPCA特征提取算法和GBDT算法的模型。
步骤S2:建立用于识别混合气体中各气体浓度范围的第一模型,其中,第一模型为卷积神经网络;
步骤S3:对第一模型和各第二模型完成训练;
分类模型方面本发明使用阵列式传感器归一化后的稳态输出值进行训练,根据数据集混合气体种类设定GRCNN网络模型参数,设定后使用随机初始化模型参数,后使用Adam优化算法根据模型输出优化模型。
浓度定量检测算法为:将上述训练集根据浓度分为单一气体和混合气体训练集;以混合气体C2H4和CH4为例,针对单一气体(C2H4或CH4)和混合气体(C2H4和CH4)的训练集构造核矩阵K1(·),K2(·),K3(·),K3(·)通过KPCA提取训练样本特征;针对单一气体和混合气体四种情况分别训练四种GBDT模型fM1(x),fM2(x),fM3(x),fM4(x)分别用于单一气体下C2H4,CH4和混合气体下C2H4,CH4的浓度检测。
步骤S4:获取气体传感器阵列采集的数据序列;
步骤S5:利用训练完成的第一模型根据气体传感器阵列采集的数据序列检测混合气体中各成分气体的浓度区间,具体包括:
步骤S51:数据预处理与特征图构建
设表示N组观测样本原始测量值。其中,每个样本/>为k维行向量。
发明采用传感器测量的稳态值,由于不同传感器输出分布不同,预处理时分别对每个维度进行归一化处理,假设第j维数据为数据集中第j维的最大值为/>最小值为/>归一化公式为:
得到X=[x1;x2;...;xN]表示归一化后的观测样本。其中,每个样本xi=[xi,1,xi,2,...,xi,k]为k维行向量,N表示观测样本总数。
CNN常被用于解决图像识别、物体检测的任务,而输入的一般为二维或三维图像数据,故需要将归一化后的数据转化为二维数据。同时,由于单次采样受随机误差影响较大,为减小单次测量的干扰并增强检测鲁棒性。这里以k维阵列式气体传感器输出为例,选取当混合气体处于同一浓度配比的k相邻时刻构建特征图。取同一浓度配比k连续数据构成大小为k*k的特征图Xmap,公式为:
步骤S52:GRCNN神经网络结构
考虑到分类数较少,浅层卷积神经网络结构简单,训练和前向运算效率高,本发明设计一个浅层的卷积神经网络GRCNN实现对不同气体定性识别和所处的浓度区间识别。GRCNN分三部分:(1)特征提取卷积神经网络;(2)针对每种气体的分支网络;(3)针对每种气体浓度范围识别网络。见附图1所示。
实验对CH4和C2H4组成的混合气体检测结构如附图2所示。根据气体种类,输入特征图的大小为16×16×1,输出为两个4×1的向量,分别表征两种气体所处的浓度区间,设第i种气体测量浓度最大值为则输出向量[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]分别表示气体所处浓度区间为0,/> 针对两种混合气体设计的GRCNN特征提取网络由卷积层conv1+最大池化层,卷积层conv2+最大池化层组成,conv1,conv2均含32个大小为5×5的卷积核,最大池化层核大小为2×2且步长为2,用于特征图的降维并提高模型泛化能力。最终得到大小为4×4×32的特征图;由于有两种气体,故分类网络为两个分支网络,一定程度上可减小分类数目,防止模型过拟合。将得到特征图作为后两分支网络的输入,分支网络由卷积层、最大池化层、全连接层组成,分别用于对每种气体所处浓度区间识别。
步骤S53:GRCNN网络损失函数与训练
网络采用分支结构减少网络全连接层参数个数和防止由于浓度区间内样本数较少造成的过拟合问题。对应每个分支网络的输出结果模型使用交叉熵损失函数对不同分支结果计算损失。最终使用Adam(adaptive moment estimation)优化算法分别根据各分支损失函数优化特征提取网络和各自分支分类网络参数。
假设模型有两个分支网络,分支网络输出为四维向量,经过sigmoid函数后的概率输出为真值为/> 则模型分别采用两个交叉熵损失函数/>表示第i个样本预测结果损失,公式如下:
损失函数为交叉熵损失与L2正则化之和。算法batch值大小设为b;设特征提取网络部分参数表示为ωi;两个分类网络部分参数分别为ωj和ωk。则训练时损失函数如下:
步骤S6:根据各成分气体的浓度区间,基于气体传感器阵列采集的数据序列,选择对应的第二模型分别对各成分气体进行定量检测,具体包括:
步骤S61:选择所有所处浓度区间超过设定的第一阈值的成分气体作为混合气体中的有效成分气体,得到待测气体的成分;
步骤S62:选择各有效气体成分对应的第二模型分别对各有效成分气体进行定量检测,其中对于每一种有效气体成分的定量检测过程具体包括:
步骤S621:利用对应的第二模型的核函数进行KPCA特征提取,具体如下:
在对数据完全无知的状态下,主成分分析(PCA)算法可能会丢失数据信息;虽然通过降维可减少特征个数,消除变量之间的关系,但无法解决非线性依赖问题。设X=[x1;x2;...;xN]表示归一化后的观测样本。其中,每个样本xi为k维行向量,N表示观测样本总数,通过核函数φ(XT)将原始数据X中向量xi映射到高维(D维)空间,称为特征空间,记作Z。
当核函数φ(XT)已经中心化,即:
则在特征空间Z中协方差方程为:
其中,CZ是D×D矩阵。求解协方差矩阵特征值,特征值求解方程为:
其中λ和p分别表示特征值和特征向量,由于未定义映射φ(XT),所以上式无法直接求解。又因为特征向量p可由线性表示,由此存在N维列向量α=[α1,α2,...αn]T,满足:
将(11)式带入(10)式得:
φ(XT)φ(XT)Tφ(XT)α=λφ(XT)α
上式两边左乘φ(XT)T,得:
φ(XT)Tφ(XT)φ(XT)Tφ(XT)α=λφ(XT)Tφ(XT)α
定义核矩阵Ke=φ(XT)Tφ(XT),Ke为N×N的半正定对称矩阵,特征值问题转化为下式的非零特征值求解问题。
Keα=λα
根据核技巧求解核矩阵Ke特征值λ1,λ2,...,λN其中λ1>λ2>...>λN,对应特征向量为α1,α2,...αn。通过求解累计贡献率保留前t个特征向量,累计贡献率求解如下式所示。
假设测试集为含有L个样本的K×L矩阵Xtest=[xtest1;xtest2;...;xtestN],则对其进行中心化后得到/>将/>投影到高维空间特征向量p计算主成分:
其中计算公式为:
其中,1N是一个N×N的矩阵,/>为N×L矩阵,上述两矩阵每个元素都为1/N。
步骤S622:如图3所示,选择对应的第二模型的GBDT回归模型获取该有效气体成分的浓度,GBDT算法通过加法模型及不断减小训练过程产生的残差来将数据分类或回归,建立阵列式气体传感器与对应气体浓度复杂的非线性关系,具体如下:
GBDT(Gradient Boosting Decision Tree)被广泛运用于分类、回归等问题,属于Boosting算法族,集成学习通过构建和结合多个学习器来完成任务。GBDT每一轮迭代拟合残差学习一个CART树(classification and regression tree)作为弱学习器,通过弱学习器组成的基函数的线性组合,不断减小训练中出现的残差。
GBDT算法的模型可描述为
其中模型共训练M轮,每轮产生一个弱学习器T(x;γt),设:
T={(x1,y1),(x2,y2),...,(xn,yn)}为训练样本,前一轮迭代得到的学习器是ft-1(x),损失函数是L(y,ft-1(x)),损失函数使用平方损失函数,即:
L(yi,ft(xi))=(yi-ft-1(xi)-T(xi;γt))2
利用损失函数最小化求解γt,即:
令残差ri,t=yi-ft-1(xi),则:
最终输出强学习器fM(x)。GBDT算法训练步骤如下:
(1)初始化弱学习器
(2)迭代训练:t=1,2,…,M
a.对于样本i=1,2,…,n,计算残差:
ri,t=yi-ft-1(xi)
b.根据残差训练回归树参数γt。
c.模型更新:
ft(x)=ft-1(x)+T(x;γt)
(3)返回强学习器fM(x)。
本申请针对混合气体检测中准确度较低的问题,提出了一种基于机器学习的新型混合气体定性识别和浓度定量检测的方案。针对传统模式识别方法对非线性问题达不到较高精度,模型复杂、对数据量较大的情况学习能力不足且鲁棒性不强的特点,提出基于卷积神经网络的气体所处浓度区间识别方法,算法较容易实现且可处理较大的样本量,不仅实现了对混合气体的定性识别,而且实现对气体所处浓度区间的识别;针对气体识别中的特征提取问题,卷积神经网络将特征图信息映射到高维空间,从而避免了特征提取且达到了较好的效果。方法在二元混合气体定性测试识别率达到了98.6%以上,对二元混合气体所处浓度区间识别准确率在95.4%以上,具有一定的产品化价值,对比BP神经网络,模型具有较高的精度和鲁棒性,准确率对比见附图5。
在浓度检测方面,提出了KPCA结合GBDT的浓度检测算法,对单一气体和混合气体训练不同的模型,根据前面定性识别的结果,使用不同的模型进行浓度检测,相对于单一模型,检测鲁棒性和准确性增强。在二元混合气体测试条件下,测试平均相对误差小于4.1%,相对于弹性网络回归、支持向量机回归,所提出的KPCA结合GBDT浓度定量检测算法平均相对误差分别降低了19.8%,6.4%。方案在二元混合气体测试中浓度回归相对误差远小于传统SVR模型和Elastic Net模型,模型回归相对误差折线图见附图6。
Claims (2)
1.一种基于机器学习的气体传感器阵列混合气体检测方法,其特征在于,包括:
步骤S1:根据可能存在的气体种类,建立多个第二模型,其中,各第二模型分别对应于不同成分的混合气体下的各气体的检测;
步骤S2:建立用于识别混合气体中各气体浓度范围的第一模型;
步骤S3:对第一模型和各第二模型完成训练;
步骤S4:获取气体传感器阵列采集的数据序列;
步骤S5:利用训练完成的第一模型根据气体传感器阵列采集的数据序列检测混合气体中各成分气体的浓度区间;
步骤S6:根据各成分气体的浓度区间,基于气体传感器阵列采集的数据序列,选择对应的第二模型分别对各成分气体进行定量检测;
所述第二模型的个数为:
其中:u为可能存在的气体种类的数目;
所述第一模型为卷积神经网络;
所述第二模型为结合KPCA特征提取算法和GBDT算法的模型;
所述步骤S6具体包括:
步骤S61:选择所有所处浓度区间超过设定的第一阈值的成分气体作为混合气体中的有效成分气体,得到待测气体的成分;
步骤S62:选择各有效气体成分对应的第二模型分别对各有效成分气体进行定量检测;
所述步骤S62中对于每一种有效气体成分的定量检测过程具体包括:
步骤S621:利用对应的第二模型的核函数进行KPCA特征提取;
步骤S622:选择对应的第二模型的GBDT回归模型获取该有效气体成分的浓度;
所述GBDT算法通过加法模型及不断减小训练过程产生的残差来将数据分类或回归,建立阵列式气体传感器与对应气体浓度复杂的非线性关系。
2.一种基于机器学习的气体传感器阵列混合气体检测装置,其特征在于,包括气体传感器阵列、处理器、存储器,以及程序,所述处理器与气体传感器阵列连接,执行所述程序时实现如权利要求1所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023373.6A CN111126575B (zh) | 2020-01-09 | 2020-01-09 | 基于机器学习的气体传感器阵列混合气体检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010023373.6A CN111126575B (zh) | 2020-01-09 | 2020-01-09 | 基于机器学习的气体传感器阵列混合气体检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111126575A CN111126575A (zh) | 2020-05-08 |
CN111126575B true CN111126575B (zh) | 2023-11-03 |
Family
ID=70487612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010023373.6A Active CN111126575B (zh) | 2020-01-09 | 2020-01-09 | 基于机器学习的气体传感器阵列混合气体检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126575B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112014785B (zh) * | 2020-08-06 | 2023-07-11 | 三峡大学 | 基于弹性网络的空心线圈电流互感器误差补偿方法 |
CN112098605A (zh) * | 2020-09-21 | 2020-12-18 | 哈尔滨工业大学 | 一种高鲁棒性化学传感器阵列软测量方法 |
CN114660231B (zh) * | 2020-12-22 | 2023-11-24 | 中国石油化工股份有限公司 | 气体浓度预测方法、系统、机器可读存储介质及处理器 |
CN113126488B (zh) * | 2021-03-17 | 2022-10-28 | 淮阴工学院 | 一种物质混合智能系统 |
CN113065306B (zh) * | 2021-03-18 | 2024-09-20 | 锐立平芯微电子(广州)有限责任公司 | 一种基于机器学习的半导体器件敏感性分析方法 |
CN113239989A (zh) * | 2021-04-26 | 2021-08-10 | 深圳市水务科技有限公司 | 气体浓度识别方法、系统、电子设备及存储介质 |
CN113607776B (zh) * | 2021-07-21 | 2023-03-10 | 广州德芯半导体科技有限公司 | 一种阵列型mems多气体传感器的实现方法 |
CN113267535A (zh) * | 2021-07-21 | 2021-08-17 | 深圳盛方科技有限公司 | 一种智能气体识别方法及其装置 |
CN115228511A (zh) * | 2022-06-13 | 2022-10-25 | 广东众志检测仪器有限公司 | 一种超低温试验箱的快速温变方法 |
CN115860056B (zh) * | 2023-02-17 | 2023-05-26 | 电子科技大学 | 一种用于混合气体浓度预测的传感器阵列神经网络方法 |
CN117612644B (zh) * | 2024-01-23 | 2024-04-09 | 上海凌泽信息科技有限公司 | 一种空气安全评价方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102192927A (zh) * | 2010-11-05 | 2011-09-21 | 重庆大学 | 一种基于电子鼻技术的空气质量监测系统及其监测方法 |
CN105651939A (zh) * | 2015-12-29 | 2016-06-08 | 重庆大学 | 电子鼻系统中基于凸集投影的浓度检测精度校正方法 |
CN109632891A (zh) * | 2018-12-19 | 2019-04-16 | 江苏智闻智能传感科技有限公司 | 一种利用阵列气体传感器监测气体种类以及浓度的方法 |
CN110346514A (zh) * | 2019-07-09 | 2019-10-18 | 南京工程学院 | 混合气体识别方法、装置、计算机设备和存储介质 |
CN110412883A (zh) * | 2019-07-22 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种控制气体源的方法、装置、控制设备及存储介质 |
-
2020
- 2020-01-09 CN CN202010023373.6A patent/CN111126575B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102192927A (zh) * | 2010-11-05 | 2011-09-21 | 重庆大学 | 一种基于电子鼻技术的空气质量监测系统及其监测方法 |
CN105651939A (zh) * | 2015-12-29 | 2016-06-08 | 重庆大学 | 电子鼻系统中基于凸集投影的浓度检测精度校正方法 |
CN109632891A (zh) * | 2018-12-19 | 2019-04-16 | 江苏智闻智能传感科技有限公司 | 一种利用阵列气体传感器监测气体种类以及浓度的方法 |
CN110346514A (zh) * | 2019-07-09 | 2019-10-18 | 南京工程学院 | 混合气体识别方法、装置、计算机设备和存储介质 |
CN110412883A (zh) * | 2019-07-22 | 2019-11-05 | 珠海格力电器股份有限公司 | 一种控制气体源的方法、装置、控制设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张铭.基于RVM的混合气体识别与浓度检测算法研究.《中国优秀硕士学位论文全文数据库 信息科技辑》.2017,(第02期),论文第8,17,38-52页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111126575A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126575B (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
Hu et al. | Band selection of hyperspectral images using multiobjective optimization-based sparse self-representation | |
CN105224872B (zh) | 一种基于神经网络聚类的用户异常行为检测方法 | |
CN112001270B (zh) | 基于一维卷积神经网络的地面雷达自动目标分类识别方法 | |
Yun | Prediction model of algal blooms using logistic regression and confusion matrix | |
KR20180120056A (ko) | 학습 데이터 전처리 방법 및 시스템 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN108960421B (zh) | 改进基于bp神经网络的水面无人艇航速在线预报方法 | |
CN112557034B (zh) | 一种基于pca_cnns的轴承故障诊断方法 | |
CN111638034B (zh) | 基于深度学习的应变天平温度梯度误差补偿方法及系统 | |
CN111275168A (zh) | 基于卷积全连接的双向门控循环单元的空气质量预测方法 | |
CN108805061A (zh) | 基于局部自适应判别分析的高光谱图像分类方法 | |
Hossin et al. | Breast cancer detection: an effective comparison of different machine learning algorithms on the Wisconsin dataset | |
CN112504682A (zh) | 基于粒子群优化算法的底盘发动机故障诊断方法及系统 | |
Kang | Machine learning: Diagnostics and prognostics | |
Ridok et al. | A hybrid feature selection on AIRS method for identifying breast cancer diseases | |
CN117171681B (zh) | 非平衡小样本下的无人机舵面智能故障诊断方法及装置 | |
CN116452820B (zh) | 环境污染等级确定方法及装置 | |
CN116738172A (zh) | 一种基于机器学习的大型混合暴露数据分析方法 | |
CN116933025A (zh) | 基于vmd与dbo-lstm-at的变压器顶层油温预测方法 | |
US20230092949A1 (en) | System and method for estimating model metrics without labels | |
CN116519661A (zh) | 一种基于卷积神经网络的大米识别检测方法 | |
CN110728292A (zh) | 一种多任务联合优化下的自适应特征选择算法 | |
CN115618506A (zh) | 一种单轴联合循环燃气轮机功率的预测方法 | |
CN115423091A (zh) | 一种条件对抗神经网络训练方法、场景生成方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |