CN111898744A - 基于池化lstm的tdlas痕量气体浓度检测方法 - Google Patents
基于池化lstm的tdlas痕量气体浓度检测方法 Download PDFInfo
- Publication number
- CN111898744A CN111898744A CN202010796156.0A CN202010796156A CN111898744A CN 111898744 A CN111898744 A CN 111898744A CN 202010796156 A CN202010796156 A CN 202010796156A CN 111898744 A CN111898744 A CN 111898744A
- Authority
- CN
- China
- Prior art keywords
- lstm
- gas concentration
- training
- concentration detection
- loss
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 110
- 238000000041 tunable diode laser absorption spectroscopy Methods 0.000 title claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 91
- 238000011176 pooling Methods 0.000 claims abstract description 34
- 238000000034 method Methods 0.000 claims abstract description 28
- 230000008569 process Effects 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 60
- 238000012360 testing method Methods 0.000 claims description 49
- 239000000126 substance Substances 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 9
- 230000007423 decrease Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 230000010355 oscillation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 3
- 239000007789 gas Substances 0.000 description 46
- 238000004458 analytical method Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0062—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
Abstract
本发明提供了基于池化LSTM的TDLAS痕量气体浓度检测方法,属于气体浓度检测技术领域。本发明提出将池化金字塔PP‑LSTM深度学习网络模型用于TDLAS痕量气体浓度检测,第一层LSTM1实现输入信号局部特征提取,池化层下采样LSTM1输出得到更大时间跨度的粗粒度特征,第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。本发明不仅提高了TDLAS痕量气体浓度的检测精度,减少了训练过程中的冗余信息,有效地降低了网络高层的特征及时序维度。
Description
技术领域
本发明涉及气体浓度检测领域,尤其涉及基于池化LSTM的TDLAS痕量气体浓度检测方法。
背景技术
TDLAS(Tunable Diode Laser Absorption Spectroscopy)主要是利用可调谐半导体激光器的窄线宽和波长随注入电流改变的特性实现对分子的单个或几个距离很近很难分辨的吸收线进行测量。广泛用于获得分子结构的信息、研究其动力学过程和痕量气体监测分析,是常用的一种痕量气体检测方法。由于痕量气体浓度检测要求的激光调制信号微弱,且受到光学器件干涉条纹、电子器件白噪声、信号漂移、气压变化、光路尘埃等诸多不同干扰因素的影响,使得有效检测信号常常淹没于干扰信号之中。因此,强干扰情况下的微弱信号提取,成为提高TDLAS气体检测精度的关键。已有的TDLAS气体浓度检测方法,主要采取时域分析、频域分析、小波分析、相关分析、经验模态分解,以及这些方法组合进行噪声去除,其去噪核心是通过分析噪声与信号模式的差别,制定去噪策略或构建去噪模型。TDLAS气体浓度检测精度的提高围绕其二次谐波信号的去噪问题,由于TDLAS气体有效信号十分微弱(μV级),常常淹没于噪声信号之中。依照传统的序列信号噪声去除方法,TDLAS系统提高信噪比的主要方法包括:小波变换(wavelet transform,WT)去噪、自适应Savitzky-Golay(S-G)去噪和EMD-FCR去噪。
但是,由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂,单纯的信号分析与处理方法难以穷尽所有情况,使得TDLAS精确气体浓度检测始终面临挑战。
现有技术至少存在以下不足:
1.由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂,单纯的信号分析与处理方法难以穷尽所有情况;
2.由于TDLAS设备噪声未知或难以解析表达,使得现有技术始终面临参数选择主观、适应性受限、信号描述不确定等问题,使得TDLAS痕量气体检测的精度难以进一步提升;
3.由于TDLAS有效信号十分微弱,常常淹没于噪声信号之中,现有技术无法在存在多种不同强度的噪声的条件下对痕量信号进行有效的处理;
4.针对TDLAS信号,若直接使用多层级联LSTM网络结构,在训练过程中造成信息冗余,模型极易过拟合。
发明内容
为解决现有技术中存在的技术问题,本发明将深度学习中的LSTM网络用于检测TDLAS气体气体浓度检测,并对LSTM网络进行改进,添加池化层和两层全连接层,通过对输入信号的深度学习,对模型进行训练,将训练后的模型应用于TDLAS气体气体浓度检测中。通过实验验证,本发明通过引入PP-LSTM模型并训练得到权重模型,能够准确检测气体气体浓度。
本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
PP-LSTM为池化金字塔长短时记忆(Pool Pyramid Long Short Term Memory)网络模型。LSTM是一种含有LSTM区块的类神经网络,LSTM区块被称为一种智能网络单元,因为它可以记忆不定时间长度的数值,用于解决一般的循环神经网络RNN存在的长期依赖问题。
最大池化层(Max Pooling Layer)对LSTM的输出进行最大池化操作可以得到更大时间跨度的粗粒度特征,利用第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
优选地,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
PP-LSTM网络模型针对TDLAS一维信号分析,LSTM1的输入信号X1,即为TDLAS系统采集的一维时序信号:
其中,
T1是LSTM1的时序长度。
LSTM1每个时序的状态输出为:
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
最大池化层对每N个LSTM1的状态输出信号取其最大值,减少数据时序长度的大小,减少计算量,防止“数据冗余”现象,减小训练过程中出现过拟合的几率;
引入最大池化层,针对LSTM1的状态输出H1进行最大值池化操作,每N个状态输出信号取其最大值作为LSTM2的输入X2:
其中,
T2是LSTM2的时序长度。
其中,
N是池化步长。
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出做为LSTM单元LSTM2的输出;
LSTM2每个时序的状态输出:
该PP-LSTM模型提高了LSTM网络针对TDLAS信号表达的归纳偏置强度和信息表达容量。
优选地,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
优选地,所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
其中,
m为样本的数量;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
优选地,PP-LSTM气体浓度检测模型具体训练过程包括:
S03:停止训练,保存训练权重模型。
优选地,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
优选地,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
优选地,步骤二中,在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
优选地,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
优选地,所述检测精度指标为相对误差:
计算公式如下:
其中,
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
与现有技术相对比,本发明的有益效果如下:
1.本发明借鉴使用深度神经网络的思想,并使用LSTM层作为基本结构单元,该技术能够拟合训练样本的绝大多数情况,同时能够降低多种不同强度噪声对痕量信号的影响;
2.本发明通过在两层LSTM层之间添加池化层,使整个结构呈金字塔状,该网络结构可以对时序信号中较大时间尺度上的特征进行提取,不仅减少了训练过程中的冗余信息,而且提高了检测精度。尤其是,针对TDLAS痕量气体检测问题,在给定甲烷TDLAS数据集上,检测精度误差达到了1.5%以下;
3.本发明通过采用金字塔多尺度结构,有效地降低了网络高层的特征及时序的维度,降低了网络过拟合的概率;
4.本发明在训练过程中分阶段使用两种损失函数,更有效地保证了损失函数快速下降到足够小。
附图说明
图1是本发明PP-LSTM网络模型示意图。
图2是多层LSTM单元级联的网络模型。
图3是本发明实施例1中PP-LSTM网络模型示意图。
图4a~4j是本发明实施例1中每类浓度的检测值拟合分布图,包括多张曲线图;针对测试集中每类浓度的检测结果,将检测浓度值的频率直方图及拟合得到的正态分布曲线可视化(注:将直方图、曲线与横轴围成的面积设置为1),每类浓度的检测结果呈现以真实浓度值为均值的正态分布。
图4a为本发明实施例1中针对浓度为1ppm在测试集上的检测结果分布;
图4b为本发明实施例1中针对浓度为3ppm在测试集上的检测结果分布;
图4c为本发明实施例1中针对浓度为6.1ppm在测试集上的检测结果分布;
图4d为本发明实施例1中针对浓度为8ppm在测试集上的检测结果分布;
图4e为本发明实施例1中针对浓度为9.72ppm在测试集上的检测结果分布;
图4f为本发明实施例1中针对浓度为50ppm在测试集上的检测结果分布;
图4g为本发明实施例1中针对浓度为70.8ppm在测试集上的检测结果分布;
图4h为本发明实施例1中针对浓度为150ppm在测试集上的检测结果分布;
图4i为本发明实施例1中针对浓度为200ppm在测试集上的检测结果分布;
图4j为本发明实施例1中针对浓度为253ppm在测试集上的检测结果分布;
图5是本发明基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法流程图。
图6为训练初始使用loss2作为损失函数的随着训练迭代次数增加损失值的变化趋势图。
图7a为训练初始阶段使用loss2作为损失函数,随着训练迭代次数增加损失值的变化趋势图;
图7b为分阶段使用不同损失函数,训练初始阶段使用loss1作为损失函数,然后更换loss2作为损失函数,随着训练迭代次数增加损失值的变化趋势图。
具体实施方式
下面结合附图1-3,图4a-图4j,图5、图6、图7a和图7b,对本发明的具体实施方式作详细的说明。
本发明提供了一种基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
最大池化层(Max Pooling Layer)对LSTM的输出进行最大池化操作可以得到更大时间跨度的粗粒度特征,利用第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
作为优选实施方式,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
PP-LSTM网络模型针对TDLAS一维信号分析,LSTM1的输入信号X1,即为TDLAS系统采集的一维时序信号:
其中,
T1是LSTM1的时序长度。
LSTM1每个时序的状态输出为:
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
最大池化层对每N个LSTM1的状态输出信号取其最大值,减少数据时序长度的大小,减少计算量,防止“数据冗余”现象,减小训练过程中出现过拟合的几率;
引入最大池化层,针对LSTM1的状态输出H1进行最大值池化操作,每N个状态输出信号取其最大值作为LSTM2的输入X2:
其中,
T2是LSTM2的时序长度。
其中,
N是池化步长。
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出做为LSTM单元LSTM2的输出;
LSTM2每个时序的状态输出:
该PP-LSTM模型提高了LSTM网络针对TDLAS信号表达的归纳偏置强度和信息表达容量。
作为优选实施方式,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
作为优选实施方式,所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
其中,
m为样本的数量;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
作为优选实施方式,PP-LSTM气体浓度检测模型具体训练过程包括:
S03:停止训练,保存训练权重模型。
作为优选实施方式,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
作为优选实施方式,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
作为优选实施方式,步骤二中,在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
作为优选实施方式,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
作为优选实施方式,所述检测精度指标为相对误差:
计算公式如下:
其中,
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
实施例1
根据本发明的一个具体实施方案,本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
利用TDLAS装置以不同频率采集两组不同气体浓度的数据,由于前后两次采集数据时TDLAS系统设置的频率不同,第一次采集时10000个相同时间间隔采集的数据点构成一个周期的数据序列,第二次采集时500个相同时间间隔采集的数据点构成一个周期的数据序列,共采集每类浓度样本的数据量见表1:
表1.两次采集的不同浓度样本数据量
针对每类浓度数据,随机选取80%样本作为训练样本集,其余样本作为测试样本集对训练得到的网络模型进行性能测试。
步骤二:对数据集进行降采样和归一化处理;
由于前后两次采集实验数据每组时序信号的个数不同,分别为10000和500,故针对每组数据,在保证每组序列信号波形不失真的条件下均将其降采样为120个序列信号,并将每组数据的序列信号值均线性归一化到[-1,1]。
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
如附图3,采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;将TDLAS系统采集的一维时序信号经过预处理之后作为输入信号X1输入到LSTM1中,LSTM1的时序长度T1=120。
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作,每N个状态输出信号取其最大值;针对LSTM1的状态输出H1进行最大值池化操作,每3个状态输出信号取其最大值作为LSTM2的输入信号X2,LSTM2的时序长度
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行全局粗粒度特征提取,LSTM2最后一个时序的状态输出作为LSTM单元LSTM2的输出;
步骤四:对步骤三构建的PP-LSTM气体浓度检测模型进行训练;
利用步骤二所制作的数据集及步骤三所构建的PP-LSTM网络模型对训练样本集进行训练,在训练的不同阶段选择不同的损失函数,直至网络模型损失值下降到允许范围内,停止训练。
针对PP-LSTM网络模型,分别使用两种不同的损失函数对网络模型进行训练,这两种损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
其中,
m为样本的数量;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
如附图6在训练初始阶段使用loss2作为损失函数,随着训练迭代次数增加损失值下降幅度不明显;如附图7a和附图7b为分阶段使用损失函数,先使用loss1作为损失函数,然后更换loss2作为损失函数,则可以保证损失函数能够下降到足够小。
PP-LSTM气体检测网络模型具体训练过程如下:
对于每一组序列信号对应的浓度值,不做任何处理,在训练过程中将真实浓度值输入到PP-LSTM网络模型中进行训练。
S03:停止训练,保存训练权重模型。
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试集样本数据进行检测,并计算该模型的检测精度;
测试样本集输入训练获得的PP-LSTM气体浓度检测模型,进行批量检测,并计算相对误差,将相对误差作为评估模型精度的指标,相对误差计算公式如下:
其中:
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
每类浓度检测误差即为该类浓度每组数据检测误差的平均值,总体误差即为所有浓度数据检测误差的平均值,测试结果如表2所示:
表2.测试集测试结果
由上表结果可知,类似附图2所示的LSTM级联结构,直接使用两层LSTM级联的结构针对上述数据集进行训练,网络模型无法收敛,测试误差极大,没有参考意义。而使用本发明中的PP-LSTM模型结构,十类气体浓度检测相对误差都非常小,整个测试集的相对误差为0.69%,故由上述具体实例可进一步验证,本发明中的PP-LSTM模型能够对TDLAS一维序列信号的浓度进行高精度检测。
根据表2的测试结果,将每类浓度的测试数据的检测值可视化,并计算每类浓度检测值的均值和标准差值,拟合其正态分布曲线如附图4所示,可以看出每类浓度的检测结果基本呈现出以真实浓度为均值的正态分布。
本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,并利用该方法对上述实施例进行了数据采集及处理、模型构造、模型训练及样本数据检测。附图4的结果验证了本发明采用的方法在处理TDLAS气体浓度检测方面优于LSTM级联,本发明针对多类浓度信号能够实现精确检测,同时每类浓度的检测结果呈现出正态分布趋势。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。
Claims (10)
1.基于池化LSTM的TDLAS痕量气体浓度检测方法,其特征在于,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
2.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出作为LSTM单元LSTM2的输出;
在LSTM单元LSTM2之后,添加两层全连接层,拟合非线性特征。
3.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
6.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
7.根据权利要求6所述的TDLAS痕量气体浓度检测方法,其特征在于,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
8.根据权利要求1所述的气体浓度检测方法,其特征在于,步骤二中,在保证每组序列信号波形不失真的条件下,将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
9.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出样本的浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010796156.0A CN111898744A (zh) | 2020-08-10 | 2020-08-10 | 基于池化lstm的tdlas痕量气体浓度检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010796156.0A CN111898744A (zh) | 2020-08-10 | 2020-08-10 | 基于池化lstm的tdlas痕量气体浓度检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111898744A true CN111898744A (zh) | 2020-11-06 |
Family
ID=73246812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010796156.0A Pending CN111898744A (zh) | 2020-08-10 | 2020-08-10 | 基于池化lstm的tdlas痕量气体浓度检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111898744A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673683A (zh) * | 2021-08-24 | 2021-11-19 | 吉林大学 | 一种基于cgan判别器和生成器的电子鼻识别模型优化方法 |
CN114443896A (zh) * | 2022-01-25 | 2022-05-06 | 百度在线网络技术(北京)有限公司 | 数据处理方法和用于训练预测模型的方法 |
CN116152254A (zh) * | 2023-04-20 | 2023-05-23 | 北京万龙精益科技有限公司 | 工业泄露目标气体检测模型训练方法、检测方法、电子设备 |
-
2020
- 2020-08-10 CN CN202010796156.0A patent/CN111898744A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673683A (zh) * | 2021-08-24 | 2021-11-19 | 吉林大学 | 一种基于cgan判别器和生成器的电子鼻识别模型优化方法 |
CN114443896A (zh) * | 2022-01-25 | 2022-05-06 | 百度在线网络技术(北京)有限公司 | 数据处理方法和用于训练预测模型的方法 |
CN114443896B (zh) * | 2022-01-25 | 2023-09-15 | 百度在线网络技术(北京)有限公司 | 数据处理方法和用于训练预测模型的方法 |
CN116152254A (zh) * | 2023-04-20 | 2023-05-23 | 北京万龙精益科技有限公司 | 工业泄露目标气体检测模型训练方法、检测方法、电子设备 |
CN116152254B (zh) * | 2023-04-20 | 2023-07-28 | 北京万龙精益科技有限公司 | 工业泄露目标气体检测模型训练方法、检测方法、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898744A (zh) | 基于池化lstm的tdlas痕量气体浓度检测方法 | |
CN111238814B (zh) | 一种基于短时希尔伯特变换的滚动轴承故障诊断方法 | |
CN110706720B (zh) | 一种端到端无监督深度支撑网络的声学异常检测方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN112906644A (zh) | 基于深度迁移学习的机械故障智能诊断方法 | |
CN113420691A (zh) | 一种基于皮尔逊相关系数的混合域特征轴承故障诊断方法 | |
CN114563150B (zh) | 桥梁健康在线检测模块生成方法、检测方法、工具箱及装置 | |
CN113420795B (zh) | 一种基于空洞卷积神经网络的矿物光谱分类方法 | |
CN112036042A (zh) | 一种基于变分模态分解的动力设备异常检测方法及系统 | |
CN111861272A (zh) | 一种基于多源数据的复杂机电系统异常状态检测方法 | |
CN112182490B (zh) | 一种电抗器状态诊断方法及系统 | |
CN117030654B (zh) | 一种空气中痕量级二氧化硫浓度测量方法 | |
CN113204850A (zh) | 一种桥梁挠度监测中的温度效应分离方法 | |
CN115824519A (zh) | 基于多传感器信息融合的阀门泄露故障综合诊断方法 | |
CN114357560A (zh) | 基于多模态神经网络的结构健康监测数据检测方法和装置 | |
CN112364296A (zh) | 一种基于深度学习的p波到时自动拾取方法 | |
CN114757413A (zh) | 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法 | |
CN114487129A (zh) | 基于声发射技术的柔性材料的损伤识别方法 | |
CN114660180A (zh) | 一种基于声发射与1D CNNs的中小桥梁轻量化健康监测方法与系统 | |
CN113903407A (zh) | 成分识别方法、装置、电子设备和存储介质 | |
CN115733673B (zh) | 一种基于多尺度残差分类器的数据异常检测方法 | |
CN115905827A (zh) | 一种基于神经网络的汽轮机故障诊断方法及装置 | |
CN113686810B (zh) | 一种基于卷积神经网络的近红外光谱波长选择方法 | |
CN114896228A (zh) | 基于过滤规则多级组合优化的工业数据流清洗模型和方法 | |
CN116933119A (zh) | 一种基于卷积神经网络的信号数据去除趋势方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |