CN111898744A - 基于池化lstm的tdlas痕量气体浓度检测方法 - Google Patents

基于池化lstm的tdlas痕量气体浓度检测方法 Download PDF

Info

Publication number
CN111898744A
CN111898744A CN202010796156.0A CN202010796156A CN111898744A CN 111898744 A CN111898744 A CN 111898744A CN 202010796156 A CN202010796156 A CN 202010796156A CN 111898744 A CN111898744 A CN 111898744A
Authority
CN
China
Prior art keywords
lstm
gas concentration
training
concentration detection
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010796156.0A
Other languages
English (en)
Inventor
郑可尧
赵雪梦
郑红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vison Vision Danyang Co ltd
Original Assignee
Vison Vision Danyang Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vison Vision Danyang Co ltd filed Critical Vison Vision Danyang Co ltd
Priority to CN202010796156.0A priority Critical patent/CN111898744A/zh
Publication of CN111898744A publication Critical patent/CN111898744A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

本发明提供了基于池化LSTM的TDLAS痕量气体浓度检测方法,属于气体浓度检测技术领域。本发明提出将池化金字塔PP‑LSTM深度学习网络模型用于TDLAS痕量气体浓度检测,第一层LSTM1实现输入信号局部特征提取,池化层下采样LSTM1输出得到更大时间跨度的粗粒度特征,第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。本发明不仅提高了TDLAS痕量气体浓度的检测精度,减少了训练过程中的冗余信息,有效地降低了网络高层的特征及时序维度。

Description

基于池化LSTM的TDLAS痕量气体浓度检测方法
技术领域
本发明涉及气体浓度检测领域,尤其涉及基于池化LSTM的TDLAS痕量气体浓度检测方法。
背景技术
TDLAS(Tunable Diode Laser Absorption Spectroscopy)主要是利用可调谐半导体激光器的窄线宽和波长随注入电流改变的特性实现对分子的单个或几个距离很近很难分辨的吸收线进行测量。广泛用于获得分子结构的信息、研究其动力学过程和痕量气体监测分析,是常用的一种痕量气体检测方法。由于痕量气体浓度检测要求的激光调制信号微弱,且受到光学器件干涉条纹、电子器件白噪声、信号漂移、气压变化、光路尘埃等诸多不同干扰因素的影响,使得有效检测信号常常淹没于干扰信号之中。因此,强干扰情况下的微弱信号提取,成为提高TDLAS气体检测精度的关键。已有的TDLAS气体浓度检测方法,主要采取时域分析、频域分析、小波分析、相关分析、经验模态分解,以及这些方法组合进行噪声去除,其去噪核心是通过分析噪声与信号模式的差别,制定去噪策略或构建去噪模型。TDLAS气体浓度检测精度的提高围绕其二次谐波信号的去噪问题,由于TDLAS气体有效信号十分微弱(μV级),常常淹没于噪声信号之中。依照传统的序列信号噪声去除方法,TDLAS系统提高信噪比的主要方法包括:小波变换(wavelet transform,WT)去噪、自适应Savitzky-Golay(S-G)去噪和EMD-FCR去噪。
但是,由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂,单纯的信号分析与处理方法难以穷尽所有情况,使得TDLAS精确气体浓度检测始终面临挑战。
现有技术至少存在以下不足:
1.由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂,单纯的信号分析与处理方法难以穷尽所有情况;
2.由于TDLAS设备噪声未知或难以解析表达,使得现有技术始终面临参数选择主观、适应性受限、信号描述不确定等问题,使得TDLAS痕量气体检测的精度难以进一步提升;
3.由于TDLAS有效信号十分微弱,常常淹没于噪声信号之中,现有技术无法在存在多种不同强度的噪声的条件下对痕量信号进行有效的处理;
4.针对TDLAS信号,若直接使用多层级联LSTM网络结构,在训练过程中造成信息冗余,模型极易过拟合。
发明内容
为解决现有技术中存在的技术问题,本发明将深度学习中的LSTM网络用于检测TDLAS气体气体浓度检测,并对LSTM网络进行改进,添加池化层和两层全连接层,通过对输入信号的深度学习,对模型进行训练,将训练后的模型应用于TDLAS气体气体浓度检测中。通过实验验证,本发明通过引入PP-LSTM模型并训练得到权重模型,能够准确检测气体气体浓度。
本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
PP-LSTM为池化金字塔长短时记忆(Pool Pyramid Long Short Term Memory)网络模型。LSTM是一种含有LSTM区块的类神经网络,LSTM区块被称为一种智能网络单元,因为它可以记忆不定时间长度的数值,用于解决一般的循环神经网络RNN存在的长期依赖问题。
最大池化层(Max Pooling Layer)对LSTM的输出进行最大池化操作可以得到更大时间跨度的粗粒度特征,利用第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
优选地,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
PP-LSTM网络模型针对TDLAS一维信号分析,LSTM1的输入信号X1,即为TDLAS系统采集的一维时序信号:
Figure BDA0002625691420000021
其中,
T1是LSTM1的时序长度。
LSTM1每个时序的状态输出为:
Figure BDA0002625691420000022
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
最大池化层对每N个LSTM1的状态输出信号取其最大值,减少数据时序长度的大小,减少计算量,防止“数据冗余”现象,减小训练过程中出现过拟合的几率;
引入最大池化层,针对LSTM1的状态输出H1进行最大值池化操作,每N个状态输出信号取其最大值作为LSTM2的输入X2
Figure BDA0002625691420000031
其中,
T2是LSTM2的时序长度。
Figure BDA0002625691420000032
其中,
N是池化步长。
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出做为LSTM单元LSTM2的输出;
LSTM2每个时序的状态输出:
Figure BDA0002625691420000033
LSTM2最后一个时序的状态输出
Figure BDA0002625691420000034
做为LSTM网络结构的输出。
在LSTM单元LSTM2之后,添加两层全连接层,拟合非线性特征;为提升模型拟合非线性特征的能力,将
Figure BDA0002625691420000035
输入到两层全连接层,输出得到TDLAS浓度信号的检测值ypre
该PP-LSTM模型提高了LSTM网络针对TDLAS信号表达的归纳偏置强度和信息表达容量。
优选地,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
优选地,所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
Figure BDA0002625691420000036
Figure BDA0002625691420000037
其中,
m为样本的数量;
Figure BDA0002625691420000041
为该模型针对第i个样本对应的浓度检测值;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
优选地,PP-LSTM气体浓度检测模型具体训练过程包括:
S01:在训练过程中,将真实浓度值输入到PP-LSTM网络模型中先使用loss1函数作为损失函数训练,loss1损失函数值会震荡下降,直至相邻迭代次数之间loss1的下降幅度
Figure BDA0002625691420000042
时,其中:
Figure BDA0002625691420000043
S02:更换loss2函数作为损失函数在loss1函数训练的基础上继续训练,loss2震荡下降,直至相邻迭代次数之间loss2的下降幅度
Figure BDA0002625691420000044
时,其中:
Figure BDA0002625691420000045
S03:停止训练,保存训练权重模型。
优选地,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
优选地,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
优选地,步骤二中,在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
优选地,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
优选地,所述检测精度指标为相对误差:
计算公式如下:
Figure BDA0002625691420000046
其中,
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
Figure BDA0002625691420000051
为该组数据的相对误差。
与现有技术相对比,本发明的有益效果如下:
1.本发明借鉴使用深度神经网络的思想,并使用LSTM层作为基本结构单元,该技术能够拟合训练样本的绝大多数情况,同时能够降低多种不同强度噪声对痕量信号的影响;
2.本发明通过在两层LSTM层之间添加池化层,使整个结构呈金字塔状,该网络结构可以对时序信号中较大时间尺度上的特征进行提取,不仅减少了训练过程中的冗余信息,而且提高了检测精度。尤其是,针对TDLAS痕量气体检测问题,在给定甲烷TDLAS数据集上,检测精度误差达到了1.5%以下;
3.本发明通过采用金字塔多尺度结构,有效地降低了网络高层的特征及时序的维度,降低了网络过拟合的概率;
4.本发明在训练过程中分阶段使用两种损失函数,更有效地保证了损失函数快速下降到足够小。
附图说明
图1是本发明PP-LSTM网络模型示意图。
图2是多层LSTM单元级联的网络模型。
图3是本发明实施例1中PP-LSTM网络模型示意图。
图4a~4j是本发明实施例1中每类浓度的检测值拟合分布图,包括多张曲线图;针对测试集中每类浓度的检测结果,将检测浓度值的频率直方图及拟合得到的正态分布曲线可视化(注:将直方图、曲线与横轴围成的面积设置为1),每类浓度的检测结果呈现以真实浓度值为均值的正态分布。
图4a为本发明实施例1中针对浓度为1ppm在测试集上的检测结果分布;
图4b为本发明实施例1中针对浓度为3ppm在测试集上的检测结果分布;
图4c为本发明实施例1中针对浓度为6.1ppm在测试集上的检测结果分布;
图4d为本发明实施例1中针对浓度为8ppm在测试集上的检测结果分布;
图4e为本发明实施例1中针对浓度为9.72ppm在测试集上的检测结果分布;
图4f为本发明实施例1中针对浓度为50ppm在测试集上的检测结果分布;
图4g为本发明实施例1中针对浓度为70.8ppm在测试集上的检测结果分布;
图4h为本发明实施例1中针对浓度为150ppm在测试集上的检测结果分布;
图4i为本发明实施例1中针对浓度为200ppm在测试集上的检测结果分布;
图4j为本发明实施例1中针对浓度为253ppm在测试集上的检测结果分布;
图5是本发明基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法流程图。
图6为训练初始使用loss2作为损失函数的随着训练迭代次数增加损失值的变化趋势图。
图7a为训练初始阶段使用loss2作为损失函数,随着训练迭代次数增加损失值的变化趋势图;
图7b为分阶段使用不同损失函数,训练初始阶段使用loss1作为损失函数,然后更换loss2作为损失函数,随着训练迭代次数增加损失值的变化趋势图。
具体实施方式
下面结合附图1-3,图4a-图4j,图5、图6、图7a和图7b,对本发明的具体实施方式作详细的说明。
本发明提供了一种基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
最大池化层(Max Pooling Layer)对LSTM的输出进行最大池化操作可以得到更大时间跨度的粗粒度特征,利用第二层LSTM2获得更高层的全局特征,两层LSTM网络结构通过学习获得输入序列信息特征表达;最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
作为优选实施方式,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
PP-LSTM网络模型针对TDLAS一维信号分析,LSTM1的输入信号X1,即为TDLAS系统采集的一维时序信号:
Figure BDA0002625691420000071
其中,
T1是LSTM1的时序长度。
LSTM1每个时序的状态输出为:
Figure BDA0002625691420000072
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
最大池化层对每N个LSTM1的状态输出信号取其最大值,减少数据时序长度的大小,减少计算量,防止“数据冗余”现象,减小训练过程中出现过拟合的几率;
引入最大池化层,针对LSTM1的状态输出H1进行最大值池化操作,每N个状态输出信号取其最大值作为LSTM2的输入X2
Figure BDA0002625691420000073
其中,
T2是LSTM2的时序长度。
Figure BDA0002625691420000074
其中,
N是池化步长。
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出做为LSTM单元LSTM2的输出;
LSTM2每个时序的状态输出:
Figure BDA0002625691420000075
LSTM2最后一个时序的状态输出
Figure BDA0002625691420000076
做为LSTM网络结构的输出。
在LSTM单元LSTM2之后,添加两层全连接层,拟合非线性特征;为提升模型拟合非线性特征的能力,将
Figure BDA0002625691420000077
输入到两层全连接层,输出得到TDLAS浓度信号的检测值ypre
该PP-LSTM模型提高了LSTM网络针对TDLAS信号表达的归纳偏置强度和信息表达容量。
作为优选实施方式,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
作为优选实施方式,所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
Figure BDA0002625691420000081
Figure BDA0002625691420000082
其中,
m为样本的数量;
Figure BDA0002625691420000083
为该模型针对第i个样本对应的浓度检测值;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
作为优选实施方式,PP-LSTM气体浓度检测模型具体训练过程包括:
S01:在训练过程中,将真实浓度值输入到PP-LSTM网络模型中先使用loss1函数作为损失函数训练,loss1损失函数值会震荡下降,直至相邻迭代次数之间loss1的下降幅度
Figure BDA0002625691420000084
时,其中:
Figure BDA0002625691420000085
S02:更换loss2函数作为损失函数在loss1函数训练的基础上继续训练,loss2震荡下降,直至相邻迭代次数之间loss2的下降幅度
Figure BDA0002625691420000086
时,其中:
Figure BDA0002625691420000087
S03:停止训练,保存训练权重模型。
作为优选实施方式,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
作为优选实施方式,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
作为优选实施方式,步骤二中,在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
作为优选实施方式,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
作为优选实施方式,所述检测精度指标为相对误差:
计算公式如下:
Figure BDA0002625691420000091
其中,
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
Figure BDA0002625691420000092
为该组数据的相对误差。
实施例1
根据本发明的一个具体实施方案,本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
利用TDLAS装置以不同频率采集两组不同气体浓度的数据,由于前后两次采集数据时TDLAS系统设置的频率不同,第一次采集时10000个相同时间间隔采集的数据点构成一个周期的数据序列,第二次采集时500个相同时间间隔采集的数据点构成一个周期的数据序列,共采集每类浓度样本的数据量见表1:
表1.两次采集的不同浓度样本数据量
Figure BDA0002625691420000093
针对每类浓度数据,随机选取80%样本作为训练样本集,其余样本作为测试样本集对训练得到的网络模型进行性能测试。
步骤二:对数据集进行降采样和归一化处理;
由于前后两次采集实验数据每组时序信号的个数不同,分别为10000和500,故针对每组数据,在保证每组序列信号波形不失真的条件下均将其降采样为120个序列信号,并将每组数据的序列信号值均线性归一化到[-1,1]。
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
如附图3,采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;将TDLAS系统采集的一维时序信号经过预处理之后作为输入信号X1输入到LSTM1中,LSTM1的时序长度T1=120。
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作,每N个状态输出信号取其最大值;针对LSTM1的状态输出H1进行最大值池化操作,每3个状态输出信号取其最大值作为LSTM2的输入信号X2,LSTM2的时序长度
Figure BDA0002625691420000101
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行全局粗粒度特征提取,LSTM2最后一个时序的状态输出作为LSTM单元LSTM2的输出;
在LSTM单元LSTM2之后,添加两层全连接层,拟合非线性特征;将LSTM2最后一个时序的状态输出
Figure BDA0002625691420000102
输入到两层全连接层中,输出即得到TDLAS浓度信号的检测值ypre
步骤四:对步骤三构建的PP-LSTM气体浓度检测模型进行训练;
利用步骤二所制作的数据集及步骤三所构建的PP-LSTM网络模型对训练样本集进行训练,在训练的不同阶段选择不同的损失函数,直至网络模型损失值下降到允许范围内,停止训练。
针对PP-LSTM网络模型,分别使用两种不同的损失函数对网络模型进行训练,这两种损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
Figure BDA0002625691420000105
Figure BDA0002625691420000103
其中,
m为样本的数量;
Figure BDA0002625691420000104
为该模型针对第i个样本对应的浓度检测值;
yi为第i个样本浓度的真实值。
loss1用来衡量浓度检测值与真实值的绝对误差,loss2用来衡量浓度检测值与真实值之间的相对误差。
在训练初始阶段使用loss1函数作为模型的损失函数,使得浓度检测值与真实值之间的绝对误差不断降低,loss1训练一定次数之后,loss1函数值不再明显地震荡下降。更换loss2作为损失函数,继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数,而在训练的开始阶段使用loss2,下降幅度不明显。
如附图6在训练初始阶段使用loss2作为损失函数,随着训练迭代次数增加损失值下降幅度不明显;如附图7a和附图7b为分阶段使用损失函数,先使用loss1作为损失函数,然后更换loss2作为损失函数,则可以保证损失函数能够下降到足够小。
PP-LSTM气体检测网络模型具体训练过程如下:
对于每一组序列信号对应的浓度值,不做任何处理,在训练过程中将真实浓度值输入到PP-LSTM网络模型中进行训练。
S01:在训练过程中,先使用loss1函数作为损失函数训练,loss1损失函数值会震荡下降,直至相邻迭代次数之间loss1的下降幅度
Figure BDA0002625691420000111
时,其中:
Figure BDA0002625691420000112
S02:更换loss2函数作为损失函数在loss1函数训练的基础上继续训练,loss2震荡下降,直至相邻迭代次数之间loss2的下降幅度
Figure BDA0002625691420000113
时,其中:
Figure BDA0002625691420000114
S03:停止训练,保存训练权重模型。
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试集样本数据进行检测,并计算该模型的检测精度;
测试样本集输入训练获得的PP-LSTM气体浓度检测模型,进行批量检测,并计算相对误差,将相对误差作为评估模型精度的指标,相对误差计算公式如下:
Figure BDA0002625691420000115
其中:
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
Figure BDA0002625691420000116
为该组数据的相对误差。
每类浓度检测误差即为该类浓度每组数据检测误差的平均值,总体误差即为所有浓度数据检测误差的平均值,测试结果如表2所示:
表2.测试集测试结果
Figure BDA0002625691420000121
由上表结果可知,类似附图2所示的LSTM级联结构,直接使用两层LSTM级联的结构针对上述数据集进行训练,网络模型无法收敛,测试误差极大,没有参考意义。而使用本发明中的PP-LSTM模型结构,十类气体浓度检测相对误差都非常小,整个测试集的相对误差为0.69%,故由上述具体实例可进一步验证,本发明中的PP-LSTM模型能够对TDLAS一维序列信号的浓度进行高精度检测。
根据表2的测试结果,将每类浓度的测试数据的检测值可视化,并计算每类浓度检测值的均值和标准差值,拟合其正态分布曲线如附图4所示,可以看出每类浓度的检测结果基本呈现出以真实浓度为均值的正态分布。
本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法,并利用该方法对上述实施例进行了数据采集及处理、模型构造、模型训练及样本数据检测。附图4的结果验证了本发明采用的方法在处理TDLAS气体浓度检测方面优于LSTM级联,本发明针对多类浓度信号能够实现精确检测,同时每类浓度的检测结果呈现出正态分布趋势。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均包含在本发明的保护范围之内。

Claims (10)

1.基于池化LSTM的TDLAS痕量气体浓度检测方法,其特征在于,包括以下步骤:
步骤一:采集原始数据,制作数据集,所述数据集包括训练样本集和测试样本集;
步骤二:对数据集进行降采样和归一化处理;
步骤三:构建池化LSTMPP-LSTM气体浓度检测模型;
步骤四:利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练;
步骤五:利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测,并计算检测模型的精度。
2.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括:
采用第一层LSTM单元LSTM1,对输入信号进行初步信号特征提取;
添加最大池化层,对第一层LSTM单元LSTM1的输出信号进行最大值池化操作;
采用第二层LSTM单元LSTM2,对最大池化层的输出信号进行高层特征提取,将LSTM2最后一个时序的状态输出作为LSTM单元LSTM2的输出;
在LSTM单元LSTM2之后,添加两层全连接层,拟合非线性特征。
3.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤四中,在PP-LSTM气体浓度检测模型训练的不同阶段,使用不同的损失函数进行训练,直至网络模型损失值下降到预设范围内,停止训练。
4.根据权利要求3所述的TDLAS痕量气体浓度检测方法,其特征在于,所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数,公式分别如下:
Figure FDA0002625691410000011
Figure FDA0002625691410000012
其中,
m为样本的数量;
Figure FDA0002625691410000013
为该模型针对第i个样本对应的浓度检测值;
yi为第i个样本浓度的真实值。
5.根据权利要求4所述的TDLAS痕量气体浓度检测方法,其特征在于,PP-LSTM气体浓度检测模型具体训练过程包括:
S01:在训练过程中,将真实浓度值输入到PP-LSTM网络模型中先使用loss1函数作为损失函数训练,loss1损失函数值会震荡下降,直至相邻迭代次数之间loss1的下降幅度
Figure FDA0002625691410000021
时,
其中:
Figure FDA0002625691410000022
S02:更换loss2函数作为损失函数在loss1函数训练的基础上继续训练,loss2震荡下降,直至相邻迭代次数之间loss2的下降幅度
Figure FDA0002625691410000023
时,其中:
Figure FDA0002625691410000024
S03:停止训练,保存训练权重模型。
6.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤一中,利用TDLAS装置以不同频率采集不同气体浓度数据。
7.根据权利要求6所述的TDLAS痕量气体浓度检测方法,其特征在于,针对采集的原始数据,随机抽取80%作为训练样本集,其余数据作为测试样本集。
8.根据权利要求1所述的气体浓度检测方法,其特征在于,步骤二中,在保证每组序列信号波形不失真的条件下,将其降采样为相同数目的序列信号,并将每组数据的序列信号值线性归一化到[-1,1]。
9.根据权利要求1所述的TDLAS痕量气体浓度检测方法,其特征在于,步骤五中,使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测,批量输出样本的浓度检测结果,并与真实浓度比较,计算该检测模型针对测试数据集的检测精度。
10.根据权利要求9所述的TDLAS痕量气体浓度检测方法,其特征在于,所述检测精度指标为相对误差:
计算公式如下:
Figure FDA0002625691410000025
其中:
y为测试数据的真实浓度;
ypre为PP-LSTM模型对该组样本数据的检测浓度;
Figure FDA0002625691410000026
为该组数据的相对误差。
CN202010796156.0A 2020-08-10 2020-08-10 基于池化lstm的tdlas痕量气体浓度检测方法 Pending CN111898744A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010796156.0A CN111898744A (zh) 2020-08-10 2020-08-10 基于池化lstm的tdlas痕量气体浓度检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010796156.0A CN111898744A (zh) 2020-08-10 2020-08-10 基于池化lstm的tdlas痕量气体浓度检测方法

Publications (1)

Publication Number Publication Date
CN111898744A true CN111898744A (zh) 2020-11-06

Family

ID=73246812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010796156.0A Pending CN111898744A (zh) 2020-08-10 2020-08-10 基于池化lstm的tdlas痕量气体浓度检测方法

Country Status (1)

Country Link
CN (1) CN111898744A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673683A (zh) * 2021-08-24 2021-11-19 吉林大学 一种基于cgan判别器和生成器的电子鼻识别模型优化方法
CN114443896A (zh) * 2022-01-25 2022-05-06 百度在线网络技术(北京)有限公司 数据处理方法和用于训练预测模型的方法
CN116152254A (zh) * 2023-04-20 2023-05-23 北京万龙精益科技有限公司 工业泄露目标气体检测模型训练方法、检测方法、电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673683A (zh) * 2021-08-24 2021-11-19 吉林大学 一种基于cgan判别器和生成器的电子鼻识别模型优化方法
CN114443896A (zh) * 2022-01-25 2022-05-06 百度在线网络技术(北京)有限公司 数据处理方法和用于训练预测模型的方法
CN114443896B (zh) * 2022-01-25 2023-09-15 百度在线网络技术(北京)有限公司 数据处理方法和用于训练预测模型的方法
CN116152254A (zh) * 2023-04-20 2023-05-23 北京万龙精益科技有限公司 工业泄露目标气体检测模型训练方法、检测方法、电子设备
CN116152254B (zh) * 2023-04-20 2023-07-28 北京万龙精益科技有限公司 工业泄露目标气体检测模型训练方法、检测方法、电子设备

Similar Documents

Publication Publication Date Title
CN111898744A (zh) 基于池化lstm的tdlas痕量气体浓度检测方法
CN111238814B (zh) 一种基于短时希尔伯特变换的滚动轴承故障诊断方法
CN110706720B (zh) 一种端到端无监督深度支撑网络的声学异常检测方法
CN111562108A (zh) 一种基于cnn和fcmc的滚动轴承智能故障诊断方法
CN112906644A (zh) 基于深度迁移学习的机械故障智能诊断方法
CN113420691A (zh) 一种基于皮尔逊相关系数的混合域特征轴承故障诊断方法
CN114563150B (zh) 桥梁健康在线检测模块生成方法、检测方法、工具箱及装置
CN113420795B (zh) 一种基于空洞卷积神经网络的矿物光谱分类方法
CN112036042A (zh) 一种基于变分模态分解的动力设备异常检测方法及系统
CN111861272A (zh) 一种基于多源数据的复杂机电系统异常状态检测方法
CN112182490B (zh) 一种电抗器状态诊断方法及系统
CN117030654B (zh) 一种空气中痕量级二氧化硫浓度测量方法
CN113204850A (zh) 一种桥梁挠度监测中的温度效应分离方法
CN115824519A (zh) 基于多传感器信息融合的阀门泄露故障综合诊断方法
CN114357560A (zh) 基于多模态神经网络的结构健康监测数据检测方法和装置
CN112364296A (zh) 一种基于深度学习的p波到时自动拾取方法
CN114757413A (zh) 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法
CN114487129A (zh) 基于声发射技术的柔性材料的损伤识别方法
CN114660180A (zh) 一种基于声发射与1D CNNs的中小桥梁轻量化健康监测方法与系统
CN113903407A (zh) 成分识别方法、装置、电子设备和存储介质
CN115733673B (zh) 一种基于多尺度残差分类器的数据异常检测方法
CN115905827A (zh) 一种基于神经网络的汽轮机故障诊断方法及装置
CN113686810B (zh) 一种基于卷积神经网络的近红外光谱波长选择方法
CN114896228A (zh) 基于过滤规则多级组合优化的工业数据流清洗模型和方法
CN116933119A (zh) 一种基于卷积神经网络的信号数据去除趋势方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination