CN111898744A

CN111898744A - 基于池化lstm的tdlas痕量气体浓度检测方法

Info

Publication number: CN111898744A
Application number: CN202010796156.0A
Authority: CN
Inventors: 郑可尧; 赵雪梦; 郑红
Original assignee: Vison Vision Danyang Co ltd
Current assignee: Vison Vision Danyang Co ltd
Priority date: 2020-08-10
Filing date: 2020-08-10
Publication date: 2020-11-06

Abstract

本发明提供了基于池化LSTM的TDLAS痕量气体浓度检测方法，属于气体浓度检测技术领域。本发明提出将池化金字塔PP‑LSTM深度学习网络模型用于TDLAS痕量气体浓度检测，第一层LSTM₁实现输入信号局部特征提取，池化层下采样LSTM₁输出得到更大时间跨度的粗粒度特征，第二层LSTM₂获得更高层的全局特征，两层LSTM网络结构通过学习获得输入序列信息特征表达；最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。本发明不仅提高了TDLAS痕量气体浓度的检测精度，减少了训练过程中的冗余信息，有效地降低了网络高层的特征及时序维度。

Description

基于池化LSTM的TDLAS痕量气体浓度检测方法

技术领域

本发明涉及气体浓度检测领域，尤其涉及基于池化LSTM的TDLAS痕量气体浓度检测方法。

背景技术

TDLAS(Tunable Diode Laser Absorption Spectroscopy)主要是利用可调谐半导体激光器的窄线宽和波长随注入电流改变的特性实现对分子的单个或几个距离很近很难分辨的吸收线进行测量。广泛用于获得分子结构的信息、研究其动力学过程和痕量气体监测分析，是常用的一种痕量气体检测方法。由于痕量气体浓度检测要求的激光调制信号微弱，且受到光学器件干涉条纹、电子器件白噪声、信号漂移、气压变化、光路尘埃等诸多不同干扰因素的影响，使得有效检测信号常常淹没于干扰信号之中。因此，强干扰情况下的微弱信号提取，成为提高TDLAS气体检测精度的关键。已有的TDLAS气体浓度检测方法，主要采取时域分析、频域分析、小波分析、相关分析、经验模态分解，以及这些方法组合进行噪声去除，其去噪核心是通过分析噪声与信号模式的差别，制定去噪策略或构建去噪模型。TDLAS气体浓度检测精度的提高围绕其二次谐波信号的去噪问题，由于TDLAS气体有效信号十分微弱(μV级)，常常淹没于噪声信号之中。依照传统的序列信号噪声去除方法，TDLAS系统提高信噪比的主要方法包括：小波变换(wavelet transform，WT)去噪、自适应Savitzky-Golay(S-G)去噪和EMD-FCR去噪。

但是，由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂，单纯的信号分析与处理方法难以穷尽所有情况，使得TDLAS精确气体浓度检测始终面临挑战。

现有技术至少存在以下不足：

1.由于TDLAS的干扰与干扰、干扰与信号之间的相互耦合机制复杂，单纯的信号分析与处理方法难以穷尽所有情况；

2.由于TDLAS设备噪声未知或难以解析表达，使得现有技术始终面临参数选择主观、适应性受限、信号描述不确定等问题，使得TDLAS痕量气体检测的精度难以进一步提升；

3.由于TDLAS有效信号十分微弱，常常淹没于噪声信号之中，现有技术无法在存在多种不同强度的噪声的条件下对痕量信号进行有效的处理；

4.针对TDLAS信号，若直接使用多层级联LSTM网络结构，在训练过程中造成信息冗余，模型极易过拟合。

发明内容

为解决现有技术中存在的技术问题，本发明将深度学习中的LSTM网络用于检测TDLAS气体气体浓度检测，并对LSTM网络进行改进，添加池化层和两层全连接层，通过对输入信号的深度学习，对模型进行训练，将训练后的模型应用于TDLAS气体气体浓度检测中。通过实验验证，本发明通过引入PP-LSTM模型并训练得到权重模型，能够准确检测气体气体浓度。

本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法，包括以下步骤：

步骤一：采集原始数据，制作数据集，所述数据集包括训练样本集和测试样本集；

步骤二：对数据集进行降采样和归一化处理；

步骤三：构建池化LSTMPP-LSTM气体浓度检测模型；

PP-LSTM为池化金字塔长短时记忆(Pool Pyramid Long Short Term Memory)网络模型。LSTM是一种含有LSTM区块的类神经网络，LSTM区块被称为一种智能网络单元，因为它可以记忆不定时间长度的数值，用于解决一般的循环神经网络RNN存在的长期依赖问题。

最大池化层(Max Pooling Layer)对LSTM的输出进行最大池化操作可以得到更大时间跨度的粗粒度特征，利用第二层LSTM₂获得更高层的全局特征，两层LSTM网络结构通过学习获得输入序列信息特征表达；最后两层为全连接层网络用于根据前端时间序列信息特征的分类与检测特性的回归。

步骤四：利用训练样本集对步骤三构建的PP-LSTM气体浓度检测模型使用梯度下降法进行浓度拟合回归训练；

步骤五：利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试样本数据集进行检测，并计算检测模型的精度。

优选地，步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括：

采用第一层LSTM单元LSTM₁，对输入信号进行初步信号特征提取；

PP-LSTM网络模型针对TDLAS一维信号分析，LSTM₁的输入信号X¹，即为TDLAS系统采集的一维时序信号：

其中，

T₁是LSTM₁的时序长度。

LSTM₁每个时序的状态输出为：

添加最大池化层，对第一层LSTM单元LSTM₁的输出信号进行最大值池化操作；

最大池化层对每N个LSTM₁的状态输出信号取其最大值，减少数据时序长度的大小，减少计算量，防止“数据冗余”现象，减小训练过程中出现过拟合的几率；

引入最大池化层，针对LSTM₁的状态输出H¹进行最大值池化操作，每N个状态输出信号取其最大值作为LSTM₂的输入X²：

其中，

T₂是LSTM₂的时序长度。

其中，

N是池化步长。

采用第二层LSTM单元LSTM₂，对最大池化层的输出信号进行高层特征提取，将LSTM₂最后一个时序的状态输出做为LSTM单元LSTM₂的输出；

LSTM₂每个时序的状态输出：

LSTM₂最后一个时序的状态输出

做为LSTM网络结构的输出。

在LSTM单元LSTM₂之后，添加两层全连接层，拟合非线性特征；为提升模型拟合非线性特征的能力，将

输入到两层全连接层，输出得到TDLAS浓度信号的检测值y_pre

该PP-LSTM模型提高了LSTM网络针对TDLAS信号表达的归纳偏置强度和信息表达容量。

优选地，步骤四中，在PP-LSTM气体浓度检测模型训练的不同阶段，使用不同的损失函数进行训练，直至网络模型损失值下降到预设范围内，停止训练。

优选地，所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数，公式分别如下：

其中，

m为样本的数量；

为该模型针对第i个样本对应的浓度检测值；

y_i为第i个样本浓度的真实值。

loss₁用来衡量浓度检测值与真实值的绝对误差，loss₂用来衡量浓度检测值与真实值之间的相对误差。

在训练初始阶段使用loss1函数作为模型的损失函数，使得浓度检测值与真实值之间的绝对误差不断降低，loss1训练一定次数之后，loss1函数值不再明显地震荡下降。更换loss2作为损失函数，继续训练。此种方案效果优于单独使用loss1或loss2作为损失函数，而在训练的开始阶段使用loss2，下降幅度不明显。

优选地，PP-LSTM气体浓度检测模型具体训练过程包括：

S01：在训练过程中，将真实浓度值输入到PP-LSTM网络模型中先使用loss₁函数作为损失函数训练，loss₁损失函数值会震荡下降，直至相邻迭代次数之间loss₁的下降幅度

时，其中：

S02：更换loss₂函数作为损失函数在loss₁函数训练的基础上继续训练，loss₂震荡下降，直至相邻迭代次数之间loss₂的下降幅度

时，其中：

S03：停止训练，保存训练权重模型。

优选地，步骤一中，利用TDLAS装置以不同频率采集不同气体浓度数据。

优选地，针对采集的原始数据，随机抽取80％作为训练样本集，其余数据作为测试样本集。

优选地，步骤二中，在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号，并将每组数据的序列信号值线性归一化到[-1，1]。

优选地，步骤五中，使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测，批量输出浓度检测结果，并与真实浓度比较，计算该检测模型针对测试数据集的检测精度。

优选地，所述检测精度指标为相对误差：

计算公式如下：

其中，

y为测试数据的真实浓度；

y_pre为PP-LSTM模型对该组样本数据的检测浓度；

为该组数据的相对误差。

与现有技术相对比，本发明的有益效果如下：

1.本发明借鉴使用深度神经网络的思想，并使用LSTM层作为基本结构单元，该技术能够拟合训练样本的绝大多数情况，同时能够降低多种不同强度噪声对痕量信号的影响；

2.本发明通过在两层LSTM层之间添加池化层，使整个结构呈金字塔状，该网络结构可以对时序信号中较大时间尺度上的特征进行提取，不仅减少了训练过程中的冗余信息，而且提高了检测精度。尤其是，针对TDLAS痕量气体检测问题，在给定甲烷TDLAS数据集上，检测精度误差达到了1.5％以下；

3.本发明通过采用金字塔多尺度结构，有效地降低了网络高层的特征及时序的维度，降低了网络过拟合的概率；

4.本发明在训练过程中分阶段使用两种损失函数，更有效地保证了损失函数快速下降到足够小。

附图说明

图1是本发明PP-LSTM网络模型示意图。

图2是多层LSTM单元级联的网络模型。

图3是本发明实施例1中PP-LSTM网络模型示意图。

图4a～4j是本发明实施例1中每类浓度的检测值拟合分布图，包括多张曲线图；针对测试集中每类浓度的检测结果，将检测浓度值的频率直方图及拟合得到的正态分布曲线可视化(注：将直方图、曲线与横轴围成的面积设置为1)，每类浓度的检测结果呈现以真实浓度值为均值的正态分布。

图4a为本发明实施例1中针对浓度为1ppm在测试集上的检测结果分布；

图4b为本发明实施例1中针对浓度为3ppm在测试集上的检测结果分布；

图4c为本发明实施例1中针对浓度为6.1ppm在测试集上的检测结果分布；

图4d为本发明实施例1中针对浓度为8ppm在测试集上的检测结果分布；

图4e为本发明实施例1中针对浓度为9.72ppm在测试集上的检测结果分布；

图4f为本发明实施例1中针对浓度为50ppm在测试集上的检测结果分布；

图4g为本发明实施例1中针对浓度为70.8ppm在测试集上的检测结果分布；

图4h为本发明实施例1中针对浓度为150ppm在测试集上的检测结果分布；

图4i为本发明实施例1中针对浓度为200ppm在测试集上的检测结果分布；

图4j为本发明实施例1中针对浓度为253ppm在测试集上的检测结果分布；

图5是本发明基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法流程图。

图6为训练初始使用loss₂作为损失函数的随着训练迭代次数增加损失值的变化趋势图。

图7a为训练初始阶段使用loss₂作为损失函数，随着训练迭代次数增加损失值的变化趋势图；

图7b为分阶段使用不同损失函数，训练初始阶段使用loss1作为损失函数，然后更换loss2作为损失函数，随着训练迭代次数增加损失值的变化趋势图。

具体实施方式

下面结合附图1-3，图4a-图4j，图5、图6、图7a和图7b，对本发明的具体实施方式作详细的说明。

本发明提供了一种基于池化LSTM PP-LSTM的TDLAS痕量气体浓度检测方法，包括以下步骤：

步骤二：对数据集进行降采样和归一化处理；

步骤三：构建池化LSTMPP-LSTM气体浓度检测模型；

作为优选实施方式，步骤三中所述构建PP-LSTM气体浓度检测模型的步骤包括：

其中，

T₁是LSTM₁的时序长度。

LSTM₁每个时序的状态输出为：

其中，

T₂是LSTM₂的时序长度。

其中，

N是池化步长。

LSTM₂每个时序的状态输出：

LSTM₂最后一个时序的状态输出

做为LSTM网络结构的输出。

输入到两层全连接层，输出得到TDLAS浓度信号的检测值y_pre

作为优选实施方式，步骤四中，在PP-LSTM气体浓度检测模型训练的不同阶段，使用不同的损失函数进行训练，直至网络模型损失值下降到预设范围内，停止训练。

作为优选实施方式，所述不同的损失函数分别为绝对均方差损失函数和相对均方差损失函数，公式分别如下：

其中，

m为样本的数量；

为该模型针对第i个样本对应的浓度检测值；

y_i为第i个样本浓度的真实值。

作为优选实施方式，PP-LSTM气体浓度检测模型具体训练过程包括：

时，其中：

时，其中：

S03：停止训练，保存训练权重模型。

作为优选实施方式，步骤一中，利用TDLAS装置以不同频率采集不同气体浓度数据。

作为优选实施方式，针对采集的原始数据，随机抽取80％作为训练样本集，其余数据作为测试样本集。

作为优选实施方式，步骤二中，在保证每组序列信号波形不失真的条件下将其降采样为相同数目的序列信号，并将每组数据的序列信号值线性归一化到[-1，1]。

作为优选实施方式，步骤五中，使用训练得到的PP-LSTM气体浓度检测模型对测试样本集浓度进行批量检测，批量输出浓度检测结果，并与真实浓度比较，计算该检测模型针对测试数据集的检测精度。

作为优选实施方式，所述检测精度指标为相对误差：

计算公式如下：

其中，

y为测试数据的真实浓度；

y_pre为PP-LSTM模型对该组样本数据的检测浓度；

为该组数据的相对误差。

实施例1

根据本发明的一个具体实施方案，本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法，包括以下步骤：

利用TDLAS装置以不同频率采集两组不同气体浓度的数据，由于前后两次采集数据时TDLAS系统设置的频率不同，第一次采集时10000个相同时间间隔采集的数据点构成一个周期的数据序列，第二次采集时500个相同时间间隔采集的数据点构成一个周期的数据序列，共采集每类浓度样本的数据量见表1：

表1.两次采集的不同浓度样本数据量

针对每类浓度数据，随机选取80％样本作为训练样本集，其余样本作为测试样本集对训练得到的网络模型进行性能测试。

步骤二：对数据集进行降采样和归一化处理；

由于前后两次采集实验数据每组时序信号的个数不同，分别为10000和500，故针对每组数据，在保证每组序列信号波形不失真的条件下均将其降采样为120个序列信号，并将每组数据的序列信号值均线性归一化到[-1，1]。

步骤三：构建池化LSTMPP-LSTM气体浓度检测模型；

如附图3，采用第一层LSTM单元LSTM1，对输入信号进行初步信号特征提取；将TDLAS系统采集的一维时序信号经过预处理之后作为输入信号X¹输入到LSTM₁中，LSTM₁的时序长度T₁＝120。

添加最大池化层，对第一层LSTM单元LSTM1的输出信号进行最大值池化操作，每N个状态输出信号取其最大值；针对LSTM₁的状态输出H¹进行最大值池化操作，每3个状态输出信号取其最大值作为LSTM₂的输入信号X²，LSTM₂的时序长度

采用第二层LSTM单元LSTM2，对最大池化层的输出信号进行全局粗粒度特征提取，LSTM2最后一个时序的状态输出作为LSTM单元LSTM2的输出；

在LSTM单元LSTM2之后，添加两层全连接层，拟合非线性特征；将LSTM₂最后一个时序的状态输出

输入到两层全连接层中，输出即得到TDLAS浓度信号的检测值y_pre。

步骤四：对步骤三构建的PP-LSTM气体浓度检测模型进行训练；

利用步骤二所制作的数据集及步骤三所构建的PP-LSTM网络模型对训练样本集进行训练，在训练的不同阶段选择不同的损失函数，直至网络模型损失值下降到允许范围内，停止训练。

针对PP-LSTM网络模型，分别使用两种不同的损失函数对网络模型进行训练，这两种损失函数分别为绝对均方差损失函数和相对均方差损失函数，公式分别如下：

其中，

m为样本的数量；

为该模型针对第i个样本对应的浓度检测值；

y_i为第i个样本浓度的真实值。

在训练初始阶段使用loss₁函数作为模型的损失函数，使得浓度检测值与真实值之间的绝对误差不断降低，loss₁训练一定次数之后，loss₁函数值不再明显地震荡下降。更换loss₂作为损失函数，继续训练。此种方案效果优于单独使用loss₁或loss₂作为损失函数，而在训练的开始阶段使用loss₂，下降幅度不明显。

如附图6在训练初始阶段使用loss₂作为损失函数，随着训练迭代次数增加损失值下降幅度不明显；如附图7a和附图7b为分阶段使用损失函数，先使用loss₁作为损失函数，然后更换loss₂作为损失函数，则可以保证损失函数能够下降到足够小。

PP-LSTM气体检测网络模型具体训练过程如下：

对于每一组序列信号对应的浓度值，不做任何处理，在训练过程中将真实浓度值输入到PP-LSTM网络模型中进行训练。

S01：在训练过程中，先使用loss₁函数作为损失函数训练，loss₁损失函数值会震荡下降，直至相邻迭代次数之间loss₁的下降幅度

时，其中：

时，其中：

S03：停止训练，保存训练权重模型。

步骤五：利用步骤四中训练获得的PP-LSTM气体浓度检测模型对测试集样本数据进行检测，并计算该模型的检测精度；

测试样本集输入训练获得的PP-LSTM气体浓度检测模型，进行批量检测，并计算相对误差，将相对误差作为评估模型精度的指标，相对误差计算公式如下：

其中：

y为测试数据的真实浓度；

y_pre为PP-LSTM模型对该组样本数据的检测浓度；

为该组数据的相对误差。

每类浓度检测误差即为该类浓度每组数据检测误差的平均值，总体误差即为所有浓度数据检测误差的平均值，测试结果如表2所示：

表2.测试集测试结果

由上表结果可知，类似附图2所示的LSTM级联结构，直接使用两层LSTM级联的结构针对上述数据集进行训练，网络模型无法收敛，测试误差极大，没有参考意义。而使用本发明中的PP-LSTM模型结构，十类气体浓度检测相对误差都非常小，整个测试集的相对误差为0.69％，故由上述具体实例可进一步验证，本发明中的PP-LSTM模型能够对TDLAS一维序列信号的浓度进行高精度检测。

根据表2的测试结果，将每类浓度的测试数据的检测值可视化，并计算每类浓度检测值的均值和标准差值，拟合其正态分布曲线如附图4所示，可以看出每类浓度的检测结果基本呈现出以真实浓度为均值的正态分布。

本发明提供了一种基于池化LSTM的TDLAS痕量气体浓度检测方法，并利用该方法对上述实施例进行了数据采集及处理、模型构造、模型训练及样本数据检测。附图4的结果验证了本发明采用的方法在处理TDLAS气体浓度检测方面优于LSTM级联，本发明针对多类浓度信号能够实现精确检测，同时每类浓度的检测结果呈现出正态分布趋势。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均包含在本发明的保护范围之内。