CN115688865A - 面向脱硫工艺烟气的长短期记忆网络工业软测量方法 - Google Patents
面向脱硫工艺烟气的长短期记忆网络工业软测量方法 Download PDFInfo
- Publication number
- CN115688865A CN115688865A CN202211361424.1A CN202211361424A CN115688865A CN 115688865 A CN115688865 A CN 115688865A CN 202211361424 A CN202211361424 A CN 202211361424A CN 115688865 A CN115688865 A CN 115688865A
- Authority
- CN
- China
- Prior art keywords
- lstm
- time
- desulfurization process
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明涉及工业软测量技术领域,尤其是面向脱硫工艺烟气的长短期记忆网络工业软测量方法,包括:采集电厂脱硫过程中的输入、输出数据组成历史样本数据库;对采集的样本数据进行预处理:建立具有Huber损失和l1正则化的鲁棒LSTM模型并对数据进行异常值检测,用滑动窗口遍历历史数据,将窗口后的一位数据与参考窗中的统计量作差,得到时间序列S1;计算S1箱线图的上边缘和下边缘作为正常范围;若当前值与它参考窗中的统计量之差不在正常范围内,则为异常;将上述的LSTM模型应用于火电厂脱硫过程SO2浓度预测。仿真结果表明,提出的模型异常值和非高斯噪声具有很好的抗干扰能力,减少冗余变量的影响,从而提高了LSTM的预测性能,具有很好的经济性和适用性。
Description
技术领域
本发明涉及数据驱动的工业软测量技术领域,具体涉及一种面向脱硫工艺烟气的长短期记忆网络工业软测量方法。
背景技术
在现代工业过程中,需要对保证过程安全、生产效率和产品质量的关键性能变量进行在线实时监测和控制。然而,一些性能变量,如泥浆成分、流体粘度和气体浓度,很难直接用硬件传感器测量。数据驱动的软测量使用过程自动化系统所采集的历史数据来建立数学模型,为工业过程关键变量的实时监测和控制提供了快速、低成本和易于实现的替代方案,因此得到了广泛的研究和应用。
然而,目前工业过程的软测量建模仍存在以下问题:(1)由于复杂的物理化学反应和结构,工业过程通常表现出强非线性特征;(2)工业过程中往往存在许多冗余变量,使得数据驱动的软测量模型复杂度过高,会出现过拟合现象;(3)过程中各传感器的位置分布不同会导致各变量测量结果之间存在较大时间延迟;(4)实际工业过程会受到环境干扰、传感器漂移和系统故障的影响,测量数据存在非高斯噪声和异常值。
在火电厂脱硫工艺过程中,二级吸收塔排放烟气中的SO2浓度是关系到污染物排放标准和能耗的关键性能指标。但该指标通常不稳定,很难用硬件传感器直接测量。同时,特定的在线分析仪通常价格昂贵且测量耗时。因此,有必要设计软传感器来提供校准信息,提高系统的可靠性。
发明内容
针对上述问题,本发明提供了面向脱硫工艺烟气的长短期记忆网络工业软测量方法。
本发明提供如下技术方案:面向脱硫工艺烟气的长短期记忆网络工业软测量方法,包括如下步骤:
步骤1、采集电厂脱硫过程中的输入、输出数据组成历史样本数据库;
步骤2、对采集的样本数据进行预处理:
步骤3、具有Huber损失和l1正则化的鲁棒LSTM模型并对数据进行异常值检测,用滑动窗口遍历历史数据,将窗口后的一位数据与参考窗中的统计量作差,得到一个新的时间序列S1;其次,计算S1箱线图的上边缘和下边缘作为正常范围;最后,若当前值与它参考窗中的统计量之差不在正常范围内,则视为异常;
步骤4、将上述的LSTM模型应用于火电厂脱硫过程SO2浓度预测。
所述的LSTM模型为具有Huber损失和l1正则化的鲁棒LSTM模型,首先,为了提高LSTM对非高斯噪声和异常值的抵抗能力,采用Huber损失代替经典LSTM的MSE损失。其次,为了降低LSTM模型的复杂性,提高模型的泛化性能,在损失函数中加入l1正则化。
一、算法基础
1、LSTM神经网络算法
LSTM是为了克服标准RNN的梯度消失和梯度爆炸问题而提出的。通过设计三个门控单元来控制信息流。在三个门的控制下,LSTM可以忘记之前的无用信息,并将有用的信息在记忆单元中进行保留传递,具有对时间序列进行预测的能力。由于这些优点,LSTM在软传感器领域得到了很好的研究。研究中LSTM的结构如图1所示。
处理信息的具体流程:首先,上一时刻的记忆单元ct-1通过遗忘门ft遗忘一些无用信息。其次,由当前时刻的输入xt和上一时刻的外部状态ht-1计算出当前时刻新信息通过输入门it控制,将其写入内部状态ct后将其激活。最后,由输出门ot把控,在目前积累的信息ct中选出部分相关的信息传递给外部状态ht。LSTM的计算过程表示如下
ft=σ(Wf·[ht-1,xt]+bf) (1)
it=σ(Wi·[ht-1,xt]+bi) (2)
ot=σ(Wo·[ht-1,xt]+bo) (3)
ht=ot⊙tanh(ct) (6)
式中Wc,Wo,Wf,和bc,bo,bf,分别是权重矩阵和向量偏置,s和u分别是输入和隐藏层神经元个数。⊙为向量点乘,σ(·)和tanh(·)分别是sigmoid和tanh激活函数。给定输出ht,最终的估计由下式得到:
wv和bv分别为最终回归系数向量和偏置。
2、l1正则化
LASSO通过压缩模型参数,可以减小或避免发生过拟合。给出一个线性回归模型,将其引入到普通最小二乘(OLS)估计中:
在等式(8)中,第一项为残差约束项,用来控制解的逼近程度,第二项称为l1惩罚,用来对权重向量进行压缩。λ是非负可调参数,用于平衡精确度与噪声敏感度。当λ的值足够大时,某些相关度低的变量系数就被压缩为0,实现变量选择。当λ=0时,将不再具有约束的作用,权向量保持与OLS的初始估计相同。因此,最优模型的准确性在很大程度上受λ的影响。
3、Huber损失的鲁棒估计
Huber损失是一种稳健的自适应损失函数,它结合了二次损失和线性损失。Huber损失的表达式为:
δ的选择决定了Huber损失是二次或线性的侧重程度。函数对小残差使用二次损失,以保证模型更精确地得到全局最优值,对大残差使用线性损失,以抑制对非高斯噪声和异常值的敏感性。因此Huber损失同时具备了二次和线性损失的优点,不仅对异常值具有鲁棒性,还实现了处处可导。超参数δ可通过交叉验证的方法确定。
二、所设计软测量算法
1、l1-HM-LSTM动态软测量模型
将传统的LSTM作为处理非线性和时间延迟的基本模型,设计了一种新颖的LSTM损失函数,它结合了Huber损失对非高斯噪声的出色抵抗力和l1正则化的出色模型缩减能力,即具有Huber损失和l1正则化的鲁棒LSTM模型中的损失函数为
其中λ控制权重矩阵的收缩强度,δ决定Huber损失的二次或线性程度。
2、基于BPTT的l1-HM-LSTM网络更新计算方法
BPTT是一种在递归神经网络中计算参数梯度的方法。参数梯度可以依次计算和存储,提高计算速度。在研究中,针对提出的l1-HM-LSTM,开发了一种特定的BPTT训练算法。
首先,对于输出梯度:
θf,t=Wf[ht-1,xt]+bf,t=Wfhht-1+Wfxxt+bf,t (13)
θi,t=Wi[ht-1,xt]+bi,t=Wihht-1+Wixxt+bi,t (14)
θo,t=Wo[ht-1,xt]+bo,t=Wohht-1+Woxxt+bo,t (16)
在t-1时刻,沿时间反向传播的误差项定义为,
由等式(16),可以得到
通过计算式(18)中的所有偏导数,得到
注意,我们只提供了应用于LSTM网络的输出门的变化,而其他门的变化可以用类似的方式求出。
Woh的权重梯度是每个时刻的梯度之和。在t时刻,Woh,t的梯度可以表示为
这里
最终Woh的梯度为
对于Wox的权重梯度:
对于bo的偏置梯度
按照Woh,Wox和bo的相同推导过程,可以得到其他权重和偏差的梯度更新方程为
在完成对所提出LSTM的BPTT算法推导之后,使用Adam来执行梯度更新。
3.“滑窗法”交叉检验法求解Huber损失中δ值和l1正则化中的λ
该算法有两类超参数。第一类是LSTM本身的常规训练超参数,如学习率等可以通过经验和一些试验来确定。第二类是决定算法鲁棒性和正则化程度的高级超参数,即Huber损失中的δ和l1正则化中的λ。通过网格搜索和移动窗口交叉验证(MWCV)进行选择。
网格搜索:是一种通过循环遍历所有候选参数来优化模型表现的方法。该过程可分为两个步骤。(1)设置超参数δ和λ分别在给定范围[0.1,1]和[0,λub]内均匀分布,λub是一个足够大的值,使模型发生欠拟合。(2)从定义的范围中找出所有可能的超参数组合(3)通过两个循环找到最佳的超参数组合,其中内循环使用MWCV方法评估平均模型性能,外循环遍历每一种可能的超参数。
MWCV:交叉验证作为性能评估方法,常用来对模型的超参数进行寻优。考虑到数据的顺序对于时间序列相关的问题非常重要,于是采用MWCV对训练数据集和验证数据集进行划分来确定鲁棒LSTM的最佳δ和λ。该算法的示意图如图2所示。通过构造多个沿子数据集同步移动的窗口,步长为1,用来分割验证数据集Zvalidate=Zk+1,并将验证数据集之前子数据集的并集作为训练数据集Ztrain=[Z1,Z2...Zk]。利用上述方法计算了δ和λ的所有可能组合后,选择最小验证损失的组合作为l1-HM-LSTM的最优[δ,λ]。该算法的原理如图4所示。
通过上述描述,可以看出本方案总体流程如下,1、用滑动回归的方法对初始数据集 进行预处理,构造一个多步时间序列数据集D′={{X1,X2,...,Xn-p},{dp+m,dp+m+1,...,dL}},整个数据集分为两部分,前80%为训练数据,其余为测试数据。2、考虑到冗余变量、异常值和非高斯噪声的影响,在标准LSTM中引入Huber损失和l1正则化,重新定义LSTM的损失函数来提高算法的鲁棒性和预测精度。3、为了得到一个可靠稳定的模型,通过移动窗口交叉验证确定最佳[δ,λ],以适应火电厂脱硫过程数据集的误差分布和降低LSTM模型的复杂度,提高模型的泛化性能。4、使用特定的BPTT算法来训练所提出的LSTM,计算公式如(27)-(36)所示。基于相应误差项,采用Adam优化算法对网络权重进行更新。
综上所述,基于Huber损失和l1正则化的鲁棒LSTM软测量算法可以有效地处理输入和输出之间的短期和长期依赖关系,同时在模型训练过程中对异常值和非高斯噪声具有很好的抗干扰能力,并且有助于减少冗余变量的影响,从而提高了LSTM的预测性能,具有很好的经济性和适用性。
附图说明
附图1为LSTM单元结构图。
附图2为移动窗口交叉验证原理图。
附图3为双塔脱硫系统工艺流程图。
附图4为异常值检测图。
附图5为本发明软测量建模方法对脱硫烟气排放中SO2浓度预测曲线。
具体实施方式
下面将结合本发明具体实施方式中的附图,对本发明具体实施方式中的技术方案进行清楚、完整地描述,显然,所描述的具体实施方式仅仅是本发明一种具体实施方式,而不是全部的具体实施方式。基于本发明中的具体实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他具体实施方式,都属于本发明保护的范围。
通过附图可以看出面向脱硫工艺烟气的长短期记忆网络工业软测量方法,包括如下步骤:
步骤1、采集电厂脱硫过程中的输入、输出数据组成历史样本数据库;由35个辅助变量组成的候选输入变量集,如表1所示,SO2浓度是关键的响应变量。以一分钟的采样间隔共采集了2676组过程数据。
表1脱硫系统候选输入变量
步骤2、对采集的样本数据进行预处理:
在建立模型时,需要引入一种滑动回归的方法对数据进行预处理。对于原始时间序列利用滑动窗口m,为LSTM构造多步时间序列,如其中L为原时间序列的长度,xt表示第t时刻的输入数据,dt表示第t时刻的响应输出,p表示预测步长,m决定了LSTM的记忆容量。
步骤3、设计一种新颖的LSTM的损失函数:本发明公开了一种具有Huber损失和l1正则化的鲁棒LSTM模型来预测SO2浓度。首先,为了提高LSTM对非高斯噪声和异常值的抵抗能力,采用Huber损失代替经典LSTM的MSE损失。其次,为了降低LSTM模型的复杂性,提高模型的泛化性能,在损失函数中加入l1正则化。
建立特定的时间反向传播(backpropagation through time,BPTT)训练算法:在这项发明中,针对所提出的LSTM开发了一种特定的BPTT训练算法。利用BPTT算法进行链导数的计算,并使用自适应矩估计(Adam)执行梯度更新。
在确定Huber损失中的δ和l1正则化中的λ时,为了得到可靠稳定的模型,通过网格搜索和移动窗口交叉验证进行选择。
使用异常检测工具包(ADTK)检测异常值。首先用滑动窗口遍历历史数据,将窗口后的一位数据与参考窗中的统计量作差,得到一个新的时间序列S1;其次,计算S1箱线图的上边缘和下边缘作为正常范围;最后,若当前值与它参考窗中的统计量之差不在正常范围内,则视为异常。
具有Huber损失和l1正则化的鲁棒LSTM模型中的损失函数为
对所述的损失函数进行参数梯度训练,
对于输出梯度:
θf,t=Wf[ht-1,xt]+bf,t=Wfhht-1+Wfxxt+bf,t
θi,t=Wi[ht-1,xt]+bi,t=Wihht-1+Wixxt+bi,t
θo,t=Wo[ht-1,xt]+bo,t=Wohht-1+Woxxt+bo,t
在t-1时刻,沿时间反向传播的误差项定义为,
对上式进行偏导数计算获得
Woh的权重梯度是每个时刻的梯度之和,在t时刻,Woh,t的梯度可以表示为
这里
最终Woh的梯度为
对于Wox的权重梯度:
对于bo的偏置梯度
按照Woh,Wox和bo的相同推导过程,得到其他权重和偏差的梯度更新方程为
在完成对所提出LSTM模型的梯度推导之后,使用Adam来执行梯度更新。
步骤4、将上述的LSTM模型应用于火电厂脱硫过程SO2浓度预测。
火电厂采用双吸收塔结构和石灰石-石膏湿法烟气脱硫(FGD)技术。整个FGD工艺主要包括石灰石浆液制备系统、反应吸收系统、烟气系统等。该过程的示意图如图3所示。在该系统中,二级吸收塔排放烟气中的SO2浓度是关键的性能指标,在生产过程中需要严格遵循国家环保标准,但该指标变化频率高,振幅大,通常不稳定,在线分析仪需要定期维护和校准,同时其性能会因老化或故障积累而下降。因此,有必要设计软传感器持续提供SO2浓度的预测结果,不仅可以临时取代在线分析仪的功能,还可以对在线分析仪进行验证和故障识别。
图4显示了该数据集在ADTK中捕获的异常值,经检测共有71个,这可能会影响预测的精度。为体现l1-HM-LSTM算法优越性,本文将其与LSTM、LASSO-LSTM和NNG-MLP软测量算法进行性能比较。本发明采用的模型性能评价指标共有2个:
1)均方根误差RMSE:
2)平均绝对误差MAE
表2显示了每种模型运行十次的最佳实验结果。
表2不同算法对SO2预测的仿真结果
对比结果可以看出,传统LSTM模型由于无关变量较多和非高斯噪声的存在,性能明显较差。虽然NNG-MLP和LASSO-LSTM可以选择输入变量并简化模型,但性能不太理想。所提出的l1-HM-LSTM在所有标准上都优于其他算法,说明模型冗余和测量数据中的非高斯噪声在训练过程中得到了很好的处理。我们的方法在具有非高斯分布和异常值特征的工业过程中具有更好的泛化性能和更高的鲁棒性。其预测结果如图5所示。拟合曲线表明,所提算法能够准确地跟随SO2浓度的动态变化,具有较好的估计效果,验证了所提算法的优越性。
考虑到实际工业过程软测量中经常受到多变量、时间序列和非高斯噪声的影响,本发明提出的算法充分利用LSTM可以有效地捕获输入和输出之间的短期和长期依赖关系,建立变量间的时序对应关系,提升了模型的动态信息处理能力,对于预测相对连续过程中的输出响应非常有用。另一方面,Huber损失融合了线性损失和二次损失,对误差分布具有更好的适应性,应用l1正则化可以降低模型复杂度,进而提高模型性能。
综上所述,本发明公开了一种高效的脱硫过程排放烟气中SO2浓度的软测量模型。仿真结果表明,所提出的算法能够准确地预测过程中SO2浓度。与其他方法进行比较,验证了该方法的泛化性能和鲁棒性。此外,l1-HM-LSTM可以筛选出与工厂现场操作一致的关键控制变量,该模型具有良好的实用性,可以为脱硫系统的优化提供参考。
本发明尽管已经示出和描述了本发明的具体实施方式,对于本领域的普通技术人员而言,可以理解在不脱离发明的原理和精神的情况下可以对这些具体实施方式进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.面向脱硫工艺烟气的长短期记忆网络工业软测量方法,其特征在于包括如下步骤:
步骤1、采集电厂脱硫过程中的输入、输出数据组成历史样本数据库;
步骤2、对采集的样本数据进行预处理:
步骤3、建立具有Huber损失和l1正则化的鲁棒LSTM模型并对数据进行异常值检测,用滑动窗口遍历历史数据,将窗口后的一位数据与参考窗中的统计量作差,得到一个新的时间序列S1;其次,计算S1箱线图的上边缘和下边缘作为正常范围;最后,若当前值与它参考窗中的统计量之差不在正常范围内,则视为异常;
步骤4、将上述的LSTM模型应用于火电厂脱硫过程SO2浓度预测。
2.根据权利要求1所述面向脱硫工艺烟气的长短期记忆网络工业软测量方法,其特征在于,
所述的具有Huber损失和l1正则化的鲁棒LSTM模型,首先,为了提高LSTM对非高斯噪声和异常值的抵抗能力,采用Huber损失代替经典LSTM的MSE损失。其次,为了降低LSTM模型的复杂性,提高模型的泛化性能,在损失函数中加入l1正则化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211361424.1A CN115688865A (zh) | 2022-11-02 | 2022-11-02 | 面向脱硫工艺烟气的长短期记忆网络工业软测量方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211361424.1A CN115688865A (zh) | 2022-11-02 | 2022-11-02 | 面向脱硫工艺烟气的长短期记忆网络工业软测量方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115688865A true CN115688865A (zh) | 2023-02-03 |
Family
ID=85048456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211361424.1A Pending CN115688865A (zh) | 2022-11-02 | 2022-11-02 | 面向脱硫工艺烟气的长短期记忆网络工业软测量方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115688865A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738120A (zh) * | 2023-08-11 | 2023-09-12 | 齐鲁工业大学(山东省科学院) | 面向x荧光品位分析仪的铜品位scn建模算法 |
-
2022
- 2022-11-02 CN CN202211361424.1A patent/CN115688865A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116738120A (zh) * | 2023-08-11 | 2023-09-12 | 齐鲁工业大学(山东省科学院) | 面向x荧光品位分析仪的铜品位scn建模算法 |
CN116738120B (zh) * | 2023-08-11 | 2023-11-03 | 齐鲁工业大学(山东省科学院) | 面向x荧光品位分析仪的铜品位scn建模算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
Zhou et al. | A model for real-time failure prognosis based on hidden Markov model and belief rule base | |
Zhao et al. | Soft sensor modeling of chemical process based on self-organizing recurrent interval type-2 fuzzy neural network | |
CN110706720A (zh) | 一种端到端无监督深度支撑网络的声学异常检测方法 | |
CN111461413B (zh) | 一种公路路面使用性能检测系统 | |
CN106156434A (zh) | 基于局部时滞重构的滑动窗时间差‑高斯过程回归建模方法 | |
CN112270229A (zh) | 一种基于奇异谱分析的滑坡体位移预测方法 | |
CN114282443B (zh) | 基于mlp-lstm有监督联合模型的剩余使用寿命预测方法 | |
CN113516310B (zh) | 一种变压器故障预警方法及系统 | |
CN112990435A (zh) | 一种长短时记忆网络电站风机故障预警方法及系统 | |
CN115034129A (zh) | 一种面向火电厂脱硝装置的NOx排放浓度软测量方法 | |
CN115688865A (zh) | 面向脱硫工艺烟气的长短期记忆网络工业软测量方法 | |
CN113780420B (zh) | 基于gru-gcn的变压器油中溶解气体浓度预测方法 | |
Ismail et al. | Adaptive neural network prediction model for energy consumption | |
CN115438897A (zh) | 一种基于blstm神经网络的工业过程产品质量预测方法 | |
CN116305985A (zh) | 一种基于多传感器数据融合的局部智能通风方法 | |
Chen et al. | Satellite on-orbit anomaly detection method based on a dynamic threshold and causality pruning | |
Huang et al. | A hybrid bayesian deep learning model for remaining useful life prognostics and uncertainty quantification | |
CN114970745B (zh) | 物联网智能安防与环境大数据系统 | |
CN115062764B (zh) | 光照度智能调节与环境参数物联网大数据系统 | |
Dong et al. | Hierarchical causal graph-based fault root cause diagnosis and propagation path identification for complex industrial process monitoring | |
CN116432856A (zh) | 基于cnn-glstm模型的管道动态预警方法及装置 | |
CN114397809B (zh) | 物料称重大数据检测与包装智能控制系统 | |
CN114943328A (zh) | 基于bp神经网络非线性组合的sarima-gru时序预测模型 | |
CN114995248A (zh) | 智能养护与环境参数大数据物联网系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |