CN115936061A

CN115936061A - 基于数据驱动的火电厂烟气含氧量软测量方法及系统

Info

Publication number: CN115936061A
Application number: CN202211379874.3A
Authority: CN
Inventors: 马燕芹; 陈锐; 彭建华; 卞志国; 王洋; 戴会娟
Original assignee: Nanjing Vocational University of Industry Technology NUIT
Current assignee: Nanjing Vocational University of Industry Technology NUIT
Priority date: 2022-11-04
Filing date: 2022-11-04
Publication date: 2023-04-07

Abstract

本发明属于火电厂锅炉热工技术和人工智能技术领域，具体涉及了一种基于数据驱动的火电厂烟气含氧量软测量方法及系统，旨在解决现有软测量方法数据清洗工作量大、网络训练效率低、模型复杂度高的问题。本发明包括：采集火电厂锅炉不同运行状态下的传感器数据集，并进行野值剔除和数据清洗；对清洗后的数据进行分层特征提取和分层特征拼接；基于拼接特征的不同分量对目标输出的影响，通过注意力网络赋予拼接特征不同的权值；基于带有权值的拼接特征集进行预测模型的迭代训练；通过训练好的预测模型进行在线实时的火电厂烟气含氧量软测量。本发明有效实现原始数据降维，并提取深层次特征，模型复杂度低，实现火电厂烟气含氧量的实时、高精度软测量。

Description

基于数据驱动的火电厂烟气含氧量软测量方法及系统

背景技术

近年来，耗电量的急剧增加给火电厂带来了巨大的挑战。然而，燃煤发电的效率不到50％。燃煤锅炉的燃烧效率反映了发电效率。一般情况下，煤的燃烧效率越高，发电量就越大。燃烧过程优化是燃煤电厂的核心和难点之一。然而，考虑到燃烧过程复杂的非线性和动态特性，很难建立精确的燃烧过程优化控制模型。烟气含氧量是关系到煤炭燃烧效率和安全性的主要指标。烟气含氧量的准确测定是优化燃煤燃烧的基础，也得到了广泛的研究。在实际中，一般需要将烟气含氧量保持在5％左右。而烟气含氧量则受锅炉结构、煤种、燃烧过程以及功率负荷、蒸汽压力、气流等状态参数的影响，精确测量含氧量是一个巨大的挑战。

现有的测定烟气含氧量的方法可分为硬测量方法和软测量方法两大类。传统的硬测量方法直接采用氧化锆氧分析仪或热磁氧分析仪直接测量氧含量，其方便灵活，在火电厂中普遍采用。然而，传统的硬件测量成本高、精度低、测量延迟、使用寿命短，而且硬测量装置需要定期进行维护和标定，防止仪器长时间使用引起的测量误差和零点漂移。综上硬测量方法的问题和不足，使得研究人员更加关注其他可替代测量方法。

与硬测量方法不同，软测量方法旨在基于机器学习或者深度学习原理建立煤燃烧过程中可测量与不可测量变量之间的潜在关系[1][2][3]。一般来说，软测量方法可分为两大类，即第一性原理模型(FPMs)和数据驱动模型。如卡尔曼滤波等FPMs是建立在对燃烧过程进行深入分析的基础上的，由于其复杂的动态特性，很难构建精确且稳定的原理模型。数据驱动方法主要基于大量的历史过程数据，建立隐式映射模型来预测氧含量。特别是随着人工智能和大数据技术的快速发展，基于数据驱动的软测量方法因其在精度和实时性方面优于其他测量方法而受到广泛研究[4]。

但是，现有软测量方法还存在诸多问题：(1)设计了针对相邻和非相邻数据的两阶段的数据清洗策略，增加了数据清洗的工作量；(2)设计了基于专家知识的数据融合和主成分分析(PCA)的数据降维方法，由此将高维的原始数据映射到低维空间，达到数据特征提取的目的，但是提取到的特征会受专家经验影响较大，而专家经验往往有限，不能很好地对动态系统有全面的把握，而且PCA在进行特征映射提取时并未考虑目标输出，使得最后提取的特征不能很好地表达目标输出，由此会增加预测模型训练时间、降低预测精度；(3)设计了多层LSTM的预测网络，未引入随机失活层或者随机丢弃层，使得网络训练时间增加，而且训练好的网络存在过拟合的现象，同时在预测网络训练损失函数的选取时，现专利未考虑不同训练样本的比例系数，由此也增加了预测网络的训练时间。

以下文献是与本发明相关的技术背景资料：

[1]J.Sun,X.Meng,J.Qiao,Prediction of Oxygen Content Using WeightedPCA and Improved LSTM Network in MSWI Process,IEEETrans.Instrum.Meas..vol.70,no.4,pp.2507512-2507512,March 2021.

[2]X.Huang,J.Wang,L.Zhang,and B.Wang,Data-driven modeling and fuzzymultiple-model predictive control of oxygen content in coal-fired powerplant,Trans.Inst.Meas.Control,39(11)(2017):1631-1642.

[3]X.Han,Y.Yan,et.al.,Monitoring of Oxygen Content in the Flue Gas ata Coal-Fired Power Plant Using Cloud Modeling Techniques,IEEETrans.Instrum.Meas..63(4)(2014):953-963.

[4]马燕芹，彭建华，周元伟，金誉成，基于注意力机制和多层LSTM的电厂烟气含氧量智能预测方法，CN115017818A.

发明内容

为了解决现有技术中的上述问题，即现有软测量方法数据清洗工作量大、网络训练效率低、模型复杂度高的问题，本发明提供了一种基于数据驱动的火电厂烟气含氧量软测量方法，首先，基于原始采集数据的特点和大数据技术理论，对原始数据进行数据预处理，得到高质量的过程数据；在此基础上，搭建了基于堆叠目标增强自动编码机(stackedtarget-enhanced autoencoder,STAE)的特征提取模型，用于提取可表示原始数据并且和目标输出相关的分层特征量，并通过特征拼接技术将分层特征串联，得到总特征；然后，设计了基于注意力网络的特征权值计算模型，对总特征各个量赋予不同的权值，以更高效的对目标输出进行预测；最后，搭建了基于长短时记忆网络(long short-term memory,LSTM)的预测模型，用于建立权值特征到目标输出的映射函数。

本发明的第一方面，提出了一种基于数据驱动的火电厂烟气含氧量软测量方法，所述软测量方法包括：

获取火电厂锅炉不同运行状态下的传感器数据集，并基于预设的野值阈值进行数据的野值剔除；

以火电厂发电负荷作为数据清洗的基准，基于预设的数据清洗阈值对野值剔除后的数据集进行数据清洗，获得清洗数据集；

基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，并进行分层特征拼接，获得拼接特征集；

基于拼接特征的不同分量对目标输出的影响，通过注意力网络赋予拼接特征不同的权值，获得带有权值的拼接特征集；

基于多层LSTM网络、随机失活层和全连接层构建预测模型，并基于带有权值的拼接特征集进行模型的迭代训练，获得训练好的预测模型；

通过训练好的预测模型进行在线实时的火电厂烟气含氧量软测量。

在一些优选的实施例中，所述传感器数据集包括：

发电负荷、主蒸汽压力、主蒸汽温度、主蒸汽流量、炉膛负压、A1磨煤机煤量、A2磨煤机煤量、A3磨煤机煤量、A4磨煤机煤量、A5磨煤机煤量、A6磨煤机煤量炉膛总风量、A侧风机送风量、B侧风机送风量、一次总风量、二次总风量、A侧二次风量、A侧一次热风、A侧一次冷风、B侧二次风量，B侧一次热风、B侧一次冷风、A侧烟气流量、B侧烟气流量、反应器A侧的3个检测点温度、反应器B侧的3个检测点温度、A侧烟气含氧量和B侧烟气含氧量；

其中，A1、A2、A3、A4、A5、A6为6个监测点的标识，A、B为火电厂烟气含氧量的两个采集点的标识。

在一些优选的实施例中，所述野值剔除，其方法为：

针对每个传感器，分别设置不同的野值阈值；

对于每个传感器，遍历其不同运行状态的传感器数据，将超出当前传感器对应的野值阈值的数据剔除。

在一些优选的实施例中，所述数据清洗，其方法为：

|a_t，1-a_p，1|≤ε

其中，t和p分别表示采样时刻t和采样时刻p，a_t,1和a_p,1分别表示采样时刻t和采样时刻p的发电负荷，ε为预设的数据清洗阈值；

若采样时刻t和采样时刻p的发电负荷a_t,1和a_p,1的关系满足上式，则将采样时刻p的发电负荷a_p,1剔除；

遍历野值剔除后的数据集，获得清洗数据集。

在一些优选的实施例中，所述基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，其方法为：

其中，

为提取的分层特征，

为对目标输出的预测结果，f_di(i＝1，...，n)为堆叠的n个TAE基元中第i个TAE基元用于表示输入数据的激活函数，

为堆叠的n个TAE基元中第i个TAE基元的输出和第i+1个TAE基元的输入，W_di和b_di分别为堆叠的n个TAE基元中第i个TAE基元用于表示输入数据的权值矩阵和偏差向量，f_pi(i＝1，...，n)为堆叠的n个TAE基元中第i个TAE基元用于预测目标输出的激活函数，W_pi和b_pi分别为堆叠的n个TAE基元中第i个TAE基元用于预测目标输出权值矩阵和偏差向量。

在一些优选的实施例中，所述TAE基元，其参数更新方法为：

其中，θ_TAEi＝{W_di，b_di；W_pi，b_pi}为堆叠的n个TAE基元中第i个TAE基元的超参数，N_s为批量训练过程的样本个数，λ_i为用于平衡输入数据重建损失和目标输出编码损失的比例系数，y_k＝[y_kA，y_kB]为第k个目标输出的实际值，

为第k个目标输出的预测值。

在一些优选的实施例中，所述分层特征拼接，其方法为：

其中，F_h为拼接特征，

代表串联拼接操作。

在一些优选的实施例中，所述基于拼接特征的不同分量对目标输出的影响，赋予拼接特征不同的权值，其方法为：

其中，F_i＝[F_h，y_A，y_B]为输入特征，F_h为拼接特征，y_A和y_B分别表示采集点A和采集点B烟气含氧量实际测量值，

和δ为注意力网络的训练参数，γ_i表示第i个拼接特征的权值，d为拼接特征的维数。

在一些优选的实施例中，所述预测模型，其训练中的损失函数为：

其中，

为预测模型训练中的损失函数，y＝[y_A，y_B]，y_A和y_B分别表示采集点A和采集点B烟气含氧量实际测量值，

和

分别为采集点A和采集点B烟气含氧量的预测模型输出值，N为批量训练中数据的个数，k_t为预设的用于平衡不同数据的训练损失占比的比例系数，min(·)为最小化函数。

本发明的另一方面，提出了一种基于数据驱动的火电厂烟气含氧量软测量系统，所述软测量系统包括：

数据采集模块，配置为获取火电厂锅炉不同运行状态下的传感器数据集；

数据预处理模块，配置为基于预设的野值阈值进行数据的野值剔除，并以火电厂发电负荷作为数据清洗的基准，基于预设的数据清洗阈值对野值剔除后的数据集进行数据清洗，获得清洗数据集；

特征提取模块，配置为基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，并进行分层特征拼接，获得拼接特征集；

权重分配模块，配置为基于拼接特征的不同分量对目标输出的影响，通过注意力网络赋予拼接特征不同的权值，获得带有权值的拼接特征集；

模型构建与训练模块，配置为基于多层LSTM网络、随机失活层和全连接层构建预测模型，并基于带有权值的拼接特征集进行模型的迭代训练，获得训练好的预测模型；

实时测量模块，配置为通过训练好的预测模型进行在线实时的火电厂烟气含氧量软测量。

本发明的有益效果：

(1)本发明基于数据驱动的火电厂烟气含氧量软测量方法，其火电厂烟气含氧量软测量框架包括数据采集、数据预处理、特征提取和输出预测。其中，数据采集部分主要将影响烟气含氧量的过程变量进行实时采集和保存；数据预处理部分主要基于大数据技术理论，对采集的冗余数据以设定的野值剔除和数据清洗规则进行滤除，得到高质量的数据；特征提取部分主要对清洗后的数据进行特征的学习和特征量的提取，以降低数据内的不同特征量之间的相关性，达到数据降维和高效表征的效果；输出预测主要是以抽取的特征作为输入，以烟气含氧量作为输出，通过搭建合适的深度神经网络学习其映射关系。本发明能够将高维的原始数据进行有效地降维，提取其深层次的特征，大大降低了预测模型的复杂度，从而提高了烟气含氧量的预测效率。同时本发明设计的注意力网络和LSTM的预测网络能够较好地将抽取特征映射到目标输出，预测精度也得到提高。因此，本发明能为火电厂提供实时的、高精度的烟气含氧量预测信息，为日后工作人员进行燃煤锅炉的优化控制奠定基础。

(2)本发明基于数据驱动的火电厂烟气含氧量软测量方法，基于堆叠目标增强自动编码机(STAE)进行特征提取，充分考虑到原始数据的维度高、冗余性强等特点，将原始数据进行了特征学习，从而可以得到相关性弱的、表达能力强的低维特征。同时，考虑到学习到的特征用于进行烟气含氧量的预测和不同层次的特征的表征能力的差异，设计了STAE，可以有效地学习既能高精度编码表示原始数据又能和目标输出相关的特征量。

(3)本发明基于数据驱动的火电厂烟气含氧量软测量方法，考虑到STAE学习到的特征包含来自不同层级的特征量，其对原始数据的抽象程度不同，进而影响对目标输出的预测能力。因此，本发明建立了注意力神经网络对特征量赋予不同的权值，从而可以高效地对目标输出进行预测。

(4)本发明基于数据驱动的火电厂烟气含氧量软测量方法，考虑到数据特征和LSTM的结构特点，搭建了多层LSTM单元的预测模型，以带权值的拼接特征作为预测模型的输入，烟气含氧量的估计值为预测模型的输出，使得预测模型能更精确地表达输入特征到目标输出之间的映射关系。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本发明基于数据驱动的火电厂烟气含氧量软测量方法的流程示意图；

图2是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的基于堆叠目标增强自动编码机的特征提取网络结构图；

图3是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的目标增强自动编码机个数选取对比结果图；

图4是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的基于注意力网络的特征权值计算网络结构图；

图5是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的多层LSTM单元的预测模型结构图；

图6是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的A、B两侧烟气含氧量预测误差图；

图7是本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的批量测试样本的预测误差分布图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

本发明提供一种基于数据驱动的火电厂烟气含氧量软测量方法，在现有专利“基于注意力机制和多层LSTM的电厂烟气含氧量智能预测方法”的基础上做了进一步的改进，减少了人工干预、降低了模型训练成本、提高了烟气含氧量预测的精度，实现了火电厂烟气含氧含量的实时预测，具体包括：

(1)设计了数据预处理策略，从原始数据中过滤冗余数据，提高了数据的有效性；

(2)搭建了基于堆叠目标增强自动编码机(stacked target-enhancedautoencoder,STAE)的特征提取模型，由此可以将高维特征进行降维的同时，可以提取到对输入数据和目标输出有效的特征，为后续预测模型的高效训练奠定基础，具体方法为：在每个自动编码机中引入目标输出，使得所提取的层次特征不仅能表示输入数据，而且与目标输出具有较高的相关性；为了保证学习到的特征能够包含更多隐含的、高层次的信息，采用了堆叠多个自动编码机单元来实现；设计了基于注意力网络的特征权值计算策略，赋予学习到的特征不同权值，进一步提高特征对目标输出的预测能力；设计了基于长短时记忆网络(LSTM)的预测模型，学习特征与目标输出(即烟气含氧含量)的潜在关系；

(3)预测网络中引入随机失活层，可以在网络训练过程更新网络训练参数，由此避免了参数的过度训练。而且预测网络损失函数中引入权值系数，提高训练效率。

本发明的一种基于数据驱动的火电厂烟气含氧量软测量方法，主要包含离线训练阶段和在线预测阶段，其中离线训练阶段是本发明的核心和重点，在线预测阶段主要是以离线训练好的预测模型进行在线实时地进行烟气含氧量预测(即软测量)。本发明将重点对离线训练阶段搭建的烟气含氧量软测量模型进行概述，包括：

基于多层LSTM网络、随机失活层和全连接层构建预测模型，并基于带有权值的拼接特征集进行模型的迭代训练，获得训练好的预测模型。

在获得预测模型后，通过训练好的预测模型进行在线实时的火电厂烟气含氧量软测量。

为了更清晰地对本发明基于数据驱动的火电厂烟气含氧量软测量方法进行说明，下面结合图1对本发明实施例中各步骤展开详述。

本发明第一实施例的基于数据驱动的火电厂烟气含氧量软测量方法，各步骤详细描述如下：

数据采集：获取火电厂锅炉不同运行状态下的传感器数据集。

本发明一个实施例中，原始采集的数据来源于300-MW燃煤火电厂，电脑处理器参数为第12代Gen Intel(R)Core(TM)i9-12900K 3.20GHz,英伟达GeForce RTX 3090GPU。

传感器数据集包括：

数据预处理：考虑到火电厂采集数据的样本量大，数据样本的相关性大，而且可能存在突变的过程数据等问题，本发明设计了两阶段的数据预处理方法：野值剔除和数据清洗。

野值剔除：基于预设的野值阈值进行数据的野值剔除。

通过对火电厂正常工况状态下传感器数据的波动范围的深入分析，本发明对每个传感器数据设定野值剔除的阈值。对于每个样本中的每个传感器测量分量进行野值检测，当测量值超过设定的阈值范围时，将样本数据进行剔除，具体包括：

针对每个传感器，分别设置不同的野值阈值；

数据清洗：以火电厂发电负荷作为数据清洗的基准，基于预设的数据清洗阈值对野值剔除后的数据集进行数据清洗，获得清洗数据集。

数据清洗，其方法如式(1)所示：

|a_t，1-a_p，1|≤ε (1)

遍历野值剔除后的数据集，获得清洗数据集。

特征提取：基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，并进行分层特征拼接，获得拼接特征集。

假设数据清洗之后，数据表示为Φ＝[φ₁，φ₂，...，φ_n]^T∈R^n×s，n和s分别表示数据个数和数据特征维度。对数据清洗后的数据进行特征提取，以得到可表示原始数据和目标输出高度相关的特征量，具体包含分层特征提取和分层特征融合。

基于堆叠目标增强自动编码机的分层特征提取：如图2所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的基于堆叠目标增强自动编码机的特征提取网络结构图，包括了两大模块：分层特征提取和分层特征拼接。

如图3所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的目标增强自动编码机个数选取对比结果图，可以看出，根据试错方法，得到堆叠3个目标增强自动编码机(TAE)基元可以提取最优的特征，设第i个TAE输出结果如式(2)所示：

其中，f_ei(i＝1，2，3)表示第i个TAE基元的激活函数，h_i(i＝1，2，3)表示第i个TAE基元的输出，同时也作为第i+1个TAE基元的输入，W_ei和b_ei分别表示第i个TAE基元的权值矩阵和偏差向量。

基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，具体而言，第i个TAE基元的输出包含两部分：对原始输入数据的估计和对目标输出的预测。

对原始输入数据的估计如式(3)所示：

其中，

为提取的分层特征，f_di(i＝1，...，n)为堆叠的n个TAE基元中第i个TAE基元用于表示输入数据的激活函数，

为堆叠的n个TAE基元中第i个TAE基元的输出和第i+1个TAE基元的输入，W_di和b_di分别为堆叠的n个TAE基元中第i个TAE基元用于表示输入数据的权值矩阵和偏差向量。

对目标输出的预测如式(4)所示：

其中，

为对目标输出的预测结果，f_pi(i＝1，...，n)为堆叠的n个TAE基元中第i个TAE基元用于预测目标输出的激活函数，W_pi和b_pi分别为堆叠的n个TAE基元中第i个TAE基元用于预测目标输出权值矩阵和偏差向量。

对于堆叠的3个TAE基元，每个TAE基元的输出

即为提取到的分层特征向量。为了得到第i个TAE基元提取到的特征向量，本发明设计了式(5)所示的TAE基元参数更新公式：

为第k个目标输出的预测值。

分层特征拼接：为了提高特征的表征能力，将n个TAE基元提取到的分层特征进行拼接，得到总的拼接特征F_h，如式(6)所示：

其中，

表示串联拼接操作，即将各个分层特征进行拼接成总的特征。

预测模型：基于堆叠目标增强自动编码机学习到的输入数据的对应特征F_h，本发明搭建了注意力神经网络学习特征权值。具体而言，注意力神经网络主要根据学习到特征的不同分量对目标输出的影响不同赋予不同的权值。然后，将带有权值的特征输入到基于多层LSTM的预测神经网络构建的预测模型，进行模型的训练和预测。

特征权值计算：基于拼接特征的不同分量对目标输出的影响，通过注意力网络赋予拼接特征不同的权值，获得带有权值的拼接特征集。

本发明设计了3层架构的注意力网络用于计算特征权值：如图4所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的基于注意力网络的特征权值计算网络结构图，包括特征输入层，权值计算层和特征输出层。注意力网络的特征输入层包含STAE抽取到的特征和烟气含氧量的实际测量值，其中烟气含氧量的实际测量值主要用于指导权值的训练；权值计算层主要根据网络的学习目标进行权值的学习和归一化处理；特征输出层将特征和权值进行数学运算，得到带有权值的特征。

注意力网络的权值计算如式(7)所示：

特征输出层，即权值特征向量

如式(8)所示：

其中，⊙为点乘运算，即两个维度相同的向量对应位置的元素相乘，γ＝[γ₁，γ₂，...，γ_d]为权值向量。

预测模型损失函数：如图5所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的多层LSTM单元的预测模型结构图，本发明设计的预测神经网络结构模型包含多层LSTM网络、随机失活层和全连接层。其中LSTM网络主要用来进行权值特征到目标是输出结果的非线性映射，随机失活层来控制超参数的训练，避免模型过拟合，最后全连接层输出烟气含氧量的预测结果。在预测网络训练时，采用均方误差作为网络训练的损失函数L，如式(9)所示：

其中，

和

分别为采集点A和采集点B烟气含氧量的预测模型输出值，N为批量训练中数据的个数，κ_t为预设的用于平衡不同数据的训练损失占比的比例系数，min(·)为最小化函数。

本发明一个实施例中，N＝256。

如图6所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的A、B两侧烟气含氧量预测误差图，从图中可以看出A、B两侧烟气含氧量的95％预测误差处于[-0.5,0.5]之间，满足电厂对实际预测精度的要求。对比现有技术对于A、B两侧的烟气含氧量预测误差效果有差异，而且会出现预测漂移的现象，本发明的预测精度高，预测模型稳定性高。

如图7所示，为本发明基于数据驱动的火电厂烟气含氧量软测量方法一种实施例的批量测试样本的预测误差分布图，从图中可以看出本发明的预测误差均分布在零值左右，而且最大预测误差没有超过0.6。与现有技术的预测会出现预测误差的突变相比，本发明的预测动态性好，能很好地跟踪电厂数据急剧变化的情况。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

本发明第二实施例的基于数据驱动的火电厂烟气含氧量软测量系统，所述软测量系统包括：

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的基于数据驱动的火电厂烟气含氧量软测量系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种电子设备，包括：

至少一个处理器；以及

与至少一个所述处理器通信连接的存储器；其中，

所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现上述的基于数据驱动的火电厂烟气含氧量软测量方法。

本发明第四实施例的一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现上述的基于数据驱动的火电厂烟气含氧量软测量方法。

所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的存储装置、处理装置的具体工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域技术人员应该能够意识到，结合本文中所公开的实施例描述的各示例的模块、方法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种基于数据驱动的火电厂烟气含氧量软测量方法，其特征在于，所述软测量方法包括：

2.根据权利要求1所述的基于数据驱动的火电厂烟气含氧量软测量方法，其特征在于，所述传感器数据集包括：

采集时间、发电负荷、主蒸汽压力、主蒸汽温度、主蒸汽流量、炉膛负压、A1磨煤机煤量、A2磨煤机煤量、A3磨煤机煤量、A4磨煤机煤量、A5磨煤机煤量、A6磨煤机煤量炉膛总风量、A侧风机送风量、B侧风机送风量、一次总风量、二次总风量、A侧二次风量、A侧一次热风、A侧一次冷风、B侧二次风量，B侧一次热风、B侧一次冷风、A侧烟气流量、B侧烟气流量、反应器A侧的3个检测点温度、反应器B侧的3个检测点温度、A侧烟气含氧量和B侧烟气含氧量；

3.根据权利要求1所述的基于数据驱动的火电厂烟气含氧量软测量方法，其特征在于，所述野值剔除，其方法为：

针对每个传感器，分别设置不同的野值阈值；

4.根据权利要求1所述的基于数据驱动的火电厂烟气含氧量软测量方法，其特征在于，所述数据清洗，其方法为：

|a_t，1-a_p，1|≤ε

遍历野值剔除后的数据集，获得清洗数据集。

5.根据权利要求1所述的基于数据驱动的火电厂烟气含氧量软测量方法，其特征在于，所述基于堆叠目标增强自动编码机进行清洗数据集中数据的分层特征提取，其方法为：