CN114595635A

CN114595635A - 火电机组主汽温度数据的特征选择方法、系统及设备

Info

Publication number: CN114595635A
Application number: CN202210240614.1A
Authority: CN
Inventors: 裘智峰; 曾婉馨; 廖大华; 穆伟伟; 桂宁
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2022-03-10
Filing date: 2022-03-10
Publication date: 2022-06-07

Abstract

本公开实施例中提供了一种机组主汽温度数据的特征选择方法、系统及设备，属于数据处理技术领域，具体包括：采集火电机组的无标签数据并生成无标签数据对应的掩码矩阵；将无标签数据和掩码矩阵输入编码器，生成信息表征层；将信息表征层输入第一、第二解码器，得到定位损失函数和重构损失函数；固定编码器、第一解码器和第二解码器的参数；得到批量数据；得到有标签数据上每个特征的重要性评分以及加权特征；根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练注意力特征提取网络和评估网络，输出特征选择结果。通过本公开的方案，通过自监督预训练和批量注意力机制，提高了特征选择的效率、精准度、安全性和适应性。

Description

火电机组主汽温度数据的特征选择方法、系统及设备

技术领域

本公开实施例涉及数据处理技术领域，尤其涉及一种火电机组主汽温度数据的特征选择方法、系统及设备。

背景技术

目前，燃煤设备运行的过程监测较为成熟，已经积累了大容量的工业大数据。采集了设备物联数据、生产经营数据和外部数据，包含不同尺度数据，涵盖了电厂生产的全流程。这些设备和系统的规划运行数据构成了当下火电能源大数据的基础。能源大数据中蕴含着丰富的相关关系和因果关系,如何利用大数据技术,深层挖掘火电大数据中的相关关系和因果关系,解决火电系统中遇到的实际问题,是重要且有挑战性的课题。

在传统的火电运行模式中:运行专家利用典型的运行方式,对火电机组进行建模与安全稳定分析,依据少量的仿真样本寻找描述和影响机组安全的关键特征,并结合人工经验离线制定运行规则,包括通过敏感性分析判断筛选出对机组模型产生实质性影响的特征。然而,传统的运行模式已经无法适应火电大数据系统的发展趋势:①依赖专家经验、时效性差；②不安全,基于典型运行方式制定运行规则,无法适应复杂多变的在线运行方式,存在安全隐患；③不经济,为保证火电机组运行的安全性,运行规则相对保守、粗放,缺乏量化、精益化管控,经济性差。综上所述,亟需开发适应新形势的控制优化模式和安全评估平台。

可见，亟需一种高效精准、安全性和适应性高的火电机组主汽温度数据的特征选择方法。

发明内容

有鉴于此，本公开实施例提供一种电机组主汽温度数据的特征选择方法、系统及设备，至少部分解决现有技术中存在处理效率、精准度、安全性和适应性较差的问题。

第一方面，本公开实施例提供了一种火电机组主汽温度数据的特征选择方法，包括：

采集火电机组的无标签数据并生成所述无标签数据对应的掩码矩阵；

将所述无标签数据和所述掩码矩阵输入编码器，生成信息表征层；

将所述信息表征层输入第一解码器，得到定位损失函数，以及，将所述信息表征层输入第二解码器，得到重构损失函数；

根据所述定位损失函数和所述重构损失函数得到总损失函数，并根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数；

采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据；

将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，以及，将每个所述特征与重要性权重相乘，得到加权特征；

根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练所述注意力特征提取网络和评估网络，当满足迭代停止条件时，输出特征选择结果。

根据本公开实施例的一种具体实现方式，所述定位损失函数为

所述重构损失函数为

其中，d为特征维度，S_m为所述第一解码器，E为所述编码器，

为经掩码矩阵处理后的无标签数据，m为掩码向量，S_r为所述第二解码器。

根据本公开实施例的一种具体实现方式，所述总损失函数为

其中，标签数据服从分布p_x,掩码矩阵服从分布p_m，

为掩码矩阵生成器，m为原始掩码矩阵，

为定位网络预测的掩码矩阵，x为原始标签数据，

为复原网络预测的复原数据，α平衡参数用于调节两个网络的平衡。

根据本公开实施例的一种具体实现方式，所述采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据的步骤，包括：

将所述编码器的输出数据分别输入所述第一解码器和所述第二解码器，剔除噪音数据以及还原原始数据后，得到解码数据；

将所述解码数据进行非线性变换映射，得到所述批量数据。

根据本公开实施例的一种具体实现方式，所述将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分的步骤，包括：

将所述批量数据输入所述注意力特征提取网络，根据预设条件提取所述批量数据中的多个特征，并对全部所述特征进行平均处理，得到批量原始评分；

对所述批量原始评分进行归一化处理，得到每个所述特征的重要性评分。

根据本公开实施例的一种具体实现方式，所述迭代停止条件包括最大迭代次数或迭代后损失函数阈值中的任一种。

第二方面，本公开实施例提供了一种火电机组主汽温度数据的特征选择系统，包括：

第一采集模块，用于采集火电机组的无标签数据并生成所述无标签数据对应的掩码矩阵；

第一输入模块，用于将所述无标签数据和所述掩码矩阵输入编码器，生成信息表征层；

第二输入模块，用于将所述信息表征层输入第一解码器，得到定位损失函数，以及，将所述信息表征层输入第二解码器，得到重构损失函数；

第一训练模块，用于根据所述定位损失函数和所述重构损失函数得到总损失函数，并根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数；

第二采集模块，用于采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据；

评分模块，用于将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，以及，将每个所述特征与重要性权重相乘，得到加权特征；

第二训练模块，用于根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练所述注意力特征提取网络和评估网络，当满足迭代停止条件时，输出特征选择结果。

第三方面，本公开实施例还提供了一种电子设备，该电子设备包括：

至少一个处理器；以及，

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的火电机组主汽温度数据的特征选择方法。

本公开实施例中的火电机组主汽温度数据的特征选择方案，包括：采集火电机组的无标签数据并生成所述无标签数据对应的掩码矩阵；将所述无标签数据和所述掩码矩阵输入编码器，生成信息表征层；将所述信息表征层输入第一解码器，得到定位损失函数，以及，将所述信息表征层输入第二解码器，得到重构损失函数；根据所述定位损失函数和所述重构损失函数得到总损失函数，并根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数；采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据；将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，以及，将每个所述特征与重要性权重相乘，得到加权特征；根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练所述注意力特征提取网络和评估网络，当满足迭代停止条件时，输出特征选择结果。

本公开实施例的有益效果为：通过本公开的方案，利用大量的火电无标签样本学习特征与特征之间的结构关系，通过自监督预训练，降低特征选择算法对标签样本数量的需求，同时增加特征选择算法应对噪声数据和缺失数据的鲁棒性，在有标签特征选择中，提出了一种批量注意力机制，该机制将单样本逐一特征重要性判断转变成批量样本全局重要性权重生成，在有效生成全局特征权重的同时减少了特殊分布外数据对特征重要性评判误导，提高了特征选择的效率、精准度、安全性和适应性。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本公开实施例提供的一种火电机组主汽温度数据的特征选择方法的流程示意图；

图2为本公开实施例提供的一种数据预处理结果示意图；

图3为本公开实施例提供的一种噪声环境下分类效果比较示意图；

图4为本公开实施例提供的一种不同模型达到阈值精度所需样本*特征数比较示意图；

图5为本公开实施例提供的一种主汽温度预测示意图；

图6为本公开实施例提供的一种火电机组主汽温度数据的特征选择系统的结构示意图；

图7为本公开实施例提供的电子设备示意图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

本公开实施例提供一种火电机组主汽温度数据的特征选择方法，所述方法可以应用于工业数据处理场景中的火电机组主汽温度数据的特征选择过程。

参见图1，为本公开实施例提供的一种火电机组主汽温度数据的特征选择方法的流程示意图。如图1所示，所述方法主要包括以下步骤：

S101，采集火电机组的无标签数据并生成所述无标签数据对应的掩码矩阵；

具体实施时，可以收集所述火电机组的历史运行数据作为所述无标签数据，然后可以利用噪声位置矩阵生成器输出一个二进制的掩码矩阵M。

S102，将所述无标签数据和所述掩码矩阵输入编码器，生成信息表征层；

具体实施时，在得到所述无标签数据和所述掩码矩阵后，可以根据所述无标签数据X∈Du和掩码矩阵M，输出最终数据

输入到所述编码器中，生成所述信息表征层。

M＝[m₁，m₂，...，m_d]∈{0，1}^d (1)

其中m_j服从概率为P_m的二项分布。

的第j特征数据是无监督样本中的随机抽样的第i个样本的j特征数据。简单来说，样本数据以一定的概率p_m被替换成大样本数据中的其他样本同特征数据点。可以通过改变此概率值调整噪声数据

重构原始数据X的难度。

S103，将所述信息表征层输入第一解码器，得到定位损失函数，以及，将所述信息表征层输入第二解码器，得到重构损失函数；

可选的，所述定位损失函数为

所述重构损失函数为

具体实施时，使用这种替换方式一方面不会使数据样本出现混乱，仍然呈现表格形式，另一方面能使样本掩码产生类Du数据更好进行的交融学习。传统的自监督的方式中，编码器将重新编排或损坏的样本

转换为中间信息表征层z，然后经解码器恢复成原始样本X，例如在图像自监督任务中，需要借助前置任务校正图像旋转度或重新给灰度图像着色。在我们多任务降噪自编码器中，我们分为2个子任务：

(1)定位噪声数据的位置：输入所述信息表征层z，所述第一解码器S_m输出为预测的噪声位置矩阵；

(2)复原噪声数据：输入所述信息表征层z，所述第二解码器S_r输出复原后样本数据。

第一项损失函数为掩码矩阵的二项交叉熵损失，即定位损失函数：

第二项损失函数为重构损失函数：

α为调节两个损失函数平衡的系数。

S104，根据所述定位损失函数和所述重构损失函数得到总损失函数，并根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数；

可选的，所述总损失函数为

其中，标签数据服从分布p_x，掩码矩阵服从分布pm，

为掩码矩阵生成器，m为原始掩码矩阵，

为定位网络预测的掩码矩阵，x为原始标签数据，

具体实施时，可以根据所述定位损失函数和所述重构损失函数得到总损失函数

然后根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数。两个任务共享编码器模型，在同一编码器提供的信息表征上运行，拥有各自独立的解码器模型，协同合作，从多角度挖掘数据中的重要信息，提取信息表征。我们期待不仅仅在下游预测中发挥更好的效果，更重要的是相较于单纯加入高斯或者其他噪声数据，替换成小样本同特征数据包含的原始数据结构知识信息不变，在定位过程中，发现异常数据，帮助恢复原始数据。

S105，采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据；

进一步的，步骤S105所述的，采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据，包括：

将所述解码数据进行非线性变换映射，得到所述批量数据。

具体实施时，在需要对所述火电机组的实时数据进行特征选择时，可以将采集到的所述火电机组的药养不起数据输入所述编码器，然后将所述编码器的输出数据分别输入所述第一解码器和所述第二解码器，剔除噪音数据以及还原原始数据后，得到解码数据，再将所述解码数据进行非线性变换映射，得到所述批量数据，如式(6)所示。

S106，将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，以及，将每个所述特征与重要性权重相乘，得到加权特征；

可选的，步骤S106所述的，将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，包括：

具体实施时，可以将所述批量数据输入所述注意力特征提取网络，根据预设条件提取所述批量数据中的多个特征，并对全部所述特征进行平均处理，得到批量原始评分，如式(7)所示，

在得到所述批量原始评分后，可以对所述批量原始评分进行归一化处理，得到每个所述特征的重要性评分，如式(8)所示，

其中E、D分别为恢复数据任务中自监督模型的编码器和解码器网络，B为批数量。

S107根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练所述注意力特征提取网络和评估网络，当满足迭代停止条件时，输出特征选择结果。

可选的，所述迭代停止条件包括最大迭代次数或迭代后损失函数阈值中的任一种。

具体实施时，通过注意力批量特征选择网络，我们得到每一批量数据的特征评分向量m，我们把特征分别与重要性权重对应相乘得到加权特征G＝X⊙m，不断调整权重m的过程等效于权衡特征在全局重要性程度。为了生成权重向量m，学习器通过减小目标函数不断反向传播运行，如下所示：

其中损失函数f取决于预测任务的类型。当迭代到损失函数的值小于预设的阈值或者迭代次数到达最大迭代次数后，停止迭代并输出特征选择结果，所述特征选择结果可以包括多个进行排序的特征，以及特征选择的准确率，需要说明的是，对于分类任务通常使用交叉熵损失函数表示其准确率，对于回归任务通常使用均方差(MSE)表示其准确率。

本实施例提供的火电机组主汽温度数据的特征选择方法，通过利用大量的火电无标签样本学习特征与特征之间的结构关系，通过自监督预训练，降低特征选择算法对标签样本数量的需求，同时增加特征选择算法应对噪声数据和缺失数据的鲁棒性，在有标签特征选择中，提出了一种批量注意力机制，该机制将单样本逐一特征重要性判断转变成批量样本全局重要性权重生成，在有效生成全局特征权重的同时减少了特殊分布外数据对特征重要性评判误导，提高了特征选择的效率、精准度、安全性和适应性。

本公开实施例的有益效果为：

数据驱动方法通常采用离线训练、在线更新/应用的模式,从而将大量在线计算任务转移到离线训练过程中,因此能对快速变化的火电机组运行方式做出实时响应；

离线训练中,数据驱动方法能够考虑更全面的运行场景、融合多系统的数据,挖掘深层次、非线性的相关关系,提升特征选择结果的准确性。

不引入任何专家知识与先验评判标准，利用神经网络自主构建特征映射关系，将特征结构关系嵌入在神经网络中。在运行监测制定层面,将运行专家离线制定粗放特征结构规则的模式,变革为人工智能在线发现精细结构规则的模式；

自监督-注意力机制混合驱动的思想分析了降低噪声干扰的手段，在Gaussian、Salt&Pepper、Speckle等常见噪声下，仍然有较强的准确率；

在大量无标签数据驱动下，自监督模型降低特征选择算法对标签样本数量的需求，减少了90％标签数据的需求。

下面将结合一个具体实施例对本方法进行说明，首先从公开数据集上进行验证，从文献中选择了以下优秀性能方法作为比较的参考方法：监督方法：i)Lightgbm，ii)XGBoost，iii)随机森林三种成熟的树模型方法和iv)Attention based FeatureSelection(AFS)。无监督方法：UDFS(Unsupervised Discriminative FeatureSelection)，将判别分析和l_2，1范数最小化合并到无监督特征选择的联合框架中)。

在进行的实验中，选取了Mnist，USPS，Optdigits等经典特征选择数据集。在此基础上加入适量的噪声包括Guassian噪声，Speckle噪声，Salt&Pepper噪声。准确度实验旨在表明所提出的自监督特征选择方法能广泛应用在多领域异构数据集中且总体上可以胜过其他特征选择方法。表1展示了显示了所有方法在Lightgbm分类器上选择前5/30个特征在加入得出的分类精度。

表1

上述的数据集中，即使在不人为对数据集添加噪声的情况下，数据集本身也会存在一定的噪声。在MNIST、USPS、Pendigits、Optdigits四个数据集中本方案均表现出最佳的分类效果。与其他特征选择算法相比，我们的方法在MNIST、Optdigits数据集上，准确率相较提高了1.95％～13.25％、1.93％～23.54％。在统计学意义上在Auml_url中准确率并列第一。表中Fisher_Score方法性能较低，原因可能在于，其针对的是单个特征进行评价，每个特征的评价结果独立于特征空间和标签映射。基于神经网络的AFS模型采用与特征维度数相同的浅层注意力网络，当特征维度较高时，时间复杂度和计算复杂度随之增大。本方案打破了树模型集合在分类性能中的最优，在MNIST数据集中比XGBoost准确率高出6.82％。这证明了其选择的是包含互补性最大相关特征子集，融合特征结构知识从全局角度筛选最优特征组合，为下游分类任务消除冗余特征达到最佳性能。

其次，在噪声环境下可视化，如图2所示，(顶部)噪声数据的原始图像。(底部)自监督模块还原图像，在数据集中将加入各种噪声(随机高斯噪声、脉冲噪声、泊松噪声、乘性噪声)、模糊处理(高斯模糊、均值模糊)和缺失处理的mnist数据输入到我们训练好的自监督模型中，观察输出恢复的数据图像。默认噪声比例为0。05。由下图，可以清楚得看到恢复出来的图像，不仅能把周围不相关的噪声数据去除，也能对于真实有效数据点进行数据增强。

随机高斯噪声(Gaussian Noise)：随机分布的均值设为0，方差设为0。01。

脉冲噪声(Impulse Noise)：高灰度噪声和低灰度噪声同时出现，呈现出黑白杂点，盐噪声和胡椒噪声的比例设定0。5。

泊松噪声(Poisson Noise)：服从泊松分布的噪声。

乘性噪声(Speckle Noise)：out＝image+n×image，其中n是具有指定均值和方差的均匀噪声。

高斯模糊(Gaussian Blur)：即图像与正态分布做卷积。过滤高频信号，保留低频信号。

均值模糊(Mean Blur)：平滑处理时用到的滤波器的输出像素值是核窗口内像素值的均值(所有像素加权系数相等)

观察到，自监督具有抵抗随机性的鲁棒特性。能实现对于噪声或异常数据的修复和还原。分析，设计的自监督的结构能捕获特征之间的相关性信息、结构关系、重要性程度等一系列的隐藏特征知识，这些特征知识使得在解码过程中的S_m可以通过特征值之间的不一致来定位被替换的噪声数据，并且S_r可以通过相关非噪声特征来推算被替换的噪声数据的真实值。这一点与图像和语言领域的自监督殊途同宗，图像利用空间的相关性和位置信息判断旋转的角度，语言利用上下文的关联性合成完整语序句子。表格数据缺少空间相关性和语义联系，但自监督挖掘表格数据特征之间的结构关系，捕获的数据不同部分之间的结构特征信息表示都是对下游任务的有益输入。

然后进行噪声鲁棒性分析，如图3所示，其中，(a)至(f)展现了在不同噪声环境下分类效果比较，本方法模型在三个数据集上几乎所有特征选择范围都达到了最佳精度，它明显优于所比较方法。在MNIST-Gauss中比Lightgbm和XGBoost绝对精度提高了2％～13％，对比AFS和UDFS有更加明显的优势。同样的效果也出现在MNIST-Salt&Pepper和MNIST-Speckle数据集中。在USPS-Speckle数据集中本方案和XGBoost有相似优越性能，但其在20个特征之后领先于XGBoost约0。9％。

Lightgbm、XGBoost等Boosting方法是基于迭代算法的，每一次迭代都会使模型的偏差减小。这种基于偏差的算法对噪声较为敏感。在USPS_Speckle中短期内获得了良好的平均准确率，但20个特征之后性能上升速度降低，且在其他噪声类型中没有突出的分类效果。AFS是对单个样本使用注意力机制计算特征权重，噪声数据会产生错误的权重，造成得到的权重不准确。所以在噪声数据的分类结果上，AFS表现较差。

本方案明显优于监督和非监督学习模型。这些结果揭示了高效的自监督模型能利用大量未标记表格数据集来增强模型噪声类型鲁棒性和选择重要特征能力方面的独特优势，以应对多样噪声随机性的干扰。

最后进行鲁棒性实验，为了确定对标签样本的依赖性，本小节中选择并比较不同的监督特征选择方法对于标签样本需求量的比较。在我们的方法使用3000样本选择30个特征所能达到的准确率为基准的背景下，比较其他方法达到此基准所需的标签样本数量×特征数，将其表示为图4条形图对比，其中，(a)为USPS数据集，(b)为MNIST数据集。

在对比方法中Mnist特征数目为[34,50]，样本数为[8000,20000]。USPS特征数目为[100,152]，样本数为[5500,7000]。结果表明所提出的方法，Minst-Speckle数据中为达到与本方案同等分类效果，AFS需要20000训练样本选取TOP41个特征数，LightGBM需要10000训练样本TOP42个特征数，本方案只需要使用监督方法10。9％～21。4％的监督数据便可达到与之匹敌的表现效果，在USPS数据集上仅需监督模型数据9。7％～13。8％。究其原因可能在于大量的噪声数据会对LightGBM和Xgboost模型在分割点选择上产生误判和差错。这项方法对于噪声数据下，需要高成本投入才能取得高质量监督标记的应用中(比如癌症判断，基因选择等)，自/半监督学习的潜力巨大，只需少量标签样本的数据集便可进行降维和重性指标评价，以获取更快更好的下游效果。

为验证所提出的计算方法与融合模型的有效性，在TensorFlow机器学习平台上进行实验。通过火电机组DCS系统采集的数据对30s后的主汽温度进行建模预测。本文的数据来源于某1000MW超临界发电机组，选取从2018年5月1日到2018年7月31日三个月的数据作为训练数据，将2018年8月1日至31日一个月的数据作为测试数据。

传统的主汽温度建模，通过专家知识对机组进行机理分析得出主汽温度容易受到的影响因素。例如，烟气温度的变化、烟气压力的波动、机组负荷的变化、主汽压力的变化、燃料量的变化、给水温度和给水流量的波动、煤水比的变化等都会引起主汽温度的变化。机组对于火电机组主汽温度一般采用二级减温水结构对末级过热器出口温度进行控制，其中，一级减温水起到粗调作用，二级减温水起到细调作用。因此，本文将一级减温水流量、二级减温水流量的变化也作为影响主汽温度的特征。经本模型特征选择后做预测分析，结果如图5所示，观察图5中的预测效果，其中，(a)为一天内预测主汽温度和目标温度间变化曲线，误差值在0附近小范围波动。(b)为放大局部误差，在温度变化密集区域及温度大范围变动区，预测模型仍能实时跟随目标变化。通过比较可以看出根据本文提出的基于自监督和注意力机制计算的特征选择模型预测结果和预测目标之间的误差几乎很小。实验充分体现了本发明提出的计算方法的有效性。

与上面的方法实施例相对应，参见图6，本公开实施例还提供了一种火电机组主汽温度数据的特征选择系统60，包括：

第一采集模块601，用于采集火电机组的无标签数据并生成所述无标签数据对应的掩码矩阵；

第一输入模块602，用于将所述无标签数据和所述掩码矩阵输入编码器，生成信息表征层；

第二输入模块603，用于将所述信息表征层输入第一解码器，得到定位损失函数，以及，将所述信息表征层输入第二解码器，得到重构损失函数；

第一训练模块604，用于根据所述定位损失函数和所述重构损失函数得到总损失函数，并根据所述总损失函数进行反向梯度迭代训练所述编码器、所述第一解码器和所述第二解码器，固定所述编码器、所述第一解码器和所述第二解码器的参数；

第二采集模块605，用于采集所述火电机组的有标签数据输入所述编码器，将所述编码器的输出数据输入所述第一解码器和所述第二解码器，得到批量数据；

评分模块606，用于将所述批量数据输入注意力特征提取网络，得到所述有标签数据上每个特征的重要性评分，以及，将每个所述特征与重要性权重相乘，得到加权特征；

第二训练模块607，用于根据所述重要性评分和所述加权特征进行下游分类或回归任务，通过反向梯度迭代训练所述注意力特征提取网络和评估网络，当满足迭代停止条件时，输出特征选择结果。

图6所示系统可以对应的执行上述方法实施例中的内容，本实施例未详细描述的部分，参照上述方法实施例中记载的内容，在此不再赘述。

参见图7，本公开实施例还提供了一种电子设备70，该电子设备包括：至少一个处理器以及与该至少一个处理器通信连接的存储器。其中，该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行前述方法实施例中的火电机组主汽温度数据的特征选择方法。

本公开实施例还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述方法实施例中的火电机组主汽温度数据的特征选择方法。

本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述方法实施例中的火电机组主汽温度数据的特征选择方法。

下面参考图7，其示出了适于用来实现本公开实施例的电子设备70的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，电子设备70可以包括处理装置(例如中央处理器、图形处理器等)701，其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中，还存储有电子设备70操作所需的各种程序和数据。处理装置701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

通常，以下装置可以连接至I/O接口705：包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置706；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707；包括例如磁带、硬盘等的存储装置708；以及通信装置709。通信装置709可以允许电子设备70与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备70，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置709从网络上被下载和安装，或者从存储装置708被安装，或者从ROM 702被安装。在该计算机程序被处理装置701执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备可以执行上述方法实施例的相关步骤。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备可以执行上述方法实施例的相关步骤。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。

应当理解，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。