CN111985681A

CN111985681A - 数据预测方法、模型训练方法、装置、设备

Info

Publication number: CN111985681A
Application number: CN202010664094.8A
Authority: CN
Inventors: 邢红涛; 邢志恒; 张夕平
Original assignee: Hebei Train Of Thought Technology Co ltd
Current assignee: Hebei Train Of Thought Technology Co ltd
Priority date: 2020-07-10
Filing date: 2020-07-10
Publication date: 2020-11-24
Anticipated expiration: 2040-07-10
Also published as: CN111985681B

Abstract

本发明的实施例提供了一种数据预测方法、模型训练方法、装置、设备。该方法包括：获取设备工况数据，设备工况数据包括热工变量数据与设备运行数据；采用设备工况数据对热工变量预测模型进行训练，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型；通过第一单预测模型和第二单预测模型融合得到的热工变量预测模型对目标热工变量数据进行预测。该方法通过训练热工变量单预测模型，将热工变量单预测模型融合为热工变量预测模型，使热工变量预测模型具有更强的泛化性和抗噪性，解决设备工况数据发生时间不同步的问题，从而，预测出更准确的目标热工变量数据，以优化机组能源利用率，降低污染物排放，减少运行成本。

Description

数据预测方法、模型训练方法、装置、设备

技术领域

本发明涉及能源技术领域，更具体地，本发明涉及一种数据预测方法、模型训练方法、装置、设备。

背景技术

目前，化石能源在消费能源中仍处于主导地位。但随着新能源电力大量并网，火电机组多参与到调峰调频中，使火电机组的工况负荷产生波动，为火电机组中热工变量数据的预测带来挑战。

以燃煤发电为主的火电厂来说，燃煤机组排放的烟气中主要污染物是氮氧化物(NOx)。为应对来自经济效益和环保政策的双重压力，达到标准排放量，需要对烟气中的NOx的排放量进行预测，以基于预测结果优化机组能源利用率，降低NOx的排放量。但目前的预测方案均无法准确地对变负荷工况下的NOx排放数据进行预测。

因此，如何预测热工变量数据，成为亟待解决的技术问题。

发明内容

本发明实施例提供一种数据预测方法、模型训练方法、装置、设备，用以预测热工变量数据。比如，预测火电机组污染物的排放数据。

第一方面，本发明实施例提供一种数据预测方法，该方法包括：

获取设备工况数据，该设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

采用设备工况数据对热工变量预测模型进行训练，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的；

通过热工变量预测模型对目标热工变量数据进行预测。

第二方面，本发明实施例提供一种数据预测装置，包括：

数据获取模块，用于获取设备工况数据，该设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

训练模块，用于采用设备工况数据对热工变量预测模型进行训练，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的；

预测模块，用于通过热工变量预测模型对目标热工变量数据进行预测。

第三方面，本发明实施例提供一种电子设备，其中包括处理器和存储器，其中，存储器上存储有可执行代码，当可执行代码被处理器执行时，使处理器至少可以实现第一方面中的数据预测方法。

第四方面，本发明实施例提供了一种非暂时性机器可读存储介质，非暂时性机器可读存储介质上存储有可执行代码，当可执行代码被电子设备的处理器执行时，使处理器至少可以实现第一方面中的数据预测方法。

第五方面，本发明实施例提供一种模型训练方法，该方法包括：

基于设备运行数据训练第一单预测模型；

基于历史热工变量数据训练第二单预测模型；

将第一单预测模型和第二单预测模型融合为热工变量预测模型，以通过热工变量预测模型预测目标热工变量数据。

第六方面，本发明实施例提供一种模型训练装置，该装置包括：

训练模块，用于基于设备运行数据训练第一单预测模型；基于历史热工变量数据训练第二单预测模型；将第一单预测模型和第二单预测模型融合为热工变量预测模型，以通过热工变量预测模型预测目标热工变量数据。

第七方面，本发明实施例提供一种电子设备，其中包括处理器和存储器，其中，存储器上存储有可执行代码，当可执行代码被处理器执行时，使处理器至少可以实现第五方面中的模型训练方法。

第八方面，本发明实施例提供了一种非暂时性机器可读存储介质，非暂时性机器可读存储介质上存储有可执行代码，当可执行代码被电子设备的处理器执行时，使处理器至少可以实现第五方面中的模型训练方法。

第九方面，本发明实施例提供一种数据预测方法，该方法包括：

通过热工变量预测模型对目标热工变量数据进行预测，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的。

第十方面，本发明实施例提供一种电子设备，其中包括处理器和存储器，其中，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器至少可以实现第九方面中的数据预测方法。

第十一方面，本发明实施例提供了一种非暂时性机器可读存储介质，所述非暂时性机器可读存储介质上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器至少可以实现第九方面中的数据预测方法。

本发明实施例提供的技术方案中，设备工况数据即反映设备运行过程中多项监测指标的数据。针对需要预测的目标热工变量数据，可以先采用热工变量数据以及与该热工变量数据相关的设备运行数据分别训练热工变量单预测模型(如第一单预测模型和第二单预测模型)，再将训练出的热工变量单预测模型融合为热工变量预测模型，经过融合得到的热工变量预测模型具有更强的泛化性和抗噪性，并有助于解决设备工况数据发生时间不同步的问题，从而，通过热工变量预测模型最终预测出更准确的目标热工变量数据，以便优化机组能源利用率，降低污染物排放，减少运行成本。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施例，其中：

图1a为本发明实施例提供的一种数据预测系统的结构示意图；

图1b为本发明实施例提供的一种数据预测方法的流程示意图；

图1c为本发明实施例提供的一种热工变量预测模型的原理示意图；

图2为本发明实施例提供的一种数据预测装置的结构示意图；

图3为本发明实施例提供的一种介质的结构示意图；

图4为本发明实施例提供的一种计算设备的结构示意图；

图5为本发明实施例提供的一种模型训练方法的流程示意图；

图6为本发明实施例提供的一种模型训练装置的结构示意图；

图7为本发明实施例提供的另一种计算设备的结构示意图；

图8为本发明实施例提供的另一种数据预测方法的流程示意图；

图9为本发明实施例提供的另一种数据预测装置的结构示意图；

图10为本发明实施例提供的再一种计算设备的结构示意图；

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施例来描述本发明的原理和精神。应当理解，给出这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施例是为了使本发明更加透彻和完整，并且能够将本发明的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施例可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本发明可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施例，提出了一种数据预测方法、模型训练方法、装置、设备。此外，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施例，详细阐释本发明的原理和精神。

发明人发现，随着新能源电力大量并网，火电机组多参与到调峰调频中，使火电机组的工况负荷产生波动，不仅导致运行成本增加，还为火电机组中热工变量数据的预测带来挑战。

以燃煤机组来说，燃煤机组排放的烟气中主要污染物是NOx。为达到标准排放量，需要对烟气中NOx的排放数据进行预测，以便基于预测结果优化机组能源利用率，降低NOx的排放量。但目前的预测方案均无法准确地对变负荷工况下的NOx排放数据进行预测。

综上，本发明实际想要解决的技术问题是：如何预测热工变量数据。

为了克服目前存在的至少一个技术问题，本发明中提出了一种数据预测方法、模型训练方法、装置、设备。该数据预测方法至少包括：获取设备工况数据，该设备工况数据包括热工变量数据以及与所述热工变量数据相关的设备运行数据，从而，采用所述设备工况数据对热工变量预测模型进行训练，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型。最终，通过由第一单预测模型和第二单预测模型融合得到的热工变量预测模型，对目标热工变量数据进行预测。

上述数据预测方法中，设备工况数据即反映设备运行过程中多项监测指标的数据。针对需要预测的目标热工变量数据，可以先采用热工变量数据(如其中包括的历史热工变量数据)以及与该热工变量数据相关的设备运行数据分别训练热工变量单预测模型，再将训练出的热工变量单预测模型融合为热工变量预测模型，经过融合得到的热工变量预测模型具有更强的泛化性和抗噪性，并且通过引入历史热工变量数据也有助于解决设备工况数据发生时间不同步的问题。从而，通过热工变量预测模型最终预测出更准确的目标热工变量数据。并且，该热工变量预测模型应用于各种工况下的热工变量数据预测，为变负荷工况下的机组运行管理提供参考，有助于优化机组能源利用率，降低污染物排放，减少运行成本。

可以理解的是，模型训练方法、装置、介质和设备的原理与数据预测方法类似，此处不再赘述。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施例。

本发明实施例提供的技术方案可以由一电子设备来执行，该电子设备可以是诸如PC机、笔记本电脑等终端设备，也可以是服务器。该服务器可以是包含一独立主机的物理服务器，或者也可以为主机集群承载的虚拟服务器，或者也可以为云服务器。

本发明实施例提供的技术方案可以适用于各种热工变量数据的处理场景，尤其是热工变量数据的预测场景。预测场景比如是变负荷工况下对某一种或某几种热工变量数据进行预测的场景。例如，对燃煤机组排放烟气中污染物排放量的预测场景，或者对火电机组中烟气含氧量的预测场景等。

本发明实施例适用的数据预测系统如图1a所示。该数据预测系统至少包括：通信模块、热工变量预测模型。通信模块从分散控制系统(Distributed Control System，DCS)中获取设备工况数据，该设备工况数据中热工变量数据以及与热工变量数据相关的设备运行数据，从而，热工变量预测模型通过历史热工变量数据和设备运行数据对目标热工变量数据进行预测。具体地，热工变量预测模型是基于第一单预测模型和第二单预测模型融合得到的，其中，采用设备运行数据训练得到的热工变量单预测模型称为第一单预测模型，采用历史热工变量数据得到的热工变量单预测模型称为第二单预测模型。当然，本发明实施例涉及的数据预测系统并不限定于图1a示出的架构。可选地，热工变量数据包括历史热工变量数据。

上述架构中，可选地，热工变量预测模型与通信模块间还可以配置有特征提取模块。该特征提取模块主要用于确定多类设备运行数据对热工变量数据的贡献程度，其中，贡献程度越大，与热工变量数据的相关性越大，进而，从这多类设备运行数据中选取贡献程度符合预设条件的至少一类设备运行数据作为设备运行数据。这样，通过该特征提取模块能够有效压缩设备运行数据的数量，简化热工变量预测模型的复杂度，提高热工变量预测模型的预测准确性以及泛化能力。

下面结合应用场景，参考附图来描述根据本发明示例性实施例的用于预测热工变量数据的技术方案。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施例在此方面不受任何限制。相反，本发明的实施例可以应用于适用的任何场景。

本发明实施例提供了一种数据预测方法，如图1b所示，该数据预测方法应用于目标热工变量数据的预测，该数据预测方法至少包括以下步骤：

101、获取设备工况数据，该设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

102、采用设备工况数据对热工变量预测模型进行训练，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的；

103、通过热工变量预测模型对目标热工变量数据进行预测。

图1b示出的数据预测方法中，设备工况数据即反映设备运行情况的数据，比如设备运行时多项监测指标对应的数据。以火电机组来说，假设热工变量数据是烟气中的污染物排放数据，则设备工况数据中包括与该污染物排放数据相关的至少一项设备运行数据。针对需要预测的目标热工变量数据，可以先采用设备运行数据和历史热工变量数据分别训练热工变量单预测模型，再将训练出的热工变量单预测模型融合为热工变量预测模型，经过融合得到的热工变量预测模型具有更强的泛化性和抗噪性，因而，通过热工变量预测模型最终预测出的目标热工变量数据，准确性和可靠性更高。

本发明实施例提供的热工变量预测模型应用于各种工况下的热工变量数据预测。尤其是，适用于变负荷工况，因而能够为变负荷工况下的机组运行管理提供参考，有助于优化机组能源利用率，降低污染物排放，减少运行成本。

本发明实施例中设备工况数据也可称为热工变量，或其他类似名称，本发明实施例并不限定。具体地，设备工况数据中包括热工变量数据以及与该热工变量数据相关的设备运行数据。其中热工变量数据包括历史热工变量数据。举例来说，假设设备为火电机组，则设备运行数据包括但不限于：机组负荷(Load)，总风量(M_A)，主蒸汽温度(T_A)，主蒸汽压力(P_A)，一次风压(P_R)，二次风压(P_E)，二次风温(T_S)，一次风挡板开度(V_RA、V_RB)，给煤机平均转速(V_S)，10个二次风挡板开度(S_A、S_B、S_C、S_D、S_E、S_F、S_G、S_H、S_I、S_J)，排烟温度(T_py)，烟气含氧量(O₂)，4台磨煤机给煤量(F_A、F_B、F_C、F_D)，3层燃尽风挡板开度(F_OA、F_OB、F_OC)。

可以理解的是，一个应用场景中需要预测的目标热工变量数据，也可以是另一应用场景中上述设备运行数据中的一种或组合，本发明实施例中并不限定。实际应用中，热工变量数据包括历史热工变量数据。本文中，将设备运行数据中需要预测的数据所属的一类设备运行数据称为热工变量数据，已采集到的该类设备运行数据称为历史热工变量数据，需要通过本发明提供的技术方案进行预测的称为目标热工变量数据。不同场景中，需要预测的热工变量数据可以为多种设备运行数据中的一种或组合。

结合以下实施例对图1b示出的数据预测方法进行详细说明：

继续以火电机组为例，101中，可以从DCS中获取设备工况数据，为区分，本文中将此处的设备工况数据称为初始设备工况数据。

以图1a示出的数据预测系统为例，假设某火电厂中配置有额定发电容量为330MW的火电机组，DCS每10分钟采集一组设备工况数据，进而，数据预测系统中的通信模块与DCS进行数据交互，以接收DCS采集到的多组初始设备工况数据。具体地，通信模块采用应用于过程控制的对象连接与嵌入(Object Linking and Embedding for Process Control，OPC)客户端与DCS的OPC服务器进行交互数据，数据交互过程中使用的通信协议比如为RS485通讯协议。进而，假设待预测的目标热工变量数据为烟气中的污染物含量，上述每一组初始设备工况数据中均可包括历史污染物含量(即历史热工变量数据)以及与历史污染物含量相关的设备运行数据。

可选的，可以将DCS采集到的多组初始设备工况数据分为训练样本集和测试样本集。比如，DCS采集到的532组初始设备工况数据，可以将500组作为用于训练热工变量预测模型的训练样本集，将32组作为用于测试该热工变量预测模型的性能的测试样本集。本文中，根据具体应用需求，训练样本集也可称为第一训练集或第二训练集，关于第一训练集或第二训练集的详细描述参见下文。

获取初始设备工况数据之后，101中，可以确定初始设备工况数据中的异常数据；获取异常数据对应的残差，以及剔除异常数据后初始设备工况数据对应的标准差；判断残差和标准差是否满足预设条件；若残差和标准差满足预设条件，则对异常数据进行剔除处理。

可选地，采用罗曼诺夫斯基准则对异常数据进行剔除处理，具体为：依次确定初始设备工况数据中的异常数据，该异常数据记为X_j,j∈[1,n]，其中n为采集到的工况数据个数。进而，计算剔除异常数据后初始设备工况数据对应的平均值

以及对应的标准差

计算异常数据对应的残差

针对上述标准差和残差，根据判别式|ε_j|＞Kσ来判定此异常数据是否存在粗大误差。如果此异常数据存在粗大误差，则对此异常数据进行剔除处理，其中K为检验系数。

上述步骤剔除异常数据，能够有效降低异常数据(如噪声数据)对后续预测过程的干扰，有助于提高预测结果的准确性。

进而，101中，可以确定多类设备运行数据对热工变量数据的贡献程度，其中，贡献程度越大，与热工变量数据的相关性越大；从多类设备运行数据中选取贡献程度符合预设条件的至少一类设备运行数据作为用于训练热工变量预测模型的设备运行数据。

本发明实施例中选取设备运行数据的方法可以是统计方法和机器学习方法，包括但不限于：偏主成分分析法、核主成分分析法、偏最小二乘法(Partial Least-SquareMethod，PLS)、特征选择(Relief)算法、卷积神经网络中的一种或多种。

以PLS来说，该算法的主要原理是：在自变量数据提取最大解释方差时，使与该自变量数据对应的因变量的相关性达到最大。基于上述原理，本文中采用PLS来确定多类设备运行数据对热工变量数据的贡献程度，从而筛选出贡献程度较大的设备运行数据用于热工变量预测模型的训练。

继续以上文提到的火电机组为例，假设该火电机组至少包括4台磨煤机，假设采集自该火电机组的设备运行数据包括如下多种类型：机组负荷(Load)，总风量(M_A)，主蒸汽温度(T_A)，主蒸汽压力(P_A)，一次风压(P_R)，二次风压(P_E)，二次风温(T_S)，一次风挡板开度(V_RA、V_RB)，给煤机平均转速(V_S)，10个二次风挡板开度(S_A、S_B、S_C、S_D、S_E、S_F、S_G、S_H、S_I、S_J)，排烟温度(T_py)，烟气含氧量(O₂)，4台磨煤机给煤量(F_A、F_B、F_C、F_D)，3层燃尽风挡板开度(F_OA、F_OB、F_OC)。假设热工变量数据为NOx排放量。

基于上述假设，下面将说明如何确定多类设备运行数据对热工变量数据的贡献程度：可以采用变量投影重要性指标(Variable Importance In Projection，VIP)确定上述多类设备运行数据各自对NOx排放量的贡献值(即贡献程度)。具体地，当

时交叉有效性，此情况下确定需要提取的设备运行数据的数量；进而，计算多类设备运行数据各自对NOx排放量的贡献值，即：

式1中，p为自变量个数，m为主成分的个数；r(y；t_h)为y与t_h的相关系数，y为设备运行数据中的设备工况数据，t_h为历史热工变量数据，h为；w_hk为权值向量w_h的第k个分量。下表1中展示出部分设备运行数据对应的贡献值，按照贡献值从大到小排列。

表1部分设备运行数据对应的贡献值

如表1所示，烟气含氧量(O₂)、机组负荷(Load)、二次风压(P_E)、总风量(M_A)、二次风挡板开度(S_A、S_B、S_H)等设备运行数据对NOx排放量的贡献值较大，即可以理解为，这些设备运行数据对目标热工变量数据的贡献程度较大。

可选地，为简化热工变量预测模型的复杂度，提升热工变量预测模型的预测精度，可以剔除部分VIP值小于预设门限的设备运行数据，并将余下的设备运行数据作为用于训练热工变量预测模型的设备运行数据。

或者，另一实施例中，也可以对训练样本集即

x_i∈R^p，y_i∈R进行特征工程；进而，通过上述选取设备运行数据的方法分析多类设备运行数据对历史热工变量数据的贡献程度，以便依据贡献程度确定最终的训练样本集

其中，x_i∈R^p-q，y_i∈R，n为历史热工变量数据的数量，p为设备运行数据的数量，q为已剔除的设备运行数据的数量，p-q为设备运行数据对应的特征变量个数，x_i为设备运行数据，y_i为历史热工变量数据，R为变量映射空间。x_i∈R^p-q，y_i∈R，n为历史热工变量数据的数量，p为设备运行数据的数量，q为已剔除的设备运行数据的数量，p-q为设备运行数据对应的特征变量个数，x_i为相关变量，y_i为目标热工变量数据，R为变量映射空间。

获取设备工况数据之后，102中，采用设备工况数据对热工变量预测模型进行训练，可以具体实现为：

将设备工况数据划分为第一训练集和第二训练集；采用第一训练集训练第一单预测模型和第二单预测模型；采用第二训练集训练非线性神经网络的参数，该非线性神经网络用于融合第一单预测模型和第二单预测模型；基于该非线性神经网络的参数对第一单预测模型和第二单预测模型进行融合，以建立热工变量预测模型。

具体而言，可以采用分布训练机制将设备工况数据T划分为第一训练集和第二训练集。假设x_i∈R^p-q，y_i∈R，n为历史热工变量数据的数量，p为设备运行数据的数量，q为已剔除的设备运行数据的数量，p-q为设备运行数据对应的特征变量个数，x_i为设备运行数据，y_i为历史热工变量数据，R为变量映射空间。

基于上述假设，第一训练集记为

第二训练集记为

设备工况数据包括第一训练集和第二训练集即T＝[T₁,T₂]。

进而，102中，采用第一训练集训练第一单预测模型和第二单预测模型，可以具体实现为：

以第一训练集中的设备运行数据作为待训练的第一单预测模型的输入，以设备运行数据对应的历史热工变量数据作为待训练的第一单预测模型的输出，对第一单预测模型进行训练。

具体地，采用第一训练集T₁中的设备运行数据x_i作为待训练的第一单预测模型的输入，以设备运行数据对应的历史热工变量数据y_i作为待训练的第一单预测模型的输出，对第一单预测模型进行训练。

举例来说，如图1c所示，假设第一训练集T₁中的设备运行数据x_i为a、b、c三种设备运行数据，假设i时刻对应的历史热工变量数据y_i为这三种设备运行数据对应的历史热工变量数据，那么，将a、b、c这三种设备运行数据作为待训练的提升树模型(XGBoost)的输入，以这三种设备运行数据对应的历史热工变量数据作为待训练的XGBoost模型的输出，对XGBoost模型进行训练，得到第一XGBoost模型。该第一XGBoost模型即为基于多种设备运行数据训练得到的第一单预测模型。实际应用中，设备运行数据可以为上文举例的火电机组的设备运行数据中的一种或多种。当然，设备运行数据也可以为其他类型的数据，并不局限于本文示例数量或类型。

其中，第一单预测模型的训练算法为机器学习算法或深度学习算法。第一单预测模型包括但不限于支持向量机、XGBoost、循环神经网络、长短期记忆网络中的一种或组合。

以XGBoost来说，采用第一训练集T₁中的设备运行数据x_i作为待训练的XGBoost的输入，以设备运行数据对应的历史热工变量数据y_i作为待训练的XGBoost的输出，对该XGBoost进行训练得到第一单预测模型。

需要说明的是，XGBoost是一种提升树模型，该算法主要原理是添加不同的树，通过特征分裂来生长树模型，从而每次添加一棵树即相当于学习一个新函数，以达到去拟合上次预测结果的残差的目的。假设训练完成得到t棵树，此情况下需要预测的样本分数即相当于根据该样本的特征，在每棵树中会落到对应的一个叶子节点，每个叶子节点对应权重w，最后将每棵树对应的分数叠加即是该样本的预测值。该算法所用的基本树模型为回归树模型即XGBoost模型如下：

式2中，n为树的数目，f_t为函数空间F的一个函数，

为回归树预测值，x_i为输入的第i个数据，F为所有可能的回归树模型集合。

而每一次迭代不影响模型，即原来的模型保持不变，将一个新的函数添加到模型里。一个函数对应一棵树，新生成的树拟合上次预测的残差，迭代过程如下所示：

上述式3中XGBoost的目标函数表达式如下所示：

式4中，

用来衡量模型预测值与真实值的差距，

为目标函数正则化项。

式5中，T为叶子节点的个数，ω为叶子节点的分数，分数不至于太大，γ和λ为权重系数。正则化目标是选择简单的热工变量预测函数，防止模型过拟合。当正则化参数为零时，XGBoost退化为传统的Boosting模型。

通过上述步骤，可以采用第一训练集中的设备运行数据以及这些设备运行数据对应的历史热工变量数据，对XGBoost进行训练得到第一单预测模型，便于后续以第一单预测模型为基础建立热工变量预测模型。

可选地，102中，采用第一训练集训练第一单预测模型和第二单预测模型，也可以具体实现为：

以第一训练集中i时刻前的多个历史热工变量数据组成的序列作为待训练的第二单预测模型的输入，以i时刻对应的历史热工变量数据作为待训练的第二单预测模型的输出，对第二单预测模型进行训练。其中，历史热工变量数据包括多个历史时刻对应的历史热工变量数据，i时刻为多个历史时刻中的任一个。

举例来说，以第一训练集T₁中i时刻前t个工况各自对应的历史热工变量数据组成的序列{y_i-t,y_i-t+1,y_i-t+2,...,y_i}作为待训练的第二单预测模型的输入，以i时刻对应的历史热工变量数据y_i作为待训练的第二单预测模型的输出，对第二单预测模型进行训练。

基于上述示例，如图1c所示，具体地，假设第一训练集T₁中i时刻前t个工况各自对应的历史热工变量数据所组成的序列为{y_i-t,y_i-t+1,y_i-t+2,...,y_i}，该序列包括如下数据：前t个工况对应的历史热工变量数据、前t-1个工况对应的历史热工变量数据、前t-2个工况对应的历史热工变量数据、……、前1个工况对应的历史热工变量数据。其中t为整数。那么，上述t个工况对应的历史热工变量数据作为待训练的XGBoost模型的输入，以i时刻对应的热工变量数据y_i作为待训练的XGBoost模型的输出，对该XGBoost模型进行训练得到第二XGBoost模型。该第二XGBoost模型即为基于前t个工况对应的历史热工变量数据训练得到的第二单预测模型。

本发明实施例中，第二单预测模型的训练算法为机器学习算法或深度学习算法。第二单预测模型包括但不限于支持向量机、XGBoost、循环神经网络、长短期记忆网络中的一种或组合。

通过上述步骤，可以采用第一训练集中多个历史热工变量数据组成的序列对第二单预测模型进行训练，便于后续以第二单预测模型为基础建立热工变量预测模型。

训练完第一单预测模型和第二单预测模型后，102中，采用第二训练集训练非线性神经网络的参数，可以具体实现为：

将第二训练集中的设备运行数据作为第一单预测模型的输入，通过第一单预测模型得到第一预测数据；将第二训练集中的多个历史热工变量数据组成的序列作为第二单预测模型的输入，通过第二单预测模型得到第二预测数据；将第一预测数据和第二预测数据输入非线性神经网络，以训练该非线性神经网络的参数。

具体地，将第二训练集T₂中的设备运行数据x_i作为第一单预测模型的输入，通过第一单预测模型得到预测数据，本文中称为第一预测数据。将第二训练集T₂中的i时刻前t个工况各自对应的历史热工变量数据所组成的序列{y_i-t,y_i-t+1,y_i-t+2,...,y_i}作为第二单预测模型的输入，通过第二单预测模型得到预测数据，本文中称为第二预测数据。进而将第一预测数据和第二预测数据输入非线性神经网络，以训练该非线性神经网络的参数。

可选地，上述非线性神经网络的表达式如下：

式6中，参数包括权重系数w_ik和偏置系数β_i，

为目标热工变量数据，exp为自然常数e为底的指数函数，k为神经元个数，y_ik为第一预测数据和第二预测数据。即y_ik包括第一单预测模型和第二单预测模型各自的预测值。

可选地，热工变量预测模型的性能评价指标可以选取平均相对误差百分比(MAPE)以及均方根误差(RMSE)。该热工变量预测模型的评价误差表达式如下所示：

上述式7和8中，E_MAPE为平均相对误差百分比，E_RMSE为均方根误差，y_t为实际热工变量数据，

为热工变量预测模型所预测的目标热工变量数据，n为设备工况数据的个数。

继续以上文示例中的第一XGBoost模型和第二XGBoost模型为例来说，可以基于加权函数将第一XGBoost模型和第二XGBoost模型进行融合，通过训练权重参数和偏差量建立热工变量预测模型。

假设

为基于热工变量预测模型的输出，那么加权函数可以表示为：

式9中，

为第一XGBoost模型的输出，

为第二XGBoost模型的输出。α和β为用于建立热工变量预测模型的权重参数，θ为用于建立热工变量预测模型的偏差量，这三个参数可以通过训练所述加权函数得到。

进而，建立热工变量预测模型之后，103中，通过热工变量预测模型对目标热工变量数据进行预测。

以图1a示出的数据预测系统来说，通过热工变量预测模型准确地预测并输出目标热工变量数据，从而，通过通信模块传输至DCS，以便优化机组能源利用率，降低污染物排放，减少运行成本。

图1b示出的数据预测方法中，通过先训练单预测模型，再将单预测模型融合为热工变量预测模型，使热工变量预测模型具有更强的泛化性和抗噪性，并且通过引入历史热工变量数据有助于解决设备工况数据发生时间不同步的问题，从而，通过热工变量预测模型最终预测出更准确的目标热工变量数据，以便优化机组能源利用率，降低污染物排放，减少运行成本。

在介绍了本发明示例性提供的一种数据预测方法之后，接下来，介绍示例性实施的装置。本发明提供的数据预测装置可以适用于图1b对应的实施例提供的任一项方法。可选地，该数据预测装置与布置于设备上的DCS相连。参见图2，该数据预测装置至少包括：

数据获取模块201，用于获取设备工况数据，所述设备工况数据包括热工变量数据以及与所述热工变量数据相关的设备运行数据；

训练模块202，用于采用所述设备工况数据对热工变量预测模型进行训练，其中，所述设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，所述热工变量预测模型是基于所述第一单预测模型和所述第二单预测模型进行融合得到的；

预测模块203，用于通过所述热工变量预测模型对目标热工变量数据进行预测。

可选的，训练模块202具体用于：将所述设备工况数据划分为第一训练集和第二训练集；采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型；采用所述第二训练集训练非线性神经网络的参数，所述非线性神经网络用于融合所述第一单预测模型和所述第二单预测模型；基于所述参数对所述第一单预测模型和所述第二单预测模型进行融合，以建立所述热工变量预测模型。

可选的，训练模块202采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型时，具体用于：以所述第一训练集中的所述设备运行数据作为待训练的所述第一单预测模型的输入，以所述设备运行数据对应的所述历史热工变量数据作为待训练的所述第一单预测模型的输出，对所述第一单预测模型进行训练。

可选的，所述第一单预测模型包括以下之一或组合：支持向量机、提升树模型XGBoost、循环神经网络、长短期记忆网络。

可选的，训练模块202采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型时，具体用于：以所述第一训练集中i时刻前的多个历史热工变量数据组成的序列作为待训练的所述第二单预测模型的输入，以所述i时刻对应的历史热工变量数据作为待训练的所述第二单预测模型的输出，对所述第二单预测模型进行训练；其中，所述历史热工变量数据包括多个历史时刻对应的历史热工变量数据，所述i时刻为多个历史时刻中的任一个。

可选的，所述第二单预测模型包括以下之一或组合：支持向量机、XGBoost、循环神经网络、长短期记忆网络。

可选的，训练模块202采用所述第二训练集训练非线性神经网络的参数时，具体用于：将所述第二训练集中的所述设备运行数据作为所述第一单预测模型的输入，通过所述第一单预测模型得到第一预测数据；将所述第二训练集中的多个所述历史热工变量数据组成的序列作为所述第二单预测模型的输入，通过所述第二单预测模型得到第二预测数据；将所述第一预测数据和所述第二预测数据输入所述非线性神经网络，以训练非线性神经网络的参数。

可选的，所述非线性神经网络为

其中，所述参数包括权重系数w_ik和偏置系数β_i，

为所述目标热工变量数据，exp为自然常数e为底的指数函数，k为神经元个数，y_ik为所述第一预测数据或所述第二预测数据。可理解的，式10与上文中式6类似，相似之处相互参见，此处不再展开。

可选的，获取模块201具体用于：确定多类设备运行数据对热工变量数据的贡献程度，其中，贡献程度越大，与热工变量数据的相关性越大；从所述多类设备运行数据中选取贡献程度符合预设条件的至少一类设备运行数据作为所述设备运行数据。

可选的，选取所述设备运行数据的方法包括偏主成分分析法、核主成分分析法、偏最小二乘法、Relief算法、卷积神经网络中的一种或组合。

可选的，获取模块201具体用于：确定初始设备工况数据中的异常数据；获取所述异常数据对应的残差，以及剔除所述异常数据后初始设备工况数据对应的标准差；判断所述残差和所述标准差是否满足预设条件；若所述残差和所述标准差满足预设条件，则对所述异常数据进行剔除处理。

在介绍了本发明示例性实施例的数据预测方法和装置之后，接下来，参考图3，本发明提供了一种示例性介质，该介质存储有计算机可执行指令，该计算机可执行指令可用于使所述计算机实现图1b对应的本发明示例性实施例中任一项用于数据预测方法。

在介绍了本发明示例性实施例的用于数据预测方法、介质和装置之后，接下来，参考图4，介绍本发明提供的一种示例性计算设备40，该计算设备40包括处理单元401、存储器402、总线403、外部设备404、I/O接口405以及网络适配器406，该存储器402包括随机存取存储器(Random Access Memory，RAM)4021、高速缓存存储器4022、只读存储器(Read-OnlyMemory，ROM)4023以及至少一片存储单元4024构成的存储单元阵列4025。其中该存储器402，用于存储处理单元401执行的程序或指令；该处理单元401，用于根据该存储器402存储的程序或指令，执行图1b对应的本发明示例性实施例中任一项所述的数据预测方法；该I/O接口405，用于在该处理单元401的控制下接收或发送数据。

图5为本发明实施例提供的一种模型训练方法的流程图，如图5所示，该模型训练方法可以包括如下步骤：

501、获取设备工况数据，设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

502、基于设备运行数据训练第一单预测模型；

503、基于历史热工变量数据训练第二单预测模型；

504、将第一单预测模型和第二单预测模型融合为热工变量预测模型，以通过热工变量预测模型预测目标热工变量数据。

步骤501至步骤504的执行过程可以参见前述其他实施例中的说明，在此不赘述。可以理解的是，步骤502和503的执行顺序可以为并列，也可以为502在前503在后，还可以为503在前502在后，此处不限定。

图6为本发明实施例提供的一种模型训练装置的结构示意图，如图6所示，该装置包括：数据获取模块601、训练模块602。

数据获取模块601，用于获取设备工况数据，设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

训练模块602，用于基于设备运行数据训练第一单预测模型；基于历史热工变量数据训练第二单预测模型；将第一单预测模型和第二单预测模型融合为热工变量预测模型，以通过热工变量预测模型预测目标热工变量数据。

图6所示模型训练装置可以执行前述图5实施例中示意的模型训练方法，本实施例未详细描述的部分，可参考前述实施例的相关说明，在此不再赘述。

在介绍了本发明示例性实施例的模型训练方法和装置之后，接下来，本发明提供了一种示例性介质，该介质存储有计算机可执行指令，该计算机可执行指令可用于使所述计算机实现图5对应的本发明示例性实施例中任一项用于模型训练方法。

在介绍了本发明示例性实施例的用于模型训练方法、介质和装置之后，接下来，参考图7，介绍本发明提供的一种示例性计算设备70，该计算设备70包括处理单元701、存储器702、总线703、外部设备704、I/O接口705以及网络适配器706，该存储器702包括随机存取存储器7021、高速缓存存储器7022、只读存储器7023以及至少一片存储单元7024构成的存储单元阵列7025。其中该存储器702，用于存储处理单元701执行的程序或指令；该处理单元701，用于根据该存储器702存储的程序或指令，执行图5对应的本发明示例性实施例中任一项所述的模型训练方法；该I/O接口705，用于在该处理单元701的控制下接收或发送数据。

图8为本发明实施例提供的另一种数据预测方法的流程图，如图8所示，该模型训练方法可以包括如下步骤：

801、获取设备工况数据，设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

802、通过热工变量预测模型对目标热工变量数据进行预测，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的。

步骤801和步骤802的执行过程可以参见前述其他实施例中的说明，在此不赘述。

图9为本发明实施例提供的一种数据预测装置的结构示意图，如图9所示，该装置包括：数据获取模块901、预测模块902。

数据获取模块901，用于获取设备工况数据，设备工况数据包括热工变量数据以及与热工变量数据相关的设备运行数据；

预测模块902，用于通过热工变量预测模型对目标热工变量数据进行预测，其中，设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，热工变量预测模型是基于第一单预测模型和第二单预测模型进行融合得到的。

图9所示模型训练装置可以执行前述图8实施例中示意的数据预测方法，本实施例未详细描述的部分，可参考前述实施例的相关说明，在此不再赘述。

在介绍了本发明示例性实施例的模型训练方法和装置之后，接下来，本发明提供了一种示例性介质，该介质存储有计算机可执行指令，该计算机可执行指令可用于使所述计算机实现图8对应的本发明示例性实施例中任一项用于数据预测方法。

在介绍了本发明示例性实施例的用于模型训练方法、介质和装置之后，接下来，参考图10，介绍本发明提供的一种示例性计算设备100，该计算设备100包括处理单元1001、存储器1002、总线1003、外部设备1004、I/O接口1005以及网络适配器1006，该存储器1002包括随机存取存储器10021、高速缓存存储器10022、只读存储器10023以及至少一片存储单元10024构成的存储单元阵列10025。其中该存储器1002，用于存储处理单元1001执行的程序或指令；该处理单元1001，用于根据该存储器1002存储的程序或指令，执行图8对应的本发明示例性实施例中任一项所述的数据预测方法；该I/O接口1005，用于在该处理单元1001的控制下接收或发送数据。

应当注意，尽管在上文详细描述中提及了装置的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施例，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施例描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施例，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种数据预测方法，其特征在于，包括：

获取设备工况数据，所述设备工况数据包括热工变量数据以及与所述热工变量数据相关的设备运行数据；

采用所述设备工况数据对热工变量预测模型进行训练，其中，所述设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，所述热工变量预测模型是基于所述第一单预测模型和所述第二单预测模型进行融合得到的；

通过所述热工变量预测模型对目标热工变量数据进行预测。

2.根据权利要求1所述的方法，其特征在于，所述采用所述设备工况数据对热工变量预测模型进行训练，包括：

将所述设备工况数据划分为第一训练集和第二训练集；

采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型；

采用所述第二训练集训练非线性神经网络的参数，所述非线性神经网络用于融合所述第一单预测模型和所述第二单预测模型；

基于所述参数对所述第一单预测模型和所述第二单预测模型进行融合，以建立所述热工变量预测模型。

3.根据权利要求2所述的方法，其特征在于，所述采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型，包括：

以所述第一训练集中的所述设备运行数据作为待训练的所述第一单预测模型的输入，以所述设备运行数据对应的所述历史热工变量数据作为待训练的所述第一单预测模型的输出，对所述第一单预测模型进行训练。

4.根据权利要求3所述的方法，其特征在于，所述第一单预测模型包括以下之一或组合：支持向量机、提升树模型XGBoost、循环神经网络、长短期记忆网络。

5.根据权利要求2所述的方法，其特征在于，所述采用所述第一训练集训练所述第一单预测模型和所述第二单预测模型，包括：

以所述第一训练集中i时刻前的多个历史热工变量数据组成的序列作为待训练的所述第二单预测模型的输入，以所述i时刻对应的历史热工变量数据作为待训练的所述第二单预测模型的输出，对所述第二单预测模型进行训练；

其中，所述历史热工变量数据包括多个历史时刻对应的历史热工变量数据，所述i时刻为多个历史时刻中的任一个。

6.根据权利要求5所述的方法，其特征在于，所述第二单预测模型包括以下之一或组合：支持向量机、提升树模型XGBoost、循环神经网络、长短期记忆网络。

7.根据权利要求2所述的方法，其特征在于，所述采用所述第二训练集训练所述非线性神经网络的参数，包括：

将所述第二训练集中的所述设备运行数据作为所述第一单预测模型的输入，通过所述第一单预测模型得到第一预测数据；

将所述第二训练集中的多个所述历史热工变量数据组成的序列作为所述第二单预测模型的输入，通过所述第二单预测模型得到第二预测数据；

将所述第一预测数据和所述第二预测数据输入所述非线性神经网络，以训练所述参数。

8.根据权利要求7所述的方法，其特征在于，所述非线性神经网络为

其中，所述参数包括权重系数w_ik和偏置系数β_i，

为所述目标热工变量数据，exp为自然常数e为底的指数函数，k为神经元个数，y_ik为所述第一预测数据和所述第二预测数据。

9.根据权利要求1所述的方法，其特征在于，所述获取设备工况数据，包括：

确定多类设备运行数据对所述热工变量数据的贡献程度，其中，贡献程度越大，与所述热工变量数据的相关性越大；

从所述多类设备运行数据中选取贡献程度符合预设条件的至少一类设备运行数据作为所述设备运行数据。

10.根据权利要求9所述的方法，其特征在于，选取所述设备运行数据的方法包括偏主成分分析法、核主成分分析法、偏最小二乘法、特征选择Relief算法、卷积神经网络中的一种或组合。

11.根据权利要求1所述的方法，其特征在于，所述获取设备工况数据，包括：

确定初始设备工况数据中的异常数据；

获取所述异常数据对应的残差，以及剔除所述异常数据后初始设备工况数据对应的标准差；

判断所述残差和所述标准差是否满足预设条件；

若所述残差和所述标准差满足预设条件，则对所述异常数据进行剔除处理。

12.一种数据预测装置，其特征在于，包括：

数据获取模块，用于获取设备工况数据，所述设备工况数据包括热工变量数据以及与所述热工变量数据相关的设备运行数据；

训练模块，用于采用所述设备工况数据对热工变量预测模型进行训练，其中，所述设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，所述热工变量预测模型是基于所述第一单预测模型和所述第二单预测模型进行融合得到的；

预测模块，用于通过所述热工变量预测模型对目标热工变量数据进行预测。

13.一种电子设备，其特征在于，包括：存储器、处理器；其中，所述存储器上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1至11中任一项所述的数据预测方法。

14.一种模型训练方法，其特征在于，包括：

基于所述设备运行数据训练第一单预测模型；

基于历史热工变量数据训练第二单预测模型；

将所述第一单预测模型和所述第二单预测模型融合为热工变量预测模型，以通过所述热工变量预测模型预测目标热工变量数据。

15.一种模型训练装置，其特征在于，包括：

训练模块，用于基于所述设备运行数据训练第一单预测模型；基于历史热工变量数据训练第二单预测模型；将所述第一单预测模型和所述第二单预测模型融合为热工变量预测模型，以通过所述热工变量预测模型预测目标热工变量数据。

16.一种数据预测方法，其特征在于，包括：

通过热工变量预测模型对目标热工变量数据进行预测，其中，所述设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，所述热工变量预测模型是基于所述第一单预测模型和所述第二单预测模型进行融合得到的。

17.一种数据预测装置，其特征在于，包括：

预测模块，用于通过热工变量预测模型对目标热工变量数据进行预测，其中，所述设备运行数据用于训练第一单预测模型，历史热工变量数据用于训练第二单预测模型，所述热工变量预测模型是基于所述第一单预测模型和所述第二单预测模型进行融合得到的。