CN113420508A

CN113420508A - 一种基于lstm的机组组合计算方法

Info

Publication number: CN113420508A
Application number: CN202110770004.8A
Authority: CN
Inventors: 任冠华; 焦洋; 陈艳波; 武超; 郑国栋; 高瑜珑; 陈冬晖; 马彦虎; 孙志祥
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2021-07-07
Filing date: 2021-07-07
Publication date: 2021-09-21
Anticipated expiration: 2041-07-07
Also published as: CN113420508B

Abstract

本发明公开了一种基于LSTM的机组组合计算方法，使用MinMaxScaler归一化方法和K‑means聚类算法对历史数据进行处理，并构建预调度模型和再调度模型，通过两步深度学习得到次日的机组组合计划。所提出的深度学习模型采用LSTM神经网络，通过学习大量的历史数据，模型训练完成后得出机组组合映射关系。在实时决策中，调用训练好的深度学习模型，即可直接得到机组组合计划，无需通过复杂的物理模型计算。第一步，输入负荷的预测数据，得到机组启停状态；第二步，输入机组启停状态和负荷的预测数据，得到机组出力。

Description

一种基于LSTM的机组组合计算方法

技术领域

本发明属于电力系统调度自动化技术领域，具体涉及一种基于LSTM的机组组合计算方法。

背景技术

目前，机组组合问题的研究多集中于基于物理模型驱动的决策方法。这种方法往往侧重于机理研究，从实际工程问题抽离出数学模型，再利用数学方法简化模型，最后根据模型的特点选取合适的求解算法，整个过程以严谨的数学推导作为支撑。这类方法的优点是逻辑清晰，可解释性强，但存在以下缺陷：模型的建立和求解的过程都较为复杂；求解大规模系统耗费的时间较长；新能源、新技术、新结构会给电力系统带来新的挑战，以往的模型和算法可能不再适用，需要不断地调整和更新。相较而言，以深度学习为基础的数据驱动机组组合决策方法是一种更为有效的新思路，深度学习作为新兴的研究热点，正逐步应用于电力系统优化调度的各领域。但是，如何从大量历史数据学习机组组合映射关系，又成为了一个值得研究的问题。

发明目的

本发明的目的在于应对现有技术所存在的不足，供了一种基于LSTM的机组组合计算方法，该方法所提出的深度学习模型通过学习大量的历史数据，模型训练完成后得出机组组合映射关系，在实时决策中，调用训练好的深度学习模型，即可直接得到机组组合计划，无需通过复杂的物理模型计算。

发明内容

本发明提供了一种基于LSTM的机组组合计算方法，包括以下步骤：

步骤一、使用MinMaxScaler归一化方法和K-means聚类算法对机组的历史数据进行预处理，并构建预调度模型和再调度模型，通过两步深度学习得到次日的机组组合计划；所构建的预调度模型和再调度模型采用LSTM神经网络，通过学习大量的历史数据，模型训练完成后得出机组组合映射关系；

步骤二、在实时决策中，调用步骤一中所得到的机组组合映射关系，首先，输入负荷的预测数据，得到机组启停状态；接着，输入机组启停状态和负荷的预测数据，得到机组出力值。

优选地，所述所述MinMaxScaler归一化方法表征为如式(1)所示：

式中，

为归一化的值；X为待处理数据，即样本数据；X_max和X_min分别为样本数据的最大值和最小值。

优选地，所述K-means聚类算法是一个循环迭代的算法，通过以下4步实现：

(1)选择K个初始中心点，作为初始聚类中心a₁，a₂，…，a_k；

(2)计算每个样本x_i到K个聚类中心的距离，并将其分到距离最小的类中；

(3)计算K类中所有样本点的均值，作为下一次迭代的聚类中心；

(4)重复步骤(2)、(3)，直到聚类中心不再改变或达到迭代次数。

优选地，所述预调度模型包括LSTM神经网络层、Dropout层、全连接层共三个部分，其输入为负荷的预测数据，输出为机组启停状态；

其中，所述LSTM神经网络层是基于RNN改善的结构模型，引入了存储单元和门机制，当前时刻能利用上一时刻句子中的信息；所述LSTM神经网络由4个部分组成：即输入门i_t、输出门o_t、遗忘门f_t和记忆单元C_t；

在所述Dropout层中，Dropout是指在深度学习的训练过程中，每次更新参数时随机断开一定比例的神经元，减弱神经元对某些局部特征的依赖性，从而提高模型的泛化能力；

所述全连接层使用了softmax激励函数作为输出层的多层感知；所述全连接指当前层与前一层网络的所有神经元是相互连接的，将提取的高维特征进行降维；该层；位于网络的末端，最后一层的单元数与分类个数相同，并且与softmax激活函数配合使用，以实现对输出特征的分类。

采用Adam算法对所述预调度模型进行训练，所述训练过程包括前向传播和反向传播两个阶段；首先，在前向传播中计算输入信号的乘积及其对应的权重，然后，将激活函数作用于这些乘积的总和，得到的输出结果与真实值所形成的误差；接着，在网络的反向传播过程中回传所形成的相关误差，通过计算损失函数对于对各参数的梯度，根据梯度下降法对权值W和偏置b进行更新，如式(2)、(3)所示

式中，

为学习率，L(W,b)为损失函数；

选取交叉熵误差作为损失函数，计算公式如式(4)所示：

式中，y_i为样本的实际标签，

为预测值。

优选地，所述再调度模型的构建方法与上述预调度模型一致，其输入为机组启停状态和负荷的预测数据，输出为机组出力值；在所述再调度模型的训练过程中，采用Adam算法对参数进行调整，所述训练过程包括前向传播和反向传播两个阶段；首先，在前向传播中计算输入信号的乘积及其对应的权重；然后，将激活函数作用于这些乘积的总和，得到的输出结果与真实值所形成的误差，在网络的反向传播过程中回传相关误差，通过计算损失函数对于对各参数的梯度，根据梯度下降法对权值W和偏置b进行更新，选取均方误差作为损失函数，计算公式如式(5)所示：

式中，y_i为数据样本的真实值，

为数据样本的预测值。

附图说明

图1为本发明提供的方法流程图。

图2为LSTM网络结构图。

图3为火电机组启停状态的预测准确率图。

图4为训练过程中的损失值变化图。

图5为模型准确度与训练样本容量的关系曲线图。

图6为损失值随着学习率变化的曲线图。

图7为损失值随着训练次数变化的收敛曲线图。

具体实施方式

本发明提供了一种基于LSTM的机组组合计算方法，使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理，并构建预调度模型和再调度模型，通过两步深度学习得到次日的机组组合计划。所提出的深度学习模型采用LSTM神经网络，通过学习大量的历史数据，模型训练完成后得出机组组合映射关系。在实时决策中，调用训练好的深度学习模型，即可直接得到机组组合计划，无需通过复杂的物理模型计算。第一步，输入负荷的预测数据，得到机组启停状态；第二步，输入机组启停状态和负荷的预测数据，得到机组出力值。结合图1的方法流程图进行介绍,具体包括：

步骤1：使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理；

步骤2：构建预调度模型，输入负荷的预测数据，得到机组启停状态；

步骤3：构建再调度模型，输入机组启停状态和负荷的预测数据，得到机组出力值。

其中，步骤1：使用MinMaxScaler归一化方法和K-means聚类算法对历史数据进行处理，具体包括：

K-means聚类算法的本质是基于欧式距离的数据划分算法，均值和方差大的维度将对数据的聚类产生决定性影响。所以未做归一化处理的数据是无法直接参与运算和比较的。选取MinMaxScaler方法实现数据的归一化：

式中，

为归一化的值；X为待处理数据；X_max和X_min分别为样本数据的最大值和最小值。

聚类算法是指将一堆没有标签的数据自动划分成几类的方法，这个方法要保证同一类的数据有相似的特征。K-means聚类算法是一个循环迭代的算法，通过以下4步实现：

(1)选择K个初始中心点，作为初始聚类中心a₁，a₂，…，a_k。

(2)计算每个样本x_i到K个聚类中心的距离，并将其分到距离最小的类中。

(3)计算K类中所有样本点的均值，作为下一次迭代的聚类中心。

步骤2：构建预调度模型，输入负荷的预测数据，得到机组启停状态，具体包括：

预调度模型的输入为负荷的预测数据，输出为机组启停状态。网络模型构建和训练算法如下：

(1)模型构建

预调度模型包括3个部分：LSTM层、Dropout层、全连接层。

①LSTM层。RNN是一种可以获得之前的信息并进行学习的网络模型。在实践中，RNN随着时间的增长会出现梯度消失或梯度爆炸问题。为了这些问题，有学者提出了特殊的循环网络结构，如LSTM网络。

LSTM网络是基于RNN改善的结构模型，LSTM网络引入了存储单元和门机制，当前时刻能利用上一时刻句子中的信息。LSTM网络结构见图2。

LSTM网络的基本结构由4个部分组成：即输入门i_t、输出门o_t、遗忘门f_t和记忆单元C_t。遗忘门决定是否保留记忆单元之前的信息，遗忘门的输出为：

f_t＝σ(W_fhh_t-1+W_fxx_t+b_f) (2’)

式中，h_t-1为t-1时刻隐藏层的输出；x_t为当前时刻的输入；σ为sigmoid激活函数；W_fh为遗忘门的h_t-1的权值；W_fx为遗忘门的x_t的权重；b_f为遗忘门的偏置参数。

输入门和记忆单元的状态更新如式(3’)、(4’)、(5’)所示：

i_t＝σ(W_ihh_t-1+W_ixx_t+b_i) (3’)

式中，W_ih为输入门的h_t-1的权值；W_ix为输入门的x_t的权重；b_i为输入门的偏置参数。

为待更新的记忆单元状态；tanh为产生

的激活函数；W_ch为

的h_t-1的权值；W_cx为

的x_t的权重；b_c为

的偏置参数。C_t和C_t-1为t和t-1时刻的记忆单元状态。式(4)表明，记忆单元的状态由遗忘门控制的历史信息和输入门控制的

共同决定。LSTM网络更新记忆单元后，其输出状态的具体表达式为：

o_t＝σ(W_ohh_t-1+W_oxx_t+b_o) (6’)

h_t＝o_t·tanh(C_t) (7’)

式中，W_oh为输出门的h_t-1的权值；W_ox为输出门的x_t的权重；b_o为输出门的偏置参数。h_t为当前时刻隐藏层的输出。表达式(6)说明LSTM网络的输出由输出门控制的记忆单元决定，并由输出门决定其对结果的影响程度。

②Dropout层。在深度学习问题中，过拟合是一个很常见的问题。过拟合是指只能拟合训练数据，对于不在训练集中的数据不能很好地拟合，泛化能力差。对于复杂的网络模型，会使用Dropout方法防止过拟合。Dropout是指在深度学习的训练过程中，每次更新参数时随机断开一定比例的神经元，减弱神经元对某些局部特征的依赖性，从而提高模型的泛化能力。

③全连接层。全连接层使用了softmax激励函数作为输出层的多层感知，其他很多分类器如支持向量机也使用了softmax。“全连接”指的是当前层与前一层网络的所有神经元是相互连接的，将提取的高维特征进行降维。该层一般位于网络的末端，最后一层的单元数与分类个数相同，并且常与softmax激活函数配合使用，以实现对输出特征的分类。

(2)训练算法

神经网络学习的目的是找到使损失函数值最小的参数，这是求解最优参数问题。目前常用的梯度下降算法，例如，动量法，涅斯捷罗夫加速梯度法，Adam法，随机梯度下降法。

采用Adam算法对网络模型进行训练。网络的训练过程包括前向传播和反向传播两个阶段。首先在前向传播中计算输入信号的乘积及其对应的权重，然后将激活函数作用于这些乘积的总和，得到的输出结果与真实值形成误差。在网络的反向传播过程中回传相关误差，通过计算损失函数对于对各参数的梯度，根据梯度下降法对权值W和偏置b进行更新：

式中，

为学习率，L(W,b)为损失函数。

选取交叉熵误差作为损失函数，计算公式如下：

式中，y_i为样本的实际标签，

为预测值。

步骤3：构建再调度模型，输入机组启停状态和负荷的预测数据，得到机组出力值，具体包括：

再调度模型的输入为机组启停状态和负荷的预测数据，输出为机组出力值。网络模型构建和训练算法如下：

模型构建与上述预调度模型一致，此处不再赘述。

在训练过程中，采用Adam算法对参数进行调整。网络的训练过程包括前向传播和反向传播两个阶段。首先在前向传播中计算输入信号的乘积及其对应的权重，然后将激活函数作用于这些乘积的总和，得到的输出结果与真实值形成误差。在网络的反向传播过程中回传相关误差，通过计算损失函数对于对各参数的梯度，根据梯度下降法对权值W和偏置b进行更新,如式(2)、式(3)所示：

式中，

为学习率，L(W,b)为损失函数。

选取均方误差作为损失函数，计算公式如式(5)所示：

式中，y_i为样本的真实值，

为预测值。

为使本领域技术人员更好地理解本发明以及了解本发明相对现有技术的优点，申请人结合具体实施例进行进一步的阐释。

实施例：

为了验证所提模型的合理性，采用IEEE 30系统作为算例，该系统有6台常规机组。本专利使用MATLAB2016a上调用YALMIP和Gurobi-8.0.1产生100组数据集，以6：2：2的比例划分为训练集、验证集和测试集，利用python完成数据的预处理。并在基于TensorFlow后端的keras深度学习框架下进行模型的搭建、训练和测试。硬件仿真环境为Intel(R)Core(TM)i7-6700HQ CPU@2.60GHz，运行内存大小为4GB。

1.预调度模型

图3为预调度输出结果的准确率，可以看出本专利建立的深度学习模型能够准确地预测火电机组启停状态。

2.再调度模型

图4为再调度过程训练400次损失值变化情况，可以发现随着训练的进行，损失函数的值在不断减小。提出的深度学习模型在学习，网络的权重参数在拟合数据，向最优参数靠近。模型训练到一定次数后，损失值下降到接近于0的稳定值。

表1为使用Dropout的性能比较，为了证明使用Dropout的有效性，本专利建立了一组对比实验。表1中的实验结果表明，使用Dropout后，模型的性能有所提高。这表明使用Dropout能有效地抑制过拟合，提高模型的泛化能力。

表1使用Dropout的性能比较

基于LSTM深度学习的机组组合模型需要大量的样本参与训练，若样本数量不足以支撑模型的训练和学习，则会影响模型的准确性。从图5中可以看出，当训练容量为10时，模型准确度为99.33％。；而当训练样本容量增加到60时，模型准确度达到了99.94％。这表明随着训练样本容量的增加，模型的预测结果更加精确。

学习率决定了权重迭代的步长，是一个非常敏感的参数。过大则导致模型不收敛，过小则导致模型收敛特别慢或者无法学习，故选取适当的学习率将有效地提高网络识别的性能。随着学习率的增加，模型的训练集精度增加，直到超过验证集，模型可能会从欠拟合状态过度到过拟合状态。为了对学习率的参数设置进行分析，固定其他网络参数不变，考察不同学习率对网络性能的影响。从图6可以看出，较小或较大学习率均会导致模型无法有效学习，使得损失值较大；而学习率为0.01时得到了较好的网络性能，因此选取大小为0.01的学习率。

深度学习作为新兴的研究热点，正逐步应用于电力系统优化调度的各领域。本专利针对机组组合问题，提出了基于LSTM的机组组合模型，利用两步深度学习算法，提取数据的时序特征，实现对机组组合决策的预测。相较传统方法中依赖严谨的公式推导，该方法无需复杂的物理模型计算，根据训练得出的机组组合映射关系，即可直接得到机组组合计划。实验结果表明，根据所提出模型得到的机组组合计划，能够达到较高的计算精度，且适用性较高，可作为辅助性决策工具为调控人员提供参考。

与现有技术相比，本发明的有益效果为：

本发明所提出的深度学习模型通过学习大量的历史数据，模型训练完成后得出机组组合映射关系。在实时决策中，调用训练好的深度学习模型，即可直接得到机组组合计划，无需通过复杂的物理模型计算。实验结果表明，根据所提出模型得到的机组组合计划，能够达到较高的计算精度，且适用性较高，可作为辅助性决策工具为调控人员提供参考。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

以上仅为本发明的实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均包含在申请待批的本发明的权利要求范围之内。

Claims

1.一种基于LSTM的机组组合计算方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于LSTM的机组组合计算方法，其特征在于，所述MinMaxScaler归一化方法表征为如式(1)所示：

式中，

3.根据权利要求1所述的一种基于LSTM的机组组合计算方法，其特征在于，所述预调度模型包括LSTM神经网络层、Dropout层、全连接层共三个部分，其输入为负荷的预测数据，输出为机组启停状态；

式中，

为学习率，L(W,b)为损失函数；

选取交叉熵误差作为损失函数，计算公式如式(4)所示：

式中，y_i为样本的实际标签，

为预测值。

4.根据权利要求1所述的一种基于LSTM的机组组合计算方法，其特征在于，

所述再调度模型的构建方法与上述预调度模型一致，其输入为机组启停状态和负荷的预测数据，输出为机组出力值；

在所述再调度模型的训练过程中，采用Adam算法对参数进行调整，所述训练过程包括前向传播和反向传播两个阶段；首先，在前向传播中计算输入信号的乘积及其对应的权重；然后，将激活函数作用于这些乘积的总和，得到的输出结果与真实值所形成的误差，在网络的反向传播过程中回传相关误差，通过计算损失函数对于对各参数的梯度，根据梯度下降法对权值W和偏置b进行更新，选取均方误差作为损失函数，计算公式如式(5)所示：

式中，y_i为数据样本的真实值，

为数据样本的预测值。