CN114239905A

CN114239905A - 一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置

Info

Publication number: CN114239905A
Application number: CN202111270980.3A
Authority: CN
Inventors: 李海龙; 张磐; 李春晖; 刘慧芳; 滕飞; 张志朋; 刘文韬; 奚鹏飞; 庄乾宇; 范须露
Original assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Tianjin Electric Power Co Ltd
Priority date: 2021-10-29
Filing date: 2021-10-29
Publication date: 2022-03-25

Abstract

本发明提供了一种基于ResNet‑LSTM的配电台区短期负荷预测方法及装置，用于负荷预测的领域，包括：搭建第一ResNet‑LSTM模型，ResNet‑LSTM模型包括CNN层、LSTM层以及全连接层输出层；对第一ResNet‑LSTM模型添加注意力机制以获取第二ResNet‑LSTM模型；获取预处理的历史数据，并对第二ResNet‑LSTM模型进行训练对以获取第三ResNet‑LSTM模型；将待预测的负荷数据属于三ResNet‑LSTM模型中，并对待预测的负荷数据进行负荷预测。本发明所提方法能显著提高配电台区短期负荷预测的精度。

Description

一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置

技术领域

本发明涉及电力系统调度技术领域，尤其是涉及一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置。

背景技术

短期负荷预测指对未来几小时至几天的负荷进行预报。准确的负荷预测结果可以用于安排日前调度、设备检修，监视系统运行状态、预防事故发生，对于提高资源利用率和经济效益，保障社会的正常生产和人们的日常生活有着十分重要的意义。

负荷预测的难点主要在于其不确定性。影响负荷预测准确度的因素众多，主要包括温度、湿度、节假日等，负荷在时间序列上具有较强的波动性，且与各因素之间具有很强的非线性关系，难以显式的刻画预测模型。

目前，应用于短期负荷预测的方法可分为三类：经典方法、传统方法和智能方法。经典方法中，回归分析法结构简单，计算速度快，外推性能好，但用线性方程表述复杂问题，无法精确预测各种因素对结果的影响；时间序列法所需数据少，能反映短期内负荷的连续特点，但对节假日等对负荷影响较大的不确定因素考虑不足。传统方法中，卡尔曼滤波法表现较好：将负荷划分为随机分量和确定分量，随机分量用状态变量表示，确定分量用一阶线性模型描述，建立状态空间模型实现预测，其将系统下一时刻状态的最佳估计和系统未来的状态相结合，使模型预测结果更准确，但是实际场景下，难以得出噪音的统计特性。伴随数据采集、存储技术的发展，负荷历史数据呈现指数级增长，各种智能方法得以应用，其中神经网络的优势在于能对海量数据进行复杂建模，并基于收敛快、自适应能力强的特点，在回归预测领域独占鳌头

发明内容

有鉴于此，本发明的目的在于提供一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置，以对短负荷进行高精度的预测，提高配电台区短期负荷预测的自适应能力。

第一方面，本发明提供了一种基于ResNet-LSTM的配电台区短期负荷预测方法，具体包括如下步骤：

搭建第一ResNet-LSTM模型，所述ResNet-LSTM模型包括CNN层、 LSTM层以及全连接层输出层；

对所述第一ResNet-LSTM模型添加注意力机制以获取第二 ResNet-LSTM模型；

获取预处理的历史数据，并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型；

将待预测的负荷数据属于所述三ResNet-LSTM模型中，并对所述待预测的负荷数据进行负荷预测。

优选的，所述获取预处理的历史数据的步骤包括：

获取历史数据并对所述历史数据进行预处理以获取预处理的历史数据。

优选的，所述对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型的步骤包括：

获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数；

采用Adam算法对所述第二ResNet-LSTM模型的参数进行优化并获取第二损失函数；

判定第一损失函数是否小于第二损失函数；

若是，则获取未优化参数的所述第二ResNet-LSTM模型为所述第三 ResNet-LSTM模型；

若否，则对所述未优化参数第二ResNet-LSTM模型的参数进行更新，以获取所述第三ResNet-LSTM模型，并执行所述获取所述预处理的历史数据输出所述第二ResNet-LSTM模型并获取第一损失函数的步骤。

优选的，所述CNN层包括所第一BasicBlock残差基本模块、第二 BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四 BasicBlock残差基本模块；

所述第一BasicBlock残差基本模块、所述第二BasicBlock残差基本模块、所述第三BasicBlock残差基本模块以及所述第四BasicBlock残差基本模块依次相连；

所述第一BasicBlock残差基本模块包括3个第一BasicBlock残差基本子模块，所述第一BasicBlock残差基本子模块的卷积核数为64；

所述第二BasicBlock残差基本模块包括4个第二BasicBlock残差基本子模块，所述第二BasicBlock残差基本子模块的卷积核数为128；

所述第三BasicBlock残差基本模块包括6个第三BasicBlock残差基本子模块，所述第三BasicBlock残差基本子模块的卷积核数为256；

所述第四BasicBlock残差基本模块包括3个第四BasicBlock残差基本子模块，所述第三BasicBlock残差基本子模块的卷积核数为512。

优选的，所述全连接层输出层采用Relu函数为激活函数：

y_t＝Relu(w_os_t+b_o)；

y_t—全连接层输出量；

w_o—全连接层的权重参数；

b_o—全连接层的偏置；

s_t—全连接层的输入。

优选的，所述获取预处理的历史数据的步骤中，采用如下公式进行归一化：

X_std—归一化之后的数据；

X—未进行归一化的数据；

X_min(axis＝0)—未进行归一化的数据中特征的最小值；

X_max(axis＝0)—未进行归一化的数据中特征的最大值；

所述全连接层输出层采用如下公式进行反归一化：

X′＝X_std*(X_max(axis＝0)-X_min(axis＝0))+X_min(axis＝0)；

X′—反归一化的数据。

优选的，采用如下公式获取第一损失函数以及第二损失函数：

x_act—真实值；

x_pred—预测值；

Y_MAPE—平均绝对百分比误差

Adam算法采用如下公式：

θ_t—待更新的参数；

α—学习率；

—时间步t的梯度的一阶估计的修正量；

—时间步t的梯度的二阶估计的修正量；

式中：

β₁—时间步t的梯度的一阶估计衰减率；

β₂—时间步t的梯度的二阶估计衰减率；

g_t—时间步t的梯度。

优选的，所述对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型的步骤包括：

所述注意力机制的权重系数为：

e_t＝utanh(wh_t+b)

h_t—t时刻隐藏层的状态；

tanh—激活函数；

α_t—为t时刻注意力机制对隐藏层的注意力权重值；

e_t—t时刻LSTM层输出h_t所决定的注意力概率分布值；

u和w—权重系数；

b—偏置；

s_t—t时刻注意力机制隐藏层的输出值。

优选的，所述LSTM层满足如下公式：

f_t＝σ(W_fxx_t+W_fhh_t-1+b_f)；

W_f—隐藏层中间输出；

h_t与输入数据W_t是门运算的权值参数；

b_f—门运算的偏置；

σ—非线性激活函数sigmoid。

另一方面，本发明提供了一种基于ResNet-LSTM的配电台区短期负荷预测装置，具体包括如下步骤：

模型搭建模块：用于搭建第一ResNet-LSTM模型，所述ResNet-LSTM 模型包括CNN层、LSTM层以及全连接层输出层；

注意力机制引入模块：用于对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型；

训练模块：用于获取预处理的历史数据，并对所述第二ResNet-LSTM 模型进行训练对所述以获取第三ResNet-LSTM模型；

预测结果输出模块：用于将待预测的负荷数据属于所述三 ResNet-LSTM模型中，并对所述待预测的负荷数据进行负荷预测。

本发明实施例带来了以下有益效果：本发明提供了一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置，所述方法包括：搭建第一ResNet-LSTM模型，ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层；对第一ResNet-LSTM模型添加注意力机制以获取第二 ResNet-LSTM模型；获取预处理的历史数据，并对第二ResNet-LSTM模型进行训练对以获取第三ResNet-LSTM模型；将待预测的负荷数据属于三 ResNet-LSTM模型中，并对待预测的负荷数据进行负荷预测。本发明所提方法能显著提高配电台区短期负荷预测的精度。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的34层Resnet神经网络结构示意图；

图2为本发明实施例提供的卷积神经网络基本结构示意图；

图3为本发明实施例提供的K折交叉验证方法示意图；

图4为本发明实施例提供的ResNet-LSTM混合结构loss函数曲线示意图；

图5为本发明实施例提供的24h预测效果示意图；

图6为本发明实施例提供的7天预测效果示意图；

图7为本发明实施例提供的attention结构示意图；

图8为本发明实施例提供的长短期记忆人工神经网络原理图。

图9为本发明实施例提供的一种基于ResNet-LSTM的配电台区短期负荷预测方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，应用于短期负荷预测的方法可分为三类：经典方法、传统方法和智能方法。经典方法中，回归分析法结构简单，计算速度快，外推性能好，但用线性方程表述复杂问题，无法精确预测各种因素对结果的影响；时间序列法所需数据少，能反映短期内负荷的连续特点，但对节假日等对负荷影响较大的不确定因素考虑不足。传统方法中，卡尔曼滤波法表现较好：将负荷划分为随机分量和确定分量，随机分量用状态变量表示，确定分量用一阶线性模型描述，建立状态空间模型实现预测，其将系统下一时刻状态的最佳估计和系统未来的状态相结合，使模型预测结果更准确，但是实际场景下，难以得出噪音的统计特性，基于此，本发明实施例提供的一种基于ResNet-LSTM的配电台区短期负荷预测方法及装置，可以显著提高配电台区短期负荷预测的精度。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种基于 ResNet-LSTM的配电台区短期负荷预测方法及装置进行详细介绍。

实施例一：

本发明实施例一提供了一种基于ResNet-LSTM的配电台区短期负荷预测方法，具体包括如下步骤：

结合图7、图8、图9所示，搭建第一ResNet-LSTM模型，所述 ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层；

进一步的，结合图2所示，所述CNN层包括所第一BasicBlock残差基本模块、第二BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四BasicBlock残差基本模块；

在所述第三BasicBlock残差基本模块第四BasicBlock残差基本模块

在本发明提供的实施例中，Attention(注意力机制)本质上是一种资源分配的机制，能突出重要信息的影响对，在此所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型；

所述注意力机制的权重系数为：

e_t＝utanh(wh_t+b)

h_t—t时刻隐藏层的状态；

tanh—激活函数；

α_t—为t时刻注意力机制对隐藏层的注意力权重值；

e_t—t时刻LSTM层输出h_t所决定的注意力概率分布值；

u和w—权重系数；

b—偏置；

s_t—t时刻注意力机制隐藏层的输出值。

优选的，所述获取预处理的历史数据的步骤包括：

进一步的，将小时、月份、周几、是否周末、是否节假日进行one-hot 编码，丢弃原始数据中神经网络模型无法直接利用的特征，添加温度、湿度信息和月份的交互影响，以丰富数据的特征维度；将每连续的24个时刻历史数据作为一个时间序列，即根据过去24个时刻的数据预测下一时刻的负荷，为单步预测；也可根据需要改为多步预测。为了便于运算，将特征维度进行拆分，使其长宽近似相等；数据使用最大最小归一化方法进行归一化，消除奇异样本的不良影响；

采用如下公式进行归一化：

X_std—归一化之后的数据；

X—未进行归一化的数据；

X_min(axis＝0)—未进行归一化的数据中特征的最小值；

X_max(axis＝0)—未进行归一化的数据中特征的最大值；

判定第一损失函数是否小于第二损失函数；

采用如下公式获取第一损失函数以及第二损失函数：

x_act—真实值；

x_pred—预测值；

Y_MAPE—平均绝对百分比误差

Adam算法采用如下公式：

θ_t—待更新的参数；

α—学习率；

—时间步t的梯度的一阶估计的修正量；

—时间步t的梯度的二阶估计的修正量；

式中：

β₁—时间步t的梯度的一阶估计衰减率；

β₂—时间步t的梯度的二阶估计衰减率；

g_t—时间步t的梯度。

优选的，所述LSTM层满足如下公式：

f_t＝σ(W_fxx_t+W_fhh_t-1+b_f)；

W_f—隐藏层中间输出；

h_t与输入数据W_t是门运算的权值参数；

b_f—门运算的偏置；

σ—非线性激活函数sigmoid。

优选的，所述全连接层输出层采用Relu函数为激活函数：

y_t＝Relu(w_os_t+b_o)；

y_t—全连接层输出量；

w_o—全连接层的权重参数；

b_o—全连接层的偏置；

s_t—全连接层的输入。

所述全连接层输出层采用如下公式进行反归一化：

X′＝X_std*(X_max(axis＝0)-X_min(axis＝0))+X_min(axis＝0)；

X′—反归一化的数据。

在本发明提供的实施例中，在一个深度较浅的卷积神经网络上叠加 y＝x，可以保证神经网络的预测结果比起浅层网络不会退化；

进一步的，所述第一BasicBlock残差基本子模块、所述第二BasicBlock 残差基本子模块、所述第三BasicBlock残差基本子模块以及所述第四 BasicBlock残差基本子模块均包括两个BasicBlock残差学习基本单元；

在本发明提供的实施例中，每个残差单元的预测值H(x)为：

H(x)＝F(x,{w_i})+x

H(x)—预测值；

F(x,{w_i})—残差；

x—观测值。

因此残差网络学习的是预测值与观测值之差，即F(x)＝H(x)－x。当卷积层数较深时，即使F(x)中某些参数趋于零，由于观测值y＝x的存在，依旧可以保证学习能力不会下降；

结合图8遗忘门决定记忆单元中上一时刻的值由多少会被传入当前时刻进行学习。通过参数σ实现，σ的取值范围为(0,1)，遗忘门函数使用sigmoid函数来控制输出比例：

f_t＝σ(W_fxx_t+W_fhh_t-1+b_f)

W_f是权重系数；

h_t-1为上一序列的隐藏状态，x_t是本序列数据；

b_f是门运算的偏置；

σ为非线性激活函数sigmoid；

输入门决定让多少新的信息加入到单元中来。实现这个需要包括两个函数：

i_t＝σ(W_ixx_t+W_ihh_t-1+b_i)

类似的，W_tx、W_th、W_gx、W_gh为权重系数；

b_i、b_g为偏置；

为激活函数tanh。

输出门决定记忆单元中储存的记忆之有多大比例可以被输出：

o_t＝σ(W_oxx_t+W_ohh_t-1+b_o)

S_t＝g_t⊙i_t+S_t-1⊙f_t

在本发明提供的实施例中，训练方法法使用K折交叉验证方法进行改进，使数据集获得更强的随机性。首先将数据集随机打乱，并平均的分成K 个子数据集。在预测时随机选取K-1个子数据集作为模型的训练集，而将剩余的一个子数据集作为模型的测试集。将上述过程重复K次，最后将得到的K个结果求均值作为最终输出。这样，每一个数据都能参与正向传播与反向传播两个过程。K折交叉验证既防止了模型过拟合，也防止无法充分利用数据。

实施例二：

实施例三：

结合图5以及图6，选用Global Energy Forecasting数据集中两年的历史数据进行测试，可见在整个训练过程中，loss在稳步下降，红色曲线代表预测值，蓝色曲线为实际值。ResNet-LSTM模型的预测值与实际值相比，极大值点与极小值点对应的时间完全重合，曲线趋势基本一致。尤其是夜间用电低谷时间段内，预测值与实际值几乎完全吻合，这表明本方法也可用于预测一天甚至一周的负荷，验证了所提方法的有效性。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。

本发明实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/ 或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种基于ResNet-LSTM的配电台区短期负荷预测方法，其特征在于，具体包括如下步骤：

搭建第一ResNet-LSTM模型，所述ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层；

对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型；

2.根据权利要求1所述的方法，其特征在于，所述获取预处理的历史数据的步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型的步骤包括：

判定第一损失函数是否小于第二损失函数；

若是，则获取未优化参数的所述第二ResNet-LSTM模型为所述第三ResNet-LSTM模型；

4.根据权利要求1所述的方法，其特征在于，所述CNN层包括所第一BasicBlock残差基本模块、第二BasicBlock残差基本模块、第三BasicBlock残差基本模块以及第四BasicBlock残差基本模块；

5.根据权利要求1所述的方法，其特征在于，所述全连接层输出层采用Relu函数为激活函数：

y_t＝Relu(w_os_t+b_o)；

y_t—全连接层输出量；

w_o—全连接层的权重参数；

b_o—全连接层的偏置；

s_t—全连接层的输入。

6.根据权利要求1所述的方法，其特征在于，所述获取预处理的历史数据的步骤中，采用如下公式进行归一化：

X_std—归一化之后的数据；

X—未进行归一化的数据；

X_min(axis＝0)—未进行归一化的数据中特征的最小值；

X_max(axis＝0)—未进行归一化的数据中特征的最大值；

所述全连接层输出层采用如下公式进行反归一化：

X′＝X_std*(X_max(axis＝0)-X_min(axis＝0))+X_min(axis＝0)；

X′—反归一化的数据。

7.根据权利要求3所述的方法，其特征在于，采用如下公式获取第一损失函数以及第二损失函数：

x_act—真实值；

x_pred—预测值；

Y_MAPE—平均绝对百分比误差

Adam算法采用如下公式：

θ_t—待更新的参数；

α—学习率；

时间步t的梯度的一阶估计的修正量；

时间步t的梯度的二阶估计的修正量；

式中：

β₁—时间步t的梯度的一阶估计衰减率；

β₂—时间步t的梯度的二阶估计衰减率；

g_t—时间步t的梯度。

8.根据权利要求3所述的方法，其特征在于，所述对所述第一ResNet-LSTM模型添加注意力机制以获取第二ResNet-LSTM模型的步骤包括：

所述注意力机制的权重系数为：

e_t＝utanh(wh_t+b)

h_t—t时刻隐藏层的状态；

tanh—激活函数；

α_t—为t时刻注意力机制对隐藏层的注意力权重值；

e_t—t时刻LSTM层输出h_t所决定的注意力概率分布值；

u和w—权重系数；

b—偏置；

s_t—t时刻注意力机制隐藏层的输出值。

9.根据权利要求1所述的方法，其特征在于，所述LSTM层满足如下公式：

f_t＝σ(W_fxx_t+W_fhh_t-1+b_f)；

W_f—隐藏层中间输出；

h_t与输入数据W_t是门运算的权值参数；

b_f—门运算的偏置；

σ—非线性激活函数sigmoid。

10.一种基于ResNet-LSTM的配电台区短期负荷预测装置，其特征在于，具体包括如下步骤：

模型搭建模块：用于搭建第一ResNet-LSTM模型，所述ResNet-LSTM模型包括CNN层、LSTM层以及全连接层输出层；

训练模块：用于获取预处理的历史数据，并对所述第二ResNet-LSTM模型进行训练对所述以获取第三ResNet-LSTM模型；

预测结果输出模块：用于将待预测的负荷数据属于所述三ResNet-LSTM模型中，并对所述待预测的负荷数据进行负荷预测。