CN113743650A

CN113743650A - 电力负荷预测方法、装置、设备与存储介质

Info

Publication number: CN113743650A
Application number: CN202110889443.0A
Authority: CN
Inventors: 周挺辉; 苏寅生; 周保荣; 赵利刚; 甄鸿越; 黄冠标; 王长香; 吴小珊; 徐原; 翟鹤峰; 涂思嘉
Original assignee: China South Power Grid International Co ltd; China Southern Power Grid Co Ltd
Current assignee: China South Power Grid International Co ltd; China Southern Power Grid Co Ltd
Priority date: 2021-08-04
Filing date: 2021-08-04
Publication date: 2021-12-03
Anticipated expiration: 2041-08-04
Also published as: CN113743650B

Abstract

本发明公开了一种电力负荷预测方法、装置、设备以及计算机可读存储介质，所述方法通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权，能够给予重要特征更多的权重，并采用引入attention机制的双向LSTM对结构化数据进行特征提取，能够从众多信息中选择出对当前任务目标更关键的信息，最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷，有效提高了电力负荷预测结果的准确性。

Description

电力负荷预测方法、装置、设备与存储介质

技术领域

本发明涉及电力技术领域，尤其涉及一种电力负荷预测方法、装置、设备与存储介质。

背景技术

随着我国经济进入新的阶段，节约能源成为电力行业的发展方向，对于电力负荷的预测和精准把控是保障系统正常稳定运行的重要步骤，也能辅助用电系统的用电指定计划。

传统的电力负荷预测采用时间序列ARIMA的方式进行电力负荷预测，虽能在一定程度上预测电力负荷的趋势，但无法很好表达天气因素、气压等多因素对电力负荷的影响。据统计，影响电力负荷的因素高达32种，即有32维的数据。因此，传统的方法无法已经无法满足数据拟合。

随着机器学习的发展，支持向量机算法的出现可以解决多维度特征拟合、非线性、局部最小值等问题，但是支持向量机仅对小样本拟合较好，在大样本条件下，特征量较多的数据则会出现过拟合现象。而前馈神经网络虽能拟合多维数据，但其缺少对时间序列的数据相关性的考虑，需要人工构造时序特征，这样会导致预测不精确。

发明内容

本发明的目的是提供一种电力负荷预测方法、装置与存储介质，以解决现有技术对电力负荷预测不精准的问题。

本发明第一方面提供一种电力负荷预测方法，包括：

采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的；

将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；

将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；其中，所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型；

将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到电力负荷预测结果。

作为上述方案的改进，所述对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据，具体包括：

对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理，并根据数据类型，将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据；

对所述第二非结构化负荷数据进行向量化处理，得到第一特征数据；

对所述第二结构化负荷数据进行降维处理，得到第二特征数据。

作为上述方案的改进，所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理，并根据数据类型，将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据，具体包括：

将所述预设时间段的电力负荷数据整理成数据表，其中，所述数据表的每一列用于存放影响因素名称和相关联的数据；

遍历所述数据表的每一列，查找并删除数据缺失率大于第一预设缺失率的所在列、查找并删除与前一列影响因素名称相同的所在列、查找并填充数据缺失率小于第二预设缺失率的所在列、查找并删除存在异常数据的所在行，得到过滤填充后的数据表；

将过滤填充后的数据表中的数据进行标准化和归一化处理，并根据数据类型，将过滤填充后的数据表中的数据分为第二结构化负荷数据和第二非结构化负荷数据。

作为上述方案的改进，所述对所述第二非结构化负荷数据进行向量化处理，得到第一特征数据，具体为：

采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理，得到第一特征数据。

本发明第二方面提供一种电力负荷预测装置，包括：

数据预处理模块，对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的；

第一特征向量获取模块，用于将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；

第二特征向量获取模块，用于将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；其中，所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型；

预测结果获取模块，用于将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到电力负荷预测结果。

作为上述方案的改进，所述数据预处理模块，具体包括：

过滤填充处理单元，用于对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理，并根据数据类型，将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据；

第一特征数据获取单元，用于对所述第二非结构化负荷数据进行降维处理，得到第一特征数据；

第二特征数据获取单元，用于对所述第二结构化负荷数据进行向量化处理，得到第二特征数据。

作为上述方案的改进，所述过滤填充处理单元，具体用于：

对将所述预设时间段的电力负荷数据整理成数据表，其中，所述数据表的每一列用于存放影响因素名称和相关联的数据；

作为上述方案的改进，所述第一特征数据获取单元，具体用于：

本发明第三方面提供一种电力负荷预测设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如上述的电力负荷预测方法。

本发明第四方面提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述的电力负荷预测方法。

与现有技术相比，本发明提供的电力负荷预测方法的有益效果在于：本发明提供的电力负荷预测方法包括对预设时间段的第一非结构化负荷数据预处理得到第一特征数据，对所述预设时间段的第一结构化负荷数据预处理得到第二特征数据，并将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到预设时间段的电力负荷预测结果，其通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权，能够给予重要特征更多的权重，并采用引入attention机制的双向LSTM对结构化数据进行特征提取，能够从众多信息中选择出对当前任务目标更关键的信息，最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷，有效提高了电力负荷预测结果的准确性。相应地，本发明还提供一种电力负荷预测装置、设备及计算机可读存储介质。

附图说明

图1是本发明提供的电力负荷预测方法的一种实施例的流程示意图；

图2是本发明实施例提供的电力负荷预测方法的详细预测流程框图。

图3是本发明提供的电力负荷预测装置的一种实施例的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明提供的电力负荷预测方法的一个实施例的流程示意图。

本发明实施例提供的电力负荷预测方法，包括步骤S11到步骤S14：

步骤S11，对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的；

步骤S12，将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；

步骤S13，将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；其中，所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型；

步骤S14，将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到电力负荷预测结果。

具体的，预设时间段的电力负荷数据分为第一非结构化负荷数据和第一结构化负荷数据。所述预先时间段可以为待预测日的前1天，或者前m天到前1天。

具体的，所述第一特征数据为向量编码的形式，由于第一非结构化负荷数据为非结构数据，网络模型不能直接提取特征，需要将非结构化的数据预处理(预处理过程包括了向量化处理)，从而得到向量形式的第一特征数据。

在具体实施时，可以预先构建卷积神经网络、Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络并对其进行训练，具体可以通过获取历史电力负荷数据，将历史电力负荷数据分为训练集、验证集、测试集(该测试集即为所述预设时间段的电力负荷数据)；其中，所述训练集和所述验证集用于训练Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络并使得模型收敛，并得到训练后的Transformer编码器模型、LSTM-Attention网络模型和全连接神经网络应用于测试集对待预测日的电力负荷进行预测。

可以理解的是，卷积神经网络采用卷积的形式能够提取不同类型数据的潜在特征，但其在提取特征后并不能很好地记住哪些特征是重要的，因此，本发明实施例在通过对非结构化负荷数据预处理后得到的第一特征数据输入到卷积神经网络进行特征提取后进一步输入到Transformer编码器模型中，能够使得最终提取到的第一特征向量既自带时间属性，又增强了不同特征向量之间的相关性，并给予重要特征更多的权重，得到一组带有自注意力机制的特征向量。

具体的，卷积神经网络对第一特征数据的提取过程为：先对向量形式的第一特征数据进行卷积操作，卷积步长设为2，采用3*3的卷积层进行卷积操作，卷积完成后，对其进行池化操作，池化过程采用最大池化，得到第一一特征向量。

可以理解的是，对于结构化的负荷数据，其预处理得到的第二特征数据输入到LSTM-Attention网络模型中，由于双向LSTM引入了注意力机制，能够解决信息超载的问题，将计算资源分配给对当前任务目标更关键的信息，从而能够提取出更具有代表性的特性向量。

具体的，所述第一特征向量和所述第二特征向量在相应的模型中处理得到加权后的数据，对所述第一特征向量和所述第二特征向量进行拼接，从而获取数据的重要性加权的特征向量矩阵，即拼接特征向量，将拼接特征向量输入到全连接神经网络进行预测，即得到电力负荷预测结果。

具体的，所述全连接神经网络具体为前馈神经网络，其由输入层、隐含层、输出层组成，其中前馈神经网络的中间神经元的激活函数采用RELU函数，最后一层的函数去掉激活函数，就可以输出回归值，即电力负荷的预测结果。

本发明提供的电力负荷预测方法包括对预设时间段的第一非结构化负荷数据预处理得到第一特征数据，对所述预设时间段的第一结构化负荷数据预处理得到第二特征数据，并将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到预设时间段的电力负荷预测结果，其通过将预设时间段的非结构化数据输入卷积神经网络中后用Transformer编码器模型进行特征赋权，能够给予重要特征更多的权重，并采用引入attention机制的双向LSTM对结构化数据进行特征提取，能够从众多信息中选择出对当前任务目标更关键的信息，最后采用特征向量拼接的方式将第一特征向量和第二特征向量拼接输入到全连接神经网络中来预测电力负荷，有效提高了电力负荷预测结果的准确性。

示例性的，参见图2，图2示出了本发明实施例提供的电力负荷预测方法的详细预测流程框图。在一种实施方式中，所述步骤S11“对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据”，具体包括：

对所述第二非结构化负荷数据进行降维处理，得到第一特征数据；

对所述第二结构化负荷数据进行向量化处理，得到第二特征数据。

在本发明实施例中，为了能够最大限度地从原始符合数据中提取特征以供算法和模型使用，需要对历史电力负荷数据(包括预设时间段的电力负荷数据)中过滤、填充、标准化和归一化处理。同时，由于电力负荷数据包括了多个影响因素对应的数据，如，时间(小时、天)、天气因素、温度、电力负荷等，而在这些数据中，存在着如“时间”、“电力负荷”等的第一结构化负荷数据，也存在着“天气因素”等这种文本的第一非结构化负荷数据，因此，需要将这两类型的负荷数据分别处理，针对第二结构化负荷数据进行降维处理，对第二非结构化负荷数据进行向量化处理，并便于后续输入到对应的模型中提取特征。

进一步的，在一种实施方式中，所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理，并根据数据类型，将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据，具体包括：

具体的，所述第一预设缺失率为0.5，所述第二预设缺失率为0.2。对于某一列影响因素相关联的数据缺失率较大时，则该列数据对整体预测不会产生很大影响，因此，需要将这列过滤掉。而对于某一列影响因素相关联的数据缺失率比较小时，则该列数据对于整体预测有一定影响，因此，需要对数据进行填充。示例性的，可以采用临近插值法进行填充。

在对数据填充后，需要进一步过滤异常值，过滤规则可以采用3倍标准差原则，即，整体平均数+-整体标准差*用户设置的标准差倍数(默认为3)。具体的，当在某一列影响因素相关联的数据中有一个数据与该列其他数据相差明显较大时，则判定该数据为异常数据，并删除该异常数据所在行。

在一种实施方式中，所述对所述第二非结构化负荷数据进行向量化处理，得到第二特征数据，具体为：

采用One-hot编码、BOW模型、TF-IDF算法或N-Gram模型对所述第二非结构化负荷数据进行向量化处理，得到第二特征数据。

在本发明实施例中，对于非结构的数据，需要将其向量化，均可输入到网络模型中提取特征。

参见图3，图3是本发明提供的电力负荷预测装置的一个实施例结构框图。

本发明实施例提供的电力负荷预测装置10，包括：

数据预处理模块11，对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的；

第一特征向量获取模块12，用于将所述第一特征数据输入到预先训练的卷积神经网络进行特征提取，得到第一一特征向量，并将所述第一一特征向量输入到预先训练的Transformer编码器模型中，得到第一特征向量；

第二特征向量获取模块13，用于将所述第二特征数据输入到预先训练的LSTM-Attention网络模型中，得到第二特征向量；其中，所述LSTM-Attention网络模型为引入注意力机制的双向LSTM模型；

预测结果获取模块14，用于将所述第一特征向量和所述第二特征向量进行拼接，得到拼接特征向量，并将所述拼接特征向量输入到预先训练的全连接神经网络进行预测，得到电力负荷预测结果。

在一种实施方式中，所述数据预处理模块11，具体包括：

在一种实施方式中，所述过滤填充处理单元，具体用于：

在一种实施方式中，所述第一特征数据获取单元，具体用于：

需要说明的是，本发明实施例提供的电力负荷预测装置，其用于执行所述电力负荷预测方法的全部流程和示意图，两者的原理和作用效果一一对应，这里不再作过多的赘述。

其中，所述电力负荷预测装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

相应地，本发明实施例还提供了一种电力负荷预测设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如上述实施例提供的电力负荷预测方法。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述实施例提供的电力负荷预测方法。

示例性的，所述计算机程序可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器中，并由所述处理器执行，以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序在所述电力负荷预测装置中的执行过程。例如，所述计算机程序可以被分割成如图3所示的电力负荷预测装置的功能模块。

所述电力负荷预测设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述电力负荷预测装置可包括，但不仅限于，处理器、存储器。本领域技术人员可以理解，所述示意图仅仅是电力负荷预测装置的示例，并不构成对电力负荷预测装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述电力负荷预测装置还可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述电力负荷预测装置的控制中心，利用各种接口和线路连接整个电力负荷预测装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述电力负荷预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种电力负荷预测方法，其特征在于，包括：

对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一非结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一结构化负荷数据预处理得到的；

2.如权利要求1所述的电力负荷预测方法，其特征在于，所述对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据，具体包括：

3.如权利要求2所述的电力负荷预测方法，其特征在于，所述对预设时间段的电力负荷数据进行过滤、填充、标准化和归一化处理，并根据数据类型，将处理后的数据分为第二结构化负荷数据和第二非结构化负荷数据，具体包括：

4.如权利要求2所述的电力负荷预测方法，其特征在于，所述对所述第二非结构化负荷数据进行向量化处理，得到第一特征数据，具体为：

5.一种电力负荷预测装置，其特征在于，包括：

数据预处理模块，对采集到的预设时间段的电力负荷数据进行预处理，得到第一特征数据和第二特征数据；其中，所述第一特征数据是对预设时间段的第一结构化负荷数据预处理得到的，所述第二特征数据是对预设时间段的第一非结构化负荷数据预处理得到的；

6.如权利要求5所述的电力负荷预测装置，其特征在于，所述数据预处理模块，具体包括：

第一特征数据获取单元，用于对所述第二非结构化负荷数据进行向量化处理，得到第一特征数据；

第二特征数据获取单元，用于对所述第二结构化负荷数据进行降维处理，得到第二特征数据。

7.如权利要求6所述的电力负荷预测装置，其特征在于，所述过滤填充处理单元，具体用于：

8.如权利要求6所述的电力负荷预测装置，其特征在于，所述第一特征数据获取单元，具体用于：

9.一种电力负荷预测设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的电力负荷预测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至4中任意一项所述的电力负荷预测方法。