CN110991729A

CN110991729A - 一种基于迁移学习和多头注意力机制的负荷预测方法

Info

Publication number: CN110991729A
Application number: CN201911192616.2A
Authority: CN
Inventors: 周知瑞; 邓世杰
Original assignee: Sichuan Wanyi Energy Technology Co ltd
Current assignee: Sichuan Wanyi Energy Technology Co ltd
Priority date: 2019-11-28
Filing date: 2019-11-28
Publication date: 2020-04-10

Abstract

本发明公开了一种基于迁移学习和多头注意力机制的负荷预测方法，采用数据集向量到向量的数据处理流程，可以在统一框架下提供未来多步时刻的用电负荷预测结果；通过循环神经网络进行数据集编码，并构造多头注意力机制，能有效识别多种负荷模型，提升数据精度；并利用迁移学习方法，将某特定区域训练好的神经网络模型参数迁移至其他区域，大幅度降低模型对数据集规模要求，有效降低适用门槛。

Description

一种基于迁移学习和多头注意力机制的负荷预测方法

技术领域

本发明涉及用电负荷预测领域，具体涉及一种基于迁移学习和多头注意力机制的负荷预测方法。

背景技术

近年来，以时间序列、机器学习技术为基础的多种算法或模型被用于用电负荷预测中，如：Arima、GBDT、循环神经网络等。其中Arima等传统时间序列预测模型精度较低；GBDT及其变种无法直接进行多步预测；循环神经网络模型复杂度较高，对小型数据集预测精度较差。

现有技术方案不仅存在上述内在缺陷，由于用电主体往往存在多种负荷模式，模式间规律性差异较大，因此上述各种算法或模型均不能准确预测用电负荷。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于迁移学习和多头注意力机制的负荷预测方法解决了现有技术无法预测具有多样性且只有小型数据集样本的用电负荷的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于迁移学习和多头注意力机制的负荷预测方法，包括以下步骤：

S1、从能源大数据平台获取研究区域内的所有用电单元历史粒度负荷数据，得到用电数据集X＝{x₀,…,x_t,…,x_τ}，t为当前时间，其值在区间[0,τ]内，τ为所获取的用电数据集的时间长度；

S2、采用GRU循环神经网络，利用均值为0方差为0.05的正态分布，对用电数据集X进行编码，得到隐藏状态编码集

S3、根据多头注意力机制，构造6个注意力向量，并用注意力向量对隐藏状态编码集

进行进一步编码，得到最终编码向量h^enc；

S4、采用GRU循环神经网络，利用均值为0方差为0.05的正态分布，根据用电数据集X、隐藏状态编码集

和最终编码向量h^enc，对未来用电负荷进行预测，得到未来时刻用电负荷预测集{p′_t+1,…,p′_t+i,…,p′_t+K}，其中K为预测范围内，未来时间中的单位时刻总数；

S5、继续监控并采集用电负荷情况，得到与未来时刻用电负荷预测集对应的相对未来时刻用电负荷真实值{p_t+1,…,p_t+i,…,p_t+K}，并计算未来时刻用电负荷预测集和相对未来时刻用电负荷真实值的均方误差MSE；

S6、根据均方误差MSE，采用梯度下降法训练GRU循环神经网络的各项权值，判断权值是否在训练过程中发生变化，若是，则跳转至步骤S1，若否，则跳转至步骤S7；

S7、记录训练出的GRU循环神经网络的各项权值，扩大需要进行用电负荷预测的研究区域，并通过迁移学习方法，采用记录得到的GRU循环神经网络的各项权值构建成熟的GRU循环神经网络对新的区域进行数据集神经网络训练，进而实现用电负荷预测。

进一步地：步骤S1的用电数据集X＝{x₀,…,x_t,…,x_τ}由[0,τ]时间范围内的[0,N]用电单元的负荷、当前用电单元产生负荷的当前时间是否为节假日的标志信息以及当前用电单元产生负荷的当前时间是否为周末的标志信息组合而成，即

其中u为当前的用电单元编号，其值在区间[0,N]内，N为用电单元总数，

为用电单元u在t时刻的用电负荷，

为用电单元u在t时刻是否为其节假日的标志信息，

为t时刻是否为周末的标志信息。

进一步地：步骤S2中的编码过程遵循以下等式：

其中，sigmoid()为S型生长曲线函数；tanh()为双曲正切函数；·为向量点乘运算；*为卷积运算；0为0向量；z_t为GRU循环神经网络更新门输出量；

为循环神经网络更新门权值；r_t为GRU循环神经网络重置门输出量；

为GRU循环神经网络重置门权值；s_t为GRU循环神经网络中间状态量；W^enc为GRU循环神经网络中间状态权值。

进一步地：步骤S3中的进一步编码过程遵循以下等式：

其中，A_j；j∈{1,2,…,6}为六个注意力向量；

为

的注意力得分，

为注意力权重，最终编码向量h^enc为六个最终编码元素

拼接而成，即

进一步地：步骤S4中的预测过程遵循以下等式：

p’_t+i＝tanh(W_output·h_t+i) (16)

其中，x’_t+i为未来时刻t+i的拼接输入集，

为预测用GRU循环神经网络更新门输出量；

为预测用循环神经网络更新门权值；

为预测用GRU循环神经网络重置门输出量；

为预测用GRU循环神经网络重置门权值；

为预测用GRU循环神经网络中间状态量；W^dec为预测用GRU循环神经网络中间状态权值；W_output为输出量权值，

为未来时刻t+i的解码隐藏状态向量；h_t+i为最终编码向量h^enc和解码隐藏状态向量

拼接后的状态向量；p’_t+i为未来时刻t+i的用电负荷预测值。

进一步地：步骤S6中的各项权值包括：循环神经网络更新门权值

GRU循环神经网络重置门权值

GRU循环神经网络中间状态权值W^enc，预测用循环神经网络更新门权值

预测用GRU循环神经网络重置门权值

预测用GRU循环神经网络中间状态权值W^dec和输出量权值W_output。

本发明的有益效果为：采用数据集向量到向量的数据处理流程，可以在统一框架下提供未来多步时刻的用电负荷预测结果；通过循环神经网络进行数据集编码，并构造多头注意力机制，能有效识别多种负荷模型，提升数据精度；并利用迁移学习方法，将某特定区域训练好的神经网络模型参数迁移至其他区域，大幅度降低模型对数据集规模要求，有效降低适用门槛。

附图说明

图1为一种基于迁移学习和多头注意力机制的负荷预测方法流程示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，在本发明的一个实施例中，一种基于迁移学习和多头注意力机制的负荷预测方法，包括以下步骤：

步骤S1的用电数据集X＝{x₀,…,x_t,…,x_τ}由[0,τ]时间范围内的[0,N]用电单元的负荷、当前用电单元产生负荷的当前时间是否为节假日的标志信息以及当前用电单元产生负荷的当前时间是否为周末的标志信息组合而成，即

为用电单元u在t时刻的用电负荷，

为用电单元u在t时刻是否为其节假日的标志信息，

为t时刻是否为周末的标志信息。

步骤S2中的编码过程遵循以下等式：

进行进一步编码，得到最终编码向量h^enc；

步骤S3中的进一步编码过程遵循以下等式：

其中，A_j；j∈{1,2,…,6}为六个注意力向量；

为

的注意力得分，

为注意力权重，最终编码向量h^enc为六个最终编码元素

拼接而成，即

步骤S4中的预测过程遵循以下等式：

p’_t+i＝tanh(W_output·h_t+i) (16)其中，x′_t+i为未来时刻t+i的拼接输入集，

为预测用GRU循环神经网络更新门输出量；

为预测用循环神经网络更新门权值；

为预测用GRU循环神经网络重置门输出量；

为预测用GRU循环神经网络重置门权值；

拼接后的状态向量；p′_t+i为未来时刻t+i的用电负荷预测值。

步骤S6中的各项权值包括：循环神经网络更新门权值

GRU循环神经网络重置门权值

预测用GRU循环神经网络重置门权值

本发明采用数据集向量到向量的数据处理流程，可以在统一框架下提供未来多步时刻的用电负荷预测结果；通过循环神经网络进行数据集编码，并构造多头注意力机制，能有效识别多种负荷模型，提升数据精度；并利用迁移学习方法，将某特定区域训练好的神经网络模型参数迁移至其他区域，大幅度降低模型对数据集规模要求，有效降低适用门槛。

Claims

1.一种基于迁移学习和多头注意力机制的负荷预测方法，其特征在于，包括以下步骤：

S1、从能源大数据平台获取研究区域内的所有用电单元历史粒度负荷数据，得到用电数据集X＝{x₀，…，x_t，…，x_τ}，t为当前时间，其值在区间[0，τ]内，τ为所获取的用电数据集的时间长度；

进行进一步编码，得到最终编码向量h^enc；

和最终编码向量h^enc，对未来用电负荷进行预测，得到未来时刻用电负荷预测集{p’_t+1，…，p’_t+i，…，p’_t+K}，其中K为预测范围内，未来时间中的单位时刻总数；

S5、继续监控并采集用电负荷情况，得到与未来时刻用电负荷预测集对应的相对未来时刻用电负荷真实值{p_t+1，…，p_t+i，…，p_t+K}，并计算未来时刻用电负荷预测集和相对未来时刻用电负荷真实值的均方误差MSE；

2.根据权利要求1所述的基于迁移学习和多头注意力机制的负荷预测方法，其特征在于，所述步骤S1的用电数据集X＝{x₀，…，x_t，…，x_τ}由[0，τ]时间范围内的[0，N]用电单元的负荷、当前用电单元产生负荷的当前时间是否为节假日的标志信息以及当前用电单元产生负荷的当前时间是否为周末的标志信息组合而成，即