CN112700057A - 一种基于模块化循环神经网络的电力负荷预测方法 - Google Patents

一种基于模块化循环神经网络的电力负荷预测方法 Download PDF

Info

Publication number
CN112700057A
CN112700057A CN202110020657.4A CN202110020657A CN112700057A CN 112700057 A CN112700057 A CN 112700057A CN 202110020657 A CN202110020657 A CN 202110020657A CN 112700057 A CN112700057 A CN 112700057A
Authority
CN
China
Prior art keywords
hidden layer
strategy
neural network
module
recurrent neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110020657.4A
Other languages
English (en)
Other versions
CN112700057B (zh
Inventor
黄昉菀
郭昆
於志勇
庄世杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110020657.4A priority Critical patent/CN112700057B/zh
Publication of CN112700057A publication Critical patent/CN112700057A/zh
Application granted granted Critical
Publication of CN112700057B publication Critical patent/CN112700057B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于模块化循环神经网络的电力负荷预测方法。包括以下步骤:1、构建一个包含输入层、隐藏层和输出层的循环神经网络,并把隐藏层划分为若干个模块;2、通过四种隐藏层模块更新策略和两种循环连接剪枝策略的不同组合,可以构建不同的模块化循环神经网络;3、对获取的电力负荷数据进行Z‑score标准化处理,并将其按照时间顺序划分为训练集,验证集和测试集。利用训练集对模型进行训练,用验证集进行调参,最后在测试集上评估性能。本发明相对于目前广泛应用的门控循环神经网络而言,该框架下的模型能够在有效降低网络训练参数量的同时,实现对电力负荷的精准预测。特别是基于自适应更新策略的模块化循环神经网络的表现最为突出。

Description

一种基于模块化循环神经网络的电力负荷预测方法
技术领域
本发明涉及一种基于模块化循环神经网络的电力负荷预测方法。
背景技术
电力负荷预测对于确保智能电网的安全、稳定和高效运行具有重要作用。从电力生产的角度来看,精准预测有助于制定合理的生产计划,在提供充足电力供应的同时避免过度生产造成的资源浪费。从电力消费的角度来看,精准预测有助于实时电价的合理制定,以鼓励非高峰电力消费。近年来,智能电网中各种高精度数据采集设备(如智能电表)的不断出现,为电力负荷预测提供了强有力的支持。目前用于电力负荷预测的方法通常可以分为两类:基于统计分析的方法和基于数据驱动的方法。虽然基于统计分析的方法已经发展得非常成熟,但由于电力负荷序列的非线性、用户行为的随机性、外部因素的多样性等原因,其精准度仍有待进一步的提高。这使得基于人工智能的数据驱动方法逐渐成为该领域的研究热点。主要模型包括动态神经网络、极限学习机、深度信念网络、卷积神经网络等。然而,上述模型没有将数据的时序关系作为电力负荷的明确特征,当需要考虑当前负荷与历史负荷之间的复杂时间依赖关系时,可能会导致模型预测性能下降。因此,近年来,能够通过隐藏层状态连续传输早期输入信息的循环神经网络(Recurrent Neural Network,RNN)被广泛应用于缺乏外部影响因素情况下的电力负荷预测问题。
由于传统RNN采用随时间反向传播算法进行网络参数训练,随着记忆深度的增加,模型容易出现梯度消失或爆炸的问题。为了改变传统RNN在长序列学习中表现不佳的现状,可采用训练算法替代、循环权重约束、门控机制和多时间尺度连接等改进措施。在训练算法替代方面,研究人员提出了Hessian-Free方法和储备池计算等,但上述方法存在着实施困难或学习能力有限等不足。在循环权重约束方面,研究人员提出在初始化或整个学习过程中约束循环连接权重,以保证矩阵多步连乘后的范数仍约等于1。然而,严格执行权重约束可能会影响模型的训练速度和泛化能力。以长短期记忆网络(Long Short-Term Memory,LSTM)及其变体为代表的门控机制是最常见的一种措施,已成功应用于包括电力负荷预测在内的众多时间序列数据挖掘任务中。但该机制造成了隐藏层复杂的内部结构,其缺点在于需要训练的网络参数急剧增大。最后一种提高RNN长期依赖能力的常用方法是引入多时间尺度连接。其主要思想是隐藏层的循环连接不仅要存在于相邻的时间步长中,还要存在于更大的时间步长中。这样做的好处是长期依赖关系不需要一步一步的反向传播,而是可以用更少的时间步完成。例如:Temporal-Kernel RNN规定每个神经元的循环连接随着跳跃长度的增加呈指数衰减;Skip RNN允许网络根据计算出的更新可能性决定当前时刻是否更新神经元。除了以神经元为单位之外,还可以将隐藏层划分为若干个模块来形成多时间尺度的连接,如Clock-Work RNN。最近,Dilated RNN提出可以堆叠多个隐藏层,并让这些隐藏层在不同的跳跃长度上工作以关注不同的时间依赖。
发明内容
本发明的目的在于提供一种基于模块化循环神经网络的电力负荷预测方法,该方法能够在有效降低网络训练参数量的同时,实现对电力负荷的精准预测。特别是基于自适应更新策略的模块化循环神经网络的表现最为突出。
为实现上述目的,本发明的技术方案是:一种基于模块化循环神经网络的电力负荷预测方法,包括以下步骤:
步骤S1、构建一个包含输入层、隐藏层和输出层的循环神经网络,并把隐藏层划分为若干个模块;
步骤S2、选择固定策略、随机策略、无序自适应策略和有序自适应策略中的任意一种更新策略用于隐藏层模块的更新;
步骤S3、选择与步骤S2的更新策略相匹配的循环连接剪枝策略,其中固定策略和有序自适应策略可选择单方向剪枝策略,而随机策略和无序自适应策略可以选择双方向剪枝策略;
步骤S4、根据选择好的隐藏层模块更新策略和循环连接剪枝策略利用训练集进行模块化循环神经网络的电力负荷预测模型训练,利用验证集进行参数优化,最后利用测试集评估预测性能,得到最终的模块化循环神经网络的电力负荷预测模型。
在本发明一实施例中,步骤S1中,循环神经网络的构建过程如下:
步骤S101、构建一个包含输入层、隐藏层和输出层的循环神经网络,其中输出层可在每个时间步都出现或仅出现在最后一个时间步,若输出层放置在最后一个时间步,则构建的循环神经网络用于预测在输入一段时长的信息后的下一个时刻的负荷值;时间步长可根据任务设定;输入层神经元的个数ni可以根据需要设定;隐藏层神经元的个数nh可利用验证集进行优化;输出层神经元的个数no根据预测任务设定;
步骤S102、随机生成输入层到隐藏层的输入连接权重
Figure BDA0002887713820000021
相邻时刻隐藏层之间的循环连接权重
Figure BDA0002887713820000022
隐藏层到输出层的输出连接权重
Figure BDA0002887713820000023
隐藏层偏置向量
Figure BDA0002887713820000024
和输出层偏置向量
Figure BDA0002887713820000025
利用上述参数,可得到模块化循环神经网络的计算方程如公式(1)-(3)所示:
h′t=fh(Wihxt+(Whh*M)ht-1+bh) #(1);
ht=(1-ut)⊙ht-1+ut⊙h′t #(2);
yt=fo(Whoht+bo) #(3);
其中,fh(.)和fo(.)分别表示隐藏层和输出层的激活函数,⊙和*分别表示向量间和矩阵间的元素级乘法运算,
Figure BDA0002887713820000031
表示在时间步t隐藏层神经元的更新向量,
Figure BDA0002887713820000032
表示循环连接权重Whh的剪枝标记矩阵;
步骤S103、将隐藏层划分为k个模块,其中每个模块的神经元个数如公式(4)所示:
Figure BDA0002887713820000033
在本发明一实施例中,步骤S101中,输入层神经元的个数ni若为1,可输入每天的最大或平均负荷值;输入层神经元的个数ni若为2,可输入当天的负荷值和温度;输入层神经元的个数ni若为24,可输入每天每小时的负荷值。
在本发明一实施例中,步骤S2中,固定策略、随机策略、无序自适应策略和有序自适应策略的具体实现方法如下:
1)固定策略:
步骤S201、首先为每个隐藏层模块预分配一个工作周期,各个隐藏层模块的工作周期可用公式(5)得到:
Ti=ri-1(i=1,2,…,k) #(5);
式中,r是一个大于1的固定的整数;
步骤S202、根据当前时间步t是否能够整除每一个模块的周期Ti来获得每一个隐藏层模块的更新子向量
Figure BDA0002887713820000034
如公式(6)所示:
Figure BDA0002887713820000035
Figure BDA0002887713820000036
是一个全1向量时,意味着相应隐藏层模块内的所有神经元在时间步t参与更新,否则保持和上一个时刻的状态相同;
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA0002887713820000037
2)随机策略:
步骤S201、在每个时间步为每个隐藏层模块随机设置一个更新概率
Figure BDA0002887713820000038
步骤S202、设定一个更新阈值0<ε<1,则每一个隐藏层模块的更新子向量
Figure BDA0002887713820000039
的获得方式如公式(7)所示:
Figure BDA0002887713820000041
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA0002887713820000042
3)无序自适应策略:
步骤S201、对每个时间步的隐藏层候选状态ht′设计一个新的激活函数来得到每一个隐藏层模块的优先级
Figure BDA0002887713820000043
如公式(8)所示:
Figure BDA0002887713820000044
式中sumi(.)表示将隐藏层模块i中所有神经元对应的softmax(.)的值进行累加;
步骤S202、根据公式(9)可获得每一个隐藏层模块在时间步t的更新子向量
Figure BDA0002887713820000045
Figure BDA0002887713820000046
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA0002887713820000047
4)有序自适应策略:
步骤S201、与3)中无序自适应策略的步骤S201相同;
步骤S202、根据公式(10)对每一个隐藏层模块的优先级
Figure BDA0002887713820000048
进行模块间的累加,从而可以得到每一个隐藏层模块的累加优先级
Figure BDA0002887713820000049
Figure BDA00028877138200000410
步骤S203、设定一个更新阈值0<ε<1,则该时刻的隐藏层更新向量
Figure BDA00028877138200000411
的获得方式如公式(11)所示:
Figure BDA00028877138200000412
在本发明一实施例中,步骤S3中,单方向剪枝策略、双方向剪枝策略的具体实现方法如下:
1)单方向剪枝策略:
步骤S301、将剪枝标记矩阵
Figure BDA00028877138200000413
划分成k×k个子矩阵,每个子矩阵Mij∈Rm ×m,如公式(12)所示:
Figure BDA0002887713820000051
步骤S302、单方向剪枝策略规定前一个时刻的隐藏层神经元可连接到下一个时刻更新频率与之相等或者更快的神经元;考虑到固定策略和有序自适应策略均可保证模块号越小的隐藏层模块其更新频率更快,故可根据公式(13)得到每个子矩阵Mij∈Rm×m的取值:
Figure BDA0002887713820000052
步骤S303、每个时间步均利用上述得到的相同的标记矩阵M对循环连接Whh进行剪枝操作;
2)双方向剪枝策略:
步骤S301、与1)中单方向剪枝策略的步骤S301相同;
步骤S302、考虑到随机策略和无序自适应策略的隐藏层模块更新频率没有快慢之分,故必须通过概率确定其剪枝与否;首先保证每个时间步的
Figure BDA0002887713820000053
是一个全1矩阵;然后在每个时间步为每个隐藏层模块
Figure BDA0002887713820000054
随机设置一个剪枝概率
Figure BDA0002887713820000055
最后设置一个剪枝阈值0<θ<1,并通过公式(14)得到每个时间步剩余子矩阵
Figure BDA0002887713820000056
的取值:
Figure BDA0002887713820000057
步骤S303、每个时间步均利用上述得到的不同的标记矩阵M对循环连接Whh进行剪枝操作。
在本发明一实施例中,步骤S4中,模块化循环神经网络的电力负荷预测模型的训练过程具体如下:
步骤S401、将电力负荷数据集的数据进行Z-score标准化处理,并按照时间的先后顺序划分为训练集、测试集和验证集三个部分;
步骤S402、设置网络的相关配置参数,包括时间步长、各层神经元个数、隐藏层模块数、优化器、学习率、批处理大小、迭代次数、更新阈值、剪枝阈值;
步骤S403、将划分好的训练集的数据加入到循环神经网络中进行训练,在验证集上进行参数优化,最后利用测试集上得到的电力负荷预测值与实际的电力负荷值进行比较,来评估训练后的模块化循环神经网络的电力负荷预测模型的有效性。
相较于现有技术,本发明具有以下有益效果:在真实电力负荷数据集的实验结果表明,相对于目前广泛应用的门控循环神经网络而言,本发明方法能够在有效降低网络训练参数量的同时,实现对电力负荷的精准预测。特别是基于自适应更新策略的模块化循环神经网络的表现最为突出。
附图说明
图1为模块化循环神经网络的框架图,其中
Figure BDA0002887713820000061
表示模块
Figure BDA0002887713820000062
的状态保持不变的时间长度,该值由模块的更新向量
Figure BDA0002887713820000063
决定。
图2为模块化循环神经网络的循环连接剪枝示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,本发明提供了一种基于模块化循环神经网络的电力负荷预测方法,包括以下步骤:
步骤S1、构建一个包含输入层、隐藏层和输出层的循环神经网络,并把隐藏层划分为若干个模块;
步骤S2、选择固定策略、随机策略、无序自适应策略和有序自适应策略中的任意一种更新策略用于隐藏层模块的更新;
步骤S3、选择与步骤S2的更新策略相匹配的循环连接剪枝策略,其中固定策略和有序自适应策略可选择单方向剪枝策略,而随机策略和无序自适应策略可以选择双方向剪枝策略;
步骤S4、根据选择好的隐藏层模块更新策略和循环连接剪枝策略利用训练集进行模块化循环神经网络的电力负荷预测模型训练,利用验证集进行参数优化,最后利用测试集评估预测性能,得到最终的模块化循环神经网络的电力负荷预测模型。
本实例中,步骤S1中,循环神经网络的构建过程如下:
步骤S101、构建一个包含输入层、隐藏层和输出层的循环神经网络,其中输出层可在每个时间步都出现或仅出现在最后一个时间步,若输出层放置在最后一个时间步,则构建的循环神经网络用于预测在输入一段时长的信息后的下一个时刻的负荷值;时间步长可根据任务设定;输入层神经元的个数ni可以根据需要设定;隐藏层神经元的个数nh可利用验证集进行优化;输出层神经元的个数no根据预测任务设定;
步骤S102、随机生成输入层到隐藏层的输入连接权重
Figure BDA0002887713820000071
相邻时刻隐藏层之间的循环连接权重
Figure BDA0002887713820000072
隐藏层到输出层的输出连接权重
Figure BDA0002887713820000073
隐藏层偏置向量
Figure BDA0002887713820000074
和输出层偏置向量
Figure BDA0002887713820000075
利用上述参数,可得到模块化循环神经网络的计算方程如公式(1)-(3)所示:
h′t=fh(Wihxt+(Whh*M)ht-1+bh) #(1);
ht=(1-ut)⊙ht-1+ut⊙h′t #(2);
yt=fo(Whoht+bo) #(3);
其中,fh(.)和fo(.)分别表示隐藏层和输出层的激活函数,⊙和*分别表示向量间和矩阵间的元素级乘法运算,
Figure BDA0002887713820000076
表示在时间步t隐藏层神经元的更新向量,
Figure BDA0002887713820000077
表示循环连接权重Whh的剪枝标记矩阵;
步骤S103、将隐藏层划分为k个模块,其中每个模块的神经元个数如公式(4)所示:
Figure BDA0002887713820000078
本实例中,步骤S101中,输入层神经元的个数ni若为1,可输入每天的最大或平均负荷值;输入层神经元的个数ni若为2,可输入当天的负荷值和温度;输入层神经元的个数ni若为24,可输入每天每小时的负荷值。
本实例中,步骤S2中,固定策略、随机策略、无序自适应策略和有序自适应策略的具体实现方法如下:
1)固定策略:
步骤S201、首先为每个隐藏层模块预分配一个工作周期,各个隐藏层模块的工作周期可用公式(5)得到:
Ti=ri-1(i=1,2,…,k) #(5);
式中,r是一个大于1的固定的整数;
步骤S202、根据当前时间步t是否能够整除每一个模块的周期Ti来获得每一个隐藏层模块的更新子向量
Figure BDA0002887713820000079
如公式(6)所示:
Figure BDA00028877138200000710
Figure BDA00028877138200000711
是一个全1向量时,意味着相应隐藏层模块内的所有神经元在时间步t参与更新,否则保持和上一个时刻的状态相同;
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA0002887713820000081
2)随机策略:
步骤S201、在每个时间步为每个隐藏层模块随机设置一个更新概率
Figure BDA0002887713820000082
步骤S202、设定一个更新阈值0<ε<1,则每一个隐藏层模块的更新子向量
Figure BDA0002887713820000083
的获得方式如公式(7)所示:
Figure BDA0002887713820000084
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA0002887713820000085
3)无序自适应策略:
步骤S201、对每个时间步的隐藏层候选状态ht′设计一个新的激活函数来得到每一个隐藏层模块的优先级
Figure BDA0002887713820000086
如公式(8)所示:
Figure BDA0002887713820000087
式中sumi(.)表示将隐藏层模块i中所有神经元对应的softmax(.)的值进行累加;
步骤S202、根据公式(9)可获得每一个隐藏层模块在时间步t的更新子向量
Figure BDA0002887713820000088
Figure BDA0002887713820000089
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure BDA00028877138200000810
4)有序自适应策略:
步骤S201、与3)中无序自适应策略的步骤S201相同;
步骤S202、根据公式(10)对每一个隐藏层模块的优先级
Figure BDA00028877138200000811
进行模块间的累加,从而可以得到每一个隐藏层模块的累加优先级
Figure BDA00028877138200000812
Figure BDA00028877138200000813
步骤S203、设定一个更新阈值0<ε<1,则该时刻的隐藏层更新向量
Figure BDA0002887713820000091
的获得方式如公式(11)所示:
Figure BDA0002887713820000092
如图2所示,本实例中,步骤S3中,单方向剪枝策略、双方向剪枝策略的具体实现方法如下:
1)单方向剪枝策略:
步骤S301、将剪枝标记矩阵
Figure BDA0002887713820000093
划分成k×k个子矩阵,每个子矩阵Mij∈Rm ×m,如公式(12)所示:
Figure BDA0002887713820000094
步骤S302、单方向剪枝策略规定前一个时刻的隐藏层神经元可连接到下一个时刻更新频率与之相等或者更快的神经元;考虑到固定策略和有序自适应策略均可保证模块号越小的隐藏层模块其更新频率更快,故可根据公式(13)得到每个子矩阵Mij∈Rm×m的取值:
Figure BDA0002887713820000095
步骤S303、每个时间步均利用上述得到的相同的标记矩阵M对循环连接Whh进行剪枝操作;
2)双方向剪枝策略:
步骤S301、与1)中单方向剪枝策略的步骤S301相同;
步骤S302、考虑到随机策略和无序自适应策略的隐藏层模块更新频率没有快慢之分,故必须通过概率确定其剪枝与否;首先保证每个时间步的
Figure BDA0002887713820000096
是一个全1矩阵;然后在每个时间步为每个隐藏层模块
Figure BDA0002887713820000097
随机设置一个剪枝概率
Figure BDA0002887713820000098
最后设置一个剪枝阈值0<θ<1,并通过公式(14)得到每个时间步剩余子矩阵
Figure BDA0002887713820000099
的取值:
Figure BDA00028877138200000910
步骤S303、每个时间步均利用上述得到的不同的标记矩阵轐对循环连接Whh进行剪枝操作。
本实例中,步骤S4中,模块化循环神经网络的电力负荷预测模型的训练过程具体如下:
步骤S401、将电力负荷数据集的数据进行Z-score标准化处理,并按照时间的先后顺序划分为训练集、测试集和验证集三个部分;
步骤S402、设置网络的相关配置参数,包括时间步长、各层神经元个数、隐藏层模块数、优化器、学习率、批处理大小、迭代次数、更新阈值、剪枝阈值;
步骤S403、将划分好的训练集的数据加入到循环神经网络中进行训练,在验证集上进行参数优化,最后利用测试集上得到的电力负荷预测值与实际的电力负荷值进行比较,来评估训练后的模块化循环神经网络的电力负荷预测模型的有效性。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (6)

1.一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,包括以下步骤:
步骤S1、构建一个包含输入层、隐藏层和输出层的循环神经网络,并把隐藏层划分为若干个模块;
步骤S2、选择固定策略、随机策略、无序自适应策略和有序自适应策略中的任意一种更新策略用于隐藏层模块的更新;
步骤S3、选择与步骤S2的更新策略相匹配的循环连接剪枝策略,其中固定策略和有序自适应策略可选择单方向剪枝策略,而随机策略和无序自适应策略可以选择双方向剪枝策略;
步骤S4、根据选择好的隐藏层模块更新策略和循环连接剪枝策略利用训练集进行模块化循环神经网络的电力负荷预测模型训练,利用验证集进行参数优化,最后利用测试集评估预测性能,得到最终的模块化循环神经网络的电力负荷预测模型。
2.根据权利要求1所述的一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,步骤S1中,循环神经网络的构建过程如下:
步骤S101、构建一个包含输入层、隐藏层和输出层的循环神经网络,其中输出层可在每个时间步都出现或仅出现在最后一个时间步,若输出层放置在最后一个时间步,则构建的循环神经网络用于预测在输入一段时长的信息后的下一个时刻的负荷值;时间步长可根据任务设定;输入层神经元的个数ni可以根据需要设定;隐藏层神经元的个数nh可利用验证集进行优化;输出层神经元的个数no根据预测任务设定;
步骤S102、随机生成输入层到隐藏层的输入连接权重
Figure FDA0002887713810000011
相邻时刻隐藏层之间的循环连接权重
Figure FDA0002887713810000012
隐藏层到输出层的输出连接权重
Figure FDA0002887713810000013
隐藏层偏置向量
Figure FDA0002887713810000014
和输出层偏置向量
Figure FDA0002887713810000015
利用上述参数,可得到模块化循环神经网络的计算方程如公式(1)-(3)所示:
h′t=fh(Wihxt+(Whh*M)ht-1+bh) #(1);
ht=(1-ut)⊙ht-1+ut⊙h′t #(2);
yt=fo(Whoht+bo) #(3);
其中,fh(.)和fo(.)分别表示隐藏层和输出层的激活函数,⊙和*分别表示向量间和矩阵间的元素级乘法运算,
Figure FDA0002887713810000016
表示在时间步t隐藏层神经元的更新向量,
Figure FDA0002887713810000017
表示循环连接权重Whh的剪枝标记矩阵;
步骤S103、将隐藏层划分为k个模块,其中每个模块的神经元个数如公式(4)所示:
Figure FDA0002887713810000018
3.根据权利要求2所述的一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,步骤S101中,输入层神经元的个数ni若为1,可输入每天的最大或平均负荷值;输入层神经元的个数ni若为2,可输入当天的负荷值和温度;输入层神经元的个数ni若为24,可输入每天每小时的负荷值。
4.根据权利要求1所述的一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,步骤S2中,固定策略、随机策略、无序自适应策略和有序自适应策略的具体实现方法如下:
1)固定策略:
步骤S201、首先为每个隐藏层模块预分配一个工作周期,各个隐藏层模块的工作周期可用公式(5)得到:
Ti=ri-1(i=1,2,…,k) #(5);
式中,r是一个大于1的固定的整数;
步骤S202、根据当前时间步t是否能够整除每一个模块的周期Ti来获得每一个隐藏层模块的更新子向量
Figure FDA0002887713810000021
如公式(6)所示:
Figure FDA0002887713810000022
Figure FDA0002887713810000023
是一个全1向量时,意味着相应隐藏层模块内的所有神经元在时间步t参与更新,否则保持和上一个时刻的状态相同;
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure FDA0002887713810000024
2)随机策略:
步骤S201、在每个时间步为每个隐藏层模块随机设置一个更新概率
Figure FDA0002887713810000025
步骤S202、设定一个更新阈值0<ε<1,则每一个隐藏层模块的更新子向量
Figure FDA0002887713810000026
的获得方式如公式(7)所示:
Figure FDA0002887713810000027
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure FDA0002887713810000028
3)无序自适应策略:
步骤S201、对每个时间步的隐藏层候选状态ht′设计一个新的激活函数来得到每一个隐藏层模块的优先级
Figure FDA0002887713810000031
如公式(8)所示:
Figure FDA0002887713810000032
式中sumi(.)表示将隐藏层模块i中所有神经元对应的softmax(.)的值进行累加;
步骤S202、根据公式(9)可获得每一个隐藏层模块在时间步t的更新子向量
Figure FDA0002887713810000033
Figure FDA0002887713810000034
步骤S203、将所有隐藏层模块的更新向量按模块号从小到大的顺序上下拼接,即可得到该时刻的隐藏层更新向量
Figure FDA0002887713810000035
4)有序自适应策略:
步骤S201、与3)中无序自适应策略的步骤S201相同;
步骤S202、根据公式(10)对每一个隐藏层模块的优先级
Figure FDA00028877138100000312
进行模块间的累加,从而可以得到每一个隐藏层模块的累加优先级
Figure FDA0002887713810000036
Figure FDA0002887713810000037
步骤S203、设定一个更新阈值0<ε<1,则该时刻的隐藏层更新向量
Figure FDA0002887713810000038
的获得方式如公式(11)所示:
Figure FDA0002887713810000039
5.根据权利要求1所述的一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,步骤S3中,单方向剪枝策略、双方向剪枝策略的具体实现方法如下:
1)单方向剪枝策略:
步骤S301、将剪枝标记矩阵
Figure FDA00028877138100000310
划分成k×k个子矩阵,每个子矩阵Mij∈Rm×m,如公式(12)所示:
Figure FDA00028877138100000311
步骤S302、单方向剪枝策略规定前一个时刻的隐藏层神经元可连接到下一个时刻更新频率与之相等或者更快的神经元;考虑到固定策略和有序自适应策略均可保证模块号越小的隐藏层模块其更新频率更快,故可根据公式(13)得到每个子矩阵Mij∈Rm×m的取值:
Figure FDA0002887713810000041
步骤S303、每个时间步均利用上述得到的相同的标记矩阵M对循环连接Whh进行剪枝操作;
2)双方向剪枝策略:
步骤S301、与1)中单方向剪枝策略的步骤S301相同;
步骤S302、考虑到随机策略和无序自适应策略的隐藏层模块更新频率没有快慢之分,故必须通过概率确定其剪枝与否;首先保证每个时间步的
Figure FDA0002887713810000042
是一个全1矩阵;然后在每个时间步为每个隐藏层模块
Figure FDA0002887713810000043
随机设置一个剪枝概率
Figure FDA0002887713810000044
最后设置一个剪枝阈值0<θ<1,并通过公式(14)得到每个时间步剩余子矩阵
Figure FDA0002887713810000045
的取值:
Figure FDA0002887713810000046
步骤S303、每个时间步均利用上述得到的不同的标记矩阵M对循环连接Whh进行剪枝操作。
6.根据权利要求1所述的一种基于模块化循环神经网络的电力负荷预测方法,其特征在于,步骤S4中,模块化循环神经网络的电力负荷预测模型的训练过程具体如下:
步骤S401、将电力负荷数据集的数据进行Z-score标准化处理,并按照时间的先后顺序划分为训练集、测试集和验证集三个部分;
步骤S402、设置网络的相关配置参数,包括时间步长、各层神经元个数、隐藏层模块数、优化器、学习率、批处理大小、迭代次数、更新阈值、剪枝阈值;
步骤S403、将划分好的训练集的数据加入到循环神经网络中进行训练,在验证集上进行参数优化,最后利用测试集上得到的电力负荷预测值与实际的电力负荷值进行比较,来评估训练后的模块化循环神经网络的电力负荷预测模型的有效性。
CN202110020657.4A 2021-01-07 2021-01-07 一种基于模块化循环神经网络的电力负荷预测方法 Active CN112700057B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110020657.4A CN112700057B (zh) 2021-01-07 2021-01-07 一种基于模块化循环神经网络的电力负荷预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110020657.4A CN112700057B (zh) 2021-01-07 2021-01-07 一种基于模块化循环神经网络的电力负荷预测方法

Publications (2)

Publication Number Publication Date
CN112700057A true CN112700057A (zh) 2021-04-23
CN112700057B CN112700057B (zh) 2022-07-08

Family

ID=75513254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110020657.4A Active CN112700057B (zh) 2021-01-07 2021-01-07 一种基于模块化循环神经网络的电力负荷预测方法

Country Status (1)

Country Link
CN (1) CN112700057B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872322A (zh) * 2021-09-06 2021-12-31 广西电网有限责任公司电力科学研究院 一种基于深度学习的微电网云边协同控制方法
CN114118530A (zh) * 2021-11-04 2022-03-01 杭州经纬信息技术股份有限公司 一种基于多户电力消耗预测模型的预测方法及装置
CN116359762A (zh) * 2023-04-27 2023-06-30 北京玖行智研交通科技有限公司 一种基于深度学习和网络压缩的电池荷电状态估计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007056686A (ja) * 2005-08-22 2007-03-08 Univ Of Ryukyus 風速予測に基づく風力発電機の数時間先発電電力予測装置
CN110084407A (zh) * 2019-04-03 2019-08-02 新奥数能科技有限公司 基于循环神经网络和元学习策略的负荷预测方法及装置
CN111598151A (zh) * 2020-05-12 2020-08-28 辽宁工程技术大学 用户用电负荷的预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007056686A (ja) * 2005-08-22 2007-03-08 Univ Of Ryukyus 風速予測に基づく風力発電機の数時間先発電電力予測装置
CN110084407A (zh) * 2019-04-03 2019-08-02 新奥数能科技有限公司 基于循环神经网络和元学习策略的负荷预测方法及装置
CN111598151A (zh) * 2020-05-12 2020-08-28 辽宁工程技术大学 用户用电负荷的预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姚程文等: "基于CNN-GRU混合神经网络的负荷预测方法", 《电网技术》 *
庄世杰等: "基于Zoneout的跨尺度循环神经网络及其在短期电力负荷预测中的应用", 《计算机科学》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113872322A (zh) * 2021-09-06 2021-12-31 广西电网有限责任公司电力科学研究院 一种基于深度学习的微电网云边协同控制方法
CN114118530A (zh) * 2021-11-04 2022-03-01 杭州经纬信息技术股份有限公司 一种基于多户电力消耗预测模型的预测方法及装置
CN116359762A (zh) * 2023-04-27 2023-06-30 北京玖行智研交通科技有限公司 一种基于深度学习和网络压缩的电池荷电状态估计方法
CN116359762B (zh) * 2023-04-27 2024-05-07 北京玖行智研交通科技有限公司 一种基于深度学习和网络压缩的电池荷电状态估计方法

Also Published As

Publication number Publication date
CN112700057B (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
CN112700057B (zh) 一种基于模块化循环神经网络的电力负荷预测方法
Hao et al. A novel two-stage forecasting model based on error factor and ensemble method for multi-step wind power forecasting
US20210278825A1 (en) Real-Time Production Scheduling with Deep Reinforcement Learning and Monte Carlo Tree Research
CN104335232B (zh) 连续时间尖峰神经网络基于事件的模拟
CN107622329A (zh) 基于多时间尺度长短时记忆神经网络的电力负荷预测方法
US9256823B2 (en) Apparatus and methods for efficient updates in spiking neuron network
Yu et al. Unit commitment using Lagrangian relaxation and particle swarm optimization
CN109492814A (zh) 一种城市交通流量预测方法、系统及电子设备
CN106960252A (zh) 基于长短时记忆神经网络的电力负荷预测方法
CN108170529A (zh) 一种基于长短期记忆网络的云数据中心负载预测方法
CN106952181A (zh) 基于长短时记忆神经网络的电力负荷预测系统
CN111027732B (zh) 一种多风电场出力场景的生成方法及系统
CN105723383A (zh) 因果凸显性时间推断
WO2020198520A1 (en) Process and system including an optimization engine with evolutionary surrogate-assisted prescriptions
CN108985514A (zh) 基于eemd和lstm的负荷预测方法、装置及设备
Chinnathambi et al. Deep neural networks (DNN) for day-ahead electricity price markets
Morteza et al. Deep learning hyperparameter optimization: Application to electricity and heat demand prediction for buildings
CN112070241A (zh) 基于机器学习模型的植物生长预测方法、装置和设备
JP2020204928A (ja) 最適化装置および最適化方法
CN112884236A (zh) 一种基于vdm分解与lstm改进的短期负荷预测方法及系统
Zhang et al. Prediction on the highest price of the stock based on PSO-LSTM neural network
Yang et al. Prediction of equipment performance index based on improved chaotic lion swarm optimization–LSTM
WO2022147583A2 (en) System and method for optimal placement of interacting objects on continuous (or discretized or mixed) domains
CN114154753A (zh) 一种负荷预测方法及系统
CN116822722A (zh) 水位预测方法、系统、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant