CN113868938A - 基于分位数回归的短期负荷概率密度预测方法、装置及系统 - Google Patents
基于分位数回归的短期负荷概率密度预测方法、装置及系统 Download PDFInfo
- Publication number
- CN113868938A CN113868938A CN202110973907.6A CN202110973907A CN113868938A CN 113868938 A CN113868938 A CN 113868938A CN 202110973907 A CN202110973907 A CN 202110973907A CN 113868938 A CN113868938 A CN 113868938A
- Authority
- CN
- China
- Prior art keywords
- lstm
- layer
- network
- probability density
- quantile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 238000012549 training Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000001413 cellular effect Effects 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 2
- 230000007774 longterm Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 42
- 210000004027 cell Anatomy 0.000 description 34
- 238000010586 diagram Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000012886 linear function Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000011217 control strategy Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种基于分位数回归的短期负荷概率密度预测方法、装置及系统,包括获取DL‑LSTM‑A深度网络模型,所述DL‑LSTM‑A深度网络模型包括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与所述注意力机制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权求和;所述双层LSTM网络元胞包括顺次相连的两个LSTM元胞;利用训练数据训练获得DL‑LSTM‑A网络中待优化的各个参数,获得优化后的DL‑LSTM‑A深度网络模型;将获取到的电力负荷消耗的影响因素输入至优化后的DL‑LSTM‑A深度网络模型,获得分位数;采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密度函数。本发明能够提供更为精确的长期电力负荷概率密度预测。
Description
技术领域
本发明属于智能电网电力负荷预测领域,具体涉及一种基于分位数回归的短期负荷概 率密度预测方法、装置及系统。
背景技术
相比于传统的电力负荷点预测过程,负荷的概率密度预测能给出分位数、预测区间或 概率密度函数等特征来描述电力负荷中的不确定性,受到学界和业界的持续关注。另外从 时间跨度上看,预测的范围可以从分钟、小时到天月年等。电网中不同的需求所对应的预 测时间跨度也不一样。由于短期电力负荷预测能够提供精确地电力负荷预测因而受到了广 泛的关注。
对于电力负荷短期概率密度预测,一般分为两步,第一步采用分位数回归分析获得电 力负荷的分位数,第二步采用核密度估计获得概率密度函数。线性分位数回归利用线性函 数描述电力负荷与参数间的关系,是较为基础的方法。由于电力负荷通常呈现非线性的特 征,线性函数所预测的结果并不是很优越。现阶段非线性的预测方法,如基于SVM模型、 基于CNN-GRU模型的方法等不能有效描述复杂时序数据的高阶特征,预测精度有待提高。 因此,提高电力负荷预测精度是亟需解决的问题。
发明内容
针对上述问题,本发明提出一种基于分位数回归的短期负荷概率密度预测方法、装置 及系统,能够提供更为精确的长期电力负荷概率密度预测。
为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
第一方面,本发明提供了一种基于分位数回归的短期负荷概率密度预测方法,包括:
获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与所述注意力机 制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权求和;所述双 层LSTM网络元胞包括顺次相连的两个LSTM元胞;
利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的 DL-LSTM-A深度网络模型;
将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深度网络模型,获 得分位数;
采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密度函数,完成基 于分位数回归的短期负荷概率密度预测。
可选地,所述分位数的获取方法包括:
定义电力负荷预测值Y的计算公式为:
Y=f(h,d,ty,s,te,n,l,Yo)
其中,h∈{1,2,…,24}为一天中的小时数,d∈{1,2,…,365}指一年中的某一天;ty是天 的类型,ty=1指工作日,ty=0指休息日;s指季节,用{1,2,3,4}分别代表春夏秋冬四个季 节,te指当前时刻的温度,用摄氏度来描述;n指当前终端所服务的用户数,Yo是历史负 荷值,f(·)为非线性的复杂函数,用来描述电力负荷与各个影响因素之间关系的函数;
定义电力负荷预测值Y的分布函数为:
F(y)=P(Y≤y)
则满足F(y)≥τ的最小y的值为变量y的第τ分位数,第τ分位数的表示形式为:
Q(τ)=inf(y|F(y)≥τ)。
可选地,所述注意力机制模块的输出表达式为:
其中,n+1指所提注意力机制中元胞序列的长度,βk指在第t-(k-1)个元胞的注意力 值,ht-(k-1)指第t-(k-1)个元胞的输出值,Ht指注意力机制的输出,利用范数进行归一化,注意力值βk可用如下公式计算:
其中,||·||2指向量二范数,sk用来描述元胞的重要性,再将Ht输入全连接层得到的输 出值即为DL-LSTM-A网络模型的输出,也就是电力负荷的预测值。
可选地,假设经过DL-LSTM-A网络后,电力负荷预测值Y与网络参数W,V,b和 输入X=[h,d,ty,s,te,n,l,Yo]之间的关系变为Y=fDL-LSTM-A(X,W,V,b),则所述利用训练数 据训练获得DL-LSTM-A网络中待优化的各个参数包括W,V,b,具体为:
设计优化目标函数为:
其中||·||F指矩阵Frobenius范数,||·||2指2范数,λ1、λ2、λ3为三个正则化变量,函数floss为:
其中,τ为在分位数,N为样本数量,Yi指输出电量样本,Xi和X′i都指分位数τ条件下的样本,i|Yi≥fDL-LSTM-A(Xi′,W,V,b)表示第i个响应变量大于等于回归估计值, i|Yi<fDL-LSTM-A(Xi′,W,V,b)表示第i个响应变量小于回归估计值,分位数τ∈(0,1),函数 ρτ(u)=u(τ-I(u)),I(u)称为示性函数,u是自变量,
基于所述优化目标函数,结合adam优化算法进行参数优化,获得DL-LSTM-A网络中待优化的各个参数。
可选地,所述概率密度函数为:
可选地,各LSTM元胞包括4个门,第一个称为遗忘门,第一个门的输出ft和输入ht-1、 Xt以及第一层门参数Wf,bf之间的关系为:
ft=sigmoid(Wf[ht-1,Xt]+bf)
sigmoid(·)为sigmoid函数;第二层和第三层分别称为输入层和tanh层,Tanh层引入 一个新的候选值,第二层it和第二层输入ht-1,Xt、第二层参数Wi、bi间的关系,以及第三 层输出与第三层输入ht-1、Xt和第三层网络参数WC、bC之间的关系分别用下式描述:
it=sigmoid(Wi[ht-1,Xt]+bi)
Ot=sigmoid(WO[ht-1,Xt]+bO)t
ht=Ottanh(Ct)。
其中WO、bO为第四层的参数,Ot中间变量,ht-1、Xt为输入参数。
第二方面,本发明提供了一种基于分位数回归的短期负荷概率密度预测装置,包括:
获取模块,用于获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包 括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与 所述注意力机制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权 求和;所述双层LSTM网络元胞包括顺次相连的两个LSTM元胞;
优化模块,用于利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的DL-LSTM-A深度网络模型;
执行模块,用于将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深 度网络模型,获得分位数;
预测模块,用于采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密 度函数,完成基于分位数回归的短期负荷概率密度预测。
第三方面,本发明提供了一种基于分位数回归的短期负荷概率密度预测系统,包括处 理器和存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据第一方面中任一项所述方法的步 骤。
与现有技术相比,本发明的有益效果:
本发明提出双层的LSTM元胞结构以更好地提取短期电力负荷预测的高阶特征,同时 引入注意力(attention)机制解决长序列问题中各部分的重点问题,得出不同分位点下电 力负荷预测结果。最后利用高斯核函数非参数估计方法,得到电力负荷概率密度预测。通 过本发明能够提供更为精确的长期电力负荷概率密度预测。
附图说明
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发 明作进一步详细的说明,其中:
图1为本发明一种实施例的DL-LSTM-A元胞结构示意图;
图2为本发明一种实施例的每一层LSTM结构示意图;
图3为本发明一种实施例的DL-LSTM-A网络模型示意图;
图4为本发明一种实施例的DL-LSTM-A分位数回归流程图;
图5为本发明一种实施例的DL-LSTM-A模型概率密度函数预测性能示意图;
图6不同模型下的中位数预测性能示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进 行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于 限定本发明的保护范围。
下面结合附图对本发明的应用原理作详细的描述。
实施例1
本发明实施例中提供了一种基于分位数回归的短期负荷概率密度预测方法,包括:
获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与所述注意力机 制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权求和;所述双 层LSTM网络元胞包括顺次相连的两个LSTM元胞,具体参见图3;
利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的 DL-LSTM-A深度网络模型;
将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深度网络模型,获 得分位数;
采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密度函数,完成基 于分位数回归的短期负荷概率密度预测。
下面结合一具体实施方式对本发明实施例中的方法进行详细说明。
首先对影响电力负荷消耗的影响因素进行分析。通过对特征的分析,提取电力负荷消 耗的因素主要受表I所示的因素影响。将电力负荷预测值Y建模为如下公式:
Y=f(h,d,ty,s,te,n,l,Yo) (1)
其中,h∈{1,2,…,24}为一天中的小时数,d∈{1,2,…,365}指一年中的某一天;ty是天 的类型,ty=1指工作日,ty=0指休息日;s指季节,用{1,2,3,4}分别代表春夏秋冬四个季 节,te指当前时刻的温度,用摄氏度来描述;n指当前终端所服务的用户数,Yo是历史负 荷值。f(·)为非线性的复杂函数,用来描述电力负荷与各个因素之间关系的函数。
表1电力负荷的特征因素
定义电力负荷预测值Y的分布函数为:
F(y)=P(Y≤y) (2)
那么满足F(y)≥τ的最小y的值为变量y的第τ分位数,可写成如下形式
Q(τ)=inf(y|F(y)≥τ) (3)
在实际电网中,电力负荷与其影响因素是非线性的关系,且与以往的电力负荷存在关 联,因而存在记忆特性。以LSTM网络为基础,提出一种双层LSTM网络(double layerLSTM network with attention,DL-LSTM-A)的深度网络结构,并将其引入到分位数回归分析中。 附图1描述了所提的DL-LSTM-A模型中的元胞结构,在每一个元胞中,将两个LSTM单元进行连接,并将前一个LSTM层的输出作为后一个LSTM层的输入,该双层的结构能够 更好地提取出长序列的信息,从而提升模型的性能。另外,引进注意力机制,如图1所示, 每一个元胞有一个注意力模块,该模块将输入当前的输入和当前时刻的输出通过tanh层, 并经过归一化获得该时刻的注意力值,该注意力机制用于分析每一个元胞的重要程度,从 而进一步提升模型的有效性。
对于DL-LSTM-attention网络元胞中每一个LSTM层由传统的LSTM元胞构成,其主要结构如图2所示。每一层LSTM中有4个门,每一个门的输入输出关系可由下面的式 子表示。第一个称为遗忘门,第一个门的输出ft和输入ht-1、Xt以及参数Wf、bf之间的 关系可通过如下的关系式进行计算:
ft=σ(Wf[ht-1,Xt]+bf) (4)
第二层和第三层分别称为输入层和tanh层,输入层的sigmoid函数决定要更新哪些信 息。Tanh层引入一个新的候选值,第二层输出和第三层输出与输入和网络参数之间的关系 分别用下式描述:
it=σ(Wi[ht-1,Xt]+bi) (5)
此时将旧状态更新为新状态,此时LSTM元胞的输出ht由下式得到
Ot=σ(WO[ht-1,Xt]+bO)t (8)
ht=Ottanh(Ct) (9)
虽然上述LSTM网络具有记忆特性,但是其无法检测到哪个是影响电力负荷的序列的 重要部分。为解决此问题,在LSTM网络中设计了一种注意力机制,以在不同时间自动利用电力负荷序列中各个部分的重要性。附图3描述了所设计的注意力机制。在DL-LSTM-A 网络的注意力机制中,网络的输出是每一个DL-LSTM-A网络元胞的加权和,其表达式如 下式所示,
其中n+1指所提注意力机制中元胞序列的长度,βk指在第t-(k-1)个元胞的注意力值。利用范数进行归一化,注意力值βk可用如下公式计算
其中,||·||2指向量二范数。每一个元胞的sk用来描述元胞的重要性。在图1中,为了更好地 提取负荷序列的特征,本发明将注意力值由输入相关联,因而对于每一个时刻的st设计为
其中,和Wa是需要学习的参数,由式(11)和(12)可以看出,t时刻的注意力值取决于输入Xt和当前时间t及其前n个时间步的元胞输出变量ht。注意力值也可以看作是流 量选择门的激活函数。得到Ht以后经过一个全连接层后得到最后的输出。上述各公式描述 了DL-LSTM-A网络中各模块的输出与输入以及参数之间的关系,根据各模块的关系将整 个网络的输出(即电力负荷预测值)和输入(特征因素)以及网络参数的关系描述为:
y=fDL-LSTM-A(X,W,V,b) (13)
得到上述模型以后,参数还是未知的,需要根据现有的数据对参数进行训练,即训练 参数(X,W,V,b)以使输出尽可能的精确。利用深度网络经典的Adam算法进行参数的优化。 在训练过程中为了防止模型过拟合,设计代价函数时考虑正则化,训练各参数W,V,b的优 化目标函数为:
其中||·||F指矩阵Frobenius范数,更精确地,函数floss为:
其中,τ为在分位数,N为样本数量,Yi指输出电量样本,Xi和X′i都指分位数τ条件下的样本,i|Yi≥fDL-LSTM-A(Xi′,W,V,b)表示第i个响应变量大于等于回归估计值, i|Yi<fDL-LSTM-A(Xi′,W,V,b)表示第i个响应变量小于回归估计值,分位数τ∈(0,1),函数 ρτ(u)=u(τ-I(u)),I(u)称为示性函数,u是自变量,表示为:
对于式(18)的优化问题,可以用传统的优化方法进行求解,本发明通过传统的adam 算法进行求解,可以获得参数W,V,b。求得参数以后,便可以获得电力负荷的分位数模型。 由上可知,经过DL-LSTM-A模型后可获得电力负荷分位数。此时采用非参数密度估计方法对电力负荷的分位数进行处理,可以获取最后的负荷的概率密度函数。由于高斯核函数非参数密度估计方法具有好的数学特征和广适性,本发明采用高斯核函数非参数密度估计方法获取用电负荷的概率密度函数。具体过程如下,定义概率密度函数可由高斯函数表示为
其中K(·)为高斯核函数,其表示为:
其中,σ为平滑参数,又称为带宽。那么找到各个平滑参数即可获得概率密度函数。得到平滑参数对负荷的密度函数的形状影响较大,当平滑参数带宽过小时,计算系统参数的点减少,导致高斯核函数偏差降低,方差增大,估计结果不稳定。而当带宽过大使得用 于计算的点增多,方差降低,偏差可能增大,但方法本质上要求带宽趋近于0,因此,带 宽的选择需要考虑到偏差-方差均。参数的选择对于负荷概率密度函数影响较大,并采用 交叉验证准则来获取参数。
主要思想及逻辑思路如图4所示。
利用安徽某一个县的电力数据作为样本,里面存在多个所的电力负荷数据,并分析各个 所的电力负荷数据。利用Tensorflow框架执行所提的DL-LSTM-A模型。采用Inteli7-8700 处理器和Nvidia GeForce RTX 2080Ti图形处理器。在训练模型时,批量大小为128,时间 序列长度为48,即把提前48个小时的数据作为一次训练数据。为了更快地获得训练结果, 首先对数据进行归一化,将Xt归一化为
将所提的DL-LSTM-A和常见的概率负荷预测算法如支持向量机分位数回归和CNN-GRU分位数回归这两种模型进行对比,所有方法中选取的分位点从0.01到0.99,为 间隔0.01的99个分位点。为了更好地验证所提方案的有效性,采用平均绝对百分比误差(mean absolute percentage error,MAPE)和最大相对百分比误差(maximal relativepercentage error,MRPE)为指标进行比较,其分别计算为
安徽2021年2月和3月两个月的历史负荷数据为基础。采用的数据集经过数据预处理操作如有效性检测、缺失值插补,归一化等以保证数据质量。在该数据集中,记录了每 一天每一个小时的电力负荷数据。在2月和3月两个月中,天气通常较冷。以2月1日到 3月20日的历史负荷数据为训练数据,对3月21日和3月22日的两天48小时的电力负 荷做出预测。运用DS-LSTM-A模型预测得到了3月21日和3月22日48个小时的的预 测结果,如附图5所示,附图5给出了四个时间点的模型所预测的概率密度函数、中位数 值以及实际电力负荷值,这四个时间点分别为5、10、15、20小时。从这四个图中可以看 出,实际的电力负荷值始终处于所提出的DL-LSTM-A模型的概率密度函数上面,在第5、 10、20小时时,电力负荷的实际值与DL-LSTM-A模型预测的概率密度函数最大所对应的 的值较接近。在第15个小时的时候,概率密度函数最大对应的负荷值与实际值存在一定 偏差,但仍处在概率密度线以上。另外,比较四个图中模型预测的中位数值和实际值可以 发现,中位数与实际值相近。因此可知,上述分析可得,L-LSTM-A模型所得到的预测值 与预测误差能够为电网工作人员提供较好地短期电力负荷预测方法,从而为做出电网控制 策略等提供可靠的信息。
附图6比较了DL-LSTM-A、SVM以及CNN-GRU模型预测的中位数。图6显示,与 SVR以及CNN-GRU模型相比,DL-LSTM-A模型所预测出的中位数更加接近于实际电荷 值,CNN-GRU比SVM模型具备更优的性能。由于DL-LSTM-A模型利用双层的LSTM结 构更好地利用了电荷序列间的高阶特征。同时,引入了注意力机制判别了序列各个部分的 重要性,从而能够提供比其他模型更加精确的预测结果,验证了DL-LSTM-A模型的有效 性。
为了更好地描述所提模型的有效性,表II描述了DL-LSTM-A、SVM以及CNN-GRU 模型所预测的电力负荷的误差统计,包括MAPE和MRPE。由表2可知,DL-LSTM-A模 型中的平均绝对误差为3.07%,其最大相对误差为4.58%,而CNN-GRU模型的平均绝对 误差为4.66%,其最大相对误差为6.83%;SVM模型的平均相对误差和最大相对误差最大, 分别为6.09%和9.46%。可以看出,DL-LSTM-A具有最小的相对误差,能够提供较高的预 测精度,较其他模型具有更优越的预测性能。
表2不同模型预测误差统计
模型 | MAPE | MRPE |
DL-LSTM-A | 3.07% | 4.58% |
SVM | 6.09% | 9.46% |
CNN-GRU | 4.66% | 6.83% |
实施例2
基于与实施例1相同的发明构思,本发明实施例中提供了一种基于分位数回归的短期 负荷概率密度预测装置,包括:
获取模块,用于获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包 括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与 所述注意力机制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权 求和;所述双层LSTM网络元胞包括顺次相连的两个LSTM元胞;
优化模块,用于利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的DL-LSTM-A深度网络模型;
执行模块,用于将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深 度网络模型,获得分位数;
预测模块,用于采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密 度函数,完成基于分位数回归的短期负荷概率密度预测。
实施例3
本发明实施例中提供了一种基于分位数回归的短期负荷概率密度预测系统,包括处理 器和存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据实施例1中任一项所述方法的步 骤。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员 应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明 的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化 和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等 效物界定。
Claims (8)
1.一种基于分位数回归的短期负荷概率密度预测方法,其特征在于,包括:
获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与所述注意力机制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权求和;
所述双层LSTM网络元胞包括顺次相连的两个LSTM元胞;
利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的DL-LSTM-A深度网络模型;
将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深度网络模型,获得分位数;
采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密度函数,完成基于分位数回归的短期负荷概率密度预测。
2.根据权利要求1所述的一种基于分位数回归的短期负荷概率密度预测方法,其特征在于,所述分位数的获取方法包括:
定义电力负荷预测值Y的计算公式为:
Y=f(h,d,ty,s,te,n,l,Yo)
其中,h∈{1,2,…,24}为一天中的小时数,d∈{1,2,…,365}指一年中的某一天;ty是天的类型,ty=1指工作日,ty=0指休息日;s指季节,用{1,2,3,4}分别代表春夏秋冬四个季节,te指当前时刻的温度,用摄氏度来描述;n指当前终端所服务的用户数,Yo是历史负荷值,f(·)为非线性的复杂函数,用来描述电力负荷与各个影响因素之间关系的函数;
定义电力负荷预测值Y的分布函数为:
F(y)=P(Y≤y)
则满足F(y)≥τ的最小y的值为变量y的第τ分位数,第τ分位数的表示形式为:
Q(τ)=inf(y|F(y)≥τ)。
4.根据权利要求1所述的一种基于分位数回归的短期负荷概率密度预测方法,其特征在于,假设经过DL-LSTM-A网络后,电力负荷预测值Y与网络参数W,V,b和输入X=[h,d,ty,s,te,n,l,Yo]之间的关系变为Y=fDL-LSTM-A(X,W,V,b),则所述利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数包括W,V,b,具体为:
设计优化目标函数为:
其中||·||F指矩阵Frobenius范数,||·||2指2范数,λ1、λ2、λ3为三个正则化变量,函数floss为:
其中,τ为在分位数,N为样本数量,Yi指输出电量样本,Xi和X′i都指分位数τ条件下的样本,i|Yi≥fDL-LSTM-A(X′i,W,V,b)表示第i个响应变量大于等于回归估计值,i|Yi<fDL-LSTM-A(X′i,W,V,b)表示第i个响应变量小于回归估计值,分位数τ∈(0,1),函数ρτ(u)=u(τ-I(u)),I(u)称为示性函数,u是自变量,
基于所述优化目标函数,结合adam优化算法进行参数优化,获得DL-LSTM-A网络中待优化的各个参数。
6.根据权利要求1所述的一种基于分位数回归的短期负荷概率密度预测方法,其特征在于:各LSTM元胞包括4个门,第一个称为遗忘门,第一个门的输出ft和输入ht-1、Xt以及第一层门参数Wf,bf之间的关系为:
ft=sigmoid(Wf[ht-1,Xt]+bf)
sigmoid(·)为sigmoid函数;第二层和第三层分别称为输入层和tanh层,Tanh层引入一个新的候选值,第二层it和第二层输入ht-1,Xt、第二层参数Wi、bi间的关系,以及第三层输出与第三层输入ht-1、Xt和第三层网络参数WC、bC之间的关系分别用下式描述:
it=sigmoid(Wi[ht-1,Xt]+bi)
Ot=sigmoid(WO[ht-1,Xt]+bO)t
ht=Ottanh(Ct)。
其中WO、bO为第四层的参数,Ot中间变量,ht-1、Xt为输入参数。
7.一种基于分位数回归的短期负荷概率密度预测装置,其特征在于,包括:
获取模块,用于获取DL-LSTM-A深度网络模型,所述DL-LSTM-A深度网络模型包括若干个双层LSTM网络元胞和注意力机制模块,各双层LSTM网络元胞的输出端分别与所述注意力机制模块相连;所述注意力机制模块将各双层LSTM网络元胞的输出进行加权求和;所述双层LSTM网络元胞包括顺次相连的两个LSTM元胞;
优化模块,用于利用训练数据训练获得DL-LSTM-A网络中待优化的各个参数,获得优化后的DL-LSTM-A深度网络模型;
执行模块,用于将获取到的电力负荷消耗的影响因素输入至优化后的DL-LSTM-A深度网络模型,获得分位数;
预测模块,用于采用非参数密度估计方法对分位数进行处理,获得最终的负荷概率密度函数,完成基于分位数回归的短期负荷概率密度预测。
8.一种基于分位数回归的短期负荷概率密度预测系统,其特征在于,包括处理器和存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110973907.6A CN113868938A (zh) | 2021-08-24 | 2021-08-24 | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110973907.6A CN113868938A (zh) | 2021-08-24 | 2021-08-24 | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113868938A true CN113868938A (zh) | 2021-12-31 |
Family
ID=78988102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110973907.6A Pending CN113868938A (zh) | 2021-08-24 | 2021-08-24 | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113868938A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114978931A (zh) * | 2022-07-29 | 2022-08-30 | 国电南瑞科技股份有限公司 | 基于流形学习的网络流量预测方法、装置及存储介质 |
CN115907233A (zh) * | 2023-01-06 | 2023-04-04 | 北京科技大学 | 基于机器心智模型和自注意力的风力发电分位数预测方法 |
CN116308441A (zh) * | 2023-03-07 | 2023-06-23 | 太原科技大学 | 一种具有变量选择能力的房屋价格预测方法 |
-
2021
- 2021-08-24 CN CN202110973907.6A patent/CN113868938A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114978931A (zh) * | 2022-07-29 | 2022-08-30 | 国电南瑞科技股份有限公司 | 基于流形学习的网络流量预测方法、装置及存储介质 |
CN115907233A (zh) * | 2023-01-06 | 2023-04-04 | 北京科技大学 | 基于机器心智模型和自注意力的风力发电分位数预测方法 |
CN116308441A (zh) * | 2023-03-07 | 2023-06-23 | 太原科技大学 | 一种具有变量选择能力的房屋价格预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Wind speed forecasting based on quantile regression minimal gated memory network and kernel density estimation | |
CN109902801B (zh) | 一种基于变分推理贝叶斯神经网络的洪水集合预报方法 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN113868938A (zh) | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN111178611B (zh) | 一种日电量预测的方法 | |
CN110781947B (zh) | 用电负荷预测模型训练、用电负荷预测方法及装置 | |
CN111008726B (zh) | 一种电力负荷预测中类图片转换方法 | |
CN112434848A (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN113657668A (zh) | 基于lstm网络的电力负荷预测方法及系统 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN113344288A (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN112381673A (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
CN111815026A (zh) | 一种基于特征聚类的多能源系统负荷预测方法 | |
CN114015825A (zh) | 基于注意力机制的高炉热负荷异常状态监测方法 | |
CN110533249B (zh) | 一种基于集成长短期记忆网络的冶金企业能耗预测方法 | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
CN114118401A (zh) | 基于神经网络的配电网络流量预测方法、系统、装置及存储介质 | |
Zhang et al. | Remaining useful life prediction of lithium-ion batteries based on TCN-DCN fusion model combined with IRRS filtering | |
CN116303786B (zh) | 一种基于多维数据融合算法的区块链金融大数据管理系统 | |
CN116826745A (zh) | 一种电力系统背景下的分层分区短期负荷预测方法及系统 | |
CN114978931B (zh) | 基于流形学习的网络流量预测方法、装置及存储介质 | |
CN111061708A (zh) | 一种基于lstm神经网络的电能量预测与修复方法 | |
CN115130662A (zh) | 一种基于迁移学习的配电网时变拓扑状态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |