CN112232561B - 基于约束并行lstm分位数回归的电力负荷概率预测方法 - Google Patents
基于约束并行lstm分位数回归的电力负荷概率预测方法 Download PDFInfo
- Publication number
- CN112232561B CN112232561B CN202011092704.8A CN202011092704A CN112232561B CN 112232561 B CN112232561 B CN 112232561B CN 202011092704 A CN202011092704 A CN 202011092704A CN 112232561 B CN112232561 B CN 112232561B
- Authority
- CN
- China
- Prior art keywords
- model
- parameters
- lstm
- training
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 238000012795 verification Methods 0.000 claims abstract description 12
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000010606 normalization Methods 0.000 claims abstract description 5
- 238000011156 evaluation Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 230000007787 long-term memory Effects 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000036316 preload Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于约束并行LSTM分位数回归的电力负荷概率预测方法,包括收集多个样本日的负荷功率和影响因素数据,形成数据集;设置模型超参数;建立约束并行LSTM模型,对约束并行LSTM模型中各个分位点LSTM进行预训练,获得权重、偏置参数集;对约束并行LSTM模型进行整体训练,训练过程中对权重、偏置参数进行微调,确定约束并行LSTM模型的最佳权重、偏置参数;将验证集输入训练好的约束并行LSTM模型,根据验证误差选出模型的最佳超参数;将测试样本输入具有最佳超参数的约束并行LSTM模型,对约束并行LSTM模型输出的预测结果进行反归一化。本发明采用约束并行LSTM模型进行电力负荷的分位数回归预测,使得预测负荷概率分布更合理,避免分位数预测值之间的交叉。
Description
技术领域
本发明属于电力负荷预测领域,具体涉及一种基于约束并行LSTM分位数回归的电力负荷概率预测方法。
背景技术
短期电力负荷预测是电力系统安全、经济运行的基础,为电力系统规划和运行、能源交易、机组启停、经济调度等提供重要信息。提高负荷预测的准确率有助于提高电力设备的利用率,并最大程度地减少能源浪费。
目前,负荷概率预测方法主要包括区间估计、核密度估计和分位数回归等。前两种方法主要基于点预测误差的参数统计估计概率分布,而分位数回归可直接解释不同分位点下响应变量和因变量之间的关系,成为近年来负荷概率预测文献关注的热点。但是,分位数回归的分位数预测值存在交叉的现象而导致不合理。
负荷概率预测方法较多是结合机器学习算法和分位数回归法,构建分位数模型。然而传统的机器学习算法,往往需要利用特征工程对数据进行处理。与传统的机器学习方法相比,深度学习神经网络被证明在应对大数据集的短期负荷预测方面更加有效。尤其是长短期记忆(long short-term memory,LSTM)神经网络,如附图2所示,因为其对时间序列形式的数据具有强适应性而得到了广泛应用。
因此,研究一种基于约束并行LSTM神经网络分位数回归的短期电力负荷概率预测方法。
发明内容
本发明的技术问题是现有的电力负荷的分位数回归方法的分位数预测值存在交叉的现象而导致不合理。
本发明的目的是解决上述问题,提供一种基于约束并行LSTM分位数回归的电力负荷概率预测方法,将LSTM的鲁棒性和记忆特性与分位数回归的概率预测功能相结合,并考虑预测负荷概率分位数的固有特性,加入考虑分位数预测值之间约束关系的组合层,构建约束并行长短期记忆网络模型((constrained parallel Long-Short Term Memory,CP-LSTM)进行电力负荷的分位数回归预测,使得预测负荷概率分布更合理,避免分位数预测值之间的交叉。
本发明的技术方案是基于约束并行LSTM分位数回归的电力负荷概率预测方法,包括以下步骤,
步骤1:收集多个样本日的负荷功率和影响因素数据,形成数据集并分为训练集、验证集和测试集;
步骤2:设置模型超参数;
步骤3:建立约束并行LSTM模型,采用并行式训练方法,对约束并行LSTM模型中各个分位点下并行LSTM进行预训练,获得全局参数集{W(τi),b(τi)}opt;
步骤4:将得到全局参数集{W(τi),b(τi)}opt作为约束并行LSTM模型的初始参数,对约束并行LSTM模型进行整体训练,训练过程中对权重、偏置参数进行微调,确定约束并行LSTM模型的最佳权重、偏置参数;
步骤5:将验证集输入训练好的约束并行LSTM模型,根据验证误差选出模型的最佳超参数;步骤6:将测试样本输入具有最佳超参数的约束并行LSTM模型,对约束并行LSTM模型输出的预测结果进行反归一化,得到预测日中各时刻预测负荷的多个分位数预测值;
步骤7:根据步骤6得到的预测负荷的多个分位数,计算得到预测点的概率密度曲线。
优选地,步骤1还包括对数据集的各类数据进行归一化,将数据变量归一化到[-1,1]区间。
具体地,对样本日收集0时~24时相邻时间点间隔15分钟的96点负荷功率数据,选取预测前日的96点负荷功率与预测日的24时刻气温和分区降雨量组成多维特征输入变量向量,以预测日的96点负荷分位数作为输出变量向量,输入变量Xd=[Td,Rd],气温Td=[T1,T2,…,T24]d,其中Ti,i∈{1,2,…,24}表示i时测取的天气温度,降雨量Rd=[R1,R2,…,RM]d,其中Rj,j∈{1,2,…,M}表示预测地区的第j个子区域的降雨,d∈{1,2,…,D},D为历史样本总天数,M为预测地区所包含的子区域数。
步骤2中,所述模型超参数包括神经元的数量m、样本的时窗长度l、节点数n和惩罚项参数λ1、λ2。
步骤4中,所述对权重、偏置参数进行微调,根据损失函数,运用梯度下降算法对权重、偏置参数进行微调整。
优选地,所述计算得到预测点的概率密度曲线采用高斯核密度估计方法。
优选地,步骤1按照8:1:1的比例,将数据集划分为训练集、验证集和测试集。
优选地,步骤6的预测结果采用计及分位数约束关系的评价指标评价分位数的交叉情况,由分位数的固有属性可知,t时刻的分位数预测值应满足
计及分位数约束关系的指标如下:
其中XCS表示计及分位数约束关系的评价指标值;是t时刻分位点下的预测值,N为全部测试时刻数,vt,i为约束违反程度函数,θ=τi+1-τi为分位点之间的步长,是一个常数;当相邻分位数之间满足约束关系时,vt,i为0,而当违背约束关系时,vt,i为相邻分位数的正差值,反映约束违反的程度。系数项2θ/N为分位数约束误差平方的归一化系数,由此计算出的XCS为vt,i在整个测试集样本和全部相邻分位数上的归一化均方根。故可通过XCS来量化反映分位数的交叉情况。
当概率预测评价指标XQS和XCS同时较低时,表明预测得到的分位数具有更好的性能,本发明将两者结合,组成综合评价指标XQCS:
XQCS=XQS+XCS
相比现有技术,本发明的有益效果包括:
1)本发明采用CP-LSTM模型进行电力负荷的分位数回归预测,使得预测负荷概率分布更合理,避免分位数预测值之间的交叉;
2)采用并行式训练方法,对约束并行LSTM模型中各个分位点LSTM进行预训练,获得权重、偏置参数集作为CP-LSTM模型的初始参数,再进行整体训练,对权重、偏置参数进行微调,得到约束并行LSTM模型的最佳权重、偏置参数,使得模型预测效率更高,能获得准确的点预测结果;
3)本发明提出的计及分位数约束关系的评价指标,可用于评价分位数的交叉情况。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为实施例的电力负荷概率预测方法的流程示意图。
图2为LSTM结构示意图。
图3为实施例的CP-LSTM模型的结构示意图。
图4为实施例的并行式训练的示意图。
图5为实施例的Q-LSTM的训练过程示意图。
图6为实施例中不同预测模型得到的测试集样本日的评价指标Xcs的对比示意图。
具体实施方式
如图1所示,基于约束并行LSTM分位数回归的电力负荷概率预测方法,包括以下步骤,步骤1:收集某实际地区2016年1月1日至2017年6月30日每间隔15分钟的负荷数据、气温数据和降雨量,形成数据集并按8:1:1的比例分为训练集、验证集和测试集,输入变量Xd=[Td,Rd],包括预测日24时刻气温Td=[T1,T2,…,T24]d和M个分区的降雨量Rd=[R1,R2,…,RM]d;考虑到数据之间的数据差别比较大,需要将不同的数据归化到[-1,1]里,经过归一化处理后的输入样本为x'i;归一化处理前的样本数据为xi,其最大、最小样本值分别为 x,样本数为N,具体处理公式如下:
步骤2:设置模型超参数,包括神经元数量m、样本时窗长度l、计算节点数n、惩罚参数λ1、λ2;实施例中,m的取值为200,时窗长度l的取值为6,λ1的取值为1,λ2的取值为20,总样本日为547天;
步骤3:建立约束并行LSTM模型,如图3所示,约束并行LSTM模型包括输入层、隐藏层、输出层和回归层,隐藏层包括多个分位点长短期记忆网络模型(Quantile Long-ShortTerm Memory,Q-LSTM);采用并行式训练方法,对约束并行LSTM模型中各个分位点下并行LSTM进行预训练,将训练集分为均等的n个子集,利用对应的n个计算节点对网络进行并行训练;如图4所示,神经网络的数据并行式训练通过GPU分布式计算实现,将训练集均等分为多个子集,分配到计算系统的各个节点,每个计算节点负责处理该数据集的一个不同子集,从而减少神经网络训练总时间,每个节点训练其数据子集均会得到一套模型参数,将每个节点训练得到的参数集合,运用梯度下降公式计算新的全局权重集,进而分配给计算系统的每一个节点,其公式为:
其中为第/>次迭代训练得到的全局参数集,/>为第/>次迭代训练得到的第j个计算节点的参数梯度,n为计算节点的总个数,χ为缩放系数,类似于学习率。
如图5所示,每个节点单独训练Q-LSTM,训练过程如下:
(1)输入初始权重W0(τi)和初始偏置b0(τi);
(2)计算LSTM的输入门it、遗忘门ft、输出门ot、候选存储单元新的存储状态Ct、隐藏层状态ht的当前迭代值it,i、ft,i、ot,i、/>Ct,i、ht,i,计算过程如下:
给定当前输入xt,上一时刻隐含层状态ht-1和存储状态Ct-1,详细的计算过程如下:
it=σ(Wi[xt,ht-1]T+bi)
ft=σ(Wf[xt,ht-1]T+bf)
ot=σ(Wo[xt,ht-1]T+bo)
ht=ot⊙tanh(Ct)
其中,Wi、Wf、Wo、Wc分别代表相应的权重矩阵,bi、bf、bo、bc分别代表相应的偏置向量;σ(·)和tanh(·)分别为Sigmoid和正切S形曲线激活函数;输出层的最终输出由隐含层状态ht计算:
其中WS是隐含层与输出层的连接权重矩阵,bS表示相应的偏置向量。
(3)根据损失函数利用梯度下降法计算梯度和/>并据此计算各权重和偏置的梯度,损失函数如下:
其中W(τi)={Wf(τi),Wi(τi),Wc(τi),Wo(τi),WS(τi)}b(τi)={bf(τi),bi(τi),bc(τi),bo(τi),bS(τi)}分别为分位点τi下LSTM神经网络的全部权重参数矩阵集合和偏置向量集合;λ1为防止模型训练过拟合的正则项惩罚参数,ρτ(a)为检验函数,其定义为:
定义梯度函数和/>如下:
为损失函数/>对隐藏层状态ht的微分,/>为损失函数/>对存储状态Ct的微分。
隐含层至输出层参数的梯度为:
为隐藏层状态ht对隐含层与输出层的连接权重矩阵WS微分,/>为隐藏层状态ht对偏置向量bS微分。
根据分别计算遗忘门、输入门、候选存储单元和输出门参数的梯度;
(4)更新权重和偏置,公式如下:
其中η为学习率,W*和b*分别代表相应的权重矩阵和偏置向量。
重复步骤(2)~(4),直至达到收敛条件,获得模型最优参数{W(τi),b(τi)}opt。
步骤4:将得到的权重、偏置参数集{W(τi),b(τi)}opt作为约束并行LSTM模型的初始参数,对约束并行LSTM模型进行整体训练,对{W(τi),b(τi)}r进行微调,确定CP-LSTM短期负荷概率预测模型的最佳权重及偏置参数;为获得CP-LSTM模型的最佳参数,基于训练样本集,采用梯度下降法搜寻使损失函数最小的模型参数{W(τi),b(τi)}opt;CP-LSTM模型的训练方法与Q-LSTM训练方法一致,只是在损失函数和梯度有差别,CP-LSTM模型损失函数Floss如下:
其中λ2为违反约束条件的惩罚参数,对应的梯度/>和/>相应变为:
向量ui中各元素分别为:
(m=1,...,o)遗忘门、输入门、存储单元、候选存储单元和输出门参数的梯度计算与步骤3中计算方式相同。
步骤5:将验证集输入步骤4训练好的CP-LSTM模型,根据验证误差选择最优越的超参数;实施例的547天的样本数据的10%用于验证,根据最终输出结果与真实值的误差选择最佳超参数;
步骤6:将测试样本输入具有最佳超参数的CP-LSTM模型得到输出结果,再将输出结果转化为不同的量纲,即反归一化,最终对预测数据与真实结果进行对比分析;考虑到分位数预测结果应满足分位数约束条件,在常用概率预测评价指标Quantile score(QS)的基础上,本发明提出计及分位数约束关系的评价指标Constraint score(CS)。由分位数的固有属性可知,t时刻的分位数预测值应满足据此本发明提出考虑分位数约束关系的指标如式:
其中XCS表示计及分位数约束关系的评价指标值;是t时刻分位点下的预测值,N为测试时刻的总数,vt,i为约束违反程度函数,θ=τi+1-τi为分位点之间的步长,是一个常数;当相邻分位数之间满足约束关系时,vt,i为0,而当违背约束关系时,vt,i为相邻分位数的正差值,反映约束违反的程度。系数项2θ/N为分位数约束误差平方的归一化系数,由此计算出的XCS为vt,i在整个测试集样本和全部相邻分位数上的归一化均方根。故可通过XCS来量化反映分位数的交叉情况。
当XQS和XCS同时较低时,表明预测得到的分位数具有更好的性能,本发明将两者结合,组成综合评价指标XQCS:
XQCS=XQS+XCS
此外,预测区间(prediction interval,PI)的可靠性指标—PI覆盖概率偏差指数(PICP)和锐度指标—PI标准均方根宽度(PINRW)也是概率预测结果评价的要指标。
常用概率预测评价指标XQS:
其中是分位点τi下的pinball losses值,yt为t时刻电力负荷的实际值,/>是t时刻τi分位点下的预测值,N为测试时刻的总数。
可靠性指标XPICP:
其中εα表示在置信度1-α下实际值落入预测区间的数量。
PI的实际覆盖率PICP与其标称值(PI nominal confidence,PINC)的偏差覆盖概率偏差指数XDev:
XDev α=|XPICP α-XPINC α|
锐度指标XPINRW:
其中XPINRW α是在置信度1-α下的预测区间归一化均方根宽度,Ut α和Lt α分别是置信度1-α下第t个测试样本预测区间的上、下限,R是测试集中负荷最大值和最小值之差。
步骤7:根据步骤6得到的预测负荷的多个分位数,采用高斯核密度估计方法计算得到预测点的概率密度曲线,高斯核密度估计方法参照期刊《Energy》2018年刊登的文章“Short-term power load probability density forecasting based on Yeo-Johnsontransformation quantile regression and Gaussian kernel function”公开的高斯核密度估计方法。
实施例中,选取某实际地区2016年1月1日至2017年6月30日的15分钟级负荷数据集,通过本发明的方法,进行日前负荷概率预测。为验证CP-LSTM模型的预测性能,将它与线性分位数回归模型L-QR、带参数整流线性激活函数RCLU的分位数神经网络bQRNN、QRNN以及不加组合层的Q-LSTM进行对比。各模型概率预测结果的评价指标统计对比如表1和表2所示,表1列出了训练时长Ttrain、常用概率预测评价指标XQS、考虑分位数约束关系的指标XCS、综合评价指标XQCS及50%、90%置信度下的锐度指标XPINRW和违背相邻分位数约束关系样本占比f;表2列出了不同置信度下可靠性指标XPICP和偏差指数XDev的对比,其中XAD、XMD分别为各置信度下XDev的均值、最大值。
结合图6和表1可知,CP-LSTM的XCS指标在绝大多数样本日中明显低于其他几种方法,且CP-LSTM在整个测试集的综合XCS指标仅为Q-LSTM的27.28%,而且违背约束的样本在整个测试集样本中所占的比例f相较Q-LSTM降低了16.3%,但反映预测精度的XQS指标却并未有明显变化。可见CP-LSTM能在不降低预测精度的前提下,有效避免分位数交叉,改善预测分位数的合理性。
表1各模型评价指标对比表
表2各模型XPICP和XDev对比表
本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。
Claims (6)
1.基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,包括以下步骤,
步骤1:收集多个样本日的负荷功率和影响因素数据,形成数据集并分为训练集、验证集和测试集;
步骤2:设置模型超参数;
步骤3:建立约束并行LSTM模型,约束并行LSTM模型包括输入层、隐藏层、输出层和回归层,隐藏层包括多个分位点长短期记忆网络模型;采用并行式训练方法,对约束并行LSTM模型中各个分位点LSTM进行预训练,获得权重、偏置参数集;
分位点长短期记忆网络模型Q-LSTM包括输入门、遗忘门/>、输出门/>、候选存储单元/>;
选取预测前日的96点负荷功率与预测日的24时刻气温和分区降雨量组成多维特征输入变量向量,以预测日的96点负荷分位数作为输出变量向量;
并行式训练通过GPU分布式计算实现,将训练集均等分为多个子集,分配到计算系统的各个节点,每个计算节点负责处理该数据集的一个不同子集,从而减少神经网络训练总时间,将每个节点训练得到的参数集合,运用梯度下降公式计算新的全局权重集,进而分配给计算系统的每一个节点,其公式为:
其中Z φ={W, b}(φ)为第φ次迭代训练得到的全局参数集,△Z φ,j为第φ次迭代训练得到的第j个计算节点的参数梯度,n为计算节点的总个数,为缩放系数;
每个节点单独训练的分位点长短期记忆网络模型Q-LSTM,训练过程为:
(1)输入初始权重W 0(τi)和初始偏置b 0(τi);
(2)计算LSTM的输入门、遗忘门/>、输出门/>、候选存储单元/>、新的存储状态/>、隐藏层状态/>的当前迭代值/>、/>、/>、/> 、/>、/>,计算过程如下:
给定当前输入x t,上一时刻隐含层状态h t-1和存储状态C t-1,详细的计算过程为:
其中,W i、W f、W o、W c分别代表相应的权重矩阵,b i、b f、b o、b c分别代表相应的偏置向量;σ(·) 和tanh(·)分别为Sigmoid 和正切S形曲线激活函数;输出层的最终输出由隐含层状态h t计算:
其中W S是隐含层与输出层的连接权重矩阵,b S表示相应的偏置向量;
(3)根据损失函数利用梯度下降法计算梯度和/>,并据此计算各权重和偏置的梯度,损失函数为:
其中W(τ i)={W f(τ i),W i(τ i),W c(τ i),W o(τ i), W S(τ i)},b(τ i)={b f(τ i),b i(τ i),b c(τ i),b o(τ i),b S(τ i)}分别为分位点下LSTM神经网络的全部权重参数矩阵集合和偏置向量集合;λ 1为防止模型训练过拟合的正则项惩罚参数,/>为检验函数;
隐含层至输出层参数的梯度为:
为隐藏层状态/>对隐含层与输出层的连接权重矩阵W S微分,/>为隐藏层状态/>对偏置向量b S微分;
根据、/>分别计算遗忘门、输入门、候选存储单元和输出门参数的梯度;
(4)更新权重和偏置,公式为:
其中η为学习率,W *和b *分别代表相应的权重矩阵和偏置向量;
重复步骤(2)-步骤(4),直至达到收敛条件,获得模型最优参数{W(τ i ), b(τ i )}opt;
步骤4:将得到的权重、偏置参数集{W(τ i), b(τ i)}opt作为约束并行LSTM模型的初始参数,对约束并行LSTM模型进行整体训练,训练过程中对权重、偏置参数进行微调,确定约束并行LSTM模型的最佳权重、偏置参数;
为获得约束并行LSTM模型的最佳参数,基于训练样本集,采用梯度下降法搜寻使损失函数最小的模型参数{W(τ i), b(τ i)}opt;约束并行LSTM模型的训练方法与分位点长短期记忆网络模型Q-LSTM训练方法一致,只是在损失函数和梯度有差别,约束并行LSTM模型损失函数为:
其中
;
为违反约束条件的惩罚参数;
遗忘门、输入门、存储单元、候选存储单元和输出门参数的梯度计算与步骤3中计算方式相同;
步骤5:将验证集输入训练好的约束并行LSTM模型,根据验证误差选出模型的最佳超参数;
步骤6:将测试样本输入具有最佳超参数的约束并行LSTM模型,对约束并行LSTM模型输出的预测结果进行反归一化,得到预测日中各时刻预测负荷的多个分位数预测值;
步骤7:根据步骤6得到的预测负荷的多个分位数,计算得到预测点的概率密度曲线。
2.根据权利要求1所述的基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,步骤1还包括对数据集的各类数据进行归一化,将数据变量归一化到[-1,1]区间。
3.根据权利要求1所述的基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,步骤2中,所述模型超参数包括神经元的数量m、样本的时窗长度l、节点数n和惩罚项参数λ 1 、λ 2。
4.根据权利要求1所述的基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,所述计算得到预测点的概率密度曲线采用高斯核密度估计方法。
5.根据权利要求1所述的基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,步骤6的预测结果采用计及分位数约束关系的评价指标评价分位数的交叉情况,计及分位数约束关系的指标为:
其中表示计及分位数约束关系的评价指标值;/>是t时刻分位点/>下的预测值,N为测试时刻的总数,v t,i为约束违反程度函数,θ表示分站点之间的步长;当相邻分位数之间满足约束关系时,v t,i为0,而当违背约束关系时,v t,i为相邻分位数的正差值,反映约束违反的程度;系数项2θ/N为分位数约束误差平方的归一化系数。
6.根据权利要求1-5任意一项所述的基于约束并行LSTM分位数回归的电力负荷概率预测方法,其特征在于,步骤1按照8:1:1的比例,将数据集划分为训练集、验证集和测试集。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410049336.0A CN117977568A (zh) | 2020-10-13 | 2020-10-13 | 基于嵌套lstm和分位数计算的电力负荷预测方法 |
CN202011092704.8A CN112232561B (zh) | 2020-10-13 | 2020-10-13 | 基于约束并行lstm分位数回归的电力负荷概率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011092704.8A CN112232561B (zh) | 2020-10-13 | 2020-10-13 | 基于约束并行lstm分位数回归的电力负荷概率预测方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410049336.0A Division CN117977568A (zh) | 2020-10-13 | 2020-10-13 | 基于嵌套lstm和分位数计算的电力负荷预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112232561A CN112232561A (zh) | 2021-01-15 |
CN112232561B true CN112232561B (zh) | 2024-03-15 |
Family
ID=74113480
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410049336.0A Pending CN117977568A (zh) | 2020-10-13 | 2020-10-13 | 基于嵌套lstm和分位数计算的电力负荷预测方法 |
CN202011092704.8A Active CN112232561B (zh) | 2020-10-13 | 2020-10-13 | 基于约束并行lstm分位数回归的电力负荷概率预测方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410049336.0A Pending CN117977568A (zh) | 2020-10-13 | 2020-10-13 | 基于嵌套lstm和分位数计算的电力负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN117977568A (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784435B (zh) * | 2021-02-03 | 2023-05-23 | 浙江工业大学 | 一种基于性能事件计数和温度的gpu实时功率建模方法 |
CN113112092A (zh) * | 2021-05-07 | 2021-07-13 | 国网四川省电力公司经济技术研究院 | 一种短期概率密度负荷预测方法、装置、设备和存储介质 |
CN113239029A (zh) * | 2021-05-18 | 2021-08-10 | 国网江苏省电力有限公司镇江供电分公司 | 一种电能表缺失日冻结数据的补全方法 |
CN113449934B (zh) * | 2021-08-31 | 2021-11-30 | 国能日新科技股份有限公司 | 一种基于数据迁移的风力发电功率预测方法及装置 |
CN113807432B (zh) * | 2021-09-16 | 2024-04-30 | 成都卡普数据服务有限责任公司 | 一种基于深度学习的气温预报数据订正方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846517A (zh) * | 2018-06-12 | 2018-11-20 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN109214605A (zh) * | 2018-11-12 | 2019-01-15 | 国网山东省电力公司电力科学研究院 | 电力系统短期负荷概率预测方法、装置及系统 |
CN109558975A (zh) * | 2018-11-21 | 2019-04-02 | 清华大学 | 一种电力负荷概率密度多种预测结果的集成方法 |
CN109978201A (zh) * | 2017-12-27 | 2019-07-05 | 深圳市景程信息科技有限公司 | 基于高斯过程分位数回归模型的概率负荷预测系统及方法 |
CN111612244A (zh) * | 2020-05-18 | 2020-09-01 | 南瑞集团有限公司 | 基于qra-lstm的日前光伏功率非参数概率预测方法 |
-
2020
- 2020-10-13 CN CN202410049336.0A patent/CN117977568A/zh active Pending
- 2020-10-13 CN CN202011092704.8A patent/CN112232561B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109978201A (zh) * | 2017-12-27 | 2019-07-05 | 深圳市景程信息科技有限公司 | 基于高斯过程分位数回归模型的概率负荷预测系统及方法 |
CN108846517A (zh) * | 2018-06-12 | 2018-11-20 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN109214605A (zh) * | 2018-11-12 | 2019-01-15 | 国网山东省电力公司电力科学研究院 | 电力系统短期负荷概率预测方法、装置及系统 |
CN109558975A (zh) * | 2018-11-21 | 2019-04-02 | 清华大学 | 一种电力负荷概率密度多种预测结果的集成方法 |
CN111612244A (zh) * | 2020-05-18 | 2020-09-01 | 南瑞集团有限公司 | 基于qra-lstm的日前光伏功率非参数概率预测方法 |
Non-Patent Citations (3)
Title |
---|
基于CNN-GRU分位数回归的短期母线负荷概率密度预测;臧海祥;刘冲冲;滕俊;孔伯骏;孙国强;卫志农;;智慧电力(08);全文 * |
基于时间卷积网络分位数回归的短期负荷概率密度预测方法;庞昊;高金峰;杜耀恒;;电网技术(04);全文 * |
基于深度学习分位数回归模型的充电桩负荷预测;彭曙蓉;黄士峻;李彬;郑国栋;张恒;;电力系统保护与控制(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117977568A (zh) | 2024-05-03 |
CN112232561A (zh) | 2021-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112232561B (zh) | 基于约束并行lstm分位数回归的电力负荷概率预测方法 | |
CN111738512B (zh) | 一种基于cnn-ipso-gru混合模型的短期电力负荷预测方法 | |
Wang et al. | Deep belief network based k-means cluster approach for short-term wind power forecasting | |
CN106886846A (zh) | 一种基于长短期记忆循环神经网络的银行网点备付金预测方法 | |
CN109359786A (zh) | 一种电力台区短期负荷预测方法 | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
Cai et al. | Short‐term load forecasting method based on deep neural network with sample weights | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN115860177A (zh) | 基于组合式机器学习模型光伏发电功率预测方法及其应用 | |
CN114580545A (zh) | 一种基于融合模型的风电机组齿轮箱故障预警方法 | |
CN115600729A (zh) | 一种考虑多属性网格电网负荷预测方法 | |
He et al. | Short-term runoff prediction optimization method based on bgru-bp and blstm-bp neural networks | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及系统 | |
CN115660182A (zh) | 基于最大期望样本加权神经网络模型的光伏出力预测方法 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
Wang et al. | Mid-long term forecasting of reservoir inflow using the coupling of time-varying filter-based empirical mode decomposition and gated recurrent unit | |
CN107704944A (zh) | 一种基于信息论学习的股市波动区间预测方法 | |
CN111738483A (zh) | 基于聚类和深层信念网络的电网降损优化方法及系统 | |
CN114862032B (zh) | 一种基于XGBoost-LSTM的电网负荷预测方法及装置 | |
Li | Prediction of house price index based on machine learning methods | |
Mao et al. | Naive Bayesian algorithm classification model with local attribute weighted based on KNN | |
Zhang et al. | Short-term traffic flow prediction model based on deep learning regression algorithm | |
CN114254828A (zh) | 一种基于混合卷积特征提取器和gru的电力负荷预测方法 | |
Ye et al. | Short-term wind power prediction based on nutrosophic clustering and GA-ELM | |
Li et al. | A data-driven rutting depth short-time prediction model with metaheuristic optimization for asphalt pavements based on RIOHTrack |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |