CN115936062A - 基于场景生成与深度学习的光伏功率日前区间预测方法 - Google Patents

基于场景生成与深度学习的光伏功率日前区间预测方法 Download PDF

Info

Publication number
CN115936062A
CN115936062A CN202310033191.0A CN202310033191A CN115936062A CN 115936062 A CN115936062 A CN 115936062A CN 202310033191 A CN202310033191 A CN 202310033191A CN 115936062 A CN115936062 A CN 115936062A
Authority
CN
China
Prior art keywords
output
scene
clustering
prediction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310033191.0A
Other languages
English (en)
Inventor
李�赫
岳志国
丁仁杰
王翀
历春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin Ruilai Technology Development Co ltd
Tongliao Power Supply Co Of State Grid East Inner Mongolia Electric Power Co
State Grid Corp of China SGCC
Northeast Electric Power University
Original Assignee
Jilin Ruilai Technology Development Co ltd
Tongliao Power Supply Co Of State Grid East Inner Mongolia Electric Power Co
State Grid Corp of China SGCC
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Ruilai Technology Development Co ltd, Tongliao Power Supply Co Of State Grid East Inner Mongolia Electric Power Co, State Grid Corp of China SGCC, Northeast Dianli University filed Critical Jilin Ruilai Technology Development Co ltd
Priority to CN202310033191.0A priority Critical patent/CN115936062A/zh
Publication of CN115936062A publication Critical patent/CN115936062A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于场景生成与深度学习的光伏功率日前区间预测方法,属于新能源发电功率预测领域。本发明的目的是引入可以使预测模型更全面地学习输入与预测对象间的分布规律,从而提高预测精度基于场景生成与深度学习的光伏功率日前区间预测方法。本发明的步骤是:场景聚类个数确定,实现场景聚类,得出具有不同波动和出力特征的日光伏功率场景,通过DCGAN模型进行场景生成,通过QRLSTM模型进行区间预测。本发明的区间预测结果能够为含高比例光伏电力系统提供更为丰富准确的不确定性信息。

Description

基于场景生成与深度学习的光伏功率日前区间预测方法
技术领域
本发明属于新能源发电功率预测领域。
背景技术
传统经济社会发展模式长期依赖化石能源大量消耗,已导致严重环境污染和恶劣气候变化等问题。在清洁化、低碳化能源革命背景下,以光伏、风电为代表的可再生能源发电已成为实现电能替代的有效途径,并呈现产业化和规模化发展态势,高比例可再生能源将成为我国电力系统发展的突出特征。就我国光伏产业而言,光伏装机容量逐年提高且发展前景巨大。然而,高比例光伏并网使电力系统运行调控方式发生了根本性变革。不同于传统可控电源,光伏功率具有较强的随机性和间歇波动性特征,光伏发电的广泛接入使电力系统的供需态势呈现较高的不确定性,给系统安全与经济运行带来了严峻挑战。因此,准确高效的光伏功率预测可以为含高比例光伏电力系统规划、运行、优化调度等提供可靠的信息支撑,对提高系统综合能效、促进新能源消纳具有重要意义。
数据驱动方法是实现光伏功率预测的常用方法之一,其有着易于实现,可迁移性强等优点。现有的预测方法的预测形式以点预测为主,由于光伏功率的预测误差不可避免,导致点预测并不能对预测的不确定性进行量化分析,表达的信息不够全面,且有限的历史数据难以全面描述不同天气类型下的各特征参数分布规律,因此现有技术当中亟需一种新型技术方案来解决这一问题。
发明内容
本发明的目的是引入可以使预测模型更全面地学习输入与预测对象间的分布规律,从而提高预测精度基于场景生成与深度学习的光伏功率日前区间预测方法。
本发明的步骤是:
S1、场景聚类个数k确定:
①选择两个距离阈值:T1和T2,其中T1>T2;
②从待分类的原始数据集合中取出一个样本P,将P作为第一个类,称为Canopy;
③继续从集合中取点E,计算E到已经产生的所有Canopy的距离,如果到某个Canopy的距离小于T1,则将E加入到该Canopy;如果E到所有Canopy中心的距离都大于T1,则将E作为一个新Canopy;
④如果E到该Canopy距离小于T2,则表示E和该Canopy已经足够近,此时将E从集合中删除,避免重复加入到其他Canopy;
⑤返回步骤②,对集合中的点继续执行上述操作直到集合为空,算法结束,聚类完成;
S2、通过K-means算法实现场景聚类,得出k个具有不同波动和出力特征的日光伏功率场景:①输入聚类前的所有样本数据M,M={M1,M2,…,Mj,…,Mh},其中每一个样本Mj为一个向量,且Mj=[m1,m2,…,mi,…mn];
②确定聚类个数k,并初始化k个聚类中心,使用随机数在所有样本中抽取k个不重复的样本作为初始聚类中心;
③计算第j个样本对k个聚类中心的欧式距离,并把该样本归并到与聚类中心最小欧式距离对应的类别,重复上述过程,直至把所有样本遍历;
④移动聚类中心,把各类别样本对应的样本点加和计算得到的均值作为该类别新的聚类中心,返回步骤③,直至聚类中心不再发生变化,迭代结束;
S3、通过DCGAN模型进行场景生成:
①首先将服从标准正态分布的随机噪声z输入进生成器G,生成尽可能服从真实样本x的Pdata分布规律的样本G(z);其生成器损失函数为:
LG=-Ez~Pg(z)[logD(G(z))]                                  (1)
式中:Pdata为真实数据的概率分布;Pg(z)为噪声数据的概率分布;G(z)为生成器的输出结果;
②将G(z)与真实样本x一同输入至判别器D中,判断输入为真实数据还是生成数据,若为真实数据,D(x)接近1,若为生成数据,D(G(z))接近0;
LD=Ez~Pg(z)[-log(1-D(G(z)))]-Ex~Pdata[logD(x)]               (2)
式中:D(·)为判别器输出的[0,1]之间的概率结果;
③更新判别器与生成器参数,通过计算损失函数及梯度不断训练和优化模型,使生成器输出的数据结果不断接近真实数据,返回步骤①,重复上述过程,直至算法满足最大迭代次数;DCGAN模型表示为:
Figure BDA0004048139160000021
④将随机噪声向量z输入已经训练完毕的生成模型G中,得到各特征参数的日内场景生成结果;
S4、通过QRLSTM模型进行区间预测:
①确定网络结构、节点个数及分位点个数l,初始化网络,并构建训练集与测试集;
②将训练集输入进QRLSTM,训练并更新每个分位点τ下的LSTM模型,直至训练次数达到最大值;其QRLSTM输出响应变量S在τ分位点下的条件分位数为:
Figure BDA0004048139160000022
式中:J为隐含层的单元个数;f为输出层激活函数;hj(τ·)为LSTM隐含层的输出;wj(τ·)、bj(τ·)为输出层的权重与偏置;
LSTM在t时刻的输入序列xt与t-1时刻LSTM隐含层的输出序列ht-1拼接得到的矩阵作为遗忘门、输入门和输出门的输入变量,其中各门控单元的计算过程为:
it=σ(Wi[xt,ht-1]T+bi)                 (5)
ft=σ(Wf[xt,ht-1]T+bf)                (6)
ot=σ(Wo[xt,ht-1]T+bo)                 (7)
式中:it、ft、ot分别为输入门、遗忘门和输出门的输出值;Wi、Wf、Wo和bi、bf、bo分别为对应门的权重和偏置矩阵;σ为激活函数sigmoid,其输出在[0,1]之间;
LSTM的输出门和细胞状态共同作用得到t时刻的隐藏层输出,即:
C't=tanh(Wc·ht-1+Wf·xt+bc)    (8)
Ct=ftvCt-1+it⊙C't    (9)
ht=ot⊙tanh(Ct)   (10)
式中:tanh为激活函数;C't为当前时刻细胞状态的输入;Ct为t时刻细胞状态输出;ht为t时刻隐含层的输出;Wc、bc分别为输入层的权重和偏置矩阵;⊙表示矩阵对应元素的相乘运算;
③将测试集的解释变量Ut输入进训练完毕的QRLSTM中,得到t时刻响应变量的条件分位数St+h|t,并输出测试集预测结果。
本发明对现有预测方法中的点预测表达信息不全面和有限的历史数据难以全面描述不同天气类型下的各特征参数分布规律的问题,提出了一种基于场景生成与深度学习的光伏功率日前区间预测方法,可以实现不同置信度下的光伏功率日前区间预测,其优点在于场景生成模型的引入可以使预测模型更全面地学习输入与预测对象间的分布规律,从而提高预测精度。相比于点预测,本发明的区间预测结果能够为含高比例光伏电力系统提供更为丰富准确的不确定性信息。
附图说明
图1为本发明的区间预测整体流程图;
图2为生成对抗网络结构示意图;
图3为QRLSTM网络结构示意图;
图4a为本发明实施例场景聚类仿真结果中第1类场景光伏功率曲线图;
图4b为本发明实施例场景聚类仿真结果中第2类场景光伏功率曲线图;
图4c为本发明实施例场景聚类仿真结果中第3类场景光伏功率曲线图;
图4d为本发明实施例场景聚类仿真结果中第4类场景光伏功率曲线图;
图4e为本发明实施例场景聚类仿真结果中第1类场景箱线图;
图4f为本发明实施例场景聚类仿真结果中第2类场景箱线图;
图4g为本发明实施例场景聚类仿真结果中第3类场景箱线图;
图4h为本发明实施例场景聚类仿真结果中第4类场景箱线图;
图5a为本发明实施例第1类场景生成均值仿真结果图;
图5b为本发明实施例第2类场景生成均值仿真结果图;
图5c为本发明实施例第3类场景生成均值仿真结果图;
图5d为本发明实施例第4类场景生成均值仿真结果图;
图6a为本发明实施例第1类场景区间预测结果仿真图;
图6b为本发明实施例第2类场景区间预测结果仿真图;
图6c为本发明实施例第3类场景区间预测结果仿真图;
图6d为本发明实施例第4类场景区间预测结果仿真图。
具体实施方式
本发明在于提供一种基于场景生成与深度学习的光伏功率日前区间预测方法,首先采用K-means聚类方法将光伏功率原始数据集划分为有限个场景,通过深度卷积生成对抗网络(deep convolutional generative adversarial networks,DCGAN)模型生成若干条与原始数据概率分布类似但实际值不同的场景曲线,并取均值。将其与其他解释变量共同输入基于长短期记忆神经网络的分位数回归(quantile regression long short-termmemory,QRLSTM)模型进行日前光伏功率预测,得到取不同置信度时各分位数下的预测区间。
本发明以下步骤顺次进行:
步骤1:模型参数设置。根据不同类型的原始数据,确定相应的深度卷积生成对抗网络(deep convolutional generative adversarial networks,DCGAN)模型和基于长短期记忆神经网络的分位数回归(quantile regression long short-term memory,QRLSTM)模型中网络参数以及场景聚类个数k。
步骤2:通过K-means算法实现场景聚类。将以天为单位的光伏功率作为待聚类数据输入进K-means聚类方法中,迭代并不断更新聚类结果,直至聚类结果不发生变化为止,得出k个具有不同波动和出力特征的日光伏功率场景。
步骤3:通过DCGAN模型进行场景生成。将第i场景下的日光伏功率及其他特征参数作为真实数据x输入进DCGAN模型中训练迭代并更新网络参数,在满足最大迭代次数后得到训练完毕的场景生成模型,然后将随机噪声向量z输入已经训练完毕的生成模型G中,得到各特征参数在第i场景下的日内场景生成结果。
步骤4:通过QRLSTM模型进行区间预测。在第i类场景下,以光伏功率训练集作为预测对象实际值yt+h,将预测日前一日的光伏功率数据与DCGAN生成的各参数曲线均值在t时刻的解释变量Ut输入进QRLSTM模型中进行迭代训练并更新网络参数,在达到最大迭代次数时停止迭代,并将测试集数据样本输入训练完毕的QRLSTM模型中,并输出最终的测试集区间预测结果。循环步骤3、4,直至遍历k类场景数据为止。
图1为本发明的区间预测整体流程图,具体步骤如下:
S1、参数设置。根据不同类型的原始数据,确定相应的DCGAN和QRLSTM模型中网络参数以及场景聚类个数k。
S2、通过K-means算法实现场景聚类。将以天为单位的光伏功率作为待聚类数据输入进K-means聚类方法中,得到k个具有不同特征的日光伏出力场景。
①输入聚类前的所有样本数据M,M={M1,M2,…,Mj,…,Mh},其中每一个样本Mj为一个向量,且Mj=[m1,m2,…,mi,…mn]。
②确定聚类个数k,并初始化k个聚类中心。使用随机数在所有样本中抽取k个不重复的样本作为初始聚类中心。
③计算第j个样本对k个聚类中心的欧式距离,并把该样本归并到与聚类中心最小欧式距离对应的类别,重复上述过程,直至把所有样本遍历。
④移动聚类中心,把各类别样本对应的样本点加和计算得到的均值作为该类别新的聚类中心,返回步骤③,直至聚类中心不再发生变化,迭代结束。
S3、通过DCGAN模型进行场景生成。将对应场景下的日光伏功率及其他参数作为真实数据x输入进DCGAN模型中,DCGAN模型将原始GAN中的生成器G和判别器D替换为深度卷积网络,卷积层的计算公式为:
Figure BDA0004048139160000051
式中:X为神经元输入;hc为神经元局部输出;i、j、τ分别代表输出矩阵的3个维度;K为卷积核;m、n、τ分别为卷积核的长度、宽度和深度;bc为卷积核阈值向量。
①首先将服从标准正态分布的随机噪声z输入进生成器G,生成尽可能服从真实样本x的Pdata分布规律的样本G(z);其生成器损失函数为:
LG=-Ez~Pg(z)[logD(G(z))]                        (1)
式中:Pdata为真实数据的概率分布;Pg(z)为噪声数据的概率分布;G(z)为生成器的输出结果。
②将G(z)与真实样本x一同输入至判别器D中,判断输入为真实数据还是生成数据,若为真实数据,D(x)接近1,若为生成数据,D(G(z))接近0;
LD=Ez~Pg(z)[-log(1-D(G(z)))]-Ex~Pdata[logD(x)]      (2)
式中:D()为判别器输出的[0,1]之间的概率结果。
③更新判别器与生成器参数,通过计算损失函数及梯度不断训练和优化模型,使生成器输出的数据结果不断接近真实数据。返回步骤①,重复上述过程,直至算法满足最大迭代次数。DCGAN模型表示为:
Figure BDA0004048139160000052
④将随机噪声向量z输入已经训练完毕的生成模型G中,得到各特征参数的日内场景生成结果。
S4、通过QRLSTM模型进行区间预测。在第i类场景下,以光伏功率训练集作为预测对象实际值yt+h,将预测日前一日的光伏功率数据与DCGAN生成的各参数曲线均值在t时刻的解释变量Ut输入进QRLSTM模型中进行迭代训练,并输出最终的区间预测结果。
QRLSTM模型区间预测步骤为:
①确定网络结构、节点个数及分位点个数l,初始化网络,并构建训练集与测试集;
②将训练集输入进QRLSTM,训练并更新每个分位点τ下的LSTM模型,直至训练次数达到最大值;其QRLSTM输出响应变量S在τ分位点下的条件分位数为:
Figure BDA0004048139160000061
式中:J为隐含层的单元个数;f为输出层激活函数;hj(τ)为LSTM隐含层的输出;wj(τ)、bj(τ)为输出层的权重与偏置。
LSTM在t时刻的输入序列xt与t-1时刻LSTM隐含层的输出序列ht-1拼接得到的矩阵作为遗忘门、输入门和输出门的输入变量,其中各门控单元的计算过程为:
it=σ(Wi[xt,ht-1]T+bi)                         (5)
ft=σ(Wf[xt,ht-1]T+bf)                         (6)
ot=σ(Wo[xt,ht-1]T+bo)                         (7)
式中:it、ft、ot分别为输入门、遗忘门和输出门的输出值;Wi、Wf、Wo和bi、bf、bo分别为对应门的权重和偏置矩阵;σ为激活函数sigmoid,其输出在[0,1]之间。
LSTM的输出门和细胞状态共同作用得到t时刻的隐藏层输出,即:
C't=tanh(Wc·ht-1+Wf·xt+bc)                             (8)
Ct=ft⊙Ct-1+it⊙C't                               (9)
ht=ot⊙tanh(Ct)                                   (10)
式中:tanh为激活函数;C't为当前时刻细胞状态的输入;Ct为t时刻细胞状态输出;ht为t时刻隐含层的输出;Wc、bc分别为输入层的权重和偏置矩阵;⊙表示矩阵对应元素的相乘运算。
③将测试集的解释变量Ut输入进训练完毕的QRLSTM中,得到t时刻响应变量的条件分位数St+h|t,并输出测试集预测结果。
本发明优选实例采用江苏省内某光伏电站的整年实测光伏功率时间序列,以及电站环境监测仪采集的4种环境特征参数为仿真数据,分别为总辐照、直射、散射和组件温度。具体步骤如下:
(1)参数设置。根据不同类型的原始数据,确定相应的DCGAN和QRLSTM模型中网络参数以及场景聚类个数k;对于光伏数据,在每天的5:00至20:00之间取该时间段的数据构建数据集,每天包含60个采样点。则场景生成模型DCGAN中生成器和判别器的参数可设置如表1、表2所示,其中生成器与判别器的激活函数分别为Relu与LeakyRelu函数。对于QRLSTM模型,分位数取值区间可设置为0.01~0.99,间隔为0.01。LSTM网络层数设为2层,隐含层节点个数分别为24和48个。
对于聚类个数k,本发明选用Canopy算法确定聚类个数。其具体步骤为:
①选择两个距离阈值:T1和T2,其中T1>T2。
②从待分类的原始数据集合中取出一个样本P,将P作为第一个类,称为Canopy。
③继续从集合中取点E,计算E到已经产生的所有Canopy的距离,如果到某个Canopy的距离小于T1,则将E加入到该Canopy;如果E到所有Canopy中心的距离都大于T1,则将E作为一个新Canopy。
④如果E到该Canopy距离小于T2,则表示E和该Canopy已经足够近,此时将E从集合中删除,避免重复加入到其他Canopy。
⑤返回步骤②,对集合中的点继续执行上述操作直到集合为空,算法结束,聚类完成。
设置运行次数为500次,得出聚类数为4的结果出现频率最高,占总数的67.8%,因此可将k-means算法的聚类数k设为4。
(2)通过K-means算法实现场景聚类。将以天为单位的光伏功率作为待聚类数据输入进K-means聚类方法中,通过算法不断迭代更新聚类结果,直至各聚类中心在迭代时不再发生变化为止,得到k个具有不同特征的日光伏出力场景数据聚类结果。
(3)通过DCGAN模型进行场景生成。将第i场景下的日光伏功率及其他特征参数作为真实数据x输入进DCGAN模型中训练迭代并更新网络参数,在满足最大迭代次数后得到训练完毕的场景生成模型,然后将随机噪声向量z输入已经训练完毕的生成模型G中,得到各特征参数在第i场景下的日内场景生成结果。
(4)通过QRLSTM模型进行区间预测。在第i类场景下,以光伏功率训练集作为预测对象实际值yt+h,将预测日前一日的光伏功率数据与DCGAN生成的各参数曲线均值在t时刻的解释变量Ut输入进QRLSTM模型中进行迭代训练并更新网络参数,在达到最大迭代次数时停止迭代,并将测试集数据样本输入训练完毕的QRLSTM模型中,并输出最终的测试集区间预测结果。
仿真分析
图4a~h为本发明实施例场景聚类仿真结果图,其中+为异常值,-为中位数,
Figure BDA0004048139160000071
为第一四分位数至第三四分位数区间,
Figure BDA0004048139160000072
为内限。经k-means聚类可将日光伏功率划分为4类不同场景。由图可知,k-means聚类基本实现了对不同出力特征日光伏功率曲线的有效分类,各场景所包含的样本数量分别为110、67、57和95。为了进一步分析各场景中的曲线的特性,由聚类结果得到的各类场景下光伏功率日曲线对应的箱线图,第1类场景至第4类场景下的第一四分位数到第三四分位数区间逐渐减小,说明4类场景下的日光伏功率水平逐渐降低,即光伏板接收到的辐射总量逐渐减小。另外,由于第1类场景和第4类场景的内限较窄,说明这两类场景下的光伏功率在不同出力水平下的波动较小,反之,第2类场景和第3类场景的内限较宽,说明其在不同出力水平下的波动较大。
表1生成器网络参数
Figure BDA0004048139160000081
表2判别器网络参数
Figure BDA0004048139160000082
将上述四类场景下的光伏功率和其他特征参数作为真实数据x,与大小为1×50且服从正态分布的噪声z共同输入进DCGAN模型进行训练,分别生成待预测日各参数在对应场景下的100条特性曲线并分别求取其均值,得到四类场景下光伏功率和各特征参数的归一化生成曲线如图5a~5d所示,图中
Figure BDA0004048139160000083
为光伏功率,
Figure BDA0004048139160000084
为总辐射,
Figure BDA0004048139160000085
为直射,
Figure BDA0004048139160000086
为散射,
Figure BDA0004048139160000087
为组件温度。可以看出DCGAN模型能够有效匹配不同场景下的光伏功率分布规律,具有较强的学习和场景生成能力。
将图5a~5d中四种场景生成的日光伏功率和各特征参数均值与预测日前一日的解释变量输入进QRLSTM模型中迭代训练,然后输入测试集数据,得到四种场景下的日前区间预测结果,并分别将其表示为不同置信度下的预测区间,如图6a~6d所示,图6a~6d中
Figure BDA0004048139160000092
为实际值,
Figure BDA0004048139160000093
为95%置信度,
Figure BDA0004048139160000094
为90%置信度,
Figure BDA0004048139160000095
为85%置信度,
Figure BDA0004048139160000096
为80%置信度。由图可知,置信度较高的预测区间内出现真实值的概率相对更高,相应地,其预测区间宽度也更大。4类场景在不同置信度下各评价指标计算结果见表5。由表5可知,本文方法能够较精确地实现光伏功率日前区间预测,在95%置信度下的预测区间覆盖率(empiricalcoverage probability,ECP)最大,代表预测可靠性最高,而在80%置信度下的平均宽度(average width,AW)与Winker分数最小,代表预测区间的锐度与综合性能更好。验证了本发明提出的场景生成方法的合理性以及区间预测方法的有效性和优越性。
表3本文方法预测区间各置信度下评价指标
Figure BDA0004048139160000091
本发明涉及的符号名称:
k:场景聚类个数;M:聚类前的所有样本数据;X:为神经元输入;K:卷积核;bc:卷积核阈值向量;G:生成器模型;z:随机噪声向量;G(z):生成器的生成样本;Pdata:真实数据的概率分布;Pg(z):噪声数据的概率分布;D:判别器模型;D(G(z)):判别器的判别结果;yt+h:预测对象在t+h时刻的实际值;Ut:DCGAN生成结果均值在t时刻的解释变量;l:分位点个数;S:QRLSTM输出响应变量;τ:分位数的值;J:QRLSTM隐含层的单元个数;f(·):QRLSTM输出层激活函数;hj(τ):QRLSTM隐含层的输出;wj(τ):QRLSTM输出层的权重;bj(τ):QRLSTM输出层的偏置;xt:LSTM在t时刻的输入序列;ht-1:t-1时刻LSTM隐含层的输出序列;it:LSTM输入门的输出值;ft:LSTM遗忘门的输出值;ot:LSTM输出门的输出值;Wi:LSTM输入门的权重;Wf:LSTM遗忘门的权重;Wo:LSTM输出门的权重;bi:LSTM输入门的偏置;bf:LSTM遗忘门的权重;bo:LSTM输出门的偏置;σ:激活函数sigmoid;tanh:激活函数;C't:LSTM在t时刻细胞状态的输入;Ct:LSTM在t时刻细胞状态的输出;ht:LSTM在t时刻隐含层的输出;Wc:LSTM输入层的权重;bc:LSTM输入层的偏置矩阵;⊙:矩阵对应元素的相乘运算;St+h|t:QRLSTM中t时刻响应变量的条件分位数。

Claims (1)

1.一种基于场景生成与深度学习的光伏功率日前区间预测方法,其特征在于:其步骤是:
S1、场景聚类个数k确定:
①选择两个距离阈值:T1和T2,其中T1>T2;
②从待分类的原始数据集合中取出一个样本P,将P作为第一个类,称为Canopy;
③继续从集合中取点E,计算E到已经产生的所有Canopy的距离,如果到某个Canopy的距离小于T1,则将E加入到该Canopy;如果E到所有Canopy中心的距离都大于T1,则将E作为一个新Canopy;
④如果E到该Canopy距离小于T2,则表示E和该Canopy已经足够近,此时将E从集合中删除,避免重复加入到其他Canopy;
⑤返回步骤②,对集合中的点继续执行上述操作直到集合为空,算法结束,聚类完成;
S2、通过K-means算法实现场景聚类,得出k个具有不同波动和出力特征的日光伏功率场景:
①输入聚类前的所有样本数据M,M={M1,M2,…,Mj,…,Mh},其中每一个样本Mj为一个向量,且Mj=[m1,m2,…,mi,…mn];
②确定聚类个数k,并初始化k个聚类中心,使用随机数在所有样本中抽取k个不重复的样本作为初始聚类中心;
③计算第j个样本对k个聚类中心的欧式距离,并把该样本归并到与聚类中心最小欧式距离对应的类别,重复上述过程,直至把所有样本遍历;
④移动聚类中心,把各类别样本对应的样本点加和计算得到的均值作为该类别新的聚类中心,返回步骤③,直至聚类中心不再发生变化,迭代结束;
S3、通过DCGAN模型进行场景生成:
①首先将服从标准正态分布的随机噪声z输入进生成器G,生成尽可能服从真实样本x的Pdata分布规律的样本G(z);其生成器损失函数为:
LG=-Ez~Pg(z)[logD(G(z))]                 (1)
式中:Pdata为真实数据的概率分布;Pg(z)为噪声数据的概率分布;G(z)为生成器的输出结果;
②将G(z)与真实样本x一同输入至判别器D中,判断输入为真实数据还是生成数据,若为真实数据,D(x)接近1,若为生成数据,D(G(z))接近0;
LD=Ez~Pg(z)[-log(1-D(G(z)))]-Ex~Pdatadata[logD(x)]               (2)
式中:D(·)为判别器输出的[0,1]之间的概率结果;
③更新判别器与生成器参数,通过计算损失函数及梯度不断训练和优化模型,使生成器输出的数据结果不断接近真实数据,返回步骤①,重复上述过程,直至算法满足最大迭代次数;
DCGAN模型表示为:
Figure FDA0004048139150000011
④将随机噪声向量z输入已经训练完毕的生成模型G中,得到各特征参数的日内场景生成结果;
S4、通过QRLSTM模型进行区间预测:
①确定网络结构、节点个数及分位点个数l,初始化网络,并构建训练集与测试集;
②将训练集输入进QRLSTM,训练并更新每个分位点τ下的LSTM模型,直至训练次数达到最大值;其QRLSTM输出响应变量S在τ分位点下的条件分位数为:
Figure FDA0004048139150000012
式中:J为隐含层的单元个数;f为输出层激活函数;hj(τ·)为LSTM隐含层的输出;wj(τ·)、bj(τ·)为输出层的权重与偏置;
LSTM在t时刻的输入序列xt与t-1时刻LSTM隐含层的输出序列ht-1拼接得到的矩阵作为遗忘门、输入门和输出门的输入变量,其中各门控单元的计算过程为:
it=σ(Wi[xt,ht-1]T+bi)                 (5)
ft=σ(Wf[xt,ht-1]T+bf)                (6)
ot=σ(Wo[xt,ht-1]T+bo)                 (7)
式中:it、ft、ot分别为输入门、遗忘门和输出门的输出值;Wi、Wf、Wo和bi、bf、bo分别为对应门的权重和偏置矩阵;σ为激活函数sigmoid,其输出在[0,1]之间;
LSTM的输出门和细胞状态共同作用得到t时刻的隐藏层输出,即:
Ct'=tanh(Wc·ht-1+Wf·xt+bc)    (8)
Ct=ft⊙Ct-1+it⊙Ct'    (9)
ht=ot⊙tanh(Ct)   (10)
式中:tanh为激活函数;Ct'为当前时刻细胞状态的输入;Ct为t时刻细胞状态输出;ht为t时刻隐含层的输出;Wc、bc分别为输入层的权重和偏置矩阵;⊙表示矩阵对应元素的相乘运算;
③将测试集的解释变量Ut输入进训练完毕的QRLSTM中,得到t时刻响应变量的条件分位数St+h|t,并输出测试集预测结果。
CN202310033191.0A 2023-01-10 2023-01-10 基于场景生成与深度学习的光伏功率日前区间预测方法 Pending CN115936062A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310033191.0A CN115936062A (zh) 2023-01-10 2023-01-10 基于场景生成与深度学习的光伏功率日前区间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310033191.0A CN115936062A (zh) 2023-01-10 2023-01-10 基于场景生成与深度学习的光伏功率日前区间预测方法

Publications (1)

Publication Number Publication Date
CN115936062A true CN115936062A (zh) 2023-04-07

Family

ID=86552637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310033191.0A Pending CN115936062A (zh) 2023-01-10 2023-01-10 基于场景生成与深度学习的光伏功率日前区间预测方法

Country Status (1)

Country Link
CN (1) CN115936062A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432874A (zh) * 2023-06-14 2023-07-14 青岛鼎信通讯科技有限公司 一种基于特征功率的分布式光伏功率预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432874A (zh) * 2023-06-14 2023-07-14 青岛鼎信通讯科技有限公司 一种基于特征功率的分布式光伏功率预测方法

Similar Documents

Publication Publication Date Title
CN110070226B (zh) 基于卷积神经网络与元学习的光伏功率预测方法及系统
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
Fan et al. A novel deep generative modeling-based data augmentation strategy for improving short-term building energy predictions
CN110910004A (zh) 一种多重不确定性的水库调度规则提取方法及系统
CN113128113B (zh) 一种基于深度学习和迁移学习的贫乏信息建筑负荷预测方法
CN109902340B (zh) 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
CN113344288B (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN111898825A (zh) 一种光伏发电功率短期预测方法及装置
CN111553510A (zh) 一种短期风速预测方法
CN111506868B (zh) 一种基于hht权值优化的超短期风速预测方法
CN116960978A (zh) 基于风速-功率组合分解重构的海上风电功率预测方法
CN115936062A (zh) 基于场景生成与深度学习的光伏功率日前区间预测方法
Wibawa et al. Long Short-Term Memory to Predict Unique Visitors of an Electronic Journal
CN110956304A (zh) 一种基于ga-rbm的分布式光伏发电量短期预测方法
CN112836876B (zh) 一种基于深度学习的配电网线路负荷预测方法
CN115392387B (zh) 一种低压分布式光伏发电出力预测方法
CN113283043B (zh) 一种适用于高维大规模场景的场景约简求解方法
CN116187506A (zh) 考虑气象分类的短期风电功率组合概率预测方法及系统
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN114897260A (zh) 基于lstm神经网络的短期风速预测模型建模方法及预测方法
CN112232714B (zh) 一种基于深度学习的结构参数不完备下配电网风险评估方法
Xu et al. NWP feature selection and GCN-based ultra-short-term wind farm cluster power forecasting method
CN114386666A (zh) 一种基于时空相关性的风电场短期风速预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination