CN114676622A - 基于自编码器深度学习模型的短期光伏功率预测方法 - Google Patents
基于自编码器深度学习模型的短期光伏功率预测方法 Download PDFInfo
- Publication number
- CN114676622A CN114676622A CN202210146567.4A CN202210146567A CN114676622A CN 114676622 A CN114676622 A CN 114676622A CN 202210146567 A CN202210146567 A CN 202210146567A CN 114676622 A CN114676622 A CN 114676622A
- Authority
- CN
- China
- Prior art keywords
- encoder
- model
- data
- vae
- photovoltaic power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000013136 deep learning model Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000003860 storage Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 22
- 238000009826 distribution Methods 0.000 claims description 20
- 238000013135 deep learning Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000002441 reversible effect Effects 0.000 claims description 3
- 238000007493 shaping process Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 2
- 238000010248 power generation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/04—Power grid distribution networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/06—Power analysis or power optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于自编码器深度学习模型的短期光伏功率预测方法,包括:S1,构建变分自编码器模型VAE;S2,基于所述变分自编码器模型VAE进行短期光伏功率预测。S1包括:S11,构建所述变分自编码器模型VAE的一个编码器和一个解码器;S12,通过近似后验qθ(z|x)得到所述编码器,通过似然pφ(x|z)得到所述解码器;S13,构建并计算损失函数,以训练VAE的特征提取;S14,通过使用训练观测值最小化损失函数L(θ,φ)来获得编码器和解码器的参数。还公开了基于自编码器深度学习模型的短期光伏功率预测系统、电子设备以及计算机可读存储介质。
Description
技术领域
本发明属于智慧电力技术领域,尤其涉及基于自编码器深度学习模型的短期光伏功率预测方法。
背景技术
光伏(PV)系统中太阳能输出的准确建模和预测对于构建以新能源为主体的新型电力系统的安全运行至关重要。准确的光伏功率预测,可以减少光伏发电不确定性对电网的影响,提高电能质量及光伏系统的渗透水平。光伏发电输出具有很高的波动性和间歇性,光伏系统输出功率的准确建模和预测,能够有效提高能源管理系统有效运行和电力系统并网调度管理水平。
光伏发电功率预测主要采用物理方法、统计方法及人工智能方法。基于物理方程实现预测,需要大量的传感器获取物理参数,预测方法的鲁棒性较差。传统的统计方法通过回归分析等方法来映射发电量和历史数据间的关系,但处理非线性数据效果不理想。相比之下,人工智能技术具有处理复杂的非线性问题的能力和更强的容错性。
近年来,浅层机器学习(ML)作为非参数模型,可以模拟过程变量之间的复杂关系,已被广泛用于改进太阳能光伏预测。Wang Kejun等通过将数据重新采样方法与机器学习相结合,开发了一种用于太阳能预测的单变量方法,将神经网络(CNN)、支持向量回归(SVR)、随机森林(RF)和多元线性回归(MLR)在内的机器学习算法应用于重新采样的时间序列,以计算多步提前预测。在过去几年中,深度学习已成为学术界和工业界的一个热点方向,广泛应用于计算机视觉、自然语言处理、语音识别、可再生能源预测、异常检测、强化学习等领域。由于其数据驱动的方法,深度学习带来了时间序列数据中相关信息的提取和分析方式的范式转变。通过将多层连接到神经网络结构中,深度学习驱动的方法能够灵活有效地对过程变量之间的隐式交互进行建模,并在人工指令有限的情况下从海量数据集中自动提取相关信息。多种深度学习技术已应用到太阳能功率预测。
Gangqiang Li等人使用循环神经网络(RNN)预测光伏发电功率。然而,由于存在梯度消失和梯度爆炸,简单的RNN不适合学习长期进化。为了绕过这个限制,已经开发了几种RNN变体,包括长短期记忆网络(LSTM)和门控循环单元(GRU) 网络。从本质上讲,与简单的RNN模型相比,LSTM和GRU模型在对更长的时间跨度内的时间相关数据进行建模方面具有卓越的能力。Fei Wang等人将LSTM循环神经网络(LSTM-RNN)应用于独立日前光伏功率预测,并使用修改方法对预测结果进行了改进,该方法考虑了不同光伏功率模式的相关性,提高了预测质量。 Aprillia H等人通过将卷积神经网络(CNN)和Salpswarm算法(SSA)相结合,引入了一种混合预测方法,用于光伏功率输出预测。深度学习模型具有高效学习时间序列数据中的非线性特征和相关信息的能力。基于VAE(Variational Auto-Encoder)的深度学习模型在时间序列建模和非线性逼近特征提取方面表现性能优异,有望提高预测精度,但是现有技术还没有对此用于短期光伏功率预测的方案。
发明内容
本发明的目的是提供基于自编码器深度学习模型的短期光伏功率预测方法,将变分自编码器(VAE)方法应用于光伏发电时间序列数据的预测。并与循环神经网络(DRNN)、长短期记忆(LSTM)深度学习方法和支持向量回归(SVR)机器学习方法的预测输出进行了对比分析比较,这些模型考虑了固有的时间依赖性和非线性特征。为了指导光伏系统的短期和长期运营策略,对单步和多步提前预测进行了对比研究。两个太阳能电站预测结果表明,深度学习模型较基线机器学习模型预测性能更好,基于VAE的预测方法能够学习更高级别的特征,其预测性能表现更佳。
本发明一方面提供了基于自编码器深度学习模型的短期光伏功率预测方法,包括:
S1,构建变分自编码器模型VAE;
S2,基于所述变分自编码器模型VAE进行短期光伏功率预测。
优选的,所述S1包括:
S11,构建所述变分自编码器模型VAE的一个编码器和一个解码器,其中所述编码器用于将给定的观察集X编码到潜在空间Z作为分布q(z|x),与观察集的维度相比,所述潜在空间维度减少;使用学习到的概率分布,通过z~q(z|x) 生成样本;
S12,通过近似后验qθ(z|x)得到所述编码器,通过似然pφ(x|z)得到所述解码器,其中θ和φ分别为编码器和解码器的参数,并构建了一个神经网络来学习编码器和解码器的参数θ和φ;所述编码器输出的维数小于原始数据的维数;所述编码器是通过训练包含编码器和解码器的整个VAE来训练;
S13,构建并计算损失函数,以训练VAE的特征提取;
S14,通过使用训练观测值最小化损失函数L(θ,φ)来获得编码器和解码器的参数。
优选的,所述S13包括:假设Xt=[x1t,x2t,...,xNt]是VAE在时间点t的输入数据,X是使用VAE模型重建的数据;假设最大化参数的边际似然学习表示为:
logpφ(x′)=DKL[qθ(z|x)||pφ(x)]+L(θ,φ;x)(1)
其中DKL[.]表示Kullback-Leibler散度,L表示编码器和解码器参数(即θ和φ)的似然性;VAE的损失函数由两部分组成:重建损失和正则化器;重建损失获得有效的编码-解码过程;正则化器部分允许对潜在空间构造进行正则化,以尽可能接近前缀分布来逼近编码器外的分布;
式(2)允许增强解码器学习数据重建的能力;使用Kulback-Leibler(KL)散度报告正则化器,该散度将编码器函数(qθ(z|x))和潜在变量先验(z,|pφ(z)) 的分布分开;KL用于计算分隔两个给定概率分布的距离;梯度下降法用于在训练阶段最小化编码器参数和解码器损失函数;最小化损失函数以确保获得规则的潜在空间z,并使用z~pφ(z)对新观察进行充分采样;
假设pφ(z)=N(z;0,I),则qθ(z|x)可写为:
logqθ(z|x)=logN(z;μ,σ2I) (3)。
优选的,使用所述解码器重建数据会导致重建偏差,在VAE模型的训练阶段,通过最小化观察集和编码-解码集之间的偏差来最小化该误差,其中,重构误差项可以表示为以下形式:
优选的,所述S2包括:
S21,进行数据预处理,包括:
(1)整体上对输入数据通过min-max进行归一化,然后用于构建深度学习模型,归一化后允许在不考虑光伏设施规模的情况下比较预测性能;原始测量值y的归一化定义为:
其中ymin和ymax分别为光伏电站的输出功率数据的最小值和最大值;在获得预测输出后,应用反向操作来确保预测数据与原始光伏功率时间序列数据匹配:
(2)采用深度学习框架来预测光伏功率输出时间序列;
S22,采用预测程序进行太阳能功率初步预测,分训练过程和预报过程两个阶段完成;其中,原始功率数据被拆分为训练子数据和测试子数据;对原始功率数据进行标准化以构建用于预报的深度学习模型,采用Adam优化器通过基于训练数据最小化损失函数来选择深度学习模型的参数值深度学习模型的质量使用若干统计指标进行量化,包括决定系数R2、解释方差EV、平均绝对误差MAE、均方根误差RMSE和标准均方根误差NRMSE评估深度学习模型性能,计算公式如 (7)~(11);
式中yt是实际值,y^t是相应的估计值,ym是测得的功率数据点的平均值, n是测量次数。
优选的,所述两个阶段包括:
(1)第一阶段,训练过程
使用的模型分为编码器模型和RNN模型两类;;数据集首先进行归一化处理,自动编码器模型需要进行数据整形预处理,以将单变量功率时间序列数据转换为二维矩阵,用作自编码器的输入;训练基于RNN的模型来学习从输入到输出的映射函数;,经过训练的模型用于完成新数据序列的预测;逐层无监督加微调应用于VAE;基于自动编码器的光伏功率输出预测通过降维实现,模型无法发现时间依赖性或模型时间序列数据;对每一层进行逐层无监督学习,进行微调后,改进专用于预测问题或降维的神经网络的特征提取和学习过程;
(2)预报过程:基于用于预报的深度学习模型进行短期光伏功率预测。
本发明的第二方面提供了基于自编码器深度学习模型的短期光伏功率预测系统,包括:
模型构建模块,用于构建变分自编码器模型VAE;以及
功率预测模块,用于基于所述变分自编码器模型VAE进行短期光伏功率预测。
本发明的第三方面提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如第一方面所述的方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如第一方面所述的方法。
本发明提供的方法、装置、电子设备以及计算机可读存储介质,具有如下有益的技术效果:
提供基于自编码器深度学习模型的短期光伏功率预测方法,将变分自编码器(VAE)方法应用于光伏发电时间序列数据的预测。并与循环神经网络(DRNN)、长短期记忆(LSTM)深度学习方法和支持向量回归(SVR)机器学习方法的预测输出进行了对比分析比较,这些模型考虑了固有的时间依赖性和非线性特征。为了指导光伏系统的短期和长期运营策略,对单步和多步提前预测进行了对比研究。两个太阳能电站预测结果表明,深度学习模型较基线机器学习模型预测性能更好,基于VAE的预测方法能够学习更高级别的特征,其预测性能表现更佳。
附图说明
图1为本发明提供的变分自编码器模型基本原理示意图。
图2为本发明提供的损失函数和散度就算过程示意图。
图3为本发明提供的光伏功率预测流程图;
图4为本发明提供的VAE训练过程图;
图5(a)和5(b)分别为本发明提供的光伏电站实际功率以及电站实时监测辐照度示意图;
图6(a)-(d)分别为本发明提供的光伏电站白天辐射、环境温度、组件温度和直流输出示意图;
图7(a)-(d)分别为本发明提供的不同模型预测结果对比。
图8(a)-(d)分别为本发明提供的不同模型的光伏功率预测和测量的散点图。
图9为本发明提供的不同方法模型的NRMSE。
图10为本发明提供的电子设备一种实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例一
提供了基于自编码器深度学习模型的短期光伏功率预测方法,包括:
S1,构建变分自编码器模型VAE;
S2,基于所述变分自编码器模型VAE进行短期光伏功率预测。
作为优选的实施方式,变分自编码器VAE的构建基于深度学习技术,深度学习技术在自动学习嵌入数据的相关特征方面具有良好的能力,可用于预测光伏功率输出。变分自编码器模型(Variational Autoencoders Model-VAE)是一类基于生成的技术,可以有效地以无监督的方式从数据中自动提取信息。VAE 的一个理想特性是它们能够降低输入维数,对于使用随机梯度下降法逼近复杂数据分布非常有效。与传统的自编码器相比,VAE在训练阶段使用调节机制有效解决传统自编码器中的过拟合问题,已证明在处理各种类型的复杂数据方面有效。图1显示了一个VAE的构建示意图。
作为优选的实施方式,所述S1包括:
S11,作为自动编码器的变体,构建所述变分自编码器模型VAE的一个编码器和一个解码器,其中所述编码器用于将给定的观察集X编码到潜在空间Z作为分布q(z|x)。与观察集的维度相比,潜在(称为隐藏)空间维度减少。事实上,编码器的构建是为了有效地将观察到的集合压缩到这个减少的维度空间。然后,使用学习到的概率分布,通过z~q(z|x)生成样本。另一方面,解码器p(x|z) 的主要目的在于根据输入z生成观测值x。需要强调的是,使用解码器重建数据会导致一些重建偏差,在VAE模型的训练阶段,通过最小化观察集和编码-解码集之间的偏差来最小化该误差。
S12,通过近似后验qθ(z|x)得到所述编码器,通过似然pφ(x|z)得到所述解码器,其中θ和φ分别为编码器和解码器的参数,并构建了一个神经网络来学习编码器和解码器的参数θ和φ。本质上,VAE编码器的作用是根据收集的传感器数据学习潜在变量z,解码器使用学习到的潜在变量z来恢复输入数据。重构数据与输入数据的偏差应尽可能接近于零。值得注意的是,从编码器学习到的潜在变量z用于基于输入数据的特征提取。其中,所述编码器输出的维数小于原始数据的维数。所述编码器是通过训练包含编码器和解码器的整个VAE 来训练的。
S13,构建并计算损失函数,以训练VAE的特征提取,包括:假设 Xt=[x1t,x2t,...,xNt]是VAE在时间点t的输入数据,X是使用VAE模型重建的数据。假设最大化参数的边际似然学习表示为:
logpφ(x′)=DKL[qθ(z|x)||pφ(x)]+L(θ,φ;x) (1)
其中DKL[.]表示Kullback-Leibler散度,L表示编码器和解码器参数(即θ和φ)的似然性。VAE的损失函数由两部分组成:重建损失和正则化器。重建损失试图获得有效的编码-解码过程。相比之下,正则化器部分允许对潜在空间构造进行正则化,以尽可能接近前缀分布(例如,正态分布)来逼近编码器外的分布。图2展示了计算损失函数的计算过程。
式(2)允许增强解码器学习数据重建的能力。较高的重建损失值意味着执行的重建不合适,而较低的值意味着模型正在收敛。使用Kulback-Leibler(KL) 散度报告正则化器,该散度将编码器函数(qθ(z|x))和潜在变量先验 (z,|pφ(z))的分布分开。实际上,KL用于计算分隔两个给定概率分布的距离。梯度下降法用于在训练阶段最小化编码器参数和解码器损失函数。总体而言,尽可能最小化损失函数以确保获得规则的潜在空间z,并使用z~pφ(z)对新观察进行充分采样。
假设pφ(z)=N(z;0,I),则qθ(z|x)可写为:
logqθ(z|x)=logN(z;μ,σ2I) (3)
S14,通过使用训练观测值最小化损失函数L(θ,φ)来获得编码器和解码器的参数。重构误差项可以表示为以下形式:
作为优选的实施方式,所述S2包括:
S21,进行数据预处理,包括:
(1)当使用RNN模型处理一些大值数据时,可能会发生梯度爆炸并对RNN 的性能产生负面影响,会降低RNN的学习效率。为了解决这个问题,整体上对输入数据通过min-max进行归一化,然后用于构建深度学习模型,归一化后允许在不考虑光伏设施规模的情况下比较预测性能。原始测量值y的归一化定义为:
其中ymin和ymax分别为光伏电站的输出功率数据的最小值和最大值。在获得预测输出后,我们应用了反向操作来确保预测数据与原始光伏功率时间序列数据匹配。
(2)由于光伏电站功率与天气条件的高度相关性,功率输出曲线显示高度的可变性和波动性。为了减轻不确定性对光伏功率预测准确性的影响,采用一个深度学习框架来预测光伏功率输出时间序列。从本质上讲,深度学习模型是从复杂数据集中学习相关特征和处理非线性的有效工具。
预测程序的整体结构如图3所示,S22,采用预测程序进行太阳能功率初步预测,分训练过程和预报过程两个阶段完成。其中,原始功率数据被拆分为训练子数据和测试子数据。对原始功率数据进行标准化以构建用于预报的深度学习模型,采用Adam优化器通过基于训练数据最小化损失函数来选择深度学习模型的参数值深度学习模型的质量使用若干统计指标进行量化,包括决定系数(R2)、解释方差(EV)、平均绝对误差(MAE)、均方根误差(RMSE)和标准均方根误差 (NRMSE)。深度学习驱动的预测方法学习隐藏在光伏功率输出数据中的时间相关性,并有望揭示和捕获光伏功率时间序列中的序列特征。
作为优选的实施方式,还包括对深度学习模型进行测量评价,包括:使用 R2、RMSE、MAE、EV和NRMSE 5种指标评估深度学习模型性能,计算公式如(7) ~(11)。
式中yt是实际值,y^t是相应的估计值,ym是测得的功率数据点的平均值, n是测量次数。与使用依赖于测量值范围的RMSE不同,使用NRMSE作为统计指标的好处是它不依赖于测量值的范围。NRMSE指标反应预测模型响应与测量数据的匹配程度,NRMSE值为100%表示完美的预测,较低的值表示预测性能不佳。较低的RMSE和MAE值以及EV和R2越接近1说明预测性能越高。
(1)第一阶段,训练过程
使用的模型大体可分为编码器模型和RNN模型两类。数据集首先进行归一化处理,自动编码器模型需要进行数据整形预处理,以将单变量功率时间序列数据转换为二维矩阵,用作自编码器的输入。两类模型在训练阶段的主要区别在于学习方式不同,RNNs为完全受监督训练,而自动编码器首先以无监督的方式预训练,然后基于监督学习完成训练。RNN模型通过使用训练子集作为输入序列(X=x1,...,xk)和输出变量Y=xk+1以监督方式进行训练。
训练基于RNN的模型来学习从输入到输出的映射函数。之后,经过训练的模型用于完成新数据序列的预测。另一方面,逐层无监督加微调应用于VAE。基于自动编码器的光伏功率输出预测是通过降维来实现的,即模型无法发现时间依赖性或模型时间序列数据。对每一层进行逐层无监督学习,进行微调后,改进了专用于预测问题或降维(如自动编码器)的神经网络的特征提取和学习过程。预处理步骤的VAE预测程序如图4所示。
(2)预报过程:基于用于预报的深度学习模型进行短期光伏功率预测。
具体实施例
1、光伏电站数据
在本实施例中,采用来自贵州地区某太阳能光伏电站数据来验证深度学习模型预测方法的性能。光伏电站的实时监测辐照度及实际功率曲线如图5(a) 和图5(b)所示。光伏电站的时间分辨率为15分钟。该电站于2021年7月份全部投产,装机容量50MW,采集的数据时间从2021年8月1日到2020年10月 16日。
图6(a)-(d)描绘了电站某天辐射照度、环境温度、组件表面温度及对应的直流输出。从图中观察到平均辐照度、环境温度、模块温度和直流功率是如何从日出到日落先增加然后减少的。通常,模块温度随着温度和辐照的增加而增加。
2、预测结果分析
基于测试光伏电站功率数据,评估4个学习模型(即SVM、DRNN、ConvLSTM 和VAE)的预测性能。我们首先构建每个以捕获训练数据中的最大方差,然后使用它们来预测未来光伏功率输出的趋势。对于所有模型,我们使用交叉熵作为损失函数,使用Rmsprop作为训练中的优化器。表1为训练模型对应的调整参数。测试数据集85%的数据用于训练,15%的数据用于测试。
表1
光伏电站功率输出的主要特征是其间歇性。准确预测光伏发电量对于保证电网可靠运行和保证电站经济收益至关重要。图7(a)-(d)显示了使用4个模型的预测输出。这些结果说明了深度学习模型在光伏功率预测方面的优势。
为了定量评估4个模型的预测精度,计算了5个性能统计指标,评估指标如表3所示。此外,我们将3学习模型的预测结果与SVM模型进行了比较。 ConvLSTM与其他模型相比在预测精度方面表现不佳,不能很好地跟踪功率的变化,并且没有描述数据中的最大差异。
与其他模型相比,VAE模型统计指标显示,RMSE(1.51)、MAE(1.09)值较低,RMSLE(0.41)值较低,R2值(0.98)最高,EV值接近1,意味着数据中的大部分方差被VAE模型捕获,表明VAE方法用于光伏功率预测具有优越的性能,能够提供准确的预测。
此外,DRNN模型在统计指标(RMSE、RMSE、MAE、EV和NRMSE)方面的性能与VAE略有可比性。基于RNN的模型具有很强的描述时间相关数据的能力,可以比其他方法更好地模拟历史和未来功率输出数据之间的复杂关系。表2表明,VAE和DRNN深度学习模型表现出更好的预测性能。
表2
图8(a)-(d)为各模型预测数据的散点图,可以清楚的看出各模型的实际和预测数据的一致性。由图可以看出,ConvLSTM的预测与测量的功率数据的相关性相对较弱。另一方面,基于DRNN的模型和VAE模型的预测功率与测量的 PV功率密切相关。
图8(a)-(d)和表2中的结果表明,使用基于DRNN的模型和VAE方法提高了预测性能。误差分析结果表明这些模型获得的预测精度可以满足实际需要。应该注意的是,VAE模型是以无监督的方式训练的,这意味着预测仅基于过去数据中的信息。然而,其他模型通过使用训练的子集作为输入序列(x1,..,xk)和输出变量xk以监督方式进行训练,训练基于DRNN的模型来学习从输入到输出。应用经过训练的模型用于预测新数据。即使VAE模型以无监督的方式进行训练,也可以提供与基于DRNN的监督模型相当的预测性能。因此,基于VAE的预测方法是一种更灵活、更强大的工具,可用于实时光伏功率预测。
NRMSE(%)可以量化实际和预测的功率数据时间序列之间的预测质量水平,数值越大,表示预测性能越佳。图9为电站的4种学习模型方法得出的NRMSE(%) 的可视化显示。与ConvLSTM和SVM模型以及基于DRNN的模型相比,VAE模型实现了更好的光伏潮流预测性能。此外,结果表明,VAE模型在捕获具有不同时间分辨率的功率数据中的线性和非线性特征方面是有效的。
3、多步提前功率预测
精确的多步提前预测对于适当管理光伏系统的运行至关重要。基于光伏电站运行数据评估4种方法对光伏功率输出进行多步提前预测的能力。对于时间序列x=[x1,x2,...,xl],计算的单步、两步和多步提前预测分别为xl+1,xl+2, 和xl+n.。两个光伏电站的5、10、15步光伏功率数据提前预测结果如表3所示。
表3
由表3可以看出,除了ConvLSTM,其他模型提前五步、十步、十五步预测都执行了一致合理的预测结果。VAE模型R2值达到0.956、0.926、0.921。在绝大情况下,DRNN、ConvLSTM和VAE模型在R2、MAPE和RMSE方面的表现大致相同。对于提前十步预测,所有模型的R2值都开始下降。在提前十五步预测中,观察到SVM和ConvLSTM的预测性能较差。DRNN和VAE模型的整体预测性能令人满意,随着步数的增加,可以保持合理的预测性能来预测太阳能光伏发电量。
根据R2、MAPE和RMSE值判断哪些模型绝对优越是很有挑战性的。研究结果表明,在大多数情况下,DRNN和VAE用于单步和多步提前预测的平均性能略好于其他模型。具有监督学习的RNN和具有无监督学习的VAE都可以准确地进行一步和多步预测。总体而言,VAE深度学习模型提供了一种有效的方法来建模和预测PV功率输出,并且它已成为RNN驱动模型(即RNN、GRU和LSTM)的重要竞争对手。
光伏出力对环境因素依赖性强,具有较高的波动性和间歇性。太阳能功率输出的可靠预测对于能源管理系统的有效运行是必不可少的。本文比较了4种不同模型的学习预测方法。模型分为两类:有监督的深度学习方法,包括DRNN、 SVM和ConvLSTM,以及无监督的方法VAE。并将深度学习方法的性能与SVM学习模型进行了比较。为了有效地管理光伏系统,需要考虑单步和多步提前预测。使用测试光伏电站系统收集的实际数据集对4个模型的预测准确性进行了评估。电站预测结果表明,基于VAE的预测方法能够学习更高级别的特征,其预测性能更佳。
实施例二
基于自编码器深度学习模型的短期光伏功率预测系统,包括:
模型构建模块,用于构建变分自编码器模型VAE;以及
功率预测模块,用于基于所述变分自编码器模型VAE进行短期光伏功率预测。
本发明还提供了一种存储器,存储有多条指令,所述指令用于实现如实施例一所述的方法。
如图10所示,本发明还提供了一种电子设备,包括处理器301和与所述处理器301连接的存储器302,所述存储器302存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如实施例一所述的方法。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.基于自编码器深度学习模型的短期光伏功率预测方法,其特征在于,包括:
S1,构建变分自编码器模型VAE;
S2,基于所述变分自编码器模型VAE进行短期光伏功率预测。
2.根据权利要求1所述的基于自编码器深度学习模型的短期光伏功率预测方法,其特征在于,所述S1包括:
S11,构建所述变分自编码器模型VAE的一个编码器和一个解码器,其中所述编码器用于将给定的观察集X编码到潜在空间Z作为分布q(z|x),与观察集的维度相比,所述潜在空间维度减少;使用学习到的概率分布,通过z~q(z|x)生成样本;
S12,通过近似后验qθ(z|x)得到所述编码器,通过似然pφ(x|z)得到所述解码器,其中θ和φ分别为编码器和解码器的参数,并构建了一个神经网络来学习编码器和解码器的参数θ和φ;所述编码器输出的维数小于原始数据的维数;所述编码器是通过训练包含编码器和解码器的整个VAE来训练;
S13,构建并计算损失函数,以训练VAE的特征提取;
S14,通过使用训练观测值最小化损失函数L(θ,φ)来获得编码器和解码器的参数。
3.根据权利要求2所述的基于自编码器深度学习模型的短期光伏功率预测方法,其特征在于,所述S13包括:假设Xt=[x1t,x2t,...,xNt]是VAE在时间点t的输入数据,X是使用VAE模型重建的数据;假设最大化参数的边际似然学习表示为:
log pφ(x′)=DKL[qθ(z|x)||pφ(x)]+L(θ,φ;x) (1)
其中DKL[.]表示Kullback-Leibler散度,L表示编码器和解码器参数(即θ和φ)的似然性;VAE的损失函数由两部分组成:重建损失和正则化器;重建损失获得有效的编码-解码过程;正则化器部分允许对潜在空间构造进行正则化,以尽可能接近前缀分布来逼近编码器外的分布;
式(2)允许增强解码器学习数据重建的能力;使用Kulback-Leibler(KL)散度报告正则化器,该散度将编码器函数(qθ(z|x))和潜在变量先验(z,|pφ(z))的分布分开;KL用于计算分隔两个给定概率分布的距离;梯度下降法用于在训练阶段最小化编码器参数和解码器损失函数;最小化损失函数以确保获得规则的潜在空间z,并使用z~pφ(z)对新观察进行充分采样;
假设pφ(z)=N(z;0,I),则qθ(z|x)可写为:
log qθ(z|x)=logN(z;μ,σ2I) (3)。
5.根据权利要求4所述的基于自编码器深度学习模型的短期光伏功率预测方法,其特征在于,所述S2包括:
S21,进行数据预处理,包括:
(1)整体上对输入数据通过min-max进行归一化,然后用于构建深度学习模型,归一化后允许在不考虑光伏设施规模的情况下比较预测性能;原始测量值y的归一化定义为:
其中ymin和ymax分别为光伏电站的输出功率数据的最小值和最大值;在获得预测输出后,应用反向操作来确保预测数据与原始光伏功率时间序列数据匹配:
(2)采用深度学习框架来预测光伏功率输出时间序列;
S22,采用预测程序进行太阳能功率初步预测,分训练过程和预报过程两个阶段完成;其中,原始功率数据被拆分为训练子数据和测试子数据;对原始功率数据进行标准化以构建用于预报的深度学习模型。
7.根据权利要求6所述的基于自编码器深度学习模型的短期光伏功率预测方法,其特征在于,所述两个阶段包括:
(1)第一阶段,训练过程
使用的模型分为编码器模型和RNN模型两类;;数据集首先进行归一化处理,自动编码器模型需要进行数据整形预处理,以将单变量功率时间序列数据转换为二维矩阵,用作自编码器的输入;训练基于RNN的模型来学习从输入到输出的映射函数;,经过训练的模型用于完成新数据序列的预测;逐层无监督加微调应用于VAE;基于自动编码器的光伏功率输出预测通过降维实现,模型无法发现时间依赖性或模型时间序列数据;对每一层进行逐层无监督学习,进行微调后,改进专用于预测问题或降维的神经网络的特征提取和学习过程;
(2)预报过程:基于用于预报的深度学习模型进行短期光伏功率预测。
8.基于自编码器深度学习模型的短期光伏功率预测系统,用于实现如权利要求1-7任一所述的预测方法,其特征在于,包括:
模型构建模块,用于构建变分自编码器模型VAE;以及
功率预测模块,用于基于所述变分自编码器模型VAE进行短期光伏功率预测。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述处理器用于读取所述指令并执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述多条指令可被处理器读取并执行如权利要求1至7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210146567.4A CN114676622A (zh) | 2022-02-17 | 2022-02-17 | 基于自编码器深度学习模型的短期光伏功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210146567.4A CN114676622A (zh) | 2022-02-17 | 2022-02-17 | 基于自编码器深度学习模型的短期光伏功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114676622A true CN114676622A (zh) | 2022-06-28 |
Family
ID=82071758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210146567.4A Pending CN114676622A (zh) | 2022-02-17 | 2022-02-17 | 基于自编码器深度学习模型的短期光伏功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114676622A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879569A (zh) * | 2023-03-08 | 2023-03-31 | 齐鲁工业大学(山东省科学院) | 一种IoT观测数据的在线学习方法及系统 |
CN117692346A (zh) * | 2024-01-31 | 2024-03-12 | 浙商银行股份有限公司 | 基于谱正则化变分自编码器的消息阻塞预测方法及装置 |
-
2022
- 2022-02-17 CN CN202210146567.4A patent/CN114676622A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879569A (zh) * | 2023-03-08 | 2023-03-31 | 齐鲁工业大学(山东省科学院) | 一种IoT观测数据的在线学习方法及系统 |
CN117692346A (zh) * | 2024-01-31 | 2024-03-12 | 浙商银行股份有限公司 | 基于谱正则化变分自编码器的消息阻塞预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | A hybrid attention-based deep learning approach for wind power prediction | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
Jebli et al. | Deep learning based models for solar energy prediction | |
Berrezzek et al. | Efficient Wind Speed Forecasting Using Discrete Wavelet Transform and Artificial Neural Networks. | |
CN112434848B (zh) | 基于深度信念网络的非线性加权组合风电功率预测方法 | |
CN114676622A (zh) | 基于自编码器深度学习模型的短期光伏功率预测方法 | |
CN111144644B (zh) | 基于变分异方差高斯过程回归的短期风速预测方法 | |
CN113222289B (zh) | 一种基于数据处理的能源功率的预测方法 | |
CN110717610B (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN111241755A (zh) | 电力负荷预测方法 | |
CN112862630A (zh) | 基于天气类型指数区间的光伏功率预测方法、终端及介质 | |
CN115688579A (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
CN115860177A (zh) | 基于组合式机器学习模型光伏发电功率预测方法及其应用 | |
Miraftabzadeh et al. | High-resolution PV power prediction model based on the deep learning and attention mechanism | |
CN112163689A (zh) | 基于深度Attention-LSTM的短期负荷分位点概率预测方法 | |
CN111222689A (zh) | 基于多尺度时间特征的lstm负荷预测方法、介质及电子装置 | |
CN116341613A (zh) | 一种基于Informer encoder和LSTM的超短期光伏功率预测方法 | |
CN112803398A (zh) | 基于经验模态分解和深度神经网络的负荷预测方法及系统 | |
Wang et al. | Hybrid deep learning model for short-term wind speed forecasting based on time series decomposition and gated recurrent unit | |
CN115840893A (zh) | 一种多变量时间序列预测方法及装置 | |
CN116975645A (zh) | 一种基于vae-mrcnn的工业过程软测量建模方法 | |
CN116050621A (zh) | 一种集成提升模式的多头自注意力海上风电超短时功率预测方法 | |
CN114154684A (zh) | 基于数据挖掘和多核支持向量机的短期光伏功率预测方法 | |
Bommidi et al. | A hybrid approach to ultra short-term wind speed prediction using CEEMDAN and Informer | |
CN116885699A (zh) | 基于双重注意力机制的电力负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |