发明内容
本发明的目的是针对上述问题,深入挖掘空间多维风电功率的内在规律,提供一种独特的降维编码-特征预测-重构解码的预测框架,使得多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一得以实现。在堆叠自编码器的多级编码器设计中,分别引入稀疏化、独立性和约束性技术,充分解析多维风电功率间的非线性关系,保证降维特征的独立性和重构结果的合理性,有效提高多风电场功率预测的精度与效率。
本发明的技术方案是基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,先后利用独立稀疏堆叠自编码器ISSAE1、ISSAE2对空间多维风电功率数据集、预测功率的影响因素降维,对降维后的功率特征独立并行预测,再对低维预测数据进行解码重构,得到各风电场的功率预测结果,所述风电场超短期功率预测方法包括以下步骤,
步骤1:采集多座风电场多个时刻的历史功率观测数据集;
步骤2:利用独立稀疏堆叠自编码器ISSAE1对步骤1得到的空间多维风电功率数据集进行降维,得到降维的历史特征数据,再结合气象信息,共同作为预测功率的影响因素,利用独立稀疏堆叠自编码器ISSAE2对预测功率的影响因素进一步降维得到低维特征;
步骤3:从步骤2得到的低维特征中选出独立特征,并利用具有动态映射能力的神经网络进行预测,得到风电场功率的低维预测数据;
步骤4:利用独立稀疏堆叠自编码器ISSAE1的解码器对步骤3得到的低维预测数据进行解码重构,得到各风电场的功率预测结果。
优选地,独立稀疏堆叠自编码器ISSAE1包括升维编码器AE1、降维编码器AE2;独立稀疏堆叠自编码器ISSAE2与独立稀疏堆叠自编码器ISSAE1的结构相同。
优选地,步骤3的神经网络为Elman神经网络。
进一步地,步骤2包括以下子步骤:
步骤2.1:输入m座风电场N个时刻的历史功率观测样本集PN×m=[P1,P2,…,Pm]N,其中P1,P2,…,Pm分别表示1,2,…,N观测时刻对应的m维风电功率样本向量;
步骤2.2:采用独立稀疏堆叠自编码器ISSAE1对历史功率观测样本集进行降维编码;
步骤2.2.1:针对空间多维风电功率数据矩阵P
N×m,通过升维编码器AE
1非线性映射到M维高维空间的
后,再通过降维编码器AE
2提取r维的低维特征
其中M>>m,r<<m;步骤2.2.2:初步选择影响功率预测的影响因素,进一步提取独立特征,以第i维功率特征
预测为例,i∈{1,2,...,r},选取预测时刻前h相关时刻的历史数据
和预测时刻的气象信息S共同作为功率预测的影响因素,组成第i维功率特征
预测模型的初选输入变量:
Zi={FHi,S}={z1,z2,...,zJ}i (1)
式中J表示影响因素的数量;
对初选输入变量Zi采用独立稀疏堆叠自编码器ISSAE2来提取J'维的低维特征:
Z′i={z′1,z′2,...,z′J′}i (2)
式中J'表示独立特征的数量,J'<<J。
进一步地,步骤3包括以下子步骤:
步骤3.1:分别计算各个低维特征与
之间的最大互信息相关系数;按最大互信息相关系数由大到小的顺序优选出与
相关性最强的前J″个特征组成
预测模型的输入Z″
i={z″
1,z″
2,...,z″
J″}
i,其中J″表示强影响因素特征的数量;
变量X和Y之间的最大互信息相关系数的计算公式为:
式中ρXY表示变量X和Y之间的相关系数;Cov(X,Y)表示变量X和Y之间的协方差;D(X)表示变量X的方差;D(Y)表示变量Y的方差;EX、EY分别表示变量X、Y的期望值;I[X;Y]表示变量X和X之间的互信息;CMIC [X,Y]表示变量X和X之间的最大互信息相关系数;p表示概率密度分布函数;a*b<B表示在X和Y坐标上划分的网格总数小于B,B为常数,取样本总量的0.6次方;
步骤3.2:以Z″
i为输入,
为输出建立具有动态映射能力的Elman神经网络,分别对r维功率特征
独立并行预测,预测结果经过重新组合,得到r维功率特征的预测结果
进一步地,对升维编码器AE1采用稀疏化计算来抑制隐含层的神经元状态,并消除提取特征之间的相关性,具体包括:
其中,e∈[1,...,m],j∈[1,...,M],x
e表示第e个输入值,
表示第j维功率特征。在损失函数中引入Kullback-Leible散度惩罚项来保证
不断逼近ρ:
式中
表示平均激活量
与ρ的接近程度,二者越接近,
越小;ρ为接近于零的常数;
2)在降维编码器AE
2的编码过程采用pureline线性激活函数,将
的协方差矩阵特征分解后,提取特征值最大的r个特征向量组成V
r×M作为权重W
1 (2)的初始值;
3)在独立稀疏堆叠自编码器的微调训练损失函数中引入线性无关惩罚项:
式中Ω表示不同维特征之间样本协方差的方均值,用来衡量不同维特征之间的总体线性相关程度;
加入稀疏性及线性无关惩罚后的损失函数为:
式中
表示损失函数;P表示模型输入的空间多维风电功率数据集,
表示测试风电场的功率预测结果,λ表示防止过拟合的正则项,β表示稀疏惩罚项,α表示线性无关惩罚项的权重系数;L表示自编码器的堆叠层数;ω
(l)表示l层所有的参数;M表示隐含层神经元数。
通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数,使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象,具体包括:
1)降维编码过程中将各风电功率归一化到[-1,1]区间;
2)降维编码器AE2中采用satlin饱和线性激活函数解码。
相比现有技术,本发明的有益效果包括:
1)本发明的超短期预测方法对海量的风电数据进行降维编码-特征预测-重构解码,实现了多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一,有利于大规模风电数据实现并网运行,对电网的安全与稳定运行产生积极的影响;
2)本发明的引入稀疏化、独立性和约束性技术的堆叠自编码器,充分解析多维风电功率间的非线性关系,保证降维特征的独立性和重构结果的合理性;
3)本发明的超短期预测方法得到的功率数据在预测精度与预测效率方面优于现有的预测方法。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为自编码器的结构示意图。
图2为堆叠自编码器的结构示意图图。
图3为Elman神经网络的结构示意图。
图4为本发明实施例的风电场超短期功率预测方法的编码、解码示意图。
图5a为本发明实施例的18座风电场多风季预测结果的平均绝对百分比误差对比图。
图5b为本发明实施例的18座风电场少风季预测结果的平均绝对百分比误差对比图。
图6a为本发明实施例的7号风电场多风季不同预测方法的日预测曲线对比图。
图6b为本发明实施例的3号风电场多风季不同预测方法的日预测曲线对比图。
图6c为本发明实施例的1号风电场多风季不同预测方法的日预测曲线对比图。
图7a为本发明实施例的17号风电场少风季不同预测方法的日预测曲线对比图。
图7b为本发明实施例的6号风电场少风季不同预测方法的日预测曲线对比图。
图7c为本发明实施例的9号风电场少风季不同预测方法的日预测曲线对比图。
图8a为本发明实施例的多风季不同预测方法预测结果的XMAPE误差统计值对比图。
图8b为本发明实施例的少风季不同预测方法预测结果的XMAPE误差统计值对比图。
图9a为本发明实施例的SAE提取的各维功率特征之间的MIC对比图。
图9b为本发明实施例的ISSAE提取的各维功率特征之间的MIC对比图。
具体实施方式
如图1所示,基于堆叠自编码器的多风电场短期功率预测框架预测模型中的自编码器(Autoencoder,AE)是一个由输入层、隐含层和输出层组成具有结构对称性的无监督学习神经网络。AE的期望输出
与输入x相同,在训练中利用反向传播算法,以均方误差损失最小为目标训练网络结构的最佳参数,其编码、解码和训练过程可描述如下:
式中F为隐含层输出的特征向量,f与g分别为编码与解码的激活函数,网络参数θ=[W1,W2,b1,b2]为编码和解码过程中的权重和偏置参数集合,N为训练样本个数。隐含层输出F可视为原始数据的特征表达,通过调整隐含层神经元数r,可灵活提取原始数据映射到不同维度空间的特征。
如图2所示,采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测,预测模型中的堆叠自编码器SAE是由两个或多个自编码器AE堆叠而成的深度神经网络,上一层编码器隐含层的输出作为下一层编码器的输入。SAE通过逐层编码,提取数据的深层特征,在处理具有复杂非线性相关性的高维数据时,比只有单隐含层的AE具有更强的特征提取能力。
为避免多层神经网络训练时梯度弥散,SAE通常采用贪婪训练法将训练过程分为预训练和微调两阶段。预训练按照AE1到AEL的顺序进行,上一层AEL通过前向传播计算网络最佳参数W(L)、b(L)以及获得隐含层特征F(L),再以F(L)作为下一层AEL+1的输入,训练得到W(L +1)、b(L+1)和F(L+1),依次向下推进直到训练结束。最后,全部L个AE被堆叠为SAE,根据最深层编码器输出与期望输出之间的误差,进行有监督训练,完成整体网络参数的微调。
如图3所示,基于堆叠自编码器的多风电场短期功率预测框架预测模型中的Elman神经网络是一个由输入层、隐层、承接层和输出层组成的动态递归神经网络。其输入层、隐层和输出层的连接类似于前馈网络,承接层则用来记忆隐层单元前一时刻的输出值,可以认为是一个有一步迟延的延时算子。它属于带反馈的BP网络,有短期记忆功能。其网络的数学表达式为:
y(t)=g(ω3x(t))
x(t)=f(ω1xc(t)+ω2(u(t-1)))
xc(t)=x(t-1)
式中t表示时间,y表示输出节点向量;x表示中间层节点单元向量;u表示输入向量;xc表示反馈状态向量;ω3表示中间层到输出层连接权值;ω2表示输入层到中间层连接权值;ω1表示承接层到中间层连接权值;g()表示输出神经元的传递函数,是中间层输出的线性组合;f()表示中间层神经元的传递函数。
如图4所示,基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测,具体包括以下步骤:
步骤1:输入m座风电场N个时刻的历史功率观测样本集PN×m=[P1,P2,…,Pm]N,其中P1,P2,…,Pm分别表示1,2,…,N观测时刻对应的m维风电功率样本向量;
步骤2:采用独立稀疏堆叠自编码器ISSAE1对步骤1的空间多维风电功率数据集进行降维编码;
步骤2.1:针对空间多维风电功率数据矩阵P
N×m,通过独立稀疏堆叠自编码器ISSAE
1非线性映射到M维高维空间的
后,再提取r维的独立特征
M>>m,r<<m;
步骤2.2:初步选择影响功率特征的因素,进一步提取独立特征,以第i维功率特征
预测为例,i∈{1,2,...,r},选取预测时刻前h相关时刻的历史数据
和预测时刻的气象信息S等J个潜在影响因素,组成第i维功率特征
预测模型的初选输入变量:
Zi={FHi,S}={z1,z2,...,zJ}i (1)
对初选输入变量Zi采用独立稀疏堆叠自编码器ISSAE2提取J'维(J'<<J)的低维独立特征:
Z′i={z′1,z′2,...,z′J′}i (2)
步骤3:利用神经网络对每个样本时刻的r维功率进行特征预测;
步骤3.1:分别计算各影响因素特征与
之间的最大互信息相关系数MIC。按最大互信息相关系数MIC由大到小的顺序优选出与
相关性最强的前J″个强影响因素特征组成
预测模型的输入Z″
i={z″
1,z″
2,...,z″
J″}
i;
变量X和Y之间的最大互信息相关系数MIC计算公式如下:
式中ρXY表示变量X和Y之间的相关系数;Cov(X,Y)表示变量X和Y之间的协方差;EX、EY分别表示变量X、Y的期望值;D(X)表示变量X的方差;D(Y)表示变量Y的方差;I[X;Y]表示变量X和X之间的互信息;CMIC [X,Y]表示变量X和X之间的最大互信息相关系数;p表示概率密度分布函数;a*b<B表示在X和Y坐标上划分的网格总数小于B,B为常数,实施例中B的取值为样本总量的0.6次方;
步骤3.2:以Z″
i为输入,
为输出,建立具有动态映射能力的Elman神经网络,分别对r维功率特征
独立并行预测,预测结果经过重新组合,得到测试集r维功率特征的预测结果
步骤4:利用独立稀疏堆叠自编码器ISSAE
1训练得到的解码器将低维功率预测特征
分两级解码重构,输出n个测试样本对应的m座风电场的功率预测结果
上述的空间多维风电功率预测中堆叠自编码器利用稀疏化来抑制隐含层的神经元状态,对升维编码器AE
1激活函数的平均激活量进行调整,引入平均激活量
其中,e∈[1,...,m],j∈[1,...,M],x
e表示第e个输入值,
表示第j维功率特征。在损失函数中引入Kullback-Leible散度惩罚项来保证
不断逼近ρ:
式中
表示平均激活量
与ρ的接近程度,二者越接近,
越小;ρ为接近于零的常数;
上述的空间多维风电功率预测中堆叠自编码器,通过消除提取特征之间的相关性来增强特征的独立性,具体过程如下:
1)在降维编码器AE
2的编码过程中采用pureline线性激活函数,将
的协方差矩阵特征分解后提取特征值最大的r个特征向量组成V
r×M作为权重W
1 (2)的初始值。
2)在SAE整体模型参数的微调训练损失函数中引入线性无关惩罚项:
式中Ω是不同维特征之间样本协方差的方均值,用来衡量不同维特征之间的总体线性相关程度。加入稀疏性及线性无关惩罚后的损失函数为:
式中
表示损失函数;P表示模型输入的空间多维风电功率数据集,
表示测试风电场的功率预测结果,λ表示防止过拟合的正则项,β表示稀疏惩罚项,α表示线性无关惩罚项的权重系数;L表示自编码器的堆叠层数;ω
(l)表示l层所有的参数;M表示隐含层神经元数;
上述的空间多维风电功率预测中堆叠自编码器,将各风电功率归一化到[-1,1]区间,在降维编码器AE2中采用satlin饱和线性激活函数解码来对数据进行限制约束。
图5a、5b所示为实施例的18座风电场六种预测模型在多风季、少风季的日预测曲线与实际曲线的平均绝对百分误差(mean absolute percentage error,MAPE),计算公式如下:
式中XMAPE表示平均绝对百分误差,xi'表示风电场i的预测功率,xi表示风电场i的原始功率,xN表示对应风电场的额定功率,N为测试样本个数。
图6a所示为多风季预测误差较大的7号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6b所示为多风季预测误差中等的3号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6c所示为多风季预测误差小的1号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。
图7a所示为少风季预测误差较大的17号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7b所示为少风季预测误差中等的6号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7c所示为少风季预测误差小的9号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。其中,AE-Elman模型表示自编码器AE与Elman网络相结合用于风电功率预测,SAE-Elman模型表示堆叠自编码器SAE与Elman网络相结合用于风电功率预测,PCA-Elman模型表示主成分分析法PCA与Elman网络相结合用于风电功率预测。
本发明方法在多风季、少风季均可得到最佳的预测精度,由此可见,与Elman网络直接用于风电功率预测的方法相比,本发明方法有效提高了预测精度和计算效率。而从图6a、6b、6c可以看出,当风电场实际功率为0或者额定输出的时段,PCA-Elman和AE-Elman预测结果可能为负或超出额定出力。而本发明方法通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数,使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象,使得预测结果更贴近实际功率数据。
综上,利用本发明提出的多维风电功率的降维-预测-重构框架,采用基于深度学习的独立稀疏堆叠自编码器降维,相对于PCA、AE等常规降维方法,可显著降低多风电场功率预测的平均误差和最大误差。
图8a所示为多风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的XMAPE误差统计值。图8b所示为少风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的XMAPE误差统计值。由图8a、8b可见,相比分别去掉稀疏性、独立性、归一化这3种情况,多风季本发明方法的平均XMAPE分别下降了4.7%、5.2%、4.5%,本发明方法的平均XMAPE相比SAE-Elman下降了4.1%,相比这些方法,本发明方法的最小XMAPE下降了2.4~3.6%,最大XMAPE下降了3.3~6.8%。由图8b可见,相比这些方法,少风季本发明方法的平均XMAPE分别下降了2.4%、5.3%、3.4%和2.2%,最小XMAPE下降了2.8~4.8%,最大XMAPE下降了1.3~5.6%。
图9a、9b所示为SAE-Elman、本发明方法提取的各维功率特征之间的最大互信息相关系数MIC,可以发现本发明方法功率特征之间的最大互信息相关系数低于SAE-Elman,表明引入了稀疏化和独立性技术后的独立稀疏堆叠自编码器降维方法可更好保证提取特征的独立性。