CN112861992B

CN112861992B - 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法

Info

Publication number: CN112861992B
Application number: CN202110256120.8A
Authority: CN
Inventors: 李丹; 杨帆; 杨保华; 张远航; 李振兴; 刘颂凯; 缪书唯; 王奇; 甘月琳; 章可; 谭雅; 孙光帆
Original assignee: China Three Gorges University CTGU
Current assignee: China Three Gorges University CTGU
Priority date: 2021-03-09
Filing date: 2021-03-09
Publication date: 2022-09-02
Anticipated expiration: 2041-03-09
Also published as: CN112861992A

Abstract

本发明公开了基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，包括：采集多座风电场多个时刻的历史功率观测数据集；对空间多维风电功率数据集进行降维，得到降维的历史特征数据，再结合气象信息，共同作为预测功率的影响因素，对预测功率的影响因素进一步降维得到低维特征；从低维特征中选出独立特征，并利用具有动态映射能力的神经网络进行预测，得到风电场功率的低维预测数据；对低维预测数据进行解码重构，得到各风电场的功率预测结果。本发明的方法在不增加预测变量维数情况下使得预测精度得以提高，相对于常规降维方法，显著降低了误差；本发明通过充分解析多维风电功率间的非线性关系，进一步提高了功率预测的精度。

Description

基于独立稀疏堆叠自编码器的风电场超短期功率预测方法

技术领域

本发明属于可再生能源发电与综合消纳领域，具体涉及一种基于独立稀疏堆叠自编码器的风电场超短期功率预测方法。

背景技术

风能作为一种清洁、低成本和技术成熟的可再生能源，已成为目前开发规模最大的新能源发电形式。然而，由于风能具有的强随机性和波动性，大量风电接入电网势必会对电网安全与稳定运行带来严峻挑战。当前，有众多学者以风电大规模并网对电网安全运行的影响为对象开展研究，提出了多种确定和不确定性风电超短期预测方法，为缓解大规模风电接入与系统稳定运行之间的矛盾、提高风能消纳能力，发挥了重要作用。随着集中式、大规模开发成为我国风电产业未来发展的新趋势，利用海量风电数据信息，深度挖掘不同时空分布下风电数据的内在规律，成为改善风电预测精度一个新的重要手段。多风电场超短期预测的难点在于，风电场数量和潜在影响因素过多导致预测模型庞大且复杂度很高。引入深度学习技术可以提取空间多维功率和潜在影响因素的内在独立特征，构建更独立和精准的预测模型。目前，被应用于电力系统预测的深度学习方法主要包括：深度置信网络(deep belief networks，DBN)，卷积神经网络(convolutional neural network，CNN)，深度长短期记忆神经网络(deep long short-term memory，LSTM)以及堆叠自编码神经网络(stacked autoencoder，SAE)。这些深度学习方法在电力系统预测方面有一定的优势，但它们多针对周期性更强的负荷数据或者单个风电场功率开展预测，对于多风电场功率预测，还鲜有研究。

因此，研究空间多维风电功率超短期功率预测方法，依据风电数据本身的特性，实现多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一，提出一种独立稀疏堆叠自编码的预测框架实现多风电场超短期功率预测。

发明内容

本发明的目的是针对上述问题，深入挖掘空间多维风电功率的内在规律，提供一种独特的降维编码-特征预测-重构解码的预测框架，使得多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一得以实现。在堆叠自编码器的多级编码器设计中，分别引入稀疏化、独立性和约束性技术，充分解析多维风电功率间的非线性关系，保证降维特征的独立性和重构结果的合理性，有效提高多风电场功率预测的精度与效率。

本发明的技术方案是基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，先后利用独立稀疏堆叠自编码器ISSAE₁、ISSAE₂对空间多维风电功率数据集、预测功率的影响因素降维，对降维后的功率特征独立并行预测，再对低维预测数据进行解码重构，得到各风电场的功率预测结果，所述风电场超短期功率预测方法包括以下步骤，

步骤1：采集多座风电场多个时刻的历史功率观测数据集；

步骤2：利用独立稀疏堆叠自编码器ISSAE₁对步骤1得到的空间多维风电功率数据集进行降维，得到降维的历史特征数据，再结合气象信息，共同作为预测功率的影响因素，利用独立稀疏堆叠自编码器ISSAE₂对预测功率的影响因素进一步降维得到低维特征；

步骤3：从步骤2得到的低维特征中选出独立特征，并利用具有动态映射能力的神经网络进行预测，得到风电场功率的低维预测数据；

步骤4：利用独立稀疏堆叠自编码器ISSAE₁的解码器对步骤3得到的低维预测数据进行解码重构，得到各风电场的功率预测结果。

优选地，独立稀疏堆叠自编码器ISSAE₁包括升维编码器AE₁、降维编码器AE₂；独立稀疏堆叠自编码器ISSAE₂与独立稀疏堆叠自编码器ISSAE₁的结构相同。

优选地，步骤3的神经网络为Elman神经网络。

进一步地，步骤2包括以下子步骤：

步骤2.1：输入m座风电场N个时刻的历史功率观测样本集P_N×m＝[P₁,P₂,…,P_m]_N，其中P₁,P₂,…,P_m分别表示1,2,…,N观测时刻对应的m维风电功率样本向量；

步骤2.2：采用独立稀疏堆叠自编码器ISSAE₁对历史功率观测样本集进行降维编码；

步骤2.2.1：针对空间多维风电功率数据矩阵P_N×m，通过升维编码器AE₁非线性映射到M维高维空间的

后，再通过降维编码器AE₂提取r维的低维特征

其中M>>m，r<<m；步骤2.2.2：初步选择影响功率预测的影响因素，进一步提取独立特征，以第i维功率特征

预测为例，i∈{1,2,...,r}，选取预测时刻前h相关时刻的历史数据

和预测时刻的气象信息S共同作为功率预测的影响因素，组成第i维功率特征

预测模型的初选输入变量：

Z_i＝{FH_i,S}＝{z₁,z₂,...,z_J}_i (1)

式中J表示影响因素的数量；

对初选输入变量Z_i采用独立稀疏堆叠自编码器ISSAE₂来提取J'维的低维特征：

Z′_i＝{z′₁,z′₂,...,z′_J′}_i (2)

式中J'表示独立特征的数量，J'<<J。

进一步地，步骤3包括以下子步骤：

步骤3.1：分别计算各个低维特征与

之间的最大互信息相关系数；按最大互信息相关系数由大到小的顺序优选出与

相关性最强的前J″个特征组成

预测模型的输入Z″_i＝{z″₁,z″₂,...,z″_J″}_i，其中J″表示强影响因素特征的数量；

变量X和Y之间的最大互信息相关系数的计算公式为：

式中ρ_XY表示变量X和Y之间的相关系数；Cov(X,Y)表示变量X和Y之间的协方差；D(X)表示变量X的方差；D(Y)表示变量Y的方差；EX、EY分别表示变量X、Y的期望值；I[X；Y]表示变量X和X之间的互信息；C_MIC ^[X,Y]表示变量X和X之间的最大互信息相关系数；p表示概率密度分布函数；a*b<B表示在X和Y坐标上划分的网格总数小于B，B为常数，取样本总量的0.6次方；

步骤3.2：以Z″_i为输入，

为输出建立具有动态映射能力的Elman神经网络，分别对r维功率特征

独立并行预测，预测结果经过重新组合，得到r维功率特征的预测结果

进一步地，对升维编码器AE₁采用稀疏化计算来抑制隐含层的神经元状态，并消除提取特征之间的相关性，具体包括：

1)引入平均激活量

其中，e∈[1,...,m]，j∈[1,...,M]，x_e表示第e个输入值，

表示第j维功率特征。在损失函数中引入Kullback-Leible散度惩罚项来保证

不断逼近ρ：

式中

表示平均激活量

与ρ的接近程度，二者越接近，

越小；ρ为接近于零的常数；

2)在降维编码器AE₂的编码过程采用pureline线性激活函数，将

的协方差矩阵特征分解后，提取特征值最大的r个特征向量组成V_r×M作为权重W₁ ⁽²⁾的初始值；

3)在独立稀疏堆叠自编码器的微调训练损失函数中引入线性无关惩罚项：

式中Ω表示不同维特征之间样本协方差的方均值，用来衡量不同维特征之间的总体线性相关程度；

加入稀疏性及线性无关惩罚后的损失函数为：

式中

表示损失函数；P表示模型输入的空间多维风电功率数据集，

表示测试风电场的功率预测结果，λ表示防止过拟合的正则项，β表示稀疏惩罚项，α表示线性无关惩罚项的权重系数；L表示自编码器的堆叠层数；ω^(l)表示l层所有的参数；M表示隐含层神经元数。

通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数，使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象，具体包括：

1)降维编码过程中将各风电功率归一化到[-1,1]区间；

2)降维编码器AE₂中采用satlin饱和线性激活函数解码。

相比现有技术，本发明的有益效果包括：

1)本发明的超短期预测方法对海量的风电数据进行降维编码-特征预测-重构解码，实现了多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一，有利于大规模风电数据实现并网运行，对电网的安全与稳定运行产生积极的影响；

2)本发明的引入稀疏化、独立性和约束性技术的堆叠自编码器，充分解析多维风电功率间的非线性关系，保证降维特征的独立性和重构结果的合理性；

3)本发明的超短期预测方法得到的功率数据在预测精度与预测效率方面优于现有的预测方法。

附图说明

下面结合附图和实施例对本发明作进一步说明。

图1为自编码器的结构示意图。

图2为堆叠自编码器的结构示意图图。

图3为Elman神经网络的结构示意图。

图4为本发明实施例的风电场超短期功率预测方法的编码、解码示意图。

图5a为本发明实施例的18座风电场多风季预测结果的平均绝对百分比误差对比图。

图5b为本发明实施例的18座风电场少风季预测结果的平均绝对百分比误差对比图。

图6a为本发明实施例的7号风电场多风季不同预测方法的日预测曲线对比图。

图6b为本发明实施例的3号风电场多风季不同预测方法的日预测曲线对比图。

图6c为本发明实施例的1号风电场多风季不同预测方法的日预测曲线对比图。

图7a为本发明实施例的17号风电场少风季不同预测方法的日预测曲线对比图。

图7b为本发明实施例的6号风电场少风季不同预测方法的日预测曲线对比图。

图7c为本发明实施例的9号风电场少风季不同预测方法的日预测曲线对比图。

图8a为本发明实施例的多风季不同预测方法预测结果的X_MAPE误差统计值对比图。

图8b为本发明实施例的少风季不同预测方法预测结果的X_MAPE误差统计值对比图。

图9a为本发明实施例的SAE提取的各维功率特征之间的MIC对比图。

图9b为本发明实施例的ISSAE提取的各维功率特征之间的MIC对比图。

具体实施方式

如图1所示，基于堆叠自编码器的多风电场短期功率预测框架预测模型中的自编码器(Autoencoder，AE)是一个由输入层、隐含层和输出层组成具有结构对称性的无监督学习神经网络。AE的期望输出

与输入x相同，在训练中利用反向传播算法，以均方误差损失最小为目标训练网络结构的最佳参数，其编码、解码和训练过程可描述如下：

式中F为隐含层输出的特征向量，f与g分别为编码与解码的激活函数，网络参数θ＝[W₁，W₂，b₁，b₂]为编码和解码过程中的权重和偏置参数集合，N为训练样本个数。隐含层输出F可视为原始数据的特征表达，通过调整隐含层神经元数r，可灵活提取原始数据映射到不同维度空间的特征。

如图2所示，采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测，预测模型中的堆叠自编码器SAE是由两个或多个自编码器AE堆叠而成的深度神经网络，上一层编码器隐含层的输出作为下一层编码器的输入。SAE通过逐层编码，提取数据的深层特征，在处理具有复杂非线性相关性的高维数据时，比只有单隐含层的AE具有更强的特征提取能力。

为避免多层神经网络训练时梯度弥散，SAE通常采用贪婪训练法将训练过程分为预训练和微调两阶段。预训练按照AE₁到AE_L的顺序进行，上一层AE_L通过前向传播计算网络最佳参数W^(L)、b^(L)以及获得隐含层特征F^(L)，再以F^(L)作为下一层AE_L+1的输入，训练得到W^(L ⁺¹⁾、b^(L+1)和F^(L+1)，依次向下推进直到训练结束。最后，全部L个AE被堆叠为SAE，根据最深层编码器输出与期望输出之间的误差，进行有监督训练，完成整体网络参数的微调。

如图3所示，基于堆叠自编码器的多风电场短期功率预测框架预测模型中的Elman神经网络是一个由输入层、隐层、承接层和输出层组成的动态递归神经网络。其输入层、隐层和输出层的连接类似于前馈网络，承接层则用来记忆隐层单元前一时刻的输出值，可以认为是一个有一步迟延的延时算子。它属于带反馈的BP网络，有短期记忆功能。其网络的数学表达式为：

y(t)＝g(ω₃x(t))

x(t)＝f(ω₁x_c(t)+ω₂(u(t-1)))

x_c(t)＝x(t-1)

式中t表示时间，y表示输出节点向量；x表示中间层节点单元向量；u表示输入向量；x_c表示反馈状态向量；ω₃表示中间层到输出层连接权值；ω₂表示输入层到中间层连接权值；ω₁表示承接层到中间层连接权值；g()表示输出神经元的传递函数，是中间层输出的线性组合；f()表示中间层神经元的传递函数。

如图4所示，基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测，具体包括以下步骤：

步骤1：输入m座风电场N个时刻的历史功率观测样本集P_N×m＝[P₁,P₂,…,P_m]_N，其中P₁,P₂,…,P_m分别表示1,2,…,N观测时刻对应的m维风电功率样本向量；

步骤2：采用独立稀疏堆叠自编码器ISSAE₁对步骤1的空间多维风电功率数据集进行降维编码；

步骤2.1：针对空间多维风电功率数据矩阵P_N×m，通过独立稀疏堆叠自编码器ISSAE₁非线性映射到M维高维空间的

后，再提取r维的独立特征

M>>m，r<<m；

步骤2.2：初步选择影响功率特征的因素，进一步提取独立特征，以第i维功率特征

和预测时刻的气象信息S等J个潜在影响因素，组成第i维功率特征

预测模型的初选输入变量：

Z_i＝{FH_i,S}＝{z₁,z₂,...,z_J}_i (1)

对初选输入变量Z_i采用独立稀疏堆叠自编码器ISSAE₂提取J'维(J'<<J)的低维独立特征：

Z′_i＝{z′₁,z′₂,...,z′_J′}_i (2)

步骤3：利用神经网络对每个样本时刻的r维功率进行特征预测；

步骤3.1：分别计算各影响因素特征与

之间的最大互信息相关系数MIC。按最大互信息相关系数MIC由大到小的顺序优选出与

相关性最强的前J″个强影响因素特征组成

预测模型的输入Z″_i＝{z″₁,z″₂,...,z″_J″}_i；

变量X和Y之间的最大互信息相关系数MIC计算公式如下：

式中ρ_XY表示变量X和Y之间的相关系数；Cov(X,Y)表示变量X和Y之间的协方差；EX、EY分别表示变量X、Y的期望值；D(X)表示变量X的方差；D(Y)表示变量Y的方差；I[X；Y]表示变量X和X之间的互信息；C_MIC ^[X,Y]表示变量X和X之间的最大互信息相关系数；p表示概率密度分布函数；a*b<B表示在X和Y坐标上划分的网格总数小于B，B为常数，实施例中B的取值为样本总量的0.6次方；

步骤3.2：以Z″_i为输入，

为输出，建立具有动态映射能力的Elman神经网络，分别对r维功率特征

独立并行预测，预测结果经过重新组合，得到测试集r维功率特征的预测结果

步骤4：利用独立稀疏堆叠自编码器ISSAE₁训练得到的解码器将低维功率预测特征

分两级解码重构，输出n个测试样本对应的m座风电场的功率预测结果

上述的空间多维风电功率预测中堆叠自编码器利用稀疏化来抑制隐含层的神经元状态，对升维编码器AE₁激活函数的平均激活量进行调整，引入平均激活量

其中，e∈[1,...,m]，j∈[1,...,M]，x_e表示第e个输入值，

不断逼近ρ：

式中

表示平均激活量

与ρ的接近程度，二者越接近，

越小；ρ为接近于零的常数；

上述的空间多维风电功率预测中堆叠自编码器，通过消除提取特征之间的相关性来增强特征的独立性，具体过程如下：

1)在降维编码器AE₂的编码过程中采用pureline线性激活函数，将

的协方差矩阵特征分解后提取特征值最大的r个特征向量组成V_r×M作为权重W₁ ⁽²⁾的初始值。

2)在SAE整体模型参数的微调训练损失函数中引入线性无关惩罚项：

式中Ω是不同维特征之间样本协方差的方均值，用来衡量不同维特征之间的总体线性相关程度。加入稀疏性及线性无关惩罚后的损失函数为：

式中

表示损失函数；P表示模型输入的空间多维风电功率数据集，

表示测试风电场的功率预测结果，λ表示防止过拟合的正则项，β表示稀疏惩罚项，α表示线性无关惩罚项的权重系数；L表示自编码器的堆叠层数；ω^(l)表示l层所有的参数；M表示隐含层神经元数；

上述的空间多维风电功率预测中堆叠自编码器，将各风电功率归一化到[-1,1]区间，在降维编码器AE₂中采用satlin饱和线性激活函数解码来对数据进行限制约束。

图5a、5b所示为实施例的18座风电场六种预测模型在多风季、少风季的日预测曲线与实际曲线的平均绝对百分误差(mean absolute percentage error,MAPE)，计算公式如下：

式中X_MAPE表示平均绝对百分误差，x_i'表示风电场i的预测功率，x_i表示风电场i的原始功率，x_N表示对应风电场的额定功率，N为测试样本个数。

图6a所示为多风季预测误差较大的7号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6b所示为多风季预测误差中等的3号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6c所示为多风季预测误差小的1号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。

图7a所示为少风季预测误差较大的17号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7b所示为少风季预测误差中等的6号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7c所示为少风季预测误差小的9号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。其中，AE-Elman模型表示自编码器AE与Elman网络相结合用于风电功率预测，SAE-Elman模型表示堆叠自编码器SAE与Elman网络相结合用于风电功率预测，PCA-Elman模型表示主成分分析法PCA与Elman网络相结合用于风电功率预测。

本发明方法在多风季、少风季均可得到最佳的预测精度，由此可见，与Elman网络直接用于风电功率预测的方法相比，本发明方法有效提高了预测精度和计算效率。而从图6a、6b、6c可以看出，当风电场实际功率为0或者额定输出的时段，PCA-Elman和AE-Elman预测结果可能为负或超出额定出力。而本发明方法通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数，使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象，使得预测结果更贴近实际功率数据。

综上，利用本发明提出的多维风电功率的降维-预测-重构框架，采用基于深度学习的独立稀疏堆叠自编码器降维，相对于PCA、AE等常规降维方法，可显著降低多风电场功率预测的平均误差和最大误差。

图8a所示为多风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的X_MAPE误差统计值。图8b所示为少风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的X_MAPE误差统计值。由图8a、8b可见，相比分别去掉稀疏性、独立性、归一化这3种情况，多风季本发明方法的平均X_MAPE分别下降了4.7％、5.2％、4.5％，本发明方法的平均X_MAPE相比SAE-Elman下降了4.1％，相比这些方法，本发明方法的最小X_MAPE下降了2.4～3.6％，最大X_MAPE下降了3.3～6.8％。由图8b可见，相比这些方法，少风季本发明方法的平均X_MAPE分别下降了2.4％、5.3％、3.4％和2.2％，最小X_MAPE下降了2.8～4.8％，最大X_MAPE下降了1.3～5.6％。

图9a、9b所示为SAE-Elman、本发明方法提取的各维功率特征之间的最大互信息相关系数MIC，可以发现本发明方法功率特征之间的最大互信息相关系数低于SAE-Elman，表明引入了稀疏化和独立性技术后的独立稀疏堆叠自编码器降维方法可更好保证提取特征的独立性。

Claims

1.基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，其特征在于，先后利用独立稀疏堆叠自编码器ISSAE1、ISSAE2对空间多维风电功率数据集、预测功率的影响因素降维，对降维后的功率特征独立并行预测，再对低维预测数据进行解码重构，得到各风电场的功率预测结果，所述风电场超短期功率预测方法包括以下步骤，

步骤1：采集多座风电场多个时刻的历史功率观测数据集；

步骤2：利用第一独立稀疏堆叠自编码器ISSAE1对步骤1得到的空间多维风电功率数据集进行降维，得到降维的历史特征数据，再结合气象信息，共同作为预测功率的影响因素，利用第二独立稀疏堆叠自编码器ISSAE2对预测功率的影响因素进一步降维得到低维特征；

步骤4：利用第一独立稀疏堆叠自编码器ISSAE1的解码器对步骤3得到的低维预测数据进行解码重构，得到各风电场的功率预测结果；

第一独立稀疏堆叠自编码器ISSAE1包括升维编码器AE₁、降维编码器AE₂。

2.根据权利要求1所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，其特征在于，步骤3的神经网络为Elman神经网络。

3.根据权利要求2所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法，其特征在于，步骤2包括以下子步骤：

步骤2.2：采用第一独立稀疏堆叠自编码器ISSAE1对历史功率观测样本集进行降维编码；