CN112861992B - 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法 - Google Patents

基于独立稀疏堆叠自编码器的风电场超短期功率预测方法 Download PDF

Info

Publication number
CN112861992B
CN112861992B CN202110256120.8A CN202110256120A CN112861992B CN 112861992 B CN112861992 B CN 112861992B CN 202110256120 A CN202110256120 A CN 202110256120A CN 112861992 B CN112861992 B CN 112861992B
Authority
CN
China
Prior art keywords
power
prediction
dimensional
encoder
wind power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110256120.8A
Other languages
English (en)
Other versions
CN112861992A (zh
Inventor
李丹
杨帆
杨保华
张远航
李振兴
刘颂凯
缪书唯
王奇
甘月琳
章可
谭雅
孙光帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN202110256120.8A priority Critical patent/CN112861992B/zh
Publication of CN112861992A publication Critical patent/CN112861992A/zh
Application granted granted Critical
Publication of CN112861992B publication Critical patent/CN112861992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,包括:采集多座风电场多个时刻的历史功率观测数据集;对空间多维风电功率数据集进行降维,得到降维的历史特征数据,再结合气象信息,共同作为预测功率的影响因素,对预测功率的影响因素进一步降维得到低维特征;从低维特征中选出独立特征,并利用具有动态映射能力的神经网络进行预测,得到风电场功率的低维预测数据;对低维预测数据进行解码重构,得到各风电场的功率预测结果。本发明的方法在不增加预测变量维数情况下使得预测精度得以提高,相对于常规降维方法,显著降低了误差;本发明通过充分解析多维风电功率间的非线性关系,进一步提高了功率预测的精度。

Description

基于独立稀疏堆叠自编码器的风电场超短期功率预测方法
技术领域
本发明属于可再生能源发电与综合消纳领域,具体涉及一种基于独立稀疏堆叠自编码器的风电场超短期功率预测方法。
背景技术
风能作为一种清洁、低成本和技术成熟的可再生能源,已成为目前开发规模最大的新能源发电形式。然而,由于风能具有的强随机性和波动性,大量风电接入电网势必会对电网安全与稳定运行带来严峻挑战。当前,有众多学者以风电大规模并网对电网安全运行的影响为对象开展研究,提出了多种确定和不确定性风电超短期预测方法,为缓解大规模风电接入与系统稳定运行之间的矛盾、提高风能消纳能力,发挥了重要作用。随着集中式、大规模开发成为我国风电产业未来发展的新趋势,利用海量风电数据信息,深度挖掘不同时空分布下风电数据的内在规律,成为改善风电预测精度一个新的重要手段。多风电场超短期预测的难点在于,风电场数量和潜在影响因素过多导致预测模型庞大且复杂度很高。引入深度学习技术可以提取空间多维功率和潜在影响因素的内在独立特征,构建更独立和精准的预测模型。目前,被应用于电力系统预测的深度学习方法主要包括:深度置信网络(deep belief networks,DBN),卷积神经网络(convolutional neural network,CNN),深度长短期记忆神经网络(deep long short-term memory,LSTM)以及堆叠自编码神经网络(stacked autoencoder,SAE)。这些深度学习方法在电力系统预测方面有一定的优势,但它们多针对周期性更强的负荷数据或者单个风电场功率开展预测,对于多风电场功率预测,还鲜有研究。
因此,研究空间多维风电功率超短期功率预测方法,依据风电数据本身的特性,实现多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一,提出一种独立稀疏堆叠自编码的预测框架实现多风电场超短期功率预测。
发明内容
本发明的目的是针对上述问题,深入挖掘空间多维风电功率的内在规律,提供一种独特的降维编码-特征预测-重构解码的预测框架,使得多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一得以实现。在堆叠自编码器的多级编码器设计中,分别引入稀疏化、独立性和约束性技术,充分解析多维风电功率间的非线性关系,保证降维特征的独立性和重构结果的合理性,有效提高多风电场功率预测的精度与效率。
本发明的技术方案是基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,先后利用独立稀疏堆叠自编码器ISSAE1、ISSAE2对空间多维风电功率数据集、预测功率的影响因素降维,对降维后的功率特征独立并行预测,再对低维预测数据进行解码重构,得到各风电场的功率预测结果,所述风电场超短期功率预测方法包括以下步骤,
步骤1:采集多座风电场多个时刻的历史功率观测数据集;
步骤2:利用独立稀疏堆叠自编码器ISSAE1对步骤1得到的空间多维风电功率数据集进行降维,得到降维的历史特征数据,再结合气象信息,共同作为预测功率的影响因素,利用独立稀疏堆叠自编码器ISSAE2对预测功率的影响因素进一步降维得到低维特征;
步骤3:从步骤2得到的低维特征中选出独立特征,并利用具有动态映射能力的神经网络进行预测,得到风电场功率的低维预测数据;
步骤4:利用独立稀疏堆叠自编码器ISSAE1的解码器对步骤3得到的低维预测数据进行解码重构,得到各风电场的功率预测结果。
优选地,独立稀疏堆叠自编码器ISSAE1包括升维编码器AE1、降维编码器AE2;独立稀疏堆叠自编码器ISSAE2与独立稀疏堆叠自编码器ISSAE1的结构相同。
优选地,步骤3的神经网络为Elman神经网络。
进一步地,步骤2包括以下子步骤:
步骤2.1:输入m座风电场N个时刻的历史功率观测样本集PN×m=[P1,P2,…,Pm]N,其中P1,P2,…,Pm分别表示1,2,…,N观测时刻对应的m维风电功率样本向量;
步骤2.2:采用独立稀疏堆叠自编码器ISSAE1对历史功率观测样本集进行降维编码;
步骤2.2.1:针对空间多维风电功率数据矩阵PN×m,通过升维编码器AE1非线性映射到M维高维空间的
Figure GDA0003619808480000021
后,再通过降维编码器AE2提取r维的低维特征
Figure GDA0003619808480000022
其中M>>m,r<<m;步骤2.2.2:初步选择影响功率预测的影响因素,进一步提取独立特征,以第i维功率特征
Figure GDA0003619808480000023
预测为例,i∈{1,2,...,r},选取预测时刻前h相关时刻的历史数据
Figure GDA0003619808480000024
和预测时刻的气象信息S共同作为功率预测的影响因素,组成第i维功率特征
Figure GDA0003619808480000025
预测模型的初选输入变量:
Zi={FHi,S}={z1,z2,...,zJ}i (1)
式中J表示影响因素的数量;
对初选输入变量Zi采用独立稀疏堆叠自编码器ISSAE2来提取J'维的低维特征:
Z′i={z′1,z′2,...,z′J′}i (2)
式中J'表示独立特征的数量,J'<<J。
进一步地,步骤3包括以下子步骤:
步骤3.1:分别计算各个低维特征与
Figure GDA0003619808480000031
之间的最大互信息相关系数;按最大互信息相关系数由大到小的顺序优选出与
Figure GDA0003619808480000032
相关性最强的前J″个特征组成
Figure GDA0003619808480000033
预测模型的输入Z″i={z″1,z″2,...,z″J″}i,其中J″表示强影响因素特征的数量;
变量X和Y之间的最大互信息相关系数的计算公式为:
Figure GDA0003619808480000034
Figure GDA0003619808480000035
Figure GDA0003619808480000036
式中ρXY表示变量X和Y之间的相关系数;Cov(X,Y)表示变量X和Y之间的协方差;D(X)表示变量X的方差;D(Y)表示变量Y的方差;EX、EY分别表示变量X、Y的期望值;I[X;Y]表示变量X和X之间的互信息;CMIC [X,Y]表示变量X和X之间的最大互信息相关系数;p表示概率密度分布函数;a*b<B表示在X和Y坐标上划分的网格总数小于B,B为常数,取样本总量的0.6次方;
步骤3.2:以Z″i为输入,
Figure GDA0003619808480000037
为输出建立具有动态映射能力的Elman神经网络,分别对r维功率特征
Figure GDA0003619808480000038
独立并行预测,预测结果经过重新组合,得到r维功率特征的预测结果
Figure GDA0003619808480000039
进一步地,对升维编码器AE1采用稀疏化计算来抑制隐含层的神经元状态,并消除提取特征之间的相关性,具体包括:
1)引入平均激活量
Figure GDA00036198084800000310
Figure GDA00036198084800000311
其中,e∈[1,...,m],j∈[1,...,M],xe表示第e个输入值,
Figure GDA00036198084800000312
表示第j维功率特征。在损失函数中引入Kullback-Leible散度惩罚项来保证
Figure GDA00036198084800000313
不断逼近ρ:
Figure GDA00036198084800000314
式中
Figure GDA0003619808480000041
表示平均激活量
Figure GDA0003619808480000042
与ρ的接近程度,二者越接近,
Figure GDA0003619808480000043
越小;ρ为接近于零的常数;
2)在降维编码器AE2的编码过程采用pureline线性激活函数,将
Figure GDA0003619808480000044
的协方差矩阵特征分解后,提取特征值最大的r个特征向量组成Vr×M作为权重W1 (2)的初始值;
3)在独立稀疏堆叠自编码器的微调训练损失函数中引入线性无关惩罚项:
Figure GDA0003619808480000045
式中Ω表示不同维特征之间样本协方差的方均值,用来衡量不同维特征之间的总体线性相关程度;
加入稀疏性及线性无关惩罚后的损失函数为:
Figure GDA0003619808480000046
式中
Figure GDA0003619808480000047
表示损失函数;P表示模型输入的空间多维风电功率数据集,
Figure GDA0003619808480000048
表示测试风电场的功率预测结果,λ表示防止过拟合的正则项,β表示稀疏惩罚项,α表示线性无关惩罚项的权重系数;L表示自编码器的堆叠层数;ω(l)表示l层所有的参数;M表示隐含层神经元数。
通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数,使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象,具体包括:
1)降维编码过程中将各风电功率归一化到[-1,1]区间;
2)降维编码器AE2中采用satlin饱和线性激活函数解码。
相比现有技术,本发明的有益效果包括:
1)本发明的超短期预测方法对海量的风电数据进行降维编码-特征预测-重构解码,实现了多风电场功率特征提取、潜在影响因素降维与特征优选、功率特征独立预测和重构还原的有机统一,有利于大规模风电数据实现并网运行,对电网的安全与稳定运行产生积极的影响;
2)本发明的引入稀疏化、独立性和约束性技术的堆叠自编码器,充分解析多维风电功率间的非线性关系,保证降维特征的独立性和重构结果的合理性;
3)本发明的超短期预测方法得到的功率数据在预测精度与预测效率方面优于现有的预测方法。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为自编码器的结构示意图。
图2为堆叠自编码器的结构示意图图。
图3为Elman神经网络的结构示意图。
图4为本发明实施例的风电场超短期功率预测方法的编码、解码示意图。
图5a为本发明实施例的18座风电场多风季预测结果的平均绝对百分比误差对比图。
图5b为本发明实施例的18座风电场少风季预测结果的平均绝对百分比误差对比图。
图6a为本发明实施例的7号风电场多风季不同预测方法的日预测曲线对比图。
图6b为本发明实施例的3号风电场多风季不同预测方法的日预测曲线对比图。
图6c为本发明实施例的1号风电场多风季不同预测方法的日预测曲线对比图。
图7a为本发明实施例的17号风电场少风季不同预测方法的日预测曲线对比图。
图7b为本发明实施例的6号风电场少风季不同预测方法的日预测曲线对比图。
图7c为本发明实施例的9号风电场少风季不同预测方法的日预测曲线对比图。
图8a为本发明实施例的多风季不同预测方法预测结果的XMAPE误差统计值对比图。
图8b为本发明实施例的少风季不同预测方法预测结果的XMAPE误差统计值对比图。
图9a为本发明实施例的SAE提取的各维功率特征之间的MIC对比图。
图9b为本发明实施例的ISSAE提取的各维功率特征之间的MIC对比图。
具体实施方式
如图1所示,基于堆叠自编码器的多风电场短期功率预测框架预测模型中的自编码器(Autoencoder,AE)是一个由输入层、隐含层和输出层组成具有结构对称性的无监督学习神经网络。AE的期望输出
Figure GDA0003619808480000051
与输入x相同,在训练中利用反向传播算法,以均方误差损失最小为目标训练网络结构的最佳参数,其编码、解码和训练过程可描述如下:
Figure GDA0003619808480000052
Figure GDA0003619808480000053
式中F为隐含层输出的特征向量,f与g分别为编码与解码的激活函数,网络参数θ=[W1,W2,b1,b2]为编码和解码过程中的权重和偏置参数集合,N为训练样本个数。隐含层输出F可视为原始数据的特征表达,通过调整隐含层神经元数r,可灵活提取原始数据映射到不同维度空间的特征。
如图2所示,采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测,预测模型中的堆叠自编码器SAE是由两个或多个自编码器AE堆叠而成的深度神经网络,上一层编码器隐含层的输出作为下一层编码器的输入。SAE通过逐层编码,提取数据的深层特征,在处理具有复杂非线性相关性的高维数据时,比只有单隐含层的AE具有更强的特征提取能力。
为避免多层神经网络训练时梯度弥散,SAE通常采用贪婪训练法将训练过程分为预训练和微调两阶段。预训练按照AE1到AEL的顺序进行,上一层AEL通过前向传播计算网络最佳参数W(L)、b(L)以及获得隐含层特征F(L),再以F(L)作为下一层AEL+1的输入,训练得到W(L +1)、b(L+1)和F(L+1),依次向下推进直到训练结束。最后,全部L个AE被堆叠为SAE,根据最深层编码器输出与期望输出之间的误差,进行有监督训练,完成整体网络参数的微调。
如图3所示,基于堆叠自编码器的多风电场短期功率预测框架预测模型中的Elman神经网络是一个由输入层、隐层、承接层和输出层组成的动态递归神经网络。其输入层、隐层和输出层的连接类似于前馈网络,承接层则用来记忆隐层单元前一时刻的输出值,可以认为是一个有一步迟延的延时算子。它属于带反馈的BP网络,有短期记忆功能。其网络的数学表达式为:
y(t)=g(ω3x(t))
x(t)=f(ω1xc(t)+ω2(u(t-1)))
xc(t)=x(t-1)
式中t表示时间,y表示输出节点向量;x表示中间层节点单元向量;u表示输入向量;xc表示反馈状态向量;ω3表示中间层到输出层连接权值;ω2表示输入层到中间层连接权值;ω1表示承接层到中间层连接权值;g()表示输出神经元的传递函数,是中间层输出的线性组合;f()表示中间层神经元的传递函数。
如图4所示,基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,采用降维编码-特征预测-重构解码的预测框架实现多风电场超短期功率预测,具体包括以下步骤:
步骤1:输入m座风电场N个时刻的历史功率观测样本集PN×m=[P1,P2,…,Pm]N,其中P1,P2,…,Pm分别表示1,2,…,N观测时刻对应的m维风电功率样本向量;
步骤2:采用独立稀疏堆叠自编码器ISSAE1对步骤1的空间多维风电功率数据集进行降维编码;
步骤2.1:针对空间多维风电功率数据矩阵PN×m,通过独立稀疏堆叠自编码器ISSAE1非线性映射到M维高维空间的
Figure GDA0003619808480000071
后,再提取r维的独立特征
Figure GDA0003619808480000072
M>>m,r<<m;
步骤2.2:初步选择影响功率特征的因素,进一步提取独立特征,以第i维功率特征
Figure GDA0003619808480000073
预测为例,i∈{1,2,...,r},选取预测时刻前h相关时刻的历史数据
Figure GDA0003619808480000074
和预测时刻的气象信息S等J个潜在影响因素,组成第i维功率特征
Figure GDA0003619808480000075
预测模型的初选输入变量:
Zi={FHi,S}={z1,z2,...,zJ}i (1)
对初选输入变量Zi采用独立稀疏堆叠自编码器ISSAE2提取J'维(J'<<J)的低维独立特征:
Z′i={z′1,z′2,...,z′J′}i (2)
步骤3:利用神经网络对每个样本时刻的r维功率进行特征预测;
步骤3.1:分别计算各影响因素特征与
Figure GDA0003619808480000076
之间的最大互信息相关系数MIC。按最大互信息相关系数MIC由大到小的顺序优选出与
Figure GDA0003619808480000077
相关性最强的前J″个强影响因素特征组成
Figure GDA0003619808480000078
预测模型的输入Z″i={z″1,z″2,...,z″J″}i
变量X和Y之间的最大互信息相关系数MIC计算公式如下:
Figure GDA0003619808480000079
Figure GDA00036198084800000710
Figure GDA00036198084800000711
式中ρXY表示变量X和Y之间的相关系数;Cov(X,Y)表示变量X和Y之间的协方差;EX、EY分别表示变量X、Y的期望值;D(X)表示变量X的方差;D(Y)表示变量Y的方差;I[X;Y]表示变量X和X之间的互信息;CMIC [X,Y]表示变量X和X之间的最大互信息相关系数;p表示概率密度分布函数;a*b<B表示在X和Y坐标上划分的网格总数小于B,B为常数,实施例中B的取值为样本总量的0.6次方;
步骤3.2:以Z″i为输入,
Figure GDA00036198084800000712
为输出,建立具有动态映射能力的Elman神经网络,分别对r维功率特征
Figure GDA00036198084800000713
独立并行预测,预测结果经过重新组合,得到测试集r维功率特征的预测结果
Figure GDA00036198084800000714
步骤4:利用独立稀疏堆叠自编码器ISSAE1训练得到的解码器将低维功率预测特征
Figure GDA00036198084800000715
分两级解码重构,输出n个测试样本对应的m座风电场的功率预测结果
Figure GDA00036198084800000716
上述的空间多维风电功率预测中堆叠自编码器利用稀疏化来抑制隐含层的神经元状态,对升维编码器AE1激活函数的平均激活量进行调整,引入平均激活量
Figure GDA0003619808480000081
Figure GDA0003619808480000082
其中,e∈[1,...,m],j∈[1,...,M],xe表示第e个输入值,
Figure GDA0003619808480000083
表示第j维功率特征。在损失函数中引入Kullback-Leible散度惩罚项来保证
Figure GDA0003619808480000084
不断逼近ρ:
Figure GDA0003619808480000085
式中
Figure GDA0003619808480000086
表示平均激活量
Figure GDA0003619808480000087
与ρ的接近程度,二者越接近,
Figure GDA0003619808480000088
越小;ρ为接近于零的常数;
上述的空间多维风电功率预测中堆叠自编码器,通过消除提取特征之间的相关性来增强特征的独立性,具体过程如下:
1)在降维编码器AE2的编码过程中采用pureline线性激活函数,将
Figure GDA0003619808480000089
的协方差矩阵特征分解后提取特征值最大的r个特征向量组成Vr×M作为权重W1 (2)的初始值。
2)在SAE整体模型参数的微调训练损失函数中引入线性无关惩罚项:
Figure GDA00036198084800000811
式中Ω是不同维特征之间样本协方差的方均值,用来衡量不同维特征之间的总体线性相关程度。加入稀疏性及线性无关惩罚后的损失函数为:
Figure GDA00036198084800000812
式中
Figure GDA00036198084800000813
表示损失函数;P表示模型输入的空间多维风电功率数据集,
Figure GDA00036198084800000814
表示测试风电场的功率预测结果,λ表示防止过拟合的正则项,β表示稀疏惩罚项,α表示线性无关惩罚项的权重系数;L表示自编码器的堆叠层数;ω(l)表示l层所有的参数;M表示隐含层神经元数;
上述的空间多维风电功率预测中堆叠自编码器,将各风电功率归一化到[-1,1]区间,在降维编码器AE2中采用satlin饱和线性激活函数解码来对数据进行限制约束。
图5a、5b所示为实施例的18座风电场六种预测模型在多风季、少风季的日预测曲线与实际曲线的平均绝对百分误差(mean absolute percentage error,MAPE),计算公式如下:
Figure GDA0003619808480000091
式中XMAPE表示平均绝对百分误差,xi'表示风电场i的预测功率,xi表示风电场i的原始功率,xN表示对应风电场的额定功率,N为测试样本个数。
图6a所示为多风季预测误差较大的7号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6b所示为多风季预测误差中等的3号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。图6c所示为多风季预测误差小的1号风电场在2016年12月10日采用不同预测方法得到的预测曲线与实际功率曲线。
图7a所示为少风季预测误差较大的17号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7b所示为少风季预测误差中等的6号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。图7c所示为少风季预测误差小的9号风电场在2016年8月4日采用不同预测方法得到的预测曲线与实际功率曲线。其中,AE-Elman模型表示自编码器AE与Elman网络相结合用于风电功率预测,SAE-Elman模型表示堆叠自编码器SAE与Elman网络相结合用于风电功率预测,PCA-Elman模型表示主成分分析法PCA与Elman网络相结合用于风电功率预测。
本发明方法在多风季、少风季均可得到最佳的预测精度,由此可见,与Elman网络直接用于风电功率预测的方法相比,本发明方法有效提高了预测精度和计算效率。而从图6a、6b、6c可以看出,当风电场实际功率为0或者额定输出的时段,PCA-Elman和AE-Elman预测结果可能为负或超出额定出力。而本发明方法通过编码过程中对风电功率归一化、解码过程中采用饱和线性激活函数,使得功率预测结果不会出现负值或者超出风电额定输出功率等不合理现象,使得预测结果更贴近实际功率数据。
综上,利用本发明提出的多维风电功率的降维-预测-重构框架,采用基于深度学习的独立稀疏堆叠自编码器降维,相对于PCA、AE等常规降维方法,可显著降低多风电场功率预测的平均误差和最大误差。
图8a所示为多风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的XMAPE误差统计值。图8b所示为少风季本发明方法、SAE-Elman以及在本发明方法的基础上分别去掉稀疏性、独立性、归一化后模型的XMAPE误差统计值。由图8a、8b可见,相比分别去掉稀疏性、独立性、归一化这3种情况,多风季本发明方法的平均XMAPE分别下降了4.7%、5.2%、4.5%,本发明方法的平均XMAPE相比SAE-Elman下降了4.1%,相比这些方法,本发明方法的最小XMAPE下降了2.4~3.6%,最大XMAPE下降了3.3~6.8%。由图8b可见,相比这些方法,少风季本发明方法的平均XMAPE分别下降了2.4%、5.3%、3.4%和2.2%,最小XMAPE下降了2.8~4.8%,最大XMAPE下降了1.3~5.6%。
图9a、9b所示为SAE-Elman、本发明方法提取的各维功率特征之间的最大互信息相关系数MIC,可以发现本发明方法功率特征之间的最大互信息相关系数低于SAE-Elman,表明引入了稀疏化和独立性技术后的独立稀疏堆叠自编码器降维方法可更好保证提取特征的独立性。

Claims (5)

1.基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,其特征在于,先后利用独立稀疏堆叠自编码器ISSAE1、ISSAE2对空间多维风电功率数据集、预测功率的影响因素降维,对降维后的功率特征独立并行预测,再对低维预测数据进行解码重构,得到各风电场的功率预测结果,所述风电场超短期功率预测方法包括以下步骤,
步骤1:采集多座风电场多个时刻的历史功率观测数据集;
步骤2:利用第一独立稀疏堆叠自编码器ISSAE1对步骤1得到的空间多维风电功率数据集进行降维,得到降维的历史特征数据,再结合气象信息,共同作为预测功率的影响因素,利用第二独立稀疏堆叠自编码器ISSAE2对预测功率的影响因素进一步降维得到低维特征;
步骤3:从步骤2得到的低维特征中选出独立特征,并利用具有动态映射能力的神经网络进行预测,得到风电场功率的低维预测数据;
步骤4:利用第一独立稀疏堆叠自编码器ISSAE1的解码器对步骤3得到的低维预测数据进行解码重构,得到各风电场的功率预测结果;
第一独立稀疏堆叠自编码器ISSAE1包括升维编码器AE1、降维编码器AE2
2.根据权利要求1所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,其特征在于,步骤3的神经网络为Elman神经网络。
3.根据权利要求2所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,其特征在于,步骤2包括以下子步骤:
步骤2.1:输入m座风电场N个时刻的历史功率观测样本集PN×m=[P1,P2,…,Pm]N,其中P1,P2,…,Pm分别表示1,2,…,N观测时刻对应的m维风电功率样本向量;
步骤2.2:采用第一独立稀疏堆叠自编码器ISSAE1对历史功率观测样本集进行降维编码;
步骤2.2.1:针对空间多维风电功率数据矩阵PN×m,通过升维编码器AE1非线性映射到M维高维空间的
Figure FDA0003619808470000011
后,再通过降维编码器AE2提取r维的低维特征
Figure FDA0003619808470000012
其中M>>m,r<<m;
步骤2.2.2:初步选择影响功率预测的影响因素,进一步提取独立特征,以第i维功率特征Fi (2)预测为例,i∈{1,2,...,r},选取预测时刻前h相关时刻的历史数据
Figure FDA0003619808470000013
和预测时刻的气象信息S共同作为功率预测的影响因素,组成第i维功率特征Fi (2)预测模型的初选输入变量:
式中J表示影响因素的数量;Zi={FHi,S}={z1,z2,...,zJ}i
利用第二独立稀疏堆叠自编码器ISSAE2对初选输入变量Zi提取J'维的低维特征:
Z′i={z′1,z′2,...,z′J′}i
式中J'表示独立特征的数量,J'<<J。
4.根据权利要求3所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,其特征在于,步骤3包括以下子步骤:
步骤3.1:分别计算各个低维特征与Fi (2)之间的最大互信息相关系数;按最大互信息相关系数由大到小的顺序优选出与Fi (2)相关性最强的前J”个特征组成Fi (2)预测模型的输入Zi″={z1″,z2″,...,z″J″}i,J”表示强影响因素特征的数量;
步骤3.2:以Z″i为输入,Fi (2)为输出建立具有动态映射能力的Elman神经网络,分别对r维功率特征Fi (2),i∈[1,...,r]独立并行预测,预测结果经过重新组合,得到r维功率特征的预测结果
Figure FDA0003619808470000021
5.根据权利要求4所述的基于独立稀疏堆叠自编码器的风电场超短期功率预测方法,其特征在于,对升维编码器AE1采用稀疏化计算来抑制隐含层的神经元状态,并消除提取特征之间的相关性,具体包括:
1)引入平均激活量
Figure FDA0003619808470000022
Figure FDA0003619808470000023
其中,e∈[1,...,m],j∈[1,...,M],xe表示第e个输入值,Fj (1)表示第j维功率特征;
在损失函数中引入Kullback-Leible散度惩罚项来保证
Figure FDA0003619808470000024
不断逼近ρ:
Figure FDA0003619808470000025
式中
Figure FDA0003619808470000026
表示平均激活量
Figure FDA0003619808470000027
与ρ的接近程度,二者越接近,
Figure FDA0003619808470000028
越小;ρ为接近于零的常数;
2)在降维编码器AE2的编码过程采用pureline线性激活函数,将
Figure FDA0003619808470000029
的协方差矩阵特征分解后,提取特征值最大的r个特征向量组成Vr×M作为权重W1 (2)的初始值;
3)在独立稀疏堆叠自编码器的微调训练损失函数中引入线性无关惩罚项:
Figure FDA00036198084700000210
式中Ω表示不同维特征之间样本协方差的方均值,用来衡量不同维特征之间的总体线性相关程度;N′表示样本数量;
加入稀疏性及线性无关惩罚后的损失函数为:
Figure FDA0003619808470000031
式中
Figure FDA0003619808470000032
表示损失函数;P表示模型输入的空间多维风电功率数据集,
Figure FDA0003619808470000033
表示测试风电场的功率预测结果,λ表示防止过拟合的正则项,β表示稀疏惩罚项,α表示线性无关惩罚项的权重系数;L表示自编码器的堆叠层数;ω(l)表示l层所有的参数;M表示隐含层神经元数。
CN202110256120.8A 2021-03-09 2021-03-09 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法 Active CN112861992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110256120.8A CN112861992B (zh) 2021-03-09 2021-03-09 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110256120.8A CN112861992B (zh) 2021-03-09 2021-03-09 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法

Publications (2)

Publication Number Publication Date
CN112861992A CN112861992A (zh) 2021-05-28
CN112861992B true CN112861992B (zh) 2022-09-02

Family

ID=75995112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110256120.8A Active CN112861992B (zh) 2021-03-09 2021-03-09 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法

Country Status (1)

Country Link
CN (1) CN112861992B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114252706B (zh) * 2021-12-15 2023-03-14 华中科技大学 一种雷电预警方法和系统
CN114792158B (zh) * 2022-04-01 2024-07-09 三峡大学 基于时空融合图神经网络的多风电场短期功率预测方法
CN114692513B (zh) * 2022-05-26 2022-09-06 国网山西省电力公司晋城供电公司 基于深度学习的新能源承载力评估方法、预警方法
CN116341614B (zh) * 2023-04-10 2023-10-03 华北电力大学(保定) 基于深层自编码网络的无线电干扰激发函数的预测方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766937A (zh) * 2017-09-11 2018-03-06 重庆大学 基于特征选取和循环神经网络的风电场功率超短期预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107294084A (zh) * 2017-06-08 2017-10-24 华南理工大学 一种基于风电功率预测的日前曲线求解方法
CN108711847B (zh) * 2018-05-07 2019-06-04 国网山东省电力公司电力科学研究院 一种基于编码解码长短期记忆网络的短期风电功率预测方法
CA3010938A1 (en) * 2018-07-10 2020-01-10 Mitchell B. Miller A system and method utilizing deflection conversion for increasing the energy efficiency of a circuit and time rate while charging an electrical storage device, different circuit configurations composing a group termed deflection converters, where this invention integrates deflection conversion into a regenerative energy recovery and or generation system
CN109580215B (zh) * 2018-11-30 2020-09-29 湖南科技大学 一种基于深度生成对抗网络的风电传动系统故障诊断方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766937A (zh) * 2017-09-11 2018-03-06 重庆大学 基于特征选取和循环神经网络的风电场功率超短期预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Dimension-Reduction and Reconstruction of;Dan Li;《IEEE》;20201231;全文 *

Also Published As

Publication number Publication date
CN112861992A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112861992B (zh) 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法
CN112564098B (zh) 基于时间卷积神经网络的高比例光伏配电网电压预测方法
CN111079781A (zh) 基于低秩与稀疏分解的轻量化卷积神经网络图像识别方法
CN110717610B (zh) 一种基于数据挖掘的风电功率预测方法
CN106251001A (zh) 一种基于改进模糊聚类算法的光伏功率预测方法
CN106503867A (zh) 一种遗传算法最小二乘风电功率预测方法
US20210334658A1 (en) Method for performing clustering on power system operation modes based on sparse autoencoder
CN110264079B (zh) 基于CNN算法和Lasso回归模型的热轧产品质量预测方法
CN110782013B (zh) 一种基于广义互熵自编码器的火电厂NOx排放量预测方法
CN111460001B (zh) 一种配电网理论线损率评估方法及系统
CN110808581B (zh) 一种基于dbn-svm的主动配电网电能质量预测方法
CN108416460A (zh) 基于多因素时序—随机深度置信网络模型的蓝藻水华预测方法
CN113688869A (zh) 一种基于生成对抗网络的光伏数据缺失重构方法
CN111798037B (zh) 一种基于堆叠式极限学习机框架的数据驱动最优潮流计算方法
CN110728391B (zh) 一种基于可拓展信息的深度回归森林短期负荷预测方法
Zhang et al. Digital twin modeling for photovoltaic panels based on hybrid neural network
CN111539482B (zh) 基于rbf核函数的空间多维风电功率数据降维及重构方法
CN113972667A (zh) 一种基于一维卷积神经网络的配电网无功优化方法
Aishwarya et al. Prediction of time series data using GA-BPNN based hybrid ANN model
CN115965150A (zh) 一种基于权重分配的电力负荷预测方法
CN117748495A (zh) 一种基于残差神经网络的光伏电站短期发电功率预测方法
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
CN116960978A (zh) 基于风速-功率组合分解重构的海上风电功率预测方法
CN113449912B (zh) 一种基于人工智能技术的空间负荷态势感知方法
CN116843057A (zh) 基于LSTM-ViT的风电功率超短期预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210528

Assignee: Hubei Yispatiotemporal Unmanned Aerial Vehicle Technology Co.,Ltd.

Assignor: CHINA THREE GORGES University

Contract record no.: X2023980044218

Denomination of invention: A Wind Farm Ultra Short Term Power Prediction Method Based on Independent Sparse Stacked Autoencoder

Granted publication date: 20220902

License type: Common License

Record date: 20231024

EE01 Entry into force of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Hubei Yispatiotemporal Unmanned Aerial Vehicle Technology Co.,Ltd.

Assignor: CHINA THREE GORGES University

Contract record no.: X2023980044218

Date of cancellation: 20240827