CN113361782A - 基于改进mkpls的光伏发电功率短期滚动预测方法 - Google Patents

基于改进mkpls的光伏发电功率短期滚动预测方法 Download PDF

Info

Publication number
CN113361782A
CN113361782A CN202110644827.6A CN202110644827A CN113361782A CN 113361782 A CN113361782 A CN 113361782A CN 202110644827 A CN202110644827 A CN 202110644827A CN 113361782 A CN113361782 A CN 113361782A
Authority
CN
China
Prior art keywords
data set
power generation
variable data
photovoltaic power
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110644827.6A
Other languages
English (en)
Other versions
CN113361782B (zh
Inventor
吴麒
张文安
黄大建
王林青
黄柳柳
张宝强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110644827.6A priority Critical patent/CN113361782B/zh
Publication of CN113361782A publication Critical patent/CN113361782A/zh
Application granted granted Critical
Publication of CN113361782B publication Critical patent/CN113361782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于改进MKPLS的光伏发电功率短期滚动预测方法,首先,获取影响发电功率的多源因素历史数据集作为解释变量数据集,并将对应的发电功率历史数据集作为因变量数据集,通过基于自适应噪声的完备经验模态分解与排列熵相结合的方法实现历史数据集的阈值滤波,实现高频噪声的有效去除和有用信息的保留;其次,通过阈值滤波解释变量数据集与因变量数据集的相关系数矩阵,实现特征提取;然后,引入多尺度下的高斯核函数将输入空间映射到高维特征空间,并建立因变量关于解释变量的非线性预测模型;最后,通过引入滑动窗口策略实时更新预测模型的多尺度高斯核函数,并最终实现光伏发电功率短期滚动预测。本发明易于实现、计算量小和自适应能力强。

Description

基于改进MKPLS的光伏发电功率短期滚动预测方法
技术领域
本发明应用于光伏发电功率预测领域,涉及一种基于改进多尺度核函数偏最小二乘(MKPLS)的光伏发电功率短期滚动预测方法。
背景技术
近年来,以新能源为主体的新型电力系统得到了大规模的发展和应用,如光伏发电系统。通过光伏发电并网和逐步提升光伏发电的占比,将有效优化现有能源结构、促进国家节能减排,助力实现“碳达峰、碳中和”的目标。然而,光伏发电系统的功率存在间歇性、波动性和随机性的特点,会严重影响电网的安全稳定运行,增加光伏发电大规模并网的难度。因此,如何实现光伏发电功率的准确预测已成为目前备受关注的研究内容,其对于电力系统调度计划的合理制定和电力系统的经济稳定运行具有重大意义。
根据预测时长的区别,光伏的发电功率预测主要分为中长期预测和短期预测。其中,短期预测的预测时长一般在48小时之内,用于配合电力调度部门规划调度用电及合理安排备用容量。通常,光伏发电功率会受到来自多方面因素的影响,包括太阳辐照强度、所在地气象状况以及光伏发电系统自身状况等。其中,所在地气象状况是影响光伏发电功率短期预测的关键因素,其造成的发电功率短期波动和随机变换会严重影响短期预测的精度。此外,这些影响因素之间往往存在多重共线性,并且与光伏发电功率呈现出非线性关系,也增加了光伏发电功率短期预测的难度。
目前,光伏发电功率的短期预测主要依赖于预测模型的建立,包括物理模型、统计模型和人工智能模型。其中,物理模型由于模型复杂、计算量大和抗干扰性差等缺陷,已经无法满足光伏发电功率短期预测的精度需求。传统的统计模型主要是基于线性模型,无法反映光伏发电功率和气象状况间的非线性关系,导致局部预测不够精确。人工智能模型虽然能较好的实现非线性拟合,但是需要大量的历史数据作为支撑。此外,大部分现有的预测模型仍然采用固定的模型参数,模型的预测精度会随着时间的推移逐渐降低,从而失去模型预测的意义。
发明内容
为了解决现有光伏发电功率短期预测方法存在非线性拟合效果差、需要历史数据样本大和无法滚动预测的技术缺陷,本发明提出了一种适用于小样本下的基于改进多尺度核函数偏最小二乘(MKPLS)的光伏发电功率短期滚动预测方法。
本发明解决其技术问题所采用的技术方案是:
一种基于改进多尺度核函数偏最小二乘(MKPLS)的光伏发电功率短期滚动预测方法,所述方法包括以下步骤:
1)获取的数据包括历史发电功率数据集Y和影响发电功率的相关数据集X={X1,X2,X3},包括光伏发电站所在地气象状况数据集X1、太阳辐射强度数据集X2和发电系统自身状况数据集X3,历史发电功率数据集Y的长度为L,数据集X的状态个数为N;
2)进行数据预处理:首先,删除由于机械原因和人为原因所导致的异常数据,提高数据的可用性,其次,采用基于自适应噪声的完备总体经验模态分解(CEEMD)方法结合检测时间序列随机排列熵(PE)的方法对数据集去噪,提高数据的可靠性;记经过数据处理后的解释变量数据集为
Figure BDA0003108749480000021
因变量数据集
Figure BDA0003108749480000022
3)进行特征选择:首先,通过对历史光伏发电功率数据与影响发电功率相关历史数据集进行相关性分析,得到相关系数矩阵
Figure BDA0003108749480000023
其次,结合阈值判断方法,在影响发电功率相关历史数据集中选择高于给定阈值的数据集作为特征项,构成解释变量数据集
Figure BDA0003108749480000024
表示特征项个数;最后,将对应的历史光伏发电功率数据集记为因变量数据集
Figure BDA0003108749480000031
4)训练样本集和测试样本集的划分:根据数据集记录时间顺序,将获得的解释变量数据集
Figure BDA0003108749480000032
与对应因变量数据集
Figure BDA0003108749480000033
划分成四个子数据集,其中,前80%的解释变量数据集
Figure BDA0003108749480000034
与对应因变量数据集
Figure BDA0003108749480000035
构成训练样本集Xtrain和Ytrain;后20%的解释变量数据集
Figure BDA0003108749480000036
与对应因变量数据集
Figure BDA0003108749480000037
构成测试样本集Xtest和Ytest
5)在训练样本集上,构建多尺度高斯核函数偏最小二乘回归模型:首先,通过设计多尺度高斯核格拉姆矩阵Θ把输入空间映射到高维特征空间,并通过优化算法确定多尺度高斯核函数的宽度参数σ;其次,在高维特征空间上构造线性偏最小二乘回归模型;最后,得到原始输入空间上的非线性建模,即光伏发电功率关于解释变量的多元非线性回归模型;
6)更新模型参数,建立光伏发电功率的滚动预测模型,采用滑动窗口法,固定窗口长度m和滑动步长p,并重构多尺度高斯核格拉姆矩阵Θ,从而实现模型参数随着滑动窗口的移动而更新;在滑动窗口的移动过程中,离开窗口范围的旧样本应被舍弃,同时,进入窗口范围的新样本应被用于重新计算核格拉姆矩阵Θ,通过保留相邻滑动窗口对应核格拉姆矩阵计算内容的相同部分;
7)在测试集上验证模型并给出模型精度评价,采用均方根误差(RMSE)和平均绝对百分比误差(MAPE)指标分别对模型精度进行评价;
8)实现光伏发电功率的滚动预测:首先,根据滑动步长p,继续采集传感器数据Xnew;其次,进行数据预处理和特征选择,得到解释变量数据集
Figure BDA0003108749480000038
然后,通过标准化
Figure BDA0003108749480000039
得到Enew,并重构核格拉姆矩阵Θ(2);最终,将新的解释变量数据集Enew和Θ(2)代入所建立的滚动预测模型,实现光伏发电功率的滚动预测。
进一步,所述步骤8)中,预测得到的标准化后的预测值,通过去标准化得到光伏发电功率的实际预测值。
与现有技术相比,本发明的有益效果表现在:1)采用基于自适应噪声的完备经验模态分解(CEEMDAN)与排列熵(PE)相结合的方法实现样本数据集的阈值滤波,在有效去除高频噪声的同时保留了有用信息,提高了信噪比;2)设计了多尺度高斯核函数,并建立了小样本下的多尺度核函数偏最小二乘模型,不仅有效解决了解释变量间的多重共线性问题,而且充分挖掘了解释变量与因变量间的非线性回归关系;3)引入滑动窗口策略,并给出了核格拉姆矩阵的更新策略,提高了模型的自适应能力,实现了对短期光伏发电功率的短期滚动预测。
附图说明
图1是基于改进多尺度核函数偏最小二乘(MKPLS)的光伏发电功率短期滚动预测方法结构框图。
图2是涉及数据预处理中基于自适应噪声的完备经验模态分解(CEEMDAN)与排列熵(PE)的阈值滤波算法流程图。
图3是涉及构建光伏发电功率短期滚动预测模型具体流程图。
具体实施方式
为了使本发明的技术方案、设计思路能更加清晰,下面结合附图在进行详尽的描述。
参照图1~图3,基于改进多尺度核函数偏最小二乘(MKPLS)的光伏发电功率短期滚动预测方法,共采集四类数据集,记数据集X={X1,X2,X3},分别是所在地附近气象状况历史数据集X1,包括温度、湿度、气压、雨量、风向和风速;太阳辐射强度相关历史数据集X2,包括太阳日照时数、斜面辐射、直射辐射和散射辐射等;光伏发电系统自身状况历史数据集X3,包括面板温度和电池电压等;以及对应光伏发电历史功率数据集Y。采样周期为5分钟,采样长度为8万个样本数据。根据短期预测任务需求,可通过重采样方法改变采样周期,本发明以采样周期为24小时(即一天)举例。
一种基于滑动窗口和多尺度核函数偏最小二乘的光伏发电功率短期滚动预测方法,包括以下步骤:
1)获取历史数据集:通过重采样技术,改变采样周期为24小时,获取长度为L的历史数据集X和Y
xi(k)=x0i(k)+xxi(k) (1)
y(k)=y0(k)+vy(k) (2)
其中,xi(k)表示数据集X中第i项状态量的第k个采样时刻获得的量测数据,x0i(k)是xi(k)去噪后的真实值,vxi(k)表示与xi(k)对应的量测噪声,一般为高斯白噪声;y(k)表示数据集Y中第k个采样时刻获得的发电功率数据,vy(k)表示与y(k)对应的量测噪声,L表示数据集长度,k∈[1,L]。N表示数据集X的状态量个数,i∈[1,N],考虑到工业数据集中难免存在数据缺失、异常数据和噪声干扰,需要采用数据预处理提高数据集的可靠性和信噪比;
2)数据预处理:首先,根据数据集中太阳日照时间,结合阈值判断法,剔除光伏发电功率在日照时间之外仍然高于给定阈值的相应数据;
Figure BDA0003108749480000051
其中,
Figure BDA0003108749480000052
Figure BDA0003108749480000053
分别构成了去除异常值后的数据集
Figure BDA0003108749480000054
Figure BDA0003108749480000055
YTH为设定功率阈值,s是由日照时间之外的采样时刻构成的时间集合,t表示采样时刻;需要注意的是,在步骤1)中采用了重采样技术获得以24小时为采样周期的数据集,但原先以5分钟为采样周期的原始数据集仍需保留,方便异常数据处理;
其次,基于自适应噪声的完备经验模态分解CEEMDAN与排列熵PE的阈值滤波算法提高数据集
Figure BDA0003108749480000061
Figure BDA0003108749480000062
的信噪比,由信号
Figure BDA0003108749480000063
Figure BDA0003108749480000064
构成待分解初始信号集合
Figure BDA0003108749480000065
对于集合
Figure BDA0003108749480000066
中的每一个待分解初始信号
Figure BDA0003108749480000067
准备Ns组正负成对的高斯白噪声,并计算第一阶EMD分解量,
Figure BDA0003108749480000068
Figure BDA0003108749480000069
Figure BDA00031087494800000610
其中,(-1)qη0nj(t)为第j组正负成对的高斯白噪声,q={1,2},η0给定幅值,记
Figure BDA00031087494800000611
表示添加高斯白噪声后的待分解信号,E(·)表示EMD分解算法,
Figure BDA00031087494800000612
表示对应
Figure BDA00031087494800000613
的第j组第一阶IMF分量,
Figure BDA00031087494800000614
表示对应
Figure BDA00031087494800000615
的第j组第一阶残差。对获得Ns组内部模态分量信号进行加总平均运算,得到第一阶IMF分量u1(t)和对应残差r1(t);
同理,重复公式(4)-(6)获得剩余IMF分量uk(t)和残差rk(t),
Figure BDA00031087494800000616
Figure BDA00031087494800000617
其中,ηk-1为给定幅值。当rk(t)为单调函数且不能再被分解时,则CEEMDAN分解完成,得到所有K阶IMF分量{uk(t)}和残差{rk(t)},k∈[1,K];
针对每阶IMF分量uk(t),分别计算其时间序列的排列熵(PE)值,长度为时间序列L的时间序列{uk(t),t=1,2,…,L},其相空间重构为
Figure BDA0003108749480000071
其中,μ表示嵌入维数,τ表示时间延迟,重构后的时间序列U(t)各有μ个向量,且对其进行升序排列共有μ!种不同的排列,将所有可能出现的排列编号构成集合G={gi},i=1,2,…,μ!,并记概率Pi为对应编号gi出现的概率,则有
Figure BDA0003108749480000072
定义时间序列{uk(t),t=1,2,…,L}的排列熵为
Figure BDA0003108749480000073
Figure BDA0003108749480000074
其中,排列熵HP(μ)的标准化形式为HP,0≤HP≤1。特别地当Pi=1/μ时,HP(μ)达到最大值ln(μ!),一般高斯白噪声序列的排列熵大于0.9,因此本发明选取阈值HTH为0.9,对上述时间序列{uk(t),t=1,2,…,L}进行阈值滤波,
Figure BDA0003108749480000075
高频分量中包含高斯白噪声,假设剔除了前l阶IMF分量,对剩下的K-l阶IMF分量重构,
Figure BDA0003108749480000076
其中,
Figure BDA0003108749480000077
为去除高频噪声后的重构信号,同样记
Figure BDA0003108749480000078
Figure BDA0003108749480000079
分别为去除高频噪声后的解释变量数据集和因变量数据集;
3)进行特征选择:由于解释变量数据集
Figure BDA00031087494800000710
具有N个状态量,其生成的高维特征矩阵会增加预测模型的建模难度,通过对解释变量数据集的每个状态量与因变量进行相关性分析,剔除相关系数低的状态量以降低特征矩阵维度,简化模型,根据相关系数矩阵计算公式
Figure BDA0003108749480000081
Figure BDA0003108749480000082
其中,
Figure BDA0003108749480000083
Figure BDA0003108749480000084
分别为
Figure BDA0003108749480000085
Figure BDA0003108749480000086
的均值,
Figure BDA0003108749480000087
Figure BDA0003108749480000088
Figure BDA0003108749480000089
间的相关系数,给定系数阈值rTH=0.8,根据阈值滤波完成特征选择,
Figure BDA00031087494800000810
Figure BDA00031087494800000811
其中,
Figure BDA00031087494800000812
Figure BDA00031087494800000813
分别表示经过特征选择后的解释变量数据集和因变量数据集,
Figure BDA00031087494800000814
表示数据集
Figure BDA00031087494800000815
的状态量个数;
4)训练样本集和测试样本集的划分:根据数据集记录时间顺序,将解释变量数据集
Figure BDA00031087494800000816
与对应因变量数据集
Figure BDA00031087494800000817
划分成四个子数据集,其中,前80%的解释变量数据集
Figure BDA00031087494800000818
与对应因变量数据集
Figure BDA00031087494800000819
构成训练样本集Xtrain和Ytrain;后20%的解释变量数据集
Figure BDA00031087494800000820
与对应因变量数据集
Figure BDA00031087494800000821
构成测试样本集Xtest和Ytest
L1=ROUND(0.8*L) (17)
Figure BDA00031087494800000822
其中,L1表示训练样本集的样本长度;
5)在训练样本集上,构建多尺度高斯核函数偏最小二乘回归模型;
记E0和F0分别为经过标准化后的训练样本集,相应标准化公式为
Figure BDA0003108749480000091
其中,
Figure BDA0003108749480000092
Figure BDA0003108749480000093
分别表示
Figure BDA0003108749480000094
和Ytrain的均值,
Figure BDA0003108749480000095
Figure BDA0003108749480000096
为对应的标准差;
通过设计多尺度高斯核函数把输入空间
Figure BDA0003108749480000097
映射到高维特征空间H,即
Figure BDA0003108749480000098
Figure BDA0003108749480000099
Figure BDA00031087494800000910
其中,Φ(·)表示从输入空间到其特征空间(希尔伯特空间)的非线性映射,Θ表示核格拉姆矩阵,矩阵中的元素Θ(i,j)采用多尺度高斯核函数,σl是宽度参数,可由优化算法确定;
在高维特征空间H上构造线性偏最小二乘回归模型,多尺度核函数偏最小二乘算法如下所示,
Figure BDA00031087494800000911
Figure BDA00031087494800000912
uh=Fhch,uh←uh/||uh|| (24)
Figure BDA00031087494800000913
Figure BDA00031087494800000914
其中,th和uh分别为特征空间中Θh和Fh的得分分量,ch表示Fh的权值分量,h表示所提取成分的下标号,重复公式(22)-(26),得到多尺度核函数偏最小二乘模型,
B=ΦTU(TTΘU)-1TTF0 (27)
Figure BDA0003108749480000101
其中,T、U为得分向量t、u构成的矩阵,成为
Figure BDA0003108749480000102
为拟合结果,将公式(27)代入公式(28),获得训练样本拟合公式
Figure BDA0003108749480000103
当获得新数据时,同样采用公式(19)进行标准化处理,得到Enew;令Θnew=Φ(Enew)Φ(Enew)T,同理得预测模型为
Figure BDA0003108749480000104
其中,Θnew为新数据Enew对应的核格拉姆矩阵,
Figure BDA0003108749480000105
为标准化的预测结果,去标准化
Figure BDA0003108749480000106
即得到对应光伏发电功率的预测值;
6)更新模型参数,建立光伏发电功率的滚动预测模型:采用滑动窗口法,固定窗口长度m和滑动步长p,重构多尺度高斯核格拉姆矩阵,
Figure BDA0003108749480000107
Figure BDA0003108749480000108
其中,Θ(1)和Θ(2)分别表示窗口滑动前多尺度高斯核格拉姆矩阵和滑动后的重构核格拉姆矩阵,
Figure BDA0003108749480000109
Figure BDA00031087494800001010
分别为构成Θ(1)和Θ(2)的分块矩阵,w∈{11,12,21,22},不难发现
Figure BDA00031087494800001011
且滑动步长p一般远小于固定窗口长度m,因此在更新过程中只需重构核格拉姆矩阵中其余三个分块小矩阵,在线计算量较小;
7)在测试集上验证模型并给出模型精度评价;
采用均方根误差(RMSE)和平均绝对百分比误差(MAPE)指标分别对模型精度进行评价,对应计算公式如下
Figure BDA0003108749480000111
Figure BDA0003108749480000112
其中,
Figure BDA0003108749480000113
为Ytest(t)的预测值,L-L1为待预测样本个数,QRMSE表示RMSE评价指标得分,QMAPE表示MAPE评价指标得分;
8)实现光伏发电功率的滚动预测:首先,根据滑动步长p,继续采集传感器数据Xnew。其次,进行数据预处理和特征选择,得到解释变量数据集
Figure BDA0003108749480000114
然后,根据公式(19)标准化
Figure BDA0003108749480000115
得到Enew,并根据公式(31)重构核格拉姆矩阵Θ(2);最终,将Enew和Θ(2)代入所建立的滚动预测模型(29),实现光伏发电功率的短期滚动预测;注意,得到的标准化后的预测值,可通过去标准化得到光伏发电功率的实际预测值。
本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。

Claims (1)

1.一种基于改进MKPLS的光伏发电功率短期滚动预测方法,其特征在于,所述方法包括以下步骤:
1)采集四类数据集,记数据集X={X1,X2,X3},分别是所在地附近气象状况历史数据集X1,包括温度、湿度、气压、雨量、风向和风速;太阳辐射强度相关历史数据集X2,包括太阳日照时数、斜面辐射、直射辐射和散射辐射;光伏发电系统自身状况历史数据集X3,包括面板温度和电池电压;以及对应光伏发电历史功率数据集Y,采样周期为5分钟,采样长度为8万个样本数据;
根据短期预测任务需求,通过重采样方法改变采样周期,采样周期为24小时,
Figure FDA0003108749470000011
y(k)=y0(k)+vy(k) (2)
其中,xi(k)表示数据集X中第i项状态量的第k个采样时刻获得的量测数据,x0i(k)是xi(k)去噪后的真实值,vxi(k)表示与xi(k)对应的量测噪声,y(k)表示数据集Y中第k个采样时刻获得的发电功率数据,vy(k)表示与y(k)对应的量测噪声,L表示数据集长度,k∈[1,L],N表示数据集X的状态量个数,i∈[1,N];
2)数据预处理:首先,根据数据集中太阳日照时间,结合阈值判断法,剔除光伏发电功率在日照时间之外仍然高于给定阈值的相应数据;
Figure FDA0003108749470000012
其中,
Figure FDA0003108749470000013
Figure FDA0003108749470000014
分别构成了去除异常值后的数据集
Figure FDA0003108749470000015
Figure FDA0003108749470000016
YTH为设定功率阈值,s是由日照时间之外的采样时刻构成的时间集合,t表示采样时刻,在步骤(1)中采用了重采样技术获得以24小时为采样周期的数据集,但原先以5分钟为采样周期的原始数据集仍需保留,方便异常数据处理;
其次,基于自适应噪声的完备经验模态分解与排列熵的阈值滤波算法提高数据集
Figure FDA0003108749470000021
Figure FDA0003108749470000022
的信噪比,由信号
Figure FDA0003108749470000023
Figure FDA0003108749470000024
构成待分解初始信号集合
Figure FDA0003108749470000025
对于集合
Figure FDA0003108749470000026
中的每一个待分解初始信号
Figure FDA0003108749470000027
准备Ns组正负成对的高斯白噪声,并计算第一阶EMD分解量,
Figure FDA0003108749470000028
Figure FDA0003108749470000029
Figure FDA00031087494700000210
其中,(-1)qη0nj(t)为第j组正负成对的高斯白噪声,q={1,2},η0给定幅值,记
Figure FDA00031087494700000211
表示添加高斯白噪声后的待分解信号,E(·)表示EMD分解算法,
Figure FDA00031087494700000212
表示对应
Figure FDA00031087494700000213
的第j组第一阶IMF分量,
Figure FDA00031087494700000214
表示对应
Figure FDA00031087494700000215
的第j组第一阶残差,对获得Ns组内部模态分量信号进行加总平均运算,得到第一阶IMF分量u1(t)和对应残差r1(t);
同理,重复公式(4)-(6)获得剩余IMF分量uk(t)和残差rk(t),
Figure FDA00031087494700000216
Figure FDA00031087494700000217
其中,ηk-1为给定幅值,当rk(t)为单调函数且不能再被分解时,则CEEMDAN分解完成,得到所有K阶IMF分量{uk(t)}和残差{rk(t)},k∈[1,K];
针对每阶IMF分量uk(t),分别计算其时间序列的排列熵(PE)值,长度为时间序列L的时间序列{uk(t),t=1,2,…,L},其相空间重构为
Figure FDA0003108749470000031
其中,μ表示嵌入维数,τ表示时间延迟,重构后的时间序列U(t)各有μ个向量,且对其进行升序排列共有μ!种不同的排列,将所有可能出现的排列编号构成集合G={gi},i=1,2,…,μ!,并记概率Pi为对应编号gi出现的概率,则有
Figure FDA0003108749470000032
定义时间序列{uk(t),t=1,2,…,L}的排列熵为
Figure FDA0003108749470000033
Figure FDA0003108749470000034
其中,排列熵HP(μ)的标准化形式为HP,0≤HP≤1,特别地当Pi=1/μ时,HP(μ)达到最大值ln(μ!),选取阈值HTH,对上述时间序列{uk(t),t=1,2,…,L}进行阈值滤波,
Figure FDA0003108749470000035
高频分量中包含高斯白噪声,假设剔除了前l阶IMF分量,对剩下的K-l阶IMF分量重构,
Figure FDA0003108749470000036
其中,
Figure FDA0003108749470000037
为去除高频噪声后的重构信号,同样记
Figure FDA0003108749470000038
Figure FDA0003108749470000039
分别为去除高频噪声后的解释变量数据集和因变量数据集;
3)进行特征选择:由于解释变量数据集
Figure FDA00031087494700000310
具有N个状态量,其生成的高维特征矩阵会增加预测模型的建模难度,通过对解释变量数据集的每个状态量与因变量进行相关性分析,剔除相关系数低的状态量以降低特征矩阵维度,简化模型,
Figure FDA0003108749470000041
Figure FDA0003108749470000042
其中,
Figure FDA0003108749470000043
Figure FDA0003108749470000044
分别为
Figure FDA0003108749470000045
Figure FDA0003108749470000046
的均值,
Figure FDA0003108749470000047
Figure FDA0003108749470000048
Figure FDA0003108749470000049
间的相关系数,给定系数阈值rTH=0.8,根据阈值滤波完成特征选择,
Figure FDA00031087494700000410
其中,
Figure FDA00031087494700000411
Figure FDA00031087494700000412
分别表示经过特征选择后的解释变量数据集和因变量数据集,
Figure FDA00031087494700000413
表示数据集
Figure FDA00031087494700000414
的状态量个数;
4)训练样本集和测试样本集的划分:根据数据集记录时间顺序,将解释变量数据集
Figure FDA00031087494700000415
与对应因变量数据集
Figure FDA00031087494700000416
划分成四个子数据集,其中,前80%的解释变量数据集
Figure FDA00031087494700000417
与对应因变量数据集
Figure FDA00031087494700000418
构成训练样本集Xtrain和Ytrain;后20%的解释变量数据集
Figure FDA00031087494700000419
与对应因变量数据集
Figure FDA00031087494700000420
构成测试样本集Xtest和Ytest
L1=ROUND(0.8*L) (17)
Figure FDA00031087494700000421
其中,L1表示训练样本集的样本长度;
5)在训练样本集上,构建多尺度高斯核函数偏最小二乘回归模型,
记E0和F0分别为经过标准化后的训练样本集,相应标准化公式为
Figure FDA0003108749470000051
其中,
Figure FDA0003108749470000052
Figure FDA0003108749470000053
分别表示
Figure FDA0003108749470000054
和Ytrain的均值,
Figure FDA0003108749470000055
Figure FDA0003108749470000056
为对应的标准差;
通过设计多尺度高斯核函数把输入空间
Figure FDA0003108749470000057
映射到高维特征空间H,即Φ:
Figure FDA0003108749470000058
Figure FDA0003108749470000059
Figure FDA00031087494700000510
其中,Φ(·)表示从输入空间到其特征空间(希尔伯特空间)的非线性映射,Θ表示核格拉姆矩阵,矩阵中的元素Θ(i,j)采用多尺度高斯核函数,σl是宽度参数;
在高维特征空间H上构造线性偏最小二乘回归模型,
Figure FDA00031087494700000511
Figure FDA00031087494700000512
uh=Fhch,uh←uh/||uh|| (24)
Figure FDA00031087494700000513
Figure FDA00031087494700000514
其中,th和uh分别为特征空间中Θh和Fh的得分分量,ch表示Fh的权值分量,h表示所提取成分的下标号,重复公式(22)-(26),得到多尺度核函数偏最小二乘模型,
B=ΦTU(TTΘU)-1TTF0 (27)
Figure FDA0003108749470000061
其中,T、U为得分向量t、u构成的矩阵,成为
Figure FDA0003108749470000062
为拟合结果,将公式(27)代入公式(28),获得训练样本拟合公式
Figure FDA0003108749470000063
当获得新数据时,同样采用公式(19)进行标准化处理,得到Enew,令Θnew=Φ(Enew)Φ(Enew)T,同理得预测模型为
Figure FDA0003108749470000064
其中,Θnew为新数据Enew对应的核格拉姆矩阵,
Figure FDA0003108749470000065
为标准化的预测结果,去标准化
Figure FDA0003108749470000066
即得到对应光伏发电功率的预测值;
6)更新模型参数,建立光伏发电功率的滚动预测模型;
采用滑动窗口法,固定窗口长度m和滑动步长p,重构多尺度高斯核格拉姆矩阵,
Figure FDA0003108749470000067
Figure FDA0003108749470000068
其中,
Figure FDA0003108749470000069
Θ(1)和Θ(2)分别表示窗口滑动前多尺度高斯核格拉姆矩阵和滑动后的重构核格拉姆矩阵,
Figure FDA00031087494700000610
Figure FDA00031087494700000611
分别为构成Θ(1)和Θ(2)的分块矩阵,w∈{11,12,21,22};
7)在测试集上验证模型并给出模型精度评价:采用均方根误差和平均绝对百分比误差指标分别对模型精度进行评价,对应计算公式如下
Figure FDA0003108749470000071
Figure FDA0003108749470000072
其中,
Figure FDA0003108749470000073
为Ytest(t)的预测值,L-L1为待预测样本个数,QRMSE表示RMSE评价指标得分,QMAPE表示MAPE评价指标得分;
8)实现光伏发电功率的滚动预测:首先,根据滑动步长p,继续采集传感器数据Xnew,其次,进行数据预处理和特征选择,得到解释变量数据集
Figure FDA0003108749470000074
然后,根据公式(19)标准化
Figure FDA0003108749470000075
得到Enew,并根据公式(31)重构核格拉姆矩阵Θ(2),最终,将Enew和Θ(2)代入所建立的滚动预测模型(29),实现光伏发电功率的短期滚动预测。
CN202110644827.6A 2021-06-09 2021-06-09 基于改进mkpls的光伏发电功率短期滚动预测方法 Active CN113361782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110644827.6A CN113361782B (zh) 2021-06-09 2021-06-09 基于改进mkpls的光伏发电功率短期滚动预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110644827.6A CN113361782B (zh) 2021-06-09 2021-06-09 基于改进mkpls的光伏发电功率短期滚动预测方法

Publications (2)

Publication Number Publication Date
CN113361782A true CN113361782A (zh) 2021-09-07
CN113361782B CN113361782B (zh) 2022-09-23

Family

ID=77533418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110644827.6A Active CN113361782B (zh) 2021-06-09 2021-06-09 基于改进mkpls的光伏发电功率短期滚动预测方法

Country Status (1)

Country Link
CN (1) CN113361782B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970952A (zh) * 2022-04-14 2022-08-30 楚能新能源股份有限公司 一种考虑环境因素的光伏出力短期预测方法及系统
TWI797806B (zh) * 2021-11-01 2023-04-01 中原大學 使用3維卷積神經網路進行光伏陣列的故障分類裝置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292453A (zh) * 2017-07-24 2017-10-24 国网江苏省电力公司电力科学研究院 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法
CN107392363A (zh) * 2017-07-12 2017-11-24 河海大学 一种ceemd和随机森林的短期风功率预测方法
CN108038580A (zh) * 2017-12-30 2018-05-15 国网江苏省电力公司无锡供电公司 基于同步挤压小波变换的光伏功率多模型综合预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392363A (zh) * 2017-07-12 2017-11-24 河海大学 一种ceemd和随机森林的短期风功率预测方法
CN107292453A (zh) * 2017-07-24 2017-10-24 国网江苏省电力公司电力科学研究院 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法
CN108038580A (zh) * 2017-12-30 2018-05-15 国网江苏省电力公司无锡供电公司 基于同步挤压小波变换的光伏功率多模型综合预测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YAN J: "Wind power grouping forecasts and its uncertainty analysis using optimized relevance vector machine", 《RENEWABLE & SUSTAINABLE ENERGY REVIEWS》 *
朱瑞金: "基于EEMD-MPE-LSSVM的光伏发电功率预测", 《中国测试》 *
李秉晨: "基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测", 《水电能源科学》 *
林翔: "基于排列熵重构的EEMD-RVM短期光伏功率预测", 《宁夏电力》 *
赵辉: "光伏电站短期功率区间预测", 《电源技术》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI797806B (zh) * 2021-11-01 2023-04-01 中原大學 使用3維卷積神經網路進行光伏陣列的故障分類裝置
CN114970952A (zh) * 2022-04-14 2022-08-30 楚能新能源股份有限公司 一种考虑环境因素的光伏出力短期预测方法及系统

Also Published As

Publication number Publication date
CN113361782B (zh) 2022-09-23

Similar Documents

Publication Publication Date Title
CN112949945B (zh) 一种改进双向长短期记忆网络的风电功率超短期预测方法
CN112161784B (zh) 基于多传感器信息融合迁移网络的机械故障诊断方法
CN111967688B (zh) 一种基于卡尔曼滤波器与卷积神经网络的电力负荷预测方法
CN110309603B (zh) 一种基于风速特性的短期风速预测方法及系统
CN111582551B (zh) 风电场短期风速预测方法、系统及电子设备
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN112434848B (zh) 基于深度信念网络的非线性加权组合风电功率预测方法
CN110826791A (zh) 一种基于长短时记忆神经网络的混合风功率预测方法
CN113361782B (zh) 基于改进mkpls的光伏发电功率短期滚动预测方法
CN112288193A (zh) 基于注意力机制的gru深度学习的海洋站表层盐度预测方法
CN114218872B (zh) 基于dbn-lstm半监督联合模型的剩余使用寿命预测方法
CN111242353A (zh) 风电功率组合预测建模和预测方法
CN116258269A (zh) 一种基于负荷特征分解的超短期负荷动态预测方法
CN113687433A (zh) 一种基于Bi-LSTM的大地电磁信号去噪方法及系统
CN117114160A (zh) 一种短期光伏功率预测方法
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN115271225A (zh) 一种基于小波降噪和神经网络的风力-风功率建模方法
CN114298132A (zh) 风电功率预测方法及装置、电子设备
CN114676622A (zh) 基于自编码器深度学习模型的短期光伏功率预测方法
CN114153826A (zh) 基于增强卷积去噪算法的风电机组数据清洗方法及装置
CN113111592A (zh) 一种基于emd-lstm的短期风电功率预测方法
CN116739172A (zh) 一种基于爬坡识别的海上风电功率超短期预测方法及装置
CN116070768A (zh) 一种基于数据重构和TCN-BiLSTM的短期风电功率预测方法
CN115860165A (zh) 一种考虑初损的神经网络流域降雨径流预报方法及系统
CN113449920A (zh) 一种风电功率预测方法、系统及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant