CN115423145A - 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 - Google Patents

一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 Download PDF

Info

Publication number
CN115423145A
CN115423145A CN202210887105.8A CN202210887105A CN115423145A CN 115423145 A CN115423145 A CN 115423145A CN 202210887105 A CN202210887105 A CN 202210887105A CN 115423145 A CN115423145 A CN 115423145A
Authority
CN
China
Prior art keywords
day
photovoltaic power
predicted
lstm
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210887105.8A
Other languages
English (en)
Inventor
任江
陈维玲
赵帅
周一览
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pan Pacific Energy Environment Zhejiang Co ltd
Original Assignee
Pan Pacific Energy Environment Zhejiang Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pan Pacific Energy Environment Zhejiang Co ltd filed Critical Pan Pacific Energy Environment Zhejiang Co ltd
Priority to CN202210887105.8A priority Critical patent/CN115423145A/zh
Publication of CN115423145A publication Critical patent/CN115423145A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Power Engineering (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Kmeans‑VMD‑WT‑LSTM的光伏功率预测方法,可以实现更高精度的光伏功率预测,通过使用KMeans算法对历史数据进行聚类分析,对不同天气状况分别进行了建模,提高了预测精度;针对实际数据非线性、非平稳和高噪声的特点,使用VMD‑WT算法对分类后的数据进行预处理;最后利用LSTM算法对历史数据进行建模,并实现对待预测日光伏电站各个时刻的光伏功率输出的预测。

Description

一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法
技术领域
本发明涉及一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法。
背景技术
作为可再生清洁能源,太阳能凭借着其得天独厚的优势受到了广泛的关注。但是光伏电站的发电功率波动较大,在并网时会对电网造成不良影响,这也是目前太阳能所面临的最大问题。如果能对光伏发电的功率进行精准预测,那么可以大幅降低光伏发电并网时的不良影响,提高电网稳定性。
目前光伏发电预测的方法主要分为物理预测法和统计时间序列预测法。物理预测法不依赖历史数据,以实时获得的数据和模型进行预测,但对模型的精准度有严苛的要求,并且受气象天气变化的影响,抗干扰性差且精度不高。而基于统计方法的时间序列预测则充分考虑了历史数据,随着人工智能的发展,支持向量机、人工神经网络、卷积神经网络和循环神经网络等已应用于光伏发电预测,取得了不错的效果,但仍存在鲁棒性差,对参数选择敏感等问题。单一的算法很难满足高鲁棒性以及高精度的预测需求。
因此本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,可以实现更高精度的光伏功率预测。使用KMeans算法对历史数据进行聚类分析,对不同天气状况分别进行了建模,提高了预测精度;针对实际数据非线性、非平稳和高噪声的特点,使用VMD-WT算法对分类后的数据进行预处理;最后利用LSTM算法对历史数据进行建模,并实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
发明内容
为了解决现有光伏功率预测方法的不足,本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,克服了现有技术存在的问题。
本发明解决上述技术问题是通过如下技术方案予以实现的:
一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,步骤如下:
步骤一:获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化;
步骤二:构建不同天气条件下相应的训练集,利用Kmeans算法对天气数据进行聚类分析,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天;
步骤三:分别对以上三种天气的训练集进行预处理,通过VMD 分解将功率序列分解为一系列IMF分量,筛选出相关性更高的模态序列,并利用WT进行降噪,最后融合各序列形成预处理后的训练集;
步骤四:利用LSTM网络对上述各天气条件下的训练集进行建模;
步骤五:采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏功率输入训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
进一步地,所述步骤二中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,输入输出组合为:
Figure RE-GDA0003897957110000031
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;
Figure RE-GDA0003897957110000032
Figure RE-GDA0003897957110000033
为第i天和第i+1天的日均全球水平辐射参数样本;
Figure RE-GDA0003897957110000034
Figure RE-GDA0003897957110000035
为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;
Figure RE-GDA0003897957110000036
Figure RE-GDA0003897957110000037
为第i天和第i+1天的日均风速参数样本;
Figure RE-GDA0003897957110000038
Figure RE-GDA0003897957110000039
为第i天和第i+1 天的日均相对湿度参数样本;Pi+1为输出变量,代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,从光伏电站的每日天气数据样本中分别挑选晴天、阴天、雨雪天各一天数据样本,以这三个数据样本作为聚类中心,按距离最短原则将其它数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止。
进一步地,所述步骤三中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
Figure RE-GDA0003897957110000041
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
步骤S312,构造模态函数中心频率的指数项
Figure RE-GDA0003897957110000042
获得相应模态函数在基频带的模态频谱:
Figure RE-GDA0003897957110000043
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
Figure RE-GDA0003897957110000044
其中,
Figure RE-GDA0003897957110000045
表示为约束变量;
步骤S314,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,增广拉格朗日表达式如下:
Figure RE-GDA0003897957110000046
步骤S315,利用乘法算子交替方向法计算上述增广拉格朗日最优解的方法为:
步骤S3151,初始化
Figure RE-GDA0003897957110000047
λ1、m;
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk
Figure RE-GDA0003897957110000051
Figure RE-GDA0003897957110000052
其中,ω为频率;
Figure RE-GDA0003897957110000053
分别为
Figure RE-GDA0003897957110000054
f(ω)、λ(ω)对应的傅里叶变换;k为第k个模态;K为分解层数;
步骤S3154,更新
Figure RE-GDA0003897957110000055
Figure RE-GDA0003897957110000056
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
Figure RE-GDA0003897957110000057
其中,ε为预设停止迭代阈值;
通过VMD算法,可以获得K个IMF分量,实现信号的自适应分解;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量;
步骤S321,相关系数计算公式如下:
Figure RE-GDA0003897957110000058
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,则IMF1-IMFh为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列进行WT 降噪:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
Figure RE-GDA0003897957110000061
Figure RE-GDA0003897957110000062
其中,
Figure RE-GDA0003897957110000063
表示分解后的小波系数;jx为分解层数;kx表示调节系数;
Figure RE-GDA0003897957110000064
表示小波系函数;f表示待分解序列;a为尺度参数;b为平移参数;tx表示小波系函数支撑域;
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
Figure RE-GDA0003897957110000065
其中,
Figure RE-GDA0003897957110000066
N表示信号长度;σ表示噪声标准差;
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
Figure RE-GDA0003897957110000067
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,融合降噪后的各模态分量序列,用于后续建模训练。
进一步地,所述步骤四中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,具体计算过程如下:
Figure RE-GDA0003897957110000068
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it
Figure RE-GDA0003897957110000069
构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵;bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数。
进一步地,所述LSTM神经网络相关参数为:两层LSTM结构,1个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM 包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
进一步地,所述步骤五中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,计算每个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
Figure RE-GDA0003897957110000071
其中,d0i为待预测日与每个聚类中心点的欧式距离;x0为待预测日的气象特征值;
Figure RE-GDA0003897957110000072
为第i个聚类气象特征值中心点;
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,使用与待预测日同属一类天气的训练集训练的 LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测。
本发明与现有技术相比的优点在于:本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,采用Kmeans算法对历史功率数据进行聚类,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天,利用Kmeans-VMD-WT-LSTM算法对上述三个聚类类别的样本进行训练,可以对当天未来时间段光伏电站的光伏发电功率进行精准的预测,具有较高的预测精度。
附图说明
图1是本实施例算法流程图;
图2是本实施例光伏功率预测结果1;
图3是本实施例光伏功率预测结果2。
具体实施方式
下面结合附图对本发明的技术方案做进一步详细说明。
本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,流程框图如图1所示,步骤如下:
步骤一:获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化,在本实施例中,我们数据集采用的是澳大利亚Alice springs的 eco-Kinetics光伏电站,最大功率26.5kW;
步骤二:构建不同天气条件下相应的训练集,根据光照、温度、湿度、风速等气象参数,利用Kmeans算法进行聚类分析,根据聚类结果将天气类型分为三类,分别为晴天、阴天、雨雪天;
步骤三:分别对以上三种天气的训练集进行预处理,通过VMD 分解将光伏电站历史发电功率序列分解为一系列IMF分量,不同的 IMF分量对应不同尺度上的信息,筛选出与发电功率相关性更高的 IMF分量,并利用WT进行降噪,降低噪声对后续建模的干扰,得到经过预处理后的多个序列,最后融合各序列形成预处理后的训练集;
步骤四:由于不同天气条件下,光伏电站历史发电功率差别较大,因此我们利用LSTM网络对上述三类天气条件下的训练集分别进行建模,获得三个不同的模型,可以提高光伏电站历史发电功率在不同环境下的预测精度;
步骤五:采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏电站历史发电功率输入到训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
进一步地,所述步骤二中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,气象参数的选取对模型预测精度影响,我们选取了日均全球水平辐射、日均扩散水平辐射、最大环境温度、最小环境温度、日均风速和日均相对湿度作为气象参数,最终确定的输入输出组合为:
Figure RE-GDA0003897957110000091
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;
Figure RE-GDA0003897957110000092
Figure RE-GDA0003897957110000093
为第i天和第i+1天的日均全球水平辐射参数样本;
Figure RE-GDA0003897957110000094
Figure RE-GDA0003897957110000095
为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和 T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;
Figure RE-GDA0003897957110000096
Figure RE-GDA0003897957110000097
为第i天和第i+1天的日均风速参数样本;
Figure RE-GDA0003897957110000098
Figure RE-GDA0003897957110000099
为第i天和第i+1天的日均相对湿度参数样本;Pi+1为输出变量,代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,根据已知的天气信息,从光伏电站的每日天气数据样本中分别挑选晴天(2021年1月30日)、阴天(2021年1月27日)、雨雪天(2021年1月24日)各一天数据样本,然后以这三个数据样本作为聚类中心,根据欧式距离最短原则将其它光伏电站的每日天气数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止,获得分类好的光伏电站每日的天气情况。
进一步地,所述步骤三中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
Figure RE-GDA0003897957110000101
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
步骤S312,构造模态函数中心频率的指数项
Figure RE-GDA0003897957110000102
获得相应模态函数在基频带的模态频谱:
Figure RE-GDA0003897957110000103
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
Figure RE-GDA0003897957110000104
其中,
Figure RE-GDA0003897957110000105
表示为约束变量;
步骤S314,为了求解上述约束变分模型,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,其增广拉格朗日表达式如下:
Figure RE-GDA0003897957110000111
步骤S315,在这里,我们利用乘法算子交替方向法计算上述增广拉格朗日最优解:
步骤S3151,初始化
Figure RE-GDA0003897957110000112
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk
Figure RE-GDA0003897957110000113
Figure RE-GDA0003897957110000114
其中,ω为频率;
Figure RE-GDA0003897957110000115
分别为
Figure RE-GDA0003897957110000116
f(ω)、λ(ω) 对应的傅里叶变换;k为第k个模态;K为分解层数;
步骤S3154,更新
Figure RE-GDA0003897957110000117
Figure RE-GDA0003897957110000118
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
Figure RE-GDA0003897957110000119
其中,ε为预设停止迭代阈值;
通过VMD算法,在本数据集中获得了8个IMF分量,实现信号的自适应分解,不同的IMF分量代表不同尺度上的信息,;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量,舍去相关性较低的模态分量,提高模型预测精度;
步骤S321,相关系数计算公式如下:
Figure RE-GDA0003897957110000121
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,在本数据中,h为4,即 IMF1-IMF4为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列分别进行 WT降噪,降低数据噪声对后续建模的影响:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
Figure RE-GDA0003897957110000122
Figure RE-GDA0003897957110000123
其中,
Figure RE-GDA0003897957110000124
表示分解后的小波系数;jx为分解层数;kx表示调节系数;
Figure RE-GDA0003897957110000125
表示小波系函数;f表示待分解序列;a为尺度参数;b为平移参数;tx表示小波系函数支撑域;
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
Figure RE-GDA0003897957110000126
其中,
Figure RE-GDA0003897957110000127
N表示信号长度;σ表示噪声标准差;
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
Figure RE-GDA0003897957110000128
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,将降噪后的各模态分量序列相加,获得融合后的数据集,用于后续建模训练。
进一步地,所述步骤四中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,可以实现高精度的时间序列预测,解决了传统循环神经网络易梯度爆炸的问题,具体计算过程如下:
Figure RE-GDA0003897957110000131
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it
Figure RE-GDA0003897957110000132
构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵; bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数。
进一步地,本文使用的LSTM神经网络包括两层LSTM结构与1 个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM 包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
进一步地,所述步骤五中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,在本实施例中,我们以2021年6月22日(澳大利亚冬季)和2021年12月22日(澳大利亚夏季)为例进行了预测,首先分别计算三个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
Figure RE-GDA0003897957110000141
其中,d0i为待预测日与每个聚类中心点的欧式距离;x0为待预测日的气象特征值;
Figure RE-GDA0003897957110000142
为第i个聚类气象特征值中心点;
最终判断出2021年6月22日为阴天,2021年12月22日为晴天;
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,待预测日(2021年6月22日)使用阴天的训练集训练的LSTM模型,待预测日(2021年12月22日)使用晴天的训练集训练的LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测,图3为 2021年12月22日光伏电站功率预测效果,实线为光伏功率真实值,虚线为光伏功率预测值,可以看出本发明可以实现较高精度的光伏功率预测。
本发明的技术内容及技术特种已揭示如上,然而熟悉本领域的技术人员仍可能基于本发明的教示及揭示而作种种不背离本发明精神的替换和修饰,因此,本发明保护范围应不限于实施例所揭示的内容,而应包括各种不背离本发明的替换和修饰,并为本专利申请权利要求所涵盖。

Claims (5)

1.一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,步骤如下:
步骤S1,获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化;
步骤S2,构建不同天气条件下相应的训练集,利用Kmeans算法对天气数据进行聚类分析,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天;
步骤S3,分别对以上三种天气的训练集进行预处理,通过VMD分解将功率序列分解为一系列IMF分量,筛选出相关性更高的模态序列,并利用WT进行降噪,最后融合各序列形成预处理后的训练集;
步骤S4,利用LSTM网络对上述各天气条件下的训练集进行建模;
步骤S5,采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏功率输入训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
2.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于所述步骤S2中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,输入输出组合为:
Figure RE-FDA0003897957100000011
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;
Figure RE-FDA0003897957100000021
Figure RE-FDA0003897957100000022
为第i天和第i+1天的日均全球水平辐射参数样本;
Figure RE-FDA0003897957100000023
Figure RE-FDA0003897957100000024
为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;
Figure RE-FDA0003897957100000025
Figure RE-FDA0003897957100000026
为第i天和第i+1天的日均风速参数样本;
Figure RE-FDA0003897957100000027
Figure RE-FDA0003897957100000028
为第i天和第i+1天的日均相对湿度参数样本;Pi+1为输出变量;代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,从光伏电站的每日天气数据样本中分别挑选晴天、阴天、雨雪天各一天数据样本,以这三个数据样本作为聚类中心,按距离最短原则将其它数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止。
3.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于所述步骤S3中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
Figure RE-FDA0003897957100000031
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
步骤S312,构造模态函数中心频率的指数项
Figure RE-FDA0003897957100000032
获得相应模态函数在基频带的模态频谱:
Figure RE-FDA0003897957100000033
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
Figure RE-FDA0003897957100000034
其中,
Figure RE-FDA0003897957100000035
表示为约束变量;
步骤S314,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,增广拉格朗日表达式如下:
Figure RE-FDA0003897957100000036
步骤S315,利用乘法算子交替方向法计算上述增广拉格朗日最优解的方法为:
步骤S3151,初始化
Figure RE-FDA0003897957100000037
λ1、m;
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk
Figure RE-FDA0003897957100000038
其中,ω为频率;
Figure RE-FDA0003897957100000041
分别为
Figure RE-FDA0003897957100000042
f(ω)、λ(ω)对应的傅里叶变换;k为第k个模态;K为分解层数;
步骤S3154,更新
Figure RE-FDA0003897957100000043
Figure RE-FDA0003897957100000044
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
Figure RE-FDA0003897957100000045
其中,ε为预设停止迭代阈值;
通过VMD算法,可以获得K个IMF分量,实现信号的自适应分解;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量;
步骤S321,相关系数计算公式如下:
Figure RE-FDA0003897957100000046
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,则IMF1-IMFh为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列进行WT降噪:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
Figure RE-FDA0003897957100000047
Figure RE-FDA0003897957100000048
其中,
Figure RE-FDA0003897957100000051
表示分解后的小波系数;jx为分解层数;kx表示调节系数;
Figure RE-FDA0003897957100000052
表示小波系函数;f表示待分解序列;a为尺度参数;b为平移参数;tx表示小波系函数支撑域;
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
Figure RE-FDA0003897957100000053
其中
Figure RE-FDA0003897957100000054
N表示信号长度;σ表示噪声标准差;
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
Figure RE-FDA0003897957100000055
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,融合降噪后的各模态分量序列,用于后续建模训练。
4.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于,所述步骤S4中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,具体计算过程如下:
ft=σg(Wfyt+Ufht-1+bf)
it=σg(Wiyt+Uiht-1+bi)
Figure RE-FDA0003897957100000056
Figure RE-FDA0003897957100000057
Figure RE-FDA0003897957100000058
Figure RE-FDA0003897957100000059
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it
Figure RE-FDA00038979571000000510
构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵;bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数;
进一步地,所述LSTM神经网络相关参数为:两层LSTM结构,1个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
5.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于,所述步骤S5中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,计算每个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
Figure RE-FDA0003897957100000061
式中,d0i为待预测日与每个聚类中心点的欧式距离;x0为待预测日的气象特征值;
Figure RE-FDA0003897957100000062
为第i个聚类气象特征值中心点;
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,使用与待预测日同属一类天气的训练集训练的LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测。
CN202210887105.8A 2022-07-26 2022-07-26 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 Pending CN115423145A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210887105.8A CN115423145A (zh) 2022-07-26 2022-07-26 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210887105.8A CN115423145A (zh) 2022-07-26 2022-07-26 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法

Publications (1)

Publication Number Publication Date
CN115423145A true CN115423145A (zh) 2022-12-02

Family

ID=84196752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210887105.8A Pending CN115423145A (zh) 2022-07-26 2022-07-26 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法

Country Status (1)

Country Link
CN (1) CN115423145A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432874A (zh) * 2023-06-14 2023-07-14 青岛鼎信通讯科技有限公司 一种基于特征功率的分布式光伏功率预测方法
CN117829000A (zh) * 2024-03-04 2024-04-05 中铁建设集团有限公司 一种基于实时力学分析的光伏系统调控方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116432874A (zh) * 2023-06-14 2023-07-14 青岛鼎信通讯科技有限公司 一种基于特征功率的分布式光伏功率预测方法
CN117829000A (zh) * 2024-03-04 2024-04-05 中铁建设集团有限公司 一种基于实时力学分析的光伏系统调控方法
CN117829000B (zh) * 2024-03-04 2024-06-04 中铁建设集团有限公司 一种基于实时力学分析的光伏系统调控方法

Similar Documents

Publication Publication Date Title
CN110059878B (zh) 基于cnn lstm光伏发电功率预测模型及其构建方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
CN106779223B (zh) 一种光伏系统发电功率实时预测方法及装置
CN115423145A (zh) 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法
CN110648017A (zh) 一种基于二层分解技术的短期冲击负荷预测方法
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN109583588B (zh) 一种短期风速预测方法及系统
CN113486303A (zh) 一种基于修饰模型集成的长时间序列预测方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN112418476A (zh) 一种超短期电力负荷预测方法
CN111369045A (zh) 一种短期光伏发电功率预测的方法
CN114912666A (zh) 一种基于ceemdan算法和注意力机制的短时客流量预测方法
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN112182709A (zh) 大型水库叠梁门分层取水设施的下泄水温快速预测方法
CN114118596A (zh) 一种光伏发电量预测方法和装置
CN115907195A (zh) 一种光伏发电功率预测方法、系统、电子设备及介质
CN110795841B (zh) 一种间歇性能源出力不确定性的数学建模方法
CN115115125A (zh) 基于深度学习融合模型的光伏功率区间概率预测方法
CN114266416A (zh) 基于相似日的光伏发电功率短期预测方法、装置及存储介质
CN113537469A (zh) 一种基于LSTM网络和Attention机制的城市需水预测方法
CN116341728A (zh) 一种基于数据驱动的超短期光伏输出功率预测方法
CN116523142A (zh) 一种考虑时空特性聚类的光伏集群区间预测方法
CN113449920A (zh) 一种风电功率预测方法、系统及计算机可读介质
CN117458480A (zh) 基于改进lof的光伏发电功率短期预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination