CN115423145A - 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 - Google Patents
一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 Download PDFInfo
- Publication number
- CN115423145A CN115423145A CN202210887105.8A CN202210887105A CN115423145A CN 115423145 A CN115423145 A CN 115423145A CN 202210887105 A CN202210887105 A CN 202210887105A CN 115423145 A CN115423145 A CN 115423145A
- Authority
- CN
- China
- Prior art keywords
- day
- photovoltaic power
- predicted
- lstm
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 37
- 238000000354 decomposition reaction Methods 0.000 claims description 19
- 238000010248 power generation Methods 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 9
- 230000005855 radiation Effects 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 230000003190 augmentative effect Effects 0.000 claims description 4
- 238000009792 diffusion process Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000035939 shock Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000003672 processing method Methods 0.000 claims 1
- 238000007621 cluster analysis Methods 0.000 abstract description 2
- 230000002354 daily effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000002411 adverse Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Power Engineering (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于Kmeans‑VMD‑WT‑LSTM的光伏功率预测方法,可以实现更高精度的光伏功率预测,通过使用KMeans算法对历史数据进行聚类分析,对不同天气状况分别进行了建模,提高了预测精度;针对实际数据非线性、非平稳和高噪声的特点,使用VMD‑WT算法对分类后的数据进行预处理;最后利用LSTM算法对历史数据进行建模,并实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
Description
技术领域
本发明涉及一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法。
背景技术
作为可再生清洁能源,太阳能凭借着其得天独厚的优势受到了广泛的关注。但是光伏电站的发电功率波动较大,在并网时会对电网造成不良影响,这也是目前太阳能所面临的最大问题。如果能对光伏发电的功率进行精准预测,那么可以大幅降低光伏发电并网时的不良影响,提高电网稳定性。
目前光伏发电预测的方法主要分为物理预测法和统计时间序列预测法。物理预测法不依赖历史数据,以实时获得的数据和模型进行预测,但对模型的精准度有严苛的要求,并且受气象天气变化的影响,抗干扰性差且精度不高。而基于统计方法的时间序列预测则充分考虑了历史数据,随着人工智能的发展,支持向量机、人工神经网络、卷积神经网络和循环神经网络等已应用于光伏发电预测,取得了不错的效果,但仍存在鲁棒性差,对参数选择敏感等问题。单一的算法很难满足高鲁棒性以及高精度的预测需求。
因此本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,可以实现更高精度的光伏功率预测。使用KMeans算法对历史数据进行聚类分析,对不同天气状况分别进行了建模,提高了预测精度;针对实际数据非线性、非平稳和高噪声的特点,使用VMD-WT算法对分类后的数据进行预处理;最后利用LSTM算法对历史数据进行建模,并实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
发明内容
为了解决现有光伏功率预测方法的不足,本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,克服了现有技术存在的问题。
本发明解决上述技术问题是通过如下技术方案予以实现的:
一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,步骤如下:
步骤一:获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化;
步骤二:构建不同天气条件下相应的训练集,利用Kmeans算法对天气数据进行聚类分析,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天;
步骤三:分别对以上三种天气的训练集进行预处理,通过VMD 分解将功率序列分解为一系列IMF分量,筛选出相关性更高的模态序列,并利用WT进行降噪,最后融合各序列形成预处理后的训练集;
步骤四:利用LSTM网络对上述各天气条件下的训练集进行建模;
步骤五:采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏功率输入训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
进一步地,所述步骤二中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,输入输出组合为:
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;和为第i天和第i+1天的日均全球水平辐射参数样本;和为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;和为第i天和第i+1天的日均风速参数样本;和为第i天和第i+1 天的日均相对湿度参数样本;Pi+1为输出变量,代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,从光伏电站的每日天气数据样本中分别挑选晴天、阴天、雨雪天各一天数据样本,以这三个数据样本作为聚类中心,按距离最短原则将其它数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止。
进一步地,所述步骤三中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
步骤S314,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,增广拉格朗日表达式如下:
步骤S315,利用乘法算子交替方向法计算上述增广拉格朗日最优解的方法为:
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk:
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
其中,ε为预设停止迭代阈值;
通过VMD算法,可以获得K个IMF分量,实现信号的自适应分解;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量;
步骤S321,相关系数计算公式如下:
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,则IMF1-IMFh为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列进行WT 降噪:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,融合降噪后的各模态分量序列,用于后续建模训练。
进一步地,所述步骤四中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,具体计算过程如下:
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it和构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵;bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数。
进一步地,所述LSTM神经网络相关参数为:两层LSTM结构,1个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM 包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
进一步地,所述步骤五中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,计算每个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,使用与待预测日同属一类天气的训练集训练的 LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测。
本发明与现有技术相比的优点在于:本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,采用Kmeans算法对历史功率数据进行聚类,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天,利用Kmeans-VMD-WT-LSTM算法对上述三个聚类类别的样本进行训练,可以对当天未来时间段光伏电站的光伏发电功率进行精准的预测,具有较高的预测精度。
附图说明
图1是本实施例算法流程图;
图2是本实施例光伏功率预测结果1;
图3是本实施例光伏功率预测结果2。
具体实施方式
下面结合附图对本发明的技术方案做进一步详细说明。
本发明提供了一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,流程框图如图1所示,步骤如下:
步骤一:获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化,在本实施例中,我们数据集采用的是澳大利亚Alice springs的 eco-Kinetics光伏电站,最大功率26.5kW;
步骤二:构建不同天气条件下相应的训练集,根据光照、温度、湿度、风速等气象参数,利用Kmeans算法进行聚类分析,根据聚类结果将天气类型分为三类,分别为晴天、阴天、雨雪天;
步骤三:分别对以上三种天气的训练集进行预处理,通过VMD 分解将光伏电站历史发电功率序列分解为一系列IMF分量,不同的 IMF分量对应不同尺度上的信息,筛选出与发电功率相关性更高的 IMF分量,并利用WT进行降噪,降低噪声对后续建模的干扰,得到经过预处理后的多个序列,最后融合各序列形成预处理后的训练集;
步骤四:由于不同天气条件下,光伏电站历史发电功率差别较大,因此我们利用LSTM网络对上述三类天气条件下的训练集分别进行建模,获得三个不同的模型,可以提高光伏电站历史发电功率在不同环境下的预测精度;
步骤五:采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏电站历史发电功率输入到训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
进一步地,所述步骤二中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,气象参数的选取对模型预测精度影响,我们选取了日均全球水平辐射、日均扩散水平辐射、最大环境温度、最小环境温度、日均风速和日均相对湿度作为气象参数,最终确定的输入输出组合为:
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;和为第i天和第i+1天的日均全球水平辐射参数样本;和为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和 T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;和为第i天和第i+1天的日均风速参数样本;和为第i天和第i+1天的日均相对湿度参数样本;Pi+1为输出变量,代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,根据已知的天气信息,从光伏电站的每日天气数据样本中分别挑选晴天(2021年1月30日)、阴天(2021年1月27日)、雨雪天(2021年1月24日)各一天数据样本,然后以这三个数据样本作为聚类中心,根据欧式距离最短原则将其它光伏电站的每日天气数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止,获得分类好的光伏电站每日的天气情况。
进一步地,所述步骤三中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
步骤S314,为了求解上述约束变分模型,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,其增广拉格朗日表达式如下:
步骤S315,在这里,我们利用乘法算子交替方向法计算上述增广拉格朗日最优解:
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk:
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
其中,ε为预设停止迭代阈值;
通过VMD算法,在本数据集中获得了8个IMF分量,实现信号的自适应分解,不同的IMF分量代表不同尺度上的信息,;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量,舍去相关性较低的模态分量,提高模型预测精度;
步骤S321,相关系数计算公式如下:
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,在本数据中,h为4,即 IMF1-IMF4为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列分别进行 WT降噪,降低数据噪声对后续建模的影响:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,将降噪后的各模态分量序列相加,获得融合后的数据集,用于后续建模训练。
进一步地,所述步骤四中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,可以实现高精度的时间序列预测,解决了传统循环神经网络易梯度爆炸的问题,具体计算过程如下:
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it和构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵; bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数。
进一步地,本文使用的LSTM神经网络包括两层LSTM结构与1 个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM 包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
进一步地,所述步骤五中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,在本实施例中,我们以2021年6月22日(澳大利亚冬季)和2021年12月22日(澳大利亚夏季)为例进行了预测,首先分别计算三个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
最终判断出2021年6月22日为阴天,2021年12月22日为晴天;
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,待预测日(2021年6月22日)使用阴天的训练集训练的LSTM模型,待预测日(2021年12月22日)使用晴天的训练集训练的LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测,图3为 2021年12月22日光伏电站功率预测效果,实线为光伏功率真实值,虚线为光伏功率预测值,可以看出本发明可以实现较高精度的光伏功率预测。
本发明的技术内容及技术特种已揭示如上,然而熟悉本领域的技术人员仍可能基于本发明的教示及揭示而作种种不背离本发明精神的替换和修饰,因此,本发明保护范围应不限于实施例所揭示的内容,而应包括各种不背离本发明的替换和修饰,并为本专利申请权利要求所涵盖。
Claims (5)
1.一种基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,步骤如下:
步骤S1,获取光伏电站历史发电功率以及气象站天气信息等数据,并对数据进行清洗,修正缺失值、离群点等异常数据,并进行归一化;
步骤S2,构建不同天气条件下相应的训练集,利用Kmeans算法对天气数据进行聚类分析,根据聚类结果对天气类型进行归类,分别为晴天、阴天、雨雪天;
步骤S3,分别对以上三种天气的训练集进行预处理,通过VMD分解将功率序列分解为一系列IMF分量,筛选出相关性更高的模态序列,并利用WT进行降噪,最后融合各序列形成预处理后的训练集;
步骤S4,利用LSTM网络对上述各天气条件下的训练集进行建模;
步骤S5,采用欧式距离判断待预测日所属的类别,进而选取与待预测日同属一类的训练模型,将待预测日的待预测时刻前2h的气象参数和光伏功率输入训练模型中,实现对待预测日光伏电站各个时刻的光伏功率输出的预测。
2.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于所述步骤S2中构建不同天气条件下相应的训练集的方法包括以下步骤:
步骤S21,将待预测日前一天的气象参数、各个时刻功率值和当天的气象参数作为训练集输入变量,待预测日当天各个时刻的功率为输出变量,输入输出组合为:
其中i为日期序号,代表天数;Pi为第i天的各个时刻的功率参数样本;和为第i天和第i+1天的日均全球水平辐射参数样本;和为第i天和第i+1天的日均扩散水平辐射参数样本;Timax和T(i+1)max为第i天和第i+1天的最大环境温度参数样本;Timin和T(i+1)min为第i天和第i+1天的最小环境温度参数样本;和为第i天和第i+1天的日均风速参数样本;和为第i天和第i+1天的日均相对湿度参数样本;Pi+1为输出变量;代表第i+1天的各个时刻的输出功率参数样本;
步骤S22,利用Kmeans算法对天气数据进行聚类分析,并根据聚类结果对天气类型进行归类,包括以下步骤:
步骤S221,根据经验设定天气分类数量为三类,分别对应晴天、阴天、雨雪天;
步骤S222,从光伏电站的每日天气数据样本中分别挑选晴天、阴天、雨雪天各一天数据样本,以这三个数据样本作为聚类中心,按距离最短原则将其它数据样本分别分配给最相近的聚类中心,形成三个簇;
步骤S223,将三个簇的均值作为三个新的聚类中心,计算所有数据样本与这三个新聚类中心的距离,用与各个新聚类中心距离最小的数据样本对聚类中心进行更新,并按距离最短原则将其它数据样本重新分配给更新后的聚类中心,得到更新后的三个簇;
重复步骤S223,直到这三个聚类中心不发生变化为止。
3.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于所述步骤S3中数据处理的方法包括以下步骤:
步骤S31:利用VMD算法对功率序列分解的方法为:
步骤S311,对输入序列进行希尔伯特变换,得到各模态函数分量对应的解析信号:
其中,uk(t)为第k个模态函数;δ(t)为冲击函数;j为虚部;t为时间;
其中,ωk为第k个模态函数的中心频率;
步骤S313,计算上述频谱解调信号一阶导数的平方L2范数,估计出各模态函数的带宽,约束变分模型可以表示为:
步骤S314,引入二次惩罚因子α和拉格朗日乘法算子λ(t),计算上述变分模型最优解,增广拉格朗日表达式如下:
步骤S315,利用乘法算子交替方向法计算上述增广拉格朗日最优解的方法为:
步骤S3152,执行循环m=m+1;
步骤S3153,更新uk、ωk:
其中,τ为噪声容忍度;
步骤S3155,重复步骤S3152~S3154,直到满足停止迭代约束条件;
其中,ε为预设停止迭代阈值;
通过VMD算法,可以获得K个IMF分量,实现信号的自适应分解;
步骤S32,根据相关系数判断序列相关性,进而提取相关性更高的模态分量;
步骤S321,相关系数计算公式如下:
其中,x(i)为待计算相关系数的各模态分量;y(i)为原始信号;
步骤S322,计算各模态分量的相关系数,记第一个相关系数小于H的模态分量为IMFh,H取值为0.15,则IMF1-IMFh为相关性更高的模态分量序列;
步骤S33,对上述筛选出的相关性更高的模态分量序列进行WT降噪:
步骤S331,对筛选出序列进行WT降噪的方法为:
步骤S332,小波分解的分解方程为:
步骤S333,通过软阈值函数对含有噪声系数的小波系数进行过滤,完成信号去噪,其阈值函数为:
步骤S334,利用小波逆变换,对各模态序列进行重构,得到滤波后的各模态序列,其公式为:
其中,X为滤波处理后的序列;C为与信号无关的常数;
步骤S34,融合降噪后的各模态分量序列,用于后续建模训练。
4.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于,所述步骤S4中使用的LSTM网络由遗忘门、输入门和输出门三部分组成,具体计算过程如下:
ft=σg(Wfyt+Ufht-1+bf)
it=σg(Wiyt+Uiht-1+bi)
其中,yt为输入序列;ht为输出序列;ft为遗忘门;it和构成输入门;ot为输出门;ct为记忆细胞状态;W和U为权重矩阵;bf、bi、bc、bo为偏差向量;σg为Sigmod激活函数;σh为双曲正切函数;
进一步地,所述LSTM神经网络相关参数为:两层LSTM结构,1个全连接层;第一层LSTM包含36个LSTM Cell单元,第二层LSTM包含28个LSTM Cell单元;优化器采用自适应矩估计优化器Adam,可以根据训练过程中的梯度对学习率进行动态调整;Dropout层添加在全连接层上,根据设定的比率值随机为网络中神经元赋值零权重,避免过拟合。
5.根据权利要求1所述的基于Kmeans-VMD-WT-LSTM的光伏功率预测方法,其特征在于,所述步骤S5中对待预测日光伏电站各个时刻的光伏功率输出预测的方法包括以下步骤:
步骤S51,计算每个聚类气象特征值的中心点,利用欧式距离计算待预测日于每个聚类中心点的距离,距离最近的聚类即为待预测日所属类别,欧氏距离公式如下:
步骤S52,利用训练模型对待预测日光伏电站各个时刻的光伏功率输出进行预测,使用与待预测日同属一类天气的训练集训练的LSTM模型,输入样本的参数与步骤S21的输入样本参数设置相同,对待预测日的每隔一小时的发电功率进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210887105.8A CN115423145A (zh) | 2022-07-26 | 2022-07-26 | 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210887105.8A CN115423145A (zh) | 2022-07-26 | 2022-07-26 | 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115423145A true CN115423145A (zh) | 2022-12-02 |
Family
ID=84196752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210887105.8A Pending CN115423145A (zh) | 2022-07-26 | 2022-07-26 | 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115423145A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432874A (zh) * | 2023-06-14 | 2023-07-14 | 青岛鼎信通讯科技有限公司 | 一种基于特征功率的分布式光伏功率预测方法 |
CN117829000A (zh) * | 2024-03-04 | 2024-04-05 | 中铁建设集团有限公司 | 一种基于实时力学分析的光伏系统调控方法 |
-
2022
- 2022-07-26 CN CN202210887105.8A patent/CN115423145A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116432874A (zh) * | 2023-06-14 | 2023-07-14 | 青岛鼎信通讯科技有限公司 | 一种基于特征功率的分布式光伏功率预测方法 |
CN117829000A (zh) * | 2024-03-04 | 2024-04-05 | 中铁建设集团有限公司 | 一种基于实时力学分析的光伏系统调控方法 |
CN117829000B (zh) * | 2024-03-04 | 2024-06-04 | 中铁建设集团有限公司 | 一种基于实时力学分析的光伏系统调控方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110059878B (zh) | 基于cnn lstm光伏发电功率预测模型及其构建方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN106779223B (zh) | 一种光伏系统发电功率实时预测方法及装置 | |
CN115423145A (zh) | 一种基于Kmeans-VMD-WT-LSTM方法的光伏功率预测方法 | |
CN110648017A (zh) | 一种基于二层分解技术的短期冲击负荷预测方法 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN113705877A (zh) | 基于深度学习模型的实时月径流预报方法 | |
CN109583588B (zh) | 一种短期风速预测方法及系统 | |
CN113486303A (zh) | 一种基于修饰模型集成的长时间序列预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN111369045A (zh) | 一种短期光伏发电功率预测的方法 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 | |
CN115186923A (zh) | 光伏发电功率的预测方法、装置及电子设备 | |
CN112182709A (zh) | 大型水库叠梁门分层取水设施的下泄水温快速预测方法 | |
CN114118596A (zh) | 一种光伏发电量预测方法和装置 | |
CN115907195A (zh) | 一种光伏发电功率预测方法、系统、电子设备及介质 | |
CN110795841B (zh) | 一种间歇性能源出力不确定性的数学建模方法 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN114266416A (zh) | 基于相似日的光伏发电功率短期预测方法、装置及存储介质 | |
CN113537469A (zh) | 一种基于LSTM网络和Attention机制的城市需水预测方法 | |
CN116341728A (zh) | 一种基于数据驱动的超短期光伏输出功率预测方法 | |
CN116523142A (zh) | 一种考虑时空特性聚类的光伏集群区间预测方法 | |
CN113449920A (zh) | 一种风电功率预测方法、系统及计算机可读介质 | |
CN117458480A (zh) | 基于改进lof的光伏发电功率短期预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |