CN115759389A - 基于天气类型的相似日组合策略的日前光伏功率预测方法 - Google Patents

基于天气类型的相似日组合策略的日前光伏功率预测方法 Download PDF

Info

Publication number
CN115759389A
CN115759389A CN202211423091.0A CN202211423091A CN115759389A CN 115759389 A CN115759389 A CN 115759389A CN 202211423091 A CN202211423091 A CN 202211423091A CN 115759389 A CN115759389 A CN 115759389A
Authority
CN
China
Prior art keywords
day
weather
data
power
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211423091.0A
Other languages
English (en)
Inventor
叶泽甫
崔京港
张帅
徐旭东
马跃
阎高伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Gemeng Sino Us Clean Energy R & D Center Co ltd
Original Assignee
Shanxi Gemeng Sino Us Clean Energy R & D Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Gemeng Sino Us Clean Energy R & D Center Co ltd filed Critical Shanxi Gemeng Sino Us Clean Energy R & D Center Co ltd
Priority to CN202211423091.0A priority Critical patent/CN115759389A/zh
Publication of CN115759389A publication Critical patent/CN115759389A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于天气类型的相似日组合策略的日前光伏功率预测方法,包括以下步骤:(1)对已有的光伏功率历史日数据集进行最小最大归一化处理;(2)计算各气象特征对功率的MIV值;(3)对天气类型一致的历史日进行平滑表示多视图聚类;(4)对各天气类型的功率数据的类内距离进行约束;(5)通过交替迭代求解聚类标签;(6)对各个数据集气象特征基于互信息进行特征选择;(7)对各天气类型下的历史日依次构建类内相似日集和全数据相似日集;(8)求取两模型预测值的加权系数;(9)获取最终的功率预测值;本发明充分应用了真实的功率特征信息,可以显著提高波动程度大的天气类型的功率预测精度。

Description

基于天气类型的相似日组合策略的日前光伏功率预测方法
技术领域
本发明涉及光伏功率预测技术领域,具体涉及基于天气类型的相似日组合策略的日前光伏功率预测方法。
背景技术
工业化导致能源需求不断加剧,太阳能作为一种清洁的可再生能源,是应对能源安全与环境污染矛盾之间的有力手段,是实现绿色低碳发展的关键途径。我国光伏产业发展迅速,2021年新增装机容量达5493万千瓦,截至2021年12月底,光伏发电装机容量约3.1亿千瓦。
然而光伏发电功率具有较强的间歇性、随机性和波动性,随着光伏发电在传统电网中装机容量比例上升,为电网能源管理和电力系统调度带来挑战,准确预测光伏功率是保证系统安全运行的关键。传统的光伏发电功率日前预测大多采用确定性估计方法,针对历史数据中不存在天气类型标签的情况,应用历史NWP数值天气预报信息来划分天气类型,建立对应模型完成待预测日天气类型识别和功率预测。但是NWP数据不准确无法对历史日天气类型进行准确划分,导致在功率波动程度大的天气类型下预测精度不高。
发明内容
针对上述存在的技术不足,本发明的目的是提供基于天气类型的相似日组合策略的日前光伏功率预测方法。
为解决上述技术问题,本发明采用如下技术方案:
本发明提供基于天气类型的相似日组合策略的日前光伏功率预测方法,包括以下步骤:
(1)对已有的光伏功率历史日数据集进行最小最大归一化处理;
(2)利用步骤(1)处理后的数据计算各气象特征对功率的MIV值,并取其绝对值作为多视图中各气象视图的权重;
(3)根据步骤(1)处理后的数据,对天气类型一致的历史日进行平滑表示多视图聚类;
(4)对步骤(2)的功率视图进行重构,结合步骤(3)得到的天气类型标签阵对各天气类型的功率数据的类内距离进行约束;
(5)结合步骤(4)的功率视图重构和平滑表示多视图聚类,通过交替迭代求解聚类标签,对历史日聚类为晴天、少云、阴天和多云天气类型;
(6)对步骤(5)聚类的气象特征进行新特征构建,并依据聚类结果将数据集划分为晴天数据集、少云数据集、阴天数据集、多云数据集和全历史数据集,对各个数据集气象特征基于互信息进行特征选择;
(7)结合步骤(6)的数据,按照加权灰色关联度的相似度准则选择相似日,对各天气类型下的历史日依次构建类内相似日集和全数据相似日集;
(8)对步骤(7)构建的历史日的两组相似日集分别建立GBDT模型获取预测值,应用遗传算法求取两模型预测值的加权系数;
(9)由天气预报获取待预测日天气类型,应用该日的NWP数据获取其类内相似日集和全数据相似日集,利用步骤(8)建立的模型,通过该天气类型下的模型加权系数获取最终的功率预测值。
优选地,步骤(1)中的光伏功率历史日数据集包括NWP气象数据和对应时刻的功率数据。
优选地,所述步骤(3)具体包括:
将历史日的NWP数据和功率数据写为视图形式
Figure BDA0003943465360000021
其中,当k=1,…,q时,Vk=[X1,k … Xn,k]T表征气象视图;Vq+1=[y1 … yn]T表征功率视图;
对特定历史日的表征气象视图、表征功率视图进行重构,描述为:
Figure BDA0003943465360000031
其中,vi,j∈Rl×1表示i视图的日序列j,zjk表示历史日j和历史日k的相似性大小为自表示阵系数;ri表示不同视图的权重系数;同时显示地对自表示系数阵进行应用分组效应约束:
Figure BDA0003943465360000032
取相似阵S=(Z+ZT)/2,通过谱聚类算法求解得到天气类型标签阵F∈Rn×C,c为聚类得到的天气类型个数,Fij=1表示历史日i属于天气类型j,Fij=0表示历史日i不属于天气类型j,且
Figure BDA0003943465360000033
优选地,所述步骤(4)具体包括:
将功率视图表示为:
Figure BDA0003943465360000034
其中,P∈Rl×m为投影阵;同时对各天气类型的功率数据的类内距离进行约束,具体描述为:
Figure BDA0003943465360000035
其中,oi是属于天气类型i的功率序列中心,ni是属于天气类型i的历史日天数,
Figure BDA0003943465360000036
是经过系数调整之后的天气类型标签阵。
优选地,所述步骤(5)具体包括:
确定以下总目标函数:
Figure BDA0003943465360000041
其中,ri是各视图的权重系数,功率视图权重系数rq+1默认为1,其余视图特征权重采用MIV方式计算得到的MIV绝对值;α是平滑表示多视图的超参;β是功率重构的超参;
采用交替的方式求解:
固定投影阵P,求解自表示阵Z,即对下式进行求解:
Figure BDA0003943465360000042
对其求导,并设置导数为0,有:
Figure BDA0003943465360000043
由该式得到Z,再计算亲和矩阵S,并应用谱聚类算法可以求解天气类型阵F,并得到系数调整后的天气类型标签
Figure BDA0003943465360000044
固定自表示系数阵Z,求解投影阵P,即对下式进行求解:
Figure BDA0003943465360000045
解为
Figure BDA0003943465360000046
对应的前m个最小特征值对应的特征向量组成的矩阵。
优选地,所述步骤(6)具体包括:
新特征构建:计算各气象特征的一阶后向差分和二阶后向差分,挖掘气象特征动态信息,扩充特征集;
基于互信息的特征选择:在给定离散随机变量X和Y后,X的边缘分布为p(x),Y的边缘分布为p(y),两者的联合概率分布为p(x,y);此时X和Y之间的互信息为
Figure BDA0003943465360000047
计算各数据集中的特征对功率的互信息大小,并对互信息由大到小排列,选取前u个特征作为该数据集相似日选择和功率预测模型建立的特征。
优选地,所述步骤(7)的计算过程为:
定义经过特征构建和特征选择后的历史日数据为Xi=[Xi,1 … Xi,u]∈Rl×u,计算历史日X0和历史日Xi的关于特征k的灰色关联系数εik
Figure BDA0003943465360000051
其中,Xi,k(t)表征气象特征k第t时刻的值,分辨系数μ=0.5;
对应的加权灰色关联度ζi的计算式为:
Figure BDA0003943465360000052
其中,wk为气象特征k对灰度系数的权重,该权重应用CRITIC方法计算得出,采用特征间的对比强度和冲突性来计算,特征k的标准差σk表现对比强度,相关系数ρki衡量冲突性,计算式为:
Figure BDA0003943465360000053
计算历史日d0和数据集内的所有历史日计算灰色关联度,对其由大到小排列,选取前若干个相似日构成历史日d0在该数据集下的相似日集;
定义类内相似日集和全数据相似日集:定义待预测日X0在同天气类型历史日中选择的相似日数据为类内相似日集D0,clus,在全部历史日中选择的相似日数据为全数据相似日集D0,all
优选地,所述步骤(8)中:
GBDT模型表示为:
Figure BDA0003943465360000054
其中,X为输入样本,ht(X)为分类回归树,T是GBDT中需要构建的树的数量,αt是第t棵树的权重;
GBDT采用前向分布算法,首先确定F0(x)为模型初始值为常数,第m步的模型是:
fm(X)=fm-1(X)+αmhm(X) (13)
其中,Fm-1(x)为当前模型;新添加的分类回归树hm(x)通过最小化损失函数求得:
Figure BDA0003943465360000061
其中,N是样本个数,GBDT采用梯度下降法来求解最优模型,将损失函数在当前模型fm-1(X)的负梯度值作为梯度下降的方向:
Figure BDA0003943465360000062
其中,αm通过线性搜索求得:
Figure BDA0003943465360000063
遗传算法求取模型加权系数:经过特征构建的天气类型c的气象特征数据记为
Figure BDA0003943465360000064
功率数据记为
Figure BDA0003943465360000065
由对应的类内相似日集
Figure BDA0003943465360000066
和全数据相似日集
Figure BDA0003943465360000067
分别建立GBDT模型
Figure BDA0003943465360000068
Figure BDA0003943465360000069
最终的功率预测值为
Figure BDA00039434653600000610
其中
Figure BDA00039434653600000611
Figure BDA00039434653600000612
为该天气类型下两类模型的加权系数;确定预测目标函数作为遗传算法的适应度函数,设定种群大小和迭代轮次,求取对应天气类型下待预测日建立的两模型的加权系数,具体为:
Figure BDA00039434653600000613
其中:nc为该天气类型的历史日个数。
优选地,所述步骤(9)具体包括:
获取待预测日天气类型的待预测日气象特征记为
Figure BDA00039434653600000614
利用步骤(8)的方式分别类内相似日集和全数据相似日集建立模型
Figure BDA00039434653600000615
Figure BDA00039434653600000616
应用天气类型c的加权模型系数,确定功率预测值
Figure BDA00039434653600000617
Figure BDA00039434653600000618
本发明的有益效果在于:
本发明通过将历史数据中的气象特征和功率特征转换为视图形式,挖掘各个视图中一致的局部结构,并利用重构的功率序列来辅助聚类任务完成,通过超参数的设定调整聚类效果,获得接近于真实天气类型的聚类结果,最后再针对各个聚类后的结果建立组合相似日模型,完成功率预测;与传统的聚类方法相比,本发明充分应用了真实的功率特征信息,其聚类后的结果相较于应用NWP数据聚类的方法更加准确,同时组合相似日的策略可以显著提高波动程度大的天气类型的功率预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明应用MIV技术计算各气象视图权重的流程图;
图3为本发明应用功率重构的多视图聚类算法的功率曲线图;
图4为本发明应用相似日策略后历史日的类内相似日和全数据相似日的功率指标对比图;
图5为本发明的一个实施例的天气数据实际值与对应方法预测值的对比示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示:本实施例提供一种基于天气类型的相似日组合策略的日前光伏功率预测方法,具体实施步骤如下:
(1)已有的光伏功率历史日数据集包括NWP气象数据
Figure BDA0003943465360000071
和对应时刻的功率数据
Figure BDA0003943465360000081
对所有历史日数据进行最小最大归一化方法处理,其中,Xi=[Xi,1 … Xi,q]为历史日i的气象数据,n为历史日个数,l为日序列长度,q为气象特征个数,;
(2)应用本领域技术人员所熟知的MIV方法计算各气象特征对功率的MIV值,并取其绝对值作为各气象特征对功率的影响大小,作为多视图技术中各气象视图的权重,MIV技术流程图如图2所示,特别地,新增两噪声特征作比较以选择对功率影响大的气象特征;
(3)针对天气类型一致的历史日,其气象特征曲线和功率波动曲线具有相似性,运用本领域技术人员所熟知的平滑表示多视图聚类方法处理,其过程为:将历史日NWP数据和功率数据改写为视图形式
Figure BDA0003943465360000082
k=1,…,q时,Vk=[X1,k … Xn,k]T表征气象视图,特别地,Vq+1=[y1 … yn]T表征功率视图;
气象特征曲线和功率特征曲线具有相似性,即特定历史日各特征曲线可以由同类型历史日曲线重构,可以描述为:
Figure BDA0003943465360000083
其中,vi,j∈Rl×1表示i视图的日序列j,zjk表示历史日j和历史日k的相似性大小为自表示阵系数;ri表示不同视图的权重系数;同时显示地对自表示系数阵进行应用分组效应约束:
Figure BDA0003943465360000084
分组效应的数学定义有:
给定一组数据点[x1 x2 … xn]∈Rd×n和自表示系数阵[z1 z2 … zn]∈Rn×n
Figure BDA0003943465360000085
对应的自表示系数阵||zi-zj||→0。拉普拉斯矩阵Li形式的约束,不仅可以满足分组效应的应用条件,而且共用同一个自表示系数阵Z挖掘各视图局部流形结构的一致性;
取相似阵S=(Z+ZT)/2,应用本领域技术人员所熟知的谱聚类方法得到天气类型标签阵F∈Rn×C,c为聚类得到的天气类型个数,Fij=1表示历史日i属于天气类型j,Fij=0表示历史日i不属于天气类型j,且
Figure BDA0003943465360000091
(4)通过对功率视图进行重构,应用本领域技术人员所熟知的平滑多视图聚类方法得到的聚类标签功率数据对其进行约束,其过程为:
功率视图是真实采集得到的信息是反应天气类型的重要方式,保持重构后功率数据信息量不变的前提下,用尽量少的维度提炼其主要信息:
Figure BDA0003943465360000092
其中,P∈Rl×m为投影阵;同时对各天气类型的功率数据的类内距离进行约束,从而对平滑多视图聚类结果进行改进,可以描述为:
Figure BDA0003943465360000093
其中,oi是属于天气类型i的功率序列中心,ni是属于天气类型i的历史日天数,
Figure BDA0003943465360000094
是经过系数调整之后的标签阵;
(5)结合功率视图重构和平滑表示多视图聚类,通过交替迭代求解聚类标签,对历史日聚类为晴天、少云、阴天和多云天气类型,:
有总目标函数:
Figure BDA0003943465360000095
其中,功率视图权重系数rq+1默认为1,其余视图特征权重采用本领域技术人员所熟知的MIV方法计算得到的MIV绝对值;α是平滑表示多视图技术的超参;
β是功率重构的超参;
采用交替求解的方式:
固定投影阵P,求解自表示阵Z,即对下式进行求解:
Figure BDA0003943465360000096
对其求导,并设置导数为0,有:
Figure BDA0003943465360000101
该形式为Sylvester方程,具有唯一解;求解Z后,可以求取亲和矩阵S,从而对S应用谱聚类算法获取天气类型标签F,和系数调整后的天气类型标签
Figure BDA0003943465360000106
固定自表示系数阵Z,求解投影阵P,即对下式进行求解:
Figure BDA0003943465360000102
显然解为
Figure BDA0003943465360000103
对应的前m个最小特征值对应的特征向量组成的矩阵;
(6)对气象特征进行新特征构建,并依据聚类结果将数据集划分为晴天数据集、少云数据集、阴天数据集、多云数据集和全历史数据集,对各个数据集气象特征基于互信息进行特征选择:
新特征构建:计算各气象特征的一阶后向差分和二阶后向差分,挖掘气象特征动态信息,扩充特征集;
基于互信息的特征选择:互信息是表明是否具有依赖关系的一种度量;在给定离散随机变量X和Y后,X的边缘分布为p(x),Y的边缘分布为p(y),两者的联合概率分布为p(x,y)。此时X和Y之间的互信息为
Figure BDA0003943465360000104
计算各数据集中的特征对功率的互信息大小,并对互信息由大到小排列,选取前u个特征作为该数据集相似日选择和功率预测模型建立的特征;
(7)按照加权灰色关联度的相似度准则选择相似日,对各天气类型下的历史日依次构建类内相似日集和全数据相似日集:
加权灰色关联度:判定两历史日是否具有相似性的相似度准则,利用几何形状衡量序列之间关联程度的分析比较方法,灰色关联度越高,待预测日与历史日的相似性越大,其计算过程为:
定义经过特征构建和特征选择后的历史日数据为Xi=[Xi,1 … Xi,u]∈Rl×u,计算历史日X0和历史日Xi的关于特征k的灰色关联系数εik
Figure BDA0003943465360000105
其中,Xi,k(t)表征气象特征k第t时刻的值,分辨系数μ=0.5。那么对应的加权灰色关联度ζi的计算式为:
Figure BDA0003943465360000111
其中,wk为气象特征k对灰度系数的权重,该权重应用CRITIC方法计算得出,采用特征间的对比强度和冲突性来计算,特征k的标准差σk表现对比强度,相关系数ρki衡量冲突性,计算式为:
Figure BDA0003943465360000112
计算历史日d0和数据集内的所有历史日计算灰色关联度,对其由大到小排列,选取前若干个相似日构成历史日d0在该数据集下的相似日集;
类内相似日集和全数据相似日集:定义待预测日X0在同天气类型历史日中选择的相似日数据为类内相似日集D0,clus,在全部历史日中选择的相似日数据为全数据相似日集D0,all
(8)对历史日的两组相似日集分别建立GBDT模型获取预测值,特定天气类型下的所有历史日组成类内GBDT模型预测和GBDT全数据模型预测值,应用遗传算法求取两模型预测值的加权系数:
GBDT模型:梯度提升决策树(Gradient boosting decision tree,GBDT)是一种加法模型,表示为:
Figure BDA0003943465360000113
其中,X为输入样本,ht(X)为分类回归树(Classification and regressiontrees,CART),T是GBDT中需要构建的树的数量,αt是第t棵树的权重。GBDT采用前向分布算法,首先确定F0(x)为模型初始值,通常为常数,第m步的模型是:
fm(X)=fm-1(X)+αmhm(X) (13)
其中,Fm-1(x)为当前模型。新添加的分类回归树hm(x)通过最小化损失函数求得:
Figure BDA0003943465360000114
其中,N是样本个数,GBDT采用梯度下降法来求解最优模型,将损失函数在当前模型fm-1(X)的负梯度值作为梯度下降的方向:
Figure BDA0003943465360000121
其中,αm通过线性搜索求得:
Figure BDA0003943465360000122
遗传算法求取模型加权系数:经过特征构建的天气类型c的气象特征数据记为
Figure BDA0003943465360000123
功率数据记为
Figure BDA0003943465360000124
由对应的类内相似日集
Figure BDA0003943465360000125
和全数据相似日集
Figure BDA0003943465360000126
分别建立GBDT模型
Figure BDA0003943465360000127
Figure BDA0003943465360000128
最终的功率预测值为
Figure BDA0003943465360000129
其中
Figure BDA00039434653600001210
Figure BDA00039434653600001211
为该天气类型下两类模型的加权系数;为保证预测效果,有目标函数为:
Figure BDA00039434653600001212
nc为该天气类型的历史日个数;应用上式作为遗传算法的适应度函数,设定种群大小和迭代轮次,求取对应天气类型下待预测日建立的两模型的加权系数。(9)由天气预报获取待预测日天气类型,应用该日的NWP数据获取其类内相似日集和全数据相似日集,分别建立模型,通过该天气类型下的模型加权系数获取最终的功率预测值:
图4为相似日组合策略的流程图,由天气预报等手段获取待预测日天气类型,待预测日气象特征记为
Figure BDA00039434653600001213
分别建立模型
Figure BDA00039434653600001214
Figure BDA00039434653600001215
应用天气类型c的加权模型系数,有功率预测值
Figure BDA00039434653600001216
Figure BDA00039434653600001217
本实施例结合国能日新第二届光伏功率预测大赛数据来说明基于天气分型的组合相似日策略的光伏功率预测模型应用NWP数据预测功率的性能。
光伏发电具有波动性和间歇性,大规模光伏电站并网运行可能对电力系统的安全稳定经济运行造成影响。为了帮助调度部门统筹安排常规能源和光伏发电的协调配合,及时调整调度计划,合理安排电网运行方式,对光伏电站的输出功率建立合适模型并准确预测。
光伏功率历史日数据包含时间、NWP数据和功率;其中,时间形式为“年/月/日时:分”,且每15分钟采集一个数据,一天共96个数据;NWP数据特征包括辐照度、风速、风向、温度、压强和湿度,均为对应时刻气象特征的预测值,并非实测值;功率数据为对应时刻光伏电站功率的实测值;采用春季数据2016年4月和5月、2017年3月、4月和5月,2018年3月作为进行聚类和功率预测的历史日集,避免由于不同季节的出力水平不同,而致使天气类型划分错误。原始特征为NWP数值天气预测数据,标签为对应时刻的光伏发电功率。通过历史日太阳辐照强度和Hottel模型数据进行比较,对2018年4月数据的天气类型进行确定,并选取其中典型天气类型的历史日进行效果对比。对各特征和新建白噪声特征应用本领域技术人员所熟知的MIV方法得到的MIV绝对值如表1所示,白噪声MIV值符合其与功率无关的特性,以此为基准,风速、风向和温度的MIV值虽然相较白噪声大一个量级却比辐照度小一个量级,故舍去以上三种气象特征,选取辐照度、压强和湿度作为气象视图;对应各视图权重设置为[r辐照度 r压强 r湿度 r功率]=[0.4096 0.12 0.1104 1]。
表1
属性 MIV |MIV|
辐照度 +0.4096 0.4096
风速 -0.0337 0.0337
风向 +0.0345 0.0345
温度 +0.0176 0.0176
压强 +0.1200 0.1200
湿度 -0.1104 0.1104
白噪声1 -0.0025 0.0025
白噪声2 -0.0015 0.0015
根据短期预报标准即国标GB/T21984-2017,天空状况被分为晴、少云、多云和阴天,结合功率波动主要由天空中云量变化引起,故天气类型划分为晴、少云、多云和阴天4种;功率重构的平滑多视图聚类法的参数设置为α=50,β=0.9,功率重构维数m=30。
表2为使用方法1、方法2和方法3聚类并判定天气类型后的聚类结果性能指标比较,表2的各方法为:Kmeans方法即方法1、只应用了功率特征的平滑表示聚类法即方法2、本实施例提出的基于天气类型的相似日组合策略的日前光伏功率预测方法即方法3,本实施例采用欧式距离d、皮尔逊相关系数Cor和时间相关系数Cort作为性能指标:
Figure BDA0003943465360000141
Figure BDA0003943465360000142
Figure BDA0003943465360000143
表2
Figure BDA0003943465360000144
式中,
Figure BDA0003943465360000145
表示天气类型c下历史日i的功率序列,
Figure BDA0003943465360000146
表示表示天气类型c下历史日i的功率序列均值,nc表示天气类型c的历史日个数,d越小越好,Cor和Cort越大越好。
表2可以看出,本实施例的方法在晴天、少云、阴天的聚类上具有明显优势,可以清晰地将以上三种天气类型区分开来。多云类型下,复杂的天气情况导致功率序列的皮尔逊系数和时间相关系数在三种方法上的表现都较小,在该天气类型下比较欧氏距离,虽然本实施例的方法欧式距离最大,但相较于其余方法相差不多。综上所述,本实施例的方法在三种方法中具有明显优势,对历史日集标注本发明聚类得到的天气类型,划分为天气类型历史日集
Figure BDA0003943465360000151
应用历史日集验证组合相似日策略的效果,对
Figure BDA0003943465360000152
按照7:3的比例划分训练集和测试集。应用训练集通过GA算法寻优求解ωclus和ωall的加权系数,并作为测试集中待预测日
Figure BDA0003943465360000153
寻找相似日的历史日集,构建对应
Figure BDA0003943465360000154
Figure BDA0003943465360000155
相似日天数选择为6。为了比较
Figure BDA0003943465360000156
Figure BDA0003943465360000157
的差异,对天气类型下
Figure BDA0003943465360000158
Figure BDA0003943465360000159
Figure BDA00039434653600001510
的功率指标进行统计。本实施例定义的功率指标如下,其中y′i为功率序列yi的极值点序列,le为极值点序列y′i的极值点个数:
Figure BDA00039434653600001511
波动频率=le/l;
Figure BDA00039434653600001512
如图3所示,由于在相似日选择前会进行特征选择,故选择相似日的特征和加权灰色关联度的系数不一定相同,所以
Figure BDA00039434653600001513
Figure BDA00039434653600001514
Figure BDA00039434653600001515
会有较大差异。明显看出各天气类型下
Figure BDA00039434653600001516
Figure BDA00039434653600001517
的功率指标在不同区间集中,晴天和少云类型下尤其明显,阴天和多云类型下集中的区间一致但是分布却不一致,故训练出的模型
Figure BDA00039434653600001518
Figure BDA00039434653600001519
具有不同的特点。通过GA求解特定天气类型下
Figure BDA00039434653600001520
Figure BDA00039434653600001521
的加权系数ωclus和ωall,结合两模型的优点改善预测效果。
分析采取的相似日选择方式和
Figure BDA00039434653600001522
的加权策略是否有效,对相似日组合策略的各个部分进行移除或添加后的预测效果进行预测效果对比。同时充分考虑策略的稳定性,对历史日集随机划分10次训练集和测试集,取10次评价结果的平均值为最终预测效果。表3为各方法与相似日组合预测模型各部分的关系。本实施例应用均方根误差RMSE、平均绝对误差MAE和决定系数R2作为模型的评价指标,其中,N为功率点个数,Cap为光伏电场的装机容量:
Figure BDA0003943465360000161
Figure BDA0003943465360000162
Figure BDA0003943465360000163
表3
序号 模型组成
方法a GBDT
方法b 全数据相似日建模+GBDT
方法c 类内相似日建模+GBDT
方法d 相似日组合建模+GBDT
方法e 特征选取+GBDT
方法f 特征选取+全数据相似日建模+GBDT
方法g 特征选取+类内相似日建模+GBDT
方法h 特征选取+相似日组合建模+GBDT
预测效果如表4所示,表3中的方法h为本实施例的方法。通过方法a~方法d与方法e~方法h的对比,基于互信息的特征提取对模型预测的准确性有较大提升。对比方法e和方法h,方法e是对所有历史日建模,包含与待预测日灰色关联度差别较大的日功率数据,导致GBDT建模的预测准确性较方法h差;对比方法f、方法g和方法h,在晴天和少云天气类型下,方法g建立的模型预测效果都接近于方法h的效果,但在功率波动峰值小,波动频率大的阴天天气类型下,方法h相较于方法f和方法g有较大提升,误差评价RMSE分别提升11.0%和8.9%,MAE分别提升10.0%和10.2%;在波动峰值大,波动频率小的多云天气类型下同样有所改善,RMSE上分别提升1.3%和6.1%,MAE上分别提升0.8%和5.8%。相似日组合预测模型在波动程度较小的天气类型中,提升或维持同类型相似日选取策略的性能,对于波动程度较大的天气类型,会改善其预测性能。
表4
Figure BDA0003943465360000171
如图5所示,在验证相似日组合策略对于聚类后的数据有效后,再验证本实施例的方法是否对特定天气类型的历史日有效。取特定天气历史日,按照相似日组合策略流程对其功率进行预测。为验证效果和其他方法进行对比,包括应用其他回归器在只进行基于互信息的特征选择情况下进行回归器和组合相似日策略的结合的情况下进行回归。为保证效果稳定有效,每种天气类型在2018年4月份选取典型的2天进行回归,评价效果包括eRMSE和eMAE。如表5,方法A为GBDT回归,方法B为应用组合相似日策略和GBDT回归;方法C为RF(Random Forest)随机森林回归,方法D为组合相似日策略和RF回归。
表5
Figure BDA0003943465360000172
Figure BDA0003943465360000181
对2018年4月选取特定天气类型历史日的回归效果如表5所示;对比采用了相似日组合策略的方法B、方法C和不应用相似日组合策略的方法A、方法C,采取组合相似日组合策略的模型比仅应用GBDT或RF的效果好;对比方法B和方法A、方法C、方法D,本实施例方法的预测效果更好。对比表4和表5,各天气类型待预测日在效果上和表4效果一致,反映出本实施例所提功率重构的平滑表示多视图聚类算法的优势。本实施例所提的基于天气类型的相似日组合短期光伏功率预测方法相对于其他方法在阴天和多云情况下预测精度更高。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,包括以下步骤:
(1)对已有的光伏功率历史日数据集进行最小最大归一化处理;
(2)利用步骤(1)处理后的数据计算各气象特征对功率的MIV值,并取其绝对值作为多视图中各气象视图的权重;
(3)根据步骤(1)处理后的数据,对天气类型一致的历史日进行平滑表示多视图聚类;
(4)对步骤(2)的功率视图进行重构,结合步骤(3)得到的天气类型标签阵对各天气类型的功率数据的类内距离进行约束;
(5)结合步骤(4)的功率视图重构和平滑表示多视图聚类,通过交替迭代求解聚类标签,对历史日聚类为晴天、少云、阴天和多云天气类型;
(6)对步骤(5)聚类的气象特征进行新特征构建,并依据聚类结果将数据集划分为晴天数据集、少云数据集、阴天数据集、多云数据集和全历史数据集,对各个数据集气象特征基于互信息进行特征选择;
(7)结合步骤(6)的数据,按照加权灰色关联度的相似度准则选择相似日,对各天气类型下的历史日依次构建类内相似日集和全数据相似日集;
(8)对步骤(7)构建的历史日的两组相似日集分别建立GBDT模型获取预测值,应用遗传算法求取两模型预测值的加权系数;
(9)由天气预报获取待预测日天气类型,应用该日的NWP数据获取其类内相似日集和全数据相似日集,利用步骤(8)建立的模型,通过该天气类型下的模型加权系数获取最终的功率预测值。
2.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,步骤(1)中的光伏功率历史日数据集包括NWP气象数据和对应时刻的功率数据。
3.如权利要求2所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(3)具体包括:
将历史日的NWP数据和功率数据写为视图形式
Figure FDA0003943465350000021
其中,当k=1,…,q时,Vk=[X1,k…Xn,k]T表征气象视图;Vq+1=[y1…yn]T表征功率视图;
对特定历史日的表征气象视图、表征功率视图进行重构,描述为:
Figure FDA0003943465350000022
其中,vi,j∈Rl×1表示i视图的日序列j,zjk表示历史日j和历史日k的相似性大小为自表示阵系数;ri表示不同视图的权重系数;同时显示地对自表示系数阵应用分组效应约束:
Figure FDA0003943465350000023
定义亲和矩阵S=(Z+ZT)/2,应用谱聚类求解得到天气类型标签阵F∈Rn×C,c为聚类得到的天气类型个数,Fij=1表示历史日i属于天气类型j,Fij=0表示历史日i不属于天气类型j,且
Figure FDA0003943465350000024
4.如权利要求3所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(4)具体包括:
将功率视图表示为:
Figure FDA0003943465350000025
其中,P∈Rl×m为投影阵;同时对各天气类型的功率数据的类内距离进行约束,具体描述为:
Figure FDA0003943465350000031
其中,oi是属于天气类型i的功率序列中心,ni是属于天气类型i的历史日天数,
Figure FDA0003943465350000032
是经过系数调整之后的天气类型标签阵。
5.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(5)具体包括:
确定以下总目标函数:
Figure FDA0003943465350000033
其中,ri是各视图的权重系数,功率视图权重系数rq+1默认为1,其余视图特征权重采用MIV方式计算得到的MIV绝对值;α是平滑表示多视图的超参;β是功率重构的超参;
采用交替的方式求解:
固定投影阵P,求解自表示阵Z和天气类型阵F,即对下式进行求解:
Figure FDA0003943465350000034
对其求导,并设置导数为0,有:
Figure FDA0003943465350000035
由该式得到Z,再计算亲和矩阵S,并应用谱聚类算法可以求解天气类型阵F,并得到系数调整后的天气类型标签
Figure FDA0003943465350000036
固定自表示系数阵Z,求解投影阵P,即对下式进行求解:
Figure FDA0003943465350000037
解为
Figure FDA0003943465350000041
对应的前m个最小特征值对应的特征向量组成的矩阵。
6.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(6)具体包括:
新特征构建:计算各气象特征的一阶后向差分和二阶后向差分,挖掘气象特征动态信息,扩充特征集;
基于互信息的特征选择:在给定离散随机变量X和Y后,X的边缘分布为p(x),Y的边缘分布为p(y),两者的联合概率分布为p(x,y);此时X和Y之间的互信息为
Figure FDA0003943465350000042
计算各数据集中的特征对功率的互信息大小,并对互信息由大到小排列,选取前u个特征作为该数据集相似日选择和功率预测模型建立的特征。
7.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(7)的计算过程为:
定义经过特征构建和特征选择后的历史日数据为Xi=[Xi,1…Xi,u]∈Rl×u,计算历史日X0和历史日Xi的关于特征k的灰色关联系数εik
Figure FDA0003943465350000043
其中,Xi,k(t)表征气象特征k第t时刻的值,分辨系数μ=0.5;
对应的加权灰色关联度ζi的计算式为:
Figure FDA0003943465350000044
其中,wk为气象特征k对灰度系数的权重,该权重应用CRITIC方法计算得出,采用特征间的对比强度和冲突性来计算,特征k的标准差σk表现对比强度,相关系数ρki衡量冲突性,计算式为:
Figure FDA0003943465350000051
计算历史日X0和数据集内的所有历史日计算灰色关联度,对其由大到小排列,选取前若干个相似日构成历史日X0在该数据集下的相似日集;
定义类内相似日集和全数据相似日集:定义待预测日X0在同天气类型历史日中选择的相似日数据为类内相似日集D0,clus,在全部历史日中选择的相似日数据为全数据相似日集D0,all
8.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(8)中:
GBDT模型表示为:
Figure FDA0003943465350000052
其中,X为输入样本,ht(X)为分类回归树,T是GBDT中需要构建的树的数量,αt是第t棵树的权重;
GBDT采用前向分布算法,首先确定F0(x)为模型初始值为常数,第m步的模型是:
fm(X)=fm-1(X)+αmhm(X) (13)
其中,Fm-1(x)为当前模型;新添加的分类回归树hm(x)通过最小化损失函数求得:
Figure FDA0003943465350000053
其中,N是样本个数,GBDT采用梯度下降法来求解最优模型,将损失函数在当前模型fm-1(X)的负梯度值作为梯度下降的方向:
Figure FDA0003943465350000054
其中,αm通过线性搜索求得:
Figure FDA0003943465350000055
遗传算法求取模型加权系数:经过特征构建的天气类型c的气象特征数据记为
Figure FDA0003943465350000056
功率数据记为
Figure FDA0003943465350000057
由对应的类内相似日集
Figure FDA0003943465350000058
和全数据相似日集
Figure FDA0003943465350000061
分别建立GBDT模型
Figure FDA0003943465350000062
Figure FDA0003943465350000063
最终的功率预测值为
Figure FDA0003943465350000064
其中
Figure FDA0003943465350000065
Figure FDA0003943465350000066
为该天气类型下两类模型的加权系数;确定预测目标函数作为遗传算法的适应度函数,设定种群大小和迭代轮次,求取对应天气类型下待预测日建立的两模型的加权系数,具体为:
Figure FDA0003943465350000067
其中:nc为该天气类型的历史日个数。
9.如权利要求1所述的基于天气类型的相似日组合策略的日前光伏功率预测方法,其特征在于,所述步骤(9)具体包括:
获取待预测日天气类型的待预测日气象特征记为
Figure FDA0003943465350000068
利用步骤(8)的方式分别类内相似日集和全数据相似日集建立模型
Figure FDA0003943465350000069
Figure FDA00039434653500000610
应用天气类型c的加权模型系数,确定功率预测值
Figure FDA00039434653500000611
Figure FDA00039434653500000612
CN202211423091.0A 2022-11-15 2022-11-15 基于天气类型的相似日组合策略的日前光伏功率预测方法 Pending CN115759389A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211423091.0A CN115759389A (zh) 2022-11-15 2022-11-15 基于天气类型的相似日组合策略的日前光伏功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211423091.0A CN115759389A (zh) 2022-11-15 2022-11-15 基于天气类型的相似日组合策略的日前光伏功率预测方法

Publications (1)

Publication Number Publication Date
CN115759389A true CN115759389A (zh) 2023-03-07

Family

ID=85370667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211423091.0A Pending CN115759389A (zh) 2022-11-15 2022-11-15 基于天气类型的相似日组合策略的日前光伏功率预测方法

Country Status (1)

Country Link
CN (1) CN115759389A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117060407A (zh) * 2023-10-12 2023-11-14 国网湖北省电力有限公司经济技术研究院 一种基于相似日划分的风电集群功率预测方法及系统
CN117175556A (zh) * 2023-09-01 2023-12-05 滁州苏埠新能源科技有限公司 一种光伏电力供应管理系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117175556A (zh) * 2023-09-01 2023-12-05 滁州苏埠新能源科技有限公司 一种光伏电力供应管理系统
CN117060407A (zh) * 2023-10-12 2023-11-14 国网湖北省电力有限公司经济技术研究院 一种基于相似日划分的风电集群功率预测方法及系统
CN117060407B (zh) * 2023-10-12 2023-12-22 国网湖北省电力有限公司经济技术研究院 一种基于相似日划分的风电集群功率预测方法及系统

Similar Documents

Publication Publication Date Title
CN109002915B (zh) 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
CN111369070B (zh) 一种基于包络线聚类的多模融合光伏功率预测方法
CN111080032A (zh) 一种基于Transformer结构的负荷预测方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN110909919A (zh) 融合注意力机制的深度神经网络模型的光伏功率预测方法
CN106251001A (zh) 一种基于改进模糊聚类算法的光伏功率预测方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN114792156B (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN106022528A (zh) 一种基于密度峰值层次聚类的光伏电站短期功率预测方法
CN110929953A (zh) 基于聚类分析的光伏电站超短期出力预测方法
CN111369045A (zh) 一种短期光伏发电功率预测的方法
CN112418346B (zh) 一种数值天气预报总辐射系统误差分类计算方法
CN114444378A (zh) 一种区域风电集群的短期功率预测方法
CN115481791A (zh) 一种水风光发电功率联合预测方法、装置和设备
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN116629416A (zh) 光伏电站功率预测方法及装置
CN115809719A (zh) 一种基于形态聚类的短期负荷预测修正方法
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN116402203A (zh) 计及天气情况的短时光伏发电量预测方法、系统及介质
CN110852492A (zh) 一种基于马氏距离找相似的光伏功率超短期预测方法
CN113627674A (zh) 一种分布式光伏电站出力预测方法、装置及存储介质
CN111553434A (zh) 一种电力系统负荷分类方法及系统
CN116611702A (zh) 一种面向楼宇综合能源管理的集成学习光伏发电预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination