CN117154704B - 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法 - Google Patents

一种基于多尺度时空图注意力卷积网络的光伏功率预测方法 Download PDF

Info

Publication number
CN117154704B
CN117154704B CN202311106969.2A CN202311106969A CN117154704B CN 117154704 B CN117154704 B CN 117154704B CN 202311106969 A CN202311106969 A CN 202311106969A CN 117154704 B CN117154704 B CN 117154704B
Authority
CN
China
Prior art keywords
photovoltaic power
time
model
attention
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311106969.2A
Other languages
English (en)
Other versions
CN117154704A (zh
Inventor
李茜
彭甜
钱诗婕
陈佳雷
张楚
李燕妮
陈亚娟
陈杰
王政
葛宜达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Institute of Technology
Original Assignee
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Institute of Technology filed Critical Huaiyin Institute of Technology
Priority to CN202311106969.2A priority Critical patent/CN117154704B/zh
Publication of CN117154704A publication Critical patent/CN117154704A/zh
Application granted granted Critical
Publication of CN117154704B publication Critical patent/CN117154704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2300/00Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
    • H02J2300/20The dispersed energy generation being of renewable origin
    • H02J2300/22The renewable source being solar energy

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Public Health (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Power Engineering (AREA)
  • Geometry (AREA)

Abstract

本发明公开了一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,获取光伏电站真实历史运行数据集,利用互信息熵对NWP中的主要气象因子与光伏功率进行相关性分析,筛选出相关程度最高的气象因子,采用矩阵填充算法对其进行修正;建立时空图注意力卷积网络模型,首先构建属性图来捕捉光伏发电功率在时间和空间上的动态特征,通过多层图注意力网络从属性图中提取空间特征,使用时间卷积网络从属性图中来挖掘时间相关特征;采用改进的序贯模型优化算法对预测模型的超参数进行优化;最后,构建融合多源数据的神经网络全连接层,从而预测光伏发电功率。本发明提高了区域内光伏电站的发电功率预测准确性。

Description

一种基于多尺度时空图注意力卷积网络的光伏功率预测方法
技术领域
本发明属于光伏功率预测领域,具体涉及一种基于多尺度时空图注意力卷积网络的光伏功率预测方法。
背景技术
光伏发电受辐照强度、季节类型、日类型、温度等因素的影响,具有较强的间歇性、波动性和随机性,模拟与控制较困难,增加了电网的调峰压力,对电网的安全稳定经济运行带来了挑战,一直是光伏发电产业的难题。为进一步提高光伏发电预测的可靠性、准确性和智能性,尚需针对当前光伏发电影响因素的不确定性与多变性,以及预测方法的局限性,从全局、多维、多时空尺度研究光伏发电输出功率的影响机制并探索新的光伏发电预测及不确定性分析方法。随着现代计算机技术的发展以及大数据时代的来临,更加丰富的数据资源容易被获取,以挖掘历史发电功率和气象数据信息来演化未来光伏功率发展趋势的数据驱动预测方法越来越流行。
深度学习在光伏发电功率领域已取得一定的应用,但仍存在一些不足,大多数现有模型只能对输入和输出具有相同时间尺度的数据进行建模预测,未考虑不同地点的气象信息存在一定时间偏移以及忽略隐含在高分辨率数据中的多时间尺度特征等问题。当预测时间跨度较大时,采用均值法对输入序列进行相应的时间尺度变换,这种粗略的变换忽略了隐含在高分辨率数据中的不同时间尺度特征。
发明内容
发明目的:本发明提出一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,能显著提高区域内光伏电站的发电功率预测准确性。
技术方案:本发明所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,包括以下步骤:
(1)获取光伏电站历史运行数据,该数据集包含历史光伏发电功率数据和NWP气象数据;利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析,筛选出相关程度最高的气象因子,并采用矩阵填充算法对相关程度最高的气象因子进行修正;
(2)考虑不同区域内光伏电站之间的时空关联特性,通过构建属性图来捕捉光伏发电功率在时间和空间上的动态特征;
(3)采用多层图注意力网络从属性图中提取空间特征,进行多个相邻光伏电站之间的空间依赖建模;
(4)采用时间卷积网络从属性图中来挖掘时间相关特征,进行多个相邻光伏电站之间时间依赖建模;
(5)基于步骤(2)、(3)、(4)建立时空图注意力卷积网络模型STGATCN,采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化;所述改进的序贯模型优化算法为使用元学习方法对序贯模型优化算法进行初始化,使用自动早停策略来自动终止STGATCN模型训练;
(6)将步骤(3)、(4)提取到的时空特征送入训练好的STGATCN模型的全连接预测输出层,输出光伏发电功率预测结果。
进一步地,步骤(1)所述利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析实现过程如下:
把气象数据看作是一种随机变量,对于每一个随机变量A=[a1,a2,…,an],其中n是指随机变量A的样的本量,将随机变量A进行[0,1]归一化处理:
式中,A0代表了随机变量A的归一化后的结果;
将X定义为向量A0的组间距,Di是向量X0的波动区间边缘:
用数字边界作划分条件,用一维柱状图进行分析;将矢量A0分成n个波动区间,对于第i个波动区间,Ai为:
Ai∈[Di,Di+1]i=1,2,…,n(4)
对每个波动区间Ai的边缘概率密度P(Ai)进行计算:
式中,ni表示向量A0中的元素落入波动区间Ai的数据点数;使用自信息熵H(Ai)来对向量A自身随机波动的不确定性进行表征:
根据香农信息论,将一维向量的自信息熵H(Xi)扩展为二维向量的互信息I(A;B),即:
式中,B是区别于A的另一个代表气象的矢量;p(Bj)代表波动区间Bj的边缘概率密度;p(AiBj)代表A0、B0在波动区间Ai、Bj的联合概率密度;
对广义互信息I(A;B)进行归一化处理,得到MIE相关系数IAB为:
式中,H(B)代表了向量B的自信息熵。
进一步地,步骤(1)所述采用矩阵填充算法对相关程度最高的气象因子进行修正实现过程如下:
气象数据的矩阵为C=(cij)m×n,其中m代表了NWP气象数据,n代表了气象预报时间,cij是用相应的时空点的实测数据来表示矩阵中各要素的数值;投影矩阵由[01]来确定在这个时间点上是否进行采集,对应的采样矩阵是:
式中,(P[C]Ω)i,j代表采样矩阵,Ω代表采样矩阵元素下标的集合;
基于矩阵填充算法将未采集到的数据进行填充,当数据被填充时,用核范数来代替秩,并且定义如下:
式中,S代表重构矩阵,||S||为矩阵S的核范数,σi为S中降序排列的第i个奇异值;
在秩最小化的条件下,解决核范数最小化的重构未知矩阵为:
式中,Cij为采集到的值;Ω为采样矩阵元素下标的集合;
首先,将式(11)正则化,表达式如下:
式中,当τ→+∞时,最优化问题的最优解收敛到式(11)的最优解,代表S的F范数,τ||S||代表原始的损失函数,PΩ(·)是一个投影算子;
其次,构造式(12)的拉格朗日函数:
式中,L(S,T)代表拉格朗日函数,T是对偶变量,通过交替迭代方法求解,表达式如下:
式中,δK代表步长,k代表迭代次数。
进一步地,所述步骤(2)实现过程如下:
构建属性图G(V,E)捕捉光伏发电功率在时间和空间上的动态特征,其中V和E分别表示属性图的节点和边;光伏电站位置表征为图节点,每个节点Vi具有关联的静态特征向量和一组矩阵形式的动态特征;静态特征包含光伏电站的位置信息,动态特征包含光伏电站S类历史特征;对不同光伏电站之间的地理邻近性进行建模定义,节点之间的连接可以用边的权重来描述;根据光伏电站的高斯核阈值距离函数,定义节点i和j之间的边的权重Wi,j
其中,dist(i,j)为光伏电站i和光伏电站j之间的地理距离;σ为n个光伏电站两两之间距离的标准差;ε是阈值,如果距离小于阈值,则默认两个光伏电站没有连接,以保证图结构的稀疏性。
进一步地,所述步骤(3)实现过程如下:
采用多层图注意力网络GAT从属性图中提取时空特征,通过聚合相邻节点来更新每个节点的嵌入;每个位置根据移动性从相邻位置接收信息,以模拟给定区域中多个光伏电站之间时空特征信息的交互;在第t个时间步处,节点i的输入表示为其中M表示输入窗口的时间步长;将历史特征输入到属性图中;应用图注意力机制计算每个节点的注意力值,表示为/>其中Fz是GAT层的输出维度;使用多头机制来计算K个独立的注意力分数,以便计算/>节点i和节点j之间的第k个头的注意力权重/>计算如下:
其中,是第k个头的线性变换权重矩阵,将输入维度转换为输出维度;是第k个头的注意力计算矩阵;(·|·)表示串联操作;注意力得分/>计算如下:
其中,节点i的每条边都具有一个注意力分数,用于评估应该从相邻节点j聚合多少信息;将来自多个头的所有嵌入向量相加以建立节点i的最终表示如下:
进一步地,所述步骤(4)实现过程如下:
采用时间卷积网络TCN挖掘时间相关特征,对于一维输入序列卷积核为K:/>则第t个时间步的卷积定义如下:
其中,d是膨胀因子,k是卷积核的大小,t-d·m指示过去的方向;
经过一系列的卷积运算,输入序列被映射为包含时间信息的隐式向量Ht
Ht=Γ(xt,{Wt})+Convdim(xt) (20)
其中,Γ表示由非线性因果扩展卷积、非线性激活函数、权重归一化和dropout正则化组成的卷积运算模块,Wt是可学习的权重向量,Convdim用于调整输入向量的维度,实现残差连接的向量加法运算。
进一步地,步骤(5)所述使用元学习方法对序贯模型优化算法进行初始化具体实现过程如下:
S1:提取元特征:利用经过训练的样本特征提取器和数据集特征提取器可以获得一个代表数据集J的元特征向量mJ
S2:寻找相似的数据集:在步骤S1的基础上,使用k近邻算法找到k个与当前数据集相似度最高的历史数据集;
S3:初始化贝叶斯优化,通过历史优化记录,可以提取步骤S2中k个历史数据集的最佳超参数,并将它们作为序贯模型优化算法的初始点,以加速整个优化过程并改善最终的优化效果。
进一步地,步骤(6)所述使用自动早停策略来自动终止预测模型训练实现过程如下:
L1:更新超参数:将超参数R更新到STGATCN模型中;
L2:STGATCN模型训练:在模型训练的初期,模型按照正常流程进行训练,直到达到需要判断是否提前停止训练的特定训练次数;
L3:判断早停:在达到特定的训练次数后,使用测试集对STGATCN模型进行提前评估;即停止当前训练进程,使用当前模型对测试集进行测试,并得到本组超参数的早期性能值;然后,将该早期性能值与历史超参数的早期性能值进行比较;如果本组超参数的早期性能值明显优于大部分历史超参数的早期性能值,则继续进行训练直到达到最大训练次数;否则,模型训练将被提前终止;
L4:输出STGATCN模型性能:如果模型按照正常流程一直训练到达最大训练次数,将直接输出模型在数据集J的测试集上的最终性能值fJ(R);为了近似代替其真实性能fJ(R),选择早期性能最接近的两个历史超参数性能的平均值。
进一步地,步骤(6)所述采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化,具体实现过程如下:
TCN模型需要优化的超参数组为(K,F,N,P,λ,η),GAT模型需要优化的超参数为(σ,H,P,λ,η),其中,K表示卷积核大小、F表示卷积核数量、N表示残差块数量、P表示Dropout丢弃率、λ表示正则化参数、η表示学习率、σ表示注意力头数、H表示隐藏层节点数;超参数优化的表示如下式所示:
式中:f(m)代表预测模型的评价指标RMSE,能够衡量光伏功率预测模型性能的度量指标,它要求使其最小;m代表了超参数组((K,F,N,P,λ,η)、(σ,H,P,λ,η));M代表m取值的超参数域;m*表示使得评价指标RMSE的分数最低的超参数;
贝叶斯优化利用自适应且评估成本较低的代理模型来近似预测模型的评价指标RMSE;贝叶斯优化基于已有的N组试验结果R对目标函数进行建模,并计算y的后验分布p(w|m,R)作为代理模型,代理模型采用了TPE估计方法,下面是p(w|m)的计算表达式:
收益函数对一个超参数组给代理模型带来的收益进行评估,收益越大则更新后的代理模型就会愈靠近模型的评价指标RMSE,收益函数为:
其中,w*=min{wn,1≤n≤N}是已有样本中的最优值,R为超参数。
进一步地,所述步骤(6)实现过程如下:
经过基于图注意力网络的空间依赖挖掘和基于时间卷积网络的时间依赖挖掘后,可以得到隐含多源数据的时空特征向量Ht,然后将时空特征向量Ht送入全连接预测输出层进行处理,最后输出光伏发电功率预测结果全连接预测输出层计算公式如下:
其中,Ψf为全连接层激活函数,Wf和Bf分别为全连接层的权重矩阵和偏置矩阵。
有益效果:与现有技术相比,本发明的有益效果:
1、本发明引入互信息熵的相关性分析方法,对气象输入数据与光伏功率输出数据之间的复杂相关性进行计算,减少相关性较弱的气象输入数据对预测模型以及光伏功率预测精度造成的负面影响;
2、本发明采用矩阵填充算法对相关程度最高的气象因子进行修正以及采用多尺度卷积神经网络挖掘隐含在高分辨率数据中不同时间尺度特征,为后续模型能够准确预测提供数据基础,提高了预测精度;
3、本发明利用图注意力网络和时间卷积网络分别捕获多个相邻光伏电站之间的空间依赖性和时间序列曲线中的时间依赖性,建立基于数据驱动的多尺度时空图注意力卷积网络预测模型,提高了区域内光伏电站的发电功率预测准确性;
4、本发明采用元学习策略对SMBO进行初始化,提高初始点的选择准确性、加速超参数搜索;采用自动早停策略来自动终止预测模型训练,解决了SMBO过程耗时太久的问题,能够更快地评估一组超参数;采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化,以获取更可靠和更准确地光伏发电功率预测结果。
附图说明
图1为本发明的流程图;
图2为本发明提出的属性图构建示意图;
图3为本发明提出的空间依赖建模示意图;
图4为本发明提出的时间依赖建模示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示,本发明提出一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,具体包括以下步骤:
步骤1:获取光伏电站历史运行数据,该数据集包含历史光伏发电功率数据和NWP气象数据;利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析,筛选出相关程度最高的气象因子,并采用矩阵填充算法对相关程度最高的气象因子进行修正。
把气象数据看作是一种随机变量,对于每一个随机变量A=[a1,a2,…,an],其中n是指随机变量A的样的本量。将随机变量A进行[0,1]归一化处理,表达式如公式如下所示:
式中,A0代表了随机变量A的归一化后的结果。
将X定义为向量A0的组间距,Di是向量X0的波动区间边缘,其表达式分别为:
用数字边界作划分条件,用一维柱状图进行了分析。根据(3)将矢量A0分成n个波动区间,对于第i个波动区间,定义Ai具有如下的表达式:
Ai∈[Di,Di+1]i=1,2,…,n(4)
对每个波动区间Ai的边缘概率密度P(Ai)进行计算:
式中,ni表示向量A0中的元素落入波动区间Ai的数据点数,P(Ai)为Ai的边缘概率密度;
使用自信息熵H(Ai)来对向量A自身随机波动的不确定性进行表征,即
根据香农信息论,将一维向量的自信息熵H(Xi)扩展为二维向量的互信息I(A;B),即:
式中:B是区别于A的另一个代表气象的矢量;p(Bj)代表波动区间Bj的边缘概率密度;p(AiBj)代表A0、B0在波动区间Ai、Bj的联合概率密度。
为克服互信息量纲的影响,对广义互信息I(A;B)进行归一化处理,得到MIE相关系数IAB为:
式中,H(B)代表了向量B的自信息熵。
相对于传统的线性相关系数,MIE具有更广泛的应用前景,能够更好的挖掘出气象因素与光伏发电功率之间的非线性相关性。
通过矩阵填充算法,可以改善光伏发电功率预测的准确性,特别是在输入侧存在较大误差的气象数据情况下。该算法能够修正NWP数据,从而提高气象数据的空间分辨率,并提高预测精度。
对气象数据进行采集,设气象数据的矩阵为C=(cij)m×n,其中m代表了NWP气象数据,n代表了气象预报时间,cij是用相应的时空点的实测数据来表示矩阵中各要素的数值。投影矩阵由[01]来确定在这个时间点上是否进行采集。对应的采样矩阵是:
式中,(P[C]Ω)i,j代表采样矩阵,Ω代表采样矩阵元素下标的集合。
基于矩阵填充算法将未采集到的数据进行填充,当数据被填充时,用核范数来代替秩,并且定义如下:
式中,S代表重构矩阵,||S||为矩阵S的核范数,σi为S中降序排列的第i个奇异值。
在秩最小化的条件下,解决核范数最小化的重构未知矩阵为:
式中,Cij为采集到的值;Ω为采样矩阵元素下标的集合。
首先,将式(11)正则化,表达式如下:
式中,当τ→+∞时,最优化问题的最优解收敛到式(11)的最优解,代表S的F范数,τ||S||代表原始的损失函数,PΩ(·)是一个投影算子。
其次,构造式(12)的拉格朗日函数,表达式如下:
式中,L(S,T)代表拉格朗日函数,T是对偶变量,也叫做拉格朗日乘子
最后,通过交替迭代方法求解,表达式如下:
式中,δK代表步长,k代表迭代次数。
考虑高分辨率数据中隐含有不同时间尺度特征尚未充分挖掘,采用多尺度一维卷积算子挖掘隐含的不同时间尺度信息与原始数据的自相关特征,作为后续时空图注意力卷积网络的输入数据。
步骤2:如图2所示,考虑不同区域内光伏电站之间的时空关联特性,通过构建属性图来捕捉光伏发电功率在时间和空间上的动态特征。
当使用图神经网络模型预测光伏发电功率时,输入数据包括静态数据和动态数据。其中静态数据包括光伏电站的位置,动态数据包括光伏电站在每个位置的动态特征。因此可以构建属性图G(V,E)来捕捉光伏发电功率在时间和空间上的动态特征,其中V和E分别表示属性图的节点和边。光伏电站位置表征为图节点,每个节点Vi具有关联的静态特征向量和一组矩阵形式的动态特征。前者包含位置信息,后者包含S类历史特征,即历史光伏发电功率、历史气象信息、NWP数据。对不同光伏电站之间的地理邻近性进行建模定义,节点之间的连接可以用边的权重来描述。根据光伏电站的高斯核阈值距离函数,可以定义节点i和j之间的边的权重Wi,j表示如下:
其中,dist(i,j)为光伏电站i和光伏电站j之间的地理距离;σ为n个光伏电站两两之间距离的标准差;ε是阈值,如果距离小于阈值,则默认两个光伏电站没有连接,以保证图结构的稀疏性。
步骤3:如图3所示,采用多层图注意力网络从属性图中提取空间特征,进行多个相邻光伏电站之间的空间依赖建模。
阐明复杂的空间相关性是预测各光伏电站发电功率的关键问题,通过考虑空间相似性,所提出的模型可以评估相似位置的光伏电站发电功率的变化,从而更准确地预测各光伏电站的发电功率。本发明采用多层图注意力网络(GAT)从属性图中提取时空特征,通过聚合相邻节点来更新每个节点的嵌入。每个位置根据移动性从相邻位置接收信息,以模拟给定区域中多个光伏电站之间时空特征信息的交互。在第t个时间步处,节点i的输入表示为其中M表示输入窗口的时间步长。首先,将历史特征输入到属性图中;然后应用图注意力机制计算每个节点的注意力值(表示为/>其中Fz是GAT层的输出维度)。其中使用多头机制来计算K个独立的注意力分数,以便计算/>节点i和节点j之间的第k个头的注意力权重/>计算如下:
其中,是第k个头的线性变换权重矩阵,将输入维度转换为输出维度;是第k个头的注意力计算矩阵;(·|·)表示串联操作。注意力得分/>计算如下:
其中,节点i的每条边都具有一个注意力分数,用于评估应该从相邻节点j聚合多少信息。最后,将来自多个头的所有嵌入向量相加以建立节点i的最终表示如下:
步骤4:如图4所示,采用时间卷积网络从属性图中来挖掘时间相关特征,进行多个相邻光伏电站之间时间依赖建模。
由于图信息随时间变化,对复杂的时间特征进行建模是预测各光伏电站发电功率的另一个关键问题。本发明采用时间卷积网络(TCN)来挖掘时间相关特征,其基本思想是结合一维全卷积网络和因果卷积的优点,使用扩展因果卷积和残差模式分别替代普通因果卷积网络和普通卷积层,以获得更大的感受视野和保持网络的稳定性。对于一维输入序列卷积核为K:/>则第t个时间步的卷积定义如下:
其中d是膨胀因子,k是卷积核的大小,t-d·m指示过去的方向。
经过一系列的卷积运算,输入序列被映射为包含时间信息的隐式向量Ht,表示如下:
Ht=Γ(xt,{Wt})+Convdim(xt) (20)
其中,Γ表示由非线性因果扩展卷积、非线性激活函数(ReLU)、权重归一化和dropout正则化组成的卷积运算模块,Wt是可学习的权重向量,Convdim用于调整输入向量的维度,实现残差连接的向量加法运算。
步骤5:基于步骤2、3、4建立时空图注意力卷积网络模型STGATCN,采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化;所述改进的序贯模型优化算法为使用元学习方法对序贯模型优化算法进行初始化,使用自动早停策略来自动终止STGATCN模型训练。
使用元学习方法对序贯模型优化算法进行初始化具体实现过程如下:
S1:提取元特征:利用经过训练的样本特征提取器和数据集特征提取器可以获得一个代表数据集J的元特征向量mJ
S2:寻找相似的数据集:在步骤S1的基础上,使用k近邻算法找到k个与当前数据集相似度最高的历史数据集;
S3:初始化贝叶斯优化,通过历史优化记录,可以提取步骤S2中k个历史数据集的最佳超参数,并将它们作为序贯模型优化算法的初始点,以加速整个优化过程并改善最终的优化效果。
使用自动早停策略来自动终止预测模型训练实现过程如下:
L1:更新超参数:将超参数R更新到STGATCN模型中;
L2:STGATCN模型训练:在模型训练的初期,模型按照正常流程进行训练,直到达到需要判断是否提前停止训练的特定训练次数;
L3:判断早停:在达到特定的训练次数后,使用测试集对STGATCN模型进行提前评估;即停止当前训练进程,使用当前模型对测试集进行测试,并得到本组超参数的早期性能值;然后,将该早期性能值与历史超参数的早期性能值进行比较;如果本组超参数的早期性能值明显优于大部分历史超参数的早期性能值,则继续进行训练直到达到最大训练次数;否则,模型训练将被提前终止;
L4:输出STGATCN模型性能:如果模型按照正常流程一直训练到达最大训练次数,将直接输出模型在数据集J的测试集上的最终性能值fJ(R);为了近似代替其真实性能fJ(R),选择早期性能最接近的两个历史超参数性能的平均值。
采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化,具体实现过程如下:
TCN模型需要优化的超参数组为(K,F,N,P,λ,η),GAT模型需要优化的超参数为(σ,H,P,λ,η),其中,K表示卷积核大小、F表示卷积核数量、N表示残差块数量、P表示Dropout丢弃率、λ表示正则化参数、η表示学习率、σ表示注意力头数、H表示隐藏层节点数;超参数优化的表示如下式所示:
式中:f(m)代表预测模型的评价指标RMSE,能够衡量光伏功率预测模型性能的度量指标,它要求使其最小;m代表了超参数组((K,F,N,P,λ,η)、(σ,H,P,λ,η));M代表m取值的超参数域;m*表示使得评价指标RMSE的分数最低的超参数;
贝叶斯优化利用自适应且评估成本较低的代理模型来近似预测模型的评价指标RMSE,从而显著提高搜索效率。贝叶斯优化是基于已有的N组试验结果R对目标函数进行建模,并计算y的后验分布p(w|m,R)作为代理模型,代理模型采用了TPE估计方法,下面是p(w|m)的计算表达式:
收益函数可以对一个超参数组给代理模型带来的收益进行评估,收益越大则更新后的代理模型就会愈靠近模型的评价指标RMSE,收益函数为:
其中,w*=min{wn,1≤n≤N}是已有样本中的最优值,R为超参数。
步骤6:将步骤3、4提取到的时空特征送入训练好的STGATCN模型的全连接预测输出层,输出光伏发电功率预测结果。
经过上述基于图注意力网络的空间依赖挖掘和基于时间卷积网络的时间依赖挖掘后,可以得到隐含多源数据的时空特征向量Ht,然后将时空特征向量Ht送入全连接预测输出层进行处理,最后输出光伏发电功率预测结果全连接预测输出层计算公式如下:
其中,Ψf为全连接层激活函数,Wf和Bf分别为全连接层的权重矩阵和偏置矩阵。

Claims (9)

1.一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,包括以下步骤:
(1)获取光伏电站历史运行数据,该数据集包含历史光伏发电功率数据和NWP气象数据;利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析,筛选出相关程度最高的气象因子,并采用矩阵填充算法对相关程度最高的气象因子进行修正;
(2)考虑不同区域内光伏电站之间的时空关联特性,通过构建属性图来捕捉光伏发电功率在时间和空间上的动态特征;
(3)采用多层图注意力网络从属性图中提取空间特征,进行多个相邻光伏电站之间的空间依赖建模;
(4)采用时间卷积网络从属性图中来挖掘时间相关特征,进行多个相邻光伏电站之间时间依赖建模;
(5)基于步骤(2)、(3)、(4)建立时空图注意力卷积网络模型STGATCN,采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化;所述改进的序贯模型优化算法为使用元学习方法对序贯模型优化算法进行初始化,使用自动早停策略来自动终止STGATCN模型训练;
(6)将步骤(3)、(4)提取到的时空特征送入训练好的STGATCN模型的全连接预测输出层,输出光伏发电功率预测结果;
步骤(1)所述利用互信息熵对NWP中的气象因子与光伏功率进行相关性分析实现过程如下:
把气象数据看作是一种随机变量,对于每一个随机变量A=[a1,a2,…,an],其中n是指随机变量A的样的本量,将随机变量A进行[0,1]归一化处理:
式中,A0代表了随机变量A的归一化后的结果;
将X定义为向量A0的组间距,Di是向量X0的波动区间边缘:
用数字边界作划分条件,用一维柱状图进行分析;将矢量A0分成n个波动区间,对于第i个波动区间,Ai为:
Ai∈[Di,Di+1]i=1,2,…,n(4)
对每个波动区间Ai的边缘概率密度P(Ai)进行计算:
式中,ni表示向量A0中的元素落入波动区间Ai的数据点数;使用自信息熵H(Ai)来对向量A自身随机波动的不确定性进行表征:
根据香农信息论,将一维向量的自信息熵H(Xi)扩展为二维向量的互信息I(A;B),即:
式中,B是区别于A的另一个代表气象的矢量;p(Bj)代表波动区间Bj的边缘概率密度;p(AiBj)代表A0、B0在波动区间Ai、Bj的联合概率密度;
对广义互信息I(A;B)进行归一化处理,得到MIE相关系数IAB为:
式中,H(B)代表了向量B的自信息熵。
2.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(1)所述采用矩阵填充算法对相关程度最高的气象因子进行修正实现过程如下:
气象数据的矩阵为C=(cij)m×n,其中m代表了NWP气象数据,n代表了气象预报时间,cij是用相应的时空点的实测数据来表示矩阵中各要素的数值;投影矩阵由[01]来确定在这个时间点上是否进行采集,对应的采样矩阵是:
式中,(P[C]Ω)i,j代表采样矩阵,Ω代表采样矩阵元素下标的集合;
基于矩阵填充算法将未采集到的数据进行填充,当数据被填充时,用核范数来代替秩,并且定义如下:
式中,S代表重构矩阵,||S||为矩阵S的核范数,σi为S中降序排列的第i个奇异值;
在秩最小化的条件下,解决核范数最小化的重构未知矩阵为:
式中,Cij为采集到的值;Ω为采样矩阵元素下标的集合;
首先,将式(11)正则化,表达式如下:
式中,当τ→+∞时,最优化问题的最优解收敛到式(11)的最优解,代表S的F范数,τ||S||代表原始的损失函数,PΩ(i)是一个投影算子;
其次,构造式(12)的拉格朗日函数:
式中,L(S,T)代表拉格朗日函数,T是对偶变量,通过交替迭代方法求解,表达式如下:
式中,δK代表步长,k代表迭代次数。
3.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(2)实现过程如下:
构建属性图G(V,E)捕捉光伏发电功率在时间和空间上的动态特征,其中V和E分别表示属性图的节点和边;光伏电站位置表征为图节点,每个节点Vi具有关联的静态特征向量和一组矩阵形式的动态特征;静态特征包含光伏电站的位置信息,动态特征包含光伏电站S类历史特征;对不同光伏电站之间的地理邻近性进行建模定义,节点之间的连接可以用边的权重来描述;根据光伏电站的高斯核阈值距离函数,定义节点i和j之间的边的权重Wi,j
其中,dist(i,j)为光伏电站i和光伏电站j之间的地理距离;σ为n个光伏电站两两之间距离的标准差;ε是阈值,如果距离小于阈值,则默认两个光伏电站没有连接,以保证图结构的稀疏性。
4.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(3)实现过程如下:
采用多层图注意力网络GAT从属性图中提取时空特征,通过聚合相邻节点来更新每个节点的嵌入;每个位置根据移动性从相邻位置接收信息,以模拟给定区域中多个光伏电站之间时空特征信息的交互;在第t个时间步处,节点i的输入表示为其中M表示输入窗口的时间步长;将历史特征输入到属性图中;应用图注意力机制计算每个节点的注意力值,表示为/>其中Fz是GAT层的输出维度;使用多头机制来计算K个独立的注意力分数,以便计算/>节点i和节点j之间的第k个头的注意力权重/>计算如下:
其中,是第k个头的线性变换权重矩阵,将输入维度转换为输出维度;是第k个头的注意力计算矩阵;(·|·)表示串联操作;注意力得分/>计算如下:
其中,节点i的每条边都具有一个注意力分数,用于评估应该从相邻节点j聚合多少信息;将来自多个头的所有嵌入向量相加以建立节点i的最终表示如下:
5.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(4)实现过程如下:
采用时间卷积网络TCN挖掘时间相关特征,对于一维输入序列卷积核为/>则第t个时间步的卷积定义如下:
其中,d是膨胀因子,k是卷积核的大小,t-d·m指示过去的方向;
经过一系列的卷积运算,输入序列被映射为包含时间信息的隐式向量Ht
Ht=Γ(xt,{Wt})+Convdim(xt) (20)
其中,Γ表示由非线性因果扩展卷积、非线性激活函数、权重归一化和dropout正则化组成的卷积运算模块,Wt是可学习的权重向量,Convdim用于调整输入向量的维度,实现残差连接的向量加法运算。
6.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(5)所述使用元学习方法对序贯模型优化算法进行初始化具体实现过程如下:
S1:提取元特征:利用经过训练的样本特征提取器和数据集特征提取器可以获得一个代表数据集J的元特征向量mJ
S2:寻找相似的数据集:在步骤S1的基础上,使用k近邻算法找到k个与当前数据集相似度最高的历史数据集;
S3:初始化贝叶斯优化,通过历史优化记录,可以提取步骤S2中k个历史数据集的最佳超参数,并将它们作为序贯模型优化算法的初始点,以加速整个优化过程并改善最终的优化效果。
7.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(6)所述使用自动早停策略来自动终止预测模型训练实现过程如下:
L1:更新超参数:将超参数R更新到STGATCN模型中;
L2:STGATCN模型训练:在模型训练的初期,模型按照正常流程进行训练,直到达到需要判断是否提前停止训练的特定训练次数;
L3:判断早停:在达到特定的训练次数后,使用测试集对STGATCN模型进行提前评估;即停止当前训练进程,使用当前模型对测试集进行测试,并得到本组超参数的早期性能值;然后,将该早期性能值与历史超参数的早期性能值进行比较;如果本组超参数的早期性能值明显优于大部分历史超参数的早期性能值,则继续进行训练直到达到最大训练次数;否则,模型训练将被提前终止;
L4:输出STGATCN模型性能:如果模型按照正常流程一直训练到达最大训练次数,将直接输出模型在数据集J的测试集上的最终性能值fJ(R);为了近似代替其真实性能fJ(R),选择早期性能最接近的两个历史超参数性能的平均值。
8.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,步骤(6)所述采用改进的序贯模型优化算法对STGATCN模型的超参数进行优化,具体实现过程如下:
TCN模型需要优化的超参数组为(K,F,N,P,λ,η),GAT模型需要优化的超参数为(σ,H,P,λ,η),其中,K表示卷积核大小、F表示卷积核数量、N表示残差块数量、P表示Dropout丢弃率、λ表示正则化参数、η表示学习率、σ表示注意力头数、H表示隐藏层节点数;超参数优化的表示如下式所示:
式中:f(m)代表预测模型的评价指标RMSE,能够衡量光伏功率预测模型性能的度量指标,它要求使其最小;m代表了超参数组((K,F,N,P,λ,η)、(σ,H,P,λ,η));M代表m取值的超参数域;m*表示使得评价指标RMSE的分数最低的超参数;
贝叶斯优化利用自适应且评估成本较低的代理模型来近似预测模型的评价指标RMSE;贝叶斯优化基于已有的N组试验结果R对目标函数进行建模,并计算y的后验分布p(w|m,R)作为代理模型,代理模型采用了TPE估计方法,下面是p(w|m)的计算表达式:
收益函数对一个超参数组给代理模型带来的收益进行评估,收益越大则更新后的代理模型就会愈靠近模型的评价指标RMSE,收益函数为:
其中,w*=min{wn,1≤n≤N}是已有样本中的最优值,R为超参数。
9.根据权利要求1所述的一种基于多尺度时空图注意力卷积网络的光伏功率预测方法,其特征在于,所述步骤(6)实现过程如下:
经过基于图注意力网络的空间依赖挖掘和基于时间卷积网络的时间依赖挖掘后,得到隐含多源数据的时空特征向量Ht,然后将时空特征向量Ht送入全连接预测输出层进行处理,最后输出光伏发电功率预测结果全连接预测输出层计算公式如下:
其中,Ψf为全连接层激活函数,Wf和Bf分别为全连接层的权重矩阵和偏置矩阵。
CN202311106969.2A 2023-08-29 2023-08-29 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法 Active CN117154704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311106969.2A CN117154704B (zh) 2023-08-29 2023-08-29 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311106969.2A CN117154704B (zh) 2023-08-29 2023-08-29 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法

Publications (2)

Publication Number Publication Date
CN117154704A CN117154704A (zh) 2023-12-01
CN117154704B true CN117154704B (zh) 2024-06-07

Family

ID=88886193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311106969.2A Active CN117154704B (zh) 2023-08-29 2023-08-29 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法

Country Status (1)

Country Link
CN (1) CN117154704B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115496263A (zh) * 2022-08-24 2022-12-20 苏州中立志科技有限公司 一种基于时空遗传注意力网络的短期光伏发电预测方法
CN116011608A (zh) * 2022-09-16 2023-04-25 浙江大学 光伏功率超短期预测方法及装置、电子设备、存储介质
CN116565863A (zh) * 2023-07-10 2023-08-08 南京师范大学 一种基于时空相关性的短期光伏出力预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115496263A (zh) * 2022-08-24 2022-12-20 苏州中立志科技有限公司 一种基于时空遗传注意力网络的短期光伏发电预测方法
CN116011608A (zh) * 2022-09-16 2023-04-25 浙江大学 光伏功率超短期预测方法及装置、电子设备、存储介质
CN116565863A (zh) * 2023-07-10 2023-08-08 南京师范大学 一种基于时空相关性的短期光伏出力预测方法

Also Published As

Publication number Publication date
CN117154704A (zh) 2023-12-01

Similar Documents

Publication Publication Date Title
CN113962364A (zh) 一种基于深度学习的多因素用电负荷预测方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN113672865A (zh) 一种基于深度图高斯过程的交通流量预测方法
Liu et al. Heating load forecasting for combined heat and power plants via strand-based LSTM
CN115688579A (zh) 一种基于生成对抗网络的流域多点水位预测预警方法
Li et al. Deep spatio-temporal wind power forecasting
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN117132135B (zh) 基于数字孪生的城市信息化管理系统及方法
Saffari et al. Deep convolutional graph rough variational auto-encoder for short-term photovoltaic power forecasting
CN114169434A (zh) 一种负荷预测方法
CN116345555A (zh) 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法
CN116014722A (zh) 基于季节分解和卷积网络的次日光伏发电预测方法及系统
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN114596726B (zh) 基于可解释时空注意力机制的停车泊位预测方法
CN117154704B (zh) 一种基于多尺度时空图注意力卷积网络的光伏功率预测方法
CN116937559A (zh) 基于循环神经网络和张量分解的电力系统负荷预测系统和方法
CN117131654A (zh) 基于预分析初猜值条件非线性最优扰动的目标观测方法
CN115063972B (zh) 基于图卷积和门控循环单元的交通速度预测方法和系统
CN116454875A (zh) 基于集群划分的区域风电场中期功率概率预测方法及系统
CN116578858A (zh) 基于图神经网络的空压机故障预测与健康度评价方法及系统
CN116205508A (zh) 一种分布式光伏发电异常诊断方法和系统
CN115204362A (zh) 一种机械设备剩余寿命区间预测方法
CN114219122A (zh) 基于网格气象数据的小水电站发电功率超短期预测方法
CN113537573A (zh) 基于双重时空特征提取的风电功率运行趋势预测方法
CN117454762B (zh) Markov-神经网络的穿煤隧道掌子面瓦斯浓度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant