CN115994605A - 综合气象因子数据的多数据融合光伏功率预测算法 - Google Patents
综合气象因子数据的多数据融合光伏功率预测算法 Download PDFInfo
- Publication number
- CN115994605A CN115994605A CN202211221139.XA CN202211221139A CN115994605A CN 115994605 A CN115994605 A CN 115994605A CN 202211221139 A CN202211221139 A CN 202211221139A CN 115994605 A CN115994605 A CN 115994605A
- Authority
- CN
- China
- Prior art keywords
- data
- meteorological
- power
- formula
- photovoltaic power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
综合气象因子数据的多数据融合光伏功率预测算法,包括以下步骤:Step1、对数据进行数据预处理;Step2、历史气象数据输入到气象特征选取模块,进行相关性分析,构造综合气象因子;Step3、预处理完的历史光伏发电功率数据,在功率模态重构模块中利用变分模态分解VMD将光发发电功率进行分解为一系列具有特定带宽的IMF,将所有IMF重构为高频分量和低频分量;Step4、构建AttGRU预测模型。然后对两种频率模态下的预测结果进行叠加重构,得到最终预测结果。该模型具有复杂度低、预测精度较高的特点。模型依据多数据融合后、生成的综合气象因子与光伏输出功率间的映射关系,构造了一种用于管理光伏发电站的功率预测算法,该算法可提高光伏电站管理系统中功率预测的准确性。
Description
技术领域
本发明涉及光伏发电功率预测技术领域,具体涉及一种综合气象因子数据的多数据融合光伏功率预测算法。
背景技术
光伏发电功率预测是基于历史和当前数据,对未来一段时间的光伏功率进行预测。传统光伏发电功率预测方法主要为物理建模法,但此类方法构建复杂,需要考虑诸多地理环境因素及安装设备参数,且随时间的推移受气象变化干扰严重。随着人工智能技术在电网中大规模应用,智能算法对预测的精度、速度和模型的复杂度都有着不错的优化,光伏发电功率预测技术已由传统的物理建模预测过渡到数据驱动的人工智能算法预测。但目前所使用的智能算法如支持向量机、BP神经网络、卷积神经网络等预测性能较差,无法深度学习历史数据之中的时序信息,难以挖掘输入特征与输出功率之间的映射关系,尤其在天气波动幅度较大的日期中预测精度下降明显。
现有专利文献CN113988364A记载了一种基于变分模态分解和多尺度下采样的光伏功率出力预测方法,使用变分模态分解(VMD)将光伏功率和气象数据分解为多个尺度,并在每个尺度下构建卷积神经网络进行光伏功率预测;但传统卷积神经网络对高维特征提取能力有限。本申请采用“引入注意力机制”,针对不同特征的重要程度赋予其贡献率,加强预测模型对关键特征的挖掘能力。
专利文献CN108549929A记载了一种基于深层卷积神经网络的光伏功率预测方法,用VMD对获取的历史光伏功率序列分解为多个频率分量和余项分量,每个频率分量又建立深层卷积神经网络进行预测、余项分量使用支持向量机结合气象数据进行预测。该技术方案一是在频率分量下预测时没有考虑当前气象,致使功率预测实时精度有限;二是全频率分量下的深层卷积神经网络,将使模型计算代价过大。本申请通过AE将VMD分解后多个模态重构为两种分量,减少模型的复杂程度;使用PCA融合多维气象数据作为两种分量下的输入,气象因素对光伏功率的影响给予了考虑。
专利文献CN113779861A记载了一种光伏功率的预测方法及终端设备,是将光伏功率通过奇异值分解为高频分量和低频分量的分解个数,利用VMD对两种分量进行二次分解、结合RBF神经网络进行预测。该技术方案对任一种气象条件下光伏功率序列都需进行两次分解、计算过于繁琐;另解释性不强。本申请使用VMD-AE将光伏功率直接重构为反映变化趋势的低频分量和反映波动程度的高频分量,分解过程简单、重构结果可解释性强的特点。
因光伏发电功率数据具有较强的前后时间关联性,但上述三种方案中使用的预测模型均不属于循环神经网络、缺少对时序信息的提取能力、预测模型对关键特征的提取能力不足,造成预测效果不佳。本专利使用AttGRU作为基本预测模型,在充分提取时序信息的同时把握了数据中的关键特征,同时使用PCA将多维气象因素融合成1维综合气象因子,减小了数据冗余对模型特征挖掘能力的干扰。
发明内容
本发明所要解决的技术问题是提供一种综合气象因子数据的多数据融合光伏功率预测算法,模型依据多数据融合后、生成的综合气象因子与光伏输出功率间的映射关系,构造了一种用于管理光伏发电站的功率预测算法,该算法可提高光伏电站管理系统中功率预测的准确性。
为解决上述技术问题,本发明所采用的技术方案是:
综合气象因子数据的多数据融合光伏功率预测算法,包括以下步骤:Step1、在开始预测前对采集到的光伏电站输出功率及天气特征数据进行数据预处理;Step2、预处理完的数据集中包含历史气象数据和历史光伏发电功率数据,历史气象数据输入到气象特征选取模块,进行相关性分析,以提取对光伏发电功率影响大于设定值的气象特征,根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块,利用PCA,即气象因素主成分的分析Principal ComponentAnalysis,构造综合气象因子;
Step3、在Step2的同时,预处理完的历史光伏发电功率数据,在功率模态重构模块中利用变分模态分解VMD将光发发电功率进行分解为一系列具有特定带宽的固有模态函数Intrinsic Mode Function,即IMF,并通过计算每个IMF的近似熵AE,将所有IMF重构为高频分量和低频分量,高频分量反映了功率的波动特征,低频分量反映了功率的变化趋势;
Step4、在门控循环神经网络Gated Recurrent Unit Neural Network,即GRU中加入注意力机制Attention Mechanism,即Att,构建AttGRU预测模型,AttGRU预测模型由AttGRU1和AttGRU2构成,STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史高频功率分量输入AttGRU1,对未来时间点的高频功率分量做出预测;STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史低频功率分量输入AttGRU2,对未来时间点的低频功率分量做出预测;然后对两种频率模态下的预测结果进行叠加重构,得到最终预测结果。
上述的Step1的数据预处理的具体过程为:
Step1.1、对于采集到的光伏电站输出功率及天气特征数据中的缺失值,采用前后5分钟记录均值进行填补,对于其中的异常值,采用孤立森林算法Isolation Forest,即IF按照STEP1.2的后续步骤进行检测并剔除;
Step1.2、IF对数据样本不断分割直至每个样本空间只包含一种数据点,分割过程如下:
Step1.2.1、对于数据集X,使用一棵具有N个节点的二叉树T进行描述,每一节点Nijr或Nijl的数据为X的子集,其中的i表示树的层数,j表示上一层中第j个节点,r和l用于区分同层的右节点和左节点;
Step1.2.2、对于某层所包含的数据集Xij,随机选择样本属性q及其值域的空间取值p来划分X(i+1)j*l与X(i+1)j*r,对应节点集N(i+1)j*l与N(i+1)j*r,小于或等于p的数据划分到N(i+1)j*l节点,其他划分到N(i+1)j*r节点,其中j*表示第i+1层第j*个节点;
Step1.2.3、当遇到下面情况时得到完整的二叉树,划分结束:
A.数据树的深度达到设定的最大值;
B.节点Nij只包含一个数据点或所包含的数据点相同。
上述的Step2的具体过程为:
Step2.1、不同的气象特征对发电功率的影响程度不同,利用皮尔逊相关系数Pearson Correlation Coefficient,即PCC对气象特征进行相关性分析,计算各气象特征与光伏发电功率间的相关系数,公式(1)为PCC计算方法:
公式(1)中xi表示气象特征,P表示光伏发电功率,Cov(xi,P)为xi和P的协方差,Ver[xi]和Ver[P]分别为xi和P的方差;
Step2.2、根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块;
Step2.3、在气象数据融合模块内,PCA对图1特征选取模块输出的多维气象特征进行降维,得到多个成分及对应贡献率,将每个成分按照其贡献率加权求和得到综合气象因子,具体过程如下:
Step2.3.1、将具有m个气象特征的n个样本的数据创建为一个m×n维矩阵X;
Step2.3.2、随后将对X中数据进行标准化处理,并计算协方差矩阵R;
Step2.3.3、通过求解特征方程|λI-R|=0计算特征值和特征向量,其中I是单位矩阵,λ是特征值,各成分根据各自的特征向量按特征值的顺序排列,具有最高特征值的成分称为第一主成分,其次是第二主成分,以此类推;
Step2.3.4、通过公式(2)、(3)计算主成分贡献率ηi和累计贡献率pk,选取的成分对应于累积贡献率达到95%的前n个特征值;
Step2.3.5、根据公式(4)计算各主成分值zi:
zi=ai1x1+ai2x2+…+aijxj+…+aipxp (4)
式中aij是特征向量矩阵中的元素;
Step2.3.6、使用公式(5)将选取的各成分按照其对应的贡献率加权求得综合气象因子:
F=η1z1+η2z2+…+ηizi+…+ηmzm (5)
公式(5)中:zi为成分,ηi为zi对应贡献率。
上述的Step3中得到高频分量和低频分量的具体过程为:
Step3.2、利用解调信号的H1高斯平滑性,得到各模态的估计带宽,假设分解模态数为K,公式(6)为约束变分模型的表达式:
公式(6)中P(t)为待分解的时间序列,uk是第k个模态,模态集表示为{uk}={u1,u2,…,un};wk是uk的第k个中心频率,*代表卷积运算,δ(t)为单位脉冲函数;
Step3.3、根据公式(7)引入二次平衡参数α和拉格朗日乘子λ,将约束变分问题转换为一个无约束变分问题;
Step3.4、利用公式(8)、(9)令(uk,wk)不断迭代更新,直至获得最优模态;
Step3.5、当满足以下收敛准则时,完成迭代;
Step3.6、利用AE衡量每个IMF的复杂程度,按计算得到的AE值对IMF进行重构,将VMD分解得到的多个IMF重新组合为高频分量和低频分量,具体过程如下:Step3.6.1、预先设置参数m和r,其中m代表嵌入维数,r代表相似容限;Step3.6.2、重建m维向量{X(i),X(2),…,X(n-m+1)},X(i)={u(i),u(i+1),…,u(i+m-1)};
Step3.6.3、对于1≤i≤n-m+1以及给定的r值,计算下式;
k=numb<r{d[X,X*]<r} (12)
公式(11)中,u(a)和u*(a)分别为向量X和X*的元素;d表示向量X和X*之间的距离,由相应元素的最大差值决定;公式(12)中,k是d[X,X*]比给定r值小的个数;Step3.6.4、定义Φm(r)函数;
Step3.6.5、按公式(15)计算分解得到的每个IMF的近似熵AE值;
AE=Φm(r)-Φm+1(r) (15)
公式(15)中参数m设置为2,r设置为0.15SD,SD表示时间序列的标准差;Step3.6.6、将IMF按对应AE值重新组合成高频分量和低频分量。
上述的Step4中AttGRU模型内部结构计算方法如下:
Step4.1、AttGRU由GRU神经网络与注意力机制结合而成,其中GRU利用其内部的两个门结构处理输入信息,计算公式如下:
rt=σ(Wr·[ht-1,xt]) (16)
zt=σ(Wz·[ht-1,xt]) (17)
gt=φ(Wg·[rt×ht-1,xt]) (18)
ht=(I-zt)×ht-1+zt×gt (19)
yt=σ(Wo·ht) (20)
式(16)-(20)中,xt表示输入向量,ht-1和ht分别表示以前时间和当前时间的状态记忆变量;zt和rt分别表示更新门和复位门的状态;ht表示当前候选集的状态,yt表示当前时刻的输出向量的权重参数;Wr、Wz、Wg、Wo表示复位门、更新门、候选集、输出向量分别乘以xt和ht-1组成的连接矩阵;×和·符号表示矩阵叉乘和点乘,I表示单位矩阵;σ为simgoid激活函数;φ表示tanh激活函数。
Step4.2、注意机制根据观察输入信息选择性地获取影响输出结果的某些重要部分,赋予重要特征相对较高的权重,不重要特征赋予较低的权重,计算公式如下:
βt=qtanh(ωht+b) (21)
式(21)中ht为t时刻输入值,βt为ht对应的注意力概率,由神经网络隐藏层输出得到;q和ω为权重系数,b为偏置系数;式(22)中at由βt通过softmax函数变换得到,at越大关注程度越高;式(23)中A是根据注意力机制通过权值分配后得到的新特征向量。
本发明提供的一种综合气象因子数据的多数据融合光伏功率预测算法,具有如下有益效果:
(1)通过对气象因素主成分的分析(Principal Component Analysis,PCA),以各气象特征的主成分值和贡献率为要素、构造综合气象因子函数,其函数值代替训练预测模型原有多个气象特征,一方面实现在保留原始高维气象特征数据中重要信息的同时,减少输入特征维度、消除冗余信息生成的敏感性;另一方面,综合气象因子函数值可强化预测模型的学习能力与特征挖掘能力、可有效应变天气突发情况,相较于传统数据驱动型方法具有更高的预测精度。
(2)变分模态分解近似熵VMD-AE(Variational Mode Decomposition-Approximate Entropy)技术,是利用VMD对历史输出功率进行分解、AE再将其重构为代表波动程度的高频分量和变化趋势的低频分量,方便预测模型提取每日光伏发电功率中的变化趋势和波动特性;从而提高模型对气象波动的抗干扰能力、降低传统频域分解技术带来的模型高复杂度问题。
(3)由于光伏发电的随机性和波动性,致使传统预测模型很难拟合输入输出关系、时序信息特征提取能力有限;故此,在门控循环神经网络(Gated Recurrent Unit NeuralNetwork,GRU)中加入注意力机制(Attention Mechanism,Att)构建AttGRU预测模型;利用GRU提取时序信息能力强的特点,以把握前后时刻数据间的关联性;注意力机制可深度挖掘高/低频分量下综合气象因子与输出功率间的映射关系,把握输入数据中对光伏发电功率影响大的特征和时段,从而实现预测精度的提高。
附图说明
下面结合附图和实施例对本发明作进一步说明:
图1为本发明光伏发电功率预测算法流程图;
图2为IF异常值检测流程图;
图3为综合气象因子构建流程图;
图4为AttGRU预测模型;
图5为实施例中的光伏功率预测系统结构图;
图6为实施例中的综合气象因子构造结果;
图7为实施例中光伏功率模态分解结果;
图8为实施例中光伏功率模态重构结果;
图9为实施例中预测结果1;
图10为实施例中预测结果2。
具体实施方式
以下结合附图和实施例详细说明本发明技术方案。
综合气象因子数据的多数据融合光伏功率预测算法,算法如图1所示,主要包括数据预处理、气象特征选取模块、气象数据融合模块、功率模态分解模块和预测模块。
本发明主要提供了一种光伏发电功率预测算法,用以解决上述背景技术中提出的问题,下面对算法中各部分流程进行说明:
首先,本发明在开始预测前对采集到的光伏电站输出功率及多维天气特征数据进行数据预处理;由于设备老化、系统故障或人为因素等特殊情况导致传感器记录数据存在异常值和缺失值,需要对此类数据进行预处理;对于数据中的缺失值,采用前后5分钟记录均值进行填补;对于异常值,采用孤立森林算法(Isolation Forest,IF)按照图2流程进行检测并剔除。
图2中,IF对数据样本不断分割直至每个样本空间只包含一种数据点,分割过程如下:
步骤一、对于数据集X,使用一棵具有N个节点的二叉树T进行描述,每一节点Nijr或Nijl的数据为X的子集,其中的i表示树的层数,j表示上一层中第j个节点,r和l用于区分同层的右节点和左节点;
步骤二、对于某层所包含的数据集Xij,随机选择样本属性q及其值域的空间取值p来划分X(i+1)j*l与X(i+1)j*r,对应节点集N(i+1)j*l与N(i+1)j*r,小于或等于p的数据划分到N(i+1)j*l节点,其他划分到N(i+1)j*r节点,其中j*表示第i+1层第j*个节点;
步骤三、当遇到下面情况时得到完整的二叉树,划分结束:
1)数据树的深度达到设定的最大值;
2)节点Nij只包含一个数据点或所包含的数据点相同。
进一步的,处理好的数据集中包含历史气象数据和历史光伏发电功率数据,历史气象数据输入到图1中气象特征选取模块,进行相关性分析,以提取对光伏发电功率影响较大的气象特征;光伏设备因其对太阳能的转化利用方式,其发电功率受天气状况的影响较大;光伏发电功率与每日气温(摄氏度)、相对湿度(%)、风速(米/秒)、散射辐照度(瓦/平方米)、水平辐照度(瓦/平方米)等气象因素均有一定的影响。但不同的气象特征对发电功率的影响程度不同,利用皮尔逊相关系数(Pearson Correlation Coefficient,PCC)对气象特征进行相关性分析,计算各气象特征与光伏发电功率间的相关系数,公式(1)为PCC计算方法:
公式(1)中xi表示气象特征,P表示光伏发电功率,Cov(xi,P)为xi和P的协方差,Ver[xi]和Ver[P]分别为xi和P的方差。
进一步的,根据相关性分析结果剔除相关系数过低或呈现负相关的无效气象特征,保留余下的气象特征输入到图1中气象数据融合模块,利用PCA构造综合气象因子,综合气象因子构建流程如图3所示。
图3中,利用PCA对图1特征选取模块输出的多维气象特征进行降维,得到多个主成分及对应贡献率,将每个主成分按照其贡献率加权求和得到综合气象因子,具体过程如下:
步骤一、将具有m个气象特征的n个样本的数据创建为一个m×n维矩阵X;
步骤二、随后将对X中数据进行标准化处理,并计算协方差矩阵R;
步骤三、通过求解特征方程|λI-R|=0计算特征值和特征向量,其中I是单位矩阵,λ是特征值;主成分根据各自的特征向量按特征值的顺序排列,具有最高特征值的主成分称为第一主成分,其次是第二主成分,以此类推;
步骤四、通过公式(2)、(3)计算主成分贡献率ηi和累计贡献率pk,选取的主成分对应于累积贡献率达到95%的前n个特征值;
步骤五、根据公式(4)计算各主成分值zi:
zi=ai1x1+ai2x2+…+aijxj+…+aipxp (4)
式中aij是特征向量矩阵中的元素;
步骤六、使用公式(5)将选取的各主成分按照其对应的贡献率加权求得综合气象因子:
F=v1z1+v2z2+…+vizi+…+vmzm (5)
公式(5)中:zi为主成分,vi为zi对应贡献率。
进一步的,在图1功率模态重构模块中利用VMD将光发发电功率进行分解为一系列具有特定带宽的固有模态函数(Intrinsic Mode Function,IMF),并通过计算每个IMF的AE值,将所有IMF重构为高频分量和低频分量,高频分量反映了功率的波动特征,低频分量反映了功率的变化趋势,VMD分解过程如下:
步骤二、利用解调信号的H1高斯平滑性,得到各模态的带宽估计,假设分解模态数为K,公式(6)为约束变分模型的表达式:
公式(6)中P(;)为待分解的时间序列,uk是第k个模态,模态集表示为{uk}={u1,u2,…,un};wk是uk的第k个中心频率,*代表卷积运算,δ(;)为单位脉冲函数;
步骤三、根据公式(7)引入二次平衡参数α和拉格朗日乘子λ,将约束变分问题转换为一个无约束变分问题;
步骤四、利用公式(8)、(9)令(uk,wk)不断迭代更新,直至获得最优模态;
步骤五、当满足以下收敛准则时,完成迭代。
进一步的,利用AE衡量每个IMF的复杂程度,按计算得到的AE值对IMF进行重构,将VMD分解得到的多个IMF重新组合为高频分量和低频分量,具体过程如下:步骤一、预先设置参数m和r,其中m代表嵌入维数,r代表相似容限;
步骤二、重建m维向量{X(i),X(2),…,X(n-m+1)},X(i)={u(i),u(i+1),…,u(i+m-1)};
步骤三、对于1≤i≤n-m+1以及给定的r值,计算下式;
k=numb<r{d[X,X*]<r} (12)
公式(11)中,u(a)和u*(a)分别为向量X和X*的元素;d表示向量X和X*之间的距离,由相应元素的最大差值决定;公式(12)中,k是d[X,X*]比给定r值小的个数;步骤四、定义Φm(r)函数;
步骤五、按公式(15)计算分解得到的每个IMF的近似熵AE值;
AE=Φm(r)-Φm+1(r) (15)
公式(15)中参数m设置为2,r设置为0.15SD,SD表示时间序列的标准差;
步骤六、将IMF按对应AE值重新组合成高频分量和低频分量;
进一步的,利用AttGRU作为图1中预测模型,AttGRU结构如图4所示。
AttGRU模型内部结构计算方法说明如下:
1)AttGRU由GRU神经网络与注意力机制结合而成,其中GRU利用其内部的两个门结构处理输入信息,计算公式如下:
rt=σ(Wr·[ht-1,xt]) (16)
zt=σ(Wz·[ht-1,xt]) (17)
gt=φ(Wg·[rt×ht-1,xt]) (18)
ht=()-zt)×ht-1+zt×gt (19)
yt=σ(Wo·ht) (20)
式(16)-(20)中,xt表示输入向量,ht-1和ht分别表示以前时间和当前时间的状态记忆变量;zt和rt分别表示更新门和复位门的状态;ht表示当前候选集的状态,yt表示当前时刻的输出向量的权重参数;Wr、Wz、Wg、Wo表示复位门、更新门、候选集、输出向量分别乘以xt和ht-1组成的连接矩阵;×和·符号表示矩阵叉乘和点乘,I表示单位矩阵;σ为simgoid激活函数;φ表示tanh激活函数。
2)注意机制根据观察输入信息选择性地获取影响输出结果的某些重要部分,赋予重要特征较高的权重,不重要特征较低的权重,计算公式如下:
βt=qtanh (ωht+b) (21)
式(21)中ht为t时刻输入值,βt为ht对应的注意力概率,由神经网络隐藏层输出得到;q和ω为权重系数,b为偏置系数;式(22)中at由βt通过softmax函数变换得到,at越大关注程度越高;式(23)中A是根据注意力机制通过权值分配后得到的新特征向量。
进一步的,图1中预测部分由两个AttGRU组成,其中AttGRU1利用图1气象数据融合模块得到的历史综合气象因子,与图1功率模态重构模块得到的历史高频功率分量作为输入,对未来时间点的高频功率分量做出预测;同理AttGRU对未来时间点的低频功率分量进行预测,对两种频率模态下的预测结果进行叠加重构,得到所提算法的最终预测结果。
实施例:
下面结合工程实例对本发明多数据融合的综合气象因子数据驱动型光伏功率预测及算法进行具体说明,在实际案例中使用硬件部分包括气象数据采集模块、数据传输模块和预测系统终端,系统结构如图5所示。
图5中各组成部分所选设备型号在表1中列出:
表1所选设备及型号
表1中,12要素气象传感器JD-WQX12可针对PM2.5、PM10、CO、SO2、NO2、O3六项污染物参数以及空气温度、相对湿度、风速、风向、大气压力以及降雨量共计12项参数进行监测;双向电表DDSD1352对太阳能电池板进行检测并记录输出参数,包括实时功率、电压、电流、频率、相位等参数;太阳总辐射传感器FSP10,可对水平辐照度、散射辐照度等进行测量;全网通无线通讯模组RM500U将气象数据采集模块、设备工况记录模块、辐照度测量模块中记录到的数据通过信道传输到预测系统终端;预测系统终端负责完成对收到数据的预处理,模型的训练及输出预测结果。
在实际案例中,按照以上方法对型号为Q.PEAK-G4.1 290-310的太阳能电池板输出功率按图1流程进行预测,具体做法与实验结果如下。
使用每天7:30到18:00每5分钟记录一次的光伏发电输出功率和气象数据作为原始数据,每天共126个时间节点,气象数据包括水平辐照度、散射辐照度、温度、风速等;由于设备原因数据中存在一些缺失值和异常值,按图2流程剔除异常值,并使用均值插入法对缺失值进行填补,最终得到218天数据,其中70%作为训练集用于预测模型的训练,30%作为测试集对模型预测效果进行评价。
按图1气象特征提取模块,分析与光伏发电功率相关性较强的气象因素,分析结果见表2,选取水平辐照度、散射辐照度、温度、风速和气压5个气象特征。
表2气象因子相关性分析结果
按图3综合气象因子提取流程,利用PCA对这5个气象特征进行降维,结果见表3。
表3主成分分析结果
从表3中可以看出,前4个主成分的累计贡献率达到了95%,故综合气象因子9可以由前4个主成分按公式(5)线性加权得到,综合气象因子构造结果见图6;由图6可以看出综合气象因子将原有的5维气象特征降低至1维的同时,保留了原有气象特征绝大部分信息,与实际光伏发电功率呈现强相关性。
根据图1中功率模态重构流程,利用VMD-AE对光伏发电功率进行模态重构,VMD分解模态数设置为7,对光伏发电功率的分解结果如图7所示。
通过计算分解后7个IMF的AE值衡量每个模态的复杂程度,各模态及原始功率的AE值计算结果见表4。
表4AE值计算结果
选取AE值小于原始功率的子模态IMF1、IMF2、IMF3重构为低频分量,其余模态重构为高频分量,重构结果如图7所示。
由图8可以看出高频分量代表光伏功率波动特性,低频分量代表光伏功率变化趋势。
在两种频率模态下分别构建AttGRU预测模型,训练过程中AttGRU1的输入为前6个时间节点的历史综合气象因子与历史高频功率分量,即输入维度为(6,2),学习与下一个时间节点高频功率分量间的映射关系;AttGRU2按同样方法学习输入与历史低频功率分量间的映射关系;AttGRU模型拥有1个GRU输入层,1个隐藏层,1个注意力层和1个输出层;隐藏层含有20个神经元,与注意力层一起对输入输出间的映射关系进行深度解析,输出层1个神经元用于输出预测点功率;训练时网络参数批大小batch_size为50,训练次数epoch为30;采用adam优化器,学习率设置为0.001,选择均方误差(Mean Squared Error,MSE)作为损失函数进行训练。
预测精度定义为预测值与实际值的偏离程度,利用MSE、平均绝对误差(MeanAbsolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)作为模型评估指标衡量模型预测精度,MSE、MAE、RMSE的计算式如下:
为说明所提VMD-AE-AttGRU模型在突变天气下的预测性能,选取单一的AttGRU模型与不含模态重构和注意力机制的VMD-GRU模型作为对照组,对未来30分钟的光伏发电功率进行预测,图9、图10为三种模型的预测结果。对三种模型预测精度使用MSE、MAE、RMSE的评估结果如表3所示:
表5各模型预测结果对比
从表中可以看出,所提VMD-AE-AttGRU模型三种指标评估结果均优于其他两种模型,在三种预测模型中的准确度最高,其次是AttGRU模型,VMD-GRU模型表现较差。在MSE、MAE、RMSE三项评估指标下相较于VMD-GRU模型分别减小了58.82%、56.06%、35.78%,说明仅靠传统GRU模型提取时序信息中关键特征能力不够。相较于AttGRU模型分别减小了32.69%、37.11%、17.96%,说明频域分解技术通过提取历史功率数据中的波动特征可使预测精度进一步提高。综上所述,注意力机制的引入和波动性提取的结合使所提模型相较于传统模型具有更高的预测精度,对于突变天气带来的波动性影响具有更强的抵抗力。
Claims (5)
1.综合气象因子数据的多数据融合光伏功率预测算法,其特征在于,包括以下步骤:
Step1、在开始预测前对采集到的光伏电站输出功率及天气特征数据进行数据预处理;
Step2、预处理完的数据集中包含历史气象数据和历史光伏发电功率数据,历史气象数据输入到气象特征选取模块,进行相关性分析,以提取对光伏发电功率影响大于设定值的气象特征,根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块,利用PCA,即气象因素主成分的分析Principal Component Analysis,构造综合气象因子;
Step3、在Step2的同时,预处理完的历史光伏发电功率数据,在功率模态重构模块中利用变分模态分解VMD将光发发电功率进行分解为一系列具有特定带宽的固有模态函数Intrinsic Mode Function,即IMF,并通过计算每个IMF的近似熵AE,将所有IMF重构为高频分量和低频分量,高频分量反映了功率的波动特征,低频分量反映了功率的变化趋势;
Step4、在门控循环神经网络Gated Recurrent Unit Neural Network,即GRU中加入注意力机制Attention Mechanism,即Att,构建AttGRU预测模型,AttGRU预测模型由AttGRU1和AttGRU2构成,STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史高频功率分量输入AttGRU1,对未来时间点的高频功率分量做出预测;STEP2中得到的历史综合气象因子和STEP3中功率模态重构模块得到的历史低频功率分量输入AttGRU2,对未来时间点的低频功率分量做出预测;然后对两种频率模态下的预测结果进行叠加重构,得到最终预测结果。
2.根据权利要求1所述的综合气象因子数据的多数据融合光伏功率预测算法,其特征在于,所述的Step1的数据预处理的具体过程为:
Step1.1、对于采集到的光伏电站输出功率及天气特征数据中的缺失值,采用前后5分钟记录均值进行填补,对于其中的异常值,采用孤立森林算法Isolation Forest,即IF按照STEP1.2的后续步骤进行检测并剔除;
Step1.2、IF对数据样本不断分割直至每个样本空间只包含一种数据点,分割过程如下:
Step1.2.1、对于数据集X,使用一棵具有N个节点的二叉树T进行描述,每一节点Nijr或Nijl的数据为X的子集,其中的i表示树的层数,j表示上一层中第j个节点,r和l用于区分同层的右节点和左节点;
Step1.2.2、对于某层所包含的数据集Xij,随机选择样本属性q及其值域的空间取值p来划分X(i+1)j*l与X(i+1)j*r,对应节点集N(i+1)j*l与N(i+1)j*r,小于或等于p的数据划分到N(i+1)j*l节点,其他划分到N(i+1)j*r节点,其中j*表示第i+1层第j*个节点;
Step1.2.3、当遇到下面情况时得到完整的二叉树,划分结束:
A.数据树的深度达到设定的最大值;
B.节点Nij只包含一个数据点或所包含的数据点相同。
3.根据权利要求2所述的综合气象因子数据的多数据融合光伏功率预测算法,其特征在于,所述的Step2的具体过程为:
Step2.1、不同的气象特征对发电功率的影响程度不同,利用皮尔逊相关系数PearsonCorrelation Coefficient,即PCC对气象特征进行相关性分析,计算各气象特征与光伏发电功率间的相关系数,公式(1)为PCC计算方法:
公式(1)中xi表示气象特征,P表示光伏发电功率,Cov(xi,P)为xi和P的协方差,Ver[xi]和Ver[P]分别为xi和P的方差;
Step2.2、根据相关性分析结果剔除相关系数低于设定值或呈现负相关的无效气象特征,保留余下的气象特征输入到气象数据融合模块;
Step2.3、在气象数据融合模块内,PCA对图1特征选取模块输出的多维气象特征进行降维,得到多个成分及对应贡献率,将每个成分按照其贡献率加权求和得到综合气象因子,具体过程如下:
Step2.3.1、将具有m个气象特征的n个样本的数据创建为一个m×n维矩阵X;
Step2.3.2、随后将对X中数据进行标准化处理,并计算协方差矩阵R;
Step2.3.3、通过求解特征方程|λI-R|=0计算特征值和特征向量,其中I是单位矩阵,λ是特征值,各成分根据各自的特征向量按特征值的顺序排列,具有最高特征值的成分称为第一主成分,其次是第二主成分,以此类推;
Step2.3.4、通过公式(2)、(3)计算主成分贡献率ηi和累计贡献率pk,选取的成分对应于累积贡献率达到95%的前n个特征值;
Step2.3.5、根据公式(4)计算各成分值zi:
zi=ai1x1+ai2x2+…+aijxj+…+aipxp (4)
式中aij是特征向量矩阵中的元素;
Step2.3.6、使用公式(5)将选取的各成分按照其对应的贡献率加权求得综合气象因子:
F=η1z1+η2z2+…+ηizi+…+ηmzm (5)
公式(5)中:zi为成分,ηi为zi对应贡献率。
4.根据权利要求3所述的综合气象因子数据的多数据融合光伏功率预测算法,其特征在于,所述的Step3中得到高频分量和低频分量的具体过程为:
Step3.2、利用解调信号的H1高斯平滑性,得到各模态的估计带宽,假设分解模态数为K,公式(6)为约束变分模型的表达式:
公式(6)中P(t)为待分解的时间序列,uk是第k个模态,模态集表示为{uk}={u1,u2,...,un};wk是uk的第k个中心频率,*代表卷积运算,δ(t)为单位脉冲函数;
Step3.3、根据公式(7)引入二次平衡参数α和拉格朗日乘子λ,将约束变分问题转换为一个无约束变分问题;
Step3.4、利用公式(8)、(9)令(uk,wk)不断迭代更新,直至获得最优模态;
Step3.5、当满足以下收敛准则时,完成迭代;
Step3.6、利用AE衡量每个IMF的复杂程度,按计算得到的AE值对IMF进行重构,将VMD分解得到的多个IMF重新组合为高频分量和低频分量,具体过程如下:
Step3.6.1、预先设置参数m和r,其中m代表嵌入维数,r代表相似容限;
Step3.6.2、重建m维向量{X(i),X(2),...,X(n-m+1)},X(i)={u(i),u(i+1),...,u(i+m-1)};
Step3.6.3、对于1≤i≤n-m+1以及给定的r值,计算下式;
k=number{d[X,X*]<r} (12)
公式(11)中,u(a)和u*(a)分别为向量X和X*的元素;d表示向量X和X*之间的距离,由相应元素的最大差值决定;公式(12)中,k是d[X,X*]比给定r值小的个数;
Step3.6.4、定义Φm(r)函数;
Step3.6.5、按公式(15)计算分解得到的每个IMF的近似熵AE值;
AE=Φm(r)-Φm+1(r) (15)
公式(15)中参数m设置为2,r设置为0.15SD,SD表示时间序列的标准差;Step3.6.6、将IMF按对应AE值重新组合成高频分量和低频分量。
5.根据权利要求4中所述的综合气象因子数据的多数据融合光伏功率预测算法,其特征在于,所述的Step4中AttGRU模型内部结构计算方法如下:
Step4.1、AttGRU由GRU神经网络与注意力机制结合而成,其中GRU利用其内部的两个门结构处理输入信息,计算公式如下:
rt=σ(Wr·[ht-1,xt]) (16)
zt=σ(Wz·[ht-1,xt]) (17)
gt=φ(Wg·[rt×ht-1,xt]) (18)
ht=(I-zt)×ht-1+zt×gt (19)
yt=σ(Wo·ht) (20)
式(16)-(20)中,xt表示输入向量,ht-1和ht分别表示以前时间和当前时间的状态记忆变量;zt和rt分别表示更新门和复位门的状态;ht表示当前候选集的状态,yt表示当前时刻的输出向量的权重参数;Wr、Wz、Wg、Wo表示复位门、更新门、候选集、输出向量分别乘以xt和ht-1组成的连接矩阵;×和·符号表示矩阵叉乘和点乘,I表示单位矩阵;σ为simgoid激活函数;φ表示tanh激活函数;
Step4.2、注意机制根据观察输入信息选择性地获取影响输出结果的某些重要部分,赋予重要特征相对较高的权重,不重要特征赋予较低的权重,计算公式如下:
βt=qtanh(ωht+b) (21)
式(21)中ht为t时刻输入值,βt为ht对应的注意力概率,由神经网络隐藏层输出得到;q和ω为权重系数,b为偏置系数;式(22)中at由βt通过softmax函数变换得到,at越大关注程度越高;式(23)中A是根据注意力机制通过权值分配后得到的新特征向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211221139.XA CN115994605A (zh) | 2022-10-08 | 2022-10-08 | 综合气象因子数据的多数据融合光伏功率预测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211221139.XA CN115994605A (zh) | 2022-10-08 | 2022-10-08 | 综合气象因子数据的多数据融合光伏功率预测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115994605A true CN115994605A (zh) | 2023-04-21 |
Family
ID=85990952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211221139.XA Pending CN115994605A (zh) | 2022-10-08 | 2022-10-08 | 综合气象因子数据的多数据融合光伏功率预测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115994605A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117293826A (zh) * | 2023-11-27 | 2023-12-26 | 山东大学 | 一种分布式光伏缺失功率实时预测方法、系统、介质及设备 |
-
2022
- 2022-10-08 CN CN202211221139.XA patent/CN115994605A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117293826A (zh) * | 2023-11-27 | 2023-12-26 | 山东大学 | 一种分布式光伏缺失功率实时预测方法、系统、介质及设备 |
CN117293826B (zh) * | 2023-11-27 | 2024-04-05 | 山东大学 | 一种分布式光伏缺失功率实时预测方法、系统、介质及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Wind speed forecasting using deep neural network with feature selection | |
CN109271975B (zh) | 一种基于大数据多特征提取协同分类的电能质量扰动识别方法 | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN112016734B (zh) | 基于lstm栈式自编码多模型荷预测方法及系统 | |
Bhardwaj et al. | Estimation of solar radiation using a combination of Hidden Markov Model and generalized Fuzzy model | |
CN109034191B (zh) | 基于elm的单维遥测数据异常判读方法 | |
CN109546659B (zh) | 基于随机矩阵和智能场景匹配的配电网无功优化方法 | |
Li et al. | A new flood forecasting model based on SVM and boosting learning algorithms | |
CN114219147A (zh) | 一种基于联邦学习的配电站故障预测方法 | |
CN111160626B (zh) | 一种基于分解融合的电力负荷时间序列控制方法 | |
CN112884089A (zh) | 一种基于数据挖掘的电力变压器故障预警系统 | |
CN115688579A (zh) | 一种基于生成对抗网络的流域多点水位预测预警方法 | |
CN111832825A (zh) | 融合长短期记忆网络和极限学习机的风电预测方法及系统 | |
CN114755745A (zh) | 基于多通道深度残差收缩网络的冰雹天气识别与分类方法 | |
CN115994605A (zh) | 综合气象因子数据的多数据融合光伏功率预测算法 | |
CN114692947A (zh) | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 | |
CN115759461A (zh) | 一种面向物联网的多元时间序列预测方法及系统 | |
CN115409369A (zh) | 基于机理和数据混合驱动的综合能源系统可靠性评估方法 | |
CN114117852B (zh) | 一种基于有限差分工作域划分的区域热负荷滚动预测方法 | |
CN113850320A (zh) | 基于改进支持向量机回归算法的变压器故障检测方法 | |
CN115935244B (zh) | 一种基于数据驱动的单相整流器故障诊断方法 | |
CN116937579A (zh) | 一种考虑时空相关性的风电功率区间预测及其可解释方法 | |
CN111008584B (zh) | 一种模糊自组织神经网络的电能质量量测缺失修复方法 | |
CN114137915A (zh) | 一种工业设备的故障诊断方法 | |
Xia et al. | Research on Solar Radiation Estimation based on Singular Spectrum Analysis-Deep Belief Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |