CN112381282B - 基于宽度学习系统的光伏发电功率预测方法 - Google Patents

基于宽度学习系统的光伏发电功率预测方法 Download PDF

Info

Publication number
CN112381282B
CN112381282B CN202011237371.3A CN202011237371A CN112381282B CN 112381282 B CN112381282 B CN 112381282B CN 202011237371 A CN202011237371 A CN 202011237371A CN 112381282 B CN112381282 B CN 112381282B
Authority
CN
China
Prior art keywords
prediction
power generation
photovoltaic power
learning system
quantile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011237371.3A
Other languages
English (en)
Other versions
CN112381282A (zh
Inventor
徐潇源
严正
周楠
杨博
朱彦名
顾崇寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202011237371.3A priority Critical patent/CN112381282B/zh
Publication of CN112381282A publication Critical patent/CN112381282A/zh
Application granted granted Critical
Publication of CN112381282B publication Critical patent/CN112381282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Water Supply & Treatment (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)

Abstract

一种基于宽度学习系统的光伏发电功率预测方法,通过光伏系统历史出力数据和气象数据构建光伏发电预测数据集,利用BLS对光伏发电功率进行点预测以确定BLS网络结构参数;再通过Adam优化算法以及光伏发电预测数据集经训练得到不同比例分位数的BLS输出权重,最后经过结果评估实现光伏发电功率预测。本发明采用拟合性能较好且计算效率较高宽度学习系统作为预测模型,基于分位数回归和Adam优化算法对光伏发电功率的分位数进行预测,从而能够充分反映光伏出力的不确定性。

Description

基于宽度学习系统的光伏发电功率预测方法
技术领域
本发明涉及的是一种光伏发电控制领域的技术,具体是一种基于Adam优化算法和宽度学习系统(BLS)的光伏发电功率概率预测方法。
背景技术
为了应对能源危机和气候变化,近年来以光伏为代表的可再生能源发电迅速发展。但是,光伏发电功率具有较强的随机性和波动性,大量光伏的接入给电网的安全稳定运行带来了不利影响。现有光伏出力预测的研究工作大多是点预测方法,即只能给出光伏在未来时刻发电功率的具体值,没有对预测结果的可靠性及不确定性进行评估。由于光伏出力与随机性较强的气象因素关联紧密,因此很难做到高精度的光伏发电功率点预测,故确定性预测方法所提供的预测信息具有较大的局限性。
发明内容
本发明针对现有技术存在的上述不足,提出一种基于宽度学习系统的光伏发电功率预测方法,采用拟合性能较好且计算效率较高宽度学习系统作为预测模型,基于分位数回归和Adam优化算法对光伏发电功率的分位数进行预测,从而能够充分反映光伏出力的不确定性。
本发明是通过以下技术方案实现的:
本发明涉及一种基于宽度学习系统的光伏发电功率预测方法,通过光伏系统历史出力数据和气象数据构建光伏发电预测数据集,利用宽度学习系统(broadlearningsystem,BLS)对光伏发电功率进行点预测以确定BLS网络结构参数;再通过Adam优化算法以及光伏发电预测数据集经训练得到不同比例分位数的BLS输出权重,最后经过结果评估实现光伏发电功率预测。
所述的光伏发电预测数据集,通过从光伏系统历史出力数据、相邻时刻光伏站点的本地测量气象数据作为输入因素,具体为:对于每个时刻t,将邻近Nlag个时刻的历史出力、上一个时间点的历史气象数据作为输入因素向量x(t),即:
x(t)=[T(t-τ),v(t-τ),IGH(t-τ),IDH(t-τ),IDN(t-τ),y(t-τ),y(t-2τ),…,y(t-Nlagτ)]T,其中:T为气温,v为风速,IGH,IDH和IDN分别为水平面总辐射强度GHI、水平面散射辐射强度DHI和法向直射辐射强度DNI的实测值,y为光伏发电功率,Nlag通过交叉验证法确定。
所述的宽度学习系统为:Y=[F1,F2,...,Fm,E]W=[F,E]W,其中:W为从特征节点和增强节点连接到输出层的权重;Y为整个神经网络的输出,将BLS的包括特征节点和增强节点的中间层对应的矩阵记作M=[F,E]。
所述的BLS网络结构,包括结构参数和输出权重,其中:结构参数包括m组特征映射和n个增强节点,其中:每组特征映射包含k个特征节点,第i组特征映射为:
Fi=φ(XWfifi),i=1,2,...,m,其中:神经网络的权重矩阵Wfi和偏置项βfi均是随机生成的,各元素的取值范围为[-1,1];映射函数φ由前述基于LASSO的特征提取间接给出,特征映射的组合记作矩阵F=[F1,F2,…,Fm];m×k个特征节点根据E=ζ(FWee)生成增强节点,其中:权重矩阵We和偏置βe随机生成的,各元素的取值范围为[-1,1];ζ为激活函数;由于随机生成的权重(Wfi,We)和偏置(βfie)不再改变,宽度学习系统的训练相当于得到线性系统Y=MW的最小二乘解,其中输出权重
Figure GDA0002855375780000021
为矩阵M的穆尔-彭罗斯广义逆(Moore-Penrose Generalized Inverse)矩阵,即伪逆(pseudoinverse)矩阵。
所述的激活函数优选双曲正切函数,其表达式为:
Figure GDA0002855375780000022
所述的特征提取,采用稀疏特征学习进行特征提取,其得到目标为:
Figure GDA0002855375780000023
其中:X为要进行特征提取的数据;
Figure GDA0002855375780000024
为特征选择的系数矩阵;Z是随机生成的特征矩阵。式中第一项用于得到线性方程
Figure GDA0002855375780000025
的最小二乘估计;第二项为l1范数,用于对
Figure GDA0002855375780000026
施加稀疏性限制;λ为正则化参数,用于控制两项之间的相对大小。该优化问题又被称为最小绝对收缩和选择算子(least absolute shrinkage andselection operator,LASSO),可以利用交替方向乘子法(alternating direction methodof multipliers,ADMM)进行得到;进一步通过引入辅助变量,将目标等价表示为:
Figure GDA0002855375780000027
其中:
Figure GDA0002855375780000028
g(V)=λ||V||1,该优化问题的增广拉格朗日函数为:
Figure GDA0002855375780000029
基于ADMM算法交替更新
Figure GDA00028553757800000210
V和Λ的值来得到上式,具体为:
Figure GDA00028553757800000211
Figure GDA00028553757800000212
其中:软阈值函数
Figure GDA00028553757800000213
所述的点预测是指:以点预测模型为概率预测基础,对数据集进行特征提取后作为随机向量函数连接神经网络(random vector functional-link neural network,RVFLN)的输入,根据选取的输入因素生成BLS的输入层矩阵Xtest,利用训练过程中随机生成的权重(Wfi,We)和偏置(βfie),计算得到相应的中间层矩阵Mtest;光伏发电功率点预测的结果即为:
Figure GDA0002855375780000031
优选地,将点预测结果与光伏实际出力值进行对比并计算误差,当误差不满足要求则对特征映射数目m,每组映射的特征节点数目k,增强节点数目n进行调整,直到误差小于所需精度为止,从而确定BLS网络的结构参数。
将t时刻的光伏发电功率记作yt,相应时刻预测模型的输入因素记作向量xt。当yt作为要预测的出力值时,由于光伏发电功率点预测的结果必然会存在误差,因此对于yt的估值存在着不确定性。将yt视为随机变量,并将其概率密度函数和累积分布函数分别记作ft和Ft,则yt的第τ分位数(记作
Figure GDA0002855375780000032
)定义为:
Figure GDA0002855375780000033
其中:τ的取值范围为[0,1]。根据累积分布函数的定义,上式也可以等价地表示为:
Figure GDA0002855375780000034
其中:
Figure GDA0002855375780000035
为t时刻对未来t+k时刻第τ分位数的预测结果,光伏出力在t+k时刻的累积分布函数Ft+k|t可以通过一系列的分位数进行估计,从而得到非参数的概率分布预测结果:
Figure GDA0002855375780000036
所述的第τ分位数通过最小化一个非对称加权的损失函数得到:
Figure GDA0002855375780000037
N为构建分位数回归模型时所采用数据集的样本数目,ρτ(·)称为检验函数;对于条件分位数,即输入因素为xt的条件下预测模型输出的分位数,将自变量向量记作xt,回归模型的参数为β,则对应的分位数为
Figure GDA0002855375780000038
设相应的宽度学习系统的输出权重为Wτ,则BLS给出的条件分位数为:
Figure GDA0002855375780000039
对于自变量向量xt,通过对应的特征节点和增强节点得到BLS的中间层矩阵Mt:当BLS中间层含有nM=mk+n个节点,则Mt是一个1×nM的向量,Wτ为nM×1的向量,是条件分位数回归模型的待求解参数,则对应的分位数回归需要最小化的损失函数
Figure GDA00028553757800000310
所述的检验函数
Figure GDA00028553757800000311
所述的Adam优化算法,以点预测模型中BLS的输出权重W为初值,具体为:用M(i,j)表示矩阵M中第i行第j列的元素,则对于基于BLS的分位数回归问题,损失函数的梯度为:
Figure GDA0002855375780000041
其中:对向量Wτ中任意一个元素Wτ(j,1)(j=1,2,…,nM)求梯度的具体表达式为:
Figure GDA0002855375780000042
。利用BLS点预测模型中训练得到的输出权重W对Wτ进行初始化,即:
Figure GDA0002855375780000043
设循环变量为i并初始化为0,则第i个循环中,令i←i+1,之后计算损失函数的梯度:
Figure GDA0002855375780000044
令m(i)为当前梯度的一阶矩估计(即带权平均),v(i)为当前梯度的二阶矩估计(即带权有偏方差)。由于m(i)和v(i)的初始值是零向量,因此在刚开始迭代或衰减率较小时会偏向零向量,故需要对两者进行校正,校正后的梯度带权平均和梯度带权有偏方差记作
Figure GDA0002855375780000045
Figure GDA0002855375780000046
在第i个循环中,一阶矩估计和二阶矩估计按照下式更新:
Figure GDA0002855375780000047
其中:一阶矩估计的指数衰减速率β1为0.9,二阶矩估计的指数衰减速率β2为0.999。进而可得优化变量Wτ的更新量:
Figure GDA0002855375780000048
其中:学习率α为0.001,常数ε为10-8。进而可对Wτ进行更新:
Figure GDA0002855375780000049
所述的Adam优化算法的收敛的条件为:
Figure GDA00028553757800000410
其中:εL取值为10-3
所述的不同比例分位数的BLS输出权重是指:根据点预测得到的BLS中间层矩阵Mtest和Adam算法的优化结果Wτ,可得到对光伏发电功率第τ分位数预测的结果:
Figure GDA00028553757800000411
所述的结果评估包括:可靠性评估、敏锐性评估和综合评估。
所述的可靠性评估,采用可靠性(reliability)和敏锐性(sharpness)两方面的评估指标。
可靠性是指概率预测结果和预测对象实际概率分布间的相似程度。对于基于分位数回归的概率预测而言,应该检验分位数的预测值是否符合其定义。根据分位数的定义可知,利用测试集上的预测结果统计出预测分位数的比例为:
Figure GDA0002855375780000051
其中:Nt为测试数据的总数;
Figure GDA0002855375780000052
为一指示变量,用于记录第t个预测结果和实际出力之间的关系:
Figure GDA0002855375780000053
当概率预测的可靠性较高时,上式所计算得到的比例也应接近分位数的真实比例τi,故定义绝对偏差(absolute deviation,简记为Dev)来表示两者间的差值:
Figure GDA0002855375780000054
Dev的值越接近于0表示预测的可靠性越高。
此外,为了更加直观地展现预测结果的可靠性,可以绘制
Figure GDA0002855375780000055
和τi之间的关系曲线,称为可靠性图(reliability diagram)。在理想情况下
Figure GDA0002855375780000056
相应的曲线为过原点且斜率为1的直线,故预测结果的可靠性曲线越接近该直线,表明预测结果越可靠。
所述的敏锐性评估是指:对于置信度为(1-γ)的预测区间,其上界和下界分别为第(1-γ/2)和第γ/2分位数,则通过预测区间的宽度对分位数预测的敏锐性进行检验,即区间的上界与下界之差:
Figure GDA0002855375780000057
预测区间的平均宽度为:
Figure GDA0002855375780000058
预测结果的平均区间宽度越小,表明不确定信息较为集中,即概率预测的敏锐性越好。
所述的综合评估是指:采用技能得分(skillscore)对预测模型的可靠性和敏锐性进行综合评估
Figure GDA0002855375780000059
对于Nt个样本的测试集的技能得分的平均值
Figure GDA00028553757800000510
技能得分的值越小,表明预测结果的综合性能越好。
本发明涉及一种实现上述方法的系统,包括:数据预处理单元、点预测单元、概率预测单元和预测结果评估单元,其中:数据预处理单元与点预测单元及概率预测相连,传输预处理并格式化后的数据集;点预测单元与概率预测单元相连,传输宽度学习系统的结构参数和点预测模型输出权重;概率预测单元与预测结果评估单元相连,传输待预测时刻的概率预测结果;预测结果评估单元根据概率预测结果计算相关评估指标、对光伏发电功率的预测区间进行可视化。
技术效果
与现有技术相比,本发明利用光伏发电功率概率预测方法对未来时刻光伏发电功率的不确定性进行刻画;可在较短的计算耗时内得到多个不同比例的分位数,从而对光伏发电功率的概率分布进行高可靠性的预测。
附图说明
图1为本发明宽度学习系统网络结构示意图;
图2为本发明光伏发电功率点预测方法流程图;
图3为本发明光伏发电功率概率预测方法流程图。
图4为实施例光伏实际出力曲线及概率预测结果(8月3日)示意图;
图5为实施例光伏实际出力曲线及概率预测结果(8月15日)示意图;
图6为实施例各方法光伏发电功率概率预测结果的可靠性示意图;
图7为实施例各方法光伏发电功率概率预测结果的平均区间宽度示意图;
图8为实施例中RVFLNN与BLS的网络结构对比图。
具体实施方式
如图3所示,为本实施例涉及一种基于Adam优化算法和宽度学习系统的光伏发电功率概率预测方法,包括如下步骤:
步骤1)获取光伏系统历史出力数据和气象数据,并选取合适的输入因素,构建光伏发电预测数据集,具体包括:
1.1收集历史出力数据
在较短的时间间隔内,光伏发电功率的波动通常较小,因此光伏的历史出力和当前时刻出力之间具有较强的相关性,一般选取作为光伏发电功率超短期预测的输入因素。
1.2收集气象数据
同时,光伏发电功率又直接受到太阳辐照度等气象因素的影响。由于数值天气预报的时间间隔较长且存在一定的滞后,故针对超短期预测的应用场景,选取相邻时刻光伏站点的本地测量气象数据作为输入因素。
1.3输入因素选取
对于每个时刻t,将邻近Nlag个时刻的历史出力、上一个时间点的历史气象数据(包括温度、风速、水平面总辐射强度GHI、水平面散射辐射强度DHI和法向直射辐射强度DNI)作为输入因素向量x(t),即:
Figure GDA0002855375780000061
其中:T为气温;v为风速;IGH,IDH和IDN分别为GHI、DHI和DNI的实测值;y为光伏发电功率;Nlag通过交叉验证法确定。
步骤2)利用BLS对光伏发电功率循环进行点预测,直至网络结构参数的对应点预测结果与光伏实际出力值的误差符合要求,从而确定最优的BLS网络结构参数,并基于该参数得到输出权重,具体包括:
2.1计算特征节点
宽度学习系统本质上是对数据集进行特征提取后作为随机向量函数连接神经网络(random vector functional-link neural network,RVFLN)的输入。本方法采用稀疏特征学习进行特征提取,其得到目标为:
Figure GDA0002855375780000071
其中:X为要进行特征提取的数据;
Figure GDA0002855375780000072
为特征选择的系数矩阵;Z是随机生成的特征矩阵。式中第一项用于得到线性方程
Figure GDA0002855375780000073
的最小二乘估计;第二项为l1范数,用于对
Figure GDA0002855375780000074
施加稀疏性限制;λ为正则化参数,用于控制两项之间的相对大小。该优化问题又被称为最小绝对收缩和选择算子(leastabsolute shrinkage and selection operator,LASSO),可以利用交替方向乘子法(alternating direction method of multipliers,ADMM)进行得到。
通过引入辅助变量,可将上式等价表示为:
Figure GDA0002855375780000075
其中:
Figure GDA0002855375780000076
g(V)=λ||V||1。该优化问题的增广拉格朗日函数为:
Figure GDA0002855375780000077
基于ADMM算法,可以交替更新
Figure GDA0002855375780000078
V和Λ的值来得到上式,迭代过程如下:
Figure GDA0002855375780000079
其中:S为软阈值函数,其表达式为:
Figure GDA00028553757800000710
设用于光伏发电功率点预测的BLS包括m组特征映射(每组包含k个特征节点),则第i组特征映射为:Fi=φ(XWfifi),i=1,2,...,m,其中:神经网络的权重矩阵Wfi和偏置项βfi均是随机生成的,各元素的取值范围为[-1,1];映射函数φ由前述基于LASSO的特征提取间接给出。
2.2计算增强节点
设用于光伏发电功率点预测的BLS包括n个增强节点,将2.1中形成的特征映射的组合记作矩阵F=[F1,F2,…,Fm],这m×k个特征节点根据下式生成BLS的增强节点:E=ζ(FWee),其中:权重矩阵We和偏置βe也是随机生成的,各元素的取值范围为[-1,1];ζ为激活函数,这里选取双曲正切函数,其表达式为:
Figure GDA0002855375780000081
2.3训练网络输出层的权重
由输入数据计算得到特征节点和增强节点后,宽度学习系统的数学模型可表示为:Y=[F1,F2,...,Fm,E]W=[F,E]W,其中:W表示从特征节点和增强节点连接到输出层的权重;Y是整个神经网络的输出。为了简化表达式,将BLS中间层(包括特征节点和增强节点)对应的矩阵记作M=[F,E]。
在训练过程中,随机生成的权重(Wfi,We)和偏置(βfie)不再改变,因此只需要得到输出权重W即可,故宽度学习系统的训练相当于得到线性系统Y=MW的最小二乘解:
Figure GDA0002855375780000082
其中:
Figure GDA0002855375780000083
为矩阵M的穆尔-彭罗斯广义逆(Moore-PenroseGeneralized Inverse)矩阵,即伪逆(pseudoinverse)矩阵。
2.4对光伏发电功率进行点预测
对于待预测时刻,根据选取的输入因素生成BLS的输入层矩阵Xtest,利用训练过程中随机生成的权重(Wfi,We)和偏置(βfie),计算得到相应的中间层矩阵Mtest。光伏发电功率点预测的结果即为:
Figure GDA0002855375780000084
步骤3)以点预测模型中BLS的输出权重为初值,通过Adam优化算法得到不同比例分位数的BLS输出权重,,具体包括:
3.1推导损失函数
将t时刻的光伏发电功率记作yt,相应时刻预测模型的输入因素记作向量xt。当yt作为要预测的出力值时,由于点预测的结果必然会存在误差,因此对于yt的估值存在着不确定性。将yt视为随机变量,并将其概率密度函数和累积分布函数分别记作ft和Ft,则yt的第τ分位数(记作
Figure GDA0002855375780000085
)定义为:
Figure GDA0002855375780000086
其中:τ的取值范围为[0,1]。根据累积分布函数的定义,上式也可以等价地表示为:
Figure GDA0002855375780000087
Figure GDA0002855375780000088
表示在t时刻对未来t+k时刻第τ分位数的预测结果,由上式可知,光伏出力在t+k时刻的累积分布函数Ft+k|t可以通过一系列的分位数进行估计,从而得到非参数的概率分布预测结果:
Figure GDA0002855375780000089
分位数回归是常用的得到分位数的方法,其核心思想是根据因变量的条件分位数对自变量进行回归。第τ分位数可以通过最小化一个非对称加权的损失函数求取,该函数由下式给出:
Figure GDA0002855375780000091
其中:N是构建分位数回归模型时所采用数据集的样本数目,ρτ(·)称为检验函数,其表达式为:
Figure GDA0002855375780000092
对于条件分位数,将自变量向量记作xt,回归模型的参数为β,则对应的分位数可表达为
Figure GDA0002855375780000093
设相应的宽度学习系统的输出权重为Wτ,则BLS给出的条件分位数为:
Figure GDA0002855375780000094
对于自变量向量xt,通过步骤(2)得到对应的特征节点和增强节点,进而可得到BLS的中间层矩阵Mt。设BLS中间层(包括特征节点和增强节点)含有nM=mk+n个节点,则Mt是一个1×nM的向量。Wτ为nM×1的向量,是条件分位数回归模型的待求解参数。此时,分位数回归需要最小化的损失函数可表示为:
Figure GDA0002855375780000095
3.2Adam优化算法
Adam(adaptive moment estimation,自适应矩估计)优化算法是一种在随机梯度下降算法基础上进行改进的算法,其根据损失函数对各参数梯度的一阶矩和二阶矩估计,动态地调整相应的学习率,因此每次迭代时参数的学习步长都有一个确定的范围,参数的更新较为平稳。
用M(i,j)表示矩阵M中第i行第j列的元素,则对于基于BLS的分位数回归问题,损失函数的梯度为:
Figure GDA0002855375780000096
其中:对向量Wτ中任意一个元素Wτ(j,1)(j=1,2,…,nM)求梯度的具体表达式如下:
Figure GDA0002855375780000101
利用BLS点预测模型中训练得到的输出权重W对Wτ进行初始化,即:
Figure GDA0002855375780000102
设循环变量为i并初始化为0,则第i个循环中,令i←i+1,之后计算损失函数的梯度:
Figure GDA0002855375780000103
令m(i)为当前梯度的一阶矩估计(即带权平均),v(i)为当前梯度的二阶矩估计(即带权有偏方差)。由于m(i)和v(i)的初始值是零向量,因此在刚开始迭代或衰减率较小时会偏向零向量,故需要对两者进行校正,校正后的梯度带权平均和梯度带权有偏方差记作
Figure GDA0002855375780000104
Figure GDA0002855375780000105
在第i个循环中,一阶矩估计和二阶矩估计按照下式更新:
Figure GDA0002855375780000106
其中:一阶矩估计的指数衰减速率β1为0.9,二阶矩估计的指数衰减速率β2为0.999。进而可得优化变量Wτ的更新量:
Figure GDA0002855375780000107
其中:学习率α为0.001,常数ε为10-8。进而可对Wτ进行更新:
Figure GDA0002855375780000108
Adam优化算法判断收敛的条件为:
Figure GDA0002855375780000109
其中:εL取值为10-3
3.3对光伏发电功率进行概率预测
对于待预测时刻,根据点预测得到的BLS中间层矩阵Mtest和Adam算法的优化结果Wτ,可得到对光伏发电功率第τ分位数预测的结果:
Figure GDA00028553757800001010
若要得到多个分位数,只需修改Adam算法中各表达式中分位数比例τ的值即可。
步骤4)对预测结果进行评估,具体包括:
4.1可靠性评估
与点预测不同,概率预测的结果不能用传统的统计量(如均方根误差等)进行分析。为了对概率预测模型所给出的分位数进行全面的评估,需要采用可靠性(reliability)和敏锐性(sharpness)两方面的评估指标。
可靠性是指概率预测结果和预测对象实际概率分布间的相似程度。对于基于分位数回归的概率预测而言,应该检验分位数的预测值是否符合其定义。根据分位数的定义可知,利用测试集上的预测结果统计出预测分位数的比例为:
Figure GDA0002855375780000111
其中:Nt为测试数据的总数;
Figure GDA0002855375780000112
为一指示变量,用于记录第t个预测结果和实际出力之间的关系:
Figure GDA0002855375780000113
当概率预测的可靠性较高时,上式所计算得到的比例也应接近分位数的真实比例τi,故定义绝对偏差(absolute deviation,简记为Dev)来表示两者间的差值:
Figure GDA0002855375780000114
Dev的值越接近于0表示预测的可靠性越高。
此外,为了更加直观地展现预测结果的可靠性,可以绘制
Figure GDA0002855375780000115
和τi之间的关系曲线,称为可靠性图(reliability diagram)。在理想情况下
Figure GDA0002855375780000116
相应的曲线为过原点且斜率为1的直线,故预测结果的可靠性曲线越接近该直线,表明预测结果越可靠。
4.2敏锐性评估
敏锐性是指预测结果所包含信息的集中度。以区间预测为例,显然可以通过保守的预测,给出宽度很大的预测区间,使得待预测时刻的出力值大概率落在这个区间内。但是这样的预测结果是没有意义的,所包含的不确定性信息极为有限,因此需要借助敏锐性指标,确保概率预测模型给出有价值的预测结果。
一旦得到了分位数的预测结果,自然可以导出不同置信度水平下的预测区间。对于置信度为(1-γ)的预测区间,假设其上下界所对应的分位数比例分别为
Figure GDA0002855375780000117
τ,即:
Figure GDA0002855375780000118
其中:γ∈[0,1]。该预测区间的物理意义是,t+k时刻光伏出力的实际值yt+k有(1-γ)的概率落在区间
Figure GDA0002855375780000119
内。根据分位数的定义,可知
Figure GDA00028553757800001110
τ满足:
Figure GDA00028553757800001111
一般将预测区间设定为关于概率密度函数中心对称,因此
Figure GDA00028553757800001112
τ满足:
Figure GDA00028553757800001113
联立以上两式可解得:
Figure GDA0002855375780000121
因此对于置信度为(1-γ)的预测区间,其上界和下界分别为第(1-γ/2)和第γ/2分位数。进而可以利用预测区间的宽度对分位数预测的敏锐性进行检验,即区间的上界与下界之差:
Figure GDA0002855375780000122
预测区间的平均宽度为:
Figure GDA0002855375780000123
预测结果的平均区间宽度越小,表明不确定信息较为集中,即概率预测的敏锐性越好。
4.3综合评估
对于分位数形式的预测结果,还可以采用技能得分(skillscore)对预测模型的可靠性和敏锐性进行综合评估,其定义为:
Figure GDA0002855375780000124
技能得分同时考虑了分位数预测结果的指示变量以及分位数和真实值间的距离,从而间接地对可靠性和敏锐性同时进行了考察。对于Nt个样本的测试集,应当计算它们技能得分的平均值
Figure GDA0002855375780000125
技能得分的值越小,表明预测结果的综合性能越好。
如图4~图7所示,本实施例以美国俄勒冈州阿什兰(Ashland)的一处光伏电站为例进行说明,该电站的具体信息如表1所示,各输入因素和光伏发电功率的相关系数如表2所示,其中输入因素的历史发电功率点数采用5折交叉验证确定。对于数据集中的异常值和缺失值,利用该采样点前3个时刻的平均值替代。考虑到光伏出力的间歇性,截取白天时段后保留5:20至19:15的数据,即每日有168个数据点。进行预测前,对预测模型输入因素和输出变量均进行归一化处理。
表1实施例数据的具体信息
Figure GDA0002855375780000126
Figure GDA0002855375780000131
表2各输入因素和输出值(当前时刻光伏出力)的相关系数
Figure GDA0002855375780000132
为了对光伏发电功率的概率分布进行细致的描述,对从0.05到0.95、以0.05为步长的分位数进行预测。为直观地展示本方法的预测性能,采用预测区间的形式绘制概率预测的结果。由于置信度为(1-γ)的预测区间,其下界和上界分别为第γ/2和第(1-γ/2)分位数,因此求取的分位数(第0.5分位数即中位数除外)可以构成置信度为90%,80%,…,10%的10个预测区间。绘制实施例的两个典型日(8月3日和8月15日)的概率预测结果,如图4和图5所示。
本发明将宽度学习系统(BLS)作为分位数回归中的回归模型,用Adam优化算法求解分位数回归问题中BLS的输出权重,利用宽度学习系统对于大规模、高维度的数据集具有较强的拟合能力,且其在宽度上拓展神经网络节点数目的结构特点使得其训练过程耗时较短结合了Adam优化算法收敛速度快、不易陷入局部最优,可以稳定、高效地求解出不同比例分位数对应的BLS输出权重。
综上,本发明在计算耗时、概率预测结果的可靠性及敏锐性上均较现有技术有所提升。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。

Claims (10)

1.一种基于宽度学习系统的光伏发电功率预测方法,其特征在于,通过光伏系统历史出力数据和气象数据构建光伏发电预测数据集,利用宽度学习系统对光伏发电功率进行点预测以确定宽度学习系统网络结构参数;再通过Adam优化算法以及光伏发电预测数据集经训练得到不同比例分位数的宽度学习系统输出权重,最后经过结果评估实现光伏发电功率预测;
所述的宽度学习系统为:Y=[F1,F2,...,Fm,E]W=[F,E]W,其中:F为特征映射的组合矩阵,E为增强节点矩阵,W为从特征节点和增强节点连接到输出层的权重;Y为整个神经网络的输出,将宽度学习系统的包括特征节点和增强节点的中间层对应的矩阵记作M=[F,E];
所述的点预测是指:以点预测模型为概率预测基础,对数据集进行特征提取后作为RVFLN的输入,根据选取的输入因素生成宽度学习系统的输入层矩阵Xtest,利用训练过程中随机生成的权重(Wfi,We)和偏置(βfie),计算得到相应的中间层矩阵Mtest;光伏发电功率点预测的结果即为:
Figure FDA0003499424940000011
2.根据权利要求1所述的光伏发电功率预测方法,其特征是,所述的光伏发电预测数据集,通过从光伏系统历史出力数据、相邻时刻光伏站点的本地测量气象数据作为输入因素,具体为:对于每个时刻t,将邻近Nlag个时刻的历史出力、上一个时间点的历史气象数据作为输入因素向量x(t),即:
x(t)=[T(t-τ),v(t-τ),IGH(t-τ),IDH(t-τ),IDN(t-τ),y(t-τ),y(t-2τ),…,y(t-Nlagτ)]T
其中:T为气温,v为风速,IGH,IDH和IDN分别为水平面总辐射强度GHI、水平面散射辐射强度DHI和法向直射辐射强度DNI的实测值,y为光伏发电功率,Nlag通过交叉验证法确定。
3.根据权利要求1所述的光伏发电功率预测方法,其特征是,所述的宽度学习系统网络结构,包括结构参数和输出权重,其中:结构参数包括m组特征映射和n个增强节点,其中:每组特征映射包含k个特征节点,第i组特征映射为:Fi=φ(XWfifi),i=1,2,...,m,其中:神经网络的权重矩阵Wfi和偏置项βfi均是随机生成的,各元素的取值范围为[-1,1];映射函数φ由基于LASSO的特征提取间接给出,特征映射的组合记作矩阵F=[F1,F2,…,Fm];m×k个特征节点根据E=ζ(FWee)生成增强节点,其中:权重矩阵We和偏置βe随机生成的,各元素的取值范围为[-1,1];ζ为激活函数;由于随机生成的权重(Wfi,We)和偏置(βfie)不再改变,宽度学习系统的训练相当于得到线性系统Y=MW的最小二乘解,其中输出权重
Figure FDA0003499424940000021
Figure FDA0003499424940000022
为矩阵M的穆尔-彭罗斯广义逆矩阵,即伪逆矩阵。
4.根据权利要求1所述的光伏发电功率预测方法,其特征是,所述的特征提取,采用稀疏特征学习进行特征提取,其得到目标为:
Figure FDA0003499424940000023
其中:X为要进行特征提取的数据;
Figure FDA0003499424940000024
为特征选择的系数矩阵;Z是随机生成的特征矩阵;式中第一项用于得到线性方程
Figure FDA0003499424940000025
的最小二乘估计;第二项为l1范数,用于对
Figure FDA0003499424940000026
施加稀疏性限制;λ为正则化参数,用于控制两项之间的相对大小;该目标即LASSO问题,利用ADMM算法进行得到;进一步通过引入辅助变量,将目标等价表示为:
Figure FDA0003499424940000027
其中:
Figure FDA0003499424940000028
g(V)=λ||V||1,该目标的增广拉格朗日函数为:
Figure FDA0003499424940000029
基于ADMM算法交替更新
Figure FDA00034994249400000210
V和Λ的值来得到上式,具体为:
Figure FDA00034994249400000211
Figure FDA00034994249400000212
其中:软阈值函数
Figure FDA00034994249400000213
5.根据权利要求1所述的光伏发电功率预测方法,其特征是,将点预测结果与光伏实际出力值进行对比并计算误差,当误差不满足要求则对特征映射数目m,每组映射的特征节点数目k,增强节点数目n进行调整,直到误差小于所需精度为止,从而确定宽度学习系统网络的结构参数;
将t时刻的光伏发电功率记作yt,相应时刻预测模型的输入因素记作向量xt;当yt作为要预测的出力值时,由于光伏发电功率点预测的结果必然会存在误差,因此对于yt的估值存在着不确定性;将yt视为随机变量,并将其概率密度函数和累积分布函数分别记作ft和Ft,则yt的第τ分位数(记作
Figure FDA00034994249400000214
)定义为:
Figure FDA00034994249400000215
其中:τ的取值范围为[0,1];根据累积分布函数的定义,上式也等价地表示为:
Figure FDA00034994249400000216
其中:
Figure FDA00034994249400000217
为t时刻对未来t+k时刻第τ分位数的预测结果,光伏出力在t+k时刻的累积分布函数Ft+k|t通过一系列的分位数进行估计,从而得到非参数的概率分布预测结果:
Figure FDA00034994249400000218
所述的第τ分位数通过最小化一个非对称加权的损失函数得到:
Figure FDA0003499424940000031
N为构建分位数回归模型时所采用数据集的样本数目,ρτ(·)称为检验函数;对于条件分位数,即输入因素为xt的条件下预测模型输出的分位数,将自变量向量记作xt,回归模型的参数为β,则对应的分位数为
Figure FDA0003499424940000032
设相应的宽度学习系统的输出权重为Wτ,则宽度学习系统给出的条件分位数为:
Figure FDA0003499424940000033
对于自变量向量xt,通过对应的特征节点和增强节点得到宽度学习系统的中间层矩阵Mt:当宽度学习系统中间层含有nM=mk+n个节点,则Mt是一个1×nM的向量,Wτ为nM×1的向量,是条件分位数回归模型的待求解参数,则对应的分位数回归需要最小化的损失函数
Figure FDA0003499424940000034
6.根据权利要求5所述的光伏发电功率预测方法,其特征是,所述的检验函数
Figure FDA0003499424940000035
7.根据权利要求1所述的光伏发电功率预测方法,其特征是,所述的Adam优化算法,以点预测模型中宽度学习系统的输出权重W为初值,具体为:用M(i,j)表示矩阵M中第i行第j列的元素,则对于基于宽度学习系统的分位数回归问题,损失函数的梯度为:
Figure FDA0003499424940000036
其中:对向量Wτ中任意一个元素Wτ(j,1)(j=1,2,…,nM)求梯度的具体表达式为:
Figure FDA0003499424940000037
利用宽度学习系统点预测模型中训练得到的输出权重W对Wτ进行初始化,即:
Figure FDA0003499424940000038
设循环变量为i并初始化为0,则第i个循环中,令i←i+1,之后计算损失函数的梯度:
Figure FDA0003499424940000041
令m(i)为当前梯度的一阶矩估计(即带权平均),v(i)为当前梯度的二阶矩估计(即带权有偏方差);由于m(i)和v(i)的初始值是零向量,因此在刚开始迭代或衰减率较小时会偏向零向量,故需要对两者进行校正,校正后的梯度带权平均和梯度带权有偏方差记作
Figure FDA0003499424940000042
Figure FDA0003499424940000043
在第i个循环中,一阶矩估计和二阶矩估计按照下式更新:
Figure FDA0003499424940000044
其中:一阶矩估计的指数衰减速率β1为0.9,二阶矩估计的指数衰减速率β2为0.999;进而可得优化变量Wτ的更新量:
Figure FDA0003499424940000045
其中:学习率α为0.001,常数ε为10-8;进而可对Wτ进行更新:
Figure FDA0003499424940000046
所述的Adam优化算法的收敛的条件为:
Figure FDA0003499424940000047
其中:εL取值为10-3
8.根据权利要求1所述的光伏发电功率预测方法,其特征是,所述的不同比例分位数的宽度学习系统输出权重是指:根据点预测得到的宽度学习系统中间层矩阵Mtest和Adam算法的优化结果Wτ,可得到对光伏发电功率第τ分位数预测的结果:
Figure FDA0003499424940000048
9.根据权利要求5所述的光伏发电功率预测方法,其特征是,所述的结果评估包括:可靠性评估、敏锐性评估和综合评估,其中:
所述的可靠性评估,采用可靠性和敏锐性的评估指标,可靠性是指概率预测结果和预测对象实际概率分布间的相似程度;对于基于分位数回归的概率预测而言,应该检验分位数的预测值是否符合其定义;根据分位数的定义可知,利用测试集上的预测结果统计出预测分位数的比例为:
Figure FDA0003499424940000049
其中:Nt为测试数据的总数;
Figure FDA00034994249400000410
为一指示变量,用于记录第t个预测结果和实际出力之间的关系:
Figure FDA00034994249400000411
当概率预测的可靠性较高时,上式所计算得到的比例也应接近分位数的真实比例τi,故定义绝对偏差来表示两者间的差值:
Figure FDA00034994249400000412
Dev的值越接近于0表示预测的可靠性越高;敏锐性评估是指:对于置信度为(1–γ)的预测区间,其上界和下界分别为第(1–γ/2)和第γ/2分位数,则通过预测区间的宽度对分位数预测的敏锐性进行检验,即区间的上界与下界之差:
Figure FDA0003499424940000051
预测区间的平均宽度为:
Figure FDA0003499424940000052
预测结果的平均区间宽度越小,表明不确定信息较为集中,即概率预测的敏锐性越好;
所述的综合评估是指:采用技能得分对预测模型的可靠性和敏锐性进行综合评估
Figure FDA0003499424940000053
对于Nt个样本的测试集的技能得分的平均值
Figure FDA0003499424940000054
技能得分的值越小,表明预测结果的综合性能越好。
10.一种实现上述任一权利要求所述方法的光伏发电功率预测系统,其特征在于,包括:数据预处理单元、点预测单元、概率预测单元和预测结果评估单元,其中:数据预处理单元与点预测单元及概率预测相连,传输预处理并格式化后的数据集;点预测单元与概率预测单元相连,传输宽度学习系统的结构参数和点预测模型输出权重;概率预测单元与预测结果评估单元相连,传输待预测时刻的概率预测结果;预测结果评估单元根据概率预测结果计算相关评估指标、对光伏发电功率的预测区间进行可视化。
CN202011237371.3A 2020-11-09 2020-11-09 基于宽度学习系统的光伏发电功率预测方法 Active CN112381282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011237371.3A CN112381282B (zh) 2020-11-09 2020-11-09 基于宽度学习系统的光伏发电功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011237371.3A CN112381282B (zh) 2020-11-09 2020-11-09 基于宽度学习系统的光伏发电功率预测方法

Publications (2)

Publication Number Publication Date
CN112381282A CN112381282A (zh) 2021-02-19
CN112381282B true CN112381282B (zh) 2022-06-17

Family

ID=74579386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011237371.3A Active CN112381282B (zh) 2020-11-09 2020-11-09 基于宽度学习系统的光伏发电功率预测方法

Country Status (1)

Country Link
CN (1) CN112381282B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113297790B (zh) * 2021-05-19 2022-05-10 哈尔滨工业大学 一种基于稀疏贝叶斯宽度学习的高铁轨道响应预测方法
CN113255982A (zh) * 2021-05-19 2021-08-13 国网甘肃省电力公司 一种风光水互补系统中长期优化调度方法
CN113487093A (zh) * 2021-07-09 2021-10-08 国网浙江省电力有限公司电力科学研究院 基于邻域前向时序最优组合的超短期光伏功率预测方法
CN115062668A (zh) * 2022-06-28 2022-09-16 合肥工业大学 基于RAdam优化宽度学习的谐波参数检测方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184399A (zh) * 2015-08-27 2015-12-23 许继集团有限公司 一种光伏电站功率预测方法
WO2018129828A1 (zh) * 2017-01-11 2018-07-19 沃太能源南通有限公司 一种光伏发电预测系统及预测方法
CN109149648A (zh) * 2018-10-11 2019-01-04 广西大学 一种自适应宽度动态规划智能发电控制方法
CN109376951A (zh) * 2018-11-21 2019-02-22 华中科技大学 一种光伏概率预测方法
CN110009135A (zh) * 2019-03-08 2019-07-12 浙江大学 一种基于宽度学习的风电功率预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184399A (zh) * 2015-08-27 2015-12-23 许继集团有限公司 一种光伏电站功率预测方法
WO2018129828A1 (zh) * 2017-01-11 2018-07-19 沃太能源南通有限公司 一种光伏发电预测系统及预测方法
CN109149648A (zh) * 2018-10-11 2019-01-04 广西大学 一种自适应宽度动态规划智能发电控制方法
CN109376951A (zh) * 2018-11-21 2019-02-22 华中科技大学 一种光伏概率预测方法
CN110009135A (zh) * 2019-03-08 2019-07-12 浙江大学 一种基于宽度学习的风电功率预测方法

Also Published As

Publication number Publication date
CN112381282A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112381282B (zh) 基于宽度学习系统的光伏发电功率预测方法
JP5888640B2 (ja) 太陽光発電予測装置、太陽光発電予測方法及び太陽光発電予測プログラム
CN108921339B (zh) 基于分位数回归的遗传支持向量机光伏功率区间预测方法
CN103489038A (zh) 基于lm-bp神经网络的光伏超短期功率预测方法
CN111815033A (zh) 一种基于rcnn和气象时序特征的海上风电功率预测方法
CN110503153B (zh) 基于差分进化算法和支持向量机的光伏系统故障诊断方法
CN111260126A (zh) 计及天气与气象因子关联度的短期光伏发电预测方法
CN113837499A (zh) 一种超短期风电功率预测方法及系统
CN109815995A (zh) 一种缺失观测值条件下锂电池剩余寿命预测方法
CN114462718A (zh) 基于时间滑动窗口的cnn-gru风电功率预测方法
CN111242355A (zh) 一种基于贝叶斯神经网络的光伏概率预测方法及系统
CN112149883A (zh) 基于fwa-bp神经网络的光伏功率预测方法
Aliberti et al. Forecasting Short-term Solar Radiation for Photovoltaic Energy Predictions.
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN115829126A (zh) 基于多视角自适应特征融合的光伏发电功率预测方法
Teferra et al. Fuzzy-based prediction of solar PV and wind power generation for microgrid modeling using particle swarm optimization
CN116345555A (zh) 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法
CN116014722A (zh) 基于季节分解和卷积网络的次日光伏发电预测方法及系统
CN112101626A (zh) 一种分布式光伏发电功率预测方法及系统
CN113991711B (zh) 一种光伏电站储能系统容量配置方法
Li et al. Photovoltaic power prediction method for zero energy consumption buildings based on multi-feature fuzzy clustering and MAOA-ESN
CN112464567B (zh) 基于变分同化框架的智能资料同化方法
CN114357670A (zh) 一种基于bls和自编码器的配电网用电数据异常预警方法
CN112215478A (zh) 光储电站的功率协调控制方法和装置、存储介质
CN111371091A (zh) 基于市场效益驱动的光伏发电智能预测系统的计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant