CN112101669A - 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 - Google Patents
一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 Download PDFInfo
- Publication number
- CN112101669A CN112101669A CN202010992908.0A CN202010992908A CN112101669A CN 112101669 A CN112101669 A CN 112101669A CN 202010992908 A CN202010992908 A CN 202010992908A CN 112101669 A CN112101669 A CN 112101669A
- Authority
- CN
- China
- Prior art keywords
- photovoltaic power
- elm
- prediction
- interval
- hidden layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 239000002245 particle Substances 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 210000002569 neuron Anatomy 0.000 claims abstract description 29
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000010219 correlation analysis Methods 0.000 claims abstract description 11
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims abstract description 7
- 239000010410 layer Substances 0.000 claims description 84
- 238000012549 training Methods 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 16
- 108090000672 Annexin A5 Proteins 0.000 claims description 15
- 238000002790 cross-validation Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 101100042371 Caenorhabditis elegans set-3 gene Proteins 0.000 claims description 3
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 claims description 3
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 claims description 3
- 101150104646 SET4 gene Proteins 0.000 claims description 3
- 101150117538 Set2 gene Proteins 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000005315 distribution function Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 abstract description 2
- 238000012795 verification Methods 0.000 abstract description 2
- 238000012216 screening Methods 0.000 abstract 1
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000007547 defect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013531 bayesian neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Photovoltaic Devices (AREA)
Abstract
本发明涉及一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,获取初始历史样本单元集,经过数据清洗后,对各气象因素与光伏功率进行相关性分析,筛选出与光伏功率具有较高相关性的气象因素作为极限学习机预测模型输入变量;考虑预测区间覆盖率与归一化平均带宽,构建光伏功率预测区间评价指标;使用交叉验证法确定极限学习机隐层神经元个数,并使用光伏功率预测区间评价指标值表征粒子适应度,结合粒子群算法与分位数回归确定极限学习机参数最优值,完成光伏功率区间预测模型构建。本发明能够在满足可信度要求基础上,实现较高准确度的光伏功率不确定性预测,生成相应置信度下的光伏功率预测区间,具有实际应用价值。
Description
技术领域
本发明涉及电力系统新能源预测技术领域,特别是一种基于改进极限学习机与分位数回归的光伏功率区间预测方法。
背景技术
随着能源短缺、环境污染等问题的加剧,在国家政策扶持下,储量丰富、环境友好的太阳能光伏在电网中的渗透率日益增加。然而,光伏出力的间歇性、波动性、随机性会对电网的安全稳定性造成威胁,光伏功率预测对电网规划与运行具有重要意义。
目前,已有诸多针对光伏预测的研究及成果。根据建模方式不同,光伏预测方法可分为物理方法和数据驱动方法。物理方法以光伏组件出力特性、安装角度、转换效率等为基础,结合气象因素、地理条件,通过建立物理模型来计算光伏功率,其缺点是建模过程复杂、鲁棒性差;数据驱动方法分为统计学方法和元启发式学习方法,以大量历史数据的分析为基础。统计学方法对历史数据进行曲线拟合和参数估计,构建光伏功率与气象因素、历史出力之间的联系,例如时间序列法、灰色理论、模糊理论、时空关联法等;元启发式学习方法通过历史数据训练得到光伏预测模型,属于人工智能算法,其中神经网络应用最为广泛,包括径向基函数神经网络、小波神经网络、BP神经网络等,虽然易于实现,但是对参数选择较为敏感,且可能存在过学习、陷入局部最优等现象。根据结果形式不同,光伏预测可分为点预测和区间预测。点预测是目前大多数研究采用的方法,得到未来一段时间内光伏功率确定值,虽然直观,但无法表征光伏功率不确定性;区间预测可得到一定置信水平下光伏功率预测范围,可以比点预测提供更多信息,目前实现方法主要有Bootstrap法、贝叶斯神经网络、Delta法等,然而这些方法计算效率较低。鉴于现有研究不足,光伏功率预测方法还有待进一步改进。
发明内容
有鉴于此,本发明的目的是提供一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,通过极限学习机输入变量确定、参数优化,提升光伏功率区间预测的可信度与准确度。
本发明采用以下方案实现:一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,包括以下步骤:
步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定(极限学习机)ELM预测模型输入变量;
步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。
进一步地,步骤S1中所述初始历史样本单元集是指:以固定采样间隔,从气象站采集各历史时间点气象数据值,包括风向、风速、温度、相对湿度、平均海平面气压、降雨量和太阳辐照度,并从光伏电站采集相应时间点的光伏功率值;同一时刻的气象数据值与光伏功率值构成一个初始历史样本单元,所有初始历史样本单元构成初始历史样本单元集。
进一步地,步骤S1中所述数据清洗的具体内容为:在初始历史样本单元集中剔除存在数据缺失或异常的样本单元;其中,数据缺失是指因包括节假日或设备停运检修因素导致某些时间点的数据为空;数据异常是指根据经验不可能出现的数据值,包括光伏功率负值或与季节不符的极端温度。
进一步地,步骤S1中所述对气象数据与光伏功率进行相关性分析确定ELM预测模型输入变量的具体内容为:计算各气象因素时间序列与光伏功率时间序列Pearson相关系数,量化各气象因素与光伏功率之间关联程度大小;Pearson相关系数计算公式为式中,cov(·,·)表示协方差运算,x为待分析的气象因素时间序列,P为光伏功率时间序列;Pearson系数正负分别表示正相关和负相关,绝对值大小分别表示相关性高低;
所述ELM包括输入层、单层隐层和输出层,选取与光伏功率相关性较高的n个气象因素,即与光伏功率Pearson相关系数绝对值达0.5的气象因素,将其作为ELM预测模型输入,同时可确定ELM输入层神经元个数为n。
进一步地,步骤S2中所述光伏功率预测区间评价指标的具体内容为:
光伏功率预测区间从可信度与准确度两个方面进行评价,可信度方面,预测区间覆盖率PICP(Prediction Interval Coverage Probability,PICP)应达到预测区间额定置信水平PINC要求,即式中,Ns为待预测样本总数,为布尔型指示函数,当光伏功率目标值被预测区间覆盖时,反之为0;α为显著性水平,与PINC的关系为PINC=100(1-α)%;预测区间带宽越窄,区间预测准确度越高,预测区间归一化平均带宽PINAW(Prediction Interval Normalized Average Width,PINAW)为式中,为光伏功率最大值,和分别为光伏功率预测区间上限和下限;设置光伏功率预测区间评价指标为φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],式中,ω和b分别为ELM隐层输入权重矩阵和偏置矩阵;γ(ω,b)为布尔类型指示函数,当PICP不低于PINC时,γ(ω,b)=0,否则,γ(ω,b)=1;η为惩罚系数;平均覆盖率误差ACE(ω,b)是PINC和PICP的差值;当PICP达到置信水平要求时,φ(ω,b)仅由PINAW决定,否则,φ(ω,b)会很低,且PICP对适应度的影响比PINAW更大。
进一步地,步骤S2中所述通过交叉验证法确定ELM结构的具体内容为:历史数据中同一时刻的n个气象因素与光伏功率构成一个历史样本单元,所有历史样本单元构成ELM训练集;设定隐层神经元个数初始值为1,将ELM训练集平均随机分为5份,分别为Set1、Set2、Set3、Set4和Set5,依次取其中4份作为交叉验证训练集进行训练,得到ELM光伏功率区间预测模型,并将剩余1份作为交叉验证测试集用于此模型区间预测结果评估,共进行5次;将5次评价指标取平均值,得到1个隐层神经元对应的预测区间评价指标均值。逐渐增加隐层神经元个数,重复上述过程,得到不同隐层神经元个数对应的预测区间评价指标均值,直至评价指标均值不再随着隐层神经元个数增加而增加,选取此时隐层神经元数量作为最优方案,确定ELM结构。
进一步地,步骤S2中所述使用ELM参数混合寻优算法确定ELM参数最优值,完成光伏功率区间预测模型构建的具体内容为:
使用粒子群算法即PSO(Particle Swarm Optimization,PSO)算法和分位数回归相结合,确定ELM隐层输入权重与偏置最优值;输入ELM训练集,初始化PSO参数,具体包括粒子群规模、粒子初始位置、初始速度、位置范围、速度范围、惯性因子和加速度长度,其中,粒子位置与速度均含两个维度,分别对应ELM隐层输入权重ω和偏置b的寻优,在PSO每一次迭代中,得到粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间,计算粒子适应度φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],更新粒子个体与种群经过的历史最优位置,并更新粒子速度与位置,判断是否满足迭代停止条件,即连续十次迭代过程中粒子群历史最优位置不再发生改变,若满足则输出ELM隐层输入权重与偏置最优值,否则重新得到粒子位置对应的ELM隐层输入权重ω和偏置b。
进一步地,所述在PSO每一次迭代中,对于粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间的具体内容为:
定义随机变量y的分布函数F-1(τ)与位于[0,1]的第τ分位数,使之满足:F-1(τ)=inf{y:F(y)≥τ};预测区间上下限和分别为光伏功率序列中第i个元素yi的第和第α分位数,可通过最小化分位数损失来确定上下限,相应目标函数和约束为:
式中,β α 和分别为输出预测区间下限和上限的ELM模型隐层输出权重矩阵,是待优化的变量;ti为第i个样本的目标输出值;f(xi,β α )和分别为ELM输出的预测区间下限和上限,由ELM输入层变量与隐层输入权重ω相乘后,加上隐层输入偏置b,再由隐层神经元进行非线性映射,分别与β α 和相乘得到;ELM输出层变量取值范围归一化后的下限和上限分别为0和1;
引入辅助变量后,原问题转化为线性规划问题,如下所示:
调用商业求解器Gurobi解得ELM隐层输出权重最优值,并生成相应预测区间。
与现有技术相比,本发明具有以下有益效果:
(1)本发明将ELM应用于光伏功率区间预测,克服传统前馈神经网络运算效率较低、存在过学习等缺点,且泛化性能更为优越;提出基于相关性分析的ELM输入参数确定方法,可以减少历史数据中的无效信息,提升训练效率;提出基于PSO与分位数回归的ELM参数优化方法与光伏功率区间预测方法,可得到区间预测性能最优的ELM模型,其结果可描述光伏功率不确定性。本发明设计的光伏功率区间预测模型,统筹考虑了预测区间结果的可信度与准确度,且运算速度较快。
(2)本发明能够在满足可信度要求基础上,实现较高准确度的光伏功率不确定性预测,生成相应置信度下的光伏功率预测区间,具有实际应用价值。
附图说明
图1为本发明实施例的使用的ELM结构图。
图2为本发明实施例的ELM参数混合寻优算法流程图。
图3为本发明实施例的某晴天在不同PINC下生成的光伏功率预测区间曲线图。
图4为本发明实施例的某多云天在不同PINC下生成的光伏功率预测区间曲线图。
图5为本发明实施例的某阴雨天在不同PINC下生成的光伏功率预测区间曲线图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本实施例提供一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,包括以下步骤:
步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定(极限学习机)ELM预测模型输入变量;
步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。
在本实施例中,步骤S1中所述初始历史样本单元集是指:以固定采样间隔,从气象站采集各历史时间点气象数据值,包括风向、风速、温度、相对湿度、平均海平面气压、降雨量和太阳辐照度,并从光伏电站采集相应时间点的光伏功率值;同一时刻的气象数据值与光伏功率值构成一个初始历史样本单元,所有初始历史样本单元构成初始历史样本单元集。
在本实施例中,步骤S1中所述数据清洗的具体内容为:在初始历史样本单元集中剔除存在数据缺失或异常的样本单元;其中,数据缺失是指因包括节假日或设备停运检修因素导致某些时间点的数据为空;数据异常是指根据经验不可能出现的数据值,包括光伏功率负值或与季节不符的极端温度。
在本实施例中,步骤S1中所述对气象数据与光伏功率进行相关性分析确定ELM预测模型输入变量的具体内容为:计算各气象因素时间序列与光伏功率时间序列Pearson相关系数,量化各气象因素与光伏功率之间关联程度大小;Pearson相关系数计算公式为式中,cov(·,·)表示协方差运算,x为待分析的气象因素时间序列,P为光伏功率时间序列;Pearson系数正负分别表示正相关和负相关,绝对值大小分别表示相关性高低;
所述的极限学习机(ELM)是一种新型前馈神经网络,包括输入层、单层隐层和输出层,选取与光伏功率相关性较高的n个气象因素,即与光伏功率Pearson相关系数绝对值达0.5的气象因素,将其作为ELM预测模型输入,同时可确定ELM输入层神经元个数为n。
在本实施例中,步骤S2中所述光伏功率预测区间额定置信水平的具体内容为:为表征光伏功率不确定性,使用光伏功率预测区间描述某时刻光伏功率可能的范围,光伏实际功率位于此区间内的概率应不低于设定的阈值,此阈值为预测区间额定置信水平PINC(Prediction Interval Nominal Confidence,PINC)。
在本实施例中,步骤S2中所述光伏功率预测区间评价指标的具体内容为:
光伏功率预测区间从可信度与准确度两个方面进行评价,可信度方面,预测区间覆盖率PICP(Prediction Interval Coverage Probability,PICP)应达到预测区间额定置信水平PINC要求,即式中,Ns为待预测样本总数,为布尔型指示函数,当光伏功率目标值被预测区间覆盖时,反之为0;α为显著性水平,与PINC的关系为PINC=100(1-α)%;预测区间带宽越窄,区间预测准确度越高,预测区间归一化平均带宽PINAW(Prediction Interval Normalized Average Width,PINAW)为式中,为光伏功率最大值,和分别为光伏功率预测区间上限和下限;设置光伏功率预测区间评价指标为φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],式中,ω和b分别为ELM隐层输入权重矩阵和偏置矩阵;γ(ω,b)为布尔类型指示函数,当PICP不低于PINC时,γ(ω,b)=0,否则,γ(ω,b)=1;η为惩罚系数;平均覆盖率误差ACE(ω,b)是PINC和PICP的差值;当PICP达到置信水平要求时,φ(ω,b)仅由PINAW决定,否则,φ(ω,b)会很低,且PICP对适应度的影响比PINAW更大。
在本实施例中,步骤S2中所述通过交叉验证法确定ELM结构的具体内容为:历史数据中同一时刻的n个气象因素与光伏功率构成一个历史样本单元,所有历史样本单元构成ELM训练集。设定隐层神经元个数初始值为1,将ELM训练集平均随机分为5份,分别为Set1、Set2、Set3、Set4和Set5,依次取其中4份作为交叉验证训练集进行训练,得到ELM光伏功率区间预测模型,并将剩余1份作为交叉验证测试集用于此模型区间预测结果评估,共进行5次,如下表所示:
将5次评价指标取平均值,得到1个隐层神经元对应的预测区间评价指标均值。逐渐增加隐层神经元个数,重复上述过程,得到不同隐层神经元个数对应的预测区间评价指标均值,直至评价指标均值不再随着隐层神经元个数增加而增加,选取此时隐层神经元数量作为最优方案,确定ELM结构。如图1所示。
在本实施例中,步骤S2中所述使用ELM参数混合寻优算法确定ELM参数最优值,完成光伏功率区间预测模型构建的具体内容为:
使用粒子群算法即PSO(Particle Swarm Optimization,PSO)算法和分位数回归相结合,确定ELM隐层输入权重与偏置最优值;输入ELM训练集,初始化PSO参数,具体包括粒子群规模、粒子初始位置、初始速度、位置范围、速度范围、惯性因子、加速度长度等,其中,粒子位置与速度均含两个维度,分别对应ELM隐层输入权重ω和偏置b的寻优,在PSO每一次迭代中,得到粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间,计算粒子适应度φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],更新粒子个体与种群经过的历史最优位置,并更新粒子速度与位置,判断是否满足迭代停止条件,即连续十次迭代过程中粒子群历史最优位置不再发生改变,若满足则输出ELM隐层输入权重与偏置最优值,否则重新得到粒子位置对应的ELM隐层输入权重ω和偏置b。
在本实施例中,所述在PSO每一次迭代中,对于粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间的具体内容为:
定义随机变量y的分布函数F-1(τ)与位于[0,1]的第τ分位数,使之满足:F-1(τ)=inf{y:F(y)≥τ};预测区间上下限和分别为光伏功率序列中第i个元素yi的第和第α分位数,可通过最小化分位数损失来确定上下限,相应目标函数和约束为:
式中,β α 和分别为输出预测区间下限和上限的ELM模型隐层输出权重矩阵,是待优化的变量;ti为第i个样本的目标输出值;f(xi,β α )和分别为ELM输出的预测区间下限和上限,由ELM输入层变量与隐层输入权重ω相乘后,加上隐层输入偏置b,再由隐层神经元进行非线性映射,分别与β α 和相乘得到;ELM输出层变量取值范围归一化后的下限和上限分别为0和1;
引入辅助变量后,原问题转化为线性规划问题,如下所示:
调用商业求解器Gurobi解得ELM隐层输出权重最优值,并生成相应预测区间。
较佳的,本实施例从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对各气象因素与光伏功率进行相关性分析,筛选出与光伏功率具有较高相关性的气象因素作为极限学习机预测模型输入变量;从区间预测可信度与准确度两方面,考虑预测区间覆盖率与归一化平均带宽,构建光伏功率预测区间评价指标;使用交叉验证法确定极限学习机隐层神经元个数,并使用光伏功率预测区间评价指标值表征粒子适应度,结合粒子群算法与分位数回归确定极限学习机参数最优值,完成光伏功率区间预测模型构建。本发明提出的预测模型,能够在满足可信度要求基础上,实现较高准确度的光伏功率不确定性预测,生成相应置信度下的光伏功率预测区间,具有实际应用价值。
较佳的,本实施例的一具体示例如下:
步骤1、从气象站与光伏电站分别搜集气象历史数据与光伏功率历史数据;
步骤2、进行数据清洗,剔除存在数据缺失或异常的历史样本单元;步骤3、对各气象因素和光伏功率进行相关性分析,计算Pearson相关系数;
步骤4、根据Pearson相关系数的绝对值大小,去除与光伏功率相关性较低的气象因素历史数据,确定ELM输入参数;
步骤5、使用交叉验证法确定ELM隐层神经元个数;
步骤6、如图2所示,使用PSO算法确定ELM隐层输入权重与偏置的最优值,在每一次迭代中,通过分位数回归确定相应ELM隐层输出权重最优值,生成光伏功率预测区间,直至满足迭代结束条件,获得ELM参数最优值,完成ELM区间预测模型的构建。
本实施例获取的气象与光伏功率历史数据采样间隔为1min,对白天光伏有输出的时刻进行步长为15min的光伏功率区间预测。
将获取的历史数据按季节划分为四份,进行数据清洗后,各气象因素与光伏功率的Pearson相关系数值如下表所示:
由表中数据可知,太阳辐照度、相对湿度和温度是与光伏功率相关性最大的三个气象因素,其余气象因素与光伏功率的Pearson相关系数绝对值较小,可以忽略。故确定ELM的输入参数为太阳辐照度、相对湿度和温度,ELM具有三个输入层神经元。
本实施例选用的ELM隐层神经元个数为20。
为检验本实施例提出的区间预测模型在不同天气条件下的预测性能,选取晴天、多云天、雨天三种天气类型下的数据作为测试集,在PINC分别为90%、85%和80%条件下进行光伏功率区间预测与结果评估。某晴天光伏功率区间预测结果如图3所示,相应预测区间评价指标如下表所示。
某多云天光伏功率区间预测结果如图4所示,相应预测区间评价指标如下表所示。
某阴雨天光伏功率区间预测结果如图5所示,相应预测区间评价指标如下表所示。
本实施例的优势在于:
1)采用基于数据驱动的预测方法,避免复杂的物理建模过程。
2)根据相关性分析确定ELM输入参数,可去除冗余历史数据。
3)使用ELM进行模型训练,可克服传统神经网络易过学习、参数敏感等缺陷,且计算效率较高。
4)将PSO算法与分位数回归结合,建立基于预测区间评价指标的粒子适应度评价体系,确定ELM参数最优值,生成的光伏功率预测区间可满足预设覆盖率要求,且带宽较窄。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (8)
1.一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:包括以下步骤:
步骤S1:从气象站与光伏电站获取初始历史样本单元集,经过数据清洗后,对气象数据与光伏功率进行相关性分析,确定ELM预测模型输入变量;
步骤S2:设定光伏功率预测区间额定置信水平,基于光伏功率预测区间评价指标,通过交叉验证法确定ELM结构,并使用ELM参数混合寻优算法确定ELM参数最优值,完成相应置信度水平下光伏功率区间预测模型构建。
2.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述初始历史样本单元集是指:以固定采样间隔,从气象站采集各历史时间点气象数据值,包括风向、风速、温度、相对湿度、平均海平面气压、降雨量和太阳辐照度,并从光伏电站采集相应时间点的光伏功率值;同一时刻的气象数据值与光伏功率值构成一个初始历史样本单元,所有初始历史样本单元构成初始历史样本单元集。
3.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述数据清洗的具体内容为:在初始历史样本单元集中剔除存在数据缺失或异常的样本单元;其中,数据缺失是指因包括节假日或设备停运检修因素导致某些时间点的数据为空;数据异常是指根据经验不可能出现的数据值,包括光伏功率负值或与季节不符的极端温度。
4.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S1中所述对气象数据与光伏功率进行相关性分析确定ELM预测模型输入变量的具体内容为:计算各气象因素时间序列与光伏功率时间序列Pearson相关系数,量化各气象因素与光伏功率之间关联程度大小;Pearson相关系数计算公式为式中,cov(·,·)表示协方差运算,x为待分析的气象因素时间序列,P为光伏功率时间序列;Pearson系数正负分别表示正相关和负相关,绝对值大小分别表示相关性高低;
所述ELM包括输入层、单层隐层和输出层,选取与光伏功率相关性较高的n个气象因素,即与光伏功率Pearson相关系数绝对值达0.5的气象因素,将其作为ELM预测模型输入,同时确定ELM输入层神经元个数为n。
5.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S2中所述光伏功率预测区间评价指标的具体内容为:光伏功率预测区间从可信度与准确度两个方面进行评价,可信度方面,预测区间覆盖率PICP应达到预测区间额定置信水平PINC要求,即式中,Ns为待预测样本总数,为布尔型指示函数,当光伏功率目标值被预测区间覆盖时,反之为0;α为显著性水平,与PINC的关系为PINC=100(1-α)%;预测区间带宽越窄,区间预测准确度越高,预测区间归一化平均带宽PINAW为式中,为光伏功率最大值,和分别为光伏功率预测区间上限和下限;设置光伏功率预测区间评价指标为φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],式中,ω和b分别为ELM隐层输入权重矩阵和偏置矩阵;γ(ω,b)为布尔类型指示函数,当PICP不低于PINC时,γ(ω,b)=0,否则,γ(ω,b)=1;η为惩罚系数,平均覆盖率误差ACE(ω,b)是PINC和PICP的差值;当PICP达到置信水平要求时,φ(ω,b)仅由PINAW决定,否则,φ(ω,b)会很低,且PICP对适应度的影响比PINAW更大。
6.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S2中所述通过交叉验证法确定ELM结构的具体内容为:历史数据中同一时刻的n个气象因素与光伏功率构成一个历史样本单元,所有历史样本单元构成ELM训练集;设定隐层神经元个数初始值为1,将ELM训练集平均随机分为5份,分别为Set1、Set2、Set3、Set4和Set5,依次取其中4份作为交叉验证训练集进行训练,得到ELM光伏功率区间预测模型,并将剩余1份作为交叉验证测试集用于此模型区间预测结果评估,共进行5次;将5次评价指标取平均值,得到1个隐层神经元对应的预测区间评价指标均值;逐渐增加隐层神经元个数,重复上述过程,得到不同隐层神经元个数对应的预测区间评价指标均值,直至评价指标均值不再随着隐层神经元个数增加而增加,选取此时隐层神经元数量作为最优方案,确定ELM结构。
7.根据权利要求1所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:步骤S2中所述使用ELM参数混合寻优算法确定ELM参数最优值,完成光伏功率区间预测模型构建的具体内容为:
使用粒子群算法即PSO算法和分位数回归相结合,确定ELM隐层输入权重与偏置最优值;输入ELM训练集,初始化PSO参数,具体包括粒子群规模、粒子初始位置、初始速度、位置范围、速度范围、惯性因子和加速度长度,其中,粒子位置与速度均含两个维度,分别对应ELM隐层输入权重ω和偏置b的寻优,在PSO每一次迭代中,得到粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间,计算粒子适应度φ(ω,b)=-[PINAW(ω,b)+γ(ω,b)η|ACE(ω,b)|],更新粒子个体与种群经过的历史最优位置,并更新粒子速度与位置,判断是否满足迭代停止条件,即连续十次迭代过程中粒子群历史最优位置不再发生改变,若满足则输出ELM隐层输入权重与偏置最优值,否则重新得到粒子位置对应的ELM隐层输入权重ω和偏置b。
8.根据权利要求7所述的一种基于改进极限学习机与分位数回归的光伏功率区间预测方法,其特征在于:所述在PSO每一次迭代中,对于粒子位置对应的ELM隐层输入权重ω和偏置b,采用分位数回归得到ELM隐层输出权重最优值与相应预测区间的具体内容为:
定义随机变量y的分布函数F-1(τ)与位于[0,1]的第τ分位数,使之满足:F-1(τ)=inf{y:F(y)≥τ};预测区间上下限和分别为光伏功率序列中第i个元素yi的第和第α分位数,可通过最小化分位数损失来确定上下限,相应目标函数和约束为:
式中,β α 和分别为输出预测区间下限和上限的ELM模型隐层输出权重矩阵,是待优化的变量;ti为第i个样本的目标输出值;f(xi,β α )和分别为ELM输出的预测区间下限和上限,由ELM输入层变量与隐层输入权重ω相乘后,加上隐层输入偏置b,再由隐层神经元进行非线性映射,分别与β α 和相乘得到;ELM输出层变量取值范围归一化后的下限和上限分别为0和1;
引入辅助变量后,原问题转化为线性规划问题,如下所示:
调用商业求解器Gurobi解得ELM隐层输出权重最优值,并生成相应预测区间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010992908.0A CN112101669B (zh) | 2020-09-21 | 2020-09-21 | 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010992908.0A CN112101669B (zh) | 2020-09-21 | 2020-09-21 | 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101669A true CN112101669A (zh) | 2020-12-18 |
CN112101669B CN112101669B (zh) | 2022-09-06 |
Family
ID=73760132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010992908.0A Active CN112101669B (zh) | 2020-09-21 | 2020-09-21 | 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101669B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487077A (zh) * | 2021-06-30 | 2021-10-08 | 南京南瑞继保电气有限公司 | 一种基于集成学习的可再生能源发电功率区间预测方法 |
CN113722970A (zh) * | 2021-09-01 | 2021-11-30 | 河海大学常州校区 | 一种光伏功率超短期在线预测方法 |
CN113762410A (zh) * | 2021-09-17 | 2021-12-07 | 哈尔滨工业大学 | 基于机器学习的关键焊接工艺参数预测方法 |
CN115483884A (zh) * | 2022-10-28 | 2022-12-16 | 广东华矩检测技术有限公司 | 一种批量光伏组件的功率性能评价方法及相关设备 |
CN115700494A (zh) * | 2022-09-16 | 2023-02-07 | 哈尔滨工业大学 | 一种基于贝叶斯推理的轨道交通监测数据清洗方法及系统 |
CN116245259A (zh) * | 2023-05-11 | 2023-06-09 | 华能山东发电有限公司众泰电厂 | 基于深度特征选择的光伏发电预测方法、装置和电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046374A (zh) * | 2015-08-25 | 2015-11-11 | 华北电力大学 | 一种基于核极限学习机模型的功率区间预测方法 |
CN105322566A (zh) * | 2015-11-06 | 2016-02-10 | 山东大学 | 考虑预测误差时序分布的含风电机组组合模型建立方法 |
AU2017202731A1 (en) * | 2016-05-04 | 2017-11-23 | Rheem Australia Pty Limited | Improvements in Water Heating Elements |
CN108428017A (zh) * | 2018-04-23 | 2018-08-21 | 华北电力大学 | 基于核极限学习机分位数回归的风电功率区间预测方法 |
CN108985521A (zh) * | 2018-08-02 | 2018-12-11 | 广东工业大学 | 光伏发电系统的输出功率预测方法、装置、设备及介质 |
CN110555548A (zh) * | 2019-08-05 | 2019-12-10 | 三峡大学 | 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法 |
CN110675278A (zh) * | 2019-09-18 | 2020-01-10 | 上海电机学院 | 一种基于rbf神经网络的光伏功率短期预测方法 |
-
2020
- 2020-09-21 CN CN202010992908.0A patent/CN112101669B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046374A (zh) * | 2015-08-25 | 2015-11-11 | 华北电力大学 | 一种基于核极限学习机模型的功率区间预测方法 |
CN105322566A (zh) * | 2015-11-06 | 2016-02-10 | 山东大学 | 考虑预测误差时序分布的含风电机组组合模型建立方法 |
AU2017202731A1 (en) * | 2016-05-04 | 2017-11-23 | Rheem Australia Pty Limited | Improvements in Water Heating Elements |
CN108428017A (zh) * | 2018-04-23 | 2018-08-21 | 华北电力大学 | 基于核极限学习机分位数回归的风电功率区间预测方法 |
CN108985521A (zh) * | 2018-08-02 | 2018-12-11 | 广东工业大学 | 光伏发电系统的输出功率预测方法、装置、设备及介质 |
CN110555548A (zh) * | 2019-08-05 | 2019-12-10 | 三峡大学 | 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法 |
CN110675278A (zh) * | 2019-09-18 | 2020-01-10 | 上海电机学院 | 一种基于rbf神经网络的光伏功率短期预测方法 |
Non-Patent Citations (2)
Title |
---|
彭立亮等: "一种改进的ELM及其在光伏发电上的应用", 《信息技术》 * |
杨锡运等: "基于粒子群优化的核极限学习机模型的风电功率区间预测方法", 《中国电机工程学报》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113487077A (zh) * | 2021-06-30 | 2021-10-08 | 南京南瑞继保电气有限公司 | 一种基于集成学习的可再生能源发电功率区间预测方法 |
CN113722970A (zh) * | 2021-09-01 | 2021-11-30 | 河海大学常州校区 | 一种光伏功率超短期在线预测方法 |
CN113722970B (zh) * | 2021-09-01 | 2023-09-15 | 河海大学常州校区 | 一种光伏功率超短期在线预测方法 |
CN113762410A (zh) * | 2021-09-17 | 2021-12-07 | 哈尔滨工业大学 | 基于机器学习的关键焊接工艺参数预测方法 |
CN113762410B (zh) * | 2021-09-17 | 2023-12-08 | 哈尔滨工业大学 | 基于机器学习的关键焊接工艺参数预测方法 |
CN115700494A (zh) * | 2022-09-16 | 2023-02-07 | 哈尔滨工业大学 | 一种基于贝叶斯推理的轨道交通监测数据清洗方法及系统 |
CN115483884A (zh) * | 2022-10-28 | 2022-12-16 | 广东华矩检测技术有限公司 | 一种批量光伏组件的功率性能评价方法及相关设备 |
CN116245259A (zh) * | 2023-05-11 | 2023-06-09 | 华能山东发电有限公司众泰电厂 | 基于深度特征选择的光伏发电预测方法、装置和电子设备 |
CN116245259B (zh) * | 2023-05-11 | 2023-10-31 | 华能山东泰丰新能源有限公司 | 基于深度特征选择的光伏发电预测方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112101669B (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101669B (zh) | 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法 | |
CN111222698B (zh) | 面向物联网的基于长短时记忆网络的积水水位预测方法 | |
CN108388956B (zh) | 考虑辐射衰减的光伏功率预测方法 | |
Stefenon et al. | Photovoltaic power forecasting using wavelet Neuro-Fuzzy for active solar trackers | |
CN111222674A (zh) | 基于长短期记忆神经网络的短期光伏发电量预测方法 | |
CN110705760A (zh) | 一种基于深度置信网络的光伏发电功率预测方法 | |
CN107766986A (zh) | 泄漏积分型回声状态网络在线学习光伏功率预测方法 | |
CN104036328A (zh) | 自适应风电功率预测系统及预测方法 | |
CN113537582B (zh) | 一种基于短波辐射修正的光伏功率超短期预测方法 | |
CN112329990A (zh) | 一种基于lstm-bp神经网络的用户用电负荷预测方法 | |
Park et al. | Multi-layer RNN-based short-term photovoltaic power forecasting using IoT dataset | |
CN114118596A (zh) | 一种光伏发电量预测方法和装置 | |
CN107977728A (zh) | 一种基于bp人工神经网络的中长期逐小时气温预测方法 | |
CN115965132A (zh) | 基于ga-bp神经网络的分布式光伏数字孪生系统功率预测方法 | |
CN113988655A (zh) | 一种计及多气象因素的输电线路运行状态评估方法 | |
CN115115127A (zh) | 一种基于深度学习的低压台区智能调控方法及系统 | |
CN113516271A (zh) | 一种基于时空神经网络的风电集群功率日前预测方法 | |
CN116702937A (zh) | 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法 | |
CN115935215A (zh) | 极端天气下基于深度学习的输电线路覆冰预警方法及系统 | |
CN115796004A (zh) | 一种基于SLSTM和MLSTNet模型的光伏电站超短期功率智能预测方法 | |
CN117498400B (zh) | 一种分布式光伏与储能数据的处理方法及系统 | |
CN114429248A (zh) | 一种变压器视在功率预测方法 | |
CN112767692A (zh) | 基于SARIMA-GA-Elman组合模型的短时交通流量预测系统 | |
CN115239029B (zh) | 考虑功率时序及气象相依特性的风电功率预测方法及系统 | |
CN109447843A (zh) | 一种光伏出力预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |