CN113487077B - 一种基于集成学习的可再生能源发电功率区间预测方法 - Google Patents

一种基于集成学习的可再生能源发电功率区间预测方法 Download PDF

Info

Publication number
CN113487077B
CN113487077B CN202110737405.3A CN202110737405A CN113487077B CN 113487077 B CN113487077 B CN 113487077B CN 202110737405 A CN202110737405 A CN 202110737405A CN 113487077 B CN113487077 B CN 113487077B
Authority
CN
China
Prior art keywords
renewable energy
interval
power
data
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110737405.3A
Other languages
English (en)
Other versions
CN113487077A (zh
Inventor
杨玉
牛洪海
李兵
陈霈
管晓晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NR Electric Co Ltd
NR Engineering Co Ltd
Original Assignee
NR Electric Co Ltd
NR Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NR Electric Co Ltd, NR Engineering Co Ltd filed Critical NR Electric Co Ltd
Priority to CN202110737405.3A priority Critical patent/CN113487077B/zh
Publication of CN113487077A publication Critical patent/CN113487077A/zh
Application granted granted Critical
Publication of CN113487077B publication Critical patent/CN113487077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于集成学习的可再生能源发电功率区间预测方法,包括以下步骤:选取合适的输入、输出变量,采集相关历史数据,进行数据预处理;将历史数据拆分为训练数据、校验数据;基于训练数据构建多个基学习器;基于训练数据以及校验数据,最优化新型综合性能评价指标来获取基学习器间的加权系数;综合基学习器的输出以及加权系数得到发电功率的预测区间。本发明充分利用极限学习机的快速学习性以及较强的泛化能力,有效的获得分位数回归模型,同时基于新型综合性能评价指标寻优得到的加权系数更为合理,更利于发挥集成学习的优势,从而得到更为精确的预测区间,为电网安全稳定运行提供有效的数据支撑。

Description

一种基于集成学习的可再生能源发电功率区间预测方法
技术领域
本发明属于可再生能源发电功率预测领域,特别涉及一种基于集成学习的可再生能源发电功率区间预测方法。
背景技术
可再生能源(风电、光伏)发电功率具有明显的不确定性以及随机性,随着可再生能源的大规模并网,对电网的安全稳定运行带来一定的挑战。传统对可再生能源发电功率预测的研究主要是确定性的点预测,但是点预测的误差不可避免且其结果不能对发电功率不确定性做出定量描述。从目前电网的应用层面来说,含可再生能源的电网规划、运行和安全稳定分析需要对可再生能源发电功率的波动范围有比较精确的估计,因此需要能定量反映发电功率不确定性的新的预测形式来克服传统点预测的缺陷。
发明内容
发明目的:为了克服现有技术中的不足,本发明提供了一种基于集成学习的可再生能源发电功率区间预测方法,通过区间预测能够定量反映发电功率的不确定性,从而得到更为精确的预测区间,为电网安全稳定运行提供有效的数据支撑。
技术方案:一种基于集成学习的可再生能源发电功率区间预测方法,包括如下方法:
采集影响可再生能源发电功率的输入变量的历史数据,可再生能源发电功率的历史数据,以及影响可再生能源发电功率的输入变量的预报值;
将采集的数据输入至训练好的多个不同基学习器;
根据多个不同基学习器的输出结果及对应基学习器的最优加权系数,计算发电功率的预测区间;
其中,基学习器的训练方法包括:
采集影响可再生能源发电功率输入变量,以及可再生能源发电功率的历史数据;
将历史数据拆分为训练数据及校验数据;
基于训练数据构建极限学习机分位数回归模型,并作为基学习器;
基于训练数据及校验数据,通过最优化新型综合性能评价指标计算获取各基学习器的最优加权系数。
在进一步的实施例中,不同基学习器间所使用的分位点不同。
在进一步的实施例中,所述新型综合性能评价指标采用下述公式计算获取:
其中:NCI表示新型的综合性能评价指标,RIS为可靠性指标分数,用于反映可再生能源发电功率预测区间的可靠性,的归一化值,为置信区间为100(1-α)%下的区间分数,用于反映可再生能源发电功率预测区间的清晰度,|·|代表绝对值,γ与λ是可靠性指标分数与区间分数的权重。
在进一步的实施例中,所述可靠性指标分数采用下述公式计算获取:
其中:是置信区间为100(1-α)%下所获得的可再生能源发电功率预测区间的平均覆盖误差(average coverage error,ACE),η,σ用于调整RIS的特性。
在进一步的实施例中,所述可靠性指标分数通过平均覆盖误差代入改进的sigmod函数中计算得到。
在进一步的实施例中,综合各个基学习器的输出以及加权系数得到发电功率的期望和方差,并根据期望和方差计算出不同置信度下的预测区间。
在进一步的实施例中,所述极限学习机模型采用下述函数表示:
其中,g(·)为激活函数,K为隐藏节点的个数,wi=[wi1,wi2,…,win]是输入变量与第i个隐藏节点间的权重,xj是第j个输入变量,βi是第i个隐藏节点与输出变量间的输出权重,bi是第i个隐藏节点的偏置,N1是历史数据拆分成训练数据的数据个数。
若极限学习机的输出可以近似零偏差的接近实际输出,此时:
可进一步转化为:
Hβ=T
其中H为隐藏层的输出矩阵,可以表示为:
β=[β12,…,βK]T为输出权重矩阵,为输出变量矩阵。
可再生能源发电功率的τ分位点可由下式表示:
基于极限学习的τ分位点分位数回归问题可以表示为如下所示的优化问题:
其中ti为可再生能源发电功率的实际输出,ρτ(·)为检验函数,其表达式如下:
对上述优化问题进行求解即可得到τ分位点对应的输出权重βτ
基于训练数据,建立不同τ值下的极限学习机分位数回归模型,这些模型即为本发明中的基学习器。
在进一步的实施例中,还包括将历史数据拆分为训练数据及校验数据之前,对历史数据进行预处理,所述预处理包括归一化处理。
在进一步的实施例中,通过粒子群算法最优化新型综合性能评价指标,得到最优加权系数。
在进一步的实施例中,所述发电功率的预测区间的上限通过下式计算获取:
所述发电功率的预测区间的上限通过下式计算获取:
其中:分别代表获得的可再生能源发电功率预测区间的上下限;为发电功率的期望, 为发电功率的方差, 为第t个基学习器的可再生能源发电功率预测输出值,nt为基学习器的个数,ht为最优加权系数,满足进而根据发电功率的期望和方差计算出不同置信度下的发电功率预测区间。
有益效果:本发明与现有技术相比具有以下优点:
通过对可再生能源发电功率的历史数据采集,进行预处理后,利用所拆分的训练数据构建多个基学习器,且各个基学习器极限学习机进行分位数回归分析,能够充分利用极限学习机的快速学习性以及较强的泛化能力,有效地获得分位数回归模型;同时基于新型综合性能评价指标寻优得到的加权系数更为合理,更利于发挥集成学习的优势,从而得到更为精确的预测区间,为电网安全稳定运行提供有效的数据支撑。
附图说明
图1为本发明中基于集成学习的区间预测计算过程示意图。
具体实施方式
为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案进一步介绍和说明,但不局限于此。
结合图1说明本发明中所述的基于集成学习的可再生能源发电功率区间预测方法,该方法包括以下步骤:
采集影响可再生能源发电功率的输入变量的历史数据,可再生能源发电功率的历史数据,以及影响可再生能源发电功率的输入变量的预报值;
将采集的数据输入至训练好的多个不同基学习器;
根据多个不同基学习器的输出结果及对应基学习器的最优加权系数,计算发电功率的预测区间;
其中,基学习器的训练方法包括:
采集影响可再生能源发电功率输入变量,以及可再生能源发电功率的历史数据;
将历史数据拆分为训练数据及校验数据;
基于训练数据构建极限学习机分位数回归模型,并作为基学习器;
基于训练数据及校验数据,通过最优化新型综合性能评价指标计算获取各基学习器的最优加权系数。
其中,采集影响可再生能源发电功率的输入变量、可再生能源发电功率的历史数据,进行数据预处理时,构建N个数据对其中影响可再生能源发电功率的输入变量为xi=[xi1,xi2,…,xin]T,可再生能源发电功率为ti
拆分历史数据时,将历史数据拆分为训练数据Dtrain(数据个数为N1)、校验数据Dvalid(数据个数为N2)。
使用Dtrain训练得到多个基学习器,本发明中基学习器使用基于极限学习机的分位数回归。
极限学习机的模型可表示为:
其中g(·)为激活函数,K为隐藏节点的个数,wi=[wi1,wi2,…,win]是输入变量与第i个隐藏节点间的权重,xj是第j个输入变量,βi是第i个隐藏节点与输出变量间的输出权重,bi是第i个隐藏节点的偏置。
对于N1个训练数据,若极限学习机的输出可以近似零偏差的接近实际输出,此时有:
可进一步重写为:
Hβ=T
其中H为隐藏层的输出矩阵,可以表示为:
β=[β12,…,βK]T为输出权重矩阵,为输出变量矩阵。由于极限学习机会在开始学习时随机生成输入权重和偏置,并在整个学习过程保持不变,H矩阵的值会在开始训练时确定并保持不变,因此极限学习机模型中待求解的参数为输出权重β。
可再生能源发电功率的τ分位点可由下式表示:
基于极限学习的τ分位点分位数回归问题可以表示为如下所示的优化问题:
其中ρτ(·)为检验函数,其表达式如下:
对上述优化问题进行求解即可得到τ分位点对应的输出权重βτ
基于训练数据,建立不同τ值下的极限学习机分位数回归模型,这些模型即为本发明中的基学习器。
根据预测区间的定义,待预测输出变量ti在满足额定置信度(PI nominalconfidence,PINC)100(1-α)%下的区间为可表示为:
其中分别代表着可再生能源发电功率预测区间的上下限。
本发明中基于集成学习的预测区间可通过下式获得:
其中:
为发电功率的期望,为发电功率的方差,为第t个基学习器的可再生能源发电功率预测输出值,nt为基学习器的个数,ht为加权系数,需满足
根据发电功率的期望和方差计算出不同置信度下的预测区间。
为获得合理的加权系数,本发明中提出一种新型的综合性能评价指标(newcomprehensive idex,NCI),其表达式为:
RIS为可靠性指标分数(reliability index score),是区间分数的归一化值,|·|代表绝对值,γ与λ是可靠性指标分数与区间分数的权重,是置信区间为100(1-α)%下预测区间的平均覆盖误差(average coverage error,ACE),RIS通过将代入改进的sigmod函数计算得到,η,σ用于调整RIS的特性。
ACE通过下式计算得到:
ACE=PICP-PINC
其中预测区间覆盖率(PI coverage probability,PICP)反映的是预测的发电功率输出ti落在中的概率,由下式计算得到。
其中Ntest为测试样本的个数;ci的计算公式为:
为了保证预测区间有高可靠性,PICP应当尽可能接近PINC,相应的ACE应当尽可能的接近0。
通过下式计算得到:
其中,设定为0,设定为2α。
为提高系统的泛化能力,使用训练数据以及校验数据,并通过粒子群算法最优化新型综合性能评价指标,得到最优的加权系数,结合预测区间上下限的公式得到最终的预测区间。
本发明通过对可再生能源发电功率的历史数据采集,进行预处理后,利用所拆分的训练数据构建多个基学习器,且各个基学习器极限学习机进行分位数回归分析,能够充分利用极限学习机的快速学习性以及较强的泛化能力,有效地获得分位数回归模型;同时基于新型综合性能评价指标寻优得到的加权系数更为合理,更利于发挥集成学习的优势,从而得到更为精确的预测区间,为电网安全稳定运行提供有效的数据支撑。
以上以附图说明的方式对本发明作了描述,本领域的技术人员应当理解,本公开不限于以上描述的实施例,在不偏离本发明的范围的情况下,可以做出各种变化、改变和替换。

Claims (7)

1.一种可再生能源发电功率区间预测方法,其特征在于,包括如下方法:
采集影响可再生能源发电功率的输入变量的历史数据,可再生能源发电功率的历史数据,以及影响可再生能源发电功率的输入变量的预报值;
将采集的所述影响可再生能源发电功率的输入变量的预报值输入至训练好的多个不同基学习器;
根据多个不同基学习器的输出结果及对应基学习器的最优加权系数,计算发电功率的预测区间;
其中,基学习器的训练方法包括:
采集影响可再生能源发电功率输入变量,以及可再生能源发电功率的历史数据;
将历史数据拆分为训练数据及校验数据;
基于训练数据构建极限学习机分位数回归模型,并作为基学习器;
基于训练数据及校验数据,通过最优化新型综合性能评价指标计算获取各基学习器的最优加权系数;
所述新型综合性能评价指标采用下述公式计算获取:
其中:NCI表示新型的综合性能评价指标,RIS为可靠性指标分数,用于反映可再生能源发电功率预测区间的可靠性,的归一化值,为置信区间为100(1-α)%下的区间分数,用于反映可再生能源发电功率预测区间的清晰度,|·|代表绝对值,γ与λ是可靠性指标分数与区间分数的权重;
所述可靠性指标分数采用下述公式计算获取:
其中:是置信区间为100(1-α)%下所获得的可再生能源发电功率预测区间的平均覆盖误差ACE,η,σ用于调整RIS的特性;
通过下式计算得到:
其中,设定为0,设定为2α;xi为影响可再生能源发电功率的输入变量,ti为可再生能源发电功率的输出变量;为发电功率的预测区间的上限,为发电功率预测区间的下限;
所述发电功率的预测区间的上限通过下式计算获取:
所述发电功率的预测区间的下限通过下式计算获取:
式中,为发电功率的期望, 为发电功率的方差, 为第t个基学习器的可再生能源发电功率预测输出值,nt为基学习器的个数,ht为最优加权系数,满足ht≥0,
ACE通过下式计算得到:
ACE=PICP-PINC;
其中,PINC表示额定置信度;PICP表示预测区间覆盖率,由下式计算得到:
其中,Ntest为测试样本的个数;ci的计算公式为:
式中,为待预测输出变量ti在满足额定置信度100(1-α)%下的区间,
2.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,不同基学习器间所使用的分位点不同。
3.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,所述可靠性指标分数通过平均覆盖误差代入改进的sigmod函数中计算得到。
4.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,综合各个基学习器的输出以及加权系数得到发电功率的期望和方差,并根据期望和方差计算出不同置信度下的预测区间。
5.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,所述极限学习机分位数回归模型通过求解下述优化问题获得:
其中,N1是历史数据拆分成训练数据的个数,Hi为第i个输入变量对应的极限学习机隐藏层输出矩阵,ρτ(·)为检验函数,βτ为极限学习机分位数回归模型中待求解的τ分位点输出权重。
6.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,还包括将历史数据拆分为训练数据及校验数据之前,对历史数据进行预处理,所述预处理包括归一化处理。
7.根据权利要求1所述的可再生能源发电功率区间预测方法,其特征在于,通过粒子群算法最优化新型综合性能评价指标,得到最优加权系数。
CN202110737405.3A 2021-06-30 2021-06-30 一种基于集成学习的可再生能源发电功率区间预测方法 Active CN113487077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110737405.3A CN113487077B (zh) 2021-06-30 2021-06-30 一种基于集成学习的可再生能源发电功率区间预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110737405.3A CN113487077B (zh) 2021-06-30 2021-06-30 一种基于集成学习的可再生能源发电功率区间预测方法

Publications (2)

Publication Number Publication Date
CN113487077A CN113487077A (zh) 2021-10-08
CN113487077B true CN113487077B (zh) 2024-07-12

Family

ID=77936704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110737405.3A Active CN113487077B (zh) 2021-06-30 2021-06-30 一种基于集成学习的可再生能源发电功率区间预测方法

Country Status (1)

Country Link
CN (1) CN113487077B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909810A (zh) * 2019-11-26 2020-03-24 国网山东省电力公司电力科学研究院 基于数据挖掘和变分模态分解的可再生能源短期预测方法
CN111695666A (zh) * 2020-05-26 2020-09-22 河海大学 一种基于深度学习的风电功率超短期条件概率预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101669B (zh) * 2020-09-21 2022-09-06 国网福建省电力有限公司泉州供电公司 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909810A (zh) * 2019-11-26 2020-03-24 国网山东省电力公司电力科学研究院 基于数据挖掘和变分模态分解的可再生能源短期预测方法
CN111695666A (zh) * 2020-05-26 2020-09-22 河海大学 一种基于深度学习的风电功率超短期条件概率预测方法

Also Published As

Publication number Publication date
CN113487077A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN110807554B (zh) 基于风电/光伏经典场景集的生成方法及系统
CN109558975B (zh) 一种电力负荷概率密度多种预测结果的集成方法
CN104077632B (zh) 一种基于深度神经网络的风电场功率预测方法
CN114648176B (zh) 一种基于数据驱动的风光电源消纳优化方法
CN112818604A (zh) 一种基于风功率预测的风电机组风险度评估方法
CN111027775A (zh) 基于长短期记忆网络的梯级水电站发电量预测方法
CN106548270A (zh) 一种光伏电站功率异常数据辨识方法及装置
US20230237316A1 (en) Forecast method and system of wind power probability density
CN111697560B (zh) 一种基于lstm预测电力系统负荷的方法及系统
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN110851784A (zh) 一种现场运行电能表的预警方法
CN116957356B (zh) 一种基于大数据的景区碳中和管理方法和系统
CN113297805A (zh) 一种风电功率爬坡事件间接预测方法
CN113487077B (zh) 一种基于集成学习的可再生能源发电功率区间预测方法
CN108694475A (zh) 基于混合模型的短时间尺度光伏电池发电量预测方法
CN110717623B (zh) 融合多种天气状况的光伏发电功率预测方法及装置、设备
CN116663727A (zh) 一种光伏功率预测方法及系统
CN115796327A (zh) 一种基于vmd和iwoa-f-gru模型的风电功率区间预测方法
CN113449466B (zh) 基于pca和混沌gwo优化relm的太阳辐射预测方法及系统
CN116128211A (zh) 基于风光不确定性预报场景的风光水联合短期优化调度方法
CN113902492A (zh) 一种分时电价预测方法及系统
Jianli et al. Wind power forecasting by using artificial neural networks and Grubbs criterion
CN111612255A (zh) 一种基于支持向量回归的风电场功率曲线建模方法
Ali et al. Residential building energy performance prediction at an urban scale using ensemble machine learning algorithms
Liu et al. Short-term PV power prediction model based on weather feature clustering and Adaboost-GA-BP

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant