CN107704953A - Ewt分位数回归森林的短期风电功率概率密度预测方法 - Google Patents
Ewt分位数回归森林的短期风电功率概率密度预测方法 Download PDFInfo
- Publication number
- CN107704953A CN107704953A CN201710850654.7A CN201710850654A CN107704953A CN 107704953 A CN107704953 A CN 107704953A CN 201710850654 A CN201710850654 A CN 201710850654A CN 107704953 A CN107704953 A CN 107704953A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- mtd
- quantile
- mtr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000009466 transformation Effects 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 28
- 238000003066 decision tree Methods 0.000 claims description 22
- 230000001419 dependent effect Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000008901 benefit Effects 0.000 claims description 9
- 238000005315 distribution function Methods 0.000 claims description 9
- 238000007637 random forest analysis Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000000205 computational method Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 101100391181 Dictyostelium discoideum forH gene Proteins 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000013524 data verification Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000000717 retained effect Effects 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 description 12
- 230000003044 adaptive effect Effects 0.000 description 6
- 230000005611 electricity Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000013016 learning Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013277 forecasting method Methods 0.000 description 2
- 210000002816 gill Anatomy 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
Abstract
本发明公开一种EWT分位数回归森林的短期风电功率概率密度预测方法,包括以下步骤:1)采用经验小波变换(empirical wavelet transform,EWT)将原始风电功率序列分解为一系列特征互异经验模式;2)根据频率范围将经验模式进行重新组合,形成高频、中频和低频分量;3)对各分量采用皮尔森相关系数选取输入变量;4)对各分量建立分位数回归森林预测模型,获得不同分位点回归预测结果;5)将各分量预测结果叠加,得到风电功率预测值;6)采用核密度估计获得风电功率概率密度预测。本发明提供方法有效提高了风电功率预测精度,获得任意时刻风电功率概率密度预测,能够较好解决电力系统风电功率预测问题。
Description
技术领域
本发明涉及一种电力系统短期风电功率概率密度预测方法,对电力系统风电功率进行预测,属于电力系统技术领域。
背景技术
风力发电在电网中装机比例的逐年提升,有效缓解了能源紧张、环境污染格局,但其间歇性和不确定性又严重影响着电网的安全稳定及经济运行。短期风电功率预测作为自动发电控制和安排电力调度的重要决策依据,能够有效提高电力系统运行可靠性。为此,需要研究新技术与新方法,以提高风电功率预测精度,满足工程应用需求。
目前,国内外学者对短期风电功率预测进行了大量研究,主要有时间序列分析、人工神经网络、支持向量机、相关向量机等模型。另外,为进一步降低风电功率预测误差,相关学者提出了组合预测模型。实践证明:组合模型相对于单一预测方法能够优势互补,在提高预测精度的同时,增强了模型鲁棒性。组合预测按机理策略不同,主要分为两类:1)采用不同原理的预测模型分别进行预测,然后将预测结果按一定方式进行优化组合;2)采用信号处理技术对原始风电功率序列进行分解处理,对不同分解量建立预测模型,最后对各分量预测结果进行组合。应用小波变换进行数据预处理面临着小波基函数选取、分解层数难以确定的问题。采用自适应经验模态分解自动的将风电功率序列分解为一系列本征模态函数,接着对模态函数建立预测模型时,存在模态混叠现象,影响预测精度。集成经验模态分解方法有效缓解了经验模态分解存在的模态混叠问题,提高了预测精度,但其计算量较大、运算效率低。
针对经验模态分解方法易出现模态混叠、计算效率低、缺乏理论基础等缺点,Gilles提出了新型自适应信号处理方法-经验小波变换(empirical wavelet transform,EWT)。该方法结合了经验模态分解方法的自适应特性与小波分析理论框架,通过对信号频谱的自适应分割,在各个频谱构造合适的正交小波滤波器来提取傅里叶频谱的调幅调频(amplitude modulated-frequencymodulated,AM-FM)成分,进而采用Hilbert变换对不同的AM-FM模态进行处理,最终获得有意义的瞬时频率和瞬时幅值。该方法计算量小,且具有较强的鲁棒性。因此,本发明将EWT引入短期风电功率预测建模中,对原始风电功率序列进行分解处理。
一般的短期风电功率预测方法仅仅给出确定性的点预测结果,难以完全描述风能的不确定性及变化规律,从而不利于决策者在电网规划运行、风险分析、可靠性评估等方面做出科学有效的决策。因此,相关学者提出了短期风电功率概率预测方法,如分位数回归、区间预测、密度预测等。概率预测能够更好的描述未来风电功率可能的波动范围、不确定性及面临的风险。Nicolai结合分位数回归理论,在随机森林(random forest,RF)基础上提出了分位数回归森林(quantile regression forests,QRF)模型,可以给出不同分位点回归预测结果。作为一种非参数集成机器学习方法,QRF兼具运算速度快、模型性能受参数影响小、较强容噪性等优点。本发明建立QRF风电功率预测模型,在获得不同分位点预测输出条件下,进一步采用核密度估计获得风电功率概率密度预测。
综上所述,本发明结合EWT和QRF优点,建立EWT-QRF短期风电功率概率密度预测模型。首先,采用EWT将原始风电功率序列分解为一系列频率不同的经验模式,对每一经验模式分别建立QRF预测模型,获得不同分位点回归预测结果,将各经验模式预测结果叠加,得到最终的风电功率预测值。最后,采用核密度估计方法给出风电功率概率密度预测。
发明内容
发明目的:本发明针对现有电力系统负荷预测技术中存在的问题,如一般的风电功率预测方法只能输出确定性的点预测结果,难以完全反映风电功率的随机性、不确定性特征,经验模态分解方法易出现模态混叠、计算效率低、缺乏理论基础缺点等问题,提供一种EWT分位数回归森林的短期风电功率概率密度预测方法。本发明首先采用EWT将原始风电功率序列分解为一系列特征互异的经验模式,对每一经验模式选取输入变量集合并建立分位数回归森林预测模型,得到任意分位点条件下的预测结果。通过叠加不同经验模式预测结果,获得最终的短期风电功率预测值。最后,对预测值的条件分布采用核密度估计方法获得任意时刻风电功率概率密度预测结果。
技术方案:一种EWT分位数回归森林的短期风电功率概率密度预测方法,包括以下步骤:
(1)获取电力系统风电功率短期预测所需的基本数据,并对原始数据进行预处理,进行异常值剔除或修正;
(2)采用EWT将经预处理的风电功率序列分解为一系列特征互异的经验模式;
(3)根据频率范围将经验模式进行重新组合,形成高频分量、中频分量和低频分量;
(4)对各分量采用皮尔森相关系数选取输入变量集合;
(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;
(6)将各分量预测结果叠加,得到最终的风电功率预测值;
(7)采用核密度估计获得风电功率概率密度预测,并通过实测风电功率数据验证本发明方法的有效性。
进一步地,步骤(2)采用EWT技术将原始风电功率序列分解为一系列频率特征互异的经验模式,所述EWT方法具体计算过程为:
2.1确定带通滤波器的频率范围;首先对信号的Fourier谱进行自适应分割,定义Fourier支撑为[0,π]并假定将其分割成N个连续部分,令Λn=[wn-1,wn]表示各分割片段边界;其中:n=1,2,L,N,w0=0,wN=π,wn选取为信号Fourier谱相邻两个极大值点之间的中点,显见
2.2以每个wn为中心,定义宽度为Tn=2τn的过渡区域;
2.3在分割区间Λn上,定义经验小波为每个Λn上的带通滤波器,并根据Meyer小波构造方法构造经验小波,通常构造的经验小波函数为
经验尺度函数为
式中:τn=γwn;在时,保证了为紧框架;通常,函数β(x)定义为β(x)=x4(35-84x+70x2-20x3);
2.4从而,原始信号可被重构为
式中:*为卷积运算;为逼近系数;为x(t)的经验小波变换;
经验模式xk(t)定义为
进一步地,步骤(3)根据频率范围将经验模式进行重新组合,形成高频分量、中频分量和低频分量,所述频率范围划定方法具体为:将[0,π]频率范围内的经验模式划分为三部分:频率小于1的为低频分量,频率大于1且小于2的为中频分量,频率大于2的即为高频分量。
进一步地,步骤(4)对各分量采用皮尔森相关系数选取输入变量集合,所述皮尔森相关系数具体计算方法为:
给定时间序列,皮尔森相关系数衡量了xt与xt-τ间的相关关系,能够有效的确定输入变量集合;其中,τ为滞后阶数;皮尔森相关系数r取值范围为[-1,1],1表示完全正相关,-1表示完全负相关,0表示变量间无相关性;当|r|>0.3时,即认为变量间存在较强相关关系;待预测时刻风电功率与前第τ时刻功率间相关系数计算公式为
式中:xt,i、xt-τ,i分别为变量xt和xt-τ的第i个样本值;分别为变量xt和xt-τ的平均值;N为样本数量。
进一步地,步骤(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;分位数回归森林模型结合了分位数回归与随机森林模型的优势,可以给出不同分位点回归预测结果;作为一种非参数集成机器学习方法,QRF兼具运算速度快、模型性能受参数影响小、较强容噪性等优点;所述分位数回归具体计算过程为:
5.1在给定条件X=x下,条件分布函数是Y≤y的累积概率,即
F(y|X=x)=P(Y≤y|X=x)
α分位数Qα(x)为在给定X=x条件下,Y大于等于Qα(x)的累积概率恰好为α,即
Qα(x)=inf{y:F(y|X=x)≥α}
5.2一般的线性条件分位数回归表示为
QY(α|X=x)=β0(α)+β1(α)x1+β2(α)x2+L+βk(α)xk≡X′β(α)
式中:QY(α|X=x)是因变量Y在自变量X=[x1,x2,L,xk]下的第α个条件分位数,分位点α∈(0,1),β(α)是回归系数向量,它随着分位点α的变化而变动;
5.3条件分位数通过最小化损失函数求解参数向量β(α)的估计值,定义损失函数为
5.4从而分位数回归可以转化为如下最优化问题
给定某个分位点α,通过求解对应的参数向量估计值,即可描述此时的自变量对因变量的影响;继而当α在(0,1)可行区间连续取值时,即可得到Y的条件分布。
进一步地,步骤(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;所述分位数回归森林具体计算过程为:
6.1随机森林被看作是一个适应性近邻分类和回归过程,对每一个X=x,可以得到原始n个观察值一个权重集合wi(x),i=1,2,L,n;随机森林本质是利用所有因变量观测值的加权和作为因变量Y条件均值E(Y|X=x)的估计;另外,QRF决策树是以标准RF算法产生,条件分布是通过观测到的因变量加权估计得到,其中每个观测值的权重等于RF算法权重;
6.2由此,QRF定义E(1{Y≤y}|X=x)的估计为观测值1{Y≤y}的加权平均,即
6.3生成k棵决策树T(θt),t=1,2,L,k;对每棵决策树每个叶节点,考察该叶节点所有观测值;
6.4给定X=x,遍历所有决策树;计算每棵决策树观测值的权重wi(x,θt),i∈{1,2,L,n};通过对决策树权重wi(x,θt),t=1,2,L,k取平均得到每个观测值i∈{1,2,L,n}的权重wi(x);
6.5对所有y∈R,利用步骤6.4得出的权重,即可计算分布函数的估计;对每棵决策树的每个节点,RF回归只保留观测值的均值而忽略了其他信息,而QRF保留节点中所有观测值,并在此基础上计算出条件分布。
进一步地,步骤(7)中采用核密度估计获得风电功率概率密度预测,并通过实测风电功率数据验证本发明方法的有效性;所述核密度估计具体计算过程为:
核密度估计是通过一组观测的来自同一未知分布函数的随机变量来估计其密度函数的非参数计算方法;设X1,X2,L,Xn是取自一元连续总体样本,在任意点x处的总体密度函数f(x)的核密度估计定义为
式中:K(x)为核函数,本文采用的高斯核函数形式为h为带宽系数,取值范围为1.8~2.0。
有益效果:本发明的电力系统短期风电功率概率密度预测方法利用EWT将原始风电功率序列分解为一系列特征互异的经验模式,对每一经验模式选取输入变量并建立分位数回归森林预测模型,获得任意分位数条件下的回归预测结果,进一步获得风电功率概率密度预测。相对于一般的预测方法,本发明方法可以给出任意时刻风电功率概率密度预测结果,从而利于决策者在电网规划运行、风险分析、可靠性评估等方面做出科学有效的决策。
附图说明
图1为傅里叶频谱分割;
图2为原始风电功率序列及EWT分解结果;
图3为经验模式频谱分布;
图4为经验模式重构结果;
图5为原始风电功率序列及EMD分解结果;
图6为EMD分解模态函数重构分量;
图7为80%置信区间概率预测结果;
图8为1:00时刻概率密度预测;
图9为5:00时刻概率密度预测;
图10为9:00时刻概率密度预测;
图11为13:00时刻概率密度预测;
图12为17:00时刻概率密度预测;
图13为21:00时刻概率密度预测。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
为有效提高短期风电功率预测精度,本发明方法采用EWT对原始风电功率进行预处理,将其分解为一系列特征互异的经验模式,对每一经验模式建立预测模型。经验小波本质上是根据信号频谱特性选择的一组带通滤波器,从而自适应地从原始信号中筛选出调幅-调频成分。为了确定带通滤波器的频率范围,首先对信号的Fourier谱进行自适应分割。
结合图1说明EWT自适应分解过程。依据香农准则,定义Fourier支撑为[0,π]并假定将其分割成N个连续部分,令Λn=[wn-1,wn]表示各分割片段边界。其中:n=1,2,L,N,w0=0,wN=π,wn选取为信号Fourier谱相邻两个极大值点之间的中点,显见以每个wn为中心,定义宽度为Tn=2τn的过渡区域,如图中阴影部分所示。在分割区间Λn上,定义经验小波为每个Λn上的带通滤波器,并根据Meyer小波构造方法构造经验小波。Gilles构造的经验小波函数为
经验尺度函数为
式中:τn=γwn;在时,保证了为紧框架。通常,函数β(x)定义为β(x)=x4(35-84x+70x2-20x3)。
从而,原始信号可被重构为
式中:*为卷积运算;为逼近系数;为x(t)的经验小波变换。
经验模式xk(t)按下式定义
标准回归分析是在给定X=x条件下,通过最小化平方误差损失函数获得因变量Y条件均值E(Y|X=x)的估计,但该方法只能提供因变量Y条件分布的单方面信息,忽略了其他信息。此外,当Y的分布为厚尾或者数据中含有奇异值时,回归分析结果稳健性较差。而分位数回归是因变量Y的条件分位数对自变量X进行回归,从而获得所有分位点下回归预测模型。因此,分位数回归相对于普通最小二乘回归更能精确的描述自变量X对因变量Y的变化范围及条件分布形状的影响。
在给定条件X=x下,条件分布函数是Y≤y的累积概率,即
F(y|X=x)=P(Y≤y|X=x) (5)
α分位数Qα(x)为在给定X=x条件下,Y大于等于Qα(x)的累积概率恰好为α,即
Qα(x)=inf{y:F(y|X=x)≥α} (6)
一般的线性条件分位数回归表示为
QY(α|X=x)=β0(α)+β1(α)x1+β2(α)x2+L+βk(α)xk≡X′β(α) (7)
式中:QY(α|X=x)是因变量Y在自变量X=[x1,x2,L,xk]下的第α个条件分位数,分位点α∈(0,1),β(α)是回归系数向量,它随着分位点α的变化而变动。
条件分位数通过最小化损失函数求解参数向量β(α)的估计值,定义损失函数为
从而分位数回归可以转化为如下最优化问题
给定某个分位点α,通过求解对应的参数向量估计值,即可描述此时的自变量对因变量的影响。继而当α在(0,1)可行区间连续取值时,即可得到Y的条件分布。
QRF是Breiman随机森林的改进算法,通过结合分位数回归特性,从而可以提供因变量的全部条件分布信息。QRF作为一种非参数机器学习方法,拥有理论基础,同时被证明具有一致性。
RF被看作是一个适应性近邻分类和回归过程,对每一个X=x,可以得到原始n个观察值一个权重集合wi(x),i=1,2,L,n。RF本质是利用所有因变量观测值的加权和作为因变量Y条件均值E(Y|X=x)的估计。另外,QRF决策树是以标准RF算法产生,条件分布是通过观测到的因变量加权估计得到,其中每个观测值的权重等于RF算法权重。
由此,QRF定义E(1{Y≤y}|X=x)的估计为观测值1{Y≤y}的加权平均,即
QRF算法具体步骤为:
1)生成k棵决策树T(θt),t=1,2,L,k。对每棵决策树每个叶节点,考察该叶节点所有观测值;
2)给定X=x,遍历所有决策树。计算每棵决策树观测值的权重wi(x,θt),i∈{1,2,L,n}。通过对决策树权重wi(x,θt),t=1,2,L,k取平均得到每个观测值i∈{1,2,L,n}的权重wi(x);
3)对所有y∈R,利用步骤2)得出的权重,通过公式(10)计算分布函数的估计。
对每棵决策树的每个节点,RF回归只保留观测值的均值而忽略了其他信息,而QRF保留节点中所有观测值,并在此基础上计算出条件分布。
本发明采用核密度估计方法从条件分布中获得概率密度预测结果。核密度估计是通过一组观测的来自同一未知分布函数的随机变量来估计其密度函数的非参数计算方法。设X1,X2,L,Xn是取自一元连续总体样本,在任意点x处的总体密度函数f(x)的核密度估计定义为
式中:K(x)为核函数,本发明采用的高斯核函数形式为h为带宽系数,取值范围为1.8~2.0。
针对一般风电功率点预测方法难以完全表征功率变化不确定性的缺点,本发明建立了EWT-QRF短期风电功率概率密度预测模型,可以获得任意时刻风电功率波动范围及概率密度输出。首先,采用EWT信号处理技术对原始风电功率序列进行预处理,将其自适应分解为若干频率互异的经验模式。为减少建模任务量,将频率大小相近的经验模式合并为新的分量。其次,对新的分量选取输入变量集合并建立QRF预测模型,得到不同分位点下的风电功率预测结果,并将不同分量预测结果叠加获得预测值的条件分布。最后,采用核密度估计方法输出风电功率概率密度预测。
采用风电场实测风电功率数据作为研究对象,验证本发明方法预测性能。已知数据采样时间间隔为30min,采用EWT方法对原始风电功率序列进行分解,选取部分结果如图2所示。从图中可以看出,EWT将原始风电功率分解为11个经验模式,各个模式频率特征较为明显。图3为各个模式频谱分段边界值,本发明按照频率大小将经验模式分为三类,分别为低频、中频和高频,然后将类中的经验模式进行合并,分别重构为低频分量、中频分量和高频分量。对各分量建立QRF预测模型,从而降低建模工作量,提高效率。图4为各个分量重构结果。
为说明EWT用于风电功率预测的有效性,本发明同时将EMD方法用于功率数据的分解,并对比预测结果。图5和图6分别为EMD分解结果及重构分量。
输入变量的选取对模型预测性能具有直接影响,本发明采用皮尔森相关系数定量评价变量间的相关性,并从待预测时刻的前10个时刻中选取相关性较大的输入变量集合。给定时间序列,皮尔森相关系数衡量了xt与xt-τ间的相关关系,能够有效的确定输入变量集合。其中,τ为滞后阶数。皮尔森相关系数r取值范围为[-1,1],1表示完全正相关,-1表示完全负相关,0表示变量间无相关性。当|r|>0.3时,即认为变量间存在较强相关关系。待预测时刻风电功率与前第τ时刻功率间相关系数计算公式为
式中:xt,i、xt-τ,i分别为变量xt和xt-τ的第i个样本值;分别为变量xt和xt-τ的平均值;N为样本数量。
对EWT和EMD分解的分量选取输入变量集合,结果分别如表1和表2所示。
表1EWT分量输入变量选择结果
表2EMD分量输入变量选择结果
采用平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)作为确定性点预测模型效果评价指标,计算公式分别为
式中:n为预测点个数;yi、分别为第i个预测点功率真实值和预测值。
采用区间覆盖率(interval coverage percentage,ICP)和区间平均宽度(interval average width,IAW)作为概率区间预测模型评价指标,计算公式分别为
式中:ξ1-α为在给定1-α置信度水平下真实功率值落在置信区间内的个数;ui为第i个预测点置信区间上限,li为第i个预测点置信区间下限。
对实测风电功率进行提前30min预测,并验证本发明方法预测性能。
1)直接对原始功率数据进行预测。分位数回归森林参数设置为:决策树数目为500,节点最小尺寸为5,每棵决策树从输入变量集合中随机选取mtry=2M/3个变量进行权重学习,M参照表1选取。为获得条件分布,本发明设置分位点范围为0.01~0.99,步长为0.01,对每个预测点即可获得99个预测结果。同时,本发明建立了BP、支持向量机(supportvector machines,SVM)对比模型。BP学习率为0.001,学习目标为0.01,迭代10000次,模型结构参数经多次试验比较后设置为9-15-1,其中第一个参数为输入层变量个数,隐含层神经元个数为15,输出层神经元个数为1。SVM模型学习参数C和ε通过网格搜索法优化选取,参数范围为[-8,8],迭代步长为1。表3为BP、SVM和QRF模型预测结果,QRF模型取0.5分位点条件下的预测值。可以看出,采用单一预测模型时,预测值落后于真实值变化趋势,存在滞后,导致较大的预测误差。
2)分别采用EMD和EWT方法对原始功率数据进行分解处理,然后对每个分量分别建立预测模型。从表3可以看出组合模型有效提高了预测精度。此外,EWT方法性能表现优于EMD方法,EWT-BP、EWT-SVM、EWT-QRF相对于EMD-BP、EMD-SVM、EMD-QRF模型MAPE指标分别提高了24.97%、13.58%和22.07%,RMSE指标分别提高了27.20%、19.37%和29.63%。其中:EMD-BP模型随机分量、细节分量和趋势分量结构参数依次为4-11-1、8-16-1和10-17-1,EWT-BP模型高频分量、中频分量和低频分量结构参数依次为5-9-1、7-15-1和10-15-1;SVM和QRF参数设置同1)。图7为80%置信水平下功率区间预测结果,EWT-QRF区间宽度更窄,优势明显,从而更有利于科学决策。
表3不同模型风电功率预测结果统计
对QRF、EMD-QRF和EWT-QRF获得的条件分布采用核密度估计可以给出任意时刻风电功率概率密度预测结果,选取一天中不同时刻预测结果如图8-图13所示。可以看出,EWT-QRF模型以较高概率接近真实值,概率密度曲线更瘦高,波动范围更集中,有利于在更窄范围内做出可靠决策。
综上所述,本发明的一种EWT分位数回归森林的短期风电功率概率密度预测方法具有如下优势:1)采用EWT这一新型自适应信号处理方法对原始风电功率序列进行分解处理,将其分解为多个频率特征互异的经验模式。相对于EMD方法,EWT分解的分量更具有解释意义。其次,建立的EWT-QRF预测模型相对于EMD-QRF模型具有更好的预测精度,MAPE指标提高29.31%,RMSE指标提高29.63%。同一置信水平下,区间宽度更窄,有利于做出科学的决策。2)分位数回归森林模型能够给出任意分位点下的预测结果,从而获得预测值条件分布,并进一步获得风电功率概率密度预测。分位数回归森林作为一种非参数估计方法,具有受模型参数影响小、鲁棒性强、计算量较少的优点,适合应用于短期风电功率概率密度预测。
本发明方法对电力系统安排风电日前调度计划及保证电网安全稳定运行具有一定的参考价值。
Claims (7)
1.一种EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:包括以下步骤:
(1)获取电力系统风电功率短期预测所需的基本数据,并对原始数据进行预处理,进行异常值剔除或修正;
(2)采用EWT将经预处理的风电功率序列分解为一系列特征互异的经验模式;
(3)根据频率范围将经验模式进行重新组合,形成高频分量、中频分量和低频分量;
(4)对各分量采用皮尔森相关系数选取输入变量集合;
(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;
(6)将各分量预测结果叠加,得到最终的风电功率预测值;
(7)采用核密度估计获得风电功率概率密度预测,并通过实测风电功率数据验证本发明方法的有效性。
2.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(2)采用EWT技术将原始风电功率序列分解为一系列频率特征互异的经验模式,所述EWT方法具体计算过程为:
2.1确定带通滤波器的频率范围;首先对信号的Fourier谱进行自适应分割,定义Fourier支撑为[0,π]并假定将其分割成N个连续部分,令Λn=[wn-1,wn]表示各分割片段边界;其中:n=1,2,L,N,w0=0,wN=π,wn选取为信号Fourier谱相邻两个极大值点之间的中点,显见
2.2以每个wn为中心,定义宽度为Tn=2τn的过渡区域;
2.3在分割区间Λn上,定义经验小波为每个Λn上的带通滤波器,并根据Meyer小波构造方法构造经验小波,通常构造的经验小波函数为
<mrow>
<msub>
<mover>
<mi>&psi;</mi>
<mo>^</mo>
</mover>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
<mo>&le;</mo>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>&le;</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>&tau;</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>cos</mi>
<mo>&lsqb;</mo>
<mfrac>
<mi>&pi;</mi>
<mn>2</mn>
</mfrac>
<mi>&beta;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>2</mn>
<msub>
<mi>&tau;</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mfrac>
<mo>(</mo>
<mrow>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>w</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>&tau;</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>&le;</mo>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>&le;</mo>
<msub>
<mi>w</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mrow>
<mi>n</mi>
<mo>+</mo>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>sin</mi>
<mo>&lsqb;</mo>
<mfrac>
<mi>&pi;</mi>
<mn>2</mn>
</mfrac>
<mi>&beta;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>2</mn>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
</mfrac>
<mo>(</mo>
<mrow>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
<mo>&le;</mo>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>&le;</mo>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
经验尺度函数为
<mrow>
<msub>
<mover>
<mi>&phi;</mi>
<mo>^</mo>
</mover>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>&le;</mo>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi>c</mi>
<mi>o</mi>
<mi>s</mi>
<mo>&lsqb;</mo>
<mfrac>
<mi>&pi;</mi>
<mn>2</mn>
</mfrac>
<mi>&beta;</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mn>2</mn>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
</mfrac>
<mo>(</mo>
<mrow>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>-</mo>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>-</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
<mo>&le;</mo>
<mrow>
<mo>|</mo>
<mi>w</mi>
<mo>|</mo>
</mrow>
<mo>&le;</mo>
<msub>
<mi>w</mi>
<mi>n</mi>
</msub>
<mo>+</mo>
<msub>
<mi>&tau;</mi>
<mi>n</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>o</mi>
<mi>t</mi>
<mi>h</mi>
<mi>e</mi>
<mi>r</mi>
<mi>w</mi>
<mi>i</mi>
<mi>s</mi>
<mi>e</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
式中:τn=γwn;在时,保证了为紧框架;通常,函数β(x)定义为β(x)=x4(35-84x+70x2-20x3);
2.4从而,原始信号可被重构为
<mrow>
<mi>x</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msubsup>
<mi>W</mi>
<mi>x</mi>
<mi>&epsiv;</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>*</mo>
<msub>
<mi>&phi;</mi>
<mn>1</mn>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msubsup>
<mi>W</mi>
<mi>x</mi>
<mi>&epsiv;</mi>
</msubsup>
<mrow>
<mo>(</mo>
<mi>n</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>*</mo>
<msub>
<mi>&phi;</mi>
<mi>n</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
</mrow>
式中:*为卷积运算;为逼近系数;为x(t)的经验小波变换;
经验模式xk(t)定义为
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<msub>
<mi>x</mi>
<mn>0</mn>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>=</mo>
<msubsup>
<mi>W</mi>
<mi>x</mi>
<mi>&epsiv;</mi>
</msubsup>
<mo>(</mo>
<mn>0</mn>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
<mo>*</mo>
<msub>
<mi>&phi;</mi>
<mn>1</mn>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mtd>
</mtr>
<mtr>
<mtd>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
<mo>=</mo>
<msubsup>
<mi>W</mi>
<mi>x</mi>
<mi>&epsiv;</mi>
</msubsup>
<mo>(</mo>
<mi>n</mi>
<mo>,</mo>
<mi>t</mi>
<mo>)</mo>
<mo>*</mo>
<msub>
<mi>&phi;</mi>
<mi>n</mi>
</msub>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>.</mo>
</mrow>
3.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(3)根据频率范围将经验模式进行重新组合,形成高频分量、中频分量和低频分量,所述频率范围划定方法具体为:将[0,π]频率范围内的经验模式划分为三部分:频率小于1的为低频分量,频率大于1且小于2的为中频分量,频率大于2的即为高频分量。
4.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(4)对各分量采用皮尔森相关系数选取输入变量集合,所述皮尔森相关系数具体计算方法为:
给定时间序列,皮尔森相关系数衡量了xt与xt-τ间的相关关系,能够有效的确定输入变量集合;其中,τ为滞后阶数;皮尔森相关系数r取值范围为[-1,1],1表示完全正相关,-1表示完全负相关,0表示变量间无相关性;当|r|>0.3时,即认为变量间存在较强相关关系;待预测时刻风电功率与前第τ时刻功率间相关系数计算公式为
<mrow>
<mi>r</mi>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>&tau;</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>&tau;</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msqrt>
<mrow>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mi>t</mi>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<mo>&CenterDot;</mo>
<msqrt>
<mrow>
<munderover>
<mi>&Sigma;</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>&tau;</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>t</mi>
<mo>-</mo>
<mi>&tau;</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
</mfrac>
</mrow>
式中:xt,i、xt-τ,i分别为变量xt和xt-τ的第i个样本值;分别为变量xt和xt-τ的平均值;N为样本数量。
5.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;分位数回归森林模型结合了分位数回归与随机森林模型的优势,可以给出不同分位点回归预测结果;作为一种非参数集成机器学习方法,QRF兼具运算速度快、模型性能受参数影响小、较强容噪性等优点;所述分位数回归具体计算过程为:
5.1在给定条件X=x下,条件分布函数是Y≤y的累积概率,即
F(y|X=x)=P(Y≤y|X=x)
α分位数Qα(x)为在给定X=x条件下,Y大于等于Qα(x)的累积概率恰好为α,即
Qα(x)=inf{y:F(y|X=x)≥α}
5.2一般的线性条件分位数回归表示为
QY(α|X=x)=β0(α)+β1(α)x1+β2(α)x2+L+βk(α)xk≡X′β(α)
式中:QY(α|X=x)是因变量Y在自变量X=[x1,x2,L,xk]下的第α个条件分位数,分位点α∈(0,1),β(α)是回归系数向量,它随着分位点α的变化而变动;
5.3条件分位数通过最小化损失函数求解参数向量β(α)的估计值,定义损失函数为
<mrow>
<msub>
<mi>L</mi>
<mi>&alpha;</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>,</mo>
<msup>
<mi>X</mi>
<mo>&prime;</mo>
</msup>
<mi>&beta;</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mi>&alpha;</mi>
<mrow>
<mo>|</mo>
<mrow>
<mi>y</mi>
<mo>-</mo>
<msup>
<mi>X</mi>
<mo>&prime;</mo>
</msup>
<mi>&beta;</mi>
</mrow>
<mo>|</mo>
</mrow>
<mo>,</mo>
<mi>y</mi>
<mo>></mo>
<msup>
<mi>X</mi>
<mo>&prime;</mo>
</msup>
<mi>&beta;</mi>
</mtd>
</mtr>
<mtr>
<mtd>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>&alpha;</mi>
<mo>)</mo>
<mrow>
<mo>|</mo>
<mrow>
<mi>y</mi>
<mo>-</mo>
<msup>
<mi>X</mi>
<mo>&prime;</mo>
</msup>
<mi>&beta;</mi>
</mrow>
<mo>|</mo>
</mrow>
<mo>,</mo>
<mi>y</mi>
<mo>&le;</mo>
<msup>
<mi>X</mi>
<mo>&prime;</mo>
</msup>
<mi>&beta;</mi>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
5.4从而分位数回归可以转化为如下最优化问题
<mrow>
<munder>
<mrow>
<mi>m</mi>
<mi>i</mi>
<mi>n</mi>
</mrow>
<mi>&beta;</mi>
</munder>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>|</mo>
<msub>
<mi>Y</mi>
<mi>i</mi>
</msub>
<mo>&GreaterEqual;</mo>
<msubsup>
<mi>X</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mi>&beta;</mi>
</mrow>
</munder>
<mi>&alpha;</mi>
<mo>|</mo>
<mrow>
<msub>
<mi>Y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msubsup>
<mi>X</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mi>&beta;</mi>
</mrow>
<mo>|</mo>
<mo>+</mo>
<munder>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>|</mo>
<msub>
<mi>Y</mi>
<mi>i</mi>
</msub>
<mo><</mo>
<msubsup>
<mi>X</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mi>&beta;</mi>
</mrow>
</munder>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>&alpha;</mi>
<mo>)</mo>
</mrow>
<mo>|</mo>
<mrow>
<msub>
<mi>Y</mi>
<mi>i</mi>
</msub>
<mo>-</mo>
<msubsup>
<mi>X</mi>
<mi>i</mi>
<mo>&prime;</mo>
</msubsup>
<mi>&beta;</mi>
</mrow>
<mo>|</mo>
</mrow>
给定某个分位点α,通过求解对应的参数向量估计值,即可描述此时的自变量对因变量的影响;继而当α在(0,1)可行区间连续取值时,即可得到Y的条件分布。
6.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(5)对各分量建立分位数回归森林模型,获得不同分位点回归预测结果;所述分位数回归森林具体计算过程为:
6.1随机森林被看作是一个适应性近邻分类和回归过程,对每一个X=x,可以得到原始n个观察值一个权重集合wi(x),i=1,2,L,n;随机森林本质是利用所有因变量观测值的加权和作为因变量Y条件均值E(Y|X=x)的估计;另外,QRF决策树是以标准RF算法产生,条件分布是通过观测到的因变量加权估计得到,其中每个观测值的权重等于RF算法权重;
6.2由此,QRF定义E(1{Y≤y}|X=x)的估计为观测值1{Y≤y}的加权平均,即
<mrow>
<mover>
<mi>F</mi>
<mo>^</mo>
</mover>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>|</mo>
<mi>X</mi>
<mo>=</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>w</mi>
<mi>i</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<msub>
<mn>1</mn>
<mrow>
<mo>{</mo>
<mi>Y</mi>
<mo>&le;</mo>
<mi>y</mi>
<mo>}</mo>
</mrow>
</msub>
</mrow>
6.3生成k棵决策树T(θt),t=1,2,L,k;对每棵决策树每个叶节点,考察该叶节点所有观测值;
6.4给定X=x,遍历所有决策树;计算每棵决策树观测值的权重wi(x,θt),i∈{1,2,L,n};通过对决策树权重wi(x,θt),t=1,2,L,k取平均得到每个观测值i∈{1,2,L,n}的权重wi(x);
6.5对所有y∈R,利用步骤6.4得出的权重,即可计算分布函数的估计;对每棵决策树的每个节点,RF回归只保留观测值的均值而忽略了其他信息,而QRF保留节点中所有观测值,并在此基础上计算出条件分布。
7.根据权利要求1所述的EWT分位数回归森林的短期风电功率概率密度预测方法,其特征在于:步骤(7)中采用核密度估计获得风电功率概率密度预测,并通过实测风电功率数据验证本发明方法的有效性;所述核密度估计具体计算过程为:
核密度估计是通过一组观测的来自同一未知分布函数的随机变量来估计其密度函数的非参数计算方法;设X1,X2,L,Xn是取自一元连续总体样本,在任意点x处的总体密度函数f(x)的核密度估计定义为
<mrow>
<msub>
<mover>
<mi>f</mi>
<mo>^</mo>
</mover>
<mi>h</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mi>n</mi>
<mi>h</mi>
</mrow>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mi>K</mi>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<mi>x</mi>
<mo>-</mo>
<msub>
<mi>X</mi>
<mi>i</mi>
</msub>
</mrow>
<mi>h</mi>
</mfrac>
<mo>)</mo>
</mrow>
</mrow>
式中:K(x)为核函数,本文采用的高斯核函数形式为h为带宽系数,取值范围为1.8~2.0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710850654.7A CN107704953A (zh) | 2017-09-20 | 2017-09-20 | Ewt分位数回归森林的短期风电功率概率密度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710850654.7A CN107704953A (zh) | 2017-09-20 | 2017-09-20 | Ewt分位数回归森林的短期风电功率概率密度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107704953A true CN107704953A (zh) | 2018-02-16 |
Family
ID=61171643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710850654.7A Pending CN107704953A (zh) | 2017-09-20 | 2017-09-20 | Ewt分位数回归森林的短期风电功率概率密度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107704953A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416695A (zh) * | 2018-02-24 | 2018-08-17 | 合肥工业大学 | 基于深度学习的电力负荷概率密度预测方法和系统、介质 |
CN108460501A (zh) * | 2018-05-10 | 2018-08-28 | 湖北工业大学 | 一种基于组合模型的风力电站输出功率预测方法 |
CN108846517A (zh) * | 2018-06-12 | 2018-11-20 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN108984797A (zh) * | 2018-08-20 | 2018-12-11 | 新疆工程学院 | 一种海量监测型长时间序列数据相关系数的快速估计方法 |
CN109085481A (zh) * | 2018-10-23 | 2018-12-25 | 国网江苏省电力有限公司徐州供电分公司 | 一种基于ewt的电缆局部放电定位方法 |
CN109086793A (zh) * | 2018-06-27 | 2018-12-25 | 东北大学 | 一种风力发电机的异常识别方法 |
CN109101390A (zh) * | 2018-06-29 | 2018-12-28 | 平安科技(深圳)有限公司 | 基于高斯分布的定时任务异常监控方法、电子装置及介质 |
CN109117992A (zh) * | 2018-07-27 | 2019-01-01 | 华北电力大学 | 基于wd-la-wrf模型的超短期风功率预测方法 |
CN109597967A (zh) * | 2018-11-20 | 2019-04-09 | 江苏云上电力科技有限公司 | 一种电力系统配变电站负荷数据异常检测与修复方法 |
CN110796303A (zh) * | 2019-10-24 | 2020-02-14 | 国网安徽省电力有限公司电力科学研究院 | 一种基于ewt和odbscan的短期电力负荷预测方法 |
CN111612262A (zh) * | 2020-01-15 | 2020-09-01 | 长沙理工大学 | 一种基于分位数回归的风电功率概率预测方法 |
CN112183848A (zh) * | 2020-09-25 | 2021-01-05 | 合肥工业大学 | 基于dwt-svqr集成的电力负荷概率预测方法 |
CN112561414A (zh) * | 2019-09-25 | 2021-03-26 | 顺丰科技有限公司 | 库存管理方法、装置及计算机可读存储介质 |
CN112926801A (zh) * | 2021-03-31 | 2021-06-08 | 云南电网有限责任公司 | 一种基于分位数回归的负荷曲线组合预测方法及装置 |
CN113205223A (zh) * | 2021-05-17 | 2021-08-03 | 上海电力大学 | 一种电量预测系统及其预测方法 |
CN113258565A (zh) * | 2021-05-11 | 2021-08-13 | 广东电网有限责任公司韶关供电局 | 一种频率调节方法、装置、设备和存储介质 |
CN113469467A (zh) * | 2021-09-02 | 2021-10-01 | 国能日新科技股份有限公司 | 基于带通滤波的风电超短期预测方法及装置 |
CN113536584A (zh) * | 2021-07-23 | 2021-10-22 | 河北工业大学 | 基于概率模型与多时间窗自相关校验的风速逆向生成方法 |
CN114548464A (zh) * | 2020-11-19 | 2022-05-27 | 国网湖南省电力有限公司 | 基于小波变换的风电功率置信区间预测方法、装置及介质 |
CN115409296A (zh) * | 2022-11-02 | 2022-11-29 | 国网江西省电力有限公司电力科学研究院 | 一种有源配电网净负荷概率预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106067073A (zh) * | 2016-05-30 | 2016-11-02 | 都城绿色能源有限公司 | 一种基于风资源相关性分析的风电功率预测方法 |
CN106295899A (zh) * | 2016-08-17 | 2017-01-04 | 合肥工业大学 | 基于遗传算法与支持向量分位数回归的风电功率概率密度预测方法 |
CN106548253A (zh) * | 2016-11-08 | 2017-03-29 | 中国地质大学(武汉) | 基于非参数核密度估计的风电功率预测的方法 |
CN106846173A (zh) * | 2016-12-30 | 2017-06-13 | 国网新疆电力公司电力科学研究院 | 基于ewt‑esn的短期风电功率预测方法 |
-
2017
- 2017-09-20 CN CN201710850654.7A patent/CN107704953A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106067073A (zh) * | 2016-05-30 | 2016-11-02 | 都城绿色能源有限公司 | 一种基于风资源相关性分析的风电功率预测方法 |
CN106295899A (zh) * | 2016-08-17 | 2017-01-04 | 合肥工业大学 | 基于遗传算法与支持向量分位数回归的风电功率概率密度预测方法 |
CN106548253A (zh) * | 2016-11-08 | 2017-03-29 | 中国地质大学(武汉) | 基于非参数核密度估计的风电功率预测的方法 |
CN106846173A (zh) * | 2016-12-30 | 2017-06-13 | 国网新疆电力公司电力科学研究院 | 基于ewt‑esn的短期风电功率预测方法 |
Non-Patent Citations (6)
Title |
---|
BENJAMIN VOLZ 等: "Predicting pedestrian crossing using Quantile Regression forests", 《2016 IEEE INTELLIGENT VEHICLES SYMPOSIUM (IV)》 * |
HAIXIANG ZANG 等: "Short-term wind speed forecasting based on an EEMD-CAPSO-RVM model", 《2016 IEEE PES ASIA-PACIFIC POWER AND ENERGY ENGINEERING CONFERENCE (APPEEC)》 * |
JIANMING HU 等: "Short-term wind speed prediction using empirical wavelet transform and Gaussian process regression", 《ENERGY》 * |
NICOLAI MEINSHAUSEN 等: "Quantile Regression Forests", 《JOURNAL OF MACHINE LEARNING RESEARCH》 * |
YAO ZHANG 等: "Review on probabilistic forecasting of wind power generation", 《RENEWABLE AND SUSTAINABLE ENERGY REVIEWS》 * |
何耀耀 等: "基于RBF神经网络分位数回归的电力负荷概率密度预测方法", 《中国电机工程学报》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416695B (zh) * | 2018-02-24 | 2020-07-07 | 合肥工业大学 | 基于深度学习的电力负荷概率密度预测方法和系统、介质 |
CN108416695A (zh) * | 2018-02-24 | 2018-08-17 | 合肥工业大学 | 基于深度学习的电力负荷概率密度预测方法和系统、介质 |
CN108460501A (zh) * | 2018-05-10 | 2018-08-28 | 湖北工业大学 | 一种基于组合模型的风力电站输出功率预测方法 |
CN108460501B (zh) * | 2018-05-10 | 2021-09-14 | 湖北工业大学 | 一种基于组合模型的风力电站输出功率预测方法 |
CN108846517A (zh) * | 2018-06-12 | 2018-11-20 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN108846517B (zh) * | 2018-06-12 | 2021-03-16 | 清华大学 | 一种分位数概率性短期电力负荷预测集成方法 |
CN109086793B (zh) * | 2018-06-27 | 2021-11-16 | 东北大学 | 一种风力发电机的异常识别方法 |
CN109086793A (zh) * | 2018-06-27 | 2018-12-25 | 东北大学 | 一种风力发电机的异常识别方法 |
CN109101390B (zh) * | 2018-06-29 | 2021-08-24 | 平安科技(深圳)有限公司 | 基于高斯分布的定时任务异常监控方法、电子装置及介质 |
CN109101390A (zh) * | 2018-06-29 | 2018-12-28 | 平安科技(深圳)有限公司 | 基于高斯分布的定时任务异常监控方法、电子装置及介质 |
CN109117992B (zh) * | 2018-07-27 | 2022-01-04 | 华北电力大学 | 基于wd-la-wrf模型的超短期风功率预测方法 |
CN109117992A (zh) * | 2018-07-27 | 2019-01-01 | 华北电力大学 | 基于wd-la-wrf模型的超短期风功率预测方法 |
CN108984797A (zh) * | 2018-08-20 | 2018-12-11 | 新疆工程学院 | 一种海量监测型长时间序列数据相关系数的快速估计方法 |
CN109085481B (zh) * | 2018-10-23 | 2021-11-26 | 国网江苏省电力有限公司徐州供电分公司 | 一种基于ewt的电缆局部放电定位方法 |
CN109085481A (zh) * | 2018-10-23 | 2018-12-25 | 国网江苏省电力有限公司徐州供电分公司 | 一种基于ewt的电缆局部放电定位方法 |
CN109597967B (zh) * | 2018-11-20 | 2023-08-25 | 江苏云上电力科技有限公司 | 一种电力系统配变电站负荷数据异常检测与修复方法 |
CN109597967A (zh) * | 2018-11-20 | 2019-04-09 | 江苏云上电力科技有限公司 | 一种电力系统配变电站负荷数据异常检测与修复方法 |
CN112561414A (zh) * | 2019-09-25 | 2021-03-26 | 顺丰科技有限公司 | 库存管理方法、装置及计算机可读存储介质 |
CN110796303B (zh) * | 2019-10-24 | 2023-11-07 | 国网安徽省电力有限公司电力科学研究院 | 一种基于ewt和odbscan的短期电力负荷预测方法 |
CN110796303A (zh) * | 2019-10-24 | 2020-02-14 | 国网安徽省电力有限公司电力科学研究院 | 一种基于ewt和odbscan的短期电力负荷预测方法 |
CN111612262A (zh) * | 2020-01-15 | 2020-09-01 | 长沙理工大学 | 一种基于分位数回归的风电功率概率预测方法 |
CN112183848B (zh) * | 2020-09-25 | 2022-08-30 | 合肥工业大学 | 基于dwt-svqr集成的电力负荷概率预测方法 |
CN112183848A (zh) * | 2020-09-25 | 2021-01-05 | 合肥工业大学 | 基于dwt-svqr集成的电力负荷概率预测方法 |
CN114548464A (zh) * | 2020-11-19 | 2022-05-27 | 国网湖南省电力有限公司 | 基于小波变换的风电功率置信区间预测方法、装置及介质 |
CN112926801A (zh) * | 2021-03-31 | 2021-06-08 | 云南电网有限责任公司 | 一种基于分位数回归的负荷曲线组合预测方法及装置 |
CN112926801B (zh) * | 2021-03-31 | 2022-11-01 | 云南电网有限责任公司 | 一种基于分位数回归的负荷曲线组合预测方法及装置 |
CN113258565A (zh) * | 2021-05-11 | 2021-08-13 | 广东电网有限责任公司韶关供电局 | 一种频率调节方法、装置、设备和存储介质 |
CN113205223A (zh) * | 2021-05-17 | 2021-08-03 | 上海电力大学 | 一种电量预测系统及其预测方法 |
CN113536584A (zh) * | 2021-07-23 | 2021-10-22 | 河北工业大学 | 基于概率模型与多时间窗自相关校验的风速逆向生成方法 |
CN113469467B (zh) * | 2021-09-02 | 2021-11-30 | 国能日新科技股份有限公司 | 基于带通滤波的风电超短期预测方法及装置 |
CN113469467A (zh) * | 2021-09-02 | 2021-10-01 | 国能日新科技股份有限公司 | 基于带通滤波的风电超短期预测方法及装置 |
CN115409296A (zh) * | 2022-11-02 | 2022-11-29 | 国网江西省电力有限公司电力科学研究院 | 一种有源配电网净负荷概率预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704953A (zh) | Ewt分位数回归森林的短期风电功率概率密度预测方法 | |
Dong et al. | Hourly energy consumption prediction of an office building based on ensemble learning and energy consumption pattern classification | |
Tascikaraoglu et al. | A review of combined approaches for prediction of short-term wind speed and power | |
Wang et al. | A combined framework based on data preprocessing, neural networks and multi-tracker optimizer for wind speed prediction | |
De Giorgi et al. | Assessment of the benefits of numerical weather predictions in wind power forecasting based on statistical methods | |
CN103729550B (zh) | 基于传播时间聚类分析的多模型集成洪水预报方法 | |
Wang et al. | Wind speed deterministic forecasting and probabilistic interval forecasting approach based on deep learning, modified tunicate swarm algorithm, and quantile regression | |
CN108038580A (zh) | 基于同步挤压小波变换的光伏功率多模型综合预测方法 | |
Mestav et al. | State estimation for unobservable distribution systems via deep neural networks | |
Zhou et al. | Short-term wind power prediction optimized by multi-objective dragonfly algorithm based on variational mode decomposition | |
CN106846173A (zh) | 基于ewt‑esn的短期风电功率预测方法 | |
CN103258142A (zh) | 基于天气模式的风电场短期风速预测方法 | |
CN107301475A (zh) | 基于连续功率谱分析的电力负荷预测优化方法 | |
Tan et al. | A multi-task learning method for multi-energy load forecasting based on synthesis correlation analysis and load participation factor | |
Ismail et al. | A hybrid model of self organizing maps and least square support vector machine for river flow forecasting | |
CN107844849A (zh) | 一种基于经验小波变换与改进高斯过程回归的新能源出力短期预测方法 | |
CN103235984B (zh) | 风电场出力的纵向时刻概率分布计算方法 | |
CN105005708B (zh) | 一种基于ap聚类算法的广义负荷特性聚类方法 | |
CN107169612A (zh) | 基于神经网络的风电机有功功率预测及误差订正方法 | |
CN102509026A (zh) | 基于最大信息熵原理的风电场短期输出功率预测综合模型 | |
CN106897794A (zh) | 一种基于完备总体经验模态分解和极限学习机的风速预测方法 | |
CN105069236A (zh) | 考虑风电场节点空间相关性的广义负荷联合概率建模方法 | |
Qu et al. | Research on short‐term output power forecast model of wind farm based on neural network combination algorithm | |
Xu et al. | Interval prediction method for wind power based on VMD-ELM/ARIMA-ADKDE | |
CN110796303A (zh) | 一种基于ewt和odbscan的短期电力负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180216 |