CN103020485B - 基于beta噪声核岭回归技术的短期风速预报方法 - Google Patents

基于beta噪声核岭回归技术的短期风速预报方法 Download PDF

Info

Publication number
CN103020485B
CN103020485B CN201310006821.1A CN201310006821A CN103020485B CN 103020485 B CN103020485 B CN 103020485B CN 201310006821 A CN201310006821 A CN 201310006821A CN 103020485 B CN103020485 B CN 103020485B
Authority
CN
China
Prior art keywords
alpha
ridge regression
sigma
beta
wind speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310006821.1A
Other languages
English (en)
Other versions
CN103020485A (zh
Inventor
胡清华
张仕光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Wei Ersike Automation Technology Co. Ltd.
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201310006821.1A priority Critical patent/CN103020485B/zh
Publication of CN103020485A publication Critical patent/CN103020485A/zh
Application granted granted Critical
Publication of CN103020485B publication Critical patent/CN103020485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及天气预报技术领域。为满足实际应用中(如风力发电、农业生产等)对短期风速预报的要求,为达到上述目的,本发明采取的技术方案是,基于beta噪声核岭回归技术的短期风速预报方法,包括如下步骤:通过最大似然估计导出基于beta噪声模型的损失函数,在此基础上构造基于beta噪声模型的核岭回归机,最后利用基于beta噪声模型的核岭回归技术得到短期风速预报。本发明主要应用于天气预报。

Description

基于beta噪声核岭回归技术的短期风速预报方法
技术领域
本发明涉及天气预报技术领域,具体讲,涉及基于beta噪声核岭回归技术的短期风速预报方法。
背景技术
对于线性系统而言,从Gauss时代起,就利用最小二乘法把平面上的点拟合成直线,把高维空间的点拟合成超平面。经历了100多年的发展,经典最小二乘法已经成为许多领域数据处理的最广泛使用的方法。但是,对于线性回归中的不适定问题,基于最小二乘法的线性回归的性能可能变得很坏,针对这种情况,众多学者研究了最小二乘回归的改进问题,提出了许多新的回归算法。岭回归(Ridgeregression,简记为RR)就是其中之一,岭回归分析是一种专门用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的耐受性远远强于最小二乘法。岭回归算法自A.E.Hoerl和R.W.Kennard于1962年提出以来,就得到了广泛的关注,它成功应用于科学技术和社会科学等各个方面。设给定数据:
Dl={(x1,y1),(x2,y2),...,(xl,yl)}(1)
其中xi∈Rn,yi∈R,i=1,2,...,l,多元线性回归模型为f(x)=ωT·x+b,其中x=(x1,x2,...,xl)T,参数向量ω∈Rn决定最小二乘回归和岭回归模型,其中,xi∈Χ=Rn,Rn表示n维欧式空间,R表示实数集,l表示样本个数,上标T表示转置。通过最小化目标函数:
g L R = Σ i = 1 l ( y i - ω T · x i - b ) 2 - - - ( 2 )
g R R = 1 2 ω T ω + C Σ i = 1 l ( y i - ω T · x i - b ) 2 - - - ( 3 )
其中C>0是惩罚因子。目标函数(2)、(3)中假设样本噪声服从Gauss分布,其均值为0,方差为σ2,即yi=f(xi)+ξi,i=1,...,l,ξi~N(0,σ2)。(2)中的gLR表示线性回归模型的目标函数;式(3)中的gRR表示岭回归模型的目标函数。
最小二乘回归和岭回归在解决线性回归问题中取得了良好的效果,但对于非线性回归问题往往无能为力。1998年,C.Saunders等提出的基于Gauss噪声模型的核岭回归,是通过核技巧构造合适的核变换Φ:Rn→H(H为Hilbert空间),通过Hilbert空间中的內积运算引进非线性核函数K(xi,xj)=(Φ(xi)·Φ(xj)),从而把非线性问题转化为线性问题来解决。一般地,基于Gauss噪声的核岭回归通过最小化目标函数来求解:
g K R R = 1 2 ω T ω + C Σ i = 1 l ( y i - ω T · Φ ( x i ) - b ) 2 - - - ( 4 )
当噪声服从Gauss分布时,基于Gauss噪声的岭回归(RidgeregressionbasedontheGauss-noise,简记为GN-RR)和基于Gauss噪声的核岭回归(KernelridgeregressionbasedontheGauss-noise,简记为GN-KRR)能够取得理想的效果。然而对于像风速预报的噪声却不服从Gauss分布,它们服从beta分布。此时应用GN-RR和GN-KRR进行预测,则预报结果不能满足实际需要。
发明内容
本发明旨在克服现有技术的不足,满足实际应用中(如风力发电、农业生产等)对短期风速预报的要求,为达到上述目的,本发明采取的技术方案是,基于beta噪声核岭回归技术的短期风速预报方法,包括如下步骤:通过最大似然估计导出基于beta噪声模型的损失函数,在此基础上构造基于beta噪声模型的核岭回归机,最后利用基于beta噪声模型的核岭回归技术得到短期风速预报;应用基于beta噪声模型的核岭回归技术进行短期风速预报主要通过以下几个步骤来实现:
1.设给定具有beta噪声影响的数据集Dl={(x1,y1),(x2,y2),...,(xl,yl)},其中xi∈Χ=Rn,yi∈R,i=1,2,...,l,Rn表示n维欧式空间,R表示实数集,l表示样本个数;求取最优损失函数;
2.利用遗传算法确定参数C、m、n;选取最优核函数K(·,·),m、n为Beta噪声模型的损失函数中的参数,由噪声分布的期望μ和方差σ2确定,即m=(1-μ)·μ22-μ,n=1-μ/μ·m;
3.构造并求解最优化问题
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 5 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C , C>0是惩罚因子,st.为subjectto的缩写,表示基于beta噪声模型核岭回归对偶问题的目标函数;
得到最优解α=(α12,...,αl),α1、α2、...,αl为拉格朗日乘子;
4.构造回归函数
f ( x ) = ω T · Φ ( x ) + b = Σ i = 1 l α i K ( x i , x ) + b - - - ( 6 )
其中Φ:Rn→H为核变换,H为Hilbert空间,K(xi,xj)=(Φ(xi)·Φ(xj)),ω∈Rn为参数向量,(Φ(xi)·Φ(xj))表示H空间中的内积。
求取最优损失函数是,利用数据集Dl估计函数f(x),通过极大化似然函数的方法来得到最优损失函数:
c(x,y,f(x))=-logp(y-f(x))(7)
其中,p(y-f(x))=p(ξ)表示误差ξ的概率密度函数,c(xi,yi,f(xi))=c(ξi)表示在样本点(xi,yi)进行预测时所得到预测值f(xi)与yi比较所产生的损失,c(ξ)表示损失函数。得beta噪声模型的损失函数为:
c(ξi)=c(yi-f(xi))=(1-m)logξi+(1-n)log(1-ξi)(8)。
利用遗传算法确定参数C、m、n具体为:利用遗传算法确定基于beta噪声模型的核岭回归机的参数C、m、n.提出的基于beta噪声模型的核岭回归机应用Matlab7.1程序语言实现,取初始参数是Max_cgen=100,BN-KRR的参数C∈[1,201],m,n∈(0,+∞)。
选取最优核函数K(·,·)是利用核技巧构造核函数K(·,·),把基于beta噪声模型的线性岭回归机推广为beta噪声模型的非线性岭回归机;其中K(xi,xj)=(Φ(xi)·Φ(xj)),Φ:Rn→H,H为Hilbert空间,(xi·xj)为H空间中的内积;
(1)多项式核函数:K(xi,xj)=((xi·xj)+1)d是正整数;
(2)Gauss径向基核函数:K(xi,xj)=exp(-||xi-xj||22)。
其中d是正数,取d=2或3;σ是正数,取σ=0.2。
构造并求解最优化问题进一步具体为:
基于beta噪声的核岭回归的原问题为:
g P B N - K R R = 1 2 ω T · ω + C Σ i = 1 l ( ( 1 - m ) logξ i + ( 1 - n ) log ( 1 - ξ i ) ) - - - ( 9 )
其中ξi=yiT·Φ(xi)-b,i=1,...,l,式中的PBN-KRR表示基于beta噪声的核岭回归的原问题,表示基于beta噪声模型核岭回归原问题的目标函数。
通过构造Lagrange泛函
L ( ω , b , α , ξ ) = 1 2 ω T ω + C Σ i = l c ( ξ i ) + Σ i = 1 l α i ( y i - ω T · Φ ( x i ) - b - ξ i )
可得到基于beta噪声模型核岭回归原问题(5)的对偶问题(简记为BN-KRR)为:
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 10 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C .
在构造回归函数后,将基于beta噪声模型的核岭回归技术应用于短期风速预报中.用输入向量分别预报分析某一时刻i以后的短期风速,x1+1表示某一时刻i以后10分钟的风速,xi+18表示某一时刻i以后180分钟的风速。
本发明的技术特点及效果:
本发明提出一种应用基于beta噪声模型的核岭回归技术进行短期风速预报分析的一般理论。利用最优化理论和beta噪声损失函数(8)构造的具有较高稳定性和鲁棒性的一种核岭回归机,能够满足实际应用中(如风力发电、农业生产等)对短期风速预报的要求;
在短期风速预报中,基于beta噪声模型的核岭回归技术的预报效果相比基于Gauss噪声模型的岭回归技术、基于Gauss噪声模型的核岭回归技术而言,表现出了更好的性能。
附图说明
图1betapdf和Gausspdf。
图2beta噪声和Gauss噪声的损失函数。
图3预报结果GN-RR(C=151,step=1)。
图4预报结果GN-KRR(C=151,step=1)。
图5预报结果BN-KRR(C=81,m=0.3,n=0.1,step=1)。
图6预报结果GN-RR(C=151,step=3)。
图7预报结果GN-KRR(C=151,step=3)。
图8预报结果BN-KRR(C=81,m=0.3,n=0.1,step=3)。
图9预报结果GN-RR(C=151,step=6)。
图10预报结果GN-KRR(C=151,step=6)。
图11预报结果BN-KRR(C=81,m=0.3,n=0.1,step=6)。
图12基于beta噪声核岭回归技术的短期风速预报方法总体流程图。
具体实施方式
本发明基于beta噪声核岭回归(Kernelridgeregressionbasedonthebeta-noise,简记为BN-KRR)技术的短期风速预报方法,是以最优化理论和统计学习理论为基础,通过最大似然估计导出基于beta噪声模型的损失函数,在此基础上构造基于beta噪声模型的核岭回归机,最后利用基于beta噪声模型的核岭回归技术得到短期风速预报。
提出了基于beta噪声模型的核岭回归技术。基于beta噪声的核岭回归的原问题:
m i n { g P N - K R R = 1 2 ω T · ω + C Σ i = 1 1 ( ( 1 - m ) logξ i + ( 1 - n ) l o g ( 1 - ξ i ) ) } - - - ( 11 )
其中ξi=yiT·Φ(xi)-b,i=1,...,l。
可证得基于beta噪声的核岭回归原问题(5)关于ω的解存在且唯一。通过构造Lagrange泛函:
L ( ω , b , α , ξ ) = 1 2 ω T ω + C Σ i = l c ( ξ i ) + Σ i = 1 l α i ( y i - ω T · Φ ( x i ) - b - ξ i )
可得基于beta噪声的核岭回归原问题(5)的对偶问题(简记为BN-KRR)为:
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 12 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C . 且有
ω = Σ i = 1 l α i Φ ( x i ) , b = y i - Σ j = 1 l α j K ( x j , x i ) - ξ i ( α i ) .
则可得到基于beta噪声核岭回归的回归函数为:
f ( x ) = ω T · Φ ( x ) + b = Σ i = 1 l α i K ( x i , x ) + b .
Φ:Rn→H(H为Hilbert空间)为核变换,K(xi,xj)=(Φ(xi)·Φ(xj)),ω∈Rn为参数向量,
b = y i - Σ j = 1 l α j K ( x j , x i ) - ξ i ( α i ) .
本发明目的是应用基于beta噪声模型的核岭回归技术进行短期风速预报。
由于各种原因,现实世界中的数据都受到噪声影响,因此基于噪声数据的机器学习模型具有重要的应用价值。当噪声服从Gauss分布时,基于Gauss噪声的核岭回归能够取得理想的效果。然而对于像风速预报的噪声、气象预报(如雨量、温度等)的噪声却不服从Gauss分布。S.Bofinger等发现风速预报的噪声并不服从Gauss分布,通过实验结果显示风速预报的噪声服从beta分布。A.Fabbri等研究了当预测值xp和测量值xm间的误差ε服从beta分布时,ε的概率密度函数(probabilitydistributionfunction,简记为pdf)为f(x)=xm-1·(1-x)n-1·h(图1),其中m,n是参数,由噪声分布的期望和方差确定,m=(1-μ)·μ22-μ,n=1-μ/μ·m,h是归一化因子,h=Γ(m+n)/Γ(m)·Γ(n)。
给定具有beta噪声影响的数据Dl,假设是加性噪声,即yi=fi(xi)+ξi(i=1,...,l)且ξi是独立同分布(i.i.d.)的随机变量。一般地,回归函数f(x)是未知的,利用数据集Dl估计函数f(x),通过极大化似然函数的方法来得到最优损失函数:
c(x,y,f(x))=-logp(y-f(x))(13)
极大似然估计为:
Xf=:{(x1,f(x1)),(x2,f(x2)),...,(xl,f(xl))}(14)
p ( X f | X ) = Π i = 1 l p ( f ( x i ) | ( x i , y i ) ) = Π i = 1 l p ( y i - f ( x i ) ) - - - ( 15 )
最大化p(Xf|X)等价于最小化-logp(Xf|X),由(15)式得:
-logp(Xf|X)=c(x,y,f(x))(16)
从而得Beta噪声模型的损失函数为(图2):
c(ξi)=c(yi-f(xi))=(1-m)logξi+(1-n)log(1-ξi)(17)
当噪声服从beta分布时,应用GN-KRR进行预测,则预报结果不能满足实际要求。为了解决上述问题,我们利用最优化理论和beta噪声损失函数(17),提出了基于beta噪声模型的核岭回归技术(BN-KRR),并成功应用于短期风速预报中,取得了良好的效果。
本发明提出一种应用基于beta噪声模型的核岭回归技术(BN-KRR)进行短期风速预报分析的一般理论。利用最优化理论和beta噪声损失函数(17)构造的具有较高稳定性和鲁棒性的一种核岭回归机,能够满足实际应用中(如风力发电、农业生产等)对短期风速预报的要求。应用基于beta噪声模型的核岭回归技术进行短期风速预报主要通过以下几个步骤来实现:
1.设数据集Dl={(x1,y1),(x2,y2),...,(xl,yl)},其中xi∈Χ=Rn,yi∈R,i=1,2,...,l。
2.利用遗传算法确定参数C、m、n;选取最优核函数K(·,·)。
3.构造并求解最优化问题
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 18 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C , C>0是惩罚因子。得到最优解α=(α12,...,αl)。m、n为Beta噪声模型的损失函数中的参数,由噪声分布的期望μ和方差σ2确定,即m=(1-μ)·μ22-μ,n=1-μ/μ·m,15.式(12)、(18)中αi(i=1,2...,l)为拉格朗日乘子,即为对偶问题(12)中的自变量。
4.构造回归函数
f ( x ) = ω T · Φ ( x ) + b = Σ i = 1 l α i K ( x i , x ) + b - - - ( 19 )
其中 b = y i - Σ j = 1 l α j K ( x j , x i ) - ξ i ( α i ) , x = ( x 1 , x 2 , ... , x l ) T , yi∈Dl,i=1,2,...,l,上标T表示转置。
在短期风速预报中,基于beta噪声模型的核岭回归技术的预报效果相比基于Gauss噪声模型的岭回归技术、基于Gauss噪声模型的核岭回归技术而言,表现出了更好的性能。
风速预报误差的评价,一般地用两个时间序列中基于预测值xp和测量值xm间的相似度来度量,即
εi=xp,i-xm,i,i=1,...,l
最常用的评价误差度量的指标是平均值绝对误差(themeanabsoluteerror,简记为MAE):
M A E = 1 l Σ i = 1 1 | x p , i - x m , i | - - - ( 20 )
相对平均值绝对误差(themeanabsolutepercentageerror,简记为MAPE):
M A P E = 1 l Σ i = 1 1 | x p , i - x m , i | x m , i - - - ( 21 )
根平方值法(therootmeansquareerror,简记为RMSE)是预测误差中应用比较广泛的方法,RMSE在两个时间序列中基于预测值xp和测量值xm定义为:
R M S E = ( 1 l Σ i = 1 l ( x p , i - x m , i ) 2 ) 1 2 - - - ( 22 )
xp,i、xm,i分别表示时间序列中第i个预测值与测量值。用平均值绝对误差、相对平均值绝对误差、根平方值误差对基于Gauss噪声模型的岭回归技术(简记为GN-RR)、基于Gauss噪声模型的核岭回归技术(简记为GN-KRR)、基于beta噪声模型的核岭回归技术(简记为BN-KRR)等三种噪声模型进行了评价。
在风速数据时间序列集Dl中,其中的样本是每10分钟测量一次,共收集有62466个样本,Dl各列属性分别包括均值、方差、最小值、最大值等多个因子。我们取训练样本2160个(从1至2160,即15天的样本),测试样本720个(从2161至2880,即5天的样本)进行了实验分析。输入向量为i=1,...,2880,输出值为xi+18+step,其中step=1,3,6。即用样本分别预报某一时刻xi+18以后10分钟、30分钟、60分钟的风速,其中i=1,...,2880。
1.时刻xi+18以后10分钟的风速预报结果
应用GN-RR、GN-KRR和BN-KRR进行预报某一时刻xi+18以后10分钟的短期风速预报结果如图3-5所示。
利用指标MAE、MAPE和RMSE评价三种模型的预报结果如表1.
表.1:三种模型的短期风速预报的误差统计(测试样本720)
2.时刻xi+18以后30分钟的风速预报结果
应用GN-RR、GN-KRR和BN-KRR进行预报某一时刻xi+18以后30分钟的短期风速预报结果如图6-8所示。
利用指标MAE、MAPE和RMSE评价三种模型的预报结果如表2.
表.2:三种模型的短期风速预报的误差统计(测试样本720)
3.时刻xi+18以后60分钟的风速预报结果
应用GN-RR、GN-KRR和BN-KRR进行预报某一时刻xi+18以后60分钟的短期风速预报结果如图9-11所示。
利用指标MAE、MAPE和RMSE评价三种模型的预报结果如表3.
表.3:三种模型的短期风速预报的误差统计(测试样本720)
评论:应用GN-RR、GN-KRR和BN-KRR进行预报某一时刻xi+18以后10分钟、30分钟、60分钟的短期风速预报的实验结果说明,BN-KRR的预报结果比GN-RR、GN-KRR的效果更好。
下面结合附图和具体实施方式进一步详细说明本发明。
1.计算噪声样本的损失函数
设给定具有beta噪声影响的数据集Dl={(x1,y1),(x2,y2),...,(xl,yl)},其中xi∈Χ=Rn,yi∈R,i=1,2,...,l.利用数据集g∈Dl估计函数f(x),通过极大化似然函数的方法来得到最优损失函数:
c(x,y,f(x))=-logp(y-f(x))(23)
得Beta噪声模型的损失函数为:
c(ξi)=c(yi-f(xi))=(1-m)logξi+(1-n)log(1-ξi)(24)
2.利用遗传算法确定参数C、m、n。
遗传算法(GeneticAlgorithm,简记为GA)是一类借鉴生物界的进化规律演化而来的随机化搜索方法。它是由美国的J.Holland教授1975年首先提出,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则.遗传算法的这些性质,已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域,它是现代有关智能计算中的关键技术。
对于一个求函数最小值的优化问题(求函数最大值也类似),一般可以描述为下列数学规划模型:
{ min f ( x ) x ∈ R ⋐ U - - - ( 25 )
式中x为决策变量,f(x)为目标函数式,式为约束条件,U是基本空间,R是U的子集。满足约束条件的解X称为可行解,集合R表示所有满足约束条件的解所组成的集合,称为可行解集合。式(13)、(17)、(23)、(24)c(x,y,f(x))=-logp(y-f(x))中的x与式(25) min f ( x ) x ∈ R ⋐ U 中的x的含义相同,x=(x1,x2,...,xl)Ty=(y1,y2,...,yl)T,xi,yi∈Dl,i=1,2,...,l,上标T表示转置。p(y-f(x))=p(ξ)表示误差ξ的概率密度函数。c(xi,yi,f(xi))=c(ξi)表示在样本点(xi,yi)进行预测时所得到预测值f(xi)与yi比较所产生的损失,c(ξ)表示损失函数。
利用遗传算法确定基于beta噪声模型的核岭回归机的参数C、m、n.提出的基于beta噪声模型的核岭回归机应用Matlab7.1程序语言实现,取初始参数是Max_cgen=100,BN-KRR的参数C∈[1,201],m,n∈(0,+∞)。
3.选取合适的核函数K(·,·).
利用核技巧构造核函数K(·,·),把基于beta噪声模型的线性岭回归机推广为beta噪声模型的非线性岭回归机。其中K(xi,xj)=(Φ(xi)·Φ(xj)),Φ:Rn→H,H为Hilbert空间,(xi·xj)为H空间中的内积。
多项式核函数和Gauss径向基核函数在诸多实际应用中具有较强的鲁棒性和稳定的性能,且容易操作实施。
(1)多项式核函数:K(xi,xj)=((xi·xj)+1)d是正整数。
(2)Gauss径向基核函数:K(xi,xj)=exp(-||xi-xj||22)。
其中d是正数,取d=2或3;σ是正数,取σ=0.2。
4.构造并求解最优化问题.
基于beta噪声的核岭回归的原问题为:
g P B N - K R R = 1 2 ω T · ω + C Σ i = 1 l ( ( 1 - m ) logξ i + ( 1 - n ) l o g ( 1 - ξ i ) ) - - - ( 26 )
其中ξi=yiT·Φ(xi)-b,i=1,...,l。
式中的PBN-KRR表示基于beta噪声的核岭回归的原问题,表示基于beta噪声模型核岭回归原问题的目标函数。
通过构造Lagrange泛函
L ( ω , b , α , ξ ) = 1 2 ω T ω + C Σ i = l c ( ξ i ) + Σ i = 1 l α i ( y i - ω T · Φ ( x i ) - b - ξ i )
可得到基于beta噪声模型核岭回归原问题(5)的对偶问题(简记为BN-KRR)为:
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 27 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C .
式(5)、(10)、(12)、(18)、(27)等中的DBN-KRR表示基于beta噪声模型核岭回归的对偶问题,表示基于beta噪声模型核岭回归对偶问题的目标函数。
式(5)、(6)、(10)、(12)、(18)、(19)、(26)、(27)中,αi(i=1,2...,l)为拉格朗日乘子,即为对偶问题(12)中的自变量。
5.构造基于beta噪声模型核岭回归的回归函数:
f ( x ) = ω T · Φ ( x ) + b = Σ i = 1 l α i K ( x i , x ) + b - - - ( 28 )
其中 b = y i - Σ j = 1 l α j K ( x j , x i ) - ξ i ( α i ) .
6.将基于beta噪声模型的核岭回归技术应用于短期风速预报中.用输入向量分别预报分析某一时刻以后的风速,i表示某一时刻;xi+1下标表示某一时刻i以后10分钟的时刻的风速,xi+2下标表示某一时刻i以后20分钟的时刻的风速,……,xi+18下标表示某一时刻i以后180分钟的时刻的风速。
外文字符的中文注释:
1.beta:贝塔(希腊字母)。
2.Gauss:高斯(著名数学家)。
3.Ridgeregression:岭回归。
4.A.E.Hoerl,R.W.Kennard,C.Saunders,A.Fabbri,S.Bofinger,J.Holland:人名。
5.Hilbert:希尔伯特(著名数学家)。
6.RidgeregressionbasedontheGauss-noise:基于Gauss噪声的岭回归。
7.KernelridgeregressionbasedontheGauss-noise:基于Gauss噪声的核岭回归。
6.Kernelridgeregressionbasedonthebeta-noise:基于beta噪声模型的核岭回归。
8.Lagrange:拉格朗日(著名数学家)。
9.probabilitydistributionfunction(pdf):概率密度函数。
10.themeanabsoluteerror:平均值绝对误差。
11.themeanabsolutepercentageerror:相对平均值绝对误差。
12.therootmeansquareerror:根平方值法。
13.GeneticAlgorithm:遗传算法。
14.minf(x):求函数f(x)的最小值;maxf(x):求函数f(x)的最大值。

Claims (2)

1.一种基于beta噪声核岭回归技术的短期风速预报方法,其特征是,包括如下步骤:通过最大似然估计导出基于beta噪声模型的损失函数,在此基础上构造基于beta噪声模型的核岭回归机,最后利用基于beta噪声模型的核岭回归技术得到短期风速预报;应用基于beta噪声模型的核岭回归技术进行短期风速预报主要通过以下几个步骤来实现:
1)设给定具有beta噪声影响的数据集Dl={(x1,y1),(x2,y2),…,(xl,yl)},其中xi∈Χ=Rn,yi∈R,i=1,2,…,l,Rn表示n维欧式空间,R表示实数集,l表示样本个数;求取最优损失函数;
2)利用遗传算法确定参数C、m、n;选取最优核函数K(·,·),m、n为Beta噪声模型的损失函数中的参数,由噪声分布的期望μ和方差σ2确定,即m=(1-μ)·μ22-μ,n=1-μ/μ·m;
3)构造并求解最优化问题
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 5 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C , 参数C>0,s.t.为subjectto的缩写,表示基于beta噪声模型核岭回归对偶问题的目标函数;
得到最优解α=(α12,…,αl),α1、α2、…,αl为拉格朗日乘子;
4)构造回归函数
f ( x ) = ω T · Φ ( x ) + b = Σ i = 1 l α i K ( x i , x ) + b - - - ( 6 )
其中ω∈Rn为参数向量;Φ:Rn→H为核变换,H为Hilbert空间,(Φ(xi)·Φ(xj))表示H空间中的内积,K(xi,xj)=(Φ(xi)·Φ(xj));
求取最优损失函数是,利用数据集Dl估计函数f(x),通过极大化似然函数的方法来得到最优损失函数:
c(x,y,f(x))=-logp(y-f(x))(7)
其中,p(y-f(x))=p(ξ)表示误差ξ的概率密度函数,c(xi,yi,f(xi))=c(ξi)表示在样本点(xi,yi)进行预测时所得到预测值f(xi)与yi比较所产生的损失,c(ξ)表示损失函数;
得beta噪声模型的损失函数为:
c(ξi)=c(yi-f(xi))=(1-m)logξi+(1-n)log(1-ξi)(8)
利用遗传算法确定参数C、m、n具体为:利用遗传算法确定基于beta噪声模型的核岭回归机的参数C、m、n.提出的基于beta噪声模型的核岭回归机应用Matlab7.1程序语言实现,取初始参数是Max_cgen=100,BN-KRR的参数C∈[1,201],m,n∈(0,+∞);
基于beta噪声核岭回归模型的英文全称为Kernelridgeregressionmodelbasedonthebeta-noise,简记为BN-KRR;
选取最优核函数K(·,·)是利用核技巧构造核函数K(·,·),把基于beta噪声模型的线性岭回归机推广为beta噪声模型的非线性岭回归机;其中核函数K(·,·)即K(xi,xj)=(Φ(xi)·Φ(xj)),Φ:Rn→H,H为Hilbert空间,(Φ(xi)·Φ(xj))为H空间中的内积;
多项式核函数:K(xi,xj)=((xi·xj)+1)d是正整数;
Gauss径向基核函数:K(xi,xj)=exp(-||xi-xj||22);
其中d是正数,取d=2或3;σ是正数,取σ=0.2。
2.如权利要求1所述的基于beta噪声核岭回归技术的短期风速预报方法,其特征是,构造并求解最优化问题进一步具体为:
基于beta噪声的核岭回归的原问题为:
g P B N - K R R = 1 2 ω T · ω + C Σ i = 1 l ( ( 1 - m ) logξ i + ( 1 - n ) l o g ( 1 - ξ i ) ) - - - ( 9 )
其中ξi=yiT·Φ(xi)-b,i=1,…,l,式中的PBN-KRR表示基于beta噪声的核岭回归的原问题,表示基于beta噪声模型核岭回归原问题的目标函数;
通过构造Lagrange泛函
L ( ω , b , α , ξ ) = 1 2 ω T ω + C Σ i = l c ( ξ i ) + Σ i = 1 l α i ( y i - ω T · Φ ( x i ) - b - ξ i )
可得到基于beta噪声模型核岭回归原问题(9)的对偶问题为:
max α { g D B N - K R R = - 1 2 Σ i , j = 1 l α i α j K ( x i , x j ) + Σ i = 1 l α i y i - Σ i = 1 l α i ξ i ( α i ) + C Σ i = 1 l ( ( 1 - m ) log ( ξ i ( α i ) ) + ( 1 - n ) log ( 1 - ξ i ( α i ) ) ) ) } s . t . Σ i = 1 l α i = 0 - - - ( 10 )
其中 ξ i ( α i ) = ( 2 + α i / C - m - n ) - [ ( α i C + m - n ) 2 + 4 ( 1 + m n - m - n ) ] 1 / 2 2 α i / C ;
在构造回归函数后,将基于beta噪声模型的核岭回归技术应用于短期风速预报中;用输入向量分别预报分析某一时刻i以后的短期风速,xi+1表示某一时刻i以后10分钟的风速,xi+18表示某一时刻i以后180分钟的风速。
CN201310006821.1A 2013-01-08 2013-01-08 基于beta噪声核岭回归技术的短期风速预报方法 Active CN103020485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310006821.1A CN103020485B (zh) 2013-01-08 2013-01-08 基于beta噪声核岭回归技术的短期风速预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310006821.1A CN103020485B (zh) 2013-01-08 2013-01-08 基于beta噪声核岭回归技术的短期风速预报方法

Publications (2)

Publication Number Publication Date
CN103020485A CN103020485A (zh) 2013-04-03
CN103020485B true CN103020485B (zh) 2016-01-06

Family

ID=47969083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310006821.1A Active CN103020485B (zh) 2013-01-08 2013-01-08 基于beta噪声核岭回归技术的短期风速预报方法

Country Status (1)

Country Link
CN (1) CN103020485B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279672B (zh) * 2013-06-04 2017-02-08 天津大学 基于噪声模型支持向量回归技术的短期风速预报方法
CN106405683B (zh) * 2016-09-29 2018-12-18 河南师范大学 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
CN108710961B (zh) * 2017-04-12 2022-08-19 中国电力科学研究院 一种风速集合预报评分方法及系统
CN107644274A (zh) * 2017-09-30 2018-01-30 湖南省烟草公司郴州市公司 基于大气候数据的烟草野火病气象预测预报方法
CN108520310B (zh) * 2018-03-01 2021-12-03 河南师范大学 G-L混合噪声特性v-支持向量回归机的风速预报方法
CN108776717B (zh) * 2018-04-25 2020-11-10 香港中文大学(深圳) 核函数构造及数据预测方法、装置、设备和存储介质
CN113610121B (zh) * 2021-07-22 2023-09-29 哈尔滨工程大学 一种跨域任务深度学习识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521671A (zh) * 2011-11-29 2012-06-27 华北电力大学 一种风电功率超短期预测方法
CN102855412A (zh) * 2012-09-21 2013-01-02 广西电网公司电力科学研究院 一种风电功率预测方法及其装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2558969A4 (en) * 2010-04-13 2013-10-09 Univ California METHOD FOR USING GENERALIZED ORDER DIFFERENCES AND FOR INTEGRATING INPUT VARIABLES IN TREND FORECASTS

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102521671A (zh) * 2011-11-29 2012-06-27 华北电力大学 一种风电功率超短期预测方法
CN102855412A (zh) * 2012-09-21 2013-01-02 广西电网公司电力科学研究院 一种风电功率预测方法及其装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于小波分解与遗传算法和支持向量机的短期风速预测;罗文 等;《太阳能学报》;20120828;第33卷(第8期);第1327-1333页 *
基于非参数回归模型的短期风电功率预测;王彩霞 等;《电力系统自动化》;20100825;第34卷(第16期);第78-82页 *

Also Published As

Publication number Publication date
CN103020485A (zh) 2013-04-03

Similar Documents

Publication Publication Date Title
CN103020485B (zh) 基于beta噪声核岭回归技术的短期风速预报方法
Saggi et al. Reference evapotranspiration estimation and modeling of the Punjab Northern India using deep learning
Wang et al. Deep belief network based k-means cluster approach for short-term wind power forecasting
Corizzo et al. Anomaly detection and repair for accurate predictions in geo-distributed big data
Wu et al. Evolving RBF neural networks for rainfall prediction using hybrid particle swarm optimization and genetic algorithm
CN106650767B (zh) 基于聚类分析和实时校正的洪水预报方法
Shabri et al. Streamflow forecasting using least-squares support vector machines
Beccali et al. Forecasting daily urban electric load profiles using artificial neural networks
Kannan et al. Prediction of daily rainfall state in a river basin using statistical downscaling from GCM output
Wu et al. A hybrid support vector regression approach for rainfall forecasting using particle swarm optimization and projection pursuit technology
CN114220271A (zh) 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质
Li et al. A novel combined prediction model for monthly mean precipitation with error correction strategy
Nematchoua et al. Prediction of daily global solar radiation and air temperature using six machine learning algorithms; a case of 27 European countries
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
CN103617259A (zh) 一种基于有社会关系和项目内容的贝叶斯概率矩阵分解推荐方法
Tian et al. An adaptive ensemble predictive strategy for multiple scale electrical energy usages forecasting
CN103279672B (zh) 基于噪声模型支持向量回归技术的短期风速预报方法
Wei RBF neural networks combined with principal component analysis applied to quantitative precipitation forecast for a reservoir watershed during typhoon periods
Zang et al. Combined empirical and machine learning modeling method for estimation of daily global solar radiation for general meteorological observation stations
CN104835073A (zh) 基于直觉模糊熵权的无人飞行器控制系统运行绩效评价方法
Guo et al. A combined model based on sparrow search optimized BP neural network and Markov chain for precipitation prediction in Zhengzhou City, China
Sun et al. Privileged information-driven random network based non-iterative integration model for building energy consumption prediction
Liu et al. Soil water content forecasting by ANN and SVM hybrid architecture
Khan et al. Forecasting renewable energy for environmental resilience through computational intelligence
Salfate et al. 24-hours wind speed forecasting and wind power generation in La Serena (Chile)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180404

Address after: 511400 425, No. 425, south of Qiaodong Road, Panyu District City, Panyu District City, Guangdong

Patentee after: Guangzhou Wei Ersike Automation Technology Co. Ltd.

Address before: 300072 Tianjin City, Nankai District Wei Jin Road No. 92

Patentee before: Tianjin University