CN108520310B - G-L混合噪声特性v-支持向量回归机的风速预报方法 - Google Patents

G-L混合噪声特性v-支持向量回归机的风速预报方法 Download PDF

Info

Publication number
CN108520310B
CN108520310B CN201810169866.3A CN201810169866A CN108520310B CN 108520310 B CN108520310 B CN 108520310B CN 201810169866 A CN201810169866 A CN 201810169866A CN 108520310 B CN108520310 B CN 108520310B
Authority
CN
China
Prior art keywords
vector regression
support vector
mixed noise
wind speed
noise characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810169866.3A
Other languages
English (en)
Other versions
CN108520310A (zh
Inventor
张仕光
周婷
王伟
陈光周
李源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Normal University
Original Assignee
Henan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Normal University filed Critical Henan Normal University
Priority to CN201810169866.3A priority Critical patent/CN108520310B/zh
Publication of CN108520310A publication Critical patent/CN108520310A/zh
Application granted granted Critical
Publication of CN108520310B publication Critical patent/CN108520310B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Air Conditioning Control Device (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于G‑L混合噪声特性v‑支持向量回归机的风速预报方法,该方法包括如下步骤:1)获取风速数据集D l ,利用Bayesian原理,得到Gauss‑Laplace混合噪声特性的经验风险损失函数;2)利用统计学习理论和凸优化技术,结合步骤1)中的损失函数,建立基于Gauss‑Laplace混合噪声特性的v‑支持向量回归模型的原问题,利用Lagrange乘子法推导并求解出该v‑支持向量回归模型对偶问题;3)确定该v‑支持向量回归模型对偶问题的最优参数,选取核函数,构造该v‑支持向量回归模型的决策函数;4)构造该v‑支持向量回归模型的风速预报模式,利用该预报模式预报分析风速值。该方法包括经验风险损失函数获取模块、对偶问题求解模块、决策函数构造模块及风速预报模块。本发明能够满足实际应用中,如风力发电、农业生产等,对风速预报精度的要求。

Description

G-L混合噪声特性v-支持向量回归机的风速预报方法
技术领域
本发明涉及风速预报技术领域,具体涉及基于G-L混合噪声特性v-支持向量回归机的 风速预报方法。
背景技术
对于线性系统而言,从Gauss时代起,就利用最小二乘法把平面上的点拟合成直线,把 高维空间的点拟合成超平面。经历了近200年的发展,经典最小二乘法已经成为许多领域 数据处理的最广泛使用的方法。但是,对于线性回归中的不适定问题或非线性回归中的问 题,基于最小二乘法的线性回归的性能可能变得很坏,针对这种情况,众多学者研究了最 小二乘回归的改进问题,提出了许多新的回归算法。支持向量回归机(Supportvector regression,简记为SVR)就是其中之一。
支持向量机方法是建立在统计学习理论和结构风险最小化原理基础上的,根据有限的 样本信息在模型复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意 样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。
支持向量机方法的主要优点有:
1.它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样 本数趋于无穷大时的最优值;
2.算法最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点, 解决了在神经网络方法中无法避免的局部极值问题;
3.算法将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性 决策函数来实现原空间中的非线性决策函数,特殊性质能保证机器有较好的推广能力,同 时它巧妙地解决了维数问题,其算法复杂度与样本维数无关。
支持向量回归方法自Vapnik于1995年提出以来,就得到了广泛的关注,它成功应用于 科学技术和社会科学等各个领域。设给定数据:
Dl={(x1,y1),(x2,y2),…,(xl,yl)} (3)
其中xi∈Rn,yi∈R,i=1,2,…,l,多元线性回归函数为f(xi)=ωT·xi+b,xi=(xi1,xi2,…,xin)T, 参数向量ω∈Rn,其中xi∈Rn,Rn表示n维欧式空间,R表示实数集,l表示样本个数,上标T 表示向量转置,在ν-SVR中,选取ε-不敏感损失函数
Figure GDA0003311514960000011
线性ν-SVR模型 的原问题为:
Figure GDA0003311514960000021
其中参数C>0,
Figure GDA0003311514960000022
为噪声,(4)中目标函数假设样本不受噪声影响。(4)中
Figure GDA0003311514960000023
的决策函 数为线性回归模型。
在实际应用中,样本Dl中xi与yi一般不满足线性关系,这样线性ν-SVR在解决非线性 回归问题时往往不能取得预期的效果。通过核技巧构造合适的核变换Φ:Rn→H(H为Hilbert空间),利用Hilbert空间中的內积运算引进非线性核函数K(xi,xj)=(Φ(xi)·Φ(xj)), 把非线性问题转化为线性问题来解决。从而得到非线性ν-SVR的原问题为:
Figure GDA0003311514960000024
不可避免地,样本都要受到噪声影响。一般地,假设样本受到高斯噪声影响。2010年 Wu提出基于高斯噪声影响的支持向量机,并利用遗传算法和粒子群优化算法进行了求解。 其原问题为:
Figure GDA0003311514960000025
当噪声服从Gauss分布时,基于Gauss噪声的支持向量回归机(support vectorregression based on the Gauss-noise,简记为GN-SVR)能够取得预期的效果。研究表明在许多实际应用领域 中,噪声分布不一定服从高斯同方差分布,而服从Beta分布、拉普拉斯分布、高斯异方差 分布、威布尔分布,或其他类型噪声特性的分布。尤其在风速/风功率预报中,噪声分布随 着季节和地域而变化,需要由某种混合分布来联合表示,如利用Gauss-Laplace混合噪声分 布来拟合不确定数据中的未知噪声特性。此时应用ν-SVR、GN-KRR等经典回归技术进行 预测,则预报结果不能满足实际要求。
发明内容
本发明提供了一种基于G-L混合噪声特性v-支持向量回归机的风速预报方法,以解决 现有的单一噪声特性的支持向量回归技术不能满足实际应用中对风速预报精度要求的问 题。
为解决上述技术问题,本发明的基于G-L混合噪声特性v-支持向量回归机的风速预报 方法包括如下步骤:
1)获取某地区具有噪声影响的风速数据集Dl,利用Bayesian原理,得到基于G-L混合噪声特性的经验风险损失函数
Figure GDA0003311514960000031
2)利用统计学习理论和凸优化技术,结合步骤1)中得到的基于G-L混合噪声特性的 损失函数c(ξ),建立基于G-L混合噪声特性v-支持向量回归模型的原问题,利用Lagrange 乘子法推导并求解出基于G-L混合噪声特性v-支持向量回归模型的对偶问题;
3)利用十折交叉验证技术确定基于G-L混合噪声特性v-支持向量回归模型的对偶问 题的惩罚参数及权重参数,选取核函数K(·,·);构造基于G-L混合噪声特性v-支持向量回 归模型的决策函数f(x);
4)构造基于G-L混合噪声特性v-支持向量回归模型的风速预报模式:输入向量为
Figure GDA0003311514960000032
其中i,j(i,j=1,2,…,l)为时间序列预报中相关联的两个时刻;输 出值为xi+step,其中step为预测间隔时间,利用该预报模式预报分析某一时刻i以后step间 隔时刻的风速值。
所述基于G-L混合噪声特性的经验风险损失函数为
Figure GDA0003311514960000033
其 中,权重参数λ1≥0,λ2≥0且λ12=1,ξ、ξ*为已知的独立同分布的随机变量。
所述基于G-L混合噪声特性的v-支持向量回归模型(v-Support vectorregression model based on Gauss-Laplace Mixture noise characteristics简记为GLM-SVR)的原问题为:
Figure GDA0003311514960000034
其中,C>0是惩罚参数,权重参数λ12≥0且λ12=1,l为样本数,yi(i=1,…,l)为样本 测量值,ξi
Figure GDA0003311514960000041
为已知的独立同分布的随机变量,Φ:Rn→H为核变换,H为Hilbert空间,ω为参数向量,T为向量转置,b∈R;式中的PGLM-SVR表示基于G-L混合噪 声特性v-支持向量回归模型的原问题,
Figure GDA0003311514960000042
表示基于G-L混合噪声特性v-支持向量回 归模型的原问题的目标函数。
步骤2)中,构造Lagrange泛函:
Figure GDA0003311514960000043
应用凸优化技术,得到基于G-L混合噪声特性v-支持向量回归模型原问题的对偶问题;
Figure GDA0003311514960000044
包含ξi
Figure GDA0003311514960000045
包含 αi
Figure GDA0003311514960000046
为Lagrange乘子,γ、ηi
Figure GDA0003311514960000047
为引进的辅助变量。
所述基于G-L混合噪声特性的v-支持向量回归模型对偶问题为:
Figure GDA0003311514960000048
其中l为样本数,惩罚参数C>0,权重参数λ12≥0且λ12=1;s.t.为subject to的 缩写,
Figure GDA0003311514960000049
表示基于G-L混合噪声特性v-支持向量回归模型对偶问题的目标函数,
Figure GDA00033115149600000410
为拉格朗日乘子,yi(i=1,…,l)为样本测量值,K(xi,xj)为核函数。
基于G-L混合噪声特性v-支持向量回归模型的决策函数为:
Figure GDA0003311514960000051
其中,
Figure GDA0003311514960000052
Φ:Rn→H为核变换,H为Hilbert空间,K(xi,xj)=(Φ(xi)·Φ(xj)),ω∈Rn为参数向量,(Φ(xi)·Φ(xj))表示H空间中 的内积。RSV为
Figure GDA0003311514960000053
对应的样本,称为支持向量。
本发明基于G-L混合噪声特性v-支持向量回归机的风速预报装置,其特征在于,该装 置包括损失函数获取模块、对偶问题求解模块、决策函数构造模块及风速预报模块;
所述损失函数获取模块,用于获取某地区具有噪声影响的风速数据集Dl,利用Bayesian 原理,得到基于G-L混合噪声特性的经验风险损失函数c(ξ);
所述对偶问题求解模块,用于利用统计学习理论和凸优化技术,结合基于G-L混合噪 声特性的经验风险损失函数c(ξ),建立基于G-L混合噪声特性v-支持向量回归模型的原问 题,利用Lagrange乘子法推导并求解出基于G-L混合噪声特性v-支持向量回归模型对偶问 题;
所述决策函数构造模块,用于利用十折交叉验证技术确定基于G-L混合噪声特性v- 支持向量回归模型对偶问题的惩罚参数及权重参数,选取核函数K(·,·);构造基于G-L混 合噪声特性v-支持向量回归模型的决策函数f(x);
所述风速预报模块,用于构造基于G-L混合噪声特性v-支持向量回归模型的风速预报 模式:输入向量为
Figure GDA0003311514960000054
其中i,j(i,j=1,2,…,l)为时间序列预报中相关 联的两个时刻;输出值为xi+step,其中step为预测间隔时间,利用该预报模式预报分析某 一时刻i以后step间隔时刻的风速值。
根据建立的基于G-L混合噪声特性的v-支持向量回归模型的原问题,构造Lagrange 泛函,利用凸优化技术,得到基于G-L混合噪声特性v-支持向量回归模型原问题的对偶问 题。
所述基于G-L混合噪声特性的经验风险损失函数
Figure GDA0003311514960000055
其中, 权重参数λ1≥0,λ2≥0且λ12=1,ξ、ξ*为已知的独立同分布的随机变量。
基于G-L混合噪声特性的v-支持向量回归模型的决策函数为:
Figure GDA0003311514960000061
其中
Figure GDA0003311514960000062
本发明的有益效果是:本发明提出一种应用基于G-L混合噪声特性v-支持向量回归技 术进行风速预报分析的新的统一理论模型。通过Bayesian原理推导出基于G-L混合噪声特 性的损失函数,在此基础上利用统计学习理论、凸优化技术构造基于G-L混合噪声特性v- 支持向量回归模型,该v-支持向量回归模型具有较高稳定性和鲁棒性;最后利用基于G-L 混合噪声特性v-支持向量回归技术得到风速预报;本发明的方法能够满足实际应用中,如 风力发电、农业生产等,对风速预报精度的要求。
在风速预报中,需要根据噪声特性的实际分布确定预报方法,利用基于G-L混合噪声 特性的v-支持向量回归技术、基于考虑Gauss噪声特性的v-支持向量回归技术和ν-支持向量回归技术进行风速预报,表现出了较好的预报效果。
附图说明
图1 Gauss概率密度函数(pdf)、Laplace概率密度函数(pdf)、Gauss损失函数 和Laplace损失函数曲线图;
图2不同参数值下的Gauss-Laplace损失函数;
图3 10分钟以后风速预报结果ν-SVR(C=181,step=1);
图4 10分钟以后风速预报结果GN-SVR(C=181,step=1);
图5 10分钟以后风速预报结果GLM-SVR(C=181,λ1=0.5,λ2=0.5,step=1);
图6 30分钟以后风速预报结果ν-SVR(C=181,step=3);
图7 30分钟以后风速预报结果GN-SVR(C=181,step=3);
图8 30分钟以后风速预报结果GLM-SVR(C=181,λ1=0.5,λ2=0.5,step=3);
图9 60分钟以后风速预报结果ν-SVR(C=181,step=6);
图10 60分钟以后风速预报结果GN-SVR(C=181,step=6);
图11 60分钟以后风速预报结果GLM-SVR(C=181,λ1=0.5,λ2=0.5,step=6);
图12 G-L混合噪声特性v-支持向量回归机的风速预报方法总体流程图。
具体实施方式
下面结合附图,对本发明的技术方案作进一步详细介绍。
本发明的基于G-L混合噪声特性v-支持向量回归机的风速预报方法实施例
该方法包括以下步骤:
1)获取某地区具有噪声影响的风速数据集Dl,利用Bayesian原理,得到Gauss-Laplace (简记为G-L)混合噪声特性的经验风险损失函数c(ξ);
2)利用统计学习理论和凸优化技术,结合步骤1)中得到的基于G-L混合噪声特性的 损失函数,建立基于G-L混合噪声特性v-支持向量回归模型的原问题,利用Lagrange乘子 法推导并求解出基于G-L混合噪声特性v-支持向量回归模型对偶问题;
3)利用十折交叉验证技术确定基于G-L混合噪声特性v-支持向量回归模型对偶问题 的最优参数C、λ1及λ2,选取核函数K(·,·);构造基于G-L混合噪声特性v-支持向量回归模型的决策函数f(x);
4)构造基于G-L混合噪声特性v-支持向量回归模型的风速预报模式:输入向量为
Figure GDA0003311514960000071
其中i,j(i,j=1,2,…,l)为时间序列预报中相关联的两个时刻,输 出值为xi+step,其中step为预测间隔时间;利用该预报模式预报分析某一时刻i以后step间 隔时刻的风速值。
下面对上述步骤作进一步详细介绍:
步骤1)中,获取具有噪声特性的数据集Dl={(x1,y1),(x2,y2),…,(xl,yl)},其 中xi∈Rn,yi∈R,i=1,2,…,l,Rn表示n维欧式空间,R表示实数集,l表示样本 数;利用Bayesian原理,推导基于G-L混合噪声特性的最优损失函数,具体过 程为:
给定具有噪声特性的数据集Dl,回归函数f(x)是未知的。一般地,最小化目标函数:
Figure GDA0003311514960000072
其中c(ξi)=c(yi-f(xi))表示在样本点(xi,yi)∈Dl进行预测时所得到预测值f(xi)与测量值 yi(i=1,…,l)比较所产生的损失值,λ是正数。假设噪声特性是加性的,即yi=fi(xi)+ξi(i=1,…,l),且ξi(i=1,…,l)是独立同分布(i.i.d.)的随机变量,ξi(i=1,…,l)的 方差为σ2,均值为μ。利用数据g∈Dl估计函数f(x),根据Bayesian原理可得噪声特性 的最优经验风险损失函数为:
c(x,y,f(x))=-logp(y-f(x)) (10)
其中p(y-f(x))=p(ξ)表示误差ξ的概率密度函数,c(xi,yi,f(xi))=c(ξi)(i=1,…,l)表示在 样本点(xi,yi)进行预测时所得到预测值f(xi)与yi比较所产生的损失值,c(ξ)表示损失函 数。
如图1所示,Gauss噪声特性的损失函数为:
Figure GDA0003311514960000081
如图1所示,Laplace噪声特性的损失函数为:
c(ξ)=c(y-f(x))=|ξ| (12)
如图2所示,Gauss-Laplace混合噪声特性的损失函数为:
Figure GDA0003311514960000082
步骤2)中,构造并求解凸优化问题进一步具体为:
基于G-L混合噪声特性v-支持向量回归模型的原问题为:
Figure GDA0003311514960000083
其中ξi=yiT·Φ(xi)-b(i=1,2,…,l),C>0是惩罚参数,权重参数λ12≥0且λ12=1, l为样本数,yi(i=1,…,l)为样本测量值,ξi
Figure GDA0003311514960000084
为已知的独立同分布的随机变量, Φ:Rn→H为核变换,H为Hilbert空间,ω为参数向量,T为向量转置,b∈R;式(14) 中的PGLM-SVR表示基于G-L混合噪声特性v-支持向量回归模型的原问题,
Figure GDA0003311514960000085
表示基于 G-L混合噪声特性v-支持向量回归模型的原问题的目标函数。
构造Lagrange泛函L(ω,b,α(*)(*)):
Figure GDA0003311514960000091
根据凸优化技术,为求L(ω,b,α(*)(*)的极小值,分别对ω,b,ε,ξ,ξ*求偏导数.由 KKT(Karush-Kusn-Tucke)条件▽ωL=0,▽bL=0,▽εL=0,▽ξL=0,
Figure GDA0003311514960000095
得:
Figure GDA0003311514960000092
把上述极值条件代入L(ω,b,α(*)(*)),并对α,α*求极大值,可得到基于G-L混合噪声 特性v-支持向量回归模型原问题(14)的对偶问题(简记为GLM-SVR)为:
Figure GDA0003311514960000093
其中C>0是惩罚参数,权重参数λ12≥0,且λ12=1,且有
Figure GDA0003311514960000094
其中的DGLM-SVR表示基于G-L混合噪声特性v-支持向量回归模型的对偶问题,
Figure GDA0003311514960000101
表 示基于G-L混合噪声特性v-支持向量回归模型对偶问题的目标函数。
Lagrange乘子法是Powel和Hestenes于1969年针对等式约束优化问题同时独立提出 的优化算法,也称为PH算法;其基本思想是:从原问题的拉格朗日函数出发,再加上适当的罚函数,从而将原问题转化为求解一系列的无约束优化子问题;增广拉格朗日乘子法(Augmented Lagrange Multiplier method,简记为ALM)是1973年Rockfellar将PH算法 推广到求解不等式约束优化问题,也称为PHR算法;ALM法是解决同时带有等式和不等 式约束问题的一类优化方法。其基本思想是:把解等式约束优化问题的乘子法推广到不等 式约束优化问题,即先引进辅助变量把不等式约束转化为等式约束,然后再利用最有效条 件消去辅助变量。
对于一个求解函数最小值的优化问题(求函数最大值也类似),一般可以描述为下列数 学规划模型:
Figure GDA0003311514960000102
式中x为决策变量,f(x)为目标函数,式
Figure GDA0003311514960000103
为约束条件,U是基本空间,R是U的 子集;满足约束条件的解X称为可行解,集合R表示所有满足约束条件的解所组成的集合, 称为可行解集合;式(1)、(7)、(14)中的x与式(16)
Figure GDA0003311514960000104
中x的含义相同, x=(x1,x2,…,xl)T,y=(y1,y2,…,yl)T,(xi,yi)∈Dl,i=1,2,…,l,上标T表示向量转置。 p(y-f(x))=p(ξ)表示误差ξ的概率密度函数;c(xi,yi,f(xi))=c(ξi)表示在样本点(xi,yi) 处进行预测时所得到预测值f(xi)与yi比较所产生的损失值,c(ξ)表示损失函数。
步骤2)中所述的统计学习理论和凸优化技术为现有技术,请参考文献《数据挖掘中 的新方法:支持向量机》(作者:邓乃杨,田英杰;出版社:科学出版社,2004.6)、《TheNature of Statistical Learning Theory》(Vapnik V.New York:Springer-Verlag,1995)及《Pattern recognition and machine learning》(C.M.Bishop.Springer,NewYork,2006)这里不再详细说 明。
步骤3)中,利用十折交叉验证技术确定最优参数C、λ1、λ2具体为:利用ALM法 求解基于G-L混合噪声特性v-支持向量回归模型对偶问题(2)、(8)、(15)及利用十折交 叉验证技术确定最优参数C、λ1、λ2。提出的基于G-L混合噪声特性v-支持向量回归机应 用Matlab7.8程序语言实现,模型GLM-SVR的参数C∈[1,201],λ12≥0且λ12=1。
选取合适的核函数K(·,·)是利用核技术构造核函数K(·,·),把基于G-L混合噪声特 性线性v-支持向量回归模型推广为基于G-L混合噪声特性非线性v-支持向量回归模型;其 中K(xi,xj)=(Φ(xi)·Φ(xj)),Φ:Rn→H,H为Hilbert空间,(Φ(xi)·Φ(xj))为H空间中的 内积。常见核函数有:
(1)多项式核函数:K(xi,xj)=((xi·xj)+1)d
(2)Gauss径向基核函数:K(xi,xj)=exp(-||xi-xj||22);
其中d是正数,取d=2或3;σ是正数,取σ=0.2。
可得到基于G-L混合噪声特性v-支持向量回归模型的决策函数为
Figure GDA0003311514960000111
其中,
Figure GDA0003311514960000112
Φ:Rn→H为核变换,H为Hilbert空间,K(xi,xj)=(Φ(xi)·Φ(xj)),ω∈Rn为参数向量,(Φ(xi)·Φ(xj))表示H空间中 的内积。RSV为
Figure GDA0003311514960000113
对应的样本,称为支持向量。
步骤3)中所述的十折交叉验证技术为现有技术,请参考文献《数据挖掘中的新方法: 支持向量机》(作者:邓乃杨,田英杰;出版社:科学出版社,2004.6)及《The Nature ofStatistical Learning Theory》(Vapnik V.New York:Springer-Verlag,1995),这里不再详细说明。
步骤4)中,将基于G-L混合噪声特性v-支持向量回归技术应用于风速预报中,构造预报模式为:输入向量为
Figure GDA0003311514960000114
其中i,j(i,j=1,2,…,l)为时间序列预报 中相关联的两个时刻;输出值为xi+step,其中step为预测间隔时间。利用这种预报模式预报分析某一时刻i以后step间隔时刻的风速值。如取step=3表示预测某一时刻i以后30分钟的风速值;取step=12表示预测某一时刻i以后120分钟的风速值。
本发明的基于G-L混合噪声特性v-支持向量回归机的风速预报装置实施例
该装置包括损失函数获取模块、对偶问题求解模块、决策函数构造模块及风速预报模 块;
其中,损失函数获取模块,用于获取某地区具有噪声影响的风速数据集Dl,利用Bayesian原理,得到G-L混合噪声特性的损失函数c(ξ);
对偶问题求解模块,用于利用统计学习理论和凸优化技术,结合步骤1)中得到的G-L 混合噪声特性的损失函数,建立基于G-L混合噪声特性v-支持向量回归模型的原问题,利 用Lagrange乘子法推导并求解出基于G-L混合噪声特性v-支持向量回归模型对偶问题;
决策函数构造模块,用于利用十折交叉验证技术确定基于G-L混合噪声特性v-支持向 量回归模型对偶问题的最优参数C、λ1及λ2,选取核函数K(·,·);构造基于G-L混合噪声 特性v-支持向量回归模型的决策函数f(x);
风速预报模块,用于构造基于G-L混合噪声特性v-支持向量回归模型的风速预报模式: 输入向量为
Figure GDA0003311514960000121
其中i,j(i,j=1,2,…,l)为时间序列预报中相关联的两 个时刻;输出值为xi+step,其中step为预测间隔时间,利用该预报模式预报分析某一时刻i 以后step间隔时刻的风速值。
该实施例中的G-L混合噪声特性的损失函数c(ξ)、基于G-L混合噪声特性的v-支持向 量回归模型的原问题、对偶问题、决策函数f(x)的具体公式及求解方法请参考方法实施例, 这里不再一一详细阐述。
利用上述方法进行风速预报时,表现了较好的性能,下面给出了风速预报性能评价的 常用指标:
风速预报性能的评价一般用两个时间序列中基于预测值xp和测量值xm间的误差来度 量,即εi=xp,i-xm,i(i=1,…,l);
最常用的评价误差度量的指标是平均值绝对误差(the mean absolute error,简记为 MAE):
Figure GDA0003311514960000122
相对平均值绝对误差(the mean absolute percentage error,简记为MAPE):
Figure GDA0003311514960000123
根平方值法(the root mean square error,简记为RMSE)、标准误差(thestandard error of prediction,简记为SEP)是预测误差中应用比较广泛的方法,RMSE、SEP在两个时间序列 中基于预测值xp和测量值xm定义为:
Figure GDA0003311514960000131
Figure GDA0003311514960000132
l为选择样本的数量,xp,i、xm,i分别表示时间序列中第i个样本的预测值与测量值,
Figure GDA0003311514960000133
为样本测量值xm的平均值。用平均值绝对误差、相对平均值绝对误差、根平方 值误差、标准误差对ν-SVR、GN-SVR、GLM-SVR三种回归技术进行了评价。
在黑龙江省的风速数据集Dl中,其中的样本是每10分钟测量一次,共收集有6万余个 样本,Dl各列属性分别包括均值、方差、最小值、最大值等多个因子。我们取训练样本2880个(从1至2880,即20天的样本),测试样本720个(从2161至2880,即5天的样本) 进行了实验分析。输入向量为
Figure GDA0003311514960000134
其中i,j为时间序 列预报中相关联的两个时刻;输出值为xi+step,其中step=1,3,6。即用向量
Figure GDA0003311514960000135
分别预报某 一时刻i以后10分钟、30分钟、50分钟的风速值,其中i=1,…,720。
1、时刻i以后10分钟的风速预报结果
应用模型ν-SVR、GN-SVR、GLM-SVR预报某一时刻i以后10分钟以后的风速预 报结果分别见图3~图5所示。
利用指标MAE、MAPE、RMSE和SEP评价三种模型10分钟以后的风速预报结果如 表1所示。
表1:三种模型10分钟以后的风速预报的误差统计(测试样本144)
Figure GDA0003311514960000136
2、时刻i以后30分钟的风速预报结果
应用模型ν-SVR、GN-SVR、GLM-SVR预报某一时刻i以后30分钟以后的风速预 报结果分别见图6~图8所示。
利用指标MAE、MAPE、RMSE和SEP评价三种模型30分钟以后的风速预报结果如 表2所示。
表2:三种模型30分钟以后的风速预报的误差统计(测试样本144)
Figure GDA0003311514960000141
3、时刻i以后50分钟的风速预报结果
应用模型ν-SVR、GN-SVR、GLM-SVR预报某一时刻i以后50分钟以后的风速预 报结果分别见图9~图11所示。
利用指标MAE、MAPE、RMSE和SEP评价三种模型50分钟以后的风速预报结果如 表3所示。
表3:三种模型50分钟以后的风速预报的误差统计(测试样本144)
Figure GDA0003311514960000142
可见,应用模型ν-SVR、GN-SVR和GLM-SVR进行预报某一时刻i以后10分钟、 30分钟和50分钟的风速预报的实验结果说明,模型GLM-SVR的预报结果比模型ν-SVR 和GN-SVR的效果更好。

Claims (7)

1.基于G-L混合噪声特性v-支持向量回归机的风速预报方法,其特征在于,该方法包括如下步骤:
1)获取某地区具有噪声影响的风速数据集Dl,利用Bayesian原理,得到基于G-L混合噪声特性的经验风险损失函数
Figure FDA0003311514950000011
其中权重参数λ1≥0,λ2≥0且λ12=1,ξ、ξ*为已知的独立同分布的随机变量;
2)利用统计学习理论和凸优化技术,结合步骤1)中得到的基于G-L混合噪声特性的经验风险损失函数c(ξ),建立基于G-L混合噪声特性v-支持向量回归模型的原问题,利用Lagrange法推导并求解出基于G-L混合噪声特性v-支持向量回归模型的对偶问题;
3)利用十折交叉验证技术确定基于G-L混合噪声特性v-支持向量回归模型的对偶问题的惩罚参数及权重参数,选取核函数K(·,·);构造基于G-L混合噪声特性v-支持向量回归模型的决策函数f(x);
4)构造基于G-L混合噪声特性v-支持向量回归模型的风速预报模式:输入向量为
Figure FDA0003311514950000012
其中i,j(i,j=1,2,…,l)为相关联的两个时刻;输出值为xi+step,其中step为预测间隔时间,利用该预报模式预报分析某一时刻i以后step间隔时刻的风速值。
2.根据权利要求1所述的基于G-L混合噪声特性v-支持向量回归机的风速预报方法,其特征在于,所述基于G-L混合噪声特性的v-支持向量回归模型的原问题为:
Figure FDA0003311514950000013
其中,C>0是惩罚参数,权重参数λ12≥0且λ12=1,l为样本数,yi(i=1,…,l)为样本测量值,ξi、ξi *(i=1,…,l)为已知的独立同分布的随机变量,Φ:Rn→H为核变换,H为Hilbert空间,ω为参数向量,T为向量转置,b∈R;式中的PGLM-SVR表示基于G-L混合噪声特性v-支持向量回归模型的原问题,
Figure FDA0003311514950000014
表示基于G-L混合噪声特性v-支持向量回归模型的原问题的目标函数。
3.根据权利要求1所述的基于G-L混合噪声特性v-支持向量回归机的风速预报方法,其特征在于,步骤2)中,构造Lagrange泛函:
Figure FDA0003311514950000021
应用凸优化技术,得到基于G-L混合噪声特性v-支持向量回归模型原问题的对偶问题;其中,α(*)=(α1,…,αl1 *,…,αl *),ξ(*)=(ξ1,…,ξl1 *,…,ξl *),ξi (*)包含ξi、ξi *(i=1,…,l),αi (*)包含
Figure FDA0003311514950000022
为Lagrange乘子,γ、ηi
Figure FDA0003311514950000023
为引进的辅助变量。
4.根据权利要求3所述的基于G-L混合噪声特性v-支持向量回归机的风速预报方法,其特征在于,所述基于G-L混合噪声特性的v-支持向量回归模型对偶问题为:
Figure FDA0003311514950000024
其中l为样本数,惩罚参数C>0,权重参数λ12≥0且λ12=1;s.t.为subject to的缩写,
Figure FDA0003311514950000025
表示基于G-L混合噪声特性v-支持向量回归模型对偶问题的目标函数,
Figure FDA0003311514950000026
为拉格朗日乘子,yi(i=1,…,l)为样本测量值,K(xi,xj)为核函数。
5.基于G-L混合噪声特性v-支持向量回归机的风速预报装置,其特征在于,该装置包括损失函数获取模块、对偶问题求解模块、决策函数构造模块及风速预报模块;
所述损失函数获取模块,用于获取某地区具有噪声影响的风速数据集Dl,利用Bayesian原理,得到基于G-L混合噪声特性的经验风险损失函数c(ξ);
所述对偶问题求解模块,用于利用统计学习理论和凸优化技术,结合基于G-L混合噪声特性的经验风险损失函数
Figure FDA0003311514950000031
其中权重参数λ1≥0,λ2≥0且λ12=1,ξ、ξ*为已知的独立同分布的随机变量;建立基于G-L混合噪声特性v-支持向量回归模型的原问题,利用Lagrange方法推导并求解出基于G-L混合噪声特性v-支持向量回归模型对偶问题;
所述决策函数构造模块,用于利用十折交叉验证技术确定基于G-L混合噪声特性v-支持向量回归模型对偶问题的惩罚参数及权重参数,选取核函数K(·,·);构造基于G-L混合噪声特性v-支持向量回归模型的决策函数f(x);
所述风速预报模块,用于构造基于G-L混合噪声特性v-支持向量回归模型的风速预报模式:输入向量为
Figure FDA0003311514950000032
其中i,j(i,j=1,2,…,l)为时间序列预报中相关联的两个时刻;输出值为xi+step,其中step为预测间隔时间,利用该预报模式预报分析某一时刻i以后step间隔时刻的风速值。
6.根据权利要求5中所述基于G-L混合噪声特性v-支持向量回归机的风速预报装置,其特征在于,根据建立的基于G-L混合噪声特性的v-支持向量回归模型的原问题,构造Lagrange泛函,利用凸优化技术,得到基于G-L混合噪声特性v-支持向量回归模型原问题的对偶问题。
7.根据权利要求5所述的基于G-L混合噪声特性v-支持向量回归机的风速预报装置,其特征在于,基于G-L混合噪声特性的v-支持向量回归模型的决策函数为:
Figure FDA0003311514950000033
其中,
Figure FDA0003311514950000034
Φ:Rn→H为核变换,H为Hilbert空间,K(xi,xj)=(Φ(xi)·Φ(xj)),ω∈Rn为参数向量,(Φ(xi)·Φ(xj))表示H空间中的内积,l为样本个数,
Figure FDA0003311514950000035
为拉格朗日乘子,RSV为
Figure FDA0003311514950000036
对应的样本,称为支持向量。
CN201810169866.3A 2018-03-01 2018-03-01 G-L混合噪声特性v-支持向量回归机的风速预报方法 Expired - Fee Related CN108520310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810169866.3A CN108520310B (zh) 2018-03-01 2018-03-01 G-L混合噪声特性v-支持向量回归机的风速预报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810169866.3A CN108520310B (zh) 2018-03-01 2018-03-01 G-L混合噪声特性v-支持向量回归机的风速预报方法

Publications (2)

Publication Number Publication Date
CN108520310A CN108520310A (zh) 2018-09-11
CN108520310B true CN108520310B (zh) 2021-12-03

Family

ID=63433404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810169866.3A Expired - Fee Related CN108520310B (zh) 2018-03-01 2018-03-01 G-L混合噪声特性v-支持向量回归机的风速预报方法

Country Status (1)

Country Link
CN (1) CN108520310B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109458308B (zh) * 2018-12-28 2020-07-07 中国大唐集团新能源科学技术研究院有限公司 风机主轴超温预警方法
CN111461219A (zh) * 2020-04-01 2020-07-28 丰车(上海)信息技术有限公司 一种基于光滑支撑向量回归融合的二手车估值方法
CN112329805A (zh) * 2020-08-11 2021-02-05 河南师范大学 基于异方差噪声孪生lssvr的风速预报装置及方法
CN112987133B (zh) * 2021-05-14 2021-08-13 郭洪涛 一种基于svr和var的地面风矢量临近预报方法
CN116307282A (zh) * 2023-05-19 2023-06-23 济南作为科技有限公司 一种基于机理模型和数据驱动的风电功率预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202222A (ja) * 2004-01-16 2005-07-28 Toshiba Corp ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
CN103020485A (zh) * 2013-01-08 2013-04-03 天津大学 基于beta噪声核岭回归技术的短期风速预报方法
CN103279672A (zh) * 2013-06-04 2013-09-04 天津大学 基于噪声模型支持向量回归技术的短期风速预报方法
CN106405683A (zh) * 2016-09-29 2017-02-15 河南师范大学 基于g‑l混合噪声特性核岭回归技术的风速预报方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101793907A (zh) * 2010-02-05 2010-08-04 浙江大学 一种风电场短期风速预测方法
CN104992008B (zh) * 2015-06-24 2019-04-02 上海大学 基于Hilbert空间多核函数相乘的风速预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202222A (ja) * 2004-01-16 2005-07-28 Toshiba Corp ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
CN103020485A (zh) * 2013-01-08 2013-04-03 天津大学 基于beta噪声核岭回归技术的短期风速预报方法
CN103279672A (zh) * 2013-06-04 2013-09-04 天津大学 基于噪声模型支持向量回归技术的短期风速预报方法
CN106405683A (zh) * 2016-09-29 2017-02-15 河南师范大学 基于g‑l混合噪声特性核岭回归技术的风速预报方法及装置

Also Published As

Publication number Publication date
CN108520310A (zh) 2018-09-11

Similar Documents

Publication Publication Date Title
CN108520310B (zh) G-L混合噪声特性v-支持向量回归机的风速预报方法
Bisoi et al. Hybrid variational mode decomposition and evolutionary robust kernel extreme learning machine for stock price and movement prediction on daily basis
Dalto et al. Deep neural networks for ultra-short-term wind forecasting
US20210326728A1 (en) Anomaly detection apparatus, anomaly detection method, and program
CN108709745A (zh) 一种基于增强型lpp算法和极限学习机快速轴承故障识别方法
CN108696331B (zh) 一种基于生成对抗网络的信号重构方法
Wang et al. On scalability and robustness limitations of real and asymptotic confidence bounds in social sensing
Kang et al. An improved modified Cholesky decomposition approach for precision matrix estimation
Terefe et al. Time series averaging using multi-tasking autoencoder
Molaei et al. Two‐dimensional DOA estimation for multi‐path environments by accurate separation of signals using k‐medoids clustering
CN106405683B (zh) 基于g-l混合噪声特性核岭回归技术的风速预报方法及装置
Kumar et al. Comparative analysis of SOM neural network with K-means clustering algorithm
Aréchiga et al. Comparison of dimensionality reduction techniques for clustering and visualization of load profiles
Zhu et al. Novel K-Medoids based SMOTE integrated with locality preserving projections for fault diagnosis
Lu et al. Multiple-kernel combination fuzzy clustering for community detection
Aswolinskiy et al. Impact of regularization on the model space for time series classification
Modi et al. Applied research on house price prediction using diverse machine learning techniques
Garcia-Magarinos et al. Lasso logistic regression, GSoft and the cyclic coordinate descent algorithm: application to gene expression data
Cheng et al. Diagnosing the variance shifts signal in multivariate process control using ensemble classifiers
Ahmad Fuzziness-based spatial-spectral class discriminant information preserving active learning for hyperspectral image classification
Ma et al. Fuzzy nodes recognition based on spectral clustering in complex networks
CN112329805A (zh) 基于异方差噪声孪生lssvr的风速预报装置及方法
Chalasani et al. Self organizing maps with the correntropy induced metric
Van Nha et al. A new ensemble approach for hyper-spectral image segmentation
Zhang et al. Modeling of number of sources detection under nonideal conditions based on fuzzy information granulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211203