CN106096646A - 一种支持向量回归机模型选择方法 - Google Patents

一种支持向量回归机模型选择方法 Download PDF

Info

Publication number
CN106096646A
CN106096646A CN201610403137.0A CN201610403137A CN106096646A CN 106096646 A CN106096646 A CN 106096646A CN 201610403137 A CN201610403137 A CN 201610403137A CN 106096646 A CN106096646 A CN 106096646A
Authority
CN
China
Prior art keywords
function
algorithm
parameter
hyper parameter
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610403137.0A
Other languages
English (en)
Inventor
王海伦
许大星
柴国飞
黄钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quzhou University
Original Assignee
Quzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quzhou University filed Critical Quzhou University
Priority to CN201610403137.0A priority Critical patent/CN106096646A/zh
Publication of CN106096646A publication Critical patent/CN106096646A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种支持向量回归机模型选择方法,针对支持向量回归机的模型选择问题提出了一种新的基于混合核函数和容积卡尔曼滤波的支持向量回归机模型选择方法。选择混合核函数作为支持向量机的核函数,把混合核函数的组合系数嵌入到核函数参数与回归参数组成的超参数状态向量当中,从而将模型选择问题转换成一个非线性系统的状态估计问题,然后基于高性能的容积卡尔曼滤波进行超参数估计。仿真实验表明,本文所提方法与单个核函数的容积卡尔曼滤波支持向量回归机模型选择方法、遗传算法相比,该方法得到的决策回归函数具有更大的泛化能力,预测精度更高。

Description

一种支持向量回归机模型选择方法
技术领域
本发明涉及一种支持向量机相关技术,尤其涉及一种支持向量回归机模型选择方法。
背景技术
1995年Corinna Cortes和Vapnik等首先提出了支持向量机(Support VectorMachine,SVM),它是建立在统计学习理论基础之上的通用学习方法。SVM由于其强大的非线性处理能力和泛化能力等特点,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,已经成功的解决了各种非线性和非可分机器学习问题,因此被广泛的应用在分类和回归问题中。但是,支持向量机方法也存在一些亟待解决和完善的问题,主要有:支持向量机分类理论是针对两类分类问题提出的,然而,现实世界的分类问题,如舰船识别、字体识别、人脸识别等都属于多分类的范畴,因此,如何用支持向量机更有效的解决多分类问题;支持向量机在二次寻优过程中要进行大量的矩阵运算,多数情况下,寻优算法占用了大部分的算法时间,这就使得存储空间和和计算时间成了求解二次规划问题的瓶颈,如何解决这一瓶颈问题;核函数以及核参数对支持向量机的分类拟合能力起着关键性作用,如何确定核函数以及最优的核参数以保证算法的有效性。
发明内容
本发明的目的就在于为了解决上述问题而提供一种支持向量回归机模型选择方法。
本发明通过以下技术方案来实现上述目的:
本发明包括参数滤波估计模型的建立、系统设计、预测输出函数、容积卡尔曼滤波、MKF-CKF-SVR模型参数选择;
参数滤波估计模型的建立:建立如下超参数非线性系统
γ(k)=γ(k-1)+w(k) (1)
y(k)=h(γ(k))+v(k) (2)
其中,γ(k)是超参数状态向量,y(k)是观测输出,过程噪声w(k)和观测噪声v(k)均是均值为零的高斯白噪声,且方差分别为Q和R;
由于待求的最优超参数可以看做是固定不变的,所以可以建立式(1)所示的关于超参数的线性状态方程,其次对于任何一个状态向量γ(k),经过LIBSVM训练预测之后每一个原始数据都有一个预测输出,故可建立式(2)所示的非线性观测方程;为了CKF算法的运行,需要对系统模型加入人工过程白噪声和观测白噪声;
系统设计:支持向量回归机:
支持向量回归机的最终目的是找到一个回归函数f:RD→R,使得
y=f(x)=wTφ(x)+b (3)
其中,φ(x)是一个将数据x从低维映射到高维特征空间的函数;w是一个权重向量,并且b是一个上下平移的数值;标准支持向量回归机采用ε-不灵敏函数,假设所有训练数据在精度ε下用线性函数拟合;这时,把问题转化为求优化目标函数最小化问题:
式中,ξi,是松弛因子,当拟合有误差时,ξi,都大于0,误差不存在时为0,优化函数第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;常数C>0表示对超出误差ε的样本的惩罚程度;
将核函数组合系数p1,p2、局部核函数的参数、全局核函数的参数以及惩罚参数C作为支持向量回归机的超参数γ,令k1为局部核函数的核参数向量,k2为全局核函数的核参数向量,则模型(1)中的超参数状态向量γ=[p1,p2,k1,k2,C]T
求解(4)式的凸二次优化问题,引入Lagrange乘子αi,支持向量回归机的原始问题(4)转换成如下对偶形式:
通过求解该对偶问题得到原始问题的解从而构造决策函数;将核函数K(x,x′)代替目标函数(1)中的內积(xi·xj),则得到决策函数为:
其中,按如下方式计算:选择开区间中的若选到的是
若选到的是
预测输出函数:假设支持向量回归机的原始样本数据集合为D={(xi,yi)|i∈I},
其中指标集合I={1,2,...,N},yi为数据的目标向量,运用k-折交叉验证方法将样本数据分成k组,即
Dj={(xi,yi)|i∈Ij} (9)
其中j∈{1,2,...,k},并且所有组的指标集Ij满足I1∪Ij∪…∪Ik=I,所有组的数据集Dj满足D1∪D2∪…∪Dk=D;在每一次支持向量回归的迭代运算中,使用其中任意一组数据Dp用作预测,剩下的k-1组数据作为训练数据库,给定初始的超参数γ0利用LIBSVM[25]训练支持向量回归机;设此时训练结果为则此时的决策函数为:
其中,
将数据组Dp代入式(11),即可得到Dp的预测输出值
分别将数据组Di,i∈{1,2,...,k}作为预测数据组,其余的数据组D1,...,Di-1,Di+1,...,Dk作为支持向量回归机训练数据组,经过k-折交叉验证回归预测之后,样本数据集D中的每一个数据有且仅有一个预测输出值;故对于超参数向量γ,可定义如下预测输出函数:
y=h(γ) (12)
其中,y=(y(1),y(2),...,y(N))T
容积卡尔曼滤波:基于公式(1)、(2)所建立的超参数模型以及预测输出函数(12),下面给出容积卡尔曼滤波算法部分的主要步骤,包括2个过程,即时间更新过程和测量更新过程:
时间更新:
1)假设在k时刻状态误差协方差矩阵已知,按下式分解
P(k-1|k-1)=S(k-1|k-1)ST(k-1|k-1) (13)
2)按下式计算容积点(i=1,2,…,m)
X i ( k - 1 | k - 1 ) = S ( k - 1 | k - 1 ) ξ ( i ) + γ ^ ( k - 1 | k - 1 ) - - - ( 14 )
其中,m=2nx如若状态维数为2,则[1]∈R2,表示集合点且[1]i表示该集合中的第i个向量点;
3)计算传播容积点(i=1,2,…,m)
X i * ( k | k - 1 ) = f ( X i ( k | k - 1 ) ) - - - ( 15 )
4)计算一步状态预测
γ ^ ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) - - - ( 16 )
5)一步预测误差协方差阵为
P ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) X i * T ( k | k - 1 ) - γ ^ ( k | k - 1 ) γ ^ T ( k | k - 1 ) + Q ( k ) - - - ( 17 )
测量更新
1)按下式分解一步预测误差协方差阵
P(k|k-1)=S(k|k-1)ST(k|k-1) (18)
2)计算容积点(i=1,2,…,m)
X i ( k | k - 1 ) = S ( k | k - 1 ) ξ ( i ) + γ ^ ( k | k - 1 ) - - - ( 19 )
3)基于预测输出函数(14)-(17)计算传播容积点
Yi(k|k-1)=h(Xi(k|k-1)) (20)
4)一步测量预测为
y ^ ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) - - - ( 21 )
5)新息协方差矩阵为
P y y ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) Y i T ( k | k - 1 ) - y ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) + R ( k ) - - - ( 22 )
6)计算互协方差矩阵
P x y ( k | k - 1 ) = 1 m Σ i = 1 m X i ( k | k - 1 ) Y i T ( k | k - 1 ) - γ ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) - - - ( 23 )
7)计算增益矩阵
K ( k ) = P x y ( k | k - 1 ) P y y - 1 ( k | k - 1 ) - - - ( 24 )
8)更新估计状态
γ ^ ( k | k ) = γ ^ ( k | k - 1 ) + K ( k ) ( y ( k ) - y ^ ( k | k - 1 ) ) - - - ( 25 )
9)状态误差协方差矩阵为
P(k|k)=P(k|k-1)-K(k)Pyy(k|k-1)KT(k) (31)
Remark 2:由于CKF算法运用了径向积分和球形积分方法,该算法本身比UKF算法具有更高的估计精度;从容积卡尔曼滤波算法对超参数的估计过程来看,主要是在测量更新步骤(20)式中,需要将LIBSVM训练得到的预测输出函数嵌入到传播容积点的计算当中;
MKF-CKF-SVR模型参数选择
在超参数系统(1)-(2)中,观测向量y(k)的真实值在每一次迭代中都是不变的,且就是原始样本数据的目标值向量y(k)=(y1,y2,...,yN)T,故可根据观测向量的真实值y(k)及预测输出值对超参数状态向量γ做最优状态估计,使得真实值与预测输出值的方差达到最小;MKF-CKF-SVR算法同样是包括两个过程,即时间更新过程和测量更新过程:
时间更新:
由于该更新过程是对状态的预测更新,且状态方程是线性已知的,故可根据容积卡尔曼滤波算法的时间跟新过程进行MKF-CKF-SVR算法的时间更新;
测量更新:
在测量更新的过程中需要用到预测输出函数,故不能直接利用CKF算法的公式(17)进行传播容积点的计算;需要由超参数状态向量γ(k),利用LIBSVM训练数据集,再预测输出具体的MKF-CKF-SVR算法步骤:
初始化:
1.1获得原始数据集D,选择混合核函数模型,将组合系数嵌入到超参数状态向量γ当中,设置初始超参数状态值γ0
1.2运用k折交叉验证法首先将原始数据集分成k组D1,D2,…,Dk
While(超参数状态值不满足设定条件)do;
时间更新:
1.3利用公式(12)-(17)对超参数状态进行时间更新
测量更新:
1.4根据公式(17)分解一步预测误差协方差阵
1.5由用公式(18)计算容积点
1.6轮流将k组数据中的一组作为测试集,其它k-1组作为训练集,基于LIBSVM算法对数据集进行训练,最后预测输出
1.7基于预测利用公式(21)计算一步测量预测
1.8运用公式(21)-(25)继续进行测量更新
End while
End
Remark 3:基于混合核函数和容积卡尔曼滤波算法的SVR算法将混合核函数的组合系数与核参数及惩罚参数C作为超参数状态向量,然后利用k-折交叉验证法基于LIBSVM对数据集进行预测输出,最终用CKF算法迭代计算最优的的超参数状态向量;实际上,整个MKF-CKF-SVR算法的过程就是在迭代寻找最优的状态向量γ,使得样本真实目标值y(k)与支持向量回归机的预测输出之间的误差方差最小。
本发明的有益效果在于:
本发明是一种支持向量回归机模型选择方法,与现有技术相比,本发明将混合核函数的组合系数嵌入到核函数参数与回归参数组成的超参数状态向量当中,基于LIBSVM对原始数据集做预测输出,然后用容积卡尔曼滤波对超参数进行自动调整估计。最后以预测太阳黑子数平滑月均值为实验证明了基于本文所提方法得到的超参数能够使得支持向量回归机的泛化能力更强,预测精度更高。
附图说明
图1是本发明的MKF-CKF-SVR超参数调整结构图;
图2是本发明的MKF-CKF-SVR算法的回归预测图;
图3是本发明的RBF-GA-SVR算法的回归预测图。
具体实施方式
下面结合附图对本发明作进一步说明:
如图1所示:MKF-CKF-SVR模型参数选择
下面推导支持向量回归机模型超参数的选择方法,并给出所提算法的具体步骤。设计如图1所示的超参数调整系统,首先利用k-折交叉验证法将原始数据集分成k组,选择局部核函数和全局核函数确定混合核函数,基于该混合核函数用k个子LIBSVM训练此数据集,并将它的预测输出嵌入到容积卡尔曼滤波器当中,将模型的超参数作为系统的状态向量,则整个超参数的调整问题就可作为一个非线性动态系统的滤波估计问题。
本发明包括参数滤波估计模型的建立、系统设计、预测输出函数、容积卡尔曼滤波、MKF-CKF-SVR模型参数选择;
参数滤波估计模型的建立:建立如下超参数非线性系统
γ(k)=γ(k-1)+w(k) (1)
y(k)=h(γ(k))+v(k) (2)
其中,γ(k)是超参数状态向量,y(k)是观测输出,过程噪声w(k)和观测噪声v(k)均是均值为零的高斯白噪声,且方差分别为Q和R;
由于待求的最优超参数可以看做是固定不变的,所以可以建立式(1)所示的关于超参数的线性状态方程,其次对于任何一个状态向量γ(k),经过LIBSVM训练预测之后每一个原始数据都有一个预测输出,故可建立式(2)所示的非线性观测方程;为了CKF算法的运行,需要对系统模型加入人工过程白噪声和观测白噪声;
系统设计:支持向量回归机:
支持向量回归机的最终目的是找到一个回归函数f:RD→R,使得
y=f(x)=wTφ(x)+b (3)
其中,φ(x)是一个将数据x从低维映射到高维特征空间的函数;w是一个权重向量,并且b是一个上下平移的数值;标准支持向量回归机采用ε-不灵敏函数,假设所有训练数据在精度ε下用线性函数拟合;这时,把问题转化为求优化目标函数最小化问题:
式中,ξi,是松弛因子,当拟合有误差时,ξi,都大于0,误差不存在时为0,优化函数第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;常数C>0表示对超出误差ε的样本的惩罚程度;
将核函数组合系数p1,p2、局部核函数的参数、全局核函数的参数以及惩罚参数C作为支持向量回归机的超参数γ,令k1为局部核函数的核参数向量,k2为全局核函数的核参数向量,则模型(1)中的超参数状态向量γ=[p1,p2,k1,k2,C]T
求解(4)式的凸二次优化问题,引入Lagrange乘子αi,支持向量回归机的原始问题(4)转换成如下对偶形式:
通过求解该对偶问题得到原始问题的解从而构造决策函数;将核函数K(x,x′)代替目标函数(1)中的內积(xi·xj),则得到决策函数为:
其中,按如下方式计算:选择开区间中的若选到的是
若选到的是
预测输出函数:假设支持向量回归机的原始样本数据集合为D={(xi,yi)|i∈I},
其中指标集合I={1,2,...,N},yi为数据的目标向量,运用k-折交叉验证方法将样本数据分成k组,即
Dj={(xi,yi)|i∈Ij} (9)
其中j∈{1,2,...,k},并且所有组的指标集Ij满足I1∪Ij∪…∪Ik=I,所有组的数据集Dj满足D1∪D2∪…∪Dk=D;在每一次支持向量回归的迭代运算中,使用其中任意一组数据Dp用作预测,剩下的k-1组数据作为训练数据库,给定初始的超参数γ0利用LIBSVM[25]训练支持向量回归机;设此时训练结果为则此时的决策函数为:
其中,
将数据组Dp代入式(11),即可得到Dp的预测输出值
分别将数据组Di,i∈{1,2,...,k}作为预测数据组,其余的数据组D1,...,Di-1,Di+1,...,Dk作为支持向量回归机训练数据组,经过k-折交叉验证回归预测之后,样本数据集D中的每一个数据有且仅有一个预测输出值;故对于超参数向量γ,可定义如下预测输出函数:
y=h(γ) (12)
其中,y=(y(1),y(2),...,y(N))T
容积卡尔曼滤波:基于公式(1)、(2)所建立的超参数模型以及预测输出函数(12),下面给出容积卡尔曼滤波算法部分的主要步骤,包括2个过程,即时间更新过程和测量更新过程:
时间更新:
6)假设在k时刻状态误差协方差矩阵已知,按下式分解
P(k-1|k-1)=S(k-1|k-1)ST(k-1|k-1) (13)
7)按下式计算容积点(i=1,2,…,m)
X i ( k - 1 | k - 1 ) = S ( k - 1 | k - 1 ) ξ ( i ) + γ ^ ( k - 1 | k - 1 ) - - - ( 14 )
其中,m=2nx如若状态维数为2,则[1]∈R2,表示集合点且[1]i表示该集合中的第i个向量点;
8)计算传播容积点(i=1,2,…,m)
X i * ( k | k - 1 ) = f ( X i ( k | k - 1 ) ) - - - ( 15 )
9)计算一步状态预测
γ ^ ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) - - - ( 16 )
10)一步预测误差协方差阵为
P ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) X i * T ( k | k - 1 ) - γ ^ ( k | k - 1 ) γ ^ T ( k | k - 1 ) + Q ( k ) - - - ( 17 )
测量更新
10)按下式分解一步预测误差协方差阵
P(k|k-1)=S(k|k-1)ST(k|k-1) (18)
11)计算容积点(i=1,2,…,m)
X i ( k | k - 1 ) = S ( k | k - 1 ) ξ ( i ) + γ ^ ( k | k - 1 ) - - - ( 19 )
12)基于预测输出函数(14)-(17)计算传播容积点
Yi(k|k-1)=h(Xi(k|k-1)) (20)
13)一步测量预测为
y ^ ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) - - - ( 21 )
14)新息协方差矩阵为
P y y ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) Y i T ( k | k - 1 ) - y ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) + R ( k ) - - - ( 22 )
15)计算互协方差矩阵
P x y ( k | k - 1 ) = 1 m Σ i = 1 m X i ( k | k - 1 ) Y i T ( k | k - 1 ) - γ ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) - - - ( 23 )
16)计算增益矩阵
K ( k ) = P x y ( k | k - 1 ) P y y - 1 ( k | k - 1 ) - - - ( 24 )
17)更新估计状态
γ ^ ( k | k ) = γ ^ ( k | k - 1 ) + K ( k ) ( y ( k ) - y ^ ( k | k - 1 ) ) - - - ( 25 )
18)状态误差协方差矩阵为
P(k|k)=P(k|k-1)-K(k)Pyy(k|k-1)KT(k) (31)
Remark 2:由于CKF算法运用了径向积分和球形积分方法,该算法本身比UKF算法具有更高的估计精度;从容积卡尔曼滤波算法对超参数的估计过程来看,主要是在测量更新步骤(20)式中,需要将LIBSVM训练得到的预测输出函数嵌入到传播容积点的计算当中;
MKF-CKF-SVR模型参数选择
在超参数系统(1)-(2)中,观测向量y(k)的真实值在每一次迭代中都是不变的,且就是原始样本数据的目标值向量y(k)=(y1,y2,...,yN)T,故可根据观测向量的真实值y(k)及预测输出值对超参数状态向量γ做最优状态估计,使得真实值与预测输出值的方差达到最小;MKF-CKF-SVR算法同样是包括两个过程,即时间更新过程和测量更新过程:
时间更新:
由于该更新过程是对状态的预测更新,且状态方程是线性已知的,故可根据容积卡尔曼滤波算法的时间跟新过程进行MKF-CKF-SVR算法的时间更新;
测量更新:
在测量更新的过程中需要用到预测输出函数,故不能直接利用CKF算法的公式(17)进行传播容积点的计算;需要由超参数状态向量γ(k),利用LIBSVM训练数据集,再预测输出具体的MKF-CKF-SVR算法步骤:
初始化:
1.1获得原始数据集D,选择混合核函数模型,将组合系数嵌入到超参数状态向量γ当中,设置初始超参数状态值γ0
1.2运用k折交叉验证法首先将原始数据集分成k组D1,D2,…,Dk
While(超参数状态值不满足设定条件)do;
时间更新:
1.3利用公式(12)-(17)对超参数状态进行时间更新
测量更新:
1.4根据公式(17)分解一步预测误差协方差阵
1.5由用公式(18)计算容积点
1.6轮流将k组数据中的一组作为测试集,其它k-1组作为训练集,基于LIBSVM算法对数据集进行训练,最后预测输出
1.7基于预测利用公式(21)计算一步测量预测
1.8运用公式(21)-(25)继续进行测量更新
End while
End
Remark 3:基于混合核函数和容积卡尔曼滤波算法的SVR算法将混合核函数的组合系数与核参数及惩罚参数C作为超参数状态向量,然后利用k-折交叉验证法基于LIBSVM对数据集进行预测输出,最终用CKF算法迭代计算最优的的超参数状态向量;实际上,整个MKF-CKF-SVR算法的过程就是在迭代寻找最优的状态向量γ,使得样本真实目标值y(k)与支持向量回归机的预测输出之间的误差方差最小。
算法分析
在基于局部核函数的的支持向量机的算法中,主要是相互之间距离较近的数据点对核函数的值产生影响,而在基于全局核函数的支持向量机算法中,主要是数据集中相互之间的距离较远的点对核函数的值产生影响。在求解实际问题时仅仅采用单一的核函数具有一定的局限性,往往不能使得得到的支持向量回归机性能最优。而混合核函数将两种不同类型的核函数组合之后使得新核函数既具有良好的学习能力又具有较好的推广能力。这就恰好体现了支持向量机在学习能力和推广能力之间两者兼顾的思想。但对于如何选择混合核函数的组合系数仍是个难题,通常采用的方法是专家的先验知识核基于交叉验证的方法,但这些方法都不一定能给出最优的选择参数。本文将构造核函数的组合参数p1,p2与局部核函数的参数、全局核函数的参数以及惩罚参数C放在一起作为支持向量回归机的超参数,事实上,我们可以完全将此时的超参数向量看作是混合核函数的核参数,然后基于高精度的容积卡尔曼滤波算法对超参数向量整体进行状态估计得到支持向量回归机最优的超参数值。
仿真例子
预测太阳黑子数平滑月均值的实验:将利用太阳活动1974年1月至2004年12月的太阳黑子数平滑月均值来预测太阳活动2005年1月至2014年11月的太阳黑子数平滑月均值。试验中的数据来自太阳影响数据分析中心。所有仿真均采用5-折交叉验证。本仿真混合核函数的局部核函数选择RBF核函数,全局核函数选择Sigmoid核函数。则MKF-CKF-SVR算法的超参数向量基于RBF核函数的遗传支持向量回归机算法(RBF-GA-SVR)的超参数向量γ=[σ,C]T。回归预测结果对比如图2和表2所示。
表2超参数估计结果表
从图2、图3可以看出,MKF-CKF-SVR算法与RBF-GA-SVR算法相比,能更好的对原始数据集进行拟合,预测精度更高。从表2的预测样本误差均方误差来看,MKF-CKF-SVR算法的预测样本误差均方误差大大小于RBF-GA-SVR算法,且基于MKF-CKF-SVR算法给出的局部核参数值σ远小于基于RBF-GA-SVR算法,因此,MKF-CKF-SVR算法泛化能力更强。
结论
本发明将混合核函数的组合系数嵌入到核函数参数与回归参数组成的超参数状态向量当中,基于LIBSVM对原始数据集做预测输出,然后用容积卡尔曼滤波对超参数进行自动调整估计。最后以预测太阳黑子数平滑月均值为实验证明了基于本文所提方法得到的超参数能够使得支持向量回归机的泛化能力更强,预测精度更高。
以上显示和描述了本发明的基本原理和主要特征及本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (1)

1.一种支持向量回归机模型选择方法,其特征在于:包括参数滤波估计模型的建立、系统设计、预测输出函数、容积卡尔曼滤波、MKF-CKF-SVR模型参数选择;
参数滤波估计模型的建立:建立如下超参数非线性系统
γ(k)=γ(k-1)+w(k) (1)
y(k)=h(γ(k))+v(k) (2)
其中,γ(k)是超参数状态向量,y(k)是观测输出,过程噪声w(k)和观测噪声v(k)均是均值为零的高斯白噪声,且方差分别为Q和R;
由于待求的最优超参数可以看做是固定不变的,所以可以建立式(1)所示的关于超参数的线性状态方程,其次对于任何一个状态向量γ(k),经过LIBSVM训练预测之后每一个原始数据都有一个预测输出,故可建立式(2)所示的非线性观测方程;为了CKF算法的运行,需要对系统模型加入人工过程白噪声和观测白噪声;
系统设计:支持向量回归机:
支持向量回归机的最终目的是找到一个回归函数f:RD→R,使得
y=f(x)=wTφ(x)+b (3)
其中,φ(x)是一个将数据x从低维映射到高维特征空间的函数;w是一个权重向量,并且b是一个上下平移的数值;标准支持向量回归机采用ε-不灵敏函数,假设所有训练数据在精度ε下用线性函数拟合;这时,把问题转化为求优化目标函数最小化问题:
式中,ξi,是松弛因子,当拟合有误差时,ξi,都大于0,误差不存在时为0,优化函数第一项使拟合函数更为平坦,从而提高泛化能力;第二项为减小误差;常数C>0表示对超出误差ε的样本的惩罚程度;
将核函数组合系数p1,p2、局部核函数的参数、全局核函数的参数以及惩罚参数C作为支持向量回归机的超参数γ,令k1为局部核函数的核参数向量,k2为全局核函数的核参数向量,则模型(1)中的超参数状态向量γ=[p1,p2,k1,k2,C]T
求解(4)式的凸二次优化问题,引入Lagrange乘子αi,支持向量回归机的原始问题(4)转换成如下对偶形式:
通过求解该对偶问题得到原始问题的解从而构造决策函数;将核函数K(x,x')代替目标函数(1)中的內积(xi·xj),则得到决策函数为:
其中,按如下方式计算:选择开区间中的若选到的是
若选到的是
预测输出函数:假设支持向量回归机的原始样本数据集合为D={(xi,yi)|i∈I},其中指标集合I={1,2,...,N},yi为数据的目标向量,运用k-折交叉验证方法将样本数据分成k组,即
Dj={(xi,yi)|i∈Ij} (9)
其中j∈{1,2,...,k},并且所有组的指标集Ij满足I1∪Ij∪…∪Ik=I,所有组的数据集Dj满足D1∪D2∪…∪Dk=D;在每一次支持向量回归的迭代运算中,使用其中任意一组数据Dp用作预测,剩下的k-1组数据作为训练数据库,给定初始的超参数γ0利用LIBSVM[25]训练支持向量回归机;设此时训练结果为则此时的决策函数为:
其中,
将数据组Dp代入式(11),即可得到Dp的预测输出值
分别将数据组Di,i∈{1,2,...,k}作为预测数据组,其余的数据组D1,...,Di-1,Di+1,...,Dk作为支持向量回归机训练数据组,经过k-折交叉验证回归预测之后,样本数据集D中的每一个数据有且仅有一个预测输出值;故对于超参数向量γ,可定义如下预测输出函数:
y=h(γ) (12)
其中,y=(y(1),y(2),...,y(N))T
容积卡尔曼滤波:基于公式(1)、(2)所建立的超参数模型以及预测输出函数(12),下面给出容积卡尔曼滤波算法部分的主要步骤,包括2个过程,即时间更新过程和测量更新过程:
时间更新:
1)假设在k时刻状态误差协方差矩阵已知,按下式分解
P(k-1|k-1)=S(k-1|k-1)ST(k-1|k-1) (13)
2)按下式计算容积点(i=1,2,…,m)
X i ( k - 1 | k - 1 ) = S ( k - 1 | k - 1 ) ξ ( i ) + γ ^ ( k - 1 | k - 1 ) - - - ( 14 )
其中,m=2nx如若状态维数为2,则[1]∈R2,表示集合点且[1]i表示该集合中的第i个向量点;
3)计算传播容积点(i=1,2,…,m)
X i * ( k | k - 1 ) = f ( X i ( k | k - 1 ) ) - - - ( 15 )
4)计算一步状态预测
γ ^ ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) - - - ( 16 )
5)一步预测误差协方差阵为
P ( k | k - 1 ) = 1 m Σ i = 1 m X i * ( k | k - 1 ) X i * T ( k | k - 1 ) - γ ^ ( k | k - 1 ) γ ^ T ( k | k - 1 ) + Q ( k ) - - - ( 17 )
测量更新
1)按下式分解一步预测误差协方差阵
P(k|k-1)=S(k|k-1)ST(k|k-1) (18)
2)计算容积点(i=1,2,…,m)
X i ( k | k - 1 ) = S ( k | k - 1 ) ξ ( i ) + γ ^ ( k | k - 1 ) - - - ( 19 )
3)基于预测输出函数(14)-(17)计算传播容积点
Yi(k|k-1)=h(Xi(k|k-1)) (20)
4)一步测量预测为
y ^ ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) - - - ( 21 )
5)新息协方差矩阵为
P y y ( k | k - 1 ) = 1 m Σ i = 1 m Y i ( k | k - 1 ) Y i T ( k | k - 1 ) - y ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) + R ( k ) - - - ( 22 )
6)计算互协方差矩阵
P x y ( k | k - 1 ) = 1 m Σ i = 1 m X i ( k | k - 1 ) Y i T ( k | k - 1 ) - γ ^ ( k | k - 1 ) y ^ T ( k | k - 1 ) - - - ( 23 )
7)计算增益矩阵
K ( k ) = P x y ( k | k - 1 ) P y y - 1 ( k | k - 1 ) - - - ( 24 )
8)更新估计状态
γ ^ ( k | k ) = γ ^ ( k | k - 1 ) + K ( k ) ( y ( k ) - y ^ ( k | k - 1 ) ) - - - ( 25 )
9)状态误差协方差矩阵为
P(k|k)=P(k|k-1)-K(k)Pyy(k|k-1)KT(k) (31)
Remark 2:由于CKF算法运用了径向积分和球形积分方法,该算法本身比UKF算法具有更高的估计精度;从容积卡尔曼滤波算法对超参数的估计过程来看,主要是在测量更新步骤(20)式中,需要将LIBSVM训练得到的预测输出函数嵌入到传播容积点的计算当中;
MKF-CKF-SVR模型参数选择
在超参数系统(1)-(2)中,观测向量y(k)的真实值在每一次迭代中都是不变的,且就是原始样本数据的目标值向量y(k)=(y1,y2,...,yN)T,故可根据观测向量的真实值y(k)及预测输出值对超参数状态向量γ做最优状态估计,使得真实值与预测输出值的方差达到最小;MKF-CKF-SVR算法同样是包括两个过程,即时间更新过程和测量更新过程:
时间更新:
由于该更新过程是对状态的预测更新,且状态方程是线性已知的,故可根据容积卡尔曼滤波算法的时间跟新过程进行MKF-CKF-SVR算法的时间更新;
测量更新:
在测量更新的过程中需要用到预测输出函数,故不能直接利用CKF算法的公式(17)进行传播容积点的计算;需要由超参数状态向量γ(k),利用LIBSVM训练数据集,再预测输出具体的MKF-CKF-SVR算法步骤:
初始化:
1.1获得原始数据集D,选择混合核函数模型,将组合系数嵌入到超参数状态向量γ当中,设置初始超参数状态值γ0
1.2运用k折交叉验证法首先将原始数据集分成k组D1,D2,…,Dk
While(超参数状态值不满足设定条件)do;
时间更新:
1.3利用公式(12)-(17)对超参数状态进行时间更新
测量更新:
1.4根据公式(17)分解一步预测误差协方差阵
1.5由用公式(18)计算容积点
1.6轮流将k组数据中的一组作为测试集,其它k-1组作为训练集,基于LIBSVM算法对数据集进行训练,最后预测输出
1.7基于预测利用公式(21)计算一步测量预测
1.8运用公式(21)-(25)继续进行测量更新
End while
End
Remark3:基于混合核函数和容积卡尔曼滤波算法的SVR算法将混合核函数的组合系数与核参数及惩罚参数C作为超参数状态向量,然后利用k-折交叉验证法基于LIBSVM对数据集进行预测输出,最终用CKF算法迭代计算最优的的超参数状态向量;实际上,整个MKF-CKF-SVR算法的过程就是在迭代寻找最优的状态向量γ,使得样本真实目标值y(k)与支持向量回归机的预测输出之间的误差方差最小。
CN201610403137.0A 2016-06-07 2016-06-07 一种支持向量回归机模型选择方法 Pending CN106096646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610403137.0A CN106096646A (zh) 2016-06-07 2016-06-07 一种支持向量回归机模型选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610403137.0A CN106096646A (zh) 2016-06-07 2016-06-07 一种支持向量回归机模型选择方法

Publications (1)

Publication Number Publication Date
CN106096646A true CN106096646A (zh) 2016-11-09

Family

ID=57228298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610403137.0A Pending CN106096646A (zh) 2016-06-07 2016-06-07 一种支持向量回归机模型选择方法

Country Status (1)

Country Link
CN (1) CN106096646A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273615A (zh) * 2017-06-15 2017-10-20 东华大学 一种基于机器学习的超宽带微波湿度检测方法
CN107977339A (zh) * 2017-11-07 2018-05-01 武汉大学 一种基于支持向量回归的gis负载能力评估方法
CN108038493A (zh) * 2017-11-24 2018-05-15 东北大学 基于回归智能判别嵌入的工业大数据过程故障监测方法
CN108595764A (zh) * 2018-03-26 2018-09-28 北京航空航天大学 电路模块行为级建模方法及系统
CN108629450A (zh) * 2018-04-26 2018-10-09 东南大学 一种液化天然气公交车尾气排放预测方法
CN108681633A (zh) * 2018-05-11 2018-10-19 上海电力学院 一种基于状态参数的凝结水泵故障预警方法
CN108763826A (zh) * 2018-06-20 2018-11-06 淮阴工学院 一种真空制盐蒸发罐内固液比的动态预测方法
CN108848512A (zh) * 2018-05-30 2018-11-20 江南大学 基于模型选择的svdd无线传感器网络离群数据检测方法
CN108985365A (zh) * 2018-07-05 2018-12-11 重庆大学 基于深度子空间切换集成学习的多源异构数据融合方法
CN109670625A (zh) * 2018-08-28 2019-04-23 江苏方天电力技术有限公司 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
CN110188831A (zh) * 2019-06-04 2019-08-30 哈尔滨理工大学 基于svm的超超临界锅炉受热面污染监测方法
CN112154464A (zh) * 2018-06-19 2020-12-29 株式会社岛津制作所 参数搜索方法、参数搜索装置以及参数搜索用程序
CN112668822A (zh) * 2020-09-14 2021-04-16 徐辉 科技成果转化平台共享系统、方法、存储介质、手机app
CN113435089A (zh) * 2021-06-28 2021-09-24 江苏特威机床制造有限公司 一种基于高斯过程的板材折弯回弹预测方法

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273615A (zh) * 2017-06-15 2017-10-20 东华大学 一种基于机器学习的超宽带微波湿度检测方法
CN107977339A (zh) * 2017-11-07 2018-05-01 武汉大学 一种基于支持向量回归的gis负载能力评估方法
CN108038493A (zh) * 2017-11-24 2018-05-15 东北大学 基于回归智能判别嵌入的工业大数据过程故障监测方法
CN108595764A (zh) * 2018-03-26 2018-09-28 北京航空航天大学 电路模块行为级建模方法及系统
CN108629450A (zh) * 2018-04-26 2018-10-09 东南大学 一种液化天然气公交车尾气排放预测方法
CN108681633A (zh) * 2018-05-11 2018-10-19 上海电力学院 一种基于状态参数的凝结水泵故障预警方法
CN108681633B (zh) * 2018-05-11 2022-03-29 上海电力学院 一种基于状态参数的凝结水泵故障预警方法
CN108848512B (zh) * 2018-05-30 2021-04-30 江南大学 Svdd无线传感器网络离群数据检测方法
CN108848512A (zh) * 2018-05-30 2018-11-20 江南大学 基于模型选择的svdd无线传感器网络离群数据检测方法
CN112154464B (zh) * 2018-06-19 2024-01-02 株式会社岛津制作所 参数搜索方法、参数搜索装置以及参数搜索用程序
CN112154464A (zh) * 2018-06-19 2020-12-29 株式会社岛津制作所 参数搜索方法、参数搜索装置以及参数搜索用程序
CN108763826A (zh) * 2018-06-20 2018-11-06 淮阴工学院 一种真空制盐蒸发罐内固液比的动态预测方法
CN108985365B (zh) * 2018-07-05 2021-10-01 重庆大学 基于深度子空间切换集成学习的多源异构数据融合方法
CN108985365A (zh) * 2018-07-05 2018-12-11 重庆大学 基于深度子空间切换集成学习的多源异构数据融合方法
CN109670625A (zh) * 2018-08-28 2019-04-23 江苏方天电力技术有限公司 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
CN109670625B (zh) * 2018-08-28 2022-06-17 江苏方天电力技术有限公司 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
CN110188831A (zh) * 2019-06-04 2019-08-30 哈尔滨理工大学 基于svm的超超临界锅炉受热面污染监测方法
CN112668822A (zh) * 2020-09-14 2021-04-16 徐辉 科技成果转化平台共享系统、方法、存储介质、手机app
CN112668822B (zh) * 2020-09-14 2021-10-26 徐辉 科技成果转化平台共享系统、方法、存储介质、手机app
CN113435089A (zh) * 2021-06-28 2021-09-24 江苏特威机床制造有限公司 一种基于高斯过程的板材折弯回弹预测方法
CN113435089B (zh) * 2021-06-28 2024-02-27 江苏特威机床制造有限公司 一种基于高斯过程的板材折弯回弹预测方法

Similar Documents

Publication Publication Date Title
CN106096646A (zh) 一种支持向量回归机模型选择方法
CN104077493B (zh) 一种电力继电保护系统状态评估指标体系的构建方法
Rahman et al. Discretization of continuous attributes through low frequency numerical values and attribute interdependency
CN105931116A (zh) 基于深度学习机制的自动化信用评分系统及方法
CN107688701A (zh) 基于wasp模型的水质软测量及水体富营养化评价方法
CN106097204A (zh) 一种面向冷启动学生用户的工作推荐系统及推荐方法
CN106778838A (zh) 一种预测空气质量的方法
CN106681305A (zh) 一种Fast RVM污水处理在线故障诊断方法
CN107798426A (zh) 基于原子分解和交互式模糊满意度的风功率区间预测方法
Rahman et al. Estimation and applications of quantile regression for binary longitudinal data
Rusek The point nuisance method as a decision-support system based on Bayesian inference approach
CN108062566A (zh) 一种基于多核潜在特征提取的智能集成软测量方法
Inyang et al. Fuzzy clustering of students' data repository for at-risks students identification and monitoring
CN110942182A (zh) 一种基于支持向量回归建立台风预测模型的方法
CN104809522A (zh) 一种综合能源预测方法
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN104751254A (zh) 基于非等距加权灰色模型和模糊聚类排序线损率预测方法
Chen et al. Combining fuzzy iteration model with dynamic programming to solve multiobjective multistage decision making problems
Kidd et al. Bayesian nonstationary and nonparametric covariance estimation for large spatial data (with discussion)
Oladokun et al. A fuzzy inference based decision support system for solving the university-course admission choice problem
Zhang et al. The time series prediction algorithm of enrollment based on the hesitancy degree correction rule of vague sets
CN105354644A (zh) 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法
Gritta et al. A review of the history of air carrier bankruptcy forecasting and the application of various models to the US airline industry, 1980-2005
Bolin et al. Scale dependence: Why the average CRPS often is inappropriate for ranking probabilistic forecasts
CN116662468A (zh) 基于地理对象空间模式特征的城市功能区识别方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109

RJ01 Rejection of invention patent application after publication