CN105447520A - 一种基于加权投影对支持向量机的样本分类方法 - Google Patents

一种基于加权投影对支持向量机的样本分类方法 Download PDF

Info

Publication number
CN105447520A
CN105447520A CN201510815688.3A CN201510815688A CN105447520A CN 105447520 A CN105447520 A CN 105447520A CN 201510815688 A CN201510815688 A CN 201510815688A CN 105447520 A CN105447520 A CN 105447520A
Authority
CN
China
Prior art keywords
class
sample
projection
lambda
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510815688.3A
Other languages
English (en)
Inventor
花小朋
孙一颗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangcheng Institute of Technology
Yancheng Institute of Technology
Original Assignee
Yangcheng Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangcheng Institute of Technology filed Critical Yangcheng Institute of Technology
Priority to CN201510815688.3A priority Critical patent/CN105447520A/zh
Publication of CN105447520A publication Critical patent/CN105447520A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于加权投影对支持向量机的样本分类方法,包括以下步骤:在每类样本内部及不同类样本之间分别构造类内近邻图Gs和类间近邻图Gd;依据每类样本的类内近邻图Gs计算样本权值,并计算每类样本的加权均值中心;依据类间近邻图Gd确定离特定类样本较近的相反类样本,并构造线性模式下的优化问题;求解上述优化问题的对偶问题,获得两类样本的决策超平面:xTw1+b1=0和xTw2+b2=0,依据决策超平面对未知样本进行分类,其中,w1、w2为第1类和第2类样本的投影轴,x表示n维度矢量空间中的样本,b1、b2分别表示两类样本决策超平面的偏置。在一定程度上提高了算法的局部学习能力,很大程度上降低了算法求解的计算复杂度。

Description

一种基于加权投影对支持向量机的样本分类方法
技术领域
本发明涉及一种非平行超平面分类器方法,具体地涉及一种基于加权投影对支持向量机的样本分类方法。
背景技术
对于二分类问题,传统支持向量机(supportvectormachine,SVM)依据大间隔原则生成分类超平面,存在的缺陷是计算复杂度高且没有充分考虑样本的分布。近年来,作为SVM的拓展方向之一,以对支持向量机(twinsupportvectormachine,TWSVM)为主要代表的非平行超平面分类器(nonparellelhyperplaneclassifiers,NHCs)正逐渐成为模式识别领域新的研究热点。TWSVM思想源于广义特征值近似支持向量机(generalizedeigenvalueproximalSVM,GEPSVM),将GEPSVM问题转换为两个规模较小的形如SVM的二次规划问题,计算复杂度缩减为SVM的1/4。除了速度上的优势,TWSVM继承了GEPSVM的优势,即线性模式下能够较好地处理异或(XOR)问题。然而,当两类样本具有不同的散度分布时,TWSVM的泛化性能欠佳。
投影对支持向量机(projectiontwinsupportvectormachine,PTSVM),一种新的非平行超平面分类器,与TWSVM不同的是:PTSVM优化目的是为每类样本寻找最佳投影轴,而且通过递归迭代算法,PTSVM能够生成多个正交投影轴。实验结果表明,PTSVM对复杂的XOR问题具有更好的分类能力。为解决非线性分类问题,也有提出PTSVM的非线性方法。
PTSVM算法如下:
给定两类n维的m个训练样本点,分别用m1×n的矩阵A和m2×n的矩阵B表示第1类(+1类)和第2类(-1类),这里m1和m2分别是两类样本的数目,并令m=m1+m2。PTSVM的目标也是在n维空间中寻找两个投影轴w1和w2,要求本类样本投影后尽可能聚集,同时他类样本尽可能分散。事实上,PTSVM优化目标也是在n维空间中寻找两个超平面:
xTw1+b1=0,xTw2+b2=0.(1)
需要注意的是,这里的偏置e1和e2是两个实体为1的列向量, A = [ x 1 ( 1 ) , ... , x m 1 ( 1 ) ] T , B = [ x 1 ( 2 ) , ... , x m 2 ( 2 ) ] T , 表示第i类的第j个样本。
第1类超平面的优化准则为
( P T S V M - 1 ) min 1 2 Σ i = 1 m 1 ( w 1 T x i ( 1 ) - w 1 T 1 m 1 Σ j = 1 m 1 x j ( 1 ) ) 2 + C 1 Σ l = 1 m 2 ξ l s . t . - ( w 1 T x l ( 2 ) - w 1 T 1 m 1 Σ j = 1 m 1 x l ( 1 ) ) + ξ l ≥ 1 , ξ l ≥ 0 , - - - ( 2 )
其中,C1是惩罚参数,ξl为损失变量。令 S 1 = Σ i = 1 m 1 ( x i ( 1 ) - 1 m 1 Σ j = 1 m 1 x j ( 1 ) ) ( x i ( 1 ) - 1 m 1 Σ j = 1 m 1 x j ( 1 ) ) T , 式(2)可用矩阵形式表示为
( P T S V M - 1 ) min 1 2 w 1 T S 1 w 1 T + C 1 e 2 T ξ , s . t . - ( Bw 1 T - 1 m 1 e 2 e 1 T Aw 1 ) + ξ ≥ e 2 , ξ ≥ 0 , - - - ( 3 )
其中ξ=[ξ1,…,ξm2]T
显然,PTSVM的优化目标函数考虑的是样本的散度,类内方差S1反应的是样本的全局分布,不是样本之间的局部几何结构。因此,该方法没有考虑蕴含在样本之间局部鉴别信息。忽视了样本空间的局部结构和局部信息。许多研究结果表明同类数据集中大部分样本在局部上是关联的,即数据集中存在潜藏的局部几何结构,而这种内在的局部信息对数据分类又是至关重要的。这种潜在的局部信息可以通过数据集中样本间的k近邻关系进行挖掘。
发明内容
针对上述技术问题,本发明目的是:提供一种基于加权投影对支持向量机的样本分类方法,通过构造类内近邻图为每个样本获取特定的权值,并且以加权均值取代标准均值,在一定程度上提高了算法的局部学习能力;利用类间近邻图选择相反类中少量的边界样本进行二次规划求解,很大程度上降低了算法求解的计算复杂度。
本发明的技术方案是:
一种基于加权投影对支持向量机的样本分类方法,其特征在于,包括以下步骤:
S01:在每类样本内部及不同类样本之间分别构造类内近邻图Gs和类间近邻图Gd
S02:依据每类样本的类内近邻图Gs计算样本权值,并计算每类样本的加权均值中心;
S03:依据类间近邻图Gd确定离特定类样本较近的相反类样本,并构造线性模式下的优化问题;
S04:求解上述优化问题的对偶问题,获得两类样本的决策超平面:xTw1+b1=0和xTw2+b2=0,依据决策超平面对未知样本进行分类,其中,w1、w2为第1类和第2类样本的投影轴,x表示n维度矢量空间中的样本,b1、b2分别表示两类样本决策超平面的偏置。
优选的,同类中给定的任意两个c类样本mc为c类样本数,则类内近邻图Gs的相似矩阵为:
W i j s = exp ( - | | x i ( c ) - x j ( c ) | | 2 / t ) 0 i f x j ( c ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) o r x i ( c ) i s k n e a r e s t n e i g h b o r s o f x j ( c ) o t h e r w i s e , , - - - ( 4 )
其中t为热核参数;
第c类样本的相反类中任意样本则类间近邻图Gd的相似矩阵为:
W i l d = 1 i f x l ( c ‾ ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) 0 t h e r w i s e , - - - ( 5 )
类中每一个样本定义权重为:
f l ( c ‾ ) = 1 ∃ i , W i l d ≠ 0 , 0 t h e r w i s e . - - - ( 6 )
显然,第类中的那些样本是离第c类样本比较近的边界点;
第1类超平面和第2类超平面优化目标是为第1类和第2类样本寻找最佳投影轴w1和w2,使得权重较大的样本投影后尽可能聚集在加权均值中心附近,第1类超平面优化准则为:
( W P T S V M - 1 ) min 1 2 Σ i = 1 m 1 ρ i ( 1 ) ( w 1 T x i ( 1 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) 2 + C 1 Σ l = 1 m 2 ξ l , s . t . - f l ( 2 ) ( w 1 T x l ( 2 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) + ξ l ≥ f l ( 2 ) , ξ l ≥ 0. - - - ( 7 )
第2类超平面优化准则为:
( W P T S V M - 2 ) min 1 2 Σ l = 1 m 2 ρ l ( 2 ) ( w 2 T x l ( 2 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) 2 + C 2 Σ i = 1 m 1 η i , s . t . f i ( 1 ) ( w 2 T x i ( 1 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) + η i ≥ f i ( 1 ) , η i ≥ 0. - - - ( 8 )
其中,C1和C2是惩罚参数,ξl和ηi为损失变量,c=1、2,代表样本的权重,为第1类样本空间的加权均值,可通过分别求解优化准则式(7)和(8)的对偶问题,获得两类样本的最佳投影轴:
第1类样本投影轴w1为:
w 1 = - ( ( A - e 1 e 1 T E ( 1 ) A ) T D ( 1 ) ( A - e 1 e 1 T E ( 1 ) A ) ) - 1 ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) T α . - - - ( 16 )
第2类样本投影轴w2为:
w 2 = ( ( B - e 2 e 2 T E ( 2 ) B ) T D ( 2 ) ( B - e 2 e 2 T E ( 2 ) B ) ) - 1 ( F ( 1 ) ( A - e 1 e 2 T E ( 2 ) B ) ) T γ . - - - ( 17 )
其中: D ( 1 ) = d i a g ( ρ 1 ( 1 ) , ... , ρ m 1 ( 1 ) ) , D ( 2 ) = d i a g ( ρ 1 ( 2 ) , ... , ρ m 2 ( 2 ) ) , E ( 1 ) = d i a g ( λ 1 ( 1 ) , ... , λ m 1 ( 1 ) ) , E ( 2 ) = d i a g ( λ 1 ( 2 ) , ... , λ m 2 ( 2 ) ) , F ( 1 ) = d i a g ( f 1 ( 1 ) , ... , f m 1 ( 1 ) ) , F ( 2 ) = d i a g ( f 1 ( 2 ) , ... , f m 2 ( 2 ) ) , A ∈ R m 1 × n 表示第1类(即+1类)样本集,表示第2类(即-1类)样本集,为单位1向量, α = [ α 1 , ... , α m 2 ] T γ = [ γ 1 , ... , γ m 1 ] T 是非负拉格朗日乘子;
对于未知样本x,WPTSVM的分类决策函数为:
其中, d c = | w c T x - w c T Σ j = 1 m c λ j ( c ) x j ( c ) | .
优选的,若所述样本的几何结构呈现出高维非线性流行时,构造非线性模式下的优化问题;求解上述优化问题的对偶问题,获得两类样本的决策超平面:K(xT,CT)u1+b1=0和K(xT,CT)u2+b2=0,依据决策超平面对未知样本进行分类;其中,K(,)为高斯核函数,u1和u2分别为第1类和第2类样本的投影矢量,x位n维矢量空间中的样本,C为全体样本集。
优选的,构造第1类决策超平面的优化准则为:
min 1 2 ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) T D ( 1 ) ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + C 1 e 2 T ξ , s . t . - F ( 2 ) ( K ( B , C T ) u 1 - e 2 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + ξ ≥ F ( 2 ) e 2 , ξ ≥ 0. - - - ( 19 )
构造第2类决策超平面的优化准则为:
min 1 2 ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) T D ( 2 ) ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + C 2 e 1 T η , s . t . F ( 1 ) ( K ( A , C T ) u 2 - e 1 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + η ≥ F ( 1 ) e 1 , η ≥ 0. - - - ( 20 )
其中,K(,)为高斯核函数,u1和u2分别为第1类和第2类样本的投影矢量, ξ = ( ξ 1 , ... , ξ m 2 ) T , η = ( η 1 , ... , η m 1 ) T , D ( 1 ) = d i a g ( ρ 1 ( 1 ) , ... , ρ m 1 ( 1 ) ) , D ( 2 ) = d i a g ( ρ 1 ( 2 ) , ... , ρ m 2 ( 2 ) ) , E ( 1 ) = d i a g ( λ 1 ( 1 ) , ... , λ m 1 ( 1 ) ) , E ( 2 ) = d i a g ( λ 1 ( 2 ) , ... , λ m 2 ( 2 ) ) , F ( 1 ) = d i a g ( f 1 ( 1 ) , ... , f m 1 ( 1 ) ) , F ( 2 ) = d i a g ( f 1 ( 2 ) , ... , f m 2 ( 2 ) ) , A ∈ R m 1 × n 表示第1类(即+1类)样本集,表示第2类(即-1类)样本集,为单位1向量,x位n维矢量空间中的样本,C为全体样本集,ξ、η为松弛变量;
通过引入拉格朗日函数,推导出对偶形式,然后通过二次规划求解得出投影矢量u1和u2
对于未知样本x,NWPTSVM的分类决策函数为:
其中, d c = | K ( x T , C T ) u i - Σ j = 1 m c λ j ( c ) K ( ( x j ( c ) ) T , C T ) u i | , i = 1 , 2.
本发明的优点是:
1.通过构造类内近邻图为每个样本获取特定的权值,并且以加权均值取代标准均值,在一定程度上提高了算法的局部学习能力。
2.利用类间近邻图选择相反类中少量的边界样本进行二次规划求解,很大程度上降低了算法求解的计算复杂度。
3.本发明继承了PTSVM的优点,可以看成PTSVM的推广算法。
4.理论分析及其在人造数据集和真实数据集上的测试结果都表明本发明具有更好的分类性能。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明基于加权投影对支持向量机的样本分类方法的流程图;
图2为本发明WPTSVM和PTSVM在人造数据集上的决策超平面。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
实施例:
如图1所示,该方法包括以下步骤:
第一步:在每类样本内部及不同类样本之间分别构造近邻图Gs和Gd
第二步:依据每类样本的近邻图Gs计算样本权值;
第三步:在第二步的基础上计算出每类样本的加权均值中心;
第四步:依据类间近邻图确定离特定类样本较近的相反类样本;
第五步:利用第一、二、三、四步的结果构造线性模式下的优化问题;
第六步:求解第五步优化问题的对偶问题,获得两类样本的决策超平面:xTw1+b1=0和xTw2+b2=0;
第七步:依据第六步的决策超平面对未知样本进行分类。
针对每一类超平面,构造一对k近邻图Gs和Gd分别刻画类内样本的紧凑性及类间样本的分散性。
考虑同类中给定的任意两个c类样本mc为c类样本数,则类内近邻图Gs的相似矩阵为:
W i j s = exp ( - | | x i ( c ) - x j ( c ) | | 2 / t ) 0 i f x j ( c ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) o r x i ( c ) i s k n e a r e s t n e i g h b o r s o f x j ( c ) o t h e r w i s e , , - - - ( 4 )
其中t为热核参数。
考虑第c类样本给定相反类中任意样本则类间近邻图Gd的相似矩阵为:
W i l d = 1 i f x l ( c ‾ ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) 0 t h e r w i s e , - - - ( 5 )
类中每一个样本定义权重为:
f l ( c ‾ ) = 1 ∃ i , W i l d ≠ 0 , 0 t h e r w i s e . - - - ( 6 )
显然,第类中的那些样本是离第c类样本比较近的边界点。
本方法是针对两类样本的二分类问题提出的分类方法。
第1类超平面优化目标是为第1类样本寻找最佳投影轴w1,使得权重较大的样本投影后尽可能聚集在加权均值中心附近。优化准则为:
( W P T S V M - 1 ) min 1 2 Σ i = 1 m 1 ρ i ( 1 ) ( w 1 T x i ( 1 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) 2 + C 1 Σ l = 1 m 2 ξ l , s . t . - f l ( 2 ) ( w 1 T x l ( 2 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) + ξ l ≥ f l ( 2 ) , ξ l ≥ 0. - - - ( 7 )
第2类超平面优化准则为:
( W P T S V M - 2 ) min 1 2 Σ l = 1 m 2 ρ l ( 2 ) ( w 2 T x l ( 2 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) 2 + C 2 Σ i = 1 m 1 η i , s . t . f i ( 1 ) ( w 2 T x i ( 1 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) + η i ≥ f i ( 1 ) , η i ≥ 0. - - - ( 8 )
其中,C1和C2是惩罚参数,ξl和ηi为损失变量,c=1、2。
式(7)中,代表样本的权重,值越大,表示越重要,对保持样本空间局部信息的贡献程度越大;为第1类样本空间的加权均值,比起式(2)中的标准均值更能体现样本空间的局部结构。约束条件表明WPTSVM-1仅仅考虑第2类样本中的边界样本。式(8)有类似的几何解释式。
式(7)矩阵形式为:
( W P T S V M - 1 ) min 1 2 ( Aw 1 - e 1 e 1 T E ( 1 ) Aw 1 ) T D ( 1 ) ( Aw 1 - e 1 e 1 T E ( 1 ) Aw 1 ) + C 1 e 2 T ξ , s . t . - F ( 2 ) ( Bw 1 - e 2 e 1 T E ( 1 ) Aw 1 ) + ξ ≥ F ( 2 ) e 2 , ξ ≥ 0 , - - - ( 9 )
其中: ξ = ( ξ 1 , ... , ξ m 2 ) T , D ( 1 ) = d i a g ( ρ 1 ( 1 ) , ... , ρ m 1 ( 1 ) ) , E ( 1 ) = d i a g ( λ 1 ( 1 ) , ... , λ m 1 ( 1 ) ) , F ( 2 ) = d i a g ( f 1 ( 2 ) , ... , f m 2 ( 2 ) ) . A ∈ R m 1 × n 表示第1类(即+1类)样本集,表示第2类(即-1类)样本集,为单位1向量。
式(9)优化问题对应的拉格朗日形式为:
L ( w 1 , ξ , α T , β T ) = 1 2 ( Aw 1 - e 1 e 1 T E ( 1 ) Aw 1 ) T D ( 1 ) ( Aw 1 - e 1 e 1 T E ( 1 ) Aw 1 ) + C 1 e 2 T ξ + α T ( F ( 2 ) ( Bw 1 - e 2 e 1 T E ( 1 ) Aw 1 ) - ξ + F ( 2 ) e 2 ) - β T ξ . - - - ( 10 )
其中:是非负拉格朗日乘子。令式(10)对w1和ξ的偏导数为0,可得:
∂ L ∂ w 1 = 0 ⇒ w 1 = - ( ( A - e 1 e 1 T E ( 1 ) A ) T D ( 1 ) ( A - e 1 e 1 T E ( 1 ) A ) ) - 1 ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) T α . - - - ( 11 )
∂ L ∂ ξ = 0 ⇒ C 1 e 2 - α - β = 0. - - - ( 12 )
α≥0,β≥0.(13)
式(11)(12)代入(10)得原问题的对偶形式为:
min 1 2 α T ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) ( ( A - e 1 e 1 T E ( 1 ) A ) T D ( 1 ) ( A - e 1 e 1 T E ( 1 ) A ) ) - 1 . ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) T α - e 2 T α , s . t . 0 ≤ α ≤ C 1 e 2 . - - - ( 14 )
由类似的推导方法可得,第2类样本优化准则式(8)对应的对偶形式为:
min 1 2 γ T ( F ( 1 ) ( A - e 1 e 2 T E ( 2 ) B ) ) ( ( B - e 2 e 2 T D ( 2 ) B ) T D ( 2 ) ( B - e 2 e 2 T E ( 2 ) B ) ) - 1 . ( F ( 1 ) ( A - e 1 e 2 T E ( 2 ) B ) ) T γ - e 1 T γ , s . t . 0 ≤ γ ≤ C 2 e 1 . - - - ( 15 )
其中, γ = [ γ 1 , ... , γ m 1 ] T 是非负拉格朗日乘子, D ( 2 ) = d i a g ( ρ 1 ( 2 ) , ... , ρ m 2 ( 2 ) ) , E ( 2 ) = d i a g ( λ 1 ( 2 ) , ... , λ m 2 ( 2 ) ) , F ( 1 ) = d i a g ( f 1 ( 1 ) , ... , f m 1 ( 1 ) ) .
通过分别求解对偶问题式(14)和(15),获得两类样本的最佳投影轴:
第1类样本投影轴w1为:
w 1 = - ( ( A - e 1 e 1 T E ( 1 ) A ) T D ( 1 ) ( A - e 1 e 1 T E ( 1 ) A ) ) - 1 ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) T α . - - - ( 16 )
第2类样本投影轴w2为:
w 2 = ( ( B - e 2 e 2 T E ( 2 ) B ) T D ( 2 ) ( B - e 2 e 2 T E ( 2 ) B ) ) - 1 ( F ( 1 ) ( A - e 1 e 2 T E ( 2 ) B ) ) T γ . - - - ( 17 )
对于未知样本x,WPTSVM的分类决策函数为:
其中, d c = | w c T x - w c T Σ j = 1 m λ j ( c ) x j ( c ) | .
WPTSVM与PTSVM比较:
考虑WPTSVM的第1类样本的优化准则(7)。令则式(7)转化为PTSVM的第1类样本的优化准则(2)。对于WPTSVM的第2类样本的优化准则(8)有类似的特性。因此,PTSVM是WPTSVM的特例,而WPTSVM是PTSVM的推广算法。
WPTSVM算法继承了PTSVM的优点,进一步比较式(14)和(2)可知,PTSVM仅仅考虑类内样本的全局信息,而WPTSVM用加权均值代替PTSVM中标准均值,可以在一定程度上提高算法的局部学习能力,因为基于近邻图的加权均值比起标准均值更能体现样本空间的局部结构。除此之外,WPTSVM还在优化目标函数中引入了样本权值,权值越大,说明该样本越重要,对保持样本空间局部信息的贡献程度越大。图2描述了PTSVM和WPTSVM在人造数据集上的决策超平面。显然,WPTSVM明显区别于PTSVM,WPTSVM的两个超平面在一定程度上反映了两类样本的内在局部流行结构;而PTSVM反映的是每类样本分布的平均信息,图2也进一步证明了PTSVM确实没有考虑样本空间局部几何结构。
从二次规划求解角度分析,PTSVM在训练阶段要针对每类中全部样本进行求解,所以计算复杂度为而WPTSVM优化准则中约束条件指明只对的样本(边界样本)进行二次规划求解,计算复杂度为其中m1-SV,m2-SV分别为第1类样本及第2类样本中相应边界样本点数,WPTSVM在训练阶段要事先求出每个样本的类内权重及类间权重,计算复杂度分别为和o(2m1·m2)。
当样本内在的几何结构呈现出高维非线性流行时,上述线性WPTSVM方法是没有办法得到非线性流行结构的,因此本文进一步提出基于核空间(KFS)的非线性WPTSVM(NWPTSVM)算法。算法步骤为:
第一步:在每类样本内部及不同类样本之间分别构造近邻图Gs和Gd
第二步:依据每类样本的近邻图Gs计算样本权值;
第三步:在第二步的基础上计算出每类样本的加权均值中心;
第四步:依据类间近邻图确定离特定类样本较近的相反类样本;
第五步:利用第一、二、三、四步的结果构造非线性模式下的优化问题;
第六步:求解第五步优化问题的对偶问题,获得两类样本的决策超平面:K(xT,CT)u1+b1=0和K(xT,CT)u2+b2=0;
第七步:依据第六步的决策超平面对未知样本进行分类。
为了获得非线性模式下第1类样本的决策超平面,构造优化问题:
min 1 2 ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) T D ( 1 ) ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + C 1 e 2 T ξ , s . t . - F ( 2 ) ( K ( B , C T ) u 1 - e 2 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + ξ ≥ F ( 2 ) e 2 , ξ ≥ 0. - - - ( 19 )
同样,为了获得非线性模式下第2类样本的决策超平面,构造优化问题:
min 1 2 ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) T D ( 2 ) ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + C 2 e 1 T η , s . t . F ( 1 ) ( K ( A , C T ) u 2 - e 1 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + η ≥ F ( 1 ) e 1 , η ≥ 0. - - - ( 20 )
式(19)(20)中:K(,)为高斯核函数,u1和u2分别为第1类和第2类样本的投影矢量, ξ = ( ξ 1 , ... , ξ m 2 ) T , η = ( η 1 , ... , η m 1 ) T , ξ、η为松弛变量。
通过引入拉格朗日函数,可按照类似上述WPTSVM算法的推导过程分别得出式(18)和(19)的对偶形式,然后通过二次规划求解可求得投影矢量u1和u2
对于未知样本x,NWPTSVM的分类决策函数为:
其中, d c = | K ( x T , C T ) u i - Σ j = 1 m c λ j ( c ) K ( ( x j ( c ) ) ) T , C T ) u i | , i = 1 , 2.
为验证本文WPTSVM方法的有效性,在不同数据集上对其性能进行评估,所采用的数据集有两类:1)人造数据集;2)多个针对不同应用领域的真实数据集。
首先验证WPTSVM测试交叉数据集的能力,使用一种较复杂的人造交叉数据集:ComXor。下表给出了TWSVM、PTSVM和WPTSVM三种算法在该测试数据集上10折交叉验证结果。参数C1与C2的搜索范围为{2i|i=-8,-6,…,+8};WPTSVM中类内近邻参数k1的搜索范围为{1,…,9},类间近邻参数k2=5,热核参数t的搜索范围为{2i|i=-1,0,…,8}。从下表实验结果来看,PTSVM对复杂交叉数据集的测试效果优于TWSVM,而本文WPTSVM则具有更强的测试能力。
数据集two-moons的结构具有明显局部流行,所以该数据集多用于测试算法的局部学习能力。这里通过测试two-moons数据集,并与TWSVM和PTSVM方法进行比较,说明本文WPTSVM方法在处理局部流行数据的有效性。
实验设计:two-moons数据集大小为100,其中正负类数据数各50,随机抽取40%训练集和60%测试集,重复10次,分别记录实验结果,且将实验结果的平均值记录于下表。显然,WPTSVM方法具有更好的测试效果,这说明本文加权措施的确能够在一定程度上提高PTSVM算法的局部学习能力.
抽取该数据集多个分类数据子集来分别测试TWSVM,PTSVM和本文WPTSVM。对于每个数据子集,选用10-折交叉验证方法。实验结果给出了平均识别精度和训练时间。非线性算法采用高斯核函数exp(-||xi-xj||2/σ),核宽参数σ的搜索范围为{2i|i=-1,0,…,7},其它参数搜索范围同上。下表为线性模式下的3种分类方法的测试结果。
下表给出了非线性模式下3种分类方法的测试结果。
从训练时间上看:TWSVM与PTSVM相当,WPTSVM明显比这两种算法快,这主要是因为前两种算法用相反类中全部样本进行二次规划求解,而本文的WPTSVM则用少量边界样本点求解。
从泛化性能上看:相比于TWSVM和PTSVM,本文提出的WPTSVM算法具有更好的分类能力,这也进一步验证了本文提高算法局部学习能力的措施确实有效。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (4)

1.一种基于加权投影对支持向量机的样本分类方法,其特征在于,包括以下步骤:
S01:在每类样本内部及不同类样本之间分别构造类内近邻图Gs和类间近邻图Gd
S02:依据每类样本的类内近邻图Gs计算样本权值,并计算每类样本的加权均值中心;
S03:依据类间近邻图Gd确定离特定类样本较近的相反类样本,并构造线性模式下的优化问题;
S04:求解上述优化问题的对偶问题,获得两类样本的决策超平面:xTw1+b1=0和xTw2+b2=0,依据决策超平面对未知样本进行分类,其中,w1、w2为第1类和第2类样本的投影轴,x表示n维度矢量空间中的样本,b1、b2分别表示两类样本决策超平面的偏置。
2.根据权利要求1所述的基于加权投影对支持向量机的样本分类方法,其特征在于,同类中给定的任意两个c类样本mc为c类样本数,则类内近邻图Gs的相似矩阵为:
W i j s = exp ( - || x i ( c ) - x j ( c ) || 2 / t ) i f x j ( c ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) o r x i ( c ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) , 0 o t h e r w i s e , - - - ( 4 )
其中t为热核参数;
第c类样本的相反类中任意样本则类间近邻图Gd的相似矩阵为:
W i l d = 1 i f x l ( c ‾ ) i s k n e a r e s t n e i g h b o r s o f x i ( c ) , 0 t h e r w i s e . - - - ( 5 )
类中每一个样本定义权重为:
f l ( c ‾ ) = 1 ∃ i , W i l d ≠ 0 , 0 t h e r w i s e . - - - ( 6 )
显然,第类中的那些样本是离第c类样本比较近的边界点;
第1类超平面和第2类超平面优化目标是为第1类和第2类样本寻找最佳投影轴w1和w2,使得权重较大的样本投影后尽可能聚集在加权均值中心附近,第1类超平面优化准则为:
( W P T S V M - 1 ) min 1 2 Σ i = 1 m 1 ρ i ( 1 ) ( w 1 T x i ( 1 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) 2 + C 1 Σ l = 1 m 2 ξ l , s . t . - f l ( 2 ) ( w 1 T x l ( 2 ) - w 1 T Σ j = 1 m 1 λ j ( 1 ) x j ( 1 ) ) + ξ l ≥ f l ( 2 ) , ξ l ≥ 0. - - - ( 7 )
第2类超平面优化准则为:
( W P T S V M - 2 ) min 1 2 Σ l = 1 m 2 ρ l ( 2 ) ( w 2 T x l ( 2 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) 2 + C 2 Σ i = 1 m 1 η i , s . t . f i ( 1 ) ( w 2 T x i ( 1 ) - w 2 T Σ j = 1 m 2 λ j ( 2 ) x j ( 2 ) ) + η i ≥ f l ( 1 ) , η i ≥ 0. - - - ( 8 )
其中,C1和C2是惩罚参数,ξl和ηi为损失变量,c=1、2,代表样本的权重,为第1类样本空间的加权均值,可通过分别求解优化准则式(7)和(8)的对偶问题,获得两类样本的最佳投影轴:
第1类样本投影轴w1为:
w 1 = - ( ( A - e 1 e 1 T E ( 1 ) A ) T D ( 1 ) ( A - e 1 e 1 T E ( 1 ) A ) ) - 1 ( F ( 2 ) ( B - e 2 e 1 T E ( 1 ) A ) ) T α . - - - ( 16 )
第2类样本投影轴w2为:
w 2 = ( ( B - e 2 e 2 T E ( 2 ) B ) T D ( 2 ) ( B - e 2 e 2 T E ( 2 ) B ) ) - 1 ( F ( 1 ) ( A - e 1 e 2 T E ( 2 ) B ) ) T γ . - - - ( 17 )
其中: D ( 1 ) = d i a g ( ρ 1 ( 1 ) , ... , ρ m 1 ( 1 ) ) , D ( 2 ) = d i a g ( ρ 1 ( 2 ) , ... , ρ m 2 ( 2 ) ) , E ( 1 ) = d i a g ( λ 1 ( 1 ) , ... , λ m 1 ( 1 ) ) , E ( 2 ) = d i a g ( λ 1 ( 2 ) , ... , λ m 2 ( 2 ) ) , F ( 1 ) = d i a g ( f 1 ( 1 ) , ... , f m 1 ( 1 ) ) , F ( 2 ) = d i a g ( f 1 ( 2 ) , ... , f m 2 ( 2 ) ) , A ∈ R m 1 × n 表示第1类(即+1类)样本集,表示第2类(即-1类)样本集,为单位1向量, α = [ α 1 , ... , α m 2 ] T γ = [ γ 1 , ... , γ m 1 ] T 是非负拉格朗日乘子;
对于未知样本x,WPTSVM的分类决策函数为:
其中, d c = | w c T x - w c T Σ j = 1 m c λ j ( c ) x j ( c ) | .
3.根据权利要求1所述的基于加权投影对支持向量机的样本分类方法,其特征在于,若所述样本的几何结构呈现出高维非线性流行时,构造非线性模式下的优化问题;求解上述优化问题的对偶问题,获得两类样本的决策超平面:K(xT,CT)u1+b1=0和K(xT,CT)u2+b2=0,依据决策超平面对未知样本进行分类;其中,K(,)为高斯核函数,u1和u2分别为第1类和第2类样本的投影矢量,x位n维矢量空间中的样本,C为全体样本集。
4.根据权利要求3所述的基于加权投影对支持向量机的样本分类方法,其特征在于,构造第1类决策超平面的优化准则为:
min 1 2 ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) T D ( 1 ) ( K ( A , C T ) u 1 - e 1 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + C 1 e 2 T ξ , s . t . - F ( 2 ) ( K ( B , C T ) u 1 - e 2 e 1 T E ( 1 ) K ( A , C T ) u 1 ) + ξ ≥ F ( 2 ) e 2 , ξ ≥ 0. - - - ( 19 )
构造第2类决策超平面的优化准则为:
min 1 2 ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) T D ( 2 ) ( K ( B , C T ) u 2 - e 2 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + C 1 e 1 T η , s . t . F ( 1 ) ( K ( A , C T ) u 2 - e 1 e 2 T E ( 2 ) K ( B , C T ) u 2 ) + η ≥ F ( 1 ) e 1 , η ≥ 0. - - - ( 20 )
其中,K(,)为高斯核函数,u1和u2分别为第1类和第2类样本的投影矢量, ξ = ( ξ 1 , ... , ξ m 2 ) T , η = ( η 1 , ... , η m 1 ) T , D ( 1 ) = d i a g ( ρ 1 ( 1 ) , ... , ρ m 1 ( 1 ) ) , D ( 2 ) = d i a g ( ρ 1 ( 2 ) , ... , ρ m 2 ( 2 ) ) , E ( 1 ) = d i a g ( λ 1 ( 1 ) , ... , λ m 1 ( 1 ) ) , E ( 2 ) = d i a g ( λ 1 ( 2 ) , ... , λ m 2 ( 2 ) ) , F ( 1 ) = d i a g ( f 1 ( 1 ) , ... , f m 1 ( 1 ) ) , F ( 2 ) = d i a g ( f 1 ( 2 ) , ... , f m 2 ( 2 ) ) , A ∈ R m 1 × n 表示第1类(即+1类)样本集,表示第2类(即-1类)样本集,为单位1向量,x位n维矢量空间中的样本,C为全体样本集,ξ、η为松弛变量;
通过引入拉格朗日函数,推导出对偶形式,然后通过二次规划求解得出投影矢量u1和u2
对于未知样本x,NWPTSVM的分类决策函数为:
其中, d c = | K ( x T , C T ) u i - Σ j = 1 m c λ j ( c ) K ( ( x j ( c ) ) T , C T ) u i | , i = 1 , 2.
CN201510815688.3A 2015-11-23 2015-11-23 一种基于加权投影对支持向量机的样本分类方法 Pending CN105447520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510815688.3A CN105447520A (zh) 2015-11-23 2015-11-23 一种基于加权投影对支持向量机的样本分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510815688.3A CN105447520A (zh) 2015-11-23 2015-11-23 一种基于加权投影对支持向量机的样本分类方法

Publications (1)

Publication Number Publication Date
CN105447520A true CN105447520A (zh) 2016-03-30

Family

ID=55557679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510815688.3A Pending CN105447520A (zh) 2015-11-23 2015-11-23 一种基于加权投影对支持向量机的样本分类方法

Country Status (1)

Country Link
CN (1) CN105447520A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106022356A (zh) * 2016-05-11 2016-10-12 华东师范大学 一种基于梯度下降法的多视图gepsvm网页分类算法
CN106156789A (zh) * 2016-05-09 2016-11-23 浙江师范大学 面向增强分类器推广性能的有效特征样本识别技术
CN106469315A (zh) * 2016-09-05 2017-03-01 南京理工大学 基于改进One‑Class SVM算法的多模复合探测目标识别方法
CN106485286A (zh) * 2016-10-29 2017-03-08 华东理工大学 一种基于局部敏感判别的矩阵分类模型
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN113449772A (zh) * 2021-05-26 2021-09-28 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法
CN115270213A (zh) * 2022-06-30 2022-11-01 北京亚控科技发展有限公司 一种实体物当前状态的孪生方法、订阅方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN103886330A (zh) * 2014-03-27 2014-06-25 西安电子科技大学 基于半监督svm集成学习的分类方法
CN104112143A (zh) * 2014-07-23 2014-10-22 大连民族学院 基于加权超球支持向量机算法的图像分类方法
CN104679860A (zh) * 2015-02-27 2015-06-03 北京航空航天大学 一种不平衡数据的分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982343A (zh) * 2012-11-12 2013-03-20 信阳师范学院 手写数字识别的增量式模糊支持向量机方法
CN103886330A (zh) * 2014-03-27 2014-06-25 西安电子科技大学 基于半监督svm集成学习的分类方法
CN104112143A (zh) * 2014-07-23 2014-10-22 大连民族学院 基于加权超球支持向量机算法的图像分类方法
CN104679860A (zh) * 2015-02-27 2015-06-03 北京航空航天大学 一种不平衡数据的分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
花小朋 等: ""基于鲁棒局部嵌入的孪生支持向量机"", 《中南大学学报(自然科学版)》 *
花小朋 等: ""鲁棒的加权孪生支持向量机"", 《中南大学学报(自然科学版)》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156789A (zh) * 2016-05-09 2016-11-23 浙江师范大学 面向增强分类器推广性能的有效特征样本识别技术
CN106022356A (zh) * 2016-05-11 2016-10-12 华东师范大学 一种基于梯度下降法的多视图gepsvm网页分类算法
CN106022356B (zh) * 2016-05-11 2019-07-26 华东师范大学 一种基于梯度下降法的多视图gepsvm网页分类方法
CN106469315A (zh) * 2016-09-05 2017-03-01 南京理工大学 基于改进One‑Class SVM算法的多模复合探测目标识别方法
CN106485286A (zh) * 2016-10-29 2017-03-08 华东理工大学 一种基于局部敏感判别的矩阵分类模型
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN113449772A (zh) * 2021-05-26 2021-09-28 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法
CN115270213A (zh) * 2022-06-30 2022-11-01 北京亚控科技发展有限公司 一种实体物当前状态的孪生方法、订阅方法及系统
CN115270213B (zh) * 2022-06-30 2024-03-01 北京亚控科技发展有限公司 一种实体物当前状态的孪生方法、订阅方法及系统

Similar Documents

Publication Publication Date Title
CN105447520A (zh) 一种基于加权投影对支持向量机的样本分类方法
CN109765333A (zh) 一种基于GoogleNet模型的变压器故障诊断方法
CN107291822A (zh) 基于深度学习的问题分类模型训练方法、分类方法及装置
Diefenbacher et al. DCTRGAN: Improving the precision of generative models with reweighting
CN102156871B (zh) 基于类别相关的码本和分类器投票策略的图像分类方法
CN103544544B (zh) 一种能源消耗预测方法及装置
CN103258210B (zh) 一种基于字典学习的高清图像分类方法
CN104794368A (zh) 基于foa-mksvm的滚动轴承故障分类方法
CN105354595A (zh) 一种鲁棒视觉图像分类方法及系统
CN104408153A (zh) 一种基于多粒度主题模型的短文本哈希学习方法
CN106355192A (zh) 一种基于混沌灰狼优化的支持向量机方法
CN105893876A (zh) 芯片硬件木马检测方法和系统
Loezer et al. Cost-sensitive learning for imbalanced data streams
CN106991049A (zh) 一种软件缺陷预测方法及预测系统
Gao et al. Pattern-based topic models for information filtering
Chen et al. The impact of the spatio-temporal neighborhood effect on urban eco-efficiency in China
CN102915448A (zh) 一种基于AdaBoost的三维模型自动分类方法
Devi et al. A relative evaluation of the performance of ensemble learning in credit scoring
CN110493045A (zh) 一种融合多模体信息的有向网络链路预测方法
CN104978569A (zh) 一种基于稀疏表示的增量人脸识别方法
CN104504391B (zh) 一种基于稀疏特征和马尔科夫随机场的高光谱图像分类方法
Tama et al. An efficientnet-based weighted ensemble model for industrial machine malfunction detection using acoustic signals
CN110222610A (zh) 一种信号分类的方法及装置
Rofik et al. The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques
Kuběnka The factors affecting the accuracy of business failure prediction models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160330

RJ01 Rejection of invention patent application after publication