CN102567742A - 一种基于自适应核函数选择的支持向量机自动分类方法 - Google Patents

一种基于自适应核函数选择的支持向量机自动分类方法 Download PDF

Info

Publication number
CN102567742A
CN102567742A CN2010105888321A CN201010588832A CN102567742A CN 102567742 A CN102567742 A CN 102567742A CN 2010105888321 A CN2010105888321 A CN 2010105888321A CN 201010588832 A CN201010588832 A CN 201010588832A CN 102567742 A CN102567742 A CN 102567742A
Authority
CN
China
Prior art keywords
kernel function
population
self
vector machine
fitness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105888321A
Other languages
English (en)
Inventor
孙显
付琨
陈刚
王宏琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Electronics of CAS
Original Assignee
Institute of Electronics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Electronics of CAS filed Critical Institute of Electronics of CAS
Priority to CN2010105888321A priority Critical patent/CN102567742A/zh
Publication of CN102567742A publication Critical patent/CN102567742A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于自适应核函数选择的支持向量机自动分类方法,涉及图像信息处理技术,步骤为:建立分类图像代表集;统计训练图像的特征向量;结合数据驱动下的机器学习处理思想,提出核函数的原型;基于自适应的遗传算法实现核函数类型及参数的最优选择;使用学习得到的分类器对待分类图像进行分类处理。本发明的自动分类方法,克服了传统的支持向量机模型选择方法中人为指定核函数类型导致模型不能达到最优性能的缺点,能够满足不同场景图像的分类需求。

Description

一种基于自适应核函数选择的支持向量机自动分类方法
技术领域
本发明涉及图像信息处理技术领域中关于图像分类的方法,尤其是一种通过自适应地选择核函数来实现对多类场景图像进行分类的方法。
背景技术
图像分类是指在对图像总体认识的基础上,根据情景信息将多幅图像标记为不同类别的过程。随着图像内容的复杂化和数据量的增大,传统的依靠人工目视对图像进行分类标注的方式逐渐受到挑战,如何自动准确地完成图像分类,已成为信息处理领域的研究热点。
支持向量机(Support Vector machine,SVM)是由Vapnik等人在1992年提出的一种新的机器学习方法。该方法通过引入核方法,将原空间中线性不可分的数据映射到高维特征空间,在克服传统机器学习存在的维数灾难和局部最小问题的同时,实现了数据的线性分类,并在图像分类中取得了一定的效果。
模型选择直接决定支持向量机方法的性能。它主要包括核函数类型的选择、核函数参数以及权衡最大化分类边界和最小化分类误差的惩罚因子C的优化,C可以并入核函数中作为核函数的参数之一。因此,支持向量机模型选择就是核函数类型及其参数的选择。不少学者先后提出若干支持向量机模型选择的方法。
一类方法通过网格算法选择支持向量机模型。由于其实际上是一种穷举搜索算法,当核函数较复杂(参数超过两个)时,时间开销较大,在复杂分类问题中的应用受到限制。
另一类方法基于分类器性能评估准则采用迭代寻优选择支持向量机模型。如Olivier等计算了类器性能评估准则T对于核函数参数的梯度,并采用梯度下降法求解最优模型。Carl等引入了贝叶斯证据理论作为支持向量机分类器性能的评估准则,并采用蒙特卡罗算法推断贝叶斯证据的梯度值。虽然这类方法可以快速得到较好的模型,但是对于初始值较敏感,容易收敛到局部最优值,且要求分类器性能评估准则和核函数对于支持向量机模型参数均为可导。
由于以上两类方法的局限性,一种新的进化方法被用于支持向量机模型的选择。该类方法可以在复杂参数空间进行高效的搜索,主要包括遗传算法、进化程序和进化策略等。Friedrichs等采用遗传策略优化带有尺度因子和旋转因子的高斯核函数,实验表明遗传策略对于参数较多的问题在搜索效率上具有很大的优势。类似的,Ana等在其研究中证明了遗传算法用于复杂参数空间搜索可以获得全局最优值。然而,进化方法仍然存在以下若干问题:(1)进化方法自身的控制参数是根据经验设定的,没有针对具体问题在进化过程中进行动态调整,这会导致算法不稳定以及收敛速度较慢等问题;(2)采用进化方法对支持向量机模型进行选择,优化的核函数类型较单一,核函数的参数也较少,进化算法对于复杂参数空间的高效搜索优势没有得到充分利用;(3)之前的大多研究只把重点放在对核函数参数的选择上,并没有提出有效的核函数类型的选择方法。
发明内容
本发明的目的是提供一种基于自适应核函数选择的支持向量机自动分类方法,以解决不同场景图像的分类问题。
为实现上述目的,本发明的技术方案如下:
一种基于自适应核函数选择的支持向量机自动分类方法,其包括以下步骤:
第一步,建立分类图像代表集;
第二步,依多类图像代表集计算所有训练图像的灰度均值、标准偏差、平滑度、三阶矩、一致性、熵,得到所有训练图像的特征向量;
第三步,结合数据驱动下的机器学习处理思想,提出核函数的原型;
第四步,基于自适应的遗传算法实现核函数类型及参数的最优选择;
第五步,重复第二步,计算得到待分类图像的特征向量;
第六步,使用学习得到的分类器进行处理,得到待分类图像所属的类别。
所述的自动分类方法,其所述第一步,包括:
(1)根据需要定义J个类别的图像或数据,类别编号为1~J,J为自然数;
(2)对每类图像标记出实际所属的类别,选取其中数量为L的图像数据作为训练集,其余图像作为测试集;
(3)将所有J类图像代表合并为多类图像代表集。
所述的自动分类方法,其所述第三步,方法是:
(A)构造满足核函数性质的基本核函数,具体步骤是:
A1、构造多项式核Kpoly,定义为:
Kpoly(xi,xj)=(a(xi·xj)+b)d       (1)
A2、构造径向基核Krbf,定义为:
Krbf(xi,xj)=exp(-γ||xi-xj||2)    (2)
A3、构造神经网络核Ksig,定义为:
Ksig(xi,xj)=tanh(a(xi·xj)+β)    (3)
以上三式中,a,b,α,β,γ为核函数系数,x为核函数中的数据向量。
(B)基于(A)步所得基本核函数,构建核函数原型,定义如下:
K ( x , z ) = λ 1 K poly ( x , z ) θ 1 + λ 2 K rbf ( x , z ) θ 2 + λ 3 K sig ( x , z ) θ 3 - - - ( 4 )
其中,λi,θi∈R+,i=1,2,3,x和z分别为数据向量;根据多项式核与径向基核的表达式,指数因子θ1和θ2可以分别并入核函数自身参数中,使核函数原型简化为如下的普适形式:
K(x,z)=λ1Kpoly(x,z)+λ2Krbf(x,z)+λ3Ksig(x,z)θ    (5)。
所述的自动分类方法,其所述(A)步中,基本核函数应满足以下性质:
假设K1,K2是X×X上的核函数,
Figure BDA0000038244470000041
a∈R+,则下面的函数也是核函数:
(1)K(x,z)=K1(x,z)+K2(x,z)
(2)K(x,z)=K1(x,z)K2(x,z)
(3)K(x,z)=aK1(x,z)。
其中,x和z分别为数据向量。
所述的自动分类方法,其所述第四步中,为了使用自适应遗传算法对核函数的类型和参数进行选择,必须将核函数类型参数和各基本核函数的参数以基因的方式编码到染色体中;染色体编码方式为,λ(21位)和e(4位)为核函数类型参数,a(7位)、b(7位)、Y(12位)、α(12位)和β(12位)为核函数参数,C(15位)为惩罚因子。
所述的自动分类方法,其所述公式(5)的核函数原型中存在两类参数,分别是:核函数类型参数λi和ei,及核函数原型的各基本核函数的参数;基于自适应核函数选择的支持向量机分类方法针对具体问题,选择出最优的
Figure BDA0000038244470000042
然后将代入核函数原型中得到适合该问题的最优的核函数类型。
所述的自动分类方法,其所述第四步,方法是:
(1)采用最佳随机初始化算法形成初始种群,首先随机生成一定数量的个体,然后计算其适应度,从中选择适应度最高的个体加入初始种群,循环这个操作,直到初始种群的大小达到要求为止;
(2)对种群中个体的染色体进行解码形成一组支持向量机模型,在训练集上对这组支持向量机模型进行训练得到一组支持向量机分类器;
(3)采用交叉验证方法对每个支持向量机分类器进行性能评估,将交叉验证准确率作为遗传算法中的适应度函数,而每个个体的适应度值就是每个支持向量机模型对应的交叉验证准确率与所有支持向量机模型交叉验证准确率总和的比值,其值在0~1之间,由此得到种群中每个个体的适应度;
(4)通过自适应方法动态调整种群中个体的交叉概率和变异概率,并据此对种群中的个体进行选择、交叉和变异操作,形成下一代种群;
(5)如果算法的进化代数达到设定的最大值,或者种群中已经产生了最优解,则算法结束;否则重复步骤(2)至(4)。
所述的自动分类方法,其所述第四步的步骤(2),支持向量机分类器的训练方法如下:
假定训练数据集为{(xi,yi)}m,其中,xi是输入向量的第i个样本,xi∈Rd,m是样本容量,yi∈{-1,+1}是第i个样本的类别;目标是寻找一个最优的分类超平面:wTx+b=0,使其将训练数据线性分开,并能获得最大分类间隔,其中w是分类超平面的法向量,b为超平面的偏移量;
求解最优分类超平面的问题,被转化成下面的二次最优化问题:
min w , b , ξ 1 2 | | w | | + C Σ i = 1 m ξ i y i ( ( w · x ) + b ) ≥ 1 - ξ i , i = 1 , . . . , m ξ i ≥ 0 - - - ( 6 )
其中,ξi是松弛变量,C是一个可调节的参数,用来权衡最大化分类间隔和最小化训练误差;
其最终的决策函数为:
f(x)=sgn((w*·x)+b*)        (7)
其中,w*和b*是最优超平面的参数;
引入核函数的支持向量机分类器的表示如下:
max a Σ i = 1 m a i - 1 2 Σ i , j = 1 m a i a j y i y j K ( x i , x j ) Σ i = 1 m a i y i = 0 0 ≤ a i ≤ C ∀ i - - - ( 8 )
其决策函数为:
f ( x ) = sgn ( Σ i = 1 m a i y i K ( x , x i ) + b * ) - - - ( 9 ) .
所述的自动分类方法,其所述第四步的步骤(4),步骤为:
4a、从种群中选择适应度最高的个体,并采用经典的轮盘赌算法选择出适应度较高的个体,这些个体经过繁殖形成下一代种群,使得在维持种群规模不变的同时,保证种群中出现的最佳个体是历史最优的;
4b、交叉操作使得种群中个体的基因进行重组,产生出新的基因型,采用自适应交叉算子根据个体的适应度对其交叉概率进行动态调整,保证新的基因型获得更好的解;
4c、变异算子用于恢复种群进化过程中丢失的遗传信息,与构造上述自适应交叉算子的原理类似,采用自适应变异算子动态调整种群的变异概率。
所述的自动分类方法,其所述第四步的步骤(4)4a中,自适应交叉算子的计算方式如下:
p c = f max - f ′ f max - f ′ , f ′ > f ‾ - - - ( 10 )
pc=1.0, f ′ ≤ f ‾ - - - ( 11 )
其中,pc是遗传算法中的交叉概率,f′是进行交叉的两个个体中较大的适应度,fmax是种群中个体的最大适应度,
Figure BDA0000038244470000065
是种群的平均适应度;
所述的自动分类方法,其所述第四步的步骤(4)4c中,自适应变异算子的计算方式如下:
p m = 0.5 ( f max - f ) f max - f , f > f ‾ - - - ( 12 )
pc=0.5, f ≤ f ‾ - - - ( 13 )
其中pm是遗传算法中的变异概率,f是种群中个体的适应度。
本发明的一种基于自适应核函数选择的支持向量机自动分类方法,针对具体问题选择最优核函数类型及相应的最优核函数参数,克服了传统的支持向量机模型选择方法中人为指定核函数类型导致模型不能达到最优性能的缺点。同时它将遗传算法自身控制参数的优化和支持向量机模型的选择统一在一个完整的进化过程中,通过动态调整遗传算法的控制参数,提高了整个支持向量机模型选择方法的收敛速度,并且克服了一般遗传算法控制参数固定不变用于支持向量机模型时选择容易陷入局部最优值的问题。本发明的方法提高了支持向量机模型选择的性能,能够满足不同场景图像的分类需求。
附图说明
图1为本发明基于自适应核函数选择的支持向量机自动分类方法的流程示意图。
图2为采用本发明方法和相关方法在标准数据集上进行分类试验的结果比较。
图3为采用本发明方法在标准数据集上选择的最优核函数类型。
具体实施方式
图1为本发明一种基于自适应核函数选择的支持向量机自动分类方法的流程示意图,具体包括:
步骤1,建立分类图像代表集。具体步骤包括:
1.1、根据需要定义J个类别的图像或数据,类别编号为1~J,J为自然数;
1.2、对每类图像标记出实际所属的类别,选取其中数量为L的图像数据作为训练集,其余图像作为测试集。在实际处理中,实验数据主要取自于LibSVM官方网站上的4个标准数据集,其中Fourclass数据集包括862个样本、2个特征、2个类别,Iris数据集包括150个样本、4个特征、3个类别,Australian数据集包括690个样本、14个特征、2个类别,Vehicle数据集包括846个样本、18个特征、4个类别。为保证训练得到分类器的有效性,L取值一般应在100以上;
1.3、将所有J类图像代表合并为多类图像代表集;
步骤2,依此计算所有训练图像的灰度均值、标准偏差、平滑度、三阶矩、一致性、熵等6类统计特征,得到所有训练图像的特征向量;
步骤3,提出核函数的原型。具体步骤包括:
3.1、构造满足核函数性质的基本核函数,具体步骤是:
3.1.1、构造多项式核Kpoly,定义为:
Kpoly(xi,xj)=(a(xi·xj)+b)d      (1)
3.1.2、构造径向基核Krbf,定义为:
Krbf(xi,xj)=exp(-γ||xi-xj||2)   (2)
3.1.3、构造神经网络核Ksig,定义为:
Ksig(xi,xj)=tanh(a(xi·xj)+β)   (3)
以上三式中,a,b,α,β,γ分别为核函数系数,x为核函数中的数据向量。
3.2、基于上述基本核函数,构建核函数原型,定义如下:
K ( x , z ) = λ 1 K poly ( x , z ) θ 1 + λ 2 K rbf ( x , z ) θ 2 + λ 3 K sig ( x , z ) θ 3 - - - ( 4 )
其中,λi,θi∈R+,i=1,2,3,x和z分别为数据向量;根据多项式核与径向基核的表达式,指数因子θ1和θ2可以分别并入核函数自身参数中,使核函数原型简化为如下的普适形式:
K(x,z)=λ1Kpoly(x,z)+λ2Krbf(x,z)+λ3Ksig(x,z)θ    (5)
步骤4,基于自适应的遗传算法实现核函数类型及参数的最优选择。在公式(5)的核函数原型中存在两类参数,分别是:核函数类型参数λi和ei,以及核函数原型的各基本核函数的参数。基于自适应核函数选择的支持向量机分类方法针对具体问题,选择出最优的
Figure BDA0000038244470000091
Figure BDA0000038244470000092
然后将
Figure BDA0000038244470000093
Figure BDA0000038244470000094
代入核函数原型中得到适合该问题的最优的核函数类型。具体步骤是:
4.1、采用最佳随机初始化算法形成初始种群,首先随机生成一定数量的个体,然后计算其适应度,从中选择适应度最高的个体加入初始种群,循环这个操作,直到初始种群的大小达到要求为止;
4.2、对种群中个体的染色体进行解码形成一组支持向量机模型,在训练集上对这组支持向量机模型进行训练得到一组支持向量机分类器;
4.3、采用交叉验证方法对每个支持向量机分类器进行性能评估,将交叉验证准确率作为遗传算法中的适应度函数,而每个个体的适应度值就是每个支持向量机模型对应的交叉验证准确率与所有支持向量机模型交叉验证准确率总和的比值,其值在0~1之间,由此得到种群中每个个体的适应度;
4.4、通过自适应方法动态调整种群中个体的交叉概率和变异概率,并据此对种群中的个体进行选择、交叉和变异操作,形成下一代种群,具体步骤为:
4.4.1、从种群中选择适应度最高的个体,并采用经典的轮盘赌算法选择出适应度较高的个体,这些个体经过繁殖形成下一代种群,使得在维持种群规模不变的同时,保证种群中出现的最佳个体是历史最优的;
4.4.2、交叉操作使得种群中个体的基因进行重组,产生出新的基因型,采用自适应交叉算子根据个体的适应度对其交叉概率进行动态调整,保证新的基因型可以获得更好的解;
4.4.3、变异算子用于恢复种群进化过程中丢失的遗传信息。与构造上述自适应交叉算子的原理类似,采用自适应变异算子动态调整种群的变异概率;
4.5、如果算法的进化代数达到设定的最大值,或者种群中已经产生了最优解,则算法结束;否则重复步骤4.2至4.4。
步骤5,重复步骤2,计算得到待分类图像的特征向量,使用学习得到的分类器进行处理,得到待分类图像所属的类别。
本发明的方法,其所述步骤3.1中,基本核函数应满足以下性质:
假设K1,K2是X×X上的核函数,
Figure BDA0000038244470000101
a∈R+,则下面的函数也是核函数:
(1)K(x,z)=K1(x,z)+K2(x,z)
(2)K(x,z)=K1(x,z)K2(x,z)
(3)K(x,z)=aK1(x,z)
其中,x和z分别为数据向量。
本发明的方法,其所述步骤4.2中,支持向量机分类器的训练方法如下:
假定训练数据集为{(xi,yi)}m,其中,xi是输入向量的第i个样本,xi∈Rd,m是样本容量,yi∈{-1,+1}是第i个样本的类别。目标是寻找一个最优的分类超平面:wTx+b=0,使其可以将训练数据线性分开,并能获得最大分类间隔,其中,w是分类超平面的法向量,b为超平面的偏移量。求解最优分类超平面的问题最终被转化下面的二次最优化问题:
min w , b , ξ 1 2 | | w | | + C Σ i = 1 m ξ i y i ( ( w · x ) + b ) ≥ 1 - ξ i , i = 1 , . . . , m ξ i ≥ 0 - - - ( 6 )
其中,ξi是松弛变量,C是一个可调节的参数,用来权衡最大化分类间隔和最小化训练误差。
最终的决策函数为:
f(x)=sgn((w*·x)+b*)        (7)
其中w*和b*是最优超平面的参数。
核函数的引入很容易将基本的线性分类扩展到非线性分类,同时也使支持向量机克服了传统机器学习算法固有的维数灾难问题。引入核函数的支持向量机分类器的表示如下:
max a Σ i = 1 m a i - 1 2 Σ i , j = 1 m a i a j y i y j K ( x i , x j ) Σ i = 1 m a i y i = 0 0 ≤ a i ≤ C ∀ i - - - ( 8 )
决策函数为:
f ( x ) = sgn ( Σ i = 1 m a i y i K ( x , x i ) + b * ) - - - ( 9 )
本发明的方法,其所述步骤4.2中,为了使用自适应遗传算法对核函数的类型和参数进行选择,必须将核函数类型参数和各基本核函数的参数以基因的方式编码到染色体中。染色体编码方式为,λ(21位)和e(4位)为核函数类型参数,a(7位)、b(7位)、Y(12位)、α(12位)和β(12位)为核函数参数,C(15位)为惩罚因子。
本发明的方法,其所述步骤4.4.2中,自适应交叉算子的计算方式如下:
p c = f max - f ′ f max - f ′ , f ′ > f ‾ - - - ( 10 )
pc=1.0, f ′ ≤ f ‾ - - - ( 11 )
其中pc是遗传算法中的交叉概率,f′是进行交叉的两个个体中较大的适应度,fmax是种群中个体的最大适应度,
Figure BDA0000038244470000115
是种群的平均适应度。
本发明的方法,其所述步骤4.4.3中,自适应变异算子的计算方式如下:
p m = 0.5 ( f max - f ) f max - f , f > f ‾ - - - ( 12 )
pc=0.5, f ≤ f ‾ - - - ( 13 )
其中pm是遗传算法中的变异概率,f是种群中个体的适应度。
图2对采用本发明方法和其他相关方法(网格算法、标准遗传算法)在标准数据集上进行分类试验的结果进行比较。其中对于内容较简单的Fourclass数据集,三种算法选择出来的支持向量机模型均有最好的性能,其交叉验证准确性均为100%,但是本发明方法的收敛速度比标准遗传算法更快,这是由于本发明方法根据每个个体的适应度对其交叉和变异概率进行动态调整的结果。本发明方法在Iris数据集上经过133代的进化获得了一个最佳的适应度,而标准遗传算法在相同的数据集上经过了30代的进化收敛到一个较差的适应度,这反映出标准遗传算法在固定的不合适的交叉和变异概率的控制下容易导致种群进入“早熟”的状态,即过早的收敛于一个较差的适应度。对于Australian数据集,网格算法与标准遗传算法选择出来的支持向量机模型的性能相当,标准遗传算法选择出来的模型性能略低一些,这反映了其由于其固定的交叉概率和变异概率而容易陷入局部最优值的缺点;实验在Vehicle数据集上的结果反映了相同的结论。
纵观整个性能比较实验,本发明方法选择出来的支持向量机模型的性能普遍优于标准遗传算法和网格算法选择出来的模型,并且本发明方法用于模型选择的收敛速度远高于其他相关方法。4个标准支持向量机数据集上的结果均证明了本发明方法用于支持向量机模型选择的有效性和高效性。图3中列出了本发明方法用于各数据集得到的最优支持向量机核函数类型。

Claims (11)

1.一种基于自适应核函数选择的支持向量机自动分类方法,其特征在于:包括以下步骤:
第一步,建立分类图像代表集;
第二步,依多类图像代表集计算所有训练图像的灰度均值、标准偏差、平滑度、三阶矩、一致性、熵,得到所有训练图像的特征向量;
第三步,结合数据驱动下的机器学习处理思想,提出核函数的原型;
第四步,基于自适应的遗传算法实现核函数类型及参数的最优选择;
第五步,重复第二步,计算得到待分类图像的特征向量;
第六步,使用学习得到的分类器进行处理,得到待分类图像所属的类别。
2.如权利要求1所述的自动分类方法,其特征在于:所述第一步,包括:
(1)根据需要定义J个类别的图像或数据,类别编号为1~J,J为自然数;
(2)对每类图像标记出实际所属的类别,选取其中数量为L的图像数据作为训练集,其余图像作为测试集;
(3)将所有J类图像代表合并为多类图像代表集。
3.如权利要求1所述的自动分类方法,其特征在于:所述第三步,方法是:
(A)构造满足核函数性质的基本核函数,具体步骤是:
A1、构造多项式核Kpoly,定义为:
Kpoly(xi,xj)=(a(xi·xj)+b)d       (1)
A2、构造径向基核Krbf,定义为:
Krbf(xi,xj)=exp(-γ||xi-xj||2)    (2)
A3、构造神经网络核Ksig,定义为:
Ksig(xi,xj)=tanh(a(xi·xj)+β)    (3)
以上三式中,a,b,α,β,γ分别为核函数系数,x为核函数中的数据向量。
(B)基于(A)步所得基本核函数,构建核函数原型,定义如下:
K ( x , z ) = λ 1 K poly ( x , z ) θ 1 + λ 2 K rbf ( x , z ) θ 2 + λ 3 K sig ( x , z ) θ 3 - - - ( 4 )
其中,λi,θi∈R+,i=1,2,3,x和z分别为数据向量;根据多项式核与径向基核的表达式,指数因子θ1和θ2可以分别并入核函数自身参数中,使核函数原型简化为如下的普适形式:
K(x,z)=λ1Kpoly(x,z)+λ2Krbf(x,z)+λ3Ksig(x,z)θ    (5)。
4.如权利要求3所述的自动分类方法,其特征在于:所述(A)步中,基本核函数应满足以下性质:
假设K1,K2是X×X上的核函数,
Figure FDA0000038244460000022
a∈R+,则下面的函数也是核函数:
(1)K(x,z)=K1(x,z)+K2(x,z)
(2)K(x,z)=K1(x,z)K2(x,z)
(3)K(x,z)=aK1(x,z)。
其中,x和z分别为数据向量。
5.如权利要求1所述的自动分类方法,其特征在于:所述第四步中,为了使用自适应遗传算法对核函数的类型和参数进行选择,必须将核函数类型参数和各基本核函数的参数以基因的方式编码到染色体中;染色体编码方式为,λ(21位)和e(4位)为核函数类型参数,a(7位)、b(7位)、Y(12位)、α(12位)和β(12位)为核函数参数,C(15位)为惩罚因子。
6.如权利要求3所述的自动分类方法,其特征在于:所述公式(5)的核函数原型中存在两类参数,分别是:核函数类型参数λi和ei,及核函数原型的各基本核函数的参数;基于自适应核函数选择的支持向量机分类方法针对具体问题,选择出最优的
Figure FDA0000038244460000023
Figure FDA0000038244460000024
然后将
Figure FDA0000038244460000025
代入核函数原型中得到适合该问题的最优的核函数类型。
7.如权利要求1或6所述的自动分类方法,其特征在于:所述第四步,方法是:
(1)采用最佳随机初始化算法形成初始种群,首先随机生成一定数量的个体,然后计算其适应度,从中选择适应度最高的个体加入初始种群,循环这个操作,直到初始种群的大小达到要求为止;
(2)对种群中个体的染色体进行解码形成一组支持向量机模型,在训练集上对这组支持向量机模型进行训练得到一组支持向量机分类器;
(3)采用交叉验证方法对每个支持向量机分类器进行性能评估,将交叉验证准确率作为遗传算法中的适应度函数,而每个个体的适应度值就是每个支持向量机模型对应的交叉验证准确率与所有支持向量机模型交叉验证准确率总和的比值,其值在0~1之间,由此得到种群中每个个体的适应度;
(4)通过自适应方法动态调整种群中个体的交叉概率和变异概率,并据此对种群中的个体进行选择、交叉和变异操作,形成下一代种群;
(5)如果算法的进化代数达到设定的最大值,或者种群中已经产生了最优解,则算法结束;否则重复步骤(2)至(4)。
8.如权利要求7所述的自动分类方法,其特征在于:所述第四步的步骤(2),支持向量机分类器的训练方法如下:
假定训练数据集为{(xi,yi)}m,其中,xi是输入向量的第i个样本,xi∈R,m是样本容量,yi∈{-1,+1}是第i个样本的类别;目标是寻找一个最优的分类超平面:wTx+b=0,使其将训练数据线性分开,并能获得最大分类间隔,其中,w是分类超平面的法向量,b为超平面的偏移量;
求解最优分类超平面的问题,被转化成下面的二次最优化问题:
min w , b , ξ 1 2 | | w | | + C Σ i = 1 m ξ i y i ( ( w · x ) + b ) ≥ 1 - ξ i , i = 1 , . . . , m ξ i ≥ 0 - - - ( 6 )
其中,ξi是松弛变量,C是一个可调节的参数,用来权衡最大化分类间隔和最小化训练误差;
其最终的决策函数为:
f(x)=sgn((w*·x)+b*)    (7)
其中,w*和b*是最优超平面的参数;
引入核函数的支持向量机分类器的表示如下:
max a Σ i = 1 m a i - 1 2 Σ i , j = 1 m a i a j y i y j K ( x i , x j ) Σ i = 1 m a i y i = 0 0 ≤ a i ≤ C ∀ i - - - ( 8 )
其决策函数为:
f ( x ) = sgn ( Σ i = 1 m a i y i K ( x , x i ) + b * ) - - - ( 9 ) .
9.如权利要求7所述的自动分类方法,其特征在于:所述第四步的步骤(4),步骤为:
4a、从种群中选择适应度最高的个体,并采用经典的轮盘赌算法选择出适应度较高的个体,这些个体经过繁殖形成下一代种群,使得在维持种群规模不变的同时,保证种群中出现的最佳个体是历史最优的;
4b、交叉操作使得种群中个体的基因进行重组,产生出新的基因型,采用自适应交叉算子根据个体的适应度对其交叉概率进行动态调整,保证新的基因型获得更好的解;
4c、变异算子用于恢复种群进化过程中丢失的遗传信息,与构造上述自适应交叉算子的原理类似,采用自适应变异算子动态调整种群的变异概率。
10.如权利要求9所述的自动分类方法,其特征在于:所述第四步的步骤(4)4a中,自适应交叉算子的计算方式如下:
p c = f max - f ′ f max - f ′ , f ′ > f ‾ - - - ( 10 )
pc=1.0, f ′ ≤ f ‾ - - - ( 11 )
其中,pc是遗传算法中的交叉概率,f′是进行交叉的两个个体中较大的适应度,fmax是种群中个体的最大适应度,
Figure FDA0000038244460000052
是种群的平均适应度;
11.如权利要求9所述的自动分类方法,其特征在于:所述第四步的步骤(4)4c中,自适应变异算子的计算方式如下:
p m = 0.5 ( f max - f ) f max - f , f > f ‾ - - - ( 12 )
pc=0.5, f ≤ f ‾ - - - ( 13 )
其中pm是遗传算法中的变异概率,f是种群中个体的适应度。
CN2010105888321A 2010-12-15 2010-12-15 一种基于自适应核函数选择的支持向量机自动分类方法 Pending CN102567742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105888321A CN102567742A (zh) 2010-12-15 2010-12-15 一种基于自适应核函数选择的支持向量机自动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105888321A CN102567742A (zh) 2010-12-15 2010-12-15 一种基于自适应核函数选择的支持向量机自动分类方法

Publications (1)

Publication Number Publication Date
CN102567742A true CN102567742A (zh) 2012-07-11

Family

ID=46413115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105888321A Pending CN102567742A (zh) 2010-12-15 2010-12-15 一种基于自适应核函数选择的支持向量机自动分类方法

Country Status (1)

Country Link
CN (1) CN102567742A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999756A (zh) * 2012-11-09 2013-03-27 重庆邮电大学 基于gpu实现pso-svm对道路标志的识别方法
CN103559294A (zh) * 2013-11-12 2014-02-05 中国石油大学(北京) 支持向量机分类器的构造方法及装置、分类方法及装置
CN103605813A (zh) * 2013-12-10 2014-02-26 电子科技大学 一种域适应学习的最优核组合选择方法
CN103678681A (zh) * 2013-12-25 2014-03-26 中国科学院深圳先进技术研究院 基于大规模数据的自适应参数的多核学习分类方法
CN103824093A (zh) * 2014-03-19 2014-05-28 北京航空航天大学 一种基于kfda及svm的sar图像目标特征提取与识别方法
CN103971136A (zh) * 2014-05-04 2014-08-06 南京师范大学 一种面向大规模数据的并行结构化支持向量机分类方法
CN103967478A (zh) * 2014-05-21 2014-08-06 北京航空航天大学 一种基于电导探针的垂直井流型辨识方法
CN104346630A (zh) * 2014-10-27 2015-02-11 华南理工大学 一种异构特征融合的云花卉识别方法
CN105354600A (zh) * 2015-09-28 2016-02-24 南京大学 一种砂岩显微薄片的自动分类方法
CN105388402A (zh) * 2015-10-30 2016-03-09 山东电力研究院 基于参数优化svm算法的交联电缆局部放电模式识别方法
CN105488528A (zh) * 2015-11-26 2016-04-13 北京工业大学 基于改进自适应遗传算法的神经网络图像分类方法
CN105930876A (zh) * 2016-05-13 2016-09-07 华侨大学 一种基于逆向训练的植物图像集分类方法
CN106548207A (zh) * 2016-11-03 2017-03-29 北京图森互联科技有限责任公司 一种基于神经网络的图像处理方法及装置
CN106897703A (zh) * 2017-02-27 2017-06-27 辽宁工程技术大学 基于aga‑pkf‑svm的遥感影像分类方法
CN107064794A (zh) * 2016-12-16 2017-08-18 南阳师范学院 一种基于遗传算法的防爆电机故障检测方法
CN107276702A (zh) * 2017-07-17 2017-10-20 北京科技大学 一种认知无线电网络中实时检测多主用户数目的方法
CN107280666A (zh) * 2017-08-08 2017-10-24 中山大学孙逸仙纪念医院 一种基于机器学习的耳聋患者ci术后康复预测方法及系统
CN107341576A (zh) * 2017-07-14 2017-11-10 河北百斛环保科技有限公司 一种大数据可视化的空气污染溯源和走向预测方法
CN107465664A (zh) * 2017-07-07 2017-12-12 桂林电子科技大学 基于并行多人工蜂群算法和支持向量机的入侵检测方法
CN108536730A (zh) * 2018-02-27 2018-09-14 南京邮电大学 一种混合傅里叶核函数支持向量机文本分类方法
CN109145933A (zh) * 2017-06-28 2019-01-04 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN109993183A (zh) * 2017-12-30 2019-07-09 中国移动通信集团四川有限公司 网络故障评估方法、装置、计算设备及存储介质
CN110454684A (zh) * 2019-04-10 2019-11-15 重庆大学 一种城市天然气管网泄漏的故障定位检测方法
CN110866562A (zh) * 2019-11-20 2020-03-06 江苏中路信息科技有限公司 一种基于dsvm的大数据分类预测方法
WO2020082732A1 (zh) * 2018-10-26 2020-04-30 平安科技(深圳)有限公司 图片自动分类方法、装置及计算机可读存储介质

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999756B (zh) * 2012-11-09 2016-01-06 重庆邮电大学 基于gpu实现pso-svm对道路标志的识别方法
CN102999756A (zh) * 2012-11-09 2013-03-27 重庆邮电大学 基于gpu实现pso-svm对道路标志的识别方法
CN103559294A (zh) * 2013-11-12 2014-02-05 中国石油大学(北京) 支持向量机分类器的构造方法及装置、分类方法及装置
CN103605813A (zh) * 2013-12-10 2014-02-26 电子科技大学 一种域适应学习的最优核组合选择方法
CN103678681B (zh) * 2013-12-25 2017-03-01 中国科学院深圳先进技术研究院 基于大规模数据的自适应参数的多核学习分类方法
CN103678681A (zh) * 2013-12-25 2014-03-26 中国科学院深圳先进技术研究院 基于大规模数据的自适应参数的多核学习分类方法
CN103824093A (zh) * 2014-03-19 2014-05-28 北京航空航天大学 一种基于kfda及svm的sar图像目标特征提取与识别方法
CN103971136A (zh) * 2014-05-04 2014-08-06 南京师范大学 一种面向大规模数据的并行结构化支持向量机分类方法
CN103967478A (zh) * 2014-05-21 2014-08-06 北京航空航天大学 一种基于电导探针的垂直井流型辨识方法
CN103967478B (zh) * 2014-05-21 2017-10-27 北京航空航天大学 一种基于电导探针的垂直井流型辨识方法
CN104346630A (zh) * 2014-10-27 2015-02-11 华南理工大学 一种异构特征融合的云花卉识别方法
CN104346630B (zh) * 2014-10-27 2017-06-20 华南理工大学 一种异构特征融合的云花卉识别方法
CN105354600B (zh) * 2015-09-28 2018-10-23 南京大学 一种砂岩显微薄片的自动分类方法
CN105354600A (zh) * 2015-09-28 2016-02-24 南京大学 一种砂岩显微薄片的自动分类方法
CN105388402A (zh) * 2015-10-30 2016-03-09 山东电力研究院 基于参数优化svm算法的交联电缆局部放电模式识别方法
CN105488528A (zh) * 2015-11-26 2016-04-13 北京工业大学 基于改进自适应遗传算法的神经网络图像分类方法
CN105488528B (zh) * 2015-11-26 2019-06-07 北京工业大学 基于改进自适应遗传算法的神经网络图像分类方法
CN105930876A (zh) * 2016-05-13 2016-09-07 华侨大学 一种基于逆向训练的植物图像集分类方法
CN106548207A (zh) * 2016-11-03 2017-03-29 北京图森互联科技有限责任公司 一种基于神经网络的图像处理方法及装置
CN107064794A (zh) * 2016-12-16 2017-08-18 南阳师范学院 一种基于遗传算法的防爆电机故障检测方法
CN106897703A (zh) * 2017-02-27 2017-06-27 辽宁工程技术大学 基于aga‑pkf‑svm的遥感影像分类方法
CN109145933A (zh) * 2017-06-28 2019-01-04 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN109145933B (zh) * 2017-06-28 2022-02-08 腾讯科技(深圳)有限公司 媒体资源的分类器训练方法及装置
CN107465664A (zh) * 2017-07-07 2017-12-12 桂林电子科技大学 基于并行多人工蜂群算法和支持向量机的入侵检测方法
CN107465664B (zh) * 2017-07-07 2020-04-24 桂林电子科技大学 基于并行多人工蜂群算法和支持向量机的入侵检测方法
CN107341576A (zh) * 2017-07-14 2017-11-10 河北百斛环保科技有限公司 一种大数据可视化的空气污染溯源和走向预测方法
CN107276702A (zh) * 2017-07-17 2017-10-20 北京科技大学 一种认知无线电网络中实时检测多主用户数目的方法
CN107280666A (zh) * 2017-08-08 2017-10-24 中山大学孙逸仙纪念医院 一种基于机器学习的耳聋患者ci术后康复预测方法及系统
CN109993183A (zh) * 2017-12-30 2019-07-09 中国移动通信集团四川有限公司 网络故障评估方法、装置、计算设备及存储介质
CN108536730A (zh) * 2018-02-27 2018-09-14 南京邮电大学 一种混合傅里叶核函数支持向量机文本分类方法
CN108536730B (zh) * 2018-02-27 2020-04-07 南京邮电大学 一种混合傅里叶核函数支持向量机文本分类方法
WO2020082732A1 (zh) * 2018-10-26 2020-04-30 平安科技(深圳)有限公司 图片自动分类方法、装置及计算机可读存储介质
CN110454684A (zh) * 2019-04-10 2019-11-15 重庆大学 一种城市天然气管网泄漏的故障定位检测方法
CN110866562A (zh) * 2019-11-20 2020-03-06 江苏中路信息科技有限公司 一种基于dsvm的大数据分类预测方法

Similar Documents

Publication Publication Date Title
CN102567742A (zh) 一种基于自适应核函数选择的支持向量机自动分类方法
CN107480261B (zh) 一种基于深度学习细粒度人脸图像快速检索方法
CN104750844B (zh) 基于tf-igm的文本特征向量生成方法和装置及文本分类方法和装置
CN109325516B (zh) 一种面向图像分类的集成学习方法及装置
Kulkarni et al. Statistical learning theory: a tutorial
CN110799995A (zh) 数据识别器训练方法、数据识别器训练装置、程序及训练方法
CN107729999A (zh) 考虑矩阵相关性的深度神经网络压缩方法
CN107451278A (zh) 基于多隐层极限学习机的中文文本分类方法
CN110059716B (zh) 一种cnn-lstm-svm网络模型的构建及mooc辍学预测方法
CN109086412A (zh) 一种基于自适应加权Bagging-GBDT的不平衡数据分类方法
CN109272107A (zh) 一种改进深层卷积神经网络的参数个数的方法
JP2012042990A (ja) 画像識別情報付与プログラム及び画像識別情報付与装置
CN112488209B (zh) 一种基于半监督学习的增量式图片分类方法
CN106971091A (zh) 一种基于确定性粒子群优化和支持向量机的肿瘤识别方法
CN110909158B (zh) 基于改进萤火虫算法和k近邻的文本分类方法
CN116503676B (zh) 一种基于知识蒸馏小样本增量学习的图片分类方法及系统
JP7160416B2 (ja) 水増しを用いた学習方法及び学習装置
CN110991621A (zh) 一种基于通道数搜索卷积神经网络的方法
CN110298434A (zh) 一种基于模糊划分和模糊加权的集成深度信念网络
Cheng et al. Remote sensing image classification based on optimized support vector machine
CN106997484A (zh) 一种优化用户信用模型建模过程的方法及装置
CN114049527B (zh) 基于在线协作与融合的自我知识蒸馏方法与系统
CN113705724B (zh) 基于自适应l-bfgs算法的深度神经网络的批量学习方法
CN114972959B (zh) 深度学习中样本生成和类内排序损失的遥感图像检索方法
JP7073171B2 (ja) 学習装置、学習方法及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120711