CN105868796A - 基于核空间的线性鉴别稀疏表示分类器的设计方法 - Google Patents

基于核空间的线性鉴别稀疏表示分类器的设计方法 Download PDF

Info

Publication number
CN105868796A
CN105868796A CN201610264895.9A CN201610264895A CN105868796A CN 105868796 A CN105868796 A CN 105868796A CN 201610264895 A CN201610264895 A CN 201610264895A CN 105868796 A CN105868796 A CN 105868796A
Authority
CN
China
Prior art keywords
centerdot
sigma
phi
rsqb
lsqb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610264895.9A
Other languages
English (en)
Other versions
CN105868796B (zh
Inventor
刘宝弟
王立
韩丽莎
王延江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201610264895.9A priority Critical patent/CN105868796B/zh
Publication of CN105868796A publication Critical patent/CN105868796A/zh
Application granted granted Critical
Publication of CN105868796B publication Critical patent/CN105868796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于核空间的线性鉴别稀疏表示分类器的设计方法,步骤为:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;通过词典矩阵获得该测试样本在核空间的线性鉴别稀疏编码,用每一类的词典及词典所对应的线性鉴别稀疏编码拟合测试样本,计算该拟合误差;拟合误差最小的类为测试样本的类别。本发明能够保证同一类样本的稀疏编码是集中的,不同类样本稀疏编码是分散的,有效地增加了样本鉴别性,提升了分类器性能。

Description

基于核空间的线性鉴别稀疏表示分类器的设计方法
技术领域
本发明属于模式识别技术领域,具体地说,涉及一种基于核空间的线性鉴别稀疏表示分类器的设计方法。
背景技术
基于稀疏表示的词典学习方法在计算机视觉领域展现除了巨大的魅力,稀疏表示的方法在人脸识别、图像分类、图像降噪等领域都有成功的应用。模式识别过程通常包括两个阶段:特征提取阶段和分类阶段。分类器的好坏直接影响模式识别系统的识别率,分类器的设计一直以来都是模式识别研究的核心问题之一。
目前,主要的分类器设计方法有以下几种。
1、支持向量机方法(英文:Support Vector Machine)
支持向量机方法是Corinna Cortes和Vapnik等于1995年首先提出来的,它旨在通过最大化类别间隔建立最优分类面。该类方法在解决小样本、非线性及高维模式识别中表现出许多特有的优势。然而,该类分类器只有少量的边界点(即支持向量)参与到分类面建立,如果边界点分布的位置不好,那么对于分类是十分不利的。
2、基于稀疏表示的多类分类方法(英文:Sparse Representation basedClassifier)
基于稀疏表示的多类分类方法是由J.Wright等人于2009年提出的,该分类方法首先将测试样本在所有训练集上进行稀疏编码,然后根据产生最小编码误差的类别决定分类结果。该分类方法在多类分类中取得了很大的成功,然而,该分类方法没有训练的过程,直接将每类训练样本构造相应子空间,并没有考虑该分类样本中每个个体对构造子空间的贡献,容易产生较大的拟合误差。
3、基于协同表示的多类分类方法(英文:Collaborative Representation basedClassifier)
基于协同表示的多类分类方法是由zhang等人于2011年提出,该分类方法首先将测试样本在所有训练集上进行协同表示,然后根据产生最小编码误差的类别决定分类结果。该分类方法在某些数据集上性能优于基于稀疏表示的多类分类方法。同样地,该分类方法没有训练的过程,直接将每类训练样本构造相应子空间,容易产生较大拟合误差,导致分类性能不高。
4、基于词典学习的多类分类方法
基于词典学习的多类分类方法是由Yang等人于2010年提出,该分类方法弥补了传统的基于稀疏表示的多类分类方法容易产生较大拟合误差导致分类准确率不高的问题,然而,该分类方法只能在欧式空间中进行,很难处理具有非线性结构的数据,使其使用范围大大受限。
由上可知,现有的分类器设计方法均存在拟合误差比较大而导致分类精确度不高的问题。
申请号为201610070445.6的中国专利申请公开了一种基于核空间自解释稀疏表示的分类器设计方法,读取训练样本,将训练样本映射到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;对测试样本通过词典矩阵获得该测试样本在核空间的稀疏编码,用每一类的词典及词典所对应的的稀疏编码拟合测试样本,并计算该拟合误差;拟合误差最小的类即为测试样本的类别,其构造的词典训练需要满足约束条件,该约束条件的目标函数为:
该方法设计的分类器考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,有效地降低拟合误差;虽然该方法设计的分类器具备了稀疏性的特点,分类器的性能得到提高,但由于分类器并不具备鉴别性,其模式识别性能还需进一步提高。
发明内容
本发明针对现有分类器设计方法设计的分类器存在拟合误差大、精确度不高的上述不足,提供一种基于核空间的线性鉴别稀疏表示分类器的设计方法,该方法设计的分类器的输出既有稀疏性的特点又具有鉴别性的特点,显著提高模式识别性能。
本发明的技术方案是:一种基于核空间的线性鉴别稀疏表示分类器的设计方法,含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是训练样本的特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
其中,
式中,代表F范数,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(XC)Wc;φ表示样本在核空间中的映射;
其中,
g ( W 1 , ... , W C , S 1 , ... , S C ) = η ω - β { ξ - 2 Σ c = 1 C | | 1 N C Σ n = 1 N C S · n c | | 2 2 } - - - ( 3 )
ω记为类内散度误差,ω如下所示:
w ( S 1 , ... , S C ) = Σ c = 1 C Σ n = 1 N C | | S · n c - 1 N c Σ m = 1 N C S · m c | | 2 2 - - - ( 4 )
ξ记为类间散度误差,ξ如下所示:
ξ ( S 1 , ... , S C ) = Σ c = 1 C 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N C Σ n = 1 N C S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 - - - ( 5 )
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:
固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个范数正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | S · n c - 1 N c Σ m = 1 N c S · m c | | 2 2 + 2 β | | 1 N c Σ n = 1 N c S · n c | | 2 2 - β 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N c Σ n = 1 N c S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 s . t | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K , c = 1 , 2 , .. , C - - - ( 6 )
式中,β为类内散度的惩罚系数;
上述公式(6)简化为:
f ( S C ) = t r a c e { κ ( X c , X c ) - 2 κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | N c - 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 + 2 β Σ n = 1 N c | | 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 - β ( 1 ( C - 1 ) ) Σ d = 1 , d ≠ c C | | 1 N c S · n c + 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) - 1 N d Σ i = 1 N d S · i d | | F 2 - - - ( 7 )
进一步把公式(7)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(7)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 { [ W c T κ ( X c , X c ) W c ] k k + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 } + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | - 2 [ ( η N c - 1 N c 2 - β 1 N c 2 ) Σ m = 1 , m ≠ n N S k m c ] S k n c + 2 β [ 1 N c N d ( C - 1 ) Σ d = 1 , d ≠ c C Σ i = 1 N d S k i d ] S k n c - - - ( 8 )
根据抛物线理论,求出公式(8)的解;由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k n c = 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 min { A k n - [ E S c ~ k n ] k n , - α } + 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 max { A k n - [ E S c ~ k n ] k n , α } - - - ( 9 )
式中,
E=WcTκ(Xc,Xc)Wc
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 10 )
上述公式(10)采用拉格朗日乘子的方法求解,忽略掉常数项trace{κ(Xc,Xc)},简化为:
L ( W C , λ k , μ k ) = - 2 Σ k = 1 K [ S c κ ( X c , X c ) ] k · W · k c + Σ k = 1 K W · k c T [ κ ( X c , X c ) W c S c S c T ] · k + λ k ( 1 - [ W c T κ ( X c , X c ) W c ] k k ) - - - ( 11 )
根据KKT条件,满足公式(11)的最优词典矩阵的每一列需要满足的条件为:
( a ) : ∂ L ( W C , λ k ) ∂ W k c = 0 ( b ) : ( 1 - [ W c T κ ( X c , X c ) W c ] k k ) = 0 ( c ) : λ k > 0 - - - ( 12 )
最终求得的解为:
W · k c = S k · c T - [ W c ~ k F ] · k ( S k · c T - [ W c - K F ] · k ) T κ ( X c , X c ) ( S k · c T - [ W c ~ k F ] · k ) - - - ( 13 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 - - - ( 14 )
式中,s表示核空间中测试样本图像特征y的稀疏编码,φ(X)表示训练样本X在核空间的映射;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s k = max ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , α ) + min ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , - α ) - - - ( 15 )
式中,sk表示s中的第k个元素,
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 16 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
本发明的有益效果:本发明结合核技巧与基于Fisher准则函数的稀疏词典学习方法,一方面通过核的方法使比较复杂的非线性的原始数据线性化、简单化,另一方面将线性鉴别约束(LDA)加入到分类器设计当中,该约束条件使样本在核空间的稀疏表达达到最大的类间散度和最小的类内散度,同时还保持了样本的局部几何特征,大大的提高了样本的可鉴别性。本发明分类器设计方法,首先读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,然后在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;通过词典矩阵获得该测试样本在核空间的线性鉴别稀疏编码,即测试样本在词典矩阵的拟合系数,用每一类的词典及词典所对应的线性鉴别稀疏编码拟合测试样本,并计算该拟合误差;最后,拟合误差最小的类为测试样本的类别,实现了对每个输入测试样本进行分类。与现有技术相比,本发明既考虑了不同的训练样本对稀疏词典训练应该具有不同的贡献的特点(例如:正面人脸样本应当对构造词典占有更大的话语权),又考虑到不同类别样本稀疏编码特征之间的关系,保证了同一类样本的稀疏编码是集中的,不同类样本稀疏编码是分散的,从而有效地增加了样本鉴别性,提升了分类器的分类性能。
附图说明
图1为本发明具体实施例设计分类器的流程图。
图2为本发明具体实施例对样本进行分类的流程图。
具体实施方式
下面结合附图对本发明作出进一步说明。
一种基于核空间的线性鉴别稀疏表示分类器的设计方法,含有以下步骤:
步骤一:参见图1,设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是训练样本的特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
其中,
式中,代表F范数,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(XC)Wc;φ表示样本在核空间中的映射;
其中,
g ( W 1 , ... , W C , S 1 , ... , S C ) = η ω - β { ξ - 2 Σ c = 1 C | | 1 N C Σ n = 1 N C S · n c | | 2 2 } - - - ( 3 )
ω记为类内散度误差,ω如下所示:
w ( S 1 , ... , S C ) = Σ c = 1 C Σ n = 1 N C | | S · n c - 1 N c Σ m = 1 N C S · m c | | 2 2 - - - ( 4 )
ξ记为类间散度误差,ξ如下所示:
ξ ( S 1 , ... , S C ) = Σ c = 1 C 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N C Σ n = 1 N C S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 - - - ( 5 )
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:
固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个范数正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | S · n c - 1 N c Σ m = 1 N c S · m c | | 2 2 + 2 β | | 1 N c Σ n = 1 N c S · n c | | 2 2 - β 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N c Σ n = 1 N c S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 s . t | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K , c = 1 , 2 , .. , C - - - ( 6 )
式中,β为类内散度的惩罚系数;
上述公式(6)简化为:
f ( S C ) = t r a c e { κ ( X c , X c ) - 2 κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | N c - 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 + 2 β Σ n = 1 N c | | 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 - β ( 1 ( C - 1 ) ) Σ d = 1 , d ≠ c C | | 1 N c S · n c + 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) - 1 N d Σ i = 1 N d S · i d | | F 2 - - - ( 7 )
进一步把公式(7)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(7)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 { [ W c T κ ( X c , X c ) W c ] k k + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 } + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | - 2 [ ( η N c - 1 N c 2 - β 1 N c 2 ) Σ m = 1 , m ≠ n N S k m c ] S k n c + 2 β [ 1 N c N d ( C - 1 ) Σ d = 1 , d ≠ c C Σ i = 1 N d S k i d ] S k n c - - - ( 8 )
根据抛物线理论,求出公式(8)的解;由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k n c = 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 min { A k n - [ E S c ~ k n ] k n , - α } + 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 max { A k n - [ E S c ~ k n ] k n , α } - - - ( 9 )
式中,E=WcTκ(Xc,Xc)Wc
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 10 )
上述公式(10)采用拉格朗日乘子的方法求解,忽略掉常数项trace{κ(Xc,Xc)},简化为:
L ( W C , λ k , μ k ) = - 2 Σ k = 1 K [ S c κ ( X c , X c ) ] k · W · k c + Σ k = 1 K W · k c T [ κ ( X c , X c ) W c S c S c T ] · k + λ k ( 1 - [ W c T κ ( X c , X c ) W c ] k k ) - - - ( 11 )
根据KKT条件,满足公式(11)的最优词典矩阵的每一列需要满足的条件为:
( a ) : ∂ L ( W C , λ k ) ∂ W k c = 0 ( b ) : ( 1 - [ W c T κ ( X c , X c ) W c ] k k ) = 0 ( c ) : λ k > 0 - - - ( 12 )
最终求得的解为:
W · k c = S k · c T - [ W c ~ k F ] · k ( S k · c T - [ W c - K F ] · k ) T κ ( X c , X c ) ( S k · c T - [ W c ~ k F ] · k ) - - - ( 13 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:参见图2,对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 - - - ( 14 )
式中,s表示核空间中测试样本图像特征y的稀疏编码,φ(X)表示训练样本X在核空间的映射;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s k = max ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , α ) + min ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , - α ) - - - ( 15 )
式中,sk表示s中的第k个元素,
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 16 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (1)

1.一种基于核空间的线性鉴别稀疏表示分类器的设计方法,其特征在于:含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是训练样本的特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典该词典的训练需要满足约束条件,所述约束条件的目标函数为:
其中,
式中,代表F范数,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(XC)Wc;φ表示样本在核空间中的映射;
其中,
g ( W 1 , ... , W C , S 1 , ... , S C ) = η ω - β { ξ - 2 Σ c = 1 C | | 1 N C Σ n = 1 N C S · n c | | 2 2 } - - - ( 3 )
ω记为类内散度误差,ω如下所示:
w ( S 1 , ... , S C ) = Σ c = 1 C Σ n = 1 N C | | S · n c - 1 N c Σ m = 1 N C S · m c | | 2 2 - - - ( 4 )
ξ记为类间散度误差,ξ如下所示:
ξ ( S 1 , ... , S C ) = Σ c = 1 C 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N C Σ n = 1 N C S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 - - - ( 5 )
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个l2范数正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | S · n c - 1 N c Σ m = 1 N c S · m c | | 2 2 + 2 β | | 1 N c Σ n = 1 N c S · n c | | 2 2 - β 1 ( C - 1 ) Σ d = 1 , d ≠ c C | | 1 N c Σ n = 1 N c S · n c - 1 N d Σ m = 1 N d S · m d | | 2 2 s . t | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K , c = 1 , 2 , .. , C - - - ( 6 )
式中,β为类内散度的惩罚系数;
上述公式(6)简化为:
f ( S C ) = t r a c e { κ ( X c , X c ) - 2 κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + η Σ n = 1 N c | | N c - 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 + 2 β Σ n = 1 N c | | 1 N c S · n c - 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) | | 2 2 - β ( 1 ( C - 1 ) ) Σ d = 1 , d ≠ c C | | 1 N c S · n c + 1 N c ( Σ m = 1 , m ≠ n N c S · m c ) - 1 N d Σ i = 1 N d S · i d | | F 2 - - - ( 7 )
进一步把公式(7)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(7)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 { [ W c T κ ( X c , X c ) W c ] k k + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 } + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | - 2 [ ( η N c - 1 N c 2 - β 1 N c 2 ) Σ m = 1 , m ≠ n N S k m c ] S k n c + 2 β [ 1 N c N d ( C - 1 ) Σ d = 1 , d ≠ c C Σ i = 1 N d S k i d ] S k n c - - - ( 8 )
根据抛物线理论,求出公式(8)的解;由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k n c = 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 min { A k n - [ E S c ~ k n ] k n , - α } + 1 1 + η ( N c - 1 N c ) 2 + β ( 1 N c ) 2 max { A k n - [ E S c ~ k n ] k n , α } - - - ( 9 )
式中,E=WcTκ(Xc,Xc)Wc
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个l2范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 10 )
上述公式(10)采用拉格朗日乘子的方法求解,忽略掉常数项trace{κ(Xc,Xc)},简化为:
L ( W C , λ k , μ k ) = - 2 Σ k = 1 K [ S c κ ( X c , X c ) ] k · W · k c + Σ k = 1 K W · k c T [ κ ( X c , X c ) W c S c S c T ] · k + λ k ( 1 - [ W c T κ ( X c , X c ) W c ] k k ) - - - ( 11 )
根据KKT条件,满足公式(11)的最优词典矩阵的每一列需要满足的条件为:
( a ) : ∂ L ( W C , λ k ) ∂ W · k c = 0
(b):(1-[WcTκ(Xc,Xc)Wc]kk)=0 (12)
(c):λk>0
最终求得的解为:
W · k c = S k · c T - [ W c ~ k F ] · k ( S k · c T - [ W c - K F ] · k ) T κ ( X c , X c ) ( S k · c T - [ W c ~ k F ] · k ) - - - ( 13 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 - - - ( 14 )
式中,s表示核空间中测试样本图像特征y的稀疏编码,φ(X)表示训练样本X在核空间的映射;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s k = max ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , α ) + min ( [ W T κ ( X c , y ) ] - [ W T κ ( X , X ) W ] s ~ k , - α ) - - - ( 15 )
式中,sk表示s中的第k个元素,
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 16 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
CN201610264895.9A 2016-04-26 2016-04-26 基于核空间的线性鉴别稀疏表示分类器的设计方法 Active CN105868796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610264895.9A CN105868796B (zh) 2016-04-26 2016-04-26 基于核空间的线性鉴别稀疏表示分类器的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610264895.9A CN105868796B (zh) 2016-04-26 2016-04-26 基于核空间的线性鉴别稀疏表示分类器的设计方法

Publications (2)

Publication Number Publication Date
CN105868796A true CN105868796A (zh) 2016-08-17
CN105868796B CN105868796B (zh) 2019-03-01

Family

ID=56629423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610264895.9A Active CN105868796B (zh) 2016-04-26 2016-04-26 基于核空间的线性鉴别稀疏表示分类器的设计方法

Country Status (1)

Country Link
CN (1) CN105868796B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169505A (zh) * 2017-04-01 2017-09-15 南京邮电大学 一种基于核统计不相关的多视图的图像分类方法
CN107169531A (zh) * 2017-06-14 2017-09-15 中国石油大学(华东) 一种基于拉普拉斯嵌入的图像分类词典学习方法和装置
CN107238822A (zh) * 2017-06-13 2017-10-10 电子科技大学 真假目标一维距离像正交非线性子空间特征提取方法
CN108416389A (zh) * 2018-03-15 2018-08-17 盐城师范学院 基于降噪稀疏自动编码器和密度空间采样的图像分类方法
CN108830290A (zh) * 2018-05-04 2018-11-16 西安电子科技大学 基于稀疏表示和高斯分布的sar图像分类方法
CN109359694A (zh) * 2018-10-24 2019-02-19 中国石油大学(华东) 一种基于混合协同表示的分类器的图像分类方法和装置
CN110163034A (zh) * 2018-02-27 2019-08-23 冷霜 一种基于最优特征提取的航空器地面定位挂牌方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930301A (zh) * 2012-10-16 2013-02-13 西安电子科技大学 基于特征权重学习与核稀疏表示的图像分类方法
WO2014152919A1 (en) * 2013-03-14 2014-09-25 Arizona Board Of Regents, A Body Corporate Of The State Of Arizona For And On Behalf Of Arizona State University Kernel sparse models for automated tumor segmentation

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930301A (zh) * 2012-10-16 2013-02-13 西安电子科技大学 基于特征权重学习与核稀疏表示的图像分类方法
WO2014152919A1 (en) * 2013-03-14 2014-09-25 Arizona Board Of Regents, A Body Corporate Of The State Of Arizona For And On Behalf Of Arizona State University Kernel sparse models for automated tumor segmentation

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169505A (zh) * 2017-04-01 2017-09-15 南京邮电大学 一种基于核统计不相关的多视图的图像分类方法
CN107238822A (zh) * 2017-06-13 2017-10-10 电子科技大学 真假目标一维距离像正交非线性子空间特征提取方法
CN107238822B (zh) * 2017-06-13 2020-05-26 电子科技大学 真假目标一维距离像正交非线性子空间特征提取方法
CN107169531A (zh) * 2017-06-14 2017-09-15 中国石油大学(华东) 一种基于拉普拉斯嵌入的图像分类词典学习方法和装置
CN110163034A (zh) * 2018-02-27 2019-08-23 冷霜 一种基于最优特征提取的航空器地面定位挂牌方法
CN110163034B (zh) * 2018-02-27 2021-07-23 山东炎黄工业设计有限公司 一种基于最优特征提取的航空器地面定位挂牌方法
CN108416389A (zh) * 2018-03-15 2018-08-17 盐城师范学院 基于降噪稀疏自动编码器和密度空间采样的图像分类方法
CN108830290A (zh) * 2018-05-04 2018-11-16 西安电子科技大学 基于稀疏表示和高斯分布的sar图像分类方法
CN108830290B (zh) * 2018-05-04 2020-05-05 西安电子科技大学 基于稀疏表示和高斯分布的sar图像分类方法
CN109359694A (zh) * 2018-10-24 2019-02-19 中国石油大学(华东) 一种基于混合协同表示的分类器的图像分类方法和装置
CN109359694B (zh) * 2018-10-24 2021-07-02 中国石油大学(华东) 一种基于混合协同表示的分类器的图像分类方法和装置

Also Published As

Publication number Publication date
CN105868796B (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN105868796B (zh) 基于核空间的线性鉴别稀疏表示分类器的设计方法
Maddox et al. Rethinking parameter counting in deep models: Effective dimensionality revisited
CN105760821B (zh) 基于核空间的分类聚集稀疏表示的人脸识别方法
Titsias The infinite gamma-Poisson feature model
CN110751038A (zh) 一种基于图注意力机制的pdf表格结构识别方法
CN105740908B (zh) 基于核空间自解释稀疏表示的分类器设计方法
Evert et al. Towards a better understanding of Burrows’s Delta in literary authorship attribution
CN103699523A (zh) 产品分类方法和装置
CN105389583A (zh) 图像分类器的生成方法、图像分类方法和装置
CN105787516A (zh) 一种基于空谱局部性低秩超图学习的高光谱图像分类方法
CN102142082B (zh) 用于人脸识别的基于虚拟样本的核鉴别方法
CN110825850B (zh) 一种自然语言主题分类方法及装置
CN109685093A (zh) 无监督的自适应特征选择方法
CN112464004A (zh) 一种多视角深度生成图像聚类方法
CN105976070A (zh) 基于重点元素的矩阵分解及微调方法
CN115564996A (zh) 一种基于注意力联合网络的高光谱遥感图像分类方法
CN103020167A (zh) 一种计算机中文文本分类方法
CN105116400A (zh) 基于iMMFA模型的雷达高分辨距离像的目标识别方法
CN103020979A (zh) 基于稀疏遗传聚类的图像分割方法
Chen et al. Max-margin discriminant projection via data augmentation
Guo et al. Data induced masking representation learning for face data analysis
CN105184320B (zh) 基于结构相似度的非负稀疏编码的图像分类方法
Wang et al. Conscience online learning: an efficient approach for robust kernel-based clustering
Xu et al. Graphical lasso quadratic discriminant function and its application to character recognition
Tang et al. Structural atomic representation for classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant