CN105740908B - 基于核空间自解释稀疏表示的分类器设计方法 - Google Patents
基于核空间自解释稀疏表示的分类器设计方法 Download PDFInfo
- Publication number
- CN105740908B CN105740908B CN201610070445.6A CN201610070445A CN105740908B CN 105740908 B CN105740908 B CN 105740908B CN 201610070445 A CN201610070445 A CN 201610070445A CN 105740908 B CN105740908 B CN 105740908B
- Authority
- CN
- China
- Prior art keywords
- centerdot
- dictionary
- sample
- phi
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Abstract
本发明涉及一种基于核空间自解释稀疏表示的分类器设计方法,含有以下步骤:读取训练样本,将训练样本映射到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;对测试样本通过词典矩阵获得该测试样本在核空间的稀疏编码,用每一类的词典及词典所对应的稀疏编码拟合测试样本,并计算该拟合误差;拟合误差最小的类即为测试样本的类别。与现有技术相比,本发明结合核技巧和词典学习方法,一方面,考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。
Description
技术领域
本发明隶属于模式识别技术领域,具体地说,涉及一种基于核空间自解释稀疏表示的分类器设计方法。
背景技术
模式识别过程通常包含两个阶段,第一个阶段是特征提取,另一个是构造分类器和标签预测。分类器设计(Classifier Design)作为模式识别系统的一个重要环节,一直以来都是模式识别领域研究的核心问题之一。
目前,主要的分类器设计方法有以下几种。
1、支持向量机方法(英文:SupportVector Machine)
支持向量机方法是Corinna Cortes和Vapnik等于1995年首先提出来的,它旨在通过最大化类别间隔建立最优分类面。该类方法在解决小样本、非线性及高维模式识别中表现出许多特有的优势。然而,该类分类器只有少量的边界点(即支持向量)参与到分类面建立,如果边界点分布的位置不好,那么对于分类是十分不利的。
2、基于稀疏表示的多类分类方法(英文:Sparse Representation basedClassifier)
基于稀疏表示的多类分类方法是由J.Wright等人于2009年提出的,该分类方法首先将测试样本在所有训练集上进行稀疏编码,然后根据产生最小编码误差的类别决定分类结果。该分类方法在多类分类中取得了很大的成功,然而,该分类方法没有训练的过程,直接将每类训练样本构造相应子空间,并没有考虑该分类样本中每个个体对构造子空间的贡献,容易产生较大的拟合误差。
3、基于协同表示的多类分类方法(英文:Collaborative Representation basedClassifier)
基于协同表示的多类分类方法是由zhang等人于2011年提出,该分类方法首先将测试样本在所有训练集上进行协同表示,然后根据产生最小编码误差的类别决定分类结果。该分类方法在某些数据集上性能优于基于稀疏表示的多类分类方法。同样地,该分类方法没有训练的过程,直接将每类训练样本构造相应子空间,容易产生较大拟合误差,导致分类性能不高。
4、基于词典学习的多类分类方法
基于词典学习的多类分类方法是由Yang等人于2010年提出,该分类方法弥补了传统的基于稀疏表示的多类分类方法容易产生较大拟合误差导致分类准确率不高的问题,然而,该分类方法只能在欧式空间中进行,很难处理具有非线性结构的数据,使其使用范围大大受限。
由上可知,现有的分类器设计方法均存在拟合误差比较大以及特征的非线性结构缺失而导致分类精确度不高的问题。
发明内容
本发明针对现有分类器设计方法设计的分类器存在拟合误差大、精确度不高的上述不足,提供一种基于核空间自解释稀疏表示的分类器设计方法。一方面,本发明考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,本发明通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。
本发明的技术方案是:一种基于核空间自解释稀疏表示的分类器设计方法,含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…+Nc+…+NC;
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc;
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:
固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个l1范数正则化最小二乘问题,即目标函数转化为:
上述公式(2)可以简化为:
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
根据抛物线理论,很容易求出公式(4)的解;由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
式中,E=Wc^Tκ(Xc,Xc)Wc
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个范数约束的最小二乘问题,即目标函数转化为:
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc;
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)步骤(3)中的拟合函数进行求解,求解结果为:
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
本发明的有益效果是:本发明结合核技巧和词典学习方法,设计多类分类器,读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,然后在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;对测试样本通过词典矩阵获得该测试样本在核空间的稀疏编码,即测试样本在词典矩阵的拟合系数,用每一类的词典及词典所对应的的稀疏编码拟合测试样本,并计算该拟合误差;最后,拟合误差最小的类即为测试样本的类别,实现了对每个输入测试样本进行分类。与现有技术相比,一方面,本发明考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,本发明通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。
附图说明
图1为本发明具体实施例设计分类器的流程图。
图2为本发明具体实施例对样本进行分类的流程图。
具体实施方式
下面结合一个仿真实例并结合附图对本发明作出进一步说明。
一种基于核空间的分类集中稀疏表示的分类器设计方法,含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…+Nc+…+NC;
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc;
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:
固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个范数正则化最小二乘问题,即目标函数转化为:
上述公式(2)可以简化为:
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数。进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
根据抛物线理论,求出公式(4)的解;由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
式中,E=Wc^Tκ(Xc,Xc)Wc
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个范数约束的最小二乘问题,即目标函数转化为:
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc;
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)步骤(3)中的拟合函数进行求解,求解结果为:
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
通过本发明上述方法可以对每个输入测试样本进行分类,一方面本发明考虑了特征的非线性结构,能够更加精确的对特征进行稀疏编码,另一方面,本发明通过学习的方式训练词典,有效地降低拟合误差。从而大大提升分类器的性能。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。
Claims (1)
1.一种基于核空间自解释稀疏表示的分类器设计方法,其特征在于:含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N2+…+Nc+…+NC;
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc;
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个关于Sc的l1范数正则化最小二乘问题,即目标函数转化为:
上述公式(2)可以简化为:
κ(Xc,Xc)=<φ(Xc),φ(Xc)>为核函数;进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
根据抛物线理论,很容易求出公式(4)的解;并且由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
式中,E=WcTκ(Xc,Xc)Wc;
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个l2范数约束的最小二乘问题,即目标函数转化为:
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc;
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)步骤(3)中的拟合函数进行求解,求解结果为:
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610070445.6A CN105740908B (zh) | 2016-01-31 | 2016-01-31 | 基于核空间自解释稀疏表示的分类器设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610070445.6A CN105740908B (zh) | 2016-01-31 | 2016-01-31 | 基于核空间自解释稀疏表示的分类器设计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105740908A CN105740908A (zh) | 2016-07-06 |
CN105740908B true CN105740908B (zh) | 2017-05-24 |
Family
ID=56241786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610070445.6A Active CN105740908B (zh) | 2016-01-31 | 2016-01-31 | 基于核空间自解释稀疏表示的分类器设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740908B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106250836B (zh) * | 2016-07-26 | 2018-09-14 | 山东师范大学 | 一种小样本条件下的两阶段人脸图像分类方法及系统 |
CN106250929A (zh) * | 2016-07-29 | 2016-12-21 | 中国石油大学(华东) | 弹性网络约束自解释稀疏表示分类器的设计方法 |
CN106250926A (zh) * | 2016-07-29 | 2016-12-21 | 华东师范大学 | 一种二次判别函数分类器存储空间的压缩方法 |
US11449985B2 (en) * | 2016-12-02 | 2022-09-20 | Regents Of The University Of Minnesota | Computer vision for cancerous tissue recognition |
CN109359694B (zh) * | 2018-10-24 | 2021-07-02 | 中国石油大学(华东) | 一种基于混合协同表示的分类器的图像分类方法和装置 |
CN111046958A (zh) * | 2019-12-13 | 2020-04-21 | 广州番禺职业技术学院 | 基于数据依赖的核学习和字典学习的图像分类及识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101667246A (zh) * | 2009-09-25 | 2010-03-10 | 西安电子科技大学 | 基于核稀疏表示的人脸识别方法 |
CN101826161A (zh) * | 2010-04-09 | 2010-09-08 | 中国科学院自动化研究所 | 一种基于局部近邻稀疏表示的目标识别方法 |
CN102142082A (zh) * | 2011-04-08 | 2011-08-03 | 南京邮电大学 | 用于人脸识别的基于虚拟样本的核鉴别方法 |
CN102930301A (zh) * | 2012-10-16 | 2013-02-13 | 西安电子科技大学 | 基于特征权重学习与核稀疏表示的图像分类方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030063796A1 (en) * | 2001-09-28 | 2003-04-03 | Koninklijke Philips Electronics N.V. | System and method of face recognition through 1/2 faces |
US7720284B2 (en) * | 2006-09-08 | 2010-05-18 | Omron Corporation | Method for outlining and aligning a face in face processing of an image |
-
2016
- 2016-01-31 CN CN201610070445.6A patent/CN105740908B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101667246A (zh) * | 2009-09-25 | 2010-03-10 | 西安电子科技大学 | 基于核稀疏表示的人脸识别方法 |
CN101826161A (zh) * | 2010-04-09 | 2010-09-08 | 中国科学院自动化研究所 | 一种基于局部近邻稀疏表示的目标识别方法 |
CN102142082A (zh) * | 2011-04-08 | 2011-08-03 | 南京邮电大学 | 用于人脸识别的基于虚拟样本的核鉴别方法 |
CN102930301A (zh) * | 2012-10-16 | 2013-02-13 | 西安电子科技大学 | 基于特征权重学习与核稀疏表示的图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105740908A (zh) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740908B (zh) | 基于核空间自解释稀疏表示的分类器设计方法 | |
Metcalf et al. | The strong gravitational lens finding challenge | |
CN108984745B (zh) | 一种融合多知识图谱的神经网络文本分类方法 | |
Zhou et al. | Deep semantic dictionary learning for multi-label image classification | |
CN1307579C (zh) | 用于分类文本以及构造文本分类器的方法和装置 | |
CN109934282A (zh) | 一种基于sagan样本扩充和辅助信息的sar目标分类方法 | |
CN105868796A (zh) | 基于核空间的线性鉴别稀疏表示分类器的设计方法 | |
CN107832458B (zh) | 一种字符级的基于嵌套深度网络的文本分类方法 | |
CN105138998B (zh) | 基于视角自适应子空间学习算法的行人重识别方法及系统 | |
CN111401156B (zh) | 基于Gabor卷积神经网络的图像识别方法 | |
CN105354595A (zh) | 一种鲁棒视觉图像分类方法及系统 | |
CN104933428A (zh) | 一种基于张量描述的人脸识别方法及装置 | |
CN113887661B (zh) | 一种基于表示学习重构残差分析的图像集分类方法及系统 | |
CN106529525A (zh) | 一种中日文手写字符的识别方法 | |
CN111968193A (zh) | 一种基于StackGAN网络的文本生成图像方法 | |
CN105740911A (zh) | 基于保持结构稀疏化的半监督字典学习方法 | |
CN107145841A (zh) | 一种基于矩阵的低秩稀疏人脸识别方法及其系统 | |
CN116311483B (zh) | 基于局部面部区域重构和记忆对比学习的微表情识别方法 | |
CN103020167A (zh) | 一种计算机中文文本分类方法 | |
Han | Evaluation of English online teaching based on remote supervision algorithms and deep learning | |
Sang et al. | Discriminative deep feature learning for facial emotion recognition | |
CN111222545B (zh) | 基于线性规划增量学习的图像分类方法 | |
CN107316050A (zh) | 基于柯西损失函数的子空间自表达模型聚类方法 | |
CN109948609A (zh) | 基于深度学习的智能阅卷定位方法 | |
CN106021402A (zh) | 用于跨模态检索的多模态多类Boosting框架构建方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |