CN108229512B - 一种基于非负表示系数的两阶段识别方法 - Google Patents

一种基于非负表示系数的两阶段识别方法 Download PDF

Info

Publication number
CN108229512B
CN108229512B CN201611196713.5A CN201611196713A CN108229512B CN 108229512 B CN108229512 B CN 108229512B CN 201611196713 A CN201611196713 A CN 201611196713A CN 108229512 B CN108229512 B CN 108229512B
Authority
CN
China
Prior art keywords
coefficient
test sample
sample
negative
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611196713.5A
Other languages
English (en)
Other versions
CN108229512A (zh
Inventor
陈才扣
李经善
王蓉
王禹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou University
Original Assignee
Yangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou University filed Critical Yangzhou University
Priority to CN201611196713.5A priority Critical patent/CN108229512B/zh
Publication of CN108229512A publication Critical patent/CN108229512A/zh
Application granted granted Critical
Publication of CN108229512B publication Critical patent/CN108229512B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提出一种基于非负表示系数的两阶段识别方法。包括:用所有训练样本线性表示测试样本且约束表示系数非负,计算系数向量;将系数向量中元素降序排列,抽取出较大的系数及其对应的训练样本;将上一步所得的训练样本分类,计算每类样本的重构图像;用所有重构图像线性表示测试样本且约束表示系数非负,计算系数向量,根据残差对测试样本分类。本发明根据一定的筛选条件择优选取训练样本并用其线性表示测试样本,从而提高识别率。

Description

一种基于非负表示系数的两阶段识别方法
技术领域
本发明属于机器学习技术领域,具体涉及一种基于非负表示系数的两阶段识别方法。
背景技术
特征抽取在模式识别领域非常重要。主成分分析(Principle ComponentAnalysis,PCA)和线性鉴别分析(Linear Discriminant Analysis,LDA)作为经典的线性特征抽取方法,被广泛使用。PCA和LDA方法最终都需依赖于分类器将测试样本分类,其中应用较为广泛的分类器如最近邻(Nearest Neighbor,NN),该分类器目的是将测试样本分类到与之距离最近的训练样本所属类别。
最新提出的稀疏表示作为人脸识别领域中的一个新方法,其基本思想是给定足够的训练样本,任何测试样本都可由训练样本的线性组合来表示,且大多数项的系数为零或接近零,只有同类样本的系数较大。John Wright等人提出的稀疏表示分类(Sparserepresentation classification,SRC)方法已被广泛使用,但由于该方法需计算l1范数,因此计算过程复杂、耗时长。基于此,Lei Zhang等学者提出协同表达分类(Collaborativerepresentation based classification,CRC)方法,该方法克服了SRC方法存在的计算速度慢的缺点,但是,从非负矩阵分解的角度来看,在CRC中的负值不具有任何物理意义,这些正是CRC等算法的缺点和不足,而本发明方法希望解决该缺点。
发明内容
本发明的目的在于提供一种基于非负表示系数的两阶段识别方法,其根据一定的筛选条件择优选取训练样本并用其线性表示测试样本,从而提高识别率。
为了解决上述技术问题,本发明提供一种基于非负表示系数的两阶段识别方法,
第一阶段,用所有训练样本xij表示测试样本y且约束系数非负,并根据非负系数模型计算获得表示系数向量w;
第二阶段,取出表示系数向量w中前n个最大元素及其所对应的原始训练样本x1,x2,…,xn,并用前n个最大元素对应的训练样本x1,x2,…,xn组成字典矩阵Dnew,对字典矩阵Dnew中的全部样本进行分类,将所有属于第i类的训练样本组成字典矩阵Di,同时,从表示系数向量w中抽取出字典矩阵Di中各训练样本所对应的表示系数并组成表示系数向量αi;使用公式zj=Djαj计算获得每类样本对应的重构样本zj;用重构样本zj表示测试样本y且约束系数非负,并根据非负系数模型计算获得表示系数向量b;根据测试样本y的残差对测试样本y进行分类。
本发明与现有技术相比,其显著优点在于:
(1)本发明在原CRC方法的基础上增加非负约束,构造非负表示系数模型,非负表示向量保证算法中系数具有物理意义,可以更好地反映数据点之间的依赖关系;
(2)本发明根据一定条件筛选出较为优秀的训练样本,使得分类结果更加精准;
(3)本发明.最终可以产生分类器,切合实际,计算机运行速度快,运用两阶段识别较为精确。
附图说明
图1是本发明方法流程示意图。
图2是本发明实施例所使用的训练样本。
具体实施方式
容易理解,依据本发明的技术方案,在不变更本发明的实质精神的情况下,本领域的一般技术人员可以想象出本发明基于非负表示系数的两阶段识别方法的多种实施方式。因此,以下具体实施方式和附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。
本发明所述基于非负表示系数的两阶段识别方法,包括:用所有训练样本线性表示测试样本且约束表示系数非负,计算系数向量;将系数向量中元素降序排列,抽取出较大的系数及其对应的训练样本;将上一步所得的训练样本分类,计算每类样本的重构图像;用所有重构图像线性表示测试样本且约束表示系数非负,计算系数向量,根据残差对测试样本分类。
实施例
本实施例采用FERET人脸数据库作为实验数据。FERET人脸库是一个包含200个人,且每人7张人脸图像的数据库。为了验证本发明的有效性与实用性,本发明分别选取每人的前m=1,2,3,4,5幅图像作为训练样本,并将每人剩余的7-m幅图像作为测试样本,这样训练样本总数为200×m,测试样本总数为200×(7-m)。本实施例中的作为训练样本的某张人脸前七张图像如图1所示。
本实施例中,进行如下定义:
设xij为p维列向量且表示第i类的第j个原始训练样本,i=1,2,…,c,j=1,2,…,ni,其中,ni为每类训练样本数,N=n1+n2+…+nc为训练样本总数,训练样本数据集D=[D1,D2,…,Dc]∈Rp×N,其中,
Figure GDA0003191194240000031
为第i类训练样本矩阵,y为测试样本,R为欧式空间。
基于上述假设,本实施例所示的基于非负表示系数的两阶段识别方法的详细步骤如下:
第一阶段
本阶段的工作是,用所有原始训练样本表示测试样本且约束系数非负,根据非负系数模型计算获得第一阶段表示系数向量w。
根据稀疏表示思想,足够多的训练样本能近似表示测试样本,且除与测试样本同类的训练样本表示系数较大外,其余表示系数近似为0,现对每个用原始训练样表示测试样本的表示系数附加非负约束,给出如下非负系数模型:
Figure GDA0003191194240000032
其中D=[x1,x2,…,xN]为由原始训练样本组成的字典矩阵,本发明中称之为第一阶段字典矩阵,N为训练样本总数,λ1为一个小的正常数,w为用原始训练样本组成字典矩阵D表示测试样本y时的表示系数向量,且第一阶段w=[w1,w2,…,wN]T,w1,w2,…,wN为各个用原始训练样表示原始测试样本的表示系数。
第二阶段
第二阶段分为以下几步:
2.1将表示系数向量w中的元素降序排列;
2.2取出前n个最大元素及其所对应的原始训练样本,设x1,x2,…,xn为前n个表示系数最大的原始训练训练样本,
2.3用x1,x2,…,xn组成第二阶段字典矩阵Dnew=[x1,x2,…,xn],将第二阶段字典矩阵Dnew中所有经第一阶段处理得到的训练样本x1,x2,…,xn分类,具体为:
第二阶段字典矩阵Dnew中用所有属于第一类的样本组成字典矩阵D1,所有属于第二类的样本组成字典矩阵D2,……,所有属于第c类的样本组成字典矩阵Dc,若Dnew中没有属于第i类(i=1,2,…,c)的训练样本,则Di=0。同时,从第一阶段的系数向量w中抽取出字典矩阵D1中各训练样本对应的表示系数组成的表示系数向量α1;同样的,字典矩阵D2对应的表示系数向量α2;……;字典矩阵Dc对应的表示系数向量αc
2.4使用公式zj=Djαj计算第二阶段字典矩阵Dnew中每类第二阶段得到的经第一阶段处理得到的训练样本的重构样本zj,其中,j=1,2,…,c;
2.5将所有重构样本zj组成重构样本矩阵Z=[z1,z2,…,zc]。用重构样本z1,z2,…,zc线性表示测试样本,即y=Zb,其中b=[b1,b2,…,bc]T为第二阶段表示系数,对其附加非负约束,有非负系数模型:
Figure GDA0003191194240000041
其中,λ2为一个小的正常数。
2.6计算出第二阶段系数向量b,并根据测试样本残差对测试样本y进行分类,根据测试样本残差对测试样本y进行分类的方法为,bj使测试样本残差最小时对应的t即为分类,使测试样本残差最小,若有下式成立:
Figure GDA0003191194240000042
则测试样本y所属类别为第t类。

Claims (1)

1.一种基于非负表示系数的两阶段识别方法,其特征在于,
第一阶段,用所有训练样本xij表示测试样本y且约束系数非负,并根据非负系数模型计算获得表示系数向量w;
第二阶段,将表示系数向量w中的元素降序排列,取出表示系数向量w中前n个最大元素及其所对应的原始训练样本x1,x2,…,xn,并用前n个最大元素对应的训练样本x1,x2,…,xn组成字典矩阵Dnew,对字典矩阵Dnew中的全部样本进行分类,将所有属于第i类的训练样本组成字典矩阵Di,同时,从表示系数向量w中抽取出字典矩阵Di中各训练样本所对应的表示系数并组成表示系数向量αi;使用公式zj=Djαj计算获得每类样本对应的重构样本zj;用重构样本zj表示测试样本y且约束系数非负,并根据非负系数模型计算获得表示系数向量b;根据测试样本y的残差对测试样本y进行分类;
其中,xij为第i类的第j个训练样本,i=1,2,…,c;j=1,2,…,ni;c为训练样本总类数,ni为每类训练样本的总个数;
用所有训练样本xij表示测试样本y且约束系数非负的非负系数模型为:
Figure FDA0003191194230000011
s.t wi≥0,i=1,2,…,N
其中D为由训练样本xij组成的字典矩阵,N为训练样本总数,λ1为一个小的正常数,wi为表示系数向量w中的元素;
用重构样本zj表示测试样本y且约束系数非负的非负系数模型为:
Figure FDA0003191194230000012
s.tbi≥0,i=1,2,…,c
其中,Z为所有重构样本zj组成重构样本矩阵,λ2为一个小的正常数,bi为表示系数向量b中的元素;
所述根据测试样本残差对测试样本y进行分类的方法为,bj使测试样本残差最小时对应的t即为分类,使测试样本残差最小,若有下式成立:
Figure FDA0003191194230000013
则测试样本y所属类别为第t类。
CN201611196713.5A 2016-12-22 2016-12-22 一种基于非负表示系数的两阶段识别方法 Active CN108229512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611196713.5A CN108229512B (zh) 2016-12-22 2016-12-22 一种基于非负表示系数的两阶段识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611196713.5A CN108229512B (zh) 2016-12-22 2016-12-22 一种基于非负表示系数的两阶段识别方法

Publications (2)

Publication Number Publication Date
CN108229512A CN108229512A (zh) 2018-06-29
CN108229512B true CN108229512B (zh) 2021-10-08

Family

ID=62656115

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611196713.5A Active CN108229512B (zh) 2016-12-22 2016-12-22 一种基于非负表示系数的两阶段识别方法

Country Status (1)

Country Link
CN (1) CN108229512B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326857B (zh) * 2020-02-28 2022-09-23 合肥美亚光电技术股份有限公司 模型训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226714A (zh) * 2013-05-09 2013-07-31 山东大学 基于较大编码系数强化的稀疏编码方法
CN104182734A (zh) * 2014-08-18 2014-12-03 桂林电子科技大学 基于lrc和协同表示的两阶段人脸识别方法
US9336433B1 (en) * 2013-07-24 2016-05-10 University Of Central Florida Research Foundation, Inc. Video face recognition
CN105956606A (zh) * 2016-04-22 2016-09-21 中山大学 一种基于不对称变换的行人再标识方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226714A (zh) * 2013-05-09 2013-07-31 山东大学 基于较大编码系数强化的稀疏编码方法
US9336433B1 (en) * 2013-07-24 2016-05-10 University Of Central Florida Research Foundation, Inc. Video face recognition
CN104182734A (zh) * 2014-08-18 2014-12-03 桂林电子科技大学 基于lrc和协同表示的两阶段人脸识别方法
CN105956606A (zh) * 2016-04-22 2016-09-21 中山大学 一种基于不对称变换的行人再标识方法

Also Published As

Publication number Publication date
CN108229512A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN110929029A (zh) 一种基于图卷积神经网络的文本分类方法及系统
Chen et al. Deep age estimation: From classification to ranking
US10963685B2 (en) Generating variations of a known shred
CN112732916B (zh) 一种基于bert的多特征融合模糊文本分类系统
CN111626336A (zh) 一种基于不平衡数据集的地铁故障数据分类方法
Cong et al. Self-supervised online metric learning with low rank constraint for scene categorization
US20170076152A1 (en) Determining a text string based on visual features of a shred
CN111275113A (zh) 基于代价敏感混合网络的偏斜类时间序列异常检测方法
Liang et al. AC-BLSTM: asymmetric convolutional bidirectional LSTM networks for text classification
CN109034281A (zh) 加速基于卷积神经网络的中文手写体识别的方法
CN113673242A (zh) 一种基于k邻近结点算法和对比学习的文本分类方法
L Fernandes et al. A novel decision support for composite sketch matching using fusion of probabilistic neural network and dictionary matching
CN115131613A (zh) 一种基于多向知识迁移的小样本图像分类方法
CN116110089A (zh) 一种基于深度自适应度量学习的面部表情识别方法
Fan et al. A hierarchical Dirichlet process mixture of generalized Dirichlet distributions for feature selection
Mohamed et al. Deep learning face detection and recognition
CN108229512B (zh) 一种基于非负表示系数的两阶段识别方法
CN110287973B (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法
CN110457155B (zh) 一种样本类别标签的修正方法、装置及电子设备
CN107491490B (zh) 基于情感中心的文本情感分类方法
Yang Application of artificial immune system in handwritten Russian uppercase character recognition
Bandyopadhyay et al. Hierarchical clustering using auto-encoded compact representation for time-series analysis
CN113887509A (zh) 一种基于图像集合的快速多模态视频人脸识别方法
Patki et al. Classification using different normalization techniques in Support Vector Machine
Malik et al. Matrix factorization-based improved classification of gene expression data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant