CN111931595A - 一种基于广义表示的人脸图像分类方法 - Google Patents

一种基于广义表示的人脸图像分类方法 Download PDF

Info

Publication number
CN111931595A
CN111931595A CN202010689694.XA CN202010689694A CN111931595A CN 111931595 A CN111931595 A CN 111931595A CN 202010689694 A CN202010689694 A CN 202010689694A CN 111931595 A CN111931595 A CN 111931595A
Authority
CN
China
Prior art keywords
alpha
representation
training sample
face image
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010689694.XA
Other languages
English (en)
Other versions
CN111931595B (zh
Inventor
王敬
张宝
李健
宣贺君
孙艳歌
郭华平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinyang Normal University
Original Assignee
Xinyang Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinyang Normal University filed Critical Xinyang Normal University
Priority to CN202010689694.XA priority Critical patent/CN111931595B/zh
Publication of CN111931595A publication Critical patent/CN111931595A/zh
Application granted granted Critical
Publication of CN111931595B publication Critical patent/CN111931595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于人脸识别技术领域,公开一种基于广义表示的人脸图像分类方法;包括:对训练样本
Figure DDA0002588890790000011
和测试样本
Figure DDA0002588890790000014
进行归一化;d为人脸图像特征数目,n为训练样本的数目;所述训练样本共包括c类人脸图像;对训练样本和测试样本使用主成分分析进行降维;在MM框架下求解GRC优化问题
Figure DDA0002588890790000012
得到表示系数α;
Figure DDA0002588890790000013
λ为调节参数,p表示范数;根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。本发明充分利用到除L1范数和L2范数以外的其他不同范数可能带来的稀疏性和鲁棒性等特性,从而具有更高的分类准确率。

Description

一种基于广义表示的人脸图像分类方法
技术领域
本发明属于人脸识别技术领域,尤其涉及一种基于广义表示的人脸图像分类方法。
背景技术
基于稀疏表示的分类方法(Sparse Representation-based Classification,SRC)(Wright,J.,A.Y.Yang,A.Ganesh,S.S.Sastry,and Yi Ma.2009.“Robust FaceRecognition via Sparse Representation.”IEEE Transactions on Pattern Analysisand Machine Intelligence 31(2):210–227.)是一种被广泛应用的人脸识别方法。SRC的基本思想是用所有训练样本的稀疏的线性组合来表示某个测试样本,然后将该测试样本分类至表示误差最小的类别中。稀疏表示的重要性在相关算法中一再被强调,然而协同表示的作用却被忽略。基于协同表示的分类方法(Collaborative Representation-basedClassification,CRC)(Zhang,Lei,Meng Yang,and Xiangchu Feng.2011.“SparseRepresentation or Collaborative Representation:Which Helps Face Recognition?”In 2011International Conference on Computer Vision,471–478.)深入分析研究了稀疏表示和协同表示在人脸分类中的作用,并且证明CRC相对于SRC算法复杂度更低并且分类准确率更高,因而具有极大优势。
作为两种主流的人脸识别方法,SRC和CRC的核心算法可以归结为两种非常接近的优化问题,其目标函数相同,区别在于SRC中采用表示系数的L1范数作为惩罚项,而CRC中采用表示系数的L2范数作为惩罚项。SRC和CRC都固定了惩罚项中所采用的范数,因而没有充分利用到其他不同范数可能带来的稀疏性和鲁棒性等特性。
发明内容
本发明针对SRC和CRC固定了惩罚项中所采用的范数,没有充分利用到除L1范数和L2范数以外的其他不同范数可能带来的稀疏性和鲁棒性等特性的问题,提出一种基于广义表示的人脸图像分类方法。
为了实现上述目的,本发明采用以下技术方案:
一种基于广义表示的人脸图像分类方法,包括:
步骤1:对训练样本
Figure BDA0002588890770000021
和测试样本
Figure BDA0002588890770000022
进行归一化;d为人脸图像特征数目,n为训练样本的数目;所述训练样本共包括c类人脸图像;
步骤2:对训练样本和测试样本使用主成分分析进行降维;
步骤3:在MM(Majorization-Minimization,优化最小化)框架下求解GRC(Generalized Representation-based Classification,基于广义表示的分类方法)优化问题
Figure BDA0002588890770000023
得到表示系数α;
Figure BDA0002588890770000024
λ为调节参数,p表示范数,0<p≤2;
步骤4:根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。
进一步地,所述步骤3包括:
Figure BDA0002588890770000025
其中α(k)为α的第k次迭代结果,α(k)中不包含零元素;
定义如下替代函数
Figure BDA0002588890770000026
根据MM框架,迭代地优化g(α|α(k))以得到GRC优化问题的局部最优解,即
Figure BDA0002588890770000027
将g(α|α(k))对α求偏导,并令结果为0,可得
Figure BDA0002588890770000028
将α(k)迭代至收敛,即得到表示系数α。
进一步地,判断α(k)迭代至收敛的条件为:
表示系数的相对误差小于10-3,即
Figure BDA0002588890770000029
或者迭代次数达到30次。
进一步地,所述步骤4包括:
令αi是第i类训练样本Xi在α中对应的表示系数,计算第i类训练样本的残差
Figure BDA0002588890770000031
则测试样本y的预测类别为
Figure BDA0002588890770000032
将所有测试样本进行归类。
进一步地,在所述步骤4之后还包括:计算人脸图像平均分类准确率。
与现有技术相比,本发明具有的有益效果:
本发明首先对训练样本和测试样本进行归一化;然后对训练样本和测试样本使用主成分分析进行降维;在MM框架下求解GRC优化问题
Figure BDA0002588890770000033
得到表示系数α;根据α计算第i类训练样本的残差ri;并基于ri对测试样本进行分类。本发明充分利用到惩罚项中所采用的(0,2]任意范数可能带来的稀疏性和鲁棒性等特性,从而具有更高的分类准确率。
附图说明
图1为本发明实施例一种基于广义表示的人脸图像分类方法的基本流程图;
图2为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之一;
图3为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之一;
图4为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之二;
图5为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之二。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
在本发明中的公式中,小写字母表示标量,加粗的小写字母表示列向量,加粗的大写字母表示矩阵。||·||p为Lp范数。
如图1所示,一种基于广义表示的人脸图像分类方法,包括:
步骤S101:对训练样本
Figure BDA0002588890770000034
和测试样本
Figure BDA0002588890770000035
进行归一化;d为人脸图像特征数目,n为训练样本的数目;所述训练样本共包括c类人脸图像;
步骤S102:对训练样本和测试样本使用主成分分析进行降维;
步骤S103:在MM框架下求解GRC优化问题
Figure BDA0002588890770000041
得到表示系数α;
Figure BDA0002588890770000042
λ为调节参数,p表示范数,0<p≤2;
步骤S104:根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。
进一步地,所述步骤S101中:
Figure BDA0002588890770000043
为训练样本,其每行为一个特征,每列为一个样本,d为特征数目,n为训练样本的数目,
Figure BDA0002588890770000044
表示实数;这些样本属于c个类别,其中第i类训练样本为
Figure BDA0002588890770000045
ni为第i类训练样本的数目,i=1,2,...,c;
Figure BDA0002588890770000046
为测试样本。
进一步地,所述步骤S103包括:
GRC优化问题可以表示为:
Figure BDA0002588890770000047
其中
Figure BDA0002588890770000048
为表示系数;λ为调节参数;
本发明在MM框架下求解GRC的优化问题;设f(α)是需要最小化的目标函数,在MM框架下,如果存在一个替代函数g(α|α(k))满足如下两个关键条件:
f(α(k))=g(α(k)(k))
f(α)≤g(α|α(k)),对所有α成立
其中α(k)为表示系数α的第k次迭代结果,那么可以通过如下方式迭代地最小化替代函数g(α|α(k))来优化f(α)
Figure BDA0002588890770000049
可以得到
f(α(k+1))=f(α(k+1))-g(α(k+1)(k))+g(α(k+1)(k))
≤f(α(k))-g(α(k)(k))+g(α(k+1)(k))
≤f(α(k))-g(α(k)(k))+g(α(k)(k))
=f(α(k))
其中第一个不等式成立的原因是f(α)-g(α|α(k))在α=α(k)时取得最大值,这是由两个关键条件来保证的;第二个不等式成立的原因是g(α|α(k))在α=α(k+1)时取得最小值,这是由迭代的规则来保证的。因此,在迭代过程中目标函数单调递减,最终会收敛到一个局部最优值。
对于任意
Figure BDA00025888907700000410
β不包含零元素,0<p≤2,不等式
Figure BDA0002588890770000051
成立,并且当且仅当α=β时取等号。
GRC优化问题的求解过程具体为:
Figure BDA0002588890770000052
其中α(k)为α的第k次迭代结果,α(k)中不包含零元素,0<p≤2;
定义如下替代函数
Figure BDA0002588890770000053
根据MM框架,迭代地优化g(α|α(k))以得到GRC优化问题的局部最优解即
Figure BDA0002588890770000054
将g(α|α(k))对α求偏导,并令结果为0,可得
Figure BDA0002588890770000055
将α(k)迭代至收敛,即得到表示系数α。
进一步地,判断α(k)迭代至收敛的条件为:
表示系数的相对误差小于10-3,即
Figure BDA0002588890770000056
或者迭代次数达到30次。
进一步地,所述步骤4包括:
令αi是第i类训练样本Xi在α中对应的表示系数,计算第i类训练样本的残差
Figure BDA0002588890770000057
则测试样本y的预测类别为
Figure BDA0002588890770000058
将所有测试样本进行归类。
进一步地,在所述步骤S104之后还包括:
步骤S105:计算人脸图像平均分类准确率。
为验证本发明效果,进行如下实验:
本实施例中采用两种常见的人脸数据集,即FERET数据集和AR数据集。
FERET数据集包括1400张人脸图像,来自200个被试,每个被试7张图像。这些图像是在不同的面部表情,拍摄角度和光照条件下拍摄的。所有图像经过裁剪和缩放,最终分辨率为80×80。其中前三个被试的图像如图2所示。
对FERET数据集中的每个被试,随机选取4张图像作为训练样本,剩下的3张图像作为测试样本,先对训练样本和测试样本进行归一化,然后用主成分分析进行降维,保留前54个主成分,之后使用GRC对降维后的数据进行分类。将整个过程重复10次,计算平均分类准确率。改变GRC中的Lp范数对应的值,p=[0.1:0.1∶2.0],得到平均分类准确率随p值变化的结果如图3所示。最高分类准确率为0.5463,当p=1.1时取得。当p=1.0时,GRC退化为SRC,分类准确率为0.5368;当p=2.0时,GRC退化为CRC,分类准确率为0.4375。该实验结果证明,将SRC中的L1范数和CRC中的L2范数推广至任意范数得到的GRC能够进一步提高该类方法的分类准确率。
AR数据集包括3120张人脸图像,来自120个被试,每个被试26张图像。这些图像是在不同的面部表情和光照条件下拍摄的。部分图像中有太阳镜或者围巾的遮挡。所有图像经过裁剪和缩放,最终的分辨率为50×40。其中第一个被试的图像如图4所示。
对AR数据集中的每个被试,随机选取6张图像作为训练样本,4张图像作为测试样本,类似地依次进行归一化,主成分分析降维,保留前54个主成分,然后使用GRC对降维后的数据进行分类。将整个过程重复10次,计算平均分类准确率,得到平均分类准确率随p值变化的结果如图5所示。最高分类准确率为0.8637,当p=1.2时取得。当p=1.0时,GRC退化为SRC,分类准确率为0.8556;当p=2.0时,GRC退化为CRC,分类准确率为0.8142。该实验结果进一步证明了基于任意范数的GRC方法相对于SRC和CRC的优势。
综上所述,本发明公布的方法在MM框架下,将经典算法SRC和CRC中惩罚项的范数推广至(0,2]的任意数,极大地丰富了基于表示的分类方法的理论,并且进一步提升了分类识别效果,因而具有重要的理论价值和实际意义。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于广义表示的人脸图像分类方法,其特征在于,包括:
步骤1:对训练样本
Figure FDA0002588890760000011
和测试样本
Figure FDA0002588890760000012
进行归一化;d为人脸图像特征数目,n为训练样本的数目;所述训练样本共包括c类人脸图像;
步骤2:对训练样本和测试样本使用主成分分析进行降维;
步骤3:在MM框架下求解GRC优化问题
Figure FDA0002588890760000013
得到表示系数α;
Figure FDA0002588890760000014
λ为调节参数,p表示范数,0<p≤2;
步骤4:根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。
2.根据权利要求1所述的一种基于广义表示的人脸图像分类方法,其特征在于,所述步骤3包括:
Figure FDA0002588890760000015
其中α(k)为α的第k次迭代结果,α(k)中不包含零元素;
定义如下替代函数
Figure FDA0002588890760000016
根据MM框架,迭代地优化g(α|α(k))以得到GRC优化问题的局部最优解,即
Figure FDA0002588890760000017
将g(α|α(k))对α求偏导,并令结果为0,可得
Figure FDA0002588890760000018
将α(k)迭代至收敛,即得到表示系数α。
3.根据权利要求2所述的一种基于广义表示的人脸图像分类方法,其特征在于,判断α(k)迭代至收敛的条件为:
表示系数的相对误差小于10-3,即
Figure FDA0002588890760000019
或者迭代次数达到30次。
4.根据权利要求2所述的一种基于广义表示的人脸图像分类方法,其特征在于,所述步骤4包括:
令αi是第i类训练样本Xi在α中对应的表示系数,计算第i类训练样本的残差
Figure FDA0002588890760000021
则测试样本y的预测类别为
Figure FDA0002588890760000022
将所有测试样本进行归类。
5.根据权利要求1-4任一所述的一种基于广义表示的人脸图像分类方法,其特征在于,在所述步骤4之后还包括:计算人脸图像平均分类准确率。
CN202010689694.XA 2020-07-17 2020-07-17 一种基于广义表示的人脸图像分类方法 Active CN111931595B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010689694.XA CN111931595B (zh) 2020-07-17 2020-07-17 一种基于广义表示的人脸图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010689694.XA CN111931595B (zh) 2020-07-17 2020-07-17 一种基于广义表示的人脸图像分类方法

Publications (2)

Publication Number Publication Date
CN111931595A true CN111931595A (zh) 2020-11-13
CN111931595B CN111931595B (zh) 2022-05-24

Family

ID=73313144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010689694.XA Active CN111931595B (zh) 2020-07-17 2020-07-17 一种基于广义表示的人脸图像分类方法

Country Status (1)

Country Link
CN (1) CN111931595B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740911A (zh) * 2016-02-02 2016-07-06 温州大学 基于保持结构稀疏化的半监督字典学习方法
CN106295694A (zh) * 2016-08-05 2017-01-04 浙江工业大学 一种迭代重约束组稀疏表示分类的人脸识别方法
CN107066964A (zh) * 2017-04-11 2017-08-18 宋佳颖 一种快速协同表示人脸分类方法
WO2018149133A1 (zh) * 2017-02-17 2018-08-23 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统
CN109522971A (zh) * 2018-12-18 2019-03-26 重庆大学 一种基于分类图像块稀疏表示的cs-mri图像重构方法
CN109840567A (zh) * 2018-11-16 2019-06-04 中电科新型智慧城市研究院有限公司 一种基于最优协同表示的稳健判别特征提取方法
CN111095294A (zh) * 2017-07-05 2020-05-01 深视有限公司 深度视觉处理器

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740911A (zh) * 2016-02-02 2016-07-06 温州大学 基于保持结构稀疏化的半监督字典学习方法
CN106295694A (zh) * 2016-08-05 2017-01-04 浙江工业大学 一种迭代重约束组稀疏表示分类的人脸识别方法
WO2018149133A1 (zh) * 2017-02-17 2018-08-23 深圳大学 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统
CN107066964A (zh) * 2017-04-11 2017-08-18 宋佳颖 一种快速协同表示人脸分类方法
CN111095294A (zh) * 2017-07-05 2020-05-01 深视有限公司 深度视觉处理器
CN109840567A (zh) * 2018-11-16 2019-06-04 中电科新型智慧城市研究院有限公司 一种基于最优协同表示的稳健判别特征提取方法
CN109522971A (zh) * 2018-12-18 2019-03-26 重庆大学 一种基于分类图像块稀疏表示的cs-mri图像重构方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BANGYUE REN ET AL: "A Sparsity-Promoted Method Based on Majorization-Minimization for Weak Fault Feature Enhancement", 《SENSORS》 *
张国庆: "基于稀疏表示的特征提取与分类方法研究", 《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》 *
管阳: "基于lp范数稀疏增强的人脸识别算法", 《自动化与仪器仪表》 *

Also Published As

Publication number Publication date
CN111931595B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN109615014B (zh) 一种基于kl散度优化的3d物体数据分类系统与方法
CN110674777A (zh) 一种专利文本场景下的光学字符识别方法
CN115578248B (zh) 一种基于风格引导的泛化增强图像分类算法
CN112861982A (zh) 一种基于梯度平均的长尾目标检测方法
CN112001404A (zh) 自适应全局和局部双层优化的图像生成模型和生成方法
CN113793319A (zh) 基于类别约束字典学习模型的织物图像瑕疵检测方法及系统
CN107066964A (zh) 一种快速协同表示人脸分类方法
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN115049952A (zh) 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法
CN110399814B (zh) 一种基于局部线性表示领域适应度量的人脸识别方法
CN113255832B (zh) 双分支多中心的长尾分布识别的方法
Andrews et al. Maximum likelihood inference in weakly identified DSGE models
CN108388918B (zh) 具有结构保持特性的数据特征选择方法
CN111931595B (zh) 一种基于广义表示的人脸图像分类方法
CN111611963B (zh) 一种基于近邻保持典型相关分析的人脸识别方法
CN112966735A (zh) 一种基于谱重建的监督多集相关特征融合方法
CN110288002B (zh) 一种基于稀疏正交神经网络的图像分类方法
Chen et al. Mitigating label noise in gans via enhanced spectral normalization
CN111079657A (zh) 一种基于半监督线性回归的人脸识别方法
CN109829377A (zh) 一种基于深度余弦度量学习的行人重识别方法
CN113408610B (zh) 一种基于自适应矩阵迭代极限学习机的图像识别方法
Zheng et al. Perturbation LDA: learning the difference between the class empirical mean and its expectation
CN111914718B (zh) 基于平均影响值数据变换的特征加权pca人脸识别方法
CN111104868B (zh) 一种基于卷积神经网络特征的跨质量人脸识别方法
CN113610229A (zh) 一种基于范数不确定性指标的主动学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant