CN111931595A - 一种基于广义表示的人脸图像分类方法 - Google Patents
一种基于广义表示的人脸图像分类方法 Download PDFInfo
- Publication number
- CN111931595A CN111931595A CN202010689694.XA CN202010689694A CN111931595A CN 111931595 A CN111931595 A CN 111931595A CN 202010689694 A CN202010689694 A CN 202010689694A CN 111931595 A CN111931595 A CN 111931595A
- Authority
- CN
- China
- Prior art keywords
- alpha
- representation
- training sample
- face image
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
Description
技术领域
本发明属于人脸识别技术领域,尤其涉及一种基于广义表示的人脸图像分类方法。
背景技术
基于稀疏表示的分类方法(Sparse Representation-based Classification,SRC)(Wright,J.,A.Y.Yang,A.Ganesh,S.S.Sastry,and Yi Ma.2009.“Robust FaceRecognition via Sparse Representation.”IEEE Transactions on Pattern Analysisand Machine Intelligence 31(2):210–227.)是一种被广泛应用的人脸识别方法。SRC的基本思想是用所有训练样本的稀疏的线性组合来表示某个测试样本,然后将该测试样本分类至表示误差最小的类别中。稀疏表示的重要性在相关算法中一再被强调,然而协同表示的作用却被忽略。基于协同表示的分类方法(Collaborative Representation-basedClassification,CRC)(Zhang,Lei,Meng Yang,and Xiangchu Feng.2011.“SparseRepresentation or Collaborative Representation:Which Helps Face Recognition?”In 2011International Conference on Computer Vision,471–478.)深入分析研究了稀疏表示和协同表示在人脸分类中的作用,并且证明CRC相对于SRC算法复杂度更低并且分类准确率更高,因而具有极大优势。
作为两种主流的人脸识别方法,SRC和CRC的核心算法可以归结为两种非常接近的优化问题,其目标函数相同,区别在于SRC中采用表示系数的L1范数作为惩罚项,而CRC中采用表示系数的L2范数作为惩罚项。SRC和CRC都固定了惩罚项中所采用的范数,因而没有充分利用到其他不同范数可能带来的稀疏性和鲁棒性等特性。
发明内容
本发明针对SRC和CRC固定了惩罚项中所采用的范数,没有充分利用到除L1范数和L2范数以外的其他不同范数可能带来的稀疏性和鲁棒性等特性的问题,提出一种基于广义表示的人脸图像分类方法。
为了实现上述目的,本发明采用以下技术方案:
一种基于广义表示的人脸图像分类方法,包括:
步骤2:对训练样本和测试样本使用主成分分析进行降维;
步骤3:在MM(Majorization-Minimization,优化最小化)框架下求解GRC(Generalized Representation-based Classification,基于广义表示的分类方法)优化问题得到表示系数α;λ为调节参数,p表示范数,0<p≤2;
步骤4:根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。
进一步地,所述步骤3包括:
其中α(k)为α的第k次迭代结果,α(k)中不包含零元素;
定义如下替代函数
根据MM框架,迭代地优化g(α|α(k))以得到GRC优化问题的局部最优解,即
将g(α|α(k))对α求偏导,并令结果为0,可得
将α(k)迭代至收敛,即得到表示系数α。
进一步地,判断α(k)迭代至收敛的条件为:
表示系数的相对误差小于10-3,即
或者迭代次数达到30次。
进一步地,所述步骤4包括:
令αi是第i类训练样本Xi在α中对应的表示系数,计算第i类训练样本的残差
将所有测试样本进行归类。
进一步地,在所述步骤4之后还包括:计算人脸图像平均分类准确率。
与现有技术相比,本发明具有的有益效果:
本发明首先对训练样本和测试样本进行归一化;然后对训练样本和测试样本使用主成分分析进行降维;在MM框架下求解GRC优化问题得到表示系数α;根据α计算第i类训练样本的残差ri;并基于ri对测试样本进行分类。本发明充分利用到惩罚项中所采用的(0,2]任意范数可能带来的稀疏性和鲁棒性等特性,从而具有更高的分类准确率。
附图说明
图1为本发明实施例一种基于广义表示的人脸图像分类方法的基本流程图;
图2为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之一;
图3为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之一;
图4为本发明实施例一种基于广义表示的人脸图像分类方法的实验数据集示例图之二;
图5为本发明实施例一种基于广义表示的人脸图像分类方法的分类准确率示例图之二。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
在本发明中的公式中,小写字母表示标量,加粗的小写字母表示列向量,加粗的大写字母表示矩阵。||·||p为Lp范数。
如图1所示,一种基于广义表示的人脸图像分类方法,包括:
步骤S102:对训练样本和测试样本使用主成分分析进行降维;
步骤S104:根据表示系数α计算第i类训练样本的残差ri;i=1,2,...,c;并基于ri对测试样本进行分类。
进一步地,所述步骤S101中:
进一步地,所述步骤S103包括:
GRC优化问题可以表示为:
本发明在MM框架下求解GRC的优化问题;设f(α)是需要最小化的目标函数,在MM框架下,如果存在一个替代函数g(α|α(k))满足如下两个关键条件:
f(α(k))=g(α(k)|α(k))
f(α)≤g(α|α(k)),对所有α成立
其中α(k)为表示系数α的第k次迭代结果,那么可以通过如下方式迭代地最小化替代函数g(α|α(k))来优化f(α)
可以得到
f(α(k+1))=f(α(k+1))-g(α(k+1)|α(k))+g(α(k+1)|α(k))
≤f(α(k))-g(α(k)|α(k))+g(α(k+1)|α(k))
≤f(α(k))-g(α(k)|α(k))+g(α(k)|α(k))
=f(α(k))
其中第一个不等式成立的原因是f(α)-g(α|α(k))在α=α(k)时取得最大值,这是由两个关键条件来保证的;第二个不等式成立的原因是g(α|α(k))在α=α(k+1)时取得最小值,这是由迭代的规则来保证的。因此,在迭代过程中目标函数单调递减,最终会收敛到一个局部最优值。
成立,并且当且仅当α=β时取等号。
GRC优化问题的求解过程具体为:
其中α(k)为α的第k次迭代结果,α(k)中不包含零元素,0<p≤2;
定义如下替代函数
根据MM框架,迭代地优化g(α|α(k))以得到GRC优化问题的局部最优解即
将g(α|α(k))对α求偏导,并令结果为0,可得
将α(k)迭代至收敛,即得到表示系数α。
进一步地,判断α(k)迭代至收敛的条件为:
表示系数的相对误差小于10-3,即
或者迭代次数达到30次。
进一步地,所述步骤4包括:
令αi是第i类训练样本Xi在α中对应的表示系数,计算第i类训练样本的残差
将所有测试样本进行归类。
进一步地,在所述步骤S104之后还包括:
步骤S105:计算人脸图像平均分类准确率。
为验证本发明效果,进行如下实验:
本实施例中采用两种常见的人脸数据集,即FERET数据集和AR数据集。
FERET数据集包括1400张人脸图像,来自200个被试,每个被试7张图像。这些图像是在不同的面部表情,拍摄角度和光照条件下拍摄的。所有图像经过裁剪和缩放,最终分辨率为80×80。其中前三个被试的图像如图2所示。
对FERET数据集中的每个被试,随机选取4张图像作为训练样本,剩下的3张图像作为测试样本,先对训练样本和测试样本进行归一化,然后用主成分分析进行降维,保留前54个主成分,之后使用GRC对降维后的数据进行分类。将整个过程重复10次,计算平均分类准确率。改变GRC中的Lp范数对应的值,p=[0.1:0.1∶2.0],得到平均分类准确率随p值变化的结果如图3所示。最高分类准确率为0.5463,当p=1.1时取得。当p=1.0时,GRC退化为SRC,分类准确率为0.5368;当p=2.0时,GRC退化为CRC,分类准确率为0.4375。该实验结果证明,将SRC中的L1范数和CRC中的L2范数推广至任意范数得到的GRC能够进一步提高该类方法的分类准确率。
AR数据集包括3120张人脸图像,来自120个被试,每个被试26张图像。这些图像是在不同的面部表情和光照条件下拍摄的。部分图像中有太阳镜或者围巾的遮挡。所有图像经过裁剪和缩放,最终的分辨率为50×40。其中第一个被试的图像如图4所示。
对AR数据集中的每个被试,随机选取6张图像作为训练样本,4张图像作为测试样本,类似地依次进行归一化,主成分分析降维,保留前54个主成分,然后使用GRC对降维后的数据进行分类。将整个过程重复10次,计算平均分类准确率,得到平均分类准确率随p值变化的结果如图5所示。最高分类准确率为0.8637,当p=1.2时取得。当p=1.0时,GRC退化为SRC,分类准确率为0.8556;当p=2.0时,GRC退化为CRC,分类准确率为0.8142。该实验结果进一步证明了基于任意范数的GRC方法相对于SRC和CRC的优势。
综上所述,本发明公布的方法在MM框架下,将经典算法SRC和CRC中惩罚项的范数推广至(0,2]的任意数,极大地丰富了基于表示的分类方法的理论,并且进一步提升了分类识别效果,因而具有重要的理论价值和实际意义。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
5.根据权利要求1-4任一所述的一种基于广义表示的人脸图像分类方法,其特征在于,在所述步骤4之后还包括:计算人脸图像平均分类准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010689694.XA CN111931595B (zh) | 2020-07-17 | 2020-07-17 | 一种基于广义表示的人脸图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010689694.XA CN111931595B (zh) | 2020-07-17 | 2020-07-17 | 一种基于广义表示的人脸图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931595A true CN111931595A (zh) | 2020-11-13 |
CN111931595B CN111931595B (zh) | 2022-05-24 |
Family
ID=73313144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010689694.XA Active CN111931595B (zh) | 2020-07-17 | 2020-07-17 | 一种基于广义表示的人脸图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931595B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740911A (zh) * | 2016-02-02 | 2016-07-06 | 温州大学 | 基于保持结构稀疏化的半监督字典学习方法 |
CN106295694A (zh) * | 2016-08-05 | 2017-01-04 | 浙江工业大学 | 一种迭代重约束组稀疏表示分类的人脸识别方法 |
CN107066964A (zh) * | 2017-04-11 | 2017-08-18 | 宋佳颖 | 一种快速协同表示人脸分类方法 |
WO2018149133A1 (zh) * | 2017-02-17 | 2018-08-23 | 深圳大学 | 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统 |
CN109522971A (zh) * | 2018-12-18 | 2019-03-26 | 重庆大学 | 一种基于分类图像块稀疏表示的cs-mri图像重构方法 |
CN109840567A (zh) * | 2018-11-16 | 2019-06-04 | 中电科新型智慧城市研究院有限公司 | 一种基于最优协同表示的稳健判别特征提取方法 |
CN111095294A (zh) * | 2017-07-05 | 2020-05-01 | 深视有限公司 | 深度视觉处理器 |
-
2020
- 2020-07-17 CN CN202010689694.XA patent/CN111931595B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740911A (zh) * | 2016-02-02 | 2016-07-06 | 温州大学 | 基于保持结构稀疏化的半监督字典学习方法 |
CN106295694A (zh) * | 2016-08-05 | 2017-01-04 | 浙江工业大学 | 一种迭代重约束组稀疏表示分类的人脸识别方法 |
WO2018149133A1 (zh) * | 2017-02-17 | 2018-08-23 | 深圳大学 | 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统 |
CN107066964A (zh) * | 2017-04-11 | 2017-08-18 | 宋佳颖 | 一种快速协同表示人脸分类方法 |
CN111095294A (zh) * | 2017-07-05 | 2020-05-01 | 深视有限公司 | 深度视觉处理器 |
CN109840567A (zh) * | 2018-11-16 | 2019-06-04 | 中电科新型智慧城市研究院有限公司 | 一种基于最优协同表示的稳健判别特征提取方法 |
CN109522971A (zh) * | 2018-12-18 | 2019-03-26 | 重庆大学 | 一种基于分类图像块稀疏表示的cs-mri图像重构方法 |
Non-Patent Citations (3)
Title |
---|
BANGYUE REN ET AL: "A Sparsity-Promoted Method Based on Majorization-Minimization for Weak Fault Feature Enhancement", 《SENSORS》 * |
张国庆: "基于稀疏表示的特征提取与分类方法研究", 《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》 * |
管阳: "基于lp范数稀疏增强的人脸识别算法", 《自动化与仪器仪表》 * |
Also Published As
Publication number | Publication date |
---|---|
CN111931595B (zh) | 2022-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109615014B (zh) | 一种基于kl散度优化的3d物体数据分类系统与方法 | |
CN110674777A (zh) | 一种专利文本场景下的光学字符识别方法 | |
CN115578248B (zh) | 一种基于风格引导的泛化增强图像分类算法 | |
CN112861982A (zh) | 一种基于梯度平均的长尾目标检测方法 | |
CN112001404A (zh) | 自适应全局和局部双层优化的图像生成模型和生成方法 | |
CN113793319A (zh) | 基于类别约束字典学习模型的织物图像瑕疵检测方法及系统 | |
CN107066964A (zh) | 一种快速协同表示人脸分类方法 | |
CN116821832A (zh) | 针对高压工商业用户用电负荷的异常数据辨识与修正方法 | |
CN115049952A (zh) | 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法 | |
CN110399814B (zh) | 一种基于局部线性表示领域适应度量的人脸识别方法 | |
CN113255832B (zh) | 双分支多中心的长尾分布识别的方法 | |
Andrews et al. | Maximum likelihood inference in weakly identified DSGE models | |
CN108388918B (zh) | 具有结构保持特性的数据特征选择方法 | |
CN111931595B (zh) | 一种基于广义表示的人脸图像分类方法 | |
CN111611963B (zh) | 一种基于近邻保持典型相关分析的人脸识别方法 | |
CN112966735A (zh) | 一种基于谱重建的监督多集相关特征融合方法 | |
CN110288002B (zh) | 一种基于稀疏正交神经网络的图像分类方法 | |
Chen et al. | Mitigating label noise in gans via enhanced spectral normalization | |
CN111079657A (zh) | 一种基于半监督线性回归的人脸识别方法 | |
CN109829377A (zh) | 一种基于深度余弦度量学习的行人重识别方法 | |
CN113408610B (zh) | 一种基于自适应矩阵迭代极限学习机的图像识别方法 | |
Zheng et al. | Perturbation LDA: learning the difference between the class empirical mean and its expectation | |
CN111914718B (zh) | 基于平均影响值数据变换的特征加权pca人脸识别方法 | |
CN111104868B (zh) | 一种基于卷积神经网络特征的跨质量人脸识别方法 | |
CN113610229A (zh) | 一种基于范数不确定性指标的主动学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |