CN111931665B - 一种基于类内变化字典建模的欠采样人脸识别方法 - Google Patents
一种基于类内变化字典建模的欠采样人脸识别方法 Download PDFInfo
- Publication number
- CN111931665B CN111931665B CN202010813209.5A CN202010813209A CN111931665B CN 111931665 B CN111931665 B CN 111931665B CN 202010813209 A CN202010813209 A CN 202010813209A CN 111931665 B CN111931665 B CN 111931665B
- Authority
- CN
- China
- Prior art keywords
- intra
- class
- face recognition
- dictionary
- sparse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于类内变化字典建模的欠采样人脸识别方法,属于数字图像和模式识别领域。该方法包括:字典学习阶段:通过鲁棒主成分分析法获得通用数据集的稀疏误差图像,将其作为类内变化字典,提供更多的类内变化信息;人脸识别阶段:将学习到的字典添加到扩展的基于稀疏表示分类的框架中以完成人脸识别过程。本发明通过鲁棒主成分分析法提取类内变化字典,相较于扩展的基于稀疏表示分类法,欠采样人脸识别的结果更有效,更具有鲁棒性,尤其是在跨数据库上的识别。
Description
技术领域
本发明属于数字图像和模式识别领域,涉及鲁棒主成分分析等技术,主要针对欠采样人脸识别的问题。
背景技术
近年来,人脸识别技术已经成功地应用了稀疏编码技术,最典型的工作是用于面部识别的基于稀疏表示的分类(SRC)。它需要大量的训练样本,否则其性能将下降。但是,在许多应用中,比如法律实施、护照验证、身份证验证等,每人只有很少甚至一张图像可供训练人脸识别系统,这被称为欠采样人脸识别问题,并且测试图像会包含各种变化,例如光照,表情和面部遮挡(比如围巾和墨镜),这些额外的面部干扰会使面部识别率下降。
为了解决欠采样问题,一些现有文献提出了一种通用的学习框架,这个框架从通用集合中提取判别性信息。如邓伟洪等人在SRC的框架中增加了通用性,提出了扩展的基于稀疏表示的分类(ESRC),该分类假设一类的类内变化可以通过其他类的类内变化的稀疏线性组合来近似。尽管ESRC的结果在某些情况下良好,但当类内差异很大时,其性能不是很好。这是因为它类内字典的构建过程相对简单,所以很难捕获到复杂的类内变化。
发明内容
有鉴于此,本发明的目的在于提供一种基于类内变化字典建模的欠采样人脸识别方法,解决实际生活中每个人只有很少甚至一张训练图像的人脸识别问题,提高基于少样本图像的识别效果。
为达到上述目的,本发明提供如下技术方案:
一种基于类内变化字典建模的欠采样人脸识别方法,包括以下步骤:
S1:字典学习阶段:通过鲁棒主成分分析法获得通用数据集的稀疏误差图像,将其作为类内变化字典,提供了更多的类内变化信息;
S2:人脸识别阶段:将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中以完成人脸识别过程。
进一步,所述步骤S1具体包括以下步骤:
S11:选取用于构造字典的样本M;
S12:通过鲁棒主成分分析法获得稀疏误差图像S,计算公式为:
minL,S(||L||*+γ||S||1),s.t. M=L+S
其中,γ是正则化参数,L是图像的低秩成分,S是图像的稀疏成分,‖·‖*表示核范数。
S13:用基于增广拉格朗日乘数的方法求解步骤S12的凸优化问题,从而得到稀疏误差图像S,将其作为类内变化字典。
进一步,所述步骤S2具体包括以下步骤:
S21:选取训练和测试样本进行人脸识别;
S22:将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中学习表示系数;
S23:计算每一类的表示误差,将最小误差的那一类确定为测试样本的类别。
进一步,所述步骤S22具体包括以下步骤:
S221:定义y为测试样本,A为训练矩阵,S为通过鲁棒主成分分析得到的类内变化字典,x,β为表示系数,则表示系数的计算公式为:
S222:通过同伦法求解步骤S221中的1范数最小化问题,从而计算出表示系数。
本发明的有益效果在于:与扩展的基于稀疏表示分类方法相比,本发明构造的字典可以提供类内差异的更多信息,识别的结果更有效,更具有鲁棒性,尤其是跨数据库上的欠采样人脸识别。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明方法的基本构思示意图;
图2为本发明方法的流程框图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图2,本发明优选了一种基于类内变化字典建模的欠采样人脸识别方法,为了使类内变化字典更多的包含类内变化信息,本实施例引入了鲁棒性主成分分析法,该方法得到的稀疏误差图像可作为类内变化字典,将此字典添加到扩展的基于稀疏表示分类的框架中进行人脸识别,可提升识别性能。
其中x和β是表示系数,DI可以通过从相同类别的图像减去自然图像或类质心图像得到。该方法中类内变化字典的构造过程相对简单,不易获得复杂的类内变化信息,进而导致识别的性能下降。为了解决这个缺陷,本实施例提出如下改进的模型来提高识别性能:
minL,S(||L||*+γ||S||1),s.t. M=L+S (5)
从公式(3)可以看到,本模型是一个1范数最小化问题,可用同伦法求解,我们将λ设为0.02。公式(5)是一个凸优化问题,可用基于增广拉格朗日乘数的方法求解。
为了验证本发明的效果,进行了以下实验:
1、训练样本不足的实验。
2、跨数据库上的实验。
对于实验1,分别在AR数据库和EYB数据库上进行了训练样本不足的实验。在AR数据库上,选取了一个子集,该子集包含来自于100类的900张人脸。随机选取80类,其中每类1张自然图像用于训练,其他包含光照,表情,遮挡的8张图像用于测试。剩余的20类用于构造类内变化字典。实验结果如表1所示。
表1每人一个训练样本在AR数据库上的识别准确性(%)
在EYB数据库上,选取第一类的64张图像用于构造类内变化字典,其余37类中子集1的7张图像用于训练,子集2-5的图像用于测试。实验结果如表2所示。
表2使用一类的类内字典在EYB数据库上的识别率(%)
对于实验2,在AR数据库上学习光照变化下的类内字典,在EYB数据库上进行训练和测试。实验结果如表3所示。
表3使用AR数据库的类内字典在EYB数据库上的识别率(%)
从以上三个表的实验对比结果可以看出,本发明所设计的欠采样人脸识别方法能够提高识别率。特别是在跨数据库实验上,ESRC相较于SRC识别率没什么提升,而本发明依然有提升,说明本发明相较于ESRC来说更具有鲁棒性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种基于类内变化字典建模的欠采样人脸识别方法,其特征在于,该方法包括以下步骤:
S1:字典学习阶段:通过鲁棒主成分分析法获得通用数据集的稀疏误差图像,将其作为类内变化字典;具体包括以下步骤:
S11:选取用于构造字典的样本M;
S12:通过鲁棒主成分分析法获得稀疏误差图像S,计算公式为:
minL,S(‖L‖*+γ‖S‖1),s.t.M=L+S
其中,γ是正则化参数,L是图像的低秩成分,S是图像的稀疏成分,‖·‖*表示核范数;
S2:人脸识别阶段:将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中以完成人脸识别过程;具体包括以下步骤:
S21:选取训练和测试样本进行人脸识别;
S22:将学习到的类内变化字典添加到扩展的基于稀疏表示分类的框架中学习表示系数;
S23:计算每一类的表示误差,将最小误差的那一类确定为测试样本的类别。
2.根据权利要求1所述的欠采样人脸识别方法,其特征在于,所述步骤S1还包括:用基于增广拉格朗日乘数的方法求解步骤S12的凸优化问题,从而得到稀疏误差图像S,将其作为类内变化字典。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813209.5A CN111931665B (zh) | 2020-08-13 | 2020-08-13 | 一种基于类内变化字典建模的欠采样人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010813209.5A CN111931665B (zh) | 2020-08-13 | 2020-08-13 | 一种基于类内变化字典建模的欠采样人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111931665A CN111931665A (zh) | 2020-11-13 |
CN111931665B true CN111931665B (zh) | 2023-02-21 |
Family
ID=73311707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010813209.5A Active CN111931665B (zh) | 2020-08-13 | 2020-08-13 | 一种基于类内变化字典建模的欠采样人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931665B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326791B (zh) * | 2021-06-10 | 2023-09-26 | 沈阳航空航天大学 | 基于鲁棒性自适应图结构学习算法的人脸识别方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915436A (zh) * | 2012-10-25 | 2013-02-06 | 北京邮电大学 | 基于类内变化字典和训练图像的稀疏表示人脸识别方法 |
CN103984918A (zh) * | 2014-04-21 | 2014-08-13 | 郑州轻工业学院 | 一种基于类内及类间变化的人脸图像识别方法 |
CN104392246A (zh) * | 2014-12-03 | 2015-03-04 | 北京理工大学 | 一种基于类间类内面部变化字典的单样本人脸识别方法 |
CN106056074A (zh) * | 2016-05-27 | 2016-10-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于区域稀疏的单张训练样本人脸识别方法 |
CN108090461A (zh) * | 2017-12-29 | 2018-05-29 | 浙江大学宁波理工学院 | 基于稀疏特征的三维人脸识别方法 |
CN108090409A (zh) * | 2017-11-06 | 2018-05-29 | 深圳大学 | 人脸识别方法、装置和存储介质 |
EP3340109A1 (en) * | 2016-12-25 | 2018-06-27 | Facebook, Inc. | Shape prediction for face alignment |
CN108681725A (zh) * | 2018-05-31 | 2018-10-19 | 西安理工大学 | 一种加权稀疏表示人脸识别方法 |
CN109800719A (zh) * | 2019-01-23 | 2019-05-24 | 南京大学 | 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法 |
CN110069978A (zh) * | 2019-03-04 | 2019-07-30 | 杭州电子科技大学 | 判别性非凸低秩分解和叠加线性稀疏表示的人脸识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130156300A1 (en) * | 2011-12-20 | 2013-06-20 | Fatih Porikli | Multi-Class Classification Method |
US11774944B2 (en) * | 2016-05-09 | 2023-10-03 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for the industrial internet of things |
-
2020
- 2020-08-13 CN CN202010813209.5A patent/CN111931665B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915436A (zh) * | 2012-10-25 | 2013-02-06 | 北京邮电大学 | 基于类内变化字典和训练图像的稀疏表示人脸识别方法 |
CN103984918A (zh) * | 2014-04-21 | 2014-08-13 | 郑州轻工业学院 | 一种基于类内及类间变化的人脸图像识别方法 |
CN104392246A (zh) * | 2014-12-03 | 2015-03-04 | 北京理工大学 | 一种基于类间类内面部变化字典的单样本人脸识别方法 |
CN106056074A (zh) * | 2016-05-27 | 2016-10-26 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于区域稀疏的单张训练样本人脸识别方法 |
EP3340109A1 (en) * | 2016-12-25 | 2018-06-27 | Facebook, Inc. | Shape prediction for face alignment |
CN108090409A (zh) * | 2017-11-06 | 2018-05-29 | 深圳大学 | 人脸识别方法、装置和存储介质 |
CN108090461A (zh) * | 2017-12-29 | 2018-05-29 | 浙江大学宁波理工学院 | 基于稀疏特征的三维人脸识别方法 |
CN108681725A (zh) * | 2018-05-31 | 2018-10-19 | 西安理工大学 | 一种加权稀疏表示人脸识别方法 |
CN109800719A (zh) * | 2019-01-23 | 2019-05-24 | 南京大学 | 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法 |
CN110069978A (zh) * | 2019-03-04 | 2019-07-30 | 杭州电子科技大学 | 判别性非凸低秩分解和叠加线性稀疏表示的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
"Extended SRC: Undersampled Face Recognition via Intraclass Variant Dictionary";W. Deng 等;《IEEE Transactions on Pattern Analysis and Machine Intelligence》;20120117;第1864 - 1870页 * |
"变化字典学习与显著特征提取的单样本人脸识别";王念兵 等;《小型微型计算机系统》;20170930;第2134-2138页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111931665A (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
RU2661750C1 (ru) | Распознавание символов с использованием искусственного интеллекта | |
CN110399821B (zh) | 基于人脸表情识别的顾客满意度获取方法 | |
CN111126404B (zh) | 一种基于改进YOLO v3的古文字及字体识别方法 | |
CN107330420B (zh) | 基于深度学习带有旋转信息的人脸表情识别方法 | |
CN109753950B (zh) | 动态人脸表情识别方法 | |
CN104966097A (zh) | 一种基于深度学习的复杂文字识别方法 | |
CN108509833B (zh) | 一种基于结构化分析字典的人脸识别方法、装置及设备 | |
Zhou et al. | A method of facial expression recognition based on Gabor and NMF | |
CN111832546A (zh) | 一种轻量级自然场景文本识别方法 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
CN112766283B (zh) | 一种基于多尺度卷积网络的两相流流型识别方法 | |
CN109684957A (zh) | 一种自动按照纸质表单展现系统数据的方法及系统 | |
CN111652273A (zh) | 一种基于深度学习的rgb-d图像分类方法 | |
CN113283336A (zh) | 一种文本识别方法与系统 | |
CN113793319A (zh) | 基于类别约束字典学习模型的织物图像瑕疵检测方法及系统 | |
Luo et al. | SLOGAN: handwriting style synthesis for arbitrary-length and out-of-vocabulary text | |
CN111931665B (zh) | 一种基于类内变化字典建模的欠采样人脸识别方法 | |
AlKhateeb et al. | Word-based handwritten Arabic scripts recognition using DCT features and neural network classifier | |
CN114863938A (zh) | 一种基于注意力残差和特征融合的鸟语识别方法和系统 | |
Nogra et al. | Baybáyin character recognition using convolutional neural network | |
CN111242131B (zh) | 一种智能阅卷中图像识别的方法、存储介质及装置 | |
Hajihashemi et al. | A pattern recognition based Holographic Graph Neuron for Persian alphabet recognition | |
CN113610080B (zh) | 基于跨模态感知的敏感图像识别方法、装置、设备及介质 | |
CN102298775B (zh) | 以样本为基础的人脸超分辨率重建方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |