CN110147782A - 一种基于投影字典对学习的人脸识别方法及装置 - Google Patents
一种基于投影字典对学习的人脸识别方法及装置 Download PDFInfo
- Publication number
- CN110147782A CN110147782A CN201910459926.XA CN201910459926A CN110147782A CN 110147782 A CN110147782 A CN 110147782A CN 201910459926 A CN201910459926 A CN 201910459926A CN 110147782 A CN110147782 A CN 110147782A
- Authority
- CN
- China
- Prior art keywords
- matrix
- function
- preset
- constraint
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims abstract description 206
- 238000012549 training Methods 0.000 claims abstract description 67
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 41
- 238000003860 storage Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 128
- 238000005457 optimization Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 6
- 230000001815 facial effect Effects 0.000 abstract 3
- 238000012545 processing Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 3
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于投影字典对学习的人脸识别方法,包括:获取目标人脸图像;利用稀疏投影矩阵提取目标人脸图像中的目标特征;将目标特征输入识别分类器,输出目标人脸图像的识别结果;其中,稀疏投影矩阵和识别分类器利用基于L2,1‑范式约束的矩阵分解和基于L2,1‑范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1‑范式约束。其中,基于L2,1‑范式约束的矩阵分解和基于L2,1‑范式约束的投影字典对学习训练稀疏投影矩阵和识别分类器,能够使稀疏投影矩阵提取到显著的图像特征,并降低数据维度,从而提高人脸识别的效率和准确率。本发明公开的一种基于投影字典对学习的人脸识别装置、设备及可读存储介质,也同样具有上述技术效果。
Description
技术领域
本发明涉及计算机视觉和图像处理技术领域,特别涉及一种基于投影字典对学习的人脸识别方法、装置、设备及可读存储介质。
背景技术
在数据挖掘与分析方面,随着数据量的增长,内容复杂性的增加以及高纬度的数据,如何有效地、健壮地表示数据已经越来越重要。一般来说,以下的几个方法可以用来处理上述的表示问题,例如基于字典对学习的稀疏表示和低秩表示等。
因此在现有技术中,通常采用投影字典对学习(projective Dictionary PairLearning,简称DPL)来识别人脸图像。但是,如今的字典对学习方法大多是基于原始图像数据进行的,而多数情况下,原始图像数据中包含着各种各样的噪音和冗余信息,这些噪音和冗余信息不仅会增大数据处理量,还会影响数据的特征表示,降低特征的表达能力,给人脸识别的效率和准确率带来了负面影响。
因此,如何提高人脸识别的效率和准确率,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于投影字典对学习的人脸识别方法、装置、设备及可读存储介质,以提高人脸识别的效率和准确率。其具体方案如下:
第一方面,本发明提供了一种基于投影字典对学习的人脸识别方法,包括:
获取待识别的目标人脸图像;
利用预设稀疏投影矩阵提取目标人脸图像中的目标特征;
将目标特征输入预设识别分类器,输出目标人脸图像的识别结果;
其中,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
优选地,预设稀疏投影矩阵和预设识别分类器的训练过程包括:
获取人脸训练图像;
利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
优选地,按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
优选地,利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
其中,为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
第二方面,本发明提供了一种基于投影字典对学习的人脸识别装置,包括:
获取模块,用于获取待识别的目标人脸图像;
提取模块,用于利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;
识别模块,用于将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;
其中,稀疏投影矩阵和识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
优选地,还包括:训练模块,用于训练稀疏投影矩阵和识别分类器,训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
优选地,优化单元具体用于:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
优选地,优化单元具体用于:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
其中,为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
第三方面,本发明提供了一种基于投影字典对学习的人脸识别设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的基于投影字典对学习的人脸识别方法。
第四方面,本发明提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的基于投影字典对学习的人脸识别方法。
本发明提供了一种基于投影字典对学习的人脸识别方法,包括:获取待识别的目标人脸图像;利用预设稀疏投影矩阵提取目标人脸图像中的目标特征;将目标特征输入预设识别分类器,输出目标人脸图像的识别结果;其中,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
可见,本发明中使用的预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得。其中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,采用核范式约束和L1-范式约束对稀疏投影矩阵进行约束,能够使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
相应地,本发明提供的一种基于投影字典对学习的人脸识别装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明公开的一种基于投影字典对学习的人脸识别方法流程图;
图2为本发明公开的一种预设稀疏投影矩阵和预设识别分类器的训练方法流程图;
图3为本发明公开的一种基于投影字典对学习的人脸识别装置示意图;
图4为本发明公开的一种基于投影字典对学习的人脸识别设备示意图;
图5为本发明公开的一种人脸识别示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,现有技术中采用的投影字典对学习方法大多是基于原始图像数据进行的,而多数情况下,原始图像数据中包含着各种各样的噪音和冗余信息,这些噪音和冗余信息不仅会增大数据处理量,还会影响数据的特征表示,降低特征的表达能力,给人脸识别的效率和准确率带来了负面影响。为此,本发明提供了一种基于投影字典对学习的人脸识别方案,能够提高人脸识别的效率和准确率。
参见图1所示,本发明实施例公开了一种基于投影字典对学习的人脸识别方法,包括:
S101、获取待识别的目标人脸图像;
S102、利用预设稀疏投影矩阵提取目标人脸图像中的目标特征,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束;
S103、将目标特征输入预设识别分类器,输出目标人脸图像的识别结果。
本实施例采用的矩阵分解为概念分解(Collaborative Filtering,简称CF)。CF可以将原始数据矩阵X表示为三个矩阵的乘积,即原始数据矩阵X≈XWVT,其中VT为V的转置矩阵。CF相比于非负矩阵分解(Nonnegative Matrix Factor,简称NMF),其能够更便捷地在内核Hilbert空间中执行完成,而NMF目前还无法在内核Hilbert空间中执行。NMF能够将原始数据矩阵近似成一个基向量组U和原始数据的低维表示V的乘积,即原始数据矩阵X≈UVT,其中VT为V的转置矩阵。
在本实施例中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,采用核范式约束和L1-范式约束对稀疏投影矩阵进行约束,能够使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
参见图2所示,本发明实施例公开了一种预设稀疏投影矩阵和预设识别分类器的训练方法,包括:
S201、获取人脸训练图像;
S202、利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
S203、对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
S204、构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
在本实施例中,目标函数为:
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
在本实施例中,按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
其中,转换后的目标函数为:
其中,E为识别分类器的误差。
在本实施例中,利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:根据转换后的目标函数定义拉格朗日函数;通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
其中,拉格朗日函数为:
其中,为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量。
在本实施例中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,利用拉格朗日函数求解出预设稀疏投影矩阵,能够使稀疏投影矩阵约束于核范式和L1-范式,从而使使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
基于上述实施例,需要说明的是,人脸训练图像为人脸图像的集合,其即为下文中的X。X和Y共同构成数据集合A。也就是说,将人脸图像集合A划分为训练样本集X和测试样本集Y,其中: X和Y中的样本数量满足l+u=N;d为特征数据的维数,N为特征数据的点数。
对X进行CF矩阵分解,使X=VWTXT,其中的V即为低维特征矩阵;对X=VWTXT中的V进行基于L2,1-范式约束的投影字典对学习,从而可得到稀疏投影矩阵,如此可构建如下目标函数:
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,c为类别数,l为H中的样本量,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵,W的每一列是一组基向量;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数;||V||1表示基于L1-范式约束的V。
在目标函数中,低维特征矩阵和字典的重构误差项为:
||VT-DPX||2,1
其中,可以为字典D定义如下优化子函数:
当字典D和稀疏投影矩阵P固定时,利用目标函数来进行优化。
在优化过程中,利用重构误差来计算新的VT,也就是说,VT的计算还与字典D和稀疏编码系数PX相关联。以此为依据,我们引入了辅助变量J、F和S,其中:V=F,PX=J,PX=S,那么目标函数就可以转换为:
对于转换后的目标函数,定义增广拉格朗日函数拉格朗日函数为:
其中,为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;<A,B>=trace(AT,B);J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量。
由于上述涉及到的几个变量相互依赖,因此通过每次固定指定变量,来更新除指定之外的其他变量的方式来更新变量,故可以通过求解增加的拉格朗日函数来更新变量:
Y1 k+1=Y1 k+μ(Vk-Fk),
具体的,各个变量的优化步骤包括:
1)固定D,P,W和V,更新J、S和F:
当固定D,P,W和V时,D,P,W和V即可看作常数,移除拉格朗日函数中与J不相干的项,可以得到如下函数:
那么可将上述公式转化为下述等价问题:
具体的,上述优化基于奇异值分解(Singular Value Decomposition,简称SVD)思想。具体的,使收缩因子Ωε[x]=sgn(x)max(|x|-ε,0),通过奇异值阀值算法计算Jk+1,那么:
构建矩阵并计算的SVD,的SVD为:
类似地,针对S和F,可得到如下函数:
那么可将上述公式转化为下述等价问题:
具体的,通过收缩操作可得到Sk+1,收缩操作用公式表示为:
Sk+1=Ωγ/μ[∑S]
其中,
2)固定指定变量,更新字典D和投影P:
具体的,当更新字典D时,需固定的其他变量为:J、S、F、E、P、W、V、Y1、Y2、Y3、Y4。
通过舍弃拉格朗日函数中独立于D的项,我们得到:
通过对上述公式中的D的导数以及对导数的归零,我们可以推导出第k+1次迭代中Dk+1的值,即:
Dk+1=Qk -1(QkVk TXTPk T)(PkXXTPk T)-1
其中,χi是VT-DPX的第i行向量,Q为对角矩阵,Q的对角元素为:
qii=1/(2||χi||2)
类似地,我们可以得到P的迭代值:
Rk=2α(XVk+1QkDk+1)T
Zk=(Rk-Y2 kXT-Y3 kXT+μkJkXT+μkSkXT+Tk)
Pk+1=(2αDk+1 TQkDk+1+2μk+1I+μCkCk T)Zk(XXT)-1
3)固定指定变量,更新W和V:
具体的,当更新字典W时,需固定的其他变量为:J、S、F、E、P、D、V、Y1、Y2、Y3、Y4。
当固定相应变量时,移除与W和V的无关项,可以得到如下简化的目标函数:
其中,ψi为XT-VWTXT的第i行向量,G是对角矩阵,其对角元素为:
gii=1/(2||ψi||2)
定义拉格朗日乘子τi,j和来约束条件wi,j≥0和vi,j≥0。因此我们可以得到如下等价关系:
使用KTT条件约束τi,jwi,j=0和经过分别对这两个变量求导后,得到如下表达式:
(XTXWVTQV)i,jwi,j-(XTXQV)i,jwi,j=0
(2GVWTXTXW+2αVQ+Y1+μV)i,jvi,j-(2GXTXW+2αXTPTDTQ+μF)i,jvi,j=0
所以,W和V的最优解为:
4)固定其他变量,更新识别分类器C和识别分类器的误差E:其中,E=HT-XTPTC。
当求得其他变量的最优解后,移除与C和E的无关项,目标函数可以简化为如下形式:
通过求导可得C和E的最优解:
lk+1=Pk+1XY4 k/μk+Pk+1XHT-Pk+1XEk
至此,得到的识别分类器即为本发明使用的预设识别分类器,P的最优解即为本发明使用的预设稀疏投影矩阵。
进而利用上述所得预设稀疏投影矩阵和预设识别分类器处理测试样本集,可确定预设稀疏投影矩阵和预设识别分类器的识别效果。
需要说明的是,上述训练过程涉及的参数可初始化为:
k=0,Jk=0,Sk=0,Fk=0,Ek=0,Dk=0,Pk=0,Wk=0,Vk=0,Ck=0,
Y1 k=0,maxu=108,μk=10-6,
η=1.12,ε=10-6
其中,用μk+1=min(ημk,maxμ)来更新μ;
若max(||PX-J||∞,||PX-S||∞,||V-F||∞,||HT-XTPTC-E||∞)<ε,则停止训练;否则,k=k+1,继续迭代更新各个变量。
通过实验发现,η=1.12时,在30到380之间的大多数情况下迭代次数收敛,具有良好的收敛效果。
下面对本发明实施例提供的一种基于投影字典对学习的人脸识别装置进行介绍,下文描述的一种基于投影字典对学习的人脸识别装置与上文描述的一种基于投影字典对学习的人脸识别方法可以相互参照。
参见图3所示,本发明实施例公开了一种基于投影字典对学习的人脸识别装置,包括:
获取模块301,用于获取待识别的目标人脸图像;
提取模块302,用于利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;
识别模块303,用于将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;
其中,稀疏投影矩阵和识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
在一种具体实施方式中,基于投影字典对学习的人脸识别装置还包括:训练模块,用于训练稀疏投影矩阵和识别分类器,训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
在一种具体实施方式中,优化单元具体用于:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
在一种具体实施方式中,优化单元具体用于:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
其中,为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本实施例提供了一种基于投影字典对学习的人脸识别装置,包括:获取模块、提取模块以及识别模块。首先由获取模块获取待识别的目标人脸图像;然后提取模块利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;最后识别模块将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;如此各个模块之间分工合作,各司其职,从而提高了人脸识别的效率和准确率。
下面对本发明实施例提供的一种基于投影字典对学习的人脸识别设备进行介绍,下文描述的一种基于投影字典对学习的人脸识别设备与上文描述的一种基于投影字典对学习的人脸识别方法及装置可以相互参照。
参见图4所示,本发明实施例公开了一种基于投影字典对学习的人脸识别设备,包括:
存储器401,用于保存计算机程序;
处理器402,用于执行所述计算机程序,以实现上述实施例公开的方法的步骤。
下面对本发明实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种基于投影字典对学习的人脸识别方法、装置及设备可以相互参照。
一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的基于投影字典对学习的人脸识别方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
为了证明本发明的效果,本发明在人脸图像的数据集,手写体数据集和目标数据集上进行了测试,测试结果均表示本发明具有良好的识别效果。
其中,人脸数据集是CMU PIE;手写体数据集是USPS;目标数据集有:COIL20。CMUPIE数据集包含了68个人的11554张图像。USPS手写体数据集包括从0到9的9298张图像。目标数据集COIL20包括20种目标的不同角度拍摄的1440张图像。这些数据库从多方面收集,因而测试结果具有普遍说明性。测试即为本发明的应用过程,测试过程的识别示意请参见图5。
需要说明的是,人脸识别可以应用于各个领域,为社会生产和生活带来便利。例如:银行内以人脸识别作为密码的自助机器;智能终端的人脸识别解锁方案、目前广泛应用的人脸识别进火车站方案。若本发明应用于某一特定领域,则采用该领域内的人脸图像作为训练图像,以获得对应的稀疏投影矩阵和识别分类器。例如:若本方案应用于人脸识别进火车站方案,那么训练图像即为身份证上的人脸图像。
同时,利用本发明公开的方法和其他方法对同一数据集进行识别,各个识别方法对应的识别结果如下:
请参见表1,表1为本发明和其他方法对CMU PIE脸部数据库的识别对比结果:
表1
请参见表2,表2为本发明和其他方法对USPS手写体数据库的识别对比结果:
表2
请参见表3,表3为本发明和其他方法对COIL20目标数据库的识别对比结果:
表3
请参阅表1-表3,本发明主要与下述方法进行对比:
K奇异值分解(KSVD),归纳式鲁棒主成分分析(IRPCA),潜在低秩表示(LatLRR),正则化低秩表示(rLRR),低秩稀疏主特征编码(LSPFC),鉴别性KSVD(D-KSVD),标签约束的KSVD(LC-KSVD),结构化不一致的字典学习(DLSI),分析鉴别性的字典学习(ADDL)以及DPL方法识别结果对比。
表1-表3给出了每个算法分别在人脸数据集CMU PIE,手写体数据集USPS,目标数据集COIL20上的使用不同数量的训练样本的平均精度(Mean),标准偏差(Std)和最高精度(Best),其中平均值,标准偏差和最高精度通过平均识别率并从每种方法的曲线搜索最佳记录来计算,标准偏差从其平均值的扩展中测量一组数据中的数字。
通过实验结果可以看出:本发明的识别结果明显优于KSVD,IRPCA,LatLRR,rLRR,LSPFC,D-KSVD,LC-KSVD,DLSI,ADDL以及DPL,且表现出了较强的稳定性和识别准确率,具有一定的优势。且本发明公开的方法可用于识别各种类型的图像数据集。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于投影字典对学习的人脸识别方法,其特征在于,包括:
获取待识别的目标人脸图像;
利用预设稀疏投影矩阵提取所述目标人脸图像中的目标特征;
将所述目标特征输入预设识别分类器,输出所述目标人脸图像的识别结果;
其中,所述预设稀疏投影矩阵和所述预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,所述稀疏投影矩阵采用了核范式约束和L1-范式约束。
2.根据权利要求1所述的方法,其特征在于,所述预设稀疏投影矩阵和所述预设识别分类器的训练过程包括:
获取人脸训练图像;
利用所述基于L2,1-范式约束的矩阵分解对所述人脸训练图像进行低维表示,得到低维特征矩阵;
对所述低维特征矩阵进行所述基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
构建目标函数,并按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器;
其中,所述目标函数为:
s.t.W,V≥0,
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
3.根据权利要求2所述的方法,其特征在于,所述按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器,包括:
对所述目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
s.t.V=F,PX=J,PX=S,HT=XTPTC+E,W,V≥0,
其中,E为识别分类器的误差;
当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器。
4.根据权利要求3所述的方法,其特征在于,所述利用拉格朗日函数求解转换后的目标函数;当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器,包括:
根据所述转换后的目标函数定义所述拉格朗日函数,所述拉格朗日函数为:
s.t.W,V≥0,
其中,为所述拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为所述拉格朗日函数中的变量;
通过固定指定变量,更新除所述指定变量之外的其他变量的方式来优化所述拉格朗日函数中的变量,直至输出所述预设稀疏投影矩阵和所述预设识别分类器。
5.一种基于投影字典对学习的人脸识别装置,其特征在于,包括:
获取模块,用于获取待识别的目标人脸图像;
提取模块,用于利用预设的稀疏投影矩阵提取所述目标人脸图像中的目标特征;
识别模块,用于将所述目标特征输入预设的识别分类器,输出所述目标人脸图像的识别结果;
其中,所述稀疏投影矩阵和所述识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,所述稀疏投影矩阵采用了核范式约束和L1-范式约束。
6.根据权利要求5所述的装置,其特征在于,还包括:训练模块,用于训练所述稀疏投影矩阵和所述识别分类器,所述训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用所述基于L2,1-范式约束的矩阵分解对所述人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对所述低维特征矩阵进行所述基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器;
其中,所述目标函数为:
s.t.W,V≥0,
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
7.根据权利要求6所述的装置,其特征在于,所述优化单元具体用于:
对所述目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
s.t.V=F,PX=J,PX=S,HT=XTPTC+E,W,V≥0,
其中,E为识别分类器的误差;
当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器。
8.根据权利要求7所述的装置,其特征在于,所述优化单元具体用于:
根据所述转换后的目标函数定义所述拉格朗日函数,所述拉格朗日函数为:
s.t.W.V≥0.
其中,为所述拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为所述拉格朗日函数中的变量;
通过固定指定变量,更新除所述指定变量之外的其他变量的方式来优化所述拉格朗日函数中的变量,直至输出所述预设稀疏投影矩阵和所述预设识别分类器。
9.一种基于投影字典对学习的人脸识别设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至4任一项所述的方法。
10.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910459926.XA CN110147782B (zh) | 2019-05-29 | 2019-05-29 | 一种基于投影字典对学习的人脸识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910459926.XA CN110147782B (zh) | 2019-05-29 | 2019-05-29 | 一种基于投影字典对学习的人脸识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110147782A true CN110147782A (zh) | 2019-08-20 |
CN110147782B CN110147782B (zh) | 2023-06-13 |
Family
ID=67593468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910459926.XA Active CN110147782B (zh) | 2019-05-29 | 2019-05-29 | 一种基于投影字典对学习的人脸识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110147782B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717519A (zh) * | 2019-09-09 | 2020-01-21 | 深圳大学 | 训练、特征提取、分类方法、设备及存储介质 |
CN111667387A (zh) * | 2020-05-29 | 2020-09-15 | 西北工业大学 | 一种基于元知识字典学习的认知诊断方法 |
CN111783033A (zh) * | 2020-07-07 | 2020-10-16 | 香港中文大学(深圳) | 一种数据稀疏投影算法、系统、电子装置及存储介质 |
CN112990242A (zh) * | 2019-12-16 | 2021-06-18 | 京东数字科技控股有限公司 | 图像分类模型的训练方法和训练装置 |
CN113902949A (zh) * | 2021-10-12 | 2022-01-07 | 苏州大学 | 图像识别方法、装置、电子设备及可读存储介质 |
CN113902924A (zh) * | 2021-10-12 | 2022-01-07 | 苏州大学 | 图像识别方法、装置、电子设备及可读存储介质 |
CN114240775A (zh) * | 2021-12-06 | 2022-03-25 | 中国科学院沈阳自动化研究所 | 基于稀疏低秩先验的降质图像恢复与识别方法 |
CN114943862A (zh) * | 2022-06-07 | 2022-08-26 | 南京工业大学 | 一种基于结构性解析字典学习的两阶段图像分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678260A (zh) * | 2016-01-07 | 2016-06-15 | 浙江工贸职业技术学院 | 一种基于稀疏保持距离度量的人脸识别方法 |
CN106778863A (zh) * | 2016-12-12 | 2017-05-31 | 武汉科技大学 | 基于Fisher判别字典学习的仓库货品识别方法 |
US20180225807A1 (en) * | 2016-12-28 | 2018-08-09 | Shenzhen China Star Optoelectronics Technology Co., Ltd. | Single-frame super-resolution reconstruction method and device based on sparse domain reconstruction |
CN108509833A (zh) * | 2017-12-21 | 2018-09-07 | 苏州大学 | 一种基于结构化分析字典的人脸识别方法、装置及设备 |
-
2019
- 2019-05-29 CN CN201910459926.XA patent/CN110147782B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678260A (zh) * | 2016-01-07 | 2016-06-15 | 浙江工贸职业技术学院 | 一种基于稀疏保持距离度量的人脸识别方法 |
CN106778863A (zh) * | 2016-12-12 | 2017-05-31 | 武汉科技大学 | 基于Fisher判别字典学习的仓库货品识别方法 |
US20180225807A1 (en) * | 2016-12-28 | 2018-08-09 | Shenzhen China Star Optoelectronics Technology Co., Ltd. | Single-frame super-resolution reconstruction method and device based on sparse domain reconstruction |
CN108509833A (zh) * | 2017-12-21 | 2018-09-07 | 苏州大学 | 一种基于结构化分析字典的人脸识别方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
李为华等: "基于字典投影学习的人脸识别算法", 《信阳师范学院学报(自然科学版)》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717519A (zh) * | 2019-09-09 | 2020-01-21 | 深圳大学 | 训练、特征提取、分类方法、设备及存储介质 |
CN110717519B (zh) * | 2019-09-09 | 2023-05-09 | 深圳大学 | 训练、特征提取、分类方法、设备及存储介质 |
CN112990242A (zh) * | 2019-12-16 | 2021-06-18 | 京东数字科技控股有限公司 | 图像分类模型的训练方法和训练装置 |
CN111667387A (zh) * | 2020-05-29 | 2020-09-15 | 西北工业大学 | 一种基于元知识字典学习的认知诊断方法 |
CN111667387B (zh) * | 2020-05-29 | 2023-06-02 | 西北工业大学 | 一种基于元知识字典学习的认知诊断方法 |
CN111783033A (zh) * | 2020-07-07 | 2020-10-16 | 香港中文大学(深圳) | 一种数据稀疏投影算法、系统、电子装置及存储介质 |
CN111783033B (zh) * | 2020-07-07 | 2024-08-23 | 香港中文大学(深圳) | 一种应用于数据稀疏投影算法的电子装置及存储介质 |
CN113902949A (zh) * | 2021-10-12 | 2022-01-07 | 苏州大学 | 图像识别方法、装置、电子设备及可读存储介质 |
CN113902924A (zh) * | 2021-10-12 | 2022-01-07 | 苏州大学 | 图像识别方法、装置、电子设备及可读存储介质 |
CN114240775A (zh) * | 2021-12-06 | 2022-03-25 | 中国科学院沈阳自动化研究所 | 基于稀疏低秩先验的降质图像恢复与识别方法 |
CN114943862A (zh) * | 2022-06-07 | 2022-08-26 | 南京工业大学 | 一种基于结构性解析字典学习的两阶段图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110147782B (zh) | 2023-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147782B (zh) | 一种基于投影字典对学习的人脸识别方法及装置 | |
Xie et al. | Implicit block diagonal low-rank representation | |
Ma et al. | Sparse representation for face recognition based on discriminative low-rank dictionary learning | |
CN105469063B (zh) | 鲁棒的人脸图像主成分特征提取方法及识别装置 | |
Xu et al. | Reconstruction and recognition of tensor-based objects with concurrent subspaces analysis | |
CN108509833B (zh) | 一种基于结构化分析字典的人脸识别方法、装置及设备 | |
CN106845358B (zh) | 一种手写体字符图像特征识别的方法及系统 | |
CN108664911B (zh) | 一种基于图像稀疏表示的鲁棒人脸识别方法 | |
CN105528620B (zh) | 一种联合鲁棒主成分特征学习与视觉分类方法及系统 | |
WO2020010602A1 (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
JP2013509664A (ja) | 光学式文字認識(ocr)の精度を向上させるためのシステムおよび方法 | |
CN106169073A (zh) | 一种表情识别方法及系统 | |
CN102880875A (zh) | 基于lrr图的半监督学习人脸识别方法 | |
Wang et al. | Robust auto-weighted projective low-rank and sparse recovery for visual representation | |
CN109063555B (zh) | 基于低秩分解和稀疏表示残差对比的多姿态人脸识别方法 | |
CN109002794A (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
CN111325275A (zh) | 基于低秩二维局部鉴别图嵌入的鲁棒图像分类方法及装置 | |
CN107256378A (zh) | 语种识别方法及装置 | |
CN109558882A (zh) | 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置 | |
CN106803105B (zh) | 一种基于稀疏表示字典学习的图像分类方法 | |
CN106056131A (zh) | 基于lrr‑lda的图像特征提取方法 | |
Zhao et al. | Two‐Phase Incremental Kernel PCA for Learning Massive or Online Datasets | |
Su et al. | Discriminative transformation for multi-dimensional temporal sequences | |
CN108009586B (zh) | 封顶概念分解方法及图像聚类方法 | |
CN109190645B (zh) | 一种高阶高维图像数据的表示与分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |