CN110147782B - 一种基于投影字典对学习的人脸识别方法及装置 - Google Patents

一种基于投影字典对学习的人脸识别方法及装置 Download PDF

Info

Publication number
CN110147782B
CN110147782B CN201910459926.XA CN201910459926A CN110147782B CN 110147782 B CN110147782 B CN 110147782B CN 201910459926 A CN201910459926 A CN 201910459926A CN 110147782 B CN110147782 B CN 110147782B
Authority
CN
China
Prior art keywords
matrix
preset
objective function
face
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910459926.XA
Other languages
English (en)
Other versions
CN110147782A (zh
Inventor
张召
任加欢
张莉
王邦军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201910459926.XA priority Critical patent/CN110147782B/zh
Publication of CN110147782A publication Critical patent/CN110147782A/zh
Application granted granted Critical
Publication of CN110147782B publication Critical patent/CN110147782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于投影字典对学习的人脸识别方法,包括:获取目标人脸图像;利用稀疏投影矩阵提取目标人脸图像中的目标特征;将目标特征输入识别分类器,输出目标人脸图像的识别结果;其中,稀疏投影矩阵和识别分类器利用基于L2,1‑范式约束的矩阵分解和基于L2,1‑范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1‑范式约束。其中,基于L2,1‑范式约束的矩阵分解和基于L2,1‑范式约束的投影字典对学习训练稀疏投影矩阵和识别分类器,能够使稀疏投影矩阵提取到显著的图像特征,并降低数据维度,从而提高人脸识别的效率和准确率。本发明公开的一种基于投影字典对学习的人脸识别装置、设备及可读存储介质,也同样具有上述技术效果。

Description

一种基于投影字典对学习的人脸识别方法及装置
技术领域
本发明涉及计算机视觉和图像处理技术领域,特别涉及一种基于投影字典对学习的人脸识别方法、装置、设备及可读存储介质。
背景技术
在数据挖掘与分析方面,随着数据量的增长,内容复杂性的增加以及高纬度的数据,如何有效地、健壮地表示数据已经越来越重要。一般来说,以下的几个方法可以用来处理上述的表示问题,例如基于字典对学习的稀疏表示和低秩表示等。
因此在现有技术中,通常采用投影字典对学习(projective Dictionary PairLearning,简称DPL)来识别人脸图像。但是,如今的字典对学习方法大多是基于原始图像数据进行的,而多数情况下,原始图像数据中包含着各种各样的噪音和冗余信息,这些噪音和冗余信息不仅会增大数据处理量,还会影响数据的特征表示,降低特征的表达能力,给人脸识别的效率和准确率带来了负面影响。
因此,如何提高人脸识别的效率和准确率,是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种基于投影字典对学习的人脸识别方法、装置、设备及可读存储介质,以提高人脸识别的效率和准确率。其具体方案如下:
第一方面,本发明提供了一种基于投影字典对学习的人脸识别方法,包括:
获取待识别的目标人脸图像;
利用预设稀疏投影矩阵提取目标人脸图像中的目标特征;
将目标特征输入预设识别分类器,输出目标人脸图像的识别结果;
其中,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
优选地,预设稀疏投影矩阵和预设识别分类器的训练过程包括:
获取人脸训练图像;
利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
Figure GDA0004073996420000021
Figure GDA0004073996420000022
/>
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure GDA0004073996420000023
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
优选地,按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
Figure GDA0004073996420000024
Figure GDA0004073996420000025
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
优选地,利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
Figure GDA0004073996420000031
Figure GDA0004073996420000032
其中,
Figure GDA0004073996420000033
为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
第二方面,本发明提供了一种基于投影字典对学习的人脸识别装置,包括:
获取模块,用于获取待识别的目标人脸图像;
提取模块,用于利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;
识别模块,用于将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;
其中,稀疏投影矩阵和识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
优选地,还包括:训练模块,用于训练稀疏投影矩阵和识别分类器,训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
Figure GDA0004073996420000041
Figure GDA0004073996420000042
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure GDA0004073996420000043
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
优选地,优化单元具体用于:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
Figure GDA0004073996420000044
Figure GDA0004073996420000045
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
优选地,优化单元具体用于:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
Figure GDA0004073996420000046
Figure GDA0004073996420000047
其中,
Figure GDA0004073996420000048
为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
第三方面,本发明提供了一种基于投影字典对学习的人脸识别设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现前述公开的基于投影字典对学习的人脸识别方法。
第四方面,本发明提供了一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的基于投影字典对学习的人脸识别方法。
本发明提供了一种基于投影字典对学习的人脸识别方法,包括:获取待识别的目标人脸图像;利用预设稀疏投影矩阵提取目标人脸图像中的目标特征;将目标特征输入预设识别分类器,输出目标人脸图像的识别结果;其中,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
可见,本发明中使用的预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得。其中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,采用核范式约束和L1-范式约束对稀疏投影矩阵进行约束,能够使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
相应地,本发明提供的一种基于投影字典对学习的人脸识别装置、设备及可读存储介质,也同样具有上述技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明公开的一种基于投影字典对学习的人脸识别方法流程图;
图2为本发明公开的一种预设稀疏投影矩阵和预设识别分类器的训练方法流程图;
图3为本发明公开的一种基于投影字典对学习的人脸识别装置示意图;
图4为本发明公开的一种基于投影字典对学习的人脸识别设备示意图;
图5为本发明公开的一种人脸识别示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,现有技术中采用的投影字典对学习方法大多是基于原始图像数据进行的,而多数情况下,原始图像数据中包含着各种各样的噪音和冗余信息,这些噪音和冗余信息不仅会增大数据处理量,还会影响数据的特征表示,降低特征的表达能力,给人脸识别的效率和准确率带来了负面影响。为此,本发明提供了一种基于投影字典对学习的人脸识别方案,能够提高人脸识别的效率和准确率。
参见图1所示,本发明实施例公开了一种基于投影字典对学习的人脸识别方法,包括:
S101、获取待识别的目标人脸图像;
S102、利用预设稀疏投影矩阵提取目标人脸图像中的目标特征,预设稀疏投影矩阵和预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束;
S103、将目标特征输入预设识别分类器,输出目标人脸图像的识别结果。
本实施例采用的矩阵分解为概念分解(Collaborative Filtering,简称CF)。CF可以将原始数据矩阵X表示为三个矩阵的乘积,即原始数据矩阵X≈XWVT,其中VT为V的转置矩阵。CF相比于非负矩阵分解(Nonnegative Matrix Factor,简称NMF),其能够更便捷地在内核Hilbert空间中执行完成,而NMF目前还无法在内核Hilbert空间中执行。NMF能够将原始数据矩阵近似成一个基向量组U和原始数据的低维表示V的乘积,即原始数据矩阵X≈UVT,其中VT为V的转置矩阵。
在本实施例中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,采用核范式约束和L1-范式约束对稀疏投影矩阵进行约束,能够使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
参见图2所示,本发明实施例公开了一种预设稀疏投影矩阵和预设识别分类器的训练方法,包括:
S201、获取人脸训练图像;
S202、利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
S203、对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
S204、构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
在本实施例中,目标函数为:
Figure GDA0004073996420000071
Figure GDA0004073996420000072
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure GDA0004073996420000073
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
在本实施例中,按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
其中,转换后的目标函数为:
Figure GDA0004073996420000081
Figure GDA0004073996420000082
其中,E为识别分类器的误差。
在本实施例中,利用拉格朗日函数求解转换后的目标函数;当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器,包括:根据转换后的目标函数定义拉格朗日函数;通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
其中,拉格朗日函数为:
Figure GDA0004073996420000083
Figure GDA0004073996420000084
其中,
Figure GDA0004073996420000085
为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量。
在本实施例中,L2,1-范式约束能够去除原始图像特征中的噪音和冗余信息,矩阵分解能够降低图像特征维度,因此基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习能够去除冗余信息,使提取到的图像特征具有显著的特征表达能力,也降低了数据处理量;同时,利用拉格朗日函数求解出预设稀疏投影矩阵,能够使稀疏投影矩阵约束于核范式和L1-范式,从而使使稀疏投影矩阵保持低秩且稀疏的属性。因此本发明能够提高人脸识别的效率和准确率。
基于上述实施例,需要说明的是,人脸训练图像为人脸图像的集合,其即为下文中的X。X和Y共同构成数据集合A。也就是说,将人脸图像集合A划分为训练样本集X和测试样本集Y,其中:
Figure GDA0004073996420000091
Figure GDA0004073996420000092
X和Y中的样本数量满足l+u=N;d为特征数据的维数,N为特征数据的点数。
对X进行CF矩阵分解,使X=VWTXT,其中的V即为低维特征矩阵;对X=VWTXT中的V进行基于L2,1-范式约束的投影字典对学习,从而可得到稀疏投影矩阵,如此可构建如下目标函数:
Figure GDA0004073996420000093
Figure GDA0004073996420000094
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,
Figure GDA0004073996420000095
c为类别数,l为H中的样本量,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵,W的每一列是一组基向量;D为字典,/>
Figure GDA0004073996420000096
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数;||V||1表示基于L1-范式约束的V。
在目标函数中,低维特征矩阵和字典的重构误差项为:
||VT-DPX||2,1
其中,可以为字典D定义如下优化子函数:
Figure GDA0004073996420000097
当字典D和稀疏投影矩阵P固定时,利用目标函数来进行优化。
在优化过程中,利用重构误差来计算新的VT,也就是说,VT的计算还与字典D和稀疏编码系数PX相关联。以此为依据,我们引入了辅助变量J、F和S,其中:V=F,PX=J,PX=S,那么目标函数就可以转换为:
Figure GDA0004073996420000098
Figure GDA0004073996420000099
对于转换后的目标函数,定义增广拉格朗日函数
Figure GDA00040739964200000910
拉格朗日函数/>
Figure GDA00040739964200000911
为:
Figure GDA0004073996420000101
Figure GDA0004073996420000102
其中,
Figure GDA0004073996420000103
为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;<A,B>=trace(AT,B);J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量。
由于上述涉及到的几个变量相互依赖,因此通过每次固定指定变量,来更新除指定之外的其他变量的方式来更新变量,故可以通过求解增加的拉格朗日函数
Figure GDA0004073996420000104
来更新变量:
Figure GDA0004073996420000105
Y1 k+1=Y1 k+μ(Vk-Fk),
Figure GDA0004073996420000106
Figure GDA0004073996420000107
Figure GDA0004073996420000108
具体的,各个变量的优化步骤包括:
1)固定D,P,W和V,更新J、S和F:
当固定D,P,W和V时,D,P,W和V即可看作常数,移除拉格朗日函数
Figure GDA0004073996420000109
中与J不相干的项,可以得到如下函数:/>
Figure GDA00040739964200001010
那么可将上述公式转化为下述等价问题:
Figure GDA00040739964200001011
具体的,上述优化基于奇异值分解(Singular Value Decomposition,简称SVD)思想。具体的,使收缩因子Ωε[x]=sgn(x)max(x|-ε,0),通过奇异值阈值算法计算Jk+1,那么:
Figure GDA00040739964200001012
构建矩阵PkX+Y2 kk,并计算
Figure GDA00040739964200001013
的SVD,/>
Figure GDA00040739964200001014
的SVD为:
Figure GDA0004073996420000111
类似地,针对S和F,可得到如下函数:
Figure GDA0004073996420000112
Figure GDA0004073996420000113
那么可将上述公式转化为下述等价问题:
Figure GDA0004073996420000114
Figure GDA0004073996420000115
具体的,通过收缩操作可得到Sk+1,收缩操作用公式表示为:
Sk+1=Ωγ/μ[∑S]
其中,
Figure GDA0004073996420000116
2)固定指定变量,更新字典D和投影P:
具体的,当更新字典D时,需固定的其他变量为:J、S、F、E、P、W、V、Y1、Y2、Y3、Y4
通过舍弃拉格朗日函数中独立于D的项,我们得到:
Figure GDA0004073996420000117
通过对上述公式中的D的导数以及对导数的归零,我们可以推导出第k+1次迭代中Dk+1的值,即:
Dk+1=Qk -1(QkVk TXTPk T)(PkXXTPk T)-1
其中,χi是VT-DPX的第i行向量,Q为对角矩阵,Q的对角元素为:
qii=1/(2||χi||2)
类似地,我们可以得到P的迭代值:
Rk=2α(XVk+1QkDk+1)T
Figure GDA0004073996420000118
Zk=(Rk-Y2 kXT-Y3 kXTkJkXTkSkXT+Tk)
Pk+1=(2αDk+1 TQkDk+1+2μk+1I+μCkCk T)-1Zk(XXT)-1
3)固定指定变量,更新W和V:
具体的,当更新字典W时,需固定的其他变量为:J、S、F、E、P、D、V、Y1、Y2、Y3、Y4
当固定相应变量时,移除与W和V的无关项,可以得到如下简化的目标函数:
Figure GDA0004073996420000121
其中,ψi为XT-VWTXT的第i行向量,G是对角矩阵,其对角元素为:
gii=1/(2|ψi||2)
定义拉格朗日乘子τi,j
Figure GDA0004073996420000127
来约束条件wi,j≥0和vi,j≥0。因此我们可以得到如下等价关系:
Figure GDA0004073996420000122
使用KTT条件约束τi,jwi,j=0和
Figure GDA0004073996420000123
经过分别对这两个变量求导后,得到如下表达式:
(XTXWVTQV)i,jwi,j-(XTXQV)i,jwi,j=0
(2GVWTXTXW+2αVQ+Y1+μV)i,jvi,j-(2GXTXW+2αXTPTDTQ+μF)i,jvi,j=0
所以,W和V的最优解为:
Figure GDA0004073996420000124
Figure GDA0004073996420000125
4)固定其他变量,更新识别分类器C和识别分类器的误差E:其中,E=HT-XTPTC。
当求得其他变量的最优解后,移除与C和E的无关项,目标函数可以简化为如下形式:
Figure GDA0004073996420000126
通过求导可得C和E的最优解:
lk+1=Pk+1XY4 kk+Pk+1XHT-Pk+1XEk
Figure GDA0004073996420000131
/>
Figure GDA0004073996420000132
至此,得到的识别分类器即为本发明使用的预设识别分类器,P的最优解即为本发明使用的预设稀疏投影矩阵。
进而利用上述所得预设稀疏投影矩阵和预设识别分类器处理测试样本集,可确定预设稀疏投影矩阵和预设识别分类器的识别效果。
需要说明的是,上述训练过程涉及的参数可初始化为:
k=0,Jk=0,Sk=0,Fk=0,Ek=0,Dk=0,Pk=0,Wk=0,Vk=0,Ck=0,
Y1 k=0,Y2 k=0,Y3 k=0,
Figure GDA0004073996420000133
maxu=108k=10-6,
η=1.12,ε=10-6
其中,用μk+1=min(ημk,maxμ)来更新μ;
若max(||PX-J||,||PX-S||,||V-F||,||HT-XTPTC-E||)<ε,则停止训练;否则,k=k+1,继续迭代更新各个变量。
通过实验发现,η=1.12时,在30到380之间的大多数情况下迭代次数收敛,具有良好的收敛效果。
下面对本发明实施例提供的一种基于投影字典对学习的人脸识别装置进行介绍,下文描述的一种基于投影字典对学习的人脸识别装置与上文描述的一种基于投影字典对学习的人脸识别方法可以相互参照。
参见图3所示,本发明实施例公开了一种基于投影字典对学习的人脸识别装置,包括:
获取模块301,用于获取待识别的目标人脸图像;
提取模块302,用于利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;
识别模块303,用于将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;
其中,稀疏投影矩阵和识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,稀疏投影矩阵采用了核范式约束和L1-范式约束。
在一种具体实施方式中,基于投影字典对学习的人脸识别装置还包括:训练模块,用于训练稀疏投影矩阵和识别分类器,训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用基于L2,1-范式约束的矩阵分解对人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对低维特征矩阵进行基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照目标函数优化稀疏投影矩阵和识别分类器;当目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器;
其中,目标函数为:
Figure GDA0004073996420000141
Figure GDA0004073996420000142
/>
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure GDA0004073996420000143
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
在一种具体实施方式中,优化单元具体用于:
对目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
Figure GDA0004073996420000144
Figure GDA0004073996420000145
其中,E为识别分类器的误差;
当转换后的目标函数收敛时,输出预设稀疏投影矩阵和预设识别分类器。
在一种具体实施方式中,优化单元具体用于:
根据转换后的目标函数定义拉格朗日函数,拉格朗日函数为:
Figure GDA0004073996420000151
Figure GDA0004073996420000152
其中,
Figure GDA0004073996420000153
为拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为拉格朗日函数中的变量;
通过固定指定变量,更新除指定变量之外的其他变量的方式来优化拉格朗日函数中的变量,直至输出预设稀疏投影矩阵和预设识别分类器。
其中,关于本实施例中各个模块、单元更加具体的工作过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
可见,本实施例提供了一种基于投影字典对学习的人脸识别装置,包括:获取模块、提取模块以及识别模块。首先由获取模块获取待识别的目标人脸图像;然后提取模块利用预设的稀疏投影矩阵提取目标人脸图像中的目标特征;最后识别模块将目标特征输入预设的识别分类器,输出目标人脸图像的识别结果;如此各个模块之间分工合作,各司其职,从而提高了人脸识别的效率和准确率。
下面对本发明实施例提供的一种基于投影字典对学习的人脸识别设备进行介绍,下文描述的一种基于投影字典对学习的人脸识别设备与上文描述的一种基于投影字典对学习的人脸识别方法及装置可以相互参照。
参见图4所示,本发明实施例公开了一种基于投影字典对学习的人脸识别设备,包括:
存储器401,用于保存计算机程序;
处理器402,用于执行所述计算机程序,以实现上述实施例公开的方法的步骤。
下面对本发明实施例提供的一种可读存储介质进行介绍,下文描述的一种可读存储介质与上文描述的一种基于投影字典对学习的人脸识别方法、装置及设备可以相互参照。
一种可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的基于投影字典对学习的人脸识别方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
为了证明本发明的效果,本发明在人脸图像的数据集,手写体数据集和目标数据集上进行了测试,测试结果均表示本发明具有良好的识别效果。
其中,人脸数据集是CMU PIE;手写体数据集是USPS;目标数据集有:COIL20。CMUPIE数据集包含了68个人的11554张图像。USPS手写体数据集包括从0到9的9298张图像。目标数据集COIL20包括20种目标的不同角度拍摄的1440张图像。这些数据库从多方面收集,因而测试结果具有普遍说明性。测试即为本发明的应用过程,测试过程的识别示意请参见图5。
需要说明的是,人脸识别可以应用于各个领域,为社会生产和生活带来便利。例如:银行内以人脸识别作为密码的自助机器;智能终端的人脸识别解锁方案、目前广泛应用的人脸识别进火车站方案。若本发明应用于某一特定领域,则采用该领域内的人脸图像作为训练图像,以获得对应的稀疏投影矩阵和识别分类器。例如:若本方案应用于人脸识别进火车站方案,那么训练图像即为身份证上的人脸图像。
同时,利用本发明公开的方法和其他方法对同一数据集进行识别,各个识别方法对应的识别结果如下:
请参见表1,表1为本发明和其他方法对CMU PIE脸部数据库的识别对比结果:
表1
Figure GDA0004073996420000161
Figure GDA0004073996420000171
请参见表2,表2为本发明和其他方法对USPS手写体数据库的识别对比结果:
表2
Figure GDA0004073996420000172
请参见表3,表3为本发明和其他方法对COIL20目标数据库的识别对比结果:
表3
Figure GDA0004073996420000173
请参阅表1-表3,本发明主要与下述方法进行对比:
K奇异值分解(KSVD),归纳式鲁棒主成分分析(IRPCA),潜在低秩表示(LatLRR),正则化低秩表示(rLRR),低秩稀疏主特征编码(LSPFC),鉴别性KSVD(D-KSVD),标签约束的KSVD(LC-KSVD),结构化不一致的字典学习(DLSI),分析鉴别性的字典学习(ADDL)以及DPL方法识别结果对比。
表1-表3给出了每个算法分别在人脸数据集CMU PIE,手写体数据集USPS,目标数据集COIL20上的使用不同数量的训练样本的平均精度(Mean),标准偏差(Std)和最高精度(Best),其中平均值,标准偏差和最高精度通过平均识别率并从每种方法的曲线搜索最佳记录来计算,标准偏差从其平均值的扩展中测量一组数据中的数字。
通过实验结果可以看出:本发明的识别结果明显优于KSVD,IRPCA,LatLRR,rLRR,LSPFC,D-KSVD,LC-KSVD,DLSI,ADDL以及DPL,且表现出了较强的稳定性和识别准确率,具有一定的优势。且本发明公开的方法可用于识别各种类型的图像数据集。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的可读存储介质中。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (8)

1.一种基于投影字典对学习的人脸识别方法,其特征在于,包括:
获取待识别的目标人脸图像;
利用预设稀疏投影矩阵提取所述目标人脸图像中的目标特征;
将所述目标特征输入预设识别分类器,输出所述目标人脸图像的识别结果;
所述预设稀疏投影矩阵和所述预设识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,所述稀疏投影矩阵采用了核范式约束和L1-范式约束;
所述预设稀疏投影矩阵和所述预设识别分类器的训练过程包括:
获取人脸训练图像;
利用所述基于L2,1-范式约束的矩阵分解对所述人脸训练图像进行低维表示,得到低维特征矩阵;
对所述低维特征矩阵进行所述基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
构建目标函数,并按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器;
所述目标函数为:
Figure FDA0004073996410000011
Figure FDA0004073996410000012
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure FDA0004073996410000013
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
2.根据权利要求1所述的方法,其特征在于,所述按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器,包括:
对所述目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
Figure FDA0004073996410000021
Figure FDA0004073996410000022
其中,E为识别分类器的误差;
当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器。
3.根据权利要求2所述的方法,其特征在于,所述利用拉格朗日函数求解转换后的目标函数;当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器,包括:
根据所述转换后的目标函数定义所述拉格朗日函数,所述拉格朗日函数为:
Figure FDA0004073996410000023
Figure FDA0004073996410000024
其中,
Figure FDA0004073996410000025
为所述拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为所述拉格朗日函数中的变量;
通过固定指定变量,更新除所述指定变量之外的其他变量的方式来优化所述拉格朗日函数中的变量,直至输出所述预设稀疏投影矩阵和所述预设识别分类器。
4.一种基于投影字典对学习的人脸识别装置,其特征在于,包括:
获取模块,用于获取待识别的目标人脸图像;
提取模块,用于利用预设的稀疏投影矩阵提取所述目标人脸图像中的目标特征;
识别模块,用于将所述目标特征输入预设的识别分类器,输出所述目标人脸图像的识别结果;
所述稀疏投影矩阵和所述识别分类器利用基于L2,1-范式约束的矩阵分解和基于L2,1-范式约束的投影字典对学习训练而得,所述稀疏投影矩阵采用了核范式约束和L1-范式约束;
还包括:训练模块,用于训练所述稀疏投影矩阵和所述识别分类器,所述训练模块包括:
获取单元,用于获取人脸训练图像;
低维表示单元,用于利用所述基于L2,1-范式约束的矩阵分解对所述人脸训练图像进行低维表示,得到低维特征矩阵;
字典对学习单元,用于对所述低维特征矩阵进行所述基于L2,1-范式约束的投影字典对学习,得到稀疏投影矩阵;
优化单元,用于构建目标函数,并按照所述目标函数优化所述稀疏投影矩阵和识别分类器;当所述目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器;
所述目标函数为:
Figure FDA0004073996410000031
Figure FDA0004073996410000032
其中,α,β,γ为所述目标函数的惩罚参数;X为所述人脸训练图像的原始特征矩阵,XT为X的转置矩阵;V为所述人脸训练图像的低维特征矩阵,VT为V的转置矩阵;H为所述人脸训练图像的标签信息矩阵,HT为H的转置矩阵;P为稀疏投影矩阵,PT为P的转置矩阵;W为对X进行矩阵分解得到的分解矩阵;D为字典,
Figure FDA0004073996410000033
为字典的约束条件;C为识别分类器;PX为所述人脸训练图像的稀疏编码系数。
5.根据权利要求4所述的装置,其特征在于,所述优化单元具体用于:
对所述目标函数进行转换,并利用拉格朗日函数求解转换后的目标函数,转换后的目标函数为:
Figure FDA0004073996410000034
Figure FDA0004073996410000035
其中,E为识别分类器的误差;
当所述转换后的目标函数收敛时,输出所述预设稀疏投影矩阵和所述预设识别分类器。
6.根据权利要求5所述的装置,其特征在于,所述优化单元具体用于:
根据所述转换后的目标函数定义所述拉格朗日函数,所述拉格朗日函数为:
Figure FDA0004073996410000041
Figure FDA0004073996410000042
其中,
Figure FDA0004073996410000043
为所述拉格朗日函数,Y1,Y2,Y3和Y4为拉格朗日乘数,μ为权重因子;J、S、F、E、D、P、V、Y1、Y2、Y3、Y4、C、W均为所述拉格朗日函数中的变量;
通过固定指定变量,更新除所述指定变量之外的其他变量的方式来优化所述拉格朗日函数中的变量,直至输出所述预设稀疏投影矩阵和所述预设识别分类器。
7.一种基于投影字典对学习的人脸识别设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至3任一项所述的方法。
8.一种可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的方法。
CN201910459926.XA 2019-05-29 2019-05-29 一种基于投影字典对学习的人脸识别方法及装置 Active CN110147782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910459926.XA CN110147782B (zh) 2019-05-29 2019-05-29 一种基于投影字典对学习的人脸识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910459926.XA CN110147782B (zh) 2019-05-29 2019-05-29 一种基于投影字典对学习的人脸识别方法及装置

Publications (2)

Publication Number Publication Date
CN110147782A CN110147782A (zh) 2019-08-20
CN110147782B true CN110147782B (zh) 2023-06-13

Family

ID=67593468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910459926.XA Active CN110147782B (zh) 2019-05-29 2019-05-29 一种基于投影字典对学习的人脸识别方法及装置

Country Status (1)

Country Link
CN (1) CN110147782B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717519B (zh) * 2019-09-09 2023-05-09 深圳大学 训练、特征提取、分类方法、设备及存储介质
CN112990242A (zh) * 2019-12-16 2021-06-18 京东数字科技控股有限公司 图像分类模型的训练方法和训练装置
CN111667387B (zh) * 2020-05-29 2023-06-02 西北工业大学 一种基于元知识字典学习的认知诊断方法
CN111783033A (zh) * 2020-07-07 2020-10-16 香港中文大学(深圳) 一种数据稀疏投影算法、系统、电子装置及存储介质
CN113902949A (zh) * 2021-10-12 2022-01-07 苏州大学 图像识别方法、装置、电子设备及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678260A (zh) * 2016-01-07 2016-06-15 浙江工贸职业技术学院 一种基于稀疏保持距离度量的人脸识别方法
CN106778863A (zh) * 2016-12-12 2017-05-31 武汉科技大学 基于Fisher判别字典学习的仓库货品识别方法
CN108509833A (zh) * 2017-12-21 2018-09-07 苏州大学 一种基于结构化分析字典的人脸识别方法、装置及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106780342A (zh) * 2016-12-28 2017-05-31 深圳市华星光电技术有限公司 基于稀疏域重构的单帧图像超分辨重建方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678260A (zh) * 2016-01-07 2016-06-15 浙江工贸职业技术学院 一种基于稀疏保持距离度量的人脸识别方法
CN106778863A (zh) * 2016-12-12 2017-05-31 武汉科技大学 基于Fisher判别字典学习的仓库货品识别方法
CN108509833A (zh) * 2017-12-21 2018-09-07 苏州大学 一种基于结构化分析字典的人脸识别方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于字典投影学习的人脸识别算法;李为华等;《信阳师范学院学报(自然科学版)》(第02期);全文 *

Also Published As

Publication number Publication date
CN110147782A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147782B (zh) 一种基于投影字典对学习的人脸识别方法及装置
Xie et al. Implicit block diagonal low-rank representation
WO2022041678A1 (zh) 张量协作图判别分析遥感图像特征提取方法
WO2020010602A1 (zh) 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质
CN106845358B (zh) 一种手写体字符图像特征识别的方法及系统
CN108664911B (zh) 一种基于图像稀疏表示的鲁棒人脸识别方法
CN110489424B (zh) 一种表格化信息提取的方法、装置、存储介质及电子设备
CN105608478B (zh) 一种图像的特征提取与分类联合方法及系统
JP2013509664A (ja) 光学式文字認識(ocr)の精度を向上させるためのシステムおよび方法
CN105528620B (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及系统
CN109002794B (zh) 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质
CN106803105B (zh) 一种基于稀疏表示字典学习的图像分类方法
Zhang et al. Bilinear low-rank coding framework and extension for robust image recovery and feature representation
CN111680529A (zh) 一种基于层聚合的机器翻译算法及装置
CN111950592B (zh) 一种基于监督最小二乘多类核典型相关分析的多模态情感特征融合方法
Haider et al. Dictionary-enabled efficient training of ConvNets for image classification
CN109558882A (zh) 基于鲁棒局部低秩稀疏cnn特征的图像分类方法及装置
Zhao et al. Two‐Phase Incremental Kernel PCA for Learning Massive or Online Datasets
CN112434145A (zh) 一种基于图像识别和自然语言处理的看图作诗方法
CN109815889B (zh) 一种基于特征表示集的跨分辨率人脸识别方法
CN108009586B (zh) 封顶概念分解方法及图像聚类方法
CN109190645B (zh) 一种高阶高维图像数据的表示与分类方法
CN112417234B (zh) 一种数据聚类方法和装置,及计算机可读存储介质
CN113535975A (zh) 一种基于汉字知识图谱的多维度智能纠错方法
Zhang et al. Deep manifold-to-manifold transforming network for action recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant