CN107220594B - 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法 - Google Patents

基于相似度保留堆叠自编码器的人脸姿态重建与识别方法 Download PDF

Info

Publication number
CN107220594B
CN107220594B CN201710316806.5A CN201710316806A CN107220594B CN 107220594 B CN107220594 B CN 107220594B CN 201710316806 A CN201710316806 A CN 201710316806A CN 107220594 B CN107220594 B CN 107220594B
Authority
CN
China
Prior art keywords
encoder
self
image
similarity
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710316806.5A
Other languages
English (en)
Other versions
CN107220594A (zh
Inventor
欧阳宁
林乐平
马玉涛
莫建文
袁华
首照宇
张彤
陈利霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Electronic Technology
Original Assignee
Guilin University of Electronic Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Electronic Technology filed Critical Guilin University of Electronic Technology
Priority to CN201710316806.5A priority Critical patent/CN107220594B/zh
Publication of CN107220594A publication Critical patent/CN107220594A/zh
Application granted granted Critical
Publication of CN107220594B publication Critical patent/CN107220594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于相似度保留堆叠自编码器的人脸姿态重建与识别方法,其特征是,包括如下步骤:1)多角度人脸图像的姿态角度步进减小;2)目标姿态特征提取;3)构建相似度保留自编码器的总损失函数;4)堆叠相似度保留自编码器;5)训练并微调网络;6)重建与识别:将重建好的正脸图像和网络的最高隐含层特征分别使用线性判别分析法,即LDA法进行降维来提取具有判别性的人脸特征,并用最近邻分类器完成人脸识别。这种方法能够消除人脸图像的姿态角度偏转影响、能够提取到人脸对于多姿态变化更具鲁棒性的特征,且提取到的姿态特征能和原始正脸图像的特征相匹配,从而提高识别率。

Description

基于相似度保留堆叠自编码器的人脸姿态重建与识别方法
技术领域
本发明涉及计算机视觉和模式识别领域,具体涉及基于相似度保留堆叠自编码器的人脸姿态重建与识别方法。
背景技术
人脸姿态重建与识别由于其巨大的理论研究空间以及在广泛的实际应用中具有良好的应用潜力,成为了目前的一个热点研究领域。现实中,人脸在不同环境中易受姿态变化的影响,使得基于姿态变化的人脸识别问题成为了一个研究难点。识别带有不同姿态角度变化的非配合主体对于公安刑侦破案、出入口控制、边界安防等领域发挥着至关重要的作用。
在实际应用中,如视频监控和图像采集等场合,由于用户的非配合,致使采集到的图像存在不同程度的角度旋转,从而导致人脸被部分遮挡以及脸部纹理形变,最后提取到的姿态特征不能很好和原始正脸图像的特征相匹配,从而降低了识别率。
为了解决姿态变化带来的人脸重建和识别问题,目前现有的技术主要为2D和3D两类方法。2D方法中的经典方法是运用堆叠步进自编码器网络结构来将较大姿态的人脸图像逐步地转换为较小姿态的图像,从而完成正脸姿态的重建。这种方法虽然能够提取到鲁棒性较强的姿态不变特征,但是其在某种程度上,使得在姿态重建过程中,人脸的局部纹理信息丢失太多,导致重建后的正脸图像质量下降,从而影响了后续的识别性能;在3D方法中,则主要是运用基于三维人脸建模的方法来处理姿态变化带来的识别性能降低等问题。基于3D建模的方法其计算量较大,且在某些情况下,运用3D方法进行姿态重建后的人脸其识别率没有得到很大程度上的提升。
发明内容
本发明的目的是针对现有技术的不足,而提供一种基于相似度保留堆叠自编码器的人脸姿态重建与识别方法。这种方法能够消除人脸图像的姿态角度偏转影响、能够提取到人脸对于多姿态变化更具鲁棒性的特征,且提取到的姿态特征能和原始正脸图像的特征相匹配,从而提高识别率。
实现本发明目的的技术方案是:
一种基于相似度保留堆叠自编码器的人脸姿态重建与识别方法,包括如下步骤:
1)多角度人脸图像的姿态角度步进减小:给定多角度姿态输入图像x(1)以及图像x(1) 下一级小姿态角度图像
Figure GDA00024627331200000214
将x(1)作为第一步进自编码器的输入,
Figure GDA00024627331200000215
则作为第一步进自编码器的期望输出,接着在第一步进自编码器编码过程中,通过编码参数 {W1(1),b1(1)}将多角度姿态输入图像x(1)映射到隐含层h1中,在第一步进自编码器解码过程中,又通过解码参数{W1(2),b1(2)}将输入图像的隐含层特征h1映射到输出层y(1),最后通过最小化均方误差函数
Figure GDA0002462733120000021
来实现姿态角度的步进减小;
2)目标姿态特征提取:将步骤1)中第一步进自编码器的目标姿态角度图像
Figure GDA0002462733120000022
作为第一半自编码器的输入,通过参数{W1(3),b1(3)}将
Figure GDA0002462733120000023
映射到第一半自编码器的隐含层
Figure GDA0002462733120000024
即为提取到的目标姿态特征;
3)构建相似度保留自编码器的总损失函数:步骤1)中的第一步进自编码器和步骤2) 中的第一半自编码器构成一个相似度保留自编码器,在第一步进自编码器的损失函数
Figure GDA0002462733120000025
中加入相似度保留约束项,即对输入图像的隐含层特征h1和目标姿态的隐含层特征
Figure GDA0002462733120000026
作相似度约束
Figure GDA0002462733120000027
在损失函数
Figure GDA0002462733120000028
中引入相似度保留项后,再在其中加入对隐含层特征h1
Figure GDA0002462733120000029
的稀疏性限制
Figure GDA00024627331200000210
即稀疏正则项,来共同构成网络总的损失函数
Figure GDA00024627331200000216
4)堆叠相似度保留自编码器:步骤3)中得到了第一个相似度保留自编码器的总损失函数
Figure GDA00024627331200000211
通过最小化损失函数,采用随机梯度下降法来训练网络参数{W1(1),b1(1)}、{W1(2),b1(2)}和{W1(3),b1(3)},之后将多角度姿态输入图像x(1)通过训练好的参数 {W1(1),b1(1)}得到隐含层特征h1,接着将h1作为第二步进自编码的输入,取
Figure GDA00024627331200000217
的下一级小姿态角度图像
Figure GDA00024627331200000218
作为第二步进自编码的目标姿态图像,同样按照步骤1)的方法来将h1映射到隐含层为h2,h2又被映射到输出层y(2),另一方面,第二步进自编码的目标姿态图像
Figure GDA00024627331200000212
又作为第二半自编码器的输入,按照步骤2)的方法将其映射到隐含层
Figure GDA00024627331200000213
接着同步骤3)来构建第二相似度保留自编码器的总损失函数,并最小化第二相似度保留自编码器的损失函数来训练参数,如此往复来堆叠多个这样的相似度保留自编码器来逐步重建正脸图像,并提取姿态不变特征;
5)训练并微调网络:经过上述的4个步骤预训练过程后,网络的参数有了初始值,以多角度姿态图像x(1)作为微调网络的输入,在最终的输出端,以正脸姿态图像
Figure GDA0002462733120000031
作为网络的期望输出,通过步骤1)-步骤4)预训练过程训练好的参数将x(1)映射到最终的输出层y0,接着通过最小化微调网络的损失函数来微调整个网络;
6)重建与识别:即重建测试图像的正脸图片,并提取网络最高隐含层特征,最后识别多姿态人脸图像,将带有不同姿态角度的测试图像输入到训练好的微调网络中,通过连接训练好的参数,将测试图像步进映射到多个隐含层中,在输出端得到重建好的正脸图像,接着将重建好的正脸图像和网络的最高隐含层特征分别使用线性判别分析法,即LDA 法进行降维来提取具有判别性的人脸特征,并用最近邻分类器完成人脸识别。
这种方法通过在步进自编码器的隐含层中引入相似度保留项,即让每一个步进自编码器的隐含层特征和这个自编码器的目标姿态特征做相似度约束,使得在姿态逐层减小的同时,又能够让每一个人对应的姿态特征相似,从而使得提取到的隐含层表达对姿态变化更具鲁棒性,则网络能够很好重建人脸图片的细节信息,且重建后的正脸图片整体光滑,噪点少,主观视觉和客观结构相似度表现都很好;由于多姿态角度图像重建后的正脸图像获得了较好的重建质量,则将重建后的正脸图像通过降维提取特征并分类,一定程度上提高了识别率;此外,由于引入相似度保留约束项,使得网络的最高隐含层特征含有的冗余信息少,则将最高隐含层特征同样通过降维特征提取和分类过程,也能很大程度上提高识别率。
这种方法使用步进自编码器,能够有效地消除人脸图像的姿态角度偏转影响、使用相似度保留项,对隐含层做相似度约束,增强了同一个人对应的人脸特征的相似度,使得人脸特征的鲁棒性更强,重建图像整体光滑,噪点少,提取到的姿态特征能和原始正脸图像的特征相匹配,从而提高识别率。
附图说明
图1为实施例的流程示意图;
图2为实施例中相似度保留自编码器人脸姿态重建结构图;
图3为实施例中相似度保留自编码器网络微调结构图。
图4为实施例的算法识别率性能图。
具体实施方式
下面结合附图和实施例对本发明内容作进一步的详细说明,但不是对本发明的限定。
实施例:
参照图1、图2、图3、图4,一种基于相似度保留堆叠自编码器的人脸姿态重建与识别方法,包括如下步骤:
1)多角度人脸图像的姿态角度步进减小:给定多角度姿态输入图像x(1)以及图像x(1) 下一级小姿态角度图像
Figure GDA0002462733120000043
将x(1)作为第一步进自编码器的输入,
Figure GDA0002462733120000044
则作为第一步进自编码器的期望输出,接着在第一步进自编码器编码过程中,通过编码参数 {W1(1),b1(1)}将多角度姿态输入图像x(1)映射到隐含层h1中,在第一步进自编码器解码过程中,又通过解码参数{W1(2),b1(2)}将输入图像的隐含层特征h1映射到输出层y(1),最后通过最小化均方误差函数
Figure GDA0002462733120000045
来实现姿态角度的步进减小,具体地:
(1)如图1所示,首先给定多姿态人脸图像x(1),其包含姿态角度p1~pk,且 pk>pk-1>...>p1>0,与此对称的角度为-pi(i=1,2...k),以p0表示正脸姿态,所以共2k+1种姿态。这里设k=3,则输入图像共包含7种姿态角度,分别为{-45°,-30°,-15°,0°,+15°,+30°,+45°};
(2)将x(1)作为第一步进自编码器的输入,经编码函数f(x)和编码参数{W1(1),b1(1)} 映射到隐含层h1中,接着隐含层特征h1经解码函数g(h)和解码参数{W1(2),b1(2)} 又映射到了输出层y(1)中,编解码过程如下所示,
h1=f(x(1))=s(W1(1)x(1)+b1(1))
y(1)=g(h1)=s(W1(2)h1+b1(2))
式中的s(x)是非线性映射sigmoid激活函数,且
Figure GDA0002462733120000041
(3)经过网络的编解码过程,接下来要通过最小化均方误差函数
Figure GDA0002462733120000042
来实现姿态角度的步进减小,即将较大姿态角度-pk(-45°)和pk(+45°)图像分别映射到下一级小姿态角度-pk-1(-30°)和pk-1(+30°)图像,其余角度分别映射到本身,则在第一步进自编码器中期望输出图像的角度范围为-pk-1-pk-1(-30°-+30°),记为
Figure GDA00024627331200000519
Figure GDA0002462733120000051
表达式如下,
Figure GDA0002462733120000052
式中,N是训练样本个数;
2)目标姿态特征提取:将步骤1)中第一步进自编码器的目标姿态角度图像
Figure GDA0002462733120000053
作为第一半自编码器的输入,通过参数{W1(3),b1(3)}将
Figure GDA0002462733120000054
映射到第一半自编码器的隐含层
Figure GDA0002462733120000055
即为提取到的目标姿态特征,具体地:
Figure GDA0002462733120000056
作为第一半自编码器的输入,如图2中右边一列所示,
Figure GDA00024627331200000520
通过参数{W1(3),b1(3)} 连接得到目标姿态的特征
Figure GDA0002462733120000057
映射过程如下式所示,
Figure GDA0002462733120000058
式中的函数f和s同步骤1)中的步进自编码器函数,分别为编码函数和sigmoid激活函数;
3)构建相似度保留自编码器的总损失函数:步骤1)中第一步进自编码器和步骤2)中的第一半自编码器构成一个相似度保留自编码器,在第一步进自编码器的损失函数
Figure GDA0002462733120000059
中加入相似度保留约束项,即对输入图像的隐含层特征h1和目标姿态的隐含层特征
Figure GDA00024627331200000510
作相似度约束
Figure GDA00024627331200000511
在损失函数
Figure GDA00024627331200000512
中引入相似度保留项后,再在其中加入对隐含层特征h1
Figure GDA00024627331200000513
的稀疏性限制
Figure GDA00024627331200000514
即稀疏正则项,来共同构成网络总的损失函数
Figure GDA00024627331200000515
具体地:
(1)将目标姿态特征
Figure GDA00024627331200000516
和步进自编码器提取的姿态特征h1进行相似度约束,使得在第一层中同一个人对应的姿态特征相似,表达式如下所示:
Figure GDA00024627331200000517
式中的N同样为训练样本个数;
(2)分别对隐含层特征h1
Figure GDA00024627331200000518
添加稀疏惩罚项来限制隐含层中较大的平均激活度,ρx
Figure GDA00024627331200000617
分别表示步进自编码器隐含层和目标姿态隐含层的平均激活度,表达式如下,
Figure GDA0002462733120000061
Figure GDA0002462733120000062
接着引入相对熵(Kullback-Leibler Divergence)来限制隐藏单元的激活度,隐含层特征h1
Figure GDA0002462733120000063
的KL熵表达式分别如下式,
Figure GDA0002462733120000064
Figure GDA0002462733120000065
式中,ρ0是稀疏度参数,是一个接近于0的数,这里取值为0.05,d是隐藏层h1
Figure GDA0002462733120000066
神经元的个数;
(3)将步进自编码器的均方误差损失函数
Figure GDA0002462733120000067
相似度保留约束项
Figure GDA0002462733120000068
以及隐含层的稀疏性正则项
Figure GDA0002462733120000069
Figure GDA00024627331200000610
合起来构成相似度保留自编码器的总损失函数
Figure GDA00024627331200000611
Figure GDA00024627331200000612
式中的α和β是平衡损失函数中不同项之间的参数,可以分别取值为1,0.001,同时在本实施例中,网络中隐含层节点数取值为2000;
(4)通过求解总的目标函数式
Figure GDA00024627331200000613
的最小值点,并运用共轭梯度(ConjugateGradients,CG)优化算法来学习网络参数{W1(i),b1(i)},网络参数的更新公式如下式所示:
Figure GDA00024627331200000614
Figure GDA00024627331200000615
上式中,η>0是学习速率;
4)堆叠相似度保留自编码器:步骤3)中得到了第一个相似度保留自编码器的总损失函数
Figure GDA00024627331200000616
通过最小化损失函数,采用随机梯度下降法来训练网络参数{W1(1),b1(1)}、{W1(2),b1(2)}和{W1(3),b1(3)},之后将多角度姿态输入图像x(1)通过训练好的参数 {W1(1),b1(1)}得到隐含层特征h1,接着将h1作为第二步进自编码的输入,取
Figure GDA0002462733120000076
的下一级小姿态角度图像
Figure GDA0002462733120000077
作为第二步进自编码的目标姿态图像,同样按照步骤1)的方法来将h1映射到隐含层为h2,h2又被映射到输出层y(2),另一方面,第二步进自编码的目标姿态图像
Figure GDA0002462733120000078
又作为第二半自编码器的输入,按照步骤2)的方法将其映射到隐含层
Figure GDA0002462733120000079
接着同步骤3),最小化第二相似度保留自编码器的损失函数来训练参数,如此往复来堆叠多个这样的相似度保留自编码器来逐步重建正脸图像,并提取姿态不变特征,具体地:
(1)训练好第一相似度保留自编码器后,再以多姿态人脸图像x(1)作为输入,计算隐含层特征h1,此时的隐含层h1已经完成了小姿态角度的映射,其包含 -pk-1-pk-1(-30°-+30°)姿态范围内图像的特征;
(2)接着将h1作为第二步进自编码器的输入,按步骤1)中的第(2)步来将h1映射到h2,h2又被映射到输出层y(2);同时又按照第(3)步来最小化均方误差函数
Figure GDA0002462733120000071
实现将角度-pk-1(-30°)和pk-1(+30°)图像分别映射到下一级小姿态角度-pk-2(-15°)和 pk-2(+15°)图像,其余角度分别映射到本身,则在第二步进自编码器中期望输出图像的角度范围为-pk-2-pk-2(-15°-+15°),记为
Figure GDA0002462733120000072
接着按照步骤2,将
Figure GDA0002462733120000073
作为另一个半自编码器的输入来提取目标姿态-pk-2~pk-2(-15°~+15°)的特征
Figure GDA0002462733120000074
最后参照步骤3的方法来构建第二相似度保留自编码器的总损失函数,并通过最小化损失函数运用随机梯度下降法来更新网络参数;然后训练完第二个网络后,又将h1作为第二相似度保留自编码器的输入,依据更新好的参数来获得-pk-2-pk-2(-15°-+15°)姿态范围内图像的特征h2
(3)将h2作为第三步进自编码器的输入,重复上述步骤,来训练第三相似度保留自编码器网络,使得最后的姿态角度均为0°;
5)训练并微调网络:经过上述的4个步骤预训练过程后,网络的参数有了初始值,以多角度姿态图像x(1)作为微调网络的输入,在最终的输出端,以正脸姿态图像
Figure GDA0002462733120000075
作为网络的期望输出,通过步骤1)-步骤4)预训练过程训练好的参数将x(1)映射到最终的输出层y0,接着通过最小化微调网络的损失函数来微调整个网络,具体地:
当预训练好相似度保留堆叠自编码器后,网络中各层参数{W1(i),b1(i)}有了初始值,在微调过程中,以各姿态角度人脸图像x(1)再次作为微调网络的输入,通过运用如下公式逐层将输入图像映射到各个隐含层中,并在输出层得到重建后的正脸图像,
h1=f(x(1))=s(W1(1)x(1)+b1(1))
h2=f(h1)=s(W2(1)h1+b2(1))
h3=f(h2)=s(W3(1)h2+b3(1))
y0=f(h3)=s(W3(2)h3+b3(2))
上述各式中,h1,h2,h3为微调网络的隐含层特征,y0为输出层表达,其包含的图像角度均为0°,此时,在微调网络的输出端,以各姿态角度人脸图像x(1)所对应的正脸图像作为网络的期望输出,表示为
Figure GDA0002462733120000081
则微调阶段的损失函数
Figure GDA0002462733120000082
表达式如下:
Figure GDA0002462733120000083
接着最小化上式,同样使用共轭梯度优化算法来学习网络参数。经过微调过程,进一步修正网络中的参数,使得参数达到最优取值;
6)重建与识别:即重建测试图像的正脸图片,并提取网络最高隐含层特征,最后识别多姿态人脸图像。将带有不同姿态角度的测试图像输入到训练好的微调网络中,通过连接训练好的参数,将测试图像步进映射到多个隐含层中,在输出端得到重建好的正脸图像,接着将正脸图像和网络的最高隐含层特征分别使用线性判别分析法,即LDA法进行降维来提取具有判别性的人脸特征,并用最近邻分类器完成人脸识别,具体地:
(1)经过训练和微调后,网络获得了最优的参数取值,在测试时,输入多角度姿态测试图像,经各层参数连接将测试图像映射到隐含层,在网络输出端得到了重建后的正脸图像;
(2)将重建后的正脸图片和网络中提取的最高隐含层特征h3分别通过线性判别分析法降维来提取具有判别性的人脸特征,然后再通过最近邻分类器来识别多姿态人脸图像;
通过上述的实施例步骤,可以将多姿态人脸图像重建为正脸图像,并能够提取到网络的最高隐含层特征,图4为分别用相似度保留堆叠自编码器重建后的正脸图像和网络的最高隐含层特征做识别的结果图,从图中可以看出,用网络提取的最高隐含层特征来做多姿态人脸识别后,其识别率要高于用重建出的正脸图像做识别的识别结果;但是用重建后的正脸图像做识别,其识别率也相对较优。

Claims (1)

1.基于相似度保留堆叠自编码器的人脸姿态重建与识别方法,其特征是,包括如下步骤:
1)多角度人脸图像的姿态角度步进减小:给定多角度姿态输入图像x(1)以及图像x(1)下一级小姿态角度图像
Figure FDA0002462733110000011
将x(1)作为第一步进自编码器的输入,
Figure FDA0002462733110000012
则作为第一步进自编码器的期望输出,接着在第一步进自编码器编码过程中,通过编码参数{W1(1),b1(1)}将多角度姿态输入图像x(1)映射到隐含层h1中,在第一步进自编码器解码过程中,又通过解码参数{W1(2),b1(2)}将输入图像的隐含层特征h1映射到输出层y(1),最后通过最小化均方误差函数
Figure FDA0002462733110000013
来实现姿态角度的步进减小;
2)目标姿态特征提取:将步骤1)中第一步进自编码器的目标姿态角度图像
Figure FDA0002462733110000014
作为第一半自编码器的输入,通过参数{W1(3),b1(3)}将
Figure FDA0002462733110000015
映射到第一半自编码器的隐含层
Figure FDA0002462733110000016
即为提取到的目标姿态特征;
3)构建相似度保留自编码器的总损失函数:步骤1)中第一步进自编码器和步骤2)中的第一半自编码器构成一个相似度保留自编码器,在第一步进自编码器的损失函数
Figure FDA0002462733110000017
中加入相似度保留约束项,即对输入图像的隐含层特征h1和目标姿态的隐含层特征
Figure FDA0002462733110000018
作相似度约束
Figure FDA0002462733110000019
在损失函数
Figure FDA00024627331100000110
中引入相似度保留项后,再在其中加入对隐含层特征h1
Figure FDA00024627331100000111
的稀疏性限制
Figure FDA00024627331100000112
Figure FDA00024627331100000113
即稀疏正则项,来共同构成网络总的损失函数
Figure FDA00024627331100000114
4)堆叠相似度保留自编码器:步骤3)中得到了第一个相似度保留自编码器的总损失函数
Figure FDA00024627331100000115
通过最小化损失函数,采用随机梯度下降法来训练网络参数{W1(1),b1(1)}、{W1(2),b1(2)}和{W1(3),b1(3)},之后将多角度姿态输入图像x(1)通过训练好的参数{W1(1),b1(1)}得到隐含层特征h1,接着将h1作为第二步进自编码的输入,取
Figure FDA00024627331100000116
的下一级小姿态角度图像
Figure FDA00024627331100000117
作为第二步进自编码的目标姿态图像,同样按照步骤1)的方法来将h1映射到隐含层h2,h2又被映射到输出层y(2),另一方面,第二步进自编码的目标姿态图像
Figure FDA00024627331100000118
又作为第二半自编码器的输入,按照步骤2)的方法将其映射到隐含层
Figure FDA00024627331100000119
接着同步骤3),最小化第二相似度保留自编码器的损失函数来训练参数,如此往复来堆叠多个这样的相似度保留自编码器来逐步重建正脸图像,并提取姿态不变特征;
5)训练并微调网络:以多角度姿态图像x(1)作为微调网络的输入,在最终的输出端,以正脸姿态图像
Figure FDA0002462733110000021
作为网络的期望输出,通过步骤1)-步骤4)预训练过程训练好的参数将x(1)映射到最终的输出层y0,接着通过最小化微调网络的损失函数来微调整个网络;
6)重建与识别:将带有不同姿态角度的测试图像输入到训练好的微调网络中,通过连接训练好的参数,将测试图像步进映射到多个隐含层中,在输出端得到重建好的正脸图像,接着将重建好的正脸图像和网络的最高隐含层特征分别使用线性判别分析法,即LDA法进行降维来提取具有判别性的人脸特征,并用最近邻分类器完成人脸识别。
CN201710316806.5A 2017-05-08 2017-05-08 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法 Active CN107220594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710316806.5A CN107220594B (zh) 2017-05-08 2017-05-08 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710316806.5A CN107220594B (zh) 2017-05-08 2017-05-08 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法

Publications (2)

Publication Number Publication Date
CN107220594A CN107220594A (zh) 2017-09-29
CN107220594B true CN107220594B (zh) 2020-06-12

Family

ID=59944674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710316806.5A Active CN107220594B (zh) 2017-05-08 2017-05-08 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法

Country Status (1)

Country Link
CN (1) CN107220594B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062559A (zh) * 2017-11-30 2018-05-22 华南师范大学 一种基于多重感受野的图像分类方法、系统及装置
CN108805802B (zh) * 2018-06-05 2020-07-31 东北大学 一种基于约束条件的堆叠步进自编码器的正面人脸重建系统及方法
CN109740659B (zh) * 2018-12-28 2021-07-27 浙江商汤科技开发有限公司 一种图像匹配方法及装置、电子设备、存储介质
CN109753608B (zh) * 2019-01-11 2023-08-04 腾讯科技(深圳)有限公司 确定用户标签的方法、自编码网络的训练方法及装置
CN110136828A (zh) * 2019-05-16 2019-08-16 杭州健培科技有限公司 一种基于深度学习实现医学影像多任务辅助诊断的方法
CN111401272B (zh) * 2020-03-19 2021-08-24 支付宝(杭州)信息技术有限公司 一种人脸特征提取方法、装置及设备
CN111462239B (zh) * 2020-04-03 2023-04-14 清华大学 姿态编码器训练及姿态估计方法及装置
CN112990047B (zh) * 2021-03-26 2024-03-12 南京大学 一种结合面部角度信息的多姿态人脸验证方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510257A (zh) * 2009-03-31 2009-08-19 华为技术有限公司 一种人脸相似度匹配方法及装置
CN106127804A (zh) * 2016-06-17 2016-11-16 淮阴工学院 基于稀疏深度去噪自编码器的rgb‑d数据跨模式特征学习的目标跟踪方法
CN106599878A (zh) * 2016-12-28 2017-04-26 深圳市捷顺科技实业股份有限公司 一种基于深度学习的人脸重建矫正方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101510257A (zh) * 2009-03-31 2009-08-19 华为技术有限公司 一种人脸相似度匹配方法及装置
CN106127804A (zh) * 2016-06-17 2016-11-16 淮阴工学院 基于稀疏深度去噪自编码器的rgb‑d数据跨模式特征学习的目标跟踪方法
CN106599878A (zh) * 2016-12-28 2017-04-26 深圳市捷顺科技实业股份有限公司 一种基于深度学习的人脸重建矫正方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Effective Insect Recognition Using a Stacked Auto encoder with Maximum Correntropy Criterion";Qi Y, et al.;《International Joint Conference on Neural Networks》;20150712;全文 *
"Research of 3D face recognition algorithm based on deep learning stacked denoising auto encoder theory";Zhang J, et al.;《2016 8th IEEE International Conference on Communication Software and Networks》;20161010;全文 *
"基于多任务学习的多姿态人脸重建与识别";欧阳宁等;《计算机应用》;20170331;第37卷(第3期);全文 *

Also Published As

Publication number Publication date
CN107220594A (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN107220594B (zh) 基于相似度保留堆叠自编码器的人脸姿态重建与识别方法
Yang et al. Learning face age progression: A pyramid architecture of gans
Cao et al. Learning a high fidelity pose invariant model for high-resolution face frontalization
Tran et al. Missing modalities imputation via cascaded residual autoencoder
CN110348330B (zh) 基于vae-acgan的人脸姿态虚拟视图生成方法
Cen et al. Dictionary representation of deep features for occlusion-robust face recognition
Liu et al. Deep aging face verification with large gaps
Chen et al. Video-based face recognition via joint sparse representation
CN108334816A (zh) 基于轮廓对称约束生成式对抗网络的多姿态人脸识别方法
CN110572696A (zh) 一种变分自编码器与生成对抗网络结合的视频生成方法
CN101436250B (zh) 基于非线性张量分解与视角流形的多视角人脸识别方法
CN106097278B (zh) 一种多维信号的稀疏模型、重建方法和字典训练方法
CN106157339A (zh) 基于低秩顶点轨迹子空间提取的动画网格序列压缩算法
CN110321777B (zh) 一种基于栈式卷积稀疏去噪自编码器的人脸识别方法
Zhou et al. Pose-robust face recognition with Huffman-LBP enhanced by divide-and-rule strategy
CN111210382B (zh) 图像处理方法、装置、计算机设备和存储介质
Jia et al. Stacked denoising tensor auto-encoder for action recognition with spatiotemporal corruptions
Hu et al. LDF-Net: Learning a displacement field network for face recognition across pose
CN109949217A (zh) 基于残差学习和隐式运动补偿的视频超分辨率重建方法
CN108805802A (zh) 一种基于约束条件的堆叠步进自编码器的正面人脸重建系统及方法
CN112766217A (zh) 基于解纠缠和特征级差异学习的跨模态行人重识别方法
Xia et al. Gait recognition based on Wasserstein generating adversarial image inpainting network
Feng et al. U²-Former: Nested U-Shaped Transformer for Image Restoration via Multi-View Contrastive Learning
CN105718906B (zh) 基于svd-hmm活体人脸检测方法
Singh et al. A sparse coded composite descriptor for human activity recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant