CN114627531A - 一种基于人脸重构和Gabor遮挡字典的人脸识别方法 - Google Patents

一种基于人脸重构和Gabor遮挡字典的人脸识别方法 Download PDF

Info

Publication number
CN114627531A
CN114627531A CN202210202974.2A CN202210202974A CN114627531A CN 114627531 A CN114627531 A CN 114627531A CN 202210202974 A CN202210202974 A CN 202210202974A CN 114627531 A CN114627531 A CN 114627531A
Authority
CN
China
Prior art keywords
dictionary
face
reconstruction
gabor
occlusion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210202974.2A
Other languages
English (en)
Inventor
梁久祯
赫焕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou University
Original Assignee
Changzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou University filed Critical Changzhou University
Priority to CN202210202974.2A priority Critical patent/CN114627531A/zh
Publication of CN114627531A publication Critical patent/CN114627531A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人脸识别技术领域,尤其涉及一种基于人脸重构和Gabor遮挡字典的人脸识别方法,包括S1、首先进行多角度人脸重构,经过mtcnn人脸对齐和裁剪;S2、引入遮挡字典Ae与训练数据A共同对测试样本编码;S3、增强字典对样本的表达能力;S4、用求解出的字典D重构测试样本;S5、重构误差矩阵进行样本分类;S6、由重构误差得到测试样本的标签分类;本发明一方面重构多角度人脸,弥补姿态遮挡人脸中的不可见部分;另一方面将Gabor遮挡字典与传统人脸识别过程相结合,利用Gabor遮挡字典重构因物理遮挡导致的噪声特征,增加对遮挡人脸识别的精度。

Description

一种基于人脸重构和Gabor遮挡字典的人脸识别方法
技术领域
本发明涉及人脸识别技术领域,尤其涉及一种基于人脸重构和Gabor遮挡字典的人脸识别方法。
背景技术
人脸识别是机器视觉领域最重要的研究方向之一。近年来,人脸识别具有非常重要的实际应用价值。但是在很多实际应用场景中,人脸识别技术会受到很多限制,其中最常见的便是面部遮挡。面部的物理遮挡和姿态遮挡破坏了人脸信息的完整性,从而降低人脸识别的准确性。通常,有两类方法可以弥补这个问题。一种是通过人脸重建来恢复由于姿态变化而损失的信息。二是训练人脸识别模型,提取人脸不变特征。
随着生成对抗网络(GAN)和深度学习的发展以及人脸重建在人脸识别领域的应用,越来越多的基于GAN的人脸重建方法被提出,以弥补姿势变化导致的人脸信息不足。人脸重建方法不可避免地需要填充人脸的不可见部分。大多数使用面部标志(如五点标志)、面部对齐方法或三维人脸可形变模型(3DMM)进行图像预处理。这些工作的一些训练模型基于大规模数据集或复杂网络。而非使用更简单有效的网络重建正面人脸,聚焦到后续的人脸识别任务中。
关于面部特征损失导致的识别困难问题。传统上,基于字典学习的经典有效人脸识别方法侧重于学习不同类别的辨别特征,研究了因面部遮挡引起的识别困难问题,从不同的方面优化关于面部遮挡引起的识别结果降低的问题。Fisher判别字典学习方法(FDDL)整合了有效的费希尔判别标准,训练字典矩阵,增大类间距离。最新的字典学习方法也学习数据的隐含特征,增强字典识别和编码能力。但是面部遮挡部分对应的噪声特征,影响判别特征的学习。如何基于Gabor变换、LBP等低阶特征训练字典,学习具有判别力的特征,仍然是值得研究的问题。
发明内容
本发明所要解决的技术问题是:人脸姿态变化导致的面部姿态遮挡问题;人脸图像中出现的外部物理遮挡问题。
本发明所采用的技术方案是:一种基于人脸重构和Gabor遮挡字典的人脸识别方法包括以下步骤:
S1、图像处理:首先进行多角度人脸重构,每个个体各个角度的人脸按照角度分类,分类后的数据划分训练集和测试集,训练多角度人脸重构网络,生成正面人脸信息,然后正面人脸信息经过mtcnn人脸对齐和裁剪;
S2、求解Gabor遮挡字典:
在基于稀疏表达的人脸识别(SRC)中,测试样本y可以由训练样本A的线性组合求得,当出现遮挡或信息损失的样本,将样本分为完整的样本与噪声或遮挡信息两部分组成,引入遮挡字典Ae与训练数据A共同对测试样本编码,可以表示为:
y=Ax0+e0=[A,Ae][x0,xe]T (1)
其中,e0表示样本噪声的误差向量,x0、xe分别是与训练数据A、遮挡字典Ae对应的稀疏矩阵,Ae为单位矩阵;Fourier基等(Fourier基是线性无关的三角级数1,cosx,sinx,…cosix,sinix…cosnx,sinnx构成的正交基);提取对应的Gabor特征χ(y)、χ(Ae),χ(A),求得的Gabor特征测试样本χ(y),对应的Gabor遮挡字典χ(Ae)、训练样本χ(A)重构如下:
χ(y)=[χ(A),χ(Ae)][x0,xe]T (2)
其中,x0、xe分别是与训练数据A、遮挡字典Ae对应的稀疏矩阵;
由于Gabor遮挡字典求解过程中的代价太大,需要对χ(Ae)进行压缩,并对提取的Gabor特征进行了下采样,为了进一步得到一个紧凑且更有表达力的字典,对Gabor遮挡字典进行优化,Gabor遮挡字典χ(Ae),具体求解Gabor遮挡字典公式如下:
Figure BDA0003528101620000031
其中,Γ表示压缩后的字典,Z是χ(Ae)在字典Γ上的表示矩阵;公式(3)是Gabor遮挡字典和矩阵Z的联合优化问题,与许多变量优化问题一样,本发明通过交替优化Γ和Z来求解公式(3);
S3、求解训练数据字典:增强字典对样本的表达能力,保证字典的全局重构性、局部重构性、重构的唯一性,同时提取更深层次的特征,结合Fisher判别准则与对字典判别力的定义,重定义字典的求解公式:
Figure BDA0003528101620000032
其中,
Figure BDA0003528101620000033
D表示全局字典,Di表示第i类局部字典,χ(Ai)表示第i类训练样本,Xi表示χ(Ai)在D上的表示矩阵,
Figure BDA0003528101620000034
表示χ(Ai)在Di上的表示矩阵,
Figure BDA0003528101620000035
表示χ(Ai)在Dj上的表示矩阵,X表示χ(A)在D上的表示矩阵;
Figure BDA0003528101620000036
表示类内距离,
Figure BDA0003528101620000037
表示类间距离,mi是Xi的均值向量,m是X的均值向量,ni是第i类训练样本的数量;
字典原子初始化过程,将每个字典的所有原子初始化为具有单位L2范数的随机向量,公式(4)是字典矩阵D和矩阵X的联合优化问题;根据迭代投影法(IPM)可用于求解矩阵X,根据MFL(Meta-Face Learning)中的求解算法,求解出字典D;
S4、求解稀疏矩阵:根据公式(5),求解出字典D,利用SRC人脸分类思想,用求解出的字典D重构测试样本,求解测试样本在字典中的稀疏编码:
Figure BDA0003528101620000041
其中,α、βΓ为稀疏矩阵,D为全局字典、Γ为压缩字典;
公式(5)表示,稀疏矩阵α、βΓ分别与全局字典D、压缩字典Γ共同重构Gabor特征测试样本χ(y);使用L2范数对编码系数进行正则化;通过正则化可以使表示更稳定;此外,正则化使表示系数更小,增加表征系数的分辨力,有利于最终的人脸识别。
S5、计算重构误差:根据S4求解的字典D和Gabor遮挡字典Γ对应的稀疏编码矩阵重构测试样本,由公式(6)得到重构误差矩阵,公式(6)分为了两部分,一部分是稀疏编码矩阵对应的对完整样本的重构,另一部分是稀疏编码矩阵对应的对噪声或遮挡信息的重构,求得重构误差进行样本分类:
Figure BDA0003528101620000042
根据公式(5)求得α、βΓ的近似解
Figure BDA0003528101620000043
用于求解重构误差ei
S6、标签分类:由重构误差得到测试样本的标签分类:
identify(y)=argmini{ei} (7)
由公式(7)求得重构测试样本最小误差对应的类别identify(y);
进一步,所述人脸识别步骤中多角度人脸重构具体内容包括:
S11、数据预处理:人脸数据集中,每个个体的人脸姿态不尽相同,处理每个个体数据,得到一定角度的若干个体参与实验,对若干个体的每个图像进行人脸对齐,调整图像中的人脸位置,舍弃无用的背景信息;
S12、训练网络设计:多角度人脸重构网络由一个生成器和一个判别器组成;生成器输入和输出的图片w×h×c=128×128×3,经过四层进行下采样和上采样卷积网络;判别网络输出:(1)用于判别输入图片真假的矩阵;(2)输入图片的判别标签;(3)图片的特征向量。
S13、损失函数设计:整个网络训练过程中,判别网络、生成网络联合训练最小化两个网络损失,LD、LG分别为D网络、G网络的总损失函数,具体设计如下:
Figure BDA0003528101620000051
D网络损失由对抗损失Ladv、标签损失Lrlbe、身份损失Ldide共同组成;G网络损失由对抗损失Ladv、标签损失Lflbe、身份损失Lgide、共循环一致性损失Lcon、对称损失Lsym同组成;λadv、λlbe、λide、λcon、λsym为不同的损失函数对应的参数;对抗损失Ladv定义如下:
Ladv=Ex[logDdis(x)]+Ex,l′[1-log(Ddis(G(x,l′)))] (9)
输入图像x与其对应的标签l组成图片对(x,l);l′是生成器训练的目标标签,从而生成器训练目标为G(x,l′)→y;G(x,l′)→y表示输入侧面图片x和目标正面人脸的标签l′,最终生成正面人脸y;
判别器训练目标为D(x)→{Ddis,Dlbe,Dfea},表示输入一张图片,得到对应图片真假判别标签的概率分布Ddis、图片域标签的概率分布Dlbe、图片对应身份标签的概率分布Dfea;域标签损失分为两部分,一个是某一人脸图像输入的域标签损失,一个是生成器生成的目标人脸角度图片的域标签损失;域标签损失加入到训练判别器D的损失函数中,能够训练D正确的判别每一张图片对应的标签类别,标签损失Lrlbe的定义如下:
Lrlbe=Ex,l[-logDlbe(l|x)] (10)
域标签损失加入到训练生成器的损失函数中,定义如下:
Lflbe=Ex,l′[-logDlbe(l′|G(x,l′))] (11)
特别的是,每一张图片都有与之对应的域标签,使得只用一个生成器的同时,保证生成图像的多样性,与身份损失相结合,保证生成图像的唯一性,保持身份特征,生成器和判别器的身份损失具体定义如下:
Lgide=-dist(Dfea(xF)-Dfea(G(xP,l0)))+dist(Dfea(xF)-Dfea(xP)) (12)
Ldide=dist(Dfea(xF)-Dfea(G(xP,l0))) (13)
公式中xF、xP表示同一个人的正面、非正面图像,l0表示正面图像的域标签,dist表示求解向量距离;除了以上的损失函数,加入了循环一致性损失,训练网络得到目标角度的人脸,同时保持原来人脸的面部细节,对称损失是针对生成的正面人脸视图,一定程度上能优化最终生成的正面人脸效果;具体定义如下:
Lcon=Ex,l,l′[||x-G(G(x,l′),l)||1] (14)
Figure BDA0003528101620000061
其中w、h表示图像的宽和高,a、b表示图像某一像素点的坐标;将G(xP,l0)的结果表示为xpred;假设人脸左右对称,
Figure BDA0003528101620000062
则表示由生成器生成的正面视图中的某一像素点,
Figure BDA0003528101620000063
则表示与
Figure BDA0003528101620000064
对称的像素点。
本发明的有益效果:
提出结合两方面内容的人脸识别方法,一方面重构多角度人脸,弥补姿态遮挡人脸中的不可见部分;另一方面将Gabor遮挡字典与传统人脸识别过程相结合,利用Gabor遮挡字典重构因物理遮挡导致的噪声特征,增加对遮挡人脸识别的精度;
针对不同姿态引起的自遮挡问题,采用MPFR模型重建正面人脸,在一定程度上补偿了面部特征的丢失,针对信息丢失的问题,GODL结合噪声项特征对人脸上丢失的信息进行重建,使受损图像更好地通过噪声项字典和训练字典进行重建。
附图说明
图1是本发明人脸重构和Gabor遮挡字典的人脸识别方法的框架图;
图2是多角度人脸重构网络框架;
图3是λadv=0时,生成器和判别器的迭代的关系图;
图4是λadv=5时,生成器和判别器的迭代的关系图;
图5是AR数据集下有遮挡人脸的测试结果;
图6是λide=5的训练结果。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,此图为简化的示意图,仅以示意方式说明本发明的基本结构,因此其仅显示与本发明有关的构成。
如图1是基于人脸重构和Gabor遮挡字典的人脸识别方法的框架图,一种基于人脸重构和Gabor遮挡字典的人脸识别方法包括以下步骤:
S1、图像处理:
首先进行多角度人脸重构,每个个体各个角度的人脸按照角度分类,分类后的数据划分训练集和测试集训练多角度人脸重构网络,生成正面人脸信息,然后正面人脸信息,经过mtcnn人脸对齐和裁剪,用于后续的人脸识别步骤;
S2、求解Gabor遮挡字典:
在基于稀疏表达的人脸识别(SRC)中,测试样本y可以由训练样本A的线性组合求得,当出现遮挡或信息损失的样本,将样本分为完整的样本与噪声或遮挡信息两部分组成,引入遮挡字典Ae与训练数据A共同对测试样本编码;可以表示为:
y=Ax0+e0=[A,Ae][x0,xe]T (1)
e0表示样本噪声的误差向量,Ae为单位矩阵、Fourier基[2]等;提取对应的gabor特征χ(y)、χ(Ae),χ(A),求得的Gabor特征测试样本χ(y),对应的Gabor遮挡字典χ(Ae)、训练样本χ(A)重构如下:
χ(y)=[χ(A),χ(Ae)][x0,xe]T (2)
由于Gabor遮挡字典求解过程中的代价太大,需要对其进行压缩,并对提取的Gabor特征进行了下采样,为了进一步得到一个紧凑且更有表达力的字典,对Gabor遮挡字典进行优化,具体求解如下
Figure BDA0003528101620000081
公式(3)是Gabor遮挡字典和矩阵Z的联合优化问题,与许多多变量优化问题一样,本发明通过交替优化Γ和Z来解决公式(3);
S3、求解训练数据字典:增强字典对样本的表达能力,保证字典的全局重构性、局部重构性、重构的唯一性,同时提取更深层次的特征,结合Fisher判别准则与对字典判别力的定义,重定义字典的求解公式:
Figure BDA0003528101620000091
其中,
Figure BDA0003528101620000092
D表示全局字典,Di表示第i类局部字典,χ(Ai)表示第i类训练样本,Xi表示χ(Ai)在D上的表示矩阵,
Figure BDA0003528101620000093
表示χ(Ai)在Di上的表示矩阵,
Figure BDA0003528101620000094
表示χ(Ai)在Dj上的表示矩阵,X表示χ(A)在D上的表示矩阵;
Figure BDA0003528101620000095
表示类内距离,
Figure BDA0003528101620000096
表示类间距离,mi是Xi的均值向量,m是X的均值向量,ni是第i类训练样本的数量;
字典原子初始化过程,将每个字典的所有原子初始化为具有单位L2范数的随机向量,公式(4)是字典矩阵D和矩阵X的联合优化问题;根据迭代投影法(IPM)可用于求解矩阵X,根据MFL(Meta-Face Learning)中的求解算法,求解出字典D。
S4、求解稀疏矩阵:本发明使用L2范数对编码系数进行正则化,通过正则化可以使表示更稳定,此外,正则化使表示系数更小,增加表征系数的分辨力,有利于最终的人脸识别。
S5、计算重构误差:根据上一步求解的字典D和Gabor遮挡字典Γ对应的稀疏编码矩阵,重构测试样本,由公式(6)得到重构误差矩阵;
S6、标签分类:根据重构误差矩阵,由公式(7)求得重构测试样本最小误差对应的类别。
进一步的,所述人脸识别步骤中多角度人脸重构具体步骤包括:
S11、数据预处理:使用CAS-PEAL亚洲人脸数据库训练MPFR网络,选取936个人作为MPFR网络训练和测试,其中不同角度变化的人脸图片,包含0°,+15°,+30°,+45°,-15°,-30°,-45°七个角度变化,研究具有人脸遮挡和角度变化数据的人脸识别问题,与经典人脸识别算法的实验结果对比,展示加入Gabor遮挡字典的GODL提高人脸识别结果的有效性。
S12、训练网络设计:设定训练图片为w×h×c=128×128×3(长×宽×通道数),对输入图片首先进行下采样,经过四层卷积网络,第一层输入图片为128×128×3,
经过四层卷积网络的输出:128×128×64→64×64×128→32×32×256→16×16×512,每一层卷积操作都使用ReLU作激活函数,InstanceNorm做通道内归一化;四层卷积网络之后,经过一定层的残差网络,进行四层上采样,输出的w,h不断增加,通道数减少,最终生成一张目标人脸;四层网络输出:32×32×256→64×64×128→128×128×64→128×128×3;判别网络对的图片做下采样,进行了六层卷积网络,其中每一层采用ReLU激活函数。
MPFR模型主要用于解决不同姿势的人脸重建问题,MPFR模型框架如图2所示,该网络由一个发生器和一个鉴别器组成,生成器将输入文件图像重建为正面视图,鉴别器判断正面图像和文件图像的真实性,其中文件图像由生成器生成,鉴别器还为文件图像和正面视图生成角度标签损失和身份标签损失。
S13、损失函数设计:设计网络基本对抗损失参数λadv=1,标签损失参数λlbe=1,循环一致性损失λcon=10,对称损失λsym=10;通过实验效果对比,身份损失参数λide=5或7时,能达到比较好的效果;如图6显示的结果就是在λide=5的训练结果,图3是λadv=0时,生成器和判别器的迭代的关系图;图4是λadv=5时,生成器和判别器的迭代的关系图;
验证GODL算法在遮挡人脸识别中的性能;本发明选择四个具有不同训练和测试数据的实验装置;在AR数据库上的实验设置细节如下:G1包括4幅有表情变化的图像作为训练集,13幅有物理遮挡的图像作为测试集,训练集不可避免地包含照明变化;G2包括4幅光照变化的图像作为训练集,测试集还选择了13幅遮挡图像;G3包括4张具有不同物理遮挡(围巾和眼镜)的图像作为训练集,13张没有遮挡的图像作为测试集;G4包括4张有遮挡和光照变化的图像作为训练集,13张没有遮挡的图像作为测试集;训练集还包括照明变化;图5显示了不同算法在G1~G4实验设置下的实验结果。
时间复杂度测试:本发明将GODL算法与经典字典学习算法(如FDDL、LRSDL等)的计算复杂度进行比较;算法的复杂性估计为一次迭代所需的近似乘法次数;为简单起见,假设每个类的训练样本数与Gabor遮挡词典的训练样本数一致;同一实验条件下,列出具体训练测试时间结果如下表所示:
表1AR数据集上训练、测试实验时间成本(上)
Figure BDA0003528101620000111
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改;本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (5)

1.一种基于人脸重构和Gabor遮挡字典的人脸识别方法,其特征在于,包括以下步骤:
S1、图像处理:首先进行多角度人脸重构,每个个体各个角度的人脸按照角度分类,分类后的数据划分训练集和测试集,训练多角度人脸重构网络,生成正面人脸信息,再经过mtcnn人脸对齐和裁剪;
S2、求解Gabor遮挡字典:
基于SRC,将测试样本y分为完整的样本与噪声或遮挡信息样本,引入遮挡字典Ae与训练数据A共同对测试样本编码,表示为:
y=Ax0+e0=[A,Ae][x0,xe]T (1)
其中,e0表示样本噪声的误差向量,x0、xe分别是与训练数据A、遮挡字典Ae对应的稀疏矩阵,Ae为单位矩阵;
提取gabor特征χ(y)、χ(Ae),χ(A),求得的Gabor特征测试样本χ(y),对应的Gabor遮挡字典χ(Ae)和训练样本χ(A)的重构如下:
χ(y)=[χ(A),χ(Ae)][x0,xe]T (2)
其中,x0、xe分别是与训练数据A、遮挡字典Ae对应的稀疏矩阵;
对χ(Ae)进行压缩,对提取的Gabor特征进行下采样,并对Gabor遮挡字典进行优化;
S3、求解训练数据字典:增强字典对样本的表达能力,保证字典的全局重构性、局部重构性、重构的唯一性,同时提取更深层次的特征,结合Fisher判别准则与对字典判别力的定义,重定义字典的求解公式:
Figure FDA0003528101610000011
其中,
Figure FDA0003528101610000012
D表示全局字典,Di表示第i类局部字典,χ(Ai)表示第i类训练样本,Xi表示χ(Ai)在D上的表示矩阵,
Figure FDA0003528101610000021
表示χ(Ai)在Di上的表示矩阵,
Figure FDA0003528101610000022
表示χ(Ai)在Dj上的表示矩阵,X表示χ(A)在D上的表示矩阵,
Figure FDA0003528101610000023
表示类内距离,
Figure FDA0003528101610000024
表示类间距离,mi是Xi的均值向量,m是X的均值向量,ni是第i类训练样本的数量;
根据迭代投影法求解矩阵X,根据MFL中的求解算法,求解出字典D;
S4、求解稀疏矩阵:利用SRC人脸分类思想,用求解出的字典D重构测试样本,求解测试样本在字典中的稀疏编码:
Figure FDA0003528101610000025
其中,α、βΓ为稀疏矩阵,D为全局字典、Γ为压缩字典;
S5、计算重构误差:根据字典D和Gabor遮挡字典Γ对应的稀疏编码矩阵重构测试样本,重构误差矩阵进行样本分类,重构误差矩阵公式为:
Figure FDA0003528101610000026
其中,α、βΓ的近似解
Figure FDA0003528101610000027
用于求解重构误差ei
S6、标签分类:由重构误差得到测试样本的标签分类:
identify(y)=arg mini{ei} (7)
其中,identify(y)为重构测试样本最小误差对应的类别。
2.根据权利要求1所述的基于人脸重构和Gabor遮挡字典的人脸识别方法,其特征在于,所述Gabor遮挡字典χ(Ae)的公式如下:
Figure FDA0003528101610000028
其中,Γ表示压缩后的字典,Z是χ(Ae)在字典Γ上的表示矩阵。
3.根据权利要求1所述的基于人脸重构和Gabor遮挡字典的人脸识别方法,所述多角度人脸重构包括如下步骤:
S11、数据预处理:对人脸数据集中个体的每个图像进行人脸对齐,调整图像中的人脸位置,舍弃无用的背景信息;
S12、训练网络设计:多角度人脸重构网络由一个生成器和一个判别器组成;生成器输入和输出的图片w×h×c=128×128×3,经过四层进行下采样和上采样卷积网络;
S13、损失函数设计:整个网络训练过程中,判别网络、生成网络联合训练最小化两个网络损失,LD为D网络的总损失函数、LG为G网络的总损失函数,具体设计如下:
Figure FDA0003528101610000031
其中,Ladv为对抗损失、Lrlbe为标签损失、Ldide为身份损失、Lflbe为标签损失、Lgide为身份损失、Lcon为共循环一致性损失、Lsym为对称损失。
4.根据权利要求3所述的基于人脸重构和Gabor遮挡字典的人脸识别方法,其特征在于,所述Ladv的定义如下:
Ladv=Ex[logDdis(x)]+Ex,l′[1-log(Ddis(G(x,l′)))] (9)
其中,输入图像x与其对应的标签l组成图片对(x,l),l′是生成器训练的目标标签,从而生成器训练目标为G(x,l′)→y;G(x,l′)→y表示输入侧面图片x和目标正面人脸的标签l′,最终生成正面人脸y,Ddis为图片真假判别标签的概率分布。
5.根据权利要求3所述的基于人脸重构和Gabor遮挡字典的人脸识别方法,其特征在于,所述Lrlbe的定义如下:
Lrlbe=Ex,l[-logDlbe(l|x)] (10)
其中,Ddis为图片域标签的概率分布;
域标签损失加入到训练生成器的损失函数中,所述Lflbe的定义如下:
Lflbe=Ex,l′[-logDlbe(l′|G(x,l′))] (11)
每一张图片都有与之对应的域标签,使得只用一个生成器的同时,保证生成图像的多样性,与身份损失相结合,保证生成图像的唯一性,保持身份特征,所述Lgide和所述Ldide的具体定义分别为:
Lgide=-dist(Dfea(xF)-Dfea(G(xP,l0)))+dist(Dfea(xF)-Dfea(xP)) (12)
Ldide=dist(Dfea(xF)-Dfea(G(xP,l0))) (13)
其中,xF、xP表示同一个人的正面、非正面图像,l0表示正面图像的域标签,dist表示求解向量距离;
加入循环一致性损失,训练网络得到目标角度的人脸,同时保持原来人脸的面部细节,对称损失是针对生成的正面人脸视图,一定程度上能优化最终生成的正面人脸效果,所述Lcon和所述Lsym具体定义如下:
Lcon=Ex,l,l′[||x-G(G(x,l′),l)||1] (14)
Figure FDA0003528101610000041
其中w、h表示图像的宽和高,a、b表示图像某一像素点的坐标;将G(xP,l0)的结果表示为xpred;假设人脸左右对称,
Figure FDA0003528101610000042
则表示由生成器生成的正面视图中的某一像素点,
Figure FDA0003528101610000043
则表示与
Figure FDA0003528101610000044
对称的像素点。
CN202210202974.2A 2022-03-02 2022-03-02 一种基于人脸重构和Gabor遮挡字典的人脸识别方法 Withdrawn CN114627531A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210202974.2A CN114627531A (zh) 2022-03-02 2022-03-02 一种基于人脸重构和Gabor遮挡字典的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210202974.2A CN114627531A (zh) 2022-03-02 2022-03-02 一种基于人脸重构和Gabor遮挡字典的人脸识别方法

Publications (1)

Publication Number Publication Date
CN114627531A true CN114627531A (zh) 2022-06-14

Family

ID=81899706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210202974.2A Withdrawn CN114627531A (zh) 2022-03-02 2022-03-02 一种基于人脸重构和Gabor遮挡字典的人脸识别方法

Country Status (1)

Country Link
CN (1) CN114627531A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117292466A (zh) * 2023-10-17 2023-12-26 江苏新巢天诚智能技术有限公司 基于多模态计算机视觉与生物识别物联网解锁方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117292466A (zh) * 2023-10-17 2023-12-26 江苏新巢天诚智能技术有限公司 基于多模态计算机视觉与生物识别物联网解锁方法
CN117292466B (zh) * 2023-10-17 2024-05-17 江苏新巢天诚智能技术有限公司 基于多模态计算机视觉与生物识别物联网解锁方法

Similar Documents

Publication Publication Date Title
US11645835B2 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
Boughrara et al. Facial expression recognition based on a mlp neural network using constructive training algorithm
Wang et al. G2DeNet: Global Gaussian distribution embedding network and its application to visual recognition
Liu et al. Hard negative generation for identity-disentangled facial expression recognition
CN110348330B (zh) 基于vae-acgan的人脸姿态虚拟视图生成方法
Lee et al. Collaborative expression representation using peak expression and intra class variation face images for practical subject-independent emotion recognition in videos
Miao et al. Learning the lie groups of visual invariance
US11157721B2 (en) Facial image recognition using pseudo-images
CN112288011B (zh) 一种基于自注意力深度神经网络的图像匹配方法
Xie et al. Facial expression recognition based on shape and texture
Li et al. A comprehensive survey on 3D face recognition methods
CN111445548B (zh) 一种基于非配对图像的多视角人脸图像生成方法
WO1997044757A2 (en) Principal component analysis of image/control-point location coupling for the automatic location of control points
CN111210382B (zh) 图像处理方法、装置、计算机设备和存储介质
Haq et al. Boosting the face recognition performance of ensemble based LDA for pose, non-uniform illuminations, and low-resolution images
Zhang et al. Video-based action recognition using rate-invariant analysis of covariance trajectories
CN114627531A (zh) 一种基于人脸重构和Gabor遮挡字典的人脸识别方法
He et al. Multi-pose face reconstruction and Gabor-based dictionary learning for face recognition
Xin et al. Random part localization model for fine grained image classification
Qiu et al. Learning transformations for classification forests
Weiss et al. Representation of similarity as a goal of early visual processing
CN108734206B (zh) 一种基于深度参数学习的最大相关主成分分析方法
Wang et al. Spatial Variational Auto-Encoding via Matrix-Variate Normal Distributions
Bukar Automatic age progression and estimation from faces
Xie et al. Facial expression recognition based on multi branch structure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220614

WW01 Invention patent application withdrawn after publication