CN109857879B

CN109857879B - 一种基于gan的人脸检索方法

Info

Publication number: CN109857879B
Application number: CN201811566128.9A
Authority: CN
Inventors: 李越; 徐联伯
Original assignee: Hangzhou Eagle Zhida Technology Co ltd
Current assignee: Hangzhou Eagle Zhida Technology Co ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2021-04-30
Anticipated expiration: 2038-12-20
Also published as: CN109857879A

Abstract

本发明涉及一种基于GAN的人脸检索方法,包括：选择真实场景的模糊图片及模糊图片对应的身份证照片作为训练数据集；选择真实场景的不同数量的模糊照片作为不同的测试数据集；根据预训练的人脸识别网络模型分别提取模糊图片特征及模糊图片对应的身份证照片特征；计算测试数据集的人脸检索正确率并作为参考基准；将模糊图片输入到生成网络G并得到输出结果；将模糊图片输出结果的特征及模糊图片对应的身份证照片特征的余弦距离构成生成网络G的损失函数；用训练数据集对GAN生成式对抗网络模型进行训练；计算测试数据集在通过GAN生成式对抗网络模型处理之后的人脸检索正确率；根据参考基准优化GAN生成式对抗网络模型。

Description

一种基于GAN的人脸检索方法

技术领域

本发明涉及计算机视觉、图像处理领域，具体涉及一种基于GAN的人脸检索方法。

背景技术

人脸识别技术，是基于人的脸部特征信息进行身份识别的一种生物识别技术，现在这项技术已广泛用于政府、军队、银行、社会福利保障、电子商务、安全防务等领域。在安防领域，对于监控拍摄到的一些人，公安人员经常需要获取这些人的身份信息。这时，他们就会用拍摄到的某个人的照片和信息库中的身份证照片一一进行人脸比对，一般而言，比对结果中相似度分数最高的照片会被认为是这个人的身份证照片。

真实场景中，经常会因为人物运动或者摄像头失焦等原因导致拍摄到的照片具有一定程度的模糊，而目前对于模糊照片的检索结果往往不能令人满意。

发明内容

为了提升模糊照片的人脸检索正确率，本发明提供了一种基于GAN的人脸检索方法，包括：选择真实场景的模糊图片及模糊图片对应的身份证照片作为训练数据集；选择真实场景的不同数量的模糊照片作为不同的测试数据集；根据预训练的人脸识别网络模型分别提取模糊图片特征及模糊图片对应的身份证照片特征；计算测试数据集的人脸检索正确率并作为参考基准；将模糊图片输入到生成网络G并得到输出结果；将模糊图片输出结果的特征及模糊图片对应的身份证照片特征的余弦距离构成生成网络G的损失函数；用训练数据集对GAN生成式对抗网络模型进行训练；计算测试数据集在通过GAN生成式对抗网络模型处理之后的人脸检索正确率；根据参考基准优化GAN生成式对抗网络模型。

可选的，生成网络G的损失函数为：

Loss_G＝Loss_adv+λ₂Loss_per；

其中，

分别表示真实场景的模糊照片和其对应的身份证照片，fr(·)表示用预训练的人脸识别网络模型来提取照片的特征，cos(·,·)用来计算模糊图片特征和模糊图片对应的身份证照片特征的余弦距离。其中，G(·)表示一张图片经过生成网络G处理后得到的输出图片，D(·)表示一张图片经过判别网络D得到的结果；

表示计算随机变量f(x)的期望，其中随机变量x服从分布P_x。

可选的，判别网络D的损失函数为：

其中，

表示对以x为自变量的函数f计算关于x的梯度，||·||₂表示计算一个矩阵的2-范数。

为了提升模糊人脸的检索正确率，最直观的想法就是提升模糊照片和其身份证照片之间的相似度分数，而相似度分数实质上是两张照片的特征之间的余弦距离。因此，需要训练一个神经网络对模糊照片进行处理，使得处理之后的照片的特征和其身份证照片的特征之间的余弦距离更大。

本发明采用生成对抗网络GAN模型，并直接建立模糊照片和其身份证照片之间的联系。对于人脸照片，要用预训练的神经网络来提取特征，所以，本发明采用预训练的神经网络分别提取生成照片和其身份证照片的特征，并用特征之间的余弦距离构成生成网络G的损失函数，针对这个损失函数进行优化，就是在不断地增大生成照片和身份证照片的特征的余弦距离，从而实现了模糊人脸的检索正确率的不断提升。

附图说明

图1为本发明实施例的一种基于GAN的人脸检索方法的流程示意图。

图2为本发明实施例的GAN生成式对抗网络模型的结构。

图3为本发明实施例的生成网络G和判别网络D的训练流程。

具体实施方式

下面结合实施例对本发明做进一步描述。

如图1所示，本发明实施例的一种基于GAN的人脸检索方法，包括以下步骤：

S01，选择真实场景的模糊图片及模糊图片对应的身份证照片作为训练数据集；

具体的，准备真实场景的模糊图片和其对应的身份证照片作为训练数据集。

S03，选择真实场景的不同数量的模糊照片作为不同的测试数据集；

真实场景的不同数量的模糊照片作为不同的测试数据集，测试数据集中的人脸和10w张其它人脸的身份证照片作为身份证图像库

具体的，挑选同一真实场景的不同数量的模糊照片来组成不同大小的测试数据集，例如200张，400张，800张等。

S05，根据预训练的人脸识别网络模型分别提取模糊图片特征及模糊图片对应的身份证照片特征；

具体的，要对哪个真实场景的模糊照片进行处理，就选择用哪个场景下的照片进行训练的人脸识别网络模型。这个场景一般指人脸的特性，比如黄种人、白种人、黑种人，也可根据不同的情况做其它的分类。本发明提供的是一种算法思路，具体的人脸识别网络模型可以根据要处理的照片来选择，本发明中使用的人脸识别网络模型可以是已发表的论文中的DeepID2网络模型，论文获取地址：

https://www.semanticscholar.org/paper/Deep-Learning-Face-Representation-by-Joint-Sun-Wang/41951953579a0e3620f0235e5fcb80b930e6eee3/pdf。

S07，计算测试数据集的人脸检索正确率并作为参考基准；

具体而言，在用GAN生成式对抗网络模型处理之前，计算测试数据集的人脸检索正确率并作为参考基准。具体的，下面给出计算测试数据集的人脸检索正确率的伪代码：

其中，X表示模糊照片组成的测试集，m为照片数量。Y表示身份证照片组成的身份证图像库，n为身份证照片数量。ID(·)表示获取一张照片的身份信息的函数(这只是一种抽象的符号记法，一般而言，作为算法的测试图片，模糊照片和身份证照片都会附带身份信息)。f₁和f₂分别表示第i张模糊图片和第j张身份证照片的特征。count用于统计正确检索的模糊照片数量，index用于记录相似度分数最高的照片，precision表示测试数据集的人脸检索正确率。

S09，将模糊图片输入到生成网络G并得到输出结果；

具体的，将测试数据集输入GAN生成式对抗网络模型的生成网络G，并将输出结果输入到预训练的人脸识别网络模型中提取特征。实际上，神经网络就是一个函数映射，而每一张图片在计算机中就是一个高维数组，用神经网络对照片进行处理，本质上就是以高维数组作为函数的输入，然后计算得到函数值，只不过这里的函数表达比较复杂而已。从这个角度去理解，用GAN对模糊照片进行处理，就是将一个高维数组(照片)映射成为一个新的高维数组(照片)。而用预训练神经网络来提取特征，一般来说，是将一个高维数组(照片)映射成为一个1维的向量(特征)。如用前面介绍的DeepID2网络模型来提取图片特征的过程，就是以照片作为预训练神经网络的输入，以最后一层网络映射作为输出特征。

S11，将模糊图片输出结果的特征及模糊图片对应的身份证照片特征的余弦距离构成生成网络G的损失函数；

S13，用训练数据集对GAN生成式对抗网络模型进行训练；

S15，计算测试数据集在通过GAN生成式对抗网络模型处理之后的人脸检索正确率；

S17，根据参考基准优化GAN生成式对抗网络模型。

具体的，计算不同的测试数据集在用GAN处理之后的人脸检索正确率，并和参考基准进行比较，依据比较结果，重复S09-S15的过程。

具体的，参考基准只是用来衡量GAN生成式对抗网络训练好坏的一个参考标准，只有当测试数据集在通过GAN生成式对抗网络模型处理之后的人脸检索正确率大于参考基准时才能认为GAN生成式对抗网络训练的好。实际上是根据G和D的损失函数的结果对GAN生成式对抗网络模型进行优化，优化策略就是经常用到的一些方法，包括改变网络的层数，学习率，损失函数的权重系数等等。进一步的，生成网络G的损失函数为：

Loss_G＝Loss_adv+λ₂Loss_per

其中，

表示计算随机变量f(x)的期望，其中随机变量x服从分布P_x。

进一步的，判别网络D的损失函数为：

其中，

表示对以x为自变量的函数f计算关于x的梯度，||·||₂表示计算一个矩阵的2-范数。训练过程中，令λ₁＝10，λ₂＝1。

根据附图2，GAN生成式对抗网络模型包括生成网络模型G和判别网络模型D，网络结构分别如下：

Conv表示卷积层，BN表示BatchNorm层，ReLU表示ReLU激活函数。k3n64s1表示卷积层的卷积核大小为3*3，卷积之后feature map的数量为64，卷积步长为1，其它类似表示含义同此。

下面结合附图3生成网络G和判别网络D的训练流程及伪代码详细说明本发明GAN生成式对抗网络模型的训练过程；

训练过程的伪代码如下：

在训练过程中，为了能够计算Loss_per，

和

必须是一一对应的，epoch表示最大迭代步数，m表示一个bath的大小，α，β₁，β₂表示Adam算法的一些参数。Adam算法是现有深度学习网络优化中的一种常用算法。流程1用来训练D，G的权重参数不变，对应伪代码的3-7行，流程2用来训练G，D的权重参数不变，对应伪代码的8-13行，流程1和流程2交替进行。

本发明中所描述的具体实施例仅仅是对本发明精神作举例说明，本领域普通技术人员可以理解本发明实施例中的相应步骤顺序在不冲突的情况下可以相互替换，本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书的保护范围。