CN108121975B

CN108121975B - 一种联合原始数据和生成数据的人脸识别方法

Info

Publication number: CN108121975B
Application number: CN201810007534.5A
Authority: CN
Inventors: 许浩
Original assignee: Casht Investment Holding Co ltd
Current assignee: Casht Investment Holding Co ltd
Priority date: 2018-01-04
Filing date: 2018-01-04
Publication date: 2022-04-19
Anticipated expiration: 2038-01-04
Also published as: CN108121975A

Abstract

本发明提供了一种通过小规模人脸数据集训练卷积神经网络的方法，其特征在于，包括步骤：步骤1：使用原始标注的人脸样本集训练卷积神经网络VGG人脸识别模型；步骤2：构造深度卷积生成对抗网络DCGAN模型，使用原始标注的人脸样本集训练深度卷积生成对抗网络；步骤3：通过DCGAN生成无标签的人脸样本集；步骤4：对DCGAN生成人脸数据集标注；步骤5：使用原始标注的人脸样本集训练即插即用生成网络PPGN；步骤6：通过PPGN生成带有标签的人脸样本集；步骤7：联合DCGAN、PPGN生成的样本集和原始标注的样本集训练卷积神经网络；步骤8：重复训练，即重复步骤4，5，6，7多次；步骤9，使用原始标注的人脸样本集微调VGG网络。

Description

一种联合原始数据和生成数据的人脸识别方法

技术领域

本发明涉及生物特征识别领域，具体涉及一种同时利用原始的标注数据和生成对抗网络生成数据训练人脸识别神经网络的方法。

背景技术

人脸识别是基于人的脸部特征信息进行身份识别的技术，因其具有自然性，非强制性和非接触性等优势成为计算机视觉热门研究领域。人脸识别的关键技术是有效地对人脸图像进行特征表达，而传统的SIFT,HOG等人工选取特征不足以捕获人脸的本质特征。近年来深度学习方法的成功应用到人脸识别领域，通过构建深度神经网络拟合人脸图像，获取人脸图像特征的本质表达，提高人脸的识别精度。比较成功的案例包括DeepFace,DeepID,FaceNet和VGGFace，达到了人眼的辨识水平。

然而深度学习方法最大的问题是网络参数过多，需要大规模的数据标注才能实现训练，往往所需要数据达百万以上，如FaceNet使用了超大规模的800万人，共2亿幅图像。而进行大规模人脸数据采集和标注是一种较大的人力财力的消耗。

为了获取廉价和充分的数据样本，来辅助神经网络的训练。Ian Goodfellow等提出的生成对抗网络(GAN)的基本的思想通过训练库学习这些训练案例生成的概率分布，从而采样生成更多的样本数据；深度卷积生成对抗网络(DCGAN)引用卷积神经网络，拓展了GAN在图像生成领域的应用；NIPS2016发布的即插即用生成网络(PPGN) 可以生成指定类别的图像，生成的图像同类差异化大并且清楚分辨率高，可用于大规模神经网络的训练。

本发明提供一种半监督的深度神经网络训练方法，通过较小规模的标注好的人脸图像训练对抗生成网络；采用对抗生成网络生成的大规模的廉价的人脸数据集；联合生成的数据和原始的标注人脸数据集共同训练深度卷积神经并应用于人脸识别。

发明内容

本发明的目的在于降低人脸数据标注的标注量，提出一种通过小规模人脸数据集训练卷积神经网络的方法，其特征在于，包括步骤：步骤1：使用原始标注的人脸样本集训练卷积神经网络VGG人脸识别模型；步骤2：构造深度卷积生成对抗网络DCGAN模型，使用原始标注的人脸样本集训练深度卷积生成对抗网络；步骤3：通过 DCGAN生成无标签的人脸样本集；步骤4：对DCGAN生成人脸数据集标注；步骤5：使用原始标注的人脸样本集训练即插即用生成网络PPGN；步骤6：通过PPGN生成带有标签的人脸样本集；步骤7：联合DCGAN、PPGN生成的样本集和原始标注的样本集训练卷积神经网络；步骤8：重复训练，即重复步骤4，5，6，7多次；步骤9，使用原始标注的人脸样本集微调VGG网络。

优选地，所述步骤4中对DCGAN生成人脸数据集标注的具体方法包括以下步骤：

步骤401，使用当前训练的卷积神经网络模型提取DCGAN生成数据集所有样本的特征；

步骤402，将特征排列成一个K×N的矩阵Y，采用稀疏编程SC 模型训练字典D，稀疏编程模型为：

其中||*||₁表示L1范数，K为特征维度，N为样本数量，D为字典， Z为稀疏表示的系数；

步骤403，将DCGAN生成的样本集和原始样本集的特征进行稀疏表示；通过查找DCGAN生成样本s_i的特征y_i的稀疏表示系数z_i在原始标注样本集中的最近邻，设定样本s_i的标签。

优选地，所述步骤8中重复训练时步骤5中PPGN训练可在原有训练基础上微调。

附图说明

为了更清楚的说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1示出了根据本发明的卷积神经网络训练的流程图。

图2示出了深度卷积生成对抗网络结构图。

图3示出了即插即用生成网络模型图。

图4示出了即插即用生成网络图像生成过程。

具体实施方式

通过参考示范性实施例，本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而，本发明并不受限于以下所公开的示范性实施例；可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。

在下文中，将参考附图描述本发明的实施例。在附图中，相同的附图标记代表相同或类似的部件，或者相同或类似的步骤。

步骤101，训练卷积神经网络VGG人脸识别模型。本发明的人脸识图网络采用VGGface网络，训练时采用softmax loss和triplet loss损失函数，采用人脸样本集S₀训练。

步骤102，使用人脸样本集S₀训练DCGAN。DCGAN分成生成模型和判别模型两部分构成,网络构建参考论文"Unsupervised Representations Learning With DeepConvolutional Generative Adversarial Networks"。如图2，对于生成模型，最开始将100维的随机向量线性拓展成4×4×1024的张量，然后通过4个微步幅卷积层,卷积核大小均为5×5，最终输出个64×64×3的RGB图像。判别模型是一个没有pooling层的全卷积网络，最终输出一个标量，表示输入数据属于原始数据而非生成样本的概率。使用人脸样本集S₀交叉训练优化生成模型和判别模型。

步骤103，随机取100维数据输入深度卷积生成对抗网络的生成模型中，生成无标签的人脸数据集S₁；

步骤104，对人脸数据集S₁标注，具体方法包括：

步骤401，使用当前训练的VGG卷积神经网络模型提取数据集S₁所有样本fc7层特征。

步骤402，将特征排列成一个K×N的矩阵Y，采用稀疏编程(SC) 方法，训练字典D方法，实行特征Y的稀疏表示。稀疏表示字典训练模型为：

其中||*||₁表示L1范数，D为字典，Z为稀疏表示的系数。

步骤403，通过查找样本s_i的特征y_i的稀疏表示系数z_i在样本S₀中的最近邻，设定样本s_i的标签。

步骤105，使用获取标注的人脸样本S₀训练即插即用生成网络 (PPGN)。即插即用生成网络模型参考“Plug&Play Generative Networks:Conditional IterativeGeneration of Images in Latent Space”，如图3所示，PPGN包括3部分，生成模型G，分类模型C 和编码模型E。具体训练的步骤包括：

步骤501，分类模型和编码模型结构采用步骤1中的VGG网络，并与之共享每一层的参数。如图3，在本发明中将VGG网络分成E1,E2 和输出层，其中E1包括从输入层到pool5层中所有层，提取的特征为h1；E2包括fc6到fc7中所有层，提取的特征为h。使用VGG提取样本集S₀的fc7层特征h作为训练生成模型G时的输入。

步骤502，生成模型G是一个通过矢量特征重构原图像的神经网络。参考AlexeyDosovitskiy的论文“Inverting Visual Representations with ConvolutionalNetworks”，PPGN的生成模型采用Alxnet-Fc8的网络结构，具有3个全连接层和5个反卷积层。需要增加判断模型D为5个卷积层和3全连接层的Alexnet模型，设最终输出维度为1。参考Dosovitskiy A的论文“Generating Images with Perceptual Similarity Metricsbased on Deep Networks”训练生成模型G采用的损失函数L_G为。

L_G＝L_img+L_h+L_h1+L_GAN

其中

表示原图像的重构损失；

表示原图像与生成图像特征h的残差；

表示原图像与生成图像特征h1的残差；

表示生成对抗网络判别模型D的惩罚项。另外训练生成模型时，对模型D的训练，其损失函数为：

步骤106，输入人脸样本集S₀中的每个类别标签，即插即用生成网络使用对人脸样本集S₀分类网络生成带有标签的人脸样本S₂。如图 4所示，给定类标签，随机出使化图像x，通过迭代方法更新图像x。具体的迭代方法为：t时刻的图像x_t通过分类模型C预测类别，同时通过编码模型E1和E2生成h_t并经过生成模型G重构。通过类别差和重构残差更新得到x_t+1,为了增加生成图像的多样性，分别在x_t，h_t和 h1_t上添加噪声干扰。迭代公式如

其中R_x(x)表示生成模型对x的重构,y表示分类标签，p(y|x)为分类模型的概率表示，ε₁，ε₂为平衡因子，

为添加高斯噪声的方差。

步骤107，联合数据集S₀,S₁和S₂进一步训练卷积神经网络。

步骤108，重复步骤103，104，105，106，107多次。

步骤109，使用原始标注的人脸样本集微调VGG网络。

以上只是本发明较佳的实例，并非来限制本发明实施范围，故凡依本发明申请专利范围所述的构造、特征及原理所做的等效变化或修饰，均应包括于本发明专利申请范围内。

Claims

1.一种通过小规模人脸数据集训练卷积神经网络的方法，其特征在于，包括步骤：

步骤1：使用原始标注的人脸样本集训练卷积神经网络VGG人脸识别模型；

步骤2：构造深度卷积生成对抗网络DCGAN模型，使用原始标注的人脸样本集训练深度卷积生成对抗网络；

步骤3：通过DCGAN生成无标签的人脸样本集；

步骤4：对DCGAN生成人脸数据集标注；

步骤5：使用原始标注的人脸样本集训练即插即用生成网络PPGN；

步骤6：通过PPGN生成带有标签的人脸样本集；

步骤7：联合DCGAN、PPGN生成的样本集和原始标注的样本集训练卷积神经网络；

步骤8：重复训练，即重复步骤4，5，6，7多次；

步骤9：使用原始标注的人脸样本集微调VGG网络；

所述步骤4中对DCGAN生成人脸数据集标注的具体方法包括以下步骤：

步骤402，将特征排列成一个K×N的矩阵Y，采用稀疏编程SC模型训练字典D，稀疏编程模型为：

其中||*||₁表示L1范数，K为特征维度，N为样本数量，D为字典，Z为稀疏表示的系数；

2.如权利要求 1所述的方法，其特征在于：所述步骤8中重复训练时步骤5中PPGN训练可在原有训练基础上微调。