CN108710896B

CN108710896B - 基于产生式对抗学习网络的领域学习方法

Info

Publication number: CN108710896B
Application number: CN201810372016.3A
Authority: CN
Inventors: 高华; 陈胜勇
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2018-04-24
Filing date: 2018-04-24
Publication date: 2021-10-29
Anticipated expiration: 2038-04-24
Also published as: CN108710896A

Abstract

一种基于产生式对抗学习网络的领域学习方法，包括以下步骤：1)收集源域人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像；2)构建产生式神经网络G，输入输出为相同分辨率的人脸图像，其中输入为收集的特定应用场景人脸图像，输出为转换后的图像；3)构建分类神经网络D，运用卷积神经网络神经元，输入为产生式神经网络的输出图像和人脸分类器的训练图像，输出为两种输入图像的分类；4)采用异步方式迭代训练产生式神经网络G和分类神经网络D；5)在指定场景进行人脸识别时，先将输入人脸图像I进行转换G(I)，将转换后的人脸图像输入人脸识别模块得到人脸识别的结果。本发明对通用人脸识别器适应能力较强、数据成本较低。

Description

基于产生式对抗学习网络的领域学习方法

技术领域

本发明属于图像处理和模式识别技术领域，涉及一种基于产生式对抗学习网络的领域学习方法。

背景技术

跨域应用分类模型是限制模式识别应用的一个主要问题。在基于人脸识别技术的实际应用中，如人证比对、人脸考勤、金融认证等，由于人脸分类器的训练数据集与实际应用场景的图像质量存在差异，造成人脸识别技术在实际应用中效果变差。针对特定的应用场景，重新收集人脸图像并人工标注足够的数据耗时耗力，尤其是目前普遍采用基于深度学习的人脸识别方法对训练样本需求量大，重新收集人脸图像并人工标注方法成本极大。

目前已有一些领域学习方法，通过实现源域到目标域的转换，降低两者的差异，改善异质图像识别的效果：《领域自适应模式识别方法及系统》103729648A中，通过将源域样本表示为目标域样本的线性组合来将其转换到目标域上，然后利用转换后的样本训练监督模型，并利用训练好的监督模型来进行目标域上的模式识别；《一种利用对抗网络和三维形态模型的大幅度人脸摆正方法》CN201710428491可以处理非前向人脸尤其大幅度偏摆的人脸图，提供一个生成网络和形态模型进行人脸的摆正，首先生成器将一张非前向正脸的人脸图当作输入去产生一张正向前脸图，同时分类器试图去对这张图像进行判别是否真实图像，并且利用反馈的信息去促使生成器生成的图像更加接近真实图像，同时利用识别引擎进行输入图像原有身份特征的保留。

发明内容

为了克服已有技术的适应能力较差、数据成本较高的不足，本发明提供了一种适应能力较强、数据成本较低的基于产生式对抗学习网络的领域学习方法。

本发明解决其技术问题所采用的技术方案是：

一种基于产生式对抗学习网络的领域学习方法，所述方法包括以下步骤：

1)收集源域人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像；

2)构建产生式神经网络G，运用卷积神经网络神经元构建的神经网络为残差网络，输入输出为相同分辨率的人脸图像，其中输入为收集的特定应用场景人脸图像，输出为转换后的图像；

3)构建分类神经网络D，运用卷积神经网络神经元，输入为产生式神经网络的输出图像和人脸分类器的训练图像，输出为两种输入图像的分类；

4)采用异步方式迭代训练产生式神经网络G和分类神经网络D，产生式对抗网络模型的目标函数为：

其中，目标函数V(D，G)的值由网络产生式神经网络G和分类神经网络D决定，x～P_data表示样本x服从人脸分类器训练样本的样本分布P_data，z～P_z表示样本z服从指定应用场景的人脸图像分布P_z；D(x)表示输入x经过网络D后得出的输出，G(z)表示输入z经过网络G后得出的输出，E是数学期望运算符号；

限制产生式神经网络G对输入的改变量，改进后网络优化的目标函数为：

其中，α∈(0,1)是权重系数，F()是特征描述子，c∈(0,1)是阈值；

初始化产生式神经网络G和分类神经网络D的网络参数，利用反向传播算法交替寻找目标函数

和

的最优解，待网络收敛后得到产生式神经网络G的模型参数；

5)在指定场景进行人脸识别时，先将输入人脸图像I进行转换G(I)，将转换后的人脸图像输入人脸识别模块得到人脸识别的结果。

进一步，所述步骤1)中，抠出人脸图像后还对该图像进行旋转、缩放和色彩变换，增加样本的数量；并规范人脸图像样本的尺寸。

本发明收集指定应用场景的人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像，运用常用的卷积神经网络神经元和残差网络模型构建产生式神经网络G，要求网络不改变输入图像的分辨率和通道数。运用常用的卷积神经网络神经元构建分类神经网络D，对产生式神经网络G的输出图像和人脸分类器进行判别。改进目标函数，加入图像内容约束，保证产生式神经网络G的输入输出具有高相似性。初始化产生式神经网络G和分类神经网络D的网络参数，采用异步方式迭代学习网络G和D的模型参数。在指定场景进行人脸识别时，加入产生式神经网络G对图像转换预处理过程即可。

运用卷积神经网络实现人脸图像转换，只需要收集少量实际应用场景人脸数据，无需标注人脸ID，构建产生式对抗网络模型，无需假设源域与目标域之间的分布差异模型，通过端到端的学习产生源域到目标域的映射关系。在目标域进行人脸识别时，只需先将采集到的人脸图像经过转换，再进行人脸识别即可。本方法采用端到端的学习方法，可以在无需假设源域与目标域之间的分布差异模型的前提下有效消除两者的分布差异，对于提升目标域训练的分类模型在源域数据中应用十分有效。

本发明的有益效果主要表现在：本发明利用改进的产生式对抗网络模型学习源域到目标域的网络模型G。模型参数采用端到端的学习方式，无需假设源域和目标域的分布差异模型，适应能力更强；只需要收集少量实际应用场景人脸数据且无需标注，方法实现数据成本低；在网络的目标函数中加入图像内容约束，限制产生式网络G的输入输出的差异，保持图像在转移后应该具有与原始图像具有较高的相似性。

附图说明

图1是产生式网络模型G结构图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1，一种基于产生式对抗学习网络的领域学习方法，所述方法包括以下步骤：

1)收集源域人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像，不需要对不同人脸图像赋予不同的身份标签；

2)构建产生式神经网络G，运用常用的卷积神经网络神经元，如卷积、Skip层等，构建的神经网络为残差网络，输入输出为相同分辨率的人脸图像，其中输入为收集的特定应用场景人脸图像，输出为转换后的图像，如图1所示。

3)构建分类神经网络D，运用常用的卷积神经网络神经元，如卷积、池化、批规范化和全卷积等，输入为产生式神经网络的输出图像和人脸分类器的训练图像，输出为两种输入图像的分类。

其中，x表示人脸分类器的训练数据，z表示指定应用场景的人脸图像。

本发明限制产生式神经网络G对输入的改变量，使得输入图像z与输出图像G(z)的差异不会过大。

改进后网络优化的目标函数为：

其中，α∈(0,1)是权重系数，F()是特征描述子，c∈(0,1)是阈值。

和

的最优解，待网络收敛后得到产生式神经网络G的模型参数。

进一步，所述步骤1)中，抠出人脸图像后还对该图像进行旋转、缩放、色彩变换，增加样本的数量；并规范人脸图像样本的尺寸。

本实施例中，产生式神经网络G学习方案的过程如下：

1.收集源域的人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像，收集到的图像记为Si。

2.收集目标域的训练样本，如学术公开数据集等，记为Di。

3.将数据集Si和Di中的人脸图像进行旋转、缩放、色彩变换、水平镜像等操作，增加样本的数量，人脸图像样本通过缩放保持一致，处理后的数据集分别记为Si＇和Di＇。

4.构建产生式神经网络G，运用常用的卷积神经网络神经元，如卷积、Skip层等，构建的神经网络为残差网络，输入输出为相同分辨率的人脸图像，其中输入为收集的特定应用场景人脸图像，输出为转换后的图像，如图1所示。产生式神经网络G的输入为样本集Si＇，输出记为Dt＇。

5.构建分类神经网络D，运用常用的卷积神经网络神经元，如卷积、池化、批规范化和全卷积等，输入为产生式神经网络的输出图像和人脸分类器的训练图像，输出为两种输入图像的判别。分类网络D的输入为Dt＇和Di＇，该网络用于分类输入的来源为Dt＇或Di＇。

6.初始化产生式神经网络G和分类神经网络D的网络参数，采用异步方式迭代训练产生式神经网络G和分类神经网络D：当训练网络D时，固定网络G的参数，优化目标函数

当训练网络G时，固定网络D的参数，优化目标函数

其中x来自数据集Di＇，z来自数据集Dt＇，α∈(0,1)是权重系数，F()是特征描述子，取自网络D中的某一层特征图，c∈(0,1)是阈值。反向传播目标函数和交替进行，待网络收敛后得到产生式神经网络G的模型参数。

基于产生式神经网络G的人脸识别方案的过程如下：

1.采集指定应用场景的人脸图像集，用人脸检测器定位人脸位置并抠出人脸图像，将人脸图像I缩放为与产生式神经网络G学习方案中数据集Di＇中图像相同尺寸。

2.将人脸图像I输入到产生式神经网络G，输出变换后的人脸图像I＇＝G(I)。

3.将变换后的人脸图像I＇输入已有的通用人脸识别模型C得到该人的身份信息。

实施例：以人和身份证比对为例。

产生式神经网络G学习过程中：(1)收集1000张以上身份证件存储的人脸图像，去除图像边界，记为Si；(2)收集100000张以上人脸学术公开数据集，记为Di，并在该数据集上用Resnet50网络训练人脸分类器C，如果已有人脸分类器模型，收集1000张分类器的训练数据集即可，记为Di；(3)将数据集Si和Di中的人脸图像进行10°范围内的旋转、0.2范围内的缩放、用PCA进行色彩变换、水平镜像等操作，每张人脸图像生成10张扰动图像，缩放至100x100分辨率，处理后的数据集分别记为Si＇和Di＇；(4)用图1的网络结构作为产生式神经网络G，该网络输入和输出均为100x100的3通道图像，该网络由10层卷积和10层反卷积串联组成(Cov1+Cov2+Cov3+…+Cov10+DCov10+…DCov3+DCov2+DCov1)，每层卷积和反卷积后紧跟一层ReLU层，Conv2至Conv9分别与DConv2至Dconv9相连接，除DConv1的通道数为3外其他卷积层和反卷积层的通道数为64，所有反卷积层和卷积层不改变中间特征图的尺寸；(5)用Resnet50实现分类神经网络D，输入为Dt＇和Di＇，输出为输入的数据来源，Dt＇中图像的标签设置为0，Di＇中图像的标签设置为1；(6)初始化产生式神经网络G和分类神经网络D的网络参数，采用异步方式迭代训练产生式神经网络G和分类神经网络D：①固定网络G的参数，优化目标函数

训练网络D；②固定网络D的参数，优化目标函数

训练网络G；其中x来自数据集Di＇，z来自数据集Dt＇，α＝0.1，F()是分类神经网络D中Resnet50的pool5层特征图。步骤①和②交替进行，直至网络收敛，得到产生式神经网络G的模型参数。

基于产生式神经网络G的人脸识别过程中：(1)采集身份证件存储的人脸图像I_s，去除图像边界，缩放至100x100；(2)采集执政人人脸图像I_t，缩放至100x100；(3)将图像I_s输入到产生式神经网络G，输出变换后的人脸图像I_s＇＝G(I_s)，将I_s＇传入通用人脸识别器C，提取pool5层特征图向量化并进行二范数归一化得到Fs；(4)将I_t传入通用人脸识别器C，提取pool5层特征图向量化并进行二范数归一化得到Ft；(5)计算欧式距离d＝||Fs-Ft||,如果d<0.1则认为持证人与证件相符，否则认为不相符。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。

Claims

1.一种基于产生式对抗学习网络的领域学习方法，其特征在于，所述方法包括以下步骤：

和

的最优解，待网络收敛后得到产生式神经网络G的模型参数；

2.如权利要求1所述的基于产生式对抗学习网络的领域学习方法，其特征在于，所述步骤1)中，抠出人脸图像后还对该图像进行旋转、缩放和色彩变换，增加样本的数量；并规范人脸图像样本的尺寸。