WO2020168731A1

WO2020168731A1 - 一种基于生成对抗机制与注意力机制的标准人脸生成方法

Info

Publication number: WO2020168731A1
Application number: PCT/CN2019/112045
Authority: WO
Inventors: 谢巍; 余孝源; 潘春文; 吴伟林; 张浪文
Original assignee: 华南理工大学
Priority date: 2019-02-19
Filing date: 2019-10-18
Publication date: 2020-08-27
Also published as: CN109934116A; AU2019430859A1; AU2019430859B2; CN109934116B

Abstract

一种基于生成对抗机制与注意力机制的标准人脸生成方法，包括：数据集设计步骤，依据数据库相关标注数据，为一张人脸图像构建出具有多种非限制因素的人脸编码，以编码和人脸图像作为模型的输入；模型设计与训练步骤，利用生成对抗机制与注意力机制设计相应的网络结构，并利用所构建的数据对进行模型训练，进而获得网络模型权重；模型预测步骤，将获取的人脸图像通过模型进行预测。将深度学习网络技术应用到标准人脸生成，用来生成彩色的、正向的、以及正常光照下的标准人脸图像；用深度学习网络的方法，能够获得准确的标准正脸照，减少与单样本数据库中数据的匹配难度，为后续人脸的特征提取与单样本人脸识别打下坚实基础。

Description

一种基于生成对抗机制与注意力机制的标准人脸生成方法

技术领域

本发明涉及深度学习应用技术领域，具体涉及一种基于生成对抗机制与注意力机制的标准人脸生成方法。

背景技术

近年来视频监控在全国大中城市普及，并已广泛应用于社会治安防控体系建设中，并成为公安机关侦查破案的有力技术手段。特别是在群体事件、重特大案件及两抢案件中，视频监控录像中获取的证据线索对于案件的快速侦破起到关键作用。目前国内公安机关主要运用视频监控录像进行事后犯罪线索及犯罪证据查找，并通过对比对重点嫌疑人的人脸信息与公安局数据库中的人员信息，锁定嫌疑人的身份。但是，监控视频中的嫌疑人人脸信息会存在多种限制性因素,如表情信息干扰、姿态干扰或者拍摄光照的干扰。由于公安局数据库中的人员人脸信息图像大多只有单张证件照样本，而具有上述多种限制性因素干扰的人脸图像进行识别处理时，成功率受到很大的约束，往往容易造成漏检和错检等情况。

近年来，人工智能领域已经被提到国家重点建设的范围。这预示着人工智能与相关行业的结合是我国朝着智能化方向发展的必然趋势，对推动行业朝智能化、自动化方面发展具有重要意义。人工智能领域中最主要的是针对不同的行业任务，设计相应的深度学习网络模型。随着计算机算力的提高，网络训练的难度大大减低，网络预测精度也在不断提高。深度学习网络的基本特点是模型拟合能力强、信息量大和精度高，能够满足不同行业中不同需求。对于具有多种非限制性因素的人脸识别问题，其关键的问题是如何生成标准的正脸图像，以满足后续人脸图像特征提取与识别的需要。目前亟待针对这一问题，设计相应合理的深度学习网络框架，利用高性能的计算机处理能力对网络进行训练，进而可以生成较标准的正脸图像，提高人脸匹配的准确度，减少人脸识别时错检情况的发生。

发明内容

本发明的目的是为了解决现有技术中的上述缺陷，提供一种基于生成对抗机制与注意力机制的标准人脸生成方法，用深度学习网络框架设计相关模型，进而可以获得较为标准的正脸图像，为后续单样本数据库下的人脸识别打下坚实基础。

本发明的目的可以通过采取如下技术方案达到：

一种基于生成对抗机制与注意力机制的标准人脸生成方法，该生成方法包括：数据集设计步骤、模型设计与训练步骤以及模型预测步骤；数据集设计步骤主要是通过当前主流的RaFD数据集和IAIR人脸数据集，依据数据库相关标注数据，为每一张人脸图像构建出具有多种非限制因素的人脸编码，包括人脸表情因素、人脸姿态因素和拍摄光照因素等，以编码和人脸图像作为模型的输入；模型设计与训练步骤主要是利用生成对抗机制与注意力机制的相关原理，设计相应的网络结构，并利用所构建的数据对进行模型训练，进而获得网络模型权重；模型预测步骤主要是针对现实所获取的人脸图像，进行模型处理后，所预测的结果。

具体的，操作步骤如下：

S1、数据构建，采集RaFD人脸数据集和IAIR人脸数据集中人脸数据，为每一张人脸图像构建出具有多种非限制因素的人脸编码，然后对人脸数据进行分类，其中，非限制因素包括人脸表情因素、人脸姿态因素和拍摄光照因素，编码后的人脸图像构成信息单元U＝{L _u,E _u,A _u}，包括8位的光照编码L _u、8位的表情编码E _u以及19位的姿态编码A _u；

S2、建立基于生成对抗机制与注意力机制的网络模型，该网络模型包括三个子网络，分别对应生成标准人脸的图像生成器子网络、对生成结果进行判别的模型判别器子网络以及通过生成结果进行还原的图像还原子网络；首先，利用图像生成器子网络和注意力机制对输入的人脸图像进行标准脸生成；接着，利用模型判别器子网络，对生成的图像进行判别，最后，构建一个图像还原子网络，对生成图像进行还原，并将还原结果与输入图像进行比较，对网络模型进行优化约束；

S3、模型训练，利用步骤S1中所生成的图像单元，以具有多种非限制因素的图像为输入，优化图像生成器子网络、模型判别器子网络以及图像还原子网络的输出与标签相似度，实现基于生成对抗机制与注意力机制的网络模型的收敛；

S4、模型预测，提取实际图像中的人脸，作为模型的输入，通过控制统一信息单元，最后获得较为标准的正脸图像输出。

进一步地，步骤S1中，对人脸数据集中的人脸信息进行相应编码，并分为非限制因素的人脸图像和标准正面自然人脸图像两类；

步骤S1过程如下；

S11、人脸信息编码。针对数据集中的不同人脸数据，为每一张人脸图像构建出具有多种非限制因素的人脸编码，其中，非限制因素包括但不限于人脸表情因素、人脸姿态因素和拍摄光照因素等。

对人脸图像进行编码遵循的规律具体如下：

A)人脸表情因素分为八种情况，分别为开心、生气、悲伤、轻蔑、失望、害怕、惊讶以及自然，将人脸的表情编码为E _u＝(E _u1,E _u2,...,E _u8)，其中E _ul代表第l种表情，l＝0,1,2,…,8，其取值为[0,1]，E _u＝(0,0,...,1)表示为自然表情；

B)人脸光照因素分为八种情况，主要是正面光照、左侧光照、右侧光照以及这三种光照的组合，即正面光照、左侧光照、右侧光照、正左光照、正右光照、左右光照、无光照以及全光照，将人脸的光照信息编码为L _u＝(L _u1,L _u2,...,L _u8)，其中L _un代表第n种光照情形，n＝0,1,2,…,8,其取值为[0,1]，L _u＝(0,0,...,1)表示为正面光照图像信息；

C)人脸姿态因素分为19种情况，包括以10°为间隔的左侧脸9种姿态、以10°为间隔的右侧脸9种姿态、以及正脸姿态图像，即左侧90°、左侧80°、左侧70°、左侧60°、左侧50°、左侧40°、左侧30°、左侧20°、左侧10°、正脸、右侧10°、右侧20°、右侧30°、右侧40°、右侧50°、右侧60°、右侧70°、右侧80°、右侧90°，将人脸的姿态信息编码为A _u＝(A _u1,A _u2,...,A _um,...,A _u19)，其中A _um代表第m种人脸姿态，m＝0,1,2,…,19，其取值为[0,1]，A _u＝(0,0,...,1)表示为正面姿态信息。最终，将人脸信息编码整合为统一信息编码U＝{L _u,E _u,A _u}，其是一个35位的一维信息。

S12、人脸数据分类，将编码后的人脸数据分类为非限制因素的人脸图像和标准正面自然清晰人脸图像，具体如下：

将统一编码信息为U ₀＝(L _u(0,0,...,1),E _u(0,0,...,1),A _u(0,0,...,1),)的人脸图像作为标准正面自然清晰人脸图像，并以此作为模型的目标图像；其余的人脸图像作为非限制因素的人脸图像，并以此作为模型的输入图像。

进一步地，所述的步骤S2中，

假设输入的图像为Y，其对应的原始统一信息编码为U _y,生成的标准人脸图像为I _o，标准人脸图像I _o对应的统一信息编码

数据库中对应的标准人脸图像为I，标准人脸图像I对应的统一信息编码为U ₀。

在图像生成器子网络中，其输入的内容是图像Y与统一信息编码U ₀。本发明设计了两个编码解码器网络G _c和G _f，通过结合注意力机制，分别生成颜色信息掩码C和注意力掩码F；接着通过以下的合成机制，生成标准的人脸：

C＝G _c(Y,U ₀)，F＝G _f(Y,U ₀)

I _o＝(1-F)⊙C+F⊙Y

其中⊙表示矩阵的逐元素相乘的操作。

因此，编码解码器网络G _c主要关注的是人脸的颜色信息与纹理信息，编码解码器网络G _f主要关注的是人脸中需要变化的区域；

在模型判别器子网络中，其输入的内容是图像生成器子网络生成的图像I _o。类似的，本发明也设计了两个深度卷积网络:图像判别子网络D _I和信息编码判别子网络D _U，分别用于判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I的差异，以及生成的标准人脸图像I _o所对应的统一信息编码

与数据库中对应的标准人脸图像I所对应的统一信息编码U ₀之间的差异；

在图像还原子网络中，其输入的内容为生成的标准人脸图像I _o与输入图像Y对应的原始统一信息编码U _y。还原子网络与图像生成器子网络一致，其网络还原结果为

通过将还原结果与整体网络的输入图像Y进行比较，达到循环优化网络结果的目的。

进一步地，基于生成对抗机制与注意力机制的网络模型的处理流程如下：

首先，将输入图像Y和标准人脸图像I对应的统一信息编码U ₀输入到图像生成器子网络中，用于生成标准人脸图像I _o，其中图像生成器子网络融合了注意力机制；

接着，为了区分真实图像和生成图像，将生成的标准人脸图像I _o和数据库中对应的标准人脸图像I(即真实图像I)送入模型判别器子网络中图像判别子网络D _I进行判别，同时，将生成标准人脸图像I _o对应的统一信息编码

与数据库中标准人脸图像I对应的统一信息编码U ₀送入模型判别器子网络中信息编码判别子网络D _U进行判别，通过不断循环优化，使得图像生成器子网络和模型判别器子网络达到共同进步；

最后，为了实现循环优化网络模型的目的，本发明设计了一个图像还原子网络，将生成的标准人脸图像I _o进一步根据原始输入图像Y对应的原始统一信息编码U _y进行还原，并将还原结果与输入图像Y进行比较。整个网络通过不断优化相应的损失函数，实现对整体网络模型的收敛。最终实现人脸图像的非限制环境因素的去除。

进一步地，所述的步骤S3中模型训练通过优化损失函数，实现模型的收敛，其中，所述的损失函数设计过程具体如下：

1)优化判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I之间的差异：设置图像损失函数如下所示

其中H与W分别是输出的人脸图像的高度与宽度，D _I(I _o)与D _I(I)分别为图像判别子网络对图像I _o与I的评判结果；然后，考虑到梯度损失的有效性，在图像损失函数中加上基于梯度的惩罚项，能够提高收敛的效率和图像生成的质量，即图像损失函数设计为

其中

表示图像的梯度操作，λ _I为惩罚项权重；

2)优化条件式统一信息编码的差异：设置条件式表达损失函数，即判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I各自对应的统一信息编码

与U ₀之间的差异，因此，条件式表达损失函数设计如下：

其中N为输出的统一信息编码长度。然后，在条件式表达损失函数中，加上输入图像Y与对应的原始统一信息编码U _y,之间的映射关系，能够提高判别器的判别能力，因此，条件式表达损失函数设计为

U _y为输入图像Y对应的原始统一信息编码，U ₀为标准人脸图像I对应的统一信息编码，D _U(I _o)与D _U(Y)分别是信息编码判别子网络对图像I _o与Y的判别结果；

3)优化图像还原子网络的结果与原始输入图像之间的差异：通过输入生成器所生成的图像I _o与原始统一信息编码U _y进行还原，进而与原始输入图像Y进行比较。因此还原损失函数设计为

其中h与w表示图像的高度与宽度。

因此，整个网络的训练损失函数如下：

L＝L _I+L _U+L _r

通过优化该损失函数，实现网络模型的收敛，获得生成标准人脸的生成器结构与权重。

进一步地，针对步骤S4中实际人脸图像的生成，首先使用基于人脸HOG图像的人脸定位方法，获取实际图像中的人脸图像；然后，利用模型训练的生成器以及人工设置的统一信息编码，实现对实际图像中人脸的快速标准脸生成。此外，可以预见的，通过设置不同的统一信息编码，能够对人脸的其他结构进行改变，如控制其他表情，或者人脸姿态的进一步改变，这应该都是可行的。

本发明相对于现有技术具有如下的优点及效果：

本发明将深度学习网络技术应用到标准人脸的生成任务，用来生成彩色的、正向的、以及正常光照下的标准人脸图像；用深度学习网络的方法，能够获得准确的标准正脸照，减少与单样本数据库中数据的匹配难度，为后续人脸的特征提取与单样本人脸识别打下坚实基础。

附图说明

图1是本发明实施例中模型训练与模型运用流程图；

图2是本发明实施例中数据库的数据构建流程图；

图3是本发明实施例中网络模型整体设计图；

图4是本发明实施例中图像生成网络的具体结构图；

图5是本发明实施例中图像判别网络的具体结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例

本实施例公开了一种基于生成对抗机制与注意力机制的标准人脸生成方法，主要涉及如下几类技术：1)训练数据的设计：利用现有的数据集，设计统一信息编码；2)网络模型结构设计：以生成对抗网络框架和循环优化网络方法作为基本网络结构；3)标准人脸生成方法：在生成器中加入注意力机制，约束标准人脸的生成准确度。

本实施例基于TensorFlow框架和Pycharm开发环境：TensorFlow框架是基于python语言的开发架构，能够方便快捷地搭建合理的深度学习网络，同时具有很好的跨平台交互能力。TensorFlow提供了深度学习架构中的众多封装函数和各类图像处理函数的接口，包括了OpenCV相关的图像处理函数。TensorFlow框架同时能够使用GPU对模型进行训练和验证，提高了计算的效率。

在Windows平台或者Linux平台下的Pycharm开发环境成开发环境(IDE)，是目前深度学习网路设计与开发的首选之一。Pycharm为客户提供了新的模板、设计工具以及测试和调试工具，同时能够为客户提供直接调用远程服务器的接口。

本实施例公开的一种基于生成对抗机制与注意力机制的标准人脸生成方法，主要过程包括模型训练和模型运用两个阶段。

在模型训练阶段：首先，对现有人脸数据集进行处理，通过设计统一信息编码机制，生成符合模型训练的数据集；然后，利用具有高算力的云端服务器对网络模型进行训练，通过优化该损失函数，并调整网络模型参数，直至网络模型的收敛，获得生成标准人脸的生成器结构与权重。

在模型运用阶段：首先，利用HOG人脸图像处理方法，对实际画面进行提取获得实际人脸图像；接着，调用训练好网络模型，以具有非限制因素的人脸图像和设计的统一信息编码作为输入，进行标准人脸生成；最终获得彩色的、正面的人脸图像。

如图1为本实施例公开的一种基于生成对抗机制与注意力机制的标准人脸生成方法的流程图。具体步骤如下：

步骤一、由于目前的人脸数据库主要以识别任务为主，没有满足本发明所需的具有统一信息编码的人脸图像数据库，因此需要对现有的数据库进行整合，构建合适的数据库。

图2为数据库中人脸图像与统一信息编码的构建流程。

步骤二、附图3为网络模型的整体架构示意图。整个模型框架主要包含有三个子网络，分别对应生成标准人脸的图像生成器子网络、对生成结果进行判别的模型判别器子网络以及通过生成结果进行还原的图像还原子网络；其中图像生成器子网络与图像还原子网络之间进行参数共享，图像生成器子网络主要是结合注意力机制对人脸图像进行生成。附图4是图像生成器子网络的具体网络结构，附图5是模型判别器子网络的具体网络结构。

主要的参数如下：

1)图像生成器子网络与图像还原子网络的参数一致，又分别包含有两个生成器，分别是颜色信息生成器与注意力掩摸生成器，具体如下：

颜色信息生成器包含有8个卷积层和7个反卷积层，所有卷积层的卷积核大小为5，步长为1，最后生成3通道的颜色信息图像；

注意力掩摸生成器包含有8个卷积层和7个反卷积层，所有卷积层的卷积核大小为5步长为1，最后生成1通道的注意力掩摸。

2)模型判别器子网络包含两个部分，分别是信息编码判别子网络和图像判别子网络，具体如下：信息编码判别子网络包含有6个卷积层和1个全连接层，卷积层的卷积核大小为5，步长为1，最后生成长度为N的一维统一信息编码；图像判别子网络包含有6个卷积层，卷积核大小为5，步长为1。

步骤三、模型的训练是在高性能的GPU上进行的，具体的训练参数设计如下：可以使用Adam优化器，其参数设置为0.9/0.999；学习率的设置为0.0001；训练的epoch设置为100；训练的batch设置依据数据的训练样本而定。

步骤四、模型预测，提取实际图像中的人脸，作为模型的输入，通过控制统一信息单元，最后获得较为标准的正脸图像输出。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的生成方法包括下列步骤：

S1、数据构建，采集人脸数据，为每一张人脸图像构建出具有多种非限制因素的人脸编码，然后对人脸数据进行分类，其中，非限制因素包括人脸表情因素、人脸姿态因素和拍摄光照因素，编码后的人脸图像构成信息单元U＝{L _u,E _u,A _u}，包括8位的光照编码L _u、8位的表情编码E _u以及19位的姿态编码A _u；

S2、建立基于生成对抗机制与注意力机制的网络模型，该网络模型包括三个子网络，分别对应生成标准人脸的图像生成器子网络、对生成结果进行判别的模型判别器子网络以及通过生成结果进行还原的图像还原子网络；首先，利用图像生成器子网络和注意力机制对输入的人脸图像进行标准脸生成；接着，利用模型判别器子网络，对生成的图像进行判别，最后，构建一个图像还原子网络，对生成图像进行还原，并将还原结果与输入图像进行比较，对网络模型进行优化约束；

S3、模型训练，以信息单元U＝{L _u,E _u,A _u}作为输入，优化图像生成器子网络、模型判别器子网络以及图像还原子网络的输出与标签相似度，实现基于生成对抗机制与注意力机制的网络模型的收敛；

S4、模型预测，提取实际图像中的人脸图像，作为网络模型的输入，通过控制信息单元U，最后获得标准的正脸图像输出。
根据权利要求1所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，

所述的人脸表情因素分为八种情况，分别为开心、生气、悲伤、轻蔑、失望、害怕、惊讶以及自然，将人脸的表情编码为E _u＝(E _u1,E _u2,...,E _u8)，其中E _ul代表第l种表情，l＝0,1,2,…,8，其取值为[0,1]，E _u＝(0,0,...,1)表示为自然表情；

所述的人脸光照因素分为八种情况，分别为正面光照、左侧光照、右侧光照、正左光照、正右光照、左右光照、无光照以及全光照，将人脸的光照信息编码为L _u＝(L _u1,L _u2,...,L _u8)，其中L _un代表第n种光照情形，其取值为[0,1]，L _u＝(0,0,...,1)表示为全光照图像信息；

所述的人脸姿态因素分为19种情况，分别为左侧90°、左侧80°、左侧70°、左侧60°、左侧50°、左侧40°、左侧30°、左侧20°、左侧10°、正脸、右侧10°、右侧20°、右侧30°、右侧40°、右侧50°、右侧60°、右侧70°、右侧80°、右侧90°，将人脸的姿态信息编码为A _u＝(A _u1,A _u2,...,A _um,...,A _u19)，其中A _um代表第m种人脸姿态，m＝0,1,2,…,19，其取值为[0,1]，A _u＝(0,0,...,1)表示为正面姿态信息。
根据权利要求2所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的步骤S1中对人脸数据进行分类过程如下：将编码后的人脸数据分类为非限制因素的人脸图像和标准正面自然清晰人脸图像，其中，

将统一编码信息为U ₀＝(L _u(0,0,...,1),E _u(0,0,...,1),A _u(0,0,...,1),)的人脸图像作为标准正面自然清晰人脸图像，并以此作为模型的目标图像，其余的人脸图像作为非限制因素的人脸图像，并以此作为模型的输入图像。
根据权利要求1所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，

所述的图像生成器子网络，其输入是图像Y与标准人脸统一信息编码U ₀，图像生成器子网络包括两个编码解码器网络G _c和G _f，其中，编码解码器网络G _c关注人脸的颜色信息与纹理信息，编码解码器网络G _f关注人脸中需要变化的区域，通过结合注意力机制，分别生成颜色信息掩码C和注意力掩码F，接着通过以下的合成机制，生成标准的人脸：

C＝G _c(Y,U ₀)，F＝G _f(Y,U ₀)

I _o＝(1-F)⊙C+F⊙Y

其中⊙表示矩阵的逐元素相乘的操作；

所述的模型判别器子网络中，其输入是图像生成器子网络生成的图像I _o，模型判别器子网络包括两个深度卷积网络图像判别子网络D _I和信息编码判别子网络D _U，分别用于判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I的差异，以及生成的标准人脸图像I _o所对应的统一信息编码
与数据库中对应的标准人脸图像I所对应的统一信息编码U ₀之间的差异；

所述的图像还原子网络，其输入是生成的标准人脸图像I _o与输入图像Y对应的原始统一信息编码U _y，其输出为网络还原结果为
通过将还原结果
与整体网络的输入图像Y进行比较，实现循环优化网络结果。
根据权利要求4所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的步骤S2过程如下：

首先，将输入图像Y和标准人脸图像I对应的统一信息编码U ₀输入到融合注意力机制的图像生成器子网络中，用于生成标准人脸图像I _o；

接着，将生成的标准人脸图像I _o和数据库中对应的标准人脸图像I送入模型判别器子网络中深度卷积网络D _I进行判别，同时，将生成标准人脸图像I _o对应的统一信息编码
与数据库中标准人脸图像I对应的统一信息编码U ₀送入模型判别器子网络中深度卷积网络D _U进行判别，使得图像生成器子网络和模型判别器子网络同时实现优化；

最后，将生成的标准人脸图像I _o输入到图像还原子网络，根据原始输入图像Y对应的原始统一信息编码U _y进行还原，并将还原结果
与输入图像Y进行比较，通过不断优化相应的损失函数，实现基于生成对抗机制与注意力机制的网络模型的收敛。
根据权利要求1所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的步骤S3中模型训练通过优化损失函数，实现模型的收敛，其中，所述的损失函数设计过程如下：

优化判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I之间的差异：设置图像损失函数如下所示
其中H与W分别是输出的人脸图像的高度与宽度，D _I(I _o)与D _I(I)分别为图像判别子网络对图像I _o与I的评判结果；然后，考虑到梯度损失的有效性，在图像损失函数中加上基于梯度的惩罚项，即图像损失函数设计为
其中
表示图像的梯度操作，λ _I为惩罚项权重；

优化条件式统一信息编码的差异：设置条件式表达损失函数，即判别生成的标准人脸图像I _o与数据库中对应的标准人脸图像I各自对应的统一信息编码
与U ₀之间的差异，条件式表达损失函数设计如下：

其中N为输出的统一信息编码长度，然后，在条件式表达损失函数中，加上输入图像Y与对应的原始统一信息编码U _y,之间的映射关系，因此，条件式表达损失函数设计如下：

其中U _y为输入图像Y对应的原始统一信息编码，U ₀为标准人脸图像I对应的统一信息编码，D _U(I _o)与D _U(Y)分别是信息编码判别子网络对图像I _o与Y的判别结果；

优化图像还原子网络的结果与原始输入图像之间的差异：通过输入生成器所生成的图像I _o与原始统一信息编码U _y进行还原，进而与原始输入图像Y进行比较，因此，还原损失函数设计为
其中h与w表示图像的的高度与宽度，G代表图像生成器子网络；

整个网络模型的损失函数如下：

L＝L _I+L _U+L _r。
根据权利要求1所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的步骤S4过程如下：

首先，使用基于人脸HOG图像的人脸定位方法，获取实际图像中的人脸图像；

然后，利用网络模型训练的生成器以及人工设置的统一信息编码，实现对实际图像中人脸的快速标准脸生成。
根据权利要求1所述的一种基于生成对抗机制与注意力机制的标准人脸生成方法，其特征在于，所述的步骤S1中采集RaFD人脸数据集和IAIR人脸数据集中人脸数据。