WO2021217856A1

WO2021217856A1 - 人脸图像生成方法、装置、电子设备及可读存储介质

Info

Publication number: WO2021217856A1
Application number: PCT/CN2020/098982
Authority: WO
Inventors: 田笑; 张展望; 周超勇; 刘玉宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-04-30
Filing date: 2020-06-29
Publication date: 2021-11-04
Also published as: CN111652064B; CN111652064A

Abstract

一种人工智能中的图像处理技术领域的人脸图像生成方法、装置、电子设备以及计算机可读存储介质，方法包括：响应客户端发出的人脸图像生成请求，请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据请求生成服从正态分布的m个第一随机向量及n个第二随机向量（S1）；将m个第一随机向量输入人脸图像生成模型的特征分离区，得到高阶特征向量集（S2）；将n个第二随机向量输入模型的特征分离区，得到低阶特征向量集（S3）；将高阶特征向量集中的m个第一高阶特征向量与低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，将每个向量对输入模型的图像生成区，得到m*n张人脸图像（S4）；提升了训练集图像的纯净度和多样性。还可应用于智慧安防、智慧交通、智慧社区等智慧城市领域中，推动智慧城市的建设。

Description

人脸图像生成方法、装置、电子设备及可读存储介质

本申请要求于2020年4月30日提交中国专利局、申请号为CN202010360187.1、发明名称为“人脸图像生成方法、电子装置及可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能中的图像处理技术领域，尤其涉及一种人脸图像生成方法、装置、电子设备及可读存储介质。

背景技术

人脸识别是人工智能领域的一个重要方面，随着机器学习的发展，更多的是采用模型对人脸进行识别，而训练数据的纯净度和多样性对人脸识别模型的识别准确性产生决定性的影响，发明人意识到当前通常通过数据清洗及图像镜像、翻转、缩放等数据增强的方法来提高训练数据的纯净度和多样性，耗时、耗力，且数据泛化能力不足，当脸部有遮盖物(例如，戴眼镜、脸部有伤痕、雀斑)时，模型的识别能力较差。因此，亟需一种人脸图像生成方法，以提升人脸识别模型的训练集图像的纯净度和多样性。

发明内容

鉴于以上内容，有必要提供一种人脸图像生成方法，旨在提升人脸识别模型的训练集图像的纯净度和多样性。

本申请提供的人脸图像生成方法，包括：

响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。

此外，为实现上述目的，本申请还提供一种人脸图像生成装置，包括：

请求模块，用于响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

第一分离模块，用于将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

第二分离模块，用于将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

生成模块，用于将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。

此外，为实现上述目的，本申请还提供一种电子设备，该电子设备包括：存储器、处理器，所述存储器中存储有可在所述处理器上运行的人脸图像生成程序，所述人脸图像生成程序被所述处理器执行时实现如下步骤：

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有人脸图像生成程序，所述人脸图像生成程序可被一个或者多个处理器执行，以实现如下步骤：

相较现有技术，本申请首先根据人脸图像生成请求中待生成人脸图像的用户数量m、每个用户的人脸图像数量n生成服从正态分布的m个第一随机向量及n个第二随机向量；然后，将m个第一随机向量输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将m个第一高阶特征向量的集合作为高阶特征向量集；接着，将n个第二随机向量输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将n个第二低阶特征向量的集合作为低阶特征向量集，其中，第一、第二高阶特征向量代表人脸的身份特征(例如，左眼、右眼、鼻子、嘴巴、额头)，第一、第二低阶特征向量代表人脸的风格特征(例如，背景、光照条件、肤色、发型、发色、眼镜、雀斑)；最后，将高阶特征向量集中的m个第一高阶特征向量与低阶特征向量集中的n个第二低阶特征向量依次匹配，得到m*n个向量对，依次将每个向量对输入人脸图像生成模型的图像生成区，得到m*n张人脸图像。本申请通过将代表身份特征的第一高阶特征向量依次与代表风格特征的低阶特征向量集中的第二低阶特征向量逐一匹配，可为同一用户生成不同风格的人脸图像，使得人脸图像更加多样化，同时，因代表身份特征的高阶特征向量保持不变，仅变化了代表风格特征的低阶特征向量，保证了同一用户人脸图像集的高纯净度，同一标签的人脸图像集中将不存在噪声图像。因此，本申请提升了人脸识别模型的训练集图像的纯净度和多样性。

附图说明

图1为本申请电子设备一实施例的示意图；

图2为本申请人脸图像生成装置一实施例的模块图；

图3为本申请人脸图像生成方法一实施例的流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

如图1所示，为本申请电子设备1一实施例的示意图。电子设备1是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。所述电子设备1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云，其中云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机。

在本实施例中，电子设备1包括，但不仅限于，可通过系统总线相互通信连接的存储器11、处理器12、网络接口13，该存储器11中存储有人脸图像生成程序10，所述人脸图像生成程序10可被所述处理器12执行。图1仅示出了具有组件11-13以及人脸图像生成程序10的电子设备1，本领域技术人员可以理解的是，图1示出的结构并不构成对电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

其中，存储器11包括内存及至少一种类型的可读存储介质。内存为电子设备1的运行提供缓存；可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中，可读存储介质可以是电子设备1的内部存储单元，例如该电子设备1的硬盘；在另一些实施例中，该非易失性存储介质也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。本实施例中，存储器11的可读存储介质通常用于存储安装于电子设备1的操作系统和各类应用软件，例如存储本申请一实施例中的人脸图像生成程序10的代码等。此外，存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器12在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作，例如执行与其他设备进行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行人脸图像生成程序10等。

网络接口13可包括无线网络接口或有线网络接口，该网络接口13用于在所述电子设备1与客户端(图中未画出)之间建立通信连接。

可选的，所述电子设备1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选的，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

在本申请的一实施例中，所述人脸图像生成程序10被所述处理器12执行时实现如下请求步骤、第一分离步骤、第二分离步骤及生成步骤。

请求步骤：响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量。

例如，人脸图像生成请求包括：待生成100个用户的人脸图像，每个用户的人脸图像数量为50张，则共需生成5000张人脸图像，其中，人脸图像的标签数量为100个。

本实施例中，第一随机向量及第二随机向量为[-1,1]内随机采样的向量。

第一分离步骤：将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集。

本实施例中，所述人脸图像生成模型包括特征分离区、图像生成区、图像判别区。

特征分离区用于将输入的随机向量拆分为高阶特征向量及低阶特征向量；图像生成区的输入为特征分离区输出的特征向量，图像生成区将输入的特征向量生成类似于真实的人脸图像；图像判别区的输入为图像生成区输出的人脸图像，图像判别区相当于一个二分类器，通过提取输入图像的特征，区分输入的图像是来自真实图像还是图像生成区生成的图像，若输入的图像来自真实图像，图像判别区输出1，否则，输出0。

所述特征分离区包括第一数量的全连接模块，所述全连接模块包括1个全连接层、1个第一激活层，所述第一激活层的激活函数为线性整流单元函数。本实施例中，特征分离区包括18个全连接模块，随机向量通过18个全连接层后，得到一个512维的向量，然后，将该512维的向量复制为18个512维的向量，将每一个512维的向量分别送入一个全连接层，得到18个不同的1024维的向量，这18个向量中，前8个向量为高阶特征向量，后10个向量为低阶特征向量。

所述高阶特征向量为人脸的身份特征向量(比如，左眼、右眼、鼻子、嘴巴、额头对应的特征向量)，所述低阶特征向量为人脸的风格特征向量(比如，背景、光照条件、肤色、发型、发色、眼镜、雀斑对应的特征向量)，高阶特征向量可以唯一确定一个身份，对应一个人脸图像标签。

所述图像生成区包括第二数量的第一卷积模块，所述第一卷积模块包括2个常规卷积层、1个转置卷积层，其中，转置卷积层位于两层常规卷积层中间。本实施例中，图像生成区包括9个第一卷积模块，每个第一卷积模块通过转置卷积做一次上采样，将前一个常规卷积层的输出与特征分离区得到的18个1024维的向量进行拼接，每次采样后，图像的长、宽分别扩大一倍，9次采样后，生成人脸图像。

本实施例中，每次拼接后，还对拼接得到的向量执行adaptiveinstancenormalization(自适应实例归一化)操作，用于将身份特征的均值和方差与样式特征的均值和方差对齐，加快了神经网络的传输速度，在特征空间中完成风格转换。

所述图像判别区包括第三数量的第二卷积模块，所述第二卷积模块包括1个常规卷积层、1个归一化层、1个第二激活层、1个全连接层，所述第二激活层的激活函数为双曲正切函数。本实施例中，图像判别区包括4个第二卷积模块，第一个第二卷积模块的常规卷积层采用64个5*5的卷积核进行卷积操作，第二个第二卷积模块的常规卷积层采用128个5*5的卷积核进行卷积操作，第三个第二卷积模块的常规卷积层采用256个5*5的卷积核进行卷积操作，第四个第二卷积模块的常规卷积层采用512个5*5的卷积核进行卷积操作，各层卷积步长均为2。

所述人脸图像生成模型生成图像的原理为：特征分离区及图像生成区通过模拟样本集中的样本图像的特征分布，生成符合真实图像分布的图像，来欺骗图像判别区，而图像判别区分辨输入的图像是图像生成区生成的图像还是真实图像，通过模型训练使得图像生成区生成的图像与真实样本无差别，图像判别区也无法正确的区分生成的图像和真实图像。

本实施例中，所述人脸图像生成模型的训练过程包括：

A1、构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型；

A2、构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型。

所述构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型，包括：

B1、将从预设数据库中获取的第四数量的真实人脸图像的集合作为第一人脸图像集，将所述第一人脸图像集输入所述人脸图像生成模型的图像判别区，得到第一判别率；

B2、将服从正态分布的第五数量的随机向量的集合作为第一随机向量集，将所述第一随机向量集输入所述人脸图像生成模型的特征分离区，得到第一特征集，将所述第一特征集输入所述人脸图像生成模型的图像生成区，得到第二人脸图像集，将所述第二人脸图像集输入所述人脸图像生成模型的图像判别区，得到第二判别率；

B3、根据所述第一判别率、第二判别率构建第一目标函数；

B4、固定所述特征分离区及图像生成区的参数，采用梯度上升法调整所述图像判别区的参数，使得第一目标函数值最小，得到优化的人脸图像生成模型。

本实施例中，所述第一目标函数为：

其中，V(D)表示第一目标函数值，A _i表示第一人脸图像集中第i张图像，D(A _i)表示第一人脸图像集中第i张图像的第一判别率，Z _i表示第一随机向量集中第i个随机向量，G(Z _i)表示第二人脸图像集中第i张图像，D(G(Z _i))表示第二人脸图像集中第i张图像的第二判别率，A～P _data表示A采样于真实图像集合P _data，Z～P _z表示Z采样于随机向量集合P _z，E[]表示求数学期望；

所述构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型包括：

C1、将从所述预设数据库中获取的第六数量的真实人脸图像的集合作为第三人脸图像集，将所述第三人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第三判别率；

C2、将服从正态分布的第七数量的随机向量的集合作为第二随机向量集，将所述第二随机向量集输入所述优化的人脸图像生成模型的特征分离区，得到第二特征集，将所述第二特征集输入所述优化的人脸图像生成模型的图像生成区，得到第四人脸图像集，将所述第四人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第四判别率；

C3、根据所述第三判别率、第四判别率构建第二目标函数；

C4、采用梯度下降法调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，得到训练好的人脸图像生成模型。

本实施例中，所述第二目标函数为博弈函数，所述调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，包括：

D1、对所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数执行第一调整，使得第二目标函数值最小；

D2、对所述优化的人脸图像生成模型的图像判别区参数执行第二调整，使得第二目标函数值最大；

D3、通过所述第一调整与第二调整来调整第二目标函数值，当第二目标函数值不再变化时，第二目标函数达到平衡。

所述第二目标函数为：

其中，V(D,G)表示第二目标函数值，B _i表示第三人脸图像集中第i张图像，D(B _i)表示第三人脸图像集中第i张图像的第三判别率，C _i表示第二随机向量集中第i个随机向量，G(C _i)表示第四人脸图像集中第i张图像，D(G(C _i))表示第四人脸图像集中第i张图像的第四判别率，B～P _data表示B采样于真实图像集合P _data，C～P _z表示C采样于随机向量集合P _z，E[]表示求数学期望。

第二分离步骤：将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集。

以图像生成请求中m为100、n为50为例，则高阶特征向量集中包括100个第一高阶特征向量，低阶特征向量集中包括50个第二低阶特征向量，可确定当前共100个身份标签、50种风格特征。

生成步骤：将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。

将高阶特征向量集中每个身份特征向量分别与低阶特征向量集中的50种风格特征进行组合，则可为每个用户生成50张不同风格的图像，实现了人脸图像的多样化，同时因每个用户的身份特征向量未改变，故同一用户的图像集中不含其它身份标签的图像，提高了图像的纯净度。

由上述实施例可知，本申请提出的电子设备1，首先，根据人脸图像生成请求中待生成人脸图像的用户数量m、每个用户的人脸图像数量n生成服从正态分布的m个第一随机向量及n个第二随机向量；然后，将m个第一随机向量输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将m个第一高阶特征向量的集合作为高阶特征向量集；接着，将n个第二随机向量输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将n个第二低阶特征向量的集合作为低阶特征向量集，其中，第一、第二高阶特征向量代表人脸的身份特征(例如，左眼、右眼、鼻子、嘴巴、额头)，第一、第二低阶特征向量代表人脸的风格特征(例如，背景、光照条件、肤色、发型、发色、眼镜、雀斑)；最后，将高阶特征向量集中的m个第一高阶特征向量与低阶特征向量集中的n个第二低阶特征向量依次匹配，得到m*n个向量对，依次将每个向量对输入人脸图像生成模型的图像生成区，得到m*n张人脸图像。本申请通过将代表身份特征的第一高阶特征向量依次与代表风格特征的低阶特征向量集中的第二低阶特征向量逐一匹配，可为同一用户生成不同风格的人脸图像，使得人脸图像更加多样化，同时，因代表身份特征的高阶特征向量保持不变，仅变化了代表风格特征的低阶特征向量，保证了同一用户人脸图像集的高纯净度，同一标签的人脸图像集中将不存在噪声图像。因此，本申请提升了人脸识别模型的训练集图像的纯净度和多样性。

如图2所示，为本申请人脸图像生成装置100一实施例的模块图。

在本申请的一个实施例中，人脸图像生成装置100包括请求模块110、第一分离模块120、第二分离模块130及生成模块140，示例性地：

所述请求模块110，用于响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

所述第一分离模块120，用于将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

所述第二分离模块130，用于将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

所述生成模块140，用于将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。

上述请求模块110、第一分离模块120、第二分离模块130及生成模块140等模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

如图3所示，为本申请人脸图像生成方法一实施例的流程图，该人脸图像生成方法包括步骤S1-S4。

S1、响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量。

S2、将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集。

本实施例中，所述人脸图像生成模型的训练过程包括：

B3、根据所述第一判别率、第二判别率构建第一目标函数；

本实施例中，所述第一目标函数为：

C3、根据所述第三判别率、第四判别率构建第二目标函数；

所述第二目标函数为：

S3、将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集。

S4、将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。

在另一个实施例中，本申请所提供的方法还可应用于智慧安防、智慧交通、智慧社区等智慧城市领域中，从而推动智慧城市的建设。比如通过本方案提高了图像的纯净度，从而可提高智慧安防中安防检查的准确率等等。

在另一个实施例中，为进一步保证上述得到的m*n张人脸图像的私密和安全性，本方案还可以将得到的m*n张人脸图像存储于一区块链的节点中。

由上述实施例可知，本申请提出的人脸图像生成方法，首先，根据人脸图像生成请求中待生成人脸图像的用户数量m、每个用户的人脸图像数量n生成服从正态分布的m个第一随机向量及n个第二随机向量；然后，将m个第一随机向量输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将m个第一高阶特征向量的集合作为高阶特征向量集；接着，将n个第二随机向量输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将n个第二低阶特征向量的集合作为低阶特征向量集，其中，第一、第二高阶特征向量代表人脸的身份特征(例如，左眼、右眼、鼻子、嘴巴、额头)，第一、第二低阶特征向量代表人脸的风格特征(例如，背景、光照条件、肤色、发型、发色、眼镜、雀斑)；最后，将高阶特征向量集中的m个第一高阶特征向量与低阶特征向量集中的n个第二低阶特征向量依次匹配，得到m*n个向量对，依次将每个向量对输入人脸图像生成模型的图像生成区，得到m*n张人脸图像。本申请通过将代表身份特征的第一高阶特征向量依次与代表风格特征的低阶特征向量集中的第二低阶特征向量逐一匹配，可为同一用户生成不同风格的人脸图像，使得人脸图像更加多样化，同时，因代表身份特征的高阶特征向量保持不变，仅变化了代表风格特征的低阶特征向量，保证了同一用户人脸图像集的高纯净度，同一标签的人脸图像集中将不存在噪声图像。因此，本申请提升了人脸识别模型的训练集图像的纯净度和多样性。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括人脸图像生成程序10，所述人脸图像生成程序10被处理器执行时实现如下操作：

本申请之计算机可读存储介质的具体实施方式与上述人脸图像生成方法以及电子设备1的具体实施方式大致相同，在此不再赘述。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种人脸图像生成方法，应用于电子设备，其中，所述方法包括：

响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。
如权利要求1所述的人脸图像生成方法，所述人脸图像生成模型还包括图像判别区，其中，所述特征分离区包括第一数量的全连接模块，所述全连接模块包括1个全连接层、1个第一激活层；

所述图像生成区包括第二数量的第一卷积模块，所述第一卷积模块包括2个常规卷积层、1个转置卷积层，其中，转置卷积层位于两层常规卷积层中间；

所述图像判别区包括第三数量的第二卷积模块，所述第二卷积模块包括1个常规卷积层、1个归一化层、1个第二激活层、1个全连接层。
如权利要求2所述的人脸图像生成方法，其中，所述人脸图像生成模型的训练过程包括：

构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型；

构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型。
如权利要求3所述的人脸图像生成方法，其中，所述构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型包括：

将从预设数据库中获取的第四数量的真实人脸图像的集合作为第一人脸图像集，将所述第一人脸图像集输入所述人脸图像生成模型的图像判别区，得到第一判别率；

将服从正态分布的第五数量的随机向量的集合作为第一随机向量集，将所述第一随机向量集输入所述人脸图像生成模型的特征分离区，得到第一特征集，将所述第一特征集输入所述人脸图像生成模型的图像生成区，得到第二人脸图像集，将所述第二人脸图像集输入所述人脸图像生成模型的图像判别区，得到第二判别率；

根据所述第一判别率、第二判别率构建第一目标函数；

固定所述特征分离区及图像生成区的参数，采用梯度上升法调整所述图像判别区的参数，使得第一目标函数值最小，得到优化的人脸图像生成模型。
如权利要求4所述的人脸图像生成方法，其中，所述构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型包括：

将从所述预设数据库中获取的第六数量的真实人脸图像的集合作为第三人脸图像集，将所述第三人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第三判别率；

将服从正态分布的第七数量的随机向量的集合作为第二随机向量集，将所述第二随机向量集输入所述优化的人脸图像生成模型的特征分离区，得到第二特征集，将所述第二特征集输入所述优化的人脸图像生成模型的图像生成区，得到第四人脸图像集，将所述第四人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第四判别率；

根据所述第三判别率、第四判别率构建第二目标函数；

采用梯度下降法调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，得到训练好的人脸图像生成模型。
如权利要求5所述的人脸图像生成方法，其中，所述调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，包括：

对所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数执行第一调整，使得第二目标函数值最小；

对所述优化的人脸图像生成模型的图像判别区参数执行第二调整，使得第二目标函数值最大；

通过所述第一调整与第二调整来调整第二目标函数值，当第二目标函数值不再变化时，第二目标函数达到平衡。
如权利要求4所述的人脸图像生成方法，其中，所述第一目标函数为：

其中，V(D)表示第一目标函数值，A _i表示第一人脸图像集中第i张图像，D(A _i)表示第一人脸图像集中第i张图像的第一判别率，Z _i表示第一随机向量集中第i个随机向量，G(Z _i)表示第二人脸图像集中第i张图像，D(G(Z _i))表示第二人脸图像集中第i张图像的第二判别率，A～P _data表示A采样于真实图像集合P _data，Z～P _z表示Z采样于随机向量集合P _z，E[]表示求数学期望。
如权利要求6所述的人脸图像生成方法，其中，所述第二目标函数为：

其中，V(D,G)表示第二目标函数值，B _i表示第三人脸图像集中第i张图像，D(B _i)表示第三人脸图像集中第i张图像的第三判别率，C _i表示第二随机向量集中第i个随机向量，G(C _i)表示第四人脸图像集中第i张图像，D(G(C _i))表示第四人脸图像集中第i张图像的第四判别率，B～P _data表示B采样于真实图像集合P _data，C～P _z表示C采样于随机向量集合P _z，E[]表示求数学期望。
一种人脸图像生成装置，其中，包括：

请求模块，用于响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

第一分离模块，用于将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

第二分离模块，用于将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

生成模块，用于将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。
一种电子设备，其中，该电子设备包括：存储器、处理器，所述存储器上存储有可在所述处理器上运行的人脸图像生成程序，所述人脸图像生成程序被所述处理器执行时实现如下步骤：

响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。
如权利要求10所述的电子设备，所述人脸图像生成模型还包括图像判别区，其中，所述特征分离区包括第一数量的全连接模块，所述全连接模块包括1个全连接层、1个第一激活层；

所述图像生成区包括第二数量的第一卷积模块，所述第一卷积模块包括2个常规卷积层、1个转置卷积层，其中，转置卷积层位于两层常规卷积层中间；

所述图像判别区包括第三数量的第二卷积模块，所述第二卷积模块包括1个常规卷积层、1个归一化层、1个第二激活层、1个全连接层。
如权利要求11所述的电子设备，其中，所述人脸图像生成模型的训练过程包括：

构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型；

构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型。
如权利要求12所述的电子设备，其中，所述构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型包括：

将从预设数据库中获取的第四数量的真实人脸图像的集合作为第一人脸图像集，将所述第一人脸图像集输入所述人脸图像生成模型的图像判别区，得到第一判别率；

将服从正态分布的第五数量的随机向量的集合作为第一随机向量集，将所述第一随机向量集输入所述人脸图像生成模型的特征分离区，得到第一特征集，将所述第一特征集输入所述人脸图像生成模型的图像生成区，得到第二人脸图像集，将所述第二人脸图像集输入所述人脸图像生成模型的图像判别区，得到第二判别率；

根据所述第一判别率、第二判别率构建第一目标函数；

固定所述特征分离区及图像生成区的参数，采用梯度上升法调整所述图像判别区的参数，使得第一目标函数值最小，得到优化的人脸图像生成模型。
如权利要求13所述的电子设备，其中，所述构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型包括：

将从所述预设数据库中获取的第六数量的真实人脸图像的集合作为第三人脸图像集，将所述第三人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第三判别率；

将服从正态分布的第七数量的随机向量的集合作为第二随机向量集，将所述第二随机向量集输入所述优化的人脸图像生成模型的特征分离区，得到第二特征集，将所述第二特征集输入所述优化的人脸图像生成模型的图像生成区，得到第四人脸图像集，将所述第四人脸图像集输入所述优化的人脸图像生成模型的图像判别区，得到第四判别率；

根据所述第三判别率、第四判别率构建第二目标函数；

采用梯度下降法调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，得到训练好的人脸图像生成模型。
如权利要求14所述的电子设备，其中，所述调整所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数、图像判别区参数，使得第二目标函数达到平衡，包括：

对所述优化的人脸图像生成模型的特征分离区参数、图像生成区参数执行第一调整，使得第二目标函数值最小；

对所述优化的人脸图像生成模型的图像判别区参数执行第二调整，使得第二目标函数值最大；

通过所述第一调整与第二调整来调整第二目标函数值，当第二目标函数值不再变化时，第二目标函数达到平衡。
如权利要求13所述的电子设备，其中，所述第一目标函数为：

其中，V(D)表示第一目标函数值，A _i表示第一人脸图像集中第i张图像，D(A _i)表示第一人脸图像集中第i张图像的第一判别率，Z _i表示第一随机向量集中第i个随机向量，G(Z _i)表示第二人脸图像集中第i张图像，D(G(Z _i))表示第二人脸图像集中第i张图像的第二判别率，A～P _data表示A采样于真实图像集合P _data，Z～P _z表示Z采样于随机向量集合P _z，E[]表示求数学期望。
如权利要求15所述的电子设备，其中，所述第二目标函数为：

其中，V(D,G)表示第二目标函数值，B _i表示第三人脸图像集中第i张图像，D(B _i)表示第三人脸图像集中第i张图像的第三判别率，C _i表示第二随机向量集中第i个随机向量，G(C _i)表示第四人脸图像集中第i张图像，D(G(C _i))表示第四人脸图像集中第i张图像的第四判别率，B～P _data表示B采样于真实图像集合P _data，C～P _z表示C采样于随机向量集合P _z，E[]表示求数学期望。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有人脸图像生成程序，所述人脸图像生成程序可被一个或者多个处理器执行，以实现如下步骤：

响应客户端发出的人脸图像生成请求，所述请求包括待生成人脸图像的用户数量m、每个用户的人脸图像数量n，根据所述请求生成服从正态分布的m个第一随机向量及n个第二随机向量；

将所述m个第一随机向量依次输入训练好的人脸图像生成模型的特征分离区，得到m个第一高阶特征向量及m个第一低阶特征向量，将所述m个第一高阶特征向量的集合作为高阶特征向量集；

将所述n个第二随机向量依次输入所述人脸图像生成模型的特征分离区，得到n个第二高阶特征向量及n个第二低阶特征向量，将所述n个第二低阶特征向量的集合作为低阶特征向量集；

将所述高阶特征向量集中的m个第一高阶特征向量依次与所述低阶特征向量集中的n个第二低阶特征向量逐一匹配，得到m*n个向量对，依次将每个向量对输入所述人脸图像生成模型的图像生成区，得到m*n张人脸图像。
如权利要求18所述的计算机可读存储介质，所述人脸图像生成模型还包括图像判别区，其中，所述特征分离区包括第一数量的全连接模块，所述全连接模块包括1个全连接层、1个第一激活层；

所述图像生成区包括第二数量的第一卷积模块，所述第一卷积模块包括2个常规卷积层、1个转置卷积层，其中，转置卷积层位于两层常规卷积层中间；

所述图像判别区包括第三数量的第二卷积模块，所述第二卷积模块包括1个常规卷积层、1个归一化层、1个第二激活层、1个全连接层。
如权利要求19所述的计算机可读存储介质，其中，所述人脸图像生成模型的训练过程包括：

构建第一目标函数，对所述人脸图像生成模型进行第一训练，得到优化的人脸图像生成模型；

构建第二目标函数，对所述优化的人脸图像生成模型进行第二训练，得到训练好的人脸图像生成模型。