WO2022022043A1

WO2022022043A1 - 人脸图像生成方法、装置、服务器及存储介质

Info

Publication number: WO2022022043A1
Application number: PCT/CN2021/096715
Authority: WO
Inventors: 曹辰捷; 徐国强
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-27
Filing date: 2021-05-28
Publication date: 2022-02-03
Also published as: CN111860380B; CN111860380A

Abstract

本申请实施例公开了一种人脸图像生成方法、装置、服务器及存储介质，该方法包括：获取目标人物的人脸图像以及该人脸图像对应的表情标签；对该人脸图像进行人脸检测，得到该人脸图像的标准脸部图像；利用表情生成模型根据该标准脸部图像以及该表情标签进行表情合成，得到第一合成脸部图像；根据该标准脸部图像以及该第一合成脸部图像进行脸部合成，得到第二合成脸部图像；生成包括该第二合成脸部图像的人脸图像。采用本申请，可以使得生成表情更加稳定，并且能够满足用户对表情，尤其是微表情的编辑需求。本申请还涉及区块链技术，可将包括第二合成脸部图像的人脸图像的索引信息写入区块链中，同时本申请还涉及人工智能领域中的图像处理技术。

Description

人脸图像生成方法、装置、服务器及存储介质

本申请要求于2020年7月27日提交中国专利局、申请号为202010731169.X，发明名称为“人脸图像生成方法、装置、服务器及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种人脸图像生成方法、装置、服务器及存储介质。

背景技术

深度学习作为一个近年来热门的技术研究领域，相关的应用也层出不穷。例如，生成对抗网络(Generative Adversarial Networks，GAN)的应用一般有生成不同风格图像，对图像进行补全，生成高清数据以用于对其它机器学习模型的数据增强，等等。

GAN广泛而有趣的应用以及较高的技术门槛，使得GAN成为了各大科技公司和学府研究的焦点。这里，我们关注GAN对表情生成方面的应用。发明人意识到，传统的通过GAN模型对人物图像进行局部调整的方法，有着生成表情不稳定，在野外场景下尤其不稳定的缺点。此外，传统方法的表情生成数量是十分有限的，一般只支持少数几种表情，无法满足用户对表情，尤其对微表情的编辑需求。

发明内容

本申请实施例提供了一种人脸图像生成方法、装置、服务器及存储介质，不仅可以使得生成表情更加稳定，还可以满足用户对表情，尤其对微表情的编辑需求。

第一方面，本申请实施例提供了一种人脸图像生成方法，包括：

获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

生成包括所述第二合成脸部图像的人脸图像。

第二方面，本申请实施例提供了一种人脸图像生成装置，包括：

获取模块，用于获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

处理模块，用于对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

合成模块，用于利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

所述合成模块，还用于根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

所述处理模块，还用于生成包括所述第二合成脸部图像的人脸图像。

第三方面，本申请实施例提供了一种服务器，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下方法：

生成包括所述第二合成脸部图像的人脸图像。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

生成包括所述第二合成脸部图像的人脸图像。

本申请实施例相较于现有技术基于GAN局部调整人脸图像导致生成表情不稳定的过程，本申请通过表情合成以及脸部合成能够使得生成表情更加稳定，并且能够满足用户对表情，尤其是微表情的编辑需求。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1A为本申请实施例提供的一种人脸图像生成方法的流程示意图；

图1B为本申请实施例提供的一种对人脸图像的图像处理过程的示意图；

图1C为本申请实施例提供的一种脸部合成过程的示意图；

图2A为本申请实施例提供的另一种人脸图像生成方法的流程示意图；

图2B为本申请实施例提供的一种对人脸图像的图像调整过程的示意图；

图3为本申请实施例提供的一种人脸图像生成装置的结构示意图；

图4为本申请实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

本申请的技术方案可涉及人工智能技术领域，如可应用于图像处理等场景中，以生成人脸图像，使得生成表情更加稳定，从而推动智慧城市的建设。可选的，本申请涉及的数据如各种图像和/或标签等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

请参阅图1A，为本申请实施例提供的一种人脸图像生成方法的流程示意图。该方法可以应用于服务器，该服务器可以一个服务器或服务器集群，具体地，该方法可以包括以下步骤：

S101、获取目标人物的人脸图像以及所述人脸图像对应的表情标签。

其中，表情标签可以为由至少一个表情单元中每个表情单元的值构成的特征向量，即该表情标签可以包括至少一个表情单元中每个表情单元的值。表情单元能够用于描述表情。在一个实施例中，表情单元可以称为动作单元(Action Units，AU)。所指的至少一个可以为一个或多个。其中，至少一个表情单元包括但不限于以下17种表情单元中的至少一个：内眉上扬、外眉上扬、皱眉、眼皮上扬、眯眼、眼帘锁紧、皱鼻、上唇上提、嘴角上扬、脸颊肌、嘴角下拉、下巴上扬、唇部平压、唇部锁紧、张嘴、下颚下垂、闭眼。所述的表情单元包括但不限于上述列举的表情单元。

在一个实施例中，服务器可以为用户终端提供多个表情图像。用户可以使用用户终端上传目标人物的人脸图像以及多个表情图像中的目标表情图像至服务器。目标表情图像可以为多个表情图像中的任一表情图像，服务器可以接收用户使用用户终端上传的目标人物的人脸图像以及目标表情图像，并根据预设的表情图像与表情标签的对应关系，确定该目标表情图像对应的表情标签作为该人脸图像对应的表情标签。在一个应用场景中，用户可以点击图像合成按钮，用户终端可以响应于对该合成按钮的点击操作，发送图像合成指令至服务器，该图像合成指令可以携带该目标人物的人脸图像以及目标表情图像，服务器可以在接收到该图像合成指令时，获取该图像合成指令携带的该目标人物的人脸图像以及目标表情图像。

在一个实施例中，服务器可以为用户终端提供多个表情标识信息。每个表情标识信息可以用于标识一种表情。用户可以使用用户终端上传目标人物的人脸图像以及多个表情标识信息中的目标表情标识信息至服务器。其中，目标表情标识信息可以为该多个表情标识信息中的任一表情标识信息。服务器可以接收用户上传的目标人物的人脸图像以及目标表情标识信息(可以为目标表情名称，如悲伤、愤怒、高兴)，并可以根据预设的表情图像与表情标识信息的对应关系，确定该目标表情标识信息对应的表情标签作为该人脸图像对应的表情标签。在一个应用场景中，用户可以点击图像合成按钮，用户终端可以响应于对该合成按钮的点击操作，发送图像合成指令至服务器，该图像合成指令携带该目标人物的人脸图像以及目标表情标识信息，服务器可以在接收到该图像合成指令时，获取该图像合成指令携带的该目标人物的人脸图像以及目标表情标识信息。

前述两种方式均可以通过设置表情相关数据来实现人脸表情合成，本申请实施例除了采用这两种方式之外，还可以通过设置表情单元的值达到对表情的精细化编辑的过程。

在一个实施例中，服务器可以为用户终端提供多个表情单元中每个表情单元的设置项。用户可以基于每个表情单元的设置项设置每个表情单元的值，并可以使用用户终端上传目标人物的人脸图像以及每个表情单元的值至服务器。服务器可以接收用户上传的目标人物的人脸图像以及每个表情单元的值，并可以根据每个表情单元的值构建该人脸图像对应的表情标签。在一个应用场景中，用户可以点击图像合成按钮，用户终端可以响应于对该合成按钮的点击操作，发送图像合成指令至服务器，该图像合成指令携带该目标人物的人脸图像以及每个表情单元的值，服务器可以在接收到该图像合成指令时，获取该图像合成指令携带的该目标人物的人脸图像以及每个表情单元的值。此处，根据实际的应用场景的不同，用户除了可以采用上述方式设置每个表情单元的值之外，也可以设置多个表情单元中部分表情单元的值，本申请实施例对其不做限制。

S102、对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像。

为了得到较为标准的脸部图像，服务器可以对人脸图像进行人脸检测，得到该人脸图像的标准脸部图像。其中，此处所述的人脸图像为目标人物的人脸图像。此处所述的标准脸部图像为目标人物的人脸图像的标准脸部图像。

在一个实施例中，服务器可以调用图像检测库，如dlib库来对该人脸图像进行人脸检测，得到该人脸图像的标准脸部图像。

在一个实施例中，服务器具体可以调用图像检测库对该人脸图像进行人脸检测，得到该人脸图像的原始脸部图像，并对该原始脸部图像进行人脸对齐，得到该人脸图像的标准脸部图像。即，服务器可以通过图像检测库来对该人脸图像进行截取和矫正，从而得到该人脸图像对应的标准脸部图像。其中，所述的原始脸部图像指在调用图像检测库对该人脸图像进行人脸检测后得到的脸部图像。

在一个实施例中，服务器对该原始脸部图像进行人脸对齐，得到该人脸图像的标准脸部图像的具体方式如下：服务器确定该原始脸部图像包括的多个关键点的坐标，并基于多个关键点的坐标以及多个关键点中每个关键点对应的基准关键点的坐标对该原始脸部图像进行刚性变换，得到变换后的脸部图像作为该人脸图像对应的标准脸部图像。其中，刚性变换可以称为全局变换。刚性变换可以包括平移、旋转、缩放，等等。刚性变换只是位置和朝向的变换，不会使得脸部形状发生改变。

例如，请参阅图1B，当多个关键点为图1B中S1所示的5个关键点时，采用上述图像调整过程的效果图可以参见图1B的S2。

S103、利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像。

本申请实施例中，服务器可以将该标准脸部图像以及该表情标签作为表情生成模型的输入数据，通过该表情生成模型来进行表情合成，得到第一合成脸部图像。该第一合成脸部图像对应的表情可以为该表情标签指示的表情。并且，该第一合成脸部图像可以具有该标准脸部图像的脸部特征。其中，此处所述的标准脸部图像是指目标人物的人脸图像对应的标准脸部图像。此处所述的表情标签为目标人物的人脸图像对应的表情标签。

在一个实施例中，所述的表情生成模型可以通过对生成对抗网络模型训练得到。当所述的表情生成模型是通过对生成对抗网络模型训练得到时，服务器具体可以通过表情生成模型的生成器来进行表情合成，得到第一合成脸部图像。

在一个实施例中，当表情生成模型通过对生成对抗网络模型训练得到时，该表情生成模型具体可以采用如下方式得到：服务器获取训练数据集，该训练数据集包括多张人脸图像，该人脸图像携带对应的表情标签；服务器对该训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，该脸部图像集合包括该各人脸图像各自对应的标准脸部图像；服务器利用该脸部图像集合中的各标准脸部图像以及该标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。

其中，上述提及的多张人脸图像可以分为至少一个人脸图像集，例如，可以分为第一人脸图像集、第二人脸图像集和第三人脸图像集，等等。其中，该第一人脸图像集，如可以为第一高质量人脸图像集合，如FFHQ，该第二人脸图像集，如可以为第二高质量人脸图像集合，如celebA-HQ，第三人脸图像集，如可以为人脸表情图像集合，如Emotion Net。或，该第一人脸图像数据集可以为根据从第一高质量人脸图像集合中筛选出的人脸图像构成的数据集。该第二人脸图像数据集可以为根据从第二高质量人脸图像集合中筛选出的人脸图像构成的数据集。第三人脸图像数据集可以为根据从人脸表情图像集筛选出的人脸图像构成的数据集。

在一个实施例中，人脸图像对应的表情标签可以通过如下方式得到：服务器对人脸图像进行算法标注，得到人脸图像对应的表情标签。具体地，服务器可以调用人脸识别工具库对该训练数据集中的各人脸图像进行标注，得到该各人脸图像各自对应的第一标注数据，并根据该各人脸图像各自对应的第一标注数据，获得该各人脸图像各自对应的第二标注数据作为该各人脸图像各自对应的表情标签。其中，该人脸识别工具库可以为开源人脸多功能工具库，如Open Face开源人脸多功能工具库。上述过程能够实现自动化的表情标签标注，提升了对表情标签的标注效率。

在一个实施例中，服务器调用人脸识别工具库对该训练数据集中的各人脸图像进行标注，得到该各人脸图像各自对应的第一标注数据的过程可以为服务器通过图形处理器(Graphics Processing Unit，GPU)获取训练数据集中各人脸图像包括的多个关键点中每个关键点的坐标，并将各人脸图像以及各人脸图像包括的多个关键点中每个关键点的坐标输入人脸识别工具库中，通过人脸识别工具库根据各人脸图像以及各人脸图像包括的多个关键点中每个关键点的坐标进行标注，得到各人脸图像各自对应的第一标注数据。

在一个实施例中，服务器根据该各人脸图像各自对应的第一标注数据，获得该各人脸图像各自对应的第二标注数据作为该各人脸图像各自对应的表情标签的过程具体为服务器将该各人脸图像各自对应的第一标注数据确定为该各人脸图像各自对应的第二标注数据，并将该各人脸图像各自对应的第二标注数据作为该各人脸图像各自对应的表情标签。

在一个实施例中，服务器根据该各人脸图像各自对应的第一标注数据，获得该各人脸图像各自对应的第二标注数据作为该各人脸图像各自对应的表情标签的过程还可以为服务器对该各人脸图像各自对应的第一标注数据进行归一化处理，得到该各人脸图像各自对应的第二标注数据作为该各人脸图像各自对应的表情标签。由于各人脸图像各自对应的第一标注数据包括的表情单元的值的取值范围较大，一般为0～5，过大的取值可能会得到表情较为夸张的人脸图像，因此为了控制表情的夸张程度，可以采用上述归一化处理的方式以缩小第一标注数据中表情单元的值，使其取值范围控制在更小的区间内，如0～1。

在一个实施例中，服务器对该训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合的过程可以为服务器调用图像检测库对该训练数据集中各人脸图像进行人脸检测，得到各人脸图像各自对应的原始脸部图像，并对各人脸图像各自对应的原始脸部图像进行人脸对齐，得到各人脸图像各自对应的标准脸部图像，生成包括各人脸图像各自对应的标准脸部图像的脸部图像集合。其中，对各人脸图像各自对应的原始脸部图像进行人脸对齐，得到各人脸图像各自对应的标准脸部图像的方式可以参见前述提及的对该人脸图像(目标人物的人脸图像)的原始脸部图像进行人脸对齐，得到该人脸图像的标准脸部图像的方式，本申请实施例在此不做赘述。由于生成对抗网络模型一般都比较敏感，因此在训练阶段通过此种方式矫正人脸图像可以提高模型稳定度。

在一个实施例中，服务器利用该脸部图像集合中的各标准脸部图像以及该标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型大致流程可以如下：服务器每次从脸部图像集合随机选两张标准脸部图像，如face_a和face_b，并获取face_a的表情单元的值，即AU系数，如au_a，并获取face_b的表情单元的值，即AU系数，如au_b(face_a和face_b可以不为同一人)；服务器利用生成对抗网络模型包括的生成器根据au_b和face_a生成fake_b；服务器通过生成对抗网络模型包括的判别器根据fake_b和face_a进行训练；服务器通过生成器以au_a还原fake_b为rec_a，并计算rec_a和face_a的还原损失，即L1-loss；服务器利用L1-loss进行模型训练，直到模型收敛，得到训练后的生成对抗网络模型作为表情生成模型。

在一个实施例中，除了可以得到fake_b，还可以得到fake_b对应的特征参数，如mask参数。mask参数的取值范围可以为0～1。mask参数的大小能够反映区域的重要程度。

S104、根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像。

为了使得合成的脸部图像更加逼真，服务器可以进一步根据该标准脸部图像以及该第一合成脸部图像进行脸部合成，得到第二合成脸部图像。其中，该第二合成脸部图像对应的表情可以为该表情标签指示的表情。并且，该第二合成脸部图像可以具有该标准脸部图像的脸部特征。

在一个实施例中，服务器在利用表情生成模型根据该标准脸部图像以及该表情标签进行表情合成之后，还可以得到第一合成脸部图像对应的特征参数。服务器可以根据该标准脸部图像、该第一合成脸部图像以及该第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。

在一个实施例中，若第一合成脸部图像对应的特征参数为mask参数，那么脸部合成的过程可以为参见如下公式：

目标图＝图1*mask+图2*(1-mask)公式1.1；

此处，前述的第一合成脸部图像即可为公式1.1中的图1，前述的标准脸部图像即可以为公式1.1中的图2，前述的第二合成脸部图像即可以为公式1.1中的目标图。

以图1C的脸部合成过程图为例，图1C左上角图像是标准脸部图像，图1C左下角图像是第一合成脸部图像，图1C右边图像是第二合成脸部图像。

上述脸部合成的方法通过图像注意力机制，使得生成的微表情和脸部图像按照合理的比例合成，让生成结果更加稳定。并且该方法能够在自然环境下对人脸表情进行编辑而无需顾及背景等因素。

S105、生成包括所述第二合成脸部图像的人脸图像。

本申请实施例中，服务器可以根据目标人物的人脸图像生成包括该第二合成脸部图像的人脸图像。这个过程，简单来说，相当于服务器使用第二合成脸部图像替换了目标人物的人脸图像的原始脸部图像，从而得到包括该第二合成脸部图像的人脸图像，即，服务器将包括该第二合成脸部图像的人脸图像还原至目标人物的人脸图像的原始脸部图像所在位置。

在一个实施例中，服务器可以输出包括该第二合成脸部图像的人脸图像，如可以将包括该第二合成脸部图像的人脸图像发送至用户终端以便用户查看。对于用户来讲，可能看到的就是目标人物表情变化后的人脸图像。

在一个实施例中，在对生成对抗网络模型进行训练的过程中，可以加入以下至少一项改进：

1、引入谱归一化spectral_norm来限制模型的Lipschitz约束(简称L约束)。具体可以将判别器的网络的参数w替换为

以使生成对抗网络模型满足L约束，从而提升模型的泛化能力和稳定性。其中，||w|| ₂为w的谱范数。判别器使用的损失函数可以为hinge-loss，该损失函数可以用于判别器的二分类过程。

2、生成器加入残差网络。引入残差网络可以使得生成的人脸图像能够更好地还原人脸细节。生成器可以利用每层卷积层的残差网络对输入特征进行卷积操作，得到输出特征。即，残差网络可以用于根据输入特征执行卷积操作，得到输出特征。

3、生成器可以参考styleGAN，在每层卷积层执行卷积操作后引入自适应实例化标准(Adaptive Instance Normalization，AdaIN)模块和均匀随机噪声对卷积操作后得到的输出特征进行AdaIN处理，以提高生成图像的质量。其中，AdaIN处理的过程可以参见如下公式：

其中，x表示输入特征，y表示表情单元的值，即AU系数。

4、生成器引入指数衰退，衰减系数可以为0.9995。即，生成器每次迭代，生成器的参数更新，每步是：旧参数*0.9995+新参数*0.0005。引入指数衰退使得生成器的更新更加缓慢和稳定。

可见，图1A所示的实施例中，服务器可以对目标人物的人脸图像进行图像处理，得到该人脸图像的标准脸部图像，并利用表情生成模型根据该标准脸部图像以及该人脸图像对应的表情标签进行表情合成，得到第一合成脸部图像，从而根据该标准脸部图像以及该第一合成脸部图像进行脸部合成，得到第二合成脸部图像，并生成包括该第二合成脸部图像的人脸图像，该过程不仅可以使得生成表情更加稳定，使得最终生成的人脸图像更加稳定，还能够满足用户对表情，尤其是微表情的编辑需求。

请参阅图2A，为本申请实施例提供的另一种人脸图像生成方法的流程示意图。该方法可以应用于服务器，该服务器可以一个服务器或服务器集群，该方法可以包括如下步骤：

S201、获取目标人物的人脸图像以及所述人脸图像对应的表情标签。

S202、对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像。

S203、利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像。

S204、根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像。

S205、生成包括所述第二合成脸部图像的人脸图像。

其中，步骤S201-S205可以参见步骤S101-S105，本申请实施例在此不做赘述。

S206、利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像。

S207、输出调整后的所述包括第二合成脸部图像的人脸图像。

在步骤S206-S207中，服务器可以通过增强型超分辨率生成对抗网络(Enhanced Super-Resolution Generative Adversarial Networks，ESRGAN)模型对包括第二合成脸部图像的人脸图像进行处理后，输出分辨率更高的人脸图像，进而达到优化人脸图像的目的。该过程采用超分辨技术对生成的人脸图像进行了高清化放大，在不影响训练生成对抗网络模型的基础上提高了生成表情的分辨率。经实践，采用上述过程能够在有效保留人脸清晰度的前提下将人脸图像的分辨率从128x128提高到512x512。

本申请实施例中，服务器具体可以将包括第二合成脸部图像的人脸图像作为ESRGAN模型的输入数据，通过ESRGAN模型对包括第二合成脸部图像的人脸图像进行调整，得到调整后的包括第二合成脸部图像的人脸图像。在一个实施例中，所述的ESRGAN模型可以通过人工扰动一些高质量的人脸图像训练得到。

例如，参见图2B，图2B左图所示的为包括第二合成脸部图像的人脸图像，图2B右图所示的为调整后的包括第二合成脸部图像的人脸图像。即，服务器可以将图2B左图所示的人脸图像作为ESRGAN模型的输入数据，通过ESRGAN模型对图2B左图所示的人脸图像进行调整，得到图2B右图所示的人脸图像。

在一个实施例中，服务器可以生成包括第二合成脸部图像的人脸图像的第一索引信息，并将该第一索引信息写入区块链中。将第一索引信息写入区块链，可以方便对相应人脸图像进行索引，还能有效防止将相应人脸图像用作非法用途。其中，第一索引信息是指包括第二合成脸部图像的人脸图像的索引信息。该第一索引信息例如可以为服务器对该人脸图像进行哈希计算得到的哈希值或服务器对该人脸图像进行签名处理后得到的签名信息。

在一个实施例中，服务器可以生成调整后的该包括第二合成脸部图像的人脸图像的第二索引信息，并将该第二索引信息写入区块链中。将第二索引信息写入区块链。其中，该第二索引信息是指调整后的该包括第二合成脸部图像的人脸图像的索引信息。该第二索引信息例如可以为服务器对该人脸图像进行哈希计算得到的哈希值或服务器对该人脸图像进行签名处理后得到的签名信息。

同样，本申请也可以用于智慧城市的建设。随着深度学习技术的发展，通过深度学习技术生成的人脸图像也越来越逼真，这无疑对人脸识别过程带来了挑战，那么在人脸识别过程中，为了避免出现利用合成的人脸图像或相关视频来以假乱真进行人脸识别的情况，可以在人脸识别过程中采集人脸图像，并将采集的人脸图像与服务器存储的多张合成脸部图像进行比对，然后根据比对结果判断是否进行警告处理。

可见，图2A所示的实施例中，服务器在得到包括第二合成脸部图像的人脸图像之后，还可以通过增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行调整，以到达优化人脸图像的目的，使得输出的人脸图像的图像质量更高。

请参阅图3，为本申请实施例提供的一种人脸生成装置的结构示意图。该装置可以应用于服务器。该装置可以包括：

获取模块301，用于获取目标人物的人脸图像以及所述人脸图像对应的表情标签。

处理模块302，用于对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像。

合成模块303，用于利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情。

合成模块303，还用于根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情。

处理模块302，还用于生成包括所述第二合成脸部图像的人脸图像。

在一种可选的实施方式中，处理模块302，还用于在生成包括所述第二合成脸部图像的人脸图像之后，利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像，输出调整后的所述包括第二合成脸部图像的人脸图像。

在一种可选的实施方式中，处理模块302对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像，具体为调用图像检测库对所述人脸图像进行人脸检测，得到所述人脸图像的原始脸部图像；对所述原始脸部图像进行人脸对齐，得到所述人脸图像的标准脸部图像。

在一种可选的实施方式中，处理模块302，还用于在利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像前，获取训练数据集，所述训练数据集包括多张人脸图像，所述人脸图像携带对应的表情标签；对所述训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，所述脸部图像集合包括所述各人脸图像各自对应的标准脸部图像；利用所述脸部图像集合中的各标准脸部图像以及所述标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。

在一种可选的实施方式中，处理模块302，还用于调用人脸识别工具库对所述训练数据集中的各人脸图像进行标注，得到所述各人脸图像各自对应的第一标注数据；根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。

在一种可选的实施方式中，处理模块302根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签，具体为对所述各人脸图像各自对应的第一标注数据进行归一化处理，得到所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。

在一种可选的实施方式中，合成模块303，还用于在利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成之后，得到第一合成脸部图像对应的特征参数。

在一种可选的实施方式中，合成模块303根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像，具体为根据所述标准脸部图像、所述第一合成脸部图像以及所述第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。

可见，图3所示的实施例中，人脸图像生成装置可以对目标人物的人脸图像进行图像处理，得到该人脸图像的标准脸部图像，并利用表情生成模型根据该标准脸部图像以及该人脸图像对应的表情标签进行表情合成，得到第一合成脸部图像，从而根据该标准脸部图像以及该第一合成脸部图像进行脸部合成，得到第二合成脸部图像，并生成包括该第二合成脸部图像的人脸图像，该过程不仅可以使得生成表情更加稳定，使得最终生成的人脸图像更加稳定，还能够满足用户对表情，尤其是微表情的编辑需求。

请参参阅图4，为本申请实施例提供的一种服务器的结构示意图。该服务器包括处理器和存储器。可选的，该服务器还可包括输入设备和/或输出设备。例如，如图4所示，本实施例中所描述的服务器可以包括：一个或多个处理器100，一个或多个输入设备200，一个或多个输出设备300和存储器400。处理器100、输入设备200、输出设备300和存储器400可以通过总线连接。其中，输入设备200和输出设备300为本申请实施例可选的设备。输入设备200、输出设备300可以是标准的有线或无线通信接口。

处理器100可以是中央处理模块(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器400可以是高速RAM存储器，也可为非不稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器400用于存储一组程序代码，输入设备200、输出设备300和处理器100可以调用存储器400中存储的程序代码。具体地：

处理器100，用于获取目标人物的人脸图像以及所述人脸图像对应的表情标签；对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；生成包括所述第二合成脸部图像的人脸图像。

在一个实施例中，处理器100，还用于在生成包括所述第二合成脸部图像的人脸图像之后，利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像；通过输出设备300输出调整后的所述包括第二合成脸部图像的人脸图像。

在一个实施例中，处理器100对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像，具体为调用图像检测库对所述人脸图像进行人脸检测，得到所述人脸图像的原始脸部图像；对所述原始脸部图像进行人脸对齐，得到所述人脸图像的标准脸部图像。

在一个实施例中，处理器100，还用于在利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像前，获取训练数据集，所述训练数据集包括多张人脸图像，所述人脸图像携带对应的表情标签；对所述训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，所述脸部图像集合包括所述各人脸图像各自对应的标准脸部图像；利用所述脸部图像集合中的各标准脸部图像以及所述标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。

在一个可选的实施例中，处理器100，还用于调用人脸识别工具库对所述训练数据集中的各人脸图像进行标注，得到所述各人脸图像各自对应的第一标注数据；根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。

在一个实施例中，处理器100根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签，具体为对所述各人脸图像各自对应的第一标注数据进行归一化处理，得到所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。

在一个实施例中，处理器100，还用于在利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成之后，得到第一合成脸部图像对应的特征参数。

在一个实施例中，处理器100根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像，具体为根据所述标准脸部图像、所述第一合成脸部图像以及所述第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。

具体实现中，本申请实施例中所描述的处理器100、输入设备200、输出设备300可执行图1A实施例、图2A实施例所描述的实现方式，也可执行本申请实施例所描述的实现方式，在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时可实现上述实施例中方法的步骤，或者，计算机程序被处理器执行时实现上述实施例中装置的各模块的功能。例如，计算机程序被处理器执行时可以实现以下方法：

生成包括所述第二合成脸部图像的人脸图像。

可选的，该计算机程序被处理器执行时还可实现上述实施例中方法的其他步骤，这里不再赘述。进一步可选的，本申请涉及的存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采样硬件的形式实现，也可以采样软件功能模块的形式实现。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为易失性的或非易失性的。例如，该计算机存储介质可以为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所揭露的仅为本申请一种较佳实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于本申请所涵盖的范围。

Claims

一种人脸图像生成方法，包括：

获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

生成包括所述第二合成脸部图像的人脸图像。
根据权利要求1所述的方法，其中，所述生成包括所述第二合成脸部图像的人脸图像之后，所述方法还包括：

利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像；

输出调整后的所述包括第二合成脸部图像的人脸图像。
根据权利要求1所述的方法，其中，所述对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像，包括：

调用图像检测库对所述人脸图像进行人脸检测，得到所述人脸图像的原始脸部图像；

对所述原始脸部图像进行人脸对齐，得到所述人脸图像的标准脸部图像。
根据权利要求1-3任一项所述的方法，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像前，所述方法还包括：

获取训练数据集，所述训练数据集包括多张人脸图像，所述人脸图像携带对应的表情标签；

对所述训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，所述脸部图像集合包括所述各人脸图像各自对应的标准脸部图像；

利用所述脸部图像集合中的各标准脸部图像以及所述标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。
根据权利要求4所述的方法，其中，所述方法还包括：

调用人脸识别工具库对所述训练数据集中的各人脸图像进行标注，得到所述各人脸图像各自对应的第一标注数据；

根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。
根据权利要求5所述的方法，其中，所述根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签，包括：

对所述各人脸图像各自对应的第一标注数据进行归一化处理，得到所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。
根据权利要求1所述的方法，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成之后，所述方法还包括：

得到第一合成脸部图像对应的特征参数；

所述根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像，包括：

根据所述标准脸部图像、所述第一合成脸部图像以及所述第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。
一种人脸图像生成装置，包括：

获取模块，用于获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

处理模块，用于对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

合成模块，用于利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

所述合成模块，还用于根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

所述处理模块，还用于生成包括所述第二合成脸部图像的人脸图像。
一种服务器，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下方法：

获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

生成包括所述第二合成脸部图像的人脸图像。
根据权利要求9所述的服务器，其中，所述生成包括所述第二合成脸部图像的人脸图像之后，所述处理器还用于执行：

利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像；

输出调整后的所述包括第二合成脸部图像的人脸图像。
根据权利要求9所述的服务器，其中，执行所述对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像，包括：

调用图像检测库对所述人脸图像进行人脸检测，得到所述人脸图像的原始脸部图像；

对所述原始脸部图像进行人脸对齐，得到所述人脸图像的标准脸部图像。
根据权利要求9-11任一项所述的服务器，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像前，所述处理器还用于执行：

获取训练数据集，所述训练数据集包括多张人脸图像，所述人脸图像携带对应的表情标签；

对所述训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，所述脸部图像集合包括所述各人脸图像各自对应的标准脸部图像；

利用所述脸部图像集合中的各标准脸部图像以及所述标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。
根据权利要求12所述的服务器，其中，所述处理器还用于执行：

调用人脸识别工具库对所述训练数据集中的各人脸图像进行标注，得到所述各人脸图像各自对应的第一标注数据；

根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。
根据权利要求9所述的服务器，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成之后，所述处理器还用于执行：

得到第一合成脸部图像对应的特征参数；

执行所述根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像，包括：

根据所述标准脸部图像、所述第一合成脸部图像以及所述第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

获取目标人物的人脸图像以及所述人脸图像对应的表情标签；

对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像；

利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像；所述第一合成脸部图像对应的表情为所述表情标签指示的表情；

根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像；所述第二合成脸部图像对应的表情为所述表情标签指示的表情；

生成包括所述第二合成脸部图像的人脸图像。
根据权利要求15所述的计算机可读存储介质，其中，所述生成包括所述第二合成脸部图像的人脸图像之后，所述计算机程序被处理器执行时还用于实现：

利用增强型超分辨率生成对抗网络模型对所述包括第二合成脸部图像的人脸图像进行图像调整，得到调整后的所述包括第二合成脸部图像的人脸图像；

输出调整后的所述包括第二合成脸部图像的人脸图像。
根据权利要求15所述的计算机可读存储介质，其中，执行所述对所述人脸图像进行人脸检测，得到所述人脸图像的标准脸部图像，包括：

调用图像检测库对所述人脸图像进行人脸检测，得到所述人脸图像的原始脸部图像；

对所述原始脸部图像进行人脸对齐，得到所述人脸图像的标准脸部图像。
根据权利要求15-17任一项所述的计算机可读存储介质，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成，得到第一合成脸部图像前，所述计算机程序被处理器执行时还用于实现：

获取训练数据集，所述训练数据集包括多张人脸图像，所述人脸图像携带对应的表情标签；

对所述训练数据集中的各人脸图像进行人脸检测，得到脸部图像集合，所述脸部图像集合包括所述各人脸图像各自对应的标准脸部图像；

利用所述脸部图像集合中的各标准脸部图像以及所述标准脸部图像对应的人脸图像携带的表情标签对生成对抗网络模型进行训练，得到训练后的生成对抗网络模型作为表情生成模型。
根据权利要求18所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还用于实现：

调用人脸识别工具库对所述训练数据集中的各人脸图像进行标注，得到所述各人脸图像各自对应的第一标注数据；

根据所述各人脸图像各自对应的第一标注数据，获得所述各人脸图像各自对应的第二标注数据作为所述各人脸图像各自对应的表情标签。
根据权利要求15所述的计算机可读存储介质，其中，所述利用表情生成模型根据所述标准脸部图像以及所述表情标签进行表情合成之后，所述计算机程序被处理器执行时还用于实现：

得到第一合成脸部图像对应的特征参数；

执行所述根据所述标准脸部图像以及所述第一合成脸部图像进行脸部合成，得到第二合成脸部图像，包括：

根据所述标准脸部图像、所述第一合成脸部图像以及所述第一合成脸部图像对应的特征参数进行脸部合成，得到第二合成脸部图像。