WO2022016996A1

WO2022016996A1 - 图像处理方法、装置、电子设备及计算机可读存储介质

Info

Publication number: WO2022016996A1
Application number: PCT/CN2021/096713
Authority: WO
Inventors: 郑子奇; 徐国强; 邱寒
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-22
Filing date: 2021-05-28
Publication date: 2022-01-27
Also published as: CN111833413B; CN111833413A

Abstract

本申请实施例提供了一种图像处理方法、装置、电子设备及计算机可读存储介质，该方法包括：获取人脸图像集合，人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像和第三人物的指定表情的人脸图像；对人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，第一人脸特征集合包括第一人物的脸部特征、第二人物的姿态特征和第三人物的表情特征；根据第一人脸特征集合进行人脸合成，得到第一人物的合成人脸图像，第一人物的合成人脸图像具有第一人物的脸部特征、第二人物的姿态特征和第三人物的表情特征。采用本申请，能够提升生成的人脸图像的质量。此外，本申请还涉及区块链技术，第一人物的合成人脸图像可写入区块链中。

Description

图像处理方法、装置、电子设备及计算机可读存储介质

本申请要求于2020年7月22日提交中国专利局、申请号为202010710400.7，发明名称为“图像处理方法、装置、电子设备及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。

背景技术

图像生成是近年来逐渐流行的一项信息处理能力。图像生成涉及许多方面，其中，人脸图像生成是十分重要的研究领域。它的主要目的是生成质量上足以商业使用或者实验使用的人脸图像，或者是依照使用者的限制生成满足限制条件的人脸图像。

目前，针对人脸图像生成，大型投入的相关技术主要是在传媒、推广等领域，如制作虚拟人物。但是，发明人意识到，对于人脸的编辑难以做到精细化，操控的粒度不足。一方面是由于技术的不成熟，另一方面是由于相关技术需要海量数据的支撑，难以满足。同时，对于完成度较高的相关技术，也会存在诸多缺陷，例如人物身份属于无中生有、表情的表现力不够等属性不达标的问题；又或者是人脸图像的清晰度过低、图像内容单一等质量有损的问题。因此，如何提升生成的人脸图像的质量成为亟待解决的问题。

发明内容

本申请实施例提供给了一种图像处理方法、装置、电子设备及计算机可读存储介质，可以提升生成的人脸图像的质量。

第一方面，本申请实施例提供了一种图像处理方法，包括：

获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

第二方面，本申请实施例提供了一种图像处理装置，包括：

获取模块，用于获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

处理模块，用于对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

所述处理模块，还用于根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

第三方面，本申请实施例提供了一种电子设备，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下方法：

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

本申请实施例相较于现有技术针对生成人脸图像产生的人脸编辑不够精细、人脸表情的表现力不够或图像内容较为单一等导致图像质量低下的问题，采用本申请可以生成逼真的多角度的人脸表情图像，能够提升生成的人脸图像的质量。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种图像处理方法的流程示意图；

图2是本申请实施例提供的另一种图像处理方法的流程示意图；

图3是本申请实施例提供的一种图像处理装置的结构示意图；

图4是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

本申请的技术方案可涉及人工智能技术领域，如可应用于图像处理等场景中，如可具体用于生成人脸图像的场景，以提升生成的人脸图像的质量，从而推动智慧城市的建设。可选的，本申请涉及的数据如各种图像和/或特征等可存储于数据库中，或者可以存储于区块链中，本申请不做限定。

由于人脸姿态、表情的变化具有多样性和复杂性，再加上现有技术的人脸图像生成技术上的缺陷，如人脸生成模型特有的不稳定性和可能导致的细节缺失，使得多角度的人脸表情图像生成十分困难，并且生成的人脸图像的质量也不高，为了实现多角度的人脸表情图像的生成，并保证其生成的人脸图像的质量，本申请实施例提供了一种图像处理方案，该图像处理方案可以应用在美颜，动图合成，视频制作，虚拟人物捏造(如虚拟游戏人物捏造)等等应用场景下，通过该图像处理方案可以达到人脸变换、人脸编辑等效果。

本申请实施例所述的图像处理方案具体为：获取人脸图像集合，该人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，该第一人脸特征集合包括该第一人物的脸部特征、该第二人物的姿态特征以及该第三人物的表情特征；根据该第一人脸特征集合进行人脸合成，得到该第一人物的合成人脸图像，该第一人物的合成人脸图像具有该第一人物的脸部特征、该第二人物的姿态特征以及该第三人物的表情特征。采用上述过程能够生成多角度的不同表情人脸，并且在编辑人脸属性具有一定准确度的同时满足一定的图像质量要求，

在一个应用场景中，用户可以将人物A的正面照片、人物B的侧面，如右侧转60°的照片以及人物B的表情照片上传到电子设备中，然后采用上述提及的图像处理方案，便可以合成人物A的侧面带表情的照片，此处的表情为人物B的表情照片对应的表情。人物A可以是用户自己也可以是其他人。

在一个应用场景中，用户可以将人物A的正面照片上传到电子设备中，并从电子设备提供的多张照片中选取人物B的侧面照片以及人物B的表情照片以用于人脸合成，然后用户可以通过点击合成按钮提交合成指令至电子设备，电子设备在检测到合成指令后，可以获取该人物A的正面照片、人物B侧面照片以及人物B的表情照片，然后采用上述提及的图像处理方案，便可以合成人物A的侧面带表情的照片，此处的表情为人物B的表情照片对应的表情。

在一个应用场景中，电子设备可以为用户提供人脸合成界面，使得用户能够基于该人脸合成界面设置人脸图像集合，如设置人物A的正面照片，人物B的侧面照片以及人物B的表情照片。该人脸合成界面可以包括合成按钮，用户可以通过点击该合成按钮提交合成指令至电子设备，电子设备可以在检测到合成指令后，获取该人脸图像集合。在一个实施例中，该合成指令可以携带人脸图像集合，如人物A的正面照片，人物B的侧面照片以及人物B的表情照片。

在一个实施例中，为了避免出现利用合成人脸图像冒充真实人脸来用于犯罪的情况，因此可以将第一人物的合成人脸图像写入区块链中，以达到对合成人脸图像溯源的目的。或，电子设备可以将第一人物的合成人脸图像以及请求合成该合成人脸图像的用户的标识或该用户对应的用户终端的设备信息写入区块链中。其中，用户的标识，例如可以为用户的账号或用户的手机号等可以用于唯一标识该用户的信息。用户终端的设备信息，例如可以为用户终端的物理地址、设备编号、网际协议地址等用于唯一标识该用户终端的信息。在一个实施例中，本申请实施例所指的电子设备可以为该用户对应的用户终端，也可以不为。在一个实施例中，电子设备在对第一人物的合成人脸图像进行矫正的情况下，可以将矫正后的第一人物的合成人脸图像写入区块链中。

在一个实施例中，考虑到合成人脸图像的私密性，也可以对第一人物的合成人脸图像进行摘要计算，得到摘要信息，然后将摘要信息写入区块链中。本申请实施例对于计算第一人物的合成人脸图像的摘要信息所采用的算法不做限制。相应地，还可以对第一人物的合成人脸图像以及上述提及的用户的标识进行摘要计算，得到第一摘要信息，然后将第一摘要信息写入区块链中，或还可以对第一人物的合成人脸图像以及上述提及的用户终端的设备信息进行摘要计算，得到第二摘要信息，然后将第二摘要信息写入区块链中。在一个实施例中，电子设备在对第一人物的合成人脸图像进行矫正的情况下，可以对矫正后的第一人物的合成人脸图像进行摘要计算，得到第三摘要信息，然后将第三摘要信息写入区块链中，同理，也可以在此引入用户的标识或用户终端的设备信息一并与第一人物的合成人脸图像进行摘要计算得到相应的摘要信息以写入区块链中，本申请实施例在此不做赘述。

请参阅图1，为本申请实施例提供的一种图像处理方法的流程示意图。该方法可以应用在电子设备中，该电子设备可以为终端或服务器。所指的终端，如可以为笔记本电脑、台式电脑等智能终端，所指的服务器包括但不限于单个的服务器或服务器集群。具体地，该方法可以包括以下步骤：

S101、获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像。

其中，第一人物、第二人物、第三人物相互之间可以相同或不同。指定姿态也可以称为固定姿态，例如，该指定姿态可以为指定的左右转角、指定的上下转角或指定的平面内的转角。本申请实施例所述的姿态可以是指脸部的姿态。相应地，指定表情也可以称为固定表情，例如，该指定表情可以为生气、开心或悲伤。本申请实施例所述的人脸图像可以是指包括人物的脸部的图像，也就是说可以是指包括人脸的图像。

在一个实施例中，电子设备可以在检测到合成指令时，执行步骤S101。

在一个实施例中，在检测到合成指令时，所述的获取人脸图像集合的过程可以为电子设备获取人脸图像集合请求携带的人脸图像集合。或，在检测到合成指令时，所述的获取人脸图像集合的过程可以为电子设备从指定目录中读取该人脸图像集合。

S102、对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

其中，所述的脸部特征也可以称为面部特征。所指的姿态特征可以是指脸部的姿态特征。

在一个实施例中，电子设备可以调用特征提取算法对人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合。采用该过程能够有效进行特征提取，保障提取的特征的准确性。

在一个实施例中，电子设备具体可以调用特征提取算法对第一人物的人脸图像进行特征提取，得到第一人物的脸部特征，对第二人物的指定姿态的人脸图像进行特征提取，得到第二人物的姿态特征、对第三人物的指定表情的人脸图像进行特征提取，得到第三人物的表情特征。

在一个实施例中，根据提取的特征的不同，电子设备所采用的特征提取算法也可以不同。例如，电子设备具体可以采用脸部特征提取算法对第一人物的人脸图像进行特征提取，采用姿态特征提取算法对第二人物的指定姿态的人脸图像进行特征提取，采用表情特征提取算法对第三人物的指定表情的人脸图像进行特征提取。

S103、根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

本申请实施例中，电子设备可以根据第一人脸特征集合进行特征融合，从而得到第一人物的合成人脸图像。在得到第一人物的合成人脸图像后，电子设备可以输出该第一人物的合成人脸图像。采用该过程得到的第一人物的合成人脸图像对应的脸为第一人物的脸，第一人物的合成人脸图像对应的姿态为前述提及的指定姿态，并且第一人物的合成人脸图像对应的表情为前述提及的指定表情。

在一个实施例中，为了有效地进行特征融合，电子设备具体可以根据预设的融合参数以及该第一人脸特征集合进行人脸合成，得到该第一人物的合成人脸图像。其中，所述的融合参数可以根据经验设置。

在一个实施例中，为了有效地进行特征融合，电子设备还可以根据该第一人脸特征集合进行上采样，得到第一人物的合成人脸图像。其中，上采样可以包括以下任一项：双线性插值、最近邻插值、转置卷积。

可见，图1所示的实施例中，电子设备可以获取人脸图像集合，该人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；电子设备可以对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，并根据该第一人脸特征集合进行人脸合成，得到该第一人物的合成人脸图像，该第一人物的合成人脸图像具有该第一人物的脸部特征、该第二人物的姿态特征以及该第三人物的表情特征，采用上述过程可以生成逼真的多角度的人脸表情图像，能够提升生成的人脸图像的质量。

请参阅图2，为本申请实施例提供的另一种图像处理方法的流程示意图。该方法可以应用在电子设备中，该电子设备可以为终端或服务器。所指的终端，如可以为笔记本电脑、台式电脑等智能终端，所指的服务器包括但不限于单个的服务器或服务器集群。相较于图1实施例，本申请实施例可以通过步骤S204-S206的图像矫正过程提升合成人脸图像的稳定性，使得输出的合成人脸图像的质量更高。具体地，该方法可以包括以下步骤：

S201、获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像。

S202、对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

S203、根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

其中，步骤S201-步骤S203可参见图1实施例中的步骤S101-步骤S103，本申请实施例在此不做赘述。

S204、对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果。

S205、根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像。

S206、输出矫正后的所述第一人物的合成人脸图像。

在步骤S204-步骤S206中，为了使得输出的合成人脸图像更加真实稳定，电子设备可以对第一人物的合成人脸图像进行矫正。具体地，电子设备可以对第一人物的合成人脸图像进行图像检测，得到图像检测结果，并根据图像检测结果对该第一人物的合成人脸图像进行矫正，从而得到矫正后的该第一人物的合成人脸图像，并输出该矫正后的该第一人物的合成人脸图像。

在一个实施例中，电子设备对第一人物的合成人脸图像进行图像检测，得到图像检测结果，并根据图像检测结果对该第一人物的合成人脸图像进行矫正，得到矫正后的该第一人物的合成人脸图像的过程可以如下：电子设备对第一人物的合成人脸图像进行人脸检测，得到第一人物的合成人脸图像中的多个关键点中每个关键点的坐标作为图像检测结果；电子设备计算每个关键点的坐标变换到该关键点对应的预设关键点的坐标使用的变换矩阵；电子设备根据该第一人物的合成人脸图像以及该变换矩阵得到矫正后的第一人物的合成人脸图像。此处的关键点可以是指人脸关键点。其中，预设关键点可以是指人脸图像集合中任一图像或指定图像的关键点。由于关键点是人脸非常重要的属性之一，所以通过对某个人、某种头部转姿或某种表情的人脸检测其关键点，以用于对生成的人脸的关键点进行矫正，可以使得输出的合成人脸图像在大部分情况下更稳定，降低合成人脸图像畸变的可能性，通过矫正可以使得合成人脸图像看起来更加正常。

在一个实施例中，为了有效地进行特征提取，电子设备对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合的过程还可以为电子设备利用训练后的卷积神经网络模型对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合。

在一个实施例中，电子设备利用训练后的卷积神经网络模型对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合的过程具体可以为电子设备利用训练后的卷积神经网络模型包括的卷积层对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合。

在一个实施例中，为了有效地进行特征融合，电子设备根据该第一人脸特征集合进行人脸合成，得到该第一人物的合成人脸图像的过程还可以为电子设备根据该第一人脸特征集合进行上采样，得到第一人物的合成人脸图像。其中，上采样可以包括以下任一项：双线性插值、最近邻插值、转置卷积。

在一个实施例中，电子设备具体可以通过训练后的卷积神经网络模型对该第一人脸特征集合进行上采样，得到第一人物的合成人脸图像。通过训练后的卷积神经网络模型实现上采样，将使得上采样的效率更高。

在一个实施例中，当上采样包括双线性插值时，电子设备具体可以通过训练后的卷积神经网络模型根据第一人脸特征集合执行双线性插值操作，得到第一人物的合成人脸图像。采用双线性插值的方法得到的图像的质量较高，不会出现像素值不连续的情况。

在一个实施例中，当上采样包括双线性插值时，电子设备具体可以根据第一人脸特征集合构建特征图，然后利用训练后的卷积神经网络模型根据该特征图执行双线性插值操作，得到第一人物的合成人脸图像。其中，采用双线性插值的方法的处理过程可以参见如下公式：

y _i,j＝x _i-,j-(1-Δi)(1-Δj)+x _j+,j-Δi(1-Δj)+x _i-,j+(1-Δi)Δj+x _i+,j+ΔiΔj公式1.1；

其中，y表示合成人脸图像。x表示特征图。Δi＝i-i ^-。Δj＝j-j ^-。i表示目标位置的像素的横坐标，j表示目标位置的像素的纵坐标。i ^-表示对i向下取整，i ⁺表示对i向上取整。j ^-表示对j向下取整。j ⁺表示对j向上取整。

在一个实施例中，可以将y作为第一人物的合成人脸图像。

在一个实施例中，还可以在得到y之后，将y输入到训练后的卷积神经网络模型中的第一卷积层执行卷积操作，得到最终的合成人脸图像作为第一人物的合成人脸图像。或，还可以在得到y之后，将y输入到第一卷积层执行卷积操作，得到第一合成人脸图像，然后根据第一合成人脸图像执行双线性操作，得到最终的合成人脸图像作为第一人物的合成人脸图像。上述过程配合双线性插值操作与卷积操作，能够使得最终的合成人脸图像拥有更高的分辨率。

需要说明的是，本申请实施例所指的双线性插值本质上就是找到x中目标位置(i，j)周围的四个像素，利用这四个像素的像素值计算出y在该目标位置的像素的像素值。

在一个实施例中，当上采样包括最近邻插值时，电子设备具体可以通过训练后的卷积神经网络模型根据第一人脸特征集合执行最近邻插值操作，得到第一人物的合成人脸图像。

在一个实施例中，当上采样包括最近邻插值时，电子设备具体可以根据第一人脸特征集合构建特征图，然后利用训练后的卷积神经网络模型根据该特征图执行最近邻插值操作，得到第一人物的合成人脸图像。其中，采用最近邻插值的方法的处理过程可以参见如下公式：

其中，y表示合成人脸图像。x表示特征图。i表示目标位置的像素的横坐标，j表示目标位置的像素的纵坐标。u表示x中的像素的横坐标，v表示x中的像素的纵坐标。

在一个实施例中，可以将y作为第一人物的合成人脸图像。

在一个实施例中，可以在得到y之后，将y输入到训练后的卷积神经网络模型的第二卷积层执行卷积操作，得到最终的合成人脸图像。此处的第二卷积层可以与前述第一卷积层相同或不同。或，还可以在得到y之后，将y输入到第二卷积层执行卷积操作，得到第二合成人脸图像，然后根据第二合成人脸图像执行最近邻插值操作，得到最终的合成人脸图像作为第一人物的合成人脸图像。

需要说明的是，本申请实施例所指的最近邻插值本质上就是找到源图像中距离目标位置(i,j)最近的像素的像素值作为合成人脸图像中该目标位置的像素的像素值。

在一个实施例中，当上采样包括转置卷积时，电子设备具体可以通过训练后的卷积神经网络模型包括的转置卷积层根据第一人脸特征集合进行转置卷积，得到第一人物的合成人脸图像。

在一个实施例中，电子设备具体可以利用该第一人脸特征集合构建特征图，并利用该训练后的卷积神经网络模型包括的转置卷积层对该特征图进行转置卷积，得到该第一人物的合成人脸图像。其中，采用转置卷积的方法的处理过程可以参见如下公式：

其中，y表示合成人脸图像。x表示特征图。k表示转置卷积层的卷积核。c表示卷积核的列，r表示卷积核的行，r'表示卷积核的滑动窗口滑动的区域的行。row表示列，col表示行。I表示预设的列范围，J表示预设的行范围。

在一个实施例中，可以将y作为第一人物的合成人脸图像。

在一个实施例中，还可以多次执行转置卷积的操作，从而得到最终的合成人脸图像作为第一人物的合成人脸图像。例如，电子设备可以在一个转置卷积层后再接另一个转置卷积层，然后，后一个转置卷积层便可以根据上一个转置卷积层的输出执行转置卷积的操作，从而得到最终的合成人脸图像作为第一人物的合成人脸图像。

在一个实施例中，前述提及的训练后的卷积神经网络模型可以通过如下方式得到：

1、电子设备获取人脸图像数据集，该人脸图像数据集包括至少一组图像，该至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像。例如，该至少一组图像中的一组图像可以包括人物C的人脸图像、54种表情中每种表情对应的一张人脸图像、4种姿态中每种姿态对应的一张人脸图像。

2、电子设备利用该人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。

具体地，电子设备利用该人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型的过程可以如下：

①电子设备对该至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合。其中，目标组图像可以为该至少一组图像中的任一组图像，或为从该至少一组图像中随机选取的任一组图像。在一个实施例中，电子设备可以通过初始的卷积神经网络模型对该至少一组图像中的目标组图像进行特征提取。在一个实施例中，电子设备具体可以通过初始的卷积神经网络模型包括的卷积层对该至少一组图像中的目标组图像进行特征提取。

②电子设备利用初始的卷积神经网络模型对该第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像。在一个实施例中，电子设备可以利用初始的卷积神经网络模型根据该第二人脸特征集合执行双线性插值的操作，得到至少一张第一合成人脸图像，或电子设备可以利用初始的卷积神经网络根据该第二人脸特征集合执行最近邻插值，得到至少一张第一合成人脸图像，或电子设备可以利用初始的卷积神经网络模型包括的转置卷积层根据该第二人脸特征集合进行转置卷积，得到至少一张第一合成人脸图像。

③电子设备通过该初始的卷积神经网络模型对该至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到该每张第一合成人脸图像对应的第二合成人脸图像，该第二合成人脸图像与该目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。其中，相匹配可以是相近、相似或相同的含义。本申请实施例中，电子设备可以重复执行①-③中的通过该初始的卷积神经网络模型对该至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到该每张第一合成人脸图像对应的第二合成人脸图像的过程，直到模型收敛，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。

在一个实施例中，电子设备通过该初始的卷积神经网络模型对该至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到该每张第一合成人脸图像对应的第二合成人脸图像的过程可以是电子设备对该每张第一合成人脸图像以及原人脸图像进行特征提取，得到第三人脸特征集合，然后通过初始的卷积神经网络模型对该第三人脸特征集合进行上采样，得到该每张第一合成人脸图像对应的第二合成人脸图像。

可见，图2所示的实施例中，电子设备可以通过对第一人物的合成人脸图像进行矫正，得到矫正后的第一人物的合成人脸图像，该过程使得输出的合成人脸图像更加稳定真实。

请参阅图3，为本申请实施例提供的一种图像处理装置的结构示意图。该装置可以应用于前述提及的电子设备。具体地，该装置可以包括：

获取模块301，用于获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像。

处理模块302，用于对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

处理模块302，还用于根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

在一种可选的实施方式中，处理模块302根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，具体为利用训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，所述上采样包括以下任一项：双线性插值、最近邻插值、转置卷积。

在一种可选的实施方式中，所述上采样包括转置卷积，处理模块302利用所述训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，具体为利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像。

在一种可选的实施方式在，处理模块302利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像，具体为利用所述第一人脸特征集合构建特征图；利用所述训练后的卷积神经网络模型包括的转置卷积层对所述特征图进行转置卷积，得到所述第一人物的合成人脸图像。

在一种可选的实施方式中，所述图像处理装置还包括输出模块303。

在一种可选的实施方式中，处理模块302，还用于在得到所述第一人物的合成人脸图像之后，对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果；根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像。

在一种可选的实施方式中，输出模块303，用于输出矫正后的所述第一人物的合成人脸图像。

在一种可选的实施方式中，处理模块302，还用于获取人脸图像数据集，所述人脸图像数据集包括至少一组图像，所述至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像；利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。

在一种可选的实施方式中，处理模块302利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，具体为对所述至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合；利用初始的卷积神经网络模型对所述第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像；通过所述初始的卷积神经网络模型对所述至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到所述每张第一合成人脸图像对应的第二合成人脸图像，所述第二合成人脸图像与所述目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。

可见，图3所示的实施例中，图像处理装置可以获取人脸图像集合，该人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；图像处理装置可以对该人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，并根据该第一人脸特征集合进行人脸合成，得到该第一人物的合成人脸图像，该第一人物的合成人脸图像具有该第一人物的脸部特征、该第二人物的姿态特征以及该第三人物的表情特征，采用上述过程可以生成逼真的多角度的人脸表情图像，能够提升生成的人脸图像的质量。

请参阅图4，为本申请实施例提供的一种电子设备的结构示意图。该电子设备包括处理器和存储器。可选的，该电子设备还可包括输入设备和/或输出设备。例如，如图4所示，本实施例中所描述的电子设备可以包括：一个或多个处理器1000，一个或多个输入设备2000，一个或多个输出设备3000和存储器4000。处理器1000、输入设备2000、输出设备3000和存储器4000可以通过总线连接。其中，输入设备2000和输出设备3000为该电子设备中可选的设备，即该电子设备可以仅包括处理器1000和存储器4000。在一个实施例中，输入设备2000、输出设备3000可以是标准的有线或无线通信接口。在一个实施例中，输入设备2000可以为触摸屏或触摸显示屏，输出设备3000可以为显示屏或触摸显示屏，本申请实施例不做限制。

处理器1000可以是中央处理模块(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器4000可以是高速RAM存储器，也可为非不稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器4000用于存储一组程序代码，输入设备2000、输出设备3000和处理器1000可以调用存储器4000中存储的程序代码。具体地：

处理器1000，用于获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。

在一个实施例中，处理器1000根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，具体为利用训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，所述上采样包括以下任一项：双线性插值、最近邻插值、转置卷积。

在一个实施例中，所述上采样包括转置卷积，处理器1000利用所述训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，具体为利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像。

在一个实施例中，处理器1000利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像，具体为利用所述第一人脸特征集合构建特征图；利用所述训练后的卷积神经网络模型包括的转置卷积层对所述特征图进行转置卷积，得到所述第一人物的合成人脸图像。

在一个实施例中，处理器1000，还用于在得到所述第一人物的合成人脸图像之后，对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果；根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像；通过输出设备3000输出矫正后的所述第一人物的合成人脸图像。

在一个实施例中，处理器1000，还用于获取人脸图像数据集，所述人脸图像数据集包括至少一组图像，所述至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像；利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。

在一个实施例中，处理器1000利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，具体为对所述至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合；利用初始的卷积神经网络模型对所述第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像；通过所述初始的卷积神经网络模型对所述至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到所述每张第一合成人脸图像对应的第二合成人脸图像，所述第二合成人脸图像与所述目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。

具体实现中，本申请实施例中所描述的处理器1000、输入设备2000、输出设备3000可执行图1实施例、图2实施例所描述的实现方式，也可执行本申请实施例所描述的实现方式，在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时可实现上述实施例中方法的步骤，或者，计算机程序被处理器执行时实现上述实施例中装置的各模块的功能。例如，计算机程序被处理器执行时可以实现以下方法：

可选的，该计算机程序被处理器执行时还可实现上述实施例中方法的其他步骤，这里不再赘述。进一步可选的，本申请涉及的存储介质如计算机可读存储介质可以是非易失性的，也可以是易失性的。

在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采样硬件的形式实现，也可以采样软件功能模块的形式实现。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为易失性的或非易失性的。例如，该计算机存储介质可以为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。所述的计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

其中，本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所揭露的仅为本申请一种较佳实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于本申请所涵盖的范围。

Claims

一种图像处理方法，包括：

获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。
根据权利要求1所述的方法，其中，所述根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，包括：

利用训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，所述上采样包括以下任一项：双线性插值、最近邻插值、转置卷积。
根据权利要求2所述的方法，其中，所述上采样包括转置卷积，所述利用所述训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，包括：

利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像。
根据权利要求3所述的方法，其中，所述利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像，包括：

利用所述第一人脸特征集合构建特征图；

利用所述训练后的卷积神经网络模型包括的转置卷积层对所述特征图进行转置卷积，得到所述第一人物的合成人脸图像。
根据权利要求1-4任一项所述的方法，其中，所述得到所述第一人物的合成人脸图像之后，所述方法还包括：

对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果；

根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像；

输出矫正后的所述第一人物的合成人脸图像。
根据权利要求2-4任一项所述的方法，其中，所述方法还包括：

获取人脸图像数据集，所述人脸图像数据集包括至少一组图像，所述至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像；

利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。
根据权利要求6所述的方法，其中，所述利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，包括：

对所述至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合；

利用初始的卷积神经网络模型对所述第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像；

通过所述初始的卷积神经网络模型对所述至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到所述每张第一合成人脸图像对应的第二合成人脸图像，所述第二合成人脸图像与所述目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。
一种图像处理装置，包括：

获取模块，用于获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

处理模块，用于对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

所述处理模块，还用于根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。
一种电子设备，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下方法：

获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。
根据权利要求9所述的电子设备，其中，执行所述根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，包括：

利用训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，所述上采样包括以下任一项：双线性插值、最近邻插值、转置卷积。
根据权利要求10所述的电子设备，其中，所述上采样包括转置卷积，执行所述利用所述训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，包括：

利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像。
根据权利要求9-11任一项所述的电子设备，其中，所述得到所述第一人物的合成人脸图像之后，所述处理器还用于执行：

对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果；

根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像；

输出矫正后的所述第一人物的合成人脸图像。
根据权利要求10-11任一项所述的电子设备，其中，所述处理器还用于执行：

获取人脸图像数据集，所述人脸图像数据集包括至少一组图像，所述至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像；

利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。
根据权利要求13所述的电子设备，其中，执行所述利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，包括：

对所述至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合；

利用初始的卷积神经网络模型对所述第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像；

通过所述初始的卷积神经网络模型对所述至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到所述每张第一合成人脸图像对应的第二合成人脸图像，所述第二合成人脸图像与所述目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下方法：

获取人脸图像集合，所述人脸图像集合包括第一人物的人脸图像、第二人物的指定姿态的人脸图像以及第三人物的指定表情的人脸图像；

对所述人脸图像集合中各人脸图像进行特征提取，得到第一人脸特征集合，所述第一人脸特征集合包括所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征；

根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，所述第一人物的合成人脸图像具有所述第一人物的脸部特征、所述第二人物的姿态特征以及所述第三人物的表情特征。
根据权利要求15所述的计算机可读存储介质，其中，执行所述根据所述第一人脸特征集合进行人脸合成，得到所述第一人物的合成人脸图像，包括：

利用训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，所述上采样包括以下任一项：双线性插值、最近邻插值、转置卷积。
根据权利要求16所述的计算机可读存储介质，其中，所述上采样包括转置卷积，执行所述利用所述训练后的卷积神经网络模型对所述第一人脸特征集合进行上采样，得到所述第一人物的合成人脸图像，包括：

利用所述训练后的卷积神经网络模型包括的转置卷积层对所述第一人脸特征集合进行转置卷积，得到所述第一人物的合成人脸图像。
根据权利要求15-17任一项所述的计算机可读存储介质，其中，所述得到所述第一人物的合成人脸图像之后，所述计算机程序被处理器执行时还用于实现：

对所述第一人物的合成人脸图像进行图像检测，得到图像检测结果；

根据所述图像检测结果对所述第一人物的合成人脸图像进行人脸矫正，得到矫正后的所述第一人物的合成人脸图像；

输出矫正后的所述第一人物的合成人脸图像。
根据权利要求16-17任一项所述的计算机可读存储介质，其中，所述计算机程序被处理器执行时还用于实现：

获取人脸图像数据集，所述人脸图像数据集包括至少一组图像，所述至少一组图像中的每组图像包括原人脸图像、至少一种姿态中每种姿态对应的至少一张人脸图像以及至少一种表情中每种表情对应的至少一张人脸图像；

利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型。
根据权利要求19所述的计算机可读存储介质，其中，执行所述利用所述人脸图像数据集对初始的卷积神经网络模型进行训练，得到训练后的卷积神经网络模型，包括：

对所述至少一组图像中的目标组图像进行特征提取，得到第二人脸特征集合；

利用初始的卷积神经网络模型对所述第二人脸特征集合进行上采样，得到至少一张第一合成人脸图像；

通过所述初始的卷积神经网络模型对所述至少一张第一合成人脸图像中每张第一合成人脸图像进行还原处理，得到所述每张第一合成人脸图像对应的第二合成人脸图像，所述第二合成人脸图像与所述目标组人脸图像包括的原人脸图像相匹配，得到收敛的卷积神经网络模型作为训练后的卷积神经网络模型。