CN110598595A

CN110598595A - 一种基于人脸关键点和姿态的多属性人脸生成算法

Info

Publication number: CN110598595A
Application number: CN201910808921.3A
Authority: CN
Inventors: 汪萌; 孔德鑫; 郭艳蓉; 郝世杰; 洪日昌
Original assignee: Hefei Polytechnic University
Current assignee: Hefei University of Technology; Hefei Polytechnic University
Priority date: 2019-08-29
Filing date: 2019-08-29
Publication date: 2019-12-20
Anticipated expiration: 2039-08-29
Also published as: CN110598595B

Abstract

本发明公开了一种基于人脸关键点和姿态的多属性人脸生成算法，包括如下步骤：S1、自动人脸姿态矢量估计：使用摄像机标定技术，通过寻找二维人脸关键点和三维人脸模型上的对应点关系，来近似得到摄像机矩阵，在已知摄像机矩阵的情况下，可以提取出旋转矩阵并将其转化为欧拉角，进而得到一个三维姿态矢量。本发明通过采集包括多种属性的人脸图像数据，标定每张图像的人脸关键点位置，并根据关键点信息自动计算人脸姿态，并在训练阶段，利用原始人脸图像、人脸关键点、人脸姿态三类信息作为输入，对条件生成对抗网络进行优化，最后在生成器网络的输出端得到具有相应属性的模拟人脸图像，本发明在扩充和丰富人脸图像数据库上具有实际应用价值。

Description

一种基于人脸关键点和姿态的多属性人脸生成算法

技术领域

本发明涉及图像处理相关技术领域，具体为一种基于人脸关键点和姿态的多属性人脸生成算法。

背景技术

近年来，随着大数据和人工智能的快速发展，在基于深度神经网络的人脸分析与识别领域上，已经提出了许多比较成功的算法，相比传统算法在准确性上获得了较大的提升；然而为了捕获人脸中更加精细的属性，例如脸型、嘴型、头发颜色等等，则需要对人脸图像进行更加细粒度的图像分析与学习；对不同属性的人脸图像进行识别在视频监控等领域具有非常重要的实际应用价值。

由于不同的人脸图像内容复杂多样，包含大量具有不同属性、不同人脸结构和姿态信息的大规模数据难以获得，因此，通过多属性的人脸图像生成来构建细粒度人脸数据库，对于人脸分析与识别领域的进一步发展无疑具有重大的意义。

发明内容

本发明的目的在于提供一种基于人脸关键点和姿态的多属性人脸生成算法，以解决上述背景技术中提到的由于不同的人脸图像内容复杂多样，包含大量具有不同属性、不同人脸结构和姿态信息的大规模数据难以获得的问题。

为实现上述目的，本发明提供如下技术方案：一种基于人脸关键点和姿态的多属性人脸生成算法，包括如下步骤：

S1、自动人脸姿态矢量估计：使用摄像机标定技术，通过寻找二维人脸关键点和三维人脸模型上的对应点关系，来近似得到摄像机矩阵，在已知摄像机矩阵的情况下，可以提取出旋转矩阵并将其转化为欧拉角，进而得到一个三维姿态矢量(r_x,r_y,r_y)；

S2、生成网络G：将目标属性矢量、人脸关键点矢量、人脸姿态矢量作为条件x，输入给生成网络G，通过训练得到具有目标属性、关键点和姿态的模拟人脸图像G(x)，使其能够逼近真实人脸图像y，以达到判别器无法将二者进行区分的目的；

S3、判别网络D和回归网络R：将生成网络生成的人脸图像G(x)和真实人脸图像y一同作为判别网络D的输入，通过训练来达到能够正确区分真实图像和模拟图像的目的；将生成网络生成的人脸图像G(x)和真实人脸图像y 一同作为回归网络R的输入，通过训练来达到能够正确估计图像中人脸关键点矢量的目的；

S4、条件生成对抗网络：完整的条件生成对抗网络总共包括S2中的生成网络和S3中的判别网络、回归网络三个模块，其总的优化目标函数如下:

S5、模型训练：根据S4中的优化目标函数，计算条件生成对抗网络的损失，利用反向传播算法对S2和S3中的神经网络模型参数进行学习，直到网络收敛；

S6、模型测试：给定目标属性、人脸关键点和姿态矢量作为输入，经过训练好的生成网络得到目标人脸图像，该图像具有目标属性的细粒度特征并且匹配相应人脸关键点和姿态信息。

优选的，S1中的三维姿态矢量中每一维元素对应于三维空间(x,y,z)中每一个坐标轴下的旋转。

优选的，S2中生成器可以学习出从条件x到真实图像y的映射函数， G:{x}→y，其目标函数为：

L(G)＝E_x[log(1-D(x,G(x)))]+λE_x,y[||y-G(x)||₁]+γE_x,y[|p(x)-R(G(x),y)|]。

优选的，S3中对于判别网络和回归网络，使用共享的主干网络结构，从而可以在尽可能少的增加网络复杂度的基础上，实现多任务共同学习。

优选的，S3中判别网络和回归网络的目标函数为：

L(D)＝E_x,y[logD(x,y)]+E_x[log(1-D(x,G(x)))]

L(R)＝E_x,y[|p(x)-R(G(x),y)|]

其中p(x)为x矢量中人脸关键点矢量，R(G(x),y)为从人脸图像(真实或者模拟图像)中估计出的人脸关键点。

本发明提供了一种基于人脸关键点和姿态的多属性人脸生成算法，具备以下有益效果：

本发明通过采集包括多种属性的人脸图像数据，标定每张图像的人脸关键点位置，并根据关键点信息自动计算人脸姿态，并在训练阶段，利用原始人脸图像、人脸关键点、人脸姿态三类信息作为输入，对条件生成对抗网络进行优化，最后在生成器网络的输出端得到具有相应属性的模拟人脸图像，并且在测试阶段，输入人脸关键点并给出所需要的人脸属性，再通过训练好的条件生成对抗网络，得到具有细粒度属性的人脸图像；本发明可以生成大量具有不同属性的人脸图像，在扩充和丰富人脸图像数据库上具有实际应用价值。

附图说明

图1为本发明的结构示意图

图2为本发明中人脸生成算法结果；

图3为无关键点和姿态条件的人脸生成算法结果。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

实施例：

S1、自动人脸姿态矢量估计：使用摄像机标定技术，通过寻找二维人脸关键点和三维人脸模型上的对应点关系，来近似得到摄像机矩阵，在已知摄像机矩阵的情况下，可以提取出旋转矩阵并将其转化为欧拉角，进而得到一个三维姿态矢量(r_x,r_y,r_y)，该矢量中每一维元素对应于三维空间(x,y,z)中每一个坐标轴下的旋转；

S2、生成网络G：将目标属性矢量、人脸关键点矢量、人脸姿态矢量作为条件x，输入给生成网络G，通过训练得到具有目标属性、关键点和姿态的模拟人脸图像G(x)，使其能够逼近真实人脸图像y，以达到判别器无法将二者进行区分的目的，其中生成器可以学习出从条件x到真实图像y的映射函数， G:{x}→y，其目标函数为：

L(G)＝E_x[log(1-D(x,G(x)))]+λE_x,y[||y-G(x)||₁]+γE_x,y[|p(x)-R(G(x),y)|]；

S3、判别网络D和回归网络R：将生成网络生成的人脸图像G(x)和真实人脸图像y一同作为判别网络D的输入，通过训练来达到能够正确区分真实图像和模拟图像的目的；将生成网络生成的人脸图像G(x)和真实人脸图像y 一同作为回归网络R的输入，通过训练来达到能够正确估计图像中人脸关键点矢量的目的，其中，判别网络和回归网络，使用共享的主干网络结构，从而可以在尽可能少的增加网络复杂度的基础上，实现多任务共同学习，判别网络和回归网络的目标函数为：

其中p(x)为x矢量中人脸关键点矢量，R(G(x),y)为从人脸图像(真实或者模拟图像)中估计出的人脸关键点；

S4、条件生成对抗网络：完整的条件生成对抗网络总共包括S2中的生成网络和S3中的判别网络、回归网络三个模块，其总的优化目标函数如下：

S6、模型测试：给定目标属性、人脸关键点和姿态矢量作为输入，经过训练好的生成网络得到目标人脸图像图。

对比例：

采用关键点和姿态条件的人脸生成算法结果。

实验结果：

根据给定人脸属性为：女性，高颧骨，卷发，无笑容；分别采用实施例和对比例的人脸生成算法进行图像生成，得到如下实验结果：

其中图2为本发明中人脸生成算法结果，图3为无关键点和姿态条件的人脸生成算法结果；根据实验结果可知本发明算法可以生成更加符合给定人脸属性且具有特定姿态的图片。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于人脸关键点和姿态的多属性人脸生成算法，其特征在于，包括如下步骤：

S1、自动人脸姿态矢量估计：使用摄像机标定技术，通过寻找二维人脸关键点和三维人脸模型上的对应点关系，来近似得到摄像机矩阵，在已知摄像机矩阵的情况下，可以提取出旋转矩阵并将其转化为欧拉角，进而得到一个三维姿态矢量；

S3、判别网络D和回归网络R：将生成网络生成的人脸图像G(x)和真实人脸图像y一同作为判别网络D的输入，通过训练来达到能够正确区分真实图像和模拟图像的目的；将生成网络生成的人脸图像G(x)和真实人脸图像y一同作为回归网络R的输入，通过训练来达到能够正确估计图像中人脸关键点矢量的目的；

；

2.根据权利要求1所述的一种基于人脸关键点和姿态的多属性人脸生成算法，其特征在于：S1中的三维姿态矢量中每一维元素对应于三维空间（x,y,z）中每一个坐标轴下的旋转。

3.根据权利要求1所述的一种基于人脸关键点和姿态的多属性人脸生成算法，其特征在于：S2中生成器可以学习出从条件x到真实图像y的映射函数，，其目标函数为：

。

4.根据权利要求1所述的一种基于人脸关键点和姿态的多属性人脸生成算法，其特征在于：S3中对于判别网络和回归网络，使用共享的主干网络结构，从而可以在尽可能少的增加网络复杂度的基础上，实现多任务共同学习。

5.根据权利要求1所述的一种基于人脸关键点和姿态的多属性人脸生成算法，其特征在于：S3中判别网络和回归网络的目标函数为：

其中为x矢量中人脸关键点矢量，为从人脸图像（真实或者模拟图像）中估计出的人脸关键点。