CN110188656A

CN110188656A - 多角度人脸表情图像的生成与识别方法

Info

Publication number: CN110188656A
Application number: CN201910445298.XA
Authority: CN
Inventors: 孙宁; 秦辉; 李晓飞
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University
Priority date: 2019-05-27
Filing date: 2019-05-27
Publication date: 2019-08-30
Anticipated expiration: 2039-05-27
Also published as: CN110188656B

Abstract

本发明公开了一种多角度人脸表情图像的生成与识别，将人脸局部关键特征与全局关键特征融合，并将对抗生成一致性网络CTGAN和卷积神经网络融合，形成了判别侧脸表情类别的深度神经网络，将四通道的侧脸图片送到生成器进行训练，而不是传统中将随机变量作为输入，从而最大化的保存了侧脸图片的特征信息，可以更有效的建立从侧脸到正脸图片的映射关系，提升整体识别准确率；将多种特征融合并使用卷积神经网络CNN对提取到的特征进行分类，能够极大的提升多角度人脸表情识别的准确率和鲁棒性。

Description

多角度人脸表情图像的生成与识别方法

技术领域

本发明涉及图像处理领域，涉及一种多角度人脸表情图像的生成与识别方法。

背景技术

人脸表情作为人最重要的生物特征之一，包含着丰富的信息，这些实时的情感信息，可以有效地辅助人类进行情感交流。人脸表情识别是计算机理解人类情感的前提，是计算机与人类进行交互的重要技术，因此人脸表情识别能够使得计算机具有人类一样具有察言观色的能力，以便更好地为人类服务。人脸表情识别一直是计算机视觉以及模式识别学科中的热点研究方向。

但是目前绝大多数的人脸表情识别技术都是针对标准姿态的人脸表情数据库提出的，这与现实生活中人脸姿态的变化不相符，这种传统的人脸面部表情研究往往忽视了由于姿势、光照条件以及遮挡等引起的复杂的面部变化，致使在现实条件下将人脸面部表情用于识别研究往往具有局限性。在自然状态下，人的面部姿势可能处于非正面的状态，而且可能会产生左右、上下、前后或者更复杂的运动形式，解决在多个角度的人脸表情来生成出人脸正面表情，是目前人脸生成和识别的一个难题。

发明内容

发明目的：本发明的目的是提供一种多角度人脸表情图像的生成与识别方法，该方法通过多角度侧脸人脸图像生成和识别生成的正脸表情。

技术方案：本发明所述的多角度人脸表情图像的生成与识别方法，步骤A，构建多角度的人脸表情库，人脸表情库的表情包括但不限于:害怕,轻蔑，高兴，惊讶，生气，嫌弃，悲伤,中性，尖叫，眨眼；摄像机拍摄角度包括但不限于为0°，15°，45°,75°,105°，180°；获取上述各种拍摄角度拍摄的图像并取45°摄像机拍摄图像为正脸表情图像；然后对上述各个角度的人脸图像进行配准，得到配准后的人脸表情图像集；

步骤B，构建对抗生成一致性网络CTGAN，对抗生成一致性网络CTGAN由正向对抗生成对抗网络和反向对抗生成对抗网络构成的环形网络；

步骤C，将人脸表情库的除正脸表情图像以外的侧脸表情图像进行人脸局部关键区域与人脸全局关键区域融合，融合后的侧脸表情图像与原始侧脸表情图像一起输入正向对抗生成网络FAGAN中进行学习与训练，由正向对抗生成网络生成正脸表情图像；

步骤D，将生成的正脸表情图像输入反向对抗生成网络BKGAN反向生成侧脸表情图像，然后将反向生成的侧脸表情图像与原侧脸表情图像分别在各自对应的对抗生成网络中进行判别以接受反向生成的侧脸表情图像；若确保反向生成的侧脸表情图像被对抗生成网络接受，反向对抗生成网络BKGAN将不断学习和训练直至生成与原始侧脸表情图像相比也无法判别的侧脸表情图像；

步骤E，将上述的通过反向对抗生成网络BKGAN反向生成侧脸表情图像的正脸表情图像输入到由正脸图像训练好的人脸检测器FADTC中，进行表情识别。

通过采用上述技术方案，将侧脸表情图像输入到正向对抗生成网络中生成正脸表情图像，正脸表情图像输入到反向对抗生成网络中生成侧脸表情图像，侧脸表情图像与原侧脸表情图像在对应的鉴别器中进行鉴别来区分它们，识别出生成器输出的生成图像，并拒绝此图像。生成器想要确保这些图像被鉴别器接受，所以它将尝试生成与原始图像非常接近的新图像；上述过程中，对抗生成一致性网络在生成和反向生成的过程中不断学习和训练，对抗生成一致性网络将最佳的生成和反向生成形成工作方式，这样就能在有侧脸表情图像的情况下生成最佳的正脸表情图像。由卷积神经网络构成的人脸检测器为了识别对抗生成一致性网络生成的正脸表情图像，在识别的过程中，人脸检测器保留最佳的识别正脸表情图像的工作方式，这样就能够保证对抗生成一致性网络生成的正脸表情图像正确性。

有益效果：将人脸局部关键特征与全局关键特征融合，并将对抗生成一致性网络和卷积神经网络融合，形成了判别侧脸表情类别的深度神经网络，并将四通道的侧脸表情图一起送到生成器中进行训练，从而最大化的保存了侧脸图像的特征信息，可以更有效的建立从侧脸到正脸图像的映射关系，提升整体识别准确率；将多种特征融合并使用卷积神经网络(CNN)对提取到的特征进行分类，能够极大的提升多角度人脸表情识别的准确率和鲁棒性。

附图说明

图1是本发明的整体流程图。

具体实施方式

如图1所示，一种多角度人脸表情图像的生成与识别方法，包括以下步骤：

步骤A，构建多角度的人脸表情库，人脸表情库的表情包括但不限于:害怕,轻蔑，高兴，惊讶，生气，嫌弃，悲伤,中性，尖叫，眨眼；摄像机拍摄角度包括但不限于为0°，15°，45°,75°,105°，180°；获取上述各种拍摄角度拍摄的图像并取45°摄像机拍摄图像为正脸表情图像；然后对上述各个角度的人脸图像进行配准，得到配准后的人脸表情图像集；

对抗生成一致性网络是由正向生成对抗网络和反向生成对抗网络构成的环形网络，且两个生成对抗网络呈镜像对称；侧脸表情图像通过正向生成对抗网络生成正脸表情图像；该正脸表情图像通过反向生成对抗网络生成侧脸表情图像。正向生成对抗网络和反向生成对抗网络构成均包括生成器和判别器，生成器作用是生成预测的正脸图像，判别器的作用是判别预测的正脸图像是否为原始正脸图像。正向生成对抗网络和反向生成对抗网络共享两个生成器并且各自带一个判别器。正向生成对抗网络和反向生成对抗网络均有两个loss，对抗生成一致性网络共有四个loss，loss用来更新生成器和鉴别器。

对抗生成一致性网络的生成器包括3个卷积层，9个残差层，3个转置卷积层。卷积层的卷积核尺寸为2×2，步长分别为1,2，2；目的是将256×256×3的图像的维度压缩,用来代替传统生成对抗网络中输入的随机向量；残差网络是由两个残差块构成，步长为1，使用残差网络可以解决在较深的网络层数下梯度消失和梯度爆炸的问题；转置卷积层的转置卷积核尺寸为2×2，步长为2，目的是将压缩后的向量复原为256×256×3的预测图像；

对抗生成一致性网络的判别器的包括3层卷积层和1层softmax分类层，卷积层卷积核尺寸为1×1。主要用于对侧脸生成的正脸图像恢复出的侧脸图和原始图像的比对，并不断优化调整。

将对抗生成一致性网络生成的正脸表情图像输入由卷积神经网络构成的人脸检测器中进行表情判决，卷积神经网络人脸检测器记录并分类其生成正脸表情图像的结果。

训练判别正脸表情类别的人脸检测器FADTC的具体方法：

人脸检测器的网络结构为，两层256×256×64的卷积层，两层128×128×64的卷积层，三层64×64×128的卷积层，三层32×32×256的卷积层，三层16×16×512的卷积层，3层全连接层。

将正脸表情图片中的全部表情图片贴上类别标签，输入判别正脸表情类别的人脸检测器中，训练迭代卷积神经网络人脸检测器的网络模型参数。

Claims

1.一种多角度人脸表情图像的生成与识别方法，其特征在于包括以下步骤：

2.根据权利要求1所述的多角度人脸表情图像的生成与识别方法，其特征在于在步骤B中，正向对抗生成对抗网络和反向对抗生成对抗网络呈镜像对称。

3.根据权利要求2所述的多角度人脸表情图像的生成与识别方法，其特征在于正向生成对抗网络和反向生成对抗网络构成均包括生成器和判别器，正向生成对抗网络中的生成器作用是生成预测的正脸图像，正向生成对抗网络中的判别器的作用是判别预测的正脸图像是否为原始正脸图像；反向生成对抗网络中的生成器作用是生成预测的侧脸图像，反向生成对抗网络中的判别器的作用是判别预测的侧脸图像是否为原始侧脸图像。

4.根据权利要求1所述的多角度人脸表情图像的生成与识别方法，其特征在于在步骤C中，人脸局部关键区域与人脸全局关键区域融合为使用人脸关键点算法截取侧脸表情图像的关键点区域，该关键点区域由眼睛、鼻子以及嘴巴三个关键点构成；将每个关键点区域的RGB值求和取平均并将除关键点外的其他区域设为0，处理后的图像作为第四通道连接在原侧脸表情图像的第三维度，与原侧脸表情图像一起构成四通道。

5.根据权利要求2所述的多角度人脸表情图像的生成与识别，其特征在于在步骤E中，人脸检测器由卷积神经网络构成。