CN111652105A

CN111652105A - 一种基于深度度量学习的人脸特征点定位方法

Info

Publication number: CN111652105A
Application number: CN202010464754.8A
Authority: CN
Inventors: 吴平平
Original assignee: NANJING AUDIT UNIVERSITY
Current assignee: NANJING AUDIT UNIVERSITY
Priority date: 2020-05-28
Filing date: 2020-05-28
Publication date: 2020-09-11

Abstract

本发明公开了一种基于深度度量学习的人脸特征点定位方法，具体方法如下：（1）训练：①标定人脸三维模型特征点位置；②对三维模型进行正交投影；③获得深度图像（包括三维特征点所对应二维坐标位置）；④深度网络训练：以卷积神经网络为主要结构（样本是深度图的值，标签是特征点二维坐标）进行训练；（2）预测：①输入三维模型进行正交投影获得深度图像；②使用已训练好的深度网络对深度图像进行特征点二维坐标预测；③输出二维坐标一一反投影到三维坐标，在三维模型上得到特征点位置，本发明设计合理，利用基于三维人脸模型正交投影生成合理深度值的二维深度图像，解决了三维人脸特征点需人工手动定位以及标定三维特征点耗时长等问题。

Description

一种基于深度度量学习的人脸特征点定位方法

技术领域

本发明涉及人工智能领域，具体涉及一种基于深度度量学习的人脸特征点定位方法。

背景技术

二维人脸识别技术发展迅速，但没有很好解决光照、表情等问题。光照条件、姿态变化等因素都对二维人脸精确检测与识别有较大影响。近年，三维人脸识别技术受到了越来越多关注。相对于二维人脸识别技术，三维人脸识别技术较容易做到姿态与光照的不变性。随着技术发展，三维模型获取日趋简化，促进了三维人脸识别、三维表情识别、三维人脸分割等三维人脸方面的研究。国内外关于三维人脸特征点定位的一些研究包括：基于曲率进行特征点定位，曲率是三维研究中重要基本属性之一，且有欧氏变换不变性，Chang等综合利用平均曲率及高斯曲率定位眼眶、鼻尖、鼻梁等人脸特殊区域。基于曲率的三维特征点定位算法缺点是对于数据噪声较为敏感，除了内眼点以及鼻尖点外，其余特征点定位效果达不到要求；王蜜宫等基于局部形状图的方法，半径大小选择很关键，但大小确定较困难，选择不当直接影响结果精度，且只能对个别几个特征点进行预测；利用较成熟二维图像数据人脸特征点定位技术，辅助定位三维人脸数据特征点，但此类算法要求三维数据存在二维辅助图像，无法仅用于三维信息人脸数据。

发明内容

本发明的目的是为解决上述不足，提供一种基于深度度量学习的人脸特征点定位方法。

本发明的目的是通过以下技术方案实现的：

一种基于深度度量学习的人脸特征点定位方法，具体方法如下：（1）训练：①标定人脸三维模型特征点位置；②对三维模型进行正交投影；③获得深度图像（包括三维特征点所对应二维坐标位置）；④深度网络训练：以卷积神经网络为主要结构（样本是深度图的值，标签是特征点二维坐标）进行训练；（2）预测：①输入三维模型进行正交投影获得深度图像（不包括特征点位置）；②使用已训练好的深度网络对深度图像进行特征点二维坐标预测；③输出二维坐标一一反投影到三维坐标，在三维模型上得到特征点位置。

人脸三维模型特征点位置标记为左眼中心、左眼内侧、左眼外侧、右眼中心、右眼内侧、右眼外侧、左眉外侧、左眉内侧、右眉外侧、右眉内侧、鼻尖、嘴巴上侧、嘴巴下侧、嘴巴左侧、嘴巴右侧共计15个特征点。

深度网络的架构由卷积神经网络构成，先是输入层，经过3层以卷积层、池化层为主网络结构，然后是2层全连接层，最后是计算损失层，第一层卷积层：kernel size=5，stride=1；下接ReLU层；第一层池化层：kernel size=2，stride=2；第二层卷积层：kernelsize=5，stride=1；下接ReLU层；第二层池化层：kernel size=2，stride=2；第三层卷积层：kernel size=3，stride=1；下接ReLU层，然后下接2个全连接层，参数num_output分别为500、30。

正交投影可以得到空间三维坐标所对应二维坐标以及其对应深度值大小，即三维模型可以生成相应深度图像。

本发明具有如下有益的效果：

本发明设计合理，利用基于三维人脸模型正交投影生成合理深度值的二维深度图像，结合卷积神经网络强大的图像特征提取及拟合能力，解决了三维人脸特征点需人工手动定位以及标定三维特征点耗时长等问题。

附图说明

图1为本发明的三维人脸图像；

图2为本发明的人物1预测结构；

图3为本发明的人物2预测结构；

图4为本发明的人物3预测结构。

具体实施方式

下面结合附图对本发明作进一步的说明：

三维模型如图1所示，用正交投影矩阵：可以得到空间三维坐标所对应二维坐标以及其对应深度值大小，即三维模型可以生成相应深度图像。

数据库采用bfm数据库，库中每个三维人脸包括53490个点及106400个三角面。训练200个三维人脸人脸，每个人脸绕着xyz轴在一定范围旋转加上平移得到50个不同姿势下深度图像，增加训练样本大小。再在库中选取200个三维人脸进行后期测试。

硬件条件为显卡gtx960，本文运用GPU加速并行架构。GPU近年来发展迅速，可以极大提升计算速度。正交投影200个三维人脸时间，计算时间单CPU模式下约2h，GPU模式下约15min，提高10倍左右。训练卷积神经网络，迭代50000次，在GPU模式下训练时间为25min左右，效率比CPU模式下快很多。

从测试实验结果中选取3个三维人脸，特征点结果预测结果如图2、图3、图4所示。实验表明，运用本文方法来预测人脸，三维人脸特征点定位结果准确。

Claims

1.一种基于深度度量学习的人脸特征点定位方法，其特征在于：具体方法如下：（1）训练：①标定人脸三维模型特征点位置；②对三维模型进行正交投影；③获得深度图像（包括三维特征点所对应二维坐标位置）；④深度网络训练：以卷积神经网络为主要结构（样本是深度图的值，标签是特征点二维坐标）进行训练；（2）预测：①输入三维模型进行正交投影获得深度图像（不包括特征点位置）；②使用已训练好的深度网络对深度图像进行特征点二维坐标预测；③输出二维坐标一一反投影到三维坐标，在三维模型上得到特征点位置。

2.根据权利要求1所述的一种基于深度度量学习的人脸特征点定位方法，其特征在于：所述的人脸三维模型特征点位置标记为左眼中心、左眼内侧、左眼外侧、右眼中心、右眼内侧、右眼外侧、左眉外侧、左眉内侧、右眉外侧、右眉内侧、鼻尖、嘴巴上侧、嘴巴下侧、嘴巴左侧、嘴巴右侧共计15个特征点。

3.根据权利要求1所述的一种基于深度度量学习的人脸特征点定位方法，其特征在于：所述的深度网络的架构由卷积神经网络构成，先是输入层，经过3层以卷积层、池化层为主网络结构，然后是2层全连接层，最后是计算损失层，第一层卷积层：kernel size=5，stride=1；下接ReLU层；第一层池化层：kernel size=2，stride=2；第二层卷积层：kernel size=5，stride=1；下接ReLU层；第二层池化层：kernel size=2，stride=2；第三层卷积层：kernelsize=3，stride=1；下接ReLU层，然后下接2个全连接层，参数num_output分别为500、30。

4.根据权利要求1所述的一种基于深度度量学习的人脸特征点定位方法，其特征在于：所述的正交投影可以得到空间三维坐标所对应二维坐标以及其对应深度值大小，即三维模型可以生成相应深度图像。