CN113111698B

CN113111698B - 一种基于语义感知损失的人脸标志点检测方法

Info

Publication number: CN113111698B
Application number: CN202011642933.2A
Authority: CN
Inventors: 马勇; 肖汉雄
Original assignee: Wuxi Leqi Technology Co ltd
Current assignee: Wuxi Leqi Technology Co ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2022-04-01
Anticipated expiration: 2040-12-30
Also published as: CN113111698A

Abstract

本发明公开了一种基于语义感知损失的人脸标志点检测方法，该方法属于人脸识别技术领域。所述方法通过在标记标签数据点，计算人脸特征点后采用采样的方法计算语义感知损失函数，以此来代替传统技术中对人脸上非显著特征点直接通过损失函数计算的方法。本发明公开的目的是为了解决传统技术中出现的人脸标记中由于存在语义歧义导致抠图精准度降低的问题。通过语义感知损失函数训练的模型在实际计算中能够减少语义歧义，增强网络模型的相关性，使抠图效果更加精准。

Description

一种基于语义感知损失的人脸标志点检测方法

技术领域

本发明涉及人脸识别技术领域，特别是涉及一种基于语义感知损失的人脸标志点检测方法。

背景技术

人脸抠图技术广泛应用于各大计算机视觉识别的应用上，人脸抠图是通过确认人脸的若干个特征点后进行抠取，人脸的特征点包括显著特征点和非显著特征点，显著特征点位具有具体语义的点，包括眼角、嘴角和鼻尖等，非显著特征点则因为没有面部标注没有明确定义，从而没有对应明确的语义，包括但不限于面部边缘点，传统的方法是在采样后通过点对点的方式进行计算，从而获得损失函数，但是传统的采样方法对语义没有清晰的定义，尤其是非显著特征点，神经网络在采用面部标志点定位算法计算面部特征点时，非显著特征点带来的模糊性很容易导致模型训练陷入局部最小，很多实验结果都显示，在人脸抠图过程中，背景真值特征点的模糊性对梯度具有一定的影响，容易使得模型收敛到更差的局部最优，从而说明语义歧义性弱的显著特征点相较于语义歧义性强的显著特征点在最终结果上还原性更差，因此，在最后的模型训练结果中，可被接受的面部非显著特征点容易因为其模糊性导致其精确度降低，从而导致抠图的准确性降低。

发明内容

为了解决上述传统技术中出现的人脸标记中由于存在语义歧义导致抠图精准度降低的问题，本发明提出了一种基于语义感知损失的人脸标志点检测方法，包括以下步骤：

步骤1：获取人脸待抠取图像，通过手动标记若干个标签数据点后，对人脸标志曲线进行抠取，并将每两个相邻的标签数据点之间的曲线段称为语义段；

步骤2：通过卷积神经网络定位人脸特征点；

步骤3：通过选取特征点与所述人脸标志曲线最近的标签数据进行采样计算计算步骤1所述人脸标志曲线与步骤2所述特征点距离的语义感知损失函数：

其中

和

代表第t个标签数据点的两个语义段，

为人脸标志点定位算法计算得出的人脸标志点，G为距离计算函数；

步骤4：利用采样法计算步骤3中所述语义感知损失函数的最小值，采样法的核心思想是随机抽取标签数据点的两个语义段上的多个任意点，计算随机抽取的任意点与人脸标志点之间的最小距离，从而计算语义感知损失函数的最小值，即：

其中，T代表随机抽取标签数据点的两个语义段上的任意点的个数，

为

的初始标签数据点，

为语义段上的第tm个采样点，H为定义的最小值函数；

步骤5：将步骤4中计算得出的语义感知损失函数的最小值反向传播至步骤2所述卷积神经网络，进行卷积神经网络参数更新，并保存最优模型用于人脸抠图。

优选地，步骤1所述的标签数据的数量与步骤2所述特征点的数量均为68个。

优选地，所述步骤2中的人脸特征点定位通过人脸标志点定位算法进行计算。

优选地，所述步骤3中的采样方法通过选取特征点与所述人脸标志曲线最近的标签数据进行计算。

优选地，所述步骤步骤2中的人脸标志点定位算法采用瞳孔间距离作为标准化项。

与现有技术相比，本发明具有如下有益效果：在人脸抠图过程中，通过减少语义歧义对数据标签进行采样分析后，可以获得相关性更强的网络模型，使抠图效果更加精准，另外使用语义归一化平均误差作为衡量标准来度量模型效果，可以使训练结果以客观维度展现人脸抠图的效果。

附图说明

附图1为本发明提出的一种基于语义感知损失的人脸标志点检测方法的流程图

具体实施方式

为使本发明的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。

如图1所述，为本发明提出的一种基于语义感知损失的人脸标志点检测方法，包括以下步骤：

步骤1：获取人脸待抠取图像，通过手动标记68个标签数据点后，对人脸标志曲线进行抠取，并将每两个相邻的标签数据点之间的曲线段称为语义段；

步骤2：通过卷积神经网络定位人脸特征点，人脸特征点定位通过人脸标志点定位算法进行计算，并采用瞳孔间距离作为标准化项；

其中

和

代表第t个标签数据点的两个语义段，

为

的初始标签数据点，

为语义段上的第tm个采样点，H为定义的最小值函数；

尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。