CN108268840A

CN108268840A - 一种人脸跟踪方法及装置

Info

Publication number: CN108268840A
Application number: CN201810021959.1A
Authority: CN
Inventors: 王斌; 王刚
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2018-01-10
Filing date: 2018-01-10
Publication date: 2018-07-10
Anticipated expiration: 2038-01-10
Also published as: CN108268840B

Abstract

本申请提供一种人脸跟踪方法及装置，用以降低关键点跟踪对初始形状的依赖性以及提高关键点跟踪对复杂环境的鲁棒性。所述人脸跟踪方法包括：根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状；对所述初始形状进行降噪处理；将降噪后所述初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状。

Description

一种人脸跟踪方法及装置

技术领域

本申请涉及人脸识别领域，尤其涉及一种人脸跟踪方法及装置。

背景技术

随着计算机和图像处理等技术的高速发展，人脸识别技术也得到了长足的进步；人脸识别不仅可以用在图像处理上，而且，也可以应用在身份鉴别等领域，因此，近些年来，人脸识别也一直是研究的一个热点。

人脸关键点的检测是人脸识别的基础，为了能够准确地识别出视频流中的人脸，需要对视频流中的每一个人脸进行人脸关键点跟踪。所谓人脸关键点，指的是能够反映人脸特征的信息，比如眼睛、眉毛、鼻子、嘴巴、以及脸部外轮廓等。

但关键点跟踪算法依赖初始形状，受光照、遮挡、姿态表情影响严重，因而如何降低关键点跟踪对初始形状的依赖性以及提高关键点跟踪对复杂环境的鲁棒性是亟待解决的技术问题。

发明内容

本申请提供一种人脸跟踪方法及装置，用以降低关键点跟踪对初始形状的依赖性以及提高关键点跟踪对复杂环境的鲁棒性。

本申请实施例提供一种人脸跟踪方法，所述方法包括：

根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状；

对所述初始形状进行降噪处理；

将降噪后所述初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状。

优选的，所述对所述初始形状进行降噪处理，具体包括：

对训练集中多个训练人脸图像的真实形状进行归一化；

将归一化后的所述训练人脸图像对应的样本形状进行PCA降维，得到n个主形状；

根据n个所述主形状对所述初始形状进行形状重构，获得降噪后的所述初始形状。

优选的，所述对训练集中多个训练人脸图像的真实形状进行归一化，具体包括：

将训练集中的任一所述训练人脸图像对应的所述真实形状作为预设基准形状，将所有剩下的所述训练人脸图像对应的所述真实形状对齐到该所述预设基准形状；

计算对齐到所述预设基准形状后的所有所述训练人脸图像对应的所述真实形状的平均形状，并将其作为基准形状；

将所有所述训练人脸图像对应的所述真实形状对齐到该所述基准形状；

至少重复一次计算对齐到所述基准形状后的所有所述真实形状的平均形状，并每一次相应将所有所述真实形状对齐到重新确定的平均形状，直到终止条件。

优选的，所述将降噪后所述初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状，具体包括：

将降噪后的所述初始形状根据关键点的关联性划分为多个组；

在每一迭代回归预测阶段，分别计算每一组的形状增量；

将每一组的所述形状增量进行融合，得到当前阶段的最终形状增量；

根据当前阶段的所述最终形状增量，更新当前阶段的形状并作为下一阶段的起始形状。

优选的，所述计算每一组的形状增量，具体包括：

通过下式计算每一组的形状增量，

其中groupi表示第i个分组的形状约束，W_groupi为在gourpi上提取到的特征，I为人脸图像，S_groupi为当前阶段的人脸形状，ΔS_groupi为groupi得到的形状增量。

优选的，所述将每一组的所述形状增量进行融合，得到当前阶段的最终形状增量，具体包括：

计算所有所述分组的所述形状增量的平均值，并将该所述平均值作为当前阶段的最终形状增量；或者，通过对各个所述分组的所述形状增量与形状残差的相似性进行加权，得到当前阶段的最终形状增量，其中，所述形状残差为该所述分组的当前形状与该所述分组的真实形状的差。

本申请实施例还提供一种人脸跟踪装置，所述装置包括：

初始形状确定模块，用于根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状；

降噪模块，用于对所述初始形状进行降噪处理；

预测形状确定模块，用于将降噪后所述初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状。

优选的，所述降噪模块，具体包括：

归一化模块，用于对训练集中多个训练人脸图像的真实形状进行归一化；

降维模块，用于将归一化后的所述训练人脸图像对应的样本形状进行PCA降维，得到n个主形状；

重构模块，用于根据n个所述主形状对所述初始形状进行形状重构，获得降噪后的所述初始形状。

优选的，所述归一化模块具体用于：

优选的，所述预测形状确定模块，具体包括：

划分模块，用于将降噪后的所述初始形状根据关键点的关联性划分为多个组；

计算模块，用于在每一迭代回归预测阶段，分别计算每一组的形状增量；

融合模块，用于将每一组的所述形状增量进行融合，得到当前阶段的最终形状增量；

更新模块，用于根据当前阶段的所述最终形状增量，更新当前阶段的形状并作为下一阶段的起始形状。

优选的，所述计算模块具体用于：

通过下式计算每一组的形状增量，

优选的，所述融合模块具体用于：

本申请实施例的有益效果如下：本申请实施例提供的人脸跟踪方法，包括：根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状，对初始形状进行降噪处理，将降噪后初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状，其中，由于对初始形状进行降噪处理，进而可以抑制人脸跟踪算法中形状的误差累积，提高预测精度，降低关键点跟踪对初始形状的依赖性；而对降噪后初始形状在融合形状约束下进行级联回归预测，可以在环境复杂度较小的情况下松弛约束，在环境复杂较大的情况下增强约束，能给自适应地调整形状约束的强度，适应环境变化，提高关键点跟踪对复杂环境的鲁棒性，以及实现对复杂表情的较好预测效果。

附图说明

图1为本申请实施例提供的人脸跟踪方法的流程示意图；

图2为本申请实施例提供的对初始形状降噪方法的流程示意图；

图3为本申请实施例提供的对训练集中的人脸图像进行归一化方法的流程示意图；

图4为本申请实施例提供的一种具体的对初始形状降噪方法的流程示意图；

图5为本申请实施例提供的对降噪后的初始形状进行级联回归预测方法的流程示意图；

图6为本申请实施例提供的一种具体的对降噪后的初始形状进行级联回归预测方法的流程示意图；

图7为本申请实施例提供的对降噪后的初始形状进行分组的示意图；

图8为本申请实施例提供的人脸跟踪装置的结构示意图。

具体实施方式

下面结合说明书附图对本申请实施例的实现过程进行详细说明。需要注意的是，自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能理解为对本申请的限制。

参加图1，本申请实施例提供一种人脸跟踪方法，方法包括：

步骤S100，根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状。具体的，可以通过连续预测法根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状通过上一帧的预测形状能够估计出人脸的大概位置，从而不需要再做人脸检测，进而可以直接进行当前帧的形状预测。

步骤S200，对初始形状进行降噪处理。

步骤S300，将降噪后初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状。

在具体实施时，对于步骤200，对初始形状进行降噪处理，结合图2、图3、图4所示，具体包括：

步骤S210，对训练集中多个训练人脸图像的真实形状进行归一化。具体的，真实形状可以是通过手工标定进行获得，即，手工标定每一训练人脸图像的真实形状，获得每一训练人脸图像对应的真实形状。

步骤S220，将归一化后的训练人脸图像对应的样本形状进行PCA降维，得到n个主形状。n个主形状可以为{S₀，S₁……S_n}，进而对于任意待重构形状可以通过如下式子重构

其中为平均形状，a₀、a₁、a_n等为重构系数。

PCA(principal componentanalysis)降维，即主成成分分析，就是降低特征的维数，n个主形状，可以是特征分解后，以特征根从大到小排列，前n个特征根对应的形状即为n个主形状，前3个的话就是最大的3个。选前n个是因为前n个的能量最大，样本在n个维度上的离散程度更高，更容易区分。

步骤S230，根据n个主形状对初始形状进行形状重构，获得降噪后的初始形状。

而对于步骤S210，对训练集中多个训练人脸图像的真实形状进行归一化，具体包括：

步骤S211，将训练集中的任一训练人脸图像对应的真实形状作为预设基准形状，将所有剩下的训练人脸图像对应的真实形状对齐到该预设基准形状，例如，可以选择训练集中的第一个训练人脸图像对应的真实形状作为预设基准形状。

步骤S212，计算对齐到预设基准形状后的所有训练人脸图像对应的真实形状的平均形状，并将其作为基准形状，即，可以通过计算坐标的平均值，获得平均形状。

步骤S213，将所有训练人脸图像对应的真实形状对齐到该基准形状。

步骤S214，至少重复一次计算对齐到基准形状后的所有真实形状的平均形状，并每一次相应将所有真实形状对齐到重新确定的平均形状，直到终止条件。即，重复步骤S213和步骤S214，直到终止条件。具体的终止条件，可以为迭代次数或者预设的最小误差值。

在具体实施时，对于步骤S300，将降噪后初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状，参见图5和图6所示，具体包括：

步骤S310，将降噪后的初始形状根据关键点的关联性划分为多个组。关联性指属于同一个局部区域的关键点具有一定的关联，如眼角的关键点和瞳孔点等其他眼睛上的点是具有关联的。具体的，参见图7所示，可以将降噪后的初始形状分为表示左眉的group 1、表示右眉的group 2、表示左眼的group 3、表示右眼的group 4、表示鼻子的group 5、表示嘴巴的group 6、以及表示整个头部的group7七个分组，其中，group1到group6两两都是没有交集，只有group7与其他6个结合有交集，这里的交集是指包含相同的关键点，其中，group7包含所有的关键点。需要说明的是，在具体实施时，在将降噪后的初始形状根据关键点的关联性划分为多个组之前，应该还包括对级联回归预测的训练阶段以及特征提取，而训练阶段的步骤，参见图6所示，可以包括训练数据、数据预处理及增强。

步骤S320，在每一迭代回归预测阶段，分别计算每一组的形状增量。具体的，可以通过下式计算每一组的形状增量，

步骤S330，将每一组的形状增量进行融合，得到当前阶段的最终形状增量。

步骤S340，根据当前阶段的最终形状增量，更新当前阶段的形状并作为下一阶段的起始形状。

本申请实施例中，通过融合形状约束下进行级联回归预测，可以避免由于全局约束在模型训练和预测阶段都对各个关键点的相对位置存在强约束，而在未遮挡的复杂表情情况下反而得不到理想效果的问题。

优选的，对于步骤S330，将每一组的形状增量进行融合，得到当前阶段的最终形状增量，具体包括：

计算所有分组的形状增量的平均值，并将该平均值作为当前阶段的最终形状增量；或者，通过对各个分组的形状增量与形状残差的相似性进行加权，得到当前阶段的最终形状增量，其中，形状残差为该分组的当前形状与该分组的真实形状的差。

具体的，通过对各个分组的形状增量与形状残差的相似性进行加权，得到当前阶段的最终形状增量，可以通过包括以下步骤：

计算group i的关键点更新后的形状St1：St1＝St1+ΔS_groupi；

计算和group i有交集的group7的形状增量，并且得到计算更新后的形状St2，其中，group1到group6两两都是没有交集，只有group7与其他6个结合有交集。交集是指包含相同的关键点，group7包含所有的关键点，St2只取和group i中相交的关键点；

对St1和St2两个形状向量按元素进行归一化到[0,1]，得到权重值。

重复上述步骤直至group1至group6都与gourp7计算出权重，最后按关键点对所有权重进行归一化。

基于同一发明构思，本申请实施例还提供一种人脸跟踪装置，如图8所示，装置包括：

初始形状确定模块100，用于根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状；

降噪模块200，用于对初始形状进行降噪处理；

预测形状确定模块300，用于将降噪后初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状。

优选的，降噪模块200，具体包括：

降维模块，用于将归一化后的训练人脸图像对应的样本形状进行PCA降维，得到n个主形状；

重构模块，用于根据n个主形状对初始形状进行形状重构，获得降噪后的初始形状。

优选的，归一化模块具体用于：

将训练集中的任一训练人脸图像对应的真实形状作为预设基准形状，将所有剩下的训练人脸图像对应的真实形状对齐到该预设基准形状；

计算对齐到预设基准形状后的所有训练人脸图像对应的真实形状的平均形状，并将其作为基准形状；

将所有训练人脸图像对应的真实形状对齐到该基准形状；

至少重复一次计算对齐到基准形状后的所有真实形状的平均形状，并每一次相应将所有真实形状对齐到重新确定的平均形状，直到终止条件。

优选的，预测形状确定模块300，具体包括：

划分模块，用于将降噪后的初始形状根据关键点的关联性划分为多个组；

融合模块，用于将每一组的形状增量进行融合，得到当前阶段的最终形状增量；

更新模块，用于根据当前阶段的最终形状增量，更新当前阶段的形状并作为下一阶段的起始形状。

优选的，计算模块具体用于：

通过下式计算每一组的形状增量，

优选的，融合模块具体用于：

本申请实施例提供的人脸跟踪方法，包括：根据上一帧人脸图像获得的预测形状作为当前帧人脸图像的初始形状，对初始形状进行降噪处理，将降噪后初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状，其中，由于对初始形状进行降噪处理，进而可以抑制人脸跟踪算法中形状的误差累积，提高预测精度，降低关键点跟踪对初始形状的依赖性；而对降噪后初始形状在融合形状约束下进行级联回归预测，可以在环境复杂度较小的情况下松弛约束，在环境复杂较大的情况下增强约束，能给自适应地调整形状约束的强度，适应环境变化，提高关键点跟踪对复杂环境的鲁棒性，以及实现对复杂表情的较好预测效果。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种人脸跟踪方法，其特征在于，所述方法包括：

对所述初始形状进行降噪处理；

2.如权利要求1所述的人脸跟踪方法，其特征在于，所述对所述初始形状进行降噪处理，具体包括：

对训练集中多个训练人脸图像的真实形状进行归一化；

3.如权利要求2所述的人脸跟踪方法，其特征在于，所述对训练集中多个训练人脸图像的真实形状进行归一化，具体包括：

4.如权利要求1所述的人脸跟踪方法，其特征在于，所述将降噪后所述初始形状在融合形状约束下进行级联回归预测，获得当前帧的最终预测形状，具体包括：

在每一迭代回归预测阶段，分别计算每一组的形状增量；

5.如权利要4所述的人脸跟踪方法，其特征在于，所述计算每一组的形状增量，具体包括：

通过下式计算每一组的形状增量，

6.如权利要5所述的人脸跟踪方法，其特征在于，所述将每一组的所述形状增量进行融合，得到当前阶段的最终形状增量，具体包括：

7.一种人脸跟踪装置，其特征在于，所述装置包括：

降噪模块，用于对所述初始形状进行降噪处理；

8.如权利要求7所述的人脸跟踪装置，其特征在于，所述降噪模块，具体包括：

9.如权利要求8所述的人脸跟踪装置，其特征在于，所述归一化模块具体用于：

10.如权利要求7所述的人脸跟踪装置，其特征在于，所述预测形状确定模块，具体包括：

11.如权利要10所述的人脸跟踪装置，其特征在于，所述计算模块具体用于：

通过下式计算每一组的形状增量，

12.如权利要11所述的人脸跟踪装置，其特征在于，所述融合模块具体用于：