CN111507304B

CN111507304B - 自适应刚性先验模型训练方法、人脸跟踪方法及相关装置

Info

Publication number: CN111507304B
Application number: CN202010355935.7A
Authority: CN
Inventors: 陈文喻; 刘更代
Original assignee: Guangzhou Baiguoyuan Information Technology Co Ltd
Current assignee: Bigo Technology Pte Ltd
Priority date: 2020-04-29
Filing date: 2020-04-29
Publication date: 2023-06-27
Anticipated expiration: 2040-04-29
Also published as: EP4145342A1; EP4145342A4; US20230177702A1; WO2021218650A1; CN111507304A

Abstract

本发明实施例公开了一种自适应刚性先验模型训练方法、人脸跟踪方法及相关装置，训练方法包括：初始化自适应刚性先验模型的模型参数；根据自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据；根据多帧人脸数据对模型参数进行更新；判断是否达到停止更新模型参数的条件；若是，停止更新自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。训练好的自适应刚性先验模型应用于人脸跟踪的过程中，自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重，使得人脸跟踪的刚性稳定化高，获得更鲁棒的人脸跟踪结果。

Description

自适应刚性先验模型训练方法、人脸跟踪方法及相关装置

技术领域

本发明实施例涉及图像处理技术领域，尤其涉及一种自适应刚性先验模型训练方法、人脸跟踪方法及相关装置。

背景技术

人脸姿态估计是视频人脸跟踪中的一项重要课题，实时人脸跟踪需要跟踪人脸姿态和人脸表情，包括计算三维人脸模型的刚性变换，包括旋转，平移，缩放等。稳定的人脸姿态估计可以应用于实现视觉增强效果，诸如试戴帽子、眼镜、追加胡子、纹身等等，也可以用于驱动虚拟人偶的表情运动。

在实时人脸跟踪中，人脸姿态是根据视频中人脸的运动进行估计的，但是视频中人脸的运动并不是由人脸姿态唯一决定的，在人脸姿态固定的情况下，用户做不同表情也会引起视频中人脸姿态的运动，因此，为了得到稳定的人脸姿态估计，必须在优化求解人脸姿态时有效降低人脸表情的影响，即刚性稳定化。

现有技术中，为了提高计算效率，实时刚性稳定化方法则采用先验来实现人脸跟踪的刚性稳定化。常见的先验主要采用两种相对简单的方法，一种是针对特定人脸区域的启发式先验，另一种是动态刚性先验，在启发式先验中对不同的人脸区域采用固定的权重，其缺陷是无法适应所有表情。对于动态刚性先验则通过估计每个人脸区域的移动量来动态估计权重，因此可以适用不同表情，但其缺陷是训练好的模型只适合特定大小的人脸，无法自适应视频中人脸尺寸的变化，因此，目前的刚性先验模型无法适应所有表情和不同的人脸尺寸来估计各个人脸区域的权重，导致人脸姿态估计刚性稳定化不高，最终导致人脸跟踪不准确的问题。

发明内容

本发明实施例提供一种自适应刚性先验模型训练方法、人脸跟踪方法及相关装置，以解决现有技术中刚性先验模型无法适应所有表情和不同的人脸尺寸来估计各个人脸区域的权重，导致人脸姿态估计刚性稳定化不高，最终导致人脸跟踪不准确的问题。

第一方面，本发明实施例提供了一种自适应刚性先验模型训练方法，包括：

初始化自适应刚性先验模型的模型参数，所述模型参数为以人脸尺寸为自变量的函数，所述自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重；

根据所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据；

根据所述多帧人脸数据对所述模型参数进行更新；

判断是否达到停止更新所述模型参数的条件；

若是，停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型；

若否，返回基于所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据的步骤。

第二方面，本发明实施例提供了一种人脸跟踪方法，包括：

对视频数据进行人脸跟踪以提取每帧视频数据中人脸的人脸关键点、初始人脸表情参数和初始刚性变换参数；

根据所述人脸关键点确定每帧视频数据中所述人脸的人脸尺寸；

将所述人脸尺寸输入预先训练的自适应刚性先验模型中获得所述人脸各个人脸区域的权重；

根据所述权重和所述人脸关键点对所述初始刚性变换参数和所述初始人脸表情参数进行求解获得人脸表情参数的最优解作为每帧视频数据的人脸跟踪的结果；

其中，所述自适应刚性先验模型通过本发明实施例所述的自适应刚性先验模型训练方法所训练。

第三方面，本发明实施例提供了一种自适应刚性先验模型训练装置，包括：

模型参数初始模块，用于初始化自适应刚性先验模型的模型参数，所述模型参数为以人脸尺寸为自变量的函数，所述自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重；

人脸数据获取模块，用于根据所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据；

模型参数更新模块，用于根据所述多帧人脸数据对所述模型参数进行更新；

停止训练条件判断模块，用于判断是否达到停止更新所述模型参数的条件；

模型参数停止更新模块，用于停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。

第四方面，本发明实施例提供了一种人脸跟踪装置，包括：

人脸跟踪模块，用于对视频数据进行人脸跟踪以提取每帧视频数据中人脸的人脸关键点、初始人脸表情参数和初始刚性变换参数；

人脸尺寸确定模块，用于根据所述人脸关键点确定每帧视频数据中所述人脸的人脸尺寸；

权重预测模块，用于将所述人脸尺寸输入预先训练的自适应刚性先验模型中获得所述人脸各个人脸区域的权重；

优化模块，用于根据所述权重和所述人脸关键点对所述初始刚性变换参数和所述初始人脸表情参数进行求解获得人脸表情参数的最优解作为每帧视频数据的人脸跟踪的结果；

第五方面，本发明实施例提供了一种电子设备，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任一实施例所述的自适应刚性先验模型训练方法和/或人脸跟踪方法。

第六方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任一实施例所述的自适应刚性先验模型训练方法和/或人脸跟踪方法。

本发明实施例的自适应刚性先验模型的模型参数为以人脸尺寸为自变量的函数，该自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重；在初始化模型参数后，根据自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据，并根据多帧人脸数据对模型参数进行更新，在达到停止更新模型参数的条件时，停止更新自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。本发明实施例训练好的自适应刚性先验模型应用于人脸跟踪的过程中，自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重，使得人脸跟踪的刚性稳定化高，获得更鲁棒的人脸跟踪结果。

附图说明

图1是本发明实施例一提供的一种自适应刚性先验模型训练方法的步骤流程图；

图2A是本发明实施例二提供的一种自适应刚性先验模型训练方法的步骤流程图；

图2B是本发明实施例二提供的一种所示为人脸的各个人脸区域的划分示意图；

图2C是本发明实施例二提供的一种自适应刚性先验模型训练流程图；

图3是本发明实施例三提供的一种人脸跟踪方法的步骤流程图；

图4是本发明实施例四提供的一种自适应刚性先验模型训练装置的结构框图；

图5是本发明实施例五提供的一种人脸跟踪装置的结构框图；

图6是本发明实施例六提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合。

实施例一

图1为本发明实施例一提供的一种自适应刚性先验模型训练方法的步骤流程图，本发明实施例可适用于训练刚性先验模型来估计人脸各个人脸区域在不同人脸尺寸时的权重的情况，该方法可以由本发明实施例的自适应刚性先验模型训练装置来执行，该自适应刚性先验模型训练装置可以由硬件或软件来实现，并集成在本发明实施例所提供的电子设备中，具体地，如图1所示，本发明实施例的自适应刚性先验模型训练方法可以包括如下步骤：

S101、初始化自适应刚性先验模型的模型参数，所述模型参数为以人脸尺寸为自变量的函数，所述自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重。

在本发明实施例中，人脸可以分为多个人脸区域，人脸做表情时，人脸各个人脸区域相对于中性人脸具有一定的位移，其中，中性人脸为用户没有脸部表情时的人脸，可以为每个用户生成中性人脸。当每个人脸区域运动时会对人脸刚性变换产生影响，为了得到稳定的刚性变换，在人脸姿态估计时期望位移大的人脸区域对刚性变换具有较小的权重，位移小的人脸区域对刚性变换具有较大的权重。

本发明实施例的自适应刚性先验模型可以用于输出人脸在不同人脸尺寸时各个人脸区域的权重，该自适应刚性先验模型的模型参数是以人脸尺寸作为自变量的函数。

S102、根据所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据。

在本发明实施例中，训练视频数据可以为某个用户的视频数据，在该视频数据所包含的用户的人脸中，有一半以上人脸是不同大小且无人脸表情的人脸，其它人脸是该用户不同大小且具有不同的人脸表情的人脸。人脸跟踪为从训练视频数据中提取同一用户的人脸关键点、建立三维人脸、对三维人脸进行刚性变换从而求解最优刚性变换和最优人脸表情的过程。

具体地，对训练视频人脸数据进行人脸跟踪时，可以提取每帧训练视频数据中人脸的人脸关键点Q_f和人脸表情参数Q_f，其中，人脸关键点Q_f可以为人脸关键部位的二维点，可以通过预先训练好的人脸关键点检测模型来提取人脸关键点，然后根据人脸的人脸关键点可以确定出人脸的人脸尺寸，通过人脸表情参数Q_f和预设形状融合变形器B_exp做乘积可以计算人脸的各个人脸区域相对于人脸的中性人脸的位移，预设形状融合变形器B_exp(Blend Shape)形状融合变形器是制作面部表情动画的工具，它能通过使用一系列的目标形状物体(Target)使基础物体得到非常平顺、高精度的变形效果，在本发明实施例中，可以为预先为各个用户设置形状融合变形器B_exp，当以某个用户的视频数据作为训练视频数据时，可以获取为该用户预先设置的形状融合变形器。

本发明实施例对训练视频进行人脸跟踪后，可以获得每帧视频数据中人脸的人脸尺寸，并对刚性变换和人脸表情参数求最优解获得各个人脸区域相对于中性人脸的位移作为人脸数据。

S103、根据所述多帧人脸数据对所述模型参数进行更新。

在本发明实施例中，人脸数据包含人脸尺寸大小和人脸的各个人脸区域相对于中性人脸的位移，可以按照人脸尺寸将从训练视频数据中提取到的不同尺寸大小的人脸划分到多个人脸容器中，针对每个人脸容器中的人脸，计算该人脸容器中人脸的人脸尺寸的均值，进一步对该人脸容器中人脸的各个人脸区域的位移分析，获得人脸尺寸为均值时自适应刚性先验模型的模型参数的型值点，最后对不同均值对应的模型参数的型值点进行插值处理，获得模型参数关于人脸尺寸的函数以作为自适应刚性先验模型的新的模型参数，即模型参数为样条曲线，该样条曲线以人脸尺寸为自变量，模型参数为因变量。

S104、判断是否达到停止更新所述模型参数的条件。

在本发明实施例中，停止更新模型参数的条件可以是相邻两次更新得到的模型参数的差值小于预设阈值，还可以是对模型参数的更新次数达到预设次数，当相邻两次更新得到的模型参数的差值小于预设阈值，或者是对模型参数的更新次数达到预设次数，执行S105，否则，返回S102根据更新模型参数后的自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据，通过人脸数据来重新更新模型参数。

S105、停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。

当达到停止更新模型参数的条件时，最后一次更新模型参数后的自适应刚性先验模型即为训练好的模型，该训练好的自适应刚性先验模型可以部署在客户端或者服务器等，并且自适应刚性先验模型应用于人脸跟踪的过程中，自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重。

本发明实施例的自适应刚性先验模型的模型参数为以人脸尺寸为自变量的函数，该自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重；在初始化模型参数后，根据自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据，并根据多帧人脸数据对模型参数进行更新，在达到停止更新模型参数的条件时，停止更新自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。训练好的自适应刚性先验模型应用于人脸跟踪的过程中，自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重，使得人脸跟踪的刚性稳定化高，获得更鲁棒的人脸跟踪结果。

实施例二

图2A为本发明实施例二提供的一种自适应刚性先验模型训练方法的步骤流程图，本发明实施例在前述实施例一的基础上进行优化，具体地，如图2A所示，本发明实施例的自适应刚性先验模型训练方法可以包括如下步骤：

S201、初始化自适应刚性先验模型的模型参数，所述模型参数为以人脸尺寸为自变量的函数，所述自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重。

在本发明实施例中，自适应刚性先验模型可以定义如下：

其中，s为人脸的人脸尺寸，

是人脸中第k个人脸区域在人脸尺寸为s时的权重，α^k(s)，β^k(s)，γ^k(s)为模型参数，α^k(s)，β^k(s)，γ^k(s)是关于二维人脸尺寸s的函数，d^k为第k个人脸区域的位移。

如图2B所示为人脸的各个人脸区域的划分示意图，本发明实施例中将人脸划分为7个区域，即k为1-7的自然数，初始化自适应刚性先验模型的模型参数可以为初始化人脸的各个人脸区域在所有人脸尺寸时的权重均为1。

S202、对所述训练视频数据进行人脸跟踪以提取每帧训练视频数据中人脸的人脸关键点和人脸表情参数。

在本发明实施例中，对于训练视频数据F包含的每帧训练视频数据f，每帧训练视频数据f中人脸由以下参数决定：

(P_f,δ_f,Q_f)

其中，P_f是人脸的刚性变换参数，δ_f是用户的人脸表情参数，Q_f是人脸关键点。

其中，刚性变换参数P_f和人脸表情参数δ_f为未知参数，Q_f是人脸关键点为已知参数，可以通过人脸跟踪过程中人脸关键点检测获得。

S203、根据所述人脸关键点确定所述人脸的人脸尺寸。

在获得人脸关键点后，可以通过人脸关键点确定一人脸框，计算人脸框的对角线的长度作为每帧视频数据f中人脸的人脸尺寸。

S204、采用所述自适应刚性先验模型、所述人脸表情参数和预设形状融合变形器计算所述人脸的各个人脸区域相对于所述人脸的中性人脸的位移。

在本发明的可选实施例中，可以采用中性人脸、人脸表情参数和预设形状融合变形器构建三维人脸，对该三维人脸做刚性变换，采用刚性变换、人脸关键点和自适应刚性先验模型计算的权重构建刚性变换优化问题，在对刚性变换优化问题求解得到最优刚性变换参数后，采用该最优刚性变换求解最优人脸表情参数，采用该最优人脸表情参数来求解人脸各个人脸区域的位移。

具体地，在本发明实施例中，每个人脸表情参数确定出一个三维人脸：

F_f＝B_user+B_expδ_f

B_user是用户的不带表情的中性人脸，对于每个用户，可以预先获取该用户无人脸表情时的人脸即为中性人脸，B_exp是该用户的形状融合变形器(Blend Shape)，则视频数据f中人脸的人脸位移B_expδ_f，即三维人脸由用户的中性人脸增加各种表情动作后所获得。

在人脸跟踪过程中，可以通过求解下列最优化问题获得最优解：

P_f(·)是对三维人脸F_f做刚性变换，Π(·)是对三维人脸做二维投影(正交投影或透视投影)。上述优化问题可以采用坐标下降法(Coordinate Descent)进行求解

公式(2)即为刚性变换问题，

为训练视频数据f中人脸的人脸关键点i所属的人脸区域k的权重。其中j为迭代次数。对给定的初始值δ_f,0＝δ_f-1，迭代求解上述最优化问题直到收敛可以获得最优的人脸表情参数δ_f为最后一轮迭代的表情，由此可以计算视频数据f中人脸的人脸位移B_expδ_f，进一步可以根据图2B所示的人脸区域划分确定各个人脸区域的相对于中性人脸的位移。

S205、按照所述人脸尺寸将所述人脸划分到多个人脸容器中。

本发明实施例在对训练视频数据进行人脸跟踪后，从每帧视频数据f∈F提取如下人脸数据：

s_f为视频数据f中人脸的人脸尺寸，

为视频数据f中人脸的第k个人脸区域相对于中性人脸的位移。

在本发明的可选实施例中，可以对人脸对所有人脸尺寸{s_f}_f∈F做直方图分析，把从每个视频数据f中提取到的人脸分类到n个人脸容器C_i中。具体地，可以从先确定出最大人脸尺寸和最小人脸尺寸，将最大人脸尺寸和最小人脸尺寸之间的尺寸范围平均分为多个尺寸范围作为人脸容器的人脸尺寸范围，确定人脸的人脸尺寸所在的目标人脸尺寸范围，将人脸划分到目标人脸尺寸范围所属的人脸容器中。

示例性地，可以按照以下公式将人脸分类到n个人脸容器：

其中，s_min＝min_f∈F{s_f},为最小人脸尺寸，s_max＝max_f∈F{s_f}为最大人脸尺寸。

人脸容器中人脸尺寸的中心值sⁱ为：

如果人脸容器C_i中的人脸少于给定的阈值，比如人脸容器C_i中人脸的数量少用10000个，则丢弃该人脸容器，在对人脸尺寸做直方图分析后，满足：

即总的人脸F为各个人脸容器C_i所包含的人脸F_i的并集，任意两个人脸容器C_i和C_j中所包含的人脸F_i和人脸F_j的交集为空。

S206、针对每个人脸容器中的人脸，计算所述人脸的人脸尺寸的均值。

具体地，对于每个人脸容器C_i中的人脸，计算

即计算人脸容器C_i中所有人脸的人脸尺寸的均值sⁱ。

S207、对所述人脸容器中所述人脸的各个人脸区域的位移分析，获得人脸尺寸为所述均值时所述自适应刚性先验模型的模型参数的型值点。

在本发明的可选实施例中，S207可以包括如下子步骤：

S2071、针对所述人脸容器中所述人脸的每个人脸区域，从人脸的人脸图像数据中确定出人脸区域的最大位移。

对于人脸容器C_i中的多个人脸，每个人脸均包括多个人脸区域，对于每个人脸区域k，可以确定出该人脸区域k的最大位移：

上述公式中，F_i为人脸容器C_i中的人脸，

为人脸容器C_i中人脸区域k的最大位移。

S2072、将所述人脸区域的位移划分到多个位移容器中。

在本发明实施例中，对于每个人脸区域，可以对该人脸区域的位移做直方图分析，将该人脸区域的位移划分到m个位移容器中，具体划分方式可参考S205中对人脸尺寸做直方图分析。

S2073、从多个位移容器中确定出包含最多位移的最大位移容器。

具体地，可以统计每个位移容器中所包含的位移的数量，将数量最大的位移容器作为最大位移容器。

S2074、从所述最大位移容器所述包含的多个位移中确定出中间位移作为人脸尺寸为所述均值时的第一模型参数的型值点。

具体地，可以对最大位移容器中所包含的多个位移

进行降序或者升序排序，并确定出排序在中间的位移/>

作为人脸尺寸为均值时的第一模型参数的型值点，得到第一模型参数的一个型值点/>

n为人脸容器的数量。

S2075、根据所述人脸区域的最大位移、中间位移、预设最大权重、预设最小权重以及所述第一模型参数的型值点计算人脸尺寸为所述均值时的第二模型参数的型值点和第三模型参数的型值点。

如图2B所示，对于本发明实施例的人脸区域的划分，可以对每个人脸区域自由设置预期的权重范围。如图2B所示的七个人脸区域。人脸区域1和人脸区域2是对称的，可以把人脸区域1和人脸区域2合并进行训练，同理把，人脸区域3和人脸区域5合并进行训练，即

另外，人脸区域4是人脸的鼻子，通常鼻子在人物做表情时位移最小，最稳定，可以对人脸区域4赋值较大权重，同理，人脸区域3和人脸区域5包括了人脸的轮廓点，相对稳定，可以赋予大权重，人脸区域1和人脸区域2为眼部区域，人脸区域6和人脸区域7为嘴巴区域，眼部区域和嘴巴区域在用户做表情时位移比较大，较容易引起刚性变换的不稳定，可以赋予较小权重，则可以设置各个人脸区域的权重范围如下表：

当然，在实际应用中，本领域技术人员可以按照其他方式对人脸划分人脸区域并设置相应的权重范围，本发明实施例对人脸区域划分和设置权重范围的方式不加以限制。

在本发明的可选实施例中，可以按照以下公式计算第二模型参数的型值点和第三模型参数的型值点：

上述公式中，

为第二模型参数在人脸尺寸为均值时的型值点，/>

为第三模型参数在人脸尺寸为均值时的型值点，/>

是人脸区域k的最大权重，/>

是人脸区域k的最小权重。

S208、对不同均值对应的模型参数的型值点进行插值处理，获得所述模型参数关于人脸尺寸的函数以作为所述自适应刚性先验模型的新的模型参数。

具体地，分别对人脸尺寸为均值时的第一模型参数的型值点、第二模型参数型值点和第三模型参数型值点进行样条插值，获得第一模型参数、第二模型参数和第三模型参数关于人脸尺寸的函数作为自适应刚性先验模型的新的模型参数，可选地，可以对不同人脸尺寸下各个模型参数的型值点进行一次样条插值，即采用直线段连接不同人脸尺寸下各个模型参数的型值点，得到各个模型参数关于人脸尺寸的函数。

即对于每个人脸容器C_i可以确定一均值sⁱ作为人脸尺寸，对于每个人脸容器C_i，可以确定人脸尺寸为sⁱ时的型值点

则对于每个人脸容器C_i可以确定出以下型值点：

由于有多个人脸容器C_i，可以对多个人脸容器C_i的多个型值点进行插值处理得到自适应刚性先验模型

的模型参数α^k(s)，β^k(s)，γ^k(s)，该模型参数α^k(s)，β^k(s)，γ^k(s)是关于人脸尺寸s的函数，即以人脸尺寸s为自变量，亦即，在人脸跟踪过程中，确定人脸的人脸尺寸s后即可以确定自适应刚性先验模型/>

的模型参数α^k(s)，β^k(s)，γ^k(s)，并通过该自适应刚性先验模型/>

确定各个人脸区域的权重。

S209、判断是否达到停止更新所述模型参数的条件。

在本发明的可选实施例中，可以计算前后两次更新得到模型参数的差值，判断差值是否小于预设阈值，若是确定达到停止更新模型参数的条件，即计算前后两次更新的模型参数的变换是否小于预设阈值，若是说明达到停止更新条件执行S210，否则采用更新模型参数后的自适应刚性先验模型

继续对训练视频数据进行人脸跟踪，并根据人脸跟踪获得的数据继续对模型参数进行更新。

当然，在实际应用中，也可以统计模型参数的更新次数，判断更新次数是否大于预设阈值，若是，确定达到停止更新模型参数的条件，执行S210，否则返回S202。

S210、停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。

为了使得本发明实施例的自适应刚性先验模型训练方法更为清楚，以下结合图2C进行实例说明：

如图2C所示，本示例的自适应刚性先验模型训练流程如下：

S0、初始化自适应刚性先验模型

即初始化自适应刚性先验模型的模型参数，使得人脸的各个人脸区域在不同人脸尺寸时的权重均为1。

S1、对视频数据F进行人脸跟踪，提取人脸数据

S2、对{s_f}_f∈F做n个容器的直方图分析；

S3、对每个容器C_i,i∈I，计算

S4、对每个人脸区域k∈K，计算

S5、对

做m个容器的直方图分析；

S6、

S7、计算

S8、对每个人脸区域k∈K，对

的离散点进行样条插值、

的离散点进行样条插值、/>

的离散点进行样条插值；

S9、更新

S10、是否停止训练，若是，执行S11，若否执行S12；

S11、输出模型参数；

S12、采用更新后的

进行人脸跟踪。

上述示例中公式的各个参数可参考S205-S208，在此不再详述。

本发明实施例初始化自适应刚性先验模型的模型参数后，对所述训练视频数据进行人脸跟踪以提取每帧训练视频数据中人脸的人脸关键点和人脸表情参数，根据人脸关键点确定人脸的人脸尺寸，并采用自适应刚性先验模型、人脸表情参数和预设形状融合变形器计算人脸的各个人脸区域相对于人脸的中性人脸的位移，进一步按照人脸尺寸将所述人脸划分到多个人脸容器中，并计算每个人脸容器中人脸的人脸尺寸的均值，对人脸容器中人脸的各个人脸区域的位移分析，获得人脸尺寸为均值时自适应刚性先验模型的模型参数的型值点，对不同均值对应的模型参数的型值点进行插值处理，获得模型参数关于人脸尺寸的函数以作为自适应刚性先验模型的新的模型参数，在达到停止更新条件时停止更新模型参数，否则对训练视频数据进行人脸跟踪继续更新模型参数。在训练好的自适应刚性先验模型应用于人脸跟踪的过程中，自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重，使得人脸跟踪的刚性稳定化高，获得更鲁棒的人脸跟踪结果。

进一步地，自适应刚性先验模型是分段函数，可以防止因为人脸区域位移过小而导致权重过大的问题，进一步保证了人脸跟踪的稳定性。

实施例三

图3为本发明实施例三提供的一种自适应刚性先验模型训练方法的步骤流程图，本发明实施例可适用于对视频中的人脸进行跟踪的情况，该方法可以由本发明实施例的人脸跟踪装置来执行，该人脸跟踪装置可以由硬件或软件来实现，并集成在本发明实施例所提供的电子设备中，具体地，如图1所示，本发明实施例的人脸跟踪方法可以包括如下步骤：

S301、对视频数据进行人脸跟踪以提取每帧视频数据中人脸的人脸关键点、初始人脸表情参数和初始刚性变换参数。

具体地，对于需要进行人脸跟踪的视频数据，可以对该视频数据进行人脸跟踪，获得每帧视频数据f中的人脸：

(P_f,δ_f,Q_f)

其中，刚性变换参数P_f和人脸表情参数δ_f为未知参数，Q_f是人脸关键点为已知参数，可以通过人脸跟踪过程中人脸关键点检测获得，本发明实施例对人脸跟踪最终为求解人脸表情参数δ_f的最优解。

S302、根据所述人脸关键点确定每帧视频数据中所述人脸的人脸尺寸。

S303、将所述人脸尺寸输入预先训练的自适应刚性先验模型中获得所述人脸各个人脸区域的权重。

在本发明实施例中，自适应刚性先验模型用于输出人脸各个人脸区域在不同人脸尺寸时的权重，该自适应刚性先验模型可通过实施例一或实施例二所提供的自适应刚性先验模型训练方法所训练。

具体地，自适应刚性先验模型如实施例二中的公式(1)所示。

S304、根据所述权重和所述人脸关键点对所述初始刚性变换参数和所述初始人脸表情参数进行求解获得人脸表情参数的最优解作为每帧视频数据的人脸跟踪的结果。

具体地，可以获取人脸的中性人脸数据，采用中性人脸数据、初始人脸表情参数和预设形状融合变形器生成每帧视频数据中人脸的三维人脸模型，基于初始刚性变换参数对三维人脸模型做二维投影获得二维人脸数据，二维人脸数据包含多个投影二维关键点，计算投影二维关键点和所提取的人脸关键点的距离，采用距离和二维关键点所在的人脸区域的权重构建刚性变换问题，并对刚性变换问题求最优解得到最终的刚性变换参数，在刚性变换参数最优时求解人脸表情参数的最优解得到最终的人脸表情参数作为每帧视频数据的人脸跟踪结果。

参考实施例二中S204，构建三维人脸后，通过自适应刚性变换模型计算权重w^ki，进一步构建公式(2)和公式(3)中的最优解问题，依次对公式(2)和公式(3)求最优解，最终得到最优的人脸表情参数δ_f，具体可参考实施例二，在此不再详述。

在对人脸跟踪获得人脸表情参数δ_f后，通过该人脸表情参数δ_f可以实现各种人脸视觉增强特效，例如，如对人脸添加帽子、眼镜，胡子、纹身等。

本发明实施例通过自适应刚性先验模型中获得人脸各个人脸区域的权重，通过该权重构建刚性变换后来求解人脸表情参数的最优解作为人脸跟踪结果，由于本发明实施例自适应刚性先验模型能够根据实时人脸的人脸尺寸和人脸各个人脸区域的位移对不同的人脸区域赋予不同的权重，使得人脸跟踪的刚性稳定化高，获得更鲁棒的人脸跟踪结果。

实施例四

图4是本发明实施例四提供的一种自适应刚性先验模型训练装置的结构框图，如图4所示，本发明实施例的自适应刚性先验模型训练装置具体可以包括如下模块：

模型参数初始模块401，用于初始化自适应刚性先验模型的模型参数，所述模型参数为以人脸尺寸为自变量的函数，所述自适应刚性先验模型用于输出人脸在不同人脸尺寸时各个人脸区域的权重；

人脸数据获取模块402，用于根据所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据；

模型参数更新模块403，用于根据所述多帧人脸数据对所述模型参数进行更新；

停止训练条件判断模块404，用于判断是否达到停止更新所述模型参数的条件；

模型参数停止更新模块405，用于停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型。

本发明实施例所提供的自适应刚性先验模型训练装置可执行本发明实施例一、实施例二所提供的自适应刚性先验模型训练方法，具备执行方法相应的功能模块和有益效果。

实施例五

图5是本发明实施例五提供的一种人脸跟踪装置的结构框图，如图5所示，本发明实施例的人脸跟踪装置具体可以包括如下模块：

人脸跟踪模块501，用于对视频数据进行人脸跟踪以提取每帧视频数据中人脸的人脸关键点、初始人脸表情参数和初始刚性变换参数；

人脸尺寸确定模块502，用于根据所述人脸关键点确定每帧视频数据中所述人脸的人脸尺寸；

权重预测模块503，用于将所述人脸尺寸输入预先训练的自适应刚性先验模型中获得所述人脸各个人脸区域的权重；

优化模块504，用于根据所述权重和所述人脸关键点对所述初始刚性变换参数和所述初始人脸表情参数进行求解获得人脸表情参数的最优解作为每帧视频数据的人脸跟踪的结果；

本发明实施例所提供的人脸跟踪装置可执行本发明实施例三所提供的人脸跟踪方法，具备执行方法相应的功能模块和有益效果。

实施例六

参照图6，示出了本发明一个示例中的一种电子设备的结构示意图。如图6所示，该电子设备具体可以包括：处理器601、存储装置602、具有触摸功能的显示屏603、输入装置604、输出装置605以及通信装置606。该电子设备中处理器601的数量可以是一个或者多个，图6中以一个处理器601为例。该电子设备的处理器601、存储装置602、显示屏603、输入装置604、输出装置605以及通信装置606可以通过总线或者其他方式连接，图6中以通过总线连接为例。所述电子设备用于执行如本发明任一实施例提供的自适应刚性先验模型训练方法和/或人脸跟踪方法。

本发明实施例还提供一种计算机可读存储介质，所述存储介质中的指令由设备的处理器执行时，使得设备能够执行如上述方法实施例所述的自适应刚性先验模型训练方法和/或人脸跟踪方法。

需要说明的是，对于装置、电子设备、存储介质实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变换、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种自适应刚性先验模型训练方法，其特征在于，包括：

根据所述多帧人脸数据对所述模型参数进行更新；

判断是否达到停止更新所述模型参数的条件；

若否，返回基于所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据的步骤；

所述自适应刚性先验模型为：

其中，s为人脸的人脸尺寸，

2.根据权利要求1所述的方法，其特征在于，所述根据所述自适应刚性先验模型对训练视频数据进行人脸跟踪获得同一人脸的多帧人脸数据，包括：

对所述训练视频数据进行人脸跟踪以提取每帧训练视频数据中人脸的人脸关键点和人脸表情参数；

根据所述人脸关键点确定所述人脸的人脸尺寸；

采用所述自适应刚性先验模型、所述人脸表情参数和预设形状融合变形器计算所述人脸的各个人脸区域相对于所述人脸的中性人脸的位移。

3.根据权利要求1或2所述的方法，其特征在于，所述人脸数据包括人脸的人脸尺寸和所述人脸的各个人脸区域的位移，所述根据所述多帧人脸数据对所述模型参数进行更新，包括：

按照所述人脸尺寸将所述人脸划分到多个人脸容器中；

针对每个人脸容器中的人脸，计算所述人脸的人脸尺寸的均值；

对所述人脸容器中所述人脸的各个人脸区域的位移分析，获得人脸尺寸为所述均值时所述自适应刚性先验模型的模型参数的型值点；

对不同均值对应的模型参数的型值点进行插值处理，获得所述模型参数关于人脸尺寸的函数以作为所述自适应刚性先验模型的新的模型参数。

4.根据权利要求3所述的方法，其特征在于，所述按照所述人脸尺寸将人脸图像数据对应的人脸划分到多个人脸容器中，包括：

从所述人脸图像数据中确定出最大人脸尺寸和最小人脸尺寸；

将所述最大人脸尺寸和最小人脸尺寸之间的尺寸范围平均分为多个尺寸范围作为人脸容器的人脸尺寸范围；

确定所述人脸的人脸尺寸所在的目标人脸尺寸范围；

将所述人脸划分到所述目标人脸尺寸范围所属的人脸容器中。

5.根据权利要求3所述的方法，其特征在于，所述对所述人脸容器中所述人脸的各个人脸区域的位移分析，获得人脸尺寸为所述均值时所述自适应刚性先验模型的模型参数的型值点，包括：

针对所述人脸容器中所述人脸的每个人脸区域，从所述人脸的人脸图像数据中确定出所述人脸区域的最大位移；

将所述人脸区域的位移划分到多个位移容器中；

从多个位移容器中确定出包含最多位移的最大位移容器；

从所述最大位移容器包含的多个位移中确定出中间位移作为人脸尺寸为所述均值时的第一模型参数的型值点；

根据所述人脸区域的最大位移、中间位移、预设最大权重、预设最小权重以及所述第一模型参数的型值点计算人脸尺寸为所述均值时的第二模型参数的型值点和第三模型参数的型值点。

6.根据权利要求5所述的方法，其特征在于，所述对不同均值对应的模型参数的型值点进行插值处理，获得所述模型参数关于人脸尺寸的函数以作为所述自适应刚性先验模型的新的模型参数，包括：

分别对人脸尺寸为所述均值时的第一模型参数的型值点、第二模型参数型值点和第三模型参数型值点进行样条插值，获得所述第一模型参数、第二模型参数和所述第三模型参数关于人脸尺寸的函数作为所述自适应刚性先验模型的新的模型参数。

7.根据权利要求1所述的方法，其特征在于，所述判断是否达到停止更新所述模型参数的条件，包括：

计算前后两次更新得到模型参数的差值；

判断所述差值是否小于预设阈值；

若是，确定达到停止更新所述模型参数的条件。

8.根据权利要求1所述的方法，其特征在于，所述判断是否达到停止更新所述模型参数的条件，包括：

统计所述模型参数的更新次数；

判断所述更新次数是否大于预设阈值；

若是，确定达到停止更新所述模型参数的条件。

9.一种人脸跟踪方法，其特征在于，包括：

其中，所述自适应刚性先验模型通过权利要求1-8任一项所述的自适应刚性先验模型训练方法所训练。

10.根据权利要求9所述的方法，其特征在于，所述根据所述权重和所述人脸关键点对所述初始刚性变换参数和所述初始人脸表情参数进行求解获得人脸表情参数的最优解作为每帧视频数据的人脸跟踪的结果，包括：

获取所述人脸的中性人脸数据；

采用所述中性人脸数据、所述初始人脸表情参数和预设形状融合变形器生成每帧视频数据中人脸的三维人脸模型；

基于所述初始刚性变换参数对所述三维人脸模型做二维投影获得二维人脸数据，所述二维人脸数据包含多个投影二维关键点；

计算所述投影二维关键点和所提取的二维关键点的距离；

采用所述距离和所述二维关键点所在的人脸区域的权重构建刚性变换问题；

对所述刚性变换问题求最优解得到最终的刚性变换参数；

在所述刚性变换参数最优时求解所述人脸表情参数的最优解得到最终的人脸表情参数作为每帧视频数据的人脸跟踪结果。

11.一种自适应刚性先验模型训练装置，其特征在于，包括：

模型参数停止更新模块，用于停止更新所述自适应刚性先验模型的模型参数得到最终的自适应刚性先验模型；

所述自适应刚性先验模型为：

其中，s为人脸的人脸尺寸，

12.一种人脸跟踪装置，其特征在于，包括：

13.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8中任一项所述的自适应刚性先验模型训练方法或权利要求9-10任一项所述的人脸跟踪方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-8中任一项所述的自适应刚性先验模型训练方法或权利要求9-10任一项所述的人脸跟踪方法。