WO2015070764A1

WO2015070764A1 - 一种人脸定位的方法与装置

Info

Publication number: WO2015070764A1
Application number: PCT/CN2014/090943
Authority: WO
Inventors: 邓川云; 林天麟
Original assignee: 智慧城市系统服务（中国）有限公司
Priority date: 2013-11-13
Filing date: 2014-11-12
Publication date: 2015-05-21
Also published as: CN103593654A; AU2014350727B2; AU2014350727A1; CN103593654B

Abstract

一种人脸定位的方法，包括：通过摄像头获取用户原始图像；对所述用户原始图像经过粗略定位，得到人脸粗略定位图像；根据所述人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息；根据所述人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状。还公开了一种人脸定位的装置。该方法和装置减小了计算的复杂性，提高了拟合精度。

Description

一种人脸定位的方法与装置

本申请要求在2013年11月13日提交中国专利局、申请号为201310560912.X、发明名称为“一种人脸定位的方法与装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及人机交互技术领域，尤其涉及一种人脸定位的方法与装置。

背景技术

在人机交互领域中，对使用者人脸的检测定位技术起着至关重要的作用。

现有的人脸定位技术大部分采用独立的模块运行，而不是采用统一框架进行处理。在人脸特征点定位技术方面，现有技术主要采用ASM(Active Shape Model，活动形状模型)模型及其改进模型，其拟合的精度较低。

发明内容

本发明提供了一种人脸定位的方法与装置，提高了拟合精度。

本发明提供了一种人脸定位的方法，包括：

通过摄像头获取用户原始图像；

对所述用户原始图像经过粗略定位，得到人脸粗略定位图像；

根据所述人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息；

根据所述人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。

较优的，所述根据所述人脸粗略定位图像得到人脸检测区域信息，具体包括：

将所述人脸粗略定位图像划分为若干个子窗口；

计算每个子窗口的图像方差值，将所述每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于所述预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口，反之则否决该子窗口；

将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口；

将在线学习分类器输出的子窗口进行非最大抑制NMS处理，得到人脸检测区域信息。

较优的，所述将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口，具体包括：

计算图像方差值小于所述预设的方差阈值的子窗口的随机森林分类器的后验概率，如果所述后验概率大于预设的概率阈值，则接收该子窗口，反之则否决该子窗口；

计算后验概率大于预设的概率阈值的子窗口与正则协相关NCC分类器样本库中的目标模板的匹配系数，如果所述匹配系数大于预设的系数阈值，则接收该子窗口，反之则否决该子窗口。

较优的，局部形状拟合方法具体为监督的序列拟合方法，所述监督的序列拟合方法具体为：

步骤a：根据人脸检测区域信息提取人脸各部位形状信息，将该提取的形状信息作为人脸各部位形状初始值；

步骤b：根据当前人脸各部位形状的标定点提取当前特征描述符，若干个当前特征描述符组成当前特征描述矢量；

步骤c：以所述当前特征描述矢量为索引号，在更新矩阵库中查找对应的更新矩阵，根据所述对应的更新矩阵更新当前人脸各部位形状信息，得到更新后的当前人脸各部位形状信息，将步骤b中的当前人脸各部位形状替代为该更新后的当前人脸各部位形状信息；

步骤d：判断是否大于预设的最大迭代步数，或者最近两次形状误差的向量范数误差是否小于预设的向量范数误差阈值，否则返回步骤b，是则进入步骤e；

步骤e：得到精确的人脸各部位形状信息。

较优的，还包括：

根据所述精确的人脸各部位形状信息，通过结构学习方法得到人脸各部位的目标函数；

对所述人脸各部位的目标函数进行优化，得到优化后的人脸各部位位置。

较优的，还包括：

根据优化后的人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置；

根据所述人脸各部位的运动位置，更新所述在线学习分类器。

本发明还提供了一种人脸定位的装置，包括：

获取图像模块，用于通过摄像头获取用户原始图像，将所述用户原始图像发送给粗略定位模块；

粗略定位模块，与所述获取图像模块相连，用于对所述用户原始图像经过粗略定位，得到人脸粗略定位图像，并将所述人脸粗略定位图像发送给检测区域模块；

检测区域模块，与所述粗略定位模块相连，用于根据所述人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息；

拟合模块，与所述检测区域模块相连，用于根据所述人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。

较优的，所述检测区域模块具体包括：

滑动窗口模块，用于将所述人脸粗略定位图像划分为若干个子窗口；

方差滤波模块，与所述滑动窗口模块相连，用于计算每个子窗口的图像方差值，将所述每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于所述预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口，反之则否决该子窗口；

在线学习模块，与所述方差滤波模块相连，用于将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口；

NMS模块，与所述在线学习模块相连，用于将在线学习分类器输出的子窗口进行NMS处理，得到人脸检测区域信息。

较优的，还包括：

优化模块，与所述拟合模块相连，用于根据所述精确的人脸各部位形状信息，通过结构学习方法得到人脸各部位的目标函数，对所述人脸各部位的目标函数进行优化，得到优化后的人脸各部位位置。

较优的，还包括：

在线更新模块，与所述优化模块相连，用于根据所述优化后的人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置，并根据所述人脸各部位的运动位置，更新在线学习分类器。

本发明实施上述实施例，通过对摄像头采集的用户图像进行人脸粗略定位图像得到人脸检测区域信息，再根据人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状，提高了拟合的精度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种人脸定位的方法流程示意图；

图2是本发明一种人脸定位的方法的另一实施例的流程示意图；

图3是本发明一种人脸定位的方法的再一实施例的流程示意图；

图4是本发明实施例的一种人脸定位的装置的结构示意图；

图5是本发明一种人脸定位的装置的另一实施例的结构示意图；

图6是本发明实施例的更新矩阵库子模块的结构示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。

请参阅图1示出的本发明实施例的一种人脸定位的方法流程示意图，包括：

步骤S101：通过摄像头获取用户原始图像。

具体的，获取用户原始图像后，对用户原始图像进行预处理，预处理包括噪声去除、光照均衡等预处理。

步骤S102：对用户原始图像经过粗略定位，得到人脸粗略定位图像。

具体的，对用户原始图像通过Haar和AdaBoos t算法完成人脸的粗略检测定位，然后基于人脸的肤色分布特征，应用肤色滤波器消除误检的区域并裁剪检测的人脸区域，得到人脸粗略定位图像。

步骤S103：根据人脸粗略定位图像得到人脸检测区域信息，人脸检测区域信息包括人脸各部位位置信息。

所述人脸各部位位置信息包括左眼位置信息、右眼位置信息、鼻子位置信息和嘴部位置信息。

具体的，本步骤S103包括：

第一步：将人脸粗略定位图像划分为若干个子窗口(也即至少两个子窗口)，计算每个子窗口的图像方差值；

第二步：针对若干个子窗口中的任一子窗口，将该子窗口的图像方差值与预设的方差阈值进行比较，如果小于预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口；反之则否决该子窗口；

第三步：将第二步通过的子窗口(也即图像方差值小于预设的方差阈值的子窗口)通过(也即输入)在线学习分类器，得到通过所述在线学习分类器的子窗口(也即得到所述在线学习分类器输出的子窗口)；

第四步：将第三步输出的子窗口进行NMS(Non-maximal Suppression，非最大抑制)处理，得到人脸检测区域信息。

步骤S104：根据人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。

具体的，局部形状拟合方法具体为SSM(Supervised Sequence Method，监督的序列拟合方法)方法。人脸各部位形状信息包括左眼形状信息、右眼形状信息、鼻子形状信息和嘴部形状信息。

本发明实施上述实施例，通过对摄像头采集的用户图像进行人脸粗略定位图像得到人脸检测区域信息，再根据人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息，提高了拟合的精度。

下面结合图2示出的本发明一种人脸定位的方法的另一实施例的流程示意图，进一步详细说明本发明实施例的一种人脸定位的方法。

步骤S201：通过摄像头获取用户原始图像。

步骤S202：对用户原始图像经过粗略定位，得到人脸粗略定位图像。

步骤S203：根据人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息。

具体的，本步骤S203包括：

第三步：将第二步通过的子窗口(也即图像方差值小于预设的方差阈值的子窗口)通过(也即输入)在线学习分类器，得到通过所述在线学习分类器的子窗口；

所述在线学习分类器包括随机森林分类器和NCC(Normalized Cross Correlation，正则协相关)分类器。

第四步：将第三步输出的子窗口(也即通过所述在线学习分类器的子窗口)进行NMS处理，得到人脸检测区域信息。

步骤S204：根据人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。

具体的，局部形状拟合方法具体为SSM方法。人脸各部位形状信息包括左眼形状信息、右眼形状信息、鼻子形状信息和嘴部形状信息。

步骤S205：根据该精确的人脸各部位形状信息，通过结构学习方法得到人脸各部位的目标函数。

具体的，该结构学习方法具体为SSVM(Structured Support Vector Machine，结构支持向量机)方法。

步骤S206：对人脸各部位的目标函数进行优化，得到优化后的人脸各部位位置。

具体的，通过SGD(Stochastic Gradient Descent，随机梯度下降)算法对人脸各部位的目标函数进行优化，得到优化后的人脸各部位位置。

步骤S207：根据优化后的人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置，并根据人脸各部位的运动位置，更新在线学习分类器。

具体的，根据优化后的人脸各部位位置，应用前后向光流跟踪法跟踪连续两帧中人脸各部位的运动位置；根据当前跟踪的人脸各部位的运动位置、各个子窗口的覆盖比例和后验概率得到人脸各部位的正负样本；基于得到的人脸各部位的正负样本，选取置信度较高(例如大于设定的置信阈值)的若干个样本计算其正负样本的特征；然后更新所述随机森林分类器的先验概率，将得到的人脸各部位的正负样本加入NCC分类器的样本库，更新NCC分类器的样本库。

本发明实施上述实施例，通过摄像头采集用户图像、采用滑动窗口的方法，通过在线学习分类器以及采用NMS算法来实现人脸定位方法，由于滑动窗口本身的特性决定了该人脸定位方法可以采用并行编程技术实现加速功能，而且采用的滤波器和分类器都不涉及复杂的运算，因此，保证程序的鲁棒性的同时减小了计算的复杂性，并且对人脸各部位特征拟合，人脸各部位位置优化以及对人脸各部位跟踪可以使人脸定位更精确，鲁棒性更高。

下面结合图3示出的本发明一种人脸定位的方法的再一实施例的流程示意图，进一步详细说明本发明实施例的一种人脸定位的方法。

步骤S301：通过摄像头获取用户原始图像。

步骤S302：对用户原始图像经过粗略定位，得到人脸粗略定位图像。

步骤S303：将人脸粗略定位图像划分为若干个子窗口。

步骤S304：计算每个子窗口的图像方差值，将每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于该预设的方差阈值则将认定该子窗口包含目标区域，接收该子窗口；反之则否决该子窗口。

步骤S305：计算通过步骤S304的子窗口的随机森林分类器的后验概率，如果该后验概率大于预设的概率阈值，则接收该子窗口；反之则否决该子窗口。

具体的，该随机森林分类器由13颗决策树构成，每颗决策树的特征由每一个子窗口的随机的10个图像块各自的亮度值两两之间相互比较得到，该随机森林分类器的后验概率是13颗决策树的后验概率的均值。该随机森林分类器的先验概率分布会在跟踪人脸后得到实时更新，以实现对目标外形变化、纹理变化的自适应性；针对任一颗决策树，根据先验概率和该颗决策树的特征得到该颗决策树的后验概率。

步骤S306：计算通过步骤S305的子窗口与NCC分类器样本库中的目标模板的匹配系数，如果该匹配系数大于预设的系数阈值，则接收该子窗口；反之则否决该子窗口。

具体的，该NCC分类器样本库会在跟踪人脸后实时更新，完成对跟踪目标的准确描述。

步骤S307：将步骤S306输出的子窗口进行NMS处理，得到人脸检测区域信息。

具体的，该人脸检测区域信息至少包括人脸中左眼、右眼、鼻子和嘴的位置信息。

在以下的实施例中，以人脸检测区域中的左眼为例，来说明人脸各个部位拟合的过程。

步骤S308：根据人脸左眼的位置信息通过PCA(Principal Component Analysis，主成分分析)算法提取左眼形状，该提取的左眼形状为初始值。

步骤S309：根据左眼形状的标定点提取特征描述符，若干个特征描述符组成特征描述矢量。

具体的，可以利用SIFT(Scale Invariant Feature Transform，尺度不变特征)算法或其变种算法来提取特征描述符。

步骤S310：计算左眼形状与预设的真实形状的差值向量。

步骤S311：根据步骤S309中的特征描述矢量和步骤S310中的差值向量，得到更新矩阵。

具体的，根据步骤S309中的特征描述矢量和步骤S310中的差值向量以及待求的更新矩阵，组成关于2范数的误差函数，通过线性最小二乘方法优化该误差函数，求解得到更新矩阵。

步骤S312：将步骤309中的左眼形状通过步骤S311得到的更新矩阵(也即将步骤309中的左眼形状与步骤S311得到的更新矩阵进行矢量积运算)，得到更新后的左眼形状，并提取更新后的左眼形状的特征描述矢量，以更新后的左眼形状的特征描述矢量为索引号与步骤S311得到的更新矩阵对应存储在本地；将步骤S309左眼形状替代为更新后的左眼形状。

步骤S313：判断是否大于预设的最大更新矩阵库的迭代步数，或者最近两次更新矩阵的范数误差是否小于预设的矩阵范数误差阈值，否则返回步骤S309，是则进入步骤S314。

步骤S314：得到更新矩阵库，该更新矩阵库由一一对应的索引号和更新矩阵组成。

步骤S315：根据当前左眼形状的标定点提取当前特征描述符，若干个当前特征描述符组成当前特征描述矢量。

具体的，当前左眼形状初始值为步骤S308中的左眼形状。

步骤S316：以当前特征描述矢量为索引号，在更新矩阵库中查找对应的更新矩阵，根据对应的更新矩阵更新当前左眼形状，得到更新后的当前左眼形状，将步骤S315中的当前左眼形状替代为该更新后的当前左眼形状。

步骤S317：判断是否大于预设的最大迭代步数，或者最近两次形状误差的向量范数误差是否小于预设的向量范数误差阈值，否则返回步骤S315，是则进入步骤S318。

步骤S318：得到精确的左眼形状。

具体的，根据上述实施例的描述，同样可以得到精确的右眼形状、精确的鼻子形状、精确的嘴部形状。上述方法在拟合过程中仅涉及查找和矩阵矢量积运算，且人脸各个部位的拟合以及特征描述矢量提取过程可以进行并行处理，因此满足实时性要求，此外，由于NCC分类器样本库的丰富性、特征描述矢量的抗尺度变化、旋转变化等能力，很大程度上提高了拟合的精度和实时性。

步骤S319：根据精确的左眼形状，提取左眼特征信息，组成左眼特征矢量。

具体的，本发明实施例采用HOG(Histogram of Oriented Gradient，梯度方向直方图)算法将左眼特征信息组成左眼特征矢量，并采用线性降维法对左眼特征矢量进行降维。

步骤S320：选取某个部位为锚点，确定左眼与该部位之间的距离特征矢量。

具体的，以鼻子作为锚点，计算左眼与鼻子的像素差值，将各差值的平方之和作为左眼与该部位之间的距离特征矢量。

步骤S321：将步骤319得到的左眼特征矢量与步骤320确定的距离特征矢量作为特征映射函数，由该特征映射函数得到左眼目标函数。

具体的，特征映射函数通过SSVM结构算法得到目标函数。

步骤S322：对左眼目标函数进行优化，得到优化后的左眼部位位置。

具体的，通过SGD算法对目标函数进行优化，得到优化后的左眼部位位置。

同理，实施上述的方法，也可以得到优化后的右眼部位位置，优化后的鼻子部位位置及优化后的嘴部部位位置。而且，通过对人脸各部位特征点局部拟合调整，以人脸部位为单位完成对4个部位的位置全局调整，满足人脸各部位的相对位置约束关系(即形状约束)，采用以部位为单位，以SGD为数值优化方法，为算法的有效性、鲁棒性以及实时性提供了保障。

步骤S323：根据优化后的左眼部位位置，应用前后向光流跟踪法跟踪连续两帧中左眼的运动位置。

步骤S324：根据当前跟踪的左眼的运动位置、各个子窗口的覆盖比例和后验概率得到人脸中左眼的正负样本。

步骤S325：基于得到的左眼的正负样本，选取置信度较高(例如大于设定的置信阈值)的若干个样本计算其正负样本的特征，然后更新随机森林分类器的先验概率。

步骤S326：将得到的左眼的正负样本加入NCC分类器的样本库，更新该NCC分类器的样本库。

本发明实施上述实施例，通过摄像头采集用户图像、采用滑动窗口的方法，依次通过方差滤波器、随机森林分类器、NCC分类器以及采用NMS算法，滑动窗口本身的特性决定了该方法可以采用并行编程技术实现加速功能，而且采用的滤波器和分类器都不涉及复杂的运算，保证程序的鲁棒性的同时减小了计算的复杂性，并且对人脸各部位特征拟合，人脸各部位位置优化以及对人脸各部位跟踪可以使人脸定位更精确，鲁棒性更高。

下面结合图4示出的本发明实施例的一种人脸定位的装置的结构示意图，进一步详细说明本发明实施例该装置的结构。

获取图像模块401，用于通过摄像头获取用户原始图像，将该用户原始图像发送给粗略定位模块402。

粗略定位模块402，与获取图像模块401相连，用于对用户原始图像经过粗略定位，得到人脸粗略定位图像，并将该人脸粗略定位图像发送给检测区域模块403。

具体的，对用户原始图像通过Haar和AdaBoos t算法完成人脸的粗略检测定位，然后基于人脸的肤色分布特征，应用肤色滤波器消除误检的区域并裁剪检测的人脸区，得到人脸粗略定位图像。

检测区域模块403，与粗略定位模块402相连，用于根据人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息。

具体的，检测区域模块403具体包括：

滑动窗口模块4031，用于将人脸粗略定位图像划分为若干个子窗口。

方差滤波模块4032，与滑动窗口模块4031相连，用于计算每个子窗口的图像方差值，将所述每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于所述预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口；反之则否决该子窗口。

在线学习模块4033，与方差滤波模块4032相连，用于将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口。

NMS模块4034，与在线学习模块4033相连，用于将在线学习分类器输出的子窗口进行NMS处理，得到人脸检测区域信息。

具体的，人脸各部位位置信息包括左眼位置信息、右眼位置信息、鼻子位置信息和嘴部位置信息。

拟合模块404，与检测区域模块403相连，用于根据人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。

具体的，局部形状拟合方法具体为SSM方法。人脸各部位形状包括左眼形状信息、右眼形状信息、鼻子形状信息和嘴部形状信息。

该装置还包括：

优化模块405，与拟合模块404相连，用于根据该精确的人脸各部位形状，通过结构学习方法得到人脸各部位的目标函数，对人脸各部位的目标函数进行优化，得到优化后的人脸各部位位置。

具体的，通过SGD算法对人脸各部位的目标函数进行优化，得到最优的人脸各部位位置。

在线更新模块406，与优化模块405相连，用于根据所述优化后人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置，并根据人脸各部位的运动位置，更新在线学习分类器。

具体的，根据最优的人脸各部位位置，应用前后向光流跟踪法跟踪连续两帧中的人脸各部位的运动位置，根据当前跟踪人脸各部位的运动位置、各个子窗口的覆盖比例和后验概率得到人脸各部位的正负样本，基于得到的人脸各部位的正负样本，选取置信度较高(例如大于设定的置信阈值)的若干个样本计算其正负样本的特征，然后更新所述随机森林分类器的先验概率，将得到的人脸各部位的正负样本加入NCC分类器的样本库，更新NCC分类器的样本库。

下面结合图5示出的本发明一种人脸定位的装置的另一实施例的结构示意图，进一步详细说明本发明实施例中该装置的结构。

获取图像模块501，用于通过摄像头获取用户原始图像，将该用户原始图像发送给粗略定位模块502。

粗略定位模块502，与获取图像模块501相连，用于对用户原始图像经过粗略定位，得到人脸粗略定位图像，并将该人脸粗略定位图像发送给滑动窗口模块503。

滑动窗口模块503，与粗略定位模块502相连，用于将该人脸粗略定位图像划分为若干个子窗口。

方差滤波模块504，与滑动窗口模块503相连，用于计算每个子窗口的图像方差值，将每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于该预设的方差阈值，则将认定该子窗口包含目标区域，接收该子窗口；反之则否决该子窗口，将通过的子窗口发送给随机森林分类器505。

随机森林分类器505，与方差滤波模块504相连，用于计算通过方差滤波模块504的子窗口的随机森林分类器的后验概率，如果该后验概率大于预设的概率阈值，则接收该子窗口；反之则否决该子窗口，将通过的子窗口发送给NCC分类器506。

NCC分类器506，与随机森林分类器505相连，用于计算通过随机森林分类器305的子窗口与NCC分类器样本库中的目标模板的匹配系数，如果该匹配系数大于预设的系数阈值，则接收该子窗口；反之则否决该子窗口。

NMS模块507，与NCC分类器506相连，用于将通过NCC分类器506的子窗口进行NMS处理，得到人脸检测区域信息。

该装置还包括：

人脸各部位特征拟合模块508，与NMS模块507相连，还包括

第一提取子模块5081，用于根据人脸检测区域信息提取人脸各部位形状。

第一特征描述矢量子模块5082，用于根据当前人脸各部位形状的标定点提取当前特征描述符，若干个当前特征描述符组成当前特征描述矢量。

第一更新子模块5083，用于以当前特征描述矢量为索引号，在更新矩阵库中查找对应的更新矩阵，根据对应的更新矩阵更新当前人脸各部位形状，得到更新后的当前左眼形状。

第一判断子模块5084，用于判断是否大于预设的最大迭代步数，或者最近两次形状误差向量的范数误差是否小于预设的向量范数误差阈值，否则将更新后的当前人脸各部位形状返回给第一特征描述矢量子模块5082作为当前人脸各部位形状，是则将更新后的当前人脸各部位形状发送给第一结果子模块5085；

第一结果子模块5085，用于得到精确的人脸各部位形状。

如图6所示，其中人脸各部位特征拟合模块508还包括更新矩阵库子模块5086，具体包括：

第二提取子模块50861，用于根据人脸检测区域信息提取人脸各部位形状。

第二特征描述矢量子模块50862，用于根据人脸各部位形状的标定点提取特征描述符，若干个特征描述符组成特征描述矢量。

计算子模块50863，用于计算人脸各部位形状与预设的真实形状的差值向量。

更新矩阵子模块50864，用于根据第二特征描述矢量子模块50862中的特征描述矢量和计算子模块50863中的差值向量，得到更新矩阵。

第二更新子模块50865，用于将第二特征描述矢量子模块50862中的人脸各部位形状通过更新矩阵子模块50864得到的更新矩阵，得到更新后的人脸各部位形状，并提取更新后的人脸各部位形状的特征描述矢量，以更新后的人脸各部位形状的特征描述矢量为索引号与更新矩阵子模块30864得到的更新矩阵对应存储在本地。

第二判断子模块50866，用于判断是否大于预设的最大更新矩阵库的迭代步数，或者最近两次更新矩阵的范数误差是否小于预设的矩阵范数误差阈值，否则将更新后的人脸各部位形状返回给第二特征描述矢量子模块50862作为人脸各部位形状，是则将存储在本地的更新矩阵及索引号发送给第二结果子模块50867。

第二结果子模块50867，用于得到更新矩阵库，该更新矩阵库由一一对应的索引号和更新矩阵组成。

该装置还包括：

人脸各部位位置优化模块509，与人脸各部位特征拟合模块508相连，用于根据精确的人脸各部位均值形状，提取人脸各部位特征信息，组成人脸各部位特征矢量，选取某个部位为锚点，得到人脸各部位与该部位之间的距离特征矢量，人脸各部位特征矢量与距离特征矢量作为特征映射函数，得到人脸各部位目标函数，对人脸各部位目标函数进行优化，得到优化后的人脸各部位位置。

人脸各部位跟踪模块510，人脸各部位位置优化模块509相连，用于根据优化后的人脸各部位位置，应用前后向光流跟踪法跟踪连续两帧中人脸各部位的运动位置；根据当前跟踪的人脸各部位的运动位置、各个子窗口的覆盖比例和后验概率得到人脸各部位的正负样本，基于得到的人脸各部位的正负样本，选取置信度较高(例如大于设定的置信阈值)的若干个样本计算其正负样本的特征；然后更新随机森林分类器的先验概率，将得到的人脸各部位的正负样本加入NCC分类器的样本库，更新NCC分类器的样本库。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样，倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

一种人脸定位的方法，其特征在于，包括：

通过摄像头获取用户原始图像；

对所述用户原始图像经过粗略定位，得到人脸粗略定位图像；

根据所述人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息；

根据所述人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。
如权利要求1所述的方法，其特征在于，所述根据所述人脸粗略定位图像得到人脸检测区域信息，具体包括：

将所述人脸粗略定位图像划分为若干个子窗口；

计算每个子窗口的图像方差值，将所述每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于所述预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口，反之则否决该子窗口；

将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口；

将在线学习分类器输出的子窗口进行非最大抑制NMS处理，得到人脸检测区域信息。
如权利要求2所述的方法，其特征在于，所述将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口，具体包括：

计算图像方差值小于所述预设的方差阈值的子窗口的随机森林分类器的后验概率，如果所述后验概率大于预设的概率阈值，则接收该子窗口，反之则否决该子窗口；

计算后验概率大于预设的概率阈值的子窗口与正则协相关NCC分类器样本库中的目标模板的匹配系数，如果所述匹配系数大于预设的系数阈值，则接收该子窗口，反之则否决该子窗口。
如权利要求1所述的方法，其特征在于，所述局部形状拟合方法具体为监督的序列拟合方法，所述监督的序列拟合方法具体为：

步骤a：根据人脸检测区域信息提取人脸各部位形状信息，将该提取的形状信息作为人脸各部位形状初始值；

步骤b：根据当前人脸各部位形状的标定点提取当前特征描述符，若干个当前特征描述符组成当前特征描述矢量；

步骤c：以所述当前特征描述矢量为索引号，在更新矩阵库中查找对应的更新矩阵，根据所述对应的更新矩阵更新当前人脸各部位形状信息，得到更新后的当前人脸各部位形状信息，将步骤b中的当前人脸各部位形状信息替代为该更新后的当前人脸各部位形状信息；

步骤d：判断是否大于预设的最大迭代步数，或者最近两次形状误差的向量范数误差是否小于预设的向量范数误差阈值，否则返回步骤b，是则进入步骤e；

步骤e：得到精确的人脸各部位形状信息。
如权利要求2或3所述的方法，其特征在于，还包括：

根据所述精确的人脸各部位形状信息，通过结构学习方法得到人脸各部位的目标函数；

对所述人脸各部位目标函数进行优化，得到优化后的人脸各部位位置。
如权利要求5所述的方法，其特征在于，还包括：

根据优化后的人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置；

根据所述人脸各部位的运动位置，更新所述在线学习分类器。
一种人脸定位的装置，其特征在于，包括：

获取图像模块，用于通过摄像头获取用户原始图像，将所述用户原始图像发送给粗略定位模块；

粗略定位模块，与所述获取图像模块相连，用于对所述用户原始图像经过粗略定位，得到人脸粗略定位图像，并将所述人脸粗略定位图像发送给检测区域模块；

检测区域模块，与所述粗略定位模块相连，用于根据所述人脸粗略定位图像得到人脸检测区域信息，所述人脸检测区域信息包括人脸各部位位置信息；

拟合模块，与所述检测区域模块相连，用于根据所述人脸检测区域信息，通过局部形状拟合方法得到精确的人脸各部位形状信息。
如权利要求7所述的装置，其特征在于，所述检测区域模块具体包括：

滑动窗口模块，用于将所述人脸粗略定位图像划分为若干个子窗口；

方差滤波模块，与所述滑动窗口模块相连，用于计算每个子窗口的图像方差值，将所述每个子窗口的图像方差值与预设的方差阈值进行比较，如果小于所述预设的方差阈值，则认定该子窗口包含目标区域，接收该子窗口，反之则否决该子窗口；

在线学习模块，与所述方差滤波模块相连，用于将图像方差值小于所述预设的方差阈值的子窗口输入在线学习分类器，得到所述在线学习分类器输出的子窗口；

非最大抑制NMS模块，与所述在线学习模块相连，用于将在线学习分类器输出的子窗口进行NMS处理，得到人脸检测区域信息。
如权利要求8所述的装置，其特征在于，还包括：

优化模块，与所述拟合模块相连，用于根据所述精确的人脸各部位形状信息，通过结构学习方法得到人脸各部位的目标函数，对所述人脸各部位目标函数进行优化，得到优化后的人脸各部位位置。
如权利要求9所述的装置，其特征在于，还包括：

在线更新模块，与所述优化模块相连，用于根据所述优化后的人脸各部位位置，跟踪连续两帧中人脸各部位的运动位置，并根据所述人脸各部位的运动位置，更新在线学习分类器。