CN103593654A - 一种人脸定位的方法与装置 - Google Patents

一种人脸定位的方法与装置 Download PDF

Info

Publication number
CN103593654A
CN103593654A CN201310560912.XA CN201310560912A CN103593654A CN 103593654 A CN103593654 A CN 103593654A CN 201310560912 A CN201310560912 A CN 201310560912A CN 103593654 A CN103593654 A CN 103593654A
Authority
CN
China
Prior art keywords
face
people
subwindow
module
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310560912.XA
Other languages
English (en)
Other versions
CN103593654B (zh
Inventor
邓川云
林天麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhongzhi Weian Robot Technology Co.,Ltd.
Original Assignee
Wisdom City System Service (china) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wisdom City System Service (china) Co Ltd filed Critical Wisdom City System Service (china) Co Ltd
Priority to CN201310560912.XA priority Critical patent/CN103593654B/zh
Publication of CN103593654A publication Critical patent/CN103593654A/zh
Priority to PCT/CN2014/090943 priority patent/WO2015070764A1/zh
Priority to AU2014350727A priority patent/AU2014350727B2/en
Application granted granted Critical
Publication of CN103593654B publication Critical patent/CN103593654B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/754Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries involving a deformation of the sample pattern or of the reference pattern; Elastic matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Abstract

本发明公开了人脸定位的方法,包括通过摄像头获取用户原始图像;对所述用户原始图像经过粗略定位,得到人脸粗略定位图像;根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息;根据所述人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。还公开了人脸定位的装置。本发明减小了计算的复杂性,提高了拟合精度。

Description

一种人脸定位的方法与装置
技术领域
本发明涉及人机交互技术领域,尤其涉及一种人脸定位的方法与装置。
背景技术
在人机交互领域中,对使用者人脸的检测定位技术起着至关重要的作用。
现有的人脸定位技术大部分采用独立的模块运行,而不是采用统一框架进行处理。在人脸特征点定位技术方面,现有技术主要采用ASM(Active Shape Model,活动形状模型)模型及其改进模型,其拟合的精度较低。
发明内容
本发明提供了一种人脸定位的方法与装置,提高了拟合精度。
本发明提供了一种人脸定位的方法,包括:
通过摄像头获取用户原始图像;
对所述用户原始图像经过粗略定位,得到人脸粗略定位图像;
根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息;
根据所述人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
较优的,所述根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息,具体包括:
将所述人脸粗略定位图像划分为若干个子窗口;
计算每个子窗口的图像方差值,将所述每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于所述方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口;
将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口;
将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。
较优的,所述将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口,具体包括:
计算通过上一步骤的子窗口的随机森林分类器的后验概率,如果所述后验概率大于预设的概率阈值则接收该子窗口,反之则否决该子窗口;
计算通过上一步骤的子窗口与NCC分类器样本库中的目标模板的匹配系数,当所述匹配系数大于预设的系数阈值则接收该子窗口,反之则否决该子窗口。
较优的,局部形状拟合方法具体为监督的序列拟合方法,所述监督的序列拟合方法具体为:
步骤a:根据人脸检测区域信息提取人脸各部位形状,该形状作为人脸各部位形状初始值;
步骤b:根据当前人脸各部位形状的标定点提取当前特征描述符,若干个当前特征描述符组成当前特征描述矢量;
步骤c:以所述当前特征描述矢量为索引号,在更新矩阵库中查找对应的更新矩阵,根据所述对应的更新矩阵更新当前人脸各部位形状,将步骤b中的当前人脸各部位形状替代为该更新当前人脸各部位形状;
步骤d:判断是否大于预设的最大迭代步数,或者最近两次形状误差向量范数误差小于预设向量范数误差阈值,否则返回步骤b,是则进入步骤e;
步骤e:得到精确的人脸各部位形状。
较优的,还包括:
根据所述精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数;
对所述人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
较优的,还包括:
根据最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置;
根据所述人脸各部位的运动位置,更新所述在线学习分类器。
本发明还提供了一种人脸定位的装置,包括:
获取图像模块,用于通过摄像头获取用户原始图像,将所述用户原始图像发送给粗略定位模块;
粗略定位模块,与所述获取图像模块相连,用于对所述用户原始图像经过粗略定位,得到人脸粗略定位图像,并将所述人脸粗略定位图像发送给检测区域模块;
检测区域模块,与所述粗略定位模块相连,用于根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息;
拟合模块,与所述检测区域模块相连,用于根据所述人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
较优的,所述检测区域模块具体包括:
滑动窗口模块,用于将所述人脸粗略定位图像划分为若干个子窗口;
方差滤波模块,与所述滑动窗口模块相连,用于计算每个子窗口的图像方差值,将所述每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于所述方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口;
在线学习模块,与所述方差滤波模块相连,用于将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口;
NMS模块,与所述在线学习模块相连,用于将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。
较优的,还包括:
优化模块,与所述拟合模块相连,用于根据所述精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数,对所述人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
较优的,还包括:
在线更新模块,与所述优化模块相连,用于根据所述最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置,并根据所述人脸各部位的运动位置,更新在线学习分类器。
本发明实施上述实施例,通过摄像头采集用户图像、根据人脸粗略定位图像得到人脸检测区域信息,再根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状,提高了拟合的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种人脸定位的方法流程示意图;
图2是本发明一种人脸定位的方法的另一实施例的流程示意图;
图3是本发明一种人脸定位的方法的再一实施例的流程示意图;
图4是本发明实施例的一种人脸定位的装置的结构示意图;
图5是本发明一种人脸定位的装置的另一实施例的结构示意图;
图6是本发明实施例的更新矩阵库子模块的结构示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
请参阅图1示出的本发明实施例的一种人脸定位的方法流程示意图,包括:
步骤S101:通过摄像头获取用户原始图像。
具体的,获取用户原始图像后,对用户原始图像进行预处理,预处理包括噪声去除,光照均衡等预处理。
步骤S102:对用户原始图像经过粗略定位,得到人脸粗略定位图像。
具体的,对用户原始图像通过Haar和AdaBoost算法完成人脸的粗略检测定位,然后基于人脸的肤色分布特征,应用肤色滤波器消除误检的区域并裁剪检测的人脸区,得到人脸粗略定位图像。
步骤S103:根据人脸粗略定位图像得到人脸检测区域信息,人脸检测区域信息包括人脸各部位位置信息。
具体的,将人脸粗略定位图像划分为若干个子窗口,计算每个子窗口的图像方差值,将该每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口,将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口,将通过上一步骤输出的子窗口进行NMS(Non-maximal Suppression,非最大抑制)处理,得到人脸检测区域信息。人脸各部位位置信息包括左眼位置信息,右眼位置信息,鼻子位置信息和嘴部位置信息。
步骤S104:根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
具体的,局部形状拟合方法具体为SSM(Supervised Sequence Method,监督的序列拟合方法)方法。人脸各部位形状包括左眼形状信息,右眼形状信息,鼻子形状信息和嘴部形状信息。
本发明实施上述实施例,通过摄像头采集用户图像、根据人脸粗略定位图像得到人脸检测区域信息,再根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状,提高了拟合的精度。
下面结合图2示出的本发明一种人脸定位的方法的另一实施例的流程示意图,进一步详细说明本发明实施例的一种人脸定位的方法。
步骤S201:通过摄像头获取用户原始图像。
具体的,获取用户原始图像后,对用户原始图像进行预处理,预处理包括噪声去除,光照均衡等预处理。
步骤S202:对用户原始图像经过粗略定位,得到人脸粗略定位图像。
具体的,对用户原始图像通过Haar和AdaBoost算法完成人脸的粗略检测定位,然后基于人脸的肤色分布特征,应用肤色滤波器消除误检的区域并裁剪检测的人脸区,得到人脸粗略定位图像。
步骤S203:根据人脸粗略定位图像得到人脸检测区域信息,人脸检测区域信息包括人脸各部位位置信息。
具体的,将人脸粗略定位图像划分为若干个子窗口,计算每个子窗口的图像方差值,将该每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口,将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口,将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。人脸各部位位置信息包括左眼位置信息,右眼位置信息,鼻子位置信息和嘴部位置信息。在线学习分类器包括随机森林分类器和NCC (Normalized Cross Correlation,正则协相关)分类器。
步骤S204:根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
具体的,局部形状拟合方法具体为SSM方法。人脸各部位形状包括左眼形状信息,右眼形状信息,鼻子形状信息和嘴部形状信息。
步骤S205:根据该精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数。
具体的,该结构学习方法具体为SSVM(Structured Support Vector Machine,结构支持向量机)方法。
步骤S206:对人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
具体的,通过SGD(Stochastic Gradient Descent,随机梯度下降)算法对人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
步骤S207:根据最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置,并根据人脸各部位的运动位置,更新在线学习分类器。
具体的,根据最优的人脸各部位位置,应用前后向光流跟踪法跟踪连续两帧中人脸各部位的运动位置,根据当前跟踪人脸各部位的运动位置和各个子窗口的覆盖比例、后验概率得到人脸各部位的正负样,基于得到的人脸各部位的正负样本,选取置信度最高的若干个样本计算其正负样本的特征,然后更新所述随机森林分类器的先验概率,将得到的人脸各部位的正负样本加入NCC分类器的样本库,更新NCC分类器的样本库。
本发明实施上述实施例,通过摄像头采集用户图像、采用滑动窗口的方法,通过在线学习分类器以及采用NMS算法,滑动窗口本身的特性决定了该方法可以采用并行编程技术实现加速功能,而且采用的滤波器和分类器都不涉及复杂的运算,保证程序得鲁棒性的同时减小了计算的复杂性,并且对人脸各部位特征拟合,人脸各部位位置优化以及对人脸各部位跟踪可以使人脸定位更精确,鲁棒性更高。
下面结合图3示出的本发明一种人脸定位的方法的再一实施例的流程示意图,进一步详细说明本发明实施例的一种人脸定位的方法。
步骤S301:通过摄像头获取用户原始图像。
具体的,获取用户原始图像后,对用户原始图像进行预处理,预处理包括噪声去除,光照均衡等预处理。
步骤S302:对用户原始图像经过粗略定位,得到人脸粗略定位图像。
具体的,对用户原始图像通过Haar和AdaBoost算法完成人脸的粗略检测定位,然后基于人脸的肤色分布特征,应用肤色滤波器消除误检的区域并裁剪检测的人脸区,得到人脸粗略定位图像。
步骤S303:将人脸粗略定位图像划分为若干个子窗口。
步骤S304:计算每个子窗口的图像方差值,将每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于该方差阈值则将该认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口。
步骤S305:计算通过步骤S304的子窗口的随机森林分类器的后验概率,如果该后验概率大于预设的概率阈值则接收该子窗口,反之则否决该子窗口。
具体的,该随机森林分类器由13颗决策树构成,每颗决策树的特征由每一个子窗口的随机的10个图像块亮度值相互比较得到,该随机森林分类器后验概率是13颗决策树后验概率的均值。该随机森林分类器的先验概率分布会在跟踪人脸后得到实时更新,以实现对目标外形变化、纹理变化的自适应性,根据先验概率和决策树特征得到后验概率。
步骤S306:计算通过步骤S305的子窗口与NCC分类器样本库中的目标模板的匹配系数,当该匹配系数大于预设的系数阈值则接收该子窗口,反之则否决该子窗口。
具体的,该NCC分类器样本库会在跟踪人脸后实时更新,完成对跟踪目标的准确描述。
步骤S307:将步骤S306输出的子窗口进行NMS处理,得到人脸检测区域信息。
具体的,该人脸检测区域信息至少包括人脸中左眼、右眼、鼻子和嘴的位置信息。
在以下的实施例中,以人脸检测区域中的左眼为例,来说明人脸各个部位拟合的过程。
步骤S308:根据人脸左眼的位置信息通过PCA(Principal Component Analysis,主成分分析)算法提取左眼形状,该左眼形状为初始值。
步骤S309:根据左眼形状的标定点提取特征描述符,若干个特征描述符组成特征描述矢量。
具体的,可以利用SIFT(Scale Invariant Feature,尺度不变特征)算法或其变种算法来提取当前特征描述符。
步骤S310:计算左眼形状与预设的真实形状的差值向量。
步骤S311:根据步骤S309中的特征描述矢量和步骤S310中的差值向量,得到更新矩阵。
具体的,根据步骤S309中的特征描述矢量和步骤S310中的差值向量以及待求的更新矩阵,组成关于2范数的误差函数,通过线性最小二乘方法优化该误差函数,求解得到更新矩阵。
步骤S312:将步骤309中的左眼形状通过步骤S311得到的更新矩阵,得到更新后的左眼形状,并提取更新后的左眼形状的特征描述矢量,以更新后的左眼形状的特征描述矢量为索引号与步骤S311得到的更新矩阵一一对应的存储在本地;将步骤S309左眼形状替代为更新后的左眼形状。
步骤S313:判断是否大于预设的最大更新矩阵库的迭代步数,或者最近两次更新矩阵范数误差小于预设矩阵范数误差阈值,否则返回步骤S309,是则进入步骤S314。
步骤S314:得到更新矩阵库,该更新矩阵库由索引号和更新矩阵一一对应组成。
步骤S315:根据当前左眼形状的标定点提取当前特征描述符,若干个当前特征描述符组成当前特征描述矢量。
具体的,当前左眼形状初始值为步骤S308中的左眼形状。
步骤S316:以当前特征描述矢量为索引号,在更新矩阵库中查找对应的更新矩阵,根据对应的更新矩阵更新当前左眼形状,将步骤S315中的当前左眼形状替代为该更新当前左眼形状。
步骤S317:判断是否大于预设的最大迭代步数,或者最近两次形状误差向量范数误差小于预设向量范数误差阈值,否则返回步骤S315,是则进入步骤S318。
步骤S318:得到精确的左眼形状。
具体的,根据上述实施例的描述,同样可以得到精确的右眼形状、精确的鼻子形状、精确的嘴部形状。上述方法在拟合过程中仅涉及查找和矩阵矢量积运算,且人脸各个部位的拟合以及特征描述矢量提取过程可以进行并行处理,因此满足实时性要求,此外,由于样本库的丰富性、特征描述矢量的抗尺度变化、旋转变化等能力,很大程度上提高了拟合的精度和实时性。
步骤S319:根据精确的左眼形状,提取左眼特征信息,组成左眼特征矢量。
具体的,本发明实施例采用HOG(Histogram of Oriented Gradient,梯度方向直方图)算法将左眼特征信息组成左眼特征矢量,并采用线性降维对左眼特征矢量进行降维。
步骤S320:选取某个部位为锚点,得到左眼与该部位之间的距离特征矢量。
具体的,以鼻子作为锚点,计算左眼与鼻子的像素差值和差的平方作为左眼与该部位之间的距离特征矢量。
步骤S321:步骤319得到的左眼特征矢量与步骤320得到的距离特征矢量作为特征映射函数,得到左眼目标函数。
具体的,特征映射函数通过SSVM结构算法得到目标函数。
步骤S322:对左眼目标函数进行优化,得到最优的左眼部位位置。
具体的,通过SGD算法对目标函数进行优化,得到最优的部位位置。
同理,实施上述的方法,也可以得到最优的右眼部位位置,最优的鼻子部位位置及最优的嘴部部位位置。而且,通过对人脸各部位特征点局部拟合调整,以人脸部位为单位完成对4个部位的位置全局调整,满足人脸各部位的相对位置约束关系(即形状约束),采用以部位为单位,以SGD为数值优化方法,为算法的有效性、鲁棒性以及实时性提供了保障。
步骤S323:根据最优的左眼部位位置,应用前后向光流跟踪法跟踪连续两帧中左眼的运动位置。
步骤S324:根据当前跟踪左眼的运动位置和各个子窗口的覆盖比例、后验概率得到人脸中左眼的正负样本。
步骤S325:基于得到的左眼的正负样本,选取置信度最高的若干个样本计算其正负样本的特征,然后更新随机森林分类器的先验概率。
步骤S326:将得到的左眼的正负样本加入NCC分类器的样本库,更新该NCC分类器的样本库。
本发明实施上述实施例,通过摄像头采集用户图像、采用滑动窗口的方法,依次通过方差滤波器、随机森林分类器、NCC分类器以及采用NMS算法,滑动窗口本身的特性决定了该方法可以采用并行编程技术实现加速功能,而且采用的滤波器和分类器都不涉及复杂的运算,保证程序得鲁棒性的同时减小了计算的复杂性,并且对人脸各部位特征拟合,人脸各部位位置优化以及对人脸各部位跟踪可以使人脸定位更精确,鲁棒性更高。
下面结合图4示出的本发明实施例的一种人脸定位的装置的结构示意图,进一步详细说明本发明实施例该装置的结构。
获取图像模块401,用于通过摄像头获取用户原始图像,将该用户原始图像发送给粗略定位模块402。
具体的,获取用户原始图像后,对用户原始图像进行预处理,预处理包括噪声去除,光照均衡等预处理。
粗略定位模块402,与获取图像模块401相连,用于对用户原始图像经过粗略定位,得到人脸粗略定位图像,并将该人脸粗略定位图像发送给检测区域模块403。
具体的,对用户原始图像通过Haar和AdaBoost算法完成人脸的粗略检测定位,然后基于人脸的肤色分布特征,应用肤色滤波器消除误检的区域并裁剪检测的人脸区,得到人脸粗略定位图像。
检测区域模块403,与粗略定位模块402相连,用于根据人脸粗略定位图像得到人脸检测区域信息,人脸检测区域信息包括人脸各部位位置信息。
具体的,检测区域模块403具体包括:
滑动窗口模块4031,用于将人脸粗略定位图像划分为若干个子窗口。
方差滤波模块4032,与滑动窗口模块4031相连,用于计算每个子窗口的图像方差值,将所述每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于所述方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口。
在线学习模块4033,与方差滤波模块4032相连,用于将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口。
NMS模块4034,与在线学习模块4033相连,用于将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。
具体的,人脸各部位位置信息包括左眼位置信息,右眼位置信息,鼻子位置信息和嘴部位置信息。
拟合模块404,与检测区域模块403相连,用于根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
具体的,局部形状拟合方法具体为SSM方法。人脸各部位形状包括左眼形状信息,右眼形状信息,鼻子形状信息和嘴部形状信息。
该装置还包括:
优化模块405,与拟合模块404相连,用于根据该精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数,对人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
具体的,通过SGD算法对人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
在线更新模块406,与优化模块405相连,用于根据最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置,并根据人脸各部位的运动位置,更新在线学习分类器。
具体的,根据最优的人脸各部位位置,应用前后向光流跟踪法跟踪连续两帧中人脸各部位的运动位置,根据当前跟踪人脸各部位的运动位置和各个子窗口的覆盖比例、后验概率得到人脸各部位的正负样,基于得到的人脸各部位的正负样本,选取置信度最高的若干个样本计算其正负样本的特征,然后更新所述随机森林分类器的先验概率,将得到的人脸各部位的正负样本加入NCC分类器的样本库,更新NCC分类器的样本库。
本发明实施上述实施例,通过摄像头采集用户图像、根据人脸粗略定位图像得到人脸检测区域信息,再根据人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状,提高了拟合的精度。
下面结合图5示出的本发明一种人脸定位的装置的另一实施例的结构示意图,进一步详细说明本发明实施例该装置的结构。
获取图像模块501,用于通过摄像头获取用户原始图像,将该用户原始图像发送给粗略定位模块502。
具体的,获取用户原始图像后,对用户原始图像进行预处理,预处理包括噪声去除,光照均衡等预处理。
粗略定位模块502,与获取图像模块501相连,用于对用户原始图像经过粗略定位,得到人脸粗略定位图像,并将该人脸粗略定位图像发送给滑动窗口模块503。
具体的,对用户原始图像通过Haar和AdaBoost算法完成人脸的粗略检测定位,然后基于人脸的肤色分布特征,应用肤色滤波器消除误检的区域并裁剪检测的人脸区,得到人脸粗略定位图像。
滑动窗口模块503,与粗略定位模块502相连,用于将该人脸粗略定位图像划分为若干个子窗口。
方差滤波模块504,与滑动窗口模块503相连,用于计算每个子窗口的图像方差值,将每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于该方差阈值则将该认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口,将通过的子窗口发送给随机森林分类器505。
随机森林分类器505,与方差滤波模块504相连,用于计算通过方差滤波模块504的子窗口的随机森林分类器的后验概率,如果该后验概率大于预设的概率阈值则接收该子窗口,反之则否决该子窗口,将通过的子窗口发送给NCC分类器506。
具体的,该随机森林分类器由13颗决策树构成,每颗决策树的特征由每一个子窗口的随机的10个图像块亮度值相互比较得到,该随机森林分类器后验概率是13颗决策树后验概率的均值。该随机森林分类器的先验概率分布会在跟踪人脸后得到实时更新,以实现对目标外形变化、纹理变化的自适应性,根据先验概率和决策树特征得到后验概率。
NCC分类器506,与随机森林分类器505相连,用于计算通过随机森林分类器305的子窗口与NCC分类器样本库中的目标模板的匹配系数,当该匹配系数大于预设的系数阈值则接收该子窗口,反之则否决该子窗口。
具体的,该NCC分类器样本库会在跟踪人脸后实时更新,完成对跟踪目标的准确描述。
NMS模块507,与NCC分类器506相连,用于将通过NCC分类器506的子窗口进行NMS处理,得到人脸检测区域信息。
具体的,该人脸检测区域信息至少包括人脸中左眼、右眼、鼻子和嘴的位置信息。
该装置还包括:
人脸各部位特征拟合模块508,与NMS模块507相连,还包括
第一提取子模块5081,用于根据人脸检测区域信息提取人脸各部位形状。
第一特征描述矢量子模块5082,用于根据当前人脸各部位形状的标定点提取当前特征描述符,若干个当前特征描述符组成当前特征描述矢量。
第一更新子模块5083,用于以当前特征描述矢量为索引号,在更新矩阵库中查找对应的更新矩阵,根据对应的更新矩阵更新当前人脸各部位形状。
第一判断子模块5084,用于判断是否大于预设的最大迭代步数,或者最近两次形状误差向量范数误差小于预设向量范数误差阈值,否则将更新当前人脸各部位形状返回第一特征描述矢量子模块5082作为当前人脸各部位形状,是则将更新当前人脸各部位形状发送给第一结果子模块5085;
第一结果子模块5085,用于得到精确的人脸各部位形状。
如图6所示,其中人脸各部位特征拟合模块508还包括更新矩阵库子模块5086,具体包括:
第二提取子模块50861,用于根据人脸检测区域信息提取人脸各部位形状。
第二特征描述矢量子模块50862,用于根据人脸各部位形状的标定点提取特征描述符,若干个特征描述符组成特征描述矢量。
计算子模块50863,用于计算人脸各部位形状与预设的真实形状的差值向量。
更新矩阵子模块50864,用于根据第二特征描述矢量子模块50862中的特征描述矢量和计算子模块50863中的差值向量,得到更新矩阵。 
第二更新子模块50865,用于将第二特征描述矢量子模块50862中的人脸各部位形状通过更新矩阵子模块50864得到的更新矩阵,得到更新后的人脸各部位形状,并提取更新后的人脸各部位形状的特征描述矢量,以更新后的人脸各部位形状的特征描述矢量为索引号与更新矩阵子模块30864得到的更新矩阵一一对应的存储在本地。
第二判断子模块50866,用于判断是否大于预设的最大更新矩阵库的迭代步数,或者最近两次更新矩阵范数误差小于预设矩阵范数误差阈值,否则将更新后的人脸各部位形状返回第二特征描述矢量子模块50862作为人脸各部位形状,是则将存储在本地的更新矩阵及索引号发送给第二结果子模块50867。
第二结果子模块50867,用于得到更新矩阵库,该更新矩阵库由索引号和更新矩阵一一对应组成。
该装置还包括:
人脸各部位位置优化模块509,与人脸各部位特征拟合模块508相连,用于根据精确的人脸各部位均值形状,提取人脸各部位特征信息,组成人脸各部位特征矢量,选取某个部位为锚点,得到人脸各部位与该部位之间的距离特征矢量,人脸各部位特征矢量与距离特征矢量作为特征映射函数,得到人脸各部位目标函数,对人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
人脸各部位跟踪模块510,人脸各部位位置优化模块509相连,用于根据最优的人脸各部位位置,应用前后向光流跟踪法跟踪连续两帧中人脸各部位的运动位置,根据当前跟踪人脸各部位的运动位置和各个子窗口的覆盖比例、后验概率得到人脸各部位的正负样本,基于得到的人脸各部位的正负样本,选取置信度最高的若干个样本计算其正负样本的特征,然后更新随机森林分类器的先验概率,将得到的人脸各部位的正负样本加入NCC分类器的样本库,更新NCC分类器的样本库。
本发明实施上述实施例,通过摄像头采集用户图像、采用滑动窗口的方法,依次通过方差滤波器、随机森林分类器、NCC分类器以及采用NMS算法,滑动窗口本身的特性决定了该方法可以采用并行编程技术实现加速功能,而且采用的滤波器和分类器都不涉及复杂的运算,保证程序得鲁棒性的同时减小了计算的复杂性,并且对人脸各部位特征拟合,人脸各部位位置优化以及对人脸各部位跟踪可以使人脸定位更精确,鲁棒性更高。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所揭露的仅为本发明实施例中的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (10)

1.一种人脸定位的方法,其特征在于,包括:
通过摄像头获取用户原始图像;
对所述用户原始图像经过粗略定位,得到人脸粗略定位图像;
根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息;
根据所述人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
2.如权利要求1所述的方法,其特征在于,所述根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息,具体包括:
将所述人脸粗略定位图像划分为若干个子窗口;
计算每个子窗口的图像方差值,将所述每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于所述方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口;
将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口;
将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。
3.如权利要求2所述的方法,其特征在于,所述将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口,具体包括:
计算通过上一步骤的子窗口的随机森林分类器的后验概率,如果所述后验概率大于预设的概率阈值则接收该子窗口,反之则否决该子窗口;
计算通过上一步骤的子窗口与NCC分类器样本库中的目标模板的匹配系数,当所述匹配系数大于预设的系数阈值则接收该子窗口,反之则否决该子窗口。
4.如权利要求1所述的方法,其特征在于,所述局部形状拟合方法具体为监督的序列拟合方法,所述监督的序列拟合方法具体为:
步骤a:根据人脸检测区域信息提取人脸各部位形状,该形状作为人脸各部位形状初始值;
步骤b:根据当前人脸各部位形状的标定点提取当前特征描述符,若干个当前特征描述符组成当前特征描述矢量;
步骤c:以所述当前特征描述矢量为索引号,在更新矩阵库中查找对应的更新矩阵,根据所述对应的更新矩阵更新当前人脸各部位形状,将步骤b中的当前人脸各部位形状替代为该更新当前人脸各部位形状;
步骤d:判断是否大于预设的最大迭代步数,或者最近两次形状误差向量范数误差小于预设向量范数误差阈值,否则返回步骤b,是则进入步骤e;
步骤e:得到精确的人脸各部位形状。
5.如权利要求2或3所述的方法,其特征在于,还包括:
根据所述精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数;
对所述人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
6.如权利要求5所述的方法,其特征在于,还包括:
根据最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置;
根据所述人脸各部位的运动位置,更新所述在线学习分类器。
7.一种人脸定位的装置,其特征在于,包括: 
获取图像模块,用于通过摄像头获取用户原始图像,将所述用户原始图像发送给粗略定位模块;
粗略定位模块,与所述获取图像模块相连,用于对所述用户原始图像经过粗略定位,得到人脸粗略定位图像,并将所述人脸粗略定位图像发送给检测区域模块;
检测区域模块,与所述粗略定位模块相连,用于根据所述人脸粗略定位图像得到人脸检测区域信息,所述人脸检测区域信息包括人脸各部位位置信息;
拟合模块,与所述检测区域模块相连,用于根据所述人脸检测区域信息,通过局部形状拟合方法得到精确的人脸各部位形状。
8.如权利要求7所述的装置,其特征在于,所述检测区域模块具体包括:
滑动窗口模块,用于将所述人脸粗略定位图像划分为若干个子窗口;
方差滤波模块,与所述滑动窗口模块相连,用于计算每个子窗口的图像方差值,将所述每个子窗口的图像方差值与预设的方差阈值进行比较,如果小于所述方差阈值则认定该子窗口包含目标区域,接收该子窗口,反之则否决该子窗口;
在线学习模块,与所述方差滤波模块相连,用于将上一步通过的子窗口通过在线学习分类器,得到通过所述在线学习分类器的子窗口;
NMS模块,与所述在线学习模块相连,用于将通过上一步骤输出的子窗口进行NMS处理,得到人脸检测区域信息。
9.如权利要求8所述的装置,其特征在于,还包括:
优化模块,与所述拟合模块相连,用于根据所述精确的人脸各部位形状,通过结构学习方法得到人脸各部位目标函数,对所述人脸各部位目标函数进行优化,得到最优的人脸各部位位置。
10.如权利要求9所述的装置,其特征在于,还包括:
在线更新模块,与所述优化模块相连,用于根据所述最优的人脸各部位位置,跟踪连续两帧中人脸各部位的运动位置,并根据所述人脸各部位的运动位置,更新在线学习分类器。
CN201310560912.XA 2013-11-13 2013-11-13 一种人脸定位的方法与装置 Active CN103593654B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310560912.XA CN103593654B (zh) 2013-11-13 2013-11-13 一种人脸定位的方法与装置
PCT/CN2014/090943 WO2015070764A1 (zh) 2013-11-13 2014-11-12 一种人脸定位的方法与装置
AU2014350727A AU2014350727B2 (en) 2013-11-13 2014-11-12 Face positioning method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310560912.XA CN103593654B (zh) 2013-11-13 2013-11-13 一种人脸定位的方法与装置

Publications (2)

Publication Number Publication Date
CN103593654A true CN103593654A (zh) 2014-02-19
CN103593654B CN103593654B (zh) 2015-11-04

Family

ID=50083786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310560912.XA Active CN103593654B (zh) 2013-11-13 2013-11-13 一种人脸定位的方法与装置

Country Status (3)

Country Link
CN (1) CN103593654B (zh)
AU (1) AU2014350727B2 (zh)
WO (1) WO2015070764A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015070764A1 (zh) * 2013-11-13 2015-05-21 智慧城市系统服务(中国)有限公司 一种人脸定位的方法与装置
CN105303150A (zh) * 2014-06-26 2016-02-03 腾讯科技(深圳)有限公司 实现图像处理的方法和系统
CN105809123A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸检测方法及装置
CN105868767A (zh) * 2015-01-19 2016-08-17 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN107481190A (zh) * 2017-07-04 2017-12-15 腾讯科技(深圳)有限公司 一种图像数据处理方法以及装置
CN107862308A (zh) * 2017-12-12 2018-03-30 成都电科海立科技有限公司 一种基于车载人脸识别装置的人脸识别方法
CN107977640A (zh) * 2017-12-12 2018-05-01 成都电科海立科技有限公司 一种基于车载人脸识别图像采集装置的采集方法
CN108764034A (zh) * 2018-04-18 2018-11-06 浙江零跑科技有限公司 一种基于驾驶室近红外相机的分神驾驶行为预警方法
CN109086711A (zh) * 2018-07-27 2018-12-25 华南理工大学 人脸特征分析方法、装置、计算机设备和存储介质
CN109613526A (zh) * 2018-12-10 2019-04-12 航天南湖电子信息技术股份有限公司 一种基于支持向量机的点迹过滤方法
CN110008791A (zh) * 2018-01-05 2019-07-12 武汉斗鱼网络科技有限公司 一种人脸区域确定方法、电子设备及可读存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051961A (zh) * 2019-12-26 2021-06-29 深圳市光鉴科技有限公司 深度图人脸检测模型训练方法、系统、设备及存储介质
CN112132067B (zh) * 2020-09-27 2024-04-09 深圳市梦网视讯有限公司 一种基于压缩信息的人脸倾斜度分析方法、系统及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561710A (zh) * 2009-05-19 2009-10-21 重庆大学 一种基于人脸姿态估计的人机交互方法
CN101593022A (zh) * 2009-06-30 2009-12-02 华南理工大学 一种基于指端跟踪的快速人机交互方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100389430C (zh) * 2006-06-13 2008-05-21 北京中星微电子有限公司 基于aam的头部姿态实时估算方法及系统
CN101916370B (zh) * 2010-08-31 2012-04-25 上海交通大学 人脸检测中非特征区域图像处理的方法
CN102622589A (zh) * 2012-03-13 2012-08-01 辉路科技(北京)有限公司 一种基于gpu的多光谱人脸检测方法
CN103593654B (zh) * 2013-11-13 2015-11-04 智慧城市系统服务(中国)有限公司 一种人脸定位的方法与装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101561710A (zh) * 2009-05-19 2009-10-21 重庆大学 一种基于人脸姿态估计的人机交互方法
CN101593022A (zh) * 2009-06-30 2009-12-02 华南理工大学 一种基于指端跟踪的快速人机交互方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015070764A1 (zh) * 2013-11-13 2015-05-21 智慧城市系统服务(中国)有限公司 一种人脸定位的方法与装置
CN105303150A (zh) * 2014-06-26 2016-02-03 腾讯科技(深圳)有限公司 实现图像处理的方法和系统
CN105868767A (zh) * 2015-01-19 2016-08-17 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN105868767B (zh) * 2015-01-19 2020-02-18 阿里巴巴集团控股有限公司 人脸特征点定位方法和装置
CN105809123B (zh) * 2016-03-04 2019-11-12 智慧眼科技股份有限公司 人脸检测方法及装置
CN105809123A (zh) * 2016-03-04 2016-07-27 北京智慧眼科技股份有限公司 人脸检测方法及装置
CN107481190A (zh) * 2017-07-04 2017-12-15 腾讯科技(深圳)有限公司 一种图像数据处理方法以及装置
CN107977640A (zh) * 2017-12-12 2018-05-01 成都电科海立科技有限公司 一种基于车载人脸识别图像采集装置的采集方法
CN107862308A (zh) * 2017-12-12 2018-03-30 成都电科海立科技有限公司 一种基于车载人脸识别装置的人脸识别方法
CN110008791A (zh) * 2018-01-05 2019-07-12 武汉斗鱼网络科技有限公司 一种人脸区域确定方法、电子设备及可读存储介质
CN110008791B (zh) * 2018-01-05 2021-04-27 武汉斗鱼网络科技有限公司 一种人脸区域确定方法、电子设备及可读存储介质
CN108764034A (zh) * 2018-04-18 2018-11-06 浙江零跑科技有限公司 一种基于驾驶室近红外相机的分神驾驶行为预警方法
CN109086711A (zh) * 2018-07-27 2018-12-25 华南理工大学 人脸特征分析方法、装置、计算机设备和存储介质
CN109613526A (zh) * 2018-12-10 2019-04-12 航天南湖电子信息技术股份有限公司 一种基于支持向量机的点迹过滤方法

Also Published As

Publication number Publication date
AU2014350727A1 (en) 2016-06-09
CN103593654B (zh) 2015-11-04
AU2014350727B2 (en) 2017-06-29
WO2015070764A1 (zh) 2015-05-21

Similar Documents

Publication Publication Date Title
CN103593654B (zh) 一种人脸定位的方法与装置
CN101777116B (zh) 一种基于动作跟踪的脸部表情分析方法
CN108073914B (zh) 一种动物面部关键点标注方法
CN110751022A (zh) 基于图像识别的城市宠物活动轨迹监测方法及相关设备
US8855363B2 (en) Efficient method for tracking people
CN107895160A (zh) 人脸检测与识别装置及方法
Kaâniche et al. Recognizing gestures by learning local motion signatures of HOG descriptors
CN111723786A (zh) 一种基于单模型预测的安全帽佩戴检测方法及装置
CN111126280B (zh) 基于融合手势识别的失语症患者辅助康复训练系统及方法
CN111813997A (zh) 入侵分析方法、装置、设备及存储介质
CN111553326B (zh) 手部动作识别方法、装置、电子设备及存储介质
CN105426882B (zh) 一种人脸图像中快速定位人眼的方法
CN112541529A (zh) 表情与姿态融合的双模态教学评价方法、设备及存储介质
CN106295524A (zh) 一种基于视觉词袋的人体动作识别方法
CN103105924A (zh) 人机交互方法和装置
CN110110663A (zh) 一种基于人脸属性的年龄识别方法及系统
CN110737788B (zh) 快速的三维模型索引建立及检索方法
CN110569775A (zh) 一种识别人体姿势的方法、系统、存储介质及电子设备
CN110688980A (zh) 基于计算机视觉的人体姿态分类方法
Kerdvibulvech A methodology for hand and finger motion analysis using adaptive probabilistic models
CN116468392A (zh) 一种电网工程项目进度监控方法、装置、设备及存储介质
Yao et al. Decision-tree-based algorithm for 3D sign classification
CN114663835A (zh) 一种行人跟踪方法、系统、设备及存储介质
CN107451578A (zh) 基于体感设备的聋哑人手语机器翻译方法
Zhang et al. Object detection based on deep learning and b-spline level set in color images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160721

Address after: 518000 Guangdong province Shenzhen City Guangming Street million Daiheng high tech Industrial Park No. 5 Building 5 floor

Patentee after: Shenzhen City Zhongzhi Kechuang Robot Co.,Ltd.

Address before: 518000 Guangdong city of Shenzhen province Nanshan District Hing Road two No. 6 Wuhan University B815 Shenzhen research building room

Patentee before: SMART CITIES SYSTEM SERVICES (PRC)CO., Ltd.

CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518000 Shenzhen, Guangdong Guangming New District Guangming Street Wan Dai Heng hi tech Industrial Park 5, 5 floor.

Patentee after: SMART SECURITY & SURVEILLANCE ROBOT Co.,Ltd.

Address before: 518000 Shenzhen, Guangdong Guangming New District Guangming Street Wan Dai Heng hi tech Industrial Park 5, 5 floor.

Patentee before: Shenzhen City Zhongzhi Kechuang Robot Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181024

Address after: 518000 Shenzhen, Guangdong Guangming New District Guangming Street Wan Dai Heng hi tech Industrial Park 5, 5 floor.

Patentee after: SHENZHEN ZHONGZHI KECHUANG ROBOT Co.,Ltd.

Address before: 518000 Shenzhen, Guangdong Guangming New District Guangming Street Wan Dai Heng hi tech Industrial Park 5, 5 floor.

Patentee before: SMART SECURITY & SURVEILLANCE ROBOT Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210508

Address after: 518000 Room 201, building a, No.1 Qianhai 1st Road, Qianhai Shenxiang cooperation zone, Shenzhen City, Guangdong Province

Patentee after: Shenzhen Zhongzhi Weian Robot Technology Co.,Ltd.

Address before: 518000 5th floor, No.5 workshop, wandaiheng hi tech Industrial Park, Guangming Street, Guangming New District, Shenzhen City, Guangdong Province

Patentee before: SHENZHEN ZHONGZHI KECHUANG ROBOT Co.,Ltd.