CN100375108C - 一种人脸特征点自动定位方法 - Google Patents

一种人脸特征点自动定位方法 Download PDF

Info

Publication number
CN100375108C
CN100375108C CNB2006100243070A CN200610024307A CN100375108C CN 100375108 C CN100375108 C CN 100375108C CN B2006100243070 A CNB2006100243070 A CN B2006100243070A CN 200610024307 A CN200610024307 A CN 200610024307A CN 100375108 C CN100375108 C CN 100375108C
Authority
CN
China
Prior art keywords
shape
face
texture
image
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100243070A
Other languages
English (en)
Other versions
CN1811793A (zh
Inventor
刘成明
张立明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CNB2006100243070A priority Critical patent/CN100375108C/zh
Publication of CN1811793A publication Critical patent/CN1811793A/zh
Application granted granted Critical
Publication of CN100375108C publication Critical patent/CN100375108C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明是一种快速的人脸特征点定位方法,对于一张任意输入的人脸正面或侧面(偏转角度在45度以内)数字图像,本算法能快速有效的定位出面部的大量显著特征点的位置。并且本算法的框架可以扩展运用到其他物体的特征点定位上。本方法综合利用了人脸的形状和纹理信息,在训练过程中只需要一定数量手工标定特征点的人脸图像,然后分别建立可变的形状和纹理模型,对于任意输入的人脸图片,首先要通过人脸检测的方法来初始化模型的参数,然后采用实时AAM和遗传算法来优化形状系数,最后再通过边缘检测以及肤色区间检测的方法来对部分特征点进一步微调就可达到准确的特征点定位的目的。

Description

一种人脸特征点自动定位方法
技术领域
本发明属机器视觉和图像处理技术领域,具体涉及一种正面和侧面人脸图像中的特征点自动定位方法。
技术背景
精确的、快速的人脸特征点定位在人脸识别、3D人脸图像的重建等方面有着非常广泛的运用。人脸特征点技术一般都与人脸检测技术相结合,从而缩小对特征点找寻的区域,成为一个实用的系统。
在人脸检测方面,比较著名的是Paul Viola和Michael Jones于2001年提出的基于Adaboost的人脸检测算法[1],该方法是统计学习的一种改进,它通过组合大量简单分类器来达到人脸检测。由于其中的每个简单分类器使用了计算速度非常快的特征,因此从根本上解决的检测的速度问题。精确的、快速的人脸特征点定位在人脸识别、3D人脸图像的重建等方面有着非常广泛的运用。早期的特征点定位是基于人脸的几何特征和先验知识,如双眼的对称性、眼珠是黑色等,但这种方法的鲁棒性很差,对光照的影响敏感。1995年Cootes等人利用人脸特征点之间位置相关性很强的特点提出了著名的活动形状模型(ASM)[2],它是一个以统计方式对特征点组的坐标位置建立的可变形状模型,从而可搜索到人脸的整体形状,但因在纹理上只利用了特征点附近的灰度值,因此对初值和背景很敏感,为了克服其不足提出了很多改进的算法。比较著名的有贝叶斯形状模型方法[3],它结合整体形状模型和局部器官形状模型来优化一个联合后验概率分布函数;还有贝叶斯正切形状模型的方法[4],它则在形状模型的正切空间通过EM算法来计算最大后验概率估计。但它们不能根本上克服ASM方法固有的缺点。2001年Cootes等人在原ASM的基础上提出了形状和纹理结合的活动外表模型(AAM)[5],获得了比ASM更优的结果。但因考虑到形状和纹理的两部分可变形参数,它的计算复杂性大,容易陷入局部最小。文献[6]采用了先ASM然后再AAM的搜索方法来提取特征点,分成两步之后也无法完全解决两种算法的不足。2004年Simon Baker等人提出了实时的活动外表模型算法(Realtime-AAM)[7][8],它在纹理基的补空间上先优化形状参数,然后直接计算纹理。改进的优化算法基本解决了AAM算法的速度问题,但仍然不能完全解决局部最小的问题,并且,由于优化是建立在与平均纹理误差的基础上,而人脸面颊部分的纹理比较平坦,传统的AAM算法和实时AAM算法在提取下巴上的特征点时都很容易陷入局部最小。
本发明与上述方法相比,主要特点有:(1)在实时AAM的代价函数中加入与图像的边缘有关的项,将得到的新的代价函数作为对下巴轮廓特征点做进一步搜索的目标,搜索算法采用遗传算法。(2)对不同角度的人脸分别建立模型,从而使人脸在一定角度范围内的图像都可以处理。(3)结合图像边缘和人脸肤色信息,对优化后的特征点进一步作精确的搜索,从而得到更优的结果。
下面介绍与本发明相关的一些概念:
1、形状和纹理模型
假设Ω是具有N幅人脸图片的训练集,可以表示为 Ω = { S t , A t } t = 1 N , 其中St表示第t个人脸上v个特征点坐标矢量 S t = ( x 1 t , . . . , x v t , y 1 t , . . . , y v t ) ′ , St∈R2v,它是用手工获取的,通过主分量分析(PCA)的方法对形状建模可以得到,
S t = S 0 + Σ i = 1 m p i t S i - - - ( 1 )
其中S0表示平均形状矢量,ξ=[S1,S2,...,Sm]为形状的PCA基。假设形状矢量St所围成的区域用Ut来表示,At是由区域Ut内的所有点变形到平均形状所围成的区域U0上所得到的纹理图像,变形的算法可以采用分段仿射变换等方法完成,同样对于纹理At有,
A t = A 0 + Σ i = 1 n q i t A i - - - ( 2 )
A0是平均形状下的平均纹理图像,如图2所示;Ai是纹理的PCA的基,式(1)和(2)中的Pi t和qi t分别是第t个人脸图像的形状和纹理系数,可以写成矢量 p t = ( p 1 t , p 2 t , . . . , p m t ) T ∈ R m , q t = ( q 1 t , q 2 t , . . . , q n t ) T ∈ R n . 在下面为了简化起见,我们把系数肩上的t省去。
2、实时活动外表模型算法(Realtime-AAM)
对于一张真实输入的照片I(x),要最小化下列与形状和纹理系数p,q有关的目标函数使得它们重建出来的人脸图片与实际图片之间的误差最小,
E = Σ x ∈ U 0 { A 0 ( x ) + Σ i = 1 n q i A i ( x ) - I ( W ( x | p ) ) } 2 ; - - - ( 3 )
式(3)中括号内的前两项是纹理在参数q下的重建结果,同样给定形状参数矢量p后,通过式(1)可以重建出形状S,它所围成的区域为U,那么W(x|p)表示U0上的所有点分段仿射变换到U后的坐标。通过Project-Out的方法可以先在纹理基的正交补空间上迭代形状参数,因补空间的基和纹理基正交,此时,式(3)括弧中的第二项为零,这样代价函数可以简化成,
E = Σ x ∈ U 0 { A 0 ( x ) - I ( W ( x | p ) ) } 2 A i ⊥ ;
这儿Ai 为纹理基的补空间,
实时AAM算法的迭代步骤可以总结为:
①对于输入图像I和初始的形状参数p,计算变形到平均形状下的纹理I(W(x|p));
②计算差值图像I(W(x|p))-A0(x),并乘上预先算好的参数 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T ;
③计算形状参数的增量Δp,满足
Δp = H - 1 Σ x ∈ U 0 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ I ( W ( x | p ) ) - A 0 ( x ) ] , 其中 H = [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ ▿ A 0 ∂ W ∂ p | p = 0 ] ; - - - ( 5 )
④根据第r次迭代时的Wr(x|p)和Δp,采用文献[6]中的Lucas-Kanade算法计算下一次迭代的Wr+1(x|p),r=r+1;
⑤重复①直到满足收敛条件或者达到最大迭代次数。
如果考虑形状的全局平移、旋转和缩放变化,可以在形状基中添加代表这些变化的正交基,然后用类似的方法优化得到对应的全局变化参数。
3、线性判别分析(LDA)
LDA算法是对不同类的高维样本(假设为d维,d>>1)的一种常用的有教师的线性降维方法,它寻找一个低维的线性子空间,以使得不同类的样本在该子空间上投影的类内样本分布更紧密、类间样本散布得更分散,以便于识别和分类。以人脸图像为例,具体做法如下:
首先我们将N个的两维人脸图像按照行序或者列序排列成列向量的形式xi∈Rd,i=1,2,...N,这样一幅图像对应了高维空间中的一个样本。我们假设这些样本共分为c类,每类有Ni个样本,则有:
总均值 m = 1 N Σ i = 1 N x i
各类均值 m i = 1 N i Σ x j ∈ X i x j , ( i = 1,2 , . . . , c )
类内散布矩阵 S w = Σ i = 1 c Σ x j ∈ X i ( x j - m i ) ( x j - m i ) T - - - ( 6 )
类间散布矩阵 S b = Σ i = 1 c N i ( m i - m ) ( m i - m ) T - - - ( 7 )
构成LDA子空间的基 W LDA = arg max W | W T S b W | | W T S w W | = w 1 w 2 . . . w m , 可由以下广义特征分解得到:
Sbwi=λiSwwi
参考文献
[1].P.Viola,M.Jones.Robust real time object detection.8th IEEE InternationalConference on Computer Vision(ICCV),2001,Vancouver,British Columbia.
[2].Cootes T,Taylor C,Cooper D,et al.Active shape models-their training andapplication[J].Computer vision and image understanding,1995,61(1):38-59.
[3].Zhong X,Stan Z,Toeh E K.Bayesian shape model for facial feature extractionand recognition[J].Pattern recognition,2003,23(12):2819-2833.
[4].Zhou Y,Gu L,Zhang H J.Bayesian tangent shape model:estimating shape andpose parameters via Bayesian inference[C].IEEE conference on computervision and pattern recognition,2003.
[5].Cootes T,Edwards G,Taylor C.Active appearance models[J].IEEE TransPattern Analysis and Machine Intelligence,2001,23(6):681-685.
[6].Shan S,Gao W,Zhao D,et al.Enhanced active shape models with globaltexture constraints for image analysis [EB/OL].http://www.jdl.ac.cn/user/sgshan/pub/Shan-ISMIS-2003.pdf,2004-06-1/2005-04-23.
[7].Matthews I,Baker S.Active appearance models revisited[J].Int’lJ.ComputerVision,2004,60(2).
[8].Baker S,Matthews I,Schneider J.Automatic construction of active appearancemodels as an image coding problem[J].IEEE Trans Pattern Analysis andMachine Intelligenee,2004,26(10):1380-1384.
发明内容
本发明的目的在于提出一种数字图像中人脸特征点自动定位方法。该方法对正面和侧面人脸均能处理,其中侧面人脸的偏转角度要求在45度以内。
本发明提出的对数字图像中人脸特征点自动定位方法包括离线训练部分和在线计算部分。其中离线部分通过手工标注好特征点的训练图片来建立形状和纹理的统计模型;在线计算部分包括人脸自动检测、姿态识别、通过模型优化算法对基于活动模型的特征点定位以及基于边缘和肤色的校准处理几个步骤(各步骤均由相应模块构成)。图1显示了系统流程图。下面具体介绍相应的步骤和详细算法。
1、建立形状和纹理模型
本模块是离线训练部分,要求一定数量的统一大小的人脸图像,并且手工标定好预先定义的特征点坐标,例如图2(a)。
在形状上:对于每幅图片上的v个特征点坐标排列为形状矢量,S=(x1,...,xv,y1,...,yv)′,St∈R2v,对不同的人脸进行归一化处理以去除全局仿射变换的影响,从而不同的形状矢量仅体现不同人脸内在的形状差异。归一化步骤如下:
(a)对所有形状矢量去除均值,转移到质心坐标系下。
(b)选择一个样本作为初始的平均形状,并校准尺度使得 | S ‾ | = 1 .
(c)将初始估计的平均形状记为
Figure C20061002430700092
并定义为参考帧。
(d)将所有训练样本形状通过仿射变换校准到当前平均形状上。
(e)对校准后的所有样本重新计算平均形状。
(f)将当前的平均形状校准到
Figure C20061002430700093
上,并且使得 | S ‾ | = 1 .
(g)如果平均形状的改变仍然大于给定的阈值,回到(d)。
对于归一化后的形状矢量,可以通过式(1)的PCA方法建立统计形状模型。
在建立纹理模型前,要求每幅图片的纹理矢量具有相同的长度,将所有图像中人脸区域内的纹理都采用变形算法校准到由平均形状所围成的人脸区域内,从而将不同人之间形状和纹理的差异分离开。图像变形算法可以采用分段仿射变换的方法,其中网格的划分如图2(b)所示。最后得到的平均纹理,例如图2(c)所示。同样,通过式(2)可以建立统计纹理模型。
2、人脸检测和姿态识别
人脸检测模块采用了比较成熟的Adaboost方法[1],标识出包含人脸的图像子区域;姿态识别模块采用了LDA的特征抽取方法。
对于姿态识别,是将同一姿态的人脸图像构成一类,按(6)(7)式分别计算类内散布矩阵Sw和类间散布矩阵Sb,并得到姿态识别LDA基。将各样本投影到这些基上得到了各样本降维后的特征。求取同一类样本的均值,作为该姿态人脸图像的特征。测试时,对于人脸区域进行姿态识别,即将其投影到LDA姿态识别基上,得到了降维后的特征,然后与已有的姿态特征进行比较,用最近邻判决法进行分类,得到该人脸图像的姿态。
3、模型优化算法
首先采用实时AAM算法对代价函数式(4)进行优化,由于算法在纹理的补空间上先优化形状可以简化计算提高收敛的速度和精度,但是所有输入图片都是与平均理匹配的,因此特征点定位不够准确,特别是对于训练集以外的测试人脸,下巴轮廓线一般都很难收敛。接下来在AAM的代价函数式(4)中引入一项代表特征点处的边缘信息,然后用遗传算法来优化新的代价函数。
对边缘图像的提取采用了9×9的Laplace高通滤波核KLaplace
Ledge(x)=I(x)*KLaplace.(8)
对于经过(8)式滤波后图像Iedge还需要归一化到[0,1]之间实数。此时,代价函数可以表示为,
ψ = Σ x ∈ U 0 { A 0 - I ( W ( x | p ) ) } 2 + α Σ i ∈ L ( 1 - I edge ( i ) ) ; - - - ( 9 )
其中在参数p下的形状S可以由(1)式算出,L表示S中下巴上的l个特征点坐标集合,α是一个常系数。当式(9)代价函数达到最小时,说明求出的输入人脸的特征点所围成的区域的纹理与平均纹理的距离最小,而且这些特征点是落在人脸图像的边缘上。
假设输入图像I(x)上粗搜索得到的下巴特征点序列ρ={x1,...x1,y1,...yl},(xi,yi)为特征点的坐标,那么取这一序列为染色体,长度为2l。初始染色体群体是通过在特征点处的法线方向上每隔单位长度取一个点来得到,染色体群体数目与在法线方向上搜索的最大范围[-Pmax,Pmax]相关,如图3所示的下巴的上下边界之间的区域内随机选取染色体。
根据(9)式可以计算出每条染色体对应的代价函数值ψ={ψ1,ψ2,...,ψη},其中η表示群体中染色体的总数。在下一代生成时适应度的计算采用了rank-scale的方法,首先对染色体群体的代价函数值进行升序排列,那么排在第j位的染色体的适应度为,
φ j = η × 1 j Σ i = 1 η 1 / i . - - - ( 10 )
十分明显,代价函数值越小,适应度φj就越大。根据群体中每条染色体的适应度,以轮盘赌的方法选取η条父代染色体作交叉运算,其中适应度佳的染色体被选中的概率也大,并且可能被多次选中。
假设选中的一对父代染色体ρa={xa1,...xal|Ya1,...yal},ρb={xb1,...xbl|yb1,...ybl},作交叉时采用单点分段交叉的方法,将x和y坐标分成两段染色体,对于每段染色体随机选取1个交叉点,然后作交叉算子产生下一代染色体。变异时对于以一定概率选中的染色体(一般概率比较小),加上一个随机[-2,2]像素之间的扰动,用来避免陷入局部最小的情况。
对于遗传下来的子代染色体要通过所建立的形状模型加以约束,可以平滑轮廓曲线并且消除个别奇异点。假设第k条染色体对应的整体形状Sk,由于PCA建模得到的形状基ξ=[S1,S2,...,Sm]是一组正交向量组,因此根据式(1)形状Sk对应的系数Pk很容易求得,
Pk=ξT(Sk-S0).(11)
对于系数矢量Pi k需要加以约束,其每个系数必须取在 - 0.3 λ i 0.3 λ i 之间,其中λi是做形状PCA时第i个特征向量对应的特征值。然后通过(1)式可求出加完约束后的新的染色群体,进入下一步的迭代。
4、基于边缘和肤色的校准处理
对于经过上面优化算法得到的特征点位置,可以再通过Canny算子抽取到的二值化图像边缘或者人脸的肤色信息作进一步的校准,特别是对于下巴轮廓上的特征点,它们和背景相区分一般都有比较明显的边缘或者位于肤色区间的分界线上,因此用上述方法可以方便快捷的得到精确的特征点位置。图4为Canny算子提取边缘的结果。对于肤色空间的检测,首先将彩色图像从RGB空间转换到YCrCb空间,一般用色度值来限定肤色区域,通过实验我们选择归一化后的色度满足Cb∈[0.455,0.500],Cr∈[0.555,0.630]的像素为肤色区间,如图5所示。
但是无论是通过边缘还是肤色,都会存在一些干扰的点,影响最后的结果。因此在每一步搜索完成后通过形状模型加以约束,以消除个别奇异点。具体搜索步骤如下:
(h)首先通过姿态识别后,如果是正面人脸,在人脸检测区域内通过canny算子得到二值化的边缘图像;如果是侧面人脸,在人脸检测区域内通过肤色检测方法得到二值化图像。例如图1中的系统框架图所示。
(i)计算需要做校准处理的下巴轮廓线上各点的法线方向。
(j)在法线方向上一定范围内寻找最临界的边缘点或者二值化图像的分界点。
(k)通过式(11)利用建立好的形状模型对搜索到的新特征点位置做约束。
(l)如果特征点收敛,即迭代前后特征点的改变量小于某一阈值,退出循环;否则回到(b)
本发明的优点:
本发明结合了人脸检测、姿态识别、特征点定位等算法,使得本算法对于不同角度的二维人脸照片都可以快速准确的定位出大量显著特征点的位置。人脸检测模块缩小了特征点的候选区域,姿态识别的引入使得不同角度的人脸可以通过不同角度的模型加以约束和优化。而在优化的方法上,本发明采用了实时AAM和遗传算法相结合的方法,克服了实时AAM的误差函数只是与平均纹理差值的结果,导致提取的特征点不够精确容易陷入局部最小的问题。最后还通过canny算子提取边缘和肤色空间分割的方法来对部分处于明显图像边缘或者肤色区间边缘上的特征点作精确校正。实验表明本方法对人脸特征点的精确定位十分有效,并且时间开销也在允许的范围内。
附图说明
图1人脸特征点定位系统框架。
图2形状和纹理模型,其中(a)手工标定60个特征点,(b)平均形状的网格,(c)平均形状下的平均纹理。
图3下巴轮廓搜索的区域。
图4(a)原始正面图像。
图4(b)二值化边缘图像。
图5(a)原始侧面图像。
图5(b)二值化的肤色区域。
图6实时AAM方法和本文方法的部分搜索结果
图6(a)模型初始位置。
图6(b)实时AAM方法搜索结果。
图6(c)本文方法搜索结果。
图7复杂背景下本文方法的搜索结果。
具体实施方式
一、建立形状和纹理模型:
1、形状模型:
将每幅图片上的v个特征点坐标排列为形状矢量,S=(x1,...,xv,y1,...,yv)′,St∈R2v。然后用下面方法对N幅图像的形状矢量进行规一化处理:
(a)对所有形状矢量去除均值,转移到质心坐标系下。
(b)选择一个样本作为初始的平均形状,并校准尺度使得 | S ‾ | = 1 .
(c)将初始估计的平均形状记为
Figure C20061002430700122
,并定义为参考帧。
(d)将所有训练样本形状通过仿射变换校准到当前平均形状上。
(e)对校准后的所有样本重新计算平均形状。
(f)将当前的平均形状校准到
Figure C20061002430700131
上,并且使得 | S ‾ | = 1 .
(g)如果平均形状的改变仍然大于给定的阈值,回到(d)。
通过式(1)的PCA方法建立统计形状模型:
S t = S 0 + Σ i = 1 m p i t S i - - - ( 1 )
其中S0表示平均形状矢量,ξ=[S1,S2,...,Sm]为形状的PCA基。
2、纹理模型:
(a)将所有图像中人脸区域内的纹理都采用变形算法校准到由平均形状S0所围成的人脸区域U0内。
(b)将不同人在区域U0内的纹理展成矢量形式At
(c)通过式(2)建立统计纹理模型。
A t = A 0 + Σ i = 1 n q i t A i - - - ( 2 )
A0是平均形状下的平均纹理图像,如图2所示;Ai是纹理的PCA的基,式(1)和(2)中的pi t和qi t分别是第t个人脸图像的形状和纹理系数,可以写成矢量 p t = ( p 1 t , p 2 t , . . . , p m t ) T ∈ R m , q t = ( q 1 t , q 2 t , . . . , q n t ) T ∈ R n .
二、人脸检测和姿态识别:
1、采用比较成熟的Adaboost方法,标识出包含人脸的图像子区域;
2、将检测出来的人脸区域内的纹理展成一列矢量,将其投影到LDA姿态识别基上,得到了降维后的特征;
3、对降维后的特征,与训练好的姿态特征进行比较,用最近邻判决法进行分类,得到该人脸图像的姿态。
三、模型优化算法:
采用两阶段优化的方法:
1、实时AAM优化算法:
(a)对于输入图像I和初始的形状参数p,计算变形到平均形状下的纹理I(W(x|p));
(b)计算差值图像I(W(x|p))-A0(x),并乘上预先算好的参数 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T ;
(c)计算形状参数的增量Δp,满足
Δp = H - 1 Σ x ∈ U 0 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ I ( W ( x | p ) ) - A 0 ( x ) ] , 其中 H = [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ ▿ A 0 ∂ W ∂ p | p = 0 ] ; - - - ( 5 )
(d)根据第r次迭代时的Wr(x|p)和Δp,采用文献[6]中的Lucas-Kanade算法计算下一次迭代的Wr+1(x |p),r=r+1;
(e)重复(a)直到满足收敛条件或者达到最大迭代次数。
2、遗传算法:
(a)假设输入图像I(x)上粗搜索得到的下巴特征点序列ρ={x1,...xl,y1,...yl},(xi,yi)为特征点的坐标,那么取这一序列为染色体,长度为2l。
(b)初始染色体群体是通过在特征点处的法线方向上每隔单位长度取一个点来得到,染色体群体数目与在法线方向上搜索的最大范围[-Pmax,Pmax]相关,如图3所示的下巴的上下边界之间的区域内随机选取染色体。
(c)根据(9)式可以计算出每条染色体对应的代价函数值ψ={ψ1,ψ2,...,ψη},其中η表示群体中染色体的总数。
ψ = Σ x ∈ U 0 { A 0 - I ( W ( x | p ) ) } 2 + α Σ i ∈ L ( 1 - I edge ( i ) ) ; - - - ( 9 )
其中在参数p下的形状S可以由(1)式算出,L表示S中下巴上的l个特征点坐标集合,α是一个常系数。对边缘图像Iedge的提取采用了9×9的Laplace高通滤波核KLaplace
Iedge(x)=I(x)*KLaplace.(8)
对于经过(8)式滤波后图像Iedge还需要归一化到[0,1]之间实数。
(d)在下一代生成时适应度的计算采用了rank-scale的方法,首先对染色体群体的代价函数值进行升序排列,那么排在第j位的染色体的适应度为,
φ j = η × 1 j Σ i = 1 η 1 / i . - - - ( 10 )
(e)根据群体中每条染色体的适应度,以轮盘赌的方法选取η条父代染色体作交叉运算,其中适应度佳的染色体被选中的概率也大,并且可能被多次选中。
(f)任意选中的一对父代染色体ρa={xa1,...xal|ya1,...yal},ρb={xb1,...xbl|yb1,...ybl},作交叉时采用单点分段交叉的方法,将x和y坐标分成两段染色体,对于每段染色体随机选取1个交叉点,然后作交叉算子产生下一代染色体。
(g)变异算子,对于以一定概率选中的染色体(一般概率比较小),加上一个随机[-2,2]像素之间的扰动。
(h)如果新的染色体群体的代价函数值进化前后保持稳定,或达到最大的遗传次数,则退出循环:否则回到(c)进行下一次的遗传。
四、校准处理:
1、首先通过姿态识别后的结果进行判断。如果是正面人脸,在人脸检测区域内通过canny算子得到二值化的边缘图像;如果是侧面人脸,在人脸检测区域内通过肤色检测方法得到二值化图像。例如图1中的系统框架图所示。
2、计算需要做校准处理的下巴轮廓线上各点的法线方向。
3、在法线方向上一定范围内寻找最临界的边缘点或者二值化图像的分界点。
4、通过式(11)利用建立好的形状模型对搜索到的新特征点位置做约束。
Pk=ξT(Sk-S0).(11)
对于系数矢量Pi k加以约束,其每个系数必须取在 - 0.3 λ i 0.3 λ i 之间,其中λi是做形状PCA时第i个特征向量对应的特征值。
5、如果特征点收敛,即迭代前后特征点的改变量小于某一阈值,退出循环;否则回到2。
本发明采用实际拍摄的照片来测试算法的有效性,其中训练集包含120张正面脸和120张右侧30度的图片,用来分别建立正面和侧面的形状和纹理模型,测试集包含100张正面脸和侧面图片。所有图片都手工标定了60个特征点,特征点的定义如图1(a)所示。对测试图片,算法收敛得到的特征点与手工标定的特征点的平均距离作为搜索精度的判别标准,
err = 1 v Σ i = 1 v | | C i - C ~ i | | ; - - - ( 12 )
其中Ci
Figure C20061002430700153
分别为收敛得到的和手工标定的第i个特征点,v=60。
1.训练阶段:
A)LDA姿态识别基:
将姿态分为-30°、0°和30°三个区间,每类姿态各用200幅Adaboost方法检测出的人脸子图像作为样本训练LDA姿态识别基。Adaboost的输出为128×128的彩色人脸子图像,为了进一步减少背景对姿态识别的影响,在进行训练前,需要对人脸检测输出的人脸子图像进行灰度化和切割,使之成为100×100的灰度图像。最终得到2个10000维的LDA姿态识别基。再将所有的灰度图像投影到这组基上,并对降维后的特征求均值,得到了每类姿态的特征。
B)形状和纹理模型的建立:
对于训练集中的正面和侧面各120张图片,以及手工标定的特征点,建立形状和纹理模型。
2.测试阶段:
(a)对于输入的人脸图像,利用Adaboost方法进行人脸检测,标识出128×128的人脸子区域。
(b)将其投影到LDA姿态识别基上,并与已有的姿态特征作比较,用最近邻判别法进行分类,得到人脸姿态。
(c)根据不同的姿态采用不同的模型,如-30°则将图片左右翻转然后用右侧30°模型来处理。
(d)通过实时AAM算法做第一步优化。
(e)对加入边缘信息后的代价函数,采用遗传算法优化。遗传算法中初始染色体数目为31,交叉概率为0.8,变异概率为0.005,迭代次数为10次。
(f)如果是正面照片,则采用canny算子提取边缘,然后对下巴特征点进行校准;如果是侧面照片,则采用人脸肤色检测方法对下巴特征点进行校准;
表1列出了在训练集和测试集上的平均搜索结果,在实时AAM方法的基础上特征点的搜索精度平均提高1个像素左右。在计算时间上,本方法在P43.6G机器上搜索一幅图片耗时2~4s,也在能够容忍的范围内。图6中列出了一些测试的例子,第一列显示的是初始放置的位置,中间是实时AAM方法搜索的结果,可以看出大部分情况下巴轮廓线都没法收敛到,最后一列是本方法得到的结果,都能收敛到较好的位置。图7是在一般背景下的比较结果。
表1不同方法匹配结果的误差(以像素为单位)
  算法   实时AAM   本文方法
  训初始位置的平均误差练特征点的平均误差集特征点误差的方差测初始位置的平均误差试特征点的平均误差集特征点误差的方差   21.9510.1312.4545.1710.4513.13   21.959.0510.2745.179.3212.47

Claims (2)

1.一种对数字图像中人脸特征点自动定位方法,包括离线训练和在线计算两个部分,其特征在于其中离线训练部分通过手工标注好特征点的训练图片来建立形状和纹理的统计模型;在线计算部分包括人脸自动检测、姿态识别、通过模型优化算法对基于活动模型的特征点定位以及基于边缘或肤色的校准处理几个步骤,其中:
所述建立形状和纹理统计模型步骤如下:
(1)形状模型
将每幅图片上的v个特征点坐标排列为形状矢量,S=(x1,…,xv,y1,…,yv)′,St∈R2v,然后对N幅图像的形状矢量进行归一化处理:
(a)对所有形状矢量去除均值,转移到质心坐标系下;
(b)选择一个样本作为初始的平均形状,并校准尺度使得 | S ‾ | = 1 ;
(c)将初始估计的平均形状记为
Figure C2006100243070002C2
并定义为参考帧;
(d)将所有训练样本形状通过仿射变换校准到当前平均形状上;
(e)对校准后的所有样本重新计算平均形状;
(f)将当前的平均形状校准到
Figure C2006100243070002C3
上,并且使得 | S ‾ | = 1 ;
(g)如果平均形状的改变仍然大于给定的阈值,回到(d);
然后,通过下式(1)的主分量分析方法建立统计形状模型:
S t = S 0 + Σ i = 1 m p i t s i - - - ( 1 )
其中S0表示平均形状矢量,ξ=[S1,S2,...,Sm]为形状的主分量分析方法的基;
(2)纹理模型:
(a)将所有图像中人脸区域内的纹理都采用变形算法校准到由平均形状S0所围成的人脸区域U0内;
(b)将不同人在区域U0内的纹理展成矢量形式At
(c)通过下式(2)建立统计纹理模型:
A t = A 0 + Σ i = 1 n q i t A i - - - ( 2 )
A0是平均形状下的平均纹理图像,Ai是纹理的主分量分析方法的的基,式(1)和(2)中的pi t和qi t分别是第t个人脸图像的形状和纹理系数,写成矢量pt=(p1 t,p2 t,...,pm t)T∈Rm,qt=(q1 t,q2 t,...,qn t)T∈Rn
所述人脸自动检测和姿态识别的步骤如下:
(1)建立姿态识别基,将人脸姿态分为若干区间,将同一区间的姿态的人脸图像构成一类,对每类姿态各用若干幅由Adaboost方法检测出的人脸子图像作为样本训练的线性差别分析的姿态识别基;
(2)采用Adaboost方法,标识出包含人脸的图像子区域;
(3)将检测出来的人脸区域内的纹理展成一列矢量,将其投影到上述姿态识别基上,得到了降维后的特征;
(4)对降维后的特征,与训练好的姿态特征进行比较,用最近邻判决法进行分类,得到该人脸图像的姿态;
所述模型优化算法的步骤如下:
(1)实时活动外表模型优化算法:
(a)对于输入图像I和初始的形状参数p,计算变形到平均形状下的纹理I(W(x|p));
(b)计算差值图像I(W(x|p))-A0(x),并乘上预先算好的参数 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T ;
(c)计算形状参数的增量Δp,满足
Δp = H - 1 Σ x ∈ U 0 [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ I ( W ( x | p ) ) - A 0 ( x ) ] , 其中 H [ ▿ A 0 ∂ W ∂ p | p = 0 ] T [ ▿ A 0 ∂ W ∂ p | p = 0 ] ; - - - ( 5 )
(d)根据第r次迭代时的Wr(x|p)和Δp,采用Lucas-Kanade算法计算下一次迭代的Wr+1(x|p),r=r+1;
(e)重复(a),直到满足收敛条件或者达到最大迭代次数;
(2)遗传算法:
(a)假设输入图像I(x)上粗搜索得到的下巴特征点序列ρ={x1,…xl,y1,…yl},(xi,yi)为特征点的坐标,那么取这一序列为染色体,长度为2l;
(b)初始染色体群体是通过在特征点处的法线方向上每隔单位长度取一个点来得到,染色体群体数目与在法线方向上搜索的最大范围[-Pmax,Pmax]相关,在下巴的上下边界之间的区域内随机选取染色体;
(c)根据(9)式计算出每条染色体对应的代价函数值ψ={ψ1,ψ2,…,ψη},其中η表示群体中染色体的总数:
ψ = Σ x ∈ U 0 { A 0 - I ( W ( x | p ) ) } 2 + α Σ i ∈ L ( 1 - I edge ( i ) ) ; - - - ( 9 )
其中在参数p下的形状S由(1)式算出,L表示S中下巴上的l个特征点坐标集合,α是一个常系数;对边缘图像Iedge的提取采用了9×9的Laplace高通滤波核KLaplace
Iedge(x)=I(x)*KLaplace.    (8)
对于经过(8)式滤波后图像Iedge归一化到[0,1]之间实数;
(d)在下一代生成时适应度的计算采用了rank-scale的方法,首先对染色体群体的代价函数值进行升序排列,排在第j位的染色体的适应度为,
φ j = η × 1 j Σ i = 1 η 1 / i . - - - ( 10 )
(e)根据群体中每条染色体的适应度,以轮盘赌的方法选取η条父代染色体作交叉运算;
(f)任意选中的一对父代染色体ρa={xa1,…xal|ya1,…yal},ρb={xb1,…xbl|yb1,…ybl},采用单点分段交叉的方法,将x和y坐标分成两段染色体,对于每段染色体随机选取1个交叉点,然后作交叉算子产生下一代染色体;
(g)变异算子,对于以一定概率选中的染色体,加上一个随机[-2,2]像素之间的扰动;
(h)如果新的染色体群体的代价函数值进化前后保持稳定,或达到最大的遗传次数,则退出循环;否则回到(c)进行下一次的遗传。
2.根据权利要求1所述的自动定位方法,其特征在于所述校准处理的步骤如下:
(1)首先通过姿态识别后的结果进行判断:如果是正面人脸,在人脸检测区域内通过canny算子得到二值化的边缘图像;如果是侧面人脸,在人脸检测区域内通过肤色检测方法得到二值化图像;
(2)计算需要做校准处理的下巴轮廓线上各点的法线方向;
(3)在法线方向上一定范围内寻找最临界的边缘点或者二值化图像的分界点:
(4)通过下式(11)利用建立好的形状模型对搜索到的新特征点位置做约束:
Pk=ξT(Sk-S0).    (11)
对于系数矢量Pi k加以约束,其每个系数必须取在
Figure C2006100243070004C3
之间,其中λi是做形状主分量分析时第i个特征向量对应的特征值;
(5)如果特征点收敛,退出循环;否则回到(2)。
CNB2006100243070A 2006-03-02 2006-03-02 一种人脸特征点自动定位方法 Expired - Fee Related CN100375108C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100243070A CN100375108C (zh) 2006-03-02 2006-03-02 一种人脸特征点自动定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100243070A CN100375108C (zh) 2006-03-02 2006-03-02 一种人脸特征点自动定位方法

Publications (2)

Publication Number Publication Date
CN1811793A CN1811793A (zh) 2006-08-02
CN100375108C true CN100375108C (zh) 2008-03-12

Family

ID=36844705

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100243070A Expired - Fee Related CN100375108C (zh) 2006-03-02 2006-03-02 一种人脸特征点自动定位方法

Country Status (1)

Country Link
CN (1) CN100375108C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254180A (zh) * 2011-06-28 2011-11-23 北京交通大学 一种基于几何特征的人脸美感分析方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008064395A1 (en) * 2006-08-18 2008-06-05 National Ict Australia Limited Facial feature processing
CN100414562C (zh) * 2006-10-10 2008-08-27 南京搜拍信息技术有限公司 人脸识别系统中的人脸特征点定位方法
CN101325691B (zh) 2007-06-14 2010-08-18 清华大学 融合不同生存期的多个观测模型的跟踪方法和跟踪装置
CN101561875B (zh) * 2008-07-17 2012-05-30 清华大学 一种二维人脸图像定位的方法
JP5166230B2 (ja) * 2008-12-26 2013-03-21 富士フイルム株式会社 画像処理装置および方法並びにプログラム
JP5700219B2 (ja) * 2009-07-23 2015-04-15 日本電気株式会社 マーカ生成装置、マーカ生成検出システム、マーカ生成検出装置、マーカ、マーカ生成方法及びプログラム
EP2458558B1 (en) * 2009-07-23 2022-09-21 Nec Corporation Marker generation device, marker generation detection system, marker generation detection device, marker, marker generation method, and program therefor
CN102402691A (zh) * 2010-09-08 2012-04-04 中国科学院自动化研究所 一种对人脸姿态和动作进行跟踪的方法
CN102479322A (zh) * 2010-11-30 2012-05-30 财团法人资讯工业策进会 以具有角度的脸部影像分析脸部缺陷的系统、装置及方法
CN102013011B (zh) * 2010-12-16 2013-09-04 重庆大学 基于正脸补偿算子的多姿态人脸识别方法
CN103208007B (zh) * 2013-03-19 2017-02-08 湖北微驾技术有限公司 一种基于支持向量机和遗传算法的人脸识别方法
CN103577815B (zh) * 2013-11-29 2017-06-16 中国科学院计算技术研究所 一种人脸对齐方法和系统
US10586570B2 (en) 2014-02-05 2020-03-10 Snap Inc. Real time video processing for changing proportions of an object in the video
CN104732247B (zh) * 2015-03-09 2018-04-27 北京工业大学 一种人脸特征定位方法
US10116901B2 (en) 2015-03-18 2018-10-30 Avatar Merger Sub II, LLC Background modification in video conferencing
CN104881657B (zh) * 2015-06-08 2019-01-25 微梦创科网络科技(中国)有限公司 侧脸识别方法、侧脸构建方法及系统
CN105205482B (zh) * 2015-11-03 2018-10-26 北京英梅吉科技有限公司 快速人脸特征识别及姿态估算方法
CN105938551A (zh) * 2016-06-28 2016-09-14 深圳市唯特视科技有限公司 一种基于视频数据的人脸特定区域提取方法
CN107145741B (zh) * 2017-05-05 2020-06-05 必应(上海)医疗科技有限公司 基于图像分析的耳诊数据采集方法及装置
CN108108694B (zh) * 2017-12-21 2020-09-29 北京搜狐新媒体信息技术有限公司 一种人脸特征点定位方法及装置
CN108717730B (zh) * 2018-04-10 2023-01-10 福建天泉教育科技有限公司 一种3d人物重建的方法及终端
CN108898601B (zh) * 2018-05-31 2020-09-29 清华大学 基于随机森林的股骨头图像分割装置及分割方法
CN108985212B (zh) * 2018-07-06 2021-06-04 深圳市科脉技术股份有限公司 人脸识别方法及装置
CN109002799B (zh) * 2018-07-19 2021-08-24 苏州市职业大学 人脸识别方法
CN109839111A (zh) * 2019-01-10 2019-06-04 王昕� 一种基于视觉定位的室内多机器人编队系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934406B1 (en) * 1999-06-15 2005-08-23 Minolta Co., Ltd. Image processing apparatus, image processing method, and recording medium recorded with image processing program to process image taking into consideration difference in image pickup condition using AAM
CN1700240A (zh) * 2004-05-17 2005-11-23 香港中文大学 基于随机采样的面部识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934406B1 (en) * 1999-06-15 2005-08-23 Minolta Co., Ltd. Image processing apparatus, image processing method, and recording medium recorded with image processing program to process image taking into consideration difference in image pickup condition using AAM
CN1700240A (zh) * 2004-05-17 2005-11-23 香港中文大学 基于随机采样的面部识别方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
人脸识别理论的研究及其系统实现. 刘智明.四川大学硕士学位论文. 2001 *
人脸面部特征定位与人脸识别方法的研究. 王巍.北京工业大学工学硕士学位论文. 2003 *
基于主动形状模型的人脸面部特征定位方法研究. 陈玉林,金石.零陵学院学报(教育科学),第2卷第4期. 2004 *
基于形状和纹理的人脸自动识别. 赵海涛,於东军,金忠,杨静宇.计算机研究与发展,第40卷第4期. 2003 *
用于人脸识别的LDA方法的研究及其应用. 崔丽.吉林大学硕士学位论文. 2004 *
纹理约束下的人脸特征点跟踪. 宋刚,艾海舟,徐光祐.软件学报,第15卷第11期. 2004 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254180A (zh) * 2011-06-28 2011-11-23 北京交通大学 一种基于几何特征的人脸美感分析方法
CN102254180B (zh) * 2011-06-28 2014-07-09 北京交通大学 一种基于几何特征的人脸美感分析方法

Also Published As

Publication number Publication date
CN1811793A (zh) 2006-08-02

Similar Documents

Publication Publication Date Title
CN100375108C (zh) 一种人脸特征点自动定位方法
Hu et al. Incremental tensor subspace learning and its applications to foreground segmentation and tracking
Ramanathan et al. Face verification across age progression
JP4234381B2 (ja) 顔の特徴を位置確認するための方法及びコンピュータープログラム製品
CN103530599B (zh) 一种真实人脸和图片人脸的区别方法和系统
CN104573614B (zh) 用于跟踪人脸的设备和方法
Choi et al. Face recognition based on 2D images under illumination and pose variations
Lee et al. Tensor-based AAM with continuous variation estimation: Application to variation-robust face recognition
Sukno et al. Active shape models with invariant optimal features: Application to facial analysis
CN101908149A (zh) 一种从人脸图像序列中识别脸部表情的方法
CN106778474A (zh) 3d人体识别方法及设备
KR101558547B1 (ko) 얼굴 포즈 변화에 강한 연령 인식방법 및 시스템
CN110069989A (zh) 人脸图像处理方法及装置、计算机可读存储介质
CN112734911A (zh) 基于卷积神经网络的单幅图像三维人脸重建方法及系统
Huang et al. A component-based framework for generalized face alignment
CN109558814A (zh) 一种三维矫正和加权相似性度量学习的无约束人脸验证方法
Kalansuriya et al. Neural network based age and gender classification for facial images
Xu et al. Automatic segmentation of cervical vertebrae in X-ray images
JP6430102B2 (ja) 人物属性推定装置、人物属性推定方法及びプログラム
Chen et al. Image-based age-group classification design using facial features
Du et al. SVM based ASM for facial landmarks location
Ratsch et al. Wavelet reduced support vector regression for efficient and robust head pose estimation
Tonchev et al. Human age-group classification of facial images with subspace projection and support vector machines
Alsarayreh et al. Enhanced constrained local models (CLM) for facial feature detection
Sun et al. An adaptive-profile active shape model for facial-feature detection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080312

Termination date: 20110302