CN102043943A - 人脸姿态参数获取方法及装置 - Google Patents

人脸姿态参数获取方法及装置 Download PDF

Info

Publication number
CN102043943A
CN102043943A CN2009102054537A CN200910205453A CN102043943A CN 102043943 A CN102043943 A CN 102043943A CN 2009102054537 A CN2009102054537 A CN 2009102054537A CN 200910205453 A CN200910205453 A CN 200910205453A CN 102043943 A CN102043943 A CN 102043943A
Authority
CN
China
Prior art keywords
face
point
dimensional
angle
boundary rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102054537A
Other languages
English (en)
Other versions
CN102043943B (zh
Inventor
马湘旺
黄华
杨锦春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd, Xian Jiaotong University filed Critical Huawei Technologies Co Ltd
Priority to CN2009102054537A priority Critical patent/CN102043943B/zh
Publication of CN102043943A publication Critical patent/CN102043943A/zh
Application granted granted Critical
Publication of CN102043943B publication Critical patent/CN102043943B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明实施例涉及一种人脸姿态参数获取方法及装置,方法包括:检测二维图像内的人脸所在的矩形区域;将矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到人脸的第二基准角度;根据与第二基准角度相对应的纹理系数和形状系数提取矩形区域内的人脸的二维特征点;通过二维特征点和三维平均脸样本的二维投影点获取矩形区域内的第一人脸姿态参数。本发明实施例提供的人脸姿态参数获取方法及装置,通过获取到的较粗略的第二基准角度、以及与第二基准角度相对应的纹理系数和形状系数提取出精度较高的二维特征点;由精度较高的二维特征点与二维投影点获取第一人脸姿态参数,提高了获取到的人脸姿态参数的精度。

Description

人脸姿态参数获取方法及装置
技术领域
本发明实施例涉及图像识别技术领域,尤其是一种人脸姿态参数获取方法及装置。
背景技术
人脸姿态估计就是对二维图像中的人脸在三维空间中所处的姿态进行估计。人脸姿态估计包括三个方向上的人脸姿态旋转信息,其中,绕二维图像的纸面法向轴的旋转与人脸平面平行,称为平面内旋转;而绕二维图像的另两个方向轴的旋转称作平面外旋转。平面内旋转的角度可以由位于人脸上方的关于眼睛的特征点的坐标计算得到,而平面外旋转包含了人脸的摇摆和俯仰两个方向上的旋转。现有技术中,基于人脸跟踪的人脸姿态估计方法能够比较稳定地反映人脸的姿态变化,但基于人脸跟踪的框架限定了用户的姿态变化不能太快,同时需要人脸上的特征点可见,从而限制了姿态估计的范围。
现有的人脸姿态估计方法分为两类:一、人脸姿态参数的粗略估计,包括:利用人脸的纹理估计人脸姿态参数;利用人脸的形状估计人脸姿态参数;将人脸的纹理和形状相结合估计人脸姿态参数;二、人脸姿态参数的高精度估计,通过主动表观模型(Active Appearance Model,简称:AAM)计算相应的人脸姿态参数,但该方法适用于人脸处于正面以及偏正面姿态时的情形,并且为使人脸上的特征点可见,人脸姿态的偏转角度受到限制。
下面是现有技术中获取人脸姿态参数的计算过程:
建立3维(3D)人脸参考模型,通过对3D人脸数据库中的人脸样本进行标定获取3D特征点。
假设3D人脸参考模型X中的人脸样本有n(n为整数)个3D特征点,3D特征点可表示为
Figure B2009102054537D0000021
对二维输入图像通过AAM配准提取出二维特征点x,二维特征点具体表示为:
Figure B2009102054537D0000022
二维输入图像中的n个二维特征点与3D人脸参考模型中的n个3D特征点相对应。
若最优化目标函数为f(c)=||P(R(c)X+t(c))-x||2,P为3D人脸参考模型中人脸样本的3D特征点到二维投影图像的投影变换,R(c)为3D特征点旋转投影到二维图像的旋转矩阵,可表示成z、x、y三个坐标方向的旋转矩阵的乘积R(c)=Rz(rz)Rx(rx)Ry(ry),Rz、Rx、Ry分别表示绕z、x、y三个坐标方向的旋转矩阵,rz表示绕z轴的旋转角度,rx表示绕x轴的旋转角度,ry表示绕y轴的旋转角度;t(c)为平移向量,具体可以表示为t(c)=(tx ty tz)T
上述f(c)=||P(R(c)X+t(c))-x||2的物理意义具体为:将3D人脸参考模型的3D特征点经旋转投影后得到3D特征点所对应的二维的投影特征点,将投影特征点经过平移后逼近二维输入图像中的人脸的二维特征点,进一步得到二维图像中的人脸姿态参数。较佳地,若f(c)取最小值时,表示3D特征点的投影特征点与二维输入图像中的二维特征点的偏差的绝对值最小,此时人脸样本的人脸姿态参数c=(rx ry rz tx ty tz)可作为二维输入图像中的人脸姿态参数。
由于f(c)=||P(R(c)X+t(c))-x||2为非线性最小二乘的目标函数,在求解f(c)时,需设置f(c)中所有未知变量的初始值,现有技术仅针对正面人脸图像将初始值设置为0,再调用列文伯格-马奎特(Levenberg-Marquardt,简称:LM)方法得到f(c)的最小值。
发明人在实施本发明的过程中发现:由于f(c)=||P(R(c)X+t(c))-x||2为非线性最小二乘的目标函数,在使f(c)取得最小值时,需要采用线性近似的方法,而线性近似的方法计算得到的使f(c)取得极小值时的c值与f(c)中c的初始值的选取密切相关,但现有技术并没有较好的方法选取较优的初始值使最优化的目标函数取得最小值,从而降低了二维输入图像中的人脸姿态参数的精度。
发明内容
本发明实施例的目的在于提供一种人脸姿态参数获取方法及装置,提高获取到的人脸姿态参数的精度。
本发明实施例提供了一种人脸姿态参数获取方法,包括:
检测二维图像内的人脸所在的矩形区域;
将所述矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到所述人脸的第二基准角度;
根据与所述第二基准角度相对应的纹理系数和形状系数提取所述矩形区域内的人脸的二维特征点;
通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数。
上述人脸姿态参数获取方法,通过与姿态识别基相对应的第一基准角度计算得到第二基准角度,获取到矩形区域内的人脸的较粗略的第二基准角度;根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;由精度较高的二维特征点与三维平均脸样本的二维投影点获取第一人脸姿态参数,提高了获取到的人脸姿态参数的精度。
本发明实施例还提供了一种人脸姿态参数获取装置,包括:
检测模块,用于检测二维图像内的人脸所在的矩形区域;
分类模块,用于将所述矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到所述人脸的第二基准角度;
提取模块,用于根据与所述第二基准角度相对应的纹理系数和形状系数提取所述矩形区域内的人脸的二维特征点;
第一获取模块,用于通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数。
上述人脸姿态参数获取装置,分类模块通过姿态识别基相对应的第一基准角度计算得到第二基准角度,获取到矩形区域内的人脸的较粗略的第二基准角度;提取模块根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;第一获取模块由精度较高的二维特征点与三维平均脸样本的二维投影点获取第一人脸姿态参数,提高了获取到的人脸姿态参数的精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明人脸姿态参数获取方法一个实施例的流程示意图;
图2为本发明人脸姿态参数获取又一个实施例的流程示意图;
图3为图2所示实施例三维平均脸的头部坐标系示意图;
图4为图2所示实施例步骤205中标定的人脸特征点示意图;
图5为图2所示实施例步骤206中三维平均人脸的二维投影点的示意图;
图6为图2所示实施例步骤207中第一外接矩形的示意图;
图7为图2所示实施例步骤209中调整朝向和尺度后的第一外接矩形和第二外接矩形的示意图;
图8为本发明人脸姿态参数获取装置一个实施例的结构示意图;
图9为本发明人脸姿态参数获取装置又一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
线性判别分析(Linear Discriminant Analysis,简称:LDA)方法是对不同类的高维样本(设为d维,d>>1,d为整数)进行监督的线性降维方法,通过寻找一个低维的线性子空间,使不同类的样本在该线性子空间上投影的类内样本分布更紧密、类间样本散布得更分散,以便于对高维样本进行识别和分类。
本发明实施例所述的三维平均脸样本是通过标定已有的3D人脸数据库中的人脸样本的人脸特征点,获取人脸特征点坐标,通过将人脸特征点坐标进行旋转、平移、缩放归一化到统一的坐标系下后对3D坐标求均值建立的特征点模型。
图1为本发明人脸姿态参数获取方法一个实施例的流程示意图,如图1所示,本实施例包括如下步骤:
步骤101、检测二维图像内的人脸所在的矩形区域。
步骤102、将矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到人脸的第二基准角度。
步骤103、根据与第二基准角度相对应的纹理系数和形状系数提取矩形区域内的人脸的二维特征点。
步骤104、通过二维特征点和三维平均脸样本的二维投影点获取矩形区域内的第一人脸姿态参数。
本发明实施例提供的人脸姿态参数获取方法,通过姿态识别基相对应的第一基准角度计算得到第二基准角度,获取到矩形区域内的人脸的初始粗略估计的第二基准角度;根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;由精度较高的二维特征点与三维平均脸样本的二维投影点获取第一人脸姿态参数,提高了获取到的人脸姿态参数的精度。
图2为本发明人脸姿态参数获取方法又一个实施例的流程示意图,图3为图2所示实施例三维平均脸的头部坐标系示意图,图4为图2所示实施例步骤205中标定的人脸特征点示意图,图5为图2所示实施例步骤206中三维平均人脸的二维投影点的示意图,图6为图2所示实施例步骤207中第一外接矩形的示意图,图7为图2所示实施例步骤209中调整朝向和尺度后的第一外接矩形和第二外接矩形的示意图。
在图2~图7所示的实施例中,需要建立目标函数
Figure B2009102054537D0000061
其中,U为弱透视相机模型,s为缩放因子,Xi为三维平均脸样本以正视姿态呈现时在三维空间中第i个特征点的坐标向量,di为提取到的矩形区域内的人脸第i个二维特征点的坐标向量,t是平移向量,R是三维旋转矩阵,并且有
R ( α , β , γ ) = R z ( γ ) R x ( α ) R y ( β ) = cos γ - sin γ 0 sin γ cos γ 0 0 0 1 1 0 0 0 cos α - sin α 0 sin α cos α cos β 0 sin β 0 1 0 - sin β 0 cos β .
为了使三维平均脸的投影特征点尽可能逼近矩形区域内的人脸的二维特征点,需要使三维平均脸的N个投影特征点通过旋转、投影、缩放、平移之后与矩形区域内的人脸的二维特征点的距离尽可能小,使各个二维特征点满足sURXi+t→di,此时,获取到的平移向量t、缩放因子s、以及第一偏转角度α、第二偏转角度β、第三偏转角度γ形成图2所示实施例中的第一人脸姿态参数。如图3所示,在三维平均脸的头部坐标系中,第一偏转角度α、第二偏转角度β、第三偏转角度γ分别表示绕X、Y、Z轴的旋转角度。
如图2所示,本实施例包括如下步骤:
步骤201、检测二维图像内的人脸所在的矩形区域。
步骤202、将矩形区域缩放成与姿态识别基相同的维数后展开成列向量。
步骤203、将列向量在姿态识别基上投影,得到列向量的投影值。
步骤204、将投影值与第一基准角度的投影值进行最邻近判决,得到人脸的第二基准角度。
步骤205、根据与第二基准角度相对应的纹理系数和形状系数提取矩形区域内的人脸的二维特征点。
步骤206、平移二维特征点的集合形成的第一点集,使第一点集的质心与三维平均脸样本的二维投影点的集合形成的第二点集的质心重合,并获取第一点集的平移向量。
步骤207、旋转第一点集的第一外接矩形,使第一外接矩形与第二点集的第二外接矩形的偏转角度一致,并获取第三偏转角度。
步骤208、获取第一外接矩形与第二外接矩形的缩放因子。
步骤209、调整第一外接矩形与第二外接矩形,使第一外接矩形的第三偏转角度和尺度与第二外接矩形的第三偏转角度和尺度一致。
步骤210、获取使得第一点集内的二维特征点与可调整的相对应的第二点集内的二维特征点的距离的平方和最小时所对应的第一偏转角度和第二偏转角度;将第一偏转角度、第二偏转角度、第三偏转角度、缩放因子、平移向量作为矩形区域内的第一人脸姿态参数。
步骤211、将第一人脸姿态参数作为初始值根据LM方法获取第二人脸姿态参数,其中,第二人脸姿态参数的精度高于第一人脸姿态参数的精度。
上述步骤201中,若输入图像中存在人脸,则执行步骤202,若输入图像中不存在人脸,则停止后续步骤的执行。具体地,可以采用Paul Viola和Michael Jones于2001年提出的基于AdaBoost的人脸检测方法实现检测输入图像中的人脸所在的矩形区域。AdaBoost人脸检测方法通过组合大量的简单分类器实现人脸的检测,由于每个简单分类器均具有较快的计算速度,因此可进一步提高人脸姿态识别的速度。
上述步骤202中,姿态识别基可以通过以下方法获取:将N(N为整数)幅二维人脸图像按行序或者列序排列成列向量xi∈Rd,i=1,2,...N。此时,一幅二维人脸图像对应高维空间中的一个样本。假设N幅二维人脸图像所对应的样本存在c(c为整数)类具有相同的人脸姿态,每类有Ni个样本,则有总均值
Figure B2009102054537D0000081
各类均值
Figure B2009102054537D0000082
(i=1,2,...,c),类内散布矩阵
Figure B2009102054537D0000083
类间散布矩阵
Figure B2009102054537D0000084
进一步地,构成LDA子空间的姿态识别基可由广义特征分解Sbwi=λiSwwi,(i=1,2,...,m)得到。通过计算
Figure B2009102054537D0000086
的特征值,选择非0的m个特征值(m<c-1,取特征值最大的前m个特征值,m为整数)对应的特征向量组成一个LDA的姿态识别基WLDA,在对样本进行训练和识别时,每一个输入的d维特征点矢量xi可以转换为m维的新的特征向量yi=WLDAxi。也可以采用基于主成分分析(Principal Components Analysis,简称:PCA)、独立成分分析(Independent Components Analysis,简称:ICA)等方法获取姿态识别基。
根据上述姿态识别基的获取方法将二维人脸图像在摇摆、俯仰、平面内旋转三个方向上每隔设定的角度组合训练一个LDA姿态识别基,将矩形区域缩放成与LDA姿态识别基相同的维数后展开成列向量。本实施例中,设定的角度可以较佳地为10度,即在摇摆、俯仰、平面内旋转三个方向上每隔10度组合训练一个LDA姿态识别基。
上述步骤203中,将列向量投影到LDA子空间中相对应的姿态识别基WLDA上得到列向量的投影值。
上述步骤204中,第一基准角度为人脸样本在摇摆、俯仰、平面内旋转三个方向已训练的各角度的范围。通过将投影值与第一基准角度相对应的投影值做最邻近判决,得到人脸的第二基准角度,该第二基准角度为矩形区域内的人脸姿态参数的初始粗略估计。
由于上述步骤202中的LDA姿态识别基是二维人脸图像在摇摆、俯仰、平面内旋转三个方向上的不同角度组合训练得到的,因此当矩形区域内的人脸在摇摆、俯仰、平面内旋转角度小于45度时,步骤204可仍以获取到精度较高的第二基准角度,从而可以根据精度较高的第二基准角度获取到精度较高的第一人脸姿态参数。
上述步骤205中,纹理系数和形状系数可以通过如下方法获取:假设
Figure B2009102054537D0000091
表示具有N幅二维人脸图像的训练集,其中,
Figure B2009102054537D0000092
表示第t个二维人脸图像中的人脸上的v个特征点坐标矢量,St∈R2v。如图4所示,标定的二维人脸图像中的人脸上的特征点为能够反映人脸的面部特征的点,如眼角、嘴角、鼻尖、鼻翼角点、以及脸部轮廓等。通过主分量分析(Principal Component Analysis,简称:PCA)方法对二维人脸图像的形状建模可以得到
Figure B2009102054537D0000093
其中S0表示平均形状矢量,ξ=[S1,S2,K,Sm]为形状的PCA基。设形状矢量St所围成的区域为Ut,At为区域内的所有特征点变形到平均形状所围成的区域U0上所得到的纹理图像,可以采用图像形变(image warping)的方法实现。对于纹理At
Figure B2009102054537D0000094
其中,A0是平均形状下的平均纹理图像,Ai是纹理的PCA的基,
Figure B2009102054537D0000095
Figure B2009102054537D0000096
分别为第t个人脸图像的形状系数和纹理系数,表示为矢量
Figure B2009102054537D0000097
通过上述方法获取到本实施例中的形状系数p和纹理系数q,对于矩形区域内的人脸,使与形状系数p和纹理系数q有关的目标函数最小化,则有
Figure B2009102054537D0000098
其中,A0(x)和可以重建出形状S,假设形状S围成的区域为U,W(x|p)表示区域U0上的所有特征点形变(warping)到区域U后的坐标。通过投射(Project-Out)方法先在纹理基的正交补空间上迭代形状系数p,由于补空间的基和纹理基正交,此时,等式
Figure B2009102054537D0000102
中的为零,因此代价函数可以简化为
Figure B2009102054537D0000104
其中,
Figure B2009102054537D0000105
为纹理基的补空间。在满足矩形区域内的人脸与理想的输入图像中矩形区域的人脸之间的误差最小的情况下得到精度较高的二维特征点。
上述步骤206中,三维平均脸样本的二维投影点的集合形成第二点集P′={d′i|i=1,...,N},其中,d′i为三维平均脸样本投影后的第i个特征点的坐标向量,如图5所示,“○”表示第二点集内的二维投影点,“虚线矩形”表示第二点集的第二外接矩形r′,该第二外接矩形r′能够将第二点集内的二维投影点全部包括在矩形区域内,第二点集是三维平均脸的二维投影点在正视视图时的二维投影点,由于已经对三维平均脸的坐标向量模进行了归一化操作,因此图5所示的坐标系只反映二维投影点的相对尺度,并不反映二维投影点真实的坐标值,并且相对尺度与真实尺度存在一个缩放比例关系。
矩形区域内的人脸的二维特征点的集合形成第一点集P={di|i=1,...,N},其中,di为偏转投影后的第i个二维特征点的坐标向量,平移第一点集P={di|i=1,...,N},使第一点集P={di|i=1,...,N}的质心与第二点集P={d′i|i=1,...,N}的质心重合,计算得到第一点集P={di|i=1,...,N}的平移向量t。
上述步骤207中,第一外接矩形r如图6所示,该第一外接矩形r能够将第一点集内的二维特征点全部包括在矩形区域内,“+”表示第一点集中的二维特征点,“点线矩形”表示第一点集的第一外接矩形r,由于图6所示的坐标系只反映二维特征点的相对尺度,因此不反映二维特征点真实尺度的坐标值,并且相对尺度与真实尺度存在一个缩放比例关系。旋转第一点集P={di|i=1,...,N}的第一外接矩形r,使第一外接矩形r与第二点集P′={d′i|i=1,...,N}的第二外接矩形r′的偏转角度一致,从而得到第一外接矩形r的第三偏转角度γ。
上述步骤208中,计算得到第一外接矩形r的长边与第二外接矩形r′的长边的比值,将该比值作为缩放因子s。
上述步骤209中,调整第一外接矩形r,使第一外接矩形r的第三偏转角度和尺度与第二外接矩形r′的第三偏转角度和尺度一致,调整后的第一外接矩形r和第二外接矩形r′如图7所示,“○”表示第二点集内的二维投影点,“+”表示第一点集中的二维特征点,“虚线矩形”表示的第二点集的第二外接矩形r′与“点线矩形”表示的第一点集的第一外接矩形r偏转角度一致。本实施例能够使三维平均脸的二维投影点充分地逼近矩形区域内的二维特征点。在具体实施时,需要计算出使第二外接矩形r′的长边与第一外接矩形r的长边方向一致所需的旋转角度,由于存在两个符合的旋转方向,并且该两个旋转方向相差180°,可以采用以眼睛在矩形中的位置为参考获取到正确的旋转角度。较佳地,当第一外接矩形r和第二外接矩形r′中的任一个为正方形时,位于人脸的眉毛区域的第一点集P内的二维特征点和第二点集P′内的二维投影点可以不参与计算,由此可以避免矩形退化为正方形时长边方向计算的不确定性并减少计算量。
上述步骤210中,计算第二点集P′={d′i|i=1,...,N}和第一点集P={di|i=1,...,N}之间的距离值
Figure B2009102054537D0000111
获取距离值D中最小距离值Dmin,则得到与Dmin对应的第一偏转角度α和第二偏转角度β。
上述步骤211中,将第一人脸姿态参数中的平移向量t、缩放因子s、以及第一偏转角度α、第二偏转角度β、第三偏转角度γ作为初始值根据LM方法获取第二人脸姿态参数。由于第一人脸姿态参数经过LM方法的迭代运算,因此第二人脸姿态参数的精度高于第一人脸姿态参数的精度。
本发明实施例提供的人脸姿态参数获取方法,通过姿态识别基相对应的第一基准角度计算得到粗略的第二基准角度,获取到矩形区域内的人脸的初始粗略估计的第二基准角度;根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;由精度较高的二维特征点与三维平均脸样本的二维投影点获取到第一人脸姿态参数;为进一步获取精度更高的人脸姿态参数,将第一人脸姿态参数作为初始值,根据LM方法进行迭代进一步获取到比第一人脸姿态参数精度更高的第二人脸姿态参数,提高了获取到的人脸姿态识别参数的精度。
图8为本发明人脸姿态参数获取装置一个实施例的结构示意图,如图8所示,本发明实施例包括:检测模块81、分类模块82、提取模块83、第一获取模块84。
其中,检测模块81检测二维图像内的人脸所在的矩形区域;分类模块82将检测模块81检测到的矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到人脸的第二基准角度;提取模块83根据与分类模块82得到的第二基准角度相对应的纹理系数和形状系数提取矩形区域内的人脸的二维特征点;第一获取模块84通过提取模块83提取到的二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数。
本发明实施例提供的人脸姿态参数获取装置,分类模块82通过姿态识别基相对应的第一基准角度计算得到第二基准角度,获取到矩形区域内的人脸的较粗略第二基准角度;提取模块83根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;第一获取模块84由精度较高的二维特征点与三位平均脸样本的二维投影点获取第一人脸姿态参数,提高了获取到的人脸姿态参数的精度。
图9为本发明人脸姿态参数获取装置又一个实施例的结构示意图,如图9所示,本发明实施例包括:检测模块91、分类模块92、提取模块93、第一获取模块94、第二获取模块95。
其中,检测模块91检测二维图像内的人脸所在的矩形区域;分类模块92将检测模块91检测到的矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到人脸的第二基准角度;提取模块93根据与分类模块92得到的第二基准角度相对应的纹理系数和形状系数提取矩形区域内的人脸的二维特征点;第一获取模块94通过提取模块93提取到的二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数;第二获取模块95将第一获取模块94获取到的第一人脸姿态参数作为初始值根据LM方法获取第二人脸姿态参数,其中,第二人脸姿态参数的精度高于第一人脸姿态参数的精度。
进一步地,分类模块92还可以包括:展开单元921、投影单元922、判决单元923。其中,展开单元921将矩形区域缩放成与姿态识别基相同的维数后展开成列向量;投影单元922将列向量在姿态识别基上投影,得到列向量的投影值;判决单元923将投影值与第一基准角度的投影值进行最邻近判决,得到人脸的第二基准角度。
进一步地,第一获取模块94还可以包括:平移单元941、旋转单元942、第一获取单元943、调整单元944、第二获取单元945。其中,平移单元941平移二维特征点的集合形成的第一点集,使第一点集的质心与三维平均脸样本的二维投影点的集合形成的第二点集的质心重合,并获取第一点集的平移向量;旋转单元942旋转第一点集的第一外接矩形,使第一外接矩形与第二点集的第二矩形的偏转角度一致,并获取第三偏转角度;第一获取单元943获取第一外接矩形与第二外接矩形的缩放因子;调整单元944调整第一外接矩形,使第一外接矩形的第三偏转角度和尺度与第二外接矩形的第三偏转角度和尺度一致;第二获取单元945获取使得第一点集内的二维特征点与可调整偏转角度的相对应的第二点集内的二维特征点的距离的平方和最小时所对应的第一偏转角度和第二偏转角度。
进一步地,旋转单元942还可以包括:第一获取子单元、计算子单元、第二获取子单元。其中,第一获取子单元获取第一外接矩形中长边的第一倾斜角度,以及获取第二外接矩形中长边的第二倾斜角度;计算子单元计算第一倾斜角度与第二倾斜角度的差值;第二获取子单元根据差值获取第三偏转角度。
本发明实施例提供的人脸姿态参数获取装置,分类模块92通过姿态识别基相对应的第一基准角度计算得到粗略的第二基准角度,获取到矩形区域内的人脸的初始粗略估计的第二基准角度;提取模块93根据与第二基准角度相对应的纹理系数和形状系数提取出精度较高的矩形区域内的人脸的二维特征点;第一获取模块94由精度较高的二维特征点与三维平均脸样本的二维投影点获取到第一人脸姿态参数;为进一步获取精度较高的人脸姿态参数,第二获取模块95将第一人脸姿态参数作为初始值,根据LM方法进行迭代进一步获取到比第一人脸姿态参数精度较高的第二人脸姿态参数,提高了获取到的人脸姿态识别参数的精度。
本发明人脸姿态参数获取装置实施例中所提供各个单元之间的交互及相关信息均可以参考前述各个方法实施例所提供的流程,具体功能和处理流程请参见前述各实施例,此处不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。本发明方法实施例和装置实施例可以适用于视频图像处理中,尤其视频图像中的人脸仅有单一方向大范围偏转。本发明实施例还可以对其它固定形态的物体进行姿态参数估计。此外,本发明装置实施例还可以安装在驾驶室的合适位置用于监督驾驶员,通过检测驾驶员的姿态可以判断出驾驶员是否集中精神驾驶,是否在左顾右盼,是否已经疲劳驾驶,是否张望幅度太大。本发明实施例还可以利用人脸姿态进行电子地图的导航,或者可以利用人脸姿态参数控制轮椅的前进方向。利用精确的姿态参数估计可以近似得到输入人脸的三维特征点,从而能够部分用于人脸的三维建模及人脸卡通化夸张、人脸动画等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种人脸姿态参数获取方法,其特征在于,包括:
检测二维图像内的人脸所在的矩形区域;
将所述矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到所述人脸的第二基准角度;
根据与所述第二基准角度相对应的纹理系数和形状系数提取所述矩形区域内的人脸的二维特征点;
通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数。
2.根据权利要求1所述的方法,其特征在于,所述将所述矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到所述人脸的第二基准角度包括:
将所述矩形区域缩放成与姿态识别基相同的维数后展开成列向量;
将所述列向量在所述姿态识别基上投影,得到所述列向量的投影值;
将所述投影值与所述第一基准角度的投影值进行最邻近判决,得到所述人脸的第二基准角度。
3.根据权利要求1所述的方法,其特征在于,所述通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数包括:
平移所述二维特征点的集合形成的第一点集,使所述第一点集的质心与三维平均脸样本的二维投影点的集合形成的第二点集的质心重合,并获取所述第一点集的平移向量;
旋转所述第一点集的第一外接矩形,使所述第一外接矩形与所述第二点集的第二外接矩形的偏转角度一致,并获取第三偏转角度;
获取所述第一外接矩形与所述第二外接矩形的缩放因子;
调整所述第一外接矩形,使所述第一外接矩形的第三偏转角度和尺度与所述第二外接矩形的第三偏转角度和尺度一致;
获取使得所述第一点集内的二维特征点与可调整的相对应的第二点集内的二维特征点的距离的平方和最小时所对应的第一偏转角度和第二偏转角度;
将所述第一偏转角度、第二偏转角度、第三偏转角度、缩放因子、平移向量作为所述矩形区域内的第一人脸姿态参数。
4.根据权利要求3所述的方法,其特征在于,所述旋转所述第一点集的第一外接矩形,使所述第一外接矩形与所述第二点集的第二外接矩形的偏转角度一致,并获取第三偏转角度包括:
获取所述第一外接矩形中长边的第一倾斜角度,以及获取所述第二外接矩形中长边的第二倾斜角度;
计算所述第一倾斜角度与所述第二倾斜角度的差值;
根据所述差值获取第三偏转角度。
5.根据权利要求1~4任一所述的方法,其特征在于,所述通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数之后还包括:
将所述第一人脸姿态参数作为初始值根据列文伯格-马奎特方法获取第二人脸姿态参数。
6.一种人脸姿态参数获取装置,其特征在于,包括:
检测模块,用于检测二维图像内的人脸所在的矩形区域;
分类模块,用于将所述矩形区域内的人脸根据与姿态识别基相对应的第一基准角度进行分类,得到所述人脸的第二基准角度;
提取模块,用于根据与所述第二基准角度相对应的纹理系数和形状系数提取所述矩形区域内的人脸的二维特征点;
第一获取模块,用于通过所述二维特征点和三维平均脸样本的二维投影点获取所述矩形区域内的第一人脸姿态参数。
7.根据权利要求6所述的装置,其特征在于,所述分类模块包括:
展开单元,用于将所述矩形区域缩放成与姿态识别基相同的维数后展开成列向量;
投影单元,用于将所述列向量在所述姿态识别基上投影,得到所述列向量的投影值;
判决单元,用于将所述投影值与所述第一基准角度的投影值进行最邻近判决,得到所述人脸的第二基准角度。
8.根据权利要求7所述的装置,其特征在于,所述第一获取模块包括:
平移单元,用于平移所述二维特征点的集合形成的第一点集,使所述第一点集的质心与所述三维平均脸样本的二维投影点的集合形成的第二点集的质心重合,并获取所述第一点集的平移向量;
旋转单元,用于旋转所述第一点集的第一外接矩形,使所述第一外接矩形与所述第二点集的第二外接矩形的偏转角度一致,并获取第三偏转角度;
第一获取单元,用于获取所述第一外接矩形与所述第二外接矩形的缩放因子;
调整单元,用于调整所述第一外接矩形,使所述第一外接矩形的第三偏转角度和尺度与所述第二外接矩形的第三偏转角度和尺度一致;
第二获取单元,用于获取使得所述第一点集内的二维特征点与可调整的相对应的第二点集内的二维特征点的距离的平方和最小时所对应的第一偏转角度和第二偏转角度。
9.根据权利要求8所述的装置,其特征在于,所述旋转单元包括:
第一获取子单元,用于获取所述第一外接矩形中长边的第一倾斜角度,以及获取所述第二外接矩形中长边的第二倾斜角度;
计算子单元,用于计算所述第一倾斜角度与所述第二倾斜角度的差值;
第二获取子单元,用于根据所述差值获取第三偏转角度。
10.根据权利要求6~9任一所述的装置,其特征在于,还包括:
第二获取模块,用于将所述第一人脸姿态参数作为初始值根据列文伯格-马奎特方法获取第二人脸姿态参数,所述第二人脸姿态参数的精度高于所述第一人脸姿态参数的精度。
CN2009102054537A 2009-10-23 2009-10-23 人脸姿态参数获取方法及装置 Active CN102043943B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102054537A CN102043943B (zh) 2009-10-23 2009-10-23 人脸姿态参数获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102054537A CN102043943B (zh) 2009-10-23 2009-10-23 人脸姿态参数获取方法及装置

Publications (2)

Publication Number Publication Date
CN102043943A true CN102043943A (zh) 2011-05-04
CN102043943B CN102043943B (zh) 2012-11-07

Family

ID=43910073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102054537A Active CN102043943B (zh) 2009-10-23 2009-10-23 人脸姿态参数获取方法及装置

Country Status (1)

Country Link
CN (1) CN102043943B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103716309A (zh) * 2013-12-17 2014-04-09 华为技术有限公司 一种安全认证方法及终端
CN105404861A (zh) * 2015-11-13 2016-03-16 中国科学院重庆绿色智能技术研究院 人脸关键特征点检测模型的训练、检测方法及系统
US20160210500A1 (en) * 2015-01-15 2016-07-21 Samsung Electronics Co., Ltd. Method and apparatus for adjusting face pose
CN105989331A (zh) * 2015-02-11 2016-10-05 佳能株式会社 脸部特征提取装置、脸部特征提取方法、图像处理设备和图像处理方法
CN106327801A (zh) * 2015-07-07 2017-01-11 北京易车互联信息技术有限公司 疲劳驾驶检测方法和装置
CN106355147A (zh) * 2016-08-26 2017-01-25 张艳 一种活体人脸检测头部姿态回归器的获取方法及检测方法
CN106485750A (zh) * 2016-09-13 2017-03-08 电子科技大学 一种基于监督局部子空间的人体姿态估计方法
CN107865473A (zh) * 2016-09-26 2018-04-03 华硕电脑股份有限公司 人体特征测距装置及其测距方法
CN108648203A (zh) * 2018-04-24 2018-10-12 上海工程技术大学 一种基于单目摄像头的人体三维姿态估计的方法
WO2019137131A1 (zh) * 2018-01-10 2019-07-18 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN110111535A (zh) * 2019-06-11 2019-08-09 陈乐堂 利用第五代移动通信技术的实时交通监控方法
CN110942007A (zh) * 2019-11-21 2020-03-31 北京达佳互联信息技术有限公司 手部骨骼参数确定方法、装置、电子设备和存储介质
CN111488856A (zh) * 2020-04-28 2020-08-04 江西吉为科技有限公司 一种基于正交引导学习的多模态2d及3d人脸表情识别
CN112825145A (zh) * 2019-11-20 2021-05-21 上海商汤智能科技有限公司 人体朝向检测方法、装置、电子设备和计算机存储介质
CN116503524A (zh) * 2023-04-11 2023-07-28 广州赛灵力科技有限公司 一种虚拟形象的生成方法、系统、装置及存储介质
CN116524572A (zh) * 2023-05-16 2023-08-01 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103716309A (zh) * 2013-12-17 2014-04-09 华为技术有限公司 一种安全认证方法及终端
CN103716309B (zh) * 2013-12-17 2017-09-29 华为技术有限公司 一种安全认证方法及终端
US20160210500A1 (en) * 2015-01-15 2016-07-21 Samsung Electronics Co., Ltd. Method and apparatus for adjusting face pose
US10134177B2 (en) * 2015-01-15 2018-11-20 Samsung Electronics Co., Ltd. Method and apparatus for adjusting face pose
CN105989331A (zh) * 2015-02-11 2016-10-05 佳能株式会社 脸部特征提取装置、脸部特征提取方法、图像处理设备和图像处理方法
CN105989331B (zh) * 2015-02-11 2019-10-08 佳能株式会社 脸部特征提取装置、脸部特征提取方法、图像处理设备和图像处理方法
CN106327801A (zh) * 2015-07-07 2017-01-11 北京易车互联信息技术有限公司 疲劳驾驶检测方法和装置
CN105404861A (zh) * 2015-11-13 2016-03-16 中国科学院重庆绿色智能技术研究院 人脸关键特征点检测模型的训练、检测方法及系统
CN105404861B (zh) * 2015-11-13 2018-11-02 中国科学院重庆绿色智能技术研究院 人脸关键特征点检测模型的训练、检测方法及系统
CN106355147A (zh) * 2016-08-26 2017-01-25 张艳 一种活体人脸检测头部姿态回归器的获取方法及检测方法
CN106485750A (zh) * 2016-09-13 2017-03-08 电子科技大学 一种基于监督局部子空间的人体姿态估计方法
CN107865473A (zh) * 2016-09-26 2018-04-03 华硕电脑股份有限公司 人体特征测距装置及其测距方法
WO2019137131A1 (zh) * 2018-01-10 2019-07-18 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
US11386699B2 (en) 2018-01-10 2022-07-12 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Image processing method, apparatus, storage medium, and electronic device
CN108648203A (zh) * 2018-04-24 2018-10-12 上海工程技术大学 一种基于单目摄像头的人体三维姿态估计的方法
CN110111535A (zh) * 2019-06-11 2019-08-09 陈乐堂 利用第五代移动通信技术的实时交通监控方法
CN112825145A (zh) * 2019-11-20 2021-05-21 上海商汤智能科技有限公司 人体朝向检测方法、装置、电子设备和计算机存储介质
JP2022510963A (ja) * 2019-11-20 2022-01-28 上▲海▼商▲湯▼智能科技有限公司 人体向き検出方法、装置、電子機器及びコンピュータ記憶媒体
CN110942007B (zh) * 2019-11-21 2024-03-05 北京达佳互联信息技术有限公司 手部骨骼参数确定方法、装置、电子设备和存储介质
CN110942007A (zh) * 2019-11-21 2020-03-31 北京达佳互联信息技术有限公司 手部骨骼参数确定方法、装置、电子设备和存储介质
CN111488856A (zh) * 2020-04-28 2020-08-04 江西吉为科技有限公司 一种基于正交引导学习的多模态2d及3d人脸表情识别
CN111488856B (zh) * 2020-04-28 2023-04-18 江西吉为科技有限公司 一种基于正交引导学习的多模态2d及3d人脸表情识别方法
CN116503524A (zh) * 2023-04-11 2023-07-28 广州赛灵力科技有限公司 一种虚拟形象的生成方法、系统、装置及存储介质
CN116503524B (zh) * 2023-04-11 2024-04-12 广州赛灵力科技有限公司 一种虚拟形象的生成方法、系统、装置及存储介质
CN116524572A (zh) * 2023-05-16 2023-08-01 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法
CN116524572B (zh) * 2023-05-16 2024-01-26 北京工业大学 基于自适应Hope-Net的人脸精准实时定位方法

Also Published As

Publication number Publication date
CN102043943B (zh) 2012-11-07

Similar Documents

Publication Publication Date Title
CN102043943B (zh) 人脸姿态参数获取方法及装置
US20200334853A1 (en) Facial features tracker with advanced training for natural rendering of human faces in real-time
Ren et al. Robust part-based hand gesture recognition using kinect sensor
Belhumeur et al. Localizing parts of faces using a consensus of exemplars
Dornaika et al. On appearance based face and facial action tracking
Ahn et al. Real-time head pose estimation using multi-task deep neural network
Burl et al. A probabilistic approach to object recognition using local photometry and global geometry
CN101159015B (zh) 一种二维人脸图像的识别方法
Roth et al. Survey of appearance-based methods for object recognition
Polonsky et al. What’s in an image? Towards the computation of the “best” view of an object
EP1760635B1 (en) Image processing apparatus and method and program
CN106203400A (zh) 一种人脸识别方法及装置
CN102376100A (zh) 基于单张照片的人脸动画方法
CN103116902A (zh) 三维虚拟人头像生成方法、人头像运动跟踪方法和装置
CN102087703A (zh) 确定正面的脸部姿态的方法
CN101968846A (zh) 一种人脸跟踪方法
Wang et al. A LINE-MOD-based markerless tracking approachfor AR applications
CN110349152A (zh) 人脸图像质量检测方法及装置
CN108171133A (zh) 一种基于特征协方差矩阵的动态手势识别方法
Čech et al. Multi-view facial landmark detection by using a 3D shape model
Davies et al. Advanced methods and deep learning in computer vision
Qiu et al. Outdoor semantic segmentation for UGVs based on CNN and fully connected CRFs
Wu et al. On signature invariants for effective motion trajectory recognition
Hafez et al. Visual servoing based on gaussian mixture models
CN108694348A (zh) 一种基于自然特征的跟踪注册方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220616

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technology Co.,Ltd.

Patentee after: Xi'an Jiao Tong University

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

Patentee before: Xi'an Jiao Tong University