WO2015078007A1

WO2015078007A1 - 一种快速人脸对齐方法

Info

Publication number: WO2015078007A1
Application number: PCT/CN2013/088224
Authority: WO
Inventors: 徐勇; 钟左峰
Original assignee: 徐勇
Priority date: 2013-11-29
Filing date: 2013-11-29
Publication date: 2015-06-04

Abstract

本发明为一种快速人脸对齐方法，本方法提出使用串联回归结构和快速特征选择方法在人脸图片中对人脸形状进行快速对齐。系统分为两个阶段。在学习训练阶段，首先将已标注好的真实人脸形状样本进行人脸形状初始化，后用每个样本的当前人脸形状求取的像素差特征与回归目标分别训练多个回归器，并将这些回归器组成一个串联结构。最后每个样本的当前人脸形状与每个回归器训练结果相加作为最后输出。在测试阶段，先将测试样本任意初始化人脸形状，后用当前人脸形状求取像素差特征与回归目标输入训练好的回归器中，并与回归器结果相加即为最终人脸估计形状。此方法可以快速准确的获取各种情况下（光照、表情、姿态）人脸图片的人脸形状。

Description

一种快速人脸对齐方法

技术领域

本发明涉及一般的图像数据处理领域，尤其涉及一种快速人脸对齐方法。背景技术

随着科技的发展，人脸识别技术渐渐成为生物识别技术的热点之一。它在视频监控、信息安全、网络社交等领域有着广泛的应用前景。同时配合着平安城市概念的提出，人脸识别的作用被进一步的突出。但是现有的人脸识别方法都基于数字图像的，这些人脸图像通常在非约束环境下采集，会受到光照、表情和姿态等因素的影响。如果缺少人脸对齐过程或者对齐结果粗糙。则需要识别算法本身要对光照、表情和姿态有很好的适应性，特别是在特征提取阶段更是需要提取局部不变性特征。这就增加了人脸识别算法的难度与复杂度，降低了算法的通用性。甚至粗糙的对齐结果还会对识别算法产生干扰，反而降低了识别算法的正确率。现有的人脸对齐方法主要分为两类

( 1 )基于参数优化的方法参数优化方法主要是将人脸对齐过程中的人脸估计形状向真实形状收敛问题转换为一个目标函数求解问题，且此目标函数是便于优化的。此类方法有 AAM模型，它是用形状模型构建整个人脸形状，并且通过最小化误差余项的优化方法来估计人脸形状。但是学习到的模型的扩展性不强，很难对各种受姿态、表情和光照等因素影响的人脸图像的进行很好的人脸形状估计。同时， AAM模型依赖于参数初始化情况，也限制它的应用性。

( 2 )基于形状回归的方法

形状回归方法是学习一个回归函数，回归函数直接将人脸形状映射到目标结果。大量的训练样本可以训练出一个很好的目标函数。但此类方法依旧存在缺点：函数求解过程中需要求解出一组最小化参数，但是函数参数的最小化并不意味着对齐错误的最小化，所以求解出的函数并不能很好的表示人脸形状。形状回归方法的另一种方式是在学习的过程仅使用单个人脸形状标注点。但是这样只学习到局部特征而将整个人脸的全局相关性忽略。所以学习到的回归器性能较差，没有很好的泛化能力。鉴于现实中获取的人脸图像大部分都在非理想环境下采集，会受到以下几个因素的影响：

1. 光照，在非均匀光照环境下获取的人脸图像会使人脸部分出现明暗对比强烈的情况。暗的部分在灰度化后会照成轮廓不清晰。

2. 表情，大部分自然状态下采集人脸图像都有表情变化，这使得五官位置与标准位置有所不同。

3. 姿态，大部分人脸图像采集都不是采集对象主动配合下完成的，所以会有各种姿态变化，如人脸向左或者向右偏转等。除了以上三种主要的因素外，还有很多情况是几种因素的共同影响。所以好的人脸对齐方法要对这些影响因素有良好的适应性，现有的人脸对齐方法, 存在效果好但是计算量大或者计算速度快但是适应性差的问题。发明内容

针对现有技术中存在的缺陷或不足，本发明所要解决的技术问题是：提供一种适应性好且计算速度快的方法，具体为用串联回归结构和快速特征选择方法在人脸图片中对人脸形状进行快速对齐速的方法，本方法在保持人脸形状约束的情况下进行快速的人脸形状回归。

本发明采取的技术方案为提供一种快速人脸对齐方法，包括回归器训练模块和回归器运用模块，

所述回归器训练模块包括以下步骤：步骤 1 , 对各种情况下的人脸图片样本提取人脸的真实形状标注点作为训练样本，再对训练样本进行人脸形状标注点初始化，对人脸形状标注点的作法为在人脸图像中在眼睛、鼻子和嘴巴主要特征点上进行人工打点标注；

步骤 2 , 对训练样本进行特征提取；

步骤 3 , 计算每个训练样本的回归目标函数，也就是计算真实人脸形状和当前估计人脸形状的差的绝对值；

步骤 4 , 对回归器进行学习；

步骤 5 , 用回归器输出的结果更新当前人脸形状；

步骤 6 , 计算训练样本当前回归目标 /₂范数，用该 /₂范数与阈值相比较；步骤 7 , 依次训练出一组回归器，且回归器组成串联结构，同时获得回归器需要特征计算的位置。

作为本发明的进一步改进，所述回归器运用模块包括以下步骤：

步骤 10 , 将测试样本输入训练好的一组回归器；

步骤 20 , 测试样本依据步骤 2进行特征提取；

步骤 30 , 将测试样本特征与每个回归器训练生成的阈值做比较，将样本分配到每个回归器已有的某个块中；

步骤 40 ,对分配到每个块中的样本用本块的平均回归目标与本块中样本当前人脸形状相加来更新估计人脸形状；

步骤 50 , 根据步骤 7中确定的回归器需要特征提取的位置进行特征提取，如需要特征提取，则返回步骤 20 , 否者返回步骤 30 , 直到所有的回归器计算完成；

步骤 60 , 用测试样本的当前人脸形状与每个回归器测试结果相加，形成最终人脸估计形状。

作为本发明的进一步改进，所述步骤 2的特征提取方法如下：

步骤 21 : 按顺序选取每个人脸形状标注点的坐标值；

步骤 22: 在每个人脸形状标注点的局部范围内随机生成局部坐标值；步骤 23: 将每个局部坐标值与对应的每个人脸形状标注点坐标值相加即为生成的特征点，提取其像素值；

步骤 24: 将所有提取的特征点的像素值两两做差即为特征。

作为本发明的进一步改进，所述步骤 6中 /₂ 范数与阈值相比较具体为当范数 /₂小于某个阈值时，返回所述步骤 3; 当范数 /₂大于某个阈值时返回所述步骤

2 , 重新提取像素差特征。

作为本发明的进一步改进，重复采用基于最大相关性的特征选取方法选取特征，提取多次阈值。

作为本发明的进一步改进，所述基于最大相关性的特征选取方法如下：计算每个像素差特征和回归目标随机投影值的相关系数，找到相关系数最大的特征作为选取特征，所述回归目标随机投影值由回归目标向量和随机生成的投影向量的内积而得到。

作为本发明的进一步改进，所述步骤 4中对回归器进行学习如下：每个测试样本提取的像素差特征全部输入到每个回归器中，用回归目标函数依次训练由串联结构组成的每个回归器，直到要求数量的回归器训练完成。

作为本发明的进一步改进，所述回归器学习为，每个测试样本提取的像素差特征全部输入到每个回归器中，然后按照每个回归器组成的串联结构和回归目标函数依次训练每个回归器，直到要求数量的回归器训练完成。

作为本发明的进一步改进，所述某个阈值为 [70 , 40]。

作为本发明的进一步改进，所述步骤 60 中需要特征提取的回归器位置为依据将串联结构进行划分，划分为若干个不需要提取特征的小结构，每个小结构共享同一个特征。

作为本发明的进一步改进，所述步骤 5中回归器输出的结果为每个训练样本的当前人脸形状与每个回归器训练结果相加。

本发明的有益效果是：本方法是无参数化方法，回归器的训练和测试都不需要设置和调整参数，大大加强了模型的灵活性；方法在测试时可以很好保持的人脸形状约束，快速准确的回归出人脸形状；算法复杂度低，训练和测试都使用像素差特征，计算量小；方法的泛化性好，训练充分的回归模型可以广泛适应各种情况的人脸图片，节约大量的算法运行时间，提高后续识别，跟踪等方法的效率。

附图说明

图 1是本发明快速人脸对齐方法的框架图；

图 2是本发明快速人脸对齐方法人脸形状标注样例；

图 3是本发明快速人脸对齐方法测试结果例图一；

图 4是本发明快速人脸对齐方法测试结果例图二；

图 5是本发明快速人脸对齐方法测试结果例图三；

图 6是本发明快速人脸对齐方法测试结果例图四；

图 7是本发明快速人脸对齐方法测试阶段流程图。

具体实施方式

下面结合附图说明及具体实施方式对本发明进一步说明。如图 1所示，本方法提出使用串联回归结构和快速特征选择方法在人脸图片中对人脸形状进行快速对齐。系统分为两个阶段。在学习训练阶段，首先将已标注好的真实人脸形状样本进行人脸形状初始化，后用每个样本的当前人脸形状求取的像素差特征与回归目标分别训练多个回归器，并将这些回归器组成一个串联结构。最后每个样本的当前人脸形状与每个回归器训练结果相加作为最后输出。在测试阶段，先将测试样本任意初始化人脸形状，后用当前人脸形状求取像素差特征与回归目标输入训练好的回归器中，并与回归器结果相加即为最终人脸估计形状。此方法可以快速准确的获取各种情况下（光照、表情、姿态）人脸图片的人脸形状。

本方法为快速人脸对齐方法，包括回归器训练模块 100和回归器运用模块 200 , 回归器训练模块 100 为训练过程主要是将训练集中每个已经人工生成的真实人脸形状的训练样本输入，并且对每个训练样本初始化一个人脸形状。每次用所有的样本训练一个回归器，直到指定数量的回归器训练完成。每个回归器的训练中对每个样本生成像素差特征并且选取像素差特征和回归目标投影相关系数最大的 N个特征。其中，回归目标是当前人脸形状与真实人脸形状的差的绝对值。每个回归器训练就是用随机阈值将样本空间划分为若干个小块，每个小块的平均回归目标值作为相应块中样本人脸估计形状的更新累加值，故每个最终训练完成的回归器由 N个随机阈值、提取特征的点的序号和每个小块的平均回归目标三个部分组成。

回归器训练模块 100包括以下步骤：

步骤 1 , 对各种情况下的人脸图片样本提取人脸的真实形状标注点作为训练样本，首先要获取各种情况下人脸图片样本，样本量至少到万张以上。样本的覆盖的情况要足够丰富，应该包括各种光照和各种场景下获取的表情，姿态各异的人脸图片，包括室内和室外采集环境，这样才可以保证回归器的充分的学习，在获取的人脸样本上人工提取人脸的真实形状标注点，对人脸形状标注点的作法为在人脸图像中在眼睛、鼻子和嘴巴主要特征点上进行人工打点标注, 如图 2所示，是一个在眼睛、鼻子和嘴巴上共标注 7个点的样例，以便训练使用。再对训练样本进行人脸形状标注点初始化，初始化包括对同一张样本进行步骤 2 , 对训练样本进行特征提取；对每个训练样本的当前估计人脸形状标注点局部随机提取像素点，然后提取的像素点的两两像素差作为选取特征；步骤 3 , 计算每个训练样本的回归目标函数（真实人脸形状和当前估计人脸形状的差的绝对值）；

步骤 4 , 对回归器进行学习并将这些回归器组成一个串联结构；所述回归器学习为，每个测试样本提取的像素差特征全部输入到每个回归器中，用回归目标函数依次训练由串联结构组成的每个回归器，直到要求数量的回归器训练完成。用提取的像素差特征和回归目标训练完成的每一个回归器包括获取的 N 个随机阔值、被提取特征点的序号和每个小块的平均回归目标三个部分。

单个回归器的训练对于输入样本的 κ个特征对应生成个随机阈值，用这些阈值将样本划分入到 ^个小块中。此处，本方法用个随机阈值构建一个二叉决策树。决策树共有层，每层共享同一个阈值，特征进入每个节点大于阈值分配到右子树，小于阈值分配到左子树。这样就将样本划分到 ^个小块中。然后计算每个块中样本的平均回归目标。对分配到每个块中的样本用本块的平均回归目标与样本当前人脸形状相加来更新估计人脸形状。最后计算更新后回归目标 /₂范数。范数值大于某个阈值进行特征提取和选取后进入回归目标的计算。小于则不需要，直接进行回归目标的计算。这样一个回归器的训练就完成。这次训练完的当前人脸形状输入到下一个回归器中依同样方法进行训练。这样可以大大减少算法特征提取量，不需要每个回归器都要提取特征。因为在精细刻画过程中，估计形状位置不会有巨大的偏离。这样就加快算法运行速度。同时也保证对齐过程由粗到精的完成。具体过程如下：其中/ ρ„为两个特征点像素值， η^ ,ι^为特征提取点的序号。

Stepl: 每个样本提取的 κ个特征 { P_m - P_n }^K _f=l ,{m ,n }^K _f=l

Step2:

Step3: 将训练样本划分入 ^个 b in Ω₆中： Step4: 计算每个 bin中的样本平均回归目标:

°^= ⁼ 1 _{+ ¾} | IQJ ^为收缩系数 Step5: 构建一个训练完成的回归器 r_b ^{{ _f} {T_f} {y ___l}

Step6: 更新回归目标

步骤 5, 用回归器输出的结果更新当前人脸形状；即将回归器输出结果与当前人脸形状向量相加；

步骤 6, 计算训练样本当前回归目标 /₂范数，用该 /₂范数与阈值相比较；当范数小于某个阈值时，返回步骤 3; 当范数大于某个阈值时返回步骤 2, 重新提取像素差特征。最终获得一组训练好的回归器以及回归器需要特征计算的位置；而 /₂范数的定义为两点之间的欧式距离，即两个点向量之间的平方和后开方。本方法为当前人脸形状向量和真实人脸形状向量之间的距离。所有样本训练完一个回归器，更新当前人脸估计形状后输入到下一个回归器进行训练。为了加快训练速度，并不需要每次训练都提取特征，因为在精细刻画过程中，当前人脸形状位置不会与真实人脸形状位置有巨大的偏离。所以为了判断是否需要提取特征，本方法需要求取当前人脸回归目标的 /₂范数并且通过阈值来判断。当范数大于阈值时表示对齐误差较大，则需要进行新的特征提取，而当范数小于阈值时则不用提取特征。这样可以节省大量训练时间。

步骤 7, 依次训练出一组回归器，且回归器组成串联结构，同时获得回归器需要特征计算的位置。依照需要特征提取的回归器位置为依据将串联结构进行划分，可以分为若干个不需要提取特征的小结构。对串联结构进行划分的原则是算法中需要特征提取回归器的位置，因为通过阈值判断下一个回归器训练是否需要提取特征，所以从整体所有回归器组成结构看有些回归器要提取特征, 有些不要，所以那些要提取的回归器就把结构进行了划分。而阈值的设置则由实验经验确定，不同是初始化情况阈值会不同，但一般都在 [70， 40]范围之内，如本方法使用所有样本的真实人脸形状平均值作为初始化人脸形状所使用的阈值为 50。

如图 7所示，回归器运用模块 200为测试阶段，主要是对初始化好的人脸接与当前估计人脸形状相加，包括以下步骤：

步骤 10 , 将测试样本输入训练好的一组回归器，测试样本的人脸形状为任意初始化的；

步骤 20 , 测试样本依据步骤 2进行特征提取；

步骤 30 , 将测试样本特征与每个回归器 /₂范数的阈值做比较；

步骤 40 ,对分配到每个块中的样本用本块的平均回归目标函数与本块中样本当前人脸形状相加来更新估计人脸形状；

步骤 50 , 根据步骤 7中确定的回归器需要特征提取的位置进行特征提取，如特征不一样，则返回步骤 20或者返回步骤 30 ,直到所有的回归器计算完成；训练完成后，回归器需要提取特征的位置就确定了，这时测试根据这个位置进行特征提取就行了；

为了提高计算速度，本方法采用像素差作为特征。因为像素差特征具有提取方便，计算快捷等特点。本方法是在当前人脸形状每个标注点的局部范围内随机采集多个像素点灰度值，后将这些灰度值两两作差像素差作为特征。如在图 2中所示情况，在 7个标注点中每个标注点局部 8像素范围内随机采点，一共采集 4 QQ个点。则这 4QQ个点共形成 16QQ()()个像素差特征。特征提取方法如下：所述步骤 2的特征提取方法如下：

步骤 21 : 按顺序选取每个人脸形状标注点的坐标值；

步骤 24: 将所有提取的特征点的像素值两两做差即为特征。

为了训练出好的回归器，必须对提取到的特征选取最优的特征。通常都会使用 n-bes t 方法。但是此方法需要在巨大的特征空间中寻找最优特征，要耗费巨大的计算量。所以本方法重复采用基于最大相关性的特征选取方法选取特征，提取多次阈值。主要是计算每个像素差特征和回归目标投影值的相关系数，找到相关系数最大的特征作为选取特征。本方法需要重复此过程提取多次特征, 而回归目标的投影是由回归目标向量和随机生成的投影向量的内积而得到。

令/^和/^为两个特征点像素值，则 p_m - p„ 像素差特征。而回归目标为 y = - 。为样本的真实人脸形状，为样本的当前估计人脸形状。将回归目标进行随机投影为 , 则像素差特征和回归目标投影的相关系数表示为： corr(Y p_m-p_n) =

(Y P_m-Pj 其中： cr(p_m -p_n) = cov( ?_m ,p_m) + coy(p_n ,p_n)-2 coy(p_m ,p_n) ₀ 根据公式，每次计算相关系数时都要计算回归目标投影和一对像素差特征中单个像素的协方差 cov(i ,p , co\(Y_p , ) ,像素差本身方差 cov(/?_m, p ,∞v(p_n,p_n)以及相互的协方差 cov( p_m,p_n)„ 算法流程如下：输入：回归目标采集点个数需要选取特征数输出：像素差特征 {P_m-

过程： for f from 1 to K

} 为随机向量计算回归目标投影和像素的协方差与回归目标投影的方差 ∞ν(Υ_ρ,ρ),σ(Υ_ρ)

m_f = 1, n_f =1

for m from 1 to P

for n from 1 to P

计算相关系数 corr(i ,p_m - p_n) i f corr(Y_p ,p_m-pj> corr(Y_p , p_mf - p_n ) m_f = m,n_f = n

return

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干筒单推演或替换，都应当视为属于本发明的保护范围。

Claims

权利要求书

1. 一种快速人脸对齐方法，其特征在于：包括回归器训练模块和回归器运用模块，所述回归器训练模块包括以下步骤：步骤 1, 对各种情况下的人脸图片样本提取人脸的真实形状标注点作为训练样本，再对训练样本进行人脸形状标注点初始化；步骤 2, 对训练样本进行特征提取；步骤 3, 计算每个训练样本的回归目标函数；步骤 4, 对回归器进行学习；步骤 5, 用回归器输出的结果更新当前人脸形状；步骤 6, 计算训练样本当前回归目标 /₂范数，用该 /₂范数与阈值相比较；步骤 7, 依次训练出一组回归器，且回归器组成串联结构，同时获得回归器需要特征计算的位置。

2. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述回归器运用模块包括以下步骤：步骤 10, 将测试样本输入训练好的一组回归器；步骤 20, 测试样本依据步骤 2进行特征提取；步骤 30, 将测试样本特征与每个回归器训练生成的阈值做比较，将测试样本分配到每个回归器已有的某个块中；步骤 40, 对分配到每个块中的样本用本块的平均回归目标与本块中样本当前人脸形状相加来更新估计人脸形状；步骤 50, 根据步骤 7 中确定的回归器需要特征提取的位置进行特征提取，如需要特征提取，则返回步骤 20, 否者返回步骤 30, 直到所有的回归器计算完成；步骤 60, 用测试样本的当前人脸形状与每个回归器测试结果相加，形成最终人脸估计形状。

3. 根据权利要求 1或 2所述快速人脸对齐方法，其特征在于：所述特征提取方法: ¾口下：

步骤 21 : 按顺序选取每个人脸形状标注点的坐标值；

步骤 24: 将所有提取的特征点的像素值两两做差即为特征。

4. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述步骤 6中 /₂ 范数与阈值相比较具体为当范数 /₂小于某个阈值时，返回所述步骤 3; 当范数 /₂大于某个阈值时返回所述步骤 2 , 重新提取像素差特征。

5. 根据权利要求 3所述快速人脸对齐方法，其特征在于：重复多次特征提取，采用基于最大相关性的特征选取方法。

6. 根据权利要求 5 所述快速人脸对齐方法，其特征在于：所述基于最大相关性的特征选取方法如下：计算每个像素差特征和回归目标随机投影值的相关系数，找到相关系数最大的特征作为选取特征。

7. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述步骤 4 中对回归器进行学习如下：每个测试样本提取的像素差特征全部输入到每个回归器中，用回归目标函数依次训练由串联结构组成的每个回归器，直到要求数量的回归器训练完成。

8. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述某个阈值为 [70 , 40] 。

9. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述步骤 60中需要特征提取的回归器位置为依据将串联结构进行划分，划分为若干个不需要提取特征的小结构，每个小结构共享同一个特征。

10. 根据权利要求 1所述快速人脸对齐方法，其特征在于：所述步骤 5中回归器输出的结 ΙΞΓ器训练结果相加。