CN107358172B

CN107358172B - 一种基于人脸朝向分类的人脸特征点初始化方法

Info

Publication number: CN107358172B
Application number: CN201710485262.5A
Authority: CN
Inventors: 秦华标; 黄波; 廖才满
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2017-06-22
Filing date: 2017-06-22
Publication date: 2022-05-24
Anticipated expiration: 2037-06-22
Also published as: CN107358172A

Abstract

本发明公开了一种基于人脸朝向分类的人脸特征点初始化方法，属于图像处理和计算机视觉领域。该方法的实现过程为：首先对每一张新输入的人脸图像，提取其HOG特征，通过随机森林的决策树投票得到其朝向分类标签，不同的朝向选取对应训练子集特征点的均值作为其初始化值。由于在同一类朝向下人脸特征点位置分布趋势差异不大，但是在类别不同的人脸朝向下特征点位置分布趋势有很明显的变化，因此采用与输入人脸图像相同朝向的特征点均值来初始化的方法可以降低人脸朝向的变化对特征点初始化的影响，从而提高人脸特征点初始化的准确率。

Description

一种基于人脸朝向分类的人脸特征点初始化方法

技术领域

本发明属于图像处理和计算机视觉领域，具体是一种基于人脸朝向分类的人脸特征点初始化方法。

背景技术

人脸特征点检测是一种自动人脸标定算法，其研究目的在于通过对人脸图像进行分析，获取一组预先定义好的足以描述人脸形状结构的特征点位置信息。作为计算机视觉领域内的一项基础研究，人脸特征点检测有着重要的研究意义和应用前景。对许多人脸图像相关的算法，如人脸识别、表情识别、性别识别、年龄识别、人脸动画、视频压缩等，人脸特征点检测往往是其必须的环节。

传统的人脸特征点检测算法主要包括主动形状模型、主动外观模型等。然而，这些方法在实际应用中对特征点的初始化结果都较为敏感。如果特征点初始化结果与真实位置差异过大，会影响后续的特征点检测精度。常规的人脸特征点初始化方法通常只针对正脸，无法处理姿势变化的情况。而在人脸多姿态变化的场景下，由于不同姿态的人脸图像人脸特征点分布差异很大，选择不同的姿态作为检测的初始值，会导致人脸特征点检测出现不同的偏差。根据不同的特征点检测模型，采用初始化的方法也不一样，其中主要有随机初始化、基于统计学习的初始化、渐进式回归初始化这三种。

随机初始化的思路是，不需要对输入的人脸图像进行区别处理，而是采用统一的多次随机取均值的方式，其本质上是通过取多次随机求均值降低总体随机误差。在人脸特征点检测的过程中，通过多次随机选取训练样本中不同的初始形状，进行多次重启人脸回归模型，取多次回归的结果均值作为最终的定位结果。基于统计学习的初始化方法是通过概率统计的方式代替随机抽取的方式，利用先验知识对人脸一些显著的特征点进行估计，如眼睛、嘴巴等关键位置，而后用于初始化。渐进式回归初始化的思路是由于人脸不同部位特征点分布不同，其对应检测的难度也不一样，因此不同部位的特征点对初始化的依赖也各不一样。在初始化的过程中，渐进式初始化将初始化分为三个不同的初始化过程，特征点检测的难度从易到难。造成算法复杂度较高。可见，随机初始化的算法简单、快速，但由于不同姿态下的训练样本的特征点分布差异性很大，导致随机初始化在人脸姿态变化的情况下不能保证初始化的有效性。而基于统计学习的方法对特征的选取十分依赖，渐进式回归的初始化效率不高。

因此，需要提出一种高效可靠的人脸特征点初始化方法，以增强人脸特征点检测算法的鲁棒性。

发明内容

本发明的目的是解决人脸特征点检测算法对特征点初始化结果敏感的问题。通过设计一种人脸特征点初始化算法，确定输入人脸图像的特征点初始位置，以提高后续人脸特征点检测的精度。本发明通过如下技术方案实现。

一种基于人脸朝向分类的人脸特征点初始化方法，该方法包括分类器建立方法和人脸特征点初始化方法两个部分：分类器建立方法为根据人脸朝向的不同，将训练样本划分为多类，同时得到人脸特征点概率分布模型；然后对训练样本中的所有人脸图像分别提取其特征并降维；最后由随机森林分类器进行训练，得到人脸朝向分类器模型；

人脸特征点初始化方法为对输入的人脸图像，提取能显示脸部形态变化的特征并降维，通过随机森林的决策树投票得到其朝向分类标签，然后从人脸特征点概率分布模型中选择具有相同朝向的特征点分布作为该人脸图像的特征点初始化的结果。

进一步地，将人脸朝向分为多类，降低因朝向变化造成的人脸特征点初始化的误差，同时根据每一类特征点分布的均值得到人脸特征点概率分布模型；首先要选取合适的角度值A₁、A₂，A₁<A₂，把训练集中人脸朝向划分为不同类，其中平动角Yaw在-A₁～+A₁，分为正脸朝向，+A₁～+A₂分为右脸朝向，-A₁～-A₂分为左脸朝向；A₁代表角度值大小，-代表偏左的旋转角度，+代表偏右的旋转角度；其中人脸朝向以平动角Yaw、转动角Pitch变化组合而成，Pitch∈{-45°,0°,+45°}三个离散姿态。

进一步地，对训练集合内所有的样本，分别提取其HOG特征，并按行排成特征矩阵；然后利用PCA对特征矩阵降维并保留90％的主成分；构建随机森林决策树，将降维后的特征矩阵进行归一化，并将归一化的特征矩阵送进分类器进行训练得到人脸朝向分类器模型。

进一步地，根据输入的人脸图像的朝向来初始化人脸特征点，包括如下步骤：对输入的人脸图像提取能充分显示其形态变化和朝向信息的HOG特征，并利用PCA算法降低提取的特征的冗余信息从而提高效率；然后将降维后的特征送到随机森林分类器，通过决策树投票得到模型预测的人脸朝向；最后利用人脸特征点概率分布模型中具有相同朝向的特征点分布来初始化输入图像的人脸特征点。

进一步地，作为优选的方案，基于人脸朝向分类的人脸特征点初始化方法，该方法包括如下具体步骤：(1)根据人脸朝向把训练集划分成多类，本方法取三类，得到三种子集，并计算每一类相对应的特征点位置的均值，从而得到人脸特征点概率分布模型。(2)在分类器建立过程中，对训练集的所有样本提取HOG(Histogram of Oriented Gradient,方向梯度直方图)特征。(3)对训练集提取的HOG特征用PCA(Principal Component Analysis，主成分分析)算法保留90％的主成分来进行降维。(4)构建随机森林决策树，将降维后的HOG特征送到分类器进行训练，得到人脸朝向分类器模型。(5)在人脸特征点初始化过程中将输入的人脸图像提取HOG特征并降维后送到分类器进行分类，得到相应的人脸朝向，然后用相同朝向训练子集的人脸特征点概率分布模型初始化该人脸图像。

上述方法中，所述的步骤(1)，包括：首先要选取合适的角度值A₁、A₂(A₁<A₂)把训练集中人脸朝向划分为不同类，其中平动角(Yaw)在-A₁～+A₁(A₁代表角度值大小，-代表偏左的旋转角度，+代表偏右的旋转角度)分为正脸朝向，+A₁～+A₂分为右脸朝向，-A₁～-A₂分为左脸朝向；其中人脸朝向以平动角(Yaw)、转动角(Pitch)变化组合而成，Pitch∈{-45°,0°,+45°}三个离散姿态；本方法把平动角为-A₁～+A₁且任意转动角下的情况归为一类；另外两种分类也是如此；本方法选取A₁为30°，A₂为60°，则-30°～+30°分为正脸朝向，+30°～+60°分为右脸朝向，-30°～-60°分为左脸朝向。同时，将正脸的标签定为1，右脸的标签定为2，左脸的标签定为3。

上述方法中，所述的步骤(2)，包括：对训练集中的每一张图片提取HOG特征，并将该特征存到一个行数与样本数量一样的Mat(opencv库的图片类型)型变量里。

上述方法中，所述的步骤(3)，包括：对步骤(2)中得到的特征矩阵利用PCA算法进行降维，保留90％的主成分。

上述方法中，所述的步骤(4)，包括：在分类器建立阶段，首先需要从不同人脸朝向的图像训练数据集D中采用bagging(bootstrap aggregating)采样的方法随机抽出N个训练子集，每个训练子集而后用于生成一棵决策树。每一次抽样都是随机且有放回的，每个训练子集的大小可取总样本集的二分之一或三分之二，这样可以保证每个训练子集里的样本存在一定的差异性，从而提高最后决策的泛化能力。当通过bagging采样得到训练子数据集后，需要为每个训练子数据集分别构建成一棵决策树，从而组成森林。由于随机森林的随机性防止了过拟合，因此在树的生成过程中不需要剪枝。在节点分裂的过程中，决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取(m<M)，每一个节点的分裂准则是基于基尼系数(Gini coefficient)的选择方法，即通过比较基尼系数与设定的阀值来决定分裂的方向。这样选出最优的属性特征，作为该节点的分裂属性。最后通过分裂函数将节点分裂成左右子树，直到不再分裂为止。

上述方法中，所述的步骤(5)，包括：在人脸特征点初始化过程中将输入的人脸图像提取HOG特征并降维后送到分类器中，决策树对输入的数据进行投票决策得到样本的朝向分类结果，然后用相同朝向训练子集的特征点均值初始化该人脸图像。

与现有技术相比，本发明具有如下优点和技术效果：本发明通过将人脸朝向分成三个子类，减弱了特征点初始化过程中由于人脸朝向的差异带来的初始化的误差；同时结合HOG特征和随机森林的方法来得到更加精确的人脸朝向，再利用相对应子集特征点的均值来初始化人脸特征点，进一步提高了人脸特征点初始化的精度。

附图说明

图1是基于人脸朝向分类的人脸特征点初始化方法的整体流程图。

图2是计算细胞单元的方向梯度直方图。

图3是人脸朝向分类算法流程图。

图4特征点初始化流程图。

具体实施方式

下面结合附图对本发明的具体实施方式做进一步说明。

结合图1，具体实施方式如下：

步骤1：根据人脸朝向的角度，将人脸朝向在-30°～+30°(-代表偏左的旋转角度，+代表偏右的旋转角度)分为正脸朝向，+30°～+60°分为右脸朝向，-30°～-60°分为左脸朝向。同时，将正脸的标签定为1，右脸的标签定为2，左脸的标签定为3。

步骤2：训练得到人脸朝向分类器模型，具体步骤如下：

2.1)对训练样本中的每一张人脸图像提取HOG特征并利用PCA降维，具体步骤如下：

a)计算梯度幅值和方向。

梯度的计算采用的是积分模板对人脸图像I(x,y)(x，y表示图像矩阵的下标)进行卷积，见式(1)、(2)，得到幅值G(x,y)，方向θ(x,y)。

b)计算细胞单元的方向梯度直方图，见图2。

如图2所示，将人脸图像平均分割成10×10的像素细胞单元(Cell)，将梯度方向(0-179)等分为9个区间，接下来根据求得的像素点梯度值对该细胞单元中所有的像素点对应的梯度值进行加权累加，统计得到其梯度方向直方图。

c)合并细胞单元

通常为了更好地描述图像的梯度特征，需要将细胞单元组成更大的一个区间，称为区间块(Block)。本文取相邻四个细胞单元组成一个块，其大小为20×20。由于每个细胞单元由9维向量组成，因此，每个块中特征向量有9×4＝36维。

d)组合区间块向量，得到HOG特征

在具体的实现过程中，通常还需要用滑动窗口在图像上对区间块进行采样，本文选取的窗口大小为40×40，窗口的滑动步长为40，区间块在窗口中的滑动步长为10。如图3所示，每个块在窗口里滑动次数为

那么窗口在人脸图像中滑动次数为

所以最后得到的人脸HOG特征为36×12×30＝12960维。同样，需要对提取得到的HOG特征进行PCA降维，得到400维。

2.2)构建随机森林决策树，主要分为三个步骤

a)随机抽样生成训练子集

在训练阶段，首先需要从不同人脸朝向的图像训练数据集D中采用bagging采样的方法随机抽出N个训练子集，每个训练子集而后用于生成一棵决策树。每一次抽样都是随机且有放回的，每个训练子集的大小可取总样本集的二分之一或三分之二，这样可以保证每个训练子集里的样本存在一定的差异性，从而提高最后决策的泛化能力，本文抽样子集取二分之一。

b)构建决策树

当通过bagging采样得到训练子数据集后，需要为每个训练子数据集分别构建成一棵决策树，从而组成森林。由于随机森林的随机性防止了过拟合，因此在树的生成过程中不需要剪枝。在节点分裂的过程中，决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取(m<M)，每一个节点的分裂准则是基于基尼系数(Gini coefficient)的选择方法，即通过比较基尼系数与设定的阀值来决定分裂的方向。这样选出最优的属性特征，作为该节点的分裂属性。最后通过分裂函数将节点分裂成左右子树，直到不再分裂为止。由于基于基尼系数的分裂方法不仅可以处理离散数据，还可以处理连续数据，增强了决策树的鲁棒性。如式(3)所示：

其中p_i为当前样本属于分类i的概率，分类总的类别为n，C为样本集。接着根据所选择的特征作为当前节点的属性，把训练样本分裂为左右两个子树中，设为C_L和C_R(L代表左边方向，R代表右边方向)，分别计算其基尼系数大小，如式(4)，选取基尼系数最小的样本划分特征作为当前节点的属性。

其中，i表示取左或者取右，C_i表示左子集或者右子集。

C)投票决策

在重复执行步骤1和2后就可以得到N个决策树，由其构成的决策森林用于新的人脸测试集的决策。当输入新的人脸测试样本后，决策树对输入的数据进行投票决策得到样本的朝向分类结果。

步骤3：将输入的人脸图像提取HOG特征并降维后送到分类器中，决策树对输入的数据进行投票决策得到样本的朝向分类结果，然后用相同朝向训练子集的特征点均值初始化该人脸图像。如图4所示。

Claims

1.一种基于人脸朝向分类的人脸特征点初始化方法，其特征在于包括：

步骤1：根据人脸朝向的角度，将人脸朝向在-30°～+30°分为正脸朝向，+30°～+60°分为右脸朝向，-30°～-60°分为左脸朝向，其中-代表偏左的旋转角度，+代表偏右的旋转角度；同时，将正脸的标签定为1，右脸的标签定为2，左脸的标签定为3；

步骤2：训练得到人脸朝向分类器模型，具体步骤如下：

a)计算梯度幅值和方向；

梯度的计算采用的是积分模板对人脸图像I(x,y)进行卷积，见式(1)、(2)，得到幅值G(x,y)，方向θ(x,y)，x，y表示图像矩阵的下标；

b)计算细胞单元的方向梯度直方图；

将人脸图像平均分割成10×10的像素细胞单元，将梯度方向(0-179)等分为9个区间，接下来根据求得的像素点梯度值对该细胞单元中所有的像素点对应的梯度值进行加权累加，统计得到其梯度方向直方图；

c)合并细胞单元

通常为了更好地描述图像的梯度特征，需要将细胞单元组成更大的一个区间，称为区间块；取相邻四个细胞单元组成一个块，其大小为20×20；由于每个细胞单元由9维向量组成，因此，每个块中特征向量有9×4＝36维；

d)组合区间块向量，得到HOG特征

在具体的实现过程中，通常还需要用滑动窗口在图像上对区间块进行采样，选取的窗口大小为40×40，窗口的滑动步长为40，区间块在窗口中的滑动步长为10；每个块在窗口里滑动次数为

那么窗口在人脸图像中滑动次数为

所以最后得到的人脸HOG特征为36×12×30＝12960维；同样，需要对提取得到的HOG特征进行PCA降维，得到400维；

2.2)构建随机森林决策树，主要分为三个步骤

a)随机抽样生成训练子集

在训练阶段，首先需要从不同人脸朝向的图像训练数据集D中采用bagging采样的方法随机抽出N个训练子集，每个训练子集而后用于生成一棵决策树；每一次抽样都是随机且有放回的，每个训练子集的大小可取总样本集的二分之一或三分之二，这样可以保证每个训练子集里的样本存在一定的差异性，从而提高最后决策的泛化能力，本文抽样子集取二分之一；

b)构建决策树

当通过bagging采样得到训练子数据集后，需要为每个训练子数据集分别构建成一棵决策树，从而组成森林；由于随机森林的随机性防止了过拟合，因此在树的生成过程中不需要剪枝；在节点分裂的过程中，决策树的当前节点特征m是从训练子数据集中的M维特征中随机选取，m<M，每一个节点的分裂准则是基于基尼系数的选择方法，即通过比较基尼系数与设定的阀值来决定分裂的方向；这样选出最优的属性特征，作为该节点的分裂属性；最后通过分裂函数将节点分裂成左右子树，直到不再分裂为止；由于基于基尼系数的分裂方法不仅可以处理离散数据，还可以处理连续数据，增强了决策树的鲁棒性；如式(3)所示：

其中p_i为当前样本属于分类i的概率，分类总的类别为n，C为样本集；接着根据所选择的特征作为当前节点的属性，把训练样本分裂为左右两个子树中，设为C_L和C_R，L代表左边方向，R代表右边方向，分别计算其基尼系数大小，如式(4)，选取基尼系数最小的样本划分特征作为当前节点的属性；

其中，i表示取左或者取右，C_i表示左子集或者右子集；

C)投票决策

在重复执行步骤1和2后就可以得到N个决策树，由其构成的决策森林用于新的人脸测试集的决策；当输入新的人脸测试样本后，决策树对输入的数据进行投票决策得到样本的朝向分类结果；

步骤3：将输入的人脸图像提取HOG特征并降维后送到分类器中，决策树对输入的数据进行投票决策得到样本的朝向分类结果，然后用相同朝向训练子集的特征点均值初始化该人脸图像。