CN106874825A

CN106874825A - 人脸检测的训练方法、检测方法和装置

Info

Publication number: CN106874825A
Application number: CN201510921985.6A
Authority: CN
Inventors: 刘阳; 陈敏杰; 潘博阳; 郭春磊; 林福辉
Original assignee: Spreadtrum Communications Tianjin Co Ltd
Current assignee: Spreadtrum Communications Tianjin Co Ltd
Priority date: 2015-12-10
Filing date: 2015-12-10
Publication date: 2017-06-20

Abstract

一种人脸检测的训练方法、检测方法和装置。所述人脸检测器包括第一分类器及第二分类器，所述训练方法包括：采集人脸和非人脸图像作为训练样本集；提取所述训练样本集中各个训练样本的亮度比较特征；根据所述亮度比较特征获得对应的蕨特征；利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器；利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数；将所述P个决策树分类器级联形成所述第二分类器。应用所述训练方法得到的人脸检测器进行人脸检测时，可以降低人脸检测的复杂度及计算量，提高检测效率。

Description

人脸检测的训练方法、检测方法和装置

技术领域

本发明涉及通信技术领域，具体涉及一种人脸检测的训练方法、检测方法和装置。

背景技术

人脸检测是一项涉及计算机视觉和机器学习的技术，主要目的是在图像和视频中检测出人脸的目标实例，可应用于人脸识别，人机交互等技术领域。

目前，人脸检测的方法有很多，按照模型来区分，主流的方案有以下几种：

1)支持向量机(Support Vector Machine，SVM)，主要和梯度方向直方图(Histogram of Oriented Gradient，HOG)特征一起应用于行人检测领域。该方案计算稠密的梯度方向特征，使用简单的线性SVM对高维的HOG描述子进行分类就能取得很好的检测效果。

2)基于部件的变形模型(Deformable Part-based Model，DPM)，主要和HOG特征一起应用于泛化目标(Generalized Object)的检测与识别，尤其适合对非刚性目标的检测和识别。该方法的核心要素，是将部件相对位置和整体位置视为隐变量，使用隐形SVM(Latent-SVM)完成半监督学习。该方法也可以实现级联检测，在不影响检测质量的前提下，可以实现一个数量级的速度提升。

3)卷积神经网络(Convolutional Neural Network，CNN)是近年大热的方法，适用于泛化目标的检测与识别。通过对输入图像进行多层的卷积、池化操作，再通过Softmax分类器进行分类，即可完成检测过程。

4)自提升级联模型(AdaBoost Cascaded Model)，主要和哈尔(Haar)特征一起应用于人脸检测(Face Detection)领域。该方案使用简单的哈尔特征学习许多简单的弱分类器(Weak Classifier)，在实际检测时采用级联结构，每一层滤掉大部分非人脸候选，同时让大部分人脸候选通过，从而加速检测。

然而，上述人脸检测方案均难以兼顾检测速度及检测效果。

发明内容

本发明实施例能够解决在保证检测效果的情况下，如何降低人脸检测的复杂度及计算量，提高检测效率。

为解决上述问题，本发明实施例提供了一种人脸检测器的训练方法，所述人脸检测器包括第一分类器及第二分类器，所述方法包括：

采集人脸和非人脸图像作为训练样本集；

提取所述训练样本集中各个训练样本的亮度比较特征；

根据所述亮度比较特征获得对应的蕨特征；

利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器；

利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数；

将所述P个决策树分类器级联形成所述第二分类器。

可选地，所述第一分类器分类方法如下：

其中，F_j是所述训练样本集中第k个训练样本的第j个蕨特征；C_q是第q个类别，P(F_m|C＝C_q)是第k个训练样本的类别为C_q时，第j个蕨特征的似然度，J为第k个训练样本的蕨特征的总数；为第一分类器对第k个训练样本的分类结果；所述第k个训练样本为所述训练样本集中任一训练样本。

可选地，所述决策树为回归树。

可选地，所述利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，包括：

对已获得的p-1个决策树分类器误分类的训练样本的权重进行更新，1≤p≤P，并根据更新后的训练样本的权重，进行第p轮的训练，获得第p个决策树分类器，其中，采用如下步骤获得第p个决策树分类器：

从待划分的训练样本的亮度比较特征集合中选取部分亮度比较特征；

根据所选取的所述部分亮度比较特征对所述待划分的训练样本进行分类；

根据更新后的所述训练样本集中各训练样本的权重，采用最小化加权均方差准则训练所述第p个决策树的划分节点，直至达到所述第p个决策树的最大深度。

可选地，采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

其中，T_p(S_k)是第p个决策树分类器在所述第k个训练样本的数据为S_k时，对所述第k个训练样本的输出值；w_k、l_k分别是所述第k个训练样本的权重、真实值；w_k’为对所述第k个训练样本的权重w_k更新后的权重。

可选地，所述第二分类器的分类方法如下：

其中，T_p(S)是第p个决策树分类器在训练样本的数据为S时，对所述训练样本的数据为S的训练样本的输出值；α_p是第p个决策树分类器的权重，H(S)为所述第二分类器对所述训练样本的数据为S的训练样本的分类结果。

可选地，所述根据所述亮度比较特征获得对应的蕨特征，包括：

根据条件互信息准则，从每个训练样本的亮度比较特征中选取部分亮度比较特征，并将所选取的部分亮度比较特征作为第j个蕨特征，其中，j为正整数。

本发明实施例还提供了一种人脸检测方法，所述方法包括：

遍历待检测图像，获得待检测子图像集，所述待检测子图像集中每一待检测子图像对应一窗口；

将各所述待检测子图像依次带入人脸检测器的第一分类器及第二分类器中进行人脸检测，将通过所述第一分类器及第二分类器的待检测子图像判定为所述待检测图像的人脸检测结果；其中，通过采集人脸和非人脸图像作为训练样本集，提取所述训练样本集中各个训练样本的亮度比较特征，并根据所述亮度比较特征获得对应的蕨特征，利用所述蕨特征及贝叶斯定理进行训练得到所述第一分类器，并利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数，将所述P个决策树分类器级联形成所述第二分类器；

所述将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像；

输出所述待检测图像中所述人脸图像的位置。

可选地，所述第一分类器分类方法如下：

可选地，所述决策树为回归树。

可选地，采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

可选地，所述第二分类器的分类方法如下：

其中，T_p(S)是第p个决策树分类器在训练样本的数据为S时，对所述训练样本的数据为S的训练样本的分类结果；α_p是第p个决策树分类器的权重，H(S)为所述第二分类器对所述训练样本的数据为S的训练样本的分类结果。

可选地，还包括：

对原始图像进行降采样处理后获得多个不同尺度的图像，将所述多个不同尺度的图像分别作为所述待检测图像；

分别将各待检测图像的人脸检测结果进行升采样处理后再进行聚类。

可选地，在所述将所述判定为待检测图像的人脸检测结果进行聚类后，还包括：

分别对与所述待检测图像相邻的预设帧数的图像的人脸检测结果进行聚类；

对每一帧图像聚类后的结果进行加权处理，并将加权处理后的结果作为所述待检测图像中的人脸图像。

可选地，所述将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像，包括：

在通过所述第一分类器及第二分类器的待检测子图像中，搜索所有相连接的待检测子图像，将相连接的待检测子图像作为一个聚类；

对每个聚类中的所有待检测子图像进行平均操作，生成新的待检测子图像；

在所有所述新的待检测子图像中，剔除嵌入待检测子图像，将剩余的所述新的待检测子图像进行合并，得到所述待检测图像的人脸图像。

本发明实施例还提供了一种人脸检测器的训练装置，所述人脸检测器包括第一分类器及第二分类器，所述装置包括：

采集单元，适于采集人脸和非人脸图像作为训练样本集；

第一特征提取单元，适于提取所述训练样本集中各个训练样本的亮度比较特征；

第二特征提取单元，适于根据所述亮度比较特征获得对应的蕨特征；

第一训练单元，适于利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器；

第二训练单元，适于利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数；

级联单元，适于将所述P个决策树分类器级联形成所述第二分类器。

可选地，所述第一训练单元训练得到所述第一分类器分类方法如下：

可选地，所述决策树为回归树。

可选地，所述第二训练单元包括：更新子单元及训练子单元；其中：

所述更新子单元，适于对已获得的p-1个决策树分类器误分类的训练样本的权重进行更新，1≤p≤P；

所述训练子单元，适于根据更新后的训练样本的权重，进行第p轮的训练，获得第p个决策树分类器，包括：提取模块，分类模块及训练模块；

所述提取模块，适于从待划分的训练样本的亮度比较特征集合中选取部分亮度比较特征；

所述分类模块，适于根据所选取的所述部分亮度比较特征对所述待划分的训练样本进行分类；

所述训练模块，适于根据更新后的所述训练样本集中各训练样本的权重，采用最小化加权均方差准则训练所述第p个决策树的划分节点，直至达到所述第p个决策树的最大深度。

可选地，所述更新子单元适于采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

可选地，所述级联单元得到所述第二分类器的方法如下：

可选地，所述第二特征提取单元适于根据条件互信息准则，从每个训练样本的亮度比较特征中选取部分亮度比较特征，并将所选取的部分亮度比较特征作为第j个蕨特征，其中，j为正整数。

本发明实施例还提供了一种人脸检测装置，所述装置包括：

遍历单元，适于遍历待检测图像，获得待检测子图像集，所述待检测子图像集中每一待检测子图像对应一窗口；

检测单元，适于将各所述待检测子图像依次带入人脸检测器的第一分类器及第二分类器中进行人脸检测，将通过所述第一分类器及第二分类器的待检测子图像判定为所述待检测图像的人脸检测结果；其中，所述第一分类器及第二分类器通过人脸检测器的训练装置得到，所述人脸检测器的训练装置包括：采集单元，适于采集人脸和非人脸图像作为训练样本集；第一特征提取单元，适于提取所述训练样本集中各个训练样本的亮度比较特征；第二特征提取单元，适于根据所述亮度比较特征获得对应的蕨特征；第一训练单元，适于利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器；第二训练单元，适于利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数；级联单元，适于将所述P个决策树分类器级联形成所述第二分类器；

第一聚类处理单元，适于将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像；

输出单元，适于输出所述待检测图像中所述人脸图像的位置。

可选地，所述决策树为回归树。

w_k’＝w_k·exp(-l_kT_p(S_k))；

可选地，所述级联单元得到所述第二分类器的方法如下：

可选地，所述装置还包括：

降采样处理单元，适于对原始图像进行降采样处理后获得多个不同尺度的图像，将所述多个不同尺度的图像分别作为所述待检测图像；

升采样处理单元，适于分别将各待检测图像的人脸检测结果进行升采样处理后再进行聚类。

可选地，所述装置还包括：

第二聚类处理单元，适于在将所述判定为待检测图像的人脸检测结果进行聚类后，分别对与所述待检测图像相邻的预设帧数的图像的人脸检测结果进行聚类；

加权处理单元，适于对每一帧图像聚类后的结果进行加权处理，并将加权处理后的结果作为所述待检测图像中的人脸图像。

可选地，所述第一聚类处理单元包括：

搜索子单元，适于在通过所述第一分类器及第二分类器的待检测子图像中，搜索所有相连接的待检测子图像，将相连接的待检测子图像作为一个聚类；

生成子单元，适于对每个聚类中的所有待检测子图像进行平均操作，生成新的待检测子图像；

处理子单元，适于在所有所述新的待检测子图像中，剔除嵌入待检测子图像，将剩余的所述新的待检测子图像进行合并，得到所述待检测图像的人脸图像。

与现有技术相比，本发明的技术方案至少具有以下优点：

通过提取训练样本的亮度比较特征，进而可以根据所述亮度比较特征获得对应的蕨特征，并利用所述蕨特征及贝叶斯定理得到第一分类器，利用所述亮度比较特征及最小化加权均方差准则得到P个决策树分类器，最后将所述P个决策树分类器级联形成所述第二分类器。相对于HOG特征，所述亮度比较特征的复杂度较低，因此通过提取所述亮度比较特征来获得的人脸检测器可以提高检测速度。相对于哈尔特征，所述亮度比较特征是随机提取的特征，因此通过提取所述亮度比较特征来获得的人脸检测器对非受限的人脸图像可以获得较好的检测效果。另外，采用利用所述蕨特征及贝叶斯定理得到的第一分类器进行检测时，可以同时对多个窗口进行检测，因此可以快速排除非目标窗口，进一步提高检测速度。

进一步地，通过采用条件互信息准则构建蕨特征，相比于随机选择亮度比较特征来构建蕨特征，能够选择出鉴别性更好的特征组合，从而可以进一步提高人脸检测器的检测速度。

进一步地，通过对原始图像的多个不同尺度的图像分别进行人脸检测，能够获取多个尺度的候选窗口，一起进行后处理,可以进一步提高人脸检测的检测效果。

进一步地，通过对与所述待检测图像相邻的预设帧数的图像进行检测，并根据对所述待检测图像相邻的预设帧数的图像的人脸检测结果来获得最终的人脸检测结果，对当前帧和相邻数帧的检测结果进行加权平均，等价于对检测结果进行平滑滤波，能够消除检测结果抖动的情况,可以进一步提高人脸检测的检测效果。

附图说明

图1是本发明实施例中一种人脸检测器的训练方法流程图；

图2是本发明实施例中一种人脸检测方法流程图；

图3是本发明实施例中一种剔除嵌入第一检测图像的示意图；

图4为应用本发明实施例中人脸检测方法进行人脸检测的效果图；

图5为应用本发明实施例中一种人脸检测器的训练装置的结构示意图；

图6为应用本发明实施例中一种人脸检测装置的结构示意图。

具体实施方式

目前，基于SVM和HOG特征的人脸检测器，没有针对变形和多视角的处理机制，因此，对变形或是侧面视角的人脸目标的处理是它的弊端。此外HOG特征的复杂度较高，导致整个人脸检测速度较低，难以应用于低功耗的嵌入式设备。

基于DPM和HOG特征的人脸检测器，虽然适用于变形和多视角的目标，但同样由于HOG特征的复杂度较高，导致整个人脸检测速度较低，难以应用于低功耗的嵌入式设备。

基于CNN和Softmax分类器的目标检测器，虽然在现有的标准数据集(如：Visual Object Classes Challenge，ImageNet)上的检测结果好于其他方法，但该方案的操作近似“黑盒”，针对特定目标的检测，调整参数也需要耗费极大的人力，降低人脸检测速度。

基于自提升级联模型和哈尔特征的人脸检测器，虽然检测速度较高，但由于哈尔特征主要提取纹理信息，而非边缘轮廓信息，并且所检测的人脸特征的形式十分局限，因此该方案对非受限的人脸图像(如侧脸，复杂光照，模糊，遮挡等情况)，检测效果一般。

由上述内容可知，上述检测方案均难以兼顾检测速度及检测效果。

针对上述问题，本发明的实施例提供了一种人脸检测器的训练方法，所述方法通过提取训练样本的亮度比较特征，进而可以根据所述亮度比较特征获得对应的蕨特征，并利用所述蕨特征及贝叶斯定理得到第一分类器，利用所述亮度比较特征及最小化加权均方差准则得到P个决策树分类器，最后将所述P个决策树分类器级联形成所述第二分类器。通过提取所述亮度比较特征来获得的人脸检测器不仅可以提高检测速度，而且可以获得较好的检测效果，更适合应用于手机的用户终端。并且，采用利用所述蕨特征及贝叶斯定理得到的第一分类器进行检测时，可以同时对多个窗口进行检测，因此可以快速排除非目标窗口，进一步提高检测速度。

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例作详细的说明。

如图1所示，本发明实施例提供了一种人脸检测器的训练方法。其中，所述人脸检测器包括第一分类器及第二分类器。

具体地，所述方法如下步骤：

步骤11，采集人脸和非人脸图像作为训练样本集。

在具体实施中，所述训练样本集中既有包括人脸的图像，也有不包括人脸的图像。将所述包括人脸的图像样本称之为正样本，对应的类别标签q的值可以设置为“0”，将所述不包括人脸的图像样本称之为负样本，对应的类别标签q的值可以设置为“1”。当然，也可以将正样本对应的类别标签q的值设置为“1”，将负样本对应的类别标签q的值设置为“0”，只要能通过数值将正样本及负样本进行标识即可。

在具体实施中，可以通过多种方式采集训练样本，所采集到的每一图像为一训练样本。其中，比如，可以直接从公开的人脸数据集中获取K个图像，也可以通过照相机等图像采集设备实时采集K个图像，具体采集方式不作限定。可以理解的是，所采集到的图像中，所述包括人脸的图像与不包括人脸的图像的数量可以由本领域人员根据实际情况设置，所述包括人脸的图像应尽可能具有多种不同的姿态，以提高根据所述训练样本获得的人脸检测器泛化能力。

步骤12，提取所述训练样本集中各个训练样本的亮度比较特征。

在具体实施中，以所述训练样本集中一训练样本为I为例，通过公式(1)，可以从训练样本I中提取亮度比较特征：

其中，p₁及p₂分别为从训练样本I上随机选择的两像素点；I(p₁)及I(p₂)分别像素点p₁，p₂的像素值，f(I；p₁，p₂)为根据像素点p₁及p₂所获得的亮度比较特征。

通过公式(1)可以看出，亮度比较特征是在图像上随机选择两像素点进行比较，属于弱特征，不仅容易提取，而且与人脸图像具体情况无关，也就是与人脸图像是否为具有正脸、侧脸、复杂光照，模糊，遮挡等情况的图像无关。

步骤13，根据所述亮度比较特征获得对应的蕨特征。

在具体实施中，可以采用自助法在从训练样本I中提取的所有亮度比较特征中一次选取n个亮度比较特征。在构建第j个蕨特征时，可以采用条件互信息准则进行构建。具体地，若所述第j个蕨特征由M个亮度比较特征组成，可以先通过公式(2)从训练样本I中提取的n个亮度比较特征中，选取一亮度比较特征f₁，再通过公式(3)从剩余的亮度比较特征中选取所述第j个蕨特征的其他亮度比较特征f_m：

f₁＝arg max_n(H(q)-H(q|f_n)) (2)

其中，H(q)是类别标签q的熵；f_l及f_n分别为通过构建所述第j个蕨特征时，第l次及第n次选取的特征；H(q|f_n)是亮度比较特征f_n已知时的条件熵；H(q；f_n|f_l)是f_l已知时类别标签q和亮度比较特征f_n的条件互信息。

在具体实施中，H(q；f_n|f_l)可以通过公式(4)计算获得：

H(q；f_n|f_l)＝H(q|f_l)-H(q|f_n,f_l) (4)

其中，q是亮度比较特征f_l及f_n对应的样本的类别标签；H(q|f_l)是f_l已知时的条件熵，H(q|f_n,f_l)是f_l及f_n均已知时的条件熵。

步骤14，利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器。

在具体实施中，设所述蕨特征之间相互独立，根据贝叶斯定理可以推导出公式(5)，即根据贝叶斯定理构建第一分类器：

其中，F_j是所述训练样本集中第k个训练样本的第j个蕨特征，C_q是第q个类别，P(F_m|C＝C_q)是第k个训练样本的类别为C_q时，第j个蕨特征的似然度，J为第k个训练样本的蕨特征的总数，为第一分类器对第k个训练样本的分类结果。k为正整数。所述第k个训练样本为所述训练样本集中任一训练样本。

通过所述第一分类器，可以同时对训练样本集中的各个训练样本属于正样本还是负样本进行分类，进而再由所述第二分类器对正样本中的人脸图像进行检测。

步骤15，利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数。

本发明的实施例中，以所述决策树为回归树为例，通常采用递归的方式来选择亮度比较特征，并利用所述亮度比较特征及最小化加权均方差准则构建树结构。

具体地，先对已获得的p-1个决策树分类器误分类的训练样本的权重进行更新，1≤p≤P，并根据更新后的训练样本的权重，进行第p轮的训练，获得第p个决策树分类器。

其中，在构建第p个决策树分类器时，先从待划分的训练样本的亮度比较特征集合中有放回的选取若干的亮度比较特征，进而根据所选取的部分亮度比较特征对所述待划分的训练样本进行分类，从而根据更新后的各训练样本的权重，按照公式(6)计算对所述训练样本集中各训练样本进行分类时的加权均方差WMSE，选择WMSE最小对应的亮度比较特征作为所述第p个决策树的划分节点，将所述待划分的训练样本划分到左子树(Left Sub-tree)或右子树(Right Sub-tree)。

以上步骤将递归进行，即不断选择各子树中新的亮度比较特征作为划分节点，对划分进左子树和右子树的样本继续划分，直至达到决策树的最大深度D为止。当达到决策树的最大深度D时，所述训练样本集中各个训练样本被划分到对应的叶子节点。其中，当所述划分节点为根节点时，所述待划分的训练样本可以为训练样本集中的全部训练样本，当所述划分节点为其他节点时，所述待划分的训练样本可以为训练样本集中的部分训练样本。

其中，BC_q指选择某一亮度比较特征对待划分的训练样本进行二值分类(Binary Classification)后，被分类为类别标签q的训练样本；S_k,l_k,w_k分别是第k个训练样本的数据、加权真实值、权重；是所述训练样本集中类别标签为q的所有训练样本的加权真实值。

在具体实施中，可以通过公式(7)计算

第p个决策树构建完成后，各个训练样本均会被划分到对应的叶子节点(Leaf Node，LN)中，对应叶子节点的数值即为所述第p个决策树分类器对该训练样本的输出值。以所述第p个决策树包括X个叶子节点，所述第k个训练样本被划分为第p个决策树的第x个叶子节点LN_x为例，x∈[0,X]可以通过公式(8)获得所述第p个决策树分类器对第k个训练样本的输出值，即第x个叶子节点的数值LNS_x：

在具体实施中，可以采用公式(9)对第k个训练样本的权重w_k进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k)) (9)

其中，T_p(S_k)是第p个决策树分类器在所述第k个训练样本的数据为S_k时，对所述第k个训练样本的输出值；w_k、l_k分别是所述第k个训练样本的权重、真实值；w_k’为对所述第k个训练样本的权重w_k更新后的权重。T_p(S_k)的数值符号代表所述第p个决策树分类器对该样本的分类结果，T_p(S_k)的绝对值代表置信度。

步骤16，将所述P个决策树分类器级联形成所述第二分类器。

在具体实施中，可以按照公式(7)将所述P个决策树分类器进行级联，得到所述第二分类器：

步骤17，将包含所述第一分类器及第二分类器的检测器作为所述人脸检测器。

由上述内容可知，通过提取亮度比较特征，进而可以根据所提取的亮度比较特征生成蕨特征，从而可以根据所述亮度比较特征生成第一分类器，根据所述蕨特征生成第二分类器，通过所述第一分类器及第二分类器对人脸进行检测，不仅可以提高检测速度，而且可以获得较好的检测效果。

如图2所示，本发明实施例还提供了一种人脸检测方法，所述方法应用上述人脸检测器训练方法获得的人脸检测器进行人脸检测。具体地，所述人脸检测方法可以包括如下步骤：

步骤21，遍历待检测图像，获得待检测子图像集，所述待检测子图像集中每一待检测子图像对应一窗口。

在具体实施中，可以采用滑动窗口的方式遍历所述待检测图像，每一待检测子图像即为一窗口。其中，窗口的大小可以由本领域人员根据实际情况进行设置。

步骤22，将各所述待检测子图像依次带入所述第一分类器及第二分类器中进行人脸检测，将通过所述第一分类器及第二分类器的待检测子图像判定为所述待检测图像的人脸检测结果。

在具体实施中，所述第一分类器及第二分类器的原理可以参照上述对人脸检测器训练方法的描述。将各待检测子图像先带入所述第一分类器，由所述第一分类器进行初步检测后，再将通过第一分类器的待检测子图像带入所述第二分类器进行检测，通过所述第二分类器检测的待检测子图像为所述人脸检测的检测结果。

其中，所述第一分类器在检测所述待检测子图像时，可以同时对多个待检测子图像进行检测。对于每个待检测子图像，所述第一分类器可以提取对应的蕨特征，再分别计算出各蕨特征在不同类别时的似然度，并将每一蕨特征的最大似然度对应的类别标签值作为该蕨特征的类别标签。由此可以获得各蕨特征的类别标签，最终确定各待检测子图像的类别，区分所述待检测子图像为人脸图像还是非人脸图像。

所述第二分类器在检测相应的待检测子图像时，先将各待检测子图像依次分别输入至P个决策树分类器，获得各决策树分类器对该待检测子图像的输出值，从而可以计算出对所述待检测子图像的各决策树分类器的输出值级联后的值，获得所述第二分类器对该待检测子图像的分类结果。

步骤23，将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像。

在具体实施中，将通过所述第一分类器及第二分类器的待检测子图像作为第一待检测子图像，所述第一待检测子图像的数量为多个。得到所述第一待检测子图像后，按照公式(11)，使用深度优先搜索的方法，在所有第一待检测子图像中搜索所有相连接的第一待检测子图像，也就是搜索所有相连接的窗口。

以W₁、W₂为任意两个第一待检测子图像为例，当W₁、W₂满足公式(11)时，W₁、W₂为相互连接的第一待检测子图像：

其中，R₁为预设的第一重叠率阈值，可以由本领域人员设定。

此时，可能存在多个聚类，每个聚类中的所述第一待检测子图像均相互连接。之后，对每个聚类中的所有第一待检测子图像进行平均操作，生成一新的第一待检测子图像。新生成的第一待检测子图像与各聚类一一对应。也就是说，新生成的第一待检测子图像的数量与聚类的数量相同。每个聚类均生成新的第一待检测子图像后，在所有所述新的第一待检测子图像中，剔除嵌入第一待检测子图像，将剩余的所述新的第一待检测子图像进行合并，也就是在所有新的窗口中，剔除嵌入窗口，将剩余的新的窗口进行合并，得到所述待检测图像的人脸图像。

如图3所示，第一待检测子图像31，32及33均为所述新的第一待检测子图像，其中，第一待检测子图像31被完全包含在第一待检测子图像33中，第一待检测子图像32被部分包含在第一待检测子图像33中。第一待检测子图像31及32均为嵌入第一待检测子图像，应剔除。

在具体实施中，以W₁、W₂为任意两个所述新的第一待检测子图像为例，当W₁、W₂满足公式(11)时，W₂为嵌入W₁的第一待检测子图像，当W₁、W₂满足公式(12)时，W₁为嵌入W₂的第一待检测子图像：

其中，R₂预设的第二重叠率阈值，可以由本领域人员设定。

步骤24，输出所述待检测图像中所述人脸图像的位置。

即使用矩形框等标注方式在所述待检测图像中标注所得到的人脸图像的位置。

在具体实施中，为了获得更好的检测效果，可以先对原始图像进行降采样处理，获得多个不同尺度的图像，再将所述多个不同尺度的图像分别作为所述待检测图像，分别对每个待检测图像执行步骤21及22，获得各待检测图像的人脸检测结果。之后，分别将所述各待检测图像的人脸检测结果进行升采样处理后再进行聚类，得到所述待检测图像的人脸图像。

在具体实施中，为了获得稳定的待检测的视频流，以达到更好的检测效果，可以分别对所述待检测图像，以及与所述待检测图像相邻的预设帧数的图像进行步骤21-23的人脸检测。在将所述判定为待检测图像的人脸检测结果进行聚类后，再分别对与所述待检测图像相邻的预设帧数的图像的人脸检测结果进行聚类，按照公式(14)对每一帧图像聚类后的结果进行加权处理，并将加权处理后的结果作为所述待检测图像中的人脸图像。其中，所述预设帧数可以由本领域人员设定。

其中，DR_t是第t帧图像的检测结果，α_t是第t帧图像对应的权重，T是参与人脸检测的图像的帧数。

图4(a)-(g)为应用本发明实施例中所述人脸检测方法获得的检测效果图。其中，图4(a)-(g)中矩形框内的图像即为应用所述人脸检测方法所检测到的人脸图像。从图4(a)-(g)的人脸检测效果图可以看出，本发明实施例中的人脸检测方法可以检测受限的人脸图像，也可以检测非受限的人脸图像。也就是说，本发明实施例中的人脸检测方法可以检测正向人脸图像，也可以检测侧脸，复杂光照，模糊，遮挡等情况的人脸图像。

为了使本领域技术人员更好地理解和实现本发明，以下分别对上述方法对应的装置进行详细描述。

如图5所示，本发明实施例提供一种人脸检测器的训练装置，所述人脸检测器包括第一分类器及第二分类器。所述装置可以包括：采集单元51，第一特征提取单元52，第二特征提取单元53，第一训练单元54，第二训练单元55以及级联单元56。其中：

所述采集单元51，适于采集人脸和非人脸图像作为训练样本集。所述第一特征提取单元52，适于提取所述训练样本集中各个训练样本的亮度比较特征。所述第二特征提取单元53，适于根据所述亮度比较特征获得对应的蕨特征。所述第一训练单元54，适于利用所述蕨特征及贝叶斯定理进行训练，得到所述第一分类器。所述第二训练单元55，适于利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，P≥1，且P为整数。所述级联单元56，适于将所述P个决策树分类器级联形成所述第二分类器。

在具体实施中，所述第一训练单元54训练得到所述第一分类器分类方法如下：

在具体实施中，所述决策树为回归树。相应地，所述第二训练单元55包括：更新子单元551及训练子单元552。其中：所述更新子单元551，适于对已获得的p-1个决策树分类器误分类的训练样本的权重进行更新，1≤p≤P。所述训练子单元552，适于根据更新后的训练样本的权重，进行第p轮的训练，获得第p个决策树分类器。

进一步地，所述训练子单元552包括：提取模块5521，分类模块5522及训练模块5523。所述提取模块5521，适于从待划分的训练样本的亮度比较特征集合中选取部分亮度比较特征。所述分类模块5522，适于根据所选取的所述部分亮度比较特征对所述待划分的训练样本进行分类。所述训练模块5523，适于根据更新后的所述训练样本集中各训练样本的权重，采用最小化加权均方差准则训练所述第p个决策树的划分节点，直至达到所述第p个决策树的最大深度。

在具体实施中，所述更新子单元551适于采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))

在具体实施中，所述级联单元56得到所述第二分类器的方法如下：

在具体实施中，所述第二特征提取单元53适于根据条件互信息准则，从每个训练样本的亮度比较特征中选取部分亮度比较特征，并将所选取的部分亮度比较特征作为第j个蕨特征，其中，j为正整数。

如图6所示，本发明实施例还提供了一种人脸检测装置，所述装置包括：遍历单元61，检测单元62，第一聚类处理单元63以及输出单元64。其中：

所述遍历单元61，适于遍历待检测图像，获得待检测子图像集，所述待检测子图像集中每一待检测子图像对应一窗口。所述检测单元62，适于采用上述人脸检测器训练装置训练得到的人脸检测器，对所述待检测子图像进行检测，得到所述待检测图像的人脸图像。所述输出单元64，适于输出所述待检测图像中所述人脸图像的位置。

在具体实施中，所述装置还包括：降采样处理单元(未示出)以及升采样处理单元(未示出)。其中，所述降采样处理单元，适于对原始图像进行降采样处理后获得多个不同尺度的图像，将所述多个不同尺度的图像分别作为所述待检测图像。所述升采样处理单元，适于分别将各待检测图像的人脸检测结果进行升采样处理后再进行聚类。

在具体实施中，所述装置还包括：第二聚类处理单元(未示出)及加权处理单元(未示出)。其中，所述第二聚类处理单元，适于在将所述判定为待检测图像的人脸检测结果进行聚类后，分别对与所述待检测图像相邻的预设帧数的图像的人脸检测结果进行聚类。所述加权处理单元，适于对每一帧图像聚类后的结果进行加权处理，并将加权处理后的结果作为所述待检测图像中的人脸图像。

在具体实施中，所述第一聚类处理单元63可以包括：搜索子单元631，生成子单元632，以及处理子单元633。其中，

所述搜索子单元631，适于在通过所述第一分类器及第二分类器的待检测子图像中，搜索所有相连接的待检测子图像，将相连接的待检测子图像作为一个聚类。所述生成子单元632，适于对每个聚类中的所有待检测子图像进行平均操作，生成新的待检测子图像。所述处理子单元633，适于在所有所述新的待检测子图像中，剔除嵌入待检测子图像，将剩余的所述新的待检测子图像进行合并，得到所述待检测图像的人脸图像。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：ROM、RAM、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种人脸检测器的训练方法，其特征在于，所述人脸检测器包括第一分类器及第二分类器，所述方法包括：

采集人脸和非人脸图像作为训练样本集；

提取所述训练样本集中各个训练样本的亮度比较特征；

根据所述亮度比较特征获得对应的蕨特征；

将所述P个决策树分类器级联形成所述第二分类器。

2.如权利要求1所述的人脸检测器的训练方法，其特征在于，所述第一分类器分类方法如下：

\hat{C_{q}} = \arg \max_{\hat{C_{q}}} Π_{j}^{J} P (F_{j} | C = C_{q});

3.如权利要求1所述的人脸检测器的训练方法，其特征在于，所述决策树为回归树。

4.如权利要求3所述的人脸检测器的训练方法，其特征在于，所述利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，包括：

5.如权利要求4所述的人脸检测器的训练方法，其特征在于，采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

6.权利要求3所述的人脸检测器的训练方法，其特征在于，所述第二分类器的分类方法如下：

H (S) = s i g n [Σ_{p = 1}^{P} α_{P} T_{P} (S)];

7.如权利要求1所述的人脸检测器的训练方法，其特征在于，所述根据所述亮度比较特征获得对应的蕨特征，包括：

8.一种人脸检测方法，其特征在于，包括：

将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像；

输出所述待检测图像中所述人脸图像的位置。

9.如权利要求8所述的人脸检测方法，其特征在于，所述第一分类器分类方法如下：

\hat{C_{q}} = \arg \max_{\hat{C_{q}}} Π_{m}^{M - 1} P (F_{m} | C = C_{q});

10.如权利要求8所述的人脸检测方法，其特征在于，所述决策树为回归树。

11.如权利要求10所述的人脸检测方法，其特征在于，所述利用所述亮度比较特征及最小化加权均方差准则进行P轮训练，得到P个决策树分类器，包括：

12.如权利要求11所述的人脸检测方法，其特征在于，采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

13.权利要求10所述的人脸检测方法，其特征在于，所述第二分类器的分类方法如下：

H (S) = s i g n [Σ_{p = 1}^{p} α_{p} T_{p} (S)];

14.如权利要求8所述的人脸检测方法，其特征在于，所述根据所述亮度比较特征获得对应的蕨特征，包括：

15.如权利要求8所述的人脸检测方法，其特征在于，还包括：

16.如权利要求8所述的人脸检测方法，其特征在于，在所述将所述判定为待检测图像的人脸检测结果进行聚类后，还包括：

17.如权利要求8-16任一项所述的人脸检测方法，其特征在于，所述将所述判定为待检测图像的人脸检测结果进行聚类，得到所述待检测图像的人脸图像，包括：

18.一种人脸检测器的训练装置，其特征在于，所述人脸检测器包括第一分类器及第二分类器，所述装置包括：

采集单元，适于采集人脸和非人脸图像作为训练样本集；

19.如权利要求18所述的人脸检测器的训练装置，其特征在于，所述第一训练单元训练得到所述第一分类器分类方法如下：

\hat{C_{q}} = \arg \max_{\hat{C_{q}}} Π_{j}^{J} P (F_{j} | C = C_{q});

20.如权利要求18所述的人脸检测器的训练装置，其特征在于，所述决策树为回归树。

21.如权利要求20所述的人脸检测器的训练装置，其特征在于，所述第二训练单元包括：更新子单元及训练子单元；其中：

22.如权利要求21所述的人脸检测器的训练装置，其特征在于，所述更新子单元适于采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_k))；

23.如权利要求20所述的人脸检测器的训练装置，其特征在于，所述级联单元得到所述第二分类器的方法如下：

H (S) = s i g n [Σ_{p = 1}^{P} α_{p} T_{p} (S)];

24.如权利要求19所述的人脸检测器的训练装置，其特征在于，所述第二特征提取单元适于根据条件互信息准则，从每个训练样本的亮度比较特征中选取部分亮度比较特征，并将所选取的部分亮度比较特征作为第j个蕨特征，其中，j为正整数。

25.一种人脸检测装置，其特征在于，包括：

26.如权利要求25所述的人脸检测装置，其特征在于，所述第一训练单元训练得到所述第一分类器分类方法如下：

\hat{C_{q}} = \arg \max_{\hat{C_{q}}} Π_{m}^{M - 1} P (F_{m} | C = C_{q});

27.如权利要求25所述的人脸检测装置，其特征在于，所述决策树为回归树。

28.如权利要求27所述的人脸检测装置，其特征在于，所述第二训练单元包括：更新子单元及训练子单元；其中：

29.如权利要求28所述的人脸检测装置，其特征在于，所述更新子单元适于采用如下公式对第k个训练样本的权重进行更新：

w_k’＝w_k·exp(-l_kT_p(S_K))；

30.如权利要求27所述的人脸检测装置，其特征在于，所述级联单元得到所述第二分类器的方法如下：

H (S) = s i g n [Σ_{p = 1}^{P} α_{p} T_{p} (S)];

31.如权利要求25所述的人脸检测装置，其特征在于，所述第二特征提取单元适于根据条件互信息准则，从每个训练样本的亮度比较特征中选取部分亮度比较特征，并将所选取的部分亮度比较特征作为第j个蕨特征，其中，j为正整数。

32.如权利要求25所述的人脸检测装置，其特征在于，还包括：

33.如权利要求25所述的人脸检测装置，其特征在于，还包括：

34.如权利要求25-33任一项所述的人脸检测装置，其特征在于，所述第一聚类处理单元包括：