CN107977636A

CN107977636A - 人脸检测方法及装置、终端、存储介质

Info

Publication number: CN107977636A
Application number: CN201711305306.8A
Authority: CN
Inventors: 万韶华
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2017-12-11
Filing date: 2017-12-11
Publication date: 2018-05-01
Anticipated expiration: 2037-12-11
Also published as: CN107977636B

Abstract

本公开是关于一种人脸检测方法及装置、终端、存储介质，属于人脸检测领域。该方法包括：通过终端的立体摄像组件捕获人体的深度图像，深度图像包括多个像素点，多个像素点中的每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离；根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸；根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口；采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。本公开有助于解决人脸检测过程复杂，检测速度较慢的问题，简化人脸检测过程，提高检测速度。本公开用于人脸检测。

Description

人脸检测方法及装置、终端、存储介质

技术领域

本公开涉及人脸检测领域，特别涉及一种人脸检测方法及装置、终端、存储介质。

背景技术

随着终端全屏技术的兴起，指纹识别组件逐渐从终端的前面板中移出，人脸识别组件逐渐代替指纹识别组件，成为终端的重要身份验证组件。终端在基于人脸识别组件进行身份验证时，首先需要进行人脸检测。

相关技术中，人脸识别组件主要包括终端的前置摄像头，终端在进行人脸检测时，首先通过前置摄像头捕获人体图像，然后在人体图像的每个像素点，采用不同尺寸的检测窗口从人体图像中提取图像特征，根据提取到的图像特征判断检测窗口中是否存在人脸，以进行人脸检测。

在实现本公开的过程中，发明人发现相关技术至少存在以下问题：

相关技术需要在人体图像的每个像素点采用不同尺寸的检测窗口进行人脸检测，因此，人脸检测过程复杂，检测速度较慢。

发明内容

本公开提供了一种人脸检测方法及装置、终端、存储介质，可以解决人脸检测过程复杂，检测速度较慢的问题。本公开的技术方案如下：

根据本公开的第一方面，提供一种人脸检测方法，所述方法包括：

通过终端的立体摄像组件捕获人体的深度图像，所述深度图像包括多个像素点，所述多个像素点中的每个像素点的深度值表示所述每个像素点在人体上的对应位置点与所述立体摄像组件之间的距离；

根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸；

根据所述每个像素点在所述深度图像中的位置和所述每个像素点对应的窗口尺寸，确定所述每个像素点对应的检测窗口；

采用所述每个像素点对应的检测窗口，在所述深度图像中进行人脸检测。

可选地，所述检测窗口为正K边形窗口，所述K为大于或等于3的整数，所述窗口尺寸为所述检测窗口的边长，所述根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸，包括：根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸；

其中，所述尺寸确定公式为f＝ax²+bx+c，所述f表示所述窗口尺寸，所述x表示所述深度值，所述a、所述b和所述c均为常数。

可选地，所述方法还包括：

在根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸之前，获取窗口尺寸样本集，所述窗口尺寸样本集包括p个窗口尺寸和与所述p个窗口尺寸一一对应的p个深度值，所述p为大于或等于1的整数；

根据所述p个窗口尺寸和所述p个深度值，确定所述a、所述b和所述c的值。

可选地，所述采用所述每个像素点对应的检测窗口，在所述深度图像中进行人脸检测，包括：

将所述每个像素点对应的检测窗口在所述深度图像中的对应区域确定为所述每个像素点对应的检测区域；

从所述每个像素点对应的检测区域中，提取图像特征；

检测所述图像特征是否为人脸特征。

可选地，所述检测所述图像特征是否为人脸特征，包括：采用特征分离器检测所述图像特征是否为人脸特征；

其中，所述特征分类器是分类器生成装置以特征样本集作为训练数据，根据分类算法训练得到的用于确定图像特征是否为人脸特征的分类器，所述特征样本集中包括n个人脸特征样本和m个非人脸特征样本，所述n和所述m均为大于0的整数。

可选地，所述采用特征分离器检测所述图像特征是否为人脸特征，包括：

接收所述分类器生成装置发送的所述特征分类器；

将提取到的所述图像特征输入所述特征分类器，以通过所述特征分类器输出特征标签，所述特征标签用于指示所述图像特征的类别，所述图像特征的类别包括人脸特征或非人脸特征；

根据所述特征标签，确定所述图像特征是否为人脸特征。

可选地，所述根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸，包括：从所述多个像素点中确定至少一个检测像素点，根据所述至少一个检测像素点中的每个检测像素点的深度值，确定所述每个检测像素点对应的窗口尺寸；

所述根据所述每个像素点在所述深度图像中的位置和所述每个像素点对应的窗口尺寸，确定所述每个像素点对应的检测窗口，包括：根据所述每个检测像素点在所述深度图像中的位置和所述每个检测像素点对应的窗口尺寸，确定所述每个检测像素点对应的检测窗口；

所述采用所述每个像素点对应的检测窗口，在所述深度图像中进行人脸检测，包括：采用所述每个检测像素点对应的检测窗口，在所述深度图像中进行人脸检测。

可选地，所述方法还包括：

在通过终端的立体摄像组件捕获人体的深度图像之前，检测所述终端是否处于被握持状态；

当所述终端处于所述被握持状态时，开启所述终端的立体摄像组件。

上述所有可选技术方案，可以采用任意结合形成本公开的可选方案，在此不再一一赘述。

根据本公开的第二方面，提供一种人脸检测装置，所述装置包括：

捕获模块，被配置为通过终端的立体摄像组件捕获人体的深度图像，所述深度图像包括多个像素点，所述多个像素点中的每个像素点的深度值表示所述每个像素点在人体上的对应位置点与所述立体摄像组件之间的距离；

第一确定模块，被配置为根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸；

第二确定模块，被配置为根据所述每个像素点在所述深度图像中的位置和所述每个像素点对应的窗口尺寸，确定所述每个像素点对应的检测窗口；

第一检测模块，被配置为采用所述每个像素点对应的检测窗口，在所述深度图像中进行人脸检测。

可选地，所述检测窗口为正K边形窗口，所述K为大于或等于3的整数，所述窗口尺寸为所述检测窗口的边长，所述第一确定模块，被配置为根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸；

可选地，所述装置还包括：

获取模块，被配置为在根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸之前，获取窗口尺寸样本集，所述窗口尺寸样本集包括p个窗口尺寸和与所述p个窗口尺寸一一对应的p个深度值，所述p为大于或等于1的整数；

第三确定模块，被配置为根据所述p个窗口尺寸和所述p个深度值，确定所述a、所述b和所述c的值。

可选地，所述第一检测模块，包括：

确定子模块，被配置为将所述每个像素点对应的检测窗口在所述深度图像中的对应区域确定为所述每个像素点对应的检测区域；

提取子模块，被配置为从所述每个像素点对应的检测区域中，提取图像特征；

检测子模块，被配置为检测所述图像特征是否为人脸特征。

可选地，所述检测子模块，被配置为采用特征分离器检测所述图像特征是否为人脸特征；

可选地，所述检测子模块，被配置为：

接收所述分类器生成装置发送的所述特征分类器；

根据所述特征标签，确定所述图像特征是否为人脸特征。

可选地，所述第一确定模块，被配置为从所述多个像素点中确定至少一个检测像素点，根据所述至少一个检测像素点中的每个检测像素点的深度值，确定所述每个检测像素点对应的窗口尺寸；

所述第二确定模块，被配置为根据所述每个检测像素点在所述深度图像中的位置和所述每个检测像素点对应的窗口尺寸，确定所述每个检测像素点对应的检测窗口；

所述第一检测模块，被配置为采用所述每个检测像素点对应的检测窗口，在所述深度图像中进行人脸检测。

可选地，所述装置还包括：

第二检测模块，被配置为在通过终端的立体摄像组件捕获人体的深度图像之前，检测所述终端是否处于被握持状态；

开启模块，被配置为当所述终端处于所述被握持状态时，开启所述终端的立体摄像组件。

根据本公开的第三方面，提供一种终端，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为：

根据本公开的第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端的处理组件上运行时，使得所述处理组件执行第一方面或第一方面的任一可选方式所提供的人脸检测方法。

本公开提供的技术方案可以包括以下有益效果：

本公开提供的人脸检测方法及装置、终端、存储介质，由于可以根据每个像素点的深度值确定每个像素点对应的窗口尺寸，根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口，采用每个像素点对应的检测窗口，在深度图像中进行人脸检测，因此，无需在每个像素点采用不同尺寸的检测窗口进行人脸检测，有助于解决人脸检测过程复杂，检测速度较慢的问题，简化人脸检测过程，提高检测速度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

为了更清楚地说明本公开的实施例，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种人脸检测方法的方法流程图；

图2是根据另一示例性实施例示出的一种人脸检测方法的方法流程图；

图3是根据一示例性实施例示出的一种确定a、b和c的值的方法流程图；

图4是根据一示例性实施例示出的一种采用像素点对应的检测窗口在深度图像中进行人脸检测的方法流程图；

图5是根据一示例性实施例示出的一种检测区域的示意图；

图6是根据一示例性实施例示出的一种检测图像特征是否为人脸特征的方法流程图；

图7是根据一示例性实施例示出的一种人脸检测装置的框图；

图8是根据另一示例性实施例示出的一种人脸检测装置的框图；

图9是根据一示例性实施例示出的一种第一检测模块的框图；

图10是根据再一示例性实施例示出的一种人脸检测装置的框图；

图11是根据一示例性实施例示出的一种终端的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

终端的前置摄像头通常为RGB摄像头，基于终端的前置摄像头的人脸识别组件已经在各个旗舰终端(例如手机)得到应用，但是从效果上来看，基于前置摄像头的人脸识别组件，在对抗光线变化、人脸假体(例如从照片中进行人脸识别)时的效果较差。本公开实施例提供的人脸检测方法，采用基于结构光的3D摄像头进行人脸检测，能够在暗光、无光等复杂环境下获取人体的深度图像，且获取到的深度图像不受人脸妆容的影响，能够极大增强人脸检测算法的可靠性。本公开实施例提供的人脸检测方法的详细描述请参考下述实施例。

本公开实施例提供的人脸检测方法可以由终端执行，该终端可以是智能手机、平板电脑、智能电视、智能手表、车载终端、智能可穿戴式设备、动态影像专家压缩标准音频层面5(英文：Moving Picture Experts Group Audio Layer V；简称：MP5)播放器、膝上型便携计算机或台式计算机等等。

在执行本公开实施例提供的人脸检测方法的过程中，终端还可以从服务器上获取相关数据，例如，获取尺寸确定公式、获取特征分类器等。当然，尺寸确定公式和特征分类器也可以由终端自身存储，且可以是终端出厂时配置的，也可以是终端通过机器学习算法确定的。其中，服务器可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心。终端与服务器可以通过有线网络或无线网络连接，该有线网络例如但不限于，通用串行总线(英文：Universal Serial Bus；简称：USB)，无线网络例如但不限于：无线保真(英文：Wireless Fidelity；简称：WIFI)、蓝牙、红外、紫蜂(英文：Zigbee)、数据等。

图1是根据一示例性实施例示出的一种人脸检测方法的方法流程图，该人脸检测的方法可以由终端执行，且该人脸检测方法可以简化人脸检测过程，提高检测速度。参见图1，该人脸检测方法包括：

在步骤101中，通过终端的立体摄像组件捕获人体的深度图像，深度图像包括多个像素点，多个像素点中的每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离。

在步骤102中，根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸。

在步骤103中，根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口。

在步骤104中，采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。

综上所述，本公开实施例提供的人脸检测方法，由于可以根据每个像素点的深度值确定每个像素点对应的窗口尺寸，根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口，采用每个像素点对应的检测窗口，在深度图像中进行人脸检测，因此，无需在每个像素点采用不同尺寸的检测窗口进行人脸检测，有助于解决人脸检测过程复杂，检测速度较慢的问题，简化人脸检测过程，提高检测速度。

图2是根据另一示例性实施例示出的一种人脸检测方法的方法流程图，该人脸检测的方法可以由终端执行，且该人脸检测方法可以简化人脸检测过程，提高检测速度。参见图2，该人脸检测方法包括：

在步骤201中，检测终端是否处于被握持状态。

在本公开实施例中，用户可以抓握终端使终端处于被握持状态，从而终端检测终端是否处于被握持状态也即是检测终端是否被用户抓握。可选地，终端上可以设置有触摸感应组件，该触摸感应组件通过检测触摸信号来检测终端是否被用户抓握，当触摸感应组件检测到触摸信号时，终端确定终端被用户抓握，从而确定终端处于被握持状态，当触摸感应组件未检测到触摸信号时，终端确定终端未被用户抓握，从而确定终端未处于被握持状态。其中，触摸感应组件可以包括触摸屏和触摸传感器中的至少一种，触摸传感器可以设置在终端的外壳上，用于检测触摸信号。

可选地，处于被握持状态和未处于被握持状态时，终端的姿态通常是不同的，终端中可以设置姿态感应组件，该姿态感应组件可以获取终端的姿态，终端可以根据姿态感应组件获取的终端的姿态，确定终端是否处于被握持状态。其中，姿态感应组件可以包括加速度传感器、陀螺仪传感器和重力传感器中的至少一种，该姿态感应组件获取终端的姿态的过程可以参考相关技术，本公开实施例在此不再赘述。

需要说明的是，该步骤201所提供的检测终端是否处于被握持状态的方案仅仅是示例性的，实际应用中，还可以采用其他方案检测终端是否处于被握持状态，本公开实施例旨在检测终端是否处于被握持状态，对于采用何种方案检测终端是否处于被握持状态，本公开实施例并不限定。

在步骤202中，当终端处于被握持状态时，开启终端的立体摄像组件。

若在步骤202中终端确定终端处于被握持状态，则终端可以开启终端的立体摄像组件。在本公开实施例中，该立体摄像组件为3D摄像头，且3D摄像头可以为基于结构光的3D摄像头。基于结构光的3D摄像头在捕获图像时，能够克服暗光、无光等复杂环境的影响，且不受人脸妆容的影响，提高获取的图像的真实性，从而提高人脸检测算法的可靠性。

需要说明的是，本公开实施例是以立体摄像组件为基于结构光的3D摄像头为例进行说明的，实际应用中，立体摄像组件还可以为双目摄像机等摄像组件，双目摄像机通常包括两个处于不同位置的摄像头，由于该两个摄像头的位置不同，因此双目摄像机可以在同一时刻从不同视角进行图像捕获，从而得到两个不同视角的图像。

还需要说明的是，当终端处于被握持状态时，本公开实施例认为用户需要进行人脸检测，从而终端开启终端的立体摄像组件，本领域技术人员应当明白，当终端未处于被握持状态时，用户可能也需要进行人脸检测，从而当终端未处于被握持状态时，终端也可以开启终端的立体摄像组件，当然，当终端未处于被握持状态时，终端也可以不开启立体摄像组件，本公开实施例对此不作限定。此外，该步骤201至步骤202为用户需要进行人脸检测的可选步骤，实际应用中，终端在进行人脸检测时，可以不执行该步骤201至步骤202，直接从下述步骤203开始执行。

在步骤203中，通过终端的立体摄像组件捕获人体的深度图像，深度图像包括多个像素点，多个像素点中的每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离。

终端可以通过终端的立体摄像组件捕获人体的图像，该人体的图像也即是人体的深度图像，该深度图像可以包括多个像素点，多个像素点中的每个像素点具有深度值。在本公开实施例中，深度图像中的每个像素点可以为三维坐标系中的点，从而深度图像可以采用三维坐标中的点集来表示，三维坐标系的两个坐标轴可以位于深度图像所在平面内，另一个坐标轴可以与深度图像所在平面垂直，每个像素点的深度值可以为该与深度图像所在平面垂直的坐标轴上的数值，每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离，换句话来讲，每个像素点的深度值表示在捕获该深度图像时，每个像素点在人体上的对应位置点与立体摄像组件之间的距离。

可选地，当立体摄像组件为3D摄像头时，采用3D摄像头直接对人体进行拍摄，就可以得到人体的深度图像。当立体摄像组件为双目摄像机时，双目摄像机的两个摄像头可以在同一时刻从不同视角对人体进行拍摄，得到不同视角的人体图像，终端可以对不同视角的人体图像进行合成得到人体的深度图像。当然，根据立体摄像组件的不同，终端还可以采用其他方式获取人体的深度图像，本公开实施例在此不再赘述。

在步骤204中，根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸。

其中，每个像素点对应的窗口尺寸也即是每个像素点对应的检测窗口的尺寸。在本公开实施例中，检测窗口可以为正K边形窗口，K为大于或等于3的整数，窗口尺寸可以为检测窗口的边长。可选地，检测窗口可以为正方形窗口。

可选地，根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸可以包括：根据每个像素点的深度值，采用尺寸确定公式确定每个像素点对应的窗口尺寸。其中，尺寸确定公式可以为f＝ax²+bx+c，f表示窗口尺寸，x表示深度值，a、b和c均为常数。终端可以将每个像素点的深度值x代入上述尺寸确定公式计算得到每个像素点对应的窗口尺寸。

需要说明的是，在采用尺寸确定公式确定每个像素点对应的窗口尺寸之前，终端可以先确定上述尺寸确定公式中a、b和c的取值。可选地，终端可以采用线性回归算法确定a、b和c的取值。示例地，图3是根据一示例性实施例示出的一种确定a、b和c的值的方法流程图，参见图3，该方法包括：

在子步骤2041中，获取窗口尺寸样本集，窗口尺寸样本集包括p个窗口尺寸和与p个窗口尺寸一一对应的p个深度值，p为大于或等于1的整数。

可选地，终端可以在至少一个样本人脸图像中确定p个样本像素点，在每个样本像素点采用不同窗口尺寸的检测窗口进行人脸检测，将检测到人脸时的窗口尺寸确定为该每个样本像素点对应的窗口尺寸，并根据该每个样本像素点的深度值和该每个样本像素点对应的窗口尺寸，确定一组样本参数，得到p组样本参数，从而得到窗口尺寸样本集。或者，终端可以根据以往进行人脸检测时，在人脸图像的每个像素点检测到人脸时的窗口尺寸以及每个像素点的深度值，确定一组样本参数，得到p组样本参数，从而得到窗口尺寸样本集。或者，终端可以直接从服务器获取窗口尺寸样本集，本公开实施例对此不作限定。

在本公开实施例中，每组样本参数包括一个深度值x和与该深度值x对应的一个窗口尺寸f，窗口尺寸样本集可以为：(x₁，f₁)，(x₂，f₂)，(x₃，f₃)....，(x_p，f_p)，x₁与f₁对应，x₂与f₂对应，x₃与f₃对应，依次类推，x_p与f_p对应。

在子步骤2042中，根据p个窗口尺寸和p个深度值，确定a、b和c的值。

可选地，终端可以以a、b和c作为未知数，将p组样本参数代入公式f＝ax²+bx+c得到p个方程，根据该p个方程计算得到a、b和c的值。示例地，该p个方程可以如下：

终端对上述p个方程进行求解，可以得到a、b和c的取值。示例地，终端对上述p个方程进行求解，可以得到a＝2.135×10^-3，b＝0.3326，c＝32.345。

需要说明的是，本公开实施例是以终端采用线性回归算法确定a、b和c的取值为例进行说明的，实际应用中，终端还可以采用其他算法确定a、b和c的取值。此外，终端还可以直接从服务器获取包含a、b和c的取值的尺寸确定公式，从而，无需终端确定a、b和c的取值，本公开实施例对此不作限定。

还需要说明的是，本公开实施例是以终端确定多个像素点中的每个像素点对应的窗口尺寸为例进行说明的，实际应用中，终端可以从多个像素点中确定至少一个检测像素点，并根据至少一个检测像素点中的每个检测像素点的深度值确定每个检测像素点对应的窗口尺寸，不难理解，相比于确定每个像素点对应的窗口尺寸，从多个像素点中确定至少一个检测像素点，并确定每个检测像素点对应的窗口尺寸可以减小确定窗口尺寸的计算量，提高人脸检测速度。

在步骤205中，根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口。

终端确定每个像素点对应的窗口尺寸之后，可以根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口，其中，每个像素点在深度图像中的位置可以为每个像素点对应的检测窗口的中心点所在位置(也即是像素点可以为相应的检测窗口的中心点)。在本公开实施例中，检测窗口可以为正K边形窗口，正K边形的所有对角线交于一点，正K边形的对角线的交点即为正K边形的中心点，因此检测窗口的中心点可以为检测窗口的对角线的交点。可选地，当检测窗口为正方形窗口时，检测窗口的中心点为该正方形窗口的两条对角线的交点。

需要说明的是，实际应用中，终端可以根据步骤204中确定的每个检测像素点在深度图像中的位置和该每个检测像素点对应的窗口尺寸，确定每个检测像素点对应的检测窗口，以减小确定检测窗口的计算量，提高人脸检测速度。

在步骤206中，采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。

终端确定每个像素点对应的检测窗口后，可以采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。可选地，图4是根据一示例性实施例示出的一种终端采用每个像素点对应的检测窗口在深度图像中进行人脸检测的方法流程图，参见图4，该方法包括：

在步骤2061中，将每个像素点对应的检测窗口在深度图像中的对应区域确定为每个像素点对应的检测区域。

终端可以将每个像素点对应的检测窗口在深度图像中的对应区域确定为每个像素点对应的检测区域。也即是，终端将每个像素点对应的检测窗口在深度图像中限定的区域确定为每个像素点对应的检测区域。示例地，图5是根据一示例性实施例示出的一种检测区域的示意图，该图5以检测窗口为正方形窗口为例进行说明，参见图5，深度图像S中的像素点E对应的检测窗口为检测窗口W，该像素点E位于检测窗口W的中心点所在位置，检测窗口W在深度图像S中的对应区域为区域G，该区域G可以为像素点E对应的检测区域，从而，对于图5所示的深度图像S，终端可以将区域G确定为像素点E对应的检测区域。

在步骤2062中，从每个像素点对应的检测区域中，提取图像特征。

终端确定每个像素点对应的检测区域后，可以采用特征提取算法从每个像素点对应的检测区域中提取图像特征。示例地，终端采用特征提取算法从图5所示的区域G中提取图像特征。其中，特征提取算法例如但不限于，局域二值模式(英文：local binarypattern；简称：LBP)算法、尺度不变特征变换(英文：Scale-invariant featuretransform；简称：SIFT)算法、梯度方向直方图(英文：Histograms of OrientedGradients；简称：HOG)算法和深度神经网络学习算法等。终端从采用特征提取算法从图像中提取图像特征的过程是本领域技术人员熟知的，本公开实施例在此不再赘述。

在步骤2063中，检测图像特征是否为人脸特征。

终端可以检测提取到的图像特征是否为人脸特征。其中，人脸特征可以包括但不限于鼻尖、鼻根、左眼角、右眼角、左嘴角、右嘴角、下巴中心点、左耳垂、右耳垂、左脸颊和右脸颊等。

可选地，终端采用特征分离器检测图像特征是否为人脸特征，该特征分离器可以为演算法(英文：Adaboost)分类器，该特征分离器可以是终端在出厂时就配置好的，也可以是终端从服务器获取的，还可以是终端通过机器学习算法训练得到的，本公开实施例不对特征分离器的来源做限定。

可选地，图6是根据一示例性实施例示出的一种采用特征分离器检测图像特征是否为人脸特征的方法流程图，参见图6，该方法包括：

在步骤20631中，接收分类器生成装置发送的特征分类器。

其中，特征分类器可以是分类器生成装置以特征样本集作为训练数据，根据分类算法训练得到的用于确定图像特征是否为人脸特征的分类器，特征样本集中包括n个人脸特征样本和m个非人脸特征样本，n和m均为大于0的整数。

可选地，分类器生成装置以特征样本集作为训练数据，根据分类算法训练得到特征分类器可以包括：分类器生成装置从多个样本图像中提取n个人脸特征样本和m个非人脸特征样本，将n个人脸特征样本和m个非人脸特征样本合并为特征样本集；以该特征样本集作为训练数据，根据分类算法训练得到特征分类器。在本公开实施例中，分类器生成装置可以为终端或者服务器中的一个处理组件，也可以是单独配置的台式计算机、笔记本计算机、服务器或服务器集群等。其中，样本图像用于分类器生成装置提取人脸特征样本和非人脸特征样本，且样本图像的数量越多，特征样本集的生成速度越快，进而特征分类器的生成速度也会越快。

分类器生成装置可以从样本图像中提取多个人脸特征样本和多个非人脸特征样本，该多个人脸特征样本中的任一人脸特征样本可以包括q个特征参数和用于指示该任一人脸特征样本的类别的标签，该任一人脸特征样本的类别为人脸特征，q为大于0的整数，该多个非人脸特征样本中的任一非人脸特征样本包括q个特征参数和用于指示该任一非人脸特征样本的类别的标签，该任一非人脸特征样本的类别为非人脸特征；分别对多个人脸特征样本和多个非人脸特征样本进行格式校验处理和缺失值补全处理，得到n个人脸特征样本和m个人脸特征样本。

需要说明的是，q个特征参数可以包括：鼻尖的参数、鼻根的参数、左眼角的参数、右眼角的参数、左嘴角的参数、右嘴角的参数、下巴中心点的参数、左耳垂的参数、右耳垂的参数、左脸颊的参数和右脸颊的参数等，q越大，生成的特征分类器的准确性越高。

在步骤20632中，将提取到的图像特征输入特征分类器，以通过特征分类器输出特征标签，特征标签用于指示图像特征的类别，图像特征的类别包括人脸特征或非人脸特征。

终端可以将提取到的图像特征输入特征分类器，该图像特征可以包括多个特征参数，特征分类器将该特征参数与分类器生成装置获取的任一人脸特征样本或任一非人脸特征样本的特征参数进行比较，得到该图像特征的特征标签，并输出该图像特征的特征标签，该特征标签用于指示图像特征的类别，根据该特征标签指示的图像特征的类别可以确定图像特征是否为人脸特征。

在步骤20633中，根据特征标签，确定图像特征是否为人脸特征。

终端可以根据特征分类器输出的特征标签，确定提取到的图像特征是否为人脸特征。在本公开实施例中，特征标签用于指示图像特征的类别，且图像特征的类别可以为人脸特征或非人脸特征，当子步骤20632中特征分类器输出的特征标签指示的图像特征的类别为人脸特征时，终端确定图像特征为人脸特征，当子步骤20632中特征分类器输出的特征标签指示的图像特征的类别为非人脸特征时，终端确定图像特征为非人脸特征。

需要说明的是，实际应用中，终端可以采用步骤205中确定的每个检测像素点对应的检测窗口，在深度图像中进行人脸检测，以提高人脸检测速度。此外，若终端确定提取到的图像特征为人脸特征，则终端确定检测到人脸，终端可以根据检测到的人脸进行人脸识别等，以对用户进行身份验证，该过程是本领域技术人员熟知的，本公开实施例在此不再赘述。

还需要说明的是，本发明实施例提供的人脸检测方法步骤的先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本发明的保护范围之内，因此不再赘述。

传统的人脸检测算法中，由于无法预测像素点对应的窗口尺寸，因此需要在人体图像的每个像素点所在位置采用不同尺寸的检测窗口进行人脸检测，检测过程复杂且速度较慢；本公开实施例提供的人脸检测方法，可以采用像素点的深度值预测像素点对应的窗口尺寸，在每个像素点仅需要采用一个检测窗口进行人脸检测，而无需在像素点所在位置采用不同尺寸的检测窗口进行人脸检测，因此检测过程简单且速度较快，相比于传统的人脸检测算法，本公开实施例提供的人脸检测方法可以将检测速度提升10倍左右。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参见本公开方法实施例。

图7是根据一示例性实施例示出的一种人脸检测装置700的框图，该人脸检测装置700可以通过软件、硬件或者两者的结合实现成为终端的部分或者全部。参见图7，该人脸检测装置700可以包括：

捕获模块710，被配置为通过终端的立体摄像组件捕获人体的深度图像，深度图像包括多个像素点，多个像素点中的每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离；

第一确定模块720，被配置为根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸；

第二确定模块730，被配置为根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口；

第一检测模块740，被配置为采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。

综上所述，本公开实施例提供的人脸检测装置，由于可以根据每个像素点的深度值确定每个像素点对应的窗口尺寸，根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口，采用每个像素点对应的检测窗口，在深度图像中进行人脸检测，因此，无需在每个像素点采用不同尺寸的检测窗口进行人脸检测，有助于解决人脸检测过程复杂，检测速度较慢的问题，简化人脸检测过程，提高检测速度。

可选地，检测窗口为正K边形窗口，K为大于或等于3的整数，窗口尺寸为检测窗口的边长，第一确定模块720，被配置为根据每个像素点的深度值，采用尺寸确定公式确定每个像素点对应的窗口尺寸；

其中，尺寸确定公式为：f＝ax²+bx+c，f表示窗口尺寸，x表示深度值，a、b和c均为常数。

进一步地，请参考图8，其示出了本公开实施例提供的另一种人脸检测装置700的框图，参见图8，在图7的基础上，该人脸检测装置700还包括：

获取模块750，被配置为在根据每个像素点的深度值，采用尺寸确定公式确定每个像素点对应的窗口尺寸之前，获取窗口尺寸样本集，窗口尺寸样本集包括p个窗口尺寸和与p个窗口尺寸一一对应的p个深度值，p为大于或等于1的整数；

第三确定模块760，被配置为根据p个窗口尺寸和p个深度值，确定a、b和c的值。

可选地，请参考图9，其示出了本公开实施例提供的一种第一检测模块740的框图，参见图9，该第一检测模块740包括：

确定子模块741，被配置为将每个像素点对应的检测窗口在深度图像中的对应区域确定为每个像素点对应的检测区域；

提取子模块742，被配置为从每个像素点对应的检测区域中，提取图像特征；

检测子模块743，被配置为检测图像特征是否为人脸特征。

可选地，检测子模块743，被配置为采用特征分离器检测图像特征是否为人脸特征；

其中，特征分类器是分类器生成装置以特征样本集作为训练数据，根据分类算法训练得到的用于确定图像特征是否为人脸特征的分类器，特征样本集中包括n个人脸特征样本和m个非人脸特征样本，n和m均为大于0的整数。

可选地，检测子模块743，被配置为：

接收分类器生成装置发送的特征分类器；

将提取到的图像特征输入特征分类器，以通过特征分类器输出特征标签，特征标签用于指示图像特征的类别，图像特征的类别包括人脸特征或非人脸特征；

根据特征标签，确定图像特征是否为人脸特征。

可选地，第一确定模块720，被配置为从多个像素点中确定至少一个检测像素点；根据至少一个检测像素点中的每个检测像素点的深度值，确定每个检测像素点对应的窗口尺寸；

第二确定模块730，被配置为根据每个检测像素点在深度图像中的位置和每个检测像素点对应的窗口尺寸，确定每个检测像素点对应的检测窗口；

第一检测模块740，被配置为采用每个检测像素点对应的检测窗口，在深度图像中进行人脸检测。

进一步地，请参考图10，其示出了本公开实施例提供的再一种人脸检测装置700的框图，参见图10，在图8的基础上，该人脸检测装置700还包括：

第二检测模块770，被配置为在通过终端的立体摄像组件捕获人体的深度图像之前，检测终端是否处于被握持状态；

开启模块780，被配置为当终端处于被握持状态时，开启终端的立体摄像组件。

可选地，立体摄像组件为3D摄像头。

可选地，3D摄像头为基于结构光的3D摄像头。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本公开实施例还提供了一种终端，包括：

处理器；

用于存储处理器的可执行指令的存储器；

其中，处理器被配置为：

通过终端的立体摄像组件捕获人体的深度图像，深度图像包括多个像素点，多个像素点中的每个像素点的深度值表示每个像素点在人体上的对应位置点与立体摄像组件之间的距离；

根据多个像素点中的每个像素点的深度值，确定每个像素点对应的窗口尺寸；

根据每个像素点在深度图像中的位置和每个像素点对应的窗口尺寸，确定每个像素点对应的检测窗口；

采用每个像素点对应的检测窗口，在深度图像中进行人脸检测。

图11是根据一示例性实施例示出的一种终端1100的结构示意图。例如，终端1100可以是智能手机、平板电脑、智能电视、智能手表、车载终端、智能可穿戴式设备、MP5播放器、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备或个人数字助理等。

参见图11，终端1100可以包括以下一个或多个组件：处理组件1102、存储器1104、电源组件1106、多媒体组件1108、音频组件1110、输入/输出(I/O)接口1112、传感器组件1114以及通信组件1116。

处理组件1102通常控制终端1100的整体操作，诸如与显示、电话呼叫、数据通信、定位、相机操作和记录操作相关联的操作。处理组件1102可以包括一个或多个处理器1120来执行指令，以完成上述人脸检测方法的全部或部分步骤。此外，处理组件1102可以包括一个或多个模块，便于处理组件1102和其他组件之间的交互。例如，处理组件1102可以包括多媒体模块，以方便多媒体组件1108和处理组件1102之间的交互。

存储器1104被配置为存储各种类型的数据以支持在终端1100上的操作。这些数据的示例包括用于在终端1100上操作的任何应用或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(英文：Dynamic Random Access Memory；简称：SRAM)、电可擦除可编程只读存储器(英文：Electrically Erasable Programmable Read-OnlyMemory；简称：EEPROM)、可擦除可编程只读存储器(英文：Erasable Programmable ReadOnly Memory；简称：EPROM)、可编程只读存储器(英文：Programmable Read Only Memory；简称：PROM)、只读存储器(英文：Read-Only Memory；简称：ROM)、磁存储器、快闪存储器，磁盘或光盘。

电源组件1106为终端1100的各种组件提供电力。电源组件1106可以包括电源管理系统、一个或多个电源及其他与为终端1100生成、管理和分配电力相关联的组件。

多媒体组件1108包括在终端1100和用户之间提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(英文：LiquidCrystalDisplay；简称：LCD)和触摸面板(英文：TouchPanle；简称：TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1108包括一个前置摄像头和/或后置摄像头。当终端1100处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1110被配置为输出和/或输入音频信号。例如，音频组件1110包括一个麦克风(英文：Microphone；简称：MIC)，当终端1100处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中，音频组件1110还包括一个扬声器，用于输出音频信号。

I/O接口1112为处理组件1102和外围接口模块之间提供接口，上述外围接口模块可以是键盘、点击轮、按钮等。这些按钮可以包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1114包括一个或多个传感器，用于为终端1100提供各个方面的状态评估。例如，传感器组件1114可以检测到终端1100的打开/关闭状态，组件的相对定位，例如组件为终端1100的显示器和小键盘，传感器组件1114还可以检测终端1100或终端1100一个组件的位置改变，用户与终端1100接触的存在或不存在，终端1100方位或加速/减速和终端1100的温度变化。传感器组件1114可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器，如互补金属氧化物半导体(英文：Complementary Metal Oxide Semiconductor；简称：CMOS)或电荷耦合元件(英文：Charge-coupled Device；简称：CCD)图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1114还可以包括加速度传感器、陀螺仪传感器、磁传感器、压力传感器或温度传感器。

通信组件1116被配置为便于终端1100和其他设备之间有线或无线方式的通信。终端1100可以接入基于通信标准的无线网络，如WIFI、2G、3G或它们的组合。在一个示例性实施例中，通信组件1116经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，通信组件1116还包括近场通信(英文：Near FieldCommunication；简称：NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(英文：Radio Frequency Identification；简称：RFID)技术，红外数据协会(英文：Infrared DataAssociation；简称：IrDA)技术，超宽带(英文：Ultra Wideband；简称：UWB)技术，蓝牙(英文：Bluetooth；简称：BT)技术和其他技术来实现。

在示例性实施例中，终端1100可以被一个或多个应用专用集成电路(英文：Application Specific Integrated Circuit；简称：ASIC)、数字信号处理器(英文：Digital Signal Processing；简称：DSP)、数字信号处理设备(英文：Digital SignalProcessing Device；简称：DSPD)、可编程逻辑器件(英文：Programable Logic Device；简称：PLD)、现场可编程门阵列(英文：Field-Programmable Gate Array；简称：FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述人脸检测方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1104，上述指令可由终端1100的处理器1120执行以完成上述人脸检测方法。例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(英文：RandomAccess Memory；简称：RAM)、激光唱片只读存储器(英文：Compact Disk Read-OnlyMemory；简称：CD-ROM)、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，该计算机可读存储介质中存储有指令，当该指令在终端1100的处理组件(例如处理器)上执行时，使得终端1100的处理组件能够执行上述人脸检测方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种人脸检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述检测窗口为正K边形窗口，所述K为大于或等于3的整数，所述窗口尺寸为所述检测窗口的边长，所述根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸，包括：

根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸；

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求1至3任一项所述的方法，其特征在于，所述采用所述每个像素点对应的检测窗口，在所述深度图像中进行人脸检测，包括：

从所述每个像素点对应的检测区域中，提取图像特征；

检测所述图像特征是否为人脸特征。

5.根据权利要求4所述的方法，其特征在于，所述检测所述图像特征是否为人脸特征，包括：采用特征分离器检测所述图像特征是否为人脸特征；

6.根据权利要求5所述的方法，其特征在于，所述采用特征分离器检测所述图像特征是否为人脸特征，包括：

接收所述分类器生成装置发送的所述特征分类器；

根据所述特征标签，确定所述图像特征是否为人脸特征。

7.根据权利要求1至3任一项所述的方法，其特征在于，

所述根据所述多个像素点中的每个像素点的深度值，确定所述每个像素点对应的窗口尺寸，包括：从所述多个像素点中确定至少一个检测像素点，根据所述至少一个检测像素点中的每个检测像素点的深度值，确定所述每个检测像素点对应的窗口尺寸；

8.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

9.一种人脸检测装置，其特征在于，所述装置包括：

10.根据权利要求9所述的装置，其特征在于，所述检测窗口为正K边形窗口，所述K为大于或等于3的整数，所述窗口尺寸为所述检测窗口的边长，

所述第一确定模块，被配置为根据所述每个像素点的深度值，采用尺寸确定公式确定所述每个像素点对应的窗口尺寸；

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

12.根据权利要求9至11任一项所述的装置，其特征在于，所述第一检测模块，包括：

检测子模块，被配置为检测所述图像特征是否为人脸特征。

13.根据权利要求12所述的装置，其特征在于，

所述检测子模块，被配置为采用特征分离器检测所述图像特征是否为人脸特征；

14.根据权利要求13所述的装置，其特征在于，

所述检测子模块，被配置为：

接收所述分类器生成装置发送的所述特征分类器；

根据所述特征标签，确定所述图像特征是否为人脸特征。

15.根据权利要求9至11任一项所述的装置，其特征在于，

所述第一确定模块，被配置为从所述多个像素点中确定至少一个检测像素点，根据所述至少一个检测像素点中的每个检测像素点的深度值，确定所述每个检测像素点对应的窗口尺寸；

16.根据权利要求9至11任一项所述的装置，其特征在于，所述装置还包括：

17.一种终端，其特征在于，包括：

处理器；

用于存储所述处理器的可执行指令的存储器；

其中，所述处理器被配置为：

18.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端的处理组件上运行时，使得所述处理组件执行权利要求1至8任一项所述的人脸检测方法。