CN107220618B

CN107220618B - 人脸检测方法及装置、计算机可读存储介质、设备

Info

Publication number: CN107220618B
Application number: CN201710379478.3A
Authority: CN
Inventors: 雷震; 朱翔昱; 张士峰; 李子青
Original assignee: Institute of Automation of Chinese Academy of Science
Current assignee: Institute of Automation of Chinese Academy of Science
Priority date: 2017-05-25
Filing date: 2017-05-25
Publication date: 2019-12-24
Anticipated expiration: 2037-05-25
Also published as: CN107220618A

Abstract

本发明涉及人脸检测方法及装置、计算机可读存储介质、设备，所述方法包括依据预设的人脸检测模型，获取待测图像的多个检测结果框；选取所获取的多个检测结果框中满足预设的筛选条件的检测结果框；所述预设的人脸检测模型为依据深度卷积神经网络构建的检测模型；所述装置、计算机可读存储介质、设备可以实现上述人脸检测方法的各步骤。与现有技术相比，本发明提供的人脸检测方法及装置、计算机可读存储介质、设备，能够对待测图像中不同尺度的人脸进行有效检测。

Description

人脸检测方法及装置、计算机可读存储介质、设备

技术领域

本发明涉及图像处理技术领域，具体涉及一种人脸检测方法及装置、计算机可读存储介质、设备。

背景技术

人脸检测技术是一种在任意图像中自动搜索人脸位置和大小的技术。人脸检测技术在基于人脸的计算机视觉、模式识别应用中占有很重要的地位，例如视频监控和身份识别系统等。

目前大多数人脸检测方法，尤其是基于锚点框的检测方法，如Faster RCNN、SSD、R-FCN，随着人脸尺度的变小，其检测性能会急剧下降。具体地，在对小尺度人脸检测还存在下述问题：

1、在构建检测框架、设计锚点框的关联层和锚点框的大小时，小尺度的人脸没有得到足够的重视，不仅锚点框关联层的位置太深，导致小尺度人脸的特征消失无法用于检测，而且锚点框大小、有效感受野、小尺度人脸三者间互不匹配，导致无法充分利用人脸的图像特征。

2、为了检测小尺度人脸必须要密集地铺设大量的小锚点框，这些小锚点框会带来很多的人脸虚检问题。

3、锚点框与人脸标注框匹配的策略不够完善，有些尺度的人脸标注框不能匹配到足够多的锚点框，导致它们有着较低的召回率。

发明内容

为了解决现有技术中的上述问题，即为了解决小尺度人脸检测准确性较低的技术问题，本发明提供了一种基于多尺度锚点框的人脸检测方法，可以对小尺度人脸进行有效检测，同时还提供了一种人脸检测装置，及相应的计算机可读存储介质、计算机设备。

第一方面，本发明提供的一种人脸检测方法的技术方案是：

所述方法包括：

依据预设的人脸检测模型，获取待测图像的多个检测结果框；

选取所获取的多个检测结果框中满足预设的筛选条件的检测结果框；

其中：

所述预设的人脸检测模型为依据深度卷积神经网络构建的检测模型，具体步骤包括：

在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，并设置各锚点框的边长；

确定所述低卷积层中最浅层所关联锚点框的背景预测概率；

依据预设的训练图像，对所述关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型。

进一步地，本发明提供的一个优选技术方案为：

所述设置锚点框的边长包括依据有效感受野的半径r设置所述锚点框的边长A_scale，具体为：

A_scale≈2r

所述锚点框的边长A_scale的约束条件为：

A_scale＝n×A_interval

其中，所述A_interval为锚点框在待测图像上的铺设间隔，所述n为预设的正整数。

进一步地，本发明提供的一个优选技术方案为：

所述确定低卷积层中最浅层所关联锚点框的背景预测概率，包括：

获取锚点框为待测图像中背景的多个预测概率，并选取所获取的多个预测概率的最大值作为所述锚点框的背景预测概率。

进一步地，本发明提供的一个优选技术方案为：

所述依据预设的训练图像，对关联锚点框的深度卷积神经网络进行网络训练，包括：

对所述预设的训练图像进行数据增广处理，得到训练样本；

对锚点框与所述训练样本中的人脸标注框进行匹配，并依据匹配结果将锚点框划分为正样本和负样本；所述正样本为与人脸标注框匹配的锚点框，所述负样本为与人脸标注框未匹配的锚点框；

采用困难负样本挖掘方法选取预设的第三数量的负样本；

依据所述正样本与所选取的负样本计算损失函数值，并依据损失函数值更新所述深度卷积神经网络；

对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件；

其中：

所述对锚点框与训练样本中的人脸标注框进行匹配，包括：

计算各锚点框与各人脸标注框的交除并重叠比；

选取与各人脸标注框的交除并重叠比最大的锚点框，并将所选取的各锚点框与各对应的人脸标注框进行匹配；

判断去除所选取的锚点框之后，剩余的各锚点框与各人脸标注框的交除并重叠比是否大于预设的第一阈值：若大于则进行匹配；

获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与所述人脸标注框的交除并重叠比大于预设的第二阈值的所有锚点框；所述预设的第一阈值大于预设的第二阈值；

按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配；所述预设的第五数量的取值为锚点框匹配数量大于或等于预设的第四数量的人脸标注框的锚点框平均匹配数量。

第二方面，本发明提供的一种人脸检测装置的技术方案是：

所述装置包括：

检测结果框获取模块，配置为依据预设的人脸检测模型，获取待测图像的多个检测结果框；

检测结果框筛选模块，配置为选取所获取的多个检测结果框中满足预设的筛选条件的检测结果框；

所述装置还包括人脸检测模型构建模块；所述人脸检测模型构建模块，配置为依据深度卷积神经网络构建的检测模型，具体包括：

锚点框关联单元，配置为在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，并设置各锚点框的边长；

背景预测概率确定单元，配置为确定所述低卷积层中最浅层所关联锚点框的背景预测概率；

网络训练单元，配置为依据预设的训练图像，对所述关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型。

进一步地，本发明提供的一个优选技术方案为：

所述锚点框关联单元包括锚点框边长设置子单元；所述锚点框边长设置子单元，配置为依据有效感受野的半径r设置所述锚点框的边长A_scale，具体为：

A_scale≈2r

所述锚点框的边长A_scale的约束条件为：

A_scale＝n×A_interval

进一步地，本发明提供的一个优选技术方案为：

所述背景预测概率确定单元包括：

数据获取子单元，配置为获取锚点框为待测图像中背景的多个预测概率；

数据筛选子单元，配置为选取所获取的多个预测概率的最大值作为所述锚点框的背景预测概率。

进一步地，本发明提供的一个优选技术方案为：

所述网络训练单元包括：

训练图像处理子单元，配置为对所述预设的训练图像进行数据增广处理，得到训练样本；

正负样本划分子单元，配置为对锚点框与所述训练样本中的人脸标注框进行匹配，并依据匹配结果将锚点框划分为正样本和负样本；所述正样本为与人脸标注框匹配的锚点框，所述负样本为与人脸标注框未匹配的锚点框；

负样本筛选子单元，配置为采用困难负样本挖掘方法选取预设的第三数量的负样本；

网络更新子单元，配置为依据所述正样本与所选取的负样本计算损失函数值，并依据损失函数值更新所述深度卷积神经网络；对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件。

其中：

所述正负样本划分子单元包括匹配子单元；所述匹配子单元包括：

交除并重叠比计算子单元，配置为计算各锚点框与各人脸标注框的交除并重叠比；

第一匹配子单元，配置为选取与各人脸标注框的交除并重叠比最大的锚点框，并将所选取的各锚点框与各对应的人脸标注框进行匹配；

第二匹配子单元，配置为判断去除所选取的锚点框之后，剩余的各锚点框与各人脸标注框的交除并重叠比是否大于预设的第一阈值：若大于则进行匹配；所述预设的第一阈值大于预设的第二阈值；

第三匹配子单元，配置为获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与所述人脸标注框的交除并重叠比大于预设的第二阈值的所有锚点框；按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配；所述预设的第五数量的取值为锚点框匹配数量大于或等于预设的第四数量的人脸标注框的锚点框平均匹配数量。

第三方面，本发明提供的一种计算机可读存储介质的技术方案是：

所述计算机可读存储介质中存储有计算机程序，其特征在于，所述程序适用于由处理器加载并执行以实现上述技术方案所述的人脸检测方法中的各步骤。

第四方面，本发明提供的一种计算机设备的技术方案是：

所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述技术方案所述的人脸检测方法中的各步骤。

与现有技术相比，上述技术方案至少具有以下有益效果：

1、本发明提供的一种人脸检测方法，其依据深度卷积神经网络构建人脸检测模型，并在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，可以对待测图像中不同尺寸的人脸进行有效检测。

2、本发明提供的一种人脸检测装置，其人脸检测模型构建模块可以依据深度卷积神经网络构建人脸检测模型，并在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，可以对待测图像中不同尺寸的人脸进行有效检测。

3、本发明提供的一种计算机可读存储介质，其存储有计算机程序，该程序可以适用于由处理器加载并执行以实现上述人脸检测方法中的各步骤。

4、本发明提供的一种计算机设备，其包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行程序时可以实现上述人脸检测方法中的各步骤。

附图说明

图1是本发明实施例中一种人脸检测方法的实施流程图；

图2是本发明实施例中第一卷积模块示意图；

图3是本发明实施例中第二卷积模块示意图；

图4是本发明实施例中归一化模块、预测模块和输出模块示意图；

图5是本发明实施例中待测图像结果示意图；

其中，1：第一卷积模块；11：第7个卷积层；12：第10个卷积层；13：第13个卷积层；2：第二卷积模块；21：第14个卷积层；22：第15个卷积层；23：第16个卷积层；24：第17个卷积层；25：第18个卷积层；26：第19个卷积层；3：归一化模块；4：预测模块；5：背景预测概率最大化模块；6：输出模块。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

基于锚点框的人脸检测方法，通常可以很好地检测到大尺度人脸，而不能准确检测小尺度人脸。基于此，本发明提供了一种人脸检测方法，该方法克服了常规人脸检测方法的检测性能随人脸尺度变小而下降的缺陷，可以适用于不同尺度的人脸检测。

下面结合附图，对本发明提供的一种人脸检测方法进行说明。

图1示例性示出了本实施例中一种人脸检测方法的实施流程，如图所示，本实施例中人脸检测方法可以包括下述内容：

步骤S101：依据预设的人脸检测模型，获取待测图像的多个检测结果框。

本实施例中预设的人脸检测模型为依据深度卷积神经网络构建的检测模型，具体地，可以按照下述步骤构建人脸检测模型：

1、在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，并设置各锚点框的边长。

其中，卷积神经网络包括多个级联的卷积层，本实施例中按照卷积层与卷积神经网络的输入图像的相对位置，将多个级联的卷积层划分为低卷积层、中卷积层和高卷积层，且低卷积层、中卷积层和高卷积层相对于输入图像的距离依次增大。同时，本实施例中低卷积层、中卷积层和高卷积层均可以包括一个或多个卷积层。

卷积神经网络中低卷积层的特征可以很好地表达小尺度人脸，但是由于感受野较小，因而对大尺度人脸的鉴别能力较差。同时，卷积神经网络中高卷积层的特征可以很好地表达大尺度人脸，而对小尺度人脸的响应会因为特征被压缩而消失。本实施例中通过在卷积神经网络中大范围铺设锚点框，即在其低卷积层、中卷积层和高卷积层中分别关联锚点框，可以保证卷积神经网络可以对不同尺度的人脸进行准确检测。其中，本实施例中卷积神经网络所关联的锚点框为长宽比例为1:1的正方形框。

本实施例提供的一个优选实施方案中，卷积神经网络包括19个卷积层、1个归一化模块、1个预测模块和1个输出模块。其中，19个卷积层依次级联。下面结合该卷积神经网络对锚点框的关联方式进行说明。

图2示例性示出了本实施例中卷积神经网络的第一卷积模块1，该第一卷积模块1为卷积神经网络VGG16的卷积模块。

图3示例性示出了本实施例中卷积神经网络的第二卷积模块2，该第二卷积模块2为在第一卷积模块1上额外添加的卷积模块。

本实施例中以第一卷积模块1和第二卷积模块2形成的卷积层结构为基础，分别在其低卷积层、中卷积层和高卷积层中关联锚点框。如图所示，本实施例中低卷积层包括第7个卷积层11和第10个卷积层12，中卷积层包括第13个卷积层13和第15个卷积层22，高卷积层包括第17个卷积层24和第19个卷积层26。本实施例中低卷积层、中卷积层和高卷积层中关联锚点框，具体为：在第一卷积模块1的第7个卷积层11、第10个卷积层12和第13个卷积层13中关联锚点框，在第二卷积模块2的第15个卷积层22、第17个卷积层24和第19个卷积层26中关联锚点框。

图4示例性示出了本实施例中归一化模块、预测模块和输出模块，如图所示，本实施例中归一化模块3与第一卷积模块1中的第7个卷积层11、第10个卷积层12和第13个卷积层13连接。归一化模块3的输出、以及第二卷积模块2的第15个卷积层22、第17个卷积层24和第19个卷积层26分别与预测模块4连接。

其中：归一化模块3可以用于对第7个卷积层11、第10个卷积层12和第13个卷积层13进行数值归一化处理。预测模块4可以输出人脸检测框的位置参数和置信度。输出模块6在进行网络训练时包括SoftmaxLoss层和SmoothL1Loss层，在对待测图像进行人脸检测时包括Softmax层和Accuracy层。

图5示例性示出了本实施例中待测图像的检测结果，如图所示，本实施例中待测图像输入至第一卷积模块1，输出模块6输出该待测图像的人脸检测框的位置参数和置信度。

本实施例中可以依据有效感受野的半径r设置锚点框的边长A_scale，具体为：

A_scale≈2r (1)

其中：

有效感受野ERF是理论感受野TRF的很小一部分，且该部分真正决定卷积神经网络中神经元输出的像素区域。有效感受野对神经元输出的影响力，是以理论感受野的中心为原点，呈高斯分布形态，形状大致为一个圆形区域，具体为：

ERF＝Gaussian(x_c,y_c)∈TRF (2)

公式(2)中各参数含义为：

(x_c,y_c)为理论感受野TRF的中心。

本实施例中卷积神经网络的6个卷积层所关联的锚点框对应的理论感受野的大小分别为：48×48、108×108、228×228、340×340、468×468、724×724。相应地，本实施例中有效感受野ERF的半径r和理论感受野TRF的边长d的关系如下式(3)所示：

理论感受野TRF是理论上影响卷积神经网络中神经元输出的像素区域，具体为：

TRF＝[x_c,y_c,w,h] (4)

公式(4)中各参数含义为：

w和h分别为理论感受野TRF的宽和长。

本实施例中通过匹配锚点框与有效感受野ERF，使得卷积神经网络利用有效感受野ERF的信息，对锚点框进行分类和回归等操作。

进一步地，为保证不同人脸标注框可以匹配到数量相等的锚点框，使得人脸检测模型公平地对待不同尺度的人脸，本实施例中在不同卷积层上铺设相同密度的锚点框。基于此，本实施例中可以依据锚点框的铺设间隔，设置锚点框的边长。具体地，本实施例中满足相同铺设密度的锚点框的边长A_scale的约束条件如下式(5)所示：

A_scale＝n×A_interval (5)

公式(5)中各参数含义为：

A_interval为锚点框在待测图像上的铺设间隔，n为预设的正整数，本实施例中n＝4。

例如：本实施例中卷积神经网络的6个卷积层分别关联锚点框，这6个锚点框的铺设间隔分别为4,8,16,32,64,128，边长分别为16,32,64,128,256,512。根据公式(5)可以得到，各卷积层的锚点框边长的约束条件为A_scale＝4×A_interval。

2、确定低卷积层中最浅层所关联锚点框的背景预测概率，该背景预测概率指的是锚点框为待测图像中背景的最终预测概率。

其中，最浅层指的是低卷积层中最靠近卷积神经网络的输入图像的卷积层，如图2所示，本实施例中低卷积层包括第7个卷积层11和第10个卷积层12，该低卷积层的最浅层为第7个卷积层11。如图4所示，本实施例中背景预测概率最大化模块5对第7个卷积层11所关联的锚点框为背景的多个预测概率进行最大化处理。

具体地，本实施例中可以按照下述步骤确定低卷积层中最浅层所关联锚点框的背景预测概率：

(1)获取锚点框为待测图像中背景的多个预测概率，如下式(6)所示：

[b₁，b₂，b₃，...，b_Nm] (6)

(2)选取步骤(1)中所获取的多个预测概率的最大值作为锚点框的背景预测概率，如下式(7)所示：

b＝max(b₁,b₂,b₃,...,b_Nm) (7)

本实施例中将多个预测概率的最大值设置为锚点框的背景预测概率，可以解决人脸检测中小锚点框带来的虚检问题，提升人脸检测模型的准确性。

3、依据预设的训练图像，对关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型。

具体地，本实施例中可以按照下述步骤对关联锚点框的深度卷积神经网络进行网络训练：

(1)将预设的训练图像输入至人脸检测模型，并对预设的训练图像进行数据增广处理，得到训练样本。本实施例中对训练图像进行数据增广处理，可以包括颜色抖动操作、随机裁剪操作、水平翻转操作和尺度变换操作：

首先，对训练图像进行颜色抖动操作，具体为：分别以0.5的概率，随机地调整训练图像的亮度、对比度和饱和度等参数。

其次，对经过颜色抖动操作后的训练图像进行随机裁剪操作，具体为：随机裁剪5张正方形的子图像。其中，1个子图像是该训练图像中最大的正方形子图像，其余4个子图像的边长为训练图像短边的0.3～1.0倍。随机选取5张子图像中的1个子图像作为最终的训练样本。

再次，对选取的训练样本进行水平翻转操作，具体为：以0.5的概率随机进行水平翻转操作。

最后，对经水平翻转操作后的训练样本进行尺度变换操作，具体为：将该训练样本缩放为640×640的图像。

本实施例中依次对训练图像进行颜色抖动操作、随机裁剪操作、水平翻转操作和尺度变换操作，可以在不改变图像类别的情况下，增加数据量，能提高模型的泛化能力。

(2)对锚点框与训练样本中的人脸标注框进行匹配，并依据匹配结果将锚点框划分为正样本和负样本。本实施例中正样本为与人脸标注框匹配的锚点框，负样本为与人脸标注框未匹配的锚点框。

具体地，本实施例中可以按照下述步骤对锚点框与训练样本中的人脸标注框进行匹配：

首先，计算各锚点框与各人脸标注框的交除并重叠比，该交除并重叠比指的是锚点框与人脸标注框的交叠率，可以理解为锚点框与人脸标注框的交集、及锚点框与人脸标注框的并集的比值。

其次，选取与各人脸标注框的交除并重叠比最大的锚点框，并将所选取的各锚点框与各对应的人脸标注框进行匹配。即对于每个人脸标注框，选出与其交除并重叠比最大的一个锚点框进行匹配。

再次，判断去除所选取的锚点框之后，剩余的各锚点框与各人脸标注框的交除并重叠比是否大于预设的第一阈值：若大于则进行匹配。即判断剩余的锚点框与人脸标注框的交除并重叠比是否大于预设的第一阈值，如果大于则将对于的锚点框匹配到人脸标注框。

再一次，获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与人脸标注框的交除并重叠比大于预设的第二阈值的所有锚点框。本实施例中锚点框匹配数量小于预设的第四数量的人脸标注框指的是没有匹配到足够锚点框的人脸标注框，且预设的第一阈值大于预设的第二阈值。

最后，按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配。本实施例中预设的第五数量的取值为锚点框匹配数量大于或等于预设的第四数量的人脸标注框的锚点框平均匹配数量。本实施例中锚点框平均匹配数量也可以理解为匹配到足够锚点框的所有人脸标注框所匹配的锚点框数量的平均值。

本实施例提供的一个优选实施方案中第一阈值为0.35，第二阈值为0.1，下面对该优选实施方案进行具体说明。

首先，计算各锚点框与各人脸标注框的交除并重叠比。

其次，选取与各人脸标注框的交除并重叠比最大的锚点框，并将所选取的各锚点框与各对应的人脸标注框进行匹配。

再次，判断去除所选取的锚点框之后，剩余的各锚点框与各人脸标注框的交除并重叠比是否大于0.35：若大于则进行匹配。本实施例中匹配到足够锚点框的所有人脸标注框所匹配的锚点框数量的平均值为Np。

再一次，获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与人脸标注框的交除并重叠比大于0.1的所有锚点框。本实施例中交除并重叠比大于0.1的所有锚点框如下式(8)所示：

[a₁,a₂,a₃...a_i...a_N] (8)

公式(8)中各参数含义为：

a_i表示锚点框的位置和大小。

最后，按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配。

本实施例中对公式(8)所示的锚点框进行交除并重叠比降序排列可以得到：

[A₁，A₂，A₃...A_j...A_N] (9)

公式(9)中各参数含义为：

A_j表示交除并重叠比降序排列后第j个锚点框的位置和大小。

(3)采用困难负样本挖掘方法选取预设的第三数量的负样本。具体地，本实施例中可以按照下述步骤选取负样本：

计算所有负样本分类预测所带来的误差值，并按照误差值由大到小的顺序选取N_neg个负样本，使得负样本与正样本具有下述关系：

N_neg＝3N_pos (10)

公式(10)中各参数含义为：

N_pos为正样本的数量。

(4)依据正样本与所选取的负样本计算损失函数值，并依据损失函数值更新深度卷积神经网络。本实施例中可以采用随机梯度下降法，反向传播误差，对深度卷积神经网络更新，从而完成一次网络训练。

本实施例中损失函数如下式(11)所示：

公式(11)中各参数含义为：

i是锚点框的标号。p_i为第i个锚点框被预测为人脸的概率。为第i个锚点框的训练标注：若锚点框为正样本，则若锚点框为负样本，则t_i为一个4维向量，表示预测的人脸边界框的参数化坐标。是与正样本关联的t_i的标注。L_cls为分类损失。L_reg为回归损失。λ为加权系数。N_cls为分类样本个数。N_reg为回归样本个数。

具体地，t_i和的参数化方法如下式(12)和(13)所示：

公式(12)和(13)中各参数含义为：

(x,y)为预测的人脸边界框的中心坐标，w和h分别为预测的人脸边界框的宽和长。x、x_a和x^*分别表示预测的人脸边界框、锚点框和人脸标注框。

具体地，分类损失L_cls如下式(14)所示：

进一步地，本实施例中采用鲁棒回归损失函数(smooth L₁)，可以得到如下式(15)所示的回归损失函数：

其中：

由公式(11)可知，两项损失函数分别依据N_cls和N_reg归一化，并由加权系数λ加权，可得：

同时，由公式(10)可知正样本N_pos与负样本N_neg的比例为1：3，因此设置加权系数λ＝4，使得分类损失L_cls与回归损失L_reg具有相同水平的权重值。

(5)对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件。本实施例中可以通过重复执行步骤(1)～(4)，得到满足预设的收敛条件的网络模型，即人脸检测模型。

步骤S102：选取所获取的多个检测结果框中满足预设的筛选条件的检测结果框。

本实施例中预设的筛选条件包括第一筛选条件和第二筛选条件。其中，第一筛选条件为检测结果框的置信度大于预设的第一置信度阈值。第二筛选条件为检测结果框的数量大于预设的第一数量。

具体地，本实施例中可以按照下述步骤获取满足预设的筛选条件的检测结果框：

1、获取多个检测结果框中满足第一筛选条件的第一检测结果框，并按照第一检测结果框的置信度由高到低的顺序，选取预设的第二数量的第一检测结果框。本实施例中在人脸检测模型输出的大量检测结果框的情况下，通过设置置信度阈值删除大部分的检测结果框。

2、采用非极大值抑制算法去除所选取的第一检测结果框中重复的检测结果框后，得到第二检测结果框。

3、按照第二检测结果框的置信度由高到低的顺序，选取预设的第一数量的第二检测结果框。其中，预设的第二数量大于预设的第一数量。

4、选取第二检测结果框中置信度大于预设的第二置信度阈值的检测结果框作为最佳人脸检测框。其中，预设的第二置信度阈值大于预设的第一置信度阈值。

本实施例提供的一个优选实施方案中第二数量Na＝400，第一数量Nb＝200，第一置信度阈值为0.05，第二置信度阈值为0.8，下面对该优选实施方案进行具体说明。

1、选取人脸检测模型输出的检测结果框中置信度大于0.05的检测结果框。

2、将步骤1选取的检测结果框按照置信度降序排列，选取前400个检测结果框。

3、采用非极大值抑制算法去除步骤2中选取的400个检测结果框中重复的检测结果框。

4、将步骤3得到的检测结果框按照置信度降序排列，选取前200个检测结果框。

5、选取步骤4中得到的200个检测结果框中置信度大于0.8的检测结果框，并将所选取的检测结果框作为最佳人脸检测框。

上述实施例中虽然将各个步骤按照上述先后次序的方式进行了描述，但是本领域技术人员可以理解，为了实现本实施例的效果，不同的步骤之间不必按照这样的次序执行，其可以同时(并行)执行或以颠倒的次序执行，这些简单的变化都在本发明的保护范围之内。

基于与方法实施例相同的技术构思，本发明实施例还提供了一种人脸检测装置。下面对该人脸检测装置进行具体说明。

本实施例中人脸检测装置可以包括检测结果框获取模块、检测结果框筛选模块和人脸检测模型构建模块。其中，检测结果框获取模块可以配置为依据预设的人脸检测模型，获取待测图像的多个检测结果框。检测结果框筛选模块可以配置为选取所获取的多个检测结果框中满足预设的筛选条件的检测结果框。人脸检测模型构建模块可以配置为依据深度卷积神经网络构建的检测模型。

具体地，本实施例中人脸检测模型构建模块可以包括锚点框关联单元、背景预测概率确定单元和网络训练单元。其中，锚点框关联单元可以配置为在深度卷积神经网络的低卷积层、中卷积层和高卷积层中分别关联锚点框，并设置各锚点框的边长。背景预测概率确定单元可以配置为确定低卷积层中最浅层所关联锚点框的背景预测概率。网络训练单元可以配置为依据预设的训练图像，对关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型。

其中：

本实施例中锚点框关联单元可以包括锚点框边长设置子单元。锚点框边长设置子单元可以配置为依据有效感受野的半径r设置锚点框的边长A_scale，如公式(1)所示。同时，锚点框的边长A_scale的约束条件如公式(5)所示。

本实施例中背景预测概率确定单元可以包括数据获取子单元和数据筛选子单元。其中，数据获取子单元可以配置为获取锚点框为待测图像中背景的多个预测概率。数据筛选子单元可以配置为选取所获取的多个预测概率的最大值作为锚点框的背景预测概率。

本实施例中网络训练单元可以包括训练图像处理子单元、正负样本划分子单元、负样本筛选子单元和网络更新子单元。其中，训练图像处理子单元可以配置为对预设的训练图像进行数据增广处理，得到训练样本。正负样本划分子单元可以配置为对锚点框与训练样本中的人脸标注框进行匹配，并依据匹配结果将锚点框划分为正样本和负样本；其中，正样本为与人脸标注框匹配的锚点框，负样本为与人脸标注框未匹配的锚点框。负样本筛选子单元可以配置为采用困难负样本挖掘方法选取预设的第三数量的负样本。网络更新子单元可以配置为依据正样本与所选取的负样本计算损失函数值，并依据损失函数值更新深度卷积神经网络；对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件。

本实施例中正负样本划分子单元可以包括匹配子单元，该匹配子单元可以包括交除并重叠比计算子单元、第一匹配子单元、第二匹配子单元和第三匹配子单元。其中，交除并重叠比计算子单元可以配置为计算各锚点框与各人脸标注框的交除并重叠比。第一匹配子单元可以配置为选取与各人脸标注框的交除并重叠比最大的锚点框，并将所选取的各锚点框与各对应的人脸标注框进行匹配。第二匹配子单元可以配置为判断去除所选取的锚点框之后，剩余的各锚点框与各人脸标注框的交除并重叠比是否大于预设的第一阈值：若大于则进行匹配。第三匹配子单元可以配置为获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与人脸标注框的交除并重叠比大于预设的第二阈值的所有锚点框；按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配。其中，预设的第一阈值大于预设的第二阈值，预设的第五数量的取值为锚点框匹配数量大于或等于预设的第四数量的人脸标注框的锚点框平均匹配数量。

进一步地，本实施例中检测结果框筛选模块可以包括下述结构，具体为：

本实施例中检测结果框筛选模块可以包括第一筛选单元、第二筛选单元和第三筛选单元。

其中：

第一筛选单元可以配置为获取多个检测结果框中满足第一筛选条件的第一检测结果框，并按照第一检测结果框的置信度由高到低的顺序，选取预设的第二数量的第一检测结果框。

第二筛选单元可以配置为采用非极大值抑制算法去除所选取的第一检测结果框中重复的检测结果框后，得到第二检测结果框。

第三筛选单可以，配置为按照第二检测结果框的置信度由高到低的顺序，选取预设的第一数量的第二检测结果框；并将所选取的第二检测结果框中置信度大于预设的第二置信度阈值的检测结果框作为最佳人脸检测框。

本实施例中预设的筛选条件包括第一筛选条件和第二筛选条件；第一筛选条件为检测结果框的置信度大于预设的置信度阈值；第二筛选条件为检测结果框的数量大于预设的第一数量。预设的第二数量大于预设的第一数量。

上述人脸检测装置实施例可以用于执行上述人脸检测方法实施例，其技术原理、所解决的技术问题及产生的技术效果相似，所属技术领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的人脸检测的具体工作过程及有关说明，可以参考前述人脸检测方法实施例中的对应过程，在此不再赘述。

本领域技术人员可以理解，上述人脸检测装置还包括一些其他公知结构，例如处理器、控制器、存储器等，其中，存储器包括但不限于随机存储器、闪存、只读存储器、可编程只读存储器、易失性存储器、非易失性存储器、串行存储器、并行存储器或寄存器等，处理器包括但不限于CPLD/FPGA、DSP、ARM处理器、MIPS处理器等。

本领域技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的服务器、客户端中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，PC程序和PC程序产品)。这样的实现本发明的程序可以存储在PC可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的PC来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

基于与方法实施例相同的技术构思，本发明实施例还提供了一种计算机可读存储介质。下面对该计算机可读存储介质进行具体说明。

本实施例中计算机可读存储介质中存储有计算机程序，该计算机程序可以适用于由处理器加载并执行以实现上述人脸检测方法实施例中的各步骤。

基于与方法实施例相同的技术构思，本发明实施例还提供了一种计算机设备。下面对该计算机设备进行具体说明。

本实施例中计算机设备可以包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。其中，处理器可以在执行计算机程序时实现上述人脸检测方法实施例中的各步骤。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在本发明的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种人脸检测方法，其特征在于，所述方法包括：

其中：

确定所述低卷积层中最浅层所关联锚点框的背景预测概率；

依据预设的训练图像，对所述关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型；

对所述预设的训练图像进行数据增广处理，得到训练样本；

采用困难负样本挖掘方法选取预设的第三数量的负样本；

依据所述正样本与所选取的负样本计算损失函数值，并依据损失函数值更新所述深度卷积神经网络；对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件；

其中：

所述对锚点框与训练样本中的人脸标注框进行匹配，包括：

计算各锚点框与各人脸标注框的交除并重叠比；

2.根据权利要求1所述的方法，其特征在于，

A_scale≈2r

所述锚点框的边长A_scale的约束条件为：

A_scale＝n×A_interval

3.根据权利要求1所述的方法，其特征在于，所述确定低卷积层中最浅层所关联锚点框的背景预测概率，包括：

获取所述锚点框为待测图像中背景的多个预测概率，并选取所获取的多个预测概率的最大值作为所述锚点框的背景预测概率。

4.一种人脸检测装置，其特征在于，所述装置包括：

网络训练单元，配置为依据预设的训练图像，对所述关联锚点框的深度卷积神经网络进行网络训练，得到满足预设的收敛条件的人脸检测模型；

所述网络训练单元包括：

正负样本划分子单元，配置为对锚点框与所述训练样本中的人脸标注框进行匹配，并依据匹配结果将锚点框划分为正样本和负样本；其中，所述正样本为与人脸标注框匹配的锚点框，所述负样本为与人脸标注框未匹配的锚点框；

网络更新子单元，配置为依据所述正样本与所选取的负样本计算损失函数值，并依据损失函数值更新所述深度卷积神经网络；对更新后的深度卷积神经网络重新进行网络训练，直至其满足预设的收敛条件；

其中：

第三匹配子单元，配置为获取锚点框匹配数量小于预设的第四数量的人脸标注框，并选取与所述人脸标注框的交除并重叠比大于预设的第二阈值的所有锚点框；按照所选取的所有锚点框的交除并重叠比由大到小的顺序，选取预设的第五数量的锚点框与对应的人脸标注框进行匹配；

所述预设的第五数量的取值为锚点框匹配数量大于或等于预设的第四数量的人脸标注框的锚点框平均匹配数量。

5.根据权利要求4所述的装置，其特征在于，所述锚点框关联单元包括锚点框边长设置子单元；所述锚点框边长设置子单元，配置为依据有效感受野的半径r设置所述锚点框的边长A_scale，具体为：

A_scale≈2r

所述锚点框的边长A_scale的约束条件为：

A_scale＝n×A_interval

6.根据权利要求4所述的装置，其特征在于，所述背景预测概率确定单元包括：

7.一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，其特征在于，所述程序适用于由处理器加载并执行以实现权利要求1至3中任一项所述的人脸检测方法中的各步骤。

8.一种计算机设备，所述计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至3中任一项所述的人脸检测方法中的各步骤。