CN107609465A

CN107609465A - 一种用于人脸检测的多尺度检测方法

Info

Publication number: CN107609465A
Application number: CN201710609465.0A
Authority: CN
Inventors: 刘宏哲; 袁家政; 杨少鹏; 王雪峤
Original assignee: Beijing Union University
Current assignee: Beijing Union University
Priority date: 2017-07-25
Filing date: 2017-07-25
Publication date: 2018-01-19

Abstract

本发明公开一种用于人脸检测的多尺度检测方法，将获取的图像首先经过三个不同尺度的检测器，把这3个尺度的检测器集成在ResNet101网络中，紧接着从深度网络模型的多个层中提取特征，每个尺度的检测器会给出相应的人脸预测，最后根据3个尺度检测器的结果得出最好的预测结果。本发明具有简单易操作、输入参数少、能够检测各个尺度的人脸等优点，提高了检测小尺度人脸的准确度。

Description

一种用于人脸检测的多尺度检测方法

技术领域

本发明属于计算机视觉领域，尤其涉及一种用于人脸检测的多尺度检测方法。

背景技术

随着计算机视觉的发展，人脸识别成为最有潜力的生物身份验证手段，人脸检测是人脸识别中的第一个环节，是一项关键技术。在大力发展人工智能的今天，人脸检测技术也取得了很大的进步。虽然如此，但在实际应用中，在检测不同像素的人脸时具有很大的挑战，因此，研究一种能够对多尺度人脸检测方法存在很大应用价值。

现有的人脸检测在选择模板时采用一刀切的方法，在检测一幅图像想具有不同像素的人脸特别是在检测小目标时具有很大的挑战性。

发明内容

本发明的目的是，提供一种用于人脸检测的多尺度检测方法，提出了一个简单而有效地多尺度检测框架，针对小目标识别提出了深层多尺度模板提高了小目标识别精度。

为了实现上述目的，本发明采取了如下的技术方案：

1.一种用于人脸检测的多尺度检测方法，其特征在于，包括以下步骤：

步骤1：获取原始图像；

步骤2：创建一个粗图像金字塔分辨分别为0.5、1、2；

步骤4：将各个分辨率下的图像随机裁剪成500*500像素的图像；

步骤5：将500*500像素的图像输入到相应的ResNet101中；

步骤6：从网络中每一个管道中的最后一层提取尺度特征进行多层特征融合，然后在每个分辨率下预测模板响应(用于检测和回归)，根据一定阈值，在不同模板对应的feature map上选出目标，并进行boundingbox矫正；

步骤7：在原图像上应用最大抑制(NMS)，获得最终检测结果。

作为优选，步骤2建立3个分辨率不同的金字塔模型，其中0.5分辨率的图像可有效检测像素大于140像素的人脸，1分辨率的图像可有效检测40～140像素的人脸，2分辨率的图像可有效检测像素小于40像素的人脸。

作为优选，步骤5当裁剪在图像边界之外时，采用平均RGB值进行填充。

作为优选，步骤3用到的ResNet101是由已经在imageNet上训练好的模型进行微调得到，给定带有目标和模板的ground truth注释的训练图片，定义正样本为IOU重叠超过70％的位置，负样本为重叠低于30％的位置。

本发明的有益效果是：

本发明通过可行的技术方案，具有以下几点有益效果：

1、本发明针对多尺度训练了不同的检测器，为了保证效率，这些检测器所用的特征来自同一网络的不同的层级；

2、本发明充分利用了上下文信息，同时微调网络的时候也充分考虑了多尺度因素；

3、本方法在进行小目标检测时，有很高的准确度。

附图说明

图1为本发明人脸检测的多尺度检测方法的流程示意图。

具体实施方式

如图1所示，本发明提供一种用于人脸检测的多尺度检测方法包括以下步骤：

步骤1：CNN网络ResNet101模型训练；

ResNet101模型是由已经在imageNet上训练好的模型进行微调得到，给定带有目标和模板的ground truth注释的训练图片，我们定义正样本为IOU重叠超过70％的位置，负样本为重叠低于30％的位置(所有其他位置通过梯度清零被忽略)。

步骤2：得到一幅原始图像；

步骤3：创建一个粗图像金字塔分辨分别为0.5、1、2；

步骤5：将500*500像素图像输入到相应的ResNet101中；

步骤7：在原图像上应用最大抑制(NMS)，获得最终检测结果。

对于步骤3，0.5分辨率的图像可有效检测像素大于140像素的人脸，1分辨率的图像可有效检测40-140像素的人脸，2分辨率的图像可有效检测像素小于40像素的人脸。

Claims

步骤1：获取原始图像；

步骤2：创建一个粗图像金字塔分辨分别为0.5、1、2；

步骤5：将500*500像素的图像输入到相应的ResNet101中；

步骤6：从网络中每一个管道中的最后一层提取尺度特征进行多层特征融合，然后在每个分辨率下预测模板响应，根据预设阈值，在不同模板对应的feature map上选出目标，并进行boundingbox矫正；

步骤7：在原图像上应用最大抑制，获得最终检测结果。

2.根据权利要求书1所述的用于人脸检测的多尺度检测方法，其特征在于，步骤2建立3个分辨率不同的金字塔模型，其中0.5分辨率的图像可有效检测像素大于140像素的人脸，1分辨率的图像可有效检测40～140像素的人脸，2分辨率的图像可有效检测像素小于40像素的人脸。

3.根据权利要求书1所述的用于人脸检测的多尺度检测方法，其特征在于，步骤5当裁剪在图像边界之外时，采用平均RGB值进行填充。

4.根据权利要求书1所述的用于人脸检测的多尺度检测方法，其特征在于，步骤3用到的ResNet101是由已经在imageNet上训练好的模型进行微调得到，给定带有目标和模板的ground truth注释的训练图片，定义正样本为IOU重叠超过70％的位置，负样本为重叠低于30％的位置。