CN107609465A - 一种用于人脸检测的多尺度检测方法 - Google Patents
一种用于人脸检测的多尺度检测方法 Download PDFInfo
- Publication number
- CN107609465A CN107609465A CN201710609465.0A CN201710609465A CN107609465A CN 107609465 A CN107609465 A CN 107609465A CN 201710609465 A CN201710609465 A CN 201710609465A CN 107609465 A CN107609465 A CN 107609465A
- Authority
- CN
- China
- Prior art keywords
- image
- face
- resolution ratio
- testing method
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开一种用于人脸检测的多尺度检测方法,将获取的图像首先经过三个不同尺度的检测器,把这3个尺度的检测器集成在ResNet101网络中,紧接着从深度网络模型的多个层中提取特征,每个尺度的检测器会给出相应的人脸预测,最后根据3个尺度检测器的结果得出最好的预测结果。本发明具有简单易操作、输入参数少、能够检测各个尺度的人脸等优点,提高了检测小尺度人脸的准确度。
Description
技术领域
本发明属于计算机视觉领域,尤其涉及一种用于人脸检测的多尺度检测方法。
背景技术
随着计算机视觉的发展,人脸识别成为最有潜力的生物身份验证手段,人脸检测是人脸识别中的第一个环节,是一项关键技术。在大力发展人工智能的今天,人脸检测技术也取得了很大的进步。虽然如此,但在实际应用中,在检测不同像素的人脸时具有很大的挑战,因此,研究一种能够对多尺度人脸检测方法存在很大应用价值。
现有的人脸检测在选择模板时采用一刀切的方法,在检测一幅图像想具有不同像素的人脸特别是在检测小目标时具有很大的挑战性。
发明内容
本发明的目的是,提供一种用于人脸检测的多尺度检测方法,提出了一个简单而有效地多尺度检测框架,针对小目标识别提出了深层多尺度模板提高了小目标识别精度。
为了实现上述目的,本发明采取了如下的技术方案:
1.一种用于人脸检测的多尺度检测方法,其特征在于,包括以下步骤:
步骤1:获取原始图像;
步骤2:创建一个粗图像金字塔分辨分别为0.5、1、2;
步骤4:将各个分辨率下的图像随机裁剪成500*500像素的图像;
步骤5:将500*500像素的图像输入到相应的ResNet101中;
步骤6:从网络中每一个管道中的最后一层提取尺度特征进行多层特征融合,然后在每个分辨率下预测模板响应(用于检测和回归),根据一定阈值,在不同模板对应的feature map上选出目标,并进行boundingbox矫正;
步骤7:在原图像上应用最大抑制(NMS),获得最终检测结果。
作为优选,步骤2建立3个分辨率不同的金字塔模型,其中0.5分辨率的图像可有效检测像素大于140像素的人脸,1分辨率的图像可有效检测40~140像素的人脸,2分辨率的图像可有效检测像素小于40像素的人脸。
作为优选,步骤5当裁剪在图像边界之外时,采用平均RGB值进行填充。
作为优选,步骤3用到的ResNet101是由已经在imageNet上训练好的模型进行微调得到,给定带有目标和模板的ground truth注释的训练图片,定义正样本为IOU重叠超过70%的位置,负样本为重叠低于30%的位置。
本发明的有益效果是:
本发明通过可行的技术方案,具有以下几点有益效果:
1、本发明针对多尺度训练了不同的检测器,为了保证效率,这些检测器所用的特征来自同一网络的不同的层级;
2、本发明充分利用了上下文信息,同时微调网络的时候也充分考虑了多尺度因素;
3、本方法在进行小目标检测时,有很高的准确度。
附图说明
图1为本发明人脸检测的多尺度检测方法的流程示意图。
具体实施方式
如图1所示,本发明提供一种用于人脸检测的多尺度检测方法包括以下步骤:
步骤1:CNN网络ResNet101模型训练;
ResNet101模型是由已经在imageNet上训练好的模型进行微调得到,给定带有目标和模板的ground truth注释的训练图片,我们定义正样本为IOU重叠超过70%的位置,负样本为重叠低于30%的位置(所有其他位置通过梯度清零被忽略)。
步骤2:得到一幅原始图像;
步骤3:创建一个粗图像金字塔分辨分别为0.5、1、2;
步骤4:将各个分辨率下的图像随机裁剪成500*500像素的图像;
步骤5:将500*500像素图像输入到相应的ResNet101中;
步骤6:从网络中每一个管道中的最后一层提取尺度特征进行多层特征融合,然后在每个分辨率下预测模板响应(用于检测和回归),根据一定阈值,在不同模板对应的feature map上选出目标,并进行boundingbox矫正;
步骤7:在原图像上应用最大抑制(NMS),获得最终检测结果。
对于步骤3,0.5分辨率的图像可有效检测像素大于140像素的人脸,1分辨率的图像可有效检测40-140像素的人脸,2分辨率的图像可有效检测像素小于40像素的人脸。
Claims (4)
1.一种用于人脸检测的多尺度检测方法,其特征在于,包括以下步骤:
步骤1:获取原始图像;
步骤2:创建一个粗图像金字塔分辨分别为0.5、1、2;
步骤4:将各个分辨率下的图像随机裁剪成500*500像素的图像;
步骤5:将500*500像素的图像输入到相应的ResNet101中;
步骤6:从网络中每一个管道中的最后一层提取尺度特征进行多层特征融合,然后在每个分辨率下预测模板响应,根据预设阈值,在不同模板对应的feature map上选出目标,并进行boundingbox矫正;
步骤7:在原图像上应用最大抑制,获得最终检测结果。
2.根据权利要求书1所述的用于人脸检测的多尺度检测方法,其特征在于,步骤2建立3个分辨率不同的金字塔模型,其中0.5分辨率的图像可有效检测像素大于140像素的人脸,1分辨率的图像可有效检测40~140像素的人脸,2分辨率的图像可有效检测像素小于40像素的人脸。
3.根据权利要求书1所述的用于人脸检测的多尺度检测方法,其特征在于,步骤5当裁剪在图像边界之外时,采用平均RGB值进行填充。
4.根据权利要求书1所述的用于人脸检测的多尺度检测方法,其特征在于,步骤3用到的ResNet101是由已经在imageNet上训练好的模型进行微调得到,给定带有目标和模板的ground truth注释的训练图片,定义正样本为IOU重叠超过70%的位置,负样本为重叠低于30%的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710609465.0A CN107609465A (zh) | 2017-07-25 | 2017-07-25 | 一种用于人脸检测的多尺度检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710609465.0A CN107609465A (zh) | 2017-07-25 | 2017-07-25 | 一种用于人脸检测的多尺度检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107609465A true CN107609465A (zh) | 2018-01-19 |
Family
ID=61059513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710609465.0A Pending CN107609465A (zh) | 2017-07-25 | 2017-07-25 | 一种用于人脸检测的多尺度检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609465A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460403A (zh) * | 2018-01-23 | 2018-08-28 | 上海交通大学 | 一种图像中多尺度特征融合的目标检测方法与系统 |
CN112364846A (zh) * | 2021-01-12 | 2021-02-12 | 深圳市一心视觉科技有限公司 | 一种人脸活体识别方法、装置、终端设备及存储介质 |
CN112766244A (zh) * | 2021-04-07 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 目标对象检测方法、装置、计算机设备和存储介质 |
CN113947799A (zh) * | 2021-11-11 | 2022-01-18 | 石家庄学院 | 三维人脸数据预处理方法及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831411A (zh) * | 2012-09-07 | 2012-12-19 | 云南晟邺科技有限公司 | 一种快速人脸检测方法 |
CN106529398A (zh) * | 2016-09-23 | 2017-03-22 | 深圳云天励飞技术有限公司 | 基于级联结构的快速精准人脸检测方法 |
-
2017
- 2017-07-25 CN CN201710609465.0A patent/CN107609465A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831411A (zh) * | 2012-09-07 | 2012-12-19 | 云南晟邺科技有限公司 | 一种快速人脸检测方法 |
CN106529398A (zh) * | 2016-09-23 | 2017-03-22 | 深圳云天励飞技术有限公司 | 基于级联结构的快速精准人脸检测方法 |
Non-Patent Citations (1)
Title |
---|
PEIYUN HU等: "Finding Tiny Faces", 《ARXIV:1612.04402[CS.CV]》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460403A (zh) * | 2018-01-23 | 2018-08-28 | 上海交通大学 | 一种图像中多尺度特征融合的目标检测方法与系统 |
CN112364846A (zh) * | 2021-01-12 | 2021-02-12 | 深圳市一心视觉科技有限公司 | 一种人脸活体识别方法、装置、终端设备及存储介质 |
CN112766244A (zh) * | 2021-04-07 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 目标对象检测方法、装置、计算机设备和存储介质 |
CN112766244B (zh) * | 2021-04-07 | 2021-06-08 | 腾讯科技(深圳)有限公司 | 目标对象检测方法、装置、计算机设备和存储介质 |
CN113947799A (zh) * | 2021-11-11 | 2022-01-18 | 石家庄学院 | 三维人脸数据预处理方法及设备 |
CN113947799B (zh) * | 2021-11-11 | 2023-03-14 | 石家庄学院 | 三维人脸数据预处理方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11887311B2 (en) | Method and apparatus for segmenting a medical image, and storage medium | |
JP7375006B2 (ja) | 画像セマンティックセグメンテーションネットワークのトレーニング方法、装置、機器及びコンピュータプログラム | |
CN104992167B (zh) | 一种基于卷积神经网络的人脸检测方法及装置 | |
CN107609465A (zh) | 一种用于人脸检测的多尺度检测方法 | |
CN110782420A (zh) | 一种基于深度学习的小目标特征表示增强方法 | |
CN103020606B (zh) | 一种基于时空上下文信息的行人检测方法 | |
WO2020101777A1 (en) | Segmenting objects by refining shape priors | |
CN105608454A (zh) | 基于文字结构部件检测神经网络的文字检测方法及系统 | |
CN107273870A (zh) | 一种监控场景下融合上下文信息的行人位置检测方法 | |
CN106971178A (zh) | 行人检测和再识别的方法及装置 | |
CN107220603A (zh) | 基于深度学习的车辆检测方法及装置 | |
CN110765833A (zh) | 一种基于深度学习的人群密度估计方法 | |
CN107563299B (zh) | 一种利用ReCNN融合上下文信息的行人检测方法 | |
CN110781980B (zh) | 目标检测模型的训练方法、目标检测方法及装置 | |
CN104751153B (zh) | 一种识别场景文字的方法及装置 | |
CN110009648A (zh) | 基于深浅特征融合卷积神经网络的路侧图像车辆分割方法 | |
CN111368634B (zh) | 基于神经网络的人头检测方法、系统及存储介质 | |
CN107301376A (zh) | 一种基于深度学习多层刺激的行人检测方法 | |
CN103946865B (zh) | 用于有助于检测图像内的文本的方法和装置 | |
US20210012201A1 (en) | Center-biased machine learning techniques to determine saliency in digital images | |
CN110135446A (zh) | 文本检测方法及计算机存储介质 | |
CN113095172A (zh) | 一种基于深度学习的点云三维物体检测方法 | |
CN107948586A (zh) | 基于视频拼接的跨区域运动目标检测方法和装置 | |
CN114519819B (zh) | 一种基于全局上下文感知的遥感图像目标检测方法 | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180119 |