CN112528851A - 一种人脸检测方法及系统 - Google Patents
一种人脸检测方法及系统 Download PDFInfo
- Publication number
- CN112528851A CN112528851A CN202011450368.XA CN202011450368A CN112528851A CN 112528851 A CN112528851 A CN 112528851A CN 202011450368 A CN202011450368 A CN 202011450368A CN 112528851 A CN112528851 A CN 112528851A
- Authority
- CN
- China
- Prior art keywords
- face detection
- detection frame
- score
- frames
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 662
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000012216 screening Methods 0.000 claims abstract description 23
- 238000013135 deep learning Methods 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 18
- 230000001629 suppression Effects 0.000 claims description 9
- 230000005764 inhibitory process Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 208000029152 Small face Diseases 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 240000001899 Murraya exotica Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明涉及一种人脸检测方法及系统,利用基于深度学习方法的人脸检测器生成具有多个人脸检测框的待检测图片,采用人群计数的密度估计网络获得密度图,确定密度图中每个划分区域的密度,根据每个人脸检测框的宽和高,确定每个划分区域中的待提分人脸检测框,结合每个划分区域的密度提高待提分人脸检测框的检测框分数,利用密度图提供的密度先验和同类物体提供的上下文信息使高密度人群中的低分辨率、尺寸小的人脸更多的被检测出来;采用基于分数和尺寸的非极大值抑制方法,删除冗余的人脸检测框,确定最终的人脸检测框,从检测框的分数和尺寸两个方面做出精细化的筛选,使去除冗余框更加的合理,从而提高了人脸检测的准确性。
Description
技术领域
本发明涉及人脸检测技术领域,特别是涉及一种人脸检测方法及系统。
背景技术
人脸检测问题已经成为计算机视觉领域研究价值和应用价值最高的热点问题。在计算机视觉领域中,目标检测一直都是一个热门的研究领域,人脸检测又是其中的一个分支,目前国内外的人脸检测研究都是基于已有的目标检测算法展开的。
现有技术中目标检测方法主要分成两类:传统的基于手工提取特征的检测方法和基于深度学习的检测方法。随着深度神经网络的发展,近年来,基于深度学习的检测方法已经成为主流。当下,基于深度学习的目标检测算法可以分为基于anchor-base和anchor-free的检测算法。其中基于anchor-base的检测方法又细分为一阶段检测算法和两阶段检测算法,在准确率方面,二阶段的检测算法表现较好,但是在速度方面达不到工业应用上的要求。随着目标检测算法在工业界的运用,性能和速度均有良好表现的一阶段检测算法也应运而生,其在检测速度方面优于两阶段检测算法,同时在性能方面表现也不错,当然相较于两阶段检测算法还存在一定差距,所以基于anchor-base的两种方法随着在不同场景中的运用,也各自发展着,并形成了以Faster R-CNN(Ren S Q,He K M,Girshick R,etal.Faster R-CNN:Towards Real-Time Object Detection with Region ProposalNetworks[J].Advances in Neural Information Processing Systems 28(NIPS),2015,28.)为代表的两阶段检测器系列和以SSD(Liu W,Anguelov D,Erhan D,et al.SSD:SingleShot MultiBox Detector[J].Computer Vision-ECCV 2016,Pt I,2016,9905:21-37.),YOLO(Redmon J,Divvala S,Girshick R,et al.You Only Look Once:Unified,Real-TimeObject Detection[J].2016IEEE Conference on Computer Vision and PatternRecognition(CVPR),2016:779-788.)系列为代表的一阶段检测器。但是近年来,也有学者提出基于anchor-base的检测算法太依赖于预定义的anchor尺寸和数量,当在某个算法中改变这些超参数,将直接影响检测器的性能,因此基于anchor-free的检测方法也被提了出来,并取得了不错的发展,超过了很多一阶段检测器的性能,但是在检测准确率方面相较于两阶段的anchor-base方法还有着很大差距。目前,现有的人脸检测算法大多是基于anchor-base的方法,并在流行的基准数据集WIDER FACE和FDDB上取得了不错的效果。
最早的基于anchor的目标检测算法是Faster R-CNN算法,它使用带anchor的Region Proposal Network(RPN)结构去预测目标边界框。它首先预设一组不同尺度不同位置的固定参考框,为了尽可能的覆盖所有目标出现的位置,预定义边框通常有上千个甚至更多,然后在使用网络去分类回归这些目标边界框,从而大大提高了目标检测的准确率。
基于anchor的目标检测方法,为了尽可能的覆盖所有目标出现的位置,预设了大量的不同尺度不同位置的目标边界框,最后这些预测的目标边界框与真实边界框(groundtruth)的交并比达到阈值后,都会被保留下来,认为检测到了目标,这就会造成一个问题,最后的每一个目标都会对应很多个检测框。非极大值抑制算法(NMS)就是为了解决这种冗余框的问题,其使用的策略为将所有的框按得分从高到低排序,先选择分值最高的检测框,删除所有和它的交并比超出阈值的框,对剩下的框继续此操作。NMS中的这种策略虽然可以去除很多冗余框,但也会带来一个问题,当目标中存在很多遮挡的时候,比如高密度人群场景下很多人脸存在遮挡,此时被遮挡的人脸的检测框也会被NMS算法去除,从而造成很多漏检。考虑到这种情况,Soft-NMS(Bodla N,Singh B,Chellappa R,et al.Soft-NMS—Improving Object Detection with One Line of Code[J].international conferenceon computer vision,2017:5562-5570.)提出了另一种策略,即对于NMS中直接删除的框,Soft-NMS依据交并比来降低这个框的分数而不是直接删除这个框,最终删除所有低于分数阈值的检测框。这种策略可以使得被遮挡的目标的检测框被保留下来,但是对于很多误检的检测框,其分数不能够降到分数阈值之下,造成了很多误检冗余框的增加。同时,这两种方法在面对当两个交叠的检测框的尺寸相差很大的时候,一种直观的理解可以看成一个面积大的框里包含了一个面积小的检测框,它们的交并比达不到删除的阈值,此时会造成这种冗余框删不掉。
高密度人群场景下的人脸检测在目前依然充满着挑战,因为高密度人群场景中有很多低分辨率人脸、小人脸以及各种遮挡人脸,对人脸检测造成了很大的挑战。HR(Hu P,Ramanan D.Finding Tiny Faces[J].computer vision and pattern recognition,2017:1522-1530.)在人脸检测中使用了上下文信息,并证明了上下文信息对检测小人脸、低分辨率等困难人脸有着很重要的作用。
现有技术在去除冗余框的算法中从检测框的分数层面对检测框做出筛选,能够更合理的去除冗余框,但是其在面对两个重叠检测框大小相差太大时,仅仅从分数层面无法有效去除这种冗余框。并且将上下文信息使用在整张图像上的所有人脸中,但是整个图像中的人群分布有疏有密,人脸也有大有小,所以在整个图像中运用这个上下文信息也忽略了很多具体的信息。
发明内容
本发明的目的是提供一种人脸检测方法及系统,以检测到更多的真实人脸,提高人脸检测的准确性。
为实现上述目的,本发明提供了如下方案:
一种人脸检测方法,所述方法包括:
将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息;所述人脸检测框的信息包括宽、高和反应人脸概率的检测框分数;
根据所述具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得所述具有多个人脸检测框的待检测图片的密度图;
确定所述密度图中每个划分区域的密度;
基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框;
根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
可选的,所述确定所述密度图中每个划分区域的密度,具体包括:
其中,Ai为密度图中第i个划分区域,为密度图中第i个划分区域的人数,Dest(p|Ai)为密度图Dest中区域Ai中的每一个像素值p,ρi为密度图中第i个划分区域的密度,ai为密度图中第i个划分区域的面积。
可选的,所述基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框,具体包括:
基于所述具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量;
根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积,并根据所述平均面积确定第i个划分区域的面积阈值范围;
将第i个划分区域中人脸检测框的面积在所述面积阈值范围内的人脸检测框作为待提分人脸检测框。
可选的,所述根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框,具体包括:
根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,利用公式s′i=sigmoid(ρi*ni)*si+si,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
其中,s′i为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。
可选的,所述采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,具体包括:
获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断所述分数较低的人脸检测框是否小于检测框分数阈值,获得第一判断结果;
若所述第一判断结果表示是,则删除所述分数较低的人脸检测框;
若所述第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚所述分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框;
当所述惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除所述惩罚后的人脸检测框;
当所述第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框;
所有未删除的人脸检测框构成最终的人脸检测框;
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
一种人脸检测系统,所述系统包括:
人脸检测框生成模块,用于将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息;所述人脸检测框的信息包括宽、高和反应人脸概率的检测框分数;
密度图获得模块,用于根据所述具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得所述具有多个人脸检测框的待检测图片的密度图;
密度确定模块,用于确定所述密度图中每个划分区域的密度;
待提分人脸检测框确定模块,用于基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框;
提分后的人脸检测框获得模块,用于根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
最终的人脸检测框确定模块,用于采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
可选的,所述密度确定模块,具体包括:
其中,Ai为密度图中第i个划分区域,为密度图中第i个划分区域的人数,Dest(p|Ai)为密度图Dest中区域Ai中的每一个像素值p,ρi为密度图中第i个划分区域的密度,ai为密度图中第i个划分区域的面积。
可选的,所述待提分人脸检测框确定模块,具体包括:
人脸检测框的数量确定子模块,用于基于所述具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量;
面积阈值范围确定子模块,用于根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积,并根据所述平均面积确定第i个划分区域的面积阈值范围;
待提分人脸检测框确定子模块,用于将第i个划分区域中人脸检测框的面积在所述面积阈值范围内的人脸检测框作为待提分人脸检测框。
可选的,所述提分后的人脸检测框获得模块,具体包括:
提分后的人脸检测框获得子模块,用于根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,利用公式si′=sigmoid(ρi*ni)*si+si,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
其中,s′i为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。
可选的,所述最终的人脸检测框确定模块,具体包括:
第一判断结果获得子模块,用于获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断所述分数较低的人脸检测框是否小于检测框分数阈值,获得第一判断结果;
分数较低的人脸检测框删除子模块,用于若所述第一判断结果表示是,则删除所述分数较低的人脸检测框;
惩罚后的人脸检测框获得子模块,用于若所述第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚所述分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框;
惩罚后的人脸检测框删除子模块,用于当所述惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除所述惩罚后的人脸检测框;
人脸检测框删除子模块,用于当所述第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框;
最终的人脸检测框构成子模块,用于所有未删除的人脸检测框构成最终的人脸检测框;
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种人脸检测方法,利用基于深度学习方法的人脸检测器生成具有多个人脸检测框的待检测图片,采用人群计数的密度估计网络获得具有多个人脸检测框的待检测图片的密度图,确定密度图中每个划分区域的密度,根据每个人脸检测框的宽和高,将每个划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框,根据每个划分区域的密度和待提分人脸检测框的检测框分数,提高待提分人脸检测框的检测框分数,利用密度图提供的密度先验和同类物体提供的上下文信息使高密度人群中的低分辨率、尺寸小的人脸更多的被检测出来;采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片,从检测框的分数和尺寸两个方面做出精细化的筛选来替代传统的非极大值抑制方法,使去除冗余框更加的合理,从而提高了人脸检测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种人脸检测方法的流程图;
图2为本发明提供的一种人脸检测方法的原理图;
图3为本发明提供的基于密度先验的共存人脸检测方法的原理图;
图4为本发明提供的基于分数和尺寸的非极大值抑制方法的原理图;
图5为本发明实施例提供的PR曲线对比图;
图6为本发明实施例提供的真正类与假正类的对比图;图6(a)为真正类的对比图;图6(b)为假正类的对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种人脸检测方法及系统,以检测到更多的真实人脸,提高人脸检测的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供一种人脸检测方法,如图1所示,方法包括:
S101,将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息;人脸检测框的信息包括宽、高和反应人脸概率的检测框分数。
S102,根据具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得具有多个人脸检测框的待检测图片的密度图。
S103,确定密度图中每个划分区域的密度。
S104,基于具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框。
S105,根据每个划分区域的密度和待提分人脸检测框的检测框分数,提高待提分人脸检测框的检测框分数,获得提分后的人脸检测框。
S106,采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
具体过程如下:
步骤S101,检测器根据输入的待检测图片生成很多个人脸检测框,人脸检测框的表示形式为(x,y,w,h,score),x、y代表坐标,w、h分别代表检测框的宽和高,score代表检测器认为这个检测框是人脸的概率,分数越高,就代表这个检测框是人脸的概率越大,这几个变量就可以表示一个检测框。检测框是由检测器在待检测图片上生成的很多个具有不同大小和不同位置的矩形框,并且以置信度分数代表其是人脸的概率。
步骤S102,由于密度图不仅可以通过对其积分求得总人数,还可以反映人头位置并提供空间分布,因此在人群计数领域大都采用估计出人群密度图来进行人群计数。密度图可以告诉我们人群的分布,不同密度区域的人数以及人脸尺寸存在很大差异。在高度密集分布的人群场景下存在着很多低分辨率的小人脸,由于光照及拍摄角度一样的情况下,这些人脸在一定程度上存在相似性,比如颜色、尺寸、纹理等,我们称这种相似性为共存性,是一种广义的上下文信息。因此,我们根据密度图提供的先验知识,找到高密度人群区域,并对其中的困难检测人脸利用共存性的上下文信息,将那些漏检的相似真实人脸进行提分。
其中,Ai为密度图中第i个划分区域,为密度图中第i个划分区域的人数,Dest(p|Ai)为密度图Dest中区域Ai中的每一个像素值p,ρi为密度图中第i个划分区域的密度,ai为密度图中第i个划分区域的面积。
步骤S104,具体包括:
基于具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量;
根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积(如图3所示的高分人脸的平均尺寸bsavg),并根据平均面积确定第i个划分区域的面积阈值范围;面积阈值范围为0.9*bsavg~1.1*bsavg。
将第i个划分区域中人脸检测框的面积bsi在面积阈值范围内的人脸检测框作为待提分人脸检测框。
步骤S105,具体包括:
根据每个划分区域的密度和待提分人脸检测框的检测框分数,利用公式s′i=sigmoid(ρi*ni)*si+si,提高待提分人脸检测框的检测框分数,获得提分后的人脸检测框。
其中,si′为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。当ρi越大时,表示区域密度越高,场景越复杂,存在漏检的人脸越多,即si是人脸的概率越大,经过提分之后,就不会被删除,保留了下来,因此能够检测出之前检测器漏检的人脸。
步骤S102-S105构成图2中所示的基于密度先验的共存人脸检测方法,基于密度先验的共存人脸检测方法的原理图如图3所示。
步骤S106,如图4所示,具体包括:
获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断分数较低的人脸检测框是否小于检测框分数阈值(此步骤为NMS(NonMaximum Suppression,非极大值抑制)),获得第一判断结果;优选地,第一交并比阈值为图4所示的0.3,检测框分数阈值为图4所示的0.5。两个人脸检测框分别为框A和框B,框A的检测框分数sk高于框B的检测框分数sj。
若第一判断结果表示是,则删除分数较低的人脸检测框;
若第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框;此步骤为Soft-NMS;
当惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除惩罚后的人脸检测框;
当两个重叠的人脸检测框的尺寸相差很大时,它们的交集远小于并集,此时它们的交并比IoU(bm,bn)小于NMS删除冗余框的阈值,NMS和Soft-NMS都不能删除这个冗余框,就会造成一些误检。因此,通过对检测框尺寸的精细考虑,提出了基于尺寸层面的去除冗余框的方法,定义一个新的判断标准IoB(intersection over box)用来去除尺寸相差很大的冗余框。即,利用公式获得提分后的人脸检测框和未提分的人脸检测框中每个人脸检测框与其余人脸检测框的第二交并比;
当第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框;这样就避免了两个检测框尺寸差异太大带来的错检冗余框问题。
所有未删除的人脸检测框构成最终的人脸检测框。
基于分数和尺寸的非极大值抑制方法能够更好的去除错检冗余框并且保留更多的真实人脸检测框。
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
NMS在两个达到重叠阈值的检测框中直接删除分数较低的检测框,这种方式会导致很多高分的被遮挡的检测框被删除,导致人脸的漏检。Soft-NMS通过惩罚检测框的分数,这样会导致很多的低分冗余检测框被惩罚后仍然无法删除。因此,本发明综合了NMS和Soft-SNM的方法,通过对检测框分数的精细考虑,提出了基于分数层面的去除冗余框方法。因为NMS会删除很多高分的被遮挡人脸检测框,在高分区域运用Soft-NMS的思想,降低其分数而不是直接删除。在低分区域,使用NMS的性能,直接删除低分的检测框,这样就不会导致很多的低分冗余检测框无法被删除。
本发明提供了人脸检测器选择HR模型的具体实施例。
图5展示了将基于密度先验的共存人脸检测方法运用于高密度人群人脸数据集(Crowd Face)前后的PR曲线对比,上面的实线代表在HR模型中使用基于密度先验的共存人脸检测方法,下面的虚线代表原始的HR检测模型,由结果可知,基于密度先验的共存人脸检测方法有着明显的提升。
图6展示了将基于分数和尺寸特定的非极大值抑制方法运用于高密度人群数据集(Crowd Face)前后的真正类(True Positive)与假正类(False Positive)的对比,由结果可知,基于分数和尺寸特定的非极大值抑制方法不仅可以降低假正类还可以增加真正类。
将本发明所提的人脸检测方法运用于高密度人群场景下,检测结果证明本发明的人脸检测方法可以检测到更多的真实人脸。
本发明还提供了一种人脸检测系统,系统包括:
人脸检测框生成模块,用于将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息。人脸检测框的信息包括宽、高和反应人脸概率的检测框分数。
密度图获得模块,用于根据具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得具有多个人脸检测框的待检测图片的密度图。
密度确定模块,用于确定密度图中每个划分区域的密度。
待提分人脸检测框确定模块,用于基于具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框。
提分后的人脸检测框获得模块,用于根据每个划分区域的密度和待提分人脸检测框的检测框分数,提高待提分人脸检测框的检测框分数,获得提分后的人脸检测框。
最终的人脸检测框确定模块,用于采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
密度确定模块,具体包括:
其中,Ai为密度图中第i个划分区域,为密度图中第i个划分区域的人数,Dest(p|Ai)为密度图Dest中区域Ai中的每一个像素值p,ρi为密度图中第i个划分区域的密度,ai为密度图中第i个划分区域的面积。
待提分人脸检测框确定模块,具体包括:
人脸检测框的数量确定子模块,用于基于具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量。
面积阈值范围确定子模块,用于根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积,并根据平均面积确定第i个划分区域的面积阈值范围。
待提分人脸检测框确定子模块,用于将第i个划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框。
提分后的人脸检测框获得模块,具体包括:
提分后的人脸检测框获得子模块,用于根据每个划分区域的密度和待提分人脸检测框的检测框分数,利用公式s′i=sigmoid(ρi*ni)*si+si,提高待提分人脸检测框的检测框分数,获得提分后的人脸检测框。
其中,s′i为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。
最终的人脸检测框确定模块,具体包括:
第一判断结果获得子模块,用于获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断分数较低的人脸检测框是否小于检测框分数阈值,获得第一判断结果。
分数较低的人脸检测框删除子模块,用于若第一判断结果表示是,则删除分数较低的人脸检测框。
惩罚后的人脸检测框获得子模块,用于若第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框。
惩罚后的人脸检测框删除子模块,用于当惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除惩罚后的人脸检测框。
人脸检测框删除子模块,用于当第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框。
最终的人脸检测框构成子模块,用于所有未删除的人脸检测框构成最终的人脸检测框。
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种人脸检测方法,其特征在于,所述方法包括:
将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息;所述人脸检测框的信息包括宽、高和反应人脸概率的检测框分数;
根据所述具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得所述具有多个人脸检测框的待检测图片的密度图;
确定所述密度图中每个划分区域的密度;
基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框;
根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
3.根据权利要求1所述的人脸检测方法,其特征在于,所述基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框,具体包括:
基于所述具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量;
根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积,并根据所述平均面积确定第i个划分区域的面积阈值范围;
将第i个划分区域中人脸检测框的面积在所述面积阈值范围内的人脸检测框作为待提分人脸检测框。
4.根据权利要求1所述的人脸检测方法,其特征在于,所述根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框,具体包括:
根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,利用公式s′i=sigmoid(ρi*ni)*si+si,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
其中,si′为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。
5.根据权利要求1所述的人脸检测方法,其特征在于,所述采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,具体包括:
获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断所述分数较低的人脸检测框是否小于检测框分数阈值,获得第一判断结果;
若所述第一判断结果表示是,则删除所述分数较低的人脸检测框;
若所述第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚所述分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框;
当所述惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除所述惩罚后的人脸检测框;
当所述第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框;
所有未删除的人脸检测框构成最终的人脸检测框;
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
6.一种人脸检测系统,其特征在于,所述系统包括:
人脸检测框生成模块,用于将待检测图片输入基于深度学习方法的人脸检测器,生成具有多个人脸检测框的待检测图片,并获取每个人脸检测框的信息;所述人脸检测框的信息包括宽、高和反应人脸概率的检测框分数;
密度图获得模块,用于根据所述具有多个人脸检测框的待检测图片,利用人群计数的密度估计网络,获得所述具有多个人脸检测框的待检测图片的密度图;
密度确定模块,用于确定所述密度图中每个划分区域的密度;
待提分人脸检测框确定模块,用于基于所述具有多个人脸检测框的待检测图片,根据每个人脸检测框的宽和高,将每个所述划分区域中人脸检测框的面积在面积阈值范围内的人脸检测框作为待提分人脸检测框;
提分后的人脸检测框获得模块,用于根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
最终的人脸检测框确定模块,用于采用基于分数和尺寸的非极大值抑制方法,删除提分后的人脸检测框和未提分的人脸检测框中冗余的人脸检测框,确定最终的人脸检测框,并输出具有最终的人脸检测框的待检测图片。
8.根据权利要求6所述的人脸检测系统,其特征在于,所述待提分人脸检测框确定模块,具体包括:
人脸检测框的数量确定子模块,用于基于所述具有多个人脸检测框的待检测图片,筛选出第i个划分区域中人脸检测框的检测框分数大于第一分数阈值的人脸检测框,并确定筛选后的人脸检测框的数量;
面积阈值范围确定子模块,用于根据筛选后的人脸检测框的宽、高以及筛选后的人脸检测框的数量,获得第i个划分区域中筛选后的人脸检测框的平均面积,并根据所述平均面积确定第i个划分区域的面积阈值范围;
待提分人脸检测框确定子模块,用于将第i个划分区域中人脸检测框的面积在所述面积阈值范围内的人脸检测框作为待提分人脸检测框。
9.根据权利要求6所述的人脸检测系统,其特征在于,所述提分后的人脸检测框获得模块,具体包括:
提分后的人脸检测框获得子模块,用于根据每个划分区域的密度和所述待提分人脸检测框的检测框分数,利用公式s′i=sigmoid(ρi*ni)*si+si,提高所述待提分人脸检测框的检测框分数,获得提分后的人脸检测框;
其中,s′i为提分后的人脸检测框的检测框分数,ρi为密度图中第i个划分区域的密度,ni为高于第一分数阈值的人脸检测框的数量,si为待提分人脸检测框的检测框分数,sigmoid()为激活函数。
10.根据权利要求6所述的人脸检测系统,其特征在于,所述最终的人脸检测框确定模块,具体包括:
第一判断结果获得子模块,用于获取第一交并比大于第一交并比阈值的两个人脸检测框中检测框分数较低的人脸检测框,判断所述分数较低的人脸检测框是否小于检测框分数阈值,获得第一判断结果;
分数较低的人脸检测框删除子模块,用于若所述第一判断结果表示是,则删除所述分数较低的人脸检测框;
惩罚后的人脸检测框获得子模块,用于若所述第一判断结果表示否,则利用公式s′j=sj*f(IoU)惩罚所述分数较低的人脸检测框的检测框分数,获得惩罚后的人脸检测框;
惩罚后的人脸检测框删除子模块,用于当所述惩罚后的人脸检测框的检测框分数小于或等于第二分数阈值时,删除所述惩罚后的人脸检测框;
人脸检测框删除子模块,用于当所述第二交并比大于第二交并比阈值时,删除两个人脸检测框中检测框分数较低的人脸检测框;
最终的人脸检测框构成子模块,用于所有未删除的人脸检测框构成最终的人脸检测框;
其中,IoU()和IoB()分别为第一交并比函数和第二交并比函数,bm和bn分别为第m个、第n个人脸检测框,min(bm,bn)为bm和bn中面积较小的人脸检测框,s′j为惩罚后的人脸检测框的检测框分数,sj为计算交并比的两个人脸检测框中分数较低的人脸检测框的检测框分数,f()为惩罚函数,f(IoU)=exp(-(IoU*IoU)/σ),σ为高斯核参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011450368.XA CN112528851B (zh) | 2020-12-09 | 2020-12-09 | 一种人脸检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011450368.XA CN112528851B (zh) | 2020-12-09 | 2020-12-09 | 一种人脸检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112528851A true CN112528851A (zh) | 2021-03-19 |
CN112528851B CN112528851B (zh) | 2024-03-29 |
Family
ID=74998675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011450368.XA Active CN112528851B (zh) | 2020-12-09 | 2020-12-09 | 一种人脸检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528851B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229381A (zh) * | 2017-12-29 | 2018-06-29 | 湖南视觉伟业智能科技有限公司 | 人脸图像生成方法、装置、存储介质和计算机设备 |
CN108734145A (zh) * | 2018-02-27 | 2018-11-02 | 北京紫睛科技有限公司 | 一种基于密度自适应人脸表征模型的人脸识别方法 |
WO2018233205A1 (zh) * | 2017-06-21 | 2018-12-27 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN109101899A (zh) * | 2018-07-23 | 2018-12-28 | 北京飞搜科技有限公司 | 一种基于卷积神经网络的人脸检测方法及系统 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
CN109934047A (zh) * | 2017-12-15 | 2019-06-25 | 浙江舜宇智能光学技术有限公司 | 基于深度学习的人脸识别系统及其人脸识别方法 |
-
2020
- 2020-12-09 CN CN202011450368.XA patent/CN112528851B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018233205A1 (zh) * | 2017-06-21 | 2018-12-27 | 北京大学深圳研究生院 | 使用高斯惩罚检测图像中行人的方法 |
CN109934047A (zh) * | 2017-12-15 | 2019-06-25 | 浙江舜宇智能光学技术有限公司 | 基于深度学习的人脸识别系统及其人脸识别方法 |
CN108229381A (zh) * | 2017-12-29 | 2018-06-29 | 湖南视觉伟业智能科技有限公司 | 人脸图像生成方法、装置、存储介质和计算机设备 |
CN108734145A (zh) * | 2018-02-27 | 2018-11-02 | 北京紫睛科技有限公司 | 一种基于密度自适应人脸表征模型的人脸识别方法 |
CN109101899A (zh) * | 2018-07-23 | 2018-12-28 | 北京飞搜科技有限公司 | 一种基于卷积神经网络的人脸检测方法及系统 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112528851B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112001339B (zh) | 一种基于YOLO v4的行人社交距离实时监测方法 | |
CN108446617B (zh) | 抗侧脸干扰的人脸快速检测方法 | |
CN108334848B (zh) | 一种基于生成对抗网络的微小人脸识别方法 | |
JP4976608B2 (ja) | 画像をイベントに自動的に分類する方法 | |
CN109918969B (zh) | 人脸检测方法及装置、计算机装置和计算机可读存储介质 | |
JP3552179B2 (ja) | 話者認識のための特徴ベクトル生成方法 | |
CN103093212B (zh) | 基于人脸检测和跟踪截取人脸图像的方法和装置 | |
CN108416250A (zh) | 人数统计方法及装置 | |
CN109886128B (zh) | 一种低分辨率下的人脸检测方法 | |
CN104504362A (zh) | 基于卷积神经网络的人脸检测方法 | |
JP2003515230A (ja) | ビデオストリームの分類可能な記号の分離方法及びシステム | |
CN105893946A (zh) | 一种正面人脸图像的检测方法 | |
Jamil et al. | Edge-based features for localization of artificial Urdu text in video images | |
CN115841649A (zh) | 一种用于城市复杂场景的多尺度人数统计方法 | |
CN113657250A (zh) | 一种基于监控视频的火焰检测方法及系统 | |
CN113920585A (zh) | 行为识别方法及装置、设备和存储介质 | |
Panda et al. | An end to end encoder-decoder network with multi-scale feature pulling for detecting local changes from video scene | |
CN109299702A (zh) | 一种基于深度时空图的人体行为识别方法及系统 | |
Yang et al. | Combining Gaussian mixture model and HSV model with deep convolution neural network for detecting smoke in videos | |
KR20080079443A (ko) | 영상으로부터의 객체 검출 방법 및 장치 | |
CN107832732A (zh) | 基于三叉树遍历的车道线检测方法 | |
CN110414430B (zh) | 一种基于多比例融合的行人重识别方法及装置 | |
CN109657577B (zh) | 一种基于熵和运动偏移量的动物检测方法 | |
CN112528851A (zh) | 一种人脸检测方法及系统 | |
Odetallah et al. | Human visual system-based smoking event detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |