CN112434674B - 基于标注框虚拟扩增的微小人脸检测方法、系统及设备 - Google Patents
基于标注框虚拟扩增的微小人脸检测方法、系统及设备 Download PDFInfo
- Publication number
- CN112434674B CN112434674B CN202110098072.4A CN202110098072A CN112434674B CN 112434674 B CN112434674 B CN 112434674B CN 202110098072 A CN202110098072 A CN 202110098072A CN 112434674 B CN112434674 B CN 112434674B
- Authority
- CN
- China
- Prior art keywords
- face
- human face
- virtual
- detection
- rectangular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000003321 amplification Effects 0.000 title claims abstract description 55
- 238000001514 detection method Methods 0.000 claims abstract description 120
- 238000002372 labelling Methods 0.000 claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 13
- 208000029152 Small face Diseases 0.000 claims abstract description 9
- 238000011478 gradient descent method Methods 0.000 claims abstract description 9
- 239000000126 substance Substances 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 4
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 4
- 230000003416 augmentation Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 6
- 230000000007 visual effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000028752 abnormal posture Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明属于视觉检测和图像处理领域,具体涉及了一种基于标注框虚拟扩增的微小人脸检测方法、系统、装置,旨在解决模型训练中仅有少量的微小人脸特征图区域被定义为正,从而导致模型对于微小人脸的检测精度和准确性较低的问题。本发明包括:使用矩形框标注微小人脸;基于LFFD构建人脸检测模型;以模型针对小尺度人脸检测分支的特征图下采样倍数为依据,进行矩形框的虚拟扩增;分别基于矩形框和虚拟扩增框生成模型的分类和预测目标;通过反向传播和随机梯度下降法迭代进行模型训练;通过训练后的同时检测通常大小人脸和微小人脸的模型进行在线人脸检测。本发明将标注框虚拟扩增应用于微小人脸数据,提升微小人脸的检出率,实现了微小人脸检测。
Description
技术领域
本发明属于视觉检测和图像处理领域,具体涉及了一种基于标注框虚拟扩增的微小人脸检测方法、系统及设备。
背景技术
在安防监控领域,人脸检测算法作为人脸识别中的一个极其重要的技术,已经被广泛应用。现阶段,人脸检测算法面临开放监控环境带来的各种挑战,比如逆光、光线不足、部分遮挡、姿态异常等等。此外,人脸检测算法通常被设计为检测较大的人脸(通常大于40个像素),即距离摄像头较近的情况。如果在不升级摄像头的前提下,要检测远距离的人脸,就需要引入微小人脸的检测技术。微小人脸检测不仅要求能够检测到通常大小的人脸,而且需要检测像素小于等于16的人脸。除了要克服上述的一些挑战,微小人脸检测还面临低像素带来的信息干扰和噪声,因此,其难度更大。微小人脸检测的技术能够变相增大摄像头的工作距离,拓宽人脸相关技术在安防监控领域的应用范围。
目前,主流的人脸检测算法均采用了深度学习的方法。具体来说,可以分为两类:单阶段有锚框的方法和单阶段无锚框的方法。两类方法均采用了相似的主干神经网络,且检测小尺度人脸时都使用了分辨率较大的特征图作为主要的信息来源。由于微小人脸的面积小,在两类方法的训练过程中,仅有少量的特征图区域被定义为正,这导致训练得到的模型对微小人脸的检测性能非常有限。
发明内容
为了解决现有技术中的上述问题,即模型训练中仅有少量的微小人脸特征图区域被定义为正,从而导致模型对于微小人脸的检测精度和准确性较低的问题,本发明提供了一种基于标注框虚拟扩增的微小人脸检测方法,该检测方法包括以下步骤:
步骤S10,获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
步骤S20,以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
步骤S30,基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
步骤S40,分别使用基于带有矩形标注框和其对应的带有虚拟标注框的图像集生成人脸检测模型的分类和预测目标,获得初始人脸检测模型;
步骤S50,采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
步骤S60,通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
在一些优选的实施例中,所述人脸检测模型包括25个卷积层和8个检测分支;
其中,针对小尺度人脸的检测分支为位于卷积层8和卷积层10的b1检测分支与b2检测分支。
在一些优选的实施例中,步骤S30包括:
在一些优选的实施例中,步骤S40包括:
在分类目标和预测目标的生成过程中,将特征图上为正的区域的设置和真实位置预测之外的模型参数及结构设置为与LFFD一致,获得初始人脸检测模型。
在一些优选的实施例中,所述微小人脸和通常大小人脸,其判断的设定像素阈值为16。
在一些优选的实施例中,所述b1检测分支与b2检测分支对应的特征图下采样倍数均为4。
本发明的另一方面,提出了一种基于标注框虚拟扩增的微小人脸检测系统,该检测系统包括以下模块:
图像获取及矩形框标注模块,配置为获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
人脸检测模型构建及参数获取模块,配置为以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
矩形标注框扩增模块,配置为基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
初始人脸检测模型构建模块,配置为分别使用基于带有矩形标注框和其对应的带有虚拟标注框的图像集生成人脸检测模型的分类和预测目标,获得初始人脸检测模型;
模型训练模块,配置为采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
在线检测模块,配置为通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
本发明的第三方面,提出了一种电子设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述的基于标注框虚拟扩增的微小人脸检测方法。
本发明的第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现上述的基于标注框虚拟扩增的微小人脸检测方法。
本发明的有益效果:
本发明基于标注框虚拟扩增的微小人脸检测方法,将标注框虚拟扩增应用于微小人脸数据,有效提升了检测网络对微小人脸的关注度,从而有效提升了微小人脸的检出率,实现了微小人脸检测的目的。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于标注框虚拟扩增的微小人脸检测方法的流程示意图;
图2是本发明基于标注框虚拟扩增的微小人脸检测方法一种实施例的LFFD的模型结构示意图;
图3是本发明基于标注框虚拟扩增的微小人脸检测方法一种实施例的矩形标注框虚拟扩增示意图;
图4是用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的一种基于标注框虚拟扩增的微小人脸检测方法,该检测方法包括以下步骤:
步骤S10,获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
步骤S20,以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
步骤S30,基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
步骤S40,分别使用基于带有矩形标注框和其对应的带有虚拟标注框的图像集生成人脸检测模型的分类和预测目标,获得初始人脸检测模型;
步骤S50,采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
步骤S60,通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
为了更清晰地对本发明基于标注框虚拟扩增的微小人脸检测方法进行说明,下面结合图1对本发明实施例中各步骤展开详述。
本发明第一实施例的基于标注框虚拟扩增的微小人脸检测方法,包括步骤S10-步骤S60,各步骤详细描述如下:
步骤S10,获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸;所述微小人脸为像素值小于或等于设定像素阈值的人脸。
微小人脸和通常大小人脸,其判断的设定像素阈值为16,即像素值大于16的人脸为通常大小人脸,像素值小于或等于16的人脸为微小人脸。
微小人脸数据可以通过摄像头采集,也可以通过将通常人脸进行下采样获得,通过下采样获取微小人脸数据更为高效,并且解决了实际应用中通过摄像头采集数据的局限性。
步骤S20,以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数。
如图2所示,为本发明基于标注框虚拟扩增的微小人脸检测方法一种实施例的
LFFD的模型结构示意图,模型包括25个卷积层和8个检测分支,卷积层c1到c10为模型的
tiny part(微小人脸检测部分),卷积层c11到c15为模型的small part(小人脸检测部分),
卷积层c16到c16为模型的medium part(中人脸检测部分),卷积层c19到c25为模型的large
part(大人脸检测部分),loss branch 1(检测分支b1)位于卷积层8,loss branch 2(检测
分支b2)位于卷积层10,loss branch 3(检测分支b3)位于卷积层13,loss branch 4(检测分
支b4)位于卷积层15,loss branch 5(检测分支b5)位于卷积层18,loss branch 6(检测分支
b6)位于卷积层21,loss branch 7(检测分支b7)位于卷积层23,loss branch 8(检测分支
b8)位于卷积层25,其中,针对小尺度人脸的检测分支为位于中卷积层8和卷积层10的b1检测
分支与b2检测分支,b1检测分支与b2检测分支对应的特征图下采样倍数均为4,代
表箭头所指的卷积层的卷积核为3×3,卷积步长为2,特征图填充宽度为0(conv 3×3,
stride 2,pad 0),代表箭头所指的卷积层的卷积核为3×3,卷积步长为1,特征图
填充宽度为1(conv 3×3,stride 1,pad 1),代表箭头所指的卷积层的卷积核为1
×1,卷积步长为1,特征图填充宽度为0(conv 1×1,stride 1,pad 0),代表箭头两
端对应的卷积层进行残差连接操作(residual connection)。模型的8个检测分支的结构一
样,均包括一个共享的卷积层(conv 1×1,stride 1,pad 0)、属于分类分支的两个卷积层
(conv 1×1,stride 1,pad 0)和属于回归分支的两个卷积层(conv 1×1,stride 1,pad
0),face classification为人脸分类的分支,bbox regression为人脸置信框预测的分支。
步骤S30,基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集。
如图3所示,为本发明基于标注框虚拟扩增的微小人脸检测方法一种实施例的矩形标注框虚拟扩增示意图,扩增过程具体包括:
步骤S40,分别使用基于带有矩形标注框和其对应的带有虚拟标注框的图像集生成人脸检测模型的分类和预测目标,获得初始人脸检测模型。
在网络针对小尺度人脸的检测分支上分别使用新旧标注框(矩形标注框为旧标注框,虚拟标注框为新标注框)生成分类和回归的学习目标,用于指导神经网络的学习。由于使用了较大的虚拟扩增后的标注框作为分类目标的生成,所以在对应特征图上被视为正的区域会增多,从而使得微小人脸的学习更加充分,具体包括:
在脸/非脸的分类目标的生成过程中,以集合为依据进行特征图
上为正的区域的设置。由于使用了虚拟扩增的方式,微小人脸的虚拟面积变大,因此在对应
的特征图上能得到更多的正区域,从而在学习的过程中受到更多的关注。
在分类目标和预测目标的生成过程中,将特征图上为正的区域的设置和真实位置预测之外的模型参数及结构设置为与LFFD一致,获得初始人脸检测模型。
步骤S50,采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸。
基于扩增的图像集和原有的图像集,通过反向传播和随机梯度下降法迭代进行模型的训练,直至模型的损失函数值低于设定阈值或者达到设定的模型训练次数,获得同时检测通常大小人脸和微小人脸的模型。
步骤S60,通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
本发明第二实施例的基于标注框虚拟扩增的微小人脸检测系统,该检测系统包括以下模块:
图像获取及矩形框标注模块,配置为获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
人脸检测模型构建及参数获取模块,配置为以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
矩形标注框扩增模块,配置为基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
初始人脸检测模型构建模块,配置为分别使用基于带有矩形标注框和其对应的带有虚拟标注框的图像集生成人脸检测模型的分类和预测目标,获得初始人脸检测模型;
模型训练模块,配置为采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
在线检测模块,配置为通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于标注框虚拟扩增的微小人脸检测系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种电子设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述的基于标注框虚拟扩增的微小人脸检测方法。
本发明第四实施例的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现上述的基于标注框虚拟扩增的微小人脸检测方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
下面参考图4,其示出了用于实现本申请方法、系统、设备实施例的服务器的计算机系统的结构示意图。图4示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)401,其可以根据存储在只读存储器(ROM,Read Only Memory)402中的程序或者从存储部分408加载到随机访问存储器(RAM,Random Access Memory)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O,Input/Output)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、 “第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (9)
1.一种基于标注框虚拟扩增的微小人脸检测方法,其特征在于,该检测方法包括以下步骤:
步骤S10,获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸,获得带有矩形标注框的图像集;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
步骤S20,以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
步骤S30,基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
步骤S40,在标注框的预测目标的生成过程中,以集合作为依据进行真实位置预测,在脸/非脸的分类目标的生成过程中,以集合为依据进行特征图上为正的区域的设置,在分类目标和预测目标的生成过程中,将特征图上为正的区域的设置和真实位置预测之外的模型参数及结构设置为与LFFD一致,获得初始人脸检测模型;其中,集合为带有矩形标注框的图像集,集合为带有虚拟标注框的图像集;
步骤S50,采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
步骤S60,通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
2.根据权利要求1所述的基于标注框虚拟扩增的微小人脸检测方法,其特征在于,所述人脸检测模型包括25个卷积层和8个检测分支;
其中,针对小尺度人脸的检测分支为位于卷积层8和卷积层10的b1检测分支与b2检测分支。
4.根据权利要求1所述的基于标注框虚拟扩增的微小人脸检测方法,其特征在于,所述微小人脸和通常大小人脸,其判断的设定像素阈值为16。
6.根据权利要求3所述的基于标注框虚拟扩增的微小人脸检测方法,其特征在于,所述b1检测分支与b2检测分支对应的特征图下采样倍数均为4。
7.一种基于标注框虚拟扩增的微小人脸检测系统,其特征在于,该检测系统包括以下模块:
图像获取及矩形框标注模块,配置为获取包含微小人脸的图像集,并使用矩形标注框标注所述图像集中的每个微小人脸,获得带有矩形标注框的图像集;所述微小人脸为像素值小于或等于设定像素阈值的人脸;
人脸检测模型构建及参数获取模块,配置为以LFFD作为基准构建人脸检测模型,并获取所述人脸检测模型针对小尺度人脸的检测分支对应的特征图下采样倍数;
矩形标注框扩增模块,配置为基于所述特征图下采样倍数,以微小人脸的矩形标注框的中心进行矩形标注框的设定系数的虚拟扩增,获得带有虚拟标注框的图像集;
初始人脸检测模型构建模块,配置为在标注框的预测目标的生成过程中,以集合作为依据进行真实位置预测,在脸/非脸的分类目标的生成过程中,以集合为依据进行特征图上为正的区域的设置,在分类目标和预测目标的生成过程中,将特征图上为正的区域的设置和真实位置预测之外的模型参数及结构设置为与LFFD一致,获得初始人脸检测模型;其中,集合为带有矩形标注框的图像集,集合为带有虚拟标注框的图像集;
模型训练模块,配置为采用Back-Propagation和随机梯度下降法迭代训练所述初始人脸检测模型,得到同时检测通常大小人脸和微小人脸的模型;所述通常大小人脸为像素值大于设定阈值的人脸;
在线检测模块,配置为通过所述同时检测通常大小人脸和微小人脸的模型,进行在线人脸检测。
8.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1-6任一项所述的基于标注框虚拟扩增的微小人脸检测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求1-6任一项所述的基于标注框虚拟扩增的微小人脸检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110098072.4A CN112434674B (zh) | 2021-01-25 | 2021-01-25 | 基于标注框虚拟扩增的微小人脸检测方法、系统及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110098072.4A CN112434674B (zh) | 2021-01-25 | 2021-01-25 | 基于标注框虚拟扩增的微小人脸检测方法、系统及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112434674A CN112434674A (zh) | 2021-03-02 |
CN112434674B true CN112434674B (zh) | 2021-04-23 |
Family
ID=74697227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110098072.4A Active CN112434674B (zh) | 2021-01-25 | 2021-01-25 | 基于标注框虚拟扩增的微小人脸检测方法、系统及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112434674B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334848A (zh) * | 2018-02-06 | 2018-07-27 | 哈尔滨工业大学 | 一种基于生成对抗网络的微小人脸识别方法 |
CN111027382A (zh) * | 2019-11-06 | 2020-04-17 | 华中师范大学 | 一种基于注意力机制的轻量级人脸检测的方法及模型 |
CN111488806A (zh) * | 2020-03-25 | 2020-08-04 | 天津大学 | 一种基于并行分支神经网络的多尺度人脸识别方法 |
CN111626160A (zh) * | 2020-05-15 | 2020-09-04 | 辽宁工程技术大学 | 一种基于区域式渐进校准网络的角度变化下人脸检测方法 |
CN111860077A (zh) * | 2019-04-30 | 2020-10-30 | 北京眼神智能科技有限公司 | 人脸检测方法、装置、计算机可读存储介质及设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101743927B1 (ko) * | 2010-09-09 | 2017-06-20 | 삼성전자주식회사 | 확장된 곡선형 가버 필터를 이용한 객체 기술자 생성 방법 및 장치 |
CN110414464A (zh) * | 2019-08-05 | 2019-11-05 | 北京深醒科技有限公司 | 一种小尺度密集行人检测方法 |
CN112183362B (zh) * | 2020-09-29 | 2021-12-17 | 广西科技大学 | 一种基于深度学习的ssd人脸检测方法 |
-
2021
- 2021-01-25 CN CN202110098072.4A patent/CN112434674B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334848A (zh) * | 2018-02-06 | 2018-07-27 | 哈尔滨工业大学 | 一种基于生成对抗网络的微小人脸识别方法 |
CN111860077A (zh) * | 2019-04-30 | 2020-10-30 | 北京眼神智能科技有限公司 | 人脸检测方法、装置、计算机可读存储介质及设备 |
CN111027382A (zh) * | 2019-11-06 | 2020-04-17 | 华中师范大学 | 一种基于注意力机制的轻量级人脸检测的方法及模型 |
CN111488806A (zh) * | 2020-03-25 | 2020-08-04 | 天津大学 | 一种基于并行分支神经网络的多尺度人脸识别方法 |
CN111626160A (zh) * | 2020-05-15 | 2020-09-04 | 辽宁工程技术大学 | 一种基于区域式渐进校准网络的角度变化下人脸检测方法 |
Non-Patent Citations (1)
Title |
---|
LFFD: A Light and Fast Face Detector for Edge Devices;Yonghao He,et al.;《arXiv》;20190812;正文第1-5节及图2 * |
Also Published As
Publication number | Publication date |
---|---|
CN112434674A (zh) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108427939B (zh) | 模型生成方法和装置 | |
CN109285181B (zh) | 用于识别图像的方法和装置 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN112101305A (zh) | 多路图像处理方法、装置及电子设备 | |
CN111723728A (zh) | 基于双向交互网络的行人搜索方法、系统、装置 | |
CN113378834B (zh) | 目标检测方法、装置、设备、存储介质以及程序产品 | |
CN112508078B (zh) | 图像多任务多标签识别方法、系统、设备及介质 | |
CN112364843A (zh) | 插拔式航拍图像目标定位检测方法、系统、设备 | |
CN111209856B (zh) | 发票信息的识别方法、装置、电子设备及存储介质 | |
CN114186007A (zh) | 高精地图生成方法、装置、电子设备和存储介质 | |
CN116844129A (zh) | 多模态特征对齐融合的路侧目标检测方法、系统及装置 | |
CN110110696B (zh) | 用于处理信息的方法和装置 | |
CN113537026B (zh) | 建筑平面图中的图元检测方法、装置、设备及介质 | |
CN116310993A (zh) | 目标检测方法、装置、设备及存储介质 | |
Shit et al. | An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection | |
CN114332809A (zh) | 一种图像识别方法、装置、电子设备和存储介质 | |
CN112434674B (zh) | 基于标注框虚拟扩增的微小人脸检测方法、系统及设备 | |
CN116863116A (zh) | 基于人工智能的图像识别方法、装置、设备及介质 | |
Ali et al. | Active contour image segmentation model with de‐hazing constraints | |
CN115393423A (zh) | 目标检测方法和装置 | |
CN111950356B (zh) | 印章文本定位方法、装置及电子设备 | |
CN116704593A (zh) | 预测模型训练方法、装置、电子设备和计算机可读介质 | |
CN114898140A (zh) | 一种基于paa算法的行为检测方法、装置及可读介质 | |
Kee et al. | Cracks identification using mask region-based denoised deformable convolutional network | |
CN114519686A (zh) | 用于检测路牙的方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |