CN111950342A - 一种人脸检测方法、装置及存储介质 - Google Patents
一种人脸检测方法、装置及存储介质 Download PDFInfo
- Publication number
- CN111950342A CN111950342A CN202010577097.8A CN202010577097A CN111950342A CN 111950342 A CN111950342 A CN 111950342A CN 202010577097 A CN202010577097 A CN 202010577097A CN 111950342 A CN111950342 A CN 111950342A
- Authority
- CN
- China
- Prior art keywords
- face
- frame
- adjusting
- neural network
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 105
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000013527 convolutional neural network Methods 0.000 claims description 54
- 238000011176 pooling Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 8
- 230000001629 suppression Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000004927 fusion Effects 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种人脸检测方法、装置及存储介质。所述人脸检测方法,包括:根据Tiny YOLO3算法,对获取的图片进行人脸框检测,得到人脸候选框;通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。本发明能够结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
Description
技术领域
本发明涉及人脸检测技术领域,尤其涉及一种人脸检测方法、装置及存储介质。
背景技术
随着科技水平的不断提高,目前已逐渐利用巡检机器人替代人工巡检。巡检机器人主要是通过对采集的图片中出现的人脸进行检测。但巡检机器人在行进过程中,受周围环境的干扰,容易采集到存在遮挡人脸、远处人脸的图片,难以从图片中准确检测到遮挡人脸、远处人脸等中小目标,导致人脸检测出现偏差或遗漏。
发明内容
为了克服现有技术的缺陷,本发明提供一种人脸检测方法、装置及存储介质,能够结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
为了解决上述技术问题,第一方面,本发明一实施例提供一种人脸检测方法,包括:
根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框;
通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。
进一步地,所述级联卷积神经网络为由第一卷积神经网络、第二卷积神经网络和第三卷积神经网络组成的三层级联卷积神经网络。
进一步地,所述通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框,具体为:
改变所述人脸候选框的尺寸,得到第一人脸候选框、第二人脸候选框和第三人脸候选框;
通过所述第一卷积神经网络,对所述第一人脸候选框进行卷积和池化操作,得到第一人脸预测框;
通过所述第二卷积神经网络,对所述第二人脸候选框进行卷积和池化操作,得到第二人脸预测框;
通过所述第三卷积神经网络,对所述第三人脸候选框进行卷积和池化操作,得到第三人脸预测框;
基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框;
基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框。
进一步地,在所述基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框之前,还包括:
采用加权平均法对所述第一人脸预测框和所述第二人脸预测框进行综合判定,得到所述第一人脸预测框和所述第二人脸预测框的综合判定结果。
进一步地,在所述基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框之前,还包括:
采用加权平均法对所述第三人脸预测框和所述人脸调整框进行综合判定,得到所述第三人脸预测框和所述人脸调整框的综合判定结果。
进一步地,所述基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框,具体为:
基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,根据边框回归和非极大值抑制算法,调整所述人脸候选框,得到所述人脸调整框。
进一步地,所述基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框,具体为:
基于所述第三人脸预测框和所述人脸调整框的综合判定结果,根据边框回归和非极大值抑制算法,调整所述人脸调整框,得到所述人脸检测框。
进一步地,所述第一人脸候选框的尺寸为12×12,所述第二人脸候选框的尺寸为24×24,所述第三人脸候选框的尺寸为48×48。
第二方面,本发明一实施例提供一种人脸检测装置,包括:
人脸候选框获取模块,用于根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框;
人脸检测框获取模块,用于通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。
第三方面,本发明一实施例提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上所述的人脸检测方法。
本发明的实施例,具有如下有益效果:
通过根据Tiny YOLO3算法,对获取的图片进行人脸框检测,得到人脸候选框,能够利用Tiny YOLO3算法采用深浅层特征图进行人脸检测的优点,提高对遮挡人脸、远处人脸等中小目标的检测率,通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,能够利用级联卷积神经网络中的多层卷积神经网络,由粗到细逐级精细化地调整人脸候选框的位置,提高人脸检测框的准确性,从而实现结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
附图说明
图1为本发明第一实施例中的一种人脸检测方法的流程示意图;
图2为本发明第一实施例中的一种人脸检测方法的另一流程示意图;
图3为本发明第二实施例中的一种人脸检测装置的结构示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,文中的步骤编号,仅为了方便具体实施例的解释,不作为限定步骤执行先后顺序的作用。
如图1-2所示,第一实施例提供一种人脸检测方法,包括步骤S1~S2:
S1、根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框。
S2、通过级联卷积神经网络,调整人脸候选框,得到人脸检测框。
在本实施例中,级联卷积神经网络为由第一卷积神经网络、第二卷积神经网络和第三卷积神经网络组成的三层级联卷积神经网络。
作为示例性地,在步骤S1中,通过将获取的图片输入Tiny YOLO3算法模型网络,通过Tiny YOLO3算法模型网络对图片进行人脸检测,得到人脸候选框。
YOLO3算法是Joseph等提出的通用目标检测模型,Tiny YOLO3是YOLO3模型的简化,并且融合了特征金字塔网络(feature pyramid networks,FPN)和全卷积网络(fullyconvolutional networks,FCN)技术。因此,根据YOLO3算法,能够快速将任意输入图片x映射到一个多维向量y,向量y的维度一般为8~16不等,基本的8维度分别是Pc、bx、by、bh、bw、c1、c2、c3,其中Pc=1表示含有目标,Pc=0表示为背景,c1、c2和c3表示要分类的3个目标,bx和by是目标中心点的位置、bh和bw分别是边框的高度与宽度相对于格子的比例。
Tiny YOLO3算法模型网络主要由卷积层和池化层构成,网络中层的命名规则由其类别和在网络中第几次出现的编号构成,例如Conv5表示网络中的第5个卷积层,maxpllo1表示网络中的第1个最大池化层,upsample1表示网络中的第1个上采样层;网络中每层的输出特征图尺寸表示为“分辨率宽×分辨率高×通道数”,例如“416×416×3”;“+”表示特征图在通道维度的连接操作,“·”表示上采样操作,例如对第5层卷积图进行特征图在通道维度的连接操作,对第8层卷积图进行上采样操作;网络中的输出层采用RefineNet进行多分辨率特征融合,形成具有深浅层特征融合的输出层。通过对第5层卷积图进行特征图在通道维度的连接操作,利用浅层卷积层特征感受野噪声小,优化对小目标的表征能力,通过形成具有深浅层特征融合的输出层,增加了目标局部特征的学习样本,增强了遮挡目标和小目标的识别能力。
在步骤S2中,当得到人脸候选框后,将人脸候选框输入级联卷积神经网络,通过级联卷积神经网络中的各层卷积神经网络,由粗到细逐级精细化地调整人脸候选框,得到人脸检测框。
由于级联卷积神经网络是由三层级联卷积神经网络组成,可以对三种尺寸的人脸候选框进行独立预测,从而根据人脸预测框校正人脸候选框。
本实施例通过根据Tiny YOLO3算法,对获取的图片进行人脸框检测,得到人脸候选框,能够利用Tiny YOLO3算法采用深浅层特征图进行人脸检测的优点,提高对遮挡人脸、远处人脸等中小目标的检测率,通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,能够利用级联卷积神经网络中的多层卷积神经网络,由粗到细逐级精细化地调整人脸候选框的位置,提高人脸检测框的准确性,从而实现结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
在优选的实施例当中,所述通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,具体为:改变人脸候选框的尺寸,得到第一人脸候选框、第二人脸候选框和第三人脸候选框;通过第一卷积神经网络,对第一人脸候选框进行卷积和池化操作,得到第一人脸预测框;通过第二卷积神经网络,对第二人脸候选框进行卷积和池化操作,得到第二人脸预测框;通过第三卷积神经网络,对第三人脸候选框进行卷积和池化操作,得到第三人脸预测框;基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框;基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框。
作为示例性地,当得到人脸候选框时,首先改变人脸候选框的尺寸,比如改变人脸候选框的尺寸为12×12、24×24、48×48,得到不同尺寸的第一人脸候选框、第二人脸候选框和第三人脸候选框,然后通过第一卷积神经网络对第一人脸候选框进行卷积和池化操作,得到第一人脸预测框,实现对第一人脸候选框进行独立预测,通过第二卷积神经网络,对第二人脸候选框进行卷积和池化操作,得到第二人脸预测框,实现对第二人脸候选框进行独立预测,通过第三卷积神经网络,对第三人脸候选框进行卷积和池化操作,得到第三人脸预测框,实现对第三人脸候选框进行独立预测,接着对第一人脸预测框和第二人脸预测框进行综合判定,并基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框,相当于对人脸候选框进行一级调整,最后对第三人脸预测框和人脸调整框进行综合判定,并基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框,相当于对人脸候选框进行二级调整,从而实现由粗到细逐级精细化地调整人脸候选框的位置。
在优选的实施例当中,在所述基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框之前,还包括:采用加权平均法对第一人脸预测框和第二人脸预测框进行综合判定,得到第一人脸预测框和第二人脸预测框的综合判定结果。
加权平均法是利用过去若干个按照时间顺序排列起来的同一变量的观测值并以时间顺序数为权数,计算出观测值的加权算术平均数,以这一数字作为预测未来期间该变量预测值的一种趋势预测法。
本实施例通过采用加权平均法对第一人脸预测框和第二人脸预测框进行综合判定,能够结合第一人脸预测框和第二人脸预测框一级调整人脸候选框,有利于提高人脸检测精度。
在优选的实施例当中,在所述基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框之前,还包括:采用加权平均法对第三人脸预测框和人脸调整框进行综合判定,得到第三人脸预测框和人脸调整框的综合判定结果。
本实施例通过采用加权平均法对第三人脸预测框和人脸调整框进行综合判定,能够结合第三人脸预测框和人脸调整框二级调整人脸候选框,有利于提高人脸检测精度。
在优选的实施例当中,所述基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框,具体为:基于第一人脸预测框和第二人脸预测框的综合判定结果,根据边框回归和非极大值抑制算法,调整人脸候选框,得到人脸调整框。
在优选的实施例当中,所述基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框,具体为:基于第三人脸预测框和人脸调整框的综合判定结果,根据边框回归和非极大值抑制算法,调整人脸调整框,得到人脸检测框。
在优选的实施例当中,所述第一人脸候选框的尺寸为12×12,所述第二人脸候选框的尺寸为24×24,所述第三人脸候选框的尺寸为48×48。
如图3所示,第二实施例提供一种人脸检测装置,包括:人脸候选框获取模块21,用于根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框;人脸检测框获取模块22,用于通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。
在本实施例中,级联卷积神经网络为由第一卷积神经网络、第二卷积神经网络和第三卷积神经网络组成的三层级联卷积神经网络。
作为示例性地,通过人脸候选框获取模块21,将获取的图片输入Tiny YOLO3算法模型网络,通过Tiny YOLO3算法模型网络对图片进行人脸检测,得到人脸候选框。
YOLO3算法是Joseph等提出的通用目标检测模型,Tiny YOLO3是YOLO3模型的简化,并且融合了特征金字塔网络(feature pyramid networks,FPN)和全卷积网络(fullyconvolutional networks,FCN)技术。因此,根据YOLO3算法,能够快速将任意输入图片x映射到一个多维向量y,向量y的维度一般为8~16不等,基本的8维度分别是Pc、bx、by、bh、bw、c1、c2、c3,其中Pc=1表示含有目标,Pc=0表示为背景,c1、c2和c3表示要分类的3个目标,bx和by是目标中心点的位置、bh和bw分别是边框的高度与宽度相对于格子的比例。
Tiny YOLO3算法模型网络主要由卷积层和池化层构成,其中,对第5层卷积图进行特征图在通道维度的连接操作,对第8层卷积图进行上采样操作,网络中的输出层采用RefineNet进行多分辨率特征融合,形成具有深浅层特征融合的输出层。通过对第5层卷积图进行特征图在通道维度的连接操作,利用浅层卷积层特征感受野噪声小,优化对小目标的表征能力,通过形成具有深浅层特征融合的输出层,增加了目标局部特征的学习样本,增强了遮挡目标和小目标的识别能力。
通过人脸检测框获取模块22,当得到人脸候选框后,将人脸候选框输入级联卷积神经网络,通过级联卷积神经网络中的各层卷积神经网络,由粗到细逐级精细化地调整人脸候选框,得到人脸检测框。
由于级联卷积神经网络是由三层级联卷积神经网络组成,可以对三种尺寸的人脸候选框进行独立预测,从而根据人脸预测框校正人脸候选框。
本实施例通过人脸候选框获取模块21,根据Tiny YOLO3算法,对获取的图片进行人脸框检测,得到人脸候选框,能够利用Tiny YOLO3算法采用深浅层特征图进行人脸检测的优点,提高对遮挡人脸、远处人脸等中小目标的检测率,通过人脸检测框获取模块22,通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,能够利用级联卷积神经网络中的多层卷积神经网络,由粗到细逐级精细化地调整人脸候选框的位置,提高人脸检测框的准确性,从而实现结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
在优选的实施例当中,所述通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,具体为:改变人脸候选框的尺寸,得到第一人脸候选框、第二人脸候选框和第三人脸候选框;通过第一卷积神经网络,对第一人脸候选框进行卷积和池化操作,得到第一人脸预测框;通过第二卷积神经网络,对第二人脸候选框进行卷积和池化操作,得到第二人脸预测框;通过第三卷积神经网络,对第三人脸候选框进行卷积和池化操作,得到第三人脸预测框;基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框;基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框。
作为示例性地,通过人脸检测框获取模块22,当得到人脸候选框时,首先改变人脸候选框的尺寸,比如改变人脸候选框的尺寸为12×12、24×24、48×48,得到不同尺寸的第一人脸候选框、第二人脸候选框和第三人脸候选框,然后通过第一卷积神经网络对第一人脸候选框进行卷积和池化操作,得到第一人脸预测框,实现对第一人脸候选框进行独立预测,通过第二卷积神经网络,对第二人脸候选框进行卷积和池化操作,得到第二人脸预测框,实现对第二人脸候选框进行独立预测,通过第三卷积神经网络,对第三人脸候选框进行卷积和池化操作,得到第三人脸预测框,实现对第三人脸候选框进行独立预测,接着对第一人脸预测框和第二人脸预测框进行综合判定,并基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框,相当于对人脸候选框进行一级调整,最后对第三人脸预测框和人脸调整框进行综合判定,并基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框,相当于对人脸候选框进行二级调整,从而实现由粗到细逐级精细化地调整人脸候选框的位置。
在优选的实施例当中,在所述基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框之前,还包括:采用加权平均法对第一人脸预测框和第二人脸预测框进行综合判定,得到第一人脸预测框和第二人脸预测框的综合判定结果。
加权平均法是利用过去若干个按照时间顺序排列起来的同一变量的观测值并以时间顺序数为权数,计算出观测值的加权算术平均数,以这一数字作为预测未来期间该变量预测值的一种趋势预测法。
本实施例通过人脸检测框获取模块22,采用加权平均法对第一人脸预测框和第二人脸预测框进行综合判定,能够结合第一人脸预测框和第二人脸预测框一级调整人脸候选框,有利于提高人脸检测精度。
在优选的实施例当中,在所述基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框之前,还包括:采用加权平均法对第三人脸预测框和人脸调整框进行综合判定,得到第三人脸预测框和人脸调整框的综合判定结果。
本实施例通过人脸检测框获取模块22,采用加权平均法对第三人脸预测框和人脸调整框进行综合判定,能够结合第三人脸预测框和人脸调整框二级调整人脸候选框,有利于提高人脸检测精度。
在优选的实施例当中,所述基于第一人脸预测框和第二人脸预测框的综合判定结果,调整人脸候选框,得到人脸调整框,具体为:基于第一人脸预测框和第二人脸预测框的综合判定结果,根据边框回归和非极大值抑制算法,调整人脸候选框,得到人脸调整框。
在优选的实施例当中,所述基于第三人脸预测框和人脸调整框的综合判定结果,调整人脸调整框,得到人脸检测框,具体为:基于第三人脸预测框和人脸调整框的综合判定结果,根据边框回归和非极大值抑制算法,调整人脸调整框,得到人脸检测框。
在优选的实施例当中,所述第一人脸候选框的尺寸为12×12,所述第二人脸候选框的尺寸为24×24,所述第三人脸候选框的尺寸为48×48。
第三实施例提供一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如第一实施例的人脸检测方法,且能达到与之相同的有益效果。
综上所述,实施本发明的实施例,具有如下有益效果:
通过根据Tiny YOLO3算法,对获取的图片进行人脸框检测,得到人脸候选框,能够利用Tiny YOLO3算法采用深浅层特征图进行人脸检测的优点,提高对遮挡人脸、远处人脸等中小目标的检测率,通过级联卷积神经网络,调整人脸候选框,得到人脸检测框,能够利用级联卷积神经网络中的多层卷积神经网络,由粗到细逐级精细化地调整人脸候选框的位置,提高人脸检测框的准确性,从而实现结合Tiny YOLO3算法和级联卷积神经网络,从图片中准确检测到遮挡人脸、远处人脸等中小目标,提高人脸检测精度。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
本领域普通技术人员可以理解实现上述实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
Claims (10)
1.一种人脸检测方法,其特征在于,包括:
根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框;
通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。
2.如权利要求1所述的人脸检测方法,其特征在于,所述级联卷积神经网络为由第一卷积神经网络、第二卷积神经网络和第三卷积神经网络组成的三层级联卷积神经网络。
3.如权利要求2所述的人脸检测方法,其特征在于,所述通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框,具体为:
改变所述人脸候选框的尺寸,得到第一人脸候选框、第二人脸候选框和第三人脸候选框;
通过所述第一卷积神经网络,对所述第一人脸候选框进行卷积和池化操作,得到第一人脸预测框;
通过所述第二卷积神经网络,对所述第二人脸候选框进行卷积和池化操作,得到第二人脸预测框;
通过所述第三卷积神经网络,对所述第三人脸候选框进行卷积和池化操作,得到第三人脸预测框;
基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框;
基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框。
4.如权利要求3所述的人脸检测方法,其特征在于,在所述基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框之前,还包括:
采用加权平均法对所述第一人脸预测框和所述第二人脸预测框进行综合判定,得到所述第一人脸预测框和所述第二人脸预测框的综合判定结果。
5.如权利要求3所述的人脸检测方法,其特征在于,在所述基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框之前,还包括:
采用加权平均法对所述第三人脸预测框和所述人脸调整框进行综合判定,得到所述第三人脸预测框和所述人脸调整框的综合判定结果。
6.如权利要求3所述的人脸检测方法,其特征在于,所述基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,调整所述人脸候选框,得到人脸调整框,具体为:
基于所述第一人脸预测框和所述第二人脸预测框的综合判定结果,根据边框回归和非极大值抑制算法,调整所述人脸候选框,得到所述人脸调整框。
7.如权利要求3所述的人脸检测方法,其特征在于,所述基于所述第三人脸预测框和所述人脸调整框的综合判定结果,调整所述人脸调整框,得到所述人脸检测框,具体为:
基于所述第三人脸预测框和所述人脸调整框的综合判定结果,根据边框回归和非极大值抑制算法,调整所述人脸调整框,得到所述人脸检测框。
8.如权利要求3所述的人脸检测方法,其特征在于,所述第一人脸候选框的尺寸为12×12,所述第二人脸候选框的尺寸为24×24,所述第三人脸候选框的尺寸为48×48。
9.一种人脸检测装置,其特征在于,包括:
人脸候选框获取模块,用于根据Tiny YOLO3算法,对获取的图片进行人脸检测,得到人脸候选框;
人脸检测框获取模块,用于通过级联卷积神经网络,调整所述人脸候选框,得到人脸检测框。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至8中任意一项所述的人脸检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010577097.8A CN111950342A (zh) | 2020-06-22 | 2020-06-22 | 一种人脸检测方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010577097.8A CN111950342A (zh) | 2020-06-22 | 2020-06-22 | 一种人脸检测方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111950342A true CN111950342A (zh) | 2020-11-17 |
Family
ID=73337165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010577097.8A Withdrawn CN111950342A (zh) | 2020-06-22 | 2020-06-22 | 一种人脸检测方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111950342A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919045A (zh) * | 2019-02-18 | 2019-06-21 | 北京联合大学 | 基于级联卷积网络的小尺度行人检测识别方法 |
CN110163057A (zh) * | 2018-10-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、设备和计算机可读介质 |
CN110210457A (zh) * | 2019-06-18 | 2019-09-06 | 广州杰赛科技股份有限公司 | 人脸检测方法、装置、设备及计算机可读存储介质 |
CN110322522A (zh) * | 2019-07-11 | 2019-10-11 | 山东领能电子科技有限公司 | 一种基于目标识别区域截取的车辆颜色识别方法 |
CN110717481A (zh) * | 2019-12-12 | 2020-01-21 | 浙江鹏信信息科技股份有限公司 | 一种利用级联卷积神经网络实现人脸检测的方法 |
CN111291637A (zh) * | 2020-01-19 | 2020-06-16 | 中国科学院上海微系统与信息技术研究所 | 一种基于卷积神经网络的人脸检测方法、装置及设备 |
-
2020
- 2020-06-22 CN CN202010577097.8A patent/CN111950342A/zh not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163057A (zh) * | 2018-10-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、设备和计算机可读介质 |
CN109919045A (zh) * | 2019-02-18 | 2019-06-21 | 北京联合大学 | 基于级联卷积网络的小尺度行人检测识别方法 |
CN110210457A (zh) * | 2019-06-18 | 2019-09-06 | 广州杰赛科技股份有限公司 | 人脸检测方法、装置、设备及计算机可读存储介质 |
CN110322522A (zh) * | 2019-07-11 | 2019-10-11 | 山东领能电子科技有限公司 | 一种基于目标识别区域截取的车辆颜色识别方法 |
CN110717481A (zh) * | 2019-12-12 | 2020-01-21 | 浙江鹏信信息科技股份有限公司 | 一种利用级联卷积神经网络实现人脸检测的方法 |
CN111291637A (zh) * | 2020-01-19 | 2020-06-16 | 中国科学院上海微系统与信息技术研究所 | 一种基于卷积神经网络的人脸检测方法、装置及设备 |
Non-Patent Citations (4)
Title |
---|
ZHEN YANG 等: "Combining Yolov3-tiny Model with Dropblock for Tiny-face Detection", 《2019 IEEE 19TH INTERNATIONAL CONFERENCE ON COMMUNICATION TECHNOLOGY (ICCT)》, pages 2 - 3 * |
刘丽娴 等: "融合全卷积和级联卷积神经网络的人脸检测方法", 《移动通信》, vol. 43, no. 6, pages 83 - 85 * |
朱超平 等: "基于YOLO2和ResNet算法的监控视频中的人脸检测与识别", 重庆理工大学学报(自然科学), vol. 32, no. 8, pages 1 * |
魏荣耀;鲍士兼;赵成林;许方敏;: "基于卡尔曼滤波改进的MTCNN网络人脸检测算法", 无线电工程, no. 03, pages 27 - 32 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112861729B (zh) | 一种基于伪深度图引导的实时深度补全方法 | |
US8045789B2 (en) | Method and apparatus for inspecting defect of pattern formed on semiconductor device | |
CN109446925A (zh) | 一种基于卷积神经网络的电力设备检测算法 | |
CN109257582A (zh) | 一种投影设备的校正方法和装置 | |
CN109781733A (zh) | 缺陷检查装置、缺陷检查方法及计算机可读存储介质 | |
CN104796582B (zh) | 基于随机喷射retinex的视频图像去噪与增强方法及装置 | |
CN112200045A (zh) | 基于上下文增强的遥感图像目标检测模型建立方法及应用 | |
CN108664839B (zh) | 一种图像处理方法和设备 | |
CN106157329B (zh) | 一种自适应目标跟踪方法及装置 | |
CN112967388B (zh) | 三维时序图像神经网络模型的训练方法和装置 | |
CN116309757A (zh) | 基于机器视觉的双目立体匹配方法 | |
CN102867295A (zh) | 一种彩色图像颜色校正方法 | |
CN108804992A (zh) | 一种基于深度学习的人群统计方法 | |
CN114021704B (zh) | 一种ai神经网络模型的训练方法及相关装置 | |
CN105913067A (zh) | 图像轮廓特征的提取方法及其装置 | |
CN114331946A (zh) | 一种图像数据处理方法、设备以及介质 | |
RU2419150C1 (ru) | Способ обработки последовательности изображений для обнаружения и слежения за воздушными объектами | |
Mikolajczak et al. | Estimation of the variance of noise in digital images using a median filter | |
CN104182940B (zh) | 一种模糊图像恢复方法及系统 | |
CN105913451B (zh) | 一种基于图模型的自然图像超像素分割方法 | |
CN113256546A (zh) | 一种基于彩色图指导的深度图补全方法 | |
CN111950342A (zh) | 一种人脸检测方法、装置及存储介质 | |
CN110717960B (zh) | 一种建筑垃圾遥感图像样本的生成方法 | |
CN107230201B (zh) | 基于样本自标定elm的在轨sar图像变化检测方法 | |
CN115209114A (zh) | 自动白平衡的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20201117 |
|
WW01 | Invention patent application withdrawn after publication |