CN111126173A - 一种高精度人脸检测方法 - Google Patents

一种高精度人脸检测方法 Download PDF

Info

Publication number
CN111126173A
CN111126173A CN201911224387.8A CN201911224387A CN111126173A CN 111126173 A CN111126173 A CN 111126173A CN 201911224387 A CN201911224387 A CN 201911224387A CN 111126173 A CN111126173 A CN 111126173A
Authority
CN
China
Prior art keywords
face
image
face detection
network
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911224387.8A
Other languages
English (en)
Other versions
CN111126173B (zh
Inventor
黄艳虎
闭吕庆
王强
巫钊
苏雪
甘国妹
莫燕斌
陈超村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yulin Normal University
Original Assignee
Yulin Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yulin Normal University filed Critical Yulin Normal University
Priority to CN201911224387.8A priority Critical patent/CN111126173B/zh
Publication of CN111126173A publication Critical patent/CN111126173A/zh
Application granted granted Critical
Publication of CN111126173B publication Critical patent/CN111126173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种高精度人脸检测方法,属于人脸检测技术领域,主要解决的是目前人脸检测存在准确率不高、效率慢的技术问题,所述方法包括步骤如下:S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图;S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对所述单通道灰度图进行特征提取得到人脸特征图;S3.根据卷积神经网络对所述人脸特征图进行学习得到描述特征后,结合回归网络和分类网络对人脸位置进行回归定位,并连接多个不同尺度的特征图融合,对所述人脸特征图进行检测得到人脸检测图;S4.使用人脸分类模型对所述人脸检测图进行确认。本发明准确率高、效率高。

Description

一种高精度人脸检测方法
技术领域
本发明涉及人脸检测技术领域,更具体地说,它涉及一种高精度人脸检测方法。
背景技术
目前人脸识别系统中对人脸检测的鲁棒性和可靠性以及高效性的要求越来越高。例如:公安安防人脸识别系统中识别犯罪逃犯,只有在高效率、高精度人脸检测的基础下才能更好更快的去进行人脸比对识别,保证公安第一时间对罪犯进行布控。而目前人脸检测存在准确率不高、效率慢的问题。
发明内容
本发明要解决的技术问题是针对现有技术的上述不足,本发明的目的是提供一种准确率高、效率高的高精度人脸检测方法。
本发明的技术方案是:一种高精度人脸检测方法,包括步骤如下:
S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图;
S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对所述单通道灰度图进行特征提取得到人脸特征图;
S3.根据卷积神经网络对所述人脸特征图进行学习得到描述特征后,结合回归网络和分类网络对人脸位置进行回归定位,并连接多个不同尺度的特征图融合,对所述人脸特征图进行检测得到人脸检测图;
S4.根据人脸分类模型对所述人脸检测图进行确认。
作为进一步地改进,在所述步骤S1中,根据公式:
f(i,j)=0.2999R+0.587G+0.114B,
对原始人脸图像预处理得到单通道灰度图,其中,f(i,j)为灰度化后图像坐标(i,j)处的像素灰度值,R,G,B分别为彩色图像RGB三分量。
进一步地,在所述步骤S2中,所述卷积层为17个,17个所述卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64,且所述网络所有权重均随机初始化。
进一步地,在所述步骤S2中,所述BN层为卷积神经网络的Batch Normalization层。
进一步地,在所述步骤S3中,根据Smooth L1 Loss算法对人脸位置进行回归定位。
进一步地,在所述步骤S3中,各所述不同尺度的特征图根据所述原始人脸图像作为特征提取网络输入基础得到,所述不同尺度的特征图为5个,5个所述不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素。
进一步地,在所述步骤S4中,所述人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接,并使用softmax分类器进行分类。
进一步地,4个所述卷积层输出通道分别为4、4、8、16,两个所述全连接层输出通道分别为64、2,分类结果为人脸、非人脸两类。
有益效果
本发明与现有技术相比,具有的优点为:本发明通过一种卷积神经网络的特征提取方法,并在人脸检测算法之后加入一种人脸分类方法,使得原来很容易产生人脸误检的人脸检测算法变得非常准确,精度相比目前主流基于深度学习的人脸检测方法至少提高10%的精度,该方法在实际应用场景中得到验证。本发明的高精度人脸检测方法相比其他深度学习方法,具有图像特征提取速度快、特征提取网络简单、准确度高、人脸检测速度快、鲁棒性高等优点。
附图说明
图1为本发明的检测流程图;
图2为本发明中卷积神经网络原理图。
具体实施方式
下面结合附图中的具体实施例对本发明做进一步的说明。
参阅图1-2,一种高精度人脸检测方法,包括步骤如下:
S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图,排除颜色的干扰;
S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对单通道灰度图进行特征提取得到人脸特征图;
S3.根据卷积神经网络对人脸特征图进行学习得到描述特征后,结合回归网络和分类网络对人脸位置进行回归定位,并连接多个不同尺度的特征图融合,对人脸特征图进行检测得到人脸检测图;
S4.根据人脸分类模型对人脸检测图进行确认。
在步骤S1中,根据公式:
f(i,j)=0.2999R+0.587G+0.114B,
对原始人脸图像预处理得到单通道灰度图,其中,f(i,j)为灰度化后图像坐标(i,j)处的像素灰度值,R,G,B分别为彩色图像RGB三分量。在转化成灰度图的基础上,将图片大小resize到384*384像素。
在步骤S2中,卷积层为17个,17个卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64,且网络所有权重均随机初始化。BN层为卷积神经网络的Batch Normalization层。
在步骤S3中,根据Smooth L1 Loss算法对人脸位置进行回归定位。Smooth L1Loss算法为:
Figure BDA0002301742310000041
Figure BDA0002301742310000042
Figure BDA0002301742310000043
Figure BDA0002301742310000044
Figure BDA0002301742310000045
Figure BDA0002301742310000046
其中N是先验框的正样本数量。这里
Figure BDA0002301742310000047
为一个指示参数,
Figure BDA0002301742310000048
时表示第i个先验框与第j个ground truth匹配,并且ground truth的类别为p,c为类别置信度预测值,l为先验框的所对应边界框的位置预测值,而g为ground truth的位置参数。
由于
Figure BDA0002301742310000049
的存在,所以位置误差仅针对正样本进行计算,值得注意的是,要先对ground truth的g进行编码得到
Figure BDA00023017423100000410
因为预测值l也是编码值,最后通过最小化Lloc(x,l,g),实现一个可用的Smooth L1回归模型。
在步骤S3中,各不同尺度的特征图根据原始人脸图像作为特征提取网络输入基础得到,如在384*384像素大小的原始人脸图像作为特征提取网络输入基础上,不同尺度的特征图为5个,5个不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素,连接5个不同尺度的特征图同时对原始人脸图像进行检测,大大提高了精度。
在步骤S4中,人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接,并使用softmax分类器进行分类,使用人脸分类模型对人脸进行再次确认,从而大大提高了精度,避免误检。4个卷积层输出通道分别为4、4、8、16,两个全连接层输出通道分别为64、2,特征向量输出为2,即分类结果为人脸、非人脸两类。
softmax分类器算法为:
类标y可以取k个不同的值,对于训练集{(x(1),y(1)),...,(x(m),y(m))},得到有y(i)∈{1,2,...,k},此处的类别下标从1开始,而不是0。
对于给定的测试输入x,使用假设函数针对每一个类别j估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率,因此,假设函数将要输出一个k维的向量来表示这k个估计的概率值,向量元素的和为1。假设函数hθ(x)如下:
Figure BDA0002301742310000051
其中
Figure BDA0002301742310000052
是模型的参数,
Figure BDA0002301742310000053
这一项对概率分布进行归一化,使得所有概率之和为1。
为了方便起见,同样使用符号θ来表示全部的模型参数,在实现Softmax回归时,将θ用一个k×(n+1)的矩阵来表示会很方便,该矩阵是将θ12,…θk按行罗列起来得到的,如下所示:
Figure BDA0002301742310000061
下面公式为softmax的代价函数:
Figure BDA0002301742310000062
通过添加一个权重衰减项
Figure BDA0002301742310000063
来修改代价函数,这个衰减项会惩罚过大的参数值,现在的代价函数变为:
Figure BDA0002301742310000064
有了这个权重衰减项以后(λ>0),代价函数就变成了严格的凸函数,可以保证得到唯一的解。此时的Hessian矩阵变为可逆矩阵,并且因为J(θ)是凸函数,梯度下降法和L-BFGS等算法可以保证收敛到全局最优解。
为了使用优化算法,需要求得这个新函数J(θ)的导数,如下:
Figure BDA0002301742310000065
通过最小化J(θ)就实现一个可用的softmax分类模型。
本发明通过一种卷积神经网络的特征提取方法,并在人脸检测算法之后加入一种人脸分类方法,使得原来很容易产生人脸误检的人脸检测算法变得非常准确,精度相比目前主流基于深度学习的人脸检测方法至少提高10%的精度,该方法在实际应用场景中得到验证。本发明的高精度人脸检测方法相比其他深度学习方法,具有图像特征提取速度快、特征提取网络简单、准确度高、人脸检测速度快、鲁棒性高等优点。
以上仅是本发明的优选实施方式,应当指出对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些都不会影响本发明实施的效果和专利的实用性。

Claims (8)

1.一种高精度人脸检测方法,其特征在于,包括步骤如下:
S1.根据灰度转换对原始人脸图像预处理得到单通道灰度图;
S2.依次经过通道压缩的多个卷积层和多个使网络加速收敛性的BN层对所述单通道灰度图进行特征提取得到人脸特征图;
S3.根据卷积神经网络对所述人脸特征图进行学习得到描述特征后,结合回归网络和分类网络对人脸位置进行回归定位,并连接多个不同尺度的特征图融合,对所述人脸特征图进行检测得到人脸检测图;
S4.根据人脸分类模型对所述人脸检测图进行确认。
2.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S1中,根据公式:
f(i,j)=0.2999R+0.587G+0.114B,
对原始人脸图像预处理得到单通道灰度图,其中,f(i,j)为灰度化后图像坐标(i,j)处的像素灰度值,R,G,B分别为彩色图像RGB三分量。
3.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S2中,所述卷积层为17个,17个所述卷积层特征图输出通道分别为8、16、16、64、64、64、64、64、64、64、64、64、64、64、64、64、64,且所述网络所有权重均随机初始化。
4.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S2中,所述BN层为卷积神经网络的Batch Normalization层。
5.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S3中,根据Smooth L1 Loss算法对人脸位置进行回归定位。
6.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S3中,各所述不同尺度的特征图根据所述原始人脸图像作为特征提取网络输入基础得到,所述不同尺度的特征图为5个,5个所述不同尺度的特征图的尺寸分别为24*24、12*12、6*6、3*3、1*1像素。
7.根据权利要求1所述的一种高精度人脸检测方法,其特征在于,在所述步骤S4中,所述人脸分类模型包括依次经过通道压缩的4个卷积层和两个全连接层连接,并使用softmax分类器进行分类。
8.根据权利要求7所述的一种高精度人脸检测方法,其特征在于,4个所述卷积层输出通道分别为4、4、8、16,两个所述全连接层输出通道分别为64、2,分类结果为人脸、非人脸两类。
CN201911224387.8A 2019-12-04 2019-12-04 一种高精度人脸检测方法 Active CN111126173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224387.8A CN111126173B (zh) 2019-12-04 2019-12-04 一种高精度人脸检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224387.8A CN111126173B (zh) 2019-12-04 2019-12-04 一种高精度人脸检测方法

Publications (2)

Publication Number Publication Date
CN111126173A true CN111126173A (zh) 2020-05-08
CN111126173B CN111126173B (zh) 2023-05-26

Family

ID=70497429

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224387.8A Active CN111126173B (zh) 2019-12-04 2019-12-04 一种高精度人脸检测方法

Country Status (1)

Country Link
CN (1) CN111126173B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930249A (zh) * 2020-07-21 2020-11-13 深圳市鹰硕教育服务股份有限公司 智能笔图像处理方法、装置及电子设备
CN113946858A (zh) * 2021-12-20 2022-01-18 湖南丰汇银佳科技股份有限公司 一种基于数据隐私计算的身份安全认证方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408470A (zh) * 2014-12-01 2015-03-11 中科创达软件股份有限公司 基于平均脸预学习的性别检测方法
CN105069340A (zh) * 2015-07-27 2015-11-18 玉林师范学院 具有物理识别密码与生物特征识别密码同步控制的试卷保密系统及其方法
CN105590102A (zh) * 2015-12-30 2016-05-18 中通服公众信息产业股份有限公司 一种基于深度学习的前车车脸识别方法
CN106529447A (zh) * 2016-11-03 2017-03-22 河北工业大学 一种小样本人脸识别方法
CN107239736A (zh) * 2017-04-28 2017-10-10 北京智慧眼科技股份有限公司 基于多任务级联卷积神经网络的人脸检测方法及检测装置
CN108108677A (zh) * 2017-12-12 2018-06-01 重庆邮电大学 一种基于改进的cnn人脸表情识别方法
CN108182384A (zh) * 2017-12-07 2018-06-19 浙江大华技术股份有限公司 一种人脸特征点定位方法及装置
US20180232879A1 (en) * 2017-02-15 2018-08-16 Chung Yuan Christian University Method and apparatus for detecting cell reprogramming
CN108830262A (zh) * 2018-07-25 2018-11-16 上海电力学院 自然状态下多角度人脸表情识别方法
CN109344693A (zh) * 2018-08-13 2019-02-15 华南理工大学 一种基于深度学习的人脸多区域融合表情识别方法
CN109934204A (zh) * 2019-03-22 2019-06-25 重庆邮电大学 一种基于卷积神经网络的人脸表情识别方法
CN110427821A (zh) * 2019-06-27 2019-11-08 高新兴科技集团股份有限公司 一种基于轻量级卷积神经网络的人脸检测方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104408470A (zh) * 2014-12-01 2015-03-11 中科创达软件股份有限公司 基于平均脸预学习的性别检测方法
CN105069340A (zh) * 2015-07-27 2015-11-18 玉林师范学院 具有物理识别密码与生物特征识别密码同步控制的试卷保密系统及其方法
CN105590102A (zh) * 2015-12-30 2016-05-18 中通服公众信息产业股份有限公司 一种基于深度学习的前车车脸识别方法
CN106529447A (zh) * 2016-11-03 2017-03-22 河北工业大学 一种小样本人脸识别方法
US20180232879A1 (en) * 2017-02-15 2018-08-16 Chung Yuan Christian University Method and apparatus for detecting cell reprogramming
CN107239736A (zh) * 2017-04-28 2017-10-10 北京智慧眼科技股份有限公司 基于多任务级联卷积神经网络的人脸检测方法及检测装置
CN108182384A (zh) * 2017-12-07 2018-06-19 浙江大华技术股份有限公司 一种人脸特征点定位方法及装置
CN108108677A (zh) * 2017-12-12 2018-06-01 重庆邮电大学 一种基于改进的cnn人脸表情识别方法
CN108830262A (zh) * 2018-07-25 2018-11-16 上海电力学院 自然状态下多角度人脸表情识别方法
CN109344693A (zh) * 2018-08-13 2019-02-15 华南理工大学 一种基于深度学习的人脸多区域融合表情识别方法
CN109934204A (zh) * 2019-03-22 2019-06-25 重庆邮电大学 一种基于卷积神经网络的人脸表情识别方法
CN110427821A (zh) * 2019-06-27 2019-11-08 高新兴科技集团股份有限公司 一种基于轻量级卷积神经网络的人脸检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
章坚武: "卷积神经网络的人脸隐私保护识别", 《中国图像图形学报》 *
邵平等: "图像多阈值特征融合及其在人脸检测中的应用", 《小型微型计算机系统》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930249A (zh) * 2020-07-21 2020-11-13 深圳市鹰硕教育服务股份有限公司 智能笔图像处理方法、装置及电子设备
CN113946858A (zh) * 2021-12-20 2022-01-18 湖南丰汇银佳科技股份有限公司 一种基于数据隐私计算的身份安全认证方法及系统

Also Published As

Publication number Publication date
CN111126173B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN108961235B (zh) 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN110059694B (zh) 电力行业复杂场景下的文字数据的智能识别方法
CN109977918B (zh) 一种基于无监督域适应的目标检测定位优化方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN111950453A (zh) 一种基于选择性注意力机制的任意形状文本识别方法
CN111460980B (zh) 基于多语义特征融合的小目标行人的多尺度检测方法
CN106529446A (zh) 基于多分块深层卷积神经网络的车型识别方法和系统
CN112036260B (zh) 一种自然环境下多尺度子块聚合的表情识别方法及系统
CN110287798B (zh) 基于特征模块化和上下文融合的矢量网络行人检测方法
CN112132145B (zh) 一种基于模型扩展卷积神经网络的图像分类方法及系统
CN106874879A (zh) 基于多特征融合和深度学习网络提取的手写数字识别方法
CN112052845A (zh) 图像识别方法、装置、设备及存储介质
CN113096085A (zh) 基于两阶段卷积神经网络的集装箱表面损伤检测方法
CN116798070A (zh) 一种基于光谱感知和注意力机制的跨模态行人重识别方法
CN113378812A (zh) 一种基于Mask R-CNN和CRNN的数字表盘识别方法
CN107545281B (zh) 一种基于深度学习的单一有害气体红外图像分类识别方法
CN111126173A (zh) 一种高精度人脸检测方法
CN110188646B (zh) 基于梯度方向直方图与局部二值模式融合的人耳识别方法
CN115862103A (zh) 一种小样本人脸识别方法及系统
CN116563410A (zh) 基于两级生成对抗网络的电气设备电火花图像生成方法
CN113378672A (zh) 基于改进YOLOv3的输电线缺陷多目标检测方法
CN116863223A (zh) 语义注意力特征嵌入Swin Transformer网络的遥感图像场景分类的方法
CN116704241A (zh) 一种全通道3d卷积神经网络高光谱遥感图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200508

Assignee: Yulin Qingzhao Intelligent Electronic Technology Co.,Ltd.

Assignor: Yulin Normal University

Contract record no.: X2023980045233

Denomination of invention: A High Precision Face Detection Method

Granted publication date: 20230526

License type: Common License

Record date: 20231102

EE01 Entry into force of recordation of patent licensing contract