CN111144313A

CN111144313A - 一种基于多感受野动态结合的人脸检测方法及系统

Info

Publication number: CN111144313A
Application number: CN201911375035.2A
Authority: CN
Inventors: 范馨予
Original assignee: Innovation Qizhi (qingdao) Technology Co Ltd
Current assignee: Innovation Qizhi (qingdao) Technology Co Ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2020-05-12

Abstract

本发明公开一种基于多感受野动态结合的人脸检测方法及系统，涉及人脸检测技术领域，包括：将待检测图像输入预先生成的神经网络模型中进行特征提取，得到相应的初始特征图；采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作，得到具有第一感受野的第一特征图；采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作，得到具有第二感受野的第二特征图；采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作，得到具有第三感受野的第三特征图；将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图；采用注意力机制更新第四特征图的权重，并根据经权重更新后的第四特征图进行人脸检测。本发明有效提升人脸检测的准确率。

Description

一种基于多感受野动态结合的人脸检测方法及系统

技术领域

本发明涉及人脸检测技术领域，具体涉及一种基于多感受野动态结合的人脸检测方法及系统。

背景技术

人脸检测技术作为人脸识别、性别识别、表情识别等任务的基础，在过去几十年得到了广泛关注以及长足发展。随着计算机硬件性能在近几年得到巨大提升，使得卷积神经网络在人脸检测方面的应用更深入，并对人脸的检测性能有了进一步提高。

现有技术应用卷积神经网络进行人脸检测，在利用多层卷积层特征的时候，仅仅考虑了人脸本身的特征，而忽略了人脸周围的背景(context)信息。

发明内容

本发明的目的在于提供一种基于多感受野动态结合的人脸检测方法及系统。

为达此目的，本发明采用以下技术方案：

提供一种基于多感受野动态结合的人脸检测方法，具体包括：

步骤S1，将待检测图像输入预先生成的神经网络模型中进行特征提取，得到相应的初始特征图；

步骤S2，采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作，得到具有第一感受野的第一特征图；

步骤S3，采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作，得到具有第二感受野的第二特征图；

步骤S4，采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作，得到具有第三感受野的第三特征图；

步骤S5，将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图；

步骤S6，采用注意力机制更新所述第四特征图的权重，并根据经权重更新后的所述第四特征图进行人脸检测。

作为本发明的一种优选方案，所述第一空洞卷积的卷积核为3*3，且所述第一预设次数为1。

作为本发明的一种优选方案，所述第二空洞卷积的卷积核为3*3，且所述第二预设次数为2。

作为本发明的一种优选方案，所述第三空洞卷积的卷积核为3*3，且所述第三预设次数为3。

作为本发明的一种优选方案，所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。

一种基于多感受野动态结合的人脸检测系统，应用以上任意一项所述的基于多感受野动态结合的人脸检测方法，所述基于多感受野动态结合的人脸检测系统具体包括：

特征提取模块，用于将待检测图像输入预先生成的神经网络模型中进行特征提取，得到相应的初始特征图；

第一卷积模块，连接所述特征提取模块，用于采用第一空洞卷积对所述初始特征图进行第一预设次数的卷积操作，得到具有第一感受野的第一特征图；

第二卷积模块，连接所述特征提取模块，采用第二空洞卷积对所述初始特征图进行第二预设次数的卷积操作，得到具有第二感受野的第二特征图；

第三卷积模块，连接所述特征提取模块，采用第三空洞卷积对所述初始特征图进行第三预设次数的卷积操作，得到具有第三感受野的第三特征图；

数据叠加模块，分别连接所述第一卷积模块、所述第二卷积模块和所述第三卷积模块，用于将所述第一特征图、所述第二特征图和所述第三特征图进行叠加得到第四特征图；

权重更新模块，连接所述数据叠加模块，用于采用注意力机制更新所述第四特征图的权重，并根据经权重更新后的所述第四特征图进行人脸检测。

本发明的有益效果：

1)结合不同的感受野，引入了人脸周围的背景信息；

2)引入注意机制，去动态结合不同感受野之间的信息；

3)利用动态结合之后的感受野之间的信息去进行人脸检测，有效提升人脸检测的准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例所述的一种基于多感受野动态结合的人脸检测方法的流程示意图。

图2是本发明一实施例所述的一种基于多感受野动态结合的人脸检测方法的原理示意图。

图3是本发明一实施例所述的一种基于多感受野动态结合的人脸检测系统的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本专利的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

在本发明的描述中，除非另有明确的规定和限定，若出现术语“连接”等指示部件之间的连接关系，该术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

基于现有技术中存在的技术问题，本发明提供一种基于多感受野动态结合的人脸检测方法，如图1所示，具体包括：

步骤S2，采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作，得到具有第一感受野的第一特征图；

步骤S3，采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作，得到具有第二感受野的第二特征图；

步骤S4，采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作，得到具有第三感受野的第三特征图；

步骤S5，将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图；

步骤S6，采用注意力机制更新第四特征图的权重，并根据经权重更新后的第四特征图进行人脸检测。

具体地，本实施例中，本发明通过引入不同的感受野，引入大量的背景信息，并通过引入动态注意机制去动态融合背景信息，有效提升人脸检测的准确率。

进一步地，如图2所示，将处理得到的初始特征图分别做一次，两次，三次3x3卷积之后得到不同的感受野，叠加到一起，得到一个新的特征图,引入注意力机制提取特征信息，经过多次实验证明，这种多感受野的结合方式在人脸检测项目中达到的效果最优。

作为本发明的一种优选方案，第一空洞卷积的卷积核为3*3，且第一预设次数为1。

作为本发明的一种优选方案，第二空洞卷积的卷积核为3*3，且第二预设次数为2。

作为本发明的一种优选方案，第三空洞卷积的卷积核为3*3，且第三预设次数为3。

作为本发明的一种优选方案，神经网络模型采用S3FD算法对待检测图像进行特征提取。

一种基于多感受野动态结合的人脸检测系统，应用以上任意一项的基于多感受野动态结合的人脸检测方法，如图3所示，基于多感受野动态结合的人脸检测系统具体包括：

特征提取模块1，用于将待检测图像输入预先生成的神经网络模型中进行特征提取，得到相应的初始特征图；

第一卷积模块2，连接特征提取模块1，用于采用第一空洞卷积对初始特征图进行第一预设次数的卷积操作，得到具有第一感受野的第一特征图；

第二卷积模块3，连接特征提取模块1，采用第二空洞卷积对初始特征图进行第二预设次数的卷积操作，得到具有第二感受野的第二特征图；

第三卷积模块4，连接特征提取模块1，采用第三空洞卷积对初始特征图进行第三预设次数的卷积操作，得到具有第三感受野的第三特征图；

数据叠加模块5，分别连接第一卷积模块2、第二卷积模块3和第三卷积模块4，用于将第一特征图、第二特征图和第三特征图进行叠加得到第四特征图；

权重更新模块6，连接数据叠加模块5，用于采用注意力机制更新第四特征图的权重，并根据经权重更新后的第四特征图进行人脸检测。

需要声明的是，上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白，还可以对本发明做各种修改、等同替换、变化等等。但是，这些变换只要未背离本发明的精神，都应在本发明的保护范围之内。另外，本申请说明书和权利要求书所使用的一些术语并不是限制，仅仅是为了便于描述。

Claims

1.一种基于多感受野动态结合的人脸检测方法，其特征在于，具体包括：

2.根据权利要求1所述的基于多感受野动态结合的人脸检测方法，其特征在于，所述第一空洞卷积的卷积核为3*3，且所述第一预设次数为1。

3.根据权利要求1所述的基于多感受野动态结合的人脸检测方法，其特征在于，所述第二空洞卷积的卷积核为3*3，且所述第二预设次数为2。

4.根据权利要求1所述的基于多感受野动态结合的人脸检测方法，其特征在于，所述第三空洞卷积的卷积核为3*3，且所述第三预设次数为3。

5.根据权利要求1所述的基于多感受野动态结合的人脸检测方法，其特征在于，所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。

6.一种基于多感受野动态结合的人脸检测系统，其特征在于，应用如权利要求1-5中任意一项所述的基于多感受野动态结合的人脸检测方法，所述基于多感受野动态结合的人脸检测系统具体包括：

7.根据权利要求6所述的基于多感受野动态结合的人脸检测系统，其特征在于，所述第一空洞卷积的卷积核为3*3，且所述第一预设次数为1。

8.根据权利要求6所述的基于多感受野动态结合的人脸检测系统，其特征在于，所述第二空洞卷积的卷积核为3*3，且所述第二预设次数为2。

9.根据权利要求6所述的基于多感受野动态结合的人脸检测系统，其特征在于，所述第三空洞卷积的卷积核为3*3，且所述第三预设次数为3。

10.根据权利要求6所述的基于多感受野动态结合的人脸检测系统，其特征在于，所述神经网络模型采用S3FD算法对所述待检测图像进行特征提取。