CN114092998A

CN114092998A - 一种基于卷积神经网络的佩戴口罩人脸识别检测方法

Info

Publication number: CN114092998A
Application number: CN202111319006.1A
Authority: CN
Inventors: 李辉; 陈少杰; 曹月花
Original assignee: School of Information Engineering of Hangzhou Dianzi University
Current assignee: School of Information Engineering of Hangzhou Dianzi University
Priority date: 2021-11-09
Filing date: 2021-11-09
Publication date: 2022-02-25

Abstract

本发明公开了一种基于卷积神经网络的佩戴口罩人脸识别检测方法，包括以下步骤：采集人脸部的图像；对采集到的图片进行预处理，然后对有无佩戴口罩进行标注；将划分好的训练集送入模型开始训练，输入的图片会经过主干特征提取网络，在主干特征提取网络中，会分离出6个有效特征层，用来预测结果；对获取到的每一个有效特征层，分别对其进行一次卷积，并需要计算每一个有效特征层对应的先验框；获得预测框对预测框进行得分排序与非极大抑制获得真实框；步骤六：快速检输出目标图像。本发明将VGG16的conv1，conv2，conv3，conv4，conv5的卷积层替换为mobilenet里面对应的可分离卷积层。大大减少了模型的参数，使得模型更加轻便，提升了模型行运行速度。

Description

一种基于卷积神经网络的佩戴口罩人脸识别检测方法

技术领域

本发明属于机器视觉及图像处理技术领域，特别是涉及一种基于卷积神经网络的佩戴口罩人脸识别检测方法。

背景技术

目前，全球新型冠状病毒感染的肺炎流行期间，佩戴口罩成为人们出行的一种方式，可以有效降低感染率。尤其是在人员密集的场所，例如公共交通站、学校、医院、游乐场所等人员密集区。由于，之前没有佩戴口罩的习惯、佩戴口罩呼吸困难、夏天佩戴口罩不舒服等原因，部分人群在密集场所仍然不佩戴口罩，这样就会存在互相传染的问题。然而，在这些场所并没有快速检测口罩佩戴的装置，如果通过人工检测，一方面人流量大，另一方面检测者被传染的概率很大，之后会出现交叉感染等情况。那么这些场所就需要快速检测有无佩戴口罩的通道。一种快速检测佩戴口罩人脸识别方法显得尤为重要。

发明内容

为了克服上述问题，本发明提供了一种基于卷积神经网络的佩戴口罩人脸识别检测方法，给出了检测具体步骤S1-S5，S3将VGG16的conv1，conv2，conv3，conv4，conv5的卷积层替换为mobilenet里面对应的可分离卷积层；大大减少了模型的参数，使得模型更加轻便，提升了模型行运行速度；提升了算法的实时性，能够快速检测到有无佩戴口罩。

本发明所采用的技术方案是：

一种基于卷积神经网络的佩戴口罩人脸识别检测方法，包括以下步骤：

步骤一：采集人脸部的图像；

步骤二：对采集到的图片进行预处理，然后对有无佩戴口罩进行标注；

步骤三：将划分好的训练集送入模型开始训练，输入的图片会经过主干特征提取网络，在主干特征提取网络中，会分离出6个有效特征层，用来预测结果；

步骤四：对获取到的每一个有效特征层，分别对其进行一次卷积，并需要计算每一个有效特征层对应的先验框；

步骤五：获得预测框对预测框进行得分排序与非极大抑制获得真实框；

步骤六：快速检输出目标图像；

其中，步骤一具体为：采集公共场所进出口人脸的图像，在采集的图片中混入从WIDERFace数据集中的2000张图片；该数据集本是一个遮挡人脸的数据集，其中有各种被遮挡的人脸图片，大多数都是被口罩遮挡的人脸图片。

其中，步骤二具体为：将戴口罩的人脸标注为face_msk；没戴口罩的标注为face；将标注好的图片按9：1的比例随机的分为训练集和测试集。

其中，步骤三具体为：将划分好的训练集送入模型开始训练，输入的图片会经过主干特征提取网络；在主干特征提取网络中，会分离出6个有效特征层，用来预测结果。

其中，步骤四具体为：对获取到的每一个有效特征层，分别对其进行一次num_priorsx4的卷积、一次num_priorsxnum_classes的卷积、并需要计算每一个有效特征层对应的先验框；而num_priors指的是该特征层所拥有的先验框数量；利用num_priorsx4的卷积的结果对先验框进行调整，获得预测框。

其中，步骤五具体为：通过对每一个特征层的处理，可以获得三个内容，分别是：num_priorsx4的卷积用于预测该特征层上每一个网格点上、每一个先验框的变化情况；num_priorsxnum_classes的卷积用于预测该特征层上每一个网格点上、每一个预测框对应的种类；每一个有效特征层对应的先验框对应着该特征层上，每一个网格点上预先设定好的多个框；利用num_priorsx4的卷积与每一个有效特征层对应的先验框获得框的真实位置。

本发明的优点如下：

该发明将VGG16的conv1，conv2，conv3，conv4，conv5的卷积层替换为mobilenet里面对应的可分离卷积层；大大减少了模型的参数，使得模型更加轻便，提升了模型行运行速度。

附图说明

图1是本发明所述一种基于卷积神经网络的佩戴口罩人脸识别检测方法的流程图；

图2是本发明的一种基于卷积神经网络的佩戴口罩人脸识别检测方法的改进后的框架训练集示意图；

图3是本发明的一种基于卷积神经网络的佩戴口罩人脸识别检测方法的特征图检测示意图；

图4是本发明的一种基于卷积神经网络的佩戴口罩人脸识别检测方法的效特征层对应的先验框结果解码示意图。

具体实施方式

以下通过具体实施例来进一步说明本发明，以下实施例为本发明较佳的实施方式，但本发明的实施方式并不受下述实施例的限制。该领域的技术熟练人员根据上述苯发明内容对本发明做出的一些非本质的改进和调整，仍属于本发明保护范围。

实施例

如图1所示，一种基于卷积神经网络的佩戴口罩人脸识别检测方法，包括以下步骤：

步骤一：采集人脸部的图像；

步骤六：快速检输出目标图像。

本发明提供了改进后的框架训练集具体步骤，如图2所示：

改进部分：用MobileNet模型里面对应的层替换ssd模型里面对应的层将普通的卷积变换为深度可分离卷积。具体将VGG16的conv1，conv2，conv3，conv4，conv5的卷积层替换为mobilenet里面对应的可分离卷积层。去掉了fc6，fc7层。输入的图片经过了改进的VGG网络(Conv1->fc5)和几个另加的卷积层(Conv6->Conv9)，进行特征提取：

具体步骤，输入一张图片后，被resize到300x300的shape

conv1，经过两次[3,3]卷积网络，输出的特征层为64，输出为(300,300,64)，再2X2最大池化，输出net为(150,150,64)。

conv2，经过两次[3,3]卷积网络，输出的特征层为128，输出net为(150,150,128)，再2X2最大池化，输出net为(75,75,128)。

conv3，经过三次[3,3]卷积网络，输出的特征层为256，输出net为(75,75,256)，再2X2最大池化，输出net为(38,38,256)。

conv4，经过三次[3,3]卷积网络，输出的特征层为512，输出net为(38,38,512)，再2X2最大池化，输出net为(19,19,512)。

conv5，经过三次[3,3]卷积网络，输出的特征层为512，输出net为(19,19,512)，再2X2最大池化，输出net为(19,19,512)。

利用卷积代替全连接层，进行了两次[3,3]卷积网络，输出的特征层为1024，因此输出的net为(19,19,1024)。(从这里往前都是VGG的结构)

conv6，经过一次[1,1]卷积网络，调整通道数，一次步长为2的[3,3]卷积网络，输出的特征层为512，因此输出的net为(10,10,512)。

conv7，经过一次[1,1]卷积网络，调整通道数，一次步长为2的[3,3]卷积网络，输出的特征层为256，因此输出的net为(5,5,256)。

conv8，经过一次[1,1]卷积网络，调整通道数，一次padding为valid的[3,3]卷积网络，输出的特征层为256，因此输出的net为(3,3,256)。

conv9，经过一次[1,1]卷积网络，调整通道数，一次padding为valid的[3,3]卷积网络，输出的特征层为256，因此输出的net为(1,1,256)。

本发明提供了特征图的检测过程，如图3所示：

取有效特征层，来获取预测结果。分别取conv3的卷积的特征、conv5的特征、conv6的第二次卷积的特征、conv7的第二次卷积的特征、conv8的第二次卷积的特征、conv9的第二次卷积的特征。对获取到的每一个有效特征层，分别对其进行一次num_priorsx4的卷积、一次num_priorsxnum_classes的卷积、并需要计算每一个有效特征层对应的先验框。而num_priors指的是该特征层所拥有的先验框数量。其中：num_priorsx4的卷积用于预测该特征层上每一个网格点上每一个先验框的变化情况。最终产生的默认边界框数量：8712个。

本发明每一个有效特征层对应的先验框结果解码，如图4所示：

每一个有效特征层将整个图片分成与其长宽对应的网格，如conv3的特征层就是将整个图像分成38x38个网格；然后从每个网格中心建立多个先验框，如conv3的特征层就是建立了4个先验框；对于conv3的特征层来讲，整个图片被分成38x38个网格，每个网格中心对应4个先验框，一共包含了，38x38x4个，5776个先验框。先验框虽然可以代表一定的框的位置信息与框的大小信息，但是其是有限的，无法表示任意情况，因此还需要调整，ssd利用num_priorsx4的卷积的结果对先验框进行调整。num_priorsx4中的num_priors表示了这个网格点所包含的先验框数量，其中的4表示了x_offset、y_offset、h和w的调整情况。x_offset与y_offset代表了真实框距离先验框中心的xy轴偏移情况。

h和w代表了真实框的宽与高相对于先验框的变化情况。

SSD解码过程就是将每个网格的中心点加上它对应的x_offset和y_offset，加完后的结果就是预测框的中心，然后再利用先验框和h、w结合计算出预测框的长和宽。这样就能得到整个预测框的位置了。当然得到最终的预测结构后还要进行得分排序与非极大抑制筛选这一部分基本上是所有目标检测通用的部分。

1、取出每一类得分大于self.obj_threshold的框和得分。

2、利用框的位置和得分进行非极大抑制。

多任务损失函数：总体目标损失函数是定位误差(loc)和置信度损失或者叫分类误差(conf)的加权和：

设定α为1，可以通过cross_validation选择。

N：与真实边界框匹对的anchor的数量；

x:如果一个anchor与真实边界框匹对，值为1，否则为0；

c:真实物体的预测值；

L：预测的边界框中心位置和长、宽；

g：真实的边界框中心位置和长、宽；

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：包括以下步骤：

步骤一：采集人脸部的图像；

步骤六：快速检输出目标图像。

2.根据权利要求1所述的一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：所述的步骤一具体为：采集公共场所进出口人脸的图像，在采集的图片中混入从WIDERFace数据集中的2000张图片；该数据集本是一个遮挡人脸的数据集，其中有各种被遮挡的人脸图片，大多数都是被口罩遮挡的人脸图片。

3.根据权利要求1所述的一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：所述的步骤二具体为：将戴口罩的人脸标注为face_msk；没戴口罩的标注为face；将标注好的图片按9：1的比例随机的分为训练集和测试集。

4.根据权利要求1所述的一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：所述的步骤三具体为：将划分好的训练集送入模型开始训练，输入的图片会经过主干特征提取网络；在主干特征提取网络中，会分离出6个有效特征层，用来预测结果。

5.根据权利要求1所述的一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：所述的步骤四具体为：对获取到的每一个有效特征层，分别对其进行一次num_priorsx4的卷积、一次num_priorsxnum_classes的卷积、并需要计算每一个有效特征层对应的先验框；而num_priors指的是该特征层所拥有的先验框数量；利用num_priorsx4的卷积的结果对先验框进行调整，获得预测框。

6.根据权利要求1所述的一种基于卷积神经网络的佩戴口罩人脸识别检测方法，其特征在于：所述的步骤五具体为：通过对每一个特征层的处理，可以获得三个内容，分别是：num_priorsx4的卷积用于预测该特征层上每一个网格点上、每一个先验框的变化情况；num_priorsxnum_classes的卷积用于预测该特征层上每一个网格点上、每一个预测框对应的种类；每一个有效特征层对应的先验框对应着该特征层上，每一个网格点上预先设定好的多个框；利用num_priorsx4的卷积与每一个有效特征层对应的先验框获得框的真实位置。