CN111461028A

CN111461028A - 复杂场景中的口罩检测模型训练及检测方法、介质及装置

Info

Publication number: CN111461028A
Application number: CN202010255376.2A
Authority: CN
Inventors: 吴晓晖; 卢阳; 王书平
Original assignee: Hangzhou Shizai Technology Co ltd
Current assignee: Hangzhou Shizai Technology Co ltd
Priority date: 2020-04-02
Filing date: 2020-04-02
Publication date: 2020-07-28

Abstract

复杂场景中的口罩检测模型训练及检测方法、介质及装置，涉及图片识别技术领域；口罩检测模型训练方法，包括以下步骤：S1、采集数据：数据由包括近景数据以及远景数据，整合后形成数据集；S2、对远景数据中目标进行优化：优化的方法为对远景数据内目标框进行聚类，得到更高拟合度的先验框；S3、采用深度学习模型对数据进行训练。与现有技术相比，对远景和小目标检测进行了优化，有效的改善了现有技术对远景和小目标检测效果不佳的问题，该方法鲁棒性好、能够适应远景、近景，能够快速准确地检测人员是否佩戴口罩。

Description

复杂场景中的口罩检测模型训练及检测方法、介质及装置

技术领域

本发明涉及图片识别技术领域，特别涉及复杂场景中的口罩检测模型训练及检测方法、介质及装置。

背景技术

口罩作为一种卫生用品广泛应用于厨房、医院、工厂、工地等场所，能够有效防唾液飞沫、止粉尘、有害气体等进出口鼻。对于这些需要检测是否佩戴口罩的场所，现有的检测方法有两种，第一种是在口罩上安装检测的传感器，根据检测传感器的检测数据，确定是否佩戴口罩，该方式需要在口罩上额外安装设备，会导致成本增加，可能会影响佩戴的舒适性。第二种方式是使用图像处理方法，比如通过对所述目标人脸图像进行阈值分割，通过统计上下人脸区域像素个数，和设定的阈值做对比，从而判断是否佩戴口罩，但是该方法的只是单纯的对人脸区域的像素进行统计对比，检测准确率会偏低。

目前比较先进的方法是使用目标检测，现有的目标检测方法的使用场景一般为近景，比如大厦的出入口，而且往往要求摄像头必须设置固定的位置和角度，这样对远景的效果不好，远景的实际场景有广场、工地等等，许多工地直接使用现有的高空球机，画面中的人脸比较小，角度比较差。

发明内容

本发明的目的在于，提供口罩检测模型训练方法、口罩检测方法。

本发明的技术方案：口罩检测模型训练方法，包括以下步骤：

S1、采集数据：数据由包括近景数据以及远景数据，整合后形成数据集；

S2、对远景数据中目标进行优化：优化的方法为对远景数据内目标框进行聚类，得到更高拟合度的先验框；

S3、采用深度学习模型对数据进行训练。

上述的口罩检测模型训练方法，所述步骤S2中对远景数据内目标框聚类采用kmeans算法，具体步骤如下:

A1、在数据集样本中随机选取k个样本充当各个簇的中心点{μ₁,μ₂,μ₃......μ_k}，对应的簇{C₁,C₂,C₃......C_k}。

A2、计算所有样本与各个簇中心之间的距离dist(xⁱ，μ_j)，然后把样本点划入最近的簇中xⁱ∈μ_nearest。

A3、根据簇中已有的样本点，重新计算簇中心

其中|C_i|表示第i个簇的样本个数。

A4、多次重复步骤A2和A3，直到簇中心稳定。

上述的口罩检测模型训练方法，口罩检测模型训练方法，所述步骤S3中，先将数据集中人体提取出来，判断是否佩戴口罩，将佩戴口罩的人脸置入预设的背景图像中，且对未佩戴口罩的人脸进行坐标信息标注，最终模型训练完成之后形成一个检测器，该检测器输出结果只有一个，即检测数据输入之后，仅输出所有未戴口罩的图片结果。

口罩检测方法：

与现有技术相比，优点在于：包括如下步骤：

T1、获取检测图片；

T2、将图片进行预处理，得到人体信息矩阵以及只包含人体的图片，该人体信息矩阵包括人体坐标信息；

T3、将人体图片输入到如权利要求1-4所述的口罩检测器中；

T4、检测器输出未戴口罩的人脸目标结果。

上述的口罩检测方法中：所述步骤T2的具体步骤为：先将测试图片输入到人体通用检测器，得到人体坐标信息矩阵

其中conf_n表示第n个人体目标的置信度，x_n表示坐标框左上点的横坐标，y_n表示坐标框左上点的纵坐标，w_n表示目标坐标框的宽度，h_n表示目标坐标框的高度。

上述的口罩检测方法中：遍历M_PC将置信度低的数据过滤掉，得到

随即输入检测器中。

上述的口罩检测方法中：检测器输出未戴口罩人脸坐标信息矩阵M_f，遍历M_f，将置信度低的信息过滤掉，最终得到未戴口罩的目标。

本发明的优点在于：与现有技术相比，对远景和小目标检测进行了优化，有效的改善了现有技术对远景和小目标检测效果不佳的问题，该方法鲁棒性好、能够适应远景、近景，能够快速准确地检测人员是否佩戴口罩。

下面结合实施例对本发明作进一步的说明，但并不作为对本发明限制的依据。

实施例：构建模型，具体步骤如下：

采集数据，模型训练使用了丰富的数据集，采集数据的摄像头的位置和角度变化多，包括各种不同的场景，比如餐厅后厨、商场，以及大型开放场景的工地、广场、公路等等，以上不仅仅包括开源数据集，还有相当一部分是专用数据集，其中餐厅后厨和工地是监控场景下的专用数据集，丰富的数据提高了模型的鲁棒性。

对远景目标的优化：用kmeans算法對数据中目标框聚类，得到一组符合真实情况的先验框，提高了远景目标检测的精度。具体操作如下：

A1、在远景数据集样本中随机选取k个样本充当各个簇的中心点{μ₁,μ₂,μ₃......μ_k}，对应的簇{C₁,C₂,C₃......C_k}；

A2、计算所有样本与各个簇中心之间的距离dist(xⁱ，μ_j)，然后把样本点划入最近的簇中xⁱ∈μ_nearest；

A3、根据簇中已有的样本点，重新计算簇中心

其中|C_i|表示第i个簇的样本个数；

A4、多次重复步骤A2和A3，直到簇中心稳定。

采用深度学习模型对训练数据进行训练。使用深度学习检测是否佩戴口罩往往训练数据分成两类，一类是佩戴口罩的人脸，另一种是未戴口罩的人脸，本实施例输出只设置一个，就是未戴口罩的人脸，将佩戴口罩的人脸的图像放入背景图像，这样不仅仅规避了检测各种形状、各种颜色的口罩，提升了检测方法的稳定性，而且因为背景图像不需要任何坐标信息，所以制作训练数据时更加省时省力。只需要对未戴口罩的人脸进行坐标信息的标注即可。

具体的检测步骤如下：将待检测的图片信息输入到人体通用模型(该模型为现有技术中任一同类功能的模型即可)，输出人体坐标信息矩阵

遍历M_PC将置信度低的数据过滤掉，得到

随即输入口罩检测器中，输出未戴口罩人脸坐标信息矩阵

遍历M_f，将置信度低的信息过滤掉，最终得到未戴口罩的目标。