CN114267074A

CN114267074A - 一种基于YOLOv5的口罩携带检测的方法

Info

Publication number: CN114267074A
Application number: CN202210009359.XA
Authority: CN
Inventors: 崔小同; 潘斌
Original assignee: Liaoning Shihua University
Current assignee: Liaoning Shihua University
Priority date: 2022-01-06
Filing date: 2022-01-06
Publication date: 2022-04-01

Abstract

该发明公开了一种口罩检测的方法。通过视频或摄像头的途径进行输入的获取，将每帧图片输入进行预处理，经过主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构。并采用的是自适应锚框结构，NMS非极大抑制与自注意力机制。经过模型处理后得到预期的图片。最终将处理后的图像或视频进行可视化的显示。该发明拥有很好的检测效果并能进行精确的预测和精准的定位。

Description

一种基于YOLOv5的口罩携带检测的方法

技术领域

本发明主要涉及计算机视觉处理领域与深度学习领域，具体涉及的是一种基于YOLOv5的口罩携带检测的方法。

背景技术

当前深度学习的目标检测算法算法主要分为两类，一类是两级式：检测方式是区域提议结合检测，以R-CNN系列为代表，这类算法精准度高但时效性较低；另一类是单级式：检测方式是无区域提议框架，即提议和检测一体，以SSD系列、YOLO系列为代表，这类算法检测速度快但精准度较差。疫情前目标检测已应用在生产生活等诸多方面，但专业的口罩佩戴检测较少，因此疫情后的急需吸引了国内外众多学者参与研究。有RETINAFACE算法，YOLOv3算法等，追求更高的目标检测精度与准确性具有重要意义。

发明内容

近年来计算机视觉与数字图像处理技术发展迅速，目标检测的方法愈来愈多，效果愈来愈好。目标大的口罩佩戴检测效果很好，但是目标小的口罩佩戴检测下效果有待提高。复杂场景下的检测效果并不友好。会出现漏检和错检的问题。在小目标和复杂场景下提高口罩佩戴检测的效果是该发明的所解决现有的问题。该发明通过视频或摄像头的途径进行输入的获取，将每帧图片输入进行预处理缩放到特定尺寸送入网络中学习，经过主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构，包含Focus结构与SPP结构。SPP特征金字塔结构进行concat融合，提高感受野，解决图像重复特征提取的问题。经过Neck采用的FPN与PAN结合的结构，并将图像特征传递到预测层加强了信息传播，具备准确保留空间信息的能力。输出端BoundingBox损失函数为GIOU_Loss，用NMS对目标最后的检测框进行非极大值抑制处理以获得最优目标框。YOLOv5的三个模型YOLOv5s,YOLOv5m,YOLOv5l在机构上一致，区别在于模型的深度和宽度设置不同。可依据效果选择基础模型。最终将处理后的图像或视频进行可视化的显示。该发明拥有很好的检测效果并能进行精确的预测和精准的定位。

附图说明

图1 YOLOv5网络结构图。

图2 结构图。

具体实施方式

为了使发明的目的、特征和优点更加清晰，下面结合附图和具体实施方案，对本发明进一步的详细描述。需要说明的是，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

将设备采集的图片传输到输入到图像处理模块中,将视频传输到视频图像处理模块进行处理，采集设备是摄像头时将数据传入相应的图像处理模块中。最终将检测完成的图像在显示器上进行可视化。

图像处理模块将图片输入进行预处理缩放到特定尺寸送入网络中学习，经过Backbone模块主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构。可在YOLOv5的三个模型YOLOv5s,YOLOv5m,YOLOv5l中进行选择，可依据效果选择基础模型。从Backbone模块进入Neck模块，从而实现目标检测。

视频图像处理模块组成是在图像处理模块的基础上增加将视频处理为多帧图片。摄像图像模块将设备获取的数据转化为多帧图像并结合图像处理模块。

请参阅图1，Backbone结构采用的YOLOv5的网络结构。，包含Focus结构与SPP结构。SPP特征金字塔结构进行concat融合，提高感受野，解决图像重复特征提取的问题。经过Neck采用的FPN与PAN结合的结构，并将图像特征传递到预测层加强了信息传播，具备准确保留空间信息的能力。输出端BoundingBox损失函数为GIOU_Loss，用NMS对最后的目标检测框进行非极大值抑制处理以获得最优目标框。

最后将处理好的图像合成为视频，然后将实时口罩携带检测视频结果进行可视化输出，处理后的视频可以应用到目标跟踪系统上。

上述实施例为本发明的一种实施方式，但本发明的实施方式不限定于此，从事该技术人员在未背离本发明精神和原则下所做的任何修改、替换、改进，均包含在发明的保护范围内。

Claims

1.一种基于YOLOv5的口罩携带检测方法，达到预期的实时性和精准性，其特征在于预处理模块与主干模块。

2.根据权利要求1所述的一种基于YOLOv5的口罩携带检测方法,其特征在于，所述的图像预处理模块包含了图片，视频与摄像头。

3.根据权利要求1所述的一种基于YOLOv5的口罩携带检测方法，其特征在于，所述的主干模块采用了YOLOv5网络结构。

4.根据权利要求1、2、3所述的一种YOLOv5的口罩携带检测方法，其特征在于，具体包括以下步骤：

S1.将视频图像以每秒n帧的速率分为图片传输给预处理模块；

S2.将经预处理的图像输入到Backbone主干网络模块中；

S3.然后将多层网络输入到Neck模块中；

S4.进而得到预测的结果有位置；

S5. 最后将处理好的图像按照正确的序列顺序合成为视频，然后将实时口罩携带视频进行可视化输出。