CN114267074A - 一种基于YOLOv5的口罩携带检测的方法 - Google Patents
一种基于YOLOv5的口罩携带检测的方法 Download PDFInfo
- Publication number
- CN114267074A CN114267074A CN202210009359.XA CN202210009359A CN114267074A CN 114267074 A CN114267074 A CN 114267074A CN 202210009359 A CN202210009359 A CN 202210009359A CN 114267074 A CN114267074 A CN 114267074A
- Authority
- CN
- China
- Prior art keywords
- yolov5
- video
- module
- mask
- detection method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
该发明公开了一种口罩检测的方法。通过视频或摄像头的途径进行输入的获取,将每帧图片输入进行预处理,经过主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构。并采用的是自适应锚框结构,NMS非极大抑制与自注意力机制。经过模型处理后得到预期的图片。最终将处理后的图像或视频进行可视化的显示。该发明拥有很好的检测效果并能进行精确的预测和精准的定位。
Description
技术领域
本发明主要涉及计算机视觉处理领域与深度学习领域,具体涉及的是一种基于YOLOv5的口罩携带检测的方法。
背景技术
当前深度学习的目标检测算法算法主要分为两类,一类是两级式:检测方式是区域提议结合检测,以R-CNN系列为代表,这类算法精准度高但时效性较低;另一类是单级式:检测方式是无区域提议框架,即提议和检测一体,以SSD系列、YOLO系列为代表,这类算法检测速度快但精准度较差。疫情前目标检测已应用在生产生活等诸多方面,但专业的口罩佩戴检测较少,因此疫情后的急需吸引了国内外众多学者参与研究。有RETINAFACE算法,YOLOv3算法等,追求更高的目标检测精度与准确性具有重要意义。
发明内容
近年来计算机视觉与数字图像处理技术发展迅速,目标检测的方法愈来愈多,效果愈来愈好。目标大的口罩佩戴检测效果很好,但是目标小的口罩佩戴检测下效果有待提高。复杂场景下的检测效果并不友好。会出现漏检和错检的问题。在小目标和复杂场景下提高口罩佩戴检测的效果是该发明的所解决现有的问题。该发明通过视频或摄像头的途径进行输入的获取,将每帧图片输入进行预处理缩放到特定尺寸送入网络中学习,经过主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构,包含Focus结构与SPP结构。SPP特征金字塔结构进行concat融合,提高感受野,解决图像重复特征提取的问题。经过Neck采用的FPN与PAN结合的结构,并将图像特征传递到预测层加强了信息传播,具备准确保留空间信息的能力。输出端BoundingBox损失函数为GIOU_Loss,用NMS对目标最后的检测框进行非极大值抑制处理以获得最优目标框。YOLOv5的三个模型YOLOv5s,YOLOv5m,YOLOv5l在机构上一致,区别在于模型的深度和宽度设置不同。可依据效果选择基础模型。最终将处理后的图像或视频进行可视化的显示。该发明拥有很好的检测效果并能进行精确的预测和精准的定位。
附图说明
图1 YOLOv5网络结构图。
图2 结构图。
具体实施方式
为了使发明的目的、特征和优点更加清晰,下面结合附图和具体实施方案,对本发明进一步的详细描述。需要说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
将设备采集的图片传输到输入到图像处理模块中,将视频传输到视频图像处理模块进行处理,采集设备是摄像头时将数据传入相应的图像处理模块中。最终将检测完成的图像在显示器上进行可视化。
图像处理模块将图片输入进行预处理缩放到特定尺寸送入网络中学习,经过Backbone模块主干神经网络提取数据特征。主干网络主要采用了YOLOv5模型结构。可在YOLOv5的三个模型YOLOv5s,YOLOv5m,YOLOv5l中进行选择,可依据效果选择基础模型。从Backbone模块进入Neck模块,从而实现目标检测。
视频图像处理模块组成是在图像处理模块的基础上增加将视频处理为多帧图片。摄像图像模块将设备获取的数据转化为多帧图像并结合图像处理模块。
请参阅图1,Backbone结构采用的YOLOv5的网络结构。,包含Focus结构与SPP结构。SPP特征金字塔结构进行concat融合,提高感受野,解决图像重复特征提取的问题。经过Neck采用的FPN与PAN结合的结构,并将图像特征传递到预测层加强了信息传播,具备准确保留空间信息的能力。输出端BoundingBox损失函数为GIOU_Loss,用NMS对最后的目标检测框进行非极大值抑制处理以获得最优目标框。
最后将处理好的图像合成为视频,然后将实时口罩携带检测视频结果进行可视化输出,处理后的视频可以应用到目标跟踪系统上。
上述实施例为本发明的一种实施方式,但本发明的实施方式不限定于此,从事该技术人员在未背离本发明精神和原则下所做的任何修改、替换、改进,均包含在发明的保护范围内。
Claims (4)
1.一种基于YOLOv5的口罩携带检测方法,达到预期的实时性和精准性,其特征在于预处理模块与主干模块。
2.根据权利要求1所述的一种基于YOLOv5的口罩携带检测方法,其特征在于,所述的图像预处理模块包含了图片,视频与摄像头。
3.根据权利要求1所述的一种基于YOLOv5的口罩携带检测方法,其特征在于,所述的主干模块采用了YOLOv5网络结构。
4.根据权利要求1、2、3所述的一种YOLOv5的口罩携带检测方法,其特征在于,具体包括以下步骤:
S1.将视频图像以每秒n帧的速率分为图片传输给预处理模块;
S2.将经预处理的图像输入到Backbone主干网络模块中;
S3.然后将多层网络输入到Neck模块中;
S4.进而得到预测的结果有位置;
S5. 最后将处理好的图像按照正确的序列顺序合成为视频,然后将实时口罩携带视频进行可视化输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009359.XA CN114267074A (zh) | 2022-01-06 | 2022-01-06 | 一种基于YOLOv5的口罩携带检测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009359.XA CN114267074A (zh) | 2022-01-06 | 2022-01-06 | 一种基于YOLOv5的口罩携带检测的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114267074A true CN114267074A (zh) | 2022-04-01 |
Family
ID=80832428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210009359.XA Withdrawn CN114267074A (zh) | 2022-01-06 | 2022-01-06 | 一种基于YOLOv5的口罩携带检测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114267074A (zh) |
-
2022
- 2022-01-06 CN CN202210009359.XA patent/CN114267074A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110674746B (zh) | 一种应用视频空间关系辅助实现高精度跨镜追踪的方法、装置、计算机设备以及存储介质 | |
US20080278487A1 (en) | Method and Device for Three-Dimensional Rendering | |
US11037308B2 (en) | Intelligent method for viewing surveillance videos with improved efficiency | |
KR20090084563A (ko) | 비디오 영상의 깊이 지도 생성 방법 및 장치 | |
Kruthiventi et al. | Low-light pedestrian detection from RGB images using multi-modal knowledge distillation | |
CN112207821B (zh) | 视觉机器人的目标搜寻方法及机器人 | |
CN110941996A (zh) | 一种基于生成对抗网络的目标及轨迹增强现实方法和系统 | |
CN112085031A (zh) | 目标检测方法及系统 | |
KR20140074201A (ko) | 추적 장치 | |
CN109948474A (zh) | Ai热成像全天候智能监控方法 | |
CN110414558A (zh) | 基于事件相机的特征点匹配方法 | |
CN103729620A (zh) | 一种基于多视角贝叶斯网络的多视角行人检测方法 | |
CN110348371A (zh) | 人体三维动作自动提取方法 | |
KR101990789B1 (ko) | 관심객체의 선택에 의한 영상 탐색장치 및 방법 | |
CN112422909A (zh) | 一种基于人工智能的视频行为分析管理系统 | |
CN102291568A (zh) | 一种大视场智能化视频监控系统的加速处理方法 | |
CN111246116B (zh) | 一种用于屏幕上智能取景显示的方法及移动终端 | |
WO2021248564A1 (zh) | 一种全景大数据应用监测管控系统 | |
JP2006054830A (ja) | 画像圧縮通信方法及び装置 | |
JP3227179B2 (ja) | 動物体検出および追跡処理方式 | |
US20200154046A1 (en) | Video surveillance system | |
CN114267074A (zh) | 一种基于YOLOv5的口罩携带检测的方法 | |
CN112906533B (zh) | 一种基于自适应检测区域的安全帽佩戴检测方法 | |
CN115984124A (zh) | 一种神经形态脉冲信号去噪和超分辨方法及装置 | |
CN115512263A (zh) | 一种面向高空坠物的动态视觉监测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220401 |