CN116665096A - 基于深度学习视觉算法的智慧加油站安全监管方法 - Google Patents
基于深度学习视觉算法的智慧加油站安全监管方法 Download PDFInfo
- Publication number
- CN116665096A CN116665096A CN202310567747.4A CN202310567747A CN116665096A CN 116665096 A CN116665096 A CN 116665096A CN 202310567747 A CN202310567747 A CN 202310567747A CN 116665096 A CN116665096 A CN 116665096A
- Authority
- CN
- China
- Prior art keywords
- training
- picture
- information
- data
- alarm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000013135 deep learning Methods 0.000 title claims abstract description 18
- 230000000007 visual effect Effects 0.000 title claims abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims description 22
- 238000012805 post-processing Methods 0.000 claims description 15
- 239000000779 smoke Substances 0.000 claims description 12
- 238000013139 quantization Methods 0.000 claims description 9
- 238000013508 migration Methods 0.000 claims description 8
- 230000005012 migration Effects 0.000 claims description 8
- 238000012544 monitoring process Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 238000007792 addition Methods 0.000 claims description 5
- 230000003993 interaction Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 238000013515 script Methods 0.000 claims description 4
- 230000000391 smoking effect Effects 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 abstract description 13
- 238000005516 engineering process Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- YNPNZTXNASCQKK-UHFFFAOYSA-N phenanthrene Chemical compound C1=CC=C2C3=CC=CC=C3C=CC2=C1 YNPNZTXNASCQKK-UHFFFAOYSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000002828 fuel tank Substances 0.000 description 1
- 239000003502 gasoline Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了基于深度学习视觉算法的智慧加油站安全监管方法,包括以下步骤:S10,训练模型;S20,后端处理及前端展示;S10,训练模型,包括以下步骤:S11,收集数据;S12,标注数据,组织数据集;S13,设置YOLOv5框架训练配置文件,进行训练。本发明通过对常见加油站中一些不安全行为、危险情况进行分析,利用加油站已有摄像头进行数据采集,通过计算机视觉目标检测算法对数据进行分析检测,由算法得到识别结果经处理后可对站点全域实现安全行为的识别和预警,能够有效地将隐患安全降到最低,杜绝安全事故的发生。
Description
技术领域
本发明属于深度学习技术领域,涉及一种基于深度学习视觉算法的智慧加油站安全监管方法。
背景技术
随着我国经济形势不断向前发展,社会对能源的需要也越来越迫切,在交通运输领域更是离不开千千万万个加油站及时地给运输车辆加油补充能源。加油站属危化品零售业,经营过程中需大量存储和销售汽油和柴油物质,具有易爆性、易然性、有毒性等危险、危害特性,一旦发生泄漏或爆炸,不仅造成人员伤亡和财产损失,更严重威胁到周边居民和环境。必须有效杜绝违章作业,减少操作失误,从而降低事故发生率,保障企业利益,人员安全。因此有必要将实现加油站安全管理现代化作为一个重要问题来解决。
近年来随着人工智能技术的不断发展,以深度学习为代表的人工智能技术发挥了极大优势,搜索技术、数据挖掘、视觉技术、自然语言处理、推荐个性化技术等在各自的领域以极快的速度迅速实现了产业化落地,将人类发展推到了一个前所未有的高度。在人工智能、深度学习快速发展的今天,一个迫切需要解决的问题是如何更好地将先进的科学技术理论转化成生产力,解决人们生产生活中遇到的实际问题,解决传统企业面临的痛点问题,真正意义上将人工智能技术强大的生命力表现出来。在人工智能的一个分支计算机视觉技术方面,目标检测技术已经逐步走向实际应用化,在智能安防、智能驾驶、工业缺陷检测、光学遥感领域、智能巡检等方面,目标检测技术发挥了极大作用。
目前工业界中常用的目标检测算法技术有二阶段的RCNN系列算法和一阶段的YOLO系列算法,相较于二阶段的RCNN系列算法,一阶段的YOLO系列算法无论是在检测速度上还是检测精度上都有着极大的优势,同时YOLO系列算法仍在不断地推陈出新,不断发展,这使得持续优化成为可能。从表1可以看出YOLOV5算法和之前的YOLOV3、YOLOV4相比,无论是在精度还是在速度上均有大幅度提升。
表1 YOLO系列算法性能对比
发明内容
为解决上述问题,本发明为了为提升加油站对不安全行为的监测,针对加油站中一些不安全行为、危险情况进行智能化分析,通过计算机视觉目标检测算法对数据进行分析检测,得到识别结果经处理后可对站点全域实现安全行为的识别和预警,能够有效地将隐患安全降到最低,杜绝安全事故的发生。
为实现上述目的,本发明的技术方案为基于深度学习视觉算法的智慧加油站安全监管方法,包括以下步骤:
S10,训练模型;
S20,后端处理及前端展示。
优选地,所述S10,训练模型,包括以下步骤:
S11,收集数据;
S12,标注数据,组织数据集;
S13,设置YOLOv5框架训练配置文件,进行训练。
优选地,所述S11,收集数据,包括以下步骤:
S111,在加油站现场利用球机进行拍摄,获取视频样本。
S112,根据视频样本的时间长度决定采样时间,获取样本,使训练出来的模型更加准确。本实施例每隔10秒,对获取的视频样本进行采样,获取图像样本,命名为合适的名字后,存于一个文件夹,形成图像数据集。
优选地,所述S112中对视频样本每隔10秒进行采样。
优选地,所述S12,标注数据,组织数据集,包括以下步骤:
S121,利用labelimg对数据集进行标注,设置两个大类,分别是加油类和卸油类,分别有10个小类和13个小类,选择生成YOLO格式的txt标注文件,格式为:
class_id x y w h
class_id:类别的id编号
其中,x:目标的中心点x坐标/图片总宽度;
y:目标的中心的y坐标/图片总高度;
w:目标框的宽带/图片总宽度;
h:目标框的高度/图片总高度。
S122,将所有需要训练和测试的图片放入JPEGImages文件夹,对应的yolo格式标记文件放入labels文件夹;
S123,利用python脚本文件,生成训练集和测试集,生成train.txt和test.txt,分别给出训练图片文件和测试图片文件的列表,含有每个图片的路径和文件名。
优选地,所述S13,设置YOLOv5框架训练配置文件,进行训练,具体为:设置测试配置文件,进行测试和性能统计,并据此修改YOLOv5先验框大小,重新训练和测试,获取最佳权重文件和配置文件。
优选地,在所述S13后,将训练完成后的模型其部署在边缘端计算板卡上,在服务器端基于Pytorch深度学习框架训练的模型在部署时,进行迁移量化工作,通过迁移量化将模型转化为能够适配在边缘端计算板卡上的模型格式;
再将算法模块进行封装,用http协议以json格式与后端进行交互,根据实际需求,定义接口地址、请求方式、请求参数、响应参数、返回格式、错误码;请求参数有timestamp:时间戳,算法推理检测的时间、camera_id:摄像头编号、detections:检测内容json字符串、image_origin:原始图像、image_det:检测图像;检测内容的json字符串参数:detections:[{},{},{},…]、class:类别、prob:识别概率。
优选地,在所述S13后,实时识别球机拍摄到的画面,得到位置信息和种类信息,在监控画面中框出具体位置并打印种类信息,具体包括以下步骤:
S31,利用opencv,来调用摄像头,以获取实时监控视频画面;
S32,提取视频的每一帧,进行颜色空间转换,从opencv图像的BGR格式,转换为YOLOv5所需要的RBG格式;
S33,进行图片的缩放,以适配YOLOv5要求的图像大小;
S34,将处理好之后的单帧图像输入YOLOv5,进行转换和识别,得到识别出来的位置信息和种类信息;
S35,若存在人员和工装,则框出人员及工装,标出类别信息,不做后处理判断;若存在抽烟、抽烟、打电话、未穿工装、未放置灭火器的不安全类别,则框出位置并标出类别信息,输出坐标信息并上传告警平台。
优选地,所述S35后告警平台收到相关信息后,进行逻辑后处理操作,形成告警信息,包括人员离岗告警、抽烟告警、打电话告警、烟火告警,前端页面弹窗提示告警信息,工作人员去及时处理。
优选地,所述S20,后端处理及前端展示,包括将检测到信息以json字符串的形式传递给后端,后端模块解析后进行后处理逻辑的编写,通过后处理后将最终告警结果传递给前端展示页面;同时后端模块也涉及前端功能的相关配置,包括摄像头的添加与删除,用户的增删改查。
本发明至少有如下具体有益效果:
1.现有加油站的安全监管只是简单的通过调看监控去发现问题,出现问题既无法立即做出有效干预,也无法在排查问题时短时间内从大量的监控视频中确定发生问题的时间及监控位置。本发明将深度学习方法引入到加油站安全监管中,通过视觉目标检测算法与加油站已有摄像头联动,对同一物体进行多次识别,可实现变焦识别、多摄像机联动识别。对于加油站出现的不安全行为以及危险情况能做出实时告警反馈,一旦出现不安全行为及危险情况,可立即反馈给工作人员,实时性高、检测效率准,能够有效减少加油站的安全隐患,降低加油站的危险情况的发生;
2.本发明视频AI检测模型丰富,可对多种不安全行为进行检测,实现的检测范围有人员识别、工服识别、安全帽识别、车辆识别、车牌识别、油箱盖识别、抽烟识别、打电话识别、灭火器识别、烟火识别等多种检测类型。检测类型丰富,可针对不同加油站的不同需求,选择检测类型,便于移植;
3.本发明实现了多算法、多技术融合,多算法联动将识别后的输出结果进行大数据分析,针对不同的告警信息,统计分析一天之内不同时间段告警信息数量,告警信息的类型,统计一个月内有哪些不安全行为或者危险情况的发生并将结果以折线图、饼状图、条形图等各种直观手段呈现出,有利于加油站更有针对性地去排查安全隐患,规范作业行为;
4.本发明将整套系统集成到了边缘端计算盒子中,边缘端计算盒子轻便灵巧,便于部署,同时支持海康、大华等主流摄像头的视频接入,支持8路/16路/32路视频流的智能实时分析,支持H264/H265硬件编解码,RTSP/ONVIF协议封装转发。通过模型压缩、量化、剪枝、并行加速等技术实现智能前置,从而达到边缘部署、前端智能的效果;
5.本方法还将视觉算法与业务流程进行了高度融合,针对系统检测出的结果,可自动生成报表,报表种类丰富,自动生成安全、服务、营销、运营等报表,不仅对加油站本身运维起到良好的作用,对于加油站的上级监管部门也可使其工作量大幅减少,实现提升效率、降本增效。
附图说明
图1为本发明方法实施例的基于深度学习视觉算法的智慧加油站安全监管方法的流程图;
图2为本发明方法实施例的基于深度学习视觉算法的智慧加油站安全监管方法的S10流程图;
图3为本发明方法实施例的基于深度学习视觉算法的智慧加油站安全监管方法的对应平台示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
参见图1,为本发明实施例的本发明的技术方案为基于深度学习视觉算法的智慧加油站安全监管方法的流程图,包括以下步骤:
S10,训练模型;
S20,后端处理及前端展示。
对可见光摄像机、红外测温摄像机、移动防爆一体机和其他传感设备的数据进行采集,至AI边缘计算盒子后进行数据分析后传输给Web端或客户端,通过设备预警和人工排查进行管理干预和人工干预,通过自动监测形成告警信息和预警播报进行自动干预。
参见图2,S10,训练模型,包括以下步骤:
S11,收集数据;
S12,标注数据,组织数据集;
S13,设置YOLOv5框架训练配置文件,进行训练。
S11,收集数据,包括以下步骤:
S111,在加油站现场利用球机进行拍摄,获取视频样本。
S112,根据视频样本的时间长度决定采样时间,获取样本,使训练出来的模型更加准确。本实施例每隔10秒,对获取的视频样本进行采样,获取图像样本,命名为合适的名字后,存于一个文件夹,形成图像数据集。
S112中对视频样本每隔10秒进行采样。
S12,标注数据,组织数据集,包括以下步骤:
S121,利用labelimg对数据集进行标注,设置两个大类,分别是加油类和卸油类,分别有10个小类和13个小类,参见表2。
表2
人员 | person |
工装 | uniforms |
菲工装 | non_uniforms |
小车 | car |
卡车 | truck |
摩托车 | motocycle |
车牌号 | plate |
油箱盖开 | cap_open |
油箱盖关 | cap_close |
打电话 | calling |
油罐车 | oli_truck |
三角木 | triangle |
静电线 | static_wire |
警戒架/线 | alert |
大灭火器 | l_extinguisher |
小灭火器 | s_extinguisher |
接油盒 | oil_can |
油管 | oil_pipeline |
人员 | person |
安全帽 | helmet |
未带安全帽 | non_helmet |
工装 | uniforms |
非工装 | non_uniforms |
选择生成YOLO格式的txt标注文件,格式为:
class_id x y w h
class_id:类别的id编号
其中,x:目标的中心点x坐标/图片总宽度;
y:目标的中心的y坐标/图片总高度;
w:目标框的宽带/图片总宽度;
h:目标框的高度/图片总高度。
S122,将所有需要训练和测试的图片放入JPEGImages文件夹,对应的yolo格式标记文件放入labels文件夹;
S123,利用python脚本文件,生成训练集和测试集,生成train.txt和test.txt,分别给出训练图片文件和测试图片文件的列表,含有每个图片的路径和文件名。
S13,设置YOLOv5框架训练配置文件,进行训练,具体为:设置测试配置文件,进行测试和性能统计,并据此修改YOLOv5先验框大小,重新训练和测试,直至模型的PR值达标,获取最佳权重文件和配置文件,导出模型。
在S13后,将训练完成后的模型其部署在边缘端计算板卡上,在服务器端基于Pytorch深度学习框架训练的模型在部署时,进行迁移量化工作,通过迁移量化将模型转化为能够适配在边缘端计算板卡上的模型格式;
再将算法模块进行封装,用http协议以json格式与后端进行交互,根据实际需求,定义接口地址、请求方式、请求参数、响应参数、返回格式、错误码;请求参数有timestamp:时间戳,算法推理检测的时间、camera_id:摄像头编号、detections:检测内容json字符串、image_origin:原始图像、image_det:检测图像;检测内容的json字符串参数:detections:[{},{},{},…]、class:类别、prob:识别概率。
在S13后,实时识别球机拍摄到的画面,得到位置信息和种类信息,在监控画面中框出具体位置并打印种类信息,具体包括以下步骤:
S31,利用opencv,来调用摄像头,以获取实时监控视频画面;
S32,提取视频的每一帧,进行颜色空间转换,从opencv图像的BGR格式,转换为YOLOv5所需要的RBG格式;
S33,进行图片的缩放,以适配YOLOv5要求的图像大小;
S34,将处理好之后的单帧图像输入YOLOv5,进行转换和识别,得到识别出来的位置信息和种类信息;
S35,若存在人员和工装,则框出人员及工装,标出类别信息,不做后处理判断;若存在抽烟、抽烟、打电话、未穿工装、未放置灭火器的不安全类别,则框出位置并标出类别信息,输出坐标信息并上传告警平台。
S35后告警平台收到相关信息后,进行逻辑后处理操作,形成告警信息,包括人员离岗告警、抽烟告警、打电话告警、烟火告警,前端页面弹窗提示告警信息,工作人员去及时处理。
S20,后端处理及前端展示,包括将检测到信息以json字符串的形式传递给后端,后端模块解析后进行后处理逻辑的编写,通过后处理后将最终告警结果传递给前端展示页面;同时后端模块也涉及前端功能的相关配置,包括摄像头的添加与删除,用户的增删改。
具体实施例中,包括:
现场采集加油站真实视频数据,包括全天不间断时间内工作人员工作场景、各类车辆到加油站加油场景以及加油站站区的相关视频数据,视频数据涵盖加油站加油作业区工作人员工装、人员打电话、灭火器、吸烟、烟火等类别,采用Python脚本对视频数据进行抽帧处理后,利用标注工具如LabelImg等对图片数据进行标注,制作数据集,划分成训练集和测试集;
用YOLOV5目标检测算法对数据集进行训练,根据PR曲线图对超参数如学习率、批次大小batch-size等进行调整,不断观察loss损失函数的下降速度以及值变化,每间隔10个epoch就用测试集对当前模型进行测试并保存模型,当loss损失函数趋于稳定时停止训练,取mAP值最高时的模型作为最优模型。当P(precision)、R(recall)值达不到要求时,需要对数据进行扩增,对网络进行适当地修改后迭代重复训练,模型训练流程见图2。
得到训练完成后的模型后,需要将其部署在边缘端计算板卡上,在服务器端基于Pytorch深度学习框架训练的模型在部署时,需要进行迁移量化工作,通过迁移量化将模型转化为能够适配在边缘端计算板卡上的模型格式。
将算法模块进行封装,用http协议以json格式与后端进行交互,根据实际需求,应当定义接口地址、请求方式、请求参数、响应参数、返回格式、错误码等数据信息。请求参数有timestamp:时间戳,算法推理检测的时间、camera_id:摄像头编号、detections:检测内容json字符串、image_origin:原始图像、image_det:检测图像。检测内容的(detections)json字符串参数:detections:[{},{},{},…]、class:类别、prob:识别概率
后端模块主要涉及数据库技术、web开发技术以及与前端页面模块、算法模块的交互等。算法模块将检测到信息以json字符串的形式传递给后端,后端模块解析后进行后处理逻辑的编写,通过后处理后将最终告警结果传递给前端展示页面。同时后端模块也涉及到前端一些功能的相关配置,如摄像头的添加与删除,用户的增删改查等功能。
前端展示页面模块主能够直观地将整个系统的信息呈现给用户,同时便于与用户进行交互。主要分成三个子模块,模块一是首页展示,首页页面示意图见图3,可添加4-8路加油站的实时视频到首页,起到实时监控的作用,同时首页右侧是告警展示,对于监测到的一些不安全行为等的告警行为直观地显示在首页;模块二是数据中心,在数据中心页可看到不同路摄像头的告警信息详情,同时可以通过选择不同的筛选条件如告警设备、告警类型、告警时间等选择性查看;模块三是系统设置,可在系统设置里置摄像头的相关参数以添加、修改、删除摄像头等。
整个系统最终集成在一个边缘端计算盒子中,连接一个显示屏即可完成硬件的配置,软件系统部署完成后,即可在加油站现场开始工作。整个工作的pipeline如下:加油站摄像头的实时视频流取流——AI算法模型分析每一帧图片数据——检测到的类别(人员、抽烟、打电话、未穿工装、未放置灭火器等)——后端后处理形成告警信息(人员离岗告警、抽烟告警、打电话告警、烟火告警等)——前端页面弹窗提示告警信息——工作人员及时处理。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于深度学习视觉算法的智慧加油站安全监管方法,其特征在于,包括以下步骤:
S10,训练模型;
S20,后端处理及前端展示。
2.根据权利要求1所述的方法,其特征在于,所述S10,训练模型,包括以下步骤:
S11,收集数据;
S12,标注数据,组织数据集;
S13,设置YOLOv5框架训练配置文件,进行训练。
3.根据权利要求2所述的方法,其特征在于,所述S11,收集数据,包括以下步骤:
S111,在加油站现场利用球机进行拍摄,获取视频样本。
S112,根据视频样本的时间长度决定采样时间,获取样本,使训练出来的模型更加准确。本实施例每隔10秒,对获取的视频样本进行采样,获取图像样本,命名为合适的名字后,存于一个文件夹,形成图像数据集。
4.根据权利要求3所述的方法,其特征在于,所述S112中对视频样本每隔10秒进行采样。
5.根据权利要求2所述的方法,其特征在于,所述S12,标注数据,组织数据集,包括以下步骤:
S121,利用labelimg对数据集进行标注,设置两个大类,分别是加油类和卸油类,分别有10个小类和13个小类,选择生成YOLO格式的txt标注文件,格式为:
class_id x y w h
class_id:类别的id编号
其中,x:目标的中心点x坐标/图片总宽度;
y:目标的中心的y坐标/图片总高度;
w:目标框的宽带/图片总宽度;
h:目标框的高度/图片总高度。
S122,将所有需要训练和测试的图片放入JPEGImages文件夹,对应的yolo格式标记文件放入labels文件夹;
S123,利用python脚本文件,生成训练集和测试集,生成train.txt和test.txt,分别给出训练图片文件和测试图片文件的列表,含有每个图片的路径和文件名。
6.根据权利要求2所述的方法,其特征在于,所述S13,设置YOLOv5框架训练配置文件,进行训练,具体为:设置测试配置文件,进行测试和性能统计,并据此修改YOLOv5先验框大小,重新训练和测试,获取最佳权重文件和配置文件。
7.根据权利要求6所述的方法,其特征在于,在所述S13后,将训练完成后的模型其部署在边缘端计算板卡上,在服务器端基于Pytorch深度学习框架训练的模型在部署时,进行迁移量化工作,通过迁移量化将模型转化为能够适配在边缘端计算板卡上的模型格式;
再将算法模块进行封装,用http协议以json格式与后端进行交互,根据实际需求,定义接口地址、请求方式、请求参数、响应参数、返回格式、错误码;请求参数有timestamp:时间戳,算法推理检测的时间、camera_id:摄像头编号、detections:检测内容json字符串、image_origin:原始图像、image_det:检测图像;检测内容的json字符串参数:detections:[{},{},{},…]、class:类别、prob:识别概率。
8.根据权利要求6所述的方法,其特征在于,在所述S13后,实时识别球机拍摄到的画面,得到位置信息和种类信息,在监控画面中框出具体位置并打印种类信息,具体包括以下步骤:
S31,利用opencv,来调用摄像头,以获取实时监控视频画面;
S32,提取视频的每一帧,进行颜色空间转换,从opencv图像的BGR格式,转换为YOLOv5所需要的RBG格式;
S33,进行图片的缩放,以适配YOLOv5要求的图像大小;
S34,将处理好之后的单帧图像输入YOLOv5,进行转换和识别,得到识别出来的位置信息和种类信息;
S35,若存在人员和工装,则框出人员及工装,标出类别信息,不做后处理判断;若存在抽烟、抽烟、打电话、未穿工装、未放置灭火器的不安全类别,则框出位置并标出类别信息,输出坐标信息并上传告警平台。
9.根据权利要求8所述的方法,其特征在于,所述S35后告警平台收到相关信息后,进行逻辑后处理操作,形成告警信息,包括人员离岗告警、抽烟告警、打电话告警、烟火告警,前端页面弹窗提示告警信息,工作人员去及时处理。
10.根据权利要求1所述的方法,其特征在于,所述S20,后端处理及前端展示,包括将检测到信息以json字符串的形式传递给后端,后端模块解析后进行后处理逻辑的编写,通过后处理后将最终告警结果传递给前端展示页面;同时后端模块也涉及前端功能的相关配置,包括摄像头的添加与删除,用户的增删改查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310567747.4A CN116665096A (zh) | 2023-05-19 | 2023-05-19 | 基于深度学习视觉算法的智慧加油站安全监管方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310567747.4A CN116665096A (zh) | 2023-05-19 | 2023-05-19 | 基于深度学习视觉算法的智慧加油站安全监管方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116665096A true CN116665096A (zh) | 2023-08-29 |
Family
ID=87725312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310567747.4A Pending CN116665096A (zh) | 2023-05-19 | 2023-05-19 | 基于深度学习视觉算法的智慧加油站安全监管方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116665096A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117274781A (zh) * | 2023-11-21 | 2023-12-22 | 成都合能创越软件有限公司 | 基于双管道信息交错车载实时检测方法及系统 |
CN117478843A (zh) * | 2023-11-15 | 2024-01-30 | 廊坊博联科技发展有限公司 | 一种智慧巡控系统及方法 |
CN117690166A (zh) * | 2024-02-02 | 2024-03-12 | 湖北世纪森源电气集团有限公司 | 一种电力控制柜的安防监测方法及系统 |
-
2023
- 2023-05-19 CN CN202310567747.4A patent/CN116665096A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117478843A (zh) * | 2023-11-15 | 2024-01-30 | 廊坊博联科技发展有限公司 | 一种智慧巡控系统及方法 |
CN117274781A (zh) * | 2023-11-21 | 2023-12-22 | 成都合能创越软件有限公司 | 基于双管道信息交错车载实时检测方法及系统 |
CN117274781B (zh) * | 2023-11-21 | 2024-04-16 | 成都合能创越软件有限公司 | 基于双管道信息交错车载实时检测方法及系统 |
CN117690166A (zh) * | 2024-02-02 | 2024-03-12 | 湖北世纪森源电气集团有限公司 | 一种电力控制柜的安防监测方法及系统 |
CN117690166B (zh) * | 2024-02-02 | 2024-04-16 | 湖北世纪森源电气集团有限公司 | 一种电力控制柜的安防监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116665096A (zh) | 基于深度学习视觉算法的智慧加油站安全监管方法 | |
CN109271938A (zh) | 一种基于智能视频分析技术的加油站卸油过程安全监控方法 | |
CN110852601A (zh) | 一种用于环境监察执法决策的大数据应用方法及系统 | |
CN113850562B (zh) | 一种智能旁站监理方法及系统 | |
CN110689148A (zh) | 一种基于ar技术的计量设备故障检测方法 | |
CN205644670U (zh) | 一种城市环境空气质量监测的智能巡检系统 | |
CN106327605A (zh) | 一种巡检方法 | |
CN104794624A (zh) | 一种基于随机防伪标记的防伪系统及其防伪方法 | |
CN114118847A (zh) | 化工园区危险源在线监测平台 | |
CN110379036A (zh) | 变电站智能巡检识别方法、系统、装置及存储介质 | |
CN114677015B (zh) | 一种基于网格化管理的智慧城市安全管控平台及管控方法 | |
CN111191498A (zh) | 行为识别方法和相关产品 | |
CN201697870U (zh) | 烟气黑度的自动监控与分析系统 | |
CN116935659B (zh) | 一种高速服务区卡口车辆稽核系统及其方法 | |
CN111199172A (zh) | 基于终端录屏的处理方法及装置、存储介质 | |
CN107742162B (zh) | 一种基于配调监控信息的多维特征关联分析方法 | |
CN113076999A (zh) | 基于人工智能信息数据采集方法 | |
CN112347079A (zh) | 一种数据库内容保密检查系统及检查方法 | |
CN114693278B (zh) | 一种机动车检验监管智能化审核系统和方法 | |
CN111047731A (zh) | 一种基于ar技术的电信机房巡检方法及系统 | |
CN113077063B (zh) | 基于语音和图像辨识的变电设备缺陷管理方法及设备 | |
CN112182212B (zh) | 一种网络车辆碰撞数据的处理方法及系统 | |
CN114444856A (zh) | 一种辅助装配系统 | |
CN114241401A (zh) | 异常判定方法、装置、设备、介质及产品 | |
CN110868690A (zh) | 基于Lora技术商场环境安全检测定位系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |