CN114202775A - 基于红外图像的变电站危险区域行人闯入检测方法及系统 - Google Patents
基于红外图像的变电站危险区域行人闯入检测方法及系统 Download PDFInfo
- Publication number
- CN114202775A CN114202775A CN202111546553.3A CN202111546553A CN114202775A CN 114202775 A CN114202775 A CN 114202775A CN 202111546553 A CN202111546553 A CN 202111546553A CN 114202775 A CN114202775 A CN 114202775A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- pedestrian target
- pseudo
- color picture
- candidate frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种基于红外图像的变电站危险区域行人闯入检测方法,包括:S1、获取单通道红外图像,并进行彩色编码,得到伪彩色图片;S2、对所述伪彩色图片进行比例不变缩放;S3、将所述伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;S4、将所述行人目标的中心坐标和宽高信息转换成左上角和右上角坐标;S5、根据所述行人目标的左上角和右上角坐标,框选出行人候选框,计算所述行人候选框与危险区域候选框的交并比;S6、判断所述交并比是否大于危险阈值,若是,则所述行人目标进入所述危险区域,对所述行人目标设置In dangerous areas标签并发出警报。本发明具体突破应用场景的限制,并且能够检测出行人位置的效果。
Description
技术领域
本发明涉及人体目标检测的技术领域,具体涉及一种基于红外图像的变电站危险区域行人闯入检测方法及系统。
背景技术
在变电站的运行工作中,检测变电站危险区域内是否有行人闯入成为了一项十分重要的工作。传统的人工检测方式主要是通过观看监控视频进行检测,需要耗费大量的人力,且人工检测的方式容易出现误检。随着视频监控技术的不断发展,通过智能化监控已成为检测变电站危险区域是否有行人闯入的重要手段,而智能化监控的关键技术就在于行人检测算法的实现。然而,现有技术的行人检测算法仍存在以下缺点:1、行人检测需要使用到可见光图像,而夜间可见光图像的拍摄效果较差,从而导致在夜间的检测效果不佳;2、行人检测最终只能检测出拍摄区域内是否有行人,不能检测出行人的具体位置,因此,若想检测危险区域是否有行人闯入,对于监控场景必须有严格的限制。基于上述应用场景的局限性,导致现有技术的行人检测算法难以被广泛应用。
因此,提供一种能够突破应用场景的限制,且能够检测出行人位置的行人闯入检测方法及系统就显得尤为重要。
发明内容
为了解决现有技术中的行人检测受限于应用场景的技术问题,本发明提出了一种基于红外图像的变电站危险区域行人闯入检测方法及系统,用于解决上述技术问题。
根据本申请的第一方面,提出了一种基于红外图像的变电站危险区域行人闯入检测方法,包括:
S1、获取检测区域内的单通道红外图像,并对所述单通道红外图像进行彩色编码,得到伪彩色图片;
S2、对所述伪彩色图片进行比例不变缩放;
S3、将缩放后的所述伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;
S4、根据坐标转换公式,将所述行人目标的中心坐标和宽高信息转换成所述行人目标的左上角和右上角坐标;
S5、根据所述行人目标的左上角和右上角坐标,在所述伪彩色图片中框选出行人候选框,并且根据已知的危险区域在所述伪彩色图片中预先设定危险区域候选框,计算所述行人候选框与所述危险区域候选框的交并比;以及
S6、判断所述交并比是否大于危险阈值,若是,则所述行人目标进入所述危险区域,对所述行人目标设置In dangerous areas标签并发出警报。
首先,本方案基于红外图像进行行人目标检测,不会受到可见光的影响,在白天和夜间都有较好的检测效果;另外,经过改进的yolov5行人目标检测模型训练得到行人目标的位置信息后,将其转换成左上角和右上角坐标,再框选出行人候选框,计算行人候选框和预设好的危险区域候选框的交并比,最后通过比较交并比与危险阈值,不仅能够判断出图片中是否有行人,而且还能判断出行人是否闯入危险区域;并且,还可以通过预设多个危险区域候选框来迭代判断,达到全区域检测的目的。综上,本申请不仅能够突破应用场景的限制,全天候、全区域进行检测,同时还能具体检测出行人的位置,具有广泛的应用前景。
优选的,所述步骤S3中所述改进的yolov5行人目标检测模型具体包括:将原yolov5行人目标检测模型的三个特征提取层往前提取一层,从而输出至少包括5维深度的152*152*7、76*76*7、38*38*7三种不同尺度的张量,其中,第一个维度是置信度矩阵,其它维度分别包括所述行人目标的中心坐标的X轴坐标和Y轴坐标以及所述行人目标的宽度信息和高度信息。
由于拍摄整个检测区域的单通道红外图像需要一定的高度,这样会使得行人在图像中比较小,若是经过深层卷积会出现行人目标的特征信息丢失的现象,因此通过对yolov5行人目标检测模型的三个特征提取层往前提取一层,最终输出的张量即具有足够的像素,不会丢失行人目标的特征信息,同时也保证了数据处理量不会太大。
优选的,所述步骤S3的训练过程具体包括::
a)对所述伪彩色图片进行筛选和过滤,剔除模糊和不存在所述行人目标的所述伪彩色图片;
b)利用标注软件在所述伪彩色图片中存在所述行人目标的区域进行标注,并保存成对应的标注文件;
c)将所述伪彩色图片以预设比例划分为训练集、验证集和测试集,所述训练集、验证集、测试集分别对所述伪彩色图片和所述标注文件进行区分训练;
d)根据所述伪彩色图片的参数信息修改所述改进的yolov5行人目标检测模型的结构配置文件;
e)修改所述改进的yolov5行人目标检测模型的配置参数,开始训练,最终输出所述行人目标的中心坐标和宽高信息。
通过对包含行人目标的伪彩色图片进行标注,然后进行针对性训练,不仅可以提高训练效率,而且还能提高行人目标检测模型的识别准确度。
优先的,所述步骤S2具体包括:
S21、将所述伪彩色图片的宽度和高度中的长边缩放为640像素,根据所述长边的缩放比例对另一条短边进行同比例缩放,得到所述伪彩色图片新的宽度和高度;
S22、将所述伪彩色图片新的宽度和高度的像素个数补充到640个。
缩放后的伪彩色图片具有足够的分辨率,不会丢失行人目标的特征信息,同时导入改进的yolov5行人目标检测模型进行训练时也不会造成数据处理量太大。
优选的,所述步骤S5中的所述交并比的具体计算公式为:
其中,IOU为交并比,A为行人候选框,B为危险区域候选框。
通过计算IOU值来预测行人是否闯入危险区域,然后再通过在检测区域内设置多个危险区域进行迭代判断,可以达到全区域检测的目的。
优选的,所述坐标转换公式具体为:
x1=x-0.5*w
y1=y-0.5*h
x2=x+0.5w
y2=y+0.5*h
其中,x和y是行人目标的中心坐标的X Y轴坐标,w是行人目标的宽度,h是行人目标的高度,x1和y1是行人目标的左上角XY轴坐标,x2和y2是行人目标的右下角XY轴坐标。
优选的,所述步骤S1中的彩色编码公式具体为:
其中,R、G、B分别代表红、绿、蓝三种颜色通道。
通过对红外图像进行彩色编码,可以得到信息更加丰富的伪彩色图片,从而提高检测的准确率。
进一步优选的,在所述步骤e)之后并且所述步骤S4之前还包括:
训练完毕后在所述测试集上验证所述改进的yolov5行人目标检测模型的识别准确率是否达到要求,若否,则对所述测试集上的错误识别结果进行分析,根据所述分析结果修改所述标注文件中的标注位置,并修改所述改进的yolov5行人目标检测模型的配置参数进行重新训练,直至所述yolov5行人目标检测模型在所述测试集上的识别准确率达到要求。
通过对行人目标检测模型的一些错误识别结果进行分析改进,进一步提高行人目标检测模型的识别准确度,减少误检情况的发生。
优选的,所述单通道红外图像是通过利用无人机在所述检测区域内巡检拍摄得到的。
利用无人机进行航拍可以对变电站的多个检测区域同时进行拍摄,从而达到全区域检测的目的。
根据本申请的第二方面,提出了一种基于红外图像的变电站危险区域行人闯入检测系统,包括:
编码模块,配置用于获取检测区域内的单通道红外图像,并对所述单通道红外图像进行彩色编码,得到伪彩色图片;
图片缩放模块,配置用于对所述伪彩色图片进行比例不变缩放;
行人目标检测模块,配置用于将缩放后的所述伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;
坐标转换模块,配置用于根据坐标转换公式,将所述行人目标的中心坐标和宽高信息转换成所述行人目标的左上角和右上角坐标;
计算模块,配置用于根据所述行人目标的左上角和右上角坐标,在所述伪彩色图片中框选出行人候选框,并且根据已知的危险区域在所述伪彩色图片中预先设定危险区域候选框,计算所述行人候选框与所述危险区域候选框的交并比;
判断模块,配置用于判断所述交并比是否大于危险阈值,若是,则所述行人目标进入所述危险区域,对所述行人目标设置In dangerous areas标签并发出警报。
本申请提出了一种基于红外图像的变电站危险区域行人闯入检测方法及系统,首先,基于红外图像进行行人目标检测,不会受到可见光的影响,在白天和夜间都有较好的检测效果;另外,经过彩色编码得到的伪彩色图片经过改进的yolov5模型训练得到行人目标的位置信息后,通过坐标转换公式将其转换成行人目标的左上角和右上角坐标,从而框选出行人候选框,并计算行人候选框和预设好的危险区域候选框的交并比,最后通过比较交并比与危险阈值,不仅能够判断出图片中是否有行人,而且还能判断出行人是否闯入危险区域;并且,还可以通过预设多个危险区域候选框来迭代判断,达到全区域检测的目的。本申请不仅能够突破应用场景的限制,实现全天候、全区域检测,同时还能具体检测出行人的位置,具有广泛的应用前景。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。
图1是根据本发明具体实施例的基于红外图像的变电站危险区域行人闯入检测方法的流程图;
图2是根据本发明一个具体实施例的改进之前的yolov5行人目标检测模型结构简图;
图3是根据本发明一个具体实施例的改进之后的yolov5行人目标检测模型结构简图;
图4是根据本发明一个具体实施例的yolov5目标检测算法的训练流程图;
图5是根据本发明一个具体实施例的行人候选框和危险区域候选框的交并比计算示意图;
图6是根据本发明一个具体实施例的变电站危险区域行人闯入检测效果图;
图7是根据本发明另一个具体实施例的变电站危险区域行人闯入检测效果图;
图8是根据本发明实施例的基于红外图像的变电站危险区域行人闯入检测系统框图。
附图标记说明:1、编码模块;2、图片缩放模块;3、行人目标检测模块;4、坐标转换模块;5、计算模块;6、判断模块。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括......”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
图1示出了根据本发明具体实施例的基于红外图像的变电站危险区域行人闯入检测方法的流程图,如图1所示,该检测方法包括以下步骤:
S1、获取检测区域内的单通道红外图像,并对单通道红外图像进行彩色编码,得到伪彩色图片。
在具体的实施例中,单通道红外图像是通过无人机航拍得到的,无人机在巡检中可以拍摄到整个变电站区域,并且,由于无人机拍摄的是单通道红外图像,因此不会受到可见光的影响,在白天和夜间都具有较好的拍摄效果。而通过对拍摄到的单通道红外图像进行彩色编码,可以获得信息更加丰富的伪彩色图片,进一步提高检测的准确率。具体的,彩色编码公式如下:
其中,R、G、B分别代表红、绿、蓝三种颜色通道。根据此公式将单通道红外图像的像素灰度值映射成三通道的RGB伪彩色图片。
S2、对伪彩色图片进行比例不变缩放。
在具体的实施例中,无人机所拍摄的单通道红外图像转换成伪彩色图片后的分辨率为960*768,在该分辨率下,后续对图片进行处理需要较大的数据处理量,而同时为了防止分辨率过低而导致图片中的行人目标的特征信息丢失,因此需要对伪彩色图片进行比例不变缩放,调整到合适的分辨率,达到两者的兼合。伪彩色图片比例不变缩放的步骤具体包括:
S21、将伪彩色图片的宽度和高度中的长边缩放为640像素,根据长边的缩放比例对另一条短边进行同比例缩放,得到伪彩色图片新的宽度和高度。
伪彩色图片的分辨率为960*768(高*宽),即长边(高度)为960像素,短边(宽度)为768像素,根据步骤将长边960像素缩放为640像素,缩放比为2/3,再根据此缩放比将短边768像素缩放为512像素,从而获得伪彩色图片新的宽度和高度。
S22、将伪彩色图片新的宽度和高度的像素个数补充到640个。
获得伪彩色图片新的宽度和高度后,对伪彩色图片的像素填补至640个,因此需要对缩放后伪彩色图片的宽度补偿128个像素,最终得到比例不变的缩放图。
S3、将缩放后的伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息。
在具体的实施例中,行人目标检测模型是基于改进的yolov5目标检测算法训练得到的。图2示出了根据本发明一个具体实施例的改进之前的yolov5行人目标检测模型结构简图,如图2所示,yolov5行人目标检测模型是通过使用全卷积的骨干网络提取特征,再用黄金金字塔对不同深浅的特征进行融合的目标检测网络,主要使用在目标检测领域,yolov5在训练时使用Mosaic数据增强、自适应锚框计算和自适应图片缩放方式,从而具有较高的精度。图3示出了根据本发明一个具体实施例的改进之后的yolov5行人目标检测模型结构简图,如图3所示,考虑到航拍无人机进行行人检测时,由于在航拍视角下,行人在照片上起来会比较小,经过深层的卷积以后会出现人目标的特征信息丢失现象。因此将原yolov5行人目标检测模型的三个特征提取层往前提取一层,从而输出至少包括5维深度的152*152*7、76*76*7、38*38*7三种不同尺度的张量,使得三个头部输网络尺寸扩大包含有更多的浅层小目标信息,最终输出的张量即具有足够的像素,不会丢失行人目标的特征信息,同时也保证了数据处理量不会太大。
本实施例中,yolov5行人目标检测模型最终输出的是一个5维深度的张量,其中第一个维度是置信度矩阵,置信度特征矩阵里的值越大代表该位置存在目标的概率越大,可以通过设置阈值来进行筛选检测出来的目标和检测灵敏度。维度2到5分别代表行人目标的中心坐标的X轴坐标、Y轴坐标以及行人目标的高度信息H和宽度信息W。在其它实施方式中,也可以是输出包括6维或7维深度的张量,其中,维度6和维度7用于检测该目标的类别,假设有N个类别,则在长度为N的向量中寻找最大值的坐标索引,再根据索引从类别字典中找到对应类别信息。
本实施例的检测目标为行人,因此最终得到的是行人目标的中心坐标和宽高信息。图4示出了根据本发明一个具体实施例的yolov5目标检测算法的训练流程图,如图4所示,yolov5目标检测算法的训练步骤具体如下:
a)对伪彩色图片进行筛选和过滤,剔除模糊和不存在所述行人目标的伪彩色图片。
通过剔除一些无效的样本,提升改进的yolov5行人目标检测模型的信度指标。
b)利用标注软件在伪彩色图片中存在行人目标的区域进行标注,并保存成对应的标注文件。
本实施例通过LabelImg标注软件对伪彩色图片中存在行人目标的区域进行标注,并保存成.xml格式的标注文件,再将.xml格式的标注文件转换成.txt格式的标注文件。.xml格式的标注文件和.txt格式的标注文件之间的转换是通过xml2txt.py工具来转换的。
c)将伪彩色图片以预设比例划分为训练集、验证集和测试集,训练集、验证集、测试集分别对伪彩色图片和标注文件进行区分训练。
在具体的实施例中,伪彩色图片以5:2:3分别划分为训练集、验证集和测试集,训练集、验证集和测试集分别对应文件夹train、val和test,train、val和test文件夹下均包括imgae和label两个文件夹,image文件夹用于存放训练的图片数据,即伪彩色图片,而label文件夹用于存放所述*.txt格式的标注文件。
d)根据伪彩色图片的参数信息修改改进的yolov5行人目标检测模型的结构配置文件
在具体的实施例中,根据伪彩色图片缩放后的分辨率等参数,将行人目标检测模型的模型结构配置文件yolov5s.yaml修改为自身的模型结构配置文件yolo-person.yaml。
e)修改改进的yolov5行人目标检测模型的配置参数,开始训练,最终输出行人目标的中心坐标和宽高信息。
其中,修改改进的yolov5行人目标检测模型的配置参数具体包括伪彩色图片大小、训练总迭代次数和批梯度数据大小等,对于没有设置的参数按照默认参数进行,设置完毕便可开始训练。
继续参照图4,在优选的实施例中,在步骤e)之后还包括:
f)训练完毕后在测试集上验证行人目标检测模型的识别准确率是否达到要求,若是,则执行步骤S4,若否,则执行步骤g)。
g)对测试集上的错误识别结果进行分析,根据分析结果修改训练集和验证集中伪彩色图片的标注位置,并返回步骤e)。
通过对行人目标检测模型的一些错误识别结果进行分析改进,进一步提高行人目标检测模型的识别准确度,可以减少误检情况的发生。
继续参照图1,在步骤S3之后:
S4、根据坐标转换公式,将行人目标的中心坐标和宽高信息转换成行人目标的左上角和右上角坐标。
在具体的实施例中,由于改进的yolov5行人目标检测模型最后输出的是行人目标的中心坐标和宽高信息,而后续在计算交并比时需要使用到行人目标的左上角和右下角坐标,因此需要进行坐标转换,坐标转换公式如下:
x1=x-0.5*w
y1=y-0.5*h
x2=x+0.5w
y2=y+0.5*h
其中,x和y是行人目标的中心坐标的X Y轴,w是行人目标的宽度,h是行人目标的高度,x1和y1是行人目标的左上角XY轴坐标,x2和y2是行人目标的右下角XY轴坐标。
S5、根据行人目标的左上角和右上角坐标,在伪彩色图片中框选出行人候选框,并且根据已知的危险区域在伪彩色图片中预先设定危险区域候选框,计算行人候选框与所述危险区域候选框的交并比。
在具体的实施例中,在得到行人目标的左上角和右上角坐标后,便可在伪彩色图片上框选出一个矩形的行人候选框,而由于变电站中的危险区域是已知的,因此可预先在伪彩色图片中框选出对应的危险区域候选框,再计算行人候选框和危险区域候选框的交并比。图5示出了根据本发明一个具体实施例的行人候选框和危险区域候选框的交并比计算示意图,如图5所示,交并比的具体计算公式如下:
其中,IOU为交并比,A为行人候选框,B为危险区域候选框。
此方法通过计算交并比来预测行人目标是否闯入对应的危险区域内,因此,应该认识到,可以通过在变电站的全区域内划分出多个危险区域,迭代计算行人目标对应的行人候选框与每个危险区域对应的危险区域候选框之间的交并比,从而达到全区域内检测的目的。
继续参照图1,在步骤S5之后:
S6、判断交并比是否大于危险阈值,若是,则行人目标进入危险区域,对行人目标设置In dangerous areas标签并发出警报,若否,则行人目标在安全区域,对行人目标设置Person标签。
在具体的实施例中,危险阈值设置为0.5,通过比较交并比和危险阈值,判断行人目标是否闯入危险区域,在其它实施方式中,可根据实际要求修改危险阈值。
在优选的实施例中,若交并比小于危险阈值,则表示行人目标在安全区域,对行人目标设置Person标签。通过设置标签,可以直观的观察到检测区域内是否有行人目标,以及行人目标是在安全区域还是在危险区域。
图6示出了根据本发明一个具体实施例的变电站危险区域行人闯入检测效果图,如图6所示,该伪彩色图片中的左半部分为变电站危险区域,右半部分为安全区域,该伪彩色图片中的行人目标都处于右半部分,因此检测显示的标签为Person,即行人目标在安全区域内。图7示出了根据本发明另一个具体实施例的变电站危险区域行人闯入检测效果图,如图7所示,该伪彩色图片中的上半部分为变电站危险区域,中间部分为安全区域,该伪彩色图片中的行人目标都处于上半部分,因此检测显示的标签为In dangerous areas,即行人目标在危险区域内,此时发出警报。
基于上述的变电站危险区域行人闯入检测方法,本发明还提出了一种基于红外图像的变电站危险区域行人闯入检测系统,图8示出了根据本发明实施例的基于红外图像的变电站危险区域行人闯入检测系统框图,如图8所示,该系统包括:
编码模块1,配置用于获取检测区域内的单通道红外图像,并对单通道红外图像进行彩色编码,得到伪彩色图片;
图片缩放模块2,配置用于对伪彩色图片进行比例不变缩放;
行人目标检测模块3,配置用于将缩放后的伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;
坐标转换模块4,配置用于根据坐标转换公式,将行人目标的中心坐标和宽高信息转换成行人目标的左上角和右上角坐标;
计算模块5,配置用于根据行人目标的左上角和右上角坐标,在伪彩色图片中框选出行人候选框,并且根据已知的危险区域在伪彩色图片中预先设定危险区域候选框,计算行人候选框与危险区域候选框的交并比;
判断模块6,配置用于判断交并比是否大于危险阈值,若是,则行人目标进入所述危险区域,对行人目标设置In dangerous areas标签并发出警报。
本发明提出了一种基于红外图像的变电站危险区域行人闯入检测方法及系统,首先,基于红外图像进行行人目标检测,不会受到可见光的影响,在白天和夜间都有较好的检测效果;另外,经过彩色编码得到的伪彩色图片经过改进的yolov5模型训练得到行人目标的位置信息后,通过坐标转换公式将其转换成行人目标的左上角和右上角坐标,从而框选出行人候选框,并计算行人候选框和预设好的危险区域候选框的交并比,最后通过比较交并比与危险阈值,不仅能够判断出图片中是否有行人,而且还能判断出行人处于危险区域还是安全区域;并且,还可以通过在整个变电站范围内预设多个危险区域候选框来迭代判断,达到全区域检测的目的。本申请不仅能够突破应用场景的限制,实现全天候、全区域检测,同时还能具体检测出行人的位置,具有广泛的应用前景。
在本申请实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置/系统/方法实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
显然,本领域技术人员在不偏离本发明的精神和范围的情况下可以作出对本发明的实施例的各种修改和改变。以该方式,如果这些修改和改变处于本发明的权利要求及其等同形式的范围内,则本发明还旨在涵盖这些修改和改变。词语“包括”不排除未在权利要求中列出的其它元件或步骤的存在。某些措施记载在相互不同的从属权利要求中的简单事实不表明这些措施的组合不能被用于获利。权利要求中的任何附图标记不应当被认为限制范围。
Claims (10)
1.一种基于红外图像的变电站危险区域行人闯入检测方法,其特征在于,包括以下步骤:
S1、获取检测区域内的单通道红外图像,并对所述单通道红外图像进行彩色编码,得到伪彩色图片;
S2、对所述伪彩色图片进行比例不变缩放;
S3、将缩放后的所述伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;
S4、根据坐标转换公式,将所述行人目标的中心坐标和宽高信息转换成所述行人目标的左上角和右上角坐标;
S5、根据所述行人目标的左上角和右上角坐标,在所述伪彩色图片中框选出行人候选框,并且根据已知的危险区域在所述伪彩色图片中预先设定危险区域候选框,计算所述行人候选框与所述危险区域候选框的交并比;以及
S6、判断所述交并比是否大于危险阈值,若是,则所述行人目标进入所述危险区域,对所述行人目标设置In dangerous areas标签并发出警报。
2.根据权利要求1所述的方法,其特征在于,所述步骤S3中所述改进的yolov5行人目标检测模型具体包括:将原yolov5行人目标检测模型的三个特征提取层往前提取一层,从而输出至少包括5维深度的152*152*7、76*76*7、38*38*7三种不同尺度的张量,其中,第一个维度是置信度矩阵,其它维度分别包括所述行人目标的中心坐标的X轴坐标和Y轴坐标以及所述行人目标的宽度信息和高度信息。
3.根据权利要求1所述的方法,其特征在于,所述步骤S3的训练过程具体包括:
a)对所述伪彩色图片进行筛选和过滤,剔除模糊和不存在所述行人目标的所述伪彩色图片;
b)利用标注软件在所述伪彩色图片中存在所述行人目标的区域进行标注,并保存成对应的标注文件;
c)将所述伪彩色图片以预设比例划分为训练集、验证集和测试集,所述训练集、验证集、测试集分别对所述伪彩色图片和所述标注文件进行区分训练;
d)根据所述伪彩色图片的参数信息修改所述改进的yolov5行人目标检测模型的结构配置文件;
e)修改所述改进的yolov5行人目标检测模型的配置参数,开始训练,最终输出所述行人目标的中心坐标和宽高信息。
4.根据权利要求1所述的方法,其特征在于,所述步骤S2具体包括:
S21、将所述伪彩色图片的宽度和高度中的长边缩放为640像素,根据所述长边的缩放比例对另一条短边进行同比例缩放,得到所述伪彩色图片新的宽度和高度;
S22、将所述伪彩色图片新的宽度和高度的像素个数补充到640个。
6.根据权利要求1所述的方法,其特征在于,所述坐标转换公式具体为:
x1=x-0.5*w
y1=y-0.5*h
x2=x+0.5w
y2=y+0.5*h
其中,x和y是行人目标的中心坐标的X Y轴坐标,w是行人目标的宽度,h是行人目标的高度,x1和y1是行人目标的左上角XY轴坐标,x2和y2是行人目标的右下角XY轴坐标。
8.根据权利要求3所述的方法,其特征在于,在所述步骤e)之后并且所述步骤S4之前还包括:
训练完毕后在所述测试集上验证所述改进的yolov5行人目标检测模型的识别准确率是否达到要求,若否,则对所述测试集上的错误识别结果进行分析,根据所述分析结果修改所述标注文件中的标注位置,并修改所述改进的yolov5行人目标检测模型的配置参数进行重新训练,直至所述yolov5行人目标检测模型在所述测试集上的识别准确率达到要求。
9.根据权利要求1所述的方法,其特征在于,所述单通道红外图像是通过利用无人机在所述检测区域内巡检拍摄得到的。
10.一种基于红外图像的变电站危险区域行人闯入检测系统,其特征在于,包括:
编码模块,配置用于获取检测区域内的单通道红外图像,并对所述单通道红外图像进行彩色编码,得到伪彩色图片;
图片缩放模块,配置用于对所述伪彩色图片进行比例不变缩放;
行人目标检测模块,配置用于将缩放后的所述伪彩色图片导入改进的yolov5行人目标检测模型中,训练得到行人目标的中心坐标和宽高信息;
坐标转换模块,配置用于根据坐标转换公式,将所述行人目标的中心坐标和宽高信息转换成所述行人目标的左上角和右上角坐标;
计算模块,配置用于根据所述行人目标的左上角和右上角坐标,在所述伪彩色图片中框选出行人候选框,并且根据已知的危险区域在所述伪彩色图片中预先设定危险区域候选框,计算所述行人候选框与所述危险区域候选框的交并比;
判断模块,配置用于判断所述交并比是否大于危险阈值,若是,则所述行人目标进入所述危险区域,对所述行人目标设置In dangerous areas标签并发出警报。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111546553.3A CN114202775A (zh) | 2021-12-16 | 2021-12-16 | 基于红外图像的变电站危险区域行人闯入检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111546553.3A CN114202775A (zh) | 2021-12-16 | 2021-12-16 | 基于红外图像的变电站危险区域行人闯入检测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114202775A true CN114202775A (zh) | 2022-03-18 |
Family
ID=80654676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111546553.3A Pending CN114202775A (zh) | 2021-12-16 | 2021-12-16 | 基于红外图像的变电站危险区域行人闯入检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114202775A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223089A (zh) * | 2022-06-22 | 2022-10-21 | 深圳市儿童医院 | 儿童危险行为检测方法、装置、智能终端及存储介质 |
CN115403258A (zh) * | 2022-08-30 | 2022-11-29 | 蚌埠凯盛工程技术有限公司 | 一种玻璃深加工系统及调度方法 |
-
2021
- 2021-12-16 CN CN202111546553.3A patent/CN114202775A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223089A (zh) * | 2022-06-22 | 2022-10-21 | 深圳市儿童医院 | 儿童危险行为检测方法、装置、智能终端及存储介质 |
CN115403258A (zh) * | 2022-08-30 | 2022-11-29 | 蚌埠凯盛工程技术有限公司 | 一种玻璃深加工系统及调度方法 |
CN115403258B (zh) * | 2022-08-30 | 2023-11-21 | 蚌埠凯盛工程技术有限公司 | 一种玻璃深加工系统及调度方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Dehazing evaluation: Real-world benchmark datasets, criteria, and baselines | |
CN112381775B (zh) | 一种图像篡改检测方法、终端设备及存储介质 | |
WO2023083280A1 (zh) | 一种场景文本识别方法和装置 | |
CN110033040B (zh) | 一种火焰识别方法、系统、介质和设备 | |
CN114783003B (zh) | 一种基于局部特征注意力的行人重识别方法和装置 | |
CN114202775A (zh) | 基于红外图像的变电站危险区域行人闯入检测方法及系统 | |
CN103544484A (zh) | 一种基于surf的交通标志识别方法及系统 | |
CN111815528A (zh) | 基于卷积模型和特征融合的恶劣天气图像分类增强方法 | |
CN116091372B (zh) | 基于层分离和重参数的红外和可见光图像融合方法 | |
CN111582074A (zh) | 一种基于场景深度信息感知的监控视频树叶遮挡检测方法 | |
CN114677722A (zh) | 一种融合多尺度特征的多监督人脸活体检测方法 | |
CN111368775A (zh) | 一种基于局部上下文感知的复杂场景密集目标检测方法 | |
CN111274988B (zh) | 一种基于多光谱的车辆重识别方法及装置 | |
CN112926426A (zh) | 基于监控视频的船舶识别方法、系统、设备及存储介质 | |
CN116052090A (zh) | 图像质量评估方法、模型训练方法、装置、设备及介质 | |
CN115953744A (zh) | 一种基于深度学习的车辆识别追踪方法 | |
CN117934843A (zh) | 基于深度学习的rgb-t多模态图像实例分割方法 | |
CN109684982B (zh) | 结合易混目标排除的基于视频分析的火焰检测方法 | |
CN114596548A (zh) | 目标检测方法、装置、计算机设备及计算机可读存储介质 | |
CN112053407B (zh) | 一种交通执法影像中基于ai技术的车道线自动检测方法 | |
CN117789077A (zh) | 一种通用场景下用于视频结构化的人与车辆预测的方法 | |
CN111582278A (zh) | 人像分割方法、装置及电子设备 | |
CN117218672A (zh) | 一种基于深度学习的病案文字识别方法及系统 | |
CN115861922B (zh) | 一种稀疏烟火检测方法、装置、计算机设备及存储介质 | |
EP4332910A1 (en) | Behavior detection method, electronic device, and computer readable storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |