CN115424171A - 火焰和烟雾检测方法、装置和存储介质 - Google Patents

火焰和烟雾检测方法、装置和存储介质 Download PDF

Info

Publication number
CN115424171A
CN115424171A CN202211024252.9A CN202211024252A CN115424171A CN 115424171 A CN115424171 A CN 115424171A CN 202211024252 A CN202211024252 A CN 202211024252A CN 115424171 A CN115424171 A CN 115424171A
Authority
CN
China
Prior art keywords
network
flame
module
smoke
yolov5
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211024252.9A
Other languages
English (en)
Inventor
黄仕君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Haiyi Zhixin Technology Co Ltd
Original Assignee
Shenzhen Haiyi Zhixin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Haiyi Zhixin Technology Co Ltd filed Critical Shenzhen Haiyi Zhixin Technology Co Ltd
Priority to CN202211024252.9A priority Critical patent/CN115424171A/zh
Publication of CN115424171A publication Critical patent/CN115424171A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features

Abstract

一种火焰和烟雾检测方法、装置和存储介质,该方法包括:获取待检测的图像;利用训练好的检测模型对所述图像进行火焰检测和/或烟雾检测,输出所述图像中的火焰和/或烟雾的分类及定位结果;其中,所述检测模型包括对yolov5网络改进后得到的改进型网络,其中对所述yolov5网络的改进包括:将所述yolov5网络的骨干网络中的空间金字塔池化模块替换为多尺度注意力模块。根据本申请实施例的火焰和烟雾检测方法和装置采用包括多尺度注意力模块的改进型yolov5网络对图像进行火焰和烟雾检测,对于形状多变、尺度多变的火焰和/或物品未完全燃烧时产生的烟雾具有较高的捕捉能力,从而能够快速、准确地判断和定位图像中的火焰和/或烟雾。

Description

火焰和烟雾检测方法、装置和存储介质
技术领域
本申请涉及目标检测技术领域,更具体地涉及一种火焰和烟雾检测方法、装置和存储介质。
背景技术
火灾是一种严重的自然灾害和社会灾难。一方面,火灾的出现对人类的生活和财产安全造成很大威胁,另一方面,它也会造成自然和社会经济环境造成巨大损失。因此,尽可能地预防和减少火灾的发生一直是被广泛关注的话题。
最初的火焰检测方法是基于传感器,根据不同的传感器类型和应用,它可以分成五种类型:光传感器、温度传感器、烟雾传感器、燃气传感器和合成传感器。由于火灾的热量释放和烟雾浓度特征,温度和烟雾传感器被最常使用。然而,这种基于传感器的火焰检测方法在检测范围和检测速度方面存在明显缺陷。
随着视频监控技术的发展,基于传统图像处理的火焰检测方法应运而生。这是一种根据火焰图像的颜色、形变、纹理结构及抖动等相关信息进行检测的方法,有效提升了检测火焰的速度。然而,这种传统图像处理方法需要融合多种图像帧信息,需要耗费大量的计算资源在图像预处理上,难以满足实时反馈的需求。此外,传统图像算法需要调整参数来适应不同的场景,对于现实中复杂多变的火焰场景的性能表现不能令人满意。
近几年,得益于卷积神经网络的出现,计算机视觉技术发展迅速。近几年,得益于卷积神经网络的出现,目标检测发展迅速,许多目标检测算法都表现出了令人满意的效果。目前,检测算法可以归类为两种结构:双阶段结构和单阶段结构。在双阶段检测算法中,具有代表性的网络有快速区域卷积神经网络(Fast-RCNN)、更快速区域卷积神经网络(Faster-RCNN)和掩码区域卷积神经网络(Mask-RCNN)等。具体地,网络首先会进行特征提取并得到候选区域,然后再通过深层卷积块对候选区域进行分类。然而,由于该类检测算法需要对特征进行两个阶段的处理,很难满足在有限计算资源的边端芯片上进行实时检测的效果。在单阶段检测算法中,单发多盒对象检测(SSD)系列和YOLO(You Only Look Once)系列备受关注,其将双阶段特征处理过程合并至单阶段完成,即算法在一阶段同时计算候选区域以及该区域的目标类别,这极大提升了检测网络的运行速度。
基于此,目前存在基于深度学习的火焰和烟雾检测算法,但其算法主要通过标准卷积来编码特征信息,缺乏提取关键特征的能力,限制了网络的表征能力,使其对形状、尺度多变的火焰和烟雾捕捉能力有限。
发明内容
根据本申请一方面,提供了一种火焰和烟雾检测方法,所述方法包括:获取待检测的图像;利用训练好的检测模型对所述图像进行火焰检测和/或烟雾检测,输出所述图像中的火焰和/或烟雾的分类及定位结果;其中,所述检测模型包括对yolov5网络改进后得到的改进型网络,其中对所述yolov5网络的改进包括:将所述yolov5网络的骨干网络中的空间金字塔池化模块替换为多尺度注意力模块。
在本申请的一个实施例中,所述多尺度注意力模块包括第一分支、第二分支和第三分支,其中:所述第一分支用于对输入特征图进行注意力权重计算,得到第一计算结果,所述输入特征图是所述骨干网络对所述图像提取的特征图;所述第二分支用于对所述输入特征图进行一次非线性变换,并将非线性变换结果和所述第一计算结果这两者相乘,得到第二计算结果;所述第三分支用于将所述输入特征图和所述第二计算结果进行矩阵相加操作,得到输出特征图。
在本申请的一个实施例中,对所述yolov5网络的改进还包括:将所述yolov5网络的骨干网络中的标准卷积模块替换为深度可分离卷积模块;所述第一分支对输入特征图进行注意力权重计算,得到第一计算结果,包括:对所述输入特征图进行一次非线性变换,得到非线性变换结果;将所述非线性变换结果进行多个不同尺度的最大池化后分别上采样至与所述输入特征图具有相同的分辨率,得到多个上采样结果;将所述多个上采样结果融合,得到融合特征图;将所述融合特征图依次进行深度可分离卷积、批归一化、全局平均池化和尺度缩放,得到所述第一计算结果。
在本申请的一个实施例中,所述多个不同尺度的最大池化采用的核大小分别为3x3、5x5、7x7;所述深度可分离卷积采用的核大小为3x3。
在本申请的一个实施例中,对所述yolov5网络的改进还包括:将所述yolov5网络的骨干网络中的中心点和尺度预测模块替换为鬼影模块;其中,所述输入特征图是所述鬼影模块对所述图像进行处理而得到的。
在本申请的一个实施例中,对所述yolov5网络的改进还包括以下中的至少一项:将所述yolov5网络的骨干网络中的通道数大于256维的卷积模块替换为通道数为256维的卷积模块;将所述yolov5网络的脖颈网络中的中心点和尺度预测模块替换为鬼影模块,并将所述脖颈网络中的标准卷积模块替换为深度可分离卷积模块;将所述yolov5网络的头网络中的三个输出分支扩展至四个输出分支。
在本申请的一个实施例中,对所述检测模型的训练,包括:收集包含火焰和/或烟雾的样本图像,对所述样本图像进行标注和数据增强,得到训练数据集;对所述训练数据集中的数据进行预处理,得到预处理后的数据集;在服务器上搭建训练模型所需的虚拟环境;在所述虚拟环境中基于所述预处理后的数据集对所述改进型网络进行训练,得到所述训练好的检测模型。
根据本申请另一方面,提供了一种火焰和烟雾检测装置,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行上述的火焰和烟雾检测方法。
在本申请的一个实施例中,所述装置的应用场景包括以下中的至少一项:森林防火、工厂防火、仓库防火、住宅防火、商场防火。
根据本申请再一方面,提供了一种存储介质,所述存储介质上存储有由处理器运行的计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行上述的火焰和烟雾检测方法。
根据本申请实施例的火焰和烟雾检测方法和装置采用包括多尺度注意力模块的改进型yolov5网络对图像进行火焰和烟雾检测,对于形状多变、尺度多变的火焰和/或物品未完全燃烧时产生的烟雾具有较高的捕捉能力,从而能够快速、准确地判断和定位图像中的火焰和/或烟雾。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出用于实现根据本发明实施例的火焰和烟雾检测方法和装置的示例电子设备的示意性框图。
图2示出根据本申请实施例的火焰和烟雾检测方法的示意性流程图。
图3示出根据本申请实施例的火焰和烟雾检测方法采用的检测模型从训练到应用的示例性过程流程图。
图4示出根据本申请实施例的火焰和烟雾检测方法中采用的改进型网络的模型结构和操作示意图。
图5示出根据本申请实施例的火焰和烟雾检测方法中采用的改进型网络的模型中多尺度注意力模块的结构和操作示意图。
图6示出根据本申请实施例的火焰和烟雾检测装置的示意性结构框图。
具体实施方式
为了使得本申请的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。基于本申请中描述的本申请实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本申请的保护范围之内。
首先,参照图1来描述用于实现本发明实施例的火焰和烟雾检测方法和装置的示例电子设备100。
如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106以及输出装置108,这些组件通过总线系统110和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。此外,所述输入装置106也可以是任何接收信息的接口。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音),并且可以包括显示器、扬声器等中的一个或多个。此外,所述输出装置108也可以是任何其他具备输出功能的设备。
示例性地,用于实现根据本发明实施例的火焰和烟雾检测方法和装置的示例电子设备可以被实现诸如智能手机、平板电脑、摄像头等终端。
下面,将参考图2描述根据本申请实施例的火焰和烟雾检测方法200。如图2所示,火焰和烟雾检测方法200可以包括如下步骤:
在步骤S210,获取待检测的图像。
在步骤S220,利用训练好的检测模型对图像进行火焰检测和/或烟雾检测,输出图像中的火焰和/或烟雾的分类及定位结果,其中,检测模型包括对yolov5网络改进后得到的改进型网络,其中对yolov5网络的改进包括:将yolov5网络的骨干网络中的空间金字塔池化模块替换为多尺度注意力模块(Multi-Scale Self-Attention,简称MSA)。
在本申请的实施例中,采用对yolov5网络改进后得到的改进型网络作为用于火焰检测和/或烟雾检测的检测模型,由于对yolov5网络的改进包括将yolov5网络的骨干网络中的空间金字塔池化(Spatial Pyramid Pooling,简称为SPP)模块替换为多尺度注意力模块,而多尺度注意力模块可以有效地提取多种不同尺度的目标信息并进行关键特征的筛选,使得包括该模块的yolov5网络检测模型对于形状多变、尺度多变的火焰和/或物品未完全燃烧时产生的烟雾(此时尚未产生火焰)具有较高的捕捉能力,从而能够对待检测的图像(此处图像可以指代图片也可以指代视频)中是否存在火焰和/或烟雾进行快速、准确的判断和定位,用于火灾预警系统时能够有效提升系统的可靠性和安全性,具有广泛的应用场景和市场价值。
在本申请的实施例中,前述的多尺度注意力模块可以包括第一分支、第二分支和第三分支,其中:第一分支用于对输入特征图进行注意力权重计算,得到第一计算结果,输入特征图是前述检测模型的骨干网络对待检测的图像提取的特征图;第二分支用于对输入特征图进行一次非线性变换,并将非线性变换结果和第一计算结果这两者相乘,得到第二计算结果;第三分支用于将输入特征图和第二计算结果进行矩阵相加操作,得到输出特征图。在该实施例中,第一分支能够完成特征图在通道维度上的注意力权重计算;第二分支利用注意力权重来表示当前通道特征的有效性,完成对关键特征的筛选;第三分支完成注意力加权的特征进行矩阵相加操作,避免因梯度弥散或爆炸而导致网络退化问题,最后得到与输入特征图尺度一致的输出特征图。稍后将结合图5来示例性地描述多尺度注意力模块的结构和操作。
在本申请的实施例中,对yolov5网络的改进还可以包括:将yolov5网络的骨干网络中的标准卷积模块替换为深度可分离卷积(Depthwise Separable Convolution,简称为DSC)模块;基于此,前述的第一分支对输入特征图进行注意力权重计算,得到第一计算结果,包括:对输入特征图进行一次非线性变换,得到非线性变换结果;将非线性变换结果进行多个不同尺度的最大池化后分别上采样至与输入特征图具有相同的分辨率,得到多个上采样结果;将多个上采样结果融合,得到融合特征图;将融合特征图依次进行深度可分离卷积、批归一化、全局平均池化和尺度缩放,得到第一计算结果。在该实施例中,输入特征图经过一次非线性变换,能够获得更强表征能力;融合多个上采样结果能够获得拥有多尺度的特征表示的特征图;将融合特征图进行深度可分离卷积配合批归一化操作能够进一步丰富特征表示;利用全局平均池化将每一个通道全局信息的有效性压缩成一个点来标识,再配合激活函数将特征点的尺度大小进行缩放,完成特征图在通道维度上的注意力权重计算。稍后将结合图5来示例性地描述多尺度注意力模块中第一分支的结构和操作。
在本申请的实施例中,对yolov5网络的改进还可以包括:将yolov5网络的骨干网络中的中心点和尺度预测(Center and Scale Prediction,简称为CSP)模块替换为鬼影(Ghost)模块;基于此,前文中所述的输入特征图可以是鬼影模块对待检测的图像进行处理而得到的。进一步地,对yolov5网络的改进还可以包括:将yolov5网络的脖颈网络中的中心点和尺度预测模块替换为鬼影模块,并将脖颈网络中的标准卷积模块替换为深度可分离卷积模块。在该实施例中,通过将yolov5网络中的标准卷积结构和CSP模块分别替换为深度可分离卷积结构和Ghost模块,能够降低网络的参数量并保持网络精度性能不变,从而能够提高火焰和/或烟雾的检测效率且不会影响检测可靠性。稍后将结合图4来示例性地描述对yolov5网络改进后得到的改进型网络的结构和操作。
在本申请的实施例中,对yolov5网络的改进还可以包括:将yolov5网络的头网络中的三个输出分支扩展至四个输出分支。在该实施例中,通过yolov5网络的头网络改进为四个输出分支,能够提升网络对多尺度目标的拟合能力,加快网络收敛,在本申请的应用场景中,其可以提升检测模型对多尺度火焰、多尺度烟雾的拟合能力,加快用于火焰和烟雾检测的模型的收敛速度。在类似的实施例中,还可以将yolov5网络的头网络中的三个输出分支扩展至其他数目的分支来提升网络对多尺度目标的拟合能力。稍后将结合图4来示例性地描述对yolov5网络改进后得到的改进型网络的结构和操作。
在本申请的实施例中,对yolov5网络的改进还可以包括:将yolov5网络的骨干网络中的通道数大于256维的卷积模块替换为通道数为256维的卷积模块,这可以降低网络的参数量并保持网络精度性能不变,从而能够提高火焰和/或烟雾的检测效率且不会影响检测可靠性。稍后将结合图4来示例性地描述对yolov5网络改进后得到的改进型网络的结构和操作。
在本申请的实施例中,对改进后的得到的改进型网络也即检测模型的训练可以包括:收集包含火焰和/或烟雾的样本图像,对样本图像进行标注和数据增强,得到训练数据集;对训练数据集中的数据进行预处理,得到预处理后的数据集;在服务器上搭建训练模型所需的虚拟环境;在虚拟环境中基于预处理后的数据集对改进型网络进行训练,得到训练好的检测模型。基于训练好的检测模型,可对输入的图像进行火焰和/或烟雾检测,得到图像中火焰和/或烟雾的分类结果和位置坐标。
下面结合图3来示例性地描述本申请的火焰和烟雾检测方法中检测模型从训练到应用的示例性过程,并结合图4和图5描述对yolov5网络改进后得到的网络模型的结构和操作示例。
如图3所示,为了训练用于火焰和烟雾检测的检测模型,首先可以利用爬虫脚本采集图片和视频并标注完成数据集的建立;接着,对数据分析整理并利用数据增强扩充数据完成数据集的构建;然后,可以选定基础网络并针对问题进行改进完成改进型yolov5网络的搭建;接着,利用Anaconda(中文大蟒蛇,一个开源的Python发行版本)在图形处理单元(GPU)服务器上搭建网络训练所需的虚拟环境;然后,为改进型yolov5网络提供数据集进行训练;最后,利用训练好的火焰和烟雾检测网络对图像或者视频进行火焰和烟雾检测。
其中,在上述的数据集建立的过程中,可以确定所需的火焰和烟雾两种类别,通过使用爬虫技术收集互联网上相应类别的公开数据集和视频;利用Labelme标注工具对收集的数据进行目标类别和位置打标。其中,标注信息例如可以存储为xml格式,标注信息可以包括图像内火焰和烟雾的类别信息(例如火焰label为0,烟雾为1)、中心点坐标信息(x,y)和尺寸长宽信息(w,h),获取标注完成的初始图像数据(datasets_original)。
在上述的数据集的构建过程中,可以编写火焰和烟雾两种类别的数量统计分析脚本,统计datasets_original的类别(label)信息,针对数量较少的类别,在不同环境、距离和拍摄角度下进行人工采集并标注并补充至数据集,获取类别均衡的图像数据(datasets_balance)。对datasets_balance使用颜色变换、尺度变换、随机裁剪和随机缩放等通用的目标检测数据增强操作进一步扩充数据集,得到最终的训练数据(datasets_train)。
在上述的改进型yolov5网络的搭建过程中,可以选取基础网络yolov5作为检测模型,该基础网络主要由骨干网络(Backbone)、脖颈网络(Neck)和头网络(Head)组成。对该基础网络的改进可以包括:将网络中的标准卷积结构和CSP模块替换为深度可分离卷积结构和Ghost模块(Module),降低网络的参数量并保持网络精度性能不变;将骨干网络中的SPP模块改进成MSA模块,增强网络对关键特征的提取能力;将骨干网络中通道数大于256维的卷积模块替换为通道数为256维;将网络Head部分扩展至四个输出分支,提升网络对多尺度目标的拟合能力,加快网络收敛。具体地,例如可以在Neck部分的32倍下采样模块接上一个64倍下采样模块,再配合Head部分的卷积模块Conv 1x1获得第四个输出(output)分支。总体上,将修改后的各结构和模块按照原yolov5网络形式顺序堆叠,即可得改进型yolov5网络,如图4所示的(此处图4中的函数concat、上采样upsample、函数dw均为原始yolov5已有的,对其不再描述)。
对于多尺度注意力模块(MSA)增强对关键语义信息的提取,其结构和计算流程如图5所示。输入特征图以广播的形式分别输入至三个分支:右一为注意力权重计算分支(即前文所述的第一分支),第一步:特征图经过一次非线性变换(Conv->BN->ReLU)以获得更强表征能力;第二步:通过多个不同尺度的最大池化(MaxPooling)操作(核大小例如分别为3x3,5x5,7x7)并上采样(UpSample)至原特征图的分辨率大小(C/3,H,W);第三步:融合三者以获得拥有多尺度的特征表示的特征图(C,H,W);第四步:利用卷积核大小为3x3的深度可分离卷积(DSC)配合批归一化操作(BN)进一步丰富特征表示;第五步:利用全局平均池化(GAP)将每一个通道全局信息的有效性压缩成一个点来表示(C,1,1),再配合Sigmoid激活函数将特征点的尺度大小缩放至[0,1],完成特征图在通道维度上的注意力权重计算。右二为注意力加权分支(即前文所述的第二分支),特征图经过一次非线形变换(Conv->BN->ReLU)后与右一分支的注意力权重相乘,利用注意力权重来表示当前通道特征的有效性(权重越趋向于1表示此通道特征越重要),完成对关键特征的筛选。右三为恒等变换分支(即前文所述的第三分支),与右二完成注意力加权的特征进行矩阵相加操作,避免因梯度弥散或爆炸而导致网络退化问题,最后得到与输入特征图尺度一致的输出特征图(C,H,W)。
基于上述改进后得到的网络,在上述的为改进型网络提供数据集进行训练的过程中,可以将上述得到的数据集datasets_train进行预处理,对xml格式的标准文件进行坐标归一化处理,完成后的xml文件包含目标类别、中心点坐标、目标框宽度、目标框高度,并且将图像数据统一缩放为416x416像素尺度,80%的数据作为训练集,其余20%的数据作为验证集,即可完成图像数据预处理操作。接着,在GPU服务器上搭建训练模型所需要的虚拟环境,完成后将训练集输入至改进后的网络进行火焰和烟雾检测模型训练,训练完成后即可得到用于检测火焰和烟雾的推理模型。
最终,将待检测的图像或视频流输入上述训练完成后得到的推理模型,即可获得图像或视频文件格式的火焰和烟雾检测结果,实现火焰和烟雾的分类(label)和定位(x,y,w,h)。
以上示例性地示出了根据本申请实施例的火焰和烟雾检测方法。基于上面的描述,根据本申请实施例的火焰和烟雾检测方法采用包括多尺度注意力模块的改进型yolov5网络对图像进行火焰和烟雾检测,对于形状多变、尺度多变的火焰和/或物品未完全燃烧时产生的烟雾具有较高的捕捉能力,从而能够快速、准确地判断和定位图像中的火焰和/或烟雾。
下面结合图6描述本申请另一方面提供的火焰和烟雾检测装置。图6示出了根据本申请实施例的火焰和烟雾检测装置600的示意性框图。如图6所示,根据本申请实施例的火焰和烟雾检测装置600可以包括存储器610和处理器620,存储器610存储有由处理器620运行的计算机程序,所述计算机程序在被处理器620运行时,使得处理器620执行前文所述的根据本申请实施例的火焰和烟雾检测方法200。本领域技术人员可以结合前文所述的内容理解根据本申请实施例的火焰和烟雾检测装置600的具体操作,为了简洁,此处不再赘述具体的细节,仅描述处理器620的一些主要操作。
在本申请的一个实施例中,所述计算机程序在被处理器620运行时,使得处理器620执行如下步骤:获取待检测的图像;利用训练好的检测模型对图像进行火焰检测和/或烟雾检测,输出图像中的火焰和/或烟雾的分类及定位结果;其中,检测模型包括对yolov5网络改进后得到的改进型网络,其中对yolov5网络的改进包括:将yolov5网络的骨干网络中的空间金字塔池化模块替换为多尺度注意力模块。
在本申请的一个实施例中,多尺度注意力模块包括第一分支、第二分支和第三分支,其中:第一分支用于对输入特征图进行注意力权重计算,得到第一计算结果,输入特征图是骨干网络对图像提取的特征图;第二分支用于对输入特征图进行一次非线性变换,并将非线性变换结果和第一计算结果这两者相乘,得到第二计算结果;第三分支用于将输入特征图和第二计算结果进行矩阵相加操作,得到输出特征图。
在本申请的一个实施例中,对yolov5网络的改进还包括:将yolov5网络的骨干网络中的标准卷积模块替换为深度可分离卷积模块;第一分支对输入特征图进行注意力权重计算,得到第一计算结果,包括:对输入特征图进行一次非线性变换,得到非线性变换结果;将非线性变换结果进行多个不同尺度的最大池化后分别上采样至与输入特征图具有相同的分辨率,得到多个上采样结果;将多个上采样结果融合,得到融合特征图;将融合特征图依次进行深度可分离卷积、批归一化、全局平均池化和尺度缩放,得到第一计算结果。
在本申请的一个实施例中,多个不同尺度的最大池化采用的核大小分别为3x3、5x5、7x7;深度可分离卷积采用的核大小为3x3。
在本申请的一个实施例中,对yolov5网络的改进还包括:将yolov5网络的骨干网络中的中心点和尺度预测模块替换为鬼影模块;其中,输入特征图是鬼影模块对图像进行处理而得到的。
在本申请的一个实施例中,对yolov5网络的改进还包括以下中的至少一项:将yolov5网络的骨干网络中的通道数大于256维的卷积模块替换为通道数为256维的卷积模块;将yolov5网络的脖颈网络中的中心点和尺度预测模块替换为鬼影模块,并将脖颈网络中的标准卷积模块替换为深度可分离卷积模块;将yolov5网络的头网络中的三个输出分支扩展至四个输出分支。
在本申请的一个实施例中,对检测模型的训练,包括:收集包含火焰和/或烟雾的样本图像,对样本图像进行标注和数据增强,得到训练数据集;对训练数据集中的数据进行预处理,得到预处理后的数据集;在服务器上搭建训练模型所需的虚拟环境;在虚拟环境中基于预处理后的数据集对改进型网络进行训练,得到训练好的检测模型。
在本申请的一个实施例中,装置600的应用场景可以包括以下中的至少一项:森林防火、工厂防火、仓库防火、住宅防火、商场防火。对于客厅、院子、仓库这些相对空旷的空间而言,传统烟火检测系统作用有限。本申请的火焰和烟雾检测装置能够用于基于深度学习的视频分析的烟火自动检测预警系统,弥补传统火灾报警设备的不足,完全适应于室内外场景,而且可以快速报警,具有非常广阔的市场空间。
此外,根据本申请实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本申请实施例的火焰和烟雾检测方法的相应步骤。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。
基于上面的描述,根据本申请实施例的火焰和烟雾检测方法和装置采用包括多尺度注意力模块的改进型yolov5网络对图像进行火焰和烟雾检测,对于形状多变、尺度多变的火焰和/或物品未完全燃烧时产生的烟雾具有较高的捕捉能力,从而能够快速、准确地判断和定位图像中的火焰和/或烟雾。
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本申请的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本申请的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本申请的范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本申请的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的一些模块的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本申请的具体实施方式或对具体实施方式的说明,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种火焰和烟雾检测方法,其特征在于,所述方法包括:
获取待检测的图像;
利用训练好的检测模型对所述图像进行火焰检测和/或烟雾检测,输出所述图像中的火焰和/或烟雾的分类及定位结果;
其中,所述检测模型包括对yolov5网络改进后得到的改进型网络,其中对所述yolov5网络的改进包括:将所述yolov5网络的骨干网络中的空间金字塔池化模块替换为多尺度注意力模块。
2.根据权利要求1所述的方法,其特征在于,所述多尺度注意力模块包括第一分支、第二分支和第三分支,其中:
所述第一分支用于对输入特征图进行注意力权重计算,得到第一计算结果,所述输入特征图是所述骨干网络对所述图像提取的特征图;
所述第二分支用于对所述输入特征图进行一次非线性变换,并将非线性变换结果和所述第一计算结果这两者相乘,得到第二计算结果;
所述第三分支用于将所述输入特征图和所述第二计算结果进行矩阵相加操作,得到输出特征图。
3.根据权利要求2所述的方法,其特征在于,对所述yolov5网络的改进还包括:将所述yolov5网络的骨干网络中的标准卷积模块替换为深度可分离卷积模块;
所述第一分支对输入特征图进行注意力权重计算,得到第一计算结果,包括:
对所述输入特征图进行一次非线性变换,得到非线性变换结果;
将所述非线性变换结果进行多个不同尺度的最大池化后分别上采样至与所述输入特征图具有相同的分辨率,得到多个上采样结果;
将所述多个上采样结果融合,得到融合特征图;
将所述融合特征图依次进行深度可分离卷积、批归一化、全局平均池化和尺度缩放,得到所述第一计算结果。
4.根据权利要求3所述的方法,其特征在于,所述多个不同尺度的最大池化采用的核大小分别为3x3、5x5、7x7;
所述深度可分离卷积采用的核大小为3x3。
5.根据权利要求2所述的方法,其特征在于,对所述yolov5网络的改进还包括:
将所述yolov5网络的骨干网络中的中心点和尺度预测模块替换为鬼影模块;
其中,所述输入特征图是所述鬼影模块对所述图像进行处理而得到的。
6.根据权利要求1所述的方法,其特征在于,对所述yolov5网络的改进还包括以下中的至少一项:
将所述yolov5网络的骨干网络中的通道数大于256维的卷积模块替换为通道数为256维的卷积模块;
将所述yolov5网络的脖颈网络中的中心点和尺度预测模块替换为鬼影模块,并将所述脖颈网络中的标准卷积模块替换为深度可分离卷积模块;
将所述yolov5网络的头网络中的三个输出分支扩展至四个输出分支。
7.根据权利要求1-6中的任一项所述的方法,其特征在于,对所述检测模型的训练,包括:
收集包含火焰和/或烟雾的样本图像,对所述样本图像进行标注和数据增强,得到训练数据集;
对所述训练数据集中的数据进行预处理,得到预处理后的数据集;
在服务器上搭建训练模型所需的虚拟环境;
在所述虚拟环境中基于所述预处理后的数据集对所述改进型网络进行训练,得到所述训练好的检测模型。
8.一种火焰和烟雾检测装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行如权利要求1-7中的任一项所述的火焰和烟雾检测方法。
9.根据权利要求8所述的装置,其特征在于,所述装置的应用场景包括以下中的至少一项:森林防火、工厂防火、仓库防火、住宅防火、商场防火。
10.一种存储介质,其特征在于,所述存储介质上存储有由处理器运行的计算机程序,所述计算机程序在被所述处理器运行时,使得所述处理器执行如权利要求1-7中的任一项所述的火焰和烟雾检测方法。
CN202211024252.9A 2022-08-24 2022-08-24 火焰和烟雾检测方法、装置和存储介质 Pending CN115424171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211024252.9A CN115424171A (zh) 2022-08-24 2022-08-24 火焰和烟雾检测方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211024252.9A CN115424171A (zh) 2022-08-24 2022-08-24 火焰和烟雾检测方法、装置和存储介质

Publications (1)

Publication Number Publication Date
CN115424171A true CN115424171A (zh) 2022-12-02

Family

ID=84197779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211024252.9A Pending CN115424171A (zh) 2022-08-24 2022-08-24 火焰和烟雾检测方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN115424171A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115909107A (zh) * 2022-12-06 2023-04-04 武汉纺织大学 一种基于无人机视角的烟火检测方法、系统、设备及介质
CN116468974A (zh) * 2023-06-14 2023-07-21 华南理工大学 一种基于图像生成的烟雾检测方法、装置及存储介质
CN117423047A (zh) * 2023-12-19 2024-01-19 深圳须弥云图空间科技有限公司 基于特征图像的计数方法、装置、电子设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115909107A (zh) * 2022-12-06 2023-04-04 武汉纺织大学 一种基于无人机视角的烟火检测方法、系统、设备及介质
CN115909107B (zh) * 2022-12-06 2023-08-18 武汉纺织大学 一种基于无人机视角的烟火检测方法、系统、设备及介质
CN116468974A (zh) * 2023-06-14 2023-07-21 华南理工大学 一种基于图像生成的烟雾检测方法、装置及存储介质
CN116468974B (zh) * 2023-06-14 2023-10-13 华南理工大学 一种基于图像生成的烟雾检测方法、装置及存储介质
CN117423047A (zh) * 2023-12-19 2024-01-19 深圳须弥云图空间科技有限公司 基于特征图像的计数方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US10943145B2 (en) Image processing methods and apparatus, and electronic devices
CN106650662B (zh) 目标对象遮挡检测方法及装置
TWI773189B (zh) 基於人工智慧的物體檢測方法、裝置、設備及儲存媒體
CN108256404B (zh) 行人检测方法和装置
CN110458107B (zh) 用于图像识别的方法和装置
CN115424171A (zh) 火焰和烟雾检测方法、装置和存储介质
CN106845352B (zh) 行人检测方法和装置
CN111062429A (zh) 基于深度学习的厨师帽和口罩佩戴的检测方法
CN108229418B (zh) 人体关键点检测方法和装置、电子设备、存储介质和程序
CN110659659A (zh) 一种智能识别和预警害虫的方法及系统
CN111126293A (zh) 一种火焰和烟雾异常情况检测方法及系统
Cheng et al. Smoke detection and trend prediction method based on Deeplabv3+ and generative adversarial network
CN108960314B (zh) 基于难样本的训练方法、装置及电子设备
JP2006163452A (ja) 追跡装置および追跡方法
WO2023093151A1 (zh) 图像筛选方法及装置、电子设备和存储介质
CN114842185A (zh) 用于火灾的目标识别方法、装置、设备及介质
CN115222717B (zh) 一种大豆种荚快速计数方法、装置及存储介质
Lee et al. Automatic recognition of flower species in the natural environment
CN110942456B (zh) 篡改图像检测方法、装置、设备及存储介质
CN112906780A (zh) 一种果蔬图像分类系统及方法
CN115062186A (zh) 一种视频内容检索方法、装置、设备以及存储介质
Wu et al. A dataset for fire and smoke object detection
CN112668675B (zh) 一种图像处理方法、装置、计算机设备及存储介质
CN114255493A (zh) 图像检测方法、人脸检测方法及装置、设备及存储介质
CN114662605A (zh) 基于改进的YOLOv5模型的火焰检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination