CN117115723B - 一种消防设施计数方法、装置、存储介质及电子设备 - Google Patents
一种消防设施计数方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN117115723B CN117115723B CN202311371816.0A CN202311371816A CN117115723B CN 117115723 B CN117115723 B CN 117115723B CN 202311371816 A CN202311371816 A CN 202311371816A CN 117115723 B CN117115723 B CN 117115723B
- Authority
- CN
- China
- Prior art keywords
- module
- fire
- fighting
- model
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000007781 pre-processing Methods 0.000 claims abstract description 19
- 238000000605 extraction Methods 0.000 claims description 53
- 230000007246 mechanism Effects 0.000 claims description 30
- 230000004927 fusion Effects 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 230000001965 increasing effect Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 239000003623 enhancer Substances 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims 1
- 238000013136 deep learning model Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000013135 deep learning Methods 0.000 description 7
- 238000012935 Averaging Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 239000013618 particulate matter Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本公开揭示了一种消防设施计数方法、装置、存储介质及电子设备,其方法包括:S100:采集消防设施输入图像;S200:对输入图像预处理;S300:构建消防设施计数模型并训练;S400:将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对输入图像中的消防设施进行计数。本公开基于深度学习模型能够学习和捕捉到消防设施丰富的特征表示,并通过特征表示确定消防设施的位置信息,以及能够更好地适应复杂的场景和变化的环境,提高计数的准确性。
Description
技术领域
本公开属于深度学习技术领域,具体涉及一种消防设施计数方法、装置、存储介质及电子设备。
背景技术
在大型建筑物或公共场所中,消防设施的布置与数量是十分重要的。为了保障人们的生命财产安全,消防设施必须经过严格的检查和核对。现有的消防设施计数方法主要包含两种:
第一种是使用深度学习目标检测来对图像中的消防设施进行标记,然后对这些标记的目标进行求和,得出最后的总数。此方法主要存在以下两个方面的问题:1、此方法需要在标记阶段对图像中的所有目标进行标记,其标签标记的范围为整个设备,因此需要消耗大量的时间来进行标记工作;2、此方法虽然能够在目标稀疏的场景下取得较好的结果,但是在目标比较密集的场所往往检测不到遮挡后的物体,从而导致检测精度降低;
第二种是使用深度学习密度图回归的方式直接输出图像中目标的密度信息,然后通过对图中的像素点进行求和可以得出图像中的总目标数。但是此类方法为了追求准确度,使用了较深的卷积神经网络,因此会导致参数量和运算量的增加,从而使得此方法难以落地应用。
发明内容
针对现有技术中的不足,本公开的目的在于提供一种消防设施计数方法,该方法能够自动对消防设施进行识别和计数,从而能够极大提高消防设施的计数效率和准确性。
为实现上述目的,本公开提供以下技术方案:
一种基于深度学习的消防设施计数方法,包括如下步骤:
S100:采集消防设施输入图像;
S200:对输入图像预处理;
S300:构建消防设施计数模型并训练;
所述消防设施计数模型包括轻量化主干网络,轻量化主干网络后依次连接通道注意力机制模块和空间注意力机制模块,其中,通道注意力机制模块用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,空间注意力机制模块用于编码空间维度上的长距离依赖;
S400:将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对输入图像中的消防设施进行计数。
优选的,所述对图像预处理包括以下步骤:
S201:对输入图像进行归一化处理;
S202:对归一化处理后的输入图像进行对比度增强。
优选的,所述消防设施计数模型还包括:轻量化多尺度特征融合模块和轻量化细粒度特征提取模块。
优选的,所述消防设施计数模型通过以下步骤进行训练:
S301:获取多张包含消防设施的输入图像数据集,对输入图像中的消防设施进行标注,以获得标注后的输入图像数据集,对标注后的输入图像数据集预处理后划分为训练集和验证集;
S302:对模型的权重进行初始化,通过训练集对模型进行训练,在训练过程中,将模型输出与训练集中已标注的消防设施数量进行比较,计算均方误差损失函数并进行反向传播以优化网络权重,使得模型的输出结果与标注的标签的差别在预设的阈值范围内,当损失函数收敛,模型训练完成;
S303:利用验证集对训练后的模型进行验证,将标注数量与模型预测数量输入损失函数以计算两者之间的差距,并根据损失函数进行反向优化。
本公开还提供一种消防设施计数装置,包括:
采集模块,用于采集消防设施输入图像;
预处理模块,用于对输入图像预处理;
训练模块,用于构建消防设施计数模型并训练;
所述消防设施计数模型包括轻量化主干网络,轻量化主干网络后依次连接通道注意力机制模块和空间注意力机制模块,其中,通道注意力机制模块用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,空间注意力机制模块用于编码空间维度上的长距离依赖;
计数模块,用于将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对输入图像中的消防设施进行计数。
优选的,所述预处理模块包括:
归一化子模块,用于对输入图像进行归一化处理;
增强子模块,用于对归一化处理后的输入图像进行对比度增强。
优选的,所述训练模块包括:
获取子模块,用于获取多张包含消防设施的输入图像数据集;
标注子模块,用于对输入图像中的消防设施进行标注;
划分子模块,用于将标注后的输入图像数据集划分为训练集和测试集;
训练子模块,用于通过训练集对消防设施计数模型进行训练;
测试子模块,用于通过测试集对训练后的消防设施计数模型进行测试。
本公开还提供一种电子设备,包括:
存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
所述处理器执行所述程序时实现任一所述的方法。
本公开还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如前任一所述的方法。
与现有技术相比,本公开带来的有益效果为:
1、自动化和高效性:传统的消防设施数量核对通常需要人工参与,耗时且容易出错。本方法通过深度学习技术实现自动识别和计数,使得消防设施的数量可以在短时间内自动完成核对,节省了大量的人力和时间成本。
2、高准确性:深度学习模型能够学习和捕捉到消防设施丰富的特征表示,并通过特征表示确定消防设施的位置信息,相比传统的基于规则或手工特征提取的方法,基于深度学习的方法能够更好地适应复杂的场景和变化的环境,提高计数的准确性。
3、鲁棒性和泛化能力:深度学习模型通过大规模的训练数据和端到端的训练方式,可以学习到丰富的特征表示和模式,从而具有更好的鲁棒性和泛化能力。无论是在不同的消防设施场所、不同的光照条件或其他变化的环境中,该方法都能够提供稳定和可靠的计数结果。
4、可扩展性:基于深度学习的方法可以通过增加更多的训练数据和调整网络结构来进行扩展和改进。随着更多数据的积累和算法的不断改进,该方法可以逐步提升性能并适应更广泛的消防设施场景。
附图说明
图1是本公开一个实施例提供的一种消防设施计数方法的流程图;
图2是本公开另一个实施例提供的消防设施计数网络的结构示意图;
图3是本公开另一个实施例提供的轻量化多尺度特征融合模块的结构示意图;
图4是本公开另一个实施例提供的轻量化细粒度特征分割提取模块的结构示意图。
具体实施方式
下面将参照附图详细地描述本公开的具体实施例。虽然附图中显示了本公开的具体实施例,然而应当理解,可以通过各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本公开的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本公开的范围。本公开的保护范围当视所附权利要求所界定者为准。
为便于对本公开实施例的理解,下面将结合附图1至图4以具体实施例为例做进一步的解释说明,且各个附图并不构成对本公开实施例的限定。
一个实施例中,如图1所示,本公开提出一种消防设施计数方法,包括如下步骤:
S100:采集消防设施输入图像;
S200:对输入图像预处理;
S300:构建消防设施计数模型并训练;
S400:将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对输入图像中的消防设施进行计数。
另一个实施例中,所述对图像预处理包括以下步骤:
S201:对输入图像进行归一化处理,以将输入图像的像素值映射到[0,1]或[-1,1]的范围内。
S202:通过直方图均衡化增强归一化处理后的输入图像的对比度,以使输入图像中的待计数消防设施更加明显,以便于模型识别计数。
另一个实施例中,步骤S300中,如图2所示,所述消防设施计数模型包括:轻量化主干网络、注意力机制模块、轻量化多尺度特征融合模块和轻量化细粒度特征提取模块。
本实施例中,轻量化主干网络包括卷积层L1至卷积层L5,依次对消防设施输入图像进行二维卷积操作,并最终输出维度为(16×16)的特征图(第一个16表示特征图的宽度,第二个16表示特征图的高度)。尽管主干网络能够提取输入图像中大量丰富的语义特征信息,但是这些语义特征信息往往包含了大量背景信息,因此如何消除特征图中的背景信息对于提升网络整体性能具有重要作用。为了解决这一问题,本公开在主干网络末端引入了通道注意力机制模块CA,以用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,并且:当特征图中的消防设施分布特别密集的时候,通过通道注意力机制模块CA能够区分不同类型以及不同大小的消防设施的纹理特征,以便于后续模块可通过纹理特征实现对消防设施进行计数。另外,本公开还在通道注意力机制模块CA后引入了空间注意力机制模块SA,空间注意力机制模块SA能够进一步有效地编码空间维度上的长距离依赖,从而能够有效提升模型在空间位置上的对于消防设施的特征提取能力。以上,本公开通过引入通道注意力机制模块CA和空间注意力机制模块SA,能够根据输入的特征图中的上下文信息动态地分配不同特征的重要性权重,使得模型更关注那些对当前任务更有意义和贡献的特征,而忽略那些冗余或无用的特征,一方面能够减少模型对于内存的消耗,另一方面能够提高模型对于输入图像中消防设施的检测和计数效率。
此外,膨胀卷积常被用于分割任务,其可以让网络在增加少许参数量和运算量的情况下提取到更深层次的语义信息。在计数网络中,通过多列并行卷积神经网络进行多尺度特征提取已被证明是可行的,然而它的缺点也十分明显,即对于较大尺度的特征图,其需要更大的卷积核来提升感受野,大卷积核带来的是参数量的上升和推理速度的下降。此外,还存在两个缺点:首先,当输出特征图的通道数增加时,特征图的大小减少到输入图像大小的1/8,随着特征图尺度的降低,网络更难捕捉到小目标物体的特征。同时,轻量模型在特征提取方面本身存在着一定限制,这就导致模型对小目标特征的感知能力较弱。针对这一问题,本实施例设计了一种轻量化多尺度特征融合模块(LMCFM),该模块与空间注意力机制模块SA连接,其结构如图3所示。图3中,轻量化多尺度特征融合模块包括一个全局平均池化层(GAP)和四个膨胀卷积层,且全局平均池化层和四个膨胀卷积层并行设置。全局平均池化层用于对输入特征图Fin(C×H×W,C为通道数,H为高度,W为宽度)进行全局平均池化操作。其中,四个并行的膨胀卷积层包括第一膨胀卷积层Conv3-2、第二膨胀卷积层Conv3-4、第三膨胀卷积层Conv3-8和第四膨胀卷积层Conv3-12,且第一至第四膨胀卷积层具有不同的感受野3-2、3-4、3-8、3-12,所以能够帮助模型更好地学习并提取出特征图中的多尺度信息和高维度特征,同时不需要增加参数量。此外,全局平均池化操作被用于计算各通道输入特征图的所有像素的平均值,然后将计算结果输入到softmax激活函数中,以防止轻量化多尺度特征融合模块在不增加参数的情况下发生过度拟合。需要说明的是,图3中的为Concat操作,其用于实现叠加,/>表示乘积操作。
进一步的,上述四个膨胀卷积层的膨胀率分别为2,4,8,12,每个膨胀卷积层输出
的特征图的通道数为输入特征图(即图3中所示的Fin:C×H×W,C表示通道数,H表示高度,W
表示宽度)的1/4(即图3中所示的C/4),通过(即图3中所示的)操作对四个膨胀卷
积层的输出特征图进行叠加,然后将叠加后的特征图输入卷积层Conv进行通道降维。
轻量化多尺度特征融合模块的第一个任务是多尺度特征提取,其包含四个分支,具体如下:
,表示膨胀率为2的膨胀卷积层的特征提取过程;,
表示膨胀率为4的膨胀卷积层的特征提取过程;,表示膨胀率为8的膨胀卷积
层的特征提取过程;,表示膨胀率为12的膨胀卷积层的特征提取过程。然
后,对四个膨胀卷积层输出的具有不同感受野的特征图和进行操作以
获得叠加后的特征图,具体为:
操作后获得的特征图输入卷积层Conv中进行特征提取和降维,即可
获得融合特征图。
通过上述方式,使得模型结构的参数量得到了降低,同时局部信息和全部信息能够充分地保留下来,从而使得模型能够更好地提取出消防设施的关键信息,其公式如下:
其中,表示输入特征图,表示卷积操作,GAP表示全局平均池化操作,
为维度为C×1×1的权重向量。最后,将权重向量和融合特征图进行相乘,即可最
终获得具有不同权重的多尺度的输出特征图Fout,具体计算过程如下:
其中,为C×H×W维的输出特征图;表示乘积操作。
相比传统的多列卷积,由于轻量化多尺度特征融合模块具有更少的参数量,并且膨胀卷积层能够在不增加参数量的情况下增强网络卷积运算的感受野,因此,轻量化多尺度特征融合模块可以在不增加参数量和运算量的情况下扩大模型的感受野,紧接着对具有不同感受野的特征图进行融合以获得融合特征图。最后,将融合特征图与权重向量相乘获得多尺度特征图,从而提升了模型的检测和计数性能。
下面,为了更直观地描述轻量化多尺度特征融合模块的运算过程,本公开对其伪代码进行了示例,具体如表1所示:
表1基于膨胀卷积的多尺度特征融合模块伪代码
进一步的,在经由轻量化多尺度特征融合模块获得多尺度特征图后,消防设施的
特征信息需要进一步从特征图中进行分离。从轻量化多尺度特征融合模块输出的多尺度特
征图的尺寸已经减小到输入图像Fin的1/64。受轻量化网络MobileNet的启发,本公开进
一步构建了第一轻量化细粒度特征提取模块(LCSPM-1)和第二轻量化细粒度特征提取模块
(LCSPM-2),以对由轻量化多尺度特征融合模块输出的多尺度特征图中的消防设施的特征
信息作进一步分离。如图4所示,第一轻量化细粒度特征提取模块和第二轻量化细粒度特征
提取模块的结构相同。图4中,表示上采样操作。
下面,本实施例就以第一轻量化细粒度特征提取模块为例进行说明,第一轻量化
细粒度特征提取模块包括第一分支和第二分支其中,在第一分支上,输入的特征图(即
前文中的Fout)通过全局平均池化层(GAP)得到一个的权重向量,该向量具体计算
如下:
ωp
其中,和分别表示特征图的高度和宽度,表示特征图第个通道像素值,
并且,和分别表示行和列。
权重向量被输入卷积层进行卷积,最后经过非线性激活函数sigmoid得到
通道系数,通道系数表示如下:
其中,表示sigmoid激活函数,表示卷积。
第二分支上,输入的特征图经过卷积层Conv卷积后再通过批归一化层
(BN)进行批归一化操作获得Xb,可以表示为:。最后将两个分支所输出的结
果进行相乘,具体表示为:,其中,表示通道系数和特征图相乘后的结
果。紧接着,对和进行操作,表示为如下:
其中,表示主干网络中第个卷积层输出的特征图,如图2所示,主干网络中的
卷积层L4输出的特征图,即X4与第一轻量化细粒度特征提取模块的输出进行操
作。
同理,由于第二轻量化细粒度特征提取模块与第一轻量化细粒度特征提取模块的
结构相同,因而,二者的原理也相同,此处就不再赘述,但与第一轻量化细粒度特征提取模
块不同的是,与第二轻量化细粒度特征提取模块的输出进行操作的是主干网络中
的卷积层L3输出的特征图。
进一步的,在操作过程中,由于第一轻量化细粒度特征提取模块没有改变
特征图的尺度,因此有必要通过上采样操作以扩大第一轻量化细粒度特征提取模块输出的
特征图的尺度,具体为:将经一个卷积模块(即图2所示的第一轻量化细粒度特征提取模
块后面连接的卷积模块,其中,示例性的,该卷积模块可以是1×1卷积层)卷积后以降低
的通道数,然后进行上采样(即图4中的)后作为第二轻量化细粒度特征提取模块的输入
(同样,第二轻量化细粒度特征提取模块也包括两个分支,其原理和第一轻量化细粒度特征
提取模块相同,此处不再赘述),最终获得输出的细粒度特征图Xout。此外,本公开同样对第
二轻量化细粒度特征提取模块的输出进行了上采样操作(即图2中所示的向上的箭头×2),
以扩大第二轻量化细粒度特征提取模块输出的特征图的尺度。
与通过大卷积核来减少通道数相比,轻量化细粒度特征提取模块不仅实现了低参数量,同时能够融合全局和局部信息,从而能够提升消防设施计数的准确度,轻量化细粒度特征提取模块的伪代码如表2所示:
表2轻量尺度池化模块算法伪代码
更进一步的,如图2所示,本实施例还在第二轻量化细粒度特征提取模块(LCSPM-2)后面依次添加了卷积模块、可变卷积模块和卷积模块,通过设置卷积模块以降低第一轻量化细粒度特征提取模块输出的细粒度特征的通道数以及提取更深层次的目标特征。而可变卷积模块主要是在感受野中引入了偏移量,而且偏移量是可学习的,因此可以使得感受野不再只是方形,而是与消防设施的实际形状贴近,这样就使得之后的卷积区域便始终覆盖在物体形状周围,从而可以更好的学习到消防设施的特征。
另一个实施例中,步骤S300中,所述消防设施计数模型通过以下步骤进行训练:
S301:获取多张包含消防设施的图像,对图像中的消防设施进行标注,以获得标注后的图像数据集,对标注后的图像数据集预处理后划分为训练集和验证集;
S302:对模型的权重进行初始化,通过训练集对模型进行训练,在训练过程中,将模型输出与训练集中已标注的消防设施数量进行比较,计算均方误差损失函数并进行反向传播以优化网络权重,使得模型的输出结果与标注的标签的差别在预设的阈值范围内,当损失函数收敛,模型训练完成;
示例性的,预设的阈值范围为1。
S303:利用验证集对训练后的模型进行验证,将标注数量与模型预测数量输入损失函数以计算两者之间的差距,并根据损失函数进行反向优化。
本实施例中,通过利用多张包含消防设施的图像对模型进行训练,使得模型能够学习和捕捉到消防设施的表面特征、颜色特征以及形状特征,当需要对某一输入图像中的消防设施进行计数检测时,该模型即可通过综合识别消防设施的表面特征、颜色特征和形状特征以确定消防设施的位置信息,并通过对以上特征进行积分求和,从而实现对图像中的消防设施进行计数。
下面,本公开通过消融实验对本公开所述消防设施计数模型与未引入轻量化多尺度特征融合模块和轻量化细粒度特征提取模块的基础网络、基础网络只引入轻量化多尺度特征融合模块以及基础网络只引入轻量化细粒度特征提取模块的网络进行比对,具体比对结果如表3所示:
表3
由表3可以看出,本公开所述消防设施计数模型通过在基础网络上同时引入轻量化多尺度特征融合模块和轻量化细粒度特征提取模块,指标MAE(平均绝对误差)和MSE(均方误差)均有显著提升,因而能够证明,本模型通过同时引入轻量化多尺度特征融合模块和轻量化细粒度特征提取模块,能够提高消防设施计数的准确性。
另一个实施例中,本公开还提供一种消防设施计数装置,包括:
采集模块,用于输入包含消防设施的输入图像;
预处理模块,用于对输入图像预处理;
训练模块,用于构建消防设施计数模型并训练;
所述消防设施计数模型包括轻量化主干网络,轻量化主干网络后依次连接通道注意力机制模块和空间注意力机制模块,其中,通道注意力机制模块用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,空间注意力机制模块用于编码空间维度上的长距离依赖;
计数模块,用于将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对图像中的消防设施进行计数。
另一个实施例中,所述预处理模块包括:
归一化子模块,用于对输入图像进行归一化处理;
增强子模块,用于对归一化处理后的输入图像进行对比度增强。
另一个实施例中,所述训练模块包括:
获取子模块,用于获取多张包含消防设施的输入图像数据集;
标注子模块,用于对输入图像中的消防设施进行标注;
划分子模块,用于将标注后的输入图像数据集划分为训练集和测试集;
训练子模块,用于通过训练集对消防设施计数模型进行训练;
测试子模块,用于通过测试集对训练后的消防设施计数模型进行测试。
另一个实施例中,本公开还提供一种电子设备,包括:
存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
所述处理器执行所述程序时实现如前任一所述的方法。
另一个实施例中,本公开还提供一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如前任一所述的方法。
以上所述仅为本发明的较佳实例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种消防设施计数方法,其特征在于,所述的方法包括如下步骤:
S100:采集消防设施输入图像;
S200:对输入图像预处理;
所述对输入图像预处理包括以下步骤:
S201:对输入图像进行归一化处理,以将输入图像的像素值映射到[0,1]或[-1,1]的范围内;
S202:通过直方图均衡化对归一化处理后的输入图像进行对比度增强;
S300:构建消防设施计数模型并训练;
所述消防设施计数模型包括轻量化主干网络,轻量化主干网络后依次连接通道注意力机制模块和空间注意力机制模块,其中,通道注意力机制模块用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,以及用于当特征图中的消防设施分布特别密集的时候区分不同类型以及不同大小的消防设施的纹理特征,以便于后续模块通过纹理特征实现对消防设施进行计数;空间注意力机制模块用于编码空间维度上的长距离依赖,以提升模型在空间位置上的对于消防设施的特征提取能力;
所述轻量化主干网络包括卷积层L1至卷积层L5,依次对消防设施输入图像进行二维卷积操作;
所述消防设施计数模型还包括轻量化多尺度特征融合模块,轻量化多尺度特征融合模块的输入端与空间注意力机制模块连接,轻量化多尺度特征融合模块的输出端与第一轻量化细粒度特征提取模块的输入端连接,所述轻量化多尺度特征融合模块包括一个全局平均池化层和四个膨胀卷积层,全局平均池化层和四个膨胀卷积层并行设置,所述四个并行的膨胀卷积层包括第一膨胀卷积层Conv3-2、第二膨胀卷积层Conv3-4、第三膨胀卷积层Conv3-8和第四膨胀卷积层Conv3-12,且第一至第四膨胀卷积层具有不同的感受野3-2、3-4、3-8、3-12,所述轻量化多尺度特征融合模块能够帮助模型更好地学习并提取出特征图中的多尺度信息和高维度特征,同时不需要增加参数量;
所述消防设施计数模型还包括第一轻量化细粒度特征提取模块和第二轻量化细粒度特征提取模块,第一轻量化细粒度特征提取模块的输出与主干网络中的卷积层L4的输出进行concat操作后经过一个卷积模块卷积再经过上采样后作为第二轻量化细粒度特征提取模块的输入;第二轻量化细粒度特征提取模块的输出经过上采样操作后与主干网络中的卷积层L3的输出进行concat操作,并作为设置于第二轻量化细粒度特征提取模块后的卷积模块的输入;所述第一轻量化细粒度特征提取模块和第二轻量化细粒度特征提取模块结构相同,均包括第一分支和第二分支,其中,第一分支包括全局平均池化层、1×1卷积层、激活函数sigmoid;第二分支包括1×1卷积层、批归一化层,且第一分支和第二分支的输出结果相乘后进行concat操作;
所述消防设施计数模型还包括卷积模块、可变卷积模块和卷积模块,所述卷积模块、可变卷积模块和卷积模块依次添加于所述第二轻量化细粒度特征提取模块后;
所述消防设施计数模型通过以下步骤进行训练:
S301:获取多张包含消防设施的图像,对图像中的消防设施进行标注,以获得标注后的图像数据集,对标注后的图像数据集预处理后划分为训练集和验证集;
S302:对模型的权重进行初始化,通过训练集对模型进行训练,在训练过程中,将模型输出与训练集中已标注的消防设施数量进行比较,计算均方误差损失函数并进行反向传播以优化网络权重,使得模型的输出结果与标注的标签的差别在预设的阈值范围内,当损失函数收敛,模型训练完成;
S303:利用验证集对训练后的模型进行验证,将标注数量与模型预测数量输入损失函数以计算两者之间的差距,并根据损失函数进行反向优化;
S400:将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对输入图像中的消防设施进行计数。
2.一种用于实施如权利要求1所述方法的消防设施计数装置,其特征在于,所述的装置包括:
采集模块,用于输入包含消防设施的输入图像;
预处理模块,用于对输入图像预处理;
训练模块,用于构建消防设施计数模型并训练;
所述消防设施计数模型包括轻量化主干网络,轻量化主干网络后依次连接通道注意力机制模块和空间注意力机制模块,其中,通道注意力机制模块用于捕获主干网络输出的特征图中更多上下文信息和高级语义信息,空间注意力机制模块用于编码空间维度上的长距离依赖;
计数模块,用于将预处理后的输入图像输入训练好的消防设施计数模型中,以实现对图像中的消防设施进行计数。
3.根据权利要求2所述的装置,其特征在于,所述预处理模块包括:
归一化子模块,用于对输入图像进行归一化处理;
增强子模块,用于对归一化处理后的输入图像进行对比度增强。
4.根据权利要求2所述的装置,其特征在于,所述训练模块包括:
获取子模块,用于获取多张包含消防设施的输入图像数据集;
标注子模块,用于对输入图像中的消防设施进行标注;
划分子模块,用于将标注后的输入图像数据集划分为训练集和测试集;
训练子模块,用于通过训练集对消防设施计数模型进行训练;
测试子模块,用于通过测试集对训练后的消防设施计数模型进行测试。
5.一种电子设备,其特征在于,所述的电子设备包括:
存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
所述处理器执行所述程序时实现权利要求1所述的方法。
6.一种计算机存储介质,其特征在于,所述的存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311371816.0A CN117115723B (zh) | 2023-10-23 | 2023-10-23 | 一种消防设施计数方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311371816.0A CN117115723B (zh) | 2023-10-23 | 2023-10-23 | 一种消防设施计数方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117115723A CN117115723A (zh) | 2023-11-24 |
CN117115723B true CN117115723B (zh) | 2024-01-23 |
Family
ID=88800516
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311371816.0A Active CN117115723B (zh) | 2023-10-23 | 2023-10-23 | 一种消防设施计数方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117115723B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062275A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 一种多层次监督的人群计数方法、装置、介质及电子设备 |
CN112541459A (zh) * | 2020-12-21 | 2021-03-23 | 山东师范大学 | 基于多尺度感知注意力网络的人群计数方法及系统 |
CN113011329A (zh) * | 2021-03-19 | 2021-06-22 | 陕西科技大学 | 一种基于多尺度特征金字塔网络及密集人群计数方法 |
CN113128558A (zh) * | 2021-03-11 | 2021-07-16 | 重庆邮电大学 | 基于浅层空间特征融合与自适应通道筛选的目标检测方法 |
CN113762009A (zh) * | 2020-11-18 | 2021-12-07 | 四川大学 | 一种基于多尺度特征融合及双注意力机制的人群计数方法 |
CN114120361A (zh) * | 2021-11-19 | 2022-03-01 | 西南交通大学 | 一种基于编解码结构的人群计数定位方法 |
CN114612755A (zh) * | 2022-02-22 | 2022-06-10 | 武汉工程大学 | 一种火灾检测方法、系统、电子设备和可读存储介质 |
CN115937758A (zh) * | 2022-07-21 | 2023-04-07 | 北京工业大学 | 一种基于多尺度动态图卷积的弱监督人群计数方法 |
CN116071709A (zh) * | 2023-03-31 | 2023-05-05 | 南京信息工程大学 | 一种基于改进型vgg16网络的人群计数方法、系统及存储介质 |
CN116110005A (zh) * | 2023-02-22 | 2023-05-12 | 上海应用技术大学 | 一种人群行为属性的计数方法、系统及产品 |
CN116152171A (zh) * | 2022-12-15 | 2023-05-23 | 重庆市西部水资源开发有限公司 | 智能建造目标计数方法、电子设备及存储介质 |
CN116311091A (zh) * | 2023-01-19 | 2023-06-23 | 江西省交通监控指挥中心 | 一种基于金字塔密度感知注意力网络的车辆计数方法 |
CN116385707A (zh) * | 2023-04-04 | 2023-07-04 | 河海大学 | 基于多尺度特征与特征增强的深度学习场景识别方法 |
CN116704231A (zh) * | 2023-03-01 | 2023-09-05 | 上海师范大学 | 一种双层部件蒸馏的细粒度图像分类方法 |
CN116740439A (zh) * | 2023-06-14 | 2023-09-12 | 陕西科技大学 | 一种基于跨尺度金字塔Transformer的人群计数方法 |
CN116778415A (zh) * | 2023-06-20 | 2023-09-19 | 山东巍然智能科技有限公司 | 一种无人机用人群计数网络模型及计数方法 |
CN116843999A (zh) * | 2023-09-04 | 2023-10-03 | 四川泓宝润业工程技术有限公司 | 一种基于深度学习的动火作业中气瓶检测方法 |
CN116863252A (zh) * | 2023-09-04 | 2023-10-10 | 四川泓宝润业工程技术有限公司 | 动火作业现场易燃物检测方法、装置、设备、存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241895B (zh) * | 2018-08-28 | 2021-06-04 | 北京航空航天大学 | 密集人群计数方法及装置 |
CN114119582B (zh) * | 2021-12-01 | 2024-04-26 | 安徽大学 | 一种合成孔径雷达图像目标检测方法 |
-
2023
- 2023-10-23 CN CN202311371816.0A patent/CN117115723B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062275A (zh) * | 2019-12-02 | 2020-04-24 | 汇纳科技股份有限公司 | 一种多层次监督的人群计数方法、装置、介质及电子设备 |
CN113762009A (zh) * | 2020-11-18 | 2021-12-07 | 四川大学 | 一种基于多尺度特征融合及双注意力机制的人群计数方法 |
CN112541459A (zh) * | 2020-12-21 | 2021-03-23 | 山东师范大学 | 基于多尺度感知注意力网络的人群计数方法及系统 |
CN113128558A (zh) * | 2021-03-11 | 2021-07-16 | 重庆邮电大学 | 基于浅层空间特征融合与自适应通道筛选的目标检测方法 |
CN113011329A (zh) * | 2021-03-19 | 2021-06-22 | 陕西科技大学 | 一种基于多尺度特征金字塔网络及密集人群计数方法 |
CN114120361A (zh) * | 2021-11-19 | 2022-03-01 | 西南交通大学 | 一种基于编解码结构的人群计数定位方法 |
CN114612755A (zh) * | 2022-02-22 | 2022-06-10 | 武汉工程大学 | 一种火灾检测方法、系统、电子设备和可读存储介质 |
CN115937758A (zh) * | 2022-07-21 | 2023-04-07 | 北京工业大学 | 一种基于多尺度动态图卷积的弱监督人群计数方法 |
CN116152171A (zh) * | 2022-12-15 | 2023-05-23 | 重庆市西部水资源开发有限公司 | 智能建造目标计数方法、电子设备及存储介质 |
CN116311091A (zh) * | 2023-01-19 | 2023-06-23 | 江西省交通监控指挥中心 | 一种基于金字塔密度感知注意力网络的车辆计数方法 |
CN116110005A (zh) * | 2023-02-22 | 2023-05-12 | 上海应用技术大学 | 一种人群行为属性的计数方法、系统及产品 |
CN116704231A (zh) * | 2023-03-01 | 2023-09-05 | 上海师范大学 | 一种双层部件蒸馏的细粒度图像分类方法 |
CN116071709A (zh) * | 2023-03-31 | 2023-05-05 | 南京信息工程大学 | 一种基于改进型vgg16网络的人群计数方法、系统及存储介质 |
CN116385707A (zh) * | 2023-04-04 | 2023-07-04 | 河海大学 | 基于多尺度特征与特征增强的深度学习场景识别方法 |
CN116740439A (zh) * | 2023-06-14 | 2023-09-12 | 陕西科技大学 | 一种基于跨尺度金字塔Transformer的人群计数方法 |
CN116778415A (zh) * | 2023-06-20 | 2023-09-19 | 山东巍然智能科技有限公司 | 一种无人机用人群计数网络模型及计数方法 |
CN116843999A (zh) * | 2023-09-04 | 2023-10-03 | 四川泓宝润业工程技术有限公司 | 一种基于深度学习的动火作业中气瓶检测方法 |
CN116863252A (zh) * | 2023-09-04 | 2023-10-10 | 四川泓宝润业工程技术有限公司 | 动火作业现场易燃物检测方法、装置、设备、存储介质 |
Non-Patent Citations (5)
Title |
---|
A Crowd Counting Method Based on Multi-Scale Attention Network;Yu Xu 等;《2023 3rd International Conference on Neural Networks, Information and Communication Engineering (NNICE)》;591-595 * |
Crowd counting network based on multi-scale convolution and attention mechanism;Fang-jun Luan 等;《Second International Conference on Electronic Information Engineering, Big Data, and Computer Technology (EIBDCT 2023)》;第12642卷;428-437 * |
基于改进Tiny-YOLOv3的人数统计方法;成玉荣 等;《科技创新导报》(第10期);4-5+8 * |
基于深度学习的目标计数及植物检测算法研究;路乔宽;《中国优秀硕士学位论文全文数据库农业科技辑》(第2023(02)期);D043-36 * |
多尺度融合的双分支特征提取人群计数算法;曾芸芸 等;《计算机工程与应用》;1-10 * |
Also Published As
Publication number | Publication date |
---|---|
CN117115723A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115797931A (zh) | 一种基于双分支特征融合的遥感图像语义分割方法 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN110246148B (zh) | 多模态的深度信息融合和注意力学习的显著性检测方法 | |
CN109753959B (zh) | 基于自适应多尺度特征融合的路面交通标志检测方法 | |
CN111444924B (zh) | 一种病虫害检测及灾害等级分析方法及系统 | |
Zeng et al. | LEARD-Net: Semantic segmentation for large-scale point cloud scene | |
CN112581409B (zh) | 一种基于端到端的多重信息蒸馏网络的图像去雾方法 | |
CN112837315A (zh) | 一种基于深度学习的输电线路绝缘子缺陷检测方法 | |
CN111461129B (zh) | 一种基于上下文先验的场景分割方法和系统 | |
CN105243154A (zh) | 基于显著点特征和稀疏自编码的遥感图像检索方法及系统 | |
CN107832794A (zh) | 一种卷积神经网络生成方法、车系识别方法及计算设备 | |
CN116740439A (zh) | 一种基于跨尺度金字塔Transformer的人群计数方法 | |
Wang et al. | Global perception-based robust parking space detection using a low-cost camera | |
CN114926734A (zh) | 基于特征聚合和注意融合的固体废弃物检测装置及方法 | |
CN114202473A (zh) | 一种基于多尺度特征和注意力机制的图像复原方法及装置 | |
CN114463340A (zh) | 一种边缘信息引导的敏捷型遥感图像语义分割方法 | |
CN116778346B (zh) | 一种基于改进自注意力机制的管线识别方法及系统 | |
CN112668662B (zh) | 基于改进YOLOv3网络的野外山林环境目标检测方法 | |
CN112132867B (zh) | 一种遥感影像变化检测方法及装置 | |
CN113313077A (zh) | 基于多策略和交叉特征融合的显著物体检测方法 | |
Wang et al. | Structure-priority image restoration through genetic algorithm optimization | |
CN113096133A (zh) | 一种基于注意力机制的语义分割网络的构建方法 | |
CN117115723B (zh) | 一种消防设施计数方法、装置、存储介质及电子设备 | |
CN116012659B (zh) | 一种红外目标检测方法、装置、电子设备及存储介质 | |
CN116503399A (zh) | 基于yolo-afps的绝缘子污闪检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |