CN117409358A

CN117409358A - 一种融合BiFPN的轻量化火焰检测方法

Info

Publication number: CN117409358A
Application number: CN202311436982.4A
Authority: CN
Inventors: 严云洋; 董可; 王盘龙; 叶翔; 冷志超; 祝巧巧; 耿嘉雯; 朱妍
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2023-10-31
Filing date: 2023-10-31
Publication date: 2024-01-16

Abstract

本发明公开了一种融合BiFPN的轻量化火焰检测方法，在YOLOv8算法的基础上，使用DCRS模块替换YOLOv8主干网络中的部分标准卷积，从而减少参数量；使用DBB替换Bottleneck结构中的Conv，构成Bottleneck_DBB结构，将其嵌入C2f模块中构成C2f_DBB模块，并将主干网络中的C2f模块替换为C2f_DBB模块，以重构主干网络；在主干特征提取网络输出的三个特征层之后加入轻量化注意力机制SimAM；颈部网络采用多尺度特征融合BiFPN，使特征融合方式更加简单高效，以提高检测速度和降低模型复杂度；使用MPDIoU边界损失函数替换原损失函数，加快收敛速度，提高模型对火焰目标的定位能力。本发明在不同场景下的检测效果对比原模型得到了改善，检测速度满足实时性要求，改进后的检测模型能够更好地应用于火灾防控任务中。

Description

一种融合BiFPN的轻量化火焰检测方法

技术领域

本发明涉及计算机视觉与图像识别的技术领域，具体涉及一种融合BiFPN的轻量化火焰检测方法。

背景技术

火灾是世界性的自然灾害之一，也是日常生活中主要灾害，其发生发展不仅对自然环境有着严重影响，还威胁着人们的生命与财产安全，能够及时并有效地做出火灾预警变得非常重要。

YOLOv8作为主流算法在实时性能、准确性和灵活性等方面具有显著的优点，是目标检测领域的一个重要算法选择。YOLOv8主要包括输入端、主干网络、颈部网络和头部网络四个部分。其中，输入端负责将输入图片缩放到训练需要的尺寸，并包合缩放、改变图片色调和数据增强等操作；主干网络用来进行目标特征的提取，由Conv、C2f和SPPF模块构成；颈部网络用来将不同维度的特征进行加强融合，其结构遵循特征金字塔和路径聚合结构；头部网络将加强后的特征进行计算，最终得到不同目标的置信度和位置。

虽然YOLOv8在目标检测领域取得了显著的进展，但它仍然具有一些挑战和局限性。YOLOv8的性能很大程度上依赖于使用的数据集。如果训练数据不足或不够代表性，模型可能会在不同场景下表现不佳。YOLOv8在一般物体检测上表现得很出色，但在检测小尺寸或相似目标时，可能会出现性能下降。这在一些特定的应用中可能是一个问题，例如火焰检测中的小目标火焰或检测过程中遇到的光照、灯光、晚霞等类火目标造成的干扰。

发明内容

发明目的：针对背景技术中指出的问题，本发明提出一种融合BiFPN的轻量化火焰检测方法，检测速度满足实时性要求，改进后的检测模型能够更好地应用于火灾防控任务中。

技术方案：本发明提供了一种融合BiFPN的轻量化火焰检测方法，具体步骤如下：

步骤1：采集数据制作数据集，通过网络采集不同的火焰图像数据，再对获得的图像数据进行标注，制作数据集；

步骤2：使用DCRS模块替换YOLOv8主干网络中的部分标准卷积；

步骤3：使用DBB替换YOLOv8主干网络中Bottleneck结构中的Conv，构成Bottleneck_DBB结构，将其嵌入C2f模块中构成C2f_DBB模块，并将主干网络中的C2f模块替换为C2f_DBB模块，以重构主干网络；

步骤4：在主干特征提取网络输出的三个特征层之后加入轻量化注意力机制SimAM；

步骤5：颈部网络中采用多尺度特征融合BiFPN；

步骤6：使用MPDIoU边界损失函数替换原损失函数；

步骤7：对改进后的YOLOv8网络进行网络模型训练，得到训练好的YOLOv8网络模型，对待检测图像数据进行火焰检测。

进一步地，所述步骤1具体步骤如下：

步骤1.1：通过网络爬虫技术爬取不同的火焰图像数据；

步骤1.2：对获取的图像数据进行数据清洗；

步骤1.3：用数据标注工具Labelimg对火焰图像进行标注，用矩形框标注图像中火焰的位置，标注成YOLO格式，得到火焰图像数据集；

步骤1.4：将标注好的火焰图像数据集按照8：1：1的比例划分成训练集、验证集和测试集。

进一步地，所述步骤2中DCRS模块由AvgPool、Conv、Softmax组合而成，并在DCRS模块中加入DWConv作为跳跃连接，通过加权运算进行求和输出感受野特征注意力特征图，整个过程表示如下：

F＝Softmax(d^1×1(AvgPool(X)))×ReLu(Norm(d^k×k(X)))＝A_rf×F_rf

其中：d表示深度可分离卷积，k表示卷积核的大小，Norm代表规范化，X表示输入特征图，F是通过注意力图A_rf与变换的感受野空间特征F_rf相乘而获得的。

进一步地，所述步骤5包括如下子步骤：

步骤5.1：运用BiFPN对主干特征提取网络输出的不同分辨率的火焰特征进行第一次融合：先从低往高、再从高往低依次进行上采样和融合，并将输入与输出级联，进而融合不同卷积层的火焰特征；

步骤5.2：将步骤5.1中BiFPN第一次融合后的三个不同分辨率的特征图进行递归操作，即返回到原有的主干网络；

步骤5.3：运用BiFPN将步骤5.2返回的三个不同分辨率的火焰特征图与相应分辨率的主干网络得到火焰特征图二次融合，再次得到三个不同分辨率的火焰特征图，然后在头部网络进行检测。

进一步地，所述步骤6中使用MPDIoU边界损失函数替换原损失函数，具体定义为：

其中：表示预测边界框的坐标，/>表示真实标注边界框的坐标，x₁，y₁表示框的左上角坐标，x₂，y₂表示框的右下角坐标，/>为预测边界框与真实标注边界框之间的左上角和右下角的距离，w，h为图片的宽度和高度。

进一步地，所述步骤7的网络模型训练中，迭代100次，初始学习率设置为0.01，最小学习率设置为0.001，bitch_size设置为8，使用AdamW优化器，且权值衰减设置为0.0005。

与现有技术相比，本发明有益效果：

在YOLOv8算法的基础上，使用DCRS模块替换YOLOv8主干网络中的部分标准卷积，从而减少参数量。使用DBB替换C2f模块中的Bottleneck结构中的Conv，构成Bottleneck_DBB结构，将其嵌入C2f模块中构成C2f_DBB模块，并将主干网络中的C2f模块替换为C2f_DBB模块，以重构主干网络，在提高精度的同时可以满足实时性要求。在主干特征提取网络输出的三个特征层之后加入轻量化注意力机制SimAM，增强模型对小目标火焰特征的提取能力。颈部网络中采用更高效简单的多尺度特征融合BiFPN，使特征融合方式更加简单高效，以提高检测速度和降低模型复杂度。使用MPDIoU边界损失函数替换原损失函数，加快收敛速度，提高模型对火焰目标的定位能力。本发明在不同场景下的检测效果对比原模型得到了改善，检测速度满足实时性要求，改进后的检测模型能够更好地应用于火灾防控任务中。

附图说明

图1是本发明实施例的方法流程图；

图2是本发明实施例的整体网络结构图；

图3是本发明实施例中DCRS模块示意图；

图4是本发明实施例中DBB的结构图；

图5是本发明实施例中Bottleneck_DBB的结构图；

图6是本发明实施例中C2f_DBB模块示意图；

图7是本发明实施例中SimAM注意力机制模块示意图；

图8是本发明实施例的原始YOLOv8算法检测效果图；

图9是本发明算法的检测效果图。

具体实施方式

下面结合实施例对本发明做进一步的描述，有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明，不能理解为对本发明保护范围的限制，该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整，仍属于本发明保护范围。

本发明提出了一种融合BiFPN的轻量化火焰检测方法，具体步骤如下：

步骤1：采集数据制作数据集，通过网络采集不同的火焰图像数据，再对获得的图像数据进行标注，制作数据集。

步骤1.1：通过网络爬虫技术爬取不同的火焰图像数据。

步骤1.2：对获取的图像数据进行数据清洗。

步骤1.3：用数据标注工具Labelimg对火焰图像进行标注，用矩形框标注图像中火焰的位置，标注成YOLO格式，得到火焰图像数据集。

步骤2：使用DCRS模块替换YOLOv8主干网络中的部分标准卷积。

步骤2.1首先将AvgPool、Conv、Softmax进行串联。

步骤2.2加入DWConv作为跳跃连接。

步骤2.3最后通过加权运算进行求和输出感受野特征注意力特征图。

整个过程表示如下：

F＝Softmax(d^1×1(AvgPool(X)))×ReLu(Norm(d^k×k(X)))＝A_rf×F_rf

步骤3：使用DBB替换Bottleneck结构中的Conv，构成Bottleneck_DBB结构，将其嵌入C2f模块中构成C2f_DBB模块，并将主干网络中的C2f模块替换为C2f_DBB模块，以重构主干网络。

步骤3.1使用DBB替换Bottleneck结构中的Conv替换为DBB，构成Bottleneck_DBB结构。

步骤3.2将Bottleneck_DBB嵌入C2f模块，构成C2f_DBB模块。

步骤3.3将C2f_DBB模块替换主干网络中的C2f模块，对主干网络进行重构。

步骤4：在主干特征提取网络输出的三个特征层之后加入轻量化注意力机制SimAM。其计算过程如下：

其中：Y表示火焰增强后的特征图，表示为每个通道上的能量函数，能量函数值越低则表明目标火焰神经元与相邻的神经元的区分度越高，为了/>避免过大的情况，采用Sigmoid函数来抑制其值，/>表示点积运算，X表示输入火焰的特征图，σ²表示输入火焰特征图中每个通道的方差，λ表示超参数，t表示火焰目标的神经元，μ表示输入火焰特征图中每个通道上的平均值，x_i表示第i(i＝1，2，3...，Q，Q为通道数量)个通道中输入特征的其他神经元。

步骤5：颈部网络中采用更高效简单的多尺度特征融合BiFPN，具体如下：

步骤6：使用MPDIoU边界损失函数替换原损失函数；

具体定义为：

步骤7：对改进后的YOLOv8网络进行网络模型训练，得到训练好的YOLOv8网络模型。

步骤7.1具体设置为迭代100次，初始学习率设置为0.01，最小学习率设置为0.001，bitch_size设置为8，使用AdamW优化器，且权值衰减设置为0.0005。

步骤7.2经训练得到最优权重，利用最优权重对测试集进行测试，得到测试结果。

本发明实施例使用平均精度(mean Average Precision，mAP)、参数量(Params)、计算量(GFLOPs)和帧速率(Frames Per Second，FPS)作为评价指标。实验结果如表1所示，从表中可以看出改进后的火焰检测算法，相比YOLOv8算法平均精度提升了0.8％，模型参数量下降了43.3％，模型计算量下降了14.8％，改进后的火焰检测模型能够保证轻量化的同时满足实时性要求。

表1

	mAP	Params	GFLOPs	FPS
					YOLOv8	82.3％	3.0M	8.1	108
本发明模型	83.1％	1.7M	6.9	92

Claims

1.一种融合BiFPN的轻量化火焰检测方法，其特征在于，具体步骤如下：

步骤2：使用DCRS模块替换YOLOv8主干网络中的部分标准卷积；

步骤5：颈部网络中采用多尺度特征融合BiFPN；

步骤6：使用MPDIoU边界损失函数替换原损失函数；

2.根据权利要求1所述的一种融合BiFPN的轻量化火焰检测方法，其特征在于，所述步骤1具体步骤如下：

步骤1.1：通过网络爬虫技术爬取不同的火焰图像数据；

步骤1.2：对获取的图像数据进行数据清洗；

3.根据权利要求1所述的一种融合BiFPN的轻量化火焰检测方法，其特征在于，所述步骤2中DCRS模块由AvgPool、Conv、Softmax组合而成，并在DCRS模块中加入DWConv作为跳跃连接，通过加权运算进行求和输出感受野特征注意力特征图，整个过程表示如下：

F＝Softmax(d^1×1(AvgPool(X)))×ReLu(Norm(d^k×k(X)))＝A_rf×F_rf

4.根据权利要求1所述的一种融合BiFPN的轻量化火焰检测方法，其特征在于，所述步骤5包括如下子步骤：

5.根据权利要求1所述的一种融合BiFPN的轻量化火焰检测方法，其特征在于，所述步骤6中使用MPDIoU边界损失函数替换原损失函数，具体定义为：

6.根据权利要求1所述的一种融合BiFPN的轻量化火焰检测方法，其特征在于，所述步骤7的网络模型训练中，迭代100次，初始学习率设置为0.01，最小学习率设置为0.001，bitch_size设置为8，使用AdamW优化器，且权值衰减设置为0.0005。