CN116342868A

CN116342868A - 基于多尺度特征补偿及门控增强的小目标检测方法

Info

Publication number: CN116342868A
Application number: CN202310283681.6A
Authority: CN
Inventors: 张铭津; 臧璠; 岳珂; 张秉颜; 李云松; 高新波
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2023-03-22
Filing date: 2023-03-22
Publication date: 2023-06-27

Abstract

本发明公开了一种基于多尺度特征补偿及门控增强的小目标检测方法，主要解决现有方法检测准确率低的问题，实现步骤为：获取训练样本集和测试样本集；构建基于多尺度特征补偿及门控增强的小目标检测模型：包括顺次连接的卷积模块、转置模块、门控增强模块和预测模块，以及加载在卷积模块和转置模块之间的多尺度特征补偿模块；对小目标检测模型进行迭代训练；获取测试样本的小目标检测结果。本发明中多尺度特征补偿模块用来提取下采样操作前后的浅层和深层特征，并利用浅层特征对深层特征补偿细节特征，提高多尺度上下文的表征能力，门控增强模块用来增强目标特征和抑制背景噪声，提高目标的信噪比，提高小目标检测的准确率。

Description

基于多尺度特征补偿及门控增强的小目标检测方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于多尺度特征补偿及门控增强的小目标检测方法，可用于森林火灾检测系统和精确制导系统。

背景技术

通常将目标区域在整个图像的占比为0.08％到0.58％之间的目标称为小目标，小目标在图像中分辨率低、像素小、对比度低和信噪比低，目标检测算法难以充分提取小目标的特征信息，这对小目标检测提出了挑战。基于深度学习的小目标检测算法不断发展，研究方向大致可以分为：锚框优化、数据增强、网络结构优化、多尺度特征融合、引入上下文信息等。

例如，哈尔滨理工大学在其申请的专利文献“一种基于CenterNet改进的多尺度特征融合的小目标检测方法”(专利申请号：CN202211459753.X，申请公布号为CN115631400A)中，提出了一种基于CenterNet改进的多尺度特征融合的小目标检测方法，将原始CneterNet模型的主干网络替换为可以获得高分辨率的主干网络来获得高质量的特征图，高分辨率的主干网络引入细粒度级多尺度特征融合模块，其将输入的特征图分为规格相同的四组，除了第一组特征图外之后每一组特征图都会与前一组特征图的输出相加得到输出，再进行卷积操作，卷积完成后将四组特征图的输出在通道维度拼接，然后引入坐标注意力机制和进行Droupout操作。主干网络会生成四个尺度不同的特征图，进行整合成通道数和大小相同的特征图后，拼接起来作为层级特征融合模块的输入，层级特征融合模块为不同分辨率的特征图赋予不同权重，自适应调节高低分辨率的比例，强化不同尺寸目标检测时所需要的特征信息。该发明中小目标特征信息在下采样操作中易丢失，并且小目标特征信息的信噪比低，导致检测的准确率较低。

发明内容

为了解决现有技术中存在的上述问题，本发明提供了一种基于多尺度特征补偿及门控增强的小目标检测方法，用于解决现有的小目标检测方法检测准确率低的问题。

为实现上述目的，本发明具体实现步骤包括如下：

(1)获取训练样本集和测试样本集：

获取K幅小目标图像，并对每幅小目标图像中的小目标对象进行标注，再将M幅小目标图像及其对应的标签组成训练样本集R₁，将剩余的K-M幅小目标图像及其对应的标签组成测试样本集E₁，其中K≥500，

(2)构建基于多尺度特征补偿及门控增强的小目标检测模型O：

构建包括顺次连接的卷积模块、转置模块、门控增强模块和预测模块的小目标检测模型O；卷积模块包括依次层叠的N个卷积层；转置模块包括依次层叠的N个转置卷积层；第n个卷积层的输入、输出端与第N-(n-1)个转置卷积层之间各加载有一个多尺度特征补偿模块，第二和第三个转置卷积层的输入端均与门控增强模块的输入端相连；多尺度特征补偿模块包括并行排布的三个分支，第一、第二分支均由顺次连接的六个残差卷积模块组成，第三分支由顺次连接的卷积层和六个残差卷积模块组成，且第二分支的输入端还与第三分支的输入端相连，三个分支中的第二、第四、第六残差卷积模块的输出端相加连接；残差卷积模块包括顺次连接的六个卷积层；门控增强模块包括并行排布的两个池化层和与其级联的卷积层和非线性激活层；预测模块包括顺次连接的卷积层、归一化层、非线性激活层、随机dropout层和卷积层；其中，N≥3；

(3)对小目标检测模型O进行迭代训练：

(3a)初始化迭代次数为t，最大迭代次数为T，T≥1000，第t次迭代的小目标检测模型O_t中的权值、偏置参数分别为w_t、b_t，并令t＝0，O_t＝O；

(3b)将从训练样本集R₁中随机有放回的选取L个训练样本作为小目标检测模型O的输入进行前向传播，其中，1≤L≤M：

(3b1)卷积模块中N个卷积层逐层对每个训练样本进行下采样，得到每个卷积层输出的L个下采样特征图；

(3b2)每个多尺度特征补偿模块分别利用其所连接的卷积模块中对应的卷积层的输入对卷积层的输出进行特征补偿，得到每个多尺度特征补偿模块输出的L个特征补偿特征图；

(3b3)转置模块中的第n个转置卷积层对其所连接的多尺度特征补偿模块的输出和第n-1个转置卷积层的输出的加和进行上采样，得到每个转置卷积层输出的L个上采样特征图；

(3b4)门控增强模块利用第二个转置卷积层的输入和第N个转置卷积层的输出对第三个转置卷积层的输入进行去除背景信息和增强目标特征，得到门控增强模块输出的L个具有高信噪比的特征图；

(3b5)预测模块对每个具有高信噪比的特征图进行预测，得到L个小目标检测结果；

(3c)利用Dice损失函数L_Dice和交叉熵损失函数L_CE，并通过生成的L个小目标检测结果和与其对应的的L个标签计算O_t的损失值L_t，再通过链式法则计算L_t对权值参数ω_t及偏置参数b_t的偏导

和/>

最后根据/>

对ω_t、b_t进行更新，得到本次迭代的网络模型O_t；

(3d)判断t≥T是否成立，若是，得到训练好的小目标检测模型O*，否则，令t＝t+1，并执行步骤(3b)；

(4)获取测试样本的小目标检测结果：

将测试样本集E₁作为训练好的小目标检测模型O*的输入进行前向传播，得到K-M个测试样本对应的小目标检测结果。

与现有技术相比，本发明具有以下优点：

本发明所构建的基于多尺度特征补偿及门控增强的小目标检测模型包括顺次连接的卷积模块、转置模块、门控增强模块和预测模块，以及加载在卷积模块和转置模块之间的多尺度特征补偿模块，在对该模型进行训练以及获取小目标检测结果的过程中，多尺度特征补偿模块用来提取下采样操作前后的浅层和深层特征，并利用浅层特征对深层特征补偿细节特征，使细节特征传播到网络的最深部分，以补偿下采样操作中丢失的目标特征，提高多尺度上下文的表征能力，门控增强模块用来增强目标特征和抑制背景噪声，提高目标的信噪比，实验结果表明，本发明能够有效提高小目标检测的准确率。

附图说明

图1为本发明实现的流程图；

图2为本发明实施例采用的基于多尺度特征补偿及门控增强的小目标检测模型；

图3为本发明实施例采用的多尺度特征补偿模块；

图4为本发明实施例采用的残差卷积模块；

图5为本发明实施例采用的门控增强模块。

具体实施方式

以下结合附图和具体实施例，对本发明作进一步详细描述。

参照图1，本发明包括如下步骤：

(1)获取训练样本集和测试样本集：

获取IRSTD-1k数据集包含的1000幅小目标图像，并对每幅小目标图像中的小目标进行标注，再将600幅小目标图像及其对应的标签组成训练样本集R₁，将剩余的400幅小目标图像及其对应的标签组成测试样本集E₁；

(2)构建基于多尺度特征补偿及门控增强的小目标检测模型O：

参照图2，对本发明实施例采用的基于多尺度特征补偿及门控增强的小目标检测模型做进一步的描述。

构建包括顺次连接的卷积模块、转置模块、门控增强模块和预测模块的小目标检测模型O；卷积模块包括依次层叠的卷积层个数为N＝3；转置模块包括依次层叠的转置卷积层个数为N＝3；第一卷积层的输入、输出端与第一多尺度特征补偿模块的输入端相连，第一多尺度特征补偿模块的输出端与第二转置卷积层的输出端相加连接(element-wise add)后再与第三转置卷积层的输入端连接，第二卷积层的输入、输出端与第二多尺度特征补偿模块的输入端相连，第二多尺度特征补偿模块的输出端与第一转置卷积层的输出端相加连接(element-wise add)后再与第二转置卷积层的输入端相连，第三卷积层的输入、输出端与第三多尺度特征补偿模块的输入端相连，第三多尺度特征补偿模块的输出端与第一转置卷积层的输入端相连；第二转置卷积层和第三转置卷积层的输入端还与门控增强模块的输入端相连；其中，多尺度特征补偿模块包括并行排布的三个分支，第二分支的输入端还和第三分支的输入端相连，第一分支包括顺次连接的第一残差卷积模块、第二残差卷积模块、第三残差卷积模块、第四残差卷积模块、第五残差卷积模块、第六残差卷积模块，第二分支包括顺次连接的第七残差卷积模块、第八残差卷积模块、第九残差卷积模块、第十残差卷积模块、第十一残差卷积模块、第十二残差卷积模块，第三分支包括顺次连接的第四卷积层、第十三残差卷积模块、第十四残差卷积模块、第十五残差卷积模块、第十六残差卷积模块、第十七残差卷积模块、第十八残差卷积模块，第二残差卷积模块、第八残差卷积模块和第十四残差卷积模块的输出端还进行相加连接(element-wise add)，第四残差卷积模块、第十残差卷积模块和第十六残差卷积模块的输出端还进行相加连接(element-wise add)，第六残差卷积模块、第十二残差卷积模块和第十八残差卷积模块的输出端还进行相加连接(element-wise add)；残差卷积模块包括顺次连接的第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层；门控增强模块包括并行排布的第一池化层和第二池化层，两个池化层的输出端进行通道拼接(concat)后，再顺次连接第十一卷积层和第一非线性激活层，中层输入端与第一非线性激活层的输出端进行点乘后与低层输入端进行相加(element-wise add)；预测模块包括顺次连接的第十二卷积层、归一化层、第二非线性激活层、随机dropout层和第十三卷积层；

具体参数设置为：输入通道为16；第一卷积层、第二卷积层、第三卷积层的卷积核大小均为3*3，步长均为2，填充均为1，输出通道分别为32、64、128；第一转置卷积层、第二转置卷积层、第三转置卷积层的卷积核大小均为4*4，步长均为2，填充均为1，输出通道分别为64、32、16；第一、第二、第三多级特征补偿块中的第四卷积层的卷积核大小均为3*3，步长均为2，填充均为1，输出通道分别为64、128、256；第五卷积层、第六卷积层、第七卷积层、第八卷积层、第九卷积层、第十卷积层均为空洞卷积，卷积核大小均为3*3，第五卷积层、第六卷积层的膨胀率为1，第七卷积层、第八卷积层的膨胀率为2，第九卷积层、第十卷积层的膨胀率为3；第十一卷积层的卷积核大小为3*3，步长为1，填充为1，输出通道为1，第十二卷积层的卷积核大小为3*3，步长为1，填充为1，输出通道为4，第十三卷积层的卷积核大小为1*1，步长为1，输出通道为1；第一池化层采用最大池化，第二池化层采用平均池化；第一非线性激活层采用Sigmoid函数，第二非线性激活层采用ReLU函数；归一化层采用批量归一化；随机dropout层设置节点保留概率为0.5。

参照图3，对本发明实施例采用的多尺度特征补偿模块做进一步的描述。

所述多尺度特征补偿模块具体来说，利用具有丰富细节的高分辨率特征来指导特征聚合，其中高分辨率特征可以补偿下采样和池化操作丢失的细节，低分辨率特征保留检测的语义。用f_e ^n-1表示第n个多尺度特征补偿模块第一分支输入的浅层特征，其输入来自较浅层网络，f_e ⁿ表示第n个多尺度特征补偿模块第二、第三分支输入的深层特征，其输入来自较深层网络，

表示第三分支中f_e ⁿ的下采样特征。由于低级特征图f_e ^n-1包含目标精细的细节特征，因此f_e ^n-1非常适合网络学习目标的边缘和纹理信息；高级特征/>

具有很大的感受野并且包含丰富的高级语义特征，因此/>

很适合网络区分目标与背景噪声；中级特征f_e ⁿ既包含部分细节特征又具有较少的背景噪声。

用

表示第n个多尺度特征补偿模块第一分支的第j个残差卷积模块，/>

表示第n个多尺度特征补偿模块第二分支的第j个残差卷积模块，/>

表示第n个多尺度特征补偿模块第三分支的第j个残差卷积模块，/>

表示第n个多尺度特征补偿模块第一分支的特征提取，/>

表示第n个多尺度特征补偿模块第二分支的特征提取，/>

表示第n个多尺度特征补偿模块第三分支的特征提取，分别定义为：

多尺度特征补偿模块通过从不同层提取特征来不断补偿中层特征，用M^n,q表示第n个多尺度特征补偿模块第q次三个分支进行相加(element-wise add)后的特征，这一过程可以被描述为以下方程：

其中，M^n,1表示第n个多尺度特征补偿模块第一次三个分支的合并特征，作为经过第一次特征补偿后的中级特征，M^n,2表示第n个多尺度特征补偿模块第二次三个分支的合并特征，作为经过第二次特征补偿后的中级特征，M^n,3表示第n个多尺度特征补偿模块第三次三个分支的合并特征，作为多尺度特征补偿模块的输出。在本发明中，浅层特征f_e ^n-1为第n个卷积层的输入，深层特征f_e ⁿ为第n个卷积层的输出，此处卷积层进行的是下采样操作，多尺度特征补偿模块用来提取的是下采样操作前后的浅层和深层特征，并利用浅层特征对深层特征补偿细节特征，因此多尺度特征补偿模块补偿了下采样操作中丢失的目标特征，使细节特征传播到网络的最深部分。

参照图4，对本发明实施例采用的残差卷积模块做进一步的描述。

两个大小均为3*3空洞卷积层顺次连接成对，形成一个空洞卷积块，共有三个空洞卷积块，膨胀率分别设置为1、2和3，以嵌套的方式排列这三个空洞卷积块，可以看作是多个残差连接方式，具体地，第五卷积层和第六卷积层顺次连接成对，第七卷积层和第八卷积层顺次连接成对，第九卷积层和第十卷积层顺次连接成对，第五卷积层的输入端与第六卷积层的输出端相加连接(element-wise add)，第七卷积层的输入端与第八卷积层的输出端相加连接(element-wise add)，第九卷积层的输入端与第十卷积层的输出端相加连接(element-wise add)后再与第五卷积层、第七卷积层、第九卷积层的输入端相加连接(element-wise add)。此残差连接方式的空洞卷积块可以扩大感受野以获取更多的多尺度上下文信息，同时不改变图像输出特征图的尺寸，保留分辨率。

参照图5，对本发明实施例采用的门控增强模块做进一步的描述。

所述门控增强模块具体来说，首先，由于较深层特征的背景噪声较小，则利用深层特征，使其经过平均池化层和最大池化层去除冗余信息，保留目标特征，再经过卷积层和Sigmoid激活层，得到取值范围为(0,1)的深层纯目标特征图，然后利用该深层纯目标特征作为门控单元来抑制中层特征中的大部分噪声，即深层纯目标特征图与中层特征图进行逐元素相乘，得到中层纯目标特征，最后利用具有精细的细节特征的浅层特征增强中层纯目标特征图中的目标特征，即中层纯目标特征图与浅层特征图进行逐元素相加，得到具有高信噪比的特征，这个过程可以表述为:

F_kernel＝σ(Conv(Max(F_high),Avg(F_high))) (7)

F_purity＝F_kernel×F_mid (8)

F_HSNR＝F_purity+F_low (9)

其中Max(·)，Avg(·)，Conv(·)和σ(·)分别代表最大池化层，平均池化层，卷积层和Sigmoid激活层。F_kernel表示深层纯目标特征，F_high表示深层特征，F_mid表示中层特征，F_purity表示中层纯目标特征，F_low表示浅层特征，F_HSNR表示具有高信噪比的特征。在本发明中，此处浅层特征为第二个转置卷积层输入的特征，中层特征为第三个转置卷积层输入的特征，深层特征为第N个转置卷积层输出的特征；在本发明实施例中，此处浅层特征为第二个转置卷积层输入的特征，中层特征为第三个转置卷积层输入的特征，深层特征为第三个转置卷积层输出的特征。

(3)对小目标检测模型O进行迭代训练：

(3a)初始化迭代次数为t，最大迭代次数为T＝2000，第t次迭代的小目标检测模型O_t中的权值、偏置参数分别为w_t、b_t，并令t＝0，O_t＝O；

(3b)将从训练样本集R₁中随机有放回的选取32个训练样本作为小目标检测模型O的输入进行前向传播：

(3b1)第一卷积层对训练样本进行下采样，得到下采样特征图x₁，第二卷积层对下采样特征图x₁进行下采样，得到下采样特征图x₂，第三卷积层对下采样特征图x₂进行下采样，得到下采样特征图x₃；

(3b2)第一多尺度特征补偿模块利用训练样本对下采样特征图x₁进行特征补偿，得到特征补偿特征图x₄，第二多尺度特征补偿模块利用下采样特征图x₁对下采样特征图x₂进行特征补偿，得到特征补偿特征图x₅，第三多尺度特征补偿模块利用下采样特征图x₂对下采样特征图x₃进行特征补偿，得到特征补偿特征图x₆；

(3b3)第一转置卷积层对特征补偿特征图x₆进行上采样，得到上采样特征图x₇，上采样特征图x₇与特征补偿特征图x₅行逐元素相加，得到加和特征图x₈，第二转置卷积层对加和特征图x₈进行上采样，得到上采样特征图x₉，上采样特征图x₉与特征补偿特征图x₄进行逐元素相加，得到加和特征图x₁₀，第三转置卷积层对加和特征图x₁₀进行上采样，得到上采样特征图x₁₁；

(3b4)门控增强模块对利用加和特征图x₈和上采样特征图x₁₁对加和特征图x₁₀进行去除背景信息和增强目标特征，得到特征图x₁₂，具体地，上采样特征图x₁₁去除冗余信息得到深层纯目标特征图x'₁₁，深层纯目标特征图x'₁₁和加和特征图x₁₀进行逐元素相乘得到中层纯目标特征图x'₁₀，中层纯目标特征图x'₁₀和加和特征图x₈进行逐元素相加，得到具有高信噪比的特征图x₁₂；

(3b5)预测模块对具有高信噪比的特征图x₁₂进行预测，得到32个小目标检测结果。

(3c)利用Dice损失函数L_Dice和交叉熵损失函数L_CE，并通过生成的32个小目标检测结果和与其对应的的32个标签计算O_t的损失值L_t，再通过链式法则计算L_t对权值参数ω_t及偏置参数b_t的偏导

和/>

最后根据/>

对ω_t、b_t进行更新，得到本次迭代的网络模型O_t；

(3d)判断t≥2000是否成立，若是，得到训练好的小目标检测模型O*，否则，令t＝t+1，并执行步骤(3b)；

(4)获取测试样本的小目标检测结果：

将测试样本集E₁作为训练好的小目标检测模型O*的输入进行前向传播，得到400个测试样本对应的小目标检测结果。

以下结合仿真实验，对本发明的技术效果进行说明

仿真条件、内容及结果分析：

仿真实验的硬件平台为：处理器为Intel(R)Core i9-9900K CPU，主频为3.5GHz，内存为32GB、显卡为NVIDIA GeForce RTX 2080Ti。仿真实验的软件平台为：Ubuntu 16.04操作系统，python版本为3.7，Pytorch版本为1.7.1。

使用交并比(IoU)评估指标对比专利文献“一种基于CenterNet改进的多尺度特征融合的小目标检测方法”(专利申请号：CN202211459753.X，申请公布号为CN115631400A)和本发明在测试样本上的检测准确度，现有方法小目标检测结果的交并比(IoU)为61.75％，本发明小目标检测结果的交并比(IoU)为64.87％，相较于现有技术，本发明的检测准确度有显著提高。

Claims

1.一种基于多尺度特征补偿及门控增强的小目标检测方法，其特征在于，包括以下步骤：

(1)获取训练样本集和测试样本集：

(2)构建基于多尺度特征补偿及门控增强的小目标检测模型O：

(3)对小目标检测模型O进行迭代训练：

和/>

最后根据/>

对ω_t、b_t进行更新，得到本次迭代的网络模型O_t；

(4)获取测试样本的小目标检测结果：

2.根据权利要求1所述的基于多尺度特征补偿及门控增强的小目标检测方法，其特征在于，步骤(3c)中所述的计算O_t的损失值L_t，以及对ω_t、b_t进行更新，计算、更新公式分别为：

L_t＝L_Dice+L_CE

其中，p_l表示预测输入小目标图像中每个像素属于标签类别的概率，r_l表示输入图像中每个像素的类别，ε表示修正因子，取值为在(0,0.1)的取值范围内选取的任意一个实数，其作用是防止分数的分母为零，ω_t、b_t表示O_t所有可学习参数的权值、偏置参数，w_t'、b_t'表示ω_t、b_t的更新结果，α表示学习率。