CN116403115A

CN116403115A - 一种大幅面遥感影像目标检测方法

Info

Publication number: CN116403115A
Application number: CN202310668054.4A
Authority: CN
Inventors: 梁北大; 李翔; 陈云龙; 王洪辉; 魏霞; 李锟
Original assignee: Jiangxi Woodpecker Bee Technology Co ltd
Current assignee: Jiangxi Woodpecker Bee Technology Co ltd
Priority date: 2023-06-07
Filing date: 2023-06-07
Publication date: 2023-07-07
Anticipated expiration: 2043-06-07
Also published as: CN116403115B

Abstract

本发明提供了一种大幅面遥感影像目标检测方法，涉及图像数据处理技术领域；该方法包括以下步骤：S10、对输入图像进行数据增强处理；S20、在卷积神经网络中，通过引入通道注意力机制和空间注意力机制，得到具有通道注意力机制和空间注意力机制的特征图；S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中，生成具有不同分辨率的特征图；在低分辨率的特征图上得到目标的粗略位置，根据得到的粗略位置在高分辨率的特征图上进行搜索，找出目标在高分辨率特征图的位置；在高分辨率特征图的基础上丢弃背景信息，构建新的高分辨率特征图并参与回归损失计算；本发明能解决遥感图像的背景复杂，目标较小的问题。

Description

一种大幅面遥感影像目标检测方法

技术领域

本发明涉及图像数据处理技术领域，更具体的说，本发明涉及一种大幅面遥感影像目标检测方法。

背景技术

现有的目标检测器，如YOLO系列对常规的图像的检测步骤为，首先对图像整体在骨干网络进行特征提取，然后经过neck部分得到不同尺度的特征图，最后使用不同尺度的特征图进行分类和定位的损失回归，从而达到良好的检测效果。针对对小尺度目标检测的常用解决方案是：1、扩增分辨率；2、数据增强、重采样；3、结合上下文信息；4、多尺度感知训练。

其中提升小目标的检测精度最常见的方案是使用更高分辨率的特征图，但是由于图像和特征尺寸的增加使计算成本成正比增长，因此这两种方法都导致了更高的计算成本。

与传统的目标检测目标不同，遥感图像具有特殊性。首先背景复杂度高，航空遥感图像视野比较大（通常有数平方公里的覆盖范围），视野中可能包含各种各样的背景，会对目标检测产生较强的干扰。其次是尺度多样性，航空遥感图像可从几百米到近万米的高度进行拍摄，且地面目标即使是同类目标也大小不一，如港口的轮船大的有300多米，小的却只有数十米。因此当使用目前目标检测器对大幅面遥感影像进行检测时，不仅耗费的计算资源较多，且对于特殊的遥感目标检测的精度存在一定的缺陷。

发明内容

为了克服现有技术的不足，本发明提供一种大幅面遥感影像目标检测方法，解决遥感图像背景复杂、目标较小的问题。

本发明解决其技术问题所采用的技术方案是：一种大幅面遥感影像目标检测方法，其改进之处在于，该方法包括以下步骤：

S10、对输入图像进行数据增强处理，其处理方式包括单样本数据增强和多样本数据增强；

S20、在卷积神经网络中，通过引入通道注意力机制和空间注意力机制，得到具有通道注意力机制和空间注意力机制的特征图；

S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中，生成具有不同分辨率的特征图；

在低分辨率的特征图上得到目标的粗略位置，根据得到的粗略位置在高分辨率的特征图上进行搜索，找出目标在高分辨率特征图的位置；

在高分辨率特征图的基础上丢弃背景信息，构建新的高分辨率特征图并参与回归损失计算。

进一步的，步骤S10中，通过对数据进行增强处理，以提高模型的泛化能力。

进一步的，步骤S10中，单样本数据增强包括对输入图像进行尺度变换、随机翻转、色域增强、随机旋转以及填充的处理。

进一步的，步骤S10中，多样本数据增强包括对经过单样本数据增强得到的图像依次进行Mosaic增强、仿射变换、随机尺寸裁剪以及Mixup融合的处理，并实现处理后图像的输出。

进一步的，步骤S20中，引入通道注意力机制包括：

对输入的特征图分别经过最大池化层和平均池化层后，再将其输出的特征通过共享的多层感知机进行进一步提取，最后相加得到具有通道注意力机制的特征图。

进一步的，引入通道注意力机制的计算结果如下：

；

其中，

为具有通道注意力机制的特征图，/>

表示sigmoid函数，MLP为多层感知机，F为输入的特征图，AvgPool代表平均池化，MaxPool代表最大池化，/>

代表平均池化特征，/>

代表最大池化特征，/>

和/>

是共享MLP的权重；

引入通道注意力机制的输出特征图

的计算公式如下：

；

其中，

表示逐元素乘法。

进一步的，步骤S20中，引入空间注意力机制包括：在通道维度对输入特征图进行平均池化和最大池化，将其产生的特征图进行拼接，并在拼接的特征图上使用卷积操作来产生具有空间注意力的特征图。

进一步的，引入空间注意力机制的计算公式如下：

；

其中，

为具有空间注意力机制的特征图，/>

表示sigmoid函数，AvgPool代表平均池化，MaxPool代表最大池化，/>

表示滤波器大小为7 × 7的卷积运算，/>

代表平均池化特征，/>

代表最大池化特征；

融合了通道注意力机制和空间注意力机制的输出特征图

如下：

；

其中，

是经过通道注意力输出的特征图，/>

是输入为/>

的空间注意力机制的特征图，/>

表示逐元素乘法。

进一步的，步骤S30中，经特征化图像金字塔FPN输出的特征图P_i具有不同的分辨率，其中i表示特征图的层数，当i大于等于3时，将该层特征图定义为低分辨率的特征图，当i小于等于2时，将该层特征图定义为高分辨率的特征图。

进一步的，步骤S30中，包括以下步骤：

S301、所述FPN层输出不同等级的特征图为

，/>

为不同等级的特征图，其中l表示金字塔等级，/>

表示特征图的维度，H′等于/>

，W′等于

，H、W、C分别表示输入图片的高、宽、类别数量；

S302、通过增加一个搜索检测器，该搜索检测器的输入为低分辨率的特征图，输出热图

和/>

，其中/>

，/>

表示热图的维度，/>

表示深度神经网络（i,j）包含小目标的概率；

其中，对于一个目标，通过计算其中心位置与特征图上每个位置之间的距离，得到目标的位置信息，同时将距离小于设定值

的目标定义为小目标；

S303、对于

高于阈值的热图认为包含小目标，将热图中的小目标的位置信息带入下一级的高分辨率特征图，下一级的高分辨率特征图只关注热图中的小目标的位置信息，并参与后续的分类和定位回归损失计算。

本发明的有益效果是：本发明提供了一种大幅面遥感影像目标检测方法，针对大幅面遥感图像背景复杂、尺度多样的特点，在提取特征时使用搜索机制先对图像中目标位置进行搜索得到粗略定位，然后使用由粗略位置稀疏引导的高分辨率特征计算准确的检测结果，且引入空间和通道注意力，充分提取特征，从而解决遥感图像的背景复杂，目标较小的问题。

附图说明

图1为本发明中关于数据增强的原理框图。

图2为本发明中通道注意力机制的原理框图。

图3为本发明中空间注意力机制的原理框图。

图4为本发明中搜索机制的原理框图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述，以充分地理解本发明的目的、特征和效果。显然，所描述的实施例只是本发明的一部分实施例，而不是全部实施例，基于本发明的实施例，本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例，均属于本发明保护的范围。另外，专利中涉及到的所有联接/连接关系，并非单指构件直接相接，而是指可根据具体实施情况，通过添加或减少联接辅件，来组成更优的联接结构。本发明创造中的各个技术特征，在不互相矛盾冲突的前提下可以交互组合。

本发明提供了一种大幅面遥感影像目标检测方法，在本实施例中，该方法包括以下步骤：

S10、对输入图像进行数据增强处理，其处理方式包括单样本数据增强和多样本数据增强；通过对数据进行增强处理，以提高模型的泛化能力。

参照图1所示，本实施例中，单样本数据增强包括对图像进行尺度变换、随机翻转、色域增强、随机旋转以及填充等操作；并且，多样本数据增强采用Mosaic增强和Mixup融合得到增强后的图像，本实施例中，输入图像经过单样本数据增强后，依次进行Mosaic增强、仿射变换以及随机尺寸裁剪，得到的图像进行Mixup融合，并进行输出。

深度神经网络中卷积层的特征包含很多对于图像检测无用的信息，因此为了使得检测效果得到提升，从而在网络中引入了注意力机制。注意力机制，是对输入进行加权再输出，希望网络关注到的地方给较大的权重，不希望网络注意的地方给较小的权重。

在给定一张特征图，融合通道和空间注意力模块能够序列化地在通道和空间两个维度上产生注意力特征图信息，然后两种特征图信息在与之前原输入特征图进行相乘进行自适应特征修正，产生最后的特征图，此特征图融合通道和空间的特征具有更多的有用特征。

在本实施例中，参照图2所示，步骤S20中，引入通道注意力机制包括：对输入的特征图分别经过最大池化层和平均池化层后，再将其输出的特征通过共享多层感知机进行进一步提取，最后相加得到具有通道注意力机制的特征图

，计算公式如下：

；

其中，

为具有通道注意力机制的特征图，/>

代表平均池化特征，/>

代表最大池化特征，/>

和/>

是共享MLP的权重；

引入通道注意力机制输出的特征图

的计算公式如下：

；

其中，

表示逐元素乘法。

参照图3所示，步骤S20中，引入空间注意力机制包括：在通道维度进行平均池化和最大池化，将其产生的特征图进行拼接，并在拼接的特征图上使用卷积操作来产生空间注意力特征图

，计算公式如下：

；

其中，

为具有空间注意力机制的特征图，/>

表示滤波器大小为7 × 7的卷积运算，/>

代表平均池化特征，/>

代表最大池化特征；

最后融合了通道注意力机制和空间注意力机制的输出特征图

如下：

；

其中，

是经过通道注意力输出的特征图，/>

是输入为/>

的空间注意力机制的特征图，/>

表示逐元素乘法。

S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中，生成一系列具有不同分辨率的特征图；在低分辨率的特征图上得到目标的粗略位置，根据得到的粗略位置在高分辨率的特征图上进行搜索，找出目标在高分辨率特征图的位置；在高分辨率特征图的基础上丢弃背景信息，构建新的高分辨率特征图并参与回归损失计算。

在本实施例中，特征化图金字塔FPN中，从查询起始层开始，每个层从上一层接收一组关键位置，并应用查询来生成稀疏值特征图；稀疏检测头和稀疏查询头预测所检测到的下一层相应的比例和关键位置的框。经特征化图像金字塔FPN输出的特征图P_i具有不同的分辨率，其中i表示特征图的层数，当i大于等于3时，将该层特征图定义为低分辨率的特征图，当i小于等于2时，将该层特征图定义为高分辨率的特征图。

本实施例中，参照图4所示，采用特征化图像金字塔FPN对特征图进行处理；所述步骤S30中，特征图被送入特征化图像金字塔FPN内，生成一系列具有不同大小的特征图

，/>

为不同等级的特征图，其中l表示金字塔等级，/>

表示特征图的维度，H′等于/>

，W′等于/>

，H、W、C分别表示输入图片的高、宽、类别数量；金字塔等级低的特征图尺寸更大，即所说的高分辨率特征图，包含更多的特征信息，但是使用高分辨率特征图会带来计算量也会成倍增长；因此先在低分辨率的特征图上预测小目标的粗略位置。

本实施例中，通过增加一个搜索检测器，该搜索检测器的输入为低分辨率的特征图，输出热图

和/>

，其中/>

，/>

表示热图的维度，/>

表示深度神经网络（i,j）包含小目标的概率，R为实数集。对于一个目标，我们通过计算其中心位置（x,y）与特征图上每个位置之间的距离得到其位置信息，同时将距离小于设定值/>

的目标定义为小目标。对于/>

高于阈值的热图认为包含小目标，将热图中的小目标的位置信息带入下一级的高分辨率特征图，下一级的高分辨率特征图只关注热图中的小目标的位置信息，并参与后续的分类和定位回归损失计算，节省了大量的计算量。

在上述的实施例中，在基于FPN的检测器中，经过FPN层输出的不同尺度的特征图，而小目标的信息更多的在高分辨率的金字塔等级低的特征图中，但是低层特征的计算是高度冗余，在大多数情况下，小物体的空间分布非常稀疏，仅占据高分辨率特征图的一小部分，因此浪费了大量计算。因此先在低分辨率的特征图上得到目标的粗略位置，根据得到的位置在高分辨率的特征图上进行搜索，找出在高分辨率特征图的位置，在高分辨率特征图的基础上丢弃无用的背景信息，构建新的高分辨率特征图参与之后的回归损失。这种搜索方式不仅可以收获高分辨率特征图的好处，而且还可以避免对背景区域进行无用的计算。

本发明提供了一种基于搜索机制的大幅面遥感影像目标检测方法，针对大幅面遥感图像背景复杂、尺度多样的特点，在提取特征时使用搜索机制先对图像中目标位置进行搜索得到粗略定位，然后使用由粗略位置稀疏引导的高分辨率特征计算准确的检测结果，且引入空间和通道注意力，充分提取特征，从而解决遥感图像的背景复杂，目标较小的问题。本发明能够快速、准确的检测出大幅面遥感影像目标，为民用领域的无人机遥感影像的检测提供了一个可行的技术方案。

本发明的一种大幅面遥感影像目标检测方法，采用了基于深度学习的目标检测模型，融合一种搜索机制对大幅面遥感图像进行精准快速检测。其优势包括：（1）基于深度学习的目标检测模型能提取出大幅面遥感影像中关键帧图像中的有效特征；（2）融合一种新颖的搜索机制，使在提取大幅面图像特征时能够在复杂的背景下搜索到需要检测目标的粗略位置，从而突出提取检测目标的特征；（3）利用搜索机制可以减少对复杂背景的特征的提取，降低了计算成本从而提高了检测的速度；（4）引入空间和通道注意力机制模块，在提取特征时考虑对空间和通道的特征之间的关联从而充分提取特征；针对大幅面遥感影像中的复杂背景和检测目标在图像中占比较小等问题，本发明提供了一种基于搜索机制的大幅面遥感影像目标检测方法，能够准确快速的对目标进行定位检测。

以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。