CN114529836B

CN114529836B - 一种sar图像目标检测方法

Info

Publication number: CN114529836B
Application number: CN202210170355.XA
Authority: CN
Inventors: 陈杰; 冯运; 万辉耀; 夏润繁; 黄志祥; 刘小平; 孙晓晖; 邬伯才; 姚佰栋
Original assignee: CETC 38 Research Institute; Anhui University
Current assignee: CETC 38 Research Institute; Anhui University
Priority date: 2022-02-23
Filing date: 2022-02-23
Publication date: 2022-11-08
Anticipated expiration: 2042-02-23
Also published as: CN114529836A

Abstract

本发明提供一种SAR图像目标检测方法，包括：为了解决SAR目标轮廓不清晰和多尺度问题，所述SAR图像目标检测网络的基准网络采用YOLOX网络，引入了无锚框的检测框架，在此基础上对其骨干网络进行了重新的轻量化设计，即NLCNet网络，包括对网络尾部的SE模块进行了删除，并对深度可分离卷积进行了重新的堆叠，同时在网络尾部使用了大的卷积核，从而获取图像的全局信息；针对SAR目标的强散射特性，在骨干网络中设计了一种新的位置注意力机制，细节是在不同空间方向上，将SE模块的全局池化操作替换为两个一维池化操作，形成两个独立的分支，能够更好的在通道注意力中添加位置信息来抑制背景杂波，从而更加准确的识别和定位目标；该方法具有较快的检测速度和精度。

Description

一种SAR图像目标检测方法

技术领域

本发明涉及目标检测技术领域，具体涉及一种SAR图像目标检测方法。

背景技术

合成孔径雷达(SAR)是捕获合成孔径雷达(SAR)图像的主要手段，具有全天候、全天时的特点，且不受天气或其他成像特性的影响。随着工具、信息和技术的快速更新，可以获得大量的SAR图像。由于SAR成像的图像特殊性，人工解译费时费力，大量数据没有得到充分利用。SAR图像目标检测是一种从图像中自动定位和识别特定目标的技术，在现实生活中具有广泛的应用前景。例如，在军事领域，对特定军事目标的位置进行检测有利于战术部署同时也可以提高预警能力。在民用领域，可以在海上发现一些走私和非法渔船，有助于对海上运输的监测和管理。

详细研究发现，目前的SAR目标检测任务仍存在以下问题需要解决:

(1)现有的SAR图像检测算法主要是基于锚框的设计。然而，锚框超参数的设置很大程度上依赖于人类的经验，生成的锚框大大降低了模型的训练速度。此外，锚框检测算法多侧重于目标边缘信息的捕获，而SAR图像轮廓信息不清晰，尤其是中小型SAR目标，极大地限制了其检测效率。

(2)为了进一步提高精度，大多数现有的算法盲目增加了模型结构和最新技术，导致了大量的模型参数，在实际应用中，这样的算法推理速度慢、效率低下，不利于在移动设备上的部署模型，大大降低了模型的实用性。

(3)现有工作没有考虑SAR图像的散射和目标轮廓不清晰的问题，导致算法无法更好地抑制背景杂波，强调目标的显著信息，大大降低了模型性能。

为此，本发明提出一种SAR图像目标检测方法。

发明内容

为解决上述问题，本发明提供一种SAR图像目标检测方法，该方法可以更好的平衡SAR目标检测的精度和速度。

本发明提供了如下的技术方案。

一种SAR图像目标检测方法，包括以下步骤：

获取待检测的SAR图像；

构建SAR图像目标检测网络；所述SAR图像目标检测网络的基准网络采用YOLOX网络，引入无锚框的检测框架；对所述SAR图像目标检测网络的骨干网络进行轻量化设计，更改为基于LCNet网络的NLCNet网络；

其中，所述NLCNet网络的尾部的SE模块删除，并对所述NLCNet网络的深度可分离卷积进行重新的堆叠，所述NLCNet网络尾部的卷积核大于原LCNet网络；在所述骨干网络中引入位置增强注意力机制；

将获取待检测的SAR图像输入至训练后的SAR图像目标检测网络中，获得SAR图像的目标检测结果。

优选地，所述位置增强注意力机制，包括以下步骤：

输入特征图X，在垂直和水平两个方向上进行两个一维全局池化，形成两个具有方向感知的独立的特征图；

将生成的两个具有特定方向信息的特征图进行编码，形成两个注意图；

将两个注意图在其空间方向上分别进行卷积运算，使用卷积函数F进行变换，从而生成中间特征图；

两个中间特征图沿着空间维度通过另外两个1x1卷积变换转换为与输入特征图X具有相同通道数的张量；

将两个张量应用于位置增强注意块，输出带有位置信息的特征图。

优选地，所述两个具有方向感知的独立的特征图的获取，包括以下步骤：

池化核的空间范围为(H,1)或(1,W)，通道c在高度h处的输出表示为：

在宽度w处，通道c的输出表示为：

其中，x_c表示squeeze操作，

和

分别表示在高度h和宽度w的两个具有方向感知的独立的特征图；i∈[0,W]，j∈[0,H]。

优选地，所述中间特征图的生成，包括：

式中，δ为非线性激活函数，Bn为batchnorm操作，f^h和f^w为中间特征图。

优选地，所述两个中间特征图沿着空间维度通过另外两个1x1卷积变换转换为与输入特征图X具有相同通道数的张量，包括以下步骤：

通过另外两个1x1卷积变换F_h和F_w，沿着空间维度将f^h和f^w转换为与输入特征图X具有相同通道数的张量：

g^h＝σ(F_h(f^h))

g^w＝σ(F_w(f^w))

其中，σ为sigmoid函数；

将输出g^h和g^w应用于位置增强注意块：

式中，x_c表示注意力机制的输入特征图，y_c表示注意力机制的输出特征图。

优选地，所述NLCNet网络尾部的卷积核大小为5X5。

本发明的有益效果：

(1)针对基于锚的目标检测算法高度依赖专家经验设计的框架问题，以及解决SAR图像目标轮廓信息不清晰、背景复杂等问题的困难，本发明引入了一种无锚目标检测算法，将最新的YOLOX作为基础网络，用LCNet 取代骨干Darknet-53，然后根据SAR目标特性进行优化设计，从而更好的平衡速度和精度。

(2)为了平衡速度和模型复杂度，本发明通过深度可分离卷积模块的巧妙设计，SE模块的删除和多模块的新颖结构构造，构建了一种新的轻量级主干NLCNet，该算法大大提高了推理速度和检测精度。

(3)为了提高复杂背景下SAR目标的定位能力，本发明设计了一种位置增强注意策略，该策略是通过添加目标位置感知信息，引导注意力更好地突出目标区域，从而有效抑制SAR目标强散射导致特征提取不足的问题，更好地检测复杂背景下的目标，从而提高检测精度。

附图说明

图1是本发明实施例的整体框架图，NLCNet网络中的序号1-6表示每个block的输出特征图；

图2是本发明实施例的NLCNet骨干网络细节示意图；

图3是本发明实施例的结构对比的经典SE通道注意块和位置增强注意块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

实施例1

本发明的一种SAR图像目标检测方法，如图1-3所示，包括以下步骤：

S1：为了解决SAR目标轮廓不清晰和多尺度问题，所述SAR图像目标检测网络的基准网络采用YOLOX网络，引入了无锚框的检测框架；

在此基础上对其骨干网络进行了重新的轻量化设计，即NLCNet网络；

细节包括对网络尾部的SE模块进行了删除，并对深度可分离卷积进行了重新的堆叠，同时使用H-Swish作为NLCNet网络的激活函数；

S2：针对SAR目标的强散射特性，在骨干网络中设计了一种新的位置增强注意力机制(PEA)；

细节是在不同空间方向上，将SE模块的全局池化操作替换为两个一维池化操作，形成两个独立的分支，能够更好的在通道注意力中添加位置信息来抑制背景杂波，从而更加准确的识别和定位目标；

具体的，YOLOX是YOLO系列中第一个应用无锚模式的模型。具体操作是直接将真值框投影到特征图的中心位置的3×3区域，并定义为正样本区域，同时预测目标位置的四个数值(左上角偏移的距离以及框的高和宽)。本发明对YOLOX骨干网进行了重新设计：

现有的YOLO系列主干大多使用DarkNet-53和CSPNet架构。这样的主干在检测效果上通常很好，但在推理速度上仍有欠缺。为此，根据SAR 目标的特点，将骨干网络进行轻量型设计，即NLCNet，以更好地平衡速度和准确性。NLCNet使用深度可分离卷积作为基本块，本发明重新组织和堆叠这些区块，同时删除尾部的SE模块以及在网络尾部使用了大的卷积核，从而形成一个新的骨干网络。该网络在以下两个方面进行了改进:SE模块的删除和卷积核尺寸选择。NLCNet的结构细节如图2所示。

(1)SE模块的删除

SE模块广泛用于许多网络中。它可以帮助模型对网络中的通道进行加权以获得更好的特征。但是，我们不能盲目的在模型中加入SE模块，因为不是所有的模型添加SE模块都会更有效。本发明在LCnet的基础上，在后续的实验中去掉SE模块，模型的准确率不仅没有降低，而且模型的参数也比较小。具体细节如表1所示。

表1 NLCNet网络细节

(2)卷积核尺寸选择

有实验表明，不同大小的卷积会对网络性能产生一定的影响。卷积核越大，卷积过程中的感受野越大，越有利于构建目标的全局信息。因此，本发明选择使用较大的卷积核。实验发现，将大卷积核放置在网络的尾部是最好的选择，因为这两种方法的性能相当于替换了网络的所有层(即每层使用一个5x5的卷积核)。因此，这种替换只在网络的末端执行。通过简单的叠加， SE模块的删除和使用相应的技术的应用，本发明使用的轻量级主干在SSDD 数据集上取得了一定的精度提高，同时参数数量也明显减少。由此可见， NLCNet的优势是明显的。

本发明引入了位置增强注意力机制，它可以将目标在图像中的位置信息嵌入到通道注意中，使移动网络能够获取图像的大部分区域，从而有效地、充分地利用图像信息，同时也可以维护远程依赖关系，并且这个过程的计算开销相对较低。具体细节如图3所示。

具体的：

在通道注意中，图像中的空间信息通常可以通过全局池化操作得到，因此可以建立通道之间的联系，但在此过程中，位置信息会丢失，这是对全局信息进行压缩的结果，但是，位置信息是特征提取需要利用的一部分。为了解决这一问题，位置注意力机制在二维全局池化中进行相应的改变，将原始的通道注意分割，形成两个一维全局池化操作。具体来说，给定输入X，用两个一维全局池化操作对水平方向和垂直方向的每个通道进行编码，池化核的大小为(H,1)或(1,W)，通道c在高度H处的输出表示为：

在宽度W处，通道c的输出表示为：

其中，x_c表示squeeze操作，

和

分别表示在高度h和宽度w出的输出结果。i∈[0,W]，j∈[0,H]

通过上述变换，可以在两个空间方向上聚合输入特征，得到两个具有方向性感知特征的特征图。这两个特征映射不仅使对应的注意力模块保存特征之间的远程依赖关系，还可以在空间方向上保持准确的位置信息，从而帮助网络更准确地检测目标。

如上所述，上述两式支持一个全局的接受域，并对精确的位置信息进行编码。将两个注意图在其空间方向上分别进行卷积运算，使用卷积函数F进行变换，从而生成中间特征图：

式中，δ为非线性激活函数，Bn为batchnorm操作，f^h和f^w为中间特征图；

通过另外两个1x1卷积变换F_h和F_w，沿着空间维度将f^h和f^w转换为与输入X具有相同通道数的张量：

g^h＝σ(F_h(f^h))

g^w＝σ(F_w(f^w))

其中，σ为sigmoid函数；

将输出g^h和g^w应用于位置增强注意块：

位置注意力增强机制Position-enhanced attention考虑了空间信息的编码，如上所述，沿水平方向和垂直方向的注意力同时应用于输入张量。这种编码过程可以使Position-enhanced attention更准确地定位图像中的目标位置，从而有助于更好地识别整个模型。

本发明提出了一种新的轻量级位置增强无锚框SAR目标检测算法，其可以在保证精度的同时，提高模型推理速度，可以为SAR图像目标检测领域的研究人员提供参考价值。

以上仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。