CN113408340B

CN113408340B - 基于增强型特征金字塔的双极化sar小型船只检测方法

Info

Publication number: CN113408340B
Application number: CN202110514236.7A
Authority: CN
Inventors: 周勇胜; 张飞翔; 张帆; 马飞; 尹嫱; 项德良
Original assignee: Beijing University of Chemical Technology
Current assignee: Beijing University of Chemical Technology
Priority date: 2021-05-12
Filing date: 2021-05-12
Publication date: 2024-03-29
Anticipated expiration: 2041-05-12
Also published as: CN113408340A

Abstract

本发明公开了基于增强型特征金字塔的双极化SAR小型船只检测方法，针对合成孔径雷达(SAR)图像中小型船只通常散射强度弱，在图像中仅占少量像素而导致的漏检问题，该方法设计了双极化自适应通道融合模块，通过检测结果的反馈来自动学习双极化SAR数据中两个通道融合系数，由系数加权得到融合通道输入特征提取网络。在本发明改进的注意力增强型低层特征金字塔中，降低深度网络下采样次数得到低层特征金字塔并在大尺度特征图上进行预测可以缓解小型船只在SAR图像中占据像素较少而导致特征消失问题，与此同时引入了空间与通道注意力机制。

Description

基于增强型特征金字塔的双极化SAR小型船只检测方法

技术领域

本发明涉及一种双极化自适应通道融合与注意力增强型低层特征金字塔的SAR小型船只目标检测方法，属于SAR自动目标检测技术领域。

背景技术

合成孔径雷达(Synthetic Aperture Radar，SAR)是一种基于主动式微波传感的高分辨率成像雷达，相比于被动成像的光学遥感，SAR具有全天时、全天候、不受云层遮挡等优点，可广泛的应用于环境地形调查、军事侦察、海洋监测等领域，SAR图像船只目标检测是海洋监测的一个重要技术手段。

传统的船只目标检测多是通过阈值法与手工提取特征等方法在大场景SAR图像中将船只与海面背景区分开，阈值法在不同场景SAR图像中需要根据背景信息设置不同的阈值，不具备普适性，而手工提取特征操作复杂且需要一定的先验知识，技术要求较高。随着计算机视觉的不断发展，深度学习被应用到目标检测领域，基于深度学习的目标检测方法可以根据人工标注的SAR船只数据自主学习船只目标的主要特征并更新模型的参数用于检测，目前深度学习凭借其操作简单、模型鲁棒性高等优点被广泛应用于SAR船只目标检测。

小型船只在SAR图像中散射强度通常较弱，占据的像素数较少，由于深度网络具有下采样模块，基于深度学习的方法提取到的小型船只特征有限，部分船只所占图像素过少甚至导致在下采样过程中出现特征消失。提取特征不足导致在检测过程中船只目标极易被背景杂波与近岸强目标干扰，造成大量漏检。本发明可以自适应融合双极化SAR的两个通道数据来丰富小型船只目标的特征，并引入空间注意力与通道注意力机制针对小型船只构建了一个注意力增强型低层特征金字塔来进行特征增强与特征筛选，改善了小型船只目标的漏检问题，提升了检测效果。

发明内容

本发明的主要目的是针对SAR图像中小型船只目标由于尺度较小、散射强度较弱导致的漏检问题，提供了一种基于双极化自适应通道融合与注意力增强型低层特征金字塔的SAR小型船只目标检测方法。本发明主要的实施对象是Sentinel-1所采集的图像，主要工作是对其进行小型船只目标检测。

本发明的技术方案具体来说，主要包括如下内容：

1.双极化自适应通道融合：极化SAR图像多个极化通道有利于深度卷积神经网络提取出更多的信息，双极化SAR图像具有VH和VV两个极化通道，将两个通道同时送入特征提取网络往往达不到最好的效果且出现特征冗余，而手动设置参数进行双通道融合需要较强的先验知识，双极化自适应通道融合通过检测结果损失的反馈来自动学习VH与VV的融合系数，通过系数加权得到融合通道输入特征提取网络。

2.低层特征金字塔：多尺度特征图根据深度的不同可分为低层特征图与高层特征图，低层特征图往往对应着定位信息，高层特征图往往对应着语义信息，特征金字塔可以有效融合低层与高层特征。针对小型船只目标尺度较小，在深度网络特征提取过程中出现特征较少甚至特征消失问题，通过降低深度网络下采样次数可以得到低层特征金字塔并在大尺度特征图上进行预测可以缓解该问题。

3.空间与通道注意力机制：注意力机制是一种资源分配机制，可以根据感兴趣目标设定不同的重要程度来分配资源，在深度神经网络中，需要分配的资源就是权重，可以通过增加感兴趣目标的权重来提升目标检测效果。空间注意力在空间范围上提取小型船只目标的显著特征，通道注意力通过通道的升降维筛选出有利于小型船只目标检测的特征通道并降低了特征冗余。

基于双极化自适应通道融合与注意力增强型低层特征金字塔的SAR小型船只检测方法，包括以下步骤：

步骤(1)剔除双极化SAR数据集中不包含船只目标的纯背景图像，并对图像进行数据增强与归一化。

为了平衡正负样本的数量并减少训练时间，需要将已标注数据中的纯背景切片剔除，原数据共9000张切片，经过背景剔除的得到数据切片共1859张，每张切片的大小都为800×800像素，为了训练出的深度模型更具有鲁棒性，需要进行数据增强，通过随机裁剪、旋转、反转等增强方式提升模型的旋转不变性，通过增加椒盐噪声提升模型的抗干扰能力。

数据归一化有利于深度网络的学习，VH与VV单通道输入图像每个像素的取值范围都是0～255之间，为了减轻深度网络学习压力，需要将每个像素按照原始比例归一化到0～1之间，归一化方式如下：

式中P_xy代表在图像中像素坐标为(x,y)的点对应的灰度值大小。

步骤(2)构建双极化通道自适应融合模块。

双极化SAR数据相对单极化具有类似的空间分辨率但增加了一个极化维度的信息。与传统人工手动设置双极化通道融合参数相比，双极化通道自适应融合模块可以在训练过程中可以针对VH和VV通道学习两个权重参数，如式(1)，其中λ₁为VH通道学习到的权重，λ₂为VV通道设置的权重，I_adapt为最终的输入，其中λ₁+λ₂＝1。

I_adapt＝λ₁×VH+λ₂×VV

双极化自适应通道融合模块整体结构如图1所示，其中Softmax用于将λ₁和λ₂归一化到0～1之间，且λ₁+λ₂＝1。Softmax可以将多个神经元的输出，映射到(0,1)区间内，能够看成概率，假定一个数组V，V_i表示其中第i个元素，那么这个元素的Softmax值S_i计算方式如下：

其中j为所有元素个数。

步骤(3)构建注意力增强型低层特征金字塔模块。

小型船只检测网络整体结构如图2所示，其中右下部分为注意力增强型特征金字塔模块，包含了低层特征金字塔结构、空间注意力模块以及通道注意力模块。

为了减少计算量并增大感受野，特征提取网络通常需要进行32倍降采样，然而小型船只经过32倍降采样，特征图中对应的特征极少甚至消失，考虑到该问题，CNN特征提取模块只进行了16倍降采样来保留小型船只更多的特征，为了精确定位小型船只的中心位置，通过特征金字塔模块融合低层与高层信息并在最终融合得到的大尺度特征图上进行预测。

注意力机制是一种资源分配机制，可以根据感兴趣目标设定不同的重要程度来分配资源，在深度神经网络中，需要分配的资源就是权重，可以通过增加感兴趣目标的权重来提升目标检测效果。

S＝Conv[Maxpool3(x),Maxpool5(x),Maxpool7(x)]

C＝Sigmoid(Avepool 3(x)+Maxpool3(x))×x

结合图2与上公式所示，S为空间注意力的输出，C为通道注意力的输出，x为输入特征，Conv表示卷积操作，Maxpool3、Maxpool5、Maxpool7分别代表核为3、5、7的最大池化，Avepool3表示核为3的平均池化，sigmoid函数用于将输出限制在0和1之间，[,]表示特征拼接。

空间注意力模块将特征图经过3，5，7不同尺度的最大池化来学习船只目标的显著特征，增强大尺度特征图上小型目标的关键点信息。通道注意力模块通过最大池化与平均池化提取不同通道上关于小型船只目标的显著信息，从拼接后特征图的多通道中筛选出有助于检测相应目标的特征，在减少计算量的同时可以更好地区分小型船只目标与背景杂波和其他强散射非船目标。

步骤(4)损失函数的构建

损失函数(loss function)是用来估量模型的预测值f(x)与真实值Y的不一致程度，它是一个非负实值函数,通常使用L(Y,f(x))来表示，损失函数越小，模型的鲁棒性就越好。损失函数是经验风险函数的核心部分，也是结构风险函数重要组成部分。模型的结构风险函数包括了经验风险项和正则项。

设定输入图I∈R^W×H×1像，W为图像宽度，H为图像高度。网络输出的关键点热力图为其中R代表得到输出相对于原图的步长stride。C代表类别个数，此处只有小型船只一个目标，所以设置为1。

核心loss公式如下：

和Focal loss形式类似，α和β是超参数，N代表的是图像关键点个数。当Y_xyc＝1时，对于易分样本来说，预测值接近于1，/>就是一个很小的值，这样loss就很小，起到了矫正作用。

对于难分样本来说，预测值接近于0，/>就比较大，相当于加大了其训练的比重。

对于otherwise的情况下Y_xy用高斯核计算，如下公式所示。

x和y是对应的像素坐标，和/>是x和y的平均值，/>是方差。/>代表关键点的预测值，N是特征图中的关键点，α和β这两个超参数是用来平衡困难样本损失函数的影响，可以通过减少容易样本对损失的贡献并增加困难样本的影响力来更好地将目标与背景区分开。

图3是一个简单的高斯核示意图，纵坐标是Y_xyc，分为A区(距离中心点较近，但是值在0-1之间)和B区(距离中心点很远接近于0)。对于A区来说，由于其周围是一个高斯核生成的中心，Y_xyc的值是从1慢慢变到0。对于B区来说，的预测值理应是0，如果该值比较大比如为1，那么/>作为权重会变大，惩罚力度也加大了。如果预测值接近于0，那么/>会很小，让其损失比重减小。对于(1-Y_xyc)^β来说，B区的值比较大，弱化了中心点周围其他负样本的损失比重。

由于注意力增强型低层特征金字塔提取出的特征图空间分辨率变为原来输入图像的四分之一。相当于输出特征图上一个像素点对应原始图像的4×4的区域，这会带来较大的误差，因此引入了偏置值和偏置的损失值。设骨干网络输出的偏置值为这个偏置值用L1loss来训练：

其中p代表目标框中心点，R代表下采样倍数4，代表偏差值。

假设第k个目标，类别为C_k的目标框的表示为那么其中心点坐标位置为/>目标的长和宽大小为/> 对长和宽进行训练的是L1Loss函数：

其中是网络输出的结果。

整体的损失函数是以上三者的综合，并且分配了不同的权重。

L_det＝L_k+λ_sizeL_size+λ_offsetL_offset

式中λ_size＝0.1,λ_offsize＝1。

与现有技术相比较，本发明的双极化自适应通道融合可以充分利用双极化SAR图像的两个通道，通过参数学习得到不同权重来融合两个通道中有利于小型船只检测信息，相比于只输入VH通道漏检率降低了13.08％。降低特征金字塔下采样次数构建低层特征金字塔可以获取更高分辨率的小型船只目标特征，引入空间注意力可以在空间范围上提取小型船只目标的显著特征，引入通道注意力可以降低特征冗余，筛选出有利于小型船只目标检测的特征通道，低层特征金字塔、空间注意力机制与通道注意力机制构成了注意力增强型低层特征金字塔模块。

附图说明

图1为双极化自适应通道融合模块结构图。

图2为小型船只目标检测整体结构图。

图3为高斯核分布示意图。

图4为网络模型参数训练流程图

图5为不同算法部分检测结果对比图。

具体实施方式

以下结合附图对本发明的实施过程和实验结果做进一步的描述。

本发明实施使用的样例数据是于的2020年由电子科技大学(成都)发布由15幅大场景sentinel-1影像标注得到的LS-SSDD-v1.0数据集，提供VV和VH两种极化方式，每张大图尺寸为24000×16000像素大小，分辨率为5×20m，其中共2358只船只目标，以AIS数据与谷歌地球为参考采用Labelimg软件进行标注。数据集中标注的目标框所占像素数均小于2342，在大场景影像中均为小型目标，采用800×800大小的滑窗进行依次裁剪共得到9000张船只切片，包括大量不含船只目标的纯背景切片，该数据集主要特点为大场景、小目标、背景丰富，是一个只包含小型船只目标的SAR数据集。

具体实施步骤如下所示：

步骤1、Sentinel-1数据的预处理。

本为了平衡正负样本的数量并减少训练时间，将纯背景切片剔除，原数据切片中前6000张影像经过背景剔除得到1123张切片作为训练集，后3000张经过背景剔除得到736张切片作为测试集，经过背景剔除的数据切片共1859张。之后再将数据集图像中的每个像素点的像素值都除以255，把图像的像素值归一化到0～1之间。

步骤2、设定网络具体参数。

1)特征提取网络结构参数

特征提取模块结构参考了Resnet-18，并做了一些细节的调整来适应数据。针对输入维度为800×800×1的灰度图像，首先使用64个尺寸为7×7的卷积滤波器来增加其通道数并进行滤波。此处采用了先在特征图四周填充零再进行卷积操作的方式，来保证输出特征图的尺寸不变而通道数增多。

网络的中间部分由3个具有相似结构的残差卷积模块堆叠而成，每个模块中包含2个残差结构，经过每个模块后的输出维度显示在表1中。

表1特征提取网络参数的设置

2)特征金字塔模块结构参数

特征金字塔模块包括特征融合与注意力机制，特征融合模块是将两组尺度大小相同的特征图进行通道维度方向的拼接，拼接之后尺度大小不变，通道维度为二者原始通道维度相加，高层与低层特征图的特征融合需要高层特征图进行参数为2的上采样，通道维数不变。

注意力机制中，空间注意力包括3个Maxpooling模块，池化尺度分辨设置为3、5、7。通道注意力包括一个Maxpooling模块和一个Avepooling模块，尺度都设置为3。

3)损失函数和优化器的参数设定

优化器采用的是随机梯度下降(SGD)，学习率lr设置值为0.001，动量Momentum设置为0.9，weight decay设置为5e-4。在训练的过程中，每隔100个epoch完整训练后就将学习率降低为原来的一半，参考Focal loss的参数设置，分类损失函数中α和β分别设置为2和4。

4)其他参数

设置训练次数为250个epoch，由于单张图片大小为800×800，防止占用显存过大，设置batch size为4。

步骤3、训练网络模型

通过以上步骤将数据和网络结构都准备好后，接下来便可以开始训练网络模型。数据是按照批次(batch)的形式被输入网络，单个批次中的每个样本数据都是以并行的形式在网络中计算传递。一个批次的训练相当于一次迭代(iteration)，当所有的训练数据都在网络中训练过一遍后即为完成一轮(epoch)迭代。训练前会先设定最大的训练轮数，每完成一轮迭代后会利用当前的模型参数对验证集进行一次测试，并记录下验证集的测试精度，每当出现更好的验证结果时就将当前网络模型保存下来。

网络模型参数的训练过程如图4流程所示，具体步骤如下：

(1)对网络的参数进行初始化。

(2)开始进行一轮迭代。

(3)对训练数据进行打乱并按照批次大小M划分出N个批次(数据量小于等于M×N)。

(4)把一个批次的数据输入进网络中，经过网络的前向计算得到输出结果，再通过总的损失函数得到本次迭代的损失。

(5)通过梯度求导的链式法则，将损失反向传播到网络的每一层得到该层权重W和偏置b的梯度。

(6)最后再通过SGD优化函数更新网络参数。

(7)回到步骤(4)进行下一个批次的迭代，直到所有的批次全都完成计算即为完成一轮迭代。

(8)用此刻的模型对验证集的数据进行测试，并记录结果。

(9)返回步骤(2)，直到达到设定的最大的训练轮数。

步骤4、结果预测与验证

对照小型船只检测算法整体结构图2，结果预测过程伪代码如下：

为了验证本发明方法在SAR小型船只目标数据集上的表现，针对LS-SSDD-v1.0数据集进行结果验证并与其他常用算法进行对比，除此之外对双极化自适应通道融合模块与增强型特征金字塔模块进行消融实验。

表2本发明方法与其他常用算法结果对比

方法	准确率	召回率	AP@0.5	测试集检测时间
					CascadeR-CNN	57.68％	77.04％	69.90％	72.63s
YOLOv4	70.69％	70.70％	70.70％	36.44s
					CenterNet	69.26％	59.85％	59.85％	46.49s
本发明方法	67.92％	80.40％	71.76％	31.68s

表2中展示了本发明的实验结果以及其他一些检测方法，其中时间是检测736个图像切片的总时间(800×800像素)。部分结果对比如图5所示，本发明方法在召回率，AP和时间指标上优于其他方法，准确率指标低于YOLOv4和CenterNet，但这是可以接受的，因为召回率指标在小型船只目标检测中比其他几个指标更重要。

表3双极化自适应通道融合模块消融实验

表3中λ₁＝0，λ₂＝1代表单VV通道输入，λ₁＝1，λ₂＝0代表单VH通道输入，由表中结果可知，相比于单通道输入SAR数据与手工设置融合参数，自适应融合可以有效提升召回率指标，减少小型船只目标的漏检。

表4注意力增强型低层特征金字塔模块消融实验

表4中，相比于特征金字塔，低层特征金字塔保留了更多的小型船只特征，可有效提升准确率、召回率与AP指标。在特征金字塔的基础上增加了注意力机制之后召回率与AP指标得到了提升，但是准确率略有降低，结合了注意力机制与低层特征金字塔之后，准确率、召回率与AP指标均得到有效提升，不仅减少了漏检，还降低了虚警，进一步证明了本发明方法的有效性。

Claims

1.基于增强型特征金字塔的双极化SAR小型船只检测方法，其特征在于：包括以下步骤：

步骤(1)剔除双极化SAR数据集中不包含船只目标的纯背景图像，并对图像进行数据增强与归一化；

将每个像素按照原始比例归一化到0～1之间，归一化方式如下：

式中P_xy代表在图像中像素坐标为(x,y)的点对应的灰度值大小；

步骤(2)构建双极化通道自适应融合模块；

双极化通道自适应融合模块在训练过程中针对VH和VV通道学习两个权重参数，λ₁为VH通道学习到的权重，λ₂为VV通道设置的权重，I_adapt为最终的输入，其中λ₁+λ₂＝1；

I_adapt＝λ₁×VH+λ₂×VV

双极化自适应通道融合模块整体结构中，Softmax用于将λ₁和λ₂归一化到0～1之间，且λ₁+λ₂＝1；Softmax将多个神经元的输出，映射到(0,1)区间内，能够看成概率，假定一个数组V，V_i表示其中第i个元素，那么这个元素的Softmax值S_i计算方式如下：

其中j为所有元素个数；

步骤(3)构建注意力增强型低层特征金字塔模块；

小型船只检测网络整体结构中的注意力增强型特征金字塔模块，包含低层特征金字塔结构、空间注意力模块以及通道注意力模块；

为减少计算量并增大感受野，特征提取网络进行32倍降采样，然而小型船只经过32倍降采样，CNN特征提取模块进行降采样来保留小型船只更多的特征；通过特征金字塔模块融合低层与高层信息并在最终融合得到的大尺度特征图上进行预测，以精确定位小型船只的中心位置；

S＝Conv[Maxpool3(x),Maxpool5(x),Maxpool7(x)]

C＝Sigmoid(Avepool 3(x)+Maxpool3(x))×x

S为空间注意力的输出，C为通道注意力的输出，x为输入特征，Conv表示卷积操作，Maxpool3、Maxpool5、Maxpool7分别代表核为3、5、7的最大池化，Avepool3表示核为3的平均池化，sigmoid函数用于将输出限制在0和1之间，[,]表示特征拼接；

空间注意力模块将特征图经过3，5，7不同尺度的最大池化来学习船只目标的显著特征，增强大尺度特征图上小型目标的关键点信息；

步骤(4)损失函数的构建

设定输入图I∈R^W×H×1像，W为图像宽度，H为图像高度；网络输出的关键点热力图为其中R代表得到输出相对于原图的步长stride；C代表类别个数，此处只有小型船只一个目标，所以设置为1；

核心loss公式如下：

和Focal loss形式类似，α和β是超参数，N代表的是图像关键点个数；

对于otherwise的情况下Y_xy用高斯核计算，如下公式所示；

x和y是对应的像素坐标，和/>是x和y的平均值，/>是方差；/>代表关键点的预测值，N是特征图中的关键点，α和β这两个超参数是用来平衡困难样本损失函数的影响，通过减少容易样本对损失的贡献并增加困难样本的影响力来更好地将目标与背景区分开。

2.根据权利要求1所述的基于增强型特征金字塔的双极化SAR小型船只检测方法，其特征在于：步骤(4)中，引入偏置值和偏置的损失值，设骨干网络输出的偏置值为这个偏置值用L1 loss来训练：

其中p代表目标框中心点，R代表下采样倍数4，代表偏差值；

假设第k个目标，类别为C_k的目标框的表示为那么其中心点坐标位置为/>目标的长和宽大小为/> 对长和宽进行训练的是L1 Loss函数：

其中是网络输出的结果；

整体的损失函数是以上三者的综合，并且分配了不同的权重；

L_det＝L_k+λ_size L_size+λ_offset L_offset

式中λ_size＝0.1,λ_offsize＝1。