CN113705331B

CN113705331B - 一种基于四元特征金字塔网络的sar船只检测方法

Info

Publication number: CN113705331B
Application number: CN202110775256.XA
Authority: CN
Inventors: 张晓玲; 胥小我; 王楠; 张天文; 师君; 韦顺军
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-07-08
Filing date: 2021-07-08
Publication date: 2023-12-05
Anticipated expiration: 2041-07-08
Also published as: CN113705331A

Abstract

本发明公开了一种基于四元特征金字塔网络的SAR船只检测方法，用来解决现有检测技术精度不足的问题。它主要包括准备数据集，基于变形卷积构建变形卷积FPN，基于内容感知重组特征构建特征重组FPN，基于路由聚合空间感知构建空间注意力FPN，基于平衡尺度全局注意力构建平衡尺度FPN，建立船只检测模型，测试船只检测模型和评估船只检测模型八个部分。该方法基于原始的FPN，构建了变形卷积FPN，特征重组FPN，空间注意力FPN和平衡尺度FPN，从而优化网络结构以提高准确性。在公知的SAR船只数据集(即SSDD数据集)上的实验结果表明，与其他12个先进的SAR船只检测器相比，本发明实现了最先进的SAR船只检测精度。

Description

一种基于四元特征金字塔网络的SAR船只检测方法

技术领域

本发明属于合成孔径雷达(Synthetic Aperture Radar,SAR)图像解译技术领域，涉及一种基于四元特征金字塔网络的SAR船只检测方法。

背景技术

合成孔径雷达(SAR)是一种能够全天时、全天候工作的主动式遥感技术。与光学传感器相比，SAR可以穿透云雾，在恶劣的气象条件下也可以完成观测任务。SAR已成为当今对地观测的重要手段，在地形图像生成、目标探测与侦察、国土资源勘查和自然灾害监测等国民经济得到越来越广泛的应用。特别地，SAR在海洋领域也有广泛地应用，例如海洋交通管理，海洋渔业管理，海洋环境保护，海洋灾难救援等。详见文献“张庆君,韩晓磊,刘杰.星载合成孔径雷达遥感技术进展及发展趋势[J].航天器工程,2017,26(06):1-8.”。

随着SAR成像分辨率的不断提高，SAR图像船只目标检测技术成为了研究的热点。特别的，在民用方面，SAR图像船只检测技术可以检测搜索遭遇危险的船只并展开搜救；在军用方面，SAR图像船只检测技术可以监视海面从而维护国家安全。详见文献“王智勇,窦浩,田金文.SAR图像船只目标快速检测方法研究[J].船只电子工程,2016,36(09):27-30+88.”。

目前现有的SAR图像中船只检测技术已经从不同的角度实现了良好的船只检测结果，并且具有较高的检测精度。然而，由于复杂的背景干扰(如港口设施、海杂波、易变的海洋状态等)，多尺度船只特征的差异，小型船只的特征模糊，SAR船只检测仍然是一个具有挑战性的问题。

因此，为解决上述问题，本发明提出了一种基于四元特征金字塔网络的SAR船只检测方法。该方法提出了四种特征金字塔网络(FPN)——变形卷积FPN，特征重组FPN，空间注意力FPN，平衡尺度FPN，保证了卓越的SAR图像中船只检测精度。

发明内容

本发明属于合成孔径雷达(SAR)图像解译技术领域，公开了一种基于四元特征金字塔网络的SAR船只检测方法，用来解决现有检测技术精度不足的问题。该方法主要包括准备数据集，基于变形卷积构建变形卷积FPN，基于内容感知重组特征构建特征重组FPN，基于路由聚合空间感知构建空间注意力FPN，基于平衡尺度全局注意力构建平衡尺度FPN，建立船只检测模型，测试船只检测模型和评估船只检测模型八个部分。该方法基于原始的FPN，构建了变形卷积FPN，特征重组FPN，空间注意力FPN和平衡尺度FPN，从而优化网络结构以提高准确性。在公知的SAR船只数据集(即SSDD数据集)上的实验结果表明，与其他12个先进的SAR船只检测器相比，本发明实现了最先进的SAR船只检测精度。

为了方便描述本发明的内容，首先作以下术语定义：

定义1：SSDD数据集

SSDD数据集是指SAR船只检测数据集，英文全称为SAR Ship Detection Dataset，其可以用于训练深度学习模型，用于研究人员在这个统一的数据集去评价他们算法的性能。在SSDD数据集中，一共有1160幅图像和2456艘船只平均每幅图像有2.12艘船。后续根据任务需要会增加样本个数，扩充数据集。相比于有9000多幅图像、20类目标的PASCAL VOC数据集，SSDD足够大到可以对船只这一类目标进行训练检测器。SSDD数据集可从参考文献“李健伟,曲长文,彭书娟,邓兵.基于卷积神经网络的SAR图像舰船目标检测[J].系统工程与电子技术,2018,40(09):1953-1959.”中获得。

定义2：经典的卷积神经网络方法

经典的卷积神经网络(CNN)指一类包含卷积计算且具有深度结构的前馈神经网络。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量进行特征提取。近年来，卷积神经网络在计算机视觉、自然语言处理、语音识别等领域取得了突飞猛进的发展，其强大的特征学习能力引起了国内外专家学者广泛的关注。经典的卷积神经网络方法详见文献“张索非,冯烨,吴晓富.基于深度卷积神经网络的目标检测算法进展[J/OL].南京邮电大学学报(自然科学版),2019(05):1-9.https://doi.org/10.14132/j.cnki.1673-5439.2019.05.010.”。

定义3：经典的CNN特征提取方法

经典的CNN特征提取，即通过CNN对原始输入图像进行特征提取。总而言之，原始输入图像经过不同特征的卷积操作变成了一系列的特征图。在CNN中，卷积层中卷积核在图像上不断滑动运算。同时，最大池化层负责在内积结果上取每一局部块的最大值。因此，CNN通过卷积层和最大池化层实现了图片特征提取方法。经典CNN特征提取详见网站“https://blog.csdn.net/qq_30815237/article/details/86703620”。

定义4：变形卷积

在变形卷积中，标准卷积核增强了偏移Δp_n，并在训练中自适应地学习来建模目标的形状特征，计算公式为其中，/>表示在p_n∈R条件下的求和运算符号，p₀表示初始位置，p_n表示第n个像素位置，R表示卷积区域，w(p_n)表示p_n对应的权重参数，Δp_n表示在第n个像素位置上学习到的偏移，y(p₀)表示最终输出。变形卷积详见文献“Dai,J.；Qi,H.；Xiong,Y.；Li,Y.；Zhang,G.；Hu,H.；Wei,Y.DeformableConvolutional Networks.In Proceedings of the IEEE International Conference onComputer Vision(ICCV),2017；pp.764–773.”。

定义5：卷积核

卷积核就是图像处理时，给定输入图像，输入图像中一个小区域中像素加权平均后成为输出图像中的每个对应像素，其中权值由一个函数定义，这个函数称为卷积核。卷积核的作用在于特征的抽取，越是大的卷积核尺寸就意味着更大的感受野，当然随之而来的是更多的参数。早在1998年，LeCun发布的LetNet-5模型中就会出，图像空域内具有局部相关性，卷积的过程是对局部相关性的一种抽取。卷积核设置方法详见文献“Lecun Y,BottouL,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义6：经典的卷积核尺寸设置方法

卷积核尺寸就是指卷积核的长度，宽度，深度，记为L×W×D，其中L代表长度，W代表宽度，D代表深度。设置卷积核的尺寸就是指确定L，W，D的具体数值。一般地，在达到相同感受野的情况下，卷积核越小，所需要的参数和计算量越小。具体来说，卷积核的长度和宽度必须大于1才有提升感受野的作用，而大小为偶数的卷积核即使对称地加补零操作也不能保证输入特征谱尺寸和输出特征谱尺寸不变，一般都用3作为卷积核大小。卷积核尺寸设置方法详见文献“Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learningapplied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义7：经典的卷积核步长设置方法

卷积核步长就是指每次移动卷积核的长度，记为S。设置卷积核的步长就是指确定S的具体数值。一般地，步长越大，提取特征越少；反之，提取特征越多。一般卷积层都用1作为卷积核步长，最大池化层都用2作为卷积核步长。经典的卷积核步长设置方法详见文献“Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to documentrecognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义8：经典的卷积层

卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网络能从低级特征中迭代提取更复杂的特征。经典的卷积层详见网站“https://www.zhihu.com/question/49376084”。

定义9：经典的最大池化层

最大池化层用于提取前一层网络区域内所有神经元的最大值，目的是为了在反向传播中，需要把梯度值传到对应最大值所在的位置。最大池化层能减小卷积层参数误差造成估计均值的偏移，更多的保留纹理信息。经典的最大池化层详见文献“Lin M,Chen Q,YanS.Network in network[J].arXiv preprint arXiv:1312.4400,2013.”。

定义10：经典的图像重采样方法

经典的图像重采样指在对采样后形成的由离散数据组成的数字图像按所需的像元位置或像元间距重新采样，以构成几何变换后的新图像。重采样过程本质上是图像恢复过程，它用输入的离散数字图像重建代表原始图像二维连续函数，再按新的像元间距和像元位置进行采样。其数学过程是根据重建的连续函数(曲面)，用周围二像元点的值估计或内插出新采样点的值，相当于用采样函数与输入图像作二维卷积运算。经典的图像重采样方法详见文献“李心爱.图像滤波检测和重采样检测方法研究[D].西安理工大学,2017.”。

定义11：经典的1×1卷积方法

1×1卷积，即特征通过长度，宽度均为1卷积核的处理。1×1卷积方法主要用于调节通道数，对不同的通道上的像素点进行线性组合，然后进行非线性化操作，可以完成升维和降维的功能。经典的1×1卷积方法详见网站“https://zhuanlan.zhihu.com/p/37910136”。

定义12：特征放大

特征放大，即特征升维操作。输入特征经过特征放大操作，实现了跨通道的信息组合，得到了通道数增加的输出特征。本发明通过1×1卷积方法实现特征放大操作。在本发明中，特征放大是将L×L×C维度特征空间通过线性变换映射到L×L×(8×C)维度特征空间。特征放大详见网站“https://zhuanlan.zhihu.com/p/37910136”。

定义13：内容编码

内容编码，即特征降维操作。输入特征经过特征降维操作，实现了跨通道的信息组合，得到了通道数减少的输出特征。内容编码减少了冗余的参数，使得新特征图的特征表达更佳。本发明通过1×1卷积方法实现内容编码操作。在本发明中，内容编码是将L×L×(8×C)维度特征空间通过线性变换映射到L×L×(2²×5×5)维度特征空间。内容编码操作详见网站“https://zhuanlan.zhihu.com/p/37910136”。

定义14：像素重组

像素重组，即单像超分辨率的重构。在基于深层神经网络的常见模型中，低分辨率(LR)输入图像在重建之前使用单个滤波器(通常是双三次插值)被放大到高分辨率(HR)空间，这种方法被证明是可优化的。因此，像素重组操作引入了一个有效的子像素卷积层，该层学习了一个升序滤波器阵列，将最终的LR特征图升级到HR输出。在本发明中，像素重组是将L×L×(2²×5×5)维度特征空间通过线性变换映射到2L×2L×(5×5)维度特征空间。像素重组详见文献“W.Shi et al.,"Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network,"2016IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2016,pp.1874-1883,doi:10.1109/CVPR.2016.207.”。

定义15：softmax激活函数

softmax激活函数，旨在增加网络的非线性表达能力。softmax通过两步将多检测输出转换为概率：分子方面，通过指数函数，将实数输出映射到零到正无穷；分母方面，将所有结果相加，进行归一化。softmax就是按照这两步将在负无穷到正无穷上的预测结果转换为概率。在本发明中，softmax激活函数在CNN中由softmax层实现。softmax激活函数详见网站“https://blog.csdn.net/lz_peter/article/details/84574716”。

定义16：经典的特征融合方法

在深度学习中，特征融合指将浅层特征和深层特征向融合，也就是说将网络中的不同深度的层输出特征谱进行融合，可以实现较弱语义和较强语义的结合，能够提高船只检测精度。特征融合方法详见网站“https://blog.csdn.net/TTdreamloong/article/details/79798817”。

定义17：全局平均池化

全局平均池化指将特征图所有像素值相加求平均，得到一个数值，即用该数值表示对应特征图。全局平均池化可以替代全连接层。相对于全连接层，全局平均池化减少了参数数量，减少了计算量，缓解了过拟合现象。在本发明中，通过平均池化层实现全局平均池化。全局平均池化详见文献“Lin M,Chen Q,Yan S.Network in network[J].arXivpreprint arXiv:1312.4400,2013.”。

定义18：全局最大池化和池化步长

全局最大池化指对特征图像素值求最大，得到一个最大数值，而去忽略其他分数低的区域。池化步长指在进行全局最大池化操作后的图像尺寸与原有图像尺寸的比值，对于全局最大池化来说，这个比值需小于1。全局最大池化能减小卷积层参数误差造成估计均值的偏移，更多的保留纹理信息。在本发明中，通过最大池化层实现全局最大池化。全局最大池化和池化步长详见文献“Lin M,Chen Q,Yan S.Network in network[J].arXivpreprint arXiv:1312.4400,2013.”。

定义19：级联操作

级联操作，即concatenate操作，是网络结构设计中很重要的一种操作，经常用于将特征联合，多个卷积特征提取框架提取的特征融合或者是将输出层的信息进行融合。级联操作是通道数的合并，也就是说描述图像本身的特征增加了，而每一特征下的信息是没有增加。在本发明中实现的二维向量的级联操作，相当于拉长二维向量。级联操作详见网站“https://blog.csdn.net/u012193416/article/details/79479935”。

定义20：上采样和上采样倍数

上采样指在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素，上采样倍数指在进行上采样操作后的图像尺寸与原有图像尺寸的比值，对于上采样来说，这个比值需大于1。上采样为池化的逆过程，上采样在CNN中由上采样层实现。上采样和上采样倍数详见网站“https://www.jianshu.com/p/587c3a45df67”。

定义21：经典的全局注意力机制方法

全局注意力机制模仿的是人类观察模式，旨在抑制某些无效信息的流动，从而使得重要信息得以保留。全局注意力机制可以描述为其中f(·)表示I_i和I_j之间的相似性运算符号，g(·)表示第j个位置的特征表示的运算符号，/>表示归一化系数运算符号，其中I_i表示第i个位置的输入，O_i表示第i个位置的输出。其中，第i个位置信息表示当前位置的响应，第j个位置信息表示全局响应。全局注意力机制详见文献“A.Vaswani,et al.,“Attention is all you need,”Int.Conf.on Neural InformationProcess-ing Systems(NIPS),pp.6000–6010,2017.”。

定义22：经典的Adam算法

经典的Adam算法是一种可以替代传统随机梯度下降过程的一阶优化算法，它能基于训练数据迭代地更新神经网络权重。Adam算法和传统的随机梯度下降不同。随机梯度下降保持单一的学习率更新所有的权重，学习率在训练过程中并不会改变。而Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。详见文献“Kingma,D.；Ba,J.Adam:A Method for Stochastic Optimization.arXiv 2014,arXiv:1412.6980.”。

定义23：标准的检测网络测试方法

标准的检测网络测试方法指在测试集上对检测模型进行最终测试，得到检测模型在测试集上的检测结果。详见文献“C.Lu,and W.Li,“Ship Classification in High-Resolution SAR Images via Transfer Learning with Small Training Dataset,”Sensors,vol.19,no.1,pp.63,2018.”。

定义24：标准的评价指标计算方法

精确率P指在所有预测得到的正样本中，预测正确的数量。精确率P定义为其中#表示数字，TP表示真正例，FP表示真负例；

召回率R指在所有的正样本中，预测正确的数量。召回率R定义为其中#表示数字，TP表示真正例，FN表示假负例；

平均精度mAP同时兼顾了检测模型的精确率P和召回率R。平均精度mAP定义为其中P(R)表示以R为自变量，P为因变量的函数；

以上参数数值的求法详见文献“李航.统计学习方法[M].北京:清华大学出版社,2012.”。定义25：标准的检测时间计算方法

标准的检测时间指检测模型检测一张图像所需要的时间，单位为毫秒ms。在深度学习中，采用Python中的time函数库进行计时得到该标准的检测时间。标准的检测时间计算方法详见文献“李航.统计学习方法[M].北京:清华大学出版社,2012.”。

定义26：经典待学习的加权矩阵W_O

待学习的加权矩阵W_O，即矩阵参数在CNN训练中自学习得到。在深度学习中，该矩阵参数属于反向传播中需要被优化器更新的参数，称之为parameter(如权重等)。本发明中，加权矩阵W_O通过调用Python中的torch.nn.Parameter函数和训练1×1卷积层实现，旨在让矩阵参数变量在学习的过程中不断的修改其值以达到最优化。经典待学习的加权矩阵W_O详见网站“https://www.jianshu.com/p/d8b77cc02410”。

本发明提供了一种基于四元特征金字塔网络的SAR船只检测方法，它包括以下步骤：

步骤1、准备数据集

对于定义1中提供的公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

按照7:3的比例将SSDD_new数据集划分为两部分，得到训练集和测试集，训练集记为Train_SSDD，测试集记为Test_SSDD。

步骤2、基于变形卷积构建变形卷积FPN

步骤2.1：第1层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的输入层，得到由经典的卷积神经网络组成的变形卷积FPN的第1层，记为f₁，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₁，M₁，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₁的变形卷积的卷积核尺寸为3×3×8，采用定义7中经典卷积核步长设置方法设置C₁的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₁的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤1.2中得到的训练集Train_SSDD中的一幅SAR图像进行处理，得到第1层特征输出，记为A₁；

步骤2.2：第2层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第2层，记为f₂，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₂，M₂，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₂的变形卷积的卷积核尺寸为3×3×16，采用定义7中经典卷积核步长设置方法设置C₂的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₂的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.1中得到的第1层特征输出A₁进行处理，得到第2层特征输出，记为A₂；

步骤2.3：第3层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第3层，记为f₃，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₃，M₃，其中根据定义4中的变形卷积原理，采用定义6中卷积核尺寸设置方法设置C₃的变形卷积的卷积核尺寸为3×3×32，采用定义7中经典卷积核步长设置方法设置C₃的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₃的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.2中得到的第2层特征输出A₂进行处理，得到第3层特征输出，记为A₃；

步骤2.4：第4层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第4层，记为f₄，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₄，M₄，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₄的变形卷积的卷积核尺寸为3×3×64，采用定义7中经典卷积核步长设置方法设置C₄的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₄的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.3中得到的第3层特征输出A₃进行处理，得到第4层特征输出，记为A₄；

步骤2.5：第5层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第5层，记为f₅，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₅，M₅，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₅的变形卷积的卷积核尺寸为3×3×128，采用定义7中经典卷积核步长设置方法设置C₅的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₅的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.4中得到的第4层特征输出A₄进行处理，得到第5层特征输出，记为A₅；

最终，得到构建的变形卷积FPN和所有层的特征输出，分别记为DE-CO-FPN和A_s,s＝1,...,5。

步骤3、基于内容感知重组特征构建特征重组FPN

遍历步骤2得到的变形卷积FPN的所有层的特征输出A_s,s＝1,...,5，具体步骤是：

采用公式W_s＝softmax{shuffle[f_encode(f_amplify(A_s))]}，计算得到特征重组FPN的第s层的核预测特征输出，记为W_s，其中f_amplify(·)表示定义12中的特征放大运算符号，f_encode(·)表示定义13中的内容编码运算符号，shuffle[·]表示定义14中的像素重组运算符号，softmax{·}表示定义15中的softmax激活函数运算符号，其中A_s为步骤2得到的变形卷积FPN的第s层特征输出；

采用公式计算得到特征重组FPN的第s层的重组特征输出，记为/>其中φ(·,·)表示标准的卷积运算符号，其中N(A_s,5)为A_s中的5×5正方形像素域，W_s为特征重组FPN的第s层的核预测特征输出；

采用定义16经典的特征融合方法，对重组特征输出和步骤2中得到的特征输出A_s进行处理，得到特征重组FPN的第s层特征输出，记为B_s；

其中，初始计数s＝5，并且每次遍历后更新计数s＝s-1，直到s＝1后停止遍历，由此得到遍历后的特征重组FPN的所有层的输出特征，记为B_s,s＝1,...,5；

步骤4、基于路由聚合空间感知构建空间注意力FPN

遍历步骤3得到的特征重组FPN的所有层的特征输出B_s,s＝1,...,5，具体步骤是：

采用公式计算得到空间注意力FPN的第s层的空间注意力特征输出，记为Q_s，其中GAP(·)表示定义17中的全局平均池化运算符号，GMP(·)表示定义18中的全局最大池化运算符号，其中/>表示定义19中的级联操作运算符号，f_encode(·)表示定义13中的内容编码运算符号，softmax{·}表示定义15中的softmax激活函数运算符号，×表示乘法运算符号，其中B_s为步骤3得到的特征重组FPN的第s层特征输出；

采用定义16经典的特征融合方法，对空间注意力特征输出Q_s和步骤3中得到的特征输出B_s进行处理，得到空间注意力FPN的第s层特征输出，记为C_s；

其中，初始计数s＝1，并且每次遍历后更新计数s＝s+1，直到s＝5后停止遍历，由此得到遍历后的空间注意力FPN的所有层的特征输出，记为C_s,s＝1,...,5；

步骤5、基于平衡尺度全局注意力构建平衡尺度FPN

步骤5.1：特征金字塔整形

采用公式H₁＝MaxPool^4×(C₁)，计算得到平衡尺度FPN的第1层的整形特征输出，记为H₁，其中MaxPool^4×(·)表示定义18中池化步长为4条件下的全局最大池化运算符号，其中C₁为空间注意力FPN的第1层特征输出；

采用公式H₂＝MaxPool^2×(C₂)，计算得到平衡尺度FPN的第2层的整形特征输出，记为H₂，其中MaxPool^2×(·)表示定义18中池化步长为2条件下的全局最大池化运算符号，其中C₂为空间注意力FPN的第2层特征输出；

采用公式H₃＝C₃，计算得到平衡尺度FPN的第3层的整形特征输出，记为H₃，其中C₃为空间注意力FPN的第3层特征输出；

采用公式，H₄＝UpSamping^2×(C₄)计算得到平衡尺度FPN的第4层的整形特征输出，记为H₄，其中UpSamping^2×(·)表示定义20中上采样倍数为2条件下的上采样运算符号，其中C₄为空间注意力FPN的第4层特征输出；

采用公式H₅＝UpSamping^4×(C₅)，计算得到平衡尺度FPN的第5层的整形特征输出，记为H₅，其中UpSamping^4×(·)表示定义20中上采样倍数为4条件下的上采样运算符号，其中C₅为空间注意力FPN的第5层特征输出；

由此得到平衡尺度FPN的所有层的整形特征输出，记为H_s,s＝1,...,5；

步骤5.2：平衡的多尺度特征融合

采用公式计算得到平衡的多尺度融合特征，记为H，其中/>表示累加运算符号，其中H_s为步骤5.1得到的第s层的整形特征输出；

步骤5.3：全局注意力细化

采用定义21的经典的全局注意力机制方法，对步骤5.2得到的多尺度融合特征H进行处理，得到的自我注意力输出，记为O；

采用公式I′＝W_OO+H，计算得到全局注意力输出，记为I′，其中W_O为定义26中的待学习的加权矩阵；

步骤5.4：特征金字塔还原

采用公式D₁＝UpSamping^4×(I′)，计算得到平衡尺度FPN的第1层的最终特征输出，记为D₁，其中UpSamping^4×(·)表示定义20中上采样倍数为4条件下的上采样运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₂＝UpSamping^2×(I′)，计算得到平衡尺度FPN的第2层的最终特征输出，记为D₂，其中UpSamping^2×(·)表示定义20中上采样倍数为2条件下的上采样运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₃＝I′，计算得到平衡尺度FPN的第3层的最终特征输出，记为D₃，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₄＝MaxPool^2×(I′)，计算得到平衡尺度FPN的第4层的最终特征输出，记为D₄，其中MaxPool^2×(·)表示定义18中池化步长为2条件下的全局最大池化运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₅＝MaxPool^4×(I′)，计算得到平衡尺度FPN的第5层的最终特征输出，记为D₅，其中MaxPool^4×(·)表示定义18中池化步长为4条件下的全局最大池化运算符号，其中I′为步骤5.3得到的全局注意力输出；

由此得到四元特征金字塔网络的所有层的最终特征输出，记为D_s,s＝1,...,5；

至此，完成了四元特征金字塔网络的构建。

步骤6、建立船只检测模型

将步骤1中得到的训练集Train_SSDD作为输入，在步骤5所完成的四元特征金字塔网络上采用定义22中的经典的Adam算法进行训练，训练完成后得到船只检测模型，记为Quad-FPN。

步骤7、测试船只检测模型

采用定义10的经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为128×128大小的新的测试集Test_SSDD_Reszie；

采用得到的测试集Test_SSDD_Resize，在步骤6中得到的船只检测模型Quad-FPN上采用定义23中的标准的检测网络测试方法进行测试，得到测试集在船只检测模型的测试结果，记为Result。

步骤8、评估船只检测模型

以步骤7中得到的船只检测模型的测试结果Result作为输入，采用定义24中的标准的评价指标计算方法，求出精确率，召回率和平均精度，分别记为P,R和mAP；

以步骤7中得到的船只检测模型的测试结果Result作为输入，采用定义25中的标准的检测时间计算方法求出标准的检测时间，记为T；

采用公式计算得到模型检测的帧率，记为FPS，其中T为标准的检测时间；

至此，整个方法结束。

本发明的创新点在于在原始FPN基础上引入了变形卷积，特征重组，空间注意力和平衡尺度的机制，实现了船只检测中船只语义信息和空间信息的充分提取，使得本发明中的船只检测模型具有更优越的检测精度。该方法在公知的SSDD数据集上达到的准确率是95.29％。

本发明的优点在于实现了船只检测中船只语义信息和空间信息的充分提取，能够提供SAR图像中船只目标检测的方法，用来解决现有船只目标检测精度不足的问题。

附图说明

图1为本发明中的提供SAR图像中船只目标检测方法的流程示意图。

图2为本发明中的SAR图像中船只目标检测方法同其他12个SAR船只检测器关于精确率，召回率，平均精度和帧率的数值比较表

具体实施方式

下面结合附图1对本发明作进一步详细描述。

步骤1、准备数据集

如图1所示，对于定义1中提供的公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

步骤2、基于变形卷积构建变形卷积FPN

步骤2.1：第1层FPN特征提取

如图1所示，采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的输入层，得到由经典的卷积神经网络组成的变形卷积FPN的第1层，记为f₁，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₁，M₁，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₁的变形卷积的卷积核尺寸为3×3×8，采用定义7中经典卷积核步长设置方法设置C₁的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₁的卷积核步长为2；

步骤2.2：第2层FPN特征提取

如图1所示，采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第2层，记为f₂，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₂，M₂，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₂的变形卷积的卷积核尺寸为3×3×16，采用定义7中经典卷积核步长设置方法设置C₂的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₂的卷积核步长为2；

步骤2.3：第3层FPN特征提取

如图1所示，采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第3层，记为f₃，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₃，M₃，其中根据定义4中的变形卷积原理，采用定义6中卷积核尺寸设置方法设置C₃的变形卷积的卷积核尺寸为3×3×32，采用定义7中经典卷积核步长设置方法设置C₃的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₃的卷积核步长为2；

步骤2.4：第4层FPN特征提取

如图1所示，采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第4层，记为f₄，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₄，M₄，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₄的变形卷积的卷积核尺寸为3×3×64，采用定义7中经典卷积核步长设置方法设置C₄的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₄的卷积核步长为2；

步骤2.5：第5层FPN特征提取

如图1所示，采用定义2中的经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第5层，记为f₅，该层由定义8中经典的卷积层和定义9中经典的最大池化层组成，分别记为C₅，M₅，其中根据定义4中的变形卷积原理，采用定义6中经典卷积核尺寸设置方法设置C₅的变形卷积的卷积核尺寸为3×3×128，采用定义7中经典卷积核步长设置方法设置C₅的变形卷积的卷积核步长为1，采用定义7中经典卷积核步长设置方法设置M₅的卷积核步长为2；

步骤3、基于内容感知重组特征构建特征重组FPN

如图1所示，遍历步骤2得到的变形卷积FPN的所有层的特征输出A_s,s＝1,...,5，具体步骤是：

步骤4、基于路由聚合空间感知构建空间注意力FPN

如图1所示，遍历步骤3得到的特征重组FPN的所有层的特征输出B_s,s＝1,...,5，具体步骤是：

步骤5、基于平衡尺度全局注意力构建平衡尺度FPN

步骤5.1：特征金字塔整形

如图1所示，采用公式H₁＝MaxPool^4×(C₁)，计算得到平衡尺度FPN的第1层的整形特征输出，记为H₁，其中MaxPool^4×(·)表示定义18中池化步长为4条件下的全局最大池化运算符号，其中C₁为空间注意力FPN的第1层特征输出；

步骤5.2：平衡的多尺度特征融合

如图1所示，采用公式计算得到平衡的多尺度融合特征，记为H，其中表示累加运算符号，其中H_s为步骤5.1得到的第s层的整形特征输出；

步骤5.3：全局注意力细化

如图1所示，采用定义21的经典的全局注意力机制方法，对步骤5.2得到的多尺度融合特征H进行处理，得到的自我注意力输出，记为O；

步骤5.4：特征金字塔还原

如图1所示，采用公式D₁＝UpSamping^4×(I′)，计算得到平衡尺度FPN的第1层的最终特征输出，记为D₁，其中UpSamping^4×(·)表示定义20中上采样倍数为4条件下的上采样运算符号，其中I′为步骤5.3得到的全局注意力输出；

至此，完成了四元特征金字塔网络的构建。

步骤6、建立船只检测模型

如图1所示，将步骤1中得到的训练集Train_SSDD作为输入，在步骤5所完成的四元特征金字塔网络上采用定义22中的经典的Adam算法进行训练，训练完成后得到船只检测模型，记为Quad-FPN。

步骤7、测试船只检测模型

如图1所示，采用定义10的经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为128×128大小的新的测试集Test_SSDD_Reszie；

步骤8、评估船只检测模型

如图1所示，以步骤7中得到的船只检测模型的测试结果Result作为输入，采用定义24中的标准的评价指标计算方法，求出精确率，召回率和平均精度，分别记为P,R和mAP；

如图1所示，以步骤7中得到的船只检测模型的测试结果Result作为输入，采用定义25中的标准的检测时间计算方法求出标准的检测时间，记为T；

至此，整个方法结束。

如图2所示，本发明在公知的SSDD数据集上达到的准确率是95.29％。同时，本发明实现了若干现有技术中最高的检测精度，表明本发明能够实现高精度的SAR图像中船只目标检测。

Claims

1.一种基于四元特征金字塔网络的SAR船只检测方法，其特征是它包括以下步骤：

步骤1、准备数据集

对于公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

按照7:3的比例将SSDD_new数据集划分为两部分，得到训练集和测试集，训练集记为Train_SSDD，测试集记为Test_SSDD；

步骤2、基于变形卷积构建变形卷积FPN

步骤2.1：第1层FPN特征提取

采用经典的卷积神经网络方法建立变形卷积FPN的输入层，得到由经典的卷积神经网络组成的变形卷积FPN的第1层，记为f₁，该层由经典的卷积层和经典的最大池化层组成，分别记为C₁，M₁，其中根据变形卷积原理，采用经典卷积核尺寸设置方法设置C₁的变形卷积的卷积核尺寸为3×3×8，采用经典卷积核步长设置方法设置C₁的变形卷积的卷积核步长为1，采用经典卷积核步长设置方法设置M₁的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤1.2中得到的训练集Train_SSDD中的一幅SAR图像进行处理，得到第1层特征输出，记为A₁；

步骤2.2：第2层FPN特征提取

采用经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第2层，记为f₂，该层由经典的卷积层和经典的最大池化层组成，分别记为C₂，M₂，其中根据变形卷积原理，采用经典卷积核尺寸设置方法设置C₂的变形卷积的卷积核尺寸为3×3×16，采用经典卷积核步长设置方法设置C₂的变形卷积的卷积核步长为1，采用经典卷积核步长设置方法设置M₂的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.1中得到的第1层特征输出A₁进行处理，得到第2层特征输出，记为A₂；

步骤2.3：第3层FPN特征提取

采用经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第3层，记为f₃，该层由经典的卷积层和经典的最大池化层组成，分别记为C₃，M₃，其中根据变形卷积原理，采用卷积核尺寸设置方法设置C₃的变形卷积的卷积核尺寸为3×3×32，采用经典卷积核步长设置方法设置C₃的变形卷积的卷积核步长为1，采用经典卷积核步长设置方法设置M₃的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.2中得到的第2层特征输出A₂进行处理，得到第3层特征输出，记为A₃；

步骤2.4：第4层FPN特征提取

采用经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第4层，记为f₄，该层由经典的卷积层和经典的最大池化层组成，分别记为C₄，M₄，其中根据变形卷积原理，采用经典卷积核尺寸设置方法设置C₄的变形卷积的卷积核尺寸为3×3×64，采用经典卷积核步长设置方法设置C₄的变形卷积的卷积核步长为1，采用经典卷积核步长设置方法设置M₄的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.3中得到的第3层特征输出A₃进行处理，得到第4层特征输出，记为A₄；

步骤2.5：第5层FPN特征提取

采用经典的卷积神经网络方法建立变形卷积FPN的中间层，得到由经典的卷积神经网络组成的变形卷积FPN的第5层，记为f₅，该层由经典的卷积层和经典的最大池化层组成，分别记为C₅，M₅，其中根据变形卷积原理，采用经典卷积核尺寸设置方法设置C₅的变形卷积的卷积核尺寸为3×3×128，采用经典卷积核步长设置方法设置C₅的变形卷积的卷积核步长为1，采用经典卷积核步长设置方法设置M₅的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.4中得到的第4层特征输出A₄进行处理，得到第5层特征输出，记为A₅；

最终，得到构建的变形卷积FPN和所有层的特征输出，分别记为DE-CO-FPN和A_s,s＝1,...,5；

步骤3、基于内容感知重组特征构建特征重组FPN

采用公式W_s＝softmax{shuffle[f_encode(f_amplify(A_s))]}，计算得到特征重组FPN的第s层的核预测特征输出，记为W_s，其中f_amplify(·)表示特征放大运算符号，f_encode(·)表示内容编码运算符号，shuffle[·]表示像素重组运算符号，softmax{·}表示softmax激活函数运算符号，其中A_s为步骤2得到的变形卷积FPN的第s层特征输出；

采用公式计算得到特征重组FPN的第s层的重组特征输出，记为其中φ(·,·)表示标准的卷积运算符号，其中N(A_s,5)为A_s中的5×5正方形像素域，W_s为特征重组FPN的第s层的核预测特征输出；

采用经典的特征融合方法，对重组特征输出和步骤2中得到的特征输出A_s进行处理，得到特征重组FPN的第s层特征输出，记为B_s；

步骤4、基于路由聚合空间感知构建空间注意力FPN

采用公式计算得到空间注意力FPN的第s层的空间注意力特征输出，记为Q_s，其中GAP(·)表示全局平均池化运算符号，GMP(·)表示全局最大池化运算符号，其中/>表示级联操作运算符号，f_encode(·)表示内容编码运算符号，softmax{·}表示softmax激活函数运算符号，×表示乘法运算符号，其中B_s为步骤3得到的特征重组FPN的第s层特征输出；

采用经典的特征融合方法，对空间注意力特征输出Q_s和步骤3中得到的特征输出B_s进行处理，得到空间注意力FPN的第s层特征输出，记为C_s；

步骤5、基于平衡尺度全局注意力构建平衡尺度FPN

步骤5.1：特征金字塔整形

采用公式H₁＝MaxPool4×(C₁)，计算得到平衡尺度FPN的第1层的整形特征输出，记为H₁，其中MaxPool4×(·)表示池化步长为4条件下的全局最大池化运算符号，其中C₁为空间注意力FPN的第1层特征输出；

采用公式H₂＝MaxPool2×(C₂)，计算得到平衡尺度FPN的第2层的整形特征输出，记为H₂，其中MaxPool2×(·)表示池化步长为2条件下的全局最大池化运算符号，其中C₂为空间注意力FPN的第2层特征输出；

采用公式，H₄＝UpSamping2×(C₄)计算得到平衡尺度FPN的第4层的整形特征输出，记为H₄，其中UpSamping2×(·)表示上采样倍数为2条件下的上采样运算符号，其中C₄为空间注意力FPN的第4层特征输出；

采用公式H₅＝UpSamping4×(C₅)，计算得到平衡尺度FPN的第5层的整形特征输出，记为H₅，其中UpSamping4×(·)表示上采样倍数为4条件下的上采样运算符号，其中C₅为空间注意力FPN的第5层特征输出；

步骤5.2：平衡的多尺度特征融合

步骤5.3：全局注意力细化

采用经典的全局注意力机制方法，对步骤5.2得到的多尺度融合特征H进行处理，得到的自我注意力输出，记为O；

采用公式I′＝W_OO+H，计算得到全局注意力输出，记为I′，其中W_O为待学习的加权矩阵；

步骤5.4：特征金字塔还原

采用公式D₁＝UpSamping4×(I′)，计算得到平衡尺度FPN的第1层的最终特征输出，记为D₁，其中UpSamping4×(·)表示上采样倍数为4条件下的上采样运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₂＝UpSamping2×(I′)，计算得到平衡尺度FPN的第2层的最终特征输出，记为D₂，其中UpSamping2×(·)表示上采样倍数为2条件下的上采样运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₄＝MaxPool2×(I′)，计算得到平衡尺度FPN的第4层的最终特征输出，记为D₄，其中MaxPool2×(·)表示池化步长为2条件下的全局最大池化运算符号，其中I′为步骤5.3得到的全局注意力输出；

采用公式D₅＝MaxPool4×(I′)，计算得到平衡尺度FPN的第5层的最终特征输出，记为D₅，其中MaxPool4×(·)表示池化步长为4条件下的全局最大池化运算符号，其中I′为步骤5.3得到的全局注意力输出；

至此，完成了四元特征金字塔网络的构建；

步骤6、建立船只检测模型

将步骤1中得到的训练集Train_SSDD作为输入，在步骤5所完成的四元特征金字塔网络上采用经典的Adam算法进行训练，训练完成后得到船只检测模型，记为Quad-FPN；

步骤7、测试船只检测模型

采用经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为128×128大小的新的测试集Test_SSDD_Reszie；

采用得到的测试集Test_SSDD_Resize，在步骤6中得到的船只检测模型Quad-FPN上采用标准的检测网络测试方法进行测试，得到测试集在船只检测模型的测试结果，记为Result；

步骤8、评估船只检测模型

以步骤7中得到的船只检测模型的测试结果Result作为输入，采用标准的评价指标计算方法，求出精确率，召回率和平均精度，分别记为P,R和mAP；

以步骤7中得到的船只检测模型的测试结果Result作为输入，采用标准的检测时间计算方法求出标准的检测时间，记为T；

至此，整个方法结束。