CN113989665B

CN113989665B - 一种基于路由聚合感知fpn的sar船只检测方法

Info

Publication number: CN113989665B
Application number: CN202111238191.1A
Authority: CN
Inventors: 张晓玲; 胥小我; 张天文; 杨景皓; 师君; 韦顺军
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-10-25
Filing date: 2021-10-25
Publication date: 2023-04-07
Anticipated expiration: 2041-10-25
Also published as: CN113989665A

Abstract

本发明公开了一种基于路由聚合感知FPN的SAR船只检测方法，该方法主要包括准备数据集、构建特征提取FPN、构建特征融合FPN、构建路由聚合感知FPN、建立船只检测模型、测试船只检测模型和评估船只检测模型六个部分。它是通过基于原始的FPN，增加了路由聚合分支，引入了注意力模块，构建了路由聚合感知FPN，优化网络结构以提高准确性，从而实现了船只检测中船只语高层语义信息和底层空间信息的充分提取，达到提高SAR图像中船只目标检测精度的目的。在公知的SAR船只数据集即SSDD数据集上的方正实验结果表明，与现有技术中特征金字塔网络FPN方法相比，本发明可将SAR船只检测精度提高约3％。

Description

一种基于路由聚合感知FPN的SAR船只检测方法

技术领域

本发明属于合成孔径雷达(Synthetic Aperture Radar,SAR)图像解译技术领域，涉及一种基于路由聚合感知FPN的SAR船只检测方法。

背景技术

合成孔径雷达(SAR)属于一种微波成像雷达，也是一种可以产生高分辨率图像的机载雷达或星载雷达。与光学传感器相比，SAR可以穿透云雾，在恶劣的气象条件下也可以完成观测任务。SAR已成为当今对地观测的重要手段，被广泛的应用于遥感和地图测绘。特别地，SAR在海洋领域也有广泛地应用，例如海洋交通管理，海洋渔业管理，海洋环境保护，海洋灾难救援等。详见文献“张庆君,韩晓磊,刘杰.星载合成孔径雷达遥感技术进展及发展趋势[J].航天器工程,2017,26(06):1-8.”。

自1978年首颗SAR卫星Seasat发射以来，利用SAR图像进行舰船检测一直受到众多学者的关注。SAR图像船只检测在海洋交通管制、渔业管理、海洋灾害救援等方面发挥着重要作用。利用SAR进行船只探测是一种很好的选择，因为SAR不受天气和光线的负面影响。这说明SAR非常适合用于海洋监测。详见文献“孟凡超,鲍勇.合成孔径雷达在舰船目标高分辨监视和测绘中的应用[J].舰船科学技术,2018,40(22):157-159.”。

由于不同的分辨率和不同类型的船舶具有不同的尺度，SAR图像中的船舶呈现出多尺度分布。目前，采用特征金字塔网络(FPN)对多尺度船舶进行检测是一种标准方案。许多学者开始对原始FPN的性能进行改进。目前现有的基于FPN的SAR图像中船只检测技术均取得了良好的多尺度舰船检测性能。然而，它们都忽略了低层次的空间位置信息，这导致了它们对小型船舶的检测性能差，SAR船只检测仍然是一个具有挑战性的问题。

因此，为解决上述问题，本发明提出了一种基于路由聚合感知FPN的SAR船只检测方法。该方法提出了路由聚合感知FPN(PAA-FPN)，有效提高了对于小型船只的检测性能。

发明内容

本发明属于合成孔径雷达(SAR)图像解译技术领域，公开了一种基于路由聚合感知FPN的SAR船只检测方法，用来解决现有检测技术精度不足的问题。该方法主要包括准备数据集，构建特征提取FPN，构建特征融合FPN，构建路由聚合感知FPN，建立船只检测模型，测试船只检测模型和评估船只检测模型六个部分。该方法基于原始的FPN，增加了路由聚合分支，引入了注意力模块，构建了路由聚合感知FPN，从而优化网络结构以提高准确性。在公知的SAR船只数据集(即SSDD数据集)上的实验结果表明，与现有技术中定义17中的FPN相比较，本发明可将SAR船只检测精度提高约3％。

为了方便描述本发明的内容，首先作以下术语定义：

定义1：SSDD数据集

SSDD数据集是指SAR船只检测数据集，英文全称为SAR Ship Detection Dataset，其可以用于训练深度学习模型，用于研究人员在这个统一的数据集去评价他们算法的性能。在SSDD数据集中，一共有1160幅图像和2456艘船只平均每幅图像有2.12艘船。后续根据任务需要会增加样本个数，扩充数据集。相比于有9000多幅图像、20类目标的PASCAL VOC数据集，SSDD足够大到可以对船只这一类目标进行训练检测器。SSDD数据集可从参考文献“李健伟,曲长文,彭书娟,邓兵.基于卷积神经网络的SAR图像舰船目标检测[J].系统工程与电子技术,2018,40(09):1953-1959.”中获得。

定义2：经典的卷积神经网络方法

经典的卷积神经网络(CNN)指一类包含卷积计算且具有深度结构的前馈神经网络。卷积神经网络仿造生物的视知觉机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量进行特征提取。近年来，卷积神经网络在计算机视觉、自然语言处理、语音识别等领域取得了突飞猛进的发展，其强大的特征学习能力引起了国内外专家学者广泛的关注。经典的卷积神经网络方法详见文献“张索非,冯烨,吴晓富.基于深度卷积神经网络的目标检测算法进展[J/OL].南京邮电大学学报(自然科学版),2019(05):1-9.https://doi.org/10.14132/j.cnki.1673-5439.2019.05.010.”。

定义3：经典的CNN特征提取方法

经典的CNN特征提取，即通过CNN对原始输入图像进行特征提取。总而言之，原始输入图像经过不同特征的卷积操作变成了一系列的特征图。在CNN中，卷积层中卷积核在图像上不断滑动运算。同时，最大池化层负责在内积结果上取每一局部块的最大值。因此，CNN通过卷积层和最大池化层实现了图片特征提取方法。经典CNN特征提取详见网站“https://blog.csdn.net/qq_30815237/article/details/86703620”。

定义4：卷积核

卷积核就是图像处理时，给定输入图像，输入图像中一个小区域中像素加权平均后成为输出图像中的每个对应像素，其中权值由一个函数定义，这个函数称为卷积核。卷积核的作用在于特征的抽取，越是大的卷积核尺寸就意味着更大的感受野，当然随之而来的是更多的参数。早在1998年，LeCun发布的LetNet-5模型中就会出，图像空域内具有局部相关性，卷积的过程是对局部相关性的一种抽取。卷积核设置方法详见文献“Lecun Y,BottouL,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义5：经典的卷积核尺寸设置方法

卷积核尺寸就是指卷积核的长度，宽度，深度，记为L×W×D，其中L代表长度，W代表宽度，D代表深度。设置卷积核的尺寸就是指确定L，W，D的具体数值。一般地，在达到相同感受野的情况下，卷积核越小，所需要的参数和计算量越小。具体来说，卷积核的长度和宽度必须大于1才有提升感受野的作用，而大小为偶数的卷积核即使对称地加补零操作也不能保证输入特征谱尺寸和输出特征谱尺寸不变，一般都用3作为卷积核大小。卷积核尺寸设置方法详见文献“Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learningapplied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义6：经典的卷积核步长设置方法

卷积核步长就是指每次移动卷积核的长度，记为S。设置卷积核的步长就是指确定S的具体数值。一般地，步长越大，提取特征越少；反之，提取特征越多。一般卷积层都用1作为卷积核步长，最大池化层都用2作为卷积核步长。经典的卷积核步长设置方法详见文献“Lecun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to documentrecognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.”。

定义7：经典的卷积层

卷积层由若干卷积单元组成，每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网络能从低级特征中迭代提取更复杂的特征。经典的卷积层详见网站“https://www.zhihu.com/question/49376084”。

定义8：经典的最大池化层

最大池化层用于提取前一层网络区域内所有神经元的最大值，目的是为了在反向传播中，需要把梯度值传到对应最大值所在的位置。最大池化层能减小卷积层参数误差造成估计均值的偏移，更多的保留纹理信息。经典的最大池化层详见文献“Lin M,Chen Q,YanS.Network in network[J].arXiv preprint arXiv:1312.4400,2013.”。

定义9：经典的图像重采样方法

经典的图像重采样指在对采样后形成的由离散数据组成的数字图像按所需的像元位置或像元间距重新采样，以构成几何变换后的新图像。重采样过程本质上是图像恢复过程，它用输入的离散数字图像重建代表原始图像二维连续函数，再按新的像元间距和像元位置进行采样。其数学过程是根据重建的连续函数(曲面)，用周围二像元点的值估计或内插出新采样点的值，相当于用采样函数与输入图像作二维卷积运算。经典的图像重采样方法详见文献“李心爱.图像滤波检测和重采样检测方法研究[D].西安理工大学,2017.”。

定义10：经典的1×1卷积方法

1×1卷积，即特征通过长度，宽度均为1卷积核的处理。1×1卷积方法主要用于调节通道数，对不同的通道上的像素点进行线性组合，然后进行非线性化操作，可以完成升维和降维的功能。经典的1×1卷积方法详见网站“https://zhuanlan.zhihu.com/p/37910136”。

定义11：上采样和上采样倍数

上采样指在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素，上采样倍数指在进行上采样操作后的图像尺寸与原有图像尺寸的比值，对于上采样来说，这个比值需大于1。上采样为池化的逆过程，上采样在CNN中由上采样层实现。上采样和上采样倍数详见网站“https://www.jianshu.com/p/587c3a45df67”。

定义12：经典的全局注意力机制方法

全局注意力机制模仿的是人类观察模式，旨在抑制某些无效信息的流动，从而使得重要信息得以保留。全局注意力机制可以描述为

其中f(·)表示I_i和I_j之间的相似性运算符号，g(·)表示第j个位置的特征表示的运算符号，c(·)表示归一化系数运算符号，其中I_i表示第i个位置的输入，O_i表示第i个位置的输出。其中，第i个位置信息表示当前位置的响应，第j个位置信息表示全局响应。全局注意力机制详见文献“A.Vaswani,et al.,“Attention is all you need,”Int.Conf.on Neural InformationProcess-ing Systems(NIPS),pp.6000–6010,2017.”。

定义13：下采样和下采样倍数

下采样指在原有图像像素的基础上在像素点之间采用合适的下采样算法保留局部元素，下采样倍数指在进行下采样操作后的图像尺寸与原有图像尺寸的比值，对于上采样来说，这个比值需小于1。下采样为上采样的逆过程，下采样在CNN中由池化层实现。下采样和下采样倍数详见网站“https://blog.csdn.net/xiaotiig/article/details/111256700”。

定义14：经典的Adam算法

经典的Adam算法是一种可以替代传统随机梯度下降过程的一阶优化算法，它能基于训练数据迭代地更新神经网络权重。Adam算法和传统的随机梯度下降不同。随机梯度下降保持单一的学习率更新所有的权重，学习率在训练过程中并不会改变。而Adam通过计算梯度的一阶矩估计和二阶矩估计而为不同的参数设计独立的自适应性学习率。详见文献“Kingma,D.；Ba,J.Adam:A Method for Stochastic Optimization.arXiv 2014,arXiv:1412.6980.”。

定义15：标准的检测网络测试方法

标准的检测网络测试方法指在测试集上对检测模型进行最终测试，得到检测模型在测试集上的检测结果。详见文献“C.Lu,and W.Li,“Ship Classification in High-Resolution SAR Images via Transfer Learning with Small Training Dataset,”Sensors,vol.19,no.1,pp.63,2018.”。

定义16：标准的评价指标计算方法

精确率Precision指在所有预测得到的正样本中，预测正确的数量。精确率Precision定义为

其中#表示数字，TP表示真正例，FP表示真负例；

召回率Recall指在所有的正样本中，预测正确的数量。召回率Recall定义为

其中#表示数字，TP表示真正例，FN表示假负例；

平均精度AP同时兼顾了检测模型的精确率Precision和召回率Recall。平均精度AP定义为

其中P(R)表示以Recall为自变量，Precision为因变量的函数；

以上参数数值的求法详见文献“李航.统计学习方法[M].北京:清华大学出版社,2012.”。

定义17：FPN

FPN，即特征金字塔网络(Feature pyramid network)，它是CVPR2017年的一篇文章所提出的算法。FPN在目标检测中融入了特征金字塔，可以同时利用低层特征高分辨率和高层特征的高语义信息，通过融合这些不同层的特征达到很好的预测效果。因此，FPN提高了目标检测的准确率，尤其体现在小物体的检测上。FPN详见文献“Lin,T.-Y.；Dollar,P.；Girshick,R.；He,K.；Hariharan,B.；et al.Feature pyramid networks for objectdetection.In Proceedings of the IEEE Conference on Computer Vision andPattern Recognition(CVPR),2017；pp.936-944.”。

本发明提供了一种基于路由聚合感知FPN的SAR船只检测方法，它包括以下步骤：

步骤1、准备数据集

对于定义1中提供的公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

按照8:2的比例将SSDD_new数据集划分为两部分，得到训练集和测试集，训练集记为Train_SSDD，测试集记为Test_SSDD；

步骤2、构建特征提取FPN

步骤2.1：第1层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立特征提取FPN的输入层，得到由经典的卷积神经网络组成的特征提取FPN的第1层，记为f₁，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₁，M₁，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₁的卷积核尺寸为3×3×16，采用定义6中经典卷积核步长设置方法设置C₁的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₁的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤1中得到的训练集Train_SSDD中的一幅SAR图像进行处理，得到第1层特征输出，记为A₁；

步骤2.2：第2层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第2层，记为f₂，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₂，M₂，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₂的卷积核尺寸为3×3×32，采用定义6中经典卷积核步长设置方法设置C₂的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₂的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.1中得到的第1层特征输出A₁进行处理，得到第2层特征输出，记为A₂；

步骤2.3：第3层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第3层，记为f₃，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₃，M₃，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₃的卷积核尺寸为3×3×64，采用定义6中经典卷积核步长设置方法设置C₃的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₃的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.2中得到的第2层特征输出A₂进行处理，得到第3层特征输出，记为A₃；

步骤2.4：第4层FPN特征提取

采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第4层，记为f₄，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₄，M₄，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₄的卷积核尺寸为3×3×128，采用定义6中经典卷积核步长设置方法设置C₄的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₄的卷积核步长为2；

采用定义3中的经典的CNN特征提取方法，对步骤2.3中得到的第3层特征输出A₃进行处理，得到第4层特征输出，记为A₄；

最终，得到构建的特征提取FPN和所有层的特征输出，分别记为Backbone-FPN和A_s,s＝1,...,4。

步骤3、构建特征融合FPN

采用公式P₁＝Conv^1×1(A₁)+UpSamping^2×(A₂)，计算得到特征融合FPN的第1层的融合特征输出，记为P₁，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，UpSamping^2×(·)表示定义11中上采样倍数为2条件下的上采样运算符号，其中A₁为特征提取FPN的第1层特征输出；

采用公式P₂＝Conv^1×1(A₂)+UpSamping^2×(A₃)，计算得到特征融合FPN的第2层的融合特征输出，记为P₂，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，UpSamping^2×(·)表示定义11中上采样倍数为2条件下的上采样运算符号，其中A₂为特征提取FPN的第2层特征输出；

采用公式P₃＝Conv^1×1(A₃)+UpSamping^2×(A₄)，计算得到特征融合FPN的第3层的融合特征输出，记为P₃，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，UpSamping^2×(·)表示定义11中上采样倍数为2条件下的上采样运算符号，其中A₃为特征提取FPN的第3层特征输出；

采用公式P₄＝Conv^1×1(A₄)，计算得到特征融合FPN的第4层的融合特征输出，记为P₄，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，其中A₄为特征提取FPN的第4层特征输出；

由此得到构建的特征融合FPN和所有层的融合特征输出，分别记为FPN和P_s,s＝1,...,4；步骤4、构建路由聚合感知FPN

采用公式Q₁＝Conv^1×1(attention(P₁))，计算得到路由聚合感知FPN的第1层的特征输出，记为Q₁，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，attention(·)表示定义12中的全局注意力运算符号，其中P₁为特征融合FPN的第1层特征输出；

采用公式Q₂＝Conv^1×1(P₂)+DownSamping^2×(attention(Q₁))，计算得到路由聚合感知FPN的第2层的特征输出，记为Q₂，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，attention(·)表示定义12中的全局注意力运算符号，DownSamping^2×(·)表示定义13中下采样倍数为2条件下的下采样运算符号，其中P₂为特征融合FPN的第2层特征输出，Q₁为路由聚合感知FPN的第1层特征输出；

采用公式Q₃＝Conv^1×1(P₃)+DownSamping^2×(attention(Q₂))，计算得到路由聚合感知FPN的第3层的特征输出，记为Q₃，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，attention(·)表示定义12中的全局注意力运算符号，DownSamping^2×(·)表示定义13中下采样倍数为2条件下的下采样运算符号，其中P₃为特征融合FPN的第3层特征输出，Q₂为路由聚合感知FPN的第2层特征输出；

采用公式Q₄＝Conv^1×1(P₄)+DownSamping^2×(attention(Q₃))，计算得到路由聚合感知FPN的第4层的特征输出，记为Q₄，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，attention(·)表示定义12中的全局注意力运算符号，DownSamping^2×(·)表示定义13中下采样倍数为2条件下的下采样运算符号，其中P₄为特征融合FPN的第4层特征输出，Q₃为路由聚合感知FPN的第3层特征输出；

由此得到路由聚合感知FPN的所有层的最终特征输出，记为Q_s,s＝1,...,4；

至此，完成了路由聚合感知FPN的构建；

步骤5、建立船只检测模型

将步骤1中得到的训练集Train_SSDD作为输入，在步骤4所完成的路由聚合感知FPN上采用定义14中的经典的Adam算法进行训练，训练完成后得到船只检测模型，记为PAA-FPN；

步骤6、测试船只检测模型

采用定义9的经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为512×512大小的新的测试集Test_SSDD_Reszie；

采用得到的测试集Test_SSDD_Resize，在步骤5中得到的船只检测模型PAA-FPN上采用定义15中的标准的检测网络测试方法进行测试，得到测试集在船只检测模型的测试结果，记为Result；

步骤7、评估船只检测模型

以步骤6中得到的船只检测模型的测试结果Result作为输入，采用定义16中的标准的评价指标计算方法，求出平均精度，召回率和精确率，分别记为AP,Recall和Precision；

至此，整个方法结束。

本发明的创新点在于在原始FPN基础上建立了一个自下而上的分支，引入了注意力模型，实现了船只检测中船只高层语义信息和底层空间信息的充分提取，使得本发明中的船只检测模型具有更优越的检测精度。在公知的SAR船只数据集(即SSDD数据集)上的实验结果表明，与现有技术中定义17中的FPN相比较，本发明可将SAR船只检测精度提高约3％。

本发明的优点在于实现了船只检测中船只语高层语义信息和底层空间信息的充分提取，能够提供SAR图像中船只目标检测的方法，用来解决现有小型船只目标检测精度不足的问题。

附图说明

图1为本发明中的SAR图像中船只目标检测方法的流程示意图。

图2为本发明中的SAR图像中船只目标检测方法的平均精度，召回率和精确率。

具体实施方式

下面结合附图1对本发明作进一步详细描述。

步骤1、准备数据集

由图1所示，对于定义1中提供的公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

步骤2、构建特征提取FPN

步骤2.1：第1层FPN特征提取

由图1所示，采用定义2中的经典的卷积神经网络方法建立特征提取FPN的输入层，得到由经典的卷积神经网络组成的特征提取FPN的第1层，记为f₁，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₁，M₁，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₁的卷积核尺寸为3×3×16，采用定义6中经典卷积核步长设置方法设置C₁的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₁的卷积核步长为2；

步骤2.2：第2层FPN特征提取

由图1所示，采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第2层，记为f₂，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₂，M₂，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₂的卷积核尺寸为3×3×32，采用定义6中经典卷积核步长设置方法设置C₂的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₂的卷积核步长为2；

步骤2.3：第3层FPN特征提取

由图1所示，采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第3层，记为f₃，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₃，M₃，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₃的卷积核尺寸为3×3×64，采用定义6中经典卷积核步长设置方法设置C₃的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₃的卷积核步长为2；

步骤2.4：第4层FPN特征提取

由图1所示，采用定义2中的经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第4层，记为f₄，该层由定义7中经典的卷积层和定义8中经典的最大池化层组成，分别记为C₄，M₄，其中根据定义4中的卷积核原理，采用定义5中经典卷积核尺寸设置方法设置C₄的卷积核尺寸为3×3×128，采用定义6中经典卷积核步长设置方法设置C₄的卷积核步长为1，采用定义6中经典卷积核步长设置方法设置M₄的卷积核步长为2；

最终，得到构建的特征提取FPN和所有层的特征输出，分别记为Backbone-FPN和A_s,s＝1,...,4；

步骤3、构建特征融合FPN

由图1所示，采用公式P₁＝Conv^1×1(A₁)+UpSamping^2×(A₂)，计算得到特征融合FPN的第1层的融合特征输出，记为P₁，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，UpSamping^2×(·)表示定义11中上采样倍数为2条件下的上采样运算符号，其中A₁为特征提取FPN的第1层特征输出；

由图1所示，采用公式Q₁＝Conv^1×1(attention(P₁))，计算得到路由聚合感知FPN的第1层的特征输出，记为Q₁，其中Conv^1×1(·)表示定义10中的1×1卷积运算符号，attention(·)表示定义12中的全局注意力运算符号，其中P₁为特征融合FPN的第1层特征输出；

至此，完成了路由聚合感知FPN的构建；

步骤5、建立船只检测模型

由图1所示，将步骤1中得到的训练集Train_SSDD作为输入，在步骤4所完成的路由聚合感知FPN上采用定义14中的经典的Adam算法进行训练，训练完成后得到船只检测模型，记为PAA-FPN；

步骤6、测试船只检测模型

由图1所示，采用定义9的经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为512×512大小的新的测试集Test_SSDD_Reszie；

步骤7、评估船只检测模型

由图1所示，以步骤6中得到的船只检测模型的测试结果Result作为输入，采用定义16中的标准的评价指标计算方法，求出平均精度，召回率和精确率，分别记为AP,Recall和Precision；

至此，整个方法结束。

如图2所示，在公知的SAR船只数据集(即SSDD数据集)上的实验结果表明，本发明实现了比现有技术中定义17中的FPN更高的平均精度，召回率和精确率，表明本发明能够实现高精度的SAR图像中船只目标检测。

Claims

1.一种基于路由聚合感知FPN的SAR船只检测方法，其特征是它包括以下步骤：

步骤1、准备数据集

对于公知的SSDD数据集，采用随机的方法调整SSDD数据集中的SAR图像次序，得到新的SSDD数据集，记为SSDD_new；

步骤2、构建特征提取FPN

步骤2.1：第1层FPN特征提取

采用经典的卷积神经网络方法建立特征提取FPN的输入层，得到由经典的卷积神经网络组成的特征提取FPN的第1层，记为f₁，该层由经典的卷积层和经典的最大池化层组成，分别记为C₁，M₁，其中根据卷积核原理，采用经典卷积核尺寸设置方法设置C₁的卷积核尺寸为3×3×16，采用经典卷积核步长设置方法设置C₁的卷积核步长为1，采用经典卷积核步长设置方法设置M₁的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤1中得到的训练集Train_SSDD中的一幅SAR图像进行处理，得到第1层特征输出，记为A₁；

步骤2.2：第2层FPN特征提取

采用经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第2层，记为f₂，该层由经典的卷积层和经典的最大池化层组成，分别记为C₂，M₂，其中根据卷积核原理，采用经典卷积核尺寸设置方法设置C₂的卷积核尺寸为3×3×32，采用经典卷积核步长设置方法设置C₂的卷积核步长为1，采用经典卷积核步长设置方法设置M₂的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.1中得到的第1层特征输出A₁进行处理，得到第2层特征输出，记为A₂；

步骤2.3：第3层FPN特征提取

采用经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第3层，记为f₃，该层由经典的卷积层和经典的最大池化层组成，分别记为C₃，M₃，其中根据卷积核原理，采用经典卷积核尺寸设置方法设置C₃的卷积核尺寸为3×3×64，采用经典卷积核步长设置方法设置C₃的卷积核步长为1，采用经典卷积核步长设置方法设置M₃的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.2中得到的第2层特征输出A₂进行处理，得到第3层特征输出，记为A₃；

步骤2.4：第4层FPN特征提取

采用经典的卷积神经网络方法建立特征提取FPN的中间层，得到由经典的卷积神经网络组成的特征提取FPN的第4层，记为f₄，该层由经典的卷积层和经典的最大池化层组成，分别记为C₄，M₄，其中根据卷积核原理，采用经典卷积核尺寸设置方法设置C₄的卷积核尺寸为3×3×128，采用经典卷积核步长设置方法设置C₄的卷积核步长为1，采用经典卷积核步长设置方法设置M₄的卷积核步长为2；

采用经典的CNN特征提取方法，对步骤2.3中得到的第3层特征输出A₃进行处理，得到第4层特征输出，记为A₄；

步骤3、构建特征融合FPN

采用公式P₁＝Conv^1×1(A₁)+UpSamping^2×(A₂)，计算得到特征融合FPN的第1层的融合特征输出，记为P₁，其中Conv^1×1(·)表示1×1卷积运算符号，UpSamping^2×(·)表示上采样倍数为2条件下的上采样运算符号，其中A₁为特征提取FPN的第1层特征输出；

采用公式P₂＝Conv^1×1(A₂)+UpSamping^2×(A₃)，计算得到特征融合FPN的第2层的融合特征输出，记为P₂，其中Conv^1×1(·)表示1×1卷积运算符号，UpSamping^2×(·)表示上采样倍数为2条件下的上采样运算符号，其中A₂为特征提取FPN的第2层特征输出；

采用公式P₃＝Conv^1×1(A₃)+UpSamping^2×(A₄)，计算得到特征融合FPN的第3层的融合特征输出，记为P₃，其中Conv^1×1(·)表示1×1卷积运算符号，UpSamping^2×(·)表示上采样倍数为2条件下的上采样运算符号，其中A₃为特征提取FPN的第3层特征输出；

采用公式P₄＝Conv^1×1(A₄)，计算得到特征融合FPN的第4层的融合特征输出，记为P₄，其中Conv^1×1(·)表示1×1卷积运算符号，其中A₄为特征提取FPN的第4层特征输出；

由此得到构建的特征融合FPN和所有层的融合特征输出，分别记为FPN和P_s,s＝1,...,4；

步骤4、构建路由聚合感知FPN

采用公式Q₁＝Conv^1×1(attention(P₁))，计算得到路由聚合感知FPN的第1层的特征输出，记为Q₁，其中Conv^1×1(·)表示1×1卷积运算符号，attention(·)表示全局注意力运算符号，其中P₁为特征融合FPN的第1层特征输出；

采用公式Q₂＝Conv^1×1(P₂)+DownSamping^2×(attention(Q₁))，计算得到路由聚合感知FPN的第2层的特征输出，记为Q₂，其中Conv^1×1(·)表示1×1卷积运算符号，attention(·)表示全局注意力运算符号，DownSamping^2×(·)表示下采样倍数为2条件下的下采样运算符号，其中P₂为特征融合FPN的第2层特征输出，Q₁为路由聚合感知FPN的第1层特征输出；

采用公式Q₃＝Conv^1×1(P₃)+DownSamping^2×(attention(Q₂))，计算得到路由聚合感知FPN的第3层的特征输出，记为Q₃，其中Conv^1×1(·)表示1×1卷积运算符号，attention(·)表示全局注意力运算符号，DownSamping^2×(·)表示下采样倍数为2条件下的下采样运算符号，其中P₃为特征融合FPN的第3层特征输出，Q₂为路由聚合感知FPN的第2层特征输出；

采用公式Q₄＝Conv^1×1(P₄)+DownSamping^2×(attention(Q₃))，计算得到路由聚合感知FPN的第4层的特征输出，记为Q₄，其中Conv^1×1(·)表示1×1卷积运算符号，attention(·)表示全局注意力运算符号，DownSamping^2×(·)表示下采样倍数为2条件下的下采样运算符号，其中P₄为特征融合FPN的第4层特征输出，Q₃为路由聚合感知FPN的第3层特征输出；

至此，完成了路由聚合感知FPN的构建；

步骤5、建立船只检测模型

将步骤1中得到的训练集Train_SSDD作为输入，在步骤4所完成的路由聚合感知FPN上采用经典的Adam算法进行训练，训练完成后得到船只检测模型，记为PAA-FPN；

步骤6、测试船只检测模型

采用经典的图像重采样方法对步骤1中得到的测试集Test_SSDD进行图像采样，得到每个图像重新整形为512×512大小的新的测试集Test_SSDD_Reszie；

采用得到的测试集Test_SSDD_Resize，在步骤5中得到的船只检测模型PAA-FPN上采用标准的检测网络测试方法进行测试，得到测试集在船只检测模型的测试结果，记为Result；

步骤7、评估船只检测模型

以步骤6中得到的船只检测模型的测试结果Result作为输入，采用标准的评价指标计算方法，求出平均精度，召回率和精确率，分别记为AP,Recall和Precision；

至此，整个方法结束。