CN114331950A - 基于稠密连接稀疏激活网络的sar图像舰船检测方法 - Google Patents

基于稠密连接稀疏激活网络的sar图像舰船检测方法 Download PDF

Info

Publication number
CN114331950A
CN114331950A CN202111165056.9A CN202111165056A CN114331950A CN 114331950 A CN114331950 A CN 114331950A CN 202111165056 A CN202111165056 A CN 202111165056A CN 114331950 A CN114331950 A CN 114331950A
Authority
CN
China
Prior art keywords
network
convolution
sar image
ship
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111165056.9A
Other languages
English (en)
Inventor
梁毅
孙昆
怀园园
刘恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202111165056.9A priority Critical patent/CN114331950A/zh
Publication of CN114331950A publication Critical patent/CN114331950A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于稠密连接稀疏激活网络的SAR图像舰船检测方法,包括:获取待测SAR图像;将待测SAR图像输入至预先训练完成的检测网络,得到待测SAR图像对应的舰船目标定位结果;其中,检测网络是基于多个训练图像训练获得的;检测网络包括:特征提取模块,用于从待测SAR图像中提取多个特征图;特征融合模块,用于对多个特征图进行特征融合,得到多个不同尺度的特征融合图;目标区域检测模块,用于对多个不同尺度的特征融合图进行无锚框式目标区域检测,得到舰船目标定位结果。本发明的基于稠密连接稀疏激活网络的SAR图像舰船检测方法在取得较高的检测精度同时具有最小的参数量和计算复杂度。

Description

基于稠密连接稀疏激活网络的SAR图像舰船检测方法
技术领域
本发明属于雷达信号处理领域,具体涉及一种基于稠密连接稀疏激活 网络的SAR图像舰船检测方法。
背景技术
合成孔径雷达(Synthetic aperture radar,SAR)具有全天时、全天候对 地观测的独特能力,在海洋勘探中占有重要地位。随着一些星载SAR传感 器平台(如RA-DARSAT-2、TerraSAR-X、GF-III)的投入使用,高分辨率SAR 图像不再难以获取,这促进了SAR图像在海洋监测中的应用。
舰船目标检测一直是SAR系统的关键问题。传统的基于恒虚警率 (CFAR)的方法不能很好地应用于多尺度或近岸船舶检测等复杂条件下。 随着深度学习的发展,基于卷积神经网络(CNN)的方法被用于解决这些 问题,并取得了良好的性能。然而,现有的基于CNN的舰船目标检测方法 直接使用普通的卷积结构来构建特征提取网络,参数量较大,导致基于CNN 的舰船目标检测器的计算复杂度较高,难以满足某些资源受限平台的应用 要求。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于稠密连 接稀疏激活网络的SAR图像舰船检测方法。本发明要解决的技术问题通过 以下技术方案实现:
本发明提供了一种基于稠密连接稀疏激活网络的SAR图像舰船检测方 法,包括:
获取待测SAR图像;
将所述待测SAR图像输入至预先训练完成的检测网络,得到所述待测 SAR图像对应的舰船目标定位结果;
其中,所述检测网络是基于多个训练图像训练获得的;所述检测网络 包括:
特征提取模块,用于从所述待测SAR图像中提取多个特征图,所述特 征提取模块包括第一卷积单元和多个第二卷积单元,其中,所述第一卷积 单元作为所述特征提取模块的第一层级,所述第一卷积单元和多个所述第 二卷积单元按照密集连接方式堆叠,所述第一卷积单元为传统卷积结构, 所述第二卷积单元为稀疏激活卷积结构;
特征融合模块,用于对多个所述特征图进行特征融合,得到多个不同 尺度的特征融合图,所述特征融合模块为深度特征融合金字塔结构;
目标区域检测模块,用于对多个不同尺度的所述特征融合图进行无锚 框式目标区域检测,得到所述舰船目标定位结果。
在本发明的一个实施例中,所述稀疏激活卷积结构包括依次连接的若 干稀疏激活模块,所述稀疏激活模块包括依次连接的分组卷积层、深度卷 积层和传统卷积层。
在本发明的一个实施例中,在所述稀疏激活模块内通过通道重排操作, 实现各卷积层的跨通道交互和信息整合。
在本发明的一个实施例中,所述特征提取模块的第i层级的输出表示为:
Figure BDA0003291067660000021
其中,Conv表示卷积操作,HSA(·)表示稀疏激活卷积结构,X0表示第 一层级的输入,X1,o,...,Xi-1,o表示相应层级输出的特征图按照通道维度拼接。
在本发明的一个实施例中,对多个所述特征图进行特征融合,得到多 个不同尺度的特征融合图,包括:
对多个所述特征图进行上采样操作,得到若干中间特征融合图;
对若干所述中间特征融合图进行下采样操作,得到多个不同尺度的特 征融合图。
在本发明的一个实施例中,所述目标区域检测模块包括分类子网络和 回归子网络,其中,
所述分类子网络用于确定舰船目标的中心点位置;
所述回归子网络用于对舰船目标的预测框进行回归,得到所述舰船目 标定位结果。
在本发明的一个实施例中,所述预测框通过四维向量(xt,yt,xb,xb)表示, 其中,(xt,yt)表示预测框左上角坐标,(xb,xb)表示预测框右下角坐标;
所述预测框的参数定义如下:
v=(l,t,r,b),
Figure BDA0003291067660000031
其中,l,t,r,b分别表示舰船目标的中心点距离预测框的左边界、上边界、 右边界和下边界的距离,(x,y)表示舰船目标的中心点。
在本发明的一个实施例中,所述目标区域检测模块的训练损失函数通 过所述分类子网络的质量损失函数与所述回归子网络的回归损失函数加权 得到;
所述目标区域检测模块的训练损失函数为,
Figure BDA0003291067660000041
所述分类子网络的质量损失函数为,
Figure BDA0003291067660000042
所述回归子网络的回归损失函数为,
Figure BDA0003291067660000043
其中,Npos为正样本的数量,
Figure BDA0003291067660000044
表示正样本区域,qx,y表示质量分数的 预测,
Figure BDA0003291067660000045
表示质量分数的标注,β表示聚焦系数,bx,y表示预测框的参数 (l,t,r,b),b'x,y表示标注框的参数(l,t,r,b),ρ(·)表示欧氏距离,c表示覆盖 (B,Bgt)最小矩形区域的对角线长度,B表示预测框所占区域,Bgt表示标注 框所占区域,b表示预测框中心点,bgt表示标注框中心点,IoU表示交并比。
与现有技术相比,本发明的有益效果在于:
本发明的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,利用 检测网络对待测SAR图像进行检测,得到待测SAR图像对应的舰船目标定位 结果,该检测网络使用分组卷积和深度卷积构建的稠密连接稀疏激活卷积 结构提取图像特征,降低了计算复杂度,采用深度特征融合网络对提取的 多尺度和多层次特征进一步融合,解决了多尺度舰船目标检测困难的问题, 采用一种无锚框的舰船目标检测技术对舰船目标进行检测,提升了舰船目 标检测的准确性,本发明的方法在取得较高的检测精度同时具有最小的参 数量和计算复杂度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的 技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和 其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附 图,详细说明如下。
附图说明
图1是本发明实施例提供的一种基于稠密连接稀疏激活网络的SAR图 像舰船检测方法的流程示意图;
图2是本发明实施例提供的一种检测网络的结构框图;
图3是本发明实施例提供的一种特征提取模块的结构框图;
图4是本发明实施例提供的不同卷积网络结构示意图;
图5是本发明实施例提供的密集连接的示意图;
图6是本发明实施例提供的一种稀疏激活卷积结构的示意图;
图7是本发明实施例提供的一种DSNet的结构示意图;
图8是本发明实施例提供的一种深度特征融合金字塔结构示意图;
图9是本发明实施例提供的一种典型SAR舰船图像;
图10是本发明实施例提供的anchor-free检测器的结构图;
图11是本发明实施例提供的一种检测网络的结构示意图;
图12是本发明实施例提供的一种计算复杂度对比图。
具体实施方式
为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效, 以下结合附图及具体实施方式,对依据本发明提出的一种基于稠密连接稀 疏激活网络的SAR图像舰船检测方法进行详细说明。
有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的 具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可 对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地 了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术 方案加以限制。
实施例一
请参见图1,图1是本发明实施例提供的一种基于稠密连接稀疏激活网 络的SAR图像舰船检测方法的流程示意图,如图所示,本实施例的SAR 图像舰船检测方法包括以下步骤:
S10:获取待测SAR图像;
需要说明的是,待测SAR图像中包含有待定位的目标,在本实施例中, 待测SAR图像中包含有待定位的舰船。
S20:将待测SAR图像输入至预先训练完成的检测网络,得到待测SAR 图像对应的舰船目标定位结果。
其中,检测网络是基于多个训练图像训练获得的,在本实施例中,训 练图像中标记有舰船目标的标注框。
请参见图2,图2是本发明实施例提供的一种检测网络的结构框图。如 图所示,本实施例的检测网络包括特征提取模块、特征融合模块和目标区 域检测模块,其中,特征提取模块用于从待测SAR图像中提取多个特征图, 特征融合模块用于对多个特征图进行特征融合,目标区域检测模块用于对 多个不同尺度的特征融合图进行无锚框式目标区域检测,得到舰船目标定 位结果。
在本实施例中,舰船目标定位结果为利用预测框对输入的待测SAR图 像中的舰船目标进行标注。
具体地,结合参见图3,图3是本发明实施例提供的一种特征提取模块 的结构框图,如图所示,特征提取模块包括第一卷积单元和多个第二卷积 单元,其中,第一卷积单元和多个第二卷积单元按照密集连接方式堆叠, 第一卷积单元为传统卷积结构,第二卷积单元为稀疏激活卷积结构。
需要说明的是,第一卷积单元作为特征提取模块的第一层级,多个第 二卷积单元依次类推作为特征提取模块的第二层级、第三层级、第四层级 等,在本实施例中,特征提取模块中具体的层级数设置在此不做限制。
在本实施例中,稀疏激活卷积结构是基于分组卷积结构和深度卷积结 构形成的。
传统卷积神经网络在现代基于深度学习的目标检测器中得到了广泛的 应用,其良好的特征提取能力往往伴随着大量的参数和较高的计算复杂度。 分组卷积(GroupConvolution)和深度卷积(Depthwise Convolution)是通 过改变通道之间的卷积密度来降低计算复杂度的两种卷积结构。
请参见图4,图4是本发明实施例提供的卷积网络结构示意图,其中, (a)图为传统卷积结构,(b)图为分组卷积结构,(c)图为深度卷积结构 如图所示,从(a)图可以看出,传统卷积结构需要对每个特征图进行处理, 生成新的特征图,对于(a)图,传统卷积需要8×4=32个卷积操作。与传 统卷积相比,分组卷积具有较低的计算复杂度,对于(b)图,分组卷积需 要4×4=16个卷积操作。深度卷积只需要对一个输入通道进行卷积,因此, 对于(c)图,深度卷积只有8×1=8个卷积操作。
在本实施例中,通过将分组卷积结构和深度卷积结构结合的方式设计 特征提取模块,其中分组卷积结构负责混合通道信息,深度卷积结构用于 对输入特征进一步深度提取,两者相互配合,替换传统计算复杂度的卷积 方式,实现了轻量化的深度特征提取。
需要说明的是,在本实施例中,将第一卷积单元和多个第二卷积单元 按照密集连接方式堆叠,可以更好地整合网络不同层次之间的信息。
在卷积神经网络中,随着网络深度增长,信息丰富度由低到高,特征 的抽象性逐渐提升,空间分辨率逐渐降低,无法从单层特征同时获得高分 辨率、多尺度表征以及全局语义信息。在目标检测任务中,低层特征能提 供高分辨的位置和细节信息,这对检测小目标十分重要;高层特征虽然分 辨率较低,但能提供更大感受野和更加丰富的语义信息,挖掘出目标更为 本质的特性,对大目标检测及目标信息的综合判断起到至关重要的作用。
在ResNet基础上,密集连接网络提出了网络连接的新模式,引入了从 任何层到后续所有层的直接连接,如图5所示,图5是本发明实施例提供 的密集连接的示意图。首先,与直观所见不同,密集连接方式反而比传统 的深度神经网络需要更少的参数,这是因为密集连接不需要学习冗余特征, 每层只需要按照增长速率δ(如取12),生成δ个特征图,再与之前层特征图 拼接,使网络具有“集体知识”。其次,密集连接方式可以改善网络中的信 息流动,便于训练,每一条跨层连接使得损失函数和输入信息存在梯度的 直接路径,便于更深的网络训练。最后,密集连接还具有正则化效果,能 减少训练数据集上的过拟合现象。然而即使密集连接网络层间的增长速率δ 是一个较小的值,减少网络参数,但由于不同层间的拼接操作以及网络深 度,最终得到特征图的通道数仍然很大,使得网络模型计算复杂度较大。
而在本实施例中,基于设计的稀疏激活卷积结构形成了一种密集连接 的稀疏卷积结构(DSNet结构)作为特征提取模块,该卷积结构作为特征 提取模块不仅可以更好地整合网络不同层次之间的信息,而且降低了网络 的计算复杂度。
在本实施例中,特征提取模块首先采用密集连接模型重用浅层特征, 整合网络不同阶段的特征信息至当前层,实现浅层特征和深层特征的融合; 其次利用稀疏激活卷积结构(即,分组卷积和深度卷积)方式对特征进行 提取变换,激活输入特征,实现深层次特征提取和信息挖掘,同时降低模 型计算复杂度;最后,通过通道随机混合操作,消除分组卷积和深度卷积 带来的通道交互少的弊端,实现信息在不同通道组之间的流通。
具体地,稀疏激活卷积结构包括依次连接的若干稀疏激活模块,如图6 所示,图6是本发明实施例提供的一种稀疏激活卷积结构的示意图,在该稀 疏激活卷积结构中包括有1个稀疏激活模块,其中,稀疏激活模块包括依次 连接的分组卷积层、深度卷积层和传统卷积层。
在本实施例中,在稀疏激活模块内通过通道重排操作,实现各卷积层 的跨通道交互和信息整合。
如图6所示,稀疏激活卷积结构(Sparse-Activate module,SA module) 有两条分支,每条分支进行不同的操作后,再汇总拼接。首先,该结构分 支的方式是通道划分而不是ResNet残差模块中的特征共享复制;其次,右 支路包含3个卷积(即分组卷积、深度卷积和传统卷积层)以及1个通道 重排操作,以实现跨通道的交互和信息整合;然后,左分支做同等映射, 并与右分支结果沿通道维度拼接,这与输入时的通道划分是对应关系;最 后,对拼接结果再进行一次通道重排,实现左右分支的信息流通。
需要说明的是,不同层级的第二卷积单元中稀疏激活模块的个数以及 每个稀疏激活模块中分组卷积层、深度卷积层和传统卷积层的结构参数(卷 积核尺寸、通道数目、分组数目、步长、输入尺寸、输出尺寸、输出通道 书)根据实际情况设置,在此不做限制。
具体地,在本实施例中,特征提取模块设置有5个层级,即包括密集 连接的1个第一卷积单元(传统卷积结构)和4个第二卷积单元(稀疏激 活卷积结构),如图7所示,图7是本发明实施例提供的一种DSNet的结 构示意图,其具体的结构参数参见表1,其中GConv表示分组卷积,DWConv 表示深度卷积,Conv表示传统卷积。
在本实施例中,特征提取模块的第i层级的输出表示为:
Figure BDA0003291067660000101
其中,Conv表示卷积操作,HSA(·)表示稀疏激活卷积结构,X0表示第 一层级的输入,X1,o,...,Xi-1,o表示相应层级输出的特征图按照通道维度拼接。
表1 DSNet结构参数
Figure BDA0003291067660000102
Figure BDA0003291067660000111
在本实施例中,通过设计的稀疏激活卷积结构,旁路直连加强了浅层 特征的重用,保证了更加精细的特征提取能力;通道划分操作使得稀疏卷 积分支的通道数量得以减少,降低了模型计算复杂度;使用通道拼接而不 是相加操作,进一步缓解深度网络训练中梯度弥散问题,网络训练更加快 速。
进一步地,特征融合模块为深度特征融合金字塔结构,在本实施例中, 采用深度特征融合金字塔结构对特征提取模块提取的多个特征图进一步融 合,具体包括:
对多个特征图进行上采样操作,得到若干中间特征融合图;
对若干中间特征融合图进行下采样操作,得到多个不同尺度的特征融 合图。
在目标检测模型中,特征是影响模型检测性能的重要因素。通常来说, 深层特征通过较大的感受野获得了丰富的高层语义信息,但是空间分辨率 较低,对小尺度目标检测效果较差;而浅层特征能提供高分辨的位置和细 节信息,定位精度高,但是抽象语义信息较少,分类性能差。因而仅使用 单层特征图检测目标的早期方法,容易受到浅层特征和深层特征的信息不 平衡影响,使得多尺度舰船检测的性能降低。因此,利用不同层次的特征构造特征金字塔来检测目标是一种合理可行的技术。此外,目标的位置信 息和语义特征信息分布在浅层特征和深层特征上,对多层特征信息进行适 当融合能有效提高目标检测效果。
在本实施例中,特征融合的思想也体现在特征提取模块中,通过密集 连接,一定程度上将浅层特征融合到深层特征,但浅层特征仍然缺少足够 的语义信息,因而需要进一步的特征信息融合。
在本实施例中,通过采用深度特征融合金字塔结构,可以使得融合后 的深层特征获得更丰富的空间位置信息和细节信息,浅层特征获得更多的 高层语义特征,从而使得后续的目标区域检测模块对多尺度目标都能取得 较好的检测结果。
请参见图8,图8是本发明实施例提供的一种深度特征融合金字塔结构 示意图,如图所示,其前端输入为特征提取模块不同阶段(第三层级、第 四层级和第五层级)的输出特征{C3,C4,C5},首先通过上采样操作引入自顶向 下的连接路径,将高层语义特征融入浅层特征里,{N′3,N′4,N′5}表示初步融合 后的各级特征,即中间特征融合图,在一定程度上解决了由于浅层特征抽 象语义信息缺失而无法直接分类的问题。其次,在{N′3,N′4,N′5}基础上引入自 底向上的特征聚合路径,将一定的浅层高分辨位置特征融合至深层语义特 征中,融合后的各特征层将兼具高层语义信息和高分辨位置信息,用于后 续的目标区域检测,{N3,N4,N5}表示特征融合模块生成的多个不同尺度的特 征融合图。
为了降低计算复杂度,在本实施例中,使用较少的卷积运算来简化深 度特征融合金字塔。具体来讲,对于特征层C3-C5,首先经过一个1×1卷积 层,然后在这一层的每个元素中加入上采样的高层特征,获得中间特征, 最后,采用自上而下路径对中间特征进行处理。具体操作如下:
Figure BDA0003291067660000131
其中,Conv1×1(·)表示卷积核大小为1×1的卷积操作,up_sampled(·)为两 倍上采样操作,down_sampled(·)为两倍下采样操作。
进一步地,对于目标区域的检测,在基于深度学习目标检测算法中, 目标区域的检测方式一般分为anchor-based(锚框式)和anchor-free(无锚 框式),两者区别在于是否利用预设的锚框(anchor)提取目标候选框。具 体来说,anchor是在网络训练之前,人为的设置一组长宽比和尺度不同的 矩形框,在目标区域检测时由这些anchor在特征图滑动提取n个候选区域 框再做进一步的分类和回归。这种anchor-based检测方式性能依赖于anchor 长宽尺度设置的准确性,如果与目标实际比例相差较大,则会严重下降目 标检测的性能。
anchor-free的检测方法直接预测目标的长宽信息和位置信息,无需预设 一定的长宽比。首先,预测特征图上该点是目标中心的置信度;其次,回 归该特征点作为目标中心时,距离目标边界的距离;最后,预测该特征点 作为目标时的分类置信度。这种anchor-free检测方式避免了预设目标框的 长宽比和尺度严重依赖先验信息的问题,适用性更广,但是存在训练较难 的问题。
在舰船目标检测中,通过对舰船几何形状的研究,发现舰船目标的几 何形状一般为长椭圆,方向是任意的。因此在实际SAR图像中,舰船目标 的边界框会有很大的变化,会出现极端的长宽比,如图9所示,图9是本 发明实施例提供的一种典型SAR舰船图像。然而在anchor-based检测方法 中,anchor的设计是根据先验信息设置,不能完全描述舰船目标的形状, 即使网络回归分支可以微调anchor长宽比,但anchor仍然具有较低的灵活 性,故anchor-based检测方法很可能会造成形状特殊的舰船目标漏检,从而 降低检测性能。因此,本实施例的目标区域检测模块,采用anchor-free框 架作为舰船目标区域检测方法,对多个不同尺度的特征融合图进行检测。
具体地,如图10所示,图10是本发明实施例提供的anchor-free检测 器的结构图,(a)图为传统的基于anchor-free方法的检测器头部结构,(b) 图为本实施例的目标区域检测模块的结构图。本实施例的目标区域检测模 块包括分类子网络和回归子网络,其中,分类子网络用于确定舰船目标的 中心点位置;回归子网络用于对舰船目标的预测框进行回归,得到舰船目 标定位结果。
在本实施例中,采用anchor-free架构,将边界框的位置作为训练样本, 而不是anchor,直接在像素点上回归该位置上的目标边界框。在正样本选 择时将ground truthbox(真实框)中的所有点都作为正样本,这不同于基 于anchor的方法只选择IoU(intersection over union,交并比)得分高的预 测框作为正样本。
具体地,预测框通过四维向量(xt,yt,xb,xb)表示,其中,(xt,yt)表示预测 框左上角坐标,(xb,xb)表示预测框右下角坐标;预测框的参数定义如下:
v=(l,t,r,b) (3),
Figure BDA0003291067660000151
其中,l,t,r,b分别表示舰船目标的中心点距离预测框的左边界、上边界、 右边界和下边界的距离,(x,y)表示舰船目标的中心点。
需要说明的是,传统的基于anchor-free方法的检测器头部(head)部 分一般会包含三个分支:(1)分类得分,表示预测框中目标的分类置信度; (2)预测框位置向量,表示预测框边界距离中心点的偏移向量,如l,t,r, b;(3)预测框质量估计,表示预测框与真实框的相似程度,可以用centerness 或IoU指标。
基于深度学习的检测器通常采用非极大值抑制(NMS)操作来选择目标 的位置,对所有检测结果的分类置信度进行排序,筛选正负样本,进行损 失函数计算。然而anchor-free检测结果经过筛选后,会引起正负样本数量 失衡,使得网络训练时难以优化正样本的检测性能。因此,RetinaNet提出 了Focal Loss,主要思想是计算损失函数时赋予正负样本不同的权重,同时 也赋予易分类和难分类样本不同的权重,使得网络训练更专注于正样本和 难例样本的优化,目前这种损失函数已广泛应用anchor-free检测方法中。 Focal Loss公式如下:
Figure BDA0003291067660000152
其中,y表示正负样本类别,y取值1为正样本,0为负样本,y′为检 测器的输出,α为平衡因子,γ为聚焦系数。在Focal Loss中,通过α控制 正负样本对整体loss的权重,(1-y′)γ为调制系数,增加难分类样本的权重, 从而使得模型更专注于难分类样本。
然而,在整个anchor-free检测过程中,存在一个问题:检测头分类得 分和质量分数在训练和测试阶段不一致,训练阶段计算损失函数只用分类 得分筛选正负样本,但测试阶段却根据分类得分和质量得分的乘积进行 NMS筛选排序,因此可能存在分类得分较低但却具有高质量得分的边界框。
为了解决训练阶段和测试阶段的不一致问题,在目标区域检测模块的 训练损失函数中拟引入质量损失,将分类得分和质量得分进行联合表示, 替换单一的分类得分。
具体地,目标区域检测模块的训练损失函数通过分类子网络的质量损 失函数与回归子网络的回归损失函数加权得到,
目标区域检测模块的训练损失函数为,
Figure BDA0003291067660000161
分类子网络的质量损失函数为,
Figure BDA0003291067660000162
在本实施例中,分类子网络的质量损失采用聚焦损失来衡量质量预测 分数和标注的差距。
回归子网络的回归损失函数为,
Figure BDA0003291067660000163
其中,Npos为正样本的数量,
Figure BDA0003291067660000164
表示正样本区域,qx,y表示质量分数的 预测,
Figure BDA0003291067660000165
表示质量分数的标注,β表示聚焦系数,bx,y表示预测框的参数 (l,t,r,b),b'x,y表示标注框的参数(l,t,r,b),ρ(·)表示欧氏距离,c表示覆盖(B,Bgt)最小矩形区域的对角线长度,B表示预测框所占区域,Bgt表示标注 框所占区域,b表示预测框中心点,bgt表示标注框中心点,IoU表示交并比。
本实施例的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,利 用检测网络对待测SAR图像进行检测,得到待测SAR图像对应的舰船目标 定位结果,该检测网络使用分组卷积和深度卷积构建的稠密连接稀疏激活 卷积结构提取图像特征,降低了计算复杂度,采用深度特征融合网络对提 取的多尺度和多层次特征进一步融合,解决了多尺度舰船目标检测困难的 问题,采用一种无锚框的舰船目标检测技术对舰船目标进行检测,提升了舰船目标检测的准确性,本发明的方法在取得较高的检测精度同时具有最 小的参数量和计算复杂度。
实施例二
本实施例通过仿真实验对实施例一的基于稠密连接稀疏激活网络的 SAR图像舰船检测方法的效果进行具体说明。本实施例的检测网络的结构 如图11所示,图11是本发明实施例提供的一种检测网络的结构示意图。
数据集以及参数选取参见表2。
表2数据集参数
Figure BDA0003291067660000171
检测网络在COCO数据集上进行了预训练,训练代数为100,使用随 机梯度下降(SGD)算法作为优化器。初始学习率设为0.1,衰减时间分别 为第50和75轮,设置为0.01和0.001。
为了评估其效果性能,在Faster R-CNN、YOLOv3、FCOS、SSD和 EfficientDet上进行了对比实验。检测性能的对比结果如下:DSNet 1.0x的 AP、AP50、AP75、AP、APm、APl分别为59.8%、94.6%、69.8%、55.0%、 66.9%、61.8%。DSNet 2.0x骨干的AP、AP50、AP75、AP、APm、APl分 别为60.5%、96.7%、70.2%、56.3%、68.1%、58.9%。与比较方法相比,本 发明的方法在几乎所有的评价标准上都具有明显的性能优势。与DSNet 1.0x 相比,DSNet2.0x具有更好的性能,这说明使用较高的空间分辨率的特征 可以提高检测性能。
请参见图12,图12是本发明实施例提供的一种计算复杂度对比图,其 中,(a)图为精度与参数量的对比图,(b)图为精度与计算复杂度的对比 图,图中横坐标为算法名称,左侧纵坐标为平均精度(AP),(a)图的右侧 纵坐标为参数量(M),(b)图的右侧纵坐标为浮点操作量(G)。从图可以 看出本发明的方法在保证较高计精度的同时参数量和计算复杂度在对比算 法中都是最低的。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用 来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者 暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语 “包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括 一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出 的其他要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素, 并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。“连接” 或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括 电性的连接,不管是直接的还是间接的。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明, 不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域 的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简 单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,包括:
获取待测SAR图像;
将所述待测SAR图像输入至预先训练完成的检测网络,得到所述待测SAR图像对应的舰船目标定位结果;
其中,所述检测网络是基于多个训练图像训练获得的;所述检测网络包括:
特征提取模块,用于从所述待测SAR图像中提取多个特征图,所述特征提取模块包括第一卷积单元和多个第二卷积单元,其中,所述第一卷积单元作为所述特征提取模块的第一层级,所述第一卷积单元和多个所述第二卷积单元按照密集连接方式堆叠,所述第一卷积单元为传统卷积结构,所述第二卷积单元为稀疏激活卷积结构;
特征融合模块,用于对多个所述特征图进行特征融合,得到多个不同尺度的特征融合图,所述特征融合模块为深度特征融合金字塔结构;
目标区域检测模块,用于对多个不同尺度的所述特征融合图进行无锚框式目标区域检测,得到所述舰船目标定位结果。
2.根据权利要求1所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,所述稀疏激活卷积结构包括依次连接的若干稀疏激活模块,所述稀疏激活模块包括依次连接的分组卷积层、深度卷积层和传统卷积层。
3.根据权利要求2所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,在所述稀疏激活模块内通过通道重排操作,实现各卷积层的跨通道交互和信息整合。
4.根据权利要求1所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,所述特征提取模块的第i层级的输出表示为:
Figure FDA0003291067650000021
其中,Conv表示卷积操作,HSA(·)表示稀疏激活卷积结构,X0表示第一层级的输入,X1,o,...,Xi-1,o表示相应层级输出的特征图按照通道维度拼接。
5.根据权利要求1所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,对多个所述特征图进行特征融合,得到多个不同尺度的特征融合图,包括:
对多个所述特征图进行上采样操作,得到若干中间特征融合图;
对若干所述中间特征融合图进行下采样操作,得到多个不同尺度的特征融合图。
6.根据权利要求1所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,所述目标区域检测模块包括分类子网络和回归子网络,其中,
所述分类子网络用于确定舰船目标的中心点位置;
所述回归子网络用于对舰船目标的预测框进行回归,得到所述舰船目标定位结果。
7.根据权利要求6所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,所述预测框通过四维向量
Figure FDA0003291067650000022
表示,其中,(xt,yt)表示预测框左上角坐标,(xb,xb)表示预测框右下角坐标;
所述预测框的参数定义如下:
v=(l,t,r,b),
Figure FDA0003291067650000023
其中,l,t,r,b分别表示舰船目标的中心点距离预测框的左边界、上边界、右边界和下边界的距离,(x,y)表示舰船目标的中心点。
8.根据权利要求6所述的基于稠密连接稀疏激活网络的SAR图像舰船检测方法,其特征在于,所述目标区域检测模块的训练损失函数通过所述分类子网络的质量损失函数与所述回归子网络的回归损失函数加权得到;
所述目标区域检测模块的训练损失函数为,
Figure FDA0003291067650000031
所述分类子网络的质量损失函数为,
Figure FDA0003291067650000032
所述回归子网络的回归损失函数为,
Figure FDA0003291067650000033
其中,Npos为正样本的数量,
Figure FDA0003291067650000034
表示正样本区域,qx,y表示质量分数的预测,
Figure FDA0003291067650000035
表示质量分数的标注,β表示聚焦系数,bx,y表示预测框的参数(l,t,r,b),b'x,y表示标注框的参数(l,t,r,b),ρ(·)表示欧氏距离,c表示覆盖(B,Bgt)最小矩形区域的对角线长度,B表示预测框所占区域,Bgt表示标注框所占区域,b表示预测框中心点,bgt表示标注框中心点,IoU表示交并比。
CN202111165056.9A 2021-09-30 2021-09-30 基于稠密连接稀疏激活网络的sar图像舰船检测方法 Pending CN114331950A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111165056.9A CN114331950A (zh) 2021-09-30 2021-09-30 基于稠密连接稀疏激活网络的sar图像舰船检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111165056.9A CN114331950A (zh) 2021-09-30 2021-09-30 基于稠密连接稀疏激活网络的sar图像舰船检测方法

Publications (1)

Publication Number Publication Date
CN114331950A true CN114331950A (zh) 2022-04-12

Family

ID=81045679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111165056.9A Pending CN114331950A (zh) 2021-09-30 2021-09-30 基于稠密连接稀疏激活网络的sar图像舰船检测方法

Country Status (1)

Country Link
CN (1) CN114331950A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116682013A (zh) * 2023-06-07 2023-09-01 无锡照明股份有限公司 一种光源故障点识别方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116682013A (zh) * 2023-06-07 2023-09-01 无锡照明股份有限公司 一种光源故障点识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112308019B (zh) 基于网络剪枝和知识蒸馏的sar舰船目标检测方法
CN114119582B (zh) 一种合成孔径雷达图像目标检测方法
CN112766087A (zh) 一种基于知识蒸馏的光学遥感图像舰船检测方法
CN110427981B (zh) 基于深度神经网络的sar船舶检测系统及方法
CN112183432B (zh) 一种基于中分辨率sar图像的建筑区提取方法以及系统
CN111368690B (zh) 基于深度学习的海浪影响下视频图像船只检测方法及系统
CN111476159B (zh) 一种基于双角回归的检测模型训练、检测方法及装置
CN110084294A (zh) 一种基于多尺度深度特征的遥感影像分类方法
CN110826379B (zh) 一种基于特征复用与YOLOv3的目标检测方法
CN114565860B (zh) 一种多维度增强学习合成孔径雷达图像目标检测方法
CN110555841B (zh) 基于自注意图像融合和dec的sar图像变化检测方法
Wan et al. AFSar: An anchor-free SAR target detection algorithm based on multiscale enhancement representation learning
Wang et al. Ship detection based on fused features and rebuilt YOLOv3 networks in optical remote-sensing images
CN110287806A (zh) 一种基于改进ssd网络的交通标志识别方法
CN109977968A (zh) 一种深度学习分类后比较的sar变化检测方法
CN116168240A (zh) 基于注意力增强的任意方向密集舰船目标检测方法
Fan et al. A novel sonar target detection and classification algorithm
CN117372898A (zh) 一种基于改进yolov8的无人机航拍图像目标检测方法
CN116342894A (zh) 基于改进YOLOv5的GIS红外特征识别系统及方法
CN116755090A (zh) 基于新型金字塔结构和混合池化通道注意力机制的sar舰船检测方法
CN114565824A (zh) 基于全卷积网络的单阶段旋转舰船检测方法
CN113361528B (zh) 一种多尺度目标检测方法及系统
Hu et al. Supervised multi-scale attention-guided ship detection in optical remote sensing images
CN114331950A (zh) 基于稠密连接稀疏激活网络的sar图像舰船检测方法
CN110008899A (zh) 一种可见光遥感图像候选目标提取与分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination