CN114972851A - 一种基于遥感影像的船只目标智能检测方法 - Google Patents

一种基于遥感影像的船只目标智能检测方法 Download PDF

Info

Publication number
CN114972851A
CN114972851A CN202210512505.0A CN202210512505A CN114972851A CN 114972851 A CN114972851 A CN 114972851A CN 202210512505 A CN202210512505 A CN 202210512505A CN 114972851 A CN114972851 A CN 114972851A
Authority
CN
China
Prior art keywords
feature
feature extraction
network
remote sensing
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210512505.0A
Other languages
English (en)
Inventor
刘烨翔
岳冰莹
胡宇昂
姚昕彤
尹逸斐
师皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202210512505.0A priority Critical patent/CN114972851A/zh
Publication of CN114972851A publication Critical patent/CN114972851A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于遥感影像的船只目标智能检测方法,将光学遥感影像输入到特征提取网络得到初步的特征提取结果;对初步提取到的特征输入到基于多层垂直注意力模块的特征金字塔网络,得到更加精细化的特征提取融合结果,再经过具有ECA注意力增强模块的head检测头,以实现对船只目标的分类检测和定位。相较于之前的光学遥感影像船只检测方法,本方案通过先对光学遥感影像完成初步的特征提取、然后利用基于多层垂直注意力模块的特征金字塔网络对提取到的初步提取结果进行精修,提高了船只的检测精度。

Description

一种基于遥感影像的船只目标智能检测方法
技术领域
本发明涉及光学遥感影像目标检测技术领域,尤其涉及一种在复杂背景下的光学遥感影像的船只目标智能检测方法。
背景技术
船只检测是遥感影像研究的热点领域,因其能广泛应用于水上交通监管、渔业管理以及船只救援等重要方面。过去常使用全天时、受天气影响较小的合成孔径雷达(SAR)图像对船只进行检测。随着今年来光学遥感影像分辨率的不断提高,相比于SAR图像,光学遥感影像能够提供更为丰富的视觉信息,从而有利于船只的定位以及检测。
之前,光学遥感影像检测方法主要有2个步骤:首先对图像进行特征提取,再使用分类器对其进行分类。但这些方法通常仅提取了低层特征,对于海浪、云层以及岛屿等干扰没有良好的鲁棒性;人工选取特征非常耗时且强烈依赖于专业知识和数据本身的特征;且没有利用光学遥感影像丰富详细的视觉信息对船只类型进行高效精细的分类。
随着机器学习的出现和发展,人们试图通过构建一系列机器学习公式对数据进行非线性变换,从而模仿大脑视觉皮层的抽象过程,卷积神经网络(CNN)就是受视觉皮层的深层结构启发而产生的。近年来,卷积神经网络(CNN)在图像分析领域不断取得突破性进展,通过设计、改善神经网络的结构,能够同时实现船只的检测和分类,提高准确率。
发明内容
本发明提供了一种基于遥感影像的船只目标智能检测方法,主要解决的技术问题是:如何提高在复杂背景下的光学遥感影像船只目标检测精度。
为解决上述技术问题,本发明提供一种基于遥感影像的船只目标智能检测方法,包括:
将光学遥感影像输入到特征提取网络,得到初步的特征提取结果;
将初步的特征提取结果中的特征图送入到基于多层垂直注意力模块的特征金字塔网络,得到精细化的特征提取结果;
将精细后化的特征提取结果中的特征图的分辨率大小进行调整重构出金字塔结构,并将不同分辨率大小的特征图送入到分类分支前增加了一个ECA注意力增强模块的head预测头中,得到最终的船只检测结果。
可选的,所述将光学遥感影像输入到特征提取网络,得到初步的特征提取结果包括:
将所述光学遥感影像输入到图像分类网络的主干网络,得到所述初步的特则提取结果。
可选的,所述图像分类网络的主干网络包括Swin Transformer网络。
可选的,所述head预测头采用FCOS无锚框检测网络的检测头,以预测最终的船只目标类别和目标框。
可选的,所述将初步的特征提取结果中的特征图送入到基于多层垂直注意力模块的特征金字塔网络,得到精细化的特征提取结果包括:
特征提取网络对输入的光学遥感影像进行特征提取,经过阶段1、阶段2、阶段3、阶段4处理后,分别获得原图分辨率大小1/2(F1)、1/4(F2)、1/8(F3)、1/16(F4)的初步特征提取结果;
将初步特征提取结果中F1、F2、F3、F4的特征图,送入到基于多层垂直注意力模块的特征金字塔网络,完成不同分辨率特征图之间信息的融合与特征的精细化提取,输出精细化的特征提取结果,输出的特征图分别记为
Figure BDA0003639967600000021
可选的,所述完成不同分辨率特征图之间信息的融合与特征的精细化提取,输出精细化的特征提取结果包括:
其中,多层垂直注意力模块的顶层只有特征提取网络提取的特征图F4一个输入,对提取的特征图F4进行1×1卷积处理得到Conv1×1(F4),再对其经过一个自注意力机制模块SA处理得到SA(Conv1×1(F4)),再与特征提取网络提取的特征图F4相加,然后经过3×3卷积处理,得到本层输出
Figure BDA0003639967600000022
除多层垂直注意力模块的顶层外,其他每层的输入包括特征提取网络提取的特征图Fj和特征金字塔上层的融合特征图
Figure BDA0003639967600000031
特征提取网络输出的一层特征图Fj进行1×1卷积处理得到Conv1×1(Fj),再经过一个自注意力机制模块SA得到SA(Conv1×1(Fj)),上层的融合特征图
Figure BDA0003639967600000032
经过2倍上采样处理得到
Figure BDA0003639967600000033
两者输入到一个跨越注意力模块CA处理得到
Figure BDA0003639967600000034
后与特征提取网络提取的特征图Fi相加,再经过3×3卷积处理,得到本层模块输出
Figure BDA0003639967600000035
可选的,所述将精细后化的特征提取结果中的特征图的分辨率大小进行调整重构出金字塔结构包括:
将多层垂直注意力模块底层输出的融合特征图
Figure BDA0003639967600000036
导入特征金字塔的底层P1,对
Figure BDA00036399676000000311
做尺寸为3×3,步长为2的卷积之后,特征图减小为原来的一半,得到P1,再和
Figure BDA0003639967600000038
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积处理得到下采样结果P2;P2再和
Figure BDA0003639967600000039
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P3;P3再和
Figure BDA00036399676000000310
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P4,最终得到特征金字塔的输出P1、P2、P3、P4
本发明的有益效果是:
本发明提供了一种基于遥感影像的船只目标智能检测方法,将光学遥感影像输入到特征提取网络得到初步的特征提取结果;对初步提取到的特征输入到基于多层垂直注意力模块的特征金字塔网络,得到更加精细化的特征提取融合结果,再经过具有ECA注意力增强模块的head检测头,以实现对船只目标的分类检测和定位。相较于之前的光学遥感影像船只检测方法,本方案通过先对光学遥感影像完成初步的特征提取、然后利用基于多层垂直注意力模块的特征金字塔网络对提取到的初步提取结果进行精修,提高了船只的检测精度;并引入了ECA注意力增强模块捕获跨通道交互的信息;尤其在针对复杂背景下的船只检测任务,本方案提出的基于多层垂直注意力模块的特征金字塔网络可以使模型具有更高的检测效果。
附图说明
图1为本发明实施例的光学遥感影像船只目标检测方法流程图;
图2为本发明实施例的光学遥感影像船只目标检测网络结构图;
图3为本发明实施例的多层垂直注意力模块(VAM)结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本实施例提供一种基于复杂背景下基于光学遥感影像的船只目标智能检测方法,其流程如图1所示。首先,将光学遥感影像输入特征提取网络,输出初步的特征提取结果;将初步提取到的特征图输入基于跨尺度语义增强的垂直融合模块的特征金字塔网络中得到精细化的特征提取结果;将精修后的特征图送入到分类分支前增加ECA注意力增强模块的head预测头,得到最终的船只检测结果。
请参见图1,本方案具体实现过程如下:
步骤一、特征的初步提取
将光学遥感影像输入已经在ImageNet数据集上训练好的Swin Transformer网络,进行特征提取,得到初步的特征提取结果。Swin Transformer网络特征提取效果较好,并具有感受野大、效果优的优势。Swin Transformer网络首先对H×W×3的输入图片进行分区得到多个块patch,之后经过如下所示的四个阶段:
阶段1:一个patch的特征维度为4x4x3=48的特征图一开始输入到阶段1的Embedding,经过一层线性层投影到C维度,这样就得到了H/4×W/4×C,作为第一个SwinTransformer Block的输入。阶段1由两层transformer block组成,这两层transformerblock的核心一个是普通的窗口注意力MSA,另一个是滑动窗口注意力MSA,可以将二者视为两个模块,在每一个阶段内部就是直接堆积这两个模块。在每个MSA模块和每个MLP之前使用LayerNorm(LN)层,并在每个MSA和MLP之后使用残差连接。
阶段2到阶段4的操作相同,先通过一个patch merging来降低要处理的数据的尺寸,也就是为了从一开始的局部信息搜索到全局信息的提取。将输入按照2x2的相邻patches合并,这样子patch块的数量就变成了H/8x W/8,特征维度就变成了4C,再跟阶段1一样使用linear embedding将4C压缩成2C(通过一个全连接层再调整通道维度为原来的两倍),也就是说每经过一个阶段,总的数据量变为原来的1/2。然后送入Swin TransformerBlock。
Swin Transformer网络的训练过程可采用现有的任意方式,此并非本发明的重点,故在此不再赘述,只需输入光学遥感影像完成特征的初步提取即可。本发明可基于如下的基于多层垂直注意力模块的特征金字塔网络,实现对初步特征完成进一步的精细化提取,从而提高复杂背景下的船只检测精度。
步骤二、特征精细化提取融合
基于多层垂直注意力模块的特征金字塔网络完成多尺度特征的信息融合。
将特征提取网络输出的特征图F1、F2、F3、F4,利用特征金字塔网络完成信息融合。本实施例中特征金字塔网络采用跨尺度垂直融合模块结构,四层垂直注意力模块分别和F1、F2、F3、F4横向相连,各个垂直注意力模块之间纵向相连。
特征提取网络对输入的光学遥感影像进行特征提取,经过阶段1、阶段2、阶段3、阶段4处理后,分别获得原图分辨率大小1/2(F1)、1/4(F2)、1/8(F3)、1/16(F4)的初步特征提取结果。
将初步特征提取结果中F1、F2、F3、F4的特征图,送入到基于多层垂直注意力模块的特征金字塔网络,完成不同分辨率特征图之间信息的融合与特征的精细化提取,输出精细化的特征提取结果,输出的特征图分别记为
Figure BDA0003639967600000051
请参见图3,其中,多层垂直注意力模块的顶层只有特征提取网络提取的特征图F4一个输入,对提取的特征图F4进行1×1卷积处理得到Conv1×1(F4),再对其经过一个自注意力机制模块SA处理得到SA(Conv1×1(F4)),再与特征提取网络提取的特征图F4相加,然后经过3×3卷积处理,得到本层输出
Figure BDA0003639967600000052
除多层垂直注意力模块的顶层外,其他每层的输入包括特征提取网络提取的特征图Fj和特征金字塔上层的融合特征图
Figure BDA0003639967600000053
特征提取网络输出的一层特征图Fj进行1×1卷积处理得到Conv1×1(Fj),再经过一个自注意力机制模块SA得到SA(Conv1×1(Fj)),上层的融合特征图
Figure BDA0003639967600000054
经过2倍上采样处理得到
Figure BDA0003639967600000055
两者输入到一个跨越注意力模块CA处理得到
Figure BDA0003639967600000061
后与特征提取网络提取的特征图Fi相加,再经过3×3卷积处理,得到本层模块输出
Figure BDA0003639967600000062
底层垂直注意力模块(VAM)输出的特征图
Figure BDA0003639967600000063
导入特征金字塔(FPN)的底层P1,对P1做尺寸为3×3,步长为2的卷积之后,特征图减小为原来的一半,得到P1,再和
Figure BDA0003639967600000064
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P2;P2再和
Figure BDA0003639967600000065
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P3;P3再和
Figure BDA0003639967600000066
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P4,最终得到特征金字塔(FPN)的输出P1、P2、P3、P4
其中,多层垂直注意力模块(VAM)的运算原理如下:
采用具有排列变换结构的多头注意力模块
PMA(Q,K,V)=MHA(Q+P(Q),K+P(V));
其中,PMA表示位置编码的多头注意力,P表示位置编码。
密集注意力DA表示为:
DA(FQ,FK)=BN(FQ+PMA(FQ,FK,FK));
其中BN表示特征层规范化。
自注意力机制模块(SA)和跨越注意力模块(CA)为DA的进一步扩展:
SA(FQ)=DA(FQ,FQ);
CA(FQ,FK)=DA(FQ,FK)=FK→Q
在多层垂直注意力模块(VAM)中,先SA后CA,这种设计有助于提高适应性,因为SA选择地表达来自查询端的信息,CA加权平衡了双方。
在自上而下的层次结构中,从最顶层(第四层)的VAM开始运算,自适应地从高层全局查询相关信息,其最顶层模块关系式为:
Figure BDA0003639967600000071
Figure BDA0003639967600000072
则垂直注意力模块(VAM)的输出为:
Figure BDA0003639967600000073
步骤三、带有ECA注意力增强模块的head目标检测
将步骤二中得到的不同分辨率大小的特征图送入到分类分支前添加ECA注意力增强模块的head目标检测头得到船只的检测结果。
ECA注意力增强模块在避免跨维的情况下捕获跨通道交互的信息包括:
将特征金字塔的输出结果Pj送入head检测头分类分支前的ECA注意力增强模块。首先经过全局平均池化,将得到的聚合特征送入一个可以权重共享的1D卷积进行学习,卷积结果与Pj相乘得到ECA注意力模块的输出结果(j=1,2,3,4)。
ECA注意力增强模块中的1D卷积核k是一个超参,对于不同数量的通道数C应有不同的大小变化,k和C之间应满足下列映射以自适应选择1D卷积核大小:
Figure BDA0003639967600000074
其中是2的次方考虑到的是通道数量的设计一般都是以2的次方设计的,k应当满足:
Figure BDA0003639967600000075
其中,k表示卷积核大小,|t|odd表示距离t最近的奇数;C表示通道数;γ和b分别取2和1。
为了提高复杂背景下光学遥感影像的船只目标检测精度,本方案在特征融合金字塔网络的基础上,进一步对特征融合网络进行优化,考虑到光学遥感影像中复杂的背景环境与船只目标检测结果息息相关,影响船只目标检测结果的精度,因此如何提高融合后特征的表达能力是关键。本实施例在常规特征金字塔网络的基础上进行改进,结合了多层垂直注意力模块,完成特征图的跨尺度精细化提取融合,然后输入到分类分支前添加ECA注意力增强模块的head检测头完成目标检测,输出检测分类类别和目标位置。
显然,本领域的技术人员应该明白,上述本发明的各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (7)

1.一种基于遥感影像的船只目标智能检测方法,其特征在于,包括:
将光学遥感影像输入到特征提取网络,得到初步的特征提取结果;
将初步的特征提取结果中的特征图送入到基于多层垂直注意力模块的特征金字塔网络,得到精细化的特征提取结果;
将精细后化的特征提取结果中的特征图的分辨率大小进行调整重构出金字塔结构,并将不同分辨率大小的特征图送入到分类分支前增加了一个ECA注意力增强模块的head预测头中,得到最终的船只检测结果。
2.如权利要求1所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述将光学遥感影像输入到特征提取网络,得到初步的特征提取结果包括:
将所述光学遥感影像输入到图像分类网络的主干网络,得到所述初步的特则提取结果。
3.如权利要求2所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述图像分类网络的主干网络包括Swin Transformer网络。
4.如权利要求3所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述head预测头采用FCOS无锚框检测网络的检测头,以预测最终的船只目标类别和目标框。
5.如权利要求1-4任一项所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述将初步的特征提取结果中的特征图送入到基于多层垂直注意力模块的特征金字塔网络,得到精细化的特征提取结果包括:
特征提取网络对输入的光学遥感影像进行特征提取,经过阶段1、阶段2、阶段3、阶段4处理后,分别获得原图分辨率大小1/2(F1)、1/4(F2)、1/8(F3)、1/16(F4)的初步特征提取结果;
将初步特征提取结果中F1、F2、F3、F4的特征图,送入到基于多层垂直注意力模块的特征金字塔网络,完成不同分辨率特征图之间信息的融合与特征的精细化提取,输出精细化的特征提取结果,输出的特征图分别记为
Figure FDA0003639967590000011
6.如权利要求5所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述完成不同分辨率特征图之间信息的融合与特征的精细化提取,输出精细化的特征提取结果包括:
其中,多层垂直注意力模块的顶层只有特征提取网络提取的特征图F4一个输入,对提取的特征图F4进行1×1卷积处理得到Conv1×1(F4),再对其经过一个自注意力机制模块SA处理得到SA(Conv1×1(F4)),再与特征提取网络提取的特征图F4相加,然后经过3×3卷积处理,得到本层输出
Figure FDA0003639967590000021
除多层垂直注意力模块的顶层外,其他每层的输入包括特征提取网络提取的特征图Fj和特征金字塔上层的融合特征图
Figure FDA0003639967590000022
特征提取网络输出的一层特征图Fj进行1×1卷积处理得到Conv1×1(Fj),再经过一个自注意力机制模块SA得到SA(Conv1×1(Fj)),上层的融合特征图
Figure FDA00036399675900000211
经过2倍上采样处理得到
Figure FDA0003639967590000023
两者输入到一个跨越注意力模块CA处理得到
Figure FDA0003639967590000024
后与特征提取网络提取的特征图Fj相加,再经过3×3卷积处理,得到本层模块输出
Figure FDA0003639967590000025
7.如权利要求6所述的基于遥感影像的船只目标智能检测方法,其特征在于,所述将精细后化的特征提取结果中的特征图的分辨率大小进行调整重构出金字塔结构包括:
将多层垂直注意力模块底层输出的融合特征图
Figure FDA0003639967590000026
导入特征金字塔的底层P1,对
Figure FDA0003639967590000027
做尺寸为3×3,步长为2的卷积之后,特征图减小为原来的一半,得到P1,再和
Figure FDA0003639967590000028
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积处理得到下采样结果P2;P2再和
Figure FDA0003639967590000029
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P3;P3再和
Figure FDA00036399675900000210
进行相加,得到的结果再经过尺寸为3×3,步长为1的卷积得到下采样结果P4,最终得到特征金字塔的输出P1、P2、P3、P4
CN202210512505.0A 2022-05-12 2022-05-12 一种基于遥感影像的船只目标智能检测方法 Pending CN114972851A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210512505.0A CN114972851A (zh) 2022-05-12 2022-05-12 一种基于遥感影像的船只目标智能检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210512505.0A CN114972851A (zh) 2022-05-12 2022-05-12 一种基于遥感影像的船只目标智能检测方法

Publications (1)

Publication Number Publication Date
CN114972851A true CN114972851A (zh) 2022-08-30

Family

ID=82981684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210512505.0A Pending CN114972851A (zh) 2022-05-12 2022-05-12 一种基于遥感影像的船只目标智能检测方法

Country Status (1)

Country Link
CN (1) CN114972851A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310850A (zh) * 2023-05-25 2023-06-23 南京信息工程大学 基于改进型RetinaNet的遥感图像目标检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733749A (zh) * 2021-01-14 2021-04-30 青岛科技大学 融合注意力机制的实时行人检测方法
WO2021139069A1 (zh) * 2020-01-09 2021-07-15 南京信息工程大学 自适应注意力指导机制的一般性目标检测方法
CN113567984A (zh) * 2021-07-30 2021-10-29 长沙理工大学 一种sar图像中人造小目标的检测方法及系统
CN114359709A (zh) * 2021-12-07 2022-04-15 北京北方智图信息技术有限公司 一种针对遥感图像的目标检测方法及装置
CN114419490A (zh) * 2021-12-28 2022-04-29 北京理工大学 一种基于注意力金字塔的sar船只目标检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139069A1 (zh) * 2020-01-09 2021-07-15 南京信息工程大学 自适应注意力指导机制的一般性目标检测方法
CN112733749A (zh) * 2021-01-14 2021-04-30 青岛科技大学 融合注意力机制的实时行人检测方法
CN113567984A (zh) * 2021-07-30 2021-10-29 长沙理工大学 一种sar图像中人造小目标的检测方法及系统
CN114359709A (zh) * 2021-12-07 2022-04-15 北京北方智图信息技术有限公司 一种针对遥感图像的目标检测方法及装置
CN114419490A (zh) * 2021-12-28 2022-04-29 北京理工大学 一种基于注意力金字塔的sar船只目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭启帆等: "基于特征金字塔的多尺度特征融合网络", 工程数学学报, vol. 37, no. 5, 15 October 2020 (2020-10-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310850A (zh) * 2023-05-25 2023-06-23 南京信息工程大学 基于改进型RetinaNet的遥感图像目标检测方法
CN116310850B (zh) * 2023-05-25 2023-08-15 南京信息工程大学 基于改进型RetinaNet的遥感图像目标检测方法

Similar Documents

Publication Publication Date Title
Zhang et al. Context encoding for semantic segmentation
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
JP2017062781A (ja) 深層cnnプーリング層を特徴として用いる、類似度に基づく重要な対象の検知
Zhu et al. Attention-aware perceptual enhancement nets for low-resolution image classification
Kadam et al. Detection and localization of multiple image splicing using MobileNet V1
Jiang et al. Cascaded subpatch networks for effective CNNs
CN110569851B (zh) 门控多层融合的实时语义分割方法
CN111027576B (zh) 基于协同显著性生成式对抗网络的协同显著性检测方法
CN110321805B (zh) 一种基于时序关系推理的动态表情识别方法
CN113255837A (zh) 工业环境下基于改进的CenterNet网络目标检测方法
CN113159067A (zh) 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置
CN112037239B (zh) 基于多层次显式关系选择的文本指导图像分割方法
Wang et al. TF-SOD: a novel transformer framework for salient object detection
CN110599502A (zh) 一种基于深度学习的皮肤病变分割方法
CN110852199A (zh) 一种基于双帧编码解码模型的前景提取方法
CN115393289A (zh) 基于集成交叉伪标签的肿瘤图像半监督分割方法
CN109492610A (zh) 一种行人重识别方法、装置及可读存储介质
Zheng et al. Feature enhancement for multi-scale object detection
CN115222998A (zh) 一种图像分类方法
CN115147601A (zh) 基于自注意力全局特征增强的城市街道点云语义分割方法
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
CN114972851A (zh) 一种基于遥感影像的船只目标智能检测方法
CN114187506A (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
CN113505640A (zh) 一种基于多尺度特征融合的小尺度行人检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination