CN112417958A - 一种遥感影像旋转目标检测方法 - Google Patents

一种遥感影像旋转目标检测方法 Download PDF

Info

Publication number
CN112417958A
CN112417958A CN202011106903.XA CN202011106903A CN112417958A CN 112417958 A CN112417958 A CN 112417958A CN 202011106903 A CN202011106903 A CN 202011106903A CN 112417958 A CN112417958 A CN 112417958A
Authority
CN
China
Prior art keywords
cbr
feature
feature map
cbrup
conv2
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011106903.XA
Other languages
English (en)
Other versions
CN112417958B (zh
Inventor
李成源
王晨捷
刘军
罗斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202011106903.XA priority Critical patent/CN112417958B/zh
Publication of CN112417958A publication Critical patent/CN112417958A/zh
Application granted granted Critical
Publication of CN112417958B publication Critical patent/CN112417958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于全局‑局部注意力机制的遥感影像旋转目标检测方法,包括以下步骤:S1:提取高低频分离的深度特征;S2:构建语义注意力金字塔;S3:提取包含前景潜在目标且排名靠前的候选区域特征及坐标;S4:进行RoIAlign池化操作;S5:生成最终特征图;S6:进行类别预测和五参数表示的包围框坐标的预测。本发明可以有效降低硬件的资源使用量,提升目标检测速度,在遥感影像上具有优异的检测精度,在噪声环境下极大提高检测精度,具有较强的抗噪能力。

Description

一种遥感影像旋转目标检测方法
技术领域
本发明涉及一种遥感影像旋转目标检测方法,属于航空图像目标检测技术领域。
背景技术
遥感影像目标检测是遥感影像处理与应用的一项基本工作,其主要内容在于从大幅遥感影像上快速确定有意义目标的位置和类别。在交通控制、机场监控、油库监控、近岸船舶检测、军事目标发现等领域有着广泛的应用。
近年来计算机视觉技术的快速发展,使得基于神经网络的目标检测技术以更高的精度和更快的速度超过了传统基于有向梯度直方图(HOG)、尺度不变特征变换(SIFT)等特征的目标检测方法。目前基于深度学习的目标检测方法按照检测框类型的不同主要分为三大类:
(1)第一类是基于关键点的检测,以CornerNet、CornerNet-Lite等为代表的网络使用点来表示目标的位置,通常可以回归目标矩形包围框的左上点和右下点坐标,或者是目标的中心点或关键点等,该类网络速度较快;
(2)第二类是基于正矩形框的目标检测方法,如faster-rcnn、YOLT、YOLOv5等,这些方法通常用于自然图像目标检测、文本检测等,由于当目标密集排列时,相邻目标的正矩形框往往会存在较大区域的重叠,因此这类方法对于具有任意角度且密集排列的目标精度较差;
(3)第三类是基于旋转矩形的目标检测方法,该类方法采用具有旋转角度的矩形来尽可能地贴合不同目标,该类方法通常计算资源占用高,同时精度更高且更符合实际应用场景。
但是以上方法都没有考虑神经网络本身的抗噪能力,一旦遇到云、雨、雾、雪或当传感器采用倾斜摄影方式,大气噪声对图像的影响已不可忽视,目前的算法通常出现显著的精度下降情况,此外对于含有大量噪声的图像处理通常采用图像增强的方式,但是这类方式资源消耗高。
发明内容
本发明的目的是提供一种遥感影像旋转目标检测方法,以解决光学遥感目标检测存在的在噪声数据情况下检测不够鲁棒、硬件需求高且速度降低的问题。
为达到上述目的,本发明采用的技术方案是:一种遥感影像旋转目标检测方法,包括以下步骤:
S1:使用Oct-ResNet-50网络,提取输入的遥感影像的深度特征,获得含有多个特征图的特征图组;
S2:将S1中提取出的特征图组中包含高、低频信息的{conv2,conv3,conv4,conv5}4层特征图送入的基于Octave卷积的语义注意力特征金字塔(Octave-based SematicAttention Feature Pyramid Network,OcSaFPN),所述OcSaFPN结构包括OcSa结构和自顶向下的特征金字塔结构,所述OcSa结构可对输入的高、低频特征图{conv2,conv3,conv4,conv5}进行挤压并进行注意力操作,生成用于输入自顶向下的特征金字塔结构的特征图{O2,O3,O4,O5},所述特征金字塔结构对输入的特征图{O2,O3,O4,O5}进行处理,获得特征图{P2,P3,P4,P5,P6};
S3:将S2中生成的基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}送入RPN网络,提取包含前景潜在目标且排名靠前的候选区域特征及坐标,获得包含多个候选区域的候选区域特征图;
S4:将候选区域特征图进行RoIAlign池化操作,获得经池化操作统一尺寸的特征图;
S5:将S4得到的池化操作后的特征图送入连续的两层全连接层,生成最终特征图;
S6:将S5生成的最终特征图分别送入类别预测分支和坐标预测分支,获得目标的类别和五参数表示的包围框坐标。
上述技术方案中进一步改进的方案如下:
1.上述方案中,所述Oct-ResNet-50网络为在ResNet-50网络基础上,使用Octave卷积替换常规卷积层形成。
2.上述方案S2中,先将{conv2,conv3,conv4,conv5}4层特征图送入OcSa结构,生成并输出特征图{O2,O3,O4,O5},再将OcSa结构生成的特征图{O2,O3,O4,O5}作为自顶向下的特征金字塔结构的输入,得到基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}。
3.上述方案中,所述特征图{O2,O3,O4,O5}的生成步骤为:
O2=CBAM{CBR[concate(Inception(conv2h),CBRUP(conv2l),CBRUP(conv3h),CBRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O3=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),Inception(conv3h),CBRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O4=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),Inception(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O5=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),CBR(conv4h),CBR(conv4l),Inception(conv5))]};
其中,CBR表示卷积层+BN层+ReLu激活函数的组合,CBRUP表示卷积层+BN层+ReLu激活函数+最近邻插值的组合,Inception表示Inception感知网络结构,CBAM为基于CBAM方法的注意力结构,concate(a,b)表示具有相同空间维度的特征图a和特征图b在通道维度进行拼接操作。
4.上述方案中,基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}的计算过程为:
Figure BDA0002727224320000031
其中,Conv(·)表示卷积核为[1,1]的卷积层,Pool(·)表示步长为2的池化操作,g(·)表示尺度因子为2的上采样操作,
Figure BDA0002727224320000032
表示矩阵的加法。
由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
本发明提供一种遥感影像旋转目标检测方法,既可以有效降低硬件的资源使用量、提升目标检测速度,又具有较强的抗噪能力,在高分遥感影像与噪声环境下依然具有优异的检测精度。
附图说明
附图1为本发明一种遥感影像旋转目标检测方法的流程示意图;
附图2为本发明遥感影像旋转目标检测方法中Octave卷积结构示意图;
附图3为本发明中语义注意力特征金字塔结构流程图;
附图4为本发明中OcSa结构生成特征图O2的示意图;
附图5为本发明中OcSa结构生成特征图O3的示意图;
附图6为本发明中OcSa结构生成特征图O4的示意图;
附图7为本发明中OcSa结构生成特征图O5的示意图;
附图8为本发明中OcSa结构中Inception结构的示意图。
具体实施方式
实施例:一种遥感影像旋转目标检测方法,其提出一种新的基于Octave卷积的语义注意力特征金字塔结构(OcSaFPN),在Faster R-CNN网络的基础上,使用Oct-ResNet-50结构替换常用的ResNet50结构作为主干特征提取网络(BackBone),为Oct-ResNet系列网络设计并实现了语义注意力特征金字塔结构替代常用的FPN结构,生成语义金字塔特征信息;
然后将从Oct-resNet-50网络中获得的划分高频信息和低频信息的特征图{conv2,conv3,conv4,conv5}送入由分为OcSa结构和一个自顶向下的特征金字塔结构组成的基于Octave卷积的语义注意力特征金字塔结构(OcSaFPN)中;
其中,OcSa结构可将输入的4对高、低频特征图进行挤压并进行注意力操作并生成特征图{O2,O3,O4,O5};
自顶向下的特征金字塔结构接收{O2,O3,O4,O5}作为输入并生成{P2,P3,P4,P5,P6}特征图;
特征图{P2,P3,P4,P5,P6}送入RPN网络,提取候选区域,然后将候选区域特征图经RoIAlign处理后送入R-CNN head结构进行类别预测和目标旋转包围框预测。
具体包括以下步骤:
步骤1:使用Oct-ResNet-50网络,提取输入的遥感影像的深度特征,其中octave卷积结构如图2所示;
步骤2:将步骤1中提取出的特征图中的包含4对高、低频信息的特征图送入基于Octave卷积的语义注意力特征金字塔(Octave-based Sematic Attention FeaturePyramid Network,OcSaFPN),如图1中所示,OcSaFPN结构可分为OcSa结构和自顶向下的特征金字塔结构,OcSa结构(如图3所示)将输入的4对高、低频特征图进行挤压并进行注意力操作,最终输出4层不同尺寸特征图送入自顶向下的特征金字塔结构中,最终将输出5层特征图;图4-图7分别表示OcSa结构生成4层特征图的方式,图8为OcSa结构中的Inception结构;
步骤1中提取的特征图{conv2,conv3,conv4,conv5}的尺寸按照格式[通道数,高,宽]格式可以表示为:
conv2h:[128,256,256],conv2l:[128,128,128],
conv3h:[256,128,128],conv3l:[256,64,64],
conv4h:[512,64,64],conv4l:[512,32,32],
conv5:[2048,32,32];其中,
convxh为convx特征图对应的高频分量,convxl对应的为convx特征图对应的低频分量;conv5特征图没有进行高频分量与低频分量的划分;
将步骤1中提取的{conv2,conv3,conv4,conv5}4层特征图首先送入OcSa结构,将OcSa结构的输出记为{O2,O3,O4,O5},将{O2,O3,O4,O5}作为自顶向下的特征金字塔结构的输入,最终将得到基于Octave卷积的语义注意力特征金字塔特征图记为{P2,P3,P4,P5,P6},那么OcSaFPN的特征图处理步骤可以被以下步骤详细描述:
对于特征图{O2,O3,O4,O5},其生成步骤可以被描述为:
O2=CBAM{CBR[concate(Inception(conv2h),CBRUP(conv2l),CBRUP(conv3h),BRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]}
O3=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),Inception(conv3h),CBRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]}
O4=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),Inception(conv4h),CBRUP(conv4l),CBRUP(conv5))]}
O5=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),CBR(conv4h),CBR(conv4l),Inception(conv5))]}
其中,CBR表示卷积层+BN层+ReLu激活函数的组合,CBRUP表示卷积层+BN层+ReLu激活函数+最近邻插值的组合,Inception表示如图8所示的Inception感知网络结构,CBAM为基于CBAM方法的注意力结构,concate(a,b)表示具有相同空间维度的特征图a和特征图b在通道维度进行拼接操作;
基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}的计算过程可以表示为:
Figure BDA0002727224320000051
其中Conv(·)表示卷积核为[1,1]的卷积层,Pool(·)表示步长为2的池化操作,g(·)表示尺度因子为2的上采样操作,
Figure BDA0002727224320000052
表示矩阵的加法。
基于以上步骤(1)(2)后,可以获得基于Octave卷积的语义注意力特征金字塔(OcSaFPN)的特征图{P2,P3,P4,P5,P6};
步骤3:将步骤2生成的基于Octave卷积的语义注意力特征金字塔特征送入RPN网络,提取包含前景潜在目标且排名靠前的候选区域特征及坐标,获得包含多个候选区域的候选区域特征图;
步骤4:将来自步骤3的特征图进行RoIAlign池化操作,获得经池化操作统一尺寸的特征图:
步骤5:将步骤4得到的池化操作后的特征图送入连续的两层全连接层,生成最终特征图;
步骤6:使用步骤5生成的最终特征图,分别进行类别预测和五参数表示的包围框坐标的预测,其中包围框的坐标可以描述为:x轴沿着逆时针旋转,遇到的矩形第一条边为w,因此另一条边h,此时x轴转过的角度记为θ,θ∈[-90,0),那么五参数的坐标表示为(x,y,w,h,θ),其中x,y为矩形中心点的坐标。
采用上述遥感影像旋转目标检测方法时,使用Oct-ResNet替代常用的ResNet网络结构,将图像信息分为高频和低频信息进行处理,在降低GPU显存使用量、提高网络处理速度的同时提高了抗噪能力;
进一步使用语义注意力金字塔结构将来自Oct-ResNet的4对高低频特征图进行处理并进行拼接操作,减小不同层特征图之间的语义鸿沟,并通过注意力模块提取有效信息,实现对噪声数据的进一步压缩;
在遥感影像目标检测时,可以在有效提高抗噪能力的同时进一步提高检测结果的精度,还可以降低显存使用量、提高检测速度。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种遥感影像旋转目标检测方法,其特征在于,包括以下步骤:
S1:使用Oct-ResNet-50网络,提取输入的遥感影像的深度特征,获得含有多个特征图的特征图组;
S2:将S1中提取出的特征图组中包含高、低频信息的{conv2,conv3,conv4,conv5}4层特征图送入的基于Octave卷积的语义注意力特征金字塔(Octave-based SematicAttention Feature Pyramid Network,OcSaFPN),所述OcSaFPN结构包括OcSa结构和自顶向下的特征金字塔结构,所述OcSa结构可对输入的高、低频特征图{conv2,conv3,conv4,conv5}进行挤压并进行注意力操作,生成用于输入自顶向下的特征金字塔结构的特征图{O2,O3,O4,O5},所述特征金字塔结构对输入的特征图{O2,O3,O4,O5}进行处理,获得特征图{P2,P3,P4,P5,P6};
S3:将S2中生成的基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}送入RPN网络,提取包含前景潜在目标且排名靠前的候选区域特征及坐标,获得包含多个候选区域的候选区域特征图;
S4:将候选区域特征图进行RoIAlign池化操作,获得经池化操作统一尺寸的特征图;
S5:将S4得到的池化操作后的特征图送入连续的两层全连接层,生成最终特征图;
S6:将S5生成的最终特征图分别送入类别预测分支和坐标预测分支,获得目标的类别和五参数表示的包围框坐标。
2.根据权利要求1所述的一种遥感影像旋转目标检测方法,其特征在于:所述Oct-ResNet-50网络为在ResNet-50网络基础上,使用Octave卷积替换常规卷积层形成。
3.根据权利要求1所述的一种遥感影像旋转目标检测方法,其特征在于:在S2中,先将{conv2,conv3,conv4,conv5}4层特征图送入OcSa结构,生成并输出特征图{O2,O3,O4,O5},再将OcSa结构生成的特征图{O2,O3,O4,O5}作为自顶向下的特征金字塔结构的输入,得到基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}。
4.根据权利要求3所述的一种遥感影像旋转目标检测方法,其特征在于:所述特征图{O2,O3,O4,O5}的生成步骤为:
O2=CBAM{CBR[concate(Inception(conv2h),CBRUP(conv2l),CBRUP(conv3h),CBRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O3=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),Inception(conv3h),CBRUP(conv3l),CBRUP(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O4=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),Inception(conv4h),CBRUP(conv4l),CBRUP(conv5))]};
O5=CBAM{CBR[concate(CBR(conv2h),CBR(conv2l),CBR(conv3h),CBR(conv3l),CBR(conv4h),CBR(conv4l),Inception(conv5))]};
其中,CBR表示卷积层+BN层+ReLu激活函数的组合,CBRUP表示卷积层+BN层+ReLu激活函数+最近邻插值的组合,Inception表示Inception感知网络结构,CBAM为基于CBAM方法的注意力结构,concate(a,b)表示具有相同空间维度的特征图a和特征图b在通道维度进行拼接操作。
5.根据权利要求3所述的一种遥感影像旋转目标检测方法,其特征在于:基于Octave卷积的语义注意力特征金字塔特征图{P2,P3,P4,P5,P6}的计算过程为:
Figure FDA0002727224310000021
其中,Conv(·)表示卷积核为[1,1]的卷积层,Pool(·)表示步长为2的池化操作,g(·)表示尺度因子为2的上采样操作,
Figure FDA0002727224310000022
表示矩阵的加法。
CN202011106903.XA 2020-10-16 2020-10-16 一种遥感影像旋转目标检测方法 Active CN112417958B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011106903.XA CN112417958B (zh) 2020-10-16 2020-10-16 一种遥感影像旋转目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011106903.XA CN112417958B (zh) 2020-10-16 2020-10-16 一种遥感影像旋转目标检测方法

Publications (2)

Publication Number Publication Date
CN112417958A true CN112417958A (zh) 2021-02-26
CN112417958B CN112417958B (zh) 2022-05-06

Family

ID=74854572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011106903.XA Active CN112417958B (zh) 2020-10-16 2020-10-16 一种遥感影像旋转目标检测方法

Country Status (1)

Country Link
CN (1) CN112417958B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113658138A (zh) * 2021-08-17 2021-11-16 天津大学 一种应用于变化检测任务的网络结构及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633661A (zh) * 2019-08-31 2019-12-31 南京理工大学 一种融合语义分割的遥感图像目标检测方法
CN111126205A (zh) * 2019-12-12 2020-05-08 南京邮电大学 一种基于旋转定位网络的光学遥感图像飞机目标检测方法
CN111260694A (zh) * 2020-02-10 2020-06-09 北方工业大学 卫星遥感视频目标跟踪方法及装置
CN111539428A (zh) * 2020-05-06 2020-08-14 中国科学院自动化研究所 基于多尺度特征整合和注意力机制的旋转目标检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633661A (zh) * 2019-08-31 2019-12-31 南京理工大学 一种融合语义分割的遥感图像目标检测方法
CN111126205A (zh) * 2019-12-12 2020-05-08 南京邮电大学 一种基于旋转定位网络的光学遥感图像飞机目标检测方法
CN111260694A (zh) * 2020-02-10 2020-06-09 北方工业大学 卫星遥感视频目标跟踪方法及装置
CN111539428A (zh) * 2020-05-06 2020-08-14 中国科学院自动化研究所 基于多尺度特征整合和注意力机制的旋转目标检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHENJIE WANG 等: "U2-ONet:A Two-level Nested Octave U-structure with Multiscale Attention Mechanism for Moving Instances Segmentation", 《ARXIV:2007.13092V1》 *
KUN FU 等: "A Ship Rotation Detection Model in Remote Sensing Images Based on Feature Fusion Pyramid Network and Deep Reinforcement Learning", 《MDPI》 *
于野等: "A-FPN算法及其在遥感图像船舶检测中的应用", 《遥感学报》 *
赵江洪等: "深度学习的遥感影像舰船目标检测", 《测绘科学》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113658138A (zh) * 2021-08-17 2021-11-16 天津大学 一种应用于变化检测任务的网络结构及方法
CN113658138B (zh) * 2021-08-17 2023-06-16 天津大学 一种应用于变化检测任务的网络结构及方法

Also Published As

Publication number Publication date
CN112417958B (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN108121991B (zh) 一种基于边缘候选区域提取的深度学习舰船目标检测方法
CN110334762B (zh) 一种基于四叉树结合orb和sift的特征匹配方法
CN109919013A (zh) 视频图像中基于深度学习的人脸检测方法及装置
Tian et al. Review of object instance segmentation based on deep learning
CN111814827B (zh) 基于yolo的关键点目标检测方法
CN111783523B (zh) 一种遥感影像旋转目标检测方法
CN108960115B (zh) 基于角点的多方向文本检测方法
Su et al. DLA-Net: Learning dual local attention features for semantic segmentation of large-scale building facade point clouds
CN109712071B (zh) 基于航迹约束的无人机图像拼接与定位方法
CN111242122A (zh) 一种轻量级深度神经网络旋转目标检测方法和系统
CN109242019B (zh) 一种水面光学小目标快速检测与跟踪方法
Zhou et al. Graph attention guidance network with knowledge distillation for semantic segmentation of remote sensing images
CN108805201A (zh) 目标图像数据集生成方法及其装置
CN110084302A (zh) 一种基于遥感图像的裂缝检测方法
Sun et al. IRDCLNet: Instance segmentation of ship images based on interference reduction and dynamic contour learning in foggy scenes
Wu et al. MENet: Lightweight multimodality enhancement network for detecting salient objects in RGB-thermal images
CN115937552A (zh) 一种基于融合手工特征与深度特征的图像匹配方法
CN111260694A (zh) 卫星遥感视频目标跟踪方法及装置
CN116030305A (zh) 一种目标检测的轻量级算法
CN112417958B (zh) 一种遥感影像旋转目标检测方法
Zheng et al. Feature pyramid of bi-directional stepped concatenation for small object detection
Xie et al. 3D surface segmentation from point clouds via quadric fits based on DBSCAN clustering
CN113763474B (zh) 一种基于场景几何约束的室内单目深度估算方法
CN115331008A (zh) 一种基于目标概率密度图的端到端目标检测方法
Sun et al. A fast multi-target detection method based on improved YOLO

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant