CN116403115A - 一种大幅面遥感影像目标检测方法 - Google Patents

一种大幅面遥感影像目标检测方法 Download PDF

Info

Publication number
CN116403115A
CN116403115A CN202310668054.4A CN202310668054A CN116403115A CN 116403115 A CN116403115 A CN 116403115A CN 202310668054 A CN202310668054 A CN 202310668054A CN 116403115 A CN116403115 A CN 116403115A
Authority
CN
China
Prior art keywords
feature map
feature
attention mechanism
resolution
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310668054.4A
Other languages
English (en)
Other versions
CN116403115B (zh
Inventor
梁北大
李翔
陈云龙
王洪辉
魏霞
李锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Woodpecker Bee Technology Co ltd
Original Assignee
Jiangxi Woodpecker Bee Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Woodpecker Bee Technology Co ltd filed Critical Jiangxi Woodpecker Bee Technology Co ltd
Priority to CN202310668054.4A priority Critical patent/CN116403115B/zh
Publication of CN116403115A publication Critical patent/CN116403115A/zh
Application granted granted Critical
Publication of CN116403115B publication Critical patent/CN116403115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种大幅面遥感影像目标检测方法,涉及图像数据处理技术领域;该方法包括以下步骤:S10、对输入图像进行数据增强处理;S20、在卷积神经网络中,通过引入通道注意力机制和空间注意力机制,得到具有通道注意力机制和空间注意力机制的特征图;S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中,生成具有不同分辨率的特征图;在低分辨率的特征图上得到目标的粗略位置,根据得到的粗略位置在高分辨率的特征图上进行搜索,找出目标在高分辨率特征图的位置;在高分辨率特征图的基础上丢弃背景信息,构建新的高分辨率特征图并参与回归损失计算;本发明能解决遥感图像的背景复杂,目标较小的问题。

Description

一种大幅面遥感影像目标检测方法
技术领域
本发明涉及图像数据处理技术领域,更具体的说,本发明涉及一种大幅面遥感影像目标检测方法。
背景技术
现有的目标检测器,如YOLO系列对常规的图像的检测步骤为,首先对图像整体在骨干网络进行特征提取,然后经过neck部分得到不同尺度的特征图,最后使用不同尺度的特征图进行分类和定位的损失回归,从而达到良好的检测效果。针对对小尺度目标检测的常用解决方案是:1、扩增分辨率;2、数据增强、重采样;3、结合上下文信息;4、多尺度感知训练。
其中提升小目标的检测精度最常见的方案是使用更高分辨率的特征图,但是由于图像和特征尺寸的增加使计算成本成正比增长,因此这两种方法都导致了更高的计算成本。
与传统的目标检测目标不同,遥感图像具有特殊性。首先背景复杂度高,航空遥感图像视野比较大(通常有数平方公里的覆盖范围),视野中可能包含各种各样的背景,会对目标检测产生较强的干扰。其次是尺度多样性,航空遥感图像可从几百米到近万米的高度进行拍摄,且地面目标即使是同类目标也大小不一,如港口的轮船大的有300多米,小的却只有数十米。因此当使用目前目标检测器对大幅面遥感影像进行检测时,不仅耗费的计算资源较多,且对于特殊的遥感目标检测的精度存在一定的缺陷。
发明内容
为了克服现有技术的不足,本发明提供一种大幅面遥感影像目标检测方法,解决遥感图像背景复杂、目标较小的问题。
本发明解决其技术问题所采用的技术方案是:一种大幅面遥感影像目标检测方法,其改进之处在于,该方法包括以下步骤:
S10、对输入图像进行数据增强处理,其处理方式包括单样本数据增强和多样本数据增强;
S20、在卷积神经网络中,通过引入通道注意力机制和空间注意力机制,得到具有通道注意力机制和空间注意力机制的特征图;
S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中,生成具有不同分辨率的特征图;
在低分辨率的特征图上得到目标的粗略位置,根据得到的粗略位置在高分辨率的特征图上进行搜索,找出目标在高分辨率特征图的位置;
在高分辨率特征图的基础上丢弃背景信息,构建新的高分辨率特征图并参与回归损失计算。
进一步的,步骤S10中,通过对数据进行增强处理,以提高模型的泛化能力。
进一步的,步骤S10中,单样本数据增强包括对输入图像进行尺度变换、随机翻转、色域增强、随机旋转以及填充的处理。
进一步的,步骤S10中,多样本数据增强包括对经过单样本数据增强得到的图像依次进行Mosaic增强、仿射变换、随机尺寸裁剪以及Mixup融合的处理,并实现处理后图像的输出。
进一步的,步骤S20中,引入通道注意力机制包括:
对输入的特征图分别经过最大池化层和平均池化层后,再将其输出的特征通过共享的多层感知机进行进一步提取,最后相加得到具有通道注意力机制的特征图。
进一步的,引入通道注意力机制的计算结果如下:
Figure SMS_1
其中,
Figure SMS_2
为具有通道注意力机制的特征图,/>
Figure SMS_3
表示sigmoid函数,MLP为多层感知机,F为输入的特征图,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure SMS_4
代表平均池化特征,/>
Figure SMS_5
代表最大池化特征,/>
Figure SMS_6
和/>
Figure SMS_7
是共享MLP的权重;
引入通道注意力机制的输出特征图
Figure SMS_8
的计算公式如下:
Figure SMS_9
其中,
Figure SMS_10
表示逐元素乘法。
进一步的,步骤S20中,引入空间注意力机制包括:在通道维度对输入特征图进行平均池化和最大池化,将其产生的特征图进行拼接,并在拼接的特征图上使用卷积操作来产生具有空间注意力的特征图。
进一步的,引入空间注意力机制的计算公式如下:
Figure SMS_11
其中,
Figure SMS_12
为具有空间注意力机制的特征图,/>
Figure SMS_13
表示sigmoid函数,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure SMS_14
表示滤波器大小为7 × 7的卷积运算,/>
Figure SMS_15
代表平均池化特征,/>
Figure SMS_16
代表最大池化特征;
融合了通道注意力机制和空间注意力机制的输出特征图
Figure SMS_17
如下:
Figure SMS_18
其中,
Figure SMS_19
是经过通道注意力输出的特征图,/>
Figure SMS_20
是输入为/>
Figure SMS_21
的空间注意力机制的特征图,/>
Figure SMS_22
表示逐元素乘法。
进一步的,步骤S30中,经特征化图像金字塔FPN输出的特征图Pi具有不同的分辨率,其中i表示特征图的层数,当i大于等于3时,将该层特征图定义为低分辨率的特征图,当i小于等于2时,将该层特征图定义为高分辨率的特征图。
进一步的,步骤S30中,包括以下步骤:
S301、所述FPN层输出不同等级的特征图为
Figure SMS_23
,/>
Figure SMS_24
为不同等级的特征图,其中l表示金字塔等级,/>
Figure SMS_25
表示特征图的维度,H′等于/>
Figure SMS_26
,W′等于
Figure SMS_27
,H、W、C分别表示输入图片的高、宽、类别数量;
S302、通过增加一个搜索检测器,该搜索检测器的输入为低分辨率的特征图, 输出热图
Figure SMS_28
和/>
Figure SMS_29
,其中/>
Figure SMS_30
,/>
Figure SMS_31
表示热图的维度,/>
Figure SMS_32
表示深度神经网络(i,j)包含小目标的概率;
其中,对于一个目标,通过计算其中心位置与特征图上每个位置之间的距离,得到目标的位置信息,同时将距离小于设定值
Figure SMS_33
的目标定义为小目标;
S303、对于
Figure SMS_34
高于阈值的热图认为包含小目标,将热图中的小目标的位置信息带入下一级的高分辨率特征图,下一级的高分辨率特征图只关注热图中的小目标的位置信息,并参与后续的分类和定位回归损失计算。
本发明的有益效果是:本发明提供了一种大幅面遥感影像目标检测方法,针对大幅面遥感图像背景复杂、尺度多样的特点,在提取特征时使用搜索机制先对图像中目标位置进行搜索得到粗略定位,然后使用由粗略位置稀疏引导的高分辨率特征计算准确的检测结果,且引入空间和通道注意力,充分提取特征,从而解决遥感图像的背景复杂,目标较小的问题。
附图说明
图1为本发明中关于数据增强的原理框图。
图2为本发明中通道注意力机制的原理框图。
图3为本发明中空间注意力机制的原理框图。
图4为本发明中搜索机制的原理框图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,基于本发明的实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。另外,专利中涉及到的所有联接/连接关系,并非单指构件直接相接,而是指可根据具体实施情况,通过添加或减少联接辅件,来组成更优的联接结构。本发明创造中的各个技术特征,在不互相矛盾冲突的前提下可以交互组合。
本发明提供了一种大幅面遥感影像目标检测方法,在本实施例中,该方法包括以下步骤:
S10、对输入图像进行数据增强处理,其处理方式包括单样本数据增强和多样本数据增强;通过对数据进行增强处理,以提高模型的泛化能力。
参照图1所示,本实施例中,单样本数据增强包括对图像进行尺度变换、随机翻转、色域增强、随机旋转以及填充等操作;并且,多样本数据增强采用Mosaic增强和Mixup融合得到增强后的图像,本实施例中,输入图像经过单样本数据增强后,依次进行Mosaic增强、仿射变换以及随机尺寸裁剪,得到的图像进行Mixup融合,并进行输出。
S20、在卷积神经网络中,通过引入通道注意力机制和空间注意力机制,得到具有通道注意力机制和空间注意力机制的特征图;
深度神经网络中卷积层的特征包含很多对于图像检测无用的信息,因此为了使得检测效果得到提升,从而在网络中引入了注意力机制。注意力机制,是对输入进行加权再输出,希望网络关注到的地方给较大的权重,不希望网络注意的地方给较小的权重。
在给定一张特征图,融合通道和空间注意力模块能够序列化地在通道和空间两个维度上产生注意力特征图信息,然后两种特征图信息在与之前原输入特征图进行相乘进行自适应特征修正,产生最后的特征图,此特征图融合通道和空间的特征具有更多的有用特征。
在本实施例中,参照图2所示,步骤S20中,引入通道注意力机制包括:对输入的特征图分别经过最大池化层和平均池化层后,再将其输出的特征通过共享多层感知机进行进一步提取,最后相加得到具有通道注意力机制的特征图
Figure SMS_35
,计算公式如下:
Figure SMS_36
其中,
Figure SMS_37
为具有通道注意力机制的特征图,/>
Figure SMS_38
表示sigmoid函数,MLP为多层感知机,F为输入的特征图,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure SMS_39
代表平均池化特征,/>
Figure SMS_40
代表最大池化特征,/>
Figure SMS_41
和/>
Figure SMS_42
是共享MLP的权重;
引入通道注意力机制输出的特征图
Figure SMS_43
的计算公式如下:
Figure SMS_44
其中,
Figure SMS_45
表示逐元素乘法。
参照图3所示,步骤S20中,引入空间注意力机制包括:在通道维度进行平均池化和最大池化,将其产生的特征图进行拼接,并在拼接的特征图上使用卷积操作来产生空间注意力特征图
Figure SMS_46
,计算公式如下:
Figure SMS_47
其中,
Figure SMS_48
为具有空间注意力机制的特征图,/>
Figure SMS_49
表示sigmoid函数,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure SMS_50
表示滤波器大小为7 × 7的卷积运算,/>
Figure SMS_51
代表平均池化特征,/>
Figure SMS_52
代表最大池化特征;
最后融合了通道注意力机制和空间注意力机制的输出特征图
Figure SMS_53
如下:
Figure SMS_54
其中,
Figure SMS_55
是经过通道注意力输出的特征图,/>
Figure SMS_56
是输入为/>
Figure SMS_57
的空间注意力机制的特征图,/>
Figure SMS_58
表示逐元素乘法。
S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中,生成一系列具有不同分辨率的特征图;在低分辨率的特征图上得到目标的粗略位置,根据得到的粗略位置在高分辨率的特征图上进行搜索,找出目标在高分辨率特征图的位置;在高分辨率特征图的基础上丢弃背景信息,构建新的高分辨率特征图并参与回归损失计算。
在本实施例中,特征化图金字塔FPN中,从查询起始层开始,每个层从上一层接收一组关键位置,并应用查询来生成稀疏值特征图;稀疏检测头和稀疏查询头预测所检测到的下一层相应的比例和关键位置的框。经特征化图像金字塔FPN输出的特征图Pi具有不同的分辨率,其中i表示特征图的层数,当i大于等于3时,将该层特征图定义为低分辨率的特征图,当i小于等于2时,将该层特征图定义为高分辨率的特征图。
本实施例中,参照图4所示,采用特征化图像金字塔FPN对特征图进行处理;所述步骤S30中,特征图被送入特征化图像金字塔FPN内,生成一系列具有不同大小的特征图
Figure SMS_59
,/>
Figure SMS_60
为不同等级的特征图,其中l表示金字塔等级,/>
Figure SMS_61
表示特征图的维度,H′等于/>
Figure SMS_62
,W′等于/>
Figure SMS_63
,H、W、C分别表示输入图片的高、宽、类别数量;金字塔等级低的特征图尺寸更大,即所说的高分辨率特征图,包含更多的特征信息,但是使用高分辨率特征图会带来计算量也会成倍增长;因此先在低分辨率的特征图上预测小目标的粗略位置。
本实施例中,通过增加一个搜索检测器,该搜索检测器的输入为低分辨率的特征图, 输出热图
Figure SMS_64
和/>
Figure SMS_65
,其中/>
Figure SMS_66
,/>
Figure SMS_67
表示热图的维度,/>
Figure SMS_68
表示深度神经网络(i,j)包含小目标的概率,R为实数集。对于一个目标,我们通过计算其中心位置(x,y)与特征图上每个位置之间的距离得到其位置信息,同时将距离小于设定值/>
Figure SMS_69
的目标定义为小目标。对于/>
Figure SMS_70
高于阈值的热图认为包含小目标,将热图中的小目标的位置信息带入下一级的高分辨率特征图,下一级的高分辨率特征图只关注热图中的小目标的位置信息,并参与后续的分类和定位回归损失计算,节省了大量的计算量。
在上述的实施例中,在基于FPN的检测器中,经过FPN层输出的不同尺度的特征图,而小目标的信息更多的在高分辨率的金字塔等级低的特征图中,但是低层特征的计算是高度冗余,在大多数情况下,小物体的空间分布非常稀疏,仅占据高分辨率特征图的一小部分,因此浪费了大量计算。因此先在低分辨率的特征图上得到目标的粗略位置,根据得到的位置在高分辨率的特征图上进行搜索,找出在高分辨率特征图的位置,在高分辨率特征图的基础上丢弃无用的背景信息,构建新的高分辨率特征图参与之后的回归损失。这种搜索方式不仅可以收获高分辨率特征图的好处,而且还可以避免对背景区域进行无用的计算。
本发明提供了一种基于搜索机制的大幅面遥感影像目标检测方法,针对大幅面遥感图像背景复杂、尺度多样的特点,在提取特征时使用搜索机制先对图像中目标位置进行搜索得到粗略定位,然后使用由粗略位置稀疏引导的高分辨率特征计算准确的检测结果,且引入空间和通道注意力,充分提取特征,从而解决遥感图像的背景复杂,目标较小的问题。本发明能够快速、准确的检测出大幅面遥感影像目标,为民用领域的无人机遥感影像的检测提供了一个可行的技术方案。
本发明的一种大幅面遥感影像目标检测方法,采用了基于深度学习的目标检测模型,融合一种搜索机制对大幅面遥感图像进行精准快速检测。其优势包括:(1)基于深度学习的目标检测模型能提取出大幅面遥感影像中关键帧图像中的有效特征;(2)融合一种新颖的搜索机制,使在提取大幅面图像特征时能够在复杂的背景下搜索到需要检测目标的粗略位置,从而突出提取检测目标的特征;(3)利用搜索机制可以减少对复杂背景的特征的提取,降低了计算成本从而提高了检测的速度;(4)引入空间和通道注意力机制模块,在提取特征时考虑对空间和通道的特征之间的关联从而充分提取特征;针对大幅面遥感影像中的复杂背景和检测目标在图像中占比较小等问题,本发明提供了一种基于搜索机制的大幅面遥感影像目标检测方法,能够准确快速的对目标进行定位检测。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (8)

1.一种大幅面遥感影像目标检测方法,其特征在于,该方法包括以下步骤:
S10、对输入图像进行数据增强处理,其处理方式包括单样本数据增强和多样本数据增强;
S20、在卷积神经网络中,通过引入通道注意力机制和空间注意力机制,得到具有通道注意力机制和空间注意力机制的特征图;
S30、将步骤S20得到的特征图送入特征化图像金字塔FPN中,生成具有不同分辨率的特征图;
在低分辨率的特征图上得到目标的粗略位置,根据得到的粗略位置在高分辨率的特征图上进行搜索,找出目标在高分辨率特征图的位置;
在高分辨率特征图的基础上丢弃背景信息,构建新的高分辨率特征图并参与回归损失计算;
步骤S30中,经特征化图像金字塔FPN输出的特征图Pi具有不同的分辨率,其中i表示特征图的层数,当i大于等于3时,将该层特征图定义为低分辨率的特征图,当i小于等于2时,将该层特征图定义为高分辨率的特征图;
步骤S30中,包括以下步骤:
S301、所述FPN层输出不同等级的特征图为
Figure QLYQS_1
,/>
Figure QLYQS_2
为不同等级的特征图,其中l表示金字塔等级,/>
Figure QLYQS_3
表示特征图的维度,H′等于/>
Figure QLYQS_4
,W′等于
Figure QLYQS_5
,H、W、C分别表示输入图片的高、宽、类别数量;
S302、通过增加一个搜索检测器,该搜索检测器的输入为低分辨率的特征图,输出热图
Figure QLYQS_6
和/>
Figure QLYQS_7
,其中/>
Figure QLYQS_8
,/>
Figure QLYQS_9
表示热图的维度,/>
Figure QLYQS_10
表示深度神经网络(i,j)包含小目标的概率;
其中,对于一个目标,通过计算其中心位置与特征图上每个位置之间的距离,得到目标的位置信息,同时将距离小于设定值
Figure QLYQS_11
的目标定义为小目标;
S303、对于
Figure QLYQS_12
高于阈值的热图认为包含小目标,将热图中的小目标的位置信息带入下一级的高分辨率特征图,下一级的高分辨率特征图只关注热图中的小目标的位置信息,并参与后续的分类和定位回归损失计算。
2.根据权利要求1所述的一种大幅面遥感影像目标检测方法,其特征在于,步骤S10中,通过对数据进行增强处理,以提高模型的泛化能力。
3.根据权利要求1所述的一种大幅面遥感影像目标检测方法,其特征在于,步骤S10中,单样本数据增强包括对输入图像进行尺度变换、随机翻转、色域增强、随机旋转以及填充的处理。
4.根据权利要求3所述的一种大幅面遥感影像目标检测方法,其特征在于,步骤S10中,多样本数据增强包括对经过单样本数据增强得到的图像依次进行Mosaic增强、仿射变换、随机尺寸裁剪以及Mixup融合的处理,并实现处理后图像的输出。
5.根据权利要求1所述的一种大幅面遥感影像目标检测方法,其特征在于,步骤S20中,引入通道注意力机制包括:
对输入的特征图分别经过最大池化层和平均池化层后,再将其输出的特征通过共享的多层感知机进行进一步提取,最后相加得到具有通道注意力机制的特征图。
6.根据权利要求5所述的一种大幅面遥感影像目标检测方法,其特征在于,引入通道注意力机制的计算结果如下:
Figure QLYQS_13
其中,
Figure QLYQS_14
为具有通道注意力机制的特征图,/>
Figure QLYQS_15
表示sigmoid函数,MLP为多层感知机,F为输入的特征图,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure QLYQS_16
代表平均池化特征,/>
Figure QLYQS_17
代表最大池化特征,/>
Figure QLYQS_18
和/>
Figure QLYQS_19
是共享MLP的权重;
引入通道注意力机制的输出特征图
Figure QLYQS_20
的计算公式如下:
Figure QLYQS_21
其中,
Figure QLYQS_22
表示逐元素乘法。
7.根据权利要求6所述的一种大幅面遥感影像目标检测方法,其特征在于,步骤S20中,引入空间注意力机制包括:在通道维度对输入特征图进行平均池化和最大池化,将其产生的特征图进行拼接,并在拼接的特征图上使用卷积操作来产生具有空间注意力的特征图。
8.根据权利要求7所述的一种大幅面遥感影像目标检测方法,其特征在于,引入空间注意力机制的计算公式如下:
Figure QLYQS_23
其中,
Figure QLYQS_24
为具有空间注意力机制的特征图,/>
Figure QLYQS_25
表示sigmoid函数,AvgPool代表平均池化,MaxPool代表最大池化,/>
Figure QLYQS_26
表示滤波器大小为7 × 7的卷积运算,/>
Figure QLYQS_27
代表平均池化特征,/>
Figure QLYQS_28
代表最大池化特征;
融合了通道注意力机制和空间注意力机制的输出特征图
Figure QLYQS_29
如下:
Figure QLYQS_30
其中,
Figure QLYQS_31
是经过通道注意力输出的特征图,/>
Figure QLYQS_32
是输入为/>
Figure QLYQS_33
的空间注意力机制的特征图,/>
Figure QLYQS_34
表示逐元素乘法。
CN202310668054.4A 2023-06-07 2023-06-07 一种大幅面遥感影像目标检测方法 Active CN116403115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310668054.4A CN116403115B (zh) 2023-06-07 2023-06-07 一种大幅面遥感影像目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310668054.4A CN116403115B (zh) 2023-06-07 2023-06-07 一种大幅面遥感影像目标检测方法

Publications (2)

Publication Number Publication Date
CN116403115A true CN116403115A (zh) 2023-07-07
CN116403115B CN116403115B (zh) 2023-08-22

Family

ID=87010845

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310668054.4A Active CN116403115B (zh) 2023-06-07 2023-06-07 一种大幅面遥感影像目标检测方法

Country Status (1)

Country Link
CN (1) CN116403115B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116863342A (zh) * 2023-09-04 2023-10-10 江西啄木蜂科技有限公司 一种基于大尺度遥感影像的松材线虫病死木提取方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10452959B1 (en) * 2018-07-20 2019-10-22 Synapse Tehnology Corporation Multi-perspective detection of objects
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111666836A (zh) * 2020-05-22 2020-09-15 北京工业大学 M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法
KR20210048837A (ko) * 2019-10-24 2021-05-04 에스케이텔레콤 주식회사 패치레벨 증강을 이용한 고해상도 영상에서의 객체 검출방법 및 장치
CN113516135A (zh) * 2021-06-23 2021-10-19 江苏师范大学 一种基于深度学习的遥感影像建筑物提取及轮廓优化方法
CN114612709A (zh) * 2022-02-28 2022-06-10 南京信息工程大学 图像金字塔特征指导的多尺度目标检测方法
CN114821246A (zh) * 2022-06-28 2022-07-29 山东省人工智能研究院 基于多层次残差网络感知和注意力机制的小目标检测方法
CN115115863A (zh) * 2022-06-28 2022-09-27 成都信息工程大学 水面多尺度目标检测方法、装置及系统和存储介质
CN115272859A (zh) * 2022-08-02 2022-11-01 清华大学 一种多尺度sar图像目标检测方法、装置、设备和介质
CN115471437A (zh) * 2022-11-14 2022-12-13 中国测绘科学研究院 一种基于卷积神经网络的影像融合方法以及遥感影像融合方法
US20220415027A1 (en) * 2021-06-29 2022-12-29 Shandong Jianzhu University Method for re-recognizing object image based on multi-feature information capture and correlation analysis
CN115861799A (zh) * 2022-11-21 2023-03-28 北京理工大学 基于注意力梯度的轻量化空对地目标检测方法
US20230169623A1 (en) * 2021-12-01 2023-06-01 Anhui University Synthetic aperture radar (sar) image target detection method

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10452959B1 (en) * 2018-07-20 2019-10-22 Synapse Tehnology Corporation Multi-perspective detection of objects
KR20210048837A (ko) * 2019-10-24 2021-05-04 에스케이텔레콤 주식회사 패치레벨 증강을 이용한 고해상도 영상에서의 객체 검출방법 및 장치
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111666836A (zh) * 2020-05-22 2020-09-15 北京工业大学 M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法
CN113516135A (zh) * 2021-06-23 2021-10-19 江苏师范大学 一种基于深度学习的遥感影像建筑物提取及轮廓优化方法
US20220415027A1 (en) * 2021-06-29 2022-12-29 Shandong Jianzhu University Method for re-recognizing object image based on multi-feature information capture and correlation analysis
US20230169623A1 (en) * 2021-12-01 2023-06-01 Anhui University Synthetic aperture radar (sar) image target detection method
CN114612709A (zh) * 2022-02-28 2022-06-10 南京信息工程大学 图像金字塔特征指导的多尺度目标检测方法
CN114821246A (zh) * 2022-06-28 2022-07-29 山东省人工智能研究院 基于多层次残差网络感知和注意力机制的小目标检测方法
CN115115863A (zh) * 2022-06-28 2022-09-27 成都信息工程大学 水面多尺度目标检测方法、装置及系统和存储介质
CN115272859A (zh) * 2022-08-02 2022-11-01 清华大学 一种多尺度sar图像目标检测方法、装置、设备和介质
CN115471437A (zh) * 2022-11-14 2022-12-13 中国测绘科学研究院 一种基于卷积神经网络的影像融合方法以及遥感影像融合方法
CN115861799A (zh) * 2022-11-21 2023-03-28 北京理工大学 基于注意力梯度的轻量化空对地目标检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TSUNG-YI LIN ETC.: "Feature Pyramid Networks for Object Detection", 《COMPUTER VISION AND PATTERN RECOGNITION 》, pages 1 - 10 *
YANG BAI ETC.: "Weak Target Detection in High-Resolution Remote Sensing Images by Combining Super-Resolution and Deformable FPN", 《 IGARSS 2020 - 2020 IEEE INTERNATIONAL GEOSCIENCE AND REMOTE SENSING SYMPOSIUM》, pages 292 - 295 *
张财广 等: "基于特征金字塔的高分辨率遥感图像飞机目标检测", 《第五届高分辨率对地观测学术年会论文集》, pages 861 - 868 *
马俊燕 等: "MFE-YOLOX: 无人机航拍下密集小目标检测算法", 《重庆邮电大学学报(自然科学版)》, pages 8 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116863342A (zh) * 2023-09-04 2023-10-10 江西啄木蜂科技有限公司 一种基于大尺度遥感影像的松材线虫病死木提取方法
CN116863342B (zh) * 2023-09-04 2023-11-21 江西啄木蜂科技有限公司 一种基于大尺度遥感影像的松材线虫病死木提取方法

Also Published As

Publication number Publication date
CN116403115B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN113436169B (zh) 一种基于半监督语义分割的工业设备表面裂纹检测方法及系统
CN113159120A (zh) 一种基于多尺度跨图像弱监督学习的违禁物检测方法
CN112163995B (zh) 一种超大航拍条带图像的拼接生成方法及装置
CN110399820B (zh) 一种公路路边景物视觉识别分析方法
CN111079739A (zh) 一种多尺度注意力特征检测方法
CN106373146A (zh) 一种基于模糊学习的目标跟踪方法
CN116403115B (zh) 一种大幅面遥感影像目标检测方法
CN113192646A (zh) 目标检测模型构建方法及不同目标间距离监控方法、装置
CN113610905B (zh) 基于子图像匹配的深度学习遥感图像配准方法及应用
CN113111727A (zh) 一种基于特征对齐的遥感场景下旋转目标检测方法
CN113034361B (zh) 一种基于改进esrgan的遥感影像超分重建方法
CN111160100A (zh) 一种基于样本生成的轻量级深度模型航拍车辆检测方法
CN113052170A (zh) 一种无约束场景下的小目标车牌识别方法
CN115205114A (zh) 一种基于orb特征的高分辨率图像拼接改进算法
CN114565824B (zh) 基于全卷积网络的单阶段旋转舰船检测方法
CN115661611A (zh) 一种基于改进Yolov5网络的红外小目标检测方法
CN113569981A (zh) 一种基于单阶段目标检测网络的电力巡检鸟窝检测方法
Babu et al. An efficient image dahazing using Googlenet based convolution neural networks
CN113657225B (zh) 一种目标检测方法
Wang et al. Afdn: Attention-based feedback dehazing network for UAV remote sensing image haze removal
CN117292120B (zh) 一种轻量化可见光绝缘子目标检测方法及系统
Zhao et al. An aircraft detection method based on improved mask R-CNN in remotely sensed imagery
CN112785629A (zh) 一种基于无监督深度光流网络的极光运动表征方法
CN110084203B (zh) 基于上下文关联的全卷积网络飞机层级检测方法
CN112560907A (zh) 基于混合域注意力的有限像素红外无人机目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant