CN114821341A - 基于fpn与pan网络的双重注意力的遥感小目标检测方法 - Google Patents
基于fpn与pan网络的双重注意力的遥感小目标检测方法 Download PDFInfo
- Publication number
- CN114821341A CN114821341A CN202210620432.7A CN202210620432A CN114821341A CN 114821341 A CN114821341 A CN 114821341A CN 202210620432 A CN202210620432 A CN 202210620432A CN 114821341 A CN114821341 A CN 114821341A
- Authority
- CN
- China
- Prior art keywords
- matrix
- channel
- attention
- remote sensing
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 47
- 239000011159 matrix material Substances 0.000 claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000010586 diagram Methods 0.000 claims abstract description 23
- 230000006835 compression Effects 0.000 claims abstract description 13
- 238000007906 compression Methods 0.000 claims abstract description 13
- 238000011176 pooling Methods 0.000 claims abstract description 13
- 230000004927 fusion Effects 0.000 claims description 34
- 241000282326 Felis catus Species 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 11
- 230000009977 dual effect Effects 0.000 claims description 10
- 230000001131 transforming effect Effects 0.000 claims description 4
- 230000017105 transposition Effects 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 11
- 230000000007 visual effect Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,属于计算机视觉领域。本发明首先对FPN网络中的顶层特征图进行池化得到通道向量,再将通道向量进行矩阵运算后得到通道注意力矩阵,接着将其归一化得到通道权重矩阵,并将该权重乘到特征图中得到带有通道权重的特征图,再与低层特征融合。在PAN网络中首先对底层特征图进行通道压缩得到空间向量,再将空间向量进行矩阵运算后得到空间注意力矩阵,接着将其归一化得到空间权重矩阵,并将该权重乘到特征图中得到带有空间权重的特征图,再与高层特征融合。最后送往检测头生成检测结果。本发明可在遥感图像检测中增强目标的检测精度,克服遥感图像中复杂背景信息带来的干扰。
Description
技术领域
本发明涉及一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,属于计算机视觉、图像应用领域。
背景技术
遥感小目标检测在车辆管控、船只调度等各个领域都有着广阔的前景。从卫星或无人机捕获的图像中检测和定位小目标的方法有很多。然而,对于噪声和低分辨率的遥感图像检测性能并不理想。现有的基于深度学习的检测方法大致可概括为两类:一类是以Faster R-CNN为代表的双阶段目标检测方法,该方法先把backbone中输出的特征图输入到RPN网络(Region Proposal Network)中,将输入样本映射成一个概率值和四个坐标值。通过训练以获得精确的候选区域,然后将候选区域与特征图送入第二阶段进行分类和回归;另一类是以YOLO系列为代表的单阶段目标检测方法,它将图像划分为等分网格后直接输入backbone,经过多个卷积层与全连接层后生成N个box并得到五个回归值(四个位置与含有物体的概率),最后再通过使用NMS算法(Non-Maximum Suppression)过滤得到最终的预测框。无论是单阶段的目标检测方法还是双阶段的检测方法,他们都存在着遥感小目标检测困难的情况。为此,研究者们在该领域进行了深入探索,并先后形成了大量优秀的小目标检测方法。其中主流方法大致分为提高分辨率后检测与多尺度特征图检测两类。
提高分辨率后检测方法的主要思想是通过生成对抗网络的方式将小目标的细节纹理信息进行重建来丰富小尺度目标的特征,进而转化为和大、中尺度目标一样或近似的特征表达来提高小目标的检测精度。比如:在EESRGAN中,Rabbi等人提出了一种由超分辨率网络和检测网络两个模块组成的网络结构,整个网络以端到端的方式进行训练。该方法首先使用超分辨率网络对低分辨率图像进行重建,然后将输出图像与对应的高分辨率图像共同输入检测网络,将检测损失梯度反向传播到超分变率网络中来优化超分变率网络,在优化检测网络的同时对超分变率网络进行优化,进而起到提高遥感图像中小尺度目标的检测精度。
由于提高分辨率后检测的方法计算量比较大,因此绝大多数研究者都偏向于在多尺度特征图检测的方向上做研究。比如:在He等人提出的FPN网络中,通过两个自底向上的分支与自顶向下的分支,分别用来产生多尺度的特征以及将高层产生的丰富语义信息融合到底层特征。通过这种方法,可以使底层特征拥有充分的语义信息,使其有利于小目标的检测;在PANet中,Liu等人对FPN网络中不同尺寸的特征图进行再次融合,使得FPN的高层特征图也拥有丰富的底层特征与多层特征。虽然这几种多尺度检测方法通过不同的特征融合方式,都分别在小目标检测性能上有着不同程度的提升,但他们都并未在遥感图像中进行实验,忽略了遥感图像中复杂背景信息对小目标对象造成不良影响问题与遥感图像中小目标对象细节信息更容易丢失的问题。
发明内容
本发明提供了一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,针对遥感图像小目标的特殊性,对特征图金字塔中的不同尺度特征图分别计算通道注意力与空间注意力,从而实现增强遥感图像小目标的语义及位置信息,提高检测精度。
本发明的技术方案是:将遥感图像数据集输入到特征提取网络中,使用特征提取网络对图像进行特征提取,得到不同尺寸的特征图金字塔。在得到的特征图金字塔中,首先对FPN网络中的顶层特征图进行池化得到通道向量,再将通道向量进行矩阵运算后得到通道注意力矩阵,接着将其归一化得到通道权重矩阵,并将该权重乘到特征图中得到带有通道权重的特征图,再与低层特征融合。在PAN网络中首先对底层特征图进行通道压缩得到空间向量,再将空间向量进行矩阵运算后得到空间注意力矩阵,接着将其归一化得到空间权重矩阵,并将该权重乘到特征图中得到带有空间权重的特征图,再与高层特征融合。最后送往检测头生成检测结果。
所述方法的具体步骤如下:
Step1:输入遥感图像集,使用特征提取网络对遥感图像集中的图像进行特征提取,得到每张图像三个不同尺寸的特征图C2,C3,C4,构成特征图金字塔C,其中C={C2,C3,C4};
Step2:在FPN中对特征提取网络中的特征图C4进行卷积操作生成特征图金字塔中新的顶层特征图P5,并对P5进行全局池化后生成通道向量并对生成的通道向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到通道注意力矩阵F5;
Step3:将Step2中生成的通道注意力矩阵F5归一化得到通道权重矩阵,并将其与P5相乘得到带有通道权重的P5_w,接着将P5_w与特征提取网络中的特征图C3进行特征融合得到特征图P4;
Step4:对Step3中生成的特征图P4进行全局池化后生成通道向量并对生成的通道向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到通道注意力矩阵F4;
Step5:将Step4中生成的通道注意力矩阵F4归一化得到通道权重矩阵,并将其与P4相乘得到带有通道权重的P4_w,接着将P4_w与特征提取网络中的特征图C2进行特征融合得到特征图P3;
Step6:在PAN中对Step5中生成的P3进行卷积操作生成特征图金字塔中新的底层特征图N3,并对N3进行通道压缩后生成空间向量并对生成的空间向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到空间注意力矩阵S3;
Step7:将Step6中生成的空间注意力矩阵S3归一化得到空间权重矩阵,并将其与N3相乘得到带有空间权重的N3_w,接着将N3_w与Step3中生成的特征图P4进行特征融合得到N4;
Step8:对Step7中生成的特征图N4进行通道压缩后生成空间向量并对生成的空间向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到空间注意力矩阵S4;
Step9:将Step8中生成的空间注意力矩阵S4归一化得到空间权重矩阵,并将其与N4相乘得到带有空间权重的N4_w,接着将N4_w与特征图P5进行特征融合得到N5;
Step10:对最终生成的特征图N3、N4、N5进行检测得到遥感小目标检测结果。
所述Step1具体如下:
根据遥感图像的不同目标类别,采用CSPDark-53网络对输入的遥感图像数据集I={I1,I2,…,In}进行特征提取,n表示遥感图像数据集中图像数量。得到每张图像三个不同尺寸的特征图C2,C3,C4,构成特征图金字塔C,其中C={C2,C3,C4}。
所述Step2具体如下:
在得到的特征图金字塔中,首先将FPN网络中的顶层特征图P5进行一次全局平均池化,得到P5的三维通道向量A5并对其进行reshape操作转换成A5_r,其中,P5∈(cp5×wp5×hp5),A5∈(cp5×1×1),A5_r∈(cp5×(1×1)),cp5为P5的通道数,wp5、hp5分别为P5的宽、高。接着将A5_r与A5_r T相乘后得到通道注意力矩阵F5,其中F5∈(cp5×cp5)。
所述Step3具体如下:
首先将通道注意力矩阵F5使用softmax归一化得到通道权重矩阵,然后再将其乘到P5上为P5赋予通道权重,得到P5_w。最后将P5_w进行二倍上采样并与经过卷积后的C3进行融合后得到P4,其中,P5_w∈(cp5×wp5×hp5),C3∈(cc3×wc3×hc3),P4∈(cp4×wp4×hp4),cc3、wc3、hc3分别为C3的通道数、宽、高,cp4、wp4、hp4分别为P4的通道数、宽、高。其计算过程如下:
P4=conv(cat(conv(C3),Upsampling(reshape(softmax(F5)×reshape(P5)))))
其中的cat表示特征融合。
所述Step4具体如下:
在Step4中对Step3中生成的特征图P4进行一次全局平均池化,得到P4的三维通道向量A4并对其进行reshape操作转换成A4_r,其中,P4∈(cp4×wp4×hp4),A4∈(cp4×1×1),A4_r∈(cp4×(1×1)),cp4为P4的通道数,wp4、hp4分别为P4的宽、高。接着将A4_r与A4_r T相乘后得到通道注意力矩阵F4,其中F4∈(cp4×cp4)。
所述Step5具体如下:
首先将通道注意力矩阵F4使用softmax归一化得到通道权重矩阵,然后再将其乘到P4上为P4赋予通道权重,得到P4_w。最后将P4_w进行二倍上采样并与经过卷积后的C2进行融合后得到P3,其中,P4_w∈(cp4×wp4×hp4),C2∈(cc2×wc2×hc2),P3∈(cp3×wp3×hp3),cc2、wc2、hc2分别为C2的通道数、宽、高,cp3、wp3、hp3分别为P3的通道数、宽、高。其计算过程如下:
P3=conv(cat(conv(C2),Upsampling(reshape(softmax(F4)×reshape(P4)))))
其中的cat表示特征融合。
所述Step6具体如下:
在得到的特征图金字塔中,首先将PAN网络中的特征图N3进行一次通道压缩,得到N3的三维空间向量R3并对其进行reshape操作转换成R3_r,其中,N3∈(cn3×wn3×hn3),R3∈(1×wn3×hn3),R3_r∈(1×(wn3×hn3)),cn3为N3的通道数,wn3为N3的宽度,hn3为N3的高度。接着将R3_r与R3_r T相乘后得到空间注意力矩阵S3,其中S3∈((wn3×hn3)×(wn3×hn3))。
所述Step7具体如下:
首先将空间注意力矩阵S3使用softmax归一化得到空间权重矩阵,然后再将其乘到N3上为N3赋予空间权重,得到N3_w。最后将N3_w进行二倍下采样并与经过卷积后的P4进行融合得到N4,其中,N3_w∈(cn3×wn3×hn3),P4∈(cp4×wp4×hp4),N4∈(cn4×wn4×hn4),cp4、wp4、hp4分别为P4的通道数、宽、高,cn4、wn4、hn4分别为N4的通道数、宽、高。其计算过程如下:
N4=conv(cat(conv(P4),Downsampling(reshape(softmax(S3)×reshape(N3)))))
其中的cat表示特征融合。
所述Step8具体如下:
在Step8中对Step7中生成的特征图N4进行一次通道压缩,得到N4的三维空间向量R4并对其进行reshape操作转换成R4_r,其中,N4∈(cn4×wn4×hn4),R4∈(1×wn4×hn4),R4_r∈(1×(wn4×hn4)),cn4为N4的通道数,wn4为N4的宽度,hn4为N4的高度。接着将R4_r与R4_r T相乘后得到空间注意力矩阵S4,其中S4∈((wn4×hn4)×(wn4×hn4))。
所述Step9具体如下:
首先将空间注意力矩阵S4使用softmax归一化得到空间权重矩阵,然后再将其乘到N4上为N4赋予空间权重,得到N4_w。最后将N4_w进行二倍下采样并与经过卷积后的P5进行融合得到N5,其中,N4_w∈(cn4×wn4×hn4),P5∈(cp5×wp5×hp5),N5∈(cn5×wn5×hn5),cp5、wp5、hp5分别为P5的通道数、宽、高,cn5、wn5、hn5分别为N5的通道数、宽、高。其计算过程如下:
N5=conv(cat(conv(P5),Downsampling(reshape(softmax(S4)×reshape(N4)))))
其中的cat表示特征融合。
所述Step10具体如下:
通过对最终生成的三层特征图金字塔N3、N4、N5进行检测,生成目标类别与置信度,得到可视化结果。
本发明的有益效果是:
1.本发明根据遥感图像中小目标特点,将基准网络中提取出的特征图金字塔在FPN网络与PAN网络中为每一层特征图赋予不同的注意力,具体为:在FPN网络中,利用语义信息最为丰富的高层特征图,首先对其进行全局池化减少计算量,再计算其各通道之间的关联性来为每个通道附加一个权重,将其与下一层特征图进行融合后达到增强每层特征图语义信息的目的。该方法可以在避免高层粗粒度特征图不准确位置信息对低层细粒度特征图准确位置信息干扰的同时来增强低层特征图的语义信息,可有效缓解遥感图像中复杂背景信息对目标特征的干扰,增强检测器分类能力。
2.本发明根据遥感图像中小目标特点,将基准网络中提取出的特征图金字塔在FPN网络与PAN网络中为每一层特征图赋予不同的注意力,具体为:在PAN网络中,利用空间信息最为丰富的低层特征图,首先对其进行通道压缩减少计算量,再计算其各像素之间的关联性来为每个像素附加一个权重,将其与上一层特征图进行融合后达到增强每层特征图空间信息的目的。该方法可以在避免低层粗粒度特征图不准确语义信息对高层细粒度特征图准确语义信息干扰的同时来增强高层特征图的位置信息,可有效提升遥感图像中目标的细节纹理信息,增强检测器定位能力。
附图说明
图1为基于FPN与PAN网络的双重注意力的遥感小目标检测方法处理流程图。
具体实施方式
为了更好的说明本发明的技术方案,下面结合附图对本发明的具体实施方式进行详细描述。
实施例1:如图1为本发明方法的流程示意图,一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,包括:
Step1提取遥感图像的特征图金字塔:通过特征提取网络对遥感图像特征进行提取生成特征图金字塔;
使用DIOR遥感图像数据集中的遥感图像作为输入图像,采用YOLOv5中的CSPDark-53特征提取网络对输入的含有船只小目标的遥感图像进行特征提取,选取特征提取网络中的三个不同阶段的包含船只目标特征的特征图组成特征图金字塔,其中每层特征图都为不同尺寸、不同通道,表示为C={C2,C3,C4}。用于后续FPN网络中进行跨层融合。
Step2生成通道注意力矩阵:通过对特征图P5进行矩阵运算得到特征图的通道注意力矩阵F5;
在FPN网络中,首先对特征图金字塔中的特征图C4进行一次卷积操作生成顶层特征图P5作为新的顶层特征图,然后再进行通道注意力的计算。在计算通道注意力过程中,首先将特征图P5进行一次全局平均池化,得到P5的三维通道向量A5,然后对其进行reshape操作转换成A5_r,并对A5_r进行转置得到A5_r T。其中,P5∈(cp5×wp5×hp5),A5∈(cp5×1×1),A5_r∈(cp5×(1×1)),cp5为P5的通道数,wp5、hp5分别为P5的宽高。接着将A5_r与A5_r T相乘后得到通道注意力矩阵F5,其中F5∈(cp5×cp5)。
Step3为特征图赋予通道权重并跨层融合:通过将通道权重乘到特征图P5上,得到P5_w,接着将其与低层特征图相融;
在获得通道注意力矩阵F5后,首先将F5使用softmax归一化得到通道权重矩阵,然后再将其乘到P5上为P5赋予通道权重,得到P5_w。最后将P5_w进行二倍上采样并与经过卷积后的C3进行融合后得到P4,其中,P5_w∈(cp5×wp5×hp5),C3∈(cc3×wc3×hc3),P4∈(cp4×wp4×hp4),cc3、wc3、hc3分别为C3的通道数、宽、高,cp4、wp4、hp4分别为P4的通道数、宽、高。其计算过程如下:
P4=conv(cat(conv(C3),Upsampling(reshape(softmax(F5)×reshape(P5)))))
其中的cat表示特征融合。
Step4生成通道注意力矩阵:通过对特征图P4进行矩阵运算得到特征图的通道注意力矩阵F4;
在Step4中对Step3中生成的特征图P4进行一次全局平均池化,得到P4的三维通道向量A4并对其进行reshape操作转换成A4_r,并对A4_r进行转置得到A4_r T。其中,P4∈(cp4×wp4×hp4),A4∈(cp4×1×1),A4_r∈(cp4×(1×1)),cp4为P4的通道数,wp4、hp4分别为P4的宽、高。接着将A4_r与A4_r T相乘后得到通道注意力矩阵F4,其中F4∈(cp4×cp4)。
Step5为特征图赋予通道权重并跨层融合:通过将通道权重乘到特征图P4上,得到P4_w,接着将其与低层特征图相融;
在获得通道注意力矩阵F4后,首先将F4使用softmax归一化得到通道权重矩阵,然后再将其乘到P4上为P4赋予通道权重,得到P4_w。最后将P4_w进行二倍上采样并与经过卷积后的C2进行融合后得到P3,其中,P4_w∈(cp4×wp4×hp4),C2∈(cc2×wc2×hc2),P3∈(cp3×wp3×hp3),cc2、wc2、hc2分别为C2的通道数、宽、高,cp3、wp3、hp3分别为P3的通道数、宽、高。其计算过程如下:
P3=conv(cat(conv(C2),Upsampling(reshape(softmax(F4)×reshape(P4)))))
其中的cat表示特征融合。
Step6生成空间注意力矩阵:通过对特征图N3进行矩阵运算得到特征图的空间注意力矩阵S3;
在PAN网络中,首先对Step5中生成的特征图P3进行一次卷积操作生成底层特征图N3作为新的底层特征图,然后再进行空间注意力的计算。在计算空间注意力过程中,首先将特征图N3进行一次通道压缩,得到N3的三维空间向量R3并对其进行reshape操作转换成R3_r,并对R3_r进行转置得到R3_r T。其中,N3∈(cn3×wn3×hn3),R3∈(1×wn3×hn3),R3_r∈(1×(wn3×hn3)),cn3为N3的通道数,wn3为N3的宽度,hn3为N3的高度。接着将R3_r与R3_r T相乘后得到空间注意力矩阵S3,其中S3∈((wn3×hn3)×(wn3×hn3))。
Step7为特征图赋予空间权重并跨层融合:通过将空间权重乘到特征图N3上,得到N3_w,接着将其与高层特征图相融;
在获得空间注意力矩阵S3后,首先将S3使用softmax归一化得到空间权重矩阵,然后再将其乘到N3上为N3赋予空间权重,得到N3_w。最后将N3_w进行二倍下采样并与经过卷积后的P4进行融合得到N4,其中,N3_w∈(cn3×wn3×hn3),P4∈(cp4×wp4×hp4),N4∈(cn4×wn4×hn4),cp4、wp4、hp4分别为P4的通道数、宽、高,cn4、wn4、hn4分别为N4的通道数、宽、高。其计算过程如下:
N4=conv(cat(conv(P4),Downsampling(reshape(softmax(S3)×reshape(N3)))))
其中的cat表示特征融合。
Step8生成空间注意力矩阵:通过对特征图N4进行矩阵运算得到特征图的空间注意力矩阵S4;
在Step8中对Step7中生成的特征图N4进行一次通道压缩,得到N4的三维空间向量R4并对其进行reshape操作转换成R4_r,其中,N4∈(cn4×wn4×hn4),R4∈(1×wn4×hn4),R4_r∈(1×(wn4×hn4)),cn4为N4的通道数,wn4为N4的宽度,hn4为N4的高度。接着将R4_r与R4_r T相乘后得到空间注意力矩阵S4,其中S4∈((wn4×hn4)×(wn4×hn4))。
Step9为特征图赋予空间权重并跨层融合:通过将空间权重乘到特征图N4上,得到N4_w,接着将其与高层特征图相融;
在获得空间注意力矩阵S4后,首先将S4使用softmax归一化得到空间权重矩阵,然后再将其乘到N4上为N4赋予空间权重,得到N4_w。最后将N4_w进行二倍下采样并与经过卷积后的P5进行融合得到N5,其中,N4_w∈(cn4×wn4×hn4),P5∈(cp5×wp5×hp5),N5∈(cn5×wn5×hn5),cp5、wp5、hp5分别为P5的通道数、宽、高,cn5、wn5、hn5分别为N5的通道数、宽、高。其计算过程如下:
N5=conv(cat(conv(P5),Downsampling(reshape(softmax(S4)×reshape(N4)))))
其中的cat表示特征融合。
Step10对特征图进行检测:对PAN网络输出的特征图金字塔进行检测并生成最终可视化效果;
通过对最终生成的三层特征图金字塔N3、N4、N5进行预测,在遥感图像中标注出船只小目标的位置并添加类别名称与置信度,得到可视化结果。
本实施例中,本发明在最新遥感小目标数据集DIOR数据集上进行了实验,与大量优秀的目标检测方法进行了比较,比较结果如表1所示,比较的方法包括:双阶段检测方法,即Libra R-CNN与Dynamic R-CNN;单阶段检测方法,即SSD,YOLOv3与YOLOx。其中“-”表示无报告数据,APs表示遥感图像中小目标检测精度,mAP表示所有类别平均表示精度。
在表1可知,本发明所提出方法在DIOR数据集上较所对比方法均取得最高值。其中,APs指标较次优小目标检测方法YOLOx高出5.9个百分比。mAP较次优小目标检测方法YOLOx高出0.3个百分比。
与双阶段目标检测方法对比,本发明所提出方法在DIOR数据集上较最优双阶段算法Libra R-CNN均表现出最优性能。其中,APs指标较Libra R-CNN高出8.3个百分比。mAP较Libra R-CNN高出6.3个百分比。
表1本发明与其他方法对比
本发明提出一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,该方法通过分别计算高层特征图的通道注意力与低层特征图的空间注意力来分别强化特征图中的语义信息与位置信息,可有效抑制遥感图像中背景信息的表达并对小目标细节信息进行再次增强,进而提升模型在遥感图像目标检测任务上的表现能力。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (10)
1.一种基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于,包括如下步骤:
Step1:输入遥感图像集,使用特征提取网络对遥感图像集中的图像进行特征提取,得到每张图像三个不同尺寸的特征图C2,C3,C4,构成特征图金字塔C,其中C={C2,C3,C4};
Step2:在FPN中对特征提取网络中的特征图C4进行卷积操作生成特征图金字塔中新的顶层特征图P5,并对P5进行全局池化后生成通道向量并对生成的通道向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到通道注意力矩阵F5;
Step3:将Step2中生成的通道注意力矩阵F5归一化得到通道权重矩阵,并将其与P5相乘得到带有通道权重的P5_w,接着将P5_w与特征提取网络中的特征图C3进行特征融合得到特征图P4;
Step4:对Step3中生成的特征图P4进行全局池化后生成通道向量并对生成的通道向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到通道注意力矩阵F4;
Step5:将Step4中生成的通道注意力矩阵F4归一化得到通道权重矩阵,并将其与P4相乘得到带有通道权重的P4_w,接着将P4_w与特征提取网络中的特征图C2进行特征融合得到特征图P3;
Step6:在PAN中对Step5中生成的P3进行卷积操作生成特征图金字塔中新的底层特征图N3,并对N3进行通道压缩后生成空间向量并对生成的空间向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到空间注意力矩阵S3;
Step7:将Step6中生成的空间注意力矩阵S3归一化得到空间权重矩阵,并将其与N3相乘得到带有空间权重的N3_w,接着将N3_w与Step3中生成的特征图P4进行特征融合得到N4;
Step8:对Step7中生成的特征图N4进行通道压缩后生成空间向量并对生成的空间向量进行reshape操作生成二维矩阵,再对该二维矩阵进行转置后与自身相乘得到空间注意力矩阵S4;
Step9:将Step8中生成的空间注意力矩阵S4归一化得到空间权重矩阵,并将其与N4相乘得到带有空间权重的N4_w,接着将N4_w与特征图P5进行特征融合得到N5;
Step10:对最终生成的特征图N3、N4、N5进行检测得到遥感小目标检测结果。
2.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:Step1中,根据遥感图像的不同目标类别,采用CSPDark-53网络对输入的遥感图像数据集I={I1,I2,…,In}进行特征提取,n表示遥感图像数据集中图像数量,在Step10中通过对最终生成的三层特征图金字塔N3、N4、N5进行检测,生成目标类别与置信度。
3.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:Step2中,将FPN网络中的顶层特征图P5进行一次全局平均池化,得到P5的三维通道向量A5并对其进行reshape操作转换成A5_r,然后对A5_r进行转置得到A5_r T,其中,P5∈(cp5×wp5×hp5),A5∈(cp5×1×1),A5_r∈(cp5×(1×1)),cp5为P5的通道数,wp5、hp5分别为P5的宽和高,接着将A5_r与A5_r T相乘后得到通道注意力矩阵F5,其中F5∈(cp5×cp5)。
4.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step3中将通道注意力矩阵F5使用softmax归一化得到通道权重矩阵,然后再将其乘到P5上为P5赋予通道权重,得到P5_w,最后将P5_w进行二倍上采样并与经过卷积后的C3进行融合后得到P4,其中,P5_w∈(cp5×wp5×hp5),C3∈(cc3×wc3×hc3),P4∈(cp4×wp4×hp4),cc3、wc3、hc3分别为C3的通道数、宽、高,cp4、wp4、hp4分别为P4的通道数、宽、高,其计算过程如下:
P4=conv(cat(conv(C3),Upsampling(reshape(softmax(F5)×reshape(P5)))))
其中的cat表示特征融合。
5.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step4中对Step3中生成的特征图P4进行一次全局平均池化,得到P4的三维通道向量A4并对A4进行reshape操作转换成A4_r,并对A4_r进行转置得到A4_r T,其中,P4∈(cp4×wp4×hp4),A4∈(cp4×1×1),A4_r∈(cp4×(1×1)),cp4为P4的通道数,wp4、hp4分别为P4的宽、高,接着将A4_r与A4_r T相乘后得到通道注意力矩阵F4,其中F4∈(cp4×cp4)。
6.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step5中将通道注意力矩阵F4使用softmax归一化得到通道权重矩阵,然后再将其乘到P4上为P4赋予通道权重,得到P4_w,最后将P4_w进行二倍上采样并与经过卷积后的C2进行融合后得到P3,其中,P4_w∈(cp4×wp4×hp4),C2∈(cc2×wc2×hc2),P3∈(cp3×wp3×hp3),cc2、wc2、hc2分别为C2的通道数、宽、高,cp3、wp3、hp3分别为P3的通道数、宽、高,其计算过程如下:
P3=conv(cat(conv(C2),Upsampling(reshape(softmax(F4)×reshape(P4)))))
其中的cat表示特征融合。
7.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step6中将PAN网络中的特征图N3进行一次通道压缩,得到N3的三维空间向量R3并对其进行reshape操作转换成R3_r,并对R3_r进行转置得到R3_r T,其中,N3∈(cn3×wn3×hn3),R3∈(1×wn3×hn3),R3_r∈(1×(wn3×hn3)),cn3为N3的通道数,wn3为N3的宽度,hn3为N3的高度,接着将R3_r与R3_r T相乘后得到空间注意力矩阵S3,其中S3∈((wn3×hn3)×(wn3×hn3))。
8.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step7中将空间注意力矩阵S3使用softmax归一化得到空间权重矩阵,然后再将其乘到N3上为N3赋予空间权重,得到N3_w,最后将N3_w进行二倍下采样并与经过卷积后的P4进行融合得到N4,其中,N3_w∈(cn3×wn3×hn3),P4∈(cp4×wp4×hp4),N4∈(cn4×wn4×hn4),cp4、wp4、hp4分别为P4的通道数、宽高,cn4、wn4、hn4分别为N4的通道数、宽、高,其计算过程如下:
N4=conv(cat(conv(P4),Downsampling(reshape(softmax(S3)×reshape(N3)))))
其中的cat表示特征融合。
9.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step8中对Step7中生成的特征图N4进行一次通道压缩,得到N4的三维空间向量R4并对其进行reshape操作转换成R4_r,并对R4_r进行转置得到R4_r T,其中,N4∈(cn4×wn4×hn4),R4∈(1×wn4×hn4),R4_r∈(1×(wn4×hn4)),cn4为N4的通道数,wn4为N4的宽度,hn4为N4的高度,接着将R4_r与R4_r T相乘后得到空间注意力矩阵S4,其中S4∈((wn4×hn4)×(wn4×hn4))。
10.根据权利要求1所述的基于FPN与PAN网络的双重注意力的遥感小目标检测方法,其特征在于:在Step9中将空间注意力矩阵S4使用softmax归一化得到空间权重矩阵,然后再将其乘到N4上为N4赋予空间权重,得到N4_w,最后将N4_w进行二倍下采样并与经过卷积后的P5进行融合得到N5,其中,N4_w∈(cn4×wn4×hn4),P5∈(cp5×wp5×hp5),N5∈(cn5×wn5×hn5),cp5、wp5、hp5分别为P5的通道数、宽高,cn5、wn5、hn5分别为N5的通道数、宽、高,其计算过程如下:
N5=conv(cat(conv(P5),Downsampling(reshape(softmax(S4)×reshape(N4)))))
其中的cat表示特征融合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210620432.7A CN114821341A (zh) | 2022-06-02 | 2022-06-02 | 基于fpn与pan网络的双重注意力的遥感小目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210620432.7A CN114821341A (zh) | 2022-06-02 | 2022-06-02 | 基于fpn与pan网络的双重注意力的遥感小目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114821341A true CN114821341A (zh) | 2022-07-29 |
Family
ID=82519467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210620432.7A Pending CN114821341A (zh) | 2022-06-02 | 2022-06-02 | 基于fpn与pan网络的双重注意力的遥感小目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114821341A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115035354A (zh) * | 2022-08-12 | 2022-09-09 | 江西省水利科学院 | 基于改进yolox的水库水面漂浮物目标检测方法 |
CN116403122A (zh) * | 2023-04-14 | 2023-07-07 | 北京卫星信息工程研究所 | 无锚框定向目标检测方法 |
-
2022
- 2022-06-02 CN CN202210620432.7A patent/CN114821341A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115035354A (zh) * | 2022-08-12 | 2022-09-09 | 江西省水利科学院 | 基于改进yolox的水库水面漂浮物目标检测方法 |
CN115035354B (zh) * | 2022-08-12 | 2022-11-08 | 江西省水利科学院 | 基于改进yolox的水库水面漂浮物目标检测方法 |
CN116403122A (zh) * | 2023-04-14 | 2023-07-07 | 北京卫星信息工程研究所 | 无锚框定向目标检测方法 |
CN116403122B (zh) * | 2023-04-14 | 2023-12-19 | 北京卫星信息工程研究所 | 无锚框定向目标检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135267B (zh) | 一种大场景sar图像细微目标检测方法 | |
CN111191736B (zh) | 基于深度特征交叉融合的高光谱图像分类方法 | |
CN108764063B (zh) | 一种基于特征金字塔的遥感影像时敏目标识别系统及方法 | |
CN111179217A (zh) | 一种基于注意力机制的遥感图像多尺度目标检测方法 | |
CN111291809B (zh) | 一种处理装置、方法及存储介质 | |
CN111461083A (zh) | 基于深度学习的快速车辆检测方法 | |
CN112347888B (zh) | 基于双向特征迭代融合的遥感图像场景分类方法 | |
CN114821341A (zh) | 基于fpn与pan网络的双重注意力的遥感小目标检测方法 | |
CN111126278A (zh) | 针对少类别场景的目标检测模型优化与加速的方法 | |
Fan et al. | A novel sonar target detection and classification algorithm | |
CN113128564B (zh) | 一种基于深度学习的复杂背景下典型目标检测方法及系统 | |
CN111723660A (zh) | 一种用于长形地面目标检测网络的检测方法 | |
CN116012722A (zh) | 一种遥感影像场景分类方法 | |
CN116229452A (zh) | 一种基于改进的多尺度特征融合的点云三维目标检测方法 | |
CN116630700A (zh) | 基于引入通道-空间注意力机制的遥感图像分类方法 | |
CN116342894A (zh) | 基于改进YOLOv5的GIS红外特征识别系统及方法 | |
CN117853955A (zh) | 一种基于改进YOLOv5的无人机小目标检测方法 | |
Wang et al. | Global contextual guided residual attention network for salient object detection | |
CN114612658A (zh) | 基于双重类别级对抗网络的图像语义分割方法 | |
CN114170526A (zh) | 基于轻量化网络的遥感影像多尺度目标检测识别方法 | |
Chen et al. | Ship detection with optical image based on attention and loss improved YOLO | |
Wang et al. | Cross-domain learning using optimized pseudo labels: toward adaptive car detection in different weather conditions and urban cities | |
CN117576009A (zh) | 一种基于改进YOLOv5s的高精度太阳能电池板缺陷检测方法 | |
CN117173595A (zh) | 基于改进YOLOv7的无人机航拍图像目标检测方法 | |
CN107358625A (zh) | 基于SPP Net和感兴趣区域检测的高分辨SAR图像变化检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |