CN115565077A - 一种基于空间特征整合的遥感图像小目标检测算法 - Google Patents

一种基于空间特征整合的遥感图像小目标检测算法 Download PDF

Info

Publication number
CN115565077A
CN115565077A CN202211203676.1A CN202211203676A CN115565077A CN 115565077 A CN115565077 A CN 115565077A CN 202211203676 A CN202211203676 A CN 202211203676A CN 115565077 A CN115565077 A CN 115565077A
Authority
CN
China
Prior art keywords
feature
layer
features
remote sensing
sensing image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211203676.1A
Other languages
English (en)
Inventor
张清江
陶成钢
赵龙
曾凡玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Tianshu Technology Co ltd
Original Assignee
Harbin Tianshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Tianshu Technology Co ltd filed Critical Harbin Tianshu Technology Co ltd
Priority to CN202211203676.1A priority Critical patent/CN115565077A/zh
Publication of CN115565077A publication Critical patent/CN115565077A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Astronomy & Astrophysics (AREA)
  • Image Analysis (AREA)

Abstract

一种基于空间特征整合的遥感图像小目标检测算法,主要包括通道‑位置注意力机制模块、高层特征增强模块以及一个特征细化分支。通过采用这三个模块能够实现特征提取过程中,空间特征信息的有效整合,还能够弥补高层目标位置信息的缺失以及减少背景特征对于目标特征的影响,能够对检测精度进行改善,使其模型满足高精度的指标要求,提高模型鲁棒性和可用性。

Description

一种基于空间特征整合的遥感图像小目标检测算法
技术领域
本发明属于遥感图像小目标检测领域,具体涉及一种基于空间特征整合的遥感图像小目标检测算法。
背景技术
近年来,随着深度学习理论的不断发展及工业界需求的日益增长,基于遥感图像的小目标检测技术的研究引起了越来越广泛的关注。识别出不同类别的目标并标注其所在的位置是计算机视觉任务中的基础问题之一,被广泛应用于城市智慧交通、物流管理、农林业发展、公共安全、抗灾救灾部署等任务场景中,然而,对于小目标而言,由于在图像中具有较小的像素,因而包含的判别性特征过少,同时受到复杂背景的影响,小目标在检测过程中极其可能被视为斑点噪声,因此基于遥感图像的小目标检测仍然存在着巨大挑战。
目前专门针对小目标检测的算法研究较少,现有的小目标检测算法一般是在通用目标检测方法的基础之上提出一些改进或优化策略,通过加深网络的层数,设计能够提取到更丰富特征的主干网络、复杂化特征融合过程来增强模型对多尺度目标的鲁棒性,从而提升对小目标的检测性能。此外,生成式对抗网络、数据扩充等技术也被用于解决小目标检测问题。相关算法研究缺乏通用性,难以迁移到其他应用场景下的小目标检测任务中。
发明内容
为了有效提高遥感图像中小型舰船的小目标检测能力,本发明提供了一种基于空间特征整合的遥感图像小目标检测算法。该网络主要采用了三个模块,通道-位置注意力机制模块、高级特征增强模块以及一个特征细化分支,分别通过对加强空间信息的提取,减少高级特征中确实的小目标信息以及增强小目标与周围背景之间的差异性来实现高精度的小目标检测。
为实现上述目的,本发明采取的技术方案如下:
一种基于空间特征整合的遥感图像小目标检测算法,所述算法为:将遥感图像依次通过通道-位置注意力机制(CLAM)模块、高级特征增强模块和特征细化分支进行处理。
所述算法具体为:
步骤一:通道-位置注意力机制(CLAM)模块将位置信息沿着两个空间方向嵌入到通道信息中,通过从两个空间方向整合位置信息可帮助骨干网络实现更精确的目标定位,对通道相似性和空间相关性进行整合,在增强主干网络的特征提取能力方面取得了优异的性能;
步骤二:使用卷积核大小为3×3的卷积层对步骤一整合后的特征进行下采样,处理后的特征被送到不同尺度的池化层进行池化操作,多尺度池化层不仅可以帮助我们的网络提取位置信息,还可以提取不同的细粒度特征。为了避免破坏全局特征,直接拼接并行的多个池化层,并使用3×3卷积来整合信道维度,将高级特征增强模块处理之后的特征与最高层的输出特征进行融合;步骤二中,使用多个池层来减少高级特征中小目标位置信息的丢失,提升骨干网络高特征层的性能;
步骤三:网络的neck端有五层输出,即C1、C2、C3、C4和C5;选择输出的任一特征层(例如使用中间层C3),并采用最大池操作用于对所选层下层的的低级特征(C1和C2)进行上采样,并且插值方法用于处理所选层上层的高级特征(C4和C5),这样,每个特征层的尺度可以转换为与所选特征层相同,接下来,将处理过的特征进行累加以实现特征融合,融合后的特征具有丰富的位置信息和细节信息。在特征融合阶段,突出了目标本身的特征表示,并且减弱了周围复杂背景的干扰,以融合各特征层的特征信息后进行特征优化,来增强网络增强目标和背景之间的差异以区分目标和背景的特征信息,解决了小目标易受周围背景信息干扰的问题,从而有效地减少误报和漏检。
本发明相对于现有技术的有益效果为:能够帮助骨干网络实现更精准的目标定位,补偿高层小目标的位置信息损失,以及有效的增强目标与背景之间的差异,实现在小尺度目标上的更高精度、更低误检的检测效果。整体而言,该小目标检测算法能够在减少漏检以及虚警的同时提升检测精度,实现高精度的小目标检测,并且具备良好的鲁棒性能。
附图说明
图1是基于空间特征整合的遥感图像小目标检测算法结构简图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
实施例1:
一种基于空间特征整合的遥感图像小目标检测算法,主要发明内容包括通道-位置注意力机制模块、高层特征增强模块以及一个特征细化分支,其中:
通道-位置注意力机制模块旨在提高骨干网络的目标定位能力,分别从X方向和Y方向进行提取特征,然后整合特征。具体而言,在第一阶段,使用两个的池化核(H,1)和(1,W)分别沿水平方向和垂直方向整合特征的每个通道信息,然后将特征分解为两个并行的一维向量。沿两个空间方向提取特征可以有效地提取位置信息,增强位置特征的表达能力。此外,还采用自适应最大池化操作以突出目标的主要信息并增强特征的纹理信息。
高层特征增强模块将多个池层处理的特征与原始特征沿通道级拼接,更充分地弥补了缺失的位置特征。首先,使用核大小为3×3的卷积层进行下采样。其次,经过处理后的特征图被送入不同尺度的池化层进行池化操作,多尺度池化层不仅有助于网络提取位置信息,还可以提取不同的细粒度特征。
特征细化分支的具体操作过程是对neck端的五个特征输出层,即C1、C2、C3、C4和C5进行操作。首先,选择输出的任何特征层(建议使用中间层C3),采用最大池化操作对所选层下方的低层特征(C1和C2)进行上采样,采用插值的方法对所选层上方的高级特征(C4和C5)进行操作。这样,每个特征层的比例可以转换为与所选特征层相同的尺度。接下来,将处理过的特征层进行相加实现特征融合,融合后的特征具有丰富的位置信息和细节信息。

Claims (2)

1.一种基于空间特征整合的遥感图像小目标检测算法,其特征在于:所述算法为:将遥感图像依次通过通道-位置注意力机制模块、高级特征增强模块和特征细化分支进行处理。
2.根据权利要求1所述的一种基于空间特征整合的遥感图像小目标检测算法,其特征在于:所述算法具体为:
步骤一:通道-位置注意力机制模块将位置信息沿着两个空间方向嵌入到通道信息中,对通道相似性和空间相关性进行整合;
步骤二:使用卷积核大小为3×3的卷积层对步骤一整合后的特征进行下采样,处理后的特征被送到不同尺度的池化层进行池化操作,将高级特征增强模块处理之后的特征与最高层的输出特征进行融合;
步骤三:网络的neck端有五层输出,即C1、C2、C3、C4和C5;选择输出的任一特征层(例如使用中间层C3),并采用最大池操作用于对所选层下层的的低级特征(C1和C2)进行上采样,并且插值方法用于处理所选层上层的高级特征(C4和C5),这样,每个特征层的尺度可以转换为与所选特征层相同,接下来,将处理过的特征进行累加以实现特征融合,融合后的特征具有丰富的位置信息和细节信息。
CN202211203676.1A 2022-09-29 2022-09-29 一种基于空间特征整合的遥感图像小目标检测算法 Pending CN115565077A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211203676.1A CN115565077A (zh) 2022-09-29 2022-09-29 一种基于空间特征整合的遥感图像小目标检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211203676.1A CN115565077A (zh) 2022-09-29 2022-09-29 一种基于空间特征整合的遥感图像小目标检测算法

Publications (1)

Publication Number Publication Date
CN115565077A true CN115565077A (zh) 2023-01-03

Family

ID=84743607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211203676.1A Pending CN115565077A (zh) 2022-09-29 2022-09-29 一种基于空间特征整合的遥感图像小目标检测算法

Country Status (1)

Country Link
CN (1) CN115565077A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190244378A1 (en) * 2018-02-08 2019-08-08 Haiwei DONG Group optimization depth information method and system for constructing a 3d feature map
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN112835068A (zh) * 2021-03-17 2021-05-25 哈尔滨天枢问道技术有限公司 基于全球卫星导航系统的gbas与sbas融合系统
CN114708511A (zh) * 2022-06-01 2022-07-05 成都信息工程大学 基于多尺度特征融合和特征增强的遥感图像目标检测方法
CN114972860A (zh) * 2022-05-23 2022-08-30 郑州轻工业大学 一种基于注意增强的双向特征金字塔网络的目标检测方法
CN115063573A (zh) * 2022-06-14 2022-09-16 湖北工业大学 一种基于注意力机制的多尺度目标检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190244378A1 (en) * 2018-02-08 2019-08-08 Haiwei DONG Group optimization depth information method and system for constructing a 3d feature map
CN111179217A (zh) * 2019-12-04 2020-05-19 天津大学 一种基于注意力机制的遥感图像多尺度目标检测方法
CN112835068A (zh) * 2021-03-17 2021-05-25 哈尔滨天枢问道技术有限公司 基于全球卫星导航系统的gbas与sbas融合系统
CN114972860A (zh) * 2022-05-23 2022-08-30 郑州轻工业大学 一种基于注意增强的双向特征金字塔网络的目标检测方法
CN114708511A (zh) * 2022-06-01 2022-07-05 成都信息工程大学 基于多尺度特征融合和特征增强的遥感图像目标检测方法
CN115063573A (zh) * 2022-06-14 2022-09-16 湖北工业大学 一种基于注意力机制的多尺度目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAN SU等: "SII-Net:Spatial Information Integration Network for Small Target Detection in SAR Images" *

Similar Documents

Publication Publication Date Title
Wang et al. DDU-Net: Dual-decoder-U-Net for road extraction using high-resolution remote sensing images
CN112183203B (zh) 一种基于多尺度像素特征融合的实时交通标志检测方法
CN110084124B (zh) 基于特征金字塔网络的特征增强目标检测方法
CN115601549B (zh) 基于可变形卷积和自注意力模型的河湖遥感图像分割方法
Dai et al. RADANet: Road augmented deformable attention network for road extraction from complex high-resolution remote-sensing images
CN114581752B (zh) 一种基于上下文感知和边界细化的伪装目标检测方法
CN110796105A (zh) 一种基于多模态数据融合的遥感图像语义分割方法
CN116823819B (zh) 一种焊缝表面缺陷检测方法、系统、电子设备及存储介质
CN115019274A (zh) 一种融合追踪与检索算法的路面病害识别方法
CN113762187B (zh) 一种多源遥感图像融合语义分割方法及系统
CN116994135A (zh) 一种基于视觉与雷达融合的船舶目标检测方法
CN118072275A (zh) 一种结合激光与视觉的可行驶区域检测方法和系统
CN114332780A (zh) 一种针对小目标的交通人车非目标检测方法
CN118135399A (zh) 一种基于边缘增强双编码器方向感知网络的卫星影像道路提取方法
CN117635628A (zh) 一种基于上下文注意力和边界感知引导的海陆分割方法
CN117351360A (zh) 一种基于注意力机制改进的遥感图像道路提取方法
CN115565077A (zh) 一种基于空间特征整合的遥感图像小目标检测算法
CN111931793A (zh) 一种显著性目标提取方法及系统
CN115861922A (zh) 一种稀疏烟火检测方法、装置、计算机设备及存储介质
CN115331112A (zh) 基于多粒度词元的红外与可见光图像融合方法及系统
Nguyen Deep Neural Network-based Detection of Road Traffic Objects from Drone-Captured Imagery Focusing on Road Regions
Xu et al. Damaged Building Detection with Improved Swin‐Unet Model
CN118298184B (zh) 一种基于层级式误差修正的高分辨率遥感语义分割方法
CN117392392B (zh) 一种割胶线识别与生成方法
CN118397602B (zh) 一种智能路牌识别车载摄像头系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230103

RJ01 Rejection of invention patent application after publication