CN110633661A - 一种融合语义分割的遥感图像目标检测方法 - Google Patents

一种融合语义分割的遥感图像目标检测方法 Download PDF

Info

Publication number
CN110633661A
CN110633661A CN201910820020.6A CN201910820020A CN110633661A CN 110633661 A CN110633661 A CN 110633661A CN 201910820020 A CN201910820020 A CN 201910820020A CN 110633661 A CN110633661 A CN 110633661A
Authority
CN
China
Prior art keywords
pyramid
channels
remote sensing
semantic
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910820020.6A
Other languages
English (en)
Inventor
崔振
虞政麟
李承政
许春燕
张桐
杨健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Tech University
Original Assignee
Nanjing Tech University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Tech University filed Critical Nanjing Tech University
Priority to CN201910820020.6A priority Critical patent/CN110633661A/zh
Publication of CN110633661A publication Critical patent/CN110633661A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种融合语义分割的遥感图像目标检测方法,构建改进的特征金字塔网络,提取遥感图像的多层金字塔特征;对金字塔特征进行语义分割,获取目标边界框级别的掩码和语义特征;构建图片笛卡尔直角坐标系,根据提取的金字塔特征和生成的边界框级别的掩码生成与图片坐标轴平行的候选框;根据候选框坐标、多层金字塔特征、语义特征和归一化后的原始图像确定边界框特征,再进行回归和softmax操作得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息。本发明提高了遥感图像小目标检测的准确率。

Description

一种融合语义分割的遥感图像目标检测方法
技术领域
本发明涉及图像处理技术,具体涉及一种融合语义分割的遥感图像目标检测方法。
背景技术
遥感图像上的目标检测已成功应用在城市道路建设、自然灾害管理等方面。但是因为姿态和高度的差异性,遥感卫星在获取的图像中,目标往往具有尺度多样性、排列方向随意性、背景复杂度高等特性,这给传统的目标检测算法带来了很大的挑战性,所以我们需要对传统的目标检测算法进行改进,使其能满足遥感图像的特性。
目前,已有许多针对遥感图像特性而改进的方法,例如何恺明等人提出了特征金字塔网络,主要解决目标的尺度多样性的问题,但由于遥感图像背景复杂度高,所以金字塔网络产生的特征会受到噪声的影响而效果减弱;李敏等人提出了基于大小场景整合的遥感小目标检测算法,通过蝇视觉的LF-SF整合机理,抑制了复杂的背景纹理特征,但对于图像的尺度多样性考虑不足,因而生成的结果也不够好。
发明内容
本发明的目的在于提供一种融合语义分割的遥感图像目标检测方法,来检测出遥感图像上目标的位置和类别信息。
实现本发明目的的技术解决方案为:一种融合语义分割的遥感图像目标检测方法,包括以下步骤:
步骤1、构建改进的特征金字塔网络,提取遥感图像的多层金字塔特征;
步骤2、对金字塔特征进行语义分割,获取目标边界框级别的掩码和语义特征;
步骤3、构建图片笛卡尔直角坐标系,根据提取的金字塔特征和生成的边界框级别的掩码生成与图片坐标轴平行的候选框;
步骤4、根据候选框坐标、多层金字塔特征、语义特征和归一化后的原始图像确定边界框特征,再进行回归和softmax操作得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息。
本发明与现有技术相比,其显著优点为:考虑了遥感图像下目标的尺度多样性、方向任意性以及背景复杂度高等特性,对传统目标检测方式中的FPN、RPN、ROI Pooling进行改进,提高了遥感图像上小目标检测的准确率。
附图说明
图1为本发明融合语义分割的遥感图像目标检测方法的流程图。
图2为本发明改进的特征金字塔网络的示意图。
图3为本发明语义分割模型的示意图。
图4为本发明基于多级融合的ROI模块的示意图。
具体实施方式
下面结合附图和具体实施例,进一步说明本发明方案。
如图1所示,一种融合语义分割的遥感图像目标检测方法,包括如下步骤:
步骤1、构建改进的特征金字塔网络,提取遥感图像的金字塔特征;
改进的特征金字塔网络为6层,如图2所示,其在传统的特征金字塔网络(FPN)中,增加1x1的卷积层和四分支增强模块,所述四分支增强模块由多个不同尺寸的卷积核构成,用来获得不同尺度的特征。改进的特征金字塔网络中,首先使用1x1的卷积层,将编码层输出的编码特征转变为256个通道的特征;然后采取多分支增强模块,将256个通道分成4个分支网络,每个网络有64个通道,通过各自通道的卷积核变换后,将所有特征组合得到1个有256个通道的特征图;再用经上采样后的解码器对有256个通道的特征图解码,即可得到多层金字塔(FPN)特征。
步骤2、对金字塔特征进行语义分割,获取目标边界框级别的掩码和语义特征;
语义分割过程如图3所示,首先通过采用上采样和下采样的方法将多层FPN目标特征都标准化成相同的空间尺寸大小(即P2层的空间尺寸),融合后通过空洞空间金字塔池化(ASPP)模块生成语义表征,再利用通道为1和256的1x1卷积层,分别产生边界框级别的掩码以及语义特征。本发明使用的ASPP模块中,采用4个并行的卷积层,分别为普通的1x1卷积层和空洞率为24/48/72的3x3卷积层。此外,考虑到遥感图像目标检测中小物体较多,本发明的层级下采样比率为4。
步骤3、根据提取的金字塔特征和生成的边界框级别的掩码,产生与坐标轴平行的候选框坐标;
将生成的掩码只下采样到P3~P6层,得到采样后的掩码,然后把它们分别与对应层的金字塔特征点乘,得到点乘后的特征向量,然后把它输入区域候选网络(RPN)中,分别通过回归和softmax操作,可以得到多个与坐标轴平行的候选框坐标,以及前景和背景的值(根据所框内容判断是不是目标,是则为前景,反之则为背景,前景为正,背景为负),将多个候选框按正负比为1:3的比例送入后续网络(代表前景或者背景的候选框都要输入后续网络,此正负比的设置是为了使步骤4回归和softmax操作更精确)。本发明使用的坐标轴为笛卡尔直角坐标系,以输入图片的左上角顶点为原点,水平方向和竖直方向为坐标轴,下面所提坐标轴都是这个。
步骤4、根据候选框坐标、多层金字塔特征、语义特征和归一化后的原始图像确定边界框特征,再进行回归和softmax操作得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息;
将上述正负比为1:3的多个候选框坐标映射在多层金字塔特征、语义特征和归一化后的原始图像上,得到在这些特征映射上的候选框坐标,再通过池化操作,得到大小固定的候选框,再通过全连接层,与给定的权重进行矩阵相乘,得到边界框特征,然后分别进行回归和softmax操作,就可分别得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息;
如图4所示,一方面,通过ROI Pooling操作,具体表述为将多层FPN特征和语义特征相加起来,形成一个特征映射(此处的特征映射通道数为256),将上述正负比为1:3的多个水平区域候选框坐标映射在上面(映射的规则为将候选框的坐标除以“输入图片与FPN多层特征和语义特征相加得到的特征映射的比值”),得到在该特征映射上的候选框坐标,将这些坐标通过池化操作,得到大小固定的候选框,将它输入全连接层,与给定的权重A进行矩阵相乘,获得一个池化特征F1(经过全连接层,特征的通道数由原来的256个变成1024个);另一方面,同样通过ROI Pooling操作,具体表述为将原始图像归一化,形成一个特征映射(此处的特征映射通道数为3),将上述正负比为1:3的多个水平区域候选框坐标映射在上面(映射的规则为将候选框的坐标除以“输入图片与归一化后的原始图像的比值”),得到在此特征映射上的候选框坐标,将这些坐标通过池化操作,得到另外一些大小固定的候选框,将它输入到另一个全连接层,与给定的权重B进行矩阵相乘,获得池化特征F2(经过全连接层,特征的通道数由原来的3个变成1024个)。将这两个池化特征相加再通过第三个全连接层,与给定的权重C进行矩阵相乘,得到边界框特征F3(经过全连接层,特征的通道数保持1024个不变),然后将该边界框特征一方面进行回归操作得到与坐标轴平行/旋转的边界框的位置信息;另一方面进行softmax操作得到物体的类别信息。(文中所述的权重A、B、C,每一类都有很多权重,A、B、C为了区分3个全连接层使用的权重不一样)
实施例
为了验证本发明方案的有效性,进行如下仿真实验。
本实验采用DOTA-v1.0作为数据集,其中1/2用作训练,1/3用作验证,1/6用作测试,测试性能涉及OBB(旋转边界框)和HBB(水平边界框)两种任务,评估标准采用PASCALVOC的基准。本实验使用预训练模型ResNet101来初始化网络,在1块Tesla P40 GPU上用batch_size=2来训练模型,一共12个epoch,学习率设为0.0025,权重衰减率设为0.0001,动量设为0.9。因为原有数据集中图片尺寸不一样,给检测带来了很大挑战性,所以在实验中每512个像素步长分割图片,每张图片尺寸为1024x1024个像素。本次实验使用训练集训练,在验证集上测试。
首先,加载网络提供的ResNet101预训练模型参数作为初始化,训练基础卷积神经网络,再通过改进后的特征金字塔网络得出特征向量,在传统的特征金字塔网络中,首先使用1x1的卷积层,将编码层输出的编码特征转变为256个通道的特征;然后采取多分支增强模块,具体表述为将256个通道分成4个分支网络,每个网络有64个通道,通过各自通道的卷积核变换后,将所有特征组合得到1个有256个通道的特征图;再用经上采样后的解码器对有256个通道的特征图解码,即可得到多层改进的FPN目标特征。
然后,根据提取的金字塔特征,通过语义分割模块来获取目标的边界框级别的掩码和语义特征,首先通过采用上采样和下采样的方法将多层FPN的特征都标准化成相同的空间尺寸大小(如P2层的空间尺寸),融合后通过空洞空间金字塔池化(ASPP)的模块生成语义表征,再利用通道为1和256的1x1卷积层,分别产生边界框级别的掩码以及语义特征,本发明使用的ASPP模块中,采用4个并行的卷积层,分别为普通的1x1卷积层和空洞率为24/48/72的3x3卷积层。此外,考虑到遥感图像目标检测中小物体较多,本发明的层级下采样比率为4。
接着,将生成的掩码只下采样到P3~P6层,得到采样后的掩码,然后把它们分别与对应层的金字塔特征点乘,得到点乘后的特征向量,然后把它输入区域候选网络(RPN)中,分别通过回归和softmax操作,可以分别得到多个与坐标轴平行的候选框坐标,以及前景和背景的值(根据所框内容判断是不是目标,是则为前景,反之则为背景,前景为正,背景为负),将多个候选框按正负比为1:3的比例送入后续网络(代表前景或者背景的候选框都要输入后续网络,此正负比的设置是为了使步骤4回归和softmax操作更精确)。本发明使用的坐标轴为笛卡尔直角坐标系,以输入图片的左上角顶点为原点,水平方向和竖直方向为坐标轴,下面所提坐标轴都是这个。
最后,一方面,通过ROI Pooling操作,具体表述为将FPN多层特征和语义特征相加起来,形成一个特征映射(此处的特征映射通道数为256),将上述正负比为1:3的多个水平区域候选框坐标映射在上面(映射的规则为将候选框的坐标除以“输入图片与FPN多层特征和语义特征相加得到的特征映射的比值”),得到在该特征映射上的候选框坐标,将这些坐标通过池化操作,得到大小固定的候选框,将它输入全连接层,与给定的权重A进行矩阵相乘,获得一个池化特征F1(经过全连接层,特征的通道数由原来的256个变成1024个);另一方面,同样通过ROI Pooling操作,具体表述为将原始图像归一化,形成一个特征映射(此处的特征映射通道数为3),将上述正负比为1:3的多个水平区域候选框坐标映射在上面(映射的规则为将候选框的坐标除以“输入图片与归一化后的原始图像的比值”),得到在此特征映射上的候选框坐标,将这些坐标通过池化操作,得到另外一些大小固定的候选框,将它输入到另一个全连接层,与给定的权重B进行矩阵相乘,获得池化特征F2(经过全连接层,特征的通道数由原来的3个变成1024个)。将这两个池化特征相加再通过第三个全连接层,与给定的权重C进行矩阵相乘,得到边界框特征F3(经过全连接层,特征的通道数保持1024个不变),然后将该边界框特征一方面进行回归操作得到与坐标轴平行/旋转的边界框的位置信息;另一方面进行softmax操作得到物体的类别信息。(文中所述的权重A、B、C,每一类都有很多权重,A、B、C为了区分3个全连接层使用的权重不一样)
受限于遥感图像中目标尺度多样性、排列方向随意性、背景复杂度高的情况,卷积神经网络的目标检测准确率无法进一步提升,通过本发明介绍的三种改进方式,可以减少甚至克服一些复杂情况带给遥感图像上小目标检测的阻碍,提高目标预测的准确率。
综上所述,本发明更好的考虑了遥感图像下目标的尺度多样性、方向任意性以及背景复杂度高等特性,提高了遥感图像下小目标检测的准确率。
表1 DOTA-v1.0验证集上HBB结果表
mAP(%) Plane BD Bridge GTF SV LV Ship TC
75.99 90.20 80.35 56.68 77.31 50.01 80.54 86.62 90.82
BC ST SBF RA Harbor SP HC
71.04 88.38 75.92 72.88 82.34 65.64 71.12
表2 DOTA-v1.0验证集上OBB结果表
mAP(%) Plane BD Bridge GTF SV LV Ship TC
73.00 90.20 80.79 49.35 77.23 49.40 71.33 85.24 90.82
BC ST SBF RA Harbor SP HC
69.77 88.29 75.68 73.26 75.12 65.81 52.76

Claims (8)

1.一种融合语义分割的遥感图像目标检测方法,其特征在于,包括以下步骤:
步骤1、构建改进的特征金字塔网络,提取遥感图像的多层金字塔特征;
步骤2、对金字塔特征进行语义分割,获取目标边界框级别的掩码和语义特征;
步骤3、构建图片笛卡尔直角坐标系,根据提取的金字塔特征和生成的边界框级别的掩码生成与图片坐标轴平行的候选框;
步骤4、根据候选框坐标、多层金字塔特征、语义特征和归一化后的原始图像确定边界框特征,再进行回归和softmax操作得到与坐标轴平行/旋转的边界框的位置信息以及物体的类别信息。
2.根据权利要求1所述的融合语义分割的遥感图像目标检测方法,其特征在于,步骤1中,改进的特征金字塔网络为6层,在传统的特征金字塔网络中增加1x1的卷积层和四分支增强模块,所述四分支增强模块由多个不同尺寸的卷积核构成,用来获得不同尺度的特征,提取特征时,首先使用1x1的卷积层,将编码层输出的编码特征转变为256个通道的特征;然后采取多分支增强模块,将256个通道分成4个分支网络,每个网络有64个通道,通过各自通道的卷积核变换后,将所有特征组合得到1个有256个通道的特征图;再用经上采样后的解码器对有256个通道的特征图解码,即得多层金字塔特征。
3.根据权利要求1所述的融合语义分割的遥感图像目标检测方法,其特征在于,步骤2中,获取目标边界框级别的掩码和语义特征的具体方法为:
首先通过采用上采样和下采样的方法将多层金字塔特征都标准化成相同的空间尺寸大小,即P2层的空间尺寸,融合后通过空洞空间金字塔池化模块生成语义表征,再利用通道为1和256的1x1卷积层,分别产生边界框级别的掩码以及语义特征。
4.根据权利要求3所述的融合语义分割的遥感图像目标检测方法,其特征在于,所述空洞空间金字塔池化模块采用4个并行的卷积层,分别为普通的1x1卷积层和空洞率为24/48/72的3x3卷积层。
5.根据权利要求3所述的融合语义分割的遥感图像目标检测方法,其特征在于,层级下采样比率为4。
6.根据权利要求1所述的融合语义分割的遥感图像目标检测方法,其特征在于,步骤3中,以输入图片的左上角顶点为原点,水平方向和竖直方向为坐标轴,构建图片笛卡尔直角坐标系。
7.根据权利要求1所述的融合语义分割的遥感图像目标检测方法,其特征在于,步骤3中,生成与图片坐标轴平行的候选框的具体方法为:
将生成的掩码只下采样到P3~P6层,得到采样后的掩码,然后把它们分别与对应层的金字塔特征点乘,得到点乘后的特征向量,然后把它输入区域候选网络中,分别进行回归和softmax操作,得到多个与坐标轴平行的候选框坐标,以及前景和背景的值。
8.根据权利要求1所述的融合语义分割的遥感图像目标检测方法,其特征在于,步骤4中,生成与坐标轴平行/旋转的边界框的位置信息和物体类别信息的具体方法为:
将多层FPN特征和语义特征相加起来,形成一个特征映射,此处的特征映射通道数为256,将水平区域候选框坐标映射在上面,映射的规则为将候选框的坐标除以“输入图片与FPN多层特征和语义特征相加得到的特征映射的比值,得到在该特征映射上的候选框坐标,将这些坐标通过池化操作,得到大小固定的候选框,将它输入全连接层,与给定的权重A进行矩阵相乘,获得一个池化特征F1,经过全连接层,特征的通道数由原来的256个变成1024个;
将原始图像归一化,形成一个特征映射,此处的特征映射通道数为3,将上述正负比为1:3的多个水平区域候选框坐标映射在上面,映射的规则为将候选框的坐标除以“输入图片与归一化后的原始图像的比值”,得到在此特征映射上的候选框坐标,将这些坐标通过池化操作,得到另外一些大小固定的候选框,将它输入到另一个全连接层,与给定的权重B进行矩阵相乘,获得池化特征F2,经过全连接层,特征的通道数由原来的3个变成1024个;
将这两个池化特征相加再通过第三个全连接层,与给定的权重C进行矩阵相乘,得到边界框特征F3,经过全连接层,特征的通道数保持1024个不变,然后将该边界框特征一方面进行回归操作得到与坐标轴平行/旋转的边界框的位置信息;另一方面进行softmax操作得到物体的类别信息。
CN201910820020.6A 2019-08-31 2019-08-31 一种融合语义分割的遥感图像目标检测方法 Withdrawn CN110633661A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910820020.6A CN110633661A (zh) 2019-08-31 2019-08-31 一种融合语义分割的遥感图像目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910820020.6A CN110633661A (zh) 2019-08-31 2019-08-31 一种融合语义分割的遥感图像目标检测方法

Publications (1)

Publication Number Publication Date
CN110633661A true CN110633661A (zh) 2019-12-31

Family

ID=68969904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910820020.6A Withdrawn CN110633661A (zh) 2019-08-31 2019-08-31 一种融合语义分割的遥感图像目标检测方法

Country Status (1)

Country Link
CN (1) CN110633661A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111259900A (zh) * 2020-01-13 2020-06-09 河海大学 一种卫星遥感图像的语义分割方法
CN111339864A (zh) * 2020-02-17 2020-06-26 北京百度网讯科技有限公司 异常行为报警方法和装置
CN111539458A (zh) * 2020-04-02 2020-08-14 咪咕文化科技有限公司 特征图处理方法、装置、电子设备及存储介质
CN111985503A (zh) * 2020-08-17 2020-11-24 浩鲸云计算科技股份有限公司 一种基于改进的特征金字塔网络结构的目标检测方法和装置
CN112084869A (zh) * 2020-08-10 2020-12-15 北京航空航天大学 一种基于紧致四边形表示的建筑物目标检测方法
CN112085741A (zh) * 2020-09-04 2020-12-15 厦门大学 一种基于深度学习的胃癌病理切片分割算法
CN112347933A (zh) * 2020-11-06 2021-02-09 浙江大华技术股份有限公司 一种基于视频流的交通场景理解方法及装置
CN112396060A (zh) * 2020-11-17 2021-02-23 中国平安人寿保险股份有限公司 基于身份证分割模型的身份证识别方法及其相关设备
CN112417958A (zh) * 2020-10-16 2021-02-26 武汉大学 一种遥感影像旋转目标检测方法
CN112487900A (zh) * 2020-11-20 2021-03-12 中国人民解放军战略支援部队航天工程大学 一种基于特征融合的sar图像舰船目标检测方法
CN112766170A (zh) * 2021-01-21 2021-05-07 广西财经学院 基于簇类无人机图像的自适应分割检测方法及装置
CN113111711A (zh) * 2021-03-11 2021-07-13 浙江理工大学 一种基于双线性和空间金字塔的池化方法
CN113158738A (zh) * 2021-01-28 2021-07-23 中南大学 一种基于注意力机制的港口环境下目标检测方法、系统、终端及可读存储介质
CN113704490A (zh) * 2021-08-19 2021-11-26 扬州大学 一种面向异构数据的新工科教育知识图谱构建方法
WO2022134464A1 (zh) * 2020-12-25 2022-06-30 平安科技(深圳)有限公司 目标检测定位置信度确定方法、装置、电子设备及存储介质
CN115272242A (zh) * 2022-07-29 2022-11-01 西安电子科技大学 一种基于YOLOv5的光学遥感图像目标检测方法
CN116079749A (zh) * 2023-04-10 2023-05-09 南京师范大学 基于聚类分离条件随机场的机器人视觉避障方法及机器人
CN116524368A (zh) * 2023-04-14 2023-08-01 北京卫星信息工程研究所 遥感图像目标检测方法
CN117636172A (zh) * 2023-12-06 2024-03-01 中国科学院长春光学精密机械与物理研究所 面向遥感图像弱小目标的目标检测方法及系统

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111210443A (zh) * 2020-01-03 2020-05-29 吉林大学 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN111259900A (zh) * 2020-01-13 2020-06-09 河海大学 一种卫星遥感图像的语义分割方法
CN111339864A (zh) * 2020-02-17 2020-06-26 北京百度网讯科技有限公司 异常行为报警方法和装置
CN111339864B (zh) * 2020-02-17 2023-11-10 北京百度网讯科技有限公司 异常行为报警方法和装置
CN111539458A (zh) * 2020-04-02 2020-08-14 咪咕文化科技有限公司 特征图处理方法、装置、电子设备及存储介质
CN111539458B (zh) * 2020-04-02 2024-02-27 咪咕文化科技有限公司 特征图处理方法、装置、电子设备及存储介质
CN112084869A (zh) * 2020-08-10 2020-12-15 北京航空航天大学 一种基于紧致四边形表示的建筑物目标检测方法
CN112084869B (zh) * 2020-08-10 2023-04-07 北京航空航天大学 一种基于紧致四边形表示的建筑物目标检测方法
CN111985503B (zh) * 2020-08-17 2024-04-26 浩鲸云计算科技股份有限公司 一种基于改进的特征金字塔网络结构的目标检测方法和装置
CN111985503A (zh) * 2020-08-17 2020-11-24 浩鲸云计算科技股份有限公司 一种基于改进的特征金字塔网络结构的目标检测方法和装置
CN112085741B (zh) * 2020-09-04 2024-03-26 厦门大学 一种基于深度学习的胃癌病理切片分割算法
CN112085741A (zh) * 2020-09-04 2020-12-15 厦门大学 一种基于深度学习的胃癌病理切片分割算法
CN112417958A (zh) * 2020-10-16 2021-02-26 武汉大学 一种遥感影像旋转目标检测方法
CN112417958B (zh) * 2020-10-16 2022-05-06 武汉大学 一种遥感影像旋转目标检测方法
CN112347933A (zh) * 2020-11-06 2021-02-09 浙江大华技术股份有限公司 一种基于视频流的交通场景理解方法及装置
CN112396060B (zh) * 2020-11-17 2024-03-15 中国平安人寿保险股份有限公司 基于身份证分割模型的身份证识别方法及其相关设备
CN112396060A (zh) * 2020-11-17 2021-02-23 中国平安人寿保险股份有限公司 基于身份证分割模型的身份证识别方法及其相关设备
CN112487900A (zh) * 2020-11-20 2021-03-12 中国人民解放军战略支援部队航天工程大学 一种基于特征融合的sar图像舰船目标检测方法
CN112487900B (zh) * 2020-11-20 2022-11-15 中国人民解放军战略支援部队航天工程大学 一种基于特征融合的sar图像舰船目标检测方法
WO2022134464A1 (zh) * 2020-12-25 2022-06-30 平安科技(深圳)有限公司 目标检测定位置信度确定方法、装置、电子设备及存储介质
CN112766170B (zh) * 2021-01-21 2024-04-16 广西财经学院 基于簇类无人机图像的自适应分割检测方法及装置
CN112766170A (zh) * 2021-01-21 2021-05-07 广西财经学院 基于簇类无人机图像的自适应分割检测方法及装置
CN113158738A (zh) * 2021-01-28 2021-07-23 中南大学 一种基于注意力机制的港口环境下目标检测方法、系统、终端及可读存储介质
CN113111711A (zh) * 2021-03-11 2021-07-13 浙江理工大学 一种基于双线性和空间金字塔的池化方法
CN113704490B (zh) * 2021-08-19 2023-06-20 扬州大学 一种面向异构数据的新工科教育知识图谱构建方法
CN113704490A (zh) * 2021-08-19 2021-11-26 扬州大学 一种面向异构数据的新工科教育知识图谱构建方法
CN115272242A (zh) * 2022-07-29 2022-11-01 西安电子科技大学 一种基于YOLOv5的光学遥感图像目标检测方法
CN115272242B (zh) * 2022-07-29 2024-02-27 西安电子科技大学 一种基于YOLOv5的光学遥感图像目标检测方法
CN116079749A (zh) * 2023-04-10 2023-05-09 南京师范大学 基于聚类分离条件随机场的机器人视觉避障方法及机器人
CN116524368A (zh) * 2023-04-14 2023-08-01 北京卫星信息工程研究所 遥感图像目标检测方法
CN116524368B (zh) * 2023-04-14 2023-12-19 北京卫星信息工程研究所 遥感图像目标检测方法
CN117636172A (zh) * 2023-12-06 2024-03-01 中国科学院长春光学精密机械与物理研究所 面向遥感图像弱小目标的目标检测方法及系统

Similar Documents

Publication Publication Date Title
CN110633661A (zh) 一种融合语义分割的遥感图像目标检测方法
CN111461110B (zh) 一种基于多尺度图像和加权融合损失的小目标检测方法
CN111862126B (zh) 深度学习与几何算法结合的非合作目标相对位姿估计方法
CN111524135B (zh) 基于图像增强的输电线路细小金具缺陷检测方法及系统
CN112949388B (zh) 一种图像处理方法、装置、电子设备和存储介质
CN111126472A (zh) 一种基于ssd改进的目标检测方法
CN111179217A (zh) 一种基于注意力机制的遥感图像多尺度目标检测方法
CN111091105A (zh) 基于新的边框回归损失函数的遥感图像目标检测方法
CN113505792B (zh) 面向非均衡遥感图像的多尺度语义分割方法及模型
CN114758288B (zh) 一种配电网工程安全管控检测方法及装置
CN113807361B (zh) 神经网络、目标检测方法、神经网络训练方法及相关产品
CN113326763B (zh) 一种基于边界框一致性的遥感目标检测方法
CN110415280B (zh) 多任务cnn模型下的遥感影像与建筑物矢量配准方法及系统
CN114519819B (zh) 一种基于全局上下文感知的遥感图像目标检测方法
CN114758337A (zh) 一种语义实例重建方法、装置、设备及介质
CN115830004A (zh) 表面缺陷检测方法、装置、计算机设备和存储介质
CN117671509B (zh) 遥感目标检测方法、装置、电子设备及存储介质
CN115995042A (zh) 一种视频sar运动目标检测方法及装置
CN116863194A (zh) 一种足溃疡图像分类方法、系统、设备及介质
CN116385281A (zh) 一种基于真实噪声模型与生成对抗网络的遥感图像去噪方法
CN116129234A (zh) 一种基于注意力的4d毫米波雷达与视觉的融合方法
CN114332780A (zh) 一种针对小目标的交通人车非目标检测方法
US11769278B2 (en) Polygonal building extraction from satellite images
CN116682178A (zh) 密集场景下的多人姿态检测方法
CN115861595A (zh) 一种基于深度学习的多尺度域自适应异源图像匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20191231

WW01 Invention patent application withdrawn after publication