CN111008603A - 面向大尺度遥感图像的多类目标快速检测方法 - Google Patents

面向大尺度遥感图像的多类目标快速检测方法 Download PDF

Info

Publication number
CN111008603A
CN111008603A CN201911246128.5A CN201911246128A CN111008603A CN 111008603 A CN111008603 A CN 111008603A CN 201911246128 A CN201911246128 A CN 201911246128A CN 111008603 A CN111008603 A CN 111008603A
Authority
CN
China
Prior art keywords
scale
network
detection
remote sensing
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911246128.5A
Other languages
English (en)
Other versions
CN111008603B (zh
Inventor
李朋龙
丁忆
连蓉
马泽忠
李晓龙
罗鼎
肖禾
段松江
王岚
王亚林
钱进
刘朝晖
王小攀
魏文杰
谭攀
曾远文
张灿
范文武
秦成
张斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Central South University
Original Assignee
Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center), Central South University filed Critical Chongqing Geographic Information And Remote Sensing Application Center (chongqing Surveying And Mapping Product Quality Inspection And Testing Center)
Priority to CN201911246128.5A priority Critical patent/CN111008603B/zh
Publication of CN111008603A publication Critical patent/CN111008603A/zh
Application granted granted Critical
Publication of CN111008603B publication Critical patent/CN111008603B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向大尺度遥感图像的多类目标快速检测方法,包括以下步骤:将大比例尺遥感图像进行裁剪,并通过重新缩放和旋转来增强数据;利用具有串联线性整流函数模块和Inception模块的卷积特征提取器,将所得的图像数据作为输入并输出多个级别的特征;构建多尺度目标提议网络,并利用多尺度目标提议网络将卷积特征提取器输出的特征生成类似目标区域预测框;构建基于融合特征映射的精确目标检测网络,输入带有类似目标区域预测框的图像,利用精确目标检测网络实现精确的目标检测,输出检测结果。实现了具有大尺度变化的遥感图像中的多类目标自动检测,使得对遥感图像的多目标的实时检测成为可能。

Description

面向大尺度遥感图像的多类目标快速检测方法
技术领域
本发明涉及到遥感图像目标检测技术领域,尤其涉及利用深度神经网络模型实现具有大尺度变化的遥感图像中的多类目标检测方法,对面向遥感图像上的多类目标检测方式进行了优化与完善。
背景技术
遥感图像中多类对象的自动遥感图像分析过程中一个基本但具有挑战性的问题。传统方法中基于人工标注或基于浅层学习的特征,仅仅具有有限的描述能力。虽然最近的一些深度学习算法特别是基于快速区域的卷积神经网络(FRCN)已经具有了更强大的检测能力。
但是,还有许多因素限制了FRCN在遥感图像检测中的应用,例如:(1)遥感图像中常常出现尺度差异巨大的目标,仅仅具有固定感受野的FRCN无法与不同物体的尺度变化相匹配;(2)大尺度遥感图像中的物体尺寸大多较小且峰值密集,FRCN对小目标的定位性能较差;(3)人工标注通常很昂贵,并且用于训练FRCN的人工标注目标数量不足。
发明内容
针对现有技术的不足,本发明的目的是提供一种面向大尺度遥感图像的多类目标快速检测方法,能够实现具有大尺度变化的遥感图像中的多类目标自动检测,使得对遥感图像的多目标实时检测成为可能。
为达到上述目的,本发明采用的技术方案如下:
一种面向大尺度遥感图像的多类目标快速检测方法,其关键在于包括如下步骤:
步骤1:将大比例尺遥感图像进行裁剪,并通过重新缩放和旋转来增强数据;
步骤2:利用具有串联线性整流函数模块和Inception模块的卷积特征提取器,将步骤1所得的图像数据作为输入并输出多个级别的特征;
步骤3:构建多尺度目标提议网络,并利用多尺度目标提议网络将卷积特征提取器输出的特征生成类似目标区域预测框;
步骤4:构建基于融合特征映射的精确目标检测网络,输入带有类似目标区域预测框的图像,利用精确目标检测网络实现精确的目标检测,输出检测结果。
进一步的,步骤2中所述卷积特征提取器由第一卷积层、第二卷积层、第一串联线性整流函数链、第二串联线性整流函数链、第一 Inception链与第二Inception链依次连接形成,其中所述第一串联线性整流函数链与第二串联线性整流函数链均分别由若干所述串联线性整流函数模块串联形成,所述第一Inception链与第二Inception链均分别由若干所述Inception模块串联形成。
进一步的,所述第一串联线性整流函数链由三个串联线性整流函数模块串联形成,所述第二串联线性整流函数链由四个串联线性整流函数模块串联形成,所述串联线性整流函数模块包括一个基础ReLU 模块,在该基础ReLU模块的输入端与输出端均连接有一个1×1卷积层。
进一步的,所述第一Inception链与所述第二Inception链均由四个Inception模块串联而成。
进一步的,步骤3中所述多尺度目标提议网络的构建过程如下:
步骤3.1:通过三个建议分支预测多尺度类似目标区域,每个建议分支由三个检测层组成,并分别进行不同窗口大小的滑动操作,提取出每个滑动窗口位置的局部特征;
步骤3.2:在每个滑动窗口位置,预测出一个锚框;
步骤3.3:为每个检测层构造训练样本,将位于图像边界之外的预测区域框丢弃,并为剩余的区域框根据其交并比大小为其分配一个类标签;
步骤3.4:构建多尺度目标提议网络的整体损失函数,并对整体损失函数的最优参数通过随机梯度下降进行优化后得到目标的预测位置。
进一步的,步骤3.3中所述训练样本的表达式为:
Figure BDA0002307714290000031
其中,Sm为训练样本,Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签,N为窗口数量。
进一步的,所述整体损失函数的表达式为:
Figure BDA0002307714290000032
所述整体损失函数的最优参数的表达式为:
W*=argminWLMS-OPN(W),
其中,M是检测层的数量,αm表示每个检测层损失的权重,Sm为训练样本,Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签,W代表多尺度目标提议网络中的网络参数。
进一步的,步骤4中利用精确目标检测网络实现精确目标检测的具体步骤为:
步骤4.1:选择所述卷积特征选择器中第二串联线性整流函数链的最底层作为参考层,并将第一Inception链与第二Inception链输出的数据进行上采样后和所述参考层输出的数据进行串联,然后输入所述精确目标检测网络对其卷积层进行初始化;
步骤4.2:将所述多尺度目标提议网络输出的含有类似目标区域预测框的图像输入所述精确目标检测网络,由精确目标检测网络进行特征提取与目标检测;
步骤4.3:构建结合了用于分类的交叉熵损失和用于边界框回归的平滑损失的所述精确目标检测网络的损失函数,并利用该损失函数对所述精确目标检测网络进行训练,训练完成后输出检测结果。
更进一步的,所述精确目标检测网络的损失函数表达式为:
Figure BDA0002307714290000041
其中,M是检测层的数量,αm表示多尺度目标提议网络中每个检测层的损失的权重,αM+1表示精确目标检测网络的损失权重,lm表示多尺度目标提议网络中每一层的损失函数,W代表多尺度目标提议网络中的网络参数,Sm和SM+1分别代表多尺度目标提议网络和精确目标检测网络的训练样本数量,Wd代表全连接层和反卷积层的参数, Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签。
本发明提出一种大尺度变化遥感图像中多类目标同时检测的统一有效方法,首先,采用C.ReLU和Inception模块对所述卷积特征提取器进行了重新设计,增加了感受野尺寸变化的范围;然后,由所述的两个子网络进行目标检测:所述多尺度目标提议网络用于从多个中间层生成类似目标的区域,其感受野匹配不同目标的不同尺度;所述的基于融合特征映射的精确目标检测网络通过结合多个特征映射,使得小而密集的目标能够产生更强的响应,在训练完成后即输出检测结果,从而有效实现了具有大尺度变化的遥感图像中的多类目标自动检测。
本发明的显著效果是:本发明是一种统一有效的基于深度卷积神经网络的方法,在面对大尺度变化的遥感图像中的多类目标检测任务时,与其它方法相比,在重新设计的特征提取器上执行检测,然后是两个子网络:用于从中间层生成类似目标区域的MS-OPN子网络,其接受野匹配不同目标的不同尺度;然后是基于融合特征映射的目标检测AODN子网络,用来获得更具信息性的特征图,从而实现更为精确的目标检测,有效实现了具有大尺度变化的遥感图像中的多类目标自动检测,使得对遥感图像的多目标实时检测成为可能。
附图说明
图1是本发明的结构示意图;
图2是本发明构建的卷积神经网络的整体架构图;
图3是所述串联线性整流函数模块的结构示意图;
图4是所述Inception模块的结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。
如图1所示,一种面向大尺度遥感图像的多类目标快速检测方法,具体步骤为:
步骤1:将大比例尺遥感图像裁剪,并通过重新缩放和旋转来增强数据;
步骤2:利用具有串联线性整流函数(C.ReLU)和Inception模块的卷积特征提取器,将步骤1所得的图像数据作为输入并输出多个级别的特征;
如图2所示,所述卷积特征提取器由第一卷积层、第二卷积层、第一串联线性整流函数链、第二串联线性整流函数链、第一Inception 链与第二Inception链依次连接形成,其中所述第一串联线性整流函数链与第二串联线性整流函数链均分别由若干所述串联线性整流函数模块串联形成,所述第一Inception链与第二Inception链均分别由若干所述Inception模块串联形成。所述第一串联线性整流函数链由三个串联线性整流函数模块串联形成,所述第二串联线性整流函数链由四个串联线性整流函数模块串联形成,所述串联线性整流函数模块包括一个基础ReLU模块,在该基础ReLU模块的输入端与输出端均连接有一个卷积层。所述第一Inception链与所述第二Inception链均由四个Inception模块串联而成。
对于所述串联线性整流函数模块即C.ReLU模块:
C.ReLU模块来自对卷积神经网络中激活模式的观察,较低层的输出节点倾向于成对配对,即一个节点的激活是另一个节点的对侧。基于以上现象,C.ReLU将一个节点的输出取反,从而将输出通道的数量减少了一半而不会明显降低精度。图3展示了应用于K×K卷积层的C.ReLU模块。为了减小输入大小并扩大输出容量,在C.ReLU 模块前后各添加了1×1卷积层。同时将K×K卷积层的正相位信息和负相位信息串联起来,使通道数加倍。在串联之后添加缩放/移位层和ReLU激活层,以使取反部分的输入可以自适应。
对于所述Inception模块:
Inception模块将具有不同内核大小的多个卷积层聚在一起分成单元组(即1×1卷积,3×3卷积,5×5卷积),这可以在不增加计算成本的情况下增加网络的宽度和深度。图4展示了所使用的Inception 模块。每个模块由四个子序列组成。虚线框中的子序列将在需要将特征图大小减半时被添加。其余子序列的通道数分别设置为前一个模块的1/2、1/4、1/4。为了提高效率,5×5卷积层被两个3×3卷积层的序列所替换。一系列的Inception模块可以增加感受野尺寸大小的多样性,这样它就可以学习各种尺寸物体的视觉信息。
步骤3:构建多尺度目标提议网络(MS-OPN),并利用多尺度目标提议网络将所述卷积特征提取器输出的特征数据生成类似目标区域预测框;具体步骤如下:
步骤3.1:通过三个建议分支预测多尺度类似目标区域,例如分别在C.ReLU模块3_4、Inception模块4_4和Inception模块5_4的输出特征图上滑动窗口;每个建议分支由三个检测层组成,分别用一个 3×3,5×5,7×7的卷积层实现了不同窗口大小(3×3;5×5;7×7)的滑动操作,以提取每个滑动窗口位置的局部特征表示Xi
步骤3.2:在每个滑动窗口位置,预测出一个锚框
Figure BDA0002307714290000081
根据滤波器尺寸大小,其中
Figure BDA0002307714290000082
代表预测区域的左上角坐标,
Figure BDA0002307714290000083
代表预测区域的宽度和高度。每个锚框有三种比例(例如2:1,1:1,1:2) 来表示不同物体的纵横比;
步骤3.3:为了为每个检测层构造训练样本Sm,位于图像边界之外的预测区域框将被丢弃,并为剩余的区域框分配一个类标签 Yi∈{0,1,2,…,C}。如果预测的区域框Bi与真实目标框
Figure BDA0002307714290000084
具有最高的交并比(IoU),则为其分配一个正标签Yi≥1;然而,如果一个预测区域框的IoU对于所有真实目标框都小于0.2,则为它分配一个负标签Yi=0;然后丢弃剩余的区域。IoU比率定义如下:
Figure BDA0002307714290000085
其中,
Figure DEST_PATH_GDA0002400915660000086
表示预测区域框和真实目标框的交集,
Figure DEST_PATH_GDA0002400915660000087
表示它们的并集;
步骤3.4:构建所述多尺度目标提议网络的整体损失函数,并对其最优参数W*通过随机梯度下降(SGD)进行优化后得到目标的预测位置,具体过程如下所述:
通过上述步骤3.3中的定义,每个检测层的训练样本被定义为
Figure BDA0002307714290000091
每个检测层的损失是分类和边界框回归的组合,其定义如下:
Figure BDA0002307714290000092
其中W代表网络参数,分类损失Lcls(p(X),Y)=-logpY(X)是一个交叉熵损失,p(X)=(p0(X),...pC(X))是C+1类的概率置信度。并且 [Y≥1]表示背景对于边界框回归训练没有意义,
Figure BDA0002307714290000093
表示回归边界框,Lbbr表示平滑的L1损耗,定义为:
Figure BDA0002307714290000094
综上,我们定义MS-OPN的整体损失函数是每个检测层损失的串联,其结构式如下:
Figure BDA0002307714290000095
其中,M是检测层的数量,在这里M=9表示具有三个检测层的三个建议分支;αm表示每个检测层损失的权重。
然后对其最优参数W*=argminWLMS-OPN(W)通过随机梯度下降 (SGD)进行优化,为了防止过度拟合,采用1000类Image-Net分类预训练模型对卷积层进行初始化。由于深层网络的训练变得麻烦,因此在C.ReLU层和Inception层上添加剩余的快捷连接结构以稳定训练过程。此外,在所有卷积层之前添加批量标准化层以加速训练。当完成MS-OPN的训练时,它将图像作为输入并通过若干建议分支输出目标的位置。
尽管MS-OPN可以用作检测器,但它不足以进行准确检测。因此为了提高检测精度,要在MS-OPN之后添加精确目标检测网络 (AODN)。
进入步骤4:构建精确目标检测网络(AODN),将带有预测区域框(由MS-OPN生成)的图像作为输入,并精确目标检测网络对目标进行更为精确的目标检测,然后输出细化的类别和位置。AODN将多个层用不同的分辨率结合起来,以获得更具信息性的特征图,从而实现更为精确的目标检测。其具体实现如下步骤:
步骤4.1:由于大比例尺遥感图像中的目标相对较小,且呈密集的群状分布,因此我们选择C.ReLU模块层3_4作为参考层,将 Inception模块层4_4和Inception模块层5_4(使用反卷积层)连接起来并倍增,也即是上采样后和所述参考层输出的数据进行串联,然后输入所述精确目标检测网络对其卷积层进行初始化,以提高小尺寸目标的检测。这是因为分辨率更高的C.ReLU模块层3_4更适合于检测密集的峰值对象。由于较浅的层更适合于定位,较深的层更适合于分类,因此将特征图进行串联对于小尺寸目标检测是互补的;
步骤4.2:由于这些类似目标的区域预测框有不同的大小,我们为每个框采用了一个感兴趣区域池化即RoI池化层来生成维度固定的特征(例如,7×7×512)。这些特征被输入到随后的完全连接层中,并分成两个部分,以便进一步分类和边界框回归;
步骤4.3:AODN的损失函数LAODN结合了用于分类的交叉熵损失和用于边界框回归的平滑L1损失,具体为:
Figure BDA0002307714290000111
其中,M是检测层的数量,αm表示多尺度目标提议网络中每个检测层的损失的权重,αM+1表示精确目标检测网络的损失权重,lm表示多尺度目标提议网络中每一层的损失函数,W代表多尺度目标提议网络中的网络参数,Sm和SM+1分别代表多尺度目标提议网络和精确目标检测网络的训练样本数量,Wd代表全连接层和反卷积层的参数。
由于参数是联合学习的,即
Figure BDA0002307714290000112
并通过整个统一网络进行反向传播。同时,由于MS-OPN和AODN共享相同的CNN特征提取阶段,因此我们采用预训练的MS-OPN模型来初始化AODN的卷积层。附加的反卷积层的权重由标准差为0.01的零均值高斯分布随机初始化。当训练完成后,就可以输出最终的目标检测结果。最后,采用了非最大值抑制(NMS)来减少冗余,即得到所需的多类目标检测结果。
本实施例采用卷积特征提取器、多尺度目标提议网络和精确目标检测网络构件形成卷积神经网络进行目标检测,其中卷积特征提取器采用了C.ReLU模块和Inception模块进行了重新设计,从而增加了感受野尺寸变化的范围;然后,由所述的多尺度目标提议网络和精确目标检测网络两个子网络进行目标检测:其中所述多尺度目标提议网络用于从多个中间层生成类似目标的区域,其感受野匹配不同目标的不同尺度;所述基于融合特征映射的精确目标检测网络通过结合多个特征映射,使得小而密集的目标能够产生更强的响应,最后并在训练完成后即输出检测结果,从而有效实现了具有大尺度变化的遥感图像中的多类目标自动检测,从而有助于实现遥感图像的多目标实时检测。
以上对本发明所提供的技术方案进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种面向大尺度遥感图像的多类目标快速检测方法,其特征在于包括以下步骤:
步骤1:将大比例尺遥感图像进行裁剪,并通过重新缩放和旋转来增强数据;
步骤2:利用具有串联线性整流函数模块和Inception模块的卷积特征提取器,将步骤1所得的图像数据作为输入并输出多个级别的特征;
步骤3:构建多尺度目标提议网络,并利用多尺度目标提议网络将卷积特征提取器输出的特征生成类似目标区域预测框;
步骤4:构建基于融合特征映射的精确目标检测网络,输入带有类似目标区域预测框的图像,利用精确目标检测网络实现精确的目标检测,输出检测结果。
2.根据权利要求1所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:步骤2中所述卷积特征提取器由第一卷积层、第二卷积层、第一串联线性整流函数链、第二串联线性整流函数链、第一Inception链与第二Inception链依次连接形成,其中所述第一串联线性整流函数链与第二串联线性整流函数链均分别由若干所述串联线性整流函数模块串联形成,所述第一Inception链与第二Inception链均分别由若干所述Inception模块串联形成。
3.根据权利要求2所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:所述第一串联线性整流函数链由三个串联线性整流函数模块串联形成,所述第二串联线性整流函数链由四个串联线性整流函数模块串联形成,所述串联线性整流函数模块包括一个基础ReLU模块,在该基础ReLU模块的输入端与输出端均连接有一个1×1卷积层。
4.根据权利要求2或3所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:所述第一Inception链与所述第二Inception链均由四个Inception模块串联而成。
5.根据权利要求1所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:步骤3中所述多尺度目标提议网络的构建过程如下:
步骤3.1:通过三个建议分支预测多尺度类似目标区域,每个建议分支由三个检测层组成,并分别进行不同窗口大小的滑动操作,提取出每个滑动窗口位置的局部特征;
步骤3.2:在每个滑动窗口位置,预测出一个锚框;
步骤3.3:为每个检测层构造训练样本,将位于图像边界之外的预测区域框丢弃,并为剩余的区域框根据其交并比大小为其分配一个类标签;
步骤3.4:构建多尺度目标提议网络的整体损失函数,并对整体损失函数的最优参数通过随机梯度下降进行优化后得到目标的预测位置。
6.根据权利要求5所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:步骤3.3中所述训练样本的表达式为:
Figure FDA0002307714280000021
其中,Sm为训练样本,Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签,N为窗口数量。
7.根据权利要求5所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:所述整体损失函数的表达式为:
Figure FDA0002307714280000031
所述整体损失函数的最优参数的表达式为:
W*=argminWLMS-OPN(W),
其中,M是检测层的数量,αm表示每个检测层损失的权重,Sm为训练样本,Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签,W代表多尺度目标提议网络中的网络参数。
8.根据权利要求2所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:步骤4中利用精确目标检测网络实现精确目标检测的具体步骤为:
步骤4.1:选择所述卷积特征选择器中第二串联线性整流函数链的最底层作为参考层,并将第一Inception链与第二Inception链输出的数据进行上采样后和所述参考层输出的数据进行串联,然后输入所述精确目标检测网络对其卷积层进行初始化;
步骤4.2:将所述多尺度目标提议网络输出的含有类似目标区域预测框的图像输入所述精确目标检测网络,由精确目标检测网络进行特征提取与目标检测;
步骤4.3:构建结合了用于分类的交叉熵损失和用于边界框回归的平滑损失的所述精确目标检测网络的损失函数,并利用该损失函数对所述精确目标检测网络进行训练,训练完成后输出检测结果。
9.根据权利要求8所述的面向大尺度遥感图像的多类目标快速检测方法,其特征在于:所述精确目标检测网络的损失函数表达式为:
Figure FDA0002307714280000041
其中,M是检测层的数量,αm表示多尺度目标提议网络中每个检测层的损失的权重,αM+1表示精确目标检测网络的损失权重,lm表示多尺度目标提议网络中每一层的损失函数,W代表多尺度目标提议网络中的网络参数,Sm和SM+1分别代表多尺度目标提议网络和精确目标检测网络的训练样本数量,Wd代表全连接层和反卷积层的参数,Xi为步骤3.1提取出的局部特征,Bi为步骤3.2预测出的锚框,Yi为步骤3.3分配的类标签。
CN201911246128.5A 2019-12-08 2019-12-08 面向大尺度遥感图像的多类目标快速检测方法 Active CN111008603B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911246128.5A CN111008603B (zh) 2019-12-08 2019-12-08 面向大尺度遥感图像的多类目标快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911246128.5A CN111008603B (zh) 2019-12-08 2019-12-08 面向大尺度遥感图像的多类目标快速检测方法

Publications (2)

Publication Number Publication Date
CN111008603A true CN111008603A (zh) 2020-04-14
CN111008603B CN111008603B (zh) 2023-04-18

Family

ID=70114154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911246128.5A Active CN111008603B (zh) 2019-12-08 2019-12-08 面向大尺度遥感图像的多类目标快速检测方法

Country Status (1)

Country Link
CN (1) CN111008603B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183450A (zh) * 2020-10-15 2021-01-05 成都思晗科技股份有限公司 一种多目标跟踪方法
CN112199984A (zh) * 2020-07-10 2021-01-08 北京理工大学 一种大尺度遥感图像的目标快速检测方法
CN112418108A (zh) * 2020-11-25 2021-02-26 西北工业大学深圳研究院 一种基于样本重加权的遥感图像多类目标检测方法
CN112686139A (zh) * 2020-12-29 2021-04-20 西安电子科技大学 基于跨阶段局部多尺度密集连接的遥感图像目标检测方法
CN113239786A (zh) * 2021-05-11 2021-08-10 重庆市地理信息和遥感应用中心 基于增强学习与特征变换的遥感图像乡村别墅识别方法
CN115019123A (zh) * 2022-05-20 2022-09-06 中南大学 一种遥感图像场景分类的自蒸馏对比学习方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070080228A1 (en) * 2000-11-24 2007-04-12 Knowles C H Compact bar code symbol reading system employing a complex of coplanar illumination and imaging stations for omni-directional imaging of objects within a 3D imaging volume
CN108052940A (zh) * 2017-12-17 2018-05-18 南京理工大学 基于深度学习的sar遥感图像水面目标检测方法
CN109919108A (zh) * 2019-03-11 2019-06-21 西安电子科技大学 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN109948415A (zh) * 2018-12-30 2019-06-28 中国科学院软件研究所 基于背景过滤和尺度预测的光学遥感图像目标检测方法
CN110009010A (zh) * 2019-03-20 2019-07-12 西安电子科技大学 基于兴趣区域重检测的宽幅光学遥感目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN110110599A (zh) * 2019-04-03 2019-08-09 天津大学 一种基于多尺度特征融合的遥感图像目标检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070080228A1 (en) * 2000-11-24 2007-04-12 Knowles C H Compact bar code symbol reading system employing a complex of coplanar illumination and imaging stations for omni-directional imaging of objects within a 3D imaging volume
CN108052940A (zh) * 2017-12-17 2018-05-18 南京理工大学 基于深度学习的sar遥感图像水面目标检测方法
WO2019144575A1 (zh) * 2018-01-24 2019-08-01 中山大学 一种快速行人检测方法及装置
CN109948415A (zh) * 2018-12-30 2019-06-28 中国科学院软件研究所 基于背景过滤和尺度预测的光学遥感图像目标检测方法
CN109919108A (zh) * 2019-03-11 2019-06-21 西安电子科技大学 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN110009010A (zh) * 2019-03-20 2019-07-12 西安电子科技大学 基于兴趣区域重检测的宽幅光学遥感目标检测方法
CN110110599A (zh) * 2019-04-03 2019-08-09 天津大学 一种基于多尺度特征融合的遥感图像目标检测方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199984A (zh) * 2020-07-10 2021-01-08 北京理工大学 一种大尺度遥感图像的目标快速检测方法
CN112199984B (zh) * 2020-07-10 2023-05-12 北京理工大学 一种大尺度遥感图像的目标快速检测方法
CN112183450A (zh) * 2020-10-15 2021-01-05 成都思晗科技股份有限公司 一种多目标跟踪方法
CN112183450B (zh) * 2020-10-15 2024-05-28 成都思晗科技股份有限公司 一种多目标跟踪方法
CN112418108A (zh) * 2020-11-25 2021-02-26 西北工业大学深圳研究院 一种基于样本重加权的遥感图像多类目标检测方法
CN112418108B (zh) * 2020-11-25 2022-04-26 西北工业大学深圳研究院 一种基于样本重加权的遥感图像多类目标检测方法
CN112686139A (zh) * 2020-12-29 2021-04-20 西安电子科技大学 基于跨阶段局部多尺度密集连接的遥感图像目标检测方法
CN112686139B (zh) * 2020-12-29 2024-02-09 西安电子科技大学 基于跨阶段局部多尺度密集连接的遥感图像目标检测方法
CN113239786A (zh) * 2021-05-11 2021-08-10 重庆市地理信息和遥感应用中心 基于增强学习与特征变换的遥感图像乡村别墅识别方法
CN115019123A (zh) * 2022-05-20 2022-09-06 中南大学 一种遥感图像场景分类的自蒸馏对比学习方法
CN115019123B (zh) * 2022-05-20 2023-04-18 中南大学 一种遥感图像场景分类的自蒸馏对比学习方法

Also Published As

Publication number Publication date
CN111008603B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN111008603B (zh) 面向大尺度遥感图像的多类目标快速检测方法
CN110175671B (zh) 神经网络的构建方法、图像处理方法及装置
CN109584337B (zh) 一种基于条件胶囊生成对抗网络的图像生成方法
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
CN110245709B (zh) 基于深度学习和自注意力的3d点云数据语义分割方法
CN108038445B (zh) 一种基于多视角深度学习框架的sar自动目标识别方法
Chandio et al. Precise single-stage detector
WO2016037300A1 (en) Method and system for multi-class object detection
CN111291809B (zh) 一种处理装置、方法及存储介质
CN112446388A (zh) 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统
CN110110599B (zh) 一种基于多尺度特征融合的遥感图像目标检测方法
CN112347970B (zh) 一种基于图卷积神经网络的遥感影像地物识别方法
CN112561027A (zh) 神经网络架构搜索方法、图像处理方法、装置和存储介质
CN110210431B (zh) 一种基于点云语义标注和优化的点云分类方法
CN111178316A (zh) 一种基于深度架构自动搜索的高分辨率遥感影像土地覆盖分类方法
CN113570029A (zh) 获取神经网络模型的方法、图像处理方法及装置
US11941865B2 (en) Hyperspectral image classification method based on context-rich networks
CN111626267B (zh) 一种利用空洞卷积的高光谱遥感图像分类方法
CN112215332A (zh) 神经网络结构的搜索方法、图像处理方法和装置
CN113361485A (zh) 基于光谱空间注意力融合和可变形卷积残差网络的高光谱图像分类方法
Doi et al. The effect of focal loss in semantic segmentation of high resolution aerial image
CN112862774A (zh) 一种遥感影像建筑物精确分割方法
CN113223027A (zh) 基于PolarMask的未成熟柿子分割方法及系统
CN113313176A (zh) 一种基于动态图卷积神经网络的点云分析方法
CN113111740A (zh) 一种遥感图像目标检测的特征编织方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant