CN111582101A

CN111582101A - 一种遥感图像检测方法及系统

Info

Publication number: CN111582101A
Application number: CN202010349935.6A
Authority: CN
Inventors: 孙显; 刁文辉; 闫梦龙; 闫志远; 柴亚捷; 马益杭; 朱子聪; 赵良瑾; 刘迎飞
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2020-04-28
Filing date: 2020-04-28
Publication date: 2020-08-25
Anticipated expiration: 2040-04-28
Also published as: CN111582101B

Abstract

本发明涉及一种遥感图像检测方法及系统，所述方法包括：获取待检测遥感图像；将所述待检测遥感图像输入至预先建立的检测网络，获取所述预先建立的检测网络输出的待检测遥感图像的初始预测结果；将所述待检测遥感图像的初始预测结果上采样至所述待检测遥感图像的影像大小，获取所述待检测遥感图像的最终预测结果；本发明提供的技术方案面向高分辨率遥感图像，实现了模型参数量小、泛化能力好、检测召回率高、对多尺度物体检测准确等优点。

Description

一种遥感图像检测方法及系统

技术领域

本发明涉及遥感图像处理技术领域，具体涉及一种遥感图像检测方法及系统。

背景技术

近年来，深度学习的跨越式发展推动了计算机视觉领域的巨大进步，使得很多计算机视觉的任务的性能达到了一个前所未有的高度。尽管深度网络模型在许多任务上都取得了不俗表现，但这仅仅是在科研层面上进行的实验与尝试，如果考虑到实际应用将其移植到嵌入式或者移动设备上，它将会受到多方面约束：1)模型参数量巨大；2)模型计算量大；3)电能消耗大。

对于硬件资源有限的嵌入式或者移动设备来说，深度神经网络直接应用在时间与空间上都受到巨大约束。因此，如何在保证模型效果的前提下对模型进行压缩已经成为了一个热点问题，这使得深度网络模型压缩快速地发展起来。

发明内容

针对现有技术的不足，本发明的目的是提供一种面向高分辨率遥感图像，能够实现模型参数量小、泛化能力好、检测召回率高、对多尺度物体检测准确等优点的遥感图像检测方法。

本发明的目的是采用下述技术方案实现的：

本发明提供了一种遥感图像检测方法，其改进之处在于，所述方法包括：

获取待检测遥感图像；

将所述待检测遥感图像输入至预先建立的检测网络，获取所述预先建立的检测网络输出的待检测遥感图像的初始预测结果；

将所述待检测遥感图像的初始预测结果上采样至所述待检测遥感图像的影像大小，获取所述待检测遥感图像的最终预测结果。

优选的，所述预先建立的检测网络的建立过程包括：

步骤1.对遥感图像数据中的遥感图像进行人工语义标注，并将所述遥感图像数据划分为训练数据、验证数据和测试数据；

步骤2.对所述训练数据进行数据增强；

步骤3.将所述训练数据、验证数据和测试数据切片为512x512；

步骤4.利用所述训练数据、验证数据和测试数据对预先建立的教师网络进行训练；

步骤5.基于训练完成的教师网络，采用知识蒸馏算法对预先建立的学生网络进行训练，并将训练完成的学生网络作为所述预先建立的检测网络。

进一步的，所述预先建立的教师网络包括：ResNet152网络、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

所述ResNet152网络，用于提取训练数据的特征{C₂,C₃,C₄,C₅}，其中，C₂,C₃,C₄,C₅分别为所述ResNet152网络中各最大池化层的输出特征；

所述多尺度特征融合模块，用于对{C₂,C₃,C₄,C₅}进行特征融合，并输出尺寸分别为训练数据1/4、1/8、1/16、1/32的特征图{P₂,P₃,P₄,P₅}；

所述候选区域生成模块，用于分别生成P₂,P₃,P₄,P₅中每个像素点对应的锚框；

所述候选区域提取模块，用于提取各锚框中的RoI；

所述分类回归模块，用于将所述各锚框中的RoI连接起来获得特征Fea，并基于特征Fea获取得分向量Score和位置向量Loc。

进一步的，所述预先建立的学生网络包括：特诊提取模块、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

所述特诊提取模块，用于提取训练数据的特征{C₂,C₃,C₄,C₅}，其中，C₂,C₃,C₄,C₅分别为所述特诊提取模块中各最大池化层的输出特征；

所述候选区域提取模块，用于提取各锚框中的RoI；

进一步的，所述特诊提取模块为改进的ShuffleNet网络，其中，ShuffleNet网络的改进过程包括：

利用预先建立的替换单元替换Shufflenet网络中的瓶颈单元，并去掉Shufflenet网络中输出端侧的全连接层以及全局池化模块；

所述预先建立的替换单元包括依次连接的通道分割层、可分离卷积层、跳跃连接层和通道混洗层；

所述通道分割层，用于将输入特征图分为第一分支和第二分支；

所述可分离卷积层，用于将所述第一分支依次经过1*1卷积降维、3*3可分离卷积和1*1卷积升维；

所述跳跃连接层，用于将所述第二分支与所述可分离卷积层输出的特征图进行合并拼接；

所述通道混洗层，用于对所述跳跃连接层输出的特征图进行转置操作。

进一步的，所述多尺度特征融合模块，包括：1*1卷积层、第一3*3卷积层、第二3*3卷积层、第三3*3卷积层、第四3*3卷积层、第一合并连接层、第二合并连接层和第三合并连接层；

所述1*1卷积层的输出端分别与所述第一3*3卷积层、第二3*3卷积层、第三3*3卷积层和第四3*3卷积层的输入端连接；第三3*3卷积层和第四3*3卷积层的输出端连接第三合并连接层的输入端，第二3*3卷积层和第三3*3卷积层的输出端连接第二合并连接层的输入端，第一3*3卷积层和第三3*3卷积层的输出端连接第一合并连接层的输入端；

其中，所述第一合并连接层的输出端输出P₂、第二合并连接层的输出端输出P₃、第三合并连接层的输出端输出P₄、第四3*3卷积层的输出端输出P₅。

进一步的，所述像素点对应的锚框为9个，每个锚框的尺寸和长宽比分别为128*128和1：1、128*128和1：2、128*128和2：1、256*256和1：1、256*256和1：2、256*256和2：1、512*512和1：1、512*512和1：2以及512*512和2：1。

进一步的，所述分类回归模块具体用于：

将所述各锚框中的RoI连接起来获得特征Fea；

将特征Fea输入至以训练数据中物体的类别为准的分类层，获取分类层输出的得分向量Score；

将特征Fea输入至以训练数据中物体的位置为准的回归层，获取回归层输出的位置向量Loc。

所述步骤2包括：对所述训练数据依次按照概率0.5进行水平和垂直方向的随机翻转，角度-20度到20度，步距1度的图像随机旋转操作，90度、180度、270度的固定角度随机旋转操作，以及图像尺寸0.25到4倍随机缩放操作。

基于同一发明构思，本发明还提供了一种遥感图像检测系统，其改进之处在于，所述系统包括：

获取模块，用于获取待检测遥感图像；

检测模块，用于将所述待检测遥感图像输入至预先建立的检测网络，获取所述预先建立的检测网络输出的待检测遥感图像的初始预测结果；

采样模块，用于将所述待检测遥感图像的初始预测结果上采样至所述待检测遥感图像的影像大小，获取所述待检测遥感图像的最终预测结果。

与最接近的现有技术相比，本发明具有的有益效果：

本发明提供了一种遥感图像检测方法及系统，所述方法包括：获取待检测遥感图像；将所述待检测遥感图像输入至预先建立的检测网络，获取所述预先建立的检测网络输出的待检测遥感图像的初始预测结果；将所述待检测遥感图像的初始预测结果上采样至所述待检测遥感图像的影像大小，获取所述待检测遥感图像的最终预测结果；本发明提供的技术方案面向高分辨率遥感图像，实现了模型参数量小、泛化能力好、检测召回率高、对多尺度物体检测准确等优点；

进一步的，本发明提供发技术方案中，通过手工建立的检测网络使得检测网络有较好的泛化能力，实现了轻量级网络架构的设计，并且在边缘计算设备上实现面向高分辨率遥感图像的目标检测网络。

附图说明

图1是本发明一种遥感图像检测方法的流程图；

图2是本发明实施例中基于知识蒸馏训练的原理示意图；

图3是本发明实施例中预先建立的替换单元的结构示意图；

图4是本发明实施例中多尺度特征融合模块的结构示意图；

图5是本发明一种遥感图像检测系统的结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为了解决现有技术中所存在的对计算、存储、能源消耗较大的问题，本发明提供了一种遥感图像检测方法，如图1所示，包括：

101获取待检测遥感图像；

102将所述待检测遥感图像输入至预先建立的检测网络，获取所述预先建立的检测网络输出的待检测遥感图像的初始预测结果；

103将所述待检测遥感图像的初始预测结果上采样至所述待检测遥感图像的影像大小，获取所述待检测遥感图像的最终预测结果。

具体的，所述预先建立的检测网络的建立过程包括：

步骤2.对所述训练数据进行数据增强；

本发明提供的最优实施例中，所述步骤2具体包括：对所述训练数据依次按照概率0.5进行水平和垂直方向的随机翻转，角度-20度到20度，步距1度的图像随机旋转操作，90度、180度、270度的固定角度随机旋转操作，以及图像尺寸0.25到4倍随机缩放操作。

步骤3.将所述训练数据、验证数据和测试数据切片为512x512，间隔步长为200；

对于检测网络的训练过程中，本发明借鉴知识蒸馏算法的思想，使用一个精度较高参数量较大的教师网络来指导轻量化网络的训练过程。

当前的目标检测网络训练过程，大多都是由真实标签(物体坐标、物体类型)来指导网络训练，以物体分类为例，在训练过程中真实标签通常使用one-hot编码的形式，然后最小化用网络预测结果与真实标签计算交叉熵来完成分类任务的训练。然而，使用one-hot编码虽然简洁，但是one-hot编码中忽略了类别之间的相似性，而在知识蒸馏算法中，通过用教师网络指导学生网络的方式，轻量化网络学习到更多的不同物体类间差异性的信息，因此可以增强轻量化模型的泛化性能。

网络蒸馏或者知识蒸馏的主要思想可以形象的理解为，学生(轻量化网络)从老师(高精度大参数量网络)那里学习知识的一个过程。通过从一个已经训练好的教师网络那里得到额外的(除真实标签之外的)信息，可以使得轻量化网络获得更高的精度；

本发明提供的最优实施例中，将预先建立的教师网络提前在数据集上训练，得到训练好的教师模型。知识蒸馏的方法主要分为输出蒸馏、中间层蒸馏以及关系蒸馏三种，图2是本发明的基于知识蒸馏训练的原理示意图。输出蒸馏方法：使用教师网络的最终的经过参数T软化的softmax输出对学生模型的经过同样的参数T软化的softmax的输出进行监督，使得教师模型的信息可以传递到学生模型中。中间层蒸馏的方法：将教师模型的中间层的输出作为对学生模型的中级监督信息，使得两者中间层的响应尽可能一致。关系知识蒸馏方法：首先对样本间要进行蒸馏表达的关系知识用数学公式进行严格的定义，对于教师网络和学生网络中的样本的输出层，使用同样的关系的准则对各自的输出提取关系，并使得学生网络提取出来的关系表达尽可能的与教师网络所表达的关系达到一致

其中，所述预先建立的教师网络包括：ResNet152网络、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

本发明提供的最优实施例个，所述像素点对应的锚框为9个，每个锚框的尺寸和长宽比分别为128*128和1：1、128*128和1：2、128*128和2：1、256*256和1：1、256*256和1：2、256*256和2：1、512*512和1：1、512*512和1：2以及512*512和2：1。

所述候选区域提取模块，用于提取各锚框中的RoI；

所述预先建立的学生网络包括：特诊提取模块、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

在Selective Search中，使用基于低等级的特征来聚合成超像素的方法来生成建议区域，需要很大的计算量并且很费时间。本发明中使用候选区域生成模块，通过共享在检测中整张图片的卷积特征，来减小区域建议的计算量，从而使得区域建议的时间缩短。在通用目标检测算法中，卷积输出的特征图，也可以用来产生区域建议。所以，在这些卷积特征上面建立候选区域生成模块，通过增加一些额外的卷积层，可以同时计算bbox和类别score在网格中每个位置。候选区域生成模块就是这样的一个全卷积网络，可以端到端的训练，被用来产生检测的建议区域。可以同时预测物体的边界和每个位置物体的置信度。候选区域生成模块高效地预测不同大小和不同尺度的建议区域。这样的模型在训练和测试阶段表现的都很好，并且可以使速度得到提升。

所述候选区域提取模块，用于提取各锚框中的RoI；

所述预先建立的替换单元，如图3所示，包括依次连接的通道分割层、可分离卷积层、跳跃连接层和通道混洗层；

本发明使用通道混洗技术来增强特征之间的流动性。通道混洗技术的一种有代表性的轻量化网络结构，主要思路是通过分组卷积和通道混合改进残差网络单元。该网络结构最重要的操作是通道混合层，在两个分组卷积之间改变通道的顺序，实现分组卷积的信息交换机制。

进一步的，所述多尺度特征融合模块，如图4所示，包括：1*1卷积层、第一3*3卷积层、第二3*3卷积层、第三3*3卷积层、第四3*3卷积层、第一合并连接层、第二合并连接层和第三合并连接层；

进一步的，所述分类回归模块具体用于：

将所述各锚框中的RoI连接起来获得特征Fea；

基于同一发明构思，本发明还提供了一种遥感图像检测系统，如图5所示，所述系统包括：

获取模块，用于获取待检测遥感图像；

其中，所述预先建立的检测网络的建立过程包括：

步骤2.对所述训练数据进行数据增强；

步骤3.将所述训练数据、验证数据和测试数据切片为512x512；

所述预先建立的教师网络包括：ResNet152网络、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

所述候选区域提取模块，用于提取各锚框中的RoI；

所述特诊提取模块为改进的ShuffleNet网络，其中，ShuffleNet网络的改进过程包括：

所述多尺度特征融合模块，包括：1*1卷积层、第一3*3卷积层、第二3*3卷积层、第三3*3卷积层、第四3*3卷积层、第一合并连接层、第二合并连接层和第三合并连接层；

所述像素点对应的锚框为9个，每个锚框的尺寸和长宽比分别为128*128和1：1、128*128和1：2、128*128和2：1、256*256和1：1、256*256和1：2、256*256和2：1、512*512和1：1、512*512和1：2以及512*512和2：1。

所述分类回归模块具体用于：

将所述各锚框中的RoI连接起来获得特征Fea；

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种遥感图像检测方法，其特征在于，所述方法包括：

获取待检测遥感图像；

2.如权利要求1所述的方法，其特征在于，所述预先建立的检测网络的建立过程包括：

步骤2.对所述训练数据进行数据增强；

步骤3.将所述训练数据、验证数据和测试数据切片为512x512；

3.如权利要求2所述的方法，其特征在于，所述预先建立的教师网络包括：ResNet152网络、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

所述候选区域提取模块，用于提取各锚框中的RoI；

4.如权利要求2所述的方法，其特征在于，所述预先建立的学生网络包括：特诊提取模块、多尺度特征融合模块、候选区域生成模块、候选区域提取模块和分类回归模块；

所述候选区域提取模块，用于提取各锚框中的RoI；

5.如权利要求4所述的方法，其特征在于，所述特诊提取模块为改进的ShuffleNet网络，其中，ShuffleNet网络的改进过程包括：

6.如权利要求3或4所述的方法，其特征在于，所述多尺度特征融合模块，包括：1*1卷积层、第一3*3卷积层、第二3*3卷积层、第三3*3卷积层、第四3*3卷积层、第一合并连接层、第二合并连接层和第三合并连接层；

7.如权利要求3或4所述的方法，其特征在于，所述像素点对应的锚框为9个，每个锚框的尺寸和长宽比分别为128*128和1：1、128*128和1：2、128*128和2：1、256*256和1：1、256*256和1：2、256*256和2：1、512*512和1：1、512*512和1：2以及512*512和2：1。

8.如权利要求3或4所述的方法，其特征在于，所述分类回归模块具体用于：

将所述各锚框中的RoI连接起来获得特征Fea；

9.如权利要求2所述的方法，其特征在于，所述步骤2包括：对所述训练数据依次按照概率0.5进行水平和垂直方向的随机翻转，角度-20度到20度，步距1度的图像随机旋转操作，90度、180度、270度的固定角度随机旋转操作，以及图像尺寸0.25到4倍随机缩放操作。

10.一种遥感图像检测系统，其特征在于，所述系统包括：

获取模块，用于获取待检测遥感图像；