CN111798417A

CN111798417A - 一种基于ssd遥感图像目标检测的方法及装置

Info

Publication number: CN111798417A
Application number: CN202010568175.8A
Authority: CN
Inventors: 杜兴强; 郝雪涛; 王峰; 徐振亮
Original assignee: China Center for Resource Satellite Data and Applications CRESDA
Current assignee: China Center for Resource Satellite Data and Applications CRESDA
Priority date: 2020-06-19
Filing date: 2020-06-19
Publication date: 2020-10-20

Abstract

本申请公开了一种基于SSD遥感图像目标检测的方法及装置，该方法包括：确定出图像训练数据集和图像测试数据集，在图像训练数据集以及图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注；将图像训练数据集输入到构建的SSD网络模型得到多个特征图，在每个特征图的每个像素点处设置一组尺度不同的先验框；将每个待检测目标的位置分别与每个先验框进行匹配确定出每个待检测目标对应的至少一个第一预测框，根据至少一个第一预测框对SSD网络模型进行优化；将图像测试数据集输入到优化后的SSD网络模型中，确定出每个待检测目标对应的至少一个第二预测框。本申请解决了现有技术中目标检测的效率较低的技术问题。

Description

一种基于SSD遥感图像目标检测的方法及装置

技术领域

本申请涉及遥感图像处理和视觉分析技术领域，尤其涉及一种基于SSD遥感图像目标检测的方法及装置。

背景技术

遥感图像在遥感技术的迅速发展下得到了极大地丰富，人类对于地球进行观测分析的需求也愈发强烈，遥感图像的智能化处理分析技术由此应运而生。目标检测作为遥感图像的一种处理分析方法，在图像判读中起着至关重要的作用，被广泛应用于智能监测、城市规划、精准农业、地理信息系统(GIS)等领域。

目前，主要采用基于深度学习的目标检测方法。具体的，基于深度学习的目标检测方法包含两个关键步骤：图像特征提取和分类器训练，其中，分类器训练是指寻找一系列的规则，来确定当前图像中物体的类别和位置。目前基于深度学习的目标检测方法的过程为：先通过启发式方式或者卷积神经网络产生一系列稀疏的候选框，然后进行分类回归操作，由于属于两个步骤过程，因此检测效率较低。

发明内容

本申请解决的技术问题是：针对现有技术中目标检测的效率较低的问题，本申请提供了一种基于SSD遥感图像目标检测的方法及装置，在本申请实施例所提供的方案中，通过SSD网络模型中得到多个不同分辨率的特征图，根据所述多个不同分辨率的特征图进行目标检测，以及通过采用不同尺度与长宽比的先验框均匀地在特征图的不同像素点位置进行密集抽样，不仅能够适应对不同尺寸的物体检测需求，提高了识别的准确率，而且利用网络模型提取特征后直接进行分类与回归，整个过程只需要一步，从而提高了目标检测的效率。

第一方面，本申请实施例提供一种基于SSD遥感图像目标检测的方法，该方法包括：

从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注；

构建SSD网络模型，将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，其中，所述先验框为矩形框；

将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，其中，所述第一预测框是指与任一所述待检测目标位置匹配的先验框；

将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。

本申请实施例所提供的方案中，通过将图像训练数据集输入到SSD网络模型中得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，即采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样，然后将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，再根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型。因此，在本申请实施例所提供的方案中，通过SSD网络模型中得到多个不同分辨率的特征图，根据所述多个不同分辨率的特征图进行目标检测，以及通过采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样，仅能够适应对不同尺寸的物体检测需求，提高了方案的适用性，还通过多个不同分辨率的特征图以及在每个像素点处设置一组尺度不同的先验框进行目标检测，即进行多尺度检测，提高了目标检测速度以及准确性。

可选地，从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，包括：

根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集；

在所述第一图像数据集中设置至少一个待检测目标，对所述每个待检测目标进行位置标注以及类别标注，得到标注后的第一图像数据集；

在所述第二图像数据集中设置至少一个待检测目标，对所述每个待检测目标进行位置标注以及类别标注，得到标注后的第二图像数据集；

分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。

可选地，构建SSD网络模型，包括：

将预设的VGG16模型中的全连接层fc6转换成3×3的卷积层，以及将全连接层fc7转换成1×1的卷积层；

在所述VGG16模型中卷积层conv1到卷积层conv5之间，每个卷积层之后添加一个池化层；

在所述VGG16模型中卷积层conv7之后添加四个依次相连的卷积层，得到所述SSD网络模型。

可选地，在每个所述特征图的每个像素点处设置一组尺度不同的先验框，包括：

确定所述每个特征图中每个像素点的位置信息，以及所述每个特征图的尺度；

根据先验框尺度与特征图尺度之间预设的关系，计算所述先验框与所述特征图尺度之间的比值；

根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度；

根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。

可选地，将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，包括：

计算所述任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比；

根据所述第一交并比确定出所述至少一个第一预测框，其中，所述第一预测框是指所述第一交并比大于第一预设阈值所对应的先验框。

可选地，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，包括：

计算所述每个先验框对应的类别置信度误差，确定出所述类别置信度误差最大的第一先验框，判断所述至少一个第一预测框中是否包括所述第一先验框；

若包括，则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本，将剩余所述先验框设置为负样本；

确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差，并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数；

根据预设的优化算法对所述损失函数进行优化，得到所述优化后的SSD网络模型。

可选地，将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框，包括：

将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中，确定所述图像测试数据集中所述每个待检测目标的类别置信度，根据所述类别置信度确定所述每个待检测目标的类别；

根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框，得到至少一个第二先验框，确定所述至少一个第二先验框的置信度；

将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉，并根据所述置信度将所述过滤后的至少一个第二先验框进行排序，得到一先验框序列，从所述先验框序列选择出预设个数的第三先验框；

根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。

可选地，所述方法，还包括：

确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度；

根据所述重合度判断所述每个待检测目标位置的检测是否正确；

若正确，则根据所述重合度计算每个类别的待检测目标的平均精度均值，以及确定检测速度评价指标。

第二方面，本申请实施例提供了一种基于SSD遥感图像目标检测的装置，该装置包括：

第一确定单元，用于从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注；

建模单元，用于构建SSD网络模型，将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，其中，所述先验框为矩形框；

优化单元，用于将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，其中，所述第一预测框是指与任一所述待检测目标位置匹配的先验框；

第二确定单元，用于将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。

可选地，所述第一确定单元，用于：

可选的，所述建模单元，具体用于：

可选地，所述优化单元，具体用于：

可选地，所述第二确定单元，具体用于：

可选地，所述第二确定单元，还用于：

确定所述每个待检测目标位置与其对应的所述至少一个第二预测框之间重合度；根据所述重合度判断所述每个待检测目标位置的检测是否正确；

第三方面，本申请提供一种计算机设备，该计算机设备，包括：

存储器，用于存储至少一个处理器所执行的指令；

处理器，用于执行存储器中存储的指令执行第一方面所述的方法。

第四方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行第一方面所述的方法。

附图说明

图1为本申请实施例所提供的一种基于SSD遥感图像目标检测的方法的流程示意图；

图2a为本申请实施例所提供的一种海港SSD遥感图像目标检测后的效果图；

图2b为本申请实施例所提供的一种飞机场SSD遥感图像目标检测后的效果图；

图2c为本申请实施例所提供的一种运动场SSD遥感图像目标检测后的效果图；

图2d为本申请实施例所提供的一种运动场SSD遥感图像目标检测后的效果图；

图3为本申请实施例所提供的一种基于SSD遥感图像目标检测的装置的结构示意图；

图4为本申请实施例所提供的一种计算机设备的结构示意图。

具体实施方式

以下结合说明书附图对本申请实施例所提供的一种基于SSD遥感图像目标检测的方法做进一步详细的说明，该方法具体实现方式可以包括以下步骤(方法流程如图1所示)：

步骤101，从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注。

在本申请实施例所提供的方案中，确定图像训练数据集和图像测试数据集的方式有多种，下面以一种较佳的方式为例进行说明。

在一种可能实现的方式中，从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，包括：根据预设的比例将所述多张遥感图像划分为第一图像数据集以及第二图像数据集；在所述第一图像数据集中设置至少一个待检测目标，对所述每个待检测目标进行位置标注以及类别标注，得到标注后的第一图像数据集；在所述第二图像数据集中设置至少一个检测目标，对所述每个检测目标进行位置标注以及类别标注，得到标注后的第二图像数据集；分别将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集。

例如，收集的遥感图像为100张，其中，该100张遥感图像中包含汽车、飞机或者建筑平面等；预设的比例为8:2。计算机设备在收集100张遥感图像之后，根据8:2的比例将100张遥感图像划分为第一图像数据集以及第二图像数据集，其中，第一图像数据集包含80张遥感图像，第二图像数据集包含20张遥感图像。在第一图像数据集中设置至少一个待检测目标，例如，待检测目标包括汽车、飞机或者建筑平面等，然后通过人工或自动方式对待检测目标进行位置标注以及类型标注，其中，通过所述待检测目标进行位置标注；在第二图像数据集中设置至少一个检测目标，例如，检测目标包括汽车、飞机或者建筑平面等，然后对检测目标进行位置标注以及类型标注，其中，通过所述待检测目标进行位置标注。最后将所述标注后的第一图像数据集以及所述标注后的第二图像数据集进行预处理操作得到所述图像训练数据集和所述图像测试数据集，其中，预处理操作包括裁剪、翻转或颜色扭曲。

步骤102，构建SSD网络模型，将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，其中，所述先验框为矩形框。

在本申请实施例所提供的方案中，构建目标检测算法SSD(Single ShotDetector)模型的方式有多种，下面以一种较佳的方式为例进行说明。

在一种可能实现的方式中，构建SSD网络模型，包括：

为了便于理解下面以举例的形式对本申请实施例所构建的SSD网络模型的结构以及参数进行简要介绍。

例如，若SSD网络模型包括28层卷积层，各卷积层的参数设置如下：第1层卷积层conv1-1，卷积核的大小为3×3，卷积核的个数为64，步长为1，激活函数为relu函数；第2层卷积层conv1-2，卷积核的大小为3×3，卷积核的个数为64，步长为1，激活函数为relu函数；第3层最大池化层pool1，池化核的大小为2×2，步长为2；第4层卷积层conv2-1，卷积核的大小为3×3，卷积核的个数为128，步长为1，激活函数为relu函数；第5层卷积层conv2-2，卷积核的大小为3×3，卷积核的个数为128，步长为1，激活函数为relu函数；第6层最大池化层pool2，池化核的大小为2×2，步长为2；第7层卷积层conv3-1，卷积核的大小为3×3，卷积核的个数为256，步长为1，激活函数为relu函数；第8层卷积层conv3-2，卷积核的大小为3×3，卷积核的个数为256，步长为1，激活函数为relu函数；第9层卷积层conv3-3，卷积核的大小为3×3，卷积核的个数为256，步长为1，激活函数为relu函数；第10层最大池化层pool3，池化核的大小为2×2，步长为2；第11层卷积层conv4-1，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第12层卷积层conv4-2，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第13层卷积层conv4-3，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第14层最大池化层pool4，池化核的大小为2×2，步长为2；第15层卷积层conv5-1，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第16层卷积层conv5-2，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第17层卷积层conv5-3，卷积核的大小为3×3，卷积核的个数为512，步长为1，激活函数为relu函数；第18层最大池化层pool5，池化核的大小为3×3，步长为1；第19层卷积层conv6，卷积核的大小为3×3，卷积核的个数为1024，步长为1，激活函数为relu函数；第20层卷积层conv7，卷积核的大小为1×1，卷积核的个数为1024，步长为1，激活函数为relu函数；第21层卷积层conv8-1，卷积核的大小为1×1，卷积核的个数为256，步长为1，激活函数为relu函数；第22层卷积层conv8-2，卷积核的大小为3×3，卷积核的个数为512，步长为2，填充padding为1，激活函数为relu函数；第23层卷积层conv9-1，卷积核的大小为1×1，卷积核的个数为128，步长为1，激活函数为relu函数；第24层卷积层conv9-2，卷积核的大小为3×3，卷积核的个数为256，步长为2，填充padding为1，激活函数为relu函数；第25层卷积层conv10-1，卷积核的大小为1×1，卷积核的个数为128，步长为1，激活函数为relu函数；第26层卷积层conv10-2，卷积核的大小为3×3，卷积核的个数为256，步长为1，激活函数为relu函数；第27层卷积层conv11-1，卷积核的大小为1×1，卷积核的个数为128，步长为1，激活函数为relu函数；第28层卷积层conv11-2，卷积核的大小为3×3，卷积核的个数为256，步长为1，激活函数为relu函数。

进一步，计算机设备构建SSD网络模型之后，将图像训练数据集中每个图像依次输入到该SSD网络模型中，由于该SSD网络模型具有多个不同深度的卷积层，通过不同深度的卷积层对图像训练数据集中的图像进行特征提取得到多个不同分辨率的特征图，然后在每个所述特征图的每个像素点处设置一组尺度不同的先验框。在本申请实施例所提供的方案中，在每个像素点处设置一组尺度不同的先验框的方式有多种，下面以一种较佳的方式为例进行说明。

在一种可能实现的方式中，在每个所述特征图的每个像素点处设置一组尺度不同的先验框，包括：确定所述每个特征图中每个像素点的位置信息，以及所述每个特征图的尺度；根据先验框尺度与特征图尺度之间预设的关系，计算所述先验框与所述特征图尺度之间的比值；根据所述比值、预设的一组先验框所包含的先验框数量和每个先验框的长宽比值确定出所述一组先验框中每个先验框的长度和宽度；根据所述每个先验框的长度和宽度在所述每个像素点处设置一组尺度不同的先验框。

为了便于理解下面基于上述SSD网络模型以举例的形式对每个像素点处设置一组尺度不同的先验框的过程进行说明。

例如，选取SSD网络模型中conv4-3、conv7、conv8-2、conv9-2、conv10-2、conv11-2六个卷积层生成的特征图，其中，特征图的大小分别为(38，38)、(19，19)、(10，10)、(5，5)、(3，3)以及(1，1)，若每个特征图的每个像素点位置设置5个不同的先验框，预设的5个先验框的长度和宽度的比a_r分别为1、2、3、1/2、1/3。

进一步，对于先验框的尺度遵循一个线性递增规则：随特征图尺度减小，先验框尺度线性增加，具体先验框尺度与特征图尺度之间满足如下关系：

其中，S_k表示先验框的尺度与特征图尺度之间的比值；m表示选中的SSD网络模型中六个层，m＝6；表示层数，k∈[1，m]；S_min表示选中的六层中第一层的尺度比值，S_min＝0.2；S_max表示选中的六层中第六层的尺度比值，S_max＝0.9。

然后，根据a_r以及S_k计算每个先验框的长和宽，具体公式如下：

其中，w_k表示先验框的长度；h_k表示先验框的宽度。

步骤103，将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，其中，所述第一预测框是指与任一所述待检测目标位置匹配的先验框。

在一种可能实现方式中，将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，包括：

具体的，在本申请实施例所提供的方案中，通过如下公式计算任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比：

其中，IoU表示第一交并比；A表示先验框的尺度；B表示待检测目标的尺度。

进一步，在计算机设备的数据库中预先存储着交并比的阈值，计算机设备在确定任一待检测目标的尺度与所述每个先验框尺度之间的第一交并比之后，提取第一交并比不小于预设阈值的至少一个先验框，并将该至少一个先验框作为第一预测框。

进一步，计算机设备在确定出至少一个第一预测框之后，根据第一预测框对SSD网络模型进行优化。具体的，在本申请实施例所提供的方案中，对SSD网络模型进行优化的方式有多种，下面以一种较佳的方式为例进行说明。

在一种可能实现的方式中，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，包括：计算所述每个先验框对应的类别置信度误差，确定出所述类别置信度误差最大的第一先验框，判断所述至少一个第一预测框中是否包括所述第一先验框；若包括，则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本，将剩余所述先验框设置为负样本；确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差，并根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数；根据预设的优化算法对所述损失函数进行优化，得到所述优化后的SSD网络模型。

在本申请实施例所提供的方案中，计算机设备每个特征图的每个像素点设置一组先验框之后，确定每个先验框中的物体属于任一类别的概率，根据所述概率确定每个先验框中物体的类别，根据所述类别与预设的类别计算每个先验框对应的类别置信度误差，然后根据类别置信度误差对先验框进行降序排列，确定出置信度误差最大的第一先验框，再判断至少一个第一预测框是否包含第一先验框，若包括，则将所述至少一个第一预测框中除所述第一先验框之外的先验框设置为正样本，将剩余所述先验框设置为负样本，确定所述正样本中先验框的数量以及每个所述第一预测框的位置误差，再根据所述数量、所述位置误差以及所述类别置信度误差确定损失函数。具体的，可以通过如下公式计算损失函数：

其中，L表示所述损失函数；N表示正样本的数量；L_conf表示类别置信度误差；α表示权重系数；L_loc表示位置回归误差。

进一步，计算机设备在计算出SSD网络模型的损失函数之后，根据预设的优化算法对所述损失函数进行迭代优化，得到所述优化后的SSD网络模型，例如，预设的优化算法包括随机梯度下降的方法。

步骤104，将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。

在本申请实施例所提供的方案中，图像测试数据集包含至少一个遥感图像，计算机设备将SSD网络模型优化得到优化后的SSD网络模型之后，需要确定图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。具体的，确定每个待检测目标对应的至少一个第二预测框的方式有多种，下面以一种较佳的方式为例进行说明。

在一种可能实现的方式中，将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框，包括：将所述图像测试数据集中遥感图像依次输入到所述优化后的SSD网络模型中，确定所述图像测试数据集中所述每个待检测目标的类别置信度，根据所述类别置信度确定所述每个待检测目标的类别；根据所述每个待检测目标的类别过滤掉所述第一预测框中属于背景的先验框，得到至少一个第二先验框，确定所述至少一个第二先验框的置信度；将所述至少一个第二先验框中所述置信度小于预设阈值的先验框过滤掉，并根据所述置信度将所述过滤后的至少一个第二先验框进行排序，得到一先验框序列，从所述先验框序列选择出预设个数的第三先验框；根据预设的NMS算法从所述预设个数的第三先验框筛选出所述至少一个第二预测框。具体的，参见图2a表示一种海港SSD遥感图像目标检测后的效果图，在图2a中目标检测物体为港口；图2b表示一种飞机场SSD遥感图像目标检测后的效果图，在图2b中目标检测物体为飞机；图2c表示一种运动场SSD遥感图像目标检测后的效果图，在图2c中目标检测物体为棒球球场；图2d表示一种运动场SSD遥感图像目标检测后的效果图，在图2d中目标检测物体为网球场。

具体的，在本申请实施例所提供的方案中，从第三先验框中筛选出至少一个第二预测框的算法有多种，包括但不限制于非极大值抑制算法(Non-maximum suppression，NMS)。

进一步，为了提高目标检测结果的准确性。在本申请实施例所提供的方案中，在步骤104之后，还包括：确定所述每个待检测目标的位置与其对应的所述至少一个第二预测框之间重合度；根据所述重合度判断所述每个待检测目标的检测是否正确；若正确，则根据所述重合度计算每个类别的检测目标的平均精度均值，以及确定检测速度评价指标。

本申请实施例所提供的方案中，通过将图像训练数据集输入到SSD网络模型中得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，即采用不同尺寸的先验框均匀地在特征图的不同像素点位置进行密集抽样，然后将所述图像训练数据集中每个所述待检测目标的位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，再根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型。因此，在本申请实施例所提供的方案中，通过SSD网络模型中得到多个不同分辨率的特征图，根据所述多个不同分辨率的特征图进行目标检测，以及通过采用不同尺度与长宽比的先验框均匀地在特征图的不同像素点位置进行密集抽样，不仅能够适应对不同尺寸的物体检测需求，提高了识别的准确率，而且利用网络模型提取特征后直接进行分类与回归，整个过程只需要一步，从而提高了目标检测的效率。

基于与上述图1所述的方法相同的发明构思，本申请实施例提供了一种基于SSD遥感图像目标检测的装置，参见图2，该装置包括：

第一确定单元201，用于从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，并在所述图像训练数据集以及所述图像测试数据集中分别对至少一个待检测目标的位置以及类别进行标注；

建模单元202，用于构建SSD网络模型，将所述图像训练数据集输入到所述SSD网络模型得到多个不同分辨率的特征图，并在每个所述特征图的每个像素点处设置一组尺度不同的先验框，其中，所述先验框为矩形框；

优化单元203，用于将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，其中，所述第一预测框是指与任一所述待检测目标位置匹配的先验框；

第二确定单元204，用于将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框。

可选地，所述第一确定单元201，用于：

可选的，所述建模单元202，具体用于：

可选地，所述优化单元203，具体用于：

可选地，所述第二确定单元204，具体用于：

可选地，所述第二确定单元204，还用于：

参见图3，本申请提供一种计算机设备，该计算机设备，包括：

存储器301，用于存储至少一个处理器所执行的指令；

处理器302，用于执行存储器中存储的指令执行图1所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行图1所述的方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种基于SSD遥感图像目标检测的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，从收集的多张遥感图像中确定出图像训练数据集和图像测试数据集，包括：

3.如权利要求2所述的方法，其特征在于，构建SSD网络模型，包括：

4.如权利要求3所述的方法，其特征在于，在每个所述特征图的每个像素点处设置一组尺度不同的先验框，包括：

5.如权利要求4所述的方法，其特征在于，将所述图像训练数据集中每个所述待检测目标位置分别与所述每个特征图对应的先验框进行匹配确定出每个所述待检测目标对应的至少一个第一预测框，包括：

计算所述任一待检测目标位置的尺度与所述每个先验框尺度之间的第一交并比；

6.如权利要求5所述的方法，其特征在于，根据所述至少一个第一预测框对所述SSD网络模型进行优化，得到优化后的SSD网络模型，包括：

7.如权利要求1～6任一项所述的方法，其特征在于，将所述图像测试数据集输入到所述优化后的SSD网络模型中，确定出所述图像测试数据集中每个所述待检测目标对应的至少一个第二预测框，包括：

8.如权利要求1～6任一项所述的方法，其特征在于，所述方法，还包括：

9.一种基于SSD遥感图像目标检测的装置，其特征在于，包括：

10.如权利要求9所述的装置，其特征在于，所述第一确定单元，用于：