CN108985314A

CN108985314A - 目标检测方法及设备

Info

Publication number: CN108985314A
Application number: CN201810506339.7A
Authority: CN
Inventors: 黄泽桑; 董远; 白洪亮; 熊风烨
Original assignee: Beijing Faceall Co
Current assignee: Beijing Faceall Co
Priority date: 2018-05-24
Filing date: 2018-05-24
Publication date: 2018-12-11

Abstract

本申请提供一种目标检测方法及设备。目标检测方法通过获取待检测图像的第一类特征图；通过特征模型对所述第一类特征图进行处理，以增强特征图中小目标对象的特征信息得到第二类特征图；将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，以提升检测小目标对象的效果；对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。利用特征模型增强小目标对象在特征图中的特征信息，从而提高检测小目标对象的效果及精准度。

Description

目标检测方法及设备

技术领域

本申请涉及图像检测技术领域，尤其涉及一种目标检测方法及设备。

背景技术

目标检测主要应用于视频监控、人机交互、虚拟现实以及无人机侦察等场景中。SSD(single shot multibox detector)作为一种快速的目标检测深层神经网络被广泛应用于目标检测中，基于其特征提取层的尺寸特性使得SSD网络在检测大目标对象方面具有较高的准确率。

SSD网络框架主要包括两部分，一部分采用了VGG-16作为基础网络层，另一部分为在VGG-16基础网络层上添加的特征提取层。在进行目标检测时，利用完成训练的SSD网络对待检测图像进行多层卷积，根据特征提取层的特征图的特征信息获取目标对象的位置信息。

然而，由于SSD网络结构层数较多，经过多层卷积后特征提取层的特征图中携带的目标对象信息被大大削弱，因此造成图像中小目标对象漏检的现象。

发明内容

有鉴于此，本申请实施例提供了一种目标检测方法及设备，以解决SSD网络检测小目标对象性能差的问题。

本申请实施例采用下述技术方案：

本申请实施例还提供了一种目标检测方法，包括：

获取待检测图像的第一类特征图；

通过特征模型对所述第一类特征图进行处理，以获取第二类特征图；

将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图；

对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。

本申请实施例还提供了一种目标检测设备，包括：

获取单元，用以获取待检测图像的第一类特征图；

处理单元，用以通过特征模型对所述第一类特征图进行处理，以获取第二类特征图；

叠加单元，用以将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图；

检测单元，用以对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。

本申请实施例还提供了电子设备，包括至少一个处理器及存储器，所述存储器存储有程序，并且被配置成由至少一个所述处理器执行以下步骤：

获取待检测图像的第一类特征图；

本申请实施例还提供了计算机可读存储介质，包括与电子设备结合使用的程序，程序可被处理器执行以完成以下步骤：

获取待检测图像的第一类特征图；

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

本发明通过获取待检测图像的第一类特征图；通过特征模型对所述第一类特征图进行处理，以增强特征图中小目标对象的特征信息得到第二类特征图；将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，以提升检测小目标对象的效果；对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。利用特征模型增强小目标对象在特征图中的特征信息，从而提高检测小目标对象的效果及精准度。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种目标检测方法的实施的方法流程图；

图2为本申请实施例中特征初级模型的工作原理图；

图3为本申请实施例提供的目标检测方法的实施的方法流程图；

图4为本申请实施例提供的一种目标检测设备的一种实施例的模块图。

具体实施方式

为了实现本申请的目的，本申请实施例提供了目标检测方法及设备，通过获取待检测图像的第一类特征图；通过特征模型对所述第一类特征图进行处理，以增强特征图中小目标对象的特征信息得到第二类特征图；将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，以提升检测小目标对象的效果；将所述第三类特征图输入到所述深层神经网络模型中对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。利用特征模型增强小目标对象在特征图中的特征信息，从而提高检测小目标对象的效果及精准度。

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本申请实施例提供的一种目标检测方法的流程示意图。所述方法可以如下所示。

步骤S101.获取待检测图像的第一类特征图。

进一步地，获取待检测图像的第一类特征图，包括：

获取待检测图像在深层神经网络模型的预设卷积层的第一类特征图。

在本实施例中，预设卷积层是指位于深层神经网络中比较靠前的卷积层，如：基础网络层中的卷积层。预设卷积层可以是基础网络层中的卷积层中任一卷积层。

作为一种较为优选的实施例，预设卷积层可采用Conv4_3卷积层，经所述Conv4_3卷积层卷积后的特征图包含的小目标对象特征信息较多有利于增强特征信息。需要说明的是，小目标对象是指目标对象的尺寸在所述待检测图像的0.1倍至0.5倍之间的对象。

步骤S102.通过特征模型对所述第一类特征图进行处理，以获取第二类特征图。

在本申请实施例中，通过特征模型对所述第一类特征图进行处理，以获取第二类特征图特征模型，包括：

通过特征模型对所述第一类特征图进行至少一次的卷积计算及至少一次的降维计算，以获取第二类特征图。

其中，在所述卷积处理过程中第一类特征图的特征平面尺寸与所述第二类特征图的特征平面尺寸保持相同。

在本实施例中，在预设卷积层后面添加了所述特征模型，通过特征模型对经预设卷积层卷积后的第一类特征图进行至少一次的卷积，以增强特征图中小目标对象的特征信息。

进一步地，如图2所示，作为一种较为优选的实施例，通过特征模型可对所述第一类特征图进行三次卷积，相邻的两次卷积之间采用池化的方式对特征图进行降维，以减少运算量。

步骤S103.将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图。

在本申请实施例中，将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，包括：

将所述第二类特征图进行卷积处理；

将经卷积处理后的第二类特征图的特征向量与所述第一类特征图的特征向量对位求和，根据求和后的特征向量生成所述第三类特征图。

其中，在所述卷积处理过程中卷积前第二类特征图的特征平面尺寸与卷积后第二类特征图的特征平面尺寸相同，以保证第一类特征图的特征向量可以与第二类特征图的特征向量对位求和。

在本实施例中，将增加小目标特征信息的第二类特征图与先前的第一类特征图相叠加，实现了在原有特征图的基础上增加小目标特征信息的目的，提升了检测目标对象的效果和准确度。

步骤S104.对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。

需要说明的是，本发明检测的目标对象的尺寸在样本图像的0.1倍至1倍之间。目标对象可以是人、动物或车体等可移动的物体或其他静止的物体，此处不做具体限定。

在本申请实施例中，对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标，包括：

将所述第三类特征图输入到所述深层神经网络模型中；

获取经所述深层神经网络模型中卷积层卷积后的第四类特征图；

对所述第四类特征图的特征通道进行压缩，获取经压缩后的特征通道之间的相关度，根据所述相关度对相应特征通道进行标识；

基于所述标识提取所述第四类特征图的图特征通道的特征信息，根据所述特征信息生成特征向量；

基于所述第四类特征图的所述特征向量获取所述目标对象的在所述待检测图像中的位置坐标。

在本实施例中，将经叠加后生成的第三类特征图，输入到深层神经网络模型中的预设卷积层后的卷积层中，对其进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。可根据相应的标识提升有用的特征通道，抑制作用小的特征通道，能够有效地减小对特征中不必要的通道的依赖。从而改善深层神经网络本身对小目标对象的漏检，进一步提升整个网络结构的目标检测性能。

进一步地，可采用SENet(Squeeze-and-Excitation Networks)结构对第四类特征图的特征通道进行压缩，获取经压缩后的特征通道之间的相关度，根据相关度对相应特征通道进行标识。

首先采用Squeeze(压缩)操作，顺着空间维度来进行特征压缩，将每个二维的特征通道变成一个实数，这个实数某种程度上具有全局的感受野，并且输出的维度和输入的特征通道数相匹配。它表征着在特征通道上响应的全局分布，而且使得靠近输入的层也可以获得全局的感受野，这一点在很多任务中都是非常有用的；其次采用Excitation(权值评比)操作，它是一个类似于循环神经网络中门的机制。通过参数来为每个特征通道生成权重，其中参数被学习用来显式地建模特征通道间的相关性。最后通过Reweight的操作，将Excitation的输出的权重作为经过特征选择后的每个特征通道的重要性，然后通过乘法逐通道加权到先前的特征上，从而完成在特征通道维度上的对原始特征的重标定。

在实际应用中，可在深层神经网的多处卷积层附近加入SENet结构。从而进一步提升识别性能。SENet结构可嵌入到Inception(开始)结构中，也可嵌入到含有skip-connections(跳跃式传递)的模块中。

在本实施例中，目标检测方法是基于经训练后的深层神经网络模型实现的。

结合图3所示，深层神经网络模型的训练过程如下所示：

步骤S201.获取至少一个样本图像在深层神经网络初级模型的预设卷积层的所述第一类特征图。

作为一种较为优选的实施例，预设卷积层可采用Conv4_3卷积层，经所述Conv4_3卷积层卷积后的特征图包含的小目标对象特征信息较多有利于增强特征信息。需要说明的是，小目标对象是指目标对象的尺寸在所述样本图像的0.1倍至0.5倍之间的对象。

步骤S202.通过特征初级模型对所述第一类特征图进行至少一次卷积处理，以获取第二类特征图。

在本申请实施例中，通过特征初级模型对所述第一类特征图进行至少一次卷积处理，以获取第二类特征图，包括：

通过特征初级模型对所述第一类特征图进行至少一次的卷积计算及至少一次的降维计算，以获取第二类特征图；

在本实施例中，在预设卷积层后面添加了所述特征初级模型，通过特征初级模型对经预设卷积层卷积后的第一类特征图进行至少一次的卷积，以增强特征图中小目标对象的特征信息。

进一步地，如图2所示，作为一种较为优选的实施例，通过特征初级模型可对所述第一类特征图进行三次卷积，相邻的两次卷积之间采用池化的方式对特征图进行降维，以减少运算量。

步骤S203.基于所述第二类特征图及所述第一类特征图对所述特征初级模型进行训练，以获取特征模型；

在本申请实施例中，基于所述第二类特征图及所述第一类特征图对所述特征初级模型进行训练，以获取特征模型，包括：

根据所述第一类特征图与所述样本图像的映射关系，获取第一类特征图中第一类像素点在所述样本图像中相应的坐标，将与所述坐标重合的所述样本图像的第二类像素点的类别作为所述第一类特征图中相应第一类像素点的类别；

对所述第二类特征图中的第三类像素点进行分类，将分类后的第二类特征图的第三类像素点与所述第一类特征图中相应的第一类像素点进行匹配，以获取第一匹配度；

根据所述第一匹配度确定所述特征初级模型的第一权重系数，根据所述第一权重系数生成所述特征模型。

在本实施例中，根据第一类特征图与样本图像的映射关系对第一类特征图上的像素点分类：将第一类特征图上的像素点映射回样本图像得到新坐标，若新坐标落入样本图像的真实值(Ground Truth)范围所属的类别即作为相应的像素点所属的类别。若像素点与真实值范围重叠，则选择面积较小的真实值所属类别作为相应像素点所属类别，从而实现对第一类特征图中像素点的分类。在实际应用中，如图2所示，第二类特征图经softmax层的分类和归一化后与经分类后的第一类特征图计算交叉熵损失函数，交叉熵损失函数可以乘以系数并与深层神经网络初级模型本身的损失函数合并，作为整体的损失函数(即：匹配过程)。根据整体的损失函数获取回归梯度(即：第一匹配度)根据该回归梯度调节特征初级模型的权重系数，使特征模型趋近于拟合小目标对象方向，根据最终确定的权重系数生成特征模型，以使经特征模型卷积获得的第二类特征图中的小目标特征信息得到增强的目的。

进一步地，交叉熵损失函数权重可为0.3，属于弱监督，有利于目标对象检测。

在本申请实施例中，基于所述第二类特征图及所述第一类特征图对所述特征初级模型进行训练，以获取特征模型，还包括：

基于所述第二类特征图及所述第一类特征图对所述特征初级模型和预设卷积层及位于所述预设卷积层之前的卷积层进行训练，以获取特征模型和预设卷积层的第一权重系数及位于所述预设卷积层之前的卷积层的第一权重系数。

在实际应用中，第一匹配度不仅可以调节特征模型的权重系数，还可以调节预设卷积层(如：Conv4_3卷积层)的权重系数及位于预设卷积层之前的其他卷积层的权重系数，使得第二特征模型及位于预设卷积层之前(包括预设卷积层)卷积的卷积层趋近于拟合小目标对象方向，使得经特征模型卷积获得的第二类特征图中的小目标特征信息得到增强的目的。

步骤S204.将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图。

将所述第二类特征图进行卷积处理；

步骤S205.将所述第三类特征图输入到所述深层神经网络初级模型中对所述深层神经网络初级模型进行训练，以获取深层神经网络模型。

在本申请实施例中，将所述第三类特征图输入到所述深层神经网络初级模型中对所述深层神经网络初级模型进行训练，以获取深层神经网络模型，包括：

通过所述深层神经网络初级模型对第三类特征图进行多层卷积，获取第三类特征图的损失函数，将所述损失函数与相应的所述样本图像的目标函数进行匹配获取第二匹配度，根据所述第二匹配度确定所述深层神经网络初级模型的第二权重系数，根据所述第二权重系数生成所述深层神经网络模型。

在本实施例中，当第二类特征图与第一类特征图叠加获取第三类特征图后，将第三类特征图继续输入到位于预设卷积层之后的卷积层中，通过第三类特征图对所述深层神经网络初级模型进行训练，将获得的损失函数与样本图像的目标函数进行匹配获取第二匹配度，根据该第二匹配度调节深层神经网络初级模型中每一卷积层的权重系数，使得深层神经网络趋近于拟合目标对象方向，根据最终获取的权重系数生成深层神经网络模型。

在训练过程中还可包括：

通过所述深层神经网络初级模型中对所述第三类特征图进行多层卷积，以获取所述样本图像中目标对象的位置坐标。

进一步地，通过所述深层神经网络初级模型中对所述第三类特征图进行多层卷积，以获取所述样本图像中目标对象的位置坐标，包括：

获取经所述深层神经网络初级模型中卷积层卷积后的第四类特征图；

基于所述第四类特征图的所述特征向量获取所述目标对象的在所述样本图像中的位置坐标。

在本实施例中，可根据相应的标识提升有用的特征通道，抑制作用小的特征通道，能够有效地减小对特征中不必要的通道的依赖。从而改善深层神经网络本身对小目标对象的漏检，进一步提升整个网络结构的目标检测性能。

通过获取至少一个样本图像在深层神经网络初级模型的预设卷积层的第一类特征图；采用特征初级模型对所述第一类特征图进行至少一次卷积处理，以增强特征图中小目标对象的特征信息得到第二类特征图；基于所述第二类特征图及所述第一类特征图对所述特征初级模型进行训练得到特征模型，使得特征模型趋近于拟合小目标对象方向；将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，以提升检测小目标对象的效果；将所述第三类特征图输入到所述深层神经网络初级模型中对所述深层神经网络初级模型进行训练得到深层神经网络模型，使得深层神经网络模型趋近于拟合目标对象方向。利用特征模型增强小目标对象在特征图中的特征信息，从而提高检测小目标对象的效果及精准度。

基于同一个发明构思，图4为本申请实施例提供的一种目标检测设备的模块图。目标检测设备包括：获取单元1、处理单元2、叠加单元3和检测单元4，其中：

获取单元1，用以获取待检测图像的第一类特征图；

处理单元2，用以通过特征模型对所述第一类特征图进行处理，以获取第二类特征图；

叠加单元3，用以将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图；

检测单元4，用以对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标。

进一步地，所述获取单元，用以获取待检测图像的第一类特征图，包括：

在本实施例中，通过获取待检测图像在深层神经网络模型的预设卷积层的第一类特征图；采用特征模型对所述第一类特征图进行至少一次卷积处理，以增强特征图中小目标对象的特征信息得到第二类特征图；将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，以提升检测小目标对象的效果；将所述第三类特征图输入到所述深层神经网络模型中对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标，达到检测目标对象的目的。利用特征模型增强小目标对象在特征图中的特征信息，从而提高检测小目标对象的效果及精准度。

在本申请的另一个实施例中，所述处理单元2，用以通过特征模型对所述第一类特征图进行处理，以获取第二类特征图，包括：

进一步地，在所述卷积处理过程中第一类特征图的特征平面尺寸与所述第二类特征图的特征平面尺寸相同。

在本申请的另一个实施例中，所述叠加单元3，用以将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，包括：

将所述第二类特征图进行卷积处理；

进一步地，在所述卷积处理过程中卷积前第二类特征图的特征平面尺寸与卷积后第二类特征图的特征平面尺寸相同。

在本申请的另一个实施例中，所述检测单元4，用以对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标，包括：

将所述第三类特征图输入到所述深层神经网络模型中；

基于同一个发明构思，本申请实施例提供了一种电子设备，包括至少一个处理器及存储器，所述存储器存储有程序，并且被配置成由至少一个所述处理器执行以下步骤：

获取待检测图像的第一类特征图；

基于同一个发明构思，本申请实施例提供了一种计算机可读存储介质，包括与电子设备结合使用的程序，程序可被处理器执行以完成以下步骤：

获取待检测图像的第一类特征图；

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种目标检测方法，其特征在于，包括：

获取待检测图像的第一类特征图；

2.根据权利要求1所述的目标检测方法，其特征在于，获取待检测图像的第一类特征图，包括：

3.根据权利要求1所述的目标检测方法，其特征在于，通过特征模型对所述第一类特征图进行处理，以获取第二类特征图特征模型，包括：

4.根据权利要求3所述的目标检测方法，其特征在于，在所述卷积处理过程中第一类特征图的特征平面尺寸与所述第二类特征图的特征平面尺寸相同。

5.根据权利要求1所述的目标检测方法，其特征在于，将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，包括：

将所述第二类特征图进行卷积处理；

6.根据权利要求5所述的目标检测方法，其特征在于，在所述卷积处理过程中卷积前第二类特征图的特征平面尺寸与卷积后第二类特征图的特征平面尺寸相同。

7.根据权利要求2所述的目标检测方法，其特征在于，对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标，包括：

将所述第三类特征图输入到所述深层神经网络模型中；

8.一种目标检测设备，其特征在于，包括：

获取单元，用以获取待检测图像的第一类特征图；

9.根据权利要求8所述的目标检测设备，其特征在于，所述获取单元，用以获取待检测图像的第一类特征图，包括：

10.根据权利要求8所述的目标检测设备，其特征在于，所述处理单元，用以通过特征模型对所述第一类特征图进行处理，以获取第二类特征图，包括：

11.根据权利要求10所述的目标检测设备，其特征在于，在所述卷积处理过程中第一类特征图的特征平面尺寸与所述第二类特征图的特征平面尺寸相同。

12.根据权利要求8所述的目标检测设备，其特征在于，所述叠加单元，用以将所述第二类特征图与所述第一类特征图进行叠加生成第三类特征图，包括：

将所述第二类特征图进行卷积处理；

13.根据权利要求12所述的目标检测设备，其特征在于，在所述卷积处理过程中卷积前第二类特征图的特征平面尺寸与卷积后第二类特征图的特征平面尺寸相同。

14.根据权利要求9所述的目标检测设备，其特征在于，所述检测单元，用以对所述第三类特征图进行多层卷积，以获取所述待检测图像中目标对象的位置坐标，包括：

将所述第三类特征图输入到所述深层神经网络模型中；

15.一种电子设备，包括至少一个处理器及存储器，所述存储器存储有程序，并且被配置成由至少一个所述处理器执行以下步骤：

获取待检测图像的第一类特征图；

16.一种计算机可读存储介质，包括与电子设备结合使用的程序，程序可被处理器执行以完成以下步骤：

获取待检测图像的第一类特征图；