CN111597945A

CN111597945A - 一种目标检测方法、装置、设备及介质

Info

Publication number: CN111597945A
Application number: CN202010392132.9A
Authority: CN
Inventors: 顾敏; 谢会斌; 李聪廷
Original assignee: Jinan Boguan Intelligent Technology Co Ltd
Current assignee: Jinan Boguan Intelligent Technology Co Ltd
Priority date: 2020-05-11
Filing date: 2020-05-11
Publication date: 2020-08-28
Anticipated expiration: 2040-05-11
Also published as: CN111597945B

Abstract

本申请公开了一种目标检测方法、装置、设备及介质，包括：获取训练样本图像；利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强；当获取到待检测图像，利用所述训练后模型输出对应的检测结果。这样，在训练过程中，针对小目标区域图像进行特征增强，得到训练后模型，然后利用这样的训练后模型进行目标检测，能够提升小目标检测的检出率和准确率。

Description

一种目标检测方法、装置、设备及介质

技术领域

本申请涉及目标检测技术领域，特别涉及一种目标检测方法、装置、设备及介质。

背景技术

目标检测是计算机视觉领域中极具挑战性的课题，目前基于深度学习的目标检测算法可分为两大类：一类是以Faster-RCNN(即Region Convolutional Neural Networks)为代表的Two-stage方法，另一类是以YOLO和SSD(即Single Shot MultiBox Detector)为代表的One-stage方法。其中Two-stage方法是基于候选区域的卷积神经网络，该方法利用RPN(即Region ProposalNetwork，区域候选网络)层生成可能包含目标的候选框，然后将候选框映射到特征图上，利用分类器和回归器得到目标的类别信息和坐标信息，该类方法检测精度较高但是速度慢。One-stage方法则是基于回归的方法，直接对图像中目标的类别和位置信息进行预测，最后通过非极大值抑制得到最终检测结果，该类方法速度快但是精度相对Two-stage方法较低。

在实际应用中，对于图像中目标较小，密集，遮挡或者小目标和大目标同时存在情况下，现有的目标检测框架在训练过程中存在小目标特征信息丢失，导致小目标出现漏检或误检的问题。

发明内容

有鉴于此，本申请的目的在于提供一种目标检测方法、装置、设备及介质，能够提升小目标检测的检出率和准确率。其具体方案如下：

第一方面，本申请公开了一种目标检测方法，包括：

获取训练样本图像；

利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强；

当获取到待检测图像，利用所述训练后模型输出对应的检测结果。

可选的，所述目标检测模型还包括特征提取网络、RPN网络、分类器和回归器；

相应的，所述利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型，包括：

将所述训练样本图像输入至所述特征提取网络，得到对应的样本特征图；

利用所述RPN网络生成所述样本特征图对应的候选区域；

将所述候选区域映射到所述样本特征图上；

从所述候选区域中筛选出小目标区域；

利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图；所述小目标区域特征图为所述小目标区域内的图像；

将所述小目标增强特征图和大目标区域特征图输入至分类器和回归器，得到每个候选区域特征图对应的预测结果；

其中，所述预测结果包括目标类别和目标位置；所述目标类别为所述分类器输出的结果；所述目标位置为所述回归器输出的结果；所述大目标区域特征图为大目标区域内的图像，所述大目标区域为所述候选区域中的大目标区域；

将所述预测结果映射到初始的所述训练样本图像，利用非极大抑制方法得到对应的训练检测结果。

可选的，所述利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图，包括：

步骤01：对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图；

步骤02：对所述小目标高级特征图进行上采样处理；

步骤03：对上采样处理后的所述小目标高级特征图进行重建，得到预设倍数的所述小目标高级特征图；

继续执行所述步骤01至步骤03，直到所述步骤01至步骤03的执行次数达到预设次数，得到所述小目标增强特征图。

可选的，所述目标检测方法，还包括：

利用所述特征提取网络的下采样倍数确定所述预设次数。

可选的，所述对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图，包括：

对所述小目标区域特征图进行残差结构处理，得到对应的小目标高级特征图。

可选的，所述对所述小目标高级特征图进行上采样处理，包括：

利用预设数量个卷积核对所述小目标高级特征图进行卷积操作，然后进行亚像素卷积操作，以完成所述上采样处理。

可选的，所述目标检测方法，还包括：

利用预先构建的目标损失函数计算所述目标检测模型的训练损失；所述训练损失包括增强损失、分类损失和回归损失。

第二方面，本申请公开了一种目标检测装置，包括：

训练样本获取模块，用于获取训练样本图像；

检测模型训练模块，用于利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强；

图像目标检测模块，用于当获取到待检测图像，利用所述训练后模型输出对应的检测结果。

第三方面，本申请公开了一种目标检测设备，包括处理器和存储器；其中，

所述存储器，用于保存计算机程序；

所述处理器，用于执行所述计算机程序以实现前述的目标检测方法。

第四方面，本申请公开了一种计算机可读存储介质，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现前述的目标检测方法。

可见，本申请先获取训练样本图像，然后利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强，当获取到待检测图像，利用所述训练后模型输出对应的检测结果。这样，在训练过程中，针对小目标区域图像进行特征增强，得到训练后模型，然后利用这样的训练后模型进行目标检测，能够提升小目标检测的检出率和准确率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种目标检测方法流程图；

图2为本申请公开的一种小目标区域特征图特征增强示意图；

图3为本申请提供的一种具体的特征增强子网络处理流程图；

图4为本申请公开的一种特征图上采样示意图；

图5为本申请提供的一种具体的特征增强流程图；

图6为本申请公开的一种具体的目标检测模型训练流程图；

图7为本申请公开的一种具体的目标检测方法流程图；

图8为本申请公开的一种特征增强网络以及特征增强损失计算示意图；

图9为本申请公开的一种目标检测装置结构示意图；

图10为本申请公开的一种目标检测设备结构图；

图11为本申请公开的一种电子终端结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在实际应用中，对于图像中目标较小，密集，遮挡或者小目标和大目标同时存在情况下，现有的目标检测框架在训练过程中存在小目标特征信息丢失，导致小目标出现漏检或误检的问题。为此本申请提供了一种目标检测方案，能够提升小目标检测的检出率和准确率。

参见图1所示，本申请实施例公开了一种目标检测方法，包括：

步骤S11：获取训练样本图像。

步骤S12：利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强。

在具体的实施方式中，所述目标检测模型还包括特征提取网络、RPN网络、分类器和回归器；相应的，所述利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型，包括：将所述训练样本图像输入至所述特征提取网络，得到对应的样本特征图；利用所述RPN网络生成所述样本特征图对应的候选区域；将所述候选区域映射到所述样本特征图上；从所述候选区域中筛选出小目标区域；利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图；所述小目标区域特征图为所述小目标区域内的图像；将所述小目标增强特征图和大目标区域特征图输入至分类器和回归器，得到每个候选区域特征图对应的预测结果；其中，所述预测结果包括目标类别和目标位置；所述目标类别为所述分类器输出的结果；所述目标位置为所述回归器输出的结果；所述大目标区域特征图为大目标区域内的图像，所述大目标区域为所述候选区域中的大目标区域；将所述预测结果映射到初始的所述训练样本图像，利用非极大抑制方法得到对应的训练检测结果。

具体的，本实施例先将训练样本图像输入特征提取网络，如VGG16，GoogleNet，ResNet50，ResNet101等，利用共享特征提取网络生成对应的特征图；然后利用RPN网络生成候选区域，具体方法包括，利用特征图中每个像素点生成大小和尺度不同的锚点框，对锚点框进行分类预测每个框属于前景或背景和回归，得到候选区域；之后将候选区域映射到特征图上，对候选区域大小进行筛选，此时针对小目标候选框，将小目标候选区域的特征输入特征增强网络，对小目标区域进行特征增强处理得到增强后的特征图，例如，参见图2所示，图2为本申请公开的一种小目标区域特征图特征增强示意图。

其中，利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图，具体可以包括：步骤01：对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图；步骤02：对所述小目标高级特征图进行上采样处理；步骤03：对上采样处理后的所述小目标高级特征图进行重建，得到预设倍数的所述小目标高级特征图；继续执行所述步骤01至步骤03，直到所述步骤01至步骤03的执行次数达到预设次数，得到所述小目标增强特征图。本实施例利用所述特征提取网络的下采样倍数确定所述预设次数。也即，本实施例中，小目标区域特征图像经过预设数量个特征增强子网络的增强处理，在每个特征增强子网络中执行步骤01至步骤03，也即，预设数量等于预设次数。并且，对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图，包括：对所述小目标区域特征图进行残差结构处理，得到对应的小目标高级特征图。对所述小目标高级特征图进行上采样处理，包括：利用预设数量个卷积核对所述小目标高级特征图进行卷积操作，然后进行亚像素卷积操作，以完成所述上采样处理。

具体的，本申请实施例任一特征增强子网络可以先对小目标候选区域特征作进一步特征提取，得到更高级的特征图，然后对高级特征图进行上采样处理，并对经过上采样处理的高级特征图进行重建，即利用上采样处理得到的特征图，与输入该特征子网络的特征图进行融合，得到大小为输入该特征子网络特征图2倍的特征图。例如，参见图3所示，图3为一种具体的特征增强子网络处理流程图。小目标区域特征图经过n个特征增强子网络得到更高级的特征图，即得到小目标增强特征图。其中，n由基础特征提取网络中下采用倍数决定，如该实施例中的基础网络中下采样8倍，则n＝3。

其中，特征提取得到的高级特征图是输入当前特征增强子网络的特征图经过残差结构处理后得到的与其图像大小相同，有64个通道的特征图。参见图4所示，图4为本申请实施例公开的一种残差结构示意图。先对输入特征图即小目标区域特征图进行卷积操作，卷积结果使用ReLu函数进行非线性激活，再次进行卷积操作，然后将得到的结果与输入残差结构的特征图进行融合，完成残差结构处理，残差结构处理中的卷积操作均使用64个大小为3x3的卷积核。

参见图5所示，图5为本申请实施例公开的一种特征图上采样示意图。对小目标高级特征图进行上采样处理。具体的，可以使用256个大小为3x3的卷积核对得到的高级特征图做卷积操作，得到256个特征图，通过亚像素卷积操作，将其变为64个长宽各扩大一倍的特征图，使其分辨率提升一倍。

例如，参见图6所示，图6为本申请实施例公开的一种具体的目标检测模型训练流程图。将训练图片输入特征提取网络，生成特征图；利用RPN网络生成候选区域；将候选区域映射到特征图上，对候选区域大小进行筛选，此时针对小目标候选框，将小目标候选区域的特征输入特征增强网络,对小目标区域进行特征增强处理得到增强后的特征图；将RPN生成的大目标候选区域特征图及特征增强网络输出的小目标特征图送入分类器和回归器，分别预测特征图所属类别及每个框的坐标。

步骤S13：当获取到待检测图像，利用所述训练后模型输出对应的检测结果。

参见图7所示，本申请实施例公开了一种具体的目标检测方法，包括：

步骤S201：获取训练样本图像。

步骤S202：将所述训练样本图像输入至所述特征提取网络，得到对应的样本特征图。

步骤S203：利用所述RPN网络生成所述样本特征图对应的候选区域。

步骤S204：将所述候选区域映射到所述样本特征图上。

步骤S205：从所述候选区域中筛选出小目标区域。

步骤S206：利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图；所述小目标区域特征图为所述小目标区域内的图像。

步骤S207：将所述小目标增强特征图和大目标区域特征图输入至分类器和回归器，得到每个候选区域特征图对应的预测结果；其中，所述预测结果包括目标类别和目标位置；所述目标类别为所述分类器输出的结果；所述目标位置为所述回归器输出的结果；所述大目标区域特征图为大目标区域内的图像，所述大目标区域为所述候选区域中的大目标区域。

步骤S208：利用预先构建的目标损失函数计算所述目标检测模型的训练损失；所述训练损失包括增强损失、分类损失和回归损失。

其中，目标损失函数为L＝L_cls+λL_reg+μL_en；L为训练损失，L_cls为分类损失，L_reg为回归损失，L_en为增强损失，λ和μ分别为回归损失和增强损失对应的权重系数。

例如，本实施例采用三个特征增强子网络对小目标区域特征图进行特征增强，对应的增强损失函数为L_en＝L_χ2+αL_χ4+βL_χ8；α和β为权重系数，L_χ4，L_χ8分别为将小目标区域特征图放大2倍、4倍、8倍对应的损失，计算公式如下：

其中，

为小目标候选区域特征图对应在原始输入的训练样本图像中的第i行第j列的像素值；

为小目标候选区域特征图对应在原始输入的训练样本图像缩小2倍图像中的第i行第j列的像素值；

为小目标候选区域特征图对应在原始输入的训练样本图像缩小4倍图像中的第i行第j列的像素值；F_×2(Y^FM；Θ)_ij，F_×4(Y^FM；Θ)_ij，F_×8(Y^FM；Θ)_ij分别为第一级、第二级、第三级特征增强子网络输出的特征图的第i行第j列像素值，Θ为特征增强网络参数，Y^FM表示特征增强子网络对输入特征图的处理操作，M、N分别为输入的小目标区域特征图的长度和宽度。

参见图8所示，图8为本申请公开的一种特征增强网络以及特征增强损失计算示意图。

分类损失利用分类损失函数为SoftmaxLoss计算：

L_cls(p,u)＝-log p_u

其中，p_u为真实分类u对应的概率。

回归损失采用SmoothL1损失:

其中，t为模型预测框的位置参数，g为实际框的位置参数，K为训练样本图像的数量，k表示第k个训练样本图像。

步骤S209：将所述预测结果映射到初始的所述训练样本图像，利用非极大抑制方法得到对应的训练检测结果。

反复执行步骤S201至步骤S209对预先搭建的目标检测模型进行训练，得到训练后模型。

步骤S210：当获取到待检测图像，利用所述训练后模型输出对应的检测结果。

参见图9所示，本申请实施例公开了一种目标检测装置，包括：

训练样本获取模块11，用于获取训练样本图像。

检测模型训练模块12，用于利用所述训练样本图像对预先搭建的目标检测模型进行训练，得到训练后模型；其中，所述目标检测模型包括特征增强网络；所述特征增强网络用于在训练过程中对所述训练样本图像中的小目标区域图像进行特征增强；

检测结果输出模块13，用于当获取到待检测图像，利用所述训练后模型输出对应的检测结果。

其中，所述目标检测模型还包括特征提取网络、RPN网络、分类器和回归器；

相应的，检测模型训练模块12，包括：

特征提取模块，用于将所述训练样本图像输入至所述特征提取网络，得到对应的样本特征图。

候选区域生成模块，用于利用所述RPN网络生成所述样本特征图对应的候选区域。

候选区域映射模块，用于将所述候选区域映射到所述样本特征图上。

小目标区域筛选模块，用于从所述候选区域中筛选出小目标区域。

特征增强模块，用于利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图；所述小目标区域特征图为所述小目标区域内的图像。

预测结果获取模块，用于将所述小目标增强特征图和大目标区域特征图输入至分类器和回归器，得到每个候选区域特征图对应的预测结果。其中，所述预测结果包括目标类别和目标位置；所述目标类别为所述分类器输出的结果；所述目标位置为所述回归器输出的结果；所述大目标区域特征图为大目标区域内的图像，所述大目标区域为所述候选区域中的大目标区域；

训练检测结果获取模块，用于将所述预测结果映射到初始的所述训练样本图像，利用非极大抑制方法得到对应的训练检测结果。

所述特征增强模块，包括预设数量个特征增强子模块，任一所述特征增强子模块包括：

特征提取单元，用于对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图。

上采样处理单元，用于对所述小目标高级特征图进行上采样处理。

图像重建单元，用于对上采样处理后的所述小目标高级特征图进行重建，得到预设倍数的所述小目标高级特征图。

预设数量确定模块，用于利用所述特征提取网络的下采样倍数确定所述预设数量。

所述特征提取单元，具体用于对所述小目标区域特征图进行残差结构处理，得到对应的小目标高级特征图。

所述上采样处理单元，具体用于利用预设数量个卷积核对所述小目标高级特征图进行卷积操作，然后进行亚像素卷积操作，以完成所述上采样处理。

目标检测装置，还包括损失计算模块，用于利用预先构建的目标损失函数计算所述目标检测模型的训练损失；所述训练损失包括增强损失、分类损失和回归损失。

参见图10所示，本申请实施例公开了一种目标检测设备，包括处理器21和存储器22；其中，所述存储器22，用于保存计算机程序；所述处理器21，用于执行所述计算机程序，以实现前述实施例公开的目标检测方法。

关于上述目标检测方法的具体过程可以参考前述实施例中公开的相应内容，在此不再进行赘述。

参见图11所示，本申请实施例公开了一种电子终端20，包括前述实施例中公开的处理器21和存储器22。关于上述处理器21具体可以执行的步骤可以参考前述实施例中公开的相应内容，在此不再进行赘述。

进一步的，本实施例中的电子终端20，还可以具体包括电源23、通信接口24、输入输出接口25和通信总线26；其中，所述电源23用于为所述终端20上的各硬件设备提供工作电压；所述通信接口24能够为所述终端20创建与外界设备之间的数据传输通道，其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议，在此不对其进行具体限定；所述输入输出接口25，用于获取外界输入数据或向外界输出数据，其具体的接口类型可以根据具体应用需要进行选取，在此不进行具体限定。

进一步的，本申请实施例还公开了一种计算机可读存储介质，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现前述实施例公开的目标检测方法。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种目标检测方法、装置、设备及介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种目标检测方法，其特征在于，包括：

获取训练样本图像；

2.根据权利要求1所述的目标检测方法，其特征在于，所述目标检测模型还包括特征提取网络、RPN网络、分类器和回归器；

利用所述RPN网络生成所述样本特征图对应的候选区域；

将所述候选区域映射到所述样本特征图上；

从所述候选区域中筛选出小目标区域；

3.根据权利要求2所述的目标检测方法，其特征在于，所述利用所述特征增强网络对小目标区域特征图进行特征增强，得到对应的小目标增强特征图，包括：

步骤02：对所述小目标高级特征图进行上采样处理；

4.根据权利要求3所述的目标检测方法，其特征在于，还包括：

利用所述特征提取网络的下采样倍数确定所述预设次数。

5.根据权利要求3所述的目标检测方法，其特征在于，所述对所述小目标区域特征图进行特征提取，得到对应的小目标高级特征图，包括：

6.根据权利要求3所述的目标检测方法，其特征在于，所述对所述小目标高级特征图进行上采样处理，包括：

7.根据权利要求1至6任一项所述的目标检测方法，其特征在于，还包括：

8.一种目标检测装置，其特征在于，包括：

训练样本获取模块，用于获取训练样本图像；

9.一种目标检测设备，其特征在于，包括处理器和存储器；其中，

所述存储器，用于保存计算机程序；

所述处理器，用于执行所述计算机程序以实现如权利要求1至7任一项所述的目标检测方法。

10.一种计算机可读存储介质，其特征在于，用于保存计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的目标检测方法。