CN110490188A

CN110490188A - 一种基于ssd网络改进型的目标物体快速检测方法

Info

Publication number: CN110490188A
Application number: CN201910589253.XA
Authority: CN
Inventors: 史再峰; 叶鹏; 曹清洁; 罗韬; 唐锐
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-07-02
Filing date: 2019-07-02
Publication date: 2019-11-22

Abstract

本发明涉及一种基于SSD网络改进型目标物体快速检测方法，其特征在于：所述检测方法的步骤为：1)改进型SSD网络搭建；2)获取图像数据集；3)网络训练与测试；4)目标检测。本发明设计科学合理，能够适用于对目标物进行快速的实时检测，不仅能够减少网络参数，提高网络计算效率，且与标准SSD网络相比具有检测精度高，速度快的优点。

Description

一种基于SSD网络改进型的目标物体快速检测方法

技术领域

本发明属于计算机视觉的图像处理领域，涉及目标物体检测方法，尤其涉及一种基于SSD(Single Shot MultiBox Detector，SSD)网络改进型的目标物体快速检测方法。

背景技术

目标检测算法的发展分为两个阶段，一个是基于传统特征的解决方案，另一个是基于深度学习的算法。在2013年之前，基于传统特征提取优化检测方法是业界主流。自深度学习技术横空出世以来，在图像检测领域展现出强大的生命力。卷积神经网络是一种前馈神经网络，由一个或多个卷积层及顶端的全连接层组成，在大型图像处理领域有出色的表现。相比于其他深度前馈神经网络结构如全连接神经网络，卷积神经网络的参数更少，使其可以具有更深的深度，因而可以提取到图像中更深层次的高维特征。

基于卷积神经网络的目标检测方法分为两种。一种是以Faster R-CNN(FasterRegion OfConvolutional Neural Networks)为代表的双步目标检测方法，它的优点是检测精度高，但缺点是检测速度慢。另一种是以YOLO(You Only Look Once)、SSD(SingleShot MultiBox Detector)网络为代表的单步目标检测方法，它们的优点就是检测速度比双步检测方法类快。

SSD网络是当下最主要的单步目标检测方法之一，由Wei Liu于2016年提出。相比于传统的可变型部件模型算法(Deformable Parts Models,DPM)，SSD网络检测算法在PASCAL VOC目标检测竞赛中将检测率提高了20％以上。它是由VGG(Visual GeometryGroup)特征提取网络和辅助检测网络组成。众所周知，VGG特征提取网络是为1000类目标分类设计，而SSD网络结构仅可以检测20类目标，因此SSD网络中存在大量冗余参数。另一方面，随着嵌入式计算的大力发展，对算法的效率——功耗与存储，提出了越来越高的要求。所以压缩SSD网络的中的冗余参数，提高SSD网络的计算效率有待解决。

通过对公开专利文献的检索，并未发现与本专利申请相同的公开专利文献。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于SSD网络改进型的目标物体快速检测方法，该方法适用于对目标物进行快速的实时检测，不仅能够减少网络参数，提高网络计算效率，且与标准SSD网络相比具有检测精度高，速度快的优点。

本发明解决其技术问题是通过以下技术方案实现的：

一种基于SSD网络改进型目标物体快速检测方法，其特征在于：所述检测方法的步骤为：

1)改进型SSD网络搭建：SSD网络是由VGG特征提取网络与检测定位网络组合而成，对改进型网络的搭建包括两个步骤：

a)修改标准卷积核：改进型SSD网络中的VGG特征提取网络采用分解卷积核，分解卷积核将标准卷积核分解成两个部分：具有压缩功能的卷积核A及类似于标准卷积核B，卷积核A利用1×1的卷积操作将卷积层进行通道压缩，卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取，并输出一组新的特征图，同时将每一层1×1卷积核使用ReLU(RectifiedLinearUnit)激活函数；

b)修改损失函数：改进型SSD网络采用焦点损失函数，焦点损失函数可以使单步目标检测的精度得到改善，焦点损失函数被定义为：

FL(p_t)＝-α_t(1-p_t)^γlog(p_t)

其中：

p_t为不同类别的分类概率；

γ为大于0的值；

α_t为[0，1]间的小数；

2)获取图像数据集：PASCAL VOC、COCO公开数据集为图像检测提供了一整套好的标注图像，它们均包含图像训练集和图像测试集；

3)网络训练与测试：网络利用随机梯度下降法进行训练，训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛，并将整个网络分为两个部分，前半部分为使用分解卷积核的VGG特征提取网络，后半部分为检测定位网络，网络的训练由四个步骤构成：

i)使用COCO数据集对VGG特征提取网络进行预训练，初始化特征提取网络；

ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络，用PASCAL VOC数据集中的图像训练集对改进型SSD网络进行训练；

iii)调整学习率等训练参数，使损失函数达到收敛；

iv)利用PASCAL VOC数据集中的图像测试集，对训练好的改进型SSD网络进行测试，并记录模型准确率，选出效果最佳的模型作为训练后的改进型SSD网络模型；

1)目标检测：利用CCD图像传感器采集实时的目标物体图像，并将图像输入训练后的改进型SSD网络模型，最后对目标物体进行精确的检测定位。

本发明的优点和有益效果为：

1、本发明提出一种基于卷积神经网络的快速目标物体检测方法，引入1×1卷积核的分解卷积模型，对卷积网络进行压缩，进而减少网络参数，提高网络计算效率，可以有效提高目标物体图像检测的速度。

2、本发明设计科学合理，能够适用于对目标物进行快速的实时检测，不仅能够减少网络参数，提高网络计算效率，且与标准SSD网络相比具有检测精度高，速度快的优点。

附图说明

图1为实时目标物体检测示意图；

图2为分解卷积核示意图；

图3为分解卷积核内部示意图。

具体实施方式

下面通过具体实施例对本发明作进一步详述，以下实施例只是描述性的，不是限定性的，不能以此限定本发明的保护范围。

a)修改标准卷积核：SSD网络中的VGG特征提取网络是将输入的特征图通过3×3标准卷积核进行卷积运算，得到新的输出，而改进型SSD网络中的VGG特征提取网络采用分解卷积核，分解卷积核将标准卷积核分解成两个部分：具有压缩功能的卷积核A及类似于标准卷积核B，卷积核A利用1×1的卷积操作将卷积层进行通道压缩，卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取，并输出一组新的特征图，同时将每一层1×1卷积核使用ReLU(Rectified Linear Unit)激活函数；

b)修改损失函数：SSD网络的使用交叉熵损失函数，而改进型SSD网络将交叉熵损失函数替换为焦点损失函数，焦点损失函数可以使单步目标检测的精度得到改善，

交叉熵(CE)损失函数为：

其中：y∈{-1,1}specifies theground-truthclass，p∈[0,1]是模型对于标签y＝1的估计概率；

焦点损失函数被定义为：

FL(p_t)＝-α_t(1-p_t)^γlog(p_t)

其中：

p_t为不同类别的分类概率；

γ为大于0的值，训练时将其设置为2；

α_t为[0，1]间的小数，训练时将其设置为0.25；

γ和α_t都是固定值，不参与训练，但是γ和α_t的最优值是相互影响的，因此在评估准确度时需要把两者组合起来调节；

3)网络训练与测试：网络利用随机梯度下降法进行训练，训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛，其中总损失函数为SSD卷积神经网络网络的总损失函数，主要由两部分构成，即是位置误差损失与置信度误差损失的加权和：

其中位置误差的损失函数定义如下：

置信度误差损失函数定义如下：

其中：N表示先验框的正样本个数；

L(x,c,l,g)表示回归候选框数量；

L_conf(x,c)表示置信度误差损失；

L_loc(x,l,g)表示位置误差损失；

c表示置信度预测值；

表示指示参数；

表示第i个先验框与第j个真实框匹配；

α为权重，用于平衡两部分损失比重；

cx,cy,w,h表示候选框的四个顶点；

将整个网络分为两个部分，前半部分为使用分解卷积核的VGG特征提取网络，后半部分为检测定位网络，网络的训练由四个步骤构成：

iii)调整学习率等训练参数，使损失函数达到收敛；

4)目标检测：利用CCD图像传感器采集实时的目标物体图像，并将图像输入训练后的改进型SSD网络模型，最后对目标物体进行精确的检测定位。

输入数据方面，在预训练中学习率为0.001，动量为0.9，权重衰减为0.0005，批量大小为32；在正式训练时，作为输入的裁剪后的目标物体图像大小统一设置为300×300，以减少网络参数，降低训练计算量；网络超参数方面，每次训练的批大小设置为8，priorbox数量K设置为4，使用comv4_3，conv7，conv8_2，conv9_2，conv10_2，conv11_2来预测位置和置信度，并用目标物体图像训练集重新训练整个网络，学习率为0.001迭代40000次，然后使用0.0001和0.00001的学习率各迭代10000次；其余学习参数与预训练相同；权重使用浮点数格式代替二值格式，以使包含更多细节；采用数据扩增(DataAugmentation)可以提升SSD网络的性能，主要采用的技术有水平翻转(horizontal flip)，随机裁剪加颜色扭曲(randomcrop&color distortion)，随机采集块域(Randomly sample apatch)获取小目标训练样本。

尽管为说明目的公开了本发明的实施例和附图，但是本领域的技术人员可以理解：在不脱离本发明及所附权利要求的精神和范围内，各种替换、变化和修改都是可能的，因此，本发明的范围不局限于实施例和附图所公开的内容。

Claims

1.一种基于SSD网络改进型目标物体快速检测方法，其特征在于：所述检测方法的步骤为：

FL(p_t)＝-α_t(1-p_t)^γlog(p_t)

其中：

p_t为不同类别的分类概率；

γ为大于0的值；

α_t为[0，1]间的小数；

2)获取图像数据集：PASCALVOC、COCO公开数据集为图像检测提供了一整套好的标注图像，它们均包含图像训练集和图像测试集；

ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络，用PASCALVOC数据集中的图像训练集对改进型SSD网络进行训练；

iii)调整学习率等训练参数，使损失函数达到收敛；

iv)利用PASCALVOC数据集中的图像测试集，对训练好的改进型SSD网络进行测试，并记录模型准确率，选出效果最佳的模型作为训练后的改进型SSD网络模型；