CN110490188A - 一种基于ssd网络改进型的目标物体快速检测方法 - Google Patents

一种基于ssd网络改进型的目标物体快速检测方法 Download PDF

Info

Publication number
CN110490188A
CN110490188A CN201910589253.XA CN201910589253A CN110490188A CN 110490188 A CN110490188 A CN 110490188A CN 201910589253 A CN201910589253 A CN 201910589253A CN 110490188 A CN110490188 A CN 110490188A
Authority
CN
China
Prior art keywords
network
training
detection
ssd
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910589253.XA
Other languages
English (en)
Inventor
史再峰
叶鹏
曹清洁
罗韬
唐锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201910589253.XA priority Critical patent/CN110490188A/zh
Publication of CN110490188A publication Critical patent/CN110490188A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明涉及一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:1)改进型SSD网络搭建;2)获取图像数据集;3)网络训练与测试;4)目标检测。本发明设计科学合理,能够适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。

Description

一种基于SSD网络改进型的目标物体快速检测方法
技术领域
本发明属于计算机视觉的图像处理领域,涉及目标物体检测方法,尤其涉及一种基于SSD(Single Shot MultiBox Detector,SSD)网络改进型的目标物体快速检测方法。
背景技术
目标检测算法的发展分为两个阶段,一个是基于传统特征的解决方案,另一个是基于深度学习的算法。在2013年之前,基于传统特征提取优化检测方法是业界主流。自深度学习技术横空出世以来,在图像检测领域展现出强大的生命力。卷积神经网络是一种前馈神经网络,由一个或多个卷积层及顶端的全连接层组成,在大型图像处理领域有出色的表现。相比于其他深度前馈神经网络结构如全连接神经网络,卷积神经网络的参数更少,使其可以具有更深的深度,因而可以提取到图像中更深层次的高维特征。
基于卷积神经网络的目标检测方法分为两种。一种是以Faster R-CNN(FasterRegion OfConvolutional Neural Networks)为代表的双步目标检测方法,它的优点是检测精度高,但缺点是检测速度慢。另一种是以YOLO(You Only Look Once)、SSD(SingleShot MultiBox Detector)网络为代表的单步目标检测方法,它们的优点就是检测速度比双步检测方法类快。
SSD网络是当下最主要的单步目标检测方法之一,由Wei Liu于2016年提出。相比于传统的可变型部件模型算法(Deformable Parts Models,DPM),SSD网络检测算法在PASCAL VOC目标检测竞赛中将检测率提高了20%以上。它是由VGG(Visual GeometryGroup)特征提取网络和辅助检测网络组成。众所周知,VGG特征提取网络是为1000类目标分类设计,而SSD网络结构仅可以检测20类目标,因此SSD网络中存在大量冗余参数。另一方面,随着嵌入式计算的大力发展,对算法的效率——功耗与存储,提出了越来越高的要求。所以压缩SSD网络的中的冗余参数,提高SSD网络的计算效率有待解决。
通过对公开专利文献的检索,并未发现与本专利申请相同的公开专利文献。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于SSD网络改进型的目标物体快速检测方法,该方法适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。
本发明解决其技术问题是通过以下技术方案实现的:
一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(RectifiedLinearUnit)激活函数;
b)修改损失函数:改进型SSD网络采用焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值;
αt为[0,1]间的小数;
2)获取图像数据集:PASCAL VOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,并将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCAL VOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCAL VOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
1)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
本发明的优点和有益效果为:
1、本发明提出一种基于卷积神经网络的快速目标物体检测方法,引入1×1卷积核的分解卷积模型,对卷积网络进行压缩,进而减少网络参数,提高网络计算效率,可以有效提高目标物体图像检测的速度。
2、本发明设计科学合理,能够适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。
附图说明
图1为实时目标物体检测示意图;
图2为分解卷积核示意图;
图3为分解卷积核内部示意图。
具体实施方式
下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:SSD网络中的VGG特征提取网络是将输入的特征图通过3×3标准卷积核进行卷积运算,得到新的输出,而改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(Rectified Linear Unit)激活函数;
b)修改损失函数:SSD网络的使用交叉熵损失函数,而改进型SSD网络将交叉熵损失函数替换为焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,
交叉熵(CE)损失函数为:
其中:y∈{-1,1}specifies theground-truthclass,p∈[0,1]是模型对于标签y=1的估计概率;
焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值,训练时将其设置为2;
αt为[0,1]间的小数,训练时将其设置为0.25;
γ和αt都是固定值,不参与训练,但是γ和αt的最优值是相互影响的,因此在评估准确度时需要把两者组合起来调节;
2)获取图像数据集:PASCAL VOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,其中总损失函数为SSD卷积神经网络网络的总损失函数,主要由两部分构成,即是位置误差损失与置信度误差损失的加权和:
其中位置误差的损失函数定义如下:
置信度误差损失函数定义如下:
其中:N表示先验框的正样本个数;
L(x,c,l,g)表示回归候选框数量;
Lconf(x,c)表示置信度误差损失;
Lloc(x,l,g)表示位置误差损失;
c表示置信度预测值;
表示指示参数;
表示第i个先验框与第j个真实框匹配;
α为权重,用于平衡两部分损失比重;
cx,cy,w,h表示候选框的四个顶点;
将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCAL VOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCAL VOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
4)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
输入数据方面,在预训练中学习率为0.001,动量为0.9,权重衰减为0.0005,批量大小为32;在正式训练时,作为输入的裁剪后的目标物体图像大小统一设置为300×300,以减少网络参数,降低训练计算量;网络超参数方面,每次训练的批大小设置为8,priorbox数量K设置为4,使用comv4_3,conv7,conv8_2,conv9_2,conv10_2,conv11_2来预测位置和置信度,并用目标物体图像训练集重新训练整个网络,学习率为0.001迭代40000次,然后使用0.0001和0.00001的学习率各迭代10000次;其余学习参数与预训练相同;权重使用浮点数格式代替二值格式,以使包含更多细节;采用数据扩增(DataAugmentation)可以提升SSD网络的性能,主要采用的技术有水平翻转(horizontal flip),随机裁剪加颜色扭曲(randomcrop&color distortion),随机采集块域(Randomly sample apatch)获取小目标训练样本。
尽管为说明目的公开了本发明的实施例和附图,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例和附图所公开的内容。

Claims (1)

1.一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(RectifiedLinearUnit)激活函数;
b)修改损失函数:改进型SSD网络采用焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值;
αt为[0,1]间的小数;
2)获取图像数据集:PASCALVOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,并将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCALVOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCALVOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
4)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
CN201910589253.XA 2019-07-02 2019-07-02 一种基于ssd网络改进型的目标物体快速检测方法 Pending CN110490188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910589253.XA CN110490188A (zh) 2019-07-02 2019-07-02 一种基于ssd网络改进型的目标物体快速检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910589253.XA CN110490188A (zh) 2019-07-02 2019-07-02 一种基于ssd网络改进型的目标物体快速检测方法

Publications (1)

Publication Number Publication Date
CN110490188A true CN110490188A (zh) 2019-11-22

Family

ID=68546571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910589253.XA Pending CN110490188A (zh) 2019-07-02 2019-07-02 一种基于ssd网络改进型的目标物体快速检测方法

Country Status (1)

Country Link
CN (1) CN110490188A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079822A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法
CN111832576A (zh) * 2020-07-17 2020-10-27 济南浪潮高新科技投资发展有限公司 一种用于移动端的轻量级目标检测方法及系统
CN112364931A (zh) * 2020-11-20 2021-02-12 长沙军民先进技术研究有限公司 基于元特征和权重调整的少样本目标检测方法及网络模型
CN112464841A (zh) * 2020-12-04 2021-03-09 四川长虹电器股份有限公司 一种用于专用道路违规行驶车辆检测的方法、存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108288075A (zh) * 2018-02-02 2018-07-17 沈阳工业大学 一种改进ssd的轻量化小目标检测方法
CN109086678A (zh) * 2018-07-09 2018-12-25 天津大学 一种基于深度监督学习提取图像多级特征的行人检测方法
CN109376572A (zh) * 2018-08-09 2019-02-22 同济大学 基于深度学习的交通视频中实时车辆检测与轨迹跟踪方法
CN109447066A (zh) * 2018-10-18 2019-03-08 中国人民武装警察部队海警学院 一种快速精确的单阶段目标检测方法及装置
CN109766769A (zh) * 2018-12-18 2019-05-17 四川大学 一种基于单目视觉与深度学习的道路目标检测识别方法
CN109840502A (zh) * 2019-01-31 2019-06-04 深兰科技(上海)有限公司 一种基于ssd模型进行目标检测的方法及设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108288075A (zh) * 2018-02-02 2018-07-17 沈阳工业大学 一种改进ssd的轻量化小目标检测方法
CN109086678A (zh) * 2018-07-09 2018-12-25 天津大学 一种基于深度监督学习提取图像多级特征的行人检测方法
CN109376572A (zh) * 2018-08-09 2019-02-22 同济大学 基于深度学习的交通视频中实时车辆检测与轨迹跟踪方法
CN109447066A (zh) * 2018-10-18 2019-03-08 中国人民武装警察部队海警学院 一种快速精确的单阶段目标检测方法及装置
CN109766769A (zh) * 2018-12-18 2019-05-17 四川大学 一种基于单目视觉与深度学习的道路目标检测识别方法
CN109840502A (zh) * 2019-01-31 2019-06-04 深兰科技(上海)有限公司 一种基于ssd模型进行目标检测的方法及设备

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
ANDREW G.HOWARD 等: ""Mobilenets: Efficient convolutional neural networks for mobile vision applications"", 《HTTPS://ARXIV.ORG/PDF/1704.04861.PDF》 *
JIANBO GUO等: ""Network Decoupling: From Regular to Depthwise Separable Convolutions"", 《HTTPS://ARXIV.ORG/PDF/1808.05517.PDF》 *
XIANGYU ZHANG等: ""Shufflenet: An extremely efficient convolutional neural network for mobile devices"", 《HTTPS://ARXIV.ORG/PDF/1707.01083.PDF》 *
余良凯: ""基于深度学习的机场场面目标检测"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
晋博: ""基于卷积神经网络的工业生产线零部件检测"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
王兆男: ""应用于嵌入式平台的深度学习目标检测算法研究"", 《万方数据企业知识服务平台》 *
谢应强: ""基于深度卷积神经网络的人脸特征提取"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079822A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法
CN111832576A (zh) * 2020-07-17 2020-10-27 济南浪潮高新科技投资发展有限公司 一种用于移动端的轻量级目标检测方法及系统
CN112364931A (zh) * 2020-11-20 2021-02-12 长沙军民先进技术研究有限公司 基于元特征和权重调整的少样本目标检测方法及网络模型
CN112364931B (zh) * 2020-11-20 2024-03-19 长沙军民先进技术研究有限公司 一种基于元特征和权重调整的少样本目标检测方法及网络系统
CN112464841A (zh) * 2020-12-04 2021-03-09 四川长虹电器股份有限公司 一种用于专用道路违规行驶车辆检测的方法、存储介质
CN112464841B (zh) * 2020-12-04 2022-08-19 四川长虹电器股份有限公司 一种用于专用道路违规行驶车辆检测的方法、存储介质

Similar Documents

Publication Publication Date Title
CN110490188A (zh) 一种基于ssd网络改进型的目标物体快速检测方法
CN110929607B (zh) 一种城市建筑物施工进度的遥感识别方法和系统
CN110533084A (zh) 一种基于自注意力机制的多尺度目标检测方法
CN110059558A (zh) 一种基于改进ssd网络的果园障碍物实时检测方法
CN110543878A (zh) 一种基于神经网络的指针仪表读数识别方法
CN107688808A (zh) 一种快速的自然场景文本检测方法
CN110322453A (zh) 基于位置注意力和辅助网络的3d点云语义分割方法
CN109325960A (zh) 一种红外云图气旋分析方法及分析系统
Ding et al. Alexnet feature extraction and multi-kernel learning for objectoriented classification
CN110751195B (zh) 一种基于改进YOLOv3的细粒度图像分类方法
CN113516124A (zh) 基于计算机视觉技术的电能表用电信息识别算法
CN110135248A (zh) 一种基于深度学习的自然场景文本检测方法
CN105405138A (zh) 基于显著性检测的水面目标跟踪方法
Liu et al. A shadow detection algorithm based on multiscale spatial attention mechanism for aerial remote sensing images
Wang et al. A fabric defect detection system based improved yolov5 detector
CN109344769A (zh) 一种基于遥感影像的光伏电站检测方法及系统
CN110321869A (zh) 基于多尺度融合网络的人员检测和提取方法
CN113902792A (zh) 基于改进RetinaNet网络的建筑物高度检测方法、系统和电子设备
Imran et al. Image-Based Automatic Energy Meter Reading Using Deep Learning
CN114359786A (zh) 一种基于改进时空卷积网络的唇语识别方法
Yu et al. Building extraction from remote sensing image based on improved segnet neural network and image pyramid
Liu et al. Remote sensing image object detection based on improved SSD
CN110097629A (zh) 一种基于草图检索的云景构建方法
Yang et al. Green litchi automatic learning based on YOLOX-S, Faster-RCNN, SSD deep learning algorithm
He et al. Research on underwater object detection of improved YOLOv7 model based on attention mechanism: The underwater detection module YOLOv7-C

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191122

RJ01 Rejection of invention patent application after publication