CN110490188A - 一种基于ssd网络改进型的目标物体快速检测方法 - Google Patents
一种基于ssd网络改进型的目标物体快速检测方法 Download PDFInfo
- Publication number
- CN110490188A CN110490188A CN201910589253.XA CN201910589253A CN110490188A CN 110490188 A CN110490188 A CN 110490188A CN 201910589253 A CN201910589253 A CN 201910589253A CN 110490188 A CN110490188 A CN 110490188A
- Authority
- CN
- China
- Prior art keywords
- network
- training
- detection
- ssd
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本发明涉及一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:1)改进型SSD网络搭建;2)获取图像数据集;3)网络训练与测试;4)目标检测。本发明设计科学合理,能够适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。
Description
技术领域
本发明属于计算机视觉的图像处理领域,涉及目标物体检测方法,尤其涉及一种基于SSD(Single Shot MultiBox Detector,SSD)网络改进型的目标物体快速检测方法。
背景技术
目标检测算法的发展分为两个阶段,一个是基于传统特征的解决方案,另一个是基于深度学习的算法。在2013年之前,基于传统特征提取优化检测方法是业界主流。自深度学习技术横空出世以来,在图像检测领域展现出强大的生命力。卷积神经网络是一种前馈神经网络,由一个或多个卷积层及顶端的全连接层组成,在大型图像处理领域有出色的表现。相比于其他深度前馈神经网络结构如全连接神经网络,卷积神经网络的参数更少,使其可以具有更深的深度,因而可以提取到图像中更深层次的高维特征。
基于卷积神经网络的目标检测方法分为两种。一种是以Faster R-CNN(FasterRegion OfConvolutional Neural Networks)为代表的双步目标检测方法,它的优点是检测精度高,但缺点是检测速度慢。另一种是以YOLO(You Only Look Once)、SSD(SingleShot MultiBox Detector)网络为代表的单步目标检测方法,它们的优点就是检测速度比双步检测方法类快。
SSD网络是当下最主要的单步目标检测方法之一,由Wei Liu于2016年提出。相比于传统的可变型部件模型算法(Deformable Parts Models,DPM),SSD网络检测算法在PASCAL VOC目标检测竞赛中将检测率提高了20%以上。它是由VGG(Visual GeometryGroup)特征提取网络和辅助检测网络组成。众所周知,VGG特征提取网络是为1000类目标分类设计,而SSD网络结构仅可以检测20类目标,因此SSD网络中存在大量冗余参数。另一方面,随着嵌入式计算的大力发展,对算法的效率——功耗与存储,提出了越来越高的要求。所以压缩SSD网络的中的冗余参数,提高SSD网络的计算效率有待解决。
通过对公开专利文献的检索,并未发现与本专利申请相同的公开专利文献。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于SSD网络改进型的目标物体快速检测方法,该方法适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。
本发明解决其技术问题是通过以下技术方案实现的:
一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(RectifiedLinearUnit)激活函数;
b)修改损失函数:改进型SSD网络采用焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值;
αt为[0,1]间的小数;
2)获取图像数据集:PASCAL VOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,并将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCAL VOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCAL VOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
1)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
本发明的优点和有益效果为:
1、本发明提出一种基于卷积神经网络的快速目标物体检测方法,引入1×1卷积核的分解卷积模型,对卷积网络进行压缩,进而减少网络参数,提高网络计算效率,可以有效提高目标物体图像检测的速度。
2、本发明设计科学合理,能够适用于对目标物进行快速的实时检测,不仅能够减少网络参数,提高网络计算效率,且与标准SSD网络相比具有检测精度高,速度快的优点。
附图说明
图1为实时目标物体检测示意图;
图2为分解卷积核示意图;
图3为分解卷积核内部示意图。
具体实施方式
下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。
一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:SSD网络中的VGG特征提取网络是将输入的特征图通过3×3标准卷积核进行卷积运算,得到新的输出,而改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(Rectified Linear Unit)激活函数;
b)修改损失函数:SSD网络的使用交叉熵损失函数,而改进型SSD网络将交叉熵损失函数替换为焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,
交叉熵(CE)损失函数为:
其中:y∈{-1,1}specifies theground-truthclass,p∈[0,1]是模型对于标签y=1的估计概率;
焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值,训练时将其设置为2;
αt为[0,1]间的小数,训练时将其设置为0.25;
γ和αt都是固定值,不参与训练,但是γ和αt的最优值是相互影响的,因此在评估准确度时需要把两者组合起来调节;
2)获取图像数据集:PASCAL VOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,其中总损失函数为SSD卷积神经网络网络的总损失函数,主要由两部分构成,即是位置误差损失与置信度误差损失的加权和:
其中位置误差的损失函数定义如下:
置信度误差损失函数定义如下:
其中:N表示先验框的正样本个数;
L(x,c,l,g)表示回归候选框数量;
Lconf(x,c)表示置信度误差损失;
Lloc(x,l,g)表示位置误差损失;
c表示置信度预测值;
表示指示参数;
表示第i个先验框与第j个真实框匹配;
α为权重,用于平衡两部分损失比重;
cx,cy,w,h表示候选框的四个顶点;
将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCAL VOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCAL VOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
4)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
输入数据方面,在预训练中学习率为0.001,动量为0.9,权重衰减为0.0005,批量大小为32;在正式训练时,作为输入的裁剪后的目标物体图像大小统一设置为300×300,以减少网络参数,降低训练计算量;网络超参数方面,每次训练的批大小设置为8,priorbox数量K设置为4,使用comv4_3,conv7,conv8_2,conv9_2,conv10_2,conv11_2来预测位置和置信度,并用目标物体图像训练集重新训练整个网络,学习率为0.001迭代40000次,然后使用0.0001和0.00001的学习率各迭代10000次;其余学习参数与预训练相同;权重使用浮点数格式代替二值格式,以使包含更多细节;采用数据扩增(DataAugmentation)可以提升SSD网络的性能,主要采用的技术有水平翻转(horizontal flip),随机裁剪加颜色扭曲(randomcrop&color distortion),随机采集块域(Randomly sample apatch)获取小目标训练样本。
尽管为说明目的公开了本发明的实施例和附图,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例和附图所公开的内容。
Claims (1)
1.一种基于SSD网络改进型目标物体快速检测方法,其特征在于:所述检测方法的步骤为:
1)改进型SSD网络搭建:SSD网络是由VGG特征提取网络与检测定位网络组合而成,对改进型网络的搭建包括两个步骤:
a)修改标准卷积核:改进型SSD网络中的VGG特征提取网络采用分解卷积核,分解卷积核将标准卷积核分解成两个部分:具有压缩功能的卷积核A及类似于标准卷积核B,卷积核A利用1×1的卷积操作将卷积层进行通道压缩,卷积核B将压缩后的特征图利用3×3卷积操作进行相邻单元特征提取,并输出一组新的特征图,同时将每一层1×1卷积核使用ReLU(RectifiedLinearUnit)激活函数;
b)修改损失函数:改进型SSD网络采用焦点损失函数,焦点损失函数可以使单步目标检测的精度得到改善,焦点损失函数被定义为:
FL(pt)=-αt(1-pt)γlog(pt)
其中:
pt为不同类别的分类概率;
γ为大于0的值;
αt为[0,1]间的小数;
2)获取图像数据集:PASCALVOC、COCO公开数据集为图像检测提供了一整套好的标注图像,它们均包含图像训练集和图像测试集;
3)网络训练与测试:网络利用随机梯度下降法进行训练,训练目标利用梯度下降法使总损失函数L(x,c,l,g)下降至收敛,并将整个网络分为两个部分,前半部分为使用分解卷积核的VGG特征提取网络,后半部分为检测定位网络,网络的训练由四个步骤构成:
i)使用COCO数据集对VGG特征提取网络进行预训练,初始化特征提取网络;
ii)利用训练好的VGG特征提取网络与检测定位网络组合形成改进型SSD网络,用PASCALVOC数据集中的图像训练集对改进型SSD网络进行训练;
iii)调整学习率等训练参数,使损失函数达到收敛;
iv)利用PASCALVOC数据集中的图像测试集,对训练好的改进型SSD网络进行测试,并记录模型准确率,选出效果最佳的模型作为训练后的改进型SSD网络模型;
4)目标检测:利用CCD图像传感器采集实时的目标物体图像,并将图像输入训练后的改进型SSD网络模型,最后对目标物体进行精确的检测定位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910589253.XA CN110490188A (zh) | 2019-07-02 | 2019-07-02 | 一种基于ssd网络改进型的目标物体快速检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910589253.XA CN110490188A (zh) | 2019-07-02 | 2019-07-02 | 一种基于ssd网络改进型的目标物体快速检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490188A true CN110490188A (zh) | 2019-11-22 |
Family
ID=68546571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910589253.XA Pending CN110490188A (zh) | 2019-07-02 | 2019-07-02 | 一种基于ssd网络改进型的目标物体快速检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490188A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079822A (zh) * | 2019-12-12 | 2020-04-28 | 哈尔滨市科佳通用机电股份有限公司 | 轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法 |
CN111832576A (zh) * | 2020-07-17 | 2020-10-27 | 济南浪潮高新科技投资发展有限公司 | 一种用于移动端的轻量级目标检测方法及系统 |
CN112364931A (zh) * | 2020-11-20 | 2021-02-12 | 长沙军民先进技术研究有限公司 | 基于元特征和权重调整的少样本目标检测方法及网络模型 |
CN112464841A (zh) * | 2020-12-04 | 2021-03-09 | 四川长虹电器股份有限公司 | 一种用于专用道路违规行驶车辆检测的方法、存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108288075A (zh) * | 2018-02-02 | 2018-07-17 | 沈阳工业大学 | 一种改进ssd的轻量化小目标检测方法 |
CN109086678A (zh) * | 2018-07-09 | 2018-12-25 | 天津大学 | 一种基于深度监督学习提取图像多级特征的行人检测方法 |
CN109376572A (zh) * | 2018-08-09 | 2019-02-22 | 同济大学 | 基于深度学习的交通视频中实时车辆检测与轨迹跟踪方法 |
CN109447066A (zh) * | 2018-10-18 | 2019-03-08 | 中国人民武装警察部队海警学院 | 一种快速精确的单阶段目标检测方法及装置 |
CN109766769A (zh) * | 2018-12-18 | 2019-05-17 | 四川大学 | 一种基于单目视觉与深度学习的道路目标检测识别方法 |
CN109840502A (zh) * | 2019-01-31 | 2019-06-04 | 深兰科技(上海)有限公司 | 一种基于ssd模型进行目标检测的方法及设备 |
-
2019
- 2019-07-02 CN CN201910589253.XA patent/CN110490188A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108288075A (zh) * | 2018-02-02 | 2018-07-17 | 沈阳工业大学 | 一种改进ssd的轻量化小目标检测方法 |
CN109086678A (zh) * | 2018-07-09 | 2018-12-25 | 天津大学 | 一种基于深度监督学习提取图像多级特征的行人检测方法 |
CN109376572A (zh) * | 2018-08-09 | 2019-02-22 | 同济大学 | 基于深度学习的交通视频中实时车辆检测与轨迹跟踪方法 |
CN109447066A (zh) * | 2018-10-18 | 2019-03-08 | 中国人民武装警察部队海警学院 | 一种快速精确的单阶段目标检测方法及装置 |
CN109766769A (zh) * | 2018-12-18 | 2019-05-17 | 四川大学 | 一种基于单目视觉与深度学习的道路目标检测识别方法 |
CN109840502A (zh) * | 2019-01-31 | 2019-06-04 | 深兰科技(上海)有限公司 | 一种基于ssd模型进行目标检测的方法及设备 |
Non-Patent Citations (7)
Title |
---|
ANDREW G.HOWARD 等: ""Mobilenets: Efficient convolutional neural networks for mobile vision applications"", 《HTTPS://ARXIV.ORG/PDF/1704.04861.PDF》 * |
JIANBO GUO等: ""Network Decoupling: From Regular to Depthwise Separable Convolutions"", 《HTTPS://ARXIV.ORG/PDF/1808.05517.PDF》 * |
XIANGYU ZHANG等: ""Shufflenet: An extremely efficient convolutional neural network for mobile devices"", 《HTTPS://ARXIV.ORG/PDF/1707.01083.PDF》 * |
余良凯: ""基于深度学习的机场场面目标检测"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
晋博: ""基于卷积神经网络的工业生产线零部件检测"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
王兆男: ""应用于嵌入式平台的深度学习目标检测算法研究"", 《万方数据企业知识服务平台》 * |
谢应强: ""基于深度卷积神经网络的人脸特征提取"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079822A (zh) * | 2019-12-12 | 2020-04-28 | 哈尔滨市科佳通用机电股份有限公司 | 轴箱橡胶垫中间橡胶与上、下层板错位故障图像识别方法 |
CN111832576A (zh) * | 2020-07-17 | 2020-10-27 | 济南浪潮高新科技投资发展有限公司 | 一种用于移动端的轻量级目标检测方法及系统 |
CN112364931A (zh) * | 2020-11-20 | 2021-02-12 | 长沙军民先进技术研究有限公司 | 基于元特征和权重调整的少样本目标检测方法及网络模型 |
CN112364931B (zh) * | 2020-11-20 | 2024-03-19 | 长沙军民先进技术研究有限公司 | 一种基于元特征和权重调整的少样本目标检测方法及网络系统 |
CN112464841A (zh) * | 2020-12-04 | 2021-03-09 | 四川长虹电器股份有限公司 | 一种用于专用道路违规行驶车辆检测的方法、存储介质 |
CN112464841B (zh) * | 2020-12-04 | 2022-08-19 | 四川长虹电器股份有限公司 | 一种用于专用道路违规行驶车辆检测的方法、存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490188A (zh) | 一种基于ssd网络改进型的目标物体快速检测方法 | |
CN110929607B (zh) | 一种城市建筑物施工进度的遥感识别方法和系统 | |
CN110533084A (zh) | 一种基于自注意力机制的多尺度目标检测方法 | |
CN110059558A (zh) | 一种基于改进ssd网络的果园障碍物实时检测方法 | |
CN110543878A (zh) | 一种基于神经网络的指针仪表读数识别方法 | |
CN107688808A (zh) | 一种快速的自然场景文本检测方法 | |
CN110322453A (zh) | 基于位置注意力和辅助网络的3d点云语义分割方法 | |
CN109325960A (zh) | 一种红外云图气旋分析方法及分析系统 | |
Ding et al. | Alexnet feature extraction and multi-kernel learning for objectoriented classification | |
CN110751195B (zh) | 一种基于改进YOLOv3的细粒度图像分类方法 | |
CN113516124A (zh) | 基于计算机视觉技术的电能表用电信息识别算法 | |
CN110135248A (zh) | 一种基于深度学习的自然场景文本检测方法 | |
CN105405138A (zh) | 基于显著性检测的水面目标跟踪方法 | |
Liu et al. | A shadow detection algorithm based on multiscale spatial attention mechanism for aerial remote sensing images | |
Wang et al. | A fabric defect detection system based improved yolov5 detector | |
CN109344769A (zh) | 一种基于遥感影像的光伏电站检测方法及系统 | |
CN110321869A (zh) | 基于多尺度融合网络的人员检测和提取方法 | |
CN113902792A (zh) | 基于改进RetinaNet网络的建筑物高度检测方法、系统和电子设备 | |
Imran et al. | Image-Based Automatic Energy Meter Reading Using Deep Learning | |
CN114359786A (zh) | 一种基于改进时空卷积网络的唇语识别方法 | |
Yu et al. | Building extraction from remote sensing image based on improved segnet neural network and image pyramid | |
Liu et al. | Remote sensing image object detection based on improved SSD | |
CN110097629A (zh) | 一种基于草图检索的云景构建方法 | |
Yang et al. | Green litchi automatic learning based on YOLOX-S, Faster-RCNN, SSD deep learning algorithm | |
He et al. | Research on underwater object detection of improved YOLOv7 model based on attention mechanism: The underwater detection module YOLOv7-C |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191122 |
|
RJ01 | Rejection of invention patent application after publication |