CN112149533A - 一种基于改进ssd模型的目标检测方法 - Google Patents

一种基于改进ssd模型的目标检测方法 Download PDF

Info

Publication number
CN112149533A
CN112149533A CN202010945055.5A CN202010945055A CN112149533A CN 112149533 A CN112149533 A CN 112149533A CN 202010945055 A CN202010945055 A CN 202010945055A CN 112149533 A CN112149533 A CN 112149533A
Authority
CN
China
Prior art keywords
layer
ssd model
improved
characteristic diagram
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010945055.5A
Other languages
English (en)
Inventor
韩清鹏
李明山
王道累
朱瑞
袁斌霞
李超
张天宇
孙嘉珺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University of Electric Power
Shanghai Electric Power University
University of Shanghai for Science and Technology
Original Assignee
Shanghai Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Electric Power University filed Critical Shanghai Electric Power University
Priority to CN202010945055.5A priority Critical patent/CN112149533A/zh
Publication of CN112149533A publication Critical patent/CN112149533A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4023Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于改进SSD模型的目标检测方法,包括以下步骤:建立图像集,并对图像集中的图像进行预处理;构建改进SSD模型,改进SSD模型在标准SSD模型上加入分支网络模块,分支网络模块对标准SSD模型进行特征融合;将图像集输入改进SSD模型,对改进SSD模型进行训练;将待检测图像输入到训练好的改进SSD模型检测。与现有技术相比,本发明采用分支网络模块对不同下采样阶段的特征图进行融合,使SSD对不同尺度安全帽检测的平均精度均值都得到提升,采用更先进的分类损失函数,加强对难样例的检测准确度,调整优化模型参数,增加小目标检测过程中的正例数目并进一步降低漏检率,提高检测器的准确度,检测速度更快。

Description

一种基于改进SSD模型的目标检测方法
技术领域
本发明涉及图像检测领域,尤其是涉及一种基于改进SSD模型的目标检测方法。
背景技术
安全帽佩戴能够减轻因坠落物对施工人员头部造成的损害,保护施工人员的人身安全,佩戴安全帽是安全施工的重要一环。由于监控拍摄距离限制,工人的头部在画面中尺度普遍偏小,这种小目标为安全帽检测带来很大工作难度,改善安全帽检测准度的关键是如何对争抢目标检测算法对小目标检测的准度。
现有技术中,大部分基于SSD的安全帽检测方法多为对参数微调,难以解决SSD对小目标检测能力弱的缺陷。中国专利CN202010082338.1公开了一种电力员工安全帽佩戴自动识别方法,该方法将行人检测模型得到的行人上半身图像输入SSD模型中,该方法通过二阶段的方法提取特征,相较于端到端的方法检测速度低下,且并未能实质提升SSD对小尺度安全帽目标检测的能力。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于改进SSD模型的目标检测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于改进SSD模型的目标检测方法,包括以下步骤:
S1:建立图像集,并对图像集中的图像进行预处理,所述的图像集内包括施工现场照片;
S2:构建改进SSD模型,所述的改进SSD模型在标准SSD模型上加入分支网络模块,所述的分支网络模块对标准SSD模型的Fc7层、Conv8_2层和Conv9_2层的特征图进行特征融合处理;
S3:将图像集输入改进SSD模型,对改进SSD模型进行训练,获取训练好的改进SSD模型;
S4:将待检测图像输入到训练好的改进SSD模型,输出图像的安全帽检测结果。
优选地,所述的图像集内包括施工现场图像,所述的改进SSD模型以安全帽为目标对施工现场图像进行检测。
优选地,所述的改进SSD模型VGG-16、extras层、分支网络模块和检测头,所述的VGG16全连接层中的Fc6层和Fc7层分别替换为3x3卷积层和1x1卷积层,所述的extras层包括Conv8_2层、Conv9_2层、Conv10_2层和Conv11_2层,
所述的Fc7层、Conv10_2层和Conv11_2层的特征图送入检测头,所述的分支网络模块对Fc7层、Conv8_2层、Conv9_2层的特征图进行处理,将处理后的特征图送入检测头。
优选地,所述的分支网络模块包括三个1x1卷积滤波器、三个3x3卷积滤波器、第一上采样层和第二上采样层,
所述的1x1卷积滤波器对Conv9_2层的特征图进行平滑获取特征图P1,并将特征图P1送入第一上采样层进行上采样,所述的1x1卷积滤波器对Conv8_2层的特征图进行平滑,平滑后的Conv8_2层的特征图与第一上采样层的输出进行融合获取特征图P2,并将特征图P2送入第二上采样层进行上采样,所述的1x1卷积滤波器对Fc7层的特征图进行平滑,平滑后的Fc7层特征图与第二上采样层的输出进行融合获取特征图P3,
所述的特征图P1、特征图P2和特征图P3分别通过3x3卷积滤波器平滑后送入检测头。
优选地,所述的第一上采样层对特征图P1进行最邻近上采样插值处理,所述的第二上采样层对特征图P2进行最邻近上采样插值处理。
优选地,所述的检测头包括多个1x1卷积层,所述的检测头对送入的特征图进行卷积后分别进行边框回归与分类,获取预测框的坐标编码和分类得分。
优选地,所述的步骤S3具体包括:
S31:设置改进SSD模型的初始参数;
S32:将图像集中的图像输入到改进SSD模型;
S33:改进SSD模型输出预测框的坐标编码和分类得分;
S34:计算改进SSD模型的总损失并更新SSD模型的参数,判断参数是否收敛,若是,完成训练,否则返回步骤S32。
优选地,改进SSD模型的总损失函数为:
Figure BDA0002675037470000031
其中,N为匹配的默认框个数,Lconf(q,c)为分类损失,β为总损失参数,q={1,0},代表某个预测框是否匹配真实框,Lloc(q,l,g)为位置损失,l为预测框,c为标签分类,g为真实框。
优选地,所述的分类损失为:
Figure BDA0002675037470000032
其中,
Figure BDA0002675037470000033
为改进损失函数,α为分类损失权重调整参数,用于对各类分类损失权重调整,
Figure BDA0002675037470000034
为第
Figure BDA0002675037470000035
类物体检测头的输出经过SoftMax函数处理后得到的logit值,γ为分类损失参数。
优选地,所述的
Figure BDA0002675037470000036
的计算公式为:
Figure BDA0002675037470000037
其中,
Figure BDA0002675037470000038
为检测头针对预测框中目标属于各类别分别输出的信号值。
优选地,所述的位置损失为:
Figure BDA0002675037470000039
其中,Pos为样本中的正例,cx、cy为预测框的中心点坐标,w为预测框的宽,h为预测框的高,
Figure BDA00026750374700000310
为类别为
Figure BDA00026750374700000311
的第i个预测框与第j个真实框是否匹配,
Figure BDA00026750374700000312
为预测框,
Figure BDA00026750374700000313
为真实框,m为产生损失的特征图对应的序号。
与现有技术相比,本发明具有如下优点:
(1)采用分支网络模块对不同下采样阶段的特征图进行融合,目标因下采样丢失的特征补充,使SSD对不同尺度安全帽检测的平均精度均值都得到提升,对小目标改善尤为明显;
(2)对SSD对安全帽检测的默认框参数进行调整,通过设置更多小尺度的先验框进行边框回归,增加小目标检测过程中的正例数目并进一步降低漏检率;
(3)采用更先进的损失函数Focal Loss,在模型训练过程中,Focal Loss通过对检测过程中难以区分的目标分类损失赋予更大的损失,同时降低易于区分的目标分类损失,让训练阶段模型专注学习如何区分难以正确分类的目标,提高模型对难样例正确分类的能力,提高检测的准确度;
(4)与其他将安全帽检测划分为二阶段的方法不同,本发明在端到端的一阶段检测器基础上改进,图像输入、特征提取、目标检测都交由模型一次性完成,安全帽检测速度更快。
附图说明
图1为本发明的流程图;
图2为本发明的改进SSD模型的结构示意图;
图3为最近邻插值算法的原理图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本发明并不意在对其适用物或其用途进行限定,且本发明并不限定于以下的实施方式。
实施例
一种基于改进SSD模型的目标检测方法,包括以下步骤:
S1:建立图像集,并对图像集中的图像进行预处理。
本实施例中,图像集内包括施工现场图像,所述的改进SSD模型以安全帽为目标对施工现场图像进行检测。
步骤S1中,通过网络爬虫、监控视频、施工现场拍摄方式构建图像集。本实验所选取的图像集的图像包含两类物体:佩戴安全帽(hat),未佩戴安全帽(person),图像集中共计7226张图片,按照7:2:1的比例进行划分为训练集、测试集和校验集。
对图像集的图像构建包含两类分类标签以及待检目标真实框坐标的数据集,其中佩戴安全帽标签为0,未佩戴安全帽标签为1。真实框坐标为(x1,y1,x2,y2)形式,其中x1与y1为边框左上角顶点的横坐标与纵坐标,x2与y2为右下角顶点的横坐标与纵坐标。
S2:构建改进SSD模型,所述的改进SSD模型在标准SSD模型上加入分支网络模块,所述的分支网络模块对标准SSD模型的Fc7层、Conv8_2层和Conv9_2层的特征图进行特征融合处理。
本实施例中,改进SSD模型VGG-16、extras层、分支网络模块和检测头,VGG16全连接层中的Fc6层和Fc7层分别替换为3x3卷积层和1x1卷积层,extras层包括Conv8_2层、Conv9_2层、Conv10_2层和Conv11_2层,Fc7层、Conv10_2层和Conv11_2层的特征图送入检测头,分支网络模块对Fc7层、Conv8_2层、Conv9_2层的特征图进行处理,将处理后的特征图送入检测头。
具体地,分支网络模块包括三个1x1卷积滤波器、三个3x3卷积滤波器、第一上采样层和第二上采样层,
1x1卷积滤波器对Conv9_2层的特征图进行平滑获取特征图P1,并将特征图P1送入第一上采样层进行上采样,1x1卷积滤波器对Conv8_2层的特征图进行平滑,平滑后的Conv8_2层的特征图与第一上采样层的输出进行融合获取特征图P2,并将特征图P2送入第二上采样层进行上采样,1x1卷积滤波器对Fc7层的特征图进行平滑,平滑后的Fc7层特征图与第二上采样层的输出进行融合获取特征图P3,
特征图P1、特征图P2和特征图P3分别通过3x3卷积滤波器平滑后送入检测头。
分支网络模块的上采样层采用最邻近上采样方法,第一上采样层对特征图P1进行最邻近上采样插值处理,第二上采样层对特征图P2进行最邻近上采样插值处理。
最近邻插值算法原理如图3所示,在待求象素的四邻象素中,将距离待求象素最近的邻象素灰度赋给待求象素设e+u,f+v(e,f为正整数,u,v为大于零小于1的小数,下同)为待求象素坐标,则待求象素灰度的值f(e+u,f+v)。如果(e+u,f+v)落在A区,即u<0.5,v<0.5,则将左上角象素的灰度值赋给待求象素,同理,落在B区则赋予右上角的象素灰度值落在C区则赋予左下角象素的灰度值,落在D区则赋予右下角象素的灰度值。通过最近领插值实现特征图尺度放大2倍,最后将对应尺度特征图进行元素累加实现特征融合并由3x3的滤波器进行平滑。
检测头中包括位置检测头和分类检测头。位置检测头输出坐标编码。分类检测头通过卷积操作与逻辑回归得到各类分类的得分。分类检测头对N个预测框进行卷积输出结果,分别对这些数值通过SoftMax函数输出logit值,即为得到物体的类别得分。
具体地,检测头包括多个1x1卷积层,检测头对送入的特征图进行卷积后分别进行边框回归与分类,获取预测框的坐标编码和分类得分。检测头包括位置检测头和分类检测头,假定预测框总数为N,共计M个种类的目标,位置检测头最终输出数目为4xN的坐标编码,分类检测头输出NxM个分类得分。
S3:将图像集输入改进SSD模型,对改进SSD模型进行训练,获取训练好的改进SSD模型。
S3具体包括:
S31:设置改进SSD模型的初始参数;
S32:将图像集中的图像输入到改进SSD模型;
S33:改进SSD模型输出预测框的坐标编码和分类得分;
S34:计算改进SSD模型的总损失并更新SSD模型的参数,判断参数是否收敛,若是,完成训练,否则返回步骤S32。
本实施例中,S32图像输入时使用RGB三通道的图像作为输入,并通过减去ImageNet三通道均值的方法进行预处理,提高检测头的鲁棒性。
改进SSD模型中,给定先验框P,真实框G,令d为相关变换操作,杰卡德系数J是衡量预测框d(P)与G相似度的重要指标,如公式所示:
Figure BDA0002675037470000061
当J大于某一阈值,称d(P)为G的正例进行保留,反之称为负例。在训练阶段,对每个真实框匹配杰卡德系数最大的预测框为正例,剩余预测框与真实框的杰卡德系数大于阈值也算作正例,其余都作为负例。
本发明的改进SSD模型的总损失函数为:
Figure BDA0002675037470000062
其中,N为匹配的默认框个数,Lconf(q,c)为分类损失,β为总损失参数,q={1,0},代表某个预测框是否匹配真实框,Lloc(q,l,g)为位置损失,l为预测框,c为标签分类,g为真实框。
总损失由位置损失与分类损失两部分加权求和得到,其中q={1,0},代表某个预测框是否匹配真实框,N代表最终与真实框匹配的默认框总数。
基于Multibox Loss计算预测值与待检测目标实际位置与类别的误差,依靠链式求导法则反向传播,模型参数在多轮迭代中不断更新,待参数收敛后最终得到较为稳定的检测模型。筛选出的正例预测框将参与位置损失的计算,负例不参与。
分类损失为:
Figure BDA0002675037470000071
其中,
Figure BDA0002675037470000072
为改进损失函数,α为分类损失权重调整参数,用于对各类分类损失权重调整,
Figure BDA0002675037470000073
为第
Figure BDA0002675037470000074
类物体检测头的输出经过SoftMax函数处理后得到的logit值,γ为分类损失参数。
分类损失公式中
Figure BDA0002675037470000075
的计算公式为:
Figure BDA0002675037470000076
其中,
Figure BDA0002675037470000077
为分类检测头针对预测框中目标属于各类别分别输出的信号值。
位置损失为:
Figure BDA0002675037470000078
其中,Pos为样本中的正例,cx、cy为预测框的中心点坐标,w为预测框的宽,h为预测框的高,
Figure BDA0002675037470000079
为类别为
Figure BDA00026750374700000710
的第i个预测框与第j个真实框是否匹配,
Figure BDA00026750374700000711
为预测框,
Figure BDA00026750374700000712
为真实框,m为产生损失的特征图对应的序号。
本发明对分类损失进行优化,通过Focal Loss强化难样例对分类损失的影响,提升检测头对难样例的正确分类能力。其中β是各类样本对损失函数的一个细化的参数,pt为SoftMax函数输出的logit值。通过γ即可实现调整样例对损失的影响,如pt取值较大时认为是易于区分的样例,此时(1-pt)γ降低,对损失影响降低,pt较小时,认为为难以区分的样例,(1-pt)γ增大,对损失影响增大。通过增加难样例对损失的影响实现模型对难样例区分能力的提升。
S4:将待检测图像输入到训练好的改进SSD模型,输出图像的安全帽检测结果。
当模型训练好后,将待检测图像输入到改进SSD模型,
模型参数判断为收敛后将待检测图像输入检测模型,改进SSD模型处理待检测图像,改进SSD模型输出的置信度得分进行排序,取前景得分排名前K的预测框进行非极大抑制处理(NMS),将筛选后的预测框坐标编码进行解码得到原图上的目标位置。
改进SSD模型中,假定m个尺度的特征图负责检测,SSD算法根据公式
Sk=Smin+(Smax-Smin)*(k-1)/(m-1),k∈[1,m]
分阶段设置默认框边长,其中Smin与Smax分别代表最底层以及最高层用以检测的特征图对应区域占原始图像尺度的比例,m为产生损失的特征图对应的序号,k为特征图所述层数的排序。
本发明对SSD的默认框进行参数调优,Smin与Smax通常取0.2与0.9,针对安全帽检测,由于小目标自身尺度限制,|G∩d(P)|取值必然较小。当Smin取常规取值0.2,此时默认框尺度偏大导致先验框P与目标尺度相差较大,不利于检测器回归得到正确坐标且结果往往偏大,|G∪d(P)|的面积相应增大,较多预测框因杰卡德系数小于阈值导致难以获得正例,但本发明中分别设置为0.1与0.9,设置与小目标更为匹配的先验框P以帮助正确回归并增加预测框中的正例数。
设置宽高比ar∈{1,2,3,1/2,1/3},分别计算得到多阶段特征图对应先验框宽高:
Figure BDA0002675037470000081
Figure BDA0002675037470000082
其中,
Figure BDA0002675037470000083
为第k层特征图的第a个先验框的高与宽。
给定预测框坐标为
Figure BDA0002675037470000084
其中
Figure BDA0002675037470000085
Figure BDA0002675037470000086
为预测框中心点的x与y坐标,
Figure BDA0002675037470000087
Figure BDA0002675037470000088
为预测框的宽与高。给定先验框坐标为
Figure BDA0002675037470000089
其中
Figure BDA00026750374700000810
Figure BDA00026750374700000811
为先验框中心点的x与y坐标,
Figure BDA00026750374700000812
Figure BDA00026750374700000813
为先验框的宽与高。SSD输出坐标编码信息为
Figure BDA00026750374700000814
其中
Figure BDA00026750374700000815
Figure BDA00026750374700000816
分别为检测头输出的水平与竖直方向的平移系数,
Figure BDA00026750374700000817
Figure BDA00026750374700000818
为检测头输出的宽、高放缩系数。
根据下列公式获取预测框坐标:
Figure BDA00026750374700000819
Figure BDA00026750374700000820
Figure BDA00026750374700000821
Figure BDA00026750374700000822
Figure BDA00026750374700000823
即为输出的最终待检测目标的解码坐标。
将目标检测的坐标与分类可视化,本实施例实验环境为:系统Win10,显卡GTX1660Ti,深度学习框架Pytorch1.3,对比算法为SSD。
本实施例的改进SSD模型的训练参数如下表所示:
参数 数值
Image size 300x300
Batch size 16
Epoch 100
Momentum 0.9
Weight decay 10-8
Gamma 0.1
Conf thresh 0.01
Nms thresh 0.5
Top K 200
Smin 0.1
Smax 0.9
Beta 1
Focal Loss Alpha [0.25,0.75,0.75]
Focal Loss Gamma 2
输入图像分辨率为300x300情况下,SSD模型和改进的SSD模型在测试集上的平均精度均值与检测速度如下表所示,其中Hat AP为安全帽检测平均精度,Person AP为人检测平均精度,mAP为平均精度均值,FPS为训练中batch size为1时模型每秒能检测的图片数目。
Figure BDA0002675037470000091
上述实施方式仅为例举,不表示对本发明范围的限定。这些实施方式还能以其它各种方式来实施,且能在不脱离本发明技术思想的范围内作各种省略、置换、变更。

Claims (10)

1.一种基于改进SSD模型的目标检测方法,其特征在于,包括以下步骤:
S1:建立图像集,并对图像集中的图像进行预处理;
S2:构建改进SSD模型,所述的改进SSD模型在标准SSD模型上加入分支网络模块,所述的分支网络模块对标准SSD模型的Fc7层、Conv8_2层和Conv9_2层的特征图进行特征融合处理;
S3:将图像集输入改进SSD模型,对改进SSD模型进行训练,获取训练好的改进SSD模型;
S4:将待检测图像输入到训练好的改进SSD模型,输出图像的目标检测结果。
2.根据权利要求1所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的改进SSD模型VGG-16、extras层、分支网络模块和检测头,所述的VGG16全连接层中的Fc6层和Fc7层分别替换为3x3卷积层和1x1卷积层,所述的extras层包括Conv8_2层、Conv9_2层、Conv10_2层和Conv11_2层,
所述的Fc7层、Conv10_2层和Conv11_2层的特征图送入检测头,所述的分支网络模块对Fc7层、Conv8_2层、Conv9_2层的特征图进行处理,将处理后的特征图送入检测头。
3.根据权利要求2所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的分支网络模块包括三个1x1卷积滤波器、三个3x3卷积滤波器、第一上采样层和第二上采样层,
所述的1x1卷积滤波器对Conv9_2层的特征图进行平滑获取特征图P1,并将特征图P1送入第一上采样层进行上采样,所述的1x1卷积滤波器对Conv8_2层的特征图进行平滑,平滑后的Conv8_2层的特征图与第一上采样层的输出进行融合获取特征图P2,并将特征图P2送入第二上采样层进行上采样,所述的1x1卷积滤波器对Fc7层的特征图进行平滑,平滑后的Fc7层特征图与第二上采样层的输出进行融合获取特征图P3,
所述的特征图P1、特征图P2和特征图P3分别通过3x3卷积滤波器平滑后送入检测器。
4.根据权利要求3所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的第一上采样层对特征图P1进行最邻近上采样插值处理,所述的第二上采样层对特征图P2进行最邻近上采样插值处理。
5.根据权利要求2所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的检测头包括多个1x1卷积层,所述的检测头对送入的特征图进行卷积后分别进行边框回归与分类,获取预测框的坐标编码和分类得分。
6.根据权利要求1所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的步骤S3具体包括:
S31:设置改进SSD模型的初始参数;
S32:将图像集中的图像输入到改进SSD模型;
S33:改进SSD模型输出预测框的坐标编码和分类得分;
S34:计算改进SSD模型的总损失并更新SSD模型的参数,判断参数是否收敛,若是,完成训练,否则返回步骤S32。
7.根据权利要求1所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的改进SSD模型的总损失函数为:
Figure FDA0002675037460000021
其中,N为匹配的默认框个数,Lconf(q,c)为分类损失,β为总损失参数,q={1,0},代表某个预测框是否匹配真实框,Lloc(q,l,g)为位置损失,l为预测框,c为标签分类,g为真实框。
8.根据权利要求7所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的分类损失为:
Figure FDA0002675037460000022
其中,
Figure FDA0002675037460000023
为改进损失函数,α为分类损失权重调整参数,
Figure FDA0002675037460000024
为第
Figure FDA0002675037460000025
类检测头的输出经过SoftMax函数处理后得到的logit值,γ为分类损失参数。
9.根据权利要求8所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的
Figure FDA0002675037460000026
的计算公式为:
Figure FDA0002675037460000027
其中,
Figure FDA0002675037460000028
为分类检测头针对预测框中目标属于各类别分别输出的信号值。
10.根据权利要求1所述的一种基于改进SSD模型的目标检测方法,其特征在于,所述的图像集内包括施工现场图像,所述的改进SSD模型以安全帽为目标对施工现场图像进行检测。
CN202010945055.5A 2020-09-10 2020-09-10 一种基于改进ssd模型的目标检测方法 Pending CN112149533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010945055.5A CN112149533A (zh) 2020-09-10 2020-09-10 一种基于改进ssd模型的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010945055.5A CN112149533A (zh) 2020-09-10 2020-09-10 一种基于改进ssd模型的目标检测方法

Publications (1)

Publication Number Publication Date
CN112149533A true CN112149533A (zh) 2020-12-29

Family

ID=73890912

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010945055.5A Pending CN112149533A (zh) 2020-09-10 2020-09-10 一种基于改进ssd模型的目标检测方法

Country Status (1)

Country Link
CN (1) CN112149533A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734732A (zh) * 2021-01-11 2021-04-30 石家庄铁道大学 基于改进ssd算法的铁路隧道漏缆卡具检测方法
CN112991168A (zh) * 2021-02-08 2021-06-18 上海电力大学 一种基于目标检测和超分辨率的文本检测方法
CN113255650A (zh) * 2021-06-24 2021-08-13 北京市水利自动化研究所 一种基于slimSSD模型的水表计量快速精准识别方法
CN113326440A (zh) * 2021-08-03 2021-08-31 腾讯科技(深圳)有限公司 基于人工智能的推荐方法、装置及电子设备
CN113627481A (zh) * 2021-07-09 2021-11-09 南京邮电大学 一种面向智慧园林的多模型组合的无人机垃圾分类方法
CN113902680A (zh) * 2021-09-14 2022-01-07 西安建筑科技大学 引入注意力机制的多尺度特征融合ssd的螺栓松动检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509978A (zh) * 2018-02-28 2018-09-07 中南大学 基于cnn的多级特征融合的多类目标检测方法及模型
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法
CN109886082A (zh) * 2019-01-03 2019-06-14 南京理工大学 一种基于ssd的小目标增强预测模块检测方法
US20200211154A1 (en) * 2018-12-30 2020-07-02 Altumview Systems Inc. Method and system for privacy-preserving fall detection
CN111582049A (zh) * 2020-04-16 2020-08-25 天津大学 一种基于ros自建无人车的端到端自动驾驶方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509978A (zh) * 2018-02-28 2018-09-07 中南大学 基于cnn的多级特征融合的多类目标检测方法及模型
CN109344821A (zh) * 2018-08-30 2019-02-15 西安电子科技大学 基于特征融合和深度学习的小目标检测方法
US20200211154A1 (en) * 2018-12-30 2020-07-02 Altumview Systems Inc. Method and system for privacy-preserving fall detection
CN109886082A (zh) * 2019-01-03 2019-06-14 南京理工大学 一种基于ssd的小目标增强预测模块检测方法
CN111582049A (zh) * 2020-04-16 2020-08-25 天津大学 一种基于ros自建无人车的端到端自动驾驶方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
TSUNG-YI LIN 等: "《Focal Loss for Dense Object Detection》", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION》 *
栾浩 等: ""基于改进SSD的目标检测方法"", 《软件》 *
牟新刚 等: "《红外探测器成像与信息处理》", 30 September 2016 *
胡梦龙 等: "《基于 SSD 方法的小目标物体检测算法研究》", 《现代信息科技》 *
黄毅 等: "《基于深度学习的空域弱小目标检测》", 《信息技术与信息化》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734732A (zh) * 2021-01-11 2021-04-30 石家庄铁道大学 基于改进ssd算法的铁路隧道漏缆卡具检测方法
CN112734732B (zh) * 2021-01-11 2023-06-02 石家庄铁道大学 基于改进ssd算法的铁路隧道漏缆卡具检测方法
CN112991168A (zh) * 2021-02-08 2021-06-18 上海电力大学 一种基于目标检测和超分辨率的文本检测方法
CN112991168B (zh) * 2021-02-08 2022-11-15 上海电力大学 一种基于目标检测和超分辨率的文本检测方法
CN113255650A (zh) * 2021-06-24 2021-08-13 北京市水利自动化研究所 一种基于slimSSD模型的水表计量快速精准识别方法
CN113627481A (zh) * 2021-07-09 2021-11-09 南京邮电大学 一种面向智慧园林的多模型组合的无人机垃圾分类方法
CN113326440A (zh) * 2021-08-03 2021-08-31 腾讯科技(深圳)有限公司 基于人工智能的推荐方法、装置及电子设备
CN113326440B (zh) * 2021-08-03 2021-11-02 腾讯科技(深圳)有限公司 基于人工智能的推荐方法、装置及电子设备
CN113902680A (zh) * 2021-09-14 2022-01-07 西安建筑科技大学 引入注意力机制的多尺度特征融合ssd的螺栓松动检测方法

Similar Documents

Publication Publication Date Title
CN112149533A (zh) 一种基于改进ssd模型的目标检测方法
CN110287960B (zh) 自然场景图像中曲线文字的检测识别方法
CN111639692B (zh) 一种基于注意力机制的阴影检测方法
CN111723748B (zh) 一种红外遥感图像舰船检测方法
CN108460356B (zh) 一种基于监控系统的人脸图像自动处理系统
CN109241985B (zh) 一种图像识别方法及装置
US8406470B2 (en) Object detection in depth images
CN112949572B (zh) 基于Slim-YOLOv3的口罩佩戴情况检测方法
CN114758288A (zh) 一种配电网工程安全管控检测方法及装置
CN112052876A (zh) 一种基于改进ra-cnn的细粒度图像检测方法与系统
CN110287888A (zh) 一种台标识别方法及系统
CN111275040A (zh) 定位方法及装置、电子设备、计算机可读存储介质
CN115620066B (zh) 一种基于x光图像的物品检测方法、装置及电子设备
CN112883941A (zh) 一种基于并行神经网络的人脸表情识别方法
CN109359530B (zh) 一种智能视频监控方法及装置
CN113936299A (zh) 建筑工地中危险区域检测方法
CN113936034A (zh) 一种结合帧间光流的表观运动联合弱小运动目标检测方法
CN111429727B (zh) 一种开放式停车位中车牌识别方法及系统
KR20080079443A (ko) 영상으로부터의 객체 검출 방법 및 장치
CN109657577B (zh) 一种基于熵和运动偏移量的动物检测方法
CN109409224B (zh) 一种自然场景火焰检测的方法
CN116309270A (zh) 一种基于双目图像的输电线路典型缺陷识别方法
CN110866500A (zh) 人脸检测对齐系统、方法、装置、平台、移动终端和存储介质
CN114387592B (zh) 一种复杂背景下字符定位和识别方法
CN110490170A (zh) 一种人脸候选框提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201229