CN111428558A - 一种基于改进YOLOv3方法的车辆检测方法 - Google Patents

一种基于改进YOLOv3方法的车辆检测方法 Download PDF

Info

Publication number
CN111428558A
CN111428558A CN202010100452.2A CN202010100452A CN111428558A CN 111428558 A CN111428558 A CN 111428558A CN 202010100452 A CN202010100452 A CN 202010100452A CN 111428558 A CN111428558 A CN 111428558A
Authority
CN
China
Prior art keywords
representing
moving object
improved
frame
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010100452.2A
Other languages
English (en)
Inventor
孙浩
葛华勇
冯婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN202010100452.2A priority Critical patent/CN111428558A/zh
Publication of CN111428558A publication Critical patent/CN111428558A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;步骤2、构建改进的YOLOv3网络模型;利用训练集、验证集和测试集对改进的YOLOv3网络模型进行训练;利用训练好的改进的YOLOv3网络模型进行检测和模型评估。本发明操作简单,易于实现。并且可以同时检测到更多的目标,降低了漏检率。

Description

一种基于改进YOLOv3方法的车辆检测方法
技术领域
本发明涉及计算机视觉技术,尤其涉及一种改进YOLOv3的车辆检测追踪方法。
背景技术
随着我国城市化进程不断加快,运输需求不断增长,智能交通系统应运而生。利用计算机视觉技术,建立智能交通管理系统,通过计算机系统对摄像机记录来进行判断,实现对车辆的检测和跟踪。通过分析,判断车辆的行为,对此作出说明解释,完成日常管理,为城市道路交通提供更先进,更完善的检测方案。
近些年来,随着图像处理,卷积神经网络,机器学习等相关领域的不断发展。目标检测领域尤其是车辆检测方向,无论在学术研究还是工程应用上,都取得了巨大的进步。车辆检测方向主要有两种类型的方法:一种是一阶段的方法,代表方法是YOLO、SSD一系列算法;还有一种是二阶段的方法,代表方法是FasterR-CNN。一阶段的方法主要优势就是速度快,但是精度普遍没有二阶段的高。二阶段的方法主要优势就是精度高,但是速度没有一阶段的快。
如何在精度和速度之间取得一个平衡,如何在不过多消耗计算资源的情况下,最大限度的实现精度和速度的平衡,是一个亟待解决的问题。
发明内容
本发明的目的是:提高车辆检测模型的精度性和鲁棒性,在不较大影响最后检测速度的前提下,基本可以实现了实时的功能。
为了达到上述目的,本发明的技术方案是提供了一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:
步骤1、采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;
步骤2、构建改进的YOLOv3网络模型,对原始YOLOv3网络模型输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet-53网络中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标,同时,在YOLOv3网络模型的第二个残差块中增加2个残差单元;
步骤3、利用步骤1获得的训练集、验证集和测试集对步骤2构建的改进的YOLOv3网络模型进行训练;
步骤4、利用训练好的改进的YOLOv3网络模型进行检测和模型评估。
优选地,步骤1中,将采集到的图像数据按照3:1:1的比例划分成训练集、验证集和测试集,然后使用labelImage工具进行图像标注。
优选地,步骤3中,采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练,使用低分辨率的数据集微调Darknet-53网络,然后在高分辨率下数据集上进行迭代,在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型,通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进的YOLOv3网络模型。
优选地,步骤3中,所述损失函数loss设计为以下函数:
Figure BDA0002386734760000021
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,
Figure BDA0002386734760000022
表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y′i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,
Figure BDA0002386734760000023
表示第i个网格的第j个目标边框不负责该目标,如果不负责为1,否则为0,p′i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值,M表示每一个网格所预测的目标边框数量。
本发明操作简单,易于实现。并且可以同时检测到更多的目标,降低了漏检率。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明提供了一种基于YOLOv3的车辆检测方法,具体包括如下步骤:
(1)采集包含各种车辆图像数据,然后依据VOC数据集格式制作自己的车辆数据集,包括以下步骤:
将采集到的图像按照3:1:1的比例划分成训练集,验证集和测试集。然后使用labelImage工具进行图像标注。按照VOC格式进行制作。VOC格式的数据集主要包括:Annotations文件夹,存放图片标记后生成的.xml文件;JPEGImages文件夹,存放原始图片,图片需要以000000.jpg、000001.jpg、000002.jpg这样的格式依次命名;ImageSets文件夹,里面建立一个Main文件,包含test.txt文件、train.txt文件、trainval.txt文件、val.txt文件,然后把文件名写入对应txt文件中去。
(2)构建YOLOv3网络模型并对其进行改进,包括以下步骤:
YOLOv3网络利用8倍降采样输出特征图对小目标进行检测,为了使网络获得更多小目标的特征信息,对YOLOv3输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet53中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标。同时,在原网络的第二个残差块中增加2个残差单元。
(3)用搭建好的网络结构和数据集训练模型,包括以下步骤:
先对网络进行分类预训练:主要是采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练。使用低分辨率(320x320)的数据集微调Darknet-53,然后在高分辨率下(512x512)数据集上进行迭代。
在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型。最小为320x320像素,最大为608x608像素。部分实验参数设置如下表所示:
参数名 参数值
学习率(learning rate) 0.02
迭代(epoch) 80
批量大小(batch size) 32
动量(momentum) 0.9
权重衰减(weight_decay) 0.0005
学习率衰减步长(Ir_step) 40
学习率衰减因子(Ir_factory) 0.1
非极大值抑制(nms) 0.5
通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进YOLOv3的检测模型。损失函数设计为以下函数:
Figure BDA0002386734760000041
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,
Figure BDA0002386734760000042
表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y′i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,I′ij表示第i个网格的第j个目标边框不负责该目标,如果不负责为1,否则为0,p′i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值,M表示每一个网格所预测的目标边框数量。
(4)利用训练好的网络模型进行检测和模型评估。评价标准是FPS,是指由程序统计检测每张图片所需时间而得。FPS表示图片检测的速率。

Claims (4)

1.一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:
步骤1、采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;
步骤2、构建改进的YOLOv3网络模型,对原始YOLOv3网络模型输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet-53网络中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标,同时,在YOLOv3网络模型的第二个残差块中增加2个残差单元;
步骤3、利用步骤1获得的训练集、验证集和测试集对步骤2构建的改进的YOLOv3网络模型进行训练;
步骤4、利用训练好的改进的YOLOv3网络模型进行检测和模型评估。
2.如权利要求1所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤1中,将采集到的图像数据按照3:1:1的比例划分成训练集、验证集和测试集,然后使用labelImage工具进行图像标注。
3.如权利要求1所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤3中,采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练,使用低分辨率的数据集微调Darknet-53网络,然后在高分辨率下数据集上进行迭代,在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型,通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进的YOLOv3网络模型。
4.如权利要求3所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤3中,所述损失函数loss设计为以下函数:
Figure FDA0002386734750000021
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,
Figure FDA0002386734750000022
表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y'i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,I′ij表示第i个网格的第j个目标边框不负责该目标,如果不负责则为1,否则为0,p'i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值。M表示每一个网格所预测的目标边框数量。
CN202010100452.2A 2020-02-18 2020-02-18 一种基于改进YOLOv3方法的车辆检测方法 Pending CN111428558A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010100452.2A CN111428558A (zh) 2020-02-18 2020-02-18 一种基于改进YOLOv3方法的车辆检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010100452.2A CN111428558A (zh) 2020-02-18 2020-02-18 一种基于改进YOLOv3方法的车辆检测方法

Publications (1)

Publication Number Publication Date
CN111428558A true CN111428558A (zh) 2020-07-17

Family

ID=71547379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010100452.2A Pending CN111428558A (zh) 2020-02-18 2020-02-18 一种基于改进YOLOv3方法的车辆检测方法

Country Status (1)

Country Link
CN (1) CN111428558A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257793A (zh) * 2020-10-26 2021-01-22 大连理工大学 一种基于改进YOLO v3算法的远距离交通标志检测方法
CN112270252A (zh) * 2020-10-26 2021-01-26 西安工程大学 一种改进YOLOv2模型的多车辆目标识别方法
CN112507929A (zh) * 2020-12-16 2021-03-16 武汉理工大学 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法
CN113033284A (zh) * 2020-12-22 2021-06-25 迪比(重庆)智能科技研究院有限公司 一种基于卷积神经网络的车辆实时超载检测方法
CN113076858A (zh) * 2021-03-30 2021-07-06 深圳技术大学 基于深度学习的车辆信息检测方法、存储介质及终端设备
CN113128362A (zh) * 2021-03-31 2021-07-16 广东工业大学 一种基于yolov3的无人机视角下小目标快速检测方法
CN113239842A (zh) * 2021-05-25 2021-08-10 三门峡崤云信息服务股份有限公司 一种基于图像识别的天鹅检测方法及装置
CN113762190A (zh) * 2021-09-15 2021-12-07 中科微至智能制造科技江苏股份有限公司 一种基于神经网络的包裹堆叠检测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472514A (zh) * 2019-07-22 2019-11-19 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
CN110751195A (zh) * 2019-10-12 2020-02-04 西南交通大学 一种基于改进YOLOv3的细粒度图像分类方法
CN110751076A (zh) * 2019-10-09 2020-02-04 上海应用技术大学 车辆检测方法
CN110796168A (zh) * 2019-09-26 2020-02-14 江苏大学 一种基于改进YOLOv3的车辆检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110472514A (zh) * 2019-07-22 2019-11-19 电子科技大学 一种自适应车辆目标检测算法模型及其构建方法
CN110796168A (zh) * 2019-09-26 2020-02-14 江苏大学 一种基于改进YOLOv3的车辆检测方法
CN110751076A (zh) * 2019-10-09 2020-02-04 上海应用技术大学 车辆检测方法
CN110751195A (zh) * 2019-10-12 2020-02-04 西南交通大学 一种基于改进YOLOv3的细粒度图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
鞠默然,罗海波,王仲博等: "改进的YOLO V3算法及其在小目标检测中的应用", 《光学学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257793A (zh) * 2020-10-26 2021-01-22 大连理工大学 一种基于改进YOLO v3算法的远距离交通标志检测方法
CN112270252A (zh) * 2020-10-26 2021-01-26 西安工程大学 一种改进YOLOv2模型的多车辆目标识别方法
CN112507929A (zh) * 2020-12-16 2021-03-16 武汉理工大学 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法
CN112507929B (zh) * 2020-12-16 2022-05-13 武汉理工大学 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法
CN113033284A (zh) * 2020-12-22 2021-06-25 迪比(重庆)智能科技研究院有限公司 一种基于卷积神经网络的车辆实时超载检测方法
CN113076858A (zh) * 2021-03-30 2021-07-06 深圳技术大学 基于深度学习的车辆信息检测方法、存储介质及终端设备
CN113128362A (zh) * 2021-03-31 2021-07-16 广东工业大学 一种基于yolov3的无人机视角下小目标快速检测方法
CN113239842A (zh) * 2021-05-25 2021-08-10 三门峡崤云信息服务股份有限公司 一种基于图像识别的天鹅检测方法及装置
CN113762190A (zh) * 2021-09-15 2021-12-07 中科微至智能制造科技江苏股份有限公司 一种基于神经网络的包裹堆叠检测方法及装置
CN113762190B (zh) * 2021-09-15 2024-03-29 中科微至科技股份有限公司 一种基于神经网络的包裹堆叠检测方法及装置

Similar Documents

Publication Publication Date Title
CN111428558A (zh) 一种基于改进YOLOv3方法的车辆检测方法
CN111563508B (zh) 一种基于空间信息融合的语义分割方法
WO2022083784A1 (zh) 一种基于车联网的道路检测方法
CN110929577A (zh) 一种基于YOLOv3的轻量级框架改进的目标识别方法
CN111899227A (zh) 基于无人机作业的铁路扣件缺陷自动采集辨识方法
CN111461209B (zh) 一种模型训练装置和方法
CN111460919A (zh) 一种基于改进YOLOv3的单目视觉道路目标检测及距离估计方法
CN110633610A (zh) 一种基于yolo的学员状态检测算法
CN111489339A (zh) 高速铁路定位器螺栓备母缺陷的检测方法
CN113177560A (zh) 一种普适性轻量级深度学习车辆检测方法
CN112434723B (zh) 一种基于注意力网络的日/夜间图像分类及物体检测方法
CN110599459A (zh) 基于深度学习的地下管网风险评估云系统
CN112232371A (zh) 一种基于YOLOv3与文本识别的美式车牌识别方法
CN113076804B (zh) 基于YOLOv4改进算法的目标检测方法、装置及系统
CN113239753A (zh) 基于YOLOv4改进的交通标志检测与识别方法
CN112528934A (zh) 一种基于多尺度特征层的改进型YOLOv3的交通标志检测方法
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN110751076A (zh) 车辆检测方法
CN114566052B (zh) 一种基于车流方向判别高速公路车流监控设备转动的方法
CN110263836B (zh) 一种基于多特征卷积神经网络的不良驾驶状态识别方法
CN115240259A (zh) 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统
CN117456480B (zh) 一种基于多源信息融合的轻量化车辆再辨识方法
CN112785610B (zh) 一种融合低层特征的车道线语义分割方法
CN116977712B (zh) 基于知识蒸馏的道路场景分割方法、系统、设备及介质
CN111340001A (zh) 一种基于遥感影像深度学习的交通拥堵识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200717