CN111428558A - 一种基于改进YOLOv3方法的车辆检测方法 - Google Patents
一种基于改进YOLOv3方法的车辆检测方法 Download PDFInfo
- Publication number
- CN111428558A CN111428558A CN202010100452.2A CN202010100452A CN111428558A CN 111428558 A CN111428558 A CN 111428558A CN 202010100452 A CN202010100452 A CN 202010100452A CN 111428558 A CN111428558 A CN 111428558A
- Authority
- CN
- China
- Prior art keywords
- representing
- moving object
- improved
- frame
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;步骤2、构建改进的YOLOv3网络模型;利用训练集、验证集和测试集对改进的YOLOv3网络模型进行训练;利用训练好的改进的YOLOv3网络模型进行检测和模型评估。本发明操作简单,易于实现。并且可以同时检测到更多的目标,降低了漏检率。
Description
技术领域
本发明涉及计算机视觉技术,尤其涉及一种改进YOLOv3的车辆检测追踪方法。
背景技术
随着我国城市化进程不断加快,运输需求不断增长,智能交通系统应运而生。利用计算机视觉技术,建立智能交通管理系统,通过计算机系统对摄像机记录来进行判断,实现对车辆的检测和跟踪。通过分析,判断车辆的行为,对此作出说明解释,完成日常管理,为城市道路交通提供更先进,更完善的检测方案。
近些年来,随着图像处理,卷积神经网络,机器学习等相关领域的不断发展。目标检测领域尤其是车辆检测方向,无论在学术研究还是工程应用上,都取得了巨大的进步。车辆检测方向主要有两种类型的方法:一种是一阶段的方法,代表方法是YOLO、SSD一系列算法;还有一种是二阶段的方法,代表方法是FasterR-CNN。一阶段的方法主要优势就是速度快,但是精度普遍没有二阶段的高。二阶段的方法主要优势就是精度高,但是速度没有一阶段的快。
如何在精度和速度之间取得一个平衡,如何在不过多消耗计算资源的情况下,最大限度的实现精度和速度的平衡,是一个亟待解决的问题。
发明内容
本发明的目的是:提高车辆检测模型的精度性和鲁棒性,在不较大影响最后检测速度的前提下,基本可以实现了实时的功能。
为了达到上述目的,本发明的技术方案是提供了一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:
步骤1、采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;
步骤2、构建改进的YOLOv3网络模型,对原始YOLOv3网络模型输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet-53网络中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标,同时,在YOLOv3网络模型的第二个残差块中增加2个残差单元;
步骤3、利用步骤1获得的训练集、验证集和测试集对步骤2构建的改进的YOLOv3网络模型进行训练;
步骤4、利用训练好的改进的YOLOv3网络模型进行检测和模型评估。
优选地,步骤1中,将采集到的图像数据按照3:1:1的比例划分成训练集、验证集和测试集,然后使用labelImage工具进行图像标注。
优选地,步骤3中,采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练,使用低分辨率的数据集微调Darknet-53网络,然后在高分辨率下数据集上进行迭代,在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型,通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进的YOLOv3网络模型。
优选地,步骤3中,所述损失函数loss设计为以下函数:
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y′i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,表示第i个网格的第j个目标边框不负责该目标,如果不负责为1,否则为0,p′i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值,M表示每一个网格所预测的目标边框数量。
本发明操作简单,易于实现。并且可以同时检测到更多的目标,降低了漏检率。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明提供了一种基于YOLOv3的车辆检测方法,具体包括如下步骤:
(1)采集包含各种车辆图像数据,然后依据VOC数据集格式制作自己的车辆数据集,包括以下步骤:
将采集到的图像按照3:1:1的比例划分成训练集,验证集和测试集。然后使用labelImage工具进行图像标注。按照VOC格式进行制作。VOC格式的数据集主要包括:Annotations文件夹,存放图片标记后生成的.xml文件;JPEGImages文件夹,存放原始图片,图片需要以000000.jpg、000001.jpg、000002.jpg这样的格式依次命名;ImageSets文件夹,里面建立一个Main文件,包含test.txt文件、train.txt文件、trainval.txt文件、val.txt文件,然后把文件名写入对应txt文件中去。
(2)构建YOLOv3网络模型并对其进行改进,包括以下步骤:
YOLOv3网络利用8倍降采样输出特征图对小目标进行检测,为了使网络获得更多小目标的特征信息,对YOLOv3输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet53中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标。同时,在原网络的第二个残差块中增加2个残差单元。
(3)用搭建好的网络结构和数据集训练模型,包括以下步骤:
先对网络进行分类预训练:主要是采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练。使用低分辨率(320x320)的数据集微调Darknet-53,然后在高分辨率下(512x512)数据集上进行迭代。
在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型。最小为320x320像素,最大为608x608像素。部分实验参数设置如下表所示:
参数名 | 参数值 |
学习率(learning rate) | 0.02 |
迭代(epoch) | 80 |
批量大小(batch size) | 32 |
动量(momentum) | 0.9 |
权重衰减(weight_decay) | 0.0005 |
学习率衰减步长(Ir_step) | 40 |
学习率衰减因子(Ir_factory) | 0.1 |
非极大值抑制(nms) | 0.5 |
通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进YOLOv3的检测模型。损失函数设计为以下函数:
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y′i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,I′ij表示第i个网格的第j个目标边框不负责该目标,如果不负责为1,否则为0,p′i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值,M表示每一个网格所预测的目标边框数量。
(4)利用训练好的网络模型进行检测和模型评估。评价标准是FPS,是指由程序统计检测每张图片所需时间而得。FPS表示图片检测的速率。
Claims (4)
1.一种基于改进YOLOv3方法的车辆检测方法,其特征在于,包括以下步骤:
步骤1、采集包含各种车辆的图像数据,然后依据VOC数据集格式制作训练集、验证集和测试集;
步骤2、构建改进的YOLOv3网络模型,对原始YOLOv3网络模型输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与Darknet-53网络中的第二个残差块输出的4倍降采样特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层,以检测小目标,同时,在YOLOv3网络模型的第二个残差块中增加2个残差单元;
步骤3、利用步骤1获得的训练集、验证集和测试集对步骤2构建的改进的YOLOv3网络模型进行训练;
步骤4、利用训练好的改进的YOLOv3网络模型进行检测和模型评估。
2.如权利要求1所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤1中,将采集到的图像数据按照3:1:1的比例划分成训练集、验证集和测试集,然后使用labelImage工具进行图像标注。
3.如权利要求1所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤3中,采用VOC20类和COCO80类数据集对Darknet-53网络进行预训练,使用低分辨率的数据集微调Darknet-53网络,然后在高分辨率下数据集上进行迭代,在训练过程中随机改变输入图像的尺寸,用多尺度输入的方式训练模型,通过损失函数对数据和真实值之间的差距进行一定规则的计算,然后经过反向传播求取梯度,进行权重更新,最终得到改进的YOLOv3网络模型。
4.如权利要求3所述的一种基于改进YOLOv3方法的车辆检测方法,其特征在于,步骤3中,所述损失函数loss设计为以下函数:
式(1)中,λ1表示坐标预测的惩罚系数,设定取值为5,KxK表示一张输入图片划分的网格数量,表示第i个网格的第j个目标边框是否负责检测该物体,如果负责则为1,否则为0,xi表示真实运动目标框的中心点横坐标,x′i表示预测运动目标框的中心点横坐标,yi表示真实运动目标框的中心点纵坐标,y'i表示预测运动目标框的中心点纵坐标,wi表示真实运动目标框的宽,w′i表示预测运动目标框的宽,hi表示真实运动目标框的高,h′i表示预测运动目标框的高,C′i表示运动目标真实的置信度,Ci表示运动目标预测的置信度,λ2表示不包含运动目标的时候置信度惩罚系数,设置为0.5,I′ij表示第i个网格的第j个目标边框不负责该目标,如果不负责则为1,否则为0,p'i(c)表示第i个网格中运动目标属于某一类别真实的概率值,c表示某一类别,classes表示类别总体,pi(c)表示第i个网格中运动目标属于某一类别预测的概率值。M表示每一个网格所预测的目标边框数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010100452.2A CN111428558A (zh) | 2020-02-18 | 2020-02-18 | 一种基于改进YOLOv3方法的车辆检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010100452.2A CN111428558A (zh) | 2020-02-18 | 2020-02-18 | 一种基于改进YOLOv3方法的车辆检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111428558A true CN111428558A (zh) | 2020-07-17 |
Family
ID=71547379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010100452.2A Pending CN111428558A (zh) | 2020-02-18 | 2020-02-18 | 一种基于改进YOLOv3方法的车辆检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111428558A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257793A (zh) * | 2020-10-26 | 2021-01-22 | 大连理工大学 | 一种基于改进YOLO v3算法的远距离交通标志检测方法 |
CN112270252A (zh) * | 2020-10-26 | 2021-01-26 | 西安工程大学 | 一种改进YOLOv2模型的多车辆目标识别方法 |
CN112507929A (zh) * | 2020-12-16 | 2021-03-16 | 武汉理工大学 | 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法 |
CN113033284A (zh) * | 2020-12-22 | 2021-06-25 | 迪比(重庆)智能科技研究院有限公司 | 一种基于卷积神经网络的车辆实时超载检测方法 |
CN113076858A (zh) * | 2021-03-30 | 2021-07-06 | 深圳技术大学 | 基于深度学习的车辆信息检测方法、存储介质及终端设备 |
CN113128362A (zh) * | 2021-03-31 | 2021-07-16 | 广东工业大学 | 一种基于yolov3的无人机视角下小目标快速检测方法 |
CN113239842A (zh) * | 2021-05-25 | 2021-08-10 | 三门峡崤云信息服务股份有限公司 | 一种基于图像识别的天鹅检测方法及装置 |
CN113762190A (zh) * | 2021-09-15 | 2021-12-07 | 中科微至智能制造科技江苏股份有限公司 | 一种基于神经网络的包裹堆叠检测方法及装置 |
CN113971763A (zh) * | 2020-12-21 | 2022-01-25 | 河南铮睿科达信息技术有限公司 | 一种基于目标检测和超分重建的小目标分割方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472514A (zh) * | 2019-07-22 | 2019-11-19 | 电子科技大学 | 一种自适应车辆目标检测算法模型及其构建方法 |
CN110751195A (zh) * | 2019-10-12 | 2020-02-04 | 西南交通大学 | 一种基于改进YOLOv3的细粒度图像分类方法 |
CN110751076A (zh) * | 2019-10-09 | 2020-02-04 | 上海应用技术大学 | 车辆检测方法 |
CN110796168A (zh) * | 2019-09-26 | 2020-02-14 | 江苏大学 | 一种基于改进YOLOv3的车辆检测方法 |
-
2020
- 2020-02-18 CN CN202010100452.2A patent/CN111428558A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472514A (zh) * | 2019-07-22 | 2019-11-19 | 电子科技大学 | 一种自适应车辆目标检测算法模型及其构建方法 |
CN110796168A (zh) * | 2019-09-26 | 2020-02-14 | 江苏大学 | 一种基于改进YOLOv3的车辆检测方法 |
CN110751076A (zh) * | 2019-10-09 | 2020-02-04 | 上海应用技术大学 | 车辆检测方法 |
CN110751195A (zh) * | 2019-10-12 | 2020-02-04 | 西南交通大学 | 一种基于改进YOLOv3的细粒度图像分类方法 |
Non-Patent Citations (1)
Title |
---|
鞠默然,罗海波,王仲博等: "改进的YOLO V3算法及其在小目标检测中的应用", 《光学学报》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257793A (zh) * | 2020-10-26 | 2021-01-22 | 大连理工大学 | 一种基于改进YOLO v3算法的远距离交通标志检测方法 |
CN112270252A (zh) * | 2020-10-26 | 2021-01-26 | 西安工程大学 | 一种改进YOLOv2模型的多车辆目标识别方法 |
CN112507929A (zh) * | 2020-12-16 | 2021-03-16 | 武汉理工大学 | 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法 |
CN112507929B (zh) * | 2020-12-16 | 2022-05-13 | 武汉理工大学 | 一种基于改进YOLOv3网络的车身点焊焊渣精准检测方法 |
CN113971763A (zh) * | 2020-12-21 | 2022-01-25 | 河南铮睿科达信息技术有限公司 | 一种基于目标检测和超分重建的小目标分割方法和装置 |
CN113033284A (zh) * | 2020-12-22 | 2021-06-25 | 迪比(重庆)智能科技研究院有限公司 | 一种基于卷积神经网络的车辆实时超载检测方法 |
CN113076858A (zh) * | 2021-03-30 | 2021-07-06 | 深圳技术大学 | 基于深度学习的车辆信息检测方法、存储介质及终端设备 |
CN113128362A (zh) * | 2021-03-31 | 2021-07-16 | 广东工业大学 | 一种基于yolov3的无人机视角下小目标快速检测方法 |
CN113239842A (zh) * | 2021-05-25 | 2021-08-10 | 三门峡崤云信息服务股份有限公司 | 一种基于图像识别的天鹅检测方法及装置 |
CN113762190A (zh) * | 2021-09-15 | 2021-12-07 | 中科微至智能制造科技江苏股份有限公司 | 一种基于神经网络的包裹堆叠检测方法及装置 |
CN113762190B (zh) * | 2021-09-15 | 2024-03-29 | 中科微至科技股份有限公司 | 一种基于神经网络的包裹堆叠检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428558A (zh) | 一种基于改进YOLOv3方法的车辆检测方法 | |
CN111563508B (zh) | 一种基于空间信息融合的语义分割方法 | |
WO2022083784A1 (zh) | 一种基于车联网的道路检测方法 | |
CN110929577A (zh) | 一种基于YOLOv3的轻量级框架改进的目标识别方法 | |
CN111899227A (zh) | 基于无人机作业的铁路扣件缺陷自动采集辨识方法 | |
CN111461209B (zh) | 一种模型训练装置和方法 | |
CN111460919A (zh) | 一种基于改进YOLOv3的单目视觉道路目标检测及距离估计方法 | |
CN110807924A (zh) | 基于全量全样实时交通数据的多参数融合方法及系统 | |
CN113076804B (zh) | 基于YOLOv4改进算法的目标检测方法、装置及系统 | |
CN112434723B (zh) | 一种基于注意力网络的日/夜间图像分类及物体检测方法 | |
CN114332473B (zh) | 目标检测方法、装置、计算机设备、存储介质及程序产品 | |
CN113239753A (zh) | 基于YOLOv4改进的交通标志检测与识别方法 | |
CN110599459A (zh) | 基于深度学习的地下管网风险评估云系统 | |
CN112990065A (zh) | 一种基于优化的YOLOv5模型的车辆分类检测方法 | |
US20230222768A1 (en) | Multiscale point cloud classification method and system | |
CN110751076A (zh) | 车辆检测方法 | |
CN114566052B (zh) | 一种基于车流方向判别高速公路车流监控设备转动的方法 | |
CN115240259A (zh) | 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统 | |
CN110263836B (zh) | 一种基于多特征卷积神经网络的不良驾驶状态识别方法 | |
CN116310328A (zh) | 基于跨图像相似度关系的语义分割知识蒸馏方法及系统 | |
CN112785610B (zh) | 一种融合低层特征的车道线语义分割方法 | |
CN116977712B (zh) | 基于知识蒸馏的道路场景分割方法、系统、设备及介质 | |
CN110765900A (zh) | 一种基于dssd的自动检测违章建筑方法及系统 | |
CN117011219A (zh) | 物品质量检测方法、装置、设备、存储介质和程序产品 | |
CN114998866A (zh) | 一种基于改进YOLOv4的交通标志识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200717 |