CN116152777A - 基于yolov5的常用交通标志识别方法、系统及存储介质 - Google Patents
基于yolov5的常用交通标志识别方法、系统及存储介质 Download PDFInfo
- Publication number
- CN116152777A CN116152777A CN202310000206.3A CN202310000206A CN116152777A CN 116152777 A CN116152777 A CN 116152777A CN 202310000206 A CN202310000206 A CN 202310000206A CN 116152777 A CN116152777 A CN 116152777A
- Authority
- CN
- China
- Prior art keywords
- model
- training
- traffic sign
- test
- yolov5
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/116—Details of conversion of file system types or formats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于yolov5的常用交通标志识别方法、系统及存储介质,包括:步骤1、常用交通标志分析:选择通过网上调研、爬虫方式,根据交通标志使用率的情况,得到最常用的交通标志种类,并将交通标志分为警告、指示和禁止三大类;步骤2、模型训练:获取开源数据集,通过python数据处理,得到一系列交通标志的训练集和测试集;线下拍摄视频,然后抽帧分析;搭建yolov5模型框架,并且使用训练集训练;根据初步训练的模型的测试情况,对模型和训练集进行优化;不断迭代模型,最后得出最优模型;步骤3、模型部署:将模型转换为onnx文件,部署到嵌入式终端上。本发明不仅检测速度快,检测精度高,还占用显存空间小,识别目标种类多。
Description
技术领域
本发明属于交通标志识别技术领域,具体涉及一种基于yolov5的常用交通标志识别方法、系统及存储介质。
背景技术
专利文献CN112464911A公开的基于改进YOLOv3-tiny的交通标志检测与识别方法,运用了yolov3-tiny模型来进行交通标志检测,对数据集进行了色相、对比度、饱和度和亮度的扩增。其方法基于yolov3-tiny修改了backbone网络架构,修改了尺度分支,使模型更加轻量化,便于嵌入式。但是无论如何修改网络结构,yolov3-tiny的模型识别率和模型大小仍然效果不佳,尤其是对小目标检测。
因此,需要开发一种新的基于yolov5的常用交通标志识别方法、系统及存储介质。
发明内容
本发明的目的在于提供一种基于yolov5的常用交通标志识别方法、系统及存储介质,不仅检测速度快,检测精度高,还占用显存空间小,识别目标种类多。
第一方面,本发明所述的一种基于yolov5的常用交通标志识别方法,包括以下步骤:
步骤1、常用交通标志分析:
选择通过网上调研、爬虫方式,根据交通标志使用率的情况,得到最常用的交通标志种类,并将交通标志分为警告、指示和禁止三大类;
步骤2、模型训练:
获取开源数据集,通过python数据处理,得到一系列交通标志的训练集和测试集;
线下拍摄视频,然后抽帧分析;
搭建yolov5模型框架,并且使用训练集训练;
根据初步训练的模型的测试情况,对模型和训练集进行优化;
不断迭代模型,最后得出最优模型;
步骤3、模型部署:
将模型转换为onnx文件,部署到嵌入式终端上。
可选地,所述步骤2中,训练使用TT100K的数据,测试使用CCTSDB和BDD数据;
其中,TT100K是腾讯采集的数据集,包括300多种不同种类的交通标志;
CCTSDB是长沙理工大学搜集的数据集,包括train和test两个文件,其中train包含16000张左右的训练图片,test包含有800张的测试图片;
BDD数据的train文件包含有70000张图片,test文件包含有20000张图片,val文件包含有10000张图片。
可选地,所述步骤2中,模型的测试包括测试@0.5map、测试召回率、测试FPS和测试线下视频文件。
可选地,所述步骤2中,优化训练集,具体为:根据测试情况增加训练集,或者添加负样本,或者添加额外种类。
可选地,所述步骤2中,优化模型,具体为:
将图像增强,使用左右翻转,马赛克增强,mixup;
使用yolov5的v4版本,在backbone添加一层
[-1,1,Conv,[768,3,2]],#7-P5/32;
[-1,3,C3,[768]]。
第二方面,本发明所述的一种基于yolov5的常用交通标志识别系统,包括存储器和控制器,所述存储器内存储有计算机可读程序,所述计算机可读程序被调用时能执行如本发明所述的基于yolov5的常用交通标志识别方法的步骤。
第三方面,本发明所述的一种存储介质,其内存储有计算机可读程序,所述计算机可读程序被调用时能执行如本发明所述的基于yolov5的常用交通标志识别方法的步骤。
本发明具有以下优点:本发明提供一种能够产业化、量产化的基于yolov5的常用交通标志识别的方法,不仅检测速度快,检测精度高,还占用显存空间小,识别目标种类多。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为数据选取到模型训练到模型部署流程图;
图2为yolov5基础网络结构;
图3为最终模型结果。
具体实施方式
以下将结合附图对本发明进行详细的说明。
如图1所示,本实施例中,一种基于yolov5的常用交通标志识别方法,包括以下步骤:
步骤1、常用交通标志分析:
选择通过网上调研、爬虫方式,根据交通标志使用率的情况,得到最常用的交通标志种类,并将交通标志分为警告、指示和禁止三大类;
步骤2、模型训练:
获取开源数据集,通过python数据处理,得到一系列交通标志的训练集和测试集;
线下拍摄视频,然后抽帧分析;
搭建yolov5模型框架,并且使用训练集训练;
根据初步训练的模型的测试情况,对模型和训练集进行优化;
不断迭代模型,最后得出最优模型;
步骤3、模型部署:
将模型转换为onnx文件,部署到嵌入式终端上。
如图2所示,yolov5的基础网络架构:
input:Mosain数据增强+自适应anchor+自适应图片放缩;
backbone:采用Focus+cspnet网络。
Neck:FPN+PAN;
Prodiction:Giou_loss。
如图3所示,是模型训练结果:
召回率:0.93;
@0.5map:0.96。
结合对本基于yolov5的常用交通标志识别方法进行详细的描述:
一、首先要配置yolov5模型的实现环境
一块支持cuda的Nvidia显卡,anaconda-python3.8,cuda==10.2,window10系统,pytorch==1.7.0。
二、寻找开源数据集和线下收集数据集
现有自动驾驶之交通标志识别数据集,主要的有CCTSDB、BDD、TT100K和GTSRB。
CCTSDB是长沙理工大学搜集的数据集,包含train和test两个文件。其中train包含16000张左右的训练图片,test包含800的测试图片。每一个中的交通标志都被标注为3类:指示标志、禁止标志、警告标志。但是由于图像分辨率低,小目标交通标志少,不利于模型训练。
BDD数据集,train文件包括70000张图片,test文件包括20000张图片,val文件包括10000图片。标注种类繁多,其中关于交通标志的标注,BDD将所有交通标志分为一个大类。因此可以借鉴,但是不能直接来训练。
TT100K,是腾讯采集的数据集,包括300多种不同种类的交通标志,大部分交通标志都是小目标,交通标志的数据量低于100。
GTSRB,是分类数据,大部分都是单独的交通标志图片,适用于分类模型。
因此综上分析,将交通标志分为三大类。训练主要使用TT100K的数据,测试主要使用CCTSDB和BDD数据。
三:使用python构建yolov5训练需要的数据集+划分训练集和测试集
yolov5数据文件目录格式:
images labels
train train
val val
yolov5的训练数据标签格式:
category(0,1,2,3,…)rx ry w h
然后按照训练集:测试集=10:1的比例分配。
四:配置超参数,准备训练模型
yolov5的超参数特别的,最重要需要修改的包括:
1:epochs:训练轮数,本专利设置为40次。
2:img-size:输入图片分辨率,一般情况下较大的分辨率效果好,但是分辨率提高,FPS会降低。本实施例中设置为1280x1280;
3:batch-size:根据GPU显存配置,本实施例中设置的8。
4:noautoanchor:是否使用自动聚类anchor。
五:模型训练+导出
模型训练40次,导出文件为.pt文件。
六:模型测试
1:测试@0.5的map;
2:测试召回率;
3:测试FPS;
4:测试线下视频文件。
七:优化模型
1:优化训练集
根据测试情况,增加训练集,或者添加负样本,或者添加额外种类。
2:优化模型
1:图像增强,使用左右翻转,马赛克增强,mixup。
2:使用yolov5v4版本,在backbone添加一层
[-1,1,Conv,[768,3,2]],#7-P5/32
[-1,3,C3,[768]]。
八:模型转换onnx+部署+落地检测
1:将pt模型转换为onnx文件,再将模型部署到嵌入式终端。
2:车辆通过摄像头传入视频数据,模型识别视频,检测出交通标志种类和位置,提醒车主。
本实施例中,一种基于yolov5的常用交通标志识别系统,包括存储器和控制器,所述存储器内存储有计算机可读程序,所述计算机可读程序被调用时能执行如本实施例中所述的基于yolov5的常用交通标志识别方法的步骤。
本实施例中,一种存储介质,其内存储有计算机可读程序,所述计算机可读程序被调用时能执行如本实施例中所述的基于yolov5的常用交通标志识别方法的步骤。
需要说明的是,本实施例所示的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (7)
1.一种基于yolov5的常用交通标志识别方法,其特征在于,包括以下步骤:
步骤1、常用交通标志分析:
选择通过网上调研、爬虫方式,根据交通标志使用率的情况,得到最常用的交通标志种类,并将交通标志分为警告、指示和禁止三大类;
步骤2、模型训练:
获取开源数据集,通过python数据处理,得到一系列交通标志的训练集和测试集;
线下拍摄视频,然后抽帧分析;
搭建yolov5模型框架,并且使用训练集训练;
根据初步训练的模型的测试情况,对模型和训练集进行优化;
不断迭代模型,最后得出最优模型;
步骤3、模型部署:
将模型转换为onnx文件,部署到嵌入式终端上。
2.根据权利要求1所述的基于yolov5的常用交通标志识别方法,其特征在于:所述步骤2中,训练使用TT100K的数据,测试使用CCTSDB和BDD数据;
其中,TT100K是腾讯采集的数据集,包括300多种不同种类的交通标志;
CCTSDB是长沙理工大学搜集的数据集,包括train和test两个文件,其中train包含16000张左右的训练图片,test包含有800张的测试图片;
BDD数据的train文件包含有70000张图片,test文件包含有20000张图片,val文件包含有10000张图片。
3.根据权利要求1或2所述的基于yolov5的常用交通标志识别方法,其特征在于:所述步骤2中,模型的测试包括测试@0.5map、测试召回率、测试FPS和测试线下视频文件。
4.根据权利要求3所述的基于yolov5的常用交通标志识别方法,其特征在于:所述步骤2中,优化训练集,具体为:根据测试情况增加训练集,或者添加负样本,或者添加额外种类。
5.根据权利要求4所述的基于yolov5的常用交通标志识别方法,其特征在于:所述步骤2中,优化模型,具体为:
将图像增强,使用左右翻转,马赛克增强,mixup;
使用yolov5的v4版本,在backbone添加一层
[-1,1,Conv,[768,3,2]],#7-P5/32;
[-1,3,C3,[768]]。
6.一种基于yolov5的常用交通标志识别系统,其特征在于:包括存储器和控制器,所述存储器内存储有计算机可读程序,所述计算机可读程序被调用时能执行如权利要求1至5任一所述的基于yolov5的常用交通标志识别方法的步骤。
7.一种存储介质,其特征在于:其内存储有计算机可读程序,所述计算机可读程序被调用时能执行如权利要求1至5任一所述的基于yolov5的常用交通标志识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310000206.3A CN116152777A (zh) | 2023-01-02 | 2023-01-02 | 基于yolov5的常用交通标志识别方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310000206.3A CN116152777A (zh) | 2023-01-02 | 2023-01-02 | 基于yolov5的常用交通标志识别方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116152777A true CN116152777A (zh) | 2023-05-23 |
Family
ID=86338293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310000206.3A Pending CN116152777A (zh) | 2023-01-02 | 2023-01-02 | 基于yolov5的常用交通标志识别方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116152777A (zh) |
-
2023
- 2023-01-02 CN CN202310000206.3A patent/CN116152777A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340131B (zh) | 图像的标注方法、装置、可读介质和电子设备 | |
Siriborvornratanakul | An automatic road distress visual inspection system using an onboard in‐car camera | |
CN110348294A (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
CN109947989B (zh) | 用于处理视频的方法和装置 | |
CN110245704B (zh) | 业务处理方法、装置、存储介质与电子设备 | |
Hakim et al. | Implementation of an image processing based smart parking system using Haar-Cascade method | |
JP2023176023A (ja) | 分散型データ分析のためのシステムおよび方法 | |
CN110727816A (zh) | 兴趣点类别确定方法和装置 | |
CN104520848A (zh) | 按照出席者搜索事件 | |
CN109816023B (zh) | 用于生成图片标签模型的方法和装置 | |
CN113673527B (zh) | 一种车牌识别方法及系统 | |
CN114549959A (zh) | 基于目标检测模型的红外弱小目标实时检测方法和系统 | |
CN111931721B (zh) | 年检标签颜色和个数的检测方法、装置及电子设备 | |
CN116884003B (zh) | 图片自动标注方法、装置、电子设备及存储介质 | |
CN113486856A (zh) | 一种基于语义分割和卷积神经网络的驾驶员不规范行为检测方法 | |
US10769768B1 (en) | Apparatus and method for providing application service using satellite image | |
CN113409393B (zh) | 用于识别交通标志牌的方法及装置 | |
CN107084728B (zh) | 用于检测数字地图的方法和装置 | |
CN116152777A (zh) | 基于yolov5的常用交通标志识别方法、系统及存储介质 | |
CN116071557A (zh) | 一种长尾目标检测方法、计算机可读存储介质及驾驶设备 | |
CN115061386B (zh) | 智能驾驶的自动化仿真测试系统及相关设备 | |
CN116052053A (zh) | 一种智慧文博下的监控图像准确度提升方法及装置 | |
CN114332716B (zh) | 视频中场景的聚类方法、装置、电子设备及存储介质 | |
CN113920127B (zh) | 一种训练数据集独立的单样本图像分割方法和系统 | |
CN112801960B (zh) | 图像处理方法及装置、存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |