CN116152777A

CN116152777A - 基于yolov5的常用交通标志识别方法、系统及存储介质

Info

Publication number: CN116152777A
Application number: CN202310000206.3A
Authority: CN
Inventors: 王传钊; 吴锐; 谢乐成
Original assignee: Chongqing Changan Automobile Co Ltd
Current assignee: Chongqing Changan Automobile Co Ltd
Priority date: 2023-01-02
Filing date: 2023-01-02
Publication date: 2023-05-23

Abstract

本发明公开了一种基于yolov5的常用交通标志识别方法、系统及存储介质，包括：步骤1、常用交通标志分析：选择通过网上调研、爬虫方式，根据交通标志使用率的情况，得到最常用的交通标志种类，并将交通标志分为警告、指示和禁止三大类；步骤2、模型训练：获取开源数据集，通过python数据处理，得到一系列交通标志的训练集和测试集；线下拍摄视频，然后抽帧分析；搭建yolov5模型框架，并且使用训练集训练；根据初步训练的模型的测试情况，对模型和训练集进行优化；不断迭代模型，最后得出最优模型；步骤3、模型部署：将模型转换为onnx文件，部署到嵌入式终端上。本发明不仅检测速度快，检测精度高，还占用显存空间小，识别目标种类多。

Description

基于yolov5的常用交通标志识别方法、系统及存储介质

技术领域

本发明属于交通标志识别技术领域，具体涉及一种基于yolov5的常用交通标志识别方法、系统及存储介质。

背景技术

专利文献CN112464911A公开的基于改进YOLOv3-tiny的交通标志检测与识别方法，运用了yolov3-tiny模型来进行交通标志检测，对数据集进行了色相、对比度、饱和度和亮度的扩增。其方法基于yolov3-tiny修改了backbone网络架构，修改了尺度分支，使模型更加轻量化，便于嵌入式。但是无论如何修改网络结构，yolov3-tiny的模型识别率和模型大小仍然效果不佳，尤其是对小目标检测。

因此，需要开发一种新的基于yolov5的常用交通标志识别方法、系统及存储介质。

发明内容

本发明的目的在于提供一种基于yolov5的常用交通标志识别方法、系统及存储介质，不仅检测速度快，检测精度高，还占用显存空间小，识别目标种类多。

第一方面，本发明所述的一种基于yolov5的常用交通标志识别方法，包括以下步骤：

步骤1、常用交通标志分析：

选择通过网上调研、爬虫方式，根据交通标志使用率的情况，得到最常用的交通标志种类，并将交通标志分为警告、指示和禁止三大类；

步骤2、模型训练：

获取开源数据集，通过python数据处理，得到一系列交通标志的训练集和测试集；

线下拍摄视频，然后抽帧分析；

搭建yolov5模型框架，并且使用训练集训练；

根据初步训练的模型的测试情况，对模型和训练集进行优化；

不断迭代模型，最后得出最优模型；

步骤3、模型部署：

将模型转换为onnx文件，部署到嵌入式终端上。

可选地，所述步骤2中，训练使用TT100K的数据，测试使用CCTSDB和BDD数据；

其中，TT100K是腾讯采集的数据集，包括300多种不同种类的交通标志；

CCTSDB是长沙理工大学搜集的数据集，包括train和test两个文件，其中train包含16000张左右的训练图片，test包含有800张的测试图片；

BDD数据的train文件包含有70000张图片，test文件包含有20000张图片，val文件包含有10000张图片。

可选地，所述步骤2中，模型的测试包括测试@0.5map、测试召回率、测试FPS和测试线下视频文件。

可选地，所述步骤2中，优化训练集，具体为：根据测试情况增加训练集，或者添加负样本，或者添加额外种类。

可选地，所述步骤2中，优化模型，具体为：

将图像增强，使用左右翻转，马赛克增强，mixup；

使用yolov5的v4版本，在backbone添加一层

[-1,1,Conv,[768,3,2]],#7-P5/32；

[-1,3,C3,[768]]。

第二方面，本发明所述的一种基于yolov5的常用交通标志识别系统，包括存储器和控制器，所述存储器内存储有计算机可读程序，所述计算机可读程序被调用时能执行如本发明所述的基于yolov5的常用交通标志识别方法的步骤。

第三方面，本发明所述的一种存储介质，其内存储有计算机可读程序，所述计算机可读程序被调用时能执行如本发明所述的基于yolov5的常用交通标志识别方法的步骤。

本发明具有以下优点：本发明提供一种能够产业化、量产化的基于yolov5的常用交通标志识别的方法，不仅检测速度快，检测精度高，还占用显存空间小，识别目标种类多。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为数据选取到模型训练到模型部署流程图；

图2为yolov5基础网络结构；

图3为最终模型结果。

具体实施方式

以下将结合附图对本发明进行详细的说明。

如图1所示，本实施例中，一种基于yolov5的常用交通标志识别方法，包括以下步骤：

步骤1、常用交通标志分析：

步骤2、模型训练：

线下拍摄视频，然后抽帧分析；

搭建yolov5模型框架，并且使用训练集训练；

不断迭代模型，最后得出最优模型；

步骤3、模型部署：

将模型转换为onnx文件，部署到嵌入式终端上。

如图2所示，yolov5的基础网络架构：

input：Mosain数据增强+自适应anchor+自适应图片放缩；

backbone：采用Focus+cspnet网络。

Neck：FPN+PAN；

Prodiction：Giou_loss。

如图3所示，是模型训练结果：

召回率：0.93；

@0.5map：0.96。

结合对本基于yolov5的常用交通标志识别方法进行详细的描述：

一、首先要配置yolov5模型的实现环境

一块支持cuda的Nvidia显卡，anaconda-python3.8，cuda＝＝10.2，window10系统，pytorch＝＝1.7.0。

二、寻找开源数据集和线下收集数据集

现有自动驾驶之交通标志识别数据集，主要的有CCTSDB、BDD、TT100K和GTSRB。

CCTSDB是长沙理工大学搜集的数据集，包含train和test两个文件。其中train包含16000张左右的训练图片，test包含800的测试图片。每一个中的交通标志都被标注为3类：指示标志、禁止标志、警告标志。但是由于图像分辨率低，小目标交通标志少，不利于模型训练。

BDD数据集，train文件包括70000张图片，test文件包括20000张图片，val文件包括10000图片。标注种类繁多，其中关于交通标志的标注，BDD将所有交通标志分为一个大类。因此可以借鉴，但是不能直接来训练。

TT100K，是腾讯采集的数据集，包括300多种不同种类的交通标志，大部分交通标志都是小目标，交通标志的数据量低于100。

GTSRB，是分类数据，大部分都是单独的交通标志图片，适用于分类模型。

因此综上分析，将交通标志分为三大类。训练主要使用TT100K的数据，测试主要使用CCTSDB和BDD数据。

三：使用python构建yolov5训练需要的数据集+划分训练集和测试集

yolov5数据文件目录格式：

images labels

train train

val val

yolov5的训练数据标签格式：

category(0，1，2，3，…)rx ry w h

然后按照训练集：测试集＝10：1的比例分配。

四：配置超参数，准备训练模型

yolov5的超参数特别的，最重要需要修改的包括：

1：epochs：训练轮数，本专利设置为40次。

2：img-size：输入图片分辨率，一般情况下较大的分辨率效果好，但是分辨率提高，FPS会降低。本实施例中设置为1280x1280；

3：batch-size：根据GPU显存配置，本实施例中设置的8。

4：noautoanchor：是否使用自动聚类anchor。

五：模型训练+导出

模型训练40次，导出文件为.pt文件。

六：模型测试

1：测试@0.5的map；

2：测试召回率；

3：测试FPS；

4：测试线下视频文件。

七：优化模型

1：优化训练集

根据测试情况，增加训练集，或者添加负样本，或者添加额外种类。

2：优化模型

1：图像增强，使用左右翻转，马赛克增强，mixup。

2：使用yolov5v4版本，在backbone添加一层

[-1,1,Conv,[768,3,2]],#7-P5/32

[-1,3,C3,[768]]。

八：模型转换onnx+部署+落地检测

1：将pt模型转换为onnx文件，再将模型部署到嵌入式终端。

2：车辆通过摄像头传入视频数据，模型识别视频，检测出交通标志种类和位置，提醒车主。

本实施例中，一种基于yolov5的常用交通标志识别系统，包括存储器和控制器，所述存储器内存储有计算机可读程序，所述计算机可读程序被调用时能执行如本实施例中所述的基于yolov5的常用交通标志识别方法的步骤。

本实施例中，一种存储介质，其内存储有计算机可读程序，所述计算机可读程序被调用时能执行如本实施例中所述的基于yolov5的常用交通标志识别方法的步骤。

需要说明的是，本实施例所示的存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于yolov5的常用交通标志识别方法，其特征在于，包括以下步骤：

步骤1、常用交通标志分析：

步骤2、模型训练：

线下拍摄视频，然后抽帧分析；

搭建yolov5模型框架，并且使用训练集训练；

不断迭代模型，最后得出最优模型；

步骤3、模型部署：

将模型转换为onnx文件，部署到嵌入式终端上。

2.根据权利要求1所述的基于yolov5的常用交通标志识别方法，其特征在于：所述步骤2中，训练使用TT100K的数据，测试使用CCTSDB和BDD数据；

3.根据权利要求1或2所述的基于yolov5的常用交通标志识别方法，其特征在于：所述步骤2中，模型的测试包括测试@0.5map、测试召回率、测试FPS和测试线下视频文件。

4.根据权利要求3所述的基于yolov5的常用交通标志识别方法，其特征在于：所述步骤2中，优化训练集，具体为：根据测试情况增加训练集，或者添加负样本，或者添加额外种类。

5.根据权利要求4所述的基于yolov5的常用交通标志识别方法，其特征在于：所述步骤2中，优化模型，具体为：

将图像增强，使用左右翻转，马赛克增强，mixup；

使用yolov5的v4版本，在backbone添加一层

[-1,1,Conv,[768,3,2]],#7-P5/32；

[-1,3,C3,[768]]。

6.一种基于yolov5的常用交通标志识别系统，其特征在于：包括存储器和控制器，所述存储器内存储有计算机可读程序，所述计算机可读程序被调用时能执行如权利要求1至5任一所述的基于yolov5的常用交通标志识别方法的步骤。

7.一种存储介质，其特征在于：其内存储有计算机可读程序，所述计算机可读程序被调用时能执行如权利要求1至5任一所述的基于yolov5的常用交通标志识别方法的步骤。