CN114648513B

CN114648513B - 一种基于自标注数据增广的摩托车检测方法

Info

Publication number: CN114648513B
Application number: CN202210322932.2A
Authority: CN
Inventors: 刘永桂; 李小龙
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2022-03-29
Filing date: 2022-03-29
Publication date: 2022-11-29
Anticipated expiration: 2042-03-29
Also published as: CN114648513A

Abstract

本发明公开了一种基于自标注数据增广的摩托车检测方法，包括以下步骤：获取原始数据，并分为初始视频数据和测试视频；在初始视频数据中获取样本，标注样本中车辆在帧图片中的位置及车辆类别，并转化为YOLOv5所需格式，经过数据处理得到训练集和验证集；对标注数据集进行单图片式数据增广，得到训练集和验证集；对标注数据集进行多图片式数据增广，得到训练集和验证集；将训练集和验证集输入到YOLOv5模型，得到子标注数据训练的权重文件；将得到的权重文件输入到YOLOv5模型，采用测试视频进行测试，得到摩托车信息。本发明采用上述基于自标注数据增广的摩托车检测方法，能够解决现有的目标检测算法对摩托车识别准确率低、检测不稳定的问题。

Description

一种基于自标注数据增广的摩托车检测方法

技术领域

本发明涉及目标检测技术领域，尤其是涉及一种基于自标注数据增广的摩托车检测方法。

背景技术

随着社会的飞速发展，车辆越来越多，道路情况越来越复杂，越来越多的人选择摩托车作为交通工具出行，给人们带来便利的同时，越来越多的道路交通事故在发生。所以检测道路上摩托车的位置，进行后续地跟踪、分析，以及时预防一些可能会发生的交通事故。

传统的目标检测算法有CNN、RCNN、fastRCNN等，从卷积神经网络提取特征，但生成的候选框有大量重叠的现象。2016年，Redmon提出了YOLO算法，将图像分成网格来预测类别概率和位置，到2018年，又提出了YOLOv3算法，通过FPN结构进行多尺度预测；到现在的YOLOv5算法，加入了Mosaic数据增强，采用两种激活函数式，检测性能大大提高。

YOLOv5模型的原有数据集在检测车辆时较为稳定，但对摩托车检测不稳定，甚至很难检测出来。在道路上来说，车辆较摩托车多，同时摩托车较车辆为小目标，所以要想稳定检测摩托车，数据量远远不够。YOLOv5自带的数据增强是翻转、旋转、缩放等一系列操作，使得小目标的检测有提升，但仍存在小目标检测不稳定的问题。

发明内容

本发明的目的是提供一种基于自标注数据增广的摩托车检测方法，解决现有的目标检测算法对摩托车识别准确率低、检测不稳定的问题。

为实现上述目的，本发明提供了一种基于自标注数据增广的摩托车检测方法，包括以下步骤：

S1、获取实际道路交通视频作为原始数据，并选取部分未经任何处理的原始数据作为测试视频，其余的为初始视频数据；

S2、在初始视频数据中获取样本，标注样本中车辆在帧图片中的位置及车辆类别，并转化为YOLOv5所需格式，经过数据处理得到训练集和验证集；

S3、对标注数据集进行单图片式数据增广，采用手动增加的方式对小数据集进行扩充，得到训练集和验证集；

S4、改变数据增广方式为多图片式数据增广，得到训练集和验证集；

S5、将训练集和验证集输入到YOLOv5模型，经过训练后，得到子标注数据训练的权重文件；

S6、将得到的权重文件输入到YOLOv5模型，采用测试视频进行测试，得到摩托车信息。

优选的，所述步骤S1中，将初始视频数据截取包含摩托车的视频片段，并进行逐帧读取输出，得到帧图片。

优选的，所述步骤S2中，将帧图片放在文件夹中；采用已有的python标注算法进行手动标注帧图片中目标进行PasvalVOC标注，得到PasvalVOC的xml格式文件；读取xml文件，通过xml2yolo.py脚本文件，将xml格式的PasvalVoc数据集转化成txt格式的YOLOV5所需格式数据集；txt文件中目标信息的内容格式为(class,x_width,y_height,w_width,h_height)，上述参数与PasvalVoc数据集的xml格式对应关系为：

其中class表示类别，小车car、货车truck、摩托车motor；w_image、h_image分别代表图片的宽、高，xmin、ymin代表目标框的左上角坐标，xmax、ymax代表目标框的右下角坐标；x_width、y_height分别表示标注目标的中心点位置横坐标与图片宽度的比值、纵坐标与图片高度的比值，w_width、h_height分别表示标注目标的宽度与图片宽度的比值、高度与图片高度的比值，x_width、y_height、w_width、h_height的值均小于1；

将所有包含摩托车motor类别的txt标签划分出来，按照8：2的比例划分成训练集train11_motor和验证集val11_motor；再按照8：2的比例将货车truck划分出来为训练集train11_truck和验证集val11_truck；最后按照8：2的比例将小车car划分出来为训练集train11_car和验证集val11_car；再将所有类别训练集合并、验证集合并，得到train11和val11。

优选的，所述步骤S3中，将步骤S2中标注数据集进行对motor的过采样，通过多次复制motor样本-粘贴motor样本操作来进行数据增广。

优选的，所述数据增广包括两种操作，第一种操作为不改变大小的单图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，不改变复制motor样本的大小，随机粘贴motor样本到图像中不与其他已标注的目标框重叠的位置；若复制motor样本框的二值为a，粘贴处二值为b，则经过m次粘贴motor样本操作后，图像计算为：

I₁为操作图片，经过不改变大小的单图片式数据增广操作完成后，得到一组操作图片数据，按照步骤S2的数据处理过程，将标注为PasvalVoc的xml格式，转换成YOLOv5的txt格式，经数据集划分得到单图片式数据增广的训练集train21和验证集val21；

第二种操作为改变大小的单图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，改变复制motor样本的大小，随机粘贴motor样本到图像中不与其他已标注的目标框重叠的位置；复制motor样本框的二值为a，粘贴处二值为b，缩放率为h；若粘贴motor样本在复制motor样本的上方，即粘贴在y值更小的地方，缩放率h小于1；若粘贴motor样本在复制motor样本的下方，即粘贴在y值更大的地方，缩放率h大于1；若粘贴处和复制处y值相等，则h取1，在经过m次粘贴motor样本操作后，图像计算为：

在经过改变大小的单图片式数据增广操作后，得到一组操作图片数据，经步骤S2的数据处理过程，得到单图片式数据增广的训练集train22和验证集val22。

优选的，所述步骤S4中，采用多张图片混合进行复制motor样本-粘贴motor样本操作；

第一种操作为不改变大小的多图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，不改变复制motor样本的大小，随机粘贴motor样本在粘贴的图像I₁中不与其他已标注的目标框重叠的位置；复制的来源图片I₂、I₃、……复制motor样本框的二值为a，I₁粘贴处二值为b，则经过m+1张图片粘贴motor样本操作后，自身图像不进行样本复制，图像计算为：

经过不改变大小的多图片式数据增广操作完成后，得到一组操作图片数据，经步骤S2的数据处理过程，可得到多图片式数据增广的训练集train31和验证集val31；

第二种操作为改变大小的多图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，改变复制motor样本的大小，随机粘贴motor样本在图像I₁中不与其他已标注的目标框重叠的位置。图片I₂、I₃、……复制motor样本框的二值为a，I1粘贴处二值为b，缩放率为h，缩放率h的取值和步骤S3中的约定一致，在经过m+1次粘贴motor样本操作后，图像计算为：

在经过改变大小的多图片式数据增广操作后，得到一组操作图片数据，经步骤S2的数据处理过程，可得到多图片式数据增广的训练集train32和验证集val32。

优选的，所述步骤S5中，将步骤S2得到的一组原始标注数据集train11和val11、步骤S3得到的两组经单图片式数据增广操作处理后的数据集train21和val21以及train22和val22、步骤S4得到的两组经多图片式数据增广操作处理后的数据集train31和val31以及train32和val32的五组数据集，分别给到YOLOv5模型进行训练，得到相对应的训练文件。

优选的，所述步骤S6中，将步骤S5得到的训练文件的权重给到YOLOv5模型，并将步骤S1中的测试视频进行测试，得到相应的测试检测结果。

本发明所述的一种基于自标注数据增广的摩托车检测方法，通过对标注数据集进行不同程度的数据增广，将训练得到的权重重新输入到YOLOv5模型，并对测试视频进行测试，可以较稳定准确的检测出摩托车。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明一种基于自标注数据增广的摩托车检测方法实施例的检测步骤流程图；

图2为本发明一种基于自标注数据增广的摩托车检测方法实施例的单图片式数据增广示意图；

图3为本发明一种基于自标注数据增广的摩托车检测方法实施例的多图片式数据增广示意图；

图4为本发明一种基于自标注数据增广的摩托车检测方法实施例的数据增广处理过程。

具体实施方式

以下通过附图和实施例对本发明的技术方案作进一步说明。

实施例

一种基于自标注数据增广的摩托车检测方法，包括以下步骤：

S1、获取实际道路交通视频作为原始数据，并选取部分未经任何处理的原始数据作为测试视频，其余的为初始视频数据。本实施例使用的道路交通视频依托广州市越秀区区域内高速公路实际交通视频，作为本发明的原始数据。将初始视频数据截取包含摩托车的视频片段，并进行逐帧读取输出，得到1097个帧图片。

S2、在初始视频数据中获取样本，标注样本中车辆在帧图片中的位置及车辆类别，并转化为YOLOv5所需格式，经过数据处理得到训练集和验证集。

将上述1097个帧图片放在各自视频的12个文件夹中；并且每个文件夹中图片名称均以0序号开始，依次命名。不同文件夹中存在图片名称相同的问题，放置在统一的文件夹中需要提前修改帧图片的名称。本实施例中按照“图片原始名称_所属文件夹名称”格式将图片重新命名。

本实施例中标注类别包括小车car、货车truck、摩托车motor。采用已有的python标注算法进行手动标注帧图片中目标进行PasvalVOC标注，得到PasvalVOC的xml格式文件。xml文件中目标信息的部分内容格式如下：

<name>class</name>

<width>w_image</width>

<height>h_image</height>

其中，class表示类别，w_image、h_image分别代表图片的宽、高，xmin、ymin代表目标框的左上角坐标，xmax、ymax代表目标框的右下角坐标。

读取xml文件，通过xml2yolo.py脚本文件，将xml格式的PasvalVoc数据集转化成txt格式的YOLOV5所需格式数据集。txt文件中目标信息的内容格式为(class,x_width,y_height,w_width,h_height)，上述参数与PasvalVoc数据集的xml格式对应关系为：

其中，x_width、y_height分别表示标注目标的中心点位置横坐标与图片宽度的比值、纵坐标与图片高度的比值，w_width、h_height分别表示标注目标的宽度与图片宽度的比值、高度与图片高度的比值，x_width、y_height、w_width、h_height的值均小于1；即对YOLOV数据txt文件做了归一化处理。

首先，将所有包含摩托车motor类别的txt标签划分出来，按照8：2的比例划分成训练集train11_motor和验证集val11_motor。对相应的帧图片进行筛选，保证训练集、验证集保持一致。按照划分摩托车motor同样的操作，将剩余的货车truck按照8：2的比例划分出来为训练集train11_truck和验证集val11_truck。最后按照8：2的比例将小车car划分出来为训练集train11_car和验证集val11_car。再将所有类别训练集合并、验证集合并，得到train11和val11，对应的图片和标签名称一致。

S3、对标注数据集进行单图片式数据增广，采用手动增加的方式对小数据集进行扩充，得到训练集和验证集。

步骤S2中得到的摩托车motor数据量相对较少，而且motor相对于car和truck来说目标较小，所以即使在数据样本处理中，渠道的每张图片均含有motor，但作为小目标来说，数据量不够。因此将步骤S1中得到的帧图片进行对motor的过采样，即数据增广，通过多次复制motor样本-粘贴motor样本操作来进行数据增广。

在粘贴小目标的副样本时，保证与已标注的目标框不重叠，在随机位置多次复制motor样本-粘贴motor样本，单图片式数据增广复制粘贴的来源为当前图片。由于摄像头拍摄的视频视角为图像上方较远、目标较小、像素变化慢，图像下方则较近、目标较大、像素变化快，所以本实施例中单图片式数据增广提供两种操作，操作图片为I₁，操作仅涉及复制粘贴，不涉及图像的翻转。

第一种操作为不改变大小的单图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，不改变复制motor样本的大小，随机粘贴motor样本到图像中不与其他已标注的目标框重叠的位置。若复制motor样本框的二值为a，粘贴处二值为b，则经过m次粘贴motor样本操作后，图像计算为：

经过不改变大小的单图片式数据增广操作完成后，得到一组操作图片数据，按照步骤S2的数据处理过程，将标注为PasvalVoc的xml格式，转换成YOLOv5的txt格式，经数据集划分得到单图片式数据增广的训练集train21和验证集val21。

第二种操作为改变大小的单图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，改变复制motor样本的大小，随机粘贴motor样本到图像中不与其他已标注的目标框重叠的位置。若复制motor样本框的二值为a，粘贴处二值为b，缩放率为h；若粘贴motor样本在复制motor样本的上方，即粘贴在y值更小的地方，缩放率h小于1；若粘贴motor样本在复制motor样本的下方，即粘贴在y值更大的地方，缩放率h大于1；若粘贴处和复制处y值相等，则h取1。在经过m次粘贴motor样本操作后，图像计算为：

S4、改变数据增广方式为多图片式数据增广，得到训练集和验证集。

步骤S3采用单图片式数据增广来扩充摩托车motor的数据量，复制motor样本-粘贴motor样本操作只在同一张图片上进行，虽在相同图片上，粘贴样本和背景可以更好地融合，但相当于在一幅图像的不同位置，目标的位置信息在当前图片取出来的几乎一样，在训练同一个目标。所以采用多张图片混合进行复制motor样本-粘贴motor样本操作。在粘贴小目标的副样本时，保证与已标注的目标框不重叠，在随机位置多次复制motor样本-粘贴motor样本，多图片式数据增广具体操作为复制的来源为图片I₂、I₃、……，粘贴的图像取I₁。

同样由于摄像头视角问题，本实施例中多图片式数据增广提供两种操作，操作仅涉及复制粘贴，不涉及图像的翻转。

第一种操作为不改变大小的多图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，不改变复制motor样本的大小，随机粘贴motor样本在图像I₁中不与其他已标注的目标框重叠的位置；若图片I₂、I₃、……复制motor样本框的二值为a，I₁粘贴处二值为b，则经过m+1张图片粘贴motor样本操作后，自身图像不进行样本复制，图像计算为：

经过不改变大小的多图片式数据增广操作完成后，得到一组操作图片数据，经步骤S2的数据处理过程，可得到多图片式数据增广的训练集train31和验证集val31。

第二种操作为改变大小的多图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，改变复制motor样本的大小，随机粘贴motor样本在图像I₁中不与其他已标注的目标框重叠的位置。若图片I₂、I₃、……复制motor样本框的二值为a，I1粘贴处二值为b，缩放率为h，缩放率h的取值和步骤S3中的约定一致，在经过m+1次粘贴motor样本操作后，图像计算为：

S5、将训练集和验证集输入到YOLOv5模型，经过训练后，得到子标注数据训练的权重文件。

将步骤S2得到的一组原始标注数据集train11和val11、步骤S3得到的两组经单图片式数据增广操作处理后的数据集train21和val21以及train22和val22、步骤S4得到的两组经多图片式数据增广操作处理后的数据集train31和val31以及train32和val32的五组数据集，分别给到YOLOv5模型进行训练，得到相对应的训练文件。

S6、将得到的权重文件输入到YOLOv5模型，采用测试视频进行测试，得到摩托车信息。将步骤S5得到的训练文件的权重给到YOLOv5模型，并将步骤S1中的测试视频进行测试，得到相应的测试检测结果。

因此，本发明采用上述基于自标注数据增广的摩托车检测方法，能够解决现有的目标检测算法对摩托车识别准确率低、检测不稳定的问题。

最后应说明的是：以上实施例仅用以说明本发明的技术方案而非对其进行限制，尽管参照较佳实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对本发明的技术方案进行修改或者等同替换，而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims

1.一种基于自标注数据增广的摩托车检测方法，其特征在于，包括以下步骤：

S6、将得到的权重文件输入到YOLOv5模型，采用测试视频进行测试，得到摩托车信息；

所述步骤S3中，将步骤S2中标注数据集进行对motor的过采样，通过多次复制motor样本-粘贴motor样本操作来进行数据增广；

所述数据增广包括两种操作，第一种操作为不改变大小的单图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，不改变复制motor样本的大小，随机粘贴motor样本到图像中不与其他已标注的目标框重叠的位置；若复制motor样本框的二值为a，粘贴处二值为b，则经过m次粘贴motor样本操作后，图像计算为：

在经过改变大小的单图片式数据增广操作后，得到一组操作图片数据，经步骤S2的数据处理过程，得到单图片式数据增广的训练集train22和验证集val22；

所述步骤S4中，采用多张图片混合进行复制motor样本-粘贴motor样本操作；

第二种操作为改变大小的多图片式数据增广操作，复制motor样本-粘贴motor样本的过程中，改变复制motor样本的大小，随机粘贴motor样本在图像I₁中不与其他已标注的目标框重叠的位置；图片I₂、I₃、……复制motor样本框的二值为a，I1粘贴处二值为b，缩放率为h，缩放率h的取值和步骤S3中的约定一致，在经过m+1次粘贴motor样本操作后，图像计算为：

2.根据权利要求1所述的一种基于自标注数据增广的摩托车检测方法，其特征在于：所述步骤S1中，将初始视频数据截取包含摩托车的视频片段，并进行逐帧读取输出，得到帧图片。

3.根据权利要求2所述的一种基于自标注数据增广的摩托车检测方法，其特征在于：所述步骤S2中，将帧图片放在文件夹中；采用已有的python标注算法进行手动标注帧图片中目标进行PasvalVOC标注，得到PasvalVOC的xml格式文件；读取xml文件，通过xml2yolo.py脚本文件，将xml格式的PasvalVoc数据集转化成txt格式的YOLOV5所需格式数据集；txt文件中目标信息的内容格式为(class,x_width,y_height,w_width,h_height)上述参数与，PasvalVoc数据集的xml格式对应关系为：

4.根据权利要求1所述的一种基于自标注数据增广的摩托车检测方法，其特征在于：所述步骤S5中，将步骤S2得到的一组原始标注数据集train11和val11、步骤S3得到的两组经单图片式数据增广操作处理后的数据集train21和val21以及train22和val22、步骤S4得到的两组经多图片式数据增广操作处理后的数据集train31和val31以及train32和val32的五组数据集，分别给到YOLOv5模型进行训练，得到相对应的训练文件。

5.根据权利要求4所述的一种基于自标注数据增广的摩托车检测方法，其特征在于：所述步骤S6中，将步骤S5得到的训练文件的权重给到YOLOv5模型，并将步骤S1中的测试视频进行测试，得到相应的测试检测结果。