CN110569379A

CN110569379A - 一种汽车配件图片数据集制作方法

Info

Publication number: CN110569379A
Application number: CN201910718143.9A
Authority: CN
Inventors: 曾万贵; 黄俊钧
Original assignee: Guangzhou Batulu Information Technology Co Ltd
Current assignee: Guangzhou Batulu Information Technology Co Ltd
Priority date: 2019-08-05
Filing date: 2019-08-05
Publication date: 2019-12-13

Abstract

本发明公开了一种汽车配件图片数据集制作方法，通过获取多个汽车配件图片，从多个汽车配件图片中筛选出符合要求的第一图片，并统一第一图片的尺寸及存储格式，再将第一图片进行数据增强处理，生成多个数据扩充后的图片，并将多个数据扩充后的图片作为第二图片，然后根据第一图片预先分类的信息，为第二图片添加相应的标签信息，最后根据标签信息，对第二图片进行分层采样，生成分类好的训练集、验证集以及测试集，采用本发明提供的实施例，能够生成高质量的数据集，用于与汽车配件图片相关的计算机视觉任务，解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。

Description

一种汽车配件图片数据集制作方法

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种汽车配件图片数据集制作方法。

背景技术

数据集是在各种场景下应用算法模型的基础，高质量的数据集能够最大程度地提高算法模型在任务中的性能表现。

在与汽车配件图片相关的计算机视觉应用场景下，用于训练模型的汽车配件图片存在如下问题：

(1)数量有限；

(2)格式(尺寸、存储格式)不统一；

(3)无标签(标签指这张图片代表什么配件/包含哪些配件/配件在图片中的具体位置/图中哪些像素属于某个配件)。

简言之，目前无现成的汽车配图片件数据集。

发明内容

本发明实施例的目的是提供一种汽车配件图片数据集制作方法，解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。

为实现上述目的，本发明实施例提供了一种汽车配件图片数据集制作方法，包括以下步骤：

获取多个汽车配件图片，从所述多个汽车配件图片中筛选出符合要求的第一图片，并统一所述第一图片的尺寸及存储格式；其中，符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片；

将所述第一图片进行数据增强处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；

根据所述第一图片预先分类的信息，为所述第二图片添加相应的标签信息；

根据所述标签信息，对所述第二图片进行分层采样，生成分类好的训练集、验证集以及测试集。

进一步的，所述多个汽车配件图片的获取方式，包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取，以及通过拍摄采集获取。

进一步的，所述数据增强处理方法，包括几何变换处理法、颜色变换处理法，以及对抗生成网络处理法；

所述几何变换处理法，通过将第一图片进行不同方位的翻转，以及不同方向不同角度的旋转，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；

所述颜色变换处理法，通过将第一图片进行降噪处理、高斯模糊处理，以及不同颜色变化处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；

所述对抗生成网络处理法，通过将第一图片输入至所述对抗生成网络，以使所述对抗生成网络进行自主生成多个类似的图片，并将所述多个类似的图片作为第二图片；

其中，每种数据增强处理方法对第一图片进行数据增强处理后生成的多个图片均不100％相同。

进一步的，所述第一图片预先分类的信息，通过以下方式获得：

在获取到所述多个汽车配件图片后，对所述多个汽车配件图片进行分类，并根据每个类别中的每个汽车配件图片，生成相应的标签文件；

其中，所述标签文件包括对应图片的存储路径或名称，以及是否为配件的标记信息。

本发明实施例还提供了一种汽车配件图片数据集制作装置，包括：图片获取模块、数据处理模块、标签信息模块以及数据集生成模块；

所述图片获取模块，用于获取多个汽车配件图片，从所述多个汽车配件图片中筛选出符合要求的第一图片，并统一所述第一图片的尺寸及存储格式；其中，符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片；

所述数据处理模块，用于将所述第一图片进行数据增强处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；

所述标签信息模块，用于根据所述第一图片预先分类的信息，为所述第二图片添加相应的标签信息；

所述数据集试生成模块，用于根据所述标签信息，对所述第二图片进行分层采样，生成分类好的训练集、验证集以及测试集。

作为本发明的优选实施例，本发明还提供了一种汽车配件图片数据集制作设备，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现上述发明实施例所述的汽车配件图片数据集制作方法。

本发明另一实施例提供了一种存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述发明实施例所述的汽车配件图片数据集制作方法。

与现有技术相比，具有如下有益效果：

本发明实施例提供的汽车配件图片数据集制作方法，通过获取多个汽车配件图片，从多个汽车配件图片中筛选出符合要求的第一图片，并统一第一图片的尺寸及存储格式，再将第一图片进行数据增强处理，生成多个数据扩充后的图片，并将多个数据扩充后的图片作为第二图片，然后根据第一图片预先分类的信息，为第二图片添加相应的标签信息，最后根据标签信息，对第二图片进行分层采样，生成分类好的训练集、验证集以及测试集，采用本发明提供的实施例，能够生成高质量的数据集，用于与汽车配件图片相关的计算机视觉任务，解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。

附图说明

图1是本发明提供的汽车配件图片数据集制作方法的一个实施例的流程示意图；

图2是本发明提供的汽车配件图片数据集制作装置的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明提供的汽车配件图片数据集制作方法的一个实施例的流程示意图；本发明实施例提供一种汽车配件图片数据集制作方法，包括步骤S1-S4；

S1，获取多个汽车配件图片，从所述多个汽车配件图片中筛选出符合要求的第一图片，并统一所述第一图片的尺寸及存储格式。

在本实施例中，所述多个汽车配件图片的获取方式，包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取，以及通过拍摄采集获取，但不限于为其他能够获取汽车配件图片的方式。

其中，符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片。

对第一图片的尺寸及存储格式的统一，是利用Python第三方图像处理标准库pillow对第一图片进行尺寸及存储格式的统一。具体流程为：统一图片尺寸→统一格式存储。尺寸及格式具体为何不是重点，只要数据集中图片的尺寸及格式是统一的即可。

S2，将所述第一图片进行数据增强处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片。

优选的，所述数据增强处理方法，包括几何变换处理法、颜色变换处理法，以及对抗生成网络处理法；

所述几何变换处理法，通过将第一图片进行不同方位的翻转，以及不同方向不同角度的旋转，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；所述颜色变换处理法，通过将第一图片进行降噪处理、高斯模糊处理，以及不同颜色变化处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；所述对抗生成网络处理法，通过将第一图片输入至所述对抗生成网络，以使所述对抗生成网络进行自主生成多个类似的图片，并将所述多个类似的图片作为第二图片；其中，每种数据增强处理方法对第一图片进行数据增强处理后生成的多个图片均不100％相同。

具体的，只要通过图像处理方法得到与原图像不100％相同的图，对于算法模型都属于不同的一张图，这也是为何数据增强方法能够解决训练算法模型时数据量不足的问题。其中，所述几何变换处理法包括翻转、旋转、裁剪、变形、缩放等处理法，所述颜色变换处理法包括噪声、模糊、颜色扰动等处理法，所述对抗生成网络是一种能够学习图片风格并进行自主生成类似/迁移风格的图片的算法模型，用于将图片进行自主分类。

需要说明的是，数据增强是在不实质性增加数据的情况下，让有限的数据产生等价于更多数据的价值，其中，上述三种数据增强处理方法，可以只选其中一种进行数据增强，也可组合进行，如几何变换+颜色变换，具体为：将图片向上/下/左/右翻转、顺时针旋转90°/180°/270°，以及噪声处理、高斯模糊处理、颜色变化处理。

S3，根据所述第一图片预先分类的信息，为所述第二图片添加相应的标签信息。

在本实施例中，所述第一图片预先分类的信息，通过以下方式获得：在获取到所述多个汽车配件图片后，对所述多个汽车配件图片进行分类，并根据每个类别中的每个汽车配件图片，生成相应的标签文件；其中，所述标签文件包括对应图片的存储路径或名称，以及是否为配件的标记信息。

为了满足计算机视觉四大基本任务要求(图像分类、目标定位、目标检测以及语义分割)，我们预先对第一图片进行了预处理，具体为：对于分类任务，在人工选取图片过程中，已经将图片进行了分类，不同类图片在不同文件夹，写一段程序即可实现对不同文件夹中的图片生成标签文件，如txt文本，里面有两列数据，一列是图片的存储路径或名称，另外一列则是图片对应的标记信息，如分类任务中，标记信息可以为数字“1”代表配件，数字“0”代表非配件；对于目标定位/检测任务，利用图像标注工具如LabelImg，通过手工标注的方式框选出目标，然后生成XML格式的标签文件，每份XML文件对应一张图片，在目标定位及检测任务中，标记信息则为图片中目标的坐标位置；对于语义分割任务，利用图像标注工具如Labelme，通过手工标注的方式框选出目标，然后生成json格式的标签文件，每份json文件对应一张图片，标记信息则为目标像素所属类别。

S4，根据所述标签信息，对所述第二图片进行分层采样，生成分类好的训练集、验证集以及测试集。

需要说明的是，通过保留类别比例的采样方式通常称为“分层采样”，该采样方式目的是使训练/测试集的划分尽可能保持数据分布的一致性，避免因数据划分过程引入额外的偏差而对最终结果产生影响。以二分类任务为例，假定数据集D包含1000个样本，通过对D进行分层采样而获得含70％样本的训练集S和含30％样本的训练集T，若D包含500个正样本，500个负样本，则分层采样得到的S应包含350个正样本，350个负样本，而T包含150个正样本，150个负样本。

为了更好的说明本发明实施例提供的汽车配件图片数据集制作方法的原理，以下为实现本发明的具体步骤：首先从本身汽配电商平台数据库中抓取、通过网络爬虫获取或人工拍摄采集汽车配件图片，然后选取配件拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片，再将选好的图片统一图片尺寸及存储格式，然后通过几何变换(翻转、旋转、裁剪、变形、缩放等)、颜色变换(噪声、模糊、颜色扰动等)及对抗生成网络(GenerativeAdversarial Networks,GAN)进行数据扩增，再为数据扩增后的汽车配件图片添加标记信息，标记信息可为代表类别的数字、配件名称、配件在图片中的位置、图片像素所属类别，最后通过能够保留类别比例的分层采样方法将数据集划分为训练集、验证集、测试集。

作为本发明提供的优选实施例，请参见图2，图2是本发明提供的汽车配件图片数据集制作装置的一个实施例的结构示意图，包括：图片获取模块、数据处理模块、标签信息模块以及数据集生成模块；

所述图片获取模块，用于获取多个汽车配件图片，从所述多个汽车配件图片中筛选出符合要求的第一图片，并统一所述第一图片的尺寸及存储格式；其中，符合要求的汽车配件图片为拍摄完整、轮廓清晰、背景无杂物且无水印的汽车配件图片；所述数据处理模块，用于将所述第一图片进行数据增强处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片；所述标签信息模块，用于根据所述第一图片预先分类的信息，为所述第二图片添加相应的标签信息；所述数据集试生成模块，用于根据所述标签信息，对所述第二图片进行分层采样，生成分类好的训练集、验证集以及测试集。

在本实施例中，所述多个汽车配件图片的获取方式，包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取，以及通过拍摄采集获取。

作为本发明的优选实施例，所述数据增强处理方法，包括几何变换处理法、颜色变换处理法，以及对抗生成网络处理法；

优选的，所述第一图片预先分类的信息，通过以下方式获得：

在获取到所述多个汽车配件图片后，对所述多个汽车配件图片进行分类，并根据每个类别中的每个汽车配件图片，生成相应的标签文件；其中，所述标签文件包括对应图片的存储路径或名称，以及是否为配件的标记信息。

由上可见，本发明实施例提供的一种汽车配件图片数据集制作装置，通过图片获取模块获取多个汽车配件图片，从所述多个汽车配件图片中筛选出符合要求的第一图片，并统一所述第一图片的尺寸及存储格式，再通过数据处理模块将所述第一图片进行数据增强处理，生成多个数据扩充后的图片，并将所述多个数据扩充后的图片作为第二图片，然后通过标签信息模块根据所述第一图片预先分类的信息，为所述第二图片添加相应的标签信息，最后通过数据集试生成模块根据所述标签信息，对所述第二图片进行分层采样，生成分类好的训练集、验证集以及测试集，采用本发明提供的实施例，能够生成高质量的数据集，用于与汽车配件图片相关的计算机视觉任务，解决了与汽车配件图片相关的计算机视觉任务无现成可用数据集的问题。

本发明实施例还提供了一种汽车配件图片数据集制作设备。该设备包括：处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述各个汽车配件图片数据集制作方法实施例中的步骤，例如图1所示的步骤S1至S4。

所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述汽车配件图片数据集制作设备的控制中心，利用各种接口和线路连接整个汽车配件图片数据集制作设备的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述汽车配件图片数据集制作设备的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中，所述汽车配件图片数据集制作设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种汽车配件图片数据集制作方法，其特征在于，包括以下步骤：

2.如权利要求1所述的汽车配件图片数据集制作方法，其特征在于，所述多个汽车配件图片的获取方式，包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取，以及通过拍摄采集获取。

3.如权利要求2所述的汽车配件图片数据集制作方法，其特征在于，所述数据增强处理方法，包括几何变换处理法、颜色变换处理法，以及对抗生成网络处理法；

4.如权利要求3所述的汽车配件图片数据集制作方法，其特征在于，所述第一图片预先分类的信息，通过以下方式获得：

5.一种汽车配件图片数据集制作装置，其特征在于，包括：图片获取模块、数据处理模块、标签信息模块以及数据集生成模块；

6.如权利要求5所述汽车配件图片数据集制作装置，其特征在于，所述多个汽车配件图片的获取方式，包括从本身汽配电商平台数据库中获取、通过网络爬虫爬取，以及通过拍摄采集获取。

7.如权利要求6所述汽车配件图片数据集制作装置，其特征在于，所述数据增强处理方法，包括几何变换处理法、颜色变换处理法，以及对抗生成网络处理法；

8.如权利要求7所述汽车配件图片数据集制作装置，其特征在于，所述第一图片预先分类的信息，通过以下方式获得：

9.一种汽车配件图片数据集制作设备，其特征在于，包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的汽车配件图片数据集制作方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至4中任意一项所述的汽车配件图片数据集制作方法。