CN116310619B

CN116310619B - 一种图像数据集生成方法、系统、电子设备及存储介质

Info

Publication number: CN116310619B
Application number: CN202211093189.4A
Authority: CN
Inventors: 王睿; 李卫燊; 李卫铳
Original assignee: Guangzhou Ligong Industrial Co ltd
Current assignee: Guangzhou Ligong Industrial Co ltd
Priority date: 2022-09-08
Filing date: 2022-09-08
Publication date: 2023-09-12
Anticipated expiration: 2042-09-08
Also published as: CN116310619A

Abstract

本发明公开了一种图像数据集生成方法、系统、电子设备及存储介质，其中，方法包括调整机器人姿态对容器进行位置固定处理，确定容器背景图；根据工件的状态对容器格子的放置状态进行调整处理，确定容器状态图像集；对容器状态图像集进行标注处理，确定容器格子的位置信息；根据容器格子的位置信息对容器状态图像集进行切分处理，确定容器格子状态图像集；从容器格子状态图像集中随机获取多个容器格子状态图像，并将容器格子状态图像粘贴到容器背景图中，确定样本图像；根据样本图像，确定图像数据集，本发明实施例能够降低人工成本，提高生成效率，可广泛应用于图像处理技术领域。

Description

一种图像数据集生成方法、系统、电子设备及存储介质

技术领域

本发明涉及图像处理技术领域，尤其是一种图像数据集生成方法、系统、电子设备及存储介质。

背景技术

目前，由于人工智能产业的迅猛发展，深度学习已经在计算机视觉、语音识别、自然语言处理等领域中取得了突破性进展。深度学习研究的巨大成功很大程度上得益于是否能够取得优秀的大量训练样本数据集。

随着人工智能与制造业的不断融合，数控机床自动化上下料需要对工件加工状态进行检测，在检测前需要建立对应的图像数据集。现有数据集的采集和标注都是通过人工操作进行的，并且构建大规模数据集的难度极大且耗时。综合上述，相关技术中存在的技术问题亟需得到解决。

发明内容

有鉴于此，本发明实施例提供一种图像数据集生成方法、系统、电子设备及存储介质，以实现降低人工成本，提高图像数据集生成的效率。

一方面，本发明提供了一种图像数据集生成方法，所述方法包括：

调整机器人姿态对容器进行位置固定处理，确定容器背景图，所述容器包括多个相同的容器格子，所述容器用于放置工件；

根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集；

对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息；

根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集；

从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像；

根据所述样本图像，确定图像数据集。

可选地，所述调整机器人姿态对容器进行位置固定处理，确定容器背景图，包括：

对所述容器的容器格子随机放置所述工件，确定初始容器状态图像；

通过调整机器人姿态对所述初始容器状态进行工件特征识别处理，确定机器人拍摄角度；

根据所述机器人拍摄角度固定所述容器的位置，并清空所述工件，确定容器背景图。

可选地，所述根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集，包括：

获取所述工件的状态，所述工件的状态包括成品状态和毛坯状态；

对所述容器中的所有容器格子都放置有成品状态的工件，确定第一状态图像；

对所述容器中的所有容器格子都放置有毛坯状态的工件，确定第二状态图像；

对所述容器中的所有容器格子都进行空置处理，确定第三状态图像。

可选地，所述对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息，包括：

从所述容器状态图像集中获取第一状态图像；

对所述第一状态图像进行工件标注处理，确定工件位置；

根据所述工件位置对所述第一状态图像进行容器格子标注处理，确定所述容器格子的位置信息。

可选地，所述根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集，包括：

根据所述容器格子的位置信息对所述第一状态图像进行切分处理，确定成品状态容器格子图像集；

根据所述容器格子的位置信息对所述第二状态图像进行切分处理，确定毛坯状态容器格子图像集；

根据所述容器格子的位置信息对所述第三状态图像进行切分处理，确定空置状态容器格子图像集；

根据所述成品状态容器格子图像集、毛坯状态容器格子图像集和空置状态容器格子图像集，确定容器格子状态图像集。

可选地，所述从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像，包括：

获取所述容器格子的位置信息；

从所述容器格子状态图像集中随机获取多个容器格子状态图像；

根据所述容器格子的位置信息将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像。

可选地，所述根据所述样本图像，确定图像数据集，包括：

将所述样本图像存储至图像数据集；

对所述容器状态图像集进行数据增强处理，更新所述容器状态图像集；

返回至对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息这一步骤，直至所述图像数据集的数量达到预设阈值。

另一方面，本发明实施例还提供了一种系统，包括：

第一模块，用于调整机器人姿态对容器进行位置固定处理，确定容器背景图，所述容器包括多个相同的容器格子，所述容器用于放置工件；

第二模块，用于根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集；

第三模块，用于对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息；

第四模块，用于根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集；

第五模块，用于从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像；

第六模块，用于根据所述样本图像，确定图像数据集。

另一方面，本发明实施例还公开了一种电子设备，包括处理器以及存储器；

所述存储器用于存储程序；

所述处理器执行所述程序实现如前面所述的方法。

另一方面，本发明实施例还公开了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如前面所述的方法。

另一方面，本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前面的方法。

本发明采用以上技术方案与现有技术相比，具有以下技术效果：本发明实施例通过调整机器人姿态对容器进行位置固定处理，确定容器背景图，能够通过机器人与工件容器相配合，固定了图像背景，使图像数据集更接近真实场景；另外，本发明实施例根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集；对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息；根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集；从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像；根据所述样本图像，确定图像数据集；本发明实施例通过自动生成对应的标注框，降低了人工成本，提高了生成效率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种图像数据集生成方法的流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本发明实施例提供一种图像数据集生成方法，所述方法包括：

S101、调整机器人姿态对容器进行位置固定处理，确定容器背景图，所述容器包括多个相同的容器格子，所述容器用于放置工件；

S102、根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集；

S103、对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息；

S104、根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集；

S105、从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像；

S106、根据所述样本图像，确定图像数据集。

在本发明实施例中，机器人需要识别出容器中工件的状态。每次识别前，移动手臂到固定姿态，以保证在每次拍摄的图像中，容器所处的位置都是固定的。可以想到的是，本发明实施例还可采用固定容器的方法，通过调整机器人姿态，在确保机器人的摄像头能够拍摄到容器中各个工件的特征的前提下确定机器人视角，在每次拍摄的过程中，根据该视角对容器进行调整，以保证在每次拍摄的图像中，容器所处的位置都是固定的。然后通过机器人进行拍摄得到容器背景图，该容器背景图包括容器以及容器所处的背景图像。其中，容器包括多个相同的容器格子，每个容器格子均能放置工件。然后根据工件的状态对容器格子的放置状态进行调整处理，工件的状态可以包括毛坯状态和成品状态，容器格子的放置状态可以包括空置状态和占有状态。根据容器格子中是否放有工件，放置工件的具体状态来调整容器格子的放置状态，从而进行拍摄得到容器状态图像集，该容器状态图像集包括：容器中所有容器格子装满成品工件的图像、容器中所有容器格子装满毛佩工件的图像和容器中所有容器格子为空置状态的图像。接着，通过对对容器状态图像集进行标注处理，能够得到容器中所有容器格子的位置信息。通过该位置信息可以对上述得到的容器状态图像集进行切分处理，从而得到容器格子状态图像集，该容器格子状态图像集包括容器中每个容器格子的状态图像，其中，每个状态图像表示每个容器格子中可能出现的状态。最后，从容器格子状态图像集中随机获取与容器中容器格子数量相同的图像，进行拼接处理，能够得到一张样本图像。通过重复多次随机获取、拼接的过程，即可得到一个图像数据集。

进一步作为优选的实施方式，所述调整机器人姿态对容器进行位置固定处理，确定容器背景图，包括：

在本发明实施例中，为了确保机器人能够拍摄到容器中每一个容器格子所放置工件的特征，在进行图像数据集生成流程之前，需要拍摄一张初始容器状态图像，通过对容器的容器格子中随机放置工件，并进行拍摄得到初始容器状态图像，通过机器人进行智能识别图像特征，并根据识别结果进一步调整机器人姿态。可以想到的是，本发明实施例可以多次实施该步骤，根据多次识别结果确定一个拍摄角度。在确定该拍摄角度后，可以清空容器中的工件，拍摄得到容器背景图。本发明实施例通过调整机器人姿态，将视角锁定，也固定了识别时的图像背景，使最终得到的合成图更逼近真实场景。

进一步作为优选的实施方式，所述根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集，包括：

在本发明实施例中，容器状态图像集包括第一状态图像、第二状态图像和第三状态图像，其中，第一状态图像为容器中所有容器格子都放置有成品状态的工件的图像，第二状态图像为容器中所有容器格子都放置有毛坯状态的工件的图像，第一状态图像为容器中所有容器格子都空置的图像。因为工件的状态包括成品状态和毛坯状态，容器格子的状态可以包括空置状态和占有状态，通过拍摄容器状态图像集可以得到容器中每个容器格子都可能出现的状态。

进一步作为优选的实施方式，所述对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息，包括：

从所述容器状态图像集中获取第一状态图像；

对所述第一状态图像进行工件标注处理，确定工件位置；

在本发明实施例中，从容器状态图像集中获取第一状态图像，即容器中所有容器格子都放置有成品状态的工件的图像。接着，对第一状态图像进行工件标注处理，能够标注得到每个工件的位置，根据得到的工件位置可以对第一状态图像进行容器格子标注处理，得到所述容器格子的位置信息。可以想到的是，在得到每个工件的位置后能够得到装有工件的容器格子的位置，即通过对第一状态图像中容器格子进行标注框标注，可选择对标注得到的工件位置进行标注框拉伸处理，从而得到容器格子的位置。

进一步作为优选的实施方式，所述根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集，包括：

在本发明实施例中，通过标注得到的容器格子位置，可以对容器状态图像集中第一状态图像、第二状态图像和第三状态图像分别进行切分处理，从而得到成品状态容器格子图像集、毛坯状态容器格子图像集、空置状态容器格子图像集，其中，成品状态容器格子图像集为所有容器格子装有成品状态工件的图像集合，毛坯状态容器格子图像集为所有容器格子装有毛坯状态工件的图像集合，空置状态容器格子图像集为所有容器格子空置的图像集合。可以想到的是，在三乘三的容器中，拥有九个容器格子，成品状态容器格子图像集即为每一个容器格子中装有成品工件的图像的集合。

进一步作为优选的实施方式，所述从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像，包括：

获取所述容器格子的位置信息；

在本发明实施例中，首先从容器格子状态图像集中随机获取多个容器格子状态图像，获取图像数量与容器中容器格子的数量相同。可以想到的是，如三乘三的容器，获取对应的九张容器格子图像，将容器格子图像根据容器格子的位置信息对应地粘贴到所述容器背景图中，得到样本图像。

进一步作为优选的实施方式，所述根据所述样本图像，确定图像数据集，包括：

将所述样本图像存储至图像数据集；

在本发明实施例中，将上述方法获取得到的样本图像存储至图像数据集，然后对容器状态图像集进行数据增强处理，更新所述容器状态图像集。可以想到的是，本发明实施例采用亮度增强、对比度增强等技术进行数据增强处理，从而更新容器状态图像集。然后返回至对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息这一步骤，直至所述图像数据集的数量达到预设阈值，该预设阈值可根据实际情况自由设置。

另一方面，本发明实施例还提供了一种系统，包括：

第六模块，用于根据所述样本图像，确定图像数据集。与图1的方法相对应，本发明实施例还提供了一种电子设备，包括处理器以及存储器；所述存储器用于存储程序；所述处理器执行所述程序实现如前面所述的方法。

与图1的方法相对应，本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有程序，所述程序被处理器执行实现如前面所述的方法。

本发明实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。

本发明实施例通过调整机器人的手臂姿态，选取一个可以拍摄到工件特征的角度。根据该角度分别拍摄三张原始照片，容器的格子内摆满毛坯、成品以及都是空置。可以选取空置的照片作为背景图，然后对成品图进行标注，标注可采用labelimg工具进行标注，自动生成位置信息和所标注物体的类别，得到了9个bounding box,也就是容器中每个格子的位置信息。基于容器格子的位置信息，切出三张原始照片中27个容器格子的图像，也就是拿到了每个格子的三种状态对应的图像。随机得到9个格子的状态，然后将每个格子对应状态的图像贴到背景图中，这样就生成了一张样本图像，同时也得到了标注文件，标注文件包括每个标注框的位置和状态信息，文件中第一列是bounding box的类别，是随机生成的，后四列是归一化之后的bounding box中心点坐标和对应宽高。最后对三张原始图像进行数据增强，从对比度等方面进行统一调整，然后再重复上述步骤，生成样本图像，直到生成的样本图像张数达到预期数量，得到图像数据集。本发明实施例通过机器人和容器协同配合的方案，达到了固定背景颜色的效果，不仅缩短了准备数据集的时间，也大大提升了识别的精度。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims

1.一种图像数据集生成方法，其特征在于，所述方法包括：

所述调整机器人姿态对容器进行位置固定处理，确定容器背景图，包括：

根据所述机器人拍摄角度固定所述容器的位置，并清空所述工件，确定容器背景图；

所述根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集，包括：

对所述容器中的所有容器格子都放置有毛坯状态的工件，确定第二状态图像；对所述容器中的所有容器格子都进行空置处理，确定第三状态图像；

所述根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集，包括：

根据所述成品状态容器格子图像集、毛坯状态容器格子图像集和空置状态容器格子图像集，确定容器格子状态图像集；

根据所述样本图像，确定图像数据集。

2.根据权利要求1所述的方法，其特征在于，所述对所述容器状态图像集进行标注处理，确定所述容器格子的位置信息，包括：

从所述容器状态图像集中获取第一状态图像；

对所述第一状态图像进行工件标注处理，确定工件位置；

3.根据权利要求1所述的方法，其特征在于，所述从所述容器格子状态图像集中随机获取多个容器格子状态图像，并将所述容器格子状态图像粘贴到所述容器背景图中，确定样本图像，包括：

获取所述容器格子的位置信息；

4.根据权利要求1所述的方法，其特征在于，所述根据所述样本图像，确定图像数据集，包括：

将所述样本图像存储至图像数据集；

5.一种图像数据集生成系统，其特征在于，所述系统包括：

所述第一模块，用于调整机器人姿态对容器进行位置固定处理，确定容器背景图，包括：

对所述容器的容器格子随机放置所述工件，确定初始容器状态图像；通过调整机器人姿态对所述初始容器状态进行工件特征识别处理，确定机器人拍摄角度；

所述第二模块，用于根据所述工件的状态对所述容器格子的放置状态进行调整处理，确定容器状态图像集，包括：

所述第四模块，用于根据所述容器格子的位置信息对所述容器状态图像集进行切分处理，确定容器格子状态图像集，包括：

第六模块，用于根据所述样本图像，确定图像数据集。

6.一种电子设备，其特征在于，所述电子设备包括存储器和处理器；

所述存储器用于存储程序；

所述处理器执行所述程序实现权利要求1至4中任一项所述的方法。

7.一种计算机可读存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法。