CN117036216A

CN117036216A - 一种数据生成方法、装置、电子设备及存储介质

Info

Publication number: CN117036216A
Application number: CN202310913764.9A
Authority: CN
Inventors: 陈友明; 陈思竹; 王猛珍
Original assignee: Sichuan Honghe Digital Intelligence Group Co ltd
Current assignee: Sichuan Honghe Digital Intelligence Group Co ltd
Priority date: 2023-07-24
Filing date: 2023-07-24
Publication date: 2023-11-10

Abstract

本发明提供了一种数据生成方法、装置、设备及介质，涉及图像处理技术领域，包括：获取图像数据；基于第二图像数据，得到多个掩码图像，并基于掩码图像中所述目标图像的本征信息，获取目标掩码图像；以目标掩码图像为基准，对第一图像数据以及第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将第一相与图像和第二相与图像进行相加处理，得到相与图像；将第一图像数据以及相与图像组合得到生成图像数据。本发明的数据生成方法以图形页面交互式数据生成，可以快速的生成危险场景或特定场景缺失而必要的深度学习训练集数据，该数据生成方法只需要利用自动选择位置生成需要的目标与背景图像结合的图像。

Description

一种数据生成方法、装置、电子设备及存储介质

技术领域

本发明涉及图像处理技术领域，特别是涉及一种数据生成方法、装置、电子设备及存储介质。

背景技术

对于危险场景，例如加油机失火冒烟，或者是一些特定场景物品识别的场景中的数据样本的获取十分困难，而且现场采集数据样本的成本过高，效率较慢，甚至一些场景下的数据人为很难采集到，使得在上述场景中存在因数据采集问题导致的数据集缺失的情况。通过对上述危险场景或特定场景进行训练数据集的数据生成，可弥补上述数据集缺失带来的训练难题。

然而，现有的数据生成方法中的交互分割和自动分割技术等存在不灵活、无法得到准确的分割对象等问题，造成缺失数据集的补充不灵活、不准确等问题。因此，如何灵活、准确的生成危险场景或特定场景的深度学习训练集数据，成为本领域亟待解决的问题。

发明内容

本发明提供一种数据生成方法、装置、电子设备及存储介质，以解决或至少部分解决上述现有技术中的问题。

第一方面，本发明实施例提供一种数据生成方法，包括：

获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；

基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；

以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；

将所述第一图像数据以及所述相与图像组合得到生成图像数据。

可选地，所述基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像，包括：

对所述多个掩码图像中目标图像进行轮廓点检测，获取每张掩码图像对应的轮廓点坐标；

基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息；

将所述每张掩码图像中所述目标图像的本征信息中的最大值对应的所述掩码图像，作为所述目标掩码图像。

可选地，所述本征信息为所述目标图像的周长信息，所述基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息，包括：

将获取的每张掩码图像的相邻轮廓点坐标之间两两进行相加操作，得到所述相邻轮廓点坐标之间的距离值；

将所有所述相邻轮廓点坐标之间的距离值相加，得到所述每张掩码图像的所有轮廓点的相加值；

将所述所有轮廓点的相加值作为所述目标图像的周长信息，将所述周长信息作为所述目标图像的本征信息。

可选地，以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，包括：

对所述目标掩码图像进行灰度化处理和二值化处理，得到第一目标掩码图像；

对所述第二图像数据和所述第一目标掩码图像进行相与处理，得到所述第一相与图像；

从所述第一图像数据中的目标位置点截取与所述目标掩码图像尺寸相同的图像，作为第三图像数据，所述目标位置点与所述第三图像数据的中心点相对应；

对所述第一目标掩码图像进行取反处理，得到第二目标掩码图像；

对所述第二目标掩码图像和所述第三图像数据进行相与处理，得到所述第二相与图像。

可选地，所述采用灰度化操作和二值化操作对所述目标掩码图像进行处理，包括：

所述灰度化操作为将目标掩码图像的多颜色空间转换为灰色单通道的目标掩码图像；

所述二值化操作为将所述灰色单通道的目标掩码图像转换为二值图，作为所述第一目标掩码图像。

可选地，在获取所述生成图像数据之后，所述数据生成方法包括：

获取所述第一图像数据的目标位置点，并将所述目标位置点坐标作为所述相与图像的中心点坐标；

基于所述中心点坐标与所述相与图像的尺寸，计算得到所述相与图像的顶点坐标；

基于所述相与图像，获取标注框和标注框信息，所述标注框为所述相与图像中的所述目标图像的最小外接矩形，所述标注框信息为所述标注框的顶点坐标和目标图像的宽高；

将所述相与图像与所述标注框对应位置的顶点坐标相加，得到所述目标图像在所述第一图像数据中对应位置的顶点坐标。

可选地，得到所述相与图像之后，对所述相与图像进行亮度处理，得到亮度相与图像，包括：

通过对所述相与图像进行去噪处理，得到去噪相与图像；

将所述去噪相与图像从第一颜色空间转换为第二颜色空间，基于所述第二颜色空间自适应调整所述目标图像的亮度通道值，得到第一亮度相与图像；

将所述第一亮度相与图像从第二颜色空间转换为第一颜色空间，得到所述亮度相与图像；

将所述亮度相与图像与所述第一图像数据组合，得到生成图像数据。

第二方面，本发明实施例提供一种数据生成装置，包括：

图像获取模块，用于获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；

目标掩码图像获取模块，用于基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；

相与图像获取模块，用于以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；

生成图像数据获取模块，用于将所述第一图像数据以及所述相与图像组合得到生成图像数据。

其中，所述目标掩码图像获取模块，包括：

轮廓点坐标获取单元，用于对所述多个掩码图像中目标图像进行轮廓点检测，获取每张掩码图像对应的轮廓点坐标；

本征信息计算单元，用于基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息；

目标掩码图像获取单元，用于将所述每张掩码图像中所述目标图像的本征信息中的最大值对应的所述掩码图像，作为所述目标掩码图像。

其中，所述本征信息计算单元，包括：

距离值计算子单元，用于将获取的每张掩码图像的相邻轮廓点坐标之间两两进行相加操作，得到所述相邻轮廓点坐标之间的距离值；

相加子单元，用于将所有所述相邻轮廓点坐标之间的距离值相加，得到所述每张掩码图像的所有轮廓点的相加值；

本征信息获取子单元，将所述所有轮廓点的相加值作为所述目标图像的周长信息，将所述周长信息作为所述目标图像的本征信息。

其中，相与图像获取模块，包括：

第一目标掩码图像获取单元，用于对所述目标掩码图像进行灰度化处理和二值化处理，得到第一目标掩码图像；

第一相与图像获取单元，用于对所述第二图像数据和所述第一目标掩码图像进行相与处理，得到所述第一相与图像；

第三图像数据获取单元，用于从所述第一图像数据中的目标位置点截取与所述目标掩码图像尺寸相同的图像，作为第三图像数据，所述目标位置点与所述第三图像数据的中心点相对应；

第二目标掩码图像获取单元，用于对所述第一目标掩码图像进行取反处理，得到第二目标掩码图像；

第二相与图像获取单元，用于对所述第二目标掩码图像和所述第三图像数据进行相与处理，得到所述第二相与图像。

其中，第一目标掩码图像获取单元，包括：

灰度化操作子单元，用于将目标掩码图像的多颜色空间转换为灰色单通道的目标掩码图像；

二值化操作子单元，用于将所述灰色单通道的目标掩码图像转换为二值图，作为所述第一目标掩码图像。

在获取所述生成图像数据之后，所述数据生成装置包括：

目标位置点获取模块，用于获取所述第一图像数据的目标位置点，并将所述目标位置点坐标作为所述相与图像的中心点坐标；

顶点坐标计算模块，用于基于所述中心点坐标与所述相与图像的尺寸，计算得到所述相与图像的顶点坐标；

标注框信息获取模块，用于获取标注框和标注框信息，所述标注框为所述相与图像中的所述目标图像的最小外接矩形，所述标注框信息为所述标注框的顶点坐标和目标图像的宽高；

目标图像的顶点坐标计算模块，用于将所述相与图像与所述标注框对应位置的顶点坐标相加，得到所述目标图像在所述第一图像数据中对应位置的顶点坐标。

在获取所述生成图像数据之后，所述数据生成装置还包括：

去噪相与图像获取模块，用于通过对所述相与图像进行去噪处理，得到去噪相与图像；

第一亮度相与图像获取模块，用于将所述去噪相与图像从第一颜色空间转换为第二颜色空间，基于所述第二颜色空间自适应调整所述目标图像的亮度通道值，得到第一亮度相与图像；

亮度相与图像获取模块，用于将所述第一亮度相与图像从第二颜色空间转换为第一颜色空间，得到所述亮度相与图像；

第二生成图像数据获取模块，用于将所述亮度相与图像与所述第一图像数据组合，得到生成图像数据。

第三方面，本发明实施例提供一种电子设备，包括：

存储器，用于存储一个或多个程序；

处理器；

当所述一个或多个程序被所述处理器执行时，实现如上述第一方面中任一项所述的数据生成方法。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述第一方面中任一项所述的数据生成方法。

本发明包括以下优点：

本发明实施例提供一种数据生成方法，通过获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；将所述第一图像数据以及所述相与图像组合得到生成图像数据。

本发明实施例提供的一种数据生成方法，可以快速的生成危险场景或特定场景缺失而必要的深度学习训练集数据，该数据生成方法只需要利用自动选择位置生成需要的目标与背景图像结合的图像，可以根据选择的目标位置灵活的生成包含目标图像的图像数据，数据生成方法可准确的选取出目标掩码图像，使得生成准确的包含目标图像的图像数据，补充危险场景或特定场景下数据集的缺失。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于数据生成方法的流程图；

图2是本发明实施例提供的一种基于数据生成方法的图片示意图；

图3是本发明实施例提供的一种基于数据生成方法的流程示意图；

图4是本发明实施例提供的一种基于数据生成装置的架构图；

图5是本发明实施例提供的一种电子设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

对于现有的生成图像掩码的技术来说，交互式分割方法虽然类似SAM(SegmentAnything Model)算法可以分割任何类别的对象，但需要人不断点击迭代细化掩码来指导该方法，即在生成想要的目标掩码过程中需要多次确认才能得到我们想要的结果，过程操作重复性过高，交互式效率太低。自动分割方法通常选用一些语义分割算法类似Faster R-CNN、Unet等，但是这种方法需要提前定义特定类别(比如猫或者狗)，需要人手动标注大量的数据集训练，之后只能分割出训练的目标，该方法灵活性差且成本高。

SAM算法包括图像编码器和提示编码器，其中图像编码器用于使用MAE(MaskedAutoencoders)预训练ViT(Vision Transformer)模型，最低限度地适应处理高分辨率输入。提示编码器用于考虑两组提示，稀疏(点、框、文本)和密集掩码。通过位置编码和每个提示的类型的学习嵌入相加来表示框和点，并使用来自CLIP(Contrastive Language-ImagePre-training，即一种基于对比文本图像对的预训练方法或者模型，多模态，图像和语言模式)的现成文本编码器来表示自由格式文本。密集提示(掩码)使用卷积嵌入，并与图像嵌入逐元素求和。同时，SAM算法的运行速度为当给定图像嵌入时，提示编码器和掩码解释器在CPU(Central Processing Unit，中央处理单元)上的Web(World Wide Web，全球广域网)浏览器中的运行，时间约为50毫秒。此外，SAM算法还使用损失函数focal loss和dice loss优化SAM算法，其中focal loss用于平衡正负样本，dice loss用于相似度损失计算。

SAM算法集合了交互式分割方法和自动分割方法的优点，成为一个单一模型，提供通用的、全自动的分割方法，允许用户通过点击，交互式利用点或者边界框的方式提示对象；当分割的对象有歧义的时候SAM可以输出多个有效掩码，这是解决实际分割问题所必需的重要能力。

基于此，本发明结合SAM算法提出一种数据生成方法，以解决现有技术中的分割方法不灵活、无法得到准确的分割对象等，造成缺失数据集的补充十分困难的问题。

本发明实施例第一方面提供一种数据生成方法，参阅图1，图1为本发明实施例提供的一种数据生成方法的流程图，所述数据生成方法包括以下步骤：

步骤S110，获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；

步骤S120，基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；

步骤S130，以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；

步骤S140，将所述第一图像数据以及所述相与图像组合得到生成图像数据。

具体实施步骤S110时，所述第一图像数据为危险场景或其他特定场景下用于物品识别的图像，例如，上述危险场景或特定场景可以为加油站失火场景、加气站失火场景、溺水场景、电器售卖场景等。所述第二目标图像为包含目标图像的图像数据，其中目标图像可以为指定场景中缺失的对象，例如，上述目标可以为火焰、溺水对象、电器等。本发明实施例中提供的图像数据举例并不对上述图像数据做任何限定，仅做说明示意，上述图像数据可以是任何实际需要的图像数据，在此不做赘述。

第一图像可以为摄像头实时采集的图像，视频某一帧采集的图像，事先采集的图像等等，例如，可以是采集的加油站内汽车加油的图像、加油站内员工工作图像、加油站内非员工图像、加气站内汽车加气图像、溺水场景游泳图像、商场内电器售卖图像等；第二图像可以为与第一图像所对应的场景相同场景下的目标图像，如第一图像为失火场景，第二图像可以为火焰图像，如第一图像为电器售卖场景，第二图像可以为电器图像；第二图像还可以为与第一图像所对应的场景不同场景下的目标图像，如第一图像为加油站场景，第二图像可以为水瓶图像、电脑图像、人员图像等。本发明实施例中提供的图像数据举例并不对上述图像数据做任何限定，仅做说明示意，上述图像数据可以是任何实际需要的图像数据，在此不做赘述。

具体实施步骤S120时，掩码在于通过图像数据中另一层新的权重，将图像数据中关键的特征标识出来，通过学习训练，让深度学习网络学到每一张待学习图像中需要关注的区域。通过对获得的第二图像数据做分割处理或者掩码操作等，可以得到多个掩码图像，其中，掩码图像可以为包含部分或所有目标图像的图像。在本发明实施例以SAM(SegmentAnything Model)算法为分割处理对获取掩码图像进行说明，具体地，SAM算法中的图像编码器为图像生成一次性嵌入，而轻量级编码器将提示实时转换为嵌入向量，然后将这两个信息源组合在一个预测分割掩码的轻量级解码器中，在计算图像嵌入后，SAM可以在50毫秒内，根据网络浏览器中的任何提示生成一个掩码图像。因此，将包含目标图像的第二图像数据输入至SAM后，可以快速得到多个包含部分或所有目标图像的掩码图像。所述目标图像的本征信息可以为目标图像的周长、面积等信息，目标掩码图像为多个掩码图像中包含完整目标图像的掩码图像，也就是通过SAM算法生成的最准确的掩码图像。对所述多个掩码图像中目标图像的本征信息进行计算，可以得到每个掩码图像中目标图像的本征信息，基于计算得到的本征信息得到目标掩码图像。其中，生成的目标掩码图像与第二图像数据的尺寸相同。

具体地，所述基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像，是通过以下步骤得到的：首先，对所述多个掩码图像中目标图像进行轮廓点检测，获取每张掩码图像对应的轮廓点坐标，其中，所述轮廓点可以是多个，并不只限于对目标图像的顶点作检测，所述轮廓点坐标可以为目标图像在所述第二图像数据的位置坐标等信息；然后，基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息；将所述每张掩码图像中所述目标图像的本征信息中的最大值对应的所述掩码图像，作为所述目标掩码图像，也就是在计算出来的所有掩码图像的本征信息中，选取最大本征信息对应的掩码图像作为目标掩码图像，这是由于在掩码图像生成时，可能生成的掩码图像仅包含部分目标图像，以水瓶作为例子进行说明，可能生成的掩码图像仅包含瓶盖、部分瓶身或瓶底等，以电脑作为例子进行说明，可能生成的掩码图像仅包含电脑屏幕、电脑键盘或电脑拼接部分等，因此，计算得到的本征信息最大，该最大本征信息对应的掩码图像最有可能包含完整的目标图像。本申请实施例通过采用本征信息进行目标掩码图像的判断，可以更直接得到准确的目标掩码图像。

本发明可选的一种实施例中，在获取目标图像的本征信息之前，可以通过交互点击方式从得到的多个掩码图像中选取出部分掩码图像用于本征信息的计算，选取出的部分掩码图像可以是通过鼠标点击选择，通过该方式可删除部分不准确的掩码图像，将不确定的部分掩码图像用于本征信息的计算，可节约本征信息的计算时间和计算量，提高目标掩码图像的获取速率和获取准确度。本发明针对SAM生成的掩码会添加本征信息计算的自动选择操作，结合自身目标自动选择出准确的目标掩码图像，实现全自动图形页面交互式的算法，减少对生成的多个掩码图像再人为手动挑选，避免了认为手动挑选的效率较低、准确率较低等问题。

本发明可选的一种实施例中，所述基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息，通过以下方法计算得到：以所述目标图像的本征信息为周长信息为例进行说明，首先对获取的每张掩码图像的相邻轮廓点坐标之间两两进行相加操作，得到所述相邻轮廓点坐标之间的距离值；然后，将所有所述相邻轮廓点坐标之间的距离值相加，得到所述每张掩码图像的所有轮廓点的相加值；将所述所有轮廓点的相加值为所述目标图像的周长信息，将所述周长信息作为所述目标图像的本征信息。

在本发明可选的一实施例中，在获取得到所述目标掩码图像后，可以通过对所述目标掩码图像添加仿射变换操作实现进一步增强目标掩码图像。所述仿射变换操作有平移变换(Translation transformation)、旋转变换(Rotation transformation)、缩放变换(Scaling transformation)、剪切变换(Shearing transformation)和镜像变换(Mirrortransformation)等。其中，所述平移变换操作为将目标掩码图像沿着x轴或y轴方向进行平移；所述旋转变换操作为将目标掩码图像以某个点为中心进行旋转，可以通过旋转角度来控制旋转的幅度；所述缩放变换操作为将目标掩码图像沿着x轴或y轴方向进行缩放，可以通过缩放因子来控制缩放的幅度；所述剪切变换操作为将目标掩码图像沿着x轴或y轴方向进行剪切，可以通过剪切因子来控制剪切的幅度；所述镜像变换操作为将目标掩码图像沿着x轴或y轴方向进行镜像翻转，可以通过镜像类型来控制镜像的方向。本发明实施例可以通过条件函数和键盘输入函数选择合适的参数，实现所述目标掩码图像的进一步增强生成。

具体实施步骤S130时，以获取的目标掩码图像为基准，对其进行相应的图像转换操作，旨在将获取的目标掩码图像与第一图像数据相组合，这是由于不同的图像之间的颜色空间或颜色空间等不同，而不能随意组合，且多颜色空间的图像数据之间也不能直接组合，需要转换为相同的背景或颜色空间或颜色空间等，还需要将多颜色空间的图像数据转换为黑白图像之后，才能将不同的图像组合在一起作为生成的图像数据。在本发明实施例中，第一图像数据、第二图像数据、第三图像数据、目标掩码图像和相与图像的颜色空间可以为RGB三颜色空间(RGB三颜色空间标识每个像素由三个通道组成，每个通道代表一种颜色，R为red红色，G为green绿色，B为blue蓝色)，同时目标掩码图像可以为RGB三颜色空间的黑白图像。

将图像转换为多颜色空间的图像数据转换为黑白图像之前，必须要将多颜色空间的图像数据转换为灰度图像之后，才能最终转换为黑白图像。因此，对图像数据进行相与处理之前，还需要对图像数据进行灰度化处理和二值化处理。在本发明可选的一实施例中，所述采用灰度化操作和二值化操作对所述目标掩码图像进行处理，包括：所述灰度化操作为将目标掩码图像的多颜色空间转换为灰色单通道的目标掩码图像；其中每个像素只携带有关光强度的信息，且灰度图像完全由灰色阴影组成。所述二值化操作为将所述灰色单通道的目标掩码图像转换为二值图，作为所述第一目标掩码图像。二值化处理为将灰度图像转换为仅包含黑白像素的黑白图像(二值图像)。在二值图像中，像素要么是黑色，要么是白色。在本申请实施例进行具体的操作时，可以以值0代表黑色，以值1代表白色进行运算。

相与处理是指进行二进制的相与运算，没有进位，也就是说，对应位是1，则运算结果为1，否则全为0，示例性地，01与10，进行相与运算的结果是00，运算过程具体为个位1与0做相与运算得到的结果是0；十位0与1做相与运算得到的结果是0。将目标掩码图像转换为二值图后，二值图上仅有0或1，然后才能进行第二图像数据与目标掩码图像的相与操作。

在本发明实施例中相加处理是指对相同格式的图片进行二进制的相加运算，也就是0+0＝0，0+1＝1，1+0＝1，1+1＝10，也就是当两个相加的二进制位仅一位为1时，相加的结果为1；如果两个二进制位全是0，相加的结果仍为0。所述第一相与图像与第二相与图像的格式均为相同格式，可以但不限制为uint8格式，在该格式下，二进制黑色为0，二进制白色为1，将所述第一相与图像和第二相与图像进行相加处理，得到包含指定背景的目标图像的相与图像。

具体地，以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，包括以下方法：首先，基于所述目标掩码图像，依次对其进行灰度化处理和二值化处理，先对所述目标掩码图像进行灰度化处理转换为灰度化目标掩码图像，然后对灰度化目标掩码图像进行二值化处理转换为二值化目标掩码图像，将该二值化目标掩码图像作为第一目标掩码图像；然后将第二图像数据与所述第一目标掩码图像进行相与处理，得到所述第一相与图像；在第一图像数据中确定出一个目标位置点，从所述第一图像数据中的目标位置点获取与所述目标掩码图像尺寸相同的图像，作为第三图像数据，其中，所述目标位置点与所述第三图像数据的中心点相对应，在本发明实施例中可以通过鼠标左键回调函数获取目标位置点，并基于该目标位置点生成与相与图像相同尺寸的图像数据作为第三图像数据；对所述第一目标掩码图像进行取反处理，得到第二目标掩码图像，所述取反处理为对图像取反，也就是将图像中各个像素的值取反，由于第一目标掩码图像为二值图像，也就是将图像中的值0转换为1，值1转换为0，因此，得到与第一目标图像黑白相反的第二目标掩码图像；最后，对所述第二目标掩码图像和所述第三图像数据进行相与处理，可以得到所述第二相与图像。

示例性地，以油气站场景为例进行说明，参阅图2，图2为本实施例提供的一种基于数据生成方法的图片示意图，图2中A部分为第一图像数据，第一图像数据为通过摄像头获取的目标场景图像，图2中B部分为第二图像数据，第二图像数据中的瓶子为目标图像，图2中C部分为第一目标掩码图像，第一目标掩码图像为第二图像数据经过灰度化操作和二值化操作后得到的，图2中D部分为第一相与图像，第一相与图像为将第二图像数据和第一目标掩码图像经过相与处理得到的，图2中E部分为第二目标掩码图像，第二目标掩码图像为通过对第一目标掩码图像进行取反处理后得到的，图2中F部分为第三图像数据，第三图像数据为通过目标位置点在第一图像数据上获取的与相与图像相同尺寸的图像数据，图2中G部分为第二相与图像，第二相与图像为第三图像数据和第二目标掩码图像经过相与处理得到的，图2中H部分为相与图像，相与图像为第一相与图像和第二相与图像经过相加处理得到的，图2中I部分为生成图像数据，生成图像数据为将相与图像数据和第一图像数据以目标位置点进行组合得到的。

具体实施步骤S140时，由于所述相与图像的背景图像是从第一图像数据中获取的，因此，可以直接将所述第一图像数据以及所述相与图像组合得到生成图像数据，所述组合包括但不限于融合、粘贴等方式，并将该生成图像数据用于数据缺失场景中训练深度学习网络。

在本发明可选的一实施例中，得到所述相与图像之后，对所述相与图像进行亮度处理，得到亮度相与图像，将所述进行亮度处理后的亮度相与图像也可直接与所述第一图像数据组合，得到生成图像数据。具体地，亮度相与图像的获取方法如下：首先对得到的相与图像进行去噪处理，得到去噪相与图像，去噪处理包括但不限于高斯滤波等去噪处理方式，高斯滤波是一种线性平滑滤波，适用于消除高斯噪声；由于相与图像的颜色空间为RGB颜色空间，不能直接对RGB颜色空间的图像做亮度调整，需要将RGB颜色空间转换为HSV颜色空间(H为Hue色调、色相，S为Saturation饱和度、色彩纯净度，V为Value亮度)，然后才能对图像数据的HSV颜色空间中的V通道做亮度调整，因此，将所述去噪相与图像从第一颜色空间转换为第二颜色空间，基于所述第二颜色空间自适应调整所述目标图像的亮度通道值，得到第一亮度相与图像，其中，第一颜色空间为RGB颜色空间，第二颜色空间为HSV颜色空间，对转换为第二颜色空间的相与图像中的目标图像做亮度通道值的调整，使相与图像中的目标图像的亮度与作为背景图像的第三图像数据的亮度值相适应；然后，将亮度调整后的第一亮度相与图像从第二颜色空间转换为第一颜色空间后，得到所述亮度相与图像；将所述亮度相与图像与所述第一图像数据组合，得到生成图像数据。本发明实施例的数据生成方法可以对图像数据的亮度进行自适应调整，并自动保存为生成图像数据。本发明中的图像数据颜色空间的转换以实际为准，本发明并不对其做限制，仅以RGB颜色空间和HSV颜色空间作为示例进行说明。

在本发明可选的一实施例中，在获取所述生成图像数据之后，所述数据生成方法还包括对所述生成图像数据进行数据标注，具体地，获取所述第一图像数据的目标位置点，该目标位置点为将相与图像组合至第一图像数据的位置，并将所述目标位置点坐标作为所述相与图像的中心点坐标，也就是说，将相与图像组合至第一图像数据时，将相与图像的中心点与该目标位置点组合在一起，完成生成图像数据的组合；然后基于所述中心点坐标与所述相与图像的尺寸，计算得到所述相与图像的顶点坐标，由于相与图像数据的尺寸与第二图像数据的相同，因此，将目标位置点作为相与图像的中心点时，该中心点坐标为(X,Y)，该相与图像在第一图像数据上的左上角坐标为A(Xa,Ya)，其中，左上角横坐标X_a＝X+1/2X，左上角纵坐标Y_a＝Y+1/2Y_a，右上角顶点、左下角顶点、右下角顶点均可根据中心点坐标计算得到，此处，不一一列举；基于所述相与图像，获取标注框和标注框信息，所述标注框为所述相与图像中的所述目标图像的最小外接矩形，所述标注框信息为所述标注框的顶点坐标和目标图像的宽高，在本申请可选的一实施例中，所述标注框和标注框信息通过自动标注函数获取，但本申请并不限制标注框和标注框信息的获取方式；将所述相与图像与所述标注框对应位置的顶点坐标相加，得到所述目标图像在所述第一图像数据中对应位置的顶点坐标，示例性地，标注框的左上角坐标点为1(x₁,y₁)，将标注框的左上角坐标的横坐标x₁与相与图像在第一图像数据上的左上角坐标的横坐标x_a相加得到目标图像的标注框在第一图像数据上的左上角顶点横坐标x_1+a，将将标注框的左上角坐标的纵坐标y₁与相与图像在第一图像数据上的左上角坐标的纵坐标y_a相加得到目标图像的标注框在第一图像数据上的左上角顶点纵坐标y_1+a，同理可得，目标图像的标注框在第一图像数据上的其余顶点坐标，此处不一一列举。

本发明实施例中生成的图像数据中目标的坐标也可以同步生成VOC2007(VisualObject Classes2007，一个可以用来进行图像识别的数据集)数据集或者COCO(CommonObjects in Context，一个可以用来进行图像识别的数据集)数据集等标注文件，减少人力等大量的时间成本标注。本发明实施例中的自动标注方法对生成的图像数据中的目标图像进行自动标注后，并自动保存生成的图像数据和标注框信息。

参阅图3，图3为本发明实施例提供的一种数据生成方法的流程示意图。具体地，以图2中的示意图片为例进行说明，首先将第二图像数据(图2中B部分)进行分割得到多个掩码图像，然后基于交互式点击选取部分掩码图像(图3中未示出)，对部分掩码图像中的目标图像的周长进行计算，将最大周长对应的掩码图像作为目标掩码图像(图3中未示出)，然后，对目标掩码图像进行灰度化操作和二值化操作得到第一目标掩码图像(图3中未示出)，将第一目标掩码图像和第二图像数据进行相与处理得到第一相与图像(图2中D部分)，采用回调函数在第一图像数据(图2中A部分为第一图像数据)得到目标位置点坐标和第三图像数据(图2中F部分)(图3中未示出)，对目标掩码图像取反处理，得到第二目标掩码图像(图2中E部分)(图3中未示出)，将第二目标掩码图像与第三图像数据图像进行相与处理得到第二相与图像(图2中G部分)，将第一相与图像与第二相与图像进行相加操作得到相与图像(图2中H部分)，将相与图像与第一图像数据组合后，得到生成图像数据(图2中I部分)，此外，还可以对相与图像进行去噪处理得到去噪相与图像，对去噪相与图像进行亮度调整得到亮度相与图像，将亮度相与图像与第一图像数据组合后，得到生成图像数据。

本发明实施例提供一种数据生成方法，通过获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；将所述第一图像数据以及所述相与图像组合得到生成图像数据。本发明实施例提供的一种数据生成方法，可以快速的生成危险场景或特定场景缺失而必要的深度学习训练集数据，该数据生成方法只需要利用自动选择位置生成需要的目标与背景图像结合的图像，可以根据选择的目标位置灵活的生成包含目标图像的图像数据，数据生成方法可准确的选取出目标掩码图像，使得生成准确的包含目标图像的图像数据，补充危险场景或特定场景下数据集的缺失。

在本发明的实施例中还提供一种数据生成装置，参阅图4，图4为本发明实施例提供的一种数据生成装置的架构图，所述数据生成装置包括：

图像获取模块410，用于获取图像数据，其中，所述图像数据包括第一图像数据和包含目标图像的第二图像数据；

目标掩码图像获取模块420，用于基于所述第二图像数据，得到多个掩码图像，并基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像；

相与图像获取模块430，用于以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，并将所述第一相与图像和第二相与图像进行相加处理，得到相与图像；

第一生成图像数据获取模块440，用于将所述第一图像数据以及所述相与图像组合得到生成图像数据。

其中，所述目标掩码图像获取模块，包括：

其中，所述本征信息计算单元，包括：

其中，相与图像获取模块，包括：

其中，第一目标掩码图像获取单元，包括：

在获取所述生成图像数据之后，所述数据生成装置包括：

标注框信息获取模块，用于基于所述相与图像，获取标注框和标注框信息，所述标注框为所述相与图像中的所述目标图像的最小外接矩形，所述标注框信息为所述标注框的顶点坐标和目标图像的宽高；

在获取所述生成图像数据之后，所述数据生成装置还包括：

基于同一发明构思，本发明实施例公开了一种电子设备，图5示出了本发明实施例公开的一种电子设备示意图，如图5所示，电子设备100包括：存储器110和处理器120，所述电子设备的存储器不少于12G，处理器主频不低于2.4GHz，存储器110与处理器120之间通过总线通信连接，存储器110中存储有计算机程序，该计算机程序可在处理器120上运行，以实现本发明实施例公开的一种数据生成方法中的步骤。

基于同一发明构思，本发明实施例公开了一种计算机可读存储介质，其上存储有计算机程序/指令，该计算机程序/指令被处理器执行时实现本发明实施例公开的一种数据生成方法中的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本发明实施例是参照根据本发明实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种数据生成方法、装置、电子设备及存储介质，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种数据生成方法，其特征在于，包括：

2.根据权利要求1所述的数据生成方法，其特征在于，所述基于所述掩码图像中所述目标图像的本征信息，获取目标掩码图像，包括：

3.根据权利要求2所述的数据生成方法，其特征在于，所述本征信息为所述目标图像的周长信息，所述基于所述轮廓点坐标，计算得到每张掩码图像中所述目标图像的本征信息，包括：

4.根据权利要求1所述的数据生成方法，其特征在于，以所述目标掩码图像为基准，对所述第一图像数据以及所述第二图像数据分别进行相与处理，得到第一相与图像和第二相与图像，包括：

5.根据权利要求4所述的数据生成方法，其特征在于，对所述目标掩码图像进行灰度化处理和二值化处理，包括：

6.根据权利要求1所述的数据生成方法，其特征在于，在获取所述生成图像数据之后，所述数据生成方法包括：

7.根据权利要求1所述的数据生成方法，其特征在于，得到所述相与图像之后，对所述相与图像进行亮度处理，得到亮度相与图像，包括：

通过对所述相与图像进行去噪处理，得到去噪相与图像；

8.一种数据生成装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

存储器，用于存储一个或多个程序；

处理器；

当所述一个或多个程序被所述处理器执行时，实现如权利要求1-7中任一项所述的数据生成方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的数据生成方法。