CN113342236A

CN113342236A - 一种数据处理方法和装置、电子设备、存储介质

Info

Publication number: CN113342236A
Application number: CN202010100012.7A
Authority: CN
Inventors: 余雪兵; 康勇
Original assignee: Navinfo Co Ltd
Current assignee: Navinfo Co Ltd
Priority date: 2020-02-18
Filing date: 2020-02-18
Publication date: 2021-09-03

Abstract

本公开提供一种数据处理方法和装置、电子设备、存储介质。包括：响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，第二数据集包括已标注的至少一个图片，根据第一数据集从至少一个图片中选取目标图片，从第一数据集中选取待标注图片，确定待标注图片的标注区域，根据标注区域对目标图片进行粘贴，对粘贴后的图片进行融合处理，生成标注图片，对标注图片进行显示，通过从已经标注的图片中选取目标图片，以便将目标图片粘贴至待标注图片的标注区域，并对粘贴后的图片进行融合处理，得到标注图片，实现了节约人力和提高标注效率的技术效果，且实现了提高标注的准确性和可靠性的技术效果，且实现了标注的全面性和有效性的技术效果。

Description

一种数据处理方法和装置、电子设备、存储介质

技术领域

本公开涉及互联网技术领域，尤其涉及一种数据处理方法和装置、电子设备、存储介质。

背景技术

随着计算机和互联网技术的快速发展和普及，互联网上存在海量的数据，这些数据主要以图片等作为信息载体，对这些信息载体进行标注已成为计算机数据训练的重要基础。

在现有的技术方案中，在对图片进行标注时，主要通过以下几种方式实现：a、通过人工的方式将各类别的对象的边缘用多边形描绘出来；b、通过半人工的方式进行标注，如将部分标注的数据样本训练得到模型，通过模型对待标注图片进行预测，得到预测结果，通过人工修正的方式对预测结果不正确的待标注图片进行修正；c、通过处理深度图数据，通过聚类和人工的方法对待标注图片进行标注；d、通过风格迁移的方法将目标场景的风格迁移至已有的标注图片上。

然而发明人在实现本公开的过程中，发现至少存在如下问题：采用方式a标注一张图片的时间大约为2个小时，且需要人工参与，因此存在即耗时费力的问题；采用方式b标注一张图片时间大约为1个小时，尽管相较于方式a已有改善，但依然存在耗费时间还是较长，且需要人工参与，耗费人力的问题；采用方式c时，深度图的获取需要依赖高精度的设备，在获取过程中，很难避免因设备本身造成的误差，且通过聚类和人工结合的方式尽管会节约一定的时间，还存在因算法本身造成的标注错误或标注不完全的问题；采用方式d，由于获取的图片与真实图片差很多，很可能造成训练的反面的影响。

发明内容

本公开提供一种数据处理方法和装置、电子设备、存储介质，用以解决上述技术问题中的至少一种。

一方面，本公开实施例提供一种数据处理方法，所述方法包括：

响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，所述第二数据集包括已标注的至少一个图片；

根据所述第一数据集从所述至少一个图片中选取目标图片；

从所述第一数据集中选取待标注图片，并确定所述待标注图片的标注区域；

根据所述标注区域对所述目标图片进行粘贴；

对粘贴后的图片进行融合处理，生成标注图片，以便对所述标注图片进行显示。

在一些实施例中，在所述获取预存的第二数据集之前，所述方法还包括：

获取预存的第三数据集，其中，所述第三数据集中包括已标注的各初始图片，且每个所述初始图片均包括至少一个类别的对象；

对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理，得到裁剪后的各图片；

根据所述裁剪后的各图片构建所述第二数据集。

在一些实施例中，所述对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理包括：

针对每个所述初始图片中的任一类别对应的对象，将所述任一类别对应的对象的像素值设置为第一像素值，并将其他类别对应的对象的像素值设置为第二像素值；

确定所述第一像素值或所述第二像素值对应的联通区域；

对所述联通区域中的对象进行裁剪处理。

在一些实施例中，所述确定所述待标注图片的标注区域包括：

将所述待标注图片划分成预设大小的区域；

获取所述目标图片在所述第一数据集中的各图片中的位置信息；

根据所述位置信息从所述区域中选取标注区域。

在一些实施例中，所述根据所述标注区域对所述目标图片进行粘贴包括：

获取所述目标图片的中心点；

根据所述中心点将所述目标图片粘贴至所述目标区域。

在一些实施例中，所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围，所述根据所述中心点将所述目标图片粘贴至所述目标区域包括：

在所述目标区域中选取定位点；

将所述目标图片粘贴至所述目标区域，并将所述中心点与所述定位点位于同一位置；

从所述高度范围中选取目标高度；

根据所述目标高度对所述目标图片进行缩放处理。

在一些实施例中，所述对粘贴后的图片进行融合处理包括：

根据泊松融合对粘贴后的图片进行融合处理；

以及，在生成所述标注图片之后，所述方法还包括：

对所述标注图片中的目标图片的边缘进行高斯模糊处理，得到所述目标标注图片，以便对所述目标标注图片进行显示。

在一些实施例中，所述至少一个图片、所述目标图片、所述初始图片和所述裁剪后的各图片分别包括label图片和与所述label图片对应的RGB图片。

另一方面，本公开实施例还提供了一种数据处理装置，所述装置包括：

第一获取模块，用于响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，所述第二数据集包括已标注的至少一个图片；

选取模块，用于根据所述第一数据集从所述至少一个图片中选取目标图片；

确定模块，用于从所述第一数据集中选取待标注图片，并确定所述待标注图片的标注区域；

粘贴模块，用于根据所述标注区域对所述目标图片进行粘贴；

融合模块，用于对粘贴后的图片进行融合处理，生成标注图片，以便对所述标注图片进行显示。

在一些实施例中，所述装置还包括：

第二获取模块，用于获取预存的第三数据集，其中，所述第三数据集中包括已标注的各初始图片，且每个所述初始图片均包括至少一个类别的对象；

裁剪模块，用于对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理，得到裁剪后的各图片；

构建模块，用于根据所述裁剪后的各图片构建所述第二数据集。

在一些实施例中，所述裁剪模块用于，针对每个所述初始图片中的任一类别对应的对象，将所述任一类别对应的对象的像素值设置为第一像素值，并将其他类别对应的对象的像素值设置为第二像素值，确定所述第一像素值或所述第二像素值对应的联通区域，对所述联通区域中的对象进行裁剪处理。

在一些实施例中，所述确定模块用于，将所述待标注图片划分成预设大小的区域，获取所述目标图片在所述第一数据集中的各图片中的位置信息，根据所述位置信息从所述区域中选取标注区域。

在一些实施例中，所述粘贴模块用于，获取所述目标图片的中心点，根据所述中心点将所述目标图片粘贴至所述目标区域。

在一些实施例中，所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围，所述粘贴模块用于，在所述目标区域中选取定位点，将所述目标图片粘贴至所述目标区域，并将所述中心点与所述定位点位于同一位置，从所述高度范围中选取目标高度，根据所述目标高度对所述目标图片进行缩放处理。

在一些实施例中，所述装置还包括：

所述融合模块用于，根据泊松融合对粘贴后的图片进行融合处理；

处理模块，用于对所述标注图片中的目标图片的边缘进行高斯模糊处理，得到所述目标标注图片，以便对所述目标标注图片进行显示。

另一方面，本公开实施例还提供了一种电子设备，包括：存储器，处理器；

所述存储器用于存储所述处理器可执行指令的存储器；

其中，当执行所述存储器中的指令时，所述处理器被配置为实现如上任一实施例所述的方法。

另一方面，本公开实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上任一实施例所述的方法。

本公开提供的响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，第二数据集包括已标注的至少一个图片，根据第一数据集从至少一个图片中选取目标图片，从第一数据集中选取待标注图片，并确定待标注图片的标注区域，根据标注区域对目标图片进行粘贴，对粘贴后的图片进行融合处理，生成标注图片，以便对标注图片进行显示，通过从已经标注的图片中选取目标图片，以便将目标图片粘贴至待标注图片的标注区域，并对粘贴后的图片进行融合处理，得到标注图片，一方面，避免了人工标注造成的上述问题(具体可参见背景技术，此处不再赘述)，从而实现了节约人力和提高标注效率的技术效果；另一方面，通过粘贴并融合的方式，无需借助精度高的获取设备，因而避免标注错误等问题，从而实现了提高标注的准确性和可靠性的技术效果；再一方面，通过结合第一数据集和第二数据集，可确保获取的图片和真实图片的差较小，从而实现标注的全面性和有效性等技术效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本公开实施例的数据处理方法的场景示意图；

图2为本公开实施例的数据处理方法的流程示意图；

图3为本公开实施例的第一数据集中的一个图片的示意图；

图4为本公开实施例的目标图片的示意图；

图5为本公开实施例的标注图片的示意图；

图6为本公开实施例的终端的显示界面示意图；

图7为本公开另一实施例的数据处理方法的流程示意图；

图8为本公开实施例的数据处理装置的模块示意图；

图9为本公开另一实施例的数据处理装置的模块示意图；

图10为本公开另一实施例的数据处理装置的模块示意图；

附图标记：10、用户，20、终端，30、服务器，1、第一获取模块，2、选取模块，3、确定模块，4、粘贴模块，5、融合模块，6、第二获取模块，7、裁剪模块，8、构建模块，9、处理模块。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供的数据处理方法，可以适用于如图1所示的场景。

其中，本公开实施例的数据处理方法的执行主体可以为数据处理装置，数据处理装置可以为终端，如电脑、计算机、iPad和车载终端等，也可以为服务器，如云端服务器和本地服务器等。

在如图1所示的应用场景中，数据处理装置为服务器。

例如：用户(如操作人员)10将第一数据集输入至终端20，并向终端20发送用于对第一数据集进行标注的请求。

用户终端20将第一数据集和请求发送至服务器30。

服务器30执行本公开实施例的数据处理方法，以便实现对第一数据集的标注，并得到标注图片。

在一些实施例中，服务器30将标注图片反馈至终端20。

终端20对标注图片进行显示。

在一些实施例中，可通过图像采集装置对第一数据集进行获取，并将第一数据集传输至终端20。

其中，图像采集装置包括具有拍照或摄像功能的装置，还包括激光雷达等。

在一些实施例中，本公开实施例的数据处理方法还可用于自动驾驶、机器人、人机交互、遥感等应用场景，等等，此处不再一一赘述。

下面以具体地实施例对本公开的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。

一个方面，本公开实施例提供了一种适用于上述场景的数据处理方法。

请参阅图2，图2为本公开实施例的数据处理方法的流程示意图。

如图2所示，该方法包括：

S101：响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，第二数据集包括已标注的至少一个图片。

基于上述示例可知，执行本公开实施例的数据处理方法的主体可以为终端，也可以为服务器，在上述示例中，是以服务器为例进行的示范性的说明，在本公开实施例中，将以执行主体为终端为例进行阐述。

其中，第一数据集包括多张图片。

第二数据集可以为存储在终端的存储器中的已经标注的图片的集合，也可以为存储在云端服务器或者其他设备中的已经标注的图片的集合。

若第二数据集为存储在终端的存储器中的已经标注的图片的集合，则当终端接收到用户或者外接设备发起的请求时，从存储器中提取第二数据集，以便进行后续处理。

若第二数据集为存储在云端服务器或者其他设备中的已经标注的图片的集合，则当终端接收到用户或者外接设备发起的请求时，从向云端服务器或者其他设备发起获取指令，且该获取指令中携带第二数据集的标识，向云端服务器或者其他设备在接收到获取指令后，基于标识确定第二数据集在云端服务器或者其他设备中的存储位置，并从确定出的存储位置中获取第二数据集，并将第二数据集发送至终端，以便终端进行后续处理。

也就是说，若第二数据集为存储在云端服务器或者其他设备中的已经标注的图片的集合，则预先建立云端服务器或者其他设备与终端的通信链路，且考虑到云端服务器或者其他设备可能还存储其他数据集，因此，预先为每个数据集(包括第二数据集)分别标识，并可构建标识与存储位置的映射关系，以便云端服务器或者其他设备在确定标识后，可基于标识和映射关系快速确定存储位置，从而快速的从存储位置中获取第二数据集并反馈至终端。其中，标识可以为ID。

S102：根据第一数据集从至少一个图片中选取目标图片。

在一些实施例中，第一数据集包括多个图片，每个图片包括至少一个对象。请参阅图3，图3为本公开实施例的第一数据集中的一个图片的示意图，该图片包括多个对象，如n辆车，则一辆车为一个对象；又如m棵树，则一棵树为一个对象；又如一栋房子，则该一栋房子为一个对象，等等。

在一些实施例中，第一数据集包括的各对象中至少包括目标图片对应的对象。

在一些实施例中，该步骤可以包括：对第一数据集中的各图片进行类别遍历处理，以确定第一数据集的所有类别，从至少一个图片中选取所述所有类别中的任一类别对应的图片，以便确定目标图片。其中，目标图片可参阅图4，图4为本公开实施例的目标图片的示意图。

例如：第一数据集包括a个图片，对a个图片中的每一个图片均进行类别遍历处理，即确定a个图片中的每一个图片对应的类别，得到第一数据集的所有类别，从至少一个图片中随机选取与所有类别中任一类别对应的图片。

在一些实施例中，得到的所有类别中可能存在相同的类别，则在选取目标图片之前，对所有类别中相同的类别进行过滤处理，以减少运算量。

S103：从第一数据集中选取待标注图片，并确定待标注图片的标注区域。

在该步骤中，对待标注图片进行确定，并在待标注图片上确定标注区域。

其中，可随机对待标注图片进行确定，也可对第一数据集中的各图片进行排序(如基于各图片的对象的数量进行排序等，且排序可以包括基于数量由大到小的降序排列，或者，基于数量由小到大的升序排列)，得到排序结果，并基于排序结果依次选取待标注图片。在一些实施例中，待标注图片可参阅图3。

其中，待标注图片中可以包括目标图片，也可以不包括目标图片。

S104：根据标注区域对目标图片进行粘贴。

在该步骤中，将目标图片粘贴至待标注图片的标注区域。

基于上述示例，将如图4所示的图片粘贴至图3所示的图片中，且粘贴至图3所示的图片中的标注区域(图中未示出)。

S105：对粘贴后的图片进行融合处理，生成标注图片，以便对标注图片进行显示。

在该步骤中，当对目标进行粘贴后，通过对粘贴后的图片进行融合处理，使得目标图片与待标注图片进行融合，得到标注图片。

基于上述示例，对将图4所示的图片粘贴至图3所示的图片后，对粘贴后的图片进行融合处理，生成如图5所示的标注图片，并对标注图片进行显示，终端的显示界面示意图可参见图6。

在本公开实施例中，提供了一种新的数据处理方法，该方法包括：响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，第二数据集包括已标注的至少一个图片，根据第一数据集从至少一个图片中选取目标图片，从第一数据集中选取待标注图片，并确定待标注图片的标注区域，根据标注区域对目标图片进行粘贴，对粘贴后的图片进行融合处理，生成标注图片，以便对标注图片进行显示，通过从已经标注的图片中选取目标图片，以便将目标图片粘贴至待标注图片的标注区域，并对粘贴后的图片进行融合处理，得到标注图片，一方面，避免了人工标注造成的上述问题(具体可参见背景技术，此处不再赘述)，从而实现了节约人力和提高标注效率的技术效果；另一方面，通过粘贴并融合的方式，无需借助精度高的获取设备，因而避免标注错误等问题，从而实现了提高标注的准确性和可靠性的技术效果；再一方面，通过结合第一数据集和第二数据集，可确保获取的图片和真实图片的差较小，从而实现标注的全面性和有效性等技术效果。

请参阅图7，图7为本公开另一实施例的数据处理方法的流程示意图。

结合图7可知，该方法包括：

S01：获取预存的第三数据集，其中，第三数据集中包括已标注的各初始图片，且每个初始图片均包括至少一个类别的对象。

同理，第三数据集可以为存储在终端的存储器中的已经标注的图片的集合，也可以为存储在云端服务器或者其他设备中的已经标注的初始图片的集合。

其中，第三数据包括多个初始图片，每个初始图片中均包括一个或多个类别的对象。基于上述示例可知，如图3所示，对象包括每一辆车、每一棵树和一栋房子，则类别可分为三个，分别为车辆类别，树类别和房子类别。

当然，也可以基于需求对类别进行适应性的划分或调整。如，将树和草(图中未示出)划分为一个类别；又如，将不同品牌的车辆划分为不同的类别，等等。

S02：对每个初始图片中的各个类别对应的对象分别进行裁剪处理，得到裁剪后的各图片。

在一些实施例中，针对每个初始图片，且针对该初始图片中的某个类别，对该类别的每个对象分别进行裁剪处理。

例如：针对初始图片a，初始图片a中包括3个类别，其中一个类别为车辆类别，且初始图片a中共包括3辆车。也就是说，针对初始图片a中的车辆类别，共有3个对象，则分别对该3个对象进行裁剪处理，即裁剪后得到3张图片。

在另一些实施例中，针对每个初始图片，且针对该初始图片中的某个类别，对该类别的所有对象进行整体性裁剪处理。

例如：针对初始图片a，初始图片a中包括3个类别，其中一个类别为车辆类别，且初始图片a中共包括3辆车。也就是说，针对初始图片a中的车辆类别，共有3个对象，则对该3个对象进行整体性裁剪处理，即裁剪后得到包括该3个对象的一张图片。

S03：根据裁剪后的各图片构建第二数据集。

基于上述示例可知，第二数据集中包括多个裁剪后的图片，且每个图片均包括一个类别的对象，对象的数量可以为多个，也可以为一个。

在一些实施例中，S03可包括：对裁剪后的各图片进行去重处理，并构建第二数据集。在该实施例中，通过对裁剪后的各图片进行去重处理，可以减少后续的计算量，并释放存储空间。

S201：响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，第二数据集包括已标注的至少一个图片。

其中，S201的描述可参见S101，且至少一个图片即为上述示例中的裁剪后的各图片，或者去重处理后的各图片。

S202：根据第一数据集从至少一个图片中选取目标图片。

其中，S202的描述可参见S102。

S203：从第一数据集中选取待标注图片，并确定待标注图片的标注区域。

其中，S203的描述可参见S103。

S204：根据标注区域对目标图片进行粘贴。

其中，S204的描述可参见S104。

S205：对粘贴后的图片进行融合处理，生成标注图片，以便对标注图片进行显示。

其中，S205的描述可参见S105。

在一些实施例中，S02包括：

S021：针对每个初始图片中的任一类别对应的对象，将任一类别对应的对象的像素值设置为第一像素值，并将其他类别对应的对象的像素值设置为第二像素值。

基于上述示例，针对初始图片a，初始图片a中包括3个类别，3个类别为车辆、树和房子，则针对车辆类别，将车辆类别对应的车的像素值设置为第一像素值，将树类别和房子类别对象的像素值设置为第二像素值。

其中，第一像素值和第二像素值为不同的像素值。

在一些实施例中，第一像素值为255，第二像素值为0，以便快速的对不同的类别的对象进行准确的区分。

S022：确定第一像素值或第二像素值对应的联通区域。

其中，联通区域是指第一像素值对应的所有区域。

例如：初始图片a中共有3辆车，则针对车辆类别，对象有3个，将3个对象的像素值均设置为第一像素值，第一像素值的区域为3个对象中每个对象所属区域的总和，则3个对象的所属区域的总区域即为联通区域。

又如：初始图片a中共有1辆车，则针对车辆类别，对象为一个，将该一个对象的像素值设置为第一像素值，则第一像素值的区域为该一个对象的所属区域，即该一个对象的所属区域为联通区域。

值得说明的是，若将第一像素值设置为255，第二像素值为0，则基于像素值的显示特性(现有技术，此处不再赘述)，则在该步骤中，优选对第一像素值对应的联通区域进行确定，以便减少后续的转换计算量和时间。

S023：对联通区域中的对象进行裁剪处理。

在本公开实施例中，通过设置像素值的方式对相应的对象进行裁剪，可实现裁剪的便捷性、高效性和准确性的技术效果。

在一些实施例中，确定待标注图片的标注区域包括：

S1031：将待标注图片划分成预设大小的区域。

在一些实施例中，该步骤可包括：将待标注图片划分成预设大小的方格。

例如：待标注图片的大小为H*W，其中，H为待标注图片的长度(单位可以为厘米等)，W为待标注图片的宽度(同理，单位也可以为厘米等)，对待标注图片划分为n*n大小的方格，且方格的数量为N个，则N＝(H/n)*(W/n)。

S1032：获取目标图片在第一数据集中的各图片中的位置信息。

在一些实施例中，该步骤可包括：从第一数据集中确定包括目标图像对应的对象的图片，从确定出的图片中获取与目标图像对应的对象的位置信息。

基于上述示例可知，第一数据集中至少部分图片包括目标图片对应的对象。如目标图片为摩托车，则第一数据集中至少部分图片中也包括摩托车，则根据第一数据集中包括摩托车的图片确定摩托车的位置信息。

例如：目标图片的对象为摩托车，第一数据集中共有x个图片，其中包括对象为摩托车的图片共有y个，则将y个图片中的每一个图片中的摩托车的位置信息均进行获取。其中，位置信息为摩托车相对于其所属图片的位置的信息，包括摩托车的高度、宽度等信息，也包括摩托车与其他对象之间的位置信息。也就是说，位置信息包括对象本身的位置信息，还包括相对位置信息。

S1033：根据位置信息从区域中选取标注区域。

在确定出位置信息之后，则可基于位置信息选取标注区域，由于位置信息是基于真实图片确定的，即位置信息具有较高的真实性和可靠性，因此，通过根据位置信息选取标注区域，可以实现提高标注图片的真实性和可靠性的技术效果。

在一些实施例中，S104包括：

S1041：获取目标图片的中心点。

S1042：根据中心点将目标图片粘贴至目标区域。

在本公开实施例中，通过确定出的中心点对目标图片进行粘贴，可以避免粘贴过程中目标图片的变形等，以便确保粘贴过程的可靠性，从而实现后续得到可靠性高的标注图片的技术效果。

在一些实施例中，目标区域包括基于位置信息确定的与目标图片对应的高度范围，S1042包括：

S10421：在目标区域中选取定位点。

可以理解的，在不同的图片中，基于图片获取的距离或者图片获取设备的参数等原因，可能会使相同对象的高度信息不一致，而基于不一致的高度信息可以确定出对象的高度范围。

因此，基于上述示例，目标区域即为确定的对目标图片进行粘贴的区域，而基于位置信息可以确定摩托车的高度范围，该高度范围可以为基于y个图片中的每一个图片中的摩托车的高度信息确定。

在一些实施例中，可以将目标区域中的任一点确定为定位点；在另一些实施例中，还可以基于y个图片中的每一个图片中的摩托车出现频率最高的位置确定定位点。

S10422：将目标图片粘贴至目标区域，并将中心点与定位点位于同一位置。

在该步骤中，根据中心点和定位点将目标图片粘贴至目标区域，且中心点与定位点贴合，即粘贴后的目标图片的中心点即为定位点。

S10423：从高度范围中选取目标高度。

在一些实施例中，可以从高度范围中选取任一高度作为目标高度；在另一些实施例中，还可以从高度范围中选取频率最高的高度作为目标高度。

S10424：根据目标高度对目标图片进行缩放处理。

在一些实施例中，为确保缩放过程中目标图片不失真，则保持目标图片的长宽比对目标图片进行缩放，直至目标图片缩放至目标高度。

在一些实施例中，缩放处理时保持中心点不变，即缩放处理后的中心点与缩放处理前的中心点为相同的点。

在一些实施例中，对粘贴后的图片进行融合处理包括：

S1051：根据泊松融合对粘贴后的图片进行融合处理。

在本公开实施例中，通过泊松融合对粘贴后的图片进行融合处理，可将目标图片嵌入到待标注图片中，生成无缝组合的标注图片，以提高标注图片的真实性。

以及，在S1051之后，该方法还包括：

S1052：对标注图片中的目标图片的边缘进行高斯模糊处理，得到目标标注图片，以便对目标标注图片进行显示。

为提高标注图片的真实感，对标注图片中的目标图片的边缘进行高斯模糊处理，且基于对标注图片中的目标图片的边缘进行高斯模糊处理，可以提高标注图片与待标注图片的贴合度。

在一些实施例中，至少一个图片、目标图片、初始图片和裁剪后的各图片分别包括label图片和与label图片对应的RGB图片。

可以理解的是，在对图片进行标注时，一般包括label图片和RGB图片，且label图片和RGB图片为一一对应关系，即一个label图片对应一个RGB图片，而在标注过程中，也包括对label图片标注和对RGB图片标注。

在本公开实施例中，在对每个初始图片中的各个类别对应的对象分别进行裁剪处理时，可通过上述示例分别对label图片和RGB图片进行裁剪处理。但是，由于label图片和RGB图片为一一对应关系，因此，为了提高效率，节约成本，可在基于上述示例对label图片进行裁剪处理，并基于label图片与RGB图片的对应关系对RGB图片进行裁剪处理。

例如：通过上述示例对label图片中的某对象进行裁剪处理，确定该对象在RGB图片中的位置，并基于确定出的位置对RGB图片中的该对象进行裁剪处理。

其中，对label图片和RGB图片的粘贴和缩放处理可参见裁剪处理，此处不再赘述。

根据本公开实施例的另一个方面，本公开实施例还提供了一种数据处理装置。

请参阅图8，图8为本公开实施例的数据处理装置的模块示意图。

如图8所示，该装置包括：

第一获取模块1，用于响应于接收到对第一数据集进行标注的请求，获取预存的第二数据集，其中，所述第二数据集包括已标注的至少一个图片；

选取模块2，用于根据所述第一数据集从所述至少一个图片中选取目标图片；

确定模块3，用于从所述第一数据集中选取待标注图片，并确定所述待标注图片的标注区域；

粘贴模块4，用于根据所述标注区域对所述目标图片进行粘贴；

融合模块5，用于对粘贴后的图片进行融合处理，生成标注图片，以便对所述标注图片进行显示。

结合图9可知，在一些实施例中，所述装置还包括：

第二获取模块6，用于获取预存的第三数据集，其中，所述第三数据集中包括已标注的各初始图片，且每个所述初始图片均包括至少一个类别的对象；

裁剪模块7，用于对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理，得到裁剪后的各图片；

构建模块8，用于根据所述裁剪后的各图片构建所述第二数据集。

在一些实施例中，所述裁剪模块7用于，针对每个所述初始图片中的任一类别对应的对象，将所述任一类别对应的对象的像素值设置为第一像素值，并将其他类别对应的对象的像素值设置为第二像素值，确定所述第一像素值或所述第二像素值对应的联通区域，对所述联通区域中的对象进行裁剪处理。

在一些实施例中，所述确定模块3用于，将所述待标注图片划分成预设大小的区域，获取所述目标图片在所述第一数据集中的各图片中的位置信息，根据所述位置信息从所述区域中选取标注区域。

在一些实施例中，所述粘贴模块4用于，获取所述目标图片的中心点，根据所述中心点将所述目标图片粘贴至所述目标区域。

在一些实施例中，所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围，所述粘贴模块4用于，在所述目标区域中选取定位点，将所述目标图片粘贴至所述目标区域，并将所述中心点与所述定位点位于同一位置，从所述高度范围中选取目标高度，根据所述目标高度对所述目标图片进行缩放处理。

结合图10可知，在一些实施例中，所述装置还包括：

所述融合模块5用于，根据泊松融合对粘贴后的图片进行融合处理；

处理模块9，用于对所述标注图片中的目标图片的边缘进行高斯模糊处理，得到所述目标标注图片，以便对所述目标标注图片进行显示。

根据本公开实施例的另一方面，本公开实施例还提供了一种电子设备，包括：存储器，处理器；

所述存储器用于存储所述处理器可执行指令的存储器；

根据本公开实施例的另一方面，本公开实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上任一实施例所述的方法。

读者应理解，在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必针对的是相同的实施例或示例。而且，描述的具体特征、结构或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本公开实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

还应理解，在本公开各实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。

以上，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

根据所述第一数据集从所述至少一个图片中选取目标图片；

根据所述标注区域对所述目标图片进行粘贴；

2.根据权利要求1所述的方法，其特征在于，在所述获取预存的第二数据集之前，所述方法还包括：

根据所述裁剪后的各图片构建所述第二数据集。

3.根据权利要求2所述的方法，其特征在于，所述对每个所述初始图片中的各个类别对应的对象分别进行裁剪处理包括：

确定所述第一像素值或所述第二像素值对应的联通区域；

对所述联通区域中的对象进行裁剪处理。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述确定所述待标注图片的标注区域包括：

将所述待标注图片划分成预设大小的区域；

根据所述位置信息从所述区域中选取标注区域。

5.根据权利要求4所述的方法，其特征在于，所述根据所述标注区域对所述目标图片进行粘贴包括：

获取所述目标图片的中心点；

根据所述中心点将所述目标图片粘贴至所述目标区域。

6.根据权利要求5所述的方法，其特征在于，所述目标区域包括基于所述位置信息确定的与所述目标图片对应的高度范围，所述根据所述中心点将所述目标图片粘贴至所述目标区域包括：

在所述目标区域中选取定位点；

从所述高度范围中选取目标高度；

根据所述目标高度对所述目标图片进行缩放处理。

7.根据权利要求1至3中任一项所述的方法，其特征在于，所述对粘贴后的图片进行融合处理包括：

根据泊松融合对粘贴后的图片进行融合处理；

以及，在生成所述标注图片之后，所述方法还包括：

8.一种数据处理装置，其特征在于，所述装置包括：

9.一种电子设备，包括：存储器，处理器；

所述存储器用于存储所述处理器可执行指令的存储器；

其中，当执行所述存储器中的指令时，所述处理器被配置为实现如权利要求1至7中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的方法。