CN112115996A

CN112115996A - 图像数据的处理方法、装置、设备及存储介质

Info

Publication number: CN112115996A
Application number: CN202010954412.4A
Authority: CN
Inventors: 申世伟
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-09-11
Filing date: 2020-09-11
Publication date: 2020-12-22
Anticipated expiration: 2040-09-11
Also published as: CN112115996B

Abstract

本公开关于一种图像数据的处理方法、装置、设备及存储介质，其中，方法包括：获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集；对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量；获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量；分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集。本公开的方案，可以解决人工确定标注错误的图像数据耗时长且准确率低的问题，可以快速且准确的确定标注错误的图像数据，为提升深度学习预测模型的准确率提供依据。

Description

图像数据的处理方法、装置、设备及存储介质

技术领域

本公开涉及本公开涉及计算机技术领域，尤其涉及一种图像数据的处理方法、装置、设备及存储介质。

背景技术

随着计算机技术的不断发展，深度学习等智能算法被广泛用来解决各种日常问题，例如，通过深度学习模型实现图像分类、行人检测以及车牌识别等日常问题。

相关技术中，当深度学习预测模型对测试数据集进行测试，得到测试结果之后，需要通过开发人员根据经验来确定该模型的性能，并查找是否存在标注错误的图像数据。

但是，这种方法需要依据开发人员的经验，判断结果存在主观性，同时也会存在耗时较长，并且很难准确的确定图像数据是否标注错误等问题。

发明内容

本公开提供一种图像数据的处理方法、装置、设备及存储介质，以至少解决相关技术中确定标注错误的图像数据耗时长，且准确率低的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种图像数据的处理方法，包括：

获取第一图像数据集，对所述第一图像数据集进行筛选处理，得到第二图像数据集；

对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量；

获取第三图像数据集，对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量；

分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度，并根据所述相似度确定第四图像数据集。

可选的，所述对所述第一图像数据集进行筛选处理，得到第二图像数据集步骤包括：

通过深度学习预测模型对第一图像数据集进行测试，得到多个预测结果；

将各所述预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据；

确定预测概率大于第一设定阈值的各所述目标图像数据为所述第二图像数据集。

可选的，所述对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量步骤包括：

对所述第二图像数据集进行分组操作，得到多个第二图像数据组；其中，每个第二图像数据组中包含的各图像数据的标签相同；

将目标第二图像数据组输入至深度学习预测模型中，提取所述目标第二图像数据组中的各图像数据的语义特征向量；

对各所述语义特征向量进行分类操作，得到多个第一图像数据簇；

确定各所述第一图像数据簇的中心向量，作为各图像数据簇的第一核心特征向量。

可选的，所述对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量步骤包括：

对所述第三图像数据集进行分组操作，得到多个第三图像数据组；其中，每个第三图像数据组中包含的各图像数据的标签相同；

将目标第三图像数据组输入至深度学习预测模型中，提取所述目标第三图像数据组中的各图像数据的语义特征向量；

对各所述语义特征向量进行分类操作，得到多个第二图像数据簇；

确定各所述第二图像数据簇的中心向量，作为各图像数据簇的第二核心特征向量。

可选的，所述分别计算所述第一核心特征向量与所述第二核心特征向量的相似度步骤包括：

分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的之间的两两夹角，并根据所述夹角确定所述相似度。

可选的，所述根据所述相似度确定第四图像数据集步骤包括：

当目标相似度大于设定阈值时，确定与所述目标相似度对应的第二图像数据簇为所述第四图像数据集。

可选的，在获取第一图像数据集步骤之前，所述方法还包括：

获取深度学习预测模型；

相应的，所述获取深度学习预测模型步骤包括：

获取对目标数据集进行标注而确定的标注集，所述标注集包括第三图像数据集和第一图像数据集；

将所述第三图像数据集输入至深度学习训练模型中进行训练，得到所述深度学习预测模型。

可选的，在所述根据所述相似度确定第四图像数据集步骤之后，所述方法还包括：

重新对第四图像数据集中的各图像数据进行分类，并根据重新标注的图像数据更新第三图像数据集；

根据更新后的第三图像数据集更新深度学习预测模型，得到最终深度学习预测模型。

可选的，在对各所述语义特征向量进行分类操作，得到多个第一图像数据簇步骤之后，所述方法还包括：

若目标图像数据簇包含的图像数据的数量小于第二设定阈值，则删除所述目标图像数据簇。

根据本公开实施例的第二方面，提供一种图像数据的处理装置，包括：

第一获取模块，被配置为获取第一图像数据集，对所述第一图像数据集进行筛选处理，得到第二图像数据集，

确定模块，被配置为对所述第二图像数据集进行分类操作，得到多个第一图像数据簇的，并确定各所述第一图像数据簇的第一核心特征向量；

第二获取模块，被配置为获取第三图像数据集，对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量

计算模块，被配置为分别计算每个所述第一核心特征向量与每个所述第二核心特征向量的相似度，并根据所述相似度确定标注错误的第四图像数据集。

可选的，所述第一获取模块，具体被配置为

可选的，所述确定模块，具体被配置为

可选的，所述第二获取模块，具体被配置为

可选的，所述计算模块，具体被配置为

可选的，所述计算模块，包括：确定子模块，被配置为

可选的，所述装置还包括：深度学习预测模型获取模块，被配置为

可选的，所述装置还包括：重新分类模块，被配置为

可选的，所述装置还包括：删除模块，被配置为

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如本公开任一实施例所述的图像数据的处理方法。

根据本公开实施例的第四方面，提供一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如本公开任一实施例所述的图像数据的处理方法。

据本公开实施例的第五方面，提供一种计算机程序产品，用于与电子设备结合使用，所述计算机程序产品包括计算机可读存储介质和内嵌于其中的计算机程序机制，经由计算机载入该程序并执行后能够实现如本公开任一实施例所述的图像数据的处理方法。

本公开的实施例提供的技术方案至少带来以下有益效果：通过获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集；对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量；获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量；分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集，可以解决人工确定标注错误的图像数据耗时长，且准确率低的问题，可以快速且准确的确定标注错误的图像数据，为提升深度学习预测模型的准确率提供依据。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种图像数据的处理方法的流程图。

图2是根据一示例性实施例示出的一种图像数据的处理方法的流程图。

图3是根据一示例性实施例示出的一种图像数据的处理方法的流程图。

图4是根据一示例性实施例示出的一种图像数据的处理装置的框图。

图5是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种图像数据的处理方法的流程图，如图1所示，图像数据的处理方法可以通过图像数据的处理装置执行，该装置可以通过软件和/或硬件的方式实现，并用于电子设备中，该电子设备可以为计算机、服务器或者智能手机等，该方法包括以下步骤。

在步骤S11中，获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集。

其中，第一图像数据集可以为图像分类任务中的测试图像数据集；第二图像数据集可以为疑似标注错误的图像数据集，其中，疑似标注错误的图像数据集的标注标签与预测标签不一致。

在本实施例的一个可选实现方式中，在获取到图像数据集之后，可以按照一定的比例(例如，5:4或者5:1等，本实施例中对其不加以限定)将获取到的图像数据集拆分为测试图像数据集和训练图像数据集；其中，测试图像数据集即为本实施例中涉及到的第一图像数据集；训练图像数据集即为本实施例后文提到的第三图像数据集。

在本实施例的一个可选实现方式中，在获取到图像数据集中的第一图像数据集之后，可以对第一图像数据集进行筛选处理，从而得到疑似标注错误的图像数据集，即第二图像数据集。

需要说明的是，目前，可以通过人工标注或者算法标注的方式对图像数据数据集进行标注(即分类)；但是由于图像数据集的样式多变，因此广泛采用人工标注的方式对图像数据集进行标注。示例性的，对于图像分类任务，可以通过人工标注的方式对图像数据中包括的各个类别进行标注，例如，分别标注出图像数据中的猫、狗、花或者人物等，本实施例对此不加以限制。

示例性的，在获取到第一图像数据集之后，可以将第一图像数据集输入至深度学习预测模型中，例如，分类任务预测模型或者目标检测任务预测模型，本实施例中对其不加以限定；得到针对每一个测试图像数据的预测结果，并在预测结果中确定标注标签与预测标签不一致的图像数据，例如，测试图像数据A的标注标签为狗，针对该测试图像数据的预测标签为猫，此时，可以确定测试图像数据A的标注标签与预测标签不一致，测试图像数据A即为第二图像数据集中的一个图像数据。可以理解的是，所有疑似标注错误的图像数据组成的集合即为疑似标注错误的图像数据集。

在步骤S12中，对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量。

在本实施例的一个可选实现方式中，在对第一图像数据集进行筛选处理，得到第二图像数据集之后，可以进一步的对第二图像数据集进行分类(聚类)操作，得到多个第一图像数据簇；示例性的，若第二图像数据集中包含“猫”、“狗”以及“猪”三个类别的图像数据，则可以将第二图像数据集分类(聚类)成三个第一图像数据簇。

在本实施例的一个可选实现方式中，在得到多个第一图像数据簇之后，可以进一步的确定各个第一图像数据簇的第一核心特征向量；示例性的，在本实施例中可以先确定第一图像数据簇中的每一个图像数据的核心特征向量，再根据每一个图像数据的核心特征向量确定第一核心特征向量。需要说明的是，本实施例中涉及到的每一个图像数据的核心特征向量可以包括该图像数据的颜色特征、纹理特征、形状特征或者空间关系特征等，本实施例对其不加以限制。

在步骤S13中，获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量。

其中，第三图像数据集即为上文中涉及到从图像数据集中确定的训练图像数据集；训练数据集指的是用于训练的样本集合，主要用来训练深度学习预测模型中的参数。

在本实施例的一个可选实现房子中，在确定第一图像数据簇的第一核心特征向量之后，可以进一步的获取第三图像数据集，并对第三图像数据集进行分类(聚类)操作，得到多个第二图像数据簇，并进一步的确定各个第二图像数据簇的第二核心特征向量。

示例性的，示例性的，若第三图像数据集中包含“猫”、“狗”以及“鸟”三个类别的图像数据，则可以将第三图像数据集分类(聚类)成三个第二图像数据簇。

在本实施例的一个可选实现方式中，在得到多个第二图像数据簇之后，可以进一步的确定各个第二图像数据簇的第二核心特征向量；示例性的，在本实施例中可以先确定第二图像数据簇中的每一个训练图像数据的核心特征向量，再根据每一个训练图像数据的核心特征向量确定第二核心特征向量。

在部署S14中，分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集。

其中，第四图像数据集为在第二图像数据集(疑似标注错误的图像数据集)中确定的标注错误的图像数据。

在本实施例的一个可选实现方式中，在确定各第一图像数据簇的第一核心特征向量以及各第二图像数据簇的第二核心特征向量之后，可以进一步的计算每个第一核心特征向量与第二核心特征向量之间的相似度，并根据计算得到的相似度确定第四图像数据集。

在本实施例的一个具体例子中，可以计算预测标签为L，而标注标签不是L的第二图像数据的第一核心特征向量与标注标签为L的训练数据的第二核心特征向量之间相似度，进一步的根据二者之间的相似度确定预测标签为L的第二图像数据是否标注错误，其中，标签L可以为任意一个标签，例如，“猫”或者“狗”等标签，本实施例中对其不作限定。

可选的，根据所述相似度确定第四图像数据集步骤可以包括：当目标相似度大于设定阈值时，确定与所述目标相似度对应的第二图像数据簇为所述第四图像数据集。

其中，目标相似度可以为任一第一核心特征向量与任一第二核心特征向量之间的相似度，本实施例中对其不加以限定；设定阈值可以为0.8、0.85或者0.9等数值，可以根据实际情况随机确定，本实施例中对其不作限定。

需要说明的是，计算预测标签为L，而标注标签不是L的第二图像数据的第一核心特征向量与标注标签为L的训练数据的第二核心特征向量之间相似度，当标注标签不是L的第二图像数据的第一核心特征向量与标注标签为L的训练数据的第二核心特征向量之间的相似度越大(例如，大于设定阈值0.9)，证明标注标签不是L的第二图像数据与标注标签为L的训练数据应属于同一个标签(类别)，则此时可以确定标注标签不是L的第二图像数据标注错误。

本实施例的方案，通过获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集；对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量；获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量；分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集，可以解决人工确定标注错误的图像数据(第四图像数据集)耗时长，且准确率低的问题，可以快速且准确的确定标注错误的图像数据，为提升深度学习预测模型的准确率提供依据。

图2是根据一示例性实施例示出的一种图像数据的处理方法的流程图，本实施例是对上述技术方案的进一步细化，本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图2所示，图像数据的处理方法包括如下步骤。

在步骤S21中，获取深度学习预测模型。

在本实施例的一个可选实现方式中，获取深度学习预测模型步骤可以包括：获取对目标数据集进行标注而确定的标注集，标注集包括第三图像数据集(训练图像数据集)和第一图像数据集(测试图像数据集)；将第三图像数据集输入至深度学习训练模型中进行训练，得到深度学习预测模型。

其中，目标图像数据集可以为与任一任务匹配的任一图像数据集，例如，与图像分类任务匹配的图像数据集，本实施例对此不加以限制。

在步骤S22中，通过深度学习预测模型对第一图像数据集进行测试，得到多个预测结果；将各预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据；确定预测概率大于第一设定阈值的各目标图像数据为第二图像数据集。

其中，第一设定阈值可以为0.9、0.85或者0.8等概率值，本实施例中对其不加以限制。

在本实施例的一个可选实现方式中，在获取到第一图像数据集之后，可以将第一图像数据集输入至深度学习预测模型中，深度学习预测模型对第一图像数据集中的每个测试图像数据进行预测，从而得到测试数据集中每个测试图像的预测结果；进一步的，分别确定每个测试图像的预测标签与其标注标签是否一致，将预测标签与标注标签不一致，且预测概率大于第一设定阈值的测试图像添加至第二图像数据集。

示例性的，若某一测试图像的预测标签为标签“0”，预测概率为0.98(第一设定阈值为0.9)，该测试图像的标注标签为标签“1”，则可以将该测试图像添加至第二图像数据集中。

在本实施例的另一个具体例子中，在将预测标签与标签不一致的图像数据确定为目标图像数据之后，也可以对各个目标图像数据的预测概率进行大小排序，并将预测概率较大的多个目标图像数据添加至疑似标注错误的图像数据集中。例如，对各个目标图像数据的预测概率进行大小排序之后，可以将预测概率较大的10个或者20个等数量的目标图像数据添加至第二图像数据集中。

在步骤S23中，对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量。

在本实施例的一个可选实现方式中，对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量步骤包括：对第二图像数据集进行分组操作，得到多个第二图像数据组；其中，每个第二图像数据组中包含的各图像数据的标签相同；将目标第二图像数据组输入至深度学习预测模型中，提取目标第二图像数据组中的各图像数据的语义特征向量；对各语义特征向量进行分类操作，得到多个第一图像数据簇；确定各第一图像数据簇的中心向量，作为各图像数据簇的第一核心特征向量。

可选的，在确定第二图像数据集之后，可以进一步的对第二图像数据集进行分组操作，即将标签相同的图像数据分在同一个组内，从而得到多个第二图像数据组。例如，第二图像数据集中包括10个标签为“0”的图像数据，100个标签为“1”的图像数据，200个标签为“2”的图像数据，则可以将标签为“0”的10个图像数据分在一个第二图像数据组内，将标签为“1”的100个图像数据分在另一个第二图像数据组内；将标签为“2”的200个图像数据分在又一个第二图像数据组内等等。

进一步的，可以将目标第二图像数据组输入至深度学习预测模型中，其中，目标第二图像数据组可以为任意一个第二图像数据组，例如，上述例子中涉及到的任一第二图像数据组，本实施例中对其不加以限制。将目标第二图像数据组输入至深度学习预测模型之后，可以提取目标第二图像数组中各个图像数据的各语义特征向量。例如，目标第二图像数据组中包括100个图像数据，则可以将这100个图像数据分别输入至深度学习预测模型中，从而得到这100个图像数据的语义特征向量。

在本实施例的一个具体例子中，将目标第二图像数据输入至深度学习预测模型中之后，提取深度学习预测模型的全连接层，即可确定该图像数据的语义特征向量。其中，每个图像数据的语义特征向量可以为1024维，也可以为2048维，本实施例中对其不加以限制。

进一步的，可以对各个语义特征向量进行分类(聚类)操作，从而得到多个图像数据簇。例如，上述例子中得到目标第二图像数据组中包括100个图像数据的语义特征向量之后，可以对这100个语义特征向量进行分类(聚类)操作，从而将这100个图像数据分成不同的图像数据簇。

其中，本实施例中涉及到的分类(聚类)操作可以为k-means聚类，把目标第二图像数据组分割为不同的图像数据簇，使得同一个簇内的图像数据的相似性尽可能大，同时不在同一个图像数据簇的图像数据之间的差异性也尽可能的大。

在本实施例的一个可选实现方式中，得到多个图像数据簇之后，可以进一步的确定各个图像数据簇的中心向量，其中，各个图像数据簇的中心向量即为各个图像数据簇的第一核心特征向量。

示例性的，本实施例中可以计算某一图像数据簇所包含的多个图像数据的语义特征向量的均值作为该图像数据簇的中心向量，或者将某一图像数据簇所包含的多个图像数据的语义特征向量按大小进行排序，将中间位置的语义特征向量作为该图像数据簇的中心向量。需要说明的是，本实施例中还可以通过其他方法确定各个图像数据簇的中心向量，本实施例中在此不再对其进行赘述，其并不是对本实施例的限定。

可选的，在对各语义特征向量进行聚类操作，得到多个图像数据簇步骤之后，方法还可以包括：若目标图像数据簇包含的图像数据的数量小于第二设定阈值，则删除目标图像数据簇。

其中，第二设定阈值可以为2个、3个或者5个等数值，本实施例中对其不加以限制。

在具体实现中，通过对各语义特征向量进行聚类操作，从而确定多个图像数据簇之后，若确定目标图像数据簇包含的图像数据的数量小于2个(第二设定阈值)，则可以删除目标图像数据簇。其中，目标图像数据簇可以为得到的多个图像数据簇中的任意一个图像数据簇。这样设置的好处在于，可以保证图片数据簇中的错误数据的产生是具备普遍性的。

在步骤S24中，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量。

在本实施例的一个可选实现方式中，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量步骤可以包括：对第三图像数据集进行分组操作，得到多个第三图像数据组；其中，每个第三图像数据组中包含的各图像数据的标签相同；将目标第三图像数据组输入至深度学习预测模型中，提取目标第三图像数据组中的各图像数据的语义特征向量；对各语义特征向量进行分类操作，得到多个第二图像数据簇；确定各第二图像数据簇的中心向量，作为各图像数据簇的第二核心特征向量。

可选的，在获取第三图像数据集即训练图像数据集之后，可以先对第三图像数据集进行分组操作，即将标签相同的图像数据分在同一个组内，从而得到多个第三图像数据组。例如，第三图像数据集中包括100个标签为“0”的图像数据，1000个标签为“1”的图像数据，2000个标签为“2”的图像数据，则可以将标签为“0”的100个图像数据分在一个第三图像数据组内，将标签为“1”的1000个图像数据分在另一个第三图像数据组内；将标签为“2”的2000个图像数据分在又一个第三图像数据组内等等。

进一步的，可以将目标第三图像数据组输入至深度学习预测模型中，其中，目标第三图像数据组可以为任意一个第三图像数据组，本实施例中对其不加以限制。将目标第三图像数据组输入至深度学习预测模型之后，可以提取目标第三图像数据组中各个图像数据的各语义特征向量。例如，目标第三图像数据组中包括100个图像数据，则可以将这100个图像数据分别输入至深度学习预测模型中，从而得到这100个图像数据的语义特征向量。

进一步的，可以对各个语义特征向量进行分类(聚类)操作，从而得到多个图像数据簇。例如，确定目标第三图像数据组中包括的100个图像数据的语义特征向量之后，可以对这100个语义特征向量进行聚类操作，从而将这100个图像数据分成不同的图像数据簇。

在具体实现中，得到多个图像数据簇之后，可以进一步的确定各个图像数据簇的中心向量，其中，各个图像数据簇的中心向量即为各个图像数据簇的第二核心特征向量。

其中，确定第三图像数据集各个第二图像数据簇的第二核心特征向量的方式，与上述确定各第一图像数据簇的第一核心特征向量的方式相同，本实施例中在此不再对其进行赘述。

在步骤S25中，分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集。

在具体实现中，通过步骤S22和步骤S23确定各第一核心特征向量以及各第二核心特征向量之后，可以进一步的确定每个第一核心特征向量与每个第二核心特征向量之间的相似度，并根据相似度确定第四图像数据集。

可选的，分别计算第一核心特征向量与第二核心特征向量的相似度步骤包括：分别计算每个第一核心特征向量与每个第二核心特征向量的之间的两两夹角，并根据夹角确定相似度。

在具体实现中，可以计算预测标签为“0”，而标注标签不是“0”的第一图像数据簇的第一核心特征向量与标注标签为“0”的第二图像数据簇的第二核心特征向量之间的夹角，并进一步的根据二者之间的夹角确定两个图像数据簇之间的相似度。其中，两个核心特征向量之间的夹角越小，两个核心特征向量越相似，当夹角为0时，两个核心特征向量之间的相似度越大。

本实施例的方案，获取深度学习预测模型，并通过深度学习预测模型对第一图像数据集进行测试，确定第二图像数据集；确定第二图像数据集的各第一核心特征向量；确定第三图像数据集的各第二核心特征向量；分别计算第一核心特征向量与第二核心特征向量的相似度，并根据相似度确定第二图像数据集中标注错误的的图像数据集，可以解决人工确定标注错误的图像数据耗时长，且准确率低的问题，可以快速且准确的确定标注错误的图像数据，为后续对标注错误的图像数据的重新标注提供依据，从而可以进一步的提高深度学习预测模型的精度。

图3是根据一示例性实施例示出的一种图像数据的处理方法的流程图，本实施例是对上述技术方案的进一步细化，本实施例中的技术方案可以与上述一个或者多个实施例中的各个可选方案结合。如图3所示，图像数据的处理方法包括如下步骤。

在步骤S31中，获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集。

在步骤S32中，对第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各第一图像数据簇的第一核心特征向量。

在步骤S33中，获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量。

在步骤S34中，分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定第四图像数据集。

在步骤S35中，重新对第四图像数据集中的各图像数据进行分类，并根据重新标注的图像数据更新第三图像数据集；根据更新后的第三图像数据集更新深度学习预测模型，得到最终深度学习预测模型。

具体的，在确定第四图像数据集之后，可以对第四图像数据进行重新标注，例如，图像数据A的原标注标签为标签“0”，预测标签为标签“1”，通过上述各实施例确定该图像数据与训练数据集中标签为“1”的图像数据的相似度大于设定阈值，则需要将该图像数据的标注标签改为标签“1”。

进一步的，根据重新标注的图像数据更新第三图像数据集，并根据更新后的第三图像数据集更新深度学习预测模型，即将更新后的第三图像数据集输入至深度学习模型中进行训练，从而得到更新后的深度学习预测模型，并将该模型作为最终的深度学习预测模型。

本实施例的方案，在根据相似度确定第四图像数据集步骤之后，可以重新对第四图像数据集中的各图像数据进行分类，并根据重新标注的图像数据更新第三图像数据集；根据更新后的第三图像数据集更新深度学习预测模型，得到最终深度学习预测模型，可以快速地定位深度学习预测模型准确率下降的原因，进而提升模型的准确率。

为了使本领域技术人员更好地理解本实施例图像数据的处理方法，下面采用一个具体的图像识别领域的图像分类任务为示例进行说明，具体过程包括有：

训练阶段：

首先基于图像分类任务的原始训练数据(比如要识别“狗”，则需要收集很多“狗”和不是“狗”的图片)，使用resnet101或者Inception-v3等深度学习分类网络进行模型训练。对全部数据(收集来的全部图片)训练N次，直到损失函数(深度学习分类网络的常用损失函数，比如交叉熵损失)的值几乎不再下降，证明此时网络收敛，则分类模型训练完毕。假设得到深度学习分类模型M。

使用阶段：

1、收集错误数据。

将完成训练的深度学习分类模型M在标注人员标注的测试集合(测试模型效果的图片)上进行测试，将模型M预测label与标注label不一致的图片按照不一致性的置信度(模型会输出一个0-1之间的概率值)大小从大到小排序。比如同样是预测label＝1(模型判定是“狗”)，标注label＝0(标注人员标注该图片不是“狗”)，则label＝1的判定概率高的图片在前面。(模型以0.99的概率判定是狗的图片要在模型以0.88的概率判定是狗的图片的前面)

2、错误数据进行分组聚类。

将topN(N可以为任意的正数，例如10或者20等)的错误数据即上面获取到的经过排序后的不一致的图片输入到深度学习模型M中，提取全连接层(一般为模型M的倒数第二层)语义特征向量S(一般是1024维或者2048维的向量)，并按照各自预测的label进行分组(比如“狗”的分类任务，这时分两组，分别为label＝0和label＝1)。将各组内经过排序后的不一致的图片使用各图片提取到的语义特征向量S进行k-means聚类。假设每个组分成K个簇，则经过k-means聚类后会生成K个图片簇，此时选取图片簇中全部图片的语义特征向量S的均值作为图片簇的中心特征向量表示。

3、训练数据分组聚类。

同样提取全部训练数据的全连接层语义特征向量S并按照训练数据的label(同样比如“狗”的分类任务，这时分两组，分别为label＝0和label＝1)进行分组。将各组内数据同样按照各图片提取到的语义特征向量S进行k-means聚类。假设每个组分成A个簇，则经过k-means聚类后会生成A个图片簇且使用该簇中全部图片的语义特征向量S的均值作为图片簇的中心特征向量表示。

4、图片簇的相似性。

计算训练数据label＝k的图片簇与预测label＝k而标注label！＝k的错误数据形成的图片簇的相似度(使用余弦距离)，这里使用各图片簇的中心特征向量来计算。如果相似度大于特定阈值，则可以知道在训练集合中大量label＝k的数据在新的标注数据中被大量标注为label！＝k，因此可以判定标注规则发生了改变。为了避免个人标注的主观性而产生的标注错误，在生成各图片簇后必须删除掉包含图片数较少的图片簇(比如某个图片簇中的图片只有2、3张图片，则可以删除)，从而保证图片簇中的错误数据的产生是具备普遍性的。

5、错误数据重新标注。

基于上述方式，可以很好的发现某类型数据的标注规则发生变化，并定位到哪些图片的标注产生了歧义。则将定位到的歧义图片按照新的规则重新交给标注同学进行二次标注，基于新的标注数据进行再次训练和评测，可以很大程度上提升模型的测试性能。

当模型测试准确率与训练准确率相比出现大幅下降时，该方案可以用来判定是否是标注规则的改变导致的，快速定位模型性能下降的原因。

当判定为标注规则发生改变时，需要与需求方确认新的数据标注规则，并对原始数据中与现行规则不一致的数据通过上述图片簇获取到并进行再次标注，将标注后的数据重新添加到原始训练集训练模型，该模型将会比之前的模型在新的规则下有更好的性能。该技术方案可以认为是一种数据清洗的技术方案，帮助提升不断变化的系统的性能。

图4是根据一示例性实施例示出的一种图像数据的处理装置的框图，参照图4，该装置包括第一获取模块41，确定模块42第二获取模块43和计算模块44。

其中，第一获取模块41，被配置为获取第一图像数据集，对第一图像数据集进行筛选处理，得到第二图像数据集，

确定模块42，被配置为对第二图像数据集进行分类操作，得到多个第一图像数据簇的，并确定各第一图像数据簇的第一核心特征向量；

第二获取模块43，被配置为获取第三图像数据集，对第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各第二图像数据簇的第二核心特征向量

计算模块44，被配置为分别计算每个第一核心特征向量与每个第二核心特征向量的相似度，并根据相似度确定标注错误的第四图像数据集。

可选的，第一获取模块41，具体被配置为通过深度学习预测模型对第一图像数据集进行测试，得到多个预测结果；将各预测结果中预测标签与标注标签不一致的图像数据确定为目标图像数据；确定预测概率大于第一设定阈值的各目标图像数据为第二图像数据集。

可选的，确定模块42，具体被配置为对第二图像数据集进行分组操作，得到多个第二图像数据组；其中，每个第二图像数据组中包含的各图像数据的标签相同；将目标第二图像数据组输入至深度学习预测模型中，提取目标第二图像数据组中的各图像数据的语义特征向量；对各语义特征向量进行分类操作，得到多个第一图像数据簇；确定各第一图像数据簇的中心向量，作为各图像数据簇的第一核心特征向量。

可选的，第二获取模块43，具体被配置为对第三图像数据集进行分组操作，得到多个第三图像数据组；其中，每个第三图像数据组中包含的各图像数据的标签相同；将目标第三图像数据组输入至深度学习预测模型中，提取目标第三图像数据组中的各图像数据的语义特征向量；对各语义特征向量进行分类操作，得到多个第二图像数据簇；确定各第二图像数据簇的中心向量，作为各图像数据簇的第二核心特征向量。

可选的，计算模块44，具体被配置为分别计算每个第一核心特征向量与每个第二核心特征向量的之间的两两夹角，并根据夹角确定相似度。

可选的，计算模块44，包括：确定子模块，被配置为当目标相似度大于设定阈值时，确定与目标相似度对应的第二图像数据簇为第四图像数据集。

可选的图像数据的处理装置还包括：深度学习预测模型获取模块，被配置为获取对目标数据集进行标注而确定的标注集，标注集包括第三图像数据集和第一图像数据集；将第三图像数据集输入至深度学习训练模型中进行训练，得到深度学习预测模型。

可选的，图像数据的处理装置还包括：重新分类模块，被配置为重新对第四图像数据集中的各图像数据进行分类，并根据重新标注的图像数据更新第三图像数据集；根据更新后的第三图像数据集更新深度学习预测模型，得到最终深度学习预测模型。

可选的，图像数据的处理装置还包括：删除模块，被配置为若目标图像数据簇包含的图像数据的数量小于第二设定阈值，则删除目标图像数据簇。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图5是根据一示例性实施例示出的一种电子设备的结构框图。如图5所示，该电子设备包括处理器51；用于存储处理器51的可执行指令的存储器52，存储器52可以包括随机存取存储器(Random Access Memory，RAM)和只读存储器(Read-Only Memory，ROM)；其中，处理器51被配置为执行指令，以实现上述图像数据的处理方法。

在示例性实施例中，还提供了一种包括指令的存储介质，例如存储可执行指令的存储器52，上述指令可由电子设备(服务器或智能终端)的处理器51执行以完成上述图像数据的处理方法。

可选地，存储介质可以是非临时性计算机可读存储介质，例如，非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，当该计算机程序产品中的指令由电子设备(服务器或智能终端)的处理器执行时，实现上述图像数据的处理方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种图像数据的处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第一图像数据集进行筛选处理，得到第二图像数据集步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述第二图像数据集进行分类操作，得到多个第一图像数据簇，并确定各所述第一图像数据簇的第一核心特征向量步骤包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述第三图像数据集进行分类操作，得到多个第二图像数据簇，并确定各所述第二图像数据簇的第二核心特征向量步骤包括：

对所述第三图像数据集进行分组操作，得到多个第三图像数据组；其中，每个所述第三图像数据组中包含的各图像数据的标签相同；

5.根据权利要求3或4所述的方法，其特征在于，所述分别计算所述第一核心特征向量与所述第二核心特征向量的相似度步骤包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述相似度确定第四图像数据集步骤包括：

7.根据权利要求1所述的方法，其特征在于，在所述根据所述相似度确定第四图像数据集步骤之后，所述方法还包括：

8.一种图像数据的处理装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行命令的存储器；

其中，所述处理器被配置为执行所述命令，以实现如权利要求1至7中任一项所述的图像数据的处理方法。

10.一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至7中任一项所述的图像数据的处理方法。