CN112348107A

CN112348107A - 图像数据清洗方法及装置、电子设备和介质

Info

Publication number: CN112348107A
Application number: CN202011290397.4A
Authority: CN
Inventors: 薛学通; 任晖; 杨敏
Original assignee: Baidu China Co Ltd
Current assignee: Baidu China Co Ltd
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2021-02-09

Abstract

本公开提供一种图像数据清洗方法及装置、电子设备和介质，涉及人工智能技术领域，具体为深度学习和计算机视觉技术领域。所述图像数据清洗方法包括：提供一种图像数据清洗方法，包括：获取目标标签的至少一个标准图像；确定所述至少一个标准图像的聚类中心；提取多个待清洗图像中每一个待清洗图像的特征；基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及基于所确定的相似度值，从所述多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。

Description

图像数据清洗方法及装置、电子设备和介质

技术领域

本公开涉及人工智能技术领域，具体为深度学习和计算机视觉技术领域，特别涉及一种图像数据清洗方法及装置、电子设备和介质。

背景技术

神经网络是人工智能技术的核心。目前，神经网络得到了广泛的研究和关注，被应用在包括计算机视觉、语音识别、目标检测、自动驾驶等诸多人工智能应用领域中。

神经网络为了完成特定的任务，需要大量样本数据进行训练学习。相关技术中，通过人工对数据进行数据清洗，并对清洗后的数据进行标注分类以建立样本数据集。面对大规模数据的清洗和标记任务，单凭人力无法快速完成，影响了神经网络的应用。

在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

发明内容

根据本公开的一方面，提供一种图像数据清洗方法，包括：获取目标标签的至少一个标准图像；确定所述至少一个标准图像的聚类中心；提取多个待清洗图像中每一个待清洗图像的特征；基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及基于所确定的相似度值，从所述多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。

根据本公开的另一方面，还提供一种神经网络模型的训练方法，包括：利用上述的图像数据清洗方法获取目标标签的图像集，并标注所述图像集中所有图像的标签为所述目标标签；以及利用所述图像集对所述神经网络模型进行训练以使得所述神经网络模型学习所述目标标签相对应的图像特征。

根据本公开的另一方面，还提供一种图像数据清洗装置，包括：第一获取单元，被配置用于获取目标标签的至少一个标准图像；第一确定单元，被配置用于确定所述至少一个标准图像的聚类中心；提取单元，被配置用于提取多个待清洗图像中每一个待清洗图像的特征；第二确定单元，被配置用于基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及清洗单元，被配置用于基于所确定的相似度值，从多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。

根据本公开的另一方面，还提供一种电子设备，包括：处理器；以及存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行上述的方法。

根据本公开的另一方面，还提供一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行上述的方法。

本公开通过目标标签的标准图像确定聚类中心，并且基于聚类中心确定待清洗图像与标准图像的相似度，以及基于相似度对多个待清洗图像进行清洗以建立目标标签的图像集，从而能够实现自动清洗图像数据，快速完成图像集中所有图像的标签标注，减少人工干预，提升图像数据清洗效率和标记效率。

附图说明

附图示例性地示出了实施例并且构成说明书的一部分，与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的，并不限制权利要求的范围。在所有附图中，相同的附图标记指代类似但不一定相同的要素。

图1是示出根据示例性实施例的图像数据清洗方法的流程图；

图2是示出根据示例性实施例的神经网络模型的训练方法流程图；

图3是示出能够应用于示例性实施例的示例性电子设备的结构框图。

具体实施方式

在本公开中，除非另有说明，否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系，这种术语只是用于将一个元件与另一元件区分开。在一些示例中，第一要素和第二要素可以指向该要素的同一实例，而在某些情况下，基于上下文的描述，它们也可以指代不同实例。

在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的，而并非旨在进行限制。除非上下文另外明确地表明，如果不特意限定要素的数量，则该要素可以是一个也可以是多个。此外，本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。

相关技术中，通过人工对大量图像数据进行清洗和标记，以建立图像数据集。利用图像数据集对神经网络进行训练学习，以能够完成特征的任务，例如，分类任务。以分类任务为例，通过人工对大量图像数据进行清洗和标记，得到目标标签(例如，汽车、动物)的相关图像，从而建立目标标签的图像数据集。利用目标标签的图像数据集对神经网络进行训练学习，能够使得神经网络学习目标标签的图像特征。训练完成后，神经网络能够基于输入的图像，输出该输入图像的标签是否为目标标签。

但是，神经网络为了完成特定的任务，需要大量图像数据进行训练学习。因此，通过人工无法快速完成图像数据清洗和标记任务，影响了神经网络的应用。

为了解决上述技术问题，本公开提供一种图像数据清洗方法，通过目标标签的少量标准图像来确定聚类中心，由于同一目标标签图像的特征与聚类中心之间的距离均小于阈值，因此，基于聚类中心能够确定大量待清洗图像与标准图像的相似度。从而能够基于相似度对大量待清洗图像进行清洗以建立目标标签的图像集，实现自动清洗图像数据，并且快速完成图像集中所有图像的标签标注，减少人工干预，提升图像数据清洗效率和标记效率。

本公开的技术方案适用于任意标签的图像数据清洗，例如，硬币的图像数据清洗。硬币可细分为多种标签，例如，铜币、各种纪念币、外国硬币等。诸如硬币等标签的图像通过人工进行数据清洗和标记，需要具备专业知识才能完成，需要大量时间及人力，大大增加了成本，而通过利用本公开的技术方案能够显著降低数据清洗和标记的成本。

以下将结合附图对本公开的图像数据清洗方法进行进一步描述。

图1是示出根据本公开示例性实施例的图像数据清洗方法的流程图。如图1所示，图像数据清洗方法包括：步骤S101、获取目标标签的至少一个标准图像；步骤S102、确定所述至少一个标准图像的聚类中心；步骤S103、提取多个待清洗图像中每一个待清洗图像的特征；步骤S104、基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及步骤S105、基于所确定的相似度值，从所述多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。由此，通过目标标签的少量标准图像确定聚类中心，并且基于聚类中心确定大量待清洗图像与标准图像的相似度，以及基于相似度对大量待清洗图像进行清洗以建立目标标签的图像集，从而能够实现自动清洗图像数据，快速完成图像集中所有图像的标签标注，减少人工干预，提升图像数据清洗效率和标记效率。

目标标签取决于具体的应用场景，例如可以为硬币类型、汽车品牌、动物种类等等。

目标标签的标准图像例如可以通过摄像机直接拍摄目标标签的物品而得到。例如可以拍摄物品的各种形态(例如各种视图)、不同光线条件下的多个标准图像，从而能够更加准确得确定在不同场景下目标标签对应的图像特征，进而更加准确得确定目标标签的聚类中心。

所述至少一个标准图像的聚类中心即为目标标签的聚类中心，可以基于所述至少一个标准图像的图像特征而确定。给定一幅图像，只要其特征与目标标签的聚类中心之间的距离满足预设条件，即可确定该图像为目标标签图像。所述聚类中心可以通过一维向量或多维向量表示，在此不作限定。

根据一些实施例，步骤S102可以包括：将至少一个标准图像输入神经网络模型，获取该神经网络模型输出的至少一个标准图像中每一个标准图像的特征向量；以及基于至少一个标准图像的特征向量，确定聚类中心。由此，利用神经网络模型能够快速提取所有标准图像的特征向量以确定目标标签的聚类中心，进一步提升数据清洗效率。

所述神经网络模型的训练过程可以为：利用公开数据集中的样本图像对神经网络模型进行训练学习，以使得神经网络模型能够提取图像特征。所述训练过程具体可以为：将样本图像输入神经网络模型，输出所述样本图像的预测标签及其置信度，基于样本图像的真实标签及其置信度，以及预测标签及其置信度计算损失值，并基于损失值对神经网络模型进行调参。可以进行迭代，直至所述损失值小于设定的阈值或迭代次数达到设定的次数，神经网络模型训练完成。

可以利用上述训练完成的神经网络模型提取所述至少一个标准图像的特征向量。在这种情况下，可以将靠近输出侧的最后一个卷积层输出的特征图拉伸为一维特征向量，并基于所述至少一个标准图像的至少一个一维特征向量计算目标标签的聚类中心。例如，可以但不局限于计算所述至少一个一维特征向量中对应的向量值的平均值，得到聚类中心。

所述神经网络模型例如可以为卷积神经网络模型，例如，LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet、SSD、MobileNet等等。MobileNet具有更小的体积，更少的计算量，更快的速度，更高的精度。因此，MobileNet网络在轻量级神经网络中拥有优势，可适用于终端设备。

根据一些实施例，步骤S103可以利用步骤S102中用于提取标准图像的特征的上述神经网络模型，来提取多个待清洗图像中每一个待清洗图像的特征，从而能够快速提取多个待清洗图像的特征。

步骤S103提取的待清洗图像的特征可以与聚类中心的维数相同，从而便于计算两者之间的距离。例如，在聚类中心为一维向量的情况下，待清洗图像的特征也为一维特征向量的形式，具体的确定方法参见上述标准图像的一维特征向量的获取方法，在此不再详述。可以理解的是，待清洗图像的特征和聚类中心也可以为多维向量，只要两者的维数相同能够进行相似度计算即可，在此不作限定。

步骤S104可以通过计算步骤S102确定的聚类中心和步骤S103提取的待清洗图像的特征之间的距离(例如欧式距离或余弦距离)，来确定每一个待清洗图像与所述至少一个标准图像的相似度值。具体可以为：待清洗图像的特征与聚类中心之间的距离越近，则待清洗图像与所述至少一个标准图像的相似度越高，反之，则待清洗图像与所述至少一个标准图像的相似度越低。

根据一些实施例，步骤S105例如可以基于步骤S104所确定的相似度值从高到低的排序，选取排序靠前的若干个待清洗图像以形成所述目标标签的图像集。步骤S105例如也可以基于步骤S104所确定的相似度值，选取相应的相似度值不小于预设值的若干个待清洗图像以形成所述目标标签的图像集。

根据一些实施例，所述方法还可以包括：获取搜索引擎基于目标标签召回的多个候选图像。其中，多个待清洗图像可以为所述多个候选图像中的至少一部分。从而能够自动挖掘大量的待清洗图像，提升效率。可以选择任意搜索引擎(例如百度搜索引擎)来搜索目标标签的多个候选图像。

在示例性实施例中，可以按照预设规则从所述多个候选图像中获取所述至少一个标准图像，所述多个待清洗图像可以为所述一个或多个候选图像中除去所述至少一个标准图像以外的图像。从而能够自动挖掘目标标签的标准图像和待清洗图像，减少人工干预，提升数据清洗效率。

例如，在所述搜索引擎召回的多个候选图像按照与所述目标标签的相关度大小排列的情况下，任意相邻的两个候选图像中排序靠前的其中一个候选图像与所述目标标签的相关度大于另外一个候选图像与所述目标标签的相关度。相应地，可以选取所述多个候选图像中排序靠前的、预设数量的候选图像作为所述至少一个标准图像。由此，通过利用搜索引擎按照相关度进行排序的功能，将排序靠前的若干个候选图像作为目标标签的标准图像，从而能够保证自动挖掘的标准图像为目标标签图像。所述预设数量可以根据实际应用场景来设定，只要能够保证选取的标准图像为目标标签图像即可。

需要说明的是，在此仅是举例说明如何获取目标标签的标准图像，并不限定标准图像仅能为上述一种方式，例如，也可以获取用户上传的图像、或获取用户交互中产生的图像等方式来获取目标标签的候选图像，再通过人工选取目标标签的标准图像。

根据本公开的另一方面，还提供一种神经网络模型的训练方法，包括：利用上述的图像数据清洗方法获取目标标签的图像集，并标注所述图像集中所有图像的标签为所述目标标签；以及利用所述图像集对所述神经网络模型进行训练以使得所述神经网络模型学习所述目标标签相对应的图像特征。由此，通过自动清洗方法来获取目标标签的图像集以作为神经网络模型的训练数据集，能够为神经网络模型的训练学习提供数据基础，加快神经网络模型的快速训练迭代，有利于神经网络模型的推广应用。

根据一些实施例，可以利用得到的目标标签的图像集进一步训练上述用于提取标准图像特征的神经网络模型，以使得神经网络模型能够更好得学习目标标签的图像特征，得到适用于目标标签图像的特征提取模型。还可以确定属于同一类标签的多个目标标签(例如，硬币所包括的多个硬币类型标签、汽车所包括的多个汽车品牌标签)，利用本公开的技术方案获取多个目标标签各自对应的图像集，利用多个目标标签的图像集同时对上述神经网络模型进行训练，从而能够使得神经网络模型能够更好得学习该类标签的图像特征，得到适用于属于同一类标签的多个目标标签图像的特征提取模型。

本公开的技术方案适用于各种应用场景的神经网络模型的训练，例如分类、检索、推荐等。

下面将结合一个示例性实施例具体描述本公开中图像数据清洗的过程，具体如下：

确定属于同一类标签的多个目标标签；

以每一个目标标签为搜索词利用搜索引擎进行搜索，获取召回的、并且按照相关度从高到低排序的多个候选图像；

选取排序靠前的、预设数量(例如3个)的候选图像作为标准图像，并将剩余的候选图像作为该目标标签的多个待清洗图像；

利用卷积神经网络模型对预设数量的标准图像进行特征提取，得到标准图像的特征向量；

对预设数量的标准图像的特征向量进行加权平均，得到该目标标签的聚类中心；

利用所述卷积神经网络模型对多个待清洗图像进行特征提取，得到待清洗图像的特征向量；

基于该目标标签的聚类中心和相应的特征向量，确定多个待清洗图像各自与预设数量的标准图像之间的相似度；

基于所确定的相似度，选取相应的相似度大于阈值的若干个待清洗图像或者相似度最高的若干个待清洗图像以形成该目标标签的图像集；

利用上述方法获取属于同一类标签的多个目标标签各自的图像集。

可以利用属于同一类标签的多个图像集对上述卷积神经网络模型进一步进行迭代训练，直至卷积神经网络模型能够完成对测试图像的正确分类。

根据本公开的另一方面，如图2所示，还提供一种图像数据清洗装置200，可以包括：第一获取单元201，被配置用于获取目标标签的至少一个标准图像；第一确定单元202，被配置用于确定所述至少一个标准图像的聚类中心；提取单元203，被配置用于提取多个待清洗图像中每一个待清洗图像的特征；第二确定单元204，被配置用于基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及清洗单元205，被配置用于基于所确定的相似度值，从多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。由此，通过目标标签的少量标准图像确定聚类中心，并且基于聚类中心确定大量待清洗图像与标准图像的相似度，以及基于相似度对大量待清洗图像进行清洗以建立目标标签的图像集，从而能够实现自动清洗图像数据，快速完成图像集中所有图像的标签标注，减少人工干预，提升图像数据清洗效率和标记效率。

这里，图像数据清洗装置200的上述各单元201～205的操作分别与前面描述的步骤S101～S105的操作类似，在此不再赘述。

根据一些实施例，第一确定单元可以包括：神经网络模型，被配置用于接收所述至少一个标准图像并输出所述至少一个标准图像中每一个标准图像的特征向量；以及确定子单元，被配置为基于所述至少一个标准图像的特征向量，确定所述聚类中心。由此，利用神经网络模型能够快速提取所有标准图像的特征向量以确定目标标签的聚类中心，进一步提升数据清洗效率。

根据一些实施例，提取单元可被配置用于利用上述神经网络模型提取多个待清洗图像中每一个待清洗图像的特征，从而能够快速提取多个待清洗图像的特征。

待清洗图像的特征可以与聚类中心的维数相同，从而便于计算两者之间的距离。例如，在聚类中心为一维向量的情况下，待清洗图像的特征也为一维特征向量的形式，具体的确定方法参见上述标准图像的一维特征向量的获取方法，在此不再详述。可以理解的是，待清洗图像的特征和聚类中心也可以为多维向量，只要两者的维数相同能够进行相似度计算即可，在此不作限定。

可以通过计算聚类中心和待清洗图像的特征之间的距离(例如欧式距离或余弦距离)，来确定每一个待清洗图像与所述至少一个标准图像的相似度值。具体可以为：待清洗图像的特征与聚类中心之间的距离越近，则待清洗图像与所述至少一个标准图像的相似度越高，反之，则待清洗图像与所述至少一个标准图像的相似度越低。

根据一些实施例，例如可以基于所确定的相似度值从高到低的排序，选取排序靠前的若干个待清洗图像以形成所述目标标签的图像集。例如也可以基于所确定的相似度值，选取相应的相似度值不小于预设值的若干个待清洗图像以形成所述目标标签的图像集。

根据一些实施例，所述装置还可以还包括：第二获取单元，被配置用于获取搜索引擎基于所述目标标签召回的多个候选图像，其中，所述多个待清洗图像为所述多个候选图像中的至少一部分。从而能够自动挖掘大量的待清洗图像，提升效率。可以选择任意搜索引擎(例如百度搜索引擎)来搜索目标标签的多个候选图像。

在示例性实施例中，所述至少一个标准图像可以为按照预设规则从所述多个候选图像中获取，所述多个待清洗图像为所述一个或多个候选图像中除去所述至少一个标准图像以外的图像。从而能够自动挖掘目标标签的标准图像和待清洗图像，减少人工干预，提升数据清洗效率。

例如，在所述搜索引擎召回的多个候选图像按照与所述目标标签的相关度大小排列的情况下，任意相邻的两个候选图像中排序靠前的其中一个候选图像与所述目标标签的相关度大于另外一个候选图像与所述目标标签的相关度。相应地，所述至少一个标准图像可以为所述候选图像中排序靠前的、预设数量的候选图像。由此，通过利用搜索引擎按照相关度进行排序的功能，将排序靠前的若干个候选图像作为目标标签的标准图像，从而能够保证自动挖掘的标准图像为目标标签图像。所述预设数量可以根据实际应用场景来设定，只要能够保证选取的标准图像为目标标签图像即可。

根据本公开的另一方面，还提供一种电子设备，可以包括：处理器；以及存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据上述的方法。

根据本公开的另一方面，还提供一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行根据上述的方法。

如图3所示，是根据本公开实施例的执行图像数据清洗方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图3所示，该电子设备包括：一个或多个处理器301、存储器302，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图3中以一个处理器301为例。

存储器302即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的图像数据清洗方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的图像数据清洗方法。

存储器302作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的图像数据清洗方法对应的程序指令/模块(例如，附图2所示的第一获取单元201、第一确定单元202和提取单元203)。处理器301通过运行存储在存储器302中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的图像数据清洗方法。

存储器302可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据执行图像数据清洗方法的电子设备的使用所创建的数据等。此外，存储器302可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器302可选包括相对于处理器301远程设置的存储器，这些远程存储器可以通过网络连接至执行图像数据清洗方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

执行图像数据清洗方法的电子设备还可以包括：输入装置303和输出装置304。处理器301、存储器302、输入装置303和输出装置304可以通过总线或者其他方式连接，图3中以通过总线连接为例。

输入装置303可接收输入的数字或字符信息，以及产生与执行图像数据清洗方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置304可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是云服务器，或者是带人工智能技术的智能云计算服务器或智能云主机。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种图像数据清洗方法，包括：

获取目标标签的至少一个标准图像；

确定所述至少一个标准图像的聚类中心；

提取多个待清洗图像中每一个待清洗图像的特征；

基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及

基于所确定的相似度值，从所述多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。

2.如权利要求1所述的方法，还包括：

获取搜索引擎基于所述目标标签召回的多个候选图像，

其中，所述多个待清洗图像为所述多个候选图像中的至少一部分。

3.如权利要求2所述的方法，其中，按照预设规则从所述多个候选图像中获取所述至少一个标准图像，所述多个待清洗图像为所述一个或多个候选图像中除去所述至少一个标准图像以外的图像。

4.如权利要求3所述的方法，其中，所述搜索引擎召回的多个候选图像按照与所述目标标签的相关度大小排列，任意相邻的两个候选图像中排序靠前的其中一个候选图像与所述目标标签的相关度大于另外一个候选图像与所述目标标签的相关度，

其中，选取所述多个候选图像中排序靠前的、预设数量的候选图像作为所述至少一个标准图像。

5.如权利要求1-4中任一项所述的方法，其中，确定所述至少一个标准图像的聚类中心包括：

将所述至少一个标准图像输入神经网络模型，获取所述神经网络模型输出的所述至少一个标准图像中每一个标准图像的特征向量；以及

基于所述至少一个标准图像的特征向量，确定所述聚类中心。

6.如权利要求5所述的方法，其中，利用所述神经网络模型提取所述多个待清洗图像中每一个待清洗图像的特征。

7.如权利要求1-4中任一项所述的方法，其中，所述目标标签为硬币类型。

8.一种神经网络模型的训练方法，包括：

利用权利要求1-7中任一项所述的图像数据清洗方法获取目标标签的图像集，并标注所述图像集中所有图像的标签为所述目标标签；以及

利用所述图像集对所述神经网络模型进行训练以使得所述神经网络模型学习所述目标标签相对应的图像特征。

9.一种图像数据清洗装置，包括：

第一获取单元，被配置用于获取目标标签的至少一个标准图像；

第一确定单元，被配置用于确定所述至少一个标准图像的聚类中心；

提取单元，被配置用于提取多个待清洗图像中每一个待清洗图像的特征；

第二确定单元，被配置用于基于所述多个待清洗图像的特征和所述聚类中心，确定每一个待清洗图像与所述至少一个标准图像的相似度值；以及

清洗单元，被配置用于基于所确定的相似度值，从多个待清洗图像中选取若干个待清洗图像以形成所述目标标签的图像集。

10.如权利要求9所述的装置，还包括：

第二获取单元，被配置用于获取搜索引擎基于所述目标标签召回的多个候选图像，

11.如权利要求10所述的装置，其中，所述至少一个标准图像为按照预设规则从所述多个候选图像中所获取，所述多个待清洗图像为所述一个或多个候选图像中除去所述至少一个标准图像以外的图像。

12.如权利要求11所述的装置，其中，所述搜索引擎召回的多个候选图像按照与所述目标标签的相关度大小排列，任意相邻的两个候选图像中排序靠前的其中一个候选图像与所述目标标签的相关度大于另外一个候选图像与所述目标标签的相关度，

其中，所述至少一个标准图像为所述多个候选图像中排序靠前的、预设数量的候选图像。

13.如权利要求9-12中任一项所述的装置，其中，所述第一确定单元包括：

神经网络模型，被配置用于接收所述至少一个标准图像并输出所述至少一个标准图像中每一个标准图像的特征向量；以及

确定子单元，被配置为基于所述至少一个标准图像的特征向量，确定所述聚类中心。

14.如权利要求13所述的装置，其中，所述提取单元被配置用于利用所述神经网络模型提取所述多个待清洗图像中每一个待清洗图像的特征。

15.一种电子设备，包括：

处理器；以及

存储程序的存储器，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-8中任一项所述的方法。

16.一种存储程序的计算机可读存储介质，所述程序包括指令，所述指令在由电子设备的处理器执行时，致使所述电子设备执行根据权利要求1-8中任一项所述的方法。