CN115147670A

CN115147670A - 一种对象处理方法及装置

Info

Publication number: CN115147670A
Application number: CN202110276806.3A
Authority: CN
Inventors: 张新雨; 解元; 钟钊
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2021-03-15
Filing date: 2021-03-15
Publication date: 2022-10-04
Also published as: WO2022194049A1

Abstract

本申请涉及人工智能领域，公开了一种对象处理方法及装置。所述方法包括：将待处理对象输入至对象处理网络，经所述对象处理网络输出所述待处理对象的处理结果；其中，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，所述训练包括：获取所述含噪声样本集合中目标样本的推断标签；根据所述推断标签，修正所述目标样本的标签；利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。

Description

一种对象处理方法及装置

技术领域

本申请涉及人工智能技术领域，尤其涉及一种对象处理方法及装置。

背景技术

人工智能的发展离不开机器学习模型，而机器学习模型的训练依赖于样本数据的质量。在有监督学习中，样本数据中标注有标签信息，标签信息越准确，样本数据的质量越高。利用专家经验标注高质量的标签信息需要耗费较多的人力成本。为了降低成本，可以利用数据收集平台(如Amazon Mechanical Turk)或者网络爬虫等方式获取大量低成本的样本数据，这些样本数据中往往还有大量的噪声样本，噪声样本即包括错误的标签信息。

相关技术中，一些机器学习算法(如深度神经网络(DNN))拥有较强的非线性特征表征能力，可以学习样本数据集中的干净样本(即标签正确的样本)。具体来说，可以根据机器学习模型的损失函数分布，例如基于small-loss准则，筛选出样本数据中的噪声样本(即标签有误的样本)，并增大干净样本对模型训练的影响，降低或者消除噪声样本的影响。但是，基于损失函数分布的样本筛选方式需要基于干净样本和噪声样本的损失函数分布不同的原则，如呈现双峰分布。在实际筛选过程中，尤其在训练开始阶段，干净样本和噪声样本的损失值都较大，导致都不能很好地拟合上述如双峰分布等损失函数分布。如果按照上述方式进行样本筛选，可能导致大量样本被误判，如干净样本被误判为噪声样本，噪声样本有可能被误判为干净样本，影响到机器学习模型的性能。

因此，相关技术中亟需一种提升利用含噪声样本集训练机器学习模型的性能。

发明内容

本申请提供了一种对象处理方法，解决了相关技术中检测准确度不高的问题。本申请还提供了对应的装置、设备、计算机可读存储介质以及计算机程序产品。

第一方面，本申请的实施例提供了一种对象处理方法，该方法可以获取到所述含噪声样本集合中各个样本对应的真实标签，并利用所述真实标签修正各个样本的标签。基于上述的标签推断和修正机制，可以识别出含噪声样本集合中的噪声样本并改善所有样本的标签，提高利用含噪声样本集合训练所述对象处理网络的训练质量，提升所述对象处理网络的处理性能。另一方面，本申请实施例对于所述含噪声样本集合不做限制，使得利用含噪声样本集合训练网络的方式具有较强的泛化能力。

具体地，将待处理对象输入至对象处理网络，经所述对象处理网络输出所述待处理对象的处理结果；其中，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，所述训练包括：

获取所述含噪声样本集合中目标样本的推断标签；

根据所述推断标签，修正所述目标样本的标签；

利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。

可选的，在本申请的一个实施例中，所述获取所述含噪声样本集合中目标样本的推断标签，包括：

利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息；

根据所述特征信息确定所述目标样本的多个参考样本，所述目标样本与所述参考样本之间的特征相似度满足预设条件；

根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签。

本实施例中，利用特征相似度确定所述目标样本的多个参考样本，并利用所述特征相似度确定所述目标样本的推断标签。具体来说，特征相似度可以用于表示所述参考样本对于推断所述目标样本真实标签的重要程度，因此，利用特征相似度确定所述目标样本的参考样本以及推断标签，能够获取到比较准确的推断标签。

可选的，在本申请的一个实施例中，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。

本实施例中，可以同时根据所述目标样本的类内类间关系衡量其他样本对目标样本i真实标签的重要程度，准确性较高。

可选的，在本申请的一个实施例中，所述根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签，包括：

根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的标签概率分布，所述标签概率分布包括所述目标样本分别对应各个标签的概率，所述各个标签包括所述含噪声样本集合中的标签；

将所述标签概率分布中概率最大的标签作为所述目标样本的推断标签。

本实施例中，可以根据所述特征相似度，获取到所述目标样本在所有标签上的概率分布，即获取到所述目标样本的软化标签，能够获取到更加准确的所述目标样本的推断标签。

可选的，在本申请的一个实施例中，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。

本实施例中，可以利用所述含噪声样本集合同时训练多个对象处理分支网络，并将不同分支网络所确定的推断标签进行交换。该方式不仅可以克服网络分支在自我迭代过程中所产生的误差，还可以融合不同网络分支能够过滤不同噪声的优势。

可选的，在本申请的一个实施例中，所述根据所述推断标签，修正所述噪声样本的标签，包括：

利用所述对象处理网络确定所述目标样本的预测结果；

根据所述推断标签和所述预测结果修正所述目标样本的标签。

本实施例中，可以利用所述推断标签与所述对象处理网络的预测结果联合修正所述目标样本的标签，提升修正后的标签的准确性。

可选的，在本申请的一个实施例中，所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。

本实施例中，对所述目标样本进行增强，可以丰富样本数量，降低所述对象处理网络产生过拟合的可能性。

可选的，在本申请的一个实施例中，所述根据所述推断标签和所述预测结果修正所述目标样本的标签，包括：

将所述推断标签和所述预测结果的加权和作为所述目标样本修正后的标签，所述推断标签和所述预测结果的权重根据所述推断标签所对应的概率确定。

本实施例中，将所述推断标签与所述预测结果的加权和作为修正后的标签，并将所述推断标签的置信度作为所述推断标签的权重，可以进一步提升修正后标签的准确性。

可选的，在本申请的一个实施例中，所述利利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络，包括：

根据所述目标样本的原始标签与所述推断标签是否相同，确定所述目标样本为干净样本还是噪声样本；

基于修正后的标签，利用所述含噪声样本集合中的干净样本和/或噪声样本训练所述初始对象处理网络，得到所述对象处理网络。

本实施例中，可以利用干净样本和/或噪声样本等多种选择方式训练所述对象处理网络。

可选的，在本申请的一个实施例中，所述利用所述含噪声样本集合中的干净样本和噪声样本训练所述初始对象处理网络，得到所述对象处理网络，包括：

从所述干净样本和/或所述噪声样本中随机抽取样本与所述干净样本及其修正后的标签进行融合，获取融合后的样本；

利用所述融合后的样本训练所述初始对象处理网络，得到所述对象处理网络。

本实施例中，在利用干净样本和/或噪声样本训练所述对象处理网络的过程中，可以以所述干净样本作为基础，在所述干净样本上融合其他任何的样本，利用融合之后的样本训练对象处理网络，可以增强干净样本对网络的影响，同时发挥了所述噪声样本的价值。

第二方面，本申请的实施例提供了一种生成对象处理网络的方法，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，包括：

获取所述含噪声样本集合中目标样本的推断标签；

根据所述推断标签，修正所述目标样本的标签；

利用所述对象处理网络确定所述目标样本的预测结果；

可选的，在本申请的一个实施例中，所述利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络包括：

第三方面，本申请的实施例提供了一种对象处理装置，该装置包括：

对象处理网络，用于输出待处理对象的处理结果；所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本；

标签推断模块，用于获取所述含噪声样本集合中目标样本的推断标签；

标签修正模块，用于根据所述推断标签，修正所述目标样本的标签；修正标签后的所述目标样本被用于监督训练初始对象处理网络，得到所述对象处理网络。

可选的，在本申请的一个实施例中，所述标签推断模块，具体用于：

可选的，在本申请的一个实施例中，所述标签修正模块，具体用于：

利用所述对象处理网络确定所述目标样本的预测结果；

可选的，在本申请的一个实施例中，所述对象处理网络，具体用于：

第四方面，本申请的实施例提供了一种生成对象处理网络的装置，其特征在于，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，包括：

标签修正模块，用于根据所述推断标签，修正所述目标样本的标签；修正标签后的所述目标样本被用于监督训练所述对象处理网络，直至达到训练终止条件。

利用所述对象处理网络确定所述目标样本的预测结果；

第五方面，本申请的实施例提供了一种对象处理装置，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令时实现上述各方面任一项可能实现的方法。

第六方面，本申请的实施例提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述各方面任一项可能实现的方法。

第七方面，本申请的实施例提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备中运行时，所述电子设备中的处理器执行上述各方面任一项可能实现的方法

第八方面，本申请实施例提供一种芯片，该芯片包括至少一个处理器，该处理器用于运行存储器中存储的计算机程序或计算机指令，以执行上述各方面任一项可能实现的方法。

可选的，该芯片还可以包括存储器，该存储器用于存储计算机程序或计算机指令。

可选的，该芯片还可以包括通信接口，用于与芯片以外的其他模块进行通信。

可选的，一个或多个芯片可以构成芯片系统。

本申请的这些和其他方面在以下(多个)实施例的描述中会更加简明易懂。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本申请的示例性实施例、特征和方面，并且用于解释本申请的原理。

图1为相关技术中干净样本与噪声样本的损失值分布图；

图2为本申请实施例提供的一种对象处理装置100的模块结构示意图；

图3为本申请实施例提供的一种对象处理方法的流程示意图；

图4为本申请实施例提供的一种推断标签方法的流程示意图；

图5为本申请实施例提供的一种根据参考样本推断标签方法的流程示意图；

图6为本申请实施例提供的一种双分支网络训练的示意图；

图7为本申请实施例提供的一种处理设备的结构示意图。

具体实施方式

以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本申请，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本申请同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本申请的主旨。

相关技术中利用含噪声样本集训练机器学习模型的算法大多基于small-loss准则，主要包括损失调整和样本筛选两种算法。损失调整是指在构建模型训练的目标损失函数的过程中，赋予噪声样本较小的权重，干净样本较大的权重，从而降低噪声样本对模型训练的影响。样本选择指是指在训练过程中，利用干净样本更新网络参数，直接剔除噪声样本影响。基于small-loss的准则依赖于干净样本和噪声样本的损失函数分布不相同，如呈现图1所示的双峰分布。具体来说，可以采用贝塔混合模型(BMM)或者高斯混合模型(GMM)对样本的损失函数分布进行建模，并通过设定阈值来区分干净样本和噪声样本。

在一些特定的样本集下，如CIFAR-10loss，干净样本和噪声样本的损失函数明显遵循双峰分布，但并不是所有的样本集都遵循双峰分布，如WebVision等含噪声样本集的样本损失函数并不遵循双峰分布。因此，基于small-loss准则的训练方式具有较低的泛化能力。对于基于small-loss准则的训练方式，在一些训练阶段，尤其是在训练开始阶段，无论是干净样本还是噪声样本都不能被很好地拟合，导致所有样本的损失值都较大，导致很难用损失函数的分布区分干净样本和有噪样本。如果直接通过设定的一个阈值来区分的话，会导致大量样本被误判，即干净样本可能被判为噪声样本，噪声样本也有可能被判为干净样本，影响最终模型性能。

基于类似于上文的技术需求，本申请实施例提供了一种对象处理方法。该方法可以获取到所述含噪声样本集合中各个样本对应的真实标签，并利用所述真实标签修正各个样本的标签。基于上述的标签推断和修正机制，可以识别出含噪声样本集合中的噪声样本并改善所有样本的标签，提高利用含噪声样本集合训练所述对象处理网络的训练质量，提升所述对象处理网络的处理性能。另一方面，本申请实施例对于所述含噪声样本集合不做限制，使得利用含噪声样本集合训练网络的方式具有较强的泛化能力。

本申请实施例提供的对象处理方法可以应用于包括但不限于如图2所示的应用场景。如图2所示，该场景中包括对象处理装置100，对象处理装置100可以包括对象处理网络101、标签推断模块103和标签修正模块105。对象处理装置100可以设置于处理设备中，该处理设备具有中央处理器(Central Processing Unit，CPU)和/或图形处理器(GraphicsProcessing Unit，GPU)，用于对输入的待处理对象进行处理，从而获取处理结果。所述待处理对象包括图像、文字、语音等数据，对应的，处理的方式包括图像分类、语音识别、文本识别等任何基于有监督学习的机器学习模型处理业务。需要说明的是，所述处理设备可以是物理设备或物理设备集群，例如终端、服务器、或服务器集群。当然，所述处理设备也可以是虚拟化的云设备，例如云计算集群中的至少一个云计算设备。

在具体实现时，对象处理网络101可以基于含噪声样本集合训练得到，所述含噪声样本集合中可以包括至少一个标签有误的噪声样本，如图2所示的三个样本示例，其中，狗的图像被标注上狼的标签，因此，在所述含噪声样本集合中，狗的图像是噪声样本。对象处理网络101的训练需要依赖于标签推断模块103和标签修正模块105。在训练过程中，对象处理网络101可以分别提取所述含噪声样本集合中各个样本的特征信息，还可以根据所述特征信息确定各个样本的对象处理结果，例如各个对象在所有标签上的概率分布，此处，所有标签是指所述含噪声样本集合中所涉及到的所有标签，或者指预设的标签集合，该标签集合中至少包括所述含噪声样本集合中所涉及到的所有标签。标签推断模块103用于根据所述特征信息确定所述含噪声样本集合中各个样本的推断标签，并根据所述推断标签确定对应的样本是噪声样本还是干净样本。例如，确定出含噪声样本集合中的原始标签为狼的图像的推断标签为狗，则可以确定该图像为噪声样本，其他图像为干净样本。其中，所述原始标签为训练之前样本最原始的标签，该原始标签不被后续训练所影响。标签修正模块105可以用于根据样本的推断标签，修正样本的标签。在其中的一个实施例中，标签修正模块105具体根据所述推断标签以及对象处理网络101所确定的对象处理结果，修正样本的标签。修正标签后的样本被用于监督训练对象处理网络101的初始对象处理网络，经过多次迭代调整，得到对象处理网络101。

训练完成的对象处理网络101可以直接使用，例如，图2所示的对象处理网络101可以直接用于对图像进行分类，识别各个图像中对象的类型。

下面结合附图对本申请所述的对象处理方法进行详细的说明。虽然本申请提供了如下述实施例或附图所示的方法操作步骤，但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中，这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际中的对象处理过程中或者装置执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。

下面结合附图3具体说明对象处理网络101的训练方式，如图3所示，所述训练方式可以包括：

S301：获取所述含噪声样本集合中目标样本的推断标签。

本申请实施例中，可以利用所述含噪声样本集合中各个样本的特征信息，确定所述目标样本的推断标签。如上所述，对象处理网络101可以提取各个样本的特征信息，具体来说，如图4所示，确定所述目标样本的推断标签的方法可以包括：

S401：利用所述对象处理网络分别确定所述含噪声样本集合中各个样本的特征信息。

S403：根据所述特征信息确定所述目标样本的多个参考样本，所述目标样本与所述参考样本之间的特征相似度满足预设条件。

本申请实施例中的目标样本可以指所述含噪声样本集合中的任意一个样本。本申请实施例中，可以在所述含噪声样本集合中选取与所述目标样本之间的特征相似度满足预设条件的多个参考样本。所述预设条件可以包括所述目标样本与所述参考样本之间的相似度大于预设阈值，也可以包括所述目标样本和所述参考样本之间的相似度为所有相似度中最高的若干个。在本申请的一个实施例中，所述特征相似度可以根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。在一个具体的示例中，所述特征相似度可以利用下述表达式(1)计算得到：

其中，d(f_i,f_j)表示目标样本i和参考样本j之间的第一特征距离，所述特征距离即为两个样本的特征信息在特征空间中的距离，距离越小表示样本之间的相似度越高，d(f_i,f_cp)表示参考样本j与其标签对应的类中心c_p之间的第二特征距离，m和∈用于平衡所述第一特征距离与所述第二特征距离之间的关系。G_p表示所述含噪声样本集中原始标签都为p(也是参考样本j的标签)的样本，f_n表示第n个样本的特征信息。

基于上述表达式(1)和(2)，目标样本i与所述含噪声样本集D中其他样本j之间的特征相似度可以利用下述表达式(3)表示：

在本申请的一个实施例中，可以对上述特征相似度集合中的特征相似度进行排序，并将特征相似度最大的K个样本作为所述参考样本。在另一个实施例中，还可以将所述特征相似度大于预设阈值的样本作为所述参考样本。当然，还可以同时满足上述两个条件，本申请在此不做限制。

本申请实施例，所述特征相似度S可以用于表示参考样本j对目标样本i真实标签的重要程度。目标样本i和参考样本j之间的第一特征距离d(f_i,f_j)越小，表示参考样本j对推断目标样本i真实标签的过程影响越大，也就是利用到了目标样本i的类内关系。另一方面，如果参考样本j是噪声样本，则会对目标样本i的真实标签产生较大的噪声干扰，需要消除其影响。基于此，在参考样本j为噪声样本的情况下，d(f_i,f_cp)较大，可以显著降低特征相似度S，从而降低参考样本j对推断过程的影响，也就是利用到了目标样本i的类间关系。综上所述，可以同时根据目标样本i的类内类间关系衡量其他样本对目标样本i真实标签的重要程度，准确性较高。

当然，表达式(1)只是确定所述特征相似度的其中一种实施例，本申请对于构建所述特征相似度的方式不做限制。

S405：根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签。

本申请实施例中，所述参考样本与所述目标样本之间的特征相似度可以表示所述参考样本对推断所述目标样本真实标签的重要程度。基于此，可以利用所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签。

在实际应用场景下，所述多个参考样本分别对应于一个原始标签，例如，参考样本为图像，图像的类别标签是猫、狗、船、狼中的一种。所述目标样本与所述参考样本之间的特征相似度表达的是两个样本之间的相似程度，有可能发生目标样本同时与多个不同标签的参考样本之间的相似度都比较接近的情况。为了更加准确地推断所述目标样本的真实标签，可以根据所述目标样本与所述多个样本之间的特征相似度，确定所述目标样本的标签概率分布，所述标签概率分布包括所述目标样本分别对应各个标签的概率。在一个示例中，经过统计，含噪声样本集合中所涉及到的所有标签有{猫、狗、船、狼、花、熊、……}，那么，所述标签概率分布用于表达所述目标样本的标签分别为猫、狗、船、狼、花、熊等的可能性，例如，所述标签概率分布可以表示为{猫＝0.6、狗＝0.1、船＝0.02、狼＝0.05、花＝0.003、熊＝0.08、……}。所述标签概率分布可以更加准确地表达所述目标对象的真实标签。基于此，在本申请的一个实施例中，如图5所示，具体可以包括：

S501：根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本在所有标签上的概率分布。

在本申请的一个实施例中，首先，可以将所述多个参考样本按照标签的不同进行划分，并确定标签n对应的至少一个参考样本分别与所述目标样本i之间的特征相似度之和ρ_in：

ρ_in＝∑S(f_i，f_j)II{y_j＝n}，n＝1，2，...，C. (4)

其中，n表示标签n，C表示标签的类别总数，Ⅱ表示示例函数，Ⅱ{y_j＝n}表示在参考样本j的原始标签为n的情况下，y_j＝1；否则为0。

这样，可以得到一个特征相似度之和向量ρ_i：

ρ_i＝{ρ_i1，...，ρ_in，...，ρ_iC} (5)

由于概率值通常分布于0到1之间，因此，可以对特征相似度之和向量ρ_i进行归一化处理，具体可以包括下述表达式：

其中，

表示特征相似度之和向量ρ_i归一化后的结果，那么，

可以作为目标样本i在所有标签上的概率分布。

进一步地，在本申请的一个实施例中，为了增强每个标签对应的特征相似度之和中的重要信息，可以对ρ_i的归一化结果

进行锐化处理，具体地，在一个实施例中，可以包括：

其中，

表示对

锐化处理后的结果，T表示锐化温度系数，用于表示锐化的强度。

当然，在本申请的另一个实施例中，还可以将锐化处理后的结果

作为目标样本i在所有标签上的概率分布。在一个具体的示例中，对于图2中标签为狼的图像，

可以表示为{猫＝0.1，船＝0.06，狼＝0.6，狗＝0.7，老虎＝0.16，……}这种形式的概率分布。

S503：将所述概率分布中概率最大的标签作为所述目标样本的推断标签。

在获取到目标样本i在所有标签上的概率分布之后，那么，可以根据从所述概率分布中确定出最大概率值所对应的标签，并将该标签作为目标样本i的推断标签。具体的，所述推断标签可以表示为：

基于此，如果目标样本i的原始标签与所述推断标签不相同，则可以确定目标样本i为噪声样本；否则为干净样本。具体地，在一个示例中，判决结果可以表示为：

其中，示例函数Ⅱ的值为1表示目标样本i的原始标签y_i为干净样本，值为0表示目标样本i的原始标签y_i为噪声样本。

在一个具体的示例中，基于对于图2中标签为狼的图像的概率分布，可以确定所述概率分布中概率值最高的标签为狗，那么，可以确定该图像的推断标签为狗，与原始标签狼不相同，因此，可以确定该图像为噪声样本，其他图像均为干净样本。

S303：根据所述推断标签，修正所述目标样本的标签。

本申请实施例中，在确定出所述目标样本的推断标签之后，可以对所述目标样本的标签进行修正。在一个具体的实施例中，修正后的结果

可以包括所述目标样本在所有标签上的概率分布，例如可以表示为：

S305：利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络。

本申请实施例中，在对所述目标样本的标签修正之后，可以利用所述修正标签后的所述目标样本监督训练对象处理网络101的初始对象处理网络，得到对象处理网络101。需要说明的是，训练对象处理网络101包括对S301和S303多次迭代处理的过程，直至对象处理网络101达到收敛或者达到预设数量的迭代次数等训练终止条件。

本申请实施例中，对对象处理网络101的训练目的在于使得对象处理网络101能够处理得到更加准确的结果。因此，在不断训练的过程中，对象处理网络101的性能也在不断增强，基于此，可以将对象处理网络101的预测结果用于修正所述目标样本的标签。也就是说，可以利用所述目标样本的推断标签和所述预测结果联合修正所述目标样本的标签。在本申请的一个实施例中，可以将所述推断标签和所述预测结果的加权和作为所述目标样本修正后的标签，所述推断标签和所述预测结果的权重根据所述推断标签所对应的概率确定。在一个示例中，修正后的结果

可以表示为：

其中，ω_i表示目标样本i的推断标签

所对应的权重，也可称为置信度，可以为推断标签

所对应的概率值，即

p_i表示对象处理网络101对目标样本i的预测结果，预测结果对应的权重为(1-ω_i)。

本申请实施例中，利用目标样本i的推断标签和对象处理网络101的预测结果联合修正所述目标样本i的标签，能够提升修正后的标签的准确性。

为了降低对象处理网络101产生过拟合的可能性，可以对所述目标样本进行数据增强，获取到对所述目标样本数据增强后的多个样本，以丰富样本数量。对于图像而言，具体的数据增强的方式可以包括对图像的旋转、缩放、色彩调整、裁剪、替换背景等操作，本申请在此不做限制。然后，可以利用对象处理网络101分别获取到所述多个样本的预测结果，并根据所述多个样本的预测结果确定对象处理网络101对目标样本i的预测结果p_i。在一个具体的示例中，所述预测结果可以表示为：

其中，x_i,m表示目标样本i的第m个增强样本，M表示目标样本i的增强样本总数，θ表示对象处理网络101的参数，P(x_i,m,θ)表示对象处理网络101对x_i,m的预测结果。

在本申请实施例中，可以使用所述干净样本和/或所述噪声样本训练对象处理网络101训练。也就是说，可以单独使用所述干净样本训练对象处理网络101，也可以单独使用所述噪声样本训练对象处理网络101，当然，也可以使用所述干净样本和所述噪声样本训练对象处理网络101。在使用所述干净样本和所述噪声样本训练对象处理网络101的过程中，可以将所述干净样本和所述噪声样本作为训练集合训练对象处理网络101。在本申请的另一个实施例中，还可以增强所述干净样本对对象处理网络101的影响。具体来说，可以对所述干净样本进行数据增强，数据增强的方式可以包括：对于目标干净样本，可以从所述干净样本和/或所述噪声样本中选取一个样本与所述目标干净样本相融合。对于图像而言，融合的方式例如可以包括图像像素信息的叠加、修正后的标签的叠加等等。利用上述融合之后的样本训练对象处理网络，可以增强干净样本对网络的影响，同时发挥了所述噪声样本的价值。

在实际应用环境中，利用相同的机器学习模型训练同一批数据，可能产生具有两种不同性能的机器学习模型，且每个机器学习模型具有各自的优势。基于此，在本申请的一个实施例中，可以利用多个不同的对象处理分支网络分别对同一批含噪声样本集合进行处理，并获取到所述含噪声样本集合中的各个样本对应的推断标签。然后，各个对象处理分支网络可以将确定的各个样本的推断标签发送至其他对象处理分支网络中。

下面结合附图6说明上述实施例的方法，如图6所示，对象处理网络101和对象处理网络101’为两个不同的网络分支，但是基于相同的含噪声样本集合训练。为了使得两个不同的网络分支具有各自的性能优势，如可以过滤不同类型的噪声样本，可以分别设置对象处理网络101和对象处理网络101’不同的初始网络参数，或者，设置处理含噪声样本集合中样本的顺序不相同，使得对象处理网络101和对象处理网络101’具有不同的性能优势。具体来说，对象处理网络101和对象处理网络101’可以分别按照上述提供的确定目标样本的推断标签的方式确定各个样本的推断标签。如图6所示，对象处理网络101可以确定出所述含噪声样本集合中第一目标样本的第一特征信息，标签推断模块103可以据此第一特征信息确定第一目标样本的推断标签，另一个分支网络上，对象处理网络101’可以确定出所述含噪声样本集合中第二目标样本的第二特征信息，标签推断模块103可以据此第二特征信息确定第二目标样本的的推断标签。根据上述实施例的方法，对象处理网络101和对象处理网络101’可以将确定的目标样本的推断标签进行互换。这样，标签修正模块105对第二目标样本进行标签修正，另一方面，标签修正模块105’对第一目标样本进行标签修正。修正的方式可以参考上述表达式(11)和(12)，在此不再赘述。在本申请的一个实施例中，还可以在修正所述第一目标样本、所述第二目标样本的标签的过程中同时融入对象处理网络101和对象处理网络101’分别对所述第一目标样本、所述第二目标样本的预测结果。如图6所示，可以将对象处理网络101对第一目标样本的预测结果传递给标签修正网络105和标签修正网络105’，另一个网络分支上，将对象处理网络101’对第二目标样本的预测结果传递给标签修正网络105’和标签修正网络105。在一个示例中，表达式(11)中的p_i中可以包括两个网络的预测结果，可以包括：

其中，x_i表示第一/二目标样本i，θ表示对象处理网络101的参数，θ’表示对象处理网络101’的参数，P(x_i,θ)表示对象处理网络101对x_i的预测结果，P’(x_i,θ’)表示对象处理网络101’对x_i的预测结果。

在本申请的一个实施例中，还可以考虑到对目标样本的数据增强，因此，预测结果p_i还可以包括下述表达式：

其中，x_i,m表示第一/二目标样本i的第m个经过数据增强后的样本，M表示对第一/二目标样本i数据增强后的样本总数，θ表示对象处理网络101的参数，θ’表示对象处理网络101’的参数，P(x_i,m,θ)表示对象处理网络101对x_i,m的预测结果，P’(x_i,m,θ’)表示对象处理网络101’对x_i,m的预测结果。

需要说明的是，图6仅示出了有两个网络分支的情况，在其他实施例中，有三个或者更多的网络分支的情况下，在进行样本交换的过程中，可以遵循将网络分支的样本发送给其他网络分支，并从其他网络分支获取到样本即可。例如，对于具有三个网络的情况，网络1可以将样本发送给网络2，网络2可以将样本发送给网络3，网络3可以将样本发送给网络1。

在本申请实施例中，在同时训练得到多个对象处理分支网络的情况下，可以将所述待处理对象分别输入至所述多个对象处理分支网络，经所述多个对象处理分支网络分别输出对应的处理结果。然后，可以将多个所述处理结果的平均作为最终对所述待处理对象的处理结果。

上文中结合图1至图6，详细描述了本申请所提供的对象处理方法，下面将结合附图，描述根据本申请所提供的对象处理装置100和设备700。

参见图2所示的系统架构图中对象处理装置100的结构示意图，如图2所示，该装置100包括：

对象处理网络101，用于输出待处理对象的处理结果；所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本；

标签推断模块103，用于获取所述含噪声样本集合中目标样本的推断标签；

标签修正模块105，用于根据所述推断标签，修正所述目标样本的标签；修正标签后的所述目标样本被用于监督训练初始对象处理网络，得到所述对象处理网络。

利用所述对象处理网络确定所述目标样本的预测结果；

根据本申请实施例的对象处理装置100可对应于执行本申请实施例中描述的方法，并且对象处理装置100中的各个模块的上述和其它操作和/或功能分别为了实现图3、图4、图5中的各个方法的相应流程，为了简洁，在此不再赘述。

另外需说明的是，以上所描述的实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本申请提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。

本申请实施例还提供了一种设备700，用于实现上述图2所示的系统架构图中对象处理装置100的功能。其中，设备700可以是物理设备或物理设备集群，也可以是虚拟化的云设备，如云计算集群中的至少一个云计算设备。为了便于理解，本申请以设备700为独立的物理设备对该设备700的结构进行示例说明。

图7提供了一种设备700的结构示意图，如图7所示，设备700包括总线701、处理器702、通信接口703和存储器704。处理器702、存储器704和通信接口703之间通过总线701通信。总线701可以是外设部件互连标准(peripheral component interconnect，PCI)总线或扩展工业标准结构(extended industry standard architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口703用于与外部通信。例如，获取目标环境的图像和点云数据等等。

其中，处理器702可以为中央处理器(central processing unit，CPU)。存储器704可以包括易失性存储器(volatile memory)，例如随机存取存储器(random accessmemory，RAM)。存储器704还可以包括非易失性存储器(non-volatile memory)，例如只读存储器(read-only memory，ROM)，快闪存储器，HDD或SSD。

存储器704中存储有可执行代码，处理器702执行该可执行代码以执行前述对象处理方法。

具体地，在实现图2所示实施例的情况下，且图2实施例中所描述的对象处理装置100的各模块为通过软件实现的情况下，执行图2中的对象处理网络101、标签推断模块103、标签修正模块105功能所需的软件或程序代码存储在存储器704中。处理器702执行存储器704中存储的各模块对应的程序代码，如对象处理网络101、标签推断模块103、标签修正模块105对应的程序代码，以确定待处理对象的处理结果。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质包括指令，所述指令指示设备700执行上述应用于对象处理装置100的对象处理方法。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品被计算机执行时，所述计算机执行前述对象处理方法的任一方法。该计算机程序产品可以为一个软件安装包，在需要使用前述对象处理方法的任一方法的情况下，可以下载该计算机程序产品并在计算机上执行该计算机程序产品。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，训练设备，或者网络设备等)执行本申请各个实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、训练设备或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、训练设备或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的训练设备、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘(Solid State Disk，SSD))等。

这里所描述的计算机可读程序指令或代码可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(Instruction Set Architecture，ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(Local Area Network，LAN)或广域网(WideArea Network，WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(Field-ProgrammableGate Array，FPGA)或可编程逻辑阵列(Programmable Logic Array，PLA)，该电子电路可以执行计算机可读程序指令，从而实现本申请的各个方面。

这里参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本申请的多个实施例的装置、系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。

也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行相应的功能或动作的硬件(例如电路或ASIC(Application SpecificIntegrated Circuit，专用集成电路))来实现，或者可以用硬件和软件的组合，如固件等来实现。

尽管在此结合各实施例对本发明进行了描述，然而，在实施所要求保护的本发明过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其它变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其它单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

以上已经描述了本申请的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种对象处理方法，其特征在于，包括：

将待处理对象输入至对象处理网络，经所述对象处理网络输出所述待处理对象的处理结果；其中，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，所述训练包括：

获取所述含噪声样本集合中目标样本的推断标签；

根据所述推断标签，修正所述目标样本的标签；

2.根据权利要求1所述的方法，其特征在于，所述获取所述含噪声样本集合中目标样本的推断标签，包括：

3.根据权利要求2所述的方法，其特征在于，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。

4.根据权利要求2或3所述的方法，其特征在于，所述根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签，包括：

5.根据权利要求1所述的方法，其特征在于，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述根据所述推断标签，修正所述噪声样本的标签，包括：

利用所述对象处理网络确定所述目标样本的预测结果；

7.根据权利要求6所述的方法，其特征在于，所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。

8.根据权利要求6或7所述的方法，其特征在于，所述根据所述推断标签和所述预测结果修正所述目标样本的标签，包括：

9.根据权利要求1-8任一项所述的方法，其特征在于，所述利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络包括：

10.根据权利要求9所述的方法，其特征在于，所述利用所述含噪声样本集合中的干净样本和噪声样本训练所述初始对象处理网络，得到所述对象处理网络，包括：

11.一种生成对象处理网络的方法，其特征在于，所述对象处理网络利用含噪声样本集合训练得到，所述含噪声样本集合包括至少一个标签有误的噪声样本，包括：

获取所述含噪声样本集合中目标样本的推断标签；

根据所述推断标签，修正所述目标样本的标签；

12.根据权利要求11所述的方法，其特征在于，所述获取所述含噪声样本集合中目标样本的推断标签，包括：

13.根据权利要求12所述的方法，其特征在于，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。

14.根据权利要求12或13所述的方法，其特征在于，所述根据所述目标样本分别与所述多个参考样本之间的特征相似度，确定所述目标样本的推断标签，包括：

15.根据权利要求11所述的方法，其特征在于，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。

16.根据权利要求11-15任一项所述的方法，其特征在于，所述根据所述推断标签，修正所述噪声样本的标签，包括：

利用所述对象处理网络确定所述目标样本的预测结果；

17.根据权利要求16所述的方法，其特征在于，所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。

18.根据权利要求16或17所述的方法，其特征在于，所述根据所述推断标签和所述预测结果修正所述目标样本的标签，包括：

19.根据权利要求11-18任一项所述的方法，其特征在于，所述利用修正标签后的所述目标样本监督训练初始对象处理网络，得到所述对象处理网络包括：

20.根据权利要求19所述的方法，其特征在于，所述利用所述含噪声样本集合中的干净样本和噪声样本训练所述初始对象处理网络，得到所述对象处理网络，包括：

21.一种对象处理装置，其特征在于，包括：

22.根据权利要求21所述的装置，其特征在于，所述标签推断模块，具体用于：

23.根据权利要求22所述的装置，其特征在于，所述特征相似度根据所述目标样本与所述参考样本之间的第一特征距离以及所述参考样本与其标签对应的类中心之间的第二特征距离确定，且所述特征相似度与所述第一特征距离及所述第二特征距离负相关。

24.根据权利要求22或23所述的装置，其特征在于，所述标签推断模块，具体用于：

25.根据权利要求21所述的装置，其特征在于，所述目标样本的推断标签利用对象处理分支网络所确定，所述对象处理分支网络同样基于所述含噪声样本集合训练。

26.根据权利要求21-25任一项所述的装置，其特征在于，所述标签修正模块，具体用于：

利用所述对象处理网络确定所述目标样本的预测结果；

27.根据权利要求26所述的装置，其特征在于，所述预测结果包括对所述目标样本或者所述目标样本进行数据增强后的样本的预测结果。

28.根据权利要求26或27所述的装置，其特征在于，所述标签修正模块，具体用于：

29.根据权利要求21-28任一项所述的装置，其特征在于，所述对象处理网络，具体用于：

30.根据权利要求29所述的装置，其特征在于，所述对象处理网络，具体用于：

31.一种对象处理装置，其特征在于，包括：

处理器；和

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令时实现权利要求1-10或者权利要求11-20任意一项所述的方法。

32.一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1-10或者权利要求11-20中任意一项所述的方法。

33.一种计算机程序产品，其特征在于，包括计算机可读代码，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行上述权利要求1-10或者权利要求11-20中任意一项所述的方法。