CN114118449A

CN114118449A - 基于偏标记学习的模型训练方法

Info

Publication number: CN114118449A
Application number: CN202210106654.7A
Authority: CN
Inventors: 刘国清; 杨广; 王启程; 郑伟; 贺硕; 杨国武
Original assignee: Shenzhen Minieye Innovation Technology Co Ltd
Current assignee: Shenzhen Youjia Innovation Technology Co ltd
Priority date: 2022-01-28
Filing date: 2022-01-28
Publication date: 2022-03-01
Anticipated expiration: 2042-01-28
Also published as: CN114118449B

Abstract

本发明提供了一种基于偏标记学习的模型训练方法包括：利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值；根据损失值将训练集样本划分为干净样本和噪声样本；当训练集样本为干净样本时，将干净样本的原始标签进行保留；当训练集样本为噪声样本时，获取热启动阶段训练集样本的输出值；对训练集样本的输出值中对应相同标签的数值进行计算得到集成输出值；根据集成输出值从若干个不同的原始标签中为噪声样本选取多个候选标签；利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型。本发明还提供了一种基于偏标记学习的系统、计算机可读存储介质以及计算机设备。

Description

基于偏标记学习的模型训练方法

技术领域

本发明涉及机器学习领域，尤其涉及一种基于偏标记学习的模型训练方法、基于偏标记学习模型的识别方法、计算机可读存储介质以及计算机设备。

背景技术

传统的监督学习算法是从大量的训练样本中学习出一个模型用于预测新的未知样本的标签。训练数据所对应的标签质量对于学习效果至关重要。如果学习时使用的标签数据都是不准确的，那么不可能训练出有效的预测模型。同时，深度学习使用的神经网络往往结构复杂，为了得到良好的学习效果，对于带标签的训练数据的数量也有较高要求，即常被提到的大数据或海量数据。在实际应用场景中，给数据打标签这个工作在很多场景下需要人工实现，从而使得获得海量、高质量标签变得费时费力，而且由于分类任务本身具有的主观性，实际的训练样本一般含有噪声标签，即训练样本的真实标签并不是其训练给定的标签。其次，由于物力，时间的成本，导致获取大量带有准确标签的样本在经济上相对昂贵。

实际应用中，我们拿到的每一个带标签数据集都是包含噪声的。进一步，由于样本量很大，对于每一个带标签数据集，不可能人工逐个检查并校正标签。由于许多工作已经从理论和实验层面证明了标签噪声会对模型产生严重的负面影响。因此，机器学习问题必须面对噪音标签的影响。

因此，如何减少噪声标签对于模型泛化能力的影响，得到一种基于偏标记学习的模型训练方法是亟需解决的问题。

发明内容

本发明提供一种基于偏标记学习的模型训练方法、基于偏标记学习模型的识别方法、计算机可读存储介质以及计算机设备，少噪声标签对于模型泛化能力的影响，提升训练得到的模型的识别能力。

第一方面，本发明实施例提供一种基于偏标记学习的模型训练方法，基于偏标记学习的模型训练方法包括：

利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，输出值包括与若干个不同的原始标签一一对应的多个数值；

根据损失值将训练集样本划分为干净样本和噪声样本；

当训练集样本为干净样本时，将干净样本的原始标签进行保留；

当训练集样本为噪声样本时，获取热启动阶段训练集样本的输出值；

对训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值；

根据集成输出值从若干个不同的原始标签中为噪声样本选取多个候选标签；

利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，噪声样本只带有一个原始标签。

第二方面，本发明实施例提供一种基于偏标记学习的系统，该基于偏标记学习的系统包括：

训练集样本划分模块：利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，输出值包括与若干个不同的原始标签一一对应的多个数值；根据损失值将训练集样本划分为干净样本和噪声样本；

标签更新模块：当训练集样本为干净样本时，将干净样本的原始标签进行保留；当训练集样本为噪声样本时，获取热启动阶段训练集样本的输出值；对训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值；根据集成输出值从若干个不同的原始标签中为噪声样本选取多个候选标签；

目标模型训练模块：利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，噪声样本只带有一个原始标签。

第三方面，本发明实施例提供一种基于偏标记学习模型的识别方法，基于偏标记学习模型的识别方法，具体包括：

利用基于偏标记学习的模型训练方法得到目标模型；

将待识别图片输入目标模型获取识别结果。

第四方面，本发明实施例提供一种计算机可读存储介质，计算机可读存储介质上存储有能够被处理器加载并执行基于偏标记学习的模型训练方法的程序指令。

第五方面，本发明实施例提供一种计算机设备，计算机设备包括：

存储器，用于存储程序指令；以及

处理器，用于执行程序指令以使计算机设备实现基于偏标记学习的模型训练方法。

上述基于偏标记学习的模型训练方法，不直接进行噪声样本的标签纠正，而是首先为每个噪声样本分配多个候选标签，然后逐步识别出其中的真实标签。由于在直接的标签纠正中，需要考虑整个标签空间，即每个标签都可能成为真实标签，而在间接的标签纠正中只需要考虑一部分的候选标签即可，因此，标签纠正就更加的高效和集中，更能有效复原样本的真实标签。

基于偏标记学习的模型训练方法，充分利用现有噪声样本。当训练集中带有大量的噪声样本，如果将噪声样本识别出来后直接舍弃，不再将噪声样本用于模型训练，那么训练集样本的数量将会下降，影响目标模型的性能。因为在噪声样本中可能包含许多有价值的样本，直接丢弃噪声样本将降低模型的识别能力。因此，基于偏标记学习的模型训练方法通过标签纠正技术，修正噪声样本的标签继续用于模型训练，防止部分被错误识别的噪声样本影响模型的训练，同时，干净样本直接用于训练目标模型，提高目标模型整体的训练效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明第一实施例提供的基于偏标记学习的模型训练方法的流程图

图2为本发明第一实施例提供的基于偏标记学习的模型训练方法的第一子流程图。

图3为本发明第二实施例提供的基于偏标记学习的模型训练方法的子流程图。

图4为本发明第三实施例提供的基于偏标记学习的模型训练方法的子流程图。

图5为本发明第一实施例提供的基于偏标记学习模型的识别方法的流程图。

图6为本发明第一实施例提供的基于偏标记学习的模型内部结构示意图。

图7为本发明第一实施例提供的计算机设备内部结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

基于偏标记学习的模型训练方法可以针对现有的多种类型的标签噪声进行标签纠正，提高训练集的可用性。

通常地，标签噪声分为以下三类。

第一种：随机标签噪声：其假设噪声标签的生成过程时完全随机的，与真实标签和样本本身均无关。比如，在大型的标注场景中，一些标注员可能会对数据进行胡乱标注，从而得到一些随机的错误标签。针对这类标签噪声，许多工作关注常用损失函数对其固有的鲁棒性，或者是设计出进新的对其具有鲁棒性的损失函数。在二分类的条件下，损失函数对于随机标签噪声的鲁棒性的充分条件为对称条件，而对于多类分类问题，其充要条件为训练数据噪声率小于1-1/C，其中C为类别数。该类型的噪声虽然有完整的理论支持，但是在现实应用中较难满足。

第二种：类别标签噪声：其假设噪声标签与潜在的真实标签有关，而与样本本身无关。此类标签噪声相对于第一种则更加符合现实应用的情况。比如，在图片标注中，一张狗的图片更可能被错误标注为猫而不是鲨鱼。针对类别标签噪声，现有工作一般集中于噪声转移矩阵，其代表不同类别间的转移概率。只要我们能够知道噪声转移矩阵，则能够利用无偏估计来设计出风险一致性的算法。但是噪声转移矩阵在现实应用中是较难被准备估计出来的。

第三种：样本标签噪声：其假设标签噪声的产生与每个样本本身相关。此类噪声更加符合现实应用，但是一般难以建模，现有工作一般对此噪声分布都有严格的限制。

请结合参看图1，其为本发明第一实施例提供的基于偏标记学习的模型训练方法的流程图。其中,本发明第一实施例提供的基于偏标记学习的模型训练方法具体包括下面步骤。

步骤S101，利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，输出值包括与若干个不同的原始标签一一对应的多个数值。在本实施例中，原始标签用数值表示例如，1、2、3……10。原始模型为Resnet-32。其中热启动阶段一般为10-30个训练周期，固定学习率进行初始的训练。训练集为带有标签的CIFAR-10。CIFAR-10共有60000张彩色图像，这些图像是32*32，分为10个类，分别是飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车，这10类都是各自独立的，不会出现重叠。其中，1代表飞机，2代表汽车……以此类推。在本实施例中，损失函数选择交叉熵损失函数，根据损失值的大小进行排序，前20%最小的样本视作干净样本，而后（1- 20%）的样本视作噪声样本。该原理基于神经网络的逐步学习模型，即网络首选学习简单的模式，拟合干净的样本，然后再逐渐强行拟合噪声样本产生过拟合。因此，在网络训练的初期，损失小的样本更加可能是干净样本。该步骤也可选用不用的样本选择准则，比如基于熵的方法等。

步骤S102，根据损失值将训练集样本划分为干净样本和噪声样本。在本实施例中，干净样本直接用于目标模型训练。具体请参照步骤S1021-步骤S1025。

步骤S103，当训练集样本为干净样本时，将干净样本的原始标签进行保留。具体地，原始标签为1的飞机转化为（1000000000）的one hot向量，原始标签为2为汽车（0100000000）的one hot向量。

步骤S104，当训练集样本为噪声样本时，获取热启动阶段训练集样本的输出值。

步骤S105，对训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值。

步骤S106，根据集成输出值从若干个不同的原始标签中为噪声样本选取多个候选标签。具体地，训练集样本候选标签中包括飞机、汽车以及鸟。则该训练样本集的候选标签向量为（1110000000）的one hot向量。

步骤S107，利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，噪声样本只带有一个原始标签。

请结合参看图2，其为本发明第一实施例提供的步骤S102的子步骤流程图。步骤S102，根据损失值将训练集样本划分为干净样本和噪声样本，具体包括下面步骤。

步骤S1021，根据损失值对训练集样本进行排序得到排序训练集样本。

步骤S1022，获取干净样本的取样范围。

步骤S1023，判断训练集样本是否在取样范围内。

步骤S1024，当训练集样本在取样范围中时，将训练集样本划分为干净样本。

步骤S1025，当训练集样本不在取样范围中时，将训练集样本划分为噪声样本。

请结合参看图3，其为本发明第二实施例提供的基于偏标记学习的模型训练方法。第二实施例提供的基于偏标记学习的模型训练方法与第一实施例提供的基于偏标记学习的模型训练方法的差异在于在利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型之前，还包括，每一个噪声样本的多个候选标签在训练过程中根据每一次训练的输出值进行更新，第二实施例提供的基于偏标记学习的模型训练方法，具体下面步骤。

步骤S301，获取热启动阶段之后模型训练过程中噪声样本的输出值。

步骤S302，根据噪声样本的多个候选标签对噪声样本的输出值进行归一化处理。

步骤S303，当经过归一化处理的输出值中某一个值达到预设标准时，根据达到预设标准的值更新多个候选标签至只剩下一个原始标签作为候选标签。

请结合参看图4，其为本发明第三实施例提供的基于偏标记学习的模型训练方法。第三实施例提供的基于偏标记学习的模型训练方法与第一实施例提供的基于偏标记学习的模型训练方法的差异在于在利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值之前，第三实施例提供的基于偏标记学习的模型训练方法还包括下面步骤。

步骤S601，将原始图片进行随机旋转生成第一数据增强图片。在本实施例中，将原始训练集中样本进行随机地翻转不同的角度（30,60,90，120,150）生成新的数据增强图片。

步骤S602，将原始图片进行随机裁剪一部分生成第二数据增强图片。在本实施例中，将原始训练集中样本随机地裁剪一部分生成新的数据增强图片。

步骤S603，将第一数据增强图片和第二数据增强图片组成训练集。其中，针对本发明所涉及的标签噪声学习任务，采用了随机翻转和裁剪。可用的数据增强方式包括几何变换类，颜色变换类等。几何变换类即对原始图片进行几何变换，包括翻转，旋转，裁剪，变形，缩放等操作。翻转和旋转操作一般适用于对方向不敏感的任务，不会改变图片的大小，而裁剪会改变图片的大小。除了缩放变形外，其他操作都是不失真的。

请结合参看图5，其为本发明第一实施例提供的基于偏标记学习模型的识别方法的流程图。其中,本发明第一实施例提供的基于偏标记学习模型的识别方法具体包括下面步骤。

步骤S701，利用基于偏标记学习的模型训练方法得到目标模型。

步骤S702，将待识别图片输入目标模型获取识别结果。

上述基于偏标记学习模型的识别方法，不直接进行噪声样本的标签纠正，而是首先为每个噪声样本分配多个候选标签，然后逐步识别出其中的真实标签。由于在直接的标签纠正中，需要考虑整个标签空间，即每个标签都可能成为真实标签，而在间接的标签纠正中只需要考虑一部分的候选标签即可，因此，标签纠正就更加的高效和集中，更能有效复原样本的真实标签。偏标记学习模型的识别方法通过标签纠正技术，修正噪声样本的标签继续用于模型训练，防止部分被错误识别的噪声样本影响模型的训练，同时，干净样本直接用于训练目标模型，提高目标模型整体的训练效果。

本发明还提供了一种基于偏标记学习的系统400，请结合参看图6，基于偏标记学习的系统400包括，训练集样本划分模块401、标签更新模块402和目标模型训练模块403。

训练集样本划分模块401：利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，输出值包括与若干个不同的原始标签一一对应的多个数值；根据损失值将训练集样本划分为干净样本和噪声样本。

标签更新模块402：当训练集样本为干净样本时，将干净样本的原始标签进行保留；当训练集样本为噪声样本时，获取热启动阶段训练集样本的输出值；对训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值；根据集成输出值从若干个不同的原始标签中为噪声样本选取多个候选标签。

目标模型训练模块403：利用干净样本和噪声样本对热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，噪声样本只带有一个原始标签。

本发明还提供了一种计算机可读存储介质。计算机可读存储介质上存储有能够被处理器加载并执行的上述的基于偏标记学习的模型训练方法的程序指令。由于计算机可读存储介质采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再赘述。

本发明还提供一种计算机设备900，计算机设备900至少包括，存储器901和处理器902。存储器901用于存储基于偏标记学习的模型训练方法的程序指令。处理器902，用于执行程序指令以使计算机设备实现上述的基于偏标记学习的模型训练方法。请结合参看图7，其为本发明第一实施例提供的计算机设备900的内部结构示意图。

其中，存储器901至少包括一种类型的计算机可读存储介质，该计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器（例如，SD或DX存储器等）、磁性存储器、磁盘、光盘等。存储器901在一些实施例中可以是计算机设备900的内部存储单元，例如计算机设备900的硬盘。存储器901在另一些实施例中也可以是计算机设备900的外部存储设备，例如计算机设备900上配备的插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字卡（Secure Digital, SD），闪存卡（Flash Card）等。进一步地，存储器901还可以既包括计算机设备900的内部存储单元也包括外部存储设备。存储器901不仅可以用于存储安装于计算机设备900的应用软件及各类数据，例如基于偏标记学习的模型训练方法的程序指令等，还可以用于暂时地存储已经输出或者将要输出的数据，例如基于偏标记学习的模型训练方法执行产生的数据等。

处理器902在一些实施例中可以是中央处理器（Central Processing Unit,CPU）、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器901中存储的程序指令或处理数据。具体地，处理器902执行基于偏标记学习的模型训练方法的程序指令以控制计算机设备900实现基于偏标记学习的模型训练方法。

进一步地，计算机设备900还可以包括总线903可以是外设部件互连标准总线(peripheral component interconnect，简称PCI)或扩展工业标准结构总线(extendedindustry standard architecture，简称EISA)等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

进一步地，计算机设备900还可以包括显示组件904。显示组件904可以是LED（Light Emitting Diode，发光二极管）显示器、液晶显示器、触控式液晶显示器以及OLED（Organic Light-Emitting Diode，有机发光二极管）触摸器等。其中，显示组件904也可以适当的称为显示装置或显示单元，用于显示在计算机设备900中处理的信息以及用于显示可视化的用户界面。

进一步地，计算机设备900还可以包括通信组件905，通信组件905可选的可以包括有线通信组件和/或无线通信组件（如WI-FI通信组件、蓝牙通信组件等），通常用于在计算机设备900与其他计算机设备之间建立通信连接。

图7仅示出了具有组件901-905以及实现基于偏标记学习的模型训练方法的程序指令的计算机设备900，本领域技术人员可以理解的是，图7示出的结构并不构成对计算机设备900的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。由于计算机设备900采用了上述所有实施例的全部技术方案，因此至少具有上述实施例的技术方案所带来的所有有益效果，在此不再赘述。

该基于偏标记学习的模型训练方法包括一个或多个程序指令。在设备上加载和执行该程序指令时，全部或部分地产生按照本发明实施例的流程或功能。该设备可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该程序指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，该程序指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考上述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的基于偏标记学习的模型训练方法实施例仅仅是示意性的，例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

该作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的计算机可读存储介质包括：U盘、流动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序指令的介质。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

以上所列举的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属于本发明所涵盖的范围。

Claims

1.一种基于偏标记学习的模型训练方法，其特征在于，所述基于偏标记学习的模型训练方法包括：

利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，所述训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，所述输出值包括与若干个不同的原始标签一一对应的多个数值；

根据所述损失值将所述训练集样本划分为干净样本和噪声样本；

当所述训练集样本为所述干净样本时，将所述干净样本的原始标签进行保留；

当所述训练集样本为所述噪声样本时，获取热启动阶段所述训练集样本的输出值；

对所述训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值；

根据所述集成输出值从若干个不同的原始标签中为所述噪声样本选取多个候选标签；

利用所述干净样本和所述噪声样本对所述热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，所述噪声样本只带有一个原始标签。

2.如权利要求1所述的基于偏标记学习的模型训练方法，其特征在于，根据所述损失值将所述训练集样本划分为干净样本和噪声样本，具体包括：

根据所述损失值对所述训练集样本进行排序得到排序训练集样本；

获取所述干净样本的取样范围；

判断所述训练集样本是否在所述取样范围内；

当所述训练集样本在所述取样范围内时，将所述训练集样本划分为所述干净样本；或者

当所述训练集样本不在所述取样范围内时，将所述训练集样本划分为所述噪声样本。

3.如权利要求1所述的基于偏标记学习的模型训练方法，其特征在于，在利用所述干净样本和所述噪声样本对所述热启动阶段之后模型进行训练得到目标模型之前，还包括，每一个噪声样本的多个候选标签在训练过程中根据每一次训练的输出值进行更新，具体包括：

获取热启动阶段之后模型训练过程中所述噪声样本的输出值；

根据所述噪声样本的多个候选标签对所述噪声样本的输出值进行归一化处理；以及

当经过归一化处理的输出值中某一个值达到预设标准时，根据达到预设标准的值更新多个候选标签至只剩下一个原始标签作为候选标签。

4.如权利要求1所述的基于偏标记学习的模型训练方法，其特征在于，所述干净样本直接用于所述目标模型的训练。

5.如权利要求1所述的基于偏标记学习的模型训练方法，其特征在于，所述原始模型为Resnet-32。

6.如权利要求1所述的基于偏标记学习的模型训练方法，其特征在于，在利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值之前，还包括：

将原始图片进行随机旋转生成第一数据增强图片；

将所述原始图片进行随机裁剪一部分生成第二数据增强图片；以及

将所述第一数据增强图片和所述第二数据增强图片组成所述训练集。

7.一种基于偏标记学习的系统，其特征在于，所述基于偏标记学习的系统包括：

训练集样本划分模块：利用训练集对原始模型进行训练，在热启动阶段，记录每一个训练集样本的输出值和损失值，所述训练集样本带有若干个不同的原始标签，一个训练集样本带有一个原始标签，所述输出值包括与若干个不同的原始标签一一对应的多个数值；根据所述损失值将所述训练集样本划分为干净样本和噪声样本；

标签更新模块：当所述训练集样本为所述干净样本时，将所述干净样本的原始标签进行保留；当所述训练集样本为所述噪声样本时，获取热启动阶段所述训练集样本的输出值；对所述训练集样本的输出值中对应相同原始标签的数值进行相加得到集成输出值；根据所述集成输出值从若干个不同的原始标签中为所述噪声样本选取多个候选标签；

目标模型训练模块：利用所述干净样本和所述噪声样本对所述热启动阶段之后模型进行训练得到目标模型，其中，在得到目标模型时，所述噪声样本只带有一个原始标签。

8.一种基于偏标记学习模型的识别方法，其特征在于，所述基于偏标记学习模型的识别方法，具体包括：

利用如权利要求1~6中任一项基于偏标记学习的模型训练方法得到目标模型；

将待识别图片输入所述目标模型获取识别结果。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有能够被处理器加载并执行的如权利要求1~6任意一项所述的基于偏标记学习的模型训练方法的程序指令。

10.一种计算机设备，其特征在于，所述计算机设备包括：

存储器，用于存储程序指令；以及

处理器，用于执行所述程序指令以使所述计算机设备实现如权利要求1~6任意一项所述的基于偏标记学习的模型训练方法。