CN112561080A

CN112561080A - 样本筛选方法、样本筛选装置及终端设备

Info

Publication number: CN112561080A
Application number: CN202011506081.4A
Authority: CN
Inventors: 尹康
Original assignee: Oppo Chongqing Intelligent Technology Co Ltd
Current assignee: Oppo Chongqing Intelligent Technology Co Ltd
Priority date: 2020-12-18
Filing date: 2020-12-18
Publication date: 2021-03-26
Anticipated expiration: 2040-12-18
Also published as: CN112561080B

Abstract

本申请提供的一种样本筛选方法，包括：基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本。通过上述方法，可以提升提升训练数据集的质量。

Description

样本筛选方法、样本筛选装置及终端设备

技术领域

本申请属于样本处理技术领域，尤其涉及样本筛选方法、样本筛选装置、终端设备及计算机可读存储介质。

背景技术

目前，各类机器学习模型大量应用于对图像、视频的分类、检测等场景中。在实际应用场景中，对于给定任务(如视频分类)，开发者需要收集足够数量的训练数据集，并通过训练数据集对指定的机器学习模型(如视频分类模型)进行训练，从而使得该指定的机器学习模型对于给定任务获得较好的性能表现。可见，训练数据集的质量是决定机器学习模型实际表现的关键因素之一。

其中，为了保证模型训练的准确性，往往需要采集大量的训练样本并进行标注，而由于训练样本的采集、标注工作十分繁琐，常常会导致所得到的训练数据集中存在一些标注错误的样本，从而导致训练数据集的质量下降，限制了训练得到的模型性能的进一步提高。

发明内容

本申请实施例提供了样本筛选方法、样本筛选装置、终端设备及计算机可读存储介质，可以提升训练数据集的质量。

第一方面，本申请实施例提供了一种样本筛选方法，包括：

基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；

在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；

根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本。

第二方面，本申请实施例提供了一种样本筛选装置，包括：

训练模块，用于基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；

获取模块，用于在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；

确定模块，用于根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本。

第三方面，本申请实施例提供了一种终端设备，包括存储器、处理器、显示器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，其特征在于，上述处理器执行上述计算机程序时实现如第一方面上述的样本筛选方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序被处理器执行时实现如第一方面上述的样本筛选方法。

第五方面，本申请实施例提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行上述第一方面中上述的样本筛选方法。

本申请实施例与现有技术相比存在的有益效果是：本申请实施例中，可以基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；此时，在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能呈现不同的变化趋势。在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；再根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本；此时，可以根据各个训练样本所分别对应的目标损失函数值，识别标签正确或者标签错误等不同状态的训练样本，以从各个所述训练样本中筛选出处于期望状态的目标样本，从而从训练数据集中去除诸如标签错误的训练样本，而获得质量更高的训练数据集。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的一种样本筛选方法的流程示意图；

图2是本申请一实施例提供的学习速率随迭代次数的变化而变化的一种示例性示意图；

图3是本申请一实施例提供的数据处理的一种示例性处理流程图；

图4是本申请一实施例提供的一种样本筛选装置的结构示意图；

图5是本申请一实施例提供的终端设备的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

本申请实施例提供的样本筛选方法可以应用于服务器、台式电脑、手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality，AR)/虚拟现实(virtualreality，VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、个人数字助理(personal digital assistant，PDA)等终端设备上，本申请实施例对终端设备的具体类型不作任何限制。

在实际应用场景中，对于给定任务(如图像分类或者视频分类等)，开发者需要收集足够数量的训练数据集，并通过训练数据集对指定的机器学习模型(如图像分类模型或者视频分类模型等)进行训练，从而使得该指定的机器学习模型对于给定任务获得较好的性能表现。可见，训练数据集的质量是决定机器学习模型实际表现的关键因素之一。

其中，为了保证模型训练的准确性，往往需要采集大量的训练样本并进行标注，而由于训练样本的采集、标注工作十分繁琐，常常会导致所得到的训练数据集中存在一些标注错误的样本，从而导致训练数据集的质量下降。

其中，标注错误的样本也可以称为所述训练数据集中的噪声样本。而对于噪声样本，若通过人工对大规模的训练数据集进行数据清洗，需要耗费大量的时间成本和人力成本，因此往往无法实际执行。可见，目前的训练数据集难以在保证数据集规模的同时维持较高的质量，从而限制了训练得到的模型性能的进一步提高，以及对该训练数据集的其他应用。

而通过本申请实施例，在基于训练数据集，对第一分类模型进行训练时，可以使得对所述第一分类模型进行训练的训练过程包括至少两个训练周期，并且每个训练周期中，学习速率随迭代次数的变化而变化，以使得在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能会随着学习速率的变化而呈现不同的变化趋势，从而可以根据各个训练样本所分别对应的目标损失函数值，识别不同状态的训练样本，以从各个所述训练样本中筛选出处于期望状态的目标样本，从而从训练数据集中去除诸如标签错误的训练样本，获得质量更高的训练数据集。

具体地，图1示出了本申请实施例提供的一种样本筛选方法的流程图，该样本筛选方法可以应用于终端设备。

如图1所示，该样本筛选方法可以包括：

步骤S101，基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期。

本申请实施例中，所述第一分类模型可以为能够对图像、视频或者文本等类型的信息进行分类的模型。示例性的，所述第一分类模型可以为卷积神经网络(ConvolutionalNeural Networks，CNN)模型等机器学习模型。所述第一分类模型的结构在此不作限制。

各个所述训练样本所分别对应的标签的具体获取方式可以有多种，在此不作限定。示例性的，所述标签可以包括内容标识以及视频编号等信息。所述标签可以是预先通过人工标注得到的，也可以是通过诸如关键词提取或者其他信息提取算法而得到的。示例性的，所述训练样本可以为文本、图像或者视频等等，所述训练样本的类型在此不作限制。

本申请实施例中，在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能呈现不同的变化趋势。例如，从一个训练周期切换至下一个训练周期之后，标签错误的训练样本的损失函数值可能会明显增加，而标签正确的训练样本则不会大幅增加。因此，本申请实施例中，对所述第一分类模型进行训练的训练过程包括至少两个训练周期，从而可以在后续根据不同状态的训练样本的损失函数值在不同训练周期的变化情况来从所述训练样本中筛选出不同状态的样本。

在一些实施例中，每个训练周期中，学习速率随迭代次数的变化而变化。

所述学习速率(learning rate)为所述第一分类模型的一个超参数，用于在训练过程中，指示通过损失函数的梯度调整网络权重的调整程度，从而可以控制第一分类模型在训练过程中的收敛速度。

在实际应用中，发明人发现，不同的训练样本由于不同的样本特性以及标注状态而呈现不同的状态。因此，在一些实施例中，可以将所述训练样本划分成以下至少三种状态：

1、标签正确且内容较为简单的无噪声易分样本。该无噪声易分样本的内容往往较易于识别，即较易于被第一分类模型提取和区分，并且该样本的内容与对应的标签相符。

2、标签正确且内容较为复杂的无噪声难分样本。该无噪声难分样本的内容往往较为复杂，通过第一分类模型进行特征提取所得到的特征较多和/或较难以与其他特征进行区分，并且，该样本的内容与对应的标签相符。

3、标签错误的噪声样本。该噪声样本的标签与内容并不相符。

而在实际训练过程中，不同状态下的样本的损失函数值可能随着不同训练阶段中学习速率的变化而呈现不同的变化趋势。

例如，在前期训练过程，第一分类模型能够迅速拟合无噪声易分样本，使无噪声易分样本的损失函数值快速下降；随着迭代次数的增加，第一分类模型逐渐能够拟合噪声样本与无噪声难分样本，使得噪声样本和无噪声难分样本的损失函数值也开始下降。当第一分类模型逐渐收敛之后，若使得所述学习速率突然增大，那么，第一分类模型会跳出局部最优解，这时，噪声样本的损失函数值将随学习速率突然增大，而无噪声样本(即无噪声易分样本和无噪声难分样本)的损失函数值虽然也会增加，但由于第一分类模型对真实内容与标签间映射关系的记忆性，无噪声样本的损失函数值的增幅会明显小于噪声样本。因此，通过分析各个训练样本的损失函数值可能会随着学习速率的变化所呈现的变化趋势即可筛选出训练数据集中的噪声样本。

基于以上原理，可以在所述训练过程中，将所述训练过程划分为至少两个训练周期，并且，在每个训练周期中，学习速率随迭代次数的变化而变化，以使得在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能会随着学习速率的变化而呈现不同的变化趋势，例如，标签错误的训练样本的损失函数值可能会随学习速率的突然增大而大幅增加，而标签正确的训练样本则不会随学习速率的突然增大而大幅增加，从而在后续根据各个训练样本在训练过程中的损失函数值的情况，分别判断各个训练样本是无噪声易分样本、无噪声难分样本或者噪声样本。此时，所述学习速率可以随不同的训练周期，呈现周期性的变化。

在一些实施例中，针对每一个训练周期，所述训练周期中学习速率随迭代次数的增加而降低，且若所述训练周期为除第一个训练周期之外的其他训练周期，则所述训练周期的第一次迭代过程的学习速率大于所述训练周期的前一个训练周期的最后一次迭代过程的学习速率。

此时，可以使得第一分类模型随一个训练周期逐渐收敛之后，在下一个训练周期重新调整学习速率，例如使得所述学习速率突然增大，以获得当第一分类模型逐渐收敛之后，学习速率突然变化时，各个训练样本的损失函数值所呈现的变化趋势，从而筛选出训练数据集中的噪声样本。

示例性的，如图2所示，为所述学习速率随迭代次数的变化而变化的一种示例性示意图。

其中，在任一训练周期中，所述学习速率都呈现随迭代次数的增加而逐渐变小的变化趋势。并且，任一所述其他训练周期的第一次迭代过程的学习速率大于该其他训练周期的前一个训练周期的最后一次迭代过程的学习速率，以使得所述学习速率突然增大。

示例性的，第一个训练周期的迭代次数可以大于其他训练周期的迭代次数，例如，第一个训练周期的迭代次数可以是其他训练周期的两倍，以使得所述第一分类模型在第一个训练周期能够收敛至一个较优的局部最优解。所述训练周期的个数可以根据实际训练情况来确定。示例性的，所述训练周期的个数可以为4或5。

在一些实施例中，所述训练数据集中的各个训练样本均满足预设格式条件，便于相应的第一分类模型进行读取和处理。

例如，若所述训练样本为视频，那么，各个训练样本的标签的格式可以为固定维度的标签向量，并且，各个训练样本的文件类型相同、视频帧帧数相同、视频时长相同、视频帧尺寸相同和/或视频帧中的像素点的取值范围相同等等。

在一些实施例中，在基于训练数据集，对第一分类模型进行训练之前，还包括：

获取原始数据集，其中，所述原始数据集包括多个原始样本和各个所述原始样本所分别对应的原始标签，所述原始样本的类型为图像或者视频；

针对每一个原始样本，对所述原始样本中的待处理图像进行尺寸调整，获得第一图像，其中，所述第一图像的尺寸为预设尺寸；

对所述第一图像的像素值进行线性变换，获得所述第一图像所对应的第二图像，其中，所述第二图像中的像素值的取值范围为预设范围；

根据所述原始样本所对应的第二图像，获得所述原始样本所对应的训练样本；

根据所述原始数据集中的各个原始样本所分别对应的训练样本和各个所述原始样本所分别对应的原始标签，确定训练数据集。

本申请实施例中，可以在获取到原始数据集之后，对原始数据集进行预处理，以获得满足预设格式条件的各个训练样本。

其中，该预处理可以包括图像尺寸归一化以及像素值归一化的处理。具体的，针对每一个原始样本，对所述原始样本中的待处理图像进行尺寸调整，获得尺寸统一为预设尺寸的第一图像，示例性的，该预设尺寸可以为224×224像素大小；然后，可以对所述第一图像的像素值进行线性变换，获得所述第一图像所对应的第二图像，此时，各个第二图像中的像素点的像素值的取值范围相同。

示例性的，所述线性变换可以基于以下公式来实现：

其中，x为所述第一图像中的像素点X的像素值，f(x)为所述像素点X在第二图像中的对应像素点的像素值。此时，第二图像中的各个像素点的取值范围为[-1，1]。

在一些实施例中，所述原始样本的类型为视频；

在针对每一个原始样本，对所述原始样本中的待处理图像进行尺寸调整，获得第一图像之前，还包括：

以预设采样率，对所述原始样本进行采样；

将采样得到的原始视频帧作为所述原始样本中的待处理图像。

本申请实施例中，可以对原始样本进行采样，以适当减小用于训练的视频中的视频帧的数量，并且，在一些情况下，还可以统一各个训练样本中的视频帧的个数，从而使得获得的各个训练样本的视频帧的帧数能够统一，以便于后续的训练。

步骤S102，在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值。

由于在实际训练过程中，不同状态下的样本的损失函数值可能随着不同训练阶段中学习速率的变化而呈现不同的变化趋势，因此，可以根据各个训练样本在训练过程中的损失函数值的情况，分别判断各个训练样本是无噪声易分样本、无噪声难分样本或者噪声样本。

其中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值，从而可以通过所述目标损失函数值，反映所述训练样本在所述训练过程中的指定阶段(如特定的训练周期中的预设迭代次数)随学习速率的变化情况，以用于识别所述训练样本的状态。

所述目标损失函数值的具体取值方式可以有多种。

例如，针对每一个训练样本，可以针对每一个训练周期，在所述训练周期进行至少一次迭代，并将该次迭代的损失函数值作为所述训练样本在所述训练周期的目标损失函数值；此时，所述训练周期的迭代次数可以为所述训练数据集中的训练样本的个数的正整数倍，以使得在所述训练周期中，每一个训练样本能够用于至少一次迭代。

或者，也可以针对每一个训练周期，在所述训练周期中的预设迭代次数所对应的迭代过程中，将该预设迭代次数中的第一分类模型针对所述训练样本所获得的损失函数值作为所述训练样本在所述训练周期的目标损失函数值。

需要说明的是，每一个训练样本所对应的目标损失函数值的个数可以是一个，也可以是两个以上，在此不作限制。

在一些实施例中，所述获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值可以是获取所述训练样本在除第一个训练周期之外的至少一个其他训练周期的目标损失函数值，而舍弃第一个训练周期的损失函数值，从而排除所述第一分类模型的随机初始化参数的影响。

步骤S103，根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本。

本实施例中，所述目标样本可以为标签正确的样本。此时，可以根据各个训练样本所分别对应的目标损失函数值，从所述训练样本中区分噪声样本(标签错误的样本)和目标样本(标签正确的样本)。

其中，可以通过所述目标损失函数值，反映所述训练样本在所述训练过程中的指定阶段(如特定的训练周期中的预设迭代次数)随学习速率的变化情况，以识别所述训练样本是否为噪声样本。

例如，针对每一个训练样本，若所述训练样本所对应的目标损失函数值只有1个，那么，可以将各个训练样本中，目标损失函数值最小的N个训练样本作为所述目标样本；

和/或，

将各个训练样本中，目标损失函数值小于预设损失阈值的训练样本作为所述目标样本。

而若每一个所述训练样本所对应的目标损失函数值为至少两个，则：

针对每一个训练样本，计算所述训练样本所对应的目标损失函数值的平均损失值；

将各个训练样本中，平均损失值最小的N个训练样本作为所述目标样本；

和/或，

将各个训练样本中，平均损失值小于预设损失阈值的训练样本作为所述目标样本。

本申请实施例中，可以根据各个训练样本所分别对应的目标损失函数值，识别标签正确或者标签错误等不同状态的训练样本，以从各个所述训练样本中筛选出处于期望状态的目标样本，从而从训练数据集中去除诸如标签错误的训练样本，而获得质量更高的训练数据集。

在一些实施例中，在从各个所述训练样本中确定目标样本之后，还包括：

将所述训练样本中除所述目标样本之外的其他样本作为待标注样本；

对所述待标注样本进行重新标注，以更新所述待标注样本的标签；

将标签更新后的待标注样本作为所述目标样本的至少一部分。

本申请实施例中，除所述目标样本之外的其他样本可以认为是噪声样本，即该其他样本的标签与该其他样本的内容并不相符，此时，可以对所述待标注样本进行重新标注以更新所述待标注样本的标签，此时标签更新后的待标注样本的标签的正确率往往很高，因此，可以将标签更新后的待标注样本作为所述目标样本的至少一部分，从而进一步提升目标样本的数量和样本的多样性。

基于所述目标样本，对第二分类模型进行训练，获得训练完成的第二分类模型，其中，所述第二分类模型的结构与所述第一分类模型的结构相同。

本申请实施例中，所述目标样本可以认为是从所述训练数据集中筛选得到的标签正确的训练样本，因此，通过所述目标样本对第二分类模型进行训练，可以提升训练得到的第二分类模型的性能。

在一些实施例中，在基于所述目标样本，对第二分类模型进行训练，获得训练完成的第二分类模型之后，还包括：

获取待预测样本；

若所述待预测样本的格式不满足预设格式条件，对所述待预测样本进行格式调整，以使得格式调整后的待预测样本的格式满足预设格式条件；

将所述格式调整后的待预测样本输入所述训练完成的第二分类模型，获得训练完成的第二分类模型针对所述格式调整后的待预测样本输出的类别向量；

根据所述类别向量，确定所述待预测样本的类别。

其中，示例性的，所述类别向量P可以为P＝{p1,p2,…,pn}。根据所述类别向量，确定所述待预测样本的类别的方式可以是：

将p1,p2,…,pn中的最大值所对应的类别作为所述待预测样本的类别。

或者，根据所述类别向量，确定所述待预测样本的类别的方式可以是：

以预设阈值T遍历P，如果存在pi>T，则确定所述待预测样本属于pi所对应的类别。

从所述类别向量P中，筛选出大小最大为前K个元素，并确定所述待预测样本属于该前K个元素所对应的类别。

可以理解的是，所述待预测视频可以属于一个类别，或者，也可以属于两个以上的类别。

如图3所示，为本申请实施例中的数据处理的一种示例性处理流程图。

其中，所述训练数据集可以用于所述第一分类模型的训练，并可以根据对所述第一分类模型的训练，对训练数据集进行样本筛选，从而从所述训练数据集中区分目标样本和噪声样本，再根据所述目标样本对所述第二分类模型进行训练，以提升训练得到的第二分类模型的性能，从而可以通过训练得到的第二分类模型进行分类应用。

在一些实施例中，所述在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值，包括：

在所述训练过程中，针对每一个训练样本，获取所述训练样本的目标损失函数值，其中，所述目标损失函数值为所述训练样本在目标训练周期内的预设迭代次数所对应的损失函数值，所述目标训练周期为所述训练过程中，除第一个训练周期之外的至少一个其他训练周期。

本申请实施例中，所述目标训练周期为所述训练过程中，除第一个训练周期之外的至少一个其他训练周期，此时，所述目标损失函数值不从所述第一个训练周期中进行获取，从而可以排除所述第一分类模型的随机初始化参数的影响。

本申请实施例中，所述目标训练周期可以为除第一个训练周期之外的至少一个其他训练周期，也即是说，所述目标训练周期可以为从第二个训练周期起的训练周期中的至少一个。并且，针对每一个目标训练周期，每一个训练样本在所述目标训练周期中均至少记录一次目标损失函数值。

所述预设迭代次数可以根据所述目标损失函数值的具体取值方式来确定。并且，不同的训练样本所对应的预设迭代次数可以相同，也可以不同。

例如，在一种示例中，对于每一个训练样本，针对每一个目标训练周期，可以在所述目标训练周期中的预设迭代次数所对应的迭代过程中，将该预设迭代次数中的第一分类模型针对所述训练样本所获得的损失函数值作为所述训练样本在所述目标训练周期的目标损失函数值。此时，为了突出当第一分类模型逐渐收敛之后，在所述学习速率突然增大时所述噪声样本和目标样本之间的损失函数值的变化差异，可以将所述预设迭代次数设置为所述目标训练周期的前H次迭代次数中的至少两次迭代次数，例如，可以是第1次迭代、第2次迭代和/或第5次迭代等等。此时，不同的训练样本所对应的预设迭代次数可以相同，例如，对于训练样本A和训练样本B，该训练样本A和训练样本B在目标训练周期中所对应的预设迭代次数均为该目标训练周期中的第1次迭代和第2次迭代。

而在另一种示例中，针对每一个目标训练周期，所述目标训练周期所包含的迭代次数可以为所述训练数据集中的训练样本的个数的正整数倍，以使得在所述目标训练周期中，每一个训练样本能够用于至少一次迭代过程。此时，所述训练样本在所述目标训练周期中的目标损失函数值即所述目标训练周期中，所述训练样本所关联的迭代过程所得到的损失函数值。此时，不同的训练样本所对应的预设迭代次数可以不同，例如，对于训练样本C和训练样本D，该训练样本C用于目标训练周期中的第10次迭代，那么该训练样本C在目标训练周期中所对应的预设迭代次数为第10次迭代。而训练样本D用于目标训练周期中的第200次迭代，那么训练样本D在目标训练周期中所对应的预设迭代次数为第200次迭代。

在一些实施例中，所述第一个训练周期的最后一次迭代过程所得到的分类结果满足预设条件。

其中，示例性的，所述预设条件可以为所述第一个训练周期的最后一次迭代过程所得到的分类结果所对应的损失函数值低于预设损失阈值；或者，所述预设条件也可以为所述第一个训练周期的最后一次迭代过程所得到的分类结果的分类准确率高于预设准确率阈值。

此时，所述第一个训练周期结束后，可以保证所述第一分类模型能够收敛至一个较优的状态。

在一些实施例中，若每一个所述训练样本所对应的目标损失函数值为至少两个，则：

所述根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本，包括：

根据各个所述训练样本所分别对应的平均损失值，从各个所述训练样本中确定目标样本。

本申请实施例中，针对每一个训练样本，可以获取所述训练样本所对应的至少两个目标损失函数值，从而可以基于该至少两个目标损失函数值更准确地判断所述训练样本随学习速率的变化趋势。

其中，所述训练样本所对应的至少两个目标损失函数值可以分别来自不同的目标训练周期，例如，所述训练样本可以对应4个目标损失函数值，分别来自第二个训练周期、第三个训练周期、第四个训练周期和第五个训练周期。当然，所述训练样本所对应的至少两个目标损失函数值中，也可以有至少部分的目标损失函数值来自相同的目标训练周期。例如，所述训练样本可以对应4个目标损失函数值，其中有两个目标损失函数值来自第二个训练周期，而其他两个目标损失函数值来自第三个训练周期。可以理解的是，所述目标损失函数值的具体获取方式可以有多种，在此不作限定。

在一些实施例中，所述根据各个所述训练样本所分别对应的平均损失值，从各个所述训练样本中确定目标样本，包括：

和/或，

本申请实施例中，所述N的取值可以根据具体应用场景中训练数据集的标注质量以及训练样本的数量等因素来确定。例如，在一些实施例中，可以初步估计噪声样本的占比为10％～20％，而所述训练样本的数量为一万，那么，所述N可以取八千至九千中的一个值。而所述预设损失阈值也可以根据实际测试经验等等方式来确定。

本申请实施例中，可以基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；此时，在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能呈现不同的变化趋势。在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；再根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本；此时，可以根据各个训练样本所分别对应的目标损失函数值，识别标签正确或者标签错误等不同状态的训练样本，以从各个所述训练样本中筛选出处于期望状态的目标样本，从而从训练数据集中去除诸如标签错误的训练样本，而获得质量更高的训练数据集。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例上述的样本筛选方法，图4示出了本申请实施例提供的一种样本筛选装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参照图4，该样本筛选装置4包括：

训练模块401，用于基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；

获取模块402，用于在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；

确定模块403，用于根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本。

可选的，所述样本筛选装置4还包括：

第二训练模块，用于基于所述目标样本，对第二分类模型进行训练，获得训练完成的第二分类模型，其中，所述第二分类模型的结构与所述第一分类模型的结构相同。

可选的，所述样本筛选装置4还包括：

第二获取模块，用于获取原始数据集，其中，所述原始数据集包括多个原始样本和各个所述原始样本所分别对应的原始标签，所述原始样本的类型为图像或者视频；

尺寸调整模块，用于针对每一个原始样本，对所述原始样本中的待处理图像进行尺寸调整，获得第一图像，其中，所述第一图像的尺寸为预设尺寸；

线性变换模块，用于对所述第一图像的像素值进行线性变换，获得所述第一图像所对应的第二图像，其中，所述第二图像中的像素值的取值范围为预设范围；

第一处理模块，用于根据所述原始样本所对应的第二图像，获得所述原始样本所对应的训练样本；

第二处理模块，用于根据所述原始数据集中的各个原始样本所分别对应的训练样本和各个所述原始样本所分别对应的原始标签，确定训练数据集。

可选的，所述原始样本的类型为视频；

所述样本筛选装置4还包括：

采样模块，用于以预设采样率，对所述原始样本进行采样；

第三处理模块，用于将采样得到的原始视频帧作为所述原始样本中的待处理图像。

可选的，所述获取模块402具体用于：

可选的，所述第一个训练周期的最后一次迭代过程所得到的分类结果满足预设条件。

可选的，若每一个所述训练样本所对应的目标损失函数值为至少两个，则：

所述确定模块403具体包括：

计算单元，用于针对每一个训练样本，计算所述训练样本所对应的目标损失函数值的平均损失值；

确定单元，用于根据各个所述训练样本所分别对应的平均损失值，从各个所述训练样本中确定目标样本。

可选的，所述确定单元具体用于：

和/或，

可选的，每个训练周期中，学习速率随迭代次数的变化而变化。

可选的，针对每一个训练周期，所述训练周期中学习速率随迭代次数的增加而降低，且若所述训练周期为除第一个训练周期之外的其他训练周期，则所述训练周期的第一次迭代过程的学习速率大于所述训练周期的前一个训练周期的最后一次迭代过程的学习速率。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图5为本申请一实施例提供的终端设备的结构示意图。如图5所示，该实施例的终端设备5包括：至少一个处理器50(图5中仅示出一个)、存储器51以及存储在上述存储器51中并可在上述至少一个处理器50上运行的计算机程序52，上述处理器50执行上述计算机程序52时实现上述任意各个样本筛选方法实施例中的步骤。

上述终端设备5可以是服务器、手机、可穿戴设备、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、桌上型计算机、笔记本、台式电脑以及掌上电脑等计算设备。该终端设备可包括，但不仅限于，处理器50、存储器51。本领域技术人员可以理解，图5仅仅是终端设备5的举例，并不构成对终端设备5的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入设备、输出设备、网络接入设备等。其中，上述输入设备可以包括键盘、触控板、指纹采集传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风、摄像头等，输出设备可以包括显示器、扬声器等。

上述处理器50可以是中央处理单元(Central Processing Unit，CPU)，该处理器50还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

上述存储器51在一些实施例中可以是上述终端设备5的内部存储单元，例如终端设备5的硬盘或内存。上述存储器51在另一些实施例中也可以是上述终端设备5的外部存储设备，例如上述终端设备5上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，上述存储器51还可以既包括上述终端设备5的内部存储单元也包括外部存储设备。上述存储器51用于存储操作系统、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等，例如上述计算机程序的程序代码等。上述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

另外，尽管未示出，上述终端设备5还可以包括网络连接模块，如蓝牙模块Wi-Fi模块、蜂窝网络模块等等，在此不再赘述。

本申请实施例中，上述处理器50执行上述计算机程序52以实现上述任意各个样本筛选方法实施例中的步骤时，可以基于训练数据集，对第一分类模型进行训练，其中，所述训练数据集中包括多个训练样本，对所述第一分类模型进行训练的训练过程包括至少两个训练周期；此时，在各个训练周期中，不同状态的训练样本(例如，标签正确的训练样本和标签错误的训练样本等)的损失函数值可能呈现不同的变化趋势。在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值；再根据各个训练样本所分别对应的目标损失函数值，从各个所述训练样本中确定目标样本；此时，可以根据各个训练样本所分别对应的目标损失函数值，识别标签正确或者标签错误等不同状态的训练样本，以从各个所述训练样本中筛选出处于期望状态的目标样本，从而从训练数据集中去除诸如标签错误的训练样本，而获得质量更高的训练数据集。

本申请实施例还提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行时实现可实现上述各个方法实施例中的步骤。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，上述计算机程序包括计算机程序代码，上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上上述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种样本筛选方法，其特征在于，包括：

2.如权利要求1所述的样本筛选方法，其特征在于，在从各个所述训练样本中确定目标样本之后，还包括：

3.如权利要求1所述的样本筛选方法，其特征在于，在基于训练数据集，对第一分类模型进行训练之前，还包括：

4.如权利要求3所述的样本筛选方法，其特征在于，所述原始样本的类型为视频；

以预设采样率，对所述原始样本进行采样；

5.如权利要求1所述的样本筛选方法，其特征在于，所述在所述训练过程中，针对每一个训练样本，获取所述训练样本在所述训练过程中的至少一个训练周期的目标损失函数值，包括：

6.如权利要求5所述的样本筛选方法，其特征在于，所述第一个训练周期的最后一次迭代过程所得到的分类结果满足预设条件。

7.如权利要求5所述的样本筛选方法，其特征在于，若每一个所述训练样本所对应的目标损失函数值为至少两个，则：

8.如权利要求7所述的样本筛选方法，其特征在于，所述根据各个所述训练样本所分别对应的平均损失值，从各个所述训练样本中确定目标样本，包括：

和/或，

9.如权利要求1至8任意一项所述的样本筛选方法，其特征在于，每个训练周期中，学习速率随迭代次数的变化而变化。

10.如权利要求9所述的样本筛选方法，其特征在于，针对每一个训练周期，所述训练周期中学习速率随迭代次数的增加而降低，且若所述训练周期为除第一个训练周期之外的其他训练周期，则所述训练周期的第一次迭代过程的学习速率大于所述训练周期的前一个训练周期的最后一次迭代过程的学习速率。

11.一种样本筛选装置，其特征在于，包括：

12.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至10任一项所述的样本筛选方法。

13.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至10任一项所述的样本筛选方法。