CN110458245A

CN110458245A - 一种多标签分类模型训练方法、数据处理方法及装置

Info

Publication number: CN110458245A
Application number: CN201910771659.XA
Authority: CN
Inventors: 张凌寒; 陈权; 郑敏鹏
Original assignee: Atlas Future (nanjing) Artificial Intelligence Research Institute Co Ltd
Current assignee: Atlas Future (nanjing) Artificial Intelligence Research Institute Co Ltd
Priority date: 2019-08-20
Filing date: 2019-08-20
Publication date: 2019-11-15
Anticipated expiration: 2039-08-20
Also published as: CN110458245B

Abstract

本申请公开一种多标签分类模型训练方法、数据处理方法及装置，属于图像处理技术领域。该方法包括：利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值；获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据；利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。该方法大大节省了训练多标签分类模型的标注成本，提高了多标签分类模型训练效率。

Description

一种多标签分类模型训练方法、数据处理方法及装置

技术领域

本申请属于图像处理技术领域，具体涉及一种多标签分类模型训练方法、数据处理方法及装置。

背景技术

图像分类任务中，单一图像往往携带多种标签的特征，多标签分类是非常自然的一种需求。目前多标签分类模型训练需要多标签数据，但完善的多标签数据较难获得。目前获取多标签数据通常由工作人员人为观察图像，并对图像人工标注，以得到图像的多个分类标签。然而，当标签体系中的分类标签非常多时，工作人员需要依次人工标注图像是否属于标签体系中的每一个分类标签，耗时较长，且人工成本较高。

发明内容

鉴于此，本申请的目的在于提供一种多标签分类模型训练方法、数据处理方法及装置，以改善现有技术中基于多标签数据训练多标签分类模型时，获取多标签数据所存在的耗时较长以及成本较高的问题。

本申请的实施例是这样实现的：

第一方面，本申请实施例提供了一种多标签分类模型训练方法，包括：利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j；获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j；利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。

本申请实施例中，在对多标签(j标签)分类模型的训练过程中，先通过标签数量较低的i标签数据进行训练，然后基于标签数量较低的i标签数据的分类结果对i标签数据进行二次标注，得到标签数量较大k标签数据，然后基于k标签数据再次进行训练。一方面，因为在训练过程中，可以根据前次训练结果标注下次使用到的数据，获取到更多标签的训练数据，另一方面，因为在获取标注数据的过程中，同时开始了模型训练，所以该方法大大节省了多标签数据的标注成本，提高了多标签分类模型训练效率，可以改善现有技术中基于多标签数据训练多标签分类模型时，获取多标签数据所存在的耗时较长以及成本较高的问题。

结合第一方面实施例，在一种可能的实施方式下，获取每个所述二元分类器经训练得到的最优分类阈值，包括：获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布，得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线；基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值。本申请实施例通过通过获取每个二元分类器对i标签的样本数据的分类结果的概率分布而得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线，然后再基于各自的第一概率曲线和第二概率曲线，获取各自对应的最优分类阈值，确保了所得的最优分类阈值的准确性和可靠性。

结合第一方面实施例，在一种可能的实施方式下，基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值，包括：判断每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线是否交叉；在为是时，确定所述第一概率曲线与所述第二概率曲线交叉处所对应的分类阈值为该二元分类器的所述最优分类阈值；在为否时，确定位于所述第一概率曲线与所述第二概率曲线之间的分类阈值为该二元分类器的所述最优分类阈值。本申请实施例中，通过判断每个二元分类器各自对应的第一概率曲线与第二概率曲线是否交叉来确定该二元分类器的最优分类阈值，这种方式确保了所得的最优分类阈值的准确性和可靠性。

结合第一方面实施例，在一种可能的实施方式下，基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，包括：获取每个所述二元分类器对所述样本数据的分类结果；对所述分类结果为正类的i标签的样本数据进行二次标注，使所述分类结果为正类的样本数据带有对应分类器的正向标签。本申请实施例中，基于每个二元分类器的分类结果对分类结果为正类的i标签的样本数据进行二次标注，使得分类结果为正类的样本数据带有对应分类器的正向标签，从而能快速获得多标签的样本数据，大大节省了人工去标注多标签的样本数据所需成本，提高了训练效率。

结合第一方面实施例，在一种可能的实施方式下，在利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练之后，所述方法还包括：获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；基于每个所述二元分类器对所述k标签的样本数据的分类结果对所述样本数据进行二次标注，得到j标签的样本数据；利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练，得到训练好的所述j标签分类模型。本申请实施例中，通过反复的更新每个二元分类器的最优分类阈值，并多次基于每个二元分类器的分类结果对样本数据进行二次标注，然后再利用标注的样本数据对j标签分类模型进行训练，以保证标注结果的准确性以及提高模型的性能。

结合第一方面实施例，在一种可能的实施方式下，利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练，包括：对所述j标签的样本数据进行特征提取，得到特征向量；利用所述特征向量对更新后的所述j标签分类模型进行训练。

第二方面，本申请实施例还提供了一种数据处理方法，包括：获取待分类的目标样本数据；对所述目标样本数据进行特征提取，得到特征向量；利用上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。本申请实施例中，利用部分标注的i标签(所需的人工标注成本较低)的样本数据如单标签数据训练得到的多标签分类模型对待待分类的目标样本数据进行分类处理，能大大节省训练多标签分类模型的成本，从而提高分类的效率。

第三方面，本申请实施例还提供了一种多标签分类模型训练装置，包括：训练模块、获取模块以及标注模块；训练模块，用于利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j；获取模块，用于获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；标注模块，用于基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j；训练模块，还用于利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。

第四方面，本申请实施例还提供了一种数据处理装置，包括：获取模块、提取模块以及处理模块；获取模块，用于获取待分类的目标样本数据；提取模块，用于对所述目标样本数据进行特征提取，得到特征向量；处理模块，用于利用上述第三方面实施例提供的多标签分类模型训练装置训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。

第五方面，本申请实施例还提供了一种电子设备，包括：存储器和处理器，所述存储器和所述处理器电连接；所述存储器用于存储程序；所述处理器用于调用存储于所述存储器中的程序，以执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法，或者执行上述第二方面实施例提供的方法。

第六方面，本申请实施例还提供了一种存储介质，其上存储有计算机程序，所述计算机程序被计算机运行时，执行上述第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法，或者执行上述第二方面实施例提供的方法。

本申请的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例而了解。本申请的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。通过附图所示，本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图，重点在于示出本申请的主旨。

图1示出了本申请实施例提供的一种多标签分类模型训练方法的流程图。

图2示出了本申请实施例提供的一种数据处理方法的流程图。

图3示出了本申请实施例提供的一种多标签分类模型训练装置的模块示意图。

图4示出了本申请实施例提供的一种数据处理装置的模块示意图。

图5示出了本申请实施例提供的一种电子设备的模块示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中诸如“第一”、“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

再者，本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。

第一实施例

目前多标签分类模型训练需要标注完整的多标签数据，而多标签数据通常由工作人员人为观察图像，并对图像人工标注，以得到多标签数据。然而，当标签体系中的分类标签非常多时，工作人员需要依次人工标注图像是否属于标签体系中的每一个分类标签，耗时较长，且人工成本较高。

鉴于此，本申请实施例中，提供一种使用标签数量较低的i标签数据对多标签(标签数量大于i)分类模型进行训练，然后基于标签数量较低的i标签数据的分类结果对i标签数据进行二次标注，得到标签数量较大k标签数据，然后基于k标签数据再次进行训练，即可得到性能较好的多标签分类模型，大大了节省了训练多标签分类模型的标注成本，提高了多标签分类模型训练效率。也即，先标注一部分，然后再利用训练过程中的结果自动标注，相较于全部由人工标注到k标签，肯定节约了时间成本和人工成本。进一步地，请参阅图1，为本申请实施例提供的一种多标签分类模型训练方法，下面将结合图1对其所包含的步骤进行说明。

步骤S101：利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值。

由于标注完整的多标签数据，特别是当标签体系中的分类标签非常多时，耗时较长，且人工成本较高，在多标签分类时，将每一个分类标签定义为正类，对于每个正类，分别使用一个单独的二元分类器进行分类，属于该标签类别的为正类，其余的均为负类，而每个样本可能属于多个不同的标签类别，这使得数据标注的成本成倍地增加，最坏的情况下标注一批C标签数据所花费的时间为标注单标签数据的C倍。因此，本申请实施例中，利用i标签(例如单标签)的样本数据对j标签分类模型进行训练，以节约标注的成本，也即利用较少标签如单标签的样本数据对较多标签分类模型进行训练。其中，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，通过训练不断的调整每个所述二元分类器对应的分类阈值，即可得到性能较好的多标签分类模型。其中，i和j均为正整数且i小于j，例如，i为1时，对应的标签数据为单标签数据，且j大于i，如i为1时，j为3。

在利用i标签的样本数据对j标签分类模型进行训练时，先对所述i标签的样本数据进行特征提取，得到特征向量；然后利用提取到的所述特征向量对j标签分类模型进行训练。例如，将Alexnet，VGG(visual geometry group，超分辨率测试序列)，ResNet等深度神经网络作为深度特征提取器，来对所述i标签的样本数据进行特征提取。在训练时，使用二元交叉熵损失函数作为每个分类器的损失计算函数进行模型训练，并使用随机梯度下降算法训练网络直到收敛。在模型训练时，每个图像是其标注所对应分类器的正样本，是其余分类器的负样本。

步骤S102：获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值。

在利用i标签(例如单标签)样本数据对j标签分类模型进行训练后，例如经过一次训练周期(其中，一次训练周期是值，所有的样本数据均使用一次)后，获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值。为了便于理解，假设上述的j标签分类模型为5标签分类模型，其包含A、B、C、D、E五个独立的二元分类器，假设开始时，这个五个独立的二元分类器初始的分类阈值均为0.5，经过训练后，假设这五个独立的二元分类器经训练得到的最优分类阈值分别为0.5、0.4、0.6、0.3、0.5，则将A分类器的分类阈值替换为0.5，将B分类器的分类阈值替换为0.4，将C分类器的分类阈值替换为0.6，将D分类器的分类阈值替换为0.3，将E分类器的分类阈值替换为0.5。

其中，在获取每个所述二元分类器经训练得到的最优分类阈值时，作为一种实施方式，可以是，获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布，得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线；然后再基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值。由于获取每个二元分类器经训练得到的最优分类阈值的过程是一样的，因此，为了便于理解，下面以上述的示例为例，以获取B分类器的最优分类阈值为例进行说明，获取B分类器对i标签的样本数据的分类结果的概率分布，i标签的样本数据经过B分类器后会被分成两类，一类为正类，一类为负类，假设i标签的样本数据有100个，其中被判定为正类的有40个，被判定为负类的有60个，则根据判定为正类的40个i标签的样本数据的概率分布，即可得到表征分类结果为正类的第一概率曲线，根据判定为负类的60个i标签的样本数据的概率分布，即可得到表征分类结果为负类的第二概率曲线，然后再根据这两条概率曲线，即可确定出B分类器的最优分类阈值。其中，需要说明的是，每个i标签的样本数据在进行提特提取后，经过二元分类器后均会有一个概率，若概率大于该分类器的分类阈值则判定为正类，若概率小于分类阈值则判定为负类。

其中，在基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值时，其过程可以是，判断每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线是否交叉；在为是时，也即第一概率曲线与第二概率曲线相交时，确定所述第一概率曲线与所述第二概率曲线交叉处所对应的分类阈值为该二元分类器的所述最优分类阈值；在为否时，也即第一概率曲线与第二概率曲线不相交时，则确定位于所述第一概率曲线与所述第二概率曲线之间的分类阈值为该二元分类器的所述最优分类阈值。为了便于理解，假设第一概率曲线对应的分类阈值的覆盖范围为0.5－0.8；第二概率曲线对应的分类阈值的覆盖范围为0.1－0.45，此时，两者是没有相交的，则位于这两条曲线之间的任一分类阈值都可以看作是最优分类阈值，如0.45－0.5这一区间内的分类阈值都可以看作是最优分类阈值。假设第一概率曲线对应的分类阈值的覆盖范围为0.4－0.8；第二概率曲线对应的分类阈值的覆盖范围为0.1－0.45，此时，两者是相交的，假设两者的相交处对应的分类阈值为0.43，则此时，最优分类阈值为0.43。

在确定每个所述二元分类器经训练得到的最优分类阈值时，并不限于上述示例的实施方式，作为另一种实施方式，也可以是在获取到每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线后，将第一概率曲线峰值对应的分类阈值与第二概率曲线峰值对应的分类阈值的平均值作为该分类器的最优分类阈值，以A分类器为例，假设A分类器的第一概率曲线的峰值对应的分类阈值为0.7，第二概率曲线的峰值对应的分类阈值为0.3，则A分类器的最优分类阈值为0.7与0.3的平均值即为0.5。

步骤S103：基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述i标签的样本数据进行二次标注，得到k标签的样本数据。

本申请实施例中，通过使用每个所述二元分类器对所述i标签的样本数据的分类结果对所述i标签的样本数据进行二次标注，而得到的k标签的样本数据对j标签分类模型进行训练，可以减少标注完整的多标签数据所需的时间成本，特别是当标签体系中的分类标签非常多时，效果更加明显。由于在模型训练时，每个二元分类器均会对i标签的样本数据进行分类，得到各自对应的分类结果，因此可以基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述i标签的样本数据进行二次标注，得到k标签的样本数据。其中，k为正整数，且k大于i小于等于j，如i为10，j为50时，k可以是11、12、13、……49、50这40个数值中的任一数值。例如以单标签的样本数据为例，在经过一个包含A、B、C、D、E五个独立的二元分类器的5标签分类模型后，会得到5个分类结果，然后基于各自的分类结果对单标签样本数据进行二次标注，这样就可以得到多(2个及以上)标签的样本数据，如可以得到双标签、三标签、四标签或者5标签的数据。

其中，作为一种实施方式，在对i标签的样本数据进行二次标注时，上述过程可以是：获取每个所述二元分类器对所述i标签(例如单标签)样本数据的分类结果；对所述分类结果为正类的i标签的样本数据进行二次标注，使所述分类结果为正类的样本数据带有对应分类器的正向标签。例如，利用A分类器的分类结果对单标签的样本数据进行二次标注，使A分类器的分类结果为正类的样本数据带有对应A分类器的正向标签，利用B分类器的分类结果对单标签的样本数据进行二次标注，使B分类器的分类结果为正类的样本数据带有对应B分类器的正向标签，其余的类似，这样，原本单标签的样本数据进行二次标注后，就变成了5标签的分类数据。

其中，作为另一种实施方式，在对i标签(例如单标签)的样本数据进行二次标注时，可以是在获取各个分类器的分类结果后，随机选取出至少一个分类结果，然后基于选取出的分类结果对i标签的样本数据进行二次标注，例如以上述的A、B、C、D、E五个分类器为例，假设选出A分类器的分类结果对单标签数据(假设此时的单标签数据的标签为B、C、D、E分类器各自对应的标签中的任一个)进行标注，则可以得到双标签数据，当然，若此时的单标签数据为A分类器对应的标签，则基于A分类器的分类结果进行二次标注后，仍然为单标签数据。

其中，需要说明的是，为了保证标注结果的准确性，在基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述i标签的样本数据进行二次标注时，可以结合人工进行审查，保留预测准确性较高的标签，对标注做的标签进行修正，这样可以仅花费较少的审查时间就能提高标注的准确性，进而提高多标签分类模型训练精度。

步骤S104：利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。

基于每个分类器的分类结果对i标签的样本数据进行二次标注后，得道k标签的样本数据后，利用k标签的样本数据对更新后的所述j标签分类模型进行训练。其中，更新后的j标签分类模型是值更新了每个分类器各自的分类阈值后的j标签分类模型。

在利用k标签的样本数据对更新后的j标签分类模型进行训练的过程与上述的利用i标签的样本数据对j标签分类模型进行训练的过程的原理一致，例如，先对所述k标签的样本数据进行特征提取，得到特征向量；然后利用提取到的所述特征向量对更新后的j标签分类模型进行训练。

作为一种可选的实施方式，为了保证标注结果的准确性，在利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练之后，所述方法还包括：获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；基于每个所述二元分类器对所述k标签的样本数据的分类结果对所述样本数据进行二次标注，得到j标签的样本数据；利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练，得到训练好的所述j标签分类模型。该过程与上述步骤S102－S104的过程一致，唯一不同的是，其中的参数不同，例如每个分类器各自对应的最优分类阈值不同，每个分类器的分类结果不同以及标注的样本数据不同，可以将该过程看作是一个反复循环的过程，也即，利用初始的样本数据对初始的j标签分类模型进行训练(第一次训练周期)，基于第一次训练后的最优分类阈值替换初始的分类阈值，利用第一次的分类结果对初始样本数据进行二次标注，然后利用第一次二次标注后的样本数据对第一次更新后的分类模型进行训练(第二次训练周期)，基于第二次训练后的最优分类阈值替换第一次确定的最优分类阈值，利用第二次的分类结果对第一次二次标注后的样本数据进行二次标注，然后利用第二次二次标注后的样本数据对第二次更新后的分类模型进行训练(第三次训练周期)；基于第三次训练后的最优分类阈值替换第二次确定的最优分类阈值，利用第三次的分类结果对第二次二次标注后的样本数据进行二次标注，然后利用第三次二次标注后的样本数据对第三次更新后的分类模型进行训练(第四次训练周期)依次类推，直至结束(如训练至训练结束次数)，得到训练好的所述j标签分类模型。

其中，需要说明的是，基于每个分类器的分类结果对样本数据进行二次标注时，可以是一次性获得j标签的样本数据(也即基于所有的分类结果对样本数据进行二次标注)，也可以是基于部分分类结果对样本数据进行二次标注，需要进行多次标注后才能得到j标签的样本数据，例如，有5个分类结果，在对单标签的样本数据进行二次标注时，可以是一次性得到5标签的样本数据，也可以是多次标注后才获得5标签的样本数据，例如，利用第一次的分类结果中A分类器的分类结果对初始单标签样本数据进行二次标注，得到单标签或双标签的样本数据，利用第二次的分类结果中B分类器的分类结果对上一次标注的样本数据进行二次标注，得到双标签或三标签的样本数据，利用第三次的分类结果中C分类器的分类结果对上一次标注的样本数据进行二次标注，得到三标签或四标签的样本数据，利用第四次的分类结果中D分类器的分类结果对上一次标注的样本数据进行二次标注，得到四标签或五标签的样本数据，利用第五次的分类结果中E分类器的分类结果对上一次标注的样本数据进行二次标注，得到五标签的样本数据。其中，在每一次对上一次样本数据进行二次标注时，都可以结合人工进行审查，保留预测准确性较高的标签，对标注做的标签进行修正。

综上所述，本申请实施例提供的多标签分类模型训练方法，使得可以使用部分标注的i标签(标注成本较低)的样本数据如单标签数据，配合少量的人工复审，即可得到性能较好的多标签分类模型，大大节省了训练多标签分类模型的标注成本，提高了多标签分类模型训练效率。

第二实施例

本申请实施例还提供了一种数据处理方法，如图2所示，下面将结合图2所包含的步骤进行说明。

步骤S201：获取待分类的目标样本数据。

当需要对待分类的目标样本数据进行分类时，获取待分类的目标样本数据。

步骤S202：对所述目标样本数据进行特征提取，得到特征向量。

对所述目标样本数据进行特征提取，得到特征向量。例如，将Alexnet，VGG(visualgeometry group，超分辨率测试序列)，ResNet等深度神经网络作为深度特征提取器，来对所述目标样本数据进行特征提取，得到特征向量。

步骤S203：利用事先训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。

利用事先训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。其中，事先训练得到的j标签分类模型为事先利用第一实施例所提供的多标签分类模型训练方法训练所得到的j标签分类模型。

第三实施例

本申请实施例还提供了一种多标签分类模型训练装置100，如图3所示。该多标签分类模型训练装置100包括：训练模块110、获取模块120以及标注模块130。

训练模块110，用于利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j。

获取模块120，用于获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值。可选地，获取模块120具体用于：获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布，得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线；基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值。可选地，获取模块120具体用于：判断每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线是否交叉；在为是时，确定所述第一概率曲线与所述第二概率曲线交叉处所对应的分类阈值为该二元分类器的所述最优分类阈值；在为否时，确定位于所述第一概率曲线与所述第二概率曲线之间的分类阈值为该二元分类器的所述最优分类阈值。

标注模块130，用于基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j。可选地，标注模块130具体用于：获取每个所述二元分类器对所述i标签的样本数据的分类结果；对所述分类结果为正类的i标签的样本数据进行二次标注，使所述分类结果为正类的样本数据带有对应分类器的正向标签。

训练模块110，还用于利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。可选地，训练模块110，还用于：对所述j标签的样本数据进行特征提取，得到特征向量；利用所述特征向量对更新后的所述j标签分类模型进行训练。

可选地，标注模块120，还用于基于每个所述二元分类器对所述k标签的样本数据的分类结果对所述样本数据进行二次标注，得到j标签的样本数据。

可选地，训练模块130，还用于利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练，得到训练好的所述j标签分类模型。

需要说明的是，本申请实施例所提供的多标签分类模型训练装置100，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

第四实施例

本申请实施例还提供了一种数据处理装置200，如图4所示。该数据处理装置200包括：获取模块210、提取模块220以及处理模块230。

获取模块210，用于获取待分类的目标样本数据。

提取模块220，用于对所述目标样本数据进行特征提取，得到特征向量。

处理模块230，用于事先训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。其中，事先训练得到的j标签分类模型为事先利用第三实施例所提供的多标签分类模型训练装置训练所得到的j标签分类模型。

需要说明的是，本申请实施例所提供的数据处理装置200，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

第五实施例

如图5所示，图5示出了本申请实施例提供的一种电子设备300的结构框图。所述电子设备300包括：收发器310、存储器320、通讯总线330以及处理器340。

所述收发器310、所述存储器320、处理器340各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线330或信号线实现电性连接。其中，收发器310用于收发数据。存储器320用于存储计算机程序，如存储有图3中所示的软件功能模块，即多标签分类模型训练装置100，或存储有图4中所示的软件功能模块，即数据处理装置200。其中，多标签分类模型训练装置100或者处理装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器320中或固化在所述电子设备300的操作系统(operating system，OS)中的软件功能模块。所述处理器340，用于执行存储器320中存储的可执行模块，例如所述多标签分类模型训练装置100或者数据处理装置200包括的软件功能模块或计算机程序。例如，处理器340，用于利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j；以及还用于获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；以及还用于基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j；以及还用于利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。或者处理器340，用于获取待分类的目标样本数据；以及还用于对所述目标样本数据进行特征提取，得到特征向量；以及还用于利用事先训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。

其中，存储器320可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read－Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read－Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read－Only Memory，EEPROM)等。

处理器340可能是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器340也可以是任何常规的处理器等。

其中，在本申请实施例中，所述电子设备300可以是，但不限于网络服务器、数据库服务器、云端服务器等。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

第六实施例

本申请实施例还提供了一种非易失性计算机可读取存储介质(以下简称可读取存储介质)，该可读取存储介质上存储有计算机程序，该计算机程序被计算机运行时，执行如上述的多标签分类模型训练方法所包含的步骤，或者执行如上述的数据处理方法所包含的步骤。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，笔记本电脑，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read－Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种多标签分类模型训练方法，其特征在于，包括：

利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j；

获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；

基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j；

利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。

2.根据权利要求1所述的方法，其特征在于，获取每个所述二元分类器经训练得到的最优分类阈值，包括：

获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布，得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线；

基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值。

3.根据权利要求2所述的方法，其特征在于，基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线，获取各自对应的所述最优分类阈值，包括：

判断每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线是否交叉；

在为是时，确定所述第一概率曲线与所述第二概率曲线交叉处所对应的分类阈值为该二元分类器的所述最优分类阈值；

在为否时，确定位于所述第一概率曲线与所述第二概率曲线之间的分类阈值为该二元分类器的所述最优分类阈值。

4.根据权利要求1所述的方法，其特征在于，基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，包括：

获取每个所述二元分类器对所述i标签的样本数据的分类结果；

对所述分类结果为正类的i标签的样本数据进行二次标注，使所述分类结果为正类的样本数据带有对应分类器的正向标签。

5.根据权利要求1－4任一项所述的方法，其特征在于，在利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练之后，所述方法还包括：

基于每个所述二元分类器对所述k标签的样本数据的分类结果对所述样本数据进行二次标注，得到j标签的样本数据；

利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练，得到训练好的所述j标签分类模型。

6.一种数据处理方法，其特征在于，包括：

获取待分类的目标样本数据；

对所述目标样本数据进行特征提取，得到特征向量；

利用如权利要求1－5中任一项所述的方法训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。

7.一种多标签分类模型训练装置，其特征在于，包括：

训练模块，用于利用i标签的样本数据对j标签分类模型进行训练，所述j标签分类模型包括j个独立的二元分类器，每个所述二元分类器对应有一个分类阈值，其中，i和j均为正整数且i小于j；

获取模块，用于获取每个所述二元分类器经训练得到的最优分类阈值，并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值；

标注模块，用于基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注，得到k标签的样本数据，k为正整数，且k大于i小于等于j；

所述训练模块，还用于利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练。

8.一种数据处理装置，其特征在于，包括：

获取模块，用于获取待分类的目标样本数据；

提取模块，用于对所述目标样本数据进行特征提取，得到特征向量；

处理模块，用于利用如权利要求7所述的训练装置训练得到的j标签分类模型对所述特征向量进行处理，得到分类结果。

9.一种电子设备，其特征在于，包括：存储器和处理器，所述存储器和所述处理器电连接；

所述存储器用于存储程序；

所述处理器用于调用存储于所述存储器中的程序，以执行如权利要求1－5中任一项所述的方法，或者执行如权利要求6所述的方法。

10.一种存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被计算机运行时，执行如权利要求1－5中任一项所述的方法，或者执行如权利要求6所述的方法。