CN112529210A

CN112529210A - 模型训练方法、装置以及计算机可读存储介质

Info

Publication number: CN112529210A
Application number: CN202011448647.2A
Authority: CN
Inventors: 刘济鹏
Original assignee: Guangzhou Yuncong Dingwang Technology Co Ltd
Current assignee: Guangzhou Yuncong Dingwang Technology Co Ltd
Priority date: 2020-12-09
Filing date: 2020-12-09
Publication date: 2021-03-19

Abstract

本发明涉及机器学习技术领域，具体提供了一种模型训练方法、装置与介质，旨在解决如何提高模型训练效果的技术问题。本发明先获取包括有标签样本以及经噪声标签标注后的样本的训练集；然后利用该训练集对进行模型训练，获取初始的数据处理模型以及获取经初始的数据处理模型预测到的无标签样本的预测类别；根据预测类别对相应的噪声标签进行修正，形成标签修正后的训练集；最后利用该训练集对初始的数据处理模型进行训练，获取到最终的数据处理模型。由于初始的数据处理模型已经具备较好的分类能力，因此利用其得到的预测类别可以快速筛选出需要修正的噪声标签，克服了对每个样本进行逐一核查导致的费时费力以及容易发生漏检和错检的缺陷。

Description

模型训练方法、装置以及计算机可读存储介质

技术领域

本发明涉及机器学习技术领域，具体涉及一种模型训练方法、装置以及计算机可读存储介质。

背景技术

机器学习技术领域中的监督学习主要是利用训练样本与样本标签对模型进行训练，而为了提高模型的训练效果，需要使用数量级较大的训练样本如百万级别的训练样本并且提前为每个训练样本分别标注好准确的样本标签，才能保证训练好的模型具备较高的模型性能。例如：利用百万级别的训练样本以及每个训练样本各自对应的类别标签，对数据分类模型进行训练，以使训练好的数据分类模型具备较高的分类性能。由于训练样本的数量级过大，在对训练样本进行标签标注时，无法保证对每个训练样本都进行准确地标签标注，如果利用这些标签错误的噪声样本进行模型训练，会降低模型的训练效果。

发明内容

为了克服上述缺陷，提出了本发明，以提供解决或至少部分地解决如何提高模型训练效果的技术问题的模型训练方法、装置以及计算机可读存储介质。

第一方面，提供一种模型训练方法，所述方法包括：

对初始训练集中的无标签样本进行噪声标签标注，以形成标注训练集，其中，所述标注训练集包括所述初始训练集中的有标签样本以及经所述噪声标签标注后的样本；

利用所述标注训练集对预设的数据处理模型进行训练，以获取初始的数据处理模型以及获取经所述初始的数据处理模型预测到的每个所述无标签样本的预测类别；

根据所述预测类别对每一所述无标签样本相应的噪声标签进行修正，以形成标签修正后的训练集；

利用所述标签修正后的训练集对所述初始的数据处理模型进行训练，以获取最终的数据处理模型。

在上述模型训练方法的一个技术方案中，“根据所述预测类别对每一所述无标签样本相应的噪声标签进行修正”的步骤具体包括：

判断所述预测类别与所述噪声标签表示的类别是否相同；

若相同，则不修正所述噪声标签；

若不同，则获取所述无标签样本的特征参数，并根据所述特征参数对所述无标签样本进行难易样本分类，以及根据所述难易样本分类的结果采用相应的修正方式进行噪声标签修正。

在上述模型训练方法的一个技术方案中，“获取所述无标签样本的特征参数”的步骤具体包括：

获取所述预测类别对应的预测概率并且将所述预测概率作为所述无标签样本的特征参数；

或者，获取所述初始的数据处理模型根据所述无标签样本输出的类别预测向量，其中，所述类别预测向量中的向量元素是所述无标签样本分别被预测为每个类别的预测概率；

根据所述每个类别的预测概率并且按照下式所示的方法计算预测向量信息熵，并且将所述预测向量信息熵作为所述无标签样本的特征参数：

其中，所述H表示所述预测向量信息熵，所述p_i表示所述无标签样本被预测为每i个类别的预测概率且i＝1，...，n，所述n表示类别总数；

或者，从所述有标签样本中选取每个类别各自对应的代表样本；

在利用所述标注训练集对预设的数据处理模型进行训练时，获取所述初始的数据处理模型中的特征提取模块提取到的每个所述代表样本各自对应的第一特征向量，以及所述无标签样本的第二特征向量；

根据所述预测类别对应的代表样本的第一特征向量以及所述第二特征向量，并且按照下式所示的方法计算所述无标签样本与所述预测类别对应的代表样本之间的平均相似性误差，以将所述平均相似性误差作为所述无标签样本的特征参数；

其中，所述err_i表示当所述预测类别是第i个类别时，所述无标签样本与所述第i个类别的代表样本之间的平均相似性误差；所述err_{i_j}表示所述无标签样本与所述第i个类别对应的第j个代表样本之间的相似性误差且j＝1，...，m，所述m表示所述第i个类别的代表样本的总数。

在上述模型训练方法的一个技术方案中，“根据所述特征参数对所述无标签样本进行难易样本分类”的步骤具体包括：

当所述特征参数是所述预测类别对应的预测概率时，若所述预测概率大于等于预设的概率阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本；

或者，当所述特征参数是所述预测向量信息熵时，若所述预测向量信息熵小于等于预设的信息熵阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本；

或者，当所述特征参数是所述平均相似性误差时，若所述平均相似性误差小于等于预设的误差阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本。

在上述模型训练方法的一个技术方案中，“根据所述难易样本分类的结果采用相应的修正方式进行噪声标签修正”的步骤具体包括：

若所述无标签样本是简单样本，则获取所述初始的数据处理模型根据所述无标签样本输出的类别预测向量，根据所述类别预测向量进行噪声标签修正；

若所述无标签样本是难样本，则将所述无标签样本输出至预设的标签标注平台，并且响应于所述预设的标签标注平台根据所述无标签样本输出的标签修正指令，根据所述标签修正指令中指定的标签进行噪声标签修正；

其中，所述类别预测向量中的向量元素是所述无标签样本分别被预测为每个类别的预测概率。

在上述模型训练方法的一个技术方案中，“根据所述类别预测向量进行噪声标签修正”的步骤具体包括：

直接将所述类别预测向量作为新的标签替换所述噪声标签，或者

对所述类别预测向量进行向量编码以形成类别标签向量并且将所述类别标签向量作为新的标签替换所述噪声标签。

在上述模型训练方法的一个技术方案中，所述预设的数据处理模型是利用所述有标签样本训练得到的；

“对初始训练集中的无标签样本进行噪声标签标注”的步骤具体包括：

利用所述预设的数据处理模型预测所述无标签样本的初始预测类别；

根据所述初始预测类别对所述无标签样本进行噪声标签标注。

第二方面，提供一种模型训练装置，所述装置包括：

训练集标注模块，其被配置成对初始训练集中的无标签样本进行噪声标签标注，以形成标注训练集，其中，所述标注训练集包括所述初始训练集中的有标签样本以及经所述噪声标签标注后的样本；

第一训练模块，其被配置成利用所述标注训练集对预设的数据处理模型进行训练，以获取初始的数据处理模型以及获取经所述初始的数据处理模型预测到的每个所述无标签样本的预测类别；

训练集修正模块，其被配置成根据所述预测类别对每一所述无标签样本相应的噪声标签进行修正，以形成标签修正后的训练集；

第二训练模块，其被配置成利用所述标签修正后的训练集对所述初始的数据处理模型进行训练，以获取最终的数据处理模型。

在上述模型训练装置的一个技术方案中，所述训练集修正模块被进一步配置成执行以下操作：

判断所述预测类别与所述噪声标签表示的类别是否相同；

若相同，则不修正所述噪声标签；

在上述模型训练装置的一个技术方案中，所述训练集修正模块包括第一特征参数获取单元、第二特征参数获取单元和第三特征参数获取单元；

所述第一特征参数获取单元被配置成获取所述预测类别对应的预测概率并且将所述预测概率作为所述无标签样本的特征参数；

所述第二特征参数获取单元被配置成执行以下操作：

获取所述初始的数据处理模型根据所述无标签样本输出的类别预测向量，其中，所述类别预测向量中的向量元素是所述无标签样本分别被预测为每个类别的预测概率；

所述第三特征参数获取单元被配置成执行以下操作：

从所述有标签样本中选取每个类别各自对应的代表样本；

在上述模型训练装置的一个技术方案中，所述训练集修正模块包括第一样本分类单元、第二样本分类单元和第三样本分类单元；

所述第一样本分类单元被配置成当所述特征参数是所述预测类别对应的预测概率时，若所述预测概率大于等于预设的概率阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本；

所述第二样本分类单元被配置成当所述特征参数是所述预测向量信息熵时，若所述预测向量信息熵小于等于预设的信息熵阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本；

所述第三样本分类单元被配置成当所述特征参数是所述平均相似性误差时，若所述平均相似性误差小于等于预设的误差阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本。

在上述模型训练装置的一个技术方案中，所述训练集修正模块包括第一修正单元和第二修正单元；

所述第一修正单元被配置成若所述无标签样本是简单样本，则获取所述初始的数据处理模型根据所述无标签样本输出的类别预测向量，根据所述类别预测向量进行噪声标签修正；

所述第二修正单元被配置成若所述无标签样本是难样本，则将所述无标签样本输出至预设的标签标注平台，并且响应于所述预设的标签标注平台根据所述无标签样本输出的标签修正指令，根据所述标签修正指令中指定的标签进行噪声标签修正；

在上述模型训练装置的一个技术方案中，所述第一修正单元被进一步配置成直接将所述类别预测向量作为新的标签替换所述噪声标签，或者对所述类别预测向量进行向量编码以形成类别标签向量并且将所述类别标签向量作为新的标签替换所述噪声标签。

在上述模型训练装置的一个技术方案中，所述预设的数据处理模型是利用所述有标签样本训练得到的；所述训练集标注模块被进一步配置成执行以下操作：

第三方面，提供一种控制装置，该控制装置包括处理器和存储装置，所述存储装置适于存储多条程序代码，所述程序代码适于由所述处理器加载并运行以执行上述模型训练方法的技术方案中任一项技术方案所述的模型训练方法。

第四方面，提供一种计算机可读存储介质，该计算机可读存储介质其中存储有多条程序代码，所述程序代码适于由处理器加载并运行以执行上述模型训练方法的技术方案中任一项技术方案所述的模型训练方法。

本发明上述一个或多个技术方案，至少具有如下一种或多种有益效果：

在实施本发明的技术方案中，训练集包括有标签样本(有标签的训练样本)和无标签样本(没有标签的训练样本)，可以先对每个无标签样本分别标注一个噪声标签(可能与样本的真实标签存在不同的标签)，形成标注训练集。然后利用这个标注训练集对预设的数据处理模型进行训练，获取初始的数据处理模型以及经这个初始的数据处理模型预测到的上述无标签样本的预测类别。进而，根据每个无标签样本的预测类别对相应的噪声标签进行修正，形成标签修正后的训练集。例如：如果预测类别与噪声标签表示的类别相同则不进行修正，如果预测类别与噪声标签表示的类别不同则将噪声标签修改为能够表示这个预测类别的标签。最后利用标签修正后的训练集对初始的数据处理模型进行训练，获取最终的数据处理模型。由于训练集内包含有标签样本，并且这些样本的标签都是正确的标签，那么在利用标注训练集对预设的数据处理模型进行训练后，初始的数据处理模型能够从这些有标签样本进行正确地样本类别学习，使其具备较好的样本分类能力，因此这个初始的数据处理模型预测到的无标签样本的预测类别，也是较为准确的预测结果。此时，再将这个预测类别与噪声标签进行比对，筛选出哪些是需要修正的噪声标签，只对这部分噪声标签修正即可，克服了现有技术中采用人工核查的方式逐一对每个训练样本进行标签核查，导致的费时费力以及容易发生漏检和错检的缺陷。

进一步，在实施本发明的技术方案中，在判断出无标签样本是简单样本后，可以获取初始的数据处理模型根据无标签样本输出的类别预测向量(类别预测向量中的向量元素是无标签样本分别被预测为每个类别的预测概率)，根据类别预测向量进行噪声标签修正。具体而言，可以直接将类别预测向量作为新的标签替换噪声标签，例如如果类别预测向量是[0.1 0.2 0.7]，则直接将“[0.1 0.2 0.7]”作为新的标签替换噪声标签。进一步，在利用无标签样本及其噪声标签对预设的数据处理模型进行训练时，会根据无标签样本的噪声标签以及预测结果(新的类别预测向量)进行模型损失计算，以便根据计算出的模型损失调整模型参数，以优化模型。然而，由于噪声标签中的向量元素是0-1之间的连续变量，不利于计算机设备在执行根据本发明实施例的模型训练方法时快速地进行模型损失计算，当对百万级别的样本进行分类学习时会显著降低分类学习(模型训练)的效率。对此，为了提高分类学习的效率，可以对类别预测向量进行向量编码以形成类别标签向量并且将类别标签向量作为新的标签替换噪声标签，例如如果类别预测向量是[0.1 0.2 0.7]，可以利用独热编码(One-Hot)技术将这个类别预测向量编码为[0 0 1]，将“[0 01]”作为新的标签替换噪声标签，即将噪声标签转换成0/1的二进制数，从而使计算机设备在执行根据本发明实施例的模型训练方法时能够快速地进行模型损失计算，提高模型训练效率。

附图说明

下面参照附图来描述本发明的具体实施方式，附图中：

图1是根据本发明的一个实施例的模型训练方法的主要步骤流程示意图；

图2是根据本发明的另一个实施例的模型训练方法的主要步骤流程示意图；

图3是根据本发明的一个实施例的模型训练装置的主要结构框图。

附图标记列表：

11：训练集标注模块；12：第一训练模块；13：训练集修正模块；14：第二训练模块。

具体实施方式

下面参照附图来描述本发明的一些实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非旨在限制本发明的保护范围。

在本发明的描述中，“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路，各种合适的感应器，通信端口，存储器，也可以包括软件部分，比如程序代码，也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质，比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合，比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似，可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。

目前传统的样本标签方法主要是利用人工标注的方式进行标签，而采用人工标注的方式对数量级较大的训练样本如百万级别的训练样本进行标签标注，很容易标注错误，如果利用这些标签错误的噪声样本进行模型训练，会降低模型的训练效果。但是，由于训练样本的数量级较大，如果继续采用人工核查的方式对训练样本进行核查，以筛选出噪声样本，不仅费时费力，还很容易发生漏检和错检。

在本发明实施例中，训练集包括有标签样本(有标签的训练样本)和无标签样本(没有标签的训练样本)，可以先对每个无标签样本分别标注一个噪声标签(可能与样本的真实标签存在不同的标签)，形成标注训练集。然后利用这个标注训练集对预设的数据处理模型进行训练，获取初始的数据处理模型以及经这个初始的数据处理模型预测到的上述无标签样本的预测类别。进而，根据每个无标签样本的预测类别对相应的噪声标签进行修正，形成标签修正后的训练集。例如：如果预测类别与噪声标签表示的类别相同则不进行修正，如果预测类别与噪声标签表示的类别不同则将噪声标签修改为能够表示这个预测类别的标签。最后利用标签修正后的训练集对初始的数据处理模型进行训练，获取最终的数据处理模型。在本实施例中由于训练集内包含有标签样本，并且这些样本的标签都是正确的标签，那么在利用标注训练集对预设的数据处理模型进行训练后，初始的数据处理模型能够从这些有标签样本进行正确地样本类别学习，使其具备较好的样本分类能力，因此这个初始的数据处理模型预测到的无标签样本的预测类别，也是较为准确的预测结果。此时，再将这个预测类别与噪声标签进行比对，筛选出哪些是需要修正的噪声标签，只对这部分噪声标签修正即可，克服了现有技术中采用人工核查的方式逐一对每个训练样本进行标签核查，导致的费时费力以及容易发生漏检和错检的缺陷。

参阅附图1，图1是根据本发明的一个实施例的模型训练方法的主要步骤流程示意图。如图1所示，本发明实施例中的模型训练方法主要包括以下步骤：

步骤S101：对初始训练集中的无标签样本进行噪声标签标注，以形成标注训练集，其中，标注训练集可以包括初始训练集中的有标签样本以及经噪声标签标注后的样本。

在本实施例中可以按照以下步骤11-步骤13对训练集中的无标签样本进行噪声标签标注。

步骤11：利用训练集中的有标签样本对数据处理模型进行训练得到训练好的数据处理模型(以下简称为预设的数据处理模型)。

在本发明实施例中可以采用机器学习技术领域中常规的分类算法构建上述数据处理模型。分类算法包括但不限于：基于XGBoost(eXtreme Gradient Boosting)算法的分类算法、基于支持向量机(Support Vector Machines，SVM)的分类算法、基于神经网络的分类算法等。为了描述简洁，在此不再对上述算法的具体工作原理与运算过程进行赘述。

此外，在本实施例中可以采用机器学习技术领域中常规的模型训练方法对上述数据处理模型进行训练，得到上述预设的数据处理模型。为了描述简洁，在此不再对模型训练方法的具体过程进行赘述。

步骤12：利用步骤11得到的上述预设的数据处理模型预测无标签样本的初始预测类别。由于上述预设的数据处理模型是利用有标签样本训练得到的，因而在训练过程中这个预设的数据处理模型能够根据每个有标签样本的类别标签进行样本类别学习，使其能够对输入的样本进行类别预测，预测出这个输入的样本到底属于哪一个类别，即得到这个输入的样本的初始预测类别。

步骤13：根据初始预测类别对无标签样本进行噪声标签标注，即设置能够表示初始预测类别的标签，将该标签作为噪声标签对无标签样本进行标注。一个例子：如果初始预测类别是机动车，那么可以设置能够表示机动车类别的标签[0 0 1]，将这个标签[0 0 1]作为噪声标签对无标签样本进行标注。

需要说明的是，虽然本发明实施例仅提供了上述步骤11-步骤13所述的这一种具体的噪声标签标注实施方式，但是，本领域技术人员可以根据实际需求采用其他的方式对无标签样本进行噪声标签标注，例如采用机器学习技术领域中的伪标签(Pseudo-Labelling)方法对无标签样本进行伪标签标注(噪声标签标注)。这些对噪声标签标注方式的更改或替换，均应落入本发明的保护范围之内。

步骤S102：利用标注训练集对预设的数据处理模型进行训练，以获取初始的数据处理模型以及获取经初始的数据处理模型预测到的每个无标签样本的预测类别。

预设的数据处理模型指的是，利用训练集中的有标签样本训练得到的数据处理模型，也即前述步骤11中训练得到的数据处理模型。

由于初始的数据处理模型是利用标注训练集中的有标签样本以及进行噪声标签标注后的样本训练得到的，因而在训练过程中这个初始的数据处理模型能够根据每个有标签样本的类别标签，以及每个无标签样本的噪声标签进行样本类别学习，使其能够对输入的样本进行类别预测，预测出这个输入的样本到底属于哪一个类别，即得到这个输入的样本的预测类别。

步骤S103：根据步骤S102预测到的预测类别对每个无标签样本相应的噪声标签进行修正，以形成标签修正后的训练集。具体而言，可以根据每个无标签样本各自对应的预测类别，分别对每个无标签样本各自对应的噪声标签进行修正。

在本实施例中可以根据预测类别与噪声标签表示的类别是否相同，决定是否对噪声标签进行修正。具体而言，如果预测类别与噪声标签表示的类别相同，则表示这个噪声标签是正确的标签，不需要对噪声标签进行修正。如果预测类别与噪声标签表示的类别不同，表示这个噪声标签可能是错误的标签，需要对噪声标签进行修正。例如：可以直接将噪声标签替换成能够表示预测类别的标签。

然而，在实际应用中，可能由于样本质量较差(例如：图像模糊的图像样本)，导致初始的数据处理模型中的特征提取模块无法准确地提取到样本的样本特征，进而在根据样本特征进行类别预测时，发生类别预测错误的问题。对此，为了克服这种缺陷，可以对“预测类别与噪声标签表示的类别不同”的无标签样本进行难易样本分类，如果分类出是简单样本，那么就直接将噪声标签替换成能够表示预测类别的标签。如果分类出是难样本，那么就将这个无标签样本输入到预设的标签标注平台，通过这个预设的标签标注平台进行样本类别分析，然后接收这个预设的标签标注平台反馈的标签修正指令，获取标签修正指令中指定的标签，将噪声标签替换成这个标签，完成噪声标签修正。具体而言，在一个实施方式中可以按照以下步骤步21-步骤22对“预测类别与噪声标签表示的类别不同”的无标签样本进行难易样本分类：

步骤21：获取无标签样本的特征参数。

无标签样本的特征参数指的是，能够反映出经初始的数据处理模型预测到的无标签样本的预测类别与这个无标签样本的真实类别一致的可信程度的参数，即特征参数的大小表示了无标签样本的预测类别与这个无标签样本的真实类别一致的可信程度的大小。如果可信程度越大，则表示这个预测类别越可信，相应的无标签样本可以被分类为简单样本。如果可信程度越小，则表示这个预测类别越不可信，相应的无标签样本可以被分类为难样本。

在本实施方式中无标签样本的特征参数可以包括三种类型的特征参数，根据任意一种类型的特征参数都可以对无标签样本进行难易样本分类。下面分别对这三种类型的特征参数进行具体介绍。

特征参数一

由前述内容可知，本实施例中用于训练以获取初始的数据处理模型的数据处理模型是采用机器学习技术领域中常规的分类算法构建的模型，因而初始的数据处理模型的输出结果可以包括每个类别各自对应的预测概率，根据这个预测概率就可以得到输入样本的预测类别。一个例子：如果将无标签样本a输入到初始的数据处理模型，初始的数据处理模的输出结果可以是类别预测向量[0.1 0.2 0.7]，其中，0.1、0.2和0.7分别表示类别A、类别B和类别C各自对应的预测概率，由于类别C的预测概率最大，因而可以确定无标签样本a的预测类别是类别C。如果初始的数据处理模型输出的预测类别对应的预测概率越大，则表明这个预测类别的可信程度越大，因而可以将初始的数据处理模型输出的预测类别对应的预测概率作为无标签样本的特征参数。

在根据预测类别对应的预测概率进行难易样本分类时，可以按照以下步骤进行分类：若预测概率大于等于预设的概率阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。

预设的概率阈值指的是在对初始的数据处理模型进行模型训练之后利用验证集对该模型进行模型验证得到的概率值，这个概率能够表示初始的数据处理模型预测到的样本类别的可信程度。需要说明的是，在本实施方式中可以利用机器学习技术领域中常规的模型验证方法对全局行为识别模型进行模型验证，为了描述简洁，在此不再赘述。

特征参数二

参阅“特征参数一”的描述可知，初始的数据处理模型的输出结果可以是类别预测向量(类别预测向量中的向量元素是无标签样本分别被预测为每个类别的预测概率)，可以通过计算类别预测向量的信息熵(information entropy)，将这个信息熵作为无标签样本的特征参数进行难易样本分类。如果信息熵越小，则表明类别预测向量中信息复杂程度越小(干扰信息越少)，进而表明根据这个类别预测向量确出的预测类别的可信程度越大，因而可以将类别预测向量的信息熵作为无标签样本的特征参数。在本实施例中可以按照以下公式(1)所示的方法计算类别预测向量的预测向量信息熵：

公式(1)中各参数含义如下：

H表示预测向量信息熵，p_i表示无标签样本被预测为每i个类别的预测概率且i＝1，...，n，n表示类别总数。

在根据预测向量信息熵进行难易样本分类时，可以按照以下步骤进行分类：若预测向量信息熵小于等于预设的信息熵阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。

预设的信息熵阈值指的是在对初始的数据处理模型进行模型训练之后利用验证集对该模型进行模型验证得到的信息熵，这个信息熵能够表示初始的数据处理模型预测到的样本类别的可信程度。需要说明的是，在本实施方式中可以利用机器学习技术领域中常规的模型验证方法对全局行为识别模型进行模型验证，为了描述简洁，在此不再赘述。

特征参数三

在预测到无标签样本的预测类别后，可以对无标签样本的特征向量与属于这个预测类别的样本的特征向量进行比对，根据比对结果分析这个预测类别的可信程度。如果“无标签样本的特征向量”与“属于这个预测类别的样本的特征向量”之间的误差越小，则表明这个预测类别的可信程度越大，因而可以将“无标签样本的特征向量”与“属于这个预测类别的样本的特征向量”之间的误差作为无标签样本的特征参数。具体而言，在本实施例中可以按照以下步骤31-步骤33获取“无标签样本的特征向量”与“属于这个预测类别的样本的特征向量”之间的误差。

步骤31：从有标签样本中选取每个类别各自对应的代表样本。

一个类别对应的代表样本指的是，能够表示在这个类别的不同维度下的样本。例如：如果样本类别是机动车，那么机动车类别的代表样本可以包括：夜晚环境下的机动车图像样本、白天环境下的机动车图像样本、前向行驶的机动车图像样本、后向行驶的机动车图像样本、转弯的机动车图像样本等等。

步骤32：在利用标注训练集对预设的数据处理模型进行训练时，获取初始的数据处理模型中的特征提取模块提取到的每个代表样本各自对应的第一特征向量，以及无标签样本的第二特征向量。

需要说明的是，本实施例中可以采用机器学习技术领域中常规的模型结构构建初始的数据处理模型中的特征提取模块，而特征提取模块提取到的特征向量的具体形式，也取决于特征提取模块的具体结构。例如：特征向量可以是N行M列的向量，每个向量元素表示图像样本中每个像素点的像素值。本领域技术人员可以根据实际需求设定特征提取模块的具体结构，对特征提取模块的结构以及特征向量的具体形式的更改或替换都将落入本发明的保护范围之内。

步骤33：根据预测类别对应的代表样本的第一特征向量以及第二特征向量，并且按照下式(2)所示的方法计算无标签样本与预测类别对应的代表样本之间的平均相似性误差，以将平均相似性误差作为无标签样本的特征参数：

公式(2)中各参数含义如下：

err_i表示当预测类别是第i个类别时，无标签样本与第i个类别的代表样本之间的平均相似性误差；err_{i_j}表示无标签样本与第i个类别对应的第j个代表样本之间的相似性误差且j＝1，...，m，m表示第i个类别的代表样本的总数。

在根据预测类别对应的预测概率进行难易样本分类时，可以按照以下步骤进行分类：若平均相似性误差小于等于预设的误差阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。

预设的误差阈值指的是在对初始的数据处理模型进行模型训练之后利用验证集对该模型进行模型验证得到的误差阈值，这个误差阈值能够表示初始的数据处理模型预测到的样本类别的可信程度。需要说明的是，在本实施方式中可以利用机器学习技术领域中常规的模型验证方法对全局行为识别模型进行模型验证，为了描述简洁，在此不再赘述。

步骤22：根据特征参数对无标签样本进行难易样本分类。

在本实施例中可以根据特征参数的类型采用不同的分类方式对无标签样本进行难易样本分类，具体的分类方式可以参阅前述特征参数一、特征参数二和特征参数三中描述的分类方式。

在通过上述步骤21-步骤22对无标签样本进行难易样本分类以后，可以按照以下步骤分别对简单样本与难样本的噪声标签进行修正。

1、简单样本

若无标签样本是简单样本，则可以获取初始的数据处理模型根据无标签样本输出的类别预测向量，根据类别预测向量进行噪声标签修正。一个实施方式中，可以直接将类别预测向量作为新的标签替换噪声标签，例如如果类别预测向量是[0.1 0.2 0.7]，则直接将“[0.1 0.2 0.7]”作为新的标签替换噪声标签。一个实施方式中，可以对类别预测向量进行向量编码以形成类别标签向量并且将类别标签向量作为新的标签替换噪声标签，例如如果类别预测向量是[0.1 0.2 0.7]，则可以利用独热编码(One-Hot)将这个类别预测向量编码为[0 0 1]，将“[0 0 1]”作为新的标签替换噪声标签。

2、难样本

若无标签样本是难样本，则将无标签样本输出至预设的标签标注平台，并且响应于预设的标签标注平台根据无标签样本输出的标签修正指令，根据标签修正指令中指定的标签进行噪声标签修正。

预设的标签标注平台指的是，能够对接收到的样本进行分类、根据分类的结果设置并输出相应的类别标签的平台。一个实施方式中，预设的标签标注平台可以包括人机交互模块，标签标注平台在接收到样本后可以通过人机交互模块进行显示，以便技术人员根据显示的内容分析这个样本属于哪个类别。同时，标签标注平台还可以通过人机交互模型接收技术人员录入的类别标签，根据这个类别标签生成标签修正指令。

在通过上述步骤S101-步骤S103得到标签修正后的训练集之后，可以利用标签修正后的训练集对初始的数据处理模型进行训练，以获取最终的数据处理模型(步骤S104)。

参阅附图2，图2是根据本发明的另一个实施例的模型训练方法，在本实施例中，该模型训练方法可以包括步骤S201-步骤S210。

步骤S201：利用初始训练集中有标签样本训练得到预设的数据处理模型。

步骤S202：利用预设的数据处理模型预测训练集中无标签样本的初始预测类别。

步骤S203：根据初始预测类别对无标签样本进行噪声标签标注，形成标注训练集，其中，标注训练集可以包括初始训练集中的有标签样本以及经噪声标签标注后的样本。

步骤S204：利用标注训练集对预设的数据处理模型进行训练，以获取初始的数据处理模型以及获取经初始的数据处理模型预测到的每个无标签样本的新的预测类别。

步骤S205：判断所述新的预测类别与噪声标签表示的类别是否相同。如果没有任何一个新的预测类别与噪声标签表示的类别不相同，则转至步骤S210；若某个新的预测类别与噪声标签表示的类别不相同，则转至步骤S206。

步骤S206：获取无标签样本的特征参数。

步骤S207：根据特征参数对无标签样本进行难易样本分类，以及根据难易样本分类的结果采用相应的修正方式进行噪声标签修正。

步骤S208：获取标签修正后的训练集。

步骤S209：利用标签修正后的训练集对初始的数据处理模型进行训练，以获取最终的数据处理模型。

步骤S210：不修正噪声标签。

上述步骤S201-步骤S210中涉及各个术语比如训练集、特征参数、预测类别、噪声标签等等均与前述步骤S101-步骤S104中描述的相关术语含义相同，为了描述简洁，在此不再赘述。

需要指出的是，尽管上述实施例中将各个步骤按照特定的先后顺序进行了描述，但是本领域技术人员可以理解，为了实现本发明的效果，不同的步骤之间并非必须按照这样的顺序执行，其可以同时(并行)执行或以其他顺序执行，这些变化都在本发明的保护范围之内。

进一步，本发明还提供了一种模型训练装置。

参阅附图3，图3是根据本发明的一个实施例的模型训练装置的主要结构框图。如图3所示，本发明实施例中的模型训练装置主要包括训练集标注模块11、第一训练模块12、训练集修正模块13和第二训练模块14。在一些实施例中，训练集标注模块11、第一训练模块12、训练集修正模块13和第二训练模块14中的一个或多个可以合并在一起成为一个模块。在一些实施例中，训练集标注模块11可以被配置成对初始训练集中的无标签样本进行噪声标签标注，以形成标注训练集，其中，标注训练集包括初始训练集中的有标签样本以及经噪声标签标注后的样本；第一训练模块12可以被配置成利用标注训练集对预设的数据处理模型进行训练，以获取初始的数据处理模型以及获取经初始的数据处理模型预测到的每个无标签样本的预测类别；训练集修正模块13可以被配置成根据预测类别对相应的噪声标签进行修正，以形成标签修正后的训练集；第二训练模块14可以被配置成利用标签修正后的训练集对初始的数据处理模型进行训练，以获取最终的数据处理模型。一个实施方式中，具体实现功能的描述可以参见步骤S101-步骤S104所述。

在一个实施方式中，预设的数据处理模型是利用初始训练集中的有标签样本训练得到的；训练集标注模块11可以被进一步配置成执行以下操作：利用预设的数据处理模型预测无标签样本的初始预测类别；根据初始预测类别对无标签样本进行噪声标签标注。一个实施方式中，具体实现功能的描述可以参见步骤S101所述。

在一个实施方式中，训练集修正模块13可以被进一步配置成执行以下操作：判断预测类别与噪声标签表示的类别是否相同；若相同，则不修正噪声标签；若不同，则获取无标签样本的特征参数，并根据特征参数对无标签样本进行难易样本分类，以及根据难易样本分类的结果采用相应的修正方式进行噪声标签修正。一个实施方式中，具体实现功能的描述可以参见步骤S103所述。

在一个实施方式中，训练集修正模块13可以包括第一特征参数获取单元、第二特征参数获取单元和第三特征参数获取单元。

第一特征参数获取单元可以被配置成获取预测类别对应的预测概率并且将预测概率作为无标签样本的特征参数。

第二特征参数获取单元可以被配置成执行以下操作：获取初始的数据处理模型根据无标签样本输出的类别预测向量，其中，类别预测向量中的向量元素是无标签样本分别被预测为每个类别的预测概率；根据每个类别的预测概率并且按照公式(1)所示的方法计算预测向量信息熵，并且将预测向量信息熵作为无标签样本的特征参数。

第三特征参数获取单元可以被配置成执行以下操作：

从有标签样本中选取每个类别各自对应的代表样本；在利用标注训练集对预设的数据处理模型进行训练时，获取初始的数据处理模型中的特征提取模块提取到的每个代表样本各自对应的第一特征向量，以及无标签样本的第二特征向量；根据预测类别对应的代表样本的第一特征向量以及第二特征向量，并且按照公式(2)所示的方法计算无标签样本与预测类别对应的代表样本之间的平均相似性误差，以将平均相似性误差作为无标签样本的特征参数。一个实施方式中，具体实现功能的描述可以参见步骤S103所述。

在一个实施方式中，训练集修正模块13可以包括第一样本分类单元、第二样本分类单元和第三样本分类单元。

第一样本分类单元可以被配置成当特征参数是预测类别对应的预测概率时，若预测概率大于等于预设的概率阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。

第二样本分类单元可以被配置成当特征参数是预测向量信息熵时，若预测向量信息熵小于等于预设的信息熵阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。

第三样本分类单元可以被配置成当特征参数是平均相似性误差时，若平均相似性误差小于等于预设的误差阈值，则判定无标签样本是简单样本；否则，判定无标签样本是难样本。一个实施方式中，具体实现功能的描述可以参见步骤S103所述。

在一个实施方式中，训练集修正模块13可以包括第一修正单元和第二修正单元。

第一修正单元可以被配置成若无标签样本是简单样本，则获取初始的数据处理模型根据无标签样本输出的类别预测向量，根据类别预测向量进行噪声标签修正。其中，类别预测向量中的向量元素是无标签样本分别被预测为每个类别的预测概率。

第二修正单元可以被配置成若无标签样本是难样本，则将无标签样本输出至预设的标签标注平台，并且响应于预设的标签标注平台根据无标签样本输出的标签修正指令，根据标签修正指令中指定的标签进行噪声标签修正。一个实施方式中，具体实现功能的描述可以参见步骤S103所述。

在一个实施方式中，第一修正单元可以被进一步配置成直接将类别预测向量作为新的标签替换噪声标签，或者对类别预测向量进行向量编码以形成类别标签向量并且将类别标签向量作为新的标签替换噪声标签。一个实施方式中，具体实现功能的描述可以参见步骤S103所述。

上述模型训练装置以用于执行图-2所示的模型训练方法实施例，两者的技术原理、所解决的技术问题及产生的技术效果相似，本技术领域技术人员可以清楚地了解到，为了描述的方便和简洁，模型训练装置的具体工作过程及有关说明，可以参考模型训练方法的实施例所描述的内容，此处不再赘述。

本领域技术人员能够理解的是，本发明实现上述一实施例的方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

进一步，本发明还提供了一种计算机可读存储介质。在根据本发明的一个计算机可读存储介质实施例中，计算机可读存储介质可以被配置成存储执行上述方法实施例的模型训练方法的程序，该程序可以由处理器加载并运行以实现上述模型训练方法。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该计算机可读存储介质可以是包括各种电子设备形成的存储装置设备，可选的，本发明实施例中计算机可读存储介质是非暂时性的计算机可读存储介质。

进一步，本发明还提供了一种控制装置。在根据本发明的一个控制装置实施例中，控制装置包括处理器和存储装置，存储装置可以被配置成存储执行上述方法实施例的模型训练方法的程序，处理器可以被配置成用于执行存储装置中的程序，该程序包括但不限于执行上述方法实施例的模型训练方法的程序。为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该控制装置可以是包括各种电子设备形成的控制装置设备。

进一步，应该理解的是，由于各个模块的设定仅仅是为了说明本发明的系统的功能单元，这些模块对应的物理器件可以是处理器本身，或者处理器中软件的一部分，硬件的一部分，或者软件和硬件结合的一部分。因此，图中的各个模块的数量仅仅是示意性的。

本领域技术人员能够理解的是，可以对系统中的各个模块进行适应性地拆分或合并。对具体模块的这种拆分或合并并不会导致技术方案偏离本发明的原理，因此，拆分或合并之后的技术方案都将落入本发明的保护范围内。

至此，已经结合附图所示的一个实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于，“根据所述预测类别对每一所述无标签样本相应的噪声标签进行修正”的步骤具体包括：

判断所述预测类别与所述噪声标签表示的类别是否相同；

若相同，则不修正所述噪声标签；

3.根据权利要求2所述的模型训练方法，其特征在于，“获取所述无标签样本的特征参数”的步骤具体包括：

或者，

或者，

从所述有标签样本中选取每个类别各自对应的代表样本；

4.根据权利要求3所述的模型训练方法，其特征在于，“根据所述特征参数对所述无标签样本进行难易样本分类”的步骤具体包括：

或者，

当所述特征参数是所述预测向量信息熵时，若所述预测向量信息熵小于等于预设的信息熵阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本；

或者，

当所述特征参数是所述平均相似性误差时，若所述平均相似性误差小于等于预设的误差阈值，则判定所述无标签样本是简单样本；否则，判定所述无标签样本是难样本。

5.根据权利要求2所述的模型训练方法，其特征在于，“根据所述难易样本分类的结果采用相应的修正方式进行噪声标签修正”的步骤具体包括：

6.根据权利要求5所述的模型训练方法，其特征在于，“根据所述类别预测向量进行噪声标签修正”的步骤具体包括：

7.根据权利要求1至6中任一项所述的模型训练方法，其特征在于，所述预设的数据处理模型是利用所述有标签样本训练得到的；

8.一种模型训练装置，其特征在于，所述装置包括：

9.根据权利要求8所述的模型训练装置，其特征在于，所述训练集修正模块被进一步配置成执行以下操作：

判断所述预测类别与所述噪声标签表示的类别是否相同；

若相同，则不修正所述噪声标签；

10.根据权利要求9所述的模型训练装置，其特征在于，所述训练集修正模块包括第一特征参数获取单元、第二特征参数获取单元和第三特征参数获取单元；

所述第二特征参数获取单元被配置成执行以下操作：

所述第三特征参数获取单元被配置成执行以下操作：

从所述有标签样本中选取每个类别各自对应的代表样本；

11.根据权利要求10所述的模型训练装置，其特征在于，所述训练集修正模块包括第一样本分类单元、第二样本分类单元和第三样本分类单元；

12.根据权利要求9所述的模型训练装置，其特征在于，所述训练集修正模块包括第一修正单元和第二修正单元；

13.根据权利要求12所述的模型训练装置，其特征在于，所述第一修正单元被进一步配置成直接将所述类别预测向量作为新的标签替换所述噪声标签，或者对所述类别预测向量进行向量编码以形成类别标签向量并且将所述类别标签向量作为新的标签替换所述噪声标签。

14.根据权利要求8至13中任一项所述的模型训练装置，其特征在于，所述预设的数据处理模型是利用所述有标签样本训练得到的；所述训练集标注模块被进一步配置成执行以下操作：

15.一种控制装置，包括处理器和存储装置，所述存储装置适于存储多条程序代码，其特征在于，所述程序代码适于由所述处理器加载并运行以执行权利要求1至7中任一项所述的模型训练方法。

16.一种计算机可读存储介质，其中存储有多条程序代码，其特征在于，所述程序代码适于由处理器加载并运行以执行权利要求1至7中任一项所述的模型训练方法。