CN113420849B

CN113420849B - 基于主动学习的模型在线增量训练方法、设备及介质

Info

Publication number: CN113420849B
Application number: CN202110978408.6A
Authority: CN
Inventors: 冯建设; 花霖; 陈军; 刘桂芬; 姚琪; 周雷; 欧馨; 王宗强; 赵一波; 许琦枫
Original assignee: Shenzhen Xinrun Fulian Digital Technology Co Ltd
Current assignee: Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority date: 2021-08-25
Filing date: 2021-08-25
Publication date: 2021-11-30
Anticipated expiration: 2041-08-25
Also published as: CN113420849A

Abstract

本申请公开了一种基于主动学习的模型在线增量训练方法、设备及介质，所述基于主动学习的模型在线增量训练方法包括：获取待预测无标签样本，通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述预测分类结果对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的，若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本，基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型。本申请解决因人工标注无标签样本工作量大，导致模型更新训练效率低的技术问题。

Description

基于主动学习的模型在线增量训练方法、设备及介质

技术领域

本申请涉及机器学习技术领域，尤其涉及一种基于主动学习的模型在线增量训练方法、设备及介质。

背景技术

随着工业制造大数据技术的发展，在工业制造过程中，存在大量的无标签数据，而数据驱动的PHM（Prognostic and Health Management ，故障预测与健康管理）模型的训练需要足够丰富的有标签样本，进一步地，当模型部署上线之后，模型更新往往是需要利用新收集的有标签数据对模型进行定期离线更新训练，导致存在大量的无标签样本无法被有效地利用的情况，可通过对无标签样本进行人工标记，从而对模型进行更新训练，然而，人工标注工作量大，需要较长的时间成本，进而导致模型更新训练的效率较低。

发明内容

本申请的主要目的在于提供一种基于主动学习的模型在线增量训练方法、设备及介质，旨在解决现有技术中的因人工标注无标签样本工作量大，导致模型训练更新效率低的技术问题。

为实现上述目的，本申请提供一种基于主动学习的模型在线增量训练方法，所述基于主动学习的模型在线增量训练方法包括：

获取待预测无标签样本；

通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述待预测无标签样本对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的；

若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本；

基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型。

可选地，所述若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本的步骤包括：

若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本；

对所述关键待标注样本进行人工标注，获得所述增量训练样本。

可选地，所述若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本的步骤包括：

获取在预设时间窗长内的各已预测样本对应的预测分类结果；

分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差；

基于所述均值和所述标准差，若所述置信度大于所述均值和所述标准差之间的运算结果，则将所述待预测无标签样本设置为所述关键待标注样本。

可选地，所述基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型的步骤包括：

基于所述增量训练样本，利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布；

基于所述参数后验概率分布，对所述故障检测分类模型进行在线增量更新，获得所述更新后的故障检测分类模型。

可选地，在所述通过故障检测分类模型对所述待预测无标签样本集进行预测，获得预测分类结果，并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前，所述基于主动学习的模型在线增量训练方法还包括：

获取待训练分类模型；

通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型。

可选地，所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型的步骤包括：

将所述有标签样本集输入所述待训练分类模型，输出所述有标签样本集中各有标签样本分别对应的分类结果；

基于各所述有标签样本分别对应的标签和所述分类结果，计算所述待训练分类模型对应的模型损失；

基于所述模型损失，对所述待训练分类模型进行迭代训练，获得所述故障检测分类模型。

本申请还提供一种基于主动学习的模型在线增量训练装置，所述基于主动学习的模型在线增量训练装置为虚拟装置，所述基于主动学习的模型在线增量训练装置包括：

获取模块，用于获取待预测无标签样本；

预测模块，用于通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述待预测无标签样本对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的；

构建模块，用于若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本；

在线更新模块，用于基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型。

本申请还提供一种基于主动学习的模型在线增量训练设备，所述基于主动学习的模型在线增量训练设备为实体设备，所述基于主动学习的模型在线增量训练设备包括：存储器、处理器以及存储在所述存储器上的基于主动学习的模型在线增量训练程序，所述基于主动学习的模型在线增量训练程序被所述处理器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。

本申请还提供一种介质，所述介质为可读存储介质，所述可读存储介质上存储基于主动学习的模型在线增量训练程序，所述基于主动学习的模型在线增量训练程序被处理器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。

本申请还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述的基于主动学习的模型在线增量训练方法的步骤。

本申请提供了一种基于主动学习的模型在线增量训练方法、设备及介质，相比于现有技术采用的通过对大量待预测无标签样本进行人工标注以对模型进行更新训练的技术手段，本申请首先获取待预测无标签样本，进而通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述预测分类结果对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的，进一步地，若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本，进而实现基于所述置信度，有选择性进行选取置信度高的待预测无标签样本以对模型进行更新训练的目的，进一步地，基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型，实现了通过模型主动学习待预测无标签样本，进而将在线的待预测无标签样本构建成增量训练样本，从而对所述故障检测分类模型进行在线更新，既充分地利用了海量的无标签样本，又能实时地通过在线的无标签样本对模型进行更新训练，延长了模型的生命周期，克服了现有技术中大量的无标签样本无法被有效地利用的情况，以及通过对无标签样本进行人工标记以对模型进行更新训练的方法工作量大，需要较长的时间成本，进而导致模型更新训练的效率较低的技术缺陷，从而提高了模型更新训练的效率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域默认技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请基于主动学习的模型在线增量训练方法第一实施例的流程示意图；

图2为本申请基于主动学习的模型在线增量训练方法第二实施例的流程示意图；

图3为本申请基于主动学习的模型在线增量训练方法第三实施例的流程示意图；

图4为本申请实施例中基于主动学习的模型在线增量训练方法涉及的硬件运行环境的基于主动学习的模型在线增量训练设备结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种基于主动学习的模型在线增量训练方法，在本申请基于主动学习的模型在线增量训练方法的第一实施例中，参照图1，所述基于主动学习的模型在线增量训练方法包括：

步骤S10，获取待预测无标签样本；

在本实施例中，需要说明的是，在模型部署上线后，可实时检测到系统上的在线流式数据，也即，可以实时获取所述待预测无标签样本。

获取待预测无标签样本，具体地，将实时检测到的数据作为所述待预测无标签样本，以通过所述故障检测分类模型对实时获取的待预测无标签样本进行预测。

步骤S20，通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述待预测无标签样本对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的；

在本实施例中，需要说明的是，所述故障检测分类模型为在离线状态下预先收集的有标签样本集进行训练得到的，待训练完成后，将所述故障检测分类模型部署上线运行。

通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述预测分类结果对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的，具体地，首先，预先收集有标签样本集，进而将所述有标签样本集输入待训练分类模型中，以优化所述待训练分类模型，并判断所述优化后的待训练分类模型是否满足预设训练结束条件，其中，所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件，若不满足，则返回执行步骤：将所述有标签样本集输入待训练分类模型中，以优化所述待训练分类模型，若满足，则获得所述故障检测分类模型，进而将所述故障检测分类模型部署上线，进一步地，通过已上线运行的故障检测分类模型对实时监测到的待预测无标签样本进行预测，输出所述预测分类结果，进而根据所述预测分类结果，确定所述预测分类结果对应的置信度，以根据置信度进行下一步的训练样本的选取。

其中，在所述通过故障检测分类模型对待预测无标签样本集进行预测，获得所述待预测无标签样本集中的各个样本对应的预测分类结果，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前，所述基于主动学习的模型在线增量训练方法还包括：

步骤A10，获取待训练分类模型；

步骤A20，通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型。

在本实施例，通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型，具体地，将所述有标签样本集输入所述待训练分类模型中，执行模型预测，获得模型输出标签，进而计算所述模型输出标签与所述有标签样本集各样本对应的标签之间的差值，获得模型损失，进而基于所述模型损失，优化所述待训练分类模型，并判断所述优化后的待训练分类模型是否满足预设训练结束条件，其中，所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件，若不满足，则返回执行步骤：将所述有标签样本集输入待训练分类模型中，以优化所述待训练分类模型，若满足，则获得所述故障检测分类模型，进而将所述故障检测分类模型部署上线。

其中，所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型的步骤包括：

步骤A21，将所述有标签样本集输入所述待训练分类模型，输出所述有标签样本集中各有标签样本分别对应的分类结果；

在本实施例中，将所述有标签样本集输入所述待训练分类模型，输出所述有标签样本集中各有标签样本分别对应的分类结果，具体地，通过所述待训练分类模型对所述有标签样本集中各所述有标签样本进行分类预测，获得各有标签样本分别对应的分类结果。

步骤A22，基于各所述有标签样本分别对应的标签和所述分类结果，计算所述待训练分类模型对应的模型损失；

在本实施例中，基于各所述有标签样本分别对应的标签和所述分类结果，计算所述待训练分类模型对应的模型损失，具体地，基于各所述有标签样本分别对应的标签与所述分类结果之间的差异度，通过预设损失函数计算所述模型损失。

步骤A23，基于所述模型损失，对所述待训练分类模型进行迭代训练，获得所述故障检测分类模型。

在本实施例中，基于所述模型损失，对所述待训练分类模型进行迭代训练，获得所述故障检测分类模型，具体地，基于所述模型损失，计算所述模型损失的梯度，进而对所述待训练分类模型进行迭代训练，获得所述故障检测分类模型。

步骤S30，若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本；

在本实施例中，需要说明的是，所述置信度阈值为在所述待预测无标签样本进行预测对应的时刻之前，且在预设时间窗长内的各已预测样本的预测分类结果对应的均值以及标准差之间的运算结果，由于在工业制造过程中会产生大量的待预测无标签样本，对全部待预测无标签样本进行标注工作量过大，因此，需要对每一所述待预测无标签样本对应的置信度进行判断，从而筛选出置信度满足的待预测无标签样本，既充分利用了大量的待预测无标签样本，又减少了后续标注的工作量。

若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本，具体地，基于所述置信度，筛选所述置信度大于所述置信度阈值所对应的待预测无标签样本，当所述置信度大于所述置信度阈值，即可说明模型无法对所述待预测无标签样本作出精准的预测输出，进而将所述待预测无标签样本作为关键待标签样本，以对所述关键待标签样本进行标注，并将标注后的样本作为所述增量训练样本，进一步地，若所述置信度不满足置信度阈值条件，则剔除所述待预测无标签样本，进而获取新的待预测无标签样本，以通过所述故障检测分类模型对所述新的待预测无标签样本进行新一轮的预测，例如，样本x进行标注后的标签为y，二者（x，y）构成所述增量训练样本，以用来实现下一步模型的增量更新。

步骤S40，基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型。

在本实施例中，基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型，具体地，基于所述增量训练样本，将所述增量训练样本输入所述故障检测分类模型，利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布，进而对所述故障检测分类模型对应的参数进行在线增量更新，获得更新后的故障检测分类模型，实现所述故障检测分类模型进行在线更新，进而利用所述更新后的故障检测分类模型实时对待预测无标签样本进行下一轮的预测分类。

本申请实施例提供了一种基于主动学习的模型在线增量训练方法，相比于现有技术采用的通过对大量待预测无标签样本进行人工标注以对模型进行更新训练的技术手段，本申请实施例首先获取待预测无标签样本，进而通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述预测分类结果对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的，进一步地，若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本，进而实现基于所述置信度，有选择性进行选取置信度高的待预测无标签样本以对模型进行更新训练的目的，进而基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型，实现了通过模型主动学习待预测无标签样本，进而将在线的待预测无标签样本构建成增量训练样本，从而对所述故障检测分类模型进行在线更新，既充分地利用了海量的无标签样本，又能实时地通过在线的无标签样本对模型进行更新训练，延长了模型的生命周期，克服了现有技术中大量的无标签样本无法被有效地利用的情况，以及通过对无标签样本进行人工标记以对模型进行更新训练的方法工作量大，需要较长的时间成本，进而导致模型更新训练的效率较低的技术缺陷，从而提高了模型更新训练的效率。

进一步地，参照图2，基于本申请中第一实施例，在本申请的另一实施例中，所述若满足，则将所述置信度对应的待预测无标签样本构建成所述增量训练样本的步骤包括：

步骤B10，若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本；

在本实施例中，若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本，具体地，获取在预设时间窗长内的各已预测样本对应的预测分类结果，进而计算各所述已预测样本对应的预测分类结果的均值，并计算各所述已预测样本对应的预测分类结果的标准差，进一步地，比较所述置信度与所述均值和所述标准差之间的运算结果，若所述置信度大于所述运算结果，则输出所述置信度对应的待预测无标签样本，进而将所述待预测无标签样本设置为关键待标注样本，以对所述关键待标注样本进行人工标注。

其中，所述若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本的步骤包括：

步骤B11，获取在预设时间窗长内的各已预测样本对应的预测分类结果；

在本实施例中，需要说明的是，各所述已预测样本为在所述待预测无标签样本进行预测对应的时刻之前且在所述预设时间窗长内的各样本，所述预设时间窗长为预先设置的时长。

获取在预设时间窗长内的各已预测样本对应的预测分类结果，具体地，通过设置一个预设时间窗长，以所述待预测无标签样本进行预测对应的时刻为基准，获取在预设时间窗长内的各已预测样本对应的预测分类结果，例如，所述待预测无标签样本对应的时刻为t,所述预设时间窗长为T，则获取在t时刻之前，且在预设时间窗长T内的各样本对应的预测分类结果。

步骤B12，分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差；

在本实施例中，分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差，具体地，基于各所述已预测样本对应的预测分类结果，计算各所述已预测样本对应的预测分类结果对应的均值以及各所述已预测样本对应的预测分类结果的标准差。

步骤B13，基于所述均值和所述标准差，若所述置信度大于所述均值和所述标准差之间的运算结果，则将所述待预测无标签样本设置为所述关键待标注样本。

在本实施例中，基于所述均值和所述标准差，若所述置信度大于所述均值和所述标准差之间的运算结果，则将所述待预测无标签样本设置为所述关键待标注样本，具体地，基于所述均值和所述标准差，将所述待预测无标签样本对应的置信度与所述均值和所述标准差之间的运算结果进行比较，若所述置信度大于所述运算结果，则将所述待预测无标签样本设置为所述关键待标注样本，例如，若当前时刻t的待预测无标签样本

对应的置信度为

，预设时间窗长为T，各所述已预测样本如下：

各所述已预测样本对应的预测分类结果为：

进而比较所述置信度与所述均值和所述标准差之间的运算结果，也即：

其中，mean表示计算均值，std表示计算标准差，进一步地，当所述置信度大于所述运算结果时，则将所述待预测无标签样本设置为所述关键待标注样本。

步骤B20，对所述关键待标注样本进行人工标注，获得所述增量训练样本。

在本实施例，需要说明的是，所述增量训练样本为用于所述故障检测分类模型进行增量更新的样本的。

对所述关键待标注样本进行人工标注，获得所述增量训练样本，具体地，通过业务专家经验对所述关键待标注样本进行人工标注，获得所述关键待标注样本对应的标签，进而将所述关键待标注样本和所述关键待标注样本对应的标签构建成所述增量训练样本，例如，样本x进行标准后的标签为y二者构成增量训练样本为（x，y），以实现下一步模型的增量更新。

本申请实施例提供了一种基于主动学习的模型在线增量训练方法，也即，若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本，进而对所述关键待标注样本进行人工标注，获得所述增量训练样本，实现了将通过训练好的故障检测分类模型部署上线，根据实时在线获取待预测无标签样本对应的置信度，选取满足条件的待预测无标签样本进行人工标注标签，充分地主动学习了海量的待预测无标签样本，以对所述故障检测分类模型进行更新，为克服现有技术中大量的待预测无标签样本无法被有效地利用的情况，而通过对待预测无标签样本进行人工标记以对模型进行更新训练的工作量大，需要较长的时间成本，进而导致模型更新训练的效率较低的技术缺陷奠定了基础。

进一步地，参照图3，基于本申请中第一实施例，在本申请的另一实施例中，所述基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型的步骤包括：

步骤C10,基于所述增量训练样本，利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布；

在本实施例中，基于所述增量训练样本，利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布，具体地，所述贝叶斯算法回归形式：

其中，θ为模型M当前的参数，

为噪音，模型的后验概率分布可分解为：

其中，

为参数前验概率分布，

为似然函数，进而基于所述增量训练样本，将所述增量训练样本输入模型中，模型后验具有以下递归更新的形式：

即可更新所述故障检测分类模型对应的参数后验概率分布。

步骤C20,基于所述参数后验概率分布，对所述故障检测分类模型进行在线增量更新，获得所述更新后的故障检测分类模型。

在本实施例中，基于所述参数后验概率分布，对所述故障检测分类模型进行在线增量更新，获得所述更新后的故障检测分类模型，具体地，基于所述参数后验概率分布，对所述故障检测分类模型进行在线增量更新，从而获得更新优化后的故障检测分类模型。

本申请实施例提供了一种基于主动学习的模型在线增量训练方法，也即，基于所述增量训练样本，利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布，进而基于所述参数后验概率分布，对所述故障检测分类模型进行在线增量更新，获得所述更新后的故障检测分类模型，实现了基于在线获取的待预测无标签样本所构建的增量训练样本，对所述故障检测分类模型进行更新操作，从而延长了模型的生命周期，为克服现有技术中大量的待预测无标签样本无法被有效地利用的情况，以及通过对待预测无标签样本进行人工标记以对模型进行更新训练的方法工作量大，需要较长的时间成本，进而导致模型更新训练的效率较低的技术缺陷奠定了基础。

参照图4，图4是本申请实施例方案涉及的硬件运行环境的基于主动学习的模型在线增量训练设备结构示意图。

如图4所示，该基于主动学习的模型在线增量训练设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该基于主动学习的模型在线增量训练设备还可以包括矩形用户接口、网络接口、相机、RF（Radio Frequency，射频）电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏（Display）、输入子模块比如键盘（Keyboard），可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口（如WIFI接口）。

本领域技术人员可以理解，图4中示出的基于主动学习的模型在线增量训练设备结构并不构成对基于主动学习的模型在线增量训练设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图4所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于主动学习的模型在线增量训练程序。操作系统是管理和控制基于主动学习的模型在线增量训练设备硬件和软件资源的程序，支持基于主动学习的模型在线增量训练程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与基于主动学习的模型在线增量训练系统中其它硬件和软件之间通信。

在图4所示的基于主动学习的模型在线增量训练设备中，处理器1001用于执行存储器1005中存储的基于主动学习的模型在线增量训练程序，实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。

本申请基于主动学习的模型在线增量训练设备具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同，在此不再赘述。

本申请还提供一种基于主动学习的模型在线增量训练装置，所述基于主动学习的模型在线增量训练装置包括：

获取模块，用于获取待预测无标签样本；

可选地，所述构建模块还用于：

可选地，所述在线更新模块还用于：

可选地，所述基于主动学习的模型在线增量训练装置还用于：

获取待训练分类模型；

本申请基于主动学习的模型在线增量训练装置的具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种介质，所述介质为可读存储介质，且所述可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。

本申请可读存储介质具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种计算机程序产品，且所述计算机程序产品包括有一个或者一个以上计算机程序，所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。

本申请计算机程序产品具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种基于主动学习的模型在线增量训练方法，其特征在于，所述基于主动学习的模型在线增量训练方法包括：

获取待预测无标签样本，其中，所述待预测无标签样本为在模型部署上线后实时检测到的在线流式数据；

通过故障检测分类模型对所述待预测无标签样本进行预测，获得预测分类结果，并确定所述预测分类结果对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的；

若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本，其中，所述置信度阈值条件为在所述待预测无标签样本进行预测对应的时刻之前，且在预设时间窗长内各已预测样本的预测分类结果对应的均值以及标准差之间的运算结果；

2.如权利要求1所述基于主动学习的模型在线增量训练方法，其特征在于，所述若所述置信度满足置信度阈值条件，则将所述待预测无标签样本构建成增量训练样本的步骤包括：

3.如权利要求2所述基于主动学习的模型在线增量训练方法，其特征在于，所述若所述置信度大于所述置信度阈值，将所述待预测无标签样本设置为关键待标注样本的步骤包括：

4.如权利要求1所述基于主动学习的模型在线增量训练方法，其特征在于，所述基于所述增量训练样本，对所述故障检测分类模型进行在线更新训练，获得更新后的故障检测分类模型的步骤包括：

5.如权利要求1所述基于主动学习的模型在线增量训练方法，其特征在于，在所述通过故障检测分类模型对所述待预测无标签样本集进行预测，获得预测分类结果，并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度，其中，所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前，所述基于主动学习的模型在线增量训练方法还包括：

获取待训练分类模型；

6.如权利要求5所述基于主动学习的模型在线增量训练方法，其特征在于，所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化，获得所述故障检测分类模型的步骤包括：

7.一种基于主动学习的模型在线增量训练设备，其特征在于，所述基于主动学习的模型在线增量训练设备包括：存储器、处理器以及存储在存储器上的基于主动学习的模型在线增量训练程序，

所述基于主动学习的模型在线增量训练程序被所述处理器执行实现如权利要求1至6中任一项所述基于主动学习的模型在线增量训练方法的步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于主动学习的模型在线增量训练程序，所述基于主动学习的模型在线增量训练程序被处理器执行实现如权利要求1至6中任一项所述基于主动学习的模型在线增量训练方法的步骤。