CN113420849A - 基于主动学习的模型在线增量训练方法、设备及介质 - Google Patents

基于主动学习的模型在线增量训练方法、设备及介质 Download PDF

Info

Publication number
CN113420849A
CN113420849A CN202110978408.6A CN202110978408A CN113420849A CN 113420849 A CN113420849 A CN 113420849A CN 202110978408 A CN202110978408 A CN 202110978408A CN 113420849 A CN113420849 A CN 113420849A
Authority
CN
China
Prior art keywords
model
sample
predicted
fault detection
classification model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110978408.6A
Other languages
English (en)
Other versions
CN113420849B (zh
Inventor
冯建设
花霖
陈军
刘桂芬
姚琪
周雷
欧馨
王宗强
赵一波
许琦枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinrun Fulian Digital Technology Co Ltd
Original Assignee
Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinrun Fulian Digital Technology Co Ltd filed Critical Shenzhen Xinrun Fulian Digital Technology Co Ltd
Priority to CN202110978408.6A priority Critical patent/CN113420849B/zh
Publication of CN113420849A publication Critical patent/CN113420849A/zh
Application granted granted Critical
Publication of CN113420849B publication Critical patent/CN113420849B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于主动学习的模型在线增量训练方法、设备及介质,所述基于主动学习的模型在线增量训练方法包括:获取待预测无标签样本,通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。本申请解决因人工标注无标签样本工作量大,导致模型更新训练效率低的技术问题。

Description

基于主动学习的模型在线增量训练方法、设备及介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于主动学习的模型在线增量训练方法、设备及介质。
背景技术
随着工业制造大数据技术的发展,在工业制造过程中,存在大量的无标签数据,而数据驱动的PHM(Prognostic and Health Management ,故障预测与健康管理)模型的训练需要足够丰富的有标签样本,进一步地,当模型部署上线之后,模型更新往往是需要利用新收集的有标签数据对模型进行定期离线更新训练,导致存在大量的无标签样本无法被有效地利用的情况,可通过对无标签样本进行人工标记,从而对模型进行更新训练,然而,人工标注工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低。
发明内容
本申请的主要目的在于提供一种基于主动学习的模型在线增量训练方法、设备及介质,旨在解决现有技术中的因人工标注无标签样本工作量大,导致模型训练更新效率低的技术问题。
为实现上述目的,本申请提供一种基于主动学习的模型在线增量训练方法,所述基于主动学习的模型在线增量训练方法包括:
获取待预测无标签样本;
通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
可选地,所述若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本的步骤包括:
若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;
对所述关键待标注样本进行人工标注,获得所述增量训练样本。
可选地,所述若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本的步骤包括:
获取在预设时间窗长内的各已预测样本对应的预测分类结果;
分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;
基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本。
可选地,所述基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型的步骤包括:
基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;
基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。
可选地,在所述通过故障检测分类模型对所述待预测无标签样本集进行预测,获得预测分类结果,并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前,所述基于主动学习的模型在线增量训练方法还包括:
获取待训练分类模型;
通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型。
可选地,所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型的步骤包括:
将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果;
基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失;
基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
本申请还提供一种基于主动学习的模型在线增量训练装置,所述基于主动学习的模型在线增量训练装置为虚拟装置,所述基于主动学习的模型在线增量训练装置包括:
获取模块,用于获取待预测无标签样本;
预测模块,用于通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
构建模块,用于若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
在线更新模块,用于基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
本申请还提供一种基于主动学习的模型在线增量训练设备,所述基于主动学习的模型在线增量训练设备为实体设备,所述基于主动学习的模型在线增量训练设备包括:存储器、处理器以及存储在所述存储器上的基于主动学习的模型在线增量训练程序,所述基于主动学习的模型在线增量训练程序被所述处理器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。
本申请还提供一种介质,所述介质为可读存储介质,所述可读存储介质上存储基于主动学习的模型在线增量训练程序,所述基于主动学习的模型在线增量训练程序被处理器执行实现如上述的基于主动学习的模型在线增量训练方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的基于主动学习的模型在线增量训练方法的步骤。
本申请提供了一种基于主动学习的模型在线增量训练方法、设备及介质,相比于现有技术采用的通过对大量待预测无标签样本进行人工标注以对模型进行更新训练的技术手段,本申请首先获取待预测无标签样本,进而通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,进一步地,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,进而实现基于所述置信度,有选择性进行选取置信度高的待预测无标签样本以对模型进行更新训练的目的,进一步地,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型,实现了通过模型主动学习待预测无标签样本,进而将在线的待预测无标签样本构建成增量训练样本,从而对所述故障检测分类模型进行在线更新,既充分地利用了海量的无标签样本,又能实时地通过在线的无标签样本对模型进行更新训练,延长了模型的生命周期,克服了现有技术中大量的无标签样本无法被有效地利用的情况,以及通过对无标签样本进行人工标记以对模型进行更新训练的方法工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低的技术缺陷,从而提高了模型更新训练的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于主动学习的模型在线增量训练方法第一实施例的流程示意图;
图2为本申请基于主动学习的模型在线增量训练方法第二实施例的流程示意图;
图3为本申请基于主动学习的模型在线增量训练方法第三实施例的流程示意图;
图4为本申请实施例中基于主动学习的模型在线增量训练方法涉及的硬件运行环境的基于主动学习的模型在线增量训练设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种基于主动学习的模型在线增量训练方法,在本申请基于主动学习的模型在线增量训练方法的第一实施例中,参照图1,所述基于主动学习的模型在线增量训练方法包括:
步骤S10,获取待预测无标签样本;
在本实施例中,需要说明的是,在模型部署上线后,可实时检测到系统上的在线流式数据,也即,可以实时获取所述待预测无标签样本。
获取待预测无标签样本,具体地,将实时检测到的数据作为所述待预测无标签样本,以通过所述故障检测分类模型对实时获取的待预测无标签样本进行预测。
步骤S20,通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
在本实施例中,需要说明的是,所述故障检测分类模型为在离线状态下预先收集的有标签样本集进行训练得到的,待训练完成后,将所述故障检测分类模型部署上线运行。
通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,具体地,首先,预先收集有标签样本集,进而将所述有标签样本集输入待训练分类模型中,以优化所述待训练分类模型,并判断所述优化后的待训练分类模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若不满足,则返回执行步骤:将所述有标签样本集输入待训练分类模型中,以优化所述待训练分类模型,若满足,则获得所述故障检测分类模型,进而将所述故障检测分类模型部署上线,进一步地,通过已上线运行的故障检测分类模型对实时监测到的待预测无标签样本进行预测,输出所述预测分类结果,进而根据所述预测分类结果,确定所述预测分类结果对应的置信度,以根据置信度进行下一步的训练样本的选取。
其中,在所述通过故障检测分类模型对待预测无标签样本集进行预测,获得所述待预测无标签样本集中的各个样本对应的预测分类结果,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前,所述基于主动学习的模型在线增量训练方法还包括:
步骤A10,获取待训练分类模型;
步骤A20,通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型。
在本实施例,通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型,具体地,将所述有标签样本集输入所述待训练分类模型中,执行模型预测,获得模型输出标签,进而计算所述模型输出标签与所述有标签样本集各样本对应的标签之间的差值,获得模型损失,进而基于所述模型损失,优化所述待训练分类模型,并判断所述优化后的待训练分类模型是否满足预设训练结束条件,其中,所述预设训练结束条件包括损失函数收敛和达到最大迭代次数阈值等条件,若不满足,则返回执行步骤:将所述有标签样本集输入待训练分类模型中,以优化所述待训练分类模型,若满足,则获得所述故障检测分类模型,进而将所述故障检测分类模型部署上线。
其中,所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型的步骤包括:
步骤A21,将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果;
在本实施例中,将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果,具体地,通过所述待训练分类模型对所述有标签样本集中各所述有标签样本进行分类预测,获得各有标签样本分别对应的分类结果。
步骤A22,基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失;
在本实施例中,基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失,具体地,基于各所述有标签样本分别对应的标签与所述分类结果之间的差异度,通过预设损失函数计算所述模型损失。
步骤A23,基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
在本实施例中,基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型,具体地,基于所述模型损失,计算所述模型损失的梯度,进而对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
步骤S30,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
在本实施例中,需要说明的是,所述置信度阈值为在所述待预测无标签样本进行预测对应的时刻之前,且在预设时间窗长内的各已预测样本的预测分类结果对应的均值以及标准差之间的运算结果,由于在工业制造过程中会产生大量的待预测无标签样本,对全部待预测无标签样本进行标注工作量过大,因此,需要对每一所述待预测无标签样本对应的置信度进行判断,从而筛选出置信度满足的待预测无标签样本,既充分利用了大量的待预测无标签样本,又减少了后续标注的工作量。
若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,具体地,基于所述置信度,筛选所述置信度大于所述置信度阈值所对应的待预测无标签样本,当所述置信度大于所述置信度阈值,即可说明模型无法对所述待预测无标签样本作出精准的预测输出,进而将所述待预测无标签样本作为关键待标签样本,以对所述关键待标签样本进行标注,并将标注后的样本作为所述增量训练样本,进一步地,若所述置信度不满足置信度阈值条件,则剔除所述待预测无标签样本,进而获取新的待预测无标签样本,以通过所述故障检测分类模型对所述新的待预测无标签样本进行新一轮的预测,例如,样本x进行标注后的标签为y,二者(x,y)构成所述增量训练样本,以用来实现下一步模型的增量更新。
步骤S40,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
在本实施例中,基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型,具体地,基于所述增量训练样本,将所述增量训练样本输入所述故障检测分类模型,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布,进而对所述故障检测分类模型对应的参数进行在线增量更新,获得更新后的故障检测分类模型,实现所述故障检测分类模型进行在线更新,进而利用所述更新后的故障检测分类模型实时对待预测无标签样本进行下一轮的预测分类。
本申请实施例提供了一种基于主动学习的模型在线增量训练方法,相比于现有技术采用的通过对大量待预测无标签样本进行人工标注以对模型进行更新训练的技术手段,本申请实施例首先获取待预测无标签样本,进而通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的,进一步地,若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本,进而实现基于所述置信度,有选择性进行选取置信度高的待预测无标签样本以对模型进行更新训练的目的,进而基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型,实现了通过模型主动学习待预测无标签样本,进而将在线的待预测无标签样本构建成增量训练样本,从而对所述故障检测分类模型进行在线更新,既充分地利用了海量的无标签样本,又能实时地通过在线的无标签样本对模型进行更新训练,延长了模型的生命周期,克服了现有技术中大量的无标签样本无法被有效地利用的情况,以及通过对无标签样本进行人工标记以对模型进行更新训练的方法工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低的技术缺陷,从而提高了模型更新训练的效率。
进一步地,参照图2,基于本申请中第一实施例,在本申请的另一实施例中,所述若满足,则将所述置信度对应的待预测无标签样本构建成所述增量训练样本的步骤包括:
步骤B10,若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;
在本实施例中,若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本,具体地,获取在预设时间窗长内的各已预测样本对应的预测分类结果,进而计算各所述已预测样本对应的预测分类结果的均值,并计算各所述已预测样本对应的预测分类结果的标准差,进一步地,比较所述置信度与所述均值和所述标准差之间的运算结果,若所述置信度大于所述运算结果,则输出所述置信度对应的待预测无标签样本,进而将所述待预测无标签样本设置为关键待标注样本,以对所述关键待标注样本进行人工标注。
其中,所述若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本的步骤包括:
步骤B11,获取在预设时间窗长内的各已预测样本对应的预测分类结果;
在本实施例中,需要说明的是,各所述已预测样本为在所述待预测无标签样本进行预测对应的时刻之前且在所述预设时间窗长内的各样本,所述预设时间窗长为预先设置的时长。
获取在预设时间窗长内的各已预测样本对应的预测分类结果,具体地,通过设置一个预设时间窗长,以所述待预测无标签样本进行预测对应的时刻为基准,获取在预设时间窗长内的各已预测样本对应的预测分类结果,例如,所述待预测无标签样本对应的时刻为t,所述预设时间窗长为T,则获取在t时刻之前,且在预设时间窗长T内的各样本对应的预测分类结果。
步骤B12,分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;
在本实施例中,分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差,具体地,基于各所述已预测样本对应的预测分类结果,计算各所述已预测样本对应的预测分类结果对应的均值以及各所述已预测样本对应的预测分类结果的标准差。
步骤B13,基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本。
在本实施例中,基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本,具体地,基于所述均值和所述标准差,将所述待预测无标签样本对应的置信度与所述均值和所述标准差之间的运算结果进行比较,若所述置信度大于所述运算结果,则将所述待预测无标签样本设置为所述关键待标注样本,例如,若当前时刻t的待预测无标签样本
Figure 174038DEST_PATH_IMAGE001
对应的置信度为
Figure 842917DEST_PATH_IMAGE002
,预设时间窗长为T,各所述已预测样本如下:
Figure 773964DEST_PATH_IMAGE003
各所述已预测样本对应的预测分类结果为:
Figure 528293DEST_PATH_IMAGE004
进而比较所述置信度与所述均值和所述标准差之间的运算结果,也即:
Figure 265305DEST_PATH_IMAGE005
其中,mean表示计算均值,std表示计算标准差,进一步地,当所述置信度大于所述运算结果时,则将所述待预测无标签样本设置为所述关键待标注样本。
步骤B20,对所述关键待标注样本进行人工标注,获得所述增量训练样本。
在本实施例,需要说明的是,所述增量训练样本为用于所述故障检测分类模型进行增量更新的样本的。
对所述关键待标注样本进行人工标注,获得所述增量训练样本,具体地,通过业务专家经验对所述关键待标注样本进行人工标注,获得所述关键待标注样本对应的标签,进而将所述关键待标注样本和所述关键待标注样本对应的标签构建成所述增量训练样本,例如,样本x进行标准后的标签为y二者构成增量训练样本为(x,y),以实现下一步模型的增量更新。
本申请实施例提供了一种基于主动学习的模型在线增量训练方法,也即,若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本,进而对所述关键待标注样本进行人工标注,获得所述增量训练样本,实现了将通过训练好的故障检测分类模型部署上线,根据实时在线获取待预测无标签样本对应的置信度,选取满足条件的待预测无标签样本进行人工标注标签,充分地主动学习了海量的待预测无标签样本,以对所述故障检测分类模型进行更新,为克服现有技术中大量的待预测无标签样本无法被有效地利用的情况,而通过对待预测无标签样本进行人工标记以对模型进行更新训练的工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低的技术缺陷奠定了基础。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型的步骤包括:
步骤C10,基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;
在本实施例中,基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布,具体地,所述贝叶斯算法回归形式:
Figure 726374DEST_PATH_IMAGE006
其中,θ为模型M当前的参数,
Figure 156218DEST_PATH_IMAGE007
为噪音,模型的后验概率分布可分解为:
Figure 397843DEST_PATH_IMAGE008
其中,
Figure 610650DEST_PATH_IMAGE009
为参数前验概率分布,
Figure 254121DEST_PATH_IMAGE010
为似然函数,进而基于所述增量训练样本,将所述增量训练样本输入模型中,模型后验具有以下递归更新的形式:
Figure 589287DEST_PATH_IMAGE011
Figure 318209DEST_PATH_IMAGE012
Figure 334707DEST_PATH_IMAGE013
即可更新所述故障检测分类模型对应的参数后验概率分布。
步骤C20,基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。
在本实施例中,基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型,具体地,基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,从而获得更新优化后的故障检测分类模型。
本申请实施例提供了一种基于主动学习的模型在线增量训练方法,也即,基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布,进而基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型,实现了基于在线获取的待预测无标签样本所构建的增量训练样本,对所述故障检测分类模型进行更新操作,从而延长了模型的生命周期,为克服现有技术中大量的待预测无标签样本无法被有效地利用的情况,以及通过对待预测无标签样本进行人工标记以对模型进行更新训练的方法工作量大,需要较长的时间成本,进而导致模型更新训练的效率较低的技术缺陷奠定了基础。
参照图4,图4是本申请实施例方案涉及的硬件运行环境的基于主动学习的模型在线增量训练设备结构示意图。
如图4所示,该基于主动学习的模型在线增量训练设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于主动学习的模型在线增量训练设备还可以包括矩形用户接口、网络接口、相机、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口(如WIFI接口)。
本领域技术人员可以理解,图4中示出的基于主动学习的模型在线增量训练设备结构并不构成对基于主动学习的模型在线增量训练设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于主动学习的模型在线增量训练程序。操作系统是管理和控制基于主动学习的模型在线增量训练设备硬件和软件资源的程序,支持基于主动学习的模型在线增量训练程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于主动学习的模型在线增量训练系统中其它硬件和软件之间通信。
在图4所示的基于主动学习的模型在线增量训练设备中,处理器1001用于执行存储器1005中存储的基于主动学习的模型在线增量训练程序,实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。
本申请基于主动学习的模型在线增量训练设备具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同,在此不再赘述。
本申请还提供一种基于主动学习的模型在线增量训练装置,所述基于主动学习的模型在线增量训练装置包括:
获取模块,用于获取待预测无标签样本;
预测模块,用于通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
构建模块,用于若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
在线更新模块,用于基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
可选地,所述构建模块还用于:
若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;
对所述关键待标注样本进行人工标注,获得所述增量训练样本。
可选地,所述构建模块还用于:
获取在预设时间窗长内的各已预测样本对应的预测分类结果;
分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;
基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本。
可选地,所述在线更新模块还用于:
基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;
基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。
可选地,所述基于主动学习的模型在线增量训练装置还用于:
获取待训练分类模型;
通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型。
可选地,所述基于主动学习的模型在线增量训练装置还用于:
将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果;
基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失;
基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
本申请基于主动学习的模型在线增量训练装置的具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种介质,所述介质为可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。
本申请可读存储介质具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种计算机程序产品,且所述计算机程序产品包括有一个或者一个以上计算机程序,所述一个或者一个以上计算机程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于主动学习的模型在线增量训练方法的步骤。
本申请计算机程序产品具体实施方式与上述基于主动学习的模型在线增量训练方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种基于主动学习的模型在线增量训练方法,其特征在于,所述基于主动学习的模型在线增量训练方法包括:
获取待预测无标签样本;
通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述预测分类结果对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
2.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,所述若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本的步骤包括:
若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本;
对所述关键待标注样本进行人工标注,获得所述增量训练样本。
3.如权利要求2所述基于主动学习的模型在线增量训练方法,其特征在于,所述若所述置信度大于所述置信度阈值,将所述待预测无标签样本设置为关键待标注样本的步骤包括:
获取在预设时间窗长内的各已预测样本对应的预测分类结果;
分别计算各所述已预测样本分别对应的预测分类结果的均值以及标准差;
基于所述均值和所述标准差,若所述置信度大于所述均值和所述标准差之间的运算结果,则将所述待预测无标签样本设置为所述关键待标注样本。
4.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,所述基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型的步骤包括:
基于所述增量训练样本,利用贝叶斯算法递归计算所述故障检测分类模型对应的参数后验概率分布;
基于所述参数后验概率分布,对所述故障检测分类模型进行在线增量更新,获得所述更新后的故障检测分类模型。
5.如权利要求1所述基于主动学习的模型在线增量训练方法,其特征在于,在所述通过故障检测分类模型对所述待预测无标签样本集进行预测,获得预测分类结果,并确定所述待预测无标签样本集中各待预测无标签样本分别对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的步骤之前,所述基于主动学习的模型在线增量训练方法还包括:
获取待训练分类模型;
通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型。
6.如权利要求5所述基于主动学习的模型在线增量训练方法,其特征在于,所述通过所述有标签样本集对所述待训练分类模型进行迭代训练优化,获得所述故障检测分类模型的步骤包括:
将所述有标签样本集输入所述待训练分类模型,输出所述有标签样本集中各有标签样本分别对应的分类结果;
基于各所述有标签样本分别对应的标签和所述分类结果,计算所述待训练分类模型对应的模型损失;
基于所述模型损失,对所述待训练分类模型进行迭代训练,获得所述故障检测分类模型。
7.一种基于主动学习的模型在线增量训练装置,其特征在于,所述基于主动学习的模型在线增量训练装置包括:
获取模块,用于获取待预测无标签样本;
预测模块,用于通过故障检测分类模型对所述待预测无标签样本进行预测,获得预测分类结果,并确定所述待预测无标签样本对应的置信度,其中,所述故障检测分类模型为基于有标签样本集进行迭代训练得到的;
构建模块,用于若所述置信度满足置信度阈值条件,则将所述待预测无标签样本构建成增量训练样本;
在线更新模块,用于基于所述增量训练样本,对所述故障检测分类模型进行在线更新训练,获得更新后的故障检测分类模型。
8.一种基于主动学习的模型在线增量训练设备,其特征在于,所述基于主动学习的模型在线增量训练设备包括:存储器、处理器以及存储在存储器上的基于主动学习的模型在线增量训练程序,
所述基于主动学习的模型在线增量训练程序被所述处理器执行实现如权利要求1至6中任一项所述基于主动学习的模型在线增量训练方法的步骤。
9.一种介质,所述介质为可读存储介质,其特征在于,所述可读存储介质上存储有基于主动学习的模型在线增量训练程序,所述基于主动学习的模型在线增量训练程序被处理器执行实现如权利要求1至6中任一项所述基于主动学习的模型在线增量训练方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述基于主动学习的模型在线增量训练方法的步骤。
CN202110978408.6A 2021-08-25 2021-08-25 基于主动学习的模型在线增量训练方法、设备及介质 Active CN113420849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110978408.6A CN113420849B (zh) 2021-08-25 2021-08-25 基于主动学习的模型在线增量训练方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110978408.6A CN113420849B (zh) 2021-08-25 2021-08-25 基于主动学习的模型在线增量训练方法、设备及介质

Publications (2)

Publication Number Publication Date
CN113420849A true CN113420849A (zh) 2021-09-21
CN113420849B CN113420849B (zh) 2021-11-30

Family

ID=77719381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110978408.6A Active CN113420849B (zh) 2021-08-25 2021-08-25 基于主动学习的模型在线增量训练方法、设备及介质

Country Status (1)

Country Link
CN (1) CN113420849B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570007A (zh) * 2021-09-27 2021-10-29 深圳市信润富联数字科技有限公司 零件缺陷识别模型构建优化方法、装置、设备及存储介质
CN113570070A (zh) * 2021-09-23 2021-10-29 深圳市信润富联数字科技有限公司 流式数据采样与模型更新方法、装置、系统与存储介质
CN114332984A (zh) * 2021-12-06 2022-04-12 腾讯科技(深圳)有限公司 训练数据处理方法、装置和存储介质
CN114418118A (zh) * 2022-01-21 2022-04-29 中国人民解放军国防科技大学 决策能力约束下多源网络流数据预测方法和装置
CN114462531A (zh) * 2022-01-30 2022-05-10 支付宝(杭州)信息技术有限公司 一种模型训练方法、装置及电子设备
CN117216280A (zh) * 2023-11-09 2023-12-12 闪捷信息科技有限公司 敏感数据识别模型的增量学习方法、识别方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060204081A1 (en) * 2005-03-01 2006-09-14 Microsoft Corporation Method and system for incrementally learning an adaptive subspace by optimizing the maximum margin criterion
US20140247978A1 (en) * 2013-03-04 2014-09-04 Xerox Corporation Pre-screening training data for classifiers
CN104680195A (zh) * 2015-03-27 2015-06-03 广州阳光耐特电子有限公司 一种自动识别道路卡口视频及图片中的车辆颜色的方法
US20200034749A1 (en) * 2018-07-26 2020-01-30 International Business Machines Corporation Training corpus refinement and incremental updating
US20200250527A1 (en) * 2019-02-04 2020-08-06 Google Llc Systems and Methods for Active Learning
CN111563554A (zh) * 2020-05-08 2020-08-21 河北工业大学 基于回归变分自编码器的零样本图像分类方法
CN113240125A (zh) * 2021-01-13 2021-08-10 深延科技(北京)有限公司 模型训练方法及装置、标注方法及装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060204081A1 (en) * 2005-03-01 2006-09-14 Microsoft Corporation Method and system for incrementally learning an adaptive subspace by optimizing the maximum margin criterion
US20140247978A1 (en) * 2013-03-04 2014-09-04 Xerox Corporation Pre-screening training data for classifiers
CN104680195A (zh) * 2015-03-27 2015-06-03 广州阳光耐特电子有限公司 一种自动识别道路卡口视频及图片中的车辆颜色的方法
US20200034749A1 (en) * 2018-07-26 2020-01-30 International Business Machines Corporation Training corpus refinement and incremental updating
US20200250527A1 (en) * 2019-02-04 2020-08-06 Google Llc Systems and Methods for Active Learning
CN111563554A (zh) * 2020-05-08 2020-08-21 河北工业大学 基于回归变分自编码器的零样本图像分类方法
CN113240125A (zh) * 2021-01-13 2021-08-10 深延科技(北京)有限公司 模型训练方法及装置、标注方法及装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
潘世超: "基于概率密度分布的增量支持向量机算法", 《南京大学学报(自然科学)》 *
陈沅涛: "一种增量向量支持向量机学习算法", 《南京理工大学学报》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570070A (zh) * 2021-09-23 2021-10-29 深圳市信润富联数字科技有限公司 流式数据采样与模型更新方法、装置、系统与存储介质
CN113570007A (zh) * 2021-09-27 2021-10-29 深圳市信润富联数字科技有限公司 零件缺陷识别模型构建优化方法、装置、设备及存储介质
CN113570007B (zh) * 2021-09-27 2022-02-15 深圳市信润富联数字科技有限公司 零件缺陷识别模型构建优化方法、装置、设备及存储介质
CN114332984A (zh) * 2021-12-06 2022-04-12 腾讯科技(深圳)有限公司 训练数据处理方法、装置和存储介质
CN114332984B (zh) * 2021-12-06 2024-04-12 腾讯科技(深圳)有限公司 训练数据处理方法、装置和存储介质
CN114418118A (zh) * 2022-01-21 2022-04-29 中国人民解放军国防科技大学 决策能力约束下多源网络流数据预测方法和装置
CN114418118B (zh) * 2022-01-21 2024-03-12 中国人民解放军国防科技大学 决策能力约束下多源网络流数据预测方法和装置
CN114462531A (zh) * 2022-01-30 2022-05-10 支付宝(杭州)信息技术有限公司 一种模型训练方法、装置及电子设备
CN117216280A (zh) * 2023-11-09 2023-12-12 闪捷信息科技有限公司 敏感数据识别模型的增量学习方法、识别方法和装置
CN117216280B (zh) * 2023-11-09 2024-02-09 闪捷信息科技有限公司 敏感数据识别模型的增量学习方法、识别方法和装置

Also Published As

Publication number Publication date
CN113420849B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN113420849B (zh) 基于主动学习的模型在线增量训练方法、设备及介质
CN110335168B (zh) 基于gru优化用电信息采集终端故障预测模型的方法及系统
US10169002B2 (en) Automated and heuristically managed solution to quantify CPU and path length cost of instructions added, changed or removed by a service team
US10579042B2 (en) Defect rate analytics to reduce defectiveness in manufacturing
US11734161B2 (en) System and method for fuzzing test orchestration using reinforcement learning
CN115859122B (zh) 一种数据识别方法、自动持续学习模型、装置和设备
CN111881023A (zh) 一种基于多模型对比的软件老化预测方法及装置
KR20220117194A (ko) 추론 연산 장치, 모델 훈련 장치, 및 추론 연산 시스템
CN116563757A (zh) 基于物联网的智慧工地监控方法及系统
CN113269359A (zh) 用户财务状况预测方法、设备、介质及计算机程序产品
CN113887655A (zh) 模型链回归预测方法、装置、设备及计算机存储介质
US11640559B2 (en) Accuracy of classification models
KR20200126766A (ko) Ict 인프라의 운용 관리 장치 및 방법
CN113641525A (zh) 变量异常修复方法、设备、介质及计算机程序产品
CN113095508A (zh) 回归模型构建优化方法、设备、介质及计算机程序产品
CN109343952B (zh) 贝叶斯网络确定方法、装置、存储介质和电子设备
CN113010435A (zh) 一种算法模型的筛选方法、装置及测试平台
CN113825165A (zh) 基于时间图网络的5g切片网络拥塞预警方法及装置
US20230072123A1 (en) Method and system for automating analysis of log data files
CN115984207A (zh) 车辆缺陷检测方法、装置、系统及介质
CN113570070B (zh) 流式数据采样与模型更新方法、装置、系统与存储介质
US20220066804A1 (en) Proxy interpreter to upgrade automated legacy systems
CN114860590A (zh) 一种接口测试方法、装置、设备、存储介质
CN114359670A (zh) 非结构化数据标注方法、装置、计算机设备及存储介质
CN113361811A (zh) 运行状态预测方法、系统、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant