CN116520150A

CN116520150A - 基于动态策略和主动学习的异常检测系统构建系统及方法

Info

Publication number: CN116520150A
Application number: CN202310124865.8A
Authority: CN
Inventors: 李朝; 肖劼; 黄家明
Original assignee: Hangzhou Yugu Technology Co ltd
Current assignee: Hangzhou Yugu Technology Co ltd
Priority date: 2023-02-16
Filing date: 2023-02-16
Publication date: 2023-08-01

Abstract

本发明涉及电池异常检测技术领域，涉及一种基于动态策略和主动学习的异常检测系统构建系统及方法。该构建系统包括：样本库单元，其用于存放已标注样本集和未标注样本集；模型库单元，其实现异常检测模型的存放及训练；阈值判定单元，其用于对参与训练的样本数是否达到设定阈值进行判定，并在达到设定阈值时使异常检测模型训练完成，否则通过下述的样本信息量评分单元及输出单元选择未标注样本并在完成所选未标注样本的标注后对已标注样本集进行更新；样本信息量评分单元，其用于对每个未标注样本的样本信息量评分进行计算；以及输出单元，其用于抽取B个未标注样本。该构建方法基于上述构建系统实现。本发明能够较佳地实现样本标注成本的降低。

Description

基于动态策略和主动学习的异常检测系统构建系统及方法

技术领域

本发明涉及电池异常检测技术领域，具体地说，涉及一种基于动态策略和主动学习的异常检测系统构建系统及方法。

背景技术

在锂电池等充电电池的使用周期内，需要对其异常状态进行检测。由于人工检测的效率较为低下，故现有通常采用构建异常检测模型对其进行检测，现有异常检测模型主要包括基于机器学习的检测模型和基于深度学习的检测模型。

无论是基于机器学习的检测模型还是基于深度学习的检测模型，其均需要大量的样本集对其进行训练，此外所参与训练的样本集中的每个样本均需要对其进行标注以获取标签数据。

在电池的异常检测中，通常需要通过通过专家对历史数据进行人工标注以获取符合条件的训练样本集，因如电池使用场景的多元化等多方面因素，对电池的历史数据的标注成本较高。故难以获取大批量的训练样本集，这将直接导致所训练的异常检测模型很难较低成本地获取较佳的训练效果。

发明内容

本发明提供了一种基于动态策略和主动学习的异常检测系统构建系统，其能够克服现有技术中所存在的异常检测模型训练所需样本获取难度较大的问题，通过多次进行模型训练和提取未标注样本进行标注，能够较佳地降低样本标注成本并能够较佳地提高模型训练的准确性。

根据本发明的一种基于动态策略和主动学习的异常检测系统构建系统，其包括：

样本库单元，其用于存放样本集，样本集包括用于收录已标注样本的已标注样本集和用于收录未标注样本的未标注样本集；

模型库单元，其用于存放异常检测模型，并用于基于已标注样本集对异常检测模型进行训练；

阈值判定单元，其用于对参与训练的已标注样本集的样本数是否达到设定阈值进行判定，并在达到设定阈值时使异常检测模型训练完成，否则通过下述的样本信息量评分单元及输出单元选择未标注样本并在完成所选未标注样本的标注后对已标注样本集进行更新，以实现基于更新后已标注样本集对异常检测模型的训练；

样本信息量评分单元，其用于基于训练后的异常检测模型对每个未标注样本的样本信息量评分进行计算；以及

输出单元，其用于按样本信息量评分自高至低地抽取B个未标注样本，在该B个未标注样本完成标注后将其更新至已标注样本集中并自未标注样本集中剔除。

通过本发明中的异常检测系统构建系统，能够首先基于既有的已标注样本集完成异常检测模型的训练，若既有的已标注样本集的样本数已经符合要求则能够使得训练完成，若既有的已标注样本集的样本数不符合训练的要求数量，则能够通过样本信息量评分单元和输出单元选取并输出最有代表性的多个未标注样本，以实现对已标注样本集的增容及更新。通过此举，能够有效地选取出最有代表性的未标注样本以实现已标注样本集的更新扩容，故而使得能够利用更少的样本量达到更优的训练效果，基于此，能够有效地降低异常检测模型的搭建成本，且由于所选取的样本能够具有更佳的代表性，故而也能够带来异常检测模型训练效果的提升。

此外，本发明还提供了一种基于动态策略和主动学习的异常检测系统构建方法，其包括如下步骤：

步骤S1、构建样本集P，样本集P包括用于收录已标注样本的已标注样本集P¹和用于收录未标注样本/>的未标注样本集P²；

步骤S2、构建异常检测模型并基于已标注样本集P¹对异常检测模型进行训练，若已标注样本集P¹中的样本数达到设定阈值则训练完成，否则进入下一步；其中，异常检测模型用于对所输入的样本进行处理并输出异常预测分S，S∈[0，1]；

步骤S3、基于经步骤S2训练后的异常检测模型对未标注样本集P²中的每个样本进行预测并获取对应的异常预测分，对于未标注样本其对应的异常预测分为/>

步骤S4、计算未标注样本集P²中的每个样本的样本信息量评分I，对于未标注样本其对应的样本信息量评分/>为，

其中，为未标注样本/>的不确定分，

其中，abs(*)为取绝对值运算；

其中，为未标注样本/>的代表性评分，其基于k-means算法获取；

步骤S5、按样本信息量评分自高至低地抽取B个未标注样本，并对其进行标注，标注后的未标注样本更新至已标注样本集中并自未标注样本集中剔除；

步骤S6、基于更新后的已标注样本集，重复步骤S2-S5，直至异常检测模型训练完成。

通过上述步骤S1-S6，能够较佳地针对目前人工智能的异常检测模型在构建时所普遍存在的样本标注成本较高的问题，综合考虑不确定性、多样性和代表性的深度批量主动学习方法，以实现最具代表性的未标注样本的获取，进而能够较佳地降低样本标注的成本，同时能够较佳地提升模型训练的效果。

作为优选，步骤S2中，异常检测模型包括机器学习模型和深度学习模型；在进行训练时，设置模型选择阈值，若当前已标注样本集P¹的样本数低于模型选择阈值则选择机器学习模型作为异常检测模型，反之则选择深度学习模型作为异常检测模型。

作为优选，机器学习模型采用xgboost模型。故而能够具有较低的样本量需求和较高的性能。

作为优选，步骤S4中，基于下述步骤获取未标注样本的代表性评分，

步骤S41、基于k-means算法对未标注样本集P²进行分簇；

步骤S42、基于分簇信息计算每个未标注样本的初始代表性评分；

步骤S43、对初始代表性评分进行去量纲处理，进而获取代表性评分。

通过步骤S41-S43，能够较佳地基于k-means算法获取每个未标注样本的代表性评分。

作为优选，步骤S41中，基于相似性评分进行分簇，并基于欧式距离计算两个未标注样本间的相似性评分；

对于未标注样本P_i ²和未标注样本P_j ²，其相似性评分sim(P_i ²，P_j ²)的计算公式为，

sim(P_i ²，P_j ²)＝-D(P_i ²，P_j ²)；

其中，D(P_i ²，P_j ²)为未标注样本P_i ²和未标注样本P_j ²间的欧式距离，

其中，和/>表示未标注样本P_i ²和未标注样本P_j ²中第t个对应特征的特征值，N为未标注样本的特征总数。

通过上述，能够较佳的实现对未标注样本集P²的分簇。

作为优选，步骤S42中，对于属于第k个簇的未标注样本/>其初始代表性评分/>的计算公式为，

其中，表示第k个簇/>的所包含的样本总数，/>为属于簇/>的样本。

基于上述，能够较佳地获取每个未标注样本的初始代表性评分。

作为优选，步骤S43中，对于未标注样本其初始代表性评分/>与代表性评分/>的计算公式为，

其中，表示所有未标注样本/>的最小初始代表性评分。

基于上述，能够较佳地实现归一化处理。

作为优选，B的值低于设定阈值。故而能够循序渐进地基于每次训练完成后的异常检测模型，对未标注样本进行重新排序和提取，故而能够较佳地提升样本选取的精确性。

附图说明

图1为实施例1中的一种基于动态策略和主动学习的异常检测系统构建系统的示意图；

图2为实施例1中的一种基于动态策略和主动学习的异常检测系统构建方法的示意图。

具体实施方式

为进一步了解本发明的内容，结合附图和实施例对本发明作详细描述。应当理解的是，实施例仅仅是对本发明进行解释而并非限定。

实施例1

结合图1所示，本实施例提供了一种基于动态策略和主动学习的异常检测系统构建系统，其包括：

通过本实施例中的异常检测系统构建系统，能够首先基于既有的已标注样本集完成异常检测模型的训练，若既有的已标注样本集的样本数已经符合要求则能够使得训练完成，若既有的已标注样本集的样本数不符合训练的要求数量，则能够通过样本信息量评分单元和输出单元选取并输出最有代表性的多个未标注样本，以实现对已标注样本集的增容及更新。通过此举，能够有效地选取出最有代表性的未标注样本以实现已标注样本集的更新扩容，故而使得能够利用更少的样本量达到更优的训练效果，基于此，能够有效地降低异常检测模型的搭建成本，且由于所选取的样本能够具有更佳的代表性，故而也能够带来异常检测模型训练效果的提升。

本实施例中，样本代表性是指能够带来更佳训练效果的样本；可以理解的是，对于诸如本实施例中的异常检测模型等人工智能模型，在对其进行训练时，所采用的样本集中的不同代表性的样本对训练结果的贡献存在显著不同；例如，1000个普通的训练样本可能其训练成效还达不到100个具有代表性的训练样本所能达到的成效。

此外，本实施例中，旨在择优地挑选出更具代表性的样本，至于异常检测模型具体如何构建、挑选出的样本如何标注等，并非本实施例中的方案所要解决的重点，故不予赘述。实质上，本实例中的方案，具有较为宽泛的通用性，因多数的人工智能模型在进行训练时，均面临如何构建训练样本集的问题。

结合图2所示，基于本实施例中的异常检测系统构建系统，本实施例还提供了一种基于动态策略和主动学习的异常检测系统构建方法，其包括如下步骤：

其中，为未标注样本/>的不确定分，

其中，abs(*)为取绝对值运算；

本实施例中，因能够较佳地选取出较为代表性的未标注样本，通过对其标注以获取训练所需的已标注样本集，故而能够较佳地有针对性地构建已标注样本集，且能够较佳降低对训练所需的样本量的要求。

此外，由于代表性评分能够基于不确定分和代表性评分综合计算获取，故而能够较佳地筛选出所携带信息量较高的未标注样本。其中，不确定分通过初步训练的异常检测模型获取，基于其公式可以看出，能够基给予异常预测分越接近0.5的样本更高的不确定分，故而能够较佳地对样本的不确定性进行表征。可以理解是的，本实施例中的异常检测模型为异常判定模型，其所输出的结果约接近1则表明越有可能为异常，其所输出的值越接近0则表明越有可能为正常，其所输出的值越接近0.5则表明越难以判定是否存在异常。

本实施例的方案中，能够通过主动学习的方式选择最优信息量的样本进行人工标注，从而能够实现通过更少的样本达到更好的效果的目的；通过融合不确定性和代表性计算样本的信息量，避免了选择的样本与真实分布严重不一致从而导致模型失效的问题。

本实施例的步骤S2中，异常检测模型包括机器学习模型和深度学习模型；在进行训练时，设置模型选择阈值，若当前已标注样本集P¹的样本数低于模型选择阈值则选择机器学习模型作为异常检测模型，反之则选择深度学习模型作为异常检测模型。

通过此举，能够借助训练所需样本量更少的机器学习模型作为过渡，以实现未标注样本的选择，进而能够完成最终所需要的基于深度学习的异常检测模型的训练。

也即，本实施的方案中，能够较佳地根据已标注样本的样本量去选择更合适的初始训练模型，当样本量比较少的时候，使用机器学习进行训练，降低过拟合风险，当样本量较多的时候，使用深度学习进行训练，降低欠拟合的风险。

可以理解的是，本实施例中的机器学习模型和深度学习模型仅仅为一种具体实现方案，其本质要求在于，异常检测模型中应当包括至少两种对训练样本量要求不同的模型。

本实施例中，机器学习模型采用xgboost模型。故而能够具有较低的样本量需求和较高的性能。

本实施例的步骤S4中，基于下述步骤获取未标注样本的代表性评分，

步骤S41、基于k-means算法对未标注样本集P²进行分簇；

本实施例的步骤S41中，基于相似性评分进行分簇，并基于欧式距离计算两个未标注样本间的相似性评分；

sim(P_i ²，P_j ²)＝-D(P_i ²，P_j ²)；

通过上述，能够较佳的实现对未标注样本集P²的分簇。

在进行步骤S41时，能够将所有未标注样本均基于k-means算法进行处理，通过设置k-means算法的相关参数，即可较佳的实现对未标注样本集P²的聚类分簇。本实施例中，能够设置k-means算法的簇数K为10，也即通过k-means算法能够将所有的未标注样本按照相似性分至10个不同的簇中。可以理解的是，k-means算法作为一种较为熟知的算法，其同簇样本间相似性最高，其不同簇样本间相似性最低。

本实施例中的k-means算法能够按照如下步骤进行：

a.在所有未标注样本中随机选取K(本实施例中K＝10)个样本作为中心点，分别记为C₁至C₁₀；

b.计算其余所有未标注样本至每个中心点的相似性评分，并将每个未标注样本/>划分至相似性评分最高的中心点所在的簇中，进而完成初始簇的获取；

c.在获取初始簇后，获取每簇的均值点作为新的中心点C₁ ^′至C₁ ^′ ₀，进而完成中心点C₁至C₁₀的更新；可以理解的是，均值点中的对应每个特征的特征值为该簇中所有样本的相应特征的均值；

d.重复步骤b和c，在完成设定循环如100次后，即可完成对未标注样本集P²的分簇。

本实施例的步骤S42中，对于属于第k个簇的未标注样本/>其初始代表性评分/>的计算公式为，

可以理解的是，

本实施例的步骤S43中，对于未标注样本其初始代表性评分/>与代表性评分/>的计算公式为，

其中，表示所有未标注样本/>的最小初始代表性评分。

基于上述，能够较佳地实现归一化处理。

本实施例中的方法在具体使用时：

在进行步骤S1时，能够从样本集P中选取已经标注完成的样本构建已标注样本集P¹，若样本集P中不存在已经标注完成的样本，则能够随机抽取例如100条样本，对其进行人工标注，进而构建已标注样本集P¹；

在进行步骤S2时，能够设置模型选择阈值为1000，即当前已标注样本集P¹的样本数低于1000时则选取机器学习模型对其进行训练，进而实现后续步骤的完成；当前已标注样本集P¹的样本数不低于1000时则选取深度学习模型进行训练，进而能够较佳地通过机器学习模型作为过渡，以实现最终的深度学习模型的获取；

在进行步骤S2时，能够设置设定阈值为10000，该设定阈值的取值能够基于对应深度学习模型的所需样本量或标注成本计算获取，故而能够较佳实现对样本标注总量的控制；

在进行步骤S5时，能够设置B的值低于设定阈值如100，故而能够循序渐进地基于每次训练完成后的异常检测模型，对未标注样本进行重新排序和提取，故而能够较佳地提升样本选取的精确性。

以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.基于动态策略和主动学习的异常检测系统构建系统，其包括：

2.基于动态策略和主动学习的异常检测系统构建方法，其包括如下步骤：

其中，为未标注样本/>的不确定分，

其中，abs(*)为取绝对值运算；

3.根据权利要求2所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：步骤S2中，异常检测模型包括机器学习模型和深度学习模型；在进行训练时，设置模型选择阈值，若当前已标注样本集P¹的样本数低于模型选择阈值则选择机器学习模型作为异常检测模型，反之则选择深度学习模型作为异常检测模型。

4.根据权利要求3所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：机器学习模型采用xgboost模型。

5.根据权利要求2所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：步骤S4中，基于下述步骤获取未标注样本的代表性评分，

步骤S41、基于k-means算法对未标注样本集P²进行分簇；

6.根据权利要求5所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：步骤S41中，基于相似性评分进行分簇，并基于欧式距离计算两个未标注样本间的相似性评分；

sim(P_i ²，P_j ²)＝-D(P_i ²，P_j ²)；

7.根据权利要求6所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：步骤S42中，对于属于第k个簇的未标注样本/>其初始代表性评分/>的计算公式为，

8.根据权利要求7所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：步骤S43中，对于未标注样本其初始代表性评分/>与代表性评分/>的计算公式为，

其中，表示所有未标注样本/>的最小初始代表性评分。

9.根据权利要求2所述的基于动态策略和主动学习的异常检测系统构建方法，其特征在于：B的值低于设定阈值。