CN112131575B - 一种基于分类错误率和一致性预测的概念漂移检测方法 - Google Patents

一种基于分类错误率和一致性预测的概念漂移检测方法 Download PDF

Info

Publication number
CN112131575B
CN112131575B CN202010992036.8A CN202010992036A CN112131575B CN 112131575 B CN112131575 B CN 112131575B CN 202010992036 A CN202010992036 A CN 202010992036A CN 112131575 B CN112131575 B CN 112131575B
Authority
CN
China
Prior art keywords
sample
classification
drift
concept
error rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010992036.8A
Other languages
English (en)
Other versions
CN112131575A (zh
Inventor
王勇
彭金雪
张继
刘振岩
薛静锋
林珂卉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202010992036.8A priority Critical patent/CN112131575B/zh
Publication of CN112131575A publication Critical patent/CN112131575A/zh
Application granted granted Critical
Publication of CN112131575B publication Critical patent/CN112131575B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/554Detecting local intrusion or implementing counter-measures involving event detection and direct action
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于分类错误率和一致性预测的概念漂移检测方法,属于计算机机器学习和信息安全技术领域。本方法首先通过计算模型分类错误率的变化来检测突变型概念漂移,然后通过计算分类错误的样本与分类正确的样本一致性程度来检测渐进型概念漂移,从而能及时检测突变型概念漂移和渐进型概念漂移,且保持较小的计算开销。本方法实现了在较低计算成本下对突变型概念漂移和渐进型概念漂移的检测,及时识别模型退化现象。本方法主要用于概念漂移检测,能有效作用于机器学习分类模型退化现象的早期判定,可以作为大数据环境下自动化分析和决策等各种应用领域的性能监测方法。

Description

一种基于分类错误率和一致性预测的概念漂移检测方法
技术领域
本发明提出了一种基于分类错误率和一致性预测的概念漂移检测方法,属于计算机机器学习和信息安全技术领域。
背景技术
随着大数据时代的到来,机器学习算法在众多领域的应用飞速发展。其中,基于大数据技术的信息安全是近几年最活跃的研究热点之一,出现了大量代码克隆检测模型、恶意代码分类模型、漏洞预测模型、缺陷预测模型等机器学习分类模型,这些模型在构建时都获得了极高的准确率。
在信息安全领域,软件随时间不断演化,出现了不同的类别。以恶意软件为例,根据行为特点可以分为木马、蠕虫等大类,还可以进一步细分成小类,这种小类被称为家族。同一家族的恶意软件还可以演化成不同变种。恶意软件的大类变化较小,新的家族不断出现,有些家族还不断产生变种。分析表明,不同家族之间的差异较大,同一家族的不同变种之间差异较小,因此新家族的产生会引起恶意代码出现突变型概念漂移,而新变种的产生则引起渐进型概念漂移。由此可见,为了提高软件分类器的可持续性,在新软件不断出现的情况下长期保持较高的准确率,有必要及时准确地检测软件中的概念漂移,包括突变型概念漂移和渐进型概念漂移。
攻击者为了逃避检测,通过变形等混淆技术以及0Day漏洞的利用,使得恶意代码在不断变异和进化,其分布随时间发生改变,产生了概念漂移现象,最终导致以前构建的分类模型无法正确地对漂移数据进行分类,引起模型退化问题。恶意代码通过加壳、变形、混淆等技术不断生成新的变种,随着时间会产生两种类型的概念漂移,突变型概念漂移和渐进型概念漂移。突变型概念漂移表现为恶意代码数据流中有较多的数据在短时间内发生变异和进化,类标签与之前的完全不同,此时若使用原先的模型对其进行预测,将无法得到较准确的结果。渐进型概念漂移是指恶意代码数据中部分数据在缓慢地进化和变异,若取进化过程中的一段时间的数据进行检测,由于变化程度较小,容易被检测机制遗漏,将无法准确识别概念漂移现象。DDM(Drift Detection Method)是最常用的概念漂移检测方法且具有较好的检测准确率,通过观察当前模型对最新的数据集的分类性能来判断最新的数据集中是否包含概念漂移,若模型的分类性能出现大幅下降,则说明新训练集中包含概念漂移。DDM检测法可适用于任何分类算法,且其计算效率高,能检测突变型概念漂移,然而,出现渐进型概念漂移时,该算法则无法及时识别。由于渐进型概念漂移具有变化缓慢的特点,而现有分类算法往往根据属于某个类别的概率来评价其判定结果,无法准确地对被错误分类的与训练的不一致程度进行统计量化分析,因此不能及时检测出渐进型概念漂移对分类效果的影响。
因此,需要一种能及时识别模型出现退化迹象的概念漂移检测方法,为分类模型的更新提供依据,最终保持分类模型的可持续性,即在不断出现新的恶意代码变种的情况下依然保持较高的分类准确率。
发明内容
本发明的目的是为了解决信息安全中软件分析领域中机器学习分类模型概念漂移检测的技术问题,创造性地提出一种分类错误率和一致性预测相结合的概念漂移检测方法,对于评估当前信息安全领域中迅速增多的基于机器学习分类算法的安全检测或测评系统在面对不断演化的恶意软件时的性能和持续性,具有重要的现实意义。
本方法,首先通过计算模型分类错误率的变化来检测突变型概念漂移,然后通过计算分类错误的样本与分类正确的样本一致性程度来检测渐进型概念漂移,从而能及时检测突变型概念漂移和渐进型概念漂移,且保持较小的计算开销。
本方法的技术方案包括两个部分,即基于分类错误率的突变型概念漂移检测和基于一致性预测器的渐进型概念漂移检测。
其中,基于分类错误率的突变型概念漂移检测,是通过检测样本数据分布的改变来检测概念漂移。当概念发生变化时,数据的分布发生改变,分类模型会对发生漂移的样本产生错误的分类预测,因此,如果分类错误率增加,则表明发生了概念漂移。首先使用分类模型对样本进行分类,标记分类错误的样本,并计算分类错误率,若分类错误率大于漂移阈值,则说明发生突变型概念漂移。
若所有样本都完成分类,而分类错误率仍小于漂移阈值,则进一步使用一致性预测器算法检测渐进型概念漂移。通过计算分类错误的样本的p值,判断分类错误的样本中是否存在以前未出现的新类,若存在样本的p值小于漂移阈值,则说明数据发生渐进型概念漂移,若所有分类错误的样本的p值都大于漂移阈值,则说明数据未发生概念漂移。
有益效果
本发明方法,旨在通过识别机器学习分类模型的退化现象,进行概念漂移的检测,特别是突变型概念漂移和渐进型概念漂移的检测。本方法,通过分类错误率来检测突变型概念漂移,通过计算分类错误的样本与分类正确的样本的一致性程度来检测渐进型概念漂移,实现了在较低计算成本下对突变型概念漂移和渐进型概念漂移的检测,及时识别模型退化现象。本发明主要用于概念漂移检测,能有效作用于机器学习分类模型退化现象的早期判定,可以作为大数据环境下自动化分析和决策等各种应用领域的性能监测方法。
与现有最好技术相比,本发明的优点在于:
1.本发明能够同时检测突发型概念漂移和渐进型概念漂移,适用于检测恶意软件样本中的新家族和新变种,进而有效评估基于机器学习分类算法的安全检测或测评系统的可持续性;
2.本发明将分类错误率和一致性度量有机结合,先检测突发型概念漂移,仅在错误率低于漂移阈值的情况下,即没有突发型概念漂移时,才只对出现分类错误的样本进行一致性度量,与仅使用一致性检测器的检测方法相比,计算量大大降低。
附图说明
图1是本发明所述方法的流程图。
图2是漂移阈值计算流程图。
具体实施方式
下面结合附图和实施例对本发明方法做进一步详细说明。
一种分类错误率和一致性预测相结合的概念漂移检测方法,将分类错误率变化检测和一致性预测器相结合,能够检测因突变型概念漂移和渐进型概念漂移引起的任意机器学习分类模型的退化问题。
本发明方法,包括基于分类错误率的突变型概念漂移检测和基于一致性预测器的渐进型概念漂移检测两部分,其流程如图1所示。
步骤一:使用分类模型对样本进行分类。
将测试数据集的数据依次输入分类模型进行分类,输入的样本序列记为(xi,yi),xi是样本的多维特征,yi是样本真实类别标签,模型对xi的预测标签是yi^,通过比较yi和yi^,确定样本i的预测结果是否正确。
步骤二:基于分类错误率的突变型概念漂移检测。
标记分类错误的样本,并计算此时的分类错误率err和标准偏差s。对于样本i,分类错误率erri为该时刻分类结果中分类错误的概率,对应的标准偏差为si=sqrt(erri(1-erri)/i)。若分类错误率和标准偏差之和大于漂移阈值,则表示该模型发生概念漂移,若小于漂移阈值,则继续下一个样本的分类。若测试数据集中最后一个样本的分类错误率和标准偏差之和小于漂移阈值,则未发生突变型概念漂移,并进一步执行基于一致性预测器的检测。
其中,所述漂移阈值的计算过程如图2所示,将分类错误率err的最小值errmin和标准偏差s的最小值smin初始化为1,样本数据依次输入分类模型进行分类,并计算分类错误率erri和标准偏差si,若erri<errmin,则用erri替换errmin;若si<smin,则用si替换smin,直到样本数据全部完成分类,得到分类错误率最小值errmin和标准偏差最小值smin。将置信水平设为99%,漂移阈值为errmin+3smin
步骤三:基于一致性预测器的渐进型概念漂移检测。
本发明使用一致性预测器的核心算法,来衡量样本与其他样本的一致性程度。所述一致性预测器算法(Comformal Predictor,CP),是一种域预测分类算法,通过分析待测样本和已知类别标签的样本之间的内在联系,预测出待测样本的类别域,并使用置信度对预测的类别域进行评估。
通过基于分类错误率的检测后,测试数据集中每个样本数据都对应一种分类结果。基于一致性预测的方法将分类错误的样本作为待测数据集,分类正确的样本作为已知类别标签的样本数据集B=(z1,z2,...,zn-1),对于待测数据集中的每一个待测样本zn=(xi,yi),将所有可能的类别都赋值给类别标签yi,若有m个类别,则yi=1,2,...,m。将待测样本加入到样本数据集B中,构成m个待检验样本序列{z1,z2,...,zn-1,zn=(xn,yn)},yn=1,2,...,m,每个待检验样本序列包含n个样本。对m个待检验样本序列分别进行随机性检验。步骤如下:
第一步:通过奇异值映射函数A(B,z),得到样本数据集B中所有样本和待测样本的奇异值αi。奇异值映射函数使用机器学习算法挖掘样本之间的内在联系来计算奇异值。该检测算法使用距离来表示待测样本与数据集B中样本的一致程度,若距离越小,则待测样本与样本数据集B中样本越相似。利用KNN算法的思想,定义奇异值映射函数,如式(1)所示:
Figure BDA0002691149680000051
其中,
Figure BDA0002691149680000052
表示在样本数据集中与样本zi同类的k个最近邻样本的距离之和,
Figure BDA0002691149680000053
表示与样本zi不同类的k个最近邻样本的距离之和。
第二步:通过奇异值计算待测样本的每个可能的类别标签对应的p值,p值表示在样本序列B中比待测样本奇异值大的样本数量占样本总数的比例,即
Figure BDA0002691149680000054
对于每个待测样本zi,计算得到m个p值zi:p=(p1,p2,...,pm)。p值越大,表明待测样本zn与样本序列B的相似性越高,待测样本zn对应的类别是该样本的真实类别的可能性越大。p值越小,表明待测样本对应的类别为该样本的真实类别的可能性越小。若待测样本所有类别对应的p值都接近0,则可认为该样本不属于已知类别。
第三步:通过p值的大小识别不属于已知类别的新样本,进而判断是否发生渐进型概念漂移。对于步骤一中分类错误的样本可能存在两种情况:一种是样本被错误地分类,但真实类别属于已知类别,另一种是样本被错误地分类,但实际上不属于任何一种已知类别。若待测样本为第一种情况,则至少有一个类别标签对应的p值不接近0,即待测样本的最大p值不接近0。若待测样本为第二种情况,则每个类别标签对应的p值都接近0,即待测样本的最大p值接近0。因此,可以通过判断待测样本的m个p值中的最大值是否接近0来判断该样本是否属于已知类别。
由于接近0是一个比较模糊的概念,本方法通过设置漂移阈值,比较待测样本的p值与漂移阈值的大小来判断是否存在新类。计算所有属于已知类别的样本的p值,包括正确分类样本和错误分类样本,将所有p值的最小值作为漂移阈值。若存在待测样本的p值小于漂移阈值,则待测样本中存在不属于已知类别的新类,即数据发生了渐进型概念漂移。若所有待测样本的p值都大于漂移阈值,则数据未发生渐进型概念漂移。

Claims (4)

1.一种基于分类错误率和一致性预测的概念漂移检测方法,其特征在于,
首先,通过计算模型分类错误率的变化来检测突变型概念漂移,然后,通过计算分类错误的样本与分类正确的样本一致性程度来检测渐进型概念漂移;
其中,基于分类错误率的突变型概念漂移检测,是通过检测样本数据分布的改变来检测概念漂移;当概念发生变化时,数据的分布发生改变,分类模型会对发生漂移的样本产生错误的分类预测,因此,如果分类错误率增加,则表明发生了概念漂移;首先使用分类模型对样本进行分类,标记分类错误的样本,并计算分类错误率,若分类错误率大于漂移阈值,则说明发生突变型概念漂移;
若所有样本都完成分类,而分类错误率仍小于漂移阈值,则进一步使用一致性预测器算法检测渐进型概念漂移;通过计算分类错误的样本的p值,判断分类错误的样本中是否存在以前未出现的新类,若存在样本的p值小于漂移阈值,则说明数据发生渐进型概念漂移,若所有分类错误的样本的p值都大于漂移阈值,则说明数据未发生概念漂移。
2.如权利要求1所述的一种基于分类错误率和一致性预测的概念漂移检测方法,其特征在于,使用分类模型对样本进行分类的方法为:
将测试数据集的数据依次输入分类模型进行分类,输入的样本序列记为(xi,yi),xi是样本的多维特征,yi是样本真实类别标签,模型对xi的预测标签是yi^,通过比较yi和yi^,确定样本i的预测结果是否正确。
3.如权利要求1所述的一种基于分类错误率和一致性预测的概念漂移检测方法,其特征在于,基于分类错误率的突变型概念漂移检测的过程为:
标记分类错误的样本,并计算此时的分类错误率err和标准偏差s;
对于样本i,分类错误率erri为该时刻分类结果中分类错误的概率,对应的标准偏差为si=sqrt(erri(1-erri)/i);若分类错误率和标准偏差之和大于漂移阈值,则表示该模型发生概念漂移,若小于漂移阈值,则继续下一个样本的分类;若测试数据集中最后一个样本的分类错误率和标准偏差之和小于漂移阈值,则未发生突变型概念漂移,并进一步执行基于一致性预测器的检测;
其中,所述漂移阈值的计算过程,将分类错误率err的最小值errmin和标准偏差s的最小值smin初始化为1,样本数据依次输入分类模型进行分类,并计算分类错误率erri和标准偏差si,若erri<errmin,则用erri替换errmin;若si<smin,则用si替换smin,直到样本数据全部完成分类,得到分类错误率最小值errmin和标准偏差最小值smin;将置信水平设为99%,漂移阈值为errmin+3smin
4.如权利要求1所述的一种基于分类错误率和一致性预测的概念漂移检测方法,其特征在于,基于一致性预测器的渐进型概念漂移检测的过程为:
使用一致性预测器的核心算法,来衡量样本与其他样本的一致性程度;所述一致性预测器算法,是一种域预测分类算法,通过分析待测样本和已知类别标签的样本之间的内在联系,预测出待测样本的类别域,并使用置信度对预测的类别域进行评估;
通过基于分类错误率的检测后,测试数据集中每个样本数据都对应一种分类结果;基于一致性预测的方法将分类错误的样本作为待测数据集,分类正确的样本作为已知类别标签的样本数据集B=(z1,z2,...,zn-1),对于待测数据集中的每一个待测样本zn=(xi,yi),将所有可能的类别都赋值给类别标签yi,若有m个类别,则yi=1,2,...,m;将待测样本加入到样本数据集B中,构成m个待检验样本序列{z1,z2,...,zn-1,zn=(xn,yn)},yn=1,2,...,m,每个待检验样本序列包含n个样本;对m个待检验样本序列分别进行随机性检验;
步骤如下:
第一步:通过奇异值映射函数A(B,z),得到样本数据集B中所有样本和待测样本的奇异值αi;奇异值映射函数使用机器学习算法挖掘样本之间的内在联系来计算奇异值;该检测算法使用距离来表示待测样本与数据集B中样本的一致程度,若距离越小,则待测样本与样本数据集B中样本越相似;利用KNN算法的思想,定义奇异值映射函数,如式(1)所示:
Figure FDA0002691149670000021
其中,
Figure FDA0002691149670000022
表示在样本数据集中与样本zi同类的k个最近邻样本的距离之和,
Figure FDA0002691149670000023
表示与样本zi不同类的k个最近邻样本的距离之和;
第二步:通过奇异值计算待测样本的每个可能的类别标签对应的p值,p值表示在样本序列B中比待测样本奇异值大的样本数量占样本总数的比例,即
Figure FDA0002691149670000024
对于每个待测样本zi,计算得到m个p值zi:p=(p1,p2,...,pm);p值越大,表明待测样本zn与样本序列B的相似性越高,待测样本zn对应的类别是该样本的真实类别的可能性越大;p值越小,表明待测样本对应的类别为该样本的真实类别的可能性越小;若待测样本所有类别对应的p值都接近0,则可认为该样本不属于已知类别;
第三步:通过p值的大小识别不属于已知类别的新样本,进而判断是否发生渐进型概念漂移;对于步骤一中分类错误的样本可能存在两种情况:一种是样本被错误地分类,但真实类别属于已知类别,另一种是样本被错误地分类,但实际上不属于任何一种已知类别;若待测样本为第一种情况,则至少有一个类别标签对应的p值不接近0,即待测样本的最大p值不接近0;若待测样本为第二种情况,则每个类别标签对应的p值都接近0,即待测样本的最大p值接近0;通过判断待测样本的m个p值中的最大值是否接近0来判断该样本是否属于已知类别。
CN202010992036.8A 2020-09-21 2020-09-21 一种基于分类错误率和一致性预测的概念漂移检测方法 Active CN112131575B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010992036.8A CN112131575B (zh) 2020-09-21 2020-09-21 一种基于分类错误率和一致性预测的概念漂移检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010992036.8A CN112131575B (zh) 2020-09-21 2020-09-21 一种基于分类错误率和一致性预测的概念漂移检测方法

Publications (2)

Publication Number Publication Date
CN112131575A CN112131575A (zh) 2020-12-25
CN112131575B true CN112131575B (zh) 2022-09-30

Family

ID=73841875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010992036.8A Active CN112131575B (zh) 2020-09-21 2020-09-21 一种基于分类错误率和一致性预测的概念漂移检测方法

Country Status (1)

Country Link
CN (1) CN112131575B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033643B (zh) * 2021-03-17 2022-11-22 上海交通大学 基于带权重采样的概念漂移检测方法、系统及电子设备
CN113418632B (zh) * 2021-05-20 2024-02-09 南昌大学 一种油浸式变压器油温预测的概念漂移检测方法
CN114079579B (zh) * 2021-10-21 2024-03-15 北京天融信网络安全技术有限公司 一种恶意加密流量检测方法及装置
CN116306931B (zh) * 2023-05-24 2023-08-04 典基网络科技(上海)有限公司 一种应用工业领域的知识图谱构建方法
CN117930813B (zh) * 2024-01-23 2024-09-24 中国人民解放军国防科技大学 Trt静叶控制系统故障检测方法、产品、介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033836A (zh) * 2018-07-24 2018-12-18 南开大学 基于统计学习的恶意代码多模型交叉检测方法
CN111478904A (zh) * 2020-04-08 2020-07-31 莆田学院 一种基于概念漂移的物联网设备通信异常检测方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11481665B2 (en) * 2018-11-09 2022-10-25 Hewlett Packard Enterprise Development Lp Systems and methods for determining machine learning training approaches based on identified impacts of one or more types of concept drift

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033836A (zh) * 2018-07-24 2018-12-18 南开大学 基于统计学习的恶意代码多模型交叉检测方法
CN111478904A (zh) * 2020-04-08 2020-07-31 莆田学院 一种基于概念漂移的物联网设备通信异常检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
一种挖掘概念漂移数据流的选择性集成算法;关菁华等;《计算机科学》;20100115(第01期);全文 *
基于一致性预测算法的内网日志检测模型;顾兆军等;《信息网络安全》;20200310(第03期);全文 *

Also Published As

Publication number Publication date
CN112131575A (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN112131575B (zh) 一种基于分类错误率和一致性预测的概念漂移检测方法
CN111314331B (zh) 一种基于条件变分自编码器的未知网络攻击检测方法
CN110691100B (zh) 基于深度学习的分层网络攻击识别与未知攻击检测方法
JP6941123B2 (ja) 適応型追加学習を用いた細胞のアノテーション法及びアノテーションシステム
CN112637132B (zh) 一种网络异常检测方法、装置、电子设备和存储介质
CN112491796B (zh) 一种基于卷积神经网络的入侵检测及语义决策树量化解释方法
JP7044117B2 (ja) モデル学習装置、モデル学習方法、及びプログラム
CN116453438B (zh) 一种显示屏参数检测方法、装置、设备及存储介质
CN111343147B (zh) 一种基于深度学习的网络攻击检测装置及方法
CN112949735A (zh) 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法
CN114746859A (zh) 评价方法、评价程序以及信息处理装置
CN114218998A (zh) 一种基于隐马尔可夫模型的电力系统异常行为分析方法
Jabbar Local and global outlier detection algorithms in unsupervised approach: a review
CN114584377A (zh) 流量异常检测方法、模型的训练方法、装置、设备及介质
Zhang et al. Robust KPI anomaly detection for large-scale software services with partial labels
CN113343123B (zh) 一种生成对抗多关系图网络的训练方法和检测方法
CN113837002A (zh) 基于改进TimeGan模型的小样本数据故障诊断方法
CN117614664A (zh) 基于攻击警告权重聚类的多阶段攻击预测方法
CN113553319A (zh) 基于信息熵加权的lof离群点检测清洗方法、装置、设备及存储介质
JP4559974B2 (ja) 管理装置及び管理方法及びプログラム
KR20240039407A (ko) 악성코드 변종 분석을 위한 ai 모델의 견고성 측정 시스템 및 어플리케이션
CN115017019B (zh) 一种基于日志的系统异常检测方法、装置及存储介质
CN116226673B (zh) 缓冲区漏洞识别模型的训练方法、漏洞检测方法及装置
CN118070024B (zh) 基于深度学习的用户行为数据处理方法及系统
CN113138924B (zh) 一种基于图学习的线程安全代码识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant