CN110348480A - 一种非监督异常数据检测算法 - Google Patents

一种非监督异常数据检测算法 Download PDF

Info

Publication number
CN110348480A
CN110348480A CN201910485030.9A CN201910485030A CN110348480A CN 110348480 A CN110348480 A CN 110348480A CN 201910485030 A CN201910485030 A CN 201910485030A CN 110348480 A CN110348480 A CN 110348480A
Authority
CN
China
Prior art keywords
algorithm
value
formula
score
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910485030.9A
Other languages
English (en)
Inventor
张智
刘子瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Lichen Technology Co Ltd
Original Assignee
Hangzhou Lichen Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Lichen Technology Co Ltd filed Critical Hangzhou Lichen Technology Co Ltd
Priority to CN201910485030.9A priority Critical patent/CN110348480A/zh
Publication of CN110348480A publication Critical patent/CN110348480A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提供了一种非监督异常数据检测算法,涉及技术领域,包括将输入的数据点与历史数据进行比较,获取历史记录中相关的条目,剔除不相关条目;通过若干静态统计算法分别对比较之后的数据点进行评分并输出分数;通过归一化算法集成上述各个静态统计算法的分数,并产生最终分数输出;将最终分数和阈值进行比较后,对数据进行分类标记。本发明采用多种算法组合的形式实现数据异常检测,结果通过多种算法进行独立评分最后共同决策,提高了异常检测的可靠性。

Description

一种非监督异常数据检测算法
技术领域
本发明涉及一种基于上下文的非监督异常检测机器学习算法,尤其是一种联 合使用统计方法和分类归并方法由多种算法得到共识结果的非监督异常检测算 法,属于数据异常检测技术领域。
背景技术
越来越多的数据通过网络传输使得网络变得越来越拥挤,这种数据的增长可 能会导致异常,比如从一端发送的数据是否能在另一端及时、恰当地接收到。随 着现代数字通信领域的发展,异常检测方面的技术进步已经成为非常重要的一方 面,亟需找到更快、更有效的方法来解决异常检测问题。
随着互联网的发展,网络中的数据流量越来越大,针对这种现象,现已有一 种概率统计方法是使用自适应阈值检测方法来进行数据检测的,可以测量数值是 否超过阈值的方法,这个阈值是自适应的,由过去测量值的平均值计算得到,使 用一个变量来计算超过阈值的连续测量值,在连续超过一定数量的测量值后,会 触发警报。在分级的数据异常检测方面,有另一种概率型方法被称为“Tiresias”, 该方法将传入的数据集过滤并聚集在某些区域,其中某个区域意味着该区域中包 含的数据具有较高的异常概率。Tiresias的工作原理是抽象一组传入的数据点, 将其组织在网格中,然后将其划分为时间单位,一旦数据在时域中分离,异常的 识别就开始了,然后对数据进行分析,以发现季节性的模式。考虑到时间序列及 其季节性,该方案具有发现任何潜在异常所需的所有参数,并对所有数据集重复 此过程。用该方法进行异常检测时,如果有一个非常小的子集,可能是一个单点, 应该被认为是异常的,但由于它是在一个低异常的区域,那么它将被错误地归类 为正常。
但类似于上述提到的概率统计方法存在以下缺陷:这种方法可以得到它所访 问的数据中某个区域的异常概率,或者得出数据的分布图,但是无法检测数据是 否错误或分类错误。
异常检测通常分为三类:监督异常检测、半监督异常检测和非监督异常检测。 在监督异常检测中,将异常检测方案作为一组选定的参考值作为输入,该方案可 以立即知道任何与参考数据的值或模式不匹配的传入数据是异常的,但是监督异 常检测方案不适合分析具有多个或多个不同“正确性”级别的数据,除非专家的 迭代参与和参考数据的更新是可维护的。半监督异常检测可以看作是监督和非监 督异常检测方案的混合,因为它同时使用有标记数据和无标记数据,然而,半监 督技术的可信度依赖于模型,也就是依赖于算法中的学习机制。非监督异常检测 中,参考数据(如果有的话是)是不用给定标签的,它的工作是在给定的输入数 据中查找与其他输入数据中呈现的值或模式不匹配的值或模式。
现有很多非监督异常检测方法都是基于聚类方法的,但是所有单一的算法检 测的结果都是片面的。
基于此,本案由此产生。
发明内容
为了解决现有技术中存在的上述缺陷,本发明提供了一种非监督异常数据检 测算法,以提高检测的可靠性。
为了实现上述目的,本发明采取的技术方案如下:
一种非监督异常数据检测算法,包括以下:
(1)将输入的数据点与历史数据进行比较,获取历史记录中相关的条目, 剔除不相关条目;
(2)通过若干静态统计算法分别对比较之后的数据点进行评分并输出分数;
(3)通过归一化算法集成上述各个静态统计算法的分数,并产生最终分数 输出;
(4)将最终分数和阈值进行比较后,对数据进行分类标记。
作为优选,所述步骤(2)中,所述静态算法采用泊松算法、桶聚类算法、 均值算法和中值算法。
作为优选,所述泊松算法评分是将数据建模为带有X个箱子的直方图,其中 X是被建模的数据集中所有条目的最大值,具体步骤如下:
第一步:通过概率质量函数计算检测值的可能性概率,计算方法如公式1:
公式1:
当前检测值表示为x,λ为集合的平均值;
第二步:计算引用概率Pref,计算方法如公式2:
公式2:
第三步:计算分数,去除Pref和P(x,λ)的比值为1的值,对相似的值给 出较低的分数,而对不相似的值给出较高的分数,评分方法如公式3:
公式3:
其中S代表分数值,P代表第一步中的可能性概率。
作为优选,所述桶聚类算法评分步骤中,遍历所有历史数据,并创建十个同 样宽的桶,每个桶都被位于a和b之间的每个值“填充”,通过计算输入数据点 所在桶的高度与所有高度之和的比较,建立0到1之间的评分值,该评分值表示 与传入数据点的集群匹配的历史点的数量。
作为优选,所述均值算法评分包括以下步骤:
第一步:计算标准差,计算方法如公式4:
公式4:
其中N是集合中元素的个数,yi表示分布集合中每个单独的值,μ是匹配集 中的均值;
第二步:计算分数,计算方法如公式5:
公式5:
其中x是被检测的值,μ是匹配集中的均值,σ是第一步中计算出的标准差, c是一个常数。
作为优选,所述中值算法评分包括以下步骤:
第一步:计算绝对中位差,计算方法如公式6:
公式6:MAD=median(|Yi-median(Y)|)
第二步:计算分数,计算方法如公式7:
公式7:
其中,m是匹配集的中值,Y代表匹配集中所有的值,yi表示集合Y中的单 独的值,c表示调节中值算法灵敏度的参数。
作为优选,所述步骤(3)中具体包括以下步骤:
第一步:分别为各个静态统计算法创建分数,将每个单独算法的分数ai作为 每个级别和每个度量的输入,以及每个分布集中元素个数N作为输入,并通过 公式8为每一级L和各个算法分数的度量M创建分数;
公式8:
第二步:计算一致意见的最终分数,将结果fi放入集合F中,计算公式如公 式9:
公式9:
其中表示F中所有值的平均值,V是F的方差。
作为优选,所述步骤(4)中,用t表示阈值,0≤t≤1,S(x)表示最终分数, S(x)≥t,该检测值为异常,标记为正结果,如果该检测是正确的则标记为真正, 如果发现实际情况下应该是负结果则标记为假正;S(x)<t时,该检测值为正常, 标记为负结果,如果该检测是正确的则标记为真负,如果发现在实际情况下应该 是正结果则标记为假负。
作为优选,所述步骤(4)中,将没有标记的数据添加到历史数据中。
本发明的工作原理:本发明通过多种算法共同决策从而实现异常检测,本发 明中算法集成了泊松(Poisson)算法、桶聚类(Bucket clustering)算法、均值算 法(Meanalgorithm)、中值算法(Median algorithm)和一种归一化算法 (NormalizationAlgorithm)。前四种算法会访问历史数据,独立的给出自己的评 分,在归一化算法中对每级算法的评分都会输出一个标签分数。异常检测有“评 分”和“分类”两个部分组成,归一化算法得出的一致性意见得分的分数被用来 分类。采用算法集成可以不同的角度分析数据,在一组数据中以不同的方式寻找 异常,一种算法的可靠性可以与其他算法进行验证,并以在线方式创建更精确的 分类。
本发明能实现如下技术效果:
(1)本发明采用多种算法组合的形式实现异常检测,结果需要多种算法进 行独立评分最后共同决策,提高了异常检测的可靠性。
(2)本发明为数字通信中数据的不规则问题提供解决方案,实现一个基于 上下文内容的支持非监督异常检测的自动异常检测方案,该方案将是一个新的概 念验证框架的一部分,该框架支持已实现的异常检测技术的测试、仿真和可视化。 各种异常检测方法的功能被合并到本发明的异常检测框架中,以便收集关于任意 异常检测技术有效的结果。
(3)本发明是基于非监督学习的异常检测,检测过程中无需为数据给定标 签,因此可以避免标签数据影响未来的预测。
(4)本发明在数据处理过程中是基于上下文的异常检测,对历史数据是可 以完全访问的,只需要提供被检测的数据,不用再给定历史记录的时间范围相关 信息。
(5)本发明中只要数据是结构化的,都可以进行异常数据的检测,而不仅 仅可以得到异常概率,还可以检测数据是否错误或分类错误,并显示发生异常之 处。
(6)本发明的框架是通用的,能够适应不同的系统与微调参数,本发明不 仅使用非常基本的统计度量来提供合理的输出,而且足够模块化,可以在任何操 作时间序列数据的设置中工作,模块化可以满足其他系统的设计需求,方便后续 维护或者更换。
附图说明
图1为本实施例一种非监督异常数据检测算法的可视化框架图;
图2为本实施例一种非监督异常数据检测算法在特定地址和特定服务网络 的情况下对所有消息的接收数量统计图;
图3为本实施例一种非监督异常数据检测算法中的桶聚类算法的可视化表 示图;
图4为本实施例一种非监督异常数据检测算法中的中值算法的可视化表示 图。
其中,图2中横轴表示接收数量,纵轴表示交互次数,虚线表示平均值(37.44), 实线表示中值(24.0);图3中横轴表示消息的接收数量,纵轴表示交互次数;如 图4中横轴表示所检测数据的时间,纵轴表示消息接收次数。
具体实施方式
为了使本发明的技术手段及其所能达到的技术效果,能够更清楚更完善的披 露,兹提供了以下实施例,并结合附图作如下详细说明:
本实施例的一种由多种算法集成的非监督异常检测算法的目的是为数字通 信中数据的不规则问题提供解决方案。如图1所示,本实施例通过集成泊松 (Poisson)算法、桶聚类(Bucket clustering)算法、均值算法(Mean algorithm)、 中值算法(Medianalgorithm)和一种归一化算法(Normalization Algorithm)实 现一个基于上下文内容的支持非监督异常检测的自动异常检测方案。前四种算法 独立工作,会访问历史数据,给出自己的评分,在归一化算法中会生成分数并且 每级算法都会输出一个分数标签。
本实施例数据结构中每条数据有6个属性,索引值分别为0,1,2,3,4,5。第一 列及索引值为0,该列属性可以修改。本实施例使用的案例数据中,每条数据有 6个属性分别是:发生时间、地址、服务网络、程序类型、接收数量和交互次数。 设置索引值是{1,2,3}的为级别指标,{4,5}为度量指标,就是指第二、三、四列为 级别指标,第五、六列是度量指标。非常相似的数值会分布在相似的时间周期内, 如图2所示为在特定地址和特定服务网络的情况下,对所有消息的接收数量进行 计数的条形统计图,横轴表示接收数量,纵轴表示交互次数,平均值(37.44)用虚 线表示,中值(24.0)用实线表示。从图中可以看出,分布呈右偏态,在任意给定 的时间段内,低值较多,高值较少,并且大多数点都位于中值附近,可见中值对异常检测具有重要作用。归一化算法在生成分数之后,通过将分数与阈值进行比 较从而输出分类标签,传入的数据点是在每个算法中使用后添加到历史记录中的。 基于本实施例使用各种属性组合和消息发送时间点访问数据的方式,本实施例使 用一种基于数据可以使用单变量回归分析建模的概率方法来扩展异常检测方案, 这样可以创建计数数据的样本,其中每个样本都表示期望值。
本实施例方法的解决方案具体如下:
1、将输入的数据点与历史数据进行比较;
在特定上下文的历史数据中选择性地匹配与特定时间间隔t相关的值,即对 于任何正在检测的给定数据,获取历史记录中与某个时间间隔相关的条目,涉及 到的方法如下:
(1)给定数字通信数据q的发生时间即为提取的时间戳,表示为T;
(2)给定需要检测的数据q的标识符键值用于查找数据结构的哪个部分, 以及树中的哪个节点要访问。历史数据中与q键匹配的所有条目被临时复制到列 表L中;
(3)所有在L中的时间戳与T在工作日相同的条目都保存在L中,其余的 则被舍弃。L中与T的小时、分钟和秒数相差超过±t/2秒的所有项都被丢弃;
(4)在L中剩下的都是历史记录,它们与某个键组合匹配,在不同周的同 一工作日的同一时间和q相匹配。
2、泊松算法、桶聚类算法、均值算法、中值算法分别在与历史数据进行比 较之后输出评分,传入的数据点使用之后将添加到历史记录中;
(1)泊松算法进行评分
泊松算法将数据建模为带有X个箱子的直方图,其中X是被建模的数据集中 所有条目的最大值,即一个条目所匹配到的历史记录。
第一步:通过概率质量函数(PMF)计算检测值的可能性概率,如公式1所示。
泊松分布的概率质量函数定义。
公式1:
当前检测值表示为x,λ为集合的平均值。本实施例中以两个类似的集合为 例,集合1:0,1,2,3,3,3,3,3,5,6,7,9;集合2:0,1,2,3,3,3,3,3,4,5,6,22。将这些集合 建模为随机泊松变量,使用公式1确定一个值的可能性的概率,其中取集合的平 均值作为参数,即λ1=3.75,λ2≈4.58。所以当x=3时,可以算出P1=P(3,3.75) ≈0.21,P2=P(3,4.58)≈0.16。
第二步:计算引用概率Pref,用于和第一步中计算的可能性概率作比较。如 果两者近似,即Pref≈P(x,λ),比值将接近或等于1,如果它们相差很大,比值 将接近于0。计算方法如公式2所示。
公式2:
第三步:计算分数,去除Pref和P(x,λ)的比值为1的值,对相似的值给出 较低的分数,而对不相似的值给出较高的分数。评分方法如公式3所示,S代表 分数值,P代表第一步中的可能性概率。
公式3:
通过上述计算,在本实施例中可得到Pref1≈0.21,Pref2≈0.19。对于x=3的 情况,此时是出现概率最高的情况。将上述数据带入公式3计算,可得S1=1 -0.21/0.21=0,S2=1-0.16/0.19≈1–0.84=0.16。S2和PMF的结果一致,但是如 果此时x=2时,计算结果会产生较大偏差,意味着此时的被检测值是偏离频率最 高的值的。
(2)桶聚类算法
如图3所示为桶聚类算法的可视化表示,横轴表示消息的接收数量,纵轴表 示交互次数。该算法遍历了所有历史数据,并创建十个同样宽的桶,每个桶都被 位于a和b之间的每个值“填充”。桶越高,传入的新数据点在桶中着陆的可能 性就越大。通过计算输入数据点所在桶的高度与所有高度之和的比较,可以建立 0到1之间的评分值。此值表示与传入数据点的集群匹配的历史点的数量。
(3)均值算法评分
第一步:计算标准差,计算方式如公式4所示。其中N是集合中元素的个 数,yi表示分布集合中每个单独的值,μ是匹配集中的均值。
公式4:
第二步:计算分数,计算方式如公式5所示。其中x是被检测的值,μ是匹 配集中的均值,σ是第一步中计算出的标准差,c是一个常数。本实施例中c取 1.96,当x超过1.96*σ是异常值,x接近均值时是非异常值。
公式5:
(4)中值算法评分
第一步:计算绝对中位差(MAD),计算方式如公式6所示。
公式6:MAD=median(|Yi-median(Y)|)
第二步:计算分数,计算方式如公式7所示。
公式7:
其中,m是匹配集的中值,Y代表匹配集中所有的值,yi表示集合Y中的单 独的值。本实施例中c取1.96,在此处的含义是调节中值算法灵敏度的参数。如 图4所示为中值算法的可视化表示,横轴表示所检测数据的时间,纵轴表示数据 通过特定服务网络发送到特定地址的消息接收次数。
3、归一化算法集成4种静态统计算法的分数产生最终的分数输出;
如果所有的算法得分一致,那分数就固定在这个得分上,如果不一致就通过 以下步骤计算一个一致意见得分。
第一步:为前面所述的每级算法输出分数。该算法将每个单独算法的得分 ai作为每个级别和每个度量的输入,以及每个分布集中元素个数N作为输入。通 过公式8为该算法为每一级L和各个算法得分的度量M创建分数。
公式8:
第二步:计算一致意见得分。将结果fi放入集合F中,如公式9所示,表 示F中所有值的平均值,V是F的方差。
公式9:
4、通过将分数和阈值进行比较,对数据进行分类;
用t表示阈值,0≤t≤1,如果S(x)≥t则该检测值为异常,标记为正结果,如 果该检测是正确的则标记为真正,如果发现实际情况下应该是负结果则标记为假 正。S(x)<t时,标记为负结果,表示该值是正常值,如果该检测是正确的则标记 为真负,如果发现在实际情况下应该是正结果则标记为假负。本实施例中阈值设 置为10%,表示一致意见得分低于0.1的被视为真负,而一致意见得分高于0.9 的被视为真正,若一致意见得分在这些值之间则表示不确定,不进行分类。
以上内容是结合本发明的优选实施方式对所提供技术方案所作的进一步详 细说明,不能认定本发明具体实施只局限于上述这些说明,对于本发明所属技术 领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单 推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种非监督异常数据检测算法,包括以下:
(1)将输入的数据点与历史数据进行比较,获取历史记录中相关的条目,剔除不相关条目;
(2)通过若干静态统计算法分别对比较之后的数据点进行评分并输出分数;
(3)通过归一化算法集成上述各个静态统计算法的分数,并产生最终分数输出;
(4)将最终分数和阈值进行比较后,对数据进行分类标记。
2.如权利要求1所述的一种非监督异常数据检测算法,其特征在于:所述步骤(2)中,所述静态算法采用泊松算法、桶聚类算法、均值算法和中值算法。
3.如权利要求2所述的一种非监督异常数据检测算法,其特征在于:所述泊松算法评分是将数据建模为带有X个箱子的直方图,其中X是被建模的数据集中所有条目的最大值,具体步骤如下:
第一步:通过概率质量函数计算检测值的可能性概率,计算方法如公式1:
公式1:
当前检测值表示为x,λ为集合的平均值;
第二步:计算引用概率Pref,计算方法如公式2:
公式2:
第三步:计算分数,去除Pref和P(x,λ)的比值为1的值,对相似的值给出较低的分数,而对不相似的值给出较高的分数,评分方法如公式3:
公式3:
其中S代表分数值,P代表第一步中的可能性概率。
4.如权利要求2所述的一种非监督异常数据检测算法,其特征在于:所述桶聚类算法评分步骤中,遍历所有历史数据,并创建十个同样宽的桶,每个桶都被位于a和b之间的每个值“填充”,通过计算输入数据点所在桶的高度与所有高度之和的比较,建立0到1之间的评分值,该评分值表示与传入数据点的集群匹配的历史点的数量。
5.如权利要求2所述的一种非监督异常数据检测算法,其特征在于:所述均值算法评分包括以下步骤:
第一步:计算标准差,计算方法如公式4:
公式4:
其中N是集合中元素的个数,yi表示分布集合中每个单独的值,μ是匹配集中的均值;
第二步:计算分数,计算方法如公式5:
公式5:
其中x是被检测的值,μ是匹配集中的均值,σ是第一步中计算出的标准差,c是一个常数。
6.如权利要求2所述的一种非监督异常数据检测算法,其特征在于:所述中值算法评分包括以下步骤:
第一步:计算绝对中位差,计算方法如公式6:
公式6:MAD=median(|Yi-median(Y)|)
第二步:计算分数,计算方法如公式7:
公式7:
其中,m是匹配集的中值,Y代表匹配集中所有的值,yi表示集合Y中的单独的值,c表示调节中值算法灵敏度的参数。
7.如权利要求1所述的一种非监督异常数据检测算法,其特征在于:所述步骤(3)中具体包括以下步骤:
第一步:分别为各个静态统计算法创建分数,将每个单独算法的分数ai作为每个级别和每个度量的输入,以及每个分布集中元素个数N作为输入,并通过公式8为每一级L和各个算法分数的度量M创建分数;
公式8:
第二步:计算一致意见的最终分数,将结果fi放入集合F中,计算公式如公式9:
公式9:
其中表示F中所有值的平均值,V是F的方差。
8.如权利要求1所述的一种非监督异常数据检测算法,其特征在于:所述步骤(4)中,用t表示阈值,0≤t≤1,S(x)表示最终分数,S(x)≥t,该检测值为异常,标记为正结果,如果该检测是正确的则标记为真正,如果发现实际情况下应该是负结果则标记为假正;S(x)<t时,该检测值为正常,标记为负结果,如果该检测是正确的则标记为真负,如果发现在实际情况下应该是正结果则标记为假负。
9.如权利要求1所述的一种非监督异常数据检测算法,其特征在于:所述步骤(4)中,将没有标记的数据添加到历史数据中。
CN201910485030.9A 2019-06-05 2019-06-05 一种非监督异常数据检测算法 Pending CN110348480A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910485030.9A CN110348480A (zh) 2019-06-05 2019-06-05 一种非监督异常数据检测算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910485030.9A CN110348480A (zh) 2019-06-05 2019-06-05 一种非监督异常数据检测算法

Publications (1)

Publication Number Publication Date
CN110348480A true CN110348480A (zh) 2019-10-18

Family

ID=68181467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910485030.9A Pending CN110348480A (zh) 2019-06-05 2019-06-05 一种非监督异常数据检测算法

Country Status (1)

Country Link
CN (1) CN110348480A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565275A (zh) * 2020-12-10 2021-03-26 杭州安恒信息技术股份有限公司 一种网络安全场景的异常检测方法、装置、设备及介质
CN113138875A (zh) * 2021-04-22 2021-07-20 深圳感臻科技有限公司 一种故障检测方法、终端以及计算机存储介质
CN113609454A (zh) * 2021-08-12 2021-11-05 中国工商银行股份有限公司 一种异常交易检测方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184364A (zh) * 2011-05-26 2011-09-14 南京财经大学 基于半监督学习的推荐系统托攻击检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184364A (zh) * 2011-05-26 2011-09-14 南京财经大学 基于半监督学习的推荐系统托攻击检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PIETA THEOFANOUS,ALEXANDER等: "Ensemble based unsupervised anomaly detection", 《HTTPS://LUP.LUB.LU.SE/STUDENT-PAPERS/SEARCH/PUBLICATION/8904850》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112565275A (zh) * 2020-12-10 2021-03-26 杭州安恒信息技术股份有限公司 一种网络安全场景的异常检测方法、装置、设备及介质
CN112565275B (zh) * 2020-12-10 2022-09-20 杭州安恒信息技术股份有限公司 一种网络安全场景的异常检测方法、装置、设备及介质
CN113138875A (zh) * 2021-04-22 2021-07-20 深圳感臻科技有限公司 一种故障检测方法、终端以及计算机存储介质
CN113138875B (zh) * 2021-04-22 2022-12-06 深圳感臻智能股份有限公司 一种故障检测方法、终端以及计算机存储介质
CN113609454A (zh) * 2021-08-12 2021-11-05 中国工商银行股份有限公司 一种异常交易检测方法和装置

Similar Documents

Publication Publication Date Title
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN109871401A (zh) 一种时间序列异常检测方法及装置
CN110348480A (zh) 一种非监督异常数据检测算法
CN103176981B (zh) 一种事件信息挖掘并预警的方法
CN110414555A (zh) 检测异常样本的方法及装置
Xia et al. A clustering approach to online freeway traffic state identification using ITS data
CN107610469A (zh) 一种考虑多因素影响的日维度区域交通指数预测方法
CN105426441B (zh) 一种时间序列自动预处理方法
CN106934254A (zh) 一种开源许可证的分析方法及装置
Utari et al. Implementation of data mining for drop-out prediction using random forest method
CN106503086A (zh) 分布式局部离群点的检测方法
CN109120632A (zh) 基于在线特征选择的网络流异常检测方法
CN108470022A (zh) 一种基于运维管理的智能工单质检方法
US20160170993A1 (en) System and method for ranking news feeds
CN108647730A (zh) 一种基于历史行为共现的数据划分方法及系统
CN115577152B (zh) 基于数据分析的在线图书借阅管理系统
CN109697332A (zh) 一种基于非监督学习方法的流计算系统的异常监测方案
CN115794803B (zh) 一种基于大数据ai技术的工程审计问题监测方法与系统
CN116485020B (zh) 一种基于大数据的供应链风险识别预警方法、系统及介质
CN106911591A (zh) 网络流量的分类方法和系统
CN110086767A (zh) 一种混合入侵检测系统及方法
CN112906738A (zh) 一种水质检测及处理方法
CN113726558A (zh) 基于随机森林算法的网络设备流量预测系统
CN112785156A (zh) 一种基于聚类与综合评价的产业领袖识别方法
CN117216713A (zh) 故障定界方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201119

Address after: Room 1007, building 3, Fengyuan international building, 430 Fengtan Road, Gongshu District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Zhiai time Technology Co., Ltd

Address before: 311300 room 413, building 2, No. 168, Qianwu Road, Qingshanhu street, Lin'an District, Hangzhou City, Zhejiang Province

Applicant before: HANGZHOU LICHEN TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20191018

RJ01 Rejection of invention patent application after publication