CN112765219B - 一种跳过平稳区域的流数据异常检测方法 - Google Patents

一种跳过平稳区域的流数据异常检测方法 Download PDF

Info

Publication number
CN112765219B
CN112765219B CN202110137315.0A CN202110137315A CN112765219B CN 112765219 B CN112765219 B CN 112765219B CN 202110137315 A CN202110137315 A CN 202110137315A CN 112765219 B CN112765219 B CN 112765219B
Authority
CN
China
Prior art keywords
data
grid
local
empty
data points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110137315.0A
Other languages
English (en)
Other versions
CN112765219A (zh
Inventor
高杨
景强
李书亮
段明江
刘现林
陆逸诚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HONG KONG-ZHUHAI-MACAO BRIDGE AUTHORITY
Zhejiang University ZJU
Original Assignee
HONG KONG-ZHUHAI-MACAO BRIDGE AUTHORITY
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HONG KONG-ZHUHAI-MACAO BRIDGE AUTHORITY, Zhejiang University ZJU filed Critical HONG KONG-ZHUHAI-MACAO BRIDGE AUTHORITY
Priority to CN202110137315.0A priority Critical patent/CN112765219B/zh
Publication of CN112765219A publication Critical patent/CN112765219A/zh
Application granted granted Critical
Publication of CN112765219B publication Critical patent/CN112765219B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种跳过平稳区域的流数据异常检测方法,通过对窗口中的数据空间进行网格单元划分,得到非空网格单元;在窗口滑动过程中,以非空网格单元的权重累积净变作为区域内数据密度变化程度的度量,跳过更新相对平稳数据区域中数据点的局部可达密度和局部异常因子;仅将含有估计点的θK最近邻点的区域用于估计局部异常因子,减少对不必要的数据点进行遍历。最后通过非空网格单元中局部异常异常因子的上下界实现非空网格单元和数据点两个层级的异常检测,即首先识别出包含有前n个异常值的非空网格单元,再检索出前n个异常数据点。本发明解决现有算法难以有效处理大量流数据的难题,使桥梁健康监测系统能高效准确地识别异常数据,以便维护桥梁的健康安全。

Description

一种跳过平稳区域的流数据异常检测方法
技术领域
本发明涉及大数据领域中流数据异常检测技术,尤其涉及一种跳过平稳区域的流数据异常检测方法。
背景技术
随着大数据技术的日益成熟,异常检测已经被广泛应用到金融反欺诈、医疗诊断、网络安全检测、工业健康监测系统等不同领域当中。在桥梁健康监测系统中,为保证时刻监测桥梁的健康状态,大量的传感器装置和超高频的数据传输使得需要采集和处理的数据呈指数级地增长,极大地增加了异常检测时间复杂度和所需计算资源,同时也增加了准确检测出异常点的难度。
目前,流数据异常检测大多采用了滑动窗口的思想,只对当前窗口中的数据进行检测,这样可以极大地减少计算量。尽管如此,为保证一定的准确率,单个窗口中的数据量依旧十分庞大。基于密度的异常检测算法在窗口切换过程中,需要对窗口内所有数据点的密度进行更新,而这一操作的最坏时间复杂度高达O(n2),其中n为数据点个数。这不仅需要大量的计算资源,还会影响异常检测的时效性,导致错过采取措施应对风险的最佳时机。因此,为确保桥梁健康监测系统能及时准确地识别出异常数据以便于相关专业人员采取措施、应对风险,维持桥梁的健康安全,提出一种具有高准确率和高时效性的流数据异常检测算法具有重要的现实意义。
发明内容
本发明的目的在于克服现有方法的不足,提出了一种跳过平稳区域的流数据异常检测方法,该方法能高效准确地检测出流式数据中异常数据点,解决现有算法难以有效处理大量流数据的难题,使桥梁健康监测系统能高效准确地识别异常数据,以便维护桥梁的健康安全。
本发明的目的是通过以下技术方案来实现的:一种跳过平稳区域的流数据异常检测方法,该方法包括以下步骤:
(1)数据预处理:从桥梁健康监测系统传感器中实时采集数据,根据系统采样频率和需要不同选择若干个采样时间间隔为一个窗口,将所述窗口中的数据进行缺失值补全、归一化操作,得到数据空间Xd
(2)划分网格单元:将步骤(1)得到的数据空间Xd分为对角线长度为θR的d维网格单元,所述网格单元包含非空网格单元<kci,wi>,其中,i表示非空网格单元的索引,wi表示第i个非空网格单元的权重,kci表示第i个非空网格单元的中心坐标;将非空网格单元集合{<kci,wi>|i=1,…,m}作为权重分布网格G;其中,m表示非空网格单元的个数;θR为不同场景下非空网格单元个数与窗口中数据点数量之比;
(3)更新数据分布:窗口滑动时,记窗口滑动前的权重分布网格为Gprep,记录消失在窗口中的消失数据点集合Sexp,同时记录新出现的新数据点集合Snew,将{<kci,wi=0>|i=1,...,m}分别作为第一分布网格Gexp和第二分布网格Gnew,对于第一分布网格Gexp遍历消失数据点集合Sexp,将消失数据点集合Sexp中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第一分布网格Gexp;对于第二分布网格Gnew遍历新数据点集合Snew,将新数据点集合Snew中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第二分布网格Gnew,随后将更新的第二分布网格Gnew和更新的第一分布网格Gexp对应非空网格单元的权重作差,将{<kci,Δwi>|i=1,...,m}作为净变权重分布网格ΔG,再由窗口滑动前的权重分布网格Gprep加上净变权重分布网格ΔG可得到当前权重分布网格Gcurr
(4)跳过平稳区域:遍历当前权重分布网格Gcurr的中心坐标kci,计算数据点x与中心坐标kci的距离,取θK个最近的kci组成θK最近邻核中心集合KC(x),遍历净变权重分布网格ΔG中的<kci,Δwi>,当所述数据点x与净变权重分布网格ΔG中的kci的欧氏距离小于等于所述数据点x与其的第θK最近邻核中心
Figure GDA0003506139910000028
的欧氏距离时,将满足上述条件的kci对应的Δwi组成集合ΔWt(x);则数据点x的局部密度累积误差为:
Figure GDA0003506139910000021
其中,tl表示上次更新密度的窗口,tc表示当前窗口,Δwj表示集合ΔWt(x)中第j个非空网格单元的权重差;
每次窗口滑动时重复计算当前权重分布网格Gcurr中核中心kci的局部密度累积误差;当核中心kci局部密度累积误差E(kci)大于误差容许阈值时,更新该核中心所在网格单元中所有数据点x的局部可达密度和局部异常因子,更新数据点x的局部可达密度和局部异常因子时,找出包含数据点x的θK最近邻数据点的非空网格单元,再遍历该非空网格单元中的数据点,估计出数据点x的第θK距离邻域
Figure GDA0003506139910000022
Figure GDA0003506139910000023
中的所有数据点y计算出y的第θK距离θK_dist(y),则y到x的局部可达距离为
Figure GDA0003506139910000024
得到局部可达密度
Figure GDA0003506139910000025
和局部异常因子
Figure GDA0003506139910000026
并记录每个非空网格单元内最小局部异常因子LOFmin(x)及最大局部异常因子LOFmax(x);其中
Figure GDA0003506139910000027
是x的θK最近邻数据点的个数;
(5)异常检测:设初始候选网格单元Gcand为空,用Gcurr-Gcand表示Gcurr中除去存在于Gcand中的非空网格单元集合,遍历Gcurr-Gcand中的非空网格单元<kci,wi>,若当前Gcand中所有非空网格单元的权重之和大于等于n且该非空网格单元最小局部异常因子LOFmin(x)大于Gcurr-Gcand中最大局部异常因子LOFmax(x),则输出当前Gcand;否则将当前Gcurr-Gcand中的非空网格单元<kci,wi>加入到Gcand,若当前Gcand中所有非空网格单元的权重之和小于n则继续遍历下一非空网格单元,否则比较当前Gcand最小局部异常因子LOFmin(x)是否大于Gcurr-Gcand中最大局部异常因子LOFmax(x),若是则继续遍历下一非空网格单元,若不是则不将<kci,wi>加入到Gcand且继续遍历下一非空网格单元;通过上述过程得到Gcand,再Gcand中所有数据点的局部异常因子由大到小进行排序,选出前n个异常数据点。
与现有技术相比,本发明的有益效果:本发明通过对数据空间进行网格单元划分,采用核中心与权重相结合的方式表示数据区域,在窗口滑动过程中,通过权重净变的累积误差来选择性的更新数据局部密度。因为异常数据往往是少数部分,大多区域的数据密度在连续窗口中较为稳定,极大地减少计算量,提高异常检测效率而且不会影响检测准确率。除此之外,在更新过程中仅将包含有数据点的θK最近邻数据点的区域用于计算局部异常因子,避免遍历整个数据空间的数据点,进一步的缩减计算量,从而提高效率。本发明以桥梁健康监测系统为应用背景,提出了一种高效准确的流数据异常检测方法,解决了现有异常检测方法在处理爆发式流数据时无法保证准确率和时效性的难题。
附图说明
图1为本发明跳过平稳区域的流数据异常检测方法流程图;
图2为窗口滑动时数据分布的方法流程图;
图3为跳过平稳区域更新数据点局部可达密度和局部异常因子Gprep的方法流程图;
图4为前n个异常数据点检测方法流程图。
具体实施方式
下面结合附图,对本发明作进一步详细描述。
如图1提供了本发明跳过平稳区域的流数据异常检测方法流程图,所述流数据异常检测方法通过对窗口中的数据空间进行网格单元划分,以单元区域内数据点个数wi作为权重,结合非空网格单元中心坐标kci来表示非空网格单元。在窗口滑动过程中,以非空网格单元的权重累积净变作为区域内数据密度变化程度的度量,跳过更新相对平稳数据区域中数据点的局部可达密度和局部异常因子。在需要更新的区域内,仅将含有估计点θK最近邻点的区域用于估计局部异常因子,减少对不必要的数据点进行遍历。最后通过非空网格单元中局部异常异常因子的上下界实现非空网格单元和数据点两个层级的异常检测,即首先识别出包含有前n个异常值的非空网格单元,再检索出前n个异常数据点。具体包括如下步骤:
(1)数据预处理:从桥梁健康监测系统传感器中实时采集数据,根据系统采样频率和需要不同选择n个采样时间间隔为一个窗口,将所述窗口中的数据进行缺失值补全、归一化操作,得到数据空间Xd
(2)划分网格单元:将步骤(1)得到的数据空间Xd分为对角线长度为θR的d维网格单元,θR为不同场景下非空网格单元个数与窗口中数据点数量之比,θR应足够小,以减少计算开销,但不能太小,以保持离群点检测精度,为此,通过从足够小的值增加θR来找到比率曲线的第一个弯折。可以在第一弯折之后的范围内通过搜索确定使得召回率最大的θR。所述网格单元包含非空网格单元<kci,wi>,其中,i表示非空网格单元的索引,wi表示第i个非空网格单元的权重,kci表示第i个非空网格单元的中心坐标;将非空网格单元集合{<kci,wi>|i=1,...,m}作为权重分布网格G;其中,m表示非空网格单元的个数。通过划分网格单元,便于后续对数据空间进行分区域的处理,减少对所有数据点的遍历,可以减少计算量,提高算法时效性。
(3)更新数据分布的方法流程图如图2所示:窗口滑动时,伴随着旧数据点的消失和新数据点的进入,因此由权重分布网格管理的窗口数据分布需要进行相应的更新。记窗口滑动前的权重分布网格为Gprep,记录消失在窗口中的消失数据点集合Sexp,同时记录新出现的新数据点集合Snew,将{<kci,wi=0>|i=1,...,m}分别作为第一分布网格Gexp和第二分布网格Gnew,对于第一分布网格Gexp遍历消失数据点集合Sexp,将消失数据点集合Sexp中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第一分布网格Gexp;对于第二分布网格Gnew遍历新数据点集合Snew,将新数据点集合Snew中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第二分布网格Gnew,随后将更新的第二分布网格Gnew和更新的第一分布网格Gexp对应非空网格单元的权重作差,将{<kci,Δwi>|i=1,...,m}作为净变权重分布网格ΔG,再由窗口滑动前的权重分布网格Gprep加上净变权重分布网格ΔG可得到当前权重分布网格Gcurr。净变权重分布网格ΔG可用于衡量各区域内数据分布的变化程度,其中Δwi越小的单元网格数据分布变化程度越小,在更新数据点局部可达密度和局部异常因子时可跳过这类变化程度小的平稳区域,因异常数据本身属于少数部分,大部分正常数据区域会趋于平稳,则该方法可减少计算所需时间和空间资源。
(4)跳过平稳区域局部可达密度和局部异常因子的方法流程图如图3所示:根据步骤(3)中净变权重分布网格ΔG选择性的更新窗口中数据点的局部可达密度。根据局部密度估计定义可知,如果数据点x的θK最近邻核中心和它的权重没有改变,那么数据点x的局部密度也不会改变。遍历当前权重分布网格Gcurr的中心坐标kci,计算数据点x与中心坐标kci的距离,取θK个最近的kci组成θK最近邻核中心集合KC(x),遍历净变权重分布网格ΔG中的<kci,Δwi>,当所述数据点x与净变权重分布网格ΔG中的kci的欧氏距离小于等于所述数据点x与其的第θK最近邻核中心
Figure GDA0003506139910000058
的欧氏距离时,将满足上述条件的kci对应的Δwi组成集合ΔWt(x);则数据点x的局部密度累积误差为:
Figure GDA0003506139910000051
其中,tl表示上次更新密度的窗口,tc表示当前窗口,Δwj表示集合ΔWt(x)中第j个非空网格单元的权重差;为保证检测精度,用局部密度累积误差定量的描述数据点局部密度变化程度,当超过阈值时表明会对检测结果造成影响,需及时更新其局部可达密度和局部异常因子。
每次窗口滑动时重复计算当前权重分布网格Gcurr中核中心kci的局部密度累积误差;当核中心kci局部密度累积误差E(kci)大于误差容许阈值时,更新该核中心所在网格单元中所有数据点x的局部可达密度和局部异常因子,更新数据点x的局部可达密度和局部异常因子时,找出包含数据点x的θK最近邻数据点的非空网格单元,再遍历该非空网格单元中的数据点,估计出数据点x的第θK距离邻域
Figure GDA0003506139910000052
Figure GDA0003506139910000053
中的所有数据点y计算出y的第θK距离θK_dist(y),则y到x的局部可达距离为
Figure GDA0003506139910000054
得到局部可达密度
Figure GDA0003506139910000055
和局部异常因子
Figure GDA0003506139910000056
并记录每个非空网格单元内最小局部异常因子LOFmin(x)及最大局部异常因子LOFmax(x),以便于后续异常检测;其中
Figure GDA0003506139910000057
是x的θK最近邻数据点的个数;
(5)异常检测方法流程图如图4所示:设初始候选网格单元Gcand为空,用Gcurr-Gcand表示Gcurr中除去存在于Gcand中的非空网格单元集合,遍历Gcurr-Gcand中的非空网格单元<kci,wi>,若当前Gcand中所有非空网格单元的权重之和大于等于n且该非空网格单元最小局部异常因子LOFmin(x)大于Gcurr-Gcand中最大局部异常因子LOFmax(x),则输出当前Gcand;否则将当前Gcurr-Gcand中的非空网格单元<kci,wi>加入到Gcand,若当前Gcand中所有非空网格单元的权重之和小于n则继续遍历下一非空网格单元,否则比较当前Gcand最小局部异常因子LOFmin(x)是否大于Gcurr-Gcand中最大局部异常因子LOFmax(x),若是则继续遍历下一非空网格单元,若不是则不将<kci,wi>加入到Gcand且继续遍历下一非空网格单元;通过上述过程得到Gcand,再Gcand的中的所有数据点的局部异常因子由大到小进行排序,选出前n个异常数据点。对整个窗口中所有数据点的局部异常因子进行排序需要极大的计算时间和空间资源,通过所述方法可先查找出含有前n个异常点的网格单元,再对其中数据点的局部异常因子进行排序,可有效减少对不必要的数据点进行排序操作,提高检测效率。
(6)异常报告:将检测出的前n个异常数据点相关信息,包括传感器编号、数据类型、异常分数等形成文本报告输出给相关专业人员,以便专业人员采取措施处理异常。

Claims (1)

1.一种跳过平稳区域的流数据异常检测方法,其特征在于,该方法包括以下步骤:
(1)数据预处理:从桥梁健康监测系统传感器中实时采集数据,根据系统采样频率和需要不同选择若干个采样时间间隔为一个窗口,将所述窗口中的数据进行缺失值补全、归一化操作,得到数据空间Xd
(2)划分网格单元:将步骤(1)得到的数据空间Xd分为对角线长度为θR的d维网格单元,所述网格单元包含非空网格单元<kci,wi>,其中,i表示非空网格单元的索引,wi表示第i个非空网格单元的权重,kci表示第i个非空网格单元的中心坐标;将非空网格单元集合{<kci,wi>|i=1,...,m}作为权重分布网格G;其中,m表示非空网格单元的个数;θR为不同场景下非空网格单元个数与窗口中数据点数量之比;
(3)更新数据分布:窗口滑动时,记窗口滑动前的权重分布网格为Gprep,记录消失在窗口中的消失数据点集合Sexp,同时记录新出现的新数据点集合Snew,将{<kci,wi=0>|i=1,...,m}分别作为第一分布网格Gexp和第二分布网格Gnew,对于第一分布网格Gexp遍历消失数据点集合Sexp,将消失数据点集合Sexp中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第一分布网格Gexp;对于第二分布网格Gnew遍历新数据点集合Snew,将新数据点集合Snew中的每一个数据点加入到对应的非空网格单元,并记录其权重,更新第二分布网格Gnew,随后将更新的第二分布网格Gnew和更新的第一分布网格Gexp对应非空网格单元的权重作差,将{<kci,Δwi>|i=1,...,m}作为净变权重分布网格ΔG,再由窗口滑动前的权重分布网格Gprep加上净变权重分布网格ΔG可得到当前权重分布网格Gcurr
(4)跳过平稳区域:遍历当前权重分布网格Gcurr的中心坐标kci,计算数据点x与中心坐标kci的距离,取θK个最近的kci组成θK最近邻核中心集合KC(x),遍历净变权重分布网格ΔG中的<kci,Δwi>,当所述数据点x与净变权重分布网格ΔG中的kci的欧氏距离小于等于所述数据点x与其的第θK最近邻核中心
Figure FDA0003506139900000011
的欧氏距离时,将满足上述条件的kci对应的Δwi组成集合ΔWt(x);则数据点x的局部密度累积误差为:
Figure FDA0003506139900000012
其中,tl表示上次更新密度的窗口,tc表示当前窗口,Δwj表示集合ΔWt(x)中第j个非空网格单元的权重差;
每次窗口滑动时重复计算当前权重分布网格Gcurr中核中心kci的局部密度累积误差;当核中心kci局部密度累积误差E(kci)大于误差容许阈值时,更新该核中心所在网格单元中所有数据点x的局部可达密度和局部异常因子,更新数据点x的局部可达密度和局部异常因子时,找出包含数据点x的θK最近邻数据点的非空网格单元,再遍历该非空网格单元中的数据点,估计出数据点x的第θK距离邻域
Figure FDA0003506139900000021
Figure FDA0003506139900000022
中的所有数据点y计算出y的第θK距离θK_dist(y),则y到x的局部可达距离为
Figure FDA0003506139900000023
得到局部可达密度
Figure FDA0003506139900000024
和局部异常因子
Figure FDA0003506139900000025
并记录每个非空网格单元内最小局部异常因子LOFmin(x)及最大局部异常因子LOFmax(x);其中
Figure FDA0003506139900000026
是x的θK最近邻数据点的个数;
(5)异常检测:设初始候选网格单元Gcand为空,用Gcurr-Gcand表示Gcurr中除去存在于Gcand中的非空网格单元集合,遍历Gcurr-Gcand中的非空网格单元<kci,wi>,若当前Gcand中所有非空网格单元的权重之和大于等于n且该非空网格单元最小局部异常因子LOFmin(x)大于Gcurr-Gcand中最大局部异常因子LOFmax(x),则输出当前Gcand;否则将当前Gcurr-Gcand中的非空网格单元<kci,wi>加入到Gcand,若当前Gcand中所有非空网格单元的权重之和小于n则继续遍历下一非空网格单元,否则比较当前Gcand最小局部异常因子LOFmin(x)是否大于Gcurr-Gcand中最大局部异常因子LOFmax(x),若是则继续遍历下一非空网格单元,若不是则不将<kci,wi>加入到Gcand且继续遍历下一非空网格单元;通过上述过程得到Gcand,再Gcand中所有数据点的局部异常因子由大到小进行排序,选出前n个异常数据点。
CN202110137315.0A 2021-02-01 2021-02-01 一种跳过平稳区域的流数据异常检测方法 Active CN112765219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110137315.0A CN112765219B (zh) 2021-02-01 2021-02-01 一种跳过平稳区域的流数据异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110137315.0A CN112765219B (zh) 2021-02-01 2021-02-01 一种跳过平稳区域的流数据异常检测方法

Publications (2)

Publication Number Publication Date
CN112765219A CN112765219A (zh) 2021-05-07
CN112765219B true CN112765219B (zh) 2022-04-29

Family

ID=75704497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110137315.0A Active CN112765219B (zh) 2021-02-01 2021-02-01 一种跳过平稳区域的流数据异常检测方法

Country Status (1)

Country Link
CN (1) CN112765219B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102246303B1 (ko) * 2021-03-04 2021-04-29 한국과학기술원 다차원 데이터 스트림에서의 실시간 이상치 탐지 방법 및 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908065A (zh) * 2010-07-27 2010-12-08 浙江大学 一种支持动态更新的在线属性异常点检测方法
CN106649339A (zh) * 2015-10-30 2017-05-10 北大方正集团有限公司 离群点的挖掘方法及挖掘装置
CN107357844A (zh) * 2017-06-26 2017-11-17 广州视源电子科技股份有限公司 离群点检测方法和装置
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法
WO2019182465A1 (en) * 2018-03-19 2019-09-26 Milaboratory, Limited Liability Company Methods of identification condition-associated t cell receptor or b cell receptor

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362608B (zh) * 2019-06-11 2023-04-28 广东工业大学 基于雨流计数法和局部异常因子的能耗异常检测方法
CN110781569B (zh) * 2019-11-08 2023-12-19 桂林电子科技大学 一种基于多分辨率网格划分的异常检测方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908065A (zh) * 2010-07-27 2010-12-08 浙江大学 一种支持动态更新的在线属性异常点检测方法
CN106649339A (zh) * 2015-10-30 2017-05-10 北大方正集团有限公司 离群点的挖掘方法及挖掘装置
CN107357844A (zh) * 2017-06-26 2017-11-17 广州视源电子科技股份有限公司 离群点检测方法和装置
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法
WO2019182465A1 (en) * 2018-03-19 2019-09-26 Milaboratory, Limited Liability Company Methods of identification condition-associated t cell receptor or b cell receptor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"An Anomaly Detection Approach Based on Isolation Forest Algorithm for Streaming Data using Sliding Window";Zhiguo Ding等;《IFAC Proceedings Volumes》;20130904;第46卷(第20期);全文 *
基于密度的异常数据检测算法GSWCLOF;李少波等;《计算机工程与应用》;20161001(第19期);全文 *

Also Published As

Publication number Publication date
CN112765219A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN109816031B (zh) 一种基于数据不均衡度量的变压器状态评估聚类分析方法
CN112911627B (zh) 无线网络性能检测方法、装置以及存储介质
CN107682319A (zh) 一种基于增强型角度异常因子的数据流异常检测及多重验证的方法
CN111046968B (zh) 一种基于改进dpc算法的道路网络轨迹聚类分析方法
Zhang et al. A study on the method for cleaning and repairing the probe vehicle data
CN116628616B (zh) 一种大功率充电能源的数据处理方法及系统
CN110995153A (zh) 一种光伏电站的异常数据检测方法、装置及电子设备
CN108197254A (zh) 一种基于近邻的数据修复方法
CN112949735A (zh) 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法
He et al. Intelligent Fault Analysis With AIOps Technology
CN112765219B (zh) 一种跳过平稳区域的流数据异常检测方法
CN117156442A (zh) 基于5g网络的云数据安全保护方法及系统
CN115759409A (zh) 多时间模式注意力机制优化lstm模型的水闸形变预测方法
CN114692677A (zh) 一种基于多目标特征选择的焊接缺陷识别方法
CN116610938A (zh) 曲线模式分段的半导体制造无监督异常检测方法及设备
CN115378000A (zh) 基于区间二型模糊聚类分析的配电网运行状态评估方法
CN114597886A (zh) 基于区间二型模糊聚类分析的配电网运行状态评估方法
Zhou et al. Online abnormal interval detection and classification of industrial time series data based on multi-scale deep learning
CN107122475A (zh) 大数据异常点检测方法及其系统
Niu et al. An online fault diagnosis method for lithium-ion batteries based on signal decomposition and dimensionless indicators selection
Fan Data mining model for predicting the quality level and classification of construction projects
CN112418522A (zh) 一种基于三支集成预测模型的工业加热炉钢温预测方法
CN111343664B (zh) 用户定位方法、装置、设备及介质
CN116319255A (zh) 一种基于kpi的根因定位方法、装置、设备及存储介质
CN115935285A (zh) 基于掩码图神经网络模型的多元时间序列异常检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant