CN107133343B - 基于时间序列近似匹配的大数据异常状态检测方法及装置 - Google Patents

基于时间序列近似匹配的大数据异常状态检测方法及装置 Download PDF

Info

Publication number
CN107133343B
CN107133343B CN201710358991.4A CN201710358991A CN107133343B CN 107133343 B CN107133343 B CN 107133343B CN 201710358991 A CN201710358991 A CN 201710358991A CN 107133343 B CN107133343 B CN 107133343B
Authority
CN
China
Prior art keywords
time series
measured
sequence
data
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710358991.4A
Other languages
English (en)
Other versions
CN107133343A (zh
Inventor
王宏志
孙旭冉
赵志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Da Da Data Industry Co Ltd
Original Assignee
Da Da Data Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Da Da Data Industry Co Ltd filed Critical Da Da Data Industry Co Ltd
Priority to CN201710358991.4A priority Critical patent/CN107133343B/zh
Publication of CN107133343A publication Critical patent/CN107133343A/zh
Application granted granted Critical
Publication of CN107133343B publication Critical patent/CN107133343B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种基于时间序列近似匹配的大数据异常状态检测方法及系统,其中方法包括以下步骤:根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;采用同样的方法使用一维标准序列表示标准时间序列;对一维待测序列和一维标准序列进行哈希运算;计算一维待测序列和一维标准序列的杰卡德系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列。本发明通过将基于集合的时间序列分割与哈希运算相结合,减小了计算杰卡德系数的运算量;并可进一步对序列进行从粗到细的分割,保证整体运算速度的同时又兼顾了异常状态检测的精度。

Description

基于时间序列近似匹配的大数据异常状态检测方法及装置
技术领域
本发明涉及大数据异常状态检测技术,尤其涉及一种基于时间序列近似匹配的大数据异常状态检测方法及装置。
背景技术
异常状态检测广泛应用于电力,遥感、道桥、机械等各种领域,对于系统的正常运转具有极其重要的作用。近年来,由于在线检测数据的体量大、类型繁多的特点,人们将大数据技术引入到了异常检测中,为提高系统异常检测准确性提供了全新的解决方法和思路。
在异常状态检测中,时间序列分析法是一种常用的方法。现有技术中提出了一种基于集合的时间序列分析法,该方法首先将分布于时间轴上的数据按照一定的规则和分割系数分割为集合,并对集合编号,集合序号包含着该集合中数据点的幅值信息和在时间轴上的位置信息。然后将包含着多个数据点的集合看作新的元素,与其他时间序列比较,并利用杰卡德(Jaccard)系数衡量两序列的相似性。这种方法将比较时间序列的相似性转换为比较集合的相似性,大大加快了运算速度,并且具有良好的可扩展性。
然而,上述方法的匹配精度和匹配速度很大程度上依赖于所分割的集合的大小,分割越精细,集合越小,则精度越高。但过小的集合又会导致集合数过大从而影响降低算法的匹配速度,尤其是将之应用于大数据计算系统中后,庞大的数据量将会进一步使该检测方法的性能恶化。
发明内容
本发明要解决的技术问题在于,针对现有异常状态检测方法在提高精度时加大了数据运算量的缺陷,提供了一种基于时间序列近似匹配的大数据异常状态检测方法及装置,通过将基于集合的时间序列分割与哈希分割相结合,进一步对数据进行降维,减少运算数据量,更适用于大数据计算计算系统中的异常检测。
本发明第一方面,提供了一种基于时间序列近似匹配的大数据异常状态检测方法,包括以下步骤:
A、根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;
B、根据标准时间序列的数据范围以及所述分割系数将所述标准时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维标准序列表示所述标准时间序列;
C、对所述一维待测序列和一维标准序列进行哈希运算;
D、计算所述一维待测序列和一维标准序列的杰卡德系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列。
优选地,所述方法还包括在步骤D之后执行的步骤E:对步骤D中检测出的不存在异常状态的时间序列,减小分割系数,并迭代执行步骤A至D直至满足异常状态检测的精度要求。
本发明第二方面,提供了一种基于时间序列近似匹配的大数据异常状态检测装置,包括:
待测数据分割模块,用于根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;
标准数据分割模块,用于根据标准时间序列的数据范围以及所述分割系数将所述标准时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维标准序列表示所述标准时间序列;
哈希运算模块,用于对所述一维待测序列和一维标准序列进行哈希运算;
相似性检测模块,计算所述一维待测序列和一维标准序列的杰卡德系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列。
优选地,所述装置还包括:迭代筛选模块,用于对相似性检测模块检测出的不存在异常状态的时间序列,减小分割系数,并迭代执行异常状态检测操作直至满足异常状态检测的精度要求。
实施本发明的基于时间序列近似匹配的大数据异常状态检测方法及装置,具有以下有益效果:本发明通过将基于集合的时间序列分割与哈希运算相结合,对包含集合编号的新表进行哈希运算,减小了计算杰卡德系数的运算量;进一步地,本发明可以采用多次筛选的办法,首先对序列进行较粗的分割,再对剩余序列进行较细的分割,保证整体运算速度的同时又兼顾了异常状态检测的精度。
附图说明
图1为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测方法的流程图;
图2为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测方法的集合分割示意图;
图3为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测装置的模块框图;
图4为根据本发明优选实施例的装置中的待测数据分割模块的一种实施方式的示意图;
图5为根据本发明优选实施例的装置中的相似性检测模块的一种实施方式的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测方法的流程图。如图1所示,该方法包括以下步骤:
首先,在步骤S101中,根据待测时间序列S的数据范围以及预设的分割系数将待测时间序列S划分到多个集合中,并采用数据点所在集合编号组成的一维待测序列S'表示待测时间序列S。其中,待测时间序列S的数据范围包括tmax、tmin、xmax和xmin,预设的分割系数包括σ和ε。分割系数σ和ε决定每个集合的大小,由实际需要的异常状态检测精度和数据量决定。
在本发明更优选的实施方式中,该步骤S101具体包括:
(1)依据预设的分割系数σ和ε将待测时间序列S的数据点划分到m×n个集合中,其中总行数m=(xmax-xmin)/σ,总列数n=(tmax-tmin)/ε。其中tmax和tmin为待测时间序列S的时间上限值和下限值,xmax和xmin为待测时间序列S的幅值上限值和下限值。也就是说,依据预设的分割系数σ和ε,将待测时间序列S的时间轴划分为n=(tmax-tmin)/ε个小区间,幅值轴划分为m=(xmax-xmin)/σ个小区间,使得待测时间序列S的数据点按照各自的坐标值被划分在了m×n个大小均为σ×ε的集合中。
(2)对步骤(1)得到的多个集合进行编号,假设待测时间序列S上的数据点P(ti,xi),1≤i≤k,其中k为所述待测时间序列S的数据点总数。则该数据点P(ti,xi)所在集合编号为:Ni=(mi-1)×n+ni,其中该数据点所在行数mi=(xi-xmin)/σ,该数据点所在列数ni=(ti-tmin)/ε,由此构建一维待测序列S'={N1,N2,…,NK}。可见,集合编号Ni中既包含着集合中数据点的时间信息,也包含着幅值信息,因此,可用由集合编号组成的新的数据表S’代替原始的待测时间序列S,从而将二维数据转换成一维数据。
请结合参阅图2,为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测方法的集合分割示意图。如图2所示,其中依据预设的分割系数σ和ε,将待测时间序列S的时间轴t划分为n=4个小区间,幅值轴划分为m=5个小区间,从而将待测时间序列S分割到5×4个集合中,按照前述规律对每个集合进行编号后,可以使用待测时间序列S所有数据点分布的集合编号来构建一维序列作为一维待测序列S',如图2中S'={1,2,6,7,11,12,16,20}。
随后,在步骤S102中,根据标准时间序列Q的数据范围以及与步骤S101中相等的分割系数σ和ε将标准时间序列Q分为多个集合,同样采用标准时间序列Q的数据点所在的集合编号组成的一维标准序列Q’表示标准时间序列Q。
随后,在步骤S103中,对包含集合编号的一维待测序列S'和一维标准序列Q’进行哈希运算,以减小数据量。具体地,该步骤S103中对序列表中数据进行取余运算,将余数相同的数据放入同一哈希桶内,以减小数据量。
最后,在步骤S104中,计算一维待测序列S'和一维标准序列Q'的杰卡德(Jaccard)系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列。
在本发明更优选的实施方式中,该步骤S104具体包括:
(1)通过以下公式计算一维待测序列S'和一维标准序列Q'的杰卡德系数:J(S',Q')=|S'∩Q'|/|S'∪Q'|。其中一维待测序列S'和一维标准序列Q'包含的是集合编号,而非原始时间序列的数据,也就是将时间序列的相似性运算转化为了集合的相似性运算。该步骤中可先计算各个哈希桶间的杰卡德系数,再对杰卡德系数较小的哈希桶中包含的待测序列进行逐一计算。
(2)判断J(S',Q')<Jmin的时间序列存在异常状态,判断J(S',Q')≥Jmin的时间序列不存在异常状态,其中Jmin为预设阈值。
在本发明更优选的实施方式中,基于时间序列近似匹配的大数据异常状态检测方法还包括在步骤S104之后执行的以下步骤:对步骤S104中检测出的不存在异常状态的时间序列,减小分割系数σ和ε,并迭代执行步骤S101-S104直至满足异常状态检测的精度要求。该步骤可以对前述判断的不存在异常状态的时间序列,即J(S',Q')≥Jmin的时间序列,进行二次检测,或者进行多次检测直至满足异常检测的精度要求。当对异常检测的精度要求较高时,可以重复多次执行步骤S101-S104,并且在每次重复时减小分割系数σ和ε,从而进行更细的分割,直至满足异常状态检测的精度要求。
请结合参阅图3,为根据本发明优选实施例的基于时间序列近似匹配的大数据异常状态检测装置的模块框图。如图3所示,该实施例提供的基于时间序列近似匹配的大数据异常状态检测装置10至少包括:待测数据分割模块100、标准数据分割模块200、哈希运算模块300和相似性检测模块400。
其中,待测数据分割模块100根据待测时间序列S的数据范围以及预设的分割系数将待测时间序列S划分到多个集合中,并采用数据点所在集合编号组成的一维待测序列S'表示待测时间序列S。
标准数据分割模块200用于根据标准时间序列Q的数据范围以及与待测数据分割模块100中相等的分割系数σ和ε将标准时间序列Q分为多个集合,同样采用标准时间序列Q的数据点所在的集合编号组成的一维标准序列Q’表示标准时间序列Q。
哈希运算模块300与待测数据分割模块100以及标准数据分割模块200相连,用于对包含集合编号的一维待测序列S'和一维标准序列Q’进行哈希运算,以减小数据量。优选地,该哈希运算模块300对序列表中数据进行取余运算,将余数相同的数据放入同一哈希桶内,进一步减小数据量。
相似性检测模块400与所述哈希运算模块300相连,用于计算一维待测序列S'和一维标准序列Q'的杰卡德(Jaccard)系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列。
请结合参阅图4,为根据本发明优选实施例的装置中的待测数据分割模块的一种实施方式的示意图。如图4所示,该待测数据分割模块100包括:数据分割单元110以及与之相连的数据编号单元120。
其中数据分割单元110,用于依据预设的分割系数σ和ε将待测时间序列S的数据点划分到m×n个集合中,其中总行数m=(xmax-xmin)/σ,总列数n=(tmax-tmin)/ε。其中tmax和tmin为待测时间序列S的时间上限值和下限值,xmax和xmin为待测时间序列S的幅值上限值和下限值。
数据编号单元120用于对数据分割单元110分割的多个集合进行编号,假设待测时间序列S上的数据点P(ti,xi),1≤i≤k,其中k为所述待测时间序列S的数据点总数;则该数据点P(ti,xi)所在集合编号为:Ni=(mi-1)×n+ni,其中mi=(xi-xmin)/σ,ni=(ti-tmin)/ε,由此构建一维待测序列S'={N1,N2,…,NK}。
请结合参阅图5,为根据本发明优选实施例的装置中的相似性检测模块的一种实施方式的示意图。如图5所示,该相似性检测模块400包括:系数计算单元410以及与之相连的系数计算单元420。
其中系数计算单元410用于通过以下公式计算一维待测序列S'和一维标准序列Q'的杰卡德系数:J(S',Q')=S'∩Q'|/|S'∪Q'|。
异常判断单元420用于判断J(S',Q')<Jmin的时间序列存在异常状态,判断J(S',Q')≥Jmin的时间序列不存在异常状态,其中Jmin为预设阈值。
在本发明更优选的实施例中,该基于时间序列近似匹配的大数据异常状态检测装置还可以进一步的包括:迭代筛选模块,与相似性检测模块400连接,用于对相似性检测模块400检测出的不存在异常状态的时间序列,减小分割系数,迭代执行异常状态检测操作。也就是说,迭代筛选模块可对J(S',Q')≥Jmin的时间序列进行二次筛选。具体为减小分割系数σ和ε,对J(S',Q')≥Jmin的时间序列进行二次分割,使用与前面相同的方法继续进行异常状态检测。该二次筛选模块也可以进行多次检测直至满足异常状态检测的精度要求,并且在每次检测时减小分割系数σ和ε,从而进行更细的分割。
综上所述,本发明的关键点在于将基于集合的时间序列分割与哈希运算相结合,对包含集合编号的新表,即一维待测序列S'和一维标准序列Q'进行哈希运算,减小了计算杰卡德(Jaccard)系数的运算量。进一步地,本发明采用多次筛选的办法,保证异常状态检测的精度。首先对序列进行较粗的分割,再对剩余序列进行较细的分割,保证整体运算速度的同时又兼顾了运算精度。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种基于时间序列近似匹配的大数据异常状态检测方法,其特征在于,包括以下步骤:
A、根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;
B、根据标准时间序列的数据范围以及所述分割系数将所述标准时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维标准序列表示所述标准时间序列;
C、对所述一维待测序列和一维标准序列进行哈希运算;
D、计算所述一维待测序列和一维标准序列的杰卡德系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列;
所述步骤A包括:
依据预设的分割系数σ和ε将待测时间序列S的数据点划分到m×n个集合中,其中总行数m=(xmax-xmin)/σ,总列数n=(tmax-tmin)/ε,每个集合的大小均为σ×ε,其中tmax和tmin为待测时间序列S的数据范围中时间上限值和下限值,xmax和xmin为待测时间序列S的数据范围中幅值上限值和下限值;
对所述多个集合进行编号,假设待测时间序列S上的数据点P(ti,xi),1≤i≤k,其中k为所述待测时间序列S的数据点总数;则该数据点P(ti,xi)所在集合编号为:Ni=(mi-1)×n+ni,其中mi=(xi-xmin)/σ,ni=(ti-tmin)/ε,将待测时间序列S使用一维待测序列S'={N1,N2,…,NK}表示;
所述步骤D包括:
通过以下公式计算一维待测序列S'和一维标准序列Q'的杰卡德系数:J(S',Q')=|S'∩Q'|/|S'∪Q'|;
判断J(S',Q')<Jmin的时间序列存在异常状态,判断J(S',Q')≥Jmin的时间序列不存在异常状态,其中Jmin为预设阈值。
2.根据权利要求1所述的基于时间序列近似匹配的大数据异常状态检测方法,其特征在于,所述方法还包括在步骤D之后执行的步骤:
E、对步骤D中检测出的不存在异常状态的时间序列,减小分割系数,并迭代执行步骤A至D直至满足异常状态检测的精度要求。
3.根据权利要求1所述的基于时间序列近似匹配的大数据异常状态检测方法,其特征在于,所述步骤C中对数据进行取余运算,将余数相同的数据放入同一哈希桶内。
4.一种基于时间序列近似匹配的大数据异常状态检测装置,其特征在于,包括:
待测数据分割模块,用于根据待测时间序列的数据范围以及预设的分割系数将所述待测时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维待测序列表示所述待测时间序列;
标准数据分割模块,用于根据标准时间序列的数据范围以及所述分割系数将所述标准时间序列划分到多个集合中,并采用数据点所在的集合编号组成的一维标准序列表示所述标准时间序列;
哈希运算模块,用于对所述一维待测序列和一维标准序列进行哈希运算;
相似性检测模块,计算所述一维待测序列和一维标准序列的杰卡德系数,并判断杰卡德系数小于预设阈值的时间序列为存在异常状态的序列;
所述待测数据分割模块包括:
数据分割单元,用于依据预设的分割系数σ和ε将待测时间序列S的数据点划分到m×n个集合中,其中总行数m=(xmax-xmin)/σ,总列数n=(tmax-tmin)/ε,每个集合的大小均为σ×ε,其中tmax和tmin为待测时间序列S的数据范围中时间上限值和下限值,xmax和xmin为待测时间序列S的数据范围中幅值上限值和下限值;
数据编号单元,对所述多个集合进行编号,假设待测时间序列S上的数据点P(ti,xi),1≤i≤k,其中k为所述待测时间序列S的数据点总数;则该数据点P(ti,xi)所在集合编号为:Ni=(mi-1)×n+ni,其中mi=(xi-xmin)/σ,ni=(ti-tmin)/ε,构建一维待测序列S'={N1,N2,…,NK};
所述相似性检测模块包括:
系数计算单元,用于通过以下公式计算一维待测序列S'和一维标准序列Q'的杰卡德系数:J(S',Q')=|S'∩Q'|/|S'∪Q'|;
异常判断单元,用于判断J(S',Q')<Jmin的时间序列存在异常状态,判断J(S',Q')≥Jmin的时间序列不存在异常状态,其中Jmin为预设阈值。
5.根据权利要求4所述的基于时间序列近似匹配的大数据异常状态检测装置,其特征在于,所述装置还包括:
迭代筛选模块,用于对相似性检测模块检测出的不存在异常状态的时间序列,减小分割系数,并迭代执行异常状态检测操作直至满足异常状态检测的精度要求。
6.根据权利要求4所述的基于时间序列近似匹配的大数据异常状态检测装置,其特征在于,所述哈希运算模块还对数据进行取余运算,将余数相同的数据放入同一哈希桶内。
CN201710358991.4A 2017-05-19 2017-05-19 基于时间序列近似匹配的大数据异常状态检测方法及装置 Active CN107133343B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710358991.4A CN107133343B (zh) 2017-05-19 2017-05-19 基于时间序列近似匹配的大数据异常状态检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710358991.4A CN107133343B (zh) 2017-05-19 2017-05-19 基于时间序列近似匹配的大数据异常状态检测方法及装置

Publications (2)

Publication Number Publication Date
CN107133343A CN107133343A (zh) 2017-09-05
CN107133343B true CN107133343B (zh) 2018-04-13

Family

ID=59733268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710358991.4A Active CN107133343B (zh) 2017-05-19 2017-05-19 基于时间序列近似匹配的大数据异常状态检测方法及装置

Country Status (1)

Country Link
CN (1) CN107133343B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112018006760T5 (de) * 2018-02-06 2020-10-01 Mitsubishi Electric Corporation Reihendatenanalysevorrichtung, Reihendatenanalyseverfahren und Reihendatenanalyseprogramm
CN110858072B (zh) * 2018-08-24 2023-05-09 阿里巴巴集团控股有限公司 设备运行状态的确定方法及装置
JP7072531B2 (ja) * 2019-03-12 2022-05-20 株式会社日立製作所 異常検出装置および異常検出方法
CN110766054B (zh) * 2019-09-23 2022-05-10 东软集团股份有限公司 一种压裂砂堵的预警方法、装置、存储介质及设备
CN111291096B (zh) * 2020-03-03 2023-07-28 腾讯科技(深圳)有限公司 数据集构建方法、装置和存储介质及异常指标检测方法
CN111425281B (zh) * 2020-04-01 2021-02-05 北京理工新源信息科技有限公司 一种柴油车加油或加尿素行为检测方法及系统
CN111811567B (zh) * 2020-07-21 2022-03-01 北京中科五极数据科技有限公司 一种基于曲线拐点比对的设备检测方法及相关装置
CN111897695B (zh) * 2020-07-31 2022-06-17 平安科技(深圳)有限公司 获取kpi异常数据样本的方法、装置和计算机设备
CN113282876B (zh) * 2021-07-20 2021-10-01 中国人民解放军国防科技大学 异常检测中一维时间序列数据生成方法、装置和设备
CN113268372B (zh) * 2021-07-21 2021-09-24 中国人民解放军国防科技大学 一种一维时间序列异常检测方法、装置及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311403B1 (en) * 2010-06-16 2016-04-12 Google Inc. Hashing techniques for data set similarity determination
CN105847302A (zh) * 2016-05-31 2016-08-10 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN106372202A (zh) * 2016-08-31 2017-02-01 北京奇艺世纪科技有限公司 文本相似度计算方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10452458B2 (en) * 2014-01-23 2019-10-22 Microsoft Technology Licensing, Llc Computer performance prediction using search technologies

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311403B1 (en) * 2010-06-16 2016-04-12 Google Inc. Hashing techniques for data set similarity determination
CN105847302A (zh) * 2016-05-31 2016-08-10 北京奇艺世纪科技有限公司 一种异常检测方法及装置
CN106372202A (zh) * 2016-08-31 2017-02-01 北京奇艺世纪科技有限公司 文本相似度计算方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于大数据的时间序列异常点检测研究;程艳云 等;《计算机技术与发展》;20160531;第26卷(第5期);第139-144页 *
基于相似性分析的时间序列异常检测方法;孙炎 等;《山东农业大学学报(自然科学版)》;20170411;第48卷(第2期);第287-292页 *

Also Published As

Publication number Publication date
CN107133343A (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
CN107133343B (zh) 基于时间序列近似匹配的大数据异常状态检测方法及装置
CN108173708A (zh) 基于增量学习的异常流量检测方法、装置及存储介质
CN111126622A (zh) 一种数据异常检测方法与装置
US20190087737A1 (en) Anomaly detection and automated analysis in systems based on fully masked weighted directed
CN104899135B (zh) 软件缺陷预测方法和系统
TW201732662A (zh) 一種建立資料識別模型的方法及裝置
CN107363645B (zh) 基于功率检测的铣床加工过程刀具磨损量预测方法
KR20200057903A (ko) 인공지능 모델 플랫폼 및 인공지능 모델 플랫폼 운영 방법
CN111310139B (zh) 行为数据识别方法、装置及存储介质
US10394631B2 (en) Anomaly detection and automated analysis using weighted directed graphs
CN108760305A (zh) 一种轴承故障检测方法、装置及设备
CN106844330B (zh) 文章情感的分析方法和装置
CN110046245A (zh) 一种数据监控方法及装置、一种计算设备及存储介质
CN115130887B (zh) 水库大坝环境影响评价方法和装置、电子设备和存储介质
CN114638688A (zh) 一种用于信贷反欺诈的拦截策略衍生方法、系统
WO2016138805A1 (zh) 一种分布数据异动判断定位方法及系统
CN111160667A (zh) 一种提高食品安全预测模型鲁棒性的方法及装置
CN110196797B (zh) 适于信用评分卡系统的自动优化方法和系统
Girard et al. Learning a Gaussian process model with uncertain inputs
CN116775741A (zh) 一种工程竣工决算的审计方法及相关装置
CN113610160B (zh) 一种基于神经网络的钢筋检测分类方法、系统及存储介质
KR20180060761A (ko) 전기설비 안전도 평가 방법 및 시스템
CN106326278A (zh) 一种判断数据异常方法和设备
CN105842535B (zh) 一种基于相似特征融合的谐波主特征群筛选方法
CN108053093A (zh) 一种基于平均影响值数据变换的k-近邻故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant