CN106548035A - 一种数据异常的诊断方法及装置 - Google Patents

一种数据异常的诊断方法及装置 Download PDF

Info

Publication number
CN106548035A
CN106548035A CN201611051180.1A CN201611051180A CN106548035A CN 106548035 A CN106548035 A CN 106548035A CN 201611051180 A CN201611051180 A CN 201611051180A CN 106548035 A CN106548035 A CN 106548035A
Authority
CN
China
Prior art keywords
data
period
purpose reference
reference period
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611051180.1A
Other languages
English (en)
Other versions
CN106548035B (zh
Inventor
丁冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201611051180.1A priority Critical patent/CN106548035B/zh
Publication of CN106548035A publication Critical patent/CN106548035A/zh
Application granted granted Critical
Publication of CN106548035B publication Critical patent/CN106548035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明实施例公开了一种数据异常的诊断方法,用于提高识别的准确性。本发明实施例方法包括:确定基准期的回溯长度和窗宽的取值条件,所述回溯长度用于确定所述基准期所在的时间区间,所述窗宽用于确定所述基准期的时间长度;选择所述回溯长度内所述窗宽满足所述取值条件的目标基准期;根据数据波动率判断所述目标基准期的数据是否异常;若正常,则确定所述目标基准期为参考基准期;根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;若不满足,则确定所述目标数据异常。

Description

一种数据异常的诊断方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种数据异常的诊断方法及装置。
背景技术
随着信息技术的发展,互联网、金融等行业均会累积海量的数据,而业务运营也越来越依赖于对海量数据的采集、处理和统计分析。而这些数据的即时性和可靠性对计算机的经营分析系统的要求非常高,有时候数据会出现异常波动,如果系统能够及时的识别出异常数据,经营者就能够针对异常数据及时的做出相应的分析并给出解决措施,从而能够提供更稳定的平台为用户办理各种业务。
现有技术一般采用环比和同比的波动差异识别出异常数据。环比即将现在的统计周期和上一个统计周期比较,同比即将现在的统计周期和历史同周期比较。
但是如果进行比较的数据本身就是异常的,那么识别出来的结果很有可能就是错误的,影响识别的准确性。
发明内容
本发明实施例提供了一种数据异常的诊断方法及装置,能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
有鉴于此,本发明实施例的第一方面提供了一种数据异常的诊断方法,包括:
确定基准期的回溯长度和窗宽的取值条件,所述回溯长度用于确定所述基准期所在的时间区间,所述窗宽用于确定所述基准期的时间长度;
选择所述回溯长度内所述窗宽满足所述取值条件的目标基准期;
根据数据波动率判断所述目标基准期的数据是否异常;
若正常,则确定所述目标基准期为参考基准期;
根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
若不满足,则确定所述目标数据异常。
在本发明实施例的第二方面提供了一种诊断装置,包括:
第一确定模块,用于确定基准期的回溯长度和窗宽的取值条件,所述回溯长度用于确定所述基准期所在的时间区间,所述窗宽用于确定所述基准期的时间长度;
第一选择模块,用于选择所述第一确定模块确定的所述回溯长度内所述窗宽满足所述取值条件的目标基准期;
第一判断模块,用于根据数据波动率判断所述第一选择模块选择的所述目标基准期的数据是否异常;
第二确定模块,用于当所述第一判断模块确定所述目标基准期的数据正常时,确定所述目标基准期为参考基准期;
第二判断模块,用于根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
第三确定模块,用于当所述第二判断模块确定不满足所述预置条件时,确定所述目标数据异常。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,诊断装置先确定基准期的回溯长度和窗宽的取值条件,再选择回溯长度内窗宽满足该取值条件的目标基准期,根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则将该目标基准期作为参考基准期,再根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
附图说明
图1为本发明实施例中数据异常的诊断方法的一个实施例流程图;
图2为本发明实施例中数据异常的诊断方法的另一实施例流程图;
图3为本发明实施例中数据异常的诊断方法的另一实施例流程图;
图4为本发明实施例实际应用场景中商品103和301的价格走势折线图;
图5为本发明实施例实际应用场景中商品103和301的日环比波动率折线图;
图6为本发明实施例中诊断装置的一个实施例示意图;
图7为本发明实施例中诊断装置的另一实施例示意图;
图8为本发明实施例中诊断装置的另一实施例示意图;
图9为本发明实施例中诊断装置的另一实施例示意图。
具体实施方式
本发明实施例提供了一种数据异常的诊断方法,可以选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本发明实施例中的数据指的是时序数据。时序数据指的是时间序列数据,时间序列数据是同一统一指标按时间顺序记录的数据列。在同一数据列中的各个数据必须是同口径的,要求具有可比性。时序数据可以是时期数,也可以时点数。具体可以是价格,流量或其他数据。
本发明实施例应用于时间序列数据的异常诊断,具体可以应用于金融、会计、互联网等行业的日常运营,还可以应用于打击游戏工作室非法收入等其他场景中,具体此处不作限定。
请参阅图1,本发明实施例中数据异常的诊断方法的一个实施例包括:
101、确定基准期的回溯长度和窗宽的取值条件;
某业务运行一段时间后,系统会将该业务对应的时序数据记录下来,而当系统想要知道某时序数据(即目标时间对应的目标数据)是否异常时,诊断装置会先确定基准期的回溯长度和窗宽的取值条件,其中,回溯长度指的是诊断装置要选取的基准数据距离目标时间的远近,即用于确定要选取的基准期所在的时间区间,窗宽则用于确定基准期的时间长度。
目标时间可以是当前时间,也可以是历史时间,可以是某一天,某一个月,某一个季度,或其他时间,具体此处不作限定。目标时间可以是用户选择的,也可以是诊断装置自行确定的,具体此处不作限定。
还需要说明的是,回溯长度和窗宽取值条件可以是用户设定的,也可以是诊断装置设定的,具体可以根据数据本身的特征设定,或根据时序数据的业务特性设定,或根据其他信息设定,具体此处不作限定。
102、选择该回溯长度内窗宽满足该取值条件的目标基准期;
诊断装置确定基准期的回溯长度和窗宽的取值条件后,在回溯长度内选择窗宽满足该取值条件的目标基准期。需要说明的是,本发明实施例中的时序数据可以存储在PostgreSQL、MYSQL等关系型数据库中,也可以通过其他数据存储方案存储,具体此处不作限定。诊断装置确定目标基准期后,会从存储有这些时序数据的地方获取该目标基准期对应的数据。
103、根据数据波动率判断该目标基准期的数据是否异常,若否,则执行步骤104;
诊断装置提取目标基准期对应的数据后,计算这些数据的波动率,根据该波动率判断该目标基准期的数据是否异常,若否,则执行步骤104。本发明实施例中的波动率可以是日环比波动率,具体可通过如下方式计算:日环比波动率=相邻两日差值/前日数值,也可以是周环比波动率,具体可以通过如下方式计算:周环比波动率=相邻两周平均值差值/前周平均值,还可以是其他方式计算数据波动率,具体此处不作限定。
104、确定该目标基准期为参考基准期,并执行步骤105;
当诊断装置确定目标基准期的数据正常时,确定该目标基准期为参考基准期。
105、根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤106;
诊断装置确定参考基准期后,根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤106。需要说明的是,预置条件可以是用户设置的,也可以是诊断装置设置的,具体此处不作限定。
106、确定该目标数据异常。
当诊断装置确定目标数据不满足预置条件时,确定该目标数据异常。诊断装置确定目标数据异常后,可以发出警报提示用户,也可以在时序数据的显示平台将该异常数据标志出来,还可以执行其他操作,具体此处不作设定。
本发明实施例中,诊断装置先确定基准期的回溯长度和窗宽的取值条件,再选择回溯长度内窗宽满足该取值条件的目标基准期,根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则将该目标基准期作为参考基准期,再根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
当诊断装置确定目标基准期的数据异常时,诊断装置可以通过其他方式确定参考基准期,下面对其中几种方式进行介绍:
一、选择备选基准期作为参考基准期。
请参阅图2,本发明实施例中异常数据的诊断方法的另一实施例包括:
201、确定基准期的回溯长度和窗宽的取值条件;
某业务运行一段时间后,系统会将该业务对应的时序数据记录下来,而当系统想要知道某时序数据(即目标时间对应的目标数据)是否异常时,诊断装置会先确定基准期的回溯长度和窗宽的取值条件,其中,回溯长度指的是诊断装置要选取的基准数据距离目标时间的远近,即用于确定要选取的基准期所在的时间区间,窗宽则用于确定基准期的时间长度。
目标时间可以是当前时间,也可以是历史时间,可以是某一天,某一个月,某一个季度,或其他时间,具体此处不作限定。目标时间可以是用户选择的,也可以是诊断装置自行确定的,具体此处不作限定。
还需要说明的是,回溯长度和窗宽取值条件可以是用户设定的,也可以是诊断装置设定的,具体可以根据数据本身的特征设定,或根据时序数据的业务特性设定,或根据其他信息设定,具体此处不作限定。
202、确定回溯长度内窗宽满足该取值条件的两个基准期;
诊断装置确定基准期的回溯长度和窗宽的取值条件后,在回溯长度内确定两个窗宽满足该取值条件的基准期,这两个基准期对应的时间是不相同的。
203、确定这两个基准期中的目标基准期及备选基准期;
诊断装置确定两个基准期后,选择其中一个座位目标基准期,另一个作为备选基准期,具体地,诊断装置可以通过如下方式确定目标基准期和备选基准期:将两个基准期中时间距离目标时间较近的基准期作为目标基准期,将时间距离目标时间较远的基准期作为备选基准期。诊断装置还可以通过其他方式确定目标基准期和备选基准期,具体此处不作限定。
204、根据数据波动率判断该目标基准期的数据是否异常,若否,则执行步骤205,若是,则执行步骤206;
诊断装置确定目标基准期后,根据数据波动率判断该目标基准期的数据是否异常,若否,则执行步骤205,若是,则执行步骤206。具体地,诊断装置可以通过如下方式判断目标基准期的数据是否异常:
先计算该目标基准期的第一数据波动率及预置周期的第二数据波动率,再计算第一数据波动率的标准差以及第二数据波动率的标准差,判断第一数据波动率的标准差是否大于预置倍数的第二数据波动率的标准差,若大于,则确定该目标基准期的数据异常,若不大于,则确定该目标基准期的数据正常。
诊断装置也可以通过其他方式判断目标基准期的数据是否正常,具体此处不作限定。
需要说明的是,预置周期指的是窗宽相对于基准期而言较大的一段时间,并且这段时间包括了目标基准期,比如说目标基准期的窗宽是七天,那么预置周期的窗宽可以是三个月,并且这三个月包含了这七天。第一数据波动率是根据目标基准期对应的数据计算得到的一组波动率值,第二数据波动率是根据预置周期对应的数据计算得到的一组波动率值,这两组波动率值均包含至少两个波动率值,这些波动率值可以通过日环比波动率的方式计算得到的,也可以通过周环比波动率的方式计算得到,还可以通过其他方式计算得到,具体此处不作限定,但是这两组波动率值均采用相同的计算方式得到。
还需要说明的是,本发明实施例中计算第一数据波动率及第二数据波动率用到的数据是诊断装置从数据库中调取的,也可以是诊断装置通过其他方式获取的,具体此处不作限定。本发明实施例中的预置倍数由用户或诊断装置设定,一般设为1.5,也可以设为其他数值,具体此处不作限定。
205、确定该目标基准期为参考基准期,并执行步骤207;
当诊断装置确定目标基准期的数据正常时,确定该目标基准期为参考基准期。
206、确定该备选基准期为参考基准期,并执行步骤207;
当诊断装置确定目标基准期的数据异常时,将步骤203中确定的备选基准期作为参考基准期。
207、根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤208,若是,则执行步骤209;
诊断装置确定参考基准期后,根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤208,若是,则执行步骤209。
具体地,诊断装置可以通过如下方式判断目标时间对应的目标数据是否满足预置条件:
诊断装置可以先计算参考基准期的样本均值及样本标准差,样本均值即参考基准期对应的数据的平均值,样本标准差即参考基准期对应的数据的标准差,诊断装置确定样本均值及样本标准差后,根据该样本均值及样本标准差判断目标时间对应的目标数据是否在预置范围内,若否,则确定该目标数据不满足预置条件。需要说明的是预置范围可以数值分布在距离样本均值两个样本标准差以内的范围,可以是数值分布在距离样本均值三个样本标准差以内的范围,还可以是其他范围,具体此处不作限定。
具体地,诊断装置可以假设参考基准期的数据服从正态分布,根据样本均值及样本标准差确定该参考基准期对应的正态分布函数,在根据这个正态分布函数计算目标数据对应的概率值,判断该概率值是否在概率预置区间内,若否,则确定目标数据不在预置范围内。这里预置概率区间可以是数值分布在距离样本均值两个标准差以内的范围,即概率值在0.025至0.975的概率区间内,也可以是数值分布在距离样本均值三个标准差以内的范围,即概率值在0.0015至0.9985的概率区间内,还可以是其他概率区间,具体此处不作限定。
诊断装置也可以直接根据样本均值及样本标准差计算正常数值范围,判断目标数据是否在该正常数值范围内,若是,则确定该目标数据不在预置范围内。这里正常数值范围可以是(μ-2σ)至(μ+2σ),也可以是(μ-3σ)至(μ+3σ),还可以通过其他方式确定,具体此处不作限定。其中μ为样本均值,σ为样本标准差。
应理解,诊断装置也可以通过其他方式判断目标时间对应的目标数据是否满足预置条件,具体此处不作限定。
208、确定该目标数据异常;
当诊断装置确定该目标数据不满足预置条件时,则可以确定该目标数据异常。诊断装置确定目标数据异常后,可以发出警报提示用户,也可以在时序数据的显示平台将该异常数据标志出来,还可以执行其他操作,具体此处不作设定。
209、执行其他流程。
当诊断装置确定该目标数据满足预置条件是,可以确定该目标数据正常,还可以执行其他流程,具体此处不作限定。
本发明实施例中,诊断装置先确定基准期的回溯长度和窗宽的取值条件,再选择回溯长度内窗宽满足该取值条件的目标基准期,根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则将该目标基准期作为参考基准期,再根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
其次,本发明实施例提供了一种目标基准期的数据异常时,确定参考基准期的方式,提高了方案的可实现性。
再次,本发明实施例提供了多种判断目标基准期的数据是否异常的方式,以及多种判断目标数据是否满足预置条件的方式,提高了方案的灵活性。
应理解,在上述图2对应的实施例是以一个备选基准期为例进行介绍的,而在一些实施例中,诊断装置确定回溯长度和窗宽的取值条件后,可以确定三个或以上回溯长度内窗宽满足该取值条件的基准期,将其中一个确定为目标基准期,其他的作为备选基准期,然后再通过步骤204所述的方式判断目标基准期的数据是否异常,若正常,则将目标基准期作为参考基准期,若异常,则可以从备选基准期中选择任意一个作为参考基准期。确定参考基准期后再通过步骤207所述的方式判断目标数据是否异常。
二、通过迭代的方式选择参考基准期。
301、确定基准期的回溯长度和窗宽的取值条件;
某业务运行一段时间后,系统会将该业务对应的时序数据记录下来,而当系统想要知道某时序数据(即目标时间对应的目标数据)是否异常时,诊断装置会先确定基准期的回溯长度和窗宽的取值条件,其中,回溯长度指的是诊断装置要选取的基准数据距离目标时间的远近,即用于确定要选取的基准期所在的时间区间,窗宽则用于确定基准期的时间长度。
目标时间可以是当前时间,也可以是历史时间,可以是某一天,某一个月,某一个季度,或其他时间,具体此处不作限定。目标时间可以是用户选择的,也可以是诊断装置自行确定的,具体此处不作限定。
还需要说明的是,回溯长度和窗宽取值条件可以是用户设定的,也可以是诊断装置设定的,具体可以根据数据本身的特征设定,或根据时序数据的业务特性设定,或根据其他信息设定,具体此处不作限定。
302、选择该回溯长度内窗宽满足该取值条件的目标基准期;
诊断装置确定回溯长度和窗宽的取值条件后,选择一个回溯长度内窗宽满足该取值条件的目标基准期。
303、根据数据波动率判断该目标基准期的数据是否异常,若否,则执行步骤304,若是,则执行步骤305;
诊断装置确定目标基准期后,根据数据波动率判断该目标基准期的数据是否异常,若否,则执行步骤305,若是,则执行步骤306。具体地,诊断装置可以通过如下方式判断目标基准期的数据是否异常:
先计算该目标基准期的第一数据波动率及预置周期的第二数据波动率,再计算第一数据波动率的标准差以及第二数据波动率的标准差,判断第一数据波动率的标准差是否大于预置倍数的第二数据波动率的标准差,若大于,则确定该目标基准期的数据异常,若不大于,则确定该目标基准期的数据正常。
诊断装置也可以通过其他方式判断目标基准期的数据是否异常,具体此处不作限定。
需要说明的是,预置周期指的是窗宽相对于基准期而言较大的一段时间,并且这段时间包括了目标基准期,比如说目标基准期的窗宽是七天,那么预置周期的窗宽可以是三个月,并且这三个月包含了这七天。第一数据波动率是根据目标基准期对应的数据计算得到的一组波动率值,第二数据波动率是根据预置周期对应的数据计算得到的一组波动率值,这两组波动率值均包含至少两个波动率值,这些波动率值可以通过日环比波动率的方式计算得到的,也可以通过周环比波动率的方式计算得到,还可以通过其他方式计算得到,具体此处不作限定,但是这两组波动率值均采用相同的计算方式得到。
还需要说明的是,本发明实施例中计算第一数据波动率及第二数据波动率用到的数据是诊断装置从数据库中调取的,也可以是诊断装置通过其他方式获取的,具体此次不作限定。本发明实施例中的预置倍数由用户或诊断装置设定,一般设为1.5,也可以设为其他数值,具体此处不作限定。
304、确定该目标基准期为参考基准期,并执行步骤307;
当诊断装置确定该目标基准期的数据正常时,确定该目标基准期为参考基准期。
305、选择该回溯长度内窗宽满足该取值条件的另一基准期,并执行步骤306;
当诊断装置确定该目标基准期的数据异常时,诊断装置确定该目标基准期的数据无效,再重新选择另一个该回溯长度内窗宽满足该取值条件的基准期。
306、将该另一基准期作为目标基准期,并返回执行步骤303;
诊断装置确定另一个基准期后,将这个基准期作为目标基准期,并返回执行步骤303。也就是说诊断装置会先选择一个基准期,对该基准期进行判断,如果该基准期的数据异常,则再选择另一个基准期进行判断,直到选出一个数据正常的基准期为止,并将这个数据正常的基准期作为参考基准期。需要说明的是,诊断装置选择基准期的顺序可以按照时间距离目标时间远近来选择,即先选择时间距离目标时间较近的基准期,再选择时间距离目标时间较远的基准期。诊断装置也可以任意选择基准期,或按照其他方式选择基准期,具体此处不作限定。
307、根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤308,若是,则执行步骤309;
诊断装置确定出参考基准期后,根据该参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件,若否,则执行步骤308,若是,则执行步骤309。
具体地,诊断装置可以通过如下方式判断目标时间对应的目标数据是否满足预置条件:
诊断装置可以先计算参考基准期的样本均值及样本标准差,样本均值即参考基准期对应的数据的平均值,样本标准差即参考基准期对应的数据的标准差,诊断装置确定样本均值及样本标准差后,根据该样本均值及样本标准差判断目标时间对应的目标数据是否在预置范围内,若否,则确定该目标数据不满足预置条件。需要说明的是预置范围可以数值分布在距离样本均值两个样本标准差以内的范围,可以是数值分布在距离样本均值三个样本标准差以内的范围,还可以是其他范围,具体此处不作限定。
具体地,诊断装置可以假设参考基准期的数据服从正态分布,根据样本均值及样本标准差确定该参考基准期对应的正态分布函数,在根据这个正态分布函数计算目标数据对应的概率值,判断该概率值是否在概率预置区间内,若否,则确定目标数据不在预置范围内。这里预置概率区间可以是数值分布在距离样本均值两个标准差以内的范围,即概率值在0.025至0.975的概率区间内,也可以是数值分布在距离样本均值三个标准差以内的范围,即概率值在0.0015至0.9985的概率区间内,还可以是其他概率区间,具体此处不作限定。
诊断装置也可以直接根据样本均值及样本标准差计算正常数值范围,判断目标数据是否在该正常数值范围内,若是,则确定该目标数据不在预置范围内。这里正常数值范围可以是(μ-2σ)至(μ+2σ),也可以是(μ-3σ)至(μ+3σ),还可以通过其他方式确定,具体此处不作限定。其中μ为样本均值,σ为样本标准差。
应理解,诊断装置也可以通过现有技术的方式或其他方式判断目标时间对应的目标数据是否满足预置条件,具体此处不作限定。
308、确定该目标数据异常;
当诊断装置确定该目标数据不满足预置条件时,则可以确定该目标数据异常。诊断装置确定目标数据异常后,可以发出警报提示用户,也可以在时序数据的显示平台将该异常数据标志出来,还可以执行其他操作,具体此处不作设定。
309、执行其他流程。
当诊断装置确定该目标数据满足预置条件是,可以确定该目标数据正常,还可以执行其他流程,具体此处不作限定。
本发明实施例中,诊断装置先确定基准期的回溯长度和窗宽的取值条件,再选择回溯长度内窗宽满足该取值条件的目标基准期,根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则将该目标基准期作为参考基准期,再根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
其次,本发明实施例提供了另一种目标基准期的数据异常时,确定参考基准期的方式,提高了方案的灵活性。
为了便于理解,下面以一实际应用场景对本发明实施例中的异常数据的诊断方法进行说明:
A业务从2016年6月22日运行到7月7日,系统将商品103和301的价格存储在PostgreSQL数据库中,其中,103和301的价格走势如图4所示,现在系统想要知道当前日期,即2016年7月7日(目标时间)103的交易价格77300(目标数据)是否异常。首先,诊断装置先确定基准期的回溯长度为一个月前,窗宽的取值条件为等于7天。确定回溯长度和窗宽取值条件后,诊断装置选择两个基准期,其中基准期1为2016年6月29日至7月5日,基准期2位2016年6月22日至6月28日。根据距离目标时间的远近,诊断装置将基准期1作为目标基准期,将基准期2作为备选基准期。
诊断装置根据PostgreSQL数据库中商品103和301的价格走势计算得到2016年6月22日到7月7日商品103和301的价格的日环比波动率,如图5所示。诊断装置计算基准期1(6月29日至7月5日)对应的日环比波动率(第一数据波动率)的标准差,以及预置周期(6月22日至7月7日)对应的日环比波动率(第二数据波动率)的标准差,计算得到第一数波动率的标准差为0.81,第二数据波动率的标准差为0.09,诊断装置判断第一数据波动率的标准差是否大于1.5倍的第二数据波动率的标准差,0.81>1.5*0.09,即第一数据波动率的标准差大于1.5倍的第二数据波动率的标准差,诊断装置确定基准期1(目标基准期)异常。诊断装置确定基准期2(备选基准期)参考基准期,诊断装置假设商品103的价格波动服从正态分布,则计算基准期2的样本均值(即6月22日至7月7日的价格的平均值)以及样本标准差(即6月22日至7月7日的价格的标准差),计算结果样本均值为48500,样本标准差为13700,根据样本均值和样本标准差诊断装置确定参考基准期对应的正态分布函数为X~(48500,137002),根据该正态分布函数计算得到77300对应的概率值为0.98,概率值不在0.025至0.975的概率区间(预置概率区间)内,即目标数据超出了距离样本均值2个样本标准差的范围内,诊断装置确定目标数据77300异常,即确定2016年7月7日(目标时间)103的交易价格存在异常。
上面介绍了本发明实施例中数据异常的诊断方法,下面介绍本发明实施例中的诊断装置,请参阅图6,本发明实施例中诊断装置的一个实施例包括:
第一确定模块601,用于确定基准期的回溯长度和窗宽的取值条件,回溯长度用于确定基准期所在的时间区间,窗宽用于确定基准期的时间长度;
第一选择模块602,用于选择第一确定模块601确定的回溯长度内窗宽满足取值条件的目标基准期;
第一判断模块603,用于根据数据波动率判断第一选择模块602选择的目标基准期的数据是否异常;
第二确定模块604,用于当第一判断模块603确定目标基准期的数据正常时,确定目标基准期为参考基准期;
第二判断模块605,用于根据参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
第三确定模块606,用于当第二判断模块605确定不满足预置条件时,确定目标数据异常。
本发明实施例中,第一确定模块601先确定基准期的回溯长度和窗宽的取值条件,第一选择模块602再选择回溯长度内窗宽满足该取值条件的目标基准期,第一判断模块603根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则第二确定模块604将该目标基准期作为参考基准期,第二判断模块605根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
在上述图6对应的实施例,当诊断装置确定目标基准期的数据异常时,可以通过其他方式确定参考基准期,下面对其中几种方式进行介绍:
请参阅图7,本发明实施例中诊断装置的另一实施例包括:
第一确定模块701,用于确定基准期的回溯长度和窗宽的取值条件,回溯长度用于确定基准期所在的时间区间,窗宽用于确定基准期的时间长度;
第一选择模块702,用于选择第一确定模块701确定的回溯长度内窗宽满足取值条件的目标基准期;
第一判断模块703,用于根据数据波动率判断第一选择模块702选择的目标基准期的数据是否异常;
第二确定模块704,用于当第一判断模块703确定目标基准期的数据正常时,确定目标基准期为参考基准期;
第二判断模块705,用于根据参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
第三确定模块706,用于当第二判断模块705确定不满足预置条件时,确定目标数据异常;
其中,第一选择模块702包括:
第一确定单元7021,用于确定回溯长度内窗宽满足该取值条件的两个基准期;
第二确定单元7022,用于确定第一确定单元7021确定的两个基准期中的目标基准期及备选基准期;
对应地,该装置还包括:
第四确定模块707,用于当第一判断模块703确定该目标基准期的数据异常时,确定该备选基准期为参考基准期。
可选地,第一确定单元7021可以包括:
第一确定子单元70211,用于将两个基准期中时间距离目标时间较近的基准期作为目标基准期,将时间距离目标时间较远的基准期作为备选基准期。
本发明实施例中,第一确定模块701先确定基准期的回溯长度和窗宽的取值条件,第一选择模块702再选择回溯长度内窗宽满足该取值条件的目标基准期,第一判断模块703根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则第二确定模块704将该目标基准期作为参考基准期,第二判断模块705根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
其次,本发明实施例提供了一种当目标基准期的数据异常时,确定参考基准期的具体方式,提高了方案的可实现性。
请参阅图8,本发明实施例中诊断装置的另一实施例包括:
第一确定模块801,用于确定基准期的回溯长度和窗宽的取值条件,回溯长度用于确定基准期所在的时间区间,窗宽用于确定基准期的时间长度;
第一选择模块802,用于选择第一确定模块801确定的回溯长度内窗宽满足取值条件的目标基准期;
第一判断模块803,用于根据数据波动率判断第一选择模块802选择的目标基准期的数据是否异常;
第二确定模块804,用于当第一判断模块803确定目标基准期的数据正常时,确定目标基准期为参考基准期;
第二判断模块805,用于根据参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
第三确定模块806,用于当第二判断模块805确定不满足预置条件时,确定目标数据异常;
第二选择模块807,用于当所述第一判断模块803确定所述目标基准期的数据异常时,选择所述回溯长度内所述窗宽满足所述取值条件的另一基准期;
第五确定模块808,用于将所述第二选择模块807选择的所述另一基准期作为所述目标基准期,并触发所述第一判断模块,第二确定模块及所述第二选择模块。
本发明实施例中,第一确定模块801先确定基准期的回溯长度和窗宽的取值条件,第一选择模块802再选择回溯长度内窗宽满足该取值条件的目标基准期,第一判断模块803根据数据波动率判断该目标基准期的数据是否异常,当确定该目标基准期正常时,则第二确定模块804将该目标基准期作为参考基准期,第二判断模块805根据该参考基准期的数据特征识别出异常数据。本方案能够排除掉异常的基准期数据,选择可靠性更高的数据作为参考基准来识别异常数据,提高识别的准确性。
其次,本发明实施例提供了另一种当目标基准期的数据异常时,确定参考基准期的具体方式,提高了方案的可灵活性。
基于上述图6至图8对应的实施例中任意一个实施例,在本发明实施例的另一实施例中,第一判断模块可以包括:
第一计算单元,用于计算目标基准期的第一数据波动率及预置周期的第二数据波动率,目标基准期在预置周期内;
第一判断单元,用于判断第一计算单元确定的第一数据波动率的标准差是否大于预置倍数的第二数据波动率的标准差;
第三确定单元,用于当第一判断单元确定第一数据波动率的标准差大于预置倍数的第二数据波动率的标准差时,确定目标基准期的数据异常;
第四确定单元,用于当第一判断单元确定第一数据波动率的标准差不大于预置倍数的第二数据波动率的标准差时,确定目标基准期的数据正常。
本发明实施例提供了一种判断目标基准期的数据是否异常的实现方式,提高了方案的可实现性。
基于上述图6至图8对应的实施例中任意一个实施例,在本发明实施例的另一实施例中,第二判断模块可以包括:
第二计算单元,用于计算参考基准期的样本均值及样本标准差;
第二判断单元,用于根据样本均值及样本标准差判断目标数据是否在预置范围内;
第五确定单元,用于当第二判断单元确定目标数据不再预置范围内时,确定目标数据不满足预置条件。
可选地,第二判断单元可以包括:
第二确定子单元,用于根据第二计算单元确定的样本均值及样本标准差确定参考基准期对应的正态分布函数。
计算子单元,用于根据第二确定子单元确定的正态分布函数计算目标数据对应的概率值;
判断子单元,用于判断计算子单元确定的概率值是否在预置概率区间内;
第三确定子单元,用于当判断子单元确定概率值不在预置概率区间内时,确定目标数据不在预置范围内。
本发明实施例中第二判断模块通过参考基准期确定分布函数,再通过分布函数判断目标数据是否异常,进一步提高了方案的准确性。
上面从功能模块的角度介绍了本发明实施例中的诊断装置,下面从硬件实体的角度介绍本发明实施例中的诊断装置,请参阅图9,图9是本发明实施例诊断装置90的结构示意图。诊断装置90可包括输入设备910、输出设备920、处理器930和存储器940。本发明实施例中的输出设备可以是显示设备。
存储器940可以包括只读存储器和随机存取存储器,并向处理器930提供指令和数据。存储器940的一部分还可以包括非易失性随机存取存储器(英文全称:Non-VolatileRandom Access Memory,英文缩写:NVRAM)。
存储器940存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
本发明实施例中处理器930用于:
确定基准期的回溯长度和窗宽的取值条件,回溯长度用于确定基准期所在的时间区间,窗宽用于确定基准期的时间长度;
选择回溯长度内窗宽满足取值条件的目标基准期;
根据数据波动率判断目标基准期的数据是否异常;
当确定目标基准期的数据正常时,确定目标基准期为参考基准期;
根据参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
当确定目标数据不满足预置条件时,则确定目标数据异常。
处理器930控制诊断装置90的操作,处理器930还可以称为中央处理单元(英文全称:Central Processing Unit,英文缩写:CPU)。存储器940可以包括只读存储器和随机存取存储器,并向处理器930提供指令和数据。存储器940的一部分还可以包括NVRAM。具体的应用中,诊断装置90的各个组件通过总线系统950耦合在一起,其中总线系统950除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统950。
上述本发明实施例揭示的方法可以应用于处理器930中,或者由处理器930实现。处理器930可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器930中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器930可以是通用处理器、数字信号处理器(英文全称:Digital Signal Processing,英文缩写:DSP)、专用集成电路(英文全称:Application Specific Integrated Circuit,英文缩写:ASIC)、现成可编程门阵列(英文全称:Field-Programmable Gate Array,英文缩写:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器940,处理器930读取存储器940中的信息,结合其硬件完成上述方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种数据异常的诊断方法,其特征在于,包括:
1)确定基准期的回溯长度和窗宽的取值条件,所述回溯长度用于确定所述基准期所在的时间区间,所述窗宽用于确定所述基准期的时间长度;
2)选择所述回溯长度内所述窗宽满足所述取值条件的目标基准期;
3)根据数据波动率判断所述目标基准期的数据是否异常;
4)若正常,则确定所述目标基准期为参考基准期;
5)根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
6)若不满足,则确定所述目标数据异常。
2.根据权利要求1所述的方法,其特征在于,所述选择所述回溯长度内所述窗宽满足所述取值条件的目标基准期包括:
确定所述回溯长度内所述窗宽满足所述取值条件的两个基准期;
确定所述两个基准期中的目标基准期及备选基准期;
所述方法还包括:
当确定所述目标基准期的数据异常时,确定所述备选基准期为参考基准期。
3.根据权利要求2所述的方法,其特征在于,所述确定所述两个基准期中的目标基准期及备选基准期包括:
将所述两个基准期中时间距离所述目标时间较近的基准期作为目标基准期,将时间距离所述目标时间较远的基准期作为备选基准期。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7)当确定所述目标基准期的数据异常时,选择所述回溯长度内所述窗宽满足所述取值条件的另一基准期;
将所述另一基准期作为所述目标基准期,并重复执行步骤3)、4)和7)。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据数据波动率判断所述目标基准期的数据是否异常包括:
计算所述目标基准期的第一数据波动率及预置周期的第二数据波动率,所述目标基准期在所述预置周期内;
判断所述第一数据波动率的标准差是否大于预置倍数的第二数据波动率的标准差;
若大于,则确定所述目标基准期的数据异常;
若不大于,则确定所述目标基准期的数据正常。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件包括:
计算所述参考基准期的样本均值及样本标准差;
根据所述样本均值及所述样本标准差判断目标时间对应的目标数据是否在预置范围内;
若否,则确定所述目标数据不满足预置条件。
7.根据权利要求6所述的方法,其特征在于,根据所述样本均值及所述样本标准差判断所述目标数据是否在预置范围内包括:根据所述样本均值及所述样本标准差确定所述参考基准期对应的正态分布函数;
根据所述正态分布函数计算所述目标数据对应的概率值;
判断所述概率值是否在预置概率区间内;
若否,则确定所述目标数据不在预置范围内。
8.一种诊断装置,其特征在于,包括:
第一确定模块,用于确定基准期的回溯长度和窗宽的取值条件,所述回溯长度用于确定所述基准期所在的时间区间,所述窗宽用于确定所述基准期的时间长度;
第一选择模块,用于选择所述第一确定模块确定的所述回溯长度内所述窗宽满足所述取值条件的目标基准期;
第一判断模块,用于根据数据波动率判断所述第一选择模块选择的所述目标基准期的数据是否异常;
第二确定模块,用于当所述第一判断模块确定所述目标基准期的数据正常时,确定所述目标基准期为参考基准期;
第二判断模块,用于根据所述参考基准期的数据特征判断目标时间对应的目标数据是否满足预置条件;
第三确定模块,用于当所述第二判断模块确定不满足所述预置条件时,确定所述目标数据异常。
9.根据权利要求8所述的装置,其特征在于,所述第一选择模块包括:
第一确定单元,用于确定所述回溯长度内所述窗宽满足所述取值条件的两个基准期;
第二确定单元,用于确定所述第一确定单元确定的所述两个基准期中的目标基准期及备选基准期;
所述装置还包括:
第四确定模块,用于当所述第一判断模块确定所述目标基准期的数据异常时,确定所述备选基准期为参考基准期。
10.根据权利要求9所述的装置,其特征在于,所述第一确定单元包括:
第一确定子单元,用于将所述两个基准期中时间距离所述目标时间较近的基准期作为目标基准期,将时间距离所述目标时间较远的基准期作为备选基准期。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二选择模块,用于当所述第一判断模块确定所述目标基准期的数据异常时,选择所述回溯长度内所述窗宽满足所述取值条件的另一基准期;
第五确定模块,用于将所述第二选择模块选择的所述另一基准期作为所述目标基准期,并触发所述第一判断模块,第二确定模块及所述第二选择模块。
12.根据权利要求8至11中任一项所述的装置,其特征在于,所述第一判断模块包括:
第一计算单元,用于计算所述目标基准期的第一数据波动率及预置周期的第二数据波动率,所述目标基准期在所述预置周期内;
第一判断单元,用于判断所述第一计算单元确定的所述第一数据波动率的标准差是否大于预置倍数的第二数据波动率的标准差;
第三确定单元,用于当所述第一判断单元确定所述第一数据波动率的标准差大于预置倍数的第二数据波动率的标准差时,确定所述目标基准期的数据异常;
第四确定单元,用于当所述第一判断单元确定所述第一数据波动率的标准差不大于预置倍数的第二数据波动率的标准差时,确定所述目标基准期的数据正常。
13.根据权利要求8至11中任一项所述的装置,其特征在于,所述第二判断模块包括:
第二计算单元,用于计算所述参考基准期的样本均值及样本标准差;
第二判断单元,用于根据所述样本均值及所述样本标准差判断所述目标数据是否在预置范围内;
第五确定单元,用于当所述第二判断单元确定所述目标数据不在预置范围内时,确定所述目标数据不满足预置条件。
14.根据权利要求13所述的装置,其特征在于,所述第二判断单元包括:
第二确定子单元,用于根据所述第二计算单元确定的所述样本均值及所述样本标准差确定所述参考基准期对应的正态分布函数;
计算子单元,用于根据所述第二确定子单元确定的所述正态分布函数计算所述目标数据对应的概率值;
判断子单元,用于判断所述计算子单元确定的所述概率值是否在预置概率区间内;
第三确定子单元,用于当所述判断子单元确定所述概率值不在所述预置概率区间内时,确定所述目标数据不在预置范围内。
CN201611051180.1A 2016-11-24 2016-11-24 一种数据异常的诊断方法及装置 Active CN106548035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611051180.1A CN106548035B (zh) 2016-11-24 2016-11-24 一种数据异常的诊断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611051180.1A CN106548035B (zh) 2016-11-24 2016-11-24 一种数据异常的诊断方法及装置

Publications (2)

Publication Number Publication Date
CN106548035A true CN106548035A (zh) 2017-03-29
CN106548035B CN106548035B (zh) 2019-08-06

Family

ID=58395059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611051180.1A Active CN106548035B (zh) 2016-11-24 2016-11-24 一种数据异常的诊断方法及装置

Country Status (1)

Country Link
CN (1) CN106548035B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491875A (zh) * 2018-03-19 2018-09-04 深圳乐信软件技术有限公司 一种数据异常检测方法、装置、设备及介质
CN109558295A (zh) * 2018-11-15 2019-04-02 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN109978379A (zh) * 2019-03-28 2019-07-05 北京百度网讯科技有限公司 时序数据异常检测方法、装置、计算机设备和存储介质
CN110134077A (zh) * 2018-02-08 2019-08-16 株式会社斯库林集团 数据处理方法、数据处理装置及记录介质
CN110765201A (zh) * 2019-09-16 2020-02-07 北京许继电气有限公司 构建PostgreSQL数据库下处理时序数据的方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000202742A (ja) * 1999-01-14 2000-07-25 Kobe Steel Ltd シミュレ―ション方法及びその装置
US20120253724A1 (en) * 2011-04-01 2012-10-04 Hitachi Kokusai Electric Inc. Management device
CN102945320A (zh) * 2012-10-29 2013-02-27 河海大学 一种时间序列数据异常检测方法与装置
CN104915846A (zh) * 2015-06-18 2015-09-16 北京京东尚科信息技术有限公司 一种电子商务时间序列数据的异常检测方法及系统
CN105978848A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 一种收集传感器数据的处理方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000202742A (ja) * 1999-01-14 2000-07-25 Kobe Steel Ltd シミュレ―ション方法及びその装置
US20120253724A1 (en) * 2011-04-01 2012-10-04 Hitachi Kokusai Electric Inc. Management device
CN102945320A (zh) * 2012-10-29 2013-02-27 河海大学 一种时间序列数据异常检测方法与装置
CN104915846A (zh) * 2015-06-18 2015-09-16 北京京东尚科信息技术有限公司 一种电子商务时间序列数据的异常检测方法及系统
CN105978848A (zh) * 2015-12-04 2016-09-28 乐视致新电子科技(天津)有限公司 一种收集传感器数据的处理方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134077A (zh) * 2018-02-08 2019-08-16 株式会社斯库林集团 数据处理方法、数据处理装置及记录介质
US11274995B2 (en) 2018-02-08 2022-03-15 SCREEN Holdings Co., Ltd. Data processing method, data processing device, and computer-readable recording medium having recorded thereon data processing program
CN108491875A (zh) * 2018-03-19 2018-09-04 深圳乐信软件技术有限公司 一种数据异常检测方法、装置、设备及介质
CN109558295A (zh) * 2018-11-15 2019-04-02 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN109558295B (zh) * 2018-11-15 2022-05-24 新华三信息安全技术有限公司 一种性能指标异常检测方法及装置
CN109978379A (zh) * 2019-03-28 2019-07-05 北京百度网讯科技有限公司 时序数据异常检测方法、装置、计算机设备和存储介质
CN110765201A (zh) * 2019-09-16 2020-02-07 北京许继电气有限公司 构建PostgreSQL数据库下处理时序数据的方法和系统

Also Published As

Publication number Publication date
CN106548035B (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
CN106548035A (zh) 一种数据异常的诊断方法及装置
US20220131770A1 (en) System and method for predicting and reducing subscriber churn
JP6716297B2 (ja) 予測信頼性マイニングのためのシステム及び方法
US7509234B2 (en) Root cause diagnostics using temporal data mining
CN106415507A (zh) 日志分析装置、攻击检测装置、攻击检测方法以及程序
CN111916150B (zh) 一种基因组拷贝数变异的检测方法和装置
CN105593864A (zh) 用于维护设备的分析设备退化
US20160132798A1 (en) Service-level agreement analysis
JP4889618B2 (ja) データ処理装置及びデータ処理方法及びプログラム
CN109327345A (zh) 网络异常流量的检测方法和装置、计算机可读存储介质
CN114708717B (zh) 一种系统监控的关联告警方法及装置
CN112581271B (zh) 一种商户交易风险监测方法、装置、设备及存储介质
CN112801316A (zh) 基于多指标数据的故障定位方法、系统设备及存储介质
CN115422464A (zh) 一种序列事件的参与人数的确定方法、装置及存储介质
CN117171157A (zh) 基于数据分析的清算数据采集清洗方法
CN111797942A (zh) 用户信息的分类方法及装置、计算机设备、存储介质
CN108509440A (zh) 一种数据处理方法及装置
CN112990769A (zh) 业务处理方法、装置、电子设备和存储介质
CN108335435A (zh) 一种存取款机的维护方法、装置、终端设备和存储介质
CN111401959A (zh) 风险群体的预测方法、装置、计算机设备及存储介质
CN111489165B (zh) 目标对象的数据处理方法、装置和服务器
Chatterjee et al. Transfer function modelling in software reliability
CN112737799B (zh) 一种数据处理方法、装置及存储介质
CN114860608A (zh) 基于场景构建的系统自动化测试方法、装置、设备及介质
CN111199419B (zh) 股票异常交易的识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant