CN113110971B - 异常数据检测方法、装置、计算机设备和存储介质 - Google Patents
异常数据检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113110971B CN113110971B CN202110382515.2A CN202110382515A CN113110971B CN 113110971 B CN113110971 B CN 113110971B CN 202110382515 A CN202110382515 A CN 202110382515A CN 113110971 B CN113110971 B CN 113110971B
- Authority
- CN
- China
- Prior art keywords
- data
- preset
- parameter
- interval
- confidence interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 56
- 238000001514 detection method Methods 0.000 title claims abstract description 24
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000012163 sequencing technique Methods 0.000 claims abstract description 8
- 238000004590 computer program Methods 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 8
- 230000002547 anomalous effect Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 abstract description 3
- 230000005856 abnormality Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002354 daily effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请涉及一种异常数据检测方法、装置、计算机设备和存储介质,方法包括:获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;获取所述数据序列中的多个预设位置处的数据;确定所述数据序列的预设统计参数;根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;根据所述数据置信区间,检测所述数据序列中的异常数据。本申请可以及时地检测出一个数据序列中的异常数据,发现预设指标的异常波动,进而进行相关的推送,将异常数据发送给相关的技术人员,便于进行后续的原因分析等工作,从而避免或减少相关设备发生故障。
Description
技术领域
本申请涉及数据检测技术领域,尤其涉及一种异常数据检测方法、装置、计算机设备和存储介质。
背景技术
在工作中,我们每天都会面对各种各样的数据指标,例如,日活跃用户数量(DailyActive User,简称DAU)、月活跃用户数量(Monthly Active User,简称MAU)、接口的成功率、响应时间等。当这些数据指标发生异常波动(例如,骤增或骤降)时,需要及时地检测出异常数据,以对发生异常的原因进行定位,因此需要一种能够检测异常数据的方案。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种异常数据检测方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种异常数据检测方法,包括:
获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;
获取所述数据序列中的多个预设位置处的数据;
确定所述数据序列的预设统计参数;
根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;
根据所述数据置信区间,检测所述数据序列中的异常数据。
第二方面,本申请提供了一种异常数据检测装置,包括:
第一获取模块,用于获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;
第二获取模块,用于获取所述数据序列中的多个预设位置处的数据;
参数确定模块,用于确定所述数据序列的预设统计参数;
区间确定模块,用于根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;
异常检测模块,用于根据所述数据置信区间,检测所述数据序列中的异常数据。
第三方面,本申请提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中,首先选取数据序列中多个预设位置的数据,确定数据序列的预设统计参数,然后根据多个预设位置处的数据和预设统计参数来确定数据置信区间,进而利用该数据置信区间进行异常数据筛选。这样可以及时地检测出一个数据序列中的异常数据,发现预设指标的异常波动,进而进行相关的推送,将异常数据发送给相关的技术人员,便于进行后续的原因分析等工作,从而避免或减少相关设备发生故障。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种异常数据检测方法的流程示意图;
图2为本申请实施例提供的一种异常数据检测装置的结构示意图;
图3为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一方面,本申请实施例提供的一种异常数据检测方法,如图1所示,该方法包括如下步骤:
S110、获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;
其中,预设指标可以根据需要选择,例如,日活跃用户数量(Daily Active User,简称DAU)、月活跃用户数量(Monthly Active User,简称MAU)、接口的成功率、响应时间等指标。
其中,预设时间段可以根据需要选择,例如,一天之内,一个月之内,一个星期之内等,可以根据预设指标设置对应的预设时间段。
其中,预设顺序,可以是从小到大的顺序,也可以是从大到小的顺序。
这里,将一个指标在一个时间段内的数据按照一定的顺序进行排序,即可得到一个数据序列。
例如,某个应用程序的接口不定时的出现响应超时,这时需要分析超时原因,将响应时间作为预设指标,然后获取在一段时间内的响应时间,并对获取到的响应时间进行排序,得到数据序列。
除了上述举例提供的场景之外,本申请实施例提供的方法可以应用在其它多种实际场景中。例如,当对于视频创作平台,每天需要监测视频生产的各个环节,包括视频上传、视频审核、视频推荐、视频分发、视频消费等流程。每个环节都会出现异常情况,同样需要进行异常检测,具体可以根据环节的种类选择预设指标。再例如,负责产品或者运营的工作人员会关注每天的活跃用户数,即DAU,将DAU作为预设指标,进行异常检测。当DAU指标发生异常波动的时候,能够及时地进行推送通知,分析导致DAU指标波动的原因。
S120、获取所述数据序列中的多个预设位置处的数据;
其中,多个预设位置可以根据需要选择,例如,25分位、中分位、75分位等。所谓的分位是指在数据序列中的位置,例如,25分位为数据序列中的1/4位置。如果一个数据序列中有20个数据,则25分位处的数据为第5个数据;但是如果一个数据序列中有21个数据,则25分位处的数据为第5个数据和第6个数据的均值。其他分位的数据也是同样的计算方式。
S130、确定所述数据序列的预设统计参数;
可理解的是,针对一个数据序列,其统计参数有多种,例如,标准差、方差、均值、期望等,预设统计参数可以根据需要选择何种统计参数。
S140、根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;
在具体实施时,步骤S140可以具体包括如下步骤:
S141、根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数;
可理解的是,区间宽度调节参数是用来对数据置信区间的宽度进行调节的参数。
在具体实施时,所述预设统计参数可以包括标准差和均值,此时步骤S140可以包括如下过程:
S141、计算所述数据序列的标准差δ和均值μ;
S142、设置参数N,将所述参数N从0开始逐步增加,当N增加到所述数据序列中预设数量的数据均落在预设区间[μ-N×δ,μ+N×δ]内时,所述参数N停止增加,并将所述参数N的当前值作为所述区间宽度调节参数。
其中,预设数量可以选择90%以上的值,例如98%,这样可以保证数据序列中的大部分数据都能落在预设区间内,根据此时的N计算出来的数据置信区间不会过宽,也不会过窄。
S142、根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,所述位置间距参数用于表征所述多个预设位置处的数据之间的差值的参数;
在具体实施时,选取的预设位置不同,位置间距参数的计算也会出现不同,下面提供两种计算方式:
(1)多个预设位置处的数据可以包括25分位处的数据和75分位处的数据,此时步骤S142可以采用第一公式计算所述位置间距参数,所述第一公式包括:
M=Q3-Q1
式中,M为所述位置间距参数,Q1为所述25分位处的数据,Q3为所述75分位处的数据。
在该公式中,位置间距参数为75分位处的数据与25分位处的数据的差值。
(2)多个预设位置处的数据可以包括25分位处的数据、中分位处的数据和75分位处的数据;此时步骤S142可以采用第二公式计算所述位置间距参数,所述第二公式包括:
M=2×max{Q2-Q1,Q3-Q2}
式中,M为所述位置间距参数,Q1为所述25分位处的数据,Q2为所述中分位处的数据,Q3为所述75分位处的数据。
在该公式中,位置间距参数为中分位处的数据和25分位处的数据之间的差值与75分位处的数据和中分位处的数据之间的差值中的最大值。
可见,位置间距参数体现了数据序列中不同位置处的数据之间的差值。
S143、根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间。
在具体实施时,步骤S143可以采用第三公式计算所述数据置信区间,所述第三公式包括:
P=[Q1-N×M,Q3+N×M]
式中,P为所述数据置信区间,M为所述位置间距参数,N为所述区间宽度调节参数,Q1为所述数据序列中25分位处的数据,Q3为所述数据序列中75分位处的数据。
从第三公式可以看出,当N值越大时,数据置信区间的宽度越大,当N较大时,例如,N为3,此时可以利用数据置信区间筛选出重度异常的数据。N值越小,数据置信区间的宽度越小,当N较小时,例如,N为1.5,此时可以利用数据置信区间筛选出中度异常的数据。
S150、根据所述数据置信区间,检测所述数据序列中的异常数据。
可理解的是,通过以上第三公式计算出来的数据置信区间为正常数据的置信区间,此时判断所述数据序列中是否存在落在所述数据置信区间之外的数据,若存在,则将落在所述数据置信区间之外的数据作为异常数据。
当然,也可以通过其他公式计算异常数据的置信区间,此时判断所述数据序列中是否存在落在所述数据置信区间之内的数据,若存在,则将落在所述数据置信区间之内的数据作为异常数据。
本申请提供的异常数据检测方法,首先选取数据序列中多个预设位置的数据,确定数据序列的预设统计参数,然后根据多个预设位置处的数据和预设统计参数来确定数据置信区间,进而利用该数据置信区间进行异常数据筛选。这样可以及时地检测出一个数据序列中的异常数据,发现预设指标的异常波动,进而进行相关的推送,例如,通过热聊、邮件、短信等方式将异常数据发送给相关的技术人员,便于进行后续的原因分析等工作,从而避免或减少相关设备发生故障。
第二方面,本申请提供一种异常数据检测装置,如图2所示,该装置100包括如下模块:
第一获取模块110,用于获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;
第二获取模块120,用于获取所述数据序列中的多个预设位置处的数据;
参数确定模块130,用于确定所述数据序列的预设统计参数;
区间确定模块140,用于根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;
异常检测模块150,用于根据所述数据置信区间,检测所述数据序列中的异常数据。
在一些实施例中,区间确定模块140包括:
第一参数确定单元,用于根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数;
第二参数确定单元,用于根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,所述位置间距参数用于表征所述多个预设位置处的数据之间的差值的参数;
区间确定单元,用于根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间。
在一些实施例中,所述预设统计参数包括标准差和均值;所述第一参数确定单元具体用于:
计算所述数据序列的标准差δ和均值μ;
设置参数N,将所述参数N从0开始逐步增加,当N增加到所述数据序列中预设数量的数据均落在预设区间[μ-N×δ,μ+N×δ]内时,所述参数N停止增加,并将所述参数N的当前值作为所述区间宽度调节参数。
在一些实施例中,所述多个预设位置处的数据包括25分位处的数据和75分位处的数据;所述第二参数确定单元具体用于采用第一公式计算所述位置间距参数,所述第一公式包括:
M=Q3-Q1
式中,M为所述位置间距参数,Q1为所述25分位处的数据,Q3为所述75分位处的数据。
在一些实施例中,所述多个预设位置处的数据包括25分位处的数据、中分位处的数据和75分位处的数据;所述第二参数确定单元具体用于采用第二公式计算所述位置间距参数,所述第二公式包括:
M=2×max{Q2-Q1,Q3-Q2}
式中,M为所述位置间距参数,Q1为所述25分位处的数据,Q2为所述中分位处的数据,Q3为所述75分位处的数据。
在一些实施例中,区间确定单元具体用于采用第三公式计算所述数据置信区间,所述第三公式包括:
P=[Q1-N×M,Q3+N×M]
式中,P为所述数据置信区间,M为所述位置间距参数,N为所述区间宽度调节参数,Q1为所述数据序列中25分位处的数据,Q3为所述数据序列中75分位处的数据。
在一些实施例中,异常检测模块具体用于:判断所述数据序列中是否存在落在所述数据置信区间之外的数据,若存在,则将落在所述数据置信区间之外的数据作为异常数据。
可理解的是,本申请实施例提供的异常数据检测装置,有关内容的解释、举例、有益效果等部分可以参考第一方面中的相应部分,此处不再赘述。
第三方面,本申请实施例提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;获取所述数据序列中的多个预设位置处的数据;确定所述数据序列的预设统计参数;根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;根据所述数据置信区间,检测所述数据序列中的异常数据。
图3示出了一个实施例中计算机设备的内部结构图。如图3所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏等。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可以存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现异常数据检测方法。该内存储器中也可以储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行异常数据检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的异常数据检测装置可以实现为一种计算机程序的形式,计算机程序可在如图3所示的计算机设备上运行。计算机设备的存储器中可存储组成该扩容装置的各个程序模块,比如,图2所示的第一获取模块110、第二获取模块120、参数确定模块130、区间确定模块140、异常检测模块150。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的异常数据检测方法中的步骤。
例如,图3所示的计算机设备可以通过如图2所示的异常数据检测装置中的第一获取模块110执行获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列。计算机设备可以通过第二获取模块120执行获取所述数据序列中的多个预设位置处的数据;计算机设备可以通过参数确定模块130执行确定所述数据序列的预设统计参数;计算机设备可以通过区间确定模块140执行根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;计算机设备可以通过异常检测模块150执行根据所述数据置信区间,检测所述数据序列中的异常数据。
可理解的是,本申请实施例提供的计算机设备,有关内容的解释、举例、有益效果等部分可以参考第一方面中的相应部分,此处不再赘述。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:获取所述预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列;获取所述数据序列中的多个预设位置处的数据;确定所述数据序列的预设统计参数;根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间;根据所述数据置信区间,检测所述数据序列中的异常数据。
可理解的是,本申请实施例提供的计算机可读存储介质,有关内容的解释、举例、有益效果等部分可以参考第一方面中的相应部分,此处不再赘述。
可理解的是,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种异常数据检测方法,其特征在于,包括:
获取预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列,其中,所述预设指标包括:日活跃用户数量、月活跃用户数量、接口的成功率或响应时间;
获取所述数据序列中的多个预设位置处的数据;
确定所述数据序列的预设统计参数;
根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间,包括:根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数;根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,所述位置间距参数用于表征所述多个预设位置处的数据之间的差值的参数;根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间;其中,所述预设统计参数包括标准差和均值;所述根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数,包括:计算所述数据序列的标准差和均值;设置参数N,将所述参数N从0开始逐步增加,当N增加到所述数据序列中预设数量的数据均落在预设区间内时,所述参数N停止增加,并将所述参数N的当前值作为所述区间宽度调节参数;所述根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间,包括:采用第三公式计算所述数据置信区间,所述第三公式包括:
式中,P为所述数据置信区间,M为所述位置间距参数,N为所述区间宽度调节参数,为所述数据序列中25分位处的数据,为所述数据序列中75分位处的数据;
根据所述数据置信区间,检测所述数据序列中的异常数据,其中,所述异常数据用于当发现所述预设指标发生异常波动时,及时进行推送通知,分析所述预设指标发生异常波动的原因,减少设备发生故障。
2.根据权利要求1所述的方法,其特征在于,所述多个预设位置处的数据包括25分位处的数据和75分位处的数据;所述根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,包括:
采用第一公式计算所述位置间距参数,所述第一公式包括:
式中,M为所述位置间距参数,为所述25分位处的数据,为所述75分位处的数据。
3.根据权利要求1所述的方法,其特征在于,所述多个预设位置处的数据包括25分位处的数据、中分位处的数据和75分位处的数据;所述根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,包括:
采用第二公式计算所述位置间距参数,所述第二公式包括:
式中,M为所述位置间距参数,为所述25分位处的数据,为所述中分位处的数据,为所述75分位处的数据。
4.根据权利要求1所述的方法,其特征在于,所述根据所述数据置信区间,检测所述数据序列中的异常数据,包括:
判断所述数据序列中是否存在落在所述数据置信区间之外的数据,若存在,则将落在所述数据置信区间之外的数据作为异常数据。
5.一种异常数据检测装置,其特征在于,包括:
第一获取模块,用于获取预设指标在预设时间段内的数据,并将所述预设指标在预设时间段内的数据按照预设顺序进行排序,得到对应的数据序列,其中,所述预设指标包括:日活跃用户数量、月活跃用户数量、接口的成功率或响应时间;
第二获取模块,用于获取所述数据序列中的多个预设位置处的数据;
参数确定模块,用于确定所述数据序列的预设统计参数;
区间确定模块,用于根据所述多个预设位置处的数据和所述预设统计参数,确定数据置信区间,包括:根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数;根据所述多个预设位置处的数据,确定所述数据置信区间的位置间距参数,所述位置间距参数用于表征所述多个预设位置处的数据之间的差值的参数;根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间;其中,所述预设统计参数包括标准差和均值;所述根据所述预设统计参数,确定所述数据置信区间的区间宽度调节参数,包括:计算所述数据序列的标准差和均值;设置参数N,将所述参数N从0开始逐步增加,当N增加到所述数据序列中预设数量的数据均落在预设区间内时,所述参数N停止增加,并将所述参数N的当前值作为所述区间宽度调节参数;所述根据所述区间宽度调节参数和所述位置间距参数,确定所述数据置信区间,包括:采用第三公式计算所述数据置信区间,所述第三公式包括:
式中,P为所述数据置信区间,M为所述位置间距参数,N为所述区间宽度调节参数,为所述数据序列中25分位处的数据,为所述数据序列中75分位处的数据;
异常检测模块,用于根据所述数据置信区间,检测所述数据序列中的异常数据,其中,所述异常数据用于当发现所述预设指标发生异常波动时,及时进行推送通知,分析所述预设指标发生异常波动的原因,减少设备发生故障。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110382515.2A CN113110971B (zh) | 2021-04-09 | 2021-04-09 | 异常数据检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110382515.2A CN113110971B (zh) | 2021-04-09 | 2021-04-09 | 异常数据检测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113110971A CN113110971A (zh) | 2021-07-13 |
CN113110971B true CN113110971B (zh) | 2024-07-16 |
Family
ID=76714969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110382515.2A Active CN113110971B (zh) | 2021-04-09 | 2021-04-09 | 异常数据检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113110971B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109032829A (zh) * | 2018-07-23 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 数据异常检测方法、装置、计算机设备及存储介质 |
CN109784042A (zh) * | 2018-12-29 | 2019-05-21 | 北京奇安信科技有限公司 | 时间序列中异常点的检测方法、装置、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111414999B (zh) * | 2020-04-27 | 2023-08-22 | 新奥新智科技有限公司 | 一种设备运行状态的监测方法及装置 |
CN112163686B (zh) * | 2020-10-23 | 2021-07-09 | 江西师范大学 | 一种g/g/1排队系统的等待响应时间置信区间预测方法和装置 |
-
2021
- 2021-04-09 CN CN202110382515.2A patent/CN113110971B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109032829A (zh) * | 2018-07-23 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 数据异常检测方法、装置、计算机设备及存储介质 |
CN109784042A (zh) * | 2018-12-29 | 2019-05-21 | 北京奇安信科技有限公司 | 时间序列中异常点的检测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113110971A (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113407371B (zh) | 数据异常监测方法、装置、计算机设备和存储介质 | |
CN110826767B (zh) | 一种基于排放源监测数据的空气污染追溯方法和装置 | |
CN113176986B (zh) | 车联网数据质量确定方法、装置、计算机设备和存储介质 | |
CN114138634B (zh) | 测试用例的选取方法、装置、计算机设备和存储介质 | |
CN113821933A (zh) | App流量预测方法、装置、计算机设备及存储介质 | |
CN113110971B (zh) | 异常数据检测方法、装置、计算机设备和存储介质 | |
CN110995506B (zh) | 告警量异常的定位方法、装置、存储介质和计算机设备 | |
CN110458713B (zh) | 模型监控方法、装置、计算机设备及存储介质 | |
CN115293549B (zh) | 基于数字政务系统的智能化监督评价方法和系统 | |
CN114860496A (zh) | 一种集群故障时长预测方法、装置、设备及存储介质 | |
CN111141981B (zh) | 线损点检方法、装置、计算机设备和存储介质 | |
CN110795255B (zh) | 数据批量值调整方法、装置、可读存储介质和设备 | |
CN113434823A (zh) | 数据采集任务异常预警方法、装置、计算机设备和介质 | |
Jagan et al. | Assessing interlaboratory comparison data adjustment procedures | |
CN112882896A (zh) | 数据监控方法、装置和电子设备 | |
CN117540258B (zh) | 一种注塑生产监测方法、装置及系统 | |
CN114897541B (zh) | 车辆售后故障率预测方法、装置、设备及可读存储介质 | |
CN116136987B (zh) | 一种基于pscada数据的供电设备可靠性在线评估方法及其系统 | |
CN112948210A (zh) | 一种检测qps指标异常的方法、装置及计算机设备 | |
EP3113088A1 (en) | Energy intensity variability analysis | |
CN114401494B (zh) | 短消息下发异常检测方法、装置、计算机设备及存储介质 | |
CN117408364B (zh) | 一种基于模型融合的农作物病虫害指标预测方法及装置 | |
CN112465328B (zh) | 一种基于工作时长评估智能终端质量的方法 | |
CN118227425B (zh) | 一种新增app获取方法、装置、电子设备及存储介质 | |
CN115829543A (zh) | 基于故障需检区间的电力设备预防性试验有效性确定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |