CN106201829B - 监控阈值确定方法及装置、监控报警方法、装置及系统 - Google Patents

监控阈值确定方法及装置、监控报警方法、装置及系统 Download PDF

Info

Publication number
CN106201829B
CN106201829B CN201610563030.2A CN201610563030A CN106201829B CN 106201829 B CN106201829 B CN 106201829B CN 201610563030 A CN201610563030 A CN 201610563030A CN 106201829 B CN106201829 B CN 106201829B
Authority
CN
China
Prior art keywords
value
confidence
performance parameter
confidence interval
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610563030.2A
Other languages
English (en)
Other versions
CN106201829A (zh
Inventor
郝建明
张炼
马平清
王巍
韩智东
廉宜果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201610563030.2A priority Critical patent/CN106201829B/zh
Publication of CN106201829A publication Critical patent/CN106201829A/zh
Application granted granted Critical
Publication of CN106201829B publication Critical patent/CN106201829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明提出一种监控阈值确定方法及装置、监控报警方法、装置及系统,其中,监控报警方法包括:获取按如下方式确定的最优置信区间:获取主机服务器的历史报警数据和预设时间内的性能参数变量值;根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1‑α的多个置信区间;根据历史报警数据对多个置信区间进行校验,确定最优置信区间;将实时获取的主机服务器的性能参数变量值与最优置信区间进行比较,当性能参数变量在最优置信区间范围外时,产生报警信号。本发明具有科学性高,可以体现性能参数值动态变化的特性,降低漏报率等优点。

Description

监控阈值确定方法及装置、监控报警方法、装置及系统
技术领域
本发明涉及设备监控管理技术领域,特别涉及一种监控阈值确定方法及装置、监控报警方法、装置及系统。
背景技术
传统的IT运营监控管理是通过设备上报故障告警实现的。比如,在对主机服务器进行监控管理时,一般是检测某时间点上的主机服务器的性能指标实际值,并将性能指标实际值与运营人员设定的报警监控阈值进行比较,当性能指标实际值大于或小于阈值时,说明该时间点为异常点,该异常点预示着主机故障或服务失败,通过检测这些异常点,能尽快发现、界定主机服务器硬件故障或配置错误等软故障,并快速修复,从而避免严重故障发生或缩短故障持续时间。这种方法虽然实现简单,但由于报警监控阈值是由运营人员根据经验设置的静态值,无法体现性能参数值动态变化的特性;如果报警监控阈值设置过大或者过小,将会导致漏报,使得该方法的漏报率偏高。
发明内容
本发明实施例提供了一种监控阈值确定方法,其科学性更高,可以体现性能参数值动态变化的特性,以便于在使用这个阈值报警时降低漏报率。该方法包括:
获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
在一个实施例中,所述根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间,包括:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
在一个实施例中,所述采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间,具体包括:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2
根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
在一个实施例中,所述根据样本方差S2和预设的多个显著性水平α值,按照如下方式确定置信度为1-α的多个置信区间:
其中,Xi表示为服从总体N(u,σ2)的样本;
n表示样本个数;
u表示总体均值;
σ2表示总体方差;
S2表示样本方差;
t表示统计量,
本发明实施例还提供了一种监控阈值确定装置,其科学性更高,可以体现性能参数值动态变化的特性,以便于在使用这个阈值报警时降低漏报率。该装置包括:
数据获取模块,用于获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
置信区间确定模块,用于根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
最优置信区间确定模块,用于根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
在一个实施例中,所述置信区间确定模块具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
在一个实施例中,所述置信区间确定模块具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2
根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
在一个实施例中,所述置信区间确定模块具体用于:
按照如下方法确定置信度为1-α的多个置信区间:
其中,Xi表示为服从总体N(u,σ2)的样本;
n表示样本个数;
u表示总体均值;
σ2表示总体方差;
S2表示样本方差;
t表示统计量,
本发明还提供了一种监控阈值报警方法,该方法使用上述方法获得的监控阈值进行报警,可以降低漏报率。该方法包括:
获取最优置信区间,所述最优置信区间由上述监控阈值确定方法确定;
获取实时的主机服务器的性能参数变量值;
将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
本发明还提供了一种监控阈值报警装置,该方法使用上述方法获得的监控阈值进行报警,可以降低漏报率。该装置包括:
最优置信区间获取模块,用于从监控阈值确定装置中获取最优置信区间;
变量值获取模块,用于获取实时的主机服务器的性能参数变量值;
报警模块,用于将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
本发明还提供了一种监控报警系统,包括:
上述所述的监控阈值确定装置;
上述所述的监控报警装置。
在本发明实施例中,本发明中的监控阈值是通过以下方式获得的:通过获取的主机服务器的预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间,然后再根据主机服务器的历史报警数据对多个置信区间进行校验,确定最优置信区间,作为监控阈值;与传统的监控阈值相比,其科学性更高,可以体现性能参数值动态变化的特性,以便于在使用这个阈值报警时降低漏报率。
本发明的报警方法和装置使用上述方法确定的最优置信区间(监控阈值),当主机服务器的性能参数变量值在最优置信区间范围外时,产生报警信号,这样可以降低误报率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种监控阈值确定方法流程图;
图2是本发明实施例提供的一种监控阈值确定装置结构图;
图3是本发明实施例提供的一种监控报警方法流程图;
图4是本发明实施例提供的一种监控报警装置结构图;
图5是本发明实施例提供的主机Host1的变量DSKPercentBus时序图;
图6是本发明实施例提供的主机Host1的变量DSKPercentBus动态监控阈值示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的IT运营监控管理是通过设备上报故障告警实现的,而报警监控阈值由运营人员根据经验设置的静态值,该方法虽然实现简单,但是其科学性较差,无法体现性能参数值动态变化的特性。如果报警监控阈值设置过大或者过小,将会导致漏报,使得该方法的漏报率偏高,另外,面对海量日志信息,传统的IT监控方法显得力不从心。针对上述问题,本发明提出一种监控阈值确定方法及装置,与传统的监控阈值相比,其科学性更高,可以体现性能参数值动态变化的特性,以便于在使用这个阈值报警时降低漏报率。
图1是本发明实施例提供的一种监控阈值确定方法流程图,如图1所示,该方法包括:
步骤101:获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
步骤102:根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
步骤103:根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
具体实施时,本发明中提出的快速生成动态监控阈值的方法,采用了大数据“样本即全体”的思想,利用中心极限定理快速生成随机变量在总体样本空间、不同时间段、不同置信度下的动态置信区间,以此作动态监控阈值。
下面介绍一下中心极限定理。
根据不同的假设条件,有众多中心极限定理,常用的中心极限定理有两个:Levy-Lindeberg定理和De Moiver-Laplace定理。它们的内容可以简述如下:
1、Levy-Lindeberg定理:
又称同分布中心极限定理,它的内容是:若X1,X2,…,Xn是相互独立且服从相同分布的随机变量,当n→∞时,
2、De Moiver-Laplace定理:
它是Levy-Lindeberg定理的特殊情况,它的内容是:若随机变量X服从二项分布B(n,p),其中n代表试验的次数,p代表每次试验的概率,当n→∞时,X~N(np,npq),其中np代表二项分布的期望,npq代表二项分布的方差,即
由于服从二项分布的随机变量X表示n重贝努里试验中(每次试验中事件A发生的概率是p)事件A出现的总次数,若令则诸Xi相互独立,且均服从参数为p的0—1分布(i=1,2,…,n),则X可以表示成这一系列相互独立的随机变量之和,X=X1+X2+...+Xn,所以由Levy-Lindeberg中心极限定理,当n→∞时,X以正态分布N(np,npq)为极限。
我们根据中心极限定理获取如下的启示:
1、σ2已知时,总体均值u的区间估计:
设X1,X2,…,Xn为服从总体N(u,σ2)的样本。已知是u的无偏估计,且统计量因此,对于给定的显著性水平α,可从确定u的双侧α临界值使得成立,即
于是总体均值u的置信度为1-α的置信区间为:
对一般总体,若已知总体方差在大样本情况下仍可用公式对总体均值u做区间估计。依据中心极限定理可知,不是正态分布的一般分布,当n充分大时,n个相互独立的随机变量的和是一个服从正态分布的随机变量。而由这些独立的随机变量组成的样本,其样本的平均值也是一个服从正态分布的随机变量。
2、σ2未知时,总体均值u的区间估计:
对于大样本而言,总体方差未知,可用样本方差S2来代替,由中心极限定理知,近似服从标准正态分布。因此对于给定的样本值x1,x2,…,xn总体均值u的置信度为1-α的置信区间为:
(2)设X1,X2,…,Xn为服从总体N(u,σ2)的样本,因为σ2未知,所以用上式估计u将无法得到结果,此种情形下可用样本方差S2估计总体方差σ2,由于统计量因此,对于给定的显著性水平α,可据分位数表确定u的双侧α临界值使成立,
于是总体均值u的置信度为1-α的置信区间为:
由上可知,中心极限定理的核心思想是:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着自有作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布。所以要求随机变量之和或其均值落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可。中心极限定理还揭示了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布。另外,在中心极限定理的应用过程中,要求样本足够大,即n的取值足够大。这时,样本空间的和及其均值越接近标准正态分布,其实际效果越佳。
基于上述理论,本发明采用大数据“样本即全体”的思想,对于全体样本,利用Levy-Lindeberg定理和公式(6),给出一种快速生成给定概率条件下的置信区间的方法。该方法具体步骤如图1所示。下面对该方法的每一步骤进行详细说明。
步骤102具体包括:采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2;根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
首先,针对全体样本(即获取的主机服务器的预设时间内的性能参数变量值),利用大数据技术及R语言编程技术,快速计算出样本方差S2;根据实际的预设出全体样本中不同的(多个)显著性水平α,1-α为其概率;针对不同的显著性水平α,用样本方差S2代替总体方差σ2,利用公式(6),计算其置信度为1-α的多个置信区间其中,Xi表示为服从总体N(u,σ2)的样本;n表示样本个数;u表示总体均值;σ2表示总体方差;S2表示样本方差;t表示统计量,将所得到置信区间作为监控阈值,作为触发警报的上下限。最后,由于得到的是多个置信区间,所以需要利用主机服务器的历史报警数据对多个置信区间进行检验,确定其中的最优置信区间,以及相对应的最佳的显著性水平α。
在实际应用时,我们可以将显著性水平α参数化,以便进行动态调整与优化。
基于同一发明构思,本发明实施例中还提供了一种监控阈值确定装置,如下面的实施例所述。由于监控阈值确定装置解决问题的原理与监控阈值确定方法相似,因此监控阈值确定装置的实施可以参见监控阈值确定方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是本发明实施例提供的一种监控阈值确定装置结构图;如图2所示,该装置包括:
数据获取模块201,用于获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
置信区间确定模块202,用于根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
最优置信区间确定模块203,用于根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
具体实施时,置信区间确定模块202具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
具体实施时,置信区间确定模块202具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2
根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
具体实施时,置信区间确定模块202具体用于:
按照如下方法确定置信度为1-α的多个置信区间:
其中,Xi表示为服从总体N(u,σ2)的样本;
n表示样本个数;
u表示总体均值;
σ2表示总体方差;
S2表示样本方差;
t表示统计量,
本发明还提出一种监控阈值报警方法,该方法使用上述方法获得的监控阈值(最优置信区间)进行报警,可以降低漏报率。如图3所示,该方法包括:
步骤301:获取最优置信区间,所述最优置信区间由上述监控阈值确定方法确定;
步骤302:获取实时的主机服务器的性能参数变量值;
步骤303:将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
基于同一发明构思,本发明实施例中还提供了一种监控阈值报警装置,如图4所示。该装置包括:
最优置信区间获取模块401,用于从监控阈值确定装置中获取最优置信区间;
变量值获取模块402,用于获取实时的主机服务器的性能参数变量值;
报警模块403,用于将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
本发明实施例中还提供了一种监控报警系统,包括上述所说的监控阈值确定装置和监控报警装置。两个装置的功能上面已经讲过,重复之处不再赘述。
下面以一具体实例,介绍如何将上述方法应用于IT运营监控中,以降低IT报警监控的漏报率。
以某家金融机构IT运营监控系统为例,应用上述方法,快速生成主机服务器系统层面各变量的动态阈值,并用实际数据进行检验,观察其实际应用效果。
对5台主机,每台主机的15个系统层面的变量进行监控,具体监控的主机服务器及变量信息如表1所示。其中变量信息涉及主机CUP、内存、磁盘、I/O等方面的信息。另外还获取了主机Host1的变量DSKPercentBus时序图,如图5所示。
表1
利用本发明方法,将上述主机及变量180天近10GB的数据(日志数据量),数据记录达2亿多条,进行计算。快速生成不同概率条件下的动态监控阈值,具体结果如图6所示。图6中包括变量DSKPercentBus的实际取值,显著性水平α=0.1时的动态阈值时序图,显著性水平α=0.01时的动态阈值时序图,和显著性水平α=0.001时的动态阈值时序图。当然上述值均可以参数化。
在实际应用中,根据验证结果,调整α=0.001,然后利用其对应的置信度区间作为5台主机的15个变量的动态监控阈值。表2是传统的监控报警数据,表3是将采用本发明获得的监控报警数据与传统的监控报警数据对比,其中,加粗的是传统的监控报警数据。通过与传统的监控报警数据比较,利用本发明的方法,报警准确率为100%,报警覆盖率为100%,报警漏报率为0(传统监控的漏报率为66.7%)。其实际效果要明显优于传统的报警监控系统。
表2
time host_name parameter value
2015-10-30 01:43 Host1 DSKPercentBusy 89.52
2015-10-30 02:19 Host1 DSKPercentBusy 90.89
2015-10-30 02:37 Host1 DSKPercentBusy 90.3
2015-10-30 01:43 Host2 DSKPercentBusy 85.25
2015-10-30 01:43 Host3 DSKPercentBusy 90.6
2015-10-30 01:43 Host4 DSKPercentBusy 86.08
2015-10-30 01:43 Host5 DSKPercentBusy 88.7
表3
综上所述,本发明监控阈值生成方法采用的是大数据“样本即全体”的思想,同时利用了中心极限定理,快速生成各主机系统层面监控指标的分布规律和各指标在在总体样本空间、不同时间段、不同置信度下的置信区间。然后利用不同的置信区间,以参数化的形式给定各指标的动态报警阈值。本发明监控阈值生成方法包括如下优点:
1、高效性。采用大数据分布式计算方法,结合R语言的优点,可对全体样本的S2、显著性水平α及其置信区间进行有效计算与快速生成。
2、灵活性。将全体空间的显著性水平α参数化,便于后期优化与调整,提高了该方法在实际应用中灵活性。
3、动态性。根据全体样本空间的变化,动态生成监控阈值,更好的适应了随机变量的动态变化性。
本发明监控报警方法中采用的是上述方法获得的动态报警阈值,将实际数据与动态报警阈值进行比较,产生报警信息。由于该报警阈值是基于总体样本空间的,而且也是基于不同置信区间动态变化的,因此其漏报率较传统监控方法有明显改善,采用本发明监控报警方法进行报警,有较高的准确率(>98%)和较低的误报率(<1%),更适合于当下IT运营监控的要求。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种监控阈值确定方法,其特征在于,包括:
获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
2.如权利要求1所述的监控阈值确定方法,其特征在于,所述根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间,包括:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
3.如权利要求2所述的监控阈值确定方法,其特征在于,所述采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间,具体包括:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2
根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
4.如权利要求3所述的监控阈值确定方法,其特征在于,所述根据样本方差S2和预设的多个显著性水平α值,按照如下方式确定置信度为1-α的多个置信区间:
其中,Xi表示为服从总体N(u,σ2)的样本;
n表示样本个数;
u表示总体均值;
σ2表示总体方差;
S2表示样本方差;
t表示统计量,
5.一种监控阈值确定装置,其特征在于,包括:
数据获取模块,用于获取主机服务器的历史报警数据和预设时间内的性能参数变量值;
置信区间确定模块,用于根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间;
最优置信区间确定模块,用于根据所述历史报警数据对多个置信区间进行校验,确定最优置信区间;所述最优置信区间为所述历史报警数据与多个置信区间有交集的一个置信区间,以便当主机服务器的性能参数变量值处于最优置信区间外时产生报警信号。
6.如权利要求5所述的监控阈值确定装置,其特征在于,所述置信区间确定模块具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
7.如权利要求6所述的监控阈值确定装置,其特征在于,所述置信区间确定模块具体用于:
采用Levy-Lindeberg定理,根据预设时间内的性能参数变量值,确定样本方差S2
根据样本方差S2和预设的多个显著性水平α值,确定置信度为1-α的多个置信区间。
8.如权利要求7所述的监控阈值确定装置,其特征在于,所述置信区间确定模块具体用于:
按照如下方法确定置信度为1-α的多个置信区间:
其中,Xi表示为服从总体N(u,σ2)的样本;
n表示样本个数;
u表示总体均值;
σ2表示总体方差;
S2表示样本方差;
t表示统计量,
9.一种监控报警方法,其特征在于,包括:
获取最优置信区间,所述最优置信区间由权利要求1至4任一项所述的监控阈值确定方法确定;
获取实时的主机服务器的性能参数变量值;
将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
10.一种监控报警装置,其特征在于,包括:
最优置信区间获取模块,用于根据权利要求1至4任一项所述的监控阈值确定方法获取最优置信区间;
变量值获取模块,用于获取实时的主机服务器的性能参数变量值;
报警模块,用于将所述性能参数变量值与最优置信区间进行比较,当所述性能参数变量在最优置信区间范围外时,产生报警信号。
11.一种监控报警系统,其特征在于,包括:
权利要求5至8任一项所述的监控阈值确定装置;
权利要求10所述的监控报警装置。
CN201610563030.2A 2016-07-18 2016-07-18 监控阈值确定方法及装置、监控报警方法、装置及系统 Active CN106201829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610563030.2A CN106201829B (zh) 2016-07-18 2016-07-18 监控阈值确定方法及装置、监控报警方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610563030.2A CN106201829B (zh) 2016-07-18 2016-07-18 监控阈值确定方法及装置、监控报警方法、装置及系统

Publications (2)

Publication Number Publication Date
CN106201829A CN106201829A (zh) 2016-12-07
CN106201829B true CN106201829B (zh) 2019-01-22

Family

ID=57475965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610563030.2A Active CN106201829B (zh) 2016-07-18 2016-07-18 监控阈值确定方法及装置、监控报警方法、装置及系统

Country Status (1)

Country Link
CN (1) CN106201829B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875309A (zh) * 2017-05-11 2018-11-23 北京蓝标成科技有限公司 一种判断美花石斛纯种相近度的方法的建立、判断标准以及判断方法
CN108875303A (zh) * 2017-05-11 2018-11-23 北京蓝标成科技有限公司 一种判断霍山石斛纯种相近度的方法的建立、判断标准以及判断方法
CN108875304A (zh) * 2017-05-11 2018-11-23 北京蓝标成科技有限公司 一种判断叠鞘石斛纯种相近度的方法的建立、判断标准以及判断方法
CN107395392A (zh) * 2017-06-07 2017-11-24 成都视达科信息技术有限公司 一种告警分析方法和系统
CN109726086A (zh) * 2017-10-30 2019-05-07 北京京东尚科信息技术有限公司 测试服务器性能的方法和装置
CN108957304B (zh) * 2018-04-09 2020-09-22 西安工程大学 断路器载流故障预测方法
CN109211564B (zh) * 2018-10-24 2020-05-01 哈工大机器人(山东)智能装备研究院 一种用于滚珠丝杠副健康评估的自适应阈值检测方法
CN109933500A (zh) * 2019-03-27 2019-06-25 新奥数能科技有限公司 设备故障告警方法、装置、可读介质及电子设备
CN109901022B (zh) * 2019-04-08 2021-12-28 山东理工大学 基于同步量测数据的配电网区域定位方法
CN110572297B (zh) * 2019-08-09 2021-07-06 网宿科技股份有限公司 网络性能的评估方法、服务器及存储介质
CN110472891B (zh) * 2019-08-26 2023-10-17 上海蔚来汽车有限公司 加电服务能力或资源的评估或管理方法、系统和存储介质
CN110765414B (zh) * 2019-09-11 2023-12-29 深信服科技股份有限公司 性能指标数据评估方法、装置、设备及存储介质
CN111459746B (zh) * 2020-02-27 2023-06-27 北京三快在线科技有限公司 告警生成方法、装置、电子设备及可读存储介质
CN113535486A (zh) * 2020-04-14 2021-10-22 北京沃东天骏信息技术有限公司 一种测试机器性能的方法和装置
CN113556241A (zh) * 2020-04-24 2021-10-26 北京淇瑀信息科技有限公司 一种上游流量的监测方法、装置和电子设备
CN113556240A (zh) * 2020-04-24 2021-10-26 北京淇瑀信息科技有限公司 一种上游流量的监测方法、装置和电子设备
CN113760637A (zh) * 2020-09-25 2021-12-07 天翼智慧家庭科技有限公司 用于针对阈值类监控数据确定阈值的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104901823A (zh) * 2014-03-04 2015-09-09 中国移动通信集团北京有限公司 一种告警阈值生成方法、业务性能指标监控方法及装置
CN105512466A (zh) * 2015-11-30 2016-04-20 华北电力大学 基于极值理论的电网工程实施阶段风险预警方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249162B2 (en) * 2003-02-25 2007-07-24 Microsoft Corporation Adaptive junk message filtering system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104901823A (zh) * 2014-03-04 2015-09-09 中国移动通信集团北京有限公司 一种告警阈值生成方法、业务性能指标监控方法及装置
CN105512466A (zh) * 2015-11-30 2016-04-20 华北电力大学 基于极值理论的电网工程实施阶段风险预警方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于时间特征的网络流量异常检测;刘仁山 等;《辽宁工程技术大学学报(自然科学版)》;20130430;第32卷(第4期);第544-548页
基于自适应阈值的网络流量异常检测算法;曹敏 等;《计算机工程》;20091031;第35卷(第19期);第164-166,177页
基于预测和动态阈值的流量异常检测机制研究;尹波 等;《电视技术》;20131231;第37卷(第1期);第105-108页

Also Published As

Publication number Publication date
CN106201829A (zh) 2016-12-07

Similar Documents

Publication Publication Date Title
CN106201829B (zh) 监控阈值确定方法及装置、监控报警方法、装置及系统
CN108011782B (zh) 用于推送告警信息的方法和装置
Ahmed et al. Model-based attack detection scheme for smart water distribution networks
US10061677B2 (en) Fast automated detection of seasonal patterns in time series data without prior knowledge of seasonal periodicity
CN108055281A (zh) 账户异常检测方法、装置、服务器及存储介质
CN107426022A (zh) 安全事件监测方法及装置、电子设备、存储介质
CN104778111A (zh) 一种进行报警的方法和装置
CN110633893B (zh) 一种策略效能监控方法、装置以及计算机设备
CN105656693B (zh) 一种基于回归的信息安全异常检测的方法及系统
US11620539B2 (en) Method and device for monitoring a process of generating metric data for predicting anomalies
CN109241353B (zh) 一种数据审核方法
CN106021063A (zh) 聚合事件消息的方法、应用及系统
CN115328975B (zh) 基于工业日常巡查的巡查数据上传系统及方法
CN110442628A (zh) 一种数据监控方法、系统和计算机设备
CN109238455A (zh) 一种基于图论的旋转机械振动信号监测方法及系统
CN109783260A (zh) 智能it全流程运维方法、装置、设备及可读存储介质
KR101469179B1 (ko) 원자력 발전 시뮬레이터의 통신 진단 시스템
CN111123009A (zh) 一种基于scd文件的智能变电站雪崩测试方法、系统及终端设备
Okeya et al. Locating pipe bursts in a district metered area via online hydraulic modelling
CN110058124A (zh) 线性离散时滞系统的间歇故障检测方法
CN109087490A (zh) 一种基于报警持续时间特征的干扰报警识别方法
KR101957744B1 (ko) 원자력발전소 내의 디지털 계통의 사이버보안 모니터링 시스템 및 그 방법
CN113221096A (zh) 一种在混沌工程中随机事件相关性分析方法及系统
CN109887253B (zh) 石油化工装置报警的关联分析方法
KR102166116B1 (ko) 원자력발전소의 지진사건 확률론적안전성평가를 위한 부분상관성을 갖는 기기들의 고장조합확률들로부터 기기고장사건들의 확률 산출 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant