CN107888435B - 一种报警监控的阈值设置方法和装置 - Google Patents

一种报警监控的阈值设置方法和装置 Download PDF

Info

Publication number
CN107888435B
CN107888435B CN201610863621.1A CN201610863621A CN107888435B CN 107888435 B CN107888435 B CN 107888435B CN 201610863621 A CN201610863621 A CN 201610863621A CN 107888435 B CN107888435 B CN 107888435B
Authority
CN
China
Prior art keywords
index
service
basic
calculating
time periods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610863621.1A
Other languages
English (en)
Other versions
CN107888435A (zh
Inventor
闵桂龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610863621.1A priority Critical patent/CN107888435B/zh
Publication of CN107888435A publication Critical patent/CN107888435A/zh
Application granted granted Critical
Publication of CN107888435B publication Critical patent/CN107888435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种报警监控的阈值设置方法和装置,以提高监控系统中各监控指标阈值设置的准确性和实时性。该方法为,获取各业务指标和各基础指标在p个时间点对应的指标值;基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,这样,能够实现业务指标的报警阈值的自动设置,提高阈值设置的准确性和实时性。

Description

一种报警监控的阈值设置方法和装置
技术领域
本发明涉及监控技术领域,尤其涉及一种报警监控的阈值设置方法和装置。
背景技术
监控系统的报警监控项都需要人工配置,而且是基于静态阀值设置的,常规情况下都需要业务精通的专家根据经验来设置和调整报警阀值,且相同系统在不同业务场景下的差异性将导致准确配置报警阀值难度大大增加。
目前监控系统的报警功能主要通过对各项监控指标建立报警阀值,超出阀值则发生报警,这就对监控指标的阀值的设定提出了很高的要求,监控指标的阀值的设定目前主要依赖于专家经验,这就造成了监控指标的阀值的设定带有决策者偏好程度,缺乏科学的依据,出现了很多棘手的问题:一方面不同系统在不同业务的应用场景下,有些监控指标的阀值的设定就明显跟不上变化,导致阀值设置不准确,从而出现误报、漏报、报警不及时的情形;另一方面监控指标的阀值设置过于苛刻,造成用户认为脱离实际情况,监控系统成为摆设且不可信。
鉴于上述问题,本发明设计一种报警监控的阈值设置方案,提高监控系统中各监控指标阈值设置的准确性和实时性。
发明内容
本发明实施例提供一种报警监控的阈值设置方法和装置,以提高监控系统中各监控指标阈值设置的准确性和实时性。
第一方面,本发明实施例提供一种报警监控的阈值设置方法,包括获取各业务指标和各基础指标在p个时间点对应的指标值;基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,p和n为大于1的正整数。
这样,当复杂监控系统下需要监控的业务指标较多时,能够根据业务指标和基础指标的动态变化,自动设置各业务指标的报警阈值,而且能够根据各业务指标的基础指标的动态变化动态调整各业务指标的报警阈值和报警区间,提高了报警阈值的设置效率和准确率。
一种可能的设计中,所述方法还包括:在监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
一种可能的设计中,所述基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在 n个时间段内的权重平均值,可以通过以下过程实现:
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值;针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值;基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
这种设计中,基于多维数据求取业务指标的权重值 和权重平均值,使权重平均值更加符合实际监控系统的运行情况,进一步实现监控系统的智能监控。
一种可能的设计中,所述基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,可以通过以下过程实现:
基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值;计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标。
这种设计中,基于多个时间段内各基础指标和各业务指标的数值分布,计算业务指标在不同时间段内的预测值,由于考虑了多个时间段内的各基础指标和各业务指标的数值分布,使业务指标的预测值更加准确并贴近实际,进一步提高了业务指标的报警阈值的设置准确性。
一种可能的设计中,所述基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值,可以通过以下过程实现:
针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值乘积之和。得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
一种可能的设计中,所述计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式:
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ];
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞);
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
第二方面,本发明实施例提供一种报警监控的阈值设置装置,包括获取单元,用于获取各业务指标和各基础指标在p个时间点对应的指标值;第一计算单元,用于基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;第二计算单元,用于基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,p和n为大于1的正整数。
这样,当复杂监控系统下需要监控的业务指标较多时,能够根据业务指标和基础指标的动态变化,自动设置各业务指标的报警阈值,而且能够根据各业务指标的基础指标的动态变化动态调整各业务指标的报警阈值和报警区间,提高了报警阈值的设置效率和准确率。
一种可能的设计中,所述装置还包括监测单元,用于在监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
一种可能的设计中,所述第一计算单元在基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值时,具体用于:
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值;针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值;基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
一种可能的设计中,所述第二计算单元在基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间时,具体用于:
基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值;计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标。
一种可能的设计中,所述第二计算单元在基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在 n个时间段内对应的n个预测值时,具体用于:
针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值乘积之和。得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
一种可能的设计中,所述第二计算单元在计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式:
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ];
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞);
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
第三方面,本发明实施例提供一种设备,该设备包括处理器、存储器和接口单元,其中,所述存储器中存有计算机可读程序,所述处理器通过运行所述存储器中的程序,控制所述接口单元实现第一方面涉及的报警监控的阈值设置方法。
第四方面,本发明实施例提供一种计算机存储介质,用于储存为上述第一方面、所述的控制器所用的计算机软件指令,其包含用于执行上述由控制器实现的方法所设计的程序。
结合以上各个方面,相比现有技术中,需要依据专家经验来人工设置监控系统中各监控指标的报警阈值,本发明提供阈值设置方案,能够根据监控指标中各业务指标和基本指标的动态变化值,从而自动设置监控指标的报警阈值和报警区间,释放数据中心运维人员压力。
附图说明
图1为本发明实施例中的告警监控系统架构图;
图2为本发明实施例中的报警监控的阈值设置方法流程图;
图3A和图3B为本发明实施例中的报警监控的阈值设置装置结构图;
图4为本发明实施例中的报警监控的阈值设置设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。
目前,在配置监控系统的报警阈值时,需要对业务精通的业务专家来手动设置各监控指标的报警阈值,由于缺乏科学的依据,导致阀值设置不准确,从而出现误报、漏报、报警不及时的问题。因此,本发明实施例提供一种报警监控的阈值设置方法和装置,以提高监控系统中各监控指标阈值设置的准确性和实时性,实现各监控指标动态自适应的阀值设置。其中,方法和装置是基于同一发明构思的,由于方法及装置解决问题的原理相似,因此装置与方法的实施可以相互参见,重复之处不再赘述。
图1所示为本发明实施例提供的告警监控系统架构图,包括:监控系统和告警分析系统,其中,监控系统包括基础指标采集模块和业务指标采集模块,监控系统通过业务指标采集模块采集各业务指标的指标值,通过基础指标采集模块采集各基础指标的指标值,将采集的各业务指标的指标值和各业务指标的指标值输出至告警分析系统;告警分析系统包括权重计算模块和阈值计算模块,权重计算模块负责基于各业务指标在p个时间点对应的指标值和各基础指标在 p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;阈值计算模块负责基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,并将各业务指标的阈值正常区间和阈值报警区间输出至监控系统,监控系统监控各业务指标的指标值是否处于对应的阈值报警区间,若是,则发出告警信号,p和n为大于1的正整数。
图1中的监控系统和告警分析系统可以集成在一个设备中,也可以分布在两个不同的设备。
需要说明的是,本发明实施例中的监控指标包括业务指标和基础指标,基础指标指的是与监控系统中的硬件与资源相关的监控指标,与业务不相关;业务指标,指的是监控系统中与应用层面的业务相关的监控指标。例如,在计算机的性能监控系统中,业务指标包括中央处理器(Central Processing Unit,CPU) 负载x1、内存使用率x2、网卡流量x3、硬盘读写速率x4,基础指标包括页面的每秒查询率(Query Per Second,QPS)y1,页面浏览量(page view,PV)y2 和连接数(session)y3。
基于图1所示的系统架构图,参阅图2所示,本发明实施例提供一种报警监控的阈值设置方法,具体流程如下所示:
步骤20:监控系统采集各业务指标和各基础指标在p个时间点对应的指标值,并输出至告警分析系统。
步骤21:告警分析系统基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n 个时间段内的权重平均值。
具体的,所述监控系统基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n 个时间段内的权重平均值的过程如下所示:
S211:所述监控系统基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值。
S212:所述监控系统针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值。
S213:所述监控系统基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
步骤22:告警分析系统基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间。
进一步的,所述告警分析系统将计算得到的各业务指标的阈值正常区间和阈值报警区间反馈至监控系统,所述监控系统监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
具体的,所述监控系统基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,具体过程如下所示:
S221:所述监控系统基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的 n个预测值。
具体的,针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值乘积之和。得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
S222:所述监控系统计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标。
其中,所述监控系统计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式:
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ]
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞),
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
例如,图1给出的架构图中,业务指标包括指标V1,指标V2,指标V13,指标V4,基础指标包括指标b1,指标b2,指标b3,指标b4,具体的,计算业务指标V1的阈值正常区间和阈值报警区间的方法如下所示:
这里p个时间点分别是t0,t1,t2,…,tx1,t(x1+1),…,tx2,t(x2+1),…, tx3,t(x3+1),....txn,取p=xn+1,n,p,xn均为大于1的正整数;n个时间段分别为第一时间段t0到tx1,记为(t0,tx1);第二时间段tx1到tx2,记为(tx1, tx2);第三时间段tx2到tx3,记为(tx2,tx3),.......,第n时间段tx(n-1)到txn,记为(tx(n-1),txn)。
一、以第一时间段(t0,tx1)为例进行说明,计算业务指标V1在第一时间段内的预测值。
1)监控系统计算各基础指标和第一业务指标在第一时间段内相邻时间点的变化值,指标b1在第一时间段内相邻时间点对应的变化值分别记为b1’(t1-t0), b1’(t2-t1),b1’(t3-t2),…,b1’(tx1-t(x1-1)),指标V1在相邻时间点对应的变化值分别记为V1’(t1-t0),V1’(t2-t1),V1’(t3-t2),…,V1’(tx1-t(x1-1))。
2)针对业务指标V1,在第一时间段计算相邻时间点各基础指标的变化值与业务指标V1的变化值的比值作为各基础指标针对业务指标V1的权重值,进一步得到第一时间段内各基础指标针对第一业务指标的权重平均值。
以基础指标b1为例,在第一时间段内基础指标b1针对业务指标V1的权重分别为:
在(t1-t0)的相邻时间点,w1(t1)=b1`(t1-t0)/V1`(t1-t0)
在(t2-t1)的相邻时间点,w1(t2)=b1`(t2-t1)/V1`(t2-t1)
……
在(tx1-t(x1-1))的相邻时间点,w1(tx1)=b1`(tx1-t(x1-1))/V1`(tx1-t(x1-1))
这样,基础指标b1针对业务指标V1在第一时间段内的权重平均值为:
w1(t0,tx1)=(w1(t1),w1(t2)&.w1(tx1))/x1
同理,基础指标b2、b3、b4针对业务指标V1在第一时间段内的权重平均值同样按照上述方法得到,分别记为w2(t0,tx1),w3(t0,tx1),w4(t0,tx1)。
二、同理,与上述步骤1)和步骤2)类似,计算基础指标b1、b2、b3、 b4针对业务指标V1在n个时间段内的权重平均值,具体格式如下所示:
在第二时间段w1(tx1,tx2),w2(tx1,tx2),w3(tx1,tx2),w4(tx1,tx2)
在第三时间段w1(tx2,tx3),w2(tx2,tx3),w3(tx2,tx3),w4(tx2,tx3)
.......
在第n时间段w1(tx(n-1),txn),w2(tx(n-1),txn),w3(tx(n-1),txn),w4(tx(n-1),txn)
三、基于各基础指标的指标值和各基础指标针对业务指标V1在n个时间段内的权重平均值,计算业务指标V1在n个时间段内对应的n个预测值。
具体的,计算在业务指标V1第一时间段内对应的预测值为a1。
a1=V1(t0,tx1)=b1*w1(t0,tx1)+b2*w2(t0,tx1)+b3*w3(t0,tx1)+b4*w4(t0,tx1),其中b1 为基础指标b1在(t0,tx1)时间段的某个时间点的取值。
同理,业务指标V1第二时间段内对应的预测值为a2。
a2=V1(tx1,tx2)=b1*w1(tx1,tx2)+b2*w2(tx1,tx2)+b3*w3(tx1,tx2)+b4*w4(tx1,tx2)
同理,业务指标V1第n时间段内对应的预测值为an。
an=V1(t(xn-1),txn)=b1*w1(t(xn-1),txn)+b2*w2(t(xn-1),txn)+b3*w3(t(xn-1),txn)+b4*w4t(xn-1),txn)
因此,得到业务指标n个时间段内对应的预测值分别是a1,a2,……,an。
四、计算上述n个预测值的平均值和方差,得到业务指标V1的阈值正常区间和阈值报警区间。
业务指标V1阈值正常区间为[μ-2σ,μ+2σ]
业务指标V1的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞)
其中,μ=(a1+a2+...+an)/n,
Figure GDA0002387716620000111
基于上述方法实施例,参阅图3A所示,本发明实施例提供一种报警监控的阈值设置装置300,如图3A所示,该装置300包括获取单元301、第一计算单元302和第二计算单元303,其中:
获取单元301,用于获取各业务指标和各基础指标在p个时间点对应的指标值;
第一计算单元302,用于基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在 n个时间段内的权重平均值;
第二计算单元303,用于基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,p和n为大于1的正整数。
可选的,如图3B所示,所述装置300还包括:
监测单元304,用于在监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
可选的,所述第一计算单元302在基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值时,具体用于:
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值;
针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值;
基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
可选的,所述第二计算单元303在基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间时,具体用于:
基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值;
计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标。
可选的,所述第二计算单元303在基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值时,具体用于:
针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值乘积之和。得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
可选的,所述第二计算单元303在计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式“
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ],
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞),
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
本发明实施例中的装置300的各个单元的功能实现以及交互方式可以进一步参照相关方法实施例的描述,在此不再赘述。
应理解以上装置300中的各个单元的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。例如,以上各个单元可以为单独设立的处理元件,也可以集成在控制器的某一个芯片中实现,此外,也可以以程序代码的形式存储于控制器的存储元件中,由控制器的某一个处理元件调用并执行以上各个单元的功能。此外各个单元可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个单元可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。该处理元件可以是通用处理器,例如中央处理器(英文:central processing unit,简称:CPU),还可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(英文:application-specific integrated circuit,简称:ASIC),或,一个或多个微处理器(英文:digital signal processor,简称:DSP),或,一个或者多个现场可编程门阵列(英文:field-programmable gate array,简称:FPGA) 等。
基于同一发明构思,本发明实施例还提供一种报警监控的阈值设置设备 400,如图4所示,该设备400包括处理器401、存储器402和接口单元403,执行本发明方案的程序代码保存在存储器402中,用于指令处理器401与所述接口单元403配合执行图2所示的报警监控的阈值设置方法。
本发明还可以通过对处理器进行设计编程,将图2所示的方法所对应的代码固化到芯片内,从而使芯片在运行时能够执行图2所示的方法。
可以理解的是,本发明实施例上述设备400中涉及的处理器可以是一个 CPU,DSP,ASIC,或一个或多个用于控制本发明方案程序执行的集成电路。计算机系统中包括的一个或多个存储器,可以是只读存储器(英文:read-only memory,简称ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(英文:random access memory,简称:RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是磁盘存储器。这些存储器通过总线与处理器相连接;上述接收器和发射器可以通过收发器实现其功能,所述收发器可以是能够实现收发功能的实体模块,以便与其他设备通信。上述存储器可以是RAM,保存有执行本发明方案的程序。
这些存储器、接口单元可以通过总线与处理器相连接,或者也可以通过专门的连接线分别与处理器连接。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-RON、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种报警监控的阈值设置方法,其特征在于,包括:
获取各业务指标和各基础指标在p个时间点对应的指标值;
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;
基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,p和n为大于1的正整数;
所述基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,包括:
基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值;
计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标;
所述基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值,包括:
针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值的乘积,并计算各乘积之和,得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
在监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
3.如权利要求2所述的方法,其特征在于,所述基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值,包括:
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值;
针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值;
基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
4.如权利要求1所述的方法,其特征在于,所述计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式:
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ];
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞);
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
5.一种报警监控的阈值设置装置,其特征在于,包括:
获取单元,用于获取各业务指标和各基础指标在p个时间点对应的指标值;
第一计算单元,用于基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值;
第二计算单元,用于基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间,p和n为大于1的正整数;
所述第二计算单元在基于各基础指标的指标值和各基础指标针对每一个业务指标在n个时间段内的权重平均值,计算各业务指标的阈值正常区间和阈值报警区间时,具体用于:
基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值;
计算所述n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间,所述第一业务指标为各业务指标中的任意一个业务指标;
所述第二计算单元在基于各基础指标的指标值和各基础指标针对第一业务指标在n个时间段内的权重平均值,计算第一业务指标在n个时间段内对应的n个预测值时,具体用于:
针对n个时间段内的第一时间段,计算各基础指标的指标值与各基础指标针对第一业务指标在第一时间段内的权重平均值的乘积,并计算各乘积之和,得到第一业务指标在第一时间段内对应的预测值,第一时间段为n个时间段中的任意一个时间段。
6.如权利要求5所述的装置,其特征在于,所述装置还包括:
监测单元,用于在监测到第一业务指标的指标值处于第一业务指标的阈值报警区间时,输出告警信号,所述第一业务指标为各业务指标中的任意一个业务指标。
7.如权利要求6所述的装置,其特征在于,所述第一计算单元在基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标针对每一个业务指标在n个时间段内的权重平均值时,具体用于:
基于各业务指标在p个时间点对应的指标值和各基础指标在p个时间点对应的指标值,计算各基础指标和各业务指标在相邻时间点的变化值;
针对第一业务指标,在n个时间段中的每一个时间段计算相邻时间点各基础指标的变化值与第一业务指标的变化值的比值作为各基础指标针对第一业务指标的权重值;
基于n个时间段内相邻时间点各基础指标针对第一业务指标的权重值计算平均值,得到各基础指标针对第一业务指标在n个时间段内的权重平均值,所述第一业务指标为各业务指标中的任意一个业务指标。
8.如权利要求5所述的装置,其特征在于,所述第二计算单元在计算第一业务指标在n个时间段内对应的n个预测值的平均值和方差,得到第一业务指标的阈值正常区间和阈值报警区间时,符合下述公式:
第一业务指标的阈值正常区间为[μ-2σ,μ+2σ];
第一业务指标的阈值报警区间为(-∞,μ-2σ)和(μ+2σ,+∞);
其中,μ表示第一业务指标在n个时间段内对应的n个预测值的平均值,σ表示第一业务指标在n个时间段内对应的n个预测值的方差。
CN201610863621.1A 2016-09-29 2016-09-29 一种报警监控的阈值设置方法和装置 Active CN107888435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610863621.1A CN107888435B (zh) 2016-09-29 2016-09-29 一种报警监控的阈值设置方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610863621.1A CN107888435B (zh) 2016-09-29 2016-09-29 一种报警监控的阈值设置方法和装置

Publications (2)

Publication Number Publication Date
CN107888435A CN107888435A (zh) 2018-04-06
CN107888435B true CN107888435B (zh) 2020-11-17

Family

ID=61769684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610863621.1A Active CN107888435B (zh) 2016-09-29 2016-09-29 一种报警监控的阈值设置方法和装置

Country Status (1)

Country Link
CN (1) CN107888435B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108984370B (zh) * 2018-07-13 2022-02-01 北京京东尚科信息技术有限公司 一种确定监控阈值的方法和装置
CN109298989A (zh) * 2018-09-14 2019-02-01 北京市天元网络技术股份有限公司 业务指标阈值获取方法及装置
CN110362454A (zh) * 2019-06-29 2019-10-22 北京淇瑀信息科技有限公司 一种支持可配置的决策引擎的报警方法、装置和电子设备
CN112711514A (zh) * 2020-12-30 2021-04-27 北京珞安科技有限责任公司 一种终端设备的监控系统、方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984415A (zh) * 2010-11-02 2011-03-09 中兴通讯股份有限公司 一种设定监控指标阈值的方法和装置
CN103067884A (zh) * 2011-10-21 2013-04-24 阿里巴巴集团控股有限公司 一种报警消息的处理方法以及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9537962B2 (en) * 2012-11-15 2017-01-03 Tencent Technology (Shenzhen) Company Limited Method, device and system for processing client environment data
CN104901823B (zh) * 2014-03-04 2018-09-25 中国移动通信集团北京有限公司 一种告警阈值生成方法、业务性能指标监控方法及装置
CN105357691B (zh) * 2015-09-28 2019-04-16 普天信息工程设计服务有限公司 Lte无线网络用户感知监测方法和系统
CN105279386B (zh) * 2015-11-16 2019-08-16 拉扎斯网络科技(上海)有限公司 一种指标异常数据确定的方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101984415A (zh) * 2010-11-02 2011-03-09 中兴通讯股份有限公司 一种设定监控指标阈值的方法和装置
CN103067884A (zh) * 2011-10-21 2013-04-24 阿里巴巴集团控股有限公司 一种报警消息的处理方法以及装置

Also Published As

Publication number Publication date
CN107888435A (zh) 2018-04-06

Similar Documents

Publication Publication Date Title
CN107888435B (zh) 一种报警监控的阈值设置方法和装置
CN102111337B (zh) 任务调度方法和系统
US20170255496A1 (en) Method for scheduling data flow task and apparatus
CN108173698B (zh) 网络服务管理方法、装置、服务器及存储介质
CN110351375B (zh) 一种数据处理方法、装置及计算机装置、可读存储介质
WO2007071883A3 (fr) Procede et systeme de traitement de donnes numeriques
EP3129880A1 (en) Method and device for augmenting and releasing capacity of computing resources in real-time stream computing system
CN110187980B (zh) 消息队列监控方法、装置、电子设备及可读存储介质
CN109710376A (zh) 容器集群管理系统的动态调度方法和装置
CN108540568B (zh) 计算能力共享方法及智能设备
US10691496B2 (en) Dynamic micro-services related job assignment
CN106027328A (zh) 一种基于应用容器部署的集群监控的方法及系统
CN111274026A (zh) 负载均衡方法、装置及电子设备
CN104580721A (zh) 一种终端闹钟实现方法
CN105279023A (zh) 一种虚拟机迁移方法和装置
CN106503841B (zh) 指标阈值的确定方法和装置
CN115328974B (zh) 一种数据实时性检测方法、装置、设备及可读存储介质
CN108664321B (zh) 系统资源分配调整方法及装置
CN107360547B (zh) 一种室内定位中静止状态下防止定位抖动的聚类处理方法
CN109218961B (zh) 一种基于虚拟节点的多站协同干扰定位方法及系统
CN109992470B (zh) 一种阈值调整方法和装置
CN114500543A (zh) 一种基于分布式的弹性边缘采集系统及其应用方法
CN106161058B (zh) 一种告警分级方法及装置
CN109308219B (zh) 任务处理方法、装置及分布式计算机系统
CN107970613B (zh) 人物位置通知方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200417

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Applicant after: HUAWEI TECHNOLOGIES Co.,Ltd.

Address before: 301, A building, room 3, building 301, foreshore Road, No. 310052, Binjiang District, Zhejiang, Hangzhou

Applicant before: Huawei Technologies Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220118

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: Super fusion Digital Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.