CN113760637A - 用于针对阈值类监控数据确定阈值的方法和装置 - Google Patents

用于针对阈值类监控数据确定阈值的方法和装置 Download PDF

Info

Publication number
CN113760637A
CN113760637A CN202011022185.8A CN202011022185A CN113760637A CN 113760637 A CN113760637 A CN 113760637A CN 202011022185 A CN202011022185 A CN 202011022185A CN 113760637 A CN113760637 A CN 113760637A
Authority
CN
China
Prior art keywords
interval
threshold
monitoring data
value
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011022185.8A
Other languages
English (en)
Inventor
张继东
曹靖城
吴春平
史国杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Digital Life Technology Co Ltd
Original Assignee
Tianyi Smart Family Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Smart Family Technology Co Ltd filed Critical Tianyi Smart Family Technology Co Ltd
Priority to CN202011022185.8A priority Critical patent/CN113760637A/zh
Publication of CN113760637A publication Critical patent/CN113760637A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3075Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved in order to maintain consistency among the monitored data, e.g. ensuring that the monitored data belong to the same timeframe, to the same system or component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明提供了一种用于针对阈值类监控数据确定阈值的方法,该方法可包括:获得监控数据在特定时间段内的历史数据;将特定时间段内的历史数据划分成多个数值区间;为多个数值区间中的每一者设置置信度;计算每一个数值区间在所设置的置信度下的置信区间;以及将每一个数值区间的所计算出的置信区间用作该数值区间在该特定时间段内的阈值区间。此外,本发明还提供了用于针对阈值类监控数据确定阈值的装置,以及用于针对阈值类监控数据进行报警的方法、装置和系统。通过本发明,能够提高监控设备异常告警的准确率并且极大地避免漏报和误报。

Description

用于针对阈值类监控数据确定阈值的方法和装置
技术领域
本发明涉及数据处理,更具体地,涉及用于针对阈值类监控数据确定阈值的方法和装置,以及用于针对阈值类监控数据进行报警的方法、装置和系统。
背景技术
随着大数据和云计算的广泛应用,企业业务不断升级,用户需求不断增加,对平台服务器的要求也越来越高。通常情况下,服务器上运行着各种程序以实现数据请求的接收并处理,相应地提供各种功能与服务。服务器的运行效率与各个服务程序的运行情况密切相关。
阈值类监控泛指超出某个指标需要进行告警或执行特定动作的监控。阈值类监控一般呈现出可量化、直观、存在特殊值或特殊范围等特点,譬如CPU使用率、内存占用率等。
对于服务器基础监控指标,监控数据不同时段波动较大,现有阈值类监控,几乎全部以个人经验或系统默认值来确定阈值。该方法便于部署且计算简单,但存在3个明显的缺点:1)个人经验属于主观判断,难以保证正确性且缺乏依据;2)监控对象、监控主机不同,阈值无法自适应进行变化;3)所确定的阈值为固定值或固定范围,一旦确定无法随数据变化进行自适应改变,会造成严重的漏报和误报。
目前,一种用于动态阈值自适应的方法是根据数学模型和历史数据的整个周期进行数学计算和模型应用,得到监控阈值的上限和下限,如中国专利申请“动态设置IT设备的性能的指标阈值的方法及系统”(CN 201610239833.2),通过获取IT设备的各性能的历史指标数据,根据历史指标数据,通过一元线性回归预测方程和浮动系数,计算各性能的指标阈值区间;根据该阈值区间设置各性能的指标阈值的上限值和下限值。该种方法利用数学公式、模型进行阈值区间的上下限配置,得到的结果较为科学、合理。但是,该种方法得到的阈值区间是基于整个监控周期的,对于服务器基础监控,以该种方法得到的阈值区间,并不能有很好的适应,比如在某些时段明明是正常的数值,却处于阈值区间之外,导致误报,因此其对于服务器基础监控有一定的局限性:无法针对高低峰下不同的要求进行有效的设置,且计算复杂。
相应地,存在对于改进的针对阈值类监控数据确定阈值的方法的需要。
发明内容
提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步的描述一些概念。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。
鉴于以上描述的现有技术中的缺陷,本发明的目的在于,提供针对阈值类监控数据的阈值确定技术,其能够提高监控设备异常告警的准确率并且极大地避免漏报和误报。
根据本发明的第一方面,提供了一种用于针对阈值类监控数据确定阈值的方法,该方法可以包括:获得监控数据在特定时间段内的历史数据;将该特定时间段内的历史数据划分成多个数值区间;为该多个数值区间中的每一者设置置信度;计算每一个数值区间在所设置的置信度下的置信区间;以及将每一个数值区间的所计算出的置信区间用作该数值区间在该特定时间段内的阈值区间。
根据本发明的第二方面,提供了一种用于针对阈值类监控数据进行报警的方法,该方法可以包括:获得实时监控数据;确定与实时监控数据相对应的时间段和数值区间;将实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,该阈值区间是通过根据本发明的用于针对阈值类监控数据确定阈值的方法来确定的;以及如果实时监控数据在阈值区间之外,则发出报警信号。
根据本发明的第三方面,提供了一种用于针对阈值类监控数据确定阈值的装置,该装置可以包括:历史数据划分模块,其配置成获得监控数据在特定时间段内的历史数据,以及将该特定时间段内的该历史数据划分成多个数值区间;以及阈值确定模块,其配置成为该多个数值区间中的每一者设置置信度,计算每一个数值区间在所设置的置信度下的置信区间,以及将每一个数值区间的所计算出的置信区间用作该数值区间在该特定时间段内的阈值区间。
根据本发明的第四方面,提供了一种用于针对阈值类监控数据进行报警的装置,该装置可以包括:实时监控数据划分模块,其配置成获得实时监控数据,以及确定与实时监控数据相对应的时间段和数值区间;比较模块,其配置成将实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,该阈值区间是通过根据本发明的用于针对阈值类监控数据确定阈值的方法来确定的;以及报警模块,其配置成如果实时监控数据在阈值区间之外,则发出报警信号。
根据本发明的第五方面,提供了一种用于针对阈值类监控数据进行报警的系统,该系统可以包括:根据本发明的用于针对阈值类监控数据确定阈值的装置;以及根据本发明的用于针对阈值类监控数据进行报警的装置。
通过采用本发明提供的技术方案,能够显著提高监控设备异常告警的准确率,极大地避免漏报和误报。
通过阅读下面的详细描述并参考相关联的附图,这些及其他特点和优点将变得显而易见。应该理解,前面的概括说明和下面的详细描述只是说明性的,不会对所要求保护的各方面形成限制。
附图说明
为了能详细地理解本发明的上述特征所用的方式,可以参照各实施例来对以上简要概述的内容进行更具体的描述,其中一些方面在附图中示出。然而应该注意,附图仅示出了本发明的某些典型方面,故不应被认为限定其范围,因为该描述可以允许有其它等同有效的方面。
图1解说了根据本发明的一个实施例的用于针对阈值类监控数据确定阈值的方法的流程图。
图2解说了根据本发明的一个实施例的用于针对阈值类监控数据确定阈值的装置的框图。
图3解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的方法的流程图。
图4解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的装置的框图。
图5解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的系统的框图。
图6解说了根据本发明的一个实施例的使用固定阈值监控和动态阈值监控的对比示图。
具体实施方式
下面结合附图详细描述本发明,本发明的特点将在以下的具体描述中得到进一步的显现。
在实践中,需要对各种设备(诸如服务器、计算机等)的运行参数进行监控,以确保这些设备的正常工作。运行参数的示例可以包括但不限于CPU使用率、内存占用率、硬盘占用率、网络带宽占用率等。这些运行参数往往属于阈值类监控数据。在本发明中,阈值类监控数据泛指超出某个阈值就需要进行报警或执行特定动作的监控数据。一般来说,运行参数在一天中的不同时段波动较大。例如,在凌晨1点到5点之间,由于用户数量较小,服务器的CPU使用率可能很小;而在晚上7点到10点之间,由于用户数量较大,服务器的CPU使用率可能很大。如果针对CPU使用率使用统一的阈值,则可能无法适配不同时段监控需求不一致问题,会造成一定程度的漏报。本发明创新地提供一种基于时间分片的阈值区间自适应设置的方法,该方法根据历史数据进行时间切片,针对不同的时间分片,设置不同置信度的阈值区间,从而适配不同业务的监控需求。
图1解说了根据本发明的一个实施例的用于针对阈值类监控数据确定阈值的方法100的流程图。在一些示例中,方法100可由图2中解说的装置200来执行。在一些示例中,方法100可由用于执行下述功能或算法的任何合适的设备或装置来执行。
在框110处,方法100可以包括获得监控数据在特定时间段内的历史数据。监控数据的示例可以包括但不限于受监控设备的CPU使用率、内存占用率、硬盘占用率、网络带宽占用率等。在一个示例中,受监控设备可以是服务器或者任何其他合适的设备。在一个实施例中,可以将一个时间周期(例如,一天、一周等)划分成数个时间段,其中各个时间段的时间长度可以是相同或不同的。作为一个非限制性示例,可以将一天划分成6个时间段,每个时间段具有4个小时的跨度,其中第一时间段可以是凌晨0点~4点,第二时间段可以是早上4点~8点,第三时间段可以是上午8点~中午12点,第四时间段可以是中午12点~下午4点,第五时间段可以是下午4点~晚上8点,第六时间段可以是晚上8点~凌晨0点。应注意,这仅是时间分片的一个示例,本发明并不被如此限定。特定时间段内的历史数据可以包括一个或多个时间周期的相同时间段内的历史数据(例如,前一天或多天内的凌晨0点~4点的历史数据)。
相应地,在一个示例中,获得监控数据在特定时间段内的历史数据可以包括获得CPU使用率在第一时间段(例如,凌晨0点~4点)内的历史数据。在每分钟采集一次CPU使用率并且历史数据包括前3天内的第一时间段的数据的情形中,该历史数据可以是包括720个CPU使用率的样本集。
在框120处,方法100可以包括将该特定时间段内的历史数据划分成多个数值区间。每个数值区间的大小可以相同或不同。在一个实施例中,可以根据历史数据的取值来将历史数据划分成3个数值区间。例如,在历史数据是CPU使用率的情况下,可以将0~33%的CPU使用率划分到第一数值区间(例如,低值区间),将33%~66%的CPU使用率划分到第二数值区间(例如,中间值区间),以及将66%~100%的CPU使用率划分到第三数值区间(例如,高值区间)。在另一个实施例中,可以根据历史数据的取值来将历史数据划分成2个、4个、或任何其他数目的数值区间。
在一个优选实施例中,在将特定时间段内的历史数据划分成多个数值区间时,可以判断该时间段内的历史数据中是否有异常的历史数据,如果有,则将该历史数据剔除,以将其排除在后续处理之外。在一个示例中,可以基于相应数值区间在上一时间周期的同一时间段的告警阈值来作出此类判断。例如,在监控数据为CPU使用率的情形中,假定前一天的第一时间段内的第二数值区间的阈值区间为45%~55%,则可以确定低于下限一定量或者高于上限一定量的CPU使用率为历史异常数据。由于异常数据会对后续的阈值计算有极大影响,如果不进行剔除,那么所计算得到的阈值区间将毫无意义,有可能造成大量的误报、漏报。
在框130处,方法100可以包括为该多个数值区间中的每一者设置置信度1-α。α表示显著性水平,即表示原假设为真时,拒绝原假设的概率。在一个实施例中,可以为该多个数值区间中的每一者设置相同的置信度。在另一个实施例中,可以为该多个数值区间中的每一者设置不同的置信度。例如,在具有3个数值区间的情形中,可以为第一数值区间(例如,低值区间)设置为1的置信度,为第二数值区间(例如,中间值区间)设置为0.95的置信度,并且为第三数值区间(例如,高值区间)设置为0.9的置信度。不同数值区间设置不同置信度的目的在于,随着资源的消耗量越来越多,可用资源越来越少,设备或服务所承受的风险越大,需要报警的需求越强烈。因此,一般较低的数值没有威胁,所以默认一切正常(即,设置置信度为1),从而减少了监控资源和运维资源的浪费。相反,对于较高的数值,可以设置较小的置信度以减小置信区间,从而使高值区间的数据更加敏感,防止漏报。
在框140处,方法100可以包括计算每一个数值区间在所设置的置信度下的置信区间。置信区间可以被表达为
Figure BDA0002701015990000061
其中μ表示在该特定时间段内在该数值区间内的历史数据的均值,σ表示在该特定时间段内在该数值区间内的历史数据的标准差,n表示在该特定时间段内在该数值区间内的历史数据的样本数,Zα/2表示该数值区间的标准分数。标准分数可以通过查表来获得,例如,在α=0.05的情形中,Zα/2=1.96;在α=0.1的情形中,Zα/2=1.645。
在框150处,方法100可以包括将每一个数值区间的所计算出的置信区间用作该数值区间在该特定时间段内的阈值区间。该阈值区间可被用来检测在该特定时间段内所获得的监控数据的实际值是否正常,以便当实际值处于阈值区间以外时产生报警信号。
在一个实施例中,方法100可以进一步包括获得监控数据在该特定时间段之后的下一时间段内的历史数据,以及基于该下一时间段内的历史数据来更新该多个数值区间中的每一者在该下一时间段内的阈值区间。例如,在获得监控数据在凌晨0点~4点之间在各个数值区间内的阈值区间之后,可以获得监控数据在早上4点~8点之间的历史数据,并且按以上所述的方法来将这些历史数据划分到多个数值区间中,为每一个数值区间设置置信度,计算每一个数值区间在所设置的置信度下的置信区间,以及将所计算出的置信区间用作相应数值区间在早上4点~8点之间的阈值区间。通过分时段更新置信区间和阈值区间,能够实现动态阈值的自适应调整更新,保证所计算出的置信区间适合当前时段的服务或设备状态,降低了监控报警的准确率,有效避免误报、漏报。
基于同一发明构思,本发明还提供了一种用于针对阈值类监控数据确定阈值的装置,如下面的实施例所描述的。由于该装置与方法100相似,因此该装置可以参见方法100来实现,重复之处不再赘述。如本文中所使用的,术语“单元”或“模块”可以是实现预定功能的软件、硬件和/或软件和硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件、或者软件和硬件的组合的实现也是可以构想的。
图2解说了根据本发明的一个实施例的用于针对阈值类监控数据确定阈值的装置200的框图。装置200可以包括历史数据划分模块210,其配置成获得监控数据在特定时间段内的历史数据,以及将该特定时间段内的该历史数据划分成多个数值区间;以及阈值确定模块220,其配置成为该多个数值区间中的每一者设置置信度,计算每一个数值区间在所设置的置信度下的置信区间,以及将每一个数值区间的所计算出的置信区间用作该数值区间在该特定时间段内的阈值区间。此外,装置200可以进一步包括阈值更新模块(未示出),其配置成获得监控数据在特定时间段之后的下一时间段内的历史数据;以及基于下一时间段内的历史数据来更新多个数值区间中的每一者在下一时间段内的阈值区间。
本发明还提出一种用于针对阈值类监控数据进行报警的方法,该方法可以使用通过方法100获得的阈值区间来进行报警,并且可以提高监控报警的准确率,在很大程度上减少误报和漏报。
图3解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的方法300的流程图。在一些示例中,方法300可由图4中解说的装置400来执行。在一些示例中,方法300可由用于执行下述功能或算法的任何合适的设备或装置来执行。
在框310处,方法300可以包括获得实时监控数据。例如,监控设备可以获得服务器的实时CPU使用率、实时内存占用率、实时网络带宽占用率等。
在框320处,方法300可以包括确定与实时监控数据相对应的时间段和数值区间。例如,如果实时CPU使用率是早上9点的CPU使用率并且为50%,则可以确定与该实时CPU使用率相对应的时间段为第三时间段(例如,早上8点~中午12点的时间段)并且相对应的数值区间为第二数值区间(例如,33%~66%的数值区间)。
在框330处,方法300可以包括将实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,其中该阈值区间是通过根据本发明的用于针对阈值类监控数据确定阈值的方法200来确定的。
在框340处,方法300可以包括如果实时监控数据在该阈值区间之外,则发出报警信号。例如,如果早上9点的实时CPU使用率是64%并且相应数值区间(例如,33%~66%的数值区间)在早上8点~中午12点的时间段内的阈值区间为45%~55%,则可以确定该实时CPU使用率超出了该阈值区间,并且因此发出报警信号。例如,报警信号可以是文本消息、声音信号、视觉信号、触觉信号、或者任何其他合适的信号。
可任选地,方法300可以进一步包括如果在相应的时间段内已发出过报警信号,则抑制在该时间段内再次发出报警信号。如此,可以避免在相同的场景下频繁报警。
基于同一发明构思,本发明还提供了一种用于针对阈值类监控数据进行报警的装置,如下面的实施例所描述的。由于该装置与方法300相似,因此该装置可以参见方法300来实现,重复之处不再赘述。
图4解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的装置400的框图。装置400可以包括实时监控数据划分模块410,其配置成获得实时监控数据,以及确定与该实时监控数据相对应的时间段和数值区间;比较模块420,其配置成将该实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,该阈值区间是通过根据本发明的用于针对阈值类监控数据确定阈值的方法200来确定的;以及报警模块430,其配置成如果该实时监控数据在该阈值区间之外,则发出报警信号。
图5解说了根据本发明的一个实施例的用于针对阈值类监控数据进行报警的系统500的框图。系统500可以包括以上描述的用于针对阈值类监控数据确定阈值的装置200和用于针对阈值类监控数据进行报警的装置400。这两个装置的功能上面已经描述,重复之处不再赘述。
图6解说了根据本发明的一个实施例的使用固定阈值监控和动态阈值监控的对比示图。在图6中,以CPU使用率为例示出了使用固定阈值监控和动态阈值监控的比较。在图6的上半部分中,采用80%的CPU使用率作为固定的报警阈值。从图中可见,CPU使用率仅在10点~12点之间超出了该固定的报警阈值。因此,监控设备将在10点~12点之间发出报警信号。
作为对比,如在图6的下半部分中所示出的,在该实施例中,CPU使用率被划分成三个数值区间,即0%~33%的低值区间、33%~66%的中间值区间、以及66%~100%的高值区间。为低值区间设置为1的置信度,并且因此落在低值区间的CPU使用率都被认为是正常的,而不会发出报警信号。为中间值区间设置为0.95的置信度,并且因此得到42%~62%的阈值区间。为高值区间设置为0.9的置信度,并且因此得到85%~95%的阈值区间。如从图中可见,在6点时,CPU使用率达到65%,这超过了中间值区间的阈值上限,并且因此监控设备将发出报警信号。此外,在11点,CPU使用率为80%,这没有达到高值区间的阈值下限,并且因此监控设备将发出报警信号。通过对比可以发现,针对同样的CPU使用率曲线,根据本发明的动态阈值监控能够有效地减少虚警率和漏警率。
总的来说,本发明与现有技术相比具有以下优点中的一者或多者:
(1)能够灵活地划分时间周期,易于根据实际情况和需要进行设置和调整,更具有通用性和良好的交互性。
(2)置信水平(置信度)的设定不是固定的,可以根据实际情况进行调整,更能适应不同要求的复杂应用场景,不同的监控指标范围置信度也是变化的。
(3)动态阈值的确定依赖于历史数据本身,不包含主观因素。
(4)报警阈值是区间的,在常规上限阈值的情况下增加下限阈值,一定程度上可以降低虚警率和漏警率。
本领域普通技术人员应领会,本发明的各个实施例可提供为方法、装置、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用一个或多个其中存储有计算机可执行程序代码的计算机可读存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置、系统和计算机程序产品的流程图和/或框图来描述的。应理解,可由计算机程序指令实现流程图和/或框图中的每一个流程和/或方框、以及流程图和/或框图中的流程和/或方框的组合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图中的一个或多个流程和/或框图中的一个或多个方框中指定的功能的装置。
尽管目前为止已经参考附图描述了本发明的各方面,但是上述方法、系统和设备仅是示例,并且本发明的范围不限于这些方面,而是仅由所附权利要求及其等同物来限定。各种组件可被省略或者也可被等同组件替代。另外,也可以在与本发明中描述的顺序不同的顺序实现所述步骤。此外,可以按各种方式组合各种组件。也重要的是,随着技术的发展,所描述的组件中的许多组件可被之后出现的等同组件所替代。对本公开的各种修改对于本领域技术人员将是显而易见的,并且本文中所定义的普适原理可被应用于其他变形而不会脱离本公开的范围。由此,本公开并非被限定于本文中所描述的示例和设计,而是应被授予与本文所公开的原理和新颖特征相一致的最广范围。

Claims (10)

1.一种用于针对阈值类监控数据确定阈值的方法,所述方法包括:
获得监控数据在特定时间段内的历史数据;
将所述特定时间段内的所述历史数据划分成多个数值区间;
为所述多个数值区间中的每一者设置置信度;
计算每一个数值区间在所设置的置信度下的置信区间;以及
将每一个数值区间的所计算出的置信区间用作该数值区间在所述特定时间段内的阈值区间。
2.如权利要求1所述的方法,其特征在于,将所述特定时间段内的所述历史数据划分成多个数值区间包括:剔除所述多个数值区间中的历史异常数据。
3.如权利要求1所述的方法,其特征在于,进一步包括:
获得所述监控数据在所述特定时间段之后的下一时间段内的历史数据;以及
基于所述下一时间段内的历史数据来更新所述多个数值区间中的每一者在所述下一时间段内的阈值区间。
4.如权利要求1所述的方法,其特征在于,所述多个数值区间包括第一数值区间、第二数值区间和第三数值区间,其中为所述第一数值区间、所述第二数值区间和所述第三数值区间设置不同的置信度。
5.如权利要求4所述的方法,其特征在于,为所述第一数值区间设置为1的置信度,为所述第二数值设置为0.95的置信度,并且为所述第三数值区间设置为0.9的置信度。
6.一种用于针对阈值类监控数据进行报警的方法,所述方法包括:
获得实时监控数据;
确定与所述实时监控数据相对应的时间段和数值区间;
将所述实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,所述阈值区间是通过如权利要求1-5中任一项所述的方法来确定的;以及
如果所述实时监控数据在所述阈值区间之外,则发出报警信号。
7.如权利要求6所述的方法,其特征在于,如果在一时间段内已发出过报警信号,则抑制在所述时间段内再次发出报警信号。
8.一种用于针对阈值类监控数据确定阈值的装置,所述装置包括:
历史数据划分模块,其配置成获得监控数据在特定时间段内的历史数据,以及将所述特定时间段内的所述历史数据划分成多个数值区间;以及
阈值确定模块,其配置成为所述多个数值区间中的每一者设置置信度,计算每一个数值区间在所设置的置信度下的置信区间,以及将每一个数值区间的所计算出的置信区间用作该数值区间在所述特定时间段内的阈值区间。
9.一种用于针对阈值类监控数据进行报警的装置,所述装置包括:
实时监控数据划分模块,其配置成获得实时监控数据,以及确定与所述实时监控数据相对应的时间段和数值区间;
比较模块,其配置成将所述实时监控数据与相应数值区间在相应时间段内的阈值区间进行比较,所述阈值区间是通过如权利要求1-5中任一项所述的方法来确定的;以及
报警模块,其配置成如果所述实时监控数据在所述阈值区间之外,则发出报警信号。
10.一种用于针对阈值类监控数据进行报警的系统,所述系统包括:
如权利要求8所述的装置;以及
如权利要求9所述的装置。
CN202011022185.8A 2020-09-25 2020-09-25 用于针对阈值类监控数据确定阈值的方法和装置 Pending CN113760637A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011022185.8A CN113760637A (zh) 2020-09-25 2020-09-25 用于针对阈值类监控数据确定阈值的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011022185.8A CN113760637A (zh) 2020-09-25 2020-09-25 用于针对阈值类监控数据确定阈值的方法和装置

Publications (1)

Publication Number Publication Date
CN113760637A true CN113760637A (zh) 2021-12-07

Family

ID=78785781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011022185.8A Pending CN113760637A (zh) 2020-09-25 2020-09-25 用于针对阈值类监控数据确定阈值的方法和装置

Country Status (1)

Country Link
CN (1) CN113760637A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116206427A (zh) * 2023-05-06 2023-06-02 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572391A (zh) * 2013-10-16 2015-04-29 深圳市腾讯计算机系统有限公司 监控告警策略配置方法及装置、监控告警方法及装置
CN106201829A (zh) * 2016-07-18 2016-12-07 中国银联股份有限公司 监控阈值确定方法及装置、监控报警方法、装置及系统
KR20180076172A (ko) * 2016-12-27 2018-07-05 주식회사 씨에스리 데이터베이스 시스템의 이상을 탐지하는 장치 및 방법
CN109582529A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 一种报警阈值的设置方法及装置
US20200142800A1 (en) * 2018-11-02 2020-05-07 Alibaba Group Holding Limited Monitoring multiple system indicators

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572391A (zh) * 2013-10-16 2015-04-29 深圳市腾讯计算机系统有限公司 监控告警策略配置方法及装置、监控告警方法及装置
CN106201829A (zh) * 2016-07-18 2016-12-07 中国银联股份有限公司 监控阈值确定方法及装置、监控报警方法、装置及系统
KR20180076172A (ko) * 2016-12-27 2018-07-05 주식회사 씨에스리 데이터베이스 시스템의 이상을 탐지하는 장치 및 방법
CN109582529A (zh) * 2018-09-29 2019-04-05 阿里巴巴集团控股有限公司 一种报警阈值的设置方法及装置
US20200142800A1 (en) * 2018-11-02 2020-05-07 Alibaba Group Holding Limited Monitoring multiple system indicators

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116206427A (zh) * 2023-05-06 2023-06-02 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法
CN116206427B (zh) * 2023-05-06 2023-06-30 安徽智寰科技有限公司 一种基于通用指标自适应阈值的分级报警方法

Similar Documents

Publication Publication Date Title
WO2021212756A1 (zh) 指标异常分析方法、装置、电子设备及存储介质
US10061677B2 (en) Fast automated detection of seasonal patterns in time series data without prior knowledge of seasonal periodicity
US9952921B2 (en) System and method for detecting and predicting anomalies based on analysis of time-series data
CN106713029B (zh) 一种确定资源监控阈值的方法及装置
US9471544B1 (en) Anomaly detection in a signal
JP2019501547A (ja) DoS/DDoS攻撃を検出する方法、装置、サーバ及び記憶媒体
CN108664321B (zh) 系统资源分配调整方法及装置
CN110955586A (zh) 一种基于日志的系统故障预测方法、装置和设备
CN112116123A (zh) 一种基于动态基线的智能告警方法和系统
JPWO2005017736A1 (ja) ディスクアレイ装置におけるボトルネックを検出するシステムおよびプログラム
CN107241440B (zh) 一种确定集群的节能策略的方法
CN106933677A (zh) 系统异常处理方法及装置
CN111585785A (zh) 告警信息的屏蔽方法、装置、计算机设备及存储介质
US8806313B1 (en) Amplitude-based anomaly detection
CN115328733A (zh) 应用于业务系统的告警方法、装置、电子设备及存储介质
CN113760637A (zh) 用于针对阈值类监控数据确定阈值的方法和装置
CN114708717A (zh) 一种系统监控的关联告警方法及装置
US20200379867A1 (en) Anomalous computing resource usage detection based on seasonality-based dynamic thresholds
CN108595685B (zh) 一种数据处理方法及装置
CN110764967A (zh) 高性能监控告警系统、方法、装置及计算机可读存储介质
CN110569114B (zh) 一种业务处理方法、装置、设备及存储介质
CN112948223A (zh) 一种监测运行情况的方法和装置
CN110677271A (zh) 基于elk的大数据告警方法、装置、设备及存储介质
US20210211437A1 (en) Activity detection based on time difference metrics
CN114024831A (zh) 一种异常事件预警方法、装置和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220208

Address after: Room 1423, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai 200072

Applicant after: Tianyi Digital Life Technology Co.,Ltd.

Address before: 201702 3rd floor, 158 Shuanglian Road, Qingpu District, Shanghai

Applicant before: Tianyi Smart Family Technology Co.,Ltd.