CN108509314A - 一种主机运行指标监控告警方法及系统装置 - Google Patents

一种主机运行指标监控告警方法及系统装置 Download PDF

Info

Publication number
CN108509314A
CN108509314A CN201810253504.2A CN201810253504A CN108509314A CN 108509314 A CN108509314 A CN 108509314A CN 201810253504 A CN201810253504 A CN 201810253504A CN 108509314 A CN108509314 A CN 108509314A
Authority
CN
China
Prior art keywords
time
cpu usage
monitoring module
real
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810253504.2A
Other languages
English (en)
Inventor
黄东
厉超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Ding Ting Information Technology Co Ltd
Original Assignee
Wuhan Ding Ting Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Ding Ting Information Technology Co Ltd filed Critical Wuhan Ding Ting Information Technology Co Ltd
Publication of CN108509314A publication Critical patent/CN108509314A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种主机运行指标监控告警方法及系统装置,其主要技术方案是获取被监控主机的CPU使用率指标的最近若干天的历史记录数据,这些历史数据按分钟记录,每分钟需要有一个CPU使用率的平均值。将上述历史数据不同天在一天内的同一分钟的值求和,然后除以天数,求平均。既得一天内该分钟的阈值或阈值范围。一天有24*60=1440分钟,因此阈值有1440个不同值。实时采集被监控主机的CPU使用率指标,并记录当前时间,与求得的同一时刻的阈值或阈值范围进行对比,若采集值大于该阈值或阈值范围,则发出告警通知。从而实现更细致更灵敏的指标监控及异常告警,使系统管理员能更早的发现系统的异常,及时作出相应的对策。

Description

一种主机运行指标监控告警方法及系统装置
技术领域
本发明涉及计算机服务器操作系统运行指标健康状况监控,及异常告警通知的一种改进方案。尤其对于需要监控数量巨大的计算机服务器主机运行指标监控告警的改进方法及系统装置。
背景技术
在计算机服务器运维工作中,实时监控每台服务器系统运行指标是必要工作。这些指标包括计算机的CPU使用率,内存使用率,硬盘使用率,系统负载率,网络带宽使用量等等。这些指标反映计算机的健康状况,当指标不在正常范围时,计算机系统可能无法正常工作。下面以其中一个指标(CPU使用率)为例,说明现有监控告警机制存在的问题。CPU使用率是衡量计算机CPU工作量大小的指标,指标取值范围是0%~100%。当指标为0%时代表计算机完全空闲,可以及时响应新任务。当指标为100%时,说明计算机任务很繁忙,新任务可能不能及时响应。CPU使用率大小跟计算机任务量多少成正比。当CPU使用率过高时,需要通知系统管理员检查是否存在异常情况并做进一步处理。目前现有的做法是,设定一个固定阈值,例如80%,当CPU使用率超过80%时,则触发告警机制,通知系统管理员。目前的这个机制可以粗略的解决指标过高的报警,但是其方法过于简单、粗放,不够灵活和细致。
对于一部分服务器,其上运行的业务是具有周期性的,例如证券的行情服务器,交易日开盘时间:9:30-11:30,13:00-15:00。那么在开盘期间业务量会显著增大,这将导致服务器的CPU使用率也会明显变大,收盘后业务量减小,又会使CPU使用率变小。基于这种周期性可以认为,开盘期间内CPU使用率明显低于历史同期,或者在收盘期间内CPU使用率明显高于历史同期,则可以认为该机器可能存在异常,需要及时通知管理员排查。而利用传统的方法设置固定阈值(如80%)告警的方案则没办法发觉该类异常行为。
发明内容
本发明的目的是根据现有方案的不足之处,提出一种基于指标历史监控数据的周期性来动态设定阈值。在一天内的不同时刻,其指标的阈值不同。这个阈值根据近期的历史数据进行计算,并每天更新,从而实现更细致更灵敏的指标监控及异常告警,使系统管理员能更早的发现系统的异常。
为解决上述问题,本发明提供的改进方案包括以下步骤:
第一方面,一种主机运行指标监控告警方法,所述方法包括:
监控模块获取存储于数据库中的CPU使用率指标值历史记录数据集合,所述历史记录数据集合包含多个历史记录数据项,每个历史记录数据项按时间级m进行记录,每个时间级m记录一个CPU使用率指标值
监控模块获取上述历史记录数据的项数及每个历史记录数据项的每个时间级m记录的CPU使用率指标值,根据公式:
计算出单个记录数据项内每个时间级m的阈值表示每个历史记录数据项的相同时间级的CPU使用率指标值的和,D表示所述历史记录数据集合包含的历史记录数据项的项数。
实时采集模块采集实时CPU使用率指标值T,记录实时采集时间。
监控模块获取所述实时CPU使用率指标值T及实时采集时间,所述监控模块对比同一时间级的实时CPU使用率指标值T与阈值的大小;若T>,监控模块发送告警通知;若T≤,监控模块等待下一个时间级启动对比。
结合第一方面,在第一方面可能的实现方式中的第一种情况为:
所述监控模块对比同一时间级的实时CPU使用率指标T与阈值的大小,若T>ax,监控模块发送告警通知;若T≤ax,监控模块等待下一个时间级启动对比;其中a为常数系数,用于控制告警的灵敏度,a>0。
结合第一方面,在第一方面可能的实现方式中的第二种情况为:
所述每个时间级m记录的CPU使用率指标值包含CPU使用率指标最小值及CPU使用率指标最大值
监控模块获取上述历史记录数据的项数及每个历史记录数据项的每个时间级m记录的CPU使用率指标最小值及CPU使用率指标最大值,根据公式:
计算出单个记录数据项内每个时间级m的下限阈值及上限阈值生成阈值范围X。
所述监控模块判断同一时间级的实时CPU使用率指标值T是否超出阈值范围X的数值;若,监控模块发送告警通知;若,监控模块等待下一个时间级启动判断。
结合第一方面的第二种情况,在第一方面可能的实现方式中的第三种情况为:
所述监控模块判断同一时间级的实时CPU使用率指标值T是否超出阈值范围X的数值,若,监控模块发送告警通知;若,监控模块等待下一个时间级启动判断,其中a为常数系数,用于控制告警的灵敏度,a>0。
结合第一方面及第一方面的第一至第三种情况,在第一方面可能的实现方式中的第四种情况为:
所述历史记录数据项以天粒度(即24小时)为一个记录周期,记录生成一个项。所述时间级m根据其时间级m的个数平均分割所述24小时记录周期,用以记录所述CPU使用率指标值
结合第一方面的第四种情况,在第一方面可能的实现方式中的第五种情况为:
所述时间级m为分钟级,所述分钟级为分钟粒度,即以一分钟为一个记录周期,记录一个所述CPU使用率指标值
结合第一方面及第一方面的第一至第三种情况,在第一方面可能的实现方式中的第六种情况为:
所述时间级m为分钟级,所述分钟级为分钟粒度,即以一分钟为一个记录周期,记录一个所述CPU使用率指标值
第二方面,一种主机运行指标监控告警系统,所述系统包括:
监控模块,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集模块,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据库,用于存储CPU使用率指标历史记录数据集合。
第三方面,一种主机运行指标监控告警系统装置,所述系统装置包括:
监控装置,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集装置,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据存储装置,用于存储CPU使用率指标历史记录数据集合;
还包括存储器、处理器、总线,所述存储器与处理器通过总线进行数据连接,存储器内部存储多条操作指令,处理器加载所述多条操作指令执行,实现第一方面及第一方面可能实现的第一种至第六种情况中所述的方法。
本发明有益效果:本发明提出一种基于指标历史监控数据的周期性来动态设定阈值,在一天内的不同时刻,设定不同的指标阈值,这个阈值根据近期的历史数据进行计算,并每天更新,从而实现更细致更灵敏的指标监控及异常告警,使系统管理员能更早的发现系统的异常,及时作出相应的对策。
附图说明
图1为某证券服务器8天的CPU使用率图表;
图2为本发明实施例一的方法流程示意图;
图3为本发明实施例二的方法流程示意图;
图4为本发明实施例三的系统结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于一部分服务器,其上运行的业务是具有周期性的,例如证券的行情服务器,交易日开盘时间:9:30-11:30,13:00-15:00。那么在开盘期间业务量会显著增大,这将导致服务器的CPU使用率也会明显变大,收盘后业务量减小,又会使CPU使用率变小。这个周期性如图1表现的,交易日的9:30-11:30,13:00-15:00期间CPU使用率会出现两个明显的波峰。基于这种周期性可以认为,开盘期间内CPU使用率明显低于历史同期,或者在收盘期间内CPU使用率明显高于历史同期,则可以认为该机器可能存在异常,需要及时通知管理员排查。
实施例一:
如图2所示,针对上述情况,本发明提供了一种设定上限阈值的主机运行指标监控告警方法,所述方法步骤如下:
步骤101,监控模块以天为单位获取存储于数据库的被监控主机的CPU使用率指标值的历史记录数据集合,所述历史记录数据集合包含最近30天的历史记录数据项D,每个历史记录数据项D为一天(D=1,2,3…30),每个历史记录数据项按分钟时间级m进行记录。一天有24个小时,所以一天内有24*60=1440个分钟级m,m与24小时内的各个分钟分别对应(m=00:00,00:01,00:02…23:59)。每个分钟级m记录一个CPU使用率指标最大值,也就是有1440个记录数据;
步骤102,监控模块获取上述历史记录数据的天数及每个历史记录数据项的每个分钟级m记录的CPU使用率指标最大值,根据公式:
计算出单天的记录数据项内每个分钟级m的上限阈值,即1440个不同的上限阈值表示前30天不同天数的历史记录数据项中同一分钟级的CPU使用率指标最大值的和。
步骤103,实时采集模块采集被监控机器的实时CPU使用率指标值T,记录实时采集时间。
步骤104,监控模块获取所述实时CPU使用率指标值T及实时采集时间,所述监控模块对比同一时间级的CPU使用率指标值T与阈值的大小。加入常数系数a,用于控制告警的灵敏度,a>0。若T>,监控模块发送告警通知;若T≤,监控模块等待下一个时间级启动对比。
本方法可实时动态地设置1440个上限阈值,只要监控到的CPU使用率未超过其上限阈值,系统继续运行,不会发出告警。一旦超出其上限阈值,监控系统立即发出告警,提醒系统管理员及时处理。
实施例二:
如图3所示,本发明还提供了一种设定阈值范围的主机运行指标监控告警方法,所述方法步骤如下:
步骤201,监控模块以天为单位获取存储于数据库的被监控主机的CPU使用率指标值的历史记录数据集合,所述历史记录数据集合包含最近30天的历史记录数据项D,每个历史记录数据项D为一天(D=1,2,3…30),每个历史记录数据项按分钟时间级m进行记录。一天有24个小时,所以一天内有24*60=1440个分钟级m,m与24小时内的各个分钟分别对应(m=00:00,00:01,00:02…23:59)。所述每个时间级m记录的CPU使用率指标值包含CPU使用率指标最小值及CPU使用率指标最大值;也就是有1440个记录数据。
步骤202,监控模块获取上述历史记录数据的天数及每个历史记录数据项的每个分钟级m记录的CPU使用率指标最小值及CPU使用率指标最大值,根据公式:
计算出单天的记录数据项内每个分钟级m的下限阈值及上限阈值形成一个阈值范围X。即1440个不同的阈值范围X,表示前30天不同天数的历史记录数据项中同一分钟级的CPU使用率指标值的和,即CPU使用率指标最小值的和以及CPU使用率指标最大值的和。
步骤203,实时采集模块采集被监控机器的实时CPU使用率指标值T,记录实时采集时间。
步骤204,监控模块获取所述实时CPU使用率指标值T及实时采集时间,所述监控模块判断同一时间级的实时CPU使用率指标值T是否超出阈值范围X的数值。加入常数系数a,用于控制告警的灵敏度,a>0。若,监控模块发送告警通知;若,监控模块等待下一个时间级启动判断,其中a为常数系数,用于控制告警的灵敏度,a>0。
本方法可实时动态地设置1440个上、下限阈值范围X,只要监控到的CPU使用率未超过其阈值范围X,系统继续运行,不会发出告警。一旦低于或高于其阈值范围X,监控系统立即发出告警,提醒系统管理员及时处理。这样不仅可以监控到CPU处于高使用率的风险,也可监控到CPU理应处于高使用率时其所监控到的CPU使用率却偏低的情况,并发出告警,通知系统管理员及时检查、处理。
根据上述实施例一及实施例二所述,其分钟级是以一分钟的时间粒度为一个分钟级。本发明人经过多次试验及模拟运行,总结出当所述分钟级以5分钟为一个时间粒度,那么可以有效的排除掉一些干扰项,如所述CPU使用率不具备周期性的主机,从而保证其监控的准确性。
实施例三:
如图4所示,本发明基于上述方法,提供了一种主机运行指标监控告警系统,所述系统包括:
监控模块,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集模块,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据库,用于存储CPU使用率指标历史记录数据集合。
基于上述系统,本发明还提供了一种主机运行指标监控告警系统装置,所述系统装置包括:
监控装置,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集装置,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据存储装置,用于存储CPU使用率指标历史记录数据集合;
还包括存储器、处理器、总线,所述存储器与处理器通过总线进行数据连接,存储器内部存储多条操作指令,处理器加载所述多条操作指令执行,实现本发明中所述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所描述的装置实施例仅仅是示意性的,可以是设计成一体设备,也可以是组合成一套设备,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件和必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种主机运行指标监控告警方法,其特征在于,所述方法包括:
监控模块获取存储于数据库的CPU使用率指标值历史记录数据集合,所述历史记录数据集合包含多个历史记录数据项,每个历史记录数据项按时间级m进行记录,每个时间级m记录CPU使用率指标值
监控模块获取上述历史记录数据的项数及每个历史记录数据项的每个时间级m记录的CPU使用率指标值,根据公式:
计算出单个记录数据项内每个时间级m的阈值表示每个历史记录数据项的相同时间级的CPU使用率指标值的和,D表示所述历史记录数据集合包含的历史记录数据项的项数;
实时采集模块采集实时CPU使用率指标值T,记录实时采集时间;
监控模块获取所述实时CPU使用率指标值T及实时采集时间,所述监控模块对比同一时间级的实时CPU使用率指标值T与阈值的大小;若T>,监控模块发送告警通知;若T≤,监控模块等待下一个时间级启动对比。
2.根据权利要求1所述的一种主机运行指标监控告警方法,其特征在于,所述监控模块对比同一时间级的实时CPU使用率指标T与阈值的大小,若T>ax,监控模块发送告警通知;若T≤ax,监控模块等待下一个时间级启动对比;其中a为常数系数,用于控制告警的灵敏度,a>0。
3.根据权利要求1所述的一种主机运行指标监控告警方法,其特征在于,所述每个时间级m记录的CPU使用率指标值包含CPU使用率指标最小值及CPU使用率指标最大值
监控模块获取上述历史记录数据的项数及每个历史记录数据项的每个时间级m记录的CPU使用率指标最小值及CPU使用率指标最大值,根据公式:
计算出单个记录数据项内每个时间级m的下限阈值及上限阈值生成阈值范围X;
所述监控模块判断同一时间级的实时CPU使用率指标值T是否超出阈值范围X的数值;若T∉X,监控模块发送告警通知;若T∈X,监控模块等待下一个时间级启动判断。
4.根据权利要求3所述的一种主机运行指标监控告警方法,其特征在于,所述监控模块判断同一时间级的实时CPU使用率指标值T是否超出阈值范围X的数值,若,监控模块发送告警通知;若,监控模块等待下一个时间级启动判断,其中a为常数系数,用于控制告警的灵敏度,a>0。
5.根据权利要求1或2或3或4所述的一种主机运行指标监控告警方法,其特征在于,所述历史记录数据项以24小时为一个记录周期,记录历史记录数据生成一个项。
6.所述时间级m根据其时间级m的个数平均分割所述24小时记录周期,记录所述CPU使用率指标值
7.根据权利要求5所述的一种主机运行指标监控告警方法,其特征在于,所述时间级m为分钟级,以分钟为单位时间的时间粒度为一个记录周期,记录所述CPU使用率指标值
8.根据权利要求1或2或3或4所述的一种主机运行指标监控告警方法,其特征在于,所述时间级m为分钟级,以分钟为单位时间的时间粒度为一个记录周期,记录所述CPU使用率指标值
9.一种主机运行指标监控告警系统,所述系统包括:
监控模块,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集模块,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据库,用于存储CPU使用率指标历史记录数据集合。
10.一种主机运行指标监控告警系统装置,所述系统装置包括:
监控装置,用于对根据历史记录数据得出时间级的CPU使用率阈值,同实时CPU使用率指标进行比较,并判断是否发出警告;
实时采集装置,用于实时采集CPU使用率指标,提供给监控模块进行监控;
数据存储装置,用于存储CPU使用率指标历史记录数据集合;
还包括存储器、处理器、总线,所述存储器与处理器通过总线进行数据连接,
存储器内部存储多条操作指令,处理器加载所述多条操作指令执行,实现权力要求1-7中所述的方法。
CN201810253504.2A 2018-02-09 2018-03-26 一种主机运行指标监控告警方法及系统装置 Pending CN108509314A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810135952 2018-02-09
CN2018101359522 2018-02-09

Publications (1)

Publication Number Publication Date
CN108509314A true CN108509314A (zh) 2018-09-07

Family

ID=63378494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810253504.2A Pending CN108509314A (zh) 2018-02-09 2018-03-26 一种主机运行指标监控告警方法及系统装置

Country Status (1)

Country Link
CN (1) CN108509314A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109672585A (zh) * 2018-12-12 2019-04-23 郑州云海信息技术有限公司 一种用于监控云平台中的主机状态的方法和装置
CN111897700A (zh) * 2020-07-15 2020-11-06 中国工商银行股份有限公司 应用指标监控方法及装置、电子设备和可读存储介质
WO2022111265A1 (zh) * 2020-11-25 2022-06-02 深圳前海微众银行股份有限公司 一种信息告警方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105406991A (zh) * 2015-10-26 2016-03-16 上海华讯网络系统有限公司 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN105956734A (zh) * 2016-04-15 2016-09-21 广东轩辕网络科技股份有限公司 动态设置it设备的性能的指标阈值的方法及系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
CN106713029A (zh) * 2016-12-20 2017-05-24 中国银联股份有限公司 一种确定资源监控阈值的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105406991A (zh) * 2015-10-26 2016-03-16 上海华讯网络系统有限公司 基于网络监控指标由历史数据生成业务阈值的方法及系统
CN105956734A (zh) * 2016-04-15 2016-09-21 广东轩辕网络科技股份有限公司 动态设置it设备的性能的指标阈值的方法及系统
CN106557401A (zh) * 2016-10-13 2017-04-05 中国铁道科学研究院电子计算技术研究所 一种it设备监控指标的动态阈值设定方法及系统
CN106713029A (zh) * 2016-12-20 2017-05-24 中国银联股份有限公司 一种确定资源监控阈值的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109672585A (zh) * 2018-12-12 2019-04-23 郑州云海信息技术有限公司 一种用于监控云平台中的主机状态的方法和装置
CN111897700A (zh) * 2020-07-15 2020-11-06 中国工商银行股份有限公司 应用指标监控方法及装置、电子设备和可读存储介质
CN111897700B (zh) * 2020-07-15 2024-03-08 中国工商银行股份有限公司 应用指标监控方法及装置、电子设备和可读存储介质
WO2022111265A1 (zh) * 2020-11-25 2022-06-02 深圳前海微众银行股份有限公司 一种信息告警方法、设备及存储介质

Similar Documents

Publication Publication Date Title
Salmasnia et al. A joint design of production run length, maintenance policy and control chart with multiple assignable causes
Gu et al. Online anomaly prediction for robust cluster systems
US7467067B2 (en) Self-learning integrity management system and related methods
US11422595B2 (en) Method and system for supervising a health of a server infrastructure
CN108509314A (zh) 一种主机运行指标监控告警方法及系统装置
CN109283866A (zh) 医院设备信息化监控系统
CN109412870A (zh) 告警监控方法及平台、服务器、存储介质
CN112162907A (zh) 基于监控指标数据的健康度评估方法
CN105872061B (zh) 一种服务器集群管理方法、装置及系统
CN109034580B (zh) 一种基于大数据分析的信息系统整体健康度评估方法
CN109362235A (zh) 对网络可访问存储装置处的事务进行分类
CN108809760A (zh) 数据采样系统中采样周期的控制方法和装置
CN109040277A (zh) 一种服务器的远程监控方法及装置
CN107579858A (zh) 云主机的告警方法及装置、通信系统
CN109240863A (zh) 一种cpu故障定位方法、装置、设备及存储介质
CN112596975A (zh) 对网络设备进行监控处理的方法、系统、设备和存储介质
CN108809720A (zh) 云数据系统中告警任务的管理方法和装置
CN108986418A (zh) 智能报警方法、装置、设备及存储介质
CN116578990A (zh) 一种基于数据中心数字化运维的综合监控技术
CN117391675B (zh) 一种数据中心基础设施运维管理方法
CN115134262B (zh) RocketMQ监控方法及装置、存储介质及电子设备
CN111258870A (zh) 分布式存储系统的性能分析方法、装置、设备及存储介质
CN109815080A (zh) 计算机设备的三维监控方法及其装置
CN110795306A (zh) 一种基于实时监控的网络安全管控系统
JP2021018630A (ja) 警報集約選別装置及び警報集約選別方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180907