CN109039740A - 一种处理运维监控告警的方法及设备 - Google Patents

一种处理运维监控告警的方法及设备 Download PDF

Info

Publication number
CN109039740A
CN109039740A CN201810864824.1A CN201810864824A CN109039740A CN 109039740 A CN109039740 A CN 109039740A CN 201810864824 A CN201810864824 A CN 201810864824A CN 109039740 A CN109039740 A CN 109039740A
Authority
CN
China
Prior art keywords
alarm
identification
service
business
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810864824.1A
Other languages
English (en)
Other versions
CN109039740B (zh
Inventor
林水明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201810864824.1A priority Critical patent/CN109039740B/zh
Priority to PCT/CN2018/105104 priority patent/WO2020024376A1/zh
Publication of CN109039740A publication Critical patent/CN109039740A/zh
Application granted granted Critical
Publication of CN109039740B publication Critical patent/CN109039740B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Alarm Systems (AREA)

Abstract

本发明适用于计算机技术领域,提供了一种处理运维监控告警的方法及设备,该方法包括:获取用于请求屏蔽运维监控告警的请求信息;所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;一个业务标识关联至少两个告警实例标识;对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。本发明通过对某项业务的告警实例进行批量告警屏蔽处理,不需要人工查找某业务的告警实例并逐一屏蔽,能够提高屏蔽告警的处理效率,且由于一项业务的所有告警实例均与其所属的业务的业务标识相关联,不会出现因遗漏告警实例而导致告警的情况出现,提高告警的准确性。

Description

一种处理运维监控告警的方法及设备
技术领域
本发明属于计算机技术领域,尤其涉及一种处理运维监控告警的方法及设备。
背景技术
监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,起着非常重要的作用。监控系统可以对服务器、操作系统、中间件、应用进行全面的监控及报警,可以在事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。
现有技术中,常用的开源运维监控工具有Open-Falcon、Zabbix。由于Open-Falcon具有强大灵活的数据采集、人性化的告警设置、高效率的告警策略管理、高可用等特点备受青睐。然而,现有的Open-Falcon的数据模型中的告警模板的告警实例都是相互独立的,在对某业务进行日常运维(比如版本发布),需要屏蔽该业务的告警时,运维人员需要花费较多时间查找该业务的所有告警实例,并逐一做告警屏蔽,处理效率较低。
发明内容
有鉴于此,本发明实施例提供了一种处理运维监控告警的方法及设备,以解决现有技术中,需要屏蔽该业务的告警时,运维人员需要花费较多时间查找该业务的所有告警实例,并逐一做告警屏蔽,处理效率较低的问题。
本发明实施例的第一方面提供了一种处理运维监控告警的方法,包括:
获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
本发明实施例的第二方面提供了一种设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
实施本发明实施例提供的一种处理运维监控告警的方法及设备具有以下有益效果:
本发明实施例通过设置告警实例标识与业务标识之间的关联关系,在获取到用于请求屏蔽运维监控告警的请求信息时,根据告警实例标识与业务标识之间的关联关系、获取与该业务标识关联的目标告警实例标识,对目标告警实例标识对应的告警实例进行告警屏蔽处理,从而实现对某项业务的告警实例进行批量告警屏蔽处理,相对于现有技术中在不能获知各单独的告警实例所对应的业务的情况下的屏蔽告警方法,本发明中的处理告警的方法不需要人工查找某业务的告警实例并逐一屏蔽,能够节省逐一查找告警实例所消耗的时间,以提高屏蔽告警的处理效率,并且由于一项业务的所有告警实例均与其所属的业务的业务标识相关联,不会出现因遗漏告警实例而导致告警的情况出现,提高告警的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种处理运维监控告警的方法的实现流程图;
图2是本发明另一实施例提供的一种处理运维监控告警的方法的实现流程图;
图3是本发明一实施例提供的一种设备的示意图;
图4是本发明另一实施例提供的一种设备的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参见图1,图1是本发明实施例提供的一种处理运维监控告警的方法的实现流程图。本实施例中处理运维监控告警的方法的执行主体为需要进行运维监控告警的设备,该设备内安装有运维监控工具,需要进行运维监控的设备包括但不限于服务器、网络设备、终端设备,网络设备包括但不限于交换机、防火墙设备、负载均衡设备等,终端设备包括但不限于电脑。如图所示的处理运维监控告警的方法可包括:
S101:获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识。
由于对一项业务或功能模块进行升级时有可能导致告警,但这是可以预期的,这时候我们就需要按照业务类型对该业务的各功能模块的告警实例进行告警屏蔽处理。业务用于对外提供服务,业务包括但不限于车险业务、寿险业务等保险业务。
设备可以在检测到当前开启屏蔽运维监控告警的功能时,获取用于请求屏蔽运维监控告警的请求信息;也可以在检测到用户触发用于请求屏蔽运维监控告警的操作或指令时,获取用于请求屏蔽运维监控告警的请求信息。用户可以在需要对某业务做版本发布(发布某业务的新版本)或更新某业务的某功能模块的功能时,开启屏蔽运维监控告警的功能。
设备在检测到用户操控用于请求开启屏蔽运维监控告警的按键时,识别为已检测到用户触发用于请求开启屏蔽运维监控告警的操作。用于请求屏蔽运维监控告警的指令可用通过屏蔽运维监控告警的交互界面触发。
请求信息中包含待屏蔽运维监控告警的业务的业务标识为唯一标识,该业务标识可以标识业务类型或业务属性。
可选地,在S101之前,还可以包括预处理步骤A、B。
A:根据每项业务、每项所述业务包含的集群、每个所述集群包含的功能模块以及每个所述功能模块包含的告警实例构建服务树;其中,所述服务树包括三个层级,所有所述业务处于顶层,每项所述业务包含的集群处于中间层级,每个所述集群包含的功能模块处于底层。
设备可以从配置管理数据库(Configuration Management database,CMDB中获取业务标识、每个业务标识各自对应的业务所包含的集群的信息、每个集群包含的功能模块的信息以及每个功能模块包含的告警实例的信息等。
其中,设备可以根据每项业务的业务标识建立根目录,根据每个业务标识各自对应的业务所包含的集群的信息,在每项业务各自对应的根目录下建立一级子目录,一级子目录包含每项业务包含的集群的标识,从而建立业务标识与集群的标识之间的关联关系,将业务与集群关联起来。业务用于对外提供服务,集群用于支持业务,集群包括但不限于测试集群、生产集群、接入管理集群等。
设备在建立一级子目录之后,根据每个集群包含的功能模块的信息在一级子目录下建立二级子目录,二级子目录包含每个集群各自的功能模块,从而建立集群的标识与功能模块的标识之间的关联关系,将集群与功能模块关联起来。功能模块是指实现某项功能的程序模块。
设备在获取到每个功能模块包含的告警实例的信息时,将每个功能模块与各自对应的告警实例关联起来,从而得到服务树。
B:根据每项所述业务的业务标识以及每项所述业务各自对应的告警实例的标识,建立所述告警实例标识与业务标识之间的预设关联关系。
S102:根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例。
由于告警实例标识与待屏蔽运维监控告警的业务的业务标识相关联,设备可以根据待屏蔽运维监控告警的业务标识查找与该业务标识关联的告警实例标识,从而得到该业务标识对应的目标告警实例标识。
S103:对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
设备可以根据获取到的目标告警实例标识获取其对应的告警实例,并在根据该业务的维护时间在该告警实例中设置维护开始时刻以及维护结束时刻,从而使得在维护开始时刻与维护结束时刻之间的时段屏蔽告警。该业务的维护时间可以从请求信息中获取,当维护该业务属于定时任务(即对该业务进行定期维护)时,也可以根据业务标识从数据库中获取。
可以理解的是,设备在告警实例标识与业务标识之间的预设关联关系获取到与业务标识关联的所有的告警实例标识时,可以批量对所有的告警实例进行告警屏蔽处理。
可选地,在另一实施方式中,设备还可以在该业务的维护时间内,将获取到的告警实例设置为停止运维监控的状态,以使得该告警实例在该业务的维护时间内不告警。
本发明实施例,通过设置告警实例标识与业务标识之间的关联关系,在获取到用于请求屏蔽运维监控告警的请求信息时,根据告警实例标识与业务标识之间的关联关系、获取与该业务标识关联的目标告警实例标识,对目标告警实例标识对应的告警实例进行告警屏蔽处理,从而实现对某项业务的告警实例进行批量告警屏蔽处理,相对于现有技术中在不能获知各单独的告警实例所对应的业务的情况下的屏蔽告警方法,本发明中的处理告警的方法不需要人工查找某业务的告警实例并逐一屏蔽,能够节省逐一查找告警实例所消耗的时间,以提高屏蔽告警的处理效率,并且由于一项业务的所有告警实例均与其所属的业务的业务标识相关联,不会出现因遗漏告警实例而导致告警的情况出现,提高告警的准确性。
请参见图2,图2是本发明另一实施例提供的一种处理运维监控告警的方法的实现流程图。本实施例中处理运维监控告警的方法的执行主体为需要进行运维监控告警的设备,该设备内安装有运维监控工具,需要进行运维监控的设备包括但不限于服务器、网络设备、终端设备,网络设备包括但不限于交换机、防火墙设备、负载均衡设备等,终端设备包括但不限于电脑。如图所示的处理运维监控告警的方法可包括:
S201:获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识。
本实施例中S201与上一实施例中的S101相同,具体请参阅上一实施例中S101的相关描述,此处不再赘述。
可选地,在S201之前,还可以包括预处理步骤A、B。
A:根据每项业务、每项所述业务包含的集群、每个所述集群包含的功能模块以及每个所述功能模块包含的告警实例构建服务树;其中,所述服务树包括三个层级,所有所述业务处于顶层,每项所述业务包含的集群处于中间层级,每个所述集群包含的功能模块处于底层。
设备可以从配置管理数据库(Configuration Management database,CMDB中获取业务标识、每个业务标识各自对应的业务所包含的集群的信息、每个集群包含的功能模块的信息以及每个功能模块包含的告警实例的信息等。
其中,设备可以根据每项业务的业务标识建立根目录,根据每个业务标识各自对应的业务所包含的集群的信息,在每项业务各自对应的根目录下建立一级子目录,一级子目录包含每项业务包含的集群的标识,从而建立业务标识与集群的标识之间的关联关系,将业务与集群关联起来。业务用于对外提供服务,集群用于支持业务,集群包括但不限于测试集群、生产集群、接入管理集群等。
设备在建立一级子目录之后,根据每个集群包含的功能模块的信息在一级子目录下建立二级子目录,二级子目录包含每个集群各自的功能模块,从而建立集群的标识与功能模块的标识之间的关联关系,将集群与功能模块关联起来。功能模块是指实现某项功能的程序模块。
设备在获取到每个功能模块包含的告警实例的信息时,将每个功能模块与各自对应的告警实例关联起来,从而得到服务树。
B:根据每项所述业务的业务标识以及每项所述业务各自对应的告警实例的标识,建立所述告警实例标识与业务标识之间的预设关联关系。
S202:根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例。
由于告警实例标识与待屏蔽运维监控告警的业务标识相关联,设备可以根据待屏蔽运维监控告警的业务标识查找与该业务标识关联的告警实例标识,从而得到该业务标识对应的告警实例标识。
S203:对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
设备可以根据获取到的目标告警实例标识获取其对应的告警实例,并在根据该业务的维护时间在该告警实例中设置维护开始时刻以及维护结束时刻,从而使得在维护开始时刻与维护结束时刻之间的时段屏蔽告警。该业务的维护时间可以从请求信息中获取,当维护该业务属于定时任务(即对该业务进行定期维护)时,也可以根据业务标识从数据库中获取。
可以理解的是,设备在告警实例标识与业务标识之间的预设关联关系获取到与业务标识关联的所有的告警实例标识时,可以批量对所有的告警实例进行告警屏蔽处理。
可选地,在另一实施方式中,设备还可以在该业务的维护时间内,将获取到的告警实例设置为停止运维监控的状态,以使得该告警实例在该业务的维护时间内不告警。
进一步地,在一实施方式中,当设备为服务器且采用虚拟主机对业务进行运维监控时,处理运维监控告警的方法,还可以包括S204,设备在执行S201之后,执行S202或S204,虚拟主机,是在网络服务器上划分出一定的磁盘空间供用户放置站点、应用组件等,提供必要的站点功能与数据存放、传输功能。
具体地,S204:根据主机标识与业务标识之间的预设关联关系,获取与所述业务标识关联的主机标识;对所述主机标识对应的主机进行告警屏蔽处理;其中,一个主机标识对应一个虚拟主机,一个虚拟主机用于对一项业务标识对应的业务进行运维监控。
由于主机标识与待屏蔽运维监控告警的业务标识相关联,因此,设备可以根据待屏蔽运维监控告警的业务标识查找与该业务标识关联的主机标识。由于一个主机标识对应一个虚拟主机,一个虚拟主机用于对一项业务标识对应的业务进行运维监控,因此,设备可以在该业务的维护时间内,将获取到的主机标识对应的虚拟主机设置为停止运维监控的状态。
进一步地,在对目标告警实例标识对应的告警实例进行告警屏蔽处理之后,为了避免在对该项业务的告警实例解除告警屏蔽之后,该项业务的部分告警实例仍处于屏蔽状态而导致无法通过这些告警实例监控异常,在S203之后,还可以包括S205~S206。
S205:若检测到当前已解除告警屏蔽,则根据所述业务标识查找当前处于告警屏蔽状态的告警实例。
设备在检测当前时刻已到达维护结束时刻时,解除或消除告警屏蔽,将已经进行告警屏蔽处理的告警实例的状态恢复为运维监控状态。之后,设备可以根据待屏蔽运维监控告警的业务标识、业务标识与告警实例标识之间的关联关系,查找当前处于告警屏蔽状态的告警实例。处于告警屏蔽状态的告警实例无法对监测异常情况,设备即使出现该告警实例监控的异常也不会告警。
S206:若查找到当前处于告警屏蔽状态的告警实例,则对所述当前处于告警屏蔽状态的告警实例进行解除告警屏蔽处理。
设备在查找到当前处于告警屏蔽状态的告警实例时,对当前仍处于告警屏蔽状态的告警实例进行解除告警屏蔽处理,使其的工作状态从告警屏蔽状态恢复为运维监控状态。
进一步地,在S203之后,当对某项业务的告警实例进行屏蔽时,其他业务的告警实例可仍处于运维监控状态。处理运维监控告警的方法,还可以包括S207~S209。其中,S207与S201不分先后顺序执行,也可以同时执行具体如下:
S207:若检测到告警通知,则获取触发所述告警通知的目标告警实例的告警实例标识。
其中,告警通知是告警实例在运行的过程中,满足告警条件产生告警时触发系统生成的。
设备在检测到告警通知时,从该告警通知中获取触发该告警通知的告警实例的告警实例标识,并将触发该告警实例识别为目标告警实例。
设备还可以确定触发该告警通知的目标告警实例,并获取该目标告警实例的标识。
S208:根据告警实例标识与业务标识之间的预设关联关系,获取与所述目标告警实例的告警实例标识匹配的目标业务标识。
设备根据目标告警实例的告警实例标识、告警实例标识与业务标识之间的预设关联关系,查找与目标告警实例的告警实例标识匹配的目标业务标识。
S209:根据所述目标业务标识统计对应的每个目标业务的告警通知的信息。
设备可以统计每个目标业务标识各自对应的目标业务的告警通知的类型以及总数。
进一步地,在检测到告警通知时,为了准确分析异常情况,在S209之后,还可以包括:根据每个所述目标业务的告警通知的信息以及所述目标业务所属的业务类型,确定异常等级。
设备可以根据目标业务标识确定该目标业务所属的业务类型,根据业务类型确定该目标业务的重要等级,根据每个目标业务的重要等级以及每个目标业务的告警通知的类型以及告警总数,确定设备运行过程中的异常等级。其中,目标业务的重要等级越高,异常等级越高。告警通知所属类型对应的严重等级越高,异常等级越高。
本发明实施例,通过对某项业务的告警实例进行批量告警屏蔽处理,相对于现有技术中在不能获知各单独的告警实例所对应的业务的情况下的屏蔽告警方法,本发明中的处理告警的方法不需要人工查找某业务的告警实例并逐一屏蔽,能够节省逐一查找告警实例所消耗的时间,以提高屏蔽告警的处理效率,并且由于一项业务的所有告警实例均与其所属的业务的业务标识相关联,不会出现因遗漏告警实例而导致告警的情况出现,提高告警的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
请参阅图3,图3是本发明一实施例提供的一种设备的示意图,设备包括但不限于服务器、网络设备,网络设备包括但不限于交换机、防火墙设备、负载均衡设备等。设备包括的各单元用于执行图1~图2对应的实施例中的各步骤。具体请参阅图1~图2各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,设备3包括:
请求信息获取单元310,用于获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
告警实例标识获取单元320,用于根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
屏蔽单元330,用于对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
可选地,设备3还包括:
查找单元,用于在屏蔽单元330对所述目标告警实例标识对应的告警实例进行告警屏蔽处理之后,若检测到当前已解除告警屏蔽,则根据所述业务标识查找当前处于告警屏蔽状态的告警实例;
解除告警单元,用于若查找到当前处于告警屏蔽状态的告警实例,则对所述当前处于告警屏蔽状态的告警实例进行解除告警屏蔽处理。
可选地,设备3还包括:
目标告警实例标识获取单元,用于若检测到告警通知,则获取触发所述告警通知的目标告警实例的告警实例标识;
目标业务标识获取单元,用于根据告警实例标识与业务标识之间的预设关联关系,获取与所述目标告警实例的告警实例标识匹配的目标业务标识;
统计单元,用于根据所述目标业务标识统计对应的每个目标业务的告警通知的信息。
可选地,设备3还包括:
异常等级确定单元,用于根据每个所述目标业务的告警通知的信息以及所述目标业务所属的业务类型,确定异常等级。
可选地,设备3还包括:
主机标识获取单元,用于在请求信息获取单元310获取用于请求屏蔽运维监控告警的请求信息之后,根据主机标识与业务标识之间的预设关联关系,获取与所述业务标识关联的主机标识;其中,一个主机标识对应一个虚拟主机,一个虚拟主机用于对一项业务标识对应的业务进行运维监控;
屏蔽单元330还用于:对所述主机标识对应的主机进行告警屏蔽处理。
可选地,设备3还包括:
构建单元,用于据每项业务、每项所述业务包含的集群、每个所述集群包含的功能模块以及每个所述功能模块包含的告警实例构建服务树;其中,所述服务树包括三个层级,所有所述业务处于顶层,每项所述业务包含的集群处于中间层级,每个所述集群包含的功能模块处于底层;
关联单元,用于根据每项所述业务的业务标识以及每项所述业务各自对应的告警实例的标识,建立所述告警实例标识与业务标识之间的预设关联关系。
图4是本发明另一实施例提供的一种设备的示意图。如图4所示,该实施例的设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42,例如设备的控制程序。所述处理器40执行所述计算机程序42时实现上述各个设备的处理运维监控告警的方法实施例中的步骤,例如图1所示的S101至S103。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各单元的功能,例如图3所示单元310至330功能。
示例性的,所述计算机程序42可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述设备4中的执行过程。例如,所述计算机程序42可以被分割成请求信息获取单元、告警实例标识获取单元以及屏蔽单元,各单元具体功能如上所述。
所述设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是设备4的示例,并不构成对设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述设备4的内部存储单元,例如设备4的硬盘或内存。所述存储器41也可以是所述设备4的外部存储设备,例如所述设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种处理运维监控告警的方法,其特征在于,包括:
获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标告警实例标识对应的告警实例进行告警屏蔽处理之后,还包括:
若检测到当前已解除告警屏蔽,则根据所述业务标识查找当前处于告警屏蔽状态的告警实例;
若查找到当前处于告警屏蔽状态的告警实例,则对所述当前处于告警屏蔽状态的告警实例进行解除告警屏蔽处理。
3.根据权利要求1所述的方法,其特征在于,还包括:
若检测到告警通知,则获取触发所述告警通知的目标告警实例的告警实例标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述目标告警实例的告警实例标识匹配的目标业务标识;
根据所述目标业务标识统计对应的每个目标业务的告警通知的信息。
4.根据权利要求2所述的方法,其特征在于,所述根据所述目标业务标识统计对应的每个所述目标业务的告警通知的信息之后,还包括:
根据每个所述目标业务的告警通知的信息以及所述目标业务所属的业务类型,确定异常等级。
5.根据权利要求1所述的方法,其特征在于,所述获取用于请求屏蔽运维监控告警的请求信息之后,还包括:
根据主机标识与业务标识之间的预设关联关系,获取与所述业务标识关联的主机标识;其中,一个主机标识对应一个虚拟主机,一个虚拟主机用于对一项业务标识对应的业务进行运维监控;
对所述主机标识对应的主机进行告警屏蔽处理。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述获取用于请求屏蔽运维监控告警的请求信息之前,还包括:
根据每项业务、每项所述业务包含的集群、每个所述集群包含的功能模块以及每个所述功能模块包含的告警实例构建服务树;其中,所述服务树包括三个层级,所有所述业务处于顶层,每项所述业务包含的集群处于中间层级,每个所述集群包含的功能模块处于底层;
根据每项所述业务的业务标识以及每项所述业务各自对应的告警实例的标识,建立所述告警实例标识与业务标识之间的预设关联关系。
7.一种设备,其特征在于,所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取用于请求屏蔽运维监控告警的请求信息;其中,所述请求信息中包含待屏蔽运维监控告警的业务的业务标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述业务标识关联的目标告警实例标识;其中,一个业务标识关联至少两个告警实例标识,所述告警实例标识对应有告警实例;
对所述目标告警实例标识对应的告警实例进行告警屏蔽处理。
8.根据权利要求7所述的设备,其特征在于,所述对所述目标告警实例标识对应的告警实例进行告警屏蔽处理之后,所述处理器执行所述计算机程序时还实现如下步骤:
若检测到告警通知,则获取触发所述告警通知的目标告警实例的告警实例标识;
根据告警实例标识与业务标识之间的预设关联关系,获取与所述目标告警实例的告警实例标识匹配的目标业务标识;
根据所述目标业务标识统计对应的每个目标业务的告警通知的信息。
9.根据权利要求7所述的设备,其特征在于,所述获取用于请求屏蔽运维监控告警的请求信息之后,所述处理器执行所述计算机程序时还实现如下步骤:
根据主机标识与业务标识之间的预设关联关系,获取与所述业务标识关联的主机标识;其中,一个主机标识对应一个虚拟主机,一个虚拟主机用于对一项业务标识对应的业务进行运维监控;
对所述主机标识对应的主机进行告警屏蔽处理。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。
CN201810864824.1A 2018-08-01 2018-08-01 一种处理运维监控告警的方法及设备 Active CN109039740B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810864824.1A CN109039740B (zh) 2018-08-01 2018-08-01 一种处理运维监控告警的方法及设备
PCT/CN2018/105104 WO2020024376A1 (zh) 2018-08-01 2018-09-11 一种处理运维监控告警的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810864824.1A CN109039740B (zh) 2018-08-01 2018-08-01 一种处理运维监控告警的方法及设备

Publications (2)

Publication Number Publication Date
CN109039740A true CN109039740A (zh) 2018-12-18
CN109039740B CN109039740B (zh) 2022-07-19

Family

ID=64648368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810864824.1A Active CN109039740B (zh) 2018-08-01 2018-08-01 一种处理运维监控告警的方法及设备

Country Status (2)

Country Link
CN (1) CN109039740B (zh)
WO (1) WO2020024376A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871305A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 告警信息的处理方法、装置、计算机设备及存储介质
CN110855473A (zh) * 2019-10-16 2020-02-28 平安科技(深圳)有限公司 一种监控方法、装置、服务器及存储介质
CN110888949A (zh) * 2019-10-15 2020-03-17 平安科技(深圳)有限公司 基于三维地图的设备告警屏蔽方法、装置、设备及介质
CN111352795A (zh) * 2018-12-24 2020-06-30 中移动信息技术有限公司 一种移动业务的监控方法及装置
CN111400435A (zh) * 2020-02-19 2020-07-10 中国平安人寿保险股份有限公司 邮件告警收敛方法、装置、计算机设备及存储介质
CN111782437A (zh) * 2020-07-10 2020-10-16 中国工商银行股份有限公司 故障定位方法、装置、计算设备和介质
CN112579397A (zh) * 2020-12-25 2021-03-30 京东数字科技控股股份有限公司 服务上线自检方法、装置、设备及存储介质
CN113051134A (zh) * 2021-04-20 2021-06-29 中国工商银行股份有限公司 一种应用系统监控管理方法、装置、设备及存储介质
CN113472565A (zh) * 2021-06-03 2021-10-01 北京闲徕互娱网络科技有限公司 服务器功能的扩容方法、装置、设备和计算机可读介质
CN114202354A (zh) * 2021-11-17 2022-03-18 苏州浪潮智能科技有限公司 一种虚拟化产品告警屏蔽方法、装置、设备和介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113765687B (zh) * 2020-06-05 2023-08-01 网联清算有限公司 服务器的故障报警方法、装置、设备及存储介质
CN112486755A (zh) * 2020-12-11 2021-03-12 北京金山云网络技术有限公司 一种服务器检测方法、检测装置、电子设备及存储介质
CN114338350A (zh) * 2021-12-30 2022-04-12 北京汇通天下物联科技有限公司 一种告警方法、装置、电子设备及计算机存储介质
CN115190045B (zh) * 2022-07-06 2024-04-09 南京云柜网络科技有限公司 快递柜系统服务的监控方法、装置、电子设备及存储介质
CN114944980B (zh) * 2022-07-26 2022-10-21 上海有孚智数云创数字科技有限公司 用于监控告警的系统方法、设备和介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101009004A (zh) * 2007-01-29 2007-08-01 华为技术有限公司 告警装置及告警方法
US20070283012A1 (en) * 2006-06-01 2007-12-06 Christopher Chu Alarm-driven access control in an enterprise network
CN101296466A (zh) * 2008-06-12 2008-10-29 广东高新兴通信股份有限公司 一种对基站产生告警的屏蔽方法
CN101610185A (zh) * 2009-06-23 2009-12-23 中兴通讯股份有限公司 告警屏蔽数据的压缩方法及压缩装置
CN101778017A (zh) * 2010-01-05 2010-07-14 中国工商银行股份有限公司 一种大型机联机交易的故障事件处理方法及服务器
CN102111788A (zh) * 2009-12-29 2011-06-29 中兴通讯股份有限公司 一种告警处理方法及告警管理系统
CN102694671A (zh) * 2011-03-23 2012-09-26 中兴通讯股份有限公司 一种实现故障告警的方法及装置
US20130176858A1 (en) * 2010-09-30 2013-07-11 Telefonaktiebolaget L M Ericsson (Publ) Method for Determining a Severity of a Network Incident
CN103491555A (zh) * 2012-06-13 2014-01-01 中国移动通信集团湖南有限公司 一种基于业务信息定位ip链路故障的方法、设备和系统
CN105373460A (zh) * 2014-08-14 2016-03-02 腾讯科技(深圳)有限公司 监控消息的告警方法和系统
CN106452846A (zh) * 2016-09-22 2017-02-22 华为技术有限公司 故障处理方法、虚拟架构管理系统和业务管理系统
CN107196804A (zh) * 2017-06-01 2017-09-22 国网山东省电力公司信息通信公司 电力系统终端通信接入网告警集中监控系统及方法
CN107769954A (zh) * 2016-08-23 2018-03-06 南京中兴软件有限责任公司 设备告警的屏蔽方法和装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070283012A1 (en) * 2006-06-01 2007-12-06 Christopher Chu Alarm-driven access control in an enterprise network
CN101009004A (zh) * 2007-01-29 2007-08-01 华为技术有限公司 告警装置及告警方法
CN101296466A (zh) * 2008-06-12 2008-10-29 广东高新兴通信股份有限公司 一种对基站产生告警的屏蔽方法
CN101610185A (zh) * 2009-06-23 2009-12-23 中兴通讯股份有限公司 告警屏蔽数据的压缩方法及压缩装置
CN102111788A (zh) * 2009-12-29 2011-06-29 中兴通讯股份有限公司 一种告警处理方法及告警管理系统
CN101778017A (zh) * 2010-01-05 2010-07-14 中国工商银行股份有限公司 一种大型机联机交易的故障事件处理方法及服务器
US20130176858A1 (en) * 2010-09-30 2013-07-11 Telefonaktiebolaget L M Ericsson (Publ) Method for Determining a Severity of a Network Incident
CN102694671A (zh) * 2011-03-23 2012-09-26 中兴通讯股份有限公司 一种实现故障告警的方法及装置
CN103491555A (zh) * 2012-06-13 2014-01-01 中国移动通信集团湖南有限公司 一种基于业务信息定位ip链路故障的方法、设备和系统
CN105373460A (zh) * 2014-08-14 2016-03-02 腾讯科技(深圳)有限公司 监控消息的告警方法和系统
CN107769954A (zh) * 2016-08-23 2018-03-06 南京中兴软件有限责任公司 设备告警的屏蔽方法和装置
CN106452846A (zh) * 2016-09-22 2017-02-22 华为技术有限公司 故障处理方法、虚拟架构管理系统和业务管理系统
CN107196804A (zh) * 2017-06-01 2017-09-22 国网山东省电力公司信息通信公司 电力系统终端通信接入网告警集中监控系统及方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111352795A (zh) * 2018-12-24 2020-06-30 中移动信息技术有限公司 一种移动业务的监控方法及装置
CN109871305B (zh) * 2019-01-18 2022-11-04 深圳壹账通智能科技有限公司 告警信息的处理方法、装置、计算机设备及存储介质
CN109871305A (zh) * 2019-01-18 2019-06-11 深圳壹账通智能科技有限公司 告警信息的处理方法、装置、计算机设备及存储介质
CN110888949A (zh) * 2019-10-15 2020-03-17 平安科技(深圳)有限公司 基于三维地图的设备告警屏蔽方法、装置、设备及介质
CN110888949B (zh) * 2019-10-15 2023-12-15 平安科技(深圳)有限公司 基于三维地图的设备告警屏蔽方法、装置、设备及介质
CN110855473A (zh) * 2019-10-16 2020-02-28 平安科技(深圳)有限公司 一种监控方法、装置、服务器及存储介质
WO2021073433A1 (zh) * 2019-10-16 2021-04-22 平安科技(深圳)有限公司 一种监控方法、装置、服务器及存储介质
CN111400435A (zh) * 2020-02-19 2020-07-10 中国平安人寿保险股份有限公司 邮件告警收敛方法、装置、计算机设备及存储介质
CN111400435B (zh) * 2020-02-19 2024-04-12 中国平安人寿保险股份有限公司 邮件告警收敛方法、装置、计算机设备及存储介质
CN111782437A (zh) * 2020-07-10 2020-10-16 中国工商银行股份有限公司 故障定位方法、装置、计算设备和介质
CN111782437B (zh) * 2020-07-10 2023-08-11 中国工商银行股份有限公司 故障定位方法、装置、计算设备和介质
CN112579397A (zh) * 2020-12-25 2021-03-30 京东数字科技控股股份有限公司 服务上线自检方法、装置、设备及存储介质
CN113051134A (zh) * 2021-04-20 2021-06-29 中国工商银行股份有限公司 一种应用系统监控管理方法、装置、设备及存储介质
CN113472565A (zh) * 2021-06-03 2021-10-01 北京闲徕互娱网络科技有限公司 服务器功能的扩容方法、装置、设备和计算机可读介质
CN114202354A (zh) * 2021-11-17 2022-03-18 苏州浪潮智能科技有限公司 一种虚拟化产品告警屏蔽方法、装置、设备和介质

Also Published As

Publication number Publication date
WO2020024376A1 (zh) 2020-02-06
CN109039740B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
CN109039740A (zh) 一种处理运维监控告警的方法及设备
CN109947079A (zh) 基于边缘计算的区域异常检测方法和边缘计算设备
CN110321371A (zh) 日志数据异常检测方法、装置、终端及介质
CN108512689A (zh) 微服务业务监控方法及服务器
CN111163115A (zh) 一种基于双引擎的物联网安全监测方法及系统
CN110351150A (zh) 故障根源确定方法及装置、电子设备和可读存储介质
CN108039959A (zh) 一种数据的态势感知方法、系统及相关装置
WO2020192677A1 (zh) 基于数据中心运维的知识库信息感知方法及系统
CN110163473A (zh) 一种任务进度的监控方法及设备
CN109240876A (zh) 实例监控方法、计算机可读存储介质和终端设备
CN107733712A (zh) 云计算系统中服务资源的监控方法和装置
CN112738040A (zh) 一种基于dns日志的网络安全威胁检测方法、系统及装置
CN110147657A (zh) 一种用户权限配置方法及装置
CN103186603A (zh) 确定sql语句对关键业务的性能的影响的方法、系统和设备
CN111813497A (zh) 一种容器环境异常检测的方法、装置、介质及计算机设备
CN110708316A (zh) 针对企业网络安全运营管理的方法以及系统架构
CN109359037A (zh) 一种公用设备的管理方法、存储介质和服务器
CN114881808A (zh) 基于大数据的电力窃电精准识别方法及防窃电系统
CN111754123A (zh) 数据监控方法、装置、计算机设备及存储介质
CN112817814A (zh) 异常监控方法、系统、存储介质及电子装置
CN205983134U (zh) 一种服务器运行状态监控系统
CN113949652B (zh) 基于人工智能的用户异常行为检测方法、装置及相关设备
CN112181786B (zh) 一种巡检应用的配置方法、装置及设备
CN116737818B (zh) Druid数据库连接池的连接泄漏检测方法及系统
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant