CN111930587B - 告警消息处理方法、装置、存储介质及电子设备 - Google Patents

告警消息处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111930587B
CN111930587B CN202010588054.XA CN202010588054A CN111930587B CN 111930587 B CN111930587 B CN 111930587B CN 202010588054 A CN202010588054 A CN 202010588054A CN 111930587 B CN111930587 B CN 111930587B
Authority
CN
China
Prior art keywords
host
alarm
message
alarm message
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010588054.XA
Other languages
English (en)
Other versions
CN111930587A (zh
Inventor
石鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dami Technology Co Ltd
Original Assignee
Beijing Dami Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dami Technology Co Ltd filed Critical Beijing Dami Technology Co Ltd
Priority to CN202010588054.XA priority Critical patent/CN111930587B/zh
Publication of CN111930587A publication Critical patent/CN111930587A/zh
Application granted granted Critical
Publication of CN111930587B publication Critical patent/CN111930587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Alarm Systems (AREA)

Abstract

本申请实施例公开了一种告警消息处理方法、装置、存储介质及电子设备,属于计算机技术领域。方法包括:第一主机拉取第一消息队列中的第一告警消息,第一主机将第一告警消息发送给第二主机,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。通过此种方式降低了在双机房双活模式乃至多机房多活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。

Description

告警消息处理方法、装置、存储介质及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种告警消息处理方法、装置、存储介质及电子设备。
背景技术
多个数据中心可以提供更安全的系统服务。以双数据中心为例,双数据中心是同时对外提供业务生产服务的双活模式,两个数据中心是对等的、不分主从、并可同时部署业务,可极大的提高资源的利用率和系统的工作效率、性能。互联网中的网站或应用服务器也会采用双机房双活模式/多机房多活模式等提供业务服务和/或部署告警服务,在相关技术中,可将告警消息发送到多个机房:以其中一个机房为主机房发送告警消息,另一机房与主机房相互监控;但在主机房发生故障时,需要先关闭主机房的控制开关,再打开另一机房的控制开关,并将告警消息发送到另一机房进行处理,增加了对告警消息处理的复杂性和风险性,也容易将网络故障等原因误判为机房故障。
发明内容
本申请实施例提供了一种告警消息处理方法、装置、存储介质及电子设备,可以解决在相关技术中在双机房乃至多机房多活模式下部署告警服务存在复杂度高和风险性高,以及机房故障误判的问题。所述技术方案如下:
第一方面,本申请实施例提供了一种告警消息处理方法,所述方法包括:
第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
所述第一主机将所述第一告警消息发送给所述第二主机;
在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或,在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出。
第二方面,本申请实施例提供了一种告警消息处理方法,所述方法包括:
第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
所述第二主机将所述第二告警消息发送给所述第一主机;
在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或,在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出。
第三方面,本申请实施例提供了一种告警消息处理装置,所述告警消息处理装置包括:
第一处理模块,用于第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
发送模块,用于所述第一主机将所述第一告警消息发送给所述第二主机;
第二处理模块,用于在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块,用于在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出。
第四方面,本申请实施例提供了一种告警消息处理装置,所述告警消息处理装置包括:
第一处理模块,用于第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
发送模块,用于所述第二主机将所述第二告警消息发送给所述第一主机;
第二处理模块,用于在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块,用于在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出。
第五方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
第六方面,本申请实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
本申请一些实施例提供的技术方案带来的有益效果至少包括:
本申请实施例的方案在执行时,第一主机拉取第一消息队列中的第一告警消息,第一主机将第一告警消息发送给第二主机,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。通过此种方式降低了在双机房双活模式乃至多机房多活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种系统架构图;
图2是本申请实施例提供的告警消息处理方法的流程示意图;
图3是本申请实施例提供的告警消息处理方法的另一流程示意图;
图4是本申请实施例提供的告警消息处理方法的交互示意图;
图5是本申请实施例提供的告警消息处理方法的流程示意图;
图6是本申请实施例提供的告警消息处理方法的另一流程示意图;
图7是本申请实施例提供的告警消息处理方法的交互示意图;
图8是本申请实施例提供的一种装置的结构示意图;
图9是本申请实施例提供的一种装置的结构示意图;
图10是本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
请参见图1,其示出了本申请实施例提供的一种告警消息处理系统架构100示意图,包括监控设备101和多个机房(第一机房102、第二机房103、……),适用于多个机房的告警消息处理,在本申请中以双机房(第一机房102和第二机房103)的告警消息处理为例进行说明。
监控设备101是指对机房所有的设备及环境进行集中监控和管理的设备,其监控对象构成机房的各个子系统:动力系统、环境系统、消防系统、保安系统、网络系统等。机房监控系统基于网络综合布线系统,采用集散监控,在机房监视室放置监控主机,运行监控软件,以统一的界面对各个子系统集中监控。机房监控系统实时监视各系统设备的运行状态及工作参数,发现部件故障或参数异常,即时采取多媒体动画、语音、电话、短消息等多种报警方式,记录历史数据和报警事件,提供智能专家诊断建议和远程监控管理功能以及WEB浏览等。尤其是对网络系统的监控,通常利用路由器远程监控模块通过TCP/IP网络接入到路由器,采样SNMP协议对路由器工作状态与运行参数进行实时监测,并能远程修改设置参数、控制路由器即故障告警;或是利用交换机远程监控模块通过TCP/IP网络接入到交换机,采用SNMP协议对交换机工作状态与运行参数进行实时监测,并能远程修改设置参数、控制交换机及故障告警。
第一机房102和第二机房103均是互联网数据中心(Internet Data Center,IDC),第一机房102和第二机房103均存放有多种服务器和小型机,如:IBM小型机,HP小型机,SUN小型机等,机房的温度和湿度以及防静电措施都有严格的要求,机房里的多种服务器会运行和/或处理多种业务,如:彩信、短消息、通话等业务;第一机房102和与第二机房103可进行相互监控。IDC在网络中的位置和总的网络带宽容量,它构成了网络基础资源的一部分,如同骨干网、接入网,它提供了一种高端的数据传输(Data Delivery)的服务,也即提供高速接入的服务。IDC不仅是数据存储的中心,而且是数据流通的中心,它出现在互联网中数据交换最集中的地方。从某种意义上说,它是由ISP的服务器托管机房演变而来的。
监控设备101能对第一机房102和第二机房103进行实时监控,并将通过第一机房102和第二机房103组成的双机房双活模式部署告警业务,如:第一主机拉取第一消息队列中的第一告警消息,第一主机将第一告警消息发送给第二主机,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。和/或
第二主机拉取第二消息队列中的第二告警消息,第二主机将第二告警消息发送给第一主机,判断第二告警消息携带的主机标识和第二主机的主机标识是否相同,在第二告警消息携带的主机标识和第二主机的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识和第二主机的主机标识相同时,进行告警事件输出。(第一机房102对应第一主机,第二机房103对应第二主机)
应该理解,图1中的监控设备、第一机房和第二机房的数目仅仅是示意性的。根据实现需要,可以具有任意数目的监控设备、第一机房和第二机房。
请参见图2,为本申请实施例提供了一种告警消息处理方法的流程示意图。如图2所示,本申请提供的告警消息处理方法适用于多个机房的告警消息处理,在本申请实施例中以双机房(第一机房和第二机房)的告警消息处理为例进行说明。本申请实施例的所述方法可以包括以下步骤:
S201,第一主机拉取第一消息队列中的第一告警消息。
其中,第一主机与第一机房对应,包含多个服务器,能完成业务服务和/或告警服务的设备。第一告警消息是指第一机房的MQ消息,也即机房中消息队列中的告警消息。第一消息队列是指将需要传输的数据放到先进先出的队列中,将数据放入第一消息队列里称为生产者,从第一消息队列里取消息称为消费者;监控设备发送的第一原始告警消息经过添加与第一主机对应机房的标识后写入第一消息队列,第一告警消息是经过消息队列先进先出处理后,从该第一消息队列中取出的告警消息。
一般的,在第一主机拉取第一消息队列中的第一告警消息之前,第一主机接收来自监控设备的第一原始告警消息,将第一主机的主机标识添加到第一原始告警消息中,将添加标识后的第一原始告警消息写入第一消息队列,添加标识后的第一原始告警消息与第一告警消息对应。在双机房双活模式下监控设备会发送多个告警消息到双机房中,并会将多个告警消息按照一定比例进行分配给两个机房进行处理,如:将60%的告警消息发送给第一机房,将40%的告警消息发送给第二机房;并且,发送到各自机房的告警消息会根据各自机房的标识标注上各自对应的主机标识,如:发送给第一机房的60%告警消息会标注上第一机房的主机标识,发送给第二机房的40%告警消息会标注上第二机房的主机标识;主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
S202,第一主机将第一告警消息发送给第二主机。
一般的,在双机房双活模式下,第一主机中的应用服务器会同时消费第一主机的第一消息队列的告警消息,也会消费第二主机的第二消息队列的告警消息,使第一主机的应用服务器能够消费并处理由告警设备发送的全量告警请求,在经过第一主机处理后得到处理结果,并将处理结果存储到MySQL、HBase,、Redis等数据库和缓存中。在双机房双活模式下其中一机房出现故障时,监控设备会向该故障机房发送的告警请求,在超过预设时长后未收到对应的响应消息,则可判定向该故障机房发送告警请求失败,此时,会将该告警请求发送到另一机房中,使监控设备的告警请求能成功写入到消息队列中。
S203,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S204,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第一主机对第一告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第一机房的原始告警消息为第一原始告警消息,会对该第一原始告警消息加上第一主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第二机房发送的且带有第二主机的主机标识的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S205,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第一机房的原始告警消息为第一原始告警消息,会对该第一原始告警消息加上第一主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第二机房发送的且带有第二主机的主机标识的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
同时,第一主机也会接收来自所述第二主机的第二告警消息,第二告警消息携带主机标识,在第二告警消息携带的主机标识与第一主机的主机标识不相同时,禁止进行告警事件输出,即不输出告警事件;在第二告警消息携带的主机标识与第一主机的主机标识相同时,进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
本申请实施例的方案在执行时,第一主机拉取第一消息队列中的第一告警消息,第一主机将第一告警消息发送给第二主机,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。通过此种方式降低了在双机房双活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。
请参见图3,为本申请实施例提供了一种告警消息处理方法的流程示意图,本申请提供的告警消息处理方法适用于多个机房的告警消息处理,在本申请实施例中以双机房(第一机房和第二机房)的告警消息处理为例进行说明。该告警消息处理方法可以包括以下步骤:
S301,第一主机接收来自监控设备的第一原始告警消息。
其中,第一主机与第一机房对应,包含多个服务器,能完成业务服务和/或告警服务的设备。第一原始告警消息是指由监控设备(客户端)发送的告警请求消息,监控设备可能会向双机房双活模式下的两个机房同时发送多个告警请求消息,且是以一定的比例分配给两个机房,分给第一机房的告警请求消息为第一原始告警消息。
S302,将第一主机的主机标识添加到第一原始告警消息中。
其中,主机标识主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
一般的,在监控设备按照一定比例将告警请求消息分配给第一主机后,将所分配的告警请求消息添加上第一主机的主机标识,再将添加标识后的告警请求消息写入MQ消息队列中,使第一主机的应用服务器只对具有第一主机标识的告警消息进行告警事件输入。
S303,将添加标识后的第一原始告警消息写入第一消息队列。
其中,第一消息队列是指将需要传输的数据放到先进先出的队列中,将数据放入第一消息队列里称为生产者,从第一消息队列里取消息称为消费者;监控设备发送的第一原始告警消息经过添加与第一主机对应机房的标识后写入第一消息队列,第一告警消息是经过消息队列先进先出处理后,从该第一消息队列中取出的告警消息,也即添加标识后的第一原始告警消息经过第一消息队列处理后得到告警消息。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中。
S304,第一主机拉取第一消息队列中的第一告警消息。
其中,第一告警消息是指第一机房的MQ消息,也即机房中消息队列中的告警消息,第一告警消息是经过消息队列先进先出处理后,从该第一消息队列中取出的告警消息,也即添加标识后的第一原始告警消息经过第一消息队列处理后得到告警消息。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中;AWS机房的应用服务器会拉取经过AWS机房的消息队列处理后的第一告警消息,也会接收到阿里机房发送的且经过阿里机房的消息队列处理后的第二告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定AWS机房是否输出告警事件;阿里机房的应用服务器会拉取经过阿里机房的消息队列处理后的第二告警消息,也会接收到AWS机房发送的且经过AWS机房的消息队列处理后的第一告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定阿里机房是否输出告警事件。
S305,第一主机将第一告警消息发送给第二主机。
一般的,为使双机房双活模式下的两个机房均能处理由监控设备发送的全量请求,第一主机需要将经过第一主机的消息队列处理后的第一告警消息也发送给第二主机的服务器,使第二主机也能对分配给第一主机的告警请求进行处理;相同地,第二主机需要将经过第二主机的消息队列处理后的第二告警消息也发送给第一主机的服务器,使第一主机也能对分配给第二主机的告警请求进行处理。
S306,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S307,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第一主机对第一告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第一机房的原始告警消息为第一原始告警消息,会对该第一原始告警消息加上第一主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第二机房发送的且带有第二主机的主机标识的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S308,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第一机房的原始告警消息为第一原始告警消息,会对该第一原始告警消息加上第一主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第二机房发送的且带有第二主机的主机标识的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
S309,第一主机接收来自第二主机的第二告警消息。
其中,第二告警消息是指第二机房的MQ消息,也即机房中消息队列中的告警消息,第二告警消息是经过消息队列先进先出处理后,从该第二消息队列中取出的告警消息,也即添加标识后的第二原始告警消息经过第二消息队列处理后得到告警消息。
S310,判断第二告警消息携带的主机标识和第一主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S311,在第二告警消息携带的主机标识与第一主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第一主机对第二告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在第一主机处理告警消息过程中也会接收并处理由第二机房发送的,带有第二主机的主机标识的且经过第二主机的消息队列处理后的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S312,在第二告警消息携带的主机标识与第一主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在第一主机处理告警消息过程中也会接收并处理由第二机房发送的,带有第二主机的主机标识的且经过第二主机的消息队列处理后的第二告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第一主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中。AWS机房的应用服务器会拉取经过AWS机房的消息队列处理后的第一告警消息,也会接收到阿里机房发送的且经过阿里机房的消息队列处理后的第二告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定AWS机房是否输出告警事件:分析第一告警消息和第二告警消息各自携带的主机标识,分别判断第一告警消息携带的主机标识和第二告警消息携带的主机标识与AWS主机的主机标识是否相同;若相同,则AWS机房进行告警事件输出;若不相同,则AWS机房禁止告警事件输出。阿里机房的应用服务器会拉取经过阿里机房的消息队列处理后的第二告警消息,也会接收到AWS机房发送的且经过AWS机房的消息队列处理后的第一告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定阿里机房是否输出告警事件:分析第一告警消息和第二告警消息各自携带的主机标识,分别判断第一告警消息携带的主机标识和第二告警消息携带的主机标识与阿里主机的主机标识是否相同;若相同,则阿里机房进行告警事件输出;若不相同,则阿里机房禁止告警事件输出。
本申请实施例中告警消息处理交互关系可参见图4,监控设备401、第一主机402、第二主机403,第一主机402接收来自监控设备401的第一原始告警消息,将第一主机402的主机标识添加到第一原始告警消息中,将添加标识后的第一原始告警消息写入第一消息队列,第一主机402拉取第一消息队列中的第一告警消息,第一主机402将第一告警消息发送给第二主机403,判断第一告警消息携带的主机标识和第一主机402的主机标识是否相同,在第一告警消息携带的主机标识和第一主机402的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机402的主机标识相同时,进行告警事件输出,第一主机402接收来自第二主机403的第二告警消息,判断第二告警消息携带的主机标识和第一主机402的主机标识是否相同,在第二告警消息携带的主机标识与第一主机402的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识与第一主机402的主机标识相同时,进行告警事件输出。
本申请实施例的方案在执行时,第一主机接收来自监控设备的第一原始告警消息,将第一主机的主机标识添加到第一原始告警消息中,将添加标识后的第一原始告警消息写入第一消息队列,第一主机拉取第一消息队列中的第一告警消息,第一主机将第一告警消息发送给第二主机,判断第一告警消息携带的主机标识和第一主机的主机标识是否相同,在第一告警消息携带的主机标识和第一主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识和第一主机的主机标识相同时,进行告警事件输出,第一主机接收来自第二主机的第二告警消息,判断第二告警消息携带的主机标识和第一主机的主机标识是否相同,在第二告警消息携带的主机标识与第一主机的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识与第一主机的主机标识相同时,进行告警事件输出。通过此种方式可实现对双机房进行监控,提高双机房双活模式乃至多机房多活模式下的告警消息处理效率,降低了在双机房双活模式乃至多机房多活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。
请参见图5,为本申请实施例提供了一种告警消息处理方法的流程示意图。本申请提供的告警消息处理方法适用于多个机房的告警消息处理,在本申请实施例中以双机房(第一机房和第二机房)的告警消息处理为例进行说明。如图5所示,本申请实施例的所述方法可以包括以下步骤:
S501,第二主机拉取第二消息队列中的第二告警消息。
其中,第二主机与第二机房对应,包含多个服务器,能完成业务服务和/或告警服务的设备。第二告警消息是指第二机房的MQ消息,也即机房中消息队列中的告警消息。第二消息队列是指将需要传输的数据放到先进先出的队列中,将数据放入第二消息队列里称为生产者,从第二消息队列里取消息称为消费者;监控设备发送的第二原始告警消息经过添加与第二主机对应机房的标识后写入第二消息队列,第二告警消息是经过消息队列先进先出处理后,从该第二消息队列中取出的告警消息。
一般的,在第二主机拉取第二消息队列中的第二告警消息之前,第二主机接收来自监控设备的第二原始告警消息,将第二主机的主机标识添加到第二原始告警消息中,将添加标识后的第二原始告警消息写入第二消息队列,添加标识后的第二原始告警消息与第二告警消息对应。在双机房双活模式下监控设备会发送多个告警消息到双机房中,并会将多个告警消息按照一定比例进行分配给两个机房进行处理,如:将60%的告警消息发送给第一机房,将40%的告警消息发送给第二机房;并且,发送到各自机房的告警消息会根据各自机房的标识标注上各自对应的主机标识,如:发送给第一机房的60%告警消息会标注上第一机房的主机标识,发送给第二机房的40%告警消息会标注上第二机房的主机标识;主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
S502,第二主机将第二告警消息发送给第一主机。
一般的,在双机房双活模式下,第二主机中的应用服务器会同时消费第二主机的第二消息队列的告警消息,也会消费第一主机的第一消息队列的告警消息,使第二主机的应用服务器能够消费并处理由告警设备发送的全量告警请求,在经过第二主机处理后得到处理结果,并将处理结果存储到MySQL、HBase,、Redis等数据库和缓存中。在双机房双活模式下其中一机房出现故障时,监控设备会向该故障机房发送的告警请求,在超过预设时长后未收到对应的响应消息,则可判定向该故障机房发送告警请求失败,此时,会将该告警请求发送到另一机房中,使监控设备的告警请求能成功写入到消息队列中。
S503,判断第二告警消息携带的主机标识和第二主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S504,在第二告警消息携带的主机标识和第二主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第二主机对第二告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第一机房发送的且带有第一主机的主机标识的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S505,在第二告警消息携带的主机标识和第二主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第一机房发送的且带有第一主机的主机标识的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
同时,第二主机也会接收来自第一主机的第一告警消息,第一告警消息携带主机标识,在第一告警消息携带的主机标识与第二主机的主机标识不相同时,禁止进行告警事件输出,即不输出告警事件;在第一告警消息携带的主机标识与第二主机的主机标识相同时,进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
本申请实施例的方案在执行时,第二主机拉取第二消息队列中的第二告警消息,第二主机将第二告警消息发送给第一主机,判断第二告警消息携带的主机标识和第二主机的主机标识是否相同,在第二告警消息携带的主机标识和第二主机的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识和第二主机的主机标识相同时,进行告警事件输出。通过此种方式降低了在双机房双活模式乃至多机房多活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。
请参见图6,为本申请实施例提供了一种告警消息处理方法的流程示意图,本申请提供的告警消息处理方法适用于多个机房的告警消息处理,在本申请实施例中以双机房(第一机房和第二机房)的告警消息处理为例进行说明。该告警消息处理方法可以包括以下步骤:
S601,第二主机接收来自监控设备的第二原始告警消息。
其中,第二主机与第二机房对应,包含多个服务器,能完成业务服务和/或告警服务的设备。第二原始告警消息是指由监控设备(客户端)发送的告警请求消息,监控设备可能会向双机房双活模式下的两个机房同时发送多个告警请求消息,且是以一定的比例分配给两个机房,分给第二机房的告警请求消息为第二原始告警消息。
S602,将第二主机的主机标识添加到第二原始告警消息中。
其中,主机标识主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
一般的,在监控设备按照一定比例将告警请求消息分配给第二主机后,将所分配的告警请求消息添加上第二主机的主机标识,再将添加标识后的告警请求消息写入MQ消息队列中,使第二主机的应用服务器只对具有第二主机标识的告警消息进行告警事件输入。
S603,将添加标识后的第二原始告警消息写入第二消息队列。
其中,第二消息队列是指将需要传输的数据放到先进先出的队列中,将数据放入第二消息队列里称为生产者,从第二消息队列里取消息称为消费者;监控设备发送的第二原始告警消息经过添加与第二主机对应机房的标识后写入第二消息队列,第二告警消息是经过消息队列先进先出处理后,从该第二消息队列中取出的告警消息,也即添加标识后的第二原始告警消息经过第二消息队列处理后得到告警消息。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中。
S604,第二主机拉取第二消息队列中的第二告警消息。
其中,第二告警消息是指第二机房的MQ消息,也即机房中消息队列中的告警消息,第二告警消息是经过消息队列先进先出处理后,从该第二消息队列中取出的告警消息,也即添加标识后的第二原始告警消息经过第二消息队列处理后得到告警消息。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中;AWS机房的应用服务器会拉取经过AWS机房的消息队列处理后的第一告警消息,也会接收到阿里机房发送的且经过阿里机房的消息队列处理后的第二告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定AWS机房是否输出告警事件;阿里机房的应用服务器会拉取经过阿里机房的消息队列处理后的第二告警消息,也会接收到AWS机房发送的且经过AWS机房的消息队列处理后的第一告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定阿里机房是否输出告警事件。
S605,第二主机将第二告警消息发送给第一主机。
一般的,为使双机房双活模式下的两个机房均能处理由监控设备发送的全量请求,第二主机需要将经过第二主机的消息队列处理后的第二告警消息也发送给第一主机的服务器,使第一主机也能对分配给第二主机的告警请求进行处理;相同地,第一主机需要将经过第一主机的消息队列处理后的第一告警消息也发送给第二主机的服务器,使第二主机也能对分配给第一主机的告警请求进行处理。
S606,判断第二告警消息携带的主机标识和第二主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S607,在第二告警消息携带的主机标识和第二主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第二主机对第二告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第一机房发送的且带有第一主机的主机标识的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S608,在第二告警消息携带的主机标识和第二主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在处理过程中也会接收并处理由第一机房发送的且带有第一主机的主机标识的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
S609,第二主机接收来自第一主机的第一告警消息。
其中,第一告警消息是指第一机房的MQ消息,也即机房中消息队列中的告警消息,第一告警消息是经过消息队列先进先出处理后,从该第一消息队列中取出的告警消息,也即添加标识后的第一原始告警消息经过第一消息队列处理后得到告警消息。
S610,判断第一告警消息携带的主机标识和第二主机的主机标识是否相同。
其中,主机标识包括主机的域名、IP地址和MAC地址中的一种或多种,也即网络中特定的计算机号码,主机不同对应的主机标识也不同。
S611,在第一告警消息携带的主机标识与第二主机的主机标识不相同时,禁止进行告警事件输出。
其中,告警事件是指第二主机对第一告警消息进行处理后得到的处理结果。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在第二主机处理告警消息过程中也会接收并处理由第一机房发送的,带有第一主机的主机标识的且经过第一主机的消息队列处理后的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识不相同时,则禁止进行告警事件输出,即不输出告警事件。
S612,在第一告警消息携带的主机标识与第二主机的主机标识相同时,进行告警事件输出。
一般的,监控设备发送的原始告警消息会按照一定比例分到两个机房,分到第二机房的原始告警消息为第二原始告警消息,会对该第二原始告警消息加上第二主机对应的主机标识后,再进行告警消息处理,在第二主机处理告警消息过程中也会接收并处理由第一机房发送的,带有第一主机的主机标识的且经过第一主机的消息队列处理后的第一告警消息;在告警消息处理过程中,所处理的告警消息携带的主机标识和第二主机的主机标识相同时,则进行告警事件输出,可将该告警事件发送给监控设备和/或其他设备进行告警提醒。
举例说明:AWS机房和阿里机房是双机房双活模式下的两个机房,监控设备按照6:4的比例,将一批告警请求消息的60%分给AWS机房,将一批告警请求消息的40%分给阿里机房,在AWS机房写入所分配的60%的告警请求消息之前,会将该60%的告警请求消息添加AWS机房的标识(domain=aws),再写入AWS机房的消息队列中;相同地,在阿里机房写入所分配的40%的告警请求消息之前,会将该40%的告警请求消息添加阿里机房的标识(domain=ali),再写入阿里机房的消息队列中。AWS机房的应用服务器会拉取经过AWS机房的消息队列处理后的第一告警消息,也会接收到阿里机房发送的且经过阿里机房的消息队列处理后的第二告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定AWS机房是否输出告警事件:分析第一告警消息和第二告警消息各自携带的主机标识,分别判断第一告警消息携带的主机标识和第二告警消息携带的主机标识与AWS主机的主机标识是否相同;若相同,则AWS机房进行告警事件输出;若不相同,则AWS机房禁止告警事件输出。阿里机房的应用服务器会拉取经过阿里机房的消息队列处理后的第二告警消息,也会接收到AWS机房发送的且经过AWS机房的消息队列处理后的第一告警消息,并对该第一告警消息和第二告警消息进行分析处理,以确定阿里机房是否输出告警事件:分析第一告警消息和第二告警消息各自携带的主机标识,分别判断第一告警消息携带的主机标识和第二告警消息携带的主机标识与阿里主机的主机标识是否相同;若相同,则阿里机房进行告警事件输出;若不相同,则阿里机房禁止告警事件输出。
本申请实施例中告警消息处理交互关系可参见图7,监控设备701、第一主机702、第二主机703,第二主机703接收来自监控设备701的第二原始告警消息,将第二主机703的主机标识添加到第二原始告警消息中,将添加标识后的第二原始告警消息写入第二消息队列,第二主机703拉取第二消息队列中的第二告警消息,第二主机703将第二告警消息发送给第一主机702,判断第二告警消息携带的主机标识和第二主机703的主机标识是否相同,在第二告警消息携带的主机标识和第二主机703的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识和第二主机703的主机标识相同时,进行告警事件输出,第二主机703接收来自第一主机702的第一告警消息,判断第一告警消息携带的主机标识和第二主机703的主机标识是否相同,在第一告警消息携带的主机标识与第二主机703的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识与第二主机703的主机标识相同时,进行告警事件输出。
本申请实施例的方案在执行时,第二主机接收来自监控设备的第二原始告警消息,将第二主机的主机标识添加到第二原始告警消息中,将添加标识后的第二原始告警消息写入第二消息队列,第二主机拉取第二消息队列中的第二告警消息,第二主机将第二告警消息发送给第一主机,判断第二告警消息携带的主机标识和第二主机的主机标识是否相同,在第二告警消息携带的主机标识和第二主机的主机标识不相同时,禁止进行告警事件输出,在第二告警消息携带的主机标识和第二主机的主机标识相同时,进行告警事件输出,第二主机接收来自第一主机的第一告警消息,判断第一告警消息携带的主机标识和第二主机的主机标识是否相同,在第一告警消息携带的主机标识与第二主机的主机标识不相同时,禁止进行告警事件输出,在第一告警消息携带的主机标识与第二主机的主机标识相同时,进行告警事件输出。通过此种方式可实现对双机房进行监控,提高双机房双活模式乃至多机房多活模式下的告警消息处理效率,降低了在双机房双活模式乃至多机房多活模式下对告警消息处理的复杂性和风险性,并不会引起机房故障误判的情况。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参见图8,其示出了本申请一个示例性实施例提供的告警消息处理装置的结构示意图。以下简称装置8,装置8可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。装置8包括第一处理模块801、发送模块802、第二处理模块803、第三处理模块804。
第一处理模块801,用于第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
发送模块802,用于所述第一主机将所述第一告警消息发送给所述第二主机;
第二处理模块803,用于在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块804,用于在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出。
可选地,所述装置8还包括:
第一接收单元,用于所述第一主机接收来自所述第二主机的第二告警消息;其中,所述第二告警消息携带主机标识;
第一处理单元,用于在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
第二处理单元,用于在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识相同时,进行告警事件输出。
可选地,所述装置8还包括:
第二接收单元,用于所述第一主机接收来自监控设备的第一原始告警消息;
添加单元,用于将所述第一主机的主机标识添加到所述第一原始告警消息中;
第三处理单元,用于将添加标识后的第一原始告警消息写入所述第一消息队列;其中,所述添加标识后的第一原始告警消息与所述第一告警消息对应。
可选地,所述装置8中的主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
请参见图9,其示出了本申请一个示例性实施例提供的告警消息处理装置的结构示意图。以下简称装置9,装置9可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。装置9包括第一处理模块901、发送模块902、第二处理模块903、第三处理模块904。
第一处理模块901,用于第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
发送模块902,用于所述第二主机将所述第二告警消息发送给所述第一主机;
第二处理模块903,用于在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块904,用于在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出。
可选地,所述装置9还包括:
第一接收单元,用于所述第二主机接收来自所述第一主机的第一告警消息;其中,所述第一告警消息携带主机标识;
第一处理单元,用于在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
第二处理单元,用于在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识相同时,进行告警事件输出。
可选地,所述装置9还包括:
第二接收单元,用于所述第二主机接收来自监控设备的第二原始告警消息;
添加单元,用于将所述第二主机的主机标识添加到所述第二原始告警消息中;
第三处理单元,用于将添加标识后的第二原始告警消息写入所述第二消息队列;其中,所述添加标识后的第二原始告警消息与所述第二告警消息对应。
可选地,所述装置9中的主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
需要说明的是,上述实施例提供的装置8和装置9在执行告警消息处理方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的告警消息处理方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质可以存储有多条指令,所述指令适于由处理器加载并执行如上述图2~图7所示实施例的方法步骤,具体执行过程可以参见图2~图7所示实施例的具体说明,在此不进行赘述。
本申请还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的告警消息处理方法。
图10为本申请实施例提供的一种告警消息处理装置结构示意图,以下简称装置10,装置10可以集成于前述服务器或终端设备中,如图10所示,该装置包括:处理器1001、存储器1002、输入装置1003、输出装置1004和通信接口。
存储器1002可以是独立的物理单元,与处理器1001、输入装置1003和输出装置1004可以通过总线连接。存储器1002、处理器1001、输入装置1003和输出装置1004也可以集成在一起,通过硬件实现等。
存储器1002用于存储实现以上方法实施例,或者装置实施例各个模块的程序,处理器1001调用该程序,执行以上方法实施例的操作。
输入装置1002包括但不限于键盘、鼠标、触摸面板、摄像头和麦克风;输出装置包括但限于显示屏。
通信接口用于收发各种类型的消息,通信接口包括但不限于无线接口或有线接口。
可选地,当上述实施例的告警消息处理方法中的部分或全部通过软件实现时,装置也可以只包括处理器。用于存储程序的存储器位于装置之外,处理器通过电路/电线与存储器连接,用于读取并执行存储器中存储的程序。
处理器可以是中央处理器(central processing unit,CPU),网络处理器(network processor,NP)或者CPU和NP的组合。
处理器还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmablelogic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。
存储器可以包括易失性存储器(volatile memory),例如存取存储器(random-access memory,RAM);存储器也可以包括非易失性存储器(non-volatile memory),例如快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);存储器还可以包括上述种类的存储器的组合。
其中,处理器1001调用存储器1002中的程序代码用于执行以下步骤:
第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
所述第一主机将所述第一告警消息发送给所述第二主机;
在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出。
在一个或多个实施例中,处理器1001还用于:
所述第一主机接收来自所述第二主机的第二告警消息;其中,所述第二告警消息携带主机标识;
在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识相同时,进行告警事件输出。
在一个或多个实施例中,处理器1001还用于:
所述第一主机接收来自监控设备的第一原始告警消息;
将所述第一主机的主机标识添加到所述第一原始告警消息中;
将添加标识后的第一原始告警消息写入所述第一消息队列;其中,所述添加标识后的第一原始告警消息与所述第一告警消息对应。
其中,处理器1001调用存储器1002中的程序代码用于执行以下步骤:
第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
所述第二主机将所述第二告警消息发送给所述第一主机;
在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出。
在一个或多个实施例中,处理器1001还用于:
所述第二主机接收来自所述第一主机的第一告警消息;其中,所述第一告警消息携带主机标识;
在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识相同时,进行告警事件输出。
在一个或多个实施例中,处理器1001还用于:
所述第二主机接收来自监控设备的第二原始告警消息;
将所述第二主机的主机标识添加到所述第二原始告警消息中;
将添加标识后的第二原始告警消息写入所述第二消息队列;其中,所述添加标识后的第二原始告警消息与所述第二告警消息对应。
本领域内的技术人员应明白,本申请的实施例可提供的方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (10)

1.一种告警消息处理方法,其特征在于,所述方法包括:
第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
所述第一主机将所述第一告警消息发送给第二主机;
所述第一主机在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或,所述第一主机在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出;
所述第一主机拉取第一消息队列中的第一告警消息之前,还包括:
所述第一主机接收来自监控设备的第一原始告警消息;
将所述第一主机的主机标识添加到所述第一原始告警消息中;
将添加标识后的第一原始告警消息写入所述第一消息队列;其中,所述添加标识后的第一原始告警消息与所述第一告警消息对应。
2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
所述第一主机接收来自所述第二主机的第二告警消息;其中,所述第二告警消息携带主机标识;
在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或,在所述第二告警消息携带的所述主机标识与所述第一主机的主机标识相同时,进行告警事件输出。
3.根据权利要求1所述的方法,其特征在于,所述主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
4.一种告警消息处理方法,其特征在于,所述方法包括:
第二主机接收来自监控设备的第二原始告警消息;
将所述第二主机的主机标识添加到所述第二原始告警消息中;
将添加标识后的第二原始告警消息写入第二消息队列;其中,所述添加标识后的第二原始告警消息与第二告警消息对应;
第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
所述第二主机将所述第二告警消息发送给第一主机;
所述第二主机在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或,所述第二主机在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出。
5.根据权利要求4所述的方法,其特征在于,所述方法,还包括:
所述第二主机接收来自所述第一主机的第一告警消息;其中,所述第一告警消息携带主机标识;
在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或,在所述第一告警消息携带的所述主机标识与所述第二主机的主机标识相同时,进行告警事件输出。
6.根据权利要求4所述的方法,其特征在于,所述主机标识包括主机的域名、IP地址和MAC地址中的一种或多种。
7.一种告警消息处理装置,其特征在于,所述装置包括:
第一处理模块,用于第一主机拉取第一消息队列中的第一告警消息;其中,所述第一告警消息携带主机标识,第一消息队列设置于所述第一主机中;
发送模块,用于所述第一主机将所述第一告警消息发送给第二主机;
第二处理模块,用于所述第一主机在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块,用于所述第一主机在所述第一告警消息携带的所述主机标识和所述第一主机的主机标识相同时,进行告警事件输出;
所述装置还包括:
第二接收单元,用于所述第一主机接收来自监控设备的第一原始告警消息;
添加单元,用于将所述第一主机的主机标识添加到所述第一原始告警消息中;
第三处理单元,用于将添加标识后的第一原始告警消息写入所述第一消息队列;其中,所述添加标识后的第一原始告警消息与所述第一告警消息对应。
8.一种告警消息处理装置,其特征在于,所述装置包括:
第一处理模块,用于第二主机拉取第二消息队列中的第二告警消息;其中,所述第二告警消息携带主机标识,第二消息队列设置于所述第二主机中;
发送模块,用于所述第二主机将所述第二告警消息发送给第一主机;
第二处理模块,用于所述第二主机在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识不相同时,禁止进行告警事件输出;和/或
第三处理模块,用于所述第二主机在所述第二告警消息携带的所述主机标识和所述第二主机的主机标识相同时,进行告警事件输出;
所述装置还包括:
第二接收单元,用于所述第二主机接收来自监控设备的第二原始告警消息;
添加单元,用于将所述第二主机的主机标识添加到所述第二原始告警消息中;
第三处理单元,用于将添加标识后的第二原始告警消息写入所述第二消息队列;其中,所述添加标识后的第二原始告警消息与所述第二告警消息对应。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~6任意一项的方法步骤。
10.一种电子设备,其特征在于,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~6任意一项的方法步骤。
CN202010588054.XA 2020-06-24 2020-06-24 告警消息处理方法、装置、存储介质及电子设备 Active CN111930587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010588054.XA CN111930587B (zh) 2020-06-24 2020-06-24 告警消息处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010588054.XA CN111930587B (zh) 2020-06-24 2020-06-24 告警消息处理方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111930587A CN111930587A (zh) 2020-11-13
CN111930587B true CN111930587B (zh) 2024-05-10

Family

ID=73317440

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010588054.XA Active CN111930587B (zh) 2020-06-24 2020-06-24 告警消息处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111930587B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105323098A (zh) * 2014-07-31 2016-02-10 中国移动通信集团北京有限公司 一种告警消息处理方法、装置及系统
CN109284267A (zh) * 2018-09-26 2019-01-29 深圳壹账通智能科技有限公司 基于异常监控的日志管理方法及终端设备
CN109951345A (zh) * 2019-04-16 2019-06-28 新华三信息安全技术有限公司 一种告警处理方法及装置
US10382380B1 (en) * 2016-11-17 2019-08-13 Amazon Technologies, Inc. Workload management service for first-in first-out queues for network-accessible queuing and messaging services
CN110825555A (zh) * 2018-08-07 2020-02-21 马维尔国际贸易有限公司 具有主机隔离的非易失性存储器交换机

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105323098A (zh) * 2014-07-31 2016-02-10 中国移动通信集团北京有限公司 一种告警消息处理方法、装置及系统
US10382380B1 (en) * 2016-11-17 2019-08-13 Amazon Technologies, Inc. Workload management service for first-in first-out queues for network-accessible queuing and messaging services
CN110825555A (zh) * 2018-08-07 2020-02-21 马维尔国际贸易有限公司 具有主机隔离的非易失性存储器交换机
CN109284267A (zh) * 2018-09-26 2019-01-29 深圳壹账通智能科技有限公司 基于异常监控的日志管理方法及终端设备
CN109951345A (zh) * 2019-04-16 2019-06-28 新华三信息安全技术有限公司 一种告警处理方法及装置

Also Published As

Publication number Publication date
CN111930587A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
CN108712332B (zh) 一种通信方法、系统和装置
CN108696581B (zh) 分布式信息的缓存方法、装置、计算机设备以及存储介质
DE112013003180T5 (de) Verfahren, System und Gerät zum Verwalten von Server-Hardware-Resourcen in einer Cloud-Scheduling-Umgebung
CN111949444A (zh) 一种基于分布式服务集群的数据备份与恢复系统及方法
CN101771565B (zh) 单一服务器实现大批量或不同种基板管理控制器模拟方法
WO2017080161A1 (zh) 云计算中报警信息的处理方法及装置
CN113923397B (zh) 会议室设备的状态检测方法、装置、电子设备和存储介质
CN112217847A (zh) 微服务平台及其实现方法、电子设备及存储介质
CN103501237A (zh) 设备管理方法、管理平台、设备及系统
CN112101589B (zh) 一种基于云计算的船舶远程技术保障系统
CN111651320A (zh) 一种高并发连接方法和系统
Smith A system for monitoring and management of computational grids
CN113515408A (zh) 一种数据容灾方法、装置、设备及介质
CN114697391A (zh) 数据处理方法、装置、设备以及存储介质
CN111930587B (zh) 告警消息处理方法、装置、存储介质及电子设备
CN113254274A (zh) 消息处理方法、装置、存储介质以及服务器
CN110321199B (zh) 一种共用数据变更的通知方法、装置、电子设备及介质
CN204425400U (zh) 应用服务器系统
CN113452948B (zh) 会议终端的控制方法、装置、设备及存储介质
CN111935296B (zh) 一种高可用无限mqtt消息服务扩容的系统
CN110768855B (zh) 链路化性能测试的方法和装置
CN111541667A (zh) 一种系统间消息通信的方法、设备、存储介质
CN108427615A (zh) 一种消息监控方法及装置
CN112994934A (zh) 数据交互方法、装置及系统
CN111858260A (zh) 信息显示方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant