监控消息的告警方法和系统
技术领域
本发明涉及信息处理技术领域,特别是涉及一种监控消息的告警方法,以及一种监控消息的告警系统。
背景技术
随着全球互联网业务的不断发展,越来越多的网络用户访问各种互联网应用,大量的用户终端接入应用平台带来大量级的数据读写请求,必然会在各应用平台产生大量的监控数据;面对如此快速、大量的数据读写请求,如何监控应用的服务质量,以便及时发现问题所在是目前需要解决的问题。
如图1所示,是传统技术中监控告警系统对采集到的监控数据的告警示意图,图中横轴表示监控时间,纵轴表示异常业务数据的数量级;传统技术中由于数据量巨大,监控告警系统只进行异常数据的统计和展示,异常数据的产生来源需人工进行业务数据的检查,无法在应用业务出现异常时自动进行对应的排故处理;这种缺陷导致应用业务出现问题时无法快速地定位,缺乏高效的告警机制,导致应用的运行维护效率低下。
发明内容
基于此,本发明提供一种监控消息的告警方法及系统,能自动查找出发生故障的应用业务并告警,提高应用运行维护效率。
一种监控消息的告警方法,包括如下步骤:
采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
一种监控消息的告警系统,包括:
采集模块,用于采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
响应状态获取模块,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
告警模块,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
上述监控消息的告警方法和系统,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
附图说明
图1为传统技术中监控告警系统对采集到的监控数据的告警示意图。
图2为本发明监控消息的告警方法在实施例一中的应用环境示意图。
图3为图1中计算机系统1000的模块图。
图4为本发明监控消息的告警方法在实施例二中的流程示意图。
图5为本发明监控消息的告警方法在实施例三中的流程示意图。
图6为本发明监控消息的告警系统在实施例四中的结构示意图。
图7为本发明监控消息的告警系统在实施例五中的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一、
本发明实施例所提供的监控消息的告警方法可应用于如图2所示的应用环境中,请参考图2所示,该应用环境具体可包括一个或多个客户端(图2中以三个客户端为例说明,即客户端3001~3003),一个或多个应用平台(图2中以两个应用平台为例说明,即应用平台2001和2002),以及能执行本发明实施例监控消息的告警方法的指定操作的计算机系统1000。客户端与应用平台进行交互,应用平台与计算机系统进行交互;客户端可包括智能设备、移动终端、个人计算机等类似设备。客户端上可运行应用程序,通过应用程序向应用平台发起业务请求,应用平台接收到业务请求产生监控消息,计算机系统采集监控消息进行监控告警处理。
图3为能实现本发明实施例的一个计算机系统1000的模块图。该计算机系统1000只是一个适用于本发明的计算机环境的示例,不能认为是提出了对本发明的使用范围的任何限制。计算机系统1000也不能解释为需要依赖于或具有图示的示例性的计算机系统1000中的一个或多个部件的组合。
图3中示出的计算机系统1000是一个适合用于本发明的计算机系统的例子。具有不同子系统配置的其它架构也可以使用。
如图3所示,计算机系统1000包括处理器1010、存储器1020和系统总线1022。包括存储器1020和处理器1010在内的各种系统组件连接到系统总线1022上。处理器1010是一个用来通过计算机系统中基本的算术和逻辑运算来执行计算机程序指令的硬件。存储器1020是一个用于临时或永久性存储计算程序或数据(例如,程序状态信息)的物理设备。系统总线1020可以为以下几种类型的总线结构中的任意一种,包括存储器总线或存储控制器、外设总线和局部总线。处理器1010和存储器1020可以通过系统总线1022进行数据通信。其中存储器1020包括只读存储器(ROM)或闪存(图中都未示出),以及随机存取存储器(RAM),RAM通常是指加载了操作系统和应用程序的主存储器。
计算机系统1000还包括显示接口1030(例如,图形处理单元)、显示设备1040(例如,液晶显示器)、音频接口1050(例如,声卡)以及音频设备1060(例如,扬声器)。显示设备1040和音频设备1060是用于体验多媒体内容的媒体设备。
计算机系统1000一般包括一个存储设备1070。存储设备1070可以从多种计算机可读介质中选择,计算机可读介质是指可以通过计算机系统1000访问的任何可利用的介质,包括移动的和固定的两种介质。例如,计算机可读介质包括但不限于,闪速存储器(微型SD卡),CD-ROM,数字通用光盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并可由计算机系统1000访问的任何其它介质。
计算机系统1000还包括输入装置1080和输入接口1090(例如,IO控制器)。用户可以通过输入装置1080,如键盘、鼠标、显示装置1040上的触摸面板设备,输入指令和信息到计算机系统1000中。输入装置1080通常是通过输入接口1090连接到系统总线1022上的,但也可以通过其它接口或总线结构相连接,如通用串行总线(USB)。
计算机系统1000可在网络环境中与一个或者多个网络设备进行逻辑连接。网络设备可以是个人电脑、服务器、路由器、智能电话、平板电脑或者其它公共网络节点。计算机系统1000通过局域网(LAN)接口1100或者移动通信单元1110与网络设备相连接。局域网(LAN)是指在有限区域内,例如家庭、学校、计算机实验室、或者使用网络媒体的办公楼,互联组成的计算机网络。WiFi和双绞线布线以太网是最常用的构建局域网的两种技术。WiFi是一种能使计算机系统1000间交换数据或通过无线电波连接到无线网络的技术。移动通信单元1110能在一个广阔的地理区域内移动的同时通过无线电通信线路接听和拨打电话。除了通话以外,移动通信单元1110也支持在提供移动数据服务的2G,3G或4G蜂窝通信系统中进行互联网访问。
应当指出的是,其它包括比计算机系统1000更多或更少的子系统的计算机系统也能适用于发明。
如上面详细描述的,适用于本发明的计算机系统1000能执行监控消息的告警方法的指定操作。计算机系统1000通过处理器1010运行在计算机可读介质中的软件指令的形式来执行这些操作。这些软件指令可以从存储设备1070或者通过局域网接口1100从另一设备读入到存储器1020中。存储在存储器1020中的软件指令使得处理器1010执行上述的监控消息的告警方法。此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本发明。因此,实现本发明并不限于任何特定硬件电路和软件的组合。
实施例二、
如图4所示,提供了一种监控消息的告警方法,该方法以应用于计算机系统中进行举例说明,包括如下步骤:
S41、采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
S42、根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
S43、当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
本发明实施例监控消息的告警方法中,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
在步骤S41中,应用平台是客户端获得应用的业务数据的入口,其中应用可包括社区网络、即时通讯等多种应用程序。每个应用可包括多个业务,例如,一个即时通讯应用中,其可包括如查询群成员资料业务、拉取最近联系人列表信息业务、查询好友资料业务等多个业务;客户端通过运行应用程序向对应的应用平台发出某一业务请求,应用平台处理客户端的业务请求,处理后生成反映此次处理状态的监控消息;监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理状态。
进一步的,在一个实施例中,所述监控消息可为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括所述业务请求标识、所述业务请求的响应状态标识以及业务请求的处理时间;
本实施例中,指定监控消息按预设监控属性字段而生成,即指定了监控消息生成的格式及监控消息携带的具体信息,可进一步加快对监控消息的监控处理速度;其中,监控属性字段,可包括但不限于:业务请求标识、应用平台IP、调用业务请求的客户端ID、业务请求处理时间、业务请求的响应状态等多种属性字段,具体可根据监控需要而设置;如表1所示,示出了三个监控消息的监控属性字段及其对应的监控属性字段值。
业务请求标识 |
应用平台IP |
客户端ID |
处理时间 |
响应状态 |
0x56B |
1.2.3.4 |
100003 |
2014-5-25 192610 |
succ |
0x571 |
1.2.3.4 |
100005 |
2014-5-25 212633 |
err |
0x787 |
6.7.8.9 |
300002 |
2014-5-25 112855 |
succ |
表1
在步骤S42中,根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
本实施例中,通过业务请求标识对监控消息进行相关性聚集,相同的业务请求标识的监控消息对应同一个业务,通过读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务;对获得的同一业务类型的监控消息的集合,通过读取其中每个监控消息中携带的业务请求的响应状态标识,从而获知该监控消息集合的响应状态;例如,若同一业务类型的监控消息的集合中业务请求超时量较多,则可确定同一业务请求标识的监控消息为请求超时状态,也即为异常状态;若业务请求超时量较少,则可确定同一业务请求标识的监控消息为请求成功状态,也即为成功状态;也可根据业务请求量或业务请求成功量的比例而确定;具体的,业务请求超时量或成功量的多少,或者业务请求量或业务请求成功量的比例的多少,可根据具体需要而设置,对此本实施例不做具体限定。
在步骤S43中,当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
当判断某一业务请求的监控消息满足预设的告警标准,从预设的与业务请求标识与告警对象的对应关系中,确定该业务请求对应的告警对象,将告警通知推送给所述告警对象;所述的告警对象,可为预设的与该业务请求相关的处理对象或监控对象。本实施例中,从海量的监控消息中聚集了同一业务类型的监控消息,迅速地定位至每个业务,并针对性地将告警通知发送到指定的与该业务相关的告警对象,使得监控告警实现自动化,显著提高了维护效率。
实施例三、
请参阅图5,图5是本发明监控消息的告警方法在实施例三的流程示意图。
本实施例中监控消息的告警方法与实施例二的主要区别在于,所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤,可包括:
S51、读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
S52、记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
S53、根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态;
本实施例中,所述业务请求的响应状态标识可包括业务请求成功标识或业务请求超时标识;对业务请求的两种响应状态:业务请求处理成功或业务请求超时进行标记,并且以不同响应状态的监控消息的数量级表征监控时间内同一业务请求的监控消息的响应状态;具体的,读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间,记录在一预设的监控时间内同一业务请求的监控消息不同响应状态的数量,可更加快速地获得监控结果。其中,监控时间可以是指定时刻,例如可以是2014年5月25日19时26分10秒等具体时刻,也可以是指定的时间间隔,如间隔10秒、30秒或是1分钟的监控时间作为一个周期等,对此本实施例不做具体限定。
如表2所示,示出了三种业务的监控消息的响应状态获取结果。
业务请求标识 |
请求总量 |
超时量 |
监控时间 |
成功量 |
0x56B |
99823 |
2 |
2014-5-25 192610 |
99821 |
0x571 |
148974 |
30 |
2014-5-25 212633 |
148944 |
0x787 |
7890 |
100 |
2014-5-25 112855 |
7790 |
表2
进一步的,在一个实施例中,在所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤后,还可包括步骤:
将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
或者包括步骤:
将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果。
本实施例中,对每种业务请求的监控消息进行汇总后,可计算监控消息中业务请求超时量与总量的比例关系,也可计算监控消息中业务请求成功量与总量的比例关系,进而比较比例关系与预设的告警标准;
例如,计算得到的业务请求超时量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求超时量所占的比例,将其与预设的第一告警阈值进行比较,若超过则判断满足告警标准;第一告警阈值可为1%、5%或者10%等,可根据实际的监控力度需要设置该第一告警阈值,对此本实施例不做具体限定;
同理,计算得到的业务请求成功量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求成功量所占的比例,将其与预设的第二告警阈值进行比较,若超过则判断满足告警标准;第二告警阈值可为91%、95%或者90%等,可根据实际的监控力度需要设置该第二告警阈值,对此本实施例不做具体限定;
本实施例以基于具体业务请求的成功率或失败率的方式进行监控,能自动判断是否对监控消息执行告警操作。
具体的,在一个实施例中,当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,还可进一步包括步骤:
检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;
若否,则执行所述查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象的步骤;
本实施例中,当某一应用业务在进行维护时,该业务在维护状态下,若接收到业务请求,其业务请求的响应状态可能出现异常,造成大量的业务请求超时监控消息的生成,因此会产生较多的告警通知;本实施例通过在同一业务请求标识的监控消息的响应状态满足预设的告警标准的情况下,进一步检查是否接收到告警对象发出的告警屏蔽通知,若否,则执行发送告警通知的步骤,显著提高业务的监控效率。
具体的,所述告警通知可包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系;在发出告警通知时,在告警通知中携带上述与业务请求相关的信息,可使告警对象及时获知具体的监控消息的异常状态,以便其迅速进行处理。
具体的发送告警通知的过程,可根据预设的告警对象的告警路径发送该告警通知,其可以有多种形式,例如根据告警对象的邮箱地址,通过邮件方式发送告警通知;也可利用即时通讯应用,将告警通知发送给告警对象;也还可以采用电话或短信等告警方式,具体可根据实际需要而设计,对此本实施例不做具体限定。
实施例四、
如图6所示,提供了一种监控消息的告警系统,包括:
采集模块61,用于采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
响应状态获取模块62,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
告警模块63,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
本发明实施例监控消息的告警系统中,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
在采集模块61中,应用平台是客户端获得应用的业务数据的入口,其中应用可包括社区网络、即时通讯等多种应用程序。每个应用可包括多个业务,例如,一个即时通讯应用中,其可包括如查询群成员资料业务、拉取最近联系人列表信息业务、查询好友资料业务等多个业务;客户端通过运行应用程序向对应的应用平台发出某一业务请求,应用平台处理客户端的业务请求,处理后生成反映此次处理状态的监控消息;监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理状态。
进一步的,在一个实施例中,所述监控消息可为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括所述业务请求标识、所述业务请求的响应状态标识以及业务请求的处理时间;
本实施例中,指定监控消息按预设监控属性字段而生成,即指定了监控消息生成的格式及监控消息携带的具体信息,可进一步加快对监控消息的监控处理速度;其中,监控属性字段,可包括但不限于:业务请求标识、应用平台IP、调用业务请求的客户端ID、业务请求处理时间、业务请求的响应状态等多种属性字段,具体可根据监控需要而设置;如表1所示,示出了三个监控消息的监控属性字段及其对应的监控属性字段值。
业务请求标识 |
应用平台IP |
客户端ID |
处理时间 |
响应状态 |
0x56B |
1.2.3.4 |
100003 |
2014-5-25 192610 |
succ |
0x571 |
1.2.3.4 |
100005 |
2014-5-25 212633 |
err |
0x787 |
6.7.8.9 |
300002 |
2014-5-25 112855 |
succ |
表1
响应状态获取模块62,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
本实施例中,通过业务请求标识对监控消息进行相关性聚集,相同的业务请求标识的监控消息对应同一个业务,通过读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务;对获得的同一业务类型的监控消息的集合,通过读取其中每个监控消息中携带的业务请求的响应状态标识,从而获知该监控消息集合的响应状态;例如,若同一业务类型的监控消息的集合中业务请求超时量较多,则可确定同一业务请求标识的监控消息为请求超时状态,也即为异常状态;若业务请求超时量较少,则可确定同一业务请求标识的监控消息为请求成功状态,也即为成功状态;也可根据业务请求量或业务请求成功量的比例而确定;具体的,业务请求超时量或成功量的多少,或者业务请求量或业务请求成功量的比例的多少,可根据具体需要而设置,对此本实施例不做具体限定。
告警模块63,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
当判断某一业务请求的监控消息满足预设的告警标准,从预设的与业务请求标识与告警对象的对应关系中,确定该业务请求对应的告警对象,将告警通知推送给所述告警对象;所述的告警对象,可为预设的与该业务请求相关的处理对象或监控对象。本实施例中,从海量的监控消息中聚集了同一业务类型的监控消息,迅速地定位至每个业务,并针对性地将告警通知发送到指定的与该业务相关的告警对象,使得监控告警实现自动化,显著提高了维护效率。
实施例五、
请参阅图7,图7是本发明监控消息的告警系统在实施例五的结构示意图。
本实施例中监控消息的告警系统与实施例四的主要区别在于,所述响应状态获取模块62,可包括:
读取模块71,用于读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
记录模块72,用于记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
确定模块73,用于根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态;
本实施例中,所述业务请求的响应状态标识可包括业务请求成功标识或业务请求超时标识;对业务请求的两种响应状态:业务请求处理成功或业务请求超时进行标记,并且以不同响应状态的监控消息的数量级表征监控时间内同一业务请求的监控消息的响应状态;具体的,读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间,记录在一预设的监控时间内同一业务请求的监控消息不同响应状态的数量,可更加快速地获得监控结果。其中,监控时间可以是指定时刻,例如可以是2014年5月25日19时26分10秒等具体时刻,也可以是指定的时间间隔,如间隔10秒、30秒或是1分钟作为一个监控周期等,对此本实施例不做具体限定。
如表2所示,示出了三种业务的监控消息的响应状态获取结果。
业务请求标识 |
请求总量 |
超时量 |
监控时间 |
成功量 |
0x56B |
99823 |
2 |
2014-5-25 192610 |
99821 |
0x571 |
148974 |
30 |
2014-5-25 212633 |
148944 |
0x787 |
7890 |
100 |
2014-5-25 112855 |
7790 |
表2
进一步的,在一个实施例中,所述告警模块63可包括第一比较模块或第二比较模块;
所述第一比较模块用于将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
所述第二比较模块用于将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
本实施例中,对每种业务请求的监控消息进行汇总后,可计算监控消息中业务请求超时量与总量的比例关系,也可计算监控消息中业务请求成功量与总量的比例关系,进而比较比例关系与预设的告警标准;
例如,计算得到的业务请求超时量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求超时量所占的比例,将其与预设的第一告警阈值进行比较,若超过则判断满足告警标准;第一告警阈值可为1%、5%或者10%等,可根据实际的监控力度需要设置该第一告警阈值,对此本实施例不做具体限定;
同理,计算得到的业务请求成功量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求成功量所占的比例,将其与预设的第二告警阈值进行比较,若超过则判断满足告警标准;第二告警阈值可为91%、95%或者90%等,可根据实际的监控力度需要设置该第二告警阈值,对此本实施例不做具体限定;
本实施例以基于具体业务请求的成功率或失败率的方式进行监控,能自动判断是否对监控消息执行告警操作。
具体的,在一个实施例中,所述告警模块63还可用于在所述判断模块判断满足所述告警标准后,进一步检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;若否,则查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
本实施例中,当某一应用业务在进行维护时,该业务在维护状态下,若接收到业务请求,其业务请求的响应状态可能出现异常,造成大量的业务请求超时监控消息的生成,因此会产生较多的告警通知;本实施例通过在同一业务请求标识的监控消息的响应状态满足预设的告警标准的情况下,进一步检查是否接收到告警对象发出的告警屏蔽通知,若否,则执行发送告警通知的步骤,显著提高业务的监控效率。
具体的,所述告警通知中可包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系,在发出告警通知时,在告警通知中携带上述与业务请求相关的信息,可使告警对象及时获知具体的监控消息的异常状态,以便其迅速进行处理。
具体的发送告警通知的过程,可根据预设的告警对象的告警路径发送该告警通知,其可以有多种形式,例如根据告警对象的邮箱地址,通过邮件方式发送告警通知;也可利用即时通讯应用,将告警通知发送给告警对象;也还可以采用电话或短信等告警方式,具体可根据实际需要而设计,对此本实施例不做具体限定。
本发明监控消息的告警方法和系统,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。