CN105373460A - 监控消息的告警方法和系统 - Google Patents

监控消息的告警方法和系统 Download PDF

Info

Publication number
CN105373460A
CN105373460A CN201410401554.2A CN201410401554A CN105373460A CN 105373460 A CN105373460 A CN 105373460A CN 201410401554 A CN201410401554 A CN 201410401554A CN 105373460 A CN105373460 A CN 105373460A
Authority
CN
China
Prior art keywords
service request
alarm
monitoring message
mark
responsive state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410401554.2A
Other languages
English (en)
Other versions
CN105373460B (zh
Inventor
林俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410401554.2A priority Critical patent/CN105373460B/zh
Publication of CN105373460A publication Critical patent/CN105373460A/zh
Application granted granted Critical
Publication of CN105373460B publication Critical patent/CN105373460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种监控消息的告警方法及系统,该监控消息的告警方法,包括:采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。本发明能自动查找出发生故障的应用业务并告警,提高应用运行维护效率。

Description

监控消息的告警方法和系统
技术领域
本发明涉及信息处理技术领域,特别是涉及一种监控消息的告警方法,以及一种监控消息的告警系统。
背景技术
随着全球互联网业务的不断发展,越来越多的网络用户访问各种互联网应用,大量的用户终端接入应用平台带来大量级的数据读写请求,必然会在各应用平台产生大量的监控数据;面对如此快速、大量的数据读写请求,如何监控应用的服务质量,以便及时发现问题所在是目前需要解决的问题。
如图1所示,是传统技术中监控告警系统对采集到的监控数据的告警示意图,图中横轴表示监控时间,纵轴表示异常业务数据的数量级;传统技术中由于数据量巨大,监控告警系统只进行异常数据的统计和展示,异常数据的产生来源需人工进行业务数据的检查,无法在应用业务出现异常时自动进行对应的排故处理;这种缺陷导致应用业务出现问题时无法快速地定位,缺乏高效的告警机制,导致应用的运行维护效率低下。
发明内容
基于此,本发明提供一种监控消息的告警方法及系统,能自动查找出发生故障的应用业务并告警,提高应用运行维护效率。
一种监控消息的告警方法,包括如下步骤:
采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
一种监控消息的告警系统,包括:
采集模块,用于采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
响应状态获取模块,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
告警模块,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
上述监控消息的告警方法和系统,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
附图说明
图1为传统技术中监控告警系统对采集到的监控数据的告警示意图。
图2为本发明监控消息的告警方法在实施例一中的应用环境示意图。
图3为图1中计算机系统1000的模块图。
图4为本发明监控消息的告警方法在实施例二中的流程示意图。
图5为本发明监控消息的告警方法在实施例三中的流程示意图。
图6为本发明监控消息的告警系统在实施例四中的结构示意图。
图7为本发明监控消息的告警系统在实施例五中的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一、
本发明实施例所提供的监控消息的告警方法可应用于如图2所示的应用环境中,请参考图2所示,该应用环境具体可包括一个或多个客户端(图2中以三个客户端为例说明,即客户端3001~3003),一个或多个应用平台(图2中以两个应用平台为例说明,即应用平台2001和2002),以及能执行本发明实施例监控消息的告警方法的指定操作的计算机系统1000。客户端与应用平台进行交互,应用平台与计算机系统进行交互;客户端可包括智能设备、移动终端、个人计算机等类似设备。客户端上可运行应用程序,通过应用程序向应用平台发起业务请求,应用平台接收到业务请求产生监控消息,计算机系统采集监控消息进行监控告警处理。
图3为能实现本发明实施例的一个计算机系统1000的模块图。该计算机系统1000只是一个适用于本发明的计算机环境的示例,不能认为是提出了对本发明的使用范围的任何限制。计算机系统1000也不能解释为需要依赖于或具有图示的示例性的计算机系统1000中的一个或多个部件的组合。
图3中示出的计算机系统1000是一个适合用于本发明的计算机系统的例子。具有不同子系统配置的其它架构也可以使用。
如图3所示,计算机系统1000包括处理器1010、存储器1020和系统总线1022。包括存储器1020和处理器1010在内的各种系统组件连接到系统总线1022上。处理器1010是一个用来通过计算机系统中基本的算术和逻辑运算来执行计算机程序指令的硬件。存储器1020是一个用于临时或永久性存储计算程序或数据(例如,程序状态信息)的物理设备。系统总线1020可以为以下几种类型的总线结构中的任意一种,包括存储器总线或存储控制器、外设总线和局部总线。处理器1010和存储器1020可以通过系统总线1022进行数据通信。其中存储器1020包括只读存储器(ROM)或闪存(图中都未示出),以及随机存取存储器(RAM),RAM通常是指加载了操作系统和应用程序的主存储器。
计算机系统1000还包括显示接口1030(例如,图形处理单元)、显示设备1040(例如,液晶显示器)、音频接口1050(例如,声卡)以及音频设备1060(例如,扬声器)。显示设备1040和音频设备1060是用于体验多媒体内容的媒体设备。
计算机系统1000一般包括一个存储设备1070。存储设备1070可以从多种计算机可读介质中选择,计算机可读介质是指可以通过计算机系统1000访问的任何可利用的介质,包括移动的和固定的两种介质。例如,计算机可读介质包括但不限于,闪速存储器(微型SD卡),CD-ROM,数字通用光盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁存储设备,或者可用于存储所需信息并可由计算机系统1000访问的任何其它介质。
计算机系统1000还包括输入装置1080和输入接口1090(例如,IO控制器)。用户可以通过输入装置1080,如键盘、鼠标、显示装置1040上的触摸面板设备,输入指令和信息到计算机系统1000中。输入装置1080通常是通过输入接口1090连接到系统总线1022上的,但也可以通过其它接口或总线结构相连接,如通用串行总线(USB)。
计算机系统1000可在网络环境中与一个或者多个网络设备进行逻辑连接。网络设备可以是个人电脑、服务器、路由器、智能电话、平板电脑或者其它公共网络节点。计算机系统1000通过局域网(LAN)接口1100或者移动通信单元1110与网络设备相连接。局域网(LAN)是指在有限区域内,例如家庭、学校、计算机实验室、或者使用网络媒体的办公楼,互联组成的计算机网络。WiFi和双绞线布线以太网是最常用的构建局域网的两种技术。WiFi是一种能使计算机系统1000间交换数据或通过无线电波连接到无线网络的技术。移动通信单元1110能在一个广阔的地理区域内移动的同时通过无线电通信线路接听和拨打电话。除了通话以外,移动通信单元1110也支持在提供移动数据服务的2G,3G或4G蜂窝通信系统中进行互联网访问。
应当指出的是,其它包括比计算机系统1000更多或更少的子系统的计算机系统也能适用于发明。
如上面详细描述的,适用于本发明的计算机系统1000能执行监控消息的告警方法的指定操作。计算机系统1000通过处理器1010运行在计算机可读介质中的软件指令的形式来执行这些操作。这些软件指令可以从存储设备1070或者通过局域网接口1100从另一设备读入到存储器1020中。存储在存储器1020中的软件指令使得处理器1010执行上述的监控消息的告警方法。此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本发明。因此,实现本发明并不限于任何特定硬件电路和软件的组合。
实施例二、
如图4所示,提供了一种监控消息的告警方法,该方法以应用于计算机系统中进行举例说明,包括如下步骤:
S41、采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
S42、根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
S43、当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
本发明实施例监控消息的告警方法中,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
在步骤S41中,应用平台是客户端获得应用的业务数据的入口,其中应用可包括社区网络、即时通讯等多种应用程序。每个应用可包括多个业务,例如,一个即时通讯应用中,其可包括如查询群成员资料业务、拉取最近联系人列表信息业务、查询好友资料业务等多个业务;客户端通过运行应用程序向对应的应用平台发出某一业务请求,应用平台处理客户端的业务请求,处理后生成反映此次处理状态的监控消息;监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理状态。
进一步的,在一个实施例中,所述监控消息可为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括所述业务请求标识、所述业务请求的响应状态标识以及业务请求的处理时间;
本实施例中,指定监控消息按预设监控属性字段而生成,即指定了监控消息生成的格式及监控消息携带的具体信息,可进一步加快对监控消息的监控处理速度;其中,监控属性字段,可包括但不限于:业务请求标识、应用平台IP、调用业务请求的客户端ID、业务请求处理时间、业务请求的响应状态等多种属性字段,具体可根据监控需要而设置;如表1所示,示出了三个监控消息的监控属性字段及其对应的监控属性字段值。
业务请求标识 应用平台IP 客户端ID 处理时间 响应状态
0x56B 1.2.3.4 100003 2014-5-25 192610 succ
0x571 1.2.3.4 100005 2014-5-25 212633 err
0x787 6.7.8.9 300002 2014-5-25 112855 succ
表1
在步骤S42中,根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
本实施例中,通过业务请求标识对监控消息进行相关性聚集,相同的业务请求标识的监控消息对应同一个业务,通过读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务;对获得的同一业务类型的监控消息的集合,通过读取其中每个监控消息中携带的业务请求的响应状态标识,从而获知该监控消息集合的响应状态;例如,若同一业务类型的监控消息的集合中业务请求超时量较多,则可确定同一业务请求标识的监控消息为请求超时状态,也即为异常状态;若业务请求超时量较少,则可确定同一业务请求标识的监控消息为请求成功状态,也即为成功状态;也可根据业务请求量或业务请求成功量的比例而确定;具体的,业务请求超时量或成功量的多少,或者业务请求量或业务请求成功量的比例的多少,可根据具体需要而设置,对此本实施例不做具体限定。
在步骤S43中,当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
当判断某一业务请求的监控消息满足预设的告警标准,从预设的与业务请求标识与告警对象的对应关系中,确定该业务请求对应的告警对象,将告警通知推送给所述告警对象;所述的告警对象,可为预设的与该业务请求相关的处理对象或监控对象。本实施例中,从海量的监控消息中聚集了同一业务类型的监控消息,迅速地定位至每个业务,并针对性地将告警通知发送到指定的与该业务相关的告警对象,使得监控告警实现自动化,显著提高了维护效率。
实施例三、
请参阅图5,图5是本发明监控消息的告警方法在实施例三的流程示意图。
本实施例中监控消息的告警方法与实施例二的主要区别在于,所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤,可包括:
S51、读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
S52、记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
S53、根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态;
本实施例中,所述业务请求的响应状态标识可包括业务请求成功标识或业务请求超时标识;对业务请求的两种响应状态:业务请求处理成功或业务请求超时进行标记,并且以不同响应状态的监控消息的数量级表征监控时间内同一业务请求的监控消息的响应状态;具体的,读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间,记录在一预设的监控时间内同一业务请求的监控消息不同响应状态的数量,可更加快速地获得监控结果。其中,监控时间可以是指定时刻,例如可以是2014年5月25日19时26分10秒等具体时刻,也可以是指定的时间间隔,如间隔10秒、30秒或是1分钟的监控时间作为一个周期等,对此本实施例不做具体限定。
如表2所示,示出了三种业务的监控消息的响应状态获取结果。
业务请求标识 请求总量 超时量 监控时间 成功量
0x56B 99823 2 2014-5-25 192610 99821
0x571 148974 30 2014-5-25 212633 148944
0x787 7890 100 2014-5-25 112855 7790
表2
进一步的,在一个实施例中,在所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤后,还可包括步骤:
将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
或者包括步骤:
将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果。
本实施例中,对每种业务请求的监控消息进行汇总后,可计算监控消息中业务请求超时量与总量的比例关系,也可计算监控消息中业务请求成功量与总量的比例关系,进而比较比例关系与预设的告警标准;
例如,计算得到的业务请求超时量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求超时量所占的比例,将其与预设的第一告警阈值进行比较,若超过则判断满足告警标准;第一告警阈值可为1%、5%或者10%等,可根据实际的监控力度需要设置该第一告警阈值,对此本实施例不做具体限定;
同理,计算得到的业务请求成功量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求成功量所占的比例,将其与预设的第二告警阈值进行比较,若超过则判断满足告警标准;第二告警阈值可为91%、95%或者90%等,可根据实际的监控力度需要设置该第二告警阈值,对此本实施例不做具体限定;
本实施例以基于具体业务请求的成功率或失败率的方式进行监控,能自动判断是否对监控消息执行告警操作。
具体的,在一个实施例中,当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,还可进一步包括步骤:
检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;
若否,则执行所述查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象的步骤;
本实施例中,当某一应用业务在进行维护时,该业务在维护状态下,若接收到业务请求,其业务请求的响应状态可能出现异常,造成大量的业务请求超时监控消息的生成,因此会产生较多的告警通知;本实施例通过在同一业务请求标识的监控消息的响应状态满足预设的告警标准的情况下,进一步检查是否接收到告警对象发出的告警屏蔽通知,若否,则执行发送告警通知的步骤,显著提高业务的监控效率。
具体的,所述告警通知可包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系;在发出告警通知时,在告警通知中携带上述与业务请求相关的信息,可使告警对象及时获知具体的监控消息的异常状态,以便其迅速进行处理。
具体的发送告警通知的过程,可根据预设的告警对象的告警路径发送该告警通知,其可以有多种形式,例如根据告警对象的邮箱地址,通过邮件方式发送告警通知;也可利用即时通讯应用,将告警通知发送给告警对象;也还可以采用电话或短信等告警方式,具体可根据实际需要而设计,对此本实施例不做具体限定。
实施例四、
如图6所示,提供了一种监控消息的告警系统,包括:
采集模块61,用于采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
响应状态获取模块62,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
告警模块63,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
本发明实施例监控消息的告警系统中,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
在采集模块61中,应用平台是客户端获得应用的业务数据的入口,其中应用可包括社区网络、即时通讯等多种应用程序。每个应用可包括多个业务,例如,一个即时通讯应用中,其可包括如查询群成员资料业务、拉取最近联系人列表信息业务、查询好友资料业务等多个业务;客户端通过运行应用程序向对应的应用平台发出某一业务请求,应用平台处理客户端的业务请求,处理后生成反映此次处理状态的监控消息;监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理状态。
进一步的,在一个实施例中,所述监控消息可为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括所述业务请求标识、所述业务请求的响应状态标识以及业务请求的处理时间;
本实施例中,指定监控消息按预设监控属性字段而生成,即指定了监控消息生成的格式及监控消息携带的具体信息,可进一步加快对监控消息的监控处理速度;其中,监控属性字段,可包括但不限于:业务请求标识、应用平台IP、调用业务请求的客户端ID、业务请求处理时间、业务请求的响应状态等多种属性字段,具体可根据监控需要而设置;如表1所示,示出了三个监控消息的监控属性字段及其对应的监控属性字段值。
业务请求标识 应用平台IP 客户端ID 处理时间 响应状态
0x56B 1.2.3.4 100003 2014-5-25 192610 succ
0x571 1.2.3.4 100005 2014-5-25 212633 err
0x787 6.7.8.9 300002 2014-5-25 112855 succ
表1
响应状态获取模块62,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
本实施例中,通过业务请求标识对监控消息进行相关性聚集,相同的业务请求标识的监控消息对应同一个业务,通过读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务;对获得的同一业务类型的监控消息的集合,通过读取其中每个监控消息中携带的业务请求的响应状态标识,从而获知该监控消息集合的响应状态;例如,若同一业务类型的监控消息的集合中业务请求超时量较多,则可确定同一业务请求标识的监控消息为请求超时状态,也即为异常状态;若业务请求超时量较少,则可确定同一业务请求标识的监控消息为请求成功状态,也即为成功状态;也可根据业务请求量或业务请求成功量的比例而确定;具体的,业务请求超时量或成功量的多少,或者业务请求量或业务请求成功量的比例的多少,可根据具体需要而设置,对此本实施例不做具体限定。
告警模块63,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
当判断某一业务请求的监控消息满足预设的告警标准,从预设的与业务请求标识与告警对象的对应关系中,确定该业务请求对应的告警对象,将告警通知推送给所述告警对象;所述的告警对象,可为预设的与该业务请求相关的处理对象或监控对象。本实施例中,从海量的监控消息中聚集了同一业务类型的监控消息,迅速地定位至每个业务,并针对性地将告警通知发送到指定的与该业务相关的告警对象,使得监控告警实现自动化,显著提高了维护效率。
实施例五、
请参阅图7,图7是本发明监控消息的告警系统在实施例五的结构示意图。
本实施例中监控消息的告警系统与实施例四的主要区别在于,所述响应状态获取模块62,可包括:
读取模块71,用于读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
记录模块72,用于记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
确定模块73,用于根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态;
本实施例中,所述业务请求的响应状态标识可包括业务请求成功标识或业务请求超时标识;对业务请求的两种响应状态:业务请求处理成功或业务请求超时进行标记,并且以不同响应状态的监控消息的数量级表征监控时间内同一业务请求的监控消息的响应状态;具体的,读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间,记录在一预设的监控时间内同一业务请求的监控消息不同响应状态的数量,可更加快速地获得监控结果。其中,监控时间可以是指定时刻,例如可以是2014年5月25日19时26分10秒等具体时刻,也可以是指定的时间间隔,如间隔10秒、30秒或是1分钟作为一个监控周期等,对此本实施例不做具体限定。
如表2所示,示出了三种业务的监控消息的响应状态获取结果。
业务请求标识 请求总量 超时量 监控时间 成功量
0x56B 99823 2 2014-5-25 192610 99821
0x571 148974 30 2014-5-25 212633 148944
0x787 7890 100 2014-5-25 112855 7790
表2
进一步的,在一个实施例中,所述告警模块63可包括第一比较模块或第二比较模块;
所述第一比较模块用于将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
所述第二比较模块用于将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
本实施例中,对每种业务请求的监控消息进行汇总后,可计算监控消息中业务请求超时量与总量的比例关系,也可计算监控消息中业务请求成功量与总量的比例关系,进而比较比例关系与预设的告警标准;
例如,计算得到的业务请求超时量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求超时量所占的比例,将其与预设的第一告警阈值进行比较,若超过则判断满足告警标准;第一告警阈值可为1%、5%或者10%等,可根据实际的监控力度需要设置该第一告警阈值,对此本实施例不做具体限定;
同理,计算得到的业务请求成功量与总量的比例关系,即是指在同一业务请求的监控消息中,业务请求成功量所占的比例,将其与预设的第二告警阈值进行比较,若超过则判断满足告警标准;第二告警阈值可为91%、95%或者90%等,可根据实际的监控力度需要设置该第二告警阈值,对此本实施例不做具体限定;
本实施例以基于具体业务请求的成功率或失败率的方式进行监控,能自动判断是否对监控消息执行告警操作。
具体的,在一个实施例中,所述告警模块63还可用于在所述判断模块判断满足所述告警标准后,进一步检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;若否,则查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象;
本实施例中,当某一应用业务在进行维护时,该业务在维护状态下,若接收到业务请求,其业务请求的响应状态可能出现异常,造成大量的业务请求超时监控消息的生成,因此会产生较多的告警通知;本实施例通过在同一业务请求标识的监控消息的响应状态满足预设的告警标准的情况下,进一步检查是否接收到告警对象发出的告警屏蔽通知,若否,则执行发送告警通知的步骤,显著提高业务的监控效率。
具体的,所述告警通知中可包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系,在发出告警通知时,在告警通知中携带上述与业务请求相关的信息,可使告警对象及时获知具体的监控消息的异常状态,以便其迅速进行处理。
具体的发送告警通知的过程,可根据预设的告警对象的告警路径发送该告警通知,其可以有多种形式,例如根据告警对象的邮箱地址,通过邮件方式发送告警通知;也可利用即时通讯应用,将告警通知发送给告警对象;也还可以采用电话或短信等告警方式,具体可根据实际需要而设计,对此本实施例不做具体限定。
本发明监控消息的告警方法和系统,监控消息中具有业务请求标识和业务请求的响应状态标识,业务请求标识用以标记该条业务请求具体涉及的业务内容,业务请求的响应状态标识用以标记该条业务请求的处理结果;相同业务请求标识的监控消息对应同一个业务,通过业务请求标识可对监控消息进行相关性聚集,即读取每个监控消息中携带的业务请求标识,可快速聚集同一业务类型的监控消息,迅速地从接收到的大量的监控消息中定位至每个业务,获得每个业务的响应状态;当判断满足预设的告警标准时,可将告警通知发送到预设的与所述业务关联的告警对象;本发明实施例能自动查找出发生故障的应用业务,并及时向与应用业务相关联的对象发出告警通知,显著提高应用运行维护效率。
本发明中的步骤虽然用标号进行了排列,但并不用于限定步骤的先后次序,除非明确说明了步骤的次序或者某步骤的执行需要其他步骤作为基础,否则步骤的相对次序是可以调整的。可以理解,本文中所使用的术语“和/或”涉及且涵盖相关联的所列项目中的一者或一者以上的任何和所有可能的组合。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种监控消息的告警方法,其特征在于,包括如下步骤:
采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
2.根据权利要求1所述的监控消息的告警方法,其特征在于,所述监控消息为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括所述业务请求标识、所述业务请求的响应状态标识以及业务请求的处理时间。
3.根据权利要求2所述的监控消息的告警方法,其特征在于,所述业务请求的响应状态标识包括业务请求成功标识或业务请求超时标识;
所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤,包括:
读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态。
4.根据权利要求3所述的监控消息的告警方法,其特征在于,所述根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态的步骤后,进一步包括步骤:
将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
或者进一步包括步骤:
将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果。
5.根据权利要求1所述的监控消息的告警方法,其特征在于,当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,进一步包括步骤:
检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;
若否,则执行所述查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象的步骤。
6.根据权利要求5所述的监控消息的告警方法,其特征在于,所述告警通知包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系。
7.一种监控消息的告警系统,其特征在于,包括:
采集模块,用于采集各应用平台的监控消息;其中,所述监控消息中具有业务请求标识和业务请求的响应状态标识;
响应状态获取模块,用于根据所述业务请求标识和所述业务请求的响应状态标识,获得同一业务请求标识的监控消息的响应状态;
告警模块,用于当判断所述同一业务请求标识的监控消息的响应状态满足预设的告警标准时,查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
8.根据权利要求7所述的监控消息的告警系统,其特征在于,所述监控消息为所述应用平台接收客户端发送的业务请求后按预设的监控属性字段生成的监控消息;其中,所述预设的监控属性字段包括业务请求标识、业务请求的响应状态标识以及业务请求的处理时间。
9.根据权利要求8所述的监控消息的告警系统,其特征在于,所述业务请求的响应状态标识包括业务请求成功标识或业务请求超时标识;
所述响应状态获取模块,包括:
读取模块,用于读取每个所述监控消息中的业务请求标识、业务请求的响应状态标识以及业务请求的处理时间;
记录模块,用于记录在预设的监控时间内,同一所述业务请求标识的所述监控消息的业务请求总量、业务请求成功量或业务请求超时量;
确定模块,用于根据所述业务请求成功量与所述业务请求总量的比例关系,或者所述业务请求超时量与所述业务请求总量的比例关系,确定所述监控消息的响应状态。
10.根据权利要求9所述的监控消息的告警系统,其特征在于,所述告警模块包括第一比较模块或第二比较模块;
所述第一比较模块用于将所述业务请求成功量与所述业务请求总量的比例关系与预设的第一告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果;
所述第二比较模块用于将所述业务请求超时量与所述业务请求总量的比例关系与预设的第二告警阈值进行比较,得到所述同一业务请求标识的监控消息的响应状态是否满足预设的告警标准的判断结果。
11.根据权利要求10所述的监控消息的告警系统,其特征在于,所述告警模块还用于在所述判断模块判断满足所述告警标准后,进一步检测是否接收到所述告警对象发送的对所述业务请求标识的告警屏蔽通知;若否,则查找预设的与所述业务请求标识对应的告警对象,将告警通知发送至所述告警对象。
12.根据权利要求11所述的监控消息的告警系统,其特征在于,所述告警通知中包括如下一个或多个信息:所述业务请求标识、所述业务请求总量、所述业务请求成功量、所述业务请求超时量、所述业务请求成功量与所述业务请求总量的比例关系或所述业务请求超时量与所述业务请求总量的比例关系。
CN201410401554.2A 2014-08-14 2014-08-14 监控消息的告警方法和系统 Active CN105373460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410401554.2A CN105373460B (zh) 2014-08-14 2014-08-14 监控消息的告警方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410401554.2A CN105373460B (zh) 2014-08-14 2014-08-14 监控消息的告警方法和系统

Publications (2)

Publication Number Publication Date
CN105373460A true CN105373460A (zh) 2016-03-02
CN105373460B CN105373460B (zh) 2019-03-26

Family

ID=55375679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410401554.2A Active CN105373460B (zh) 2014-08-14 2014-08-14 监控消息的告警方法和系统

Country Status (1)

Country Link
CN (1) CN105373460B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797902A (zh) * 2016-09-06 2018-03-13 北京百度网讯科技有限公司 用于监控机器人操作系统的消息传输频率的方法和装置
CN108920291A (zh) * 2018-06-06 2018-11-30 阿里巴巴集团控股有限公司 一种故障信息的收集方法、装置及设备
CN109039695A (zh) * 2018-06-08 2018-12-18 阿里巴巴集团控股有限公司 业务故障处理方法、装置及设备
CN109039740A (zh) * 2018-08-01 2018-12-18 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
CN109634806A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 电子装置、服务器集群监控方法及存储介质
CN109726082A (zh) * 2019-01-03 2019-05-07 中国银行股份有限公司 一种预警处理方法及系统
CN109947630A (zh) * 2019-03-14 2019-06-28 腾讯科技(深圳)有限公司 一种故障告示方法、装置及存储介质
CN110086666A (zh) * 2019-04-25 2019-08-02 深圳前海微众银行股份有限公司 一种告警方法、装置及系统
CN112181701A (zh) * 2020-09-23 2021-01-05 中国建设银行股份有限公司 一种定位异常业务请求的方法和装置
CN114389960A (zh) * 2022-01-04 2022-04-22 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409638A (zh) * 2008-11-19 2009-04-15 阿里巴巴集团控股有限公司 一种分布式业务系统故障告警的方法、系统和装置
CN101799910A (zh) * 2010-01-14 2010-08-11 中国建设银行股份有限公司 自助渠道业务系统的交易渠道状态的监控方法及系统
CN102056200A (zh) * 2009-11-09 2011-05-11 中国移动通信集团广西有限公司 一种业务处理流程监控方法和系统
CN105099510A (zh) * 2014-04-16 2015-11-25 阿里巴巴集团控股有限公司 基于无线近场通讯执行业务请求、响应的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409638A (zh) * 2008-11-19 2009-04-15 阿里巴巴集团控股有限公司 一种分布式业务系统故障告警的方法、系统和装置
CN102056200A (zh) * 2009-11-09 2011-05-11 中国移动通信集团广西有限公司 一种业务处理流程监控方法和系统
CN101799910A (zh) * 2010-01-14 2010-08-11 中国建设银行股份有限公司 自助渠道业务系统的交易渠道状态的监控方法及系统
CN105099510A (zh) * 2014-04-16 2015-11-25 阿里巴巴集团控股有限公司 基于无线近场通讯执行业务请求、响应的方法和装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797902A (zh) * 2016-09-06 2018-03-13 北京百度网讯科技有限公司 用于监控机器人操作系统的消息传输频率的方法和装置
CN108920291A (zh) * 2018-06-06 2018-11-30 阿里巴巴集团控股有限公司 一种故障信息的收集方法、装置及设备
CN109039695B (zh) * 2018-06-08 2021-07-06 创新先进技术有限公司 业务故障处理方法、装置及设备
CN109039695A (zh) * 2018-06-08 2018-12-18 阿里巴巴集团控股有限公司 业务故障处理方法、装置及设备
CN109039740A (zh) * 2018-08-01 2018-12-18 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
CN109039740B (zh) * 2018-08-01 2022-07-19 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
WO2020024376A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 一种处理运维监控告警的方法及设备
CN109634806A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 电子装置、服务器集群监控方法及存储介质
CN109726082A (zh) * 2019-01-03 2019-05-07 中国银行股份有限公司 一种预警处理方法及系统
CN109947630A (zh) * 2019-03-14 2019-06-28 腾讯科技(深圳)有限公司 一种故障告示方法、装置及存储介质
CN110086666A (zh) * 2019-04-25 2019-08-02 深圳前海微众银行股份有限公司 一种告警方法、装置及系统
CN112181701A (zh) * 2020-09-23 2021-01-05 中国建设银行股份有限公司 一种定位异常业务请求的方法和装置
CN114389960A (zh) * 2022-01-04 2022-04-22 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统
CN114389960B (zh) * 2022-01-04 2023-11-28 烽火通信科技股份有限公司 一种网络业务性能采集上报的方法和系统

Also Published As

Publication number Publication date
CN105373460B (zh) 2019-03-26

Similar Documents

Publication Publication Date Title
CN105373460A (zh) 监控消息的告警方法和系统
CN110830311B (zh) 网络质量探测方法、装置、设备和存储介质
CN104703125B (zh) 基于即时通信的信息推荐方法、装置和终端
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
CN113328872B (zh) 故障修复方法、装置和存储介质
US8935576B2 (en) Automated cabling process for a complex environment
CN111181801A (zh) 节点集群测试方法、装置、电子设备及存储介质
CN111274094B (zh) 接口预警方法、系统、设备及存储介质
CN112688806A (zh) 一种网络资产呈现的方法及系统
CN108306749B (zh) 一种监控系统报警方法、监控系统和监控装置
CN108021492A (zh) 一种告警合并方法及设备
CN104809054A (zh) 实现程序测试的方法和系统
CN115952096A (zh) 数据中心软件系统的故障检测方法、装置、设备、介质
CN110943887B (zh) 探针调度方法、装置、设备和存储介质
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
CN110515758B (zh) 一种故障定位方法、装置、计算机设备及存储介质
CN112256470A (zh) 故障服务器定位方法及装置、存储介质及电子设备
CN115904883A (zh) 一种rpa流程执行可视化异常监控方法、装置及介质
CN115906135A (zh) 目标数据泄露路径的溯源方法、装置、电子设备和存储介质
CN110825542A (zh) 一种分布式系统中故障盘的检测方法、装置及检测系统
CN114595848A (zh) 设备监管方法和装置
CN114546799A (zh) 埋点日志校验方法、装置、电子设备、存储介质及产品
CN113592305A (zh) 测试方法、装置、电子设备以及存储介质
CN114095394B (zh) 网络节点故障检测方法、装置、电子设备及存储介质
CN113312197A (zh) 批量故障的确定方法和装置,计算机存储介质和电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190812

Address after: 518000 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Co-patentee after: Tencent cloud computing (Beijing) limited liability company

Patentee after: Tencent Technology (Shenzhen) Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518000 Zhenxing Road, SEG Science Park 2 East Room 403

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.

TR01 Transfer of patent right