CN101646135B - 用于集群监控的告警通知方法及系统 - Google Patents

用于集群监控的告警通知方法及系统 Download PDF

Info

Publication number
CN101646135B
CN101646135B CN2009100918328A CN200910091832A CN101646135B CN 101646135 B CN101646135 B CN 101646135B CN 2009100918328 A CN2009100918328 A CN 2009100918328A CN 200910091832 A CN200910091832 A CN 200910091832A CN 101646135 B CN101646135 B CN 101646135B
Authority
CN
China
Prior art keywords
short message
alarm
note
warning
warning information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009100918328A
Other languages
English (en)
Other versions
CN101646135A (zh
Inventor
聂华
邵宗有
历军
刘欣然
杜翠兰
童晓民
白堃
刘润峰
李绍辉
刘庆伟
张锐
郭庆
温鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Dawning Information Industry Beijing Co Ltd
Original Assignee
National Computer Network and Information Security Management Center
Dawning Information Industry Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center, Dawning Information Industry Beijing Co Ltd filed Critical National Computer Network and Information Security Management Center
Priority to CN2009100918328A priority Critical patent/CN101646135B/zh
Publication of CN101646135A publication Critical patent/CN101646135A/zh
Application granted granted Critical
Publication of CN101646135B publication Critical patent/CN101646135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Alarm Systems (AREA)

Abstract

本发明提供一种用于集群监控的告警通知方法和系统,其中,该方法包括以下步骤:将预定发送策略存储在集群监控装置中。集群监控装置接收来自被监控集群的告警信息,根据告警信息生成短信信息,并将告警信息与预定发送策略匹配确定短信发送策略。集群监控装置根据短信发送策略,将短信信息和短信接收方发送至短信发送器或网络。短信发送器或网络接收来自集群监控装置的短信信息和短信接收方,并将短信信息发送至一个或多个便携式装置。一个或多个便携式装置接收来自短信发送器或网络的短信信息并将其呈现给用户。本发明通过以短信的方式发送告警信息实现了将告警信息实时通知到用户,通知不容易被忽略,并且不论用户在何地都可以接收到告警通知。

Description

用于集群监控的告警通知方法及系统
技术领域
本发明涉及计算机技术高性能领域,特别涉及一种告警通知方法及系统。
背景技术
现代机房服务器数量逐年增多,对于管理人员,需要及时掌握集群的情况,实时的对集群进行监控,将设备产生的告警通知给用户,以便及时解决问题。
现有技术对于问题的告警主要是通过邮件或者声音、动画等手段。邮件操作实现比较方便,但是由于会受到网络的影响,不能够保证及时地将告警通知到用户。动画、声音等手段的时效性高,但是用户必须在操作电脑时才能收到信息,而且即使用户在操作电脑也容易忽略这些情况。因此,需要一种方法和系统来解决上述问题。
发明内容
针对相关技术中存在的一个或多个问题,本发明的目的在于提供一种用于集群监控的告警通知方法及系统,以解决上述问题中的至少之一。
为实现上述目的,本发明一方面提出一种用于集群监控的告警通知方法,包括以下步骤:将预定发送策略存储在集群监控装置中。集群监控装置接收来自被监控集群的告警信息,根据告警信息生成短信信息,并将告警信息与预定发送策略匹配确定短信发送策略。集群监控装置根据短信发送策略,将短信信息和短信接收方发送至短信发送器或网络。短信发送器或网络接收来自集群监控装置的短信信息和短信接收方,并将短信信息发送至一个或多个便携式装置。一个或多个便携式装置接收来自短信发送器或网络的短信信息并将短信信息呈现给用户。
优选地,告警信息包括大型机信息、告警内容、告警等级和告警类型,发送策略包括告警属性、短信接收方、短信发送时间段、短信发送次数和短信发送时间间隔。
优选地,短信发送器与一个或多个便携式装置进行无线通信,短信发送器与集群监控装置进行有线通信。
本发明另一方面还提出一种用于集群监控的告警通知系统,包括集群监控装置、短信发送器、以及一个或多个便携式装置。其中,集群监控装置用于存储预定发送策略,接收来自被监控集群的告警信息,并根据告警信息生成短信信息,以及将告警信息与预定发送策略匹配确定短信发送策略,根据短信发送策略,将短信信息和短信接收方发送至短信发送器。短信发送器用于接收来自集群监控装置的短信信息和短信发送方,并将短信信息发送至一个或多个便携式装置。一个或多个便携式装置用于接收来自短信发送器的短信信息并将短信信息呈现给用户。
优选地,集群监控装置包括策略存储模块、接收模块、匹配模块、短信生成模块和发送模块。其中,策略存储模块用于存储预定发送策略。接收模块用于接收来自被监控集群的告警信息。匹配模块用于解析告警信息,并与预定发送策略匹配确定短信发送策略。短信生成模块用于根据告警信息生成短信信息。发送模块用于根据匹配模块确定的短信发送策略,在短信发送时间段,将短信接收方和短信信息发送给短信发送器。
借助本发明上述至少一个技术方案,通过以短信的方式发送告警信息实现了将告警信息实时通知到用户,通知不容易被忽略,并且不论用户在何地都可以接收到告警通知的效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明的用于集群监控的告警通知方法的流程图;
图2为根据本发明的一个告警信息例子的示意图;以及
图3为根据本发明的用于集群监控的告警通知系统的结构图。
具体实施方式
考虑到相关技术中存在的问题,本发明提供一种用于集群监控的告警通知方法及系统。下面详细描述本发明的实施例,所述实施例的示例在附图中示出。应理解,下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
图1为根据本发明的用于集群监控的告警通知方法的流程图,如图1所示,该方法包括以下步骤:
步骤S110,将预定发送策略存储在集群监控装置。
发送策略包括:告警属性、短信接收方、短信发送时间段、短信发送次数和短信发送时间间隔。
具体地,本发明提出的可能的预定发送策略方案如下。当然本领域技术人员还能够根据下述方案提出其他修改或变化,这些修改或变化均应包含在本发明的包含范围之内。
针对每种类型的告警,都有其相关的维护管理人员。在预定发送策略中,设定短信接收方为与告警类型对应的业务人员,且每个业务人员的姓名与手机号码一一对应。
下面以一个例子说明短信发送时间段的预定策略:对应告警等级为关键的告警,发送时间段为不限,即任何时间下都要发送告警;对应告警等级为主要的告警,发送时间段为每天的早八点至晚六点;对应告警等级为次要的告警,发送时间段为每周的周一至周五的早八点至晚六点,避免在非工作时间影响工作人员的休息;对应告警等级为警告和不确定的告警,发送时间段为每周的周一至周五的早八点至中午十二点。
应理解,上述实施例仅是示意性的实施例,并不限制本发明的范围,本领域的技术人员还能够根据实际情况更改不同告警等级的告警的发送时间段。并且,在本实施例中,默认对所有告警等级的告警均发送短信,当然也可以设置等级过滤,只对某一个或某几个告警等级的告警发送短信。
还应理解,告警等级越高的告警,发送次数应越多,以确保告警信息送达接收人。类似的,告警等级越高的告警,发送时间间隔应越小,以保证告警信息能够及时送达接收人。因此,在预定发送策略中,设定告警等级为关键、主要和次要的告警的发送次数为2次,告警等级为警告和不确定的告警的发送次数为1次。告警等级为关键的告警的发送时间间隔为半小时,告警等级为主要的告警的发送时间间隔为1小时,告警等级为次要的告警的发送时间间隔为2小时。
步骤S120,集群监控装置接收来自被监控集群的告警信息,并根据告警信息生成短信信息,以及将告警信息与预定发送策略匹配确定短信发送策略。
被监控集群的告警信息包括大型机信息、告警内容、告警等级和告警类型。其中,告警等级从高到低依次分为关键、主要、次要、警告和不确定五个等级。告警类型包括通信告警、设备告警、环境告警、软件告警和存储告警。告警内容包括告警设备和告警对象。
图2示出了一个告警信息的例子。在图2中,告警类型为设备告警、告警等级为次要,告警内容中描述了告警设备为node11、告警对象为CPU、告警原因为CPU利用率过高、系统建议为合理利用服务器资源。应理解,这仅是一个示意性的例子,并不限制本发明的范围。具体的匹配过程如下:
首先,根据告警类型确定短信接收方。以上述告警信息和预定发送策略的例子为例,告警类型为设备告警,则短信接收方为负责管理设备的业务人员。
然后,根据告警等级确定短信发送时间段。
以上述告警信息和预定发送策略的例子为例,告警等级为次要,则短信发送时间段为每周的周一至周五的早八点至晚六点,避免在非工作时间影响工作人员的休息。
最后,根据告警等级确定短信发送次数和短信发送时间间隔。以上述告警信息和预定发送策略的例子为例,告警等级为次要,则发送次数为2次,发送时间间隔为2小时。
除了根据告警信息制定发送策略之外,还根据告警信息生成相应的短信信息。以上述告警信息的例子为例,则生成的短信信息为“设备node11的CPU利用率过高”,此外,短信信息中还应包含告警发生的时间。
步骤S130,集群监控装置根据发送策略,将短信信息和短信接收方发送至短信发送器或网络。
以上述告警信息和预定发送策略的例子为例,应在每周的周一至周五的早八点至晚六点,将负责管理设备的业务人员的手机号和短信信息通过有线通信的方式发送至短信发送器或网络。
步骤S140,短信发送器或网络将短信信息发送至一个或多个便携式装置。
短信发送器或网络发送短信信息的技术为本领域技术人员所熟知,此处为了简单起见,不再详细描述。
步骤S150,一个或多个便携式装置接收来自短信发送器或网络的短信信息并将短信信息呈现给用户。
本发明还提出一种用于集群监控的告警通知系统。图3为根据本发明的用于集群监控的告警通知系统的结构图。如图3所示,该系统包括集群监控装置100、短信发送器200、以及一个或多个便携式装置300。其中,集群监控装置100用于存储预定发送策略,接收来自被监控集群的告警信息,并根据告警信息生成短信信息,以及将告警信息与预定发送策略匹配确定短信发送策略,根据短信发送策略,将短信信息和短信接收方发送至短信发送器200。短信发送器200用于接收来自集群监控装置100的短信信息和短信发送方,并将短信信息发送至一个或多个便携式装置300。一个或多个便携式装置300用于接收来自短信发送器200的短信信息并将短信信息呈现给用户。
集群监控装置100包括策略存储模块110、接收模块120、匹配模块130、短信生成模块140和发送模块150。其中,策略存储模块110用于存储预定发送策略。接收模块120用于接收来自被监控集群的告警信息。匹配模块130用于解析告警信息,并与预定发送策略匹配确定短信发送策略。短信生成模块140用于根据告警信息生成短信信息。发送模块150用于根据匹配模块130确定的短信发送策略,在短信发送时间段,将短信接收方和短信信息发送给短信发送器200。
本发明通过以短信的方式发送告警信息实现了将告警信息实时通知到用户,通知不容易被忽略,并且不论用户在何地都可以接收到告警通知。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。

Claims (1)

1.一种用于集群监控的告警通知方法,其特征在于,所述方法包括以下步骤:
将预定发送策略存储在集群监控装置中;
所述集群监控装置接收来自被监控集群的告警信息,根据所述告警信息生成短信信息,并将所述告警信息与所述预定发送策略匹配确定短信发送策略;
所述集群监控装置根据所述短信发送策略,将所述短信信息和短信接收方发送至短信发送器或网络;
所述短信发送器或所述网络接收来自所述集群监控装置的短信信息和短信接收方,并将所述短信信息发送至一个或多个便携式装置;以及
所述一个或多个便携式装置接收来自所述短信发送器或所述网络的短信信息并将所述短信信息呈现给用户;
其中,所述告警信息包括以下至少之一:大型机信息、告警内容、告警等级和告警类型;
所述发送策略包括以下至少之一:告警属性、短信接收方、短信发送时间段、短信发送次数、以及短信发送时间间隔,在预定发送策略中,设定告警等级为关键、主要和次要的告警的发送次数为2次,告警等级为警告和不确定的告警的发送次数为1次;
短信发送时间段的预定策略:对应告警等级为关键的告警,发送时间段为不限,即任何时间下都要发送告警;对应告警等级为主要的告警,发送时间段为每天的早八点至晚六点;对应告警等级为次要的告警,发送时间段为每周的周一至周五的早八点至晚六点;对应告警等级为警告和不确定的告警,发送时间段为每周的周一至周五的早八点至中午十二点;
所述短信发送器与一个或多个所述便携式装置进行无线通信;
所述短信发送器与所述集群监控装置进行有线通信。
CN2009100918328A 2009-08-28 2009-08-28 用于集群监控的告警通知方法及系统 Active CN101646135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100918328A CN101646135B (zh) 2009-08-28 2009-08-28 用于集群监控的告警通知方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100918328A CN101646135B (zh) 2009-08-28 2009-08-28 用于集群监控的告警通知方法及系统

Publications (2)

Publication Number Publication Date
CN101646135A CN101646135A (zh) 2010-02-10
CN101646135B true CN101646135B (zh) 2011-12-07

Family

ID=41657802

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100918328A Active CN101646135B (zh) 2009-08-28 2009-08-28 用于集群监控的告警通知方法及系统

Country Status (1)

Country Link
CN (1) CN101646135B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102316207B (zh) * 2010-06-29 2016-04-27 上海贝尔股份有限公司 在终端中用于处理消息的方法和装置
CN102404284A (zh) * 2010-09-10 2012-04-04 中华电信股份有限公司 网络式报警系统及方法
CN102487481B (zh) * 2010-12-01 2014-06-25 中国移动通信集团上海有限公司 告警信息发送系统、方法及设备
CN103051822A (zh) * 2011-10-12 2013-04-17 中兴通讯股份有限公司 告警信息的发送方法及装置、安防业务平台
CN102571413B (zh) * 2011-12-02 2015-04-29 曙光信息产业(北京)有限公司 一种集群环境下资源管理的方法
CN102833099A (zh) * 2012-08-15 2012-12-19 曙光信息产业(北京)有限公司 一种可扩展的告警应急处理系统及其控制方法
CN103905230A (zh) * 2012-12-28 2014-07-02 苏州工业园区进一科技有限公司 一种在线异常管理系统
CN103401698B (zh) * 2013-07-02 2017-03-15 北京奇虎科技有限公司 用于服务器集群运算中对服务器状况报警的监控系统
CN104092577B (zh) * 2014-07-31 2019-11-29 上海斐讯数据通信技术有限公司 一种网络告警通知系统及其通知方法
CN104967537A (zh) * 2015-06-30 2015-10-07 北京奇艺世纪科技有限公司 一种报警信息推送方法及装置
CN105635158A (zh) * 2016-01-07 2016-06-01 福建星网智慧科技股份有限公司 一种基于sip的语音电话自动告警方法
CN106357442A (zh) * 2016-09-13 2017-01-25 郑州云海信息技术有限公司 一种服务器集群监控方法及系统
CN106602720A (zh) * 2016-10-20 2017-04-26 国网山东省电力公司菏泽供电公司 一种基于ems平台的短信告警系统及方法
CN106789187A (zh) * 2016-12-02 2017-05-31 国网北京市电力公司 配电网告警管理的方法和系统
CN106972978A (zh) * 2017-05-27 2017-07-21 郑州云海信息技术有限公司 一种系统告警推送方法及装置
CN108928700B (zh) * 2018-08-20 2020-02-21 山东润一智能科技有限公司 医院电梯安全立体监测云平台、系统及其方法、电梯系统
CN108750854B (zh) * 2018-08-20 2020-06-16 山东润一智能科技有限公司 医院电梯安全立体监测云平台、系统及其方法、电梯系统
CN111209270A (zh) * 2019-12-24 2020-05-29 曙光信息产业(北京)有限公司 一种基于MapReduce技术的集群监控原始数据抽样计算和存储方法
CN112383887A (zh) * 2020-11-02 2021-02-19 安徽泡泡云信息技术服务有限公司 一种基于人工智能的短信推送系统
CN113709206A (zh) * 2021-07-13 2021-11-26 上海威派格智慧水务股份有限公司 一种统一消息发送接收配置管理系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101183996A (zh) * 2007-12-13 2008-05-21 浪潮电子信息产业股份有限公司 一种集群信息的监控方法
CN101188524A (zh) * 2007-09-28 2008-05-28 中国移动通信集团福建有限公司 Gprs业务监控系统
CN101329564A (zh) * 2008-07-25 2008-12-24 北京劲源信科技有限公司 一种机房管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101188524A (zh) * 2007-09-28 2008-05-28 中国移动通信集团福建有限公司 Gprs业务监控系统
CN101183996A (zh) * 2007-12-13 2008-05-21 浪潮电子信息产业股份有限公司 一种集群信息的监控方法
CN101329564A (zh) * 2008-07-25 2008-12-24 北京劲源信科技有限公司 一种机房管理系统

Also Published As

Publication number Publication date
CN101646135A (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
CN101646135B (zh) 用于集群监控的告警通知方法及系统
EP2736200B1 (en) Transmission of notifications to multiple devices associated with a user
CN101917437B (zh) 基于sip的用户离线检测方法以及sip用户状态检测系统
CN104967537A (zh) 一种报警信息推送方法及装置
CN102821084B (zh) 开放平台标识方法、开放平台及系统
CN102647396A (zh) 一种快递邮件收发系统及其方法
CN1645816A (zh) 邮箱轮询优先准则
EP2461279A1 (en) Processing of associated messages from plural social network services
CN101179532B (zh) 一种邮件服务器系统及邮件分发的方法
CN102820993A (zh) 网络资源监控系统和网络资源监控方法
CN111131082A (zh) 一种充电设施数据传输动态控制方法及系统
CN103905222A (zh) 一种检测即时通信登录故障的方法和系统
US8391307B2 (en) Method for handling communications over a non-permanent communication link
CN103840962B (zh) 服务器告警输出方法及系统
CN101860557A (zh) 一种按周期统计系统最高在线人数的方法
CN101695049A (zh) 一种监控系统中的业务处理方法及装置
CN110674013A (zh) 一种云平台可自定义监控的gpu监控告警系统
CN105791023A (zh) 光网络单元onu管理的方法、装置以及系统
US10291490B1 (en) System and method for collecting data from low-availability devices
CN101163040B (zh) 一种自动向用户通知被监控设备连接状态的方法
CN113824759A (zh) 政务服务大厅签到数据传输处理方法及计算机可读介质
CN102136972A (zh) 一种超大规模集群监控系统及方法
CN116155831B (zh) 一种用于铁路生产管理系统的数据传输方法和系统
CN110460470A (zh) 一种告警管理系统
CN212411341U (zh) 一种工业报警通知系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: STATE COMPUTER NETWORK AND INFORMATION SAFETY MANA

Free format text: FORMER OWNER: SUGON INFORMATION INDUSTRIAL (BEIJING) CO., LTD.

Effective date: 20110816

Owner name: SUGON INFORMATION INDUSTRIAL (BEIJING) CO., LTD.

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Nie Hua

Inventor after: Liu Qingwei

Inventor after: Zhang Rui

Inventor after: Guo Qing

Inventor after: Wen Xin

Inventor after: Shao Zongyou

Inventor after: Li Jun

Inventor after: Liu Xinran

Inventor after: Du Cuilan

Inventor after: Tong Xiaomin

Inventor after: Bai Kun

Inventor after: Liu Runfeng

Inventor after: Li Shaohui

Inventor before: Nie Hua

Inventor before: Shao Zongyou

Inventor before: Li Jun

Inventor before: Liu Runfeng

Inventor before: Li Shaohui

Inventor before: Liu Qingwei

Inventor before: Zhang Rui

Inventor before: Guo Qing

Inventor before: Wen Xin

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100084 HAIDIAN, BEIJING TO: 100029 CHAOYANG, BEIJING

Free format text: CORRECT: INVENTOR; FROM: NIE HUA SHAO ZONGYOU LI JUN LIU RUNFENG LI SHAOHUI LIU QINGWEI ZHANG RUI GUO QING WEN XIN TO: NIE HUA SHAO ZONGYOU LI JUN LIU XINRAN DU CUILAN TONG XIAOMIN BAI KUN LIU RUNFENG LI SHAOHUI LIU QINGWEI ZHANG RUI GUO QING WEN XIN

TA01 Transfer of patent application right

Effective date of registration: 20110816

Address after: 100029 Beijing Chaoyang District Yumin Road No. 3

Applicant after: State Computer Network and Information Safety Management Center

Co-applicant after: Dawning Information Industry (Beijing) Co., Ltd.

Address before: 100084 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing, Haidian District

Applicant before: Dawning Information Industry (Beijing) Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant