CN101615015A - 由监控告警自动触发控制动作的实现方法 - Google Patents

由监控告警自动触发控制动作的实现方法 Download PDF

Info

Publication number
CN101615015A
CN101615015A CN200910181225A CN200910181225A CN101615015A CN 101615015 A CN101615015 A CN 101615015A CN 200910181225 A CN200910181225 A CN 200910181225A CN 200910181225 A CN200910181225 A CN 200910181225A CN 101615015 A CN101615015 A CN 101615015A
Authority
CN
China
Prior art keywords
alarm
action
execution
agent
transponder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910181225A
Other languages
English (en)
Inventor
王扬勇
贾代乾
李华
梁斌
孙力斌
刘国祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LINKAGE SYSTEM INTEGRATION CO Ltd
Linkage Technology Co Ltd
Original Assignee
LINKAGE SYSTEM INTEGRATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LINKAGE SYSTEM INTEGRATION CO Ltd filed Critical LINKAGE SYSTEM INTEGRATION CO Ltd
Priority to CN200910181225A priority Critical patent/CN101615015A/zh
Publication of CN101615015A publication Critical patent/CN101615015A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Alarm Systems (AREA)

Abstract

由监控告警自动触发控制动作的实现方法,业务监控系统以消息的方式发布告警信息,由业务监控系统告警中转器和告警触发动作控制器进行:告警中转器通过java.util.EventListener进行监听告警事件,并把告警事件提交到各个告警触发动作控制器处理;告警中转器接收发布告警后进行告警接收并触发动作执行,在监控系统中预先配置告警规则表,表中保存告警跟控制动作的对应关系,由告警触发动作控制器接收触发动作执行信息后进行控制动作的告警规则过滤,通过告警过滤获得可执行动作,并根据动作设定可通过telnet或代理agent方式完成对应的控制动作执行。本发明解决了现有监控系统中不能由告警自动触发动作的问题。

Description

由监控告警自动触发控制动作的实现方法
一、技术领域
本发明通过业务监控系统发出的告警,实现由告警自动触发业务控制动作的方法,并完成动作的执行。
二、背景技术
目前在业界的业务监控系统中,监控系统对业务进行监控,发现不正常现象发出告警,通过不同方式(包括短信、电话、邮件等)提醒责任人,然后责任人再进行处理,这是我们常见监控系统的功能。但是很多时候业务问题发生在夜间,或者责任人收到告警的时候不在现场或不具备处理条件,延误处理时机造成不必要的损失。
三、发明内容
本发明目的是:为克服当前业务监控系统发现告警通知责任人之后不能及时进行问题处理的问题,本发明提供一种由监控告警自动触发控制动作的实现方法,使得监控告警在通知责任人的同时自动触发控制动作,由业务监控系统在第一时间处理问题,把风险降到最低,同时可以降低人力成本。
本发明的技术方案是:由监控告警自动触发控制动作的实现方法,业务监控系统以消息的方式发布告警信息,由业务监控系统的告警中转器和告警触发动作控制器进行相应动作,告警中转器是通过java.util.EventListener进行监听告警事件,并把告警事件提交到各个告警触发动作控制器处理;告警中转器接收发布告警后进行告警接收并触发动作执行,在监控系统中预先配置告警规则表,表中保存告警跟控制动作的对应关系,由告警触发动作控制器接收触发动作执行信息后进行控制动作的告警规则过滤,通过告警过滤获得可执行动作,并根据动作设定可通过telnet或代理agent方式完成对应的控制动作执行。
本发明预先在监控管理系统中配置好告警动作对应关系,每个动作具有ID标识,然后把动作跟告警进行关联,当监控系统发出告警时,告警中转器接收告警,根据告警的代码、告警来源、告警关键字、告警内容进行过滤,结合字符串的最大匹配算法,针对不同业务情况发出的告警自动触发控制动作。
本发明的有效益果是,可以在告警发出的同时实现业务控制,及时有效的处理业务问题,降低风险,节省人力成本。
四、具体实施方式
业务监控系统以消息的方式发布告警信息,由业务监控系统告警中转器和告警触发动作控制器进行如下步骤:
a)自动触发:告警中转器实现listener(告警接收)和AlarmTransmitterManager(告警接收并触发动作)接口,监听监控系统所发出的消息事件,接收告警类消息,实现onEvent方法(产生消息的执行函数),所有具有告警信息标识的事件经中转器接收,中转器实现transmit方法把接收告警提交给各个动作执行控制器进行处理,在transmit中,根据预先配置好的告警和动作的对应关系,把接收到的告警跟配置表中的告警进行比对,找出匹配的动作类别,然后提交给各个控制器,实现告警自动触发动作。
在告警匹配中采用字符串的最大匹配算法。
算法设计:本算法涉及到匹配度的概念,匹配度为字符串间的匹配程度,也就是两个字符串间的相似程度。对于给定的两个字符串S(源字符串)和T(目标字符串)之间的匹配根据权值计算匹配度,将S和T按字节分割成独立的字符串单元并分别存放在字符串数组中,一个字符串对应一个权值。将S和T的权值分别定义为Ws和Wt,字符串单元存放的数组从0开始计数,分别将S和T分割成了0到m和0到n个单元。Ws=1/m+1,Wt=1/n+1,开始扫描S和T字符串,如果遇到字符串单元相同的时候权值相乘。最后得到一个sum=Ws*Wt,sum即为匹配度,根据sum的值进行冒泡排序,权值由大到小排列。
算法编码实现:简要代码如下
b)动作执行:告警触发动作控制器完成动作的执行;一旦有告警提交给告警触发动作控制器,控制器根据告警与动作对应关系得到相匹配的动作列表,选择telnet(远程登录)或agent代理方式执行,选择telnet方式,则telnet目标主机,设置超时时间5s,超时退出重新生成告警提醒责任人动作执行期间出现超时问题,动作执行失败;无其他异常则完成业务指令执行,选择agent代理方式,只要借助网管监控系统的agent即可实现,由agent执行预先编写好的action来完成动作执行。
(1)实现进程启停。设置停机数目监控,当停机数达到一定值时,自动停止停机业务进程。未采用本发明之前,监控系统监控停机数,达到阀值发送短信提醒给责任人,然后责任人登录系统重新启动停机业务进程,而本发明运用之后,当监控系统发出告警,中转器接收该告警并提交告警触发动作控制器,执行预先配置好的动作,来完成停机进程的重新启动。根据经验停机数监控告警一般是凌晨产生,通过本发明负责人不必要凌晨再爬起来处理告警,完全由告警自动触发动作完成。
(2)本发明实现表空间自动管理。监控系统实现对数据库表空间使用情况进行监控,表空间使用率达到90%产生告警,本发明通过预先配置动作,设置表空间中使用比较大且能够清理的表,自动完成表空间清理,并根据数据量增长趋势实现自动扩容功能。防止数据库表空间使用率过大出现异常的情况。
(3)本发明实现日志清理。监控系统设置对日志文件系统大小监控,当该日志文件系统使用率达到一定程度,预先配置清理日志文件系统的动作,由本发明自动触发动作执行,完成自动备份并清理日志功能。防止文件系统撑满,无法续写日志的问题。
算法编码实现:简要代码如下:
public float match(String s,String t){
         float value=0.0f;int x,y;String ss,tt,ss1,tt1;
         //去除前后空格
         ss=s.trim();tt=t.trim();
         //全角空格代替半角空格
         String st=ss.replaceAll(″″,″″);
         String s1[]=new String[st.length()];
         String t1[]=new String[tt.length()];
         for(int i=0;i<st.length();i++){
              s1[i]=st.substring(i,i+1);}
         for(int j=0;j<st.length();j++){
              t1[j]=tt.substring(j,j+1);}
         float result[]=new float[Math.max(s1.length,t1.length)];
         for(x=0;x<s1.length;x++){
              result[x]=(float)1/(float)(x+1);}
         for(y=0;y<t1.length;y++){
              result[y]=(float)1/(float)(y+1);}
         for(x=0;x<s1.length;x++){
              for(y=0;y<t1.length;y++){
                   ss1=s1[x];
                   tt1=t1[y];
                   if(ss1.equals(tt1)){
                         value+=result[x]*result[y];
                   }
              }
         return value;
    }。

Claims (5)

1、由监控告警自动触发控制动作的实现方法,其特征是业务监控系统以消息的方式发布告警信息,由业务监控系统告警中转器和告警触发动作控制器进行如下步骤:告警中转器通过java.util.EventListener进行监听告警事件,并把告警事件提交到各个告警触发动作控制器处理;告警中转器接收发布告警后进行告警接收并触发动作执行,在监控系统中预先配置告警规则表,表中保存告警跟控制动作的对应关系,由告警触发动作控制器接收触发动作执行信息后进行控制动作的告警规则过滤,通过告警过滤获得可执行动作,并根据动作设定可通过telnet或代理agent方式完成对应的控制动作执行。
2、根据权利要求1所述的由监控告警自动触发控制动作的实现方法,其特征是动作控制器根据告警与动作对应关系得到相匹配的动作列表,选择telnet方式,telnet目标主机,设置超时时间5s,超时退出重新生成告警提醒责任人动作执行期间出现超时问题,动作执行失败;无其他异常则完成业务指令执行;选择agent代理方式,借助网管监控系统的agent,由agent执行预先编写好的action来完成动作执行。
3、根据权利要求1所述的由监控告警自动触发控制动作的实现方法,其特征是设置停机数目监控,当停机数达到一定值时,自动停止停机业务进程。
4、根据权利要求1所述的由监控告警自动触发控制动作的实现方法,其特征是监控系统实现对数据库表空间使用情况进行监控,表空间使用率达到90%产生告警,通过预先配置动作,设置表空间中使用比较大且能够清理的表,自动完成表空间清理,并根据数据量增长趋势实现自动扩容功能。防止数据库表空间使用率过大出现异常的情况。
5、根据权利要求1所述的由监控告警自动触发控制动作的实现方法,其特征是以下述步骤实现a)自动触发:业务监控系统告警中转器实现告警接收并触发告警触发动作控制器AlarmTransmitterManager,接收告警类消息,实现产生消息的执行函数onEvent方法,所有具有告警信息标识的事件经中转器接收,中转器实现transmit方法把接收告警提交给各个动作执行控制器进行处理,在transmit中,根据预先配置好的告警和动作的对应关系,把接收到的告警跟配置表中的告警进行比对,找出匹配的动作类别,然后提交给各个控制器,实现告警自动触发动作;在告警匹配中采用字符串的最大匹配算法;
b)动作执行:告警触发动作控制器完成动作的执行;一旦有告警提交给告警触发动作控制器,控制器根据告警与动作对应关系得到相匹配的动作列表,选择远程登录telnet或代理方式agent执行,选择telnet方式,则telnet目标主机,设置超时时间5s,超时退出重新生成告警提醒责任人动作执行期间出现超时问题,动作执行失败;无其他异常则完成业务指令执行;选择agent代理方式,借助网管监控系统的agent实现,由agent执行预先编写好的action来完成动作执行。
CN200910181225A 2009-07-20 2009-07-20 由监控告警自动触发控制动作的实现方法 Pending CN101615015A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910181225A CN101615015A (zh) 2009-07-20 2009-07-20 由监控告警自动触发控制动作的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910181225A CN101615015A (zh) 2009-07-20 2009-07-20 由监控告警自动触发控制动作的实现方法

Publications (1)

Publication Number Publication Date
CN101615015A true CN101615015A (zh) 2009-12-30

Family

ID=41494695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910181225A Pending CN101615015A (zh) 2009-07-20 2009-07-20 由监控告警自动触发控制动作的实现方法

Country Status (1)

Country Link
CN (1) CN101615015A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339256A (zh) * 2011-09-15 2012-02-01 东北大学 基于imf内外存置换策略的复杂事件检测方法
CN104699807A (zh) * 2015-03-23 2015-06-10 上海新炬网络信息技术有限公司 一种oracle数据表空间的自动监控扩容方法
CN104778825A (zh) * 2015-01-09 2015-07-15 中华电信股份有限公司 一种智能小区的设备与告警事件处理方法及其系统
CN106897387A (zh) * 2017-01-23 2017-06-27 北京思特奇信息技术股份有限公司 基于动作模拟的业务探测方法
CN107148767A (zh) * 2014-10-30 2017-09-08 亚马逊科技公司 提供商网络中的基于规则的动作触发
CN109783306A (zh) * 2018-11-27 2019-05-21 宝付网络科技(上海)有限公司 响应报警的处理动作方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102339256A (zh) * 2011-09-15 2012-02-01 东北大学 基于imf内外存置换策略的复杂事件检测方法
CN102339256B (zh) * 2011-09-15 2013-10-16 东北大学 基于imf内外存置换策略的复杂事件检测方法
CN107148767A (zh) * 2014-10-30 2017-09-08 亚马逊科技公司 提供商网络中的基于规则的动作触发
CN107148767B (zh) * 2014-10-30 2021-01-12 亚马逊科技公司 提供商网络中的基于规则的动作触发方法及系统
CN104778825A (zh) * 2015-01-09 2015-07-15 中华电信股份有限公司 一种智能小区的设备与告警事件处理方法及其系统
CN104778825B (zh) * 2015-01-09 2017-11-28 中华电信股份有限公司 一种智能小区的设备与告警事件处理方法及其系统
CN104699807A (zh) * 2015-03-23 2015-06-10 上海新炬网络信息技术有限公司 一种oracle数据表空间的自动监控扩容方法
CN104699807B (zh) * 2015-03-23 2018-05-15 上海新炬网络信息技术股份有限公司 一种oracle数据表空间的自动监控扩容方法
CN106897387A (zh) * 2017-01-23 2017-06-27 北京思特奇信息技术股份有限公司 基于动作模拟的业务探测方法
CN106897387B (zh) * 2017-01-23 2020-11-24 北京思特奇信息技术股份有限公司 基于动作模拟的业务探测方法
CN109783306A (zh) * 2018-11-27 2019-05-21 宝付网络科技(上海)有限公司 响应报警的处理动作方法及系统

Similar Documents

Publication Publication Date Title
CN101615015A (zh) 由监控告警自动触发控制动作的实现方法
CN104838370B (zh) 传输通知至与用户相关联的多个设备
CN103380603B (zh) 用于分配有意义的临床警报的系统和方法
CN101646135B (zh) 用于集群监控的告警通知方法及系统
CN102562162B (zh) 一种基于事件处理的煤矿报警系统及方法
CN206224515U (zh) 一种具有人流量采集功能的智能广告机
CN104811327A (zh) 一种监控告警语音自动通知的方法和装置
CN103856392A (zh) 消息推送方法及其外发服务器和外发服务器系统
WO2008150533A3 (en) Monitoring market data to identify user defined market conditions
CN102902583A (zh) 在挂起状态和执行状态下管理进程
CN103905533A (zh) 基于云存储的分布式告警监控方法和系统
CN102355482A (zh) 一种数据传输方法及设备
CN102999384A (zh) 在挂起状态和执行状态下管理进程
CN104408654A (zh) 一种财务监控管理系统
CN103208170A (zh) 一种多客户端接收报警信息的方法和系统
CN106330643A (zh) 一主多从通信网络的通信方法及通信装置
CN103150241A (zh) 多服务器状态监控管理系统和方法
WO2012126243A1 (zh) 一种地址池分配系统及方法
CN103856344A (zh) 一种告警事件信息处理方法及装置
CN104765672B (zh) 错误码监控方法、装置及设备
CN104156299A (zh) 一种用于并行系统的监测方法
WO2015154366A1 (zh) 一种基于策略的m2m终端设备监测控制方法和装置
CN107862811A (zh) 自助终端设备及其健康状态监控方法及装置、存储介质
CN104348653A (zh) 云管理平台的用户任务实现方法、系统与触发器
CN106817262A (zh) 一种日志分析装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091230