CN104168141A - 一种自动维护业务系统的方法 - Google Patents

一种自动维护业务系统的方法 Download PDF

Info

Publication number
CN104168141A
CN104168141A CN201410403330.5A CN201410403330A CN104168141A CN 104168141 A CN104168141 A CN 104168141A CN 201410403330 A CN201410403330 A CN 201410403330A CN 104168141 A CN104168141 A CN 104168141A
Authority
CN
China
Prior art keywords
maintenance
alarm
subsystem
event
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410403330.5A
Other languages
English (en)
Inventor
柯宗贵
杨育斌
李佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blue Shield Information Security Technology Co Ltd
Bluedon Information Security Technologies Co Ltd
Original Assignee
Blue Shield Information Security Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Blue Shield Information Security Technology Co Ltd filed Critical Blue Shield Information Security Technology Co Ltd
Priority to CN201410403330.5A priority Critical patent/CN104168141A/zh
Publication of CN104168141A publication Critical patent/CN104168141A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种智能维护业务系统的方法,该方法是在业务系统产生告警、系统事件后,由SOC系统进行收集,并生成维护命令,发送给维护子系统,然后由维护子系统自动调用相关的维护程序,对具体的告警类型及事件进行维护处理,并将处理结果形成维护报告,发送给相关维护人员。通过本发明采用了智能识别故障及事件,并对系统进行自动维护的方法,从而实现了根据事件及告警对系统进行自动维护的目的。

Description

一种自动维护业务系统的方法
技术领域
本发明涉及网络监控技术领域,尤其涉及一种自动维护业务系统的方法。
背景技术
随着IT业务应用不断增多,传统评价体系越来越不能反映终端用户的感受和整体业务的质量情况。零散的多类业务系统在满足公司业务、协助公司办公、解决网络环境安全的同时,系统管理员对感知业务应用整体质量的需求也日益升温。为解决客户业务运维管理的新挑战,为用户提供一站式智能化、自动化的监管方案,站在最终用户的角度,通过模拟交易和真实用户两种监控方式,以可量化、可视化、自动化技术手段,测量企业各IT业务系统服务的响应性能,帮助用户准确感知整体业务的性能和质量状况势在必行。特别是当系统产生了告警或某些事件后,必然需要进行后续处理。目前主流的做法是由系统通知维护人员进行处理,不会自动对这告警及事件进行维护处理。
发明内容
本发明为了解决现有技术中无法及时对告警及事件进行自动处理的缺点或不足,采用了智能识别故障及事件,并对系统进行自动维护的方法,从而实现了根据事件及告警对系统进行自动维护的目的。
本发明为了实现上述目的,提供了一种自动维护业务系统的方法,该方法为:在业务系统产生告警、系统事件后,由SOC系统进行收集,并生成维护命令,发送给维护子系统,然后由维护子系统自动调用对应的维护程序,对具体的告警类型及事件类型进行自动维护处理;维护程序处理完毕后,会将维护结果发送给维护子系统,由维护子系统推送给SOC系统,SOC系统最终形成维护报告发送给相关维护人员。
其中,SOC系统负责收集各种业务系统、主机、网络设备的日志、事件、告警,并产生相关的告警及事件,同时负责生成维护命令,推送给维护子系统的接收队列。
本发明技术方案带来的有益效果:
1.可快速自动处理故障,提高了故障处理效率和实时性。
2.可自动定位故障,自动解决故障,无人工干预环节,对故障处理及定位更高效。
3.可以代替人工,完成日常的系统维护、巡检,有效降低人力成本。
4.告警系统与维护系统分离,可实现对多套业务系统、网络设备、主机设备的分布式监控及自动维护。
5.可自定义维护程序,对维护子系统进行扩展,并动态进行热部署。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明主要针对业务系统产生了告警或某些事件后,必然需要进行后续处理。目前主流的做法是由系统通知维护人员进行处理,不会自动对这告警及事件进行维护处理。本发明的原理为在业务系统产生告警、系统事件后,由SOC系统进行收集,并生成维护命令,发送给维护子系统,然后由维护子系统自动调用相关的维护程序,对具体的告警类型及事件进行维护处理,并将处理结果形成维护报告,发送给相关维护人员。在本发明中,存在两个子系统,分别为SOC系统和维护子系统。SOC负责收集各种业务系统、主机、网络设备的日志、事件、告警,并产生相关的告警及事件,同时负责生成维护命令,推送给维护子系统的接收队列。维护子系统主要负责接收维护命令,并调用维护程序(插件)对告警及事件进行自动处理。维护程序处理完毕后,会将维护结果发送给维护子系统,由维护子系统推送给SOC系统。SOC最终形成维护报告,发送给操作人员。具体流程图如图1所示。
在具体的实施场景中,需要预先根据告警类型、事件类型,配置相关的维护信息,自定义维护程序。配置项包括:维护命令对应的维护程序,其在维护子系统配置;告警类型对应的维护命令,其在SOC端及维护子系统配置;维护程序的执行计划,其在维护子系统配置,维护报告对应的操作人员,其在SOC端配置。
例如,在具体实施时SOC系统中产生了一个ORACLE的数据库表空间不足告警,这种告警一般是由于临时表数据过多,或者数据库日志文件过大,或者有些数据表数据过多引起的。解决办法是对临时表进行truncate操作,同时将数据库日志转移备份到其余的存储空间。对数据过多的数据表,则在磁盘空间允许的情况下,对表空间进行扩展。为这些操作,实现了一个维护程序,并以插件的形式提供给维护子系统调用,该插件的名字是PL_DBORA01,同时在SOC系统及维护子系统,配置了一条CMD_DBORA01的命令,该命令自动对应的维护程序是PL_DBORA01。同时,执行任务计划配置中,限定该任务的执行时间只能是每小时执行一次。同时配置该类型的告警,需要自动进行维护。
SOC根据该告警,自动生成了一条CMD_DBORA01命令,发送给维护子系统。维护子系统接收后,立即生成一条名为TASK_DBORA01_20130901100000的任务放入任务队列A(系统中有多个队列)中,含义是在2013年9月1日上午11点整,执行维护程序PL_DBORA01。
任务队列A每隔3秒扫描一次队列,11点将TASK_DBORA01_20130901100000任务出列,并触发任务。任务执行完毕后,将结果经由维护子系统发送给SOC,SOC将维护结果形成维护报告,定时发送给维护人员。
此外,本发明还可以修改告警程序,在告警产生时,根据固有或配置的信息,自动对告警进行处理。
或者部署一个维护系统,根据固有或配置的信息,在产生一些重大的告警或事件时,如系统崩溃,硬盘故障时,自动恢复配置文件、数据文件、重启系统。
但是上述两种方案,没有把告警监控系统和维护系统分离,只是简单的对告警进行一些自动处理,或者对一些固有的严重故障进行一些固化的维护动作。缺少灵活性及开放性,实用范围较窄,同时不支持自定义维护程序,也不能进行动态部署、动态扩展。
以上对本发明实施例所提供的一种自动维护业务系统的方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种自动维护业务系统的方法,其特征在于,在业务系统产生告警、系统事件后,由SOC系统进行收集,并生成维护命令,发送给维护子系统,然后由维护子系统自动调用对应的维护程序,对具体的告警类型及事件类型进行自动维护处理;维护程序处理完毕后,会将维护结果发送给维护子系统,由维护子系统推送给SOC系统,SOC系统最终形成维护报告发送给相关维护人员。
2.根据权利要求1所述的方法,其特征在于,SOC系统负责收集各种业务系统、主机、网络设备的日志、事件、告警,并产生相关的告警及事件,同时负责生成维护命令,推送给维护子系统的接收队列。
3.根据权利要求1所述的方法,其特征在于,需要预先根据告警类型、事件类型,配置相关的维护信息。
4.根据权利要求1或3所述的方法,其特征在于,配置项包括:维护命令对应的维护程序,其在维护子系统配置;告警类型对应的维护命令,其在SOC端及维护子系统配置;维护程序的执行计划,其在维护子系统配置,维护报告对应的操作人员,其在SOC端配置。
5.根据权利要求1-4任一所述的方法,其特征在于,维护程序以插件的形式提供给维护子系统调用。
6.根据权利要求1所述的方法,其特征在于,维护程序能够自定义,对维护子系统进行扩展,并动态进行热部署。
7.根据权利要求1所述的方法,其特征在于,本发明还能够通过修改告警程序,在告警产生时,根据固有或配置的信息,自动对告警进行处理。
8.根据权利要求1所述的方法,其特征在于,本发明还能够通过部署一个维护系统,根据固有或配置的信息,在产生一些重大的告警或事件时,如系统崩溃,硬盘故障时,自动恢复配置文件、数据文件、重启系统。
9.根据权利要求1所述的方法,其特征在于,告警系统与维护子系统分离,实现分布式部署。
CN201410403330.5A 2014-08-15 2014-08-15 一种自动维护业务系统的方法 Pending CN104168141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410403330.5A CN104168141A (zh) 2014-08-15 2014-08-15 一种自动维护业务系统的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410403330.5A CN104168141A (zh) 2014-08-15 2014-08-15 一种自动维护业务系统的方法

Publications (1)

Publication Number Publication Date
CN104168141A true CN104168141A (zh) 2014-11-26

Family

ID=51911788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410403330.5A Pending CN104168141A (zh) 2014-08-15 2014-08-15 一种自动维护业务系统的方法

Country Status (1)

Country Link
CN (1) CN104168141A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105099783A (zh) * 2015-08-20 2015-11-25 长威信息科技发展股份有限公司 一种实现业务系统告警应急处置自动化的方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020001475A1 (en) * 2000-05-18 2002-01-03 Kunihiro Kikuchi Maintenance system and method for performing apparatus management using network
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统
CN101582811A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种建立网络监控和运维管理一体化的方法
CN101605346A (zh) * 2008-06-10 2009-12-16 中兴通讯股份有限公司 故障修复方法和装置
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020001475A1 (en) * 2000-05-18 2002-01-03 Kunihiro Kikuchi Maintenance system and method for performing apparatus management using network
CN101582812A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种监控运维管理系统
CN101582811A (zh) * 2008-05-13 2009-11-18 新奥特(北京)视频技术有限公司 一种建立网络监控和运维管理一体化的方法
CN101605346A (zh) * 2008-06-10 2009-12-16 中兴通讯股份有限公司 故障修复方法和装置
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105099783A (zh) * 2015-08-20 2015-11-25 长威信息科技发展股份有限公司 一种实现业务系统告警应急处置自动化的方法及系统
CN105099783B (zh) * 2015-08-20 2018-06-29 长威信息科技发展股份有限公司 一种实现业务系统告警应急处置自动化的方法及系统

Similar Documents

Publication Publication Date Title
CN101483545B (zh) 一种金融业务监控方法及系统
CN107508722B (zh) 一种业务监控方法和装置
CN106406993A (zh) 一种定时任务管理方法和系统
CN103473710A (zh) 一种集中运维系统的故障分级处理方法
CN110175451A (zh) 一种基于电力云的安全监控方法和系统
CN110794800A (zh) 一种智慧工厂信息管理的监控系统
CN101222742B (zh) 移动通信网管系统中告警自定位和自处理的方法及系统
CN109218102A (zh) 一种告警监控方法及系统
CN107766502A (zh) 一种Oracle RAC数据库容灾切换演练方法
CN102521781A (zh) 一种基于独立监控服务的跨安全区的设备统一监控方法及其监控系统
CN107580054A (zh) 基于物联网的工业设备反向控制方法及系统
CN102857371A (zh) 一种面向集群系统的动态配置管理方法
CN103281461A (zh) 一种呼叫中心监控方法、装置与系统
CN109471778A (zh) 一种电力系统的监控方法、装置及设备
CN104780220A (zh) 面向证券期货行业大型分布式系统的智能监控系统及监控方法
CN111046075A (zh) 一种工程监理信息化建管方法及装置
CN104021438A (zh) 基于业务模型对业务系统中物理设备进行监控的方法和装置
CN107544867B (zh) 智能网业务的恢复方法、装置及系统
CN103986607A (zh) 一种智能数据中心语音声光报警监控系统
CN104363359A (zh) 一种呼叫中心坐席状态可视化监控方法及系统
CN108288997A (zh) 一种传输网络光功率自动采集系统
CN109190779A (zh) 一种基于北斗系统的电网资源监管方法及系统
CN104168141A (zh) 一种自动维护业务系统的方法
CN109639508A (zh) 一种智能数据中心语音声光报警监控系统
CN102081621A (zh) 一种确定数据库生产系统容灾切换的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141126