CN101729282A - 单板告警的处理方法和装置 - Google Patents

单板告警的处理方法和装置 Download PDF

Info

Publication number
CN101729282A
CN101729282A CN200810174676A CN200810174676A CN101729282A CN 101729282 A CN101729282 A CN 101729282A CN 200810174676 A CN200810174676 A CN 200810174676A CN 200810174676 A CN200810174676 A CN 200810174676A CN 101729282 A CN101729282 A CN 101729282A
Authority
CN
China
Prior art keywords
board
alarm
single board
veneer
failing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200810174676A
Other languages
English (en)
Inventor
朱立峰
祝伟宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN200810174676A priority Critical patent/CN101729282A/zh
Publication of CN101729282A publication Critical patent/CN101729282A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

本发明公开了一种单板告警的处理方法和装置,应用于网元运行、管理和维护系统即OAM系统,上述装置包括:告警监测模块,用于接收并转发网元设备上报的单板告警,其中,单板告警中携带有单板故障信息;告警处理模块,用于根据来自告警监测模块的单板告警,进行告警处理。本发明提高了故障处理的准确性和及时性。

Description

单板告警的处理方法和装置
技术领域
本发明涉及通信领域,具体而言,涉及一种单板告警的处理方法和装置。
背景技术
在目前的移动通信系统中,当设备出现故障时,该设备就会上报相应的告警信息,以便维护人员能够快速定位和排除故障。在相关技术中,告警分为五大类,其中有一类告警称为设备告警(Equipment Alarm),在设备告警类型中包括单板告警。
在目前的单板告警处理过程中,当设备单板的处理器、芯片等硬件出现老化、损坏等故障时,该设备就会上报相应的单板告警,这类单板告警将导致不能正常提供单板承载的业务。对于设备单板告警的修复,需要专业的维护人员进行主/备切换、更换单板,或维修人员通过仪器设备进行维修。
从上述过程可以看出:对于设备单板故障,目前是通过维护人员进行手工处理。该方法需要耗费维护人员的培训成本和人力成本,通常不能快速及时地修复,而且由于维护人员的能力和经验等主观因素,对故障的处理效果也有好有坏。
发明内容
针对目前维护人员手工处理设备单板故障需要耗费维护人员的培训成本和人力成本,通常不能快速及时地修复,而且由于维护人员的能力和经验等主观因素,对故障的处理效果也有好有坏的问题而提出本发明,为此,本发明旨在提供一种单板告警的处理方法和装置,以解决上述问题。
根据本发明的一个方面,提供了一种单板告警的处理装置。
根据本发明的单板告警的处理装置,应用于网元运行、管理和维护系统即OAM系统,上述装置包括:告警监测模块,用于接收并转发网元设备上报的单板告警,其中,单板告警中携带有单板故障信息;告警处理模块,用于根据来自告警监测模块的单板告警,进行告警处理。
优选地,告警处理模块包括:接收子模块,用于接收来自告警监测模块的单板告警;获取子模块,用于从接收子模块接收的单板告警中获取单板故障信息;切换子模块,用于在满足预定条件的情况下,根据单板故障信息将故障单板的业务切换到备份单板,其中,预定条件为:故障单板支持主用单板和备份单板的切换,且故障单板的备份单正常运行;控制子模块,用于关闭故障单板。
优选地,告警处理模块还包括:复位子模块,用于对故障单板进行复位。
根据本发明的一个方面,提供了一种单板告警的处理方法。
根据本发明的单板告警的处理方法,应用于OAM系统,上述方法包括:OAM系统接收网元设备上报的单板告警,其中,单板告警中携带有单板故障信息;OAM系统根据单板告警进行告警处理。
优选地,OAM系统根据单板告警进行告警处理包括:OAM系统从单板告警中获取单板故障信息;OAM系统根据单板故障信息确定发生故障的故障单板;如果故障单板支持主用单板和备份单板的切换,且故障单板的备份单板正常运行,则关闭故障单板,并将故障单板的业务切换到备份单板,否则,关闭故障单板。
优选地,在关闭故障单板之后,上述方法还包括:如果故障单板不存在硬件故障,则将故障单板进行复位。
通过本发明,在OAM系统中设置告警监测模块和告警处理模块,解决了目前维护人员手工处理设备单板故障需要耗费维护人员的培训成本和人力成本,通常不能快速及时地修复,而且由于维护人员的能力和经验等主观因素,对故障的处理效果也有好有坏的问题,提高了故障处理的准确性和及时性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的单板告警的处理装置的结构框图;
图2是根据本发明实施例的单板告警的处理装置的优选结构框图;
图3是根据本发明实施例的单板告警的处理方法的流程图;
图4是根据本发明实施例一的单板告警的处理方法的流程图;
图5是根据本发明实施例二的单板告警的处理方法的流程图。
具体实施方式
功能概述
本发明实施例提供了一种单板告警的处理方法和装置,在网元运行、管理和维护(Operation Administration and Maintenance,简称为OAM)系统中设置告警监测模块和告警处理模块,其中,告警监测模块实时监测告警,如果发现单板告警,则将告警转发给告警处理模块(也可以称为单板告警自动修复模块,这不影响发明的本质);单板告警自动修复模块首先闭塞故障单板,隔离业务;然后调用数据库服务获得故障单板的备份状态及备份对象,执行主/备切换操作,使业务转移到备份单板上;最后对故障单板进行诊断测试,如果诊断结果没有发现硬件异常,则尝试进行复位操作,并监控单板告警是否恢复。下面将参考附图并结合实施例来详细说明本发明。
装置实施例
根据本发明的实施例,提供了一种单板告警的处理装置,应用于网元OAM系统。图1是根据本发明实施例的单板告警的处理装置的结构框图,如图1所示,该装置包括:告警监测模块12和告警处理模块14,下面对上述结构进行描述。
告警监测模块12,用于接收并转发网元设备上报的单板告警,其中,单板告警中携带有单板故障信息;也就是说,监测接收到的告警,如果发现单板告警,将告警转发给单板告警处理模块14;告警处理模块14,连接至告警监测模块12,用于根据来自告警监测模块12的单板告警,进行告警处理,也就是说,通过分析单板告警信息,根据单板的备份状态及备份对象,对故障进行自动修复。
图2是根据本发明实施例的单板告警的处理装置的优选结构框图,如图2所示,告警处理模块14包括:接收子模块142、获取子模块144、切换子模块146、控制子模块148、复位子模块140,下面对上述结构进行描述。
接收子模块142,用于接收来自告警监测模块的单板告警;获取子模块144,连接至接收子模块142,用于从接收子模块142接收的单板告警中获取单板故障信息;控制子模块148,连接至获取子模块144,用于根据获取子模块144获取的单板故障信息关闭故障单板;切换子模块146,连接至控制子模块148,用于控制子模块148关闭故障单板之后,在满足预定条件的情况下,根据获取子模块144获取的单板故障信息将故障单板的业务切换到备份单板,其中,预定条件为:故障单板支持主用单板和备份单板的切换,且故障单板的备份单正常运行。
进一步地,告警处理模块14还包括:复位子模块140,连接至控制子模块148,用于控制子模块148关闭故障单板之后,在故障单板不存在硬件故障的情况下,对故障单板进行复位。
通过该实施例,提供了能够自动处理设备单板故障的网元OMA系统。
方法实施例
根据本发明的实施例,提供了一种单板告警的处理方法,应用于OAM系统。图3是根据本发明实施例的单板告警的处理方法的流程图,如图3所示,该方法包括步骤S302至步骤S304,具体操作如下:
步骤S302,OAM系统接收网元设备上报的单板告警,其中,单板告警中携带有单板故障信息;
步骤S304,OAM系统根据单板告警进行告警处理。
具体地,OAM系统从单板告警中获取单板故障信息,然后根据单板故障信息确定发生故障的故障单板;如果故障单板支持主用单板和备份单板的切换,且故障单板的备份单板正常运行,则关闭故障单板,并将故障单板的业务切换到备份单板,否则,关闭故障单板。优选地,在关闭故障单板之后,如果故障单板不存在硬件故障,则将故障单板进行复位。
通过该实施例,解决了现有技术中不能对单板告警进行自动修复的问题,从而使设备单板出现故障时,能够快速及时地修复。
下面将结合实例对本发明实施例的实现过程进行详细描述。
实施例一
图4是根据本发明实施例一的单板告警的处理方法的流程图,如图4所示,对于支持主/备(即,主用单板和备用单板的切换)的单板发生故障的单板告警的处理方法包括步骤S402至步骤S408,具体操作如下:
步骤S402,网元设备检测到某单板发生故障,产生单板告警,并上报到网元OAM系统;
步骤S404,驻留在网元OAM系统中的告警监测模块接收到单板告警,将告警信息转发给告警处理模块(即,上述步骤S302);
步骤S406,驻留在网元OAM系统中的告警处理模块接收到单板告警,解析得到故障单板对象,判断出故障单板支持主用单板和备份单板的切换,且备份单板状态正常,该操作可以通过调用数据库接口,获得故障单板的备份状态及备份对象来实现(即,上述步骤S304);
步骤S408,告警处理模块根据单板的备份状态及备份对象对故障进行自动修复,具体地,闭塞故障单板,隔离业务;执行主/备切换操作,使业务转移到备份单板上,即,自动将备份单板切换到主用状态;对闭塞后的故障单板进行进一步的诊断测试,以定位准确的故障原因,如诊断结果为没有发现硬件异常,则尝试进行复位操作,并监控单板告警是否恢复(即,上述步骤S304)。
通过该实施例,提供了支持主/备的单板发生故障的单板告警的处理方法。
实施例二
图5是根据本发明实施例二的单板告警的处理方法的流程图,如图5所示,对于不支持主/备或支持主/备但备份单板状态异常的单板发生故障的单板告警的处理方法包括步骤S502至步骤S508,具体操作如下:
步骤S502,网元设备检测到某单板发生故障,产生单板告警,并上报到网元OAM系统;
步骤S504,驻留在网元OAM系统中的告警监测模块接收到单板告警,将告警信息转发给告警处理模块(即,上述步骤S302);
步骤S506,驻留在网元OAM系统中的告警处理模块收到单板告警,解析得到故障单板对象,并调用数据库接口,判断出故障单板不支持主/备,或支持主/备但备份单板状态异常(即,上述步骤S304);
步骤S508,告警处理模块根据单板的备份状态及备份对象对故障进行自动修复;具体地,闭塞故障单板,隔离业务;也就是说,如果故障单板不支持主/备或支持主/备但备份单板状态异常,则立即闭塞故障单板,退出服务,避免对业务造成不良影响;对闭塞后的故障单板进行进一步的诊断测试,以定位准确的故障原因,如诊断结果为没有发现硬件异常,则尝试进行复位操作,并监控单板告警是否恢复(即,上述步骤S304)。
通过该实施例,提供了不支持主/备或支持主/备但备份单板状态异常的单板发生故障的单板告警的处理方法。
综上,通过本发明的上述实施例,通过计算机软件处理对设备单板告警实现自动监控、自动分析、自动修复等自动处理,有效地缩短了故障排除时间,降低了运维成本,并且提高了网络服务质量。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种单板告警的处理装置,应用于网元运行、管理和维护系统即OAM系统,其特征在于,所述装置包括:
告警监测模块,用于接收并转发网元设备上报的单板告警,其中,所述单板告警中携带有单板故障信息;
告警处理模块,用于根据来自所述告警监测模块的所述单板告警,进行告警处理。
2.根据权利要求1所述的装置,其特征在于,所述告警处理模块包括:
接收子模块,用于接收来自所述告警监测模块的所述单板告警;
获取子模块,用于从所述接收子模块接收的所述单板告警中获取所述单板故障信息;
切换子模块,用于在满足预定条件的情况下,根据所述单板故障信息将所述故障单板的业务切换到所述备份单板,其中,所述预定条件为:所述故障单板支持主用单板和备份单板的切换,且所述故障单板的备份单正常运行;
控制子模块,用于关闭所述故障单板。
3.根据权利要求2所述的装置,其特征在于,所述告警处理模块还包括:
复位子模块,用于对所述故障单板进行复位。
4.一种单板告警的处理方法,应用于OAM系统,其特征在于,所述方法包括:
所述OAM系统接收网元设备上报的单板告警,其中,所述单板告警中携带有单板故障信息;
所述OAM系统根据所述单板告警进行告警处理。
5.根据权利要求4所述的方法,其特征在于,所述OAM系统根据所述单板告警进行告警处理包括:
所述OAM系统从所述单板告警中获取所述单板故障信息;
所述OAM系统根据所述单板故障信息确定发生故障的故障单板,如果所述故障单板支持主用单板和备份单板的切换,且所述故障单板的备份单板正常运行,则关闭所述故障单板,并将所述故障单板的业务切换到所述备份单板,否则,关闭所述故障单板。
6.根据权利要求5所述的方法,其特征在于,在所述关闭所述故障单板之后,所述方法还包括:
如果所述故障单板不存在硬件故障,则将所述故障单板进行复位。
CN200810174676A 2008-10-30 2008-10-30 单板告警的处理方法和装置 Pending CN101729282A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200810174676A CN101729282A (zh) 2008-10-30 2008-10-30 单板告警的处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810174676A CN101729282A (zh) 2008-10-30 2008-10-30 单板告警的处理方法和装置

Publications (1)

Publication Number Publication Date
CN101729282A true CN101729282A (zh) 2010-06-09

Family

ID=42449555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810174676A Pending CN101729282A (zh) 2008-10-30 2008-10-30 单板告警的处理方法和装置

Country Status (1)

Country Link
CN (1) CN101729282A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997718A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 故障定位方法及装置
CN102143005A (zh) * 2011-04-14 2011-08-03 中兴通讯股份有限公司 一种基于oam协议确定故障消除的方法及装置
CN106375113A (zh) * 2016-08-25 2017-02-01 杭州华三通信技术有限公司 一种分布式设备故障记录的方法、装置和系统
CN107548089A (zh) * 2016-06-28 2018-01-05 中兴通讯股份有限公司 一种基站故障自动修复的方法及装置
CN108476149A (zh) * 2016-03-14 2018-08-31 富士通株式会社 操作管理维护系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101997718A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 故障定位方法及装置
CN102143005A (zh) * 2011-04-14 2011-08-03 中兴通讯股份有限公司 一种基于oam协议确定故障消除的方法及装置
WO2012139477A1 (zh) * 2011-04-14 2012-10-18 中兴通讯股份有限公司 一种基于oam协议确定故障消除的方法及装置
CN102143005B (zh) * 2011-04-14 2015-01-28 中兴通讯股份有限公司 一种基于oam协议确定故障消除的方法及装置
CN108476149A (zh) * 2016-03-14 2018-08-31 富士通株式会社 操作管理维护系统
CN108476149B (zh) * 2016-03-14 2020-12-15 富士通株式会社 操作管理维护系统
CN107548089A (zh) * 2016-06-28 2018-01-05 中兴通讯股份有限公司 一种基站故障自动修复的方法及装置
CN106375113A (zh) * 2016-08-25 2017-02-01 杭州华三通信技术有限公司 一种分布式设备故障记录的方法、装置和系统
CN106375113B (zh) * 2016-08-25 2020-01-17 新华三技术有限公司 一种分布式设备故障记录的方法、装置和系统

Similar Documents

Publication Publication Date Title
CN101800675B (zh) 故障监控方法、监控设备及通信系统
US7995485B1 (en) Method and apparatus for providing automated diagnostics of networks
US20100124165A1 (en) Silent Failure Identification and Trouble Diagnosis
CN101729282A (zh) 单板告警的处理方法和装置
CN105871569B (zh) Otn 网络故障节点自动检测的方法及装置
CN113608908B (zh) 服务器故障处理方法、系统、设备及可读存储介质
CN101237343A (zh) 故障时快速切换的方法及快速切换系统
CN101924661A (zh) 告警的处理方法及装置
JP2009135731A (ja) 無線ネットワーク制御装置およびその障害処理方法
US8111625B2 (en) Method for detecting a message interface fault in a communication device
CN102195824B (zh) 数据业务系统退服告警的方法、装置及系统
CN101958925A (zh) 一种控制远程设备的方法以及装置
CN110572292B (zh) 基于单向传输链路的高可用系统及方法
US7446665B1 (en) Method for automatically detecting and isolating a power outage in a communication network
US20110170404A1 (en) Mobile communication network
JP5367002B2 (ja) 監視サーバおよび監視プログラム
US20050220276A1 (en) Method and system of remotely restoring communication lines
KR100257043B1 (ko) 통신 관리 네트워크 시스템의 경보 처리 방법
US7315181B1 (en) Method for automatically identifying component failure in a communication network
JP2004274595A (ja) 呼完了率低下時対応装置
JP2002064490A (ja) 故障部位切り分け方法
US8248914B2 (en) Gateway device and method for maintaining a communication connection therethrough
KR20000044998A (ko) 기지국 전원/전송로 시험의 원격제어시스템및 그 방법
JP2016178486A (ja) 通信機、通信システム、通信方法およびプログラム
CN117061311A (zh) 通信网络故障处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100609