CN104426697B - 网络故障管理系统 - Google Patents

网络故障管理系统 Download PDF

Info

Publication number
CN104426697B
CN104426697B CN201310385729.0A CN201310385729A CN104426697B CN 104426697 B CN104426697 B CN 104426697B CN 201310385729 A CN201310385729 A CN 201310385729A CN 104426697 B CN104426697 B CN 104426697B
Authority
CN
China
Prior art keywords
alarm
module
network
name
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310385729.0A
Other languages
English (en)
Other versions
CN104426697A (zh
Inventor
彭年香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Song Yixiao
Original Assignee
Shanghai Feixun Data Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Feixun Data Communication Technology Co Ltd filed Critical Shanghai Feixun Data Communication Technology Co Ltd
Priority to CN201310385729.0A priority Critical patent/CN104426697B/zh
Publication of CN104426697A publication Critical patent/CN104426697A/zh
Application granted granted Critical
Publication of CN104426697B publication Critical patent/CN104426697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出了一种网络故障管理系统,包括告警显示模块、告警查询模块、告警统计模块、告警屏蔽模块、告警配置模块。本发明主要用于在网管环境下,当网络环境中的设备发生异常时,本发明网络故障管理系统能够实时的显示告警、按告警级别定时对告警条数进行统计、对当前和历史告警进行查询、还可对不关心的告警进行屏蔽。本发明能很好的实现故障发现、故障定位与故障报警的故障管理功能,及时定位故障,诊断和解决问题,以使网络恢复初始状态。使用本发明网络故障管理系统可以减少网络故障、优化网络性能、并减少网络维护费用。

Description

网络故障管理系统
技术领域
本发明涉及一种网络系统的故障管理技术。
背景技术
随着通信与网络技术的飞速发展和广泛应用,计算机网络已经渗透到人类活动的各个领域。越来越多的企业和组织建立了与自己业务相关的计算机网络系统,借以提高工作效率、降低成本。在建立网络系统时,如何实时监测用来组建网络的设备及链路,及时发现网络故障,就成为摆在管理人员和技术人员面前的实际问题。因此,对网络系统故障监测技术的研究具有重要意义。传统的人工管理方式效率低下,缺少智能分析、过滤和自动化处理,导致故障告警泛滥,无法准确定位故障根源;维护人员数量与技术能力有限,面对大量告警堆砌,故障无法及时恢复和解决;网络规模庞大、设备分散,没有规范性的分级管理,运维效率低下及流程混乱;无法实时了解与监控集中在机房的网络设备,大大拖延了设备故障恢复的时间;网络环境复杂化与分散化,无法做到集中监控以及实时掌握网络整体运行情况。
签于网络管理潜在的巨大市场和应用价值,许多厂商开发了自己的网络管理系统和平台产品。这些产品都支持标准的网络管理协议,提供网元管理到业务管理的通用解决方案。但这些产品互不能兼容,造成信息孤岛,网络扩展与升级难、成本高。
发明内容
本发明需解决的技术问题是提供一种可以减少网络故障并形成有效的恢复手段、优化网络性能、并减少网络维护费用的网络故障管理系统。
为解决上述的技术问题,本发明设计了一种网络故障管理系统,其包括:告警显示模块,在客户端显示设备上报的告警并提示;告警查询模块,查询已经产生的告警的情况;告警统计模块,统计告警的个数;告警屏蔽模块,屏蔽重复的告警;告警配置模块,配置告警的相关参数。
作为发明进一步改进,所述告警显示模块显示的内容包括告警名称、设备名称、告警级别、告警服务类型、告警消息类型、告警时间、告警定位信息和告警描述信息。
作为发明进一步改进,所述告警显示模块通过颜色图标将告警分为不同的级别。
作为发明进一步改进,所述告警显示模块通过信息或声音提示。
作为发明进一步改进,所述告警查询模块分别查询当前告警和历史告警;当前告警为未恢复的告警,历史告警为已恢复的告警。
作为发明进一步改进,当前告警按告警名称、设备名称、告警发生时间间隔、告警级别和告警消息类型的不同组合条件来进行查询;历史告警按不同模式、告警名称、设备名称、告警发生时间间隔、告警消息类型、告警级别、告警状态、告警恢复时间和告警确认时间的组合条件来进行查询。
作为发明进一步改进,所述告警统计模块根据告警的不同级别统计个数。
作为发明进一步改进,所述告警屏蔽模块根据设备名称、告警名称、以及设备名称和告警名称组合的条件屏蔽告警。
作为发明进一步改进,所述告警配置模块包括确认告警单元、恢复告警单元、修改告警级别单元、恢复默认告警级别单元和修改告警提示声音单元。
本发明主要用于在网管环境下,当网络环境中的设备发生异常时,本发明网络故障管理系统能够实时的显示告警、按告警级别定时对告警条数进行统计、对当前和历史告警进行查询、还可对不关心的告警进行屏蔽。本发明能很好的实现故障发现、故障定位与故障报警的故障管理功能,及时定位故障,诊断和解决问题,以使网络恢复初始状态。使用本发明网络故障管理系统可以减少网络故障、优化网络性能、并减少网络维护费用。
附图说明
图1为本发明网络故障管理系统的结构示意图。
具体实施方式
为了使本领域相关技术人员更好地理解本发明的技术方案,下面将结合本发明实施方式的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。
本发明主要应用于网管系统中,提供了一种通用的网络故障管理系统。网管系统分为服务器端和客户端,服务器和设备之间采用SNMP协议,告警显示主要通过客户端呈现,服务器端负责收集设备的Trap告警、过虑告警、转发告警、将告警数据写入数据库,而客户端主要负责将服务器转发的告警进行显示、查询、统计等操作。当网络出现安全隐患时,网络故障管理系统会发出告警信息,分析判断网络的安全状态,分析非法入侵、攻击、物理故障等现象。
如图1所示,本发明网络故障管理系统包括告警显示模块、告警查询模块、告警统计模块、告警屏蔽模块、和告警配置模块。
告警显示模块,是在客户端显示设备上报的告警并提示出来。对于网络中的设备的异常,通过告警显示模块的显示可以精确定位到设备、设备的单板、单板上的端口,并以颜色、声音或信息的方式提示告警。
当设备出现异常,会主动上报告警给服务器端,服务器端收集并过滤部分告警,再将告警整理后转发给客户端,客户端通过告警显示模块将告警显示给网管用户。
客户端的告警显示模块显示的内容包括:告警名称、设备名称、告警级别、告警服务类型、告警消息类型、告警时间、告警定位信息和告警描述信息。告警名称、告警级别、告警服务类型、告警消息类型为静态数据,该静态数据都存放在XML配置文件中,方便读取。设备名称、告警时间、告警定位信息和告警描述信息为动态数据,该动态数据由服务器端转发。
其中,告警级别按等级可分为紧急、主要、次要、提示和清除。告警级别的字段支持彩色图标,通过颜色图标将告警分为不同的级别,便于用户查看。告警级别从高到低依次为:紧急告警:红色;主要告警:橙色;次要告警:黄色;提示告警:蓝色;恢复告警:灰色。
告警消息类型分为事件告警和状态告警,状态告警表示设备状态发生了变化,如线路发生故障,由在线变为离线等。事件告警表示自定义的告警事件,如对一条千兆网络连接300M的流量算不上大事,但如果考虑到日常的流量一般不会超过100M,这就是“事件”,通过设置流量告警门限可以及时发现问题。告警服务类型包括设备告警、服务质量告警、通讯告警、环境告警和处理失败告警。告警定位信息如槽位号、端口号等,告警描述如单板类型、设备类型等。
过滤告警即过滤不必要的事件,仅向操作员呈现有意义的告警。如设备CPU利用率过高等超阀值的告警,一旦超过,设备会一直上报,造成告警泛滥,遇到此情况,服务器端会过滤此告警直到此告警清除,再向客户端发送清除告警。这类告警包括:
1.设备内存利用率阈值告警,当设备内存利用率过大/小,能产生报警;
2.设备CPU利用率阈值告警,当设备CPU利用率过大/小,能产生报警;
3.设备温湿度环境监测告警。
告警处理采用灵活多样的提示方式:
1.发出声音
当事件发生时,网管可以发出声音,在所有监控记录中发出声音。
2.显示报警框
对于要求得到立即关注的事件,可以在所记录的IT运维平台上显示一个警报框。
告警查询模块,告警入库后(即已经产生的告警),用户可对告警进行查询,告警查询分为当前告警查询和历史告警查询。当前告警指的是未恢复的告警,恢复包括设备自动恢复和用户手动恢复;历史告警指的是已恢复的告警。
用户查询的步骤如下:
1.客户端用户选择查询条件;
2.服务器端查询数据库,返回条件集对应的告警;
3.客户端以表格形式显示告警;
其中,当前告警可按告警名称、设备名称、告警发生时间间隔、告警级别和告警类型的组合条件来进行查询;历史告警可按不同模式、告警名称、设备名称、告警发生时间间隔、告警类型、告警级别、告警状态、告警恢复时间和告警确认时间的组合条件来进行查询。
在服务器告警数据库中,保存着设备的每条告警,历史告警查询的模式有单条和合并两种,如果选择合并模式,则对于设备的一个告警和这个告警的恢复告警则显示为一条告警。
每条告警显示的内容包括:告警级别、设备名称、告警名称、告警类型、告警发生时间、告警定位、告警描述、告警确认状态、告警确认用户、告警确认时间、告警恢复标记、告警恢复用户和告警恢复时间、产生告警原因及告警修改建议。
对于设备的每个告警,将其静态数据如告警名称、告警定位参数名称(如槽位号=%s)、告警描述参数(板卡类型=%s)、告警原因和告警修改建议存放于XML配置文件中,静态数据只与告警本身有关,与设备无关,可通用。
告警确认状态包括未确认和已确认两种,告警恢复标记包括设备自动恢复和人工恢复两种。
所述告警统计模块,用于统计告警的个数,在客户端告警统计窗口上显示告警条数。通过对不同级别的告警个数进行统计,可让用户清楚的看到设备上紧急、主要、次要、提示的告警个数。
统计步骤如下:
1.客户端定时发送设备ID请求告警条数;
2.服务器返回当前设备的不同级别的告警条数。
所述告警屏蔽模块,屏蔽告警,服务器端将某告警屏蔽,不转发此告警到客户端,客户端不再显示此告警到实时告警表中。
当存在大量的无谓重复的实时告警信息时,为防止告警泛滥,可在众多的告警信息中,屏蔽不重要的告警信息。告警屏蔽的条件有:设备名称,告警名称,设备名称和告警名称的组合。根据“设备名称”条件,将某设备下的所有告警屏蔽。根据“告警名称”条件,将某条告警屏蔽。根据“设备名称和告警名称”的组合条件,将某设备下的某条告警屏蔽。
所述告警配置模块,配置告警的相关参数。告警配置模块包括确认告警单元、恢复告警单元、修改告警级别单元、恢复默认告警级别单元和修改告警提示声音单元,从而分别对确认告警的参数、恢复告警的参数、修改告警的参数、恢复默认告警的参数、修改告警提示声音的参数等等进行设置。用户可在当前告警表和历史告警表中进行手动确认,当告警清除时,也可进行手动恢复该告警,可以修改某条告警的级别,自定义某条告警的个性化铃声。
本发明主要用于在网管环境下,当网络环境中的设备发生异常时,本发明网络故障管理系统能够实时的显示告警、按告警级别定时对告警条数进行统计、对当前和历史告警进行查询、还可对不关心的告警进行屏蔽。本发明能很好的实现故障发现、故障定位与故障报警的故障管理功能,及时定位故障,诊断和解决问题,以使网络恢复初始状态。使用本发明网络故障管理系统可以减少网络故障、优化网络性能、并减少网络维护费用。
更优的是,本发明,将公有的静态数据存储于XML配置文件中,使得本发明网络故障管理系统可用于不同设备,即通用;并且有较高的可兼容性和扩展性。本发明注重运行维护管理,偏向于事前管理而非事后管理,强化了故障管理与故障预警管理;
以上仅表达了本发明的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种网络故障管理系统,其特征在于,包括:
告警显示模块,在客户端显示设备上报的告警并提示;
告警查询模块,查询已经产生的告警的情况;
告警统计模块,统计告警的个数;
告警屏蔽模块,屏蔽重复的告警;
告警配置模块,配置告警的相关参数;
所述告警显示模块显示的内容包括告警名称、设备名称、告警级别、告警服务类型、告警消息类型、告警时间、告警定位信息和告警描述信息;
告警名称、告警级别、告警服务类型、告警消息类型为静态数据,该静态数据存放在XML配置文件中,设备名称、告警时间、告警定位信息和告警描述信
息为动态数据,该动态数据由服务器端转发;
所述告警显示模块通过颜色图标将告警分为不同的级别;
所述告警查询模块查询当前告警和历史告警;当前告警为未恢复的告警,历史告警为已恢复的告警;
当前告警按告警名称、设备名称、告警发生时间间隔、告警级别和告警消息类型的不同组合条件来进行查询;历史告警按不同模式、告警名称、设备名称、告警发生时间间隔、告警消息类型、告警级别、告警状态、
告警恢复时间和告警确认时间的组合条件来进行查询。
2.根据权利要求1所述的网络故障管理系统,其特征在于,所述告警显示模块通过信息或声音提示。
3.根据权利要求1所述的网络故障管理系统,其特征在于,所述告警统计模块根据告警的不同级别统计个数。
4.根据权利要求1所述的网络故障管理系统,其特征在于,所述告警屏蔽模块根据设备名称、告警名称、以及设备名称和告警名称组合的条件屏蔽告警。
5.根据权利要求1所述的网络故障管理系统,其特征在于,所述告警配置模块包括确认告警单元、恢复告警单元、修改告警级别单元、恢复默认告警级别单元和修改告警提示声音单元。
CN201310385729.0A 2013-08-29 2013-08-29 网络故障管理系统 Active CN104426697B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310385729.0A CN104426697B (zh) 2013-08-29 2013-08-29 网络故障管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310385729.0A CN104426697B (zh) 2013-08-29 2013-08-29 网络故障管理系统

Publications (2)

Publication Number Publication Date
CN104426697A CN104426697A (zh) 2015-03-18
CN104426697B true CN104426697B (zh) 2018-05-01

Family

ID=52974715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310385729.0A Active CN104426697B (zh) 2013-08-29 2013-08-29 网络故障管理系统

Country Status (1)

Country Link
CN (1) CN104426697B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470112A (zh) * 2015-08-17 2017-03-01 中兴通讯股份有限公司 充电设备的管理方法及装置
CN105207826A (zh) * 2015-10-26 2015-12-30 南京联成科技发展有限公司 一种基于Tachyou的Spark大数据平台的安全攻击告警定位系统
CN105634822B (zh) * 2016-01-15 2018-10-30 武汉烽火网络有限责任公司 基于告警分组实现快速查询告警信息的方法及装置
CN106992900A (zh) * 2016-01-20 2017-07-28 北京国双科技有限公司 监控预警的方法及智能预警通知平台
CN106230646B (zh) * 2016-09-05 2019-05-17 深圳震有科技股份有限公司 一种获取网管告警信息的方法及测试系统
CN107819633B (zh) * 2017-11-30 2021-05-28 国网河南省电力公司商丘供电公司 一种快速发现并处理网络故障的方法
CN111049694A (zh) * 2019-12-30 2020-04-21 武汉长光科技有限公司 一种通过改变界面颜色来反映设备运行状态的方法
CN111585782A (zh) * 2020-03-18 2020-08-25 国网江苏省电力有限公司信息通信分公司 综合化集中告警自动处理系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265096A (en) * 1991-07-03 1993-11-23 Transwitch Corporation Sonet alarm indication signal transmission method and apparatus
CN1411234A (zh) * 2001-09-26 2003-04-16 和记奥普泰通信技术有限公司 电信设备告警集中监视系统
CN1412978A (zh) * 2001-10-19 2003-04-23 上海贝尔有限公司 用于数字数据网接入模块的管理指配控件及其控制方法
CN201146525Y (zh) * 2007-12-29 2008-11-05 中国移动通信集团湖北有限公司 网管告警监控系统
CN102769535A (zh) * 2011-05-06 2012-11-07 中兴通讯股份有限公司 一种呈现告警数据统计结果的方法及系统
CN103001804A (zh) * 2012-12-10 2013-03-27 上海斐讯数据通信技术有限公司 设备无关的告警处理方法、装置及相应的网管系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265096A (en) * 1991-07-03 1993-11-23 Transwitch Corporation Sonet alarm indication signal transmission method and apparatus
CN1411234A (zh) * 2001-09-26 2003-04-16 和记奥普泰通信技术有限公司 电信设备告警集中监视系统
CN1412978A (zh) * 2001-10-19 2003-04-23 上海贝尔有限公司 用于数字数据网接入模块的管理指配控件及其控制方法
CN201146525Y (zh) * 2007-12-29 2008-11-05 中国移动通信集团湖北有限公司 网管告警监控系统
CN102769535A (zh) * 2011-05-06 2012-11-07 中兴通讯股份有限公司 一种呈现告警数据统计结果的方法及系统
CN103001804A (zh) * 2012-12-10 2013-03-27 上海斐讯数据通信技术有限公司 设备无关的告警处理方法、装置及相应的网管系统

Also Published As

Publication number Publication date
CN104426697A (zh) 2015-03-18

Similar Documents

Publication Publication Date Title
CN104426697B (zh) 网络故障管理系统
CN103544093B (zh) 监控报警控制方法及其系统
US6513129B1 (en) System and method for managing faults using a gateway
CN104407964B (zh) 一种基于数据中心的集中监控系统及方法
CN102447570B (zh) 一种基于健康度分析的监控装置及方法
CN102158360B (zh) 一种基于时间因子因果关系定位的网络故障自诊断方法
CN103370904B (zh) 用于确定网络意外事件的严重性的方法、网络实体
CN102624554B (zh) 一种结合了设备管理和业务管理的综合网络管理方法
CN102238023B (zh) 一种生成网络管理系统的告警数据的方法及装置
CN107862626A (zh) 一种基于计量终端告警信息的实时停电监控方法及装置
CN104468237B (zh) 一种sdh和ptn网络告警联动的方法及应用该方法的系统
WO2020228276A1 (zh) 网络告警的方法及装置
CN103716173A (zh) 一种存储监控系统及监控告警发布的方法
CN103095498B (zh) 话单采集方法和系统
CN102014020A (zh) 一种用于对网络设备进行网络监控的设备及其方法
CN103166788B (zh) 一种集控控制管理系统
CN101667941A (zh) 链路性能的检测方法及装置
CN111147286B (zh) Ipran网络环路监控方法及装置
CN107547228A (zh) 一种基于大数据的安全运维管理平台的实现架构
CN105591775B (zh) 一种网络的操作管理维护oam方法、装置和系统
CN108134685A (zh) 一种输变电设备状态告警管理系统
CN112671592A (zh) 一种网络设备运维管理系统
CN108156017A (zh) 一种输变电设备状态告警管理方法
CN102195791A (zh) 一种告警的分析方法、装置及系统
CN109510777A (zh) 流表编排方法、装置及sdn控制器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201118

Address after: 221700 4-1-110-shop, Nanyuan new town, Fengxian County, Xuzhou City, Jiangsu Province

Patentee after: Song Yixiao

Address before: 201616 Shanghai city Songjiang District Guangfulin Road No. 4855 Building No. 90 big industry territory

Patentee before: Phicomm (Shanghai) Co.,Ltd.