发明内容
本发明目的就在于克服现有技术存在的问题和不足,提供一种基于分布式网络设备管理的网管监控系统及其实现并行处理故障告警的方法。
本发明的技术方案为:
一、网管监控系统
本网管监控系统是一种基于分布式网络设备管理的网管监控系统,设置有应用服务,应用服务与一级网管中心连通。
应用服务分别与数据访问服务和数据库服务连通,形成数据访问通道;
应用服务分别与通信服务、信号发射和信号覆盖设备连通,形成通信访问通道;
操作终端通过一级网管中心分别与应用服务和WEB服务连通,形成终端状态查询控制控制通道;
操作终端通过终端控制通道下达操作请求,应用服务通过数据访问通道进行处理,处理完毕后应答数据给操作终端;
覆盖设备通过通信访问通道上报告警数据,应用服务通过数据访问通道进行处理,处理完毕后上报数据给操作终端。
网管监控系统各服务间定义了通信规程,用来约定和保障网管监控数据在彼此间的传递和识别。
应用服务中所管理的覆盖设备可是不同通信协议不同设备类型的,通信方式兼容多种方式。通信服务可同时开启多种通信方式,每种都维护有相应的缓冲区及控制机制以实现设备通信协议数据并行处理。应用服务内部维护有通信超时机制,以避免数据累积效应。多操作终端可并行操作,应用服务并发处理多设备告警,所有处理均及时响应与应答;因此实现了网管监控系统中功能强大、高效稳定的告警管理机制。
二、并行处理故障告警的方法
并行处理故障告警的方法主要包括了故障告警并行处理策略、操作终端设备告警与告警配置的并行处理策略;具体地说,包括下列步骤:
①告警管理组件根据多区域组建立各区域组告警并行处理例程;
②不同类型网元上报的告警可并行处理、存数据库并上报操作终端;
③告警管理组件建立多个操作终端请求队列以及各自队列的并行处理池;
④多操作终端请求无论同类型与否均可并行处理、访问数据库并应答。
本发明具有下列优点和积极效果:
1、多操作终端并发处理告警配置的读取与配置、告警数据的获取与确认/
清除等操作并行处理,管理效率极大提升;
2、海量并发处理设备上报告警信息,告警处理效率提升;
3、设备管理与设备通信协议、设备类型、网络类型等特征相分离,便于实现统一管理,使得该处理模式能够广泛应用于多种场合;
本发明适用于需要处理监控设备故障的应用系统,提供了一种并行处理设备上报故障告警、并行处理多操作终端操作请求的并行处理模式。
具体实施方式
下面结合附图和实施例详细说明:
一、网管监控系统
1、总体
如图1,本网管监控系统是一种基于分布式网络设备管理的网管监控系统,包括现有的工作环境:数据访问服务20、通信服务30、操作终端40、WEB服务50和数据库服务60,还有所需要的传输网络如一级网管中心70、二级网管中心71和IP传输网络72,以及信号发射80和信号覆盖设备81。
信号覆盖设备81、信号发射80、通信服务30、一级网管中心70、IP传输网络72、二级网管中心71和操作终端40前后依次连通;
数据访问服务20、WEB服务50、数据库服务60和操作终端40分别与一级网管中心70连通;
其特征是:设置有应用服务10,应用服务10与一级网管中心70连通。
2、应用服务10
如图2,应用服务10包括告警管理组件11、通信处理组件12、协议处理组件13和数据访问组件14;告警管理组件11负责并行处理告警;通信处理组件12负责与网元设备进行通信;协议处理组件13负责对网元监控协议组解帧;数据访问组件14负责与数据库进行通信。
其交互关系是:
告警管理组件11与通信处理组件12和协议处理组件13形成应用服务的通信访问通道;
告警管理组件11与数据访问组件14形成应用服务的数据访问通道。
所述的告警管理组件11是负责并行处理告警的处理单元;
所述的通信处理组件12是负责与网元设备进行通信的处理单元;
所述的协议处理组件13是负责对网元监控协议组解帧的处理单元;
所述的数据访问组件14是负责与数据库进行通信的处理单元。
其工作原理是:
信号覆盖设备81上报多个告警数据,由应用服务10并行调用协议处理组件13解帧上行数据,并行派发给告警管理组件11;告警管理组件11收到后,并行调用通信处理组件12发送下行应答数据,将告警数据处理后通过数据访问组件14存储到数据库服务60;同时上报告警给操作终端40。
二、方法
1、操作终端请求处理流程
本方法是多操作终端并发操作,将告警配置操作添加第1处理队列,将告警处理操作添加到第2处理队列,多操作统一调度、并行处理方式完成。
从宏观上看,多个监控操作终端并发请求,互不影响;应用服务并行处理各操作终端操作请求,互不影响,真正实现并行处理。
如图3,操作终端请求处理流程包括下列步骤:
一、操作终端下发操作
①301、若操作终端下发告警配置操作,则加入第1个处理队列;
②302、若操作终端下发告警处理操作,则加入第2个处理队列;
二、交由操作终端的处理例程处理
三、若保存告警配置,则:
①303、通过数据访问服务保存指定告警配置到数据库服务;
②304、若操作成功,则同步更新到应用服务;
③305、上报处理结果给操作终端;
四、若读取告警配置,则:
①306、通过数据访问服务从数据库服务读取指定告警配置;
②307、上报告警配置给操作终端;
五、若处理告警操作,则查找用户所在区域组:
①308、若一级用户,调用全部区域组进行处理;
②309、若二级用户,调用对应区组进行处理;
③310、判断是否获取告警操作,是则到④311,否则到313⑥:
④311、查找符合该用户条件告警;
⑤312、上报告警给操作终端;
⑥313、循环每个告警;
⑦314、查找设备以及该设备告警;
⑧315、若找到,则做告警确认/清除操作,并更新告警到数据库服务;
⑨316、操作成功,则将更新告警上报给操作终端。
2、设备告警处理流程
多台设备并发上报告警,而后根据设备所属区域派发到不同的区域组并行处理,互不影响。同一区域组的设备告警以FIFO原则按序处理。
如图4,设备告警处理流程包括下列步骤::
一、设备上报/查询告警;
二、告警组件收到后,加入设备告警请求队列:
①401、循环处理解析告警数据;
②402、若解析成功,查找设备所在区域,查找设备及告警;
③403、若上报告警,调用通信处理组件接口发送告警应答;
三、发送告警应答协议帧给被覆盖设备:
①404、派发给所在区域进行处理,加入区域告警处理队列;
②405、区域组线程内循环处理队列告警;
③406、调用告警屏蔽、衍生告警屏蔽机制处理告警;
④407、若存在未屏蔽的告警,则查找告警内部队列,未找到则新产生告警;
⑤408、处理/更新告警计数、告警时间等信息;
⑥409、调用自动告警确认、自动告警清除机制处理,更新告警状态信息;
⑦410、将该告警通过数据访问服务存储到数据库服务;
⑧411、循环在线用户;
⑨412、调用在线用户的告警过滤、告警忽略机制处理;
四、若显示告警,则上报告警给操作终端。