CN103905237B - 一种电信交换网的网管系统和管理方法 - Google Patents
一种电信交换网的网管系统和管理方法 Download PDFInfo
- Publication number
- CN103905237B CN103905237B CN201210583702.8A CN201210583702A CN103905237B CN 103905237 B CN103905237 B CN 103905237B CN 201210583702 A CN201210583702 A CN 201210583702A CN 103905237 B CN103905237 B CN 103905237B
- Authority
- CN
- China
- Prior art keywords
- network
- layer
- management system
- communication
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种电信交换网的网管系统和管理方法,网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;网管系统自动向电信交换网中的网元下发维护指令,控制网元自动执行周期维护作业。本发明的电信交换网的网管系统和管理方法,自动执行网络管理任务,实现网络自动例行维护,集中管理网元连接关系管理,分析判断网络事件影响,弥补了现有网管系统以网元为管理对象这一模式在效率、功能上的不足,并具有良好的可扩展性和较高的可靠性。
Description
技术领域
本发明涉及网络管理技术领域,尤其涉及一种电信交换网的网管系统和管理方法。
背景技术
电信交换网是由相互独立运行、型号各异的数字程控交换机互连而成的复杂、庞大的通信网络,主要承载固定及移动语音业务。各交换机在物理上通过传送网、IP承载网连接成一个完整的网络,传递端到端的呼叫;在逻辑上配置数据相互关联,运行状态相互影响,一台交换机的故障会影响整个网络的呼叫路由。
网络管理系统(简称网管系统)是电信交换网的重要组成部分,是支撑电信交换网运行、管理、维护和业务配置的基础工具,对于实时监测电信交换网运行状态,及时发现和解决网络故障,持续优化网络结构,不断提高网络性能,有着不可或缺的重要作用,在网络的部署、运行、发展和演进中扮演着关键角色。
常见的网管系统功能模型是ITU-T和ISO组织提出的FCAPS电信管理网模型,定义了五大基本功能:故障管理、配置管理、安全管理、性能管理和计费管理。目前公知的交换网管系统都参照该模型实现,提供了与交换机进行信息交换的接口,一方面从被管设备中获取运行数据,另一方面将操作指令发送给被管设备执行,从而实现了网元层的设备管理。
这种网元层管理模式中,网管系统以交换机为管理对象,可以看作是交换机的操作维护接口,体现设备的可操作性,是一种自下而上的设计。交换机的例行维护、业务配置数据管理、网络事件影响分析都依赖人工完成,特别是静态配置数据与动态运行数据都分布在各交换机上单独进行管理,网管系统只提供了管理接口,缺乏对交换机之间的物理连接关系、配置数据与运行状态的逻辑关联性这些网络层和业务层属性的管理能力,导致网络管理的效率不高。
网络维护时,同样的例行维护任务,维护人员需要根据各交换机的不同指令集、不同配置数据,以及运行状态生成不同的维护指令,通过网管系统发送给各交换机执行,收集执行结果然后再继续分析。这种依赖人的网络管理方式,随着网络规模扩张,在网设备类型和数量日渐增多,耗费了大量人力;而且,当发生设备告警时,为了判断对网络结构和网络业务的影响,需要查询全程路由数据,实时性差,查询时间长。
发明内容
有鉴于此,本发明要解决的一个技术问题是提供一种电信交换网的网管系统,能够自动执行网络管理任务。
一种电信交换网的网管系统,网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;所述网管系统自动向所述电信交换网中的网元下发维护指令,控制所述网元自动执行周期维护作业。
根据本发明的网管系统的一个实施例,进一步的,所述网管系统包括3个功能层,其中,第一层为设备接口层,第二层为智能网管层,第三层为是呈现层;所述设备接口层包括:网络维护任务执行模块和网络运行数据采集单元;所述网络维护任务执行模块将维护指令下发给所述电信交换网中的各个网元执行;所述网络运行数据采集单元实时采集所述电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入数据库;所述智能网管层包括:智能维护模块、网络事件分析单元和网管系统校验模块;所述智能维护模块自动将维护作业任务下发给所述网络维护任务执行模块执行;所述网络事件分析单元对所述电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响;所述网管系统功能校验模块用于校验网管系统自身运行的完整性;所述呈现层包括:监控管理服务器;所述监控管理服务器提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
根据本发明的网管系统的一个实施例,进一步的,所述网络运行数据采集单元实时采集网络运行状态数据,包括静态配置数据和动态运行数据。
根据本发明的网管系统的一个实施例,进一步的,所述网络运行数据采集单元将采集的各类接口协议的数据整合为统一的内部数据格式;所述接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP。
根据本发明的网管系统的一个实施例,进一步的,所述网络维护任务执行模块接收来自所述智能维护模块发送的维护作业代码,根据所述电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给所述电信交换网中的各个网元执行,并返回执行的结果。
根据本发明的网管系统的一个实施例,进一步的,所述维护指令包括操作码和参数两部分;
根据网元型号和软件版本,使用预定义的翻译表将作业代码翻译成一组维护指令操作码;从所述网络运行数据采集单元采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
根据本发明的网管系统的一个实施例,进一步的,所述智能维护模块自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到所述网络维护任务执行模块执行;所述智能维护模块管理所述维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行;其中,所述维护作业任务的执行为周期性触发或由网络事件实时触发。
根据本发明的网管系统的一个实施例,进一步的,所述网络事件分析单元分析网络事件对物理端口、网络结构和业务流程的影响;所述网络事件包括:设备告警、运行状态变化。
根据本发明的网管系统的一个实施例,进一步的,所述网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化;当所述网络事件分析单元收到网络事件后,就执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围;其中,物理层指所述电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连;网络层指所述电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议;业务层指语音业务、智能业务的话务与信令路由。
根据本发明的网管系统的一个实施例,进一步的,所述网管系统功能校验模块通过分析智能维护模块和网络事件分析单元的运行数据,并测试网管系统与所述电信交换网中的网元之间的接口是否正常,判断所述网管系统运行的完整性。
所述监控管理服务器建立了覆盖所述电信交换网中的网元的各型号的模型,对网元的功能和实现进行统一的描述,把存储在各个网元上的配置数据关联起来,建立统一的逻辑视图。
本发明要解决的一个技术问题是提供一种电信交换网的管理方法,能够自动执行网络管理任务。
一种电信交换网的管理方法,网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;所述网管系统自动向所述电信交换网中的网元下发维护指令,控制所述网元自动执行周期维护作业。
根据本发明的方法的一个实施例,进一步的,所述网管系统包括3个功能层,其中,第一层为设备接口层,第二层为智能网管层,第三层为是呈现层;所述设备接口层包括:网络维护任务执行模块和网络运行数据采集单元;所述智能网管层包括:智能维护模块、网络事件分析单元和网管系统校验模块;所述呈现层包括:监控管理服务器;所述网络维护任务执行模块将维护指令下发给所述电信交换网中的各个网元执行;所述网络运行数据采集单元实时采集所述电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入数据库;所述智能维护模块自动将维护作业任务下发给所述网络维护任务执行模块执行;所述网络事件分析单元对所述电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响;所述网管系统功能校验模块用于校验网管系统自身运行的完整性;所述监控管理服务器提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
根据本发明的方法的一个实施例,进一步的,所述网络运行数据采集单元将采集的各类接口协议的数据整合为统一的内部数据格式;所述接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP;所述网络维护任务执行模块接收来自所述智能维护模块发送的维护作业代码,根据所述电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给所述电信交换网中的各个网元执行,并返回执行的结果;所述维护指令包括操作码和参数两部分;根据网元型号和软件版本,使用预定义的翻译表将作业代码翻译成一组维护指令操作码;其中,从所述网络运行数据采集单元采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
根据本发明的方法的一个实施例,进一步的,所述智能维护模块自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到所述网络维护任务执行模块执行;所述智能维护模块管理所述维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行;其中,所述维护作业任务的执行为周期性触发或由网络事件实时触发。
根据本发明的方法的一个实施例,进一步的,所述网络事件分析单元分析网络事件对物理端口、网络结构和业务流程的影响;所述网络事件包括:设备告警、运行状态变化。所述网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化;当所述网络事件分析单元收到网络事件后,执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围;其中,物理层指所述电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连;网络层指所述电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议;业务层指语音业务、智能业务的话务与信令路由。
本发明的电信交换网的网管系统和管理方法,自动执行网络管理任务,实现网络自动例行维护,集中管理网元连接关系管理,分析判断网络事件影响,弥补了现有网管系统以网元为管理对象这一模式在效率、功能上的不足,并具有良好的可扩展性和较高的可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明的网管系统的一个实施例的示意图;
图2为根据本发明的网管系统的另一个实施例的示意图;
图3为根据本发明的交换机抽象模型的一个实施例的示意图;
图4为根据本发明的网络系统三层结构以及层间关系的一个实施例的示意图;
图5为根据本发明的电信交换网的管理方法的一个实施例的流程图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面结合各个图和实施例对本发明的技术方案进行多方面的描述。
图1为根据本发明的网管系统的一个实施例的示意图。
电信交换网的网管系统,自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;网管系统自动向电信交换网中的网元下发维护指令,控制网元自动执行周期维护作业。
如图1所示:网管系统包括3个功能层,其中,第一层为设备接口层,第二层为智能网管层,第三层为呈现层。
设备接口层包括:网络维护任务执行模块11(可以为网络维护任务执行装置或单元11)和网络运行数据采集单元(网络运行数据采集器,也可以为网络运行数据采集装置)12。网络维护任务执行模块11将维护指令下发给电信交换网中的各个网元执行。网络运行数据采集单元12实时采集电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入网络拓扑与状态数据库17。
智能网管层包括:智能维护模块13(可以为智能维护装置或单元13)、网络事件分析单元(网络事件分析器,也可以为网络事件分析装置)14和网管系统校验模块15(可以为网管系统校验装置或单元15)。智能维护模块13自动将维护作业任务下发给网络维护任务执行模块执行。网络事件分析单元14对电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响。网管系统功能校验模块15用于校验网管系统自身运行的完整性。
呈现层包括:监控管理服务器18。监控管理服务器18提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
根据本发明的一个实施例,网络运行数据采集单元12实时采集网络运行状态数据,包括静态配置数据和动态运行数据。
网络运行数据采集单元12将采集的各类接口协议的数据整合为统一的内部数据格式。接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP。
根据本发明的一个实施例,网络维护任务执行模块11接收来自智能维护模块13发送的维护作业代码,根据电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给电信交换网中的各个网元执行,并返回执行的结果。
维护指令包括操作码和参数两部分。
根据网元型号和软件版本,网络维护任务执行模块11使用预定义的翻译表将作业代码翻译成一组维护指令操作码。从网络运行数据采集单元12采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
根据本发明的一个实施例,智能维护模块13自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到网络维护任务执行模块执行。
智能维护模块13管理维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行。其中,维护作业任务的执行为周期性触发或由网络事件实时触发。
根据本发明的一个实施例,网络事件分析单元14分析网络事件对物理端口、网络结构和业务流程的影响。网络事件包括:设备告警、运行状态变化。
根据本发明的一个实施例,网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化。当网络事件分析单元14收到网络事件后,就执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围。其中,物理层指电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连。网络层指电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议。业务层指语音业务、智能业务的话务与信令路由。
根据本发明的一个实施例,网管系统功能校验模块16通过分析智能维护模块13和网络事件分析单元14的运行数据,并测试网管系统与电信交换网中的网元之间的接口是否正常,判断网管系统运行的完整性。
监控管理服务器18建立了覆盖电信交换网中的网元的各型号的模型,对网元的功能和实现进行统一的描述,把存储在各个网元上的配置数据关联起来,建立统一的逻辑视图。
根据本发明的一个实施例,本发明的网管系统弥补了网元层管理模式在维护效率、网络层和业务层管理能力上的不足,提供了一种以交换网为管理对象的新型网管系统,一种按照自上而下设计的面向维护任务的软件系统,用于自动执行网络管理任务。相比于已有的网络管理任务执行系统,如局数据批量制作系统和自动告警处理系统,本申请摆脱了单一机型、单一任务的限制,以网络和业务管理为目标。
根据本发明的一个实施例,网管系统通过计算机程序向交换机直接下发维护指令,完成两个任务:自动执行交换机周期性维护作业。读取交换机业务配置数据,基于业务字冠、路由组织、信令关系的相关性以及物理连接关系构造网络拓扑,在此基础上分析设备告警对网络和业务的影响。
网管系统自动采集业务配置数据,归一化后构造了一个网络拓扑及语音呼叫流程,在此基础上实现了自动例行维护、设备告警分析两项网络管理任务的自动化执行。
根据本发明的一个实施例,网管系统的设备接口层可以看作是一个协议适配层,将来自不同交换机的不同通信接口协议的信息转换成统一格式的内部数据,将维护作业代码根据各交换机不同的配置、不同的指令集,翻译成目标交换机可执行的维护指令,经由通信接口发送给交换机执行。该层运用面向对象方法建立了一个交换机抽象模型,对现网交换机按照功能结构进行一般化描述,以一个超类的形式实现,将从实际交换机采集来的配置数据转换为该模型的属性。利用抽象模型,各交换机在业务字冠、路由组织、信令关系这些配置数据的相关性在模型的属性上体现出来。同时,采集指令作为超类的一个具体方法,是可以直接访问目标交换机内部数据模型的可执行指令集合。
网管系统的智能网管层中的智能维护模块13负责管理各类例行维护作业任务的自动执行。例行维护作业随交换机型号、配置数据、运行状态不同,任务内容差别较大。为实现作业的灵活调度可实现可重配置,把例行维护作业划分成一组基本操作单元,基本操作单元是最小的执行单元,用一个维护作业代码标识,完整的维护作业由一组基本操作单元和一个单元执行规则组成,单元执行规则是一个状态机,定义了基本操作单元的执行顺序以及单元间参数传递方法。
智能网管层中的网络事件分析器14负责分析各类网络事件对网络结果和业务流程的影响,并管理网络拓扑。网络事件包括但不限于设备告警、运行状态变化。基于设备接口层建立的交换机抽象模型,该分析器构造了一个三层结构的电信交换网络系统,分为物理层、网络层和业务层。物理层描述了交换机物理端口之间的互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连。网络层描述了交换机之间协议连接关系,包括七号信令、SIP协议。业务层描述了语音业务、智能业务的话务与信令路由。有了这些基本的数据结构,分析器分析网络事件对物理端口、网络链接和业务流程的影响。
智能网管层中的网管系统校验模块15目的是提高系统运行的稳定性,方法是在不影响系统其他模块正常运行的情况下,发现系统运行异常。采取的技术方案是:其他模块运行时留下实时运行轨迹数据,由校验模块验证轨迹数据逻辑上是否正确。
根据本发明的一个实施例,呈现层是网管系统的用户界面,输出系统生成的网络运行分析报告,并保持分析结果的实时刷新。另一个功能是为用户提供修改运行参数的接口,主要是操作单元的执行规则,及事件分析器使用的判决条件和参考阈值。
图2为根据本发明的网管系统的另一个实施例的示意图。如图2所示:电信交换网网管系统包括有四个服务器:设备接口服务器21、报表服务器23、智能网管服务器22和数据库服务器24。网管系统包括3个功能层,其中,设备接口服务器21相当于设备接口层,智能网管服务器22相当于智能网管层,报表服务器23相当于呈现层。
设备接口服务器21作为电信交换网网管系统与电信交换网之间的通信接口,负责采集网络运行数据,包括各交换机上的静态配置数据和动态运行数据,包括但不限于设备告警、性能统计,及操作日志。采集到的数据进行格式化后发送到数据库服务器24。同时设备接口服务器21还负责翻译来自智能网管服务器22的维护作业代码,生成目标交换机可执行的各类操作维护指令,并分析指令执行结果,由此屏蔽了各型号交换机在指令集、内部数据模型和配置上的差异,使得智能网管服务器22专注于网络层和业务层的数据处理。
图3为根据本发明的交换机抽象模型的一个实施例的示意图。如图3所示:交换机抽象模型对在网运行的各型号、版本的交换机进行一般化描述,在提供了交换机的主要功能的同时,屏蔽了不同型号在具体实现上的差异,是构造交换网逻辑拓扑的基本元素。也就是说,该模型把分散存储在各交换机上的、杂乱无序的配置数据关联起来,形成一个互连的、有序的结构化数据,为网络运行维护、业务配置管理建立一个统一的逻辑视图。
该模型包括公共逻辑资源、呼叫处理模型和物理资源三个部分,其中公共逻辑资源是设备标识信息,包括有信令点编码(Point Code)、IP地址、全局翻译码(GT码),是设备互通的基本标识。呼叫处理模型用关系表查找过程模拟了交换机的典型工作过程,其中被叫号码信息属于业务层,局向、信令路由属于网络层。物理资源包括了呼叫业务使用到的实际资源,包括了中继电路、以太网接口、以及信令处理资源。
设备接口服务器在实现上的复杂性有两方面:
一是处理各类接口协议。除了公开的接口协议如COBRA、SNMP、TL1、TELNET/SSH、FTP、HTTP,也有基于SOCKET的各类私有接口协议,一些更早期入网的西门子EWSD、上海贝尔S1240交换机还需要进行物理接口改造以支持IP通信。
二是维护作业代码的翻译。各种型号的交换机虽然基本功能一致,但内部数据模型和指令集不同,即使是同一型号,随着装载软件不同,指令集也存在差别。设置指令集都有很大不同。例如查看中继群的指令,朗讯5ESS设备使用的是OPSUM-TG和OPLST-TG,而上海贝尔S1240设备使用的是1560这一数字指令,而华为、中兴又有各自的指令格式,对于该指令参数:中继群标识,即使同一机型,各设备的实际配置也是不同的。
维护作业代码将这些与具体设备密切相关的细节任务封装在代码翻译模块中,使得上层可以对所有设备进行同样的处理。
维护作业代码标识了一个基本任务单元,代码翻译模块根据目标设备型号、指令集、配置的不同,将代码翻译成一条或多条的维护指令。在多条指令的情形下,还包含有指令序列的执行规则,用于定义指令的执行顺序与指令间的参数传递方式。
这种设计目的是提高网管系统的可扩展性,随着网络演进引入新的交换设备,只需要增加该设备的代码翻译模块即可,在智能网管层及以上都不需要变化。
智能网管服务器是实现自动例行维护、事件分析的应用服务器,包括3个独立运行的进程,一是智能维护进程,该进程将通常的人工例行维护作业划分为一系列基本任务单元。如下表1所示。
表1-网元的维护作业表
上述维护作业适用于所有机型。当然,有些交换机因采用了一些特殊设计,需要一些额外的维护作业,我们把这部分纳入到T09任务中,比较设置的阈值和实际值。对不能纳入到T09的一些特殊维护作业,仍沿用既有的人工维护模式。可以说,上述维护作业已经涵盖了90%以上网络例行维护作业。
任务单元之间有关联性,例如时钟故障发生时,由于设备时钟与网络不同步,局间TDM中继出现滑码,严重时TDM中继电路会变成故障状态。同时,相连设备之间的任务单元也有关联性,例如对端局的TDM电路为故障态,而本局对应的状态为空闲,那么表明两端状态不一致,会导致呼损,这种情况在网络维护中并不罕见,以前是通过人工分析呼损或者有用户投诉了才能发现,费时费力,现在智能维护进程可以自动比较判断,给出警示,并对电路进行简单的复位操作。
智能维护进程,根据作业的执行周期,周期性调度各作业执行,通过周而复始的检查运行状态,可以及时发现交换机运行中的异常、提前进行资源预警。
相比之下,同属于智能网管层的网络事件分析器则采用了条件触发方式执行,也就是当网络事件分析器收到交换机产生的网络事件后,就执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围。
图4为根据本发明的网络系统三层结构以及层间关系的一个实施例的示意图。如图4所示,将交换网分为三层,图中的逻辑连接对应网络层,表明网络互通,业务互通对应这业务层,表明语音业务和智能业务可以正常传递到下游局。而物理连接对应物理层,是实际的物理端口。三层之间,底层事件发生后需要分析对上层的影响。
以采集到TDM电路端口传输告警事件为例,网络事件分析器采取如下分析步骤:
步骤1:端口上的TDM电路是否分配给局向,如未分配则表明无效告警,不影响现有业务和网络结构,输出提示信息,提醒维护人员屏蔽该告警。否则继续执行步骤2。
步骤2:该局向是否还有其他电路可用,如果有,表明局向可达,并分析剩余可用电路数占比,如果不可用电路数达到了设定阈值,则输出提示信息,提醒维护人员及时处理故障电路。否则,为局向不可达,继续执行步骤3。
步骤3:那么该局向上的被叫号码(业务层)有无其他迂回局向可用。如果有,则表明该事件只影响网络层,尚不影响业务层。如果没有,那么认为该端口告警事件,影响了至下一个局向的呼叫路由,并导致本局某些业务字冠不通。并继续执行步骤4。
步骤4:在交换机之间也进行同样的对比分析,对于本局来说到某个下游局向不通,如果上游局(来话方向)将呼叫在2个局之间负荷分担的话,那么本局的故障只会影响到一半的呼叫,否则上游局也是业务字冠不通。
智能网管服务器的第三个模块是网管系统校验进程。网管系统校验进程,通过分析其他两个模块的运行轨迹信息,发现网管系统运行异常。
校验网络运行数据采集器的具体步骤如下:
步骤1:检查网络运行数据采集器的运行日志中最近一次采集成功的时间,如该时间距离当前时间超过了设定周期的3倍(本实例中采集周期为5分钟),则认为数据未及时采集,可能原因包括:与交换机通信接口异常、采集进程运行异常、以及设备侧网管接口软件运行异常。
步骤2:测试网管系统和交换机之间的通信接口是否正常,首先PING接口地址,如果成功下发查询设备时间的指令,如果正确返回时间,则认为通信接口正常。
步骤3:测试设备侧网管接口软件,方法是由系统校验进程试采集,如果采集成功则认为接口软件正常。
步骤4:重启采集进程。等待1个周期后重新执行步骤1的检查,如仍未及时采集,记录一次采集失败事件,并以声音和视频的提示维护人员。
校验智能维护模块的具体步骤如下:
步骤1:检查智能维护模块的运行日志中最近2次维护作业成功执行的时间。成功执行指的是维护作业的输出结果符合预期格式,而不论是否检测出设备异常。比较前两次时间差算出周期,如该时间距离当前时间超过了设定周期的3倍,则认为智能维护模块有作业未能执行,可能原因包括:与交换机通信接口异常、维护进程运行异常、以及设备侧软件运行异常。
步骤2:测试网管系统和交换机之间的通信接口是否正常,首先PING接口地址,如果成功则尝试进行时间管理作业T01,如果系统时间正常,则认为通信接口正常。
步骤3:重启智能维护模块,并调度维护作业立即执行,如果成功执行,则认为设备侧软件正常。等待3个周期后,再次执行步骤1检查是否,如果仍未能成功执行,记录一次自动维护失败事件,并以声音和视频的提示维护人员。
校验网络事件分析器的具体步骤如下:
步骤1:网络事件分析器并非以周期方式执行,因此无法校验周期。检查运行日志的最近一次事件分析时间,比较网络运行数据采集器中的最近一次事件的事件号(ID),如果一致,则表示事件分析正常,如果不一致,则表明有事件遗漏没有及时分析。可能原因包括:事件分析器运行异常、模块间通信异常。
步骤2:重启网络事件分析器,等待5分钟后,再次执行步骤1,如果事件已经正常分析,则认为系统恢复正常,如果仍未能成功完成事件分析,记录一次事件分析失败事件,并以声音和视频的提示维护人员。
系统校验进程自身也是一个软件模块,因此也有可能出现异常,本实例采取看门狗式方法,即设置一个声音和视频提醒的定时器,系统校验进程定时去复位该定时器,如果进程自身正常,则没有任何提醒,如果异常,则不能及时复位定时器,导致声音和视频提醒产生。
图5为根据本发明的电信交换网的管理方法的一个实施例的流程图。如图5所示:
步骤502,网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障。
步骤503,网管系统自动向电信交换网中的网元下发维护指令,控制网元自动执行周期维护作业。
根据本发明的一个实施例,网管系统包括3个功能层,其中,第一层为设备接口层,第二层为智能网管层,第三层为是呈现层。设备接口层包括:网络维护任务执行模块和网络运行数据采集单元。智能网管层包括:智能维护模块、网络事件分析单元和网管系统校验模块。呈现层包括:监控管理服务器。
网络维护任务执行模块将维护指令下发给电信交换网中的各个网元执行。网络运行数据采集单元实时采集电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入数据库。
智能维护模块自动将维护作业任务下发给网络维护任务执行模块执行。网络事件分析单元对电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响。
网管系统功能校验模块用于校验网管系统自身运行的完整性。
监控管理服务器提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
根据本发明的一个实施例,网络运行数据采集单元将采集的各类接口协议的数据整合为统一的内部数据格式。接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP。
网络维护任务执行模块接收来自智能维护模块发送的维护作业代码,根据电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给电信交换网中的各个网元执行,并返回执行的结果。
维护指令包括操作码和参数两部分。根据网元型号和软件版本,使用预定义的翻译表将作业代码翻译成一组维护指令操作码。其中,从网络运行数据采集单元采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
根据本发明的一个实施例,智能维护模块自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到网络维护任务执行模块执行。智能维护模块管理维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行。其中,维护作业任务的执行为周期性触发或由网络事件实时触发。
根据本发明的一个实施例,,网络事件分析单元分析网络事件对物理端口、网络结构和业务流程的影响。网络事件包括:设备告警、运行状态变化。网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化。当网络事件分析单元收到网络事件后,执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围。
物理层指电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连。网络层指电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议。业务层指语音业务、智能业务的话务与信令路由。
本申请提供了一种电信交换网的网管系统和管理方法,以交换网为管理对象,实现网络自动例行维护,集中管理网元连接关系管理,分析判断网络事件影响。该方法有效弥补了现有网管系统以网元为管理对象这一模式在效率、功能上的不足,贴近电信运营商全面、高效、实时管理电信交换网的实际需求。
在系统结构上,与其他告警自动处理系统或维护工具软件相比,具有以下有点:
(1)良好的可扩展性,采用层次化以及面向对象的模块化设计方法,建立了一个通用交换机抽象模型,不局限于个别交换机的实现方式,能适应不同的交换机类型、版本,适用范围广,且扩容功能模块不影响现有功能模块。
(2)较高的可靠性,本申请增加了安全设计,设计了一个独立的系统功能校验模块,校验网管系统自身运行状态、以及与被管网元间的接口状态,提高了网管系统可靠性,减少了网管系统后期维护工作量。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机单元可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。
Claims (15)
1.一种电信交换网的网管系统,其特征在于:
网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;
所述网管系统自动向所述电信交换网中的网元下发维护指令,控制所述网元自动执行周期维护作业;
所述网管系统包括3个功能层,第一层为设备接口层,第二层为智能网管层,第三层为呈现层;所述智能网管层包括:网络事件分析单元,用于对所述电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响;
其中,所述设备接口层包括:网络维护任务执行模块;所述智能网管层包括:智能维护模块;所述智能维护模块自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到所述网络维护任务执行模块执行;所述网络维护任务执行模块接收来自所述智能维护模块发送的维护作业代码,根据所述电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给所述电信交换网中的各个网元执行,并返回执行的结果;其中,所述维护指令包括操作码和参数两部分,根据网元型号和软件版本,使用预定义的翻译表将作业代码翻译成一组维护指令操作码。
2.如权利要求1所述的网管系统,其特征在于:
所述设备接口层还包括:网络运行数据采集单元;所述网络运行数据采集单元实时采集所述电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入数据库;
所述智能网管层还包括:网管系统校验模块;所述网管系统功能校验模块用于校验网管系统自身运行的完整性;
所述呈现层包括:监控管理服务器;所述监控管理服务器提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
3.如权利要求2所述的网管系统,其特征在于:
所述网络运行数据采集单元实时采集网络运行状态数据,包括静态配置数据和动态运行数据。
4.如权利要求3所述的网管系统,其特征在于:
所述网络运行数据采集单元将采集的各类接口协议的数据整合为统一的内部数据格式;
所述接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP。
5.如权利要求4所述的网管系统,其特征在于:
从所述网络运行数据采集单元采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
6.如权利要求2所述的网管系统,其特征在于:
所述智能维护模块管理所述维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行;
其中,所述维护作业任务的执行为周期性触发或由网络事件实时触发。
7.如权利要求2所述的网管系统,其特征在于:
所述网络事件分析单元分析网络事件对物理端口、网络结构和业务流程的影响;所述网络事件包括:设备告警、运行状态变化。
8.如权利要求7所述的网管系统,其特征在于:
所述网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化;当所述网络事件分析单元收到网络事件后,执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围;
其中,物理层指所述电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连;
网络层指所述电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议;
业务层指语音业务、智能业务的话务与信令路由。
9.如权利要求2所述的网管系统,其特征在于:
所述网管系统功能校验模块通过分析智能维护模块和网络事件分析单元的运行数据,并测试网管系统与所述电信交换网中的网元之间的接口是否正常,判断所述网管系统运行的完整性。
10.如权利要求2所述的网管系统,其特征在于:
所述监控管理服务器建立了覆盖所述电信交换网中的网元的各型号的模型,对网元的功能和实现进行统一的描述,把存储在各个网元上的配置数据关联起来,建立统一的逻辑视图。
11.一种电信交换网的管理方法,其特征在于:
网管系统自动采集电信交换网中的网元的配置数据,构造网络拓扑,并采集网元的告警信息,分析故障;
所述网管系统自动向所述电信交换网中的网元下发维护指令,控制所述网元自动执行周期维护作业;
其中,所述网管系统包括3个功能层,第一层为设备接口层,第二层为智能网管层,第三层为呈现层;所述智能网管层包括:网络事件分析单元,用于对所述电信交换网中的网元的告警进行关联分析,判断告警事件对全网结构、网络业务的影响;
所述设备接口层包括:网络维护任务执行模块;所述智能网管层包括:智能维护模块;所述智能维护模块自动将维护作业任务转换成一组基本操作单元,用网络维护作业代码标识,下发到所述网络维护任务执行模块执行;所述网络维护任务执行模块接收来自所述智能维护模块发送的维护作业代码,根据所述电信交换网中的网元的业务配置、指令格式,翻译成具体维护指令下发给所述电信交换网中的各个网元执行,并返回执行的结果;其中,所述维护指令包括操作码和参数两部分,根据网元型号和软件版本,使用预定义的翻译表将作业代码翻译成一组维护指令操作码。
12.如权利要求11所述的方法,其特征在于:
所述设备接口层还包括:网络运行数据采集单元;所述智能网管层还包括:网管系统校验模块;所述呈现层包括:监控管理服务器;
所述网络运行数据采集单元实时采集所述电信交换网的运行数据,包括:业务配置、告警、事件、性能数据以及操作日志,写入数据库;
所述网管系统功能校验模块用于校验网管系统自身运行的完整性;
所述监控管理服务器提供网管系统运行参数的配置接口,输出维护作业执行报告、网络事件分析报告。
13.如权利要求12所述的方法,其特征在于:
所述网络运行数据采集单元将采集的各类接口协议的数据整合为统一的内部数据格式;所述接口协议包括:COBRA、SNMP、TL1、TELNET/SSH、FTP和HTTP;
其中,从所述网络运行数据采集单元采集的网元配置数据中获取指令参数,或从上一条维护指令的输出结果中获得下一条维护指令的参数,其中,最先执行的是查询配置参数指令。
14.如权利要求13所述的方法,其特征在于:
所述智能维护模块管理所述维护作业任务的执行,根据上一个任务单元的执行结果,按照预先定义好的一组判决规则,选择下一个任务单元执行;其中,所述维护作业任务的执行为周期性触发或由网络事件实时触发。
15.如权利要求14所述的方法,其特征在于:
所述网络事件分析单元分析网络事件对物理端口、网络结构和业务流程的影响;所述网络事件包括:设备告警、运行状态变化;
所述网络事件包括针对物理层、网络层和业务层状态的告警、运行状态变化;当所述网络事件分析单元收到网络事件后,执行自下而上,从物理层、网络层到业务层逐层分析事件的影响范围;
其中,物理层指所述电信交换网中的网元之间物理端口互连关系,包括通过线缆直接互连或者通过传送网和IP网的互连;
网络层指所述电信交换网中的网元之间配置数据的关联,包括七号信令、SIP协议;
业务层指语音业务、智能业务的话务与信令路由。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210583702.8A CN103905237B (zh) | 2012-12-28 | 2012-12-28 | 一种电信交换网的网管系统和管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210583702.8A CN103905237B (zh) | 2012-12-28 | 2012-12-28 | 一种电信交换网的网管系统和管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103905237A CN103905237A (zh) | 2014-07-02 |
CN103905237B true CN103905237B (zh) | 2018-10-02 |
Family
ID=50996394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210583702.8A Active CN103905237B (zh) | 2012-12-28 | 2012-12-28 | 一种电信交换网的网管系统和管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103905237B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104125102B (zh) * | 2014-08-12 | 2017-10-03 | 浪潮天元通信信息系统有限公司 | 一种实时监控网络设备运行数据完整性的方法 |
CN105991317A (zh) * | 2015-02-04 | 2016-10-05 | 中国移动通信集团安徽有限公司 | Ptn业务电路调度方法、系统及ptn电路自动调度子系统 |
CN106656599A (zh) * | 2016-12-22 | 2017-05-10 | 浙江鹏信信息科技股份有限公司 | 一种网络数据配置指令下发的方法及系统 |
CN109039685B (zh) * | 2017-06-12 | 2021-05-04 | 中兴通讯股份有限公司 | 一种网管系统故障告警映射配置方法及装置 |
CN108989336B (zh) * | 2018-08-19 | 2021-09-28 | 杭州安恒信息技术股份有限公司 | 一种用于网络安全事件的应急处置系统及应急处置方法 |
CN109858242A (zh) * | 2018-11-30 | 2019-06-07 | 中国电力科学研究院有限公司 | 一种防止用电采集终端中模块被绕过执行的方法及系统 |
US11153144B2 (en) | 2018-12-06 | 2021-10-19 | Infosys Limited | System and method of automated fault correction in a network environment |
CN111526052B (zh) * | 2020-04-17 | 2023-04-07 | 中移(杭州)信息技术有限公司 | 网元指令管理方法、装置、网络设备及存储介质 |
CN115277352B (zh) * | 2021-04-29 | 2023-09-19 | 中国移动通信集团辽宁有限公司 | 网元指令纠错方法、装置、电子设备及计算机存储介质 |
CN113364623A (zh) * | 2021-06-04 | 2021-09-07 | 上海天旦网络科技发展有限公司 | 基于路径图与网络性能指标减少告警误判的方法和系统 |
CN114615157A (zh) * | 2022-01-19 | 2022-06-10 | 浪潮通信信息系统有限公司 | 一种面向算网一体化场景的智慧营维系统及其应用方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197621A (zh) * | 2007-12-07 | 2008-06-11 | 中兴通讯股份有限公司 | 一种对网管系统故障进行远程诊断定位的方法及其系统 |
CN102325036A (zh) * | 2011-05-17 | 2012-01-18 | 中兴通讯股份有限公司 | 一种网络系统的故障诊断方法、系统及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070083642A1 (en) * | 2005-10-07 | 2007-04-12 | International Business Machines Corporation | Fully distributed data collection and consumption to maximize the usage of context, resource, and capacity-based client server interactions |
-
2012
- 2012-12-28 CN CN201210583702.8A patent/CN103905237B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197621A (zh) * | 2007-12-07 | 2008-06-11 | 中兴通讯股份有限公司 | 一种对网管系统故障进行远程诊断定位的方法及其系统 |
CN102325036A (zh) * | 2011-05-17 | 2012-01-18 | 中兴通讯股份有限公司 | 一种网络系统的故障诊断方法、系统及装置 |
Non-Patent Citations (1)
Title |
---|
通信设备自动维护系统的设计与实现;郭旗;《中国硕士学位论文全文数据库》;20100315(第2010年第3期);第4.1-4.6节,表4-1 * |
Also Published As
Publication number | Publication date |
---|---|
CN103905237A (zh) | 2014-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103905237B (zh) | 一种电信交换网的网管系统和管理方法 | |
CN107046481B (zh) | 一种信息系统综合网管系统综合分析平台 | |
CN106100999B (zh) | 一种虚拟化网络环境中镜像网络流量控制方法 | |
CN106992877B (zh) | 基于sdn架构的网络故障检测与修复方法 | |
CN105159964B (zh) | 一种日志监控方法及系统 | |
CN102158360B (zh) | 一种基于时间因子因果关系定位的网络故障自诊断方法 | |
CN105790990B (zh) | 一种监管配用电通信业务的方法及其系统 | |
CN107404421A (zh) | 流量监测、监管方法及系统 | |
CN112333020B (zh) | 一种基于五元组的网络安全监测及数据报文解析系统 | |
CN110113205A (zh) | 一种基于软件定义网络技术的网络排障系统及其工作方法 | |
CN111930078A (zh) | 一种面向核控系统的网络测试装置 | |
CN104639358B (zh) | 批量网络端口切换方法及切换系统 | |
CN108696371A (zh) | 网络故障确定方法及系统 | |
CN107800559A (zh) | 一种软件定义网络sdn的告警处理方法及装置 | |
CN109547257A (zh) | 网络流量控制方法、装置、设备、系统及存储介质 | |
Zhang et al. | SDNMP: Enabling SDN management using traditional NMS | |
CN106209484A (zh) | 一种深度网路分析系统的测试方法和装置 | |
Leal et al. | Software defined power substations: An architecture for network communications and its control plane | |
CN109687985B (zh) | 一种变电站过程层网络自动配置方法及系统 | |
Su et al. | A scalable on-line multilevel distributed network fault detection/monitoring system based on the SNMP protocol | |
CN114443488A (zh) | 一种arinc664网络配置测试框架构建方法 | |
Han et al. | Computer network failure and solution | |
CN100484041C (zh) | 一种在宽带网络中实现大业务量数据测试的装置 | |
CN111884953A (zh) | 一种基于SONiC交换机实现错误回报的方法及装置 | |
CN106452971B (zh) | 一种基于分布式集群系统的监控网口检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |