CN114710396A - 一种网络告警的处理方法和服务器 - Google Patents

一种网络告警的处理方法和服务器 Download PDF

Info

Publication number
CN114710396A
CN114710396A CN202210368192.6A CN202210368192A CN114710396A CN 114710396 A CN114710396 A CN 114710396A CN 202210368192 A CN202210368192 A CN 202210368192A CN 114710396 A CN114710396 A CN 114710396A
Authority
CN
China
Prior art keywords
alarm
network
fault
network element
alarms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210368192.6A
Other languages
English (en)
Other versions
CN114710396B (zh
Inventor
满祥锟
李慧
李一鸣
聂天予
王光全
纪越峰
张贺
魏步征
蔡一鸿
张红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202210368192.6A priority Critical patent/CN114710396B/zh
Publication of CN114710396A publication Critical patent/CN114710396A/zh
Application granted granted Critical
Publication of CN114710396B publication Critical patent/CN114710396B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种网络告警的处理方法和服务器,解决了处理故障效率较低的问题。该方法包括:根据获取的第一网络的告警信息以及第一网络的网络拓扑信息,建立第一告警树;其中,第一告警树包括多个告警对应的多个节点,多个节点包括根节点以及以根节点为源头的分支,一个分支包括具有父子关系的节点;具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;衍生关系、第一告警故障分类根据告警对应的告警原因确定得到;根据第一告警树,处理第一网络的故障。

Description

一种网络告警的处理方法和服务器
技术领域
本申请涉及网络维护技术领域,尤其涉及一种网络告警的处理方法和服务器。
背景技术
随着互联网的迅速发展,通信网络不断向着复杂化演进,承载更多的用户业务,也有更多的物理设备接入其中。一个网元发生故障可能会使得有业务的其他网元无法工作,产生若干告警。
运维人员在进行故障排查时,需要依靠大量资料和自身经验进行分析,难以快速定位根源告警。现有的一部分技术将所有告警作为一个数据集进行分析,通过历史告警确定告警间的逻辑关系,依据逻辑关系对现有告警进行关联抑制或对告警进行处理。但是这种方法对于新出现的告警,抑制效果不佳,且需要处理多个告警。现有技术还可以通过对告警进行优先级排序,帮助运维人员处理优先级高的告警,但是优先级高的告警不一定是根源告警,还是需要运维人员根据业务路径进行人工检查,从而影响故障处理时效,使得网络中断后无法快速恢复正常。
发明内容
本申请提供了一种网络告警的处理方法和服务器,可以清晰地表示出网络中告警间的关联关系,快速地确定网络中的根源告警,有利于提高处理故障的效率。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供了一种网络告警的处理方法。获取第一网络的告警信息以及第一网络的网络拓扑信息;其中,第一网络的告警信息包括第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;第一网络的网络拓扑信息包括第一网络中处于同一业务路径的网元,以及网元间的连接关系;根据第一网络的告警信息以及第一网络的网络拓扑信息,建立第一告警树;其中,第一告警树包括多个告警对应的多个节点,多个节点包括根节点以及以根节点为源头的分支,一个分支包括具有父子关系的节点;具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;衍生关系、第一告警故障分类根据告警对应的告警原因确定得到;根据第一告警树,处理第一网络的故障。
结合上述第一方面,在一种可能的实现方式中,还包括:若第一告警的告警原因中包括第二告警的告警名称,判断第一告警所在网元对应的业务路径是否产生第二告警;当第一告警所在网元对应的业务路径产生第二告警时,确定第一告警和第二告警具有衍生关系,且第一告警树上第二告警对应的节点为第一告警对应的节点的父节点。
结合上述第一方面,在一种可能的实现方式中,根据第一告警故障分类确定的两个告警对应的节点,包括:根据第三告警对应的第一告警故障分类,判断第三告警所在网元的业务路径中是否产生第四告警,第四告警为第一告警故障分类对应的网元或线路产生的;当第三告警所在网元对应的业务路径产生第四告警时,确定在第一告警树上第四告警对应的节点为第三告警对应的节点的父节点。
结合上述第一方面,在一种可能的实现方式中,第一告警故障分类为对端故障、上游故障、下游故障、线路故障中任一项。
结合上述第一方面,在一种可能的实现方式中,当第一告警故障分类为对端故障时,第一告警故障分类对应的网元为第三告警所在网元的对端网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号接收方向上的网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号发送方向上的网元;当第一告警故障分类为线路故障时,第一告警故障分类对应的线路为第三告警所在网元连接其他网元间的线路。
第二方面,本申请提供了一种网络告警的处理系统,包括获取模块和处理模块;获取模块,用于获取第一网络的告警信息以及第一网络的网络拓扑信息;其中,第一网络的告警信息包括第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;第一网络的网络拓扑信息包括第一网络中处于同一业务路径的网元,以及网元间的连接关系;处理模块,用于根据第一网络的告警信息以及第一网络的网络拓扑信息,建立第一告警树;其中,第一告警树包括多个告警对应的多个节点,多个节点包括根节点以及以根节点为源头的分支,一个分支包括具有父子关系的节点;具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;衍生关系、第一告警故障分类根据告警对应的告警原因确定得到;处理模块,还用于根据第一告警树,处理第一网络的故障。
结合上述第二方面,在一种可能的实现方式中,还包括:处理模块,还用于若第一告警的告警原因中包括第二告警的告警名称,判断第一告警所在网元对应的业务路径是否产生第二告警;处理模块,还用于当第一告警所在网元对应的业务路径产生第二告警时,确定第一告警和第二告警具有衍生关系,且第一告警树上第二告警对应的节点为第一告警对应的节点的父节点。
结合上述第二方面,在一种可能的实现方式中,根据第一告警故障分类确定的两个告警对应的节点,包括:处理模块,还用于根据第三告警对应的第一告警故障分类,判断第三告警所在网元的业务路径中是否产生第四告警,第四告警为第一告警故障分类对应的网元或线路产生的;处理模块,还用于当第三告警所在网元对应的业务路径产生第四告警时,确定在第一告警树上第四告警对应的节点为第三告警对应的节点的父节点。
结合上述第二方面,在一种可能的实现方式中,第一告警故障分类为对端故障、上游故障、下游故障、线路故障中任一项。
结合上述第二方面,在一种可能的实现方式中,当第一告警故障分类为对端故障时,第一告警故障分类对应的网元为第三告警所在网元的对端网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号接收方向上的网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号发送方向上的网元;当第一告警故障分类为线路故障时,第一告警故障分类对应的线路为第三告警所在网元连接其他网元间的线路。
第三方面,本申请提供了一种处理装置,包括处理器,用于与存储器相连,调用所述存储器中存储的程序,以执行如第一方面或第一方面的可能的实现方式中任一所述的网络告警的处理方法。
第四方面,本申请提供了一种计算机可读存储介质,包括计算机指令,当所述计算机指令在处理装置上运行时,使得所述处理装置执行如第一方面或第一方面的可能的实现方式中任一所述的网络告警的处理方法。
综上可见,在本申请实施例提供的网络告警处理方法中,当第一网络中存在告警时,根据第一网络的告警信息以及第一网络的网络拓扑信息,建立第一告警树。根据第一告警树的根节点,处理第一网络的故障。如此,可以清晰地表示出网络中告警间的关联关系,快速地确定网络中的根源告警,有利于提高处理故障的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种网络告警的处理方法的流程示意图;
图2a为本申请实施例提供的一种第一告警树的示意图;
图2b为本申请实施例提供的另一种第一告警树的示意图;
图3a为本申请实施例提供的又一种第一告警树的示意图;
图3b为本申请实施例提供的又一种第一告警树的示意图;
图4为本申请实施例提供的又一种网络告警的处理方法的流程示意图;
图5为本申请实施例提供的一种装置300的结构示意图;
图6为本申请实施例提供的又一种服务器400的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
如图1所示,为本申请实施例提供的一种网络告警的处理方法的流程示意图,该流程包括:
S101、获取第一网络的告警信息。
其中,第一网络的告警信息包括第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因
在一些实施例中,第一网络中的网元因该网元自身发生故障而产生的告警,称为根源告警。同时,当第一网络中一个网元发生故障时也会使得与该网元有业务关联的其他网元无法正常工作,产生告警,这种告警称为衍生告警。
需要说明的是,第一网络中的网元可以包括服务器、基站,还可以包括终端、移动台(mobile station,MS)或者移动终端(mobile terminal,MT),本申请实施例对网元的形式不做具体限定。
在一个具体实施中,当第一网络中的某个网元发生故障时,该网元以及其他无法正常工作的网元首先会根据网元自身设定的抑制机制,阻止网元自身上报一些告警,存在告警的网元经过自身的抑制机制后,将自身产生的告警进行上报,从而得到第一网络中各个网元产生的告警。例如,当网元存在告警级别高的告警时,会抑制与其相关的低级别的告警。如下表一所示,当一个网元中同时存在R_LOS和AU_LOP告警时,由于R_LOS告警的告警级别高于AU_L OP告警的告警级别,此时该网元就会抑制AU_LOP告警,只上报R_LOS告警。
表一告警名称与告警级别关系表
告警名称 告警级别
R_LOS 紧急
AU_LOP 重要
需要说明的是,表一仅为示例性表格,本申请实施例并不限定告警之间的抑制关系,表内的告警在一些网元中可以不存在抑制关系。
S102、获取第一网络的网络拓扑信息。
其中,第一网络的网络拓扑信息包括第一网络中处于同一业务路径的网元,以及网元间的连接关系。
在一些实施例中,第一网络可以是使用光纤作为主要传输介质的广域网、城域网或者新建的大范围的局域网,可以采用可重构光分插复用器(reconfigurable opticaladd-drop multiplexer,ROADM)作为网络节点。在第一网络中包括多个网元,各个网元通过传输介质相连,不考虑网元的物理属性(例如大小、形状),仅考虑网元间实际位置与关系。
在一些实施例中,第一网络从垂直方向可以分为光通路层(optical channel,OCh),光复用段层(optical mutiplex section,OMS)和光传输段层(optical transportsection,OTS),相邻层之间是客户/服务者关系。其中,OCh层可以与客户层(Client)之间进行信号传送。有的层级又存在子层的划分,例如,OCh层包括光通路子层、光通路传输单元子层(optical transform unit,OTUk,k=1,2,3,4)和光通路数据单元子层(oracledatabase unloader,ODUk,k=0,1,2,2e,3,4)。为了实现每个层级和子层的传送功能,每个层级和子层由路径源端、路径宿端、链路连接、网络连接、子网和子网连接(subnetworkconnection,SNC)组成。其中,SNC层中包含多个网元。每个网元内包括网元的输入端口、输出端口、内部端口以及网元内部连接端口的一系列光纤;网元间包括相邻网元的输入端口与输出端口间的光纤连接。
在一个具体实施例中,根据第一网络中的网元信息,按照网元-子架-槽位-单板-端口-通道的顺序,建立不同网元端口间以及网元内的光纤连接关系。其中,网元信息可以包括网元名称、互联网协议(Internet protocol,IP)地址、设备型号。根据第一网络中业务路径的层级和子层的路径源端和路径宿端,逐层还原,确定业务路径中实际包含的网元以及信号在网元间的传送方向,获得第一网络的网络拓扑信息。可以理解的是,第一网络中可以包含多条业务路径,例如用户之间的语音通话、多媒体视频。
S103、根据第一网络的告警信息以及第一网络的网络拓扑信息,确定第一告警集合。
在一些实施例中,将第一网络的网络拓扑信息与第一网络的告警信息中每一个告警所在的网元对应,得到第一网络中存在告警的所有业务路径。根据第一网络中存在告警的一条业务路径上各个网元产生的告警,确定第一告警集合。
S104、根据第一告警集合中各个告警的告警原因,确定第一告警集合中存在衍生关系的告警,以及告警间的父子关系。
在一些实施例中,若第一告警集合中第一告警的告警原因包括第二告警的告警名称,且第一告警所在网元对应的业务路径中存在第二告警时,确定第一告警与第二告警具有衍生关系,且第二告警对应的节点为第一告警对应的节点的父节点。例如,如图2a所示,第一网络中一个网元存在告警A(如VC_RDI告警),包含的一个告警原因是“对端站出现VC_AIS告警”。根据告警A所在网元对应的业务路径,确定对端网元。如果对端网元存在告警B(如VC_AIS告警),则告警A与告警B之间具有衍生关系,将告警B作为告警A的父节点。可以理解的是,在确定告警间的父子关系后,可以得到一个或多个具有根节点的分支,其中一个或多个分支上的节点属于同一业务路径。针对不同的业务路径,通过告警间的衍生关系,以及告警所在网元对应的业务路径,而形成的具有父子关系的分支可以不同,如图2a和图2b所示。
在一些实施例中,一个告警中可以存在多个告警原因,第一告警的告警原因中还可以包括多个第二告警的告警名称。例如,如图2a所示,第一网络中一个网元存在告警C(如REM_SF告警),告警C包含的一个告警原因是“对端站OTU单板客户侧有R_LOS、R_LOF、R_LOC、LINK_ERR、L_SYNC或LOCAL_FAULT告警”。根据告警C所在网元对应的业务路径,查找到对端网元。如果对端网元存在R_LOS、R_LOF、R_LOC、LINK_ERR、L_SYNC或LOCAL_FAULT告警中至少一个,则说明告警C具有衍生关系。此时,将对端网元存在的相应的告警,作为告警C的父节点。可以理解的是,当对端网元存在多个告警时(如图2a中的告警D和告警E),则将多个告警均作为告警C的父节点。
需要说明的是,如果第一告警集合中第一告警的告警原因中包含第二告警的告警名称,但是第一告警所在网元的业务路径中不存在第二告警,此时说明第一告警的产生不是由第二告警引起的,而是由第一告警中其他告警原因引起的。
S105、根据第二告警集合中各个告警的告警原因,确定第二告警集合中每个告警对应的第一告警故障分类。
其中,第二告警集合包括第一告警集合中不存在衍生关系的告警(如图2a中的告警H、告警I和告警G),以及由步骤S104确定的父子关系中根节点(如图2a中的告警B、告警E和告警F)。
在一些实施例中,根据第二告警集合中各个告警的告警原因,如下表二所示,第一告警故障分类可以具体分为:对端故障、上游故障、下游故障、线路故障。其中,对端故障是指本网元在SNC层中的对端网元产生的故障,上游故障是指本网元在信号接收方向产生的故障,下游故障是指本网元在信号发送方向产生的故障,线路故障是指本网元与连接的网元间线路产生的故障。可选的,还可以包括本端故障,其中,本端故障是指本网元内产生的故障。
表二告警名称、告警原因以及告警故障分类表关系表
Figure BDA0003587936110000071
需要说明的是,上表二所示出的告警,各个告警所对应的告警原因,以及各个告警原因与第一告警故障分类的对应关系均为示例。可以理解的,第一告警集合中还可以存在其他名称的告警,表内的各个告警还可以存在其他告警原因,表内的第一告警故障分类也可以对应其他的告警原因,本申请实施例对此均不做限定。
在一些实施例中,根据具体的第一告警故障分类,将第二告警集合中各个告警的告警原因与第一告警故障分类进行对应。一个告警的多个告警原因可以属于同一个第一告警故障分类,也可以属于不同的第一告警故障分类,但每一个告警原因都只对应着一个第一告警故障分类,如上表二所示。
S106、根据第二告警集合中每个告警对应的第一告警故障分类,以及每个告警所在网元对应的业务路径,建立第一告警树。
在一些实施例中,根据第三告警对应的第一告警故障分类,以及第三告警所在网元的业务路径,判断对应的网元或线路是否存在相应的故障,由该故障引起了第四告警。当第三告警所在网元对应的业务路径产生第四告警时,确定第四告警对应的节点作为第三告警对应的节点的父节点。其中,当第一告警故障分类为对端故障时,第一告警故障分类对应的网元为第三告警所在网元的对端网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号接收方向上的网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号发送方向上的网元;当第一告警故障分类为线路故障时,第一告警故障分类对应的线路为第三告警所在网元连接其他网元间的线路。
在一些实施例中,在确定了告警间的父子关系后,得到了第一告警树,如图3a所示。第一告警树包括多个告警对应的多个节点,多个节点包括根节点以及以根节点为源头的分支,根节点可以是一个,也可以是多个(如图3a中告警H和告警I),一个分支包括具有父子关系的节点,一个父节点可以对应多个子节点,一个子节点也可以对应多个父节点。可以理解的是,一棵告警树上所有节点对应的告警属于同一业务路径,第一网络可以存在多棵告警树,不同的告警树中的节点对应的告警属于不同的业务路径,如图3a和图3b分别表示根据不同的业务路径建立的告警树。
S107、根据第一告警树,处理第一网络的故障。
在一些实施例中,在得到第一网络中一条业务路径的第一告警树后,若第一网络中其他业务路径还存在告警,则重复执行步骤S103-步骤S106,得到其他业务路径的第一告警树。针对一棵或多棵第一告警树的根节点对应告警所在网元的故障进行处理。
可选的,对一棵或多棵第一告警树的根节点对应告警所在网元的故障进行处理后,若第一网络仍存在告警,则重新执行步骤S101-步骤S107,直到第一网络中不存在告警。
可选的,在执行步骤S103-步骤S106后,可以得到第一网络中一条业务路径的第一告警树,还可以得到孤立的告警(如图3b中的告警f),即与其他告警之间不存在关联关系。在处理了第一告警树根节点对应告警所在网元存在的故障后,还可以对孤立的告警所在网元存在的故障进行处理。
综上可见,在本申请实施例提供的网络告警的处理方法中,获取第一网络的告警信息以及第一网络的网络拓扑信息。将一条业务路径中各个网元产生的告警的集合作为第一告警集合。其中,第一网络的告警信息包括第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;第一网络的网络拓扑信息包括第一网络中处于同一业务路径的网元,以及网元间的连接关系。将一条业务路径上的各个网元产生的告警作为第一告警集合。根据第一告警集合中各个告警的告警原因,确定第一告警集合中存在衍生关系的告警,以及告警间的父子关系。将第一告警集合中不存在衍生关系的告警,以及上述父子关系中的根节点作为第二告警集合。根据第二告警集合中各个告警的告警原因,确定第二告警集合中每个告警对应的第一告警故障分类。根据第二告警集合中每个告警对应的第一告警故障分类,以及每个告警所在网元对应的业务路径,建立第一告警树。根据第一告警树,处理第一网络的故障。
如此,通过本申请实施例提供的方法建立第一告警树,与其他方法相比,可以更加清晰地表示出网络中告警间的关联关系,快速地定位出第一网络的根源告警,当解决根源告警对应的故障后,由根源告警衍生的其他告警也将不存在。可见,从根源告警开始处理故障,有利于提升处理故障的效率。
另外,针对新出现的告警,可以根据其告警原因,得到新出现的告警的衍生关系或者告警故障分类,实现对于新出现告警的快速处理。
如图4所示,为本申请实施例提供的又一种网络告警的处理方法的流程示意图,是在图1本申请实施例提供的一种网络告警的处理方法的流程示意图的基础上,对步骤S106的进一步细化,该流程包括:
S201、判断一个告警是否存在属于对端故障类型的告警原因,若是,则执行步骤S202,否则,执行步骤S204。
S202、通过该告警所在网元对应的业务路径,确定该告警所在网元的对端网元,判断对端网元是否存在相应的告警,若是,则执行步骤S203,否则,执行步骤S204。
在一些实施例中,当一个告警的告警原因中存在属于对端故障类型的告警原因时,通过该告警所在网元对应的业务路径,确定该告警所在网元的对端网元。根据该告警的告警原因,判断对端网元中是否存相应的故障,并由该故障产生了相应的告警。例如,如图3a所示,如果该告警是告警F(如R_LOS告警),引起告警F的告警原因包括“对端站单板激光器关闭”,告警F的告警原因属于对端故障类型,则根据告警原因,确定告警F所在网元的对端网元是否存在本站单板激光器关闭的故障,并由此产生相应的告警,即告警H。
S203、确定该告警与对端网元存在的相应告警间的父子关系后,执行步骤S204。
具体的,将对端网元存在的相应告警作为本告警的父节点,本告警作为对端网元存在的相应告警的子节点。
S204、判断该告警是否存在属于上游故障类型的告警原因,若是,则执行步骤S205,否则,执行步骤S207。
S205、通过该告警所在网元对应的业务路径,确定该告警所在网元的上游网元,判断上游网元是否存在相应的告警,若是,则执行步骤S206,否则,执行步骤S207。
其中,上游网元是指在该告警所在网元的信号接收方向的至少一个网元,可以包括在信号接收方向与该告警所在网元直连的一个网元,还可以包括在信号接收方向的不与该告警所在网元直连的其他网元。
在一些实施例中,如果在信号接收方向与该告警所在网元直连的网元不存在相应的告警,可以继续判断在该告警所在网元的信号接收方向上的其他网元,是否存在相应告警。
S206、确定该告警与上游网元存在的相应告警间的父子关系后,执行步骤S207。
具体的,将上游网元存在的相应告警作为本告警的父节点,本告警作为上游网元存在的相应告警的子节点。
S207、判断该告警是否存在属于下游故障类型的告警原因,若是,则执行步骤S208,否则,执行步骤S210。
S208、通过该告警所在网元对应的业务路径,确定该告警所在网元的下游网元,判断下游网元是否存在相应的告警,若是,则执行步骤S209,否则,执行步骤S210。
S209、确定该告警与下游网元存在的相应告警间的父子关系后,执行步骤S210。
具体的,将下游网元存在的相应告警作为本告警的父节点,本告警作为下游网元存在的相应告警的子节点。
其中,步骤S207-步骤S209的过程可参照步骤S204-步骤S206,在此不予赘述。
S210、判断该告警是否存在属于线路故障类型的告警原因,若是,则执行步骤S211,否则,则执行步骤S213。
S211、通过该告警所在网元对应的业务路径,确定该告警所在网元直连的网元,判断与该告警所在网元直连的网元是否存在相应的告警,若是,则执行步骤S212,否则,则执行步骤S213。
S212、确定该告警与直连网元存在的相应告警的父子关系。
在上述步骤S210-步骤S212中,与该告警所在网元直连的网元中至少有一个网元存在相应的告警。将相应的告警作为本告警的父节点,本告警作为相应告警的子节点。
S213、将该告警作为一个孤立的告警。
需要说明的是,当该告警成为一个孤立的告警时,说明该告警不和其他告警存在父子关系,不是由其他告警引起的,同时也无法引起其他告警。
可选的,在经过步骤S201-步骤S212后,该告警不与第二告警集合中的告警存在父子关系,但是该告警可以是第一告警集合中一个告警的父节点,此时该告警不是一个孤立的告警,如图3b中的告警c。
需要说明的是,本申请实施例不限定判断对端故障、上游故障、下游故障、线路故障的步骤的执行顺序。
综上可见,针对第二告警集合中每个告警的各个告警原因对应的告警故障分类,以及每个告警所在网元对应的业务路径,确定相应网元中是否存在相应的故障,从而产生相应的告警,得到告警间的关联关系,建立第一告警树。
如此,通过本申请实施例提供的方法建立第一告警树,与其他方法相比,可以更加清晰地表示出网络中告警间的关联关系,快速地定位出第一网络的根源告警。另外,针对新出现的告警,可以根据其告警原因,得到新出现的告警的衍生关系或者告警故障分类,实现对于新出现告警的快速处理。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。可以理解的是,为了实现上述功能,本申请实施例提供的装置包含了执行各个功能相应的硬件结构和/或软件网元。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
如图5所示,为本申请实施例提供的一种装置300的结构示意图。装置300包括获取模块301和处理模块302。获取模块301,用于获取第一网络的告警信息以及第一网络的网络拓扑信息;其中,第一网络的告警信息包括第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;第一网络的网络拓扑信息包括第一网络中处于同一业务路径的网元,以及网元间的连接关系;处理模块302,用于根据第一网络的告警信息以及第一网络的网络拓扑信息,建立第一告警树;其中,第一告警树包括多个告警对应的多个节点,多个节点包括根节点以及以根节点为源头的分支,一个分支包括具有父子关系的节点;具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;衍生关系、第一告警故障分类根据告警对应的告警原因确定得到;处理模块302,还用于根据第一告警树,处理第一网络的故障。
可选的,处理模块302,还用于若第一告警的告警原因中包括第二告警的告警名称,判断第一告警所在网元对应的业务路径是否产生第二告警;处理模块302,还用于当第一告警所在网元对应的业务路径产生第二告警时,确定第一告警和第二告警具有衍生关系,且第一告警树上第二告警对应的节点为第一告警对应的节点的父节点。
可选的,根据第一告警故障分类确定的两个告警对应的节点,包括:处理模块302,还用于根据第三告警对应的第一告警故障分类,判断第三告警所在网元的业务路径中是否产生第四告警,第四告警为第一告警故障分类对应的网元或线路产生的;处理模块302,还用于当第三告警所在网元对应的业务路径产生第四告警时,确定在第一告警树上第四告警对应的节点为第三告警对应的节点的父节点。
可选的,第一告警故障分类为对端故障、上游故障、下游故障、线路故障中任一项。
可选的,当第一告警故障分类为对端故障时,第一告警故障分类对应的网元为第三告警所在网元的对端网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号接收方向上的网元;当第一告警故障分类为上游故障时,第一告警故障分类对应的网元为第三告警所在网元在信号发送方向上的网元;当第一告警故障分类为线路故障时,第一告警故障分类对应的线路为第三告警所在网元连接其他网元间的线路。
由于本实施例提供的装置300可执行上述网络告警的处理方法,因此其所能获得的技术效果可参考上述方法实施例,在此不再赘述。
如图6所示,图6示出又一种服务器400的结构示意图,服务器400可以是独立于第一网络的服务器,也可以是第一网络中某个负责故障处理的服务器。服务器400包括一个或多个处理器401、一个或多个存储器402、以及一个或多个通信接口403。
处理器401、存储器402和通信接口403通过总线相连接。处理器401可以包括通用中央处理器(Central Processing Unit,CPU)(例如CPU0和CPU1)、微处理器、特定应用集成电路(Application-Specific Integrated Circuit,ASIC),图形处理器(graphicsprocessing unit,GPU)、神经网络处理器(neural-network processing unit,NPU),或者用于控制本申请方案程序执行的集成电路等。
存储器402,可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。存储器402可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统以及应用程序代码等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flashstorage,UFS)等。处理器401通过运行存储在存储器402的指令,执行服务器400的各种功能应用以及数据处理。在一个示例中,处理器401也可以包括多个CPU,并且处理器401可以是一个单核(single-CPU)处理器或多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路或用于处理数据(例如计算机程序指令)的处理核。
通信接口403,可用于与其他设备或通信网络通信,如以太网,无线局域网(wireless local area networks,WLAN)等。
在一个具体实施例中,上述装置300的获取模块301具体为图6所示服务器400中的通信接口403,上述装置300的处理模块302具体为图6所示服务器400中的处理器401。
本申请另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当计算机指令在服务器上运行时,使得服务器执行上述方法实施例所示的方法流程中的各个步骤。
本申请另一个实施例中还提供了提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述方法实施例所示的方法流程中的各个步骤。
本申请另一实施例还提供一种芯片系统,该芯片系统应用于服务器。所述芯片系统包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联。接口电路用于从服务器的存储器接收信号,并向处理器发送所述信号,所述信号包括所述存储器中存储的计算机指令。当处理器执行计算机指令时,网络告警服务器执行上述方法实施例所示的方法流程中的各个步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种网络告警的处理方法,其特征在于,所述方法包括:
获取第一网络的告警信息以及所述第一网络的网络拓扑信息;其中,所述第一网络的告警信息包括所述第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;所述第一网络的网络拓扑信息包括所述第一网络中处于同一业务路径的网元,以及所述网元间的连接关系;
根据所述第一网络的告警信息以及所述第一网络的网络拓扑信息,建立第一告警树;其中,所述第一告警树包括所述多个告警对应的多个节点,所述多个节点包括根节点以及以所述根节点为源头的分支,一个分支包括具有父子关系的节点;所述具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;所述衍生关系、所述第一告警故障分类根据告警对应的告警原因确定得到;
根据所述第一告警树,处理所述第一网络的故障。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第一告警的告警原因中包括第二告警的告警名称,判断所述第一告警所在网元对应的业务路径是否产生所述第二告警;
当所述第一告警所在网元对应的业务路径产生所述第二告警时,确定所述第一告警和所述第二告警具有衍生关系,且所述第一告警树上所述第二告警对应的节点为所述第一告警对应的节点的父节点。
3.根据权利要求2所述的方法,其特征在于,所述根据第一告警故障分类确定的两个告警对应的节点,包括:
根据第三告警对应的第一告警故障分类,判断所述第三告警所在网元的业务路径中是否产生第四告警,所述第四告警为所述第一告警故障分类对应的网元或线路产生的;
当所述第三告警所在网元对应的业务路径产生所述第四告警时,确定在所述第一告警树上所述第四告警对应的节点为所述第三告警对应的节点的父节点。
4.根据权利要求3所述的方法,其特征在于,所述第一告警故障分类为对端故障、上游故障、下游故障、线路故障中任一项。
5.根据权利要求4所述的方法,其特征在于,
当所述第一告警故障分类为对端故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元的对端网元;
当所述第一告警故障分类为上游故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元在信号接收方向上的网元;
当所述第一告警故障分类为上游故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元在信号发送方向上的网元;
当所述第一告警故障分类为线路故障时,所述第一告警故障分类对应的线路为所述第三告警所在网元连接其他网元间的线路。
6.一种网络告警的处理系统,其特征在于,包括获取模块和处理模块;
所述获取模块,用于获取第一网络的告警信息以及所述第一网络的网络拓扑信息;其中,所述第一网络的告警信息包括所述第一网络中的多个网元产生的多个告警,以及各个告警对应的告警原因;所述第一网络的网络拓扑信息包括所述第一网络中处于同一业务路径的网元,以及所述网元间的连接关系;
所述处理模块,用于根据所述第一网络的告警信息以及所述第一网络的网络拓扑信息,建立第一告警树;其中,所述第一告警树包括所述多个告警对应的多个节点,所述多个节点包括根节点以及以所述根节点为源头的分支,一个分支包括具有父子关系的节点;所述具有父子关系的两个节点为同一业务路径上,具有衍生关系的两个告警对应的节点,或根据第一告警故障分类确定的两个告警对应的节点;所述衍生关系、所述第一告警故障分类根据告警对应的告警原因确定得到;
所述处理模块,还用于根据所述第一告警树,处理所述第一网络的故障。
7.根据权利要求6所述的处理系统,其特征在于,还包括:
所述处理模块,还用于若所述第一告警的告警原因中包括第二告警的告警名称,判断所述第一告警所在网元对应的业务路径是否产生所述第二告警;
所述处理模块,还用于当所述第一告警所在网元对应的业务路径产生所述第二告警时,确定所述第一告警和所述第二告警具有衍生关系,且所述第一告警树上所述第二告警对应的节点为所述第一告警对应的节点的父节点。
8.根据权利要求7所述的处理系统,其特征在于,所述根据第一告警故障分类确定的两个告警对应的节点,包括:
所述处理模块,还用于根据所述第三告警对应的第一告警故障分类,判断所述第三告警所在网元的业务路径中是否产生第四告警,所述第四告警为所述第一告警故障分类对应的网元或线路产生的;
所述处理模块,还用于当所述第三告警所在网元对应的业务路径产生所述第四告警时,确定在所述第一告警树上所述第四告警对应的节点为所述第三告警对应的节点的父节点。
9.根据权利要求8所述的处理系统,其特征在于,所述第一告警故障分类为对端故障、上游故障、下游故障、线路故障中任一项。
10.根据权利要求9所述的处理系统,其特征在于,
当所述第一告警故障分类为对端故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元的对端网元;
当所述第一告警故障分类为上游故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元在信号接收方向上的网元;
当所述第一告警故障分类为上游故障时,所述第一告警故障分类对应的网元为所述第三告警所在网元在信号发送方向上的网元;
当所述第一告警故障分类为线路故障时,所述第一告警故障分类对应的线路为所述第三告警所在网元连接其他网元间的线路。
11.一种处理装置,其特征在于,包括处理器,用于与存储器相连,调用所述存储器中存储的程序,以执行如权利要求1至5中任一项所述的网络告警的处理方法。
12.一种计算机可读存储介质,其特征在于,包括计算机指令,当所述计算机指令在处理装置上运行时,使得所述处理装置执行如权利要求1-5中任一项所述的网络告警的处理方法。
CN202210368192.6A 2022-04-08 2022-04-08 一种网络告警的处理方法和服务器 Active CN114710396B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210368192.6A CN114710396B (zh) 2022-04-08 2022-04-08 一种网络告警的处理方法和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210368192.6A CN114710396B (zh) 2022-04-08 2022-04-08 一种网络告警的处理方法和服务器

Publications (2)

Publication Number Publication Date
CN114710396A true CN114710396A (zh) 2022-07-05
CN114710396B CN114710396B (zh) 2023-06-23

Family

ID=82173238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210368192.6A Active CN114710396B (zh) 2022-04-08 2022-04-08 一种网络告警的处理方法和服务器

Country Status (1)

Country Link
CN (1) CN114710396B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115580529A (zh) * 2022-11-15 2023-01-06 阿里云计算有限公司 告警信息的处理方法、电子设备及存储介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505284A (zh) * 2002-12-02 2004-06-16 深圳市中兴通讯股份有限公司 一种全光网中的分布式故障定位方法
CN1992636A (zh) * 2005-12-29 2007-07-04 华为技术有限公司 一种处理告警信息的系统及方法
CN101022366A (zh) * 2007-03-21 2007-08-22 Ut斯达康通讯有限公司 一种故障关联分析系统以及方法
CN101237661A (zh) * 2008-02-28 2008-08-06 中兴通讯股份有限公司 告警上报方法与装置
WO2011060651A1 (zh) * 2009-11-18 2011-05-26 华为技术有限公司 故障链路定位方法、告警根因分析方法及设备、系统
CN102308522A (zh) * 2011-07-21 2012-01-04 华为技术有限公司 一种定位网络故障的方法、设备及系统
CN102571407A (zh) * 2010-12-30 2012-07-11 中国移动通信集团河北有限公司 告警关联分析方法及装置
CN106713017A (zh) * 2016-12-08 2017-05-24 国网北京市电力公司 告警信息的处理方法及装置
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN110493042A (zh) * 2019-08-16 2019-11-22 中国联合网络通信集团有限公司 故障诊断方法、装置及服务器
CN113259168A (zh) * 2021-05-28 2021-08-13 新华三人工智能科技有限公司 一种故障根因分析方法及装置
CN113627624A (zh) * 2021-06-22 2021-11-09 中国空间技术研究院 基于故障树分析的卫星故障预案设计方法
CN114070709A (zh) * 2020-08-26 2022-02-18 北京市天元网络技术股份有限公司 告警关联分析方法及装置
CN114285725A (zh) * 2021-12-24 2022-04-05 中国电信股份有限公司 网络故障确定方法及装置、存储介质及电子设备

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505284A (zh) * 2002-12-02 2004-06-16 深圳市中兴通讯股份有限公司 一种全光网中的分布式故障定位方法
CN1992636A (zh) * 2005-12-29 2007-07-04 华为技术有限公司 一种处理告警信息的系统及方法
CN101022366A (zh) * 2007-03-21 2007-08-22 Ut斯达康通讯有限公司 一种故障关联分析系统以及方法
CN101237661A (zh) * 2008-02-28 2008-08-06 中兴通讯股份有限公司 告警上报方法与装置
WO2011060651A1 (zh) * 2009-11-18 2011-05-26 华为技术有限公司 故障链路定位方法、告警根因分析方法及设备、系统
CN102571407A (zh) * 2010-12-30 2012-07-11 中国移动通信集团河北有限公司 告警关联分析方法及装置
CN102308522A (zh) * 2011-07-21 2012-01-04 华为技术有限公司 一种定位网络故障的方法、设备及系统
WO2012106913A1 (zh) * 2011-07-21 2012-08-16 华为技术有限公司 一种定位网络故障的方法、设备及系统
CN106713017A (zh) * 2016-12-08 2017-05-24 国网北京市电力公司 告警信息的处理方法及装置
CN109684181A (zh) * 2018-11-20 2019-04-26 华为技术有限公司 告警根因分析方法、装置、设备及存储介质
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN110493042A (zh) * 2019-08-16 2019-11-22 中国联合网络通信集团有限公司 故障诊断方法、装置及服务器
CN114070709A (zh) * 2020-08-26 2022-02-18 北京市天元网络技术股份有限公司 告警关联分析方法及装置
CN113259168A (zh) * 2021-05-28 2021-08-13 新华三人工智能科技有限公司 一种故障根因分析方法及装置
CN113627624A (zh) * 2021-06-22 2021-11-09 中国空间技术研究院 基于故障树分析的卫星故障预案设计方法
CN114285725A (zh) * 2021-12-24 2022-04-05 中国电信股份有限公司 网络故障确定方法及装置、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
彦逸: "\"基于因果规则的电力营销系统故障定位算法\"" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115580529A (zh) * 2022-11-15 2023-01-06 阿里云计算有限公司 告警信息的处理方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN114710396B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
US11153148B2 (en) Resource state monitoring method, device and communication network
US4956835A (en) Method and apparatus for self-restoring and self-provisioning communication networks
US11489588B2 (en) Method for supporting SNCP over packet network
US7633952B2 (en) Discovery of physically adjacent neighbor devices using a unidirectional in-band process coupled with an out-of-band follow-up process
US7333425B2 (en) Failure localization in a transmission network
CN112787841B (zh) 故障根因定位方法及装置、计算机存储介质
EP2713556A1 (en) Mapping a network topology request to a physical network
US20100128611A1 (en) Transmitting apparatus, alarm control method, and computer product
JP2001298456A (ja) メッシュネットワークにおいてパス修復情報をシグナリングする方法および装置
CN114520760B (zh) 一种跨域故障分析的方法及系统
EP1993223B1 (en) Method and device of group broadcast protection in wdm optical network
CN107465966B (zh) 一种用于光网络的拓扑重构控制方法
CN114710396B (zh) 一种网络告警的处理方法和服务器
EP3062526A1 (en) Service deployment method, apparatus and network device
US20140040476A1 (en) Method and system for network restructuring in multilayer network
CN110912816B (zh) 链路重路由方法、装置和存储介质
CN107689916B (zh) 一种在软件定义网络中获取完全风险共享链路组分离路径对的方法及系统
CN107888282B (zh) 一种光传输网络的电路全程路由计算方法
CN108989201B (zh) 一种用于sncp相切环业务的端到端路径配置方法
CN101243723A (zh) 自动交换光网络组播业务的路由选择方法
CN109688060B (zh) 链路分组配置方法、装置及路由器
US6697856B1 (en) Healing of incomplete circuits in networks
CN115884013A (zh) 一种自动发现sdh光网络拓扑的方法
CN115884010A (zh) 一种通信方法、装置及系统
CN117376155A (zh) Ip承载网拓扑结构分析方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant