CN114520760B - 一种跨域故障分析的方法及系统 - Google Patents

一种跨域故障分析的方法及系统 Download PDF

Info

Publication number
CN114520760B
CN114520760B CN202110019596.XA CN202110019596A CN114520760B CN 114520760 B CN114520760 B CN 114520760B CN 202110019596 A CN202110019596 A CN 202110019596A CN 114520760 B CN114520760 B CN 114520760B
Authority
CN
China
Prior art keywords
information
fault
time
network
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110019596.XA
Other languages
English (en)
Other versions
CN114520760A (zh
Inventor
谢青
叶坚栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202311014471.3A priority Critical patent/CN117041012A/zh
Priority to EP21893822.3A priority patent/EP4236234A4/en
Priority to PCT/CN2021/130168 priority patent/WO2022105675A1/zh
Publication of CN114520760A publication Critical patent/CN114520760A/zh
Priority to US18/319,883 priority patent/US11909581B2/en
Application granted granted Critical
Publication of CN114520760B publication Critical patent/CN114520760B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/064Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/044Network management architectures or arrangements comprising hierarchical management structures

Abstract

本申请实施例提供一种跨域故障分析的方法和系统。所述方法和所述系统基于对第一单域网络故障和第二单域网络故障在时间维度和业务维度进行关联性分析,确定所述第一单域网络故障和第二单域网络故障是否是由同一个故障导致的,从而解决同一故障导致多个单域网络故障,运维人员需要分析每个单域网络故障而导致的故障诊断效率低的问题。

Description

一种跨域故障分析的方法及系统
技术领域
本发明涉及通信领域,尤其涉及一种跨域故障分析的方法及系统。
背景技术
随着运营商网络已发展到第五代(the 5th generation,5G)移动通信技术,运营商网络架构对网络的时延、速率、连接规模等关键性能指标需求不断提升,对业务的性能保障,灵活性均发生根本性改变,导致网络运维难度的增加。
然而运营商为了降低网络投资开销,通过多域网络混合组网,例如,基于可远距离传输的传送网络传输的互联网协议(Internet Protocol,IP)信息数据和光信息数据的业务;通过无线基站将无线业务通过传送网络传递到网络另一侧完成信号传递。这里IP网络、传送网络、无线网络都为不同业务网络,每一种业务网络可以称为一种单域网络。随着运营商的业务范围扩大,运营商的网络常常是一个包含了IP网络、传送网络、无线网络的多域网络。一个信号经过多个单域网络也是比较常见的现象。
但是当在多域网络中出现网络故障后,每个业务网络的网络运维系统和设备会产生一系列故障现象和告警信息。大量的故障现象和告警信息会导致进行故障分析的系统要处理大量数据,导致效率降低。
发明内容
本申请实施例提供了一种跨域故障分析的方法及系统,通过对多个单域故障的分析确定多个单域故障是否是由同一个故障点引起,从而解决同一故障导致多个单域故障,运维人员对每个单域故障进行分析而导致的故障诊断效率低的问题。
本申请实施例技术方案包括以下内容。
第一方面,提供了一种跨域故障分析的方法。该方法中跨域故障分析系统获取第一网络域中的第一故障的信息和第二网络域中的第二故障的信息,第一故障的信息包括第一故障的第一时间和第一故障的第一业务信息,第二故障的信息包括第二故障的第二时间和第二故障的第二业务信息。跨域故障分析系统基于第一时间和第二时间确定时间关联性,其中时间关联性为第一时间和第二时间满足时间约束条件;基于第一业务信息和第二业务信息确定业务信息关联性,其中业务信息关联性为第一业务信息和第二业务信息满足业务信息约束条件;根据时间关联性和业务信息关联性确定第一网络域中的第一故障和第二网络域中的第二故障是由同一个故障导致的。通过上述方法,对多域网络的网络故障在时间和业务维度进行关联性分析,确定多个单域故障是同一故障导致,减少了针对每个单域故障进行分析的资源投入,提高了网络运维效率。
在一种可能的实现方式中,该方法还包括:所述根据第一故障的信息和第二故障的信息确定故障的原因信息;通过北向接口向第三方系统发送故障的原因信息。
在一种可能的实现方式中,该方法还包括:时间约束条件为第一时间和第二时间之间的差值的绝对值小于时间阈值或者第一时间和第二时间在同一个时间窗内。
在一种可能的实现方式中,该方法还包括:第一时间的类型包括第一故障发生的时间、第一故障的信息的被生成的时间、第一故障的信息的被发送的时间和/或第一故障的信息的被接收的时间,第一时间至少包含一种时间信息,例如第一时间的取值为第一故障发生的时间。第二时间的类型包括第二故障发生的时间、第二故障的信息的被生成的时间、第二故障的信息的被发送的时间和/或第二故障的信息的被接收的时间,第二时间至少包含一种时间信息,例如第二时间的取值为第二故障发生的时间。第二时间和第一时间的类型一致,例如第一时间和第二时间的类型都为故障的信息的被发送的时间。
在一种可能的实现方式中,该方法还包括:第一业务信息的类型包括:第一故障的业务类型信息、第一故障发生的第一网络域的网络拓扑信息、第一故障发生的网络设备信息和/或第一故障所在的业务流程信息。第一业务信息至少包含一种业务信息。第二业务信息的类型包括:第二故障的业务类型信息、第二故障发生的第二网络域的网络拓扑信息、第二故障发生的网络设备信息和/或第二故障所在的业务流程信息。第二业务信息至少包含一种业务信息。第一业务信息和第二业务信息的类型一致。
在一种可能的实现中,该方法还包括:业务信息约束条件为第一业务信息的业务类型信息和第二业务信息的业务类型信息属于同一种业务类型或者是存在关联的业务类型。业务信息约束条件为第一业务信息的网络拓扑信息和第二业务信息的网络拓扑信息属于同一个网络拓扑。业务信息约束条件为第一业务信息的业务流程信息和第二业务信息的业务流程信息属于同一个业务流程或属于故障因果关系。
在一种可能的实现中,该方法还包括:第一网络域的故障分析系统接收第一故障的信息,从第二网络域的故障分析系统接收第二故障的信息。第一网络与的故障分析系统和第二网络域的故障分析系统属于单域网络故障分析系统。
在一种可能的实现中,该方法还包括:从第一网络域的故障分析系统接收用于生成第一故障的信息的第一基础信息;从第二网络域的故障分析系统接收用于生成第二故障的信息的第二基础信息。第一基础信息和第二基础信息属于故障的基础信息,例如,故障的告警、故障设备的日志。跨域故障分析系统可基于第一基础信息生成第一故障的信息;基于第二基础信息生成第二故障的信息。
第二方面,提供一种跨域故障分析系统,该系统包括:故障信息接收模块,用于获取第一网络域中的第一故障的信息和第二网络域中的第二故障的信息,第一故障的信息包括第一故障的第一时间和第一故障的第一业务信息,第二故障的信息包括第二故障的第二时间和第二故障的第二业务信息;时间关联性分析模块,用于基于第一时间和第二时间确定时间关联性,其中时间关联性为第一时间和第二时间满足时间约束条件;业务信息关联性分析模块,用于基于第一业务信息和第二业务信息确定业务信息关联性,其中业务信息关联性为第一业务信息和第二业务信息满足业务信息约束条件;跨域故障确定模块,用于基于时间关联性和业务信息关联性确定第一网络域中的第一故障和第二网络域中的第二故障是由同一个故障导致的。
在一种可能的实现中,该系统还包括:跨域故障原因分析模块,用于基于第一故障的信息和第二故障的信息确定跨域故障的原因信息;跨域故障原因同步模块,用于通过北向接口向第三方系统发送跨域故障的原因信息。
在一种可能的实现方式中,该系统还包括:时间约束条件为第一时间和第二时间之间的差值的绝对值小于时间阈值或者第一时间和第二时间在同一个时间窗内。
在一种可能的实现方式中,该系统还包括:第一时间的类型包括第一故障发生的时间、第一故障的信息的被生成的时间、第一故障的信息的被发送的时间和/或第一故障的信息的被接收的时间,第一时间至少包含一种时间信息,例如第一时间的取值为第一故障发生的时间。第二时间的类型包括第二故障发生的时间、第二故障的信息的被生成的时间、第二故障的信息的被发送的时间和/或第二故障的信息的被接收的时间,第二时间至少包含一种时间信息,例如第二时间的取值为第二故障发生的时间。第二时间和第一时间的类型一致,例如第一时间和第二时间的类型都为故障的信息的被发送的时间。
在一种可能的实现方式中,该系统还包括:第一业务信息的类型包括:第一故障的业务类型信息、第一故障发生的第一网络域的网络拓扑信息、第一故障发生的网络设备信息和/或第一故障所在的业务流程信息。第一业务信息至少包含一种业务信息。第二业务信息的类型包括:第二故障的业务类型信息、第二故障发生的第二网络域的网络拓扑信息、第二故障发生的网络设备信息和/或第二故障所在的业务流程信息。第二业务信息至少包含一种业务信息。第一业务信息和第二业务信息的类型一致。
在一种可能的实现中,该系统还包括:业务信息约束条件为第一业务信息的业务类型信息和第二业务信息的业务类型信息属于同一种业务类型或者是存在关联的业务类型。业务信息约束条件为第一业务信息的网络拓扑信息和第二业务信息的网络拓扑信息属于同一个网络拓扑。业务信息约束条件为第一业务信息的业务流程信息和第二业务信息的业务流程信息属于同一个业务流程或属于故障因果关系。
在一种可能的实现中,该系统还包括:故障信息接收模块用于从第一网络域的故障分析系统接收第一故障的信息,从第二网络域的故障分析系统接收第二故障的信息。第一网络与的故障分析系统和第二网络域的故障分析系统属于单域网络故障分析系统。
在一种可能的实现中,该系统还包括:故障信息接收模块用于从第一网络域的故障分析系统接收用于生成第一故障的信息的第一基础信息;从第二网络域的故障分析系统接收用于生成第二故障的信息的第二基础信息。第一基础信息和第二基础信息属于故障的基础信息,例如,故障的告警、故障设备的日志。故障信息接收模块可基于第一基础信息生成第一故障的信息;基于第二基础信息生成第二故障的信息。
第三方面,提供一种计算机存储介质,该计算机存储介质中存储有程序代码,该程序代码用于指示执行上述第一方面或第一方面的任意可能的实现方式中的方法。
第四方面,提供一种计算机程序产品,该计算机程序产品包括计算机程序代码,当该计算机程序代码被计算机运行时,使得该计算机执行上述第一方面或第一方面的任意可能的实现方式中的方法。
附图说明
图1为本申请实施例的网络示意图。
图2为本申请实施例的一种架构示意图。
图3为本申请实施例的一种跨域故障分析方法的流程图。
图4为本申请实施例的一种跨域故障示意图。
图5为本申请实施例的一种跨域故障分析方法的流程图。
图6为本申请实施例的跨域故障分析系统600的示意图。
图7为本申请实施例的跨域故障分析系统700的示意图。
具体实施方式
了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
本申请实施例描述的网络架构以及业务场景是为了通过实例的方式说明本申请的技术方案,并不表示本申请仅适用于以下实施例中。本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本申请提供的技术方案对于类似的技术问题,同样适用。
图1为本申请实施例的网络示意图。如图1所示网络100是一个多域网络,包括一个互联网协议(Internet Protocol,IP)网络110和一个传送网络120。如图1所示,网元1101至网元1104是IP网络110的网元设备,例如,路由器;网元1101至网元1104之间通过IP网络协议通信,例如通用多协议标签交换(Multi-protocol Label Switching,MPLS)协议;IP网络故障分析系统1105是IP网络110的故障分析系统,负责对IP网络110中的网元、网元之间的链路以及网络运行的业务的故障进行监控和分析。如图1所示,网元1201至网元1204是传送网络120的网元设备,例如,光网络设备;网元1201至网元1204之间通过传送网络协议通信,例如,通用多协议标签交换(Generalized Multi-protocol Label Switching,GMPLS)协议;传送网络故障分析系统1205是传送网络120的故障分析系统,负责对传送网络120中的网元、网元之间的链路以及网络运行的业务的故障进行监控和分析。IP网络故障分析系统1105和传送网络故障分析系统1205分别对IP网络110和传送网络120提供故障的监控和分析。例如,当网络100发生了一个网络故障,所述网络故障的原因是传送网络120的网元1202和网元120之间的光纤被施工人员意外挖断。那么所述网络故障会导致IP网络110和传送网络120表现出故障现象:例如,故障分析系统上出现IP网络故障分析系统1105监控到:1、网元1102和网元1103上报的链路中断告警信息;2、网元1101上报的链路切换告警信息,IP网络故障分析系统1105需要针对监控到的告警信息进行故障分析;传送网络故障分析系统1205监控到:网元1202和网元1203上报的链路中断告警信息。这个举例可以说明对于多域网络出现的一个故障,会导致所包含的单域网络出现故障现象,网络运维人员需要对多个单域网络的故障分析系统上报的故障信息进行人工分析,分析过程需要基于个人经验、通过网络拓扑和业务配置等多个维度信息,这种方式大大降低了故障分析的效率,影响了网络业务运行。
图2为本申请实施例的架构示意图。在本申请的一些实施例中,如图2所示,系统200包括单域网络2004、单域网络2005、单域网络故障分析系统2002、单域网络故障分析系统2003、跨域故障分析系统2001和第三方系统5001。单域网络2004和单域网络2005是两个业务网络,例如单域网络2004是IP网络,单域网络2005是传送网络。单域网络故障分析系统2002是单域网络2004的故障分析系统,单域网络2004中的设备和系统会将产生的告警信息、异常日志和采集的用于监控的信息,例如性能信息,上报给单域网络故障分析系统2002;单域网络故障分析系统2002接收单域网络2004上报的告警信息、异常日志和监控信息,基于所述告警信息、异常日志和监控信息进行分析,分析出故障根源并生成故障信息,将故障信息上报至跨域故障分析系统2001。所述故障信息包括故障发生的单域网络信息、故障的时间信息、故障的业务信息和故障产生原因。类似的,单域网络故障分析系统2003是单域网络2005的故障分析系统,单域网络2005中的设备和系统会将产生的告警信息、异常日志和采集的用于监控的信息,例如性能信息,上报给单域网络故障分析系统2003;单域网络故障分析系统2003根据接收到的告警信息、异常日志和监控信息对所述单域网络2005进行故障监控和分析,生成故障信息,将故障信息上报至多域网络故障分析系统2001。所述跨域故障分析系统2001接收所述单域网络故障分析系统2002和所述单域网络故障分析系统2003上报的所述故障信息。所述跨域故障分析系统2001在所述故障信息的基础上,对多个单域网络发生的故障,基于时间和业务信息的关联,基于时间关联性和业务信息关联性确定多个故障是由同一个故障导致的。如果确定多个故障是同一故障导致的,所述跨域故障分析系统2001分析所述故障的原因,通过北向开放接口将故障原因同步到第三系统5001。这种方法减少了运维人员故障分析的工作量,提高故障分析的效率。
图3为本申请实施例的流程图。在本申请的一些实施例中,如图3所示的多域网络中的跨域故障分析流程包括以下内容。
S301、获取第一网络域中的第一故障的信息和第二网络域中的第二故障的信息,所述异地故障的信息包括第一时间和第一业务信息,所述第二故障的信息包括第二时间和第二业务信息。
在一些实施例中,例如图2所示的跨域故障分析系统2001,获取第一网络域,即单域网络2004,中的第一故障的信息,所述第一故障的信息是单域网络2004对应的单域网络故障分析系统2002,根据从所述单域网络2004接收的告警信息、异常日志和监控信息生成的,所述第一故障的信息包括第一时间和第一业务信息。所述第一时间的类型包括所述第一故障发生的时间、第一故障的信息生成的时间、第一故障的信息被发送的时间和/或第一故障的信息被接收的时间。所述第一时间至少包含一类时间信息。所述第一业务信息指所述第一故障对应的业务信息,包括所述第一故障的业务类型信息、所述第一故障发生的单域网络的网络拓扑信息、所述第一故障发生的网络设备信息和所述第一故障所在的业务流程信息。所述跨域故障分析系统2001,获取第二网络域,即单域网络2005,中的第二故障的信息,所述第二故障的信息是单域网络2005对应的单域网络故障分析系统2003,根据从所述单域网络2005接收的告警信息和监控信息生成的,所述第二故障的信息包括第二时间和第二业务信息。所述第二时间的类型包括所述第二故障发生的时间、第二故障的信息生成的时间、第二故障的信息被发送的时间和/或第二故障的信息被接收的时间。所述第二时间至少包含一类时间信息,所述第二时间和所述第一时间的类型一致。所述第二业务信息指所述第二故障对应的业务信息,包括所述第二故障的业务的类型信息、所述第二故障发生的单域网络的网络拓扑信息、所述第二故障发生的网络设备信息和所述第二故障所在的业务流程信息。
在一些实施例中,所述跨域故障分析系统2001从所述单域网络故障分析系统2002接收所述单域网络2004的第一故障的第一基础信息,所述第一基础信息是所述单域网络故障分析系统2002,从所述单域网络2004接收的告警信息、告警日志和监控信息或者根据上述信息生成的分析信息。所述跨域故障分析系统2001从所述单域网络故障分析系统2003接收所述单域网络2004的第二故障的第二基础信息,所述第二基础信息是所述单域网络故障分析系统2003从所述单域网络2005接收的告警信息、告警日志和监控信息或根据上述信息生成的分析信息。所述跨域故障分析系统2001基于所述第一基础信息生成所述第一故障的信息;基于所述第二基础信息生成所述第二故障的信息。
S303、基于第一时间和第二时间确定时间关联性。
在一些实施例中,如图2所示的所述跨域故障分析系统2001基于所述第一时间和所述第二时间确定时间关联性。所述第一时间是指所述第一故障的信息中的第一时间信息,所述第二时间是指所述第二故障的信息中的第二时间信息。所述第一时间的类型包括所述第一故障发生的时间、第一故障的信息生成的时间、第一故障的信息被发送的时间和/或第一故障的信息被接收的时间。所述第一时间至少含有上述一类时间信息。所述第二时间的类型包括所述第二故障发生的时间、第二故障的信息生成的时间、第二故障的信息被发送的时间和/或第二故障的信息被接收的时间。所述第二时间至少含有上述一类时间信息。所述第一时间和所述第二时间的类型是一致的,在这种情况下,所述时间关联性为所述第一时间和所述第二时间之间的差值小于时间阈值或者所述第一时间和所述第二时间在一个时间窗内。如图2所示,单域网络2004中的各网络设备、单域网络2005中的中各网络设备、单域网络故障分析系统2002、单域网络故障分析系统2003和跨域故障分析系统2001具备独立的系统时钟,通过网络时间协议(Network Time Protocol,NTP)实现系统时钟的自动同步。网络设备和系统的系统时间在一些实施例中,所述第一时间为所述第一故障发生的时间,所述第二时间为所述第二故障发生的时间;在一些实施例中,所述第一时间为所述第一故障的信息生成的时间,所述第二时间为所述第二故障的信息生成的时间;在一些实施例中,所述第一时间为所述第一故障的信息被发送的时间,所述第二时间为所述第二故障的信息被发送的时间;在一些实施例中,所述第一时间为所述第一故障的信息被接收的时间,所述第二时间为所述第二故障的信息被接收的时间。例如,第一时间为T1,T1的单位为秒,第二时间为T2,T2的单位为秒,时间关联性的时间阈值或者时间窗长度为σ,单位为秒;当T1与T2的差值的绝对值小于σ,或者T1与T2可以在同一个时间窗内,在这种情况下,第一时间和第二时间是有时间关联性的。例如,第一时间为第一故障发生的时间,第一时间的值为8:55:55 2020-12-12,第二时间的值为8:59:55 2020-12-12,时间阈值或者时间窗长度为300秒;经计算,第一时间和第二时间的差值的绝对值为240秒,差值的绝对值小于时间阈值,或者第一时间和第二时间在300秒的时间窗内,所以第一时间和第二时间具有时间关联性。例如,第一时间为第一故障的信息生成的时间,在一些实施例中所述第一故障的信息是由单域网络故障分析系统生成的,所述第一时间的值为8:56:10 2020-12-12,第二时间的值为9:00:30 2020-12-12,时间阈值或者时间窗长度为200秒;经计算,第一时间和第二时间的差值的绝对值为260秒,差值的绝对值大于时间阈值,或者第一时间和第二时间不在200秒的时间窗内,所以第一时间和第二时间不具有时间关联性。
S305、基于第一业务信息和第二业务信息确定业务信息关联性。
在一些实施例中,如图2所示的跨域故障分析系统2001基于第一业务信息和第二业务信息确定业务信息关联性。单域网络故障分析系统生成的故障的业务信息的类型包括所述故障对应的业务类型信息、所述故障发生的单域网络的网络拓扑信息、所述故障发生的网络设备信息、所述故障所在的业务流程信息。例如,所述第一业务信息的类型包括所述第一故障对应的业务类型信息、所述第一故障发生的单域网络的网络拓扑信息、所述第一故障发生的网络设备信息、所述第一故障所在的业务流程信息。所述第一业务信息至少包含一种业务信息。所述第二业务信息的类型包括所述第二故障对应的业务类型信息、所述第二故障发生的单域网络的网络拓扑信息、所述第二故障发生的网络设备信息、所述第二故障所在业务流程信息。所述第二业务信息至少包含一种业务信息。需要注意的是,跨域故障分析系统基于第一业务信息和第二业务信息确定业务信息关联性之前,要保证所述第一业务信息和所述第二业务信息是一种类型的信息。
在一些实施例中,故障的业务类型信息根据网络域的维度划分,在这种情况下,业务类型信息包括IP网络业务、传送网络业务、无线网络业务;在一些实施例中,故障的业务类型信息根据网络场景的维度划分,在这种情况下,故障的业务类型信息包括IP局域网络(Local Area Network,LAN)业务、IP无线局域网络(Wireless Local Area Network,WLAN)、光传送网络(Optical Transport Network,OTN)、分组传送网络(Packet TransportNetwork,PTN)、城域交换(Metropolitan Area Exchange,MAE)网络、无线接入网络(RadioAccess Network)和IP化无线接入网络(Internet Protocol Radio Access Network,IPRAN)。在一些实施例中,故障的业务类型信息根据开放系统互联(Open SystemInterconnection,OSI)7层模型维度划分,在这种情况下,故障的业务类型信息包括:物理层业务、数据链路层业务、网络层业务、传输层业务、会话层业务、表示层业务和应用层业务。例如,一个光传送网络域中光纤连接接口故障对应的业务类型信息是物理层业务的端口业务;一个BGP路由倒换故障对应的业务类型信息是网络层业务的路由业务。例如,如图2所示,单域网络故障分析系统2002生成的第一故障的信息中的第一业务信息中的业务信息类型为IP网络业务;单域网络故障分析系统2003生成的第二故障的信息中的第二业务信息中的业务信息类型为传送网络业务。需要说明的,在一些实施例中,故障的业务类型信息可以包含一种或多种业务类型信息。例如,一个故障的业务类型信息是:业务类型信息1:IP网络;业务类型信息2:MPLS,所述业务类型信息表示所述故障的所发生的单域网络业务类型为IP网络,具体的是网络层业务MPLS。
所述故障发生的单域网络的网络拓扑信息包括所述故障发生所在单域网络的网络设备节点信息、所述网络设备节点间存在的物理连接关系信息和所述网络设备节点间存在的逻辑连接关系信息。在一些实施例中,所述网络设备节点信息包括网络设备名称、网络设备类型和网络设备序列号。所述网络设备节点间存在的物理连接关系信息包括所述物理连接的类型、所述构成物理连接链路的网络设备节点的端口名和/或所述网络设备节点的端口状态信息。所述网络设备节点间存在的逻辑连接关系信息包括所述逻辑连接的类型、所述构成逻辑连接链路的网络设备节点的端口名称和/或所述网络设备节点的端口状态信息。例如,如图2所示,单域网络2004产生的故障的网络拓扑信息包括所述单域网络2004的网络设备节点网元1101、网元1102、网元1103和网元1104的设备名称、设备类型和设备序列号;网元1101、网元1102、网元1103和网元1104之间存在的物理连接关系信息和逻辑连接关系信息,例如,网元1101和网元1102之间的千兆以太网(Gigabit Ethernet,GE)物理连接链路,网元1101和网元1103之间的GE物理连接链路和网元1101和网元1104之间的GE物理连接链路。
所述故障发生的网络设备信息包括上报故障告警信息的网络设备的基本信息和/或单域网络故障分析系统分析出的导致故障的网络设备的基本信息。在一些实施例中,所述网络设备的基本信息包括网络设备名称、网络设备类型、网络设备序列号、网络设备管理IP地址、和/或端口信息。所述端口信息包括端口名称、端口状态、端口的流量统计信息。例如,如图2所示,单域网络2004产生的一个故障,通过单域网络故障分析系统2002分析,网元1101的配置错误导致所述故障,在这种情况下,所述故障发生的网络设备信息包括所述网元1101的设备名称、设备类型、设备序列号、设备管理IP地址和端口信息。
所述故障所在的业务流程信息包括所述故障所在的业务对应的正常流程状态和/或所述故障导致的业务状态。例如,如图2所示,单域网络2004产生的一个MPLS标签分发路径协商报文丢包导致MPLS标签分发路径协商失败的故障,所述故障所在的业务流程信息包括所述故障所在的MPLS标签分发路径协商业务正常流程状态和所述故障导致的MPLS标签分发路径协商失败的业务状态。
在一些实施例中,单域网络故障分析系统生成的故障的信息格式如表1所示。跨域故障分析系统接收所述单域网络故障分析系统生成的所述故障的信息,按照如表1所示的信息格式进行数据的获取。故障来源信息标识了所述故障生成的单域网络和单域网络故障分析系统。故障编号信息标识了所述故障的编号,所述编号由单域网络故障分析系统生成或跨域网络故障分析系统生成。所述时间信息标识了所述故障的时间信息,所述故障的时间信息的类型包括所述故障发生的时间、所述故障的信息生成的时间、所述故障的信息被发送的时间和/或所述故障的信息被接收的时间。所述时间信息至少含有上述一类时间信息。在这种情况下,通过在单域网络故障分析系统配置故障的时间信息类型或者通过在跨域故障分析系统配置接收的故障信息的时间信息的类型,保证故障信息的时间信息类型一致。业务类型信息标识了所述故障对应的业务类型信息。网络拓扑信息标识了所述故障发生的网络拓扑中的网络设备节点信息和网络设备节点间的链路信息。网络设备信息标识了所述故障发生的网络设备信息,例如,所述故障的告警信息上报的网络设备的信息。业务流程信息标识了所述故障所在业务流程信息。
表1
例如,单域网络故障分析系统2002上报了单域网络2004的故障1001的信息,如表2所示;单域网络故障分析系统2003上报了单域网络2005的故障2001的信息,如表3所示。
表2
/>
表3
在一些实施例中,第一业务信息为所述第一故障对应的业务类型信息,第二业务信息为所述第二故障对应的业务类型信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在这种情况下,所述业务信息关联性为判断所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息的约束条件。在一些实施例中,如果所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息相同,在这种情况下,所述故障的业务类型信息和所述第二故障的业务类型信息满足约束条件,跨域故障分析系统将所述业务信息关联性判断结果为所述第一业务信息和所述第二业务信息具有业务信息关联性。在一些实施例中,如果所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息满足业务关联关系,在这种情况下,跨域故障分析系统所述业务信息关联性判断结果为满足约束条件,所述第一业务信息和所述第二业务信息具有业务信息关联性。例如,如表2中所示单域网络2004的故障1001的业务类型信息为:业务类型信息1:IP网络;业务类型信息2:MPLS;如表3中所示单域网络2005的故障2001的业务类型为OTN网络,如图2所示单域网络2004是如图1所示的IP网络110,单域网络2005是如图1所示的传送网络120,所述单域网络2004与所述单域网络2005间还所述有光纤连接,需要基于单域网络2005的OTN网络进行数据传输,在物理链路上有依赖关系,所以跨域故障分析系统2001关联IP网络业务和OTN网络业务,判断所述故障1001和所述故障2001的业务类型信息是结果为满足约束条件,述故障1001和所述故障2001具有业务信息关联性。
在一些实施例中,第一业务信息为所述第一故障所在的单域网络的网络拓扑信息,第二业务信息为第二故障所在的单域网络的网络拓扑信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在一些实施例中,所述业务信息关联性为判断所述第一业务的网络拓扑信息和所述第二业务的网络拓扑信息的关联关系。例如,如图2所示,单域网络2004是如图1所示的IP网络110,单域网络2005是如图1所示的传送网络120,所述单域网络2004对应的单域网络故障分析系统2002生成的故障1001的信息如表2所示,所述单域网络2005对应的单域网络故障分析系统2003生成的故障2001的信息如表3所示,跨域故障分析系统2001会被输入所述单域网络2004和所述单域网络2005的跨域拓扑数据,所述跨域拓扑数据包括跨域链路名称、链路类型、链路对应的端口信息。例如,所述单域网络2004与所述单域网络2005之间的跨域拓扑数据包括所述单域网络2004的网元1101至1104与所述单域网络2005的网元1201至1204的跨域链路名称,所述跨域链路类型和所述跨域链路对应的端口信息。所述跨域故障分析系统2001接收所述单域网络故障分析系统2002生成的故障1001的信息,所述跨域故障分析系统2001获取所述故障1001所在所述单域网络2004的网络拓扑信息。所述跨域故障分析系统2001接收所述单域网络故障分析系统2003生成的故障2001的信息,所述跨域故障分析系统2003获取所述故障2001所在所述单域网络2005的网络拓扑信息。所述跨域故障分析系统2001基于所述跨域拓扑数据、如表2所示的所述故障1001的网络拓扑信息和如表3所示的所述故障2001的网络拓扑信息,确定所述故障1001的网络拓扑信息和所述故障2001的网络拓扑信息中具有共同的网络设备节点,所以所述故障1001的网络拓扑信息和所述故障2001的网络拓扑信息具有关联关系,所以所述故障1001的业务信息和所述故障2001的业务信息具有业务信息关联性。
在一些实施例中,第一业务信息为所述第一故障所在的业务流程信息,第二业务信息为所述第二故障所在的业务流程信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在这种情况下,所述业务信息关联性为判断所述第一故障所在的业务流程信息和所述第二故障所在的业务流程信息属于同一业务流程或属于故障因果关系。例如,如图2中的单域网络2004是如图1所示的IP网络110,单域网络2005是如图1所示的传送网络120,所述单域网络2004的单域网络故障分析系统2002生成的故障1001的信息中的故障的业务流程信息为“路由器1101向路由器1104的MPLS标签分发领协商失败”,所述单域网络2005的单域网络故障分析系统2003生成的故障2001的信息中的故障的业务流程信息为“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”。跨域故障分析系统2001基于所述单域网络2004和所述单域网络2005的跨域网络拓扑,可以分析出路由器1101与路由器1104之间的数据报文通信基于OTN1201与OTN1204之间的光纤链路,所以所述故障2001的“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”的业务流程信息会导致OTN1201与OTN1204之间的光纤链路不可用,在这种情况下,路由器1101与路由器1104之间的数据报文无法通信,最终导致所述故障1001的业务流程信息“路由器1101向路由器1104的MPLS标签分发领协商失败”,所以所述故障1001的业务信息和所述故障2001的业务信息具有关联关系,所述故障1001的业务信息和所述故障2001具有业务信息关联性。
S307、基于时间关联性和业务信息关联性确定第一故障和第二故障是由同一故障导致的。
在一些实施例中,如图2所示的跨域故障分析系统2001基于单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息,通过S305的步骤后,获得了所述第一故障和所述第二故障时间关联性和业务信息关联性。所述跨域故障分析系统2001基于时间关联性和业务信息关联性确定第一故障和第二故障是由同一故障导致的。
在一些实施例中,如图2所示,跨域故障分析系统2001接收到单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息。所述跨域故障分析系统2001分析了所述第一故障和所述第二故障的时间关联性和业务信息关联性。例如,所述跨域故障分析系统2001获得的时间关联性结果是所述第一故障和所述第二故障不具有时间关联性,在这种情况下,所述第一故障属于单域网络2004的单域网络故障,所述第二故障属于单域网络2005的单域网络故障,所述跨域故障分析系统2001停止针对所述第一故障和所述第二故障的跨域故障分析。
在一些实施例中,如图2所示,跨域故障分析系统2001接收到单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息。所述跨域故障分析系统2001分析了所述第一故障和所述第二故障的时间关联性和业务信息关联性。例如,所述跨域故障分析系统2001获得的时间关联性结果是所述第一故障和所述第二故障具有时间关联性,在这种情况下,所述跨域故障分析系统2001获得所述第一故障和所述第二故障的业务信息关联性。例如,所述跨域故障分析系统2001获得的时间关联性结果是所述第一故障和所述第二故障不具有业务信息关联性,在这种情况下,所述第一故障属于单域网络2004的单域网络故障,所述第二故障属于单域网络2005的单域网络故障,所述跨域故障分析系统2001停止针对所述第一故障和所述第二故障的跨域故障分析。
在一些实施例中,如图5所示,跨域故障分析系统2001接收到单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息。图5是一种跨域故障分析场景示意图。所述跨域故障分析系统2001分析了所述第一故障和所述第二故障的时间关联性和业务信息关联性。例如,所述跨域故障分析系统2001获得的时间关联性结果是所述第一故障和所述第二故障具有时间关联性,在这种情况下,所述跨域故障分析系统2001获得所述第一故障和所述第二故障的业务信息关联性。例如,所述跨域故障分析系统2001获得的时间关联性结果是所述第一故障和所述第二故障具有业务信息关联性,在这种情况下,所述跨域故障分析系统2001对每一个单域网络故障的业务信息,即所述第一故障和所述第二故障的,利用故障因果关系或者机器学习方法,确定导致所述第一故障和所述第二故障的同一故障和故障原因。例如,故障因果关系表如表4所示。表4描述了故障原因和故障表现结果关系,所述故障可以传播的网络域类型以及传播条件。
表4
例如,如图5所示的跨域故障分析系统2001根据表4所示的故障因果关系表,根据单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息,得到所述第一故障“路由器1101向路由器1104的MPLS标签分发领协商失败”的原因是“路由器1101IP数据报文发送失败”,“路由器1101IP数据报文发送失败”,的原因是“路由器1101的网络端口信号丢失”,“路由器1101的网络端口信号丢失”的原因是对端网络设备“网络设备无法提供服务”,所以定位所述第一故障的根本原因是到OTN1201“网络设备无法提供服务”;所述第二故障“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”的原因是对应设备OTN1201的“端口不可用”,OTN1201“端口不可用”的原因“网络设备无法提供设备”,所以定位到第二故障的根本原因是OTN1201“网络设备无法提供服务”。所述跨域故障分析系统2001确定所述第一故障和所述第二故障是由同一故障导致的。在一些实施例中,如图5所示,跨域故障分析系统2001基于第一故障和第二故障的信息的时间关联性和业务信息关联性,确定所述第一故障和所述第二故障是由同一故障导致的,如果是同一故障导致,所述跨域故障分析系统2001给出跨域故障的原因,通过北向开放接口向第三方系统,例如运营支撑系统,发送所述跨域故障的原因信息。具体方法如下。
S501、上报第一故障的信息。
一些实施例中,单域网络故障分析系统,例如图2所示的单域网络故障分析系统2002,生成了第一故障的信息。所述第一故障的信息包括所述第一故障的第一时间和第一业务信息。所述单域网络故障分析系统2002向所述跨域故障分析系统2001上报所述第一故障的信息。
S503、上报第二故障的信息。
一些实施例中,单域网络故障分析系统,例如图2所示的单域网络故障分析系统2003,生成了第二故障的信息。所述第二故障的信息包括所述第二故障的第二时间和第二业务信息。所述单域网络故障分析系统2003向所述跨域故障分析系统2001上报所述第二故障的信息。
S505、基于第一故障和第二故障的信息,获取第一故障和第二故障的时间关联性。
在一些实施例中,如图2所示的所述跨域故障分析系统2001基于第一故障的第一时间和第二故障的第二时间确定时间关联性。所述时间关联性为所述第一时间和所述第二时间之间的差值小于时间阈值或者所述第一时间和所述第二时间在同一个时间窗内。如图2所示,单域网络2004中的各网络设备、单域网络2005中的中各网络设备、单域网络故障分析系统2002、单域网络故障分析系统2003和跨域故障分析系统2001具备独立的系统时钟,通过网络时间协议(Network Time Protocol,NTP)实现系统时钟的自动同步。网络设备和系统的系统时间在一些实施例中,所述第一时间为所述第一故障发生的时间,所述第二时间为所述第二故障发生的时间;在一些实施例中,所述第一时间为所述第一故障的信息生成的时间戳,所述第二时间为所述第二故障的信息生成的时间戳;在一些实施例中,所述第一时间为所述第一故障的信息被发送的时间戳,所述第二时间为所述第二故障的信息被发送的时间戳;在一些实施例中,所述第一时间为所述第一故障的信息被接收的时间戳,所述第二时间为所述第二故障的信息被接收的时间戳。例如,第一时间为T1,T1的单位为秒,第二时间为T2,T2的单位为秒,时间关联性的时间阈值或者时间窗长度为σ,单位为秒;当T1与T2的差值的绝对值小于σ,或者T1与T2可以在同一个时间窗内,在这种情况下,第一时间和第二时间是有时间关联性的。例如,第一时间为第一故障发生的时间,第一时间的值为8:55:552020-12-12,第二时间的值为8:59:55 2020-12-12,时间阈值或者时间长长度为300秒;经计算,第一时间和第二时间的差值的绝对值为240秒,差值的绝对值小于时间阈值,或者第一时间和第二时间在300秒的时间窗内,所以第一时间和第二时间具有时间关联性。所以所述第一故障和所述第二故障不具有时间关联性。例如,第一时间为第一故障的信息生成的时间,在一些实施例中所述第一故障的信息是由单域网络故障分析系统生成的,所述第一时间的值为8:56:10 2020-12-12,第二时间的值为9:00:30 2020-12-12,时间阈值或者时间长长度为200秒;经计算,第一时间和第二时间的差值的绝对值为260秒,差值的绝对值大于时间阈值,或者第一时间和第二时间不在300秒的时间窗内,所以第一时间和第二时间不具有时间关联性。所以所述第一故障和所述第二故障不具有时间关联性。
S507、判断第一故障和第二故障是否具有时间关联性。如果所述第一故障和所述第二故障具有时间关联性,基于所述第一故障和所述第二故障的信息,获得所述第一故障和所述第二故障的业务信息关联性;如果所述第一故障和所述第二故障不具有时间关联性,终止分析流程。
在一些实施例中,跨域故障分析系统2001根据S507的操作可以获得第一故障和第二故障的时间关联性,所述跨域故障分析系统判断第一故障和第二故障是否具有时间关联性。如果所述第一故障和所述第二故障具有时间关联性,基于所述第一故障和所述第二故障的信息,获得所述第一故障和所述第二故障的业务信息关联性;如果所述第一故障和所述第二故障不具有时间关联性,终止分析流程。在一些实施例中,跨域故障分析系统2001基于所述第一故障的业务信息和所述第二故障的业务信息确定业务信息关联性。单域网络故障分析系统生成的故障的业务信息包括所述故障对应的业务类型信息、所述故障发生的单域网络的网络拓扑信息、所述故障发生的网络设备信息、所述故障所在的业务流程信息。
在一些实施例中,第一业务信息为所述第一故障对应的业务类型信息,第二业务信息为所述第二故障对应的业务类型信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在这种情况下,所述业务信息关联性为判断所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息的约束条件。在一些实施例中,如果所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息相同,在这种情况下,跨域故障分析系统将所述业务信息关联性判断结果为满足约束条件,所述第一业务信息和所述第二业务信息具有业务信息关联性。在一些实施例中,如果所述第一故障对应的业务类型信息和所述第二故障对应的业务类型信息满足关联关系,在这种情况下,跨域故障分析系统所述业务信息关联性判断结果为满足约束条件,所述第一业务信息和所述第二业务信息具有业务信息关联性。例如,如表2中所示单域网络2004的故障1001的业务类型信息为:业务类型信息1:IP网络;业务类型信息2:MPLS;如表3中所示单域网络2005的故障2001的业务类型为OTN网络,如图2所示单域网络2004是如图1所示的IP网络110,单域网络2005是如图1所示的传送网络120,所述单域网络2004与所述单域网络2005间还所述有光纤连接,需要基于单域网络2005的OTN网络进行数据传输,在物理链路上有依赖关系,所以跨域故障分析系统2001关联IP网络业务和OTN网络业务,判断所述故障1001和所述故障2001的业务类型信息是结果为满足约束条件,述故障1001和所述故障2001具有业务信息关联性。
在一些实施例中,第一业务信息为所述第一故障所在的单域网络的网络拓扑信息,第二业务信息为第二故障所在的单域网络的网络拓扑信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在一些实施例中,所述业务信息关联性为判断所述第一业务的网络拓扑信息和所述第二业务的网络拓扑信息的关联关系。例如,如图4所示,多域网络400包括单域网络2004和单域网络2005。所述单域网络2004是如图1所示的IP网络110,所述单域网络2005是如图1所示的传送网络120,所述单域网络2004对应的单域网络故障分析系统2002生成的故障1001的信息如表2所示,所述单域网络2005对应的单域网络故障分析系统2003生成的故障2001的信息如表3所示,跨域故障分析系统2001会被输入所述单域网络2004和所述单域网络2005的跨域拓扑数据,所述跨域拓扑数据包括跨域链路名称、链路类型、链路对应的端口信息。例如,所述单域网络2004与所述单域网络2005之间的跨域拓扑数据包括所述单域网络2004的网元1101至1104与所述单域网络2005的网元1201至1204的跨域链路名称,所述跨域链路类型和所述跨域链路对应的端口信息。所述跨域故障分析系统2001接收所述单域网络故障分析系统2002生成的故障1001的信息,所述跨域故障分析系统2001获取所述故障1001所在所述单域网络2004的网络拓扑信息。所述跨域故障分析系统2001接收所述单域网络故障分析系统2003生成的故障2001的信息,所述跨域故障分析系统2003获取所述故障2001所在所述单域网络2005的网络拓扑信息。所述跨域故障分析系统2001基于所述跨域拓扑数据、如表2所示的所述故障1001的网络拓扑信息和如表3所示的所述故障2001的网络拓扑信息,确定所述故障1001的网络拓扑信息和所述故障2001的网络拓扑信息中具有共同的网络设备节点,所以所述故障1001的网络拓扑信息和所述故障2001的网络拓扑信息具有关联关系,所以所述故障1001的业务信息和所述故障2001的业务信息具有业务信息关联性。
在一些实施例中,第一业务信息为所述第一故障所在的业务流程信息,第二业务信息为所述第二故障所在的业务流程信息,基于所述第一业务信息和所述第二业务信息确定所述第一业务信息和所述第二业务信息的业务信息关联性。在这种情况下,所述业务信息关联性为判断所述第一故障所在的业务流程信息和所述第二故障所在的业务流程信息属于同一业务流程或属于业务流程的因果关系。例如,如图4中的单域网络2004是如图1所示的IP网络110,单域网络2005是如图1所示的传送网络120,所述单域网络2004的单域网络故障分析系统2002生成的故障1001的信息中的故障的业务流程信息为“路由器1101向路由器1104的MPLS标签分发领协商失败”,所述单域网络2005的单域网络故障分析系统2003生成的故障2001的信息中的故障的业务流程信息为“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”。跨域故障分析系统2001基于所述单域网络2004和所述单域网络2005的跨域网络拓扑,可以分析出路由器1101与路由器1104之间的数据报文通信基于OTN1201与OTN1204之间的光纤链路,所以所述故障2001的“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”的业务流程信息会导致OTN1201与OTN1204之间的光纤链路不可用,在这种情况下,路由器1101与路由器1104之间的数据报文无法通信,最终导致所述故障1001的业务流程信息“路由器1101向路由器1104的MPLS标签分发领协商失败”,所以所述故障1001的业务信息和所述故障2001的业务信息具有关联关系,所述故障1001的业务信息和所述故障2001具有业务信息关联性。
在一些实施例中,如果所述第一故障和所述第二故障不具有时间关联性,所述第一故障和所述第二故障属于单域网络的故障,跨域故障分析系统2001通过对应的单域网络故障分析系统2002和单域网络故障分析系统2003的北向开放接口通知所述单域网络故障分析系统2002和所述单域网络故障分析系统2003,对于所述第一故障和所述第二故障按照单域网络故障进行分析和处理,所述跨域故障分析系统2001终止分析流程。
S509、判断第一故障和第二故障是否具有业务信息关联性,如果第一故障和第二故障具有业务信息关联性,基于第一故障和第二故障的时间关联性和业务信息关联性,确定第一故障和第二故障是由同一故障导致的;如果第一故障和第二故障不具有业务信息关联性,终止分析流程。
在一些实施例中,跨域故障分析系统2001根据S507的操作,判断第一故障和第二故障是否具有业务信息关联性,如果所述第一故障和所述第二故障具有业务信息关联性,基于所述第一故障和所述第二故障的时间关联性和业务信息关联性,确定所述第一故障和所述第二故障是由同一故障导致的;如果所述第一故障和所述第二故障不具有业务信息关联性,终止分析流程。在这种情况下,所述跨域故障分析系统2001对每一个单域网络故障的业务信息,即所述第一故障和所述第二故障的业务信息,利用故障因果关系或者机器学习方法,确定导致所述第一故障和所述第二故障的同一故障和故障原因。例如,故障因果关系表如表5所示。表5描述了故障原因和故障表现结果关系,所述故障可以传播的网络域类型以及传播条件。
表5
例如,跨域故障分析系统2001根据表5所示的故障因果关系表,根据单域网络故障分析系统2002上报的第一故障的信息和单域网络故障分析系统2003上报的第二故障的信息,如表2和表3所示,得到所述第一故障“路由器1101向路由器1104的MPLS标签分发领协商失败”的原因是“路由器1101IP数据报文发送失败”,“路由器1101IP数据报文发送失败”,的原因是“路由器1101的网络端口信号丢失”,“路由器1101的网络端口信号丢失”的原因是对端网络设备“网络设备无法提供服务”,所以定位所述第一故障的根本原因是到OTN1201“网络设备无法提供服务”;所述第二故障“OTN1201的槽位号1-单板1-端口1的光网络端口信号丢失”的原因是对应设备OTN1201的“端口不可用”,OTN1201“端口不可用”的原因“网络设备无法提供设备”,所以定位到第二故障的根本原因是OTN1201“网络设备无法提供服务”。所述跨域故障分析系统2001确定所述第一故障和所述第二故障是由同一故障导致的。
在一些实施例中,如果所述第一故障和所述第二故障不具有业务信息关联性,所述第一故障和所述第二故障属于单域网络的故障,跨域故障分析系统2001通过对应的单域网络故障分析系统2002和单域网络故障分析系统2003的北向开放接口通知所述单域网络故障分析系统2002和所述单域网络故障分析系统2003,对于素数第一故障和所述第二故障按照单域网络故障进行分析和处理,所述跨域故障分析系统2001终止分析流程。
S511、判断第一故障和第二故障是由同一故障导致的,如果第一故障和第二故障是由同一故障导致的,分析并生成同一故障的原因信息;如果第一故障和第二故障不是由同一故障导致的,终止分析流程。
在一些实施例中,跨域故障分析系统2001判断第一故障和第二故障是由同一故障导致的,如果所述第一故障和所述第二故障是由同一故障导致的,分析并生成所述同一故障的原因信息;如果所述第一故障和所述第二故障不是由同一故障导致的,终止分析流程。在一些实施例中,如果所述第一故障和所述第二故障不是由同一故障导致的,所述第一故障和所述第二故障属于单域网络的故障,跨域故障分析系统2001通过对应的单域网络故障分析系统2002和单域网络故障分析系统2003的北向开放接口通知所述单域网络故障分析系统2002和所述单域网络故障分析系统2003,对于素数第一故障和所述第二故障按照单域网络故障进行分析和处理,所述跨域故障分析系统2001终止分析流程。
S513、通过北向开放接口向运营支撑系统发送跨域故障的原因信息。
在一些实施例中,跨域故障分析系统2001根据S511操作生成了导致第一故障和第二故障的跨域故障的原因信息,所述跨域故障分析系统2001通过北向开放接口向第三方系统,例如图5所示的运营支撑系统5001。本申请实施例还提供一种跨域故障分析系统。图6为本申请一个实施例提供的跨域故障分析系统600的结构示意图。所述跨域故障分析系统600用于通过图6所示的各个模块执行前述多个实施例,例如,与图3和图4对应的实施例中的跨域故障分析系统所执行的操作。如图6所示,所述跨域故障分析系统600包括如下模块。
故障信息接收模块601,用于获取第一网络域,例如图2所示的单域网络2004,中的第一故障的信息和第二网络域,例如图2所示的单域网络2005,中的第二故障的信息,所述第一故障的信息包括所述第一故障的第一时间和所述第一故障的第一业务信息,所述第二故障的信息包括所述第二故障的第二时间和所述第二故障的第二业务信息。
时间关联性分析模块602,用于基于所述第一时间和所述第二时间确定时间关联性,其中所述时间关联性为所述第一时间和所述第二时间满足时间约束条件。
业务信息关联性分析模块603,用于基于所述第一业务信息和所述第二业务信息确定业务信息关联性,其中所述业务信息关联性为所述第一业务信息和所述第二业务信息满足业务信息约束条件。
跨域故障确定模块604,用于基于所述时间关联性和所述业务信息关联性确定所述第一网络域中的第一故障和所述第二网络域中的第二故障是由同一个故障导致的。
跨域故障原因分析模块605,用于基于所述第一故障的信息和所述第二故障的信息确定所述故障的原因信息。
跨域故障原因同步模块606,用于通过北向接口向第三方系统发送所述故障的原因信息。
在一些实施例中,跨域故障分析系统600还可以包括如下模块。
资源管理模块607,用于管理组成多域网络的单域网络、第三方系统的资源信息。例如单域网络的名称、网络业务类型和网络拓扑信息;多域网络的跨域拓扑信息;第三方系统的互联网协议(Internet Protocol,IP)地址。
在一些实施例中,跨域故障分析系统600中的各个模块可以部署在同一个物理设备中;在另一些实施例中,跨域故障分析系统600中的各个模块可以部署在多台不同的物理设备中。跨域故障分析系统600中的各个模块可以是硬件模块或者软件和硬件相结合的模块。
图7为本申请一个实施例提供的跨域故障分析系统700的结构示意图。图7所示的跨域故障分析系统700用于执行前述多个实施例,例如与图3和图4对应的实施例中的跨域故障分析系统所执行的操作。如图7所示,系统700包括至少一个处理器701、连接线702、存储器703以及至少一个网络接口704。
处理器701例如是通用中央处理器(Central Processing Unit,CPU)、数字信号处理器(Digital Signal Processor,DSP)、网络处理器(Network Processer,NP)、图形处理器(Graphics Processing Unit,GPU)、神经网络处理器(Neural-network ProcessingUnits,NPU)、数据处理单元(Data Processing Unit,DPU)、微处理器或者一个或多个用于实现本申请方案的集成电路。例如,处理器701包括专用集成电路(Application-specificIntegrated Circuit,ASIC),可编程逻辑器件(Programmable Logic Device,PLD)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。PLD例如是复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD)、现场可编程逻辑门阵列(Field-programmable Gate Array,FPGA)、通用阵列逻辑(Generic Array Logic,GAL)或其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种逻辑方框、模块和电路。所述处理器也可以是实现计算功能的组合,例如包括一个或多个微处理器组合,DSP和微处理器的组合等等。
跨域故障分析系统700还可以包括连接线702。连接线702用于在跨域故障分析系统700的各组件之间传送信息。总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器703例如是只读存储器(Read-only Memory,ROM)或可存储静态信息和指令的其它类型的静态存储设备,又如是随机存取存储器(Random access Memory,RAM)或者可存储信息和指令的其它类型的动态存储设备,又如是电可擦可编程只读存储器(Electrically Erasable programmable read-only Memory,EEPROM)、只读光盘(CompactDisc Read-only Memory,CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备,或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。存储器703例如是独立存在,并通过总线与处理器701相连接。存储器703也可以和处理器701集成在一起。
网络接口704使用任何收发器一类的装置,用于与其它设备或通信网络通信,通信网络可以为以太网、无线接入网或无线局域网(Wireless Local Area Networks,WLAN)等。网络接口704可以包括有线通信接口,还可以包括无线通信接口。具体的,网络接口704可以为以太接口、快速以太(Fast Ethernet,FE)接口、千兆以太(Gigabit Ethernet,GE)接口,异步传输模式(Asynchronous Transfer Mode,ATM)接口,无线局域网WLAN接口,蜂窝网络通信接口或其组合。以太网接口可以是光接口,电接口或其组合。在本申请实施例中,网络接口704可以用于系统700与其他设备进行通信。
在具体实现中,作为一种实施例,处理器701可以包括一个或多个CPU。这些处理器中的每一个可以是一个单核处理器,也可以是一个多核处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,跨域故障分析系统700可以包括多个处理器。这些处理器中的每一个可以是一个单核处理器,也可以是一个多核处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。
在具体实现中,作为一种实施例,跨域故障分析系统700还可以包括输出设备和输入设备。输出设备和处理器701通信,可以以多种方式来显示信息。例如,输出设备可以是液晶显示器(Liquid Crystal Display,LCD)、发光二级管(Light Emitting Diode,LED)显示设备、阴极射线管(Cathode Ray Tube,CRT)显示设备或投影仪等。输入设备和处理器701通信,可以以多种方式接收用户的输入。例如,输入设备可以是鼠标、键盘、触摸屏设备或传感设备等。
在一些实施例中,存储器703用于存放程序模块和数据。所述程序模块包括故障信息接收模块7031、时间关联性分析模块7032、业务信息关联性分析模块7033、跨域故障确定模块7034、跨域故障原因分析模块7035、跨域故障原因同步模块7036和资源管理模块7037。在一些实施例中,图7中存储器703中的各个模块分别和图6所示的各个模块相对应,处理701通过执行存储器703中的各个模块中的计算机可读指令,能够执行图6所示的各个模块所能够执行的操作。
在具体实施例中,本申请实施例的跨域故障分析系统700可对应于上述多个实施例,例如与图3和图4对应的多个实施例,中的跨域故障分析系统2001,跨域故障分析系统700中的处理器701读取存储器703中的指令,使图7所示的跨域故障分析系统700能够执行上述多个实施例中跨域故障分析系统的全部或部分操作。
本申请的说明书和权利要求书及上述附图中的操作顺序,不限于描述中特定的顺序或先后次序。应该理解这样使用的数据在适当情况下同时进行或可以改变顺序,以便描述的实施例能够以除了在附图中的图示或描述的内容以外的顺序实施。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本申请的一些实施例提供一种计算机程序产品,所述计算机程序产品在被计算机执行时,能够使计算机执行本申请多个实施例中的跨域故障分析系统所执行的操作。
本申请的一些实施例提供一种计算机可读存储介质,例如硬盘、内存、闪存等。所述计算机存储介质中存储有计算机可读指令。当计算机执行所述计算机可读指令时,能够执行本申请多个实施例中的跨域故障分析系统所执行的操作。
本申请的一些实施例提供一种包括多个模块的跨域故障分析系统,所述多个模块协同工作,执行本申请多个实施例中的跨域故障分析系统所执行的操作。所述多个模块可以在同一个硬件设备中,也可以在不同的硬件设备中。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉该技术的人在本申请所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。

Claims (24)

1.一种跨域故障分析的方法,其特征在于,包括:
获取第一网络域中的第一故障的信息和第二网络域中的第二故障的信息,所述第一故障的信息包括所述第一故障的第一时间和所述第一故障的第一业务信息,所述第二故障的信息包括所述第二故障的第二时间和所述第二故障的第二业务信息;
基于所述第一时间和所述第二时间确定时间关联性,其中所述时间关联性为所述第一时间和所述第二时间满足时间约束条件;
基于所述第一业务信息和所述第二业务信息确定业务信息关联性,其中所述业务信息关联性为所述第一业务信息和所述第二业务信息满足业务信息约束条件;
基于所述时间关联性和所述业务信息关联性确定所述第一网络域中的第一故障和所述第二网络域中的第二故障是由同一个故障导致的;其中,若所述第一时间和所述第二时间不具有所述时间关联性,或者,若所述第一时间和所述第二时间具有所述时间关联性且所述第一业务信息和所述第二业务信息不具有所述业务信息关联性,则所述第一故障属于所述第一网络域的单域网络故障,所述第二故障属于所述第二网络域的单域网络故障,停止针对所述第一故障和所述第二故障的跨域故障分析。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述第一故障的信息和所述第二故障的信息确定所述故障的原因信息;
通过北向接口向第三方系统发送所述故障的原因信息。
3.根据权利要求1或2所述的方法,其特征在于,所述时间约束条件为所述第一时间和所述第二时间之间的差值的绝对值小于时间阈值。
4.根据权利要求1或2所述的方法,其特征在于,所述时间约束条件为所述第一时间和所述第二时间在同一个时间窗内。
5.根据权利要求1或2所述的方法,其特征在于,所述第一时间包括所述第一故障发生的时间、所述第一故障的信息的被生成的时间、所述第一故障的信息的被发送的时间和/或所述第一故障的信息的被接收的时间,所述第二时间包括所述第二故障发生的时间、所述第二故障的信息的被生成的时间、所述第二故障的信息的被发送的时间和/或所述第二故障的信息的被接收的时间。
6.根据权利要求1或2所述的方法,其特征在于,所述第一业务信息包括:所述第一故障的业务类型信息、发生所述第一故障的所述第一网络域的网络拓扑信息、发生所述第一故障的网络设备信息和/或所述第一故障所在的业务流程信息,所述第二业务信息包括:所述第二故障的业务类型信息、发生所述第二故障的所述第一网络域的网络拓扑信息、发生所述第二故障的网络设备信息和/或所述第二故障所在的业务流程信息。
7.根据权利要求1或2所述的方法,其特征在于,所述业务信息约束条件为所述第一业务信息的业务类型信息和所述第二业务信息的业务类型信息属于同一种业务类型或者是存在关联的业务类型。
8.根据权利要求1或2所述的方法,其特征在于,所述业务信息约束条件为所述第一业务信息的网络拓扑信息和所述第二业务信息的网络拓扑信息是同一个网络拓扑的网络拓扑信息。
9.根据权利要求1或2所述的方法,其特征在于,所述业务信息约束条件为所述第一业务信息的业务流程信息和所述第二业务信息的业务流程信息属于同一个业务流程或属于故障因果关系。
10.根据权利要求1或2所述的方法,其特征在于,获取所述第一网络域中的第一故障的信息和所述第二网络域中的第二故障的信息包括:
从所述第一网络域的故障分析系统接收所述第一故障的信息;
从所述第二网络域的故障分析系统接收所述第二故障的信息。
11.根据权利要求1或2所述的方法,其特征在于,获取所述第一网络域中的第一故障的信息和所述第二网络域中的第二故障的信息包括:
从所述第一网络域的故障分析系统接收用于生成所述第一故障的信息的第一基础信息;
从所述第二网络域的故障分析系统接收用于生成所述第二故障的信息的第二基础信息;
基于所述第一基础信息生成所述第一故障的信息;
基于所述第二基础信息生成所述第二故障的信息。
12.根据权利要求1或2所述的方法,其特征在于,所述方法由跨域故障分析系统执行。
13.一种跨域故障分析系统,其特征在于,所述系统包括:
故障信息接收模块,用于获取第一网络域中的第一故障的信息和第二网络域中的第二故障的信息,所述第一故障的信息包括所述第一故障的第一时间和所述第一故障的第一业务信息,所述第二故障的信息包括所述第二故障的第二时间和所述第二故障的第二业务信息;
时间关联性分析模块,用于基于所述第一时间和所述第二时间确定时间关联性,其中所述时间关联性为所述第一时间和所述第二时间满足时间约束条件;
业务信息关联性分析模块,用于基于所述第一业务信息和所述第二业务信息确定业务信息关联性,其中所述业务信息关联性为所述第一业务信息和所述第二业务信息满足业务信息约束条件;
跨域故障确定模块,用于基于所述时间关联性和所述业务信息关联性确定所述第一网络域中的第一故障和所述第二网络域中的第二故障是由同一个故障导致的;其中,若所述第一时间和所述第二时间不具有所述时间关联性,或者,若所述第一时间和所述第二时间具有所述时间关联性且所述第一业务信息和所述第二业务信息不具有所述业务信息关联性,则所述第一故障属于所述第一网络域的单域网络故障,所述第二故障属于所述第二网络域的单域网络故障,停止针对所述第一故障和所述第二故障的跨域故障分析。
14.根据权利要求13所述的系统,其特征在于,所述系统还包括:
跨域故障原因分析模块,用于基于所述第一故障的信息和所述第二故障的信息确定所述故障的原因信息;
跨域故障原因同步模块,用于通过北向接口向第三方系统发送所述故障的原因信息。
15.根据权利要求13或14所述的系统,其特征在于,所述时间约束条件为所述第一时间和所述第二时间之间的差值的绝对值小于时间阈值。
16.根据权利要求13或14所述的系统,其特征在于,所述时间约束条件为所述第一时间和所述第二时间在同一个时间窗内。
17.根据权利要求13或14所述的系统,其特征在于,所述第一时间包括所述第一故障发生的时间、所述第一故障的信息的被生成的时间、所述第一故障的信息的被发送的时间和/或所述第一故障的信息的被接收的时间,所述第二时间包括所述第二故障发生的时间、所述第二故障的信息的被生成的时间、所述第二故障的信息的被发送的时间和/或所述第二故障的信息的被接收的时间。
18.根据权利要求13或14所述的系统,其特征在于,所述第一业务信息包括:所述第一故障的业务类型信息、发生所述第一故障的所述第一网络域的网络拓扑信息、发生所述第一故障的网络设备信息和/或所述第一故障所在的业务流程信息,所述第二业务信息包括:所述第二故障的业务类型信息、发生所述第二故障的所述第一网络域的网络拓扑信息、发生所述第二故障的网络设备信息和/或所述第二故障所在的业务流程信息。
19.根据权利要求13或14所述的系统,其特征在于,所述业务信息约束条件为所述第一业务信息的业务类型信息和所述第二业务信息的业务类型信息属于同一种业务类型或者是存在关联的业务类型。
20.根据权利要求13或14所述的系统,其特征在于,所述业务信息约束条件为所述第一业务信息的网络拓扑信息和所述第二业务信息的网络拓扑信息是同一个网络拓扑的网络拓扑信息。
21.根据权利要求13或14所述的系统,其特征在于,所述业务信息约束条件为所述第一业务信息的业务流程信息和所述第二业务信息的业务流程信息属于同一个业务流程或属于故障因果关系。
22.根据权利要求13或14所述的系统,其特征在于,所述故障信息接收模块用于从所述第一网络域的故障分析系统接收所述第一故障的信息;从所述第二网络域的故障分析系统接收所述第二故障的信息。
23.根据权利要求13或14所述的系统,其特征在于,所述故障信息接收模块还用于:
从所述第一网络域的故障分析系统接收用于生成所述第一故障的信息的第一基础信息;
从所述第二网络域的故障分析系统接收用于生成所述第二故障的信息的第二基础信息;
基于所述第一基础信息生成所述第一故障的信息;
基于所述第二基础信息生成所述第二故障的信息。
24.一种计算机存储介质,包括计算机程序指令,当所述计算机程序指令在计算机上运行时,使得所述计算机执行根据权利要求1至12中任一项所述的方法。
CN202110019596.XA 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统 Active CN114520760B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202311014471.3A CN117041012A (zh) 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统
EP21893822.3A EP4236234A4 (en) 2020-11-20 2021-11-11 CROSS-DOMAIN ERROR ANALYSIS PROCEDURE AND SYSTEM
PCT/CN2021/130168 WO2022105675A1 (zh) 2020-11-20 2021-11-11 一种跨域故障分析的方法及系统
US18/319,883 US11909581B2 (en) 2020-11-20 2023-05-18 Cross-domain fault analysis method and system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020113074121 2020-11-20
CN202011307412 2020-11-20

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311014471.3A Division CN117041012A (zh) 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统

Publications (2)

Publication Number Publication Date
CN114520760A CN114520760A (zh) 2022-05-20
CN114520760B true CN114520760B (zh) 2023-08-22

Family

ID=81594767

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110019596.XA Active CN114520760B (zh) 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统
CN202311014471.3A Pending CN117041012A (zh) 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311014471.3A Pending CN117041012A (zh) 2020-11-20 2021-01-07 一种跨域故障分析的方法及系统

Country Status (4)

Country Link
US (1) US11909581B2 (zh)
EP (1) EP4236234A4 (zh)
CN (2) CN114520760B (zh)
WO (1) WO2022105675A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115811464B (zh) * 2022-11-25 2023-07-25 北京智维盈讯网络科技有限公司 基于多维整合数据的网络故障智能分析方法、装置和控制系统
CN115988438A (zh) * 2022-12-14 2023-04-18 中国联合网络通信集团有限公司 呼叫业务数据处理方法、装置、设备及存储介质
CN116566805B (zh) * 2023-07-10 2023-09-26 中国人民解放军国防科技大学 一种面向体系容灾抗毁的节点跨域调度方法、装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062642B1 (en) * 2000-05-20 2006-06-13 Ciena Corporation Policy based provisioning of network device resources
CN101715149A (zh) * 2009-07-21 2010-05-26 北京邮电大学 一种多层多域分布式光网络并行跨域故障恢复方法和装置
WO2015176603A1 (zh) * 2014-05-23 2015-11-26 华为技术有限公司 网络故障定位方法和装置
CN105264836A (zh) * 2013-06-29 2016-01-20 华为技术有限公司 一种多域网络保护方法、系统和节点
CN106452817A (zh) * 2015-08-12 2017-02-22 中国电信股份有限公司 保护配置管理方法和系统
CN106982136A (zh) * 2017-03-07 2017-07-25 西安电子科技大学 一种多域分层的多域物联网平台及多域管理方法
US9742788B2 (en) * 2015-04-09 2017-08-22 Accenture Global Services Limited Event correlation across heterogeneous operations
CN108322320A (zh) * 2017-01-18 2018-07-24 华为技术有限公司 业务生存性分析方法及装置
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质
CN109842527A (zh) * 2019-03-19 2019-06-04 中国联合网络通信集团有限公司 一种网络告警方法以及设备
CN110048944A (zh) * 2018-01-17 2019-07-23 中兴通讯股份有限公司 端到端重路由的方法及装置
CN111669282A (zh) * 2019-03-08 2020-09-15 华为技术有限公司 识别疑似根因告警的方法、装置及计算机存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006016A (en) * 1994-11-10 1999-12-21 Bay Networks, Inc. Network fault correlation
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
US5991264A (en) * 1996-11-26 1999-11-23 Mci Communications Corporation Method and apparatus for isolating network failures by applying alarms to failure spans
US7197546B1 (en) * 2000-03-07 2007-03-27 Lucent Technologies Inc. Inter-domain network management system for multi-layer networks
US8280835B2 (en) * 2009-01-29 2012-10-02 Telcordia Technologies, Inc. Method for automated distributed diagnostics for networks
US8464279B2 (en) * 2009-12-18 2013-06-11 Hewlett-Packard Development Company, L.P. Domain event correlation
KR20150015457A (ko) * 2012-05-09 2015-02-10 엘지전자 주식회사 무선 통신 시스템에서 측정 결과 및 위치 정보간 상관성 유효 평가 방법과 이를 지원하는 장치
CN104168132B (zh) * 2014-06-18 2017-12-12 华为技术有限公司 故障诊断方法、设备和系统
US20160072688A1 (en) * 2014-09-08 2016-03-10 Mayank DESAI Fault monitoring in multi-domain networks
CN105634714A (zh) * 2014-10-28 2016-06-01 中兴通讯股份有限公司 一种跨域时钟同步方法、装置和系统
CN104468191A (zh) * 2014-11-05 2015-03-25 国家电网公司 基于时间窗和网络模型的电力通信故障预警方法及系统
CN106302153B (zh) * 2015-05-11 2020-02-07 中兴通讯股份有限公司 多域控制器、单域控制器、软件定义光网络系统及方法
CN107925585B (zh) * 2015-08-31 2020-07-21 华为技术有限公司 一种网络服务的故障处理方法及装置
CN105577456A (zh) * 2016-03-09 2016-05-11 浪潮通信信息系统有限公司 一种解决单域和跨域问题的网络拓扑配置展示方法
CN106789194B (zh) * 2016-12-02 2019-12-03 国网安徽省电力公司信息通信分公司 跨专业协同的电力通信业务故障自动诊断定位方法
US11102053B2 (en) * 2017-12-05 2021-08-24 Cisco Technology, Inc. Cross-domain assurance
US10924329B2 (en) * 2019-01-18 2021-02-16 Vmware, Inc. Self-healing Telco network function virtualization cloud
US10887156B2 (en) * 2019-01-18 2021-01-05 Vmware, Inc. Self-healing Telco network function virtualization cloud
US11177998B2 (en) * 2019-09-25 2021-11-16 International Business Machines Corporation Cross domain topology from machine learning
US11929917B2 (en) * 2021-07-30 2024-03-12 Cisco Technology, Inc. Systems and methods for determining problematic paths between interest points in a multi-cloud environment

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7062642B1 (en) * 2000-05-20 2006-06-13 Ciena Corporation Policy based provisioning of network device resources
CN101715149A (zh) * 2009-07-21 2010-05-26 北京邮电大学 一种多层多域分布式光网络并行跨域故障恢复方法和装置
CN105264836A (zh) * 2013-06-29 2016-01-20 华为技术有限公司 一种多域网络保护方法、系统和节点
WO2015176603A1 (zh) * 2014-05-23 2015-11-26 华为技术有限公司 网络故障定位方法和装置
US9742788B2 (en) * 2015-04-09 2017-08-22 Accenture Global Services Limited Event correlation across heterogeneous operations
CN106452817A (zh) * 2015-08-12 2017-02-22 中国电信股份有限公司 保护配置管理方法和系统
CN108322320A (zh) * 2017-01-18 2018-07-24 华为技术有限公司 业务生存性分析方法及装置
CN106982136A (zh) * 2017-03-07 2017-07-25 西安电子科技大学 一种多域分层的多域物联网平台及多域管理方法
CN110048944A (zh) * 2018-01-17 2019-07-23 中兴通讯股份有限公司 端到端重路由的方法及装置
WO2019141211A1 (zh) * 2018-01-17 2019-07-25 中兴通讯股份有限公司 端到端重路由的方法及装置
CN109495322A (zh) * 2018-12-25 2019-03-19 华为技术有限公司 网络故障定位方法、相关设备及计算机存储介质
CN111669282A (zh) * 2019-03-08 2020-09-15 华为技术有限公司 识别疑似根因告警的方法、装置及计算机存储介质
CN109842527A (zh) * 2019-03-19 2019-06-04 中国联合网络通信集团有限公司 一种网络告警方法以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
利用大数据分析技术的智能化网络故障诊断系统;朱永庆;黄新宇;唐宏;陈江山;程康;包德伟;;电讯技术(第10期);全文 *

Also Published As

Publication number Publication date
WO2022105675A1 (zh) 2022-05-27
EP4236234A1 (en) 2023-08-30
EP4236234A4 (en) 2024-04-03
US20230291640A1 (en) 2023-09-14
CN117041012A (zh) 2023-11-10
CN114520760A (zh) 2022-05-20
US11909581B2 (en) 2024-02-20

Similar Documents

Publication Publication Date Title
CN114520760B (zh) 一种跨域故障分析的方法及系统
US10142203B2 (en) Ethernet fault management systems and methods
US10623293B2 (en) Systems and methods for dynamic operations, administration, and management
US8347143B2 (en) Facilitating event management and analysis within a communications environment
WO2016119436A1 (zh) 告警处理方法、装置及控制器
US6941362B2 (en) Root cause analysis in a distributed network management architecture
US6694364B1 (en) System and method for suppressing out-of-order side-effect alarms in heterogeneous integrated wide area data and telecommunication networks
US20100128611A1 (en) Transmitting apparatus, alarm control method, and computer product
US20060230309A1 (en) System for remote fault management in a wireless network
CN113973042B (zh) 用于网络问题的根本原因分析的方法和系统
US20090003238A1 (en) Node Merging Process for Network Topology Representation
US20190155632A1 (en) Self-managed virtual networks and services
US20140337668A1 (en) Method And Apparatus For Coordinating Fault Recovery Techniques Among Domains
CN114766089A (zh) 基线化来自服务的子服务的服务标记数据以改进服务保证
CN111835579B (zh) 一种网络流量调度仿真有效性的测试方法及系统
US6748432B1 (en) System and method for suppressing side-effect alarms in heterogenoeus integrated wide area data and telecommunication networks
CN105897580B (zh) 一种协议无关转发网络快速故障检测与流量保护切换方法
EP2566103B1 (en) Apparatus and method for correlating faults in an information carrying network
US20160197810A1 (en) Synthetic loss measurements using session numbers
Tcholtchev et al. Autonomic fault-management and resilience from the perspective of the network operation personnel
CN109964450B (zh) 一种确定共享风险链路组的方法及装置
CN107005440A (zh) 一种链路故障定位的方法、装置及系统
EP3355530B1 (en) Method and apparatus for processing service failure
US20180287855A1 (en) Network Incident Identification Based On Characterizing Relationships Between Interfaces And Events As Graphical Component Relationships
US20190207805A1 (en) Node fault isolation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant