CN101027872A - 用于自动故障修复的通信网络管理系统 - Google Patents

用于自动故障修复的通信网络管理系统 Download PDF

Info

Publication number
CN101027872A
CN101027872A CNA2005800323261A CN200580032326A CN101027872A CN 101027872 A CN101027872 A CN 101027872A CN A2005800323261 A CNA2005800323261 A CN A2005800323261A CN 200580032326 A CN200580032326 A CN 200580032326A CN 101027872 A CN101027872 A CN 101027872A
Authority
CN
China
Prior art keywords
module
diagnostic result
fault
communication network
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800323261A
Other languages
English (en)
Inventor
E·马里利
O·马蒂诺
M·A·赛义迪
S·斯奎丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Original Assignee
Alcatel Lucent SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel Lucent SAS filed Critical Alcatel Lucent SAS
Publication of CN101027872A publication Critical patent/CN101027872A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种用于通信网络(N)的管理系统(NMS),其包括能够基于由网络单元(N1、N2、N3、N4)提供的信息(A)确定诊断结果(D)的诊断模块(MD),所述诊断结果标识了网络内的故障。所述管理系统还包括修复模块(MR),用于至少基于所述诊断结果来确定一个或几个纠正动作,并且将对应于所述纠正动作的一个或几个命令(C)发送到一个或几个网络单元,以纠正所述故障。

Description

用于自动故障修复的通信网络管理系统
技术领域
本发明涉及通信网络,并且特别(但不只)适用于面向分组的通信网络。其更具体地涉及通信网络的管理。
背景技术
已知网络管理系统(NMS)可以关联于通信网络,其目的在于从网络设备收集告警,特别使用相关方法对这些告警进行总结,以及将该总结或这些告警显示给操作员,以便操作员可以在该设备的一个或几个部件出现故障的情况下实现纠正动作。“故障”这一概念必须以非常一般的意义来理解,其意味着任意类型的硬件或软件故障。因此,网络单元的错误配置可以被看作故障(软件),这与IP路由器选路表中的错误或已被意外关闭的端口一样。
网络管理系统还可以用于配置网络设备。操作员可以使用人机接口输入新的参数,并且网络管理系统将这些新的参数应用于设备。这样,操作员可以反应于告警显示而纠正网络故障。
这种集中式分析取决于从通信系统中的许多单元收集大量数据和告警。这些单元在IP(互联网协议)通信网络的框架内可能是例如路由器的设备,但它在所谓的NGN(下一代网络)中可能还涉及语音和光交换机、PABX(专用小交换机)和媒体网关等。网络单元也可以构成所述设备的一部分,例如卡。
由于网络的单元之间的许多交互,单一故障可能生成大量告警。因此,设备部件中的卡上的故障可能从连接到该卡上的端口之一的另一设备中的所有卡中、并且由其中发生故障的设备中的卡来生成告警。
因此,对于操作员来说难以确定在大量生成的告警之中哪个是真正的故障,并且甚至更加难以确定要采取的纠正动作。
由于诊断系统而取得了进展,该诊断系统使用大量告警来确定最可能的原因。
这些诊断系统是基于例如规则集,例如基于由llog公司推出的llogRulesTM产品的那些规则集。它们可以还基于神经网络、贝叶斯(Bayesian)网络、专家系统或者特别是人工智能的其他技术。
值得一提的一些产品如Agilent公司的“用于数据通信的故障检测(FDDC)”、Hewlett-Packard的“网络节点管理器”和“网络节点管理器延伸拓扑”产品,以及Cisco公司的“输出解释程序”和“故障排除助理”(TAC)产品。
然而,在使用这些工具时,操作员必须采取关于每个故障的动作来确定要采取的纠正动作并触发它们。他因而需要使用网络管理系统来重配置网络或手动连接到设备的一个或几个部件并且发送合适的CLI(命令行接口)命令。
尽管该任务可以借助于现有技术的诊断系统,但其仍然是困难的,并且因此是昂贵的且容易出现错误。
实际上,重配置和手动连接到设备的阶段是漫长且乏味的。容易在CLI命令的参数中出错,并且因而引起另一网络故障。
对于纠正动作的确定阶段对于操作员来说是困难的,因为如果他希望动作是最佳的,则他需要考虑网络性能信息和其他参数。
这些任务由于增加的网络复杂度、可用设备类型的数量及其复杂度而变得更加困难和昂贵。
用于自动化根据诊断确定对通信网络设备的配置的解决方案是可用的。所述解决方案例如在以下文章中有所描述:Mercedes Garijo、AndresCancer和Julio J.Sanchez所著的、在1996年4月22日的关于智能代理和多代理技术的实际应用的国际会议的会议录中发表的“A MultiagentSystem for Cooperative Network-Fault Management”,以及Jiann-LiangChen和Pei-Hwa Huang所著的、在1996年10月的关于系统、人和控制论的北京IEEE国际会议中发表的“A Fuzzy Expert System for NetworkFault Management”。
然而,这些系统不包括任何用于检查纠正动作已实际纠正了检测到的问题的装置。此外,在使用这些系统时,不能够确定这些纠正动作不会使情况恶化。该问题在这些文献中甚至未被提及。
发明内容
本发明的目的是自动化被管理通信网络中的故障纠正,同时确保纠正检测到的问题或至少改进电信网络的总体情况。
为此,本发明的第一目的是一种用于管理通信网络的系统,该系统包括能够利用由所述通信网络中的单元提供的信息来确定诊断结果的诊断模块。所述诊断结果标识了所述通信网络中的故障。所述管理系统的特征在于,它还包括修复模块用于:
-基于从所述诊断模块接收的诊断结果确定一个或几个纠正动作;
-向所述通信网络中的一个或几个单元发送对应于所述纠正动作的一个或几个命令,以纠正所述故障;
-向所述诊断模块发送诊断请求,以开始所述诊断模块对新诊断结果的确定。
根据本发明的实施例,所述管理系统可以分别地或组合地包括以下特征:
-迭代计数器在每次开始新的诊断时增加,并且所述管理系统在所述迭代计数器已达到预定阈值时停止诊断和修复模块;
-所述命令通过中介(mediation)模块被发送,其中所述中介模块能够将以通用语言而制定的命令转换为专用于通信网络中不同设备的命令语言的特定命令;
-所述修复模块被安排用于在纠正动作不能令人满意地被确定以纠正故障的情况下,与业务优化模块通信,从而消除或限制该故障对通信网络运转(behavior)的影响;
-所述诊断模块使用贝叶斯网络来确定诊断结果;
-所述诊断结果至少包含对故障的描述、故障的位置以及可能地对关联于该诊断结果的概率的估计;
-所述诊断模块向所述修复模块发送包含所述诊断结果的符合SNMP协议的消息;
-所述修复模块具有修复规则库;
-所述规则可能取决于迭代计数器;
-所述修复模块具有在每次迭代中所确定的纠正动作和诊断结果的历史记录,并如果在达到所述阈值时所述诊断结果不如它对于给定迭代那样正确,则能够将所述通信网络退回到其对于该给定迭代的状态。
本发明的第二目的是一种用于管理通信网络方法,该方法包括基于由所述通信网路的单元提供的信息来确定诊断结果的第一步骤。所述方法的特征在于,该方法在所述诊断结果标识了故障的情况下还包括第二步骤,即,至少基于所述诊断结果确定一个或几个纠正动作,以及向所述通信系统的一个或几个单元发送对应于所述纠正动作的一个或几个命令(C)以纠正所述故障;所述第一步骤在所述第二步骤结束时自动开始以形成处理循环。
根据本发明的实施例,所述管理方法可以分别地或组合地包括以下特征:
-迭代计数器在每次触发新的诊断时增加,当该迭代计数器已达到预定阈值时中断所述处理循环;
-所述命令通过中介模块被发送,该中介模块能够将以通用语言而制定的命令转换为符合专用于通信网络中不同设备的命令语言的特定命令;
-如果纠正动作不能被确定以纠正故障,则命令可以被发送到业务优化模块,以消除或限制该故障对所述通信网络运转的影响;
-所述第一步骤使用贝叶斯网络来确定诊断结果;
-所述诊断结果至少包含对故障的描述、故障的位置以及可能地对关联于所述诊断结果的概率的估计;
-构建在每次迭代中所确定的纠正动作和诊断结果的历史记录,并且如果在达到阈值时所述诊断结果不如它对于早期迭代那样正确,则恢复对于该早期迭代的通信网络状态。
因此,根据本发明,所述修复模块可以自动修复通信故障,和/或采取纠正动作来限制故障的后果以及特别是其对通信网络上建立的SLA(服务级协议)的影响,或者其可以在操作员确认后半自动地进行这些修复。
在纠正之后,所述诊断模块被要求进行新的诊断,以确保该修复未生成新的故障,并且如果其生成了新的故障则再纠正它们。处理循环可以由此被实现,其必须收敛以修复所诊断的故障。
阈值针对循环中迭代的次数可以是不变的,以防止过长的修复循环。
附图说明
在阅读下面参考附图的描述后,本发明及其特征和优点将变得更清楚。
-图1概略示出了根据本发明的管理系统;
-图2示出了根据本发明实施例的修复模块的内部结构;
-图3示出了根据本发明方法的步骤链。
附图不仅在不限制本发明的情况下完善了本发明的说明书,而且在一些情况下还有助于定义本发明。
具体实施方式
根据本发明,所述网络管理系统包括两个主要模块,即首先是诊断模块MD,其次是修复模块MR。
所述诊断模块的输入包括用户投诉CC和来自网络的信息A。用户投诉可以由网络性能或网络上使用的服务的降级而引发。当接收到所述投诉时,所述诊断系统MD可以触发诊断搜索,以确定导致该投诉的技术原因。它然后可以利用从网络单元输出的信息。
诊断搜索还可以通过从通信网络的各个单元输出的信息而被触发(也就是说与用户投诉的出现无关)。
从网络单元输出的信息可以有以下两种主要类型:
-告警,即由网络单元向所述网络管理系统发送的异步通知。当所述单元检测到异常时、测量值达到预定阈值时、或更一般地当出现配置应当针对其而触发告警的任意类型的事件时,发送这些告警。因此,这些告警可以指示软件或硬件的故障。
-它还可能涉及未被通知给网络管理系统NMS但该NMS必须在管理信息库(MIB)中找到的配置或性能数据。
-它还可能被要求建立有源测试、有源或无源测量,并且特别是端到端测量。
特别地,当接收到告警时,诊断模块MD可以确定这些告警代表故障或可能的故障。在所述确定之后,它然后触发对诊断结果的确定,也就是说搜索故障。
如上面所提到的,当故障发生时,它可能引发不仅源自故障网络单元而且源自“相邻”网络单元的告警。对诊断结果的确定包括基于源自多个网络单元的这个告警集合来标识故障网络单元(故障排除)和故障类型(故障名称)。通常,诊断结果是不确定的,并且诊断模块MD因而将提供最可能的诊断结果D,即将概率值与其关联。它还可以提供几个诊断结果的列表,每个都关联于一个概率值,并且每个都标识了通信网络N中的故障。
所述诊断模块可以是现有技术公知的模块。如上所述,多种不同的技术可以被使用:神经网络、专家系统、基于规则的系统等。上面提到的商业产品可以被使用。
诊断模块MD必须优选地遵循两个准则:
-它必须是“主动的”,换句话说,诊断搜索可以不是通过从通信网络接收告警而被触发。特别地,必须可以通过外部事件来触发该搜索,该外部事件可能是用户投诉CC或随后将描述的由修复模块MR发送的诊断请求(CD)。
-必须可以提供最可能的诊断结果,并且如果可能,将概率与其关联。
优选地,这个诊断模块使用贝叶斯网络,并且类似于由Alcatel公司开发的“5530-网络分析器”产品。于是,实现这个模块的操作在“5530”产品的技术文献中被描述。贝叶斯网络技术及其在诊断结果确定中的应用例如在1996年由F.Jensen所著、UCL出版的“An introduction toBayyesian Networks”一书中被描述,或在2004年3月关于网络的第三届国际会议上由Gerard Delegue、Stephane Betge-Brezetz、EmmanuelMarilly和Olivier Martinot所著的“IP VPN Network Diagnosis:Technologies and Perspectives”一文中被描述。
贝叶斯网络原理使用概率理论,该概率理论定义了规则以通过考虑附加的证据和背景信息元素而提炼假设,并且由此导出代表该假设为真的可能性的数值。
因此,贝叶斯图定义了要采取的关联于概率和成本的所有测试动作,所述成本例如是被用于定义哪些测试比其他测试需要更多时间的成本。
图3示出了贝叶斯图的非常简化的例子。其示出,“LossPacket”实体取决于其他几个实体,“HighCPUUtilization”比率,“InterfaceINStatus”(接口输入状态),“InterfaceOutStatus”(接口输出状态)。
因此,该模块使所述系统首先能够代表因果链并且因此指示它要执行的测试,以及其次对于每个可能的诊断结果计算概率值并确定最可能的诊断结果。
实际上,贝叶斯图明显更复杂,并且可能包括几个层级。此外,许多图对于建模网络单元是必需的。
一旦诊断结果D已被确定,它就被以一个或几个消息的形式发送到修复模块MR。例如,这些消息可能符合由IETF(互联网工程任务组)在RFC 1157和1592中分别针对版本1和2定义的SNMP(简单网络管理协议)协议。
它可能是单个SNMP消息(或“陷阱(trap)”)或几个消息。如果使用几个消息,则它们必须被清楚地定义以便修复模块MR可以容易地确定其关于同一诊断结果D。根据一个实施例,第一消息包含关于诊断结果的一般信息,而随后的消息包含详细信息。例如,如果诊断结果涉及LSP(标记交换点,Label Switching Point),则第一消息可能包含关于该LSP本身的诊断信息,而随后的消息包含关于该LSP经过的设备(或路由器)的信息。
可以利用随后将说明的票据(ticket)而作出这个确定:传输同一诊断结果D的所有SNMP消息具有同一票据。
然而,其他实施例也是可能的,特别地,所述两个模块可以通过如由微软公司的OMG(开放管理组)或COM/DCOM定义的CORBA(公共对象请求代理体系结构)型的软件总线来进行通信。
该消息D必须优选地包含以下信息:
-所诊断的故障的标题。例如,“接口关闭”、“错误的BGP配置”(边界网关协议)等。
-故障位置,换句话说,相关的卡、接口、虚拟专用网(VPN)、网络单元的标识符,等等。
-概率值,其确定必须考虑所建立的诊断结果的置信级别。
-票据,换句话说,标识了用于正确诊断给定问题的的搜索会话的数值。如上面所提到的,如果一些诊断结果通过几个消息来传输,则这些消息中的每一个都具有相同的票据,这特别因为信息量太大。
-迭代数目,其标识了对于给定票据进行诊断搜索的次数。随后将看到,问题可能创建诊断模块MD和修复模块MR之间的循环,以使得可能必需几个迭代来解决所述问题。
下表给出了基于SNMP协议的实现的情况下的“SNMP陷阱”的例子:
  SNMP“陷阱”字段名 描述 OID(SNMP对象标识符)   ASN1类型     应用格式
  故障类型 SNMP告警描述;针对其生成SNMP“陷阱”的故障的描述 1.3.6.1.4.1.637.4.1   字符串     字符串
  位置 VPN ID 1.3.6.1.4.1.637.4.2.1   字符串     字符串
  LSP LSP ID;LSP标识符 1.3.6.1.4.1.637.4.2.2   字符串     整型
  路由器 路由器ID;路由器IP地址 1.3.6.1.4.1.637.4.2.3   字符串     字符串
  接口 索引接口,SNMP索引接口 1.3.6.1.4.1.637.4.2.4   字符串     整型
  票据 票据ID;标识故障的唯一票据 1.3.6.1.4.1.637.4.3   字符串     整型
  可靠性 诊断结果的概率 1.3.6.1.4.1.637.4.4   字符串     浮点型
  迭代 诊断循环中的迭代 1.3.6.1.4.1.637.4.5   字符串     整型
  诊断情景 诊断情景描述 1.3.6.1.4.1.637.1.6   字符串     字符串
这些OID文件(SNMP对象标识符)由三部分组成:左部分(1.3.6.1.4.637.)对应于Alcatel标识符,下一部分(4.)对应于应用(即诊断模块MD),以及最后一部分对应于专用于“SNMP陷阱”中字段的属性。
当接收到包含诊断结果D的消息时,修复模块D尝试确定一个或几个纠正动作。
图2示出了修复模块MR的一种可能的功能结构。由于该结构是功能上的,因此不同的实施例是可能的。根据该实施例,修复模块MR包括主模块MP、人机接口IHM、数据库B和配置模块MC。
诊断结果D由主模块MP接收,其目的是确定纠正动作并将对应于这些纠正动作的命令发送到中介模块MED或直接发送到图中未示出的网络单元。
因此,根据诊断结果D以及包含于该诊断结果中且先前已经了解的信息来作出所述确定。然而,它还可以取决于其他信息,例如:
-内部逻辑,换句话说,用于基于至少一个诊断结果确定以指定语言的纠正动作的策略的形式定义。该内部逻辑被存储在数据库B中。
-由用户特别使用IHM接口和配置模块MC所确定的、被存储在数据库B中(或者可能在另一分离的数据库中)的参数。
-由用户特别响应于主模块MP产生的建议、在诊断结果产生期间通过IHM接口发送的信息。
根据本发明的优选实施例,所述内部逻辑形式上是以一组规则的形式而被定义的。
这些规则被用于将接收自诊断模块MD的诊断结果D关联于纠正动作。它们可以是通过配置模块MC和IHM接口到数据库B中的输入。
这些规则可以典型地用以下形式表示:
如果前提则动作
其中,“前提”是为触发动作所必须满足的条件的列表。该列表可能包含几个彼此共轭(用AND逻辑运算子)或非共轭(用OR逻辑运算子)相关的条件。
例如,所述规则可以如下写出:
-如果(路由器=Alcatel/192.128.12.52,接口=FastEthernet1/0)&&((迭代=1)<3)&&(故障=INTERFACE_DOWN)则(执行纠正动作2)。
-如果(路由器=Alcatel/192.128.12.52,接口=FastEthernet1/0)&&((迭代=1)<3)&&(故障==BGP_MISCONFIGURATION)则(执行纠正动作3)。
-(纠正动作2)=启动(路由器=Cisco/192.128.12.52,接口=FastEthernet1/0)接口。
-(纠正动作3)=用BGP_Configuration_Script_1配置(路由器=Alcatel/192.128.12.52,接口=FastEthernet1/0)。
指示符可以关联于这些规则的形式定义,或在关联于这些规则的参数中,以指明纠正动作是否可以可能地通过中介模块MED被直接发送到通信网络单元,或者操作员是否必须验证它们。如果操作员必须验证它们,则纠正动作被发送到人机接口IHM以显示在屏幕上。这些指示符可以利用配置模块MC而被存储在数据库B中,其中操作员可以通过人机接口IHM到达配置模块MC。
除了这些纠正动作,其他信息可以被显示以帮助操作员进行判决,特别是与诊断模块MD所发送的诊断结果D有关的信息。
操作员因而可以在修复模块向网络单元发送命令C之前验证来自修复模块MR的建议。
在可能存在几个纠正动作的情况下,IHM接口可以将它们显示在屏幕上,并且用户因而可以选择他认为最合适的。修复模块MR然后向通信网络中的单元发送对应于操作员所选择的纠正动作的命令C。
除基于规则的优选实施例外的实施例也是可能的。
例如,可以使用贝叶斯网络或神经网络。使用神经网络的优点是其学习能力和其在不确定情况下运行的能力。例如,即使丢失了一定量的信息,它们也能够对最可能的故障应用最可能的纠正动作。然而,该应用的问题在于网络操作员理解这种技术时的困难。
如上面所提到的,命令C可以通过中介模块MED被发送到通信网络N中的单元。该中介模块的目的是将由修复模块MR用通用语言制定的命令C转换为符合专用于通信网络中不同设备的命令语言的特定命令C1、C2
因此,在图1中,设备N1和N2可以是不同的类型,例如IP路由器和媒体网关,从而将该通信网络N连接到未示出的另一网络。它可以还是相似类型但由不同供应商制造的设备。同时在这两种情况下,用于配置它们的命令必须适合于所述设备所理解的命令语言。因此,单个通用命令C(例如“打开接口”)将导致用于两种类型的设备N1和N2的不同指定命令,这些指定命令中每一个都符合专用于所述设备以及特别是其CLI(命令行接口)接口的语言。
不同产品和技术可以被用于制造该中介模块MED。
特别地,可以使用基于策略规则的管理结构(PBM,代表“基于策略的管理”)。例如,标题为“Deployment of rules by a service managementdevice as a function of information on network equipment”的专利申请EP1335524和标题为“Rule-based network management system comprisingan inference motor”的EP1387526描述了所述结构。
因此,通过对纠正动作的确定,根据本发明的修复模块MR可以自动化通信网络的修复,或者在要求操作员动作的情况下半自动化通信网络的修复。
然而,通信网络的复杂度使得实际上不可能完全控制纠正动作的影响。首先,修复可能在解决问题时无效(例如由于诊断结果不正确,或者还由于纠正动作不完全恰当),以及其次,还有可能故障的实际修复生成新的故障。例如,在修复第一故障时,允许业务传输到先前被隔离的网络单元,并且在这样做时,故障可能在这些网络单元之中被标识。
因此,本申请已考虑了最小化对通信网络的不适当或不期望的影响的附加技术问题。为此,在向所述通信网络中的单元发送命令C之后,诊断请求CD被发送到诊断模块MD,以便该诊断模块可以确定新的诊断结果。
该诊断请求CD可能包含票据的值,以便该新的诊断结果(和任何之后的诊断结果)涉及由同一票据确定的会话中的第一诊断结果。
由于这种至诊断模块MD的回送,所述诊断模块可以检验故障的纠正并且检测是否会发生新的故障。它然后可以通过修复模块MR触发新的修复,等等。因此,本发明的这个优选实施例可以被用于产生循环以控制在被管理通信网络上所采取的动作。
然而,这个实施例可能导致创建无限循环的附加问题,换句话说,每个修复将循环地生成新的故障。
迭代计数器可以被用于防止这些无限循环。例如,该迭代计数器在每次触发新的诊断时增加。当该迭代计数器达到给定的预定阈值时,循环终止并且系统可以通过IHM接口通知操作员未找到任何解决方案。
类似地,对于本领域的技术人员,所述计数器可以被初始化为该阈值的值,并且在每次触发新的诊断时减少。停止准则因而是该迭代计数器经过零。
根据本发明的一个实施例,该迭代计数器可能影响所述修复模块的内部逻辑。例如,在该内部逻辑是以一组规则的形式被实现的情况下,这些规则可能取决于迭代计数器的值。
操作员可以根据他设定的约束来配置这些相关性。例如,关于不重要的LSP,操作员可以关联较高的迭代阈值(特别由于所产生的成本低于触发业务优化模块的成本,如将在后文描述的那样)。对于其中存在恶化严重的LSA的重要的LSP,迭代阈值可能非常低,并且操作员的主要目的是即使已经触发业务优化模块也要维持服务。
最终,如果诊断结果涉及关于所述通信网络的、比在给定时刻更严重的问题,则可以采用反向跟踪机制以返回该网络配置。为此,所述修复模块包含所接收的诊断结果和所发送的纠正动作和/或命令的历史记录。如果达到阈值时新的诊断结果比早期迭代时更糟糕,则所述修复模块可以使用该历史记录来使得网络退回到对应于该迭代的状态。必须发送反命令以恢复这个早期情况。
如果故障不能被真正解决,则该实施例实现了改进网络状态的折衷。
在所述反向跟踪之后,消息通过人机接口IHM被发送给操作员,以通知他问题还未被解决以及网络状况。
根据另一实施例,如果所述诊断模块不能解决问题,则可以使用业务工程TE(Traffic Engineering)优化模块。该业务优化模块的目的是重定向业务,以避免问题而非真正地解决该问题。因此,如果路由器内的问题不能被解决(例如硬件问题),则所述TE模块可以修改其他路由器上的选路表、经过该路由器的LSP等,以便不再将业务发送到该路由器。因此,即使正讨论的设备仍然不起作用,网络运转也可以变得完全可行。
总之,标识故障的诊断结果可以具有以下四个结论之一:其被修复,其未被修复而操作员被通知,不存在任何修复但触发业务优化工具,修复模块MR利用反向跟踪功能将网络退回到“较不”严重的状态并且通知操作员。
图3概略示出了根据本发明方法的步骤的执行。
第一个“Diag”步骤包括触发对诊断结果的确定。该步骤特别在接收到通信网络中的告警或用户投诉后被触发。
所述系统然后确定所述诊断结果是否标识了故障(框“P?”)。如果不存在任何故障(框“F1”)则所述方法停止。
如果存在故障,则所述方法包括确定某个停止准则(“Stop?”)。目的是确定迭代次数是否已达到预定阈值,或者所述诊断结果是否对应于先前在早期迭代期间产生的诊断结果。如果这些停止准则被满足,则所述系统停止(框“F2”)。
如果不是这样,则所述方法使用“Rep”步骤,该步骤包括确定纠正动作并向通信网络发送关联于这些纠正动作的命令。
在本发明的一个优选实施例中,新的“Diag”诊断步骤然后被触发,并且所述方法然后经过上面描述的不同步骤和测试。
所述方法因而形成处理循环,通过解决“P?”测试期间的故障或满足“Stop?”测试期间的停止准则而终止该处理循环。
在读过下面三个指定实例后,本发明和不同步骤的链将变得更加清楚。
在这些实例的每一个中,通过从通信网络接收告警或通过用户投诉而使得所述诊断模块开始操作。
在第一实例中,用户投诉CC或接收自通信网络的告警A已表明了该网络内的问题。第一诊断结果揭示,路由器Y的接口X关闭。诊断模块MD利用票据值和迭代值1而将该诊断结果发送到所述修复模块。
修复模块MR然后确定关联于该诊断结果的纠正动作。在该例子中,纠正动作是使得接口X开始服务(“启动”)。关联于该纠正动作的通用命令被发送到中介模块MED,其确定以专用于路由器Y的语言的合适的命令。
修复模块MR将指定同一票据值的诊断请求CD发送到诊断模块MD。
诊断模块MD重复对通信网络的诊断,并且确定路由器Y的接口X现在是开启的并且网络运转正常。它然后可以将诊断结果D发送到所述修复模块,以通知网络运转正常。由于问题已经解决,修复模块MR并不触发任何动作并且根据本发明的方法终止。
在第二实例中,所述诊断模块也确定路由器Y的接口X关闭。以与第一实例中相同的方式,利用票据将诊断结果D发送到所述修复模块,并且该修复模块MR确定纠正动作。关联于该纠正动作的通用命令被发送到中介模块MED,该中介模块将它转换为符合路由器Y的特定语言的命令。
修复模块MR利用相同票据将诊断请求CD发送到诊断模块MD。诊断模块MD开始新的诊断确定。新的诊断结果D确定路由器Y的接口X仍然关闭。利用相同票据和等于2的迭代值将该诊断结果D发送到修复模块MR。
修复模块MR可以观测到,尽管迭代等于2,但问题仍然一样。它然后可以决定向业务优化模块TE(业务工程)发送命令。
该业务工程模块TE然后可以修改所述通信网络中的现有路径,以使它们避开路由器Y的接口X。这样,尽管正讨论的接口是关闭的,所述通信网络也能够正常运转。
在第三实例中,诊断模块MD也确定路由器Y的接口X关闭。利用票据数值和等于1的迭代值将诊断结果D发送到所述修复模块。
如上所述,所述修复模块确定要发送到中介模块MED的通用命令,该中介模块MED将它转换为符合专用于路由器Y的语言的命令,以使得接口X开始服务(“启动”)。
修复模块MR利用相同的票据数值将诊断请求CD发送到诊断模块MD。
所述诊断模块然后触发新的诊断确定,并且新的问题被发现,例如错误的BGP(边界网关协议)配置。利用等于2的迭代数和相同票据值将该诊断结果D发送到所述修复模块。
修复模块MR然后确定合适的纠正动作,所述纠正动作在该情况下是重配置BGP协议。通用命令然后被发送到将它们转换为特定命令的中介模块MED。
再次,修复模块MR向诊断模块MD发送指定同一票据数值的诊断请求CD。新的诊断结果D表明,路由器Y的同一接口X是关闭的。利用等于3的迭代值和相同票据值将该诊断结果D发送到修复模块MR。
所述修复模块可以观测到,迭代值等于3并且诊断结果与迭代1时相同。它因而可以确定它不能够解决该问题,并且向人机接口IHM发送致使显示消息的命令,该消息表示了该无能力和关于诊断结果的信息。
这些实例说明了本发明的不同操作模式,并且特别地,可以通过配置规则数据库B而使得根据本发明的修复模块MR不同地运转,例如通知操作员、触发业务优化模块、触发修复命令等。

Claims (17)

1.一种用于通信网络(N)的管理系统(NMS),其包括能够基于由所述通信网络的单元(N1、N2、N3、N4)提供的信息(A)而确定诊断结果(D)的诊断模块(MD),所述诊断结果标识了所述通信网络内的故障,所述系统的特征在于,其还包括修复模块(MR)用于:至少基于接收自所述诊断模块MD的所述诊断结果确定一个或几个纠正动作;将对应于所述纠正动作的一个或几个命令(C)发送到所述通信网络的一个或几个单元以修正所述故障;以及向所述诊断模块(MD)发送诊断请求(CD)以触发所述诊断模块对新的诊断结果的确定。
2.根据前一权利要求的管理系统,其中,迭代计数器在每次触发新的诊断时增加,所述管理系统在所述迭代计数器已达到预定阈值时停止诊断和修复模块。
3.根据前述任一权利要求的管理系统,其中,所述命令是通过中介模块(MED)被发送的,所述中介模块能够将以通用语言而制定的所述命令转换为符合专用于所述通信网络中不同设备的命令语言的特定命令(C1、C2)。
4.根据权利要求2或3之一的管理系统,其中,所述修复模块(MR)具有在每次迭代中确定的纠正动作和诊断结果的历史记录,并且如果在达到所述阈值时所述诊断结果不如它对于给定迭代那样正确,则能够将所述通信网络退回到它对于所述给定迭代的状态。
5.根据前述任一权利要求的管理系统,其中,所述修复模块用于在纠正动作不能令人满意地被确定以纠正所述故障的情况下与业务优化模块(TE)通信,从而消除或限制所述故障对所述通信网络运转的影响。
6.根据前述任一权利要求的管理系统,其中,所述诊断模块(MD)使用贝叶斯网络来确定所述诊断结果。
7.根据前述任一权利要求的管理系统,其中,所述诊断结果(D)至少包含对所述故障的描述、所述故障的位置和可能地对关联于所述诊断结果的概率的估计。
8.根据前述任一权利要求的管理系统,其中,所述诊断模块利用符合SNMP协议的消息将所述诊断结果传送到所述修复模块。
9.根据前述任一权利要求的管理系统,其中,所述修复模块具有修复规则库。
10.根据前一权利要求和权利要求2的管理系统,其中,所述规则可能取决于所述迭代计数器。
11.一种通信网络(N)的管理方法,该方法包括第一步骤:即基于由所述通信网络的单元(N1、N2、N3、N4)提供的信息(A)来确定诊断结果(D),其特征在于,该方法还包括第二步骤:即如果所述诊断结果标识了故障,则至少基于所述诊断结果确定一个或几个纠正动作,以及将对应于所述纠正动作的一个或几个命令(C)传送到所述通信网络的一个或几个单元,从而纠正所述故障,其特征还在于,所述第一步骤在所述第二步骤结束时被自动触发以形成处理循环。
12.根据前一权利要求的方法,其中,迭代计数器在每次触发新的诊断时增加,所述处理循环在所述迭代计数器已达到预定阈值时停止。
13.根据前一权利要求的方法,其中,构造在每次迭代中所确定的纠正动作和诊断结果的历史记录,其中,如果所述诊断结果在达到所述阈值时不如它对于先前迭代那样正确,则将所述通信网络退回其对于所述先前迭代的状态。
14.根据权利要求11到13之一的方法,其中,所述命令通过中介模块(MED)被发送,所述中介模块(MED)能够将以通用语言而制定的所述命令转换为符合专用于所述通信网络中不同设备的命令语言的特定命令。
15.根据权利要求11到14之一的方法,其中,如果纠正动作不能令人满意地被确定以纠正所述故障,则命令可以被发送到业务优化模块(TE),从而消除或限制所述故障对所述通信网络运转的影响。
16.根据权利要求11到15之一的方法,其中,所述第一步骤使用贝叶斯网络来确定所述诊断结果。
17.根据权利要求11到16之一的方法,其中,所述诊断结果(D)至少包含对所述故障的描述、所述故障的位置以及可能地对关联于所述诊断结果的概率的估计。
CNA2005800323261A 2004-07-30 2005-07-01 用于自动故障修复的通信网络管理系统 Pending CN101027872A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0408505 2004-07-30
FR0408505A FR2873879B1 (fr) 2004-07-30 2004-07-30 Systeme de gestion de reseau de communication pour reparation automatique de pannes

Publications (1)

Publication Number Publication Date
CN101027872A true CN101027872A (zh) 2007-08-29

Family

ID=34947039

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800323261A Pending CN101027872A (zh) 2004-07-30 2005-07-01 用于自动故障修复的通信网络管理系统

Country Status (6)

Country Link
US (1) US8149718B2 (zh)
EP (1) EP1774705A1 (zh)
JP (1) JP2008508760A (zh)
CN (1) CN101027872A (zh)
FR (1) FR2873879B1 (zh)
WO (1) WO2006021702A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009082836A1 (fr) * 2007-12-26 2009-07-09 Zte Corporation Procédé et dispositif de traitement d'un dysfonctionnement
CN101801015A (zh) * 2009-02-06 2010-08-11 中兴通讯股份有限公司 一种小区退服故障的处理方法及装置
CN101459925B (zh) * 2007-12-11 2010-10-20 中国移动通信集团公司 电信网络投诉管理系统及方法
CN101924661A (zh) * 2009-06-17 2010-12-22 中兴通讯股份有限公司 告警的处理方法及装置
CN101197621B (zh) * 2007-12-07 2012-03-07 中兴通讯股份有限公司 一种对网管系统故障进行远程诊断定位的方法及其系统
CN101217696B (zh) * 2007-12-28 2012-09-05 中国移动通信集团浙江有限公司 一种移动用户投诉综合处理系统及其方法
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置
CN105262622A (zh) * 2015-10-27 2016-01-20 北京极科极客科技有限公司 一种路由器的优化和诊断的方法及系统
CN108540298A (zh) * 2017-03-01 2018-09-14 中兴通讯股份有限公司 一种自动处理垃圾业务的方法及装置
CN109491336A (zh) * 2017-09-13 2019-03-19 费希尔-罗斯蒙特系统公司 用于模块化控制系统的助理应用
CN110447206A (zh) * 2017-03-29 2019-11-12 凯迪迪爱通信技术有限公司 自动故障恢复系统、控制设备、程序创建设备及计算机可读存储介质

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536595B1 (en) * 2005-10-19 2009-05-19 At&T Intellectual Property, Ii, L.P. Systems, devices, and methods for initiating recovery
JP2007128437A (ja) * 2005-11-07 2007-05-24 Hitachi Ltd ディスクアレイ装置及びその経路障害検出方法
US20070106784A1 (en) * 2005-11-08 2007-05-10 Dickman David T Systems, methods and apparatus to identify network maintenance zones
JP4701148B2 (ja) * 2006-03-02 2011-06-15 アラクサラネットワークス株式会社 障害回復システム及びサーバ
US7788544B2 (en) * 2006-05-03 2010-08-31 Computer Associates Think, Inc. Autonomous system state tolerance adjustment for autonomous management systems
US8213321B2 (en) 2007-02-01 2012-07-03 Deere & Company Controller area network condition monitoring and bus health on in-vehicle communications networks
US8839325B2 (en) * 2007-02-14 2014-09-16 At&T Intellectual Property I, L.P. System and method of managing video content quality
US7995575B2 (en) * 2008-01-02 2011-08-09 Cisco Technology, Inc. Packet error handling
US8588225B1 (en) * 2008-07-07 2013-11-19 Cisco Technology, Inc. Physical resource to virtual service network mapping in a template based end-to-end service provisioning
US8190727B2 (en) * 2008-07-15 2012-05-29 Airbus Operations Gmbh Network management system for an aircraft
US7954010B2 (en) * 2008-12-12 2011-05-31 At&T Intellectual Property I, L.P. Methods and apparatus to detect an error condition in a communication network
CN102640154B (zh) 2009-07-30 2015-03-25 惠普开发有限公司 基于所接收的与网络实体相关联的事件来构造贝叶斯网络
US8825845B1 (en) * 2010-11-10 2014-09-02 Open Invention Network, Llc Managing a network element operating on a network
CN102325036B (zh) * 2011-05-17 2016-09-14 南京中兴软件有限责任公司 一种网络系统的故障诊断方法、系统及装置
US9160620B2 (en) * 2011-11-30 2015-10-13 GM Global Technology Operations LLC Integrated fault diagnosis and prognosis for in-vehicle communications
US9021310B1 (en) * 2012-02-14 2015-04-28 Amazon Technologies, Inc. Policy-driven automatic network fault remediation
CN103023699B (zh) * 2012-11-30 2016-12-21 北京奇虎科技有限公司 一种网络修复方法和系统
CN103001801B (zh) * 2012-11-30 2016-12-21 北京奇虎科技有限公司 网络修复方法和装置
US9071956B2 (en) * 2012-12-03 2015-06-30 Qualcomm Incorporated Systems and methods for dynamic enablement of wireless communication device functionalities
US20140351414A1 (en) * 2013-05-24 2014-11-27 Alcatel Lucent Systems And Methods For Providing Prediction-Based Dynamic Monitoring
US9578047B2 (en) * 2015-01-13 2017-02-21 GM Global Technology Operations LLC Method and system for reflectometry based communication network monitoring, intrusion detection, and message authentication
US9973441B2 (en) * 2015-11-07 2018-05-15 King Abdulaziz City Of Science And Technology (Kacst) Method and system for establishing routes in wireless ad-hoc networks utilizing Bayesian approach
US10355918B2 (en) * 2016-01-20 2019-07-16 Level 3 Communications, Llc System and method for automatically repairing a network element
US10162698B2 (en) * 2016-03-25 2018-12-25 Dropbox, Inc. System and method for automated issue remediation for information technology infrastructure
US10142185B2 (en) 2016-06-08 2018-11-27 At&T Intellectual Property I, L.P. Content quality assessment and prediction via flows
JP6718398B2 (ja) * 2017-02-15 2020-07-08 日本電信電話株式会社 サービス復旧装置およびサービス復旧方法
US10771331B2 (en) 2018-11-07 2020-09-08 Cisco Technology, Inc. Closed loop control for fixing network configuration issues to aid in device classification
CN111200827B (zh) * 2018-11-19 2023-03-21 华硕电脑股份有限公司 网络系统、无线网络延伸器以及网络供应端
CN109560970A (zh) * 2018-12-24 2019-04-02 大唐软件技术股份有限公司 一种网络故障愈合方法、装置以及系统
US10985969B2 (en) * 2019-02-19 2021-04-20 Juniper Networks, Inc. Systems and methods for a virtual network assistant
US11356321B2 (en) * 2019-05-20 2022-06-07 Samsung Electronics Co., Ltd. Methods and systems for recovery of network elements in a communication network
US11570038B2 (en) 2020-03-31 2023-01-31 Juniper Networks, Inc. Network system fault resolution via a machine learning model
US11314583B2 (en) 2020-08-18 2022-04-26 Micron Technology, Inc. Memory data correction using multiple error control operations
US11743151B2 (en) 2021-04-20 2023-08-29 Juniper Networks, Inc. Virtual network assistant having proactive analytics and correlation engine using unsupervised ML model
US11770290B2 (en) 2021-08-13 2023-09-26 Juniper Networks, Inc. Network management actions based on access point classification

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6012152A (en) * 1996-11-27 2000-01-04 Telefonaktiebolaget Lm Ericsson (Publ) Software fault management system
US6294991B1 (en) * 1998-09-08 2001-09-25 Mci Communications Corporation Method and system therefor for ensuring a true activation of distributed restoration in a telecommunications network
US6654914B1 (en) * 1999-05-28 2003-11-25 Teradyne, Inc. Network fault isolation
JP2000358029A (ja) * 1999-06-15 2000-12-26 Nec Corp 自動障害診断ネットワークシステム及びネットワークの自動障害診断方法
US6718377B1 (en) * 1999-08-13 2004-04-06 Lucent Technologies Inc. Telecommunications network management system interface
EP1312003A4 (en) * 2000-06-16 2005-12-21 Verisae SYSTEM AND METHOD FOR MANAGING THE ASSETS OF AN ENTERPRISE
US20020124070A1 (en) * 2001-03-02 2002-09-05 Pulsipher Eric A. System for providing related information of a network error event in a hand-held device
JP4149178B2 (ja) * 2001-03-09 2008-09-10 松下電器産業株式会社 リモートメンテナンスシステム
FR2835674B1 (fr) 2002-02-07 2006-02-24 Cit Alcatel Deploiement des regles par un dispositif de gestion de services, en fonction d'informations sur les equipements du reseau
JP2003244150A (ja) * 2002-02-15 2003-08-29 Toshiba Corp ネットワーク復旧システム
US7091846B2 (en) * 2002-03-18 2006-08-15 Siemens Communications, Inc. Methods and apparatus for handling information regarding an alarm for a communication network
FR2843260B1 (fr) 2002-07-31 2005-04-08 Cit Alcatel Systeme de gestion de reseau par regles comportant un moteur d'inference
JP2004164615A (ja) * 2002-10-11 2004-06-10 Seiko Epson Corp 作業担当者支援方法及び作業担当者支援プログラム
US7301909B2 (en) * 2002-12-20 2007-11-27 Compucom Systems, Inc. Trouble-ticket generation in network management environment
US7620848B1 (en) * 2003-11-25 2009-11-17 Cisco Technology, Inc. Method of diagnosing and repairing network devices based on scenarios
WO2006007460A2 (en) * 2004-06-21 2006-01-19 Spirent Communications Of Rockville, Inc. Service-centric computer network services diagnostic conclusions
US20060221913A1 (en) * 2005-03-31 2006-10-05 Adc Telecommunications, Inc. Integrated network management of a software defined radio system
US8068425B2 (en) * 2008-04-09 2011-11-29 Embarq Holdings Company, Llc System and method for using network performance information to determine improved measures of path states

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101197621B (zh) * 2007-12-07 2012-03-07 中兴通讯股份有限公司 一种对网管系统故障进行远程诊断定位的方法及其系统
CN101459925B (zh) * 2007-12-11 2010-10-20 中国移动通信集团公司 电信网络投诉管理系统及方法
WO2009082836A1 (fr) * 2007-12-26 2009-07-09 Zte Corporation Procédé et dispositif de traitement d'un dysfonctionnement
CN101217696B (zh) * 2007-12-28 2012-09-05 中国移动通信集团浙江有限公司 一种移动用户投诉综合处理系统及其方法
CN101801015A (zh) * 2009-02-06 2010-08-11 中兴通讯股份有限公司 一种小区退服故障的处理方法及装置
US8526299B2 (en) 2009-02-06 2013-09-03 Zte Corporation Method and device for processing cell out-of-service failures
CN101801015B (zh) * 2009-02-06 2014-03-12 中兴通讯股份有限公司 一种小区退服故障的处理方法及装置
CN101924661B (zh) * 2009-06-17 2015-07-22 中兴通讯股份有限公司 告警的处理方法及装置
CN101924661A (zh) * 2009-06-17 2010-12-22 中兴通讯股份有限公司 告警的处理方法及装置
CN103684828A (zh) * 2012-09-18 2014-03-26 亿阳信通股份有限公司 一种电信设备故障的处理方法和装置
CN103684828B (zh) * 2012-09-18 2018-08-03 长春亿阳计算机开发有限公司 一种电信设备故障的处理方法和装置
CN105262622A (zh) * 2015-10-27 2016-01-20 北京极科极客科技有限公司 一种路由器的优化和诊断的方法及系统
CN108540298A (zh) * 2017-03-01 2018-09-14 中兴通讯股份有限公司 一种自动处理垃圾业务的方法及装置
CN108540298B (zh) * 2017-03-01 2022-06-17 中兴通讯股份有限公司 一种自动处理垃圾业务的方法及装置
CN110447206A (zh) * 2017-03-29 2019-11-12 凯迪迪爱通信技术有限公司 自动故障恢复系统、控制设备、程序创建设备及计算机可读存储介质
CN109491336A (zh) * 2017-09-13 2019-03-19 费希尔-罗斯蒙特系统公司 用于模块化控制系统的助理应用
CN109491336B (zh) * 2017-09-13 2023-11-28 费希尔-罗斯蒙特系统公司 用于模块化控制系统的助理应用

Also Published As

Publication number Publication date
EP1774705A1 (fr) 2007-04-18
US8149718B2 (en) 2012-04-03
JP2008508760A (ja) 2008-03-21
FR2873879A1 (fr) 2006-02-03
US20070260911A1 (en) 2007-11-08
FR2873879B1 (fr) 2006-10-27
WO2006021702A1 (fr) 2006-03-02

Similar Documents

Publication Publication Date Title
CN101027872A (zh) 用于自动故障修复的通信网络管理系统
US9680722B2 (en) Method for determining a severity of a network incident
US8347143B2 (en) Facilitating event management and analysis within a communications environment
US7688951B1 (en) Automated rules based proactive alarm analysis and response
US7818283B1 (en) Service assurance automation access diagnostics
CA2272609A1 (en) Software fault management system
US7275017B2 (en) Method and apparatus for generating diagnoses of network problems
US7286965B2 (en) Modular evolving knowledge-based diagnostic device for use in communication networks
cois Huard et al. Fault isolation based on decision-theoretic troubleshooting
EP2566103B1 (en) Apparatus and method for correlating faults in an information carrying network
US7395186B2 (en) Diagnostic device using adaptive diagnostic models, for use in a communication network
Riese Model-based diagnosis of communication protocols
Melchiors et al. Fault management in computer networks using case-based reasoning: DUMBO system
Tcholtchev et al. Autonomic fault-management and resilience from the perspective of the network operation personnel
US11716241B1 (en) Methods, systems, and computer readable media for actively diagnosing and remediating performance degradation in a production network
Wallace CCNP TSHOOT 642-832 Official Cert Guide
Bolton et al. Analyses of the reverse path forwarding routing algorithm
Ranjbar Troubleshooting and Maintaining Cisco IP Networks (TSHOOT) Foundation Learning Guide:(CCNP TSHOOT 300-135)
Ranjbar Troubleshooting and Maintaining Cisco IP Networks (TSHOOT) Foundation Learning Guide: Foundation Learning for the CCNP TSHOOT 642-832
Fuller Network management using expert diagnostics
Sánchez Vílchez et al. Self‐modeling based diagnosis of network services over programmable networks
Hao et al. Fault management for networks with link state routing protocols
Kant et al. Fault localization and self-healing mechanisms for FCS networks
Gupta et al. NEWS: Towards an Early Warning System for Network Faults.
Tang Exploiting Modularity to Scale Verification of Network Router Configurations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication