CN102868553A - 故障定位方法及相关设备 - Google Patents

故障定位方法及相关设备 Download PDF

Info

Publication number
CN102868553A
CN102868553A CN2012103101984A CN201210310198A CN102868553A CN 102868553 A CN102868553 A CN 102868553A CN 2012103101984 A CN2012103101984 A CN 2012103101984A CN 201210310198 A CN201210310198 A CN 201210310198A CN 102868553 A CN102868553 A CN 102868553A
Authority
CN
China
Prior art keywords
path
node
test
transmit port
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012103101984A
Other languages
English (en)
Other versions
CN102868553B (zh
Inventor
李兴
朱毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210310198.4A priority Critical patent/CN102868553B/zh
Publication of CN102868553A publication Critical patent/CN102868553A/zh
Application granted granted Critical
Publication of CN102868553B publication Critical patent/CN102868553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种故障定位方法及相关设备,其中所述方法包括:对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。实施本发明实施例,可快速有效地准确定位故障。

Description

故障定位方法及相关设备
技术领域
本发明涉及通信领域,尤其涉及故障定位方法及相关设备。
背景技术
目前,对于常见故障,如端口Down、光纤断、硬件故障等,网络设备以及设备上的实体对象会自动生成告警,并通过SNMP(Simple Network ManagementProtocol,简单网络管理协议)Trap(陷阱)方式上报给网络管理系统,以使运维人员直接通过网络管理系统监控上报列表来处理这些故障。而对于质量劣化类故障,如流量拥塞,节点CPU、内存占用率高等,网络管理系统建立对业务、隧道和链路各层次的性能监控实例。定时从网络设备上采集性能数据,根据经验数据对各性能指标设置阈值。当采集性能超过阈值时,在网络管理系统中产生越限告警,提示用户处理。但是,目前通过告警的方式,依赖于阈值设置的合理性,存在误判和不能准确定位故障的缺陷。另外,在比较多的情况下,某些位置无法设置告警参考阈值,因此这些节点无法通过告警、性能等监控及时发现和定位故障,对于这些节点,运维人员定位故障时,通常采用人工逐跳查找路由表确定转发路径,登录设备执行逐段的Ping的方式,确定故障点。通过人工逐跳确认路径之后,需要进一步根据路径上业务、隧道的承载关系,通过使用不同源、宿,不同层次的Ping、Trace,来逐步缩小故障发生的区间。缩小范围之后,还需要登录设备检查流量、丢包、错包等运行参数确定故障发生的位置。由于背景流量的影响,运维人员通常需要多次重复这个步骤,逐台设备判断/排除故障点,其操作非常繁琐,比较依赖运维人员的技能和经验,耗时耗力,并且容易出错。
发明内容
本发明实施例提供故障定位方法及相关设备,以快速有效地准确定位故障。
本发明第一方面提供一种故障定位方法,可包括:
对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;
对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
在第一种可能的实现方式中,对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识之前包括:
在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口;
为所述指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述在业务路径上指定测试路径之前,包括:
由业务的源IP地址和宿IP地址确定业务路径。
结合第一方面或第一方面的第一种可能的实现方式,或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述测试报文的大小小于所述业务路径的最大传输单元所限定的数据量。
结合第一方面的第一种可能的实现方式,或第一方面的第二种可能的实现方式,在第四种可能的实现方式中,所述测试路径包括所述业务路径的全部路径或者所述业务路径的部分路径。
结合第一方面,或第一方面的第一种可能的实现方式,或第一方面的第二种可能的实现方式,或第一方面的第三种可能的实现方式,或第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
本发明第二方面提供一种网络管理服务器,可包括:
流量统计单元,用于对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;
故障分析单元,用于根据所述流量统计单元的计数结果,对每组传输端口,判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
在第一种可能的实现方式中,本发明的网络管理服务器还可包括:
路径管理单元,用于在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口;
策略管理单元,用于为所述路径管理单元指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述策略管理单元包括:
ACL管理单元,用于为所述路径管理单元指定的测试路径设置ACL规则;
流量策略管理单元,用于设置流量策略;
关联单元,用于将所述ACL管理单元和所述流量策略管理单元所设置的ACL规则和流量策略进行关联。
结合第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述路径管理单元将业务路径的全部路径指定为所述测试路径或者将业务路径的部分路径指定为所述测试路径。
结合第二方面,或第二方面的第一种可能的实现方式,或第二方面的第二种可能的实现方式,或第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
本发明第三方面提供一种一种网络管理系统,其可包括本发明所述的网络管理服务器;及
客户端,用于当网络服务器指定测试路径时,将用户对源节点、宿节点、中间节点及各组传输端口的指示信息发送给所述服务器,以及当所述服务器确定节点或连接链路故障时,将所述服务器确定的故障节点和连接链路输出给用户。
由上可见,在本发明的一些可行的实施方式中,网络管理服务器对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障,以快速有效地准确自动定位故障位置,解决了现有技术中存在误判和不能准确定位故障以及依赖运维人员的技能和经验,耗时耗力,并且容易出错的技术缺陷。
附图说明
图1为本发明的故障定位方法一实施例的流程示意图;
图2为本发明的故障定位方法另一实施例的流程示意图;
图3为本发明的网络管理服务器一实施例的结构组成示意图;
图4为本发明的网络管理服务器另一实施例的结构组成示意图;
图5为本发明的策略管理单元的一实施例的结构组成示意图;
图6为本发明的网络设备的另一实施例的结构组成示意图;
图7-a为本发明的业务路径的一实施例的网元拓扑示意图;
图7-b为图7-a网元拓扑的另一状态示意图;
图7-c为图7-a网元拓扑的再一状态示意图;
图8为本发明的故障定位方法另一实施例的流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
在本发明的一些可行的实施方式中,网络管理服务器对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
图1为本发明的故障定位方法的实施例一的流程示意图。如图1所示,本发明的故障定位方法可包括:
步骤S110,对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识。
具体实现中,对于IP业务,设置ACL规则可为对源IP地址、目的IP地址、源端口号、目的端口号、协议类型等域中的一个或者多个进行设置,比如,可以通过设置源IP地址来定义一个基于源地址ACL规则,也可以通过设置源IP地址和目的IP地址来定义一个基于源和目的IP地址的ACL。对于其他业务,比如VPLS业务,设置ACL规则时,也可对源MAC地址,宿MAC地址进行设置。
具体实现中,设置流量策略可为对特定分类的流进行限定,并将该特定分类的流指定为本发明的测试报文。因此,可以理解的是,本发明的流量策略中包括测试报文的类别标识。
具体实现中,所述每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
具体实现中,测试报文可为专门为发现故障发送的检测报文,也可是已经在业务路径上传输的符合流量策略要求的传输报文。
步骤S111,对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。可以理解的是,在无故障的情况下,同组传输端口中的两端口所统计的测试报文应该是相等的,如果有故障则其统计的测试报文不相等。因此,在步骤S111,如果判断测试路径上某一节点的输入端口和输出端口上传输的测试报文不相等,则表明该节点可能故障。而如果判断测试路径上上流节点的输出端口和下流节点的输入端口传输的测试报文不相等,则表明该两个节点间的链路可能故障。
具体实现中,测试报文的大小可设置为固定值。
具体实现中,所述测试报文的大小可为小于或等于业务路径所允许传输的最大传输单元所限定的数据量。当测试报文不大于最大传输单元所限定的数据量时,测试报文不会分片。
图2为本发明的故障定位方法的实施例二的流程示意图。如图2所示,本发明的故障定位方法可包括:
步骤S210,在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口。
具体实现中,可将业务路径的整个路径作为发送测试报文的测试路径,也可将业务路径的部分路径作为发送测试报文的测试路径。测试路径的指定可为在正在运作的业务路径上实时进行指定,在实时的业务路径上进行故障定位,也可在业务已经中断的情况下,查找该业务某一历史时刻的业务路径,在该历史业务路径上指定测试路径并进行故障定位。
步骤S211,为所述指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
具体实现中,对于IP业务,设置ACL规则可为对源IP地址、目的IP地址、源端口号、目的端口号、协议类型等域中的一个或者多个进行设置,比如,可以通过设置源IP地址来定义一个基于源地址ACL规则,也可以通过设置源IP地址和目的IP地址来定义一个基于源和目的IP地址的ACL。对于其他业务,比如VPLS业务,设置ACL规则时,也可对源MAC地址,宿MAC地址进行设置。
具体实现中,设置流量策略可为对特定分类的流进行限定,并将该特定分类的流指定为本发明的测试报文。因此,可以理解的是,本发明的流量策略中包括测试报文的类别标识。具体实现中,测试报文可为专门为发现故障发送的检测报文,也可是已经在业务路径上传输的符合流量策略要求的传输报文。
具体实现中,可首先设置ACL规则,其次设置流量策略,再次将设置的ACL规则和流量策略进行关联,其中,ACL规则和流量策略的设置顺序也可倒换。
具体实现中,ACL规则和流程策略的可设置为用户可改变或用户不可改变。
步骤S212,根据所述ACL规则及流量策略对测试路径上的各组传输端口的测试报文进行计数。
具体实现中,测试报文的大小可设置为固定值。
具体实现中,所述测试报文的大小可为小于或等于业务路径所允许传输的最大传输单元所限定的数据量。当测试报文不大于最大传输单元所限定的数据量时,测试报文不会分片。
步骤S213,对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
具体实现中,本实施例中步骤S212和S213与方法实施一中步骤S110和S111分别相同,在此不进行赘述。
在本发明的一些可行的实施例中,在业务路径上指定测试路径之前,还可包括:由业务的源地址和宿地址确定业务路径的步骤。对于IP业务,业务路径可根据业务的源IP地址和宿IP地址确定,而对于PWE3业务,业务路径可根据路由器接入接口来确定,而对于VPLS业务,业务路径可根据源MAC地址和宿MAC地址来确定,以此类推,其它业务路径也可根据自身的情况来确定。
由上可见,在本发明的一些可行的方法实施方式中,对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
为更好实施本发明的方法实施例的各方案,本发明实施例还提供了相关装置。
图3为本发明的可用于实施本发明的方法实施例的网络管理服务器的实施例一的结构组成示意图。如图3所示,本发明的网络管理服务器3可包括流量统计单元34和故障分析单元35,其中:
流量统计单元34,用于对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识。
故障分析单元35,用于根据所述流量统计单元34的计数结果,对每组传输端口,判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
在本发明的一些可行的实施例中,可由网络管理服务器设置ACL规则和流量策略,也可由网络管理服务器从其他设备处获取设置的ACL规则和流量策略。其中,对于IP业务,设置ACL规则可为对源IP地址、目的IP地址、源端口号、目的端口号、协议类型等域中的一个或者多个进行设置,比如,可以通过设置源IP地址来定义一个基于源地址ACL规则,也可以通过设置源IP地址和目的IP地址来定义一个基于源和目的IP地址的ACL。对于其他业务,比如VPLS业务,设置ACL规则时,也可对源MAC地址,宿MAC地址进行设置。其中,设置流量策略可为对特定分类的流进行限定,并将该特定分类的流指定为本发明的测试报文。因此,可以理解的是,本发明的流量策略中包括测试报文的类别标识。
具体实现中,每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
具体实现中,测试报文可为专门为发现故障发送的检测报文,也可是已经在业务路径上传输的符合流量策略要求的传输报文。
在本发明的一些可行的实施例中,测试报文的大小可设置为固定值。
在本发明的一些可行的实施例中,测试报文的大小可为小于或等于业务路径所允许传输的最大传输单元所限定的数据量。当测试报文不大于最大传输单元所限定的数据量时,测试报文不会分片。
本发明的一些可行的实施例中,可由网络管理服务器设置测试报文的大小,也可由其他设备来设置测试报文的大小。
图4为本发明的可用于实施本发明的方法实施例的网络管理服务器的实施例二的结构组成示意图。如图4所示,本发明的网络管理服务器4可包括路径管理单元41、策略管理单元42、流量统计单元43和故障分析单元44,其中:
路径管理单元41,用于在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口。
策略管理单元42,用于为所述路径管理单元41指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
流量统计单元43,用于对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识。
故障分析单元44,用于根据所述流量统计单元44的计数结果,对每组传输端口,判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
具体实现中,路径管理单元41可将业务路径的整个路径作为发送测试报文的测试路径,也可将业务路径的部分路径作为发送测试报文的测试路径。测试路径的指定可为在正在运作的业务路径上实时进行指定,在实时的业务路径上进行故障定位,也可在业务已经中断的情况下,查找该业务某一历史时刻的业务路径,在该历史业务路径上指定测试路径并进行故障定位。
具体实现中,策略管理单元42设置ACL规则对于IP业务,设置ACL规则可为对源IP地址、目的IP地址、源端口号、目的端口号、协议类型等域中的一个或者多个进行设置,比如,可以通过设置源IP地址来定义一个基于源地址ACL规则,也可以通过设置源IP地址和目的IP地址来定义一个基于源和目的IP地址的ACL。对于其他业务,比如VPLS业务,设置ACL规则时,也可对源MAC地址,宿MAC地址进行设置。
具体实现中,策略管理单元42设置流量策略可为对特定分类的流进行限定,并将该特定分类的流指定为本发明的测试报文。因此,可以理解的是,本发明的流量策略中包括测试报文的类别标识。
具体实现中,策略管理单元42可首先设置ACL规则,其次设置流量策略,再次将设置的ACL规则和流量策略进行关联,其中,ACL规则和流量策略的设置顺序也可倒换。
具体实现中,流量统计单元43中统计的测试报文的大小可被设置为固定值。测试报文的大小可为小于或等于业务路径所允许传输的最大传输单元所限定的数据量。当测试报文不大于最大传输单元所限定的数据量时,测试报文不会分片。
结合图4进一步参考图5,图5为图4所示的策略管理单元42的一实施例的结构组成示意图。如图5所示,本发明的策略管理单元42可包括:ACL管理单元421、流量策略管理单元422和关联单元423。其中:
ACL管理单元421,用于为所述路径管理单元41指定的测试路径设置ACL规则。
流量策略管理单元422,用于设置流量策略。
关联单元423,用于将所述ACL管理单元和所述流量策略管理单元所设置的ACL规则和流量策略进行关联。
具体实现中,ACL管理单元421设置ACL规则对于IP业务,设置ACL规则可为对源IP地址、目的IP地址、源端口号、目的端口号、协议类型等域中的一个或者多个进行设置,比如,可以通过设置源IP地址来定义一个基于源地址ACL规则,也可以通过设置源IP地址和目的IP地址来定义一个基于源和目的IP地址的ACL。对于其他业务,比如VPLS业务,设置ACL规则时,也可对源MAC地址,宿MAC地址进行设置。
具体实现中,流量策略管理单元422设置流量策略可为对特定分类的流进行限定,并将该特定分类的流指定为本发明的测试报文。因此,可以理解的是,本发明的流量策略中包括测试报文的类别标识。
在本发明的一些可行的实施例中,本发明的网络管理服务器还可包括:用于由业务的源地址和宿地址确定业务路径的功能模块。对于IP业务,业务路径可根据业务的源IP地址和宿IP地址确定,而对于PWE3业务,业务路径可根据路由器接入接口来确定,而对于VPLS业务,业务路径可根据源MAC地址和宿MAC地址来确定,以此类推,其它业务路径也可根据自身的情况来确定。
由上可见,在本发明的一些可行的实施方式中,网络管理服务器4对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,给程序执行时可包括本发明提供的故障定位方法的各实施例中的部分或全部步骤。
具体实现中,如图6所示,本发明还提供一种网络设备6,可包括:输入装置61、输出装置62、存储器63和处理器64(具体实现中,网络设备6的处理器64可为多个,图6中仅以一个为例进行说明);
在本发明的一些可行的实施例中,输入装置61、输出装置62、存储器63和处理器64可通过总线或其他方式连接,图6中以总线连接为例。
在本发明的一些可行的实施例中:处理器64可执行如下步骤:
对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;
对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
在本发明的一些可行的实施例中,处理器64对测试路径上的各组传输端口的测试报文进行计数,之前还可执行如下步骤:
在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口;
为所述指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
在本发明的一些可行的实施例中,处理器64在业务路径上指定测试路径之前,还可执行如下步骤:
由业务的源地址和宿I地址确定业务路径。
在本发明的一些可行的实施例中,处理器64可将业务路径的全部路径指定为所述测试路径或者将业务路径的部分路径指定为所述测试路径。
在本发明的一些可行的实施例中,存储器63中存储处理器64为所述指定的测试路径设置的ACL规则和与所述ACL规则关联的流量策略,以及存储所述处理器根据所述ACL规则及流量策略对所述测试路径的各组传输端口进行测试报文的计数结果。
由上可见,在本发明的一些可行的实施方式中,网络设备6对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
本发明实施例还提供一种网络管理系统,其可包括本发明所述的网络管理服务器;及客户端,所述客户端用于用于当网络服务器指定测试路径时,将用户对源节点、宿节点、中间节点及各组传输端口的指示信息发送给所述服务器,以及当所述服务器确定节点或连接链路故障时,将所述服务器确定的故障节点和连接链路输出给用户。
为便于更好地理解本发明实施例所提供的技术方案,下面通过一个具体流量统计下的故障定位的实施例为例对本发明进一步进行说明。
在该具体实施例中,图7-a示出了本发明实施例确定出的业务路径所包括的所有网元拓扑图;图7-b在图7-a的基础上,进一步示出了指定的测试路径;图7-c示出了图7-b的测试路径的输入端口和输出端口的计数统计结果。
结合图7-a至图7-c,如图8所示,本发明实施例提供的故障定位方法包括:
步骤S810,将需进行业务故障检测的业务路径的源IP地址输入网络管理服务器中,网络管理服务器根据所述源IP地址发现端到端的业务路径。
结合图7-a至图7-c的实例,在步骤S810网络管理服务器可发现如图7-a的业务路径,该业务路径的正向为:网元A->网元B->网元C->网元D->网元E->网元F;该业务路径的反向为:网元F->网元E->网元D->网元I->网元H->网元G->网元B->网元A。
步骤S811,网络管理服务器在业务路径上指定测试路径。所述测试路径包括测试报文的源节点、宿节点及中间节点。
结合图7-a至图7-c的实例,如图7-b所示,在步骤S811网络管理服务器可在图7-a的业务路径上指定网元B为测试报文的源节点、网元E为测试报文的宿节点,中间节点可包括网元C、网元D、网元G、网元H、网元I等(在图7-b中实心圆圈所表示网元)。
步骤S812,网络管理服务器为所述指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
结合图7-a至图7-c的实例,在步骤S812网络管理服务器为包括网元B、网元C、网元D、网元E、网元G、网元H、网元I的测试路径设置ACL规则,比如可设置源IP地址为网元B的IP地址,目标IP地址为网元E的IP地址。并设置流量策略,所述流量策略中指定作为测试报文的类,其具体通过设置类标识来设置测试报文的类。在设置好ACL规则及流量策略后,将流量策略应用到测试路径的各网元的输入端口和输出端口。
步骤S813,根据所述ACL规则及流量策略对所述测试路径的各组传输端口的测试报文进行计数。
步骤S814,采集测试路径上的各组传输端口根据预先设置的ACL规则和流量策略对测试报文的计数结果。
结合图7-a至图7-c的实例,如图7-c,经过步骤S813和步骤S814的处理后,即可采集到从网元B到网元E的测试路径上各网元节点的输入端口和输出端口所统计的测试报文的数量。比如,网元C的输入端口的报文数为50、网元C的输出端口的报文数为46。再如,测试路径流向上,上流网元H的输出端口的报文数为46,下流网元G的输入端口的报文数为40。
步骤S815,对每组传输端口,分别判断该组传输端口的两端口对测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
结合图7-a至图7-c的实例,如图7-c,经过判断可知网元C的输入端口的报文数为50、网元C的输出端口的报文数为46,因此可确定在测试路径上网元C发生故障,以及经过判断可知上流网元H的输出端口的测试报文数为46,而下流网元G的输入端口的测试报文为40,则可确定在测试路径上网元H和网元G之间的链路发生故障。
由上可见,本发明实施例采集测试路径上的各组传输端口根据预先设置的访问控制列表ACL规则和流量策略对测试报文的计数结果,并根据每组传输端口对测试报文的计数是否相等来判断节点或链路是否故障,以快速有效地准确自动定位故障位置,解决了现有技术中存在误判和不能准确定位故障以及依赖运维人员的技能和经验,耗时耗力,并且容易出错的技术缺陷。
以上所列举的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (12)

1.一种故障定位方法,其特征在于,包括:
对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;
对每组传输端口,根据所述计数的计数结果判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
2.如权利要求1所述的故障定位方法,其特征在于,对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识之前,所述方法还包括:
在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口;
为所述指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
3.如权利要求2所述的故障定位方法,其特征在于,所述在业务路径上指定测试路径之前,包括:
由业务的源地址和宿地址确定业务路径。
4.如权利要求1-3中任一项所述的故障定位方法,其特征在于,所述测试报文的大小小于或等于所述业务路径的最大传输单元所限定的数据量。
5.如权利要求2或3所述的故障定位方法,其特征在于,所述测试路径包括所述业务路径的整个路径或者所述业务路径的部分路径。
6.如权利要求1-5中任一项所述的故障定位方法,其特征在于,所述每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
7.一种网络管理服务器,其特征在于,包括:
流量统计单元,用于对测试路径上的各组传输端口的测试报文进行计数,所述进行计数的依据包括预先设置的访问控制列表ACL规则和流量策略,所述流量策略包括测试报文的分类标识;
故障分析单元,用于根据所述流量统计单元的计数结果,对每组传输端口,判断对该组传输端口中的两端口的测试报文的计数是否相等,当判断结果为否时,则确定该组传输端口归属的节点或连接的链路故障。
8.如权利要求7所述的网络管理服务器,其特征在于,还包括:
路径管理单元,用于在业务路径上指定测试路径,所述测试路径包括源节点、宿节点、中间节点及各组传输端口,所述传输端口为所述测试路径上各节点的接口;
策略管理单元,用于为所述路径管理单元指定的测试路径设置ACL规则和与所述ACL规则关联的流量策略。
9.如权利要求8所述的网络管理服务器,其特征在于,所述策略管理单元包括:
ACL管理单元,用于为所述路径管理单元指定的测试路径设置ACL规则;
流量策略管理单元,用于设置流量策略;
关联单元,用于将所述ACL管理单元和所述流量策略管理单元所设置的ACL规则和流量策略进行关联。
10.如权利要求8或9所述的网络管理服务器,其特征在于,所述路径管理单元将业务路径的全部路径指定为所述测试路径或者将业务路径的部分路径指定为所述测试路径。
11.如权利要求7-10中任一项所述的网络管理服务器,其特征在于,所述每组传输端口包括同一节点的输入端口和输出端口,或所述每组传输端口包括测试路径上上流节点的输出端口和下流节点的输入端口。
12.一种网络管理系统,其特征在于,包括:
如权利要求7-11中任一项所述的网络管理服务器;
客户端,用于当网络服务器指定测试路径时,将用户对源节点、宿节点、中间节点及各组传输端口的指示信息发送给所述服务器,以及当所述服务器确定节点或连接链路故障时,将所述服务器确定的故障节点和连接链路输出给用户。
CN201210310198.4A 2012-08-28 2012-08-28 故障定位方法及相关设备 Active CN102868553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210310198.4A CN102868553B (zh) 2012-08-28 2012-08-28 故障定位方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210310198.4A CN102868553B (zh) 2012-08-28 2012-08-28 故障定位方法及相关设备

Publications (2)

Publication Number Publication Date
CN102868553A true CN102868553A (zh) 2013-01-09
CN102868553B CN102868553B (zh) 2016-03-30

Family

ID=47447158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210310198.4A Active CN102868553B (zh) 2012-08-28 2012-08-28 故障定位方法及相关设备

Country Status (1)

Country Link
CN (1) CN102868553B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104320305A (zh) * 2014-11-12 2015-01-28 迈普通信技术股份有限公司 一种网络设备转发业务监控方法及系统
WO2016091019A1 (zh) * 2014-12-10 2016-06-16 中兴通讯股份有限公司 一种特征数据报文的流量统计和分析方法及相应设备
CN106357446A (zh) * 2016-09-20 2017-01-25 杭州迪普科技有限公司 一种流量转发路径的获取方法及装置
CN106411624A (zh) * 2016-12-26 2017-02-15 北京东土科技股份有限公司 一种丢包端口定位方法及装置
CN106961344A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 一种网络故障检测方法及装置
CN107846291A (zh) * 2016-09-18 2018-03-27 华为技术有限公司 报文处理方法、故障定位方法及网络设备
CN109525438A (zh) * 2018-12-21 2019-03-26 安徽皖兴通信息技术有限公司 一种网络连通性排查的实现方法
CN109728931A (zh) * 2017-10-31 2019-05-07 杭州华为数字技术有限公司 网络的故障定界方法、装置以及计算机存储介质
CN110120887A (zh) * 2019-04-25 2019-08-13 新华三技术有限公司合肥分公司 一种网络质量信息监控方法、电子设备及存储介质
CN111385120A (zh) * 2018-12-29 2020-07-07 华为技术有限公司 一种确定转发故障位置的方法和设备
CN112822066A (zh) * 2020-12-31 2021-05-18 北京浩瀚深度信息技术股份有限公司 一种用于dpi设备的数据链路的测试方法及系统
CN113206771A (zh) * 2021-04-26 2021-08-03 深圳市科信网安科技有限公司 一种确定路径故障的控制器、交换机和系统
CN113452564A (zh) * 2021-06-29 2021-09-28 杭州迪普科技股份有限公司 一种基于acl的故障诊断方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039213A (zh) * 2006-03-14 2007-09-19 华为技术有限公司 一种通信网络中对用户的接入访问进行控制的方法
CN101304372A (zh) * 2008-06-18 2008-11-12 华为技术有限公司 一种配置访问控制列表的方法、设备及系统
CN101594265A (zh) * 2009-06-30 2009-12-02 北京星网锐捷网络技术有限公司 一种网络故障诊断方法、装置和网络设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101039213A (zh) * 2006-03-14 2007-09-19 华为技术有限公司 一种通信网络中对用户的接入访问进行控制的方法
CN101304372A (zh) * 2008-06-18 2008-11-12 华为技术有限公司 一种配置访问控制列表的方法、设备及系统
CN101594265A (zh) * 2009-06-30 2009-12-02 北京星网锐捷网络技术有限公司 一种网络故障诊断方法、装置和网络设备

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104320305B (zh) * 2014-11-12 2018-06-05 迈普通信技术股份有限公司 一种网络设备转发业务监控方法及系统
CN104320305A (zh) * 2014-11-12 2015-01-28 迈普通信技术股份有限公司 一种网络设备转发业务监控方法及系统
WO2016091019A1 (zh) * 2014-12-10 2016-06-16 中兴通讯股份有限公司 一种特征数据报文的流量统计和分析方法及相应设备
CN106961344A (zh) * 2016-01-08 2017-07-18 中兴通讯股份有限公司 一种网络故障检测方法及装置
CN107846291B (zh) * 2016-09-18 2020-02-14 华为技术有限公司 报文处理方法、故障定位方法及网络设备
CN107846291A (zh) * 2016-09-18 2018-03-27 华为技术有限公司 报文处理方法、故障定位方法及网络设备
CN106357446B (zh) * 2016-09-20 2019-07-09 杭州迪普科技股份有限公司 一种流量转发路径的获取方法及装置
CN106357446A (zh) * 2016-09-20 2017-01-25 杭州迪普科技有限公司 一种流量转发路径的获取方法及装置
CN106411624A (zh) * 2016-12-26 2017-02-15 北京东土科技股份有限公司 一种丢包端口定位方法及装置
CN109728931A (zh) * 2017-10-31 2019-05-07 杭州华为数字技术有限公司 网络的故障定界方法、装置以及计算机存储介质
CN109728931B (zh) * 2017-10-31 2021-06-15 华为技术有限公司 网络的故障定界方法、装置以及计算机存储介质
CN109525438A (zh) * 2018-12-21 2019-03-26 安徽皖兴通信息技术有限公司 一种网络连通性排查的实现方法
CN111385120B (zh) * 2018-12-29 2021-10-26 华为技术有限公司 一种确定转发故障位置的方法和设备
CN111385120A (zh) * 2018-12-29 2020-07-07 华为技术有限公司 一种确定转发故障位置的方法和设备
US11902087B2 (en) 2018-12-29 2024-02-13 Huawei Technologies Co., Ltd. Forwarding fault location determining method and device
CN110120887A (zh) * 2019-04-25 2019-08-13 新华三技术有限公司合肥分公司 一种网络质量信息监控方法、电子设备及存储介质
CN110120887B (zh) * 2019-04-25 2022-02-11 新华三技术有限公司合肥分公司 一种网络质量信息监控方法、电子设备及存储介质
CN112822066A (zh) * 2020-12-31 2021-05-18 北京浩瀚深度信息技术股份有限公司 一种用于dpi设备的数据链路的测试方法及系统
CN113206771A (zh) * 2021-04-26 2021-08-03 深圳市科信网安科技有限公司 一种确定路径故障的控制器、交换机和系统
CN113206771B (zh) * 2021-04-26 2022-03-29 深圳市捷力通信息技术有限公司 一种确定路径故障的控制器和系统
CN113452564A (zh) * 2021-06-29 2021-09-28 杭州迪普科技股份有限公司 一种基于acl的故障诊断方法及装置

Also Published As

Publication number Publication date
CN102868553B (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
CN102868553B (zh) 故障定位方法及相关设备
JP5840788B2 (ja) 根本原因分析のための方法、装置、および通信ネットワーク
WO2018126645A1 (zh) 一种通信网络管理方法及其装置
CN105721184A (zh) 一种网络链路质量的监控方法及装置
CN106605392A (zh) 用于使用控制器在网络上进行操作的系统和方法
CN113938407B (zh) 基于带内网络遥测系统的数据中心网络的故障检测方法及装置
CN102158360A (zh) 一种基于时间因子因果关系定位的网络故障自诊断方法
CN112564964B (zh) 一种基于软件定义网络的故障链路检测与恢复方法
JP2012517148A (ja) ネットワークコストの分析
CN111817911A (zh) 一种探测网络质量的方法、装置、计算设备及存储介质
US10708155B2 (en) Systems and methods for managing network operations
CN105187228A (zh) 一种网络质量探测方法及路由器
CN101242320A (zh) 监测网络路径的方法及装置
CN110071843B (zh) 一种基于流路径分析的故障定位方法及装置
CN111147286A (zh) Ipran网络环路监控方法及装置
CN111082979A (zh) 基于交换机的智能变电站过程层二次回路故障诊断方法及故障诊断主机
CN101385292B (zh) 质量恶化部分估计装置、方法及程序
Tri et al. Locating deteriorated links by network-assisted multicast proving on OpenFlow networks
JP2016146581A (ja) トラヒック情報収集装置およびトラヒック情報収集方法
CN114465897A (zh) 业务流中数据包的监控方法、装置和系统
CN110351148A (zh) 一种网络三层转发路径诊断方法和系统
JP2005286684A (ja) トラフィックフロー計測環境設定方式
CN115473825A (zh) 业务服务等级协议保障方法和系统、控制器和存储介质
JP4871775B2 (ja) 統計情報収集装置
Tri et al. Effective route scheme of multicast probing to locate high-loss links in OpenFlow networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant