CN106330506A - 一种业务故障定位方法及装置 - Google Patents

一种业务故障定位方法及装置 Download PDF

Info

Publication number
CN106330506A
CN106330506A CN201510372320.4A CN201510372320A CN106330506A CN 106330506 A CN106330506 A CN 106330506A CN 201510372320 A CN201510372320 A CN 201510372320A CN 106330506 A CN106330506 A CN 106330506A
Authority
CN
China
Prior art keywords
layer equipment
layer
equipment
characteristic parameter
service message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510372320.4A
Other languages
English (en)
Other versions
CN106330506B (zh
Inventor
李从娟
李峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201510372320.4A priority Critical patent/CN106330506B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to ES16817166T priority patent/ES2820775T3/es
Priority to PCT/CN2016/086379 priority patent/WO2017000802A1/zh
Priority to EP16817166.8A priority patent/EP3300301B1/en
Priority to EP20182779.7A priority patent/EP3783837B1/en
Publication of CN106330506A publication Critical patent/CN106330506A/zh
Priority to US15/856,935 priority patent/US10785095B2/en
Application granted granted Critical
Publication of CN106330506B publication Critical patent/CN106330506B/zh
Priority to US17/009,334 priority patent/US11368357B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/324Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the data link layer [OSI layer 2], e.g. HDLC

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种业务故障定位方法及装置,能够精确定位多层OAM架构网络中的网络故障问题。方法包括:接收业务故障定位请求消息;根据业务报文的特征参数、IPS和IPD,确定业务故障位于第一三层设备与第二三层设备之间;获取第一三层设备和第二三层设备之间的第一网络拓扑;根据第一网络拓扑和业务报文的特征参数,确定业务报文在第一三层设备和第二三层设备之间的第一转发路径;配置第一转发路径上的转发设备的转发表项,并触发第一三层设备生成扩展的二层OAM报文;获取转发设备发送的第一转发路径的第一路径参数,并根据第一路径参数,确定业务故障的具体位置。

Description

一种业务故障定位方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种业务故障定位方法及装置。
背景技术
根据运营商网络运营的实际需要,网络的管理工作通常划分为3大类:操作(operation)、管理(administration)和维护(maintenance),简称OAM。现有的OAM技术中,针对同一种OAM功能,很多网络技术和网络层次都有自己的OAM机制和协议工具。例如,同样是连续性检测(continuity check,简称:CC)功能,网际协议(Internet Protocol,简称:IP)层有控制报文协议(Internet Control Message Protocol,简称:ICMP)Ping,多协议标签交换(Multi-Protocol Label Switch,简称:MPLS)技术有标签交换协议(Label Switch Protocol,简称:LSP)Ping。
在现有的多层OAM架构网络中,每个层次的OAM报文都有其特定的封装头/封装值,拥有不同封装头/封装值的OAM报文在网络中传输时可能沿不同的转发路径,也就是说,不同层次的OAM报文可能会拥有不同的转发路径。在定位网络故障时,为了找到故障原因,往往需要在多个协议层发送不同的OAM报文,而且要求各个协议层的OAM报文必须与业务报文具有相同的转发路径。然而,现有的多层OAM架构并不具备这种保证各个协议层的OAM报文的转发路径一致的业务故障定位能力。
为解决上述问题,互联网工程任务组(Internet Engineering TaskForce,简称:IETF)三层网络虚拟化(Network Virtualization Over Layer3,简称:NVO3)工作组提出了一种应用于虚拟扩展局域网(VirtualeXtensible Local Area Network,简称:VxLAN)的OAM方案,该方案通过使VxLAN OAM报文和业务报文使用相同的封装形式,保证VxLANOAM报文与业务报文沿相同的转发路径;通过在VxLAN OAM报文中,使用IP层生存时间(Time To Live,简称:TTL)字段,完成VxLAN OAM的路由跟踪功能,进而将故障问题定位到两个三层设备间。然而,该方案仅能将问题定位到两个三层设备之间,无法保证二层OAM报文与业务报文具有相同的转发路径,因此无法精确定位二层网络问题。
发明内容
本发明实施例提供一种业务故障定位方法及装置,能够精确定位多层OAM架构网络中的网络故障问题。
为达到上述目的,本发明实施例提供如下技术方案:
第一方面,提供一种业务故障定位方法,包括:
接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的网络协议IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;
根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,其中,所述第二三层设备为所述第一三层设备的下一跳三层设备;
获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;
根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;
向所述第一转发路径上的转发设备配置转发表项,并触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;
获取所述转发设备发送的所述第一转发路径的第一路径参数,并根据所述第一路径参数,确定所述业务故障的具体位置。
在第一方面第一种可能的实现方式中,结合第一方面,所述根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径,包括:
根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;
根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备;
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口;
根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备;
根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
在第一方面第二种可能的实现方式中,结合第一方面第一种可能的实现方式,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略;
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及所述第一三层设备的转发策略,计算得到所述第一三层设备的出端口;
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
获取所述二层设备对外开放的所述二层设备的转发策略;
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和所述第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
在第一方面第三种可能的实现方式中,结合第一方面第一种可能的实现方式,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
调用所述第一三层设备的应用程序接口API,其中,所述第一三层设备以所述API形式对外开放所述第一三层设备的转发策略;
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口;
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
调用所述二层设备的API,其中,所述二层设备以所述API形式对外开放所述二层设备的转发策略;
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
在第一方面第四种可能的实现方式中,结合第一方面第一种可能的实现方式,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数;
若所述第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;以及,
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数;
若所述二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
在第一方面第五种可能的实现方式中,结合第一方面第四种可能的实现方式,在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,还包括:
若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备;以及,
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,还包括:
若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
在第一方面第六种可能的实现方式中,结合第一方面至第一方面第五种可能的实现方式,所述扩展的二层OAM报文还包含至少一个类型-长度-内容TLV字段,所述TLV字段用于标识不同业务的扩展的二层OAM报文。
在第一方面第七种可能的实现方式中,结合第一方面至第一方面第五种可能的实现方式,所述根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,包括:
根据所述IPS和所述IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑;
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径;
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于所述第一三层设备与所述第二三层设备之间。
第二方面,提供一种业务故障定位装置,所述业务故障定位装置包括:接收单元、确定单元、获取单元、配置单元以及触发单元;
所述接收单元,用于接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的网络协议IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;
所述确定单元,用于根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,其中,所述第二三层设备为所述第一三层设备的下一跳三层设备;
所述获取单元,用于获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;
所述确定单元,还用于根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;
所述配置单元,用于向所述第一转发路径上的转发设备配置转发表项;
所述触发单元,用于触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;
所述获取单元,还用于获取所述转发设备发送的所述第一转发路径的第一路径参数;
所述确定单元,还用于根据所述第一路径参数,确定所述业务故障的具体位置。
在第二方面第一种可能的实现方式中,结合第二方面,所述确定单元具体用于:
根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;
根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备;
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口;
根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备;
根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
在第二方面第二种可能的实现方式中,结合第二方面第一种可能的实现方式,所述确定单元具体用于:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略;
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及所述第一三层设备的转发策略,计算得到所述第一三层设备的出端口;以及,
所述确定单元具体用于:
获取所述二层设备对外开放的所述二层设备的转发策略;
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和所述第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
在第二方面第三种可能的实现方式中,结合第二方面第一种可能的实现方式,调用所述第一三层设备的应用程序接口API,其中,所述第一三层设备以所述API形式对外开放所述第一三层设备的转发策略;
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口;以及,
所述确定单元具体用于:
调用所述二层设备的API,其中,所述二层设备以所述API形式对外开放所述二层设备的转发策略;
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
在第二方面第四种可能的实现方式中,结合第二方面第一种可能的实现方式,所述确定单元具体用于:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数;
若所述第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;以及,
所述确定单元具体用于:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数;
若所述二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
在第二方面第五种可能的实现方式中,结合第二方面第四种可能的实现方式,所述确定单元还具体用于:
在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备;
所述确定单元还具体用于:
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
在第二方面第六种可能的实现方式中,结合第二方面至第二方面第五种可能的实现方式,所述扩展的二层OAM报文还包含至少一个类型-长度-内容TLV字段,所述TLV字段用于标识不同业务的扩展的二层OAM报文。
在第二方面第七种可能的实现方式中,结合第二方面至第二方面第五种可能的实现方式,所述确定单元具体用于:
根据所述IPS和所述IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑;
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径;
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于所述第一三层设备与所述第二三层设备之间。
基于本发明实施例提供的业务故障定位方法和装置,由于本发明实施例在确定业务故障位于第一三层设备与第二三层设备之间之后,还确定业务报文在这两个三层设备之间的第一转发路径,并向所述第一转发路径上的转发设备配置转发表项,以使得所述转发设备根据所述第一转发路径转发扩展的二层OAM报文,从而保证了扩展的二层OAM报文与业务报文具有相同的转发路径,进而可以精确定位二层网络的故障问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的业务故障定位方法流程示意图一;
图2为本发明实施例提供的LTM报文格式示意图;
图3为图2所示的LTM报文中的标志位字段格式示意图;
图4为本发明实施例提供的业务故障定位方法流程示意图二;
图5为本发明实施例提供的VxLAN网络结构示意图;
图6为图2所示的LTM报文中额外TLV字段格式示意图;
图7为本发明实施例提供的业务故障定位装置结构示意图一;
图8为本发明实施例提供的业务故障定位装置结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。
实施例一、
本发明实施例提供一种业务故障定位方法,如图1所示,方法包括:
S101、接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数。
具体的,本发明实施例中,业务报文的特征参数具体可以包括业务五元组(即业务的源IP地址、业务的目标IP地址、业务的源端口号、业务的目标端口号和协议类型)。当然,业务报文的特征参数还可能包含其它参数,比如虚拟局域网(Virtual Local Area Network,简称:VLAN)配置参数等,本发明实施例对此不作具体参数,
S102、根据所述业务报文的特征参数,所述IPS和IPD,确定业务故障位于第一三层设备和第二三层设备之间,其中,第二三层设备为第一三层设备的下一跳三层设备。
具体的,本发明实施例中,可以采用现有的NVO3 VxLAN OAM方案,在VxLAN OAM报文中,使用IP层TTL字段,以及所述业务报文的特征参数,所述IPS和IPD,完成VxLAN OAM的路由跟踪功能,进而将业务故障定位到两个三层设备之间。当然,也可以采用其它方式将业务故障定位在两个三层设备之间,具体可参考下述实施例,此处暂不描述。
S103、获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑。
具体的,本发明实施例中,业务故障定位装置可以以第一三层设备的IP地址和第二三层设备的IP地址为关键字,向软件定义网络(SoftwareDefined Network,简称:SDN)控制器或者网元管理系统(ElementManagement System,简称:EMS)/网络管理系统(Network ManagementSystem,简称:NMS)请求第一三层设备和第二三层设备之间的第一网络拓扑,该第一网络拓扑可以包含各设备之间的级联关系,级联端口信息(包括端口号、端口媒体访问控制(Media Access Control,简称:MAC)地址、端口IP地址等)以及设备类型(包括三层设备、二层设备)等。
其中,本发明实施例中,“级联”具体是指连接,“级联设备”具体是指相连接的下一跳设备,比如,A的级联设备具体是指,与A相连接的下一跳设备。
S104、根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
其中,第一转发路径具体是指,业务报文在第一三层设备和第二三层设备之间的传输路径,比如,第一转发路径可以是:第一三层设备->设备A->设备B->第二三层设备。
S105、向所述第一转发路径上的转发设备配置转发表项,并触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文。
具体的,本发明实施例中,业务故障定位装置可以使用SDN控制器或者EMS/NMS向第一转发路径上的转发设备配置转发表项。
其中,本发明实施例中,第一转发路径上转发设备具体可以包括第一三层设备、以及所述第一三层设备和所述第二三层设备之间的每个二层设备,本发明实施例对此不作具体限定。
优选的,该扩展的二层OAM报文可以是扩展的链路跟踪消息(LinkTrace Message,简称:LTM)。示例性的,如图2所示,为LTM格式,包括:维护实体(Maintenance Entity,简称:ME)组(ME Group,简称:MEG)级别(MEG Level,简称:MEL)字段、版本(Version)字段、操作码(Opcode)字段、标志位(Flags)字段、类型-长度-内容(Type-length-value,简称:TLV)偏移字段,事务标识(Transaction ID)字段、TTL字段、源MAC地址字段、目的MAC地址字段、额外(additional)TLV字段、以及TLV结束字段。其中,标志位字段如图3所示,仅最高bit位在使用,表示根据从转发表中学习到的MAC地址来转发LTM报文,默认最高位值为1,其他7个bit位默认为0。本发明实施例中,可以从这7位中取出一位进行扩展,比如将第7位设置为1,指示该二层OAM报文为扩展的二层OAM报文,进而可以将该扩展的二层OAM报文与其它故障检测无关的二层OAM报文区分开,从而避免了配置该扩展的二层OAM报文的转发路径对其它故障检测无关的二层OAM报文的转发路径的影响。
S106、获取所述转发设备发送的第一转发路径的第一路径参数,并根据第一路径参数,确定所述业务故障的具体位置。
具体的,本发明实施例中,在第一转发路径上的转发设备根据第一转发路径转发扩展的二层OAM报文的过程中,会测出第一转发路径的第一路径参数,进而转发设备会向业务故障定位装置上报该第一路径参数,由业务故障定位装置根据第一路径参数,定位所述业务故障的具体位置。
其中,本发明实施例中,业务故障具体可能是链路故障,也可能是端口故障,还可能是设备故障,本发明实施例对此不作具体限定。
其中,本发明实施例中,路径参数具体是指延时、丢包率、是否连通等用来衡量路径质量的参数。
具体的,如图4所示,根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径(步骤S104),包括:
S104a、根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口。
S104b、根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备。
S104c、对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口。
具体的,本发明实施例中,第一三层设备和第二三层设备之间的二层特征参数具体可以包括:第一三层设备的出端口的MAC地址、第二三层设备的入端口的MAC地址,以及VLAN值等,本发明实施例对此不作具体限定。
S104d、根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备。
S104e、根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
其中,一种可能的实现方式中,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取第一三层设备的出端口(步骤S104a),具体可以包括:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略;
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及第一三层设备的转发策略,计算得到所述第一三层设备的出端口。
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口(步骤S104c),具体可以包括:
获取所述二层设备对外开放的所述二层设备的转发策略;
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
另一种可能的实现方式中,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口(步骤S104a),具体可以包括:
调用第一三层设备的应用程序接口(Application Programminglnterface,简称:API),其中,第一三层设备以API形式对外开放第一三层设备的转发策略;
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口。
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口(步骤S104c),具体可以包括:
调用所述二层设备的API,其中,所述二层设备以API形式对外开放所述二层设备的转发策略;
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
其中,本发明实施例中的转发策略可以包括多路径选择算法、转发表项等,本发明实施例对此不作具体限定。
下面以一个具体示例对本发明实施例提供的业务故障定位方法进行简要说明。
如图5所示为一个VxLAN网络示意图,源网络虚拟化端点(Source-Network Virtualization Endpoint,简称:S-NVE)为一个VxLAN网关,可视为源三层设备,目的网络虚拟化端点(Source NetworkVirtualization Endpoint,简称:D-NVE)为另一端的VxLAN网关,可视为目的三层设备。当使用者发现业务质量下降,需要定位故障位置时,向业务故障定位装置发送携带S-NVE的IP地址IPS,D-NVE的IP地址IPD,及业务五元组(即业务的源IP地址、业务的目标IP地址、业务的源端口号、业务的目标端口号和协议类型)的业务故障定位请求消息,请求进行业务故障位置的定位,业务故障定位装置将按以下步骤进行业务故障定位(假设业务转发路径如图5中箭头所示,业务故障发生在N5和N6之间):
步骤一、以源三层设备S-NVE的IP地址IPS,目的三层设备D-NVE1的IP地址IPD,以及业务五元组(即业务的源IP地址、业务的目标IP地址、业务的源端口号、业务的目标端口号和协议类型)作为关键字,使用NVO3 VxLAN OAM方案将业务故障定位到第一三层设备N4和第二三层设备D-NVE1之间。
步骤二、以第一三层设备N4的IP地址IPN4和第二三层设备D-NVE1的IP地址IPD作为关键字,向SDN控制器或者EMS/NMS请求N4和D-NVE1之间的网络拓扑。该网络拓扑包含各设备间的级联关系,级联端口信息(端口号、端口MAC地址、端口IP地址等)以及设备类型(三层转发设备、二层转发设备),具体可参见图5中的N4至D-NVE1之间的网络拓扑。
步骤三、确定业务报文在N4至D-NVE1之间的第一转发路径,具体步骤为:
a)、调用N4的API,以业务报文的特征参数(比如业务五元组)和N4的入端口IN1作为关键字,查询N4的转发策略,获得N4的出端口为OUT1,用该出端口OUT1匹配步骤二中获得的网络拓扑,得知级联设备为N5,入端口为IN1,且N5为二层设备;
b)、调用N5的API,将N4出端口OUT1的MAC地址作为源MAC地址,下一跳三层设备D-NVE1的入端口IN1的MAC地址作为目的MAC地址,以a)中N4上查询到的入端口IN1、业务报文的特征参数(比如业务五元组)、源MAC地址和目的MAC地址作为关键字,查询N5的转发策略,获得N5的出端口为OUT1,匹配步骤二中获得的网络拓扑,得知级联设备为N6,入端口为IN1,且N6为二层设备;
c)、调用N6的API,以b)中N5上查询到的入端口IN1、源MAC地址、目的地址和业务报文的特征参数(比如业务五元组)作为关键字,查询N6的转发策略,获得N6的出端口为OUT1,匹配步骤二中获得的网络拓扑,得知级联设备为D-NVE1,此即为第二三层设备,停止查询。
据此,得到业务报文在N4和D-NVE1之间的第一转发路径为:(IN1)N4(OUT1)->(IN1)N5(OUT1)->(IN1)N6(OUT1) ->(IN1)D-NVE1。
步骤四、根据第一转发路径向第一转发路径上的转发设备配置转发表项。其中,具体设置可以为:
N4:目的MAC为D-NVE,携带业务故障定位标识,出端口为OUT1;
N5:从IN1口进入,目的MAC为D-NVE,携带业务故障定位标识,出端口为OUT1;
N6:从IN1口进入,目的MAC为D-NVE,携带业务故障定位标识,出端口为OUT1。
步骤五、触发第一三层设备N4生成扩展的二层OAM报文,以使得转发设备根据第一转发路径转发扩展的二层OAM报文。
具体的,扩展的二层OAM报文的报文格式可参考上述实施例的描述,此处不再赘述。
步骤六、获取转发设备发送的第一转发路径的第一路径参数,并根据第一路径参数,确定业务故障的具体位置。
示例性的,假设N5和N6发送的路径参数过大或过小,则表征跨层业务故障的位置在N5和N6之间。
至此,整个业务故障定位方法执行结束。
需要说明的是,本示例中步骤三仅是以上述实施例中其中一种获取第一转发路径的方式为例进行说明,当然,也可以以上述实施例中另外一种获取第一转发路径的方式获取第一转发路径,此处不再赘述。
进一步的,本发明实施例提供的业务故障定位方法中,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口(步骤S104a),具体可以包括:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数;
若第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口。
根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口(步骤S104c),具体可以包括:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数;
若任一二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
进一步的,在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,还包括:
若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备;以及,
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,还包括:
若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
即,本发明实施例中,根据第一网络拓扑,在该设备有多个出端口,也就是说该设备存在多路径时,采用上述的路径查找方式。若某一设备的出端口仅有一个,也就是该设备不存在多路径,则可以不用采用上述的路径查找方式,而是直接根据第一网络拓扑确定级联顺序。这样可以节省路径查找的时间,提升业务故障定位方法执行的效率。
可选的,本发明实施例提供的业务故障定位方法中,扩展的二层OAM报文还可以包含至少一个TLV字段,该TLV字段用于标识不同业务的扩展的二层OAM报文。
如上所述,该扩展的二层OAM报文具体可以是扩展的LTM报文,在图2所示的LTM报文中,LTM报文可以包含0个或多个TLV字段,但这个字段不是必须的,由使用者根据自己的需要来决定。TLV偏移字段用于指示第一个TLV字段相对于TLV偏移字段的字节偏移量,比如若TLV偏移值为0,则标识TLV偏移字段之后紧跟第一个TLV字段。另外,每个LTM报文必然携带一个TLV结束字段,即从TLV偏移字段指定的偏移处开始,直到遇到TLV结束字段,这之间全是TLV字段,有可能有多个,有可能是0个。其中,TLV字段格式可以如图6所示,每个TLV字段中的类型和长度字段的长度是固定的,内容的长度是由长度字段指定的,因此当知道一个TLV的开始处,就可以计算出一个TLV的结束处,若结束处不是TLV结束字段,则就是另外一个TLV的开始处。
具体的,考虑到在N4和D-NVE1之间可能有多种业务的报文在转发,他们的转发路径是不一样的,比如有的沿N4-N5-N6-D-NVE1路径转发,有的沿N4-N8-N6-D-NVE1路径转发,但是不同的扩展的二层OAM报文可能拥有相同的目的MAC地址、以太网类型、并且都包含第一字段,此时无法区分不同业务,因此,本发明实施例中,扩展的二层OAM报文还可以包含至少一个TLV字段,该TLV字段用于标识不同业务的扩展的二层OAM报文。
这样,通过TLV字段可以区分不同业务的扩展的二层OAM报文,从而可以同时进行多业务故障定位。
需要说明的是,本发明实施例需要根据TLV的格式重新定义TLV字段。比如,指明类型字段值为200时,表征该TLV为业务标识TLV。该业务标识的值可以根据该TLV的长度字段从TLV的内容字段读取。
进一步的,如上所述,步骤S102中,可以采用现有的NVO3 VxLANOAM方案,在VxLAN OAM报文中,使用IP层TTL字段,以及所述业务报文的特征参数,所述IPS和IPD,完成VxLAN OAM的路由跟踪功能,进而将业务故障定位到两个三层设备之间。当然,也可以采用其它方式将跨层业务的故障问题定位在两个三层设备之间,比如:
根据所述业务报文的特征参数,所述IPS和IPD,确定业务故障位于第一三层设备和第二三层设备之间(步骤S102),具体可以包括:
根据所述IPS和IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑;
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径;
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于第一三层设备与第二三层设备之间。
即,本发明实施例中,可以采用先确定业务报文转发路径,再根据确定的转发路径来设置OAM报文的转发路径的二层业务故障定位思想进行二层以上的故障定位。比如,在进行三层业务故障定位时,可按照上述方法先找出源三层设备至目的三层设备的第二转发路径,然后根据第二转发路径,设置沿途转发设备的转发表项,进而根据第二转发路径转发三层OAM报文,以测出业务报文所经过的三层设备之间的第二路径参数,从而根据第二路径参数,确定业务故障位于第一三层设备与第二三层设备之间。
本发明实施例提供业务故障定位方法,包括:接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间;获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;向所述第一转发路径上的转发设备配置转发表项,并触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;获取所述转发设备发送的所述第一转发路径的第一路径参数,并根据所述第一路径参数,确定所述业务故障的具体位置。由于本发明实施例在确定业务故障位于第一三层设备与第二三层设备之间之后,还确定业务报文在这两个三层设备之间的第一转发路径,并向所述第一转发路径上的转发设备配置转发表项,以使得所述转发设备根据所述第一转发路径转发扩展的二层OAM报文,从而保证了扩展的二层OAM报文与业务报文具有相同的转发路径,进而可以精确定位二层网络的故障问题。
实施例二、
本发明实施例提供一种业务故障定位装置700,具体如图7所示,所述业务故障定位装置700包括:接收单元701、确定单元702、获取单元703、配置单元704以及触发单元705。
所述接收单元701,用于接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数。
所述确定单元702,用于根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,其中,所述第二三层设备为所述第一三层设备的下一跳三层设备。
所述获取单元703,用于获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑。
所述确定单元702,还用于根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
所述配置单元704,用于向所述第一转发路径上的转发设备配置转发表项。
所述触发单元705,用于触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文。
所述获取单元703,还用于获取所述转发设备发送的所述第一转发路径的第一路径参数。
所述确定单元702,还用于根据所述第一路径参数,确定所述业务故障的具体位置。
进一步的,所述确定单元702具体用于:
根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口。
根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备。
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口。
根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备。
根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
进一步的,一种可能的实现方式中,所述确定单元702具体用于:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略。
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及所述第一三层设备的转发策略,计算得到所述第一三层设备的出端口。
以及,所述确定单元702具体用于:
获取所述二层设备对外开放的所述二层设备的转发策略。
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和所述第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
另一种可能的实现方式中,所述确定单元702具体用于:
调用所述第一三层设备的API,其中,所述第一三层设备以所述API形式对外开放所述第一三层设备的转发策略。
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口。
以及,所述确定单元702具体用于:
调用所述二层设备的API,其中,所述二层设备以所述API形式对外开放所述二层设备的转发策略。
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
进一步的,所述确定单元702具体用于:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数。
若所述第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口。
以及,所述确定单元702具体用于:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数。
若所述二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
进一步的,所述确定单元702还具体用于:
在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备。
所述确定单元702还具体用于:
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
优选的,所述扩展的二层OAM报文还包含至少一个类型-长度-内容TLV字段,所述TLV字段用于标识不同业务的扩展的二层OAM报文。
进一步的,所述确定单元702具体用于:
根据所述IPS和所述IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑。
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径。
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于所述第一三层设备与所述第二三层设备之间。
具体的,通过本发明实施例提供的业务故障定位装置700进行业务故障定位的方法可参考实施例一的描述,本发明实施例在此不再赘述。
本发明实施例提供业务故障定位装置,包括:接收单元接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;确定单元根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间;获取单元获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;确定单元根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;配置单元向所述第一转发路径上的转发设备配置转发表项,触发单元触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;获取单元获取所述转发设备发送的所述第一转发路径的第一路径参数,确定单元根据所述第一路径参数,确定所述业务故障的具体位置。由于本发明实施例提供的OAM装置在确定业务故障位于第一三层设备与第二三层设备之间之后,还确定业务报文在这两个三层设备之间的第一转发路径,并向所述第一转发路径上的转发设备配置转发表项,以使得所述转发设备根据所述第一转发路径转发扩展的二层OAM报文,从而保证了扩展的二层OAM报文与业务报文具有相同的转发路径,进而可以精确定位二层网络的故障问题。
实施例三、
本发明实施例提供一种业务故障定位装置80,具体如图8所示,包括处理器81、通信接口82、存储器83和总线84。
其中,所述处理器81具体可以是一个中央处理器(Central ProcessingUnit,简称:CPU),或者是特定集成电路(Application Specific IntegratedCircuit,简称:ASIC)等,本发明实施例对此不作具体限定。
所述存储器83具体可以包含高速随机存取存储器(Random AccessMemory,简称:RAM),也可能包含非易失性存储器(non-volatilememory),例如至少一个磁盘存储器,本发明实施例对此不作具体限定。
所述总线84具体可以是工业标准体系结构(Industry StandardArchitecture,简称:ISA)总线、外部设备互连(Peripheral ComponentInterconnect,简称:PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,简称:EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
所述总线84,用于所述处理器81,所述通信接口82、所述存储器83之间的连接通信。
所述通信接口82,用于所述业务故障定位装置80与外部的通信。
所述处理器81,用于调用所述存储器83中存储的程序代码831,实现图1和图4所示的方法。
具体的,通过本发明实施例提供的业务故障定位装置80进行业务故障定位的方法可参考实施例一的描述,本发明实施例在此不再赘述。
由于本发明实施例提供的OAM装置在确定业务故障位于第一三层设备与第二三层设备之间之后,还确定业务报文在这两个三层设备之间的第一转发路径,并向所述第一转发路径上的转发设备配置转发表项,以使得所述转发设备根据所述第一转发路径转发扩展的二层OAM报文,从而保证了扩展的二层OAM报文与业务报文具有相同的转发路径,进而可以精确定位二层网络的故障问题。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种业务故障定位方法,其特征在于,包括:
接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的网络协议IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;
根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,其中,所述第二三层设备为所述第一三层设备的下一跳三层设备;
获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;
根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;
向所述第一转发路径上的转发设备配置转发表项,并触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;
获取所述转发设备发送的所述第一转发路径的第一路径参数,并根据所述第一路径参数,确定所述业务故障的具体位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径,包括:
根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;
根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备;
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口;
根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备;
根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略;
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及所述第一三层设备的转发策略,计算得到所述第一三层设备的出端口;
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
获取所述二层设备对外开放的所述二层设备的转发策略;
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和所述第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
调用所述第一三层设备的应用程序接口API,其中,所述第一三层设备以所述API形式对外开放所述第一三层设备的转发策略;
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口;
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
调用所述二层设备的API,其中,所述二层设备以所述API形式对外开放所述二层设备的转发策略;
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
5.根据权利要求2所述的方法,其特征在于,所述根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口,包括:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数;
若所述第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;
所述根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,包括:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数;
若所述二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,还包括:
若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备;以及,
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,还包括:
若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述扩展的二层OAM报文还包含至少一个类型-长度-内容TLV字段,所述TLV字段用于标识不同业务的扩展的二层OAM报文。
8.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,包括:
根据所述IPS和所述IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑;
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径;
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于所述第一三层设备与所述第二三层设备之间。
9.一种业务故障定位装置,其特征在于,所述业务故障定位装置包括:接收单元、确定单元、获取单元、配置单元以及触发单元;
所述接收单元,用于接收业务故障定位请求消息,所述业务故障定位请求消息携带业务报文的源三层设备的网络协议IP地址IPS、目的三层设备的IP地址IPD、以及所述业务报文的特征参数;
所述确定单元,用于根据所述业务报文的特征参数、所述IPS和所述IPD,确定业务故障位于第一三层设备与第二三层设备之间,其中,所述第二三层设备为所述第一三层设备的下一跳三层设备;
所述获取单元,用于获取所述第一三层设备和所述第二三层设备之间的第一网络拓扑;
所述确定单元,还用于根据所述第一网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径;
所述配置单元,用于向所述第一转发路径上的转发设备配置转发表项;
所述触发单元,用于触发所述第一三层设备生成扩展的二层OAM报文,以使得所述转发设备根据所述第一转发路径转发所述扩展的二层OAM报文;
所述获取单元,还用于获取所述转发设备发送的所述第一转发路径的第一路径参数;
所述确定单元,还用于根据所述第一路径参数,确定所述业务故障的具体位置。
10.根据权利要求9所述的业务故障定位装置,其特征在于,所述确定单元具体用于:
根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;
根据所述第一三层设备的出端口以及所述第一网络拓扑,获得所述第一三层设备的级联二层设备;
对于所述第一三层设备和所述第二三层设备之间的每个二层设备,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口,其中,所述二层设备的入端口为所述第一网络拓扑中与所述二层设备的前一级联设备的出端口连接的端口;
根据所述二层设备的出端口以及所述第一网络拓扑,获得所述二层设备的级联设备;
根据所述第一三层设备的级联二层设备和所述每个二层设备的级联设备,确定所述业务报文在所述第一三层设备和所述第二三层设备之间的第一转发路径。
11.根据权利要求10所述的业务故障定位装置,其特征在于,所述确定单元具体用于:
获取所述第一三层设备对外开放的所述第一三层设备的转发策略;
根据所述第一三层设备的入端口和所述业务报文的特征参数,以及所述第一三层设备的转发策略,计算得到所述第一三层设备的出端口;以及,
所述确定单元具体用于:
获取所述二层设备对外开放的所述二层设备的转发策略;
根据所述二层设备的入端口、所述业务报文的特征参数、所述第一三层设备和所述第二三层设备之间的二层特征参数,以及所述二层设备的转发策略,计算得到所述二层设备的出端口。
12.根据权利要求10所述的业务故障定位装置,其特征在于,所述确定单元具体用于:
调用所述第一三层设备的应用程序接口API,其中,所述第一三层设备以所述API形式对外开放所述第一三层设备的转发策略;
以所述第一三层设备的入端口和所述业务报文的特征参数为关键字,查询所述第一三层设备的转发策略,获得所述第一三层设备发送的所述第一三层设备的出端口;以及,
所述确定单元具体用于:
调用所述二层设备的API,其中,所述二层设备以所述API形式对外开放所述二层设备的转发策略;
以所述二层设备的入端口、所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数为关键字,查询所述二层设备的转发策略,获得所述二层设备发送的所述二层设备的出端口。
13.根据权利要求10所述的业务故障定位装置,其特征在于,所述确定单元具体用于:
根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数;
若所述第一三层设备的级联二层设备的个数不为1,根据所述第一三层设备的入端口和所述业务报文的特征参数,获取所述第一三层设备的出端口;以及,
所述确定单元具体用于:
根据所述第一网络拓扑,确定所述二层设备的级联设备的个数;
若所述二层设备的级联设备的个数不为1,根据所述二层设备的入端口,所述业务报文的特征参数以及所述第一三层设备和所述第二三层设备之间的二层特征参数,获取所述二层设备的出端口。
14.根据权利要求13所述的业务故障定位装置,其特征在于,所述确定单元还具体用于:
在所述根据所述第一网络拓扑,确定所述第一三层设备的级联二层设备的个数之后,若所述第一三层设备的级联二层设备的个数为1,则确定所述第一三层设备的级联二层设备为所述第一网络拓扑中所述第一三层设备级联的二层设备;
所述确定单元还具体用于:
在所述根据所述第一网络拓扑,确定所述二层设备的级联设备的个数之后,若所述任一二层设备的级联设备的个数为1,则确定所述二层设备的级联设备为所述第一网络拓扑中所述二层设备的级联设备。
15.根据权利要求9-14任一项所述的业务故障定位装置,其特征在于,所述扩展的二层OAM报文还包含至少一个类型-长度-内容TLV字段,所述TLV字段用于标识不同业务的扩展的二层OAM报文。
16.根据权利要求9-14任一项所述的业务故障定位装置,其特征在于,所述确定单元具体用于:
根据所述IPS和所述IPD,获取所述源三层设备和所述目的三层设备之间的第二网络拓扑;
根据所述第二网络拓扑和所述业务报文的特征参数,确定所述业务报文在所述源三层设备和所述目的三层设备之间的第二转发路径;
根据所述第二转发路径转发三层OAM报文,并获取所述第二转发路径的第二路径参数后,根据所述第二路径参数,确定所述业务故障位于所述第一三层设备与所述第二三层设备之间。
CN201510372320.4A 2015-06-29 2015-06-29 一种业务故障定位方法及装置 Active CN106330506B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201510372320.4A CN106330506B (zh) 2015-06-29 2015-06-29 一种业务故障定位方法及装置
PCT/CN2016/086379 WO2017000802A1 (zh) 2015-06-29 2016-06-20 一种业务故障定位方法及装置
EP16817166.8A EP3300301B1 (en) 2015-06-29 2016-06-20 Service fault location method and device
EP20182779.7A EP3783837B1 (en) 2015-06-29 2016-06-20 Service fault locating method and apparatus
ES16817166T ES2820775T3 (es) 2015-06-29 2016-06-20 Método y dispositivo de ubicación de fallos de servicios
US15/856,935 US10785095B2 (en) 2015-06-29 2017-12-28 Service fault locating method and apparatus
US17/009,334 US11368357B2 (en) 2015-06-29 2020-09-01 Service fault locating method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510372320.4A CN106330506B (zh) 2015-06-29 2015-06-29 一种业务故障定位方法及装置

Publications (2)

Publication Number Publication Date
CN106330506A true CN106330506A (zh) 2017-01-11
CN106330506B CN106330506B (zh) 2019-08-16

Family

ID=57607874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510372320.4A Active CN106330506B (zh) 2015-06-29 2015-06-29 一种业务故障定位方法及装置

Country Status (5)

Country Link
US (2) US10785095B2 (zh)
EP (2) EP3300301B1 (zh)
CN (1) CN106330506B (zh)
ES (1) ES2820775T3 (zh)
WO (1) WO2017000802A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110519103A (zh) * 2019-09-18 2019-11-29 国网河北省电力有限公司邢台供电分公司 一种异构网络的故障定位方法、装置及终端
WO2020135547A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 一种确定转发故障位置的方法和设备
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN114143088A (zh) * 2021-11-30 2022-03-04 北京天融信网络安全技术有限公司 网络故障诊断方法、装置、设备及计算机可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10110551B1 (en) * 2017-08-14 2018-10-23 Reza Toghraee Computer-implemented system and methods for providing IPoE network access using software defined networking
CN114448785A (zh) * 2022-03-18 2022-05-06 新浪网技术(中国)有限公司 定位故障网络设备的方法、装置及电子设备
CN114866398B (zh) * 2022-03-24 2024-01-09 阿里巴巴(中国)有限公司 网络故障诊断方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6766482B1 (en) * 2001-10-31 2004-07-20 Extreme Networks Ethernet automatic protection switching
CN1848757A (zh) * 2005-04-15 2006-10-18 华为技术有限公司 通信网络中三层vpn的操作维护系统及方法
CN101155076A (zh) * 2006-09-28 2008-04-02 华为技术有限公司 一种检测二层虚拟专用网伪线故障的方法
CN101557343A (zh) * 2009-04-03 2009-10-14 联想天工网络(深圳)有限公司 Vrrp拓扑网络中二层环路的检测与保护方法
CN103428009A (zh) * 2012-05-14 2013-12-04 中兴通讯股份有限公司 实现分组同步网的运行管理和维护(oam)方法及装置
US20140078884A1 (en) * 2010-03-09 2014-03-20 Juniper Networks, Inc. Communicating network path and status information in multi-homed networks

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3430074B2 (ja) * 1999-07-05 2003-07-28 日本電気株式会社 運用保守セル検出装置および方法
WO2011024187A2 (en) * 2009-07-08 2011-03-03 Tejas Networks Limited A protection switching method and system
US8307050B2 (en) * 2010-03-05 2012-11-06 Ca, Inc. System and method for intelligent service assurance in network management
JP2012028938A (ja) * 2010-07-21 2012-02-09 Nec Corp 通信装置、通信システム、通信方法、および通信プログラム
US9185018B2 (en) * 2010-10-22 2015-11-10 Brocade Communications Systems, Inc. Path diagnosis in communication networks
CN101986604B (zh) * 2010-10-29 2015-01-28 中兴通讯股份有限公司 分组传送网的链路故障定位方法及系统
US9054828B2 (en) * 2011-10-14 2015-06-09 Glimmerglass Networks, Inc. Method and system for managing optical distribution network
CN103716172B (zh) * 2012-09-28 2018-06-12 中兴通讯股份有限公司 一种基于多协议标签交换的oam方法及装置
CN102984011B (zh) * 2012-12-04 2015-05-13 杭州华三通信技术有限公司 链路故障定位方法及设备
US9571362B2 (en) * 2013-05-24 2017-02-14 Alcatel Lucent System and method for detecting a virtual extensible local area network (VXLAN) segment data path failure
US9444675B2 (en) * 2013-06-07 2016-09-13 Cisco Technology, Inc. Determining the operations performed along a service path/service chain
US9800497B2 (en) * 2015-05-27 2017-10-24 Cisco Technology, Inc. Operations, administration and management (OAM) in overlay data center environments
US9992056B2 (en) * 2015-10-20 2018-06-05 Cisco Technology, Inc. Triggered in-band operations, administration, and maintenance in a network environment

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6766482B1 (en) * 2001-10-31 2004-07-20 Extreme Networks Ethernet automatic protection switching
CN1848757A (zh) * 2005-04-15 2006-10-18 华为技术有限公司 通信网络中三层vpn的操作维护系统及方法
CN101155076A (zh) * 2006-09-28 2008-04-02 华为技术有限公司 一种检测二层虚拟专用网伪线故障的方法
CN101557343A (zh) * 2009-04-03 2009-10-14 联想天工网络(深圳)有限公司 Vrrp拓扑网络中二层环路的检测与保护方法
US20140078884A1 (en) * 2010-03-09 2014-03-20 Juniper Networks, Inc. Communicating network path and status information in multi-homed networks
CN103428009A (zh) * 2012-05-14 2013-12-04 中兴通讯股份有限公司 实现分组同步网的运行管理和维护(oam)方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020135547A1 (zh) * 2018-12-29 2020-07-02 华为技术有限公司 一种确定转发故障位置的方法和设备
CN111385120A (zh) * 2018-12-29 2020-07-07 华为技术有限公司 一种确定转发故障位置的方法和设备
CN111385120B (zh) * 2018-12-29 2021-10-26 华为技术有限公司 一种确定转发故障位置的方法和设备
US11902087B2 (en) 2018-12-29 2024-02-13 Huawei Technologies Co., Ltd. Forwarding fault location determining method and device
CN110519103A (zh) * 2019-09-18 2019-11-29 国网河北省电力有限公司邢台供电分公司 一种异构网络的故障定位方法、装置及终端
CN112653587A (zh) * 2019-10-12 2021-04-13 北京奇艺世纪科技有限公司 一种网络连通状态检测方法及装置
CN114143088A (zh) * 2021-11-30 2022-03-04 北京天融信网络安全技术有限公司 网络故障诊断方法、装置、设备及计算机可读存储介质
CN114143088B (zh) * 2021-11-30 2024-02-09 天融信雄安网络安全技术有限公司 网络故障诊断方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
US20180123873A1 (en) 2018-05-03
EP3783837B1 (en) 2022-07-27
EP3300301A4 (en) 2018-05-23
ES2820775T3 (es) 2021-04-22
CN106330506B (zh) 2019-08-16
US20200403849A1 (en) 2020-12-24
EP3300301A1 (en) 2018-03-28
US11368357B2 (en) 2022-06-21
EP3300301B1 (en) 2020-08-05
WO2017000802A1 (zh) 2017-01-05
US10785095B2 (en) 2020-09-22
EP3783837A1 (en) 2021-02-24

Similar Documents

Publication Publication Date Title
CN106330506A (zh) 一种业务故障定位方法及装置
WO2021170092A1 (zh) 报文处理方法、装置、网络设备及存储介质
CN101120552B (zh) 利用服务标签的mpls的环路防止方法以及网络节点
EP1856862B1 (en) System and method for network reachability detection
CN105939260B (zh) 覆盖网络中的过载功能
CN1716912B (zh) 提供分组交换通信网络中快速端到端失效转移的方法与设备
CN101536411B (zh) Pbt网络中的中间节点上的以太网oam
CN109873760A (zh) 处理路由的方法和装置、以及数据传输的方法和装置
CN108696434A (zh) 一种转发数据报文的方法、设备和系统
CN108574639A (zh) Evpn报文处理方法、设备及系统
CN108337157A (zh) 一种网络中传输报文的方法和节点
EP1482694A2 (en) Virtual private network fault tolerance
CN108574630A (zh) Evpn报文处理方法、设备及系统
CN113381933B (zh) SRv6网络中双向转发检测的方法与系统
CN101822006A (zh) 在包括多个交换机的集群交换机中设置抽象层
CN105099846A (zh) 传输数据报文的方法和供应商边缘设备
CN103475583B (zh) 清除媒体接入控制转发表项的方法和设备
JP6443864B2 (ja) パケット紛失検出を実装するための方法、装置、およびシステム
CN102273177A (zh) 邻居发现协议调解
CN104243362A (zh) 一种报文转发方法和装置
CN104660469A (zh) 一种二层网络的连通性检测方法及相关设备
CN103138955B (zh) 在第2层网络中使用多个igmp查询器
CN102546433A (zh) 基于mpls vpn的数据转发方法和边缘设备
CN109587059A (zh) Sr-be内层隧道标签的配置方法、设备及通信系统
CN107645446A (zh) 一种信息确定方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant