CN113132223A - 一种故障检测方法及设备 - Google Patents
一种故障检测方法及设备 Download PDFInfo
- Publication number
- CN113132223A CN113132223A CN202010043122.4A CN202010043122A CN113132223A CN 113132223 A CN113132223 A CN 113132223A CN 202010043122 A CN202010043122 A CN 202010043122A CN 113132223 A CN113132223 A CN 113132223A
- Authority
- CN
- China
- Prior art keywords
- lsp
- network device
- bfd
- packet
- message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/28—Routing or path finding of packets in data switching networks using route fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/50—Routing or path finding of packets in data switching networks using label swapping, e.g. multi-protocol label switch [MPLS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请实施例公开了一种故障检测方法及设备,该方法包括:待检测的第一LSP的源节点经过该第一LSP向目的节点发送第一报文,该第一报文中携带该第一LSP的路径信息,该第一LSP包括依次排列的多个LSR;目的节点接收到该第一报文后,根据路径信息,建立与第一LSP反向共路的第二LSP;那么,目的节点即可经过与之反向共路的第二LSP向源节点反馈第一BFD报文,以便源节点基于该第一BFD报文确定第一LSP的故障情况。这样,通过目的节点基于路径信息建立与待检测LSP反向共路的LSP,使得BFD检测中正向BFD报文和反向BFD报文共路传输成为可能,实现对LSP更加快速、准确的故障检测。
Description
技术领域
本申请涉及通信技术领域,特别是涉及一种故障检测方法及设备,用于流量工程(英文:Traffic Engineering,简称:TE)的约束路径的标签交换路径(英文:Control RouteLabel Switched Path,简称:CR-LSP)场景下,采用双向链路检测(英文:BidirectionalForwarding Detection,简称:BFD)机制检测LSP上是否存在故障。
背景技术
在多协议标签交换(英文:Multiprotocol Label Switching,简称:MPLS)TE中,隧道中可以包括多条从源节点(英文:Ingress)到目的节点(英文:Egress)的CR-LSP。为了确保CR-LSP能够安全和可靠的传输业务流,通常采用BFD这一能够快速进行端到端检测的机制,检测该CR-LSP是否存在故障。
目前,BFD机制在检测CR-LSP的过程包括:Ingress通过LSP向Egress发出正向检测报文,并要求Egress向Ingress反馈反向检测报文,从而确定该LSP是否存在故障。由于LSP是单向路径,那么,反向检测报文只能通过互联网协议(英文:Internet Protocol,简称:IP)路由的方式确定其传输路径,而IP路由方式所确定的IP路径很可能并不经过 LSP中的各标签交换节点(英文:Label Switching Router,简称:LSR),即,正向检测报文和反向检测报文并不共路,这样,检测结果反映LSP以及IP路由方式确定的IP路径的整体故障情况,无法准确反映LSP是否发生故障。
基于此,亟待提供一种故障检测方法,既利用到BFD机制可以快速完成检测的特点,又能够克服BFD机制的双向性和单向LSP的冲突,实现对LSP更加准确的故障检测。
发明内容
基于此,本申请实施例提供了一种故障检测方法及设备,通过在目的节点侧建立与待检测LSP共路的反向LSP,克服了BFD机制的双向性和单向LSP的冲突,使得优化的BFD机制能够对LSP进行更加准确的故障检测。
第一方面,本申请实施例提供了一种故障检测方法,应用于CR-LSP场景中待检测的第一LSP的第一网络设备(即,第一LSP的目的节点),故障检测的过程可以包括:第二网络设备(即,第一LSP的源节点)经过该第一LSP向第一网络设备发送第一报文,其中,该第一报文中携带该第一LSP的路径信息,该第一LSP包括依次排列的多个LSR;那么,第一网络设备接收到该第一报文后,即可根据路径信息,建立从第一网络设备到第二网络设备的第二LSP,该第二LSP包括的LSR均与第一LSP包括的LSR相同,且多个LSR 在第二LSP中的排列顺序与该多个LSR在第一LSP中的排列顺序相反;基于此,第一网络设备即可经过与之反向共路的第二LSP,向第二网络设备反馈第一BFD报文,以便第二网络设备基于该第一BFD报文确定第一LSP的故障情况。
可见,本申请实施例中,通过源节点将待检测的LSP的路径信息告知目的节点,目的节点基于路径信息建立与待检测LSP反向共路的LSP,利用正向LSP和建立的反向LSP 共路的特点,使得BFD检测中正向BFD报文和反向BFD报文共路传输成为可能,BFD 检测结果能够准确的反映该待检测LSP的故障情况,克服了BFD机制的双向性和单向LSP 的冲突,即,目前的BFD检测中正向BFD报文和反向BFD报文大概率不共路,导致检测结果无法准确反映LSP故障情况的问题,实现对LSP更加快速、准确的故障检测。
其中,第一报文例如可以是LSP-Ping报文,具体为LSP-Ping请求报文,那么,第一LSP的路径信息可以通过LSP-Ping报文中扩展的类型长度值(英文:Type Length Value,简称:TLV)字段携带。第一LSP的路径信息,例如可以是第一LSP所经过的各标签交换节点(英文:Label Switched Router,简称:LSR)的IP地址。这样,第一网络设备接收到该携带第一LSP的路径信息的第一报文,相当于获得了建立与第一LSP反向共路的第二 LSP的依据,使得第一网络设备建立第二LSP成为可能。
可以理解的是,第二网络设备也可以经过第一LSP向第一网络设备发送第二BFD报文,以满足BFD机制双向检测的特点,第一网络设备也能够根据其是否可以接收到第二网络设备经过第一LSP发送的第二BFD报文,确定该第一LSP的故障情况。
在一些可能的实现方式中,本申请实施例还可以在第一网络设备处确定其是否具有建立第二LSP的能力,并将该能力告知第一LSP的源节点(即,第二网络设备),以便第二网络设备确定其进行故障检测的具体策略。
作为一个示例,若第一网络设备确定其具有建立第二LSP的能力,则,第一网络设备不仅可以申请并与第二网络设备配合建立第二LSP,还可以向第二网络设备发送第二报文,该第二报文携带能力信息,该能力信息用于表征第一网络设备具备建立第二LSP的能力。那么,第二网络设备可以确定采用BFD机制进行故障检测,即,基于第一LSP和所述第二LSP,第一网络设备和第二网络设备协商BFD的配置参数;并且,基于协商确定的所述配置参数,第二网络设备经过第一LSP向第一网络设备发送BFD报文,第一网络设备经过该第一LSP接收到该BFD报文后,也基于协商确定的所述配置参数,向第二网络设备反馈响应报文。这样,本申请实施例提供的BFD机制能够实现对第一LSP快速和准确的故障检测。
作为另一个示例,若第一网络设备确定其不具有建立第二LSP的能力,则,在第一网络设备接收第二网络设备经过待检测的第一LSP发送的第一报文之后,第一网络设备可以不执行申请并与第二网络设备配合建立第二LSP的过程,而可以通过IP路由的方式,向第二网络设备发送第二报文,该第二报文中携带的能力信息,用于表征第一网络设备不具备建立第二LSP的能力;或者,在第一网络设备接收第二网络设备经过待检测的第一 LSP发送的第一报文之后,也可以不对第二网络设备发送第一报文进行回应,第二网络设备在得不到关于第一报文的回应时,也可以确定第一网络设备不具备建立第二LSP的能力。那么,第二网络设备即可选择不采用BFD机制对第一LSP进行故障检测,或者,如果可以容忍目前的BFD机制检测CR-LSP得到的检测结果误差,也可以选择采用目前的BFD 机制对第一LSP进行故障检测。这样,本申请实施例提供方法能够让源节点感知到目的节点建立第二LSP的能力,使得源节点能够根据需求配置其对第一LSP故障情况进行检测的机制,实现了对第一LSP更加灵活的故障检测。
第二方面,本申请实施例还提供了一种故障检测方法,应用于CR-LSP场景中待检测的第一LSP的第二网络设备(即,第一LSP的源节点),故障检测的过程可以包括:第二网络设备经过待检测的第一LSP向第一网络设备(即,第一LSP的目的节点)发送第一报文,其中,该第一报文中携带第一LSP的路径信息,该第一LSP包括依次排列的多个LSR;接着,第二网络设备接收第一网络设备经过第二LSP发送的第一BFD报文,其中,该第二LSP为第二网络设备基于所接收到的路径信息建立的,第二LSP包括该多个LSR,且该多个LSR在第二LSP中的排列顺序与该多个LSR在第一LSP中的排列顺序相反;那么,该第二网络设备即可基于该第一BFD报文,确定第一LSP的检测结果。
可见,本申请实施例中,通过源节点将待检测的LSP的路径信息告知目的节点,目的节点基于路径信息建立与待检测LSP反向共路的LSP,利用正向LSP和建立的反向LSP 共路的特点,使得BFD检测中正向BFD报文和反向BFD报文共路,BFD检测结果能够准确的反映该待检测LSP的故障情况,克服了BFD机制的双向性和单向LSP的冲突,即,目前的BFD检测中正向BFD报文和反向BFD报文大概率不共路,导致检测结果无法准确反映LSP故障情况的问题,实现对LSP更加快速、准确的故障检测。
其中,第一报文例如可以是LSP-Ping报文,具体为LSP-Ping请求报文,那么,第一LSP的路径信息可以通过LSP-Ping报文中扩展的TLV字段携带。第一LSP的路径信息,例如可以是第一LSP所经过的各LSR的IP地址。这样,第二网络设备发送携带第一LSP 的路径信息的第一报文,相当于向第一网络设备提供了建立与第一LSP反向共路的第二 LSP的依据,使得第一网络设备建立第二LSP成为可能。
可以理解的是,第二网络设备也可以经过第一LSP向第一网络设备发送第二BFD报文,以满足BFD机制双向检测的特点,第一网络设备也能够根据其是否可以接收到第二网络设备经过第一LSP发送的第二BFD报文,确定该第一LSP的故障情况。
在一些可能的实现方式中,本申请实施例还可以在第一网络设备处确定其是否具有建立第二LSP的能力,并将该能力告知第一LSP的源节点(即,第二网络设备),从而第二网络设备可以确定其进行故障检测的具体策略。
作为一个示例,若第一网络设备确定其具有建立第二LSP的能力,则,第二网络设备不仅可以配合第一网络设备建立第二LSP,还可以接收到第一网络设备发送的第二报文,该第二报文携带能力信息,该能力信息用于表征第一网络设备具备建立第二LSP的能力。那么,第二网络设备可以确定采用BFD机制进行故障检测,即,基于第一LSP和所述第二LSP,第二网络设备和第一网络设备协商BFD的配置参数;并且,基于协商确定的所述配置参数,第二网络设备经过第一LSP向第一网络设备发送BFD报文,第一网络设备经过该第一LSP接收到该BFD报文后,也基于协商确定的所述配置参数,向第二网络设备反馈响应报文。这样,本申请实施例提供的BFD机制能够实现对第一LSP快速和准确的故障检测。
作为另一个示例,若第一网络设备确定其不具有建立第二LSP的能力,则,在第二网络设备经过待检测的第一LSP向第一网络设备发送第一报文之后,第二网络设备可以不配合第一网络设备建立第二LSP,那么,第二网络设备即可选择不采用BFD机制对第一 LSP进行故障检测,或者,如果可以容忍目前的BFD机制检测CR-LSP得到的检测结果误差,也可以选择采用目前的BFD机制对第一LSP进行故障检测。这样,本申请实施例提供方法能够让源节点感知到目的节点建立第二LSP的能力,使得源节点能够根据需求配置其对第一LSP故障情况进行检测的机制,实现了对第一LSP更加灵活的故障检测。
在另一些可能的实现方式中,本申请实施例还可以包括:第二网络设备根据响应报文,确定第一LSP的检测结果。
作为一个示例,第二网络设备只要在发送下一个BFD报文之前,接收到BFD报文对应的响应报文,则确定第一LSP无故障;相反,若第二网络设备在发送下一个BFD报文时未接收到BFD报文对应的响应报文,则确定第一LSP故障。
作为另一个示例,还可以设置预设时长(例如:10毫秒),该预设时长可以用于指示发送BFD报文和接收其对应的响应报文之间所允许经过的最长时间,那么,若第二网络设备在预设时长接收到BFD报文对应的响应报文,则确定第一LSP无故障;相反,若第二网络设备在发送BFD报文后,经过预设时长还未接收到BFD报文对应的响应报文,则确定第一LSP故障。
可以理解的是,在确定第一LSP故障后,第二网络设备还可以将第一LSP承载的流量切换到该第一LSP的备份LSP上,以确保流量在网络中的正常传输;并且,该第二网络设备还可以上报告警消息,用于告知控用户该第一LSP发生故障,供技术人员尽快进行检测和维修,并在第一LSP修复后,第二网络设备再将该流量从备份的LSP上切回到该第一 LSP上。如此,实现了对CR-LSP合理和有效的管理,例如:MPLS TE隧道中的CR-LSP 的管理,使得流量能够在网络中被安全和可靠的传输。
第三方面,本申请实施例还提供了一种故障检测方法,应用于CR-LSP场景中待检测的第一LSP的第一网络设备(即,第一LSP的目的节点),故障检测的过程可以包括:第二网络设备(即,第一LSP的源节点)经过该第一LSP向第一网络设备发送第一报文,其中,该第一报文中携带该第一LSP的路径信息,该第一LSP包括依次排列的多个LSR;此时,一种情况下,若第一网络设备确定自身具备建立反向共路第二LSP的能力,则,执行根据所接收的路径信息建立从第二网络设备到第一网络设备的第二LSP,以便后续在第一网络设备和第二网络设备之间基于第一LSP和第二LSP进行BFD检测。另一种情况下,若第一网络设备确定自身不具备建立反向共路第二LSP的能力,则,第一网络设备可以通过IP路由方式向第二网络设备发送第二报文,告知第一网络设备不具备建立第二LSP的能力,或者,第一网络设备不进行回复,当第二网络设备在未收到回复的情况下,每隔预设时长向第一网络设备发送一次第一报文,在连续发送第一报文的次数达到预设次数时,确定第一网络设备不具备建立第二LSP的能力;这样,第二网络设备在确定第一网络设备不具备建立第二LSP的能力后,可以根据用户的实际检测需求,选择使用目前的BFD机制检测第一LSP的故障情况,或者,选择不再使用BFD机制对第一LSP进行故障检测。可见,本申请实施例中,通过让源节点感知到目的节点建立反向共路LSP能力,使得源节点能够决策后续故障检测中采用的具体方式,从而使得对CR-LSP场景中LSP的故障检测更加灵活。
第四方面,本申请实施例还提供了一种故障检测方法,应用于CR-LSP场景中待检测的第一LSP的第二网络设备(即,第一LSP的源节点),故障检测的过程可以包括:第二网络设备经过该第一LSP向第一网络设备(即,第一LSP的目的节点)发送第一报文,其中,该第一报文中携带该第一LSP的路径信息,该第一LSP包括依次排列的多个LSR;此时,一种情况下,第二网络设备配合第一网络设备建立反向共路第二LSP,则,后续在第一网络设备和第二网络设备之间,基于第一LSP和第二LSP进行BFD检测。另一种情况下,若第二网络设备接收到第一网络设备发送的第二报文,告知第一网络设备不具备建立反向共路第二LSP的能力,或者,第二网络设备在预设时长未收到对第一报文的回复,接下来每隔预设时长向第一网络设备发送一次第一报文,在连续发送第一报文的次数达到预设次数时,确定第一网络设备不具备建立第二LSP的能力;这样,第二网络设备在确定第一网络设备不具备建立第二LSP的能力后,可以根据用户的实际检测需求,选择使用目前的BFD机制检测第一LSP的故障情况,或者,选择不再使用BFD机制对第一LSP进行故障检测。可见,本申请实施例中,通过让源节点感知到目的节点建立反向共路LSP能力,使得源节点能够决策后续故障检测中采用的具体方式,从而实现更加灵活的对CR-LSP场景中LSP的故障检测。
第五方面,本申请实施例还提供了一种第一网络设备,应用于约束路径的标签交换路径CR-LSP场景,第一网络设备包括:接收单元、发送单元和处理单元。其中,接收单元用于接收第二网络设备经过待检测的第一LSP发送的第一报文,该第一报文中携带第一 LSP的路径信息,第一LSP的源节点为第一网络设备,第一LSP的目的节点为第二网络设备,第一LSP包括依次排列的多个标签交换节点LSR。处理单元用于根据路径信息,建立从第一网络设备到第二网络设备的第二LSP,该第二LSP包括多个LSR,且多个LSR在第二LSP中的排列顺序与多个LSR在第一LSP中的排列顺序相反。发送单元用于经过第二LSP向第二网络设备发送第一双向链路检测BFD报文,以便第二网络设备基于第一BFD 报文确定第一LSP的故障情况。
在一些可能的实现方式中,第一网络设备中的接收单元,还用于接收第二网络设备经过第一LSP发送的第二BFD报文。
在另一些可能的实现方式中,第一网络设备中的发送单元,还用于向第二网络设备发送第二报文,第二报文携带能力信息,能力信息用于表征第一网络设备具备建立第二LSP 的能力。
在又一些可能的实现方式中,第一网络设备中的处理单元,还用于在经过第二LSP向第二网络设备发送第一双向链路检测BFD报文之前,基于第一LSP和第二LSP,和第二网络设备协商BFD的配置参数;那么,该发送单元,具体用于:基于协商确定的配置参数,经过第二LSP向第二网络设备发送第一BFD报文。
可以理解的是,第一报文为LSP-Ping报文,路径信息通过LSP-Ping报文中扩展的类型长度值TLV字段携带。
需要说明的是,该第五方面提供的第一网络设备用于执行上述第一方面或第三方面提及的相关操作,其具体实现方式以及达到的效果,均可以参见上述第一方面和第三方面的相关描述,在此不再赘述。
第六方面,本申请实施例还提供了一种第二网络设备,应用于约束路径的标签交换路径CR-LSP场景,第二网络设备包括:发送单元、接收单元和处理单元。其中,发送单元用于经过待检测的第一LSP向第一网络设备发送第一报文,该第一报文中携带第一LSP 的路径信息,该第一LSP的源节点为第二网络设备,目的节点为第一网络设备,第一LSP 包括依次排列的多个标签交换节点LSR。接收单元用于接收第一网络设备经过第二LSP发送的第一双向链路检测BFD报文,其中,该第二LSP为第二网络设备基于路径信息建立的,第二LSP包括多个LSR,且多个LSR在第二LSP中的排列顺序与多个LSR在第一 LSP中的排列顺序相反。处理单元用于基于第一BFD报文,确定第一LSP的检测结果。
在一些可能的实现方式中,第二网络设备中的发送单元,还用于经过第一LSP向第一网络设备发送第二BFD报文。
在另一些可能的实现方式中,第二网络设备中的接收单元,还用于接收第一网络设备发送的第二报文,第二报文携带能力信息,能力信息用于表征第一网络设备具备建立第二 LSP的能力。
在又一些可能的实现方式中,第二网络设备中的处理单元,还用于在接收第一网络设备经过第二LSP发送的第一双向链路检测BFD报文之前,基于第一LSP和第二LSP,和第一网络设备协商BFD的配置参数;那么,该接收单元,具体用于:基于协商确定的配置参数,接收第一网络设备经过第二LSP发送的第一BFD报文。
在再一些可能的实现方式中,第二网络设备中的处理单元,还用于若检测结果表征第一LSP故障,则,将第一LSP上承载的流量切换到第三LSP,第三LSP的源节点为第二网络设备,第三LSP的目的节点为第一网络设备。
可以理解的是,第一报文为LSP-Ping报文,路径信息通过LSP-Ping报文中扩展的类型长度值TLV字段携带。
需要说明的是,该第六方面提供的第二网络设备用于执行上述第二方面或第四方面提及的相关操作,其具体实现方式以及达到的效果,均可以参见上述第二方面和第四方面的相关描述,在此不再赘述。
第七方面,本申请实施例还提供了一种第一网络设备,包括:存储器和处理器。其中,存储器用于存储程序代码或指令;处理器用于运行程序代码或指令,使得设备执行以上第一方面或第三方面提供的方法。
第八方面,本申请实施例还提供了一种第二网络设备,包括:存储器和处理器。其中,存储器用于存储程序代码或指令;处理器用于运行程序代码或指令,使得设备执行以上第二方面或第四方面提供的方法。
第九方面,本申请实施例还提供了一种网络系统,网络系统包括第五方面提供第一网络设备和第六方面提供的第二网络设备;或者,所述网络系统也可以包括第七方面提供第一网络设备和第八方面提供的第二网络设备。
第十方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码或指令,当其在计算机上运行时,使得计算机执行以上第一方面、第二方面、第三方面或第四方面提供的任一种方法。
第十一方面,本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在网络设备上运行时,使得网络设备执行第一方面、第二方面、第三方面或第四方面的任意一种可能的实现方式中提供的方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本申请实施例中一应用场景所涉及的网络系统框架示意图;
图2为本申请实施例中一种对LSP 1的检测方法的信令流程图;
图3为本申请实施例中另一种对LSP 1的检测方法的信令流程图;
图4为本申请实施例中一种故障检测方法100的信令流程图;
图5为本申请实施例中一种第一报文的格式示意图;
图6a为本申请实施例中一种第一报文扩展的TLV的格式示意图;
图6b为本申请实施例中另一种第一报文扩展的TLV的格式示意图;
图7为本申请实施例中一种第一网络设备700的结构示意图;
图8为本申请实施例中一种第二网络设备800的结构示意图;
图9为本申请实施例中另一种第一网络设备900的结构示意图;
图10为本申请实施例中另一种第二网络设备1000的结构示意图;
图11为本申请实施例中一种网络系统1100的结构示意图。
具体实施方式
MPLS TE隧道中通常包括源节点和目的节点均相同的多条LSP,为了确保该MPLSTE 隧道能够有效的传输业务流,需要对其中的LSP进行故障检测,将故障的LSP上承载的业务流切换到其他无故障的LSP上,使得业务流能够在无故障的LSP上进行有效传输。BFD 是一种快速收发报文的端到端检测机制,能够快速发送BFD报文并接收对端发送的BFD 报文,确定正向BFD报文以及反向BFD报文所经链路的故障情况。由于BFD机制在源节点和目的节点之间能够实现毫秒级的收发BFD报文,所以,该BFD机制能够满足MPLS TE 隧道中对LSP的故障检测需要快速的要求。
目前,采用BFD机制对LSP进行故障检测的过程可以包括:源节点通过待检测的LSP向目的节点发出正向的BFD报文,目的节点通过IP路由的方式向源节点发送反向的BFD 报文,源节点基于所接收到的反向的BFD报文确定该LSP是否存在故障。由于LSP是单向的约束路径,IP路由方式所确定的IP路径很可能和该LSP经过的标签交换节点LSR并不完全相同,这样,检测结果反映的就是LSP以及IP路由方式确定的IP路径的整体故障情况,而不单反映LSP是否发生故障。
例如:以图1所示的MPLS TE场景为例,该场景中包括网络设备110、网络设备120、网络设备130、网络设备140和网络设备150,其中,LSP 1依次经过:网络设备110->网络设备120->网络设备130;LSP 2依次经过:网络设备110->网络设备150->网络设备140-> 网络设备130。那么,如图2所示,在图1所示的场景中,对该LSP 1进行故障检测的过程具体可以包括:S11,网络设备110经过LSP 1向网络设备130发送BFD报文1;S12,网络设备130基于IP路由方式,通过IP路径1向网络设备110发送BFD报文2,其中, IP路径1依次经过网络设备130->网络设备140->网络设备150->网络设备110;S13,网络设备110根据BFD报文2,确定检测结果;S14,若检测结果表征故障,则,将LSP 1上承载的流量切换到LSP 2上。需要说明的是,检测结果表征故障,可能是LSP 1经过的网络设备或链路故障导致的,也可能是IP路径1经过的链路或网络设备故障导致的,如果是 IP路径1经过链路或网络设备故障,由于IP路径1和LSP 2包括的所有LSR均相同,LSP 2很可能发生故障,则,S14执行之后,很可能将流量从正常状态的LSP 1误切换到发生故障的LSP 2上,从而使得流量无法在MPLS TE隧道中有效传输。
基于此,在本申请实施例中,提供了一种故障检测方法,应用于CR-LSP场景中,对于待检测的第一LSP,通过源节点将待检测的第一LSP的路径信息告知目的节点,目的节点基于路径信息建立与待检测的第一LSP反向共路的第二LSP,使得BFD检测中反向的 BFD报文能够和正向的BFD报文通过反向共路的第二LSP和第一LSP进行传输,克服了 BFD机制的双向性和LSP单向性的冲突,即,目前的BFD检测中BFD报文和响应报文大概率不共路,导致检测结果无法准确反映LSP故障情况的问题,实现对LSP更加快速、准确的故障检测。
举例来说,仍然以图1所示的场景为例,在本申请实施例中,参见图3,具体的故障检测过程可以包括:S21,网络设备110经过LSP 1向网络设备130发送LSP-Ping报文,该LSP-Ping报文中携带LSP 1的路径信息,例如:LSP 1中包括的各节点的IP地址列表,如图1所示,在网络设备110到网络设备120的链路上网络设备110对应的IP地址为IP 1,在网络设备120到网络设备130的链路上网络设备120对应的IP地址为IP 3,那么,LSP 1 的路径信息包括:IP 1和IP 3;S22,网络设备130根据LSP 1的路径信息,建立LSP 1’,该LSP 1’依次经过:网络设备130->网络设备120->网络设备110,如图1所示,在网络设备130到网络设备120的链路上网络设备130对应的IP地址为IP 4,在网络设备120到网络设备110的链路上网络设备120对应的IP地址为IP 2,那么,LSP 1’的路径信息可以包括:IP 4和IP 2;S23,网络设备110和网络设备130协商确定BFD的配置参数,例如: BFD检测周期;S24,网络设备110基于协商确定的配置参数,经过LSP 1向网络设备130 发送BFD报文1;S25,网络设备130基于所述配置参数,经过LSP 1’向网络设备110发送BFD报文2;S26,网络设备110基于BFD报文2,确定对LSP 1的检测结果。这样,通过网络设备110将LSP 1的路径信息告知网络设备130,网络设备130基于该路径信息可以建立与LSP 1反向共路的LSP 1’,使得BFD检测中BFD报文和响应报文能够通过反向共路的LSP 1和LSP 1’进行传输,经过相同的LSR,检测结果能够准确反映LSP 1的故障检测。
可以理解的是,上述场景仅是本申请实施例提供的一个场景示例,本申请实施例并不限于此场景。
需要说明的是,本申请实施例中,网络设备和节点在本申请中指代相同的含义,可以相互替换使用。本申请实施例中,网络设备具体可以包括但不限于交换机、路由器或防火墙等。
需要说明的是,本申请实施例中,LSP可以是源节点和目的节点之间通过链路开销或标签等约束后确定的CR-LSP,该CR-LSP是单向路径,其上包括多个有序排列的标签交换节点LSR。相邻的LSR之间可以是直接相连的,也可以通过中转节点相连,在本申请实施例中,对于待检测LSP以及建立的与其反向共路的LSP,只关注其包括的LSR,对于是否包括中转节点、中转节点是否一致不予考虑。
可以理解的是,本申请实施例中,两条LSP反向共路,是指两条LSP包括的所有LSR均相同,且,一条LSP中LSR的排列顺序和另一条LSP中LSR的排列顺序相反,例如:一条LSP中源节点是另一条LSP的目的节点,一条LSP中目的节点是另一条LSP的源节点,一条LSP中第二个LSR是另一条LSP的倒数第二个LSR,以此类推。
下面结合附图,通过实施例来详细说明本申请实施例中一种故障检测方法的具体实现方式。
图4为本申请实施例中一种故障检测方法100的信令流程图。参见图4,该方法100应用于CR-LSP场景中,以待检测的第一LSP的源节点和目的节点之间的交互介绍本申请实施例。该方法100例如可以应用在图1所示的网络场景中,一个示例下,方法100可以是对网络设备110到网络设备130的LSP 1进行故障检测,其中,LSP 1、LSP 1’分别对应于方法100中的第一LSP和第二LSP,网络设备110、网络设备130分别对应于方法100 中的第二网络设备和第一网络设备;作为另一个示例,方法100也可以是对网络设备130 到网络设备110的LSP 1’进行故障检测,其中,LSP 1’、LSP 1分别对应于方法100中的第一LSP和第二LSP,网络设备130、网络设备110分别对应于方法100中的第二网络设备和第一网络设备。
具体实现时,该方法100例如可以包括下述S101~S108:
S101,第二网络设备经过待检测的第一LSP向第一网络设备发送第一报文,该第一报文中携带第一LSP的路径信息,第一LSP的源节点为第二网络设备,第一LSP的目的节点为所述第一网络设备,且该第一LSP包括依次排列的多个LSR。
S102,第一网络设备接收第二网络设备经过待检测的第一LSP发送的第一报文。
第一LSP,是指第二网络设备申请创建的,从第二网络设备到第一网络设备的LSP。该第一LSP可以包括多个LSR,对于创建好的第一LSP,该多个LSR在第一LSP中的位置固定,即,第一LSP包括依次排列的多个LSR。例如:假设第一LSP为图1所示的场景中的LSP 1,那么,第一LSP包括依次排列的多个LSR,分别为:网络设备110、网络设备120和网络设备130。该第一LSP的多个LSR中除了包括第一LSP的源节点(即,第二网络设备)和目的节点(即,第一网络设备),还可以包括其他至少一个LSR,例如: LSP 1的多个LSR中,源节点为网络设备110,目的节点为网络设备130,其他LSR仅包括网络设备120。
作为一个示例,在执行S101之前,本申请实施例还可以包括:S31,第二网络设备申请建立从该第二网络设备到第一网络设备的CR-LSP,通过与第一网络设备的配合建立第一LSP,并保存该第一LSP的路径信息;S32,若需要对第一LSP进行故障检测,则,第二网络设备可以使能BFD,触发建立BFD会话,例如:可以通过配置命令的方式,使能第二网络设备上的BFD能力。
其中,路径信息用于指示第一LSP所经历的LSR以及各LSR在第一LSP中出现的先后顺序,例如:第一LSP的路径信息可以是各跳LSR的IP地址组成的IP地址列表,各IP 地址在该IP地址列表中的位置和该IP地址对应的LSR在第一LSP中的位置匹配。假设第一LSP为图1所示场景中的LSP 1,而且,网络设备110的IP地址为IP 1,网络设备120 的IP地址为IP 2,网络设备130的IP地址为IP 3,那么,第一LSP的路径信息中,依次为:IP 1、IP 2和IP 3。
具体实现时,当执行上述S32之后,第二网络设备即可基于配置信息,生成第一报文,并将第一报文发送给第一网络设备,用于告知第一网络设备待检测的第一LSP的路径信息,为后续S103中第一网络设备建立与第一LSP反向共路的第二LSP提供了数据基础。
作为一个示例,第一报文可以是LSP-Ping报文,具体格式参见图5所示,具体可以包括:版本号(英文:Version Number)字段,用于标识MPLS命令的版本号,例如:该版本号字段可以取1;填零(英文:Must Be Zero)字段,必须全部填0,接收到该报文时可以忽略该字段;消息类型(英文:Message Type)字段,用于标识该MPLS命令消息的类型,例如:当Message Type=1,表征该LSP-Ping报文为请求消息,当Message Type=2,表征该LSP-Ping报文为响应消息;答复模式(英文:Reply Mode)字段,用于指示接收该报文的节点采用的回复方式,例如:当Reply Mode=1,表征不需要回复,当Reply Mode=2,表征通过第四版互联网协议(英文:Internet Protocol version 4,简称:IPv4)用户数据报协议(英文:UserDatagram Protocol,简称:UDP)数据包进行回复,当Reply Mode=3,表征通过带有路由器报警的IPv4 UDP数据包进行回复;返回代码(英文:Return Code) 字段,发送端可以设置该字段的取值为0,接收端可以设置该字段的取值为0-7,具体取值和表征的含义可以根据需求灵活设置,在此不再赘述;返回子代码(英文:Return Subcode) 字段,用于标识标签栈的处理结束的指针,例如:当Return Subcode=0,表征该报文未携带标签,不需要处理标签,当Return Subcode取其它值,表征该报文携带了标签;发送者句柄(英文:Sender’sHandle)字段,用于标识具体的MPLS命令,其取值可以是发送一个MPLS命令请求时的随机产生的;序列号(英文:Sequence Number)字段,同样用于标识具体的MPLS命令,在一个进程内有效;时间戳(英文:Timestamp)字段,具体可以采用网络时间协议(英文:Network TimeProtocol,简称:NTP)定义的时间格式,具体可以包括发送时间(如:秒对应的字段和毫秒对应的字段)和接收时间(如:秒对应的字段和毫秒对应的字段);预留区域,该预留区域可以扩展多个类型长度值(英文:Type Length Value,简称:TLV)字段。
本申请实施例中,第一报文具体可以是LSP-Ping报文中的LSP-Ping请求报文,即,在图5所示的LSP-Ping报文格式中,设置Message Type=1,Reply Mode=2,并在预留区域扩展TLV字段,携带第一LSP对应的路径信息。仍然以图1所示的LSP 1为第一LSP为例,第一LSP的路径信息依次为:IP 1和IP 3,一种情况下,第一报文可以通过在LSP-Ping 报文中扩展一个TLV字段携带路径信息。例如:扩展的TLV字段的格式可以参见图6a所示,在该扩展的TLV中,Type可以取127,用于标识该TLV字段携带的是LSP 1的路径信息,Length的取值等于该扩展TLV字段的长度;Value可以包括保留字段、地址个数(英文:Hop Num)以及具体的路径信息,具体而言,保留字段可以全部填0,Hop Num可以取2,路径信息可以包括IP 1和IP3。另一种情况下,第一报文也可以通过在LSP-Ping报文中扩展多个TLV字段,多个TLV字段共同携带该路径信息,每个TLV字段携带路径信息中的一个IP地址。又例如:扩展的TLV字段的格式可以参见图6b所示,扩展2个TLV: TLV 1和TLV 2,其中,TLV 1中的Type 1可以取127,用于标识该TLV 1字段携带的是 LSP 1的路径信息,Length 1的取值等于该扩展TLV 1字段的长度;Value 1可以包括保留字段(可以全部填0)、Hop Num=1以及IP 1;TLV 2中的Type 2可以取127,用于标识该 TLV 2字段携带的是LSP 1的路径信息,Length 2的取值等于该扩展TLV 2字段的长度; Value 2可以包括保留字段(可以全部填0)、Hop Num=1以及IP 3。需要说明的是,该 LSP-Ping报文的格式以及相关字段含义,可在日期为2006年2月的题为“Detecting Multi-Protocol Label Switched(MPLS)Data Plane Failures”的RFC4379中找到,其全部内容通过引证结合于此,犹如全部陈述的一样,在此不再赘述。
S103,第一网络设备根据路径信息,建立从第一网络设备到第二网络设备的第二LSP,该第二LSP包括所述多个LSR,且所述多个LSR在第二LSP中的排列顺序与所述多个LSR在第一LSP中的排列顺序相反。
可以理解的是,第一网络设备在接收到携带第一LSP的路径信息的第一报文后,在执行下述S103之前,可以先判断自身是否具有创建与第一LSP反向共路的第二LSP的能力,如果有,则,执行S103;如果没有,则,不执行S103~S108。
作为一个示例,S103具体可以包括:第一网络设备根据路径信息,确定需要建立的第二LSP依次需要经过的LSR;第一网络设备根据所确定的LSR,与第二网络设备配合创建该第二LSP。第二LSP,是指第一网络设备申请创建的与第一LSP反向共路的LSP,该第二LSP的源节点为第一网络设备,目的节点为第二网络设备。以图1所示的LSP 1为第一 LSP,LSP 1’为第二LSP为例,第二LSP的路径信息依次为:IP 4和IP 2。
在本申请实施例中,S103之后,还可以包括:第一网络设备可以使能BFD,触发建立回程BFD会话,例如:可以通过配置命令的方式,使能第一网络设备上的BFD能力。
此外,为了能够让第二网络设备知晓第一网络设备具有建立与第一LSP反向共路的第二LSP的能力,第一网络设备还可以向第二网络设备发送第二报文,该第二报文携带能力信息,该能力信息用于表征第一网络设备具备建立第二LSP的能力。需要说明的是,第一网络设备向第二网络设备发送第二报文的时机,可以在S103之前执行,也可以在S103之后执行,还可以和S103同时执行,在本申请实施例中不作具体限定。
例如,第二报文具体可以是LSP-Ping报文中的LSP-Ping响应报文,即,在图5所示的LSP-Ping报文格式中,设置Message Type=2,Return Code=8(即,表征第一网络设备已经收第一LSP的路径信息且支持建立与第一LSP反向共路的LSP)。
需要说明的是,如果第一网络设备确定自身不具有创建与第一LSP反向共路的第二 LSP的能力,则第一网络设备可以根据实际需求,进行不同的操作,例如:第一网络设备可以通过IP路由方式向第二网络设备发送第二报文,该第二报文中携带能力信息,该能力信息用于指示第一网络设备不具备建立第二LSP的能力,那么,第二网络设备可以作出故障检测的具体决策,如:第二报文具体为LSP-Ping报文中的LSP-Ping响应报文,即,在图5所示的LSP-Ping报文格式中,设置Message Type=2,Return Code=2(即,表征第一网络设备已经收第一LSP的路径信息但不支持建立与第一LSP反向共路的LSP);又例如:第一网络设备也可以不对第一报文作回复,那么,第二网络设备可以设置其在开始发送 BFD报文之前,每隔预设时长(如:1秒)向第一网络设备发送一次第一报文,在连续发送第一报文的次数达到预设次数(如:3次)时,确定第一网络设备不具备建立第二LSP 的能力。
当第二网络设备确定第一网络设备不具备建立第二LSP的能力后,根据用户的实际故障检测需求,可以选择不再使用无法准确检测故障的BFD机制对第一LSP进行故障检测;或者,也可以选择使用目前的BFD机制检测第一LSP的故障情况。其中,目前的BFD机制检测第一LSP的故障的过程例如可以包括:S41,第二网络设备向第一网络设备发送 LSP-Ping请求报文,其中携带第二网络设备的标识符;S42,第一网络设备记录第二网络设备的标识符,并将自己的标识符和第二网络设备的标识符均携带在LSP-Ping响应报文中,发送给第二网络设备;S43,第二网络设备记录第一网络设备的标识符;S44,第二网络设备和第一网络设备协商确定BFD的配置参数;S45,第二网络设备经过第一LSP向第一网络设备发送正向的BFD报文;S46,第一网络设备经过IP路由的方式向第二网络设备发送反向的BFD报文;S47,第二网络设备根据该反向的BFD报文确定第一LSP的故障情况。
需要说明的是,建立第二LSP不成功,可能是由于第一网络设备不支持建立第二LSP,也可能是由于其他原因,例如:标签资源不足。本申请实施例中的“第一网络设备不具备建立第二LSP的能力”,可以指第一网络设备不支持建立第二LSP,也可以指由于其他原因导致建立第二LSP不成功的情况。
可见,本申请实施例中,可以通过让源节点感知到目的节点建立反向共路LSP能力,使得源节点能够决策后续故障检测中采用的具体方式,从而使得对CR-LSP场景中LSP的故障检测更加灵活。
需要说明的是,本申请实施例中,建立与待检测的第一LSP反向共路的第二LSP,为后续采用BFD机制检测第一LSP时,能够让BFD报文的响应报文和BFD报文经过反向共路的LSP传输,从而准确的检测出第一LSP的故障情况,提供了必不可少的数据基础。
S104,第二网络设备经过第一LSP向第一网络设备发送第一BFD报文。
S105,第一网络设备接收第二网络设备经过第一LSP发送的第一BFD报文。
S106,第一网络设备经过第二LSP向第二网络设备发送第二BFD报文。
S107,第二网络设备接收第一网络设备经过第二LSP发送的所述第二BFD报文。
S108,第二网络设备基于该第二BFD报文,确定第一LSP的检测结果。
可以理解的是,本申请实施例中,采用BFD机制检测待检测的LSP的故障情况的过程,包括三个部分:第一部分,建立与待检测的LSP反向共路的LSP;第二部分,协商确定收发BFD报文的配置参数;第三部分,基于第一部分和第二部分的操作结果,通过BFD 报文以及其对应的响应报文,对待检测的LSP进行故障检测。其中,第一部分可以对应上述S101~S103,第二部分实施的具体过程可以是:在S103和S104之间,基于第一LSP和第二LSP,第一网络设备和第二网络设备协商BFD的配置参数,该配置参数用于规范后续执行S104-S107的参数,例如:执行S104和S107的周期(例如:10秒)。第三部分可以是:第二网络设备基于协商确定的所述配置参数,经过第一LSP向第一网络设备发送正向的第一BFD报文;而第一网络设备接收到第一BFD报文后,也基于协商确定的所述配置参数,经过第二LSP向第二网络设备发送反向的第二BFD报文;第二网络设备接收到第二BFD报文确定第一LSP的检测结果。
对于S108中第二网络设备基于该第二BFD报文确定第一LSP的检测结果,具体可以根据预先人为设置或者协商确定的配置参数,确定检测结果。作为一个示例,第二网络设备只要接收到第二BFD报文,则确定第一LSP无故障;相反,若第二网络设备未接收到第二BFD报文,则确定第一LSP故障。作为另一个示例,还可以设置预设时长(例如: 30毫秒),该预设时长可以是人为设置的,或者,也可以是协商确定的配置参数中的一个参数,用于指示第一网络设备发送第二BFD报文所允许经过的最长周期,那么,若第二网络设备在间隔预设时长接收到下一个第二BFD报文,则确定第一LSP无故障;相反,若第二网络设备在间隔预设时长仍未接收到下一个第二BFD报文,则确定第一LSP故障。其中,预设时长的具体取值可以根据实际情况进行灵活设置。
例如:以图1所示的场景,S104~S108具体可以包括:网络设备110每隔10毫秒通过LSP 1向网络设备130发送BFD报文1;网络设备130每隔20毫秒,经过LSP 1’向网络设备110发送BFD报文2。一种情况下,如果网络设备110在接收到一个BFD报文2后的 60毫秒(即,20毫秒的3倍,3为预设倍数)内,接收到下一个BFD报文2,则,确定 LSP 1’无故障,从而确定共路的LSP 1无故障;如果网络设备110在接收到一个BFD报文 2后经过80毫秒才接收到下一个BFD报文2,或者,在接收到一个BFD报文2后一直未接收到下一个BFD报文2,则,确定LSP1’故障,从而确定共路的LSP 1故障。另一种情况下,如果网络设备130在接收到一个BFD报文1后的40毫秒(即,10毫秒的4倍,4 为预设倍数)内,接收到下一个BFD报文1,则,确定LSP1无故障;如果网络设备130 在接收到一个BFD报文1后经过40毫秒才接收到下一个BFD报文1,或者,在接收到一个BFD报文1后一直未接收到下一个BFD报文1,则,确定LSP 1故障。其中,10毫秒、 20毫秒、倍数3和倍数4均可以是第二部分中协商确定的配置参数。
需要说明的是,在确定第一LSP故障后,第二网络设备还可以将第一LSP承载的流量切换到该第一LSP的备份LSP上,以确保流量在网络中的正常传输;并且,该第二网络设备还可以上报告警消息,用于告知控用户该第一LSP发生故障,供技术人员尽快进行检测和维修,并在第一LSP修复后,第二网络设备再将该流量从备份的LSP上切回到该第一 LSP上。
如此,在本申请实施例中,源节点能够将待检测的LSP的路径信息告知目的节点,目的节点基于路径信息建立与待检测LSP反向共路的LSP,使得BFD检测中正向和反向的BFD报文能够通过共路的LSP进行传输,克服了目前BFD机制中正向和反向的BFD报文分别采用CR-LSP和IP路由两种方式确定传输路径传输,而两种方式所确定的传输路径大概率不共路,导致检测结果反映的是整个环路(即,IP路由方式确定的传输路径和CR-LSP 两部分)的故障情况,而无法准确反映待检测的单向LSP故障情况的问题,解决了BFD 机制双向性和LSP单向性的冲突。可见,采用本申请实施例提供的BFD机制,检测LSP 的故障情况,既利用到BFD机制可以快速完成检测的特点,又基于构建的反向共路LSP 使得采用BFD机制对LSP的故障检测更加准确。而且,本申请实施例还通过让源节点感知到目的节点是否具有建立反向共路LSP能力,使得源节点能够决策后续故障检测中采用的具体方式,从而使得对CR-LSP场景中LSP的故障检测更加灵活。
相应的,本申请实施例还提供了一种第一网络设备700,如图7。该第一网络设备700 应用于约束路径的标签交换路径CR-LSP场景,第一网络设备700包括:接收单元701、发送单元702和处理单元703。
其中,接收单元701用于接收第二网络设备经过待检测的第一LSP发送的第一报文,该第一报文中携带第一LSP的路径信息,第一LSP的源节点为第一网络设备,第一LSP 的目的节点为第二网络设备,第一LSP包括依次排列的多个标签交换节点LSR。
处理单元703用于根据路径信息,建立从第一网络设备到第二网络设备的第二LSP,该第二LSP包括多个LSR,且多个LSR在第二LSP中的排列顺序与多个LSR在第一LSP 中的排列顺序相反。
发送单元702用于经过第二LSP向第二网络设备发送第一双向链路检测BFD报文,以便第二网络设备基于第一BFD报文确定第一LSP的故障情况。
在一些实现方式中,第一网络设备700中的接收单元701,还用于接收第二网络设备经过第一LSP发送的第二BFD报文。
在另一些实现方式中,第一网络设备700中的发送单元702,还用于向第二网络设备发送第二报文,第二报文携带能力信息,能力信息用于表征第一网络设备具备建立第二LSP 的能力。
在又一些实现方式中,第一网络设备700中的处理单元703,还用于在经过第二LSP向第二网络设备发送第一双向链路检测BFD报文之前,基于第一LSP和第二LSP,和第二网络设备协商BFD的配置参数;那么,该发送单元702,具体用于:基于协商确定的配置参数,经过第二LSP向第二网络设备发送第一BFD报文。
可以理解的是,第一报文为LSP-Ping报文,路径信息通过LSP-Ping报文中扩展的类型长度值TLV字段携带。
需要说明的是,图7所示的第一网络设备700可以是图3所示的示例中的网络设备130,也可以是图4所示的方法100中提及的第一网络设备,因此,第一网络设备700的各种具体实施例方式,可以参见图3对应实施例以及方法100的相关介绍,本实施例不再赘述。
相应的,本申请实施例还提供了一种第二网络设备800,如图8。该第二网络设备800 应用于约束路径的标签交换路径CR-LSP场景,第二网络设备800包括:发送单元801、接收单元802和处理单元803。
其中,发送单元801用于经过待检测的第一LSP向第一网络设备发送第一报文,该第一报文中携带第一LSP的路径信息,该第一LSP的源节点为第二网络设备,目的节点为第一网络设备,第一LSP包括依次排列的多个标签交换节点LSR。
接收单元802用于接收第一网络设备经过第二LSP发送的第一双向链路检测BFD报文,其中,该第二LSP为第二网络设备基于路径信息建立的,第二LSP包括多个LSR,且多个LSR在第二LSP中的排列顺序与多个LSR在第一LSP中的排列顺序相反。
处理单元803用于基于第一BFD报文,确定第一LSP的检测结果。
在一些实现方式中,第二网络设备800中的发送单元803,还用于经过第一LSP向第一网络设备发送第二BFD报文。
在另一些实现方式中,第二网络设备中800的接收单元802,还用于接收第一网络设备发送的第二报文,第二报文携带能力信息,能力信息用于表征第一网络设备具备建立第二LSP的能力。
在又一些实现方式中,第二网络设备800中的处理单元803,还用于在接收第一网络设备经过第二LSP发送的第一双向链路检测BFD报文之前,基于第一LSP和第二LSP,和第一网络设备协商BFD的配置参数;那么,该接收单元802,具体用于:基于协商确定的配置参数,接收第一网络设备经过第二LSP发送的第一BFD报文。
在再一些实现方式中,第二网络设备800中的处理单元803,还用于若检测结果表征第一LSP故障,则,将第一LSP上承载的流量切换到第三LSP,第三LSP的源节点为第二网络设备,第三LSP的目的节点为第一网络设备。
可以理解的是,第一报文为LSP-Ping报文,路径信息通过LSP-Ping报文中扩展的类型长度值TLV字段携带。
需要说明的是,图8所示的第二网络设备800可以是图3所示的示例中的网络设备110,也可以是图4所示的方法100中提及的第二网络设备,因此,第二网络设备800的各种具体实施例方式,可以参见图3对应实施例以及方法100的相关介绍,本实施例不再赘述。
参见图9,本申请实施例提供了一种第一网络设备900。该第一网络设备900可以是上述任一实施例中目的节点,例如可以是图3所示所示实施例中的网络设备130,也可以是图4所示实施例中的第一网络设备。该第一网络设备900包括至少一个处理器901,总线系统902,存储器903以及至少一个收发器904。
该第一网络设备900是一种硬件结构的装置,可以用于实现图7所示的第一网络设备 700中的功能模块。例如,本领域技术人员可以想到图7所示的第一网络设备700中的处理单元703可以通过该至少一个处理器901调用存储器903中的代码来实现,图7所示的第一网络设备700中的接收单元701和发送单元702可以通过该收发器904来实现。
可选的,该第一网络设备900还可用于实现上述任一实施例中第一网络设备的功能。
可选的,上述处理器901可以是一个通用中央处理器(central processing unit,CPU),网络处理器(network processor,NP),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
上述总线系统902可包括一通路,在上述组件之间传送信息。
上述收发器904,用于与其他设备或通信网络通信。
上述存储器903可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器903用于存储执行本申请方案的应用程序代码,并由处理器901来控制执行。处理器901用于执行存储器903中存储的应用程序代码,从而实现本专利方法中的功能。
在具体实现中,作为一种实施例,处理器901可以包括一个或多个CPU,例如图9中的CPU0和CPU1。
在具体实现中,作为一种实施例,该第一网络设备900可以包括多个处理器,例如图 9中的处理器901和处理器907。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
参见图10,本申请实施例提供了一种第二网络设备1000。该第二网络设备1000可以是上述任一实施例中的源节点,例如可以是图3所示所示实施例中的网络设备110,也可以是图4所示实施例中的第二网络设备。。该第二网络设备1000包括至少一个处理器1001,总线系统1002,存储器1003以及至少一个收发器1004。
该第二网络设备1000是一种硬件结构的装置,可以用于实现图8所述的第二网络设备800中的功能模块。例如,本领域技术人员可以想到图8所示的第二网络设备800中的处理单元803可以通过该至少一个处理器1001调用存储器1003中的代码来实现,图8所示的第二网络设备800中的接收单元802和发送单元801可以通过该收发器1004来实现。
可选的,该第二网络设备1000还可用于实现上述任一实施例中第二网络设备的功能。
可选的,上述处理器1001可以是一个通用中央处理器(central processingunit,CPU),网络处理器(network processor,NP),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
上述总线系统1002可包括一通路,在上述组件之间传送信息。
上述收发器1004,用于与其他设备或通信网络通信。
上述存储器1003可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器1003用于存储执行本申请方案的应用程序代码,并由处理器1001来控制执行。处理器1001用于执行存储器1003中存储的应用程序代码,从而实现本专利方法中的功能。
在具体实现中,作为一种实施例,处理器1001可以包括一个或多个CPU,例如图10中的CPU0和CPU1。
在具体实现中,作为一种实施例,该装置1000可以包括多个处理器,例如图10中的处理器1001和处理器1007。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和 /或用于处理数据(例如计算机程序指令)的处理核。
参见图11,本申请实施例提供了一种网络系统1100,所述网络系统1100包括:第一网络设备1101和第二网络设备1102。其中,第一网络设备1101具体可以是图7所示的第一网络设备700或图9所示的第一网络设备900;第二网络设备1102具体可以是图8所示的第二网络设备800或图10所示的第二网络设备1000。
可选的,第一网络设备1101可以是图4所示实施例中的第一网络设备或在如图3所示实施例中的网络设备130,第二网络设备1102可以是图4所示实施例中的第二网络设备或在如图3所示实施例中的网络设备110。
此外,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码或指令,当其在计算机上运行时,使得计算机执行以上图3或图4所示实施例中任意一种实现方式下的方法。
此外,本申请实施例还提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行前述方法100中任意一种实现方式的方法。
需要说明的是,本申请中,该采用BFD机制进行故障检测的过程以及相关定义,可在日期为2010年6月的题为“Bidirectional Forwarding Detection(BFD)for MPLS LabelSwitched Paths(LSPs)”的RFC5884中找到,其全部内容通过引证结合于此,犹如全部陈述的一样,在此不再赘述。
本申请实施例中提到的“第一报文”、“第一LSP”等名称中的“第一”只是用来做名字标识,并不代表顺序上的第一。该规则同样适用于“第二”等。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,ROM)/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例和设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本申请的优选实施方式,并非用于限定本申请的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (18)
1.一种故障检测方法,其特征在于,应用于约束路径的标签交换路径CR-LSP场景的第一网络设备,所述方法包括:
接收第二网络设备经过待检测的第一LSP发送的第一报文,所述第一报文中携带所述第一LSP的路径信息,所述第一LSP的源节点为所述第一网络设备,所述第一LSP的目的节点为所述第二网络设备,所述第一LSP包括依次排列的多个标签交换节点LSR;
根据所述路径信息,建立从所述第一网络设备到所述第二网络设备的第二LSP,所述第二LSP包括所述多个LSR,且所述多个LSR在所述第二LSP中的排列顺序与所述多个LSR在所述第一LSP中的排列顺序相反;
经过所述第二LSP向所述第二网络设备发送第一双向链路检测BFD报文,以便所述第二网络设备基于所述第一BFD报文确定所述第一LSP的故障情况。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述第二网络设备经过所述第一LSP发送的第二BFD报文。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
向所述第二网络设备发送第二报文,所述第二报文携带能力信息,所述能力信息用于表征所述第一网络设备具备建立所述第二LSP的能力。
4.根据权利要求1-3任一项所述的方法,其特征在于,在经过所述第二LSP向所述第二网络设备发送第一双向链路检测BFD报文之前,所述方法还包括:
基于所述第一LSP和所述第二LSP,和所述第二网络设备协商BFD的配置参数;
所述经过所述第二LSP向所述第二网络设备发送第一双向链路检测BFD报文,具体为:
基于协商确定的所述配置参数,经过所述第二LSP向所述第二网络设备发送所述第一BFD报文。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述第一报文为LSP-Ping报文,所述路径信息通过所述LSP-Ping报文中扩展的类型长度值TLV字段携带。
6.一种故障检测方法,其特征在于,应用于约束路径的标签交换路径CR-LSP场景的第二网络设备,所述方法包括:
经过待检测的第一LSP向第一网络设备发送第一报文,所述第一报文中携带所述第一LSP的路径信息,所述第一LSP的源节点为所述第二网络设备,目的节点为所述第一网络设备,所述第一LSP包括依次排列的多个标签交换节点LSR;
接收所述第一网络设备经过第二LSP发送的第一双向链路检测BFD报文,所述第二LSP为所述第二网络设备基于所述路径信息建立的,所述第二LSP包括所述多个LSR,且所述多个LSR在所述第二LSP中的排列顺序与所述多个LSR在所述第一LSP中的排列顺序相反;
基于所述第一BFD报文,确定所述第一LSP的检测结果。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
经过所述第一LSP向所述第一网络设备发送第二BFD报文。
8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:
接收所述第一网络设备发送的第二报文,所述第二报文携带能力信息,所述能力信息用于表征所述第一网络设备具备建立所述第二LSP的能力。
9.根据权利要求6-8任一项所述的方法,其特征在于,在所述接收所述第一网络设备经过第二LSP发送的第一双向链路检测BFD报文之前,所述方法还包括:
基于所述第一LSP和所述第二LSP,和所述第一网络设备协商BFD的配置参数;
所述接收所述第一网络设备经过第二LSP发送的第一双向链路检测BFD报文,具体为:
基于协商确定的所述配置参数,接收所述第一网络设备经过所述第二LSP发送的所述第一BFD报文。
10.根据权利要求6-9任一项所述的方法,其特征在于,所述方法还包括:
若所述检测结果表征所述第一LSP故障,则,将所述第一LSP上承载的流量切换到第三LSP,所述第三LSP的源节点为所述第二网络设备,所述第三LSP的目的节点为所述第一网络设备。
11.一种网络设备,其特征在于,应用于约束路径的标签交换路径CR-LSP场景,所述网络设备是所述CR-LSP场景中的第一网络设备,所述CR-LSP场景还包括第二网络设备,所述第一网络设备包括:
接收单元,用于接收所述第二网络设备经过待检测的第一LSP发送的第一报文,所述第一报文中携带所述第一LSP的路径信息,所述第一LSP的源节点为所述第一网络设备,所述第一LSP的目的节点为所述第二网络设备,所述第一LSP包括依次排列的多个标签交换节点LSR;
处理单元,用于根据所述路径信息,建立从所述第一网络设备到所述第二网络设备的第二LSP,所述第二LSP包括所述多个LSR,且所述多个LSR在所述第二LSP中的排列顺序与所述多个LSR在所述第一LSP中的排列顺序相反;
发送单元,用于经过所述第二LSP向所述第二网络设备发送第一双向链路检测BFD报文,以便所述第二网络设备基于所述第一BFD报文确定所述第一LSP的故障情况。
12.根据权利要求11所述的网络设备,其特征在于,
所述接收单元,还用于接收所述第二网络设备经过所述第一LSP发送的第二BFD报文。
13.根据权利要求11或12所述的网络设备,其特征在于,
所述发送单元,还用于向所述第二网络设备发送第二报文,所述第二报文携带能力信息,所述能力信息用于表征所述第一网络设备具备建立所述第二LSP的能力。
14.根据权利要求11-13任一项所述的网络设备,其特征在于,
所述处理单元,还用于在经过所述第二LSP向所述第二网络设备发送第一双向链路检测BFD报文之前,基于所述第一LSP和所述第二LSP,和所述第二网络设备协商BFD的配置参数;
则,所述发送单元,具体用于:
基于协商确定的所述配置参数,经过所述第二LSP向所述第二网络设备发送所述第一BFD报文。
15.一种网络设备,其特征在于,应用于约束路径的标签交换路径CR-LSP场景,所述网络设备是所述CR-LSP场景中的第二网络设备,所述CR-LSP场景还包括第一网络设备,所述第二网络设备包括:
发送单元,用于经过待检测的第一LSP向所述第一网络设备发送第一报文,所述第一报文中携带所述第一LSP的路径信息,所述第一LSP的源节点为所述第二网络设备,目的节点为所述第一网络设备,所述第一LSP包括依次排列的多个标签交换节点LSR;
接收单元,用于接收所述第一网络设备经过第二LSP发送的第一双向链路检测BFD报文,所述第二LSP为所述第二网络设备基于所述路径信息建立的,所述第二LSP包括所述多个LSR,且所述多个LSR在所述第二LSP中的排列顺序与所述多个LSR在所述第一LSP中的排列顺序相反;
处理单元,用于基于所述第一BFD报文,确定所述第一LSP的检测结果。
16.根据权利要求15所述的网络设备,其特征在于,
所述处理单元,还用于若所述检测结果表征所述第一LSP故障,则,将所述第一LSP上承载的流量切换到第三LSP,所述第三LSP的源节点为所述第二网络设备,所述第三LSP的目的节点为所述第一网络设备。
17.一种网络系统,其特征在于,所述网络系统包括权利要求11-14任一项所述的网络设备以及权利要求15或16所述的网络设备。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码或指令,当其在计算机上运行时,使得所述计算机执行以上权利要求1-5中任意一项所述的方法或者权利要求6-10中任意一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010043122.4A CN113132223A (zh) | 2020-01-15 | 2020-01-15 | 一种故障检测方法及设备 |
PCT/CN2020/141140 WO2021143524A1 (zh) | 2020-01-15 | 2020-12-30 | 一种故障检测方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010043122.4A CN113132223A (zh) | 2020-01-15 | 2020-01-15 | 一种故障检测方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113132223A true CN113132223A (zh) | 2021-07-16 |
Family
ID=76771610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010043122.4A Pending CN113132223A (zh) | 2020-01-15 | 2020-01-15 | 一种故障检测方法及设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113132223A (zh) |
WO (1) | WO2021143524A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022161061A1 (zh) * | 2021-01-29 | 2022-08-04 | 华为技术有限公司 | 一种故障检测方法、网络设备及系统 |
WO2023197644A1 (zh) * | 2022-04-15 | 2023-10-19 | 华为技术有限公司 | 跨分段网络的故障检测方法、通信系统及相关装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771577A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种为双向lsp建立双向转发检测的方法、系统及设备 |
CN102571601A (zh) * | 2012-02-13 | 2012-07-11 | 中兴通讯股份有限公司 | 一种保证双向转发检测可靠性的方法及标记交换路径设备 |
CN102624609A (zh) * | 2012-02-28 | 2012-08-01 | 华为技术有限公司 | 反向bfd报文发送、通知路径的方法及装置 |
CN102769543A (zh) * | 2012-07-20 | 2012-11-07 | 杭州华三通信技术有限公司 | 一种基于lsp的bfd检测方法和设备 |
US20140198634A1 (en) * | 2013-01-11 | 2014-07-17 | Cisco Technology, Inc. | Detecting failures of backup label switched paths in a network environment |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109964450B (zh) * | 2017-10-24 | 2020-06-26 | 华为技术有限公司 | 一种确定共享风险链路组的方法及装置 |
CN108768788A (zh) * | 2018-06-26 | 2018-11-06 | 新华三技术有限公司合肥分公司 | 路径故障检测方法及装置 |
-
2020
- 2020-01-15 CN CN202010043122.4A patent/CN113132223A/zh active Pending
- 2020-12-30 WO PCT/CN2020/141140 patent/WO2021143524A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771577A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种为双向lsp建立双向转发检测的方法、系统及设备 |
CN102571601A (zh) * | 2012-02-13 | 2012-07-11 | 中兴通讯股份有限公司 | 一种保证双向转发检测可靠性的方法及标记交换路径设备 |
CN102624609A (zh) * | 2012-02-28 | 2012-08-01 | 华为技术有限公司 | 反向bfd报文发送、通知路径的方法及装置 |
CN102769543A (zh) * | 2012-07-20 | 2012-11-07 | 杭州华三通信技术有限公司 | 一种基于lsp的bfd检测方法和设备 |
US20140198634A1 (en) * | 2013-01-11 | 2014-07-17 | Cisco Technology, Inc. | Detecting failures of backup label switched paths in a network environment |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022161061A1 (zh) * | 2021-01-29 | 2022-08-04 | 华为技术有限公司 | 一种故障检测方法、网络设备及系统 |
WO2023197644A1 (zh) * | 2022-04-15 | 2023-10-19 | 华为技术有限公司 | 跨分段网络的故障检测方法、通信系统及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021143524A1 (zh) | 2021-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7288993B2 (ja) | ネットワークにおけるパケット伝送のための方法及びノード | |
US20220407802A1 (en) | Packet processing method and apparatus, network device, and storage medium | |
US9860161B2 (en) | System and method for computing a backup ingress of a point-to-multipoint label switched path | |
EP2761829B1 (en) | Point-to-point based multicast label distribution protocol local protection solution | |
US7710860B2 (en) | Data relay apparatus and data relay method | |
US7765306B2 (en) | Technique for enabling bidirectional forwarding detection between edge devices in a computer network | |
CN101427501B (zh) | 确保mpls转发和控制平面之间一致性的方法和设备 | |
US7746796B2 (en) | Directed echo requests and reverse traceroute | |
US8218432B2 (en) | Routing method in a label switching network | |
RU2586855C2 (ru) | Способ для управления сетевым узлом | |
CN112448877B (zh) | 一种sbfd会话的建立方法、设备及系统 | |
US7936667B2 (en) | Building backup tunnels for fast reroute in communications networks | |
CN109617803B (zh) | 一种转发表项生成方法、装置及设备 | |
US9191221B2 (en) | Technique for protecting a point-to-multipoint primary tree in a connected mode communications network | |
EP2866394A1 (en) | Method and device for sending inter-domain fault information | |
EP3985941A2 (en) | Path switching method, device, and system | |
KR102157711B1 (ko) | 통신 네트워크에서 장애 복구 방법 | |
CN113132223A (zh) | 一种故障检测方法及设备 | |
US7869350B1 (en) | Method and apparatus for determining a data communication network repair strategy | |
US7702810B1 (en) | Detecting a label-switched path outage using adjacency information | |
WO2017143958A1 (en) | System, method and apparatus for implementing fast reroute (frr) | |
US20200145326A1 (en) | Path data deletion method, message forwarding method, and apparatus | |
US10715420B2 (en) | System, method and apparatus for implementing fast reroute (FRR) | |
CN104104600A (zh) | 一种lsp建立的方法及网络设备 | |
Agarwal et al. | Ingress failure recovery mechanisms in MPLS network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210716 |