CN117768340A - 故障检测方法、装置及系统 - Google Patents
故障检测方法、装置及系统 Download PDFInfo
- Publication number
- CN117768340A CN117768340A CN202211127815.7A CN202211127815A CN117768340A CN 117768340 A CN117768340 A CN 117768340A CN 202211127815 A CN202211127815 A CN 202211127815A CN 117768340 A CN117768340 A CN 117768340A
- Authority
- CN
- China
- Prior art keywords
- network
- network device
- slice
- fault detection
- detection message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 302
- 238000000034 method Methods 0.000 claims description 94
- 230000005540 biological transmission Effects 0.000 claims description 33
- 230000007246 mechanism Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 230000002457 bidirectional effect Effects 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 10
- 238000012545 processing Methods 0.000 description 18
- 230000000977 initiatory effect Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 6
- 239000004744 fabric Substances 0.000 description 3
- RGNPBRKPHBKNKX-UHFFFAOYSA-N hexaflumuron Chemical compound C1=C(Cl)C(OC(F)(F)C(F)F)=C(Cl)C=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F RGNPBRKPHBKNKX-UHFFFAOYSA-N 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Abstract
本申请提供了一种故障检测方法、装置及系统,属于通信技术领域。本申请提供的方案中,由于第二网络设备发送至第一网络设备的故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
Description
技术领域
本申请涉及通信技术领域,特别涉及一种故障检测方法、装置及系统。
背景技术
为了确保报文在网络中转发的可靠性,网络设备一般具有故障检测的功能。例如,两个网络设备之间可以基于双向转发检测(bidirectional forwarding detection,BFD)协议检测链路是否故障。
但是,若网络中部署有多个网络切片,则上述故障检测方法只能检测链路是否存在故障,而无法检测具体是哪个网络切片存在故障。
发明内容
本申请提供了一种故障检测方法、装置及系统,可以解决相关技术中的故障检测方法无法检测网络切片是否存在故障的技术问题。
第一方面,提供了一种故障检测方法,应用于第一网络设备。该方法包括:接收第二网络设备发送的第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识;基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障。
由于该第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备可以基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
可选地,基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障的过程可以包括:若在接收到一个第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则确定该第一网络切片故障。
其中,该目标时长可以是基于第二网络设备发送第一故障检测报文的发包周期确定的,且该目标时长可以大于该发包周期。
可选地,该第一故障检测报文可以为互联网协议第6版(Internet protocolversion 6,IPv6)报文,该IPv6报文的IPv6扩展头中包括该第一切片标识。
可选地,该IPv6扩展头可以为逐跳选项(hop by hop,HBH)头。
可选地,接收第二网络设备发送的第一故障检测报文的过程可以包括:接收第二网络设备通过第一网络切片发送的第一故障检测报文。也即是,该第二网络设备可以是故障检测报文的报文发起端,第一网络设备可以是该故障检测报文的报文接收端。其中,报文发起端可以是第一网络切片的入节点,报文接收端可以是第一网络切片的出节点。
可选地,该第一故障检测报文可以为BFD报文。
可选地,在接收第二网络设备发送的第一故障检测报文之前,该方法还可以包括:通过第一网络切片向第二网络设备发送第二故障检测报文。相应的,接收第二网络设备发送的第一故障检测报文的过程可以包括:接收第二网络设备通过第二网络切片发送的第一故障检测报文,该第一故障检测报文为第二故障检测报文的反射报文。
其中,该第一网络设备为故障检测报文的报文发起端,第二网络设备为故障检测报文的报文反射端。该报文反射端接收到故障检测报文后,可以构造反射报文,并向报文发起端反馈该反射报文。并且,该第一网络切片和第二网络切片可以相同,也可以不同。也即是,故障检测报文及其反射报文可以通过相同的网络切片传输,也可以通过不同的网络切片传输。
可选地,该第一故障检测报文和第二故障检测报文可以均为无缝双向转发检测(seamless bidirectional forwarding detection,SBFD)报文,或者可以均为双向主动测量协议(two-way active measurement protocol,TWAMP)报文。
可选地,该第二故障检测报文中可以包括该第一切片标识和第二网络切片的第二切片标识。其中,该第一切片标识可以用于供第二网络设备封装在第一故障检测报文中,该第二切片标识可以用于指示第二网络设备通过该第二网络切片发送第一故障检测报文。
可选地,该第二故障检测报文的HBH头中包括该第一切片标识,该第二故障检测报文的扩展类型长度值(type-length-value,TLV)字段中包括该第二切片标识。
可选地,基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障的过程可以包括:基于该第一故障检测报文的收包状态,检测该第一网络切片和该第二网络切片是否故障。
对于第一故障检测报文和第二故障检测报文通过不同的网络切片发送的场景,第一网络设备可以基于第一故障检测报文的收包状态,检测第一网络切片和第二网络切片是否故障。
可选地,该方法还可以包括:基于该第一网络切片故障,对该第一网络切片中承载的业务流的传输路径进行切换。
通过对业务流的传输路径进行切换,可以确保在第一网络切片故障后,业务流仍然能够正常传输,确保了业务流的传输性能。
可选地,基于该第一网络切片故障,对该第一网络切片中承载的业务流的传输路径进行切换的过程可以包括:基于该第一网络切片故障,通过快速重路由(fast reroute,FRR)机制对该第一网络切片中承载的业务流的传输路径进行切换。
其中,该FRR可以是指虚拟专用网(virtual private network,VPN)FRR。基于该VPN FRR机制,能够将业务流快速切换至备份路径中,以避免业务流的性能。
第二方面,提供了一种故障检测方法,应用于第二网络设备。该方法包括:向第一网络设备发送第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识。其中,该第一故障检测报文用于供第一网络设备基于第一故障检测报文的收包状态,检测第一网络切片是否故障。
可选地,该第一故障检测报文可以为IPv6报文,该IPv6报文的IPv6扩展头中包括该第一切片标识。其中,该IPv6扩展头可以为HBH头。
可选地,向第一网络设备发送第一故障检测报文的过程可以包括:通过第一网络切片向第一网络设备发送第一故障检测报文。
可选地,该第一故障检测报文可以为BFD报文。
可选地,该方法还可以包括:基于该第一网络切片故障,对该第一网络切片中承载的业务流的传输路径进行切换。
可选地,基于第一网络切片故障,对该第一网络切片中承载的业务流的传输路径进行切换的过程可以包括:基于该第一网络切片故障,通过FRR机制对该第一网络切片中承载的业务流的传输路径进行切换。其中,该FRR机制可以是VPN FRR机制。
可选地,在向第一网络设备发送第一故障检测报文之前,该方法还可以包括:通过第一网络切片接收第一网络设备发送的第二故障检测报文。相应的,向第一网络设备发送第一故障检测报文的过程可以包括:通过第二网络切片向第一网络设备发送第一故障检测报文,该第一故障检测报文为第二故障检测报文的反射报文。
可选地,该第一故障检测报文和第二故障检测报文可以均为SBFD报文,或者可以均为TWAMP报文。
第三方面,提供了一种网络设备,该网络设备包括至少一个模块,该至少一个模块可以用于实现上述任一方面所提供的故障检测方法。
第四方面,提供了一种网络设备,该网络设备包括:存储器,处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该处理器执行该计算机程序时实现如上述任一方面所提供的故障检测方法。
第五方面,提供了一种网络设备,该网络设备可以包括:主控板和接口板,该主控板和接口板可以用于实现上述任一方面所提供的故障检测方法。
第六方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,该指令由处理器执行以实现如上述任一方面所提供的故障检测方法。
第七方面,提供了一种包含指令的计算机程序产品,该指令由处理器执行以实现如上述任一方面所提供的故障检测方法。
第八方面,提供了一种故障检测系统,该故障检测系统包括:第一网络设备和第二网络设备;其中,该第一网络设备可以用于实现上述第一方面所提供的故障检测方法,该第二网络设备可以用于实现上述第二方面所提供的故障检测方法。
第九方面,提供了一种芯片,该芯片可以用于实现上述任一方面所提供的故障检测方法。
综上所述,本申请提供了一种故障检测方法、装置及系统。本申请提供的方案中,由于第二网络设备发送至第一网络设备的第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
附图说明
图1是本申请实施例提供的一种通信网络的结构示意图;
图2是本申请实施例提供的一种故障检测方法的流程图;
图3是本申请实施例提供的另一种故障检测方法的流程图;
图4是本申请实施例提供的一种第一故障检测报文的结构示意图;
图5是本申请实施例提供的另一种通信网络的结构示意图;
图6是本申请实施例提供的又一种故障检测方法的流程图;
图7是本申请实施例提供的再一种故障检测方法的流程图;
图8是本申请实施例提供的一种第二故障检测报文的结构示意图;
图9是本申请实施例提供的再一种故障检测方法的流程图;
图10是本申请实施例提供的一种第一网络设备的结构示意图;
图11是本申请实施例提供的一种第二网络设备的结构示意图;
图12是本申请实施例提供的一种网络设备的结构示意图;
图13是本申请实施例提供的另一种网络设备的结构示意图。
具体实施方式
下面结合附图详细介绍本申请实施例提供的故障检测方法、装置及系统。
图1是本申请实施例提供的一种通信网络的结构示意图。如图1所示,该通信网络可以包括第一网络设备10和第二网络设备20。该第一网络设备10和第二网络设备20之间的链路可以划分为多个网络切片,该第一网络设备10可以通过不同的网络切片向第二网络设备20发送报文。其中,第一网络设备10和第二网络设备20均可以是运营商边缘(provideredge,PE)设备,该PE设备可以是路由器或交换机等具备报文转发功能的设备。
可以理解的是,网络切片是一种在公共共享物理基础设施之上创建的逻辑网络。网络切片使网络运营商能够在通用网络基础设施上为专用虚拟网络提供特定服务,或者为特定客户提供特定服务。
示例的,如图1所示,该第一网络设备10和第二网络设备20之间的链路可以划分为三个网络切片,该三个网络切片的切片标识(identifier,ID)分别为10、20和30。其中,切片ID为10的网络切片可以为基础(basic)切片,切片标识为20和30的网络切片可以为业务切片。并且,不同的业务切片也可以满足不同的业务需求,第一网络设备10可以基于业务流的业务需求,通过对应的网络切片转发该业务流的报文。
为了提高第一网络设备10向第二网络设备20发送报文时的可靠性,第一网络设备10和第二网络设备20之间可以基于BFD协议检测链路是否故障。但是,对于链路划分为多个网络切片的场景,该故障检测方法只能检测网络设备之间的链路是否故障,而无法检测该多个网络切片中的哪个网络切片存在故障。
本申请实施例提供了一种故障检测方法,可以实现对网络切片的故障检测。该方法可以应用于诸如图1所示的系统,如图2所示,该方法包括:
步骤101、第二网络设备向第一网络设备发送第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识。
在本申请实施例中,该第二网络设备可以按照预设的发包周期,周期性地通过第一网络切片向第一网络设备发送该第一故障检测报文。例如,该第一故障检测报文可以是BFD报文。
或者,该第一网络设备可以按照预设的发包周期,周期性地通过第一网络切片向第二网络设备发送第二故障检测报文。第二网络设备接收到该第二故障检测报文后,可以构造反射报文(即第一故障检测报文),并发送至第一网络设备。例如,该第一故障检测报文和第二故障检测报文可以是SBFD报文或者双向主动测量协议(two-way activemeasurement protocol,TWAMP)报文。
步骤102、第一网络设备基于第一故障检测报文的收包状态,检测第一网络切片是否故障。
第一网络设备接收到第二网络设备发送的第一故障检测报文后,可以基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障。例如,若第一网络设备在接收到任一第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则可以基于该第一故障检测报文中的第一切片标识,确定该第一网络切片故障。
其中,该目标时长可以是基于第二网络设备发送第一故障检测报文的发包周期确定的,且该目标时长可以大于该发包周期。例如,该目标时长可以是该发包周期的n倍,n为大于1的整数。
综上所述,本申请实施例提供了一种故障检测方法。由于第二网络设备发送至第一网络设备的第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
图3是本申请实施例提供的另一种故障检测方法的流程图,该方法可以应用于诸如图1所示的系统,且该方法以第二网络设备为报文发起端,第一网络设备为报文接收端为例进行介绍。其中,报文发起端可以是第一网络切片的入节点,报文接收端可以是第一网络切片的出节点。如图3所示,该方法包括:
步骤201、第二网络设备通过第一网络切片向第一网络设备发送第一故障检测报文。
在本申请实施例中,第二网络设备作为报文发起端,可以按照预设的发包周期,周期性地通过第一网络切片向第一网络设备发送第一故障检测报文。该第一故障检测报文中包括第一网络切片的第一切片标识。其中,该第一故障检测报文可以是BFD报文。
可选地,该第一故障检测报文可以为IPv6报文,且该IPv6报文的IPv6扩展头中包括该第一切片标识。例如,参考图4,该IPv6扩展头可以为HBH头,即HBH头中封装有第一切片标识(slice ID)。从图4可以看出,该IPv6报文还包括IPv6头、UDP头和载荷(payload)。其中,IPv6头包括如下字段:版本(version)、流分类(traffic class,TC)、流标签(flowlabel)、载荷长度(payload length)、下一头部(next header)、跳数限制(hop limit)、源地址(source address,SA)和目的地址(destination address,DA)。如图4所示,该HBH头还可以包括:选项类型(option type)、选项数据长度(option data length)、标志(flags)和保留字段。其中,该选项类型、选项数据长度和标志字段的长度均为8比特,保留字段的长度为3字节,第一切片标识的长度可以为4字节。该UDP头包括如下字段:下一头部、长度、源端口(source port)、目的端口、校验和(checksum)和数据(data)。
示例的,参考图5,假设网络设备PE1与网络设备PE2之间通过P1设备连接,网络设备PE1与网络设备PE3之间通过P2设备连接。网络设备PE1还分别与CE设备CE1和CE2连接,网络设备PE2和PE3中的每个PE设备还分别与CE设备CE3和CE4连接。其中,网络设备PE1与网络设备PE2之间的链路可以划分为三个网络切片,该三个网络切片的切片标识分别为10、20和30。网络设备PE1与网络设备PE3之间的链路也可以划分为三个网络切片,该三个网络切片的切片标识分别为10、20和30。
若网络设备PE1需要检测与网络设备PE2之间的切片标识为20的第一网络切片是否故障,则可以通过该第一网络切片向网络设备PE2发送第一故障检测报文。并且,该第一故障检测报文中封装有该第一网络切片的切片标识20。
步骤202、第一网络设备若在接收到任一第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则确定该第一网络切片故障。
第一网络设备通过第一网络切片接收到第二网络设备发送的第一故障检测报文后,可以检测该第一故障检测报文的收包状态。并且,第一网络设备若在接收到任一第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则可以确定该第一网络切片故障。其中,该目标时长可以大于第二网络设备发送第一故障检测报文的发包周期,例如可以是该发包周期的n倍,n可以是3或者10等。
示例的,参考图5,网络设备PE2可以检测通过第一网络切片接收到的封装有第一切片标识20的第一故障检测报文的收包状态。若该第一故障检测报文的收包状态出现异常,则网络设备PE2可以确定该切片标识为20的第一网络切片存在故障。
步骤203、第二网络设备基于该第一网络切片故障,对第一网络切片中承载的业务流的传输路径进行切换。
在本申请实施例中,第一网络设备也可以按照预设的发包周期,周期性地通过第一网络切片向第二网络设备发送故障检测报文。该故障检测报文中包括第一网络切片的第一切片标识。也即是,第一网络设备和第二网络设备之间可以双向发送故障检测报文。其中,该故障检测报文可以是BFD报文。第二网络设备进而可以基于该故障检测报文的收包状态,检测该第一网络切片是否存在故障。该检测过程可以参考上述步骤202,此处不再赘述。
或者,第一网络设备在确定该第一网络切片存在故障后,还可以向第二网络设备(即发送端设备)发送故障消息,该故障消息用于指示第一网络切片故障。例如,参考图5,网络设备PE2确定切片标识为20的第一网络切片存在故障后,可以向网络设备PE1发送故障消息。
第二网络设备在确定该第一网络切片存在故障后,为了确保第一网络切片中承载的业务流能够正常传输,可以对该第一网络切片中承载的业务流的传输路径进行切换。例如,第二网络设备可以采用FRR机制对第一网络切片中承载的业务流的传输路径进行切换。
示例的,参考图5,假设网络设备PE1分别与第一CE设备CE1和第二CE设备CE2连接,其中第一CE设备CE1用于接入虚拟专用网(virtual private network,VPN)A的用户,第二CE设备CE2用于接入VPNB的用户。并且,网络设备PE1可以将VPNA的业务流引入至切片标识为20的第一网络切片,并将VPNB的业务流引入至切片标识为30的网络切片。基于此,若网络设备PE1确定切片标识为20的第一网络切片故障,则可以采用VPN FRR机制对VPNA的业务流的传输路径进行切换。
下文以该第一故障检测报文为BFD报文为例,对该故障检测方法进行介绍。如图6所示,该方法包括:
步骤301、第二网络设备基于第一配置信息,配置为BFD发起端。
在本申请实施例中,若需要对第二网络设备与第一网络设备之间的第一网络切片的故障情况进行检测,则可以由运维人员或控制器在第二网络设备中配置第一配置信息,以将该第二网络设备配置为BFD发起端。该第一配置信息可以包括如下内容:
bfd<name>peer-ipv6<locator-ip>sliceid<sliceid>
discriminator local<md>;
discriminator remote<yd>;
其中,<name>是指BFD会话的标识符,其可以是随机配置的字符串;<locator-ip>可以配置为对端(peer),即第一网络设备的IPv6地址,<sliceid>可以配置为第一网络切片的第一切片标识。<md>和<yd>分别为本地(local)标识符(discriminator)和远端(remote)标识符。该标识符可以是32位的无符号整数。
步骤302、第一网络设备基于第二配置信息,配置为BFD接收端。
在本申请实施例中,若需要对第一网络切片的故障情况进行检测,则还可以由运维人员或控制器在第一网络设备中配置第二配置信息,以将该第一网络设备配置为BFD接收端。该第二配置信息包括的配置项可以与第一配置信息相同,并且,该第二配置信息中的<locator-ip>可以配置为第二网络设备的IPv6地址,<sliceid>可以配置为第一网络切片的第一切片标识。该第二配置信息中的<md>与第一配置信息中的<yd>相同,且第二配置信息中的<yd>与第一配置信息中的<md>相同。
步骤303、第二网络设备通过第一网络切片周期性发送BFD报文。
第二网络设备被配置为BFD发起端后,即可通过第一网络切片周期性发送BFD报文,且该BFD报文中封装有第一网络切片的第一切片标识。
步骤304、切片网络向第一网络设备转发BFD报文。
在本申请实施例中,切片网络中的第一网络切片可以向第一网络设备转发来自该第二网络设备的BFD报文。其中,该切片网络可以是基于IPv6的段路由(segment routingbased on IPv6,SRv6)网络,且可以是SRv6尽力而为(best effort,BE)网络。
步骤305、第一网络设备若检测到BFD报文收包正常,则确定检测状态为正常(up)。
第一网络设备在接收到BFD报文后,可以周期性检测BFD报文的收包状态。若收包状态正常,则可以确定检测状态正常,即第一网络切片不存在故障。
步骤306、若第一网络切片故障,则丢弃BFD报文。
若切片网络中的第一网络切片故障,则第二网络设备发送的BFD报文将无法正常传输,即第一网络切片将丢弃该BFD报文。
步骤307、第一网络设备若检测到BFD报文收包异常,则确定检测状态为故障(down)。
基于步骤306可知,第一网络切片若存在故障并丢弃了第二网络设备发送的BFD报文,则第一网络设备将无法正常接收到BFD报文。也即是,第一网络设备会检测到BFD报文的收包状态异常,并可以确定检测状态为故障,即第一网络切片存在故障。
可以理解的是,上述步骤301至步骤304也可以理解为是第一网络设备与第二网络设备之间建立BFD会话的过程。相应的,在上述步骤305和步骤307中,第一网络设备可以基于BFD报文的收包状态,检测该BFD会话是否故障。
还可以理解的是,第一网络设备也可以执行上述步骤301和步骤303所示的方法,第二网络设备也可以执行上述步骤302、步骤305和步骤307所示的方法。并且,第二网络设备作为第一网络切片的入节点,在确定第一网络切片存在故障后,可以对该第一网络切片中承载的业务流的传输路径进行切换。例如,第二网络设备可以采用VPN FRR机制对该第一网络切片中承载的业务流的传输路径进行切换。
图7是本申请实施例提供的又一种故障检测方法的流程图,该方法可以应用于诸如图1所示的系统,且该方法以第二网络设备为报文反射端,第一网络设备为报文发起端为例进行介绍。其中,该报文发起端可以是第一网络切片的入节点,该报文反射端可以是第一网络切片的出节点。如图7所示,该方法包括:
步骤401、第一网络设备通过第一网络切片向第二网络设备发送第二故障检测报文。
在本申请实施例中,第一网络设备作为报文发起端,可以按照预设的发包周期,周期性地通过第一网络切片向第二网络设备发送第二故障检测报文。该第二故障检测报文中至少包括该第一网络切片的第一切片标识。
可选地,该第二故障检测报文中还可以包括第二网络切片的第二切片标识,该第二网络切片为用于传输反射报文(即第一故障检测报文)的网络切片。例如,如图8所示,该第二故障检测报文的HBH头中可以封装有该第一切片标识。并且,该第二故障检测报文还可以包括扩展TLV字段,该扩展TLV字段中可以封装有该第二切片标识。参考图8,该扩展TLV字段还可以包括:类型字段、长度字段和保留字段。
可选的,如图8所示,该第二故障检测报文还可以包括魔术字(magic word)字段,该魔术字字段携带有魔术字,该魔术字用于指示第二故障检测报文中还包括扩展TLV。示例的,该魔术字可以为0x42464445,其中,0x是指十六进制数。
可以理解的是,该第二网络切片与第一网络切片可以相同,也可以不同。对于该第二网络切片与第一网络切片相同的场景,第二故障检测报文中也可以无需携带第二切片标识。
步骤402、第二网络设备通过第二网络切片向第一网络设备发送第一故障检测报文。
第二网络设备通过第一网络切片接收到第二故障检测报文后,可以构造该第二故障检测报文的反射报文,即第一故障检测报文。之后,第二网络设备可以通过第二网络切片向第一网络设备发送该第一故障检测报文。其中,该第一故障检测报文中封装有第一切片标识,例如该第一故障检测报文的HBH头中封装有该第一切片标识。
可选地,在本申请实施例中,该第一故障检测报文和第二故障检测报文均可以是SBFD报文,或者均可以是TWAMP报文。
可以理解的是,该第二网络设备中可以预先配置有第二网络切片的第二切片标识,第二网络设备可以基于该配置,通过第二网络切片向第一网络设备发送第一故障检测报文。或者,该第二网络设备可以基于第二故障检测报文中封装的第二切片标识,通过第二网络切片向第一网络设备发送第一故障检测报文。又或者,若第二故障检测报文中封装了第一切片标识,但未封装第二切片标识,则该第二网络设备可以直接通过第一切片标识指示的第一网络切片向第一网络设备发送第一故障检测报文。
步骤403、第一网络设备若在接收到任一第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则确定该第一网络切片和第二网络切片故障。
第一网络设备接收到第二网络设备通过第二网络切片发送的第一故障检测报文后,可以检测(例如周期性检测)该第一故障检测报文的收包状态。若第一网络设备在接收到任一第一故障检测报文之后的目标时长内未接收到下一个第一故障检测报文,则可以确定收包状态异常,进而确定该第一网络切片和第二网络切片均故障。
其中,该目标时长可以大于第一网络设备发送第二故障检测报文的发包周期,例如可以是该发包周期的n倍,n可以是3或者10等。
步骤404、第一网络设备基于该第一网络切片和第二网络切片故障,对第一网络切片和第二网络切片中承载的业务流的传输路径进行切换。
第一网络设备在确定该第一网络切片和第二网络切片存在故障后,还可以对第一网络切片和第二网络切片中承载的业务流的传输路径进行切换。例如,第一网络设备可以采用FRR机制对第一网络切片和第二网络切片中承载的业务流的传输路径进行切换。由此,可以确保业务流的正常传输,避免影响业务流的性能。
示例的,参考图5,假设VPNA的上行业务流被网络设备PE1引入至切片标识为20的第一网络切片,其下行业务流被网络设备PE2引入至切片标识为30的第二网络切片。则该两个网络设备在进行故障检测时,网络设备PE1可以通过切片标识为20的第一网络切片向网络设备PE2发送第二故障检测报文。网络设备PE2可以通过切片标识为30的第二网络切片向网络设备PE1发送第一故障检测报文。网络设备PE1若检测到第一故障检测报文的收包状态异常,则可以确定该第一网络切片和第二网络切片均故障。之后,网络设备PE1则可以对VPNA的上行业务流和下行业务流的传输路径均进行切换。
可选地,在本申请实施例中,第一网络设备能够以业务流或业务流组为粒度,对网络切片进行故障检测。其中,针对待检测的每个业务流(或业务流组),第一网络切片即为用于承载该业务流(或业务流组)的上行流量的网络切片,第二网络切片即为用于承载该业务流(或业务流组)的下行流量的网络切片。相应的,第一网络设备若检测到第一故障检测报文的收包状态异常,则可以确定该业务流(或业务流组)的传输出现故障,进而可以对该业务流(或业务流组)的传输路径进行切换。
下文以该第一故障检测报文和第二故障检测报文均为SBFD报文为例,对该故障检测方法进行介绍。如图9所示,该方法包括:
步骤501、第二网络设备基于第一配置信息,配置为SBFD发起端。
在本申请实施例中,若需要对第二网络设备与第一网络设备之间的第一网络切片的故障情况进行检测,则可以由运维人员或控制器在第二网络设备中配置第一配置信息,以将该第二网络设备配置为SBFD发起端。该第一配置信息可以包括如下内容:
seamless-bfd sliceid local<local-sliceid>remote<remote-sliceid>;
其中,<local-sliceid>可以为第一网络切片的第一切片标识,<remote-sliceid>可以为第二网络切片的第二切片标识。可以理解的是,该第一网络切片和第二网络切片可以相同,也可以不同。相应的,该第一切片标识和第二切片标识可以相同,也可以不同。
步骤502、第一网络设备基于第二配置信息,配置为SBFD反射端。
在本申请实施例中,若需要对第一网络切片的故障情况进行检测,则还可以由运维人员或控制器在第一网络设备中配置第二配置信息,以将该第一网络设备配置为SBFD反射端。该第二配置信息包括的配置项可以与第一配置信息相同,并且,该第二配置信息中的<local-sliceid>可以配置为第二切片标识,<remote-sliceid>可以配置为第一切片标识。
步骤503、第二网络设备通过第一网络切片周期性发送SBFD报文。
第二网络设备被配置为SBFD发起端后,即可通过第一网络切片周期性发送SBFD报文,且该SBFD报文中封装有第一网络切片的第一切片标识,以及第二网络切片的第二切片标识。
步骤504、切片网络向第一网络设备转发该SBFD报文。
在本申请实施例中,若切片网络正常,则该切片网络中的第一网络切片可以向第一网络设备转发来自该第二网络设备的SBFD报文。
步骤505、第二网络设备构造反射SBFD报文。
第二网络设备接收到SBFD报文后,可以根据该SBFD报文中封装的第一切片标识,构造反射SBFD报文。该反射SBFD报文中封装有该第一切片标识,例如,该反射SBFD报文的HBH头中封装有该第一切片标识。
步骤506、第二网络设备通过第二网络切片发送反射SBFD报文。
第二网络设备可以通过该SBFD报文中的第二切片标识指示的第二网络切片,向第一网络设备发送反射SBFD报文。
步骤507、切片网络向第一网络设备转发反射SBFD报文。
在本申请实施例中,若切片网络正常,则该切片网络中的第二网络切片能够正常向第一网络设备转发该反射SBFD报文。
步骤508、第一网络设备若检测到反射SBFD报文收包正常,则确定检测状态为正常。
第一网络设备在接收到反射SBFD报文后,可以周期性检测反射SBFD报文的收包状态。若收包状态正常,则可以确定检测状态正常,即第一网络切片和第二网络切片均不存在故障。
步骤509、若第一网络切片和/或第二网络切片故障,则丢弃SBFD报文。
若切片网络中的第一网络切片故障,则第一网络设备发送的SBFD报文将无法正常传输,即第一网络切片将丢弃该SBFD报文。相应的,第二网络设备无法构造并反馈反射SBFD报文。若切片网络中的第一网络切片故障,则第二网络设备发送的反射SBFD报文将无法正常传输,即第二网络切片将丢弃该反射SBFD报文。
步骤510、第一网络设备若检测到反射SBFD报文收包异常,则确定检测状态为故障。
基于步骤509可知,若第一网络切片存在故障并丢弃了SBFD报文,和/或,第二网络切片故障并丢弃了反射SBFD报文,则第一网络设备将无法正常接收到反射BFD报文。也即是,第一网络设备会检测到反射SBFD报文的收包状态异常,并可以确定检测状态为故障,即第一网络切片和第二网络切片均存在故障。
第一网络设备确定第一网络切片和第二网络切片均存在故障后,可以对该第一网络切片和第二网络切片中承载的业务流的传输路径进行切换。
可以理解的是,上述步骤501至步骤507也可以理解为是第一网络设备与第二网络设备之间建立SBFD会话的过程。该SBFD会话可以模拟待检测的业务流(或业务流组)的传输状态。相应的,在上述步骤508至步骤510中,第一网络设备可以基于反射SBFD报文的收包状态,检测该SBFD会话是否故障,进而检测该业务流(或业务流组)是否故障。
还可以理解的是,第一网络设备与第二网络设备之间可以部署有多个网络切片。对于其中的每个网络切片,第一网络设备和第二网络设备均可以通过图2、图3、图6、图7或图9所示的实施例检测该网络切片是否故障。例如,第二网络设备可以通过第一网络切片发送封装有第一切片标识的第一故障检测报文,并可以通过第二网络切片发送封装有第二切片标识的第一故障检测报文。第一网络设备进而可以基于该封装有第一切片标识的第一故障检测报文的收包状态,检测第一网络切片是否故障,并可以基于该封装有第二切片标识的第一故障检测报文的收包状态,检测第二网络切片是否故障。
还可以理解的是,本申请实施例提供的上述故障检测方法的步骤先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减。例如,图3所示实施例中的步骤203可以根据情况删除,或者,图7所示实施例中的步骤404可以根据情况删除。
综上所述,本申请实施例提供了一种故障检测方法。由于第二网络设备发送至第一网络设备的第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
图10是本申请实施例提供的一种第一网络设备的结构示意图,该第一网络设备可以应用于诸如图1或图5所示的系统,且可以实现上述方法实施例中由第一网络设备执行的步骤。
如图10所示,该第一网络设备包括:
接收模块601,用于接收第二网络设备发送的第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识。该接收模块601的功能实现可以参考上述方法实施例中步骤101的相关描述。
检测模块602,用于基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障。该检测模块602的功能实现可以参考上述方法实施例中步骤102的相关描述。
可选地,该检测模块602,可以用于若在接收到一个该第一故障检测报文之后的目标时长内未接收到下一个该第一故障检测报文,则确定该第一网络切片故障。该检测模块602的功能实现可以参考上述方法实施例中步骤202和步骤307的相关描述。
可选地,该第一故障检测报文可以为IPv6报文,该IPv6报文的IPv6扩展头中包括该第一切片标识。其中,该IPv6扩展头可以为HBH头。
可选地,该接收模块601,可以用于接收该第二网络设备通过该第一网络切片发送的该第一故障检测报文。该接收模块601的功能实现还可以参考上述方法实施例中步骤201、步骤303和步骤304的相关描述。
可选地,该第一故障检测报文可以为BFD报文。
可选地,如图10所示,该第一网络设备还可以包括:
发送模块603,用于在接收模块601接收第二网络设备发送的第一故障检测报文之前,通过第一网络切片向第二网络设备发送第二故障检测报文。该发送模块603的功能实现可以参考上述方法实施例中步骤401、步骤503和步骤504的相关描述。
相应的,该接收模块601可以用于接收该第二网络设备通过第二网络切片发送的该第一故障检测报文,该第一故障检测报文为该第二故障检测报文的反射报文。该接收模块601的功能实现还可以参考上述方法实施例中步骤402、步骤506和步骤507的相关描述。
可选地,该第一故障检测报文和该第二故障检测报文可以均为SBFD报文,或者可以均为TWAMP报文。
可选地,该第二故障检测报文中包括该第一切片标识和第二网络切片的第二切片标识。
可选地,该第二故障检测报文的HBH头中包括该第一切片标识,该第二故障检测报文的扩展TLV字段中包括该第二切片标识。
可选地,该检测模块602,可以用于基于该第一故障检测报文的收包状态,检测该第一网络切片和第二网络切片是否故障。该检测模块602的功能实现可以参考上述方法实施例中步骤403的相关描述。
可选地,如图10所示,该第一网络设备还可以包括:
切换模块604,用于基于第一网络切片故障,对该第一网络切片中承载的业务流的传输路径进行切换。该切换模块604的功能实现可以参考上述方法实施例中步骤404的相关描述。
可选地,该切换模块604,可以用于基于该第一网络切片故障,通过FRR机制对该第一网络切片中承载的业务流的传输路径进行切换。
综上所述,本申请实施例提供了一种第一网络设备。由于第二网络设备发送至第一网络设备的第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
图11是本申请实施例提供的一种第二网络设备的结构示意图,该第二网络设备可以应用于诸如图1或图5所示的系统,且可以实现上述方法实施例中由第二网络设备执行的步骤。
如图11所示,该第二网络设备包括:
发送模块701,用于向第一网络设备发送第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识。其中,该第一故障检测报文用于供第一网络设备基于该第一故障检测报文的收包状态,检测该第一网络切片是否故障。该发送模块701的功能实现可以参考上述方法实施例中步骤101的相关描述。
可选地,该第一故障检测报文可以为IPv6报文,该IPv6报文的IPv6扩展头中包括该第一切片标识。其中,该IPv6扩展头可以为HBH头。
可选地,该发送模块701,可以用于通过该第一网络切片向第一网络设备发送第一故障检测报文。该发送模块701的功能实现还可以参考上述方法实施例中步骤201的相关描述。
可选地,该第一故障检测报文可以为BFD报文。
可选地,如图11所示,该第二网络设备还可以包括:
切换模块702,用于基于该第一网络切片故障,对第一网络切片中承载的业务流的传输路径进行切换。该切换模块702的功能实现可以参考上述方法实施例中步骤203的相关描述。
可选地,该切换模块702,可以用于基于第一网络切片故障,通过FRR机制对第一网络切片中承载的业务流的传输路径进行切换。
可选地,如图11所示,该第二网络设备还可以包括:
接收模块703,用于在该发送模块701向第一网络设备发送第一故障检测报文之前,通过第一网络切片接收第一网络设备发送的第二故障检测报文。该接收模块703的功能实现可以参考上述方法实施例中步骤401的相关描述。
相应的,该发送模块701可以用于通过第二网络切片向第一网络设备发送第一故障检测报文,该第一故障检测报文为该第二故障检测报文的反射报文。该发送模块701的功能实现还可以参考上述方法实施例中步骤402的相关描述。
可选地,该第一故障检测报文和该第二故障检测报文可以均为SBFD报文,或者可以均为TWAMP报文。
综上所述,本申请实施例提供了一种第二网络设备。由于该第二网络设备发送至第一网络设备的第一故障检测报文中包括第一网络切片的第一切片标识,因此第一网络设备即可基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。由此,实现了对网络切片的故障情况的准确检测,有效提高了故障检测的灵活性和精确性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的第一网络设备、第二网络设备以及各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
应理解的是,本申请实施例提供的第一网络设备和第二网络设备还可以用特定应用集成电路(application-specific integrated circuit,ASIC)实现,或可编程逻辑器件(programmable logic device,PLD)实现,上述PLD可以是复杂程序逻辑器件(complexprogrammable logical device,CPLD),现场可编程门阵列(field-programmable gatearray,FPGA),通用阵列逻辑(generic array logic,GAL)或其任意组合。此外,也可以通过软件实现上述方法实施例提供的故障检测方法,当通过软件实现上述方法实施例提供的故障检测方法时,该第一网络设备和第二网络设备中的各个功能模块也可以为软件模块。
图12是本申请实施例提供的一种网络设备的结构示意图。该网络设备可以应用于诸如图1或图5所示系统,且可以为该系统中的PE设备。并且,该网络设备可以实现上述方法实施例中由第一网络设备或第二网络设备执行的步骤。参考图12,该网络设备包括:处理器1201、存储器1202、网络接口1203和总线1204。
其中,存储器1202中存储有计算机程序12021,计算机程序12021用于实现各种应用功能。处理器1201用于执行该计算机程序12021以实现上述方法实施例提供的应用于第一网络设备或第二网络设备的故障检测方法。例如,该计算机程序12021可以用于实现图10或图11所示的各个模块的功能。
处理器1201可以是中央处理器(central processing unit,CPU),该处理器1201还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、ASIC、FPGA、图形处理器(graphics processing unit,GPU)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器。
存储器1202可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DRRAM)。
网络接口1203可以为多个,且网络接口1203用于实现与其他设备之间的通信连接(可以是有线或者无线)。其中,在本申请实施例中,网络接口1203用于收发报文。其中,其他设备可以是终端、服务器、VM等设备或其它网络设备。
总线1204用于连接处理器1201、存储器1202和网络接口1203。并且,总线1204除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线1204。
若该网络设备为第一网络设备,则处理器1201用于通过网络接口1203接收第二网络设备发送的第一故障检测报文,以及基于该第一故障检测报文的收包状态,检测第一网络切片是否故障。其中,该第一故障检测报文中包括第一网络切片的第一切片标识。该处理器1201的详细处理过程请参考上述图2、图3、图6、图7以及图9所示方法实施例中由第一网络设备执行的步骤,这里不再赘述。
若该网络设备为第二网络设备,则处理器1201用于通过网络接口1203向第一网络设备发送第一故障检测报文,该第一故障检测报文中包括第一网络切片的第一切片标识。并且,该第一故障检测报文用于供第一网络设备基于第一故障检测报文的收包状态,检测第一网络切片是否故障。该处理器1201的详细处理过程请参考上述图2、图3、图6、图7以及图9所示方法实施例中由第二网络设备执行的步骤,这里不再赘述。
图13是本申请实施例提供的另一种网络设备的结构示意图。该网络设备可以应用于诸如图1或图5所示系统,且可以为该系统中的PE设备。并且,该网络设备可以实现上述方法实施例中由第一网络设备或第二网络设备执行的步骤。如图13所示,该网络设备可以包括:主控板801和至少一个接口板(接口板也称为线卡或业务板),例如图13中示出了接口板1302和接口板1303。多个接口板的情况下网络设备还可以包括交换网板1304,该交换网板1304用于完成各接口板之间的数据交换。
其中,主控板1301也称为主处理单元(main processing unit,MPU)或路由处理卡(route processor card),主控板1301用于完成系统管理、设备维护和协议处理等功能。主控板1301上主要有3类功能单元:系统管理控制单元、系统时钟单元和系统维护单元。主控板1301包括:中央处理器13011和存储器13012。
接口板1302和1303也称为线路接口单元卡(line processing unit,LPU)、线卡(line card)或业务板,接口板用于提供各种业务接口,并实现报文的转发。其中,接口板所提供的业务接口可以包括:基于SONET/SDH的数据包(packet over SONET/SDH,POS)接口、千兆以太网(gigabit Ethernet,GE)接口和异步传输模式(asynchronous transfer mode,ATM)接口等。其中,SONET是指同步光纤网络(synchronous optical network),SDH是指同步数字体系(synchronous digital hierarchy)。主控板1301、接口板1302以及接口板1303之间通过系统总线与系统背板相连以实现互通。如图13所示,接口板1302上包括一个或多个中央处理器13021。中央处理器13021用于对接口板1302进行控制管理并与主控板1301上的中央处理器13011进行通信。接口板1302上的存储器13024用于存储转发表项,网络处理器13022可以通过查找存储器13024中存储的转发表项进行报文的转发。存储器13024还可以用于存储程序代码。
该接口板1302还包括一个或多个物理接口卡13023,该一个或多个物理接口卡13023用于接收上一跳节点发送的报文,并根据中央处理器13021的指示向下一跳节点发送处理后的报文。
此外,可以理解的是,图13中的接口板1302中的中央处理器13021和/或网络处理器13022可以是专用硬件或芯片,如可以采用ASIC来实现上述功能,这种实现方式即为通常所说的转发面采用专用硬件或芯片处理的方式。在另外的实施方式中,所述中央处理器13021和/或网络处理器13022也可以采用通用的处理器,如通用的CPU来实现以上描述的功能。
此外应理解的是,主控板1301可能有一块或多块,有多块的时候可以包括主用主控板和备用主控板。接口板可能有一块或多块,该网络设备的数据处理能力越强,提供的接口板越多。如图13所示,网络设备包括接口板1302和接口板1303。当采用分布式的转发机制时,接口板1303的结构与接口板1302的结构基本相同,且接口板1303上的操作与接口板1302的操作基本相似,为了简洁,不再赘述。网络设备具有多块接口板的情况下,该多块接口板之间可以通过一块或多块交换网板1304通信,且可以实现负荷分担和冗余备份,以提供大容量的数据交换和处理能力。
在集中式转发架构下,该网络设备可以不需要交换网板1304,接口板承担整个系统的业务数据的处理功能。所以,分布式架构的网络设备的数据接入和处理能力要大于集中式架构的网络设备。具体采用哪种架构,取决于具体的组网部署场景,此处不做任何限定。
在本申请实施例中,存储器13012和存储器13024可以是ROM或可存储静态信息和指令的其它类型的静态存储设备,也可以是RAM或者可存储信息和指令的其它类型的动态存储设备,还可以是EEPROM、只读光盘(compact disc read-only Memory,CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质,但不限于此。接口板1302中的存储器13024可以是独立存在,并通过通信总线与中央处理器13021相连接;或者,存储器13024也可以和中央处理器13021集成在一起。主控板1301中的存储器13012可以是独立存在,并通过通信总线与中央处理器13011相连接;或者,存储器13012也可以和中央处理器13011集成在一起。
存储器13024中存储的程序代码,由中央处理器13021来控制执行,存储器13012存储的程序代码,由中央处理器13011来控制执行。该中央处理器13021和/或中央处理器13011可以通过执行程序代码来实现上述实施例所提供的故障检测方法。存储器13024和/或存储器13012存储的程序代码中可以包括一个或多个软件单元。这一个或多个软件单元可以为图10或图11所示的功能模块。
在本申请实施例中,该物理接口卡13023,可以是使用任何收发器一类的装置,用于与其它设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local area networks,WLAN)等。
可选地,图10至图12中任一附图所示的设备也可以采用图13所示的结构实现。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,该指令可以由处理器执行,以实现如上述方法实施例中由第一网络设备或第二网络设备执行的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,该指令可以由处理器执行,以实现如上述方法实施例中由第一网络设备或第二网络设备执行的步骤。
本申请实施例还提供了一种故障检测系统,如图1所示,该故障检测系统可以包括第一网络设备10和第二网络设备20。
该第一网络设备10用于实现上述方法实施例中由第一网络设备执行的方法。该第二网络设备20用于实现上述方法实施例中由第二网络设备执行的方法。
其中,该第一网络设备10的结构可以如图10、图12或图13所示,该第二网络设备20的结构可以如图11、图12或图13所示。
可选地,第一网络设备10和第二网络设备20可以均为PE设备,该故障检测系统可以是SRv6 BE系统。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本申请实施例中,术语“第一”、“第二”和“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“至少一个”是指一个或多个,“多个”是指两个或两个以上。术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的构思和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (26)
1.一种故障检测方法,其特征在于,应用于第一网络设备,所述方法包括:
接收第二网络设备发送的第一故障检测报文,所述第一故障检测报文中包括第一网络切片的第一切片标识;
基于所述第一故障检测报文的收包状态,检测所述第一网络切片是否故障。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一故障检测报文的收包状态,检测所述第一网络切片是否故障,包括:
若在接收到一个所述第一故障检测报文之后的目标时长内未接收到下一个所述第一故障检测报文,则确定所述第一网络切片故障。
3.根据权利要求1或2所述的方法,其特征在于,所述第一故障检测报文为互联网协议第6版IPv6报文,所述IPv6报文的IPv6扩展头中包括所述第一切片标识。
4.根据权利要求3所述的方法,其特征在于,所述IPv6扩展头为逐跳选项HBH头。
5.根据权利要求1至4任一所述的方法,其特征在于,所述接收第二网络设备发送的第一故障检测报文,包括:
接收所述第二网络设备通过所述第一网络切片发送的所述第一故障检测报文。
6.根据权利要求5所述的方法,其特征在于,所述第一故障检测报文为双向转发检测BFD报文。
7.根据权利要求1至4任一所述的方法,其特征在于,在所述接收第二网络设备发送的第一故障检测报文之前,所述方法还包括:
通过所述第一网络切片向所述第二网络设备发送第二故障检测报文;
所述接收第二网络设备发送的第一故障检测报文,包括:
接收所述第二网络设备通过第二网络切片发送的所述第一故障检测报文,所述第一故障检测报文为所述第二故障检测报文的反射报文。
8.根据权利要求7所述的方法,其特征在于,所述第一故障检测报文和所述第二故障检测报文均为无缝双向转发检测SBFD报文或者均为双向主动测量协议TWAMP报文。
9.根据权利要求7或8所述的方法,其特征在于,所述第二故障检测报文中包括所述第一切片标识和所述第二网络切片的第二切片标识。
10.根据权利要求9所述的方法,其特征在于,所述第二故障检测报文的HBH头中包括所述第一切片标识,所述第二故障检测报文的扩展类型长度值TLV字段中包括所述第二切片标识。
11.根据权利要求7至10任一所述的方法,其特征在于,所述基于所述第一故障检测报文的收包状态,检测所述第一网络切片是否故障,包括:
基于所述第一故障检测报文的收包状态,检测所述第一网络切片和所述第二网络切片是否故障。
12.根据权利要求1至11任一所述的方法,其特征在于,所述方法还包括:
基于所述第一网络切片故障,对所述第一网络切片中承载的业务流的传输路径进行切换。
13.根据权利要求12所述的方法,其特征在于,所述基于所述第一网络切片故障,对所述第一网络切片中承载的业务流的传输路径进行切换,包括:
基于所述第一网络切片故障,通过快速重路由FRR机制对所述第一网络切片中承载的业务流的传输路径进行切换。
14.一种故障检测方法,其特征在于,应用于第二网络设备,所述方法包括:
向第一网络设备发送第一故障检测报文,所述第一故障检测报文中包括第一网络切片的第一切片标识;
其中,所述第一故障检测报文用于供所述第一网络设备基于所述第一故障检测报文的收包状态,检测所述第一网络切片是否故障。
15.根据权利要求14所述的方法,其特征在于,所述第一故障检测报文为互联网协议第6版IPv6报文,所述IPv6报文的IPv6扩展头中包括所述第一切片标识。
16.根据权利要求15所述的方法,其特征在于,所述IPv6扩展头为逐跳选项HBH头。
17.根据权利要求14至16任一所述的方法,其特征在于,所述向第一网络设备发送第一故障检测报文,包括:
通过所述第一网络切片向所述第一网络设备发送所述第一故障检测报文。
18.根据权利要求17所述的方法,其特征在于,所述第一故障检测报文为双向转发检测BFD报文。
19.根据权利要求17或18所述的方法,其特征在于,所述方法还包括:
基于所述第一网络切片故障,对所述第一网络切片中承载的业务流的传输路径进行切换。
20.根据权利要求19所述的方法,其特征在于,所述基于所述第一网络切片故障,对所述第一网络切片中承载的业务流的传输路径进行切换,包括:
基于所述第一网络切片故障,通过快速重路由FRR机制对所述第一网络切片中承载的业务流的传输路径进行切换。
21.根据权利要求14至16任一所述的方法,其特征在于,在所述向第一网络设备发送第一故障检测报文之前,所述方法还包括:
通过所述第一网络切片接收所述第一网络设备发送的第二故障检测报文;
所述向第一网络设备发送第一故障检测报文,包括:
通过第二网络切片向所述第一网络设备发送所述第一故障检测报文,所述第一故障检测报文为所述第二故障检测报文的反射报文。
22.根据权利要求21所述的方法,其特征在于,所述第一故障检测报文和所述第二故障检测报文均为无缝双向转发检测SBFD报文或者均为双向主动测量协议TWAMP报文。
23.一种网络设备,其特征在于,所述网络设备包括:存储器,处理器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至22任一所述的方法。
24.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,所述指令由处理器执行以实现如权利要求1至22任一所述的方法。
25.一种包含指令的计算机程序产品,其特征在于,所述指令由处理器执行以实现如权利要求1至22任一所述的方法。
26.一种故障检测系统,其特征在于,所述系统包括:第一网络设备和第二网络设备;
所述第一网络设备用于实现如权利要求1至13任一所述的方法;
所述第二网络设备用于实现如权利要求14至22任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211127815.7A CN117768340A (zh) | 2022-09-16 | 2022-09-16 | 故障检测方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211127815.7A CN117768340A (zh) | 2022-09-16 | 2022-09-16 | 故障检测方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117768340A true CN117768340A (zh) | 2024-03-26 |
Family
ID=90309131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211127815.7A Pending CN117768340A (zh) | 2022-09-16 | 2022-09-16 | 故障检测方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117768340A (zh) |
-
2022
- 2022-09-16 CN CN202211127815.7A patent/CN117768340A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11606292B2 (en) | Route processing method, device, and system | |
CN109873760B (zh) | 处理路由的方法和装置、以及数据传输的方法和装置 | |
US20220407802A1 (en) | Packet processing method and apparatus, network device, and storage medium | |
KR102342286B1 (ko) | Dcn 메시지 처리 방법, 네트워크 디바이스, 및 네트워크 시스템 | |
CN107547402B (zh) | 一种转发表生成方法和装置 | |
CN113411834B (zh) | 报文处理方法、装置、设备及存储介质 | |
US20200396162A1 (en) | Service function chain sfc-based communication method, and apparatus | |
US8570857B2 (en) | Resilient IP ring protocol and architecture | |
WO2016058245A1 (zh) | 操作、管理和维护oam报文处理方法及装置 | |
US7778204B2 (en) | Automatic maintenance of a distributed source tree (DST) network | |
CN112565046B (zh) | 同步多播路由器能力 | |
CN109617803B (zh) | 一种转发表项生成方法、装置及设备 | |
EP2911355A1 (en) | Method and device for flow path negotiation in link aggregation group | |
WO2021258823A1 (zh) | 路径创建方法、装置及系统 | |
WO2018113294A1 (zh) | 一种转发报文的方法、设备及系统 | |
US20190007302A1 (en) | Mechanism for Dual Active Detection Link Monitoring in Virtual Switching System with Hardware Accelerated Fast Hello | |
US20220124023A1 (en) | Path Switching Method, Device, and System | |
CN107682261B (zh) | 流量转发方法及装置 | |
WO2019062268A1 (zh) | 传输组播报文的方法、装置和系统 | |
WO2016197950A1 (zh) | 一种路径检测的方法、路由设备及系统 | |
CN117768340A (zh) | 故障检测方法、装置及系统 | |
CN113973072B (zh) | 报文发送方法、设备及系统 | |
WO2019056239A1 (zh) | 报文同步方法和装置 | |
CN116094987A (zh) | 转发路径的确定方法及装置 | |
CN115242699A (zh) | 报文传输方法、切片生成方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |