CN117221163A - 一种网络设备pfc死锁及恢复的测试方法、设备及介质 - Google Patents

一种网络设备pfc死锁及恢复的测试方法、设备及介质 Download PDF

Info

Publication number
CN117221163A
CN117221163A CN202311214552.8A CN202311214552A CN117221163A CN 117221163 A CN117221163 A CN 117221163A CN 202311214552 A CN202311214552 A CN 202311214552A CN 117221163 A CN117221163 A CN 117221163A
Authority
CN
China
Prior art keywords
pfc
equipment
server
leaf
spine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311214552.8A
Other languages
English (en)
Inventor
吴莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Cisco Networking Technology Co Ltd
Original Assignee
Inspur Cisco Networking Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Cisco Networking Technology Co Ltd filed Critical Inspur Cisco Networking Technology Co Ltd
Priority to CN202311214552.8A priority Critical patent/CN117221163A/zh
Publication of CN117221163A publication Critical patent/CN117221163A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请实施例公开了一种网络设备PFC死锁及恢复的测试方法、设备及介质。包括,构建PFC死锁及恢复所需的测试环境;在确定测试环境中流量正常流转的情况下,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对网络设备PFC死锁的测试;在测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的PFC pause帧的变换情况进行检测,以实现对网络设备PFC死锁恢复的测试。通过上述方法降低测试成本。

Description

一种网络设备PFC死锁及恢复的测试方法、设备及介质
技术领域
本申请涉及数据传输技术领域,尤其涉及一种网络设备PFC死锁及恢复的测试方法、设备及介质。
背景技术
随着全球企业数字化转型的加速进行,数据中心的使命正在从聚焦业务快速发放向聚焦数据高效处理进行转变。为了提升数据处理的效率,HPC高性能计算、分布式存储、AI人工智能等当今热门应用要求数据中心网络具有无丢包、低时延、高吞吐的能力。然而传统的基于TCP/IP协议栈的网络通信,由于在数据拷贝等关键环节资源消耗较大并且时延过高,无法满足对网络性能的高要求。
现有技术中,数据中心网络的典型组网通常部署一个Spine-Leaf网络,Leaf和Spine之间采用100GE链路全互联,服务器使用25GE或100GE接入Leaf交换机,支持M-LAG双归接入。服务器集群上部署RoCEv2分布式高性能应用,在网络交换机上部署智能无损网络技术,通过智能化的网络拥塞控制满足RoCEv2应用的需求。但这种架构组网和拓扑较复杂,需要使用大量的服务器和网络设备,以致成本较高。
发明内容
本申请实施例提供了一种网络设备PFC死锁及恢复的测试方法、设备及介质,用于解决如下技术问题:现有技术中,数据中心网络的架构组网和拓扑较复杂,需要使用大量的服务器和网络设备,以致成本较高。
本申请实施例采用下述技术方案:
本申请实施例提供一种网络设备PFC死锁及恢复的测试方法。包括,构建PFC死锁及恢复所需的测试环境;其中,测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;在确定测试环境中流量正常流转的情况下,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对网络设备PFC死锁的测试;在测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的PFC pause帧的变换情况进行检测,以实现对网络设备PFC死锁恢复的测试。
本申请实施例通过优化测试拓扑,将之前需要用到2台Spine+4台Leaf+4台服务器的测试拓扑,简化为2台Spine+2台Leaf+2台服务器的测试拓扑,简化了所需的测试设备,降低了测试成本。其次,在实验室环境中模拟测试网络设备的PFC死锁检测和自动恢复功能,验证网络中出现拥塞时,PFC死锁检测和自动恢复功能可以正常生效,防止网络拥塞时出现丢包,保证智能无损网络的稳定性和可靠性。
在本申请的一种实现方式中,构建PFC死锁及恢复测试环境,具体包括:Spine设备与Leaf设备之间通过25GE链路互联;以及Leaf设备与服务器之间通过25GE链路互联;以及服务器均设置有25G速率的RoCEv2的智能网卡;对第一服务器与第二服务器分别对应的网卡进行ip地址配置,并对第一Leaf设备、第二Leaf设备以及第一Spine设备配置相应的静态路由信息,以使第一服务器与第二服务器可以进行流量传输。
在本申请的一种实现方式中,以使第一服务器与第二服务器可以进行流量传输,具体包括:第一服务器将流量输送至第一Leaf设备,通过第一Leaf设备,将流量发送至第一Spine设备;通过第一Spine设备将流量发送至第二Leaf设备;通过第二Leaf设备将流量发送至第二服务器,以实现流量从第一服务器传递至第二服务器。
在本申请的一种实现方式中,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,具体包括:在第一Spine设备、第二Spine设备、第一Leaf设备以及Leaf设备上,分别进行默认路由设置;对第二Leaf设备上到第二服务器上的静态路由信息进行删除处理,以及,将第二Leaf设备上连接的第二服务器的端口断开,以构造环路故障流量。
在本申请的一种实现方式中,环路故障流量的流量路径为:第一Leaf设备将流量输送至第一Spine设备,以通过第一Spine设备将流量发送至第二Leaf设备;通过第二Leaf设备将流量发送至第二Spine设备;通过第二Spine设备,将流量发送至第一Leaf设备,以实现故障流量环路传递。
在本申请的一种实现方式中,对测试环境中多个设备的端口分别对应的PFCpause帧的情况进行检测,具体包括:获取第一Leaf设备、第一Spine设备、第二Spine设备以及第二Leaf设备分别对应的PFC pause帧增长信息;在PFC pause帧增长信息为持续增长,且测试环境中的各设备不在转发第一服务器至第二服务器的数据流量的情况下,确定PFC死锁检测生效。
在本申请的一种实现方式中,在测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的PFC pause帧的变换情况进行检测,具体包括:将第一Leaf设备与第二Spine设置之间直连的端口进行断开处理;启动计时,计时时间到,将端口恢复连接;获取第一Leaf设备、第一Spine设备、第二Spine设备以及第二Leaf设备分别对应的端口所接收到的PFC pause帧信息;在接收到的PFC pause帧不出现增加的情况下,确定PFC死锁恢复生效。
在本申请的一种实现方式中,以实现对网络设备PFC死锁恢复的测试之前,方法还包括:将第二Leaf设备上连接第二服务器的端口恢复连接,以使第二服务器接收到第一服务器发送的流量。
本申请实施例提供一种网络设备PFC死锁及恢复的测试设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:构建PFC死锁及恢复所需的测试环境;其中,测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;在确定测试环境中流量正常流转的情况下,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对对网络设备PFC死锁的测试;在测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的PFC pause帧的变换情况进行检测,以实现对网络设备PFC死锁恢复的测试。
本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:构建PFC死锁及恢复所需的测试环境;其中,测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;在确定测试环境中流量正常流转的情况下,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对测试环境中多个设备的端口分别对应的PFCpause帧的情况进行检测,以实现对对网络设备PFC死锁的测试;在测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的PFC pause帧的变换情况进行检测,以实现对网络设备PFC死锁恢复的测试。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请实施例通过优化测试拓扑,将之前需要用到2台Spine+4台Leaf+4台服务器的测试拓扑,简化为2台Spine+2台Leaf+2台服务器的测试拓扑,简化了所需的测试设备,降低了测试成本。其次,在实验室环境中模拟测试网络设备的PFC死锁检测和自动恢复功能,验证网络中出现拥塞时,PFC死锁检测和自动恢复功能可以正常生效,防止网络拥塞时出现丢包,保证智能无损网络的稳定性和可靠性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本申请实施例提供的一种网络设备PFC死锁及恢复的测试方法流程图;
图2为本申请实施例提供的一种PFC死锁检测与恢复测试优化拓扑结构图;
图3为本申请实施例提供的一种网络设备PFC死锁及恢复的测试设备的结构示意图。
具体实施方式
本申请实施例提供一种网络设备PFC死锁及恢复的测试方法、设备及介质。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
由于在实际的数据中心网络中,涉及到大量的服务器、存储设备、虚拟机、网络交换机以及路由器等设备,实际环境很复杂,流量的转发路径也是错综复杂的。而PFC死锁检测和恢复功能是构建无损的数据中心网络的重要特性,也是测试网络交换机能否用于数据中心网络的重要指标。
由于触发PFC发生死锁,需要构造出网络拥塞的场景,目前可以采用数据中心通用的Spine-Leaf拓扑结构,采用2台100G转发速率的交换机设备作为Spine设备,另选取4台25G转发速率的交换机设备作为Leaf设备,对接4台服务器,使用25G网卡发送业务报文,来模拟实际的数据中心通信网络。其所需要的设备数量较多,拓扑结构较为复杂,造成较高的测试成本。
本申请实施例旨在简化测试拓扑,来验证网络设备的PFC死锁检测和恢复功能是否正常生效,满足无损网络的要求。
图1为本申请实施例提供的一种网络设备PFC死锁及恢复的测试方法流程图,如图1所示,网络设备PFC死锁及恢复的测试方法包括如下步骤:
S101、构建PFC死锁及恢复所需的测试环境。
本申请实施例中的测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器。
在本申请的一个实施例中,Spine设备与Leaf设备之间通过25GE链路互联;以及Leaf设备与服务器之间通过25GE链路互联;以及服务器均设置有25G速率的RoCEv2的智能网卡。对第一服务器与第二服务器分别对应的网卡进行ip地址配置,并对第一Leaf设备、第二Leaf设备以及第一Spine设备配置相应的静态路由信息,以使第一服务器与第二服务器可以进行流量传输。
具体地,搭建测试环境,图2为本申请实施例提供的一种PFC死锁检测与恢复测试优化拓扑结构图,如图2所示,2台Spine和2台Leaf设备之间通过25GE链路互联,2台Leaf设备和2台服务器之间通过25GE链路互联,第一服务器(Server1)和第二服务器(Server4)均使用25G速率的RoCEv2的智能网卡。
进一步地,所述第一服务器将流量输送至所述第一Leaf设备,通过第一Leaf设备,将流量发送至所述第一Spine设备。通过第一Spine设备将所述流量发送至所述第二Leaf设备。通过所述第二Leaf设备将所述流量发送至所述第二服务器,以实现流量从所述第一服务器传递至所述第二服务器。
具体地,第一服务器和第二服务器的网卡配置ip地址,并在网络设备Leaf1(第一Leaf设备)、Spine1(第一Spine设备)和Leaf2(第二Leaf设备)上配置相应的静态路由信息,使第二服务器可以收到第一服务器发送的绑定流量,其中第一服务器到第二服务器的流量路径规划为:
Server1→Leaf1→Spine1→Leaf2→Server4
正常情况下,网络拓扑稳定,Server4可以收到Server1发送的所有流量,不会出现流量丢包。
S102、在确定所述测试环境中流量正常流转的情况下,对测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧。
在本申请的一个实施例中,在第一Spine设备、第二Spine设备、第一Leaf设备以及第二Leaf设备上,分别进行默认路由设置。对第二Leaf设备上到第二服务器上的静态路由信息进行删除处理,以及,将第二Leaf设备上连接的第二服务器的端口断开,以构造环路故障流量。
具体地,在所有网络设备Spine1(第一Spine设备)、Spine2(第二Spine设备)、Leaf1(第一Leaf设备)、Leaf2(第二Leaf设备)上配置默认路由0.0.0.0/0,使下一跳按照拓扑图中故障流量所示的路径配置。
进一步地,删除Leaf2上到第二服务器的静态路由信息,并将Leaf2上连接第二服务器的端口断开,此时直连路由消失,瞬时环路出现。构造了环路的故障流量,此时网络设备Spine1、Spine2、Leaf1、Leaf2上的默认路由生效,产生环路故障流量路径。
在本申请的一个实施例中,第一Leaf设备将流量输送至第一Spine设备,以通过第一Spine设备将流量发送至第二Leaf设备。通过第二Leaf设备将流量发送至第二Spine设备。通过第二Spine设备,将流量发送至第一Leaf设备,以实现故障流量环路传递。
具体地,产生环路故障流量路径为:
Leaf1→Spine1→Leaf2→Spine2→Leaf1;
即,流量从Leaf1设备输出后,传递至Spine1设备,经该Spine1设备后传递至Leaf2设备,在通过该Leaf2设备将该流量传输至Spine2设备,以通过该Spine2设备将该流量传输至Leaf1设备。
需要说明的是,PFC死锁(PFC DeadLock),是指当多个交换机之间因为环路等原因同时出现拥塞,各自端口缓存消耗超过阈值,而又相互等待对方释放资源,从而导致所有交换机上的数据流都永久阻塞的一种网络状态。正常情况下,PFC中流量暂停只针对某一个或几个优先级队列,不针对整个接口进行中断,每个队列都能单独进行暂停或重启,而不影响其他队列上的流量,真正实现多种流量共享链路。然而当发生链路故障或设备故障时,在路由重新收敛期间,网络中可能会出现短暂环路,会导致出现一个循环依赖缓冲区(CyclicBuffer Dependency)。当交换机都达到PFC门限,都将同时向对端发送PFC反压帧,这个时候拓扑中所有交换机都处于停流状态。
S103、对测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对网络设备PFC死锁的测试。
在本申请的一个实施例中,获取第一Leaf设备、第一Spine设备、第二Spine设备以及第二Leaf设备分别对应的PFC pause帧增长信息。在PFC pause帧增长信息为持续增长,且测试环境中的各设备不在转发第一服务器至第二服务器的数据流量的情况下,确定PFC死锁检测生效。
具体地,由于网路设备Spine1、Spine2、Leaf1、Leaf2上都开启了PFC死锁检测功能,此时在Leaf1设备上出现流量拥塞,会最先产生PFC pause帧,并按照环路路径,依次在Spine2、Leaf2、Spine1上产生PFC pause帧。其中,PFCpause帧的环路路径为:
Leaf1→Spine2→Leaf2→Server1→Leaf1
即,由Leaf1传递至Spine2后,由该Spine2将其传递至Leaf2,再由该Leaf2将其传递至Server1,最终由该Server1将其传递至Leaf1。继而发生全网的PFC死锁,此时第二服务器不再收到任何流量。
进一步地,确定网络设备Leaf1、Spine1、Spine2、Leaf2,端口上收到的PFC pause帧持续增长,PFC死锁检测生效。且所有的网络设备不再转发第一服务器与第二服务器的数据流量,所有网络设备持续断流。
进一步地,第一服务器的网卡停止发送网络流量,由于PFC死锁依然存在,未被解除,观察网络设备Leaf1、Spine1、Spine2、Leaf2,端口上收到的PFC pause帧依然会持续增长。
S104、在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFC pause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
在本申请的一个实施例中,将第一Leaf设备与第二Spine设置之间直连的端口进行断开处理。启动计时,计时时间到,将端口恢复连接。获取第一Leaf设备、第一Spine设备、第二Spine设备以及第二Leaf设备分别对应的端口所接收到的PFC pause帧信息。在接收到的PFC pause帧不出现增加的情况下,确定PFC死锁恢复生效。
在本申请的一个实施例中,将第二Leaf设备上连接第二服务器的端口恢复连接,以使第二服务器接收到第一服务器发送的流量。
具体地,将Leaf1和Spine2直连的端口断开后,开始倒计时,等待预置时长后,例如,本申请实施例中的预置时长可以为等待10秒,再将端口恢复连接。此时,PFC死锁恢复生效,观察网络设备Leaf1、Spine1、Spine2、Leaf2,端口上收到的PFC pause帧不再增长。
进一步地,将Leaf2上连接第二服务器(Server4)的端口恢复连接,第一服务器(Server1)的网卡重新发送流量。由于PFC死锁已经恢复了,Server4可以正常收到Server1发送的流量,网络恢复正常,不再出现流量丢失。通过获取网络设备Leaf1、Spine1、Spine2、Leaf2分别接收到的数据,可以确定出端口上不再收到PFC pause帧。
本申请实施例通过上述优化后的测试拓扑和流程,利用PFC死锁检测和自动恢复技术,模拟智能无损网络中出现大量的PFC反压信号,极有可能诱发网络死锁时,快速响应和自动恢复,确保网络流量不出现死锁,确保在网络流量出现拥塞时,不丢包,验证智能无所网络中相应的网络设备的准确性和高效性。
图3为本申请实施例提供的一种网络设备PFC死锁及恢复的测试设备的结构示意图。如图3所示,网络设备PFC死锁及恢复的测试设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:构建PFC死锁及恢复所需的测试环境;其中,所述测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;在确定所述测试环境中流量正常流转的情况下,对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对所述网络设备PFC死锁的测试;在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFC pause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
本申请实施例还提供一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:构建PFC死锁及恢复所需的测试环境;其中,所述测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;在确定所述测试环境中流量正常流转的情况下,对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对所述网络设备PFC死锁的测试;在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFCpause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请的实施例可以有各种更改和变化。而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述方法包括:
构建PFC死锁及恢复所需的测试环境;其中,所述测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;
在确定所述测试环境中流量正常流转的情况下,对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;
对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对所述网络设备PFC死锁的测试;
在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFC pause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
2.根据权利要求1所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述构建PFC死锁及恢复所需的测试环境,具体包括:
Spine设备与Leaf设备之间通过25GE链路互联;以及
所述Leaf设备与服务器之间通过25GE链路互联;以及
所述服务器均设置有25G速率的RoCEv2的智能网卡;
对所述第一服务器与所述第二服务器分别对应的网卡进行ip地址配置,并对所述第一Leaf设备、所述第二Leaf设备以及所述第一Spine设备配置相应的静态路由信息,以使所述第一服务器与所述第二服务器可以进行流量传输。
3.根据权利要求2所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述以使所述第一服务器与所述第二服务器可以进行流量传输,具体包括:
所述第一服务器将流量输送至所述第一Leaf设备,通过所述第一Leaf设备,将所述流量发送至所述第一Spine设备;
通过所述第一Spine设备将所述流量发送至所述第二Leaf设备;
通过所述第二Leaf设备将所述流量发送至所述第二服务器,以实现流量从所述第一服务器传递至所述第二服务器。
4.根据权利要求1所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,具体包括:
在所述第一Spine设备、所述第二Spine设备、所述第一Leaf设备以及所述第二Leaf设备上,分别进行默认路由设置;
对所述第二Leaf设备上到所述第二服务器上的静态路由信息进行删除处理,以及,将所述第二Leaf设备上连接的所述第二服务器的端口断开,以构造环路故障流量。
5.根据权利要求4所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述环路故障流量的流量路径为:
所述第一Leaf设备将流量输送至所述第一Spine设备,以通过所述第一Spine设备将所述流量发送至所述第二Leaf设备;
通过所述第二Leaf设备将所述流量发送至所述第二Spine设备;
通过所述第二Spine设备,将所述流量发送至所述第一Leaf设备,以实现故障流量环路传递。
6.根据权利要求1所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,具体包括:
获取所述第一Leaf设备、所述第一Spine设备、所述第二Spine设备以及所述第二Leaf设备分别对应的PFC pause帧增长信息;
在所述PFC pause帧增长信息为持续增长,且所述测试环境中的各设备不在转发所述第一服务器至所述第二服务器的数据流量的情况下,确定PFC死锁检测生效。
7.根据权利要求1所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFCpause帧的变换情况进行检测,具体包括:
将所述第一Leaf设备与所述第二Spine设置之间直连的端口进行断开处理;
启动计时,计时时间到,将所述端口恢复连接;
获取所述第一Leaf设备、所述第一Spine设备、所述第二Spine设备以及所述第二Leaf设备分别对应的端口所接收到的PFC pause帧信息;
在接收到的所述PFC pause帧不出现增加的情况下,确定PFC死锁恢复生效。
8.根据权利要求1所述的一种网络设备PFC死锁及恢复的测试方法,其特征在于,所述以实现对所述网络设备PFC死锁恢复的测试之前,所述方法还包括:
将所述第二Leaf设备上连接所述第二服务器的端口恢复连接,以使所述第二服务器接收到所述第一服务器发送的流量。
9.一种网络设备PFC死锁及恢复的测试设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
构建PFC死锁及恢复所需的测试环境;其中,所述测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;
在确定所述测试环境中流量正常流转的情况下,对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;
对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对所述网络设备PFC死锁的测试;
在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFC pause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
构建PFC死锁及恢复所需的测试环境;其中,所述测试环境中包括第一Spine设备、第二Spine设备、第一Leaf设备、第二Leaf设备、第一服务器以及第二服务器;
在确定所述测试环境中流量正常流转的情况下,对所述测试环境中的设备重新进行路由设置,使其出现故障流量路径,并产生PFC pause帧;
对所述测试环境中多个设备的端口分别对应的PFC pause帧的情况进行检测,以实现对所述网络设备PFC死锁的测试;
在所述测试环境中多个设备的端口进行断开与恢复连接的情况下,分别对收到的所述PFC pause帧的变换情况进行检测,以实现对所述网络设备PFC死锁恢复的测试。
CN202311214552.8A 2023-09-20 2023-09-20 一种网络设备pfc死锁及恢复的测试方法、设备及介质 Pending CN117221163A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311214552.8A CN117221163A (zh) 2023-09-20 2023-09-20 一种网络设备pfc死锁及恢复的测试方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311214552.8A CN117221163A (zh) 2023-09-20 2023-09-20 一种网络设备pfc死锁及恢复的测试方法、设备及介质

Publications (1)

Publication Number Publication Date
CN117221163A true CN117221163A (zh) 2023-12-12

Family

ID=89038620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311214552.8A Pending CN117221163A (zh) 2023-09-20 2023-09-20 一种网络设备pfc死锁及恢复的测试方法、设备及介质

Country Status (1)

Country Link
CN (1) CN117221163A (zh)

Similar Documents

Publication Publication Date Title
CN107347021B (zh) 一种基于sdn网络可靠传输方法
JP5883743B2 (ja) パケット通信網における通信途絶時間短縮方法
US9385944B2 (en) Communication system, path switching method and communication device
CN108337161B (zh) 一种mlag接口故障三层数据流量平滑切换的方法
CN101951345B (zh) 一种报文的发送方法和设备
US9319310B2 (en) Distributed switchless interconnect
US9800521B2 (en) Network switching systems and methods
CN103516612B (zh) 分布式路由器中生成路由表项的方法及分布式路由器
KR20150007623A (ko) 패킷 전달 시스템에서의 보호 절체 방법 및 장치
CN113472646B (zh) 一种数据传输方法、节点、网络管理器及系统
EP2920920A2 (en) Router with passive interconnect and distributed switchless switching
US9294342B2 (en) Network node apparatus system, apparatus, and method
CN106533771B (zh) 一种网络设备以及控制信息传输方法
US9277300B2 (en) Passive connectivity optical module
CN108768721B (zh) 一种基于包暂存的主备vnf切换技术
CN117221163A (zh) 一种网络设备pfc死锁及恢复的测试方法、设备及介质
CN102045259B (zh) 分组交换设备以及管理用户业务的方法
Cisco Router Products Release Notes for Cisco IOS Release 10.2
Zhang et al. A service protection mechanism impelemented on P4 by packet replication
CN102164094B (zh) 多链路流量重分配的方法和装置
US11552882B2 (en) Efficient propagation of fault routing notifications
CN111901181A (zh) 一种误码率检测的处理方法及相关设备
CN117041893B (zh) 一种使用云计算技术发送国际短信的方法与系统
CN114268561B (zh) 一种bfd报文发送装置与方法
WO2023065750A1 (zh) 一种状态同步方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination