CN114157609A - Pfc死锁检测方法及装置 - Google Patents

Pfc死锁检测方法及装置 Download PDF

Info

Publication number
CN114157609A
CN114157609A CN202111449429.5A CN202111449429A CN114157609A CN 114157609 A CN114157609 A CN 114157609A CN 202111449429 A CN202111449429 A CN 202111449429A CN 114157609 A CN114157609 A CN 114157609A
Authority
CN
China
Prior art keywords
equipment
pfc
layer loop
message
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111449429.5A
Other languages
English (en)
Other versions
CN114157609B (zh
Inventor
陈可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN202111449429.5A priority Critical patent/CN114157609B/zh
Publication of CN114157609A publication Critical patent/CN114157609A/zh
Application granted granted Critical
Publication of CN114157609B publication Critical patent/CN114157609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2425Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
    • H04L47/2433Allocation of priorities to traffic types
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/18Loop-free operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种PFC死锁检测方法、装置、电子设备和计算机可读存储介质,所述方法应用于网络设备,所述网络设备上配置有PFC协议,该方法包括:判断是否接收到预设次数的PFC PAUSE帧;若是,判断本设备是否与其他网络设备形成环路;若存在二层环路或三成环路,则确定产生PFC死锁。在进行PFC死锁检测时,引入环路检测机制,通过判断是否存环路进而判断是否产生PFC死锁,提高了PFC死锁检测的准确性。

Description

PFC死锁检测方法及装置
技术领域
本申请涉及网络通信领域,具体而言,涉及一种PFC死锁检测方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,大多数网络通常采用优先级流量控制(Priority-based Flow Control,PFC)构建无损以太网,用于保证网络传输过程中不丢包。
然而,虽然PFC机制能够通过给不同队列映射不同优先级来实现基于队列的流量控制,但采用PFC机制的网络可能会发生PFC死锁。PFC死锁是指当多个交换机之间因环路等原因同时出现拥塞,各自端口缓存消耗超过阈值,而又相互等待对方释放资源,从而导致在环路中所有交换机上的数据流都永久阻塞的一种网络状态。
要解决PFC死锁,首先要确定是否发生PFC死锁,因此,需要通过对网络设备进行PFC死锁检测。现有的PFC死锁检测通常是检测一定时间段内是否持续收到PFC PAUSE帧。然而,PFC PAUSE帧的长时间存在,可能是因为网络中的实时流量较大,并不一定是因为产生了PFC死锁,因此,上述检测方式会存在一定程度的误判。
发明内容
本申请实施例的目的在于提供一种PFC死锁检测方法、装置、电子设备和计算机可读存储介质,用以解决现有技术中对PFC死锁检测存在误判的问题,从而提高PFC死锁检测的准确性。
第一方面,本申请提供一种PFC死锁检测方法,应用于网络设备,所述网络设备上配置有PFC协议,所述方法包括:判断是否接收到预设次数的PFC PAUSE帧;若是,判断本设备是否与其他网络设备形成环路;若存在二层环路或三层环路,则确定产生PFC死锁。
在本申请实施例中,首先判断是否在短时间内多次接收到PFC PAUSE帧,若是,则触发环路检测机制,检测本设备是否与其他网络设备形成环路,若形成环路,则确定产生了PFC死锁。在进行PFC死锁检测时,引入环路检测机制,通过判断是否存环路进而判断是否产生PFC死锁,提高了PFC死锁检测的准确性。
在可选的实施方式中,所述判断本设备是否与其他网络设备形成环路,包括:判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若为是,则自当前时刻经过第二预设时长后,在所述第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成所述三层环路;若在所述第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成所述三层环路。
在本申请实施例中,在进行三层环路检测时,通过判断是否接收到携带有路由标记的报文,并在接收到携带有路由标记的报文时延时第二预设时长后,再进行报文标记并发送标记后的报文,避免对已经存在路由标记的报文再次标记而导致原有的路由标记被覆盖,从而影响环路检测性能。
在可选的实施方式中,所述方法还包括:在确定本设备与其他网络设备未形成所述三层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断本设备是否与其他网络设备形成环路,包括:发送二层环路检测报文,所述二层环路检测报文中包括本设备的标识;若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成所述二层环路;若在所述第四预设时长内未接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备未形成所述二层环路。
在可选的实施方式中,所述方法还包括:在确定本设备与其他网络设备未形成所述二层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断是否接收到预设次数的PFC PAUSE帧,包括:判断在首次接收到PFC PAUSE帧之后的连续所述预设次数个预设监控周期内是否均接收到PFCPAUSE帧。
在可选的实施方式中,所述判断本设备是否与其他网络设备形成环路,包括:进行二层环路检测,并判断本设备是否与其他网络设备形成二层环路;进行三层环路检测,并判断本设备是否与其他网络设备形成三层环路。
在可选的实施方式中,所述方法还包括:若不存在环路,在接下来的与所述预设次数对应的连续多个预设监控周期内暂停发送所述PFC PAUSE帧。
第二方面,本申请提供一种PFC死锁检测装置,应用于网络设备,所述网络设备上配置有PFC协议,所述装置包括:判断模块,判断是否接收到预设次数的PFC PAUSE帧;若是,判断本设备是否与其他网络设备形成环路;确定模块,当判断结果为存在二层环路或三层环路时,则确定产生PFC死锁。
在可选的实施方式中,所述判断模块具体用于判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若为是,则自当前时刻经过第二预设时长后,在所述第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成所述三层环路;若在所述第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成所述三层环路。
在可选的实施方式中,所述装置还包括:控制模块,用于在判断模块的判断结果为本设备与其他网络设备未形成所述三层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断模块具体用于发送二层环路检测报文,所述二层环路检测报文中包括本设备的标识;若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成所述二层环路;若在所述第四预设时长内未接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备未形成所述二层环路。
在可选的实施方式中,所述控制模块还用于在判断模块的判断结果为本设备与其他网络设备未形成所述二层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断模块具体用于判断在首次接收到PFC PAUSE帧之后的连续所述预设次数个预设监控周期内是否均接收到PFC PAUSE帧。
在可选的实施方式中,所述判断模块具体用于进行二层环路检测,并判断本设备是否与其他网络设备形成二层环路;进行三层环路检测,并判断本设备是否与其他网络设备形成三层环路。
在可选的实施方式中,所述控制模块还用于若不存在环路,在接下来的与所述预设次数对应的连续多个预设监控周期内暂停发送所述PFC PAUSE帧。
第三方面,本申请提供一种电子设备,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前述实施方式任一项所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被计算机读取并运行时,执行如前述实施方式任一项所述的方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种PFC死锁示意图;
图2为本申请实施例提供的一种PFC死锁检测方法的流程图;
图3为本申请实施例提供的一种PFC死锁检测装置的结构框图;
图4为本申请实施例提供的一种电子设备的结构框图。
图标:300-PFC死锁检测装置;301-判断模块;302-确定模块;400-电子设备;401-处理器;402-通信接口;403-存储器;404-总线。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
为方便理解本申请,在介绍本申请的方案前,下面将对本申请中所涉及的部分术语或名词进行解释说明:
优先级流量控制(Priority-based Flow Control,PFC):PFC机制能够逐跳提供基于优先级的流量控制。在PFC机制下,允许在一条以太网链路上创建8个虚拟通道,并为每条虚拟通道指定相应优先级,允许单独暂停和重启其中任意一条虚拟通道,同时允许其它虚拟通道的流量无中断通过。
正常情况下,设备在进行报文转发时,根据报文的优先级进入对应映射关系的队列中进行调度转发。当一台交换机的端口出现拥塞并触发PFC水线(XOFF水线)时,数据进入的方向(即,下游设备)将发送PFC PAUSE帧反压,上游设备接收到PFC PAUSE帧后停止发送数据,如果其本地端口缓存消耗超过阈值,则继续向上游反压。如此一级级反压,直到网络终端服务器在PAUSE帧中指定的Pause Time内暂停发送数据,从而消除网络节点因拥塞造成的丢包。通过采用PFC机制,使得某种类型的流量拥塞不会影响其他类型流量的正常转发,从而达到同一链路上不同类型的报文互不影响。
PFC死锁:如图1所示,在特殊情况下,例如发生链路故障或设备故障时,BGP路由重新收敛期间可能会出现短暂环路。当4台交换机都达到XOFF水线时,会同时向其对应的上游设备发送PFC PAUSE帧。此时,该拓扑中所有的交换机都处于停留状态,由于PFC的反压效应,使得整个网络或部分网络的吞吐量将变为零。
本申请实施例提供一种PFC死锁检测方法、装置、电子设备和计算机可读存储介质,用以解决现有技术中对PFC死锁检测存在误判的问题,从而提高PFC死锁检测的准确性。
该技术可采用相应的软件、硬件以及软硬结合的方式实现。以下对本申请实施例进行详细介绍。
下面将针对本申请所提供的PFC死锁检测方法进行介绍。
请参阅图2,图2为本申请实施例提供的一种PFC死锁检测方法的流程图,该PFC死锁检测方法应用于网络设备,该网络设备上配置有PFC协议,该方法可以包括如下步骤:
步骤101:判断是否接收到预设次数的PFC PAUSE帧。
步骤102:若是,判断本设备是否与其他网络设备形成环路。
步骤103:若存在环路,则确定产生PFC死锁。
下面将结合示例对上述步骤进行说明。
步骤101:判断是否接收到预设次数的PFC PAUSE帧。
本申请实施例中,首先判断网络设备是否接收到预设次数的PFC PAUSE帧。若网络设备没有接收到PFC PAUSE帧或是仅接受到几个(小于预设次数)PFC PAUSE帧,根据PFC机制的工作原理可知,可以认为PFC机制处于正常运行状态,整个网络环境中并没有发生PFC死锁。
若网络设备在短时间内持续接收到大量(超过预设次数)PFC PAUSE帧,则说明网络环境中可能发生了PFC死锁。
作为一种可选的实施方式,上述步骤101可以包括如下内容:
判断在首次接收到PFC PAUSE帧之后的与预设次数对应的连续多个预设监控周期内是否均接收到PFC PAUSE帧。
具体地,当网络设备的某个端口首次接收到下游设备发送PFC PAUSE帧后,持续监控该端口是否持续接收到PFC PAUSE帧。若在连续预设次数个预设监控周期内均接收到PFCPAUSE帧,则认为网络环境中可能发生了PFC死锁;反之,则认为PFC机制处于正常工作状态,无需进行进一步处理。
举例来说,监控周期为10ms,预设次数为3次。在首次接收到下游设备发送PFCPAUSE帧后,该端口在连续的3个监控周期(即接来的3个10ms)中都接收到了PFC PAUSE帧中,则认为网络环境中可能发生了PFC死锁。
需要说明的是,监控周期的时长、预设次数的的具体数值可以灵活设置,本申请对此不做限定。
作为另一种可选的实施方式,还可以设置一预设时长,若在预设时长内接收到预设次数的PFC PAUSE帧,则认为网络环境中可能发生了PFC死锁。例如,若在5s内,网络设备接收到了10个PFC PAUSE帧,则认为网络环境中可能发生了PFC死锁。
步骤102:若是,判断本设备是否与其他网络设备形成环路。
本申请实施例中,若网络设备接收到了预设次数的PFC PAUSE帧,则认为网络环境中可能发生了PFC死锁,即网络设备可能与其他网络设备形成了环路,此时,可以进行环路检测。
作为一种可选的实施方式,上述步骤102可以包括如下步骤:
第一步,进行二层环路检测,并判断本设备是否与其他网络设备形成二层环路。
第二步,进行三层环路检测,并判断本设备是否与其他网络设备形成三层环路。
需要说明的是,PFC机制是基于端口列队的流量控制,流量可能采用二层转发或是三层转发,对于不同的网络环境来说,流量可能仅基于二层通信协议进行转发(即基于MAC地址进行转发),也可能仅基于三层通信协议进行转发(即基于IP地址进行转发),还可能同时基于二层通信协议和三层通信协议进行转发。因此,对于不同的网络环境来说,可以采用二层环路检测、三层环路检测或同时进行二层环路检测和三层环路检测。
可以理解,本申请实施例同时进行二层环路检测和三层环路检测。
下面分别对二层环路检测和三层环路检测进行介绍。
进行二层环路检测可以包括如下步骤:
第一步,发送二层环路检测报文,二层环路检测报文中包括本设备的标识。
第二步,若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成二层环路;若在第四预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成二层环路。
本申请实施例中,在接收到预设次数的PFC PAUSE帧后,网络设备在收到PFCPAUSE帧的端口上启动二层环路检测,发送二层环路检测报文。二层环路检测报文中设置有发送该报文的网络设备的标识,例如该网络设备的MAC地址。
二层环路检测报文为独立的协议报文,会在网络设备所属的局域网或vlan中不断广播。由于此部分为现有技术,此处不再赘述。
在第四预设时长内,发送二层环路检测报文的网络设备若接收到携带有本设备的标识的二层环路检测报文,则说明本设备与其他网络设备形成了二层环路,使得本设备能接收到自身发送的二层环路检测报文。
若确定本设备与其他网络设备形成二层环路,则确定网络环境中存在PFC死锁,完成PFC死锁检测。
进一步地,在确定网络环境中存在PFC死锁后,将二层环路检测日志发送给系统管理员,以使系统管理员进行干预,解决二层环路问题。二层环路消除后,PFC死锁也会解除,网络环境中的各网络设备可以正常进行流量转发。
在第四预设时长内,发送二层环路检测报文的网络设备若没有接收到携带有本设备的标识的二层环路检测报文,则说明本设备没有与其他网络设备形成了二层环路,在接下来的预设次数个预设监控周期内暂停发送PFC PAUSE帧,需要说明的是,此处的预设次数与步骤101中的预设次数相同。由于本设备在接下来的预设次数个预设监控周期内暂停发送PFC PAUSE帧,根据PFC机制可知,网络环境中的各网络设备可以正常进行流量转发,从而解除PFC死锁。
进行三层环路检测可以包括如下步骤:
第一步,判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;
第二步,若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;
若为是,则自当前时刻经过第二预设时长后,在第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;
第三步,若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成三层环路;若在第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成三层环路。
本申请实施例中,由于进行三层通信时,是基于路由进行报文转发,无法类似于二层环路检测一样通过构建一个特殊检测报文实现检测。因此,在进行三层环路检测时,需要对业务数据报文进行标记,发送标记后的业务数据报文,若在此接收到标记后的业务数据报文,则说明本设备与其他网络设备形成三层环路。
需要说明的是,PFC机制是基于端口的,网络设备上的同一个端口可能同时属于多个三层网络系统,相应的会对应多个IP地址,任何一个IP地址都可以唯一确定该网络设备的端口,因此,可以选取本网络设备的端口对应的任一一个IP地址作为路由标记。
以下对对业务数据报文进行标记进行介绍。
在IPv4的报文格式中,存在一个可以编辑的扩展字段,可以将路由标记保存在该扩展字段中,从而实现对IPv4报文进行标记。
在IPv6的报文格式中,存在逐跳可选项报头(Hop-By-Hop Options)。转发路径上所有节点都会对逐跳可选项报头进行处理。因此,可以将路由标记保存在逐跳可选项报头中。
作为一种可选的实施方式,将逐跳可选项报头中选项类型中动作设置为0,类型字段定义为200,使得网络设备在接收到IPv6报文后,若选项类型中动作设置为0,类型字段定义为200,则确定该逐跳可选项报头中保存的信息为用于进行三层环路检测的路由标记。
进一步地,考虑到出现PFC死锁时,可能会有多个网络设备均触发了三层环路检测,即多个网络设备都要对报文进行标记。若一个网络设备接收到别的网络设备发送的标记后的报文后,再次标记会覆盖前一个网络设备标记的内容,从而无法实现环路检测。因此,在对报文进行标记前,需要判断是否接收到携带有路由标记的报文。若没有接收到携带有路由标记的报文,则在当前时刻对多个报文进行标记,并发送标记后的报文。若接收到携带有路由标记的报文,则说明当前网络环境中有其他网络设备在对报文进行标记并发送标记后的报文。为了避免对已经存在路由标记的报文被再次标记,自当前时刻经过第二预设时长后,再对报文进行标记,并发送标记后的报文。
需要说明的是,第二预设时长可以为5ms、10ms、20ms等,本申请对此不作限定。
作为一种可选的实施方式,在进行报文标记时,对第一预设时长内的多个报文进行标记。本申请实施例中,PFC机制发送了多次PFC PAUSE帧,说明当前网络较为拥堵,发送标记后的报文会占用网络带宽,若对网络设备上的所有报文均进行标记,然后发送标记后的报文,对整个网络环境的性能影响较大。因此,设置第一预设时长,只在第一预设时长内对报文进行标记。第一预设时长可以为10ms,即只对在该10ms内接受到的报文进行标记,减少被标记以及发送的报文数量,从而减少对网络整个网络环境的性能影响。
在第三预设时长内,网络设备若接收到携带有本设备对应的路由标记的报文,则说明本设备与其他网络设备形成了三层环路,使得本设备能接收到自身发出去的携带有本设备对应的路由标记的报文。
若确定本设备与其他网络设备形成三层环路,则确定网络环境中存在PFC死锁,完成PFC死锁检测。
进一步地,在确定网络环境中存在PFC死锁后,将三层环路检测日志发送给系统管理员,以使系统管理员进行干预,解决三层环路问题。三层环路消除后,PFC死锁也会接触,网络环境中的各网络设备可以正常进行流量转发。
在第三预设时长内,网络设备若没有接收到携带有本设备对应的路由标记的报文,则说明本设备没有与其他网络设备形成了三层环路,在接下来的预设次数个预设监控周期内暂停发送PFC PAUSE帧,需要说明的是,此处的预设次数可以与步骤101中的预设次数相同。由于本设备在接下来的预设次数个预设监控周期内暂停发送PFC PAUSE帧,根据PFC机制可知,网络环境中的各网络设备可以正常进行流量转发,从而解除PFC死锁。
需要说明的是,第三预设时长和第四预设时长可以相等,也可以不相等,本领域技术人员可以根据网络环境中的报文转发速率、时延等因素灵活设置,本申请对此不作限定。
综上所述,本申请实施例提供一种PFC死锁检测方法,首先判断是否在短时间内多次接收到PFC PAUSE帧,若是,则触发环路检测机制,检测本设备是否与其他网络设备形成环路,若形成环路,则确定产生了PFC死锁。在PFC死锁检测时,引入环路检测机制,通过判断是否存环路进而判断是否产生PFC死锁,提高了PFC死锁检测的准确性。此外,本申请实施例提供的PFC死锁检测方法应用于网络设备上,当网络环境出现异常时,网络设备可以直接进行PFC死锁检测,无需依赖其他设备进行PFC死锁检测。
基于同一发明构思,本申请实施例中还提供一种PFC死锁检测装置。请参阅图3,图3为本申请实施例提供的一种PFC死锁检测装置的结构框图,该PFC死锁检测装置300配置于网络设备,所述网络设备配置有PFC协议,该PFC死锁检测装置300可以包括:
判断模块301,判断是否接收到预设次数的PFC PAUSE帧;若是,判断本设备是否与其他网络设备形成环路;
确定模块302,当判断结果为存在环路时,则确定产生PFC死锁。
在可选的实施方式中,所述判断模块301具体用于判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若为是,则自当前时刻经过第二预设时长后,在所述第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成所述三层环路;若在所述第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成所述三层环路。
在可选的实施方式中,所述装置还包括:控制模块,用于在判断模块301的判断结果为本设备与其他网络设备未形成所述三层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断模块301具体用于发送二层环路检测报文,所述二层环路检测报文中包括本设备的标识;若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成所述二层环路;若在所述第四预设时长内未接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备未形成所述二层环路。
在可选的实施方式中,所述控制模块还用于在判断模块301的判断结果为本设备与其他网络设备未形成所述二层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
在可选的实施方式中,所述判断模块301具体用于判断在首次接收到PFC PAUSE帧之后的连续所述预设次数个预设监控周期内是否均接收到PFC PAUSE帧。
在可选的实施方式中,所述判断模块301具体用于进行二层环路检测,并判断本设备是否与其他网络设备形成二层环路;进行三层环路检测,并判断本设备是否与其他网络设备形成三层环路。
请参阅图4,图4为本申请实施例的电子设备400的结构示意图,该电子设备400包括:至少一个处理器401,至少一个通信接口402,至少一个存储器403和至少一个总线404。其中,总线404用于实现这些组件直接的连接通信,通信接口402用于与其他节点设备进行信令或数据的通信,存储器403存储有处理器401可执行的机器可读指令。当电子设备400运行时,处理器401与存储器403之间通过总线404通信,机器可读指令被处理器401调用时执行如上述PFC死锁检测方法。
处理器401可以是一种集成电路芯片,具有信号处理能力。上述处理器401可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器403可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
可以理解,图4所示的结构仅为示意,电子设备400还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。于本申请实施例中,电子设备400可以是,但不限于台式机、笔记本电脑、智能手机、智能穿戴设备、车载设备等实体设备,还可以是虚拟机等虚拟设备。另外,电子设备400也不一定是单台设备,还可以是多台设备的组合,例如服务器集群,等等。
此外,本申请实施例还提供一种计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被计算机运行时,执行如上述实施例中PFC死锁检测方法的步骤。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
需要说明的是,功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (11)

1.一种PFC死锁检测方法,其特征在于,应用于网络设备,所述网络设备上配置有PFC协议,所述方法包括:
判断是否接收到预设次数的PFC PAUSE帧;
若是,判断本设备是否与其他网络设备形成环路;
若存在二层环路或三层环路,则确定产生PFC死锁。
2.根据权利要求1所述的方法,其特征在于,所述判断本设备是否与其他网络设备形成环路,包括:
判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;
若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;
若为是,则自当前时刻经过第二预设时长后,在所述第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;
若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成所述三层环路;
若在所述第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成所述三层环路。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在确定本设备与其他网络设备未形成所述三层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述判断本设备是否与其他网络设备形成环路,包括:
发送二层环路检测报文,所述二层环路检测报文中包括本设备的标识;
若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成所述二层环路;若在所述第四预设时长内未接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备未形成所述二层环路。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在确定本设备与其他网络设备未形成所述二层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
6.一种PFC死锁检测装置,其特征在于,应用于网络设备,所述网络设备上配置有PFC协议,所述装置包括:
判断模块,判断是否接收到预设次数的PFC PAUSE帧;若是,判断本设备是否与其他网络设备形成环路;
确定模块,当判断结果为存在二层环路或三层环路时,则确定产生PFC死锁。
7.根据权利要求6所述的装置,其特征在于,所述判断模块具体用于:判断是否接收到携带有路由标记的报文,其中,所述路由标记表征网络设备对应的IP地址;若为否,则自当前时刻开始的第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若为是,则自当前时刻经过第二预设时长后,在所述第一预设时长内对待发送报文进行标记,并发送标记后的报文,其中,所述标记后的报文中携带有本设备对应的路由标记;若在第三预设时长内接收到携带有本设备对应的路由标记的报文,则确定本设备与其他网络设备形成所述三层环路;若在所述第三预设时长内未接收到携带有本设备对应的路由标记的报文,确定本设备与其他网络设备未形成所述三层环路。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:控制模块,用于在判断模块的判断结果为本设备与其他网络设备未形成所述三层环路时,在接下来的所述预设次数个预设监控周期内暂停发送所述PFC PAUSE帧。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述判断模块具体用于:发送二层环路检测报文,所述二层环路检测报文中包括本设备的标识;若在第四预设时长内接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备形成所述二层环路;若在所述第四预设时长内未接收到携带有本设备的标识的二层环路检测报文,则确定本设备与其他网络设备未形成所述二层环路。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-5任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被计算机读取并运行时,执行如权利要求1-5任一项所述的方法。
CN202111449429.5A 2021-11-30 2021-11-30 Pfc死锁检测方法及装置 Active CN114157609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111449429.5A CN114157609B (zh) 2021-11-30 2021-11-30 Pfc死锁检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111449429.5A CN114157609B (zh) 2021-11-30 2021-11-30 Pfc死锁检测方法及装置

Publications (2)

Publication Number Publication Date
CN114157609A true CN114157609A (zh) 2022-03-08
CN114157609B CN114157609B (zh) 2024-02-23

Family

ID=80455464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111449429.5A Active CN114157609B (zh) 2021-11-30 2021-11-30 Pfc死锁检测方法及装置

Country Status (1)

Country Link
CN (1) CN114157609B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114640635A (zh) * 2022-03-17 2022-06-17 新华三技术有限公司合肥分公司 Pfc死锁的处理方法及装置
CN115987831A (zh) * 2022-12-19 2023-04-18 浪潮思科网络科技有限公司 一种网络设备的pfc死锁功能测试方法、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104852826A (zh) * 2015-04-13 2015-08-19 北京华为数字技术有限公司 一种环路检测方法及装置
US20180019947A1 (en) * 2016-07-14 2018-01-18 Mellanox Technologies Tlv Ltd. Credit Loop Deadlock Detection and Recovery in Arbitrary Topology Networks
CN110361957A (zh) * 2019-08-29 2019-10-22 金华市唯柏表业有限公司 一种无工具快拆更换表壳的手表
CN110995534A (zh) * 2019-11-26 2020-04-10 锐捷网络股份有限公司 Pfc死锁的检测方法及装置
US20200136985A1 (en) * 2018-10-26 2020-04-30 Cisco Technology, Inc. Mitigating priority flow control deadlock in stretch topologies
CN111092787A (zh) * 2019-12-16 2020-05-01 新华三大数据技术有限公司 环路检测方法、装置、隧道端点设备及存储介质
EP3767885A1 (en) * 2019-07-18 2021-01-20 Huawei Technologies Co., Ltd. Method, apparatus, and system for locating root cause of network anomaly, and computer storage medium
CN112565087A (zh) * 2020-11-23 2021-03-26 盛科网络(苏州)有限公司 一种pfc反压报文及其处理方法
CN112968811A (zh) * 2021-02-20 2021-06-15 中国工商银行股份有限公司 一种rdma网络的pfc异常处理方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104852826A (zh) * 2015-04-13 2015-08-19 北京华为数字技术有限公司 一种环路检测方法及装置
US20180019947A1 (en) * 2016-07-14 2018-01-18 Mellanox Technologies Tlv Ltd. Credit Loop Deadlock Detection and Recovery in Arbitrary Topology Networks
US20200136985A1 (en) * 2018-10-26 2020-04-30 Cisco Technology, Inc. Mitigating priority flow control deadlock in stretch topologies
EP3767885A1 (en) * 2019-07-18 2021-01-20 Huawei Technologies Co., Ltd. Method, apparatus, and system for locating root cause of network anomaly, and computer storage medium
CN110361957A (zh) * 2019-08-29 2019-10-22 金华市唯柏表业有限公司 一种无工具快拆更换表壳的手表
CN110995534A (zh) * 2019-11-26 2020-04-10 锐捷网络股份有限公司 Pfc死锁的检测方法及装置
CN111092787A (zh) * 2019-12-16 2020-05-01 新华三大数据技术有限公司 环路检测方法、装置、隧道端点设备及存储介质
CN112565087A (zh) * 2020-11-23 2021-03-26 盛科网络(苏州)有限公司 一种pfc反压报文及其处理方法
CN112968811A (zh) * 2021-02-20 2021-06-15 中国工商银行股份有限公司 一种rdma网络的pfc异常处理方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BANDAOYU: "【RDMA】无损网络和PFC(基于优先级的流量控制)|ECN", Retrieved from the Internet <URL:https://blog.51cto.com/liangchaoxi/4046404> *
HUAWEI: "PFC死锁检测", Retrieved from the Internet <URL:https://support.huawei.com/enterprise/zh/doc/EDOC1100075315/6502eee1> *
XINYU CRYSTAL WU ET AL.: "ITSY:Initial Trigger-Based PFC Deadlock Detection in the Data Plane", IEEE, pages 1 *
刘军 等: "数据中心RoCE和无损网络技术", 中国电信业 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114640635A (zh) * 2022-03-17 2022-06-17 新华三技术有限公司合肥分公司 Pfc死锁的处理方法及装置
CN114640635B (zh) * 2022-03-17 2024-02-09 新华三技术有限公司合肥分公司 Pfc死锁的处理方法及装置
CN115987831A (zh) * 2022-12-19 2023-04-18 浪潮思科网络科技有限公司 一种网络设备的pfc死锁功能测试方法、设备及介质
CN115987831B (zh) * 2022-12-19 2024-04-12 浪潮思科网络科技有限公司 一种网络设备的pfc死锁功能测试方法、设备及介质

Also Published As

Publication number Publication date
CN114157609B (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN109412964B (zh) 报文控制方法及网络装置
CN108243116B (zh) 一种流量控制方法及交换设备
US10178029B2 (en) Forwarding of adaptive routing notifications
US9819590B2 (en) Method and apparatus for notifying network abnormality
CN114157609B (zh) Pfc死锁检测方法及装置
US7872973B2 (en) Method and system for using a queuing device as a lossless stage in a network device in a communications network
CN111385121B (zh) 一种操作管理维护iOAM报文的传输方法及相应装置
CN106656857B (zh) 一种报文限速的方法和装置
CN110557342B (zh) 用于分析和减轻丢弃的分组的设备
CN111130821B (zh) 一种掉电告警的方法、处理方法及装置
EP3029883B1 (en) Network protection method and apparatus, next-ring node, and system
WO2017186070A1 (zh) 流量整形方法、控制器、网络设备和流量整形系统
EP3534571B1 (en) Service packet transmission method, and node apparatus
CN107294856B (zh) 确定拓扑变化的方法、设备及系统
CN112383450A (zh) 一种网络拥塞检测方法及装置
CN113992569A (zh) Sdn网络中多路径业务收敛方法、装置及存储介质
CN112187586A (zh) 微突发流量的监测方法和装置
CN111447095A (zh) 双向转发检测切换方法、双向转发检测模块及边缘设备
CN112702226B (zh) 环路检测方法、装置、设备及计算机可读存储介质
CN112737940A (zh) 一种数据传输的方法和装置
CN111130943B (zh) 快速环网切换的实现方法、交换机及计算机可读存储介质
CN108243117B (zh) 一种流量监控方法、装置及电子设备
CN110336759B (zh) 基于rdma的协议报文转发方法及装置
WO2021109851A1 (zh) 一种网络通信方法、装置、设备和存储介质
CN115118645A (zh) 一种虚拟二层网络环路检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant