WO2023231912A1

WO2023231912A1 - 链路故障处理方法、相关装置、存储介质及程序产品

Info

Publication number: WO2023231912A1
Application number: PCT/CN2023/096491
Authority: WO
Inventors: 李灵; 刘世兴; 冀智刚; 李�杰; 温华锋; 王海波; 王松林
Original assignee: 华为技术有限公司
Priority date: 2022-06-02
Filing date: 2023-05-26
Publication date: 2023-12-07
Also published as: CN117221215A

Abstract

本申请公开了一种链路故障处理方法、相关装置、存储介质及程序产品，属于通信技术领域。在本方法中，网络设备的转发面组件通过主动轮询端口状态寄存器来及时更新参考状态表，从而在转发数据流时，能够依据参考状态表及时感知本地的故障链路，及时进行链路切换。无需PHY芯片上报故障信息给网络设备中控制面的CPU，也无需等待控制面的CPU下发指令。即，本方案不依赖控制面算路，没有从数据面到控制面的额外通信，避免了由CPU处理故障所带来的延迟。使用本方案，降低了从发生链路故障到完成链路切换的耗时，提高了链路故障处理的收敛速度，减轻了链路故障对于业务所产生的影响，大幅提升了网络的可靠性。

Description

链路故障处理方法、相关装置、存储介质及程序产品

本申请要求于2022年06月02日提交的申请号为202210624676.2、发明名称为“链路故障处理方法、相关装置、存储介质及程序产品”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域，特别涉及一种链路故障处理方法、相关装置、存储介质及程序产品。

背景技术

当前，网络设备之间用于传输数据流的路径称为链路。一旦网络中的链路发生故障，就需要尽快进行处理，以保证后续数据流能够正常发送。

网络设备包括物理层(physical，PHY)芯片、转发面组件和中央处理器(central processing unit，CPU)等。PHY芯片具有多个端口，转发面组件存储有转发数据流所需的转发表和链路状态表。网络设备的某个端口在接收上一跳网络设备发送的数据流之后，将接收到的数据流传输给转发面组件。转发面组件通过查询转发表来确定该数据流对应的出端口，再查询链路状态表中该出端口所在链路的链路状态。在查询到的链路状态为故障状态的情况下，即，该出端口所在的链路为故障链路，转发面组件确定该故障链路的替换链路，并将转发表中该数据流对应的出端口修改为该替换链路对应的出端口。转发面组件按照修改后的转发表将该数据流发送出去。简单来讲，网络设备在转发数据流时，要依据链路状态表来确定是否进行链路切换。而链路状态表是在端口发生故障后才更新的，也即是，若某个端口发生故障，PHY芯片向CPU发送硬件中断信号，即上报故障信息，该硬件中断信号用于指示该端口故障，CPU基于该硬件中断信号向转发面组件下发用于指示更新链路状态表的指令。转发面组件在接收到该指令后，将链路状态表中该端口所在链路的状态修改为故障状态。

然而，网络通信中的业务种类繁多，大部分业务对时延比较敏感，例如网络游戏、付费结算等业务。而上述方案中，在某个端口发生故障之后，需要PHY芯片向CPU上报故障信息，并等待CPU向转发面组件下发指令之后才能够修改链路状态表。上报故障信息以及等待指令下发的过程是比较耗时的，导致链路状态表不能够及时更新。而链路状态表更新不及时会导致链路切换不及时。可见，上述方案从链路发生故障到执行链路切换的时间较长，这会导致业务中断。

发明内容

本申请实施例提供了一种链路故障处理方法、相关装置、存储介质及程序产品，能够缩短从发生链路故障到完成链路切换的时间，从而减少链路故障对业务的影响。

第一方面，提供了一种链路故障处理方法，应用于网络设备，该网络设备包括转发面组件、端口状态寄存器和多个端口，该方法包括：

网络设备的转发面组件通过轮询端口状态寄存器来维护参考状态表，该参考状态表用于指示该多个端口分别所在的多条链路是否故障；转发面组件根据待转发的数据流，查询转发表和参考状态表，以确定用于传输该数据流的链路是否为故障链路；在确定用于传输该数据流的链路为故障链路的情况下，转发面组件确定该故障链路的替换链路；转发面组件基于该替换链路更新转发表，以将该数据流切换到替换链路。

在本方案中，转发面组件通过主动轮询端口状态寄存器来及时更新参考状态表，从而在转发数据流时，能够依据参考状态表及时感知本地的故障链路，及时进行链路切换。无需PHY芯片上报故障信息给控制面的CPU，也无需等待CPU下发链路切换指令。即，本方案不依赖控制面算路，没有从数据面到控制面的额外通信，避免了由CPU处理故障所带来的延迟。本方案从发生链路故障到完成链路切换的耗时较少，链路故障处理的收敛速度更快，从而减少链路故障对业务的影响。

网络设备还包括PHY芯片，该多个端口为PHY芯片的端口，端口状态寄存器为PHY芯片中的寄存器，端口状态寄存器的值由PHY芯片在检测到该多个端口中存在发生故障的端口的情况下进行修改。

其中，参考状态表包括链路状态表，链路状态表用于记录该多条链路中各条链路的链路状态。基于此，转发面组件通过轮询端口状态寄存器来维护参考状态表，包括：转发面组件轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口，发生状态改变包括从可用状态变为不可用状态；在确定该多个端口中存在发生状态改变的端口的情况下，转发面组件将链路状态表中的第一链路状态修改为故障状态，第一链路状态为发生状态改变的端口所在链路的状态。

可选地，链路状态表记录有该多条链路的链路索引与链路状态的对应关系；转发面组件将链路状态表中的第一链路状态修改为故障状态之前，还包括：转发面组件从端口与链路的索引映射表中查询与第一端口索引对应的链路索引，以得到第一链路索引，第一端口索引为发生状态改变的端口的索引；转发面组件从链路状态表中查询与第一链路索引对应的链路状态，以得到第一链路状态。

在参考状态表包括链路状态表的实现方式中，转发面组件根据待转发的数据流，查询转发表和参考状态表，以确定用于传输该数据流的链路是否为故障链路，包括：转发面组件从转发表中查询该数据流对应的出端口；转发面组件从链路状态表中查询该出端口所在链路的链路状态；在该出端口所在链路的链路状态为故障状态的情况下，转发面组件确定用于传输该数据流的链路为故障链路。

可选地，转发面组件是通过快速重路由(fast reroute，FRR)组件从链路状态表中查询该出端口所在链路的链路状态的。FRR组件用于实现FRR机制。

或者，参考状态表包括端口状态表，端口状态表用于记录该多个端口中各个端口的端口状态。基于此，转发面组件通过轮询端口状态寄存器来维护参考状态表，包括：转发面组件轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口，发生状态改变包括从可用状态变为不可用状态；在确定该多个端口中存在发生状态改变的端口的情况下，转发面组件将端口状态表中的第一端口状态修改为不可用状态，第一端口状态为发生状态改变的端口的状态。

可选地，端口状态表记录有该多个端口的端口索引与端口状态的对应关系；转发面组件将端口状态表中的第一端口状态修改为不可用状态之前，还包括：转发面组件从端口状态表中查询与第一端口索引对应的端口状态，以得到第一端口状态，第一端口索引为发生状态改变的端口的索引。

在参考状态表包括端口状态表的实现方式中，转发面组件根据待转发的数据流，查询转发表和参考状态表，以确定用于传输该数据流的链路是否为故障链路，包括：转发面组件从转发表中查询该数据流对应的出端口；转发面组件从端口状态表中查询该出端口的端口状态；在该出端口的端口状态为不可用状态的情况下，转发面组件确定用于传输该数据流的链路为故障链路。

在本方案中，转发面组件确定该故障链路的替换链路的一种实现方式为：转发面组件通过快速重路由机制从主备链路对应关系中获取该故障链路对应的备链路作为替换链路。这样，无需重新算路，快速进行主备切换。

转发面组件确定该故障链路的替换链路的另一种实现方式为：转发面组件通过哈希算法，从该故障链路的多条等价路径中确定替换链路。即，预先确定多条等价路径，以通过哈希算法实现快速重路由，无需根据网络拓扑重新算路，例如，无需根据网络拓扑通过开放式最短路径优先(open shortest path first，OSPF)算法重新计算链路。这样也能够尽可能地缩短链路故障处理的收敛时间。

可选地，转发面组件是通过亚毫秒级轮询机制来轮询端口状态寄存器的。这样能够实现链路故障情况下的亚毫秒级换路。

可选地，该转发面组件为可编程逻辑器件。这样，通过对现有的转发面组件上的链路故障处理的相关逻辑进行相应修改即可实现本方案。

第二方面，提供了一种链路故障处理装置，所述链路故障处理装置具有实现上述第一方面中链路故障处理方法行为的功能。所述链路故障处理装置包括一个或多个模块，该一个或多个模块用于实现上述第一方面所提供的链路故障处理方法。

也即是，提供了一种链路故障处理装置，该装置应用于网络设备的转发面组件，该网络设备还包括多个端口和端口状态寄存器，该装置包括：

轮询模块，用于通过轮询端口状态寄存器来维护参考状态表，该参考状态表用于指示该多个端口分别所在的多条链路是否故障；

查表模块，用于根据待转发的数据流，查询转发表和参考状态表，以确定用于传输数据流的链路是否为故障链路；

确定模块，用于在确定用于传输该数据流的链路为故障链路的情况下，确定该故障链路的替换链路；

链路切换模块，用于基于该替换链路更新转发表，以将该数据流切换到该替换链路。

可选地，该参考状态表包括链路状态表，链路状态表用于记录该多条链路中各条链路的链路状态；

轮询模块，包括：

第一轮询子模块，用于轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口，发生状态改变包括从可用状态变为不可用状态；

第二更新子模块，用于在确定该多个端口中存在发生状态改变的端口的情况下，将链路状态表中的第一链路状态修改为故障状态，第一链路状态为发生状态改变的端口所在链路的状态。

可选地，链路状态表记录有该多条链路的链路索引与链路状态的对应关系；

轮询模块还包括：

第一查询子模块，用于从端口与链路的索引映射表中查询与第一端口索引对应的链路索引，以得到第一链路索引，第一端口索引为发生状态改变的端口的索引；

第二查询子模块，用于从链路状态表中查询与第一链路索引对应的链路状态，以得到第一链路状态。

可选地，查表模块包括：

第三查询子模块，用于从转发表中查询该数据流对应的出端口；

第四查询子模块，用于从链路状态表中查询该出端口所在链路的链路状态；

第一确定子模块，用于在该出端口所在链路的链路状态为故障状态的情况下，确定用于传输该数据流的链路为故障链路。

可选地，转发面组件是通过快速重路由机制从链路状态表中查询出端口所在链路的链路状态的。

可选地，该参考状态表包括端口状态表，端口状态表用于记录该多个端口中各个端口的端口状态；

轮询模块包括：

第二轮询子模块，用于轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口，发生状态改变包括从可用状态变为不可用状态；

第二更新子模块，用于在确定该多个端口中存在发生状态改变的端口的情况下，将端口状态表中的第一端口状态修改为不可用状态，第一端口状态为发生状态改变的端口的状态。

可选地，端口状态表记录有该多个端口的端口索引与端口状态的对应关系；

轮询模块还包括：

第五查询子模块，用于从端口状态表中查询与第一端口索引对应的端口状态，以得到第一端口状态，第一端口索引为发生状态改变的端口的索引。

可选地，查表模块包括：

第六查询子模块，用于从转发表中查询数据流对应的出端口；

第七查询子模块，用于从端口状态表中查询该出端口的端口状态；

第二确定子模块，用于在该出端口的端口状态为不可用状态的情况下，确定用于传输该数据流的链路为故障链路。

可选地，确定模块包括：

获取子模块，用于通过快速重路由机制从主备链路对应关系中获取该故障链路对应的备链路作为替换链路。

可选地，确定模块包括：

第三确定子模块，用于通过哈希算法，从该故障链路的多条等价链路中确定替换链路。

可选地，转发面组件是通过亚毫秒级轮询机制来轮询端口状态寄存器的。

可选地，网络设备还包括PHY芯片，该多个端口为PHY芯片的端口，端口状态寄存器为PHY芯片中的寄存器，端口状态寄存器的值由PHY芯片在检测到该多个端口中存在发生故障的端口的情况下进行修改。

可选地，转发面组件为可编程逻辑器件。

第三方面，提供了一种网络设备，该网络设备包括转发面组件、端口状态寄存器和多个端口。该网络设备用于通过转发面组件实现上述第一方面提供的链路故障处理方法的步骤。

第四方面，提供了一种网络设备，所述网络设备包括转发面组件和存储器，所述存储器用于存储执行上述第一方面所提供的链路故障处理方法的程序，以及存储用于实现上述第一方面所提供的链路故障处理方法所涉及的数据。所述转发面组件被配置为用于执行所述存储器中存储的程序。所述网络设备还可以包括通信总线，该通信总线用于该转发面组件与存储器之间建立连接。

第五方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在网络设备上运行时，使得网络设备执行上述第一方面所述的链路故障处理方法。

第六方面，提供了一种包含指令的计算机程序产品，当所述指令在网络设备上运行时，使得网络设备执行上述第一方面所述的链路故障处理方法。

上述第二方面、第三方面、第四方面、第五方面和第六方面所获得的技术效果与第一方面中对应的技术手段获得的技术效果近似，在这里不再赘述。

本申请提供的技术方案至少包括以下有益效果：

本方案无需PHY芯片上报故障信息给网络设备中控制面的CPU，也无需等待控制面的CPU下发指令。网络设备的转发面组件通过主动轮询端口状态寄存器来及时更新参考状态表，从而在转发数据流时，能够依据参考状态表及时感知本地的故障链路，及时进行链路切换。其中，参考状态表用于指示该网络设备的多个端口分别所在的多条链路是否故障。即，本方案不依赖控制面算路，没有从数据面到控制面的额外通信，避免了由CPU处理故障所带来的延迟。本方案从发生链路故障到完成链路切换的耗时较少，链路故障处理的收敛速度更快且更稳定，链路故障对于业务所产生的影响较小，大幅提升网络的可靠性。

附图说明

图1是本申请实施例提供的一种数据中心场景下的多级交换架构示意图；

图2是本申请实施例提供的一种链路故障处理方法的流程图；

图3是本申请实施例提供的另一种链路故障处理方法的流程图；

图4是本申请实施例提供的又一种链路故障处理方法的示意图；

图5是本申请实施例提供的链路故障处理方法所涉及的方案要点；

图6是本申请实施例提供的一种链路故障处理装置的结构示意图；

图7是本申请实施例提供的一种网络设备的结构示意图；

图8是本申请实施例提供的另一种网络设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先对本申请实施例涉及的网络架构和业务场景进行介绍。

本申请实施例提供的链路故障处理方法可应用于数据中心场景中的网络设备。图1是本申请实施例提供的一种数据中心场景下的多级交换架构示意图。该多级交换架构如close架构。图1展示出了多级交换架构中的三种设备，分别为用户设备、架顶式(top of rack，ToR)交换机和脊(spine)交换机。其中，用户设备如发送端的服务器、接收端的服务器等。ToR交换机即叶(leaf)交换机，位于接入侧，用于将用户设备接入数据中心。spine交换机位于汇聚层，连接ToR交换机。发送端的服务器与接收端的服务器之间的业务流量需要经过ToR交换机和spine交换机。本申请实施例提供的链路故障处理方法可应用于ToR交换机和spine交换机。

除了应用于数据中心场景中的网络设备之外，本方案也可应用于其他场景中的网络设备，本申请实施例对此不作限定。上述网络设备可以是交换机、路由器等任何一种具备转发功能的设备。网络设备包括转发面组件、端口状态寄存器、多个端口以及控制面的CPU。本申请实施例提供的链路故障处理方法应用于网络设备的转发面组件，而无需经过控制面的CPU。可选地，转发面组件也可称为转发装置。

其中，网络设备还包括PHY芯片，网络设备中的多个端口为PHY芯片的端口，端口状态寄存器为PHY芯片中的寄存器。端口状态寄存器用于存储该多个端口中各个端口的端口状态。在该多个端口中存在发生故障的端口时，PHY芯片立即感知到故障端口，更新端口状态寄存器中该故障端口所对应的比特位的值。

另外，网络设备的形态可以是盒式、框式等。其中，盒式网络设备的转发面组件和控制面的CPU可以在同一个单板(board)上，该转发面组件用于处理由于网络设备的各个端口故障所导致的链路故障问题。盒式网络设备可以包括一个PHY芯片。

框式网络设备包括主控板和至少一个接口板，各个接口板均包括PHY芯片和转发面组件，网络设备所包括的多个端口分布于该至少一个PHY芯片上，各个PHY芯片均包括端口状态寄存器，各个PHY芯片通过自身的端口状态寄存器来存储自身包括的各个端口的状态。框式网络设备的主控板包括控制面的CPU。本方案可以应用于各个接口板中的转发面组件，以通过转发面组件来处理由于相应接口板上的端口故障所导致的链路故障问题。

本申请实施例描述的网络架构以及业务场景是为了更加清楚的说明本申请实施例的技术方案，并不构成对于本申请实施例提供的技术方案的限定，本领域普通技术人员可知，随着网络架构的演变和新业务场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

接下来对本申请实施例提供的链路故障处理方法进行介绍。

图2是本申请实施例提供的一种链路故障处理方法的流程图，该方法应用于网络设备，该网络设备包括转发面组件、端口状态寄存器和多个端口。在图2中以上述介绍的盒式网络设备为例进行介绍。请参考图2，该方法包括如下步骤。

步骤201：网络设备的转发面组件通过轮询端口状态寄存器来维护参考状态表，参考状态表用于指示网络设备的多个端口分别所在的多条链路是否故障。

其中，参考状态表存储于转发面组件中，转发面组件在转发数据流时通过查询参考状态表来确定是否进行链路切换。参考状态表可以包括链路状态表(link state table，LST)或端口状态表(port state table，PST)。LST用于记录该多条链路中各条链路的链路状态，链路状态用于指示相应链路是否故障。PST用于记录该多个端口中各个端口的端口状态，端口状态用于指示相应端口是否可用，即是否故障。在本申请实施例中，一个端口对应一条链路，不同的端口对应不同的链路，各个端口的端口状态还能够用于指示相应端口所在链路是否故障。

首先以参考状态表包括LST为例，对转发面组件通过轮询端口状态寄存器来维护参考状态表的实现方式进行介绍。

在本申请实施例中，转发面组件轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口。在确定该多个端口中存在发生状态改变的端口的情况下，转发面组件将LST中的第一链路状态修改为故障状态，第一链路状态为发生状态改变的端口所在链路的状态。其中，各个端口的端口状态为可用状态或不可用状态，发生状态改变包括从可用状态变为不可用状态。

其中，转发面组件轮询端口状态寄存器，将本次轮询到的寄存器值与上一次轮询到的寄存器值进行对比，以确定该多个端口中是否存在发生状态改变的端口。示例性地，端口状态寄存器包括多个比特位，该多个比特位分别对应网络设备的多个端口，各个比特位的值用于指示相应端口的端口状态。每个比特位的值可以为第一值或第二值，第一值表示可用状态，第二值表示不可用状态。若本次轮询到的第一比特位的值为第二值，上一次轮询到的第一比特位的值为第一值，则转发面组件确定第一比特位所对应的端口为发生状态改变的端口。若本次轮询到的第一比特位的值与上一次轮询到的第一比特位的值相同，则转发面组件确定第一比特位所对应的端口为未发生状态改变的端口。其中，第一值和第二值可以分别为‘1’和‘0’，第一值和第二值也可以分别为‘0’和‘1’。

可选地，LST记录有该多条链路的链路索引与链路状态的对应关系，网络设备还存储有端口与链路的索引映射表。基于此，转发面组件轮询端口状态寄存器，在查询到该多个端口中存在发生状态改变的端口的情况下，转发面组件从端口与链路的索引映射表中查询第一端口索引所对应的链路索引，以得到第一链路索引。第一端口索引为发生状态改变的端口的索引。转发面组件从LST中查询与第一链路索引对应的链路状态，以得到第一链路状态。其中，第一链路索引所索引的链路即为发生状态改变的端口所在的链路。

其中，转发面组件确定第一端口索引的实现方式有多种。

在一种实现方式中，端口状态寄存器中各个比特位的序号即为相应端口的端口索引。例如，端口状态寄存器中的第i个比特位所对应的端口的端口索引即为‘i’。基于此，转发面组件轮询端口状态寄存器的多个比特位，确定该多个端口中发生状态改变的端口所对应的比特位的序号，将该序号作为第一端口索引。

示例性地，端口状态寄存器为32位寄存器，即共有32个比特位，网络设备包括16个端口，端口状态寄存器中的16个比特位用于存储该多个端口的端口状态，这16个比特位的序号依次为1、2、3、…、16。转发面组件轮询这16个比特位，确定这16个端口中发生状态改变的端口所对应的比特位的序号为3，即第3个比特位所对应的端口为发生状态改变的端口，转发面组件将3作为第一端口索引。

在另一种实现方式中，网络设备还存储有端口状态寄存器中各个比特位的序号与相应端口的端口标识的对应关系，以及该多个端口的端口标识与端口索引的对应关系。转发面组件轮询端口状态寄存器的多个比特位，确定该多个端口中发生状态改变的端口所对应的比特位的序号，从端口状态寄存器中各个比特位的序号与相应端口的端口标识的对应关系中，确定该序号所对应的端口标识，以得到第一端口标识，第一端口标识即为发生状态改变的端口的端口标识。转发面组件再从该多个端口的端口标识与端口索引的对应关系中查询与第一端口标识对应的端口索引，以得到第一端口索引。

示例性地，端口状态寄存器中多个比特位的序号依次为1、2、…、18，这多个序号对应的端口标识依次为Pa01、Pa02、Pc03、…、Ph05，这18个端口标识所对应的端口索引依次为0、1、2、…、17。转发面组件确定发生状态改变的端口所对应的比特位的序号为3，然后从序号与端口标识的对应关系中确定序号3所对应的端口标识为Pc03，即第一端口标识为Pc03。转发面组件再从端口标识与端口索引的对应关系中确定端口标识Pc03所对应的端口索引为2，即第一端口索引为2。

在本申请实施例中，LST所记录的各条链路的链路状态为‘up’或‘down’，其中，‘up’表示正常状态，即无故障状态，‘down’表示故障状态。或者，链路状态为‘1’或‘0’，其中，‘1’表示正常状态，‘0’表示故障状态。或者，链路状态也可以通过其他方式来表示。

接下来以参考状态表包括PST为例，对转发面组件通过轮询端口状态寄存器来维护参考状态表的实现方式进行介绍。

在本申请实施例中，转发面组件轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口，其中，发生状态改变包括从可用状态变为不可用状态。在确定该多个端口中存在发生状态改变的端口的情况下，转发面组件将PST中的第一端口状态修改为不可用状态，第一端口状态为发生状态改变的端口的状态。

转发面轮询端口状态寄存器，以确定该多个端口中是否存在发生状态改变的端口的具体实现方式请参照前述相关内容，这里不再赘述。

可选地，端口状态表记录有该多个端口的端口索引与端口状态的对应关系。基于此，转发面组件将PST中的第一端口状态修改为不可用状态之前，从PST中查询与第一端口索引对应的端口状态，以得到第一端口状态。其中，第一端口索引为发生状态改变的端口的索引。其中，转发面组件确定第一端口索引的实现方式请参照前述相关内容，这里不再赘述。

在本申请实施例中，PST所记录的各个端口的端口状态为‘up’或‘down’，其中，‘up’表示可用状态，‘down’表示不可用状态。或者，端口状态为‘1’或‘0’，其中，‘1’表示可用状态，‘0’表示不可用状态。或者，端口状态也可以通过其他方式来表示。

可选地，为了提升链路故障处理的速度，转发面组件可以通过亚毫秒级轮询机制来轮询端口状态寄存器的，换句话说，转发面组件按照亚毫秒级的轮询周期来轮询端口状态寄存器。轮询周期小于1毫秒。例如，轮询周期为100微妙或200微妙等。本申请实施例通过亚毫秒级轮询机制来实现亚毫秒级的链路故障处理速度。

由前述可知，在本申请实施例中，转发面组件通过轮询端口状态寄存器来维护参考状态表，即通过轮芯端口状态寄存器来及时更新参考状态表，从而保证参考状态表的实时性和准确性。

示例性地，在PHY芯片中的第一端口发生故障后，第一端口向产生硬件中断信号，从而使得PHY芯片基于该硬件中断信号修改端口状态寄存器中第一端口所对应的比特位的值。例如，将第一端口所对应的比特位的值从‘1’修改为‘0’。其中，‘1’表示无故障状态，即可用状态，‘0’表示故障状态，即不可用状态。其中，该硬件中断信号可以携带第一端口的标识，PHY芯片从该硬件终端信号中获得第一端口的标识，按照第一端口的标识所对应的比特位的序号来修改端口寄存器中相应比特位的值。

步骤202：转发面组件根据待转发的数据流，查询转发表和参考状态表，以确定用于传输该数据流的链路是否为故障链路。

在本申请实施例中，网络设备还存储有转发表。转发面组件在获取到待转发的数据流之后，依次查询转发表和参考状态表，以确定用于传输该数据流的链路是否为故障链路。

在参考状态表为LST的实现方式中，转发面组件从转发表中查询该数据流对应的出端口。然后，转发面组件从LST中查询该出端口所在链路的链路状态。在该出端口所在链路的链路状态为故障状态的情况下，转发面组件确定用于传输该数据流的链路为故障链路。

可选地，转发面组件是通过FRR组件从LST中查询该出端口所在链路的链路状态的，后续转发面组件可以通过FRR组件来快速进行主备链路切换。也即是，网络设备配置有支持FRR机制的FRR组件，转发面组件通过FRR组件来查询LST。

其中，LST记录有该多条链路的链路索引与链路状态的对应关系，转发表记录有数据流信息与出端口索引的对应关系，网络设备还存储有端口与链路的索引映射表。基于此，转发面组件确定待转发的数据流信息，查询转发表中该数据流信息所对应的表项，获取该表项中的出端口索引。然后，转发面组件从端口与链路的索引映射表中查询与该出端口索引对应的链路索引，以得到该出端口所在链路的链路索引。转发面组件从LST中查询该出端口所在链路的链路索引所对应的链路状态，以得到该出端口所在链路的链路状态。

在参考状态表为PST的实现方式中，转发面组件从转发表中查询该数据流对应的出端口，转发面组件从PST中查询该出端口的端口状态。在该出端口的端口状态为不可用状态的情况下，转发面组件确定用于传输该数据流的链路为故障链路。

其中，PST记录有该多个端口的端口索引与端口状态的对应关系，转发表数据流信息与出端口索引的对应关系。基于此，转发面组件确定待转发的数据流信息，查询转发表中该数据流信息所对应的表项，获取该表项中的出端口索引。然后，转发面从PST中查询与该出端口索引对应的端口状态，以得到该出端口的端口状态。

在本申请实施例中，转发表中的数据流信息可以包括数据流的五元组信息，也可以包括其他的信息。转发表除了记录有数据流信息与出端口索引之外，还可以记录有下一跳路由信息，下一跳路由信息可以包括下一跳网络设备的信息和/或下一跳网络设备的入端口信息，转发表还可以记录有其他信息，本申请实施例对此不作限定。

步骤203：在确定用于传输该数据流的链路为故障链路的情况下，转发面组件确定该故障链路的替换链路。

在本申请实施例中，在确定用于传输该数据流的链路为故障链路的情况下，转发面组件自动确定故障链路的替换链路，无需向控制面的CPU上报故障信息，无需控制面算路和下发换路指令。

在确定替换链路的第一种实现方式中，转发面组件从主备链路对应关系中获取故障链路对应的备链路作为替换链路。应当理解的是，网络设备存储有主备链路对应关系。

可选地，转发面组件通过FRR组件从主备链路对应关系中获取该故障链路对应的备链路作为替换链路。

可选地，该主备链路对应关系所记录的任一主链路与对应的备链路为等价路径。等价路径是按照等价多路径(equal-cost multi-path，ECMP)策略确定的。

示例性地，流经网络设备A的数据流要发往同一目的地，假设该目的地为网络设备B，按照ECMP策略计算出从网络设备A到网络设备B的3条等价路径，这3条等价路径分别包括链路1、链路2和链路3。那么，在一些实施例中，可以将链路2作为链路1的备链路，将链路2作为链路3的备链路，将链路1作为链路3的备链路。网络设备A所存储的主备链路对应关系包括{[主:链路1，备:链路2]，[主:链路2，备:链路3]，[主:链路3，备:链路1]}。流经网络设备A，且目的地为网络设备B的各个数据流可以负载分担到这3条等价路径上。例如，网络设备通过哈希算法对数据流a的流信息进行哈希运算，得到的哈希值为10，计算10除以3的余数，得到余数为1，那么网络设备将数据流a通过链路1进行发送。若网络设备对数据流b也按照上述方法进行计算，所得到的余数为2，那么网络设备将数据流b通过链路2进行发送。如果网络设备的端口1发生故障，导致端口1所在的链路1故障，则网络设备确定链路1的替换链路为链路2。

在确定替换链路的第二种实现方式中，转发面组件通过哈希算法，从该故障链路的多条等价路径中确定替换链路。其中，该多条等价路径是按照ECMP策略确定的。应当理解的是，预先确定多条等价路径，以通过哈希算法实现快速重路由，无需根据网络拓扑重新算路。例如，无需根据网络拓扑通过OSPF算法重新计算链路。这样也能够尽可能地缩短链路故障处理的收敛时间。

示例性地，网络设备按照ECMP策略所确定的3条等价路径分别包括链路1、链路2和链路3，在链路1为故障链路的情况下，网络设备通过哈希算法计算出原本要通过链路1发送的数据流对应的余数，将该余数加上预设值，得到目标值。网络设备计算目标值除以3的余数，将该余数所对应的链路作为替换链路。其中，预设值为不被3整除的任一整数。假设链路1故障，原本要通过链路1发送的数据流对应的余数为1，预设值为2，那么网络设备确定替换链路即为链路3。

除了以上两种实现方式之外，网络设备也可以通过其他方式来确定故障链路的替换链路，本申请实施例对此不作限定。

步骤204：转发面组件基于该替换链路更新转发表，以将该数据流切换到替换链路。

在本申请实施例中，转发面组件在确定故障链路的替换链路之后，可以通过修改转发表来将故障链路上的业务切换到替换链路，即将原本要通过该故障链路传输的数据流切换到该替换链路。

示例性地，转发表记录有数据流信息与出端口索引的对应关系。基于此，转发面组件确定故障链路上业务的数据流信息，包括确定步骤203中待转发的数据流的信息，查询转发表中该数据流信息所对应的表项，将该表项中的出端口索引修改为替换链路所对应的出端口的端口索引，从而在按照转发表来转发数据流的情况下，将故障链路上的业务切换到替换链路，即按照修改后的转发表，将该数据流从替换链路所对应的出端口发送出去。

在转发表还记录有下一跳路由信息的情况下，转发面组件还将转发表中该表项中的下一跳路由信息修改为替换链路所对应的下一跳路由信息。

由前述可知，在本申请实施例中，网络设备中的一个端口对应一条链路，不同的端口所在的链路不同。本文中的链路是指相邻两个网络设备的两个端口之间的链路。例如，故障链路为发生故障的第一端口与下一跳网络设备中与第一端口进行通信的一个端口之间的链路，替换链路为本网络设备中未故障的第二端口与下一跳网络设备中与第二端口进行通信的一个端口之间的链路。替换链路对应的出端口是指第二端口。替换链路对应的下一跳路由信息可以包括下一跳网络设备的信息，和/或，下一跳网络设备中与第二端口进行通信的一个端口的信息。

可选地，网络设备的转发面组件为可编程逻辑器件。这样，通过对现有的转发面组件上的链路故障处理的相关逻辑进行相应修改即可实现本方案。

由前述可知，在本方案中，转发面组件是对数据面上的端口状态表、链路状态表以及转发表执行的操作，即，网络设备通过转发面组件在数据面上对本地的链路故障进行处理。因此，本方案实质上是一种基于数据面的本地链路故障收敛方案。

接下来请参照图3至图5对本申请实施例提供的链路故障处理方法再次进行示例性解释。

图3是本申请实施例提供的另一种链路故障处理方法的流程图。在图3中，网络设备配置有ECMP策略和FRR机制，网络设备包括转发面组件，且存储有主备链路对应关系、LST、端口与链路的索引映射表(PL索引映射表)和转发表(forwarding information table，FIB)。网络设备还包括端口状态寄存器。网络设备还包括多个端口，这些端口的标识(port identity，PID)分别为E1、E2等。

如图3所示，网络设备基于ECMP策略所确定的3条等价路径中的下一跳(next hop，NHP)路由信息分别为NHP1、NHP2和NHP3。NHP1、NHP2和NHP3分别对应E1、E2和E3。主备链路对应关系包括FRR1、FRR2和FRR3。FRR1表示NHP1所在链路为主链路、且NHP2所在链路为备链路的对应关系。FRR2表示NHP2所在链路为主链路、且NHP3所在链路为备链路的对应关系。FRR3表示NHP3所在链路为主链路、且NHP1所在链路为备链路的对应关系。

图3所示的链路故障处理方法包括两个过程，在第一个过程中，网络设备的转发面组件通过轮询端口状态寄存器来维护LST。在第二个过程中，转发面组件在转发数据流的过程中，基于转发表和LST来确定用于传输数据流的链路是否为故障链路，在确定用于传输某数据流的链路为故障链路的情况下，通过支持FRR机制的FRR组件快速执行主备切换。

其中，第一个过程包括如下步骤：

步骤11：转发面组件通过亚毫秒级轮询机制来轮询端口状态寄存器。

步骤12：以E1发生故障为例，在通过轮询端口状态寄存器，确定端口E1的端口状态发生改变的情况下，转发面组件确定端口E1的端口索引(port index，P idx)，所确定的P idx为1。

步骤13：转发面组件从PL索引映射表中查询P idx为1的表项，获取该表项中的链路索引(link index，L idx)，所获得的L idx为2。

步骤14：转发面组件从LST中查询L idx为2的表项，将该表项中的链路状态从无故障状态(记为比特1)修改为故障状态(记为比特0)。

第二个过程包括如下步骤：

步骤21：转发面组件根据待转发的目标数据流，查询FIB，以得到目标数据流对应的出端口的P idx。

步骤22：假设查询到的出端口的P idx为1，转发面组件从PL索引映射表中查询P idx为1的表项，获取该表项中的L idx。

步骤23：假设查询到的L idx为2，转发面组件通过FRR组件从LST中查询L idx为2的表项，获取该表项中指示链路状态的比特值。

步骤24：在获取到的比特值为0的情况下，转发面组件确定L idx为2的链路为故障链路。故障链路为NHP1所在的链路，即原本用于传输目标数据流的链路。

步骤25：转发面组件通过FRR组件从主备链路对应关系中获取NHP1所在链路对应的备链路作为替换链路。备链路为NHP2所在的链路，即替换链路为NHP2所在的链路。

步骤26：转发面组件将FIB中目标数据流对应的出端口修改为NHP2对应的出端口，将下一跳路由信息修改为NHP2，从而在按照FIB来转发数据流的情况下，将目标数据流切换到NHP2所在的链路。目标数据流是指原本要通过NHP1所在的链路进行发送的数据流。

图4是本申请实施例提供的又一种链路故障处理方法的示意图。相比于图3，在图4中，网络设备存储有PST，且可以不配置FRR机制。图4所示的链路故障处理方法也包括两个过程，在第一个过程中，网络设备的转发面组件通过轮询端口状态寄存器来维护PST。在第二个过程中，转发面组件在转发数据流的过程中，基于转发表和PST来确定用于传输数据流的链路是否为故障链路，在确定用于传输某数据流的链路为故障链路的情况下，通过哈希算法来确定故障链路的替换链路，并将故障链路上的业务切换到替换链路。

其中，第一个过程包括如下步骤：

步骤a1：转发面组件通过亚毫秒级轮询机制来轮询端口状态寄存器。

步骤a2：以E1发生故障为例，在通过轮询端口状态寄存器，确定端口E1的端口状态发生改变的情况下，转发面组件确定端口E1的P idx，所确定的P idx为1。

步骤a3：转发面组件从PST中查询P idx为1的表项，将该表项中的端口状态从可用状态(记为比特1)修改为不可用状态(记为比特0)。

第二个过程包括如下步骤：

步骤b1：转发面组件根据待转发的目标数据流，查询转发表，以得到目标数据流对应的出端口的P idx。

步骤b2：假设查询到的出端口的P idx为1，转发面组件从PST中查询P idx为1的表项，获取该表项中端口状态。

步骤b3：在获取的端口状态为不可用状态的情况下，转发面组件确定P idx为1的端口所在的链路为故障链路。故障链路即为NHP1所在的链路。如图4所示，故障链路是哈希选路所确定的链路，即目标数据流原本要经过的链路。目标数据流是指原本要通过NHP1所在的链路进行发送的数据流。

步骤b4：转发面组件通过哈希算法，从基于ECMP策略所确定的3条等价路径中，确定NHP1所在链路的替换链路为NHP3所在的链路。

步骤b5：转发面组件将FIB中目标数据流对应的出端口修改为NHP3对应的出端口，将下一跳路由信息修改为NHP3，从而在按照FIB来转发数据流的情况下，将目标数据流切换到NHP3所在的链路。即如图4所示，替换链路是哈希重新选路所确定的链路。

图5是本申请实施例提供的链路故障处理方法所涉及的方案要点。以转发面组件为可编程逻辑器件为例，转发面组件包括数据面的可编程模块。参见图6，本方案包括如下三个要点：

(1)：轮询端口状态寄存器，以进行故障检测。即，数据面的可编程模块轮询端口状态寄存器，以确定发生故障的端口。其中，轮询周期可以为亚毫秒级周期。

(2)：检测到故障时更新相关状态表。即，在通过轮询确定存在发生故障的端口的情况下，数据面的可编程模块立即更新参考状态表，包括端口状态表和/或链路状态表，也即将转发面组件所记录的端口状态和/或链路状态置为不可用状态。

(3)：链路故障收敛，快速换路。即，在转发数据流的过程中，查询转发表和参考状态表确定用于传输该数据流的链路是否为故障链路。在确定该数据流的链路为故障链路的情况下，通过FRR机制或哈希算法快速确定故障链路的替换链路，更新FIB以将故障链路上的业务切换到替换链路。

本方案的整体思路还可以被应用于流量监测。例如，转发面组件实时监测多个出端口的流量大小，在监测到某一出端口的流量达到端口最大流量预警条件的情况下，将该出端口的端口状态设置为告警状态，并确定该出端口所在链路的替换链路。被设置为告警状态的出端口的流量要立即切换到替换链路，即切换到网络设备的其他出端口上。

综上所述，在本申请实施例中，无需PHY芯片上报故障信息给控制面的CPU，也无需等待控制面的CPU下发指令。转发面组件通过主动轮询端口状态寄存器来及时更新参考状态表，从而在转发数据流时，能够依据参考状态表及时感知本地的故障链路，及时进行链路切换。即，本方案不依赖控制面算路，没有从数据面到控制面的额外通信，避免了由CPU处理故障所带来的延迟。本方案从感知到链路故障到完成链路切换的耗时较少，链路故障处理的收敛速度更快且更稳定，链路故障对于业务所产生的影响较小，大幅提升网络的可靠性。在转发面组件对端口状态寄存器执行亚毫秒级轮询的实现方式中，从端口发生故障到完成链路切换的时间为亚毫秒级，使得本方案能够实现链路故障情况下的亚毫秒级换路。

图6是本申请实施例提供的一种链路故障处理装置600的结构示意图，该链路故障处理装置600可以由软件、硬件或者两者的结合实现成为网络设备的部分或者全部。在本申请实施例中，该装置600应用于网络设备的转发面组件，该网络设备还包括多个端口和端口状态寄存器。参见图6，该装置600包括：轮询模块601、查表模块602、确定模块603和链路切换模块604。

轮询模块601，用于通过轮询端口状态寄存器来维护参考状态表，该参考状态表用于指示该多个端口分别所在的多条链路是否故障；

查表模块602，用于根据待转发的数据流，查询转发表和参考状态表，以确定用于传输数据流的链路是否为故障链路；

确定模块603，用于在确定用于传输该数据流的链路为故障链路的情况下，确定该故障链路的替换链路；

链路切换模块604，用于基于替换链路更新转发表，以将该数据流切换到该替换链路。

轮询模块601，包括：

轮询模块601还包括：

可选地，查表模块602包括：

轮询模块601包括：

轮询模块601还包括：

可选地，查表模块602包括：

可选地，确定模块603包括：

可选地，该转发面组件为可编程逻辑器件。

在本申请实施例中，无需PHY芯片上报故障信息给控制面的CPU，也无需等待控制面的CPU下发指令。转发面组件通过主动轮询端口状态寄存器来及时更新参考状态表，从而在转发数据流时，能够依据参考状态表及时感知本地的故障链路，及时进行链路切换。即，本方案不依赖控制面算路，没有从数据面到控制面的额外通信，避免了由CPU处理故障所带来的延迟。本方案从感知到链路故障到完成链路切换的耗时较少，链路故障处理的收敛速度更快且更稳定，链路故障对于业务所产生的影响较小，大幅提升网络的可靠性。在转发面组件对端口状态寄存器执行亚毫秒级轮询的实现方式中，从端口发生故障到完成链路切换的时间为亚毫秒级，使得本方案能够实现链路故障情况下的亚毫秒级换路。

需要说明的是：上述实施例提供的链路故障处理装置在处理链路故障时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的链路故障处理装置与链路故障处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图7是本申请实施例提供的一种网络设备的结构示意图。该网络设备可以为图1至图6实施例中的任一网络设备。该网络设备700可以为交换机、路由器或者其他具备转发功能的网络设备。在该实施例中，该网络设备700包括：中央处理器710、转发面组件711、存储器712和PHY芯片713。PHY芯片713包括多个端口7131和端口状态寄存器7132。

中央处理器710用于完成系统管理、设备维护等功能。转发面组件711用于实现本申请实施例提供的链路故障处理方法。存储器712用于存储端口和/或链路状态表、转发表等。PHY芯片713用于在检测到该多个端口7131中的故障端口时修改端口状态寄存器7132的值。转发面组件711可以通过轮询端口状态寄存器来维护存储器712中的表项，从而实现上述链路故障处理方法。该多个端口7131用于接收和发送数据流和其他信息。其中，中央处理器710属于网络设备的控制面，转发面组件711和存储器712属于网络设备的数据面。

在一些实施例中，存储器712还用于存储执行本申请方案的程序代码，转发面组件711能够执行存储器712中存储的程序代码，促使网络设备700执行图2至图5所示实施例中网络设备的处理步骤，具体实现请参照图2至图5所示实施例中的详细介绍，这里不再赘述。

其中，该程序代码中可以包括一个或多个软件模块，例如，当图6所示实施例中的轮询模块601、查表模块602、确定模块603和链路切换模块604是通过软件实施的情况下，该程序代码包括可以包括轮询模块、查表模块、确定模块和链路切换模块。轮询模块用于通过轮询端口状态寄存器来维护参考状态表，该参考状态表用于指示该多个端口7131分别所在的多条链路是否故障，该参考状态表包括端口状态表和/或链路状态表。查表模块用于根据待转发的数据流，查询转发表和参考状态表，以确定用于传输数据流的链路是否为故障链路。确定模块用于在确定用于传输该数据流的链路为故障链路的情况下，确定该故障链路的替换链路。链路切换模块用于基于该替换链路更新转发表，以将该数据流切换到该替换链路。具体实现方式，请参考上述图2至图5所示实施例中的详细描述，这里不再赘述。

图8是本申请实施例提供的另一种网络设备的结构示意图，该网络设备可以为图1至图6实施例中的任一网络设备。该网络设备800可以为交换机、路由器或者其他转发报文的网络设备。在该实施例中，该网络设备800包括：主控板810、接口板830和接口板840。多个接口板的情况下可以包括交换网板(图中未示出)，该交换网板用于在各接口板(接口板也称为线卡或业务板)之间交换数据。

主控板810用于执行系统管理、设备维护、协议处理等功能。接口板830和840用于提供各种业务接口(例如，POS接口、GE接口、ATM接口等)，并转发数据流。主控板810上主要有3类功能单元：系统管理控制单元、系统时钟单元和系统维护单元。主控板810、接口板830以及接口板840之间通过系统总线与系统背板相连实现互通。接口板830上包括一个或多个转发面组件831、存储器832以及多个网络接口8321，转发面组件可以包括PHY芯片(未示出)。该多个网络接口8321具体为端口。该多个网络端口可以部署在一个或多个PHY芯片上，每个PHY芯片还包括端口状态寄存器(未示出)。

每个PHY芯片用于在检测到自身的至少一个端口中的端口故障时修改自身的端口状态寄存器的值。

转发面组件831用于实现本申请实施例提供的链路故障处理方法，以及转发数据流。接口板830上的存储器832用于存储端口状态表和/或链路状态表，以及转发表。转发面组件831通过轮询端口状态寄存器来维护存储器中的相关表项，从而实现上述链路故障处理的方法。其中，转发面组件831通过查找存储器832中存储的转发表项进行数据流的转发。在另一些实施例中，转发面组件831还用于对接口板830进行控制管理并与主控板810上的中央处理器811通信。

转发面组件831可以为一个或多个用于实现本申请方案的集成电路，例如，专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。可选地，上述PLD为复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic,GAL)或其任意组合。

接口板830所包括的一个或多个网络接口(即端口8321)，用于接收终端或者网络中其他设备发送的数据流或者其他信息，并根据转发面组件831的指示处理这些数据流或者数据信息。具体实现过程这里不再逐一赘述。

可以理解，如图8所示，本申请实施例中包括多个接口板，采用分布式的转发机制，这种机制下，接口板840包括转发面组件41，存储器42以及多个网络接口843，接口板840上的操作与所述接口板830的操作基本相似，为了简洁，不再赘述。此外，可以理解的是，图8中转发面组件831和/或841可以是可编程逻辑器件，也可以是专用硬件或芯片，如网络处理器或者专用集成电路(application-specific integrated circuit，ASIC)，这种实现方式即为通常所说的转发面采用专用硬件或芯片处理的方式。

此外，主控板可能有一块或多块，有多块的时候可以包括主用主控板和备用主控板。接口板可能有一块或多块，该设备的数据处理能力越强，提供的接口板越多。多块接口板的情况下，该多块接口板之间可以通过一块或多块交换网板通信，有多块的时候可以共同实现负荷分担冗余备份。在集中式转发架构下，该设备可以不需要交换网板，接口板承担整个系统的业务数据的处理功能。在分布式转发架构下，该设备包括多块接口板，可以通过交换网板实现多块接口板之间的数据交换，提供大容量的数据交换和处理能力。所以，分布式架构的网络设备的数据接入和处理能力要大于集中式架构的设备。具体采用哪种架构，取决于具体的组网部署场景，此处不做任何限定。

在一些实施例中，存储器832可以是只读存储器(read-only memory，ROM)，也可以是随机存取存储器(random access memory，RAM)，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、光盘包括(只读光盘(compact disc read-only Memory，CD-ROM)、压缩光盘、激光盘、数字通用光盘、蓝光光盘等)、磁盘存储介质或者其它磁存储设备、或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。存储器832可以是独立存在，并通过通信总线与转发面组件831相连接。存储器832也可以和转发面组件831集成在一起。

在一些实施例中，所述网络接口8321，可以是使用任何收发器一类的装置，用于与其它设备或通信网络通信，如以太网，无线接入网(radio access network，RAN)，无线局域网(wireless local area networks，WLAN)等。网络接口833包括有线网络接口，还可以包括无线网络接口。其中，有线网络接口例如可以为以太网接口。以太网接口可以是光接口，电接口或其组合。无线网络接口可以为WLAN接口，蜂窝网络通信接口或其组合等。

在一些实施例中，网络设备800可以包括多个处理器，这些处理器中的每一个可以是一个单核处理器，也可以是一个多核处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。

在一些实施例中，存储器832还用于存储执行本申请方案的程序代码，转发面组件831可以执行存储器832中存储的程序代码，促使网络设备800执行图2至图5所示实施例中转发面组件的处理步骤，具体实现请参照图2至图5所示实施例中的详细介绍，这里不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如：同轴电缆、光纤、数据用户线(digital subscriber line，DSL))或无线(例如：红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质，或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如：软盘、硬盘、磁带)、光介质(例如：数字通用光盘(digital versatile disc，DVD))或半导体介质(例如：固态硬盘(solid state disk，SSD))等。值得注意的是，本申请实施例提到的计算机可读存储介质可以为非易失性存储介质，换句话说，可以是非瞬时性存储介质。

应当理解的是，本文提及的“至少一个”是指一个或多个，“多个”是指两个或两个以上。在本申请实施例的描述中，除非另有说明，“/”表示或的意思，例如，A/B可以表示A或B；本文中的“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

本申请实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请实施例中涉及到的业务的数据流都是在充分授权的情况下获取的。

以上所述仅为本申请的示例性实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种链路故障处理方法，其特征在于，应用于网络设备，所述网络设备包括转发面组件、端口状态寄存器和多个端口，所述端口状态寄存器用于存储所述多个端口中各个端口的端口状态；所述方法包括：

所述转发面组件通过轮询所述端口状态寄存器来维护参考状态表，所述参考状态表用于指示所述多个端口分别所在的多条链路是否故障；

所述转发面组件根据待转发的数据流，查询转发表和所述参考状态表，以确定用于传输所述数据流的链路是否为故障链路；

在确定用于传输所述数据流的链路为故障链路的情况下，所述转发面组件确定所述故障链路的替换链路；

所述转发面组件基于所述替换链路更新所述转发表，以将所述数据流切换到所述替换链路。
如权利要求1所述的方法，其特征在于，所述参考状态表包括链路状态表，所述链路状态表用于记录所述多条链路中各条链路的链路状态；

所述转发面组件通过轮询所述端口状态寄存器来维护所述参考状态表，包括：

所述转发面组件轮询所述端口状态寄存器，以确定所述多个端口中是否存在发生状态改变的端口，所述发生状态改变包括从可用状态变为不可用状态；

在确定所述多个端口中存在发生状态改变的端口的情况下，所述转发面组件将所述链路状态表中的第一链路状态修改为故障状态，所述第一链路状态为所述发生状态改变的端口所在链路的状态。
如权利要求2所述的方法，其特征在于，所述链路状态表记录有所述多条链路的链路索引与链路状态的对应关系；

所述转发面组件将所述链路状态表中的第一链路状态修改为故障状态之前，还包括：

所述转发面组件从端口与链路的索引映射表中查询与第一端口索引对应的链路索引，以得到第一链路索引，所述第一端口索引为所述发生状态改变的端口的索引；

所述转发面组件从所述链路状态表中查询与所述第一链路索引对应的链路状态，以得到所述第一链路状态。
如权利要求2或3所述的方法，其特征在于，所述转发面组件根据待转发的数据流，查询所述转发表和所述参考状态表，以确定用于传输所述数据流的链路是否为故障链路，包括：

所述转发面组件从所述转发表中查询所述数据流对应的出端口；

所述转发面组件从所述链路状态表中查询所述出端口所在链路的链路状态；

在所述出端口所在链路的链路状态为故障状态的情况下，所述转发面组件确定用于传输所述数据流的链路为故障链路。
如权利要求4所述的方法，其特征在于，所述转发面组件是通过快速重路由机制从所述链路状态表中查询所述出端口所在链路的链路状态的。
如权利要求1所述的方法，其特征在于，所述参考状态表包括端口状态表，所述端口状态表用于记录所述多个端口中各个端口的端口状态；

所述转发面组件通过轮询所述端口状态寄存器来维护所述参考状态表，包括：

所述转发面组件轮询所述端口状态寄存器，以确定所述多个端口中是否存在发生状态改变的端口，所述发生状态改变包括从可用状态变为不可用状态；

在确定所述多个端口中存在发生状态改变的端口的情况下，所述转发面组件将所述端口状态表中的第一端口状态修改为不可用状态，所述第一端口状态为所述发生状态改变的端口的状态。
如权利要求6所述的方法，其特征在于，所述端口状态表记录有所述多个端口的端口索引与端口状态的对应关系；

所述转发面组件将所述端口状态表中的第一端口状态修改为不可用状态之前，还包括：

所述转发面组件从所述端口状态表中查询与第一端口索引对应的端口状态，以得到所述第一端口状态，所述第一端口索引为发生状态改变的端口的索引。
如权利要求6或7所述的方法，其特征在于，所述转发面组件根据待转发的数据流，查询所述转发表和所述参考状态表，以确定用于传输所述数据流的链路是否为故障链路，包括：

所述转发面组件从所述转发表中查询所述数据流对应的出端口；

所述转发面组件从所述端口状态表中查询所述出端口的端口状态；

在所述出端口的端口状态为不可用状态的情况下，所述转发面组件确定用于传输所述数据流的链路为故障链路。
如权利要求1-8任一所述的方法，其特征在于，所述转发面组件确定所述故障链路的替换链路，包括：

所述转发面组件通过快速重路由机制从主备链路对应关系中获取所述故障链路对应的备链路作为所述替换链路。
如权利要求1-8任一所述的方法，其特征在于，所述转发面组件确定所述故障链路的替换链路，包括：

所述转发面组件通过哈希算法，从所述故障链路的多条等价链路中确定所述替换链路。
如权利要求1-10任一所述的方法，其特征在于，所述转发面组件是通过亚毫秒级轮询机制来轮询所述端口状态寄存器的。
如权利要求1-11任一所述的方法，其特征在于，所述网络设备还包括物理层PHY芯片，所述多个端口为所述PHY芯片的端口，所述端口状态寄存器为所述PHY芯片中的寄存器，所述端口状态寄存器的值由所述PHY芯片在检测到所述多个端口中存在发生故障的端口的情况下进行修改。
如权利要求1-12任一所述的方法，其特征在于，所述转发面组件为可编程逻辑器件。
一种链路故障处理装置，其特征在于，应用于网络设备的转发面组件，所述装置用于实现权利要求1-13中任一所述方法的步骤。
一种网络设备，其特征在于，所述网络设备包括转发面组件、端口状态寄存器和多个端口；所述网络设备用于通过所述转发面组件实现权利要求1-13中任一所述方法的步骤。
一种计算机可读存储介质，其特征在于，所述存储介质内存储有计算机程序，所述计算机程序被网络设备执行时实现权利要求1-13中任一所述方法的步骤。
一种计算机程序产品，其特征在于，所述计算机程序产品内存储有计算机指令，所述计算机指令被网络设备执行时实现权利要求1-13中任一所述方法的步骤。