WO2022028456A1

WO2022028456A1 - 拥塞控制方法和装置、网络节点设备，及计算机可读存储介质

Info

Publication number: WO2022028456A1
Application number: PCT/CN2021/110501
Authority: WO
Inventors: 王同乐
Original assignee: 中兴通讯股份有限公司
Priority date: 2020-08-07
Filing date: 2021-08-04
Publication date: 2022-02-10
Also published as: EP4195594A1; CN112787951A; CN112787951B

Abstract

本申请涉及通信技术领域，并提供一种拥塞控制方法和装置、网络节点设备，及计算机可读存储介质。该方法包括：根据接收到的报文的接收时间戳信息和发送时间戳信息，计算报文在本节点设备内部的转发时延值；以及，响应于报文在本节点设备内部的转发时延值大于报文的预设时延门限值，对报文进行拥塞通知标记，以通过拥塞通知标记对报文进行拥塞控制。

Description

拥塞控制方法和装置、网络节点设备，及计算机可读存储介质

本申请要求在2020年8月7日提交中国专利局、申请号为202010789061.6的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请涉及通信技术领域。

背景技术

数据中心在线密集服务、深度学习、高频交易等应用对传统以太网提出了挑战。传统以太网络是有损网络，会产生局部拥塞，从而导致延迟、丢包、网络吞吐率下降等性能损失，影响客户体验。因此，数据中心的低时延业务需要无损网络的支撑，并对无损网络中的报文传输进行拥塞控制。

发明内容

本申请实施例的一个方面提供一种拥塞控制方法，包括：根据接收到的报文的接收时间戳信息和发送时间戳信息，计算报文在本节点设备内部的转发时延值；以及，响应于报文在本节点设备内部的转发时延值大于报文的预设时延门限值，对报文进行拥塞通知标记，以通过拥塞通知标记对报文进行拥塞控制。

本申请实施例的另一个方面提供一种拥塞控制装置，包括：时延门限计算模块，被配置为根据接收到的报文的接收时间戳信息和发送时间戳信息，计算报文在本节点设备内部的转发时延值；以及，拥塞通知标记携带模块，被配置为响应于报文在本节点设备内部的转发时延值大于报文的预设时延门限值，对报文进行拥塞通知标记，以通过拥塞通知标记对报文进行拥塞控制。

本申请实施例的另一个方面提供一种网络节点设备，包括：一个或多个处理器；以及，存储器，其上存储有一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现本申请实施例提供的拥塞控制方法的至少一个步骤。

本申请实施例的另一个方面提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现本申请实施例提供的拥塞控制方法的至少一个步骤。

附图说明

图1示出本申请实施例提供的拥塞控制方法的流程示意图。

图2示出本申请实施例提供的集中式转发网络节点设备的结构示意图。

图3示出本申请实施例提供的分布式转发网络节点设备的结构示意图。

图4示出本申请实施例提供的根据入端口进行拥塞标记的流程示意图。

图5示出本申请实施例提供的根据出端口进行拥塞标记的流程示意图。

图6示出本申请实施例提供的根据入端口和优先级进行拥塞标记的流程示意图。

图7示出本申请实施例提供的根据出端口和优先级进行拥塞标记的流程示意图。

图8示出本申请实施例提供的根据访问控制列表进行拥塞标记的流程示意图。

图9示出本申请实施例提供的能够实现在物理接口获取时间戳信息和进行拥塞通知标记的网络节点结构示意图。

图10示出本申请实施例提供的拥塞控制装置的结构示意图。

图11示出本申请实施例提供的计算设备的示例性硬件架构的示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚明白，下文中将结合附图对本申请的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

在本申请实施例中，数据中心低延时业务需要无损网络的支撑，而显性拥塞通知(Explicit Congestion Notification，ECN)和基于优先级的流量控制(Priority-based Flow Control，PFC)技术作为避免拥塞的重要手段经常应用于无损网络的拥塞控制中。

在征求评议文件(Request For Comments，RFC)3168中，将互联网协议(Internet Protocol，IP)头中的服务条款(Terms of Service，TOS)保留位重新定义为ECN字段。当前允许通过以太网使用远程直接内存访问(Remote Direct Memory Access，RDMA)的网络协议(RDMA over Converged Ethernet，ROCE)网络，利用ECN拥塞标记技术实现网络节点的拥塞控制。

对于使能ECN功能的网络节点，通常会在出口队列拥塞时对具备ECN能力的报文进行ECN拥塞标记，标记为拥塞的报文达目的端后，目的端会反馈拥塞信息到报文发送的源端，报文发送的源端对拥塞流进行降速处理。降速的目的一方面可以避免因网络节点出现拥塞丢包，另一方面对于时延敏感业务也通过降速避免了本地缓存大量报文从而带来更大的传输时延。在网络节点上，传统的ECN标记方法通常是报文在入队或出队操作时，根据出口队列拥塞程度来决定是否进行ECN标记。若队列深度超过了设置的ECN标记门限，则对报文进行ECN标记，否则对报文不进行ECN标记。

上述标记方式是把报文在本网络节点的拥塞简化为用出口队列的拥塞来表示的方法。然而网络节点对于一个报文的完整转发流程，会经过入端口接收报文、入口缓存、上行转发处理、上行流量管理、交换网、下行转发处理、下行流量管理等多个阶段。出口队列的拥塞程度只是反应了流量管理阶段报文在出口队列的拥塞状况，并没有完整反应报文在本网络节点从入端口接收报文到出端口发送的内部完整的拥塞情况。

实际应用场景中，报文在内部转发过程中会经过多处资源的竞争，这些资源包括入口缓存资源、转发查表资源、报文上行流量管理器(Traffic Manager，TM)资源、交换网转发及下行TM资源等，这些资源的竞争都可能会引起报文的拥塞及转发时延增加。因此，只通过出口队列的拥塞程度来进行ECN标记具有局限性，不能完整反应报文在整个网络节点因资源竞争导致的时延。在无损网络的应用中存在的大量时延敏感业务，对这些业务低时延的保障不仅需要感知出口队列的拥塞，同时还需要感知整个网络节点转发的时延来进行相应的拥塞控制，从避免网络节点时延偏大带来较差的客户体验。

PFC技术也是无损网络经常使用的拥塞控制技术，但是利用PFC技术会引起队头阻塞(Head-of-line blocking，HOL)。同一入口进来的报文可能转发到多个出口，包含拥塞出口和非拥塞的出口。但是入口的PFC流控会导致本入口同一优先级的所有流量都停止发送，因此转发到其它非拥塞出口的流也被阻塞了，从而引起队头阻塞，严重时还会导致拥塞蔓延，网络吞吐量急剧下降。

本申请实施例提供一种拥塞控制方法，通过计算网络节点的报文完整转发时延并基于时延对报文进行ECN标记，可以保障低时延业务在网络传输中的时延要求，并对PFC的队头阻塞进行改善。

图1示出本申请实施例提供的拥塞控制方法的流程示意图。如图1所示，拥塞控制方法可以包括以下步骤S110和步骤S120。

在步骤S110中，根据所接收报文的接收时间戳信息和发送时间戳信息，计算报文在本节点设备内部的转发时延值。

在步骤S120中，若报文在本节点设备内部的转发时延值大于预设的报文的预设时延门限值，则对报文进行拥塞通知标记，以通过拥塞通知标记对报文进行拥塞控制。

根据本申请实施例提供的拥塞控制方法，可以根据在报文接收阶段获取的接收时间戳和在报文发送之前获取的发送时间戳，计算报文在该网络节点内部的完整转发时延，该转发时延大于预先配置的预设时延门限值时，对报文进行拥塞通知标记；从而，通过检测网络节点内部完整转发时延来进行拥塞通知标记，可以保障低时延业务在网络传输中的时延要求。

在一种可选的实施方式中，在预定的报文接收阶段，该拥塞控制方法还包括：在步骤S140中，若确定无需对报文开启拥塞通知标记功能，则配置报文的第二时间戳标记；在步骤S141中，在发送报文之前，根据第二时间戳标记确定拥塞标记功能未开启，并按照预定转发方式转发报文。第二时间戳标记携带于报文的指定位置或作为报文的随路信息进行传输。

本申请实施例提供的拥塞控制方法可以应用于网络节点设备，该网络节点设备可以是集中式转发网络节点设备，或者是分布式转发网络节点设备。下面通过图2和图3，分别介绍本申请实施例提供的集中式转发网络节点设备和分布式转发网络节点设备的各功能单元以及它们之间的结构关系。

图2示出本申请实施例提供的集中式转发网络节点设备的结构示意图。如图2所示，集中式转发网络节点设备的功能单元可以包括：入端口10、上行ECN处理模块11、报文上行处理模块12、流量管理器(TM模块)13、报文下行处理模块14、下行ECN处理模块15和出端口16。

入端口10和出端口16可以是物理端口(Physical，PHY)。上行ECN处理模块11和报文上行处理模块12，形成集中式转发网络节点设备对报文进行处理的上行流水线。报文下行处理模块14和下行ECN处理模块15，形成集中式转发网络节点设备对报文进行处理的下行流水线。

在一种可选的实施方式中，在集中式转发网络节点设备中，报文接收阶段包括从本节点设备的入端口10到本节点设备的转发芯片之间进行报文处理的任一阶段；以及，发送报文之前的报文处理阶段，包括从本节点设备的转发芯片到本节点设备的出端口16之间进行报文处理的任一阶段。

本节点设备的转发芯片对报文的上行处理，可以参见图2中，上行ECN处理模块11和报文上行处理模块12对报文的处理；本节点设备的转发芯片对报文的下行处理，可以参见图2中，报文下行处理模块14和下行ECN处理模块15对报文的处理。

通过图2可知，入端口10可以被配置为进行报文接收和报文缓存，上行ECN处理模块11可以被配置为获取时延门限模板，报文上行处理模块12可以被配置为进行报文的上行转发处理，流量管理器13被配置为进行流量管理，报文下行处理模块14可以被配置为报文的下行转发处理，下行ECN处理模块15被配置为获取时延门限模板，以及出端口16被配置为进行报文发送，从而实现集中式转发节点设备对于一个报文的完整转发流程。

图3示出本申请实施例提供的分布式转发网络节点设备的结构示意图。如图3所示，分布式转发网络节点设备可以包括：入口芯片端口(简称入端口)20、入口芯片上行ECN处理模块21、入口芯片上行报文处理模块22、入口芯片上行TM 23、交换网模块24、出口芯片下行报文处理模块25、出口芯片下行TM 26、出口芯片下行ECN处理模块27和出口芯片端口(简称出端口)28。入口芯片端口20和出口芯片端口28可以是物理端口PHY。

在一种可选的实施方式中，在分布式转发网络节点设备中，报文接收阶段包括从本节点设备的入端口20到本节点设备的上行转发芯片之间进行报文处理的任一阶段；以及，发送报文之前的报文处理阶段，包括从本节点设备的下行转发芯片到本节点设备的出端口28之间进行报文处理的任一阶段。

本节点设备的上行转发芯片对报文的上行处理，可以参见图3中，入口芯片上行ECN处理模块21、入口芯片上行报文处理模块22和入口芯片上行TM 23对报文的处理。本节点设备的转发芯片对报文的下行处理，可以参见图3中，出口芯片下行报文处理模块25、出口芯片下行TM 26和出口芯片下行ECN处理模块27对报文的处理。

通过图3可知，入口芯片端口(简称入端口)20被配置为进行报文接收和报文缓存，入口芯片上行ECN处理模块21可以被配置为获取时延门限模板，入口芯片上行报文处理模块22可以被配置为进行报文的上行转发处理，入口芯片上行TM 23被配置为进行上行流量管理，交换网模块24被配置为对报文进行交换网转发，出口芯片下行报文处理模块25被配置为进行报文的下行转发处理，出口芯片下行TM 26被配置为进行下行流量管理，出口芯片下行ECN处理模块 27被配置为获取时延门限模板，以及，出口芯片端口(简称出端口)28被配置为进行报文发送，从而实现分布式转发节点设备对于一个报文的完整转发流程。

网络节点设备从入端口接收报文，在报文接收阶段根据预定的配置信息识别能够开启时延ECN功能的数据流，并对该数据流对应的报文进行时延ECN标记并打上系统时间戳，该时间戳作为报文接收时间戳。

在一个种可选的实施方式中，在上述步骤S110之前，该拥塞控制方法还可以包括：在步骤S10中，在预定的报文接收阶段，根据接收到的报文所对应的流匹配信息，判断是否需要对报文开启拥塞通知标记功能；在步骤S11中，若判定需要开启拥塞通知标记功能，则获取报文的接收时间戳信息，并配置报文的时延门限模板，时延门限模板中包含预设时延门限值。

在步骤S10中，流匹配信息项包括如下项中的至少一项：入端口流量、出端口流量、入端口、出端口、报文优先级和报文特征信息。在步骤S11中，第一时间戳标记用于指示拥塞标记功能已开启，时延门限模板号用于索引预先配置的包含预先配置的时延门限值的时延门限模板。

通过预先配置的流匹配信息项，可以对不同的数据流开启时延标记功能，并为其配置相应的时延门限模板。流匹配信息项，可以基于全局、端口、端口和优先级、流特征等粒度来进行识别和匹配。

在一种可选的实施方式中，在步骤S11之后，该拥塞控制方法还可以包括：在步骤S12中，确定报文的第一时间戳标记和对应的时延门限模板号。第一时间戳标记用于指示拥塞标记功能已开启，时延门限模板号用于索引所配置的时延门限模板。

在该实施方式中，步骤S110具体可以包括：在发送报文之前，检测到报文的第一时间戳标记时，计算接收时间戳信息和获取的发送时间戳信息的差值，得到报文的转发时延值，并根据报文对应的时延门限模板号获取报文的预设时延门限值。

第一时间戳标记、接收时间戳信息和对应的时延门限模板号携带于报文的指定位置或作为报文的随路信息进行传输。

根据本申请实施例提供的拥塞控制方法，在根据流匹配信息项确定需要开启拥塞标记功能时，可以根据在报文接收阶段获取的接收时间戳和报文发送之前获取的发送时间戳，计算报文在该网络节点内部的完整转发时延，该转发时延大于预先配置的预设时延门限值时，对报文进行拥塞通知标记，从而通过检测网络节点内部完整转发时延来进行拥塞通知标记，保障低时延业务在网络传输中的时延要求。

在一种可选的实施方式中，接收时间戳的获取位置可以是报文从入端口PHY到流量管理器的任何环节，在这里不做具体限制。

在一种可选的实施方式中，可以基于流获取对应的时延门限模板。例如，上述图2中的上行ECN处理模块11和图3中的入口芯片上行ECN处理模块21，可被配置为基于流获取对应的时延门限模板。

在一种可选的实施方式中，若本节点设备为集中式转发节点设备，则在步骤110之后，和步骤S120之前，该拥塞控制方法还可包括：在步骤S21中，在本节点设备内部转发报文，并发送报文至本节点设备的转发芯片。

在一种可选的实施方式中，若本节点设备为分布式转发节点设备，则在步骤110之后，和步骤S120之前，该拥塞控制方法还可包括：在步骤S22中，在本节点设备内部将报文经交换网转发至本节点设备的下行转发信息。

在一种可选的实施方式中，报文在经过交换网时，第一时间戳标记、接收时间戳信息和对应的时延门限模板号的报文携带于报文的指定位置，指定位置为报文内部、或与交换网对应的附加报文头部中。也就是说，第一时间戳标记、接收时间戳信息和对应的时延门限模板号，可以携带于报文内部，或携带于报文的与交换网对应的附加报文头部中。

网络节点设备内部在对报文转发过程中，时间戳标记、接收时间戳信息及时延门限模板号随报文一起在网络节点内部传送。

如果是集中式设备，参见图2中的报文下行处理模块14和下行ECN处理模块15对报文的处理，以上信息随报文转发到本网络节点设备的转发芯片进行下行处理。

如果是分布式设备，参见图3中的出口芯片下行报文处理模块25、出口芯片下行TM 26、出口芯片下行ECN处理模块27对报文的处理，以上信息随包先经过交换网转发后传送到本网络节点的下行转发芯片处理。

报文携带上述三个信息在网络节点内部转发。对于集中式转发的网络节点，上述三个信息(第一时间戳标记、接收时间戳信息和对应的时延门限模板号)随报文一起经过上行流水线的上行处理模块后到达及下行流水线的下行处理模块。对于分布式转发架构的网络节点，上述三个信息需要随报文经过交换网模块24，经过交换网时，上述三个信息可以选择在报文内部携带，也可以选择在报文经过交换网的附加头部携带，在此不做限制。报文经过交换网后到达出口芯片的下行处理模块。

网络节点设备在报文从出口发送出去之前，例如选择转发芯片报文处理下行流水线到出端口PHY的任意阶段，可以获取系统时间戳，作为报文发送时间戳。

作为示例，若本网络节点设备为集中式设备，图2中的下行ECN处理模块15，可以被配置为通过计算接收时间戳和发送时间戳的差值获取报文的转发时延，并通过时延配置模板获取时延门限，当转发时延大于时延门限模板配置的门限值时，对报文进行ECN标记。

作为示例，若本网络节点设备为分布式设备，图3中的出口芯片下行ECN处理模块27，可以被配置为通过计算接收时间戳和发送时间戳的差值获取报文的转发时延，并通过时延配置模板获取时延门限，当转发时延大于时延门限模板配置的门限值时，对报文进行ECN标记。

通过上述描述可知，根据本申请实施例提供的拥塞控制方法，可以通过检测网络节点内部完整转发时延来进行ECN标记，从而保障了低时延业务在网络传输中的时延要求。

图2中的上行ECN处理模块11与图3中的入口芯片上行ECN处理模块21可以实现相同或等同的功能，图2中的报文上行处理模块 12和图3中的入口芯片上行报文处理模块22可以实现相同或等同的功能，图2中的报文下行处理模块14与图3中的出口芯片下行报文处理模块25可以实现相同或等同的功能，图2中的下行ECN处理模块15与图3中的出口芯片下行ECN处理模块27可以实现相同或等同的功能。因此，为了描述方便，在下面的描述中，当以集中式转发网络节点设备中的模块为例描述对应的报文处理过程时，分布式转发网络节点设备中的相应模块具有相同或等同的功能；同样，当以分布式转发网络节点设备中的模块为例描述对应的报文处理过程时，集中式转发网络节点设备中的相应模块具有相同或等同的功能，本申请实施例不再赘述。

图4示出本申请实施例提供的根据入端口进行拥塞标记的流程示意图。如图4所示，在一种可选的实施方式中，根据入端口进行拥塞标记的过程具体可以包括如下步骤S41-步骤S46。

在步骤S41中，入端口接收报文。

在步骤S42中，入端口是否使能基于时延的ECN标记功能。用户可以选择业务编排器、控制器、网管及命令行等方式之一来对网络节点入端口开启时延ECN标记功能并为其配置相应的时延门限模板，配置模板中的主要参数是时延门限值。ECN标记功能开启及时延门限模板相关配置信息可以记录在接口属性表或其它表项，具体不做限定。

在步骤S43中，若未使能基于时延的ECN标记功能，则按照预定流程转发报文。在该步骤中，若入端口未使能ECN标记功能，按照原有的预定流程正常转发报文即可。

在步骤S44中，若已使能基于时延的ECN标记功能，则识别入口流量，并进行ECN时间戳标记，获取接收时间戳。

在步骤S45中，报文携带ECN时间戳标记、接收时间戳信息和时延门限模板号到下行处理模块，下行处理模块解析ECN时间戳标记和接收时间戳信息。

在S46中，下行ECN处理模块获取发送时间戳，进行时延值的计算，根据计算结果对报文进行ECN标记。

网络节点设备识别入端口接收到的报文，被识别的报文例如在上行ECN处理模块11需要被打上三个信息，一个信息为ECN时间戳标记的第二个信息为具体的入口接收时间戳信息，第三个信息为时延门限模板号。ECN时间戳标记的作用是表示此报文被ECN功能打上了接收时间戳；时延门限模板号用来索引时延门限模板，不同的时延门限模板中保存着为不同时延需求业务配置的时延门限值。本申请实施例中的ECN时间戳标记可以用1个位(bit)或多个bit来表示，本申请实施例不做限定。

以集中式转发网络节点设备为例，通过携带的ECN时间戳标记，下行ECN处理模块15可以在识别ECN时间戳标记后，继续获取发送时间戳且进行时延计算，并和时延门限模板索引到的时延门限模板获取时延门限值比较，从而决策是否进行ECN标记。

上述三个信息的携带可以是选择携带在报文中的任何位置，也可以是不携带于报文中而选择作为报文的随路信息传输的方式。本申请实施例对采用哪种方式不做限定，两种方式都在本申请的保护范围之内。

继续以集中式转发网络节点设备为例，下行处理模块14可以负责报文的下行转发处理，利用下行处理模块14的报文解析功能，下行处理模块14可以被配置为完成接收时间戳标记、时间戳信息及时延门限模板的解析。解析出来的三个信息为下行ECN处理模块15所用。需要说明的是这三个信息的解析也可以放在后面下行ECN处理模块15来解析，而不是必须在下行处理模块14解析。具体的报文解析位置，本申请不做具体限定。

在步骤S46中，下行ECN处理模块15获取发送时间戳进行时延值的计算，根据计算结果对报文进行ECN标记。在该步骤中，下行ECN处理模块15，在获取到下行处理模块14或本模块解析出来的时间戳标记、时间戳信息及时延门限模板后，判断时间戳标记是否有效，若时间戳标记有效，说明报文携带接收时间戳并需要进行ECN标记的逻辑处理，则进一步获取时间戳信息。若时间戳标记为无效值，则说明此报文不需要进行基于时延的ECN标记处理。

作为示例，时间戳标记被置位或取值为第一预定值，表示报文需要使用拥塞标记功能，即时间戳标记有效；时间戳标记未被置位或取值为第二预定值，表示报文不需要使用拥塞标记功能，即时间戳标记无效。可以将时间戳标记被置位或取值为第一预定值，作为第一时间戳标记，时间戳标记未被置位或取值为第二预定值，作为第二时间戳标记。第二预定值与第一预定值不相同。

经过时间戳标记判断后，对于需要基于时延ECN标记的报文，下行ECN处理模块15继续获取当前系统时间戳作为报文发送时间戳，并计算发送时间戳和接收时间戳的差值。同时下行ECN处理模块15可以根据时延门限模板查表获取ECN时延门限。若计算的时间戳差值超过时延门限模板预设的时延门限，则对报文进行ECN拥塞标记。

在如图4所示的预设的流匹配信息为入端口时，上述步骤S10具体可以包括如下步骤S301。在步骤S301中，若报文是本节点设备从预定的入端口接收的报文，且本节点设备的入端口流量为无损业务流量，则判定需要对报文开启拥塞标记功能。

在一种可选的实施方式中，若所接收的报文是本节点设备从预定的入端口接收的报文，但本节点设备的入端口流量非无损业务流量；或者，本节点设备的入端口流量为无损业务流量，但所接收的报文是本节点设备从预定的入端口以外的其它端口接收的报文，则可以判定无需对报文开启拥塞标记功能。

相应地，上述步骤S11中配置报文的时延门限模板具体可以包括：在步骤S302中，将报文承载的时延需求业务所对应的时延门限模板，作为报文的时延门限模板。不同的时延需求业务预先设置有不同的时延门限模板。

在一种可选的实施方式中，步骤S301中的入端口(或入接口)，例如可以是物理端口、LAG端口、及各种逻辑端口等，在此不做具体限定。需要说明的是，基于入端口开启时延ECN标记功能的具体含义是：对本入端口的流使能基于时延进行ECN标记功能，并不是说在入端口进行ECN标记，ECN的标记动作都是在报文的下行处理流程中实施。

如果已知某入端口流量为对丢包和时延敏感的无损业务流量时，可以在此入端口开启基于时延的ECN标记使能，从而达到本入端口流量的转发低时延的目的，报文的目的端收到带有ECN标记的报文后，发送流控信息通知发送端对流进行降速。

多对一的聚合(Incast)流量是数据中心高度并行化的云应用产生的一种现象，Incast具体指的是在高带宽、低延时、有限缓冲区的数据中心环境中，当多个服务器同时响应客户端请求并同时向客户端发送数据时，在连接客户端的网络节点的出口会发生拥塞。这也已经被证明是引起数据中心大部分丢包或时延增加的原因。基于上述场景，在数据中心leaf节点连接客户端的服务器的出口配置基于时延的ECN标记功能，从而有效缓解incast引起的丢包或时延增加。

如图5所示，在一种可选的实施方式中，根据出端口进行拥塞标记的过程具体可以包括如下步骤S51-步骤S58。

在步骤S51中，入端口接收报文。

在步骤S52中，查报文转发表获取出端口号。在该步骤中，络节点收到报文后，在上行流水线通过转发表查找获取出端口号。

在步骤S53中，查预设的第一ECN标记匹配表。在该步骤中，配置信息可以记录在第一ECN标记匹配表中。在第一ECN标记匹配表中，查表关键字为出端口号，查表结果为时延门限模板。具体表的存储和查找形式不做限定，可以是访问控制列表(Access Control Lists，ACL)表项，也可以是其它类型内核内存(Random Access Memory，RAM)表等。

在步骤S54中，判断查表结果是否命中。

在步骤S55中，若未命中，则按照预定流程转发报文。

在步骤S56中，若命中，则对报文进行ECN时间戳标记，获取接收时间戳，以及查ECN标记匹配表得到时延门限模板。

通过上述步骤S54-S56，在上行流水线获取到出端口号后，上行ECN处理模块11以查转发表获取的报文出端口号作为关键字继续查找第一ECN标记匹配表。如果未命中，则说明此报文不需要进行出口 ECN标记。如果命中则从查找结果中获取时延门限模板号，同时对报文设置ECN时间戳标记，同时获取系统时间戳作为报文接收时间戳。至此报文在上行需要打上的三个信息已经完全获取到。

在步骤S57中，报文携带ECN时间戳标记、接收时间戳信息和时延门限模板号到报文下行处理模块14，报文下行处理模块14解析ECN时间戳标记和接收时间戳信息。在该步骤中，对ECN时间戳标记和接收时间戳信息的解析可以参照结合图4描述的步骤S45，此处不再赘述。

在步骤S58中，下行ECN处理模块15获取发送时间戳进行时延值的计算，根据计算结果对报文进行ECN标记。

报文可以携带三个信息在网络节点内部转发。三个信息随报文在集中式和分布式架构的网络节点的转发设计可以参考上述结合图2和图3描述的在网络节点设备内部的报文转发过程，此处不再赘述。

在该步骤中，报文下行处理模块14可以负责完成接收时间戳标记、时间戳信息及时延门限模板的解析，下行ECN处理模块15负责判断接收时间戳标记，获取发送时间戳，计算报文转发时延并根据时延和预设门限比较来决定是否对报文进行ECN拥塞标记。对ECN时间戳标记和接收时间戳信息的解析可以参照结合图4描述的步骤S45，此处不再赘述。

在图5所示的实施方式中，流匹配信息为出端口；则上述步骤S10具体可以包括如下步骤S311和步骤S312。在步骤S311中，若报文是本节点设备作为预定服务器接收的报文，且预定服务器的出端口被配置为发送预定数据中心网络中的多对一Incast流量数据，则通过查找预设的报文转发表确定报文的出端口号；在步骤S312中，若在预设的第一拥塞通知标记匹配表中，查找到与出端口号对应的时延门限模板，则判定需要对报文开启拥塞通知标记功能。

相应地，上述步骤S11中配置报文需要携带的时延门限模板号具体可以包括：在步骤S314中，将查找到的与出端口号对应的时延门限模板号，作为需要携带的时延门限模板号。

在一种可选的实施方式中，若在预设的第一拥塞通知标记匹配表中，未查找到与出端口号对应的时延门限模板，则可以判定无需对报文开启拥塞通知标记功能。

报文的目的端收到带有ECN标记的报文后，发送流控信息通知发送端对流进行降速。

在一种可选的实施方式中，在上述步骤S11中配置报文需要携带的时延门限模板号时，拥塞控制方法还可包括：在步骤S315中，设置需要携带的时延门限模板号为空值，并在确定报文已开启拥塞标记功能之后，以及在发送报文之前，从预先配置的下行出端口属性表中获取与出端口号对应的时延门限模板号。

在一种可选的实施方式中，可以根据报文的第一时间戳标记确定拥塞标记功能已开启。

存放时延门限的时延门限模板也可以在下行处理模块从出接口属性表获取。在下行出接口属性表获取时延门限模板方法的优势就是报文从上行流水转发到下行流水只需要携带接收时间戳标记和时间戳信息，不需要携带时延门限模板，从而降低了附加信息对交换网有效带宽的占用，提升了交换网加速比。具体是通过上行获取时延门限模板携带到报文下行处理模块14，还是报文下行处理模块14直接获取时延门限模板，本申请不做限定。

图6示出本申请实施例提供的根据入端口和优先级进行拥塞标记的流程示意图。PFC是无损网络中经常使用的流控技术，PFC实现了基于入口和报文优先级的流控，这种流控是在发生拥塞的节点向上游节点的反压，缺点是会引起队头阻塞。也就是说，针对PFC并未考虑出口的拥塞情况，并对转发到未拥塞出口的报文也进行了反压处理的明显缺陷，基于上述PFC的应用场景，可在数据中心网络节点开启基于入口和报文优先级的时延ECN标记功能。

如图6所示，在一种可选的实施方式中，根据入端口和优先级进行拥塞标记的过程具体可以包括如下步骤S61-步骤S68。

在步骤S61中，入端口接收报文。

在步骤S62中，获取入端口号和报文优先级。在该步骤中，网络节点设备收到报文后，在上行流水会获取报文的优先级。作为示例，优先级可以是以太网头中的802.1p字段映射获得，也可以是IP头中的差分服务代码点(Differentiated Services Code Point，DSCP)字段映射获得，或者是通过其它流分类手段映射获得，在此不做限制。

在步骤S63中，查预设的第二ECN标记匹配表。在该步骤中，用户可以选择业务编排器、控制器、网管及命令行等方式之一来对网络节点开启基于入口和优先级的时延ECN标记功能并配置时延门限模板，配置模板中的主要参数是时延的门限值。配置信息可以记录在第二ECN标记匹配表中。在第二ECN标记匹配表中，查表关键字为“入端口号+报文优先级”，查表结果为时延门限模板。具体表的存储和查找形式不做限定，可以是ACL表项，也可以是其它类型RAM表等。

在步骤S64中，判断查表结果是否命中。

在步骤S65中，若未命中，则按照预定流程转发报文。

在步骤S66中，若命中，则对报文进行ECN时间戳标记，获取接收时间戳，以及查ECN标记匹配表得到时延门限模板号。

通过上述步骤S64-S66，上行ECN处理模块11以入端口号和报文优先级作为关键字继续查找第二ECN标记匹配表。如果未命中，则说明不需要进行入口和报文优先级的ECN标记。如果命中则从查找结果中获取时延门限模板号，同时对报文设置ECN时间戳标记，同时获取系统时间戳作为报文接收时间戳。至此报文在入向需要打上的三个信息已经完全获取到。

在步骤S67中，报文携带ECN时间戳标记、接收时间戳信息和时延门限模板号到报文下行处理模块14，报文下行处理模块14解析ECN时间戳标记和接收时间戳信息。步骤S67中对ECN时间戳标记和接收时间戳信息的解析可以参照结合图4描述的步骤S45，此处不再赘述。

在步骤S68中，下行ECN处理模块15获取发送时间戳进行时延值的计算，根据计算结果对报文进行ECN标记。在该步骤中，下行 ECN处理模块15负责判断接收时间戳标记，获取发送时间戳，计算报文转发时延并根据时延和预设门限比较来决定是否对报文进行ECN拥塞标记。处理流程可参考结合图4描述的步骤S46，此处不再赘述。

在图6所示的实施方式中，流匹配信息为入端口和报文优先级；则上述步骤S10具体可以包括如下步骤S321和步骤S322。

在步骤S321中，若报文是本节点设备从预定的入端口接收的具有优先级信息的报文，且本节点设备的入端口流量为无损业务流量，且在预设的第二拥塞通知标记匹配表中，查找到与报文的入端口号和优先级信息对应的时延门限模块号时，判定需要对报文开启拥塞通知标记功能；在步骤S322中，若查找到与入端口号和优先级信息对应的时延门限模块号，则判定需要对报文开启拥塞通知标记功能。

相应地，上述步骤S11中配置报文的时延门限模板具体可以包括：在步骤S323中，将查找到的与入端口号和优先级信息对应的时延门限模块，作为报文的时延门限模板。

基于时延的ECN标记功能是考虑内部完整的转发延时，对于未拥塞出口的报文，因为在入向流量管理器和出向流量管理器都不会拥塞引起时延增加，因此未拥塞出口的报文时延不会超过预设门限，因此也不会进行ECN拥塞标记；只有出接口是拥塞出口的报文因为转发时延会超过预设门限因此会被进行ECN拥塞标记。报文的目的端只对ECN标记的流通知其发送端降速，不会影响非拥塞流，因此有效改善了PFC的队头阻塞和拥塞蔓延。

图7示出本申请实施例提供的根据出端口和优先级进行拥塞标记的流程示意图。如图7所示，在一种可选的实施方式中，普通的ECN拥塞标记功能正是基于出口和报文优先级来开启的，但是它只是根据出口队列的拥塞状况来决定是否进行ECN拥塞标记。而本申请的基于内部时延的ECN标记也可以基于出口和报文优先级开启，但是它体现的是转发节点内部完整的拥塞状况。基于上述场景，可在网络节点基于出口和优先级来配置时延ECN标记功能。

如图7所示，根据出端口和优先级进行拥塞标记的过程具体可以包括如下步骤S71-步骤S78。

在步骤S71中，入端口接收报文。

在步骤S72中，获取出端口号和报文优先级。在该步骤中，网络节点收到报文后，在上行流水线通过转发表查找获取出端口号。同时在上行流水会获取报文的优先级，优先级可以是以太网头中的802.1p字段映射获得，也可以是IP头中的DSCP映射获得，或者是通过其它流分类手段映射获得，在此不做限制。

在步骤S73中，查预设的第三ECN标记匹配表。在该步骤中，用户可以选择业务编排器、控制器、网管及命令行等方式之一来对网络节点基于“出口+优先级”来开启时延ECN标记功能并配置时延门限模板，配置模板中的主要参数是时延的门限值。配置信息可以记录在第三ECN标记匹配表中，在第三ECN标记匹配表中,查表关键字为出端口号和报文优先级，查表结果为时延门限模板。具体表的存储和查找形式不做限定，可以是ACL表项，也可以是其它类型RAM表等。

在步骤S74中，判断查表结果是否命中。

在步骤S75中，若未命中，则按照预定流程转发报文。

在步骤S76中，若命中，则对报文进行ECN时间戳标记，获取接收时间戳，以及查ECN标记匹配表得到时延门限模板。

在上述步骤S74-S76，在上行流水线获取到出端口号及报文优先级后，上行ECN处理模块11以出端口号和报文优先级作为关键字继续查找第三ECN标记匹配表。如果未命中，则说明不需要进行ECN拥塞标记。如果命中则从查找结果中获取时延门限模板号，同时对报文设置ECN时间戳标记，同时获取系统时间戳作为报文接收时间戳。至此报文在入向需要打上的三个信息已经完全获取到。

在步骤S77中，报文携带ECN时间戳标记、接收时间戳信息和时延门限模板号到报文下行处理模块14，报文下行处理模块14解析ECN时间戳标记和接收时间戳信息。

在一种可选的实施方式中，下行处理模块负责完成接收时间戳标记、时间戳信息及时延门限模板的解析，可以参照结合图4描述的步骤S45，此处不再赘述。

在步骤S78中，下行ECN处理模块15获取发送时间戳进行时延值的计算，根据计算结果对报文进行ECN标记。在该步骤中，下行ECN处理模块15负责判断接收时间戳标记，获取发送时间戳，计算报文转发时延并根据时延和预设门限比较来决定是否对报文进行ECN拥塞标记，处理流程请参考结合图4描述的步骤S46，此处不再赘述。

在图7所示的实施方式中，流匹配信息为出端口和优先级信息；则上述步骤S10具体可以包括如下步骤S331和步骤S332。在步骤S331中，通过查找预设的报文转发表确定报文的出端口号，并获取报文的优先级信息；在步骤S332中，若在预设的第三拥塞通知标记匹配表中，查找到与出端口号和优先级信息对应的时延门限模块，则判定需要对报文开启拥塞通知标记功能。

在一种可选的实施方式中，若在预设的第三拥塞通知标记匹配表中，未查找到与出端口号和优先级信息对应的时延门限模块，则判定无需对报文开启拥塞通知标记功能。

相应地，上述步骤S11中配置报文需要携带的时延门限模板号具体可以包括：在步骤S334中，将查找到的与出端口号和优先级信息对应的时延门限模块号，作为需要携带的时延门限模板号。

网络节点基于出口和优先级来配置时延ECN标记功能，报文的目的端收到带有ECN标记的报文后，发送流控信息通知发送端对流进行降速。

图8示出本申请实施例提供的根据访问控制列表进行拥塞标记的流程示意图。在一种可选的实施方式中，基于入向ACL可以根据配置的报文特征字段来匹配需要进行时延ECN标记的流量，ACL可以匹配的字段可以是报文头和报文内容中的任何特征字段，也可以匹配报文在上行流水中产生的metadata数据，在此不做限定。如图8所示，根据ACL进行拥塞标记的过程具体可以包括如下步骤S81-步骤S88。

在步骤S81中，入端口接收报文。

在步骤S82中，解析ACL查找需要的关键字。在该步骤中，网络节点收到报文后，上行流水线在ACL阶段会查ACL表进行流匹配，如果没有rule命中，则说明不需要进行ECN拥塞标记。如果命中则从查找结果中获取时延门限模板号，同时对报文设置ECN时间戳标记，同时获取系统时间戳作为报文接收时间戳。至此报文在入向需要打上的三个信息已经完全获取到。

在步骤S83中，查预设的ACL表。在该步骤中，用户可以选择业务编排器、控制器、网管及命令行等方式之一来对网络节点基于ACL来开启时延ECN标记功能并配置时延门限模板，配置模板中的主要参数是时延的门限值。配置信息记录在ACL表中，在ACL表中，ACL查表关键字为上述描述的任意字段，查表结果为时延门限模板。

在步骤S84中，判断查表结果是否命中。

在步骤S85中，若未命中，则按照预定流程转发报文。

在步骤S86中，若命中，则对报文进行ECN时间戳标记，获取接收时间戳，以及查ECN标记匹配表得到时延门限模板。

在上述步骤S84-S86，网络节点收到报文后，上行流水线在ACL阶段会查ACL表进行流匹配，如果没有rule命中，则说明不需要进行ECN拥塞标记。如果命中则从查找结果中获取时延门限模板号，同时对报文设置ECN时间戳标记，同时获取系统时间戳作为报文接收时间戳。至此报文在入向需要打上的三个信息已经完全获取到。

在步骤S87中，报文携带ECN时间戳标记、接收时间戳信息和时延门限模板号到报文下行处理模块14，报文下行处理模块14解析 ECN时间戳标记和接收时间戳信息。在该步骤中，对ECN时间戳标记和接收时间戳信息的解析可以参照结合图4描述的步骤S45，此处不再赘述。

在步骤S88中，下行ECN处理模块15获取发送时间戳进行时延值的计算，根据计算结果对报文进行ECN标记。在该步骤中，计算报文转发时延并根据时延和预设门限比较来决定是否对报文进行ECN拥塞标记，处理流程请参考结合图4描述的步骤S46，此处不再赘述。

在图8所示的实施方式中，流匹配信息为报文特征信息；则上述步骤S10具体可以包括如下步骤S341。在步骤S341中，若在预设的第四拥塞通知标记匹配表中，查找到与报文特征信息对应的时延门限模块号，则判定需要对报文开启拥塞通知标记功能。

报文特征信息包括：报头信息、报文内容的任一特征字段信息或报文在报文接收阶段产生的元数据。

在一种可选的实施方式中，若在预设的第四拥塞通知标记匹配表中，未查找到与报文特征信息对应的时延门限模块号，则判定无需对报文开启拥塞通知标记功能。

相应地，上述步骤S11中配置报文需要携带的时延门限模板号具体可以包括：在步骤S343中，将查找到的与报文特征信息对应的时延门限模块，作为报文对应的时延门限模板。

基于入向ACL可以根据配置的报文特征字段来匹配需要进行时延ECN标记的流量，报文的目的端收到带有ECN标记的报文后，发送流控信息通知发送端对流进行降速。

在上述结合图4-图8的描述的可选的实施方式中，接收时间戳的处理都是在上行ECN处理模块11中进行，发送时间戳及ECN标记都是在下行ECN处理模块15中完成。

本申请实施例还提供一种在入口PHY模块标记接收时间戳，在出口PHY模块实现下行ECN处理逻辑的方法，这种方法使得接收和发送时间戳的位置更贴近接收和发送端口，因此更能准确的反应报文在网络节点内部完整的转发时延。

应理解，本申请实施例只是提供了一种在PHY打戳和ECN标记的方法，并不限定打戳和ECN标记必须在PHY完成。

在图9中，该网络节点可以包括入端口模块31，流分类和接收时间戳处理模块32和出端口模块33。入端口模块31，可以包括入向物理端口PHY 311和接收时间戳获取逻辑单元312。流分类和接收时间戳处理模块32，可以包括流分类处理单元321和接收时间戳处理单元322。出端口模块33可以包括下行ENC处理逻辑单元331和出向物理端口PHY 332。

在图9所示的实施方式中，可在入端口模块31和出端口模块33配置入向时延ECN标记和出向时延ECN标记使能。

作为示例，用户可以选择业务编排器、控制器、网管及命令行等方式之一，来对网络节点开启时延ECN标记功能并配置时延门限模板，配置模板中的主要参数是时延的门限值。

网络节点收到报文后，如果入端口模块31的接收方向没有配置ECN标记使能，则报文会绕过接收时间戳获取逻辑单元312被传送到上行流水线的流分类和接收时间戳处理模块32。如果入端口模块31的接收方向配置了ECN标记使能，则在入端口模块31对接收报文打上接收时间戳，且将报文携带接收时间戳传送到上行流水线的流分类及接收时间戳获取逻辑单元312。

流分类和接收时间戳处理模块32可以通过流分类处理单元321，对报文进行流分类，并通过接收时间戳处理单元322，对时延ECN标记进行上述的基于时延门限模板映射。

与上述结合图4-图8描述的实施方式不同，该实施方式中，无需在上行ECN处理模块11获取接收时间戳，而是直接使用报文从入向物理端口PHY 311携带过来的时间戳作为接收时间戳。需要说明的是，考虑各种流分类及后续处理逻辑较为复杂，这些逻辑处理可以不放在PHY模块实现，而是由流分类和接收时间戳处理模块32完成。在一种可选的实施方式中，上行时延ECN的处理逻辑也可以完全放到入端口模块31完成，此处不做限定。

报文到达出端口模块33时，如果出端口模块33的发送方向未使能时延ECN标记，则报文绕过出端口模块33的下行ENC处理逻辑单元331，直接传送给PHY处理。如果出端口模块33的发送方向使能时延ECN标记，则需要在PHY模块完成下行ECN处理的完整逻辑，包括获取报文发送时间戳；计算接收时间戳和发送时间戳的差值为报文的转发时延；通过时延门限模板获取时延门限，实际转发时延若超过配置的时延门限值则对报文进行ECN标记，否则不进行标记。时延门限值也可以在PHY模块之前的下行流水阶段获取后带到PHY模块，这里不做限定。

出端口模块33的下行ECN处理逻辑对报文进行ECN标记后，报文进一步经过出口PHY处理后从出端口发出。报文的目的端收到带有ECN标记的报文后，发送流控信息通知发送端对流进行降速。

在图9所示的实施方式中，接收时间戳信息是从接收报文的物理端口获取的时间戳信息，或者在预定的报文接收阶段获取的系统时间戳信息；发送时间戳信息是从发送报文之前的报文处理阶段获取的系统时间戳信息，或者是从发送报文的物理端口获取的时间戳信息。

可以在入口PHY模块打接收时间戳，在出口PHY模块打接收时间戳，从而实现下行ECN处理逻辑，这种方法使得接收和发送时间戳的位置更贴近接收和发送端口，因此更能准确的反应报文在网络节点内部完整的转发时延。

在一种可选的实施方式中，在上述步骤S130之后，该拥塞控制方法还可包括：在步骤S150中，发送携带拥塞通知标记的报文至预定的目的端设备，携带拥塞通知标记的报文在目的端设备中被用于触发目的端设备发送流控信息，流控信息用于通知报文对应的数据流的发送端对数据流进行降速。

根据本申请实施例提供的报文拥塞处理方法，通过检测网络节点内部完整转发时延来进行ECN标记的方法，本方法通过计算网络节点的报文完整转发时延并基于时延对报文进行ECN标记，从而保障了低时延业务在网络传输中的时延要求。本申请实施例提出的基于网络节点内部完整时延的ECN标记技术，是对相关的无损网络基于队列拥塞进行ECN标记方法的补充，同时对PFC的队头阻塞也有很好的改善。

下面结合附图，详细介绍本申请实施例提供的拥塞控制装置。图10示出本申请实施例提供的拥塞控制装置的结构示意图。如图10所示，拥塞控制装置包括转发时延计算模块410和拥塞通知标记模块420。

转发时延计算模块410，被配置为根据所接收报文的接收时间戳信息和发送时间戳信息，计算报文在本节点设备内部的转发时延值。

拥塞通知标记模块420，被配置为若报文在本节点设备内部的转发时延值大于预设的报文的预设时延门限值，则对报文进行拥塞通知标记，以通过拥塞通知标记对报文进行拥塞控制。

根据本申请实施例提供的拥塞控制装置，通过计算网络节点的报文完整转发时延并基于时延对报文进行ECN标记，保障了低时延业务在网络传输中的时延要求；并且，该基于网络节点内部完整时延的ECN标记技术，是对相关的无损网络基于队列拥塞进行ECN标记方法的补充，同时对PFC的队头阻塞也有很好改善。

在一种可选的实施方式中，该拥塞控制装置还可以包括：功能开启判断单元，被配置为在预定的报文接收阶段，根据接收到的报文所对应的流匹配信息，判断是否需要对报文开启拥塞通知标记功能，流匹配信息包括如下项中的至少一项：入端口流量、出端口流量、入端口、出端口、报文优先级和报文特征信息；信息配置单元，被配置为若判定需要开启拥塞通知标记功能，则获取报文的接收时间戳信息，并配置报文的时延门限模板，时延门限模板中包含预设时延门限值。

在一种可选的实施方式中，拥塞控制装置还被配置为：确定报文的第一时间戳标记和对应的时延门限模板号，第一时间戳标记用于指示拥塞标记功能已开启，时延门限模板号用于索引所配置的时延门限模板；转发时延计算模块410，具体还被配置为：在发送报文之前，检测到报文的第一时间戳标记时，计算接收时间戳信息和获取的发送时间戳信息的差值，得到报文的转发时延值，并根据报文对应的时延门限模板号获取报文的预设时延门限值。

在一种可选的实施方式中，流匹配信息包括入端口；功能开启判断单元，具体可以被配置为：若报文是本节点设备从预定的入端口接收的报文，且本节点设备的入端口流量为无损业务流量，则判定需要对报文开启拥塞标记功能；信息配置单元，具体还被配置为：将报文承载的时延需求业务所对应的时延门限模板，作为报文的时延门限模板，不同的时延需求业务预先设置有不同的时延门限模板。

在一种可选的实施方式中，流匹配信息项包括出端口；拥塞控制装置还可以包括：若报文是本节点设备作为预定服务器接收的报文，且预定服务器的出端口被配置为发送预定数据中心网络中的多对一Incast流量数据，则通过查找预设的报文转发表确定报文的出端口号；功能开启判断单元，具体可以被配置为：若在预设的第一拥塞通知标记匹配表中，查找到与出端口号对应的时延门限模板，则判定需要对报文开启拥塞通知标记功能；信息配置单元，还被配置为将查找到的与出端口号对应的时延门限模板，作为报文的时延门限模板。

在一种可选的实施方式中，信息配置单元，还可以被配置为设置需要携带的时延门限模板号为空值，并在确定报文已开启拥塞标记功能之后，以及在发送报文之前，从预先配置的下行出端口属性表中获取与出端口号对应的时延门限模板。

在一种可选的实施方式中，流匹配信息为入端口和报文优先级；功能开启判断单元，具体可以被配置为：若报文是本节点设备从预定的入端口接收的具有优先级信息的报文，且本节点设备的入端口流量为无损业务流量，且在预设的第二拥塞通知标记匹配表中，查找到与报文的入端口号和优先级信息对应的时延门限模块号时，判定需要对报文开启拥塞通知标记功能。信息配置单元，还可以被配置为将查找到的与入端口号和优先级信息对应的时延门限模块，作为报文的时延门限模板。

在一种可选的实施方式中，流匹配信息项为出端口和优先级信息；拥塞控制装置还可以包括：出端口和优先级获取模块，被配置为通过查找预设的报文转发表确定报文的出端口号，并获取报文的优先级信息；功能开启判断单元，具体还可以被配置为：若在预设的第三拥塞通知标记匹配表中，查找到与出端口号和优先级信息对应的时延门限模块，则判定需要对报文开启拥塞通知标记功能；信息配置单元，还可以被配置为将查找到的与出端口号和优先级信息对应的时延门限模块号，作为报文的时延门限模板。

在一种可选的实施方式中，流匹配信息项为报文特征信息；功能开启判断单元，具体可以被配置为：若在预设的第四拥塞通知标记匹配表中，查找到与报文特征信息对应的时延门限模块号，则判定需要对报文开启拥塞通知标记功能，报文特征信息包括：报头信息、报文内容的任一特征字段信息或报文在报文接收阶段产生的元数据；信息配置单元，还可以被配置为将查找到的与报文特征信息对应的时延门限模块，作为报文对应的时延门限模板。

在一种可选的实施方式中，在预定的报文接收阶段，信息配置单元，还被配置为若确定无需对报文开启拥塞通知标记功能，则配置报文的第二时间戳标记；报文转发模块，被配置为在发送报文之前，根据第二时间戳标记确定拥塞标记功能未开启，并按照预定转发方式转发报文，第二时间戳标记携带于报文的指定位置或作为报文的随路信息进行传输。

在一种可选的实施方式中，接收时间戳信息是从接收报文的物理端口获取的时间戳信息，或在预定的报文接收阶段获取的系统时间戳信息；发送时间戳信息是从发送报文之前的报文处理阶段获取的系统时间戳信息，或是从发送报文的物理端口获取的时间戳信息。

在一种可选的实施方式中，若本节点设备为集中式转发节点设备，则报文接收阶段包括从本节点设备的入端口到本节点设备的转发芯片之间进行报文处理的任一阶段，以及，发送报文之前的报文处理阶段，包括从本节点设备的转发芯片到本节点设备的出端口之间进行报文处理的任一阶段。

在一种可选的实施方式中，若本节点设备为分布式转发节点设备，则报文接收阶段包括从本节点设备的入端口到本节点设备的上行转发芯片之间进行报文处理的任一阶段，以及，发送报文之前的报文处理阶段，包括从本节点设备的下行转发芯片到本节点设备的出端口之间进行报文处理的任一阶段。

在一种可选的实施方式中，若本节点设备为集中式转发节点设备，则拥塞控制装置还可以包括：内部转发模块，被配置为在报文中携带第一时间戳标记、接收时间戳信息和对应的时延门限模板号之后，以及发送报文之前，在本节点设备内部转发所接收的报文，并发送报文至本节点设备的转发芯片。

在一种可选的实施方式中，若本节点设备为分布式转发节点设备，则拥塞控制装置还可以包括：在报文中携带第一时间戳标记、接收时间戳信息和对应的时延门限模板号之后，以及发送报文之前，在本节点设备内部将所接收的报文经交换网转发至本节点设备的下行转发信息。

报文在经过交换网时，第一时间戳标记、接收时间戳信息和对应的时延门限模板号的报文携带于报文的指定位置，指定位置为报文内部或与交换网对应的附加报文头部中。

在一种可选的实施方式中，拥塞控制装置还可包括报文发送模块，被配置为对报文进行拥塞通知标记之后，发送携带拥塞通知标记的报文至预定的目的端设备，携带拥塞通知标记的报文在目的端设备中被用于触发目的端设备发送流控信息，流控信息用于通知报文对应的数据流的发送端对数据流进行降速。

根据本申请实施例提供的拥塞控制装置，通过检测网络节点内部完整转发时延来进行ECN标记的方法，保障了低时延业务在网络传输中的时延要求。该拥塞控制装置可以对相关的无损网络基于队列拥塞进行ECN标记方法的补充，同时对PFC的队头阻塞也有很好的改善。

需要明确的是，本申请并不局限于上文中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁，这里省略了对已知方法的详细描述，并且上述描述的系统、模块和单元的具体工作过程，可以参考前述方法的对应过程，在此不再赘述。

图11示出本申请实施例提供的计算设备的示例性硬件架构的示意图。如图11所示，计算设备500包括输入设备501、输入接口502、中央处理器503、存储器504、输出接口505、以及输出设备506。输入接口502、中央处理器503、存储器504、以及输出接口505通过总线510相互连接，输入设备501和输出设备506分别通过输入接口502和输出接口505与总线510连接，进而与计算设备500的其它组件连接。

具体地，输入设备501接收来自外部的输入信息，并通过输入接口502将输入信息传送到中央处理器503；中央处理器503基于存储器504中存储的计算机可执行指令对输入信息进行处理以生成输出信息，将输出信息临时或者永久地存储在存储器504中，然后通过输出接口505将输出信息传送到输出设备506；输出设备506将输出信息输出到计算设备500的外部供用户使用。

在一种可选的实施方式中，图11所示的计算设备可以被实现为一种网络节点设备，该网络节点设备可以包括：存储器，被配置为存储程序；处理器，被配置为运行存储器中存储的程序，以执行本申请实施例提供的拥塞控制方法的至少一个步骤。

以上所述，仅为本申请的示例性实施例而已，并非用于限定本申请的保护范围。一般来说，本申请的多种实施例可以在硬件或专用电路、软件、逻辑或其任何组合中实现。例如，一些方面可以被实现在硬件中，而其它方面可以被实现在可以被控制器、微处理器或其它计算装置执行的固件或软件中，尽管本申请不限于此。

本申请的实施例可以通过移动装置的数据处理器执行计算机程序指令来实现，例如在处理器实体中，或者通过硬件，或者通过软件和硬件的组合。计算机程序指令可以是汇编指令、指令集架构(Instruction Set Architecture，ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码。

本申请附图中的任何逻辑流程的框图可以表示程序步骤，或者可以表示相互连接的逻辑电路、模块和功能，或者可以表示程序步骤与逻辑电路、模块和功能的组合。计算机程序可以存储在存储器上。存储器可以具有任何适合于本地技术环境的类型并且可以使用任何适合的数据存储技术实现，例如但不限于只读存储器(Read-Only Memory，ROM)、随机访问存储器(Random Access Memory，RAM)、光存储器装置和系统(数码多功能光碟Digital Versatile Disc，DVD或光盘CD)等。计算机可读介质可以包括非瞬时性存储介质。数据处理器可以是任何适合于本地技术环境的类型，例如但不限于通用计算机、专用计算机、微处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程逻辑门阵列(Field Programmable Gate Array，FGPA)以及基于多核处理器架构的处理器。

通过示范性和非限制性的示例，上文已提供了对本申请的示范实施例的详细描述。但结合附图和权利要求来考虑，对以上实施例的多种修改和调整对本领域技术人员来说是显而易见的，但不偏离本申请的范围。因此，本申请的恰当范围将根据权利要求确定。

Claims

一种拥塞控制方法，包括：

根据接收到的报文的接收时间戳信息和发送时间戳信息，计算所述报文在本节点设备内部的转发时延值；以及

响应于所述报文在本节点设备内部的转发时延值大于所述报文的预设时延门限值，对所述报文进行拥塞通知标记，以通过所述拥塞通知标记对所述报文进行拥塞控制。
根据权利要求1所述的方法，在根据接收到的所述报文的所述接收时间戳信息和所述发送时间戳信息，计算所述报文在本节点设备内部的转发时延值之前，还包括：

在预定的报文接收阶段，根据接收到的报文所对应的流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能；其中，所述流匹配信息包括如下项中的至少一项：入端口流量、出端口流量、入端口、出端口、报文优先级或报文特征信息；以及

响应于确定需要开启拥塞通知标记功能，获取所述报文的接收时间戳信息，并配置所述报文的时延门限模板，所述时延门限模板中包含所述预设时延门限值。
根据权利要求2所述的方法，其中，

在获取所述报文的接收时间戳信息，并配置所述报文的时延门限模板之后，所述方法还包括：确定所述报文的第一时间戳标记和对应的时延门限模板号；其中，所述第一时间戳标记用于指示所述拥塞标记功能已开启，所述时延门限模板号用于索引所配置的时延门限模板；以及

根据接收到的所述报文的所述接收时间戳信息和所述发送时间戳信息，计算所述报文在本节点设备内部的转发时延值，包括：在发送所述报文之前，响应于检测到所述报文的第一时间戳标记，计算所述接收时间戳信息和获取的发送时间戳信息的差值，得到所述报文的转发时延值；以及，根据所述报文对应的时延门限模板号获取所述报文的预设时延门限值；

其中，所述第一时间戳标记、所述接收时间戳信息和对应的时延门限模板号携带于所述报文的指定位置或作为所述报文的随路信息进行传输。
根据权利要求2所述的方法，其中，所述流匹配信息为入端口；

根据接收到的所述报文所对应的所述流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能，包括：响应于所述报文是本节点设备从预定的入端口接收的报文，且本节点设备的入端口流量为无损业务流量，确定需要对所述报文开启拥塞标记功能；以及

配置所述报文的时延门限模板，包括：将所述报文承载的时延需求业务所对应的时延门限模板，作为所述报文的时延门限模板；其中，不同的时延需求业务预先设置有不同的时延门限模板。
根据权利要求2所述的方法，其中，所述流匹配信息为出端口；

根据接收到的所述报文所对应的所述流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能，包括：响应于所述报文是本节点设备作为预定服务器接收的报文，且所述预定服务器的出端口用于发送预定数据中心网络中的多对一聚合流量数据，通过查找预设的报文转发表确定所述报文的出端口号；以及，响应于在预设的第一拥塞通知标记匹配表中，查找到与所述出端口号对应的时延门限模板，确定需要对所述报文开启拥塞通知标记功能；以及

配置所述报文的时延门限模板，包括：将查找到的与所述出端口号对应的时延门限模板，作为所述报文的时延门限模板。
根据权利要求5所述的方法，其中，配置所述报文的时延门限模板号，包括：

设置需要携带的时延门限模板号为空值；以及

在确定所述报文已开启拥塞标记功能之后，以及在发送所述报文之前，从预先配置的下行出端口属性表中获取与所述出端口号对应的时延门限模板。
根据权利要求2所述的方法，其中，所述流匹配信息为入端口和报文优先级；

根据接收到的所述报文所对应的所述流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能，包括：响应于所述报文是本节点设备从预定的入端口接收的具有优先级信息的报文，且本节点设备的入端口流量为无损业务流量，且在预设的第二拥塞通知标记匹配表中查找到与所述报文的入端口号和所述优先级信息对应的时延门限模块号，确定需要对所述报文开启拥塞通知标记功能；以及

配置所述报文的时延门限模板，包括：将查找到的与所述入端口号和所述优先级信息对应的时延门限模块，作为所述报文的时延门限模板。
根据权利要求2所述的方法，其中，所述流匹配信息为出端口和优先级信息；

根据接收到的所述报文所对应的所述流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能，包括：通过查找预设的报文转发表确定所述报文的出端口号，并获取所述报文的优先级信息；以及，响应于在预设的第三拥塞通知标记匹配表中，查找到与所述出端口号和所述优先级信息对应的时延门限模块，确定需要对所述报文开启拥塞通知标记功能；以及

配置所述报文的时延门限模板，包括：将查找到的与所述出端口号和所述优先级信息对应的时延门限模块号，作为所述报文的时延门限模板。
根据权利要求2所述的方法，其中，所述流匹配信息为报文特征信息；

根据接收到的所述报文所对应的所述流匹配信息，判断是否需要对所述报文开启拥塞通知标记功能，包括：响应于在预设的第四拥塞通知标记匹配表中，查找到与所述报文特征信息对应的时延门限模块号，确定需要对所述报文开启拥塞通知标记功能；以及

配置所述报文的时延门限模板，包括：将查找到的与所述报文特征信息对应的时延门限模块，作为所述报文对应的时延门限模板；

其中，所述报文特征信息包括：报头信息、报文内容的任一特征字段信息或所述报文在所述报文接收阶段产生的元数据。
根据权利要求2-9中任一项所述的方法，在预定的报文接收阶段，还包括：

响应于确定无需对所述报文开启拥塞通知标记功能，配置所述报文的第二时间戳标记；以及

在发送所述报文之前，根据所述第二时间戳标记确定所述拥塞标记功能未开启，并按照预定转发方式转发所述报文；

其中，所述第二时间戳标记携带于所述报文的指定位置或作为所述报文的随路信息进行传输。
根据权利要求2-9中任一项所述的方法，其中，

所述接收时间戳信息是从接收所述报文的物理端口获取的时间戳信息，或是在预定的报文接收阶段获取的系统时间戳信息；以及

所述发送时间戳信息是从发送所述报文之前的报文处理阶段获取的系统时间戳信息，或是从发送所述报文的物理端口获取的时间戳信息。
根据权利要求11所述的方法，其中，

若本节点设备为集中式转发节点设备，则所述报文接收阶段包括从本节点设备的入端口到本节点设备的转发芯片之间进行报文处理的任一阶段；以及，所述发送所述报文之前的报文处理阶段包括从本节点设备的转发芯片到本节点设备的出端口之间进行报文处理的任一阶段；以及

若本节点设备为分布式转发节点设备，则所述报文接收阶段包括从本节点设备的入端口到本节点设备的上行转发芯片之间进行报文处理的任一阶段；以及，所述发送所述报文之前的报文处理阶段包括从本节点设备的下行转发芯片到本节点设备的出端口之间进行报文处理的任一阶段。
根据权利要求3所述的方法，还包括：

响应于本节点设备为集中式转发节点设备，在本节点设备内部转发所接收的报文，并发送所述报文至本节点设备的转发芯片；以及

响应于本节点设备为分布式转发节点设备，在本节点设备内部将所接收的报文经交换网转发至本节点设备的下行转发信息；

其中，所述报文在经过交换网时，所述第一时间戳标记、所述接收时间戳信息和所述对应的时延门限模板号携带于所述报文的指定位置，所述指定位置为所述报文内部、或与所述交换网对应的附加报文头部中。
根据权利要求2-9中任一项所述的方法，在对所述报文进行拥塞通知标记之后，还包括：

发送携带所述拥塞通知标记的报文至预定的目的端设备；

其中，所述携带拥塞通知标记的报文在所述目的端设备中被用于触发所述目的端设备发送流控信息，且流控信息用于通知所述报文对应的数据流的发送端对所述数据流进行降速。
一种拥塞控制装置，包括：

时延门限计算模块，被配置为根据接收到的报文的接收时间戳信息和发送时间戳信息，计算所述报文在本节点设备内部的转发时延值；以及

拥塞通知标记携带模块，被配置为响应于所述报文在本节点设备内部的转发时延值大于所述报文的预设时延门限值，对所述报文进行拥塞通知标记，以通过所述拥塞通知标记对所述报文进行拥塞控制。
一种网络节点设备，包括：

一个或多个处理器；以及

存储器，其上存储有一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现根据权利要求1-14中任一项所述的拥塞控制方法。
一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现根据权利要求1-14任一项所述的拥塞控制方法。