CN114745331A - 一种拥塞通知方法及设备 - Google Patents
一种拥塞通知方法及设备 Download PDFInfo
- Publication number
- CN114745331A CN114745331A CN202210290898.5A CN202210290898A CN114745331A CN 114745331 A CN114745331 A CN 114745331A CN 202210290898 A CN202210290898 A CN 202210290898A CN 114745331 A CN114745331 A CN 114745331A
- Authority
- CN
- China
- Prior art keywords
- congestion notification
- sending
- message
- ethernet data
- mac address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000004044 response Effects 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/26—Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/33—Flow control; Congestion control using forward notification
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请提供了一种拥塞通知方法及设备。该方法包括:复制收到的带有显示拥塞通知标签的以太网数据报文;获取收到的带有显示拥塞通知标签以太网数据报文的接收端口;基于复制的以太网数据报文生成第一代答拥塞通告报文;通过接收端口发送第一代答拥塞通告报文,从而在RoCE网络内,发送端与接收端之间的设备可以快速向发送端通知发生拥塞。
Description
技术领域
本申请涉及通信技术,特别涉及一种拥塞通知方法及设备。
背景技术
RDMA(Remote Direct Memory Access,远程直接数据存取)技术可实现从一个主机或服务器的内存直接访问另一主机或服务器的内存,而无需使用CPU。RoCE(RDMA overConverged Ethernet)允许通过以太网络使用RDMA,在网络侧使用PFC(Priority-basedFlow Control,基于优先级的流量控制)保证拥塞时不丢包,网卡侧又使用ECN(ExplicitCongestion Notification,显示拥塞通知)进一步减缓拥塞。
当RoCE网络内的交换设备的出口缓存达到设定的阈值时,交换设备将该出口待发送的以太网数据报文的IP头的报文的ECT(ECN-capable Transport)位和CE(ECN-capableTransport)位都标记为1,为待转发的以太网数据报文添加ECN标签,然后正常转发。当接收端收到带有ECN标签的以太网数据报文后,接收端生成带有导致拥塞的flow(流)信息或QP(Queue Pairs)信息的CNP(Congestion Notification Packet,拥塞通告报文),发送CNP至发送端。发送端收到CNP后,对出口发生拥塞的队列采取措施降低发送速度。但是当发送带有ECN标签数据报文的交换设备到达接收端的路径较长,从拥塞发生到接收端发出CNP报文的时间较长;接收端和发送端之间的路径较长,接收端发送的CNP报文可能经过多跳才能到达接收端,这些情况都会导致网络内长时间存在拥塞。
发明内容
本申请的目的提供一种拥塞通知方法及设备,在RoCE网络内快速向发送端通知发生拥塞。
为实现上述目的,本申请提供了一种拥塞通知方法,该方法包括:复制收到的带有显示拥塞通知标签的以太网数据报文;获取收到的带有显示拥塞通知标签以太网数据报文的接收端口;基于复制的以太网数据报文生成第一代答拥塞通告报文;通过接收端口发送第一代答拥塞通告报文。
为实现上述目的,本申请还提供了一种拥塞通知设备,该设备至少包括:交换模块、代答模块、发送模块;交换模块,用于复制收到的带有显示拥塞通知标签的以太网数据报文并发送到代答模块;代答模块,用于获取收到的带有显示拥塞通知标签以太网数据报文的接收端口,基于复制的以太网数据报文生成第一代答拥塞通告报文,并发送到代答模块;发送模块,用于通过接收端口发送第一代答拥塞通告报文。
本申请的有益效果在于,发送端与接收端之间额交换设备可以快速向发送端设备通知发生拥塞,降低RoCE网络中发送端降低导致网络拥塞的以太网数据报文的发送速率,快速缓解网络发生的拥塞。
附图说明
图1为本申请提供的拥塞通知方法实施例的流程图;
图2为本申请提供的代答拥塞通告报文转发的示意图;
图3为本申请提供的拥塞通知设备实施例的示意图。
具体实施方式
将以多个附图所示的多个例子进行详细说明。在以下详细描述中,多个具体细节用于提供对本申请的全面理解。实例中没有详细地描述已知的方法、步骤、组件以及电路,以免使这些例子的难于理解。
使用的术语中,术语“包括”表示包括但不限于;术语“含有”表示包括但不限于;术语“以上”、“以内”以及“以下”包含本数;术语“大于”、“小于”表示不包含本数。术语“基于”表示至少基于其中一部分。
图1为本申请提供的拥塞通知方法实施例的流程图包括以下步骤:
步骤101,复制收到的带有显示拥塞通知标签的以太网数据报文;
步骤102,获取收到的带有显示拥塞通知标签以太网数据报文的接收端口;
步骤103,基于复制的以太网数据报文生成第一代答拥塞通告报文;
步骤104,通过接收端口发送第一代答拥塞通告报文。
图1所示方法实施例的有益效果在于,发送端与接收端之间额交换设备可以快速向发送端设备通知发生拥塞,降低RoCE网络中发送端降低导致网络拥塞的以太网数据报文的发送速率,快速缓解网络发生的拥塞。
图2为本申请提供的代答拥塞通告报文转发的示意图;RoCE网络内,发送端向接收端发送以太网数据报文201。交换设备21查找以太网数据报文的目的MAC地址,通过出端口将以太网数据报文201交换设备22。
交换设备22根据目的MAC地址查找到发送端口2B,确定发送端口2B的缓存达到设定的阈值时,交换设备22将以太网数据报文的IP头的报文的ECT(ECN-capable Transport)位和CE(ECN-capable Transport)位都标记为1,为以太网数据报文201添加ECN标签,即以太网数据报文202。交换设备通过发送端口2B发送带有ECN标签的以太网数据报文202。
交换设备23通过端口3A接收到以太网数据报文202,确定带有ECN标签则复制以太网数据报文202,从以太网数据报文202的报文描述符中获得接收端口为3A,然后通过软件处理以根据复制的以太网数据报文202进行代答拥塞通告。交换设备23对初始接收到的带有ECN标签的以太网数据报文202进程硬件转发,查找MAC地址对应的发送端口3B,然后将初始接收的以太网数据报文202通过发送端口3B发送到交换设备24。
交换设备23确定收到的带有显示拥塞通知标签的以太网数据报文202的目的MAC地址不是本机的MAC地址,不需要生成CNP报文,而生成代答CNP报文。
交换设备23以复制的以太网数据报文202的源IP地址以及目的IP地址作为代答CNP报文的203的目的IP地址和源IP地址;以本机的MAC地址以及复制的以太网数据报文202的源MAC地址作为代答CNP报文203的源MAC地址和目的MAC地址,基于CNP报文格式填充代答CNP报文203。
交换设备23生成代答CNP报文203,通过获取的以太网数据报文202的接收端口3A发送到交换设备22。
交换设备22收到代答CNP报文203,基于配置的ACL(接入控制列表)表项识别端口2B收到的报文类型为代答CNP报文,则将代答CNP报文203修改为最高发送优先级,查找到目的MAC地址对应的发送端口2A,将代答CNP报文203缓存在对应最高发送优先级的端口2A的队列。
交换设备22发送对应最高发送优先级的端口2A的队列缓存的代答CNP报文203,保证优先转发代答CNP报文到交换设备21。交换设备21基于相同的方式,修改代答CNP报文203为最高发送优先级,优先转发代答CNP报文203到发送端。发送端收到代答CNP报文203,获取flow或QP信息,对出口发生拥塞的队列采取措施降低发送速度。
交换设备24通过端口4A收到以太网数据报文202后,基于上述交换设备23相同方式生成代答CNP报文204,然后通过收到以太网数据报文202的接收端口4A发送到交换设备23,交换设备23和22按上述方式修改代答CNP报文204为最高发送优先级,优先保证代答CNP报文204优先被发送到发送端。发送端再次根据收到的代答CNP报文204对出口发生拥塞的队列采取措施降低发送速度。交换设备24按正常方式,通过以太网数据报文202的目的MAC地址对应的发送端口4B发送以太网数据报文202。
接收端收到以太网数据报文202,确定带有ECN标签且目的MAC地址为本机MAC地址,生成CNP报文,将CNP报文发送到发送端。发送端收到的收到CNP报文,再一次对出口发生拥塞的队列采取措施降低发送速度。
通过图2所示实施例可以看出,即使在拓扑复杂的大型二层网络中,接收端与发送端的转发路径上的交换设备可基于带有ECN标签的以太网数据报文快速触发代答CNP报文的发送,快速通知到发送端降低导致拥塞的以太网数据报文的发送速率,加快缓解RoCE网络拥塞。
图3为本申请提供的拥塞通知设备实施例的示意图。该设备30至少包括:网络接口,交换芯片,CPU以及存储器。交换芯片至少包括接收模块,交换模块、发送模块。处理器通过运行存储器中的处理器可执行指令用以执行代答模块。
交换模块,用于复制收到的带有显示拥塞通知标签的以太网数据报文并发送到代答模块;代答模块,用于获取收到的带有显示拥塞通知标签以太网数据报文的接收端口,基于复制的以太网数据报文生成第一代答拥塞通告报文,并发送到代答模块;发送模块,用于通过接收端口发送第一代答拥塞通告报文。
代答模块用于基于复制的以太网数据报文生成第一代答拥塞通告报文包括:以复制的以太网数据报文的源IP地址以及目的IP地址作为第一代答拥塞通告报文的目的IP地址和源IP地址;以本机的MAC地址以及复制的以太网数据报文的源MAC地址作为第一代答拥塞通告报文的源MAC地址和目的MAC地址;基于拥塞通告报文格式填充第一代答拥塞通告报文。
交换模块用于复制收到的带有显示拥塞通知标签的以太网数据报文之前,还用于确定所述收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址不是本机的MAC地址。
交换模块,还用于查找收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址对应发送端口;发送模块,还用于通过发送端口发送收到的带有显示拥塞通知标签的以太网数据报文。
接收模块,通过接收第二代答拥塞通告报文;交换模块,修改第二代答拥塞通告报文为最高发送优先级,确定对应第二代答拥塞通告报文的目的MAC地址的发送端口,将第二代答拥塞通告报文缓存在其最高发送优先级的队列;发送模块,发送缓存于第二代答拥塞通告报文的发送端口的最高发送优先级的队列的第二代答拥塞通告报文。
以上仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种拥塞通知方法,其特征在于,所述方法包括:
复制收到的带有显示拥塞通知标签的以太网数据报文;
获取所述收到的带有显示拥塞通知标签以太网数据报文的接收端口;
基于复制的以太网数据报文生成第一代答拥塞通告报文;
通过所述接收端口发送所述第一代答拥塞通告报文。
2.根据权利要求1所述的方法,其特征在于,基于复制的以太网数据报文生成第一代答拥塞通告报文包括:
以复制的以太网数据报文的源IP地址以及目的IP地址作为所述第一代答拥塞通告报文的目的IP地址和源IP地址;
以本机的MAC地址以及复制的以太网数据报文的源MAC地址作为所述第一代答拥塞通告报文的源MAC地址和目的MAC地址;
基于拥塞通告报文格式填充所述第一代答拥塞通告报文。
3.根据权利要求1所述的方法,其特征在于,基于复制的以太网数据报文生成第一代答拥塞通告报文之前,所述方法还包括:
确定所述收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址不是本机的MAC地址。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括,
查找所述收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址对应发送端口;
通过所述发送端口发送所述收到的带有显示拥塞通知标签的以太网数据报文。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括,通过所述发送端口接收第二代答拥塞通告报文;
修改所述第二代答拥塞通告报文为最高发送优先级;
确定根据所述第二代答拥塞通告报文的目的MAC地址对应所述接收端口;
通过对应所述最高发送优先级的所述接收端口的队列发送所述第二代答拥塞通告报文。
6.一种拥塞通知设备,其特征在于,所述设备包括:交换模块、代答模块、发送模块;
所述交换模块,用于复制收到的带有显示拥塞通知标签的以太网数据报文并发送到所述代答模块;
所述代答模块,用于获取所述收到的带有显示拥塞通知标签以太网数据报文的接收端口,基于复制的以太网数据报文生成第一代答拥塞通告报文,并发送到所述代答模块;
所述发送模块,用于通过所述接收端口发送所述第一代答拥塞通告报文。
7.根据权利要求6所述的设备,其特征在于,所述代答模块用于基于复制的以太网数据报文生成第一代答拥塞通告报文包括:以复制的以太网数据报文的源IP地址以及目的IP地址作为所述第一代答拥塞通告报文的目的IP地址和源IP地址;以本机的MAC地址以及复制的以太网数据报文的源MAC地址作为所述第一代答拥塞通告报文的源MAC地址和目的MAC地址;基于拥塞通告报文格式填充所述第一代答拥塞通告报文。
8.根据权利要求6所述的设备,其特征在于,所述交换模块用于复制收到的带有显示拥塞通知标签的以太网数据报文之前,还用于确定所述收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址不是本机的MAC地址。
9.根据权利要求6所述的设备,其特征在于,
所述交换模块,还用于查找所述收到的带有显示拥塞通知标签的以太网数据报文的目的MAC地址对应发送端口;
所述发送模块,还用于通过所述发送端口发送所述收到的带有显示拥塞通知标签的以太网数据报文。
10.根据权利要求9所述的设备,其特征在于,所述设备还包括接收模块,
所述接收模块,通过所述发送端口接收第二代答拥塞通告报文;
所述交换模块,根据所述第二代答拥塞通告报文的目的MAC地址对应所述接收端口,修改所述第二代答拥塞通告报文为最高发送优先级,将所述第二代答拥塞通告报文缓存在对应所述最高发送优先级的所述接收端口的队列;
所述发送模块,发送对应所述最高发送优先级的所述接收端口的队列缓存的所述第二代答拥塞通告报文。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210290898.5A CN114745331B (zh) | 2022-03-23 | 2022-03-23 | 一种拥塞通知方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210290898.5A CN114745331B (zh) | 2022-03-23 | 2022-03-23 | 一种拥塞通知方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114745331A true CN114745331A (zh) | 2022-07-12 |
CN114745331B CN114745331B (zh) | 2023-11-07 |
Family
ID=82276251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210290898.5A Active CN114745331B (zh) | 2022-03-23 | 2022-03-23 | 一种拥塞通知方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114745331B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116055416A (zh) * | 2023-03-28 | 2023-05-02 | 新华三工业互联网有限公司 | 应用于长距通信网络场景下传输速率的调整方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188611A (zh) * | 2007-11-21 | 2008-05-28 | 华为技术有限公司 | 拥塞通知方法、系统和节点设备 |
US20110032819A1 (en) * | 2008-01-14 | 2011-02-10 | Paul Schliwa-Bertling | Method and Nodes for Congestion Notification |
US20120063316A1 (en) * | 2010-09-10 | 2012-03-15 | Brocade Communications Systems, Inc. | Congestion notification across multiple layer-2 domains |
CN102594713A (zh) * | 2012-03-29 | 2012-07-18 | 杭州华三通信技术有限公司 | 一种实现显式拥塞通告的方法及设备 |
CN102624723A (zh) * | 2012-03-06 | 2012-08-01 | 杭州华三通信技术有限公司 | 一种实现显式拥塞通告的方法及设备 |
CN105915464A (zh) * | 2016-06-21 | 2016-08-31 | 中南大学 | 一种快速简单的量化拥塞通告方法 |
CN109391560A (zh) * | 2017-08-11 | 2019-02-26 | 华为技术有限公司 | 网络拥塞的通告方法、代理节点及计算机设备 |
WO2022048647A1 (zh) * | 2020-09-03 | 2022-03-10 | 华为技术有限公司 | RoCE网络拥塞控制的方法及相关装置 |
-
2022
- 2022-03-23 CN CN202210290898.5A patent/CN114745331B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188611A (zh) * | 2007-11-21 | 2008-05-28 | 华为技术有限公司 | 拥塞通知方法、系统和节点设备 |
US20110032819A1 (en) * | 2008-01-14 | 2011-02-10 | Paul Schliwa-Bertling | Method and Nodes for Congestion Notification |
US20120063316A1 (en) * | 2010-09-10 | 2012-03-15 | Brocade Communications Systems, Inc. | Congestion notification across multiple layer-2 domains |
CN102624723A (zh) * | 2012-03-06 | 2012-08-01 | 杭州华三通信技术有限公司 | 一种实现显式拥塞通告的方法及设备 |
CN102594713A (zh) * | 2012-03-29 | 2012-07-18 | 杭州华三通信技术有限公司 | 一种实现显式拥塞通告的方法及设备 |
CN105915464A (zh) * | 2016-06-21 | 2016-08-31 | 中南大学 | 一种快速简单的量化拥塞通告方法 |
CN109391560A (zh) * | 2017-08-11 | 2019-02-26 | 华为技术有限公司 | 网络拥塞的通告方法、代理节点及计算机设备 |
WO2022048647A1 (zh) * | 2020-09-03 | 2022-03-10 | 华为技术有限公司 | RoCE网络拥塞控制的方法及相关装置 |
Non-Patent Citations (3)
Title |
---|
K. K. RAMAKRISHNAN;TERAOPTIC NETWORKS;SALLY FLOYD; ACIRI;D. BLACK; EMC; EXPIRES: AUGUST, 2001;: "The Addition of Explicit Congestion Notification (ECN) to IP", IETF * |
MAYUTAN ARUMAITHURAI; RUEDIGER GEIB; RENE REX; XIAOMING FU, 《2009 IEEE 28TH INTERNATIONAL PERFORMANCE COMPUTING AND COMMUNICATIONS CONFERENCE》 * |
郜盛魁;刘凯;张;: "针对ATN over IP方案的明确拥塞通告模型及映射算法", 航空电子技术, no. 02 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116055416A (zh) * | 2023-03-28 | 2023-05-02 | 新华三工业互联网有限公司 | 应用于长距通信网络场景下传输速率的调整方法及装置 |
CN116055416B (zh) * | 2023-03-28 | 2023-05-30 | 新华三工业互联网有限公司 | 应用于长距通信网络场景下传输速率的调整方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114745331B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200280518A1 (en) | Congestion management techniques | |
CN109936510B (zh) | 多路径rdma传输 | |
WO2019134383A1 (zh) | 控制网络拥塞的方法、接入设备和计算机可读存储介质 | |
JP6236933B2 (ja) | 中継装置 | |
WO2021244240A1 (zh) | 网络拥塞的控制方法、装置、设备、系统及存储介质 | |
US20230083441A1 (en) | Managing subpacket transmission and reception for advanced interactive services | |
US9356844B2 (en) | Efficient application recognition in network traffic | |
US9559960B2 (en) | Network congestion management | |
US9742583B2 (en) | Method of data retransmission in collaborative service transmission and access network gateway thereof | |
US10652142B2 (en) | SDN-based ARP implementation method and apparatus | |
EP3018868B1 (en) | Congestion method, device and system | |
JP2005192216A (ja) | トランスポートオフロードエンジンのための再送信システムおよび方法 | |
CN111935031B (zh) | 一种基于ndn架构的流量优化方法及系统 | |
CN106961487B (zh) | 虚拟机热迁移过程中的数据流自适应调整系统及调整方法 | |
CN112104562A (zh) | 拥塞控制方法及装置、通信网络、计算机存储介质 | |
WO2020073907A1 (zh) | 转发表项的更新方法及装置 | |
WO2019192318A1 (zh) | 流量平滑方法、服务器及转发设备 | |
US9344363B2 (en) | Information processing system, relay device, information processing device, and information processing method | |
CN114745331B (zh) | 一种拥塞通知方法及设备 | |
US6988125B2 (en) | Servicing client requests in a network attached storage (NAS)-based network including replicating a client-server protocol in a packet generated by the NAS device | |
CN108924061B (zh) | 一种应用识别及管理方法、系统及相关装置 | |
US20100238930A1 (en) | Router and method of forwarding ipv6 packets | |
JP2003186730A (ja) | 通信制御方法、通信システム、およびコンピュータプログラム | |
CN115866103A (zh) | 一种报文处理方法、装置、智能网卡和服务器 | |
CN107707546A (zh) | 一种报文复制方法及支持报文复制功能的新型网络适配器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |