CN116582492B - 优化rdma读取的拥塞控制方法、系统及存储介质 - Google Patents

优化rdma读取的拥塞控制方法、系统及存储介质 Download PDF

Info

Publication number
CN116582492B
CN116582492B CN202310862785.2A CN202310862785A CN116582492B CN 116582492 B CN116582492 B CN 116582492B CN 202310862785 A CN202310862785 A CN 202310862785A CN 116582492 B CN116582492 B CN 116582492B
Authority
CN
China
Prior art keywords
response
window value
message
read
send
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310862785.2A
Other languages
English (en)
Other versions
CN116582492A (zh
Inventor
修强
邬旭永
黎立印
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Xingyun Zhilian Technology Co Ltd
Original Assignee
Zhuhai Xingyun Zhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Xingyun Zhilian Technology Co Ltd filed Critical Zhuhai Xingyun Zhilian Technology Co Ltd
Priority to CN202310862785.2A priority Critical patent/CN116582492B/zh
Publication of CN116582492A publication Critical patent/CN116582492A/zh
Application granted granted Critical
Publication of CN116582492B publication Critical patent/CN116582492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17306Intercommunication techniques
    • G06F15/17331Distributed shared memory [DSM], e.g. remote direct memory access [RDMA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种优化RDMA读取的拥塞控制方法、系统及存储介质,所述方法包括:向响应侧发送SEND或WRITE请求报文;接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。本申请提供的技术方案具有提高网络性能的优点。

Description

优化RDMA读取的拥塞控制方法、系统及存储介质
技术领域
本发明涉及数据中心领域,具体涉及一种优化RDMA读取的拥塞控制方法、系统及存储介质。
背景技术
数据中心网络中计算机可以通过远程直接内存访问 (Remote Direct MemoryAccess,简称:RDMA)进行数据交换,从而使计算机的网络接口卡(Network InterfaceCard,简称NIC)通过网络从另外一个计算机的内存读取或者向另外一个计算机的内存写入数据,而不需要计算机的操作系统介入。RDMA在以太网上运行称为RDMA穿越汇聚以太网(RDMA over Converged Ethernet,RoCE)技术。
RDMA的操作类型主要有RDMA SEND(告知)、WRITE(写入)和READ(读取)三种,现有的流控方案采用接收业务ACK的时间和频率来控制网卡发送方向SEND和WRITE请求的速率的方式存在算法误识别问题,如果发送在请求端网卡发送SEND和WRITE请求之前发送了一个需读取大量数据的READ请求,响应端网卡会一直回复READ RESP响应报文,直到READRESP响应报文发送完成后才会发送后接收到的SEND和WRITE请求报文的确认ACK报文(因为ACK报文为普通优先级的报文,需要进行排队,即排列在READ RESP响应报文之后),此时,在请求端网卡看来是长时间接收不到业务ACK报文导致算法在其发送侧网络路径并不拥塞的情况下限制发送SEND和WRITE请求的速率,进而产生带宽利用率的损失。
发明内容
本发明实施例提供了一种优化RMDA读取的拥塞控制方法、系统及存储介质,可以避免响应报文的排队,不会产生算法误识别,提高网络流畅度。
第一方面,本发明实施例提供一种优化RMDA读取的拥塞控制方法,所述方法包括如下步骤:
向响应侧发送SEND或WRITE请求报文;
接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。
第二方面,提供一种优化RMDA读取的拥塞控制方法,所述方法包括如下步骤:
接收请求侧SEND或WRITE请求报文;
统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的第一响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级。
第三方面,提供一种请求侧设备,所述请求侧设备包括:
通信单元,用于向响应侧发送SEND或WRITE请求报文,接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
处理单元,用于接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;
通信单元,用于按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。
第四方面,提供一种优化RMDA读取的拥塞控制系统,所述系统包括请求侧设备和响应侧设备:
请求侧设备,用于向响应侧发送SEND或WRITE请求报文;
响应侧设备,用于接收请求侧SEND或WRITE请求报文;统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的第一响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
请求侧设备,用于依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。
第五方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面或第二方面提供的方法。
实施本发明实施例,具有如下有益效果:
本申请提供的技术方案采用高优先级HPACK报文控制SEND/WRITE请求报文流量(即第一窗口值),无算法误识别问题,且与业务本身解耦,简化CC方案,更具扩展性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一种DMA的请求示意图;
图2是一种优化RMDA读取的拥塞控制方法的流程示意图;
图3是本申请提供的RDMA READ请求的流程示意图 ;
图4是一种请求侧设备的结构示意图;
图5是本申请提供的一种优化RMDA读取的拥塞控制系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面介绍下本申请涉及的概念。
DMA:Direct Memory Access直接存储器访问;
WQE:Work Queue Element;工作队列元素;
CQE:Completion Queue Entry;完成队列条目;
DMA Len:DMA Length;远程DMA操作的字节长度;
incast现象是指,多打一的通信模式中,例如请求侧网卡向多个响应侧网卡发送RDMA READ请求,多个响应侧网卡同时回复单张请求侧网卡的RDMA READ请求时会出现的现象称为incast现象。
参阅图1,图1为一种DMA的请求示意图,其中网卡A为请求侧,网卡B为响应侧,如图1所示,网卡A发送SEND/WRITE请求,网卡B发送ACK响应,网卡A发送READ请求,网卡B发送READ RESP响应。请求侧网卡A发送的SEND/WRITE请求报文,请求侧网卡A发送的SEND/WRITE请求报文,引发网卡A至网卡B路径的流量增加,可能造成网卡A至网卡B路径拥塞;请求侧网卡A发送的READ请求报文,引发网卡B至网卡A路径的流量增加,可能造成网卡B至网卡A路径拥塞。
参阅图2,图2提供了一种优化RMDA读取的拥塞控制方法的流程示意图,如图2所示,该方法在网卡A和网卡B之间完成,其中网卡A为请求侧,网卡B为响应侧,该方法如图2所示,包括如下步骤:
步骤S200、网卡A向网卡B发送SEND或WRITE请求报文;
步骤S201、网卡B接收SEND或WRITE请求报文,并统计接收到的SEND或WRITE请求报文内包含的payload(有效载荷)的数量x,若数量x超过数量阈值,网卡B向网卡A发送第一响应报文,该第一响应报文的优先级高于SEND或WRITE请求报文对应的ACK报文的优先级;
示例的,上述第一响应报文具体可以包括:HPACK响应报文,当然在实际应用中,也可以添加一个新的响应报文,该新的响应报文(TPACK响应报文)的优先级高于ACK报文的优先级。
步骤S202、网卡A接收到第一响应报文,网卡A依据接收到HPACK响应报文时间或速率调整能够发送的SEND/WRITE请求报文的第一窗口值;
步骤S203、按第一窗口值发送SEND/WRITE请求报文,网卡A接收到ACK报文(即业务ACK报文,具体可以为:SEND/WRITE请求报文的ACK报文)后,上报CQE。
本申请提供的技术方案采用高优先级HPACK报文控制SEND/WRITE请求报文流量,无算法误识别问题,且与业务本身解耦,简化CC方案,更具扩展性。
示例的,上述方法还可以包括如图3所示的方法步骤,图3为本申请提供的RDMAREAD请求的流程示意图,如图3所示,该方法包括如下步骤 :
步骤S301、网卡A按第一窗口值发送RDMA READ请求;
步骤S302、网卡B向网卡A回复 READ RESP响应报文;
步骤S303、网卡A根据接收READ RESP响应包时间或速率得到第二窗口值,即可接收的READ RESP响应报文窗口值(即第二窗口值);
步骤S304、网卡A将该READ RESP响应报文窗口值(第二窗口值)转换为可发送的READ请求报文指代的需回复的READ RESP响应包报文窗口值(即第三窗口值);
步骤S305、网卡A按该第三窗口值对READ WQE拆分成多个子报文,将该多个子报文发送给网卡B;
示例的,上述网卡A按该第三窗口值对READ WQE拆分成多个子报文的方式本申请可以不限定,只需要网卡A按该第三窗口值对READ WQE拆分多个子报文即可,例如可以平均拆分,比如第三窗口值为500KB,则可以平均拆分成5个100KB,即5个子报文,每个子报文对应100KB,当然也可以不均匀拆分,例如拆分成3个报文,前2个子报文每个200KB,最后一个100KB,本申请并不限制上述拆分的具体方式。
示例的,上述网卡A按该第三窗口值对READ WQE拆分成多个子报文还可以包括:
网卡A拥塞控制算法单元计算出当前期望响应侧回复的READ RESP报文长度,对READ请求WQE拆分成多个子报文,每个子报文的长度为该当前期望响应侧回复的READ RESP报文长度。
示例的,上述将该多个子报文发送给网卡B具体可以包括:
网卡A将该多个子报文逐一发送给网卡B,每发送一个子报文,记录一个子报文的请求包信息,该请求包信息用于验证响应侧返回的响应子报文是否正确。
示例的,上述将该多个子报文发送给网卡B具体可以包括:
网卡A将该多个子报文逐一发送给网卡B,在网卡A发送最后一个子报文时,将最后一个子报告设置特殊标记(例如标记置1),该特殊标记用于确定是否完成一个完整的READ请求WQE。
步骤S306、网卡B逐一回复该多个子报文对应的多个响应子报文READ RESP;
步骤S307、网卡A接收并聚合多个响应子报文READ RESP并确定接收到一个完整的READ请求WQE后,上报CQE。
如图3所示的流程图中,请求端网卡通过拆分RDMA READ WQE的方式,控制请求端发送READ请求大小(即期望响应端回复的READ RESP报文长度和个数)及READ请求频率的方式来细粒度调整响应端网卡回复READ RESP报文速率。此方案具有三个优点:1)实现在请求端控制READ RESP响应报文速率,即在请求侧网卡依据其接收能够释放RDMA READ请求的窗口,进而避免READ RESP的incast现象;2)对READ WQE大小进行拆分,实现READ RESP响应报文速率的细粒度控制;3)利用业务报文自身完成CC,无需增加新种类的报文。
示例的,上述方法还可以包括:
网卡A通过请求包信息确定该请求包信息对应的第i子报文发送错误时,网卡A将该第i子报文以及第i子报文之后的子报文全部重传给网卡B。
此技术方案在单一子报文发生错误时,对后续的子报文均进行重传,这样能够提高报文的准确性。
参阅图4,图4提供了一种请求侧设备,请求侧设备包括:
通信单元401,用于向响应侧发送SEND或WRITE请求报文,接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
处理单元402,用于接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;
通信单元401,用于按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。
通信单元401,还用于按第一窗口值向响应侧发送RDMA READ请求,接收响应侧返回的READ RESP响应报文;
处理单元402,用于依据所述READ RESP响应报文的时间或速率得到第二窗口值,将所述第二窗口值转换为第三窗口值,所述第二窗口值为接收的READ RESP响应报文窗口值;所述第三窗口值为发送的READ请求报文指代的需回复的READ RESP响应报文窗口值;按所述第三窗口值对READ WQE拆分成多个子报文;
通信单元401,用于将该多个子报文发送给响应侧,接收响应侧逐一回复的所述多个子报文对应的多个响应子报文;接收并聚合多个响应子报文并确定接收到一个完整的READ请求WQE后,上报完成队列条目CQE。
参阅图5,图5提供一种优化RMDA读取的拥塞控制系统,所述系统包括请求侧设备501和响应侧设备502:
请求侧设备,用于向响应侧发送SEND或WRITE请求报文;
响应侧设备,用于接收请求侧SEND或WRITE请求报文;统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的第一响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
请求侧设备,用于依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE。
上述请求侧设备还可以用于执行请求侧的方法步骤,上述响应侧设备可以用于执行响应侧的方法步骤,具体的实现步骤可以参见如图2或如图3所示方法实施例中的描述,这里不再赘述。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种优化RMDA读取的拥塞控制方法的部分或全部步骤。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种优化RMDA读取的拥塞控制方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以接收其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory ,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种优化RDMA读取的拥塞控制方法,其特征在于,所述方法包括如下步骤:
向响应侧发送SEND或WRITE请求报文;
接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE;
按第一窗口值向响应侧发送RDMA READ请求,接收响应侧返回的READ RESP响应报文;
依据所述READ RESP响应报文的时间或速率得到第二窗口值,将所述第二窗口值转换为第三窗口值,所述第二窗口值为接收的READ RESP响应报文窗口值;所述第三窗口值为发送的READ请求报文指代的需回复的READ RESP响应报文窗口值;
按所述第三窗口值对READ WQE拆分成多个子报文,将该多个子报文发送给响应侧,接收响应侧逐一回复的所述多个子报文对应的多个响应子报文;
接收并聚合多个响应子报文并确定接收到一个完整的READ请求WQE后,上报完成队列条目CQE。
2.根据权利要求1所述的方法,其特征在于,
所述第一响应报文为:高优先级HPACK报文。
3.一种优化RMDA读取的拥塞控制方法,其特征在于,所述方法包括如下步骤:
接收请求侧SEND或WRITE请求报文;
统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的第一响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
接收请求侧按第一窗口值发送的RDMA READ请求,向请求侧返回READ RESP响应报文;所述第一窗口值为请求侧依据第一响应报文时间或速率调整能够发送的SEND/WRITE请求报文的窗口值;
接收请求侧发送的多个子报文,向请求侧逐一回复所述多个子报文的响应子报文;所述多个子报文为按第三窗口值对READ WQE拆分成的多个子报文,所述第三窗口值为依据第二窗口值转换的窗口值,所述第二窗口值为依据所述READ RESP响应报文的时间或速率得到的窗口值;所述第三窗口值为发送的READ请求报文指代的需回复的READ RESP响应报文窗口值。
4.根据权利要求3所述的方法,其特征在于,
所述第一响应报文为:高优先级HPACK报文。
5.一种请求侧设备,其特征在于,所述请求侧设备包括:
通信单元,用于向响应侧发送SEND或WRITE请求报文,接收响应侧发送的第一响应报文,所述第一响应报文为响应侧统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
处理单元,用于接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;
通信单元,用于按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE;
通信单元,还用于按第一窗口值向响应侧发送RDMA READ请求,接收响应侧返回的READRESP响应报文;
处理单元,用于依据所述READ RESP响应报文的时间或速率得到第二窗口值,将所述第二窗口值转换为第三窗口值,所述第二窗口值为接收的READ RESP响应报文窗口值;所述第三窗口值为发送的READ请求报文指代的需回复的READ RESP响应报文窗口值;按所述第三窗口值对READ WQE拆分成多个子报文;
通信单元,用于将该多个子报文发送给响应侧,接收响应侧逐一回复的所述多个子报文对应的多个响应子报文;
接收并聚合多个响应子报文并确定接收到一个完整的READ请求WQE后,上报完成队列条目CQE。
6.根据权利要求5所述的请求侧设备,其特征在于,所述
所述第一响应报文为:高优先级HPACK报文。
7.一种优化RMDA读取的拥塞控制系统,其特征在于,所述系统包括请求侧设备和响应侧设备:
请求侧设备,用于向响应侧发送SEND或WRITE请求报文;
响应侧设备,用于接收请求侧SEND或WRITE请求报文;统计接收到的SEND或WRITE请求报文内包含的payload的数量x,若数量x超过数量阈值时发送的第一响应报文,所述第一响应报文的优先级大于该SEND或WRITE请求报文对应的ACK报文的优先级;
请求侧设备,用于依据接收到第一响应报文时间或速率,调整能够发送的SEND/WRITE请求报文的第一窗口值;按第一窗口值发送SEND/WRITE请求报文,上报SEND/WRITE请求的CQE;
请求侧设备,用于按第一窗口值向响应侧发送RDMA READ请求,接收响应侧返回的READRESP响应报文;依据所述READ RESP响应报文的时间或速率得到第二窗口值,将所述第二窗口值转换为第三窗口值,所述第二窗口值为接收的READ RESP响应报文窗口值;所述第三窗口值为发送的READ请求报文指代的需回复的READ RESP响应报文窗口值;按所述第三窗口值对READ WQE拆分成多个子报文,将该多个子报文发送给响应侧,接收响应侧逐一回复的所述多个子报文对应的多个响应子报文;接收并聚合多个响应子报文并确定接收到一个完整的READ请求WQE后,上报完成队列条目CQE。
8.一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行如权利要求1-2任意一项所述的方法或如权利要求3-4任意一项所述的方法。
CN202310862785.2A 2023-07-14 2023-07-14 优化rdma读取的拥塞控制方法、系统及存储介质 Active CN116582492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310862785.2A CN116582492B (zh) 2023-07-14 2023-07-14 优化rdma读取的拥塞控制方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310862785.2A CN116582492B (zh) 2023-07-14 2023-07-14 优化rdma读取的拥塞控制方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN116582492A CN116582492A (zh) 2023-08-11
CN116582492B true CN116582492B (zh) 2023-09-26

Family

ID=87536459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310862785.2A Active CN116582492B (zh) 2023-07-14 2023-07-14 优化rdma读取的拥塞控制方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN116582492B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116760783B (zh) * 2023-08-16 2023-10-27 沐曦集成电路(上海)有限公司 一种均衡读数据的系统
CN116760779A (zh) * 2023-08-21 2023-09-15 珠海星云智联科技有限公司 网络拥塞控制方法、系统、存储介质和电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016971B1 (en) * 1999-05-24 2006-03-21 Hewlett-Packard Company Congestion management in a distributed computer system multiplying current variable injection rate with a constant to set new variable injection rate at source node
CN109067663A (zh) * 2018-07-16 2018-12-21 广发证券股份有限公司 一种针对应用程序内控制请求响应速率的系统和方法
CN109815204A (zh) * 2018-12-10 2019-05-28 清华大学 一种基于拥塞感知的元数据请求分发方法及设备
CN109981480A (zh) * 2017-12-27 2019-07-05 华为技术有限公司 一种数据传输方法及第一设备
CN109995664A (zh) * 2017-12-29 2019-07-09 华为技术有限公司 一种发送数据流的方法、设备和系统
CN111400212A (zh) * 2019-09-29 2020-07-10 杭州海康威视系统技术有限公司 一种基于远程直接数据存取的传输方法、设备
CN111817977A (zh) * 2019-04-12 2020-10-23 华为技术有限公司 一种网络拥塞控制方法和装置
CN114490462A (zh) * 2020-10-28 2022-05-13 华为技术有限公司 网络接口卡、控制器、存储装置和报文发送方法
CN114584492A (zh) * 2022-02-15 2022-06-03 珠海星云智联科技有限公司 一种延时测量方法、系统以及相关设备
CN114979002A (zh) * 2021-02-23 2022-08-30 华为技术有限公司 一种流量控制方法和流量控制装置
WO2022179417A1 (zh) * 2021-02-24 2022-09-01 华为技术有限公司 网络接口卡、消息收发方法和存储装置
CN115002047A (zh) * 2022-05-20 2022-09-02 北京百度网讯科技有限公司 一种远程直接数据存取方法、装置、设备以及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090150536A1 (en) * 2007-12-05 2009-06-11 Microsoft Corporation Application layer congestion control
US9276866B2 (en) * 2012-11-30 2016-03-01 Microsoft Technology Licensing, Llc Tuning congestion notification for data center networks
US11418446B2 (en) * 2018-09-26 2022-08-16 Intel Corporation Technologies for congestion control for IP-routable RDMA over converged ethernet
US20220078119A1 (en) * 2020-12-17 2022-03-10 Intel Corporation Network interface device with flow control capability
US20220103479A1 (en) * 2021-12-08 2022-03-31 Intel Corporation Transmit rate based on detected available bandwidth

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7016971B1 (en) * 1999-05-24 2006-03-21 Hewlett-Packard Company Congestion management in a distributed computer system multiplying current variable injection rate with a constant to set new variable injection rate at source node
CN109981480A (zh) * 2017-12-27 2019-07-05 华为技术有限公司 一种数据传输方法及第一设备
CN109995664A (zh) * 2017-12-29 2019-07-09 华为技术有限公司 一种发送数据流的方法、设备和系统
CN109067663A (zh) * 2018-07-16 2018-12-21 广发证券股份有限公司 一种针对应用程序内控制请求响应速率的系统和方法
CN109815204A (zh) * 2018-12-10 2019-05-28 清华大学 一种基于拥塞感知的元数据请求分发方法及设备
CN111817977A (zh) * 2019-04-12 2020-10-23 华为技术有限公司 一种网络拥塞控制方法和装置
CN111400212A (zh) * 2019-09-29 2020-07-10 杭州海康威视系统技术有限公司 一种基于远程直接数据存取的传输方法、设备
CN114490462A (zh) * 2020-10-28 2022-05-13 华为技术有限公司 网络接口卡、控制器、存储装置和报文发送方法
CN114979002A (zh) * 2021-02-23 2022-08-30 华为技术有限公司 一种流量控制方法和流量控制装置
WO2022179417A1 (zh) * 2021-02-24 2022-09-01 华为技术有限公司 网络接口卡、消息收发方法和存储装置
CN114584492A (zh) * 2022-02-15 2022-06-03 珠海星云智联科技有限公司 一种延时测量方法、系统以及相关设备
CN115002047A (zh) * 2022-05-20 2022-09-02 北京百度网讯科技有限公司 一种远程直接数据存取方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN116582492A (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN116582492B (zh) 优化rdma读取的拥塞控制方法、系统及存储介质
CN116566921B (zh) 远程直接内存访问读取的拥塞控制方法、系统及存储介质
CN107835040B (zh) 一种基于蓝牙的数据通讯的方法、设备及存储介质
US11558302B2 (en) Data transmission method and apparatus
CN111817977B (zh) 一种网络拥塞控制方法和装置
EP2978171B1 (en) Communication method, communication device, and communication program
US8599734B1 (en) TCP proxy acknowledgements
CN104320809A (zh) 基于rtt的无线多跳网络拥塞控制方法及系统
CN109525376B (zh) 快速重传方法、装置及终端设备
CN110831010A (zh) 一种多通道数据发送及接收方法及装置和数据传输系统
US10601722B2 (en) Method and device for dynamically managing the message retransmission delay on an interconnection network
CN103684707A (zh) 服务端、用户端消息传输处理方法、消息传输方法及系统
CN115037700A (zh) 一种复杂网络数据包传送方法、系统、终端及存储介质
CN114124830B (zh) 一种面向数据中心多应用场景的rdma服务质量保证方法及系统
CN102299777A (zh) 数据重传方法及装置
CA2848459A1 (en) Method of controlling congestion for contention access network
CN101944983A (zh) 用于在通信网络中发送和接收管理消息的方法及系统
US9544401B2 (en) Device and method for data communication using a transmission ring buffer
CN115344405A (zh) 一种数据处理方法、网络接口卡、电子设备及存储介质
CN112468513B (zh) 一种企业网的终端管理通信方法
CN114337942A (zh) 一种报文重传方法、装置及电子设备
US20200067845A1 (en) Mobile packet data rate control based on radio load and other measures
US9794930B1 (en) Method and apparatus for packet data unit processing for retransmission
CN110289937B (zh) 延迟响应方未就绪否定应答
CN113300874B (zh) 网络性能检测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant