CN109067752B - 一种利用rdma消息实现兼容tcp/ip协议的方法 - Google Patents

一种利用rdma消息实现兼容tcp/ip协议的方法 Download PDF

Info

Publication number
CN109067752B
CN109067752B CN201810928706.2A CN201810928706A CN109067752B CN 109067752 B CN109067752 B CN 109067752B CN 201810928706 A CN201810928706 A CN 201810928706A CN 109067752 B CN109067752 B CN 109067752B
Authority
CN
China
Prior art keywords
rdmabuf
message
rdma
datasink
datasrc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810928706.2A
Other languages
English (en)
Other versions
CN109067752A (zh
Inventor
陈淑平
李祎
何王全
彭龙根
周慧霖
卢德平
王申
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Jiangnan Computing Technology Institute
Original Assignee
Wuxi Jiangnan Computing Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Jiangnan Computing Technology Institute filed Critical Wuxi Jiangnan Computing Technology Institute
Priority to CN201810928706.2A priority Critical patent/CN109067752B/zh
Publication of CN109067752A publication Critical patent/CN109067752A/zh
Application granted granted Critical
Publication of CN109067752B publication Critical patent/CN109067752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/26Special purpose or proprietary protocols or architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/18Multiprotocol handlers, e.g. single devices capable of handling multiple protocols

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种利用RDMA消息实现兼容TCP/IP协议的方法,该方法利用RDMA消息传输IP数据报文,实现对TCP/IP协议的兼容,可以获得比传统的利用Send/Recv传输IP报文更高的消息性能。本发明通过rdmabuf通告及补充机制,预先分配rdmabuf,以降低消息延迟;通过rdmabuf失效方法,在发送端可以避免使用无效的rdmabuf,在接收端可以节省内存消耗;采用rdmabuf池机制,预先分配rdmabuf,提高rdmabuf的使用效率。

Description

一种利用RDMA消息实现兼容TCP/IP协议的方法
技术领域
本发明涉及高速互连网络领域,尤其涉及一种利用RDMA消息实现兼容TCP/IP协议的方法。
背景技术
在高性能计算、大数据、云计算、人工智能等领域,包括Infiniband在内的高速互连网络得到了越来越多的应用。Infiniband等互连网络通过RDMA(Remote Direct MemoryAccess)技术将用户数据从一个进程地址空间直接拷贝到另一个进程的地址空间,具有数据零拷贝、数据传输旁路操作系统核心等特性,可以获得高带宽、低延迟的消息通信性能。但该类互连网络需要利用Verbs接口进行编程,编程语义和接口跟传统的TCP/IP通信相比极其复杂,影响了用户选用该类网络。为了扩展该类高速互连网络的适用性,很多厂商和组织以该类高速互连网络为底层传输介质,实现了对TCP/IP协议的兼容。在支持TCP/IP协议兼容的系统中,每块网卡都会虚拟出一个以太网设备,用户可以利用标准的Socket接口使用这些网络设备。用户发送数据时,系统会将IP数据报文封装在高速互连网络提供的消息中,通过底层的高速互连网络进行传输,来获得比传统以太网卡高得多的传输性能。目前在高速互连网络中实现TCP/IP协议兼容的方案是:利用Send/Recv消息来封装IP数据报文,通过底层高速互连网络进行传输。例如,Infiniband网络就是通过Send/Recv消息来实现IPoIB的。该方法具有实现简单、IP数据报文两端无需进行控制消息交互等优点。但Send/Recv消息相比RDMA消息,具有较大的开销。并且当硬件支持的Send/Recv消息很小(例如,仅有一个MTU)时,利用Send/Recv消息发送IP数据报文会产生严重的性能开销:(1)当用户发送大量数据时,需要将用户层数据拆分成很多个MTU大小的Send/Recv消息进行发送,从而需要投递大量的发送请求,在发送端产生极大的CPU开销;(2)在接收端,需要频繁投递接收请求,并将小的IP报文向上层传递,产生大量中断,在接收端产生极大的CPU开销。
发明内容
本发明的目的在于通过一种利用RDMA消息实现兼容TCP/IP协议的方法,来解决以上背景技术部分提到的问题。
为达此目的,本发明采用以下技术方案:
一种利用RDMA消息实现兼容TCP/IP协议的方法,其包括:
一、利用RDMA消息传输IP数据报文,具体包括:
a)DataSink预先分配并注册用于接收数据的rdmabuf;
b)DataSrc有数据要发送时,如果数据量小于阈值Tmix_rdma_size,则通过Send/Recv消息进行发送;
c)如果DataSrc待发送数据超过阈值Tmix_rdma_size,则通过RDMA消息进行发送;
d)DataSink预先将rdmabuf信息通告DataSrc;
e)通过RDMA进行发送时,DataSrc直接将数据写入DataSink端的rdmabuf中;然后发送通知告知DataSink数据已写完;
f)接收方公告的每个rdmabuf都有一个有效时间TO,对发送方来说,如果rdmabuf的生存时间超过TO,则认为该缓冲区变为无效;
二、rdmabuf通告方法包括:每个<src_ip,dst_ip>表示一个连接;当DataSrc使用RDMA方式发送IP报文时,如果发现没有可用的Rdmabuf,则向DataSink发送一条ReqMoreRdmaBuf消息;DataSink收到ReqMoreRdmaBuf消息后,分配一定数量的Rdmabuf,并将Rdmabuf列表填入RdmaBufAdvertisement消息,发送给DataSrc;
三、采用BCopy模式、RDMA Write模式两种数据传输机制:BCopy模式采用Send/Recv消息实现,直接传输IP数据报文;RDMA Write模式通过SRDMAW_H实现;RdmaWrCompl消息存放在SRDMAW_H的异步消息中;
四、DataSink检查rdmabuf的数量:(1)当收到ReqMoreRdmaBuf消息时;(2)当收到RdmaWrCompl消息时;如果发现rdmabuf的数量小于阈值Tmin_rdmabuf,则需要补充rdmabuf;
五、rdmabuf阈值设置为Roundup((n×BDP)/MTU),其中n是一个常量,BDP是网络的带宽延迟积,MTU是IP MTU大小,当DataSink端的rdmabuf低于该阈值时,需要补充新的rdmabuf;
六、DataSink维护一个空闲rdmabuf池;预先分配一定数量的空闲rdmabuf;当需要为某个连接补充rdmabuf时,直接从该池中取;如果发现该池中空闲rdmabuf数量少于某个阈值,则启动另外的线程,补充空闲rdmabuf;当处于Pending状态的rdmabuf超时后(DataSrc未使用该rdmabuf),则将该rdmabuf还回rdmabuf池,使其重新处于空闲状态。
特别地,对于接收方,rdmabuf的有效时间不低于2xTO。
特别地,如果DataSrc在规定的时间内未收到DataSink端的应答,则直接丢弃上层网络协议栈发来的IP数据包;如果DataSink不能向DataSrc提供任何新的Rdmabuf,则DataSink不发送任何控制消息;DataSink在未收到新ReqMoreRdmaBuf消息的情况下,可预分配Rdmabuf,并通过RdmaBufAdvertisement消息通知DataSrc。
本发明提出的利用RDMA消息实现兼容TCP/IP协议的方法利用RDMA消息传输IP数据报文,实现对TCP/IP协议的兼容,可以获得比传统的利用Send/Recv传输IP报文更高的消息性能。与Send/Recv消息不同,RDMA支持很大的消息大小,例如,Infiniband可以支持2GB大小的RDMA消息,从而可以通过一次RDMA消息将上层用户数据发送到接收方,降低了收发两端的CPU开销,可以充分利用高速互连网络提供的带宽,实现非常高的性能。本发明通过rdmabuf通告及补充机制,预先分配rdmabuf,以降低消息延迟;通过rdmabuf失效方法,在发送端可以避免使用无效的rdmabuf,在接收端可以节省内存消耗;采用rdmabuf池机制,预先分配rdmabuf,提高rdmabuf的使用效率。
附图说明
图1为本发明实施例提供的控制消息类型表;
图2为本发明实施例提供的Rdmabuf通告方法示意图;
图3为本发明实施例提供的BCopy模式示意图;
图4为本发明实施例提供的RDMA Write模式示意图;
图5A和图5B为本发明实施例提供的DataSrc与DataSink端rdmabuf的组织方式示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容,除非另有定义,本文所使用的所有技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述具体的实施例,不是旨在于限制本发明。
本实施例中利用RDMA消息实现兼容TCP/IP协议的方法包括:
一、利用RDMA消息传输IP数据报文,具体包括:
a)DataSink预先分配并注册用于接收数据的rdmabuf。
b)DataSrc有数据要发送时,如果数据量小于阈值Tmix_rdma_size,则通过Send/Recv消息进行发送。
c)如果DataSrc待发送数据超过阈值Tmix_rdma_size,则通过RDMA消息进行发送。
d)DataSink预先将rdmabuf信息通告DataSrc。
e)通过RDMA进行发送时,DataSrc直接将数据写入DataSink端的rdmabuf中;然后发送通知告知DataSink数据已写完。
f)接收方公告的每个rdmabuf都有一个有效时间TO,对发送方来说,如果rdmabuf的生存时间超过TO,则认为该缓冲区变为无效;在本实施例中对接收方来说,rdmabuf的有效时间应该不低于2xTO。
如图1所示为本实施例提供的控制消息类型表;上述消息都是通过异步消息或带异步通知的单边RDMAW来发送的,每类消息的编码都放在异步消息的立即数中。
二、在本实施例中rdmabuf通告方法具体包括:如图2所示,图中Data Source指IP报文发送方;Data Sink指IP报文接收方;每个<src_ip,dst_ip>表示一个连接;当DataSrc使用RDMA方式发送IP报文时,如果发现没有可用的Rdmabuf,则向DataSink发送一条ReqMoreRdmaBuf消息;DataSink收到ReqMoreRdmaBuf消息后,分配一定数量的Rdmabuf,并将Rdmabuf列表填入RdmaBufAdvertisement消息,发送给DataSrc。
在本实施例中如果DataSrc在规定的时间内未收到DataSink端的应答,则直接丢弃上层网络协议栈发来的IP数据包;如果DataSink不能向DataSrc提供任何新的Rdmabuf,则DataSink不发送任何控制消息;DataSink在未收到新ReqMoreRdmaBuf消息的情况下(例如:发现rdmabuf即将耗尽时),可预分配Rdmabuf,并通过RdmaBufAdvertisement消息通知DataSrc。
三、在本实施例中采用BCopy模式、RDMA Write模式两种数据传输机制。如图3所示,BCopy模式采用Send/Recv消息实现,直接传输IP数据报文。如图4所示,RDMA Write模式通过SRDMAW_H实现;RdmaWrCompl消息存放在SRDMAW_H的异步消息中。由于SRDMAW_H最多可以携带16B的数据,因此每次可以向DataSink方通告2个rdmabuf的完成。
四、在本实施例中Rdmabuf管理方法如下:如图5A和图5B所示,图中Rdmabuf指用于接收IP报文的缓冲区;Va指rdmabuf的虚地址;Mr指rdmabuf的存储句柄;Length指rdmabuf的长度;Timeout指rdmabuf的超时时间。对每个连接来说,每个rdmabuf都有一个唯一的64位编号(例如:可以用rdmabuf的虚地址表示)。DataSrc为每个目的IP维护一个rdmabuf链表,该链表以rdmabuf的过期时间为顺序进行组织。当DataSrc需要通过RDMA方式发送数据时,顺序遍历该链表。如果某个rdmabuf已经过期,则丢弃该rdmabuf,继续向后寻找,直到找到第一个可用的rdmabuf。DataSink以同样的方式为每个源IP维护一个rdmabuf链表。
在本实施例中DataSink补充rdmabuf的时机:在下列情况下,DataSink检查rdmabuf的数量:
(1)当收到ReqMoreRdmaBuf消息时(表示DataSrc端请求新的rdmabuf);
(2)当收到RdmaWrCompl消息时(极有可能有后续包到达);
如果发现rdmabuf的数量小于阈值Tmin_rdmabuf,则需要补充rdmabuf。
在本实施例中针对Rdmabuf阈值Tmin_rdmabuf的大小:
经典的TCP实现中,滑动窗口大小设为W=min(cwnd,awnd),其中cwnd是拥塞窗口大小,awnd是接收方通告的窗口大小。TCP发送端根据网络拥塞程度、接收端可用缓冲区大小等因素调整滑动窗口大小。TCP方并不能精确确定网络拥塞程度,需要根据丢包、延迟等推断cwnd的大小;理想的窗口大小为网络带宽延迟积。网络带宽延迟积(bandwidth-delayproduct,BDP)是网络带宽与延迟的乘积,表示任意时刻一条通路上的正在传输的数据量。Rdmabuf如果太小,则在进行成块数据的传输时,Rdmabuf很容易耗尽,从而造成DataSrc等待DataSink分配rdmabuf的情况,导致性能下降。Rdmabuf如果太大,则会造成内存的浪费。
rdmabuf阈值Tmin_rdmabuf设置为Roundup((n×BDP)/MTU),其中n是一个常量,BDP是网络的带宽延迟积,MTU是IP MTU大小,当DataSink端的rdmabuf低于该阈值时,需要补充新的rdmabuf。例如,MTU为64KB,链路速率为28Gbpsx4,64KB消息最小延迟为15μsec,n设为4时,Tmin_rdmabuf设为14。
在本实施例中针对Rdmabuf池,为了提高性能,DataSink维护一个空闲rdmabuf池。每个rdmabuf处于3种状态之一:(1)、Free:该rdmabuf未被任何连接使用;(2)、Pending:该rdmabuf已分配给某个连接使用,正在等待DataSrc写入数据;(3)、Finishing:该rdmabuf已被DataSrc写入数据,可以传递给上层网络协议栈处理。
在本实施例中Rdmabuf池的工作机制如下:(1)预先分配一定数量的空闲rdmabuf;(2)当需要为某个连接补充rdmabuf时,直接从该池中取;如果发现该池中空闲rdmabuf数量少于某个阈值,则启动另外的线程,补充空闲rdmabuf;(3)当处于Pending状态的rdmabuf超时后(DataSrc未使用该rdmabuf),则将该rdmabuf还回rdmabuf池,使其重新处于空闲状态。
本发明的技术方案利用RDMA消息传输IP数据报文,实现对TCP/IP协议的兼容,可以获得比传统的利用Send/Recv传输IP报文更高的消息性能。与Send/Recv消息不同,RDMA支持很大的消息大小,例如,Infiniband可以支持2GB大小的RDMA消息,从而可以通过一次RDMA消息将上层用户数据发送到接收方,降低了收发两端的CPU开销,可以充分利用高速互连网络提供的带宽,实现非常高的性能。本发明通过rdmabuf通告及补充机制,预先分配rdmabuf,以降低消息延迟;通过rdmabuf失效方法,在发送端可以避免使用无效的rdmabuf,在接收端可以节省内存消耗;采用rdmabuf池机制,预先分配rdmabuf,提高rdmabuf的使用效率。
本领域普通技术人员可以理解实现上述实施例中的全部部分是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (3)

1.一种利用RDMA消息实现兼容TCP/IP协议的方法,其特征在于,包括:
一、利用RDMA消息传输IP数据报文,具体包括:
a)DataSink预先分配并注册用于接收数据的rdmabuf;
b)DataSrc有数据要发送时,如果数据量小于阈值Tmix_rdma_size,则通过Send/Recv消息进行发送;
c)如果DataSrc待发送数据超过阈值Tmix_rdma_size,则通过RDMA消息进行发送;
d)DataSink预先将rdmabuf信息通告DataSrc;
e)通过RDMA进行发送时,DataSrc直接将数据写入DataSink端的rdmabuf中;然后发送通知告知DataSink数据已写完;
f)接收方公告的每个rdmabuf都有一个有效时间TO,对发送方来说,如果rdmabuf的生存时间超过TO,则认为该缓冲区变为无效;
二、rdmabuf通告方法包括:每个<src_ip,dst_ip>表示一个连接;当DataSrc使用RDMA方式发送IP报文时,如果发现没有可用的Rdmabuf,则向DataSink发送一条ReqMoreRdmaBuf消息;DataSink收到ReqMoreRdmaBuf消息后,分配一定数量的Rdmabuf,并将Rdmabuf列表填入RdmaBufAdvertisement消息,发送给DataSrc;
三、采用BCopy模式、RDMA Write模式两种数据传输机制:BCopy模式采用Send/Recv消息实现,直接传输IP数据报文;RDMA Write模式通过SRDMAW_H实现;RdmaWrCompl消息存放在SRDMAW_H的异步消息中;
四、DataSink检查rdmabuf的数量:(1)当收到ReqMoreRdmaBuf消息时;(2)当收到RdmaWrCompl消息时;如果发现rdmabuf的数量小于阈值Tmin_rdmabuf,则需要补充rdmabuf;
五、rdmabuf阈值设置为Roundup((n×BDP)/MTU),其中n是一个常量,BDP是网络的带宽延迟积,MTU是IP MTU大小,当DataSink端的rdmabuf低于该阈值时,需要补充新的rdmabuf;
六、DataSink维护一个空闲rdmabuf池;预先分配一定数量的空闲rdmabuf;当需要为某个连接补充rdmabuf时,直接从该池中取;如果发现该池中空闲rdmabuf数量少于某个阈值,则启动另外的线程,补充空闲rdmabuf;当处于Pending状态的rdmabuf超时后,则将该rdmabuf还回rdmabuf池,使其重新处于空闲状态。
2.根据权利要求1所述的利用RDMA消息实现兼容TCP/IP协议的方法,其特征在于,对于接收方,rdmabuf的有效时间不低于2xTO。
3.根据权利要求1或2任一项所述的利用RDMA消息实现兼容TCP/IP协议的方法,其特征在于,如果DataSrc在规定的时间内未收到DataSink端的应答,则直接丢弃上层网络协议栈发来的IP数据包;如果DataSink不能向DataSrc提供任何新的Rdmabuf,则DataSink不发送任何控制消息;DataSink在未收到新ReqMoreRdmaBuf消息的情况下,可预分配Rdmabuf,并通过RdmaBufAdvertisement消息通知DataSrc。
CN201810928706.2A 2018-08-15 2018-08-15 一种利用rdma消息实现兼容tcp/ip协议的方法 Active CN109067752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810928706.2A CN109067752B (zh) 2018-08-15 2018-08-15 一种利用rdma消息实现兼容tcp/ip协议的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810928706.2A CN109067752B (zh) 2018-08-15 2018-08-15 一种利用rdma消息实现兼容tcp/ip协议的方法

Publications (2)

Publication Number Publication Date
CN109067752A CN109067752A (zh) 2018-12-21
CN109067752B true CN109067752B (zh) 2021-03-26

Family

ID=64686763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810928706.2A Active CN109067752B (zh) 2018-08-15 2018-08-15 一种利用rdma消息实现兼容tcp/ip协议的方法

Country Status (1)

Country Link
CN (1) CN109067752B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112350842B (zh) * 2019-08-08 2023-04-07 深圳致星科技有限公司 一种重置分布式训练任务训练过程中数据传输网络的方法
CN111404842B (zh) * 2019-12-11 2024-04-09 杭州海康威视系统技术有限公司 数据传输方法、装置及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409715A (zh) * 2008-10-22 2009-04-15 中国科学院计算技术研究所 一种利用InfiniBand网络进行通信的方法及系统
CN101699797A (zh) * 2009-11-13 2010-04-28 珠海网博信息科技有限公司 使用udp协议进行数据传输的方法
CN102404212A (zh) * 2011-11-17 2012-04-04 曙光信息产业(北京)有限公司 一种基于InfiniBand网络的跨平台RDMA通信方法
CN103645994A (zh) * 2013-11-05 2014-03-19 华为技术有限公司 一种数据处理方法及设备
CN107508828A (zh) * 2017-09-18 2017-12-22 南京斯坦德云科技股份有限公司 一种超远程数据交互系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7298749B2 (en) * 2004-01-07 2007-11-20 International Business Machines Corporation Completion coalescing by TCP receiver
WO2007139426A1 (en) * 2006-05-31 2007-12-06 Intel Corporation Multiple phase buffer enlargement for rdma data transfer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101409715A (zh) * 2008-10-22 2009-04-15 中国科学院计算技术研究所 一种利用InfiniBand网络进行通信的方法及系统
CN101699797A (zh) * 2009-11-13 2010-04-28 珠海网博信息科技有限公司 使用udp协议进行数据传输的方法
CN102404212A (zh) * 2011-11-17 2012-04-04 曙光信息产业(北京)有限公司 一种基于InfiniBand网络的跨平台RDMA通信方法
CN103645994A (zh) * 2013-11-05 2014-03-19 华为技术有限公司 一种数据处理方法及设备
CN107508828A (zh) * 2017-09-18 2017-12-22 南京斯坦德云科技股份有限公司 一种超远程数据交互系统及方法

Also Published As

Publication number Publication date
CN109067752A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
TWI332150B (en) Processing data for a tcp connection using an offload unit
US7720063B2 (en) Method apparatus and system for accelerated communication
US9331955B2 (en) Transporting operations of arbitrary size over remote direct memory access
US6747949B1 (en) Register based remote data flow control
CN101040489B (zh) 用于统一输入/输出和降低延迟的网络设备体系结构
US8090859B2 (en) Decoupling TCP/IP processing in system area networks with call filtering
CN109088892A (zh) 数据传输方法、系统以及代理服务器
US7139268B1 (en) Performance of intermediate nodes with flow splicing
US10164870B2 (en) Relaxed ordering network
US8072886B2 (en) Method and system for transmission control protocol (TCP) traffic smoothing
US20120140621A1 (en) Incast Congestion Control in a Network
US8605578B1 (en) System and method for handling of destination host side congestion
TW201251374A (en) Link layer reservation of switch queue capacity
CN109067752B (zh) 一种利用rdma消息实现兼容tcp/ip协议的方法
US20130212280A1 (en) Aggregate transport control
US8539089B2 (en) System and method for vertical perimeter protection
US8862682B2 (en) Accelerated sockets
US11720413B2 (en) Systems and methods for virtualizing fabric-attached storage devices
US9590909B2 (en) Reducing TCP timeouts due to Incast collapse at a network switch
CN111416775B (zh) 数据接收和发送方法、装置及系统
US11886938B2 (en) Message communication between integrated computing devices
CN111274195B (zh) Rdma网络流控方法、装置及计算机可读存储介质
WO2018142866A1 (ja) 転送装置、転送方法及びプログラム
Pinkerton Sockets Direct Protocol v1. 0 RDMA Consortium
KR102184363B1 (ko) 네트워크 커넥터의 호스트 및 클라이언트와의 통신 방법, 그리고 동일 방법을 수행하는 네트워크 커넥터

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant