CN112261142B - 一种rdma网络的数据重传方法、装置及fpga - Google Patents

一种rdma网络的数据重传方法、装置及fpga Download PDF

Info

Publication number
CN112261142B
CN112261142B CN202011147327.3A CN202011147327A CN112261142B CN 112261142 B CN112261142 B CN 112261142B CN 202011147327 A CN202011147327 A CN 202011147327A CN 112261142 B CN112261142 B CN 112261142B
Authority
CN
China
Prior art keywords
command
current
retransmission
data transmission
data corresponding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011147327.3A
Other languages
English (en)
Other versions
CN112261142A (zh
Inventor
张翔宇
刘钧锴
阚宏伟
王江为
韩海跃
赵坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN202011147327.3A priority Critical patent/CN112261142B/zh
Publication of CN112261142A publication Critical patent/CN112261142A/zh
Application granted granted Critical
Publication of CN112261142B publication Critical patent/CN112261142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/32Flow control; Congestion control by discarding or delaying data units, e.g. packets or frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Communication Control (AREA)

Abstract

本发明公开了一种RDMA网络的数据重传方法、装置、FPGA及计算机可读存储介质,该方法包括:根据获取的数据传输命令,配置第一命令队列和第二命令队列;利用重传响应线程,在检测到目标重传命令时,生成重读中断;利用读响应线程传输当前命令对应的数据时,若检测到重读中断,则暂停发送当前命令对应的数据,并发送目标重传命令对应的数据;在目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据;本发明利用第一命令队列和第二命令队列的双命令队列设置,使RDMA响应端能够优先处理因以太网丢包造成的重传命令,从而保证了每个命令的实时响应性能,减少了丢失数据的重传耗时,降低了系统延时。

Description

一种RDMA网络的数据重传方法、装置及FPGA
技术领域
本发明涉及云计算技术领域,特别涉及一种RDMA网络的数据重传方法、装置、FPGA及计算机可读存储介质。
背景技术
随着现代社会科技的发展,云计算的应用越来与广泛。云计算是分布式计算的一种,是一种基于互联网的计算方式。FPGA(Field-Programmable Gate Array,现场可编程门阵列)由于其高性能,低延时,设计灵活,扩展性强,功耗低等特点,已经越来越成为数据中心中云计算加速设备的首选。
FPGA云平台指将多个FPGA通过网络组成加速资源池,实现数据分布式加速。如图1所示,FPGA加速设备的形态一般有两种,一种是插在服务器上的FPGA加速卡,另一种是没有服务器只有若干加速卡组成的JBOF(Just a Bunch OF FPGA,云平台中纯FPGA加速资源池)。FPGA板卡之间通过100G/40G高速以太网互联,进行分布式计算数据的交互。
RDMA(RemoteDirect Memory Access,远程直接内存访问)技术是为了解决网络传输中服务器端数据处理的延迟而产生的。目前,RoCE(RDMA Over Converged Ethernet,运行在以太网中的RDMA技术)协议定义了如何在以太网中运行RDMA;但由于以太网本身的不可靠性,如果网络包丢失,需要进行重传,RoCE协议的回退N丢包恢复方案(从丢包位置开始重传后面所有包)效率较低,带宽浪费大。
现有技术中,虽然存在如图2所示的RDMA响应端只重传丢失的包的丢包重传方案,由于如FPGA的云计算加速设备的处理性能很高,经常会连续执行多个RDMA读命令,图2所示的丢包重传方案会使重传丢失的包的耗时相比无丢包时增加几倍,使得应用的实时性大幅下降,使得系统延时较高。
因此,如何能够提供一种RDMA网络的数据重传方法,减少丢失数据的重传耗时,提升应用的实时性,降低系统延时,是现今急需解决的问题。
发明内容
本发明的目的是提供一种RDMA网络的数据重传方法、装置、FPGA及计算机可读存储介质,以减少丢失数据的重传耗时,提升应用的实时性,降低系统延时。
为解决上述技术问题,本发明提供一种RDMA网络的数据重传方法,包括:
根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,所述第一命令队列包括所述数据传输命令,所述第二命令队列包括所述数据传输命令中的重传命令;
利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,所述目标重传命令为所述第二命令队列中未执行过的重传命令;
利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据;其中,当前命令为所述第一命令队列中任一未执行过的数据传输命令;
在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据。
可选的,所述根据获取的数据传输命令,配置第一命令队列和第二命令队列,包括:
FPGA将获取的所述数据传输命令分别加入到所述第一命令队列和所述第二命令队列。
可选的,所述根据获取的数据传输命令,配置第一命令队列和第二命令队列,包括:
FPGA将获取的当前数据传输命令加入到所述第一命令队列;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若是,则将当前数据传输命令加入到所述第二命令队列;
若否,则不将当前数据传输命令加入到所述第二命令队列。
可选的,所述目标重传命令为所述第二命令队列中任一未执行过的重传命令时,所述利用重传响应线程,在检测到目标重传命令时,生成重读中断,包括:
利用重传响应线程,判断所述第二命令队列中是否存在所述数据传输命令;
若是,则从所述第二命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若为重传命令,则判断当前数据传输命令是否未执行;
若未执行,则将当前数据传输命令作为所述目标重传命令,并触发所述重读中断。
可选的,所述利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据,包括:
利用读响应线程,判断所述第一命令队列中是否存在所述数据传输命令;
若是,则从所述第一命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若为重传命令,则判断当前数据传输命令是否未执行;
若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;
传输当前命令对应的数据的过程中,判断是否检测到所述重读中断;
若检测到所述重读中断,则保存当前状态参数,暂停发送当前命令对应的数据;
获取并发送所述目标重传命令对应的数据;
对应的,所述在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据,包括:
在所述目标重传命令对应的数据发送完成后,恢复当前状态参数,继续发送当前命令对应的数据。
可选的,所述传输当前命令对应的数据的过程中,判断是否检测到所述重读中断,包括:
每传输完成一帧当前命令对应的数据后,判断是否检测到所述重读中断;
若是,则执行所述保存当前状态参数,暂停发送当前命令对应的数据的步骤;
若否,则发送下一帧当前命令对应的数据。
可选的,当前命令为所述第一命令队列中任一未执行过的非重传命令时,所述若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据,包括:
若当前数据传输命令不为重传命令,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;
若当前数据传输命令为重传命令且未执行,则获取并传输当前数据传输命令对应的数据,且当前数据传输命令对应的数据的传输过程中不检测所述重读中断。
本发明还提供了一种RDMA网络的数据重传装置,包括:
配置模块,用于根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,所述第一命令队列包括所述数据传输命令,所述第二命令队列包括所述数据传输命令中的重传命令;
中断生成模块,用于利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,所述目标重传命令为所述第二命令队列中未执行过的重传命令;
中断响应模块,用于利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据;其中,当前命令为所述第一命令队列中任一未执行过的数据传输命令;
恢复模块,用于在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据。
本发明还提供了一种FPGA,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述所述的RDMA网络的数据重传方法的步骤。
此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的RDMA网络的数据重传方法的步骤。
本发明所提供的一种RDMA网络的数据重传方法,包括:根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,第一命令队列包括数据传输命令,第二命令队列包括数据传输命令中的重传命令;利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,目标重传命令为第二命令队列中未执行过的重传命令;利用读响应线程传输当前命令对应的数据时,若检测到重读中断,则暂停发送当前命令对应的数据,并发送目标重传命令对应的数据;其中,当前命令为第二命令队列中任一未执行过的数据传输命令;在目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据;
可见,本发明利用第一命令队列和第二命令队列的双命令队列设置,使RDMA响应端由现有串行顺序响应RDMA请求端的数据传输命令,变成优先处理因以太网丢包造成的重传命令,从而保证了每个命令的实时响应性能,减少了丢失数据的重传耗时,提升了应用的实时性,降低了系统延时。此外,本发明还提供了一种RDMA网络的数据重传装置、FPGA及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是一个现有典型FPGA云平台的拓扑示意图;
图2为现有RDMA网络的数据读流程和丢包处理流程的示意图;
图3为现有RDMA读命令的传递示意图;
图4为图3中RDMA读发生重传时现有各读命令完成时间的示意图;
图5为本发明实施例所提供的一种RDMA网络的数据重传方法的流程图;
图6为本发明实施例所提供的一种重传响应线程的重读中断触发过程的流程图;
图7为本发明实施例所提供的另一种RDMA网络的数据重传方法的流程示意图;
图8为本发明实施例所提供的一种读响应线程的重读中断响应过程的流程图;
图9为本发明实施例所提供的一种RDMA网络的数据重传方法的双命令队列设置的优化效果比对示意图;
图10为图3中RDMA读发生重传时双命令队列优化后各读命令完成时间的示意图;
图11为本发明实施例所提供的一种RDMA网络的数据重传装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
可以理解的是,由于云计算加速设备(如FPGA云平台的FPGA)的处理性能很高,所以经常会连续执行多个RDMA命令,以5个读命令为例,采用如图2所示的丢包重传方案时,RDMA请求端将5个读命令通过以太网连续发送给RDMA响应端,RDMA响应端会依次将5个读命令的读数据反馈给RDMA请求端,由于发送读命令的时间远小于反馈读数据的时间,所以当RDMA请求端发现读命令1的数据有丢包,需要重传时,其发送的重传命令经常会排到其它读请求命令之后,具体位置取决于其它读请求命令的触发时间;如图3所示,命令1的数据重传命令排在了命令4之后。
以图3为例,在命令1发生丢包时,各个读命令响应完成时间如图4所示,正常情况下,5个读命令应该是顺序完成的,但由于命令1出现了丢包重传,而此时命令4已经发送;由于RDMA响应端只能串行接收RDMA网络发送来的读命令,所以会在完成命令4后才响应命令1的重传包,所以导致了命令1的完成时间在命令4之后。
而如FPGA云平台的云计算的应用场景都是针对大数据、高性能和低延时的需求。在图4的情况下,命令1耗时相比无丢包时会增加几倍,对应应用的实时性就会大幅下降;如果更多的命令有更多的丢包,则会有更多的命令耗时大幅增加,系统的应用延时会进一步加大,这会导致系统的性能大幅下降。因此,本发明实施例中提出了一种基于双命令队列的RDMA网络的数据重传方法,实现因以太网丢包造成的重传命令的优先传输。
具体的,请参考图5,图5为本发明实施例所提供的一种RDMA网络的数据重传方法的流程图。该方法可以包括:
步骤101:根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,第一命令队列包括数据传输命令,第二命令队列包括数据传输命令中的重传命令。
具体的,本步骤中的数据传输命令可以为以太网中运行的RDMA网络中的DRMA响应端(如FPGA云平台中的FPGA)接收的DRMA请求端发送的请求相应数据的命令,如读命令。本步骤中的重传命令可以为DRMA响应端接收的DRMA请求端发送的请求重新传输相应数据的命令,如丢包重传命令,例如图3中的命令1重传命令。
相应的,本步骤中的第一命令队列可以为放置DRMA响应端接收的数据传输命令的命令队列,如图2所示的现有技术中DRMA响应端中的命令队列。本实施例中的第二命令队列可以为放置DRMA响应端接收的数据传输命令中的重传命令的命令队列。
可以理解的是,本步骤的目的可以为DRMA响应端通过第一命令队列和第二命令队列的双命令队列设置,将RDMA响应端接收到的数据传输命令由原来的单一命令队列,优化成双命令队列,使DRMA响应端能够利用重传响应线程从第二命令队列快速检测出需要执行的重传命令并触发重读中断,从而打断正在执行的数据传输命令(即当前命令),优先执行重传命令,实现以太网丢包造成的重传命令的优先处理。
具体的,对于本步骤中DRMA响应端根据获取的数据传输命令,配置第一命令队列和第二命令队列的具体方式,可以由设计人员根据实用场景和用户需求自行设置,如DRMA响应端(如FPGA)可以将获取的数据传输命令分别加入到第一命令队列和第二命令队列;例如DRMA响应端在接收RDMA请求端通过以太网发送来的一个数据传输命令后,可以复制该数据传输命令,同时分发到第一命令队列和第二命令队列。DRMA响应端也可以在接收的数据传输命令为重传命令时,将该数据传输命令加入到第一命令队列和第二命令队列;在获取的数据传输命令为非重传命令(即不为重传命令)时,将该数据传输命令仅加入到第一命令队列;例如,FPGA将获取的当前数据传输命令加入到第一命令队列;判断当前数据传输命令是否为重传命令;若是,则将当前数据传输命令加入到第二命令队列;若否,则不将当前数据传输命令加入到第二命令队列;其中,当前数据传输命令为任一数据传输命令。本实施例对此不作任何限制。
步骤102:利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,目标重传命令为第二命令队列中未执行过的重传命令。
可以理解的是,本步骤中的重传响应线程可以为DRMA响应端中设置的用于检测第二命令队列中需要执行的重传命令(即目标重传命令)的线程。由于重传响应线程仅需要检测目标重传命令并生成相应的重读中断,并不需要如读响应线程一般,等待上一个数据传输命令执行完成后再读取下一个数据传输命令,而是直接串行读取第二命令队列,直至获取到目标重传命令,使得重传响应线程检测到目标重传命令的时间能够早于读响应线程从第一命令队列检测到对应重传命令的时间,从而实现重传命令的优先处理。
具体的,对于本步骤中DRMA响应端利用重传响应线程,在检测到目标重传命令时,生成重读中断的具体方式,可以由设计人员自行设置,如DRMA响应端将获取的数据传输命令分别加入到第一命令队列和第二命令队列,且目标重传命令为第二命令队列中任一未执行过的重传命令时,本步骤可以如图6所示,包括:
步骤201:利用重传响应线程,判断第二命令队列中是否存在数据传输命令;若是,则进入步骤202。
其中,本步骤的目的可以为DRMA响应端通过判断第二命令队列中是否存在数据传输命令,确定第二命令队列中是否有可能存在重传命令;若是,则进入步骤202,以解析第二命令队列中存在的数据传输命令是否为重传命令;若否,则可以直接返回本步骤或等待预设时间后返回本步骤,继续进行下一次判断。
具体的,如图7所示,本步骤中DRMA响应端的重传队列处理线程(即重传响应线程)在初始化后,可以判断重传响应命令队列(即第二命令队列)是否有数据(即数据传输命令);若有,则进入步骤202,将读命令(即数据传输命令)读出解析;如果没有,则继续等待判断。
步骤202:从第二命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一数据传输命令。
可以理解的是,本步骤中DRMA响应端利用重传响应线程从第二命令队列获取并解析的当前数据传输命令,可以为按照第二命令队列的任务写入顺序读出的一个当前的数据传输命令(如读命令)。
步骤203:判断当前数据传输命令是否为重传命令;若是,则进入步骤204。
具体的,如图7所示,本步骤中DRMA响应端的重传队列处理线程在解析读命令(即当前数据传输命令)后,判断该读命令是否为重传读命令(即重传命令);若是重传命令,则进入步骤204,判断该读命令是否已经被响应;若不是重传命令,则可以直接丢弃该读命令,并返回步骤201,继续等待判断。
步骤204:判断当前数据传输命令是否未执行;若是,则进入步骤205。
其中,本步骤的目的可以为在当前数据传输命令为重传命令时,通过判断当前数据传输命令是否未执行,确定当前数据传输命令是否未被读响应线程执行,从而在当前数据传输命令未执行时,进入步骤205,触发重读中断,使读响应线程先执行当前数据传输命令,即重传命令。对应的,对于当前数据传输命令已经或正在被读响应线程执行的情况,重传响应线程可以直接丢弃当前数据传输命令,并返回步骤201,继续等待判断。
具体的,如图7所示,本步骤中DRMA响应端的重传队列处理线程在确定解析的读命令为重传读命令后,可以判断该读命令是否已经被响应,即被读响应线程响应执行;若已经响应过,则可以直接丢弃该读命令,并返回步骤201,继续等待判断;若没有被响应,则进入步骤205,触发重读中断通知读响应线程。
步骤205:将当前数据传输命令作为目标重传命令,并触发重读中断。
可以理解的是,本步骤的目的可以为在确定当前数据传输命令为一个未执行过的重传命令时,将当前数据传输命令作为目标重传命令,并触发重读中断通知读响应线程,先响应执行该目标重传命令。
具体的,如图7所示,本步骤完成之后可以返回到开始的步骤201,继续判断等待第二命令队列的下一个当前数据传输命令。
对应的,DRMA响应端将获取的数据传输命令分别加入到第一命令队列和第二命令队列,且目标重传命令为第二命令队列中全部未执行过的重传命令时,步骤102可以采用与图6所示的方法相似的方式实现;相应的,DRMA响应端仅在接收的数据传输命令为重传命令时,将该数据传输命令加入到第一命令队列和第二命令队列,且目标重传命令为第二命令队列中全部未执行过的重传命令时,步骤102可以采用与图6所示的方法相似的方式实现,如仅减少了判断当前数据传输命令是否为重传命令的过程。只要DRMA响应端可以利用重传响应线程,在检测到目标重传命令时,生成重读中断,本实施例对此不做任何限制。
步骤103:利用读响应线程传输当前命令对应的数据时,若检测到重读中断,则暂停发送当前命令对应的数据,并发送目标重传命令对应的数据;其中,当前命令为第一命令队列中任一未执行过的数据传输命令。
可以理解的是,本步骤中的读响应线程可以为DRMA响应端中设置的用于串行响应执行第一命令队列中的未执行过的数据传输命令(即当前命令)的线程。本实施例中DRMA响应端的读响应线程在未检测到重读中断时,可以采用与现有技术中读响应线程对命令队列的处理方式,按照第一命令队列的任务写入顺序,串行依次读响传输第一命令队列中每个数据传输命令对应的数据;而在DRMA响应端的读响应线程检测到重传响应线程触发的重读中断时,可以暂停发送当前命令对应的数据,并发送目标重传命令对应的数据,从而实现重传命令的优先处理。
具体的,对于本步骤中DRMA响应端利用读响应线程传输当前命令对应的数据时,若检测到重读中断,则暂停发送当前命令对应的数据,并发送目标重传命令对应的数据的具体方式,可以由设计人员自行设置,如本步骤可以如图8所示,包括:
步骤301:利用读响应线程,判断第一命令队列中是否存在数据传输命令;若是,则进入步骤302。
其中,本步骤的目的可以为DRMA响应端通过判断第一命令队列中是否存在数据传输命令,确定是否需要传输数据;若是,则进入步骤302,以解析第一命令队列中存在的当前需要响应执行的数据传输命令是否为重传命令;若否,则可以直接返回本步骤或等待预设时间后返回本步骤,继续进行下一次判断。
具体的,如图7所示,本步骤中DRMA响应端的读响应线程在初始化后,可以判断命令队列(即第一命令队列)是否有数据(即数据传输命令);若有,则进入步骤302,将读命令(即数据传输命令)读出解析;如果没有,则继续等待判断。
步骤302:从第一命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一数据传输命令。
可以理解的是,本步骤中DRMA响应端利用读响应线程从第一命令队列获取并解析的当前数据传输命令,可以为按照第一命令队列的任务写入顺序读出的一个当前的数据传输命令(如读命令)。
步骤303:判断当前数据传输命令是否为重传命令;若是,则进入步骤304;若否,则进入步骤305。
具体的,如图7所示,本步骤中DRMA响应端的读响应线程在解析读命令(即当前数据传输命令)后,判断该读命令是否为重读命令(即重传命令);若是重传命令,则进入步骤304,判断该读命令是否已经被响应;若不是重传命令,则可以进入步骤305,直接读取并向RDMA请求端发送该读命令对应的数据。
步骤304:判断当前数据传输命令是否未执行;若是,则进入步骤305。
其中,本步骤的目的可以为在当前数据传输命令为重传命令时,通过判断当前数据传输命令是否未执行,确定当前数据传输命令是否未被读响应线程执行,即是否在之前根据重传响应线程触发的重读中断执行过当前数据传输命令,从而在当前数据传输命令未执行时,进入步骤205;对应的,对于当前数据传输命令已经被读响应线程执行的情况,读响应线程可以直接丢弃当前数据传输命令,并返回步骤301,继续等待响应下一个数据传输命令。
步骤305:将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据。
可以理解的是,本步骤的目的可以为在确定当前数据传输命令为一个未执行过的数据传输命令时,将当前数据传输命令作为当前命令,获取并开始传输当前命令对应的数据。
进一步的,为了避免读响应线程在获取并传输重传命令对应的数据时,被重传响应线程触发的重读中断所打断,本步骤中读响应线程可以在当前数据传输命令不为重传命令时,将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;在当前数据传输命令为重传命令时,获取并传输当前数据传输命令对应的数据,且当前数据传输命令对应的数据的传输过程中不检测重读中断;即当前命令可以仅为第一命令队列中任一未执行过的非重传命令。
具体的,如图7所示,本步骤中DRMA响应端的读响应线程可以从内存中读取当前命令对应的数据,并封帧发送到相应的DRMA请求端。
步骤306:传输当前命令对应的数据的过程中,判断是否检测到重读中断;若是,则进入步骤307。
可以理解的是,本步骤的目的可以为读响应线程在传输当前命令对应的数据的过程中,通过判断是否检测到重传响应线程触发的重读中断,确定是否有重传命令需要优先传输;若是,则进入步骤307,暂停传输当前命令对应的数据;若否,则可以继续传输当前命令对应的数据,并在当前命令对应的数据传输完成后返回步骤301,继续等待响应下一个数据传输命令。
具体的,对于本步骤中DRMA响应端的读响应线程在传输当前命令对应的数据的过程中,判断是否检测到重读中断的具体方式,可以由设计人员根据实用场景和用户需求自行设置,如图7所示,DRMA响应端的读响应线程将当前命令对应的数据封帧发送到相应的DRMA请求端时,读响应线程可以在每传输完成一帧当前命令对应的数据后,判断是否检测到重读中断;若是,则进入步骤307;若否,则发送下一帧当前命令对应的数据。也就是说,读响应线程可以每发送一帧数据,判断是否有重读中断;如果没有,则继续发送下一帧数据,直到数据发送完毕;如果有,则进入步骤307执行重传中断响应流程。
步骤307:保存当前状态参数,暂停发送当前命令对应的数据。
其中,本步骤可以为DRMA响应端的读响应线程在保存当前状态参数(如当前命令和已读长度等信息)后,暂停传输当前命令对应的数据。
步骤308:获取并发送目标重传命令对应的数据。
可以理解的是,本步骤的目的可以为DRMA响应端的读响应线程在暂停传输当前命令对应的数据后,读取内存中目标重传命令(即所检测到重读中断对应的重传命令)对应的数据,并传输到相应的DRMA请求端,实现重传命令的优先传输。相应的,如图7所示,DRMA响应端的读响应线程在目标重传命令对应的数据发送完成后,可以进入步骤104,恢复当前状态参数,继续发送当前命令对应的数据。
步骤104:在目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据。
可以理解的是,本步骤的目的可以为DRMA响应端的读响应线程在目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据,如恢复保存的当前状态参数,继续发送下一帧当前命令对应的数据,并在下一帧当前命令对应的数据,继续判断是否检测到重读中断。
需要说明的是,由于以太网的数据传输方式为串行,并且RDMA读命令传输耗时远小于RDMA读数据传输耗时。所以对于RDMA请求端,在有多个读命令的情形下,当其发现读命令1的数据有丢包时,其它读命令肯定已经发送。对于RDMA响应端,在只有一个命令队列的情况下,无法预知后续命令中有无重传命令,也就无法对重传命令进行及时的响应,如图9的原方案所示。本实施例所提供的RDMA网络的数据重传方法通过增加了一个重传响应命令队列(即第二命令队列),如图9的优化方案,第二命令队列由单独线程(即重传响应线程)独立控制,不关注原命令队列(即第一命令队列)执行情况,直接读取第二命令队列,直到获取到重传命令;获取到重传命令后,触发中断,打断读响应线程,优先响应重传命令,达到提高重传度命令效率的目的;而第一命令队列中的重传命令可以依旧有效,所以两个命令队列在获取重传命令后需要进行判断,如果是已经执行完的重传命令,则不需要再次执行;一般情况下第二命令队列的重传命令会先被获取,但某些情况下(例如只有一个读命令)第一命令队列会先被获取。
也就是说,本实施例所提供的RDMA网络的数据重传方法可以将图4所示的RDMA读发生重传时各命令完成时间优化为图9所示的情形,使得读命令1的丢包重传,能够插在读命令2的读数据过程中;相比图4的情形,读命令1的完成时间大幅提前。
本实施例中,本发明实施例利用第一命令队列和第二命令队列的双命令队列设置,使RDMA响应端由现有串行顺序响应RDMA请求端的数据传输命令,变成优先处理因以太网丢包造成的重传命令,从而保证了每个命令的实时响应性能,减少了丢失数据的重传耗时,提升了应用的实时性,降低了系统延时。
请参考图11,图11为本发明实施例所提供的一种RDMA网络的数据重传装置的结构框图。该装置可以包括:
配置模块10,用于根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,第一命令队列包括数据传输命令,第二命令队列包括数据传输命令中的重传命令;
中断生成模块20,用于利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,目标重传命令为第二命令队列中未执行过的重传命令;
中断响应模块30,用于利用读响应线程传输当前命令对应的数据时,若检测到重读中断,则暂停发送当前命令对应的数据,并发送目标重传命令对应的数据;其中,当前命令为第一命令队列中任一未执行过的数据传输命令;
恢复模块40,用于在目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据。
可选的,配置模块10,可以包括:
第一配置子模块,用于将获取的数据传输命令分别加入到第一命令队列和第二命令队列。
可选的,配置模块10,可以包括:
第二配置子模块,用于将获取的当前数据传输命令加入到第一命令队列;判断当前数据传输命令是否为重传命令;若是,则将当前数据传输命令加入到第二命令队列;若否,则不将当前数据传输命令加入到第二命令队列;其中,当前数据传输命令为任一数据传输命令。
可选的,目标重传命令为第二命令队列中任一未执行过的重传命令时,中断生成模块20,可以包括:
第一判断子模块,用于利用重传响应线程,判断第二命令队列中是否存在数据传输命令;
第一解析子模块,用于若存在数据传输命令,则从第二命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一数据传输命令;
第二判断子模块,用于判断当前数据传输命令是否为重传命令;
第三判断子模块,用于若为重传命令,则判断当前数据传输命令是否未执行;
中断触发子模块,用于若未执行,则将当前数据传输命令作为目标重传命令,并触发重读中断。
可选的,中断响应模块30,可以包括:
第四判断子模块,用于利用读响应线程,判断第一命令队列中是否存在数据传输命令;
第二解析子模块,用于若存在数据传输命令,则从第二命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一数据传输命令;
第五判断子模块,用于判断当前数据传输命令是否为重传命令;
第六判断子模块,用于若为重传命令,则判断当前数据传输命令是否未执行;
第一传输子模块,用于若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;在传输当前命令对应的数据的过程中,判断是否检测到重读中断;
暂停子模块,用于若检测到重读中断,则保存当前状态参数,暂停发送当前命令对应的数据;
第二传输子模块,用于获取并发送目标重传命令对应的数据;
对应的,恢复模块40,可以具体用于在目标重传命令对应的数据发送完成后,恢复当前状态参数,继续发送当前命令对应的数据。
可选的,第一传输子模块可以具体用于每传输完成一帧当前命令对应的数据后,判断是否检测到重读中断;若是,则向暂停子模块发送启动信号;若否,则发送下一帧当前命令对应的数据。
可选的,当前命令为第一命令队列中任一未执行过的非重传命令时,第一传输子模块,可以具体用于若当前数据传输命令不为重传命令,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;若当前数据传输命令为重传命令且未执行,则获取并传输当前数据传输命令对应的数据,且当前数据传输命令对应的数据的传输过程中不检测重读中断。
本实施例中,本发明实施例利用第一命令队列和第二命令队列的双命令队列设置,使RDMA响应端由现有串行顺序响应RDMA请求端的数据传输命令,变成优先处理因以太网丢包造成的重传命令,从而保证了每个命令的实时响应性能,减少了丢失数据的重传耗时,提升了应用的实时性,降低了系统延时。
本发明实施例还提供了一种FPGA,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序时实现如上述实施例所提供的RDMA网络的数据重传方法的步骤。
本发明实施例还提供了一种FPGA云平台,包括:如上一实施例所提供的FPGA。
此外,本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的RDMA网络的数据重传方法的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、FPGA、FPGA云平台及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
以上对本发明所提供的一种RDMA网络的数据重传方法、装置、FPGA、FPGA云平台及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (9)

1.一种远程直接内存访问RDMA网络的数据重传方法,其特征在于,包括:
根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,所述第一命令队列包括所述数据传输命令,所述第二命令队列包括所述数据传输命令中的重传命令;
利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,所述目标重传命令为所述第二命令队列中未执行过的重传命令;
利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据;其中,当前命令为所述第一命令队列中任一未执行过的数据传输命令;
在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据;
其中,所述利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据,包括:
利用读响应线程,判断所述第一命令队列中是否存在所述数据传输命令;
若是,则从所述第一命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若为重传命令,则判断当前数据传输命令是否未执行;
若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;
传输当前命令对应的数据的过程中,判断是否检测到所述重读中断;
若检测到所述重读中断,则保存当前状态参数,暂停发送当前命令对应的数据;
获取并发送所述目标重传命令对应的数据;
对应的,所述在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据,包括:
在所述目标重传命令对应的数据发送完成后,恢复当前状态参数,继续发送当前命令对应的数据。
2.根据权利要求1所述的RDMA网络的数据重传方法,其特征在于,所述根据获取的数据传输命令,配置第一命令队列和第二命令队列,包括:
FPGA将获取的所述数据传输命令分别加入到所述第一命令队列和所述第二命令队列。
3.根据权利要求1所述的RDMA网络的数据重传方法,其特征在于,所述根据获取的数据传输命令,配置第一命令队列和第二命令队列,包括:
FPGA将获取的当前数据传输命令加入到所述第一命令队列;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若是,则将当前数据传输命令加入到所述第二命令队列;
若否,则不将当前数据传输命令加入到所述第二命令队列。
4.根据权利要求2所述的RDMA网络的数据重传方法,其特征在于,所述目标重传命令为所述第二命令队列中任一未执行过的重传命令时,所述利用重传响应线程,在检测到目标重传命令时,生成重读中断,包括:
利用重传响应线程,判断所述第二命令队列中是否存在所述数据传输命令;
若是,则从所述第二命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一所述数据传输命令;
判断当前数据传输命令是否为重传命令;
若为重传命令,则判断当前数据传输命令是否未执行;
若未执行,则将当前数据传输命令作为所述目标重传命令,并触发所述重读中断。
5.根据权利要求1所述的RDMA网络的数据重传方法,其特征在于,所述传输当前命令对应的数据的过程中,判断是否检测到所述重读中断,包括:
每传输完成一帧当前命令对应的数据后,判断是否检测到所述重读中断;
若是,则执行所述保存当前状态参数,暂停发送当前命令对应的数据的步骤;
若否,则发送下一帧当前命令对应的数据。
6.根据权利要求1所述的RDMA网络的数据重传方法,其特征在于,当前命令为所述第一命令队列中任一未执行过的非重传命令时,所述若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据,包括:
若当前数据传输命令不为重传命令,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;
若当前数据传输命令为重传命令且未执行,则获取并传输当前数据传输命令对应的数据,且当前数据传输命令对应的数据的传输过程中不检测所述重读中断。
7.一种远程直接内存访问RDMA网络的数据重传装置,其特征在于,包括:
配置模块,用于根据获取的数据传输命令,配置第一命令队列和第二命令队列;其中,所述第一命令队列包括所述数据传输命令,所述第二命令队列包括所述数据传输命令中的重传命令;
中断生成模块,用于利用重传响应线程,在检测到目标重传命令时,生成重读中断;其中,所述目标重传命令为所述第二命令队列中未执行过的重传命令;
中断响应模块,用于利用读响应线程传输当前命令对应的数据时,若检测到所述重读中断,则暂停发送当前命令对应的数据,并发送所述目标重传命令对应的数据;其中,当前命令为所述第一命令队列中任一未执行过的数据传输命令;
恢复模块,用于在所述目标重传命令对应的数据发送完成后,恢复发送当前命令对应的数据;
其中,所述中断响应模块,包括:
第四判断子模块,用于利用读响应线程,判断所述第一命令队列中是否存在所述数据传输命令;
第二解析子模块,用于若存在所述数据传输命令,则从所述第一命令队列获取并解析当前数据传输命令;其中,当前数据传输命令为任一所述数据传输命令;
第五判断子模块,用于判断当前数据传输命令是否为重传命令;
第六判断子模块,用于若为重传命令,则判断当前数据传输命令是否未执行;
第一传输子模块,用于若当前数据传输命令不为重传命令或未执行,则将当前数据传输命令作为当前命令,获取并传输当前命令对应的数据;在传输当前命令对应的数据的过程中,判断是否检测到所述重读中断;
暂停子模块,用于若检测到所述重读中断,则保存当前状态参数,暂停发送当前命令对应的数据;
第二传输子模块,用于获取并发送所述目标重传命令对应的数据;
对应的,所述恢复模块具体用于在所述目标重传命令对应的数据发送完成后,恢复当前状态参数,继续发送当前命令对应的数据。
8.一种FPGA,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述的RDMA网络的数据重传方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的RDMA网络的数据重传方法的步骤。
CN202011147327.3A 2020-10-23 2020-10-23 一种rdma网络的数据重传方法、装置及fpga Active CN112261142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011147327.3A CN112261142B (zh) 2020-10-23 2020-10-23 一种rdma网络的数据重传方法、装置及fpga

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011147327.3A CN112261142B (zh) 2020-10-23 2020-10-23 一种rdma网络的数据重传方法、装置及fpga

Publications (2)

Publication Number Publication Date
CN112261142A CN112261142A (zh) 2021-01-22
CN112261142B true CN112261142B (zh) 2023-07-14

Family

ID=74264837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011147327.3A Active CN112261142B (zh) 2020-10-23 2020-10-23 一种rdma网络的数据重传方法、装置及fpga

Country Status (1)

Country Link
CN (1) CN112261142B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113301103B (zh) * 2021-02-05 2024-03-12 阿里巴巴集团控股有限公司 数据处理系统、方法及装置
TWI807919B (zh) * 2022-07-14 2023-07-01 群聯電子股份有限公司 資料重讀方法、記憶體儲存裝置及記憶體控制電路單元

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012131806A1 (en) * 2011-03-28 2012-10-04 Nec Corporation Retransmission control system and retransmission control method
CN106487896A (zh) * 2016-10-14 2017-03-08 北京百度网讯科技有限公司 用于处理远程直接内存访问请求的方法和装置
CN110460412A (zh) * 2019-07-11 2019-11-15 阿里巴巴集团控股有限公司 用于数据传输的方法和rdma网卡
CN110674064A (zh) * 2019-09-05 2020-01-10 苏州浪潮智能科技有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
CN111448543A (zh) * 2017-12-07 2020-07-24 华为技术有限公司 内存访问技术及计算机系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012131806A1 (en) * 2011-03-28 2012-10-04 Nec Corporation Retransmission control system and retransmission control method
CN106487896A (zh) * 2016-10-14 2017-03-08 北京百度网讯科技有限公司 用于处理远程直接内存访问请求的方法和装置
CN111448543A (zh) * 2017-12-07 2020-07-24 华为技术有限公司 内存访问技术及计算机系统
CN110460412A (zh) * 2019-07-11 2019-11-15 阿里巴巴集团控股有限公司 用于数据传输的方法和rdma网卡
CN110674064A (zh) * 2019-09-05 2020-01-10 苏州浪潮智能科技有限公司 一种数据传输方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112261142A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
US9197373B2 (en) Method, apparatus, and system for retransmitting data packet in quick path interconnect system
TWI387256B (zh) 改善傳輸時間間隔集束傳輸之方法及通訊裝置
US7693070B2 (en) Congestion reducing reliable transport packet retry engine
CN109547162B (zh) 基于两套单向边界的数据通信方法
CN112261142B (zh) 一种rdma网络的数据重传方法、装置及fpga
JP2007089174A (ja) 無線通信システムにおける信号の伝送速度を改善する方法及び装置
CN202841192U (zh) 一种支持广域网的高速、可靠的单向传输系统
CN112738229B (zh) 一种实现数据自动续传的通信方法
US9258834B2 (en) Method of mobile terminal internal communications
CN113992654A (zh) 一种高速的文件传输方法、系统、设备及介质
CN113572582B (zh) 数据发送、重传控制方法及系统、存储介质及电子设备
CN112929455A (zh) 基于udp的数据传输方法、装置、设备和可读存储介质
CN111064768B (zh) 打印机数据传输控制方法、装置、设备及存储介质
JP2007243239A (ja) 通信装置及び通信方法
CN117097679A (zh) 一种网络中断的聚合方法、装置及网络通信设备
CN105099645A (zh) 一种基于半双工通信设备的多用户并发通信的方法和装置
CN113992609B (zh) 一种处理多链路业务数据乱序的方法及系统
CN114422617B (zh) 一种报文处理方法、系统及计算机可读存储介质
CN111258937B (zh) 一种环式链表dma的传输方法及系统
CN101610477B (zh) 多媒体消息业务的处理系统和方法
CN114268670A (zh) 基于时间触发的以太网异步消息处理系统及方法
CN113612737A (zh) 一种基于分组与重传机制的长报文可靠传输方法
CN111447046A (zh) 业务数据传输方法、装置、设备和存储介质
CN114337921B (zh) 一种数据传输方法、数据传输装置和相关设备
WO2021057616A1 (zh) Rrc连接的管理方法及装置、存储介质和电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant