CN118054885A - 一种数据重传方法、电子设备及存储介质 - Google Patents

一种数据重传方法、电子设备及存储介质 Download PDF

Info

Publication number
CN118054885A
CN118054885A CN202410185216.3A CN202410185216A CN118054885A CN 118054885 A CN118054885 A CN 118054885A CN 202410185216 A CN202410185216 A CN 202410185216A CN 118054885 A CN118054885 A CN 118054885A
Authority
CN
China
Prior art keywords
node
cwid
retransmission
codeword
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410185216.3A
Other languages
English (en)
Inventor
杨凯
孙滨
朱云姗
董晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Nori Integrated Circuit Design Co ltd
Shanghai Hejian Industrial Software Group Co Ltd
Original Assignee
Beijing Nori Integrated Circuit Design Co ltd
Shanghai Hejian Industrial Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Nori Integrated Circuit Design Co ltd, Shanghai Hejian Industrial Software Group Co Ltd filed Critical Beijing Nori Integrated Circuit Design Co ltd
Priority to CN202410185216.3A priority Critical patent/CN118054885A/zh
Publication of CN118054885A publication Critical patent/CN118054885A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

本发明涉及通信技术领域,特别是涉及一种数据重传方法、电子设备及存储介质,其应用于第一节点的物理层中的前向编解码模块,通过获取第二节点发送的第i个码字CWi;对CWi进行校验,当校验失败时,提取CWi的身份信息CWIDi;将CWIDi加入第一节点待发送给第二节点的下一个码字CWj中第二子码cwBj的填补位padBj,使padBj携带CWIDi以及请求第二节点重发的传输类型;将CWj发送给第二节点,使第二节点根据CWIDi查找目标码字,并根据传输类型对目标码字进行重发,由于前向编解码模块重传所需经过的逻辑较少,因此能够大幅度减少重传时间。

Description

一种数据重传方法、电子设备及存储介质
技术领域
本发明涉及通信技术领域,特别是涉及一种数据重传方法、电子设备及存储介质。
背景技术
在数据从源端传输至目的端的过程中,由于误码会出现丢包。目前针对丢包的问题,一般采用网络拥塞管理机制,也即结合PFC(Priority Flow Control,流量控制技术)和ECN(Explicit Congestion Notification,拥塞通知技术),其中,PFC是在网络拥塞时暂停低优先级流量,以确保高优先级流量的传输。ECN是在网络拥塞时向数据包添加标记,以通知源端和目的端网络的拥塞情况。PFC主要用于保证数据包传输的优先级,而ECN则用于控制网络拥塞,这两种机制可以结合使用,以最大限度地减少网络拥塞和数据包丢失,提高网络的性能和可靠性。
当组网的规模较少时,例如几十到几百个处理器组成的网络结构,需要重传的数据量小,根据上述网络拥塞管理机制,重传导致的数据延时并不突出。当组网的规模较大时,例如由上千个处理器组成的网络结构,需要重传的数据量很大,利用前述网络拥塞管理机制进行重传会导致重传的延时很大。
发明内容
针对上述技术问题,本发明采用的技术方案为:一种数据重传方法,应用于第一节点的物理层中的前向编解码模块,所述方法包括如下步骤:
S100,获取第二节点发送的第i个码字CWi
S200,对CWi进行校验,当校验失败时,提取CWi的身份信息CWIDi
S300,将CWIDi加入第一节点待发送给第二节点的下一个码字CWj中,其中CWj包括绑定的第一子码cwAj和第二子码cwBj,所述cwAj的填补位padAj携带CWj的身份信息CWIDj以及CWj的传输类型,所述cwBj的填补位padBj携带CWIDi以及CWi的传输类型;其中CWi的传输类型为请求第二节点重发的校验失败待重传类型。
S400,将CWj发送给第二节点,使第二节点根据CWIDi查找目标码字,并根据CWi的传输类型将目标码字进行重发。
此外,本发明还提供了一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现上述方法。
此外,本发明还提供了一种电子设备,包括处理器和上述非瞬时性计算机可读存储介质。
本发明至少具有以下有益效果:
本发明提供了一种数据重传方法、电子设备及存储介质,其应用于第一节点的物理层中的前向编解码模块,借助前向编解码模块传输的码字CW中第二子码cwB中填补位传递需要对端重传的码字的身份信息,使第二节点根据解析到cwB的填补位的身份信息时进行重传,达到通过前向编解码模块实现重传的目的。物理层重传所需经过的逻辑较少,因此能够将重传延时降低至125ns,大幅度减少重传时间,而在125ns的时间内传输的数据较少,相较于网络拥塞管理机制的现有技术的重传延时100微秒的时间,大幅度缩短了传输延时,因此重传码字需要占用的缓存也更小。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据重传方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决重传延时大的技术问题,本发明提供了一种数据重传方法,该方法应用于第一节点的物理层中的前向编解码模块。前向编解码模块传输的码字CW包括绑定的两个第一子码cwA和第二子码cwB,利用cwA中填补位传递当前码字的身份信息以及传输类型;当需要重传时,借助cwB中填补位传递需要对端重传的码字的身份信息。在传输的过程中,第一节点接收第二节点发送的码字,当校验失败时,提取校验失败的码字的身份信息,将该身份信息加入下一个发送的码字中cwB的填补位;当第二节点解析到cwB的填补位的身份信息时,重传缓存的相同身份信息的码字,达到通过物理层实现重传的目的。
可选的,节点为处理器或交换机。其中,处理器可以是CPU、GPU或GPGPU。第一节点为GPU,第二节点为交换机;或者第一节点和第二节点均为GPU;或者第一节点为交换机,第二节点为GPU等。现有技术中其他所有能够实现数据交互的节点均落入本发明的保护范围之内。
可选的,第一节点和第二节点之间通过以太网协议进行通信,现有技术中其他局域网协议也落入本发明的保护范围之内。其中OSI参考模型的七层框架被以太网协议封装为四层框架架构,以太网协议的四层网络架构包括:应用层、传输层、网络层和网络接口层。其中,在以太网协议中的应用层封装了OSI参考模型中的应用层、表示层和会话层。在以太网协议中的网络接口层封装了OSI参考模型中的数据链路层和物理层。其中,物理层中还包括物理编码子模块(Physical Coding Sublayer,PCS)和前向编解码模块(Forward ErrorCorrection,FEC)。
可选的,以太网协议为TCP/IP协议,现有技术中其他以太网协议均落入本发明的保护范围之内。
可选的,本发明所提供的数据重传方法应用于物理层中的前向编解码模块(Forward Error Correction,FEC)。现有技术中将该数据重传方法应用于物理层中的其他子层也落入本发明的保护范围之内。
可选的,前向编解码模块的编码采用RS编码。现有技术中其他所有前向编解码技术均落入本发明的保护范围之内。
可选的,RS编码为RS(272,257)编码。其中,272是指码字中数据块的总数量,257是指有效数据占用的数据块的总数量。现有技术中其他所有RS编码技术均落入本发明的保护范围之内。
请参阅图1,其示出了一种数据重传方法流程图,该方法应用于第一节点的物理层中的前向编解码模块,该数据重传方法包括如下步骤:
S100,获取第二节点发送的第i个码字CWi。其中,i大于0。
其中,CWi还包括:绑定的第一子码cwAi和第二子码cwBi,cwAi包括cwAi的有效数据位dataAi、填补位padAi和校验位PAi,padAi包括CWi的身份信息CWIDi和CWi的传输类型;cwBi包括cwBi的有效数据位dataBi、填补位padBi和校验位PBi。其中,CWi的传输类型为正常传输类型、校验失败待重传类型、重传类型中的任意一种。其中,第一子码和第二子码的编码格式相同,码字的编码格式共计包括272个数据块,每个数据块10bit。其中,码字的有效数据位包括M0-M256共计257个码字数据块,码字为需要加密的原始数据,也称为有效数据位。填补位为一个数据块,保证有效数据位和数据标志位校验后为偶数,符合RS编码的校验规则。校验位为P0-P13共计14个数据块。
其中,在经过编码之后再经过前向纠错的按lane交织和分发(FEC laneinterleave&distribution)之后生成绑定的第一子码cwAi和第二子码cwBi的CWi。对应的,第一节点需要执行解交织的步骤之后得到CWi
其中,S100之前还包括:当第二节点向第一节点发送CWi时,将CWi加入重传缓存中备份。重传缓存用于备份第二节点已经发送出去的码字,若在传输的过程中导致码字CWi中的dataBi出现了不可纠正的错误时,需要通过CWIDi在缓存中查找备份的码字进行重传。
其中,第二节点发送的码字和第一节点发送的码字的编码格式相同。第二节点和第一节点发送的码字均采用相同的编码方式。
其中,第二节点是指与第一节点进行数据通信的下一个节点。第一节点和第二节点之间为点对点通信,两者不能跨中间节点通信。例如,第一个GPU通过交换机访问第二个GPU,此时分为两段通信,第一段通信为第一个GPU与交换机通信,第二段通信为交换机和第二个交换机通信。在第一段通信中,第一个GPU为第一节点,交换机为第一个GPU的第二节点。在第二段通信中,交换机为第一节点,第二个GPU为交换机的第二节点。
需要说明的是,S100-S400的执行主体均为第一节点的物理层中的前向编解码模块。
S200,对CWi进行校验,当校验失败时,提取CWi的身份信息CWIDi
需要说明的是,码字在传输的过程中可能会出现误码,误码可能会导致校验失败。误码的原因包括信号传输过程中衰变的电压信号,噪音、传输设备故障或其他因素都会导致误码。当校验失败时需要重传产生误码的码字。
所有校验码字的方法均落入本发明的保护范围,在此基础上,本发明还提供了一种新的校验步骤,新的校验步骤包括:
S210,对dataAi和dataBi分别进行校验和纠错,当dataAi和/或dataBi校验出错且无法纠正时,校验失败;否则校验通过。其中,dataAi和/或dataBi校验出错且无法纠正是指dataAi校验出错且无法纠正,或者dataBi校验出错且无法纠正,或者dataAi和dataBi都校验出错且无法纠正。需要说明的是,当校验出错且产生误码的码字能够被纠正时,不需要重传。当校验出错的数据块的数量超出能够纠错的范围时,确定是无法纠正的错误,此时校验失败。本发明提供了两种校验的方式,一种为校验,无纠错功能,当校验出错时即为校验失败。另一种为具有纠正功能的校验,当校验出错时进行纠正,当出错的码字能够被纠正时,则不需要重传;当校验出错且无法纠正时,则校验失败,需要重传。现有技术中所有用于校验、或具有纠正功能的校验方法均落入本发明的保护范围之内。
可选的,校验算法为奇偶校验、校验和、循环冗余校验(Cyclic RedundancyCheck,CRC)、纵向冗余校验(Longitudinal Redundancy Check,LRC)或者异或校验(BlockCheck Character,BCC)。所有用于生成校验码的其他校验算法均落入本发明的保护范围之内。
S300,将CWIDi加入第一节点发送给第二节点的下一个码字CWj中,其中CWj包括绑定的第一子码cwAj和第二子码cwBj,所述cwAj的填补位padAj携带CWj的身份信息CWIDj以及CWj的传输类型,所述cwBj的填补位padBj携带CWIDi以及CWi的传输类型;其中CWi的传输类型为请求第二节点重发的校验失败待重传类型。其中CWj为第一节点发送的第j个码字,j大于0。
需要说明的是,第一节点发送给第二节点的下一个码字CWj不是专门用于发送待重传的码字的身份信息CWIDi的码字,而是第一节点需要发送给第二节点的码字,该码字的传输类型可以是正常传输类型、校验出错待重传类型、重传类型中的任意一种,由第一子码cwAj的填补位padAj携带该码字的传输类型。只是借助CWj中空闲的填补位padBj将需要重传的CWIDi传递给第二节点。
S400,将CWj发送给第二节点,使第二节点根据CWIDi查找目标码字,并根据CWi的传输类型将目标码字进行重发。
所有根据CWIDi查找待重发的码字进行重发的方法都落入本发明的保护范围之内,本发明实施例还提供了一种第二节点的重传步骤,包括S420-S440。
S420,第二节点根据接收到的CWIDi,查询缓存得到目标码字;
S440,取出目标码字进行重传;
S460,依次取出缓存中目标码字之后的所有码字,其中,在目标码字之后重传的第k个码字CWi+k包括绑定的第一子码cwAi+k和第二子码cwBi+k,cwAi+k的填补位padi+k包括CWIDi+k以及CWi+k的传输类型,其中CWi+k的传输类型为重传类型,其中k的取值范围为1到K,K为第二节点向第一节点发送CWi之后且在重传目标码字之前已经向第一节点发送出去的码字数量。
需要说明的是。其中,缓存中缓存了预设时间内或者预设数量的已经发送的码字,当产生误码时,通过码字的身份信息可查到目标码字,将缓存中目标码字及其目标码字之后的所有已经发送出去的码字都进行重传。在进行重传时,需要将该重传码字的传输类型设置为重传类型。
作为一个优选实施例,S400还包括:
S410,第二节点在接收CWIDi之后,向系统缓存发送暂缓发送的标志信号,控制系统缓存中的码字暂停发送。
S450,当重传缓存中retryi的码字重传完毕时,第二节点继续发送系统缓存中的码字。
综上所述,本发明提供了一种数据重传方法,该方法应用于第一节点的物理层中的前向编解码模块,其利用前向编解码模块传输的码字CW包括绑定的两个第一子码cwA和第二子码cwB,当需要重传时,借助cwB中填补位传递需要对端重传的码字的身份信息,当第二节点解析到cwB的填补位的身份信息时,重传缓存中存储的具有相同身份信息的码字,达到通过前向编解码模块实现重传的目的。由于前向编解码模块重传所需要经过的逻辑较少,因此能够大幅度减少重传时间,将重传延时降低至125ns。由于在125ns的时间内传输的数据较少,重传码字需要占用的缓存也更小。且本发明提供的重传方法不需要发送其他额外码字或者数据包,只需要巧妙的借助正常传输的码字中数据块即可将需要重传的码字的身份信息传回,能够降低通信压力,降低拥塞情况。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
本发明的实施例还提供一种计算机程序产品,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明公开的范围由所附权利要求来限定。

Claims (10)

1.一种数据重传方法,其特征在于,应用于第一节点的物理层中的前向编解码模块,所述方法包括如下步骤:
S100,获取第二节点发送的第i个码字CWi
S200,对CWi进行校验,当校验失败时,提取CWi的身份信息CWIDi
S300,将CWIDi加入第一节点发送给第二节点的下一个码字CWj中,其中CWj包括绑定的第一子码cwAj和第二子码cwBj,所述cwAj的填补位padAj携带CWj的身份信息CWIDj以及CWj的传输类型,所述cwBj的填补位padBj携带CWIDi以及CWi的传输类型;其中CWi的传输类型为请求第二节点重发的校验失败待重传类型;
S400,将CWj发送给第二节点,使第二节点根据CWIDi查找目标码字,并根据CWi的传输类型将目标码字进行重发。
2.根据权利要求1所述的方法,其特征在于,S100中CWi包括:绑定的第一子码cwAi和第二子码cwBi,cwAi包括cwAi的有效数据位dataAi、填补位padAi和校验位PAi,padAi包括CWi的身份信息CWIDi和CWi的传输类型;cwBi包括cwBi的有效数据位dataBi、填补位padBi和校验位PBi
3.根据权利要求2所述的方法,其特征在于,所述CWi的传输类型为正常传输类型、校验失败待重传类型和重传类型中的任意一种。
4.根据权利要求2所述的方法,其特征在于,S200还包括校验步骤:
S210,对dataAi和dataBi分别进行校验和纠错,当dataAi和/或dataBi校验出错且无法纠正时,CWi校验失败;否则校验通过。
5.根据权利要求1所述的方法,其特征在于,S400还包括第二节点的重传步骤:
S420,第二节点根据接收到的CWIDi,查询缓存得到目标码字;
S440,取出目标码字进行重传;
S460,依次取出缓存中目标码字之后的所有码字,其中,在目标码字之后重传的第k个码字CWi+k包括绑定的第一子码cwAi+k和第二子码cwBi+k,cwAi+k的填补位padi+k包括CWIDi+k以及CWi+k的传输类型,其中CWi+k的传输类型为重传类型,其中k的取值范围为1到K,K为第二节点向第一节点发送CWi之后且在重传目标码字之前已经向第一节点发送出去的码字数量。
6.根据权利要求5所述的方法,其特征在于,S400还包括:
S410,第二节点在接收CWIDi之后,向系统缓存发送暂缓发送的标志信号,控制系统缓存中的码字暂停发送;以及
S450,当重传缓存中retryi的码字重传完毕时,第二节点继续发送系统缓存中的码字。
7.根据权利要求1所述的方法,其特征在于,S100之前还包括:当第二节点向第一节点发送CWi时,将CWi加入重传缓存中备份。
8.根据权利要求1所述的方法,其特征在于,所述前向编解码模块采用RS编码。
9.一种非瞬时性计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,其特征在于,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项的所述方法。
10.一种电子设备,其特征在于,包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。
CN202410185216.3A 2024-02-19 2024-02-19 一种数据重传方法、电子设备及存储介质 Pending CN118054885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410185216.3A CN118054885A (zh) 2024-02-19 2024-02-19 一种数据重传方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410185216.3A CN118054885A (zh) 2024-02-19 2024-02-19 一种数据重传方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN118054885A true CN118054885A (zh) 2024-05-17

Family

ID=91047730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410185216.3A Pending CN118054885A (zh) 2024-02-19 2024-02-19 一种数据重传方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN118054885A (zh)

Similar Documents

Publication Publication Date Title
US6516435B1 (en) Code transmission scheme for communication system using error correcting codes
JP3634800B2 (ja) パリティチェック結合を用いたハイブリッド自動再送要求を実施するシステム及び方法
US20210160003A1 (en) Networking Coding System in a Network Layer
US6445717B1 (en) System for recovering lost information in a data stream
US8386901B2 (en) Method, device and software application for transmitting data packets in a communication system
US8255560B2 (en) System for transmitting and receiving packets
US20040117722A1 (en) Performance of communication systems using forward error correction
US20030023915A1 (en) Forward error correction system and method for packet based communication systems
US7742501B2 (en) System and method for higher throughput through a transportation network
US20090138574A1 (en) Information processing and transportation architecture for data storage
US9979566B2 (en) Hybrid forward error correction and replay technique for low latency
US20230034209A1 (en) Data transmission method and network device
CN114499993A (zh) 一种基于单向光闸的高可靠性安全传输与控制系统及方法
JPH04296140A (ja) 複数のデータフレーム符号化方法
EP2191602B1 (en) Improved data structure boundary synchronization between a transmitter and receiver
US8185795B1 (en) Side channel for forward error correction used with long-haul IP links
CN114095117A (zh) 一种以太网错误帧的重传方法及相关装置
CN118054885A (zh) 一种数据重传方法、电子设备及存储介质
WO2023098430A1 (zh) 一种数据包的处理方法、通信装置及通信系统
WO2022105753A1 (zh) 网络数据编码传输方法及装置
CN114696963B (zh) 一种用于多核处理器系统片上网络的高可靠通信系统
CN117834095B (zh) 一种重传报文的方法、电子设备及存储介质
RU2216868C2 (ru) Система и способ осуществления гибридного автоматического запроса на повторение с использованием объединения проверки четности
US6981194B1 (en) Method and apparatus for encoding error correction data
WO2024022243A1 (zh) 数据传输方法、网络设备、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination