CN116915721A - 一种拥塞控制方法、装置、计算设备及可读存储介质 - Google Patents
一种拥塞控制方法、装置、计算设备及可读存储介质 Download PDFInfo
- Publication number
- CN116915721A CN116915721A CN202311169054.6A CN202311169054A CN116915721A CN 116915721 A CN116915721 A CN 116915721A CN 202311169054 A CN202311169054 A CN 202311169054A CN 116915721 A CN116915721 A CN 116915721A
- Authority
- CN
- China
- Prior art keywords
- network card
- rate
- congestion
- congestion control
- sending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 84
- 230000009467 reduction Effects 0.000 claims abstract description 81
- 238000011217 control strategy Methods 0.000 claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 13
- 238000012423 maintenance Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims 3
- 238000011002 quantification Methods 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000000630 rising effect Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/26—Flow control; Congestion control using explicit feedback to the source, e.g. choke packets
- H04L47/263—Rate modification at the source after receiving feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/11—Identifying congestion
- H04L47/115—Identifying congestion using a dedicated packet
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种拥塞控制方法、装置、计算设备及可读存储介质,该方法应用于第一网卡向第二网卡发送远程直接内存访问业务报文的过程,该方法包括:在第一网卡确定第一网卡发送RDMA业务报文至第二网卡时连续接收第二网卡发送的拥塞通知报文的情况下,第一网卡根据第一降速系数,将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率,第二速率小于第一速率。上述方法相较于第一网卡在接收拥塞通知报文时,通过DCQCN算法对发送速率进行降速,生成第一速率的方法,在第一速率的基础上进行额外降速,提升了DCQCN算法的动态控制性能,且利用了DCQCN算法的基础设施,易于实现。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种拥塞控制方法、装置、计算设备及可读存储介质。
背景技术
目前,远程直接数据存取(remote direct memory access,RDMA)技术越来越多地部署在数据中心中,为避免网络拥塞丢包给RDMA造成性能损失,通常采用数据中心量化拥塞通知(data center quantized congestion notification,DCQCN)算法进行网络拥塞调节。例如,发送端网卡根据DCQCN算法调节发送端网卡向接收端网卡发送业务报文的发送速率,可以持续地对发送速率进行升速维护,在网络丢包,发送端网卡接收到拥塞通知报文(congestion notification packet,CNP)的情况下,对发送速率进行降速维护。即使DCQNC算法已经进行过参数调优并且稳定状态下控速性能良好,但是在频繁的加流撤流过程,或者在被控流已经处于稳定状态后突然出现网络拥塞需要快速降速等场景下,网络丢包仍然难以避免,在这些被控流状态瞬间变动的场景下,DCQNC算法的降速未能快速反应。
发明内容
本申请实施例提供一种拥塞控制方法、装置、计算设备及可读存储介质,通过发送端设备包括的第一网卡在确定连续接收拥塞通知报文(congestion notificationpacket,CNP)的情况下,在数据中心量化拥塞通知(data center quantized congestionnotification,DCQCN)算法等网络拥塞控制算法降速得到的第一速率的基础上,再次根据第一降速系数进行降速,生成第二速率,可以实现发送速率的额外降速,提升DCQCN算法的动态控制性能,减少网络丢包等情况的发生。
第一方面,本申请提供了一种拥塞控制方法,应用于第一网卡向第二网卡发送远程直接内存访问(remote direct memory access,RDMA)业务报文的过程,该方法包括:第一网卡确定自上一次接收第二网卡发送的拥塞通知报文之后,是否通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护;在第一网卡未对第一网卡向第二网卡发送业务报文的发送速率进行升速维护,确定第一网卡发送RDMA业务报文至第二网卡时连续接收第二网卡发送的拥塞通知报文的情况下,第一网卡根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率,第二速率小于第一速率,其中,第一降速系数是根据指示连续接收拥塞通知报文的数量的第一计数确定的,第一计数是第一网卡在连续接收拥塞通知报文的情况下,将上一次接收拥塞通知报文对应的第二计数加一得到的,第二计数为非负整数。
在第一网卡确定第一网卡发送RDMA业务报文至第二网卡时未连续接收第二网卡发送的拥塞通知报文的情况下,第一网卡通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,其中,第一拥塞控制策略包括通过第一网卡和第二网卡之间的交换机检测网络路径是否发生拥塞,交换机在网络路径发生拥塞的情况下在业务报文上标注拥塞信息,第二网卡根据包含拥塞信息的业务报文返回拥塞通知报文至第一网卡,第一网卡通过数据中心量化拥塞通知DCQCN算法持续增加发送速率,或者,在接收拥塞通知报文的情况下通过DCQCN算法对发送速率进行降速,生成第一速率。
综上所述,本申请提供的拥塞控制方法通过第一降速系数对第一网卡根据第一拥塞控制策略生成的第一速率进行额外的降速,生成小于第一速率的第二速率,相较于当前第一网卡在连续接收第二网卡发送的拥塞通知报文的情况下,仅按照DCQCN算法对第一网卡向第二网卡发送业务报文的发送速率进行调整,生成第一速率的方法,可以在连续接收拥塞通知报文的情况下,对发送速率进行额外降速,提升了DCQCN算法的动态控制性能,且上述方法可以利用DCQCN算法的基础设施,易于实现。
在一种可能的实施方式中,第一网卡确定自上一次接收第二网卡发送的拥塞通知报文之后,是否通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护;在第一网卡未对第一网卡向第二网卡发送业务报文的发送速率进行升速维护的情况下,第一网卡确定第一网卡发送RDMA业务报文至第二网卡时连续接收第二网卡发送的拥塞通知报文。第一网卡在接收第二网卡发送的拥塞通知报文之后,通过确定自上一次接收拥塞通知报文到此次接收拥塞通知报文的过程中是否对发送速率进行升速维护,以确定此次接收拥塞通知报文是否是连续接收的,从而可以确定网络拥塞程度,在网络拥塞程序较高的情况下,执行本申请提供的拥塞控制方法。
在一种可能的实施方式中,在第一网卡确定第一网卡发送RDMA业务报文至第二网卡时出现连续接收第二网卡发送的拥塞通知报文的情况下,第一网卡根据接收的第二网卡发送的拥塞通知报文确定第一计数,第一计数用于确定第一降速系数。第一网卡根据连续接收的拥塞通知报文的数量确定第一计数,第一计数可以影响第一降速系数的取值,从而影响对发送速率进行额外降速的大小。
在一种可能的实施方式中,确定第一计数的具体过程如下:在第一网卡确定第一网卡发送RDMA业务报文至第二网卡时出现连续接收第二网卡发送的拥塞通知报文的情况下,第一网卡将上一次接收的第二网卡发送的拥塞通知报文对应的计数加一,得到第一计数,其中,上一次接收的第二网卡发送的拥塞通知报文对应的计数为非负整数。例如,第一网卡上一次接收的第二网卡发送的拥塞通知报文是接收的第一个拥塞通知报文,对应的计数为零,第一网卡在连续接收第二网卡发送的拥塞通知报文的情况下,将第一个拥塞通知报文对应的计数加一,得到数值为1的第一计数。根据第一计数的数值可以确定连续接收的拥塞通知报文的数量,可以反映网络拥塞程度,第一计数越大,网络拥塞程度越高,根据第一计数生成的第一降速系数越大。
在一种可能的实施方式中,第一网卡根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率的具体过程如下:第一网卡确定大于第一计数的第一最小整数,根据第一最小整数生成减性第一降速系数,其中,第一最小整数是2的次方数;第一网卡根据减性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。也就是说,将减性第一降速系数作为降速算法中的降速系数,将第一速率作为降速算法中的基准速率,计算得到新的第二速率。根据第一计数确定的减性第一降速系数生成第二速率,可以在存在网络拥塞的情况下,在根据DCQCN算法确定第一速率的基础上,进行额外降速,以提升DCQCN算法的动态控制性能,减少网络丢包等问题。
在一种可能的实施方式中,第一网卡根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率的具体过程如下:第一网卡确定大于第一计数的第二最小整数,根据第二最小整数生成乘性第一降速系数,其中,第二最小整数是2的倍数;第一网卡根据乘性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。也就是说,将乘性第一降速系数作为降速算法中的降速系数,将第一速率作为降速算法中的基准速率,计算得到新的第二速率。根据第一计数确定的乘性第一降速系数生成第二速率,可以实现在网络拥塞程度较高的情况下,在根据DCQCN算法确定第一速率的基础上,进行额外降速,以提升DCQCN算法的动态控制性能,减少网络丢包等问题。
在一种可能的实施方式中,该方法还包括:在第一网卡确定第一网卡发送RDMA业务报文至第二网卡时未连续接收拥塞通知报文的情况下,第一网卡根据第一拥塞控制策略对发送速率进行降速维护;或者,在未接收拥塞通知报文的情况下,第一网卡根据第一拥塞控制策略对发送速率进行升速维护。
第二方面,本申请提供了一种拥塞控制装置,应用于向第二网卡发送RDMA业务报文的第一网卡中,该装置包括接收模块,拥塞控制模块以及发送模块:接收模块,用于接收第二网卡发送的拥塞通知报文;拥塞控制模块,用于确定自上一次接收第二网卡发送的拥塞通知报文之后,是否通过所述第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护;拥塞控制模块,还用于在未对第一网卡向第二网卡发送业务报文的发送速率进行升速维护,确定第一网卡发送RDMA业务报文至第二网卡时连续接收第二网卡发送的拥塞通知报文的情况下,根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率,第二速率小于第一速率,其中,第一降速系数是根据指示连续接收拥塞通知报文的数量的第一计数确定的,第一计数是第一网卡在连续接收拥塞通知报文的情况下,将上一次接收拥塞通知报文对应的第二计数加一得到的,第二计数为非负整数;拥塞控制模块,还用于在确定第一网卡发送RDMA业务报文至第二网卡时未连续接收第二网卡发送的拥塞通知报文的情况下,通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,其中,第一拥塞控制策略包括通过第一网卡和第二网卡之间的交换机检测网络路径是否发生拥塞,交换机在网络路径发生拥塞的情况下在业务报文上标注拥塞信息,第二网卡根据包含拥塞信息的业务报文返回拥塞通知报文至第一网卡,拥塞控制模块通过数据中心量化拥塞通知DCQCN算法持续增加发送速率,或者,在接收模块接收拥塞通知报文的情况下通过DCQCN算法对发送速率进行降速,生成第一速率;发送模块,用于根据第一速率或者第二速率向第二网卡发送业务报文。
在一种可能的实施方式中,拥塞控制模块具体用于,确定大于第一计数的第一最小整数,根据第一最小整数生成减性第一降速系数,其中,第一最小整数是2的次方数;根据减性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。
在一种可能的实施方式中,拥塞控制模块具体用于,确定大于第一计数的第二最小整数,根据第二最小整数生成乘性第一降速系数,其中,第二最小整数是2的倍数;第一网卡根据乘性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。
在一种可能的实施方式中,拥塞控制模块还用于,在确定第一网卡发送RDMA业务报文至第二网卡时接收模块未连续接收拥塞通知报文的情况下,根据第一拥塞控制策略对发送速率进行降速维护;或者,在未接收拥塞通知报文的情况下,根据第一拥塞控制策略对发送速率进行升速维护。
第三方面,本申请提供了一种计算设备,该计算设备包括处理器和存储器,存储器存储计算机程序,处理器执行计算机程序,以使计算设备执行上述第一方面所述的方法。
第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有程序,程序在计算设备上运行时,使计算设备执行上述第一方面所述的方法。
本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本申请实施例提供的一种拥塞控制系统的结构示意图;
图2是本申请实施例提供的一种拥塞控制方法的流程图;
图3是本申请实施例提供的一种拥塞控制装置的结构示意图;
图4是本申请实施例提供的一种具体的拥塞控制装置的结构示意图;
图5是本申请实施例提供的一种计算设备的结构示意图。
具体实施方式
如图1所示,图1是本申请实施例提供的一种拥塞控制系统的结构示意图,该系统中包括发送端110、交换机120和接收端130,其中,发送端110包括第一网卡111,接收端130包括第二网卡131,发送端、交换机以及接收端之间通过网络相互连接。
发送端110和接收端130通过远程直接内存访问(remote direct memory access,RDMA)技术进行数据交换,其中,RDMA在以太网上运行称为RDMA穿越汇聚以太网(RDMA overconverged ethernet,RoCE)技术,具体实现中,为了实现RoCE技术,交换机是支持PFC(优先流控制)操作系统的交换机,第一网卡和第二网卡也需选择适配RoCE技术的网卡。
为了避免网络拥塞丢包给RoCE带来性能损失,常采用数据中心量化拥塞通知(data center quantized congestion notification,DCQCN)算法等进行网络拥塞调节。具体实现中,为了实现DCQCN算法,交换机是支持加权随机先期检测(weighted randomearly detection,WRED)和基于显示反馈的协议(explicit congestion notification,ECN)的交换机,交换机与第一网卡和第二网卡相结合,可以实现DCQCN算法的主要功能:拥塞点算法、响应点算法以及通知点算法。
在一种可能的实施方式中,交换机120作为拥塞点(congestion point ,CP),发送端的第一网卡111作为响应点(reaction point,RP),接收端的第二网卡131作为通知点(notification point,NP)。
第一网卡用于发送和接收业务报文,执行响应点算法,例如,调节第一网卡向第二网卡发送业务报文的发送速率,避免拥塞。在未接收到拥塞通知报文(congestionnotification packet,CNP)的情况下,第一网卡持续地增加第一网卡向第二网卡发送业务报文的发送速率,在接收到CNP的情况下,第一网卡根据响应点算法对发送速率进行降速。
交换机用于检测当前的网络路径的拥塞情况并标记拥塞信息,例如,交换机在端口队列超过预设阈值的情况下,在转发报文时会按照一定的概率给报文携带ECN拥塞标记(ECN字段设置为11),以表示拥塞情况,上述标记过程由WRED功能完成,交换机将携带拥塞标记的业务报文转发给下一跳的网络设备。
第二网卡用于发送和接收业务报文,执行通知点算法,第二网卡在接收到交换机发送的标注有ECN拥塞标记的业务报文转换为CNP报文发送给第一网卡,以使第一网卡进行发送速率的调节,在一种可能的实施方式中,第二网卡可以执行第一网卡的功能,第一网卡也可执行第二网卡的功能,对此本申请不作具体限定,此处不详细赘述。
上述本申请提供的拥塞控制系统仅为一种可能的实施方式,发送端和接收端可以是本地数据中心服务器、无线通讯基站设备、个人终端通讯电子设备、智能化车辆以及其他配置有支持RDMA网关的设备等,第一网卡和第二网卡也可以独立地部署在拥塞控制系统中,对此本申请不作具体限定。拥塞控制系统还可以包括更多的交换机以及网关等部件,对此本申请不作具体限定。
当前,在网络拥塞丢包,第一网卡接收到第二网卡发送的拥塞通知报文的情况下,第一网卡根据DCQCN算法对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,通过多次迭代收敛到稳定的速率分布。即使DCQNC算法已经进行过参数调优并且稳定状态下控速性能良好,但是在频繁的加流撤流过程,或者在被控流已经处于稳定状态后突然出现网络拥塞需要快速降速等场景下,网络丢包仍然难以避免,在这些被控流状态瞬间变动的场景下,DCQNC算法的降速未能快速反应。
因此,本申请提供了一种拥塞控制方法,通过在利用DCQCN算法对第一网卡向第二网卡发送业务报文的发送速率进行降速,生成第一速率的基础上,利用第一降速系数对第一速率额外进行降速,生成小于第一速率的第二速率,从而实现在网络拥塞的情况下,额外对发送速率进行降速,提升DCQCN算法的动态控制性能,减少网络丢包等情况的发生,并且上述过程利用DCQCN算法的基础设施,易于实现。
如图2所示,图2是本申请实施例提供的一种拥塞控制方法的流程图,该方法应用于图1所示的系统中的第一网卡中,该方法包括以下多个步骤。
步骤S210:在未接收CNP报文的情况下,第一网卡根据通过第一拥塞控制策略生成的第一速率向第二网卡发送业务报文。
在未接收CNP报文的情况下,第一网卡根据第一拥塞控制策略生成的第一速率,向第二网卡发送业务报文,其中,第一拥塞控制策略可以是DCQCN算法,对此本申请不作具体限定。第一网卡根据DCQCN算法持续增加第一网卡向第二网卡发送业务报文的发送速率,生成一个或者多个第一速率,具体过程此处不详细赘述。
步骤S220:第一网卡接收第二网卡发送的CNP报文,并确定是否连续接收CNP报文。
由于第一网卡在发送业务报文的发包长度到达计数阈值,或者,连续发送业务报文的发包时间到达时间阈值的情况下,才根据第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护。因此,第一网卡在接收第二网卡发送的CNP报文后,通过确定自上一次接收第二网卡发送的CNP报文之后,是否通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护的情况,确定是否连续接收CNP报文。
在第一网卡确定自上一次接收第二网卡发送的CNP报文后,通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护的情况下,第一网卡确定未连续接收CNP报文。
在第一网卡确定自上一次接收第二网卡发送的CNP报文后,未通过第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护的情况下,第一网卡确定连续接收CNP报文。
第一网卡判断是否连续接收CNP报文,可以确定拥塞程度,在未连续接收CNP报文的情况下,拥塞程度较低,在连续接收CNP报文的情况下,拥塞程度较高,可以确定在接收到CNP报文后,根据哪种策略对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,从而提升网络拥塞控制算法的动态控制性能。
步骤S230:在第一网卡连续接收CNP报文的情况下,第一网卡根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从第一速率降低到第二速率。
在第一网卡连续接收CNP报文的情况下,第一网卡根据第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,生成第一速率,并根据CNP报文生成第一降速系数,根据第一降速系数和第一速率生成第二速率,确定第一网卡向第二网卡发送业务报文的发送速率为第二速率,第二速率小于第一速率。
第一网卡根据CNP报文生成第一降速系数,需要先根据CNP报文确定第一计数。在第一网卡确定接收第二网卡CNP报文的情况下,第一网卡将上一次接收的第二网卡发送的CNP报文对应的计数加一,得到第一计数,其中,上一次接收的第二网卡发送的CNP报文对应的计数为非负整数。
在一种可能的实施方式中,第一网卡上一次接收的第二网卡发送的CNP报文是接收的第一个拥塞通知报文,对应的计数为零,第一网卡在连续接收第二网卡发送的拥塞通知报文的情况下,将第一个拥塞通知报文对应的计数加一,得到数值为1的第一计数,如第一网卡继续连续接收CNP报文,那么下一次接收的CNP报文对应的计数为2,如第一网卡下一次接收的CNP报文不是连续接收的CNP报文,则下一次接收的CNP报文对应的计数为0。根据第一计数的数值可以确定连续接收的拥塞通知报文的数量,可以反映网络拥塞程度,第一计数越大,网络拥塞程度越高,根据第一计数生成的第一降速系数越大。
在确定第一计数后,第一网卡根据第一计数确定第一降速系数。
在一种可能的实施方式中,第一网卡确定大于第一计数的第一最小整数,其中,第一最小整数是2的次方数,具体计算公式如下:
其中,cnt为第一计数,在确定第一最小整数后,第一网卡根据第一最小整数,生成减性第一降速系数。具体地,第一网卡根据/>,生成减性第一降速系数q,具体计算公式如下:
在确定减性第一降速系数q的情况下,第一网卡根据减性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从第一速率降低到第二速率,也就是,将减性第一降速系数q作为DCQCN算法的降速算法中的降速系数,将第一速率作为DCQCN算法的降速算法中的基准速率,从而在第一速率的基础上进行额外降速,生成第二速率,提升DCQCN算法的动态控制性能,并且上述过程较为简单,可以利用DCQCN算法的基础设施,易于实现。
在另一种可能的实施方式中,第一网卡确定大于第一计数的第二最小整数,其中,第二最小整数是2的倍数,具体计算公式如下:
其中,cnt为第一计数,在确定第二最小整数后,第一网卡根据第二最小整数,生成乘性第一降速系数。具体地,第一网卡根据/>,生成乘性第一降速系数v,具体计算公式如下:
在确定乘性第一降速系数v的情况下,第一网卡根据乘性第一降速系数以及DCQCN算法的降速算法,将第一网卡向第二网卡发送业务报文的发送速率从第一速率降低到第二速率,也就是,将乘性第一降速系数v作为DCQCN算法的降速算法中的降速系数,将第一速率作为DCQCN算法的降速算法中的基准速率,从而对发送速率进行额外降速,生成第二速率,提升DCQCN算法的动态控制性能,减少网络丢包等情况,并且上述过程可以利用DCQCN算法的基础设施,易于实现。
步骤S240:在第一网卡未连续接收CNP报文的情况下,第一网卡根据第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,生成第一速率。
在第一网卡未连续接收CNP报文的情况下,第一网卡还是根据DCQCN算法等对第一网卡向第二网卡发送业务报文的发送速率进行降速维护,生成第一速率,此时不存在频繁加流等情况,采用DCQCN算法相比于本申请提供的拥塞控制方法更加简单,可以节约计算资源,可以解决网络丢包等情况。
综上所述,本申请提供的一种拥塞控制方法,通过第一网卡在确定连续接收拥塞通知报文的情况下,在根据DCQCN算法等网络拥塞控制算法降速得到的第一速率的基础上,再次根据第一降速系数进行额外的降速,生成第二速率,可以实现在网络拥塞的情况下,可以提升DCQCN算法的动态控制性能,减少网络丢包等情况的发生。
如图3所示,图3本申请实施例提供的一种拥塞控制装置的结构示意图,该装置应用于图1所示系统中的第一网卡中,该拥塞控制装置300包括接收模块310,拥塞控制模块320以及发送模块330。其中,接收模块310,用于接收第二网卡发送的拥塞通知报文;拥塞控制模块320,用于确定自上一次接收第二网卡发送的拥塞通知报文之后,是否通过所述第一拥塞控制策略对第一网卡向第二网卡发送业务报文的发送速率进行升速维护;还用于在未对第一网卡向第二网卡发送业务报文的发送速率进行升速维护,确定第一网卡发送RDMA业务报文至第二网卡时连续接收第二网卡发送的拥塞通知报文的情况下,根据第一降速系数将第一网卡向第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率,第二速率小于第一速率,其中,第一降速系数是根据指示连续接收拥塞通知报文的数量的第一计数确定的,第一计数是第一网卡在连续接收拥塞通知报文的情况下,将上一次接收拥塞通知报文对应的第二计数加一得到的,第二计数为非负整数;拥塞控制模块,还用于在确定第一网卡发送RDMA业务报文至第二网卡时未连续接收第二网卡发送的拥塞通知报文的情况下,通过第一拥塞控制策略对第一网卡对第二网卡的访问速率进行降速维护,其中,第一拥塞控制策略包括通过第一网卡和第二网卡之间的交换机检测网络路径是否发生拥塞,交换机在网络路径发生拥塞的情况下,在业务报文上标注拥塞信息,第二网卡根据包含拥塞信息的业务报文返回拥塞通知报文至第一网卡,拥塞控制模块通过数据中心量化拥塞通知DCQCN算法持续增加发送速率,或者,在接收模块接收拥塞通知报文的情况下通过DCQCN算法对发送速率进行降速,生成第一速率;发送模块330,用于根据第一速率或者第二速率向第二网卡发送业务报文。
接收模块用于执行图2所示的步骤S220,拥塞控制模块用于执行图2所示的步骤S210~S240,发送模块用于根据拥塞控制模块确定的发送速率向第二网卡发送业务报文。
在一种可能的实施方式中,上述拥塞控制装置只是拥塞控制装置一种可能的实现方式,拥塞控制装置还可以包括更多或者更少的模块,对此本申请不作具体限定。
在一种可能的实施方式中,上述拥塞控制模块可以包括多个单元,如图4所示,图4是本申请实施例提供的一种具体的拥塞控制装置的结构示意图,该装置中包括接收模块310,拥塞控制模块320以及发送模块330,拥塞控制模块320中包括发包计数单元321、发包计时单元322、降速系数选择单元323、速率计算单元324以及速率限制单元325。
其中,发包计数单元321和发包计时单元322用于在接收模块310未接收到第二网卡发送的拥塞通知报文的情况下,对第一网卡向第二网卡发送业务报文的发送速率进行升速控制。例如,在发送模块330发送业务报文的发包长度到达计数阈值,或者,连续发送业务报文的发包时间到达时间阈值的情况下,发包计数单元321或者发包计时单元322向速率计算单元发送通知,以使速率计算单元根据DCQCN算法对第一网卡向第二网卡发送业务报文的发送速率进行升速计算。
速率计算单元324除用于升速计算,还用于对第一网卡向第二网卡发送业务报文的发送速率进行降速操作,速率计算单元可以直接根据DCQCN算法进行降速,或者根据降速系数选择单元323发送的第一降速系数在DCQCN算法降速的基础上进行额外降速。
在接收模块接收到第二网卡发送的拥塞通知报文的情况下,接收模块将接收CNP的通知发送给降速系数选择单元,降速系数选择单元323用于确定自上一次接收CNP通知之后,速率计算单元是否通过DCQCN算法对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升速控制,从而确定该CNP是否是接收模块连续接收的。在确定该CNP不是接收模块连续接收的情况下,降速系数选择单元不需选择第一降速系数发送给速率计算单元,速率计算单元仍根据DCQCN算法进行降速,生成第一速率。在确定该CNP是接收模块连续接收的情况下,降速系数选择单元根据CNP确定第一计数,并根据第一计数确定第一降速系数,将第一降速系数发送给速率计算单元。速率计算单元在根据DCQCN算法进行降速计算,生成第一速率后,再根据第一降速系数和第一速率进行额外的降速计算,生成第二速率,第二速率小于第一速率。
速率计算单元用于升降速控制,将升降速计算得到的速率发送给速率限制单元325,速率限制单元用于根据速率计算单元发送的速率限制发送模块发送业务报文的速率。
需要说明的是,图4仅是一种本申请提供的拥塞控制装置可能的实施方式,接收模块310,拥塞控制模块320以及发送模块330中还可以包括更多或者更少的部件,对此本申请不作具体限定。
如图5所示,图5是本申请提供的一种计算设备的结构示意图,可以应用于图1所示系统中的第一网卡,该计算设备500包括处理器510、存储器520、通信接口530以及总线540。其中,处理器、存储器、通信接口可以通过内部总线相互连接也可以通过无线传输等手段实现通信。
处理器510可以由至少一个通用处理器构成,例如中央处理器(centralprocessing unit, CPU),或者CPU和硬件芯片的组合。上述硬件芯片可以是专用集成电路(application-specific integrated circuit, ASIC)、可编程逻辑器件(programmablelogic device, PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complexprogrammable logic device, CPLD)、现场可编程逻辑门阵列(field-programmable gatearray, FPGA)、通用阵列逻辑(generic array logic, GAL)或其任意组合。处理器510用于执行各种类型的数字存储指令。处理器可以通过执行相应的指令,实现图2所示的图中的任意步骤。
存储器520可以是易失性存储器(volatile memory),例如随机存取存储器(random access memory, RAM)、动态随机存储器(dynamic RAM, DRAM)、静态随机存储器(static RAM, SRAM)、同步动态随机存储器(synchronous dynamic RAM, SDRAM)、双倍速率同步动态随机存储器(double data rate RAM, DDR)、高速缓存(cache)等等,存储器还可以包括上述种类的组合。存储器520中可以包括程序以及数据,处理器510通过执行程序代码可以执行图2中的步骤,存储器还可以存储发送业务报文的数量以及各个业务报文对应的时间点,接收拥塞通知报文的数量以及各个拥塞通知报文对应的时间点等等。
通信接口530可以用于实现数据交互,例如,第一网卡将业务报文发送给第二网卡等,本申请对此不作具体限定。
需要说明的,图5仅仅是本申请实施例的一种可能的实现方式,实际应用中,计算设备还可以包括更多或更少的部件,这里不作限制。
本申请实施例,还提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在处理器上运行时,图2所示的方法流程得以实现。
本申请实施例,还提供一种计算机程序产品,当计算机程序产品在处理器上运行时,图2所示的方法流程得以实现。
在计算机上加载或执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。
计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含至少一个可用介质集合的服务器、数据中心等数据存储节点。可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,高密度数字视频光盘(digital video disc, DVD)、或者半导体介质)。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (7)
1.一种拥塞控制方法,其特征在于,应用于第一网卡向第二网卡发送远程直接内存访问RDMA业务报文的过程,所述方法包括:
所述第一网卡确定自上一次接收所述第二网卡发送的拥塞通知报文之后,是否通过第一拥塞控制策略对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升速维护;
在第一网卡未对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升速维护,确定所述第一网卡发送所述RDMA业务报文至所述第二网卡时连续接收所述第二网卡发送的拥塞通知报文的情况下,所述第一网卡根据第一降速系数将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据所述第一拥塞控制策略生成的第一速率降低到第二速率,所述第二速率小于所述第一速率,其中,所述第一降速系数是根据指示连续接收所述拥塞通知报文的数量的第一计数确定的,所述第一计数是所述第一网卡在连续接收所述拥塞通知报文的情况下,将上一次接收所述拥塞通知报文对应的第二计数加一得到的,所述第二计数为非负整数;
在第一网卡确定所述第一网卡发送所述RDMA业务报文至所述第二网卡时未连续接收所述第二网卡发送的所述拥塞通知报文的情况下,所述第一网卡通过所述第一拥塞控制策略对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升降速维护;其中,所述第一拥塞控制策略包括通过所述第一网卡和所述第二网卡之间的交换机检测网络路径是否发生拥塞,所述交换机在所述网络路径发生拥塞的情况下在所述业务报文上标注拥塞信息,所述第二网卡根据包含所述拥塞信息的所述业务报文返回拥塞通知报文至所述第一网卡,所述第一网卡通过数据中心量化拥塞通知DCQCN算法持续增加发送速率,或者,在接收所述拥塞通知报文的情况下通过所述DCQCN算法对所述发送速率进行降速,生成所述第一速率。
2.根据权利要求1所述的方法,其特征在于,所述第一网卡根据第一降速系数将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率包括:
所述第一网卡确定大于所述第一计数的第一最小整数,根据所述第一最小整数生成减性第一降速系数,其中,所述第一最小整数是2的次方数;
所述第一网卡根据所述减性第一降速系数以及所述DCQCN算法的降速算法,将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。
3.根据权利要求1所述的方法,其特征在于,所述第一网卡根据第一降速系数将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率包括:
所述第一网卡确定大于所述第一计数的第二最小整数,根据所述第二最小整数生成乘性第一降速系数,其中,所述第二最小整数是2的倍数;
所述第一网卡根据所述乘性第一降速系数以及所述DCQCN算法的降速算法,将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
在所述第一网卡确定所述第一网卡发送所述RDMA业务报文至所述第二网卡时未连续接收所述拥塞通知报文的情况下,所述第一网卡根据所述第一拥塞控制策略对所述发送速率进行降速维护;或者,在未接收所述拥塞通知报文的情况下,所述第一网卡根据所述第一拥塞控制策略对所述发送速率进行升速维护。
5.一种拥塞控制装置,应用于向第二网卡发送远程直接内存访问RDMA业务报文的第一网卡中,其特征在于,所述装置包括接收模块,拥塞控制模块以及发送模块:
所述接收模块,用于接收所述第二网卡发送的拥塞通知报文;
所述拥塞控制模块,用于确定自上一次接收所述第二网卡发送的拥塞通知报文之后,是否通过所述第一拥塞控制策略对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升速维护;
所述拥塞控制模块,还用于在未对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升速维护,确定所述第一网卡发送所述RDMA业务报文至所述第二网卡时连续接收所述第二网卡发送的拥塞通知报文的情况下,根据第一降速系数将所述第一网卡向所述第二网卡发送业务报文的发送速率从根据第一拥塞控制策略生成的第一速率降低到第二速率,所述第二速率所述第一速率,其中,所述第一降速系数是根据指示连续接收所述拥塞通知报文的数量的第一计数确定的,所述第一计数是所述第一网卡在连续接收所述拥塞通知报文的情况下,将上一次接收所述拥塞通知报文对应的第二计数加一得到的,所述第二计数为非负整数;
所述拥塞控制模块,还用于在确定所述第一网卡发送所述RDMA业务报文至所述第二网卡时未连续接收所述第二网卡发送的所述拥塞通知报文的情况下,通过所述第一拥塞控制策略对所述第一网卡向所述第二网卡发送业务报文的发送速率进行升降速维护;其中,所述第一拥塞控制策略包括通过所述第一网卡和所述第二网卡之间的交换机检测网络路径是否发生拥塞,所述交换机在网络路径发生拥塞的情况下在所述业务报文上标注拥塞信息,所述第二网卡根据包含所述拥塞信息的所述业务报文返回拥塞通知报文至所述第一网卡,所述拥塞控制模块通过数据中心量化拥塞通知DCQCN算法持续增加发送速率,或者,在所述接收模块接收所述拥塞通知报文的情况下通过所述DCQCN算法对所述发送速率进行降速,生成所述第一速率;
所述发送模块,用于根据所述第一速率或者所述第二速率向所述第二网卡发送业务报文。
6.一种计算设备,其特征在于,所述计算设备包括处理器和存储器,所述存储器存储计算机程序,所述处理器执行所述计算机程序,以使所述计算设备执行如权利要求1至4任一项所述的方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序在计算设备上运行时,使所述计算设备执行如权利要求1至4任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311169054.6A CN116915721B (zh) | 2023-09-12 | 2023-09-12 | 一种拥塞控制方法、装置、计算设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311169054.6A CN116915721B (zh) | 2023-09-12 | 2023-09-12 | 一种拥塞控制方法、装置、计算设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116915721A true CN116915721A (zh) | 2023-10-20 |
CN116915721B CN116915721B (zh) | 2023-12-19 |
Family
ID=88356955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311169054.6A Active CN116915721B (zh) | 2023-09-12 | 2023-09-12 | 一种拥塞控制方法、装置、计算设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116915721B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018001222A1 (zh) * | 2016-06-27 | 2018-01-04 | 中兴通讯股份有限公司 | 数据传输缓存队列分配方法及装置和计算机存储介质 |
CN108418767A (zh) * | 2018-02-09 | 2018-08-17 | 华为技术有限公司 | 数据传输方法、设备及计算机存储介质 |
CN109417514A (zh) * | 2018-03-06 | 2019-03-01 | 华为技术有限公司 | 一种报文发送的方法、装置和存储设备 |
CN113746744A (zh) * | 2020-05-30 | 2021-12-03 | 华为技术有限公司 | 网络拥塞的控制方法、装置、设备、系统及存储介质 |
CN114143827A (zh) * | 2020-09-03 | 2022-03-04 | 华为技术有限公司 | RoCE网络拥塞控制的方法及相关装置 |
CN116527593A (zh) * | 2023-07-03 | 2023-08-01 | 珠海星云智联科技有限公司 | 网络流量拥塞控制方法及相关装置 |
WO2023142937A1 (zh) * | 2022-01-27 | 2023-08-03 | 华为技术有限公司 | 一种网络拥塞控制方法及相关装置 |
CN116545933A (zh) * | 2023-07-06 | 2023-08-04 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 网络拥塞控制方法、装置、设备及存储介质 |
CN116566921A (zh) * | 2023-07-04 | 2023-08-08 | 珠海星云智联科技有限公司 | 远程直接内存访问读取的拥塞控制方法、系统及存储介质 |
-
2023
- 2023-09-12 CN CN202311169054.6A patent/CN116915721B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018001222A1 (zh) * | 2016-06-27 | 2018-01-04 | 中兴通讯股份有限公司 | 数据传输缓存队列分配方法及装置和计算机存储介质 |
CN108418767A (zh) * | 2018-02-09 | 2018-08-17 | 华为技术有限公司 | 数据传输方法、设备及计算机存储介质 |
CN109417514A (zh) * | 2018-03-06 | 2019-03-01 | 华为技术有限公司 | 一种报文发送的方法、装置和存储设备 |
CN113746744A (zh) * | 2020-05-30 | 2021-12-03 | 华为技术有限公司 | 网络拥塞的控制方法、装置、设备、系统及存储介质 |
CN114143827A (zh) * | 2020-09-03 | 2022-03-04 | 华为技术有限公司 | RoCE网络拥塞控制的方法及相关装置 |
WO2023142937A1 (zh) * | 2022-01-27 | 2023-08-03 | 华为技术有限公司 | 一种网络拥塞控制方法及相关装置 |
CN116566907A (zh) * | 2022-01-27 | 2023-08-08 | 华为技术有限公司 | 一种网络拥塞控制方法及相关装置 |
CN116527593A (zh) * | 2023-07-03 | 2023-08-01 | 珠海星云智联科技有限公司 | 网络流量拥塞控制方法及相关装置 |
CN116566921A (zh) * | 2023-07-04 | 2023-08-08 | 珠海星云智联科技有限公司 | 远程直接内存访问读取的拥塞控制方法、系统及存储介质 |
CN116545933A (zh) * | 2023-07-06 | 2023-08-04 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 网络拥塞控制方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116915721B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10097379B2 (en) | Managing communication congestion for internet of things devices | |
US9923821B2 (en) | Managing communication congestion for internet of things devices | |
US20170187597A1 (en) | Managing Communication Congestion For Internet of Things Devices | |
US20210067453A1 (en) | Data transmission method and apparatus | |
US11888744B2 (en) | Spin-leaf network congestion control method, node, system, and storage medium | |
US20070097864A1 (en) | Data communication flow control | |
EP3479530B1 (en) | Message schema control | |
KR101017532B1 (ko) | 통신 시스템에서 흐름 제어 방법 | |
US20070226347A1 (en) | Method and apparatus for dynamically changing the TCP behavior of a network connection | |
CN111107017A (zh) | 一种交换机报文拥塞的处理方法、设备以及存储介质 | |
KR20020035623A (ko) | 사용 레이트의 영속-벡터-기반 변경 시스템 및 방법 | |
US20130279339A1 (en) | Communication device and method | |
CN113141314B (zh) | 一种拥塞控制方法及设备 | |
CN113328953B (zh) | 网络拥塞调整的方法、装置和存储介质 | |
US10764219B2 (en) | Message schema control | |
CN116980342B (zh) | 一种多链路聚合传输数据的方法和系统 | |
CN116915721B (zh) | 一种拥塞控制方法、装置、计算设备及可读存储介质 | |
CN116915722B (zh) | 一种网络拥塞调节方法、装置、计算设备及可读存储介质 | |
KR20200015303A (ko) | 패킷 보고 방법과 시스템 | |
CN114070795A (zh) | 拥塞门限确定方法、装置、设备及存储介质 | |
Irawan et al. | Performance evaluation of queue algorithms for video-on-demand application | |
US10652159B2 (en) | Mobile packet data rate control based on radio load and other measures | |
US9088959B1 (en) | Paging back-off timer | |
CN117061438A (zh) | 一种拥塞控制方法以及装置 | |
US20230328577A1 (en) | Adaptive wireless packet filtering control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |