CN114124830A - 一种面向数据中心多应用场景的rdma服务质量保证方法及系统 - Google Patents
一种面向数据中心多应用场景的rdma服务质量保证方法及系统 Download PDFInfo
- Publication number
- CN114124830A CN114124830A CN202111375359.3A CN202111375359A CN114124830A CN 114124830 A CN114124830 A CN 114124830A CN 202111375359 A CN202111375359 A CN 202111375359A CN 114124830 A CN114124830 A CN 114124830A
- Authority
- CN
- China
- Prior art keywords
- delay
- message
- sensitive
- bandwidth
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000275 quality assurance Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000004891 communication Methods 0.000 claims abstract description 13
- 230000005540 biological transmission Effects 0.000 claims description 12
- 238000002955 isolation Methods 0.000 claims description 5
- 230000000737 periodic effect Effects 0.000 claims 1
- 238000012856 packing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0852—Delays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/215—Flow control; Congestion control using token-bucket
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2425—Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
- H04L47/2433—Allocation of priorities to traffic types
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
- H04L47/2441—Traffic characterised by specific attributes, e.g. priority or QoS relying on flow classification, e.g. using integrated services [IntServ]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种面向数据中心多应用场景的RDMA服务质量保证方法及系统,流量发送方根据提交发送请求时对数据的优先级标识和数据大小,将数据打标为延迟敏感型或带宽敏感型,对于延迟敏感型流量数据,流量发送方仅测量每条消息的完成时间并进一步计算出每条消息的端上排队延迟,对于带宽敏感型流量数据,流量发送方根据计算得到的排队延迟控制带宽敏感流量发送速率;系统中,通过应用进程中网络通信线程模块和服务质量线程模块实现数据打包分类、延迟判断计算和调节发送速率。本发明在面对数据中心复杂的流量模型是,准确传达描述并调节发送速率,在保证低延迟的同时实现了高带宽的效果。
Description
技术领域
本发明属于数据通信服务领域,具体涉及一种面向数据中心多应用场景的RDMA服务质量保证方法及系统。
背景技术
数据中心支撑着当前大量互联网业务,包括在线搜索,直播为代表的追求低延迟的业务,以存储,AI为代表的追求高带宽的业务。因此低延迟和高带宽成为数据中心应用的基本需求。而传统的TCP/IP网络由于嵌入内核的复杂协议栈和数据路径上的多次内存拷贝,越来越无法满足应用对于低延迟高带宽的需求,成为整个分布式系统中的性能瓶颈。因此越来越多的数据中心解决方案选择将网络协议栈卸载到专用硬件上,充分发挥硬件的处理能力,RDMA(Remote Direct MemoryAccess,远程直接数据存储)技术就是其中的一个典型方案。RDMA技术通过协议栈下沉,内核旁路等手段实现在远端CPU不参与的情况下,直接访问远端内存,从而提供了低延迟和高带宽。RoCEv2协议的出现更是以能够兼容现有以太网设施的优势使得RDMA技术正越来越多的被用来加速数据中心内的网络传输,并逐渐成为数据中心高速网络通信的主流方案。
然而,简单的将现有的数据中心应用中的网络传输模块替换成原生的RDMA通信接口,并不能充分释放RDMA的性能,反而会发生意想不到的性能瓶颈问题。这主要是因为数据中心各类应用有各自的流量特点和性能需求,且不同的应用之间可能存在对网络资源的竞争关系;此外不管在何种规模的数据中心中,各类应用都是分布式的部署在集群中的各个节点上,而为了资源利用的最大化,通常每个节点上都会服务各种不同的应用,此时不同的应用会共享同一个节点的网络资源,进而就会引发不同应用之间的资源竞争导致的服务质量问题。例如高带宽的存储业务会占用大量的网络带宽从而影响低延迟的搜索业务的服务质量。现有的解决方案根据数据中心内的流量特点将流量分为延迟敏感流量和带宽敏感流量,通过对不同的网络流量根据其特点进行打标,同时在网卡上启用硬件优先级队列来隔离这两种流量。但是在真实的数据中心中,情况往往复杂的多。因为RoCE允许RDMA技术实现在传统的以太网之上,因此不同的协议(用户态协议,TCP,RDMA)的流量将共享网络节点上的RDMA网卡,现有方案选择将不同协议的流量映射到不同的硬件队列上从而达到性能隔离的目的。另一方面每个网络协议都承载在各类应用,而不同的应用同样需要隔离,但是目前兼容以太网的RDMA网卡上最多支持8个硬件优先级队列,因此不同类型的流量将不可避免的出现在同一个硬件队列中。综上所述当前网卡提供的硬件优先级队列的数量是无法满足对数据中心各类应用进行性能隔离的需求的。
发明内容
发明目的:本发明提供一种面向数据中心多应用场景的RDMA服务质量保证方法及系统,可以保证各类业务的性能指标和网卡硬件资源的充分利用。
技术方案:本发明提供一种面向数据中心多应用场景的RDMA服务质量保证方法,具体包括以下步骤:
(1)流量发送方根据提交发送请求时对数据的优先级标识和数据大小,将数据打标为延迟敏感型或带宽敏感型;
(2)对于延迟敏感型流量数据,流量发送方仅测量每条消息的完成时间并进一步计算出每条消息的端上排队延迟;
(3)对于带宽敏感型流量数据,流量发送方根据计算得到的排队延迟控制带宽敏感流量发送速率。
进一步地,所述步骤(1)包括以下步骤:
(11)若上层应用已指明消息为延迟敏感型或带宽敏感型,则根据指明信息执行打标;
(12)若上层应用未指明消息的类型,则有流量发送方根据消息的大小判断消息的类型;设定有划分延迟敏感消息和带宽敏感消息的界限阈值,当消息大小大于该阈值时,将其标记为延迟敏感型流量,反之则标记为带宽敏感型流量。
进一步地,所述步骤(2)包括以下步骤:
(21)流量的发送方记录延迟敏感消息被提交到RDMA发送队列的时间,作为消息的提交时间;
(22)流量的发送方记录延迟敏感消息对应的完成标识出现在RDMA完成队列中的时间,作为消息的完成时间;
(23)流量的发送方将消息的完成时间减去消息的提交时间得到消息的整体延迟;并进一步将消息的整体延迟划分为消息的端上延迟和网络延迟;
(24)流量的发送方将最近一次完成标识产生时间之前一个网络往返延迟的时间作为网卡开始处理当前消息的时间;
(25)流量的发送方将网卡开始处理当前消息的时间减去消息的提交时间得到该消息的端上排队延迟,并且用该消息的完成时间减去发送方网卡开始处理该消息的时间得到新的网络往返延迟;
(26)当有新的延迟敏感消息需要发送时,流量的发送方重复步骤(21)-(25),动态地更新延迟敏感消息的网络往返延迟,提供给下一个发送周期使用;同时流量的发送方维护一个滑动窗口的数据结构用于存储每个发送周期获得的端上排队延迟。
进一步地,所述步骤(3)包括以下步骤:
(31)在初始阶段,流量发送方首先将带宽敏感型流量的发送速率设置为网卡的最大带宽;
(32)流量的发送方设定调整带宽敏感流量的发送速率的依据的延迟敏感消息的目标排队延迟;
(33)若当前的延迟敏感消息的端上排队高于目标延迟,对带宽敏感流量的发送速率执行减半操作,反之则线性增加带宽敏感流量的发送速率。
进一步地,所述阈值为保证带宽利用率的带宽安全阈值,若当前的排队尾延迟大于设定的目标延迟,对带宽敏感流量的发送速率减小当前发送速率和带宽安全阈值的差的一半。
基于相同的发明构思,本发明还提供一种面向数据中心多应用场景的RDMA服务质量保证系统,所述系统运行在具备RDMA网卡和RDMA传输能力的服务器节点上的应用进程中;所述应用进程包括网络通信线程模块和服务质量线程模块;所述网络通信线程模块为应用连接配置的服务质量插件;所述服务质量线程模块包括应用进程中的服务质量线程;所述服务质量插件和服务质量线程共同对流量数据完成打标分类为延迟敏感型和带宽敏感型并性能隔离,根据延迟敏感流量在服务器节点上的排队延迟作为服务质量问题严重程度的信号和通过控制带宽敏感流量的发送速率来缓解服务质量问题。
进一步地,所述服务质量插件一方面负责测量应用连接发送的每一个延迟敏感消息的端上排队延迟,维护一个滑动窗口,存储近期测量的排队延迟,提供给服务质量线程定期获取;另一方面负责维护用于控制带宽敏感消息的发送速率的令牌桶。
进一步地,所述服务质量线程一方面负责定期收集应用进程内部其他所有网络通信线程的网络信息,包括延迟敏感消息的端上排队延迟和带宽敏感消息的发送速率;另一方面负责根据当前延迟敏感消息的线上排队延迟情况,计算出新的速率分配方案并下发至各个连接的服务质量插件中。
有益效果:与现有技术相比,本发明具有如下显著优点:面对数据中心复杂的流量模型,从软件方面量化延迟敏感消息在发送端侧被阻塞的情况,并准确传达描述;发现不同类型流量之间的网络资源竞争关系,对其进行性能隔离;通过准确描述队头阻塞的情况为依据,动态调整带宽敏感流量的发送速率,更好的起到了保证低延迟且高带宽的目的。
附图说明
图1为本发明的RDMA服务质量保证方法流程图;
图2为本发明的RDMA服务质量保证系统的架构图;
图3为测量延迟敏感消息端上排队延迟示意图;
图4为服务质量保证算法兼容单队列硬件配置的部署示意图;
图5为服务质量保证算法搭配多队列硬件配置的部署示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。
本发明提供一种面向数据中心多应用场景的RDMA服务质量保证方法,如图1所示,具体包括以下步骤:
步骤1:流量发送方对将要发送的数据进行打标,将不同的数据标记为延迟敏感型或带宽敏感型,打标的依据是应用提交发送请求时是否注明优先级和将要发送数据的大小。
如果上层应用已经指明该消息为延迟敏感型或者带宽敏感型流量,则按照应用指定的类型执行下一步骤;
如果上层应用未指明该消息的具体类型,则由流量发送方根据消息的大小判断该消息的类型。例如设定一个阈值作为划分延迟敏感消息和带宽敏感消息的界限,当消息大小小于该阈值时则将消息标记为延迟敏感型流量,反之则标记为带宽敏感型流量。
步骤2:流量发送方对于延迟敏感型流量,在数据路径上不添加额外的处理逻辑,仅仅测量每条消息的完成时间并进一步计算出每条消息的端上排队延迟,并以此作为控制带宽敏感流量发送速率的依据,具体包括以下步骤:
(2.1)流量的发送方首先记录延迟敏感消息被提交到RDMA发送队列的时间,作为消息的提交时间;
(2.2)流量的发送方其次记录延迟敏感消息对应的完成标识出现在RDMA完成队列中的时间,作为消息的完成时间;
(2.3)流量的发送方将消息的完成时间减去消息的提交时间得到消息的整体延迟;并进一步将消息的整体延迟划分为消息的端上延迟和网络延迟;
(2.4)流量的发送方将最近一次完成标识产生时间之前一个网络往返延迟的时间作为网卡开始处理当前消息的时间。
(2.5)流量的发送方将网卡开始处理当前消息的时间减去消息的提交时间得到该消息的端上排队延迟,并且用该消息的完成时间减去发送方网卡开始处理该消息的时间得到新的网络往返延迟;
(2.6)当有新的延迟敏感消息需要发送时,流量的发送方重复步骤(2.1)-(2.5),动态地更新延迟敏感消息的网络往返延迟,提供给下一个发送周期使用。流量的发送方同时维护一个滑动窗口的数据结构用于存储每个发送周期获得的端上排队延迟。
如图2所示,用户态端Tenq_v1发送请求1至发送端网卡,发送端网卡开始传输请求1数据包;Tenq_v2发送发送请求2至发送端网卡,由于当前发送端网卡正在进行请求1数据包的传输进程,于是进行排队等候,产生排队延迟;请求1数据包传输完成后,请求2结束排队开始数据包的传输;接收端网卡接受到请求1数据包传输完成信号之后,向发送端网卡和用户态端Tcomp_v1反馈确认信号1,用户态端接受到确认信号后,Tenq_v3发送请求3至发送端网卡进行排队等待,等待和传输过程同请求2,请求2的反馈确认信号过程同请求1;请求发送至发送端网卡的时间与请求数据包传输完成后发送端网卡接受到确认信号的时间之间的延迟为网络往返延迟。
步骤3:对于带宽敏感型流量,流量发送方根据延迟敏感流量的端上排队延迟情况调整带宽敏感流量的发送速率。如果当前的延迟敏感消息的端上排队延迟高于目标延迟,则对带宽敏感流量的发送速率进行减半操作,反之则线性增加带宽敏感流量的发送速率。
流量的发送方在初始阶段首先将带宽敏感流量的发送速率设置为网卡的最大带宽,以保证可以充分利用网卡的带宽资源;流量的发送方在初始化阶段设定延迟敏感消息的目标排队延迟,并以此作为依据调整带宽敏感流量的发送速率;当流量的发送方发现当前延迟敏感消息的端上排队延迟高于设定的目标排队延迟,则对带宽敏感流量的发送速率执行减半操作;反之则线性增加带宽敏感流量的发送速率。本发明发现在某些场景下,例如目标延迟设置过低等,为了保证延迟敏感消息的目标延迟,带宽敏感消息的发送速率几乎被减小到零。为此引入一个新的限定条件,即带宽安全阈值,即保证网卡的带宽利用率不低于该安全阈值。因此改进后的决策算法中减速策略优化为,如果当前的排队尾延迟大于设定的目标延迟,对带宽敏感流量的发送速率减小当前发送速率和带宽安全阈值的差的一半,此操作保证了网卡带宽的高利用率。
如图3所示,本发明还提供一种面向数据中心多应用场景的RDMA服务质量保证系统,系统运行在具备RDMA网卡和RDMA传输能力的服务器节点上的应用进程中,应用进程包括网络通信线程模块和服务质量线程模块,网络通信线程模块为应用连接配置的服务质量插件,服务质量线程模块包括应用进程中的服务质量线程,服务质量插件和服务质量线程共同对流量数据完成打标分类为延迟敏感型和带宽敏感型并性能隔离,根据延迟敏感流量在服务器节点上的排队延迟作为服务质量问题严重程度的信号和通过控制带宽敏感流量的发送速率来缓解服务质量问题。
系统将消息的整体延迟分为端上排队延迟和网络往返延迟,当硬件未提供获取的准确延迟时,通过软件方法计算出准确的端上排队延迟和网络往返延迟。服务质量插件一方面负责测量应用连接发送的每一个延迟敏感消息的端上排队延迟,维护一个滑动窗口,存储近期测量的排队延迟,提供给服务质量线程定期获取;另一方面负责维护用于控制带宽敏感消息的发送速率的令牌桶。服务质量线程一方面负责定期收集应用进程内部其他所有网络通信线程的网络信息,包括延迟敏感消息的端上排队延迟和带宽敏感消息的发送速率;另一方面负责根据当前延迟敏感消息的线上排队延迟情况,计算出新的速率分配方案并下发至各个连接的服务质量插件中。
在服务质量保证系统中,服务质量线程获取所有带宽敏感连接的总发送速率。并且在每一个决策时间片结束后都会根据新的计算得到的排队延迟计算出下一个时间片的带宽敏感流量的总发送速率。而服务质量线程依据最大最小公平性准则公平地将总速率分配给所有的带宽敏感连接。最后将这些速率分配给每个应用连接的插件。
而在每个服务质量插件内部的限速模块,本发明采用令牌桶的方式来控制每个带宽敏感连接的发送速率。当需要传输一条新的RDMA消息时,服务质量插件首先根据最后一次获取令牌的时间来计算存储在令牌桶中的剩余令牌数。如果存储的令牌能够满足消息的要求,消息将立即被发送。否则,消息将存储在连接的缓冲队列中,服务质量插件计算存储在令牌桶中的令牌数量满足消息的发送时间,启动一个定时器发送该消息。
图4和图5为在单优先级队列和多优先级队列场景下部署服务质量保证算法的示意图。
尽管RDMA网卡支持多队列来区分不同类型的消息。但是在实际场景中,往往只能为RDMA流量提供一个或两个硬件队列。当只有一个硬件队列时,服务质量问题会尤其严重,因为所有消息不管消息大小和性能诉求,都将进入同一个硬件队列;即使当有两个硬件队列可以先对消息进行一次分类,使高优先级队列为延迟敏感消息服务,低优先级队列为带宽敏感消息服务。但是由于RDMA消息大小跨度极大,仍会出现大小消息混合在同一个硬件队列中的情况。
图4展示了适配单队列场景的设计:对于只有一个硬件优先级队列可用的情况,所有RDMA硬件连接都映射到同一硬件队列,本发明设置每个RDMA连接只发送一种类型的消息。例如,一个RDMA连接将只发送小的(延迟敏感的)消息或只发送大的(带宽敏感的)消息。每个应用连接将包含两个RDMA连接分别用于发送延迟敏感消息和带宽敏感消息。
图5展示了适配多队列场景的设计:与单队列情况不同,当存在多个硬件队列时,不同的RDMA连接可以映射到不同的硬件优先级队列。虽然硬件优先级队列的数量有限,但是本发明仍然使用这个功能来区分不同类型的消息。在有两个硬件优先级队列可用的情况下,本发明将其中一个配置为高优先级,另一个配置为低优先级。其中重要的延迟敏感消息被映射到高优先级队列,而其余消息被映射到低优先级队列。软件服务质量保证算法同样适用于低优先级队列上的消息。
本发明将流量划分为延迟敏感型和带宽敏感型,并且将延迟敏感型消息的端上排队延迟作为服务质量问题的信号,通过控制带宽敏感流量的发送速率来保证延迟敏感消息的低延迟,同时为网卡的带宽利用率设置了安全阈值保证了网卡的高带宽利用率,通过这种方法可以在数据中心复杂的流量模型下,依然可以保证各类业务的性能指标。
Claims (8)
1.一种面向数据中心多应用场景的RDMA服务质量保证方法,其特征在于,包括以下步骤:
(1)流量发送方根据提交发送请求时对数据的优先级标识和数据大小,将数据打标为延迟敏感型或带宽敏感型;
(2)对于延迟敏感型流量数据,流量发送方仅测量每条消息的完成时间并进一步计算出每条消息的端上排队延迟;
(3)对于带宽敏感型流量数据,流量发送方根据计算得到的排队延迟控制带宽敏感流量发送速率。
2.根据权利要求1所述的一种面向数据中心多应用场景的RDMA服务质量保证方法,其特征在于,所述步骤(1)包括以下步骤:
(11)若上层应用已指明消息为延迟敏感型或带宽敏感型,则根据指明信息执行打标;
(12)若上层应用未指明消息的类型,则有流量发送方根据消息的大小判断消息的类型;设定有划分延迟敏感消息和带宽敏感消息的界限阈值,当消息大小大于该阈值时,将其标记为延迟敏感型流量,反之则标记为带宽敏感型流量。
3.根据权利要求1所述的面向数据中心多应用场景的RDMA服务质量保证方法,其特征在于,所述步骤(2)包括以下步骤:
(21)流量的发送方记录延迟敏感消息被提交到RDMA发送队列的时间,作为消息的提交时间;
(22)流量的发送方记录延迟敏感消息对应的完成标识出现在RDMA完成队列中的时间,作为消息的完成时间;
(23)流量的发送方将消息的完成时间减去消息的提交时间得到消息的整体延迟;并进一步将消息的整体延迟划分为消息的端上延迟和网络延迟;
(24)流量的发送方将最近一次完成标识产生时间之前一个网络往返延迟的时间作为网卡开始处理当前消息的时间;
(25)流量的发送方将网卡开始处理当前消息的时间减去消息的提交时间得到该消息的端上排队延迟,并且用该消息的完成时间减去发送方网卡开始处理该消息的时间得到新的网络往返延迟;
(26)当有新的延迟敏感消息需要发送时,流量的发送方重复步骤(21)-(25),动态地更新延迟敏感消息的网络往返延迟,提供给下一个发送周期使用;同时流量的发送方维护一个滑动窗口的数据结构用于存储每个发送周期获得的端上排队延迟。
4.根据权利要求1所述的面向数据中心多应用场景的RDMA服务质量保证方法,其特征在于,所述步骤(3)包括以下步骤:
(31)在初始阶段,流量发送方首先将带宽敏感型流量的发送速率设置为网卡的最大带宽;
(32)流量的发送方设定调整带宽敏感流量的发送速率的依据的延迟敏感消息的目标排队延迟;
(33)若当前的延迟敏感消息的端上排队高于目标延迟,对带宽敏感流量的发送速率执行减半操作,反之则线性增加带宽敏感流量的发送速率。
5.根据权利要求2所述的面向数据中心多应用场景的RDMA服务质量保证方法,其特征在于,所述阈值为保证带宽利用率的带宽安全阈值,若当前的排队尾延迟大于设定的目标延迟,对带宽敏感流量的发送速率减小当前发送速率和带宽安全阈值的差的一半。
6.一种采用如权利要求1-5任一所述方法的面向数据中心多应用场景的RDMA服务质量保证系统,其特征在于,所述系统运行在具备RDMA网卡和RDMA传输能力的服务器节点上的应用进程中;所述应用进程包括网络通信线程模块和服务质量线程模块;所述网络通信线程模块为应用连接配置的服务质量插件;所述服务质量线程模块包括应用进程中的服务质量线程;所述服务质量插件和服务质量线程共同对流量数据完成打标分类为延迟敏感型和带宽敏感型并性能隔离,根据延迟敏感流量在服务器节点上的排队延迟作为服务质量问题严重程度的信号和通过控制带宽敏感流量的发送速率来缓解服务质量问题。
7.根据权利要求6所述的面向数据中心多应用场景的RDMA服务质量保证系统,其特征在于,所述服务质量插件一方面负责测量应用连接发送的每一个延迟敏感消息的端上排队延迟,维护一个滑动窗口,存储近期测量的排队延迟,提供给服务质量线程定期获取;另一方面负责维护用于控制带宽敏感消息的发送速率的令牌桶。
8.根据权利要求6所述的面向数据中心多应用场景的RDMA服务质量保证系统,其特征在于,所述服务质量线程一方面负责定期收集应用进程内部其他所有网络通信线程的网络信息,包括延迟敏感消息的端上排队延迟和带宽敏感消息的发送速率;另一方面负责根据当前延迟敏感消息的线上排队延迟情况,计算出新的速率分配方案并下发至各个连接的服务质量插件中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111375359.3A CN114124830B (zh) | 2021-11-19 | 2021-11-19 | 一种面向数据中心多应用场景的rdma服务质量保证方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111375359.3A CN114124830B (zh) | 2021-11-19 | 2021-11-19 | 一种面向数据中心多应用场景的rdma服务质量保证方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114124830A true CN114124830A (zh) | 2022-03-01 |
CN114124830B CN114124830B (zh) | 2024-04-30 |
Family
ID=80396828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111375359.3A Active CN114124830B (zh) | 2021-11-19 | 2021-11-19 | 一种面向数据中心多应用场景的rdma服务质量保证方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114124830B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114666281A (zh) * | 2022-03-18 | 2022-06-24 | 南京大学 | 基于智能网卡卸载的数据中心多应用QoS保障系统及方法 |
CN116800684A (zh) * | 2023-06-27 | 2023-09-22 | 中科驭数(北京)科技有限公司 | Rdma网卡发送队列的性能隔离方法和rdma网卡 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140101331A1 (en) * | 2012-10-05 | 2014-04-10 | Aaa Internet Publishing, Inc. | Method and System for Managing, Optimizing, and Routing Internet Traffic from a Local Area Network (LAN) to Internet Based Servers |
US20160308769A1 (en) * | 2015-04-14 | 2016-10-20 | Cisco Technology, Inc. | Setting delay precedence on queues before a bottleneck link based on flow characteristics |
CN106059821A (zh) * | 2016-06-29 | 2016-10-26 | 重庆邮电大学 | 一种基于sdn的数据中心业务服务质量保障方法 |
CN110022269A (zh) * | 2018-01-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 通信数据处理方法、装置和设备 |
CN113312323A (zh) * | 2021-06-03 | 2021-08-27 | 中国人民解放军国防科技大学 | 并行文件系统中降低访问延迟的io请求调度方法及系统 |
US20210281518A1 (en) * | 2012-10-05 | 2021-09-09 | Aaa Internet Publishing, Inc. | Method and system for managing, optimizing, and routing internet traffic from a local area network (lan) to internet based servers |
CN113438163A (zh) * | 2021-05-29 | 2021-09-24 | 中国人民解放军空军工程大学 | 一种基于路径隔离的数据中心网络混合流路由方法及系统 |
CN113613286A (zh) * | 2021-09-13 | 2021-11-05 | 大连大学 | 一种天地一体化智能网络多路径拥塞控制方法 |
-
2021
- 2021-11-19 CN CN202111375359.3A patent/CN114124830B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140101331A1 (en) * | 2012-10-05 | 2014-04-10 | Aaa Internet Publishing, Inc. | Method and System for Managing, Optimizing, and Routing Internet Traffic from a Local Area Network (LAN) to Internet Based Servers |
US20210281518A1 (en) * | 2012-10-05 | 2021-09-09 | Aaa Internet Publishing, Inc. | Method and system for managing, optimizing, and routing internet traffic from a local area network (lan) to internet based servers |
US20160308769A1 (en) * | 2015-04-14 | 2016-10-20 | Cisco Technology, Inc. | Setting delay precedence on queues before a bottleneck link based on flow characteristics |
CN106059821A (zh) * | 2016-06-29 | 2016-10-26 | 重庆邮电大学 | 一种基于sdn的数据中心业务服务质量保障方法 |
CN110022269A (zh) * | 2018-01-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 通信数据处理方法、装置和设备 |
CN113438163A (zh) * | 2021-05-29 | 2021-09-24 | 中国人民解放军空军工程大学 | 一种基于路径隔离的数据中心网络混合流路由方法及系统 |
CN113312323A (zh) * | 2021-06-03 | 2021-08-27 | 中国人民解放军国防科技大学 | 并行文件系统中降低访问延迟的io请求调度方法及系统 |
CN113613286A (zh) * | 2021-09-13 | 2021-11-05 | 大连大学 | 一种天地一体化智能网络多路径拥塞控制方法 |
Non-Patent Citations (4)
Title |
---|
KATEBZADEH, MR SIAVASH, PAOLO COSTA, AND BORIS GROT: "Evaluation of an infiniband switch: Choose latency or bandwidth, but not both.", 2020 IEEE INTERNATIONAL SYMPOSIUM ON PERFORMANCE ANALYSIS OF SYSTEMS AND SOFTWARE (ISPASS), 26 October 2020 (2020-10-26) * |
XIAOLIANG WANG; HEXIANG SONG; CAM-TU NGUYEN; DONGXU CHENG; TIANCHENG JIN: "Maximizing the Benefit of RDMA at End Hosts", IEEE INFOCOM, 26 July 2021 (2021-07-26) * |
YAN, SIYU, ET AL: "ACC: Automatic ECN tuning for high-speed datacenter networks.", PROCEEDINGS OF THE 2021 ACM SIGCOMM 2021 CONFERENCE., 31 August 2021 (2021-08-31) * |
曾高雄等: "数据中心网络传输协议综述", 计算机研究与发展, 31 December 2020 (2020-12-31) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114666281A (zh) * | 2022-03-18 | 2022-06-24 | 南京大学 | 基于智能网卡卸载的数据中心多应用QoS保障系统及方法 |
CN116800684A (zh) * | 2023-06-27 | 2023-09-22 | 中科驭数(北京)科技有限公司 | Rdma网卡发送队列的性能隔离方法和rdma网卡 |
CN116800684B (zh) * | 2023-06-27 | 2024-06-07 | 中科驭数(北京)科技有限公司 | Rdma网卡发送队列的性能隔离方法和rdma网卡 |
Also Published As
Publication number | Publication date |
---|---|
CN114124830B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11805065B2 (en) | Scalable traffic management using one or more processor cores for multiple levels of quality of service | |
US9185047B2 (en) | Hierarchical profiled scheduling and shaping | |
US9112786B2 (en) | Systems and methods for selectively performing explicit congestion notification | |
US7558197B1 (en) | Dequeuing and congestion control systems and methods | |
US11968111B2 (en) | Packet scheduling method, scheduler, network device, and network system | |
US8078763B1 (en) | Dequeuing and congestion control systems and methods for single stream multicast | |
CN114124830B (zh) | 一种面向数据中心多应用场景的rdma服务质量保证方法及系统 | |
CN110808920B (zh) | 一种ccsds帧和ip报文共存的卫星通信流量控制方法 | |
CN109962760B (zh) | 一种适于无线tdma自组网的业务调度方法 | |
CN113543209B (zh) | 一种基于令牌调度的拥塞控制方法及装置 | |
Wu et al. | Network congestion avoidance through packet-chaining reservation | |
US7684422B1 (en) | Systems and methods for congestion control using random early drop at head of buffer | |
CN115622952A (zh) | 资源调度方法、装置、设备及计算机可读存储介质 | |
CN112838992B (zh) | 报文调度方法及网络设备 | |
US20240348557A1 (en) | Queue control method and apparatus | |
JP2001211207A (ja) | パケット送信方法、パケット送信装置並びに帯域保証方法 | |
CN112005528B (zh) | 一种数据交换方法、数据交换节点及数据中心网络 | |
CN109995608B (zh) | 网络速率计算方法和装置 | |
CN110177051A (zh) | 基于流控技术的数据中心拥塞控制方法 | |
CN117793583A (zh) | 报文转发方法、装置、电子设备及计算机可读存储介质 | |
CN102404225B (zh) | 一种用于差分队列服务系统的数据包快速入队方法 | |
CN115695578A (zh) | 一种数据中心网络tcp和rdma混合流调度方法、系统及装置 | |
CN117411833A (zh) | 拥塞控制方法、设备及系统 | |
US20230283575A1 (en) | Allocation of Shared Reserve Memory to Queues in a Network Device | |
WO2023175754A1 (ja) | パケット転送装置、パケット転送方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |