CN110351187A - 数据中心网络中路径切换粒度自适应的负载均衡方法 - Google Patents

数据中心网络中路径切换粒度自适应的负载均衡方法 Download PDF

Info

Publication number
CN110351187A
CN110351187A CN201910712667.7A CN201910712667A CN110351187A CN 110351187 A CN110351187 A CN 110351187A CN 201910712667 A CN201910712667 A CN 201910712667A CN 110351187 A CN110351187 A CN 110351187A
Authority
CN
China
Prior art keywords
stream
short
grouping
long
exit port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910712667.7A
Other languages
English (en)
Other versions
CN110351187B (zh
Inventor
黄家玮
胡晋彬
吕文俊
李威赫
王建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201910712667.7A priority Critical patent/CN110351187B/zh
Publication of CN110351187A publication Critical patent/CN110351187A/zh
Application granted granted Critical
Publication of CN110351187B publication Critical patent/CN110351187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/38Flow based routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种数据中心网络中路径切换粒度自适应的负载均衡方法,交换机根据数据流的已发送数据量区分长流和短流,对任一条数据流,若其已发送数据量小于长度阈值S,则认为其是短流,否则认为是长流;对于短流,以分组为粒度选择队列长度最短的出端口转发其新到达的分组,以保证满足短流完成期限;对于长流,根据短流强度计算其切换路径的队列长度阈值,若转发某条长流上一个分组的出端口的队列长度大于或等于长流切换路径的队列长度阈值,则选择队列长度最短的出端口转发该长流新到达的分组,否则选择与该长流上一分组相同的出端口转发该长流新到达的分组。本发明避免了短流被长流阻塞,有效的减少了流的完成时间。

Description

数据中心网络中路径切换粒度自适应的负载均衡方法
技术领域
本发明涉及数据中心网络(DCN,Data Center Network)中一种切换路径粒度自适应的负载均衡方法。
技术背景
近年来,随着延迟敏感型和吞吐率导向型应用程序的流量需求不断增加,现代数据中心部署了多根树网络,如Fat-tree和clos网络拓扑结构,以通过任何给定主机对之间的多条路径提供高对分带宽。为了获得更好的应用程序性能,提升用户的体验和服务的质量,如何有效地平衡多路径之间的大量流量成为大型数据中心网络中一个至关重要的问题。
等价多路径路由策略(Equal-Cost Multi Path,ECMP)是目前数据中心网络中应用最为广泛的负载均衡方案。ECMP是以流为单位通过哈希算法选择不同的路径传输,存在哈希冲突和无法自适应地重新路由流的问题。最近,在DCN中出现了许多更好的负载均衡设计。随机包散射(Random Packet Spraying,RPS)、DRILL、Hermes以包为粒度灵活选择多路径进行传输。Presto为固定大小的数据块(64KB)选择路径,以实现高吞吐率并减少乱序数据包。CONGA和LetFlow采用了flowlet为粒度的路由切换机制,以减少分组乱序。
然而,现有的负载均衡方法不感知长流和短流混合的流量特性,没有考虑不同类型流的需求,都分别为不同类型的流使用相同的粒度切换路径重路由。许多研究表明,数据中心的流量是重尾分布的,即约90%的数据量仅由约10%的吞吐率敏感的长流提供,而约90%的延迟敏感短流只提供了约10%的数据量。
当短流和长流以相同的粒度重新路由时,短流很容易被长流阻塞而经历长尾排队延迟,因为大量的长流数据占据了每条路径,使得短流很难有机会切换到非拥塞的路径,从而导致短流分组头部阻塞、流完成时间增大\链路利用率和分组乱序的问题。另外,在非自适应粒度下,当网络流量发生动态变化时,由于链路利用率低或出现乱序问题,长流也会遭受严重的吞吐率损失。
因此,避免短流分组头部阻塞和分组的乱序,同时提高链路利用率,有效降低数据流的完成时间,是一个亟待解决的问题。
发明内容
本发明所解决的技术问题是,针对上述数据中心网络中现有负载均衡方法的不足,本发明提供一种数据中心网络中路径切换粒度自适应的负载均衡方法,使得短流平均完成时间减小的同时提高长流吞吐率。
本发明的技术方案为:
一种数据中心网络中路径切换粒度自适应的负载均衡方法,交换机根据数据流的已发送数据量区分长流和短流,对任一条数据流,若其已发送数据量小于长度阈值S,则认为其是短流,否则认为是长流;对于短流,以分组为粒度选择队列长度最短的出端口转发其新到达的分组;对于长流,根据短流强度更新其切换路径的队列长度阈值,即其切换路径的粒度,若转发某条长流上一个分组的出端口的队列长度大于或等于长流切换路径的队列长度阈值,则选择队列长度最短的出端口转发该长流新到达的分组,否则选择与该长流上一分组相同的出端口转发该长流新到达的分组。
一种数据中心网络中路径切换粒度自适应的负载均衡方法,包括以下步骤:
步骤一:初始化流长度阈值S、长流切换路径的队列长度阈值qth、短流数量ms、长流数量mL、qth更新周期的起始时间t、qth更新的周期阈值Tth、数据流空闲时间阈值age、分组大小MSS、各个数据流最后到达分组的时间tend、各个数据流的已发送数据量SF、转发各数据流上一个分组的出端口P;将各数据流的信息保存在交换机流表中;
步骤二:遍历交换机流表,依次判断其中各个数据流的空闲时间与数据流空闲时间阈值age的差值是否为0;删除差值为0数据流的信息,转步骤三;其中各个数据流的空闲时间等于当前时间与各个数据流最后到达分组的时间tend的差值;最后到达分组是指最近一次到达的分组。该步骤的目的是删除非活跃流;
步骤三:交换机监听是否有新分组到达,若有新分组到达,转步骤四,否则转步骤二;
步骤四:判断当前到达分组是否属于新数据流,如是,则在交换机各个出端口中选择队列长度k最小的出端口转发该当前分组,短流数量ms加1(即每发送一个属于新数据流的分组,则使短流数量ms加1),并对当前分组所属的数据流,设置其最后到达分组的时间tend为当前时间,设置其已发送数据量SF为分组大小MSS(所有TCP分组的大小相同,其值为最大报文段长度,即MSS),设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,将该数据流的信息保存在交换机流表中,再转步骤二;否则转步骤五;
步骤五:判断当前分组所属流的已发送数据量是否小于流长度阈值S,如是,则在交换机各个出端口中选择队列长度k最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,再转步骤二;否则转步骤六;
步骤六:判断当前分组是否为所属流已发送数据量大于或等于流长度阈值S后要发送的第一个分组,如是,则短流数量ms减1,长流数量mL加1(即每确定一条长流,则使长流数量mL加1,短流数量ms减1),转步骤七;否则转步骤七;
步骤七:判断转发当前分组所属数据流的上一个分组的出端口P的队列长度k是否大于或等于长流切换路径的队列长度阈值qth,如是,则使用队列长度最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,转步骤二;否则,使用转发该数据流上一个分组的出端口P转发当前分组,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,转步骤二;
从步骤三中监听到有新分组到达至步骤七执行前的任一时间,判断当前时间与qth更新周期的起始时间t的差值是否大于或等于qth更新的周期阈值Tth,若大于qth更新的周期阈值Tth,则根据短流强度更新长流切换路径的队列长度阈值qth,并将qth更新周期的起始时间t设置为当前时间。
进一步地,所述步骤一中:初始化流长度阈值为100KB;qth更新的周期阈值Tth和数据流空闲时间阈值age都设置为500μs;长流切换路径的队列长度阈值qth、短流数量ms、长流数量mL、各个数据流的已发送数据量SF、qth更新周期的起始时间t、各个数据流最后到达分组的时间tend、转发各数据流上一个分组的出端口P都设置为0。
进一步地,所述步骤一中:所述分组大小MSS设置为1500字节。
进一步地,根据短流强度更新长流切换路径的队列长度阈值qth的方法为:当短流强度增大(如短流数量增多,短流的平均大小增大),长流切换路径的队列长度阈值qth增大,即增大长流切换路径的粒度,以留下更多的没有长流的路径给短流传输,保证短流的低延时性能。当短流强度减小,长流切换路径的队列长度阈值qth减小,即减小长流切换路径的粒度。
进一步地,更新长流切换路径的队列长度阈值qth的公式为:
其中,n是交换机出端口的总数;ms、mL分别是短流数量和长流数量;Tth是qth更新的周期阈值;RTT是往返延时;C为链路带宽;WL是发送方(主机)在发送长流时的最大拥塞窗口;X是短流的平均大小(根据历史短流流量分布得到短流的平均大小);D是短流完成期限;r是短流在慢启动阶段完成传输的轮数(短流数据量少,一般认为短流在TCP慢启动阶段完成传输。在慢启动阶段,TCP窗口在每个RTT按指数增长(2,4,8,16..),短流完成传输所需要的RTT个数即短流完成传输所需的轮数)。
上述公式中,qth是以满足短流完成期限为条件,根据短流强度计算得出的。这样计算可以保证短流规定的期限内完成,同时使长流能灵活切换路径以充分利用链路带宽。其推导过程如下:
1)在qth更新的每个周期内,根据长流发送的数据量与长流在网络中传输的数据量相等,得到以下关系式:
因此,
其中,qth为长流切换路径的队列长度阈值;nL为长流所用的路径数量;Tth为qth更新的周期阈值;C为链路带宽,即交换机一个出端口的带宽值;mL为长流数量;WL为发送方在发送长流时的最大拥塞窗口(64KB);RTT是往返延时。
2)根据总路径数量即交换机出端口的总数n等于长流所用路径数量和短流所用路径数量的和,计算出短流所用路径数为:
3)短流完成时间FCTs为:
其中,X是短流的平均大小;r为短流在慢启阶段传输完成所需的轮数,即短流需要r个RTT传输完;E[W]为短流每一轮(每个RTT)的平均等待时间。短流逐包选择最短队列通过多路径传输,则每一轮的平均等待时间为1个包在队列中的平均等待时间。根M/G/1-FCFS队列模型,每个包在队列中的平均等待时间E[W]为:
其中,E[S]为1个包的服务时间,即
为每个包服务时间分布系数,则:
其中,ρ为短流强度,其中,λ为短流到达率,因此有:
4)由以上的公式,即:
可以得到:
本发明首先保证短流完成时间小于或等于短流完成期限D,即要满足:FCTs≤D,可以得到:
然后尽可能提高长流吞吐量,故为了提高长流吞吐量,取qth下限值,即:
由上述公式可知,当短流强度增大(如短流数量增多,短流的平均大小增大),长流切换路径的队列长度阈值增大,即增大长流切换路径粒度,以留下更多的没有长流的路径给短流传输,保证短流的低延时性能。当短流强度减小,长流切换路径的队列长度阈值减小,即减小长流切换路径粒度,能充分利用多路径,提高长流吞吐量。
进一步地,RTT设置为100μs;链路带宽C设置为交换机出端口的带宽值;发送方在发送长流时的最大拥塞窗口WL为64KB,即linux默认的最大通告窗口;历史短流大小已知的情况下,短流的平均大小X为历史短流的字节数之和与历史短流数量之比,历史短流大小未知的情况下,短流的平均大小X设置为100KB;D设置为历史短流完成期限的25分位数,历史短流完成期限的分布已知的情况下,则直接按其分布取25分位数,历史短流完成期限的分布未知的情况下,则设其在5ms与25ms之间随机分布,按该分布取25分位数;短流在慢启动阶段完成传输所需的轮数r的计算公式为:
其中,表示向下取整。
进一步地,所述步骤四中:判断当前到达分组是否属于新数据流的方法是,如果交换机流表中未保存该数据流的转发该数据流上一个分组的出端口,则判断当前分组属于新数据流。
有益效果:
本发明中交换机会根据流的已发送数据量区分长流和短流。在满足短流完成期限的前提下,根据短流强度更新长流切换路径的队列长度阈值;当短流强度增大,长流切换路径的队列长度阈值增大,即长流切换路径的粒度增大,能留下更多的没有长流的路径给短流传输,保证短流的低延时性能;当短流强度减小,长流切换路径的队列长度阈值减小,即长流切换路径的粒度减小,能充分利用多路径,提高长流吞吐量。若长流当前分组所属流的上一个分组所在的队列长度大于或等于长流切换路径的队列长度阈值时,选择队列长度最短的出端口转发当前分组,否则选择转发该流上一分组的出端口转发当前分组。本发明中,短流以分组为粒度选择队列长度最短的出端口转发当前分组,动态调节长流切换路径的粒度有效避免了短流分组被长流阻塞、提高了长流吞吐率并减少了分组乱序,有效的减少了流完成时间,提升了网络性能和用户体验。
附图说明
图1为本发明实施例的流程图。
图2为测试场景拓扑图。
图3为短流的基本性能测试图,其中,图3(a)为分组乱序的示意图,图3(b)为每条流平均排队延时的示意图。本发明命名为TLB。
图4为长流的基本性能测试图,其中,图4(a)为分组乱序的示意图,图4(b)为每条流平均吞吐率的示意图。本发明命名为TLB。
图5为web-search场景下性能测试图,其中,图5(a)为web-search场景下短流平均完成时间示意图,图5(b)为长流吞吐率的示意图。本发明命名为TLB。
图6为data-mining场景下性能测试图,其中,图6(a)为data-mining场景下短流平均完成时间示意图,图6(b)为长流吞吐率的示意图。本发明命名为TLB。
图7为在mininet测试环境中流数变化场景的CPU和内存开销图,其中图7(a)为改变短流数量的CPU和内存占用率示意图,图7(b)为改变长流数量的CPU和内存占用率示意图。本发明命名为TLB。
具体实施方式
下面结合附图对本发明作进一步的说明。
本发明公开了一种数据中心网络中路径切换粒度自适应的负载均衡方法,交换机根据数据流的已发送数据量区分长流和短流,对任一条数据流,若其已发送数据量小于长度阈值S,则认为其是短流,否则认为是长流;对于短流,以分组为粒度选择队列长度最短的出端口转发其新到达的分组,以保证满足短流完成期限;对于长流,根据短流强度计算其切换路径的队列长度阈值,若转发某条长流上一个分组的出端口的队列长度大于或等于长流切换路径的队列长度阈值,则选择队列长度最短的出端口转发该长流新到达的分组,否则选择与该长流上一分组相同的出端口转发该长流新到达的分组。相比于现有技术,本发明避免了短流被长流阻塞,链路利用率低和分组乱序的问题,有效的减少了流的完成时间,提升了用户的体验。
参见图1,图1为本发明实施例的的流程图。该实施例具体步骤如下:
步骤一、初始化;流长度阈值为100KB;RTT设置为100μs;将链路带宽C设置为交换机出端口的带宽值;将分组大小MSS设置为1500字节;发送方在发送长流时的最大拥塞窗口WL为64KB;qth更新的周期阈值Tth和数据流空闲时间阈值age都设置为500μs;长流切换路径的阈值qth、短流数量ms、长流数量mL、各个数据流的已发送数据量SF、qth更新周期的起始时间t、各个数据流最后到达分组的时间tend、转发各数据流上一个分组的出端口P都设置为0;
步骤二、遍历交换机流表判断各个数据流的空闲时间与数据流空闲时间阈值age的差值是否为0;删除差值为0数据流的信息;
步骤三、交换机监听是否有新分组到达,若有新分组到达,转步骤四;否则转步骤二继续监听是否有数据流空闲时间age为0;
步骤四、判断该分组是否属于新数据流,如果交换机未保存转发该数据流上一个分组的出端口,则判断该到达分组属于新数据流;如属于新数据流,则在交换机各个出端口中选择队列长度k最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,设置其最后到达分组的时间tend为当前时间,该流的已发送数据量SF增加MSS;然后转步骤二继续监听是否有数据流空闲时间age为0;若不属于新数据流,则转步骤五;
步骤五、判断当前分组所属流的已发送数据量是否小于流长度阈值S,如果是小于流长度阈值S,则在交换机各个出端口中选择队列长度k最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间;然后转步骤二继续监听是否有数据流空闲时间age为0;如果不是小于流长度阈值S,则当前分组所属的流为长流,转步骤六;
步骤六、先判断当前分组是否为所属流已发送数据量大于或等于流长度阈值S后要发送的第一个分组,如是,则短流数量ms减1,长流数量mL加1,再转步骤七;否则不更新短流和长流数量,直接转步骤七;
步骤七、判断转发当前分组所属数据流的上一个分组的出端口P的队列长度k是否大于或等于长流切换路径的队列长度阈值qth,如是,则使用队列长度最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,再转步骤二继续监听是否有数据流空闲时间age为0;否则,使用转发该数据流上一个分组的出端口P转发当前分组,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,再转步骤二继续监听是否有数据流空闲时间age为0;
从步骤三中监听到有新分组到达至步骤七执行前的任一时间,判断当前时间与qth更新周期的起始时间t的差值是否大于qth更新的周期阈值Tth,若大于qth更新的周期阈值Tth,则根据短流强度更新长流切换路径的队列长度阈值qth,并将qth更新周期的起始时间t设置为当前时间。
本发明利用NS2.35网络仿真平台和mininet测试平台来实现,并进行了性能测试。
实验设置如下:采用Leaf-Spine网络拓扑结构,其中,两个leaf交换机之间提供15条等价路径,图2为测试场景拓扑图。网络传播延时为100微秒,链路带宽为1Gbps。实验生成流量大小服从重尾分布的100条小于100KB的短流和3条大于10MB的长流,其发送时间服从泊松分布。
图3为短流的基本性能测试图。图3(a)为分组乱序率的示意图,从图中可以看出,与RPS和Presto相比,TLB显著减少了乱序数据包的数量,这是因为本发明中长流切换路径的粒度是根据短流强度自适应调节的。当短流所需路径多,长流切换路径粒度就大,留更多的路径给短流;当短流所需路径少,长流切换路径粒度就小,留给短流的路径就少,长流可以充分利用带宽。总之,短流会选择没有长流传输的出端口,使长短流不会在同一路径上同时混合传输。由于短流和长流不会在同一路径上同时混合传输,显著减少了乱序数据包的数量。图3(b)为每条流平均排队延时的示意图,从图中可以看出,由于短流逐包重新路由到最短队列,因此TLB始终实现最小的平均排队延时。
图4为长流的基本性能测试图。图4(a)为分组乱序的示意图,从图中可以看出,TLB减少了长流的乱序包数量,这是因为本发明使长短流不会在同一路径上同时混合传输,避免了长短流的相互影响;由于长流不受当前队列中的短流的影响,减少了长流的乱序包数量。图4(b)为每条流平均吞吐率的示意图,从图中可以看出,由于长流的重路由粒度随短流强度的变化而迅速变化,因此TLB的瞬时吞吐率大于ECMP、Presto和Letflow。由于短流只提供不到10%的数据,因此长流在大多数情况下可以充分利用多条路径。这意味着TLB通过避免短流和长流在同一时间混合在同一路径上传输而同时获得了短流低延时且长流高吞吐率的良好性能。
图5为web-search场景下性能测试图。图6为data-mining场景下性能测试图。图5(a)和图6(a)分别为web-search和data-mining场景下短流平均完成时间示意图,从图中可以看出,在相同的切换粒度下,当工作负载变大时,更多的混合流在交换机的同一输出端口中排队,结果导致更多的短流经历长尾排队延时。短流在较大的重路由粒度(如ECMP)下都会遇到较大的排队延迟,在较小的路径切换粒度(如RPS)下则有大量的乱序包,因此延迟性能都会降低。对于LetFlow,高负载下的性能更好,因为在流量强度大和拥塞情况下会出现更多的flowlet间隙而能及时切换路径,而在低负载下性能相对差,因为重新路由的机会较少。与其他方案相比,TLB能够根据短流强度自适应调整长流的路径切换粒度,从而获得性能提升,可以减轻排队延迟和乱序问题的影响。此外,web-search工作负载中的短流比data-mining工作负载中的短流具有更大的FCT。原因是,在web-search工作负载中,有更多的大小介于100KB和1MB之间的长流和大于1M的更长的流,从而导致更长的排队延时和更多的乱序包。而在data-mining工作负载中,大量的短流和少量的长流之间存在明显的边界,使得乱序包数量减少。然而,对于LetFlow方案,data-mining场景中的性能比web-search场景中的性能更差,因为出现可以切换路径的flowlet间隙更少。图5(b)和图6(b)为长流吞吐率的示意图,从图中可以看出,重路由粒度大的方案中的长流遭受更大的吞吐率下降。由于TLB根据短流的流量强度,灵活调整长流切换路径的粒度大小,充分利用了多路径,减少了包乱序,从而实现了长流的高吞吐率。
图7为在mininet测试环境中流数变化场景的CPU和内存开销图。图7(a)为改变短流数量的CPU和内存占用率示意图。图7(b)为改变长流数量的CPU和内存占用率示意图。从图中可以看出,对于ECMP、RPS和Presto,由于它们在交换机上的操作简单,CPU利用率非常低。总的来说,由于路径切换粒度的计算开销只产生CPU负载的一小部分,因此与其他方案相比,TLB不会产生过多的CPU开销,并且产生的内存利用率可以忽略不计。

Claims (7)

1.一种数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,交换机根据数据流的已发送数据量区分长流和短流,对任一条数据流,若其已发送数据量小于长度阈值S,则认为其是短流,否则认为是长流;对于短流,以分组为粒度选择队列长度最短的出端口转发其新到达的分组;对于长流,根据短流强度更新其切换路径的队列长度阈值qth,若转发某条长流上一个分组的出端口的队列长度大于或等于长流切换路径的队列长度阈值,则选择队列长度最短的出端口转发该长流新到达的分组,否则选择与该长流上一分组相同的出端口转发该长流新到达的分组。
2.一种数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,包括以下步骤:
步骤一:初始化流长度阈值S、长流切换路径的队列长度阈值qth、短流数量ms、长流数量mL、qth更新周期的起始时间t、qth更新的周期阈值Tth、数据流空闲时间阈值age、分组大小MSS、各个数据流最后到达分组的时间tend、各个数据流的已发送数据量SF、转发各数据流上一个分组的出端口P;将各数据流的信息保存在交换机流表中;
步骤二:遍历交换机流表,依次判断其中各个数据流的空闲时间与age的差值是否为0;删除差值为0数据流的信息,转步骤三;其中各个数据流的空闲时间等于当前时间与各个数据流最后到达分组的时间tend的差值;
步骤三:监听是否有新分组到达,若有新分组到达,则转步骤四,否则转步骤二;
步骤四:判断当前到达分组是否属于新数据流,若是,则在交换机各个出端口中选择队列长度k最小的出端口转发该当前分组,并将ms加1,对当前分组所属的数据流,设置其最后到达分组的时间tend为当前时间,设置其已发送数据量SF为MSS,设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,将该数据流的信息保存在交换机流表中,再转步骤二;否则转步骤五;
步骤五:判断当前分组所属流的已发送数据量是否小于S,如是,则在交换机各个出端口中选择队列长度k最小的出端口转发当前分组,并设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,转步骤二;否则转步骤六;
步骤六:判断当前分组是否为所属流已发送数据量大于或等于S后要发送的第一个分组,若是,则将ms减1,mL加1,并转步骤七;否则直接转步骤七;
步骤七:判断转发当前分组所属数据流的上一个分组的出端口P的队列长度k是否大于或等于长流切换路径的队列长度阈值qth,若是,则使用队列长度最小的出端口转发当前分组,同时重新设置转发该数据流上一个分组的出端口P为转发该数据流当前分组的出端口,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,转步骤二;否则,使用转发该数据流上一个分组的出端口P转发当前分组,该流的已发送数据量SF增加MSS,该流最后到达分组的时间tend为当前时间,转步骤二;
在从步骤三中监听到有新分组到达至步骤七执行前的任一时间,判断当前时间与t的差值是否大于或等于Tth,若是,则根据短流强度更新qth,并将t设置为当前时间。
3.根据权利要求2所述数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,所述步骤一中:初始化流长度阈值为100KB;qth更新的周期阈值Tth和数据流空闲时间阈值age都设置为500μs;分组大小M设置为1500字节;长流切换路径的队列长度阈值qth、短流数量ms、长流数量mL、各个数据流的已发送数据量SF、qth更新周期的起始时间t、各个数据流最后到达分组的时间tend、转发各数据流上一个分组的出端口P都设置为0。
4.根据权利要求1或2所述的数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,根据短流强度更新长流切换路径的队列长度阈值qth的方法为:当短流强度增大,长流切换路径的队列长度阈值qth增大,即增大长流切换路径的粒度;当短流强度减小,长流切换路径的队列长度阈值qth减小,即减小长流切换路径的粒度。
5.根据权利要求1或2所述的数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,更新长流切换路径的队列长度阈值qth的公式为:
其中,mS和mL分别是短流数量和长流数量,WL为发送方在发送长流时的最大拥塞窗口大小,Tth是qth更新的周期阈值Tth,RTT是往返延时,n是交换机出端口的总数;r是短流在慢启动阶段完成传输的轮数,X是短流的平均大小,C为链路带宽,D是短流的完成期限。
6.根据权利要求5所述的数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,所述往返延时RTT设置为100μs;链路带宽C设置为交换机一个出端口的带宽值;发送方在发送长流时的最大拥塞窗口大小WL为64KB;在历史短流大小已知的情况下,短流的平均大小X设置为历史短流的字节数之和与历史短流数量之比,在历史短流大小未知的情况下,短流的平均大小X设置为100KB;D设置为历史短流完成期限的25分位数,在历史短流完成期限的分布已知的情况下,则直接按其分布取25分位数,在历史短流完成期限的分布未知的情况下,则设其在5ms与25ms之间随机分布,按该分布取25分位数;短流在慢启动阶段完成传输所需的轮数r的计算公式为:
其中,表示向下取整。
7.根据权利要求2所述的数据中心网络中路径切换粒度自适应的负载均衡方法,其特征在于,所述步骤四中:判断当前到达分组是否属于新数据流的方法是,如果交换机流表中未保存转发该数据流上一个分组的出端口,则判断当前分组属于新数据流。
CN201910712667.7A 2019-08-02 2019-08-02 数据中心网络中路径切换粒度自适应的负载均衡方法 Active CN110351187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910712667.7A CN110351187B (zh) 2019-08-02 2019-08-02 数据中心网络中路径切换粒度自适应的负载均衡方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910712667.7A CN110351187B (zh) 2019-08-02 2019-08-02 数据中心网络中路径切换粒度自适应的负载均衡方法

Publications (2)

Publication Number Publication Date
CN110351187A true CN110351187A (zh) 2019-10-18
CN110351187B CN110351187B (zh) 2021-03-12

Family

ID=68183877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910712667.7A Active CN110351187B (zh) 2019-08-02 2019-08-02 数据中心网络中路径切换粒度自适应的负载均衡方法

Country Status (1)

Country Link
CN (1) CN110351187B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111526089A (zh) * 2020-04-14 2020-08-11 北京交通大学 一种基于变长粒度的数据融合传输与调度的装置
CN111585911A (zh) * 2020-05-22 2020-08-25 西安电子科技大学 数据中心网络流量负载的均衡方法
CN114448899A (zh) * 2022-01-20 2022-05-06 天津大学 一种均衡数据中心网络负载的方法
CN114553783A (zh) * 2022-02-23 2022-05-27 湖南工学院 数据中心网络自适应调整流胞粒度的负载均衡方法
CN115134308A (zh) * 2022-06-27 2022-09-30 长沙理工大学 数据中心无损网络中通过数据包弹跳避免队头阻塞的方法
CN115134304A (zh) * 2022-06-27 2022-09-30 长沙理工大学 云计算数据中心避免数据包乱序的自适应负载均衡方法
CN115396357A (zh) * 2022-07-07 2022-11-25 长沙理工大学 一种数据中心网络中的流量负载均衡方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107046507A (zh) * 2016-12-13 2017-08-15 中南大学 一种用于dcn中任务传输的拥塞控制方法
CN107566275A (zh) * 2017-10-18 2018-01-09 中南大学 数据中心网络中基于延时差异性的多路径传输方法
CN108683602A (zh) * 2018-07-13 2018-10-19 北京瀚海星云科技有限公司 一种数据中心网络负载均衡方法
CN109039941A (zh) * 2018-08-23 2018-12-18 中南大学 数据中心网络中基于路径分类的自适应包散射方法
CN109787913A (zh) * 2019-03-15 2019-05-21 北京工业大学 一种基于sdn的数据中心网络动态负载均衡方法
CN109873772A (zh) * 2019-01-25 2019-06-11 广州大学 基于稳定匹配的流调度方法、装置、计算机设备及存储介质
CN110138676A (zh) * 2019-06-08 2019-08-16 苏州龙欣通颖网络科技有限公司 一种基于ip的软件定义泛在无线manet路由体系结构
CN110198273A (zh) * 2019-05-31 2019-09-03 中南大学 数据中心网络中基于网络编码的多路径传输方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107046507A (zh) * 2016-12-13 2017-08-15 中南大学 一种用于dcn中任务传输的拥塞控制方法
CN107566275A (zh) * 2017-10-18 2018-01-09 中南大学 数据中心网络中基于延时差异性的多路径传输方法
CN108683602A (zh) * 2018-07-13 2018-10-19 北京瀚海星云科技有限公司 一种数据中心网络负载均衡方法
CN109039941A (zh) * 2018-08-23 2018-12-18 中南大学 数据中心网络中基于路径分类的自适应包散射方法
CN109873772A (zh) * 2019-01-25 2019-06-11 广州大学 基于稳定匹配的流调度方法、装置、计算机设备及存储介质
CN109787913A (zh) * 2019-03-15 2019-05-21 北京工业大学 一种基于sdn的数据中心网络动态负载均衡方法
CN110198273A (zh) * 2019-05-31 2019-09-03 中南大学 数据中心网络中基于网络编码的多路径传输方法
CN110138676A (zh) * 2019-06-08 2019-08-16 苏州龙欣通颖网络科技有限公司 一种基于ip的软件定义泛在无线manet路由体系结构

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JINBIN HU: "TLB: Traffic-aware Load Balancing with Adaptive Granularity inData Center Networks", 《HTTP://FACULTY.CSU.EDU.CN/HUANGJIAWEI/EN/LWCG/27183/CONTENT/21243.HTM》 *
陈鸣: "一种基于OpenFlow的多路径传输机制", 《电子与信息学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111526089A (zh) * 2020-04-14 2020-08-11 北京交通大学 一种基于变长粒度的数据融合传输与调度的装置
CN111526089B (zh) * 2020-04-14 2021-08-17 北京交通大学 一种基于变长粒度的数据融合传输与调度的装置
CN111585911A (zh) * 2020-05-22 2020-08-25 西安电子科技大学 数据中心网络流量负载的均衡方法
CN114448899A (zh) * 2022-01-20 2022-05-06 天津大学 一种均衡数据中心网络负载的方法
CN114553783A (zh) * 2022-02-23 2022-05-27 湖南工学院 数据中心网络自适应调整流胞粒度的负载均衡方法
CN114553783B (zh) * 2022-02-23 2023-06-16 湖南工学院 数据中心网络自适应调整流胞粒度的负载均衡方法
CN115134308A (zh) * 2022-06-27 2022-09-30 长沙理工大学 数据中心无损网络中通过数据包弹跳避免队头阻塞的方法
CN115134304A (zh) * 2022-06-27 2022-09-30 长沙理工大学 云计算数据中心避免数据包乱序的自适应负载均衡方法
CN115134304B (zh) * 2022-06-27 2023-10-03 长沙理工大学 云计算数据中心避免数据包乱序的自适应负载均衡方法
CN115134308B (zh) * 2022-06-27 2023-11-03 长沙理工大学 数据中心无损网络中通过数据包弹跳避免队头阻塞的方法
CN115396357A (zh) * 2022-07-07 2022-11-25 长沙理工大学 一种数据中心网络中的流量负载均衡方法及系统
CN115396357B (zh) * 2022-07-07 2023-10-20 长沙理工大学 一种数据中心网络中的流量负载均衡方法及系统

Also Published As

Publication number Publication date
CN110351187B (zh) 2021-03-12

Similar Documents

Publication Publication Date Title
CN110351187A (zh) 数据中心网络中路径切换粒度自适应的负载均衡方法
CN105471764B (zh) 一种SDN网络中端到端QoS保障的方法
CN113728592A (zh) 促进采用端点拥塞检测和控制的数据驱动智能网络的系统和方法
EP1430642B1 (en) Method and system for congestion avoidance in packet switching devices
CN106533960A (zh) 一种基于Fat‑Tree结构的数据中心网络路由方法
US7746784B2 (en) Method and apparatus for improving traffic distribution in load-balancing networks
CN105897575A (zh) 一种sdn下基于多约束路径计算策略的路径计算方法
CN110932989B (zh) 一种基于sdn数据中心网络的大象流路径监控调度方法
WO2017024824A1 (zh) 基于聚合链路的流量管理方法及装置
CN102014075B (zh) 流量监管方法和装置
US20180077064A1 (en) Methods and systems for data center load balancing
CN107948103B (zh) 一种基于预测的交换机pfc控制方法及控制系统
CN112350949B (zh) 软件定义网络中基于流调度的重路由拥塞控制方法及系统
US11863322B2 (en) Communication method and apparatus
CN109787910A (zh) 一种流量管理方法、系统及织状网络处理器
CN111585911B (zh) 数据中心网络流量负载的均衡方法
CN103716252A (zh) 一种分发流量的链路聚合方法及设备
CN109088822A (zh) 数据流量转发方法、装置、系统、计算机设备及存储介质
Wang et al. Load balancing for heterogeneous traffic in datacenter networks
US7508766B2 (en) Packet routing
JP2012216961A (ja) トラヒック制御方法及びゲートウェイ仮想化ノード装置
CN113162863B (zh) 基于轮盘算法的公平多路径路由方法
CN105072046A (zh) 一种基于令牌控制节点并发数据转发的延迟容忍网络拥塞避免方法
CN109257302B (zh) 一种基于分组排队时间的包散射方法
Minkenberg et al. Adaptive routing for convergence enhanced Ethernet

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant