CN109039930A - 一种评估Clos网络路径拥塞的方法 - Google Patents

一种评估Clos网络路径拥塞的方法 Download PDF

Info

Publication number
CN109039930A
CN109039930A CN201810772377.7A CN201810772377A CN109039930A CN 109039930 A CN109039930 A CN 109039930A CN 201810772377 A CN201810772377 A CN 201810772377A CN 109039930 A CN109039930 A CN 109039930A
Authority
CN
China
Prior art keywords
path
rtt
congestion
threshold value
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810772377.7A
Other languages
English (en)
Inventor
张弘
张骏雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hai Hai Xingyun Technology Co Ltd
Original Assignee
Beijing Hai Hai Xingyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hai Hai Xingyun Technology Co Ltd filed Critical Beijing Hai Hai Xingyun Technology Co Ltd
Priority to CN201810772377.7A priority Critical patent/CN109039930A/zh
Publication of CN109039930A publication Critical patent/CN109039930A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/28Flow control; Congestion control in relation to timing considerations
    • H04L47/283Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/29Flow control; Congestion control using a combination of thresholds

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种评估Clos网络路径拥塞的方法,其通过利用RTT和ECN信号并结合二者优点,准确地判断路径拥塞程度;相较于TTL、RTT、ACK或其变换趋势判断路径拥塞的方法,本发明提供的技术方案减少了误判,并可以提供了更为细化的路径状态展示。在此基础上,本发明还提供一种评估路径状态的方法、一种比较路径拥塞程度的方法以及在以上基础上的负载均衡方法。

Description

一种评估Clos网络路径拥塞的方法
技术领域
本发明涉及Clos网络数据传输技术领域;具体地,涉及一种评估Clos网络路径拥塞的方法,以及在上述方法评估获得的路径状态指导下的负载均衡方法。
背景技术
在以太网络通信中,为了降低路径故障对数据流量传输业务的影响,通常将多个路径互做备份;当主路径出现故障时,流量重路由到备用路径上,以保证业务的质量和可靠性。在该思想指导下的技术演进过程中,发展出了无阻塞网络的概念。
广义的无阻塞网络,是指一个给定的网络存在着固有的阻塞可能,但又可能存在着一种精巧的选路方法,使得所有的阻塞均可避免,而不必重新安排网络中已建立起来的连接。作为一种无阻碍网络,Clos网络在网络通信等领域被广泛应用。严格来说,这样的网络结构,无论是胖树拓扑结构(Fat tree)还是叶脊拓扑结构(Leaf-spine,如图1所示),也只是在带宽上的无阻碍,并不能避免现实中在个别路径上发生的拥塞、故障等。那么,如何将流量负载分布在合适的路径上呢?一个技术路线的指导思想是,及时获知路径的状态,并根据路径状态做出合理的路由策略(包括重路由,即重新调整路径)。
在多级Clos网络中,拥塞是不可避免的;由于流量是动态传输的,拥塞可能出现在网络的任何地方(如图2所示)。在简单的网络中,通常通过拥塞控制机制减少拥塞对单一路径下流量传输的影响;其中,显式拥塞通知(Explicit Congestion Notification,ECN),通常被用来捕捉单跳(hop)的拥塞,它通过商用交换机支持实现,被广泛用于拥塞控制算法。
但是,在Clos这种高负载网络下,ECN对此是无能为力;ECN信号只能反映路径中最拥塞一跳的拥塞情况。而在如Clos网络等的高负载网络下,拥塞可能从多跳积累起来。因此,一个低的ECN值也并非一定表示没有发生拥塞,特别是在ECN采样不足的情况下,其尤为明显。
现有技术中,CN106911584A公开了基于源叶设备发出的探测获知路径拥塞,但其仅限于叶脊拓扑结构网络下;另,探测还将引入额外开销的问题;同样是以探测为手段,CN108063732A则公开了以包生存时间(Time to live,TTL)信号为指标、基于当前路径(以处于拥塞中)评估探测路径拥塞,虽然其探测更具针对性和目的性,但其也存在开销问题,且评估的路径越多,需要探测的路径越多,额外开销也越大;而CN104767826A提供的基于端的故障容忍的分布式数据中心负载均衡方法公开了利用ACK到达时间和ACK确认号等信息评估路径拥塞程度,但是Ack信号也不能充分和很准确地反映路径的拥塞程度。
发明内容
有鉴于此,本发明提供一种评估Clos网络路径拥塞的方法,其通过利用RTT和ECN信号,并结合二者,评估Clos网络中路径的拥塞程度。基于上述方法获得的路径状态,本申请提供一种避免拥塞的负载均衡方法。
一方面,本发明提供一种利用RTT和ECN信号评估Clos网络路径拥塞的方法。该方法包括:
在源主机端,
获取自所述源主机端出发可达的所有路径上的RTT值和ECN标记率;
设定用于判断各路径拥塞程度的RTT门限值和ECN标记率门限值;其中,所述的RTT门限值,用于衡量各路径的RTT值高低,从一方面反映路径的拥塞程度;所述的ECN标记率门限值,用于衡量各路径的ECN标记包比率(即标记率)的高低,从另一方面反映路径的拥塞程度;
根据各路径的RTT值和ECN标记率,评估路径拥塞程度,
若一条路径的RTT值高于所述RTT门限值且ECN标记率高于所述ECN标记率门限值,则评估该路径处于拥塞状态(即为拥塞路径Congested path);否则,该路径处于非拥塞状态(即为非拥塞路径Non-congested path)。
结合所述的第一方面,在其所述方法中,为提高判断的准确性和进一步细化区分路径状态,优选的,设定高、低RTT门限值;其具体评估如下,
若一条路径的RTT值高于所述的高RTT门限值且ECN标记率高于所述ECN标记率门限值,则评估该路径处于拥塞状态(即为拥塞路径Congested path);
若一条路径的RTT值低于所述的低RTT门限值且ECN标记率低于所述ECN标记率门限值,则评估该路径未被充分利用(即为良好路径Good path);
否则,评估该路径处于次于为未被充分利用但优于拥塞的中间状态(即为灰色路径Gray path)。
优选的,根据基础RTT设定所述的RTT门限值;所述的基础RTT值由网络环境、设备等因素决定。
进一步,优选的,所述的高RTT门限值,根据基础RTT值与单跳的时延设定。
进一步,优选的,所述的低RTT门限值,被设定的稍高于基础RTT值。一种做法是,在基础RTT值上加上一个极小的调参时间。
优选的,所述的ECN标记率门限值设定为中间水平,如40%左右;这是因为一个过高的ECN标记率门限值,是不能灵敏地反映路径拥塞程度;但一个较低的ECN标记率门限值,则会造成过多的拥塞误判。
另一方面,结合所述第一方面的评估Clos网络路径拥塞的方法,本发明提供一种评估路径状态的方法。在所述评估路径拥塞的方法基础上,该方法还包括:
获取各路径超时、重传信息;
若一条路径超时超过三次且没有收到Ack包、或重传率超过1%且为非拥塞路径时,则判断该路径为故障路径。
又一方面,结合所述第一方面的评估Clos网络路径拥塞的方法,本发明提供一种比较路径拥塞程度的方法,该方法包括:
获取第一路径、及自源主机端出发可达的其他路径的RTT值和ECN标记率;
设定用于比较两条路径间拥塞程度的门限值ΔRTT和ΔECN;
若所述第一路径与所述其他路径中的任意一条间的RTT值、ECN标记率之差,均大于ΔRTT、ΔECN,则认为该路径拥塞程度明显优于所述第一路径。
当所述的第一路径为拥塞路径,上述的比较则更有意义。
又一方面,结合所述第一方面、第二方面,本发明提供一种负载均衡方法,该方法包括:
根据上述方法获知路径状态,指导负载均衡。
优选的,结合所述第三方面,所述负载均衡,包括所述比较路径拥塞程度的方法指导下的重路由。
相对现有技术,本发明提供的技术方案具有诸多的有益效果,如:
一,全面性,通过其能有效地检测路径拥塞和故障,进而指导负载均衡;
二,准确性,较之仅通过TTL、RTT、ACK或其变换趋势判断路径拥塞的方法,本发明提供了更为准确的判断,减少了误判,同时还提供了更为细化的路径状态展示;
三,低开销,相对于以探测为手段的路径评估方法,本发明提供的方法减少了探测的开销。
附图说明
为更加清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明中一部分实施例或现有技术描述中涉及的附图做简单介绍。
图1展示了现有技术中的一种Clos网络架构(叶脊拓扑结构)示意图;
图2揭示了图1中的网络容易发生拥塞的缺陷;
图3为一种利用ECN和RTT评估路径结果的示意图;
图4为本发明一实施例提供了一种评估路径状态的算法。
具体实施方式
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为一种叶脊拓扑结构的Clos网络示意图,这种网络结构能够为网络中的每一对主机终端提供多条路径。通过这种多路径网络传输数据流量时,本领域技术人员都会追求严格的流量负载均衡,以最大限度地利用带宽并行传输流量。但是,在数据流量动态传输过程中,特别是在多路径情形下,路由算法导致的流量拥塞就无法根本避免。
针对上述问题,本发明的一部分实施例提供一种利用RTT和ECN信号评估Clos网络路径拥塞的方法,以及全面及时地感知路径拥塞状态。该方法包括:
在源主机端,获取自所述源主机端出发可达的所有路径上的RTT值和ECN标记率;其中,RTT(Round trip time),即往返时间,是计算机网络中一个重要的性能指标,表示从发送端发送数据开始,到发送端收到来自接收端的确认经历的时间。RTT对于TCP协议非常重要,在TCP中常被用来作为设置超时时间的依据。由于RTT由路径传输时间、端处理时间及交换机排队和处理时间等决定。因此,RTT的变化在一定程度上反映网络拥塞程度的变化。在一些方案中,RTT通常被直接拿来评估端到端的路径拥塞程度。虽然RTT对拥塞评估有一定信息价值,但是直接用于评估路径拥塞显然得到的RTT值是不够准确的。一个高的RTT值并非一定表示路径拥塞,比如主机终端网络协议栈的延迟也会增加RTT值。但小的RTT值则能明确表示路径未充分利用,这对我们来说是更有信息价值的。而ECN通常被用来捕捉单跳的拥塞,它是通过商用交换机支持实现,被广泛用于拥塞控制算法。但是,在高负载网络(如Clos网络)下,拥塞可能从多跳积累起来。ECN信号则只是反映路径中最拥塞一跳的拥塞情况。因此,一个低的ECN值也并非一定表示没有发生拥塞,特别是在ECN采样不足的情况下,其尤为明显。
因此,我们设定RTT门限值和ECN标记率门限值两个门限值,以用于判断各路径拥塞程度。其具体判断过程如下:若一条路径的RTT值高于所述RTT门限值且ECN标记率高于所述ECN标记率门限值,则评估该路径处于拥塞状态(即为拥塞路径Congested path);否则,该路径处于非拥塞状态(即为非拥塞路径Non-congested path)。
在上述的实施例中,部分实施例提供一种优选的实现方式,即设定高、低RTT门限值;其具体评估如图3所示,
一条路径的RTT值高于所述的高RTT门限值,虽并不一定路径拥塞造成的,但若其ECN标记率也高于所述ECN标记率门限值,则大概率是路径拥塞造成的,故评估该路径处于拥塞状态(即为拥塞路径);
若一条路径的ECN标记率低于所述ECN标记率门限值,可能是采样低造成的误报,但若其RTT值也低于所述的低RTT门限值,则在很大程度上反映该路径处于未充分利用状态,故评估该路径未被充分利用(即为良好路径);
除上述两种情况外,其他的包括适度负载的几种情况,一般可视为优于拥塞的状态,但又无法确认或次于未充分利用状态,故将处于这种中间状态的路径评估为灰色路径。
在上述任一的实施例中,部分实施例提供一种优选的实现方式,根据基础RTT设定所述的RTT门限值。
进一步,上述的设定高、低RTT门限值的实施例中,优选的,其中的高RTT门限值,根据基础RTT值与跳的时延设定。例如,一个高RTT门限值,可以设定为基础RTT值、单个跳的时延与预设参数乘积之和。其中预设参数可根据网络环境、设备等因素调节。
同样地,低RTT门限值,可设定为稍高于基础RTT值。例如,在基础RTT值上加上一个极小的调参时间(如20-40μs)。
在上述的任一实施例中,部分实施例提供一种优选的实现方式,所述的ECN标记率门限值设定为中间水平,例如40%。这样既可以避免ECN标记率门限值设定过高而不能灵敏地反映路径拥塞程度,又可减少因其设定过低造成过的拥塞误判。
本发明的另一部分实施例提供一种评估路径状态的方法。图4为该评估路径状态方法其中一个实施例的算法示例。在上述评估路径拥塞的方法(详见第1-7行)基础上,该方法还包括:
获取各路径超时、重传信息;
并根据其评估路径故障,具体如下,
若一条路径超时超过三次且没有收到Ack包、或重传率超过1%且为非拥塞路径时,则判断该路径为故障路径。(详见第8-9行)
本发明的又一部分实施例提供一种比较路径拥塞程度的方法,该方法包括:
获取某条路径(即视为当前路径)、及自源主机端出发可达的其他路径的RTT值和ECN标记率;
设定用于比较两条路径间拥塞程度的门限值ΔRTT和ΔECN;
将该当前路径与所述其他路径中的任意一条间的RTT值、ECN标记率之差,与上述门限值比较,若两值均分别大于ΔRTT、ΔECN,则认为这条与当前路径对比的路径的拥塞程度明显优于当前路径。
当前路径为拥塞路径,通过上述路径比较,可以为路径调整给出指导。
本发明的又一部分实施例提供一种负载均衡的方法,该方法包括:
根据上述方法获知路径状态,指导负载均衡。具体的,可以通过上述方法,及时获知路径拥塞、故障等,在流量负载分配时,据此合理地规避拥塞、故障。
在上述的实施例中,部分实施例提供一种优选的实现方式,
结合上述的比较路径拥塞程度方法提供的路径调整指导,所述的负载均衡方法,包括基于上述路径调整指导的重路由。
以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此。

Claims (10)

1.一种评估Clos网络路径拥塞的方法,其特征在于,
该方法包括:
在源主机端,获取自所述源主机端出发可达的所有路径上的RTT值和ECN标记率;
设定用于判断各路径拥塞程度的RTT门限值和ECN标记率门限值;
根据各路径的RTT值和ECN标记率,评估路径拥塞程度,
若一条路径的RTT值高于所述RTT门限值且ECN标记率高于所述ECN标记率门限值,则判断该路径为拥塞路径;
否则,判断该路径为非拥塞路径。
2.根据权利要求1所述的评估Clos网络路径拥塞的方法,其特征在于,
设定高、低RTT门限值;
若一条路径的RTT值高于所述RTT门限值且ECN标记率高于所述ECN标记率门限值,则判断该路径为拥塞路径;
若一条路径的RTT值低于所述RTT门限值且ECN标记率低于所述ECN标记率门限值,则判断该路径为良好路径;
否则,判断该路径为灰色路径。
3.根据权利要求1所述的评估Clos网络路径拥塞的方法,其特征在于,
所述的RTT门限值,根据基础RTT值设定。
4.根据权利要求2所述的评估Clos网络路径拥塞的方法,其特征在于,
所述的高RTT门限值,根据基础RTT和单跳的时延设定。
5.根据权利要求2所述的评估Clos网络路径拥塞的方法,其特征在于,
所述的低RTT门限值,为基础RTT值与调参时间之和。
6.根据权利要求1所述的评估Clos网络路径拥塞的方法,其特征在于,
所述的ECN标记率门限值设定为中间水平。
7.一种评估路径状态的方法,其特征在于,
在权利要求1-6任一评估路径拥塞的方法基础上,还包括:
获取各路径超时、重传信息;
若一条路径超时超过三次且没有收到Ack包、或重传率超过1%且为非拥塞路径时,则判断该路径为故障路径。
8.一种比较路径拥塞程度的方法,其特征在于,
获取第一路径、及自源主机端出发可达的其他路径的RTT值和ECN标记率;
设定用于比较两条路径间拥塞程度的门限值ΔRTT和ΔECN;
若所述第一路径与所述其他路径中的任意一条间的RTT值、ECN标记率之差,均大于ΔRTT、ΔECN,则认为该路径拥塞程度明显优于所述第一路径。
9.一种负载均衡方法,其特征在于,
根据权利要求1-7任一方法,获取路径状态,指导负载均衡。
10.根据权利要求9所述的负载均衡方法,其特征在于,
所述负载均衡,包括权利要求8所述方法指导下的重路由。
CN201810772377.7A 2018-07-13 2018-07-13 一种评估Clos网络路径拥塞的方法 Pending CN109039930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810772377.7A CN109039930A (zh) 2018-07-13 2018-07-13 一种评估Clos网络路径拥塞的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810772377.7A CN109039930A (zh) 2018-07-13 2018-07-13 一种评估Clos网络路径拥塞的方法

Publications (1)

Publication Number Publication Date
CN109039930A true CN109039930A (zh) 2018-12-18

Family

ID=64642877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810772377.7A Pending CN109039930A (zh) 2018-07-13 2018-07-13 一种评估Clos网络路径拥塞的方法

Country Status (1)

Country Link
CN (1) CN109039930A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002040A (zh) * 2022-05-27 2022-09-02 长沙理工大学 基于大数据的感知优先级流控的负载均衡方法及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088413A (zh) * 2011-03-02 2011-06-08 华为技术有限公司 一种网络流量分流方法、网络节点及系统
CN108243111A (zh) * 2016-12-27 2018-07-03 华为技术有限公司 确定传输路径的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102088413A (zh) * 2011-03-02 2011-06-08 华为技术有限公司 一种网络流量分流方法、网络节点及系统
CN108243111A (zh) * 2016-12-27 2018-07-03 华为技术有限公司 确定传输路径的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HONG ZHANG等: "Resilient Datacenter Load Balancing in the Wild", 《THE CONFERENCE OF THE ACM SPECIAL INTEREST GROUP ON DATA COMMUNICATION》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002040A (zh) * 2022-05-27 2022-09-02 长沙理工大学 基于大数据的感知优先级流控的负载均衡方法及其系统
CN115002040B (zh) * 2022-05-27 2024-03-01 长沙理工大学 基于大数据的感知优先级流控的负载均衡方法及其系统

Similar Documents

Publication Publication Date Title
US10498612B2 (en) Multi-stage selective mirroring
US7961605B2 (en) System and method for enabling management of a plurality of messages in a communication network
CN108234340B (zh) 基于流控制信用的自适应路由
US20020044528A1 (en) Flow control method and apparatus
US8923701B2 (en) Wireless communications links
EP3550774B1 (en) Packet transmission method and hybrid access gateway
US20170155544A1 (en) Monitoring and detecting causes of failures of network paths
US10574546B2 (en) Network monitoring using selective mirroring
US20080247327A1 (en) Identifying correlations within wireless networks
US20190215274A1 (en) Packet loss tolerant transmission control protocol congestion control
US10389646B2 (en) Evading congestion spreading for victim flows
US9548928B2 (en) Network system, controller, and load distribution method
CN109088822B (zh) 数据流量转发方法、装置、系统、计算机设备及存储介质
CN108683602B (zh) 一种数据中心网络负载均衡方法
JP4672448B2 (ja) 全二重・半二重不整合検出方法及び,この方法を適用する全二重・半二重不整合検出装置
US8289851B2 (en) Lightweight bandwidth-management scheme for elastic traffic
CN112737940A (zh) 一种数据传输的方法和装置
CN109039930A (zh) 一种评估Clos网络路径拥塞的方法
CN112468405B (zh) 基于信用和反应型的数据中心网络拥塞控制方法
CN112910795B (zh) 一种基于众源的边缘负载均衡方法和系统
CN108881010A (zh) 基于损益评估的拥塞路径调整方法
KR20170004052A (ko) 네트워크 트래픽 상태에 기반한 대역폭 관리 방법 및 시스템
CN111835653B (zh) 一种网络流量负载均衡的控制方法及系统
CN116346726B (zh) 一种自适应突发流量的主机端负载均衡方法
US20230269184A1 (en) Notification-based load balancing in a network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 a2405, building 9, zone 2, Shenzhen Bay science and technology ecological park, 3609 Baishi Road, community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Zhixing Technology Co., Ltd

Address before: 100088 Haidian District 57 North Central Ring Road 44, 57 cottage No. 63.

Applicant before: BEIJING HANHAI CLUSTAR TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20181218

RJ01 Rejection of invention patent application after publication