CN107634912B - 负载均衡方法、装置及设备 - Google Patents

负载均衡方法、装置及设备 Download PDF

Info

Publication number
CN107634912B
CN107634912B CN201610570733.8A CN201610570733A CN107634912B CN 107634912 B CN107634912 B CN 107634912B CN 201610570733 A CN201610570733 A CN 201610570733A CN 107634912 B CN107634912 B CN 107634912B
Authority
CN
China
Prior art keywords
message
path
equivalent path
equivalent
switch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610570733.8A
Other languages
English (en)
Other versions
CN107634912A (zh
Inventor
沈利
袁峰
蒋玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201610570733.8A priority Critical patent/CN107634912B/zh
Priority to PCT/CN2017/076987 priority patent/WO2018014569A1/zh
Priority to EP17830212.1A priority patent/EP3468119B1/en
Publication of CN107634912A publication Critical patent/CN107634912A/zh
Priority to US16/239,353 priority patent/US11134014B2/en
Application granted granted Critical
Publication of CN107634912B publication Critical patent/CN107634912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • H04L45/03Topology update or discovery by updating link state protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • H04L45/7453Address table lookup; Address filtering using hashing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • H04L49/253Routing or path finding in a switch fabric using establishment or release of connections between ports
    • H04L49/254Centralised controller, i.e. arbitration or scheduling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/11Identifying congestion

Abstract

本发明公开了一种负载均衡方法、装置及设备,属于网络技术领域。所述方法包括:在接收到服务器发送的一个报文后,判断该报文是否为一个Flowlet的首报文;若该报文为所述Flowlet的首报文,则根据该报文的目的地址确定目的交换机;在存储的等价路径权重表中,确定与该目的交换机关联的至少一条等价路径的权重值,该等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;根据所述至少一条等价路径的权重值,将该报文调度到相应的等价路径上传输。本发明交换机在接收到服务器发送的报文后,进行Flowlet检测,且直接根据本地存储的等价路径权重表作基于Flowlet的负载均衡,无需交换机实时获取各个路径的负载情况,大大降低了负载均衡算法的复杂度,效果佳。

Description

负载均衡方法、装置及设备
技术领域
本发明涉及网络技术领域,特别涉及一种负载均衡方法、装置及设备。
背景技术
随着网络技术的不断发展,数据中心网络越来越广泛地被云服务提供商和企业所创建。在基于数据中心网络进行流量传输时,常常会发生下述两种流量拥塞情况。在图1A中,由于传统的负载均衡方法如ECMP(Equal-Cost MultiPath,等价多路径)方式仅能做到对流数的负载均衡,因此可能会出现图1A所示的多条大象流凑巧映射到同一条链路的情况,导致汇聚流量超过端口容量,引起流量拥塞,这种拥塞称为Local Collision(局部冲突)。在图1B中,由于Leaf交换机各自做负载均衡,没有一个全局的信息,因此可能会出现图1A所示的多个Leaf交换机上发往同一个Leaf交换机的多条大象流,发送到同一个中转交换机(比如Spine交换机)的情况,导致下行流量拥塞,这种拥塞称为Downstream Collision(下游冲突)。因此,为了防止上述两种拥塞情况的发生,如何对网络流量进行负载均衡成为了本领域技术人员关注的一个焦点。
参见图2,现有技术在进行负载均衡时主要逻辑如下:源Leaf交换机检测Flowlet(子流),其中位于一个滑动窗口内的报文作为一个Flowlet一起发送。对于每个新的Flowlet,源Leaf交换机总是选择最小负载路径。其中,路径的负载情况通过下述步骤得到:(1)源Leaf交换机将拥塞信息字段(包括LBTag和CE)封装到每个报文的overlay(覆盖)头中。其中,LBTag表示源Leaf交换机的端口号,CE表示路径拥塞度量值;CE在经过Spine交换机时更新,并在到达目的Leaf交换机后暂存到Congestion-From-Leaf表中。(2)目的Leaf交换机在接收到上述报文后,向源Leaf交换机发送反向报文,具体目的Leaf交换机将拥塞信息字段(包括FB_LBTag和FB_Metric)封装到反向报文的overlay头中。其中,FB_LBTag表示目的Leaf交换机的端口号,FB_Metric表示拥塞度量值。源Leaf交换机在接收到反向报文后,将反向报文存放到Congestion-To-Leaf表中。这样,源Leaf交换机便可以根据本地上行链路和反馈回来的下行链路的拥塞情况,遍历获取最小负载路径的出端口,以为Flowlet决策最佳路径。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于需要目的Leaf交换机返回给源Leaf交换机所有的下行链路负载信息,且需遍历获取最小负载路径对应的出端口,因此该种负载均衡方法的复杂度过高,负载均衡效果欠佳。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种负载均衡方法、装置及设备。所述技术方案如下:
针对控制器来讲,首先会根据网络拓扑、端口状态、链路带宽等信息,计算各条等价多路径的权重,具体为:对于一个源交换机,控制器计算所述源交换机与各个目的交换机之间多条等价路径的权重值,得到所述源交换机的等价路径权重表,所述等价路径权重表中存储了所述多条等价路径与权重值之间的对应关系;向所述源交换机下发所述等价路径权重表。这样每一个源交换机中都会存储有一个与自身匹配的等价路径权重表。
其中,所述控制器在计算所述源交换机与各个目的交换机之间多条等价路径的权重值时,通常采取下述方式实现:对于一个目的交换机,确定所述源交换机与所述目的交换机之间的各条等价路径,所述等价路径包括所述源交换机至中转交换机之间的第一链路路径、以及所述中转交换机至所述目的交换机之间的第二链路路径;对于一条等价路径,根据所述第一链路路径和所述第二链路路径的链路状态,计算所述等价路径的权重值。
在另一个实施例中,一个源交换机在接收到服务器发送的一个报文后,首先进行Flowlet检测,判断所述报文是否为一个Flowlet的首报文。其中,在判断所述报文是否为一个Flowlet的首报文时,可采取下述方式实现:
根据所述报文的五元组信息进行哈希计算,得到哈希值;在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;若所述Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文;若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文;其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
针对所述报文为所述Flowlet的首报文的情况,源交换机会根据所述报文的目的地址确定目的交换机;在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值;根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输。
在本发明实施例中,所述根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输,包括:
获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
需要说明的是,在确定与所述随机数匹配的第一指定等价路径后,源交换机还会将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中。此外,源交换机还会将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值。
针对所述报文为所述Flowlet的非首报文的情况,源交换机根据所述Flowlet条目中的出端口信息确定第二指定等价路径;将所述报文调度到所述第二指定等价路径上传输,并将所述Flowlet条目中的最近活跃时间更新为当前时间。
在另一个实施例中,若与所述目的交换机关联的至少一条等价路径的链路状态发生变化,则源交换机向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算各个源交换机与各个目的交换机之间多条等价路径的权重值,得到新等价路径权重表,并向各个源交换机发送匹配的新等价路径权重表。这样每一个源交换机在接收到所述控制器发送的新等价路径权重表后,存储所述新等价路径权重表用以替换之前存储的等价路径权重表。
在另一个实施例中,对于自身存储的Flowlet表中每一个Flowlet条目,源交换机会周期性计算当前时间与记录的最近活跃时间之间的差值;若所述差值大于预设时间阈值,则源交换机将所述Flowlet条目设置为无效状态,以方便进行Flowlet检测。
本发明实施例提供的技术方案带来的有益效果是:
交换机在接收到服务器发送的报文后进行Flowlet检测,之后交换机直接根据本地存储的等价路径权重表作基于Flowlet的负载均衡,其中所述等价路径权重表中存储了至少一条等价路径与权重值之间的对应关系;比如在检测到当前接收到的报文为一个Flowlet的首报文后,直接根据该报文的目的地址确定目的交换机,并在存储的等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,进而根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输,从而在无需交换机实时获取各个路径的负载情况下实现了负载均衡,大大降低了负载均衡算法的复杂度,效果较佳。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本发明背景技术提供的一种负载均衡方法的逻辑示意图;
图1B是本发明背景技术提供的一种负载均衡方法的逻辑示意图;
图2是本发明背景技术提供的一种负载均衡方法的逻辑示意图;
图3是本发明实施例提供的一种流传输过程的逻辑示意图;
图4是本发明实施例提供的一种Flowlet在Leaf-Spine架构数据中心网络中传输的逻辑示意图;
图5是本发明实施例提供的一种交换机的结构示意图;
图6是本发明实施例提供的一种控制器的结构示意图;
图7是本发明实施例提供的一种负载均衡方法的流程图;
图8是本发明实施例提供的一种负载均衡方法的系统示意图;
图9是本发明实施例提供的一种等价路径权重表的示意图;
图10是本发明实施例提供的一种三级Clos架构数据中心网络的示意图;
图11是本发明实施例提供的一种负载均衡方法的流程图;
图12是本发明实施例提供的一种负载均衡装置的结构示意图;
图13是本发明实施例提供的一种负载均衡装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在对本发明实施例进行详细地解释说明之前,先对Flowlet的原理进行一下解释说明。
如图3所示,在进行TCP(Transmission Control Protocol,传输控制协议)流传输时,如果保证前后两个报文之间的传输时间间隔大于两条路径延时的差值,那么这两个报文便可以通过不同的路径发送,而不用担心引起乱序。具体来说,在分开点(DivergingPoint)通过上面一条路径传输报文1后,经过两条路径延时的差值时长后,再通过下面一条路径传输报文2。这样可保证在报文1到达汇聚点(Converging Point)之后,报文2再到达聚集点,不会引起报文之间的乱序。由于TCP流天然存在Burst(突发)特性,即TCP流总是将位于一个滑动窗口内的报文作为一个Burst一起发送,然后等待ACK(Acknowledge ment,确认字符)。在接收到ACK后再发送下一个窗口内的报文,这样的话两个Burst之间便天然存在一个较大的时间间隔,这个时间间隔可以保证这两个Burst通过不同的路径传输,在达到汇聚点时并不会乱序,这样一个Burst称之为一个子流(Flowlet)。
需要说明的是,Flowlet也并不一定是由一个滑动窗口内的多个报文组成,还可能由多个滑动窗口内的报文组成,甚至可能是一个滑动窗口内的报文被分成几个Flowlet,这和判断Flowlet的传输时间间隔有关,这个传输时间间隔越短,原始的一条流被分成的Flowlet数越多;这个传输时间间隔越长,原始的一条流被分成的Flowlet数越少。这个传输时间间隔并不是越长越好,也不是越短越好,会有一个临界值,用这个临界值区分Flowlet,不但需保证Flowlet数足够多,还需保证Flowlet通过不同路径发送到汇聚点后还不会乱序。
图4说明了Flowlet在Leaf-Spine架构数据中心网络中的基本原理。以Leaf1对第一个Leaf交换机进行标识,以Leaf4对第四个Leaf交换机进行标识为例,在图4中,报文1和报文2分别通过图中粗线所示的两条路径从Leaf1发送到Leaf4。分别以d1和d2对两条路径的延时进行标识,则需保证报文1和报文2之间的发送时间间隔Gap≥|d1-d2|,这样报文1便会先于报文2达到Leaf4,从而保证两个报文之间不会乱序。
图5是本发明实施例提供的一种交换机的结构示意图,参见图5,包括:发送器501、接收器502、存储器503和处理器504,存储器503、发送器501和接收器502分别与处理器504连接,存储器503存储有程序代码,处理器504用于调用程序代码,执行以下操作:
在通过接收器502接收到服务器发送的一个报文后,判断所述报文是否为一个Flowlet的首报文;若所述报文为所述Flowlet的首报文,则根据所述报文的目的地址确定目的交换机;在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值,所述等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输。
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
根据所述报文的五元组信息进行哈希计算,得到哈希值;在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;若所述Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文,将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值;其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文,根据所述Flowlet条目中的出端口信息确定第二指定等价路径;将所述报文调度到所述第二指定等价路径上传输,并将所述Flowlet条目中的最近活跃时间更新为当前时间。
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
在确定与所述随机数匹配的第一指定等价路径后,将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中;
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
若所述至少一条等价路径的链路状态发生变化,则通过发送器501向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算所述至少一条等价路径的权重值,得到新等价路径权重表;通过接收器502接收所述控制器发送的所述新等价路径权重表,并存储所述新等价路径权重表。
在另一个实施例中,处理器504用于调用程序代码,执行以下操作:
对于所述Flowlet表中的每一个Flowlet条目,周期性计算当前时间与最近活跃时间之间的差值;若所述差值大于预设时间阈值,则将所述Flowlet条目设置为无效状态。
本发明实施例提供的交换机,在接收到控制器下发的等价路径权重表并进行存储后,若接收到服务器发送的报文,则进行Flowlet检测并直接根据本地存储的等价路径权重表和Flowlet表作基于Flowlet的负载均衡,为当前接收到的报文选择待传输的等价路径,无需交换机实时获取各个路径的负载情况,仅需在链路状态发送变化时重新计算一次等价路径权重即可,大大降低了负载均衡算法的复杂度,效果较佳。
图6是本发明实施例提供的一种控制器的结构示意图,参见图6,包括:发送器601、接收器602、存储器603和处理器604,存储器603、发送器601和接收器602分别与处理器604连接,存储器603存储有程序代码,处理器604用于调用程序代码,执行以下操作:
对于一个源交换机,计算该源交换机与各个目的交换机之间多条等价路径的权重值,得到该源交换机的等价路径权重表;通过发送器601向该源交换机下发等价路径权重表,以使该源交换机在接收到服务器发送的一个报文且判断出该报文为一个Flowlet的首报文后,根据该报文的目的地址确定目的交换机,在等价路径权重表中确定与该目的交换机关联的至少一条等价路径的权重值,根据至少一条等价路径的权重值,将该报文调度到相应的等价路径上传输。
在另一个实施例中,处理器604用于调用程序代码,执行以下操作:
对于一个目的交换机,确定该源交换机与该目的交换机之间的各条等价路径,所述等价路径包括该源交换机至中转交换机之间的第一链路路径、以及中转交换机至该目的交换机之间的第二链路路径;对于一条等价路径,根据第一链路路径和第二链路路径的链路状态,计算该等价路径的权重值。
在另一个实施例中,处理器604用于调用程序代码,执行以下操作:
通过接收器602接收该源交换机发送的链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的等价路径;根据链路状态变更消息,重新计算各个源交换机与各个目的交换机之间多条等价路径的权重值,得到新等价路径权重表;通过发送器601向各个源交换机发送匹配的新等价路径权重表。
本发明实施例提供的控制器,在根据整网链路信息,分别为两两交换机之间的各条等价路径设置权重值,并将对应的等价路径权重表下发至每一个交换机后,若交换机接收到服务器发送的报文,则进行Flowlet检测并直接根据本地存储的等价路径权重表和Flowlet表作基于Flowlet的负载均衡,以为当前接收到的报文选择待传输的等价路径,无需交换机实时获取各个路径的负载情况,仅需在链路状态发送变化时重新计算一次等价路径权重即可,大大降低了负载均衡算法的复杂度,效果较佳。
图7是本发明实施例提供的一种负载均衡方法的流程图,本发明实施例的主要思路有两个,一个是使用Flowlet来打散大象流;另一个是在Flowlet的基础上实现通过WCMP(Weighted Cost MultiPath,带权重非等价多路径)方法来作负载均衡。以二级Clos的Leaf-Spine架构数据中心网络为例,参见图7,本发明实施例提供的方法流程包括:
701、控制器计算Leaf-Spine架构中两两Leaf交换机之间各条等价路径的权重,生成等价路径权重表,并下发等价路径权重表至各个Leaf交换机。
如图8所示,控制器会根据网络拓扑、端口状态、链路带宽等链路状态,计算出两两Leaf交换机之间各条等价路径的权重。需要说明的是,两两Leaf交换机之间各条等价路径指代的含义是,对于一个源Leaf交换机,计算该源Leaf交换机与各个目的Leaf交换机之间的全部等价路径。在图8中,两两Leaf交换机之间各条等价路径,包括Leaf#1与Leaf#2之间的3条等价路径、Leaf#1与Leaf#3之间的3条等价路径,Leaf#2与Leaf#1之间的3条等价路径、Leaf#2与Leaf#3之间的3条等价路径,以及Leaf#3与Leaf#1之间的3条等价路径、Leaf#3与Leaf#2之间的3条等价路径。
以源Leaf交换机为Leaf#1,目的Leaf交换机为Leaf#2为例,参加图8,二者之间总共存在三条等价路径,分别为Leaf#1→Spine#1→Leaf#2,Leaf#1→Spine#2→Leaf#2和Leaf#1→Spine#3→Leaf#2。其中,对于第一条等价路径Leaf#1→Spine#1→Leaf#2,由于其链路Leaf#1→Spine#1、Spine#1→Leaf#2的链路带宽都是40G,因此将该条等价路径的权重设置为4。对于第二条等价路径Leaf#1→Spine#2→Leaf#2,由于其链路Leaf#1→Spine#2、Spine#2→Leaf#2的链路带宽都是40G,因此将该条等价路径的权重也设置为4。对于第三条等价路径Leaf#1→Spine#3→Leaf#3,由于其链路Leaf#1→Spine#3、Spine#3→Leaf#2的链路带宽都是40G,因此将该条等价路径的权重也设置为4。
以源Leaf交换机为Leaf#1,目的Leaf交换机为Leaf#3为例,参加图8,二者之间总共存在三条等价路径,分别为Leaf#1→Spine#1→Leaf#3,Leaf#1→Spine#2→Leaf#3和Leaf#1→Spine#3→Leaf#3。其中,对于第一条等价路径Leaf#1→Spine#1→Leaf#3,由于Spine#1→Leaf#3这段链路处于失效状态,因此该条链路down,将该条等价路径的权重设置为0。对于第二条等价路径Leaf#1→Spine#2→Leaf#3,由于Spine#2-->Leaf#3这段链路的链路带宽为10G,因此将该条等价路径的权重设置为1。对于第三条等价路径Leaf#1→Spine#3→Leaf#3,由于其链路Leaf#1→Spine#3、Spine#3→Leaf#3的链路带宽都是40G,因此将该条等价路径的权重设置为4。
对于Leaf#1来说,在计算出Leaf#1与Leaf#2之间3条等价路径的权重值、Leaf#1与Leaf#3之间3条等价路径的权重值之后,便可得到图8所示的与Leaf#1关联的等价路径权重表。其中,横轴表示路径号、纵轴表示目的Leaf交换机号。而对于Leaf#2和Leaf#3来说,也可按照上述方式计算各条等价路径的权重值,得到图8所示的与Leaf#2关联的等价路径权重表和与Leaf#3关联的等价路径权重表。控制器在得到上述等价路径权重表后,将与Leaf#1关联的等价路径权重表发送至Leaf交换机Leaf#1,将与Leaf#2关联的等价路径权重表发送至Leaf交换机Leaf#2,将与Leaf#3关联的等价路径权重表发送至Leaf交换机Leaf#3。
702、对于一个源Leaf交换机,接收服务器发送的报文并检测Flowlet,每接收到一个报文,判断该报文是否为一个Flowlet的首报文;若该报文为该Flowlet的非首报文,则执行下述步骤703;若该报文为该Flowlet的首报文,则执行下述步骤704。
在本发明实施例中,使用Flowlet来打散大象流。其中,源交换机在检测Flowlet时有不同的实现方式,一种实现方式是为每条流维护一个流表。在接收到报文后,计算当前报文的到达时间与前一个报文的到达时间之间的时间差值;如果该时间差值超过判定Flowlet的预设时间阈值,则当前接收到的是一个新的Flowlet;另一种实现方式是维护一个Flowlet表,通过Flowlet表项超时机制,即如果一个Flowlet表项不活动时间超过预设时间阈值,那么下一个报文到达后,判断出对应Flowlet的valid bit为0,这说明接收到的报文是一个新Flowlet的首包,更具体的说明请参见后续描述部分。在本发明实施例中实际采用第二种方式,第二种方式的好处是需要维护的表项数远少于第一种方式。
源Leaf交换机每接收到一个报文,都会根据该报文的五元组信息进行哈希计算,并在存储的Flowlet表中确定与得到的哈希值匹配的Flowlet条目。其中,若根据该报文的五元组信息进行哈希计算得到的哈希值,与Flowlet表中任一Flowlet条目的五元组信息的哈希值计算结果一致,则将该Flowlet条目确定为与得到的哈希值匹配的Flowlet条目。
若该Flowlet条目中的有效位信息(Valid Bit)为第一数值,则确定该报文为该Flowlet的首报文;若该Flowlet条目中的有效位信息为第二数值,则确定该报文为该Flowlet的非首报文。其中,第一数值通常为0,第二数值通常为1。五元组信息通常包括:SrcIP(Source Internet Protocol,源网络协议地址)、Dst IP(Destination IP,目的IP地址)、Src Port(源端口)、Dst Port(目的端口)、Protocol(控制协议)。此外,Flowlet表包含的内容具体如下述表1所示:
表1
Figure BDA0001053788370000101
在表1中,一个Flowlet对应一个条目。对于一个Flowlet条目来说,前五列元素为五元组信息,最近活跃时间(Last Active Time)用于记录最后一次使用一条Flowlet条目的时间,出端口信息(Outport)指示用于传输报文的等价路径信息。Valid Bit的取值为0或1,用于指示当前Flowlet条目记录的Flowlet是否处于有效状态。如果有效位信息的取值为0,则证明当前Flowlet条目记录的Flowlet处于无效状态,这个Flowlet已经超时。
703、若该报文为该Flowlet的非首报文,源Leaf交换机根据存储的Flowlet表中与其关联Flowlet条目中的出端口信息确定等价路径A,将该报文调度到等价路径A上传输,并将与其关联Flowlet条目中的最近活跃时间更新为当前时间。
针对该种情况,由于源Leaf交换机在接收到该Flowlet的首报文时,已经在Flowlet表中建立好与其关联Flowlet条目,因此在接收到该Flowlet的非首报文时,该Flowlet条目中已经至少包括五元组信息、最近活跃时间、出端口信息和有效位信息了,且有效位信息的取值为1。由于该Flowlet条目中包括出端口信息,因此直接将该出端口信息指示的等价路径A确定为传输该报文的等价路径,将该报文调度到等价路径A上进行传输,同时将该Flowlet条目中的Last Active Time更新为当前时间。
704、若该报文为该Flowlet的首报文,则源Leaf交换机根据该报文的目的地址确定目的Leaf交换机,在存储的等价路径权重表中,确定与目的Leaf交换机关联的至少一条等价路径;根据至少一条等价路径的权重值,将该报文调度到等价路径B上传输。
由于该报文为该Flowlet的首报文,因此这是一个新的Flowlet,Flowlet表中除了有效位信息(取值为0)之外的其他信息均为之前已超时的Flowlet的相关信息,因此还需源Leaf交换机将该报文的五元组信息、当前时间作为最近活跃时间保存到Flowlet表中对应的Flowlet条目中,同时将有效位信息由第一数值更新为第二数值,也即由0更新为1。之后,源Leaf交换机再根据控制器下发的等价路径权重表,计算将该报文调度到哪一个等价路径上进行传输。其中,等价路径B的具体确定过程如下:
源Leaf交换机获取与目的Leaf交换机之间每一条等价路径的权重值,计算每一条等价路径的权重值之和,并产生一个数值范围位于零至该权重值之和之间的随机数;根据该随机数的数值,在与目的Leaf交换机之间的全部等价路径中,确定与该随机数匹配的等价路径B,将该报文调度到等价路径B上传输。
以报文从Leaf#1发送到Leaf#3为例,由图8可知,Leaf#1至Leaf#3的三条等价路径的权重值分别为0、1、4,因此各条等价路径的权重值之和为5。对于每个新的Flowlet(即Flowlet中的首包),产生一个范围在1~5的随机数;如果随机数的值为1,将该报文调度到Leaf#1→Spine#2→Leaf#3这条等价路径上(即图8中Leaf#1的第2个出端口);如果随机数为2~5,则将该报文调度到Leaf#1→Spine#3→Leaf#3这条等价路径上(即图8中Leaf#1的第3个出端口),这样便可保证Leaf#1至Leaf#3的三条等价路径上Flowlet的数目比例为0∶1∶4,实现了负载均衡。
需要说明的是,在确定等价路径B后,将等价路径B的路径标识作为出端口信息保存在Flowlet表的对应Flowlet条目中。这样对于该Flowlet的后续报文(即非Flowlet首包),则可直接读取该Flowlet条目中的出端口信息进行报文发送。
此外,当两两Leaf交换机之间的各条等价路径中链路状态变化时,比如端口down或up,关联的Leaf交换机会将端口down或up的情况上报控制器,由控制器根据端口down或up的情况,根据步骤701中类似的方式重新计算两两Leaf交换机之间的各条等价路径的权重值,并将权重值发生变化的部分下发给涉及到的Leaf交换机。假设如8中Spine#1→Leaf#3链路恢复正常,则各个Leaf交换机的等价路径权重表将变为图9所示。与图8对照可知,在Spine#1→Leaf#3链路恢复正常后,与Leaf#1关联的等价路径权重表、与Leaf#2关联的等价路径权重表、与Leaf#3关联的等价路径权重表均发生了变化,因此分别向三个Leaf交换机下发新等价路径权重表。
需要说明的是,Leaf交换机会周期性地扫描Flowlet表中所有Flowlet条目,对于Flowlet已超时的表项,会将该表项设置为无效状态。其中,Flowlet已超时的表项指代当前时间减去表项中Last Active Time大于某个预设时间阈值的表项。也即,Leaf交换机对于Flowlet表中的每一个Flowlet条目,周期性计算当前时间与该Flowlet条目中记录的最近活跃时间之间的差值;若该差值大于预设时间阈值,则将该Flowlet条目设置为无效状态。
此外,本发明实施例提及的负载均衡方法同样可运用于三级Clos的Fat-tree架构数据中心网络。其中三级Clos的Fat-tree架构实际上由多个二级Clos叠加而成。如图10所示的三级Clos Fat-tree架构,两个POD(Pool Of Device,设备池)分别对应一个二级Clos,即TOR(Top OfRack,架顶交换机)#1、TOR#2、AGG(Aggregation,汇聚交换机)#1、AGG#2组成一个二级Clos,TOR#3、TOR#4、AGG#3、AGG#4组成另外一个二级Clos,同时第二层的AGG#1、AGG#2、AGG#3、AGG#4和Spine#1、Spine#2又组成1个二级Clos,分别运行本发明所述方案,可达到非常好的负载均衡效果。
本发明实施例提供的方法,控制器根据整网链路信息,分别为两两交换机之间的各条等价路径设置权重值,并将对应的等价路径权重表下发至每一个交换机,且交换机在接收到服务器发送的报文后,进行Flowlet检测,这样交换机可直接根据本地存储的等价路径权重表和Flowlet表作基于Flowlet的负载均衡,无需交换机实时获取各个路径的负载情况,仅需在链路状态发送变化时重新计算一次等价路径权重即可,大大降低了负载均衡算法的复杂度,效果较佳。
图11是本发明实施例提供的一种负载均衡方法的流程图。以交换机执行该方法的角度为例,参见图11,本发明实施例提供的方法流程包括:
1101、在接收到服务器发送的一个报文后,判断该报文是否为一个Flowlet的首报文;若该报文为一个Flowlet的首报文,则执行下述步骤1102。
1102、若该报文为一个Flowlet的首报文,则根据该报文的目的地址确定目的交换机。
1103、在存储的等价路径权重表中,确定与该目的交换机关联的至少一条等价路径的权重值,该等价路径权重表中存储了至少一条等价路径与权重值之间的对应关系。
1104、根据至少一条等价路径的权重值,将该报文调度到相应的等价路径上传输。
本发明实施例提供的方法,交换机在接收到服务器发送的报文后进行Flowlet检测,之后交换机直接根据本地存储的等价路径权重表作基于Flowlet的负载均衡,其中所述等价路径权重表中存储了至少一条等价路径与权重值之间的对应关系;比如在检测到当前接收到的报文为一个Flowlet的首报文后,直接根据该报文的目的地址确定目的交换机,并在存储的等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,进而根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输,从而在无需交换机实时获取各个路径的负载情况下实现了负载均衡,大大降低了负载均衡算法的复杂度,效果较佳。
在另一个实施例中,所述根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输,包括:
获取所述至少一条等价路径中每一条等价路径的权重值;
计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;
根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;
将所述报文调度到所述第一指定等价路径上传输。
在另一个实施例中,所述判断所述报文是否为一个Flowlet的首报文,包括:
根据所述报文的五元组信息进行哈希计算,得到哈希值;
在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;
若所述Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文,将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值;
其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
在另一个实施例中,该方法还包括:
若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文,根据所述Flowlet条目中的出端口信息确定第二指定等价路径;
将所述报文调度到所述第二指定等价路径上传输,并将所述Flowlet条目中的最近活跃时间更新为当前时间。
在另一个实施例中,该方法还包括:
在确定与所述随机数匹配的第一指定等价路径后,将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中。
在另一个实施例中,该方法还包括:
若所述至少一条等价路径的链路状态发生变化,则向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算所述至少一条等价路径的权重值,得到新等价路径权重表;
接收所述控制器发送的所述新等价路径权重表,并存储所述新等价路径权重表。
在另一个实施例中,该方法还包括:
对于所述Flowlet表中的每一个Flowlet条目,周期性计算当前时间与最近活跃时间之间的差值;
若所述差值大于预设时间阈值,则将所述Flowlet条目设置为无效状态。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图12是本发明实施例提供的一种负载均衡装置的结构示意图。参见图12,该装置包括:判断模块1201、确定模块1202、调度模块1203。
判断模块1201,用于在接收到服务器发送的一个报文后,判断所述报文是否为一个Flowlet的首报文;
确定模块1202,用于若所述报文为所述Flowlet的首报文,则根据所述报文的目的地址确定目的交换机;
所述确定模块1202,还用于在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值,所述等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;
调度模块1203,用于根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输。
在另一个实施例中,所述调度模块1203,用于获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
在另一个实施例中,该装置还包括:
所述判断模块1201,用于根据所述报文的五元组信息进行哈希计算,得到哈希值;在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;若该Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文;
更新模块1204,用于当所述报文为所述Flowlet的首报文时,将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值;其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
在另一个实施例中,所述判断模块1201,还用于若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文;
所述确定模块1202,还用于当所述报文为所述Flowlet的非首报文时,根据所述Flowlet条目中的出端口信息确定第二指定等价路径;
所述调度模块1203,还用于当所述报文为所述Flowlet的非首报文时,将该报文调度到所述第二指定等价路径上传输;更新模块1204,还用于当所述报文为所述Flowlet的非首报文时,将该Flowlet条目中的最近活跃时间更新为当前时间。
在另一个实施例中,该装置还包括:
保存模块1205,用于在确定与所述随机数匹配的第一指定等价路径后,将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中。
在另一个实施例中,该装置还包括:
发送模块1205,用于若所述至少一条等价路径的链路状态发生变化,则向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算所述至少一条等价路径的权重值,得到新等价路径权重表;
接收模块1206,用于接收所述控制器发送的所述新等价路径权重表,并存储所述新等价路径权重表。
在另一个实施例中,该装置还包括:
计算模块1207,用于对于所述Flowlet表中的每一个Flowlet条目,周期性计算当前时间与最近活跃时间之间的差值;
设置模块1208,用于若所述差值大于预设时间阈值,则将所述Flowlet条目设置为无效状态。
本发明实施例提供的装置,在接收到控制器下发的等价路径权重表并进行存储后,若接收到服务器发送的报文,则进行Flowlet检测并直接根据本地存储的等价路径权重表和Flowlet表作基于Flowlet的负载均衡,为当前接收到的报文选择待传输的等价路径,无需交换机实时获取各个路径的负载情况,仅需在链路状态发送变化时重新计算一次等价路径权重即可,大大降低了负载均衡算法的复杂度,效果较佳。
图13是本发明实施例提供的一种负载均衡装置的结构示意图。参见图13,该装置包括:计算模块1301和发送模块1302。
计算模块1301,用于对于一个源交换机,计算所述源交换机与各个目的交换机之间多条等价路径的权重值,得到所述源交换机的等价路径权重表;
发送模块1302,用于向所述源交换机下发所述等价路径权重表,以使所述源交换机在接收到服务器发送的一个报文且判断出所述报文为一个Flowlet的首报文后,根据所述报文的目的地址确定目的交换机,在所述等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,根据所述至少一条等价路径的权重值,将所述报文调度到相应的等价路径上传输。
在另一个实施例中,所述计算模块1301,用于对于一个目的交换机,确定所述源交换机与所述目的交换机之间的各条等价路径,所述等价路径包括所述源交换机至中转交换机之间的第一链路路径、以及所述中转交换机至所述目的交换机之间的第二链路路径;对于一条等价路径,根据所述第一链路路径和所述第二链路路径的链路状态,计算所述等价路径的权重值。
在另一个实施例中,该装置还包括:
接收模块1303,用于接收所述源交换机发送的链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的等价路径;
所述计算模块1301,还用于根据所述链路状态变更消息,重新计算各个源交换机与各个目的交换机之间多条等价路径的权重值,得到新等价路径权重表;
所述发送模块1302,还用于向各个源交换机发送匹配的新等价路径权重表。
本发明实施例提供的装置,在根据整网链路信息,分别为两两交换机之间的各条等价路径设置权重值,并将对应的等价路径权重表下发至每一个交换机后,若交换机接收到服务器发送的报文,则进行Flowlet检测并直接根据本地存储的等价路径权重表和Flowlet表作基于Flowlet的负载均衡,以为当前接收到的报文选择待传输的等价路径,无需交换机实时获取各个路径的负载情况,仅需在链路状态发送变化时重新计算一次等价路径权重即可,大大降低了负载均衡算法的复杂度,效果较佳。
需要说明的是:上述实施例提供的负载均衡装置在进行负载均衡时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的负载均衡装置与负载均衡方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (20)

1.一种负载均衡方法,其特征在于,所述方法包括:
在接收到服务器发送的一个报文后,判断所述报文是否为一个子流Flowlet的首报文;
若所述报文为所述Flowlet的首报文,则根据所述报文的目的地址确定目的交换机;
在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值,所述等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;
获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
2.根据权利要求1所述的方法,其特征在于,所述判断所述报文是否为一个Flowlet的首报文,包括:
根据所述报文的五元组信息进行哈希计算,得到哈希值;
在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;
若所述Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文,将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值;
其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文,根据所述Flowlet条目中的出端口信息确定第二指定等价路径;
将所述报文调度到所述第二指定等价路径上传输,并将所述Flowlet条目中的最近活跃时间更新为当前时间。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在确定与所述随机数匹配的第一指定等价路径后,将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中。
5.根据权利要求1至4中任一权利要求所述的方法,其特征在于,所述方法还包括:
若所述至少一条等价路径的链路状态发生变化,则向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算所述至少一条等价路径的权重值,得到新等价路径权重表;
接收所述控制器发送的所述新等价路径权重表,并存储所述新等价路径权重表。
6.根据权利要求2至4中任一权利要求所述的方法,其特征在于,所述方法还包括:
对于所述Flowlet表中的每一个Flowlet条目,周期性计算当前时间与最近活跃时间之间的差值;
若所述差值大于预设时间阈值,则将所述Flowlet条目设置为无效状态。
7.一种负载均衡方法,其特征在于,所述方法还包括:
对于一个源交换机,计算所述源交换机与各个目的交换机之间多条等价路径的权重值,得到所述源交换机的等价路径权重表;
向所述源交换机下发所述等价路径权重表,以使所述源交换机在接收到服务器发送的一个报文且判断出所述报文为一个Flowlet的首报文后,根据所述报文的目的地址确定目的交换机,在所述等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
8.根据权利要求7所述的方法,其特征在于,所述计算所述源交换机与各个目的交换机之间多条等价路径的权重值,包括:
对于一个目的交换机,确定所述源交换机与所述目的交换机之间的各条等价路径,所述等价路径包括所述源交换机至中转交换机之间的第一链路路径、以及所述中转交换机至所述目的交换机之间的第二链路路径;
对于一条等价路径,根据所述第一链路路径和所述第二链路路径的链路状态,计算所述等价路径的权重值。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
接收所述源交换机发送的链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的等价路径;
根据所述链路状态变更消息,重新计算各个源交换机与各个目的交换机之间多条等价路径的权重值,得到新等价路径权重表;
向各个源交换机发送匹配的新等价路径权重表。
10.一种负载均衡装置,其特征在于,所述装置包括:
判断模块,用于在接收到服务器发送的一个报文后,判断所述报文是否为一个子流Flowlet的首报文;
确定模块,用于若所述报文为所述Flowlet的首报文,则根据所述报文的目的地址确定目的交换机;
所述确定模块,还用于在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值,所述等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;
调度模块,用于获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
所述判断模块,用于根据所述报文的五元组信息进行哈希计算,得到哈希值;在存储的Flowlet表中,确定与所述哈希值匹配的Flowlet条目;若所述Flowlet条目中的有效位信息为第一数值,则确定所述报文为所述Flowlet的首报文;
更新模块,用于当所述报文为所述Flowlet的首报文时,将所述五元组信息、当前时间作为最近活跃时间更新至所述Flowlet条目中,并将所述有效位信息由第一数值更新为第二数值;其中,一个Flowlet条目中至少包括一个Flowlet的五元组信息、最近活跃信息、出端口信息和有效位信息。
12.根据权利要求11所述的装置,其特征在于,所述判断模块,还用于若所述Flowlet条目中的有效位信息为所述第二数值,则确定所述报文为所述Flowlet的非首报文;
所述确定模块,还用于当所述报文为所述Flowlet的非首报文时,根据所述Flowlet条目中的出端口信息确定第二指定等价路径;
所述调度模块,还用于当所述报文为所述Flowlet的非首报文时,将所述报文调度到所述第二指定等价路径上传输;
所述更新模块,还用于当所述报文为所述Flowlet的非首报文时,将所述Flowlet条目中的最近活跃时间更新为当前时间。
13.根据权利要求10所述的装置,其特征在于,所述装置还包括:
保存模块,用于在确定与所述随机数匹配的第一指定等价路径后,将所述第一指定等价路径的路径标识作为出端口信息,保存在Flowlet表的对应Flowlet条目中。
14.根据权利要求10至13中任一权利要求所述的装置,其特征在于,所述装置还包括:
发送模块,用于若所述至少一条等价路径的链路状态发生变化,则向控制器发送链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的第三指定等价路径,以使所述控制器根据所述链路状态变更消息,重新计算所述至少一条等价路径的权重值,得到新等价路径权重表;
接收模块,用于接收所述控制器发送的所述新等价路径权重表,并存储所述新等价路径权重表。
15.根据权利要求11至13中任一权利要求所述的装置,其特征在于,所述装置还包括:
计算模块,用于对于所述Flowlet表中的每一个Flowlet条目,周期性计算当前时间与最近活跃时间之间的差值;
设置模块,用于若所述差值大于预设时间阈值,则将所述Flowlet条目设置为无效状态。
16.一种负载均衡装置,其特征在于,所述装置还包括:
计算模块,用于对于一个源交换机,计算所述源交换机与各个目的交换机之间多条等价路径的权重值,得到所述源交换机的等价路径权重表;
发送模块,用于向所述源交换机下发所述等价路径权重表,以使所述源交换机在接收到服务器发送的一个报文且判断出所述报文为一个Flowlet的首报文后,根据所述报文的目的地址确定目的交换机,在所述等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
17.根据权利要求16所述的装置,其特征在于,所述计算模块,用于对于一个目的交换机,确定所述源交换机与所述目的交换机之间的各条等价路径,所述等价路径包括所述源交换机至中转交换机之间的第一链路路径、以及所述中转交换机至所述目的交换机之间的第二链路路径;对于一条等价路径,根据所述第一链路路径和所述第二链路路径的链路状态,计算所述等价路径的权重值。
18.根据权利要求16所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收所述源交换机发送的链路状态变更消息,所述链路状态变更消息指示了链路状态发生变化的等价路径;
所述计算模块,还用于根据所述链路状态变更消息,重新计算各个源交换机与各个目的交换机之间多条等价路径的权重值,得到新等价路径权重表;
所述发送模块,还用于向各个源交换机发送匹配的新等价路径权重表。
19.一种交换机,其特征在于,包括:发送器、接收器、存储器和处理器,所述存储器、所述发送器和所述接收器分别与所述处理器连接,所述存储器存储有程序代码,所述处理器用于调用程序代码,执行以下操作:
在通过所述接收器接收到服务器发送的一个报文后,判断所述报文是否为一个子流Flowlet的首报文;若所述报文为所述Flowlet的首报文,则根据所述报文的目的地址确定目的交换机;在存储的等价路径权重表中,确定与所述目的交换机关联的至少一条等价路径的权重值,所述等价路径权重表中存储了所述至少一条等价路径与权重值之间的对应关系;获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
20.一种控制器,其特征在于,包括:发送器、接收器、存储器和处理器,所述存储器、所述发送器和所述接收器分别与所述处理器连接,所述存储器存储有程序代码,所述处理器用于调用程序代码,执行以下操作:
对于一个源交换机,计算所述源交换机与各个目的交换机之间多条等价路径的权重值,得到所述源交换机的等价路径权重表;通过所述发送器向所述源交换机下发所述等价路径权重表,以使所述源交换机在接收到服务器发送的一个报文且判断出所述报文为一个Flowlet的首报文后,根据所述报文的目的地址确定目的交换机,在所述等价路径权重表中确定与所述目的交换机关联的至少一条等价路径的权重值,获取所述至少一条等价路径中每一条等价路径的权重值;计算所述每一条等价路径的权重值之和,产生一个数值范围位于零至所述权重值之和之间的随机数;根据所述随机数的数值,在所述至少一条等价路径中,确定与所述随机数匹配的第一指定等价路径;将所述报文调度到所述第一指定等价路径上传输。
CN201610570733.8A 2016-07-19 2016-07-19 负载均衡方法、装置及设备 Active CN107634912B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201610570733.8A CN107634912B (zh) 2016-07-19 2016-07-19 负载均衡方法、装置及设备
PCT/CN2017/076987 WO2018014569A1 (zh) 2016-07-19 2017-03-16 负载均衡方法、装置及设备
EP17830212.1A EP3468119B1 (en) 2016-07-19 2017-03-16 Method, apparatus and device for balancing load
US16/239,353 US11134014B2 (en) 2016-07-19 2019-01-03 Load balancing method, apparatus, and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610570733.8A CN107634912B (zh) 2016-07-19 2016-07-19 负载均衡方法、装置及设备

Publications (2)

Publication Number Publication Date
CN107634912A CN107634912A (zh) 2018-01-26
CN107634912B true CN107634912B (zh) 2020-04-28

Family

ID=60992833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610570733.8A Active CN107634912B (zh) 2016-07-19 2016-07-19 负载均衡方法、装置及设备

Country Status (4)

Country Link
US (1) US11134014B2 (zh)
EP (1) EP3468119B1 (zh)
CN (1) CN107634912B (zh)
WO (1) WO2018014569A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106998302B (zh) * 2016-01-26 2020-04-14 华为技术有限公司 一种业务流量的分配方法及装置
US10848432B2 (en) * 2016-12-18 2020-11-24 Cisco Technology, Inc. Switch fabric based load balancing
US10924385B2 (en) * 2017-11-07 2021-02-16 Nicira, Inc. Weighted multipath routing configuration in software-defined network (SDN) environments
WO2020086092A1 (en) * 2018-10-26 2020-04-30 Hewlett Packard Enterprise Development Lp Determination of an inflection point in congestion of a network path
CN112398749A (zh) * 2019-08-12 2021-02-23 中国电信股份有限公司 负载均衡方法、装置和系统、网络和存储介质
CN112423345B (zh) * 2019-08-22 2022-08-02 大唐移动通信设备有限公司 一种小区重选的方法和网络侧设备及ue
EP4113917A4 (en) * 2020-03-10 2023-01-25 Mitsubishi Electric Corporation CONTROLLER, NETWORK SYSTEM, AND FLOW MANAGEMENT METHOD
CN111526089B (zh) * 2020-04-14 2021-08-17 北京交通大学 一种基于变长粒度的数据融合传输与调度的装置
US11411869B1 (en) * 2020-05-11 2022-08-09 Cisco Technology, Inc. Designated forwarder selection for multihomed hosts in an ethernet virtual private network
CN113810284A (zh) * 2020-06-16 2021-12-17 华为技术有限公司 确定报文发送路径的方法及装置
WO2022067791A1 (zh) * 2020-09-30 2022-04-07 华为技术有限公司 一种数据处理、传输方法及相关设备
CN112787925B (zh) * 2020-10-12 2022-07-19 中兴通讯股份有限公司 拥塞信息收集方法、确定最优路径方法、网络交换机
US11425044B2 (en) * 2020-10-15 2022-08-23 Cisco Technology, Inc. DHCP layer 2 relay in VXLAN overlay fabric
CN112910795B (zh) * 2021-01-19 2023-01-06 南京大学 一种基于众源的边缘负载均衡方法和系统
CN115442287B (zh) * 2022-08-10 2024-04-05 北京金山云网络技术有限公司 基于权重的专线网关方法以及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136986A (zh) * 2010-01-22 2011-07-27 杭州华三通信技术有限公司 一种负载分担方法和交换设备
CN102710489A (zh) * 2011-03-28 2012-10-03 日电(中国)有限公司 动态分流调度系统和方法
CN105591974A (zh) * 2014-10-20 2016-05-18 华为技术有限公司 报文处理方法、装置及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8897130B2 (en) * 2009-09-16 2014-11-25 Broadcom Corporation Network traffic management
US10044548B2 (en) * 2012-10-15 2018-08-07 Jetflow Technologies Flowlet-based processing
US9071541B2 (en) * 2012-04-25 2015-06-30 Juniper Networks, Inc. Path weighted equal-cost multipath
US9036476B2 (en) * 2012-09-28 2015-05-19 Juniper Networks, Inc. Maintaining load balancing after service application with a network device
US9270601B2 (en) * 2013-04-01 2016-02-23 Broadcom Corporation Path resolution for hierarchical load distribution
US10778584B2 (en) * 2013-11-05 2020-09-15 Cisco Technology, Inc. System and method for multi-path load balancing in network fabrics
US9502111B2 (en) * 2013-11-05 2016-11-22 Cisco Technology, Inc. Weighted equal cost multipath routing
US9565114B1 (en) * 2014-03-08 2017-02-07 Google Inc. Weighted load balancing using scaled parallel hashing
US9367366B2 (en) * 2014-03-27 2016-06-14 Nec Corporation System and methods for collaborative query processing for large scale data processing with software defined networking
US9397926B2 (en) * 2014-08-05 2016-07-19 Dell Products L.P. Peer-influenced aggregate member selection
CN104580002B (zh) * 2015-01-14 2017-07-28 盛科网络(苏州)有限公司 大流负载均衡转发方法及装置
US10320681B2 (en) * 2016-04-12 2019-06-11 Nicira, Inc. Virtual tunnel endpoints for congestion-aware load balancing
US10015096B1 (en) * 2016-06-20 2018-07-03 Amazon Technologies, Inc. Congestion avoidance in multipath routed flows

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102136986A (zh) * 2010-01-22 2011-07-27 杭州华三通信技术有限公司 一种负载分担方法和交换设备
CN102710489A (zh) * 2011-03-28 2012-10-03 日电(中国)有限公司 动态分流调度系统和方法
CN105591974A (zh) * 2014-10-20 2016-05-18 华为技术有限公司 报文处理方法、装置及系统

Also Published As

Publication number Publication date
WO2018014569A1 (zh) 2018-01-25
EP3468119A1 (en) 2019-04-10
US20190140956A1 (en) 2019-05-09
US11134014B2 (en) 2021-09-28
CN107634912A (zh) 2018-01-26
EP3468119A4 (en) 2019-04-24
EP3468119B1 (en) 2023-07-26

Similar Documents

Publication Publication Date Title
CN107634912B (zh) 负载均衡方法、装置及设备
CN102263697B (zh) 一种聚合链路流量分担方法和装置
US20170048144A1 (en) Congestion Avoidance Traffic Steering (CATS) in Datacenter Networks
US10986021B2 (en) Flow management in networks
TWI353144B (en) Systems and methods for protocol filtering for qua
US9667570B2 (en) Fabric extra traffic
US10965604B2 (en) Deadlock avoidance in leaf-spine networks
JP2009542113A (ja) フォルトトレラントQoSのための方法及びシステム
US10728156B2 (en) Scalable, low latency, deep buffered switch architecture
JP2006506845A (ja) ルータにおけるパケットに対し論理リンクを選択する方法
WO2021244450A1 (zh) 一种通信方法及装置
CN111224888A (zh) 发送报文的方法及报文转发设备
CN109309625A (zh) 一种数据中心网络灾备传输方法
US7233578B1 (en) Network with self regulating quality of service (QoS)
EP4333380A1 (en) Packet forwarding method and apparatus, and dragonfly network
CN115776443A (zh) 网络优化策略的确定方法、装置及系统
CN110324255B (zh) 一种面向数据中心网络编码的交换机/路由器缓存队列管理方法
CN108881010A (zh) 基于损益评估的拥塞路径调整方法
CN112087376A (zh) 一种负载分担的方法及装置
CN117081984B (zh) 一种路由调整方法、装置及电子设备
CN111510391B (zh) 数据中心环境下细粒度级别混合的负载均衡方法
US11729099B2 (en) Scalable E2E network architecture and components to support low latency and high throughput
Xu et al. SIG: Solution to TCP incast in SDN network based Openflow protocol
An et al. Priority-based distributed dynamic multipath routing for LEO satellite networks
Rekha et al. Agent based Monitoring and Scheduling Technique Framework for Backup Configurations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant