CN111953598A - 一种分布式流量转发方法、装置及系统 - Google Patents

一种分布式流量转发方法、装置及系统 Download PDF

Info

Publication number
CN111953598A
CN111953598A CN202010607582.5A CN202010607582A CN111953598A CN 111953598 A CN111953598 A CN 111953598A CN 202010607582 A CN202010607582 A CN 202010607582A CN 111953598 A CN111953598 A CN 111953598A
Authority
CN
China
Prior art keywords
forwarding
traffic
interface
forwarded
forwarding unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010607582.5A
Other languages
English (en)
Other versions
CN111953598B (zh
Inventor
曾华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202010607582.5A priority Critical patent/CN111953598B/zh
Publication of CN111953598A publication Critical patent/CN111953598A/zh
Application granted granted Critical
Publication of CN111953598B publication Critical patent/CN111953598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2425Traffic characterised by specific attributes, e.g. priority or QoS for supporting services specification, e.g. SLA
    • H04L47/2433Allocation of priorities to traffic types
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开了一种分布式流量转发方法、装置及系统。该方法包括:由控制单元来设置聚合接口对应的优先级队列和带宽限制信息,并将这些配置信息下发到聚合接口的每个成员接口所在的转发单元;而转发单元则根据上述配置信息对选路到该聚合接口的待转发流量进行转发处理,包括从本地优先级队列中获取一个优先级最高的待转发流量,从聚合接口的成员接口中优选本地成员接口进行转发,如果本地成员接口发生拥塞,则选取一个其他转发单元的成员接口,将待转发流量发送给该成员接口。如此,实现了聚合口在全局统一的服务质量(QoS)功能,不同转发单元对流量优先级的处理保持一致,同时也实现了聚合接口的实际带宽限制与设置的带宽限制相符。

Description

一种分布式流量转发方法、装置及系统
技术领域
本发明涉及数据通信领域,尤其涉及一种分布式流量转发方法、装置及系统。
背景技术
在分布式转发场景中,一个控制单元可能对应多个转发单元。控制单元通过链路聚合的方式将各转发单元成员接口捆绑成一个逻辑接口,实现流量的负载均衡和冗余备份。在这种场景下,不同优先级的流量随机从各个转发单元进入,之后从同一聚合接口转发出去。在这一过程中,由于优先级的控制是在各个转发单元独立进行的,会存在优先级无法保证的情况。
发明内容
针对以上问题,本发明人创造性地提供一种分布式流量转发方法、装置及系统。
根据本发明实施例第一方面,一种分布式流量转发方法,应用于控制单元,该方法包括:设置聚合接口对应的转发配置信息,转发配置信息包括优先级队列的配置信息、聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;将转发配置信息下发到聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据转发配置信息对选路到聚合接口的待转发流量进行转发。
根据本发明实施例一实施方式,在聚合接口上设置转发配置信息之前,该方法还包括:获取聚合接口的总带宽限制信息;根据聚合接口各成员接口的转发能力按比例将总带宽限制信息分配到各成员接口;根据分配到各成员接口的带宽限制信息设置每个成员接口的带宽限制信息。
根据本发明实施例第二方面,应用于第一转发单元,第一转发单元上设置有聚合接口的成员接口,该方法包括:根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量,其中,本地优先级队列是第一转发单元根据优先级队列的配置信息在本地预先创建好的;从聚合接口的成员接口中选取位于第一转发单元的成员接口作为第一成员接口进行转发;根据第一成员接口的带宽限制信息判断第一成员接口是否会发生拥塞,若是,则选取一个位于第二转发单元的第二成员接口,并将待转发流量发送给位于第二转发单元的第二成员接口,若否,则从第一成员接口进行转发。
根据本发明实施例一实施方式,在根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高待的转发流量之前,该方法还包括:获取待转发流量;为待转发流量进行选路,若待转发流量选路到聚合接口,则根据待转发流量和优先级队列的配置信息将待转发流量加入到优先级对应的本地优先级队列中。
根据本发明实施例一实施方式,待转发流量包括从其他转发单元传递给第一转发单元的待转发流量。
根据本发明实施例一实施方式,将待转发流量发送给位于第二转发单元的第二成员接口,包括:通过第一转发单元和第二转发单元之间的跨卡转发通道将待转发流量发送给位于第二转发单元的第二成员接口。
根据本发明实施例一实施方式,在将待转发流量发送给位于第二转发单元的第二成员接口之前,该方法还包括:检测待转发流量是否已经在聚合接口的所有成员接口中都传递了一遍后仍未转发出去,若是,则丢弃待转发流量。
根据本发明实施例第三方面,一种分布式流量转发装置,应用于控制单元,该装置包括:转发配置信息设置模块,用于设置聚合接口对应的转发配置信息,转发配置信息包括优先级队列的配置信息、聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;转发配置信息下发模块,用于将转发配置信息下发到聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据转发配置信息对选路到聚合接口的待转发流量进行转发。
根据本发明实施例第四方面,一种分布式流量转发装置,应用于转发单元,该装置包括:待转发流量获取模块,用于根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量;第一成员接口选取模块,用于从聚合接口的成员接口中选取位于第一转发单元的成员接口作为第一成员接口进行转发;拥塞检测模块,用于根据第一成员接口的带宽限制信息判断第一成员接口是否会发生拥塞;待转发流量发送模块,用于选取一个位于第二转发单元的第二成员接口,并将待转发流量发送给位于第二转发单元的第二成员接口;待转发流量转发模块,用于从第一成员接口进行转发。
根据本发明实施例第五方面,提供一种分布式流量转发系统,系统包括控制单元、第一转发单元和第二转发单元,其中,控制单元中设置有一个聚合接口,聚合接口的成员接口位于第一转发单元和第二转发单元上,控制单元用于执行上述任一项应用于控制单元的分布式流量转发方法;所述第一转发单元,用于执行上述任一项应用于转发单元的分布式流量转发方法;所述第二转发单元,用于接收所述第一转发单元发送的所述待转发流量。
本发明实施例提供一种分布式流量转发方法、装置及系统,本发明实施例公开了一种分布式流量转发方法、装置及系统。该方法包括:由控制单元来设置聚合接口对应的优先级队列和带宽限制信息,并将这些配置信息下发到聚合接口的每个成员接口所在的转发单元;而转发单元则根据上述配置信息对选路到该聚合接口的待转发流量进行转发处理,包括从本地优先级队列中获取一个优先级最高的待转发流量,从聚合接口的成员接口中优选本地成员接口进行转发,如果本地成员接口发生拥塞,则选取一个其他转发单元的成员接口,将待转发流量发送给该成员接口。如此,实现了聚合口在全局统一的服务质量(Quality of Service,QoS)功能,不同转发单元对流量优先级的处理保持一致,同时也实现了聚合接口的实际带宽限制与设置的带宽限制相符。
需要理解的是,本发明的教导并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本发明的其他实施方式还能够实现上面未提到的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明实施例分布式流量转发方法的应用场景示意图;
图2为本发明实施例分布式流量转发方法在控制单元端的实现流程示意图;
图3为本发明实施例分布式流量转发方法在转发单元端的实现流程示意图;
图4为本发明实施例分布式流量转发装置在控制单元端的组成结构示意图;
图5为本发明实施例分布式流量转发装置在转发单元端的组成结构示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
图1示出了本发明实施例分布式流量转发方法的一个应用场景,该应用场景是一个分布式转发场景,其中,控制单元101对应多个转发单元,如转发单元102、转发单元103和转发单元104。控制单元101通过链路聚合的方式将各转发单元的成员接口,比如成员接口1021、成员接口1031和成员接口1041,捆绑成一个逻辑接口,即图1所示的聚合接口105,实现流量的负载均衡和冗余备份。在这种场景下,不同优先级流量会从各个转发单元进入,选路到聚合接口后,就会从转发单元上该聚合接口对应的成员接口转发出去。例如,假设从转发单元102进入的某一流量经过选路要从聚合接口105转发出去,此时,转发单元102就会读取相应的配置文件,找到聚合接口105对应的成员接口,然后就将该流量从成员接口转发出去。
在现有方案中,聚合接口的服务质量功能是由各个转发单元独立实现的,只在单个转发单元上保证流量优先级队列,如果转发单元上有成员接口,则进入到该转发单元上的流量只从该转发单元上的成员接口发送,因此很难保证不同流量的优先级在各个转发单元保持一致。
与现有方案不同,使用本发明实施例分布式流量转发方法,聚合接口的服务质量功能是由控制单元101统一进行的。控制单元101会统一规划优先级队列的配置信息,并将聚合接口105的总带宽限制分配到各个成员接口为各个成员接口设置对应的带宽限制。
之后,控制单元101将上述规划内容以配置文件的方式下发到各个转发单元上,如转发单元102、转发单元103和转发单元104。每个转发单元收到该配置文件后会存储在本地,并根据配置文件中设置的优先级队列的配置信息,以及各个成员接口对应的带宽限制进行后续的转发处理和本转发单元的服务质量功能。
此外,如果在本地成员接口发生拥塞时,转发单元还会通过跨卡通道将该流量传递到其他转发单元尝试轮询发送。例如,从转发单元103进入的某一流量经过选路要从聚合接口105转发出去,此时,转发单元103就会读取本地存储的、由控制单元101下发的配置文件,找到聚合接口105对应的所有成员接口,比如成员接口1021、成员接口1031和成员接口1041。转发单元103会优先选取本地的成员接口1031转发该流量,如果根据成员接口1031的带宽限制信息进行判断,发现该成员接口1031已经发生拥塞,则转发单元103就会选择一个其他的成员接口并通过跨卡通道将该流量转发到其他成员接口对应的转发单元。假设转发单元103选取的是成员接口1041,则转发单元103就会将该流量通过转发单元103与转发单元104之间的跨卡转发通道发送到转发单元104。转发单元104接受到该流量后,会把该流量加入到转发单元104本地为聚合接口105创建的优先级队列中,对其进行相应的处理。如果在随后转发该流量的过程中,根据成员接口1041的带宽限制信息进行判断,发现成员接口1041也发生了拥塞,则转发单元104会通过跨卡转发通道继续将该流量转发到其他未转发过的成员接口对应的转发单元,比如成员接口1021对应的转发单元102。如果,成员接口1021也发生了拥塞,且再没有其他成员接口可进行轮询转发,则丢弃该流量。
如此,就实现了不同转发单元对不同优先级流量的统一处理和聚合接口的实际带宽与设置的带宽限制实时一致。
需要说明的是上述应用场景仅是本发明实施例分布式流量转发方法可应用的多种应用场景之一,是示例性说明,并非对本发明实施例应用场景所作的限定。
根据本发明实施例第一方面,一种分布式流量转发方法,应用于控制单元,如图2所示,该方法包括:操作210,设置聚合接口对应的转发配置信息,转发配置信息包括优先级队列的配置信息、聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;操作220,将转发配置信息下发到聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据转发配置信息对选路到聚合接口的待转发流量进行转发。
网络中的通信都是由各种流量组成的,这些流量来自不同的应用,而这些应用对网络服务和性能的要求各不相同。比如,FTP下载业务希望能获取尽量多的带宽,而VoIP语音业务则希望能保证尽量少的延迟和抖动等。为了保证各种应用各种流量的不同需求,会根据服务要求对不同业务的流量进行分类,并根据流量分类对该流量的报文进行优先级标记,然后有差别地提供服务。
流量分类,就是将流量划分为多个类别,并对流量对应的报文进行类别的标记。在对流量进行分类时,可以根据报文中的任何信息段对流量进行分类,例如,源IP地址、目的IP地址、源端口号、目的端口号、协议ID等等。而对流量对应的报文进行标记时,则通常通过约定的某些字段来进行。例如,在以太网帧中,可以使用802.1Q头保留的User Priority字段标记服务级别或使用IP报文头的ToS字段的前3位或前6位来标记报文的分类;而在MPLS网络报文中,则可以根据EXP字段来标记流量的分类。对流量对应的报文进行标记的主要目的是让处理此报文的应用系统或设备,如本实施例中提到的控制单元或转发单元,知道该报文的类别,并根据这种类别对报文进行相应的区分处理。
在操作210中,优先级队列的配置信息主要指设置几个优先级以及每个优先级队列对应的流量分类。如此,可以将不同流量分类的流量对应到不同的优先级队列中,从而实现根据类别对流量对应的报文进行相应的区分处理。
各个转发单元可以依据这一配置信息,将流量对应的报文插入到相应的优先级队列中,并根据优先级队列对应的优先级由高到低的顺序依次处理每一优先级队列中的报文。
通常,在发送报文时,会优先发送高优先队列中的报文,直到高优先队列中的报文发送完,然后再发送优先队列中的报文。这样,可使得关键业务或实时业务(如VoIP)的报文能够得到优先处理,而非关键业务或非实时的业务(如E-Mail)的报文则可以在网络处理完关键业务或实施业务后的空闲间隙得到处理。如此,既保证了实时业务的优先,又充分利用了网络资源。
例如,在配置信息中进行了如下分类和标记:1)将所有VoIP数据报文划分到EF业务类,并将EF业务类报文的优先级标记为5;2)将所有VoIP控制报文划分到AF业务类,将AF业务类报文的优先级标记为4,其中,优先级的值越低代表优先级越高,即AF业务类的优先级高于EF业务类。
当转发单元收到EF业务类的报文,就会将该报文放入到优先级为5的优先级队列中;当转发单元收到AF业务类的报文,就会将该报文放入到优先级为4的优先级队列中。在网络拥塞时,就会优先处理优先级为4的优先级队列里的报文,处理完后就会处理优先级为5的优先级队列里的报文。对应到上述的配置信息,AF业务类的报文就会在EF业务类报文之前得到处理。
在操作210中,除了优先级队列的配置信息,聚合接口对应的转发配置信息还需要包括聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息。转发单元在获取聚合接口对应的所有成员接口后,就可以在本地成员接口发生拥塞时,选择其他转发单元上的成员接口进行轮询转发。而每个成员接口的带宽限制信息,主要是用于向转发单元提供带宽限制信息,以便转发单元对本地成员接口的带宽进行相应的控制。
在操作220中,将转发配置信息下发到聚合接口的每个成员接口所在的转发单元可以使各个转发单元获取相同的转发配置信息,从而保证不同流量分类的优先级配置在各个单元上是一致的,且每个成员接口的带宽限制也可以得到统一的配置和规划。
由控制单元设置聚合接口对应的优先级队列配置信息和每个成员接口的带宽限制信息,可以实现聚合口在全局统一的服务质量功能,使不同转发单元流量优先级可以得到整体保证,也使得聚合接口的实际带宽与配置的带宽限制是实时一致的。
根据本发明实施例一实施方式,在在聚合接口上设置转发配置信息之前,该方法还包括:获取聚合接口的总带宽限制信息;根据聚合接口各成员接口的转发能力按比例将总带宽限制信息分配到各成员接口;根据分配到各成员接口的带宽限制信息设置每个成员接口的带宽限制信息。
在分布式转发系统中,由于各个设备和各个成员接口的处理能力不同,如果只是简单地根据成员接口的数量进行平均分配,有可能会造成有些成员接口总是发生阻塞,而有些成员接口却处于空闲的情况。
为此,在本实施方式中,转发配置信息中每个成员的带宽限制信息是根据各成员接口的转发能力按比例将总带宽限制信息分配到各成员接口中的,如此,可以最大程度地发挥各成员接口的处理能力,减少负载不均衡的情况。
根据本发明实施例第二方面,应用于第一转发单元,第一转发单元上设置有聚合接口的成员接口,如图3所示,该方法包括:操作310,根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量,其中,本地优先级队列是第一转发单元根据优先级队列的配置信息在本地预先创建好的;操作320,从聚合接口的成员接口中选取位于第一转发单元的成员接口作为第一成员接口进行转发;操作330,根据第一成员接口的带宽限制信息判断第一成员接口是否会发生拥塞,若是,则选取一个位于第二转发单元的第二成员接口,并将待转发流量发送给位于第二转发单元的第二成员接口,若否,则从第一成员接口进行转发。
在操作310中,如上所述,优先级队列的配置信息包括设置几个优先级以及每个优先级队列对应的流量分类,转发单元可以根据这一配置信息预先创建这些优先级队列,并将进入转发单元的流量按照流量分类插入到对应的优先级队列中。转发单元总是从多个优先级队列中获取一个优先级最高的待转发流量进行转发。在比较待转发流量的优先级时,通常是遵循以下原则:在比较不同优先级队列中的待转发流量时,高优先级队列中的待转发流量的优先级高于低优先级队列中的待转发流量;在比较相同优先级队列中的待转发流量时,可以采用先进先出的原则,即先进入优先级队列的待转发流量的优先级高于后进入优先级队列的待转发流量。
如此,各个转发单元可以根据控制单元设置的统一的优先级队列配置信息对不同优先级的流量进行统一处理。
在操作320中,可以从控制单元下发的配置信息中获取到聚合接口的所有成员接口信息,并根据本地的接口信息得知哪些成员接口是本地的接口。当该聚合端口在转发单元上有多个成员接口时,首选不会发生拥塞的成员接口作为第一成员接口。
在操作330中,判断第一成员接口是否发生拥塞主要是通过比对单位时间内的待转发流量和第一成员接口的带宽限制值来判断的,如果单位时间内的待转发流量大于第一成员接口的带宽限制值,则可以判断第一成员接口会发生拥塞。通常,在选路到某一聚合端口时,转发单元会优选该聚合端口对应的、本地的成员接口进行转发。可以确保只有在本地的成员接口都发生拥塞时,才考虑到将待转发流量发送给位于其他转发单元的成员端口。如此,也可以最大程度地减少待转发流量在不同转发单元之间的传输。其中,在将待转发流量发送给位于其他转发单元的成员端口时,可以使用任何适用的方法或途径,在本实施方式中并不加以限定。
通过操作320和操作330,待转发流量可以在各个转发单元流动起来,从而可以将位于各个转发单元的所有成员接口都作为一个逻辑接口供待转发流量来选择,这样也可以真正保证不同优先级的流量真正能按照设置的优先级在各个转发单元上进行统一处理。
根据本发明实施例一实施方式,在根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高待的转发流量之前,该方法还包括:获取待转发流量;为待转发流量进行选路,若待转发流量选路到聚合接口,则根据待转发流量和优先级队列的配置信息将待转发流量加入到优先级对应的本地优先级队列中。
如上所述,优先级队列的配置信息包括设置几个优先级以及每个优先级队列对应的流量分类,转发单元可以根据这一配置信息预先创建这些优先级队列。当某一待转发流量进入到转发单元后,可以先获取该流量的流量分类,并根据流量分类将该流量插入到该流量分类对应的优先级队列中。
根据本发明实施例一实施方式,待转发流量包括从其他转发单元传递给第一转发单元的待转发流量。
在本发明实施例分布式转发方法中,由于选路到聚合接口的待转发流量可以通过跨卡通道在各个转发单元中流动,所以对于在某一时刻向其他转发单元发送待转发流量的第一转发单元,也可能会接收其他转发单元发送来的待转发流量。在本实施例中,第一转发单元在接收到其他转发单元发送来的待转发流量后,也会将该待转发流量加入到聚合接口对应的优先级队列中,进行统一处理。
根据本发明实施例一实施方式,将待转发流量发送给位于第二转发单元的第二成员接口,包括:通过第一转发单元和第二转发单元之间的跨卡转发通道将待转发流量发送给位于第二转发单元的第二成员接口。
跨卡转发通道本来设计的主要用途是在某个转发单元不具有某一聚合接口的成员接口时,将待转发流量转发到其他转发单元的一个途径。但通常的用法都是在配置聚合接口时,静态指定可以用来接收待转发流量的成员接口和该成员接口所位于的转发单元。在本实施方式中,本发明人巧妙地利用这一转发通道,根据某一成员接口是否拥塞这一条件,实现动态地跨卡传输待转发流量,使选路到聚合接口的待转发流量可以在该聚合接口对应的所有成员接口中流动起来。
根据本发明实施例一实施方式,在将待转发流量发送给位于第二转发单元的第二成员接口之前,该方法还包括:检测待转发流量是否已经在聚合接口的所有成员接口中都传递了一遍后仍未转发出去,若是,则丢弃待转发流量。
由于本发明实施例分布式流量转发方法,在本地成员接口发生拥塞的时候会将待转发流量发送给其他转发单元,而其他转发单元的成员接口拥塞时又会发送给另一个转发单元,这样就有可能出现待转发流量是否已经在聚合接口的所有成员接口中都传递了一遍后仍未转发出去的情况。在本实施方式中,会认为对该转发流量的处理已经超出了聚合接口对应的总带宽,并丢弃该待转发流量。
根据本发明实施例第三方面,一种分布式流量转发装置,应用于控制单元,如图4所示,该装置40包括:转发配置信息设置模块401,用于设置聚合接口对应的转发配置信息,转发配置信息包括优先级队列的配置信息、聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;转发配置信息下发模块402,用于将转发配置信息下发到聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据转发配置信息对选路到聚合接口的待转发流量进行转发。
根据本发明实施例一实施方式,该装置40还包括:总带宽限制信息获取模块,用于获取聚合接口的总带宽限制信息;总带宽限制信息分配模块,用于根据聚合接口各成员接口的转发能力按比例将总带宽限制信息分配到各成员接口;成员接口带宽限制信息设置模块,用于根据分配到各成员接口的带宽限制信息设置每个成员接口的带宽限制信息。
根据本发明实施例第四方面,一种分布式流量转发装置,应用于转发单元,如图5所示,该装置50包括:待转发流量获取模块501,用于根据优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量;第一成员接口选取模块502,用于从聚合接口的成员接口中选取位于第一转发单元的成员接口作为第一成员接口进行转发;拥塞检测模块503,用于根据第一成员接口的带宽限制信息判断第一成员接口是否会发生拥塞;待转发流量发送模块504,用于选取一个位于第二转发单元的第二成员接口,并将待转发流量发送给位于第二转发单元的第二成员接口;待转发流量转发模块505,用于从第一成员接口进行转发。
根据本发明实施例一实施方式,该装置50还包括:流量获取模块,用于获取待转发流量;选路模块,用于为待转发流量进行选路;优先级队列插入模块,用于若待转发流量选路到聚合接口,则根据待转发流量和优先级队列的配置信息将待转发流量加入到优先级对应的本地优先级队列中。
根据本发明实施例一实施方式,待转发流量发送模块504具体用于通过第一转发单元和第二转发单元之间的跨卡转发通道将待转发流量发送给位于第二转发单元的第二成员接口。
根据本发明实施例一实施方式,该装置50还包括:待转发流量检测模块,用于检测待转发流量是否已经在聚合接口的所有成员接口中都传递了一遍后仍未转发出去;待转发流量丢弃模块,用于丢弃待转发流量。
根据本发明实施例第五方面,提供一种分布式流量转发系统,系统包括控制单元、第一转发单元和第二转发单元,其中,控制单元中设置有一个聚合接口,聚合接口的成员接口位于第一转发单元和第二转发单元上,控制单元用于执行上述任一项应用于控制单元的分布式流量转发方法;所述第一转发单元,用于执行上述任一项应用于转发单元的分布式流量转发方法;所述第二转发单元,用于接收所述第一转发单元发送的所述待转发流量。
这里需要指出的是:以上针对分布式流量转发装置实施例的描述和以上针对分布式流量转发系统实施例的描述,与前述方法实施例的描述是类似的,具有同前述方法实施例相似的有益效果,因此不做赘述。对于本发明对分布式流量转发装置实施例的描述和对分布式流量转发系统实施例的描述尚未披露的技术细节,请参照本发明前述方法实施例的描述而理解,为节约篇幅,因此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以利用硬件的形式实现,也可以利用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储介质、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例方法的全部或部分。而前述的存储介质包括:移动存储介质、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种分布式流量转发方法,应用于控制单元,所述方法包括:
设置聚合接口对应的转发配置信息,所述转发配置信息包括优先级队列的配置信息、所述聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;
将所述转发配置信息下发到所述聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据所述转发配置信息对选路到所述聚合接口的待转发流量进行转发。
2.根据权利要求1所述的方法,在所述在聚合接口上设置转发配置信息之前,所述方法还包括:
获取所述聚合接口的总带宽限制信息;
根据所述聚合接口各成员接口的转发能力按比例将所述总带宽限制信息分配到各成员接口;
根据所述分配到各成员接口的带宽限制信息设置每个成员接口的带宽限制信息。
3.一种分布式流量转发方法,应用于第一转发单元,所述第一转发单元上设置有所述聚合接口的成员接口,所述方法包括:
根据所述优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量,其中,所述本地优先级队列是所述第一转发单元根据所述优先级队列的配置信息在本地预先创建好的;
从所述聚合接口的成员接口中选取位于所述第一转发单元的成员接口作为第一成员接口进行转发;
根据所述第一成员接口的带宽限制信息判断所述第一成员接口是否会发生拥塞,若是,则选取一个位于第二转发单元的第二成员接口,并将所述待转发流量发送给位于第二转发单元的第二成员接口,若否,则从所述第一成员接口进行转发。
4.根据权利要求3所述的方法,在所述根据所述优先级队列的配置信息从本地优先级队列中获取一个优先级最高待的转发流量之前,所述方法还包括:
获取待转发流量;
为所述待转发流量进行选路,若所述待转发流量选路到所述聚合接口,则根据所述待转发流量的优先级和所述优先级队列的配置信息将所述待转发流量加入到所述优先级对应的本地优先级队列中。
5.根据权利要求4所述的方法,所述待转发流量包括从其他转发单元传递给所述第一转发单元的待转发流量。
6.根据权利要求3所述的方法,所述将所述待转发流量发送给位于第二转发单元的第二成员接口,包括:通过所述第一转发单元和第二转发单元之间的跨卡转发通道将所述待转发流量发送给位于第二转发单元的第二成员接口。
7.根据权利要求3所述的方法,在所述将所述待转发流量发送给位于第二转发单元的第二成员接口之前,所述方法还包括:
检测所述待转发流量是否已经在所述聚合接口的所有成员接口中都传递了一遍后仍未转发出去,若是,则丢弃所述待转发流量。
8.一种分布式流量转发装置,应用于控制单元,所述装置包括:
转发配置信息设置模块,用于设置聚合接口对应的转发配置信息,所述转发配置信息包括优先级队列的配置信息、所述聚合接口对应的所有成员接口以及每个成员接口的带宽限制信息;
转发配置信息下发模块,用于将所述转发配置信息下发到所述聚合接口的每个成员接口所在的转发单元,以使得各转发单元根据所述转发配置信息对选路到所述聚合接口的待转发流量进行转发。
9.一种分布式流量转发装置,应用于转发单元,所述装置包括:
待转发流量获取模块,用于根据所述优先级队列的配置信息从本地优先级队列中获取一个优先级最高的待转发流量;
第一成员接口选取模块,用于从所述聚合接口的成员接口中选取位于所述第一转发单元的成员接口作为第一成员接口进行转发;
拥塞检测模块,用于根据所述第一成员接口的带宽限制信息判断所述第一成员接口是否会发生拥塞;
待转发流量发送模块,用于选取一个位于第二转发单元的第二成员接口,并将所述待转发流量发送给位于第二转发单元的第二成员接口;
待转发流量转发模块,用于从所述第一成员接口进行转发。
10.一种分布式流量转发系统,其特征在于,所述系统包括控制单元、第一转发单元和第二转发单元,其中,
所述控制单元中设置有一个聚合接口,所述聚合接口的成员接口位于所述第一转发单元和所述第二转发单元上,所述控制单元用于执行权利要求1或2所述的分布式流量转发方法;
所述第一转发单元,用于执行权利要求3至7任一项所述的分布式流量转发方法;
所述第二转发单元,用于接收所述第一转发单元发送的所述待转发流量。
CN202010607582.5A 2020-06-29 2020-06-29 一种分布式流量转发方法、装置及系统 Active CN111953598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010607582.5A CN111953598B (zh) 2020-06-29 2020-06-29 一种分布式流量转发方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010607582.5A CN111953598B (zh) 2020-06-29 2020-06-29 一种分布式流量转发方法、装置及系统

Publications (2)

Publication Number Publication Date
CN111953598A true CN111953598A (zh) 2020-11-17
CN111953598B CN111953598B (zh) 2022-05-31

Family

ID=73337887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010607582.5A Active CN111953598B (zh) 2020-06-29 2020-06-29 一种分布式流量转发方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111953598B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102132511A (zh) * 2008-08-27 2011-07-20 思科技术公司 用于虚拟机的虚拟交换机服务质量
US20120275301A1 (en) * 2011-04-29 2012-11-01 Futurewei Technologies, Inc. Port and Priority Based Flow Control Mechanism for Lossless Ethernet
CN103401801A (zh) * 2013-08-07 2013-11-20 盛科网络(苏州)有限公司 动态负载均衡的实现方法及装置
CN103780510A (zh) * 2012-10-19 2014-05-07 中兴通讯股份有限公司 链路聚合组中流量路径的协商方法及装置
CN109088819A (zh) * 2018-07-25 2018-12-25 新华三技术有限公司合肥分公司 一种报文转发方法、交换机及计算机可读存储介质
CN109547341A (zh) * 2019-01-04 2019-03-29 烽火通信科技股份有限公司 一种链路聚合的负载分担方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102132511A (zh) * 2008-08-27 2011-07-20 思科技术公司 用于虚拟机的虚拟交换机服务质量
US20120275301A1 (en) * 2011-04-29 2012-11-01 Futurewei Technologies, Inc. Port and Priority Based Flow Control Mechanism for Lossless Ethernet
CN103780510A (zh) * 2012-10-19 2014-05-07 中兴通讯股份有限公司 链路聚合组中流量路径的协商方法及装置
CN103401801A (zh) * 2013-08-07 2013-11-20 盛科网络(苏州)有限公司 动态负载均衡的实现方法及装置
CN109088819A (zh) * 2018-07-25 2018-12-25 新华三技术有限公司合肥分公司 一种报文转发方法、交换机及计算机可读存储介质
CN109547341A (zh) * 2019-01-04 2019-03-29 烽火通信科技股份有限公司 一种链路聚合的负载分担方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨懿: ""基于分布式的多链路捆绑的研究与实现"", 《中国优秀硕士学位论文全文数据库》 *

Also Published As

Publication number Publication date
CN111953598B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
US9185047B2 (en) Hierarchical profiled scheduling and shaping
US7706292B2 (en) Network system, network apparatus, route change method, and program storage medium storing program thereof
US8743683B1 (en) Quality of service using multiple flows
US6757249B1 (en) Method and apparatus for output rate regulation and control associated with a packet pipeline
US7953885B1 (en) Method and apparatus to apply aggregate access control list/quality of service features using a redirect cause
US7327681B2 (en) Admission control method in internet differentiated service network
US20050007954A1 (en) Network device and method for categorizing packet data flows and loading balancing for packet data flows
US9166927B2 (en) Network switch fabric dispersion
TW200920035A (en) Enhancement of end-to-end network QoS
EP3651416B1 (en) Generating automatic bandwidth adjustment policies per label-switched path
EP3094053A1 (en) Predictive egress packet classification for quality of service
CN109005126B (zh) 数据流的处理方法、设备和计算机可读存储介质
US11722420B2 (en) System and method for reactive path selection
US20050068798A1 (en) Committed access rate (CAR) system architecture
CN111371690A (zh) 流量调控方法、装置、网络设备及计算机可读存储介质
CN114079638A (zh) 多协议混合网络的数据传输方法、装置和存储介质
CN117201407B (zh) 一种应用感知的IPv6网络快速拥塞检测与避免方法
EP3186927B1 (en) Improved network utilization in policy-based networks
JP2004201304A (ja) 高速パケット網のためのパケットスケジューリングシステム及び方法
CN108696455B (zh) 用于处理业务流的方法及装置
CN111970149A (zh) 一种基于硬件防火墙qos的共享带宽实现方法
CN111953598B (zh) 一种分布式流量转发方法、装置及系统
US11012378B2 (en) Methods and apparatus for shared buffer allocation in a transport node
Meitinger et al. A hardware packet re-sequencer unit for network processors
CN112311678B (zh) 报文分发的实现方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant