CN112104564A - 一种负载分担方法及设备 - Google Patents

一种负载分担方法及设备 Download PDF

Info

Publication number
CN112104564A
CN112104564A CN202010892776.4A CN202010892776A CN112104564A CN 112104564 A CN112104564 A CN 112104564A CN 202010892776 A CN202010892776 A CN 202010892776A CN 112104564 A CN112104564 A CN 112104564A
Authority
CN
China
Prior art keywords
elephant flow
flow
port
load sharing
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010892776.4A
Other languages
English (en)
Inventor
王金全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
New H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN202010892776.4A priority Critical patent/CN112104564A/zh
Publication of CN112104564A publication Critical patent/CN112104564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • H04L43/0882Utilisation of link capacity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/02Topology update or discovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/101Server selection for load balancing based on network conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供了一种负载分担方法及设备。该负载分担方法包括:确定无损队列中缓存的报文数量到达显式拥塞通知门限值;识别大象流;获取大象流的多个出端口;从多个出端口选择一个最大剩余带宽出端口;设置最大剩余带宽的出端口为负载分担端口;通过负载分担端口发送大象流的报文。

Description

一种负载分担方法及设备
技术领域
本申请涉及通信技术,具体地讲一种负载分担方法及设备。
背景技术
数据中心网络的数据流调度算法有很多种,譬如,最短路径转发算法、基于哈希值的ECMP(Equal Cost Multi Path,等价多路径)算法。
但是在实际的数据中心网络中,大象流导致基于哈希值的等价多路径的负载分担效果往往并不理想。数据中心网络中大象流的流量占比大约为80%,持续时间较长,占用了网络中的大部分带宽,容易导致数据中心网络拥塞和排队延迟增多,影响数据中心内的其他的业务流。
发明内容
本申请的目的在于,提供一种负载分担方法及设备,将导致拥塞的大象流负载分担到等价多路径上剩余带宽最大的路径。
为实现上述目的,本申请提供了一种负载分担方法,该方法包括:确定无损队列中缓存的报文数量到达显式拥塞通知门限值;识别大象流;获取大象流的多个出端口;从所述多个出端口选择一个最大剩余带宽出端口;设置所述最大剩余带宽的出端口为负载分担端口;通过所述负载分担端口发送所述大象流的报文。
为实现上述目的,本申请还提供一种实现负载分担的设备,该设备包括:硬件转发芯片,用于确定无损队列中缓存的报文数量到达显式拥塞通知门限值;硬件控制芯片,用于识别大象流;处理器和存储设备,所述存储器用于存储处理器可执行指令,所述处理器通过运行所述存储器中的处理器可执行指令,用于获取大象流的多个出端口;设置所述最大剩余带宽出端口为负载分担端口;通过所述负载分担端口发送所述大象流的报文。
本申请的有益效果在于,基于ECN(Explicit Congestion Notification,显式拥塞通知)功能来识别大象流,然后对大象流进行负载分担,通过等价多路径中剩余带宽最大的路径转发大象流。
附图说明
图1所示为本申请实施例提供的负载分担方法实施例流程图;
图2所示为本申请应用的设备转发控制架构实施例示意图;
图3所示为本申请提供的识别大象流实施例的流程图。
具体实施方式
将以多个附图所示的多个例子进行详细说明。在以下详细描述中,多个具体细节用于提供对本申请的全面理解。实例中没有详细地描述已知的方法、步骤、组件以及电路,以免使这些例子难于理解。
使用的术语中,术语“包括”表示包括但不限于;术语“含有”表示包括但不限于;术语“以上”、“以内”以及“以下”包含本数;术语“大于”、“小于”表示不包含本数。术语“基于”表示至少基于其中一部分。
图1为本申请提供的一种负载分担方法,该方法包括:
步骤101,确定无损队列中缓存的报文数量到达显式拥塞通知门限值。
步骤102,识别大象流。
步骤103,获取大象流的多个出端口。
步骤104,从多个出端口中选择一个最大剩余带宽出端口。
步骤105,设置最大剩余带宽的出端口为负载分担端口。
步骤106,通过负载分担端口发送大象流的报文。
图1有益效果在于基于ECN(Explicit Congestion Notification,显式拥塞通知)功能来识别大象流,然后对大象流进行负载分担,通过等价多路径中剩余带宽最大的路径转发大象流。
图2所示为本申请提供的实现负载分担的设备,该设备包括:硬件转发芯片210、硬件控制芯片220、处理器CPU230以及存储器240;存储器240用于存储处理器可执行指令,处理器230通过运行存储器240中的处理器可执行指令执行相应的处理。
本申请设备中硬件控制芯片220作为专用硬件来识别大象流,硬件控制芯片包括但不限于FPGA芯片和AI芯片,也可能是独立的CPU芯片。本申请中硬件转发芯片210可以是负责接收报文、转发报文、复制报文等硬件处理的MAC芯片。
硬件转发芯片210,用于确定无损队列中缓存的报文数量到达显式拥塞通知门限值;硬件控制芯片220,用于识别大象流;处理器230通过运行存储器240中的处理器可执行指令用于获取大象流的多个出端口;设置最大剩余带宽出端口为负载分担端口;通过负载分担端口发送大象流的报文。
硬件转发芯片210在无损队列中缓存的报文数量到达显式拥塞通知门限后,复制各个报文,并将复制的各个报文发往硬件控制芯片220。
图3是本申请提供的识别大象流的流程图,其中包括:
步骤301,获取到达显式拥塞通知门限后进入无损队列的各拥塞报文。
硬件转发芯片210复制无损队列到达ECN门限值后收到的各个报文,将复制的各个报文作为拥塞报文发往硬件控制芯片220(如图2所示)。硬件控制芯片220从硬件转发芯片210获取这些拥塞报文。
步骤302,确定各拥塞报文的所属业务流。
硬件控制芯片220从这些拥塞报文中解析出五元组、源端口和目的端口等流信息和转发信息,通过这些信息识别各拥塞报文所属的业务流。
步骤303,将达到大象流报文数目阈值的各业务流识别为大象流。
硬件控制芯片220会对每个业务流的拥塞报文进行统计分析。在同一个出端口下,如果硬件控制芯片220判定多条业务流拥塞报文的数量都达到门限值,则判定这些业务流是大象流。判定大象流的门限值是个报文数目阈值,可以结合实际的网络环境来灵活设置。每个业务流的流量大小往往是有波动的。因此,硬件控制芯片220可以按照一定的周期对拥塞报文进行统计分析。这个周期也是可以灵活设置的。
硬件控制芯片220,例如FPGA芯片,将大象流的信息发送给CPU,将各条业务流的相关信息进行汇总,这些信息包括五元组、源端口和目的端口(出端口)、拥塞统计和大象流判定结果等。
CPU230可以在大象流的等价转发路径中选择剩余带宽最大的端口。CPU可以通过网管的MIB(Management Information Base,管理信息库)信息获取各端口的带宽。
CPU230在硬件转发芯片210中设置转发控制表项,譬如ACL(Access ControlList,接入控制表)表项,将表项的匹配项设置为大象流的流特征信息,在表项的动作项中,将出端口设置为最大剩余带宽出端口。
本申请的有益效果在于,在数据中心网络中,利用ECN功能触发对大象流的传输优化,保证数据中心网络中大象流以外的其他的业务流的传输。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种负载分担方法,其特征在于,所述方法包括:
确定无损队列中缓存的报文数量到达显式拥塞通知门限值;
识别大象流;
获取大象流的多个出端口;
从所述多个出端口中选择一个最大剩余带宽出端口;
设置所述最大剩余带宽的出端口为负载分担端口;
通过所述负载分担端口发送所述大象流的报文。
2.根据权利要求1所述的方法,其特征在于,获取大象流的多个出端口是指包括:
根据所述大象流的流特征信息的目的IP地址确定发送所述大象流的等价多路径;
获取所述等价多路径的每个路径的出端口。
3.根据权利要求1所述的方法,其特征在于,所述识别大象流包括:
获取到达所述显式拥塞通知门限后进入所述无损队列的各拥塞报文;
确定各所述拥塞报文的所属业务流;
将达到大象流报文数目阈值的各业务流识别为所述大象流。
4.根据权利要求1所述的方法,其特征在于,设置所述最大剩余带宽的出端口为负载分担端口是指,设置转发控制表项;其中,所述转发控制表项的匹配项为所述大象流的流特征信息;所述转发控制表项的出端口为所述最大剩余带宽出端口。
5.根据权利要求1所述的方法,其特征在于,获取到达所述显式拥塞通知门限后进入所述无损队列的各拥塞报文是指,复制所述无损队列中缓存的报文数量到达所述显式拥塞通知门限后才进入所述无损队列的各个报文。
6.一种实现负载分担的设备,其特征在于,所述设备包括:
硬件转发芯片,用于确定无损队列中缓存的报文数量到达显式拥塞通知门限值;
硬件控制芯片,用于识别大象流;
处理器和存储设备,所述存储器用于存储处理器可执行指令,所述处理器通过运行所述存储器中的处理器可执行指令,用于获取大象流的多个出端口;设置所述最大剩余带宽出端口为负载分担端口;通过所述负载分担端口发送所述大象流的报文。
7.根据权利要求6所述的设备,其特征在于,所述处理器通过运行所述存储器中的指令获取大象流的多个出端口是指包括:
根据所述大象流的流特征信息的目的IP地址确定发送所述大象流的等价多路径;
获取所述等价多路径的每个路径的出端口。
8.根据权利要求6所述的设备,其特征在于,所述硬件控制芯片识别大象流包括:
获取到达所述显式拥塞通知门限后进入所述无损队列的各拥塞报文;
确定各所述拥塞报文的所属业务流;
将达到大象流报文数目阈值的各业务流识别为所述大象流。
9.根据权利要求6所述的设备,其特征在于,所述处理器通过运行所述存储器中的处理器可执行指令设置所述最大剩余带宽的出端口为负载分担端口包括:在所述硬件转发芯片中设置转发控制表项;其中,所述转发控制表项的匹配项为所述大象流的流特征信息;所述转发控制表项的出端口为所述最大剩余带宽出端口。
10.根据权利要求6所述的设备,其特征在于,所述硬件转发芯片复制所述无损队列中缓存的报文数量到达所述显式拥塞通知门限后才进入所述无损队列的各个报文,将复制的各个报文发往所述硬件控制芯片。
CN202010892776.4A 2020-08-31 2020-08-31 一种负载分担方法及设备 Pending CN112104564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010892776.4A CN112104564A (zh) 2020-08-31 2020-08-31 一种负载分担方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010892776.4A CN112104564A (zh) 2020-08-31 2020-08-31 一种负载分担方法及设备

Publications (1)

Publication Number Publication Date
CN112104564A true CN112104564A (zh) 2020-12-18

Family

ID=73756766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010892776.4A Pending CN112104564A (zh) 2020-08-31 2020-08-31 一种负载分担方法及设备

Country Status (1)

Country Link
CN (1) CN112104564A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887218A (zh) * 2020-12-22 2021-06-01 新华三技术有限公司 一种报文转发方法及装置
CN113872872A (zh) * 2021-09-29 2021-12-31 新华三信息安全技术有限公司 一种报文转发方法、装置及框式网络设备
CN114827042A (zh) * 2021-01-22 2022-07-29 瑞昱半导体股份有限公司 数据流分类装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137018A (zh) * 2011-03-21 2011-07-27 华为技术有限公司 一种负载分担方法及装置
CN106487676A (zh) * 2016-10-27 2017-03-08 盛科网络(苏州)有限公司 一种基于大象流的动态ecmp芯片实现方法
CN108881010A (zh) * 2018-07-13 2018-11-23 北京瀚海星云科技有限公司 基于损益评估的拥塞路径调整方法
CN108881056A (zh) * 2017-05-15 2018-11-23 华为技术有限公司 一种拥塞控制方法、网络设备及其网络接口控制器
WO2019103953A1 (en) * 2017-11-22 2019-05-31 Cisco Technology, Inc. Layer 3 fair rate congestion control notification
CN110784415A (zh) * 2019-11-04 2020-02-11 盛科网络(苏州)有限公司 一种ecn快速响应的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137018A (zh) * 2011-03-21 2011-07-27 华为技术有限公司 一种负载分担方法及装置
CN106487676A (zh) * 2016-10-27 2017-03-08 盛科网络(苏州)有限公司 一种基于大象流的动态ecmp芯片实现方法
CN108881056A (zh) * 2017-05-15 2018-11-23 华为技术有限公司 一种拥塞控制方法、网络设备及其网络接口控制器
WO2019103953A1 (en) * 2017-11-22 2019-05-31 Cisco Technology, Inc. Layer 3 fair rate congestion control notification
CN108881010A (zh) * 2018-07-13 2018-11-23 北京瀚海星云科技有限公司 基于损益评估的拥塞路径调整方法
CN110784415A (zh) * 2019-11-04 2020-02-11 盛科网络(苏州)有限公司 一种ecn快速响应的方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887218A (zh) * 2020-12-22 2021-06-01 新华三技术有限公司 一种报文转发方法及装置
CN114827042A (zh) * 2021-01-22 2022-07-29 瑞昱半导体股份有限公司 数据流分类装置
CN113872872A (zh) * 2021-09-29 2021-12-31 新华三信息安全技术有限公司 一种报文转发方法、装置及框式网络设备
CN113872872B (zh) * 2021-09-29 2023-11-24 新华三信息安全技术有限公司 一种报文转发方法、装置及框式网络设备

Similar Documents

Publication Publication Date Title
US11005769B2 (en) Congestion avoidance in a network device
US11588757B2 (en) Traffic management in a network switching system with remote physical ports
US10498612B2 (en) Multi-stage selective mirroring
CN111788803B (zh) 网络中的流管理
KR100757872B1 (ko) 네트워크에서의 혼잡 발생 예고 시스템 및 방법
US20240098042A1 (en) Egress packet processing using a modified packet header separate from a stored payload
CN112104564A (zh) 一种负载分担方法及设备
US10574546B2 (en) Network monitoring using selective mirroring
US8144588B1 (en) Scalable resource management in distributed environment
US20130250757A1 (en) Reducing Headroom
US9350631B2 (en) Identifying flows causing undesirable network events
US9985910B2 (en) Adaptive flow prioritization
US8243595B2 (en) Prioritization of network traffic sent to a processor by using packet importance
US10728156B2 (en) Scalable, low latency, deep buffered switch architecture
CN111404839B (zh) 报文处理方法和装置
KR100819271B1 (ko) 패킷 스위치 장비 및 이의 대역폭 제어 방법
US10608948B1 (en) Enhanced congestion avoidance in network devices
CN110336759B (zh) 基于rdma的协议报文转发方法及装置
Domżał et al. Click-based tests of QoS mechanisms for flow-based router
Rahouti et al. QoSP: A priority-based queueing mechanism in software-defined networking environments
CN116016277A (zh) 网络拥塞丢包的监控方法、装置、电子设备及存储介质
US11528227B1 (en) Integrated traffic profile for indicating multi-level congestion and packet drop for congestion avoidance
WO2020003975A1 (ja) 通信制御装置及び通信制御方法
CN116886631A (zh) 一种支持探测模式的路由设备
CN116418765A (zh) 一种报文处理方法和网络设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201218

RJ01 Rejection of invention patent application after publication