CN101860489A - 基于隐式流分割器的负载均衡结构 - Google Patents
基于隐式流分割器的负载均衡结构 Download PDFInfo
- Publication number
- CN101860489A CN101860489A CN201010195825A CN201010195825A CN101860489A CN 101860489 A CN101860489 A CN 101860489A CN 201010195825 A CN201010195825 A CN 201010195825A CN 201010195825 A CN201010195825 A CN 201010195825A CN 101860489 A CN101860489 A CN 101860489A
- Authority
- CN
- China
- Prior art keywords
- packet
- flow splitter
- vcq
- buffer
- load balancing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于隐式流分割器的负载均衡结构,所述输入缓存采用包含虚拟输出队列(VOQ1)和虚拟路径队列(VCQ)的双缓冲模式,即到达的数据包和流分割器分配给该包的理论路径信息组合在一起缓存于VOQ1,同时,流分割器自动生成一个该包所属流的转发请求J并缓存于VCQ;依据交换模块的连接模式和VCQ中的转发请求通过两步调度策略完成数据包的第一级转发;数据包到达输出端后依据其自身携带的理论路径信息完成重排序过程。本发明排除了Byte-Focal结构中DTS算法的缺陷和不足。降低了交换机的计算复杂度和系统的时延,提高了交换结构的高速交换能力和可扩展性,增强了交换结构的公平性。
Description
所属技术领域
本发明属于互联网信息传输技术领域。
背景技术
互联网用户的迅猛增长和多媒体业务流的激增使Internet面临越来越大的数据传输压力,虽然密集波分复用技术使单个波长的数据传输率高达160Gbps,但中继系统的交换速率却远远低于光域内的数据传输率,这就使中继系统因交换速率过低而成为Internet的瓶颈。此外,长期的流量监测表明Internet数据流具有自相似性,其典型特征是数据具有突发性。因此,能够适应自相似业务流的高速交换结构就成为下一代Internet的核心技术之一。
在包长一定的情况下,提高转发速率势必要缩短时槽长度,这就必须尽可能降低调度算法的复杂度,而传统的交换结构因复杂度或加速比的原因均无法满足未来的高速交换需求。张正尚教授等人提出的负载均衡结构LB-BvN(Load Balanced Birkhoff-von Neumann switch architecture)采用确定的、周期性连接的crossbar连接模式,这种具有O(1)复杂度的crossbar连接模式可以有效缩短时槽长度从而使高速转发成为可能。但该结构会导致数据包失序,针对这一问题,国内外研究机构提出了很多方案,这些方案可分为两类:第一类通过特定机制避免数据包在转发过程中失序,如FFF(Full Frame First)和Mailbox;第二类允许数据包在转发过程中失序,但在数据包离开交换机之前要通过RB(Re-sequencing Buffer)来调整其顺序,使之按正确顺序离开,如FCFS(First Come First Served),EDF(Earliest Deadline First),EDF-3DQ,FOFF(Full OrderedFrames First)及Byte-Focal(参考文献:Shen Y,Panwar S S,ChaoH J.Design and performance analysis of a practical load-balancedswitch[J].IEEE.Trans.onCommunications,2009,57(8):2420-2429.)等。
第一类方案中,FFF需要在线卡之间为寻找满帧而进行大量的通信。Mailbox的吞吐率只能达到75%,改进后的方案也只能达到95%。第二类方案中,FCFS的策略是无论数据包是否失序都延迟到最大时延值后转发,时延性能较差。EDF-3DQ是EDF的改进方案,它根据数据包的截止时间来判断是否转发,每个时槽都需要复杂度为O(N)的搜索操作来查找最紧迫的数据包。FOFF采用基于帧的转发模式,选择非满帧会造成N个时槽的带宽浪费,在低负载或N较大时,大部分都是非满帧,带宽浪费较大。
Byte-Focal结构因易于实现且性能较好而被认为是迄今为止较为理想的解决方案。其关键特性在于第一级转发所采用的DTS(Dynamic Threshold Scheme)算法确保了同一个流的相邻数据包通过相邻路径到达输出端(本文称之为相邻到达特性),这使得在输出端可根据数据包的路径信息判断先后次序,简化了重排序过程。但DTS存在伪队头阻塞、复杂度和惯性服务的缺陷,这些不足严重影响了Byte-Focal的高速交换能力,增大了数据包的时延,降低了可扩展性,针对这些问题,我们提出基于隐式流分割器的负载均衡结构(以下称LB-IFS:Load Balanced switch architecture based on Implicit Flow Splitter)。
为便于表达,本文约定N表示交换结构的输入输出端口数。从输入端口i到达输出端口k的数据包的集合记为数据流Fi,k,记Ci,k泛指Fi,k的任意一个数据包,Ji,k表示Fi,k的一个转发请求。两级crossbar分别记为XB1,XB2,二者采用完全相同的连接模式,令i,j分别表示crossbar的输入和输出端口,XB1,XB2在t时槽的连接模式均满足(i+j)mod N=(t+1)modN,i与j相连简记为(i--j)。若Ci,k通过XB2的输入端口j到达输出端,则称Ci,k的转发路径为j。
Byte-Focal的基本结构如图1所示。
Byte-Focal的主要问题如下:
一、伪队头阻塞问题DTS决定了只有VOQ1i,k的队首才能发出转发请求,这就可能出现队列中虽然有数据包等待转发且能够保证相邻到达特性,但由于所有队首数据包都不满足DTS转发条件而被阻塞。令qi,k(t)表示t时刻VOQ1i,k的队长,令Pi,k指示Fi,k下一个数据包的转发路径。假定在T-1时槽(i--3),VOQ1i,0被服务,而T时槽之初有Pi,0=0,Pi,1=3,Pi,2=0及Pi,3=1,如图2(a)所示。则根据crossbar连接模式和DTS规则,T时槽(i--0),A0被转发,C4到达,Pi,0→1,如图2(b)所示。T+1时槽(i--1),A1被转发,D1到达,Pi,0→2,如图2(c)所示。T+2时槽(i--2),A2到达,没有数据包可被转发,但事实上根据Pi,2=0和Pi,3=1可知,本时槽内转发C2和D1仍能保证相邻到达特性,如图2(d)所示。在T+3时槽(i--3),但同样的原因使得C3也不能被转发。
Byte-Focal中这种因队首数据包不满足转发条件而造成的阻塞在成因和效果等方面都区别于IQ(Input Queuing)中的HOL(Head of Line blocking)问题,故本文称之为伪队头阻塞PHOL(Pseudo-HOL)。PHOL导致DTS无法充分利用带宽资源,虽然Byte-Focal仍能达到100%的吞吐率,但仿真结果结果表明,PHOL明显增大了Byte-Focal的第一级转发时延。
二、算法复杂度高
为简化描述,此处Sj(t)和S′j(t)均采用原文献中的定义。DTS在每个时槽都需要借助集合Sj(t)和S′j(t)以O(1)的复杂度选择一个队列来服务,从表面上看,其算法复杂度为O(1),但集合Sj(t)和S′j(t)每个时槽都要更新,由0≤|Sj(t)|≤N和0≤|S′j(t)|≤N可知最坏情况下更新Sj(t)和S′j(t)的复杂度为O(N)。O(N)的复杂度势必增加提高交换速率的难度,降低Byte-Focal的高速交换能力和可扩展性。
三、惯性服务模式
为降低算法的复杂度,DTS在下一时槽的仲裁中总优先选择当前被服务的队列,本文称之为惯性服务模式ISM(Inertial Serve Mode)。在某些极端环境中,惯性服务模式会导致公平性的问题,致使某些流长期占据传输资源,而其他数据包则长期等待,假定T时槽XB1(i--3)且在T时槽之初有Pi,0=3,Pi,1=0,Pi,2=2及Pi,3=0,如图3(a)所示,则T时槽A0被转发,B4到达且Pi,0→0,如图3(b)所示。T+1时槽XB1(i--0),B0被转发,B5到达且Pi,1→1,如图3(c)所示。T+2时槽XB1(i--1),B1被转发,B6到达且Pi,1→2,如图3(d)所示。若每个时槽都到达一个Ci,1,其他数据包将长期等待,显然DTS无法保证流的公平性。
发明内容
鉴于现有技术的以上缺点,本发明的目的是排除Byte-Focal结构中DTS算法的缺陷和不足。降低了交换机的计算复杂度和系统的时延,提高了交换结构的高速交换能力和可扩展性,增强了交换结构的公平性。
本发明的目的是通过如下的手段实现的。
基于隐式流分割器的负载均衡结构,包含两级交换模块和三级缓存:第一级交换模块之前的输入缓存、两级交换模块之间的中间缓存和第二级交换模块之后的重排序缓存;其特征在于,所述输入缓存采用包含虚拟输出队列VOQ1和虚拟路径队列VCQ的双缓冲模式,即到达的数据包和流分割器分配给该包的理论路径信息组合在一起缓存于VOQ1,同时,流分割器自动生成一个该包所属流的转发请求J并缓存于VCQ;依据交换模块的连接模式和VCQ中的转发请求通过调度策略完成数据包的第一级转发;数据包到达输出端后依据其自身携带的理论路径信息完成重排序过程。
附图说明
图1是Byte-Focal结构图。
图2是Byte-Focal的输入端口i (a)T时槽(b)T+1时槽(c)T+2时槽(b)T+3时槽。
图3是Byte-Focal的输入端口i (a)T时槽(b)T+1时槽(c)T+2时槽(d)T+3时槽。
图4是本发明基于隐式流分割器的负载均衡结构图。
图5是本发明双缓冲模式示意图
图6是本发明与现有技术在均匀业务流环境下的时延比较图。
图7是本发明与现有技术在突发流量环境下的时延比较图。
图8是本发明与现有技术在对角流量环境下的时延比较图。
图9是本发明与现有技术在Hot-spot流量环境下的时延比较图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
对照图1与4及图5,本发明(LB-IFS)与Byte-Focal的不同点在于:
①第一级数据的缓冲模式:
LB-IFS对到达的数据包采用基于隐式流分割器的双缓冲模式处理,而Byte-Focal仅仅将到达的数据包缓存于VOQ中。
②第一级转发的调度模式:
LB-IFS的第一级调度采用复杂度为O(1)的两步调度策略,而Byte-Focal采用DTS调度算法,其最坏情况下的复杂度为O(N),过高的复杂度降低了Byte-Focal的高速交换能力和可扩展性。
③重排序过程的依赖信息
LB-IFS中数据包的重排序依赖的是数据包经流分割器产生的理论路径信息,该信息作为数据包的一个附加域一起被缓存和传输,在输出端完成重排序过程后被丢弃。而Byte-Focal的数据包重排序依赖的是数据包的实际转发路径。
双缓冲模式的工作原理:
LB-IFS为每个输入端口设置一个流分割器,不失一般性,考虑输入端口i,其中包含N个指针Pi,k,k=0,1,…,N-1,Pi,k用于指示Fi,k下一个数据包的转发路径。系统为每个到达的数据包生成一个转发请求J,双缓冲模式中VOQ1用于存储数据包实体(包括附加的路径信息),VCQ用于存储该数据包的转发请求J,Ci,k到达输入端口i时,需执行以下步骤:
step2:生成一个Fi,k的转发请求Ji,k。
Ji,k仅仅表示Fi,k的一个转发请求,与Fi,k的具体数据包无关,故Ji,k只需包含Fi,k的目的端口k即可。
两步调度策略:
若t时槽(i--j),则调度策略如下:
step1:若VCQi,j空,表示等待队列中没有需经路径j转发的数据包,转发结束。否则转step2;
step2:读取并移除VCQi,j队首的请求指针,不妨设其值为u,转发VOQ1i,u的队首数据包,转发结束。
转发引擎从VCQ中获取的仅仅是当前应转发的数据包所属的流,尔后根据该流标识转发相应VOQ1的队首数据包。虽然转发引擎是由基于流分割器的VCQ所控制,但从数据包的存储和转发角度来看,数据包仅仅是依据FCFS原则进行存储和转发,并不涉及流量的负载均衡,犹如不存在流分割器一样,故称之为隐式的流分割器。
本发明利用双缓冲模式和两步调度策略,以O(1)的复杂度解决了负载均衡的第一级调度。与Byte-Focal相比较,由于摒弃了DTS算法,LB-IFS具有以下优势:
①排除了Byte-Focal结构中DTS算法的缺陷和不足。
②降低了交换机的计算复杂度,提高了交换结构的高速交换能力和可扩展性。
③降低了系统的时延,提高了交换机的性能。
④增强了交换结构的公平性。
为验证本项发明的有效性,本文用32×32的仿真模型将LB-IFS和Byte-Focal一起在均匀流量模型、突发流量模型、对角流量模型和Hot-spot模型环境中进行仿真分析,仿真中假定各级缓存无限大。时延数据越小越好。
均匀流量模型:均匀流量模型是指数据包以Bernoulli i.i.d.过程到达且以等概率到达各输出端口,仿真结果如图6所示。
突发业务流模型:突发业务流采用ON-OFF模型产生,平均突发长度设为64,仿真结果如图7所示。
对角流量模型:数据包以Bernoulli i.i.d.过程到达输入端口i,但以2/3的概率到达目的端口i,以1/3的概率到达其下一个端口,即(i+1)mod N端口,仿真结果如图8所示。
Hot-spot模型:数据包以Bernoulli i.i.d.过程到达输入端口i,但以2/3的概率到达目的端口i,以等概率到达其余端口,仿真结果如图9所示。所有仿真结果都表明,在相同的数据包到达情况下,LB-IFS比Byte-Focal的时延更小。
Claims (3)
1.基于隐式流分割器的负载均衡结构,包含两级交换模块和三级缓存:第一级交换模块之前的输入缓存、两级交换模块之间的中间缓存和第二级交换模块之后的重排序缓存;其特征在于,所述输入缓存采用包含虚拟输出队列VOQ1和虚拟路径队列VCQ的双缓冲模式,即到达的数据包和流分割器分配给该包的理论路径信息组合在一起缓存于VOQ1,同时,流分割器自动生成一个该包所属流的转发请求J并缓存于VCQ;依据交换模块的连接模式和VCQ中的转发请求通过调度策略完成数据包的第一级转发;数据包到达输出端后依据其自身携带的理论路径信息完成重排序过程。
2.根据权利要求1所述之基于隐式流分割器的负载均衡结构,其特征在于,所述双缓冲模式采用:隐式的流分割器为到达数据包所属的流产生一个转发请求并缓存于输入缓存中的虚拟路径队列;数据包及隐式流分割器为其所分配的理论路径值组合在一起缓存于输入缓存中的虚拟输出队列。
3.基于隐式流分割器的负载均衡结构,其特征在于,所述调度策略包含两个步骤,即,转发引擎首先依据交换模块的连接模式从特定的虚拟路径队列中取出等待时间最长的转发请求,获取其所属的流标识;再依据该流标识从特定虚拟输出队列中取出待转发数据包转发。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101958255A CN101860489B (zh) | 2010-06-09 | 2010-06-09 | 基于隐式流分割器的负载均衡结构 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010101958255A CN101860489B (zh) | 2010-06-09 | 2010-06-09 | 基于隐式流分割器的负载均衡结构 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101860489A true CN101860489A (zh) | 2010-10-13 |
CN101860489B CN101860489B (zh) | 2012-12-12 |
Family
ID=42946155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010101958255A Expired - Fee Related CN101860489B (zh) | 2010-06-09 | 2010-06-09 | 基于隐式流分割器的负载均衡结构 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101860489B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040131069A1 (en) * | 2003-01-06 | 2004-07-08 | Jing Ling | Virtual output queue (VoQ) management method and apparatus |
CN1819523A (zh) * | 2006-02-20 | 2006-08-16 | 中国人民解放军国防科学技术大学 | 并行交换开关设计方法 |
-
2010
- 2010-06-09 CN CN2010101958255A patent/CN101860489B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040131069A1 (en) * | 2003-01-06 | 2004-07-08 | Jing Ling | Virtual output queue (VoQ) management method and apparatus |
CN1819523A (zh) * | 2006-02-20 | 2006-08-16 | 中国人民解放军国防科学技术大学 | 并行交换开关设计方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101860489B (zh) | 2012-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101478483B (zh) | 交换设备内实现分组调度的方法及交换设备 | |
CN100420241C (zh) | 实现信息交换的系统及方法和调度算法 | |
JP6036310B2 (ja) | パケット交換装置、伝送装置、及びパケットスケジューリング方法 | |
CN102726009B (zh) | 一种数据流交换控制方法及相关设备 | |
CN107566275B (zh) | 数据中心网络中基于延时差异性的多路径传输方法 | |
CN101631070A (zh) | 三级交换系统及其调度方法 | |
CN109168094A (zh) | 一种光流交换网络调度方法及光流交换系统 | |
CN102404213B (zh) | 报文缓存管理方法及系统 | |
CN100421420C (zh) | 一种调度纵横式交换矩阵中变长数据包队列的方法 | |
CN103617132B (zh) | 一种基于共享存储的以太网终端发送实现方法及终端装置 | |
CN104486040B (zh) | 基于缓存管理的高效编码感知路由方法 | |
CN105099947B (zh) | 空间网络接入方法及装置 | |
WO2019232760A1 (zh) | 一种数据交换方法、数据交换节点及数据中心网络 | |
CN102523616B (zh) | 无线传感器网络中基于节点占用度的跨层qos路由方法 | |
CN102404225B (zh) | 一种用于差分队列服务系统的数据包快速入队方法 | |
CN101860489B (zh) | 基于隐式流分割器的负载均衡结构 | |
CN101964747B (zh) | 基于前置反馈的两级交换结构工作方法 | |
CN109039934B (zh) | 一种空间dtn网络拥塞控制方法及系统 | |
CN103384225B (zh) | 基于输入交叉点缓存快速分组交换网络的流量控制方法 | |
CN101945054B (zh) | 一种适用于反馈制两级交换结构的调度算法 | |
CN102123330A (zh) | 基于多节点协作的主动式光突发竞争避免方法 | |
CN101127705B (zh) | 实现网络传输服务质量的方法 | |
CN102104975A (zh) | 一种减小等待时延的无线mesh网络的业务调度的方法 | |
CN114531399A (zh) | 一种内存阻塞平衡方法、装置、电子设备和存储介质 | |
CN1787516B (zh) | 一种新型环形网络接入控制协议 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121212 Termination date: 20150609 |
|
EXPY | Termination of patent right or utility model |