CN103686467A - 光学数据中心网络、光学组件、波长分配方法 - Google Patents

光学数据中心网络、光学组件、波长分配方法 Download PDF

Info

Publication number
CN103686467A
CN103686467A CN201210338781.6A CN201210338781A CN103686467A CN 103686467 A CN103686467 A CN 103686467A CN 201210338781 A CN201210338781 A CN 201210338781A CN 103686467 A CN103686467 A CN 103686467A
Authority
CN
China
Prior art keywords
wavelength
tor
new
optical data
central site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210338781.6A
Other languages
English (en)
Other versions
CN103686467B (zh
Inventor
陈凯
陈焰
文熙韬
夏勇
刘永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Priority to CN201210338781.6A priority Critical patent/CN103686467B/zh
Publication of CN103686467A publication Critical patent/CN103686467A/zh
Application granted granted Critical
Publication of CN103686467B publication Critical patent/CN103686467B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Optical Communication System (AREA)

Abstract

本发明提出了一种光学数据中心网络,具有广义k-ary-n-cube拓扑结构,其中所述光学数据中心网络具有n个维度,每个维度具有ki个架顶(ToR)交换机,其中i∈[0,n-1],
Figure DDA00002133785300011
是大于等于3的整数,n是大于等于2的整数,多个服务器分别与各自的ToR交换机相连,ToR交换机分别通过各自的光学组件与其他ToR交换机互连。本发明还提出了一种用在上述光学数据中心网络中的光学组件,以及用在上述光学数据中心网络中的波长分配方法。

Description

光学数据中心网络、光学组件、波长分配方法
技术领域
本发明涉及数据中心网络,更具体地,涉及一种光学数据中心网络(DCN),具有可扩缩、容错和改善的性能;一种用在所述光学DCN中的光学组件;以及一种用在所述光学DCN中的波长分配方法。
背景技术
由于与传统的电学网络相比具有更卓越的技术性能,光学数据中心网络(DCN)已成为研究的热门领域。但是,现有的光学DCN存在以下缺点:难以扩缩、易于受到单点故障的影响、网络平分带宽有限。
在光学DCN中已经引入了大量的光学技术(参见非专利文献[1]、[2]、[3])。例如,以下将简单介绍几种光学技术,更为详细的内容可参考相关文献。
基于MEMS(微机电开关)的光学开关:MEMS工作在物理层,是一种双侧N×N电路交换矩阵,通过机械地旋转微镜,实现任一输入端口与任一输出端口相连。MEMS的开关时间是大约10毫秒(参见非专利文献[4])。
波长选择开关(WSS):WSS是一种1×N的光学器件,用于波长解复用。WSS具有1个公共输入端口和N个输出端口,可以将来自公共输入端口的所有波长分为N组,每一组通过1个输出端口输出。WSS是操作时间可重配置的(大约10毫秒)。
波分复用(WDM):WDM是一种将多个非冲突波长复用到单根光纤上的技术。根据信道间隔,在传统的C波段上,可以将多达100个波长复用在光纤上。在光学DCN中,波长通常受到与之相连的电开关端口的速率限制(例如,10Gbps)。
其他的光学器件例如还包括:环行器、收发机、耦合器等。环行器能够在单根光纤上实现双向传输,从而能够更有效率地利用MEMS端口。收发机可以在架顶(ToR)交换机中实现电信号和光信号之间的转换。耦合器可以将多个波长耦合到单根光纤中(类似于复用器,但比复用器简单)。
目前的光学DCN为了实现可重配置的拓扑,均以MEMS为中心来实现。然而,由于MEMS的使用,导致了如可扩缩性、容错性和运行性能等方面的问题。例如,这些光学DCN依赖于中心MEMS来连接所有ToR交换机,因此所能支持的ToR交换机的数量由MEMS端口密度决定。目前可用的最大的MEMS具有多达320个端口,因此,限制其最多支持320个ToR交换机。最简单直接的解决方案是对多个MEMS进行互连(级联),例如,按照Fat Tree的形式,以增加端口密度(参见非专利文献[3])。但是,基于MEMS的电路交换不同于传统的电分组交换。MEMS开关只允许其端口间的双侧、成对连接,即,MEMS的所有端口被分为两组,只有在两个端口分别属于不同的组时,才能彼此相连(参见图1中的“√”和“×”)。这样,与传统的电分组交换相比,MEMS难以互连形成较大的端口池。图2示出了两层全网格MEMS链结构的示例。即使是在这种密集互连的情况下,图2所示的MEMS链也只能保证下方一个MEMS的一个端口每次与上方一个HEMS的一个端口相连,限制了灵活性。例如,HEHS 00的端口1可以与MEMS 11的端口5~8之一相连,但是MEMS 00的端口1和端口2不能与MEMS 11的端口5~8中的任意两个同时相连。因此,为了实现更为灵活的连接,需要更为复杂的结构。此外,即使能够实现更为灵活的MEMS链,也将极大地增加网络成本。每个MEMS端口的成本大约是US$500(参见非专利文献[2]),这意味着一个320端口的MEMS的成本是US$160,000。而且,这种灵活的MEMS链将浪费大量的端口,例如,在图2所示的MEMS链中,50%的端口用于纯粹的互连目的。此外,由于MEMS的开关时间(~10毫秒),操作这种复杂的MEMS链的时间成本也是非常惊人的。
另一方面,“热点”在现实的数据中心中越来越流行,而且以扇入(扇出)的方式出现。即使是最繁忙的5对ToR交换机对也只是“热点”负载的一小部分。这意味着对于分散负载和业务而言,即使是通过MEMS在最繁忙的ToR交换机间建立电路链路也难以起到实质性的作用。因此,需要更为先进的路由方式。
由于MEMS开关给光学DCN带来了如此多的问题,发明人认为与其增加更多的MEMS开关,不如完全去除MEMS开关,而以另外的方式来实现具有可扩缩、容错和改善的性能的光学数据中心网络(DCN)。
非专利文献列表:
[1]K.Chen,A.Singla,A.Singh,K.Ramachandran,L.Xu,Y.Zhang,X.Wen,and Y.Chen,“OSA:An Optical Switching Architecturefor Data Center Networks with Unprecedented Flexibility,”inNSDI,2012;
[2]N.Farrington,G.Porter,S.Radhakrishnan,H.H.Bazzaz,V.Subramanya,Y.Fainman,G.Papen,and A.Vahdat,“Helios:AHybrid Electrical/Optical Switch Architecture for Modular DataCenters,”in SIGCOMM,2010;
[3]G.Wang,D.Andersen,M.Kaminsky,K.Papagiannaki,T.Ng,M.Kozuch,and M.Ryan,“c-Through:Part-time Optics in DataCenters,”in SIGCOMM,2010;和
[4]T.Truex,A.A.Bent,and N.W.Hagood,“Beam steering opticalswitch fabric utilizing piezoelectric actuation technology,”inNFOEC,2003。
发明内容
考虑到现有技术的上述缺陷,本发明提出了一种光学数据中心网络(DCN),具有可扩缩、容错和改善的性能;一种用在所述光学DCN中的光学组件;以及一种用在所述光学DCN中的波长分配方法。
根据本发明的第一方案,提出了一种光学数据中心网络,具有广义k-ary-n-cube拓扑结构。所述光学数据中心网络具有n个维度,每个维度具有ki个架顶(ToR)交换机,其中i∈[0,n-1],
Figure BDA00002133785100031
是大于等于3的整数,n是大于等于2的整数。多个服务器分别与各自的ToR交换机相连,ToR交换机分别通过各自的光学组件与其他ToR交换机互连。
优选地,每个ToR交换机在所述光学数据中心网络的拓扑结构中的位置可以由逻辑地址A=(an-1,an-2,…,a0)来描述,其中ai以ki为基,ai∈[0,ki-1]。
优选地,两个ToR交换机之间的距离可以定义为
Dw(A,B)=w(A-B),
其中A和B表示两个ToR交换机的逻辑地址,w(A)是地址行列式A的权重
w ( A ) = Σ i = 0 n - 1 | a i | ,
其中|ai|=min{ai,ki-ai}。
优选地,所述光学数据中心网络可以由
Figure BDA00002133785100042
个ToR交换机和
Figure BDA00002133785100043
条ToR链路构成。
优选地,所述光学数据中心网络的网络直径,即,网络中任意两个ToR交换机之间的最长最短路径,等于
Figure BDA00002133785100044
优选地,在任意两个ToR交换机之间,存在2n条节点独立的平行路径。
根据本发明的第二方案,提出了一种光学组件,可以用在根据本发明第一方案的光学数据中心网络中,所述光学组件包括:q×1多路复用器(MUX),其q个输入端分别与相应的ToR交换机上的收发机相连,接收来自ToR交换机的相应波长的光信号,并将各个波长的光信号复用到输出端口,通过光纤输出;1×p波长选择开关(WSS),其输入端与q×1多路复用器的输出端相连,对通过光纤传输的多个波长的光信号进行波长选择,从而将多个波长分为p组,分别从p个输出端口输出;p个环行器,每一个将从1×p WSS的对应输出端口输出的光信号输出到所述光学组件的外部,并将来自所述光学组件外部的光信号输出到p×1耦合器;p×1耦合器,对来自p个环行器的光信号进行合波操作,从输出端口输出到1×q解复用器;以及1×q解复用器(DeMUX),将来自p×1耦合器的多波长光信号解复用为p组相应波长的光信号,并输出到相应的ToR交换机上的收发机,其中,p=2n,q是与根据网络带宽需求设置的波长数目相关联的整数。
优选地,q等于根据网络带宽需求设置的波长数目。
优选地,1×p WSS根据链路带宽需求,将波长分为p组。
根据本发明的第三方案,提出了一种波长分配方法,可以用在根据本发明第一方案的光学数据中心网络中,所述波长分配方法包括:将所述光学数据中心网络的图表示G=(V,E,φ)重绘为多重图G′=(V,E′),其中V是ToR交换机集合,每个元素表示一个ToR交换机,E是边集合,即每个元素表示一条ToR链路,φ是链路带宽需求,即每个元素表示一条链路上的带宽需求,E′包含两个节点之间的多个边,表示两个ToR交换机之间的多个波长,以满足二者之间的带宽需求;通过增加伪边,将双向图G′增广为Δ(G′)-规则双向图Gr=(V,Er),Δ(Gr)=Δ(G′),其中Er=E′+伪边,Δ(G′)是G′的最大节点度,Δ(Gr)是Gr的最大节点度;采用分割-占领方法,对Δ(Gr)-规则双向图Gr进行分解,找出形成图Gr的Δ(Gr)个完美匹配;从这Δ(Gr)个完美匹配中去除伪边,得到形成图G′的Δ(G′)个匹配;为这Δ(G′)个匹配中的每一个分配一个不同的波长,得到波长分配λ。
优选地,在链路带宽需求发生变化时,对波长分配进行调整,但使得改变的波长的数目最小。更优选地,原链路带宽需求为φold,满足原链路带宽需求φold的原波长分配为λold,新链路带宽需求为φnew,新波长分配为λnew,所述波长分配方法还包括以下步骤:利用原波长分配λold={m1,m2,…mΔ}作为辅助,将新的多重图G′new分解为Δ个匹配λnew={m′1,m′2,…m′Δ};采用Hungarian算法,得到新波长分配λnew,以实现新波长分配λnew和原波长分配λold之间的最大波长重叠。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1是示出了MEMS开关的示意图;
图2是示出了两层全网格MEMS链结构的示例的示意图;
图3A是示出了根据本发明的光学数据中心网络(DCN)300的示意图;
图3B是示出了图3A所示的光学DCN 300的ToR级连接逻辑图3000的示意图;
图4是示出了用在本发明的光学DCN 300中的光学组件400的结构的示意图;
图5是用于解释波长冲突的示例的示意图;
图6示出了本发明与其他现有网络拓扑在成本和功率消耗上的比较结果;以及
图7示出了本发明的波长分配方法在带宽需求发生变化时波长调整数量的仿真图。
具体实施方式
下面参照附图对本发明的优选实施例进行详细说明,在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。
【光学数据中心网络(DCN)300的基本拓扑结构和编址】
图3A是示出了根据本发明的光学数据中心网络(DCN)300的示意图,图3B是示出了图3A所示的光学DCN 300的ToR级连接逻辑图3000的示意图,其中,多个服务器H分别与各自的架顶(ToR)交换机相连,ToR交换机(位于其上的收发机T)分别通过各自的光学组件(Optics)400与其他ToR交换机互连。在ToR级,根据本发明的光学DCN 300具有n个维度,每个维度具有ki个ToR交换机,其中i∈[0,n-1],
Figure BDA00002133785100061
是大于等于3的整数,n是大于等于2的整数,即,构成了以(kn-1,kn-2,…,k0)为基的拓扑结构。基于以上特性,光学DCN 300构成了广义k-ary-n-cube拓扑结构(参见W.J.Dally,“Performance analysis ofk-ary n-cube interconnection networks,”IEEE Transaction on Computer,1990),每个维度具有可变的基数ki。因此,可以通过改变每一维度的基数ki,得到灵活的光学DCN 300。在本发明中,出于简单的目的,取为ki偶数。
选取逻辑地址A=(an-1,an-2,…,a0)来描述ToR交换机在拓扑结构的位置,其中ai以ki为基(即,ai∈[0,ki-1])。定义地址行列式A的权重为
w ( A ) = Σ i = 0 n - 1 | a i | ,
其中|ai|=min{ai,ki-ai}。由此,两个ToR交换机A和B之间的距离定义为Dw(A,B)=w(A-B)。例如,在图3B的ToR级连接逻辑图3000中,示出了n=2,k0=k1=4的网络拓扑(各个ToR交换机的逻辑地址如图3B所示);w(23)=2+|4-3|=3,Dw(10,33)=w(23)=3。在本发明的光学DCN300(ToR级连接逻辑图3000)中,如果Dw(A,B)=1,则两个ToR交换机A和B相邻。事实上,上述距离定义类似于Lee距离(参见http://en.wikipedia.org/wiki/Lee_distance),但对于各个维度具有不同的基数。本发明采用这种逻辑编址方式以体现其拓扑信息,从而有利于路由的计算(稍后将详细描述)。
本发明的光学DCN 300的这种k-ary-n-cube拓扑结构具有以下属性:
1.光学DCN 300由
Figure BDA00002133785100072
个ToR交换机和
Figure BDA00002133785100073
条ToR链路构成;
2.网络直径(即,网络中任意两个ToR交换机之间的最长最短路径)等于
Figure BDA00002133785100074
以上属性1确保了光学DCN 300中的ToR交换机的数量可以自由地在各个维度上进行扩缩,而没有任何限制。另外,在网络设计上,需要考虑网络直径,以避免过长的路由路径。基本上,2维光学DCN可以容纳数以千计的服务器,3维或4维光学DCN可以容纳数以万计或十万计的服务器。
在本发明的光学DCN 300中采用中央管理器来提供网络智能功能,如带宽调度/供给、网络连接/故障信息维护等。
如果一对ToR交换机之间的两条路径是节点独立的(即,一条路径上的任一交换机不出现在另一路径上),则这两条路径是两条平行路径。平行路径的存在提供了在两个ToR交换机之间选择备选路径的可能,增强了容错性能。根据本发明的光学DCN 300提供了较好的容错性能,因为其能够在任意两个ToR之间提供多条平行路径。
属性3.在任意两个ToR交换机之间,存在2n条节点独立的平行路径。
例如,在图3B所示的ToR级连接逻辑图3000中,ToR交换机00与ToR交换机21之间的4条节点独立的平行路径为:00-01-11-21、00-10-20-21、00-03-13-23-22-21、00-30-31-21。
当基本拓扑结构已知时,可以根据源地址和目的地址容易地计算出多条平行路径,由此为可扩缩的路由创造了条件。根据本发明,由源ToR交换机完全控制多径路由,而不必与中间节点(中间交换机)协商(源路由方式)。这意味着,中间交换机不必参与路由,只需按照报头转发分组,简化了功能的复杂度。此外,由于在本发明中采用源路由方式,避免了链路状态广播。
同样地,由于2n条节点独立的平行路径的存在,本发明的光学DCN300具有极强的容错性能。当故障发生时,源节点可以容易地将分组路由到故障路径以外的其他平行路径上。当检测到故障事件时,相关ToR交换机将立即通知中央管理器,中央管理器将通知其余ToR交换机。利用故障消息,每个ToR交换机可以容易地检查哪些路径将受到影响,并且可以容易地避开这些路径,将分组路由到其他路径上,从而到达目的地。在此过程中,本发明的光学DCN 300需要0(n)次通信(n是ToR交换机的个数):来自检测到故障的交换机的一条消息、和中央管理器向其余(n-1)个交换机发送的(n-1)条消息。
【光学组件400的具体结构】
图4是示出了用在本发明的光学DCN 300中的光学组件400的结构的示意图。
如图4所示,根据本发明的光学组件400包括1×p波长选择开关(WSS)、p个环行器、p×1耦合器、q×1多路复用器(MUX)、1×q解复用器(DeMUX),其中p=2n,q是与根据网络带宽需求设置的波长数目相关联的整数。
ToR交换机上的收发机将电信号转换为相应波长的光信号,并发送给相应的光学组件400中的q×1多路复用器。
q×1多路复用器的q个输入端分别与相应的ToR交换机上的收发机相连,接收来自ToR交换机的相应波长的光信号,并将各个波长的光信号复用到输出端口,通过光纤输出。
1×p WSS的输入端与q×1多路复用器的输出端相连,可以对光纤上传输的多个波长的光信号进行波长选择,从而将多个波长分为p组,分别从p个输出端口输出。
这里,关于波长的个数没有具体限定,可以根据实际需要(例如,带宽需求)进行配置。例如,假设ToR交换机的每个收发机对应于1个波长,则可以将相应的q个波长的光信号在q×1多路复用器处复用到单根光纤上。1×p WSS可以将这q个波长分为p组。再例如,假设ToR交换机的每个收发机对应于2个波长,则可以将相应的2q个波长的光信号在q×1多路复用器处复用到单根光纤上。1×p WSS可以将这2q个波长分为p组。再例如,假设ToR交换机具有40(q=40)个收发机,每个收发机的速率是10Gbps,对应于1个波长,则可以将相应的40个波长的光信号在40×1多路复用器处复用到单根光纤上。1×p WSS可以将这40个波长如下分组:波长1~5通过输出端口1输出;波长11~20通过输出端口2输出;波长6~10和21通过输出端口3输出;等等。这样,输出端口1~3所对应的链路1~3分别具有50Gbps、100Gbps和60Gbps的带宽。
p个环行器中的每一个将从1×p WSS的对应输出端口输出的光信号输出到光学组件400的外部(到其他光学组件),并将来自光学组件400外部(其他光学组件)的光信号输出到p×1耦合器,从而实现双向通信。
p×1耦合器对来自p个环行器的光信号进行合波操作,从1个输出端口输出到1×q解复用器。
1×q解复用器将来自p×1耦合器的多波长光信号解复用为p组相应波长的光信号,并输出到相应的ToR交换机上的收发机。
ToR交换机上的收发机将相应波长的光信号转换为电信号。
根据本发明,光学组件400可以简单地实现ToR交换机之间的链路带宽的改变,由此,可以实现灵活的流调度(2n条节点独立的平行路径)和灵活的带宽调度(灵活的波长配置)。
【波长分配的图模型】
图5是用于解释波长冲突的示例的示意图。如图5所示,当由相同波长携带的两个数据流在相同光纤上同相发送或接收时,发生波长冲突。为了防止这种约束事件的发生,需要进行合理的波长分配。
假设本发明的光学DCN 300由图G=(V,E,φ)描述,其中V是ToR交换机集合,每个元素(节点)表示一个ToR交换机,E是边集合,即每个元素(边)表示一条ToR链路,φ是链路带宽需求,即每个元素(带宽)表示一条链路上的带宽需求。可以将图G重绘为多重图G′=(V,E′):V保持不变,E′包含两个节点之间的多个边,表示两个ToR交换机之间的多个波长,以满足二者之间的带宽需求。利用多重图G′和波长冲突约束,波长分配问题可以转化为多重图上的边着色问题(参见http://en.wikipedia.org/wiki/Edge_coloring)。不同的颜色表示不同的波长,所需的波长分配方案需满足任意两条相邻边不具有相同的颜色。为了有效利用昂贵的光学端口或波长(每个端口具有固定的波长),应当找到具有最少数量的颜色的解(因为额外的颜色意味着额外的波长和额外的端口)。然而,找到最优边着色解是NP完全问题(参见http://en.wikipedia.org/wiki/Edge_coloring)。
在这一部分中,关注以下两个关键问题:
1.能够对光学DCN 300的多重图G′着色的最小颜色数量;
2.在带宽供给发生变化时,如何优化波长调整。
第1个问题是NP完全问题,发明人期望在利用光学DCN 300的属性的情况下,提供优化解。对于第2个问题,发明人以公式的形式描述了该问题,由于属于NP困难问题,发明人引入了快速启发式算法。
在以下的详细描述中,采用了以下符号:
  G=(V,E)   光学DCN 300的ToR级图
  φ   对于E的带宽需求
  G′=(V,E′)   G=(V,E,φ)的多重图表示
  λ   E′上的波长分配,满足带宽需求φ
  Gr=(V,Er)   由G′扩展得到的规则多重图,Er=E′+伪边
问题1.优化波长分配(OWA):给定光学DCN 300G=(V,E,φ),
其中φ是E上的带宽需求分布,找出E上的非冲突波长分
配(满足φ),使得所使用的不同波长的数目最小。
使用多重图G′=(V,E′)上的边着色来表述OWA问题。对于一般多重图G′,已知边色度χ′(G′)(对图G′进行边着色的最小颜色数量)满足χ′(G′)∈[Δ(G′),Δ(G′)+μ(G′)],其中Δ(G′)是G′的最大节点度(maximum node degree),μ(G′)是G′的重复度(multiplicity)。然而,对于找出χ′(G′)的一般问题是NP完全问题(参见http://en.wikipedia.org/wiki/Edge_coloring)。这对有效利用波长和光学端口提出了挑战。根据本发明,利用光学DCN 300的拓扑特性(广义k-ary-n-cube拓扑结构),可以实现对上述OWA问题的优化。
属性4.光学DCN 300G=(V,E,φ)仅需要Δ(G′)个颜色(即,边着
色的最小颜色数量),其中G′是G的多重图表示。
这意味着,总是可以使用最少的波长数量来满足带宽需求φ,也就是说,光学DCN 300优化地使用了精确的光波长或端口。
以上仅给出了最小边色度Δ(G′)个波长即可对图G′(G)进行着色,以下将根据属性5,介绍如何进行着色(波长分配)。
属性5.光学DCN 300的拓扑图G=(V,E,φ)(及其多重图表示G′)是双向图。
利用以上的属性5,可以根据以下方法,利用Δ(G′)个颜色(波长)对双向多重图G′进行着色:首先,通过增加伪边,将双向图G′增广为Δ(G′)-规则双向图Gr=(V,Er)(Δ(Gr)=Δ(G′));然后,采用分割-占领方法,对Δ(Gr)-规则双向图Gr进行分解,找出形成图Gr的Δ(Gr)个完美匹配;接下来,从这些完美匹配中去除伪边,由此得到形成图G′的Δ(G′)个匹配;最后,为这Δ(G′)个匹配中的每一个分配一个不同的颜色(波长),即,以Δ(G′)个颜色对图G′进行着色,得到波长分配λ。
对于上述分割-占领方法,可以描述如下:因为“任意的k-规则双向图具有完美匹配”(参见A.Schrijver,“Bipartite edge-colouring in O(Δm)time,”SIAM Journal on Computing,1998),可以从图Gr找出第1个完美匹配,剩余的图是(Δ(Gr)-1)-规则的。由此,可以依次找出第2个完美匹配、第3个完美匹配、…、第Δ(Gr)=Δ(G′)个完美匹配。
更具体地,可参考以下对Δ(G′)-规则双向图Gr进行分解的伪码程
Figure BDA00002133785100121
其中的伪码程序Find_Perfect_Matching(Gr)是从规则双向图中找出完美匹配的算法。
问题2.最少波长调整(MWA):给定光学DCN 300的拓扑G=(V,E,φ),原带宽分布φold,满足原带宽分布φold的原波长分配λold,新带宽分布φnew,找出新波长分配λnew满足新带宽分布φnew,使得从λold到λnew,改变的波长的数目最小。
发明人将上述MWA问题描述为0-1整数线性编程问题,该问题是NP困难问题。发明人在此采用了启发式算法,利用原波长分配λold={m1,m2,…mΔ}作为辅助,将新的多重图G′new分解为Δ个匹配λnew={m′1,m′2,…m′Δ},然后,采用Hungarian算法(参见http://en.wikipedia.org/wiki/Hungarian_algorithm)将颜色分配给λnew,以实现λnew和λold之间的最大颜色重叠。
更具体地,可参考以下启发式算法的伪码程序
Figure BDA00002133785100131
Figure BDA00002133785100141
在上述伪码中,在第3~13行,使用每个原匹配mi作为参考,试图在G′new中找出新匹配m,使其与mi具有尽可能多的重叠边;在第5和11行,要求所找出的新匹配必须覆盖当前图中最大节点度的节点,这是保证G′new最终能够被分解为Δ个匹配的充分条件,由于这一条件的存在,在成功找出δ个匹配之后,剩余图的最大节点度为Δ-δ,因此,可以被分解为Δ-δ个匹配;如果在第3~13行未能找出G′new的所有Δ个匹配,则在第14~15行中,采用前述Decomposition(G′new)算法来找出剩余的匹配。最后,在第16~22行(伪码程序Color_Assignment(λold,λnew)),采用Hungarian算法,将颜色(波长)分配给λnew,以实现λnew和λold之间的最大颜色重叠。
发明人已经意识到上述方法未必是最优的,仍然存在改善的空间。但是,上述方法已能给出相当好的结果。
图6示出了本发明与其他现有网络拓扑在成本和功率消耗上的比较结果。在图6中,给出了本发明与Fattree、BCube和c-Through(参见非专利文献[3])网络拓扑结构的成本和功耗对照。在成本上,本发明的光学DCN 300更为便宜,比Fattree便宜35%左右,比BCube便宜40%左右。在功率消耗上,本发明的光学DCN 300更为节能,比Fattree和BCube节能40%左右。
图7示出了本发明的波长分配方法在带宽需求发生变化时波长调整数量的仿真图。在所述仿真中,本发明的光学DCN 300构成6-ary 3-cube拓扑结构,每个维度均具有6个ToR交换机,每个ToR交换机具有40个波长。将本发明的波长分配方法与非优化方法(任意调整波长分配)进行比较,重复100次,并计算平均值和IQR(即,25~75个百分点),所得结果如图7所示。由图7可知,本发明的波长分配方法在带宽需求发生变化时避免了不必要的波长改变。例如,当带宽分布差为20(即,|φnewold|=20)时,本发明的波长分配方法保持了3876/4320=90%的波长不改变,而非优化方法仅保持了949/4320=22%的波长不改变。图7示出了曲线的下降趋势,这是因为越大的带宽需求变化更有可能引起波长分配变化。本发明的波长分配方法与优化方法之间的比较是非常复杂的,但发明人在此可以给出一些估计。例如,当带宽分布差为640(即,|φnewold|=640)时,优化方法最多能够保持4320-640=3680个波长不改变(应当小于3680);根据本发明,能够保持3000个波长不改变,超过了优化方法的80%。
这里所公开的本发明实施例的其他设置包括执行在先概述并随后详述的方法实施例的步骤和操作的软件程序。更具体地,计算机程序产品是如下的一种实施例:具有计算机可读介质,计算机可读介质上编码有计算机程序逻辑,当在计算设备上执行时,计算机程序逻辑提供相关的操作,从而提供上述波长分配和波长调整方案。当在计算系统的至少一个处理器上执行时,计算机程序逻辑使得处理器执行本发明实施例所述的操作(方法)。本发明的这种设置典型地提供为设置或编码在例如光介质(例如CD-ROM)、软盘或硬盘等的计算机可读介质上的软件、代码和/或其他数据结构、或者诸如一个或多个ROM或RAM或PROM芯片上的固件或微代码的其他介质、或专用集成电路(ASIC)、或一个或多个模块中的可下载的软件图像、共享数据库等。软件或固件或这种配置可安装在计算设备上,以使得计算设备中的一个或多个处理器执行本发明实施例所述的技术。结合诸如一组数据通信设备或其他实体中的计算设备进行操作的软件过程也可以提供根据本发明的系统。根据本发明的系统也可以分布在多个数据通信设备上的多个软件过程、或者在一组小型专用计算机上运行的所有软件过程、或者单个计算机上运行的所有软件过程之间。
应该理解,严格地讲,本发明的实施例可以实现为数据处理设备上的软件程序、软件和硬件、或者单独的软件和/或单独的电路。
至此已经结合优选实施例对本发明进行了描述。应该理解,本领域技术人员在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不局限于上述特定实施例,而应由所附权利要求所限定。

Claims (12)

1.一种光学数据中心网络,具有广义k-ary-n-cube拓扑结构,其中所述光学数据中心网络具有n个维度,每个维度具有ki个架顶(ToR)交换机,其中i∈[0,n-1],
Figure FDA00002133785000011
是大于等于3的整数,n是大于等于2的整数,多个服务器分别与各自的ToR交换机相连,ToR交换机分别通过各自的光学组件与其他ToR交换机互连。
2.根据权利要求1所述的光学数据中心网络,其中,每个ToR交换机在所述光学数据中心网络的拓扑结构中的位置由逻辑地址A=(an-1,an-2,…,a0)来描述,其中ai以ki为基,ai∈[0,ki-1]。
3.根据权利要求2所述的光学数据中心网络,其中,两个ToR交换机之间的距离定义为
Dw(A,B)=w(A-B),
其中A和B表示两个ToR交换机的逻辑地址,w(A)是地址行列式A的权重
w ( A ) = Σ i = 0 n - 1 | a i | ,
其中|ai|=min{ai,ki-ai}。
4.根据权利要求1~3之一所述的光学数据中心网络,其中,所述光学数据中心网络由
Figure FDA00002133785000013
个ToR交换机和
Figure FDA00002133785000014
条ToR链路构成。
5.根据权利要求1~3之一所述的光学数据中心网络,其中,所述光学数据中心网络的网络直径,即,网络中任意两个ToR交换机之间的最长最短路径,等于
Figure FDA00002133785000015
6.根据权利要求1~3之一所述的光学数据中心网络,其中,在任意两个ToR交换机之间,存在2n条节点独立的平行路径。
7.一种光学组件,用在根据权利要求1所述的光学数据中心网络中,所述光学组件包括:
q×1多路复用器(MUX),其q个输入端分别与相应的ToR交换机上的收发机相连,接收来自ToR交换机的相应波长的光信号,并将各个波长的光信号复用到输出端口,通过光纤输出;
1×p波长选择开关(WSS),其输入端与q×1多路复用器的输出端相连,对通过光纤传输的多个波长的光信号进行波长选择,从而将多个波长分为p组,分别从p个输出端口输出;
p个环行器,每一个将从1×p WSS的对应输出端口输出的光信号输出到所述光学组件的外部,并将来自所述光学组件外部的光信号输出到p×1耦合器;
p×1耦合器,对来自p个环行器的光信号进行合波操作,从输出端口输出到1×q解复用器;以及
1×q解复用器(DeMUX),将来自p×1耦合器的多波长光信号解复用为p组相应波长的光信号,并输出到相应的ToR交换机上的收发机,
其中,p=2n,q是与根据网络带宽需求设置的波长数目相关联的整数。
8.根据权利要求7所述的光学组件,其中,q等于根据网络带宽需求设置的波长数目。
9.根据权利要求7或8所述的光学组件,其中,1×p WSS根据链路带宽需求,将波长分为p组。
10.一种波长分配方法,用在根据权利要求1所述的光学数据中心网络中,所述波长分配方法包括:
将所述光学数据中心网络的图表示G=(V,E,φ)重绘为多重图G′=(V,E′),其中V是ToR交换机集合,每个元素表示一个ToR交换机,E是边集合,即每个元素表示一条ToR链路,φ是链路带宽需求,即每个元素表示一条链路上的带宽需求,E′包含两个节点之间的多个边,表示两个ToR交换机之间的多个波长,以满足二者之间的带宽需求;
通过增加伪边,将双向图G′增广为Δ(G′)-规则双向图Gr=(V,Er),Δ(Gr)=Δ(G′),其中Er=E′+伪边,Δ(G′)是G′的最大节点度,Δ(Gr)是Gr的最大节点度;
采用分割-占领方法,对Δ(Gr)-规则双向图Gr进行分解,找出形成图Gr的Δ(Gr)个完美匹配;
从这Δ(Gr)个完美匹配中去除伪边,得到形成图G′的Δ(G′)个匹配;
为这Δ(G′)个匹配中的每一个分配一个不同的波长,得到波长分配λ。
11.根据权利要求10所述的波长分配方法,其中,在链路带宽需求发生变化时,对波长分配进行调整,但使得改变的波长的数目最小。
12.根据权利要求11所述的波长分配方法,其中,原链路带宽需求为φold,满足原链路带宽需求φold的原波长分配为λold,新链路带宽需求为φnew,新波长分配为λnew,所述波长分配方法还包括以下步骤:
利用原波长分配λold={m1,m2,…mΔ}作为辅助,将新的多重图G′new分解为Δ个匹配λnew={m′1,m′2,…m′Δ};
采用Hungarian算法,得到新波长分配λnew,以实现新波长分配λnew和原波长分配λold之间的最大波长重叠。
CN201210338781.6A 2012-09-13 2012-09-13 光学数据中心网络、光学组件、波长分配方法 Active CN103686467B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210338781.6A CN103686467B (zh) 2012-09-13 2012-09-13 光学数据中心网络、光学组件、波长分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210338781.6A CN103686467B (zh) 2012-09-13 2012-09-13 光学数据中心网络、光学组件、波长分配方法

Publications (2)

Publication Number Publication Date
CN103686467A true CN103686467A (zh) 2014-03-26
CN103686467B CN103686467B (zh) 2017-06-30

Family

ID=50322525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210338781.6A Active CN103686467B (zh) 2012-09-13 2012-09-13 光学数据中心网络、光学组件、波长分配方法

Country Status (1)

Country Link
CN (1) CN103686467B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105025399A (zh) * 2014-04-21 2015-11-04 江苏艾思特信息科技有限公司 无源光互联结构
CN105471733A (zh) * 2015-12-04 2016-04-06 北京邮电大学 一种基于wss的支持流量局部化的可扩展的数据中心内部网络架构
CN105681932A (zh) * 2016-03-31 2016-06-15 中国人民解放军国防科学技术大学 一种支持大规模、全光互连的光交换机
US9722694B2 (en) 2015-09-11 2017-08-01 Microsoft Technology Licensing, Llc Backup communications scheme in computer networks
US9736556B2 (en) 2015-09-10 2017-08-15 Equinix, Inc. Automated fiber cross-connect service within a multi-tenant interconnection facility
CN107094270A (zh) * 2017-05-11 2017-08-25 中国科学院计算技术研究所 可重构的互连系统及其拓扑构建方法
CN109361967A (zh) * 2018-12-03 2019-02-19 北京邮电大学 一种基于集群的数据中心光网络架构方法
CN115378886A (zh) * 2021-05-19 2022-11-22 迈络思科技有限公司 混合光电交换机
CN117130428A (zh) * 2022-12-02 2023-11-28 上海交通大学 基于可编程光子芯片的np完全问题实现方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170402A (zh) * 2011-05-31 2011-08-31 清华大学 Torus网络中的无死锁自适应路由算法
CN102694720A (zh) * 2011-03-24 2012-09-26 日电(中国)有限公司 编址方法、编址装置、架构管理器、交换机和数据路由方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102694720A (zh) * 2011-03-24 2012-09-26 日电(中国)有限公司 编址方法、编址装置、架构管理器、交换机和数据路由方法
CN102170402A (zh) * 2011-05-31 2011-08-31 清华大学 Torus网络中的无死锁自适应路由算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王东: "面向数据中心网络的新型交换机制研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105025399A (zh) * 2014-04-21 2015-11-04 江苏艾思特信息科技有限公司 无源光互联结构
US9736556B2 (en) 2015-09-10 2017-08-15 Equinix, Inc. Automated fiber cross-connect service within a multi-tenant interconnection facility
US10206017B2 (en) 2015-09-10 2019-02-12 Equinix, Inc. Automated fiber cross-connect service within a multi-tenant interconnection facility
US9722694B2 (en) 2015-09-11 2017-08-01 Microsoft Technology Licensing, Llc Backup communications scheme in computer networks
CN105471733B (zh) * 2015-12-04 2019-06-18 北京邮电大学 一种基于wss的支持流量局部化的可扩展的数据中心内部网络架构
CN105471733A (zh) * 2015-12-04 2016-04-06 北京邮电大学 一种基于wss的支持流量局部化的可扩展的数据中心内部网络架构
CN105681932B (zh) * 2016-03-31 2018-10-02 中国人民解放军国防科学技术大学 一种支持大规模、全光互连的光交换机
CN105681932A (zh) * 2016-03-31 2016-06-15 中国人民解放军国防科学技术大学 一种支持大规模、全光互连的光交换机
CN107094270A (zh) * 2017-05-11 2017-08-25 中国科学院计算技术研究所 可重构的互连系统及其拓扑构建方法
CN109361967A (zh) * 2018-12-03 2019-02-19 北京邮电大学 一种基于集群的数据中心光网络架构方法
CN109361967B (zh) * 2018-12-03 2020-11-03 北京邮电大学 一种基于集群的数据中心光网络架构方法
CN115378886A (zh) * 2021-05-19 2022-11-22 迈络思科技有限公司 混合光电交换机
CN115378886B (zh) * 2021-05-19 2024-06-07 迈络思科技有限公司 混合光电交换机
CN117130428A (zh) * 2022-12-02 2023-11-28 上海交通大学 基于可编程光子芯片的np完全问题实现方法
CN117130428B (zh) * 2022-12-02 2024-04-19 上海交通大学 基于可编程光子芯片的np完全问题实现方法

Also Published As

Publication number Publication date
CN103686467B (zh) 2017-06-30

Similar Documents

Publication Publication Date Title
CN103686467A (zh) 光学数据中心网络、光学组件、波长分配方法
Chen et al. WaveCube: A scalable, fault-tolerant, high-performance optical data center architecture
US9332323B2 (en) Method and apparatus for implementing a multi-dimensional optical circuit switching fabric
Gerstel et al. Cost-effective traffic grooming in WDM rings
Kachris et al. A survey on optical interconnects for data centers
Gerstel et al. Fault tolerant multiwavelength optical rings with limited wavelength conversion
CN103535050A (zh) 自适应波导光交换系统和方法
Kim et al. Performance of colorless, non-directional ROADMs with modular client-side fiber cross-connects
Lin et al. Logical topology survivability in IP-over-WDM networks: Survivable lightpath routing for maximum logical topology capacity and minimum spare capacity requirements
Morais et al. Impact of node architecture in the power consumption and footprint requirements of optical transport networks
Džanko et al. Dedicated path protection for optical networks based on function programmable nodes
US20210314278A1 (en) Communication system and communication method
Yang et al. Survivable virtual optical network embedding with probabilistic network-element failures in elastic optical networks
JP5811777B2 (ja) トラフィックグルーミングのための方法、装置、およびシステム
Sharma et al. The augmented data vortex switch fabric: An all-optical packet switched interconnection network with enhanced fault tolerance
EP3588819A1 (en) Multi-degree colorless directionless roadm system
Ramamurthy et al. Cost and reliability considerations in designing the next-generation IP over WDM backbone networks
AT&T untitled
Jaekel et al. Resource efficient network design and traffic grooming strategy with guaranteed survivability
Kabaciński et al. Strict-sense nonblocking networks with k degrees of freedom
Zervas et al. Network function programmability and software-defined synthetic optical networks for data centres and future internet
Zhao et al. Nested rings: a simple scalable ring-based ROADM structure for neural application computing in mega datacenters
Tapolcai Survey on out-of-band failure localization in all-optical mesh networks
Hong et al. A multi-floor arrayed waveguide grating based architecture with grid topology for datacenter networks
Kabaciński et al. Strict-sense nonblocking networks with three multiplexing and switching levels

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant