CN105634953A - 一种基于可见光通信的混合数据中心组网与路由方法 - Google Patents
一种基于可见光通信的混合数据中心组网与路由方法 Download PDFInfo
- Publication number
- CN105634953A CN105634953A CN201511026714.0A CN201511026714A CN105634953A CN 105634953 A CN105634953 A CN 105634953A CN 201511026714 A CN201511026714 A CN 201511026714A CN 105634953 A CN105634953 A CN 105634953A
- Authority
- CN
- China
- Prior art keywords
- frame
- pod
- fat
- data center
- wireless
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/12—Shortest path evaluation
- H04L45/122—Shortest path evaluation by minimising distances, e.g. by selecting a route with minimum of number of hops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B10/00—Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
- H04B10/11—Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
- H04B10/114—Indoor or close-range type systems
- H04B10/116—Visible light communication
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于可见光通信的混合数据中心组网与路由方法,包括:建立或保持有线数据中心网络系统中多个机架间的有线Fat-Tree结构;将有线Fat-Tree结构中的多个机架组网为具有多个pod层的无线2D-Torus结构;根据无线2D-Torus结构的多个pod层与有线Fat-Tree结构计算任意机架对间的路由Pathh。本发明通过使用建立无线2D-Torus结构组网与已有的有线Fat-Tree机架结构相耦合并使混合结构作为一个整体工作的技术手段,在不改变有线数据中心的已有设备与布局的前提下建立不需要任何控制的跨机架无线连接,在小成本下大幅度扩展有线数据中心,并提升网络灵活性。
Description
技术领域
本发明涉及混合通信领域,特别地,涉及一种基于可见光通信的混合数据中心组网与路由方法。
背景技术
数据中心是在线应用和基础性服务的基础设施。成千上万的服务器和交换机通过数据中心网络(DCN,datacenternetwork)互联互通。而当前的数据中心网络包括两大主要流派,即有线数据中心和无线数据中心。有线数据中心内部服务器和交换机的组网依赖于有线链路,例如双绞线、光纤。Fat-Tree和VL2便属于这一类;无线数据中心内部的组网主要依靠无线通信链路来实现,要么将机架互联为无线网络,要么将所有服务器和交换机连接成为全无线网络结构。
有线数据中心网络存在天然的缺陷。首先,有线数据中心要么是过度超额认购,即使能维持很好的网络性能却大量的成本;要么就是过度从简来降低成本,但却不能保证较好的网络性能。其次,扩展现有的数据中心及其困难和复杂。再次,有线数据中心需要大量的接线和维护成本。最后,大型的有线数据中心通常采用多层结构。导致的结果是两个属于不同机架的服务器,即使物理上距离非常之近也必须采用上层链路才能实现通信。
针对现有技术中有线数据中心扩展成本高与灵活性差的问题,目前尚未有有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提出一种基于可见光通信的混合数据中心组网与路由方法,能够在不改变有线数据中心的已有设备与布局的前提下建立不需要任何控制的跨机架无线连接,在小成本下大幅度扩展有线数据中心,并提升网络灵活性。
基于上述目的,本发明提供的技术方案如下:
根据本发明的一个方面,提供了一种基于可见光通信的混合数据中心组网与路由方法,包括:
建立或保持有线数据中心网络系统中多个机架间的有线Fat-Tree结构;
将有线Fat-Tree结构中的多个机架组网为具有多个pod层的无线2D-Torus结构;
根据无线2D-Torus结构的多个pod层与有线Fat-Tree结构计算任意机架对间的路由Pathh。
其中,将有线Fat-Tree结构中的多个机架组网为具有多个pod层的无线2D-Torus结构包括:
将有线Fat-Tree结构中的多个机架构建为具有m个机架列、每列至多n个机架的矩形结构;
在每个机架顶端设置可见光收发器与其他机架通信;
在多个机架中设置k个pod,并将每个机架都划入pod中形成k个pod层。
并且,在每个机架顶端设置可见光收发器与其他机架通信,为在每个机架顶端对着与相邻机架正交的方向设置4个可见光收发器,可见光收发器电性连接至所在机架的ToR交换机,可见光收发器用于对所在方向上的不同ToR交换机收发信号束。
同时,k是偶数,k个pod最多容纳k2/2个机架,无线2D-Torus结构包括k2/2个ToR交换机。
同时,无线2D-Torus结构的网络直径是(m+n)/2,m、n满足条件m*(n-1)<k2/2≤m*n。
同时,根据无线2D-Torus结构的多个pod层与有线Fat-Tree结构计算任意机架对间的路由Pathh包括:
为每个机架按照pod层分配标识并构建pod层逻辑图;
计算起始机架所在pod到目标机架所在pod在pod层逻辑图上的路径Pathhp;
遴选Pathhp中的每一条无线连接,使得Pathhp的无线连接路径最短,并获得在机架上的路径Pathht;
添加聚合层交换机并将需要的有线连接加入Pathht中,获得路由Pathh。
并且,标识包括标识前缀与标识后缀,为每个机架按照pod层分配标识并构建pod层逻辑图包括:
对于任意x∈[0,k],随机选取k/2个无标识前缀机架,将被选取机架的标识前缀置为x,并保证任意两个相邻的机架的标识前缀不同;
为每个机架设置标识后缀,标识后缀取值范围为0到k/2-1,任意两个标识前缀相同的机架的标识后缀不同;
计算当前标识下pod层逻辑图的连通性;
重复执行上述步骤多次,选取连通性最大的标识分配方案作为pod层逻辑图生成结果。
从上面所述可以看出,本发明提供的技术方案通过使用建立无线2D-Torus结构组网与已有的有线Fat-Tree机架结构相耦合并使混合结构作为一个整体工作的技术手段,在不改变有线数据中心的已有设备与布局的前提下建立不需要任何控制的跨机架无线连接,在小成本下大幅度扩展有线数据中心,并提升网络灵活性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法的流程图;
图2为现有技术中无线数据中心网络系统中机架之间的连接关系与无线信号传输方式示意图;
图3为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,设置于正对光源的信号收发器收到的照度分布图;
图4为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,设置于侧对光源的信号收发器收到的照度分布图;
图5为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,设置于背对光源的信号收发器收到的照度分布图;
图6为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,设置于侧对光源的信号收发器收到的照度分布图;
图7为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,混合数据中心网络系统的机架顶层视图;
图8为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube的机架层逻辑图;
图9为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube的pod层逻辑图;
图10为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree的平均路径长度-k值柱状比较图;
图11为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree的网络总带宽-k值柱状比较图;
图12为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree的pod层连通性度量-k值柱状比较图;
图13为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree的路由算法复杂度度量-k值柱状比较图;
图14为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Trace流量下的吞吐量-k值柱状比较图;
图15为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Trace流量下的丢包率-k值柱状比较图;
图16为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Stride-2k流量下的吞吐量-k值柱状比较图;
图17为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Stride-2k流量下的丢包率-k值柱状比较图;
图18为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Stride-2k流量下的吞吐量-流大小柱状比较图;
图19为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在Stride-2k流量下的丢包率-流大小柱状比较图;
图20为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在随机流量下的吞吐量-k值柱状比较图;
图21为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在随机流量下的丢包率-k值柱状比较图;
图22为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在随机流量下的吞吐量-流大小柱状比较图;
图23为根据本发明实施例的一种基于可见光通信的混合数据中心组网与路由方法中,VLCcube与Fat-Tree在随机流量下的丢包率-流大小柱状比较图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进一步进行清楚、完整、详细地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
为了降低扩展已有有线数据中心过程中的成本并增加网络灵活性,一些针对机架层面的无线数据中心网络结构被提出。如图2所示,网络中的机架通过无线链路连接在一起,不同机架之间的信号通过精确地调整发射角度,通过反射镜面反射到目标机器上。特别地,60GHz射频通信技术和自由空间通信技术(FSO,Free-Space-Optical)技术被采用以建立机架间的无线链接。类似的这些方案能提高有线数据中心的带宽并降低包延迟。另外,无线链接能被动态重构以满足当前通信模式的需求。
现有的机架间无线数据中心设计方法主要致力于无线链接的可重构性。然而,却忽视了设计目标中的后两者。首先,已有工作必须升级或者完全重建已有数据中心的外围环境。譬如,之前的采用60GHz和FSO通信技术的设计方案必须将现有数据中心天花板装饰成为一个反射镜面以实现信号的超视距传输。另外,为了实现可重构性,必须使用特定的光设备。例如,天花板镜面,凸透镜/凹透镜等等。更致命的是,当配置无线链接时,它们往往需要对光网络设备及基础设施进行频繁而复杂的控制操作。
根据本发明的一个实施例,提供了一种基于可见光通信的混合数据中心组网与路由方法。
如图1所示,根据本发明实施例提供的基于可见光通信的混合数据中心组网与路由方法包括:
步骤S101,建立或保持有线数据中心网络系统中多个机架间的有线Fat-Tree结构;
步骤S103,将有线Fat-Tree结构中的多个机架组网为具有多个pod层的无线2D-Torus结构;
步骤S105,根据无线2D-Torus结构的多个pod层与有线Fat-Tree结构计算任意机架对间的路由Pathh。
其中,将有线Fat-Tree结构中的多个机架组网为具有多个pod层的无线2D-Torus结构包括:
将有线Fat-Tree结构中的多个机架构建为具有m个机架列、每列至多n个机架的矩形结构;
在每个机架顶端设置可见光收发器与其他机架通信;
在多个机架中设置k个pod,并将每个机架都划入pod中形成k个pod层。
并且,在每个机架顶端设置可见光收发器与其他机架通信,为在每个机架顶端对着与相邻机架正交的方向设置4个可见光收发器,可见光收发器电性连接至所在机架的ToR交换机,可见光收发器用于对所在方向上的不同ToR交换机收发信号束。
同时,k是偶数,k个pod最多容纳k2/2个机架,无线2D-Torus结构包括k2/2个ToR交换机。
同时,无线2D-Torus结构的网络直径是(m+n)/2,m、n满足条件m*(n-1)<k2/2≤m*n。
同时,根据无线2D-Torus结构的多个pod层与有线Fat-Tree结构计算任意机架对间的路由Pathh包括:
为每个机架按照pod层分配标识并构建pod层逻辑图;
计算起始机架所在pod到目标机架所在pod在pod层逻辑图上的路径Pathhp;
遴选Pathhp中的每一条无线连接,使得Pathhp的无线连接路径最短,并获得在机架上的路径Pathht;
添加聚合层交换机并将需要的有线连接加入Pathht中,获得路由Pathh。
并且,标识包括标识前缀与标识后缀,为每个机架按照pod层分配标识并构建pod层逻辑图包括:
对于任意x∈[0,k],随机选取k/2个无标识前缀机架,将被选取机架的标识前缀置为x,并保证任意两个相邻的机架的标识前缀不同;
为每个机架设置标识后缀,标识后缀取值范围为0到k/2-1,任意两个标识前缀相同的机架的标识后缀不同;
计算当前标识下pod层逻辑图的连通性;
重复执行上述步骤多次,选取连通性最大的标识分配方案作为pod层逻辑图生成结果。
下面根据具体实施例VLCcube来进一步阐述本发明的技术方案。
VLCcube是我们提出的一种代表性的有线数据中心网络结构Fat-Tree的增强结构。VLCcube将所有机架用VLC(VisibleLightCommunication)链接组网成为无线Torus结构,并形成有线Fat-Tree与无线Torus的耦合结构。
VLC通信技术是调制LED(LightingEmittingDiodes)或者LD(LaserDiodes)发出的可见光来实现信号传输。VLC通信技术采用OOK(On-OffKeying)调制机制,即接收到光信号便表示逻辑1,没有接收到便表示逻辑0。
在数据率方面,使用高频LED光源时,单色光VLC通信技术能实现3Gbps的数据率;而当使用三色光时,数据率将被扩展到10Gbps。倘若使用LD,单一的450nm激光束便能实现9Gbps的数据率。VLC通信技术的数据率完全能胜任数据中心的数据传输要求。
在传输距离方面,基于LED光源的VLC通信技术能实现10米范围内10Gbps带宽,这已经足够承担数据中心内相邻机架间的通信任务。一个名为Rojia的项目延长VLC通信技术的通信距离到1.4千米,虽然数据率有限。另外,基于LD的VLC通信技术能实现长距离(千米级别)高速率通信,因为激光具有良好的线性性。我们可以将基于LED的VLC通信技术用于数据中心内短距离通信,而基于LD的VLC通信技术作为长距离通信手段。
在可获得性方面,全双工式的VLC通信设备,即收发器,已经被成功研制并对外开放出售。一个名为MOMO的开发平台能为开发者提供开发基于VLC通信技术的应用的API和SDK工具包。比如,VLC通信技术能无缝地与物联网融合,提供室内的位置定位服务等等。另外,PureLiFi能为开发者提供快速配置和测试基于LED设施的可将光通信相关应用。
综上所述,VLC通信技术能够被用于数据中心网络内的通信业务,并且不会带来额外的接线成本,也不需要对已有数据中心硬件环境做出大得改变。
通常而言,每个机架顶端都会配置几个VLC收发器以便将机架互联成为特定的无线拓扑结构。给定一个机架R,当有多个邻居同时向它发送信号时,当R顶端的收发器都能接收到这些信号,却不能有效地区分开的话,干扰就会出现,导致R无法正确解码收到的信号。
我们使用专业的光学仿真软件TracePro70来评估当引入到数据中心里时的干扰情况。在一个机架上,我们放置四个正交方向的收发器,依次为T1,T2,T3和T4。我们让一束LED可见光从3米以外向T1发出,然后用每个收发器的照度分布图来表征每个收发器接收到的光信号的多少。倘若T2,T3和T4能接收到足够多的可见光的话,则证明它们受到了明显的干扰。
图3到图6示出的依次是T1、T2、T3、T4的观测结果。很显然,T1捕获了绝大多数的光信号,而在捕获的光信号又集中于收发器的中央位置。由于可见光传播过程中的散射,有些光线偏离中心位置,因而非中央部位也能感知到一些光照。而相反地,其他三个收发器只能接收到极少的光信号,因为只有极少几个部位能感知到0.001单位的归一化照度;特别地,T3几乎接收不到光信号。其原因是T3位于T1的正后方,光线很难绕过T1到达T3。因此,向T1发射的光信号对其他3个收发器的干扰是很有限的。而在机架顶端放置4个收发器是很合理的,带来的干扰问题是微乎其微。有这一观测结论作为支撑,我们把VLC技术引入数据中心并设计了VLCcube,每个机架放置4个方向正交的收发器。
在数据中心内部,每个服务器都是与其所在机架的架顶交换机连接而接入网络。对典型的有线数据中心而言,这些机架都是通过上层的交换机和链接二组网成一个分层结构,而非直接互联组网。因此,我们着眼于将有线数据中心里的机架通过无线链接直接组网成特定拓扑结构。在本文中,我们以当下被最广泛采用的Fat-Tree为例,将其机架组网为无线Torus结构。以这种方式,我们便构造了混合结构VLCcube,并无缝地将有线Fat-Tree结构和无线Torus结构相融合。
图7示出的是VLCcube无线部分的机架顶层视图,如图7所示,Fat-Tree中的所有机架都用VLC组网为2维无线Torus结构。该Torus结构中共有每一行共有m个机架,而每一列则有n个机架。在每个机架顶端,4个可见光收发器被配置为朝着四个正交的方向,以便尽量避免相互之间的干扰。需要注意的是,VLCcube的有线部分维持了Fat-Tree结构不变,我们所做的是将所有机架用VLC链接组网为Torus。用k表示每个交换机的端口数,并且k为偶数。与Fat-Tree一样,VLCcube有k个pod,每个pod包含k/2个架顶交换机和k/2个聚合交换机。因此,总体而言,VLCcube的无线Torus一共涉及到k2/2个架顶交换机。
为了保证VLCcube的性能,2维Torus必须精心设计。有两大问题需要解决以便充分发挥无线链接的优势:m和n的设置以及机架的放置问题。在2维Torus中,每个维度的交换机都连接成为一个圈,故而该Torus的网络直径为(m+n)/2。所以VLCcube需要设置合适的m和n以便最小化网络直径。另外,2维Torus中远程链接的数量也是m+n,然而这些远程链接的数据率是有限的,最小化m+n能提高网络的总带宽。出于这方面的考虑,我们也需要最小化m+n。至于机架放置问题,由于Fat-Tree中任意两个机架之间的路径长度要么是2跳,要么是4跳,为了最小化VLCcube的网络直径,引入的VLC无线链接必须尽可能将那些相隔4跳的机架直接链接。
如果2维Torus需要容纳k2/2个机架,则参数m和n必须满足:
m*(n-1)<k2/2≤m*n
在VLCcube中,最优化的参数配置是而n的取值则依赖于k2/2。如果(m-1)2<k2/2≤m*(m-1),n取(m-1);否则,如果m*(m-1)<k2/2≤m2,则n的取值与m一样,即
m和n的取值需要最小化m+n。而因此,当且仅当m=n时,m+n达到最小值。再综合考虑不等式(m-1)2<k2/2≤m*(m-1),便能得到m,n和k三者之间的关系。
对于给定的m和n,接下来就是考虑机架的放置问题。在Fat-Tree中,如果一对机架属于同一个pod,则它们之间的路径长度为2跳,否则,需要4跳。VLCcube尽可能将机架间4跳有线路径缩短为1跳无线路径。也就是说,VLCcube中的VLC连接必须用于互联那些不属于同一个pod的机架。
为了清楚地阐明机架放置策略,我们首先介绍机架的标识的概念。图8示出的是一个数据中心内的机架标识图,在VLCcube中,每个机架都有唯一的标识。该标识由两部分组成,前缀和后缀。前缀的取值范围是0到k,表示的是该机架属于哪一个pod。而后缀则在0到k/2之间取值,表示的是该机架在pod内部的编号。举个例子,标识51表示的是第6个pod中的第2个机架。
我们还引入了pod层逻辑图,如图9所示。pod层逻辑图将每个pod看作一个节点,倘若两个pod之间存在一条或者多条无线链接,则在pod层逻辑图中相应节点之间加入一条边。在图8与图9所示的VLCcube当中,k=6,m=5,n=4。根据以上定义,可以推导出相应的pod层逻辑图。本文用pod层逻辑图中边的数量来衡量其连通性。在示例的pod层逻辑图中,共有6个节点和15条边,已经构成一个完全图。因此,给定k的值,pod层逻辑图边的总数不大于k*(k-1)/2。
有了以上定义并给定k,m和n的值,我们设计了三个步骤来构造2维无线Torus。正如图8与图9所示,有可能获得的Torus并不是严格意义上完整的Torus。
第一步,分配标识前缀。对于任意x∈[0,k],我们都随机选取k/2个机架,并将它们的前缀置为x。每个前缀被分配k/2次是因为每个pod中都有k/2个机架。这一步需要满足的唯一约束是任何机架都不能和其四个邻居中的任何一个拥有相同的前缀。如果出现了冲突,重复这一步骤直到所有前缀都被分配到图中。
第二步,计算标识后缀。在机架层逻辑图中,每个机架都有一个后缀来将其与其他同一pod内的机架区分开。而后缀的取值范围为0到k/2。
第三步,提高pod层逻辑图的连通性。我们通过重复以上两个步骤多次,计算每次执行得到的pod层逻辑图的连通性并选取连通性最大的分配方案作为最终结果。
我们进一步证明以上步骤能推导出正确合法的VLCcube。
当k≥4时,以上步骤能得到一个可行的VLCcube构造方案,并且每个pod在机架层逻辑图中出现k/2次。
在第一步中,我们保证了将每个pod分配k/2次到机架层逻辑图中,并且每一条VLC链接只能互联两个不同的pod。假如机架层逻辑图中每个机架被染上一种颜色的话,这等价于证明机架层逻辑图能被k种颜色着色。事实上,VLCcube的机架层逻辑图是4-正则图,也就是说起色数为4。4种颜色就能将该图成功染色,因此,当k≥4时,VLCcube的可行构造方案一定存在。
同时,VLCcube的pod层逻辑图必须是连通的。否则,假设存在VLC链接不能到达的pod的话,VLCcube的性能将不能保证。
同时,以上三个步骤得到的VLCcube的pod层逻辑图是连通的。
值得注意的是,机架层视图是一个2维Torus结构,不管是完整Torus还是非完整Torus,它都是一个连通图。也就是说,给定任意机架xiyi,它能找到一条到达任意目的机架xjyj的路径,当把该路径映射到pod层逻辑图上时,就找到一条从podxi到podxj的路径。因此,VLCcube的pod层逻辑图是连通的。
上述论证保证了VLCcube构造方法的合理性。第三步则通过重复执行选最优而提升了pod层逻辑图的连通性。这样做的理论依据是,多次执行之后,更有可能获得更优的解。我们会在后续的实验中验证其具体效果。
从拓扑设计的视角来看,VLCcube集成了Fat-Tree和Torus的拓扑特性,包括扩展性、常量度、多路径以及容错性。另外,VLCcube易有于部署和即插即用的特性(可见光通信设备一旦安置好,在使用过程中不再需要后续的调整和控制)。还需要注意的是,VLCcube实现了机架层面的无线组网,并没有对已有的Fat-Tree结构和机房周围环境做任何改变。
对于任意一对机架,它们之间并存着有线路径,无线路径以及有线无线混合路径。在本实施例中,我们聚焦于设计VLCcube的混合链路路由算法。为了最小化网络拥塞,我们对VLCcube网络拥塞系数进行了建模,并分别针对批量流量和序列流量提出拥塞感知的流调度算法。
给定任意一对机架,混合路径Pathh中既包含了有线链接,也包含了无线链接。也就是说,在设计混合路由算法时,必须综合考虑Fat-Tree和Torus的拓扑特性。根据VLCcube本身的特征,我们设计了一种自顶而下的混合路由算法。假设源端机架和目的端机架分别为xiyi和xjyj,我们首先得到pod层逻辑图中从podxi到podxj的路径,然后将pod层面的路径具体化到机架层面。在具体化的过程中,需要选定合理的VLC链接。最后,将涉及到的有线链接加入到路径当中。
首先,计算从源pod到目的pod在pod层逻辑图中的路径,Pathhp。这一步比较简单,因为pod层逻辑图中只有k个节点。
然后,遴选出Pathhp中的每一条无线链接,也就是计算机架层面的路径Pathht。因为一对pod之间可能存在多条可选的无线链接,而选择不同的无线链接会导致不同的链路长度。因此,在Pathhp中的每一跳都应该选择那些导致最短路径的无线链接。在图9所示的VLCcube中,我们将源端机架定为11,目的端机架定为41。在pod层逻辑图中,pod1和pod4是邻居。而在机架层逻辑图中,有三条可选链接直接互联了pod1和pod4,即 和如果选用的话,机架11需要传输到10,而40则需要转发数据到41,导致的结果是pod1和pod4都需要一个聚合层交换机作为中继。然而,倘若选取或者则分别只需要一个聚合层交换机作为中继,即11到12和11到10个需要一跳中继。所以,会导致5跳路径长度,而或者只需要4跳。
最后,将所需要的有线链接加入到路径Pathht中。这一步是向路径中添加必要的聚合层交换机。在每个pod中,聚合层交换机和架顶交换机构成完全二分图,因此,该pod中的任意聚合层交换机都可以作为任意两个架顶交换机之间的中继。所以,在这一步中,我们随机选取所需的聚合层交换机。
采用以上三步,可以计算出任意两个机架之间的最短混合路径。第一步的时间复杂度是O(k2),第二步和第三步的时间复杂度为O(0)。因此,该路由算法的时间复杂度为O(k2)。值得注意的是,k表示的是交换机端口数量(往往小于100),所以O(k2)的复杂度是可以接受的。
下面对本发明所述的排序方法的效果进行评价。
我们用专业网络仿真软件NS3(NetworkSimulator)实现了VLCcube和Fat-Tree。给定k的值,可以得到Fat-Tree结构,而VLCcube则可以按照上文给出的构造方法得到。VLCcube中的有线连接和短程无线链接的带宽设置为10Gbps,而长距离无线链接的带宽被限定为100Mbps。网络中的重传时间(RTO,retransmissiontimeout)固定为2秒。基于以上参数设置,我们首先比较二者拓扑层面的优劣,然后比较有线路径,无线路径和混合路径三种路由算法的时间复杂度。最后,我们着重衡量二者的网络性能。
我们的实验考虑了三种不同的流量模式:1)Trace流量:雅虎数据中心记录下来的流量;2):Stride-i流量:网络中标号为x的服务器向标号为(x+i)modN的服务器发送数据包,其中N为网络中服务器的总数量;3):Random流量:每条流的源端和目的端都是随机选取的。网络吞吐量和丢包率被用来衡量网络在不同流量模式下的性能。
为了验证我们提出的调度算法的性能,我们比较VLCcube和Fat-Tree都使用ECMP调度方法时的网络性能。需要注意的是,序列流量的到达时间服从泊松分布。
为了比较VLCcube和Fat-Tree在拓扑层面的优劣,我们测量了两种网络的平均路径长度和网络总带宽。如图10与图11所示,相较Fat-Tree而言,VLCcube能提供更多网络带宽,并拥有更短的平均路径长度。造成这些优势的原因是VLCcube中引入了额外的VLC无线链接。同时,我们观察到,引入的VLC无线链接对网络平均路径的影响呈现出边际递减的趋势。也就是说,当网络规模较小时,VLC无线链接能更加显著地降低平均路径长度。实际上,给定k的值,VLCcube中有k2条VLC无线链接,而网络中有线和无线链接的总数是k3/2+k2。随着k的增加,VLC无线链接占总链接数的比例逐渐下降,从而导致上述边际效应的出现。
我们多次执行VLCcube构建方法,并选出其中最优的VLCcube构建方案。为了易于比较,所生成的VLCcube的pod层逻辑图的连通性(pod层逻辑图中边的数量)被相应的完全图归一化。在图12中,VLCcube1,VLCcube2和VLCcube10分别表示执行VLCcube构建方法1次,2次和10次时所得的VLCcube结构的pod层逻辑图的连通性。显然,随着k的增加pod层逻辑图的连通性递减,而执行构建方法的次数越多,得到的结构也就越优越,因为更有可能获得较好的机架放置方案。
我们还进一步比较搜索有线路径,无线路径和混合路径的路由算法的时间复杂度。图13记录了三种算法的时间开销,可以看出,随着网络规模的增加,混合路径的路由算法的时间消耗不断增加并比其他两者消耗更大。而无线路径路由算法的时间开销也有着不断增长的趋势,从0.2毫秒增加到了0.575毫秒。需要注意的是,有线路径路由算法的时间开销最小并稳定地保持在很低的水平,即0.09毫秒。所以总的来讲,有线路径路由算法的时间复杂度是常数,而其他两种路由算法的复杂度分别与k和k2成正比。
因此,根据以上结果,可以断定VLCcube能提供更多网络带宽,并拥有更短的平均路径长度,也就是说具有更好的拓扑性能。
我们还比较了VLCcube和Fat-Tree都采用ECMP时的网络吞吐量和丢包率。在不同的流量模式下,通过改变k的值从6增加到60来调整网络规模,并观察和记录网络吞吐量和丢包率。另外,我们的实验还控制平均流大小从5Mb到300Mb来揭示流大小对网络性能的影响。但是基于真实Trace的流大小是无法改变的,由Trace的数据决定。在每次测试中,网络吞吐量用VLCcube中k=60是的吞吐量或者当平均流大小为300Mb时的吞吐量归一化。
对于Trace流量,本文使用的雅虎的Trace记录了其6个分布式数据中心一段时间内每条流的基本信息,包括源端和目的端服务器的IP地址,流大小及其所用的端口号等等。通过识别流所用的端口号,可以判断该流量是某个数据中心内部流量还是跨数据中心的流量。之后,我们在实验中向VLCcube和Fat-Tree分别注入随机选取的k3条流以评估它们的性能。
图14与图15记录了VLCcube和Fat-Tree在k的值从6增加到60过程中,在Trace流量下的吞吐量和丢包率。结果显示,相较Fat-Tree而言,VLCcube能提供多于8.5%的吞吐量,并减少39%的丢包率。其深层次原因是VLCcube引入了无线链接,使得每条流有更多的路径可选。
对于Stride-2k流量,在给定流平均大小为150Mb的情况下,我们使k的值从6增加到60,当注入k3条流时,记录下网络吞吐量和丢包率,图16与图17分别展示了实验结果。随着k的增加,VLCcube和Fat-Tree都能传输更多数量的流,因此它们的吞吐量都不断增长。然而,平均来看,VLCcube比Fat-Tree能提供15.14%更多的吞吐量,而丢包率也更少。
同时,为了测量流大小对性能的影响,我们固定k=36,而流的平均大小从50Mb增加到300Mb,并向网络中注入k3条流。如图18与图19所示,VLCcube仍然优于Fat-Tree。具体而言,甚至当流的平均大小为150Mb时,VLCcube拥有14.31%更多的吞吐量,而丢包率也小得多。
对于随机流量模式,流的源端和目的端服务器是随机选取的,同样地,网络中注入了k3条流。
首先,我们固定流的平均大小为150Mb,而决定网络规模的k的值从6增加到60。如图20所示,VLCcube和Fat-Tree的吞吐量都急剧增加,而平均来看,VLCcube仍然更优越,比Fat-Tree多10.44%吞吐量。图21显示出,在k≥18以后,Fat-Tree一直遭受很高的丢包率,而VLCcube中的丢包率却一直维持在低水平。具体而言,VLCcube和Fat-Tree平均的丢包率分别是0.27%和2.45%。
我们进一步度量流大小的影响并固定k=36。图22与图23表明,随着输入的流的大小的增加,网络中吞吐量也不断攀升。与此同时,丢包率不断上升。然而,VLCcube还是维持了较大的优势,相较Fat-Tree而言。拥有更高吞吐量的同时保持较低的丢包率。
因此,通过实验证明,在都使用ECMP调度算法时,即使在不同的网络流量模型下,VLCcube在网络性能上较Fat-Tree更具有优势。
综上所述,借助于本发明的上述技术方案,本文提出了一种易于部署,高效能的新型数据中心结构VLCcube。为了提升已有的有线数据中心网络Fat-Tree,本文采用正在兴起的可见光通信技术将机架互联组网成无线Torus结构,引入的可见光链接能有效降低网路平均路径长度并提高网络带宽。通过使用建立无线2D-Torus结构组网与已有的有线Fat-Tree机架结构相耦合并使混合结构作为一个整体工作的技术手段,在不改变有线数据中心的已有设备与布局的前提下建立不需要任何控制的跨机架无线连接,在小成本下大幅度扩展有线数据中心,并提升网络灵活性。实验评估结果显示,VLCcube显著优于Fat-Tree,而本文提出的流调度算法能充分提高VLCcube的性能。
所属领域的普通技术人员应当理解:以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,包括:
建立或保持有线数据中心网络系统中多个机架间的有线Fat-Tree结构;
将所述有线Fat-Tree结构中的所述多个机架组网为具有多个pod层的无线2D-Torus结构;
根据所述无线2D-Torus结构的多个pod层与所述有线Fat-Tree结构计算任意机架对间的路由Pathh。
2.根据权利要求1所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,将所述有线Fat-Tree结构中的所述多个机架组网为具有多个pod层的无线2D-Torus结构包括:
将所述有线Fat-Tree结构中的所述多个机架构建为具有m个机架列、每列至多n个机架的矩形结构;
在所述每个机架顶端设置可见光收发器与其他机架通信;
在所述多个机架中设置k个pod,并将每个机架都划入pod中形成k个pod层。
3.根据权利要求2所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,在所述每个机架顶端设置可见光收发器与其他机架通信,为在所述每个机架顶端对着与相邻机架正交的方向设置4个可见光收发器,所述可见光收发器电性连接至所在机架的ToR交换机,所述可见光收发器用于对所在方向上的不同ToR交换机收发信号束。
4.根据权利要求2所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,所述k是偶数,所述k个pod最多容纳k2/2个机架,所述无线2D-Torus结构包括k2/2个ToR交换机。
5.根据权利要求2所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,所述无线2D-Torus结构的网络直径是(m+n)/2,所述m、n满足条件m*(n-1)<k2/2≤m*n。
6.根据权利要求2所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,根据所述无线2D-Torus结构的多个pod层与所述有线Fat-Tree结构计算任意机架对间的路由Pathh包括:
为所述每个机架按照pod层分配标识并构建pod层逻辑图;
计算起始机架所在pod到目标机架所在pod在所述pod层逻辑图上的路径Pathhp;
遴选Pathhp中的每一条无线连接,使得所述Pathhp的无线连接路径最短,并获得在机架上的路径Pathht;
添加聚合层交换机并将需要的有线连接加入所述Pathht中,获得路由Pathh。
7.根据权利要求6所述的一种基于可见光通信的混合数据中心组网与路由方法,其特征在于,所述标识包括标识前缀与标识后缀,为所述每个机架按照pod层分配标识并构建pod层逻辑图包括:
对于任意x∈[0,k],随机选取k/2个无标识前缀机架,将被选取机架的所述标识前缀置为x,并保证任意两个相邻的机架的标识前缀不同;
为每个机架设置所述标识后缀,所述标识后缀取值范围为0到k/2-1,任意两个所述标识前缀相同的机架的标识后缀不同;
计算当前标识下pod层逻辑图的连通性;
重复执行上述步骤多次,选取连通性最大的标识分配方案作为pod层逻辑图生成结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511026714.0A CN105634953B (zh) | 2015-12-30 | 2015-12-30 | 一种基于可见光通信的混合数据中心组网与路由方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511026714.0A CN105634953B (zh) | 2015-12-30 | 2015-12-30 | 一种基于可见光通信的混合数据中心组网与路由方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105634953A true CN105634953A (zh) | 2016-06-01 |
CN105634953B CN105634953B (zh) | 2017-09-12 |
Family
ID=56049473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511026714.0A Active CN105634953B (zh) | 2015-12-30 | 2015-12-30 | 一种基于可见光通信的混合数据中心组网与路由方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105634953B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241222A (zh) * | 2017-06-06 | 2017-10-10 | 郭得科 | 一种网络拓扑校准方法 |
CN113595896A (zh) * | 2021-08-05 | 2021-11-02 | 河南大学 | 一种基于vlc链路的混合数据中心网络的多路由通信方法 |
CN113726879A (zh) * | 2021-08-30 | 2021-11-30 | 河南大学 | 一种基于vlc链路的混合数据中心网络结构vhcn |
CN114978781A (zh) * | 2022-08-02 | 2022-08-30 | 中国电子科技集团公司第三十研究所 | 一种面向Tor网络的混合匿名链路通信方法及系统 |
CN115460221A (zh) * | 2021-08-30 | 2022-12-09 | 河南大学 | 一种基于有线数据中心网络结构架设无线链路的方法 |
CN115499271A (zh) * | 2022-08-30 | 2022-12-20 | 西北工业大学 | 一种混合网络拓扑结构及其路由方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104185999A (zh) * | 2012-03-21 | 2014-12-03 | 光机队公司 | 分组流互联架构 |
WO2015100044A1 (en) * | 2013-12-24 | 2015-07-02 | Nec Laboratories America, Inc. | Scalable hybrid packet/circuit switching network architecture |
-
2015
- 2015-12-30 CN CN201511026714.0A patent/CN105634953B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104185999A (zh) * | 2012-03-21 | 2014-12-03 | 光机队公司 | 分组流互联架构 |
WO2015100044A1 (en) * | 2013-12-24 | 2015-07-02 | Nec Laboratories America, Inc. | Scalable hybrid packet/circuit switching network architecture |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241222A (zh) * | 2017-06-06 | 2017-10-10 | 郭得科 | 一种网络拓扑校准方法 |
CN107241222B (zh) * | 2017-06-06 | 2022-06-07 | 中国人民解放军国防科技大学 | 一种网络拓扑校准方法 |
CN113595896A (zh) * | 2021-08-05 | 2021-11-02 | 河南大学 | 一种基于vlc链路的混合数据中心网络的多路由通信方法 |
CN113595896B (zh) * | 2021-08-05 | 2022-04-05 | 河南大学 | 一种基于vlc链路的混合数据中心网络的多路由通信方法 |
CN113726879A (zh) * | 2021-08-30 | 2021-11-30 | 河南大学 | 一种基于vlc链路的混合数据中心网络结构vhcn |
CN115460221A (zh) * | 2021-08-30 | 2022-12-09 | 河南大学 | 一种基于有线数据中心网络结构架设无线链路的方法 |
CN113726879B (zh) * | 2021-08-30 | 2023-10-24 | 河南大学 | 一种基于vlc链路的混合数据中心网络系统vhcn |
CN114978781A (zh) * | 2022-08-02 | 2022-08-30 | 中国电子科技集团公司第三十研究所 | 一种面向Tor网络的混合匿名链路通信方法及系统 |
CN115499271A (zh) * | 2022-08-30 | 2022-12-20 | 西北工业大学 | 一种混合网络拓扑结构及其路由方法 |
CN115499271B (zh) * | 2022-08-30 | 2023-10-13 | 西北工业大学 | 一种混合网络拓扑结构及其路由方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105634953B (zh) | 2017-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105634953A (zh) | 一种基于可见光通信的混合数据中心组网与路由方法 | |
CN103608797B (zh) | 数据传输系统和网络转置盒 | |
CN104067566B (zh) | 在多区域网络中改进最短路径桥接 | |
CN102124704B (zh) | 跨数字和光学直通节点的链路分集和负载平衡 | |
EP2842278B1 (en) | Three stage folded clos optimization for 802.1aq | |
US20180375718A1 (en) | Technique for topology aware network device upgrades | |
CN105191215A (zh) | 双向服务链的数据平面学习 | |
CN106063195A (zh) | 具有单独控制设备和转发设备的网络中的控制设备发现 | |
US20160134482A1 (en) | Distributed Determination OF Routes in a Vast Communication Network | |
KR101548695B1 (ko) | 하이브리드 광학 네트워크 온 칩의 토폴로지 설계 장치 및 방법 | |
CN103718519A (zh) | 实现分离式架构网络中的ospf | |
WO2014046875A1 (en) | A method and apparatus for topology and path verification in networks | |
CN103379032A (zh) | 跨域端到端路由的获取方法及装置、子路由计算实体 | |
CN102739407A (zh) | 捆绑式交换机、网络及在该网络上传输数据的方法 | |
US9762479B2 (en) | Distributed routing control in a vast communication network | |
CN101425975B (zh) | 一种基于bgp虚拟下一跳的ip骨干网络流量负载均衡的方法 | |
CN107147530A (zh) | 一种基于资源守恒的虚拟网络重配置方法 | |
CN101330411B (zh) | 一种模拟大规模网络拓扑的方法和系统 | |
US8472347B2 (en) | System and method for providing network resiliency | |
CN106453084B (zh) | 一种基于拥塞系数的混合数据中心网络流调度方法 | |
CN102025615B (zh) | 一种光通讯网络中小粒度业务路径规划的方法及装置 | |
CN103795641B (zh) | 基于多维帧映射的光网络资源管理方法 | |
CN103401796B (zh) | 网络流量清洗系统及方法 | |
CN101147348A (zh) | 自动交换光网络层次路由计算和连接建立的方法 | |
AU2013235426B2 (en) | Routing a data packet in a communication network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |