CN105162721A - 基于软件定义网络的全光互连数据中心网络系统及数据通信方法 - Google Patents
基于软件定义网络的全光互连数据中心网络系统及数据通信方法 Download PDFInfo
- Publication number
- CN105162721A CN105162721A CN201510466089.5A CN201510466089A CN105162721A CN 105162721 A CN105162721 A CN 105162721A CN 201510466089 A CN201510466089 A CN 201510466089A CN 105162721 A CN105162721 A CN 105162721A
- Authority
- CN
- China
- Prior art keywords
- frame
- server
- network
- controller
- wavelength
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000003287 optical effect Effects 0.000 claims abstract description 45
- 230000005540 biological transmission Effects 0.000 claims description 24
- 238000007726 management method Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 238000013468 resource allocation Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 9
- 230000005693 optoelectronics Effects 0.000 claims description 8
- 238000005538 encapsulation Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000004806 packaging method and process Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 238000005265 energy consumption Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 239000013307 optical fiber Substances 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000011217 control strategy Methods 0.000 description 4
- 230000004907 flux Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000010410 layer Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000012792 core layer Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 101100171666 Arabidopsis thaliana SFP2 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010065042 Immune reconstitution inflammatory syndrome Diseases 0.000 description 1
- 241000588769 Proteus <enterobacteria> Species 0.000 description 1
- 101150003216 SFP1 gene Proteins 0.000 description 1
- 101100422767 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) SUL1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011982 device technology Methods 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000002365 multiple layer Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/24—Traffic characterised by specific attributes, e.g. priority or QoS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/50—Queue scheduling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Optical Communication System (AREA)
- Small-Scale Networks (AREA)
Abstract
本发明涉及一种基于软件定义网络的全光互连数据中心网络系统及数据通信方法,涉及云计算与通信技术领域。该系统中无源光网络互连服务器构建机架替代传统的架顶交换机,光Clos网络互连各机架构建全光互连数据中心网络。其中机架内无源光网络由耦合器模块构成;光Clos网络由波长控制模块、阵列波导光栅路由器和耦合器构成。机架内软件定义控制器和机架间软件定义控制器以层次结构互连,分别对机架内服务器和机架间服务器的数据通信进行集中式控制,实现控制与转发的分离。本发明具有很好的节能和成本效益,能够提高数据中心网络的管理效率和网络性能。
Description
技术领域
本发明属于云计算与通信技术领域,涉及一种基于软件定义的全光互连数据中心网络系统及数据通信方法。
背景技术
云计算是一种利用互联网实现随时、随地、按需、便捷地访问共享资源池(如服务器、网络资源、存储设备、应用程序等)的计算模式。数据中心(DataCenter)是云计算实现信息集中处理、存储、传输、交换和管理的核心平台和基础设施。数据中心网络DCN(DataCenterNetwork)是数据中心内互连大规模(几万甚至几十万台)服务器实现大型分布式计算的网络,用于数据中心内服务器间大量数据的传输和交换。作为云计算的基础设施和传输海量数据的关键网络,DCN已成为各界关注的研究热点。
云计算应用的蓬勃发展使得数据中心内流量剧增,要求DCN提供更高的带宽、更低的时延、更少的能耗以及更低的成本。传统DCN大多使用基于电分组交换的商业化以太网交换机,采用典型的3层树形结构,分别由接入层交换机、汇聚层交换机及核心层交换机互连构成。服务器连接到接入层架顶交换机(TopofRack,ToR),架顶交换机进一步连接到汇聚层交换机,核心层交换机向下连接汇聚层交换机,从而构成树形网络结构。传统的网络比较简单,但是也存在诸多问题:高能耗,链路复杂,高时延,树形结构顶端的核心交换机易成为带宽瓶颈,且限制了网络的可扩展性。
传统的DCN无法持续发展以满足新兴网络应用对高吞吐量、低时延和低能耗等性能需求,已成为未来云计算数据中心发展的瓶颈。随着大量新兴应用的发展,大规模的数据流要求在大量交换节点之间转移,且通信负载更加密集。这些特征更加强了DCN在整体时延和吞吐量方面的性能要求,对传统电交换数据中心网络提出了很大的挑战。因而研究者们相继提出改进型电交换数据中心网络及基于无线协同数据中心网络架构来克服传统DCN中存在的一系列问题。但是改进型电交换数据中心网络架构同样无法消除高能耗、高时延和高复杂度等问题,而无线协同网络架构中无线信号传输本身存在一些问题,如无线信号干扰、信道干扰和信道分配和调度等。
光网络由于其高带宽、高吞吐量和低时延的优势,已经成功在电信网络中广泛应用。随着光器件技术的成熟以及成本的降低,研究人员开始探讨将光交换网络技术应用至数据中心网络构建光互连DCN。光互连DCN可分为光分组交换和光电路交换两大类。大部分的光互连DCN架构都基于光分组交换,如DOS、Petabit、Multiple-Layer、SPINT、Spanke、IRIS、FISSION、Optical-OFDM和HWRE等。由于光分组交换的快速交换,光分组交换可同时支持长时和短暂突发流量。与电分组相比,它的主要优势是分组无需携带其他的目的地址数据,减少开销,光分组交换直接基于不同的传输波长到达目的端口。基于光电路交换的DCN架构有:Proteus、Space-Wavelength、Data-vortex、E-RAPID、c-through和Helios等。光电路交换通常基于微电机系统(MEMS),MEMS过长的配置时间导致了光电路交换时延性能的降低,但是对于长时大流量的通信,光电路交换可以提供高带宽的交换路径。但是对于突发小流量,其性能会显著降低。虽然光互连DCN架构具有高带宽,低时延等优势,但是高能耗问题却一直未得到很好的解决,随着DCN网络规模的不断扩展,其能耗问题也不断凸显,成为光互连DCN正常运营的挑战之一。
发明内容
有鉴于此,本发明的目的在于提供一种基于软件定义的全光互连数据中心网络系统及数据通信方法,能够提高数据中心网络的管理效率和网络性能。
为达到上述目的,本发明提供如下技术方案:
一种基于软件定义的全光互连数据中心网络系统,包括两个层次的互连:
(1)无源光网络(PON)互连服务器构建机架替代传统的架顶交换机。
机架内包括服务器、耦合器模块和机架内软件定义控制器。耦合器模块连接服务器构建服务器机架,服务器中的用于机架内数据通信的光收发器为现在商用的小型可热插拔光模块。机架内服务器间的通信采用广播-选择的工作方式,机架内控制器运行软件定义带宽资源分配算法对每台服务器进行带宽资源的分配,保证服务器之间数据无碰撞传输。
进一步,所述的耦合器模块为无源光模块。其为多端口模块或可由2×2耦合器级联构成多端口模块,该模块连接多台服务器构成服务器机架,在该机架内服务器数据发送采用广播-选择方式。
进一步,所述机架内控制器基于软件定义的控制方式。控制器基于软件定义技术,实时的对机架内网络状态进行监测、记录和更新,同时根据这一系列的状态信息运行基于软件定义的带宽资源分配算法对机架内的网络带宽资源进行分配。
进一步,所述的带宽资源分配算法主要功能是为机架内每台服务器数据的发送分配带宽资源,保证机架内数据无碰撞有序的发送。该软件定义带宽资源分配算法包括服务器信息注册与更新、控制器控制和服务器数据发送三个部分。
(2)光Clos网络连接机架构建光互连数据中心网络。
Clos网络是一种多级互连模块化网络。输入模块、中间模块和输出模块构成,输入模块和中间模块、中间模块和输出模块之间以完全二部图方式连接。本发明采用光器件来构建Clos网络,输入模块、中间模块和输出模块分别选择波长控制模块、阵列波导光栅路由器(AWGR)和耦合器构成,且输入模块和中间模块、中间模块与输出模块之间以完全二部图方式连接,该光Clos网络互连机架构建了真正的光互连数据中心网络。
进一步,所述波长控制模块完成波长转换功能。要使数据能正确传输到目的机架和目的服务器,需要对机架输出的波长进行转换。波长控制转换模块由波长控制模块由耦合器、带宽可调谐滤波器(BTF)、复用器和可调谐波长转换器(TWC)组成。耦合器将机架输出的光信号通过耦合器对功率进行分割,该耦合器对应输出的光信号通过BTF滤出特定的波长并将该波长转发到1×2的耦合器,该耦合器的一个输出端口将光信号发送到机架间软件定义控制器,另外一个端口的光信号转发到TWC,波长转换之后的光信号分成两组由复用器合并输出到光Clos网络的中间模块。
进一步,所述机架间软件定义控制器实现网络状态管理和波长转换控制功能。所述1×2耦合器将光信号转发至机架间软件定义控制器,控制器对其进行光电转换为电信号,并提取数据包头部检测该数据包的目的地址,控制器获取数据包目的地址后结合网络状态做出控制决策,并将决策信息发送到TWC,TWC根据该控制信号将波长转换到合适的波长。
进一步,所述AWGR作为Clos网络的中间模块,连接输入模块和输出模块,基于波长循环路由特性将来自同一输入模块的光信号输出到不同的输出模块,同时将来自不同输入模块的光信号输出到同一输出模块。
进一步,所述构成输出模块的耦合器,以完全二部图的方式连接所述中间模块AWGR,接收并复用各AWGR输出的光信号,再将该光信号转发到目的机架。
本发明还提供了一种基于软件定义的全光互连数据中心网络系统的数据通信方法,包括以下步骤:
1)为每台服务器分配唯一的服务器地址;
2)源服务器将需要发送的信息进行封装,封装的信息包括有源服务器的地址信息和目的服务器的地址信息;
3)控制器检测封装信息目的服务器地址信息,判断该信息的目的服务器在机架内或机架外。若目的服务器在机架内,则转入步骤4),若目的服务器在机架外,则转入步骤5);
4)机架内软件定义控制器运行基于软件定义的带宽资源分配算法来对机架内各服务器数据的发送进行调度;若源服务器此时无数据发送权限,则待发送数据进入服务器缓存队列,否则源服务器根据软件定义控制器的控制,将待传输电信号转换为光信号;该光信号通过耦合器以广播的方式发送到机架内所有的服务器;当接收端服务器接收到该光信号之后,经过光电转换提取出电信号并检测该信号的目的服务器地址,若服务器发现该地址是本身则接收,否则丢弃;
5)源服务器根据控制器的控制,将源服务器待传输电信号转换为光信号;该光信号通过耦合器从源机架输出到光Clos网络。首先该波长发送到Clos网络的输入模块波长控制模块,该模块将携带数据的波长根据控制平台的控制转换到合适的波长并转发至中间模块AWGR,AWGR根据波长循环路由特性将光信号发送到正确的输出端口并转发到输出模块耦合器,耦合器将接收到的光信号转发至目的服务器所在机架。光信号转发到目的机架则输入到耦合器中,耦合器将该光信号进行分割广播到机架内每台服务器中,经过光电转换提取出电信号并检测该信号的目的服务器地址,若服务器发现该地址是本身则接收,否则丢弃。
进一步,步骤4)和步骤5)源服务器在上传数据的过程中,将电信号转换为光信号时采用以下方法:控制器根据待传输信息的目的服务器地址分别控制SFP1和SFP2光模块产生波长,再将待传输的机架内数据和机架外数据调制到光波长上进行数据的传输。
进一步,步骤5)中波长转换的过程中,采用以下方法:耦合器将光信号转发至控制平台,控制平台对其进行光电转换为电信号,并提取数据包头部检测该数据包的目的地址,控制平台获取数据包目的地址后结合网络状态做出控制决策,并将决策信息发送到TWC,TWC根据该控制信号将波长转换到合适的波长。
本发明的有益效果在于:
1)本发明具有很好的节能效果。由于无源光网络构建的机架替代了传统的ToR交换机,同时在机架间的光Clos网络中也大量使用无源光器件实现数据中心网络的构建,本发明消除了传统光网络中由于ToR交换机带来的大量能量消耗,可有效降低数据中心网络总体能耗。比较同时互连64台服务器的机架和ToR的成本及能耗,ToR的成本和能耗分别为70.4k美元和13.44千瓦,而机架的成本和能耗只需38.4K美元和1.28千瓦。采用机架代替传统ToR不但能提供较高的带宽资源满足服务器通信需求,同时在成本和能耗上低于ToR。因此利用本发明可以构建绿色数据中心网络,减少碳排放,节约能源。
2)本发明组建难度低。本发明光互连数据中心网络系统是基于目前商用的常见的光器件而设计的,网络组建的光器件如耦合器、复用/解复用器、AWGR、BTF和TWC等,这些光器件大多数技术成熟,成本低廉。因此本发明光互连数据中心网络系统的构建难度比较低。
3)本发明可提供较高的通信带宽和较大的网络容量。本发明中无源光网络机架替代了传统的ToR交换机,可突破传统光设备对光互连数据中心网络带来的带宽和速率瓶颈,同时光Clos网络互连机架构建数据中心网络,由于光网络系统本身的高带宽特性和WDM系统的使用,使该数据中心网络具有较高的通信带宽和网络容量。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为机架内部连接示意图;
图2为本发明光互连数据中心网络架构的互连方式示意图;
图3为波长控制模块示意图;
图4为阵列波导光栅路由器AWGR示意图;
图5为软件定义控制器互连示意图;
图6为机架内控制器控制过程示意图;
图7为机架内服务器数据通信流程示意图;
图8为机架间服务器数据通信流程示意图;
图9为实施例一的工作状态示意图;
图10为实施例二的工作状态示意图;
图11为本发明机架与ToR连接服务器的成本和能耗比较结果图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
本发明用无源光网络替代传统的光互连数据中心网络中的ToR交换机连接服务器,用Clos光网络互连机架构建真正的光互连数据中心网络架构。如图1是机架内部连接示意图,耦合器模块连接服务器,在控制器的控制下运行带宽资源分配算法实现服务器无阻塞通信。光Clos网络通过机架外部接口连接各机架构成真正的光互连数据中心网络系统。
所述机架是无源光网络耦合器模块连接服务器构成的服务器机架。耦合器模块连接服务器以广播-选择的工作方式实现服务器间通信,所述耦合器为多端口模块或是由2ⅹ2耦合器级联构成的多端口耦合器模块。
本发明光互连数据中心网络的构建如图2所示。机架间由光Clos网络实现互连,所述光Clos网络是由一系列的光器件作为其交换模块构建的网络,输入模块、中间模块和输出模块分别由波长控制模块、AWGR和耦合器构成。其中输入模块与中间模块、中间模块与输出模块之间以完全二部分图的方式连接,构成完全非阻塞网络。控制平台控制波长控制模块,实现波长正确转换的功能。
所述波长控制模块示意图如图3所示。BFT耦合器输出的光信号滤出为单波长信号,该单波长信号通过1×2耦合器分离为两部分,一部分的光信号输入到控制平台,一部分发送到TWC。首先,控制平台将该光信号转换为电信号,检测数据包头部的目的服务器地址信息。然后,结合当前网络状态计算控制决策。最后,控制平台向TWC发送控制决策消息。TWC根据该决策消息对发送到达的光信号转换到合适的波长。波长转换后的光信号分为两组分别通过两台复用器复用后发送到中间模块。
所述由AWGR构成的中间模块根据波长实现路由,直接根据光信号的波长特性将其路由到正确的输出端口。AWGR是k×k的无源光器件,具有波长循环路由的特性:不同的波长可承载不同类型的信号,而且相同的波长也可承载不同的信号从不同的输入端口输入,而在输出端口不会发生碰撞。图4所示是5×5的循环阵列波导光栅路由器的波长传输关系,a1、a2、a3、a4、a5是输入端口,b1、b2、b3、b4、b5是输出端口,每个输入端口输入5个不同波长的光信号分别到5个输出端口中,而每个输出端口中输出的5个不同波长光信号分别来自5个输入端口,输入和输出之间有循环移位特性,从而实现路由选择功能。
本发明的控制模块如图5所示。主要分为两个层次:机架内控制器和机架间控制器,两个层次的控制器之间以树形分层结构互连,彼此保持实时通信以实现对全光互连数据中心网络的集中控制:
1.机架内的控制。所述机架内的软件定义控制器功能包括:监测机架内各服务器状态,检测服务器数据流量类型,判断是机架内流量还是机架外流量;二是运行基于软件定义的动态带宽资源分配算法为机架内各服务器数据的发送分配带宽资源;三是与机架间软件定义控制器进行实时通信,对网络状态信息进行交互。
2.机架间的控制。所述机架间软件定义控制器功能包括:一是监测网络状态,与机架间控制器实时通信,维持整个数据中心网络全网状态信息,控制数据流量的正确适时调度;二是控制光Clos网络的波长控制模块进行波长的正确转换。
所述软件定义控制器之间以树形分层结构互连。每个机架同时与2台机架内软件定义控制器相连,其中一台作为主控制器,另外一台作为备份控制器,例如图中机架1由机架内软件定义控制器1进行控制,而机架内软件定义控制器2作为其备份控制器,当控制器1出现故障时,控制器2可同时维持对机架1和机架2的控制。在正常状态下,每个机架由一台机架内软件定义控制器控制,而只有当一台控制器发生故障时,而作为备份的机架内控制器同时对两个机架进行控制。同时每台机架内软件定义控制器与2台机架间软件定义控制器相连,其中一台机架间软件定义控制器作为主控制器,另外一台作为备份控制器。机架间软件定义控制器从机架内软件定义控制器获取全网的状态信息,同时机架内软件定义控制器需要从机架间软件定义控制器处获取备份控制器所控制的机架的状态信息。控制器之间的交互是实时的。
所述机架内软件定义控制器运行的动态带宽资源分配算法实现过程如图6所示,该过程包括:服务器信息注册与更新、控制器控制和服务器数据发送三个部分:
1.注册与更新
服务器启动或入网时,需要向控制器发送“注册信息”,该信息包括:服务器及虚拟机IP地址,各端口MAC地址和服务器编号。控制器接收到该“注册信息”后,将其写入服务器“状态信息表”并根据服务器编号更新时刻表,同时向服务器发送“注册确认消息”。服务器若收到“注册确认消息”,则注册成功,若未收到,则继续注册。当服务器的地址信息发生变化(如虚拟机迁移)或进入休眠、关机等状态时,服务器需要主动地向控制器发送“注册更新信息”,控制器在更新“注册信息表”后确认该行为。
2.主动控制、被动控制
在主动模式中,控制策略由控制器下发至服务器。在主动控制中,服务器仅根据控制策略对数据进行发送。主动模式能够减少控制器与交换机的信息交互从而提高转发效率。在被动模式中,控制器不会主动下发控制策略,而由服务器不断向控制器发送“报告信息”请示后控制器完成控制策略。被动模式牺牲转发效率但能够实现细粒度的控制。本发明采用的控制方式包含以上两种模式:
(1)主动控制,控制器为每台工作状态的服务器分配时隙,通过令牌对各个服务器轮询授权。控制器维持时间信息表。
(2)被动控制,当服务器缓存队列为空或数据提取完成发送、服务器有优先级高的业务到达时,服务器会主动地向控制器发送“报告信息”,控制器根据该“报告信息”做出调度策略。若服务器缓存队列为空或数据提取完成发送,其主动告知控制器,控制器确认该信息后向下一台服务器发送令牌;若高优先级业务到达其它服务器时,控制器停止计时并暂停当前的数据发送期,当高优先级数据发送完后恢复暂停的数据发送期和计时器。
3.数据发送
控制器维持着各服务器进行数据发送的一个“时间信息表”,控制器根据该时间信息表周期性的轮询各服务器。控制器根据调度策略的结果向一台服务器发送“令牌”,“令牌”意味着使用网络资源的权限,只有接收到令牌的服务器才能够发送数据,且该服务器必须通过控制信道向控制器发送“令牌确认”信息以确保网络资源分配无误,令牌确认包含两个作用:一是确保令牌的正确传输二是当服务器无数据需要传输时,通过令牌确认信息告知控制器,控制器则向下一台服务器发送令牌,提高网络吞吐量。当机架内各服务器轮询一次完成,“时间信息表”将进行更新,重新开始新一轮的计时查询。控制器内的“时间信息表”是根据数据流在机架内传输的时延和网络状态等规则设定的,根据机架内服务器数量的变化而实时的更新。
本发明提供一种适用于全光互连数据中心网络系统的数据通信方法,该方法包括机架内光信号通信和机架间光信号通信,机架内控制器控制光信号发送过程如图7:
步骤701,机架内软件定义控制器的流量分发机制通过对服务器流量特性的分析,确定流量是机架内流量,服务器则将其缓存到相应的机架内流量发送缓存队列中等待调度。
步骤702,控制器运行带宽资源分配算法,为服务器数据的发送分配带宽资源。
步骤703,服务器获得数据发送令牌,向机架内所有服务器以广播方式通过耦合器模块将光信号发送到机架内其他所有服务器。
步骤704,机架内其他服务器接收到该光信号后将其转换为电信号并检测该信号的目的服务器地址,若该地址为接收服务器本身则接收,否则丢弃。
机架间服务器数据发送过程如图8所示,该方法包括:
步骤801,机架内软件定义控制器的流量分发机制通过对服务器流量特性的分析,确定流量是机架外流量,服务器则将其缓存到相应的机架外流量发送缓存队列中等待发送。
步骤802,在机架内软件定义控制器控制下,机架外数据通信光收发器将待发送电信号转换为光信号,并通过机架外部接口发送到连接机架的光Clos网络中。
步骤803,光信号进入光Clos网络中,在波长控制模块中需要进行波长的转换以保证光信号正确的发送到目的机架。波长转换过程为:机架间软件定义控制器接收到来自机架内服务器发送的光信号,利用光电转换器将该光信号转换为电信号;控制器提取电信号中分组头部,并检测该分组头部信息,获取该分组的源服务器地址和目的服务器地址;控制器获取整个数据中心网络状态,对网络状态进行分析;根据获取的分组源、目的地址和网络状态信息,控制器根据控制算法计算出控制决策(当前分组的载波波长转换控制信息和该信号的调度路径控制信息);控制器发送控制决策信息到TWC,TWC根据该控制信息将当前光信号转换到合适波长。
步骤804,经过波长转换的光信号可根据其波长特性准确的传输到目的机架,进入目的机架的光信号经过耦合器广播到目的机架中所有服务器,这些服务器上光收发器将光信号转换为电信号并检测其目的服务器地址,若该地址为接收服务器本身则接收,否则丢弃。
实施例一
如图9所示,服务器A向服务器B发送数据。机架内软件定义控制器首先对该数据流量特性进行分析,确定该流量为机架内通信流量,对该流量进行标记并缓存到相应的队列中。控制器运行软件定义带宽资源分配算法,根据“时间信息表”轮询机架内的服务器,当轮询到服务器A时,则控制器给服务器A发送“令牌”,该“令牌”告知服务器A具有发送权限,服务器A向控制器确认“令牌”之后开始发送数据。服务器A将需要发送的信息进行封装,封装的信息包括有源服务器A的地址信息和目的服务器B的地址信息,封装后的信息调制到光载波λ1上并以广播方式经过耦合器模块发送到机架内的所有其他服务器,接收端各服务器接收到该光信号后将其转换为电信号并检测该信号的目的服务器地址,服务器B发现该数据的目的服务器地址是本身则接收做进一步处理,而其他服务器检测到其目的服务器地址非本身则将该信息丢弃。
实施例二
如图10所示,机架1内服务器C向机架2内服务器D发送连接请求。服务器C产生数据流,经过机架内控制器分析,该数据流为机架外流量,对该流进行标记并缓存到相应的队列中。对于机架外的数据,数据的发送无需遵循带宽资源分配原则,直接进行数据的发送。首先,服务器C将需要发送的信息进行封装,封装的信息包括有源机架1、源服务器C的地址信息和目的机架2、目的服务器D的地址信息,其次,SFP光模块将待发送电信号调制到光载波上经过耦合器发送到连接各机架的光Clos网络。从机架1输出的波长λ1转发到光Clos网络的输入模块波长控制模块,该波长输入控制模块,通过耦合器一部分功率输入到控制平台,一部分发送到TWC。控制平台首先将光信号转换为电信号,获取该电信号中分组的头部信息,检测出该分组的目的服务器地址,控制平台然后结合网络状态信息计算出控制决策,最后将控制决策转发到TWC,TWC根据控制决策消息将波长λ1转换为λ2。波长控制模块将λ2转发到中间模块AWGR1,AWGR1根据波长循环路由特性,将λ2转发到输出模块耦合器,该耦合器将接收到的光信号转发至目的服务器D所在机架2。光信号转发到目的机架2则输入到耦合器中,耦合器将该光信号进行分割广播到机架2内每台服务器中,经过光电转换提取出电信号并检测该信号的目的服务器地址,若服务器D发现该地址是本身则接收,其他服务器发现该目的地址非本身则丢弃信息。图11为本发明机架网络与ToR连接服务器的成本和能耗比较结果图。
以上两个实施例描述了两台服务器之间进行数据通信的路径和经历的过程。与现有其他光互连数据中心网络系统不同的是,本发明没有使用架顶交换机,而采用无源光网络将其替代构建机架,因此在机架内的服务器数据通信需要由该光网络来实现,由于该光网络中只采用耦合器模块连接各服务器,所以携带数据的光载波通过该光网络进行路由时不需要对光信号进行光电光转换,只需要控制器对该网络的带宽资源进行协调分配就可以实现透明的光传输网络。同样对于机架间服务器通信也基于波长的路由,数据的调度需要控制平台的统一协调,包括协调调度路径和波长转换等,同样可实现透明的光传输网络。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (9)
1.一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:耦合器模块互连服务器构建服务器机架;波长控制模块、阵列波导光栅路由器和耦合器分别作为输入模块、中间模块和输出模块构建光Clos网络互连服务器机架;机架内软件定义控制器与机架间软件定义控制器以层次结构互连,并分别控制机架内服务器数据通信和解决间服务器数据通信;
所述耦合器模块连接服务器构建服务器机架,每台服务器的光接口配置两个波长固定或波长可调谐的小型可插拔光模块,分别用于机架内服务器数据通信和机架间服务器数据通信;光Clos网络通过机架提供的外部接口互连各机架构成光互连数据中心网络系统;机架内服务器间的通信采用广播-选择的工作方式,机架内软件定义控器对机架内服务器的数据发送进行控制,若所有用于机架内服务器通信的光模块波长固定且相同,则控制器需运行基于软件定义的带宽资源分配算法为每台服务器的数据发送进行带宽分配,若该光模块为波长可调谐或彼此波长不同则无需进行带宽分配;机架间软件定义控制器主要功能是通过互连机架内控制器对数据中心网络整体架构进行控制器,同时对机架间服务器的数据通信进行光信号波长转换的控制。
2.根据权利要求1所述的一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:所述的耦合器模块为多端口模块或是由低端口耦合器级联构成的多端口模块。
3.根据权利要求1所述的一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:所述服务器上两个小型可插拔光模块分别用于机架内服务器数据通信和机架间服务器数据通信;用于机架内通信的光模块可以是波长固定的也可以是波长可调谐的,用于机架间服务器数据通信光模块可以是波长固定的也可以是波长可调谐的。
4.根据权利要求1所述的一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:所述的波长控制模块由耦合器、带宽可调谐滤波器BTF、复用器和可调谐波长转换器构成。
5.根据权利要求1所述的一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:若机架内所有服务器上用于内部通信的光模块波长相同且固定时,在机架内只有一个波长用于内部通信,机架内软件定义控制器运行基于软件定义的带宽资源分配算法用于解决机架内的波长碰撞问题,保证机架内服务器数据无差错传输;对于机架内服务器上用于内部通信的光模块彼此波长不同或波长可调谐的情况,控制器无需对其进行带宽分配。
6.根据权利要求1所述的一种基于软件定义网络的全光互连数据中心网络系统,其特征在于:所述机架内软件定义控制器和机架间软件定义控制器基于软件定义网络技术,分别控制机架内服务器通信和机架间服务器通信;机架内软件定义控制器与机架间软件定义控制器以层次结构互连,机架内控制器连接机架控制机架内服务器,机架间控制器连接机架内控制器,使控制器间形成互连网络;每台控制器都有其备份控制器以保证在故障时网络正常运行;通过实时的对数据中心网络状态进行监测、记录和更新,控制器可对网络系统进行精确控制。
7.利用权利要求1至6中任一项所述网络系统进行数据通信的方法,其特征在于:包括以下步骤:
步骤一:为每台服务器分配唯一的服务器地址;
步骤二:源服务器将需要发送的信息进行封装,封装的信息包括有源服务器的地址信息和目的服务器的地址信息;
步骤三:机架内控制器检测封装信息目的服务器地址信息,判断目的服务器在机架内或机架外;若目的服务器在机架内,则转入步骤四,若目的服务器在机架外,则转入步骤五;
步骤四:机架内软件定义控制器运行基于软件定义的带宽资源分配算法来对机架内各服务器数据的发送进行调度;若源服务器此时无数据发送权限,则待发送数据进入服务器缓存队列,否则源服务器根据软件定义控制器的控制,将待传输电信号转换为光信号;该光信号通过耦合器以广播的方式发送到机架内所有的服务器;当接收端服务器接收到该光信号之后,经过光电转换提取出电信号并检测该信号的目的服务器地址,若服务器发现该地址是本身则接收,否则丢弃;
步骤五:源服务器根据软件定义控制器的控制,将源服务器待传输电信号转换为光信号;该光信号通过耦合器从源机架输出到光Clos网络;首先该波长发送到Clos网络的输入模块波长控制模块,该模块将携带数据的波长根据控制平台的控制转换到合适的波长并转发至中间模块阵列波导光栅路由器,阵列波导光栅路由器根据波长循环路由特性将光信号发送到正确的输出端口并转发到输出模块耦合器,耦合器将接收到的光信号转发至目的服务器所在机架;光信号转发到目的机架则输入到耦合器中,耦合器将该光信号进行分割广播到机架内每台服务器中,经过光电转换提取出电信号并检测该信号的目的服务器地址,若服务器发现该地址是本身则接收,否则丢弃。
8.根据权利要求7所述的方法,其特征在于:在步骤四和步骤五中,源服务器在上传数据的过程中,将电信号转换为光信号时采用以下方法:机架内软件定义控制器根据待传输信息的目的服务器地址分别控制用于机架内通信和机架间通信的光模块产生波长,再将待传输的机架内数据和机架外数据调制到光波长上进行数据的传输。
9.根据权利要求8所述的方法,其特征在于:在步骤五中,波长转换的过程采用以下方法:耦合器将来自机架的部分光信号转发至机架间软件定义控制器,控制器对其进行光电转换为电信号,并提取数据包头部检测该数据包的目的地址,控制器获取数据包目的地址后结合网络状态做出控制决策,并将决策信息发送到可调谐波长转换器,可调谐波长转换器根据该控制信号将波长转换到合适的波长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510466089.5A CN105162721B (zh) | 2015-07-31 | 2015-07-31 | 基于软件定义网络的全光互连数据中心网络系统及数据通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510466089.5A CN105162721B (zh) | 2015-07-31 | 2015-07-31 | 基于软件定义网络的全光互连数据中心网络系统及数据通信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105162721A true CN105162721A (zh) | 2015-12-16 |
CN105162721B CN105162721B (zh) | 2018-02-27 |
Family
ID=54803478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510466089.5A Expired - Fee Related CN105162721B (zh) | 2015-07-31 | 2015-07-31 | 基于软件定义网络的全光互连数据中心网络系统及数据通信方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105162721B (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105743580A (zh) * | 2016-02-16 | 2016-07-06 | 江苏鼎云信息科技有限公司 | 一种基于多个阵列波导光栅的数据中心内部网络互连结构 |
CN105959163A (zh) * | 2016-07-12 | 2016-09-21 | 重庆大学 | 一种基于软件定义的无源光互连网络结构及数据通信方法 |
CN106254969A (zh) * | 2016-08-08 | 2016-12-21 | 西安电子科技大学 | 快速光交换条件下的时隙分配方法 |
CN106304308A (zh) * | 2016-09-19 | 2017-01-04 | 南京邮电大学 | 一种多业务并存系统中云业务能耗优化调度方法 |
CN106941633A (zh) * | 2017-02-20 | 2017-07-11 | 武汉邮电科学研究院 | 基于sdn的全光交换数据中心网络控制系统及其实现方法 |
WO2017167231A1 (en) * | 2016-04-01 | 2017-10-05 | The Hong Kong University Of Science And Technology | Integrated high-radix non-blocking optical switching fabric |
CN107317631A (zh) * | 2016-03-28 | 2017-11-03 | 迈络思科技有限公司 | 冗余和可重构光收发器 |
CN107343231A (zh) * | 2017-09-04 | 2017-11-10 | 南京曦光信息科技有限公司 | 非对称缓存与转发模块及由其组成的分组交换节点及网络 |
CN110098972A (zh) * | 2018-06-11 | 2019-08-06 | 电子科技大学 | 一种测量节点放置和探测路径规划的启发式方法 |
CN110121868A (zh) * | 2017-01-02 | 2019-08-13 | 微软技术许可有限责任公司 | 通过被配置为加速服务的加速组件的消息传输 |
CN110582032A (zh) * | 2018-06-11 | 2019-12-17 | 台达电子工业股份有限公司 | 智能定义光隧道网络系统与网络系统控制方法 |
CN111865472A (zh) * | 2020-07-29 | 2020-10-30 | 浙江大学 | 一种用于数据中心的无缓冲光互连架构和方法 |
US10958717B2 (en) | 2017-01-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Hardware implemented load balancing |
CN113709606A (zh) * | 2021-08-31 | 2021-11-26 | 山东大学 | 一种面向弹性光网络的灵活可重构光交换节点系统以及工作方法 |
CN115550281A (zh) * | 2022-11-30 | 2022-12-30 | 广州地铁设计研究院股份有限公司 | 一种面向awgr光交换数据中心网络的资源调度方法及架构 |
CN108092807B (zh) * | 2017-12-12 | 2023-04-18 | 长春理工大学 | 一种立体化多路径数据中心网络拓扑结构及构建方法 |
CN117093161A (zh) * | 2023-10-19 | 2023-11-21 | 之江实验室 | 一种基于光收发芯片的内存管理系统、方法、介质及设备 |
WO2023245829A1 (zh) * | 2022-06-21 | 2023-12-28 | 苏州大学 | 数据中心光互连系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103441942A (zh) * | 2013-08-26 | 2013-12-11 | 重庆大学 | 基于软件定义的数据中心网络系统及数据通信方法 |
WO2014076565A1 (en) * | 2012-11-14 | 2014-05-22 | Alcatel Lucent | Remote node device, optical network unit and system and communication method thereof |
CN104320270A (zh) * | 2014-10-08 | 2015-01-28 | 武汉邮电科学研究院 | 一种基于sdn架构的弹性光网络控制系统及方法 |
-
2015
- 2015-07-31 CN CN201510466089.5A patent/CN105162721B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014076565A1 (en) * | 2012-11-14 | 2014-05-22 | Alcatel Lucent | Remote node device, optical network unit and system and communication method thereof |
CN103441942A (zh) * | 2013-08-26 | 2013-12-11 | 重庆大学 | 基于软件定义的数据中心网络系统及数据通信方法 |
CN104320270A (zh) * | 2014-10-08 | 2015-01-28 | 武汉邮电科学研究院 | 一种基于sdn架构的弹性光网络控制系统及方法 |
Non-Patent Citations (1)
Title |
---|
蔡岳平等: "《基于AWGR的光电混合数据中心网络架构设计》", 《计算机科学与探索》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105743580B (zh) * | 2016-02-16 | 2018-07-06 | 江苏鼎云信息科技有限公司 | 一种基于多个阵列波导光栅的数据中心内部网络互连结构 |
CN105743580A (zh) * | 2016-02-16 | 2016-07-06 | 江苏鼎云信息科技有限公司 | 一种基于多个阵列波导光栅的数据中心内部网络互连结构 |
CN107317631B (zh) * | 2016-03-28 | 2021-04-27 | 迈络思科技有限公司 | 光电连接器和用于通过该光电连接器传输一个或多个数据链的方法 |
CN107317631A (zh) * | 2016-03-28 | 2017-11-03 | 迈络思科技有限公司 | 冗余和可重构光收发器 |
CN108886403A (zh) * | 2016-04-01 | 2018-11-23 | 香港科技大学 | 集成高基数非阻塞光交换结构 |
WO2017167231A1 (en) * | 2016-04-01 | 2017-10-05 | The Hong Kong University Of Science And Technology | Integrated high-radix non-blocking optical switching fabric |
US10911844B2 (en) | 2016-04-01 | 2021-02-02 | The Hong Kong University Of Science And Technology | Integrated high-radix non-blocking optical switching fabric |
CN108886403B (zh) * | 2016-04-01 | 2022-03-18 | 香港科技大学 | 集成高基数非阻塞光交换结构 |
CN105959163A (zh) * | 2016-07-12 | 2016-09-21 | 重庆大学 | 一种基于软件定义的无源光互连网络结构及数据通信方法 |
CN106254969A (zh) * | 2016-08-08 | 2016-12-21 | 西安电子科技大学 | 快速光交换条件下的时隙分配方法 |
CN106254969B (zh) * | 2016-08-08 | 2019-06-18 | 西安电子科技大学 | 快速光交换条件下的时隙分配方法 |
CN106304308A (zh) * | 2016-09-19 | 2017-01-04 | 南京邮电大学 | 一种多业务并存系统中云业务能耗优化调度方法 |
CN106304308B (zh) * | 2016-09-19 | 2019-06-28 | 南京邮电大学 | 一种多业务并存系统中云业务能耗优化调度方法 |
CN110121868B (zh) * | 2017-01-02 | 2021-06-18 | 微软技术许可有限责任公司 | 通过被配置为加速服务的加速组件的消息传输 |
CN110121868A (zh) * | 2017-01-02 | 2019-08-13 | 微软技术许可有限责任公司 | 通过被配置为加速服务的加速组件的消息传输 |
US10958717B2 (en) | 2017-01-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Hardware implemented load balancing |
CN106941633A (zh) * | 2017-02-20 | 2017-07-11 | 武汉邮电科学研究院 | 基于sdn的全光交换数据中心网络控制系统及其实现方法 |
CN107343231A (zh) * | 2017-09-04 | 2017-11-10 | 南京曦光信息科技有限公司 | 非对称缓存与转发模块及由其组成的分组交换节点及网络 |
CN108092807B (zh) * | 2017-12-12 | 2023-04-18 | 长春理工大学 | 一种立体化多路径数据中心网络拓扑结构及构建方法 |
CN110582032A (zh) * | 2018-06-11 | 2019-12-17 | 台达电子工业股份有限公司 | 智能定义光隧道网络系统与网络系统控制方法 |
CN110098972B (zh) * | 2018-06-11 | 2021-02-09 | 电子科技大学 | 一种测量节点放置和探测路径规划的启发式方法 |
CN110582032B (zh) * | 2018-06-11 | 2022-03-11 | 台达电子工业股份有限公司 | 智能定义光隧道网络系统与网络系统控制方法 |
CN110098972A (zh) * | 2018-06-11 | 2019-08-06 | 电子科技大学 | 一种测量节点放置和探测路径规划的启发式方法 |
CN111865472A (zh) * | 2020-07-29 | 2020-10-30 | 浙江大学 | 一种用于数据中心的无缓冲光互连架构和方法 |
CN113709606A (zh) * | 2021-08-31 | 2021-11-26 | 山东大学 | 一种面向弹性光网络的灵活可重构光交换节点系统以及工作方法 |
CN113709606B (zh) * | 2021-08-31 | 2022-07-12 | 山东大学 | 一种面向弹性光网络的灵活可重构光交换节点系统以及工作方法 |
WO2023245829A1 (zh) * | 2022-06-21 | 2023-12-28 | 苏州大学 | 数据中心光互连系统及方法 |
CN115550281A (zh) * | 2022-11-30 | 2022-12-30 | 广州地铁设计研究院股份有限公司 | 一种面向awgr光交换数据中心网络的资源调度方法及架构 |
CN117093161A (zh) * | 2023-10-19 | 2023-11-21 | 之江实验室 | 一种基于光收发芯片的内存管理系统、方法、介质及设备 |
CN117093161B (zh) * | 2023-10-19 | 2024-01-26 | 之江实验室 | 一种基于光收发芯片的内存管理系统、方法、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105162721B (zh) | 2018-02-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105162721A (zh) | 基于软件定义网络的全光互连数据中心网络系统及数据通信方法 | |
Saridis et al. | Lightness: A function-virtualizable software defined data center network with all-optical circuit/packet switching | |
CN103441942B (zh) | 基于软件定义的数据中心网络系统及数据通信方法 | |
Lu et al. | Flexible and scalable optical interconnects for data centers: Trends and challenges | |
Kachris et al. | Optical interconnection networks in data centers: recent trends and future challenges | |
Bakopoulos et al. | NEPHELE: An end-to-end scalable and dynamically reconfigurable optical architecture for application-aware SDN cloud data centers | |
US9654852B2 (en) | Scalable hybrid packet/circuit switching network architecture | |
US11791926B2 (en) | Efficiently interconnecting a plurality of computing nodes to form a circuit-switched network | |
Christodoulopoulos et al. | Performance evaluation of a hybrid optical/electrical interconnect | |
KR20150003353A (ko) | 광 회선 단말 장치 및 그 구현 방법 | |
CN106941633B (zh) | 基于sdn的全光交换数据中心网络控制系统及其实现方法 | |
Kamchevska et al. | Experimental demonstration of multidimensional switching nodes for all-optical data center networks | |
WO2015081164A1 (en) | Hybrid electro-optical distributed software-defined data center architecture | |
CN103716721B (zh) | 向分组光网络的目的地节点提供外部光数据分组的方法和系统 | |
Zheng et al. | Dual MAC based hierarchical optical access network for hyperscale data centers | |
CN104883224A (zh) | 构建数据中心交换网络的方法及节点装置 | |
Li et al. | All optical service network for F5G | |
CN105959163A (zh) | 一种基于软件定义的无源光互连网络结构及数据通信方法 | |
CN106209294A (zh) | 一种高扩展的数据中心全光互连网络系统及通信方法 | |
Rofoee et al. | Griffin: Programmable optical datacenter with SDN enabled function planning and virtualisation | |
WO2013159501A1 (zh) | 用于多个服务器间的数据传输系统、数据接口装置及数据传输方法 | |
Shu et al. | Programmable OPS/OCS hybrid data centre network | |
CN108683961A (zh) | 一种基于波长选择开关的数据中心机架内光互连网络 | |
Kong et al. | Hybrid OCS/OBS interconnect in intra-data-center network | |
Xie et al. | Mode transformation and united control mechanism supporting wavelength division multiplexing Ethernet passive optical network and orthogonal frequency division multiplexing passive optical network in multi‐subsystem‐based virtual passive optical network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180227 |
|
CF01 | Termination of patent right due to non-payment of annual fee |