CN106797270A - 光子交换中用于换向的系统和方法 - Google Patents
光子交换中用于换向的系统和方法 Download PDFInfo
- Publication number
- CN106797270A CN106797270A CN201580054550.4A CN201580054550A CN106797270A CN 106797270 A CN106797270 A CN 106797270A CN 201580054550 A CN201580054550 A CN 201580054550A CN 106797270 A CN106797270 A CN 106797270A
- Authority
- CN
- China
- Prior art keywords
- interchanger
- commutator
- port number
- photonic switching
- high port
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0039—Electrical control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0045—Synchronisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/005—Arbitration and scheduling
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Optical Communication System (AREA)
Abstract
在一个实施例中,光子交换结构包括被配置为接收包括多个容器化光子分组的光子帧流的输入光子换向器交换机,以及与该输入光子换向器交换机耦连的第一高端口数光子交换机。该光子交换结构还包括与该输入光子换向器交换机耦连的第二高端口数光子交换机,其中输入光子换向器交换机被配置为将光子帧路由至第一高端口数光子交换机或第二高端口数光子交换机,以及与第一高端口数光子交换机和第二高端口数光子交换机耦连的输出光子换向器交换机,其中该输出光子换向器交换机被配置为输出交换后的光子帧。
Description
本申请要求于2014年10月7日提交的名为“光子交换中用于换向的系统和方法”的美国非临时申请号14/508676的权益,该申请在此通过引用并入本文。
技术领域
本发明涉及一种用于通信的系统和方法,并且具体地,涉及用于光子网络的系统和方法。
背景技术
数据中心路由大量的数据。目前,数据中心可以有每秒5-7兆兆字节的吞吐量,预期在未来会急剧增加。数据中心包含巨大数量的服务器机柜(rack)、存储设备机柜和其他机柜,所有这些机柜经由大规模集中化分组交换资源互相连接。数据中心中,电分组交换机被用来路由这些数据中心中的所有数据分组,而不考虑分组属性。
服务器、存储设备以及输入-输出功能的机柜包含柜顶式(TOR)分组交换机,这些柜顶式分组交换机将来自与分组流相关联的服务器和/或其他外围设备的分组流合并入路由至电分组交换核心交换机资源的每个TOR交换机较少数量的极高速流中。TOR交换机从该资源接收返回的交换后的流并将它们分布至它们机柜内的服务器。从每个TOR交换机至核心交换资源有4×40Gb/s个流,和相同数量的返回流。每个机柜有一个TOR交换机,该TOR交换机有几百个至成千上万个机柜,因此在数据中心中就有几百个至成千上万个TOR交换机。数据中心性能现已大幅增长,致使出现了大量的电子分组交换结构。
这些电子交换结构设计起来有问题,会消耗大量的功率,并且吞吐量有限。光子交换消耗的功率较少,吞吐量高,具有不同的性能和不同的构造。
发明内容
光子交换结构的一个实施例包括被配置为包括多个容器化(containerized)的光子分组的光子帧流的输入光子换向器交换机,以及与该输入光子换向器交换机耦连的第一高端口数光子交换机。该光子交换结构还包括与该输入光子换向交换机耦连的第二高端口数光子交换机,其中输入光子换向器交换机被配置为将光子帧路由至第一高端口数光子交换机或第二高端口数光子交换机,以及与第一高端口数光子交换机和第二高端口数光子交换机耦连的输出光子换向器交换机,其中该输出光子换向器交换机被配置为输出交换后的光子帧。
光子分组交换的一个实施例方法包括在第一时间段期间切换(toggle)第一光学换向器交换机,以及接收光子分组流的第一分组。该方法还包括将第一分组导向第一高端口数光子交换机以及由第一高端口数光子交换机对第一分组进行交换,以在第二时间段期间产生第一交换后光子分组,其中第二时间段在第一时间段之后。此外,该方法包括在第二时间段期间启动第二高端口数光子交换机。
控制光子交换结构(fabic)的一个实施例方法包括在第一时间段期间切换输入换向器交换机并且在第一时间段期间切换输出换向器交换机。该方法还包括在第二时间段期间由第一控制模块确定用于光子交换结构的第一连接映射,其中第二时间段在第一时间段之后,以及在第二时间段期间由第二控制模块向光子交换结构发送第一连接映射。
前述内容已经相当广泛地概括了本发明实施例的特征,以便更好地理解随后对本发明的详细说明。其他特征和本发明实施例的优点将在下文描述,其形成了本发明的权利要求的主题。本领域技术人员应理解,所公开的概念和具体实施例可以容易地用作修改或设计用于执行与本发明目的相同的其他结构或过程的基础。本领域技术人员应意识到,这样的等效构造并不脱离如所附权利要求所述的本发明的精神和范围。
附图说明
为了更完整地理解本发明及其优点,现在结合附图参考如下描述,其中:
图1示出了使用换向(commutation)的光子分组交换的实施例系统;
图2示出了使用换向和不使用换向的光子分组交换的计时图;
图3示出了用于光子分组交换的示例的换向的控制系统;
图4示出了利用光子分组交换机和电子分组交换机用于光子分组交换的实施例系统;
图5A-5B示出了使用管线控制的实施例光子分组交换机;
图6示出了用于换向的光子分组交换的实施例系统;
图7示出了容量和时钟加速度与启动时间和偏差时间的图表;
图8示出了两个高端口数交换机之间使用换向的用于光子分组交换的实施例系统;
图9示出了三个高端口数交换机之间使用换向的用于光子分组交换的实施例系统;
图10示出了四个高端口数交换机之间使用换向的用于光子分组交换的实施例系统;
图11示出了用于补偿停止服务的高端口数交换机的光子分组交换的实施例系统;
图12示出了马赫曾德(Mach Zehnder)干涉仪;
图13示出了贝奈斯(Benes)交换机;
图14示出了实施例固态光子交换机;
图15示出了实施例固态光子交换机;
图16示出了使用换向的光子分组交换的另一个系统;
图17示出了使用换向的光子分组交换的时序图;
图18示出了实施例三级光子交换机;
图19示出了用于光子交换的实施例机柜配置;
图20A-20B示出了用于光子分组交换的实施例卡;
图21示出了使用换向的用于光子分组交换的附加实施例系统;
图22示出了使用相位控制和换向的用于光子分组交换的实施例系统;
图23示出了使用相位控制和换向的用于光子分组交换的另一个实施例系统;
图24A-24B示出了用于光子分组交换的对于控制换向的实施例系统和控制时序图;
图25A-25B示出了用于光子分组交换的对于换向后控制的实施例系统和具有在控制系统之间传递的消息的控制时序图;
图26示出了使用换向的光子分组交换的实施例方法的流程图;以及
图27示出了使用换向的控制光子分组交换机的实施例方法的流程图。
不同附图中相应的数字和符号通常指相应的部件,除非另有说明。所绘附图清楚地示出了实施例的相关方面,无需按比例绘制。
具体实施方式
虽然下文提供了一个或多个实施例的说明性实施方式,但是所公开的系统和方法可以使用无论是目前已知的或现有的多种技术来实施,这是在开始就应该了解的。所公开内容决不限于下文示出的说明性实施方式、附图,和技术,包括文中说明和描述的示例性设计和实施方式,可以在所附权利要求的范围连同等效物的完整范围内修改。对数据吞吐量和系统和/或设备容量、设备个数等的参考仅仅是说明性的,且绝不意味着是对文中所要求的实施例的可扩充性和性能的限制。
在一个实施例中,存在一种混合光子/电子分组交换机,基于将分组流分裂成长分组的较高带宽流和短分组的较低带宽流。长分组可以被填充至恒定长度,并且被具有极高帧速率的高吞吐量光子同步电路交换机交换。短分组在电子分组交换机中被交换。用此方法,80-95%的带宽以光子交换,剩余5-20%以电子交换。由于多数带宽经过光子交换机,此分裂导致电子节点的吞吐量带宽容量的整体节点容量达到了可相比的全电子节点的容量的5-20倍。同步光子电路交换机中每条路径每帧具有一个长容器化(containerized)的分组,100Gb/s的接口交换机,帧速率约为120ns或40Gb/s的接口交换机,帧速率约为300ns,40Gb/s时组间间隔为2.4ns或100Gb/s时组间间隔为1ns。
虽然在通信中光子交换具有吸引力,因为高端口数光子交换机可以交换大量的数据带宽,并且每端口的带宽可以很高,但是累积的交换次数和计时偏差或高端口数多级光子交换机的偏移相对较大。例如,硅波导中复杂多级载流子注入交换机的交换时间可以在低于10ns至高于30ns的范围。并且,光子交换机可能缺乏光子存储器、缓冲器或其他方式来对光子信号重新计时。
一个实施例基于非常快速的1:2和2:1交换机的线性阵列,例如具有低于1ns(sub-1ns)的交换和偏差时间的铌酸锂交换机,在两个高端口数复杂交换矩阵之间切换,比如基于硅中注入载流子光电交换机的超大规模集成(VLSI)的多级(stage)交换机,由于它们的实际尺寸而可能有高计时偏差,且可能耗费相对较长时间来交换。此实施例可有利于包含两个并联的大型交换结构的光子交换结构,其中一个高端口数交换结构启动时,另一个高端口数交换结构在高端口数交换机转变任务之前提供长分组连通性的帧。高端口数交换机可以是具有四个或更多端口的单一级或多级交换机。它可以有更多的端口,例如几百个或几千个端口,复杂的多级结构的使用为此提供了便利。此方法使用小型快速光子换向器交换机和较慢大型复杂光子交换机以产生大型快速光子交换节点。
复杂管线控制可以被用来控制光子交换机。在管线控制中,一系列控制元件执行子任务以生成用于整体控制的整体连接映射。控制元件在管线中及时将该子任务的结果切换至下个元件之前,在一个帧周期内执行子任务。然后,第一元件重复用于下一帧的子任务。控制区域中的换向被用来增加管线循环时间,从而缓和处理速度需求。换向有利于使管线步骤时间成为分组周期的倍数。由于减少了步骤至步骤的信息切换所需要的时间,所以这能够延长整体管线处理延迟和/或有利于管线元件切换之间的少数较大处理步骤的更有效使用,从而维持或缩短整体管线及其延迟。
用来缓和交换时间和结构的偏差极限的流量交换路径的换向与用来缓和步骤上时间限制的控制路径的换向可以一起使用或分别使用。
一个实施例将启动交换机的过程从通过交换机传送流量的过程中分离出来。提供了具有短分组间间隔(IPG)的长分组流的交换。缓慢启动时间高端口数交换机可以有具有换向级别(commutation level)为2的启动时间周期和具有相对短分组间间隔的交换机分组。换向级别为n时,可容许的交换启动时间为(n-1)帧。
实施例技术可以用来减少对大型分组交换机的计时(timing)限制,该大型分组交换机被用在分组被分裂成长分组和短分组的整体交换节点中。在同步光子交换机结构中,低于给定阈值的短分组以电子交换,而长分组被填充并以光子交换。
一个实施例使用具有双高端口数结构的高吞吐量光子节点,该双高端口数结构提供分组之间的快速连接启动时间。此方法有利于缓和高端口数交换结构的计时和偏差。光子交换技术与一项高速技术和一项大型端口数技术相结合。换向的管线控制系统有利于通过换向级别因素将运行的管线元件速度从交换机的帧时间中分离出来。
快速低偏差光子电路交换结构可以交换高带宽的运输路径,例如每条路径25-400Gb/s或更多,例如快速光子电路交换机中的子多路复用的100千兆以太网(GE)、100GE或子多路复用的或整个400GE的四个流之一的长分组。从控制计时的精确度和交换机光电控制的运行的实际速度上来说,整体交换结构中构成的高端口数交换机可能存在缓慢的启动时间、更高层的偏差或两者都存在。
大型复杂高端口数光子交换机可以与小型2:1和1:2快速低偏差的光子交换机相结合。这有利于被输入端的1:2快速交换机和输出端的快速2:1交换机包围的两个分离的大型交换结构(fabric)。
图1示出了具有1:2和2:1快速低偏差的光子交换机的阵列的两个高端口数光子交换机的系统200。阵列206包含换向器208,其用来接收光学分组流输入。换向器208为1×2快速光子交换机,在分组流中的分组间间隔内运行。在一个交换机运载流量的同时,另一个交换机启动,然后他们交换任务。换向器以交换后实体的帧速率被切换,比如利用他们填充至固定长度的有效荷载在容器中交换高于给定阈值的分组的长分组交换机。
因为它类似于电机中的换向,所以这个过程被称为换向。在两路换向的系统中,交换机用一半时间提供完全的连通的同时,另一个交换机正在启动以处理接下来的时间周期。然后,这两个交换机的任务互换。两个交换机之间提供完全的连通。大型多级结构的启动时间对通过的流量是不可见的。
阵列206将输入的光子分组导向高端口数交换机202或高端口数交换机214。一个高端口数交换机正在交换给定帧的分组的同时,另一高端口数交换机正在启动以交换下一帧的输入分组。
交换后的光子分组被发送至阵列220,该阵列220包含换向器交换机212,2:1快速光子交换机。换向器交换机212交替地将交换机202和214连接至整体交换机节点的输出端口,以帧速率来交替来产生连续的输出。因此,交换后的光子分组通过换向器交换机212输出为连续的流。
控制系统226协调光子交换机中的控制。控制系统226生成用于各种光子交换级的控制信号,例如,用于高端口数交换机和换向器交换机中的第一级、第二级和第三级。此控制信号以计算的连接映射的形式用于分组连接的每一帧,其中该帧连接映射被送至正确的大型多级交换机结构。
信号经由阵列220发送至高端口数交换机交换,此阵列220包含电换向器交换机222,其将控制信号路由至适当的高端口数交换机。它们与流量换向器切换同步交替地发送用于高端口数交换机202的连接映射204或用于高端口数交换机214的连接映射216。
同步块218每个时隙同步一个换向步骤。
流量路径上通过两个结构的光速传播偏差被设置在分组间间隔(IPG)内。精心选择布线长度有利于恰当的计时,因为光在光纤中传播大约8英寸(20cm)所花费的时间是1ns。传播偏差被定义为通过整体交换机结构沿着各种路径的延迟的变化,并且该传播偏差对输出IPG的布局进行调整。当使用换向时,多级交换结构有一个时隙,例如,120ns或300ns的控制偏差和启动时间,而不是1-2.5ns的IPG。此外,在一定范围(例如2-10倍)内通过加速分组时钟可以对该IPG进行修改。
在具有100Gb/s分组流的一个实施例未换向的长分组交换机中,交换帧,长分组持续的周期,大约为120ns,而启动时间加偏差时间是5-30ns。在换向的结构中,当快速启动1:2交换机的启动时间和偏差时间少于1ns时,高端口数交换机的启动时间可以增加至大约118ns,而不会对用于具有100Gb/s标称比特率流的长分组的整体光子交换结构的吞吐量产生负面影响。
图2示出了用于未换向的和换向的光子交换机的时序图640。交换机的帧周期是流量分组加IPG的持续时间。在40GE中,帧周期约为1500字节长分组的300ns加IPG的2.5ns,在100GE中,帧周期约为1500字节长分组的120ns加IPG的2ns,以及对于400GE,帧周期约为1500字节长分组的30ns加IPG的0.25ns。
不换向时,总启动时间示出为轨迹642,计时偏差示出为轨迹644,以及合成结构启动时间示出为轨迹646。结构在IPG期间启动,因为启动开始之前先前分组的尾端经过,下一分组的前沿到达之前该启动完成。这对实际光子相交点的启动时间加对那些相交点的电子控制的计时效果(控制计时偏差)提出了要求。总启动时间包括计时偏差和容差以及用于光子交换结构的合成实际启动时间。在一个80:20的分裂中,其中20%的计时预算被分配给偏差,80%被分配给交换机启动时间,40GE时,交换机在2ns内启动,100GE时800ps内启动,400GE时200ps内启动。
换向时,交换机A的总启动时间示出为轨迹648,交换机B的总启动时间示出为轨迹650,计时偏差示出为曲线652,交换机A的合成结构启动时间示出为轨迹654,以及交换机B的合成结构启动时间示出为轨迹656。交换机A和交换机B作为高端口数交换机,基于先前启动和正在启动在现有的连接路径之间进行切换,其中交换机A与交换机B反相切换。高端口数交换机的计时偏差可以进入或退出换向元件,而大型交换机的周期等于用于启动或连通的流量分组持续时间。这导致大型交换机的计时偏差在100GE和40GE时分别约为1ns或2.5ns,没有分组加速,也没有适度加速后的系统在100GE或40GE时分别约为5ns或12ns,在两种情况中加速度大约为3.5%。在100GE时,提供了交替的120ns分组周期。由于路径长度可变,经过交换机的传播偏差可以得以处理,所以来自不同源的分组在交换机的输出级(在非换向的交换机中)处或输出换向器(在换向的交换机中)处被适当地交错。例如,光程尽可能接近相等的延迟。传播平均值由通过交换机的平均传播时间延迟的输出换向器计时进行处理。
高端口数光子交换机的光子输入和光子输出的换向交换在IPG周期内由快速1:2和2:1交换机的阵列的定期循环切换计时。速度为约0.1ns至约0.5ns的快速1:2和2:1光子交换机由铌酸锂(LiNbO3)制成。因此,光子交换结构包含大型缓慢光子交换机和小型快速光子交换机,以构建大型快速光子交换结构。
换向也在控制系统中用于同步的光子电路交换结构。多个控制系统,例如管线控制系统,以循环的方式在分组流的连续时隙上运行。该交换机在每个时隙被完全重启,不依赖于先前的或先已存在的连接。因此,控制信息不从时隙传送至时隙。在一些实施例中,信息可以在换向相位间传送。
两路换向(two way commutation)时,一个控制器或控制管线处理1、3、5、7、9等分组的连通数据,而另一控制器或控制管线处理帧0、2、4、6、8的连通数据,使处理步骤窗口从一个分组时隙增加到两个分组时隙。例如,对于40Gb/s的流,处理时间从300ns增加至600ns,对于100Gb/s的流,处理时间或管线控制器每步骤的处理时间从120ns增加至240ns。
图3示出了具有换向的控制结构的交换系统231。控制结构231的左边部分示出了应用于控制结构的两路换向,这使得用于管线控制系统的每级的控制系统的可用循环时间加倍,并且通过呈现仅一半的连接信息使处理速率减半。当控制系统240正在接收并开始处理通过换向器239来自控制输入并由交换机244输出的信息时,控制系统242正在完成处理。然后,控制系统242将处理后的信息通过交换机244输出至高端口数交换机234。交换机239和244进行切换,并且当有新信息从控制输入流向控制系统242时,重复该过程,同时控制系统240完成其来自先前周期的信息的处理并将其输出至控制高端口数交换机234。因此,进入控制输入的控制信息被接收和处理,且交换机始终处于控制状态,但负载被时间切成两个控制系统,每个处理以一半的速率完成。当控制系统为管线控制系统时,例如具有管线元件248的管线控制246,多个处理级和信息依次从一级递送至另一级,以便用于处理的新信息进入管线级1,并且使级之间的切换间的周期加倍。光子分组流在到达高端口数交换机234之前在延迟器232中等待以便说明处理时间。计时块236控制交换机以使计时同步。
在另一实施例中,可以有更高等级的换向。例如,可以有3、4、5,或更多等级的换向。例如,8路控制换向使用在一个八分组时隙处理步骤上运行的八个并联的处理管线,例如40Gb/s分组流为2.4μs,100Gb/s分组流为960ns,400Gb/s分组流为240ns。处理流1处理帧1、9、17、25、33……,处理流2处理帧2、10、18、26、34……,处理流3处理帧3、11、19、27、35……,处理流4处理帧4、12、20、28、36……,处理流5处理帧5、13、21、29、37……,处理流6处理帧6、14、22、30、38……,处理流7处理帧7、15、23、31、39……,以及处理流8处理帧8、16、24、32、40……。
控制结构231的右侧示出了第四等级控制换向。控制系统260、262、264和266以依次偏移的方式通过输入换向器250处理来自计时块252的控制输入并将控制信息通过交换机258输出至高端口数交换机256。延迟器254延迟分组流。控制系统可各自包含管线控制。
根据所使用的材料,存在多种固态光子交换机。磷化铟和镓-铟-砷-磷化物具有良好的光学属性,但对于按比例增至非常大型的结构来说是有问题的。硅的有利光学属性相对于磷化铟和镓-铟-砷-磷化物稍微有点少,但仍具有良好的光学属性,特别是在1300nm至1550nm范围内,而且可以容易地按比例提供复杂的功能。电气工业中关于处理硅的重要知识可以用在制造硅光子交换结构中。热光硅交换机相对缓慢,具有子毫秒交换次数。利用载流子注入技术以改变波导属性的光电硅交换机提供更快的交换次数,驱动偏差和传播延迟以及偏差效果加起来低至2-5ns。在大型多级交换机中,整体交换时间和偏差可以约为10–30+ns。具有非常快速交换次数的铌酸锂(LiNbO3),例如亚纳秒交换次数,可用于构建简单且非常快速的交换机,例如1:2或2:1交换机的小型阵列。也可以使用多种其他材料。
图4示出了用于路由分组流的系统140,例如在数据中心中。2013年5月24日申请的序列号为13/902008、本申请通过引用结合的题为“用于操纵分组流的系统和方法”的美国专利申请中进一步讨论了用于路由分组流的系统。最初,将来自机柜102中的柜顶式(TOR)交换机104的分组流被馈送至分组颗粒流分流器146中的缓冲器148的同时,读取分组地址和长度特征模块142确定分组的分组地址和长度。将分组地址和长度被馈送至统计采集模块144,该统计采集模块114采集统计以发送至控制单元130。控制单元130采集用于非实时使用的分组长度的混合的统计。交换机控制处理器和连接请求处理器154在分组颗粒流分流器146内处理实时逐分组过程,该分组颗粒流分流器146基于测量的或检测的分组特性例如分组长度将独立的分组转移至一条路径或另一条路径中。
当分组地址和长度被读取时,缓冲器148存储分组。并且,该分组地址和长度特征被馈送至读取分组地址和长度特征模块142和至交换机控制处理器和连接请求处理器154。交换机控制处理器和连接请求处理器154的输出被馈送至交换机150以使该开光将分组交换到两条路径之一中,这取决于路由度量。分组被输送至交换机150,这是由从交换机控制处理器和连接请求处理器154的输出设置的,因此分组会被路由至光子交换结构112或至电分组交换结构116。例如,该路由是基于由交换机控制处理器和连接请求处理器154来确定分组长度是否超过或不超过一组分组长度或其他阈值。交换机150将分组路由至光子交换结构112或至电分组交换结构116,例如基于分组的长度。交换机150可以是一个简单的交换机。如果分组被路由至光子交换结构112,它就被传送至缓冲器和延迟器152、加速器147,然后至光子交换结构112。由于缺少光子缓冲或存储,缓冲器和延迟器152存储分组直到光子交换结构112的适当的目的地端口变为可用。缓冲器和延迟器147也填充分组至恒定长度和/或将容器封装应用于分组。加速器147加速路由至光子交换结构112的分组流的时钟速率,以增加IPG。
另一方面,如果分组被路由至电分组交换结构116,它就被传送至缓冲器156、统计复用器158,和统计解复用器160,然后至电分组交换结构116。缓冲器156在分组被发送至电分组交换机之前一直存储分组。由于送至电交换机的分组都是低于长度阈值的短分组,所以它们在整体带宽的约5%至20%之间表示,这取决于长/段阈值的设置,并且流量带宽的大约80%-95%以光子交换,以约5至20的倍数对节点的电子交换的带宽需求进行减装载。来自多个分组流的分组可以被统计复用器158统计复用,所以可以更充分地利用电分组交换结构116的端口。然后,将合成复用的流量馈送至一连串并联的数据缓冲器之前,统计复用器160对低占用数据流进行进一步统计复用。
光子交换结构112是由多个固态光子交换级构建的多级固态光子交换结构,每个固态光子交换级都是非阻塞单一级交换机,例如相交点矩阵,其可以直接或简单地在级(stage)这一级别上定址。电分组交换结构116是电分组结构,其可以被设计用于交换短分组。电分组交换结构116可以使用统计解复用器160接收分组,并且可以使用统计解复用器164将已经交换后的分组统计地解复用成流入独立的组合器120的流。然后分组进一步被组合器120中的统计解复用器174解复用成独立的分组流。电分组交换结构116可以包括用于电分组交换机和缓冲器162的以任何常规方式响应分组路由信息的处理功能,缓冲器162可以包括缓冲器阵列。
来自光子交换结构112和电分组交换结构116的交换的分组被馈送至组合两个交换的分组流的组合器120。组合器120包含分组颗粒组合器和定序器166。光子分组流被馈送至减速器167,在此处分组的时钟速度被减速,从而减少了分组间间隔。在一个例子中,减速后的分组有着与加速前的分组相同的时钟速率和分组间间隔。然后,光子分组流被馈送至缓冲器172进行储存的同时,地址和序列被分组地址和序列读取器168读取,这确定了光子分组的目的地地址和序列号。光子分组流还被馈送至统计解复用器174以被统计地解复用以及至并联缓冲器176以存储的同时,其特征由分组地址和序列读取器168确定。然后,基于组合来自序列中两条路径的分组,分组地址和序列读取器168确定序列以读取来自缓冲器172和缓冲器176的分组,来恢复组合的短加长分组流的分组的连续序列编号。这可包括从给定源TOR流向给定目的地TOR的分组,所以各流中短分组和长分组的组合以每个流正确的序列被读取出。接着,分组定序控制单元170在它们自己的流中以它们原始的序列释放每个流中的分组,它们自己的流与来自其他源的其他流相组合,每个流在其自己的流中也有正确的分组序列。由于分组序列控制单元170释放了分组,所以这些分组利用交换机178,例如一个简单的交换机,组合起来。在一个例子中,分离器106和组合器120在单一模块中被执行。可选地,分离器106和组合器120可以分别被执行。分离器160可以在TOR交换机104中被集成,并且组合器120可以在TOR交换机128中被执行。TOR交换机104在机柜102中,TOR交换机128在机柜126中。
光子分组交换机可以在数据中心中被用作核心交换机。在光子分组交换机中,分组由光子设备交换,无需将他们转化为电信号。光子分组交换机通过独立交换每个分组将分组的流交换至其目的地。因此,光子交换结构在分组间间隔或死区期间启动用于新的目的地。对于给定水平的传输效率,分组间间隔与码率成反比。对于高速交换机,分组间间隔可以很短,致使在定址和启动光子交换机中出现困难。
图5A-图5B示出了实施例光子交换机,光子交换机460是一个大型端口数光子交换机,基于相交点阵列式波导光栅(AWG-R)CLOS结构,在被标识为源矩阵控制器的第一级控制器和被标识为组扇入控制器(group fan in controller)的第三级控制器之间执行的管线控制过程。光子交换机460在多平面结构中可以被用作一个交换平面,多平面结构中W-1个其他相同平面的每个由W-平面负载共享结构中的光子交换机460执行,以利用W个端口TOR提供高的总流量吞吐量和冗余防范交换机平面故障。可选地,在小型交换节点中光子交换机不在平面结构中使用。虽然在图5A-B中只显示了一个三级光子交换机,但在可以有多个光子交换机并联。并联交换机平面可以多达每个TOR都有高容量端口。W可以等于4、8或更多。交换结构包含第一级相交点交换机470和第三级相交点交换机474,以及AWG-R的第二级阵列472。对于80×80端口第二级AWG-R、12×24端口第一级交换机、24×12第三级交换机和构建四个平面的每TOP四个输出,这构建了3840×3840端口核心长分组交换性能,其被组织为960×960的四个象限,用于40Gb/s时整体吞吐量为153.6Tb/s,或100Gb/s时整体吞吐量为384Tb/s。在另一个例子中,每个100Gb/s流分裂成四个25Gb/s子流,且每个结构被四个并联结构替代,每个子流一个结构。在一个附加的例子中,利用80×80端口的AWG-R、16×32和32×16端口相交点交换机以及8个平面构建一个被组织为每个交换机有1280个端口的八个平面的一个10204端口核心长分组节点,如果100Gb/s馈送被单片地交换,例如利用多层编码以将符号速率降低至大约25G每秒个符号(例如正交振幅调制(QAM)-16或脉冲振幅调制(PAM)-16以适合在AWG-R的通频带内的光信号的数据边带,该10204端口核心长分组节点就需要1280×1280的八个并联交换机平面结构(W=8)。可替换地,使用每100Gb/s流4个独立的25Gb/s子流的32结构。基于该交换机且具有W=8的节点能够处理1.024Pb/s的输入端口容量。可替换地,对于z=40,相当于100GHz的光网格和55+GHz的可用带宽(通频带),并且使用16×32第一级交换机,32×16第三级交换机以及每TOR 8个端口,当使用更简单的用于100Gb/s数据流的编码时,给定8个并联负载共享的平面,给出8×(16×40)=5120×5120个端口=100Gb/s上每端口512Tb/s的容量。
TOR组464中的一组被定义为与一个特定的第一级交换模块连接的TOR和相应的第三级交换机模块,该TOR组464与单独的可调谐激光器或波长选择器466等波长灵活生成器相关联。波长选择器466选择Z个波长源462的其中一个,其中Z为AWG-R 472中的其中一个输入端口的个数。无需迅速调谐数千个灵活激光器,而是可以利用80精确波长静态源,其中它们生成的波长由本地模块处的一对Z×1个选择器交换机分布和选择。因为波长是提前已知的,所以这些交换机无需匹配分组间间隔启动时间。然而,从一波长至另一波长的变化在IPG期间发生,所以选择器交换机与快速2:1光栅串联,以便于在IPG期间发生快速倒换(changeover)。
由于一组TOR共享相同的第一级交换模块和第三级交换模块,针对组之间的连接,通过第二级组对组连接是相同的。由于根据源地址和目的地址的组部分,已经了解这个定址的部分以及由此的连通性,并且通过波长的选择来确定通过第二级的连通,所以波长的选择可以直接从给定的源组内的用于TOR的地址的目的地TOR组部分来确定。
来自TOR组464的已调光学载流子通过第一级相交点交换机470被传送,第一级相交点交换机470是X×Y交换机装置,通过管线控制过程482来改正交叉连接设置,在与第一级矩阵相关联的源矩阵控制器(SMC)和与第三级矩阵相关联的组扇入(GFC)控制器之间实际地执行。这些SMC和GFC合作为交换的每个新帧派生出连接映射,这由三级CLOS交换机执行,其包括与其他路径的设置相互依赖的自由路径分配活动。这二者都被管线及时分解到映射部分的计算的区域。这导致出现了一连串交叉连接的映射,每帧一个被馈送至每个组成的交换机模块,这些交换机模块用直接或简单的可定制能力快速地应用简单的映射。第一级从SMC 468开始被控制,也就是管线控制部分,其与管理第一级连接有关。同时,第一级输入端口连接至没有竞争的第一级输出端口,并且连接的第一级映射与连接的第三级映射匹配,以完成整体端对端连接。第一级完成连接后到适当的第二级,AWG-R 472,这是由管线控制过程确定的。第二级基于信号的波长自动地路由这些信号,所以它们出现在适当的第三级模块的输入端口第三级相交点交换机474上,其中在第三级的GFC 476的控制下它们与适当的输出端口连接。组管理器管理AWG-R第二级至第三级的适当的输出端口的输入信号的连接,并且从特定的GFC处接收的相关的SMC请求中识别出针对相同第三级输出端口的任何竞争的请求。SMC和GFC在管线过程中协作,所以SMC和GFC的部分执行导向用于帧的连接映射的过程的部分。然后,该部分经由正交映射器(图5A-图5B中未示出)在SMC/GFC共同体内将该过程的部分的结果传递(hand off)至其他资源,以管理输出端口竞争和通过交换级的内部路径启动,从而启动了非输出端口竞争的连接。正交映射器是硬件映射器,它传送从SMC至适合的GFC的信息以及从GFC至适合的SMC的信息。控制结构的其他细节包括在于2014年8月8日提交的、申请号为14455023的美国专利申请中,并且该申请通过引用并入本文。第三级相交点交换机474耦连至TOR 478。
对偏差具有迫切需求的快速帧化的光子电路交换机、交换时间对齐以及相交点启动时间的操作使用与任何其他同步固定帧化的系统共享的一个集中化的精确计时参考源。偏差是对被交换的到达数据以及交换机中来自实际路径长度的计时变化,电子和光子反应时间的变化等的计时偏移或计时误差。该计时参考源为计时块480,其通过控制计算的连接的实际启动的计时并为TOR分组分离器和缓冲器/加速器块的计时的锁定提供参考计时来为交换机级提供计时。计时块480提供包括跨多个帧进行编号的帧的位间隔、帧间隔,以及多帧间隔信号,该跨多个帧进行编号的帧分布在整个系统中以便于外部设备请求连通参考已知数据/分组和已知帧,所以正确的容器化的分组通过正确的帧的计算连接映射被交换。
图5B示出了管线控制482。沿着管线控制的步骤包括分组目的地组识别块484和设置波长块486,两者可分布至TOR位置之外或被集中化。管线控制还包括第三级输出端口冲突探测块488、跨越核心的负载平衡块490,其探测第二级端口和连接的多种用法,并且将复制的端口用法或连接移至其他第二级平面上的空闲端口,以及第一和第三级矩阵控制块500,所有这些都可以被集中化。该实现涉及通过正交映射器功能的SMC和GFC之间的合作。控制过程的每个主要步骤在一帧周期(100Gb/s为~120ns或40Gb/s为~300ns)内完成,或被分成它们自身能在一帧周期内完成的更小步骤,所以每个步骤或子步骤的资源适当地被释放用于对下一帧来做相同的计算任务。可替换为提供平台的多个并联实体以执行长步骤,每个实体执行不同帧的长步骤,然后成为后来的重用的若干帧。
在每个分组目的地组识别块484中,从源分组目的地地址的TOR组识别部分识别出目的地组。大约X个并联的分组容器地址可以有最大值,在各个若干并行流中每个输入端口有一个分组容器地址。X等于组尺寸,该组尺寸等于每个输入交换机上输入的数量,例如8、16、24或32。波长是根据SMC的波长地址映射设置的。可替换地,当TOR处于足够远离用于交换机的中央处理功能时,该波长设置可在TOR分离器处被复制。例如,如果超过波长确定点至连接映射被释放的点的处理用了G微秒,光在玻璃中的速度=2/3和c0=200,000km/sec,则返回至TOR的最大距离为200,000*G的1/2。G=2μs时,TOR在核心控制器的200米路径长度以内,G=4μs时,为400米,G=6μs时,为600米。数据中心中最大长度运行可以向上至300-500米,且可以存在用于光学载流子波长的集中化的和远程(在TOR位置)设置的位置。当在其TOR源组内的两个或更多并联输入分组有相同的目的地组和TOR地址时,分组目的地组识别块也可以探测,在这种情况下,会探测到潜在的冲突,并且两个分组中的其中一个可能会延迟一帧或几帧。可替换地,当横跨源TOR至目的地TOR的整个输出端口冲突探测过程部分在第三级冲突探测块中被处理时,该情况可以被处理,正如所示的正交相对于流而言,每个例示都会处理输出端口的子集。
由于波长所使用的信息在TOR处,并且分组目的地组识别块484的输出的其他用户都在集中化的控制器内,所以分组目的地组识别块484可以被概念地分布,封装于SMC的硬件状态机内,或者在这两个位置。分组目的地组识别块将所选的输入端口传送至连接第三级输出端口冲突探测和映射器功能的输出组,根据地址的组地址部分,该第三级输出端口冲突探测和映射器功能将来自SMC的地址传送至每个适当的GFC,以利于输出端口冲突探测过程的启动。这是因为每个GFC也和与一组及特定波长相关联的第三级模块相关联。因此,SMC计算输出的特定部分被路由至特定的GFC,以接收来自SMC的相关子集(连接至GFC的关联的TOR组和专用于该TOR组的关联的交换机结构第三级)。因此,第三级输出端口冲突探测的功能之一是将SMC数据的相同子集映射至GFC流的相同子集,此时SMC流的数量与并行GFC流(X)的数量相同。第三级输出端口冲突探测块执行的另一功能是探测两个SMC是否请求相同的第三级输出端口(相同的TOR号码或TOR组号码)。当探测到一个竞争,可随后启动其中一个竞争请求中的退避。SMC还可以沿着一些附加信息与地址一起传送,比如用于来自SMC的关联输入交换机矩阵的每个连接的主要和次要预期的第一级输出连接端口,其由SMC分配以减少在第一级中相互阻塞的可能性,因为它们独立的请求在第三级输出端口冲突探测块中被汇聚在一起。因此,那些能立即被GFC接受的请求被锁定,从而减少需要由剩余过程来解决的连接的数量。
基于被处理的帧中用于每个分组的输出识别组,分组目的地组识别块484传送波长信息以设置波长块486,该波长块486调谐本地的光源或从连续的源的中央储库中选择正确的集中化的源。在另一个例子中,波长已通过TOR中的函数进行了设置。由于波长选择发生在控制管线过程的早期,当距离TOR相对较低时,源启动时间要求可被放宽,该函数在TOR处被复制用于设置光学载流子波长。在图5B中,80个源的中央储库和两个具有用于每个光源的一连串快速2:1光栅的80:1选择器交换机向每个TOR中的光电调制器提供波长灵活光学载流子,以生成在正确的波长上交换的调制后的100Gb/s(或40Gb/s)光学载流子,以恰当地转接第二级。快速光栅可以具有大约<1ns的速度,而选择器交换机的速度慢于快速光栅,但快于分组持续时间。
第三级输出端口冲突探测块484发生在组扇入控制器476中,该组扇入控制器476已经经由正交映射器(无图)接收了来自源矩阵控制器468的与自身相关的通信。由特定的组扇入控制器处理的输出组的预期地址与特定的第三级模块相关联,因此,特定的定址TOR组被发送至该组扇入控制器。在第三级输出端口冲突探测过程中,组扇入控制器从源矩阵控制器的所有通信的输入中探测重叠输出地址请求,并批准来自与其关联的第三级中的每个输出端口的一个地址请求,拒绝其他地址请求。这是因为与每个GFC关联的第三级矩阵的每个输出端口支持每帧一个分组。被批准的分组地址被通知回原始源控制器。通知寻求竞争输出的容器化的分组的被拒绝的地址在下一帧内重试。在一个例子中,重试的分组地址优先于新分组地址。第三级输出端口冲突探测步骤将一帧中路由至任何一个输出端口的分组的最大数量减少至一个。这基本上消除了所担心的阻塞,因为对于过程的剩余部分,扩大的交换机是非阻塞的,且一旦SMC和GFC的协作确定了路径映射,所有路径都能被容纳以执行控制过程482。
在该级中,虽然输入可以连接至他们各自的输出,并通过交换机和交换机路径有足够的容量用于所有连接,但是仍要建立利用第二级的连接路径。一旦探测和解决了输出端口冲突,第一级矩阵和第三级矩阵就会有足够的容量来处理剩余的分组连接。然后,通过第二级分配连接,以通过核心提供一定程度的负载平衡,所以仅使用一次第二级输入和输出。这可以用非扩大的交换机或扩大的交换机来完成。
负载平衡跨核心块490有利于每个第一级输出使用一次,每个第三级输入使用一次,同时第一级的每个输出连接至与第三级的对应输入相同的第二级以完成连接。因此,每个第二级输出和输出只使用一次。
如果GFC不能接受主地址,从SMC至适当的GFC的初始通信还可以包括主期望第一级输出端口地址和用作次要第一级输出端口地址的附加地址。SMC提供的主第一级输出端口地址和次要第一级输出端口地址都可以转化为GFC上的特定输入端口地址,该特定输入端口地址可已被分配至另一个SMC。相对于仅使用一个主地址,两者已被分配的概率较低。这些主第一级输出端口和次要第一级输出端口被分配,使得在源SMC处的每个输出端口识别最多被使用一次,因为在1:2扩大的第一级中,每个输入端口有足够的输出端口将被唯一分配两个输出端口地址。这些期望第一级输出端口地址与期望GFC输出端口连接一起以连接请求的形式被传送至适当的GFC。虽然与GFC关联的第三级交换机模块的特定输出端口已被分配(即,整体结构输出端口拥塞)的基础上,一些连接请求会被GFC拒绝,但是输出端口连接请求的剩余部分会被接受用于连接映射,并且请求的SMC会被通知。当主第一级输出地址和次要第一级输出地址二者,以及随后的第三级输入地址已被SMC发送时,主连接请求可被授予,次要连接请求可被授予,或两者连接请求都不被授予。
在一种情况中,当连接请求被接受,主请求被授予,由第一级输出端口和随后的第三级输入端口的主选择隐含的,通过正确波长上第二级的固定的映射被转化的第三级输出端口还未被GFC分配用于正在计算的帧的GFC的第三级输入端口。然后,分配该请求,构成GFC对来自SMC的主连接路径请求的接受。该接受被输送回至相关的SMC,该相关的SMC锁定在该第一级输入端口至主输出端口连接中,且释放已被分配至潜在次要连接的第一级输出端口,因此其他连接的重试就可以重复使用。
在另一情况中,次要请求被授予,连接请求被接受,但是第一级输出端口和之后的第二级平面的主选择隐含的第三级输入端口已被GFC分配用于正在计算的帧的GFC的第三级,而第一级输出端口和之后的第二级平面以及第三级输入端口的SMC的次要选择还没被GFC分配用于正在计算的帧的GFC的第三级。在该例子中,GFC接受来自SMC的次要连接路径请求,并且SMC将该第一级输入端口至第一级输出端口连接锁定,并释放主输出端口用于在其他连接的重试中使用。
在另外一个例子中,整体连接请求被接受,由于结构输出端口是自由的,且由第一级输出端口和之后的第二级平面的主选择和次要选择均隐含的第三级输入端口已经被GFC分配用于正在计算的帧的GFC的第三级。在该例子中,GFC同时拒绝来自SMC的主连接路径请求和次要连接路径请求。这种情况在主第三级输入端口或次要第三级输入端口都不可用时发生。这导致SMC释放来自其输出端口列表的暂时保存的输出,并重试与来自其自由端口列表的其他主输出端口和次要输出端口的连接,以到达目的地第三级交换机上任何可用的输入端口。一对输出端口尝试被交换至不同的GFC以解决连接限制。
总体上,SMC响应于来自GFC的接受是为了分配第一级输入和第一级输出之间的那些连接以启动连接。尚未启动的第一级连接然后被分配至未使用的第一级输出端口,其中至少一半会保留在2:1扩大的交换机中,并且重复该过程。未使用的第一级输出端口可包括先前未分配的端口,作为主端口分配至不同GFC但未使用的端口,以及分配为次要端口但未使用的端口。同时,由于特定的主输入端口和次要输入端口的存在,当GFC对已经被使用的第三级提供拒绝反应时,附加其自身的主第三级输入端口或次要第三级输入端口,和/或附加的意见,这取决于空闲端口剩余的多少和拒接通信的数量。随着该过程的继续,空闲端口与拒绝的比率增加,就会提出更多独特的意见。这些意见通常有利于SMC直接选择一个已知可行的第一级输出路径。如果不是,则过程重复。该过程继续直到所有路径都被分配,这要经历若干个迭代。可替换地,该过程在若干个周期后超时。超时点未建立的连接可以延迟至随后的帧或分组可以被重新发送。
当负载平衡完成或超时时,SMC生成用于与其关联的第一级的连接映射,并且GFC生成用于与其关联的第三级的连接映射,该帧中的分组通过缓冲器传播并且到达快速光子电路交换机的分组交换结构时进行使用。当负载平衡完成时,负载平衡已进行得足够远,或负载平衡超时时,第一级SMC和第三级GFC分别生成用于与它们关联的第一级和第三级的连接映射。这些连接映射较小,因为映射是针对独立的第一级模块或第三级模块的,并且在分组目的地组识别操作中沿着先前生成的第一级输入端口波长映射聚集。
SMC和GFC功能可以实现为硬件逻辑和状态机或专用任务特定应用微控制器的阵列或这些技术的组合。
图6示出了系统270,具有快速高速小型换向器交换机的两个并联的大型复杂的但相对缓慢的交换机的高层视图。高端口数交换机271和272是基于光子集成电路的交换机,分别具有交换模块562和560,其体积大且复杂,但从相交点交换机、沿着光路的飞行时间延迟(生成偏差)的交换速度,和/或连接映射建立之后交换机大型阵列中的连接变化的计时来说相对缓慢,产生了控制系统计时偏差。换向器274是在高端口数交换机271和272的输入处的1:2快速光子交换机的一个阵列,而换向器273是在高端口数交换机271和272的输出处的快速2:1光子交换机的一个阵列。输入快速交换机可以被称为换向器,其交替地连接同步的输入分组至上部高端口数交换机和下部高端口数交换机。当上部交换机正在接收并路由一组分组时,下部交换机停止对下一帧的启动。当换向器逆向连接时,下一长分组被馈送至每个输入上,上部交换机停止对后面分组的启动的同时,当前分组集合路由至下部交换机。
换向也可以由控制模块276,连同电换向器交换机换向器278和279使用。控制的换向与交换机换向一起使用或作为一个独立的性能使用。控制的换向有利于多个控制管线并联,每个控制管线处理一个帧子集。主计时块564控制计时。同时,延迟模块566延迟进入换向器273的计时信号。
例如,使用系统568中所示的4路换向,一个管线处理帧1、5、9、13、17,第二管线处理帧2、6、10、14、18,第三管线处理帧3、7、11、15、19,而第四管线处理帧4、8、12、16、20,有利于内部管线结构在每步骤使用4倍的处理时间。系统568包含作为1:4换向器交换机的交换机574,和作为2:1换向器交换机的交换机572和570。换向器交换机在控制管线576、577、578和579中换向。对于40Gb/s,步骤时间从300ns增加至480ns,对于100Gb/s,步骤时间从120ns增加至480ns,其中管线的每一步骤完成其分配的任务并且为新的帧输入信息做好准备,对于400Gb/s,步骤时间从30ns增加至120ns。当控制过程在100Gb/s端口容量下执行时,没有控制换向的120ns步骤(帧)时间,可以通过将4路换向添加至该控制过程的4个例示使相同的控制过程使用400Gb/s分组流。
光子电路交换机必须在分组之间的间隔(即,分组间间隔)期间完全启动。该启动窗口包括启动相交点的实际行为(即,将电子命令传递至相交点,相交点响应命令以及偏差)、命令计时的准确性以及它们在整体复杂交换机结构的不同部分中传播时间变化,都是用于这些电子命令和以大约2/3c0流动的光信号。
图7示出的图表显示了IPG增加对光子交换结构速度、端口传输效率、以及时钟加速度水平的影响。曲线182、184和186分别表示40Gb/s、100Gb/s和400Gb/s分组流的分组运载效率与启动时间和偏差时间的比,靠左边垂直轴绘制。由于实际尺寸、不同路径长度和其他可在启动窗口的开始和结尾添加容差的因素的存在,启动时间和偏差时间是组合的时间以启动交换机连接和计时的变化。当高速GE流的IPG被修改为具有非标准较长持续时间并且不使用分组加速度时,分组运载效率是分组运载容量损失的百分比。随着长分组的流上分组间间隔的增加,分组有效负载减少,且这时该增加是分组持续时间的显著百分比,有效负载容量的减少是显著的。
在一个例子中,通过加速分组时钟速率增加IPG,而容量不会随着损耗。关于增加的IPG的更多细节在于2013年5月24日提交的序列号为13/901944、发明名称为“加速和减速分组的系统和方法”的美国专利申请中讨论,通过引用结合在本申请中。曲线188、190,和192分别表示匹配40GE有效负载、100GE有效负载和400GE有效负载的时钟加速度与用于光子电路交换机的启动时间加输入偏差的比。这些曲线表示时钟速率加速度比例n:1,以作为靠右边垂直轴绘制的增加的IPG的函数将分组运载容量恢复到原始水平。
表1表明在启动时间加偏差为10ns和30ns情况下的分组容量损失和时钟率,该表来自图7的图表。
表1
比特率高于40Gb/s时,时钟速率增加显著。
在一个交换结构例子中,复杂性从速度中分离出来,开发出两种光子交换技术——一种是优化具有适度启动时间和偏差的大型复杂交换功能,另一种是优化用于简单的重复切换的快速交换速度和非常低的偏差。在第一种技术中,可以与具有基于光电(载流子注入)马赫曾德(Mach Zehnder)交换机的这些交换单元的大量阵列一起使用基于载流子注入交换机、被集成为单一光子集成电路的硅。在马赫曾德交换机中,马赫曾德干涉仪的一个臂通过将载流子注入横跨建在该臂的p型本征的n型(pin)接头处修改其光程传播时间。通过大规模集成至大型交换机阵列建立这些交换机。在另一个例子中,GaAsInP/InP技术可以被用来产生基于半导体光放大器(SOA)的相交点芯片作为交换元件。在第二种技术中开发出了铌酸锂的超快交换性能,其缺乏可测量性,但能够在子100ps时间帧中交换。这两种技术也可用于其他例子。
这两种技术可以利用换向进行开发,其中在启动一个高端口数交换机的同时,另一个高端口数交换机与超快交换切换的两个阵列在两个高端口数交换机之间切换。图8示出了光子交换结构300,是具有交替利用高端口数大型复杂缓慢光子交换机的换向的交换结构,以提供交换路径。该交替的实现是在输入处和输出处分别使用了1:2快速光子交换机和2:1快速光子交换机的阵列,这些阵列用于在大型交换结构之间实现换向。在该结构中,两个并联的缓慢光子交换结构被优化用于大型端口数交换机和高端口数交换机316和320。高端口数交换机316和320的输入连接至换向器308和310的输出,形成交换阵列306。换向器308和310是1:2快速换向交换机。高端口数交换机316和320的输出与阵列328中的交换机330和332耦连。交换机330和332是2:1快速换向交换机。同时,换向交换机324是电换向交换机,被设置在生成并帧对帧传送连接映射的连接处理块314和将传送的帧连接映射应用至大型端口数交换机的交换机驱动器318以及322之间。交换机驱动器318和322分别驱动高端口数交换机316和320。输入314的路由信息可以直接从分组流中提取,如图8所示,或可以是如图4所示的馈送公共信令的路由信息。
换向器在高端口数交换机316和高端口数交换机320之间交替他们的连通。电换向器相对于光换向器反相运行以提供连通信息至高端口数交换机,同时它们不提供用于配置的交换的路径,并且当它们将提供交换的路径时,它们为下一帧做好准备。
在IPG的开端,光换向器在IPG周期内运行,以将流量连接至已经在前一帧期间启动的高端口数交换机316,并且将连接处理连接至高端口数交换机320。连接映射从连接处理块314下载至交换机驱动器322。基于连接映射,交换机驱动322启动高端口数交换机320。在分组容器(container)持续时间结束之前,启动实际路径,该分组容器持续时间在40GE时,可以为300ns,100GE时,可以为120ns,或400GE时,可以为30ns。在此期间,高端口数交换机316处在服务状态中并交换光子分组容器的一帧。光子分组容器被延迟器302和延迟器304延迟,以为连接处理从分组流容器头部中直接提取提供时间。对于共同的信道途径,在分离器功能微调电容器/缓冲器和加速块内考虑计时延迟。
在分组容器持续时间的尾端,当光子分组容器已被路由时,另一IPG开始。换向器由计时块312控制。延迟器326在计时块312和阵列328之间以利于通过大型结构的光子信号的平均飞行时间,所以输出换向器在被通过大型端口数交换机的吞吐量平均飞行时间延迟的点处交换,并在一个输出分组容器尾端和下一分组容器开端之间换向。光换向器和电换向器是反向的,所以新的启动高端口数交换机320被嵌入交换路径中,且高端口数交换机316连接至连接处理块314。已经被延迟器302和304处理连接所用的时间的该帧周期的分组容器现被路由至它们的目的地。同时,来自连接过程块314的连接映射被发送至交换机驱动器318,以启动高端口数交换机316。每个交换机继续循环该过程,一半时间用于提供连接,另一半时间期间用于启动。
换向的较高层次可以被用于促进更多的启动次数。三层的换向提供增至用于启动的两个帧周期,四层的换向提供增至用于启动的三个帧周期。换向可以因其他优点而设置在较高的层上。由于换向器简单,而换向的高端口数交换机复杂,相对于换向器,系统故障更可能发生在高端口数交换机中。通过拥有附加的高端口数交换机,换向器既可作为换向器还可提供保护防止故障发生。例如,在具有30-60ns启动时间光子交换结构的400GE交换机中,可以使用具有三个高端口数交换机的3路换向器。当单一高端口数交换机在这三路换向的交换机上发生故障时,整个节点可能会出现故障。而具有四个高端口数交换机中,当时只有其中三个在实际运行,当任何高端口数交换机发生故障时,换向器的排序被改变,所以节点继续与剩下的三个高端口数交换机一同运行。
图9示出了用于三路换向的系统340。系统340包含具有对应交换机驱动器356、360和375的高端口数交换机354、358和374。具有三路快速交换机348和350的换向器364将输入连接至被延迟器342和344延迟的光子分组流。高端口数交换机354、358和374的输出与换向器362中的3:1快速光子交换机364和366耦连。连接处理块370确定连接映射。电换向交换机372可替换地将连接处理块370耦连至交换机驱动器356、交换机驱动器360、或交换机驱动器375中的其中一个,以传送适当的帧的连接映射来控制对应的高端口数交换机。通过延迟块368提供计时偏移来补偿通过交换机的平均飞行时间,计时块352控制换向交换机的定相和计时。
图10示出具有四层换向的系统380。系统380包含具有对应交换机驱动388、392、396和400的高端口数交换机386、390、394和398。具有四路快速交换机383和385的阵列381将高端口数交换机的输入连接至被延迟器382和384延迟的光子分组流。高端口数交换机386、390、394和398的输出与阵列410中的4:1快速光子交换机412和414耦连。连接处理块404确定用于帧的连接映射。电换向交换机406将连接处理块404耦连至交换机驱动器388、交换机驱动器392、交换机驱动396,或交换机驱动器400中的其中一个,以通过基于帧传送帧的适当的连接映射来控制对应的高端口数交换机。通过延迟块408提供计时偏移来补偿通过交换机的平均飞行时间,计时块402控制换向交换机。也可使用更高层的换向。
图11示出系统420,其使用三路换向为使用高端口数交换机的两个快速交换机提供附加换向途径以防止交换故障。系统340中的三路换向器交换机换向器346和362为两个快速交换提供用于高端口数交换机故障的附加保护层。高端口数交换机354、358和374足够快,以在2级别的换向上运行,但是实际上用于三层换向。表2示出了在换向相位期间高端口数交换机的状态。高端口数交换机每3个周期就处在流通中,一个周期用于启动,一个周期用于重连启动。当高端口数交换机中的任何一个发生故障时,例如系统420中的高端口数交换机374发生故障时,换向器被重新安排在两个尚存的高端口数交换机高端口数交换机354和高端口数交换机358之间的两路换向上。表3表示高端口数交换机375发生故障后高端口数交换机的状态。不再使用高端口数交换机375。高端口数交换机354和高端口数交换机358交替处在流通中和启动中。
这有利于在交换机发生故障之后,维持整体交换机节点的全部容量,但在完全复制的交换机节点中有50%的设备开销而不是100%的开销。对于较高层的交换,使用较低层的开销可以实现该保护——对于4路→3路(保护活动,protection active)换向为33%,对于5路→4路(保护活动)换向为25%,等等。
相对于两路换向的使用,具有备用第三交换机和复杂的保护交换布置的三路换向利于所有三个交换机在操作期间连续使用,证实他们的功能性且避免了可替换方法的备用交换机发生“静默”故障的可能性。通过适当地重新编程换向器序列,没有实现该功能性确认的所有交换机从服务中移除。
换向相位 | 高端口数交换机354 | 高端口数交换机358 | 高端口数交换机375 |
1 | 流通 | 启动 | 重连启动 |
2 | 重连启动 | 流通 | 启动 |
3 | 启动 | 重连启动 | 流通 |
4 | 流通 | 启动 | 重连启动 |
5 | 重连启动 | 流通 | 启动 |
6 | 启动 | 重连启动 | 流通 |
表2
换向相位 | 高端口数交换机354 | 高端口数交换机358 | 高端口数交换机375 |
1 | 流通 | 启动 | 不使用 |
2 | 启动 | 流通 | 不使用 |
3 | 流通 | 启动 | 不使用 |
4 | 启动 | 流通 | 不使用 |
5 | 流通 | 启动 | 不使用 |
6 | 启动 | 流通 | 不使用 |
表3
在另一例子中,在运行中使用三个高端口数交换机的配置中,可以使用具有四层换向的四个高端口数交换机。在其他例子中,当一个高端口数交换机发生故障时,使用来自期望数量的交换机的一层、两层或更多附加层以维持运行。
具有数千个端口的高端口数交换结构可涉及与光子集成电路(PIC)中的高端口数光子交换机一同执行的大量的交换级或相对较少的交换级。可使用的一些技术,包括具有载流子注入交换的硅和基于交换的InGaAsP/InP半导体光放大器。
图12示出了马赫曾德干涉仪430,它是硅载流子注入交换机的交换元件的一个例子。入射光进入输入432或输入434,并且继续至耦合器436,一个50:50的耦合器,并在其中分裂。一半光信号与支路(leg)438耦连,一半光信号与支路440耦连。来自支路438和440的光信号被耦合器442合并,其中在输出444或输出446输出。该输出取决于支路438和支路440的相对光程长度。当光程长度相同时,或支路438和支路440之间2π的倍数的相移不同时,则存在完全的建设性干扰。然而,如果路径长度的相对相移为-π、π、3π等等时,则存在完全结构性干扰。如果光程长度是变化的,例如,通过可变移相器进入一个或两个支路中,马赫曾德干涉仪430可被用作一个光交换机。如图所示,作为p型本征的n型(pin)二极管移相器的移相器441在支路440中。移相器441可以为pin二极管移相器。将电压施加到移相器441以调节其光程长度。马赫曾德干涉仪430被集成在单一基板上,例如PIC上。该交换机在2-5ns的交换时间下可以有0.6dB的通路状态损耗和20—25dB的断路状态损耗。
这可产生一个在交换体系结构中能够被复制的2×2交换机,比如贝奈斯交换机,以产生具有大量串联交换机的16×16、16×32、32×32阵列,或更大相交点阵列。
图13示出了贝奈斯交换机450。贝奈斯交换机具有相同的行数和列数且行数和列数均为偶数。贝奈斯交换机450是建于8×8贝奈斯块454的16×16贝奈斯体系结构,而8×8贝奈斯块454反过来建于4×4贝奈斯块456。贝奈斯交换机可被用作交换模块以制造更大更复杂的交换机,例如在CLOS体系结构中将它们用作模块。
图14示出了交换机560,它是一个4×4直接可定址的相交点矩阵交换机。类似的设计可用于更大的交换机。图15示出了交换机290,对于N=8的情况,它是一个在输入光程和输出光程的行之间具有有源垂直耦合器(AVC)的固态光子交换机。交换机290可以在InP基板上的InGaAsP/InP多层中制造。这样的结构可以使用AVC以对半导体光放大器(SOA)使用类似技术提供集成放大。交换机290可以用于第一级结构、第二级结构,和/或第三级结构中的结构。交换机290可以是如图所示的非阻塞铟镓砷磷化物/磷化铟相交点阵列,可以用作直接可定址交换机模块。在另一个例子中,使用具有不同内部结构的硅固态单片集成或混合的交换机相交点阵列,例如,贝奈斯结构,它使用管线中连接处理的附加级,或直接可定址的扩大的树加选择交换机矩阵。交换机290包含输入292和输出298。如图,交换机290包含八个输入292和八个输出298,虽然它可以包含更多或更少的输入和输出,并且输入和输出的数量可以相同,但是输入少于输出或输入多于输出有利于建立扩大的交换机结构。同时,交换机290的InGaAsP/InP例子包含AVC294和无源波导296。AVC是在波导的顶部制造的几对半导体光放大器部分,它们之间有一个插入的90度完全内反射的波导角。当这些放大器断开时,没有施加的电源。由于AVC是断开的,所以它们是不透明的,并且输入光波导与它们不耦合。相反,光信号在输入波导中横跨交换机芯片水平地传播。在所需要的输出连接与输入波导交叉的相交点处,AVC被偏置且变得透明。事实上,AVC可以有正增益以抵消交换损耗。由于AVC是透明的,输入光耦合到它上,由于完全内反射的存在,进而转动拐角,并且耦合出AVC至垂直输出波导。虽然图15示出了一个N=8的交换机,但是具有较大N和/或矩形交换机、输入多于输出或输出多于输入的交换机也可以在扩大的多级交换机中被用于交换模块。
另一个光子交换材料是铌酸锂,其有助于简单功能的单一或小型阵列,比如1:2交换机或1:4交换机。然而,基于铌酸锂的交换机能在亚纳秒时间帧内交换,例如100ps或者更快。在其他材料系统中,光电硅交换机中甚至更快的交换速度和改进利于简单交换机速度的显著提高。
图16示出了使用换向用于非常高容量快速同步光子电路交换节点的系统610。具有横跨它们输入和输出的换向交换机的两个高端口数交换机用于释放启动速度限制和偏差时间限制。阵列612接收同步的输入分组流。输入分组流可以是具有P的IPG的长分组的流。阵列612中的交换机是快速1:2切换交换机,例如由铌酸锂制成。在一个例子中,交换机有大约0.1ns的交换时间和不到1ns的偏差。阵列612接收分组流同步信号。在100GE中,填充的长分组流周期可以为120ns,对应于100Gb/s时1500字节的持续时间。快速交换机维持分组帧周期的连接。然后,当它们切换回来时,它们与IPG同步地切换,并在帧周期维持切换的连接。
分组交替地被路由至高端口数交换机614和高端口数交换机618。高端口数交换机614和高端口数交换机618是基于大型多级硅的交换结构。用于高端口数多级交换机的交换时间和启动偏差小于或等于帧时间,其在100GE时大约为120ns。高端口数交换机614包含第一级628、第二级630、和第三级632,而高端口数交换机618包含第一级634、第二级636、和第三级638。在分组持续时间期间,一个高端口数交换机维持其整个帧持续时间的连接,而另一个被启动。然后,高端口数交换机交换任务。
连接映射和管线处理块620接收连接请求。根据该连接请求,连接映射管线处理块620确定用于高端口数交换机614和高端口数交换机618的连接映射。该连接映射通过电换向交换机622交替地路由至用于高端口数交换机614的连接映射616和用于高端口数交换机618的连接映射621。
换向器626输出来自高端口数交换机614和高端口数交换机618的交换的分组。换向器626由延迟器624延迟的分组帧同步控制,以补偿通过光子交换结构的平均飞行时间延迟。飞行时间的变化生成传播偏差。为了解决该问题,通过高端口数交换机的路径甚至可以被设计成全部具有相同或相似的延迟,因为能够补偿固定延迟用于计时,例如经由图16中的延迟块624。然而,传播偏差(不同路径上的延迟变化)是有问题的,由于延迟是用于特定路由的实际交换机路径的函数。匹配交换的路径长度延迟解决了该问题。换向器626中的交换机是快速2:1切换交换机,例如由铌酸锂制成。在一个例子中,交换机时间是0.1,且偏差和飞行时间偏差均小于通过在大型结构内匹配光程长度实现的纳秒,导致P=1ns。可替换地,P的小幅增加应用于小的容量损耗或小的分组时钟速率加速度。输出分组流有P的IPG。
在连接被传送至高端口数交换机614之后,其处于服务状态,在前一帧期间已经被启动,且高端口数交换机618停止服务并与控制处理连接,并接收/启动用于分组的下一帧的连接。作为输出换向器的换向器626虽然名义上与高端口数交换机614和高端口数交换机618交替地连接,同步输入换向,但是可以延迟以补偿通过光程的光子的飞行时间。光程大约每隔20cm,该延迟近似为1ns。
图2上半部分示出的是图16中所示的用于交换机的结果时序图表以及非换向的高顿口数光子交换结构。没有换向或分组加速度,100GE时IPG中的启动时间是1ns。本地连接映射应用于独立的交换矩阵,且交换矩阵在IPG期间断开先前的连接并启动新的连接。这还包括偏差的容差和计时容差,比如在先前分组末端之后的计时容差,使先前连接的断开不会在先前分组的末端之前开始,且由于分组到达时间的变化等因素,将新连接被置于新分组开端到达之前。这些容差的等级取决于多个因素,包括在每个交换机输入上分组到达时间与分组帧同步信号之间的变化,以及路径至交换机以及路径在交换机内的实际长度,因为1ns的延迟源自大约20cm的光波导。偏差可以为正的,也可以为负的,剩余较少的可用启动时间。没有IPG增大时,100GE中用于多级交换机的启动时间少于1ns。
通过换向,交换机启动时间和偏差小于流量分组持续时间加2IPG。启动时间可以与偏差进行换算。在图2下半部分中,示出了换向的方法,总偏差为1+1ns,启动时间为120ns,总共是122ns。
当交换机启动时间和返回至服务在由结构交换的下一组分组到达之前完成时,总启动时间可以以不同比例被分成交换机相交点配置启动时间和控制计时偏差。在图2的下半部分中,整个IPG被分配至光传播偏差,但大型结构控制偏差可以小于或大于IPG。该偏差应使得先前分组的部分没有因换向器运行过早而损耗,并且换向器在下一分组开始之前完成其换向交换。此外,第一结构(图2中结构A)任意一个末端处的两个偏差致使高端口数交换机614在下一组分组通过高端口数交换机614开始被路由之前被启动且返回至服务,高端口数交换机618(图2中结构B)也是如此。对于没有时钟加速度的100GE长分组流来说,1ns被分配用于峰至峰光传播偏差,120ns用于启动高端口数交换机。可以从启动时间映射一段时间以增加控制偏差预算。对于400GE,两路换向时光程偏差的值均为约0.25ns,启动时间和控制偏差均为30ns。
通过使用一些分组加速度,例如小于10%,IPG不随过度的时钟速率的增加而增加。100GE时,10%的加速度出现的偏差总共为26ns(13+13),启动时间窗口缩短至大约108ns。400GE时,对应的偏差和启动时间为:总共偏差约为6.5ns(3.25+3.25),启动时间约为27ns。
图17示出了用于换向器本身的计时图680。曲线682表示换向帧,曲线683表示分组流量,曲线684表示第一偏差,曲线686表示第二偏差,曲线688表示用于换向器交换机的交换时间,曲线690表示用于输出的同步延迟,曲线692表示高端口数交换机产生的延迟的流量,以及曲线694表示第二高端口数交换机产生的延迟的流量。
用于换向器的计时要求大约与那些不具有换向的大型交换机一样严格。然而,这些要求适用于速度和偏差被优化的小型简单交换机,而不适用于复杂的多级交换结构。在一个例子中,使用铌酸锂。由铌酸锂制作出的简单交换机可以有200ps、100ps,或更少的交换时间。当交换机驱动被适当地计时,横跨各交换机端口的偏差被定址时,这成为用于整体交换机节点的透明的交换速度性能。
如图16所示,通过换向器的光子路径馈送高端口数交换机,并基于分组接收来自高端口数交换机的分组上的交换的流量。高端口数交换机有通过它们的有限延迟,该延迟通过输入换向器的输出至输出换向器的输入的光程的长度来确定。该延迟与IPG相比可能是显著的,或明显超出IPG。因此,输出换向从输入换向开始被延迟,以说明通过高端口数交换机的飞行时间。
换向器计时偏差和交换时间在IPG内。简单的交换可以以0.1ns的交换时间实现。传播偏差是来自外围设备的分组(TOR/分离器至交换计时偏差)的传送次数的准确性和换向器(交换传播偏差)之间通过高端口数交换机的飞行时间的变化二者的函数。通过高端口数交换机的传播偏差不同于通过这些交换机的飞行时间标称的延迟,即是最大可能延迟和最小可能延迟之间的差。标称的或平均的飞行时间延迟被确定和补偿,并且可以适当地延迟输出换向帧时钟。来自高端口数交换机的偏差来自通过高端口数交换机的沿着选择的信号路径的时迟的变化。这是由通过高端口数交换机的光程长度的设计控制的。当高端口数交换机越紧凑,整体延迟和传播偏差越低,并且通过光程长度的设计,能够减小传播偏差。
在一个例子中,由两个1024×1024的三级大型交换机结构和输入1:2与输出2:1换向器的阵列构成的能承载400GE的1024×1024端口交换结构在具有换向的体系结构的单一交换平面中提供0.4Pb/s的分组交换容量。这可用于分别利用4个高速端口和8个高速端口TOR在数据中心中生成1.6Pb/s四分之一的光子交换核心或3.2Pb/s八分之一的光子交换核心。在一个例子中,利用二级中AWG-R的三级交换结构被用来与波长灵活光学载流子连接。可替换地,基于三级主动相交点交换机的交换机与固定的波长光学载流子一同被使用。相交点交换机可以安装于光学宏模块上,例如集成在Si结构上的SiO2上,其可以在硅波导或混合SOA中执行铒掺杂波导放大。铒掺杂波导放大的运行类似于铒掺杂光纤放大,是将用于放大器紧凑阵列的约10-15cm的Er掺杂SiO2波导管的增益介质的增益增至10-15dB。
图18示出了用于完全无阻塞行为的具有1:2扩大1024×1024光子交换机的结构。系统700包含32个第一级模块702,64个第二级模块704,和32个第三级模块706。第一级模块708包含1:2分离器711,32×32相交点PIC 710,980nm耦合器713,和铒掺杂波导管712。第二级模块714包含32×32相交点PIC 716,铒掺杂波导管718,以及耦合器715。第三级模块720包含32×32相交点PIC 722,1:2分离器723,以及铒掺杂波导管724。与铒掺杂光纤放大器中一样,通过应用来自适度的高功率连续波激光器的980nm泵浦光刺激铒掺杂波导管进入放大。PIC可为InGaAsP/InP或硅PIC。此外,通过用单一32×64交换机模块替换一对32×32交换机和用于每个第一级模块中的分离器,用单一64×32交换机替换两个32×32交换机和用于每个第三级交换机模块中的组合器,可以将该方法简化用于硅光电交换模块。
在一个例子中,换向内置在交换模块中的交换机中。这可以在宏模块配置中实现或以另一种方法实现。分组被第一级模块接收,该第一级模块包含换向器和高端口数交换机。换向器和两个高端口数交换机被嵌入第一级模块中。当一个高端口数模块正在启动时,另一个处于流通状态,反之亦然。在一个例子中,换向器由铌酸锂制成,且高端口数交换机是32×64端口数交换机。
在一个例子中,光子模块被安装于利用印刷电路板和机架(shelf)背板的插件电路板上。这可以用一个或多个基于光纤的柔性电路光学背板完成,该背板可以支持数千个光连接。
图19示出了基于设备机柜780的例子的实施方式,该机柜780包含双深度插入卡,这些卡前后大约200mm厚。端口卡机架782有输入端口卡/输出端口卡以及具有交换机卡的交换机卡机架784。机柜780包含具有1:2中级扩大的四机架1024×1024快速光子电路交换机,以生成基于高密度电路板的非阻塞三级结构。电路板上的光学宏模块提供内部电路板光互连和承载InGaAsP/InP或Si相交点PIC以及关联的功能的功能性。光学宏模块还包括与高密度多路光插入式面板互连的高密度带和背板连接器,比如连接器。端口卡机架包含32个信息传递速率(trib)级1或级3交换卡,机架控制器,以及约750mm宽的机架中的使用电源点(PUPS)。该交换机机架包含32个级2交换机卡、机架控制器、以及约750mm宽的机架中的PUPS。此外,机柜780包含冷却单元786。
背板互连使用多个柔性光背板以实现光互联器(shuffle)功能,其中每个第一和第二级卡或模块之间,以及每个第二和第三级卡或模块之间进行一个光连接。这些柔性光互联器被安装于铰链的板至机架后面的背板的一侧边缘或两侧边缘以绞出路来为电背板提供通路。机架电背板是无光互连的多层印刷电路板。由柔性光互联器功能执行的光互连经由若干柔性光互连矩阵,其中利用现有技术中的标准工艺将独立的光纤自动放置在胶粘的薄膜上,并用第二薄膜进行层压,例如来自连接器。互连经由多光纤连接器。四级机架设计中,其中两个机架中的每个包含32个输入或输出级卡,另外两个机架中的每个包含32个交换机中心级卡。可替换地,六级机架设计中,其中三个机架中的每个包含21或22个输入或输出级卡,另外两个机架中的每个包含21或22个交换机中心级卡。对于四级机架设计,机柜780高度可以为约900mm至约950mm,六级机架设计为1350—1425mm。
图20A-图20B示出了卡的例子,其为复杂插入式光子/电子单元,用于1024×1024三级快速光子交换结构。图20A表示输入端口卡/输出端口卡788,对于四级机架设计,其约为200mm×20mm×220mm,或六级机架设计为200mm×30mm×220mm。输入端口卡/输出端口卡788包括管线控制输入级控制器790、50cx/线性英寸的电连接高密度背板连接器796、封装宏模块792、以及光纤带连接器794。光纤带连接器794包含具有20mm×50mm覆盖区的48个光纤带连接器。封装光子区域792包含至少一个32×64或32×32交换机。
图20B示出了交换机卡798,其包含管线控制输入级正交映射器800、电连接806、光纤连接器804、以及封装宏模块802。电连接806包括具有50cx/线性英寸的高密度背板连接器。每个光纤连接器804都包含具有20mm×50mm覆盖区的48个光纤连接器。封装宏模块802包含至少一个32×32交换机。
具有四个机架,或约250mm高的交换机可以是高度为一米的机柜。两个交换机可以与相邻机柜内小体积换向器元件一起位于单一机柜内。换向器可以置于交换机之间的中间位置,将机柜高度从250mm增至500mm,使机柜高度为约2.25至约2.5米。可替换地,换向器分布在输入和输出级机架内,使机架更宽。对于六级机架设计,虽然两个机柜中容纳了两个大型交换机,但是这两个机柜内还有空间容纳换向器的其他机架。
由于存在内部路径长度,对此结构的合成延迟和无补偿和补偿传播偏差的例子进行计算,在描述四级机架实现方式的情况下,计算不使用换向的交换机。表4表示平均延迟、无补偿传播偏差、以及在例子中使用路径均衡技术的估计的传播偏差,例如通过延长短光路,针对图19示出的机架、卡模块以及系统780互连的主要部件。
表4
表4表示在平均~32ns下,封装的系统例子中的整体传播延迟是系统的IPG的很多倍,该系统中IPG通过适度的时钟加速度被增大。结果,交换机的级可以由计时的延迟偏移控制,以匹配沿交换的路径的整体传播延迟部分。级对级的延迟是由通过光纤互联器的长延迟引起的,其具有对与每个互联器连接的各机架的所有卡的连通性,致使出现长光纤流通。因为互联器经由机架一侧铰链装置连接,所以无补偿光纤长度下变化大,例如是机架的两倍宽和两倍高。在六级机架的实现方式中,光纤互联器中存在较长的不平衡长度。
估计的无补偿偏差为22.2ns,主要来自于光纤互联器功能长度的变化,其可通过增加环路中短光纤的长度或其他引入实际直接路径的方式减少。当偏差补偿通过设计靠近恒定路径长度被应用时,残留的传播偏差大约为800-1,000ps,例如920ps。因此,具有1ns输入IPG的100Gb/s交换的分组是有问题的,因为输出IPG可能低至零-200ps。然而,通过增加分组时钟速率,当输入IPG被增加至1.29ns时,可以看到1ns的最小输出IPG,时钟速率从约0.77%的120ns容器化的分组流增加至100.77GHz的时钟速率。然而,由于填充所有路径至最大延迟为延迟平均+无补偿的偏差/2=32.2+11.1=43.3ns,或超过三分之一的120ns帧的帧周期,该过程是以增加平均路径长度为代价实现的。
以换向的方式基于机柜的大型交换机可以经由平衡的长度往返布线于另外的交换机架进行连接,该另外的交换机架包含具有在低偏差快速交换技术设计中实现的1个输入2个输出和2个输入1个输出的换向交换机的多个端口的卡的阵列。这些卡的传播偏差和计时偏移被控制。通过利用相等的光程长度控制传播偏差计时偏移,这是由缺少换向器机架内卡对卡光互连和光纤带状电缆连接所引起的。因为已知的连接化的带中的光纤与相同的长度非常相近。计时偏移由计时设计控制,特别是对机架上卡的时钟计时的分布方面。
当电缆从邻近换向器机架往返运行大型交换机,其各自大约3米,并且通过换向器卡的光程长度为每换向器卡50cm时,存在另外的7米路径长度,或35ns的延迟,以及大约500ps的估计的偏差,主要为带到带的布线长度变化。这导致通过整体换向的常规封装交换机的整体传播延迟和补偿传播偏差为约35+43ns=78ns,而传播偏差约为1.3-1.5ns。在非换向的大型结构情况下,主要来自光纤互联器的延迟是显著的,导致每级的启动时间显著不同且精确,以在交换的流量IPG发射每级时追踪他们。在换向的情况下,仍存在来自输入换向器的输出换向器偏移的仔细计时控制,这种情况大约为78ns,半帧以上,但是,当大型端口数交换机结构启动时,包括控制偏差,减去传播延迟和偏差时间的帧时间内,没有使用控制的级对级延迟的特殊处理。这是因为,当启动时间在等于通过交换机的整体传播延迟和残差传播偏差的时间偏移下开始时,最慢的先前分组的末端正如启动开始一样退出该交换机,并且启动序列会在下下一个分组前沿到达之前结束。下一个分组已经被另一个大型交换机结构交换。在一个例子中,交换机启动为120-78ns=42ns,远高于1ns IPG。当交换机需要更多时间来启动时,可使用级启动中计时偏移的度量方法,这会有足够的偏移,以便每级启动在它本身120ns帧窗口内,而不是如每个未交换的情况,与传送的IPG精确对齐。
由于换向硬件和布线,偏差从没有换向的大约800-1000ps增加至有换向的大约1300-1500ps,这对于具有1ns IPG的未加速的100Gb/s分组流来说是有问题的。然而,可以使用加速度以实现有相同吞吐量的更大IPG。该加速度可约为+1.27%,时钟速率为101.27GHz,输入IPG为2.5ns,且输出IPG为1ns。
在一个例子中,换向被内置在交换电路板或模块中的交换机中。图21示出了具有嵌入式交换器的交换系统850。分组由包含换向器858和高端口数交换机860的第一级模块852接收。换向器和两个高端口数交换机被嵌入在第一级模块852中。当一个高端口数交换机正启动时,另一个处在流通状态,反之亦然。在一个例子中,换向器由铌酸锂制成,且高端口数交换机为32×64端口数交换机。
交换的分组被传送至包含高端口数交换机864的第二级模块854。一个第一级模块馈送两个第二级模块阵列。一个阵列正被启动时,另一个处于服务状态,反之亦然。
交换的分组被送至包含作为铌酸锂交换机阵列的换向器858和高端口数交换机860的级三模块856。两个交互的帧信号被合并在与第一级模块为反函数的第三级模块中。
模块由控制和换向计时块862控制。
将换向直接建在交换机本身中去除了从实际交换机至换向器的电缆的延迟和偏差。这显著地减少了延迟和偏差。有利于精确控制计时和偏差,因为不用考虑机柜对机柜布线延迟。通过与短整体路径长度密切匹配的换向的两个相位,减少了延迟和偏差。四厘米峰对峰变化是正或负0.1ns,而20cm峰对峰变化是正或负0.5ns。在这样的偏差水平下,交换独立长分组的100GE或400GE的同步的快速电路交换机在100GE时,IPG没有增加,400GE时,时钟速率增加了几个百分点。具有稍微密集光子功能或具有稍低吞吐量和相同功能密度的图19-20所示的封装制造的交换机计时具有近似相同的延迟和偏差属性。当实现最佳传播偏差且传播偏差约为800ps-1ns时,传播延迟约为43ns。因此,对于100Gb/s交换,当没有使用特别的级对级控制计且用于残留的1ns IPG的时钟速率加速度为0.77%至100.77GHz时,交换的情况下交换机启动时间和计时偏差分配大约为120-43=77ns。对于具有0.25ns IPG要求及30ns长分组持续时间的400Gb/s,因为分组持续时间少于通过交换机的传播时间,所以每级的启动时间及时的被错开。然而,代替精确停留在IPG内+/-125ps的交错安排,现在换向帧允许在窗口内精确停留+/-15ns。1ns的偏差涉及将3.45%时钟速率从400GHz增加至414GHz,以维持在重建输出端最小值0.25ns IPG。400Gb/s分组流可以被承载于作为多路复用块在相同光路上交换的十个40GHz时钟控制的光载流子上,且实际时钟速率在加速前为40GHz,加速后为41.4GHz。在四流而不是十流的子多路复用层上,类似的考虑可以应用于100GHz数据流的一些形式。
光子交换结构还可以有具有路由信息的分组同步。分组被交换之前,路由信息可以显著到达,所以控制管线具有前置时间以确定用于分组的帧的路径,并生成用于分组的帧的连接映射。这可以通过缓冲作为分组流分离器的部分的分组和容器化过程实现。分组分离器生成长的容器化的填充分组的流和短分组的分离的流。
因为无论换向与否,同步快速容器化的长分组交换机使所有输入端口上的所有分组容器前沿时间对齐,所以输入分组容器的计时偏差可能是个问题。分组流分离器的电缆长度是延迟的显著来源,特别是当那些分组流分离器与可能距离几百米远的远程TOR同置时。由于TOR/分离器交换传播偏差,而电缆传送延迟导致设置在分离器上的精确计时设置丢失,所以长度的变化会引起偏移。这可通过闭合回路相位控制的应用来解释,其有利于向交换机馈送的分离器输出处的分组帧相位成为交换机换向器输入处的输入信号的分组帧相位,或用于未换向的同步快速电路交换机的输入被正确地对齐至换向信号,这是由交换机上主参考计时源设置的,其充当用于交换机和基于TOR的对向分离器的主计时参考。因此,分离器传送它们的数据流,以便IPG在交换机输入处对齐,或在用于换向的交换机的换向输入处对齐。
图22-图23示出了分离器输出相位的闭合电路锁定例子,以便换向器的输入信号精确地对齐至换向帧。图22示出了通过辨别交换机输入处的输入IPG,用于输入容器化的分组数据计时的完整时间测量和修正的系统870。系统870探测相对于本地换向帧的输入IPG的相位中的错误,并生成相位修正信号,再传送回至原始分离器。该方法锁定了100%的时间,但使用了大量光电分接头数据信号,每个输入端口一个。分离器/组合器输出级包含可变的延迟块874和876,在光电转换(未示出)之前实现为分离器电子部分,其驱动长分组流至具有交换机898和900的换向器896。在交换机输入处,分组流的光信号在非对称光分离器(例如具有较高功率的90%:10%或80%:20%进入交换机)中被分裂,通过较低功率接头组件驱动探测IPG的相位的探测IPG相位块894和890。具有换向相位的计时块902也作为主计时参考被馈送至探测IPG相位块894和890内。
探测IPG块878中,光分组信号通过光对电(O/E)转化器880被转化为电信号。IPG探测器882探测IPG。然后通过相位比较器884比较探测的IPG的相位与来自计时块902的换向帧的计时参考。相位控制信号由相位控制信号886基于相位比较器884的输出生成。相位控制信号通过电对光(E/O)转化器888从光域被转化为电域。控制信号被反馈至可变的延迟块874和876,以调节延迟,通过调节TOR分离器处的源IPG相位的过程使得来自换向帧的参考信号和测量的IPG之间的测量相位差为零。
换向器896中的计时由来自计时块902的换向帧信号设置。换向器连接分组流至用于帧的持续的高端口数交换机914或高端口数交换机910的同时,另一高端口数交换机正在被启动。连接处理由连接处理块904进行。连接处理块904的输出通过电高端口数交换机906连接至交换机驱动912或交换机驱动908,并馈送至包含交换机920和922的换向器918。输出换向信号被延迟的换向信号驱动,该延迟的换向信号被延迟器916延迟以补偿通过交换机节点的光传播延迟。
图23示出了在交换机输入处用于扫描输入数据相位识别的系统930。一个或多个光子1:P选择器被插入于输入信号分接头和光电IPG相位探测器之间。在一些例子中,P可从大约8至大约64。这通过与光子选择器上输入的数量成正比,减少了高速接收器的数量。控制回路以简单和控制相位错误测量方式运行。整个回路的最佳相位偏移,特别是可变的延迟,比应用于这些光子选择器的扫描重复率低得多。在基于TOR的分组分离器和换向器之间的整体相位变化是有多因素支配的,比如基于TOP分组分离器和换向器之间光纤电缆中的延迟依据时间变化,特别是当电缆长时。这些变化是由通常显示多达几分钟至几个月而不是几微妙的环境温度的变化引起的。例如,每步骤12微妙的扫描速率下,对40×40GE分组,100×100GE分组,或400×400GE分组的相位测量与8至64之间的N值结合,每分离器每96至768微秒生成矫正的相位测量,这比偏移快很多数量级。12微秒步骤速率有利于相对缓慢的光子选择器,例如在1μs而非1ns的启动范围中运行。
分接(tapped off)的长分组流被馈送至光子选择器932和934,它们将分组发送至用于相位探测的探测IPG相位块879。相位控制信号生成后,被送回至光子选择器932和934,在那里被送回至可变的延迟块874和876。
闭合电路控制方法控制来自交换机换向帧的输入IPG的位移,使其成为IPG周期的小型组件。精确度取决于回路增益、回路中的噪声、以及相位探测器的任何阈值灵敏度。
换向还被应用于光子交换机控制。同步快速电路交换机的使用涉及每帧周期的整个交换连接映射的重新计算。对于40GE,9000字节巨型分组为1.8微秒,对于40GE,1500字节分组为300ns,对于100GE,1500字节分组为120ns,对于400GE,1500字节分组为30ns。生成大型连接映射的过程可以被分成多个连续的更小、更简单的步骤,在被切换至下一处理资源之前,每个步骤在一帧周期以内在处理资源中实现,下一处理资源在步骤专用处理块的管线中实现的管线处理步骤中实现下一小的简单过程。
同步快速电路交换机中,可以存在高计算速率,以高速率生成连接地址路由。对1024×1024交换机来说,这相当于生成具有每分组帧第一级路由、第二级路由,以及第三级路由的1024个地址路由(分组路由)。这对于进入交换机的40GE分组流来说,相当于每秒1024×109/300分组路由(3.4×109分组路由)的峰值,100GE每秒8.5×109分组路由的峰值,以及400GE每秒3.4×1010分组路由的峰值。
可以使用产生连接映射流的划分和克服方法。输入和输出的小组可以用来简化控制流中的计算,生成并行控制流。同时,可以使用连续的处理结构,其中在切换至管线中下一个处理器之前,部分连接处理在该处理器中被实施。多个管线的使用可以交替地处理基于输入的组和基于输出的组。使用并联的管线控制体系结构,其中在处理器并联组中部分地处理基于源地址的地址组,这些处理器并联组可以是一连串处理子任务的处理器。随后是一连串相似的处理基于目的地地址的地址组的处理器,其可以是一连串处理子任务的处理器。基于源地址的处理器可以通过一连串正交映射器互连至基于目的地地址的处理器。这可以根据需要重复串联和并联,将每个帧的1024地址路由分成在输入或输出的小组上执行的一连串更小的任务。
这是并联的正交管线方法。它是并联的,是因为处理是基于少量组以并联方式实施的。在1024×1024交换机中,每个32输入或输出可以都是32+32组,将处理分成在三十二分之一的整体计算等级上产生地址的流并每帧传送三十二分之一的完全连接映射。对于100GE,这相当于每管线每秒的地址路由从8.5×109减少到2.6×108。该方法是正交的,由于使用了连续地沿着具有正交映射器的管线的基于输入组的处理和基于输出组的处理,来映射从基于输入组的结果至基于输出的数据,反之亦然。因为使用了多个串联的处理器,该方法是管线式的,每个处理器有一个简单的每帧重复的任务。该处理器可以是非常快速硬编码的控制器或硬件状态机。
每个管线的数据速率可以是大的。对于1024×1024交换机的100GE时2.6×108×6=1.56×109字节/秒的管线处理器输出速率,启动地址具有每级两个字节或每总地址六个字节的量级(order)。相同的交换机40GE时速率为624兆字节/秒,400GE时为6.24千兆字节/秒。
可以使用基于并联组的管线控制,其中控制计算被分成一连串步骤,每个步骤在超快计算块中完成以实现高速。计算块的一个例子是定制的硬件状态机。这可以在将中间结果切换至管线中的下一硬件状态机之前,针对当前硬件状态机及时执行,以接受与同步分组地址的后续帧的分配的组完成的相同的任务。
可以在控制系统中使用换向的方法。图3左边示出了管线控制中的两路换向,而图3右边表示管线控制中的四路换向。帧专用控制输入被输入至输入换向器239或250内,每时隙在一个位置旋转。计时块236和252协调计时。
控制输入是用于下一个分组帧的连接映射。这是由P=2的控制系统240和242,和P=4的控制系统260、262、264及266完成的。控制块以每次一个分组帧交替连接至分组的完整帧的输入路由请求,该请求由换向输入交换机馈送。1/Pth信息被输入至并联管线处理器结构内。当计算完成时,它们经由输出换向器交换机,交换机244和交换机258,输出用于特定的连接时间。
控制块可以是单一的处理器、管线处理器、或管线处理器的并联阵列。控制块接收1/P路由请求并且有P倍长以传送处理的连接映射。该连接映射可以是基于单一处理器刚刚收到的输入或来自先前大量帧的输入的,该输入已经通过处理器管线以每P帧一个处理器步骤的管线步骤速率被处理。
来自控制模块的输出连接映射代表连接映射的帧速率流的交替部分。当P=2时,一个控制模块有奇数个帧,而另一个有偶数个帧。他们通过输出换向器连续地结合,以提供具有控制连接映射流的所有帧的控制。当P=4时,控制内连续的输入之间的周期是四个分组帧周期,并且控制的整体工作负载是其具有一个控制块时的四分之一。
控制映射被发送至高端口数交换机234和高端口数交换机256。分组流通过延迟器232和254已经被延迟。这可以在分离器中以电子方式执行,以为连接处理提供时间。流量信号被馈送至快速电路光子交换结构,以达到与来自控制系统的处理的控制同步。
因为换向器每P帧将控制输入输入至特定的控制块,所以控制块有P倍多的时间来完成每个管线元件的处理。这可以减少串联元件的数量或为复杂元件提供时间以完成它们的任务。
如图3所示,信息未从一个帧处理传送至下一帧。可替换地,信息可以在控制系统之间被传送。
在一个例子中,控制结构使用具有正交地址流映射器的分区的并联管线控制。管线步骤在40GE时为300ns,400GE时为30ns。表5示出了在40GE至400GE范围间将管线帧速率作为分组持续时间和换向水平的函数。数据速率和作为结果的长分组持续时间之间的关系与控制换向的水平被示出,以在控制管线帧速率下产生切换工作级之间的周期变化,以重复他们用于下个输入的任务。可以使用200ns和800ns之间的控制帧速率或切换周期,设置用于任何已知分组帧速率的换向水平。然而也可以使用较小或较大的帧速率。
表5
对于具有40GE、100GE,或400GE长分组或400GE巨型分组的1024×1024端口来说,使用32条并联管线,相当于32个TOR和它们相关联的第一级或第三级,就被寻址的每个第二管线来说,40GE长分组的每个管线输出地址速率为1.04×108/秒,100GE长分组为2.6×108/秒,400GE为1.04×109/秒,以及400GE巨型分组为1.72×108/秒。P路控制换向下,通过P值划分每个流。表6示出了将每个管线流地址传送速率作为输入数据速率和用于具有32组的1024×1024端口长分组交换机的控制换向水平的函数。
表6
管线与端口的输入或输出组和其关联的输入或输出矩阵相关联,与增加至32路换向结合的32条并联管线的结合可以通过1024的倍数减少每个处理器的处理后的数据吞吐量。例如,非常快速处理器管线每秒传送1亿个地址且每端口传送32组,400GE时界面连接1024×1024长分组交换机的32端口,可以使用约为12的控制换向水平。对于每秒具有32组端口的40GE和1千万个地址,以及组为256×256交换机的8个端口来说,换向可以为三级。
图24A-图24B示出了用于四相位换向的换向的管线控制以及控制换向帧计时图。在图24A中的管线控制1010中,通过计时块1016接收交换机换向帧或同步的IPG帧。具有四倍换向周期的换向控制的四个相位由计时块1016产生。
作为四路换向器的换向器1018被应用于四个并联的管线控制系统1022、1024、1026及1028。该控制系统分别包含管线控制级1030、1032、1034及1036。虽然示出了四种状态,但可以使用其他数量的级。例如,可以使用2、8、10、16或32个级。输出通过换向器1020结合,该换向器1020将处理的地址的各自的四分之一时间控制流重新结合至单一的完整控制流中,随着管线完成计算且释放用于交换机的一个帧的连通数据,该流在输入换向后被延迟,以同步并连接至正确的输出。
光子交换结构1014使用连通映射来处理已被延迟器1012延迟的光子分组。
控制管线用它们各自的相位时钟以被换向等级分开的分组帧速率计时,例如用于四个相位换向的四分之一速率。由于从一个管线级至下一管线级的部分被处理的数据被计时,所以第一级接收和处理一组新的数据。
图24B示出了用于四相位换向的计时图。迹线1024表示换向帧,迹线1044、1046、1048及1050表示用于四个控制模块的控制帧,以及迹线1052、1054、1056及1058表示用于四个控制模块的控制处理。每个第四控制帧进入特定的控制模块。每个管线的帧的32个分组地址进入用于具有32组的1024×1024交换机的每个第四控制帧。管线步骤的变化通过换向的适当的相位被计时,以使处理进入管线中的下一个处理器,同步加载要被处理的下一帧。当步骤1正处理分组流N的控制时,步骤2正处理N-4,步骤3在处理N-8,等等。
处理过程中,管线级可以确定其不能路由一些流量。例如,相同帧中的两个分组可以有相同的目的地端口地址。在一个例子中,当多个分离器在相邻的机柜中时,回退信号被发送至命令该回退信号的其中一个分离器,以将该分组保存为额外的分组帧。这涉及控制系统内部的横向通信,所以延迟的分组被正确地路由。
图25A-图25B示出了具有横向传递的信息的例子,比如溢出分组的地址至较晚的定相的转换器片段的相同、较早、或较晚处理步骤。图25A表示控制模块之间通信的系统1016。控制块1062、1064、1066和1068之间互相通信,其包含管线元件1070、1072、1074和1076。控制系统传送结果至较晚控制过程的流中的适当的点。例如,竞争分组的地址被发送至较晚的流,以助于其中一个分组在另一个分组之后进行交换。
图25B示出了用于管线间通信的控制换向帧计时图。曲线1082表示换向帧,曲线1084、1086、1088,和1900表示四个控制帧,曲线1092、1094、1096,和1098表示用于四个控制模块的控制处理。管线相同步骤之间的连接可以传输至相邻的一个换向相位较晚管线。这表示为管线的步骤1,但可以发生在任何步骤。在只有四分之一步骤相位差时,当信息可以足够早地被插入用于相同步骤的相邻管线中,这有利于特定的步骤中具有推理出的结果的管线传输该结果供相邻的管线在下一分组帧中使用。可替换地,信息被插入至两个换向相位移除的管线的相同步骤中(未示出)。它可以提前一半步骤时间插入作用于两帧后的分组帧的后一步骤中。在一个例子中,当确定两个分组地址具有相同的目的地且在目的地端口冲突时,两个分组地址的其中一个被传送。当管线中该确定提早做出时,这这有利于对附近分离器进行反馈的那些分组的串行化。
来自管线处理步骤早期的信息可以被传送回至前一步骤的后期级。
图26示出了利用换向光子交换机的光子分组交换方法的流程图180。最初,步骤185中,第一光换向器交换机和电换向器交换机被切换。第一光换向器交换机是快速光交换机,例如由铌酸锂制成。第一光换向交换机在光子交换结构的输入处并确定一个输入光子分组被路由至哪个高端口数交换机。
接下来,步骤183中,系统接收光子分组。该分组通过第一换向器交换机被路由至第一高端口数交换机。
然后,步骤187中,第二光交换器交换机被切换。第二光交换器交换机在高端口数交换机的输出处。存在由于切换第一光换向器交换机和切换第二光换向器交换机引起的延迟,以考虑通过该系统的光传播时间。第二光换向器交换机也可以由铌酸锂制成。
步骤189中,分组通过第一高端口数开端交换。第一高端口数交换机已经被启动。第一高端口数交换机是大型复杂的光子交换机,其维持用于分组持续期间的连接。第一高端口数交换机可以是一个三级光子交换机。在一个例子中,第一和第三级是固态相交点交换机且第二级是AWG-R。可替换地,所有三级都是固态相交点交换机。也可以使用其它数量的级,比如5。
同时,第二高端口数交换机正被启动用于随后的分组。如同第一高端口数交换机,第二高端口数交换机是大型复杂的光子交换机。
步骤193中,交换的分组被传输至其目的地TOR。
然后,步骤196中,第一光交换器交换机和电交换器交换机被切换,所以输入的分组被导向至第二高端口数交换机,并且第一高端口数交换机正被启动用于随后的分组。
步骤194中,系统接收下一个要被交换的分组。该分组通过第二高端口数交换机交换。
接下来,步骤198中,第二光交换器交换机被切换。第二光换向器交换机指引导来自适当的高端口数交换机的交换的分组。切换的第一光换向器交换机和第二光换向器交换机之间的某一延迟用来考虑传播延迟。
步骤530中,分组通过第二高端口数交换机交换。这些分组通过第一光换向器交换机导向第二高端口数交换机
同时,步骤532中第一高端口数交换机正被启动。该启动信息通过电切换交换机被发送至第一高端口数交换机。
最终,步骤534中交换的分组被传送。它们被发送至目的地TOR。
图27示出了用于换向控制模块的方法的流程图550。最初,步骤552中,换向器交换机被切换。例如对于光子交换结构来说,存在确定哪个控制模块接收信息的输入换向器交换机,以及确定哪个控制模块输出控制信息的输出换向器交换机。
步骤554中,第一控制模块确定用于光子交换结构的连接。在一个例子中,第一控制模块是管线控制模块。可替换地,第一控制模块是单一的处理器。管线控制模块中,存在一连串步骤,其中一个步骤的输入是前一步骤的输出。在一个例子中,信息从一个控制模块传送至另一个控制模块。例如,当存在竞争分组时,一个控制模块可以告诉另一控制模块在下一时隙安排竞争分组中的一个。控制模块可以与较早管线控制步骤中的另一控制模块通信。
同时,步骤556中,第二控制模块正在控制光子交换结构。在一个例子中,管线控制不同级中存在若干控制模块。
然后,步骤558中,换向器交换机切换。
步骤561中,第二控制模块确定用于光子交换结构的连接映射。第二控制模块可以接收连接请求。
同时,步骤563中,第一控制模块控制光子交换的结构。该过程继续。可以有更多控制模块。
虽然本公开已经提供了若干实施例,但应当理解,所公开的系统和方法在不脱离本公开的精神或范围的前提下,可以以许多其它特定形式体现。本公开的例子应被视为说明性的,而不是是限制性的,并且意图并不限于本文所给出的细节。例如,各种元件或组件可以被结合或集成在另一个系统中,或某些特征可以被省略,或不实施。
此外,在不脱离本公开的范围的前提下,各种实施例中离散或单独描述和示出的技术、系统、子系统,及方法可以与其他系统、模块、技术,或方法结合或集成。其他耦合的或直接耦合的或互相通信的所示出的或讨论的项目可以通过某个界面、设备,或媒介组件以电、机械或其他方式直接耦合或通信。在不脱离本文公开的精神和范围下的前提下,本领域技术人员确定并可能做出变化、替换、及变更的其他例子。
Claims (23)
1.一种光子交换结构,包括:
输入光子换向器交换机,被配置为接收包括多个容器化光子分组的光子帧流;
第一高端口数光子交换机,与所述输入光子换向器交换机耦连;
第二高端口数光子交换机,与所述输入光子换向器交换机耦连,其中所述输入光子换向器交换机被配置为将光子帧路由至所述第一高端口数光子交换机或所述第二高端口数光子交换机;以及
输出光子换向器交换机,与所述第一高端口数光子交换机和所述第二高端口数光子交换机耦连,其中所述输出光子换向器交换机被配置为输出交换后的光子帧。
2.如权利要求1所述的光子交换结构,还包括与所述第一高端口数光子交换机和所述第二高端口数光子交换机耦连的电换向器交换机,其中所述电换向器交换机被配置为将控制映射导向所述第一高端口数光子交换机或所述第二高端口数光子交换机。
3.如权利要求2所述的光子交换结构,还包括与所述电换向器交换机耦连的控制模块。
4.如权利要求3所述的光子交换结构,其中所述控制模块包括:
输入控制换向器交换机;
第一控制模块,与所述输入控制换向器交换机耦连;
第二控制模块,与所述输入控制换向器交换机耦连;及
输出控制器,与所述第一控制模块和所述第二控制模块耦连。
5.如权利要求1所述的光子交换结构,还包括:
第三高端口数光子交换机,与所述输入光子换向器交换机耦连;以及
第四高端口数光子交换机,与所述输入光子换向器交换机耦连。
6.如权利要求1所述的光子交换结构,还包括与所述输入光子换向器交换机耦连的第三高端口数光子交换机,其中所述输入光子换向器交换机被配置为,当在所述第二高端口数光子交换机中检测到错误时,在所述第一高端口数光子交换机和所述第三高端口数光子交换机之间切换,并且当在所述第二高端口数光子交换机中未检测到错误时,在所述第一高端口数光子交换机、所述第二高端口数光子交换机和所述第三高端口数光子交换机之间切换。
7.如权利要求1所述的光子交换结构,其中所述输入光子换向器交换机和所述输出光子换向器交换机是快速换向器交换机,并且其中所述第一高端口数光子交换机和所述第二高端口数光子交换机是多级光子交换结构。
8.如权利要求7所述的光子交换结构,其中所述输入光子换向器交换机被配置为在第一时间段中启动,其中所述第一时间段短于所述光子帧流中的帧间间隔,其中所述第一高端口数光子交换机被配置为在第二时间段中启动,并且其中所述第二时间段长于所述光子帧流中的所述帧间间隔。
9.如权利要求1所述的光子交换结构,其中通过所述第一高端口数光子交换机从所述输入光子换向器交换机至所述输出光子换向器交换机的第一光程长度约等于通过所述第二高端口数光子交换机从所述输入光子换向器交换机至所述输出光子换向器交换机的第二光程长度。
10.如权利要求1所述的光子交换结构,其中所述输入光子换向器交换机被合并入交换机输入级卡中且所述输出光子换向器交换机被和并入交换机输出级卡中。
11.如权利要求1所述的光子交换结构,还包括:
可变延迟模块,被配置为在所述输入光子换向器交换机之前延迟所述光子帧;以及
偏差检测模块,与所述可变延迟模块耦连。
12.如权利要求11所述的光子交换结构,其中所述偏差检测模块被配置为测量所述输入光子换向器交换机得输入处的输入信号偏差,并根据所述输入信号偏差进行调节。
13.如权利要求11所述的光子交换结构,其中所述偏差检测模块包括:
分组间间隔(IPG)相位检测模块,被配置为检测所述光子帧流的IPG相位;以及
IPG检测模块,被配置为检测所述光子帧流的IPG,并根据所述光子帧流的所述IPG相位和所述光子帧流的所述IPG生成用于所述可变延迟模块的相位控制信号。
14.如权利要求13所述的光子交换结构,还包括耦连于所述可变延迟和所述IPG检测模块之间的光子选择器。
15.一种光子分组交换的方法,所述方法包括:
在第一时间段期间切换第一光学换向器交换机;
接收光子分组流的第一分组;
将所述第一分组导向至第一高端口数光子交换机;
由所述第一高端口数光子交换机对所述第一分组进行切换,以在第二时间段期间产生第一交换后光子分组,其中所述第二时间段在所述第一时间段之后;以及
在所述第二时间段期间启动第二高端口数光子交换机。
16.如权利要求15所述的方法,还包括在所述第一时间段期间切换电换向器交换机,其中启动所述第二高端口数光子交换机包括从所述电换向器交换机接收控制信息。
17.如权利要求15所述的方法,还包括:
在第三时间段期间切换输出光学换向器交换机,其中所述第三时间段是所述第一时间段之后的第一延迟;以及
通过所述输出光学换向器交换机发送所述交换后光子分组。
18.如权利要求17所述的方法,其中所述第一延迟等于所述第二时间段。
19.如权利要求15所述的方法,还包括:
在第三时间段期间切换所述第一换向器交换机,其中所述第三时间段在所述第二时间段之后;
接收所述分组流的第二分组;
将所述第二分组导向至所述第二高端口数光子交换机;
在第四时间段期间由所述第二高端口数光子交换机切换所述第二分组,其中所述第四时间段在所述第三时间段之后;以及
在所述第四时间段期间启动所述第一高端口数光子交换机。
20.一种控制光子交换结构的方法,所述方法包括:
在第一时间段期间切换输入换向器交换机;
在所述第一时间段期间切换输出换向器交换机;
在第二时间段期间由第一控制模块确定用于所述光子交换结构的第一连接映射,其中所述第二时间段在所述第一时间段之后;以及
在所述第二时间段期间由第二控制模块向所述光子交换结构发送所述第一连接映射。
21.如权利要求20所述的方法,还包括:
在第三时间段期间切换所述输入换向器交换机,其中所述第三时间段在所述第二时间段之后;
在第三时间段期间切换所述输出换向器交换机;
在第四时间段期间由所述第二控制模块确定用于所述光子交换结构的第二连接映射,其中所述第四时间段在所述第三时间段之后;以及
在所述第三时间段期间由所述第一控制模块向所述光子交换结构发送所述第二连接映射。
22.如权利要求20所述的方法,其中所述第一控制模块是管线控制器。
23.如权利要求20所述的方法,还包括由所述第二控制模块向所述第一控制模块发送消息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/508,676 US9282384B1 (en) | 2014-10-07 | 2014-10-07 | System and method for commutation in photonic switching |
US14/508,676 | 2014-10-07 | ||
PCT/CN2015/090145 WO2016054967A1 (en) | 2014-10-07 | 2015-09-21 | System and method for commutation in photonic switching |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106797270A true CN106797270A (zh) | 2017-05-31 |
Family
ID=55410584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580054550.4A Pending CN106797270A (zh) | 2014-10-07 | 2015-09-21 | 光子交换中用于换向的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9282384B1 (zh) |
CN (1) | CN106797270A (zh) |
WO (1) | WO2016054967A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112313586A (zh) * | 2018-06-01 | 2021-02-02 | 西创同驰系统控制股份公司 | 自动化系统、用于自动化系统的运行方法和计算机程序产品 |
CN113261303A (zh) * | 2019-04-30 | 2021-08-13 | 华为技术有限公司 | 用于针对扩展数据中心云系统将光子交换透明嵌入到电子机箱的方法和装置 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9491120B2 (en) | 2013-05-01 | 2016-11-08 | Huawei Technologies Co., Ltd. | Method for crosstalk and power optimization in silicon photonic based switch matrices |
US9456260B2 (en) * | 2013-05-01 | 2016-09-27 | Huawei Technologies Co., Ltd. | Method for crosstalk and power optimization in silicon photonic based switch matrices |
CN104753623B (zh) * | 2013-12-25 | 2018-04-27 | 华为技术有限公司 | 一种光交换装置 |
US10231038B2 (en) | 2014-02-24 | 2019-03-12 | Rockley Photonics Limited | Detector remodulator and optoelectronic switch |
US10928659B2 (en) | 2014-02-24 | 2021-02-23 | Rockley Photonics Limited | Optoelectronic device |
US11150494B2 (en) | 2015-03-05 | 2021-10-19 | Rockley Photonics Limited | Waveguide modulator structures |
US10921616B2 (en) | 2016-11-23 | 2021-02-16 | Rockley Photonics Limited | Optoelectronic device |
US9860614B2 (en) * | 2015-05-13 | 2018-01-02 | Huawei Technologies Co., Ltd. | System and method for hybrid photonic electronic switching |
US9860615B2 (en) * | 2015-05-14 | 2018-01-02 | Huawei Technologies Co., Ltd. | System and method for photonic switching |
US9654849B2 (en) * | 2015-05-15 | 2017-05-16 | Huawei Technologies Co., Ltd. | System and method for photonic switching |
US9980021B2 (en) * | 2015-10-07 | 2018-05-22 | Ciena Corporation | Scalable switch fabric using optical interconnects |
KR102501159B1 (ko) * | 2016-09-21 | 2023-02-21 | 한국전자통신연구원 | 포토닉 프레임 스위칭 방법 및 포토닉 프레임 스위칭 시스템 |
KR20180042631A (ko) * | 2016-10-18 | 2018-04-26 | 한국전자통신연구원 | 포토닉 프레임 처리 장치 및 방법 |
US11101256B2 (en) | 2016-11-23 | 2021-08-24 | Rockley Photonics Limited | Optical modulators |
GB2559458B (en) | 2016-12-02 | 2020-06-03 | Rockley Photonics Ltd | Waveguide device and method of doping a waveguide device |
GB2559252B (en) | 2016-12-02 | 2020-06-03 | Rockley Photonics Ltd | Waveguide optoelectronic device |
US10686729B2 (en) | 2017-03-29 | 2020-06-16 | Fungible, Inc. | Non-blocking any-to-any data center network with packet spraying over multiple alternate data paths |
WO2018183553A1 (en) | 2017-03-29 | 2018-10-04 | Fungible, Inc. | Non-blocking any-to-any data center network having multiplexed packet spraying within access node groups |
CN110710139A (zh) | 2017-03-29 | 2020-01-17 | 芬基波尔有限责任公司 | 具有光置换器的无阻塞全网状数据中心网络 |
CN110741356B (zh) | 2017-04-10 | 2024-03-15 | 微软技术许可有限责任公司 | 多处理器系统中的中继一致存储器管理 |
US10659254B2 (en) | 2017-07-10 | 2020-05-19 | Fungible, Inc. | Access node integrated circuit for data centers which includes a networking unit, a plurality of host units, processing clusters, a data network fabric, and a control network fabric |
EP3625679A1 (en) | 2017-07-10 | 2020-03-25 | Fungible, Inc. | Data processing unit for stream processing |
US11221606B2 (en) * | 2017-09-26 | 2022-01-11 | Honeywell International Inc. | System and method for depicting and using one logical connection with collection of input/output (I/O) modules as multiple individual logical connections |
CN111149329A (zh) | 2017-09-29 | 2020-05-12 | 芬基波尔有限责任公司 | 通过多个备用数据路径进行分组喷射的数据中心网络的结构控制协议 |
US10965586B2 (en) | 2017-09-29 | 2021-03-30 | Fungible, Inc. | Resilient network communication using selective multipath packet flow spraying |
WO2019152063A1 (en) | 2018-02-02 | 2019-08-08 | Fungible, Inc. | Efficient work unit processing in a multicore system |
US10841671B1 (en) * | 2019-05-07 | 2020-11-17 | Huawei Technologies Co., Ltd. | Method and apparatus for loss-aware optical routing |
US11561916B2 (en) * | 2020-01-13 | 2023-01-24 | Hewlett Packard Enterprise Development Lp | Processing task deployment in adapter devices and accelerators |
US11275705B2 (en) * | 2020-01-28 | 2022-03-15 | Dell Products L.P. | Rack switch coupling system |
US11398845B1 (en) * | 2021-11-24 | 2022-07-26 | Softronics Ltd. | Adaptive combiner for radio transmitters |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020186434A1 (en) * | 2001-06-08 | 2002-12-12 | Roorda Peter David | Transparent photonic switch architectures for optical communication networks |
CN1392696A (zh) * | 2002-07-09 | 2003-01-22 | 华中科技大学 | 一种用于全光交换节点中的n×n光交换结构 |
WO2014120203A1 (en) * | 2013-01-31 | 2014-08-07 | Hewlett-Packard Development Company, L.P. | Radix enhancement for photonic packet switch |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2283953C (en) * | 1999-09-27 | 2009-07-28 | Nortel Networks Corporation | Compact high-capacity switch |
US6839478B2 (en) | 2001-05-01 | 2005-01-04 | Terraop Ltd. | Optical switching system based on hollow waveguides |
US7519053B2 (en) * | 2005-08-24 | 2009-04-14 | Nortel Networks Limited | Multi-speed rotorswitch |
US8463091B2 (en) | 2007-10-15 | 2013-06-11 | Telescent Inc. | Methods to reconfigure all-fiber optical cross-connects |
US8190025B2 (en) | 2008-02-28 | 2012-05-29 | Olympus Corporation | Wavelength selective switch having distinct planes of operation |
US8625994B2 (en) | 2008-03-11 | 2014-01-07 | Ciena Corporation | Directionless reconfigurable optical add-drop multiplexer systems and methods |
US8971321B2 (en) | 2012-12-11 | 2015-03-03 | Futurewei Technologies, Inc. | System and method for accelerating and decelerating packets |
US10015111B2 (en) | 2013-03-15 | 2018-07-03 | Huawei Technologies Co., Ltd. | System and method for steering packet streams |
US9584885B2 (en) * | 2013-05-10 | 2017-02-28 | Huawei Technologies Co., Ltd. | System and method for photonic switching |
-
2014
- 2014-10-07 US US14/508,676 patent/US9282384B1/en not_active Expired - Fee Related
-
2015
- 2015-09-21 CN CN201580054550.4A patent/CN106797270A/zh active Pending
- 2015-09-21 WO PCT/CN2015/090145 patent/WO2016054967A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020186434A1 (en) * | 2001-06-08 | 2002-12-12 | Roorda Peter David | Transparent photonic switch architectures for optical communication networks |
CN1392696A (zh) * | 2002-07-09 | 2003-01-22 | 华中科技大学 | 一种用于全光交换节点中的n×n光交换结构 |
WO2014120203A1 (en) * | 2013-01-31 | 2014-08-07 | Hewlett-Packard Development Company, L.P. | Radix enhancement for photonic packet switch |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112313586A (zh) * | 2018-06-01 | 2021-02-02 | 西创同驰系统控制股份公司 | 自动化系统、用于自动化系统的运行方法和计算机程序产品 |
US11981361B2 (en) | 2018-06-01 | 2024-05-14 | Selectron Systems Ag | Automation system, operating method for automation system, and computer program product |
CN113261303A (zh) * | 2019-04-30 | 2021-08-13 | 华为技术有限公司 | 用于针对扩展数据中心云系统将光子交换透明嵌入到电子机箱的方法和装置 |
CN113261303B (zh) * | 2019-04-30 | 2022-06-07 | 华为技术有限公司 | 用于将光子交换透明嵌入到电子机箱的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2016054967A1 (en) | 2016-04-14 |
US9282384B1 (en) | 2016-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106797270A (zh) | 光子交换中用于换向的系统和方法 | |
Blumenthal et al. | Photonic packet switches: Architectures and experimental implementations | |
WO2016019798A1 (en) | System and method for photonic networks | |
US8170416B2 (en) | Optical switching device | |
Shacham et al. | A Fully Implemented 12� 12 Data Vortex Optical Packet Switching Interconnection Network | |
Tucker | The role of optics and electronics in high-capacity routers | |
US20060036831A1 (en) | Multiprocessor | |
CN105637821A (zh) | 混合电路-分组交换机 | |
CN107407777A (zh) | 用于光网络的系统和方法 | |
CN105164954A (zh) | 用于分流包流的系统和方法 | |
US20160334575A1 (en) | System and Method for Photonic Switching | |
US20160337731A1 (en) | System and Method for Photonic Switching | |
US9166928B2 (en) | Scalable 3-stage crossbar switch | |
Munter et al. | A high-capacity ATM switch based on advanced electronic and optical technologies | |
CN103369415B (zh) | 基于微环谐振器的全光片上网络 | |
CN101815057A (zh) | 多数据率兼容型超高速自适应全光数据包速率倍增方法 | |
CN107534506B (zh) | 用于光子交换的系统和方法 | |
Thompson et al. | Experimental modular switching system with a time-multiplexed photonic center stage | |
CN110430486A (zh) | 一种基于集成式混合光交换网络的边界交换节点 | |
Zheng et al. | Low latency passive optical node for optical access network | |
Yang et al. | An optical interconnect network design for dynamically composable data centers | |
US8588620B2 (en) | Optical routing and transport acceleration (ORTA) | |
US9351054B2 (en) | Device and a method for merging optical components associated with one wavelength into a merged optical component | |
CN206472148U (zh) | 一种可片上集成的物理层组播光交换节点装置及网络 | |
CN100518380C (zh) | 全光主动型光纤网络背板系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170531 |
|
WD01 | Invention patent application deemed withdrawn after publication |