CN105210316B - 用于光子交换的系统和方法 - Google Patents
用于光子交换的系统和方法 Download PDFInfo
- Publication number
- CN105210316B CN105210316B CN201480024668.8A CN201480024668A CN105210316B CN 105210316 B CN105210316 B CN 105210316B CN 201480024668 A CN201480024668 A CN 201480024668A CN 105210316 B CN105210316 B CN 105210316B
- Authority
- CN
- China
- Prior art keywords
- photonic switching
- photon
- output port
- bag
- switching system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/35—Switches specially adapted for specific applications
- H04L49/356—Switches specially adapted for specific applications for storage area networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0062—Network aspects
- H04Q11/0066—Provisions for optical burst or packet networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J14/00—Optical multiplex systems
- H04J14/02—Wavelength-division multiplex systems
- H04J14/0227—Operation, administration, maintenance or provisioning [OAMP] of WDM networks, e.g. media access, routing or wavelength allocation
- H04J14/0254—Optical medium access
- H04J14/0256—Optical medium access at the optical channel layer
- H04J14/0258—Wavelength identification or labelling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J14/00—Optical multiplex systems
- H04J14/02—Wavelength-division multiplex systems
- H04J14/0227—Operation, administration, maintenance or provisioning [OAMP] of WDM networks, e.g. media access, routing or wavelength allocation
- H04J14/0254—Optical medium access
- H04J14/0267—Optical signaling or routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0007—Construction
- H04Q2011/0033—Construction using time division switching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/0045—Synchronisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0037—Operation
- H04Q2011/005—Arbitration and scheduling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0005—Switch and router aspects
- H04Q2011/0052—Interconnection of switches
- H04Q2011/0054—Distribute-route
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Optical Communication System (AREA)
Abstract
在一个实施例中,光子包交换的方法包含通过光子交换结构从第一架顶(TOR)交换机接收对应于第一光子包和第一时间段的目的地端口请求,其中所述目的地端口请求包含第一输出端口;以及确定所述第一输出端口在所述第一时间段期间是否可用。所述方法还包含通过所述光子交换结构从所述第一TOR交换机接收所述第一光子包;以及当所述第一输出端口在所述第一时间段期间可用时,将所述第一光子包路由到所述第一输出端口。另外,所述方法包含当所述第一输出端口不可用时,将所述第一光子包路由到替代输出端口。
Description
本发明要求2014年5月12日递交的发明名称为“用于光子交换的系统和方法(System and Method for Photonic Switching)”的第14/275,320号美国非临时申请案以及2013年5月10日递交的发明名称为“用于在纯光子包交换机中使用偏转策略的竞争解决的系统和方法(System and Method for Contention Resolution using DeflectionPolicies in Pure Photonic Packet Switch)”的第61/822,180号美国临时申请案的在先申请优先权,所述在先申请的内容以引入的方式并入本文本中。
技术领域
本发明涉及一种用于光通信的系统和方法,且具体来说,涉及一种用于光子交换的系统和方法。
背景技术
通过用户数的增长且通过应用数的增加激起的互联网业务的增长产生对带宽的更高需求。此增长需要具有较高交换能力的较大包交换网络。数据中心含有巨大数量的服务器机架、存储设备机架以及其它机架,所有机架经由巨大的集中式包交换资源互连。在数据中心中,电力包交换机用于路由数据包。极高速率的电子包交换涉及巨大的冷却和空间成本。因此,光子包交换是所需的。
服务器、存储设备和输入输出功能的机架含有架顶(TOR)交换机,所述架顶交换机将来自它们的相关联服务器和/或其它外围设备的包流合并成每TOR交换机更少数目的高速流,这些高速流被路由到包交换核心。并且,TOR交换机接收来自所述资源的返回经交换流且将其分布到所述交换机的机架内的服务器。可以存在从每一TOR交换机到包交换核心的4×40Gb/s的流和相同数目的返回流。在数据中心中可以存在每机架一个TOR交换机,其中具有数百到数万个机架,以及因此数百到数万个TOR交换机。
发明内容
光子包交换的实施例方法包含:通过光子交换结构从第一架顶(TOR)交换机接收对应于第一光子包和第一时间段的目的地端口请求,其中目的地端口请求包含第一输出端口;以及确定所述第一输出端口在所述第一时间段期间是否可用。所述方法还包含通过光子交换结构从第一TOR交换机接收第一光子包;以及当第一输出端口在第一时间段期间可用时,将第一光子包路由到第一输出端口。另外,所述方法包含当第一输出端口在第一时间段期间不可用时,将第一光子包路由到替代输出端口。
实施例光子交换结构包含第一光子交换机和耦合到所述第一光子交换机的交换机控制器,其中所述第一光子交换机用于耦合到多个架顶(TOR)交换机,其中所述第一光子交换机包含第一多个输入端口和第二多个输出端口,其中所述第二多个输出端口多于所述第一多个输入端口,其中所述交换机控制器用于根据第一目的地端口请求确定第一输出端口在第一时间段期间是否可用,其中当所述第一输出端口在所述第一时间段期间可用时,所述第一光子交换机用于将第一输入端口连接到所述第一输出端口,并且其中当所述第一输出端口在所述第一时间段期间不可用时,所述第一光子交换机用于将所述第一输入端口连接到第二输出端口。
实施例光子交换结构包含光子包交换机和包含第一输入光子交换机的多个输入光子交换机,其中所述多个输入光子交换机耦合到所述光子包交换机,其中所述多个输入光子交换机用于耦合到包含第一TOR交换机的多个架顶(TOR)交换机,其中当所述光子包交换机的第一输出端口在第一时间段期间可用时,所述第一输入交换机用于将第一包从所述第一TOR交换机引导至所述光子包交换机,并且其中当所述光子交换结构的所述第一输出端口在所述第一时间段期间不可用时,所述第一输入光子交换机用于将所述光子包返回到所述第一TOR交换机。
前文已相当广泛地概述了本发明的一个实施例的特征,以便可以更好地理解下文本发明的详细说明。下文中将描述本发明的实施例的另外的特征和优点,这些另外的特征以及优点形成本发明的权利要求书的主题。所属领域的技术人员应了解,所公开的概念和具体实施例可以容易地用作修改或设计用于实现本发明的相同目的的其它结构或方法的基础。所属领域的技术人员还应意识到,此类等效构造不脱离如在所附权利要求书中所阐述的本发明的精神和范围。
附图说明
为了更完整地理解本发明及其优点,现在参考下文结合附图进行的描述,其中:
图1图示实施例数据中心;
图2图示实施例星形架构;
图3图示实施例环形架构;
图4图示到光子包交换机的传入竞争光子包;
图5图示竞争包通过光子包交换机的解决;
图6图示用于竞争解决的实施例光子交换结构;
图7图示具有竞争解决的另一实施例光子交换结构;
图8图示解决竞争光子包的实施例方法的流程图;
图9图示用于竞争解决的另外实施例光子交换结构;
图10图示吞吐量与交换机大小的曲线图;
图11图示光子交换结构中的输出负载均衡;
图12图示光子交换结构中的输入负载均衡;
图13图示用于竞争解决的另一实施例光子交换结构;
图14图示包的数目与根据接口负载的用于每一输出端的交换机缓存器的曲线图;
图15图示通过软件定义网络(SDN)控制的实施例光子网络。
图16图示用于竞争解决的实施例光子交换架构;
图17图示用于竞争解决的另一实施例光子交换架构;
图18图示用于竞争解决的另外实施例光子交换架构;
图19图示用于解决竞争光子包的实施例方法的流程图;
图20图示用于混合光子包交换的实施例系统;
图21A至C图示用于光子包交换系统的波形和眼图;以及
图22图示用于光子包交换的另一实施例系统。
除非另有指示,否则不同图中的对应标号和符号通常指代对应部分。绘制各图是为了清楚地说明实施例的相关方面,因此未必是按比例绘制的。
具体实施方式
首先应理解,尽管下文提供一个或多个实施例的说明性实施方案,但所公开的系统和/或方法可以使用任何数目的技术来实施,无论该技术是当前已知还是现有的。本发明决不应限于下文所说明的说明性实施方案、附图和技术,包含本文所说明并描述的示例性设计和实施方案,而是可以在所附权利要求书的范围以及其等效物的完整范围内修改。
实现光子包交换的一个挑战是竞争解决。当两个或两个以上包同时尝试交换机的同一输出端口时发生竞争。竞争解决的一个方法是偏转路由。在偏转路由中,竞争通过仅将竞争包中的一者路由到所需输出端口来解决,而其它竞争包被偏转至节点或网络内的另一路径。纯光子包交换中的竞争解决可能涉及异步竞争解决。在实例中,竞争包返回到源。在另一实例中,存在到给定目的地的更多输出端口并且包被发送到可用输出端口中的任一者。在另一实例中,去往输出端口的多个包具有允许首先检查最高优先级可用端口的优先权。
图1图示数据中心100,即,三层数据中心。服务器组104各自含有N个服务器102。服务器组中的服务器连接到架顶(TOR)交换机106,即,最小交换机。服务器102和TOR交换机106组织在机架中。TOR群108,即集群交换机连接到TOR交换机106。存在每TOR群M个TOR交换机以及P个TOR群。TOR群108通过n个并行接口连接到光子交换机110,即,nP×nP光子交换机。在一个实例中,N=48、M=32、P=32、且n=1,所述实例具有50,000个服务器。业务从服务器102的源服务器路由通过TOR交换机106、TOR群108以通过光子交换机110进行交换。接下来,业务路由通过光子交换机112以进行多跳交换。数据中心100可以包含用于单跳交换的一个光子交换机、如图1中所描绘的两个光子交换机或更多光子交换机。光子交换机110和112是空间交换机。在一个实例中,光子交换机110和112是硅光子交换机。业务随后前进通过TOR群108和TOR交换机106到达服务器102的目的地服务器。
可以用于光学无缓存包交换机的另一架构是图2中说明的系统120。光子交换结构122以星形配置连接TOR或TOR群126。TOR或TOR群126连接到子网络124。TOR或TOR群126可以将指定到另一TOR或TOR群的一个或多个包包装成光子帧且将所述帧发送到光子交换机122。光子帧具有经波长编码的标签以表示目的地TOR或TOR群。关于光子帧包装的更多细节在2014年5月15日递交的发明名称为“用于光子交换的系统和方法(System and Methodfor Photonic Switching)”的美国专利申请案HW81091186US02中论述,所述申请案的内容以引入的方式并入本文本中。经包装的光子帧是数据路径的一部分,而标签是控制路径的一部分。经包装的帧可以在数据波段上发送,而标签在控制波段上发送。关于使用用于业务和信令的单独波段的更多细节在2014年4月7日递交的发明名称为“用于光子交换的系统和方法(System and Method for Photonic Switching)”的第14/246,633号美国专利申请案中论述,所述申请案的内容以引入的方式并入本文本中。
在通过图3中的系统130说明的另一个实例中,使用环形架构。TOR交换机134通过高容量光子环132在环中彼此连接。而且,TOR交换机134连接到子网络136。在一个实例中,高容量光子环132具有1.28Tbps的带宽。在另一实例中,使用具有任意速率的多个环的堆。在实施例中,控制信号和数据使用单独的波段。信令波段中的多个波长可以用于TOR或TOR群寻址。信令波段携载路由和管理信息两者。由于环中的节点数目是有限的,因此可以使用有限数目的波长来寻址TOR群。例如,在1550nm范围中的12个波长中,一些波长可以用于寻址环节点且一些波长用于管理和控制。信令波段还可以承载其它控制信号,例如拥塞状态、公平性、以及管理。
在光子包交换中的异步竞争解决的一个方法中,当存在竞争时,一个竞争包被发送到所需输出端口且其它竞争包被发送回到源。在图4中,包224、226、228和230传入到光子交换机222上。光子交换机222具有N个输入端口和2N个输出端口。包224去往输出端口1,包228指定到输出端口2,且包226和包230都去往输出端口3。包226和230是竞争的。
包230在包226之前到达包交换机222。如图5所示,包230被路由到输出端3。当包226到达光子交换机222时,输出端口3已被占据且包226返回到源。源可以再次尝试将包226传输到输出端口3。包可以重试多次。如果包传输最终由于存在对所需输出端口的激烈竞争而未成功,那么包可以被丢弃。因此,在电子域中在源处发生缓存,而不是在光域中在光子交换机处发生缓存。
图6图示光子包交换机242。包交换机包含用以从源TOR或TOR群接收包的N个输入端口、用以将竞争包返回到源TOR交换机的N个返回输出端口,以及用以将包传输到目的地TOR交换机的N个输出端口。用以将光子包返回到源TOR或TOR群的另外的链路被称作竞争链路。因此,光子包交换机242具有N个输入端口和2N个输出端口。
图7图示光子交换系统160。输入TOR交换机162耦合到光子交换结构166。具体而言,输入TOR交换机162将光学包传输到输入交换机170。输入交换机170是将光子包路由到光子交换机172或路由回到源TOR交换机的1:2光子交换机。交换机竞争控制件168协调输入交换机170。当包标签(或标头)由输入交换机接收时,所述包标签向交换机竞争控制件咨询目的地端口是否可用。当目的地端口可用时,包路由到光子交换机172。包穿过通过交换机控制器设定的光子交换机172内的交换元件,以到达前往目的地TOR交换机164的输出端。当输出端口不可用时,光子包交换回到源TOR。光子交换机172是32×32光子交换机。在一个实例中,光子交换机172是硅光子交换机。
图8图示用于光子包交换的方法的流程图250。初始地,在步骤252中,光子交换结构从源接收光子包标签,例如,从源TOR交换机。接收到的光子包去往特定输出端口。
随后,在步骤254中,光子交换结构确定目的地输出端口是否可用。当在进行请求时存在被路由到该输出端口的光子包时,目的地输出端口不可用。当目的地输出端口不可用时,光子交换结构前进到步骤256,且当目的地输出端口可用时,光子交换结构前进到步骤258。
在步骤256中,光子交换结构将光子包返回到其源TOR交换机。另外的输出端口用于将包路由回到源TOR交换机。源TOR交换机可以再次尝试将包传输到目的地输出端口。
在步骤258中,光子包被路由到光子交换机的所请求输出端。2:1光子交换机可以用于将包路由到光子交换机或路由回到源TOR交换机。光子交换结构可以是N×N无缓存光空间交换机。
最终,在步骤262中,通过检查标签信息,光子包经由通过交换机控制器建立的路径发送到目的地TOR交换机。
在另一实施例光子交换结构中,竞争光子包被路由到若干输出端口中的一者。可以使用负载均衡。图9图示用于使用到结构的扩大部分的偏转来解决竞争的光子交换系统180。输入TOR交换机182将光子包传输到光子交换结构184。
负载均衡通过负载均衡块198执行。负载均衡将业务负载均等地分布到输出端口,从而防止丢包或减少丢包。当负载均衡有效时,输入端和输出端具有相似的业务分布。
标头在包之前通过源TOR交换机发送。在一个实例中,标头指示目的地地址将路由通过目的地端口的三个选择中的任一者。标签被发送到两个输入端口中的任一者且由标签检测器188读取。在一个实例中,目的地地址是经波长编码的,其中每一波长指示用于目的地地址的位。所述波长具有两个功率电平。低功率可以表示0且高功率可以表示1,或反之亦然。关于波长编码的更多细节在2013年5月24日递交的发明名称为“用于多波长编码的系统和方法(System and Method for Multi-Wavelength Encoding)”的第13/902,085号美国专利申请案中论述,所述申请案的内容以引入的方式并入本文本中。
目的地地址被传递到交换机控制器190。交换机控制器190执行竞争分析和调度。在一个实例中,所述交换机控制器决定三个输出端口中可用的输出端口且选择光子交换机来连接包在其上到达该输出端口的输入端。给定存在具有适当扩大级的负载均衡器,所述选择都不可用是可能的,但可能性不是很大。在这种情况下,包丢失。
当包由光子交换结构184接收时,其通过光子交换机186路由,所述光子交换机为将包路由到光子交换机192、光子交换机194或光子交换机196的适当输入端的2×3光子交换机。光子包随后被交换到适当的输出端口且被发送到输出TOR交换机185。包基于决策通过连接到连接路径中的交换单元上的交换机控制器190进行交换。在此实例中,光子包交换机184具有N个输入端口和1.5N个输出端口。每一TOR在两条链路上发送出包并且在3条链路上接收包。在一个实例中,针对光子交换结构184存在N个输入端口和1.4N个输出端口。对于不具有缓存器、满载业务和到输出端的均匀负载分布的N×N光子交换机,N个包中的n者同时竞争同一输出端的概率是N个包中的n者同时到达同一输出端口的概率。使用伯努利分布,所述概率通过以下公式给出:
系统的吞吐量T通过至少一个包指定到输出端k的所有k个概率的总和除以N给出,其通过以下公式给出:
然而,给定负载的对称性以及均匀分布的包的假设,吞吐量通过以下公式给出:
图10图示根据N的吞吐量400的曲线图。对于较大N,吞吐量T趋于1-1/e=63%。因此,37%的包将丢失,因为不存在用以吸收这些包的缓存器。这表示添加40%的另外的链路可以吸收这些竞争包。在一些实例中,输出链路的数目是输入链路的数目的1.35倍、1.37倍、1.4倍、1.5倍、1.67倍、1.75倍或2倍。
图11图示具有处理λ个业务的一个输入链路和各自处理λ/N个业务的N个输出端的输出负载均衡光包交换机202。在负载均衡中,均匀地分布到达所有目的地的业务。
图12图示具有N个输入端和一个输出端的输入负载均衡光包交换机214。N个输入端各自处理λ/N个业务,而输出端处理λ个业务。
图13图示光子交换系统410,相较于光子交换系统180,所述光子交换系统具有更多扩大以及对负载均衡的较少依赖性。可能存在负载均衡。光子交换结构414含有N个输入端口和2N个输出端口。输入TOR交换机412耦合到光子交换结构414。
当在所有输出端上存在负载的均匀分布时,可以计算出缓存要求。可能存在发送到竞争链路的最大数目的包。对缓存器要求的计算可以使用泊松分布。而此分布可能低估数据网络的缓存器大小,甚至此经低估的缓存器大小在光子交换机中是成问题的。假定交换机具有用于每一输出端的K个容器,其中每一容器可以存储一个包,当在包的传输期间到达的包的数目超过缓存器大小K时,另外的包将丢失或受到阻挡。阻挡概率可以使用M/M/1/K系统获得。在此系统中,第一M表示包或包层的到达的泊松分布,且第二M表示包或包层到输出端口的传输时间(或服务时间),1表示到输出目的地的交换机链路的数目,且K表示可以保持用于每一输出端口的包或包层的数目。根据每一链路的业务负载ρ的阻挡概率,其中:
其中λ是包到达速率且μ是服务速率,所述阻挡概率通过以下公式给出:
可以关于ρ和PK将K表示为:
图14示出曲线图480,其中与每一链路上的业务负载比较绘制用以保持包或包层所需的容器的数目。此曲线图绘制用于PK=10-6的目标丢包。对于99%的业务负载(接近链路速率的传输),用以实现10-6的丢包或包层丢失的容器数目为约500。在光子交换机的每一链路上具有此缓存器大小是成问题的。
标头在光子包之前发送。所述标头含有光子包的输出端口的四个选择。这四个选择可以具有相同优先级并且可以通过单表表示,或者可以具有通过网络控制器分配的不同优先级。所述标头通过标签检测器422读取。在一个实例中,所述标头是经波长编码的,其中波长上功率的存在或不存在指示目的地地址的一位。
经解码地址被发送到交换机控制器418。交换机控制器418确定所请求的输出端口中可用的输出端口。当输出端口具有相同优先级时,可以分配输出端中的任一者。当输出端口具有不同优先级时,将可用的最高优先级输出端口授予光子包。一些包可能被丢弃,但是包被丢弃的概率较低。
当包由光子交换结构414接收时,所述包通过2×4输入交换机420中的一者路由。这些交换机确定包被交换到哪个输入端。
随后,光子交换机426、428、424和430交换光子包。这些光子交换机可以是硅光子空间交换机。交换机控制器418配置光子交换机以路由光子包。
经交换的光子包被输出到目的地TOR交换机416。
图15图示系统351,即,具有用于通过多个无缓存光子交换机进行光子帧交换的软件定义网络(SDN)的无存储光学数据面。系统351具有边缘缓存器架构。TOR 359耦合到接入网络355。TOR 358将包传递到光子交换核心357用于进行交换。
SDN控制器353用于基于源的路由。SDN控制器353有助于光子包交换的可编程控制而不需要物理接入光子交换机,从而有助于基于源的路由。SDN控制器353监管网络级路由。
光子交换核心357含有包装器361,所述包装器包装包以产生经包装的光子帧。包装器361移除包之间的IPG并且串接包,从而在光子帧之间形成间隙。所述间隙可以约等于经移除的IPG的总和。在光子交换核心357中,节点级路由使用竞争和负载均衡器。
此实施例具有介接在电子接入网络与光子核心交换机之间的边缘光子交换设备。边缘光子交换机可以使用包装器方案来作为光子帧发送包。
图16图示用于路由竞争光子包的系统440。光子交换结构442是N×1.4N光子交换结构。在另一实例中,光子交换结构442是N×1.5N光子交换结构。光子交换结构耦合到TOR交换机444,所述TOR交换机以环形或菊花链配置耦合。环容量等于光子交换机中假定的另外扩大。在一个实例中,环是配备有分路器和放大器的无源环。如果包目的地地址与节点地址或属于附接到此节点上的网络的地址匹配,那么偏转的包标头可以通过所有环节点(TOR交换机或TOR群)进行检查并且通过所述节点收集。通过到光子无缓存环的偏转,包被引导至它们的目的地。所述环具有0.4N的容量,其中0.4指示环的容量,而不是链路的数目。例如,如果接口是100Gbps且N=100,从而导致10Tbps交换机,那么相等的0.4N容量的接口是40个100Gbps的接口。如果竞争链路是1.28Tbps链路,那么1.28Tbps的三个或四个接口可以用于处理环上的竞争业务。
图17图示系统450,即,用于路由光子交换结构中的竞争包光子包的另一系统。在光子交换结构452,即N×N光子交换结构与TOR交换机454和458之间存在多个接口。光子交换结构452的N个接口各自具有m条链路。例如,如果每一接口是100G,那么所述接口由m=1010G条链路组成。在这种情况下,存在将TOR交换机连接到光子交换机的10G接口(1010G接口)。存在将光子交换机连接到TOR交换机的至少1.4*m*10G接口(1410G接口)。负载均衡器456均衡TOR交换机454与TOR交换机458之间的负载。负载均衡器456监视链路的负载以确定TOR交换机或TOR群是否存在过载情况。如果存在过载情况,那么负载均衡器456进行业务均衡动作以消除或最小化由于无法通过40%的另外的链路吸收的竞争而引起的丢包。所述负载均衡器是任选的。
图18图示用于通过第二交换机路由竞争光子包以处理另外的业务的系统140。光子交换结构146,即N×N光子交换结构耦合到TOR交换机142和144。负载均衡器150在链路之间均衡负载。光子包交换结构146从TOR交换机接收光子包。当所请求的输出端口不可用时,光子交换结构146将包路由到路由竞争包的交换结构148。在一个实例中,交换结构148是较小的光子交换机。替代地,交换结构148是电力交换机且可以含有缓存。
图19图示用于使用偏转来解决竞争光子包的方法的流程图460。初始地,在步骤462中,光子交换结构执行负载均衡。当一个或多个链路具有不成比例地高的业务量时,负载得到均衡使得业务从过度利用的链路转移到未充分利用的链路。负载均衡降低丢弃包的速率。负载均衡器均衡连接到TOR交换机或TOR群的服务器上的数据存储,因此光子交换机的输出链路上的业务负载得到均匀分布。在数据存储为在多个位置具有每一信息块的副本的数据中心中的信息块的条件下,负载均衡的方法涉及从连接到TOR的服务器获取数据,从而在交换机输出端上产生均衡需求。
接下来,在步骤464中,光子交换结构接收对应于待交换的光子包的目的地端口请求。目的地端口请求可以呈标头形式。在一个实例中,所述标头是经波长编码的。目的地端口请求指示已请求的光子包交换机的交换结构和输出端口。在一个实例中,目的地端口请求指示光子包交换机与目的地之间的可用输出链路的选择。在其它实例中,目的地端口请求请求前往同一目的地的两个、三个、四个或更多个输出端口。输出端口可以按优先级顺序进行请求。
随后,在步骤466中,光子交换结构确定所请求的目的地端口在所请求时间是否可用。当那时端口用于交换另一光子包时,所述端口不可用。当所请求端口可用时,光子交换结构前进到步骤474,并且当所请求端口不可用时,光子交换结构前进到步骤478。在另一实例中,所有所请求目的地端口具有相同优先级。
在步骤478中,光子交换结构确定是否考虑另一输出端口。当不存在待考虑的输出端口时,在步骤476中可以丢弃包。当优先考虑输出端口请求时,在步骤466中光子交换结构考虑下一个所请求的输出端口。
在步骤474中,光子交换机接收待交换的光子包。经由光纤从TOR交换机接收光子包。
接下来,在步骤470中,光子包进行光学交换。在一个实例中,光子包首先通过2×3或2×4光子交换机交换以将光子包引导至交换结构,已安排所述交换结构将输入端连接到所需输出端。随后,光子包通过交换结构交换。光子包交换机是光空间交换机。在另一实例中,光子包通过大型光子交换机接收。当所请求的输出端口可用时,光子交换机通过大型光子交换机交换。当所请求的输出端口不可用时,光子包被发送到处理溢流的较小交换机。光子包随后通过较小交换机交换,所述较小交换机可以是光交换机或电力交换机。替代地,仅使用一个交换机。
最终,在步骤472中,传输经交换的光子包。例如,经交换的光子包沿着光纤传输到目的地TOR交换机。
实施例光子交换结构在不使用光缓存器的情况下异步地偏转光子包。实施例使用光空间交换机来代替阵列波导光栅(AWG)。可以使用单跳或多跳无缓存光子空间交换机。在电域中在TOR交换机处执行缓存,而不是在光域中在光子交换结构中执行缓存。
图20图示具有电力交换机298和光子交换机306的实施例系统270,其中短包通过电力交换机298交换且长包通过光子交换机306交换。实施例系统将短包与长包分离。竞争解决可以应用于系统270的光子交换机。关于其中短包通过电力交换机交换且快速包通过光子交换机交换的包交换系统的另外的细节在2013年5月24日递交的发明名称为“用于分流包流的系统和方法(System and Method for Steering Packet Streams)”的第13/902,008号美国专利申请案中论述,所述申请案的内容以引入的方式并入本文本中。
服务器272和274耦合到TOR交换机280,而服务器276和278耦合到TOR交换机282。用于TOR交换机280和TOR交换机282的光信号分别通过光至电转换器284和286转换到电域。
处理器288处理包,所述处理器即可以是TOR交换机280和282的一部分的现场可编程门阵列(FPGA)。传入包通过入节点291和入节点294处理,而传出包通过出节点292和出节点296处理。在TOR交换机280和282与处理器288之间的链路是10千兆以太网。在入节点291和入节点294中,长包与短包分离。长包通过解决包竞争而准备用于光子交换。竞争长包通过在288中的竞争控制来处理。在解决竞争之后,对包进行压缩且对其进行按位加扰,并且添加光子目的地标签。标签跟随有经加扰媒体接入控制(MAC)帧。通过对长包进行压缩,存在足够的包间间隙用于插入光子标签,且存在更多的时间用于光子交换机连接建立且用于在目的地聚合交换机处的接收器同步。包压缩通过升高在输出物理层上的时钟速率来实现。长包在11.35Gb/s处超频10%。标签在11.35Gb/s处是短模式。关于包压缩的另外的细节由2013年5月24日递交的发明名称为“用于加速和减速包的系统和方法(System andMethod for Accelerating and Decelerating Packets)”的第13/901,944号美国专利申请案提供,所述申请案的内容以引入的方式并入本文本中。
在出节点292和出节点296中,执行反向操作。接收光子长包和电子短包。对包进行重新排序且将其作为互联网协议(IP)/以太网包朝向目的地TOR交换机转发。
随后通过电至光转换器290、293、295以及297将经处理包从电域转换到光域。短包被路由到电至光转换器290和295且通过电力交换机298继续进行交换。
长包被路由到光子交换机306,即4×4锆钛酸铅镧(PLZT)光子交换机。光子交换机306的交换时间为约10ns到20ns。光纤分路器301将功率的10%引导至光至电转换器302。电信号用于通过交换机控制器304控制光子交换机306,所述交换机控制器即基于FPGA的交换机控制器。光纤延迟线303使信号延迟足够长以使交换机控制器在包到达之前读取光子标签且设定交换机连接。
图21A至C图示来自图20中的系统270的结果。服务器272发送具有四个不同目的地MAC地址的以太网包,其各自指定到光子交换机306的不同光子输出端口。图21A图示具有在光子交换机306的四个输出端口上的包波形的曲线图310。光接收器电压极性倒转,在不存在光时具有水平线且在存在经交换包时具有波形。
图21B图示具有光子交换机306的输出端口1和2的详细输出包波形的曲线图320。输出端1完成光子帧传输,且输出端2开始发送前导和光子标签。交换机响应时间是12ns,用于接收器同步的残余前导是15ns,且起始帧分隔符(SFD)时间是12ns。
图21C图示具有经交换信号的眼图的曲线图330。由于总处理时间是130ns,因此用于控制处理的延迟大约是130ns减交换机响应时间减残余前导时间,或103ns。此延迟可以通过21m的延迟线来补偿。
图22图示系统340,即,使用光空间交换的实施例光子交换系统。系统340可以是图7中的光子交换系统160的实施方案。单独的波段用于控制信号路径和净荷数据路径。光子路由标签用于前向路径上。返回路径上的信令用于竞争控制和同步。
系统340通过部署光子交换机的2个输入端和4个输出端来使用实施例。另外的输出端携载竞争包。
服务器网络342通过模拟器344和模拟器346来模拟。模拟器344和346含有小形状因子可插拔收发器(SFP)348、350、352和354,所述收发器连接到TOR交换机356、358、360和362。信号被发送到FPGA 366。
在FPGA 366中,通过SFP 368接收信号。这些信号通过前端适配器372前进。通过标签产生器374产生标签。通过SFP 378将信号和群输出到光子交换结构386和FPGA 390。
通过光至电转换器398将标签的光信号转换成电信号,且通过FPGA390接收标签的所述光信号。通过处理器396来处理所述光信号。随后,通过控制信号提取器394来提取控制信号。随后通过低压差分信号(LVDS)将控制信号转换到晶体管-晶体管逻辑(TTL)板392。
数据波路径信号和信令波路径信号通过多路复用器380进行多路复用,其中数据在40GE处且信令在10GE处;且所述数据波路径信号和所述信令波路径信号被输出到光子交换结构386。来自FPGA 390的控制信号也被输入到光子交换结构386。光子交换结构386是4×4光空间交换机。所述信号进行交换且被输出到FPGA 366。
通过多路分用器382和SFP 378接收所述信号。通过后端适配器376处理所述信号。通过FPGA夹层卡(FMC)将信号转换到超小型A型(SMA)转换器370。信号通过电至光转换器364转换成光信号,且前进到TOR交换机356、358、360和362。
虽然本发明中已提供若干实施例,但应理解,在不脱离本发明的精神或范围的情况下,本发明所公开的系统和方法可以以许多其它特定形式来体现。本发明的实例应被视为说明性而非限制性的,且本发明并不限于本文本所给出的细节。例如,各种元件或组件可以在另一系统中组合或合并,或者某些特征可以省略或不实施。
此外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、系统、子系统和方法可以与其它系统、模块、技术或方法进行组合或合并。展示或论述为彼此耦合或直接耦合或通信的其它项也可以采用电方式、机械方式或其它方式通过某一接口、设备或中间组件间接地耦合或通信。其它变化、替代和改变的示例可以由所属领域的技术人员在不脱离本文所公开的精神和范围的情况下确定。
Claims (21)
1.一种光子包交换的方法,其特征在于,所述方法包括:
通过光子交换结构从第一架顶(TOR)交换机接收对应于第一光子包和第一时间段的目的地端口请求,其中所述目的地端口请求包括第一输出端口;
确定所述第一输出端口在所述第一时间段期间是否可用;
通过所述光子交换结构从所述第一TOR交换机接收所述第一光子包;
当所述第一输出端口在所述第一时间段期间可用时,将所述第一光子包路由到所述第一输出端口;以及
当所述第一输出端口在所述第一时间段期间不可用时,将所述第一光子包路由到替代输出端口,所述替代输出端口用于将所述第一光子包路由到目的地TOR交换机或者将所述第一光子包路由回到所述第一TOR交换机。
2.根据权利要求1所述的方法,其特征在于,进一步包括负载均衡耦合到所述光子交换结构的多个TOR交换机,其中所述多个TOR交换机包括所述第一TOR交换机。
3.根据权利要求1所述的方法,其特征在于,所述目的地端口请求包括第二输出端口,其中将所述第一光子包路由到所述替代输出端口包括确定所述第二输出端口在所述第一时间段期间是否可用,并且其中当所述第二输出端口在所述第一时间段期间可用时,所述替代输出端口是所述第二输出端口。
4.根据权利要求1所述的方法,其特征在于,将所述第一光子包路由到所述替代输出端口包括:
将所述第一光子包路由到替代包交换机;以及
通过所述替代包交换机交换所述第一光子包。
5.根据权利要求1所述的方法,其特征在于,确定所述第一输出端口在所述第一时间段期间是否可用包括确定第二光子交换机在所述第一时间段期间是否被路由到所述第一输出端口。
6.一种光子交换结构,其特征在于,包括:
第一光子交换机;以及
交换机控制器,其耦合到所述第一光子交换机,其中所述第一光子交换机用于耦合到多个架顶(TOR)交换机,其中所述第一光子交换机包括多个输入端口和多个输出端口,其中所述多个输出端口多于所述多个输入端口,其中所述交换机控制器用于根据第一目的地端口请求确定第一输出端口在第一时间段期间是否可用,其中当所述第一输出端口在所述第一时间段期间可用时,所述第一光子交换机用于将第一输入端口连接到所述第一输出端口,并且其中当所述第一输出端口在所述第一时间段期间不可用时,所述第一光子交换机用于将所述第一输入端口连接到第二输出端口,所述第二输出端口用于将第一光子包路由到目的地交换机或者将所述第一光子包路由回到所述第一光子交换机。
7.根据权利要求6所述的光子交换结构,其特征在于,进一步包括用于对所述第一目的地端口请求进行解码的标签检测器。
8.根据权利要求6所述的光子交换结构,其特征在于,所述第一光子交换机进一步用于耦合到负载均衡器。
9.根据权利要求6所述的光子交换结构,其特征在于,所述第二多个输出端口是所述第一多个输入端口的至少1.35倍。
10.根据权利要求9所述的光子交换结构,其特征在于,所述第二多个输出端口是所述第一多个输入端口的至少两倍。
11.根据权利要求6所述的光子交换结构,其特征在于,所述多个TOR交换机配置在环中。
12.根据权利要求6所述的光子交换结构,其特征在于,进一步包括耦合到所述第一光子交换机的第二交换机。
13.根据权利要求12所述的光子交换结构,其特征在于,所述第二交换机是第二光子交换机。
14.根据权利要求12所述的光子交换结构,其特征在于,所述第二交换机是电力交换机。
15.根据权利要求12所述的光子交换结构,其特征在于,所述第一光子交换机的所述第二输出端口连接到所述第二交换机。
16.根据权利要求6所述的光子交换结构,其特征在于,所述第一光子交换机是硅光子交换机。
17.根据权利要求6所述的光子交换结构,其特征在于,所述第一光子交换机是光空间交换机。
18.根据权利要求6所述的光子交换结构,其特征在于,所述光子交换结构用于耦合到软件定义网络(SDN)控制器。
19.一种光子交换结构,其特征在于,包括:
光子包交换机;以及
多个输入光子交换机,其包括第一输入光子交换机,其中所述多个输入光子交换机耦合到所述光子包交换机,其中所述多个输入光子交换机用于耦合到包括第一TOR交换机的多个架顶(TOR)交换机,其中当所述光子包交换机的第一输出端口在第一时间段期间可用时,所述第一输入交换机用于将第一光子包从所述第一TOR交换机引导至所述光子包交换机,并且其中当所述光子包交换机的所述第一输出端口在所述第一时间段期间不可用时,所述第一输入光子交换机用于将所述第一光子包路由到目的地TOR交换机或者将所述第一光子包返回到所述第一TOR交换机。
20.根据权利要求19所述的光子交换结构,其特征在于,进一步包括耦合到所述多个输入光子交换机的交换机控制器,其中所述交换机控制器用于接收包括所述第一输出端口的第一目的地请求,并且其中所述交换机控制器用于确定所述第一输出端口在所述第一时间段期间是否可用。
21.根据权利要求19所述的光子交换结构,其特征在于,所述第一输入光子交换机是2:1光子交换机。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361822180P | 2013-05-10 | 2013-05-10 | |
US61/822,180 | 2013-05-10 | ||
PCT/US2014/037724 WO2014183126A1 (en) | 2013-05-10 | 2014-05-12 | System and method for photonic switching |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105210316A CN105210316A (zh) | 2015-12-30 |
CN105210316B true CN105210316B (zh) | 2018-04-20 |
Family
ID=54956176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480024668.8A Expired - Fee Related CN105210316B (zh) | 2013-05-10 | 2014-05-12 | 用于光子交换的系统和方法 |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP2995023B1 (zh) |
CN (1) | CN105210316B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105681932B (zh) * | 2016-03-31 | 2018-10-02 | 中国人民解放军国防科学技术大学 | 一种支持大规模、全光互连的光交换机 |
CN107317765B (zh) * | 2016-04-26 | 2021-02-12 | 华为技术有限公司 | 管理路径信息的方法和装置 |
CN110582033B (zh) * | 2018-06-11 | 2022-03-11 | 台达电子工业股份有限公司 | 智能定义光隧道网络系统与网络系统控制方法 |
US11075803B1 (en) * | 2020-06-02 | 2021-07-27 | Cisco Technology, Inc. | Staging configuration changes with deployment freeze options |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3630084B2 (ja) * | 2000-08-29 | 2005-03-16 | Kddi株式会社 | 反射経路制御の方法及びそれを行う光パケット交換機 |
US20060165081A1 (en) * | 2005-01-24 | 2006-07-27 | International Business Machines Corporation | Deflection-routing and scheduling in a crossbar switch |
WO2007056713A2 (en) * | 2005-11-04 | 2007-05-18 | The Trustees Of Columbia University In The City Of New York | An optical network |
US8503879B2 (en) * | 2010-10-25 | 2013-08-06 | Nec Laboratories America, Inc. | Hybrid optical/electrical switching system for data center networks |
-
2014
- 2014-05-12 CN CN201480024668.8A patent/CN105210316B/zh not_active Expired - Fee Related
- 2014-05-12 EP EP14794695.8A patent/EP2995023B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2995023A1 (en) | 2016-03-16 |
EP2995023B1 (en) | 2019-11-27 |
EP2995023A4 (en) | 2016-05-25 |
CN105210316A (zh) | 2015-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9661405B2 (en) | System and method for photonic switching | |
CN105165024B (zh) | 用于光子交换的系统和方法 | |
CN105164952B (zh) | 用于光子交换的系统和方法 | |
CN106134116B (zh) | 采用pic交换机的可扩展光分组结构的装置与方法 | |
CN103891224B (zh) | 具有集成的服务器件的分布式机箱架构 | |
US8983292B2 (en) | Electrical signal packet routing | |
CN105099556B (zh) | 一种数据中心网络以及部署所述数据中心网络的方法 | |
CN103916326B (zh) | 用于数据中心的系统、方法以及设备 | |
CN105721358B (zh) | 多跳分布控制面和单跳数据面交换结构系统的方法和装置 | |
CN107407777A (zh) | 用于光网络的系统和方法 | |
WO2018183553A1 (en) | Non-blocking any-to-any data center network having multiplexed packet spraying within access node groups | |
CN105210316B (zh) | 用于光子交换的系统和方法 | |
CN105187331B (zh) | 在交换机的分布式控制面内的动态资源管理的系统 | |
CN106817288A (zh) | 一种数据中心网络系统及信号传输系统 | |
US20200359117A1 (en) | Incrementally scalable, two-tier system of robotic, fiber optic interconnect units enabling any-to-any connectivity | |
JP2857931B2 (ja) | 大容量モジュールatmスイッチ | |
CN105917606A (zh) | 用于光子网络的系统及方法 | |
EP4008068A1 (en) | Incrementally scalable, multi-tier system of robotic, fiber optic interconnect units enabling any-to-any connectivity | |
Li et al. | Performance analysis and experimental demonstration of a novel network architecture using optical burst rings for interpod communications in data centers | |
CN106576016B (zh) | 数据传输的方法和媒体接入控制器 | |
TWI776294B (zh) | 光框架交換機 | |
CN107634920A (zh) | 一种数据传输系统 | |
Comellas et al. | Optical Interconnection for Datacenters: To Switch or Not to Switch | |
KR20170006743A (ko) | 파장-공간-시간 광 스위칭을 위한 전광 스위칭 네트워크 장치 및 그 방법 | |
Comellas Colomé et al. | Optical interconnection for datacenters: To switch or not to switch |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180420 |
|
CF01 | Termination of patent right due to non-payment of annual fee |