CN105009602A - 无源连接光模块 - Google Patents
无源连接光模块 Download PDFInfo
- Publication number
- CN105009602A CN105009602A CN201380069129.1A CN201380069129A CN105009602A CN 105009602 A CN105009602 A CN 105009602A CN 201380069129 A CN201380069129 A CN 201380069129A CN 105009602 A CN105009602 A CN 105009602A
- Authority
- CN
- China
- Prior art keywords
- node
- link
- plug
- passcom
- destination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q11/00—Selecting arrangements for multiplex systems
- H04Q11/0001—Selecting arrangements for multiplex systems using optical switching
- H04Q11/0003—Details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/30—Peripheral units, e.g. input or output ports
- H04L49/3027—Output queuing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/30—Peripheral units, e.g. input or output ports
- H04L49/3045—Virtual queuing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Mechanical Coupling Of Light Guides (AREA)
- Mechanical Light Control Or Optical Switches (AREA)
Abstract
公开一种无源连接光模块(“PassCOM”)。PassCOM是不带有切换功能的无源设备。PassCOM使用可替换插头连接多个节点之间的链路。设备可以用于内部节点间切换系统,其中每个节点能够使用特定链路将数据发送到目的地。源节点通过连接至来自PassCOM中的目的地节点的链路的具体链路来发送数据。首先,通过连接源节点和PassCOM的链路从源节点发送数据,然后使用用于连接PassCOM和目的地的链路通过插头发送数据到目的地。
Description
技术领域
本公开涉及用于在全网状网络中发送数据的方法。本公开尤其涉及经由多个链路和多个中间节点分配和发送数据。
背景技术
高速系统要求处理引擎之间的全连接。处理引擎(“节点”)具有一定处理容量。处理引擎典型地与在其物理位置例如特定线路卡、搁置架或机架上进行限制的硬件源的特定集合关联。
传统上,利用以下两种方法中的一种,节点间连接可以用在通信和计算工业中:(i)交换机连接和(ii)全网状连接。交换机连接的实例为使用节点间的交换平台的Clos交换。想要发送数据到另一个节点的每个节点将数据发送到交换机。交换机将数据或者发送到单个目的地节点,或者发送到多个目的地节点(广播或组播)。交换机连接的一个缺点是随着节点数量增加,交换机尺寸和复杂度增加。带有更大数量的节点的交换机要求更多处理功率,例如来容纳交换机开销和容纳在将从多个节点到相同节点的业务进行计划中的低效率。
在全网状连接中,每个节点与所有其它节点(点到点连接)连接。当源节点将数据发送到目的地节点时,其在直接连接至目的地节点的链路上发送数据。在多路广播业务的情况下,源节点在本地将数据相乘,并且将复件经由直接连接至目的地节点的链路发送到目的地节点。全网状连接具有一定缺点。例如,当附加的节点被添加到系统中时,来自每个现有节点的至少一个链路被相互从对方拔掉并且被插进新的节点。要被重新插接的链路的数量等于或大于现有节点的数量,或者必须增加新的链路。
在典型的全网状连接中,M个链路和N个节点的系统,其中每个节点具有容量CN,要求每个节点能够容纳至少(N-1)*CN的总容量。在这个情况下,链路的数量可以至少为(N-1)*CN/CL,其中CL对应于单个链路容量。另外,在N个节点以全网状连接之后,将附加节点添加到系统使得性能降级,除非每个节点的总链路数量M增加。
发明内容
公开一种无源连接光模块(“PassCOM”)。PassCOM使用可替换插头连接全网状的多个节点之间的链路。源节点通过连接到来自PassCOM中的目的地节点的另一条链路的具体链路发送数据。链路通过可替换插头连接。
在本公开的一个方案中,一种无源网络切换装置包括用于耦合至多个网络元件的多个前端连接器。该装置还包括至少一个可替换插头和至少一个用于接收所述至少一个可替换插头的至少一个后端连接器。该装置还包括无源地将多个前端连接器耦合至所述至少一个后端连接器的多条链路。所述至少一个可替换插头配置为以全网状耦合多个网络元件。
另外的特征可以出现在本公开的方案中。例如,装置的多个网络元件可以包括至少一个处理引擎。无源网络切换装置的多个网络元件还可以包括耦合到至少一个处理引擎的至少一个网络路由器。该装置的多条链路包括光纤。该装置的每个前端连接器可以耦合至所述至少一个后端连接器。该装置的每个后端连接器还可以接收对应的可替换插头。该装置的两个后端连接器可以接收所述至少一个可替换插头中的第一可替换插头。无源网络切换装置的每个可替换插头还可以配置为耦合不同网络元件。
在本公开的方案中,一种方法包括将多个前端连接器经由多条链路耦合至多个网络元件。该方法还包括将多个前端连接器经由多条链路耦合到至少一个后端连接器并且由该至少一个后端连接器接收至少一个可替换插头。该至少一个可替换插头配置为以全网状耦合多个网络元件。
在本公开的另一个方案中,方法包括移除至少一个可替换插头中的第一可替换插头。该方法还包括插入第二可替换插头。
附图说明
图1显示根据本公开的方案将处理单元连接至网络的节点。
图2显示根据本公开的方案汇编主单元的流程图。
图3显示根据本公开的方案处理接收的主单元的流程图。
图4显示根据本公开的方案的重排序逻辑的流程图。
图5显示根据本公开的方案带有与主单元对应的比特的分组结尾数据库和序列号。
图6显示根据本公开的方案在分布式无交换机互连系统中从源节点经由直接链路和间接链路传播到目的地节点的数据。
图7显示根据本公开的方案在分布式无交换机互连系统中接收数据和将数据发送到另一个节点的节点。
图8显示根据本公开的方案的带有不同容量的链路的分布式无交换机互连系统。
图9显示根据本公开的方案的带有节点之间的不同数量链路的分布式无交换机互连系统。
图10显示根据本公开的方案的带有断开的链路的分布式无交换机互连系统。
图11显示以全网状连接的系统。
图12显示根据本公开的方案的连接多个节点的PassCOM。
图13显示根据本公开的方案的连接多个节点的PassCOM的内部链路布置。
图14A显示根据本公开的方案利用设计为连接四个节点的插头将两个节点连接的PassCOM的内部链路布置。图14B显示根据本公开的方案利用设计为连接两个节点的插头将两个节点连接的PassCOM的内部链路布置。
图15显示根据本公开的方案利用两个插头将四个节点连接的PassCOM的内部链路布置。
图16显示根据本公开的方案利用两个前端连接器和四个后端连接器将四个节点连接的PassCOM的内部链路布置。
图17显示根据本公开的方案的连接多个节点的两个PassCOM。
图18显示根据本公开的方案的连接多个节点的两个PassCOM的内部链路布置。
具体实施方式
根据本公开的方案,提供带有无源互连和分布式无交换机切换的多机箱路由器。这个系统以全网状连接多个节点,并且允许数据的直接和间接传输。多机箱路由器可以用于在多簇计算环境中连接计算处理器。另外,多机箱路由器可以连接计算处理器和存储处理器。路由器使用无源连接光模块(“PassCOM”)以简化用于设置或更新全网网络的过程。PassCOM是不包括电子组件的无源设备。
物理节点结构和节点功能
图1显示用于将处理单元105连接到网络的节点100。节点100使用链路110连接至处理单元105并且连接至其他节点。节点110使用链路110提供处理单元105和在线路卡、搁置架、机架或其他物理位置上分配的其他处理单元之间的连接。
处理单元105为节点100的客户端。在通信系统中,处理单元105可以例如为连接至外部接口106的网络处理器。处理单元105检查从接口106接收的分组并且基于路由和/或切换操作确定接收的分组的目的地。其他分组信息,例如服务质量(Quality of Service,QOS)、队列和修改可以用于确定目的地。目的地可以为用于单播通信的单个处理单元,或可以为用于组播通信的多个处理单元。
当来自处理单元105的数据分组到达时,分组可以发送到切换单元103,其然后将分组发送到其它节点。在该情况中,分组可以直接发送到其他节点。汇编单元101可以将分组序列号写在发送到其他阶段的分组的头部上。可替选地,当分组到达时,汇编单元101可以将分组汇编到主单元并且将主单元通过切换单元103发送到其它节点。汇编单元101可以将主单元序列号写入主单元的头部中。
图2显示汇编主单元的流程图。汇编单元101接收分组(步骤210)并且基于它们目的地而对分组进行分割(步骤220)。汇编单元101将每个分组添加到包括相同目的地的分组的主单元(步骤230)。如果有并未被完全填充的主单元存在,那么汇编单元101将分组添加到现有主单元。否则,汇编单元101形成新的主单元并且将填充的主单元释放到虚拟输出队列(VOQ)(步骤240)。如果分组超过主单元的长度,汇编单元将填充并且发送填充的主单元,并且分组的剩余部分位于下一个主单元中。下一个主单元等待下一个分组。
释放的主单元写入在外部存储器中的VOQ(步骤250)。VOQ逻辑保持每个目的地节点至少一个队列。所以假如对特定目的地有背压(在具体链路处的数据的建立),那么仅有与特定目的地有关的队列或队列中主单元的发送会被阻止。其它目的地的队列中的其它主单元可以继续被发送。当主单元准备被发送时,从存储器读取主单元(步骤260)并且将主单元发送至其它节点(步骤270)。VOQ可以由主单元生成过程来独立管理,其中汇编单元仅保持每个目的地的当前主单元,而且VOQ外部缓存被外部管理。基于主单元朝着切换单元103的释放率,汇编单元然后将分组从VOQ中取出。
主单元可以包括分组的部分有效载荷。在这种情况下,汇编单元101将分组的剩余部分添加到下一个主单元。汇编单元101可以保持每个目的地节点多个队列,每个队列代表不同的服务等级(Class of Service,COS)。
主单元的使用使得有效的内部切换存储器管理和队列管理成为可能,这是因为主单元可以形成为一个尺寸。使用固定尺寸单元提供一些性能优点。例如,由于在避免DRAM组竞争的同时以较大块尺寸更有效写入动态随机存取存储器(Dynamic random-acciess memory,DRAM)或从其读取,所以固定尺寸的单元使得有效处理和外部存储器管理成为可能。典型地,平均分组尺寸小于最佳块尺寸,其与主单元的尺寸匹配。而且,当链路具有小带宽时,大分组被分割为多个主单元。使用多个链路发送多个主单元允许目的地节点以更少的延迟和与单个面板的使用更少的跳动并行接收整个分组。另外,当本地处理单元在尺寸上被限制时,队列和缓存管理更简单,这是因为描述符的数量可以形成为与小分组的大数量相比更低。主单元的使用还简化平衡链路负载所要求的计数,这是因为计数可以基于固定尺寸单元,而非可变分组尺寸来形成。
当单元是满的时,主单元被输送到切换单元103。切换单元103确定使用哪个链路来发送主单元到其目的地。如果对于特定目的地/COS结合而言没有来自切换单元103的背压,那么主单元可以被立刻发送到其目的地。
主单元尺寸可以变化。例如,主单元尺寸对于高优先等级COS而言更小以避免由利用附加分组填充主单元所引起的过度延迟。主单元尺寸可以取决于网络中的可用带宽而变化。可用带宽可以通过节点数量和链路数量来确定。汇编单元101还可以采用超时并且将部分填充主单元发送以避免过度延迟。另外,汇编单元101可以释放部分填充主单元以避免在互连链路上的非必要带宽消耗。
切换单元103还可以从其他节点接收数据。切换单元103确定数据的目的地是否为本地处理单元105或另一个节点的处理单元。如果最终目的地是另一个节点的处理单元,那么切换单元103将数据发送到目的地节点或另一个中间节点。
当切换单元103接收本地处理单元的数据时,切换单元103传递数据至重排序和解除汇编单元102。重排序和解除汇编单元102将数据存储在存储器中的重排序队列107中。如果数据可以是主单元的形式,那么重排序和解除汇编单元102对主单元进行重排序和解除汇编。重排序和解除汇编过程可以分别在两个独立的设备或在一个设备上操作。
图3显示重排序和解除汇编单元102中处理接收的主单元的流程图。当重排序和解除汇编单元102接收主单元时(步骤310),重排序和解除汇编单元102可以将主单元存储在存储器中的重排序队列107中(步骤320)。重排序和解除汇编单元102基于主单元所源自的节点处定义的主单元序列号分割主单元(步骤330)。重排序和解除汇编单元102将接收的主单元的主单元序列号进行比较并且使用重排序逻辑将它们正确地放置在队列中,以及释放重排序的主单元(步骤340)。
图4显示步骤340的重排序逻辑的流程图。每个主单元具有其对应比特,该对应比特基于主单元序列号来确定。重排序和解除汇编单元102设置与接收的主单元对应的比特(步骤410)。设置比特可以通过将比特从0改成1以指示出接收到主单元来完成。如果主单元包括分组结尾(End Of Pcket,EOP),那么重排序和解除汇编单元102设置附加比特以指示EOP(步骤410)。
图5显示带有对主单元对应的比特的EOP序列号和数据库。在序列号数据库500中,有两种类型的比特:接收比特和EOP比特。在一个实施方式中,第一列中的比特是接收比特,指示对应的主单元是否到达。第二列中的比特是EOP比特,指示对应主单元是否包括EOP。在一个实施方式中,带有值0的接收指示其对应主单元并未到达,并且带有值1的接收比特指示对应主单元到达。带有值1的EOP比特指示其对应主单元包括分组结尾,并且带有值0的EOP比特指示相反的。
接收比特501是在队列的头部中的比特,并且接收比特504是在没有丢失先前比特的情况下队列中的最后的比特。如果EOP存在在接收比特501和接收比特504之间,那么重排序和解除汇编单元102得知接收到以EOP结尾的整个分组。例如,EOP比特513显示在接受比特501和504之间有EOP。相反,使接收比特在EOP之前具有0指示不是所有包括分组的主单元都到达了。在EOP比特517之前,例如,存在带有0的接收比特505和506。因此,在EOP比特517的对应主单元上结束的整个分组并未到达。
重排序和解除汇编单元102通过检查接收比特检查是否所有包括分组的主单元都到达(步骤420)。如果并未所有包括分组的主单元都到达,那么重排序和解除汇编单元102等到下一个主单元(步骤430)。如果所有包括分组的主单元都到达,那么重排序和解除汇编单元102释放主单元(步骤440)。当超时到期时,重排序和解除汇编单元102可以释放主单元。
使用仲裁逻辑,对释放的主单元进行解除队列。解除队列仲裁逻辑在准备好发送到处理单元105的所有主单元之间利用最高优选等级选择主单元。重排序和解除汇编单元102从存储器读取主单元并且对主单元进行解除汇编到初始分组(步骤370),初始分组然后被发送到处理单元105(步骤380)。重排序过程可以保持每个源/COS结合一个内部队列107。内部队列可以例如为位于节点内的缓存。
系统可以使用简化的实施方式,其中分组并没有与其他分组汇编成主单元。分组没有被分割成多个主单元。而且,主单元可以包括一个分组。在这个情况下,重排序和解除汇编单元102使用如上文描述的相同逻辑,但是不需要标记EOP比特。相同的逻辑仅用于重排序目的地。
每个主单元到达时间由重排序和解除汇编单元102来重排序。在主单元被发送到处理单元105之后,重排序和解除汇编单元102设置队列头序列号为发送到处理单元105的最后的主单元的主单元序列号。如果接收到主单元带有主单元的序列号小于队列头,那么主单元在其解除汇编后被立即发送到处理单元105。
处理单元105可以进一步部署QoS功能,例如业务管理和列队。处理单元105可以创建本地复件,如果需要的话,用于多广播业务。处理单元105还可以修改接收的分组的格式并且将它们发送到接口106。在典型的网络系统中,在输入接口上的分组格式可以不同于在输出接口上的分组格式,这是因为添加的信息,例如路由头部和MPLA标签。在这个情况下,一些分组格式修改可以由入口线路卡来处理,并且一些头部操作在入口线路卡上的处理单元处完成。
当由于分布式无交换机互连系统中的临时拥塞造成节点100指示背压状态到处理单元时,节点100可以实现多QoS策略。背压可以发生在所有业务上或对于特定目的地或基于优先级的一部分业务上。
一个实例策略可以是在背压的情况下,不论背压是否是基于每个目的地的,停止将来自处理单元105的分组发送到节点100。因为在背压周期期间,发送节点并不将数据发送到阻塞的节点,所以线头拥塞可以发生。线头拥塞是其中到所有节点的业务由于到一部分节点的业务中的拥塞而被停止的情况。这个因为在队列头部上的分组经历背压并且阻挡下个分组到能够接收分组的其他节点而发生。线头拥塞是没有效率并且经常是高度不期望的。
如果背压是基于优先级的,节点可以仅允许高优先级业务并且停止低优先级业务。这种方法可以是有益的,这是因为其只要求处理单元105和/或汇编单元上的少量队列。
另一个策略是每个目的地节点使用多个队列。当接收到指示在到特定节点的路由上的拥塞的背压时,处理单元105和汇编单元101可以停止发送数据到特定节点。处理单元105和汇编单元101可以允许发送特定优先级到节点。例如,仅有高优先级业务可以被允许。这个策略避免线头拥塞,但是要求高复杂度业务管理。
与QoS管理有关的处理单元105和节点100之间的逻辑分离仅为了说明。根据可替选的实施方式,汇编单元101和处理单元105可以为结合主单元汇编和列队的单个物理设备。单个物理设备可以减少在处理单元105上的负载。
另外,汇编单元101、重排序和解除汇编单元102以及切换单元103可以包括带有各种类型接口的多个物理设备。每个功能可以例如在FPGA、ASIC或在结合中使用以利用本公开中描述的逻辑功能。
连接多个节点
分布式无交换机互连系统使得通过物理全网状连接的无交换机、可升级节点连接成为可能。在一些实施方式中,系统使用内部节点间切换。特别的,系统允许从源节点到目的地节点使用1)直接连接源节点和目的地节点的链路和2)接收来自源节点的数据并且将其路由至目的地节点的中间节点的数据发送。
为了以全网状连接N个节点,带有M条链路的每个节点将其自身M条链路分割到其他N-1个节点。因此,在系统中可以被连接的节点的数量小于或等于链路的数加一,N≤M+1。链路可以在节点之间被平均或不均分分割。如果所有节点具有相同的容量,每个节点可以使用相等数量的链路连接至任意其他节点。分布式无交换机互连系统可以使用光链路,电子链路及节点间的两个的结合。
节点具有节点容量,例如,CN。连接至节点的M条链路中的每个具有链路容量,例如CL。CN通过节点到其对应处理单元的连接来确定,该对应处理单元控制通信或其他过程。例如,带有10个10Gbps接口和处理单元的节点和可以处理容量CN等于100Gbps的所有接口。
在任意两个节点之间具有一条链路的典型的全网状系统,每条链路的链路容量和节点容量的比例需要大于1,以允许网络处理全处理容量。否则,节点处理的速率会超过使用链路的传输速率,因此阻塞业务。根据本公开的方案,业务可以分割为多条链路。因此,当节点具有M条链路时,通信系统可以被设计使得比例被称为本地超速。当本地超速大于1时,网络能够处理处理单元的全处理容量。
根据本公开的方案,分布式无交换机互连系统具有N×M×CL的有效切换容量其中,可能的同时系统输入为N×CN。
每个节点可以接收来自所有其他节点的高达M×CL的带宽的峰值业务。代表峰值连接于节点的物理接口容量之间的临时可用超速。在每个呼出链路上,节点将本地生成的数据与从其他节点接收的数据汇集。然后,节点将数据发送到在链路后的另一个节点。
图6显示根据本公开的方案的分布式无交换机互连系统的实例。图中的每条线路612代表连接两个节点的一条或多条物理链路。在这个实施方式中,源节点620将数据送到目的地节点624。源节点620可以将业务平均分配在所有活动链路612之间,使得完全系统负载是平均分配的。如果所有节点将业务平均分配,那么整体系统负载平衡可以被实现。分布式无交换机互连系统可以使用亏空轮询(Deficit Round Robin,DRR)或加权DRR以在系统内部分背压的情况下分配业务。
至少一条链路——链路611——直接连接源节点620和目的地节点624。其他链路或者连接源节点620或者连接目的地节点624到中间节点:节点621-623和节点625-627。中间节点接收来自源节点620的数据,将节点624识别为目的地节点,并且发送数据到节点624。中间节点可以使用直接链路将数据发送到节点624。在这种情况下,经由两跳来发送数据。一跳从一个节点到另一节点的直接传输,所以两跳涉及具有一个中间节点。源节点将分组发送到中间节点,该中间节点将分组发送到目的地节点。可替选地,中间节点可以将数据发送到其他中间节点,使得使用多于两跳来发送数据。
图7显示分布式无交换机互连系统的节点726。链路712将节点726与其他节点连接。通过链路712、节点726能够接收来自其他节点的数据或发送数据到其他节点。当节点726从其他节点接收数据时,节点206确定如由源节点的处理单元插入的分组头部上所指示的数据目的地。分组头部包括目的地节点号。
如果目的地为另一个节点,那么节点726用作发送数据到目的地节点的中间节点。节点726从源节点720接收数据并且将数据发送到目的地节点724。节点726可以或者通过指示目的地节点号明确确定分组目的地为本地节点,或者通过识别分组为一跳而隐含确定分组目的地为本地节点,其可以显示在分组头部中。
根据本公开的实施方式,分布式无交换机互连系统实现选择性负载平衡。例如,负载平衡可以通过将数据仅通过中间节点发送到目的地来实现。选择性负载平衡可以是有益的,这是因为其减少来自通过在不同数量链路流动的业务的到达时间差。在选择性负载平衡的示例性方法中,一些链路可以专用于特定业务优先级。
根据本公开的另一个实施方式,分布式系统互联系统可以首先选择直接发送到目的地节点,并且使用仅在直接链路是超负荷的状况下使用中间节点。这种选择性负载平衡可以是有益的,因为其将在直接链路上运行的业务的延迟最小化。其仅用于属于特定业务优先级的业务。
在每个负载平衡实体处,多等级优先权可以用于避免背压和跨节点拥塞。在多个等级处背压会引起,例如整体压力,每个目的地节点背压和每个目的地接口背压。背压可以是基于优先权的。整体背压控制从转发节点到切换节点的所有业务。在目的地节点处的背压控制发往特定节点的业务。每个目的地接口背压控制发往特定节点的特定接口的业务。其可以也是基于优先权的或更高精度的。更高精度QoS的实例使用用于目的地端口和COS的结合的队列,或使用或更高精度,例如每服务队列。
带有变化的链路数量和链路容量的分布式无交换机互联系统
根据本公开的一些实施方式,系统可以支持带有不同数量的链路和不同链路容量的节点。图8显示带有不同容量的分布式无交换机互联系统。在图8中,节点820、825、826和827之间的虚线代表具有更高容量的链路。带有更高容量链路的节点可以创建带有更高容量链路的高速连接和带有更低容量的更低速连接。
图9显示分布式无交换机互联系统。在图9中,节点920、925、926和927之间的双虚线914代表更多数量的链路。带有更多数量链路的节点可以创建带有更高总体容量的任意到任意的连接,同时维持到具有更少数量链路的其他节点的连接。
对业务进行路由以避免不活动链路
因为源节点和目的地节点之间的业务并不限制于具体链路,所以甚至当一定链路是不活动或拥塞时,该系统仍可以执行。业务可以被路由以使用剩余的功能链路。根据本公开的实施方式,系统中的所有节点在每个固定间隔上将保持活动消息发送到所有其它节点。可替选地,链路故障,例如光链路上的光损失也可以通过其他装置来检测。
当链路故障或当链路拥塞时,节点无法接收保持活动消息。当接收节点无法接收保持活动消息时,接收节点可以将消息发送到发送保持活动消息的节点。来自接收节点的消息报告链路是不活动的。可替选地,接收节点可以发送确认保持活动消息的接收的返回消息。当发送节点没有接收响应于第一保持活动消息的返回消息时,发送节点也检测链路是不活动的。
当检测到不活动链路时,两个消息可以被广播。不活动链路的接收节点可以广播消息到所有其它节点,指示不要使用不活动链路来发送消息。如上文所解释的,不活动链路的发送节点还可以广播相同的消息到所有其它节点,指示给其它节点不要使用不活动链路来传递数据。
当不活动链路变得活动时,链路的接收节点和发送节点可以包括两个独立消息,指示链路是活动的。通过使得指示链路状态改变的消息从两个不同源发送,系统增加消息的传输的可靠性。
图10显示带有不活动链路的分布式无交换机互联系统。在这个实例中,从节点1021到节点1022的链路是不活动的。首先,节点1022识别出没有来自节点1021的保持活动消息被接收。然后,节点1022将消息发送到节点301,指示它们之间的链路是不活动的。节点1022发送广播消息到所有节点,指示不通过节点1021发送数据到节点1022。节点1021也发送相同的广播消息到所有其它节点。所有其它节点更新它们的动态业务分配逻辑以停止通过节点1021将数据发送到节点1022。
动态业务分配逻辑使用通过背压机制而可用的整个系统的缓存的状态和链路的状态,使得在系统上尽可能平均的分配业务。典型地,当每个源节点尽基于可用链路可能同等地将业务分配到每个目的地时,实现整体负载平衡。可用链路可以包括直接链路和通过中间节点的间接链路。然而,如果更少直接链路是有效的,那么动态业务分配逻辑通过直接链路发送更小部分的业务。动态业务分配逻辑使用加权轮询以控制通过多个路径传递到目的地的业务部分。当在网络中的节点发送数据到另一个节点,源节点避免使用从节点1021到1022的链路并且使用其它功能链路对数据进行重分配。
业务分配逻辑可以保持用于列出每个链路的可用性的表格。这种表格的实例对每个目的地节点包括一行。每行包括可用作目的地的中间节点的节点列表,每个这种中间节点具有链路列表。该表还包括每个目的地的直接连接链路的列表。表中的每条链路可以以其源节点和目的地节点来标记。这个表可以包括到目的地的直接连路和间接链路。
表中每条链路的状态可以如上文所述的被自动更新,或通过控制面板手动更新。控制面板是在节点CPU上运行的过程并且控制系统的操作。控制面板的输入可以为在系统状态上的硬件指示和操作者配置命令。自动更新对于检测和修复系统中的错误是有用的,并且手动更新对于维护是有用的。
当期望特定链路上的维护时,控制面板可以启用链路或禁用链路。当执行维护或升级时,操作者可以通过手动更新表格来手动禁用具体链路。在完成维护后,操作者可以更新表格并且启用链路。当多条链路需要升级时,通过一个接一个跟随上文所述序列来替代链路。这个功能可以简化引入附加节点的过程。PassCOM
根据本公开的方案,提供无源连接光模块。PassCOM使得以全网状连接多个节点变得容易并且使将节点添加到现有全网状网络变得容易。PassCOM的物理形状或连接界面可以与传统交换机相似。然而,不像传统交换机,PassCOM是无源设备,不包括电子组件。
在图11中,6个节点1121-1126以全网状连接。全网状连接要求至少数量为N(N-1)/2的链路1151,其中N为节点的数量。使得N(N-1)/2条链路来以全网状连接节点可能使得物理上设置系统和将节点添加到现有系统变得困难。
图12显示使用PassCOM来连接多个节点的系统的实例。PassCOM1201连接节点1221-1226。每个链路组1206将单个节点连接至PassCOM 1201。包括回送环或到其自身的环,这个配置要求节点和PassCOM 1201之间每个链路组1260中N条链路。例如,在图12中,每个链路组1260包括5条链路。总计,系统中有至少N2条链路。每个链路组能够使用多于N条的链路,以为了改进整体带宽和弹性。然而,链路的物理布置更简单,是因为所有链路连接至PassCOM 1201形式的中央集线器。
PassCOM可以包括N个前端连接器,K个插头,K个后端连接器和连接前端连接器和后端连接器的内部光纤。图13显示连接四个节点1321-1324的PassCOM 1301。PassCOM 1301包括四个前端连接器1331-1334,并且外部链路组1360将节点连接至它们对应的前端连接器。内部链路1370将前端连接器1331-1334中的每个连接至后端连接器1381-1384中的每个。后端连接器1381-1384接收可替换插头1341-1344。包括可替换插头1341-1344的插头集合提供到识别的前端连接器的连接。
插头1341提供回环连接。在一些情况下,重要的是在所有可能路径上保持相同延迟。回环连接可以使得所有路径完全相同。节点可以或者将数据内部地发送到其自身,或者通过PassCOM发送数据。当节点将数据内部都发送到自身时,节点可以实现独立逻辑用于将数据发送到自身。而且,内部地接收数据的延迟不同于通过PassCOM接收数据的延迟。而且,内部环可以要求附加线,复用器、解复用器和存储器以处理潜在拥塞。因此,更容易的是,将所有数据发送到PassCOM并且通过回环连接将PassCOM路由回来。插头13421连接两个前端连接器1331和1332,并且还连接两个前端连接器1333和1334。插头1343连接两个前端连接器1331和1333,并且还连接两个前端连接器1332和1334。相似地,插头1334连接两个前端连接器1331和1334,并且还连接两个前端连接器1332和1333。
根据本公开的方案,每个前端连接器连接至每个后端连接器。在这种方式下,所有节点可以以最平衡的方式以全网状连接。例如,当一个插头被断开,每个节点失去相同数量的链路连接。当任意给定插头被移除时,对于PassCOM1301而言,每个节点失去一个连接。因此,每个节点有平衡带宽降级。
尽管由于插头断开损失物理连接部分,但是由于两跳切换方法,逻辑连接(即,节点间发送分组的能力)仍然存在。
根据本公开的方案,K个插头1341-1344的插头集合以全网状拓扑物理连接节点。所有节点到节点连接可以具有相等的带宽或不同带宽。另外,每个连接可以使用相同数量的链路1370或不同数量的链路以连接节点对。
PassCOM 1301具有相同数量的前端连接器、后端连接器和插头。然而,PassCOM并不限于这种配置。PassCOM可以具有任意数量的前端连接器、后端连接器和插头。
在实施方式中,在系统中来自所有节点的接收和发送链路的束连接至前端PassCOM连接器。插头集合将一个或多个发送链路从一个节点连接至另一个节点中相同数量的接收链路。接收和发送链路可以为光纤。内部链路也可以为光纤。接收和发送链路被分割为K组,并且内部链路将每组接收和发送链路连接至其对应K个插头。
PassCOM可以用于内部节点间切换系统,其中每个节点能够发送数据到另一个节点。源节点可以通过连接至另一个节点的接收链路的具体发送链路发送数据。
PassCOM的一个优点是其简单升级过程。当增加节点数量时,操作者可以将新节点通过从新节点到PassCOM的前端连接器的连接链路而连接到现有PassCOM。因为所有链路连接至PassCOM并且并不连接至独立节点,所以接线的过程是简单的。因为改变插头集合改变PassCOM的连接,所以内部链路是静态连接的。换句话说,内部链路保持相同。
升级过程可能要求替换插头,这是因为PassCOM可以使用不同插头集合用于连接不同数量的节点。使得更多链路连接任意两个节点可以增加系统的带宽。在全网状连接中,比例是本地超速,其中M为系统中可用链路的数量,CL为链路容量,并且CN为节点容量(即,处理容量加上平均运输容量)。当本地超速大于1时,系统能够处理其节点的全处理容量。期望的是,保持本地超速大于阈值数,该阈值数大于1。
当链路容量是大的,或者节点容量是小的,使得本地超速大于1时,升级或降级系统规模(即,节点的数量)可以利用损失或未损失部分业务来完成。这个业务损失会取决于M的值。
图14A显示带有与图13中使用的带有插头1341-1344的插头集合相同但是连接两个节点的插头集合(插头1441-1444)。两个节点1421和1422分别连接至两个前端连接器1431和1432。在插头1441-1444之间,仅有插头14421提供节点1421和节点1422之间的连接。而且,插头1441是仅有的提供回环连接的插头。
相反,图14B示出带有不同插头集合即插头1446-1449的PassCOM。在这个实例中,插头集合以这样一种方式限定:两个节点1421和1422通过两条链路相互连接并且每个节点具有两个回环链路。两个节点1421和1422分别连接至两个前端连接器1431和1432。在插头1446-1449之中,两个插头1448和1499连接节点1421和节点1422,使带宽翻倍。在这种设置中,两个插头1446和1447允许回环连接。
利用带有两个前端连接器N=2和四个后端连接器K=4的PassCOM来显示该实例。然而,N和K的任意组合于N小于K是可能的。甚至当N小于K时,或当节点的数量小于后端连接器的数量时,通过如图14B中显示地以多于一条链路来连接节点对可以实现相同整体互联带宽。
取决于节点间的最小要求带宽,可以利用更少数量的连接来连接节点。例如,如果一条链路的带宽足以连接1421和1421,那么使用1441-1444会提供足够带宽。所以,PassCOM不需要使用带有插头1446-1449的插头集合。
当除了现有节点1421和1422外,添加节点到具有插头1446-1449的PassCOM 1401时,操作者会改变插头。前端连接器1433和1434不连接至前端连接器1431和1432,这是因为带有插头1446-1449的插头集合被设计为连接两个节点。结果,新引入的节点将不会连接至现有节点1421和1422。相反,当添加节点时,带有插头1441-1444的插头集合可以被使用。
带有Passcom和分布式无交换机切换的路由器
使用在分布式无交换机互联系统上的PassCOM的益处是当允许间接数据传输时,系统可以升级而无需业务的大中断。首先,操作者可以将命令发送到所有节点以停止使用连接到将会被替换的插头的链路。在操作者替换插头之后,操作者可以发送命令到所有节点以开始使用链路。
在传统全网状网络上,当升级过程期间,使用升级连接的业务会被停止。然而,在提出的允许多跳传输的分布式无交换机系统中,业务可以继续流动。首先,新节点连接至PassCOM的前端连接器。随着PassCOM中的插头被替换,使用被替换的插头的业务被通过作为中间节点的新节点路由。
PassCOM可以利用更少量的大插头(即,带有更多数量连接的插头),更多数量的小插头(即,带有更少数量连接的插头)或小插头和大插头的组合来操作。相同的连接可以不顾插头的尺寸来实现。然而,在系统升级(即,添加或移除节点)期间,有使用不同尺寸插头的折衷。当移除插头时,系统损失带宽的第1/K部分。在插头不可用的同时,系统使用全带宽的第(K-1)/K部分。如果使用大插头,或如果插头的数量K小,那么带宽减少是大的。然而,使用大插头来连接更多链路要求更少数量的步骤以完成升级。当使用小插头时,情况相反。当替换小插头时,带宽减少是小的。但是由于更大数量的要求操作,用于升级系统的步骤数量更大。
图15显示带有大插头1541和1542的PassCOM 1501。连接与图13中带有插头1341-1344的PassCOM 1301是相同的,但是插头1541和1542独立地连接数量为独立插头1341-1344的两倍的链路。如图15中所显示的,可以用更大数量的连接来插接大插头。插头1541被插入后端连接器1581和1582,并且插头1542插入后端连接器1583和1584。在这个实例中,两个后端连接器接收一个插头。然而,多于两个后端连接器可以接收一个插头。
图16显示带有连接四个节点1621、1622、1623和1624的两个前端连接器1631和1632的PassCOM 1601。在这种情况下,每个连接器连接两个节点。然而,本公开并不限于图中显示的配置。前端连接器和节点的任意结合是可能的。如所呈现的,节点的数量可以小于前端连接器的数量。可替选地,节点的数量可以大于前端连接器的数量
PassCOM的故障可能性是低的,因为其具有无源元件。然而,为了进一步保护系统免受PassCOM故障,连接可以分割为多达插头的数量的多个PassCOM。在实施方式中,所有节点连接至两个或多个PassCOM。图17显示连接至PassCOM 1701和1702的节点1721-1726。
图18显示链路如何连接在PassCOM 1801a和1801b终端插头和前端连接器之间的逻辑图。每个前端连接器连接至来自两个PassCOM的两个前端连接器。例如,节点1821、1822、1823和1824分别连接至两个前端连接器1831a和1831b、1832a和1832b、1833a和1833b、以及1834a和1834b。PassCOM 1801中的内部链路将前端连接器1831a-1834a连接至后端连接器1881a-1884a。相似地,PassCOM 1801b中的内部链路将前端连接器1831b-1834b连接至后端连接器1881b-1884b。
对于本领域技术人员从本公开的阅读中显而易见的是,本公开可以以除了那些上文中特别公开的形式外的形式来实现。上文描述的具体实施方式因此被视为示意性和非限制性的。那些本领域中的技术人员在使用不多于常规经验的情况下,会认识或能够确定对于本文中描述的特定实施方式的各种等同。本发明的范围陈述在所附权利要求及其等特种,而不是被限制为在之前的说明书中包括的实例。
Claims (17)
1.一种无源网络切换装置,包括:
多个前端连接器,用于耦合多个网络元件;
至少一个可替换插头;
至少一个后端连接器,用于接收所述至少一个可替换插头;和
多个链路,其将所述多个前端连接器无源地耦合至所述至少一个后端连接器;
其中,所述至少一个可替换插头配置为以全网状耦合所述多个网络元件。
2.根据权利要求1所述的无源网络切换装置,其中,所述多个网络元件包括至少一个处理引擎。
3.根据权利要求1所述的无源网络切换装置,其中,所述多个网络元件包括耦合到至少一个处理引擎的至少一个网络路由器。
4.根据权利要求1所述的无源网络切换装置,其中,所述多个网络元件包括耦合到至少一个处理引擎的至少一个网络交换机。
5.根据权利要求1所述的无源网络切换装置,其中,所述多个链路包括光纤。
6.根据权利要求1所述的无源网络切换装置,其中,每个前端连接器耦合至所述至少一个后端连接器。
7.根据权利要求1所述的无源网络切换装置,其中,每个后端连接器接收对应的可替换插头。
8.根据权利要求1所述的无源网络切换装置,其中,两个后端连接器接收所述至少一个可替换插头中的第一可替换插头。
9.根据权利要求1所述的无源网络切换装置,其中,所述至少一个可替换插头中的每个可替换插头配置为耦合不同网络元件。
10.一种方法,包括:
经由多条链路耦合多个前端连接器到多个网络元件;
经由多条链路耦合多个前端连接器到至少一个后端连接器;以及
由所述至少一个后端连接器接收至少一个可替换插头;
其中,所述至少一个可替换插头配置为以全网状耦合多个网络元件。
11.根据权利要求10所述的方法,其中,所述多个网络元件包括至少一个处理引擎。
12.根据权利要求10所述的方法,其中,所述多个网络元件包括耦合到至少一个处理引擎的至少一个网络路由器。
13.根据权利要求10所述的方法,其中,所述多个网络元件包括耦合到至少一个处理引擎的至少一个网络交换机。
14.根据权利要求10所述的方法,其中,所述多个链路包括光纤。
15.根据权利要求10所述的方法,其中,将所述多个前端连接器耦合至所述至少一个后端连接器包括将每个前端连接器耦合至所述至少一个后端连接器。
16.根据权利要求10所述的方法,其中,所述至少一个可替换插头中的每个可替换插头配置为耦合不同的网络元件。
17.根据权利要求10所述的方法,还包括:
将所述至少一个可替换插头中的第一可替换插头移除;以及
插入第二可替换插头。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/678,390 US9277300B2 (en) | 2012-11-15 | 2012-11-15 | Passive connectivity optical module |
US13/678,390 | 2012-11-15 | ||
PCT/IB2013/003056 WO2014076575A2 (en) | 2012-11-15 | 2013-11-13 | Passive connectivity optical module |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105009602A true CN105009602A (zh) | 2015-10-28 |
Family
ID=50681793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380069129.1A Pending CN105009602A (zh) | 2012-11-15 | 2013-11-13 | 无源连接光模块 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9277300B2 (zh) |
EP (1) | EP2920978A4 (zh) |
JP (1) | JP2015536621A (zh) |
KR (1) | KR20150112932A (zh) |
CN (1) | CN105009602A (zh) |
WO (1) | WO2014076575A2 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9277300B2 (en) * | 2012-11-15 | 2016-03-01 | Compass Electro Optical Systems Ltd. | Passive connectivity optical module |
CN103777280B (zh) | 2014-01-27 | 2016-06-15 | 华进半导体封装先导技术研发中心有限公司 | 一种具有倾斜角度的光纤装配体及其装配方法 |
WO2016134415A1 (en) * | 2015-02-23 | 2016-09-01 | Zuma Beach Ip Pty Ltd | Generation of combined videos |
US11653072B2 (en) | 2018-09-12 | 2023-05-16 | Zuma Beach Ip Pty Ltd | Method and system for generating interactive media content |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6154449A (en) | 1997-12-23 | 2000-11-28 | Northern Telecom Limited | Switchless network |
US6728807B1 (en) * | 2000-06-02 | 2004-04-27 | Intel Corporation | Using switch fabric blades in a modular network to connect port plates |
US6754757B1 (en) * | 2000-12-22 | 2004-06-22 | Turin Networks | Full mesh interconnect backplane architecture |
US7542653B2 (en) * | 2006-08-29 | 2009-06-02 | Cisco Technology, Inc. | Passive fiber organizer for mesh network node interconnections |
US7793089B2 (en) | 2007-01-31 | 2010-09-07 | Hewlett-Packard Development Company, L.P. | Configurable backplane connectivity for an electrical device |
US7983194B1 (en) * | 2008-11-14 | 2011-07-19 | Qlogic, Corporation | Method and system for multi level switch configuration |
US8270830B2 (en) * | 2009-04-01 | 2012-09-18 | Fusion-Io, Inc. | Optical network for cluster computing |
US8948181B2 (en) * | 2012-10-23 | 2015-02-03 | Cisco Technology, Inc. | System and method for optimizing next-hop table space in a dual-homed network environment |
US9197541B2 (en) * | 2012-11-15 | 2015-11-24 | Compass Electro Optical Systems Ltd. | Router with passive interconnect and distributed switchless switching |
US9277300B2 (en) | 2012-11-15 | 2016-03-01 | Compass Electro Optical Systems Ltd. | Passive connectivity optical module |
-
2012
- 2012-11-15 US US13/678,390 patent/US9277300B2/en not_active Expired - Fee Related
-
2013
- 2013-11-13 JP JP2015542378A patent/JP2015536621A/ja active Pending
- 2013-11-13 WO PCT/IB2013/003056 patent/WO2014076575A2/en active Application Filing
- 2013-11-13 KR KR1020157015745A patent/KR20150112932A/ko not_active Application Discontinuation
- 2013-11-13 CN CN201380069129.1A patent/CN105009602A/zh active Pending
- 2013-11-13 EP EP13855301.1A patent/EP2920978A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
US20140133852A1 (en) | 2014-05-15 |
WO2014076575A2 (en) | 2014-05-22 |
US9277300B2 (en) | 2016-03-01 |
WO2014076575A3 (en) | 2015-03-05 |
JP2015536621A (ja) | 2015-12-21 |
EP2920978A4 (en) | 2016-07-20 |
EP2920978A2 (en) | 2015-09-23 |
KR20150112932A (ko) | 2015-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104995872A (zh) | 带有无源互连和分布式无交换机交换的路由器 | |
US9319310B2 (en) | Distributed switchless interconnect | |
US7042842B2 (en) | Fiber channel switch | |
EP1454440B1 (en) | Method and apparatus for providing optimized high speed link utilization | |
EP1856921B1 (en) | Multi-stage packet switching system with alternate traffic routing | |
US7633861B2 (en) | Fabric access integrated circuit configured to bound cell reorder depth | |
US7088735B1 (en) | Processing data packets in a multiple protocol system area network | |
US20070147364A1 (en) | Local and remote switching in a communications network | |
CN104641609A (zh) | 用于在线路卡的接口控制模块之间传送分组的方法和装置 | |
CN101572673B (zh) | 扩展交换带宽的分布式包交换系统和分布式包交换方法 | |
CN103534998A (zh) | 分布式结构协议(dfp)交换网络架构 | |
US7660239B2 (en) | Network data re-routing | |
CN102428679A (zh) | 在虚拟端口通道环境中实现机架间活动链路数目大体相等 | |
US20120281525A1 (en) | METHOD AND SYSTEM FOR PRIORITY BASED (1:1)n ETHERNET PROTECTION | |
JPH02305040A (ja) | 広域ネットワークに組み込んだ統計的データ多重化装置用の通信プロトコル | |
US5029165A (en) | Method of allotting links and routing messages for a common channel type signalling transfer point | |
CN105009602A (zh) | 无源连接光模块 | |
CN102055657B (zh) | Fc数据报文的负载分担方法和fc交换机系统 | |
US7130267B1 (en) | System and method for allocating bandwidth in a network node | |
US20090074000A1 (en) | Packet based switch with destination updating | |
US20030236869A1 (en) | Data management system and method | |
KR100413520B1 (ko) | 비동기 전송 모드 셀 다중링크 제어장치 및 그 제어방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151028 |