CN102739407A - 捆绑式交换机、网络及在该网络上传输数据的方法 - Google Patents

捆绑式交换机、网络及在该网络上传输数据的方法 Download PDF

Info

Publication number
CN102739407A
CN102739407A CN2012100137857A CN201210013785A CN102739407A CN 102739407 A CN102739407 A CN 102739407A CN 2012100137857 A CN2012100137857 A CN 2012100137857A CN 201210013785 A CN201210013785 A CN 201210013785A CN 102739407 A CN102739407 A CN 102739407A
Authority
CN
China
Prior art keywords
switch
sub
cluster
cloud
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100137857A
Other languages
English (en)
Inventor
阿里尔·亨德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Broadcom Corp
Zyray Wireless Inc
Original Assignee
Zyray Wireless Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zyray Wireless Inc filed Critical Zyray Wireless Inc
Priority to CN201510729360.XA priority Critical patent/CN105227496B/zh
Publication of CN102739407A publication Critical patent/CN102739407A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/14Multichannel or multilink protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/72Routing based on the source address
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/351Switches specially adapted for specific applications for local area network [LAN], e.g. Ethernet switches
    • H04L49/352Gigabit ethernet switching [GBPS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/40Constructional details, e.g. power supply, mechanical construction or backplane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/45Arrangements for providing or supporting expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种捆绑式交换机、网络及在该网络上传输数据的方法。该方法包括在具有多个子交换机的第一捆绑式交换机的子交换机接收数据。所述子交换机配置成仅连接第一捆绑式交换机的外部连接。本方法还包括利用连接的多线电缆从第一捆绑式交换机发送数据到第二捆绑式交换机,所述多线电缆的第一端连接第一捆绑式交换机的子交换机,所述多线电缆的第二端连接第二捆绑式交换机中的至少两个子交换机。

Description

捆绑式交换机、网络及在该网络上传输数据的方法
技术领域
本发明通常涉及计算机网络中的交换机(switch)。
背景技术
随着基于“云计算”的应用需求的增长,对能托管分布式应用程序的超大规模服务器基础设施(infrastructure)的需求也在增加。能在相同的基础设施上处理大规模、多分布式应用的网络常被称为“云计算网络”或简称“云网络”。
目前关于云计算网络的解决方案通常涉及利用相同交换机模块(switchbuilding block)的大规模多级架构(fabric)的创建,所述交换机模块通常为具有足够的基数以跨越整个具有适当数量的层或级的网络的商用交换机专用芯片(ASIC)。
云计算的常规方法遇到到挑战之一,涉及多个离散的交换机盒的部署和其可扩展性,以及互联这些交换机盒所需的布线。增加新服务器和汇聚交换机(aggregation switch)需要对不同的网络组件进行浪费时间的布线和重布线。云计算的常规方法遇到的另一个挑战是上述组件和布线在购置和维护上的花费。
发明内容
根据本发明的一个方面,提供一种捆绑式交换机(bundled switch),所述捆绑式交换机包括:
多个具有端口的子交换机,其中所述多个子交换机中的一个配置成仅连接所述捆绑式交换机的外部连接。
优选地,所述多个子交换机中的所述一个进一步配置成与多线电缆(Multi-Lane cable,简称ML cable)连接。
优选地,多线电缆的线路数量对应子交换机的数量。
优选地,多线电缆的线路数量为子交换机数量的倍数。
优选地,所述子交换机具有P端口,且所述子交换机中的一个的每个所述P端口配置成与所述多线电缆的各个P传输线路连接。
优选地,网络接口可配置用于直接模式(direct mode)和条纹模式(stripedmode)。
优选地,所述捆绑式交换机为戳记交换机(stamped switch)。
优选地,所述捆绑式交换机进一步包括路由管理器。
优选地,所述路由管理器是与所述多个子交换机中的一个相关的路由处理器。
优选地,所述路由处理器配置成管理所述与它相关的子交换机的路由。
优选地,所述路由处理器配置成在独立于所述捆绑式交换机的其它子交换机的路由管理过程的过程中管理路由。
优选地,所述路由处理器为主路由处理器,所述主路由处理器配置成对与其它子交换机相关的路由处理器进行管理。
优选地,所述路由管理器包括控制面板处理器,所述控制面板处理器配置成管理所述多个子交换机中的至少两个的路由。
优选地,所述控制面板处理器配置成单独管理所述子交换机的路由。
优选地,所述控制面板处理器配置成利用管理程序单独管理所述子交换机。
根据本发明的一个方面,一种网络包括:
位于各自的第一和第二网络层的第一绑式交换机和第二捆绑式交换机,每个捆绑式交换机具有多个子交换机,且每个子交换机具有带有P端口的网络接口,其中每个捆绑式交换机中的所述多个子交换机中的一个配置成仅连接所述捆绑式交换机的外部连接。
优选地,所述网络进一步包括具有L传输线路的捆绑式电缆(bundledcable),所述捆绑式电缆配置成连接所述第一捆绑式交换机中的所述第一子交换机的所述P端口,其中的每个L传输线路配置成连接所述第二捆绑式交换机中的第一子交换机的各个P端口和第二子交换机的各个P端口。
优选地,所述第一捆绑式交换机的子交换机的网络接口可配置用于直接模式(direct mode)和条纹模式(striped mode)。
优选地,所述第一捆绑式交换机为戳记交换机(stamped switch)。
优选地,所述网络进一步包括路由管理器。
优选地,所述路由管理器是与所述第一捆绑式交换机的多个子交换机中的一个相关的路由处理器。
优选地,所述路由处理器配置成为所述管理与它相关的子交换机的路由。
优选地,所述路由处理器配置成在独立于所述第一捆绑式交换机中其它子交换机的路由管理过程的过程中管理路由。
优选地,所述路由处理器为主路由处理器,所述主路由处理器配置成对与第一捆绑式交换机的其它子交换机相关的路由处理器进行管理。
优选地,所述路由管理器包括控制面板处理器,所述控制面板处理器配置成管理所述第一捆绑式交换机的所述多个子交换机中的至少两个的路由。
优选地,所述控制面板处理器配置成单独管理所述第一捆绑式交换机的所述子交换机的路由。
优选地,所述控制面板处理器配置成利用管理程序单独管理所述第一捆绑式交换机的所述子交换机。
根据本发明的一个方面,一种网络包括:
第一级捆绑式交换机,每个捆绑式交换机具有多个子交换机,每个子交换机具有带有多个端口的网络接口,其中每个第一级捆绑式交换机的多个子交换机中的至少一个配置成仅与外部连接相连;及
具有多个子交换机的第二级捆绑式交换机,各个子交换机具有带有多个端口的网络接口,其中第二级捆绑式交换机与第一级捆绑式交换机连接。
优选地,所述网络进一步包括:
具有多个传输线路的捆绑式电缆,该捆绑式电缆配置成将第一级捆绑式交换机中的子交换机连接至第二级捆绑式交换机中的多个子交换机。
根据本发明的一个方面,提供一种在网络上传输数据的方法,所述方法包括:
在具有多个子交换机的第一捆绑式交换机的子交换机接收数据,所述子交换机配置成仅连接所述第一捆绑式交换机的外部连接;及
利用连接的多线电缆从所述第一捆绑式交换机传送所述数据到第二捆绑式交换机,所述多线电缆的第一端与所述第一捆绑式交换机的子交换机连接,第二端与所述第二捆绑式接收机的至少两个子交换机连接。
优选地,本方法进一步包括:利用与所述第一捆绑式交换机中的所述子交换机相关的处理器路由所述数据至所述第二捆绑式交换机。
优选地,本方法进一步包括:利用所述第一捆绑式交换机中的系统管理程序控制的虚拟化路由实例(instance),路由所述数据至所述第二捆绑式交换机。
优选地,所述管理程序控制用于所述第一捆绑式交换机中的至少两个子交换机的虚拟化路由实例。
附图说明
附图对本发明进行了描述,并且结合说明书用于解释本发明的原理以及使相关领域的技术人员能够制造和使用本发明。
图1是根据本发明实施例的、具有由互连电缆连接的云交换机的典型(sample)网络体系的框图;
图2是根据本发明实施例的、具有利用多线电缆连接的专用集成电路(ASIC)的云交换机的框图;
图3A是根据本发明实施例的、示出ASIC选择性的接线至多线电缆的单个数据线路的框图;
图3B是根据本发明实施例的、示出连接具有两个ASIC的云交换机的多线电缆的数据线路的框图;
图4是根据本发明实施例的、利用多线电缆与第二层上的多个云交换机连接的第一层上的云交换机的框图;
图5是根据本发明实施例的、云交换机网络的框图,其中多线电缆的线路条纹跨接(striped across)云交换机中的一个的不同的ASIC;
图6是根据本发明实施例的、云交换机网络的框图,其中多线电缆的线路通过互联的云交换机直接连接对应的ASIC;
图7是根据本发明实施例的、互连电缆连接的两层云交换机的框图;
图8是根据本发明实施例的、示出云交换机的若干组件的框图;
图9是根据本发明实施例的、具有多个处理器的云交换机的结构框图;
图10是根据本发明实施例的、具有夹层物理层(mezzanine PHY)、无源卡和中平面连接器的云交换机的结构框图;
图11是网络上的数据传输方法的实施例的流程图。
将参照附图描述本发明。通常地,以相应的标号中最左边的数字代表性地表明元件首次出现的附图。
具体实施方式
下述的本发明的详细描述参照用来说明与本发明包含的典型实施例的附图。其它的实施例是可能的,可以在本发明的精神和范围内修改实施例。因此,该详细描述并非是要限定本发明。相反地,本发明的范围由权利要求来定义。
本发明的特点和优点将在下面的描述中展示。部分本发明的特点和优点是明显的,或可在本发明的实施过程知晓。本发明的优点可通过其构造实现或获得,这已经在书面的说明书和权利要求书以及其附图中指明了。下列详细描述是实例性的和说明性的,且用于进一步解释要求保护的本发明。
说明书中针对“一个实施例”、“实施例”、“一个示例实施例”等的引用,指的是描述的该实施例可包括特定的特征、结构或特性,但是不是每个实施例必须包含这些特定特征、结构或特性。此外,这样的表述并非指的是同一个实施例。进一步,在结合实施例描述特定的特定、结构或特性时,不管有没有明确的描述,已经表明将这样的特征、结构或特性结合到其它实施例中是属于本领域技术人员的知识范围内的。
概述
总的来说,在此描述的若干实施例提供了一种改进的方法以实现在不止一个交换机层外建立大规模网络架构。该网络通常适合作为“云计算网络”来使用,具有多层交换机且具有托管分布式应用程序的能力(常称为“云应用”)的超大规模服务器。在通常实施上,云网络在相同的网络基础设施上可托管多个分布式应用。
在此描述的改进方法使用“云交换机”。云交换机在单个外壳中通常具有多个子交换机。各个子交换机能实现常规交换机的功能。在此描述的所述子交换机通常具有可与外部多线电缆(也称为捆绑式电缆)连接的连接器。在光学连接中,多线电缆可看作“平行光学器件”。在多线电缆中,“线路”是指电缆中的传输路径,对应常规电缆的传输性能。因此,一个四线ML电缆具有四倍于标准网络电缆的连接性能。
在此描述的云交换机中的子交换机能以不同的方式实现,包括使用一个交换机专用芯片(也称交换机ASIC或ASIC)。典型的所述云交换机具有多个交换机ASIC,且每个ASIC有多个端口,利用不同的可配置的网络架构可将这些端口连接其它网络部件。也应注意的是,在一个实施例中,子交换机在云交换机的物理机箱内不是本地互联的。
在此描述的网络互联电缆一般采用多线电缆连接网络中的云交换机。在此使用的多线电缆的一个例子为四芯SFP发射器可插拔式模块采用的四芯光纤或铜质电缆。四芯SFP指的是在每个方向上采用四传输线路且与QSFP发射器连接的连接器/发射器规范。
除另有说明外,在此的实例都采用四芯-SFP多线电缆。通过在此的描述,本领域的技术人员应了解,在没有背离本发明的精神的情况下,云交换机和多线电缆可采用不同数量的ASIC、端口和传输线路。
得益于云交换机的使用的典型网络拓扑结构为“胖树”网络拓扑结构。该拓扑结构通常具有同类部件和多层,所述多层的连接要求为每个交换机与相邻层与中的每个其它交换机连接。正如下面所论述的,利用描述于其中的若干实施例可显著改善胖树网络的实现、维护和扩展。
云交换机
图1为具有由互连电缆连接的三层云交换机的典型网络拓扑结构的框图。网络拓扑结构110中,第一层云交换机110A-D通过电缆互连155与第二层云交换机120A-D连接。第二层云交换机通过电缆互连150与第三层云交换机130A-D连接。为了阐明实施例的各方面,云交换机110A具有额外细节,显示为ASIC 115A-D。如图1所示的各个其它云交换机,也包含四个ASIC(未显示)。但是,每个云交换机中可包含任何数量的ASIC。
与实施多层网状网络的常规方法相比,每个ASIC 115A-D替代一个离散交换机盒。因此,云交换机110A中的ASIC 115A-D替代了常规实施中的四个交换机盒。如上所述,图1中的每个云交换机都包括四个ASIC,所述ASIC在各个层上替代离散交换机箱。
互连电缆150和155采用上述的多线电缆连接网络拓扑结构100的层。继上文所述的方法,每个ASIC 115A-D与一个层上的每个云交换机中的每个ASIC连接,所述为每个ASIC115A-D进行的连接使用多线电缆中的一个线路。因此,在电缆互连115中,采用具有16条线路的多线电缆(或某个倍数)物理连接云交换机110A至各个云交换机120A-D。逻辑上,利用多线电缆,各个ASIC115A-D与云交换机120A-D上的ASIC连接。另外的每个云交换机110B-D也具有16条线路的多线电缆(或其倍数)以连接各个云交换机110B-D至第二层中的云交换机120A-D。
应了解,在此配置中,各条多线电缆替代了常规方法中的4条单线电缆。在各个层上的交换机间的物理连接和端口间的逻辑连接的细节将结合如下对图2-图7的说明进行介绍。
图2为利用多线电缆连接两个云交换机的网络拓扑结构200的框图。云交换机120A和130A利用四个多线电缆250A-D分别连接ASIC 220A-D和230A-D。无源电缆(passive cables)250A-250D用于实现云交换机120A和130A间的4条物理电缆连接。在常规方法中,需要16条电缆将各个ASIC 220A-D链接至上一网络层上的各个ASIC 230A-D。
图3A示出连接具有ASIC的云交换机的多线电缆的四条数据线路的框图。网络拓扑结构300显示了云交换机120A与云交换机120A通过电缆250A连接。云交换机120A具有ASIC 220A-D,而云交换机130A具有ASIC 230A-D。电缆250A有四个数据线路350A-D以分别连接ASIC220A至ASIC230A-D。
重点需要注意的是,多线电缆250A是连接云交换机120A和130A的单条多线电缆。利用多线电缆250A,流经ASIC220A的网络流量可被路由到ASIC230A-D。通常,也可利用另外的多线电缆以与多线电缆250A和线路350A-D相似的连接方式连接ASIC 220B-D和ASIC 230A-D。
各个云交换机中的内部逻辑允许多线电缆250A以不对称连接的方式连接ASIC220A和ASIC 230A-D。尽管电缆连接为“盒对盒”(box to box),但是,内部的,云交换机120A中的ASIC220A的单个物理连接链接到云交换机130A中的ASIC 230A-D。如下面对图5的说明中更进一步论述的,所述不对称连接是通过利用多线电缆250A链接各个连接的ASIC的特定端口来完成的。鉴于此处的描述,相关领域的技术人员会把所述不对称连接当作ASIC220A和ASIC 230A-D间的“条纹”(striped)连接。
同样重点需要注意的是,在云交换机120A和130A的典型实施例中,云交换机中的ASIC间没有本地连接(也称为“本地交换”)。例如,在单个跳频(hop)中,ASIC 220A和ASIC 220B不能直接互相连接。通过从ASIC220A上升至上一层的云交换机130A中的ASIC230B,再从ASIC230B经与ASIC230B连接的多线电缆下降至ASIC220B的一个路由,可实现连通。
图3B为网络拓扑结构中的连接的云交换机的另一个实例的框图。网络拓扑结构400具有两个云交换机320和330,各自具有ASIC 325A-B和335A-B。云交换机320和330由多线电缆335连接。多线电缆335有四条传输线路352A-D。ASIC 335A使用线路352A-B与ASIC 325A-B分别连接。ASIC 335B使用线路352C-D与ASIC 325A-B分别连接。
图3B阐明了与云交换机320和330的使用有关的节省。利用示出的四线路QSFP连接器和每个盒两个ASIC的方法,可达成四倍(factor)的连接器和电缆的节省的目的。
图4是利用多线电缆连接第一层上的云交换机和第二层上的多个云交换机的框图。网络拓扑结构400显示了云交换机120A通过电缆250A和450A-C连接云交换机130A-D。云交换机120A具有ASIC 220A-D。ASIC220A通过电缆250A、450A、450B和450C分别与云交换机130A-D连接。
图4中的多线电缆450A-C,展示了用于连接ASIC220A到一个更高的层上的各个云交换机130B-D的ASIC(未显示ASIC)的另外的多线电缆。同样未显示的是,各个ASIC220B-220D也可使用三条另外的多线电缆连接云交换机120A到云交换机130A-D的ASIC。总之,具有64条数据线路的16条电缆连接云交换机120A的四个ASIC 220A-D到云交换机130A-D的16个ASIC。通常,增加的云交换机将包含在和云交换机120A相同的层级。
图5是示出了利用多线电缆连接的两个云交换机中的端口间的数据线路的框图。网络拓扑结构500中,云交换机120A利用具有线路510A-D的电缆连接云交换机130A。云交换机120A具有ASIC 220A-D,而云交换机130A具有ASIC 230A-D。ASIC 220A具有端口522A-D、ASIC220B具有端口524A-D、ASIC220C具有端口526A-D、ASIC220D具有端口528A-D、ASIC230A具有端口532A-D、ASIC230B具有端口534A-D、ASIC230C具有端口536A-D、ASIC230D具有端口538A-D。线路510A连接ASIC220A的端口522A至ASIC230A的端口532A。线路520B连接ASIC220A的端口522A至ASIC230B的端口534A。线路510C连接ASIC220A的端口522C至ASIC230C的端口536A。线路510D连接ASIC220A的端口522D至ASIC230D的端口538A。
如图5所示,云交换机120A采用了线路配置为510A-D的多线电缆,线路510A-D是“条纹”。鉴于此处的描述,相关领域的技术人员应了解,以“条纹”方式布线的多线电缆链接ASIC220A的端口522A至ASIC230A中的端口532A,且链接ASIC220A的端口522B至ASIC230B中的端口534A。相反,布线的“直接”方式将在下面对图6的说明中进行论述。
图5中描述的条纹方式上行链接云交换机120A中ASIC220A中的连续的端口至横跨更高层云交换机130A中的连续的ASIC 230A-D的等价端口。如下对图6、7和10的说明中描述的,所述的云交换机的实施例,可配置为在层间使用条纹的或直接的电缆连接。正如下面所讨论的,且如图10所示,“无源卡”可由一个实施例用于设置所述的直接的或条纹的配置。
在另一个实例中,每个ASIC 220A-D具有八个端口。四个端口(522A-D)朝“上”面向更高的层上的ASIC 230A-D,被称为“上行”链路,而四个“下行”端口朝“下”面向一个更低的层。如图5所示,上行端口522A-D以条纹的方式连接上面的云交换机130A。如下面图6所述的,4个典型的下行端口可直接连接至一个更低的层。
云交换机120A和130A的典型实施例中,要么每个云交换机有两个ASIC(图3B所示),要么每个云交换机有四个ASIC(图1、2、3A、4、5和6所示)。在不同的实施例中,ASIC220A-D中每个ASIC的端口数目是很大的,例如,每个ASIC有64个端口。每个ASIC的端口总数的唯一约束是基于效率的,例如,由于不同的配置,不使用有些端口。在一个实施例中,每个ASIC的端口数为每个云交换机中的ASIC数目的倍数。
图6为示出了利用多线电缆连接的两个云交换机中的端口间的数据线路的另一框图。网络拓扑结构600中,云交换机670A利用不同的示例互连电缆680连接云交换机660A,附加的典型架构包括具有线路610A-D的多线电缆。云交换机670A具有ASIC 620A-D,云交换机660A具有ASIC 630A-D。ASIC620A有端口622A-D、ASIC620B有端口624A-D、ASIC620C有端口626A-D、ASIC620D有端口628A-D。ASIC630A有端口632A-D、ASIC630B有端口634A-D、ASIC630C有端口636A-D、ASIC630D有端口638A-D。线路610A连接ASIC620A的端口622A至ASIC630A的端口632A。线路610B连接ASIC620A的端口622B至ASIC630A的端口632B。线路610C连接ASIC620A的端口622C至ASIC630A的端口632C。线路610D连接ASIC620A的端口622D至ASIC630A的端口632D。
在图6所示的典型的网络连接中,ASIC620A没有与云交换机660A中的每个ASIC 630A-D连接。这个多线电缆的直接电缆配置展示了连接云配置间的ASIC的另一种替代方法。
云交换机660A和670A的到更高的层的上行链路连接和到更低的层的下行链路连接,都可配置成使用两种连接方法。例如,云交换机660A可配置成在一组端口上的自云交换机670A的一个直接的下行链路连接,而在上行端口上(未显示),条纹连接(图5所示)可用于连接更高的层上的云交换机。
基于在此的论述,相关领域的技术人员应了解,实施例允许多线电缆设施在使用时保持单线路电缆设施使用时的总网络规模。例如,在10G和40G网络中,有4个线路的多线电缆降低了各个网络层的网络规模的四倍。例如,一个三层网络,将降低64倍。
通过使用这种配置灵活的云交换机,网络可以利用相同的灵活的云交换机模块进行调节,以优化链接速度和总网络规模之间的矛盾。
网路中的云交换机的结构
图7为由互连电缆连接的两层云交换机的框图。网络拓扑结构700中,第一层云交换机A-I利用电缆互连780与第二层云交换机760A-I连接。云交换机770A-I由ASIC组成,每个ASIC利用电缆互连780中的多线电缆连接云交换机760A-760I。电缆互连785连接第二层云交换机到第三层云交换机(未显示)。
基于第一个第二层云交换机770A-I和760A-I的各自配置,互连电缆780可直接或条纹配置。另外的层也可加入具有不同互连电缆配置的网络拓扑结构700中,以建立一个多层网络,该多层网络构造出带有交替布线配置的云交换机。云交换机可配置成使用直接或条纹连接。例如,交换机760A-I可使用将互连电缆780连接至更低的交换机层的条纹方案,同时可使用将互连电缆785连接至更高的交换机层的直接方案。鉴于此处的描述,相关领域的技术人员应该了解,不同的组合是可使用的。
用于配置互连电缆780为云交换机770A-I和云交换机760A-I间的上行链路直接连接的一种方法,在云交换机770A-I和云交换机760A-I中都使用插入式无源卡。云交换机770A-I每个都带有无源卡,所述无源卡用于配置它们的上行链路端口以利用多线电缆直接地连接云交换机160A-I中的端口。这个直接的连接在对图6的说明中进行了论述,其中多线电缆650A连接ASIC620A中的端点622A-D到ASIC630A中的端点632A-D。
为了接受来自云交换机770A-I的直接上行链路,在本方法中,云交换机760A-I每个都带有一个无源卡,所述无源卡可配置它们的下行链路端口接受来自云交换机770A-I的直接连接,在每个云交换机760A-I中的无源卡也可用于配置云交换机760A-I的上行链路端口,从而配置互连电缆785。云交换机中使用的无源卡可分别为上行链路端口和下行链路端口指定的直接连接。另一个无源卡可为上行链路和下行链路指定条纹连接。
云交换机组件
图8为根据本发明实施例的、示出云交换机的若干部件的框图。云交换机810有ASIC 820A-D、交换机处理器850、电源860和散热器(cooling)870。
如上文背景技术中所指出的,可扩展网络的常规方法面临的挑战之一是配置大量交换机盒的花费。所述花费涉及大量交换机盒的获取成本以及管理成本。相对于有更多ASIC和连接器的高密度盒,很多如封装、风扇和电源的固定成本在低密度盒里是不必要的重复,因此,在这种意义上,大量单个交换机的累加式部署是低效率的。采用具有ASIC 820A-D的云交换机810的益处为在没有降低其它属性的同时减少了与给定配置有关的交换机盒的总数。
如上所述,与常规网络相比,每个ASIC820A-D替代了网络中的离散交换机盒。如单个云交换机810中的电源860、散热器870和交换机处理器850的共享组件的功能在操作中可起到更简单地管理和节能的作用。
路由实例
图9是跟据本发明实施例的、示出云交换机的另外的组件的框图。云交换机910有ASIC 920A-D、控制面板处理器955。控制面板处理器有系统管理程序950,每个ASIC 920A-D有各自的与各个子交换机ASIC有关的处理器922A-D。系统管理程序950的虚拟化交换机处理器(Virtualized SwitchProcessors,简称VSP)922A-D分别对应ASIC 920A-D。
在一个实施例中,云交换机910中的路由计算可划分为可分离的和完全独立的路由任务。图9阐述了所述划分的两种方法。划分这些任务的一个方法为将它们分成云交换机的各个ASIC的软件任务。图9中,一组任务维持在各个ASIC920A-D的各自的处理器922A-D中。
控制分离的路由任务的另一种方法为将它们归于各个ASIC920A-D的不同路由实例。常规交换机和一些实施例使用的路由实例协议(routing instanceprotocol)的一个例子为一个开放式最短路径优先(Open Shortest Path First,简称OSPE)协议。
通过利用每个ASIC920A-D一个处理器的方法来管理ASIC的路由实例,能以成本优化的方式管理交换机实例。在该方法中,一个或多个VSP922A-D能管理云交换机910中的各个ASIC 920A-D。在一个实施例中,管理实用程序通常可利用管理处理器(也可称为“主路由处理器”)控制其它ASIC和云交换机910。
控制面板处理器955能计算和维护云交换机910中的ASIC 920A-D的路由实例。系统管理程序950将各个ASIC920A-D的操作虚拟化为虚拟化交换机且维护各个ASIC920A-D分离的路由实例。利用不同的嵌入式/交换操作系统可对各个虚拟的交换机进行操作。
基于虚拟化的系统管理程序950可用于改进对错误的恢复,且更好的抑制路由实例中的软件缺点带来的影响。由各个相关的处理器922A-D执行各个ASIC920A-D的路由任务,这样可使类似的益处更大。
重点应注意的是,使用离散控制处理器922A-D的上述方法和使用带有管理程序950的控制面板处理器的上述方法不能在图9所示的云交换机中都使用。选择在云交换机中采用哪一种方法基于实施的具体决定。
云交换机
图10是ASIC 1020A-B由中平面连接器1035连接无源卡1030的底盘式(chassis)云交换机的结构框图。ASIC 1020A-B有各自的端口1025A-B。如上面对图1-9所论述的,云交换机1000有多个ASIC 1020A-B和用于配置端口连接器到相邻层的无源卡。端口1020A-B用于连接多线电缆。在一个实施例中,无源卡1030是具有印制电路板(Printed Circuit Board)PCBs)的可插拔式卡,所述PCBs上有交换机逻辑。
夹层(mezzanine)物理层(PHY)1028A-B分别连接端口1025A-B到ASIC1020A-B。与夹层(mezzanine)PHY 1028A-B有关的设置可配置ASIC 1020A-B对端口1025A-B的使用。无源卡1030和夹层(mezzanine)PHY 1020A-B的组合也可由一个实施例用于配置端口1025A-B。
无源卡1030的一个实施例利用跟踪(trace)逻辑配置ASIC 1020A-B的端口连接。如上面对图1-9所论述的,云交换机1000使用无源卡1030配置端口连接器到相邻的层。在一些实施例中,两种类型的无源卡1030可插入云交换机1000:条纹到条纹和直接到条纹。例如,无源卡以条纹到条纹方式安装,端口1025A从以条纹设置的多线电缆接收数据(如图5所示),且端口1025B利用以条纹设置的多线电缆发送数据。在另一个实例中,无源卡以条纹到直接方式安装,端口1025A从以条纹设置的多线电缆接收数据,而端口1025B利用以直接设置的多线电缆发送数据(如图6所示)。
方法1100
本部分和图11通过呈现网络中传输数据的典型方法的流程总结本技术。本方法不是意味着限定。
如图11所示,方法1100开始于阶段1110,其中数据在具有多个子交换机的第一捆绑式交换机的子交换机中接收,所述多个子交换机配置成仅连接第一捆绑式交换机的外部连接。在一个实施例中,图3A中的云交换机120A的ASIC220A接收数据。ASIC220A没有配置成与ASIC220B连接。在不同实施例中,数据可来自不同的源。一个源可以是另一个云交换机。例如,图1中,云交换机120A通过电缆互连155从云交换机110A接收数据。一旦阶段1110完成,方法1100转至阶段1120。
在阶段1120,利用连接的多线电缆从第一捆绑式交换机传输数据到第二捆绑式交换机,所述多线电缆的第一端连接第一捆绑式交换机中的子交换机,而所述多线电缆的第二端连接第二捆绑式交换机的至少两个子交换机。在一个实施例中,来自云交换机120A中的ASIC 220A的数据利用ML电缆250A传送至云交换机130A。连接ASIC220A的多线电缆的各个线路与云交换机130A的各个ASIC 230A-D分别连接。一旦步骤1120完成,方法1100结束。
云交换机的实现
所述的交换功能可由硬件、软件或其中的某些组合来实现。能由硬件、软件或其中的某些组合来实现的实施例实现的典型的功能包括交换机路由功能。
鉴于此处的描述,相关领域的技术人员应了解,管理程序950和处理器922A-D的功能,可利用,例如,计算机处理器、计算机逻辑、ASIC等来实现。因此,实现所述云交换机功能的任何处理器都在本发明的范围和精神内。
另外,此处描述的功能可由计算机处理器或任何上面列出的硬件设备执行的计算机程序指令来体现。计算机程序指令使处理器实现所述功能。计算机程序指令(例如,软件)可存储于计算机可用介质、计算机程序介质或任何可被计算机或处理器访问的计算机可读存储介质中。所述介质包括存储设备如RAM或ROM,或其它类型的计算机存储介质如计算机硬盘或CD ROM,或等效的此类硬件。因此,任何具有使处理器完成数据收集、政策管理、协调、分析功能或其它所述的相关功能的计算机程序代码的计算机存储介质都在本发明的范围和精神内。
结论
尽管以上对本发明的各种实施例进行了描述,但应理解它们是例证性的而非限制性的。在没有背离本发明的精神和范围的情况下,本领域的技术人员应该清楚地知道,各种形式和细节上的修改都是可以的。因此,本发明应该仅仅依照权利要求和它们的等效变换来定义。
相关申请的交叉引用
本专利申请享有2011年1月20日申请的美国临时专利申请的优先权,该美国临时专利申请的申请号为No.61/434,794,题目为“数据中心交换机”,此处该专利申请全文引用,以作参考。

Claims (10)

1.一种捆绑式交换机,其特征在于,包括:
多个具有端口的子交换机,其中所述多个子交换机中的一个配置成仅连接所述捆绑式交换机的外部连接。
2.根据权利要求1所述的捆绑式交换机,其特征在于,所述多个子交换机中的所述一个进一步配置成与多线电缆连接。
3.根据权利要求2所述的捆绑式交换机,其特征在于,所述多线电缆的线路数量对应所述子交换机的数量。
4.根据权利要求2所述的捆绑式交换机,其特征在于,所述多线电缆的线路数量为所述子交换机数量的倍数。
5.根据权利要求2所述的捆绑式交换机,其特征在于,所述子交换机具有P端口,且所述子交换机中的一个的每个所述P端口配置成连接所述多线电缆的各个P发射线路。
6.根据权利要求1所述的捆绑式交换机,其特征在于,网络接口可配置成用于直接模式和条纹模式。
7.根据权利要求1所述的捆绑式交换机,其特征在于,进一步包括路由管理器。
8.一种网络,其特征在于,包括:
位于各自的第一和第二网络层的第一绑式交换机和第二捆绑式交换机,每个捆绑式交换机具有多个子交换机,且每个子交换机具有带有P端口的网络接口,其中每个捆绑式交换机中的所述多个子交换机中的一个配置成仅连接所述捆绑式交换机的外部连接。
9.一种网络,其特征在于,包括:
第一级捆绑式交换机,每个捆绑式交换机具有多个子交换机,每个子交换机具有带有多个端口的网络接口,其中每个第一级捆绑式交换机的多个子交换机中的至少一个配置成仅与外部连接器相连;及
具有多个子交换机的第二级捆绑式交换机,每个子交换机具有带有多个端口的网络接口,其中第二级捆绑式交换机与第一级捆绑式交换机连接。
10.一种在网络上传输数据的方法,其特征在于,包括:
在具有多个子交换机的第一捆绑式交换机的子交换机接收数据,所述子交换机配置成仅连接所述第一捆绑式交换机的外部连接;及
利用连接的多线电缆从所述第一捆绑式交换机传送所述数据到所述第二捆绑式交换机,所述多线电缆的第一端与所述第一捆绑式交换机的子交换机连接,第二端与所述第二捆绑式接收机的至少两个子交换机连接。
CN2012100137857A 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法 Pending CN102739407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510729360.XA CN105227496B (zh) 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161434794P 2011-01-20 2011-01-20
US61/434,794 2011-01-20
US13/235,080 2011-09-16
US13/235,080 US8934483B2 (en) 2011-01-20 2011-09-16 Data center switch

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510729360.XA Division CN105227496B (zh) 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法

Publications (1)

Publication Number Publication Date
CN102739407A true CN102739407A (zh) 2012-10-17

Family

ID=45540763

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2012100137857A Pending CN102739407A (zh) 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法
CN201510729360.XA Active CN105227496B (zh) 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510729360.XA Active CN105227496B (zh) 2011-01-20 2012-01-17 捆绑式交换机、网络及在该网络上传输数据的方法

Country Status (5)

Country Link
US (2) US8934483B2 (zh)
EP (1) EP2479943A1 (zh)
KR (1) KR101357843B1 (zh)
CN (2) CN102739407A (zh)
TW (1) TWI562563B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110891204A (zh) * 2018-08-20 2020-03-17 广达电脑股份有限公司 交换器、识别电缆匹配状态的方法及非暂态机器可读介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495194B1 (en) * 2010-06-29 2013-07-23 Amazon Technologies, Inc. Connecting network deployment units
US8934483B2 (en) 2011-01-20 2015-01-13 Broadcom Corporation Data center switch
US8681794B2 (en) 2011-11-30 2014-03-25 Broadcom Corporation System and method for efficient matching of regular expression patterns across multiple packets
US8724496B2 (en) * 2011-11-30 2014-05-13 Broadcom Corporation System and method for integrating line-rate application recognition in a switch ASIC
US9229771B2 (en) * 2012-03-08 2016-01-05 Microsoft Technology Licensing, Llc Cloud bursting and management of cloud-bursted applications
US9473422B1 (en) * 2012-05-09 2016-10-18 Google Inc. Multi-stage switching topology
US9444896B2 (en) 2012-12-05 2016-09-13 Microsoft Technology Licensing, Llc Application migration between clouds
US20140281105A1 (en) * 2013-03-15 2014-09-18 Silicon Graphics International Corp. High speed disk array spider cable
US9825857B2 (en) * 2013-11-05 2017-11-21 Cisco Technology, Inc. Method for increasing Layer-3 longest prefix match scale
US10484519B2 (en) 2014-12-01 2019-11-19 Hewlett Packard Enterprise Development Lp Auto-negotiation over extended backplane
US10616142B2 (en) 2015-10-12 2020-04-07 Hewlett Packard Enterprise Development Lp Switch network architecture
WO2021105728A1 (en) * 2019-11-28 2021-06-03 Mellanox Technologies Ltd. Efficient parallelized computation of a benes network configuration

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1695130A (zh) * 2002-08-30 2005-11-09 英特尔公司 网状结构内的多端口高速串行结构互连芯片
CN101061680A (zh) * 2004-11-18 2007-10-24 日本电气株式会社 开关装置、开关方法及开关控制用程序
US20100061391A1 (en) * 2008-09-11 2010-03-11 Pradeep Sindhu Methods and apparatus related to a low cost data center architecture
WO2010090838A2 (en) * 2009-01-20 2010-08-12 The Regents Of The University Of California Reducing cabling complexity in large-scale networks
US20110032944A1 (en) * 2009-08-06 2011-02-10 Uri Elzur Method and System for Switching in a Virtualized Platform

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291479A (en) * 1991-07-16 1994-03-01 Digital Technics, Inc. Modular user programmable telecommunications system with distributed processing
US7016299B2 (en) * 2001-07-27 2006-03-21 International Business Machines Corporation Network node failover using path rerouting by manager component or switch port remapping
US7983257B2 (en) * 2008-07-18 2011-07-19 Emulex Design & Manufacturing Corporation Hardware switch for hypervisors and blade servers
US8798045B1 (en) * 2008-12-29 2014-08-05 Juniper Networks, Inc. Control plane architecture for switch fabrics
US7909643B2 (en) * 2009-02-27 2011-03-22 Tyco Electronics Corporation Cassette for a cable interconnect system
US8416692B2 (en) 2009-05-28 2013-04-09 Microsoft Corporation Load balancing across layer-2 domains
US8613085B2 (en) * 2009-07-22 2013-12-17 Broadcom Corporation Method and system for traffic management via virtual machine migration
US8261269B2 (en) * 2009-09-21 2012-09-04 Oracle International Corporation System and method for synchronizing transient resource usage between virtual machines in a hypervisor environment
US20110202682A1 (en) * 2010-02-12 2011-08-18 Microsoft Corporation Network structure for data center unit interconnection
US8345692B2 (en) * 2010-04-27 2013-01-01 Cisco Technology, Inc. Virtual switching overlay for cloud computing
US8934483B2 (en) 2011-01-20 2015-01-13 Broadcom Corporation Data center switch

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1695130A (zh) * 2002-08-30 2005-11-09 英特尔公司 网状结构内的多端口高速串行结构互连芯片
CN101061680A (zh) * 2004-11-18 2007-10-24 日本电气株式会社 开关装置、开关方法及开关控制用程序
US20100061391A1 (en) * 2008-09-11 2010-03-11 Pradeep Sindhu Methods and apparatus related to a low cost data center architecture
WO2010090838A2 (en) * 2009-01-20 2010-08-12 The Regents Of The University Of California Reducing cabling complexity in large-scale networks
US20110032944A1 (en) * 2009-08-06 2011-02-10 Uri Elzur Method and System for Switching in a Virtualized Platform

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NATHAN FARRINGTON ET AL: "Data Center Switch Architecture in the Age of Machant Silicon", 《17TH IEEE SYMPOSIUM ON HIGH PERFORMANCE INTERCONNECTS》, 25 August 2009 (2009-08-25) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110891204A (zh) * 2018-08-20 2020-03-17 广达电脑股份有限公司 交换器、识别电缆匹配状态的方法及非暂态机器可读介质

Also Published As

Publication number Publication date
CN105227496B (zh) 2019-03-19
KR101357843B1 (ko) 2014-02-05
US9374321B2 (en) 2016-06-21
US20120189004A1 (en) 2012-07-26
CN105227496A (zh) 2016-01-06
US8934483B2 (en) 2015-01-13
KR20120084691A (ko) 2012-07-30
TWI562563B (en) 2016-12-11
TW201246835A (en) 2012-11-16
US20150098473A1 (en) 2015-04-09
EP2479943A1 (en) 2012-07-25

Similar Documents

Publication Publication Date Title
CN102739407A (zh) 捆绑式交换机、网络及在该网络上传输数据的方法
US11671330B2 (en) Network interconnect as a switch
EP2691866B1 (en) Data transmission system using a network transpose box
CN105706404B (zh) 管理计算机网络的直接互连交换机布线与增长的方法和装置
CN102480358B (zh) 集中化虚拟交换机架构控制方法和设备
CN102907057B (zh) 网络装置中的交换
US9960878B2 (en) Scalable ultra dense hypergraph network for data centers
CN107211036B (zh) 一种数据中心网络组网的方法以及数据中心网络
US20140270762A1 (en) System and method for data center optical connection
US10834484B2 (en) Flat, highly connected optical network for data center switch connectivity
GB2405298A (en) Network topology having nodes interconnected by extended diagonal links.
CN103546299A (zh) 使用串行器/解串器通道的50Gb/s以太网
CN102202005B (zh) 可重配置的光片上网络及配置方法
US10477288B2 (en) Data center interconnect as a switch
KR20170034413A (ko) 백 패널 구조 및 집중 교환 설비
CN104883224A (zh) 构建数据中心交换网络的方法及节点装置
Nooruzzaman et al. Hyperscale data center networks with Transparent HyperX architecture
US9750135B2 (en) Dual faced ATCA backplane
CN108733610A (zh) 一种交换板及刀片服务器
WO2021159936A1 (zh) 连接结构及设备安装方法
Wu et al. The case for a rackless data center network architecture
Yu et al. RingCube—An incrementally scale-out optical interconnect for cloud computing data center
Eltraify et al. Energy efficient passive optical data centre networks
Das et al. Modular Rook (MR): A Modular Data Center Network Architecture Based on Rook’s Graph
Olsen et al. Data Formatter Design Specification DRAFT version 0.1

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1169759

Country of ref document: HK

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20121017