KR20120084691A - 데이터 센터 스위치 - Google Patents

데이터 센터 스위치 Download PDF

Info

Publication number
KR20120084691A
KR20120084691A KR1020120006681A KR20120006681A KR20120084691A KR 20120084691 A KR20120084691 A KR 20120084691A KR 1020120006681 A KR1020120006681 A KR 1020120006681A KR 20120006681 A KR20120006681 A KR 20120006681A KR 20120084691 A KR20120084691 A KR 20120084691A
Authority
KR
South Korea
Prior art keywords
switch
switches
sub
bundle
cloud
Prior art date
Application number
KR1020120006681A
Other languages
English (en)
Other versions
KR101357843B1 (ko
Inventor
아리엘 헨델
Original Assignee
브로드콤 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브로드콤 코포레이션 filed Critical 브로드콤 코포레이션
Publication of KR20120084691A publication Critical patent/KR20120084691A/ko
Application granted granted Critical
Publication of KR101357843B1 publication Critical patent/KR101357843B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/14Multichannel or multilink protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/72Routing based on the source address
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/351Switches specially adapted for specific applications for local area network [LAN], e.g. Ethernet switches
    • H04L49/352Gigabit ethernet switching [GBPS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/40Constructional details, e.g. power supply, mechanical construction or backplane
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/45Arrangements for providing or supporting expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

네트워크에서 데이터를 전달하는 방법이 제공된다. 데이터는 복수의 서브-스위치들을 갖는 제 1 번들 스위치의 서브-스위치에서 수신되고, 상기 서브-스위치는 상기 제 1 번들 스위치의 외부의 접속들에만 결합하도록 구성된다. 또한, 상기 방법은 제 2 번들 스위치에 결합된 멀티-레인 케이블, 제 1 번들 스위치 내의 서브-스위치에 결합된 상기 멀티-레인 케이블의 제 1 단부, 및 상기 제 2 번들 스위치 내의 적어도 2개의 서브-스위치들에 결합된 상기 멀티-레인 케이블의 제 2 단부를 이용하여, 상기 제 1 번들 스위치로부터 상기 데이터를 전달하는 단계를 포함한다.

Description

데이터 센터 스위치{DATA CENTER SWITCH}
관련 출원들에 대한 상호 참조
본 특허 출원은 "Data Center Switch(데이터 센터 스위치)"라는 명칭으로 2011년 1월 20일자로 출원된 미국 특허 가출원 제61/434,794호의 이익을 주장한 것이며, 그 전체는 참조를 위해 본 명세서에 편입되어 있다.
본 발명은 컴퓨터 네트워크에서의 스위칭에 관한 것이다.
"클라우드 기반(cloud based)" 어플리케이션들에 대한 증가된 수요와 함께, 분산된 어플리케이션들을 호스팅(hosting)할 수 있는 매우 대형의 서버 인프라구조(infrastructure)에 대한 수요도 증가하였다. 동일한 인프라구조 상에서 대규모의 다중 분산된 어플리케이션들을 처리할 수 있는 네트워크들은 종종 "클라우드 컴퓨팅 네트워크(cloud computing network)들" 또는 간단하게 "클라우드 네트워크(cloud network)들"이라고 지칭된다.
클라우드 컴퓨팅 네트워크들에 대한 현재의 접근법들은 동일한 스위치 빌딩 블럭(switch building block)을 이용한, 즉, 합리적인 수의 타이어(tier)들 또는 스테이지(stage)들을 갖는 전체 네트워크를 포괄하기에 충분한 기수(radix)를 갖는 전형적으로 상업적 시장의 스위치 ASIC을 이용한, 대형의 멀티-스테이지(multi-stage) 패브릭(fabric)들의 생성을 일반적으로 포함한다.
클라우드 네트워크들의 기존의 구현예에서의 하나의 과제는 스위치 박스(switch box)들을 상호접속하기 위해 필요한 배선과 함께 다수의 이산 스위치 박스(discrete switch box)들의 배치(deployment) 및 확장성(scalability)을 포함한다. 새로운 서버들 및 집합 스위치(aggregation switch)들을 추가하는 것은 상이한 네트워크 구성요소들의 시간 소비적인 배선(wiring) 및 재배선(rewiring)을 포함할 수 있다. 클라우드 네트워크들의 기존의 구현예에서의 또 다른 과제는 상기 언급된 구성요소들 및 배선의 획득 및 유지보수와 관련된 비용(cost)이다.
본 발명은 네트워크에서 데이터를 전달하도록 구성된 번들 스위치 및 이와 같이 데이터를 전달하기 위한 방법을 제공하는 것을 목적으로 한다.
일 양태에 따르면, 번들 스위치가 제공되고, 상기 번들 스위치는,
포트들을 갖는 복수의 서브-스위치들을 포함하고, 상기 복수의 서브-스위치들 중의 하나는 상기 번들 스위치의 외부의 접속들에만 결합하도록 구성된다.
바람직하게는, 상기 복수의 서브-스위치들 중의 상기 하나는 멀티-레인 케이블(multi-lane cable)에 결합되도록 추가적으로 구성된다.
바람직하게는, 상기 멀티-레인 케이블 내의 레인들의 수는 서브-스위치들의 수에 대응한다.
바람직하게는, 상기 멀티-레인 케이블 내의 레인들의 수는 서브-스위치들의 수의 배수(multiple)이다.
바람직하게는, 상기 서브-스위치들은 P개의 포트들을 가지고, 상기 서브-스위치들 중의 하나의 P개의 포트들 각각은 상기 멀티-레인 케이블의 P개의 송신 레인들의 각각에 결합되도록 구성된다.
바람직하게는, 네트워크 인터페이스는 직접 모드(direct mode) 및 줄무늬 형태의 모드(striped mode) 모두에 대해 구성가능하다.
바람직하게는, 상기 번들 스위치는 스탬프 방식의 스위치(stamped switch)이다.
바람직하게는, 상기 번들 스위치는 라우팅 관리자(routing manager)를 더 포함한다.
바람직하게는, 상기 라우팅 관리자는 상기 복수의 서브-스위치들 중의 하나와 관련된 라우팅 처리기이다.
바람직하게는, 상기 라우팅 처리기는 그것과 관련되는 서브-스위치에 대한 라우팅을 관리하도록 구성된다.
바람직하게는, 상기 라우팅 처리기는 번들 스위치 내의 다른 서브-스위치들의 관리 처리들을 라우팅하는 것으로부터 분리된 처리에서 라우팅을 관리하도록 구성된다.
바람직하게는, 상기 라우팅 처리기는 다른 서브-스위치들과 관련된 라우팅 처리기들을 관리하도록 구성된 주 라우팅 처리기(primary routing processor)이다.
바람직하게는, 상기 라우팅 관리자는 상기 복수의 서브-스위치들 중의 적어도 2개에 대한 라우팅을 관리하도록 구성된 제어 평면 처리기(control plane processor)를 포함한다.
바람직하게는, 상기 제어 평면 처리기는 상기 서브-스위치들에 대한 라우팅을 독립적으로 관리하도록 구성된다.
바람직하게는, 상기 제어 평면 처리기는 상기 서브-스위치들을 독립적으로 관리하기 위해 하이퍼바이저를 이용하도록 구성된다.
일 양태에 따르면, 네트워크는,
각각의 제 1 및 제 2 네트워크 타이어(tier)들 상의 제 1 및 제 2 번들 스위치를 포함하고, 각각의 번들 스위치는 복수의 서브-스위치들을 가지고, 각각의 서브-스위치는 P개의 포트들을 갖는 네트워크 인터페이스를 가지고, 각각의 번들 스위치 내의 상기 복수의 서브-스위치들 중의 하나는 상기 번들 스위치의 외부의 접속들에만 결합하도록 구성된다.
바람직하게는, 상기 네트워크는 상기 제 1 번들 스위치 내의 제 1 서브-스위치의 P개의 포트들에 결합되도록 구성된 L개의 송신 레인들을 갖는 번들 케이블(bundled cable)을 더 포함하고, 상기 L개의 송신 레인들 각각은 제 2 번들 스위치 내의 제 1 서브-스위치 상의 P개의 포트들과, 상기 제 2 번들 스위치 내의 제 2 서브-스위치의 P개의 포트들 중의 각각의 하나에 결합되도록 구성된다.
바람직하게는, 상기 제 1 번들 스위치의 서브-스위치의 네트워크 인터페이스는 직접 모드(direct mode) 및 줄무늬 형태의 모드(striped mode) 모두에 대해 구성가능하다.
바람직하게는, 상기 제 1 번들 스위치는 스탬프 방식의 스위치이다.
바람직하게는, 상기 네트워크는 라우팅 관리자를 더 포함한다.
바람직하게는, 상기 라우팅 관리자는 상기 제 1 번들 스위치의 복수의 서브-스위치들 중의 하나와 관련된 라우팅 처리기이다.
바람직하게는, 상기 라우팅 처리기는 그것과 관련되는 서브-스위치에 대한 라우팅을 관리하도록 구성된다.
바람직하게는, 상기 라우팅 처리기는 상기 제 1 번들 스위치 내의 다른 서브-스위치들의 관리 처리들을 라우팅하는 것으로부터 분리된 처리에서 라우팅을 관리하도록 구성된다.
바람직하게는, 상기 라우팅 처리기는 상기 제 1 번들 스위치의 다른 서브-스위치들과 관련된 라우팅 처리기들을 관리하도록 구성된 주 라우팅 처리기(primary routing processor)이다.
바람직하게는, 상기 라우팅 관리자는 상기 제 1 번들 스위치의 상기 복수의 서브-스위치들 중의 적어도 2개에 대한 라우팅을 관리하도록 구성된 제어 평면 처리기를 포함한다.
바람직하게는, 상기 제어 평면 처리기는 상기 제 1 번들 스위치의 서브-스위치들에 대한 라우팅을 독립적으로 관리하도록 구성된다.
바람직하게는, 상기 제어 평면 처리기는 상기 제 1 번들 스위치의 상기 서브-스위치들을 독립적으로 관리하기 위하여 하이퍼바이저(hypervisor)를 이용하도록 구성된다.
일 양태에 따르면, 네트워크는,
제 1 레벨의 번들 스위치들로서, 각각의 번들 스위치는 복수의 서브-스위치들을 가지고, 각각의 서브-스위치는 복수의 포트들을 갖는 네트워크 인터페이스를 가지고, 각각의 제 1 레벨 번들 스위치에 대한 상기 복수의 서브-스위치들 중의 적어도 하나는 외부 접속에만 결합하도록 구성되는, 상기 제 1 레벨의 번들 스위치들; 및
복수의 서브-스위치들을 갖는 제 2 레벨의 번들 스위치들로서, 각각의 서브-스위치는 복수의 포트들을 갖는 네트워크 인터페이스를 가지고, 제 2 레벨 번들 스위치는 제 1 레벨 번들 스위치에 결합되는, 상기 제 2 레벨의 번들 스위치들을 포함한다.
바람직하게는, 상기 네트워크는,
다수의 송신 레인들을 갖는 번들 케이블을 더 포함하고, 상기 번들 케이블은 제 1 레벨 번들 스위치 내의 서브-스위치를 제 2 레벨 번들 스위치 내의 복수의 서브-스위치들에 결합하도록 구성된다.
일 양태에 따르면, 네트워크에서 데이터를 전달하는 방법은,
복수의 서브-스위치들을 갖는 제 1 번들 스위치로서, 상기 제 1 번들 스위치의 외부의 접속부들에만 결합하도록 구성된 상기 제 1 번들 스위치의 서브-스위치에서 데이터를 수신하는 단계; 및
제 2 번들 스위치에 결합된 멀티-레인 케이블, 상기 제 1 번들 스위치 내의 서브-스위치에 결합된 상기 멀티-레인 케이블의 제 1 단부, 및 상기 제 2 번들 스위치 내의 적어도 2개의 서브-스위치들에 결합된 멀티-레인 케이블의 제 2 단부를 이용하여, 상기 제 1 번들 스위치로부터 상기 데이터를 전달하는 단계를 포함한다.
바람직하게는, 상기 방법은, 상기 제 1 번들 스위치 내의 상기 서브-스위치와 관련된 처리기를 이용하여 상기 제 2 번들 스위치에 상기 데이터를 라우팅하는 단계를 더 포함한다.
바람직하게는, 상기 방법은, 상기 제 1 번들 스위치 내의 하이퍼바이저(hypervisor)에 의해 제어되는 가상화된 라우팅 인스턴스(virtualized routing instance)를 이용하여 상기 제 2 번들 스위치에 상기 데이터를 라우팅하는 단계를 더 포함한다.
바람직하게는, 상기 하이퍼바이저는 상기 제 1 번들 스위치 내의 적어도 2개의 서브-스위치들에 대한 가상화된 라우팅 인스턴스들을 제어한다.
본 발명에 따르면, 네트워크에서 데이터를 전달하도록 구성된 번들 스위치 및 이와 같이 데이터를 전달하기 위한 방법을 구현할 수 있다.
동봉된 도면들은 본 발명을 예시하고 있고, 또한, 그 설명과 함께, 발명의 원리들을 설명하도록 작용하고, 당업자가 발명을 제조하고 이용할 수 있도록 작용한다.
도 1은 일 실시예에 따라, 케이블 상호접속부들에 의해 결합된 클라우드 스위치들을 갖는 샘플 네트워크 아키텍처(architecture)의 블럭도이다.
도 2는 일 실시예에 따라, 멀티-레인(multi-lane) 케이블들을 이용하여 결합된 주문형 집적회로(ASIC : application specific integrated circuit)들을 갖는 클라우드 스위치들의 블럭도이다.
도 3a는 일 실시예에 따라, 멀티-레인 케이블의 개별적인 데이터 레인들에 선택적으로 배선된 ASIC들을 도시하는 블럭도이다.
도 3b는 일 실시예에 따라, 2개의 주문형 집적회로(ASIC)들을 갖는 클라우드 스위치들을 결합하는 멀티-레인 케이블의 데이터 레인들을 도시하는 블럭도이다.
도 4는 일 실시예에 따라, 멀티-레인 케이블들을 이용하여 제 2 타이어 위의 다수의 클라우드 스위치들에 결합된 제 1 타이어 위의 클라우드 스위치의 블럭도이다.
도 5는 일 실시예에 따라, 멀티-레인 케이블의 레인들이 클라우드 스위치들 중의 하나의 스위치 내의 상이한 ASIC들에 걸쳐 줄무늬 형태로 되어 있는 클라우드 스위치 네트워크의 블럭도이다.
도 6은 일 실시예에 따라, 멀티-레인 케이블의 레인들이 상호접속된 클라우드 스위치들에 걸쳐 대응하는 ASIC들에 직접 접속되어 있는 클라우드 스위치 네트워크의 블럭도이다.
도 7은 일 실시예에 따라, 케이블 상호접속부들에 의해 결합된 클라우드 스위치들의 2개의 타이어들의 블럭도이다.
도 8은 일 실시예에 따라, 클라우드 스위치의 몇몇 구성요소들을 도시하는 블럭도이다.
도 9는 일 실시예에 따라, 다수의 처리기들을 갖는 클라우드 스위치의 블럭도이다.
도 10은 일 실시예에 따라, 중이층(mezzanine) PHY들, 수동 카드 및 중간평면(midplane) 커넥터를 갖는 클라우드 스위치의 블럭도를 제공한다.
도 11은 네트워크에서 데이터를 전달하는 예시적인 방법의 순서도를 제공한다.
발명은 동봉된 도면들을 참조하여 설명되어 있다. 소자가 처음 나타나는 도면은 대응하는 참조 번호의 가장 좌측 숫자(들)에 의해 전형적으로 표시된다.
본 발명의 다음의 상세한 설명은 이 발명과 일치하는 예시적인 실시예들을 예시하는 동봉된 도면들을 참조한다. 다른 실시예들이 가능하며, 발명의 취지 및 범위 내에서 실시예들에 대한 변형들이 행해질 수 있다. 그러므로, 상세한 설명은 발명을 한정하기 위한 것이 아니다. 오히려, 발명의 범위는 첨부된 청구항들에 의해 규정된다.
발명의 특징들 및 장점들은 뒤따르는 설명에서 기재되어 있고, 그 설명으로부터 부분적으로 분명하거나, 발명의 실시에 의해 학습될 수 있다. 발명의 장점들은 그 구조에 의해 실현되며 달성되고, 첨부된 도면들뿐만 아니라 그 기재된 설명 및 청구항들에서 구체적으로 지적된다. 다음의 상세한 설명은 예시적이고 설명적이며, 청구된 바와 같은 발명의 추가적인 설명을 제공하도록 의도된 것이다.
설명된 실시예(들)와, "하나의 실시예", "실시예", "예시적인 실시예" 등에 대한 명세서에서의 언급들은 설명된 설시예(들)가 특정한 특징, 구조, 또는 특성을 포함할 수 있음을 나타낸다. 그러나, 모든 실시예가 반드시 특정한 특징, 구조, 또는 특성을 포함할 수 있는 것은 아니다. 또한, 이러한 어구들은 반드시 동일한 실시예를 언급하는 것은 아니다. 특정한 특징, 구조 또는 특성이 실시예와 관련하여 설명되어 있을 때, 명시적으로 설명되지 않더라도, 다른 실시예들과 관련하여 이러한 특징, 구조, 또는 특성을 실시하기 위하여 당업자의 지식 내에 있음을 이해해야 한다.
개요
일반적으로 말하면, 본 명세서에서 설명된 일부 실시예들은 하나를 초과하는 스위치 타이어로부터 구축된 대규모 네트워크 패브릭(fabric)들을 구현하는 것에 대해 개선된 접근법을 제공한다. 이러한 네트워크들은 "클라우드 컴퓨팅 네트워크들", 즉, 스위치들의 다수의 타이어들을 가지며 분산된 어플리케이션들("클라우드 어플리케이션들"이라고도 지칭됨)을 호스팅할 수 있는 매우 대형의 서버 인프라구조로서 이용하기에 종종 적당하다. 통상적으로 구현되는 바와 같이, 클라우드 네트워크들은 동일한 네트워크 인프라구조 상에서 다수의 분산된 어플리케이션들을 호스팅한다.
본 명세서에서 설명된 개선된 접근법들은 "클라우드 스위치들"을 이용한다. 클라우드 스위치는 단일 인클로져(enclosure) 내에 다수의 서브-스위치(sub-switch)들을 일반적으로 가진다. 각각의 서브-스위치는 기존의 네트워크 스위치의 기능들을 수행할 수 있다. 본 명세서에서 설명된 서브-스위치들은 외부 멀티-레인 케이블들(번들 케이블(bundled cable)들이라고도 지칭됨)에 접속되도록 할 수 있는 커넥터(connector)들을 일반적으로 가진다. 광학 접속들에서, 멀티-레인 케이블들은 "병렬 광학계들(parallel optics)"이라고 지칭될 수 있다. 멀티-레인 케이블에서, "레인(lane)"은 기존의 케이블의 송신 능력들에 대응하는 케이블 내의 송신 경로이다. 따라서, 4개 레인의 ML 케이블은 표준적인 네트워크 케이블의 접속 능력의 4배를 가진다.
본 명세서에서 설명된 바와 같은 클라우드 스위치들 내의 서브-스위치들은 스위치 주문형 집적회로(여기에서는 스위치 ASIC, 또는 ASIC이라고도 지칭됨)를 이용하는 것을 포함하는 상이한 방식으로 구현될 수 있다. 본 명세서에서 설명된 예시적인 클라우드 스위치들은 다수의 스위치 ASIC들을 가지고, 각각의 ASIC은 상이한 구성가능한 네트워크 패브릭들을 이용하여 다른 네트워크 구성요소들에 결합하기 위한 다수의 포트들을 가진다. 또한, 실시예에서, 서브-스위치들은 클라우드 스위치의 물리적 인클로져 내에서 국부적으로 상호접속되는 것을 주목해야 한다.
본 명세서에서 설명된 네트워크 케이블 상호접속부들은 네트워크에서 클라우드 스위치들을 링크(link)하기 위하여 멀티-레인 케이블들을 일반적으로 이용한다. 본 명세서에서 이용된 멀티-레인 케이블의 예는 Quad SFP 트랜시버 플러그 가능한 모듈에 의해 종단되는 쿼드(quad) 광학 또는 구리 케이블이다. Quad SFP는 방향(direction) 당 4개의 송신 레인들을 이용하고 QSFP 트랜시버에 접속되는 커넥터/트랜시버 사양을 지칭한다.
달리 기재되지 않으면, 본 명세서의 예들은 Quad-SFP 멀티레인 케이블들을 이용한다. 본 명세서에서의 설명이 주어지면, 관련 분야의 당업자는 본 명세서에서 설명된 접근법들의 취지로부터 벗어나지 않으면서, 클라우드 스위치들 및 멀티-레인 케이블들이 상이한 갯수들의 ASIC들, 포트들 및 송신 레인들과 함께 이용될 수 있다는 것을 인식할 것이다.
클라우드 스위치들의 이용으로부터 이익을 얻을 수 있는 예시적인 네트워크 토폴로지(topology)는 "팻-트리(fat-tree)" 네트워크 토폴로지이다. 이 토폴로지는 전형적으로 동질의 구성요소들을 가지고, 모든 스위치가 인접한 타이어 내의 스위치에 하나 걸러서 결합되어야 하는 접속 요건(connectivity requirement)을 갖는 다수의 타이어들을 가진다. 이하에서 논의되는 바와 같이, 본 명세서에서 설명된 일부 실시예들을 이용하는 것은 팻-트리 네트워크들의 구현, 유지보수 및 확장을 상당히 개선시킬 수 있다.
클라우드 스위치들
도 1은 케이블 상호접속부들에 의해 결합된 클라우드 스위치들의 3개의 타이어들을 갖는 샘플 네트워크 토폴로지의 블럭도이다. 네트워크 토폴로지(100)는 케이블 상호접속부들(155)을 통해 클라우드 스위치들(120A-D)의 제 2 타이어에 결합된 클라우드 스위치들(110A-D)의 제 1 타이어를 가진다. 클라우드 스위치들의 제 2 타이어는 케이블 상호접속부들(150)을 통해 클라우드 스위치들(130A-D)의 제 3 타이어에 결합된다. 실시예의 양태들을 예시하기 위하여, 클라우드 스위치(110A)는 ASIC들(115A-D)을 도시하는 추가적인 세부구성을 가진다. 도 1에 도시된 각각의 다른 클라우드 스위치도 4개의 ASIC들(도시하지 않음)을 포함한다. 그러나, 임의의 수의 ASIC들이 각각의 클라우드 스위치 내에 포함될 수 있다.
멀티-타이어 메쉬 네트워크(multi-tier mesh network)를 구현하기 위한 기존의 접근법에 비해, 각각의 ASIC(115A-D)은 이산 스위치 박스(discrete switch box)를 대체한다. 따라서, ASIC들(115A-D)을 갖는 클라우드 스위치(110A)는 기존의 구현예에서 4개의 스위치 박스들을 대체한다. 위에서 언급된 바와 같이, 도 1의 각각의 클라우드 스위치도 4개의 ASIC들을 포함하고, 이러한 ASIC들도 각각의 타이어 상에서 이산 스위치 박스들을 대체한다.
케이블 상호접속부들(150 및 155)은 네트워크 토폴로지(100)의 타이어들을 결합하기 위한 접근법으로서, 위에서 설명된 멀티-레인 케이블들을 이용한다. 위에서 개요를 기술한 접근법 이후에, 각각의 ASIC(115A-D)은 각각의 ASIC(115A-D)에 대한 멀티-레인 케이블의 하나의 레인을 이용하여 상기 타이어 내의 각각의 클라우드 스위치 내의 각각의 ASIC에 결합된다. 따라서, 클라우드 스위치(110A)를 각각의 클라우드 스위치(120A-D)에 물리적으로 접속하기 위해 케이블 상호접속부들(155)에서는, 16개의 멀티-레인 케이블들(또는 그 배수(multiple)이 이용된다. 논리적으로, 멀티-레인 케이블들을 이용하여, 각각의 ASIC(115A-D)은 클라우드 스위치들(120A-D) 내의 ASIC에 접속된다. 또한, 추가적인 클라우드 스위치들(110B-D)은 각각의 클라우드 스위치(110B-D)를 제 2 타이어 내의 클라우드 스위치들(120A-D)에 결합하는 16개의 멀티-레인 케이블들(또는 그 배수)을 각각 가진다.
이 구성에서는, 각각의 멀티-레인 케이블이 기존의 방법으로 4개의 단일 레인 케이블들을 대체한다는 것을 인식해야 한다. 스위치들 사이의 물리적 접속들과, 각각의 타이어 상의 ASIC들 내의 포트(port)들 사이의 논리적 접속들의 상세한 내용들은 이하의 도 2 내지 도 7의 설명들과 함께 논의된다.
도 2는 멀티-레인 케이블들을 이용하여 결합된 2개의 클라우드 스위치들을 갖는 네트워크 토폴로지(200)의 블럭도이다. 클라우드 스위치들(120A 및 130A)은 4개의 멀티-레인 케이블들(250A-D)을 이용하여 결합된 각각의 ASIC들(220A-D 및 230A-D)을 가진다. 수동 케이블들(250A-250D)은 클라우드 스위치들(120A 및 130A) 사이에 4개의 물리적 케이블 접속들을 구현하기 위해 이용된다. 기존의 접근법에서는, 상기 네트워크 타이어에서 각각의 ASIC(220A-D)을 각각의 ASIC(230A-D)과 링크하기 위하여, 16개의 케이블들이 요구될 것이다.
도 3a는 ASIC들을 갖는 클라우드 스위치들을 결합하는 멀티-레인 케이블의 4개의 데이터 레인들을 도시하는 블럭도이다. 네트워크 토폴로지(300)는 케이블(250A)을 통해 클라우드 스위치(130A)에 결합된 클라우드 스위치(120A)를 도시한다. 클라우드 스위치(120A)는 ASIC들(220A-D)을 가지고, 클라우드 스위치(130A)는 ASIC들(230A-D)을 가진다. 케이블(250A)은 ASIC(220A)을 ASIC(230A-A)에 각각 결합하는 4개의 데이터 레인들(350A-D)을 가진다.
멀티-레인 케이블(250A)은 클라우드 스위치(120A)를 클라우드 스위치(130A)에 결합하는 단일 멀티-레인 케이블인 점에 주목하는 것이 중요하다. ASIC(220A)을 횡단하는 네트워크 트래픽은 멀티-레인 케이블(250A)을 이용하여 ASIC들(230A-D)에 라우팅(routing)될 수 있다. 전형적으로, ASIC들(220B-D)도 멀티-레인 케이블(250A) 및 레인들(350A-D)과 유사한 접근법으로 결합된 추가적인 멀티-레인 케이블들을 이용하여 ASIC들(230A-D)에 접속될 것이다.
각각의 클라우드 스위치 내의 내부 로직은 멀티-레인 케이블(250A)이 ASIC(220A)을 ASIC들(230A-D)로 비대칭적인 접속으로 결합하도록 한다. 케이블 접속들은 "박스(box)에서 박스"이지만, 내부적으로, 클루우드 스위치(120A) 내의 ASIC(220A)에 대한 단일 물리적 접속은 클라우드 스위치(130A) 내의 ASIC들(230A-D)에 링크된다. 이하의 도 5의 설명과 함께 추가적으로 논의되는 바와 같이, 이 비대칭적인 결합은 각각의 결합된 ASIC 내의 특정 포트들을 링크하기 위해 멀티-레인 케이블(250A)을 이용함으로써 달성된다. 본 명세서의 설명이 주어지면, 관련 분야의 당업자는 이 비대칭적인 접속을 ASIC(220A) 및 ASIC들(230A-D) 사이의 "줄무늬 형태의(striped)" 접속으로서 인식할 것이다.
또한, 클라우드 스위치들(120A 및 130A)의 전형적인 실시예들에서는, 클라우드 스위치 내의 ASIC들 사이에 국부적인 접속("국부적 스위칭(local switching)"이라고도 지칭됨)이 존재하지 않는다는 점에 주목하는 것이 중요하다. 예를 들어, ASIC(220A) 및 ASIC(220B)은 단일 홉(single hop)에서 서로에 대해 직접 접속될 수 없다. 접속은 위의 타이어 상의 클라우드 스위치(130A) 내의 ASIC(220A)으로부터 ASIC(230B)으로 올라가고 ASIC(230B)에 결합된 멀티-레인 케이블을 통해 ASIC(220B)으로 내려가는 루트(route)에 의해 달성될 수 있다.
도 3b는 네트워크 토폴로지에서 결합된 클라우드 스위치들의 또 다른 예를 도시하는 블럭도이다. 네트워크 토폴로지(400)는 ASIC들(325A-B 및 335A-B)을 각각 갖는 2개의 클라우드 스위치들(320 및 330)을 가진다. 클라우드 스위치들(320 및 330)은 멀티-레인 케이블(335)에 의해 결합된다. 멀티-레인 케이블(335)은 4개의 송신 레인들(352A-D)을 가진다. ASIC(335A)은 ASIC(325A-B)과 각각 결합하기 위하여 레인들(352A-B)을 이용한다. ASIC(335B)은 ASIC(325A-B)와 각각 결합하기 위하여 레인들(352C-D)을 이용한다.
클라우드 스위치들(320 및 330)의 이용과 관련된 절감(saving)은 도 3b에 의해 예시된다. 도시된 바와 같은 박스 당 4-레인 QSFP 커넥터들 및 2개의 ASIC들을 이용하여, 4배의 커넥터 및 케이블 절감이 달성된다.
도 4는 멀티-레인 케이블들을 이용하여 제 2 타이어 상의 다수의 클라우드 스위치들에 결합된 제 1 타이어 상의 클라우드 스위치의 블럭도이다. 네트워크 토폴로지(400)는 케이블들(250A 및 450A-C)을 통해 클라우드 스위치들(130A-D)에 결합된 클라우드 스위치(120A)를 도시한다. 클라우드 스위치(120A)는 ASIC들(220A-D)을 가진다. ASIC(220A)은 케이블들(250A, 450A, 450B 및 450C)을 통해 클라우드 스위치들(130A-D)에 각각 결합된다.
도 4의 멀티-레인 케이블들(450A-C)은 더 상위의 타이어(ASIC들이 도시되지 않음) 내의 ASIC(220A)을 각각의 클라우드 스위치(130B-D)의 ASIC들에 접속하기 위해 이용되는 추가적인 멀티-레인 케이블들을 도시한다. 또한, 도 4에 도시되어 있지 않지만, 클라우드 스위치(120A)를 클라우드 스위치들(130A-D)의 ASIC들에 또한 결합하기 위하여, 3개의 추가적인 멀티-레인 케이블들이 각각의 ASIC(220B-220D)에 대해 이용된다. 모두 합해서, 64개의 데이터 레인들을 갖는 16개의 케이블들은 클라우드 스위치(120A)의 4개의 ASIC들(220A-D) 및 클라우드 스위치들(130A-D)의 16개의 ASIC들을 결합한다. 전형적으로, 추가적인 클라우드 스위치들은 클라우드 스위치(120A)와 동일한 타이어-레벨(tier-level)에서 포함될 것이다.
도 5는 멀티-레인 케이블을 이용하여 2개의 클라우드 스위치들의 결합 내의 포트들 사이의 데이터 레인들을 도시하는 블럭도이다. 네트워크 토폴로지(500)는 레인들(510A-D)을 갖는 케이블을 이용하여 클라우드 스위치(130A)에 결합된 클라우드 스위치(120A)를 가진다. 클라우드 스위치(120A)는 ASIC들(220A-D)을 가지고, 클라우드 스위치(130A)는 ASIC들(230A-D)을 가진다. ASIC(220A)은 포트들(522A-D)을 가지고, ASIC(220B)은 포트들(524A-D)을 가지고, ASIC(220C)은 포트들(526A-D)을 가지고, ASIC(220D)은 포트들(528A-D)을 가지고, ASIC(230A)은 포트들(532A-D)을 가지고, ASIC(230B)은 포트들(534A-D)을 가지고, ASIC(230C)은 포트들(536A-D)을 가지고, ASIC(230D)은 포트들(538A-D)을 가진다. 레인(510A)은 ASIC(220A)의 포트(522A)를 ASIC(230A)의 포트(532A)에 결합한다. 레인(510B)은 ASIC(220A)의 포트(522B)를 ASIC(230B)의 포트(534A)에 결합한다. 레인(510C)은 ASIC(220A)의 포트(522C)를 ASIC(230C)의 포트(536A)에 결합한다. 레인(510D)은 ASIC(220A)의 포트(522D)를 ASIC(230D)의 포트(538A)에 결합한다.
도 5에 도시된 바와 같이, 클라우드 스위치(120A)는 "줄무늬 형태"로 되어 있는 레인 구성들(510A-D)을 갖는 멀티-레인 케이블을 이용한다. 관련 분야의 당업자에 의해 인식되는 바와 같이, 본 명세서에서의 설명이 주어지면, "줄무늬 형태"의 멀티-레인 케이블 접근법은 ASIC(220A)의 포트(522A)를 ASIC(230A) 내의 포트(532A)에 링크하고, ASIC(220A)의 포트(522B)를 ASIC(230B) 내의 포트(534A)에 링크한다. 반대로, 케이블링(cabling)에 대한 "직접적인" 접근법은 이하의 도 6의 설명과 함께 논의된다.
도 5에 도시된 줄무늬 형태의 접근법은 클라우드 스위치(120A) 내의 ASIC(220A)에서의 연속적인 포트들을 더 상위 타이어의 클라우드 스위치(130A) 내의 연속적인 ASIC들(230A-D)에 걸친 동등한 포트들에 업링크(uplink)한다. 이하의 도 6, 도 7 및 도 10의 설명과 함께 논의된 바와 같이, 본 명세서에서 논의된 클라우드 스위치들의 실시예들은 타이어들 사이에서 줄무늬 형태이거나 직접적인 케이블 접속들을 이용하도록 구성될 수 있다. 이하에 논의된 바와 같이, 그리고 도 10에 도시된 바와 같이, 본 명세서에서 논의된 직접적이거나 줄무늬 형태의 구성들을 설정하기 위한 실시예에 의해, "수동 카드들"이 이용될 수 있다.
또 다른 예에서, 각각의 ASIC(220A-D)은 8개의 포트들을 가진다. 4개의 포트들(522A-D)은 상위 타이어 내의 ASIC들(230A-D)을 향해 "상부(up)"를 향하고 있고, "업링크(uplink)" 링크들이라고 지칭되고, 4개의 "다운링크(downlink)" 포트들은 하위 타이어(도시되지 않음)로 "하부(down)"를 향하고 있다. 도 5에 도시된 바와 같이, 업링크 포트들(522A-D)은 상기 클라우드 스위치(130A)에 줄무늬 형태로 되어 있다. 이하의 도 6과 함께 설명된 바와 같이, 4개의 예시적인 다운링크 포트들은 하위의 타이어에 대한 직접적인 접속을 가질 수 있다.
클라우드 스위치들(120A, 130A)의 예시적인 실시예들은 (도 3b에 도시된 바와 같이) 클라우드 스위치 당 2개의 ASIC들, 또는 (도 1, 도 2, 도 3a, 도 4, 도 5 및 도 6에 도시된 바와 같이) 클라우드 스위치 당 4개의 ASIC들을 가진다. 상이한 실시예들에서, ASIC(220A-D) 당 포트들의 수는 훨씬 더 크고, 예를 들어, ASIC 당 64개의 포트들이다. ASIC 당 포트들의 총 수에 대한 유일한 제약은 효율에 기초한 것이고, 예를 들어, 일부 포트들은 상이한 구성들로 인해 이용되지 않을 수 있다. 일 실시예에서, ASIC 당 포트들의 수는 클라우드 스위치 당 AIC의 수의 배수이다.
도 6은 멀티-레인 케이블을 이용하여 2개의 클라우드 스위치들의 결합 내의 포트들 사이의 데이터 레인들을 도시하는 또 다른 블럭도이다. 네트워크 토폴로지(600)는 상이한 예시적인 케이블 상호접속부들(680)을 이용하여 클라우드 스위치(660A)에 결합된 클라우드 스위치(670A)를 가지고, 추가의 예시적인 패브릭은 레인들(610A-D)을 갖는 멀티-레인 케이블을 가진다. 클라우드 스위치(670A)는 ASIC들(620A-D)을 가지고, 클라우드 스위치(660A)는 ASIC들(630A-D)을 가진다. ASIC(620A)은 포트들(622A-D)을 가지고, ASIC(620B)은 포트들(624A-D)을 가지고, ASIC(620C)은 포트들(626A-D)을 가지고, ASIC(620D)은 포트들(628A-D)을 가진다. ASIC(630A)은 포트들(632A-D)을 가지고, ASIC(630B)은 포트들(634A-D)을 가지고, ASIC(630C)은 포트들(636A-D)을 가지고, ASIC(630D)은 포트들(638A-D)을 가진다. 레인(610A)은 ASIC(620A)의 포트(622A)를 ASIC(630A)의 포트(632A)에 결합한다. 레인(610B)은 ASIC(620A)의 포트(622B)를 ASIC(630A)의 포트(632B)에 결합한다. 레인(610C)은 ASIC(620A)의 포트(622C)를 ASIC(630A)의 포트(632C)에 결합한다. 레인(610D)은 ASIC(620A)의 포트(622D)를 ASIC(630A)의 포트(632D)에 결합한다.
도 6에 도시된 예시적인 네트워크 결합에서, ASIC(620A)은 클라우드 스위치(660A) 내의 각각의 ASIC(630A-D)에 결합되지 않는다. 멀티-레인 케이블의 이 직접적인 케이블 구성은 클라우드 구성들 사이에서 ASIC들을 결합하기 위한 대안적인 접근법을 도시한다.
클라우드 스위치들(660A 및 670A)은 상위 타이어에 대한 그 업링크 접속들 및 하위 타이어들에 대한 그 다운링크 접속들에 관한 어느 하나의 접근법, 둘 모두의 접근법에 대해 구성될 수 있다. 예를 들어, 클라우드 스위치(660A)는 포트들의 하나의 세트(set) 상의 클라우드 스위치(670A)로부터의 직접적인 다운링크 접속에 대해 구성될 수 있지만, 업링크 포트들(도시되지 않음) 상에서는, (도 5에 도시된 바와 같은) 줄무늬 형태의 접속이 더 상위의 타이어에서 클라우드 스위치에 접속하기 위해 이용될 수 있다. 이하의 도 7은 다수의 타이어 네트워크의 이러한 유형에 대한 도면을 도시한다.
본 명세서에서의 설명들에 기초하여, 관련 분야의 당업자는 일 실시예가 단일 레인 케이블 설비가 이용된 바와 같은 전체 네트워크 크기를 유지하면서 멀티-레인 케이블 설비의 이용을 허용하는 것을 인식할 것이다. 예를 들어, 10G 및 40G 네트워크들에서, 4개의 레인의 멀티-레인 케이블 설비를 갖는 것은 모든 네트워크 타이어에 대해 네트워크 크기를 4배만큼 감소시킨다. 예를 들어, 3-타이어 네트워크는 64배 더 작을 것이다.
이러한 유형의 구성 유연성(flexibility)을 갖는 클라우드 스위치들을 이용함으로써, 네트워크들은 동일한 유연성 있는 클라우드 스위치 빌딩 블럭을 이용하여 링크 속도 대 전체 네트워크 크기를 최적화하도록 조정될 수 있다.
네트워크 내의 클라우드 스위치들의 구성
도 7은 케이블 상호접속부들에 의해 결합된 클라우드 스위치들의 2개의 타이어(tier)들의 블럭도이다. 네트워크 토폴로지(700)는 케이블 상호접속부들(780)을 이용하여 클라우드 스위치들(760A-I)의 제 2 타이어에 결합된 클라우드 스위치들(770A-I)의 제 1 타이어를 가진다. 클라우드 스위치들(770A-I)은 ASIC들로 구성되고, 각각의 ASIC은 케이블 상호접속부들(780) 내의 멀티-레인 케이블들을 이용하여 클라우드 스위치들(760A-660I)에 결합된다. 케이블 상호접속부들(785)은 클라우드 스위치들의 제 2 타이어를 클라우드 스위치들의 제 3 타이어(도시되지 않음)에 결합한다.
제 1 및 제 2 타이어들의 클라우드 스위치들(770A-I 및 760A-I)의 구성들에 각각 기초하여, 케이블 상호접속부들(780)은 직접적인 또는 줄무늬 형태의 구성을 가질 수 있다. 또한, 교대로 반복되는 케이블링 구성들을 갖는 클라우드 스위치들로부터 구성된 멀티-타이어 네트워크를 생성하기 위하여, 추가의 타이어들이 상이한 케이블 상호접속부 구성들을 갖는 네트워크 토폴로지(700)에 부가될 수 있다. 클라우드 스위치들은 직접적인 또는 줄무늬 형태의 접속들을 이용하도록 구성될 수 있다. 예를 들어, 더 상위의 스위치 타이어에 접속되는 케이블 상호접속부들(785)과의 직접적인 방식을 이용하면서, 스위치들(760A-I)은 더 하위의 스위치 타이어에 접속되는 케이블 상호접속부들(780)과의 줄무늬 형태의 방식을 이용할 수 있다. 본 명세서에서의 설명이 주어지면, 관련 분야의 당업자는 이용가능한 상이한 조합들을 인식할 것이다.
케이블 상호접속부들(780)이 클라우드 스위치들(770A-I) 및 클라우드 스위치들(760A-I) 사이에서 업링크의 직접적인 접속이 되도록 구성하기 위해 이용되는 하나의 접근법은 클라우드 스위치들(770A-I) 및 클라우드 스위치들(760A-I) 내의 플러그-인(plug-in) 수동 카드들을 이용한다. 클라우드 스위치들(770A-I)은 멀티-레인 케이블들을 이용하여 클라우드 스위치들(760A-I) 내의 포트들에 직접 결합하도록 그 업링크 포트들을 구성하는 수동 카드를 각각 가질 수 있다. 이 직접적인 접속은 도 6의 설명과 함께 논의되고, 도 6에서는, 멀티-레인 케이블(650A)이 ASIC(620A) 내의 포트들(622A-D)을 ASIC(630A) 내의 포트들(632A-D)에 결합한다.
클라우드 스위치들(770A-I)로부터 이 직접적인 업링크를 받아들이기 위하여, 이 접근법에서는, 클라우드 스위치들(760A-I)이 클라우드 스위치들(770A-I)로부터 직접적인 접속들을 받아들이도록 그 다운링크 포트들을 구성하는 수동형 카드를 각각 가질 수 있다. 각각의 클라우드 스위치(760A-I) 내의 이 수동형 카드들은 클라우드 스위치들(760A-I)의 업링크 포트들을 구성하기 위해 이용될 수도 있고, 이에 따라, 케이블 상호접속부들(785)을 구성할 수 있다. 클라우드 스위치에서 이용되는 수동 카드는 다운링크 포트들에 대한 직접적인 접속 및 업링크 포트들에 대한 직접적인 접속을 지정할 수 있다. 또 다른 수동 카드는 업링크 및 다운링크 모두에 대해 줄무늬 형태의 접속들을 지정할 수 있다.
클라우드 스위치 구성요소들
도 8은 일 실시예에 따라, 클라우드 스위치의 몇몇 구성요소들을 도시하는 블럭도이다. 클라우드 스위치(810)는 ASIC들(820A-D), 스위치 처리기(850), 전력 공급 장치(860) 및 냉각부(870)를 가진다.
상기 배경 부분에서 언급된 바와 같이, 확장가능한 네트워크들에 대한 기존의 접근법의 하나의 과제는 배치되는 다수의 스위치 박스들과 관련된 비용이다. 이 비용은 다수의 박스들의 획득 비용들 및 관리 비용들과 관련된다. 스위치들의 매우 과립형(granular) 배치는, 인클로져들, 팬들, 및 전력 공급 장치들과 같은 여러 고정된 비용들이 더욱 밀집된 박스들 내의 더 많은 스위치 ASIC들 및 커넥터들에 걸쳐 분할되는 대신에 낮은 밀도의 박스들에 걸쳐 불필요하게 복제된다는 점에서 비효율적이다. ASIC들(820A-D)을 갖는 클라우드 스위치(810)를 이용하는 하나의 장점은 다른 네트워크 속성들을 떨어뜨리지 않으면서 주어진 배치와 관련된 박스들의 전체 수에 있어서의 감소이다.
또한, 위에서 언급된 바와 같이, 기존의 네트워크와 비교할 때, 각각의 ASIC(820A-D)은 네트워크 내의 이산 스위치 박스(discrete switch box)를 대체한다. 단일 클라우드 스위치(810) 내의 전력 공급 장치(860), 냉각부(870) 및 스위치 처리기(850)와 같은 공유 구성요소의 기능들은 동작하는 동안에 더욱 간단한 관리와, 전력 절감을 달성할 수 있다.
라우팅 인스턴스들
도 9는 일 실시예에 따라, 클라우드 스위치의 추가적인 구성요소들을 도시하는 블럭도이다. 클라우드 스위치(910)는 ASIC들(920A-D), 제어 평면 처리기(955)를 가진다. 제어 평면 처리기는 하이퍼바이저(hypervisor)(950)를 가지고, 각각의 ASIC(920A-D)은 각각의 ASIC 서브-스위치와 관련된 각각의 처리기(922A-D)를 가진다. 하이퍼바이저(950)는 ASIC(920A-D)에 각각 대응하는 가상화된 스위치 처리기(VSP : virtualized switch processor)들(922A-D)을 가진다.
일 실시예에서, 클라우드 스위치(910) 내의 라우팅 연산(computation)들은 분리가능하고 완전히 독립적인 라우팅 작업(routing task)들로 분할될 수 있다. 도 9는 이 분할에 대한 2개의 접근법들을 도시한다. 이 작업들을 분할하기 위한 하나의 접근법은 작업들을 클라우드 스위치의 각각의 ASIC에 대한 소프트웨어 작업들로 분리시키는 것이다. 도 9에서, 라우팅 작업들의 하나의 세트(set)는 각각의 ASIC(920A-D)에 대한 각각의 처리기들(922A-D)에서 유지된다.
분리된 라우팅 작업들을 관리하기 위한 하나의 접근법은 이 작업들을 각각의 ASIC(920A-D)에 대한 상이한 라우팅 인스턴스(routing instance)들로 맵핑(mapping)하는 것이다. 기존의 스위치들 및 일부 실시예들에 의해 이용되는 라우팅 인스턴스 프로토콜의 예는 개방형 최단 경로 우선(OSPF : open shortest path first) 프로토콜이다.
스위치 인스턴스들은 ASIC에 대한 라우팅 인스턴스들을 관리하기 위하여 ASIC(920A-D) 당 하나의 처리기를 이용함으로써 비용 최적화된 방식으로 관리될 수 있다. 이 접근법에서, 하나 이상의 가상 스위치 처리기들(VSP)(922A-D)은 클라우드 스위치(910) 내의 각각의 ASIC들(920A-D)을 관리할 수 있다. 하나의 실시예에서, 관리 처리기("주 라우팅 처리기"라고도 지칭됨)는 다른 ASIC들 및 클라우드 스위치(910)를 일반적으로 관리하기 위한 관리 유틸리티(utility)들에 의해 이용될 수 있다.
제어 평면 처리기(955)는 클라우드 스위치(910) 내의 ASIC들(920A-D)에 대한 라우팅 인스턴스들을 연산 및 유지할 수 있다. 하이퍼바이저(950)는 각각의 ASIC(920A-D)의 동작을 가상화된 스위치들로서 가상화된 스위치들로서 가상화하고, 각각에 대한 별도의 라우팅 인스턴스들을 유지한다. 각각의 가상화된 스위치는 상이한 내장된/스위치 동작 시스템을 이용하여 동작될 수 있다.
가상화 기반 하이퍼바이저(950)는 에러들로부터의 복구를 개선시키기 위해 이용될 수 있고, 라우팅 인스턴스들 내의 소프트웨어 결함들의 영향은 더욱 양호하게 억제될 수 있다. 유사한 장점들은 각각의 관련된 처리기들(922A-D)에 의해 각각의 ASIC(920A-D)에 대해 수행되는 라우팅 작업들을 갖는 것으로부터 누적될 수 있다.
이산 제어 처리기들(922A0D)을 가지고, 하이퍼바이저(950)를 갖는 제어 평면 처리기(955)를 이용하는 상기 접근법들은 도 9에 도시된 바와 동일한 클라우드 스위치에서 일반적으로 모두 이용되는 것이 아니라는 점에 주목하는 것이 중요하다. 하나 또는 다른 하나는 구현에 특정된 판정들에 기초하여 클라우드 스위치 내에서 이용하기 위해 선택된다.
클라우드 스위치
도 10은 샤시(chassis)(1010)와, 중간평면 커넥터(1035)에 의해 수동 카드(1030)에 결합된 ASIC들(1020A-B)을 갖는 클루우드 스위치(1000)의 블럭도이다. ASIC들(1020A-B)은 각각의 포트들(1025A-B)을 가진다. 도 1 내지 도 9와 함께 위에서 논의된 바와 같이, 클라우드 스위치(1000)는 인접한 타이어들에 대한 포트 접속들을 구성하기 위한 다수의 ASIC들(1020A-B) 및 수동 카드를 가진다. 포트들(1020A-B)은 멀티-레인 케이블들에 결합하도록 구성된다. 일 실시예에서, 수동 카드(1030)는 스위치 로직(switch logic)을 갖는 인쇄 회로 기판(PCB : printed circuit board)들을 가지는 플러그-인 카드(plug-in card)이다.
중이층 PHY들(1028A-B)은 포트들(1025A-B)의 ASIC들(1020A-B)로의 각각의 결합을 가능하게 한다. 중이층 PHY들(1028A-B)과 관련된 설정들은 ASIC들(1020A-B)에 의한 포트들(1025A-B)의 이용을 구성할 수 있다. 또한, 수동 카드(1030) 및 중이층 PHY들(1020A-B)의 조합은 포트들(1025A-B)을 구성하기 위한 실시예에 의해 이용될 수 있다.
수동 카드(1030)의 실시예는 ASIC들(1020A-B)의 포트 접속들을 구성하기 위하여 추적 로직을 이용한다. 도 1 내지 도 9와 함께 상기 언급된 바와 같이, 클라우드 스위치(1000)는 인접한 타이어들에 대한 포트 접속들을 구성하기 위하여 수동 카드(1030)를 이용한다. 일부 실시예들에서, 2개의 유형들의 수동 카드(1030)는 줄무늬 대 줄무늬 및 직접 대 줄무늬로 클라우드 스위치(1000)에 플러그-인 될 수 있다. 예를 들어, 줄무늬 대 줄무늬의 수동 카드가 설치되어 있을 때, 포트들(1025A)은 (도 5에 도시된 바와 같은) 줄무늬 형태의 구성을 갖는 멀티-레인 케이블로부터 데이터를 수신하고, 포트들(1025B)은 줄무늬 형태의 구성을 갖는 멀티-레인 케이블을 이용하여 데이터를 송신한다. 또 다른 예에서, 줄무늬 대 직접 수동 카드가 설치되어 있을 때, 포트들(1025A)은 줄무늬 형태의 구성을 갖는 멀티-레인 케이블로부터 데이터를 수신하고, 포트들(1025B)은 (도 6에 도시된 바와 같은) 직접적인 구성을 갖는 멀티-레인 케이블을 이용하여 데이터를 송신한다.
방법(1100)
이 부분 및 도 11은 네트워크에서 데이터를 전달하는 예시적인 방법의 순서도를 제시함으로써 본 명세서에서 설명된 기술들을 요약한다. 이러한 방법은 한정하기 위한 것이 아니다.
도 11에 도시된 바와 같이, 방법(1100)은 단계(1110)에서 시작되고, 여기서, 제 1 번들 스위치의 외부의 접속들만을 결합하도록 구성된 복수의 서브-스위치들을 갖는 제 1 번들 스위치의 서브-스위치에서 데이터가 수신된다. 일 실시예에서, 도 3a의 클라우드 스위치(120A)의 ASIC(220A)은 데이터를 수신한다. ASIC(220A)은 ASIC(220B)에 결합되도록 구성되지 않는다. 상이한 실시예들에서, 이 데이터는 상이한 소스들로부터 발생한다. 하나의 소스는 또 다른 클라우드 스위치일 수 있다. 예를 들어, 도 1에서, 클라우드 스위치(120A)는 케이블 상호접속부들(155)을 통해 클라우드 스위치(110A)로부터 데이터를 수신한다. 일단 단계(1110)가 완료되면, 방법(1100)은 단계(1120)로 진행한다.
단계(1120)에서, 제 2 번들 스위치에 결합된 멀티-레인 케이블, 제 1 번들 스위치 내의 서브-스위치에 결합된 멀티-레인 케이블의 제 1 단부, 및 제 2 번들 스위치 내의 적어도 2개의 서브-스위치들에 결합된 멀티-레인 케이블의 제 2 단부를 이용하여, 데이터가 제 1 번들 스위치로부터 전달된다. 일 실시예에서, 클라우드 스위치(120A) 내의 ASIC(220A)으로부터의 데이터는 ML 케이블(250A)을 이용하여 클라우드 스위치(130A)에 전달된다. ASIC(220A)에 결합된 멀티-레인 케이블의 각각의 레인은 클라우드 스위치(130A) 상의 각각의 ASIC들(230A-D)에 결합된다. 일단 단계(1120)가 완료되면, 방법(1100)은 종료된다.
클라우드 스위치 구현예
본 명세서에서의 스위치 기능들은 하드웨어, 소프트웨어, 또는 그 일부 조합으로 구현될 수 있다. 하드웨어, 소프트웨어, 또는 그 조합에 의해 수행될 수 있는 실시예들에 의해 수행되는 예시적인 기능들은 스위치 라우팅 기능들을 포함한다.
관련 분야의 당업자에 의해 인식되는 바와 같이, 본 명세서에서의 설명이 주어지면, 하이퍼바이저(950) 및 처리기들(922A-D) 기능들은 예를 들어, 컴퓨터 처리기들, 컴퓨터 로직, 주문형 집적회로(ASIC) 등을 이용하여 구현될 수 있다. 추가적으로, 본 명세서에서 설명된 클라우드 스위치들에 대한 기능들을 수행하는 임의의 처리기는 본 발명의 범위 및 취지 내에 있다.
또한, 본 명세서에서 설명된 기능들은 컴퓨터 처리기 또는 위에서 열거된 하드웨어 장치들 중의 임의의 하나에 의해 실행되는 컴퓨터 프로그램 명령들에 의해 구체화될 수 있다. 컴퓨터 프로그램 명령들은 처리기가 본 명세서에서 설명된 기능들을 수행하도록 한다. 컴퓨터 프로그램 명령들(예를 들어, 소프트웨어)은 컴퓨터 또는 처리기에 의해 액세스될 수 있는 컴퓨터 이용가능 매체, 컴퓨터 프로그램 매체, 또는 임의의 컴퓨터-판독가능 저장 매체에서 저장될 수 있다. 이러한 매체는 RAM 또는 ROM과 같은 메모리 장치, 컴퓨터 디스크 또는 CD ROM과 같은 다른 유형의 컴퓨터 저장 매체, 또는 그 등가물을 포함한다. 따라서, 처리기가 데이터 수집, 정책 관리, 조정, 분석 기능들 및 본 명세서에서 설명된 다른 관련된 기능들을 수행하도록 하는 컴퓨터 프로그램 코드를 갖는 임의의 컴퓨터 저장매체는 본 발명의 범위 및 취지 내에 있다.
결론
본 발명의 다양한 실시예들이 위에서 설명되었지만, 이들은 예시를 위해 제시된 것이며 한정이 아니라는 점을 이해해야 한다. 형태 및 세부 내용에 있어서의 다양한 변화들은 발명의 취지 및 범위로부터 벗어나지 않으면서 본 명세서에서 행해질 수 있다는 것은 당해 분야의 당업자에게 명백할 것이다. 그러므로, 본 발명은 다음의 청구항들 및 그 등가물들에 따라서만 규정되어야 한다.

Claims (15)

  1. 포트들을 갖는 복수의 서브-스위치들을 포함하는 번들 스위치로서,
    상기 복수의 서브-스위치들 중의 하나는 상기 번들 스위치의 외부의 접속들에만 결합하도록 구성되는, 번들 스위치.
  2. 청구항 1에 있어서,
    상기 복수의 서브-스위치들 중의 상기 하나는 멀티-레인 케이블에 결합되도록 추가적으로 구성되는, 번들 스위치.
  3. 청구항 2에 있어서,
    상기 멀티-레인 케이블 내의 레인들의 수는 서브-스위치들의 수에 대응하는, 번들 스위치.
  4. 청구항 2에 있어서,
    상기 멀티-레인 케이블 내의 레인들의 수는 서브-스위치들의 수의 배수(multiple)인, 번들 스위치.
  5. 청구항 2에 있어서,
    상기 서브-스위치들은 P개의 포트들을 가지고, 상기 서브-스위치들 중의 하나의 P개의 포트들 각각은 상기 멀티-레인 케이블의 P개의 송신 레인들의 각각에 결합되도록 구성되는, 번들 스위치.
  6. 청구항 1에 있어서,
    네트워크 인터페이스는 직접 모드(direct mode) 및 줄무늬 형태의 모드(striped mode) 모두에 대해 구성가능한, 번들 스위치.
  7. 청구항 1에 있어서,
    상기 번들 스위치는 스탬프 방식의 스위치(stamped switch)인, 번들 스위치.
  8. 청구항 1에 있어서,
    라우팅 관리자를 더 포함하는, 번들 스위치.
  9. 청구항 8에 있어서,
    상기 라우팅 관리자는 상기 복수의 서브-스위치들 중의 하나와 관련된 라우팅 처리기인, 번들 스위치.
  10. 각각의 제 1 및 제 2 네트워크 타이어(tier)들 상의 제 1 및 제 2 번들 스위치를 포함하고, 각각의 번들 스위치는 복수의 서브-스위치들을 가지고, 각각의 서브-스위치는 P개의 포트들을 갖는 네트워크 인터페이스를 가지고, 각각의 번들 스위치 내의 상기 복수의 서브-스위치들 중의 하나는 상기 번들 스위치의 외부의 접속들에만 결합하도록 구성되는, 네트워크.
  11. 제 1 레벨의 번들 스위치들로서, 각각의 번들 스위치는 복수의 서브-스위치들을 가지고, 각각의 서브-스위치는 복수의 포트들을 갖는 네트워크 인터페이스를 가지고, 각각의 제 1 레벨 번들 스위치에 대한 상기 복수의 서브-스위치들 중의 적어도 하나는 외부 접속에만 결합하도록 구성되는, 상기 제 1 레벨의 번들 스위치들; 및
    복수의 서브-스위치들을 갖는 제 2 레벨의 번들 스위치들로서, 각각의 서브-스위치는 복수의 포트들을 갖는 네트워크 인터페이스를 가지고, 제 2 레벨 번들 스위치는 제 1 레벨 번들 스위치에 결합되는, 상기 제 2 레벨의 번들 스위치들을 포함하는, 네트워크.
  12. 네트워크에서 데이터를 전달하는 방법으로서,
    복수의 서브-스위치들을 갖는 제 1 번들 스위치로서, 상기 제 1 번들 스위치의 외부의 접속부들에만 결합하도록 구성된 상기 제 1 번들 스위치의 서브-스위치에서 데이터를 수신하는 단계; 및
    제 2 번들 스위치에 결합된 멀티-레인 케이블, 상기 제 1 번들 스위치 내의 서브-스위치에 결합된 상기 멀티-레인 케이블의 제 1 단부, 및 상기 제 2 번들 스위치 내의 적어도 2개의 서브-스위치들에 결합된 멀티-레인 케이블의 제 2 단부를 이용하여, 상기 제 1 번들 스위치로부터 상기 데이터를 전달하는 단계를 포함하는, 네트워크에서 데이터를 전달하는 방법.
  13. 청구항 12에 있어서,
    상기 제 1 번들 스위치 내의 상기 서브-스위치와 관련된 처리기를 이용하여 상기 제 2 번들 스위치에 상기 데이터를 라우팅하는 단계를 더 포함하는, 네트워크에서 데이터를 전달하는 방법.
  14. 청구항 12에 있어서,
    상기 제 1 번들 스위치 내의 하이퍼바이저(hypervisor)에 의해 제어되는 가상화된 라우팅 인스턴스(virtualized routing instance)를 이용하여 상기 제 2 번들 스위치에 상기 데이터를 라우팅하는 단계를 더 포함하는, 네트워크에서 데이터를 전달하는 방법.
  15. 청구항 14에 있어서,
    상기 하이퍼바이저는 상기 제 1 번들 스위치 내의 적어도 2개의 서브-스위치들에 대한 가상화된 라우팅 인스턴스들을 제어하는, 네트워크에서 데이터를 전달하는 방법.
KR1020120006681A 2011-01-20 2012-01-20 데이터 센터 스위치 KR101357843B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161434794P 2011-01-20 2011-01-20
US61/434,794 2011-01-20
US13/235,080 US8934483B2 (en) 2011-01-20 2011-09-16 Data center switch
US13/235,080 2011-09-16

Publications (2)

Publication Number Publication Date
KR20120084691A true KR20120084691A (ko) 2012-07-30
KR101357843B1 KR101357843B1 (ko) 2014-02-05

Family

ID=45540763

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120006681A KR101357843B1 (ko) 2011-01-20 2012-01-20 데이터 센터 스위치

Country Status (5)

Country Link
US (2) US8934483B2 (ko)
EP (1) EP2479943A1 (ko)
KR (1) KR101357843B1 (ko)
CN (2) CN105227496B (ko)
TW (1) TWI562563B (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8495194B1 (en) * 2010-06-29 2013-07-23 Amazon Technologies, Inc. Connecting network deployment units
US8934483B2 (en) 2011-01-20 2015-01-13 Broadcom Corporation Data center switch
US8724496B2 (en) * 2011-11-30 2014-05-13 Broadcom Corporation System and method for integrating line-rate application recognition in a switch ASIC
US8681794B2 (en) 2011-11-30 2014-03-25 Broadcom Corporation System and method for efficient matching of regular expression patterns across multiple packets
US9229771B2 (en) * 2012-03-08 2016-01-05 Microsoft Technology Licensing, Llc Cloud bursting and management of cloud-bursted applications
US9473422B1 (en) * 2012-05-09 2016-10-18 Google Inc. Multi-stage switching topology
US9444896B2 (en) 2012-12-05 2016-09-13 Microsoft Technology Licensing, Llc Application migration between clouds
US20140281105A1 (en) * 2013-03-15 2014-09-18 Silicon Graphics International Corp. High speed disk array spider cable
US9825857B2 (en) * 2013-11-05 2017-11-21 Cisco Technology, Inc. Method for increasing Layer-3 longest prefix match scale
US10484519B2 (en) 2014-12-01 2019-11-19 Hewlett Packard Enterprise Development Lp Auto-negotiation over extended backplane
WO2017065732A1 (en) * 2015-10-12 2017-04-20 Hewlett Packard Enterprise Development Lp Switch network architecture
US10694269B2 (en) * 2018-08-20 2020-06-23 Quanta Computer Inc. Optical cable identification tool
WO2021105728A1 (en) * 2019-11-28 2021-06-03 Mellanox Technologies Ltd. Efficient parallelized computation of a benes network configuration

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291479A (en) * 1991-07-16 1994-03-01 Digital Technics, Inc. Modular user programmable telecommunications system with distributed processing
US7016299B2 (en) * 2001-07-27 2006-03-21 International Business Machines Corporation Network node failover using path rerouting by manager component or switch port remapping
US7218640B2 (en) 2002-08-30 2007-05-15 Intel Corporation Multi-port high-speed serial fabric interconnect chip in a meshed configuration
JP4623010B2 (ja) 2004-11-18 2011-02-02 日本電気株式会社 スイッチ装置、スイッチ方法及びスイッチ制御用プログラム
US7983257B2 (en) * 2008-07-18 2011-07-19 Emulex Design & Manufacturing Corporation Hardware switch for hypervisors and blade servers
US8340088B2 (en) 2008-09-11 2012-12-25 Juniper Networks, Inc. Methods and apparatus related to a low cost data center architecture
US8798045B1 (en) * 2008-12-29 2014-08-05 Juniper Networks, Inc. Control plane architecture for switch fabrics
US8842688B2 (en) * 2009-01-20 2014-09-23 The Regents Of The University Of California Reducing cabling complexity in large-scale networks
US7909643B2 (en) * 2009-02-27 2011-03-22 Tyco Electronics Corporation Cassette for a cable interconnect system
US8416692B2 (en) 2009-05-28 2013-04-09 Microsoft Corporation Load balancing across layer-2 domains
US8613085B2 (en) * 2009-07-22 2013-12-17 Broadcom Corporation Method and system for traffic management via virtual machine migration
US9031081B2 (en) 2009-08-06 2015-05-12 Broadcom Corporation Method and system for switching in a virtualized platform
US8261269B2 (en) * 2009-09-21 2012-09-04 Oracle International Corporation System and method for synchronizing transient resource usage between virtual machines in a hypervisor environment
US20110202682A1 (en) * 2010-02-12 2011-08-18 Microsoft Corporation Network structure for data center unit interconnection
US8345692B2 (en) * 2010-04-27 2013-01-01 Cisco Technology, Inc. Virtual switching overlay for cloud computing
US8934483B2 (en) 2011-01-20 2015-01-13 Broadcom Corporation Data center switch

Also Published As

Publication number Publication date
CN102739407A (zh) 2012-10-17
US20120189004A1 (en) 2012-07-26
US9374321B2 (en) 2016-06-21
US20150098473A1 (en) 2015-04-09
CN105227496A (zh) 2016-01-06
CN105227496B (zh) 2019-03-19
US8934483B2 (en) 2015-01-13
TW201246835A (en) 2012-11-16
KR101357843B1 (ko) 2014-02-05
EP2479943A1 (en) 2012-07-25
TWI562563B (en) 2016-12-11

Similar Documents

Publication Publication Date Title
KR101357843B1 (ko) 데이터 센터 스위치
US10303640B2 (en) Method and apparatus to manage the direct interconnect switch wiring and growth in computer networks
CN102480358B (zh) 集中化虚拟交换机架构控制方法和设备
US11979278B2 (en) Software-based fabric enablement
US11388492B2 (en) Flat, highly connected optical network for data center switch connectivity
Zhang et al. Understanding lifecycle management complexity of datacenter topologies
US9258253B2 (en) System and method for flexible switching fabric
US10200305B2 (en) Structured rearranged network for data center and high-performance computing applications
Guay et al. vFtree-A fat-tree routing algorithm using virtual lanes to alleviate congestion
US11038816B2 (en) Low level provisioning of network fabrics
US11537443B2 (en) Reconfigurable computing pods using optical networks
US9124519B2 (en) System guided surrogating control in broadcast and multicast
Conterato et al. Reducing energy consumption in SDN-based data center networks through flow consolidation strategies
Wu et al. The case for a rackless data center network architecture
Korösi et al. Poincare: A hyperbolic data center architecture
US20240154903A1 (en) Cyclic dragonfly and megafly

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170303

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180109

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190110

Year of fee payment: 6