TWI794596B - 在內部交換結構中用於不等鏈路連接之散佈 - Google Patents

在內部交換結構中用於不等鏈路連接之散佈 Download PDF

Info

Publication number
TWI794596B
TWI794596B TW109107780A TW109107780A TWI794596B TW I794596 B TWI794596 B TW I794596B TW 109107780 A TW109107780 A TW 109107780A TW 109107780 A TW109107780 A TW 109107780A TW I794596 B TWI794596 B TW I794596B
Authority
TW
Taiwan
Prior art keywords
fabric
core
cores
inter
ports
Prior art date
Application number
TW109107780A
Other languages
English (en)
Other versions
TW202127835A (zh
Inventor
仙希爾 杜拉賽米
海學德 B 雅加瑟
Original Assignee
美商瞻博網路公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商瞻博網路公司 filed Critical 美商瞻博網路公司
Publication of TW202127835A publication Critical patent/TW202127835A/zh
Application granted granted Critical
Publication of TWI794596B publication Critical patent/TWI794596B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • H04L49/252Store and forward routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/50Queue scheduling
    • H04L47/62Queue scheduling characterised by scheduling criteria
    • H04L47/622Queue service order
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/36Flow control; Congestion control by determining packet size, e.g. maximum transfer unit [MTU]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/101Packet switching elements characterised by the switching fabric construction using crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/103Packet switching elements characterised by the switching fabric construction using a shared central buffer; using a shared memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • H04L49/1515Non-blocking multistage, e.g. Clos
    • H04L49/1523Parallel switch fabric planes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • H04L49/1553Interconnection of ATM switching modules, e.g. ATM switching fabrics
    • H04L49/1576Crossbar or matrix
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric
    • H04L49/253Routing or path finding in a switch fabric using establishment or release of connections between ports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports
    • H04L49/3009Header conversion, routing tables or routing tags
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • H04L49/9063Intermediate storage in different physical parts of a node or terminal
    • H04L49/9068Intermediate storage in different physical parts of a node or terminal in the network interface card

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

一般而言,本發明描述用於由一內部裝置交換結構之一結構平面之結構核心來促進平衡單元處理的技術。在一些實例中,一路由系統包含複數個結構端點及包括一結構平面之一交換結構以在該等結構端點之間交換單元。該結構平面包含兩個結構核心及連接該等結構核心之一或多個核心間鏈路。各結構核心基於以下選擇以將該等單元之一經接收單元路由至其之該結構核心之一輸出埠:(i)在其上接收該經接收單元之該結構核心之一輸入埠及(ii)用於該經接收單元之一目的地結構端點,該等選定輸出埠之至少一部分連接至該等核心間鏈路,且將該經接收單元交換至該選定輸出埠。

Description

在內部交換結構中用於不等鏈路連接之散佈
本發明係關於電腦網路,且更特定言之,係關於在電腦網路內通信封包。
一電腦網路係可交換資料及共用資源之互連計算裝置之一集合。在一基於封包之網路(諸如一乙太網路)中,計算裝置藉由將資料劃分為稱為封包之可變長度區塊來通信資料,該等可變長度區塊經分別自一源裝置至一目的地裝置跨網路路由。目的裝置自封包提取資料並將資料組裝成其原始形式。
某些裝置(指稱路由器)維護表示網路之一拓撲之路由資訊​​。路由器交換路由資訊以便維護通過網路之可用路由之一準確表示。通常可將一「路由」定義為網路上兩個位置之間的一路徑。一路由器在接收一傳入資料封包之後檢查封包內之資訊(通常指稱一「密鑰」)以根據路由資訊選擇將封包轉發至一適當下一跳。
網際網路內存在各種路由器。例如,網路服務提供商(NSP)維護「邊緣路由器」以向客戶提供網際網路存取及其他服務。NSP可提供之服務之實例包含IP語音(VoIP)、用於異步傳輸模式(ATM)或訊框中繼通信之存取、網際網路協議(IP)資料服務及多媒體服務(諸如視訊流)。NSP之邊緣路由器通常將網路流量通信至高速「核心路由器」,其可通常視作形成網際網路之骨幹。此等核心路由器通常比邊緣路由器包含更多處理資源,且經設計以處理大量網路流量。
路由器可包含線卡,其包含具有埠之網路介面卡以及封包轉發引擎(PFE)或其他封包處理器。線卡自網路接收及處理待通過路由器交換結構交換之封包且自交換結構接收待發送至網路中下一個目的地之封包。一路由器之交換結構可包含具有結構平面之結構卡,該等結構平面將通過路由器之流量自一個線卡上之一入口埠交換至另一線卡上之一目的地出口埠。
一般而言,描述用於藉由一內部裝置交換結構之一結構平面之結構核心來促進經平衡單元處理之技術。該等技術可包含在將該等結構核心彼此連接之核心間鏈路當中以及在連接至該等結構核心之目的地結構端點之直接鏈路當中散佈單元。當該等結構端點共用至一結構平面之一奇數個可用鏈路時或當多個結構端點具有至該結構平面之不同數目個鏈路以導致與該結構平面之不平衡連接時,該等技術可能特別適用。
例如,一線卡上之兩個結構端點可共同具有至一結構平面之一奇數個鏈路。此等鏈路之一者在該兩個結構端點當中共用。該結構平面包含兩個結構核心,且該奇數個鏈路在該兩個核心當中平均分配並連接至該兩個核心,其中除僅連接至該等核心之一第一核心的該共用鏈路外。在另一實例中,兩個結構端點可具有至一結構平面之一不同數目個鏈路。例如,一第一結構端點可具有至該兩個核心之各者的4個鏈路,而一第二結構端點可具有至該兩個核心之各者的一單一鏈路。此等結構端點及其等各自鏈路連接組係不平衡的。
為在共用或不平衡鏈路之此等兩種情況下促進該兩個結構核心之間的平衡單元處理,該第一核心將在一共用或不平衡鏈路上接收之該單元流量之一部分經由一核心間鏈路散佈至該等核心之該第二核心。如本文中所使用,一互連埠係經由一核心間鏈路通信地耦合至另一結構核心的一結構核心上之一埠,一輸出埠係連接至一結構端點或其他結構核心以發送單元的一結構核心之一埠,且一輸入埠係用於自一結構端點或其他結構核心接收單元的一結構核心之一埠。當一單元到達該結構平面之一輸入埠時,該單元之該初始接收結構核心可至少基於指示該源結構端點與該輸入埠之間的該鏈路係不平衡或共用之該輸入埠來判定是否經由一核心間鏈路將該單元發送至該另一結構核心用於交換至該輸出埠。
該等技術可提供一或多個技術優勢以促進至少一個實際應用。例如,該等單元處理技術可使得多核結構平面交換架構(該等結構平面具有在多個結構端點當中共用之奇數個鏈路)以在該等結構核心當中達成平衡(即公平)單元處理。作為另一實例,該等單元處理技術可實現具有一多核結構平面之結構端點當中之不平衡鏈路連接以達成該等結構核心當中之平衡單元處理。
在一個實例中,一路由系統包含複數個結構端點及包括用於在該等結構端點當中交換單元之一結構平面的一交換結構。該結構平面包含兩個結構核心及連接該等結構核心之一或多個核心間鏈路。各結構核心基於以下選擇以將該等單元之一經接收單元路由至其之該結構核心之一輸出埠:(i)在其上接收該經接收單元之該結構核心之一輸入埠及(ii)用於該經接收單元之一目的地結構端點,該等選定輸出埠之至少一部分連接至該等核心間鏈路,且將該經接收單元交換至該選定輸出埠。
另一實例包含一種在具有複數個端點及包括用於在該等端點當中交換單元之一結構平面之一交換結構的一路由器中路由單元之方法。該交換結構平面包含結構核心之兩者及連接該等結構核心之一或多個核心間鏈路。該方法包含在複數個輸入埠處接收單元。該方法亦包含由該等結構核心基於以下選擇用於路由該等單元之一經接收單元之該結構核心之一輸出埠:(i)在其上接收該經接收單元之該結構核心之一輸入埠及(ii)用於該經接收單元之一目的地結構端點,該等選定輸出埠之至少一部分連接至該等核心間鏈路。另外,該方法包含將該經接收單元交換至該等選定輸出埠。
在另一實例中,一網路裝置包含:複數個線卡,其等共同具有複數個結構端點;及一結構交換卡,其耦合至該等線卡且包括一結構平面以在該等結構端點當中交換單元。該結構平面包含兩個結構核心及連接該等結構核心之一或多個核心間鏈路。各結構核心基於以下選擇用於路由該等單元之一經接收單元之該結構核心之一輸出埠:(i)在其上接收該經接收單元之該結構核心之一輸入埠及(ii)用於該經接收單元之一目的地結構端點,該等選定輸出埠之至少一部分連接至該等核心間鏈路且將該經接收單元交換至該選定輸出埠。
一或多個實例之細節在附圖及以下描述中闡述。將自說明書及附圖以及自申請專利範圍明白其他特徵、目的及優點。
圖1係繪示一實例網路環境之一方塊圖,其中服務提供商網路包含根據本發明中所描述之技術組態之一路由器。為實例目的,關於圖1之一簡化網路環境100描述本發明之原理,其中一路由器102與邊緣路由器104A及104B (統稱為「邊緣路由器104」)通信以向客戶網路106A至106C (統稱為「客戶網路106」)提供對服務提供商網路108之存取。路由器102可與邊緣路由器104交換路由資訊以便維護網路環境100之拓撲之一準確表示。如下文所描述,路由器102可由作為服務提供商網路108內之一單一節點操作的複數個協作路由組件組成。路由器102包含將各種內部路由組件(例如,線卡、交換結構卡、一路由引擎卡等)耦合在一起之一機架(未展示於圖1中)。
儘管未繪示,但服務提供商網路108可耦合至由其他提供商管理之一或多個網路,且可因此形成一大規模公共網路基礎設施(例如網際網路)之部分。因此,客戶網路106可視作網際網路之邊緣網路。服務提供商網路108可向客戶網路106內之計算裝置提供對網際網路之存取,且可允許客戶網路106內之計算裝置彼此通信。在另一實例中,服務提供商網路108可在網際網路之核心內提供網路服務。在任一情況下,服務提供商網路108可包含除路由器102及邊緣路由器104外之各種網路裝置(未展示),諸如額外路由器、交換機、伺服器或其他裝置。
在所繪示之實例中,邊緣路由器104A經由存取鏈路110A耦合至客戶網路106A,且邊緣路由器104B經由額外存取鏈路110B及110C耦合至客戶網路106B及106C。客戶網路106可為用於一企業之地理上分離之站點之網路。客戶網路106可包含一或多個計算裝置(未展示),諸如個人電腦、膝上型電腦、手持電腦、工作站、伺服器、交換機、印表機、客戶資料中心或其他裝置。圖1中所繪示之網路環境100之組態僅係一實例。服務提供商網路108可耦合至任何數目個客戶網路106。儘管如此,為便於描述,在圖1中僅繪示一實例數目個客戶網路106A至106C。除服務提供商網路108外,許多不同類型之網路可採用路由器102之一例項,包含客戶/企業網路、傳輸網路、聚合或存取網路等等。
如下文進一步詳細描述,路由器102包含一交換結構112。交換結構112包含交換結構卡,其等提供用於在連接至結構平面之結構端點之間通過路由器102路由單元的結構平面。結構平面包含具有核心間鏈路之結構核心,其等促進在結構核心之間路由單元以平衡單元流量。此促進在其中各結構端點無需具有至結構核心之相同數目個鏈路,或其中多個結構端點可共用一奇數個鏈路的一組態中使用結構端點,同時為各結構核心維持一平衡流量負載。儘管此操作在路由器102外部係透明的,但其提供一優點:允許在其上之線卡及結構端點之一更靈活組態,使得可在不更新機架或交換結構卡之情況下更新路由器102。因此,與現有結構相比,路由器102之硬體組態可更靈活。
其中各結構平面具有自各結構端點至結構平面之一相等數目個鏈路之架構促進在結構端點之間的鏈路當中散佈之相等單元流量。交換結構112包含一或多個結構平面。結構平面之至少一者具有多個(例如兩個)結構核心,結構核心之各者係一單獨交叉交換且連接至結構平面之輸入埠及輸出埠。根據本發明之技術,結構平面促進由結構核心之平衡單元處理。結構核心藉由一或多個核心間鏈路連接。該等技術可包含在核心間鏈路當中以及在直接鏈路當中散佈單元至經由結構平面之埠連接至結構核心的目的地結構端點。當結構端點共用至一結構平面之一奇數個可用鏈路時或當多個結構端點具有至結構平面之不同數目個鏈路以導致與結構平面之不平衡連接時,該等技術可能特別適用。
單元處理技術可使得多核心結構平面交換架構(該等結構平面具有在多個結構端點之間共用之奇數個鏈路)在結構核心之間達成平衡(即公平)單元處理。作為另一實例,單元處理技術可實現具有一多核心結構平面之結構端點之間之不平衡鏈路連接以達成結構核心之間之平衡單元處理。
圖2係繪示根據本文中所描述之技術之一交換系統之一實例的一方塊圖。交換系統202之交換結構200 (有時指稱「結構200」)可表示圖1之路由器102之交換結構112之一實例例項。交換系統202之線卡204A及204B (統稱為「線卡204」)分別耦合至交換結構200之結構平面206A至206K之各者以作為由結構200交換之資料單元(例如單元)之源及/或目的地操作。明確言之,在所繪示之實例中,線卡204具有多個結構端點207A及207B (統稱為「結構端點207」),其等經由共用及非共用鏈路連接至結構平面206且作為單元之源及/或目的地操作。在所繪示之實例中,線卡204A之一者之端點207進入、發起或依其他方式獲取封包208用於經由交換結構200交換至退出、消耗或依其他方式沉入封包208之另一線卡204B之端點207。
儘管結構端點207之各者通常作為單元之一源及一目的地兩者操作,但在各種例項中,結構端點207之任何者可為單元之一源抑或一目的地。在一些實例中,結構端點207可各代表一封包轉發引擎(PFE)或其他轉發單元,使得結構端點207共同實施用於一封包交換裝置(例如路由器102)之一分佈式轉發平面。在一些實例中,結構端點207可表示用於伺服器或其他主機(例如虛擬機)之結構介面,該等伺服器或其他主機經由結構200交換用於一分佈式應用之封包。結構端點207可包含各自交換結構介面或「交換介面」(SI (未展示))以提供經由結構200交換之單元的佇列,以及其他操作。
在此實例中,交換結構200包含複數個結構平面206A至206K (統稱為「結構平面206」),各者包含多個結構核心210A及210B。結構平面206A至206K係由結構核心(經繪示為「結構核心210A及210B」且在本文中統稱為「結構核心210」)支撐之在操作上獨立、並行交換結構平面。交換系統202可包含一或多個交換平面206。交換系統202可包含一或多個交換結構卡以實施結構平面206。一單一結構平面206中之結構核心210之數目可為任何數目,取決於結構核心210之各自容量及所需之結構帶寬。在所繪示之實例中,結構平面206A包含兩個結構核心210A及210B。各結構核心210包含用於實施一獨立交換網路(例如Benes網路)以向結構端點207提供交換帶寬之類似組件,以下主要關於結構平面206A之結構核心210A及210B描述該等組件及功能。單獨結構平面206之結構核心210在操作上係獨立的,因為一個結構平面206之結構核心210之一者之一故障不影響其他結構平面206之剩餘操作結構平面之交換能力。結構核心210之各者可提供非阻塞連接。
結構核心210之各者包含耦合至線卡204A之一者之結構端點207A之輸入埠212及耦合至線卡204B之另一者之結構端點207B之輸出埠214。儘管為簡單起見僅繪示具有兩個入口結構端點207A之一個線卡204A及具有兩個出口結構端點207B之一個線卡204B,但各結構平面206通常包含耦合至多個線卡之各自結構端點之多個輸入埠212及輸出埠214。當一結構端點207A獲得一封包時,結構端點207A執行一查找操作以判定哪個結構端點(在此實例中,線卡204B之結構端點207B之一者)係該封包之一目的地。例如,獲得一封包可為指自網路或主機接收一封包,或發起一封包。結構端點207A可選地將封包劃分為單元並將該封包/單元跨結構200轉發至一目的地結構端點207B。結構端點207A選擇不同結構平面206來交換單元以跨結構平面206分佈帶寬負載。
結構端點207可採用一請求/許可協議來跨結構200傳輸一資料單元。在此等情況下,源結構端點207跨結構200將一請求傳輸至目的地結構端點207。在一些實例中,為跨用於單元之一選定結構平面206A發送單元,源結構端點207A以一輪詢(例如,不足加權輪詢等)或其他平衡順序以公平分佈運輸負載跨結構核心210之一不同者傳輸各此請求。回應於接收該請求,目的地結構端點207跨目的地結構端點207B在其上接收對應請求之相同結構核心210向源結構端點207A傳輸一許可。回應於接收該許可,源結構端點207A跨源結構端點207A在其上發出對應請求之相同結構核心210將資料單元傳輸至目的地結構端點207B。
在所繪示之實例中,相同結構平面206上之結構核心210包含核心間埠216,其等促進在兩個結構核心210之間傳輸單元以平均分佈流向結構端點207之流量。當結構端點207與結構核心210具有一不同數目個連接時,發生不平衡連接。當一單元自源結構端點207A發送至具有一不平衡連接之結構核心210時,該單元可經由待路由之核心間鏈路而轉發至另一結構核心210。依此一方式,交換結構200適應一組態,其中來自結構端點207之鏈路數目意謂結構端點不可具有與結構核心210相等之連接。
可發生不平衡連接,因為在一路由器內使用具有不同組態(諸如每結構平面之鏈路之一不同數目)之結構端點,及/或兩個或兩個以上結構端點之一組可具有具結構平面206之一或多者的一奇數個鏈路,使得該兩個或兩個以上結構端點可共用一鏈路以有效地利用鏈路之集體帶寬。
圖3A及圖3B係具有結構端點群組之線卡之方塊圖,該等結構端點群組具有至一結構平面之共用及/或不平衡鏈路連接。在圖3A之所繪示之實例中,線卡300A及300B具有各兩個結構端點群組(例如,分別端點群組302A及302B以及端點群組302C及302D)。端點群組302A至302D各包含多個結構端點。例如,結構端點之各者可代表一PFE或其他封包處理器。在所繪示之實例中,端點群組302A至302D各包含兩個結構端點(例如,端點「C0」及「C1」)。所繪示之實例之結構端點C0及C1可為上文圖2之結構端點207之實例。在所繪示之實例中,端點群組302A及302B (為簡單起見,有時分別指稱「 EG0 302A」及「 EG1 302B」)各使用九個鏈路連接至結構平面206。類似地,端點群組302C及302D (為簡單起見,有時分別指稱「 EG2 302C」及「 EG3 302D」)各使用九個鏈路連接至結構平面206。
EG0 302A使用5個鏈路連接至第一結構核心210A。EG0 302A使用4個鏈路經由結構平面206內之旁通鏈路306連接至第二結構核心210B。EG0 302A之端點C0及C1各具有至第一核心210A之5個鏈路之2個專用鏈路且EG0 302A之端點C0及C1共用至第一核心210A之5個鏈路之1個(有時指稱一「共用鏈路」或一「0.5鏈路」)。EG0 302A之端點C0使用至第二核心210B之4個鏈路之2個專用鏈路連接至第二核心210B。總而言之,EG0 302A之C0使用2.5個鏈路連接至第一結構核心210A且使用2個鏈路連接至第二結構核心210B。類似地,EG0 302A之C1使用2個專用鏈路及1個共用鏈路連接至第一結構核心210A,且使用2個專用鏈路連接至第二結構核心210B。EG1 302B及其端點C0及C1與EG1 302A類似地連接至結構核心210A、210B。
EG2 302C及EG3 302D依相對於結構核心210A、210B相對於EG0及EG1倒數之一方式連接至第一結構核心210A及第二結構核心210B。例如,EG2 302C之C0及C1各具有2個專用鏈路且共用至第二結構核心210B之一鏈路,而各具有至第一結構核心210A之2個專有鏈路。因此,EG2 302C之C0使用2.5個鏈路連接至第二結構核心210A且使用2個鏈路連接至第一結構核心210A。在所繪示之實例中,自端點至結構平面206之鏈路連接至結構平面206上之埠304且經由內部連接連接至各自結構核心210。
以下實例描述EG0 302A之C0至EG2 302C之C0之間的實例單元流量。經由相同結構核心210A (例如,不經過一核心間鏈路)而將源自EGO 302A之C0之一未共用鏈路之流量交換至EG2C之C0之一未共用鏈路。源自連接至第一結構核心210A之共用鏈路(例如,在EGO 302A之C0及C1之間共用之鏈路)之流量經發送至連接至第二結構核心210B之共用鏈路(例如,EG2 302C之C0及C1之間共用之鏈路)。為此,第一結構核心210A及第二結構核心210B經由一核心間鏈路308連接。在與EG0 302A之C0相關聯之共用鏈路上發送至第一結構核心210A之一單元經交換至待發送至第二結構核心210B之核心間鏈路308。在第二結構核心210B處,源自核心間鏈路308之單元經交換至與EG2 302C之C0相關聯之共用鏈路。第一結構核心之路由表使用單元之輸入埠及單元標頭中指定之目標端點來達成交換。因為核心間鏈路308與兩個端點相關聯(例如,到達核心間鏈路308之一單元可由於其等之間共用之鏈路而最終目的地為EG2 302C之C0或C1),所以核心間鏈路308具有兩個邏輯子通道,各充當一目的地端點。
在圖3B之所繪示之實例中,EG0 302A及EG1 302B連接至如圖3A中所描述之結構核心206。結構端點310A及310B (分別指稱「PFE0 310A」及「PFE1 310B」)使用單鏈路連接至結構核心206之各者。在圖3B之所繪示之實例中,結構端點310A及310B可為以上圖2之結構端點207之實例。因此,至結構核心之鏈路不平衡。自PFE0 310A至線卡EG0 302A之流量暗指源流量之2個鏈路至目標流量之4.5個鏈路。自結構平面206之角度來看,應以4:4:1之一比率(例如,至每一單元之未共用鏈路之各者四個單元到各到共用鏈路之單元)散佈該流量。取決於共用鏈路是否連接至與輸入來自鏈路卡300C相同之結構核心210,各結構核心210將直接抑或使用核心間鏈路308A將「 1」比率流量發送至共用鏈路。
源自目的地為共用鏈路上之端點之一者(例如PFE0 310A)之群組端點的一者(例如EG0 302A)之流量經均分。一半之單元流量自接收該單元之結構核心(例如第一結構核心210A)交換至至PFE0 310A之鏈路且一半之單元流量交換至至其他結構核心(例如第二結構核心210B)之一核心間鏈路308B。用於自一群組端點至一端點之流量(例如,群組端點至端點流量)之核心間鏈路308B可使用單獨核心間鏈路308B,而非用於群組端點與端點至群組端點流量之間的流量之核心間鏈路308A。各端點(例如,PFE 310A及PFE 310B)可與一不同核心間鏈路308B相關聯。依此一方式,結構核心可基於單元到達之核心間鏈路308B之哪一個來識別源群組端點(例如,在在一單元正在通過結構平面交換時使用一單一欄位用於目的地及源的系統中)。
圖4A、圖4B及圖4C係連接至一結構平面之結構核心210A及210B之端點207的實例組態之方塊圖。在圖4A中,端點207具有至結構核心210之平衡連接。在所繪示之實例中,端點207之各者藉由一相等數目個鏈路(N1個鏈路)連接至結構核心210之各者。圖4B係一不平衡組態之一實例。在所繪示之實例中,端點207不具有至結構核心210之各者之一相等數目個鏈路。第一端點207A具有至結構核心210之各者之一第一數目個鏈路(N1個鏈路)。然而,第二端點207B具有至結構核心210之各者之一不同數目個鏈路。在所繪示之實例中,第二端點207B具有至第一結構核心210A之一第二數目個鏈路(N2個鏈路)及至第二結構核心210B之一第三數目個鏈路(N3個鏈路)。因為來自端點207之鏈路數目不平衡,因此建立核心間鏈路308以促進平衡流量。例如,當在一個路由器內使用多種類型之端點並將其等連接至一結構平面時,鏈路可依此方式經組態為不平衡。圖4C係一不平衡組態之另一實例,其中各端點207不具有至結構核心210之各者之相同數目個鏈路。在所繪示之實例中,第一端點207A具有至第一結構核心210之一第一數目個鏈路(N1個鏈路)及至第二結構核心210B之一第二數目個鏈路(N2個鏈路)。第二端點207B具有至第一結構核心210A之第二數目個鏈路(N2個鏈路)及至第二結構核心210B之第一數目個鏈路(N1個鏈路)。至結構核心210之額外鏈路可指稱「不平衡鏈路」。例如,當端點207具有一奇數個鏈路來連接至結構核心210,但端點207具有一相同數目個鏈路介面時,可發生此組態。作為另一實例,接著當端點207具有一共用鏈路使得N1為2且N2為2.5時,可發生此組態。在圖4C之所繪示之實例中,結構核心210具有核心間鏈路308以促進平衡單元流量。
圖5係描繪經組態以根據本發明中所描述之技術來實施一級交換之一專用積體電路(ASIC) 500的一方塊圖。ASIC 500表示基於硬體之邏輯且可包含一可程式化積體電路。ASIC 500可表示一結構晶片之一實例且實施用於一交換結構之交叉交換502。ASIC 500可表示(例如)結構核心210之任何者。
交叉交換502具有輸入埠504A至504S (統稱為「輸入埠504」),各者能夠經由一全網格將單元散佈至輸出埠506A至506T (統稱為「輸出埠506」)之各者。輸入埠504及/或輸出埠506之一部分連接至核心間鏈路以促進將單元發送至另一交叉交換502且自另一交叉交換502接收單元。一交換模組508經程式化以具有(i)一目的地表510,其識別可用於到達目的地結構端點207之輸出埠506及(ii)一路由表512,其指定如何基於輸入埠及一單元之單元標頭中之一目的地端點路由該單元。
圖6係繪示根據本發明之技術之一實例資料單元格式的一方塊圖。如下文進一步詳細描述,根據一資料單元600之不同單元類型界定結構端點207及一多級交換結構中之不同級交換的操作。資料單元600包含一單元標頭602及一單元有效負載604。單元標頭602包含以下欄位:一單元大小606、一序列號(SEQ NO.) 608、一目的地識別符(DST ID) 610及一源識別符612 (SRC ID)。單元標頭602之各種實例實施方案可重新配置欄位,包含更多或更少欄位等等。
單元大小606指定單元有效負載604之大小,或在一些情況下包含單元標頭602及單元有效負載604之資料單元600之大小。實例單元大小之範圍自96至200位元組。序列號608識別該單元之一序列號。單元目的地識別符610及單元源識別符612分別標識該單元之目的地結構端點及源結構端點。單元目的地識別符610 (例如)用作路由表512之一輸入以促進結構核心210將單元路由至輸出埠之一者(例如,上文圖5之輸出埠506)。資料單元600之資料有效負載604通常係用於由交換系統交換之封包之封包資料,(例如)係一封包交換器或資料中心結構。
圖7係連接至相同結構核心210A之不同類型之端點700A、700B及700C之一實例組態的一方塊圖。在所繪示之實例中,端點700A及700B在相同端點群組702中。端點群組702可為圖3A及圖3B之端點群組302之一者之任何實例,且端點700A及700B可為圖3A及圖3B之端點C0及C1之實例。端點700C可為圖3B之端點之一者(例如端點310A)之一實例。在所繪示之實例中,端點700A及700B共同具有可用於連接至結構核心210之一奇數個鏈路。端點700A及700B各具有至結構核心210A之兩個鏈路704 (例如未共用鏈路)。另外,端點700A及700B共用至結構核心210A之一鏈路706。建立一核心間鏈路708A以將與共用鏈路706相關聯之單元流量交換至另一結構核心(例如,圖2之結構核心210B)。另外,建立另一核心間鏈路708B以接收與連接至另一結構核心之共用鏈路相關聯之單元流量。端點700C具有至結構核心210之一鏈路704。與端點700C相關聯之核心間鏈路708C建立在結構核心210之間。
此等核心間鏈路708A至708C促進在結構核心210當中平衡單元流量。結構核心210包含指定如何路由一單元之一路由表及將輸出埠映射至端點之一目的地表。路由表指定如何基於輸入埠及一單元之一目的地端點來路由該單元。輸入埠與連接至輸入埠之鏈路之一類型相關聯(例如,一核心間鏈路、一共用鏈路、一不平衡鏈路、一非共用鏈路等)。例如,若一單元源自一共用鏈路706,則該單元可經不同地路由。結構核心210使用路由表及目的地表為一單元選擇一輸出埠,該輸出埠係具有至端點700A、700B及700C之一者之一鏈路的一輸出埠抑或連接至核心間鏈路708A至708C之一者之一輸出埠。在一些實例中,在路由表上,各目的地端點映射至一不足加權輪詢(DWRR)組態、一散佈比率及一或多個輸出埠。DWRR組態具有兩位元:一旁通位元及一散佈選擇位元。當設置旁通位元時,結構核心將單元自輸入埠路由至輸出埠(例如,到達輸入埠之每一單元交換至經指定輸出埠)。當未設置旁通位元時,結構核心210使用DWRR及經指定散佈比將到達輸入埠之單元交換至多個輸出埠。散佈選擇位元使用散佈比率指定DWRR之參數。實例性路由表在下文表1及表2中繪示。
目的地 輸入埠 旁通 輸出埠 輸出埠 散佈比率
PFE0 PFE0直接鏈路 1 PFE0直接鏈路 - -
C0 or C1直接 鏈路 1 PFE0直接鏈路 - -
PFE0核心間 鏈路 1 PFE0直接鏈路 - -
C0 or c1 共用 鏈路 0 PFE0直接鏈路 PFE0核心間鏈路 1:1
表1
目的地 輸入埠 旁通 輸出埠 輸出埠 輸出埠 散佈比率
C0 PFE0 直接鏈路 0 C0 直接鏈路 C0 直接鏈路 C0 共用鏈路 4:4:1
C0 or C1直接鏈路 0 C0 直接鏈路 C0 直接鏈路 - 1:1
C0 or C1共用鏈路 1 核心間 鏈路 - - -
核心間 鏈路 1 C0 共用鏈路 - - -
表2
在表1上所繪示之實例中,具有端點700C之一目的地且自輸入埠接收之單元連接至第一端點700A抑或第二端點700B之不平衡鏈路,該單元使用DWRR以一1:1比率散佈至連接至端點700C之輸出埠抑或連接至與端點700C相關聯之核心間鏈路之輸出埠。作為一實例,在表2上所繪示,將具有自連接至一核心間鏈路之一輸入埠到達的端點700A及700B之一者之目的地之單元交換至連接至其不平衡鏈路之一輸出埠。
圖8係繪示由結構核心210交換單元之一實例方法的一流程圖。結構核心210自一輸入埠(例如,上文圖5之輸入埠504之一者)接收一單元(802)。單元包含具有一目的地識別符(例如,上文圖6之目的地識別符610)之一單元標頭(例如,上文圖6之單元標頭602)以指示該單元將經路由至哪個端點。輸入埠可(例如)與來自一端點之一直接鏈路、一共用鏈路或一平衡鏈路或來自另一結構核心210之一核心間鏈路相關聯。基於自其接收單元之輸入埠及目的地端點,結構核心210使用路由表判定是否旁通不足加權輪詢以判定將單元交換至哪個輸出埠(804)。例如,對於一些輸入埠,路由表可指定不需要不足加權輪詢將單元路由至適當輸出埠。一些輸入埠可與一單一輸出埠相關聯。當結構核心210將旁通不足加權輪詢(804處為是)時,織網核心210將單元交換至由路由表指定之輸出埠,而不使用不足加權輪詢(806)。在一些實例中,輸出埠連接至一共用鏈路或一核心間鏈路。當結構核心210不旁通不足加權輪詢時(804處為否),結構核心210將使用不足加權輪詢及由路由表指定之一散佈比率將單元交換至經指定輸出埠之一者(方塊808)。在一些實例中,經指定埠之一者連接至一核心間鏈路。
圖9係繪示由具有一實例組態(例如,如上文圖7中所繪示之組態)且基於使用輸入埠及目的地端點來交換單元之一路由表的一結構核心交換單元之一個方法之一流程圖。最初,結構核心210自一輸入埠(例如,以上圖5之輸入埠504之一者)接收一單元(902)。該單元包含具有一目的地識別符之一單元標頭(例如,上文圖6之單元標頭602)以指示該單元將經路由至哪個端點。輸入埠可(例如)與來自一端點之一直接鏈路、一共用鏈路或一平衡鏈路或來自另一結構核心210之一核心間鏈路相關聯。在所繪示之實例中,路由表基於目的地輸入係一平衡端點(例如,具有與一結構平面206上之結構核心210相同之鏈路數目之一端點)或一不平衡端點(例如,具有與一結構平面206之結構核心210不同之鏈路數目之一端點)路由該單元。一實例路由器可具有平衡及不平衡端點之一組合或可具有具共用鏈路之端點。結構核心210使用路由表判定目的地端點是否係一平衡端點(904)。當目的地端點係一平衡端點時,結構核心210,方法在方塊906處繼續。當目的地端點並非為一平衡端點時,結構核心210,方法在方塊916處繼續。
在方塊906處,結構核心210判定輸入埠係(i)與一平衡端點相關聯之一直接鏈路或(ii)一核心間鏈路。當輸入埠係(i)與一平衡端點相關聯之一直接鏈路或(ii)一核心間鏈路時(906處為是),結構核心210將單元路由至與目的地端點相關聯之一直接鏈路(08) 。否則,當輸入埠係來自一不平衡端點之一直接相等鏈路時(910處為是),結構核心210將單元路由至與目的地端點相關聯之一直接鏈路(908)。否則,當輸入埠係來自一不平衡端點之一不相等鏈路時(912處為是)時,結構核心210使用具由路由表指定之一散佈比率之不足加權輪詢將單元路由至與目的地端點相關聯之一直接鏈路抑或一核心間鏈路 (方塊914)。
在方塊916處,結構核心210判定輸入埠是否係與一平衡端點相關聯之一直接鏈路。當輸入埠係與一平衡端點相關聯之一直接鏈路時(916處為是),結構核心210使用具由路由表指定之一散佈比率之不足加權輪詢將單元路由至與目的地端點相關聯之一直接鏈路抑或一核心間鏈路(918)。否則,結構核心210判定輸入埠是否係來自一不平衡端點之一直接相等鏈路(920)。當輸入埠係來自一不平衡端點之一直接非共用鏈路時(920處為是),結構核心210使用具一散佈比率之不足加權輪詢將單元路由至與目的地端點相關聯之一直接鏈路(922)。否則,結構核心210判定輸入埠是否係來自一不平衡端點之一共用鏈路(924)。當輸入埠係來自一不平衡端點之一共用鏈路時(924處為是),結構核心210將單元路由至與目的地端點相關聯之一核心間鏈路(926)。否則,結構核心210判定輸入埠係一核心間鏈路(方塊928)。接著,結構核心210將單元路由至與目的地端點相關聯之共用鏈路(930)。
本發明中所描述之技術可至少部分以硬體、軟體、韌體或其任何組合實施。例如,所描述技術之各個態樣可在一或多個處理器內實施,包含一或多個微處理器、數位信號處理器(DSP)、專用積體電路(ASIC)、場可程式化閘陣列(FPGA)或任何其他等效整合或離散邏輯電路,以及此等組件之任何組合。術語「處理器」或「處理電路」可通常係指單獨或與其他邏輯電路或任何其他等效電路組合之前述邏輯電路之任何者。包括硬體之一控制單元亦可執行本發明之技術之一或多者。
此等硬體、軟體及韌體可在相同裝置內或在單獨裝置內實施以支援本發明中所描述之各種操作及功能。另外,所描述單元、模組或組件之任何者可一起或單獨地實施為離散但可交互操作之邏輯裝置。將不同特徵描繪為模組或單元意欲突出不同功能態樣且並不一定暗指此等模組或單元必須由單獨硬體或軟體組件來實現。實情係,可由單獨硬體或軟體組件來執行與一或多個模組或單元相關聯之功能,或可將其等整合於共同或單獨硬體或軟體組件內。
本發明中所描述之技術亦可在含有指令之一電腦可讀媒體(諸如一電腦可讀儲存媒體)中體現或編碼。嵌入或編碼於一電腦可讀媒體中之指令可致使一可程式化處理器或其他處理器(例如)在執行指令時執行該方法。電腦可讀媒體可包含非暫時性電腦可讀儲存媒體及暫時性通信媒體。有形及非瞬態之電腦可讀儲存媒體可包含隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可程式化唯讀記憶體(PROM)、可擦除可程式化唯讀記憶體(EPROM)、電子可擦除可程式化唯讀記憶體(EEPROM)、快閃記憶體、一硬碟、一CD-ROM、一軟碟、一盒式磁帶、磁性媒體、光學媒體或其他電腦可讀儲存媒體。應理解,術語「電腦可讀儲存媒體」係指實體儲存媒體,而非信號、載波或其他暫態媒體。
100:網路環境 102:路由器 104A:邊緣路由器 104B:邊緣路由器 106A:客戶網路 106B:客戶網路 106C:客戶網路 108:服務提供商網路 110A:存取鏈路 110B:存取鏈路 110C:存取鏈路 112:交換結構 200:交換結構 202:交換系統 204A:線卡 204B:線卡 206A:結構平面 206B:結構平面 206C:結構平面 206K:結構平面 207A:結構端點 207B:結構端點 208:封包 210A:結構核心/第一核心 210B:結構核心/第二核心 212:輸入埠 214:輸出埠 216:核心間埠 300A:線卡 300C:鏈路卡 302A:端點群組 302B:端點群組 302C:端點群組 302D:端點群組 304:埠 306:旁通鏈路 308:核心間鏈路 308A:核心間鏈路 308B:核心間鏈路 310A:結構端點 310B:結構端點 500:專用積體電路(ASIC) 502:交叉交換 504:輸入埠 504A:輸入埠 504B:輸入埠 504S:輸入埠 506A:輸出埠 506B:輸出埠 506T:輸出埠 508:交換模組 510:目的地表 512:路由表 600:資料單元 602:單元標頭 604:單元有效負載 606:單元大小 608:序列號(SEQ NO.) 610:目的地識別符(DST ID) 612:源識別符 700A:端點 700B:端點 700C:端點 702:端點群組 704:鏈路 706:鏈路 708A:核心間鏈路 708B:核心間鏈路 708C:核心間鏈路 802:自一端點接收一單元 804:路由表是否指示旁通不足加權輪詢 806:將單元路由至一經指定輸出埠,而不使用不足加權輪詢 808:基於由路由表指定之一散佈比率使用不足加權輪詢將單元路由至多個經指定輸出埠之一者 902:自一端點接收一單元 904:目的地端點是否係一平衡端點 906:方塊 908:將單元路由至與目的地端點相關聯之一直接鏈路 910:方塊 912:方塊 914:方塊 916:方塊 918:使用具一散佈比率之不足加權輪詢將單元路由至與目的地端點相關聯之一直接鏈路或一核心間鏈路 920:輸入埠是否係來自一不平衡端點之一非共用鏈路 922:使用具一散佈比率之不足加權輪詢將單元路由至與目的地端點相關聯之一直接鏈路 924:輸入埠是否係來自一不平衡端點之一共用鏈路 926:將單元路由至與目的地端點相關聯之一核心間鏈路 928:方塊 930:將單元路由至與目的地端點相關聯之一不平衡鏈路
圖1係繪示一實例網路環境之一方塊圖,其中服務提供商網路包含根據本發明中所描述之技術組態之一不等鏈路能力路由器。
圖2係繪示根據本文中所描述之技術之一交換系統之一實例的一方塊圖。
圖3A及圖3B係具有結構端點之線卡之方塊圖,該等結構端點具有至一結構平面之共用及/或不平衡鏈路連接。
圖4A、圖4B及圖4C係連接至結構核心之端點之實例組態的方塊圖。
圖5係描繪根據本發明中所描述之技術之經組態以交換單元之一專用積體電路(ASIC)的一方塊圖。
圖6係繪示根據本發明之技術之一實例資料單元格式的一方塊圖。
圖7係連接至相同結構核心之不同類型之端點之一實例組態的一方塊圖。
圖8係繪示由結構核心來交換單元之一實例方法的一流程圖。
圖9係繪示基於一輸入埠及一目的地端點由結構核心來交換單元之一實例方法的一流程圖。
100:網路環境
102:路由器
104A:邊緣路由器
104B:邊緣路由器
106A:客戶網路
106B:客戶網路
106C:客戶網路
108:服務提供商網路
110A:存取鏈路
110B:存取鏈路
110C:存取鏈路
112:交換結構

Claims (10)

  1. 一種路由系統,其包括:複數個結構端點(fabric endpoints);及在一網路裝置內之一內部交換結構,該內部交換結構包括一結構平面,其經組態以在該複數個結構端點之間交換單元,其中該結構平面包含至少兩個結構核心(cores)及連接該至少兩個結構核心之一或多個核心間鏈路,其中該至少兩個結構核心之各結構核心包括複數個輸入埠及複數個輸出埠,該至少兩個結構核心之各結構核心的該複數個輸出埠之至少一部分係連接至該一或多個核心間鏈路,其中該至少兩個結構核心之各結構核心經組態以:基於以下而選擇以將該等單元之一經接收單元路由至其之該結構核心之該複數個輸出埠之一輸出埠:(i)在其上接收該經接收單元之該結構核心之該複數個輸入埠之一輸入埠及(ii)用於該經接收單元之該複數個結構端點之一目的地結構端點;且將該經接收單元交換至與該目的地結構端點相關聯之該複數個輸出埠之該選定輸出埠,是基於該結構核心之該複數個輸入埠之該輸入埠與該一或多個核心間鏈路之一核心間鏈路之一相關聯,其中在該結構核心之該複數個輸入埠之該輸入埠上接收該經接收單元,且該複數個輸出埠之該輸出埠連接至該一或多個核心間鏈路之該核心間鏈路。
  2. 如請求項1之路由系統,其中為了選擇以將該等單元之該經接收單元路由至其之該結構核心之該複數個輸出埠之該輸出埠,該至少兩個結構核心之各結構核心包含一路由表,其經組態以基於該經接收單元之該目的地結構端點將在其上接收該經接收單元之該結構核心之該複數個輸入埠之該輸入埠映射至該複數個輸出埠之該輸出埠。
  3. 如請求項2之路由系統,其中該路由表經組態以將該至少兩個結構核心之各結構核心之該複數個輸入埠之至少一部分映射至該至少兩個結構核心之各結構核心之該複數個輸出埠之至少兩個輸出埠。
  4. 如請求項3之路由系統,其中對於將該至少兩個結構核心之各結構核心之該複數個輸入埠之該至少一部分映射至該複數個輸出埠,該路由表經組態以指定(specify)一散佈比(a spray ratio)以選擇該複數個輸出埠之該至少兩個輸出埠之各輸出埠。
  5. 如請求項1至4中任一項之路由系統,其中該複數個結構端點之一第一部分包括至該至少兩個結構核心之各結構核心的一第一數目個鏈路且該複數個結構端點之一第二部分包括至該至少兩個結構核心之各結構核心的一第二數目個鏈路,該第一數目不同於該第二數目。
  6. 如請求項1至4中之任一項之路由系統,其中該複數個結構端點之兩個結構端點共同包括至該結構平面之一奇數個鏈路。
  7. 一種路由系統,其包括:複數個結構端點(fabric endpoints);及在一網路裝置內之一內部交換結構,該內部交換結構包括一結構平面,其經組態以在該複數個結構端點之間交換單元,其中該結構平面包含至少兩個結構核心(cores)及連接該至少兩個結構核心之一或多個核心間鏈路,其中該至少兩個結構核心之各結構核心包括複數個輸入埠;複數個輸出埠,該至少兩個結構核心之各結構核心的該複數個輸出埠之至少一部分係連接至該一或多個核心間鏈路,其中該複數個輸出埠之至少兩個輸出埠之一第一輸出埠係連接至該一或多個核心間鏈路之一核心間鏈路;及一路由表,其經組態以:將該結構核心之該複數個輸入埠之該等輸入埠之至少一部分映射至該結構核心之該複數個輸出埠之該至少兩個輸出埠;及指定一散佈比以選擇該複數個輸出埠之該至少兩個輸出埠之各輸出埠,其中該至少兩個結構核心之各結構核心經組態以:基於以下而選擇將該等單元之一經接收單元路由至其之該結構核心之該複數個輸出埠之該第一輸出埠:(i)在其上接收該經接收單元之該結構核心之該複數個輸入埠之一輸入埠,(ii)用於該經接收單元之該複數個結構端點之一目的地結構端點;及(iii)該散佈比而選擇連接至該一或多個核心間鏈路之該核心間鏈路之該第一輸出埠,其中 該路由表經組態以基於用於該經接收單元之該目的地結構端點將在其上接收該經接收單元之該輸入埠映射至該第一輸出埠;及切換該經接收單元至該第一輸出埠。
  8. 一種路由方法,包括:藉由在一網路裝置內之一內部交換結構之一結構平面的至少兩個結構核心之一結構核心在該結構核心之複數個輸入埠處接收單元;其中該網路裝置包括複數個結構端點,其中該內部交換結構之該結構平面經組態以在該複數個結構端點之間交換單元,該結構平面進一步包含連接該至少兩個結構核心之一或多個核心間鏈路,及其中該至少兩個結構核心之各結構核心包括複數個輸入埠及複數個輸出埠,該至少兩個結構核心之各結構核心的該複數個輸出埠之至少一部分係連接至連接該至少兩個結構核心之該一或多個核心間鏈路,藉由該至少兩個結構核心之該結構核心基於以下而選擇用於路由該等單元之一經接收單元之該結構核心之該複數個輸出埠之一輸出埠:(i)在其上接收該經接收單元之該結構核心之該複數個輸入埠之一輸入埠及(ii)用於該經接收單元之該複數個結構端點之一目的地結構端點,及藉由該至少兩個結構核心之該結構核心,基於該結構核心之該複數個輸入埠之該輸入埠與該一或多個核心間鏈路之一核心間鏈路之一相關聯,其中在該結構核心之該複數個輸入埠之該輸入埠上接收該經接收單元,且該複數個輸出埠之該輸出埠連接至該一或多個核心間鏈路之該核心間鏈路,將該經接收單元交換至與該目的地結構端點相關聯之該複數個輸 出埠之該選定輸出埠。
  9. 一種路由方法,包括:藉由在一網路裝置內之一內部交換結構之一結構平面的至少兩個結構核心之一結構核心在該結構核心之複數個輸入埠處接收單元;其中該網路裝置包括複數個結構端點,其中該內部交換結構之該結構平面經組態以在該複數個結構端點之間交換單元,該結構平面進一步包含連接該至少兩個結構核心之一或多個核心間鏈路,及其中該至少兩個結構核心之各結構核心包括複數個輸入埠;複數個輸出埠,該至少兩個結構核心之各結構核心的該複數個輸出埠之至少一部分係連接至該一或多個核心間鏈路,其中該複數個輸出埠之至少兩個輸出埠之一第一輸出埠係連接至該一或多個核心間鏈路之一核心間鏈路;及一路由表,其經組態以:將該結構核心之該複數個輸入埠之該等輸入埠之至少一部分映射至該結構核心之該複數個輸出埠之該至少兩個輸出埠;及指定一散佈比以選擇該複數個輸出埠之該至少兩個輸出埠之各輸出埠,藉由該至少兩個結構核心之該結構核心基於以下而選擇用以路由該等單元之一經接收單元至該結構核心之該複數個輸出埠之該第一輸出埠:(i)在其上接收該經接收單元之該結構核心之該複數個輸入埠之一輸入埠, (ii)用於該經接收單元之該複數個結構端點之一目的地結構端點,及(iii)該散佈比而選擇連接至該一或多個核心間鏈路之該核心間鏈路之該第一輸出埠,其中該路由表經組態以基於用於該經接收單元之該目的地結構端點將在其上接收該經接收單元之該輸入埠映射至該第一輸出埠;及藉由該至少兩個結構核心之該結構核心選擇該經接收單元至該第一輸出埠。
  10. 一種用指令編碼之電腦可讀儲存媒體,該等指令用於致使一或多個可程式化處理器執行請求項8或9所述之該方法。
TW109107780A 2019-12-30 2020-03-10 在內部交換結構中用於不等鏈路連接之散佈 TWI794596B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/730,031 US11316796B2 (en) 2019-12-30 2019-12-30 Spraying for unequal link connections in an internal switch fabric
US16/730,031 2019-12-30

Publications (2)

Publication Number Publication Date
TW202127835A TW202127835A (zh) 2021-07-16
TWI794596B true TWI794596B (zh) 2023-03-01

Family

ID=69953908

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109107780A TWI794596B (zh) 2019-12-30 2020-03-10 在內部交換結構中用於不等鏈路連接之散佈

Country Status (5)

Country Link
US (1) US11316796B2 (zh)
EP (1) EP3846399B1 (zh)
KR (1) KR102394259B1 (zh)
SG (1) SG10202001462PA (zh)
TW (1) TWI794596B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100061242A1 (en) * 2008-09-11 2010-03-11 Pradeep Sindhu Methods and apparatus related to a flexible data center security architecture
US20160007102A1 (en) * 2014-07-03 2016-01-07 Fiber Mountain, Inc. Data center path switch with improved path interconnection architecture
US20190104206A1 (en) * 2017-09-29 2019-04-04 Fungible, Inc. Fabric control protocol for data center networks with packet spraying over multiple alternate data paths
US10382362B2 (en) * 2014-03-31 2019-08-13 Juniper Networks, Inc. Network server having hardware-based virtual router integrated circuit for virtual networking

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411599B1 (en) 1998-05-29 2002-06-25 International Business Machines Corporation Fault tolerant switching architecture
US7102999B1 (en) * 1999-11-24 2006-09-05 Juniper Networks, Inc. Switching device
JP4556761B2 (ja) 2005-05-06 2010-10-06 株式会社日立製作所 パケット転送装置
US8050559B2 (en) 2006-08-21 2011-11-01 Juniper Networks, Inc. Multi-chassis router with multiplexed optical interconnects
US20090080428A1 (en) * 2007-09-25 2009-03-26 Maxxan Systems, Inc. System and method for scalable switch fabric for computer network
US9847953B2 (en) * 2008-09-11 2017-12-19 Juniper Networks, Inc. Methods and apparatus related to virtualization of data center resources
US8837499B2 (en) 2011-05-14 2014-09-16 International Business Machines Corporation Distributed fabric protocol (DFP) switching network architecture
US8705551B2 (en) * 2011-07-27 2014-04-22 Fujitsu Limited Method and system for management of flood traffic over multiple 0:N link aggregation groups
US8782321B2 (en) 2012-02-08 2014-07-15 Intel Corporation PCI express tunneling over a multi-protocol I/O interconnect
US20140016486A1 (en) * 2012-07-12 2014-01-16 Broadcom Corporation Fabric Cell Packing in a Switch Device
US9661405B2 (en) 2013-05-10 2017-05-23 Huawei Technologies Co., Ltd. System and method for photonic switching
US9866427B2 (en) * 2015-02-16 2018-01-09 Juniper Networks, Inc. Multi-stage switch fabric fault detection and handling
US10951527B2 (en) * 2018-12-28 2021-03-16 Juniper Networks, Inc. Switch fabric packet flow reordering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100061242A1 (en) * 2008-09-11 2010-03-11 Pradeep Sindhu Methods and apparatus related to a flexible data center security architecture
US10382362B2 (en) * 2014-03-31 2019-08-13 Juniper Networks, Inc. Network server having hardware-based virtual router integrated circuit for virtual networking
US20160007102A1 (en) * 2014-07-03 2016-01-07 Fiber Mountain, Inc. Data center path switch with improved path interconnection architecture
US20190104206A1 (en) * 2017-09-29 2019-04-04 Fungible, Inc. Fabric control protocol for data center networks with packet spraying over multiple alternate data paths

Also Published As

Publication number Publication date
TW202127835A (zh) 2021-07-16
CN113132252A (zh) 2021-07-16
US11316796B2 (en) 2022-04-26
EP3846399B1 (en) 2023-11-15
KR20210086390A (ko) 2021-07-08
KR102394259B1 (ko) 2022-05-03
EP3846399A1 (en) 2021-07-07
SG10202001462PA (en) 2021-07-29
US20210203612A1 (en) 2021-07-01

Similar Documents

Publication Publication Date Title
JP7417825B2 (ja) スライスベースルーティング
US9306757B2 (en) Method and apparatus for distributing routing instructions over multiple interfaces of a data router
KR102205882B1 (ko) 팻-트리 라우팅에 기반하여 별개의 인피니밴드 서브넷들 사이에서 트래픽을 라우팅하기 위한 시스템 및 방법
US8509087B2 (en) Per-graph link cost assignment in layer 2 multipath networks
US8693470B1 (en) Distributed routing with centralized quality of service
US8953599B1 (en) Traffic cut-through within network device having multiple virtual network devices
US9065768B2 (en) Apparatus for a high performance and highly available multi-controllers in a single SDN/OpenFlow network
US9596094B2 (en) Managing multicast distribution using multicast trees
US20070036178A1 (en) Layer 2 virtual switching environment
EP3748916A1 (en) Forwarding multicast traffic over link aggregation ports
WO2021007963A1 (zh) 路由分发方法及控制器、信息路由方法及网络节点设备
JP2003158539A (ja) ネットワーク転送システム及び転送方法
US7990965B1 (en) Transmission of layer two (L2) multicast traffic over multi-protocol label switching networks
WO2020108587A1 (zh) 数据处理方法、控制器和转发设备
US10735312B1 (en) Methods and apparatus for efficient use of link aggregation groups
WO2014205792A1 (zh) 一种建立光旁路的方法、装置和系统
WO2022048418A1 (zh) 一种转发报文的方法、设备和系统
WO2008089667A1 (fr) Procédé et appareil destinés à réduire une perte de service dans un groupe d'ajout de liens
US10291750B1 (en) Aggregating data sessions between autonomous systems
WO2019024759A1 (zh) 一种数据通信方法及数据通信网络
US11296980B2 (en) Multicast transmissions management
TWI794596B (zh) 在內部交換結構中用於不等鏈路連接之散佈
RU2740035C1 (ru) Шлюз прямых межсоединений
US10911296B2 (en) Targeted selection of cascade ports
CN113132252B (zh) 用于内部交换结构中不等链路连接的喷射