TWI499240B - 用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體 - Google Patents

用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體 Download PDF

Info

Publication number
TWI499240B
TWI499240B TW101120312A TW101120312A TWI499240B TW I499240 B TWI499240 B TW I499240B TW 101120312 A TW101120312 A TW 101120312A TW 101120312 A TW101120312 A TW 101120312A TW I499240 B TWI499240 B TW I499240B
Authority
TW
Taiwan
Prior art keywords
interface
namespace
expander
packet
address
Prior art date
Application number
TW101120312A
Other languages
English (en)
Other versions
TW201251375A (en
Inventor
Puneet Agarwal
Niranjan Vaidya
Biju Babu
Original Assignee
Broadcom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Broadcom Corp filed Critical Broadcom Corp
Publication of TW201251375A publication Critical patent/TW201251375A/zh
Application granted granted Critical
Publication of TWI499240B publication Critical patent/TWI499240B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4604LAN interconnection over a backbone network, e.g. Internet, Frame Relay
    • H04L12/462LAN interconnection over a bridge based backbone
    • H04L12/4625Single bridge functionality, e.g. connection of two networks over a single bridge
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/70Virtual switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體
本申請要求於2011年6月6日提交的、名為“支援邊緣鏈路聚合的方法和系統(Method and System to Support Edge Link Aggregation)”的美國臨時專利申請序號61/493,896以及於2011年12月27日提交的美國專利申請13/337,774的優先權,其全部內容結合於此。
本發明的實施方式關於一種具有擴展的乙太橋接器的網路中的支援鏈路聚合(supporting link aggregation)。
在許多環境下,如資料中心(或伺服器群),需要進行互連並管理大量的物理或虛擬伺服器。存在與每個伺服器的互連提供和策略管理相關的許多挑戰,這些挑戰會隨著虛擬服務環境的增長而加劇。
在虛擬化環境中,每個物理伺服器實施一個管理程式以管理多個虛擬伺服器(或虛擬機器,VM)。該管理程式可實施其自身的網路交換機,這樣其組成VM之間可以彼此通信。然而,這造成了管理和性能的挑戰。這種管理程式中的交換缺乏私人網路絡交換機的能力,且超出了資料中心網路的管理框架的範圍。
私人網路絡交換機(如乙太橋接器,交換機和路由器)通常以高性能矽實現,並且期望將這些交換機的益處擴展至VM間的流量管理。
在這種環境下能夠具有連線性的一個模式是通過使用“分散式交換機”或者“擴展的交換機”。如文中所使用的,分散式交換機也可被稱為“分散式橋”或者“擴展 橋”。這種模式包括控制橋實體(CB)和下屬埠擴展器實體(PE)。CB實體包括用於切換式乙太網路資料包(幀)的高性能矽,而PE實體提供分散式交換機的接入埠,該分散式交換機具備對去往或來自CB的資料包進行交換的有限能力。當資料包在PE埠處進入分散式交換機時,PE在資料包上附上“埠識別字”標籤(“埠識別字標籤”)以助於在CB處識別和處理資料包。該埠識別字標籤標示到分散式交換機的資料包的傳入介面。PE可與多個CB相連,並且附在資料包上的埠識別字標籤必須對資料包將要轉發至的CB有意義,每個PE上行鏈路連接到唯一的CB,且因此CB可根據PE的上行鏈路介面而被識別。如果識別字的命名空間與PE的上行鏈路介面相關聯,並因此關聯到CB,則該埠識別字標籤必須在該命名空間的範圍內。
為使能冗餘,乙太網鏈路聚合組(LAG)可被用於包括將PE連接至伺服器/交換機、PE連接至PE、或PE連接至CB的任意鏈路的這種網路的任何地方。LAG使得多個乙太網鏈路看起來像是具有用於將流量分配至LAG的單個成員鏈路的負載平衡技術的單個邏輯鏈路。如果存在LAG將分散式交換機的PE(或所謂的“接入PE”)的第一層與伺服器/交換機互連,且如果通過LAG的成員鏈路發送的資料包通過CB的不同物理介面(且因此為不同命名空間)到達CB,那麼在存在LAG時,基於埠識別字標籤的資料包轉發可能失敗,這是因為標示單個LAG的埠識別字標籤將被映射至不同的命名空間。因此,需要用於在包括LAG的分散式交換機的環境下轉發資料包的方法和系統。
實施方式關於一種在鏈路聚合環境下轉發資料包。一種用於通過擴展交換機轉發資料包的方法,該擴展交換機包括直接或間接地分別通信耦合至控制橋的第一介面和第二介面的第一埠擴展器和第二埠擴展器,該方法包括:將第一埠擴展器的第一埠擴展器介面與全域命名空間或介面專用命名空間相關聯。該方法進一步包括通過第一埠擴展器介面接收資料包,利用與第一埠擴展器介面相關聯的命名空間的指示來標記接收到的資料包,基於該指示在控制橋中處理已標記的資料包,將已處理的資料包發送出控制橋。
一種用於轉發資料包的系統,包括:控制橋;直接或間接耦合至控制橋的第一介面的第一埠擴展器;直接或間接耦合至控制橋的第二介面的第二埠擴展器;介面配置模組;資料包接收模組,被配置為通過第一埠擴展器介面接收資料包;資料包命名空間標記模組,被配置為利用與第一埠擴展器介面相關聯的命名空間的指示來標記資料包;以及資料包處理模組,被配置為至少部分地基於該指示在控制橋中處理已標記的資料包。介面配置模組被配置為將第一埠擴展器的第一埠擴展器介面的命名空間配置與全域命名空間或介面專用命名空間相關聯。
一種存儲指令的電腦可讀存儲媒體,其中,所述指令在被處理器執行時適於:通過擴展交換機執行資料包轉發,其中,該擴展交換機包括直接或間接地分別通信耦合至控制橋的第一介面和第二介面的第一埠擴展器和第二埠擴展器。所述資料包轉發利用包括以下步驟的方法執行:將第一埠擴展器的第一埠擴展器介面與全域命名空間或者 介面專用命名空間相關聯,通過第一埠擴展器介面接收資料包,利用第一埠擴展器介面的命名空間配置的指示標記接收到的資料包,至少部分地基於該指示在控制橋中處理已標記的資料包,並且將已處理的資料包發送出控制橋。
將參考本公開的實施方式,其實例將在圖式中示出。這些圖旨在示例,而非限制。儘管在這些實施方式的背景下概括描述了本公開,但應理解,這不是為了將本公開的範圍限制在這些特定實施方式中。
儘管此處參考用於特定應用的示例性實施方式描述了本公開,應理解,本發明並不限於此。獲得本文教導的本領域技術人員將意識到其範圍內的其他修改、應用、實施方式以及本發明將起到重要作用的其他領域。
當前發展的被稱為IEEE 802.1 BR的標準定義了“埠擴展器”解決方案,以互聯和管理非常大量的物理或虛擬伺服器擴展交換機。本發明的實施方式可用於與IEEE 802.1 BR標準對應的擴展交換機。然而,“擴展交換機”或“分散式橋”,如文中所述,並不限於802.1 BR標準,也可被包含於其他網路元素中。
使用埠擴展技術的單個邏輯交換機(即,文中被稱為擴展交換機或分散式交換機)包括控制交換機(文中也稱為控制橋,CB)和一個或多個埠擴展器(PE)。如文中所使用的,術語“交換機”也可包括橋接功能。各PE直接或間接連接至CB上的一個介面,並將多個介面有效添加至CB。例如,如果一個CB介面之前只能連接至一個終端站,通過將該介面耦合至具有四個連接至終端站的下行鏈路介 面的PE,CB介面現在則可連接至4個終端站。在虛擬環境中,擴展交換機的各物理介面可被用於連接至多個虛擬機器終端站。雖然PE可被配置為執行多個轉發功能,但大多數功能在CB處執行。由CB執行的功能可包括地址查找、學習和老化功能,VLAN功能,以及存取控制清單(ACL)處理。包括一個CB和許多PE的擴展交換機的概念,提供了許多優點,例如可使PE設備得以簡化,以及CB處的策略管理和集中控制。
然而,CB中的許多處理根據資料包進入CB所通過的介面來確定。此介面特定處理(interface-specific processing)基於一個假設,即終端站的連接可被看作以CB的介面為根的“樹”。然而,在許多環境中,包括其中虛擬化伺服器通過LAG或其他聚合鏈路連接到擴展交換機的環境,以上對終端站可達性的假設無法成立。例如,由於LAG的單個鏈路可被耦合至不同的PE,一個終端站或虛擬機器可通過CB的兩個不同介面(或更具體地,經由耦合至兩個不同介面的PE)到達。從CB到終端站有多個路徑可用,這會干擾CB處的介面特定處理。
本發明的實施方式提供了方法、系統和電腦程式產品,以使資料包在連接到擴展交換機時存在多個路徑的環境下(例如正在使用鏈路聚合時)得以轉發。在實施方式中,全域命名空間與連接至LAG的PE介面相關聯,且通過這些PE介面進入擴展交換機的資料包被識別,使得它們可以通過擴展交換機被適當的處理(例如,用於學習和轉發)。
根據本發明的實施方式,圖1a示出了使用擴展交換機 轉發資料包的系統100。系統100包括將伺服器102與層2的雲(L2雲)108互連的擴展交換機104。L2雲108包括從擴展交換機104可達的終端站和/或中間平臺(如,路由器、交換機、橋等)的網路。例如,L2雲108可包括資料中心中的局域網(LAN)。擴展交換機104與L2雲108之間的通信耦合107可基於有線或無線網路技術。根據一個實施方式,通信鏈路107包括乙太網鏈路。
伺服器102可包括通信耦合至擴展交換機104的一個或多個虛擬伺服器。根據所示實施方式,伺服器102包括虛擬機器(VM)VM1 137、VM2 138、VM3 139和VM4 140。伺服器102和各個VM 137~140與擴展交換機104通信耦合。各VM 137~140均實施邏輯伺服器,且具有發送和接收資料包的能力。各VM 137~140均實施可被分配媒體存取控制(MAC)位址的虛擬網路介面卡(vNIC,未示出)。其他識別字,例如,但不限於,虛擬LAN(VLAN)識別字也可被分配至vNIC。各VM通過其各自的vNIC發送和接收資料包。vNIC被映射至伺服器102的物理介面。VM 137~140可通過一個或多個交換層耦合至擴展交換機104。例如,在所示實施方式中,VM1 137和VM2 138被耦合至虛擬乙太橋接器(VEB)134,且VM3 139和VM4 140被耦合至虛擬乙太網埠聚合器(VEPA)136。VEB 134和VEPA 136提供或幫助VM的橋接,如下所述。採用VEB和/或VEPA為VM實現橋接的伺服器,如所示伺服器102,也可被稱為具備邊緣虛擬橋接(EVB)功能的伺服器。EVB例如在IEEE 802.1 Qbg中被描述,其全部內容併入本文作為參考。
VEB 134可具有支援多個VM 137~138之間的資料包的本地橋接並且還支援VM 137~138使用諸如交換機104的外部交換平臺的功能。VEB 134可被配置為在VM1和VM2之間直接轉發資料包,而無需通過外部交換平臺。
VEPA 136使VM3 139和VM4 140之間能夠經由諸如交換機104的外部交換平臺進行通信。VEPA 136發送來自與其連接的VM的所有流量至上行鏈路交換機。VEB 134和VEPA 136可被實施為虛擬伺服器102的管理程式(未示出)的一部分。
VEB 134和VEPA 136通過S元件132耦合至擴展交換機104。S元件132具有對來自/去往VEB 134和VEPA 136的流量進行複用/解複用的功能。例如,S元件132使VEB 134和VEPA 136共用一個聚合鏈路106,並通過該鏈路與上行鏈路擴展交換機104通信。根據一個實施方式,S元件132在將資料包轉發至擴展交換機104之前,對資料包添加了VLAN標籤(被稱為服務VLAN標籤)。VLAN標籤標示該資料包是來自VEB 134還是VEPA 136。在一個實施方式中,S元件132和擴展交換機104都可根據IEEE 802.1ad協定支援並處理服務VLAN標籤。除上述以外的協定也可由S元件132和擴展交換機104實施以在VM 137~140和交換機104之間交換資料包。
聚合鏈路106可包括兩個以上鏈路(如124和126)。這些鏈路將伺服器102的物理介面耦合至擴展交換機104的物理介面。伺服器102的物理介面131和133可被分別耦合至擴展交換物理介面129和130。伺服器102可配置介面131和133作為LAG的介面。聚合鏈路106可在伺服器 102處根據標準化聚合協定如IEEE乙太網鏈路聚合(IEEE 802.3ad)或其他聚合協議來實施。S元件132可確定聚合鏈路106的鏈路124和126中的哪個被用於從VM 1~4中的任一個向擴展交換機104發送資料包。當S元件132確定應使用哪個鏈路將資料包發送至擴展交換機104時,可考慮使用諸如但不限於平衡鏈路124和126上的負載的標準。
根據所示實施方式,擴展交換機104包括CB 112和PE 114和116。PE 114上的介面121通過鏈路119與CB 112上的介面117相連。PE 116上的介面122通過鏈路120與CB 112上的介面118相連。如上所述,PE 114和116允許與CB 112的各個介面相連的介面的數量增長。在圖1所示實施方式中,聚合鏈路106的鏈路124與PE 114的介面129相連,而聚合鏈路106的鏈路126與PE 116的介面130相連。在一些實施方式中,PE 114和116可分別通過一個或多個其他PE直接耦合至CB 112。如上所述,CB 112可被配置為執行對來自/去往VM 137~140的流量的大多數轉發和其他處理功能。PE 114和116可被配置為在VM 137~140和CB 112之間轉發資料包。由於LAG 106的鏈路124和126連接至不同PE,因此可通過CB 112的多於一個的介面到達VM 137~140。
圖1b示出了資料包150的格式,該資料包通過根據實施方式的擴展交換機104轉發。資料包150包括使用者資料151和資料包報頭152。標籤154(也被稱為“E標籤”)在處被插入資料包150,資料包通過PE 114進入擴展交換機104。E標籤154在資料包150進入擴展交換機104之前被從資料包移除。E標籤154包括欄位158和156以分別標 示資料包的目的地和源。E標籤154可選地包括命名空間指示符欄位160和161,以包括分別與資料包的源PE介面和目的地PE介面相關聯的命名空間的指示。源欄位156和目的地欄位158基於資料包150是進入(即,正從PE 114去往CB 112)還是退出(即,正從CB 112去往PE 114或115以退出擴展交換機104)擴展交換機104而設定。當資料包150正在進入,源欄位156被設定為標示資料包通過其進入擴展交換機104的那個PE 114的介面。在本例中,PE 114為資料包的源PE介面。E標籤154的欄位值將在下面進一步描述。
圖2示出了根據本公開的實施方式的PE 200。PE 200可代表PE 114和/或PE 116的實現方式。PE 200包括處理器202、上行鏈路介面204、一個或多個下行鏈路介面206a~c、記憶體208、持久記憶體210以及通信基礎設施212。
處理器202可包括一個或多個市面有售的微處理器或其他處理器,諸如數位訊號處理器(DSP)、專用積體電路(ASIC)、或者現場可程式設計閘陣列(FPGA)。處理器202執行邏輯指令,以實現PE 200的一個或多個元件的功能或者控制該元件的操作。
上行鏈路介面104和下行鏈路介面206a~c進行操作,以將PE 200分別連接至諸如CB 112或其他PE的下行鏈路裝置以及諸如伺服器102的下行鏈路裝置。根據一實施方式,上行鏈路介面204和下行鏈路介面206a~c包括乙太網介面。
記憶體208包括諸如靜態隨機存取記憶體(SRAM)、 動態隨機存取記憶體(DRAM)等的一類記憶體。記憶體208可用於存儲實現PE 200的一個或多個元件的功能的邏輯指令。在實施方式中,記憶體208也可用於保持配置資訊、保持緩衝區(諸如對應於每個物理介面204和206a~c的佇列)、以及保持PE 200的操作中的各種資料結構。
在各種實施方式中,持久記憶體210可包括電腦可讀的持久資料存儲媒體,如磁片、光碟、快閃記憶體等。這種電腦可讀存儲媒體可用於存儲實現PE 200的一個或多個元件的軟體程式和/或邏輯指令。
通信基礎設施212可包括通信地耦合PE 200的各種模組的一個或多個互連的匯流排結構或其他內部互連結構。
配置模組214具有配置PE 200的功能。例如,配置模組214進行操作,以配置上行鏈路介面204連接至CB 112,和/或配置其中一個下行鏈路介面通過鏈路124或126連接至伺服器102。PE 200的配置可由CB 112執行。配置模組214也可進行操作以存儲配置,並在啟動時根據所存儲的配置或從CB 112收到的配置來重新配置PE 200。配置214可包括命名空間配置參數215,對於每個下行鏈路介面206a~c,該參數可被配置為代表該介面是與全域命名空間相關聯還是與介面專用命名空間相關聯。
在某些實施方式中,PE轉發表216可包括轉發條目217,以指定下行鏈路206a~c中的哪個可被用於到達VM137~140中的各自一個。根據某些實施方式,轉發邏輯模組220進行操作,以確定進入PE的資料包將通過哪個介面被轉發。
PE 200的資料包接收/發送模組218進行操作,以接收 和發送資料包。
PE標籤模組222進行操作,以將E標籤附至進入PE 200的資料包。根據一個實施方式,資料包150附有E標籤154,以指示資料包是通過PE 114或115的哪個介面進入擴展交換機104,以及可被用於在擴展交換機104內轉發資料包的其他資訊。根據一個實施方式,由於E標籤在擴展交換機內部使用,因此PE標籤模組222還進行操作以在資料包退出擴展交換機之前移除E標籤。
在來自外部(例如,從伺服器102)的資料包進入擴展交換機104所通過的PE(如PE 114)處,E標籤的源欄位156被設定為資料包進入擴展交換機時所通過的介面的識別字。例如,當來自VM1 137的資料包150通過介面129進入擴展交換機104時,E標籤在PE 114處被插入資料包,且E標籤的源欄位156被設置為代表介面129(或者,在某些實施方式中,介面129處對應於VM1 137的虛擬介面(未示出))。
根據一個實施方式,CB 112的耦合至PE的各介面被分配了唯一的位址範圍。PE的各介面被分配了一個或多個位址(例如,連續位址的子集),該位址來自其連接的CB 112上的介面的位址範圍。例如,介面PE 114的介面129被分配來自分配給介面117的位址範圍的位址的子集。類似地,PE 116的介面130被分配來自分配給介面118的位址範圍的位址的子集。此外,考慮圖1a中所示的多個VM 137~140,在介面129處配置多個子介面用於能夠發送資料包至第一PE 114的各VM。介面129的各子介面可被分配來自分配給介面129的位址的子集的位址。PE 116的介面 130可採用類似方式配置。
根據一個實施方式,分配給CB 112的介面的位址範圍可被分為兩個非重疊範圍:介面專用位址範圍和全域位址範圍。來自前者的位址用於指示介面專用命名空間,來自後者的位址用於指示全域命名空間。根據另一實施方式,用於介面專用命名空間和用於全域命名空間的單獨位址範圍可被分配給CB 112的各下行鏈路介面。
PE標記模組224進行操作,以利用命名空間的指示(indication)標記進入的資料包,該指示與資料包的源PE介面相關聯。與源PE介面相關聯的命名空間表示一上下文(context),在該上下文中,E標籤的位址(如欄位值)在擴展交換機104進行處理期間將被解釋。
根據一個實施方式,如果標記為源欄位156與介面專用命名空間相關聯,那麼E標籤中的資料包位址在資料包進入CB時通過的介面專用的上下文中被解釋。例如,如圖1a所示的實施方式中,通過PE 114進入的資料包將通過介面117進入CB 112,且如果源欄位156與介面專用命名空間相關聯,那麼E標籤中的位址將被在專用於介面117的上下文中被解釋。如果源欄位156被標記為與全域命名空間相關聯,那麼E標籤中的地址將被全域釋義,即,在不考慮任何介面專用上下文的情況下解釋資料包。
在PE處標記資料包可通過基於所使用的命名空間從全域位址範圍或介面專用位址範圍中選擇用於E標籤欄位的位址來執行。
根據另一實施方式,標記通過在資料包150的E標籤154中的可選的命名空間欄位160中插入預定的值來執行。 例如,PE 114、116和CB 112之間的協定可被配置為包括具有欄位160和161的E標籤154,欄位160和161用於指示與源欄位相關聯的命名空間。根據另一實施方式,一個或多個指示資料包的命名空間的欄位可從E標籤中分離出來。PE和CB被配置為可識別資料包中欄位的位置,該位置對應於資料包的源命名空間,且PE和CB被配置為可解釋欄位中的值來確定所使用的命名空間。
圖3示出了根據本公開實施方式的CB 300。CB 300可代表根據實施方式的CB 112的實現方式。CB 300包括處理器302、上行鏈路介面304、一個或多個下行鏈路介面306a~c、記憶體308、持久記憶體310以及通信基礎設施312。
處理器302可包括一個或多個市面有售的微處理器或其他處理器,諸如數位訊號處理器(DSP)、專用積體電路(ASIC)或者現場可程式設計閘陣列(FPGA)。處理器302執行邏輯指令,以實現CB 300的一個或多個元件的功能或者控制該元件的操作。
上行鏈路介面304和下行鏈路介面306a~c進行操作,以將CB分別連接至諸如L2雲108的L2網路以及諸如PE或終端站的下行鏈路設備。根據該實施方式,上行鏈路介面304和下行鏈路介面306a~c包括乙太網介面。
記憶體308包括諸如靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)等的一類記憶體。記憶體308可用於存儲實現CB 300的一個或多個元件的功能的邏輯指令。在實施方式中,記憶體308也可用於保持配置資訊、保持緩衝區(諸如對應於每個物理介面304和306a~c 的佇列)、以及保持CB 300的操作中的各種資料結構。
在各種實施方式中,持久記憶體310可包括電腦可讀持久資料存儲媒體,如磁片、光碟、快閃記憶體等。這種電腦可讀存儲媒體可用於存儲實現CB 300的一個或多個元件的軟體程式和/或邏輯指令。
通信基礎設施312可包括通信地耦合CB 300的各種模組的一個或多個互連的匯流排結構或其他內部互連結構。
CB 300的配置模組314進行操作,以配置CB 300以及直接或間接連接至CB 300的任意PE。例如,配置模組314可進行操作以配置上行鏈路介面304連接至L2雲,且配置下行鏈路介面中的兩個分別連接至PE 114和116。配置模組314也可存儲配置,並根據所存儲的配置在啟動時配置CB 300以及所連接的PE。
CB 300中存儲和/或其他方式可用的配置可包括命名空間配置332。根據一個實施方式,CB的各介面包括其自身缺省命名空間和全域命名空間。各命名空間可由唯一的地址範圍標示。這些位址可自動生成或人工分配。各命名空間也可包括什麼介面被分配給該命名空間的規範(例如,由配置確定)。例如,全域命名空間可被定義為包括PE 114的介面129和PE 116的介面130。
在某些實施方式中,CB轉發表316可包括轉發條目,例如用於確定通過其下行鏈路介面306a~c可到達哪些目的地,以及上行鏈路介面304將發送至哪些目的地。轉發邏輯模組326進行操作,以確定正在發出的資料包通過哪個CB介面被發送,以及資料包通過哪個(哪些)PE介面被最終發送出擴展交換機104。
CB 300的資料包接收/發送模組318進行操作,以接收和發送資料包。
CB標籤處理模組322進行操作,以處理傳入的資料包的E標籤,並配置從CB傳出的資料包的E標籤。根據一個實施方式,CB標籤處理模組322處理在資料包150進入擴展交換機104時通過的PE(如114或116)處附至數據包的E標籤154。在CB 112處對E標籤154的處理包括確定資料包通過哪個介面(如117或118)進入CB 112。一旦完成資料包的其他處理,諸如資料包報頭處理,傳入的E標籤被替換為新的E標籤,或在資料包從CB發往其目的地之前修改該傳入的E標籤。傳出的資料包150的目的地欄位158根據轉發查找中所識別的目的地來設定。例如,E標籤目的地欄位158可被設定為資料包被發出擴展交換機104去往其目的地所通過的PE 116上的介面的位址。添加的目的地欄位應使用欄位161被正確地識別為屬於介面專用命名空間或全域命名空間。
命名空間模組324進行操作,以確定與資料包相關聯的命名空間。例如,命名空間423可確定從PE 114或116進入CB 112的資料包150是否應基於介面專用命名空間或基於全域命名空間來處理。資料包命名空間的確定可基於確定該資料包是否包含其源命名空間的指示,例如,在資料包的E標籤中。根據一個實施方式,如果該資料包不包含其源命名空間的指示,那麼其命名空間與其進入CB時通過的介面的介面專用命名空間相關聯。
學習模組328進行操作以自動學習終端站的可達性。根據一個實施方式,終端站的可達性可由CB 112基於通過 CB 112轉發的資料包來學習。例如,CB 112可確定資料包150的源通過PE介面可達,此PE介面為該資料包進入擴展交換機所通過的PE介面。當資料包的源可通過多個PE介面到達時,如當LAG 106的單個鏈路124和126被耦合至擴展交換機104的不同PE時,那麼可經由CB 112的多個介面到達源VM1 137~VM4 140中的任一個。當存在多於一個可選路徑時,可使用負載平衡技術選擇到達節點的較佳路徑。根據一個實施方式,節點可達性的學習在各自的命名空間的上下文中執行。例如,如果包150被標記為指示全域命名空間,那麼該資料包的源可能經由多個CB 112介面可到達。
存取控制清單(ACL)模組330進行操作,以執行資料包在進行轉發處理前和/或後的過濾。根據一個實施方式,ACL處理可在各自的命名空間的上下文中執行。例如,ACL條目可基於資料包進入CB時所通過的CB介面或資料包發出CB時所通過的介面來查找。
圖4示出了根據本公開實施方式的用於轉發資料包的方法400(步驟402~416)的流程圖。方法400可在例如圖1所示的系統100中實施。
在步驟402中,通過耦合兩個或更多埠擴展器至一個CB來配置一個擴展交換機。例如,CB 112可被配置為耦合至PE 114和PE 116,以構成擴展交換機104。擴展交換機104可被耦合至如圖1所示的伺服器102和L2雲108。
在步驟404中,擴展交換機的PE的一個或多個介面與全域命名空間相關聯。例如,擴展交換機104的PE 114的介面129和PE 116的介面130被配置為與全域命名空間相 關聯。選擇介面129和130配置為與全域命名空間相關聯,是因為它們分別經由鏈路124和126耦合至伺服器102,鏈路124和126屬於同一LAG 106。
使用介面專用命名空間的擴展交換機中的資料包處理,包括源修剪(source pruning)和髮夾(hair pining),是基於節點可達性採用以CB的介面為根的樹的形式的假設。然而,當諸如LAG 106的LAG被配置時,這種節點可達性採用以CB的介面為根的各個樹的形式的假設是錯誤的。例如,單個的鏈路被耦合至擴展交換機的不同PE的這種LAG 106可導致可經由擴展交換機的CB的多個介面到達節點(如VM1 137~VM4 140)。
在步驟406中,要被轉發的資料包在擴展交換機處從終端站接收。例如,資料包可在擴展交換機104的PE 114處從伺服器102接收。該資料包可具有源和目的地,分別為VM1 137和VM4 140。
在步驟408中,諸如E標籤154的E標籤被附至數據包。如上所述,E標籤在擴展交換機內使用。E標籤包括源欄位156和目的地欄位158。傳入的資料包的源欄位156被設定為標示資料包進入擴展交換機所通過的介面。
在步驟410中,資料包被標記為指示其通過已被配置為與全域命名空間相關聯的介面進入了擴展交換機。根據一個實施方式,E標籤的命名空間欄位被用於資料包的源欄位的命名空間的指示。如果源PE介面與全域命名空間相關聯,則E標籤中的命名空間欄位例如可被設定為“1”。否則,命名空間欄位可保持為其初始值“0”。然後,已標記的資料包被發送至擴展交換機的CB。
在步驟412中,已標記的資料包基於資料包中指示的全域命名空間在CB中被處理,以確定資料包從擴展交換機所轉發至的下一跳。對已標記資料包的基於全域命名空間的處理獲得了資料包將要從擴展交換機轉發至的下一跳。該處理也使得確定了資料包被設定為從擴展交換機的哪個介面發出。
從CB到資料包發出擴展交換機所通過的介面的路徑可包括一個或多個PE。在步驟414中,利用將要通過一個或多個PE被轉發出擴展交換機的資料包的所需資訊來更新E標籤。E標籤的更新根據轉發要求來不同地執行。
如果資料包要被轉發出CB的上行鏈路介面(例如,在CB 112中的鏈路107上發出),則E標籤被移除,且資料包被轉發至L2雲。
如果資料包要在CB的下行鏈路介面上被轉發,則資料包的E標籤被適當地更新,如下所述,以從CB通過一個或多個PE轉發。基於資料包的傳入和傳出命名空間相同還是不同,E標籤將被不同地更新。如上所述,資料包的傳入命名空間可基於傳入的E標籤目的地欄位中使用的位址或基於資料包的命名空間指示欄位來確定。傳出命名空間基於目的地和轉發查找來確定。傳出的資料包的命名空間基於資料包出擴展交換機104所通過的PE介面(即,該PE介面是否被配置為全域介面)以及傳出的資料包出CB所通過的介面。
若資料包的傳入和傳出命名空間不同,則E標籤的源欄位被更新為數值0,且E標籤的目的地欄位根據目的地更新。例如,如果資料包從VM1 137經由PE 114和CB介面 117到達CB 112,則其將與全域命名空間相關聯,因為PE 114處的介面129是LAG的一部分。根據CB 112處的轉發查找,如果該資料包通過CB介面118被發送至PE 116,經由PE介面141發送至另一伺服器142上的目的地VM5 143,則E標籤的源欄位被設定為0,且E標籤的目的地欄位被設定為與介面141相關聯的值。
如果資料包的傳入和傳出命名空間相同,則E標籤的源欄位保持不變。傳出的E標籤的目的地欄位根據目的地更新。例如,如果來自VM1 137的資料包通過PE 114和CB介面117到達,則其將與全域命名空間相關聯,因為PE 114處的介面129是LAG的一部分。根據CB 112處的轉發查找,如果該資料包將要通過介面117被發送回PE 114去往VM4 140,則傳出的E標籤的目的地欄位在介面129處被設定為代表VM4 140的值。
如果資料包為組播資料包,則其必須被轉發至組播組的所有接收器。擴展橋必須適當地複製資料包以確保各接收器得到一個且僅一個拷貝。E標籤的目的地欄位標示用於組播資料包的組播分發樹,並非一個專用目的地介面。當沒有LAG時,組播分發可被視為以CB為根的樹。可直接在CB處或樹中的各種中間節點(PE)處複製資料包。各CB和PE將目的地組播樹ID映射至目的地介面的清單。將E標籤中的源欄位與目的地介面進行比較使得CB或PE可修剪掉源,並確保該源不會收到其自身的資料包拷貝。然而,當LAG存在於從CB到終端主機的路徑中時,通過擴展交換機有多個路徑可到達目的地。如果擴展交換機的每個節點基於將組播樹ID匹配至目的地介面的清單來簡單地 轉發資料包,則接收器(如VM4)將收到同一個資料包的多個拷貝。因此,擴展交換機必須實施適當的過濾方案來確保每個接收器只獲得一個資料包拷貝。一種這樣的方法是基於流來實施過濾。每個節點為資料包計算散列(hash)。如果目的地介面被標記為LAG的成員,則只有那些散列與遮罩(mask)匹配的流才允許通過。這些遮罩在不同節點處以互斥方式配置,以確保僅一個資料包拷貝去往目的地。例如,在圖1中,考慮來源於VM1的組播資料包。CB 112將複製該資料包到介面117和118,使拷貝分別到達PE 114和116。因為介面129和130為LAG的一部分,因此PE 114和116現在必須被配置為以互斥方式工作。一些流將被PE 114過濾,其他則被PE 116過濾,以確保僅一個拷貝到達各目的地。為確保正確的修剪,可將LAG的路徑連接至CB的介面必須使用全域命名空間。例如,PE介面129和130必須使用全域命名空間。PE 116的PE介面141可使用介面專用命名空間,因為其未將LAG連接至CB。
在步驟416中,傳出的資料包被發送出CB。例如,該資料包可被發送出CB 112介面118去往PE 116,從而傳出擴展交換機104到PE介面130之外。如上所述,在某些實施方式中,在CB介面118和PE 116之間可存在資料包傳出擴展交換機確定通過的一個或多個PE。基於資料包被傳出擴展交換機所通過的PE 116處的介面(如,PE介面130)的E標籤(如在CB中更新的標籤),資料包通過一個或多個PE發送。在PE 116處,E標籤被移除,且資料包通過介面130被轉發至伺服器102。
在傳出的資料包離開擴展交換機所通過的PE中,修剪 技術可被實施以確保資料包不被轉發回同一個終端主機。例如,修剪邏輯可在PE 114中實施以確保源於從VM1 137接收的資料包的組播資料包不被發送回VM1 137。
圖5示出了根據實施方式的方法500(步驟502~508)的流程圖,該方法用於標記資料包以指示相關聯的命名空間。方法500可用於執行上述步驟410。
方法500可在資料包通過PE進入擴展交換機時執行。例如,當資料包通過介面129進入時,方法500可在PE 114中被初始化。在步驟502中,資料包進入PE時通過的介面被確定。在許多實施方式中,資料包接收模組,諸如資料包發送/接收模組218,接收進入PE的傳入資料包。該資料包接收邏輯可使得關於資料包進入PE所通過的介面的資訊可用。例如,資料包發送/接收模組218可提供指向對應於資料包傳入介面(諸如PE 114的介面129)的資料結構的指標。
在步驟504中,確定了要與資料包的源PE介面相關聯的命名空間。要與資料包相關聯的命名空間可基於傳入介面(即,資料包進入擴展交換機所通過的介面)來確定。例如,配置設置可對於各PE介面(諸如PE介面129)可用,該配置設置指定介面是否與全域命名空間相關聯。如果沒有提供具體配置,則該資料包可與介面專用命名空間相關聯。如果指定介面與全域命名空間相關聯的配置條目可用,則資料包的源PE介面與全域命名空間相關聯。
在步驟506中,E標籤被插入資料包以在擴展交換機中使用。E標籤的插入可根據有關步驟408的上述內容執行。
在步驟508中,資料包被標記上與資料包進入擴展交 換機時所通過的PE介面相關聯的命名空間。例如,如果PE 114的介面129是資料包進入擴展交換機104所通過的介面,且介面129已被配置為與全域命名空間相關聯,則E標籤中的命名空間欄位的值被設定為指示資料包的源PE與全域命名空間相關聯。根據一個實施方式,E標籤中的1比特寬的欄位被更新為指示命名空間。在其他實施方式中,該命名空間欄位可位於資料包報頭部分的別處,並可以是任意寬度,假設PE和CB被配置為識別這樣的欄位。在另一個實施方式中,如上所述,經由E標籤的源欄位和/或目的地欄位中的位址,源PE介面的命名空間關聯被傳達。上述有關步驟410中進一步描述了標記。
基於源是與介面專用命名空間還是與全域命名空間相關聯,CB中資料包的處理可不同。圖6示出了根據實施方式的用於在CB中處理資料包的方法600(步驟602~608)。方法600可用於執行上述步驟412。
在步驟602中,資料包可用於學習源的可達性。基於資料包的源位址和/或基於E標籤的源欄位和E標籤的目的地欄位,CB可學習到由E標籤的源欄位指示的源和/或介面通過資料包進入CB所通過的介面是可達的。學習到的可達性資訊可被納入ACL和轉發表。如果源欄位被指示為與介面專用命名空間相關聯,則學習到的節點的可達性資訊可被驗證以確保該節點只能通過CB介面中的一個可達。學習在圖3所示的上述有關學習模組328中描述。
在步驟604中,ACL處理可被執行。可在轉發處理前的任意階段在傳入的資料包上執行ACL處理。ACL處理也可在轉發處理發生後在傳出的資料包上執行。ACL處理可 用於實施策略。根據一個實施方式,ACL規則可被分別配置用於全域命名空間和介面專用命名空間。以上關於圖3所示的ACL模組330描述了ACL處理。
在步驟606中,轉發處理可被執行。轉發處理確定資料包的下一跳,還確定資料包應通過哪個PE介面離開擴展交換機。
在步驟608中,在資料包被發送出CB前,新的E標籤被附上或者傳入的E標籤被修改。如果轉發處理指示該資料包被發送出上行鏈路介面(如,去往L2雲108),則E標籤在資料包被發送出該介面前被移除。如果該資料包將通過PE被轉發,則E標籤將基於轉發查找來更新。以上關於上述步驟414和步驟506描述了傳出的資料包的標籤。
圖7示出了根據本公開實施方式的用於處理資料包的方法700(步驟702~708)。方法700可用於執行上述步驟412。具體地,方法700可用於確定與CB處資料包的源相關聯的命名空間,並進行初始化處理,諸如關於以上方法600描述的處理。
在步驟702中,資料包進入CB所通過的介面被確定。資料包進入CB所通過的介面可基於傳入資料包的E標籤的目的地欄位來確定。
在步驟704中,確定了源是與全域命名空間還是與介面專用命名空間相關聯。對相關聯的命名空間的確定可基於傳入資料包的可選的命名空間欄位。在另一個實施方式中,如上所述,命名空間的確定可基於E標籤的目的地欄位的值。
若確定了資料包的源PE介面與介面專用命名空間相 關聯,則在步驟706中,基於介面專用命名空間來處理資料包。否則(即,如果資料包的源PE介面與全域命名空間相關聯),在步驟708中,根據全域命名空間來處理資料包。
圖8示出了根據實施方式的用於將PE介面與全域命名空間相關聯的方法800(步驟802~804)的流程圖。例如,方法800可用於執行上述步驟404。
在步驟802中,屬於聚合組的PE介面被識別。根據一個實施方式,直接連接至外部裝置且具有作為LAG的一部分的鏈路的PE介面被識別。該LAG通常為外部裝置處的配置。
在步驟804中,在步驟802中識別出的兩個或更多介面被配置為與全域命名空間相關聯。該配置可通過在與各介面相關聯的配置參數中設定一個值來執行。根據一個實施方式,如果介面未被特別配置為與全域命名空間相關聯,則其可被預設為與介面專用命名空間相關聯。
以上借助於示出了本公開的具體功能及其關係的實現方式的功能模組描述了本公開。為了方便描述,這些功能模組的界限在文中被任意定義。可定義其他可選界限,只要能適當地執行具體功能及其關係即可。
對具體實施方式的前述描述將充分地揭示本公開的主要性質,使得他人通過應用本領域中的知識,無需過度實驗,即能夠針對各種應用容易地修改和/或調整這樣的具體實施方式,而不脫離本公開的主要思想。因此,基於本文中呈現的教導和引導,這樣的調整和修改包括在本公開實施方式的涵義和等同範圍內。要理解的是,文中的用語和術語是以描述而不是限制為目的,從而本說明書中的術語 或用語可由熟練的業內人士結合教導和引導來解釋。
100‧‧‧系統
102‧‧‧伺服器
104‧‧‧擴展交換機
106‧‧‧聚合鏈路
107‧‧‧通信鏈路
108‧‧‧L2雲
112‧‧‧CB(控制橋)
114‧‧‧PE(埠擴展器)
116‧‧‧PE
117‧‧‧介面
118‧‧‧介面
119‧‧‧鏈路
120‧‧‧鏈路
121‧‧‧介面
122‧‧‧介面
124‧‧‧鏈路
126‧‧‧鏈路
129‧‧‧介面
130‧‧‧介面
131‧‧‧介面
132‧‧‧S元件
133‧‧‧介面
134‧‧‧VEB
136‧‧‧VEPA
137~140‧‧‧VM
141‧‧‧PE介面
142‧‧‧伺服器
143‧‧‧VM5
150‧‧‧資料包
151‧‧‧資料
152‧‧‧資料包報頭
154‧‧‧標籤
156‧‧‧源欄位
158‧‧‧目的地欄位
160‧‧‧命名空間指示符欄位
161‧‧‧命名空間指示符欄位
200‧‧‧PE
202‧‧‧處理器
204‧‧‧上行鏈路介面
206a、206b、206c‧‧‧下行鏈路介面
208‧‧‧記憶體
210‧‧‧持久記憶體
212‧‧‧通信基礎設施
214‧‧‧配置模組
215‧‧‧命名空間配置參數
216‧‧‧PE轉發表
218‧‧‧資料包接收/發送模組
220‧‧‧轉發邏輯模組
222‧‧‧PE標籤模組
224‧‧‧PE標記模組
300‧‧‧CB
302‧‧‧處理器
304‧‧‧上行鏈路介面
306a、306b、306c‧‧‧下行鏈路介面
308‧‧‧記憶體
310‧‧‧持久記憶體
312‧‧‧通信基礎設施
314‧‧‧配置模組
316‧‧‧轉發表
318‧‧‧資料包接收/發送模組
322‧‧‧CB標籤處理模組
324‧‧‧命名空間模組
326‧‧‧轉發邏輯模組
328‧‧‧學習模組
330‧‧‧ACL模組
圖1a示出了在擴展交換機中支援邊緣鏈路聚合的系統。
圖1b示出了通過擴展交換機轉發的資料包。
圖2示出了擴展交換機的埠擴展器。
圖3示出了擴展交換機的控制橋。
圖4示出了在擴展交換機中支援邊緣鏈路聚合的方法的流程圖。
圖5示出了標記傳入的資料包的方法的流程圖。
圖6示出了在控制橋中處理資料包的方法的流程圖。
圖7示出了判定在控制橋處要應用的處理的方法的流程圖。
圖8示出了配置介面的方法的流程圖。
100‧‧‧系統
102‧‧‧伺服器
104‧‧‧擴展交換機
106‧‧‧聚合鏈路
107‧‧‧通信鏈路
108‧‧‧L2雲
112‧‧‧CB(控制橋)
114‧‧‧PE(埠擴展器)
116‧‧‧PE
117‧‧‧介面
118‧‧‧介面
119‧‧‧鏈路
120‧‧‧鏈路
121‧‧‧介面
122‧‧‧介面
124‧‧‧鏈路
126‧‧‧鏈路
129‧‧‧介面
130‧‧‧介面
131‧‧‧介面
132‧‧‧S元件
133‧‧‧介面
134‧‧‧VEB
136‧‧‧VEPA
137~140‧‧‧VM
141‧‧‧PE介面
142‧‧‧伺服器
143‧‧‧VM5

Claims (23)

  1. 一種用於通過分散式交換機轉發資料包的方法,該分散式交換機包括分別直接或間接通信耦合至控制橋的第一介面和第二介面的第一埠擴展器和第二埠擴展器,該方法包括:將所述第一埠擴展器的第一埠擴展器介面與全域命名空間或者介面專用命名空間相關聯;通過所述第一埠擴展器介面接收資料包;利用一位址和與所述第一埠擴展器介面相關聯的命名空間的指示標記接收到的資料包;至少部分地基於所述命名空間的所述指示,在所述控制橋中處理已標記的資料包之所述位址;以及將已處理的資料包發送出所述控制橋。
  2. 如申請專利範圍第1項之方法,其中,所述處理包括:在資料包中指示用於資料包離開所述分散式交換機的傳出埠擴展器介面;以及在資料包中指示與所述傳出埠擴展器介面相關聯的命名空間。
  3. 如申請專利範圍第1項之方法,其中,所述關聯包括:將所述第一埠擴展器介面和所述第二埠擴展器的第二埠擴展器介面的命名空間配置設定為全域命名空間,其中,所述第一埠擴展器介面和所述第二埠擴展器介面通信耦合至所述控制橋與至少一個邊緣伺服器之間的鏈路聚合組(LAG)的各自介面。
  4. 如申請專利範圍第1項之方法,其中,所述標記包括:檢測資料包通過所述第一埠擴展器介面進入所述第一 埠擴展器;基於與所述第一埠擴展器介面相關聯的命名空間,確定用於檢測到的資料包的命名空間指示;以及利用所確定的命名空間指示標記資料包。
  5. 如申請專利範圍第4項之方法,其中,確定命名空間指示包括:在全域命名空間和介面專用命名空間之間進行選擇。
  6. 如申請專利範圍第1項之方法,其中,所述處理包括:基於所述指示,在介面專用命名空間和全域命名空間之間進行選擇;以及查找所述控制橋中的轉發表以獲得目的地位址,其中,所述目的地位址在資料包中被指定。
  7. 如申請專利範圍第6項之方法,其中,查找所述轉發表包括:檢測所述轉發表中與所述目的地位址匹配的多個轉發條目;以及基於所述指示,選擇所述轉發條目中的一個。
  8. 如申請專利範圍第1項之方法,進一步包括:在所述第一埠擴展器處將本地報頭附至接收到的資料包,其中,所述本地報頭包括源欄位和目的地欄位;以及利用所述位址配置所述源欄位,所述位址用以辨識所述源欄位,其中,所述第一識別字與所述第一介面和所述第一埠擴展器介面相關聯。
  9. 如申請專利範圍第8項之方法,進一步包括:在處理資料包後,基於所述第一埠擴展器介面以及資料包離開所述分散式交換機所通過的傳出埠擴展器介面的 各自的命名空間配置,改變所述源欄位和所述目的地欄位。
  10. 如申請專利範圍第9項之方法,其中,所述改變包括:利用與所述第一介面相關聯的一更新位址和所述資料包中所述目的地欄位包括的一目的地位址設定所述源欄位。
  11. 如申請專利範圍第8項之方法,其中,所述標記包括:基於全域命名空間,選擇用於所述源欄位的位址。
  12. 如申請專利範圍第8項之方法,其中,所述本地報頭進一步包括至少一個命名空間指示符欄位,並且其中,所述標記包括:將所述至少一個命名空間指示符欄位配置為指示全域命名空間。
  13. 如申請專利範圍第1項之方法,其中,所述處理包括:學習資料包的源的可達性,其中,所述學習基於所述指示來執行。
  14. 如申請專利範圍第13項之方法,其中,所述學習包括源修剪。
  15. 如申請專利範圍第1項之方法,其中,所述處理包括:基於資料包的第一資訊,確定資料包通過所述第一介面進入所述控制橋;基於資料包的第二資訊,確定資料包通過所述第一埠擴展器介面進入所述第一埠擴展器,其中,所述第二資訊在所述第一埠擴展器中被插入資料包;以及確定資料包是否包括全域命名空間的指示。
  16. 如申請專利範圍第15項之方法,其中,所述處理進一步包括: 如果資料包中包括用於全域命名空間的指示,則基於全域命名空間查找轉發條目或存取控制條目中的至少一個。
  17. 一種用於轉發資料包的系統,包括:控制橋;第一埠擴展器,直接或間接耦合至所述控制橋的第一介面;第二埠擴展器,直接或間接耦合至所述控制橋的第二介面;介面配置模組,被配置為將所述第一埠擴展器的第一埠擴展器介面與全域命名空間或介面專用命名空間相關聯;資料包接收模組,被配置為通過所述第一埠擴展器介面接收資料包;資料包命名空間標記模組,被配置為利用一位址和與所述第一埠擴展器介面相關聯的命名空間的指示來標記資料包;以及資料包處理模組,被配置為至少部分地基於所述命名空間的所述指示來在所述控制橋中處理已標記的資料包之所述位址。
  18. 如申請專利範圍第17項之系統,其中,所述介面配置模組進一步被配置為將所述第一埠擴展器介面以及所述第二埠擴展器的第二埠擴展器介面的命名空間配置設定為全域命名空間,其中,所述第一埠擴展器介面和所述第二埠擴展器介面被通信耦合至所述控制橋與至少一個邊緣伺服器之間的鏈路聚合組(LAG)的各自的介面。
  19. 如申請專利範圍第17項之系統,其中,所述資料包命名標記模組進一步被配置為: 在所述第一埠擴展器處將本地報頭附至接收到的資料包,其中,所述本地報頭包括源欄位和目的地欄位;利用所述位址配置所述源欄位,所述位址用以辨識所述源欄位,其中,所述第一識別字與所述第一介面和所述第一埠擴展器介面相關聯;以及其中,所述資料包處理模組進一步被配置為:在處理資料包後,基於所述第一埠擴展器介面以及傳出埠擴展器介面的各自的命名空間配置,改變所述源欄位和所述目的地欄位。
  20. 如申請專利範圍第19項之系統,其中,所述資料包標記模組進一步被配置為:基於全域命名空間選擇用於所述源欄位的識別字。
  21. 如申請專利範圍第19項之系統,其中,所述本地報頭進一步包括至少一個命名空間指示符欄位,並且其中,所述資料包標記模組進一步將所述至少一個命名空間指示符欄位配置為指示全域命名空間。
  22. 一種存儲指令的電腦可讀存儲媒體,其中,所述指令在被處理器執行時適於通過分散式交換機執行資料包轉發,其中,所述分散式交換機包括分別直接或間接通信耦合至控制橋的第一介面和第二介面的第一埠擴展器和第二埠擴展器,利用包括以下步驟的方法執行所述資料包轉發:將所述第一埠擴展器的第一埠擴展器介面與全域命名空間或者介面專用命名空間相關聯;通過所述第一埠擴展器介面接收資料包;利用一位址和與所述第一埠擴展器介面相關聯的命名空間的指示標記接收到的資料包; 至少部分地基於所述命名空間的所述指示,在所述控制橋中處理已標記的資料包之所述位址;以及將已處理的資料包發送出所述控制橋。
  23. 如申請專利範圍第22項之電腦可讀存儲媒體,其中,所述方法進一步包括:在所述第一埠擴展器處將本地報頭附至接收到的資料包,其中,所述本地報頭包括源欄位和目的地欄位;以及利用所述位址配置所述源欄位,所述位址用以辨識所述源欄位,其中,所述第一識別字與所述第一介面和所述第一埠擴展器介面相關聯。
TW101120312A 2011-06-06 2012-06-06 用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體 TWI499240B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161493896P 2011-06-06 2011-06-06
US13/337,774 US8798064B2 (en) 2011-06-06 2011-12-27 Method and system of frame forwarding with link aggregation in distributed ethernet bridges

Publications (2)

Publication Number Publication Date
TW201251375A TW201251375A (en) 2012-12-16
TWI499240B true TWI499240B (zh) 2015-09-01

Family

ID=46229147

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101120312A TWI499240B (zh) 2011-06-06 2012-06-06 用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體

Country Status (5)

Country Link
US (1) US8798064B2 (zh)
EP (1) EP2533472A1 (zh)
CN (2) CN102821022B (zh)
HK (1) HK1177841A1 (zh)
TW (1) TWI499240B (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102684979B (zh) * 2011-03-11 2018-08-14 中兴通讯股份有限公司 一种支持虚拟终端的组播数据转发方法及装置
US9237124B2 (en) * 2011-07-14 2016-01-12 Marvell Israel (M.I.S.L) Ltd. Scaling of virtual machine addresses in datacenters
EP3605969B1 (en) 2011-08-17 2021-05-26 Nicira Inc. Distributed logical l3 routing
US9331938B2 (en) * 2012-04-13 2016-05-03 Nicira, Inc. Extension of logical networks across layer 3 virtual private networks
US9077650B2 (en) * 2012-05-31 2015-07-07 Broadcom Corporation Multi-homing in an extended bridge
US20140044129A1 (en) * 2012-08-10 2014-02-13 Duane Edward MENTZE Multicast packet forwarding in a network
US9176767B2 (en) * 2013-04-11 2015-11-03 Cisco Technology, Inc. Network interface card device pass-through with multiple nested hypervisors
CN104427012B (zh) * 2013-09-04 2018-12-11 新华三技术有限公司 端口协商方法和设备
CN103516609B (zh) * 2013-09-17 2017-05-17 杭州华三通信技术有限公司 一种业务报文的传输方法和设备
CN104518936B (zh) * 2013-09-27 2019-02-19 新华三技术有限公司 链路动态聚合方法和装置
US9225631B2 (en) * 2013-10-22 2015-12-29 International Business Machines Corporation Implementation of protocol in virtual link aggregate group
US10374941B2 (en) 2013-10-30 2019-08-06 Entit Software Llc Determining aggregation information
US20150163072A1 (en) * 2013-12-05 2015-06-11 Broadcom Corporation Virtual Port Extender
CN103763135B (zh) * 2014-01-06 2017-05-10 新华三技术有限公司 一种pe设备流量调度方法及装置
US9473357B2 (en) * 2014-01-24 2016-10-18 Cisco Technology, Inc. Guaranteeing bandwidth for dual-homed hosts in fabric extender topologies
CN106464549A (zh) * 2014-05-12 2017-02-22 华为技术有限公司 数据传输方法、装置及交换机
CN105471742B (zh) * 2014-06-20 2018-11-09 新华三技术有限公司 一种报文处理方法及设备
CN104092595B (zh) * 2014-07-21 2017-10-27 新华三技术有限公司 基于802.1br的虚拟化系统中的报文处理方法及装置
CN104158709B (zh) * 2014-08-06 2017-10-17 新华三技术有限公司 一种光模块识别的方法及端口扩展设备
US9792242B2 (en) * 2014-12-09 2017-10-17 Dell Products Lp Systems and methods for non-unicast/destination lookup fail (DLF) load balancing
KR20160085201A (ko) * 2015-01-07 2016-07-15 삼성전자주식회사 송신 장치, 수신 장치 및 그 신호 처리 방법
CN104702438B (zh) * 2015-03-13 2018-04-06 新华三技术有限公司 Pe设备管理方法以及装置
CN105162732B (zh) * 2015-06-30 2018-09-04 新华三技术有限公司 创建扩展端口的方法、装置
US10243914B2 (en) * 2015-07-15 2019-03-26 Nicira, Inc. Managing link aggregation traffic in edge nodes
US9960987B2 (en) * 2015-09-01 2018-05-01 Dell Products, Lp System and method for using open source management modules on hardware switch elements
CN107294846B (zh) * 2016-03-31 2020-12-04 新华三技术有限公司 报文转发方法和装置
EP3439248B1 (en) * 2016-03-31 2020-09-16 New H3C Technologies Co., Ltd. Configuration of link aggregation group
CN107493181B (zh) * 2016-06-13 2022-01-28 深圳市中兴通讯技术服务有限责任公司 虚拟扩展端口的指示方法和装置
CN107528784B (zh) * 2016-06-21 2021-02-26 新华三技术有限公司 报文转发方法和装置
CN106230753B (zh) * 2016-07-14 2019-09-06 新华三技术有限公司 端口扩展器pe下行端口控制方法和装置
CN107645391B (zh) * 2016-07-21 2022-05-27 深圳市中兴通讯技术服务有限责任公司 一种接口扩展设备的端口配置方法及装置
US10250527B2 (en) * 2016-09-01 2019-04-02 Arris Enterprises Llc Port extender ID assignment in an extended bridge
CN106383736B (zh) * 2016-09-21 2019-10-11 新华三技术有限公司 端口扩展方法和装置
CN106533889A (zh) * 2016-12-30 2017-03-22 盛科网络(苏州)有限公司 芯片中bpe跨端口扩展设备实现链路聚合的方法
US10951523B2 (en) 2017-01-09 2021-03-16 Marvell Asia Pte, Ltd. Port extender with local switching
CN108259297B (zh) * 2017-04-28 2020-12-04 新华三技术有限公司 一种报文处理方法及装置
US10819675B2 (en) * 2017-08-14 2020-10-27 Nicira, Inc. Managing network connectivity between cloud computing service endpoints and virtual machines
CN109728991B (zh) * 2017-10-31 2021-11-02 中兴通讯股份有限公司 一种快速恢复扩展桥系统的方法、装置、设备及存储介质
CN107769980A (zh) * 2017-11-01 2018-03-06 盛科网络(苏州)有限公司 一种用于扩展桥的转发多播报文的方法和装置
CN107968849B (zh) * 2017-11-28 2020-12-25 新浪网技术(中国)有限公司 一种网络专线接驳的方法及装置
EP3499805A1 (en) * 2017-12-13 2019-06-19 Siemens Aktiengesellschaft Method of data packet transmission and/or reception
CN108092896B (zh) * 2017-12-26 2020-12-08 新华三技术有限公司 堆叠系统和聚合组建立装置
US11336733B2 (en) 2018-06-21 2022-05-17 Nicira, Inc. Networking connection management based on container identification
CN112769601B (zh) * 2020-12-29 2022-05-24 新华三技术有限公司 一种链路切换方法及设备
CN113422735B (zh) * 2021-06-22 2022-08-05 恒安嘉新(北京)科技股份公司 负载均衡配置方法、汇聚分流器及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100054117A1 (en) * 2008-08-26 2010-03-04 Fulcrum Microsystems Global ports in multi-switch systems

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060274647A1 (en) * 2005-06-02 2006-12-07 Broadcom Corporation Dynamic port failover
JP4688765B2 (ja) * 2006-09-20 2011-05-25 富士通株式会社 ネットワークの冗長方法及び中位スイッチ装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100054117A1 (en) * 2008-08-26 2010-03-04 Fulcrum Microsystems Global ports in multi-switch systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Atlanta,"IEEE 802 Tutorial:Edge Virtual Bridging",November 2009 R.Recio,S.Krishnasamy,and R.Sharma,"Ethernet Virtual Bridging Automation Use Cases,"DC CAVES workshop ITC 22, September 2010 *

Also Published As

Publication number Publication date
HK1177841A1 (zh) 2013-08-30
CN102821022A (zh) 2012-12-12
US20120307828A1 (en) 2012-12-06
TW201251375A (en) 2012-12-16
CN203135921U (zh) 2013-08-14
CN102821022B (zh) 2016-01-20
US8798064B2 (en) 2014-08-05
EP2533472A1 (en) 2012-12-12

Similar Documents

Publication Publication Date Title
TWI499240B (zh) 用於通過分散式交換機轉發資料包的方法、用於轉發資料包的系統、及存儲指令的電腦可讀存儲媒體
US11716223B2 (en) Virtual converged cable access platform (CCAP)
US8948179B2 (en) Method of multiprotocol label switching encapsulation for united router farm forwarding
US8005081B2 (en) Evolution of ethernet networks
CN107210961B (zh) 用于虚拟路由和转发路由泄漏的方法和装置
US8804572B2 (en) Distributed switch systems in a trill network
US9025459B2 (en) Network traffic load balancing
EP4239973A1 (en) Packet sending method, device, and system
WO2013185715A1 (zh) 一种实现虚拟网络的方法和虚拟网络
GB2497202A (en) Transmitting frames between, possibly different, local VLANs by encapsulating frames for global VLAN tunnel
WO2022110535A1 (zh) 一种报文发送方法、设备及系统
ES2731882T3 (es) Gestión de fallos de conectividad en una red de comunicaciones
Hooda et al. Using TRILL, FabricPath, and VXLAN
Farkas et al. Software defined networking supported by ieee 802.1 q
EP3253008B1 (en) Transfer apparatus
Shahrokhkhani An Analysis on Network Virtualization Protocols and Technologies
US8040897B2 (en) Multiple spanning tree extensions for trunk ports carrying more than 4K virtual services
US20180183625A1 (en) Communication node, control apparatus, communication system, communication method and program