JP2023538566A - 分散ルーティングシステムにおけるデータ処理 - Google Patents
分散ルーティングシステムにおけるデータ処理 Download PDFInfo
- Publication number
- JP2023538566A JP2023538566A JP2023511921A JP2023511921A JP2023538566A JP 2023538566 A JP2023538566 A JP 2023538566A JP 2023511921 A JP2023511921 A JP 2023511921A JP 2023511921 A JP2023511921 A JP 2023511921A JP 2023538566 A JP2023538566 A JP 2023538566A
- Authority
- JP
- Japan
- Prior art keywords
- distributed routing
- routing system
- counter
- modules
- fabric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/58—Association of routers
- H04L45/586—Association of routers of virtual routers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/065—Generation of reports related to network devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/15—Interconnection of switching modules
- H04L49/1507—Distribute and route fabrics, e.g. sorting-routing or Batcher-Banyan
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/20—Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
Abstract
通信ネットワーク内で使用される分散ルーティングシステムが提供される。前記分散ルーティングシステムは、複数の転送モジュール及び複数のファブリックモジュールを含む。少なくとも1つの個別のファブリックモジュールに配置された少なくとも1つのカウンタは、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを受信するように構成される。【選択図】 図1
Description
本開示は、包括的には、ネットワーキングの分野に関する。より詳しくは、ハードウェア資源の最適化に関する。
ACL:アクセス制御リスト(Access Control List):パケットがデバイスを介して転送されることを許可又は拒否する1組のルール。
ASIC:特定用途向け集積回路(Application-Specific Integrated Circuit)
CPU:中央処理装置(Central Processing Unit)
FIB:転送情報ベース(Forwarding Information Base):パケットを送信するインタフェースを選択する為にルーティングデバイスにより使用される。
FPGA:フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array)
LIF:論理インタフェース(Logical Interface)
LSP:ラベルスイッチパス(Label Switched Path)
MPLS:マルチプロトコルラベルスイッチング(Multiprotocol Label Switching)
RIB:ルーティング情報ベース(Routing Information Base):他のルーティングデバイスへのルートを学習する為にルーティングデバイスにより使用される。
VLAN:仮想ローカルアクセスネットワーク(Virtual Local Access Network):インターネットから分離して動作するネットワーク又はネットワークの一部。VLANは、同じ物理ネットワーク内で動作するネットワーク間の分離を可能にするアプローチである。
ASIC:特定用途向け集積回路(Application-Specific Integrated Circuit)
CPU:中央処理装置(Central Processing Unit)
FIB:転送情報ベース(Forwarding Information Base):パケットを送信するインタフェースを選択する為にルーティングデバイスにより使用される。
FPGA:フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array)
LIF:論理インタフェース(Logical Interface)
LSP:ラベルスイッチパス(Label Switched Path)
MPLS:マルチプロトコルラベルスイッチング(Multiprotocol Label Switching)
RIB:ルーティング情報ベース(Routing Information Base):他のルーティングデバイスへのルートを学習する為にルーティングデバイスにより使用される。
VLAN:仮想ローカルアクセスネットワーク(Virtual Local Access Network):インターネットから分離して動作するネットワーク又はネットワークの一部。VLANは、同じ物理ネットワーク内で動作するネットワーク間の分離を可能にするアプローチである。
典型的な分散ルーティングプラットフォームは、(例えば、冗長性目的の)1以上のルーティングプロセッサ、(ルーティングプラットフォーム内のネットワークインタフェースの数による)転送デバイス、ファブリックデバイス、及びプラットフォーム管理ネットワークから構成される。
ルーティングプロセッサは、制御プレーンプロトコル(例えば、動作ルーティングプロトコル)及び管理プレーンプロトコルを動作させる計算ノードである。ルーティングプロトコルは、ルーティング情報ベース(RIB)テーブルを事前設定する為に使用される。結局、RIBテーブルは、ネットワーク内で到達可能な全ての宛先へのルートを含む。
転送デバイス(フォーワーダ)は通常、データプレーン特定用途向け集積回路(ASIC)又はフィールドプログラマブルゲートアレイ(FPGA)であるパケットプロセッサに基づく。パケットプロセッサは、複数のネットワークインタフェースを有する。各ネットワークインタフェースはさらに、複数の論理インタフェース(LIF)に分離することができる。論理インタフェースは、VLAN、MPLS LSP、L3トンネル等としてネットワークインタフェース上に存在することができる。パケットプロセッサは、1つの論理インタフェースから他の論理インタフェースへのパケット転送を実行するように構成される。パケットプロセッサに加えて、転送デバイスは、転送エンジンアプリケーションを実行する中央処理装置を含む。転送エンジンアプリケーションは、FIB、ACL、及びルーティングエンジン指令による他のパケットプロセッサ資源の維持を担当する。転送エンジンアプリケーションは、ネットワークインタフェース状態、カウンタ等のフォーワーダの状態をルーティングエンジンに報告する。また、転送エンジンは、パケットプロセッサから受信したルーティングプロトコルパケットを捕捉し、ルーティングエンジンに転送する。
ファブリックデバイスは通常、データプレーンASIC又はFPGAチップであるファブリックスイッチに基づく。ファブリックスイッチは、1つのフォーワーダ上に存在する論理インタフェースから他のフォーワーダ上に存在する論理インタフェースへパケットを転送する為の転送デバイスの相互接続の為に使用される。ファブリックスイッチに加えて、ファブリックデバイスは、ファブリックエンジンアプリケーションを実行する中央処理装置を含む。ファブリックエンジンアプリケーションは、ファブリックインタフェース状態、カウンタ等のファブリックスイッチの状態をルーティングエンジンに報告することを担当する。
トラフィックテレメトリ及びトラブルシューティングツールの実装を可能にする為に、転送デバイス上のパケットプロセッサは、物理及び論理インタフェースのそれぞれのカウンタを維持し、物理又は論理インタフェースを介して転送されたパケットの数をそれぞれカウントする。転送エンジンアプリケーションは、パケットプロセッサ及びファブリックスイッチからカウンタの現在の結果を定期的に収集しなければならない。以下の理由から収集期間は短期間であることが重要である。
・高いデータプレーンレートによるカウンタ循環を回避する為。
・ユーザに正確で最新のテレメトリの提供を可能にする為。
・高いデータプレーンレートによるカウンタ循環を回避する為。
・ユーザに正確で最新のテレメトリの提供を可能にする為。
パケットプロセッサは、数千の論理インタフェース(LIF)をサポートすることができ、各論理インタフェースの為の数百のカウンタを維持することができる。多数のインタフェース及びカウンタにより、収集プロセスは、面倒なプロセスとなり、中央処理装置の処理が非常に多大になる。
本開示により提供されるソリューションは、分散システムの機能を以前と同様に維持したまま転送エンジン(例えば、カウンタのメンテナンス)の計算負荷が減少される新規の分散システムを提案する。
本開示は、添付の特許請求の範囲を参照することによって要約することができる。
本開示の目的は、分散ルーティングシステム内に含まれるノードからの統計収集(PM収集)の効果的な監視を可能にする新規の分散ルーティングシステムを提供することである。
本開示の他の目的は、分散ルーティングシステムの機能を以前と同様に維持したまま、中央処理装置の多大なタスクが転送デバイスからオフロードされる新規の分散ルーティングシステムを提供することである。
本開示の他の目的は、転送デバイスの為のカウンタ収集論理がファブリックデバイス上で遠隔で実行される新規の分散ルーティングシステムを提供することである。
本開示の他の目的は、カウンタ収集負荷が転送エンジンからファブリックエンジンにシフトされる新規の分散ルーティングシステムを提供することである。
本開示の他の目的は、以下の説明から明らかになる。
本開示の第1の実施形態によれば、複数の転送モジュール及び複数のファブリックモジュールを含む通信ネットワーク内で使用される分散ルーティングシステムが提供され、少なくとも1つの個別のファブリックモジュールに配置された少なくとも1つのカウンタは、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを受信するように構成される。
他の実施形態によると、前記少なくとも1つの個別のファブリックモジュールに配置された前記少なくとも1つのカウンタは、前記複数の転送モジュールの少なくとも2つに関連する全ての物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを受信するように構成される。
また、他の実施形態によると、前記複数の転送モジュール及び前記複数のファブリックモジュールのそれぞれは、分離した物理デバイス(例えば、前記分散ルーティングシステム内のノード)である。
さらに他の実施形態によると、個別のファブリックモジュールに配置された前記少なくとも1つのカウンタに関連する中央処理装置は、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを遠隔で取得するように構成される。
また、他の実施形態によると、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータは、個別のファブリックモジュールに関連するファブリックスイッチのカウンタエンジンにデータプレーンパケットとしてエクスポートされる。
他の実施形態によると、前記少なくとも1つの個別のファブリックモジュールがさらに、前記少なくとも1つの個別のファブリックモジュールに配置されたカウンタエンジンからカウンタ値を取得する為にカウンタ収集アプリケーションを実行するように構成される。
さらに他の実施形態によると、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータは、前記少なくとも1つの個別のファブリックモジュールに配置されたカウンタエンジンから取得したカウンタ値の処理とは分離して、前記少なくとも1つの個別のファブリックモジュールにより処理される。
本明細書に組み込まれ、本明細書の一部を構成する添付の図面は、本開示のいくつかの実施形態を示し、以下の説明と共に、本明細書に開示されるこれらの実施形態の原理を説明するために使用される。
以下の詳細な説明における特定の詳細及び値の一部は、本開示の特定の例を示している。但し、この説明は、例示的なものであり、本発明の範囲を限定することを意図するものではない。特許請求される分散ルーティングシステムは、当該技術分野で公知の他の手法によって実現できることは、当業者にとって明らかである。本発明の範囲は、添付の特許請求の範囲を参照することにより要約される。
上述のように、トラフィックテレメトリを実装する為の典型的な従来技術のソリューションは、転送デバイス(フォーワーダ)に関連するパケットプロセッサを構成し、それにより、それぞれの物理及び論理インタフェースの為のカウンタを維持する。このタスクに応じる為に、転送エンジンアプリケーションは、定期的に(短い期間で)、パケットプロセッサからカウンタの現在値を収集しなければならない。しかしながら、そのようなパケットプロセッサは、数千の論理インタフェース(LIF)をサポートすることができ、各論理インタフェースの数百のカウンタを維持することができる。そのように多数のインタフェース及びカウンタにより、収集プロセスは、とても面倒なタスクとなり、中央処理装置の処理が非常に多大になる。転送エンジンアプリケーションはいくつかの中央処理装置の処理が多大になる機能を含み、カウンタ収集機能のサポートはその中の1つであるという事実を考慮して、発明者は、中央処理装置の処理負荷を減少することにより、転送デバイスの中央処理装置の性能は改善されることを見出し、それにより、分散ルーティングシステム内に配置されたノードからの改善された性能監視統計収集(PM収集)を可能にする。その為に、本発明により提供されたソリューションは、転送デバイスの中央処理装置からファブリックデバイス(ファブリックモジュール)上で実行されるソフトウェア論理にカウンタ収集タスクをオフロードすることを提案する。分散ルーティングシステムが複数のファブリックデバイスを含む場合、各ファブリックデバイスは、転送デバイスの異なるグループのカウンタの値を収集するように構成されることができる。
図1には、複数の転送デバイス(1101、1102、110n)(転送モジュール)及び複数のファブリックデバイス(1201、1202、120k)(ファブリックモジュール)を含む分散ルーティングシステム100の一部の概略図が図示されている。個別の転送デバイス上に存在するパケットプロセッサ(1301、1302、130n)は、個別のオンチップブロックの一部としてカウンタ(1401、1402、140n)を維持し、カウンタは、カウンタが関連する物理又は論理インタフェースを介して転送されたパケットの数をカウントするように構成される。これらのカウンタは、ここではカウンタエンジンと呼ばれる。準用する実質的に同じオンチップブロックは、個別のファブリックデバイス(1201、1202、120k)上に存在するファブリックスイッチ(1501、1502、150k)の一部として配置されることができ、又は、転送デバイス(1101、1102、110n)から受信したデータは、これらの転送デバイスから受信したデータを収集するように構成されたプロセッサに伝達されて収集されることができる。ファブリックデバイス(1201、1202、120k)上に存在するローカル中央処理装置(CPU)(1601、1602、160k)は、転送デバイスのパケットプロセッサ(1301、1302、130n)上に配置されたカウンタエンジン(1401、1402、140n)の現在値を遠隔で取得するように構成されたカウンタ収集論理を実行する。パケットプロセッサのカウンタエンジン(1401、1402、140n)からデータを取得する為の遠隔アクセスは、例えば、リモートダイレクトメモリアクセス(RDMA)等の当業者には周知の様々な方法の1つを使用することにより、又は、パケットプロセッサのカウンタ値をデータプレーンパケットとしてファブリックスイッチ(1501、1502、150k)のカウンタエンジンにエクスポートすることにより実行することができる。また、ファブリックデバイス(1201、1202、120k)上に存在するローカル中央処理装置(1601、1602、160k)は、個別のローカルファブリックスイッチ(1501、1502、150k)に配置されたカウンタエンジン(1701、1702、170k)からカウンタの値を取得(読出)するように構成されたカウンタ収集論理を実行することができる。
ファブリックデバイスで情報を受信した後、情報は、分散ルーティングシステム内に含まれるノードからの性能監視統計収集等の必要な任意のタスクの為に処理されて使用される。
本発明は、単なる例として提供され、本発明の範囲を限定することを意図していない実施形態の詳細な説明を使用して、説明されている。記載されている実施形態は異なる構成を含み、全ての構成が本発明の全ての実施形態において必要であるわけではない。本発明のいくつかの実施形態は、いくつかの構成のみ、又は構成の可能な組み合わせを使用するものである。記載されている本発明の実施形態の変形、及び記載の実施形態に示されている構成の異なる組み合わせを含む本発明の実施形態は、当業者には自明である。本発明の範囲は、以下の特許請求の範囲によってのみ限定されるものである。
Claims (7)
- 複数の転送モジュール及び複数のファブリックモジュールを含む通信ネットワーク内で使用される分散ルーティングシステムであって、少なくとも1つの個別のファブリックモジュールに配置された少なくとも1つのカウンタは、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを受信するように構成されることを特徴とする分散ルーティングシステム。
- 前記少なくとも1つの個別のファブリックモジュールに配置された前記少なくとも1つのカウンタは、前記複数の転送モジュールの少なくとも2つに関連する全ての物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを受信するように構成されることを特徴とする請求項1に記載の分散ルーティングシステム。
- 前記複数の転送モジュール及び前記複数のファブリックモジュールのそれぞれは、分離した物理デバイスであることを特徴とする請求項1に記載の分散ルーティングシステム。
- 個別のファブリックモジュールに配置された前記少なくとも1つのカウンタに関連する中央処理装置は、前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータを遠隔で取得するように構成されることを特徴とする請求項1に記載の分散ルーティングシステム。
- 前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータは、個別のファブリックモジュールに関連するファブリックスイッチのカウンタエンジンにデータプレーンパケットとしてエクスポートされることを特徴とする請求項1に記載の分散ルーティングシステム。
- 前記少なくとも1つの個別のファブリックモジュールがさらに、前記少なくとも1つの個別のファブリックモジュールに配置されたカウンタエンジンからカウンタ値を取得する為にカウンタ収集アプリケーションを実行するように構成されることを特徴とする請求項1に記載の分散ルーティングシステム。
- 前記複数の転送モジュールの少なくとも2つに関連する物理及び/又は論理インタフェースを介して転送されたパケットの数に関するデータは、前記少なくとも1つの個別のファブリックモジュールに配置されたカウンタエンジンから取得したカウンタ値の処理とは分離して、前記少なくとも1つの個別のファブリックモジュールにより処理されることを特徴とする請求項6に記載の分散ルーティングシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063066346P | 2020-08-17 | 2020-08-17 | |
US63/066,346 | 2020-08-17 | ||
PCT/IL2021/050795 WO2022038589A1 (en) | 2020-08-17 | 2021-06-29 | Processing data in a distributed routing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023538566A true JP2023538566A (ja) | 2023-09-08 |
Family
ID=80322711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023511921A Pending JP2023538566A (ja) | 2020-08-17 | 2021-06-29 | 分散ルーティングシステムにおけるデータ処理 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230300071A1 (ja) |
EP (1) | EP4197176A4 (ja) |
JP (1) | JP2023538566A (ja) |
WO (1) | WO2022038589A1 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7065482B2 (en) * | 2001-05-17 | 2006-06-20 | International Business Machines Corporation | Internet traffic analysis tool |
US11706080B2 (en) * | 2018-06-07 | 2023-07-18 | Vmware, Inc. | Providing dynamic serviceability for software-defined data centers |
US11706099B2 (en) * | 2018-06-29 | 2023-07-18 | Juniper Networks, Inc. | Monitoring and policy control of distributed data and control planes for virtual nodes |
-
2021
- 2021-06-29 JP JP2023511921A patent/JP2023538566A/ja active Pending
- 2021-06-29 WO PCT/IL2021/050795 patent/WO2022038589A1/en active Application Filing
- 2021-06-29 US US18/041,722 patent/US20230300071A1/en active Pending
- 2021-06-29 EP EP21857907.6A patent/EP4197176A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4197176A4 (en) | 2024-01-17 |
WO2022038589A1 (en) | 2022-02-24 |
US20230300071A1 (en) | 2023-09-21 |
EP4197176A1 (en) | 2023-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10911355B2 (en) | Multi-site telemetry tracking for fabric traffic using in-band telemetry | |
CN104303467B (zh) | 一种交换机及其操作方法 | |
CN1875585B (zh) | 利用mac限制来控制动态未知l2泛滥的方法和系统 | |
US10419319B1 (en) | Monitoring gateway systems and methods for openflow type networks | |
US9858104B2 (en) | Connecting fabrics via switch-to-switch tunneling transparent to network servers | |
EP2928137B1 (en) | System and method for software defined routing of traffic within and between autonomous systems with enhanced flow routing, scalability and security | |
CN106100999B (zh) | 一种虚拟化网络环境中镜像网络流量控制方法 | |
EP1652357B1 (en) | Method and apparatus for adaptive flow-based routing in multi-stage data networks | |
US8879396B2 (en) | System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology | |
EP2608459B1 (en) | Router, virtual cluster router system and establishing method thereof | |
US20130003535A1 (en) | Systems and methods for distributed service protection across plug-in units | |
CN111245747B (zh) | 一种数据中心网络组网的方法以及数据中心网络 | |
US8462636B2 (en) | Systems and methods for communication of management traffic over link aggregation group interface for a network element with distributed architecture | |
US7436775B2 (en) | Software configurable cluster-based router using stock personal computers as cluster nodes | |
CN1943173A (zh) | 智能附属网络设备 | |
EP1890438A1 (en) | Method and apparatus for achieving dynamic capacity and high availability in multi-stage data networks using adaptive flow-based routing | |
Thorat et al. | Optimized self-healing framework for software defined networks | |
US9065678B2 (en) | System and method for pinning virtual machine adapters to physical adapters in a network environment | |
Hwang et al. | Design of SDN-Enabled cloud data center | |
JP2023538566A (ja) | 分散ルーティングシステムにおけるデータ処理 | |
Liu et al. | An enhanced scheduling mechanism for elephant flows in SDN-based data center | |
US9521066B2 (en) | vStack enhancements for path calculations | |
Sankari et al. | Network traffic analysis of cloud data centre | |
Reinemo et al. | Multi-homed fat-tree routing with InfiniBand | |
RU2775146C1 (ru) | Способ автоматизированного предоставления виртуального канала оператором связи между ЦОД |