JP7157151B2 - 直接相互接続ゲートウェイ - Google Patents

直接相互接続ゲートウェイ Download PDF

Info

Publication number
JP7157151B2
JP7157151B2 JP2020520634A JP2020520634A JP7157151B2 JP 7157151 B2 JP7157151 B2 JP 7157151B2 JP 2020520634 A JP2020520634 A JP 2020520634A JP 2020520634 A JP2020520634 A JP 2020520634A JP 7157151 B2 JP7157151 B2 JP 7157151B2
Authority
JP
Japan
Prior art keywords
network
port
direct
direct interconnection
gateway device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020520634A
Other languages
English (en)
Other versions
JP2020537439A5 (ja
JP2020537439A (ja
Inventor
マシュー ロバート ウィリアムズ
Original Assignee
ロックポート ネットワークス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロックポート ネットワークス インコーポレイテッド filed Critical ロックポート ネットワークス インコーポレイテッド
Publication of JP2020537439A publication Critical patent/JP2020537439A/ja
Publication of JP2020537439A5 publication Critical patent/JP2020537439A5/ja
Priority to JP2022117013A priority Critical patent/JP7357123B2/ja
Application granted granted Critical
Publication of JP7157151B2 publication Critical patent/JP7157151B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/66Arrangements for connecting between networks having differing types of switching systems, e.g. gateways
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/15Interconnection of switching modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

本発明は、コンピュータネットワーク内のI/O(入力/出力)トラフィックに関する。より具体的には、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のデータのブリッジング、スイッチング、又はルーティングを行う専用デバイスに関する。
コンピュータネットワークは、多数のノードが、互いにデータをルーティング又は他の方法で交換することを可能にする。その結果、コンピュータネットワークは、ストレージサーバの共有使用、ワールドワイドウェブへのアクセス、電子メールの使用などの膨大な数のアプリケーション及びサービスをサポートすることができる。
ノードは、それ自体、多くの場合、これらのノードが実行する特殊なタスクに基づいて3つのタイプ、すなわち、計算を実行する(しかしながら、一般に、皆無かそれに近いローカルディスクスペースを有する)CPUを有するサービスなどの計算ノードと、システムの二次ストレージを含み並列ファイルシステムサービスを提供するI/Oノードと、外部データサーバ及び大容量記憶システムへの接続を提供するゲートウェイノードと、に特徴付けることができる。一部のノードは、例えばI/O機能及びゲートウェイ機能の両方を処理することなどの2以上の機能を提供することさえ可能である。
国際公開第2015/027320号 国際公開第2015/120539号
しかしながら、並列システム及び分散システムのI/Oは、コンピュータシステムのユーザ及び設計者の両方にとって非常に大きな関心事になっている。この点で、CPUの速度は、事実上、毎年、指数関数的速度で増加しているが、残念なことに、I/Oデバイスの速度は、それより遅い速度で増加しており、このことは、多くの場合、この速度が機械構成要素の速度によって更に制限される場合があるという事実に起因する。従って、ノード間のI/Oデータトラフィックの尺度であるI/O性能は、ネットワーク性能における制限因子であることが多い。実際には、CPUとI/Oとの間の速度の不一致は、並列及び分散コンピュータシステムにおいて顕著であり、I/Oは、スケーラビリティを大幅に制限する可能性があるボトルネックの状態のままである。このことは、ネットワークがマルチメディア及び科学的モデリングを伴う商用アプリケーションに関連している場合に特に当てはまり、例えば、これらのアプリケーションの各々は、非常に大きなI/O要件を有する。
国際公開第2015/027320号(並列コンピュータシステムにおいてネットワークノードをメッシュ状に接続するための新規性のあるトーラス又は高基数相互接続トポロジを説明している)に開示されているものなどの直接相互接続ネットワークは、一般に、トラフィックを直接相互接続の一部分であるノードに制限する。国際公開第2015/027320号に開示されている新規性のあるシステム及びアーキテクチャは、特に、データセンタ及びクラウドデータセンタでの商用展開に有用で実用的であるが、残念なことに、現在運用中のほとんどのデータセンタは、依然として、とりわけ、従来型レガシー3層アーキテクチャ、ファットツリー型アーキテクチャ、又はDCellサーバセントリックアーキテクチャに基づいている。データセンタがこれらのアーキテクチャに基づく場合には、残念なことに、これらのデータセンタが直接相互接続に参加することは、望ましくないか又は不可能であり、従って、データセンタは、このようなネットワークトポロジの利点を活用することができない。いくつかの従来技術の直接相互接続アーキテクチャは、各ノード又はノードのサブセット(すなわち、ゲートウェイノード)が、直接相互接続ネットワーク及び従来型ネットワークの両方への二重接続性を有するシステムを提供しているが、これらのノードは、これら2つのネットワーク間でブリッジング又はルーティングを行うため、かかるノードがデバイスのリソースを管理及びロードすることは困難である。
従って、直接相互接続デバイス及び非直接相互接続デバイスが通信することを可能にするように設計及び可能にされた直接相互接続ゲートウェイを有することが望ましい。更に、I/Oトラフィックに関して上述した欠点のうちの幾つかを克服することを支援できるゲートウェイを有することが有用である。
1つの態様では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のブリッジング、スイッチング、又はルーティングが可能な専用デバイス、すなわち、ゲートウェイデバイスを提供する。
別の態様では、本発明は、ネットワーク管理システムによって管理できる非常に管理しやすいゲートウェイデバイスを提供する。
更に別の態様では、本発明は、MACテーブル、並びに複数の直接相互接続ポート間でのARP、ブロードキャスト、マルチキャスト及びエニーキャスト応答の協調を可能にするゲートウェイデバイスを提供する。
1つの実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する1又は2以上の従来型ネットワークポートの第1のセットを備え、かかるポートは、従来型ネットワークを形成するスイッチ又はデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する1又は2以上の直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続される。従来型ネットワークポートは、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの1又は2以上を備え、従来型ネットワーク内におけるスイッチポート又はルータポートに接続でき、その一方、直接相互接続ポートは、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの1又は2以上を備え、直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブに接続することができる。代替的に、直接相互接続ポートは各々、これらのポート自体の専用の直接相互接続の特定用途向け集積回路(ASIC)に接続すること、又は直接相互接続ポートは各々、1又は2以上の共有された特定用途向け集積回路(ASIC)に接続することができる。ブリッジング、スイッチング、又はルーティング機能は、ネットワークスイッチASIC又はネットワークコントローラASICによって実行することができる。これらのASICは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースラインを通じて送られる直接相互接続ノードとして機能することができる。それに加えて、他の実施形態では、直接相互接続ポートは、直接相互接続ネットワーク内のデバイスの代わりになることができ、直接相互接続ポートは、複数の直接相互接続ネットワークに接続されることさえ可能である。
別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、2つのポート、すなわち、直接相互接続ネットワークに接続できる直接相互接続ポートである第1のポートと、従来型ネットワークを形成するスイッチ又はデバイスに接続できる標準ネットワークポートである第2のポートとを備える。第1のポートは、MXCコネクタ、MTコネクタP、又はMTOコネクタのうちの1つを備えることができ、直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブに接続することができる。第2のポートは、SFP+コネクタ、QSFPコネクタ、又はQSFP+コネクタのうちの1つを備え、従来型ネットワーク内におけるスイッチポート又はルータポートに接続することができる。
更に別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する従来型ネットワークポートの第1のセットを備え、かかるポートは、第1の従来型ネットワークを形成するエンドデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続され、該直接相互接続ネットワークは、ネットワークトラフィックが、専用ネットワークゲートウェイデバイスから別の専用ネットワークゲートウェイデバイスにルーティングされることを可能にするバックボーンとして機能し、該別の専用ネットワークゲートウェイデバイスは、ポート毎に単一のリンクを有する従来型ネットワークポートの第1のセットを備え、かかるポートは、第2の従来型ネットワークを形成するエンドデバイスに接続され、本デバイスは更に、ポート毎に2又は3以上のリンクを有する直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続される。
更に別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイスを提供し、該デバイスは、ポート毎に単一のリンクを有する1又は2以上の従来型ネットワークポートの第1のセットを備え、かかるポートは、従来型ネットワークを形成するスイッチ又はデバイスに接続され、本デバイスは更に、ポート毎に1又は2以上のリンクを有する1又は2以上の直接相互接続ポートの第2のセットを備え、かかるポートは、直接相互接続ネットワークに接続され、本デバイスは更に、単一の直接相互接続ノードとして機能するように論理的に関連付けられた複数の直接相互接続ポートを備える。
別の実施形態では、本発明は、従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングを行うコンピュータ実装方法を提供し、該方法は、直接相互接続ネットワーク内の1又は2以上のノードとして機能する専用ゲートウェイデバイスを従来型ネットワーク及び直接相互接続ネットワークに接続するステップと、該ゲートウェイデバイスを用いて、ネットワークトラフィックのヘッダ又はコンテンツに基づいて従来型ネットワークと直接相互接続ネットワークとの間で該ネットワークトラフィックを転送するステップと、を含む。
更に別の実施形態では、本発明は、2以上のゲートウェイデバイスによって、従来型ネットワークに位置するリソースがアクセス可能である場合に、どのゲートウェイデバイスがリソースへのアクセスできるようにすべきかを調整するコンピュータ実装方法を提供し、本方法は、(i)従来型ネットワークに位置するリソースへのアクセスを要求するARP、ブロードキャスト、マルチキャスト、又はエニーキャストトラフィックを、各々が該リソースへのアクセスを提供できる2以上のゲートウェイデバイスに1又は2以上のホップを介してリンクされた直接相互接続ポートで受信するステップと、(ii)リソースへのアクセスを可能にすべき2以上のゲートウェイデバイスから最適なゲートウェイデバイスポートを計算するステップと、(iii)トラフィックと、直接相互接続ノードと、該計算された最適ゲートウェイデバイスポートとの間の関連付け情報を生成するステップと、(iv)該関連付け情報を2以上のゲートウェイデバイスの各々に伝達して、計算された最適ゲートウェイデバイスポートがリソースにアクセスできるようにすることを保証するステップと、を含む。リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップは、2以上のゲートウェイデバイスポートのうちのどれが、直接相互接続ポートに最も近いかを判定するステップを含むこと、又は合意アルゴリズムを使用してトラフィックの整合性を保証するステップを含むことができる。関連付け情報を伝達するステップは、専用の又は共有された調整バスによって処理することができる。
次に、本発明の実施形態について添付図面を参照して例として説明する。
本発明の1つの実施形態によるゲートウェイデバイスの高水準概要である。 いくつかのポートが従来型ネットワークコネクタに接続され、他のポートが、それ自体の専用直接相互接続ASICに接続された状態で従来型ネットワークスイッチASICを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。 各直接相互接続ASICが、2以上の直接相互接続ポートに接続され、2以上の従来型ネットワークスイッチASICポートに接続できる場合の本発明の1つの実施形態によるゲートウェイデバイス(図2に示されているものに関連)の概要である。 従来型ネットワークスイッチASICの機能と1又は2以上の直接相互接続ASICの機能とを組み合わせた単一のスイッチ及び直接相互接続ASICを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。 従来型ネットワークポート及び直接相互接続ポートを含むホストインタフェースカードを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。 直接相互接続ASIC及び従来型ネットワークコントローラASICの機能が、単一の直接相互接続及び従来型ASICに組み合わされたホストインタフェースカードを備える、本発明の1つの実施形態によるゲートウェイデバイスの概要である。 直接相互接続ポートが、ポート毎に1又は2以上のリンクを含み、ゲートウェイデバイスによってグループに組み合わされて、各グループが、直接相互接続ネットワーク内の単一のノードとして機能するように、ゲートウェイデバイスによって論理的に関連付けられるようになる場合の、本発明の1つの実施形態によるゲートウェイデバイスの概要である。 直接相互接続ポートが受動パッチパネル/ハブに接続された場合の本発明の1つの実施形態によるゲートウェイデバイスの概要である。 直接相互接続ポートが直接相互接続トポロジ内のサーバに取って代わる場合の本発明の1つの実施形態によるゲートウェイデバイスの概要である。 直接相互接続ポートのリンクが異なるノードに接続される場合の、図4に示されている実施形態を示す。 ゲートウェイ上の直接相互接続ポートが異なる直接相互接続ネットワークにリンクされて、複数の直接相互接続ネットワーク間のブリッジング、スイッチング、又はルーティングが可能になる場合の、本発明の1つの実施形態の概要である。 直接相互接続ネットワーク内のノードの全部又は大部分が、ゲートウェイポートで構成され、他のデバイスの全部又は大部分が、1又は2以上のゲートウェイに直接接続された場合の本発明の1つの実施形態の概要である。 直接相互接続ネットワークにおいて各デバイスから最も近いゲートウェイポートまでの平均距離(ホップでの)をどのようにして最小にするかについての例を提示する。 どの直接相互接続ポートが、同じ直接相互接続ネットワーク内の2以上のポートで受信されたARP要求に応答すべきかを、ゲートウェイがどのようにして調整できるかについての例を提示する。 調整機能が、直接相互接続ASICにわたって分散され、各直接相互接続ASICが、調整情報及び決定情報を伝達するのに使用される調整バスに接続された場合の調整機構(図8による)の一実施形態の例を提示する。 2以上のゲートウェイが、同じトーラスに接続されている場合に、ゲートウェイが、トーラスのトポロジについてのゲートウェイの情報、並びにARP、ブロードキャスト、マルチキャスト、及びエニーキャストトラフィックへの応答をどのようにして調整できるかを説明する論理ツリーの1つの実施形態を提示する。 中間ゲートウェイノードが、パケットを別のゲートウェイノードにルーティングするのではなく、どのようにしてパケットを処理できるかについての例を提示する。 直接相互接続ASICの好ましい実施形態の動作を説明する。 直接相互接続ASICの好ましい実施形態の動作を説明する。
本発明は、従来型ネットワークと直接相互接続ネットワークとの間のブリッジング、スイッチング、又はルーティングが可能な専用デバイス、すなわち、ゲートウェイデバイスを提供する。かかる専用デバイスを使用することにより、直接相互接続ノード上のリソースは、直接相互接続ネットワークと従来型ネットワークとの間のブリッジング、スイッチング、又はルーティングによって負担を受ける必要がなくなり、それによって、I/O性能への影響が最小になる。それに加えて、本ゲートウェイデバイスは、従来技術のゲートウェイノード使用とは対照的に、ネットワーク管理システムによって管理可能な非常に管理しやすいデバイスである。更に、本発明のゲートウェイデバイスは、MACテーブル、並びに複数の直接相互接続ポート間でのARP、ブロードキャスト、マルチキャスト及びエニーキャスト応答の協調を可能にする。
図1は、ポートの2つのセットを含む、本発明の1つの実施形態によるゲートウェイデバイス50の高水準概要を示している。ポートの第1のセット(この例では、左端の12個のポート)は、ポート毎に単一のリンク(例えば、SFP+、QSFP、QSFP+コネクタ)を有する標準の従来型ネットワークポート100であり、これらのポートは、従来型ネットワークを形成する既存のスイッチ及び/又はデバイスに接続される。例えば、Closトポロジ(多段回路交換ネットワーク)では、これらのポート100は、スパイン(spine)ポート又はスーパースパインポートに接続される可能性が最も高い。ポートの第2のセット(右端の12個のポート)は、ポート毎に多数(2又は3以上)のリンク(例えば、MXC/MTP/MTOコネクタ)を有する直接相互接続ポート102である。例えば、PCT特許出願公開第WO 2015/027320 A1号において開示されているものと同様の受動パッチパネル/ハブ60が、直接相互接続トポロジをサポートするのに使用される場合には、直接相互接続ポート102は、受動パッチパネル/ハブ60に接続される(図3を参照)。ゲートウェイデバイス50は、1ラックユニット(RU)ラックマウント型デバイス、又は更に、ラックスペースが効率的に節約される1/2RU(又は、それ以外の場合には、必要に応じて)の形態のものであり得る。図2は、従来型ネットワークスイッチ特定用途向け集積回路(ASIC)106からなる実施形態を示しており、従来型ネットワークポート100の第1のセットは各々、従来型ネットワークコネクタに接続され、直接相互接続ポート102の第2のセットは各々、それ自体の専用直接相互接続ASIC104に接続される。これらの専用直接相互接続ASIC104は、好ましくは各々、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースライン(例えば、100Gbpsイーサネット)を通じて送られる直接相互接続ノードとして機能することができる。スイッチASIC106のポートと直接相互接続ASIC104のポートとの間の接続は、100GBase-KR4、100GBase-KP4、40GBase-KR4、25GBase-KR、10GBase-KR、又は任意の他の同様の規格などの任意の標準コンポーネント相互接続を使用して実装することができる。
従来型ネットワークスイッチASIC106は、そのポートを介して到達可能なデバイスの学習と、適切な出口ポートを介した受信トラフィックの送信と、ネットワークフィルタリングと、トラフィック検査と、典型的にレイヤ2、レイヤ3及びレイヤ4、並びに上記のネットワークスイッチ、ルータ及びブリッジに見つけられる他の機能とを含む標準のネットワークトラフィック転送機能を含む。転送の決定は、限定されるものではないが、送信元及び送信先レイヤ2(MAC)アドレス、送信元ポートと、送信元及び送信先レイヤ3(IPv4、IPv6など)アドレスと、送信元及び送信先レイヤ4ポートと、レイヤ5及び上記のヘッダ及びデータペイロードとを含む1又は2以上の因子に基づくことができる。
スイッチASIC106の標準ポートを介して到達可能な最終送信先を有し、直接相互接続ネットワークから直接相互接続ASIC104で受信されるネットワークトラフィックは、直接相互接続ASIC104からスイッチASIC106に送られ、このスイッチASIC106において、スイッチASIC106標準トラフィック転送機能が、適切な標準ポートを介してトラフィックを送信する。
同様に、直接相互接続ASIC104を介して到達可能な最終送信先を有し、標準ポートからスイッチASIC106で受信されるネットワークトラフィックは、スイッチASIC106によって直接相互接続ASIC104に転送される。
別の実施形態(図示せず)では、あらゆる可能性のある実施形態に適用可能なものとして、スイッチASIC106(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行できる任意の他のデバイスに置き換えることができることが理解されるであろう。
別の実施形態(図示せず)において、あらゆる可能性のある実施形態に適用可能なものとして、直接相互接続ASIC104(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
図2bは、各直接相互接続ASIC104が、1又は2以上の直接相互接続ポート102に接続され、1又は2以上の従来型ネットワークスイッチASIC106ポートに接続できる場合の別の実施形態を示している。
図2cは、単一のスイッチ及び直接相互接続ASIC105が、従来型ネットワークスイッチASIC106の機能と1又は2以上の直接相互接続ASIC104の機能とを組み合わせる場合の別の実施形態を示している。前と同様に、単一のスイッチ及び直接相互接続ASIC105(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行すること、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
図2dは、従来型ネットワークポート及び直接相互接続ポートを含むホストインタフェースカード110の形態でのゲートウェイデバイスの別の実施形態を示している。ホストインタフェースカード110は、PCIe、Gen-Z、又はCCIXなどの通信バス経由でホストデバイスに接続されるように設計される。ホストデバイスは、サーバ、コンピュータ、ハードドライブ、ソリッドステートドライブ、ドライブキャビネット、又はデータを送受信できる任意の他のデバイスとすることができる。従来型ネットワークポートは、標準のネットワークコントローラASIC108(或いは、同様に、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行できる任意の他のデバイスなど)に接続され、直接相互接続ポートは、直接相互接続ASIC104に接続される。また、直接相互接続ASIC104は、ネットワークコントローラASIC108にも接続される。この形態では、ネットワークコントローラSIC108は、ホストによる介入なしに従来型ネットワークと直接相互接続ネットワークとの間でトラフィックを切り替えることができることになる。
図2eは、直接相互接続ASIC104及びネットワーク制御ASIC108の機能が、単一の直接相互接続及び従来型ASIC107に組み合わされた別のホストインタフェースカード111の実施形態を示している。前と同様に、単一の直接相互接続及び従来型ASIC107(及び本明細書で説明する全ての類似のASIC)は、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送を実行すること、又は直接相互接続ネットワーク内のノードとして機能を果たすことができる任意の他のデバイスに置き換えることができることが理解されるであろう。
図2fは、直接相互接続ポート102が、ポート毎に1又は2以上のリンクを含み、ゲートウェイデバイス50によってグループ55に組み合わされた場合の別の実施形態を示している。各グループ55は、直接相互接続ネットワーク内の単一のノードとして機能するように、ゲートウェイデバイス50によって論理的に関連付けられる。
図4に示されているように、直接相互接続ポート102及びグループ55は各々、直接相互接続トポロジ内のデバイスの代わりになる。
更に別の実施形態では、受動パッチパネル/ハブ60が、直接相互接続で利用されない場合に、各ゲートウェイポート(すなわち、直接相互接続ポート102)の個々のリンクは、直接相互接続の一部分であるデバイスに接続することができる。この点において、図4bは、直接相互接続ポート102のうちの1つのリンクが、直接相互接続ネットワーク内の隣接ノードに個別に接続される場合の実施形態を示している。図4bでは、直接相互接続は、2次元トーラスの形を取り、直接相互接続ポート102を構成する4つのリンクは、1、2、3、及び4と番号付けされている。2次元トーラスが形成されるように、リンク1はデバイスAに接続され、リンク2はデバイスBに接続され、リンク3はデバイスCに接続され、リンク4はデバイスDに接続される。同様に、他のトポロジの場合、直接相互接続ポート102の各リンクは、そのトポロジに必要とされる適切な隣接デバイスに接続される必要がある。
図5に示されている更に別の実施形態では、ゲートウェイデバイス50はまた、複数の直接相互接続ネットワーク間のブリッジング、スイッチング、又はルーティングを行うことに使用することもできる。この場合、ゲートウェイデバイス50上の直接相互接続ポート102は、異なる直接相互接続ネットワーク(図5にA及びBとして図示)の間で分割されることになる。直接相互接続ネットワークA内のデバイスの全部が、直接相互接続ネットワークAからゲートウェイデバイス50を介して到達可能であり、逆の場合も同様である。提供される例では、直接相互接続ネットワークA内のデバイスから直接相互接続ネットワークB内のデバイス宛てのトラフィックは、最初に、直接相互接続ネットワークAを通過して、ゲートウェイデバイス50上のA4として示されている直接相互接続ポート102に向かう。次に、ゲートウェイデバイス50は、このトラフィックを、B2として示されている直接相互接続ポート102を介して転送し、次に、このトラフィックは、直接相互接続ネットワークBを介して送信先ノードに転送される。
本発明の更に別の実施形態では、ゲートウェイは、アクセススイッチとして使用でき、直接相互接続ネットワークは、バックボーンを形成する(図6を参照)。この場合、直接相互接続ネットワークのノードの全部又は大部分が、ゲートウェイポートから構成され、他のデバイスの全部又は大部分は、ゲートウェイデバイス50の従来型ネットワークポート100に直接接続されることになる。図6に提供される例では、デバイスグループAからデバイスグループB宛てのトラフィックは、最初に、ゲートウェイデバイス50Aに転送される。ゲートウェイ50Aの転送機能は、送信先デバイスが直接相互接続ネットワークを介して到達可能であることを認識して、ゲートウェイデバイス50Aの直接相互接続ポート102のうちの1つを介してトラフィックを転送する。次に、直接相互接続ネットワークが、ゲートウェイデバイス50Bの直接相互接続ポートのうちの1つにトラフィックを転送する。ゲートウェイ50Bの転送機能は、送信先デバイスが、その標準ネットワークポートのうちの1つを介して到達可能であることを認識して、トラフィックを適切に転送する。
図7は、単一の直接相互接続展開において、I/Oトラフィック効率が最大になるように、直接相互接続ネットワークにおいて各ゲートウェイデバイス50から最も近いゲートウェイポートまでの平均距離(ホップ数)を最小にするために直接相互接続ポートをどのようにして選択できるかについての例を提示する。図7のように番号付けされたノードを有する4×4 2Dトーラスでは、ゲートウェイをノード1、6、11、及び16として機能させることは、直接相互接続ネットワーク内の他のノードまでの距離を最小にする。しかしながら、当業者であれば、ノードのサブセットが、平均よりも大量のI/Oを生成する傾向がある場合に、ゲートウェイノードの展開はまた、これらのより大量のI/Oノードに近づくように偏る場合があることが理解されるであろう。これらのI/Oノードに最適な位置を決定するのに使用できる複数のアルゴリズムが知られている(例えば、Bae、M.、Bose、B.による、ロスアラミトス(1996年)、Proc. IEEE International Parallel Processing Symposium(IEEE並列処理国際シンポジウム会議記録)、327頁から331頁、IEEE Computer Society Press(IEEEコンピュータソサエティプレス)における「Resource Placement in Torus-Based Networks(トーラスベースのネットワーク内のリソース配置)」と、DiSiow、David A他による、米国、AK、Fairbanks(フェアバンクス)、N.p.、2011.Print.Proceedings of the Cray User Group conference(クレイユーザグループ会議の2011年出版会議記録)(CUG 2011)における「I/O Congestion Avoidance via Routing and Objeoi Placement(ルーティング及びオブジェクト配置によるI/O輻輳回避)」と、Almohammad、B.、Bose、 B.による、ワシントンDC(1998年)、IEEE Computer Society(IEEEコンピュータソサエティ)、Proc. IPPS 1998 Proceedings of the 12th International Parallel Processing Symposium on International Parallel Processing Symposium(IPPS 1998年並列処理国際シンポジウムでの第12回並列処理国際シンポジウムの会議記録)、431頁における「Resource Placements in 2D Tori(2Dトーラスにおけるリソース配置)」と、Dillow、David A.他による、2011年 IEEE 30th International(第30回IEEE国際会議)、Conference Proceedings of the IEEE International Performance, Computing, and Communications Conference(IEEE性能、計算及び通信国際会議(IPCCC)の会議議事録における「Enhancing I/O Throughput via Efficient Routing and Placement for Large-scale Parallel File Systems(大規模並列ファイルシステム用の効率的ルーティング及び配置によるI/Oスループット向上)」と、Ezell、M.他による、2014年5月、Proceedings of the Cray User Group Conference(クレイユーザグループ(CUG)会議の会議記録)における「I/O Router Placement and Fine-Grained Routing on Titan to Support Spider II(Spider IIをサポートするためのTitan上のI/Oルータ配置及びきめの細かいルーティング)」と、Babatunde、A他による、2006年1月、Texas A&M University(テキサスA&M大学)、Department of Computer Science(コンピュータサイエンスの学科)における「I/O Node Placement for Performance and Reliability in Torus Networks(トーラスネットワークにおける性能及び信頼性を高めるI/Oノード配置)」と、を参照)。
好ましい実施形態では、直接相互接続ポート102は、標準の直接相互接続ポートとして機能し、直接相互接続ネットワークに残っているトラフィックを自律的に転送する(すなわち、FLIT(フリット)を転送する)。また、直接相互接続ポートは、直接相互接続ネットワークにないデバイス宛てのトラフィックのネットワークパケットにFLITを再結合する(分散直接相互接続ネットワークにおいてパケットをルーティングする最適な方法についてPCT特許出願公開第WO 2015/120539 A1号を参照)。また、ゲートウェイデバイス50は、好ましくは、従来型ネットワークポート100及び直接相互接続ポート102の各々との間でネットワークパケットを送受信する能力を有し、更に、レイヤ2、3に基づいて又は上記のようにこのトラフィックを解釈してそれを転送することができる必要がある。
好ましい実施形態では、ネットワーク管理システムがゲートウェイデバイス50を管理することを可能にするための標準のノースバンドネットワーク管理インタフェース(例えば、CLI、OpenFlow、SNMP、RESTなど)が公開される。
1つの実施形態では、複数のゲートウェイポートが同じ直接相互接続に接続される場合には、所与のフローからの全てのパケットは、好ましくは、順序どおりのパケット配信を保証することが助長されるように同じゲートウェイポートから出るべきである。
ゲートウェイデバイス50は、好ましくは、同じ直接相互接続ネットワークに接続された直接相互接続ポート102間のMAC転送テーブルを集約するように構成される必要がある(すなわち、直接相互接続ポートが、VLAN/MACアドレス/node_idタプルを認識する場合に、このタプルは、好ましくは、同じ直接相互接続ネットワークに接続された他の直接相互接続ポート102と共有される必要がある)。
好ましい実施形態では、ARP要求が、同じ直接相互接続ネットワークに接続された直接相互接続ポート102のうちの1又は2以上で受信された場合に、単一の応答のみが送信されることが保証されるように、ゲートウェイ50は、どの直接相互接続ポートが応答すべきかについての決定を調整すべきである(例えば、図8を参照)。このことは、例えば、ARP要求の送信元に最も近い直接相互接続ポートを選択することにより、ARPを受信する最初の直接相互接続ポートを選択することにより、ラウンドロビン選択機構により、ARP要求の一部分(IPアドレス、送信元MACなど)のハッシュにより、又は当業者に公知の別のアルゴリズムにより行うことができる。図8bは、調整機能が、直接相互接続ASIC104にわたって分散され、各直接相互接続ASIC104が、調整情報及び決定情報を伝達するのに使用される調整バス112に接続されたこの調整機構の1つの実施形態を示している。別の実施形態では、この調整機能は、専用調整ASICに集中することができ、各直接相互接続ASIC104は、専用の又は共有された調整バス112を介して調整ASICに接続される。
2以上のゲートウェイが、同じトーラスに接続されている場合には、これらのゲートウェイデバイス50は、好ましくは、前述の単一のゲートウェイの場合と同様の方法でトーラスのトポロジについてのゲートウェイデバイスの情報及びARP要求への応答を調整すべきである(このような調整に関する論理ツリーについては図9を参照されたい)。1つの実施形態では、ゲートウェイは、ブロードキャストプロトコルを介して互いに発見することができる。別の実施形態では、ゲートウェイは、他のゲートウェイの位置を認識するように構成することができる。更に別の実施形態では、Raft(ラフト)などの合意アルゴリズムが、ゲートウェイの調整、及びトラフィックとゲートウェイ/ポートとの関連付けの整合性を保証するのに使用することができる(例えば、Ongaro、D.、Ousterhout、J.による、2014年6月19日、PA、Philadelphia(フィラデルフィア)、2014 USENIX Annual Technical Conference(2014 USENIX年次技術会議)における「In Search of an Understandable Consensus Algorithm(Extended Version)(理解可能な合意アルゴリズム(拡張版)の検索において)」と、Woos、D.他による、2016年1月、日本、Certified Programs and Proofs(認証されたプログラム及び証明:CPP)における「Planning for Change in a Formal Verification of the Raft Consensus Protocol(Raft合意プロトコルの形式検証における変化計画)」と、を参照)。
一般に、トーラスノードが、1又は2以上のゲートウェイデバイス50を介してアクセス可能なリソースと通信することを望む場合には常に、ゲートウェイは、好ましくは、このリソースにアクセスできるようにするのにどのゲートウェイポートを選択するかを上述したARPの例と同様の方法で調整すべきである。これについての例は、エニーキャスト、ブロードキャスト及びマルチキャストトラフィックと、ノード及びサービス探索プロトコルと、IPv6近隣探索とを含む。
更なる考慮事項として、多くの場合、非最小ルーティングが直接相互接続ネットワーク内で使用されることに留意することが重要である。直接相互接続ネットワーク内のゲートウェイは、トポロジ内の複数の位置にゲートウェイポートを有するので、1つのゲートウェイポート宛てのトラフィックが、最初に他のゲートウェイポートのうちの1つを通過する可能性がある。従って、トラフィックがより離れたゲートウェイポートに通過することを可能にするのではなく、単一の最初のゲートウェイポートにトラフィックを処理させることによって効率を高めることが望ましい。このことについての例が、図10に提示されており、この図において、ノード5が、ノード1にトラフィックを送るが、非最小ルーティングにより、パケットは、ノード6を通過することになる。1つの実施形態では、効率を高めるために、ノード6に位置するポートを有するゲートウェイは、パケットが別のゲートウェイポート宛てであることを認識して、ノード2経由で直接相互接続ネットワークを介してパケットを転送するのではなく、このパケットが、あたかもノード6宛てであるようにパケットを処理する。
上述のように、直接相互接続ASIC104は、スイッチASIC106と直接相互接続ネットワークとの間の接続性を提供する。当業者が本発明のネットワークゲートウェイデバイスを作製してそれを動作させることができることを保証するために、図11及び図12は、直接相互接続ASIC104の好ましい実施形態の動作を説明する。この動作はまた、必要に応じて任意の修正を加えて、必要に応じて、ASIC105、107、及び108を含む本発明の範囲内の他のASICにも適用可能である。
当該技術分野で公知のように、スイッチASIC106は、イーサネットフレームを送受信する。図11は、スイッチASIC106によって生成されたイーサネットフレーム200が、直接相互接続ASIC104によってどのようにして処理されるかを示している。MACアドレスデータベース201は、イーサネットMACアドレスのリストと、各イーサネットMACアドレスに関連する直接相互接続ノードとを含む。スイッチASIC106から受信したイーサネットフレーム200が検査されて、送信元及び送信先MACアドレスが、このフレームのヘッダから取り出される。これらのMACアドレスは、MACアドレスデータベース201に対するインデックスとして使用される。イーサネットフレーム301の送信元MACアドレスは、現在のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース201において生成又は更新される。
イーサネットフレーム200の送信先MACアドレスが、MACアドレスデータベース201に存在する場合には、このMACアドレスに関連するノード番号202が、MACアドレスデータベース201から取り出される。次に、ノード番号202は、ソースルートデータベース206へのインデックスとして使用され、ノード番号202に関連するソースルート203が、ソースルートデータベース206から取り出される。当技術分野で公知のように、ソースルートデータベースは、ネットワーク送信先のリストと、ネットワークを通って各送信先に到達するまでの1又は2以上の経路とを含む。ソースルートデータベースは、手動で投入すること、又は公知の自動トポロジ探索及び経路計算アルゴリズムに依拠することができる。次に、イーサネットフレーム200が、FLIT204に変換される。FLITは、直接相互接続ネットワークで使用される特殊なフレームタイプであり、固定サイズ又は可変サイズのいずれかのものとすることができる。好ましい実施形態では、FLITは、固定サイズのものである。別の実施形態では、FLITは、最小サイズ及び最大サイズ内の可変サイズのものである。更に別の実施形態では、FLITは、イーサネットフレーム200がFLITペイロードに正確に適合するようにサイズ設定される。
イーサネットフレーム200が、単一のFLITのペイロードよりも大きい場合には、複数のFLIT204が生成されることになる。イーサネットフレーム200が、単一のFLITのペイロードに収まる場合には、単一のFLITが生成されることになる。次に、ソースルート203が、現在のノードのノード番号とともに、FLIT204の最初のもののヘッダに挿入される。次に、FLIT204は、ソースルート203で指定された出口ポート205から送信される。
イーサネットフレーム200の送信先MACアドレスが、MACアドレスデータベース201に存在しない場合、又はイーサネットフレーム200の送信先MACアドレスが、このイーサネットフレームがブロードキャストイーサネットパケットであることを示す場合には、イーサネットフレーム200は、上述の場合のようにFLIT204に変換されるが、ソースルートは含まれない。FLIT204が生成されると、最初のFLITのヘッダ内のフラグは、これらのFLITが直接相互接続ネットワーク内のあらゆるノードにブロードキャストされる必要があるであることを示すように設定される。また、生存時間(TTL)値が、最初のFLITのヘッダ内に設定される。TTLは、直接相互接続ネットワークを通ってブロードキャストFLITを転送できる最大回数を定める。1つの実施形態では、エニーキャスト及びマルチキャストイーサネットフレームは、上記のように、これらのフレームがあたかもブロードキャストフレームであるかのように処理される。
図12は、直接相互接続ASIC104の好ましい実施形態において、直接相互接続ASIC104が、どのようにFLIT204を処理するかを説明している。直接相互接続ASIC104は、直接相互接続ネットワーク301からFLIT204を受信し、これらのFLITのうちの最初のもののヘッダが検査されて、ブロードキャストフラグが設定されているか否かが調べられる。ブロードキャストフラグが設定されていない場合には、ソースルート203が、最初のFLITから取り出され、このソースルートが、現在のノードがFLIT204の送信先ノードであることを示すか否かが判定される。別の実施形態では、FLITは、送信先ノードのノード番号を含み、このノード番号は、現在のノードがFLIT204の送信先ノードであるか否かを判定するのに使用されるノード番号である。現在のノードが、FLIT204の送信先ノードである場合には、FLIT204は、組み合わされてイーサネットフレーム301が形成される。イーサネットフレーム301の送信元MACアドレスは、最初のFLITのヘッダ内のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース201において生成又は更新される。次に、イーサネットフレーム301は、スイッチASIC106に送信される。
ノードが送信先ノードでないと判定された場合には、ソースルートが、FLIT204に対する出口ポート302を決定するのに使用される。次に、FLIT204が出口ポート302から送信される。
ブロードキャストフラグが、最初のFLITのヘッダ内に設定されている場合には、FLIT204が組み合わされて、イーサネットフレーム301が形成される。イーサネットフレーム301の送信元MACアドレスは、最初のFLITのヘッダ内のノード番号と組み合わされて、このノード番号と送信元MACアドレスとの間の関連付け情報が、MACアドレスデータベース301において生成又は更新される。次に、イーサネットフレーム301は、スイッチASIC106に送信される。
次に、最初のFLITのヘッダ内のTTLが1だけデクリメントされる。ここで、TTLがゼロに等しい場合には、FLIT204は破棄される。TTLがゼロより大きい場合には、FLIT204は、最初にこのFLIT204を受信した入口ポートを除く全ての出口ポートから送信される。
直接相互接続ASIC104の他の実施形態では、ソースルーティングが使用されない場合がある。1つの実施形態では、各ノードは、イーサネットフレーム200の送信先MACアドレスを使用して、ローカルのネクストホップルートルックアップを実行する。別の実施形態では、各ノードは、FLITヘッダ内の送信先ノード情報を使用して、ローカルのネクストホップルートルックアップを実行する。
当業者であれば、直接相互接続104及びスイッチASIC106の他の実施形態が、イーサネット以外のプロトコルを用いて動作するように設計できることは明らかであろう。1つの実施形態では、これらの要素は、Gen Zを用いて動作するように設計される。この場合、直接相互接続104は、イーサネットフレームの代わりにGen Z Core64パケットを受信することを予期する。Gen Z GCID(グローバルコンポーネントID)が、イーサネットMACアドレスの代わりに使用され、直接相互接続ノード番号に関連付けられる。
本発明の特定の実施形態について説明したが、特許請求の範囲内で実施形態の変更及び修正を行うことができることは当業者には明らかであろう。
100 従来型ネットワークポート
102 直接相互接続ポート
50A デバイスグループA
50B デバイスグループB

Claims (12)

  1. 従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、又はルーティングが可能な専用ネットワークゲートウェイデバイス(50)であって、
    ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポート(100)の第1のセットであって、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの少なくとも1つを備える、少なくとも1つの従来型ネットワークポート(100)の第1のセットと、
    ポート毎に少なくとも2つのリンクを有する少なくとも1つの直接相互接続ポート(102)の第2のセットであって、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの少なくとも1つを備える、少なくとも1つの直接相互接続ポート(102)の第2のセットと、
    を備え、
    少なくとも1つの従来型ネットワークポート(100)の前記第1のセット及び少なくとも1つの直接相互接続ポート(102)の前記第2のセットが一緒になって、前記専用ネットワークゲートウェイデバイスが、前記従来型ネットワークと前記直接相互接続ネットワークとの間のネットワークトラフィックをブリッジング、スイッチング、又はルーティングすることができる手段を提供し、
    前記ゲートウェイデバイス(50)は、前記少なくとも1つの直接相互接続ポート(102)のうちの1つのみが所与のフローのためのネットワークトラフィックを処理するように、前記直接相互接続ネットワーク内の1又は2以上の直接相互接続ノードを、前記少なくとも1つの直接相互接続ポート(102)の各々に割り当てる調整機能をさらに備える、デバイス(50)。
  2. 前記少なくとも1つの従来型ネットワークポート(100)は、前記従来型ネットワーク内のスイッチポート及びルータポートのうちの少なくとも1つに接続される、請求項1に記載のデバイス(50)。
  3. 前記少なくとも1つの従来型ネットワークポート(100)の第1のセットは各々、少なくとも従来型ネットワークスイッチ特定用途向け集積回路(ASIC)(106)、ネットワークコントローラASIC、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送機能を実行できる他のデバイスを介して、前記従来型ネットワークに接続される、請求項1に記載のデバイス(50)。
  4. 前記少なくとも1つの直接相互接続ポート(102)の第2のセットは各々、少なくとも直接相互接続の特定用途向け集積回路(ASIC)(104)、フィールドプログラマブルゲートアレイ(FPGA)、汎用プロセッサ、ネットワークプロセッサ、又はネットワークトラフィック転送機能を実行できる他のデバイスに接続される、請求項1又は3に記載のデバイス(50)。
  5. 前記他のデバイスは、前記直接相互接続ネットワークの実装で使用される受動パッチパネル/ハブ(60)である、請求項4に記載のデバイス(50)。
  6. 前記ASIC(104)、前記FPGA、前記汎用プロセッサ、及び他のデバイスのうちの少なくとも1つは、ローカルに送信先/送信元指定されたトラフィックが従来型ネットワークインタフェースラインを通じて送られる直接相互接続ノードとして機能することができる、請求項4に記載のデバイス(50)。
  7. 前記少なくとも1つの直接相互接続ポートの第2のセットは、前記直接相互接続ネットワーク内のデバイスの代わりになる、請求項1に記載のデバイス(50)。
  8. 前記少なくとも1つの直接相互接続ポートの第2のセットは、複数の直接相互接続ネットワークに接続される、請求項1に記載のデバイス(50)。
  9. 従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング及びルーティングのうちの少なくとも1つのための専用ネットワークゲートウェイデバイス(50)であって、
    従来型ネットワークを形成するエンドデバイスに接続され、ポート毎に単一のリンクを有する従来型ネットワークポート(100)の第1のセットと、
    前記直接相互接続ネットワークに接続され、ポート毎に2又は3以上のリンクを有する直接相互接続ポート(102)の第2のセットと、
    を備え、前記直接相互接続ネットワークは、ネットワークトラフィックが前記専用ネットワークゲートウェイデバイス(50)から別の専用ネットワークゲートウェイデバイス(50)にルーティングすることを可能にするバックボーンとして機能し、前記別の専用ネットワークゲートウェイデバイスは、
    第2の従来型ネットワークを形成するエンドデバイスに接続され、ポート毎に単一のリンクを有する前記従来型ネットワークポート(100)の第1のセットと、
    前記直接相互接続ネットワークに接続され、ポート毎に2又は3以上のリンクを有する前記直接相互接続ポート(102)の第2のセットと、
    を備え、
    前記ゲートウェイデバイス(50)及び別のゲートウェイデバイスは、前記ゲートウェイデバイス(50)及び前記別のゲートウェイデバイスの前記少なくとも1つの直接相互接続ポート(102)のうちの1つのみが所与のフローのためのネットワークトラフィックを処理するように、前記直接相互接続ネットワーク内の1又は2以上の直接相互接続ノードを、前記ゲートウェイデバイス及び前記別のゲートウェイデバイスの前記少なくとも1つの直接相互接続ポート(102)の各々に割り当てる調整機能をさらに備える、ことを特徴とするデバイス(50)。
  10. 従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングのうちの少なくとも1つのための専用ネットワークゲートウェイデバイス(50)であって、
    従来型ネットワークを形成するスイッチ及びデバイスのうちの少なくとも1つに接続され、ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポート(100)の第1のセットと、
    前記ゲートウェイデバイスによってグループにまとめられた、ポート毎に1又は2以上のリンクを有する少なくとも1つの直接相互接続ポート(102)の第2のセットと、
    前記ゲートウェイデバイスによって単一の直接相互接続ノードとして機能するように論理的に関連付けられた複数の直接相互接続ポートと、
    を備え、
    前記ポート(100,102)の前記第1のセット及び前記第2のセットが一緒になって、前記専用ネットワークゲートウェイデバイスが、前記従来型ネットワークと前記直接相互接続ネットワークとの間のネットワークトラフィックをブリッジング、スイッチング、又はルーティングできる手段を提供し、
    前記ゲートウェイデバイス(50)は、前記少なくとも1つの直接相互接続ポート(102)のうちの1つのみが所与のフローのためのネットワークトラフィックを処理するように、前記直接相互接続ネットワーク内の1又は2以上の直接相互接続ノードを、前記少なくとも1つの論理的に関連付けられた直接相互接続ポート(102)の各々に割り当てる調整機能をさらに備える、デバイス(50)。
  11. 従来型ネットワークと直接相互接続ネットワークとの間のネットワークトラフィックのブリッジング、スイッチング、及びルーティングのうちの少なくとも1つを行うコンピュータ実装方法であって、
    前記直接相互接続ネットワーク内の1又は2以上のノードとして機能する専用ネットワークゲートウェイデバイス(50)を前記従来型ネットワーク及び前記直接相互接続ネットワークに接続するステップと、
    前記ゲートウェイデバイス(50)を用いて、前記ネットワークトラフィックのヘッダ又はコンテンツに基づいて前記従来型ネットワークと前記直接相互接続ネットワークとの間で前記ネットワークトラフィックを転送するステップと、
    を含み、
    前記専用ネットワークゲートウェイデバイスは、
    ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポートの第1のセットであって、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの少なくとも1つを備える、少なくとも1つの従来型ネットワークポートの第1のセットと、
    ポート毎に少なくとも2つのリンクを有する少なくとも1つの直接相互接続ポートの第2のセットであって、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの少なくとも1つを備える、少なくとも1つの直接相互接続ポートの第2のセットと、
    を備え、
    ポートの前記第1のセット及び前記第2のセットは、共に、前記専用ネットワークゲートウェイデバイスが、前記従来型ネットワークと前記直接相互接続ネットワークとの間のネットワークトラフィックをブリッジング、スイッチング、又はルーティングすることができる手段を提供し、
    前記ゲートウェイデバイスは、前記少なくとも1つの直接相互接続ポートのうちの1つのみが所与のフローのためのネットワークトラフィックを処理するように、前記直接相互接続ネットワーク内の1又は2以上の直接相互接続ノードを、前記少なくとも1つの直接相互接続ポートの各々に割り当てる調整機能をさらに備える、コンピュータ実装方法。
  12. 2以上のゲートウェイデバイス(50)によって、従来型ネットワークに位置するリソースがアクセス可能である場合に、ゲートウェイデバイス(50)が前記リソースへのアクセスを提供することを調整するコンピュータ実装方法であって、
    ARP、ブロードキャスト、マルチキャスト、又はエニーキャストトラフィックを直接相互接続ポートで受信するステップであって、前記トラフィックが、前記従来型ネットワークに位置する前記リソースへのアクセスを要求し、前記直接相互接続ポートが、1又は2以上のホップを介して前記2以上のゲートウェイデバイスにリンクされ、前記ゲートウェイデバイスの各々が前記リソースへのアクセスを可能にすることができるステップと、
    前記2以上のゲートウェイデバイスから、前記リソースへのアクセスを可能にすべき最適なゲートウェイデバイスポートを計算するステップであって、前記2以上のゲートウェイデバイスのポートのうち、前記直接相互接続ポートに最も近いポートを判定すること、又は合意アルゴリズムを使用してトラフィックの整合性を保証することのいずれかを含む、ステップと、
    前記トラフィックと、前記直接相互接続ノードと、前記計算された最適なゲートウェイデバイスポートとの間の関連付け情報を生成するステップと、
    前記関連付け情報を前記2以上のゲートウェイデバイスの各々に伝達して、前記計算された最適ゲートウェイデバイスポートが専用又は共有された調整バスによって前記リソースにアクセスできるように確保するステップと、
    を含み
    前記専用ネットワークゲートウェイデバイスは、
    ポート毎に単一のリンクを有する少なくとも1つの従来型ネットワークポートの第1のセットであって、SFP+コネクタ、QSFPコネクタ、及びQSFP+コネクタのうちの少なくとも1つを備える、少なくとも1つの従来型ネットワークポートの第1のセットと、
    ポート毎に少なくとも2つのリンクを有する少なくとも1つの直接相互接続ポートの第2のセットであって、MXCコネクタ、MTPコネクタ、及びMTOコネクタのうちの少なくとも1つを備える、少なくとも1つの直接相互接続ポートの第2のセットと、
    を備え、
    ポートの前記第1のセット及び前記第2のセットは、共に、前記専用ネットワークゲートウェイデバイスが、前記従来型ネットワークと前記直接相互接続ネットワークとの間のネットワークトラフィックをブリッジング、スイッチング、又はルーティングすることができる手段を提供し、
    前記ゲートウェイデバイスは、前記少なくとも1つの直接相互接続ポートのうちの1つのみが所与のフローのためのネットワークトラフィックを処理するように、前記直接相互接続ネットワーク内の1又は2以上の直接相互接続ノードを、前記少なくとも1つの直接相互接続ポートの各々に割り当てる調整機能をさらに備える、コンピュータ実装方法。
JP2020520634A 2017-10-12 2018-10-12 直接相互接続ゲートウェイ Active JP7157151B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022117013A JP7357123B2 (ja) 2017-10-12 2022-07-22 直接相互接続ゲートウェイ

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2982147 2017-10-12
CA2982147A CA2982147A1 (en) 2017-10-12 2017-10-12 Direct interconnect gateway
PCT/IB2018/057945 WO2019073452A1 (en) 2017-10-12 2018-10-12 DIRECT INTERCONNECTION GATEWAY

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022117013A Division JP7357123B2 (ja) 2017-10-12 2022-07-22 直接相互接続ゲートウェイ

Publications (3)

Publication Number Publication Date
JP2020537439A JP2020537439A (ja) 2020-12-17
JP2020537439A5 JP2020537439A5 (ja) 2021-02-04
JP7157151B2 true JP7157151B2 (ja) 2022-10-19

Family

ID=66096696

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020520634A Active JP7157151B2 (ja) 2017-10-12 2018-10-12 直接相互接続ゲートウェイ
JP2022117013A Active JP7357123B2 (ja) 2017-10-12 2022-07-22 直接相互接続ゲートウェイ

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022117013A Active JP7357123B2 (ja) 2017-10-12 2022-07-22 直接相互接続ゲートウェイ

Country Status (11)

Country Link
US (2) US11398928B2 (ja)
EP (1) EP3679692A4 (ja)
JP (2) JP7157151B2 (ja)
KR (1) KR102304496B1 (ja)
CN (1) CN111201756A (ja)
AU (1) AU2018349364A1 (ja)
BR (1) BR112020005514A2 (ja)
CA (3) CA2982147A1 (ja)
IL (1) IL273716A (ja)
RU (1) RU2740035C1 (ja)
WO (1) WO2019073452A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11750531B2 (en) * 2019-01-17 2023-09-05 Ciena Corporation FPGA-based virtual fabric for data center computing
RU207676U1 (ru) * 2021-06-10 2021-11-11 Общество С Ограниченной Ответственностью "Эмзиор" Устройство коммутации и маршрутизации пакетов c процессором «эльбрус» и интерфейсами 100 gbe

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2659038Y (zh) 2003-12-09 2004-11-24 海信集团有限公司 一种嵌入式网络接口电路
JP2008005061A (ja) 2006-06-20 2008-01-10 Allied Telesis Holdings Kk 自動適応型sfpポート
JP2008112398A (ja) 2006-10-31 2008-05-15 Hitachi Ltd ストレージシステム及び通信帯域制御方法
US20090216920A1 (en) 2007-06-21 2009-08-27 Seamicro Corp. Dis-Aggregated and Distributed Data-Center Architecture Using a Direct Interconnect Fabric
JP2011193261A (ja) 2010-03-15 2011-09-29 Yamaha Corp 通信システム、スイッチングハブ、およびルータ
US20140270762A1 (en) 2013-03-15 2014-09-18 Plexxi Inc System and method for data center optical connection
JP2014183421A (ja) 2013-03-19 2014-09-29 Buffalo Inc ネットワーク中継装置および方法
US20150288449A1 (en) 2014-04-04 2015-10-08 Adc Telecommunications, Inc. Optical splitter
JP2016081285A (ja) 2014-10-16 2016-05-16 富士通株式会社 計算機システム,処理方法及びジョブ処理プログラム
JP2016532209A (ja) 2013-08-29 2016-10-13 ダン オプレア コンピュータネットワークにおける直接相互接続スイッチの配線及び成長を管理する方法及び装置
JP2017506049A (ja) 2014-02-13 2017-02-23 ロックポート ネットワークス インコーポレイテッド 分散型直接相互接続ネットワークにおけるパケットルーティング方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6857132B1 (en) * 2000-01-14 2005-02-15 Terayon Communication Systems, Inc. Head end multiplexer to select and transmit video-on-demand and other requested programs and services
US7307996B2 (en) * 2002-07-30 2007-12-11 Brocade Communications Systems, Inc. Infiniband router having an internal subnet architecture
US20050220090A1 (en) * 2004-03-31 2005-10-06 Kevin Loughran Routing architecture
MX2009011514A (es) * 2007-04-23 2009-11-09 Thomson Licensing Mecanismos para deteccion de falla y mitigacion en un dispositivo de pasarela.
CN104539640B (zh) 2009-02-13 2019-04-30 Adc长途电讯有限公司 管理的连接性设备、系统和方法
JP5299508B2 (ja) * 2009-05-11 2013-09-25 富士通株式会社 ノード装置および通信方法
JP4834167B1 (ja) * 2010-06-04 2011-12-14 株式会社エヌ・ティ・ティ・ドコモ 移動通信方法及び移動通信システム
BR112013017397B1 (pt) * 2011-01-06 2022-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Métodos de roteamento de dados de sinalização, nós de roteamento de sessão, sistema de comunicação, e, meio legível por computador
US9379976B2 (en) * 2013-03-13 2016-06-28 Brocade Communications Systems, Inc. FCoE VN—port to FC N—port operations in an ethernet fabric
US9989724B2 (en) * 2014-09-29 2018-06-05 Fiber Mountain, Inc. Data center network
RO131598A2 (ro) * 2015-06-19 2016-12-30 Ixia, A California Corporation Metode, sisteme şi suport citibil pe calculator pentru testarea fenomenului de microburst
AU2017325838B2 (en) * 2016-09-14 2020-11-05 Fiber Mountain, Inc. Intelligent fiber port management

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN2659038Y (zh) 2003-12-09 2004-11-24 海信集团有限公司 一种嵌入式网络接口电路
JP2008005061A (ja) 2006-06-20 2008-01-10 Allied Telesis Holdings Kk 自動適応型sfpポート
JP2008112398A (ja) 2006-10-31 2008-05-15 Hitachi Ltd ストレージシステム及び通信帯域制御方法
US20090216920A1 (en) 2007-06-21 2009-08-27 Seamicro Corp. Dis-Aggregated and Distributed Data-Center Architecture Using a Direct Interconnect Fabric
JP2011193261A (ja) 2010-03-15 2011-09-29 Yamaha Corp 通信システム、スイッチングハブ、およびルータ
US20140270762A1 (en) 2013-03-15 2014-09-18 Plexxi Inc System and method for data center optical connection
JP2014183421A (ja) 2013-03-19 2014-09-29 Buffalo Inc ネットワーク中継装置および方法
JP2016532209A (ja) 2013-08-29 2016-10-13 ダン オプレア コンピュータネットワークにおける直接相互接続スイッチの配線及び成長を管理する方法及び装置
JP2017506049A (ja) 2014-02-13 2017-02-23 ロックポート ネットワークス インコーポレイテッド 分散型直接相互接続ネットワークにおけるパケットルーティング方法
US20150288449A1 (en) 2014-04-04 2015-10-08 Adc Telecommunications, Inc. Optical splitter
JP2016081285A (ja) 2014-10-16 2016-05-16 富士通株式会社 計算機システム,処理方法及びジョブ処理プログラム

Also Published As

Publication number Publication date
CA3054893C (en) 2022-12-20
RU2740035C1 (ru) 2020-12-30
CA2982147A1 (en) 2019-04-12
BR112020005514A2 (pt) 2020-10-06
EP3679692A1 (en) 2020-07-15
WO2019073452A1 (en) 2019-04-18
JP2020537439A (ja) 2020-12-17
EP3679692A4 (en) 2021-06-23
IL273716A (en) 2020-05-31
KR102304496B1 (ko) 2021-09-23
CN111201756A (zh) 2020-05-26
US11398928B2 (en) 2022-07-26
JP7357123B2 (ja) 2023-10-05
AU2018349364A1 (en) 2020-04-02
US11924005B2 (en) 2024-03-05
KR20200059299A (ko) 2020-05-28
CA3054893A1 (en) 2019-04-18
US20200336337A1 (en) 2020-10-22
JP2022132603A (ja) 2022-09-08
US20220345333A1 (en) 2022-10-27
CA3171150A1 (en) 2019-04-18

Similar Documents

Publication Publication Date Title
CN110300072B (zh) 一种互连交换模块及其相关设备
JP7357123B2 (ja) 直接相互接続ゲートウェイ
EP2853069B1 (en) Integrated heterogeneous software-defined network
US10516549B2 (en) Multicast service with is-is spine-leaf extension in a fabric network
JP5801383B2 (ja) 仮想クラスタ交換
US8903942B2 (en) Methods and apparatus for forwarding-state transport in a distributed control plane
US20070036178A1 (en) Layer 2 virtual switching environment
JP4892550B2 (ja) データ通信システムおよび方法
JP6510115B2 (ja) 負荷分散を実現するための方法、装置、およびネットワークシステム
US20140307578A1 (en) Fibre channel over ethernet support in a trill network environment
Besta et al. High-performance routing with multipathing and path diversity in ethernet and HPC networks
JP2007166666A (ja) ネットワーク管理のための方法とシステム
KR20150016309A (ko) 팻-트리 라우팅에 기반하여 별개의 인피니밴드 서브넷들 사이에서 트래픽을 라우팅하기 위한 시스템 및 방법
GB2417161A (en) Routing and forwarding between virtual routers within a single network element
US20170063631A1 (en) Data center networks
Cisco Configuring the Catalyst 8500 Software
KR100431207B1 (ko) 엠피엘에스(mpls)기반망에서의 엑스트라넷아이피-브이피엔(ip-vpn)서비스 제공 방법
Hirata et al. Flexible service creation node architecture and its implementation
WO2018028457A1 (zh) 一种确定路由的方法、装置及通信设备
JP4255863B2 (ja) 広域ネットワークシステム及び通信方法
CN114759982B (zh) 一种扇出光纤缆线转置架以及骨干平面
Liu Efficient Data Switching in Large Ethernet Networks using VLANs
CN116132364A (zh) 报文传输方法、装置及系统
Jain Creating scalable, efficient and namespace independent routing framework for future networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201208

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201208

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210114

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210409

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210913

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220722

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220722

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20220808

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220829

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221006

R150 Certificate of patent or registration of utility model

Ref document number: 7157151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150