JP6957451B2 - 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 - Google Patents
高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 Download PDFInfo
- Publication number
- JP6957451B2 JP6957451B2 JP2018510374A JP2018510374A JP6957451B2 JP 6957451 B2 JP6957451 B2 JP 6957451B2 JP 2018510374 A JP2018510374 A JP 2018510374A JP 2018510374 A JP2018510374 A JP 2018510374A JP 6957451 B2 JP6957451 B2 JP 6957451B2
- Authority
- JP
- Japan
- Prior art keywords
- subnet
- packet
- port
- lrh
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/20—Traffic policing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C15/00—Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
- H04L45/745—Address table lookup; Address filtering
- H04L45/74591—Address table lookup; Address filtering using content-addressable memories [CAM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/35—Switches specially adapted for specific applications
- H04L49/356—Switches specially adapted for specific applications for storage area networks
- H04L49/358—Infiniband Switches
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Telephonic Communication Services (AREA)
- Multi Processors (AREA)
Description
この特許文献の開示の一部は、著作権保護の対象となる資料を含む。著作権保有者は、この特許文献または特許開示の、それが特許商標庁の特許ファイルまたは記録に現れているとおりの、何人による複写複製にも異議を唱えないが、それ以外の場合にはすべての著作権をどのようなものであろうと所有する。
本発明は、一般にコンピュータシステムに関し、特に、ネットワーク環境においてネットワークスイッチ機能を提供することに関する。
導入されるクラウドコンピューティングアーキテクチャがより大規模になるのに応じて、従来のネットワークおよびストレージに関する性能および管理の障害が深刻な問題になってきている。クラウドコンピューティングファブリックのための基礎としてインフィニバンド(登録商標)(InfiniBand:IB)技術などの高性能な無損失相互接続を用いることへの関心がますます高まってきている。
ここに開示されるのは、ミドルウェアおよびアプリケーション実行またはミドルウェアマシン環境のための設計されたシステムのような、ネットワーク環境においてサブネット内およびサブネット間アドレス解決をサポートできるシステムおよび方法であり、高性能コンピューティング環境での線形転送テーブル(LFT)探索のためにグローバルルートヘッダ(GRH)におけるサブネットプレフィックス値を用いる。例示のシステムおよび方法は、インフィニバンド(IB)アーキテクチャを有するネットワークのような高性能コンピューティング環境におけるネットワークスイッチ環境におけるLFT探索のためにGRHにおけるサブネットプレフィックス値の使用を提供することができる。実施形態は、ネットワークファブリックを含むコンピュータ環境において、1つ以上のネットワークスイッチまたはホストに各々が関連付けられる1つ以上のサブネットを提供することができる。本明細書のシステムおよび方法は、サブネット内転送判断およびサブネット間転送判断の両方に同じ線形転送テーブルを使用できるようにすることができる。
例示の実施形態は、同様の参照番号が同様の要素を指している添付図面の図において、限定のためではなく例示のために説明されている。なお、この開示における「ある」または「1つの」または「いくつかの」実施形態への参照は必ずしも同じ実施形態に対するものではなく、そのような参照は少なくとも1つを意味する。特定の実現例が説明されるが、これらの特定の実現例が例示的な目的のためにのみ提供されることが理解される。当業者であれば、他の構成要素および構成が、この発明の範囲および精神から逸脱することなく使用され得ることを認識するであろう。
インフィニバンド(IB)は、インフィニバンド・トレード・アソシエーション(InfiniBandTM Trade Association)によって開発されたオープン標準無損失ネットワーク技術である。この技術は、特に高性能コンピューティング(high-performance computing:HPC)アプリケーションおよびデータセンタを対象とする、高スループットおよび少ない待ち時間の通信を提供するシリアルポイントツーポイント全二重相互接続(serial point-to-point full-duplex interconnect)に基づいている。
一実施形態によれば、IBネットワークは、ネットワークファブリックを共有するシステムの論理グループの分離をもたらすためにセキュリティメカニズムとしてパーティショニングをサポートし得る。ファブリックにおけるノード上の各HCAポートは、1つ以上のパーティションのメンバであり得る。パーティションメンバーシップは、SMの一部であり得る集中型パーティションマネージャによって管理される。SMは、各ポートに関するパーティションメンバーシップ情報を、16ビットのパーティションキー(partition key:P_キー)のテーブルとして構成することができる。SMはまた、これらのポートを介してデータトラフィックを送信または受信するエンドノードに関連付けられたP_Key情報を含むパーティション実施テーブルを用いて、スイッチポートおよびルータポートを構成することができる。加えて、一般的な場合には、スイッチポートのパーティションメンバーシップは、(リンクに向かう)出口方向に向かってポートを介してルーティングされたLIDに間接的に関連付けられたすべてのメンバーシップの集合を表わし得る。
過去10年の間に、ハードウェア仮想化サポートによってCPUオーバーヘッドが実質的に排除され、メモリ管理ユニットを仮想化することによってメモリオーバーヘッドが著しく削減され、高速SANストレージまたは分散型ネットワークファイルシステムの利用によってストレージオーバーヘッドが削減され、シングルルートI/O仮想化(Single Root Input/Output Virtualization:SR−IOV)のようなデバイス・パススルー技術を使用することによってネットワークI/Oオーバーヘッドが削減されてきたことに応じて、仮想化された高性能コンピューティング(High Performance Computing:HPC)環境の将来見通しが大幅に改善されてきた。現在では、クラウドが、高性能相互接続ソリューションを用いて仮想HPC(virtual HPC:vHPC)クラスタに対応し、必要な性能を提供することができる。
IBアーキテクチャは、複数の層に分割され、複数の層の各々は、他の層とは別々にかつ独立して動作する。IB層抽象化の一端では、IB物理層はIBシステムの電気的および機械的特性を定義し、IB層抽象化の他端では、IB上位層はホストとリモートクライアントとの間でトランザクションを通信する。IBトランスポート層は、それぞれ、データの送受信時に、パーティショニング、チャネル多重化、トランスポートサービス、ならびにパケットセグメンテーションおよび再アセンブリを提供するように動作する。サブネット内におけるパケット転送およびスイッチングはIBリンク層で処理され、IBネットワーク層はあるサブネットから別のサブネットへのパケットのルーティングを処理する。
一実施形態によれば、IBベースのHPCシステムのいくつかは、ファットツリートポロジーを採用して、ファットツリーが提供する有用な特性を利用する。これらの特性は、各送信元宛先ペア間の複数経路の利用可能性に起因する、フルバイセクション帯域幅および固有の耐故障性を含む。ファットツリーの背後にある初期の概念は、ツリーがトポロジーのルート(root)に近づくにつれて、より利用可能な帯域幅を用いて、ノード間のより太いリンクを採用することであった。より太いリンクは、上位レベルのスイッチにおける輻輳を回避するのに役立てることができ、バイセクション帯域幅が維持される。
一実施形態に従うと、I/O仮想化(I/O Virtualization:IOV)は、基礎をなす物理リソースに仮想マシン(VM)がアクセスすることを可能にすることによって、I/Oを利用可能にすることができる。ストレージトラフィックとサーバ間通信とを組合せると、シングルサーバのI/Oリソースにとって抗し難い高い負荷が課され、結果として、データの待機中に、バックログが発生し、プロセッサがアイドル状態になる可能性がある。I/O要求の数が増えるにつれて、IOVにより利用可能性をもたらすことができ、最新のCPU仮想化において見られる性能レベルに匹敵するように、(仮想化された)I/Oリソースの性能、スケーラビリティおよび融通性を向上させることができる。
さまざまなタイプのSR−IOVモデル(たとえば共有ポートモデル、仮想スイッチモデルおよび仮想ポートモデル)があり得る。
図5は、一実施形態に従った例示的なvSwitchアーキテクチャを示す。図に示されるように、ホスト400(たとえばホストチャネルアダプタ)はハイパーバイザ410と対話することができ、当該ハイパーバイザ410は、さまざまな仮想機能430、440および450をいくつかの仮想マシンに割当てることができる。同様に、物理機能はハイパーバイザ410によって処理することができる。仮想スイッチ415もハイパーバイザ401によって処理することができる。
図6は、一実施形態に従った例示的なvPortの概念を示す。図に示されるように、ホスト300(たとえばホストチャネルアダプタ)は、さまざまな仮想機能330、340および350をいくつかの仮想マシンに割当てることができるハイパーバイザ410と対話することができる。同様に、物理機能はハイパーバイザ310によって処理することができる。
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
図9は、一実施形態に従った、動的LID割当てがなされてLIDが予めポピュレートされたvSwitchを備えた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501〜504は、ネットワーク切替環境800(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、それぞれ、さらに、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550は、ハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当てることができる。ハイパーバイザ521は、仮想マシン3 552を仮想機能3 526に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能2 535に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
一実施形態によれば、本開示の実施形態は、単一サブネット内にインフィニバンドファブリックを提供することに加えて、2つ以上のサブネットにまたがるインフィニバンドファブリックを提供することもできる。
レイヤ2(L2)アドレス指定の場合、例示的な実施形態は、各サブネット内において「通常の」ローカルIDベースのルーティング/転送を使用する。つまり、IBパケットのローカルルートヘッダ(LRH)における16ビットの宛先ローカル識別子(DLID)は、スイッチポートでルーティングされているときに探索され、出力ポートは、IBパケットのLRHにおけるDLID値を使用してハードウェアでLFTを直接索引付けすることによって迅速に発見される。
例示的な実施形態におけるパケットのグローバルルートヘッダ(GRH)は、本質的に128ビットスキーム、すなわち一意の64ビットのノードアドレス‐「GUID」、および64ビットのサブネットプレフィックス番号を使用する。例示的な実施形態は、多数の独立したサブネットに分割された非常に大きなファブリックを提供し、同じルート/ルーティング能力が異なるサブネットにまたがって使用可能にされる。すなわち、例示的な実施形態では、エンドポイント間の経路は、あたかも大きな単一のサブネットがあるかのような場合と同じ方法でルーティングすることができる。
a)宛先サブネットにおけるLID/またはそのLIDおよび
b)「中間スイッチファブリック」インフラストラクチャの「中間」LIDの両方をエンコードする。
IBファブリック全体にわたるルーティング/転送の調整された管理を伴う単一のファブリック構成内においてサブネット内トラフィックおよびサブネット間トラフィックの両方に対してスケーラブルで柔軟性があり決定論的なルーティング/転送を可能にするために必要なスイッチ/ルータオンチップリソースの量を削減するために、ある実施形態に従って、単一のサブネット内のLIDベースのテーブル探索と同じ方法で線形テーブル探索のために使用される番号を介してサブネット間のルートを識別するためのスキームが使用される。これに関して、図11は、一実施形態による、ネットワーク環境においてパケット転送ロジックにアクセスするためにインフィニバンド(IB)アドレス指定スキームを使用するデータパケットフォーマットの図を示す。図に示すように、第1のIBサブネット1100は、複数の物理(または仮想)ノード1101および1102と、サブネットアドミニストレータ(SA)1120とを含むことができる。第1のIBサブネット1100内のソースノード1101は、中間ノード1102を介して、第1のIBサブネット1100以外の第2のIBサブネットにおける宛先ノード1103にパケット(たとえば、IBパケット1110)を送信することができる。宛先ノード1103は、それが第2のIBサブネット内にあることを表すために点線で示されている。
例示的な実施形態によるコアファブリックモデルの概要として、IBファブリック構成は、個々のサブネットに分解することができる一方で、個々の物理的または仮想的な宛先に対する個々の経路を明示的にルーティングできる柔軟性を依然として維持することができる、非常に大きなファットツリー構成に対するスケーリングを容易にする。システムは、階層的な態様で管理される単一のファブリック構成として構築されるが、最上位の管理エンティティは完全なファブリックの完全な可視性を有する。
一実施形態によれば、「ローカルファブリック」は、1つ以上の物理的な「リーフサブネット」および/または「コアファブリック」トポロジ内ならびにそのようなトポロジ間の接続性を表す物理的なIBファブリックインフラストラクチャである。ローカルファブリックは階層的な態様で管理されるが、たとえば制御プレーンソフトウェアなどの最上位の中央管理エンティティが任意のID値の割り当てを管理することができるという制約を伴い、物理接続およびルーティング(パケット転送)の両方の制約を完全なローカルファブリック(すなわち、ローカルファブリックの”全体的なビュー”)全体にわたって遵守する。
一実施形態によれば、「リモートファブリック」は、1つ以上のIBリンクを介してローカルファブリックに接続される任意のトポロジ/インフラストラクチャであるが、リンクのリモート側のポートは、ローカルファブリックと同じ最上位の中央管理エンティティによって制御されない。2つの独立したローカルファブリックを接続するポートは、典型的には、ルータポートとして設定される。したがって、これら2つのポートは、一実施形態によれば、最小IBサブネットを形成する。
一実施形態によれば、「ゲートウェイサブネット」は、典型的には、1つのローカルファブリックからの1つのルータポートを他のローカルファブリックからのちょうど1つのルータポート(すなわち、中間スイッチなし)と接続することによって形成される「単純な」物理IBサブネットである。ゲートウェイサブネットは、リンクアップ時に確立される単純な構成を持ち、パケット転送ポリシーは各側のルータによって独立して制御される。2つのルータポートは、リモートファブリックについて学習するために、相互発見プロトコルを実現する。これに代えて、および/または加えて、各ローカルファブリックにおける管理入力を、必要または所望に応じて選択的に用いて、異なるゲートウェイサブネットを介してルーティングされるべき1つ以上のリモートサブネット番号および個々のGIDのセットを定義することができる。ここでのゲートウェイサブネット定義の重要な局面は、管理すべきルータまたはスイッチデバイスではなく、IBリンク上の2つの最上位の管理ドメイン間の境界を配置することである。
「リーフサブネット」は、それ自体のユニキャストおよびマルチキャストLID空間を有する物理的なIBサブネットである。計算およびストレージサーバなどのホストタイプのエンドノードは、典型的には、単一のリーフサブネットを介してローカルファブリックに接続される。しかしながら、単一のホストが、さらに所望の通りに複数のリーフサブネットと接続されてもよい。リーフサブネットは、1つ以上の協働サブネットマネージャ(SM)インスタンスによって構成および制御され、リーフサブネット内では、パケットはパケットヘッダのLRH.DLID部分に基づいて転送される。リーフサブネットは、レガシースイッチで構成されてもよく、中央の最上位の管理エンティティと並んで、リーフサブネットを制御しているサブネットマネージャのセットに入力されるポリシーを表す管理上定義された「識別サブネット番号」(ISN)によって識別される。ISNは、グローバルに一意であってもよく、好ましくは、IBリンクを介して、すなわちゲートウェイサブネットを介して直接接続できるすべてのローカルファブリックにわたって一意である。各リーフサブネットは、ポートを介して1つ以上の「コアファブリック」に接続されてもよく、各リーフサブネットは、少なくとも1つのコアファブリックに接続されると、少なくとも1つの「ファブリックローカルサブネット番号」(FLSN)に関連付けられる。FLSN値は、ローカルファブリックについての範囲を持ち、ローカルファブリック管理インフラストラクチャによって割り当てられる。加えて、リーフサブネットは、コアファブリック接続性を表さないルータポートを介して他のIBサブネットに接続されてもよい。一般的な場合において、このような「グローバル」接続は、ゲートウェイサブネットを介したリモートファブリックへの接続を表し、この種のグローバル接続の場合、ISN値は、リモートサブネット/ファブリックからのこのリーフサブネットのDGIDベースのアドレス指定に使用される。しかしながら、2つのリーフサブネットを同じローカルファブリックにおいてこのように、すなわちローカルコアファブリックを使用せずに、接続することも可能である。この種の接続は、ISNまたはFLSNベースのDGIDアドレス指定のどちらを使用してもよい。直接、リーフサブネットからの、ローカルファブリック内またはリモートファブリックへの、ルータポートベースの接続には、システムポートまたは他のルータ実現例のどちらが関係してもよい。
一実施形態によれば、「コアファブリック」は、単一のローカルファブリックのコンテキスト内で1つ以上のリーフサブネットを接続する例示的な実施形態によるトポロジである。ここでは、「中間スイッチファブリック」という表現を代わりに使用してもよい。一実施形態によれば、コアファブリックは、たとえば、同じ物理サブネット内に既に直接的な接続性を有するセクションなど、単一のリーフサブネットの異なるセクション間に追加の接続性を提供する。例示的な実施形態では、単一のコアファブリックは、単一の「サブネット間ルート番号」(ISRN)値空間を表すことが好ましい。単一のコアファブリックは直接接続されたエンドノードを有することができる。エンドノードの特殊なケースは、スイッチ管理ポート(ポート0)である。これらは専用のISRN値を介して到達することができ、GRHベースの通信が必要である。物理IBリンクおよび/またはシステムポートを介して接続される物理エンドノードは、一般に、別個のFLSN(またはISN)値を表し、通信は、好ましくはGRHベースである。このような直接接続されたエンドノードは、一般に、わずか2つのポートおよび単一のリンク、すなわちエンドノードポートおよび関連するシステムポートを有する、「単純な」リーフサブネットを表す。例示的な実施形態の環境では、直接接続された物理エンドノードは、DLID値が一意でないかもしれないことをエンドノード実現例が処理できる限り、専用ISRN値を介してアドレス指定することもできることを理解されたい。一般に、FLSN値はローカルファブリック全体に対してグローバルでなければならないので、必要な値の空間を減らすために、別個のFLSN値をそのようなエンドポートについて選択的に割り当てないかもしれない。
一実施形態によれば、パケットの「アドレス指定モード」は、パケットがソースから宛先へどのように送られるべきかを判断するために使用されるべき特定のヘッダ情報を定義する。IBパケットは、パケットがソースから宛先へどのように送られるべきかに関する情報を含む複数のヘッダ(すなわち、LRHおよびGRH)を含んでもよい。したがって、パケットのアドレス指定モードは、どのようなそのような情報が次の転送判断に使用されるべきかを定義する。
LRH/DLIDアドレス指定モード;
GRH/ISRNアドレス指定モード;
GRH/リーフスイッチアドレス指定モード;および
GRH/DGIDアドレス指定モード。
一実施形態によれば、「転送モード」は、パケット転送判断を実行するスイッチポートに適用される。「アドレス指定モード」の概念はIBパケットのヘッダに適用されるが、転送の判断を行うスイッチポートは、あるパケットアドレス指定モードに対応する「転送モード」で動作する。スイッチポートは1つより多いアドレス指定モードを同時にサポートしてもよい。したがって、スイッチポートが特定のパケットのために正しい転送モードを選択することを可能にするために、パケットは、スイッチポートが決定論的にアドレス指定モードを判断することを可能にする情報を含まなければならないかもしれない。そのような情報には、DGIDタイプ情報および特定の転送モード(たとえば、GRH/ISRN)を示すために予約された特殊なDLID値の両方が含まれる。また、場合によっては、次ホップアドレス指定モードは、パケットにおけるアドレス情報およびファブリックにおけるポートに関連付けられる構成情報の両方の関数である。宛先リーフサブネットに到達した時点を判断するための例示的な実施形態における能力は、次ホップアドレス指定モードがパケットにおけるアドレス情報およびファブリックにおけるポートに関連付けられる構成情報の両方の関数であることの例である。
一実施形態によれば、任意の特定のリーフサブネット、コアファブリックまたはゲートウェイサブネットインスタンスは、「転送ドメイン」を表わしてもよい。IBパケットが完全なIBファブリックを通じて転送されると、図13に示すような1つ以上の「転送ドメイン」を通過し、そのような各転送ドメインは特定の転送モードおよび特定のアドレス値空間を表す。一実施形態によれば、「転送ドメイン」は、複数のリーフサブネットおよび複数のコアファブリックの間の境界である。最も単純なスキームでは、個々のシステムインスタンスは、単一の転送ドメイン、たとえば単一のリーフサブネットまたは単一のコアファブリックインスタンスに属する。この場合、リーフサブネットまたはコアファブリックインスタンスの任意の対間のすべての境界は、異なるシステムインスタンスを接続する1つ以上のリンク上に存在する。リーフサブネットおよびコアファブリックインスタンスの両方が任意のサイズを有することを可能にするために、個々のシステムインスタンスは、2つ以上の「仮想スイッチ」インスタンスに選択的に分割され、各そのような仮想スイッチは、すべてが単一のリーフサブネットまたは単一のコアファブリックへの、またはその内における接続性を表す、1つ以上の「仮想スイッチポート」の集まりを表す。この場合、転送ドメインの任意の対間の境界は、2つ以上の仮想スイッチインスタンスを接続するシステムクロスバー内に存在する。
一実施形態によれば、転送ドメインへの接続性を表す物理的なシステムポートは、本明細書では「ゲートウェイポート」と呼ばれる。以下に述べる理由から、ゲートウェイポートは、パケットをゲートウェイポートに送信する同じシステムインスタンス上の別のポートの観点から定義される。まず、ゲートウェイポートにパケットを送信することは、送信が次のいずれかであるため、パケットに対するアドレス指定モードが変更されることを意味する。
II.コアファブリックを宛先リーフに送信する、または
III.ソースリーフを宛先リーフに送信する。
一実施形態によれば、「リーフサブネット仮想スイッチ」は、同じリーフサブネットに接続する単一のシステムインスタンス上の1つ以上の物理ポートの集まりをベースラインとして定義する。ファブリックローカルサブネット番号(FLSN)が使用されている場合、同じリーフサブネット仮想スイッチにおけるすべてのポートは、通常、同じFLSN値を表わすことになる。概念的には、同じリーフサブネット仮想スイッチ内の異なるポートは異なるFLSN値を表してもよく、各ポートは、すべて同じ物理サブネットを表すにもかかわらず、1つより多い値を表してもよいことに注目されたい。また、同じFLSN値が、異なる物理リーフサブネットにおけるリーフサブネット仮想スイッチポートに関連付けられてもよい。
例示的な実施形態によれば、リーフサブネット仮想スイッチポートは、リーフサブネット仮想スイッチインスタンスに属することができ、たとえばIBリンクに到着するパケットについて出力ポート番号を探索するためにLRH.DLID値を使用する。このリーフサブネット仮想スイッチインスタンスに対して出力ポート番号が表すポートのタイプは、例示的実施形態では、メンバーの物理ポートに利用可能な構成情報によって定義される。出力ポートは、同じリーフサブネット仮想スイッチにおける別の仮想スイッチポート、コアファブリックゲートウェイポート、仮想ルータポート、または別のリーフサブネットへの直接接続性を提供するリーフサブネットゲートウェイポートを表してもよい。出力ポートは一般に物理ルータポートではない可能性があり、なぜならば、これは、新たなLRHが、パケットGRHに基づく動的な態様で構築されることになることを意味し、そして、これは、仮想ルータポートを介してしか行われ得ないからである。
一実施形態によれば、「コアファブリック仮想スイッチ」は、同じコアファブリックに接続する単一のシステムインスタンス上の1つ以上の物理ポートの集まりをベースラインとして定義する。
例示的な実施形態によれば、コアファブリック仮想スイッチインスタンスのコアファブリック仮想スイッチポートは、IBリンクに到着するパケットについて出力ポート番号を探索するためにGRH.DGID.ISRN値を使用する。探索されたポート番号がこのコアファブリック仮想スイッチインスタンスに対して表す出力ポートのタイプは、メンバーの物理ポートに利用可能な構成情報によって定義される。出力ポートは、同じコアファブリック仮想スイッチにおける別のコアファブリック仮想スイッチポート、リーフサブネットゲートウェイポート、仮想ルータポート、または別のコアファブリックへの直接接続性を提供するコアファブリックゲートウェイポートを表してもよい。
システムクロスバーベースの仮想スイッチおよび転送ドメイン境界の場合、コアファブリックゲートウェイポートである物理ポートは、関連するコアファブリック接続性を表わすコアファブリック仮想スイッチの観点から、コアファブリック仮想スイッチポートとして動作してもよいことが理解されるべきである。したがって、物理スイッチポートの観点からは、パケット転送代替策は、このセクションで説明するゲートウェイポート関連の転送に加えて、上で「コアファブリック仮想スイッチポート」に関して説明したものを含む。
DLID=0xFF
着信パケットが一致するDLIDを有する場合(たとえば、0xFまたは0xFF)、Rxフィルタ1520は、パケットをSSP1510に向けることができる。一方、着信パケットが一致するDLIDを有さない(すなわち、0xFおよび0xFF以外のDLIDを伴う)場合、Rxフィルタ1520は、着信パケットを通常/レガシー転送モダリティポート1530に向けることができ、それは、IBプロトコルエンジンを使用してIBパケットを標準的なIBプロトコルに従って処理できる。
システムクロスバーベースの転送ドメイン境界の場合、リーフサブネットゲートウェイポートである物理ポートは、関連するリーフサブネット接続性を表わすリーフサブネット仮想スイッチの観点から、リーフサブネット仮想スイッチポートとして動作してもよい。したがって、物理スイッチポートの観点からは、パケット転送代替策は、このセクションで説明するゲートウェイポート関連の転送に加えて、上で「リーフサブネット仮想スイッチポート」に関して説明したものを含む。
例示的な実施形態によれば、組み合わされたコアファブリックおよびリーフサブネット仮想スイッチ構成は、同じセットのポートがコアファブリックおよびリーフサブネット仮想スイッチの両方の特性を同時に提供することを可能にする。この構成の1つの動機は、非GRHベースのデータおよび制御トラフィックが、コアファブリックにおける1つ以上のシステムインスタンスと直接接続されたノード間で生ずることを可能にすることである。コアファブリック内の転送オプションについては上で説明した。
例示的な実施形態による組み合わされたコアファブリックおよびリーフサブネット仮想スイッチポートは、GRH/ISRN転送モードとLRH/DLID転送モードとの両方をサポートする。
仮想ルータポートは、例示的な実施形態では、物理ポートの範囲外のシステムポート番号によって表される。したがって、仮想ルータポートには直接関連付けられる物理リンクはない。どの仮想スイッチポートでも仮想ルータポートを探索でき、仮想ルータポートは次いで物理出力ポートおよび次ホップLRHを定義するためにパケットGRH上で構成可能なルーティング機能を使用する。
物理ルータポートは、例示的な実施形態では、ローカルファブリックインスタンスへの進入またはローカルファブリックインスタンスから外に出ることを処理するポートである。物理ルータポートは、リンク側からIB規格に準拠したルータポートとして表される。
例示的な実施形態によれば、サブネット間ルート番号(ISRN)は、コアファブリックインスタンス内においてLFTエントリを索引付けするために使用されるパケットGRH.DGID.サブネットプレフィックスの可変部分によって定義される値である。ISRN値空間はコアファブリックインスタンスごとであり、ファブリックグローバルマネージャ(FGM)はISRN値の使用を調整する。
例示的な実施形態によれば、ファブリックローカルサブネット番号(FLSN)は、ローカルファブリック内で宛先サブネットを識別する値である。すべてのFLSN番号は、ファブリックグローバルマネージャ(FGM)によって割り当てられ、管理されることが好ましい。ISRN値に基づいて転送されるパケットは、宛先FLSN値も有する。
例示的な実施形態によれば、ファブリックグローバルマネージャ(FGM)は、完全なローカルファブリックインスタンスの発見および構成を実行することができる「スーパーサブネットマネージャ」である。FGMは、個々のリーフサブネットにおける「FGM認識」サブネットマネージャと協働する。
例示的な実施形態によれば、識別サブネット番号(ISN)は、グローバルまたはサイトに特定の一意性を有してもよい、管理上割り当てられたサブネット番号である。ISN番号は、異なるローカルファブリックインスタンス間においてサブネット間トラフィックに選択的に使用されるGID値を形成するために、GUIDとともに使用される。
例示的な実施形態によれば、ハードウェアGUIDは、ハードウェアリソースの64ビットのグローバルに一意の識別情報である。例示的な実施形態における各物理システムインスタンスは、ベースHW GUID値を有する。各システムベースの仮想スイッチインスタンスは、予め定義された方法でベースHW GUIDから導出されるHW GUIDを有する。各物理HCAは、ベースHW GUIDを有することになる。各仮想HCAポートは、予め定義された方法でベースHW GUIDから導出されるHW GUIDを有することになる。
例示的な実施形態によれば、仮想GUID(vGUID)は、グローバルに一意またはローカルファブリック内で一意である64ビットのGUID値である。仮想GUIDは、ローカルファブリックに存在する任意のHW GUIDに対して一意であることも保証される。
パケットローカルおよびグローバルルートヘッダ(LRH/GRH)フォーマットおよび規約のための基準について以下に説明する。第1に、本明細書の例示的な実施形態で使用されるローカルルートヘッダ(LRH)は、インフィニバンド(IB)規格によって定義される通りである。同様に、本明細書の例示的な実施形態で使用されるグローバルルートヘッダ(GRH)は、インフィニバンド(IB)規格によって定義される通りであるが、2つの追加/例外のセットを有する:1)GRH.DGID.SUBNET_PREFIXはタイプ「ISRN」を有することができ、2)GRH.DGID.SUBNET_PREFIXはタイプ「LeafSwitchHierarchy(リーフスイッチ階層)」を有することができる。
(宛先)ファブリックローカルサブネット番号
サブネット間ルート番号(すなわち、ソースリーフサブネットにおいて最初のLRH.DLID値によって定義されるコアファブリックインスタンスにおける)
DLID(ファブリックローカルサブネット番号で定義される宛先リーフサブネットにおける)。
(宛先)ファブリックローカルサブネット番号
(宛先)リーフスイッチ番号
すべての特殊なサブフィールドは、ランタイムで定義されるサイズおよびオフセットを有する。(すなわち、サブフィールド抽出を実行するために専用TCAMエントリを使用することによって可能にされる)。
本明細書の例示的な実施形態によれば、単一のリーフサブネット内において、LRHのみを有し、GRHを有さないパケットは、レガシーのSLからVLへのマッピングを使用していることになる。例示的な実施形態は、予約ビットおよび新たなヘッダバージョン番号を使用することによって、ローカルLIDおよび/またはSL/VL値空間を所望または必要に応じて選択的に拡張してもよい。LFTによって探索可能なポート番号の数を拡張することは、より多くのそのような「エイリアス」ポート番号が、関連付けられる物理ポートについて他のSL/VLマッピングを表すことを可能にする。(すなわち、SL/VL処理と同じ効果であるが、予約されたLRHビットの所有権を主張できる使用に頼るのではなく、LFTメモリを消費する。)これは、トラフィック分離を達成するために異なるSL値ではなく複数のDLID値を使用することを意味する。
デフォルトでは、ローカルファブリック内で使用するために定義されたものと同じGRHベースのスキームが、例示的な実施形態によってサポートされる。基本的なマッピングに加えて、たとえば、リモートファブリックにおいてゲートウェイサブネット/ルータポートにパケットを送信するルータポートなどの出口ルータポートは、すべてのそのようなパケットまたはサブセットを、定義された基準に基づいて、ローカルファブリックに輻輳ツリーが蓄積されないようにパケットを「早期に」ドロップする、より「積極的な」クレジット待機ポリシーを有するとして分類してもよい。
例示的な実施形態における各転送ドメインは、ローカルファブリックレベルでの調整なしにリーフサブネットの内部のトラフィックに使用できるP_Key値の範囲を有する。つまり、すべての転送ドメインによって、同じプライベート範囲を使用できる。ローカル範囲外のP_Key値は、FGMを介して割当てられる。FGMは、ゲートウェイポートが、関連する転送ドメインに転送されることを許されるP_Key値を持つパケットの転送のみを受け入れることを保証する。
本明細書で説明される例示的な実施形態は、一般に、異なるローカルファブリックインスタンス間の調整されたP_Key値割り当てについての仮定をなさない。ネイティブIB通信は、この場合、関与するローカルファブリックインスタンス間の動的に交渉されるP_Key値に基づくか、または上記のローカルファブリックの場合について概説されたP_Keyマッピングスキームに基づく。
例示的な実施形態では、各転送ドメインは、各転送ドメインに対してプライベートであるとみなされるMLID値の範囲を有し、すべての転送ドメインが同じプライベート範囲を使用することができる。プライベートMLIDにマッピングされるマルチキャストグループは、ローカル転送ドメイン内でのみ転送できる。FGMは、プライベートMLID転送が転送ドメイン境界を超えて行われないようにし、完全なローカルファブリックインスタンス全体にわたるマルチキャスト転送を実現するために使用できる共有MLID値のセットを調整する。完全なローカルファブリック全体にわたって共有MLID値を介して使用されるMGID値は、FGMによって割当てられる。そのようなMGID値は、それをFGM制御されるMGIDであるよう定義する選択されたビットフィールドを有する。各転送ドメイン内におけるローカルSMは、FGM制御されるMGIDの競合する使用がないことを保証することを担う。
本明細書で説明される例示的な実施形態は、一般に、異なるローカルファブリックインスタンス間の調整されたMGID値割り当てについての仮定をなさない。純粋なハードウェアベースの転送を伴うネイティブIBマルチキャスト通信は、この場合、関与するローカルファブリックインスタンス間の動的に交渉されるMGID値に基づく。
例示的な実施形態によれば、デフォルトでは、各システムインスタンスは、単一の従来のインフィニバンド(IB)スイッチとして動作する。このデフォルト構成では、既存のIB サブネットマネージャまたはSMPベースの診断および監視ツールは、完全な接続されたファブリックを単一のIBサブネットとして「見る」かまたは他の態様で学習することができる。
例示的な実施形態によれば、各リーフサブネットにおける物理エンドノードおよび仮想エンドノードは、ローカルマスタサブネットマネージャ(SM)によって発見され、構成される。各マスタサブネットマネージャは、照会およびイベントによって、中央FGMに、それのローカルノードポピュレーションに関して通知する。物理および仮想管理サーバならびにスイッチ管理ポートを含む通信エンドノードを伴うコアファブリックの場合、関連するFGMインスタンスは、リーフサブネットにおけるマスタSMと同じ態様で、ポピュレーションに関する情報を追跡または他の態様で維持する。これにより、中央FGMは、GUIDに基づいて任意のエンドノードの所在を追跡することができ、したがって任意の必要な通信に関する関連する経路情報を構築することができる。
例示的な実施形態によれば、単一リーフサブネット内での仮想マシン(VM)マイグレーションは、一意のDLID値を用いて、VMが表わしている仮想HCAポートを示す限り、アドレス情報の変更なしに生じ得る。
単一のリーフサブネット内では、例示的な実施形態のシステムは、インフィニバンド(IB)規格に従って線形転送テーブル(LFT)を使用してLRH.DLIDベースのパケット転送を実現する。デフォルトでは、各仮想スイッチは、完全な48KのユニキャストDLID空間をサポートするLFTと、完全な16KのマルチキャストDLID空間をサポートするマルチキャスト転送テーブルとを有する。システムに対するPORが、物理ポートの対によって共有されるプライベートユニキャストおよびマルチキャストLFTを有することになる限り、仮想スイッチポートメンバーシップを構成する最小限の細分性は、LFTを共有する2つのポートのグループである。次に、拡張されたSMおよびFGMルーティングロジックで、仮想スイッチごとの複数の独立したLFTをサポートしてもよい。しかしながら、LFTが1つより多い物理ポートによって共有されている限り、依存性は、実際の物理トポロジがそれ自体を複数の独立したLFTの処理に供することである。
任意の数の入力DGID.サブネットプレフィックス値をサポートするが、依然としてDGID.GUID値をターゲット物理または仮想HCAポートについて検証できるようにするために、そのようなターゲット(v)HCAは、実施形態に従って、あるモードを含み、着信GRH.DGIDを物理または仮想のHCAポートについてハードウェアおよびエイリアスGID値に対してチェックすることはGUID部分のみに制限され、サブネットプレフィックス部分は無視される。
図16は、高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するための一実施形態による方法1600を示す。ここで、図の方法について説明する。第1および第2のサブネットは、ネットワークファブリックを含むコンピュータ環境で提供される。第1のサブネットは第2のサブネットとは異なる。第1のサブネットは、第1のセットのネットワークスイッチを含み、第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含む。第2のサブネットは、第2のセットのネットワークスイッチを含み、第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含む。これは、本方法の例示的な実施形態の環境である。全体として、方法1600は、第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの同じ第1のLFTが、第1のサブネットの第1のセットのネットワークスイッチのネットワークスイッチ間で転送されるべきパケットのサブネット内転送判断、ならびに第1および第2のサブネットのそれぞれの第1のセットのネットワークスイッチおよび第2のセットのネットワークスイッチの間で転送されるべきパケットのサブネット間転送判断の両方に対して用いられることを可能にする。
Claims (12)
- 高性能コンピューティング環境でのネットワークスイッチ環境におけるパケット転送のためにパケットヘッダを使用するための方法であって、
ネットワークファブリックを含むコンピュータ環境において、第1および第2のサブネットを提供することを備え、前記第1のサブネットは前記第2のサブネットとは異なり、前記第1のサブネットは、第1のセットのネットワークスイッチを含み、前記第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含み、前記第2のサブネットは、第2のセットのネットワークスイッチを含み、前記第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含み、前記方法はさらに、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチが、前記第1のネットワークスイッチから前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの1以上の他のネットワークスイッチへのパケットのサブネット内転送、ならびに前記第1のネットワークスイッチから前記第2のサブネットの前記第2のセットのネットワークスイッチの1以上のネットワークスイッチへのパケットのサブネット間転送の両方に対して用いられることを許可することと、
第1のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、を含み、前記第1のパケットは、前記第1のサブネット内のアドレスを識別するローカルルートヘッダ(LRH)部分と、前記第2のサブネット内のアドレスを識別するグローバルルートヘッダ(GRH)とを含み、前記方法は、さらに、
前記第1のパケットの前記LRHの第1の部分を検査することと、
前記第1のパケットの前記LRHの前記第1の部分の第1および第2の条件を判断することとを含み、
前記第1および第2の条件を判断することは、前記第1のネットワークスイッチに格納されている所定値と前記LRHの前記第1の部分とを比較し、前記所定値と前記LRHの前記第1の部分との間の不一致に従って前記第1の条件を選択的に判断し、前記所定値と前記LRHの前記第1の部分との間の一致に従って、前記第1のネットワークスイッチの第1のLFTを索引付けして、前記第1のサブネットの境界を表わす特殊スイッチポート(SSP)を取得することによって、前記第2の条件を選択的に判断することを含み、前記方法は、さらに、
前記第1のパケットの前記LRHの前記第1の部分の前記第1の条件に選択的に基づいて、前記第1のネットワークスイッチのサブネット内ポートを決定するために前記第1のネットワークスイッチの前記第1のLFTを索引付け、前記第1のネットワークスイッチによって、前記第1のネットワークスイッチの決定されたサブネット内ポートと関連する前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの1つのネットワークスイッチへ前記第1のパケットをルーティングすることと、
前記第1のパケットの前記LRHの前記第1の部分の前記第2の条件に選択的に基づいて、前記LRHの前記第1の部分を前記GRHの選択された部分によって置換することによって、新たなLRHを形成し、前記第1のネットワークスイッチによって、前記GRHおよび前記形成された新たなLRHと関連する前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの1つのネットワークスイッチへ前記第1のパケットをルーティングすることと、を含み、
前記ルーティングは、
前記GRHのサブネット間ルート番号(ISRN)を選択することによって行われ、前記ルーティングはさらに、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの前記選択されたネットワークスイッチにルーティングすることとによって行われ、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、パケット転送のためにパケットヘッダを使用するための方法。 - 前記第1のパケットの前記LRHの前記第1および第2の部分の条件を判断することは、前記LRHの前記第1の部分を前記第1のネットワークスイッチに格納される所定の値と比較することと、
前記LRHの前記第1の部分と前記所定の値との間の不一致に従って前記第1の条件を選択的に判断することと、
前記LRHの前記第1の部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することととを含む、請求項1に記載の方法。 - 前記LRHの前記第1の部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することは、前記第1のLFTを索引付けして、前記第1のサブネットの境界を表わす特殊スイッチポート(SSP)を取得することを含む、請求項2に記載の方法。
- 前記GRHおよび前記形成された新たなLRHと関連する前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの1つのネットワークスイッチへ前記第1のパケットをルーティングすることは、
前記GRHのサブネット間ルート番号(ISRN)を選択することと、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの前記選択されたネットワークスイッチにルーティングすることとを含み、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、請求項1〜3のいずれか1項に記載の方法。 - 前記ネットワークスイッチ環境の前記中間コアファブリックから、第2のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、
中間コアファブリックから受信される前記第2のパケットが前記ISRNを使用して転送されていると判断することと、
前記ISRNを使用して、および前記第2のパケットのヘッダに含まれるターゲットローカル識別子(LID)を使用して、前記第2のパケットを転送することとをさらに備える、請求項4に記載の方法。 - 前記第1のパケットのターゲットローカル識別子(LID)をフィルタリングすることによって前記第1のパケットの前記LRHの前記第1の部分の前記第1および第2の条件を判断して、前記第1のパケットが特殊スイッチポート(SSP)をターゲットとしているかどうかを判断することをさらに備える、請求項1または2に記載の方法。
- 前記第1のパケットの前記LRHの前記第1の部分の前記第1の条件を判断することは、第1のパケットが前記SSPをターゲットとしていないと判断することを含み、
前記第1のパケットの前記LRHの前記第1の部分の前記第2の条件を判断することは、前記第1のパケットが前記SSPをターゲットとしていると判断することを含む、請求項6に記載の方法。 - 高性能コンピューティング環境でのネットワークスイッチ環境におけるパケット転送のためにパケットヘッダを使用するためのシステムであって、
コンピュータ環境を備え、前記コンピュータ環境は、
ネットワークファブリックと、
第1のサブネットと、
第2のサブネットとを含み、前記第1のサブネットは前記第2のサブネットとは異なり、前記第1のサブネットは、第1のセットのネットワークスイッチを含み、前記第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含み、前記第2のサブネットは、第2のセットのネットワークスイッチを含み、前記第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含み、前記システムはさらに、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの第1のLFTを備え、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチが、前記コンピュータ環境によって、前記第1のネットワークスイッチから前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの1以上の他のネットワークスイッチへのパケットのサブネット内転送、ならびに前記第1のネットワークスイッチから前記第2のサブネットの前記第2のセットのネットワークスイッチの1以上のネットワークスイッチへのパケットのサブネット間転送の両方に対して用いられ、前記コンピュータ環境は、
第1のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することによって行われ、前記第1のパケットは、前記第1のサブネット内のアドレスを識別するローカルルートヘッダ(LRH)部分と、前記第2のサブネット内のアドレスを識別するグローバルルートヘッダ(GRH)とを含み、前記コンピュータ環境は、
前記第1のパケットの前記LRHの第1の部分を検査することと、
前記第1のパケットの前記LRHの前記第1の部分の第1および第2の条件を判断することとを含み、
前記第1および第2の条件を判断することは、前記第1のネットワークスイッチに格納されている所定値と前記LRHの前記第1の部分とを比較し、前記所定値と前記LRHの前記第1の部分との間の不一致に従って前記第1の条件を選択的に判断し、前記所定値と前記LRHの前記第1の部分との間の一致に従って、前記第1のネットワークスイッチの第1のLFTを索引付けして、前記第1のサブネットの境界を表わす特殊スイッチポート(SSP)を取得することによって、前記第2の条件を選択的に判断することを含み、前記コンピュータ環境は、さらに、
前記第1のパケットの前記LRHの前記第1の部分の前記第1の条件に選択的に基づいて、前記第1のネットワークスイッチのサブネット内ポートを決定するために前記第1のネットワークスイッチの前記第1のLFTを索引付け、前記第1のネットワークスイッチによって、前記第1のネットワークスイッチの決定されたサブネット内ポートと関連する前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの1つのネットワークスイッチへ前記第1のパケットをルーティングすることと、
前記第1のパケットの前記LRHの前記第1の部分の前記第2の条件に選択的に基づいて、前記LRHの前記第1の部分を前記GRHの選択された部分によって置換することによって、新たなLRHを形成し、前記第1のネットワークスイッチによって、前記GRHおよび前記形成された新たなLRHと関連する前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの1つのネットワークスイッチへ前記第1のパケットをルーティングすることと、によって行なわれ、
前記ルーティングは、
前記GRHのサブネット間ルート番号(ISRN)を選択することによって行われ、前記ルーティングはさらに、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のセットのネットワークスイッチのうちの前記選択されたネットワークスイッチにルーティングすることとによって行われ、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、高性能コンピューティング環境でのネットワークスイッチ環境におけるパケット転送のためにパケットヘッダを使用するためのシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記ネットワークスイッチ環境の前記中間コアファブリックから、第2のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信し、
中間コアファブリックから受信される前記第2のパケットが前記ISRNを使用して転送されていると判断し、
前記ISRNを使用して、および前記第2のパケットのヘッダに含まれるターゲットローカル識別子(LID)を使用して、前記第2のパケットを転送するよう動作可能である、請求項8に記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記第1のパケットのターゲットローカル識別子(LID)をフィルタリングすることによって前記第1のパケットの前記LRHの前記第1の部分の前記第1および第2の条件を判断して、前記第1のパケットが特殊スイッチポート(SSP)をターゲットとしているかどうかを判断するよう動作可能である、請求項8記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記第1のパケットが前記SSPをターゲットとしていないと判断することによって、前記第1のパケットの前記LRHの前記第1の部分の前記第1の条件を判断し、
前記第1のパケットが前記SSPをターゲットとしていると判断することによって、前記第1のパケットの前記LRHの前記第1の部分の前記第2の条件を判断するよう動作可能である、請求項10に記載のシステム。 - コンピュータシステムによって実行されると、前記コンピュータシステムに請求項1〜7のいずれか1項に記載の方法を実行させる、機械可読フォーマットにおけるプログラム命令を備える、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021164659A JP7241146B2 (ja) | 2016-01-28 | 2021-10-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662288101P | 2016-01-28 | 2016-01-28 | |
US62/288,101 | 2016-01-28 | ||
US15/416,642 | 2017-01-26 | ||
US15/416,642 US10230607B2 (en) | 2016-01-28 | 2017-01-26 | System and method for using subnet prefix values in global route header (GRH) for linear forwarding table (LFT) lookup in a high performance computing environment |
PCT/US2017/015464 WO2017132585A1 (en) | 2016-01-28 | 2017-01-27 | System and method for using subnet prefix values in global route header (grh) for linear forwarding table (lft) lookup in a high performance computing environment |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021164659A Division JP7241146B2 (ja) | 2016-01-28 | 2021-10-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019505103A JP2019505103A (ja) | 2019-02-21 |
JP2019505103A5 JP2019505103A5 (ja) | 2020-03-05 |
JP6957451B2 true JP6957451B2 (ja) | 2021-11-02 |
Family
ID=59387324
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510374A Active JP6957451B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
JP2018510382A Active JP6883568B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境における着信パケット処理のために複数のグローバル識別子(gid)サブネットプレフィックス値を同時に許容するためのシステムおよび方法 |
JP2021164659A Active JP7241146B2 (ja) | 2016-01-28 | 2021-10-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
JP2023033737A Pending JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510382A Active JP6883568B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境における着信パケット処理のために複数のグローバル識別子(gid)サブネットプレフィックス値を同時に許容するためのシステムおよび方法 |
JP2021164659A Active JP7241146B2 (ja) | 2016-01-28 | 2021-10-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
JP2023033737A Pending JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (11) | US10581711B2 (ja) |
EP (2) | EP3408978B1 (ja) |
JP (4) | JP6957451B2 (ja) |
CN (3) | CN108028813B (ja) |
WO (2) | WO2017132599A1 (ja) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8942258B2 (en) | 2012-09-14 | 2015-01-27 | International Business Machines Corporation | Segmentation and reassembly of network packets for switched fabric networks |
US10581711B2 (en) | 2016-01-28 | 2020-03-03 | Oracle International Corporation | System and method for policing network traffic flows using a ternary content addressable memory in a high performance computing environment |
US10778612B2 (en) * | 2016-05-26 | 2020-09-15 | Arista Networks, Inc. | Variable TCAM actions |
US10341371B2 (en) | 2016-08-31 | 2019-07-02 | Nicira, Inc. | Identifying and handling threats to data compute nodes in public cloud |
US10367757B2 (en) | 2016-08-27 | 2019-07-30 | Nicira, Inc. | Extension of network control system into public cloud |
US10594577B2 (en) * | 2016-12-19 | 2020-03-17 | Cisco Technology, Inc. | Sorting and displaying network traffic analytics |
US20190045412A1 (en) | 2017-08-02 | 2019-02-07 | Sears Brands, L.L.C. | Automatically switching communication pathways between connected devices |
US10567482B2 (en) | 2017-08-24 | 2020-02-18 | Nicira, Inc. | Accessing endpoints in logical networks and public cloud service providers native networks using a single network interface and a single routing table |
US10778579B2 (en) | 2017-08-27 | 2020-09-15 | Nicira, Inc. | Performing in-line service in public cloud |
US20190068466A1 (en) * | 2017-08-30 | 2019-02-28 | Intel Corporation | Technologies for auto-discovery of fault domains |
CN107484201B (zh) * | 2017-09-30 | 2020-08-14 | Oppo广东移动通信有限公司 | 流量统计方法和装置、终端、计算机可读存储介质 |
US10862753B2 (en) | 2017-12-04 | 2020-12-08 | Nicira, Inc. | High availability for stateful services in public cloud logical networks |
US10601705B2 (en) | 2017-12-04 | 2020-03-24 | Nicira, Inc. | Failover of centralized routers in public cloud logical networks |
US10708309B2 (en) * | 2018-01-10 | 2020-07-07 | Cisco Technology, Inc. | Fine granularity authorization control in FC-NVMe storage area network |
US11343229B2 (en) | 2018-06-28 | 2022-05-24 | Vmware, Inc. | Managed forwarding element detecting invalid packet addresses |
US11374794B2 (en) | 2018-08-24 | 2022-06-28 | Vmware, Inc. | Transitive routing in public cloud |
US11196591B2 (en) | 2018-08-24 | 2021-12-07 | Vmware, Inc. | Centralized overlay gateway in public cloud |
US10491466B1 (en) * | 2018-08-24 | 2019-11-26 | Vmware, Inc. | Intelligent use of peering in public cloud |
US11341082B2 (en) * | 2019-11-19 | 2022-05-24 | Oracle International Corporation | System and method for supporting target groups for congestion control in a private fabric in a high performance computing environment |
US11750534B2 (en) * | 2019-12-27 | 2023-09-05 | Texas Instruments Incorporated | Packet storage based on packet properties |
US11411911B2 (en) * | 2020-10-26 | 2022-08-09 | Mellanox Technologies, Ltd. | Routing across multiple subnetworks using address mapping |
CN114448882A (zh) * | 2020-11-04 | 2022-05-06 | 国家计算机网络与信息安全管理中心 | 一种实现高性能大容量路由设备的设计方法 |
CN112073321B (zh) * | 2020-11-16 | 2021-02-09 | 北京壁仞科技开发有限公司 | 信息处理方法、互连设备和计算机可读存储介质 |
US11734036B2 (en) * | 2021-03-03 | 2023-08-22 | Dell Products L.P. | System and method to monitor and manage a passthrough device |
US11928070B2 (en) | 2021-04-13 | 2024-03-12 | SK Hynix Inc. | PCIe device |
KR102568909B1 (ko) * | 2021-04-13 | 2023-08-21 | 에스케이하이닉스 주식회사 | PCIe 펑션 및 그 동작 방법 |
CN116032997A (zh) * | 2022-12-29 | 2023-04-28 | 南京先进计算产业发展有限公司 | 一种高性能计算环境中的两个子网之间的互连方法 |
Family Cites Families (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7010607B1 (en) | 1999-09-15 | 2006-03-07 | Hewlett-Packard Development Company, L.P. | Method for training a communication link between ports to correct for errors |
US7171484B1 (en) | 2000-05-24 | 2007-01-30 | Krause Michael R | Reliable datagram transport service |
US7103626B1 (en) | 2000-05-24 | 2006-09-05 | Hewlett-Packard Development, L.P. | Partitioning in distributed computer system |
US6954459B1 (en) | 2000-06-16 | 2005-10-11 | International Business Machines Corporation | Method for forwarding broadcast packets in a bridged IP network |
US7072360B2 (en) | 2000-09-22 | 2006-07-04 | Narad Networks, Inc. | Network architecture for intelligent network elements |
US6766467B1 (en) * | 2000-10-19 | 2004-07-20 | International Business Machines Corporation | Method and apparatus for pausing a send queue without causing sympathy errors |
US20020156918A1 (en) | 2001-04-23 | 2002-10-24 | Brocade Communications Systems, Inc. | Dynamic path selection with in-order delivery within sequence in a communication network |
US8935333B2 (en) | 2001-08-09 | 2015-01-13 | International Business Machines Corporation | Implementing multicast on a system area network channel adapter |
US6922749B1 (en) | 2001-10-12 | 2005-07-26 | Agilent Technologies, Inc. | Apparatus and methodology for an input port of a switch that supports cut-through operation within the switch |
US6839794B1 (en) | 2001-10-12 | 2005-01-04 | Agilent Technologies, Inc. | Method and system to map a service level associated with a packet to one of a number of data streams at an interconnect device |
US7245627B2 (en) | 2002-04-23 | 2007-07-17 | Mellanox Technologies Ltd. | Sharing a network interface card among multiple hosts |
US7149221B2 (en) | 2002-05-31 | 2006-12-12 | Palau Acquisition Corporation (Delaware) | Apparatus and methods for increasing bandwidth in an infiniband switch |
US7221676B2 (en) | 2002-07-30 | 2007-05-22 | Brocade Communications Systems, Inc. | Supporting local IB packet communication between separate subnets |
US7307996B2 (en) | 2002-07-30 | 2007-12-11 | Brocade Communications Systems, Inc. | Infiniband router having an internal subnet architecture |
US7401157B2 (en) | 2002-07-30 | 2008-07-15 | Brocade Communications Systems, Inc. | Combining separate infiniband subnets into virtual subnets |
US20040030763A1 (en) * | 2002-08-08 | 2004-02-12 | Manter Venitha L. | Method for implementing vendor-specific mangement in an inifiniband device |
US7356033B2 (en) * | 2002-11-21 | 2008-04-08 | Lucent Technologies Inc. | Method and apparatus for performing network routing with use of power efficient TCAM-based forwarding engine architectures |
US7493409B2 (en) | 2003-04-10 | 2009-02-17 | International Business Machines Corporation | Apparatus, system and method for implementing a generalized queue pair in a system area network |
US7574526B2 (en) | 2003-07-31 | 2009-08-11 | International Business Machines Corporation | Multicast group management in infiniband |
US7421488B2 (en) | 2003-08-14 | 2008-09-02 | International Business Machines Corporation | System, method, and computer program product for centralized management of an infiniband distributed system area network |
US7979548B2 (en) | 2003-09-30 | 2011-07-12 | International Business Machines Corporation | Hardware enforcement of logical partitioning of a channel adapter's resources in a system area network |
US20050074003A1 (en) * | 2003-10-02 | 2005-04-07 | Ball David Alexander | Distributed software architecture for implementing BGP |
US7428598B2 (en) | 2003-11-20 | 2008-09-23 | International Business Machines Corporation | Infiniband multicast operation in an LPAR environment |
US7639616B1 (en) | 2004-06-08 | 2009-12-29 | Sun Microsystems, Inc. | Adaptive cut-through algorithm |
US7400590B1 (en) | 2004-06-08 | 2008-07-15 | Sun Microsystems, Inc. | Service level to virtual lane mapping |
US7602712B2 (en) | 2004-06-08 | 2009-10-13 | Sun Microsystems, Inc. | Switch method and apparatus with cut-through routing for use in a communications network |
US7860096B2 (en) | 2004-06-08 | 2010-12-28 | Oracle America, Inc. | Switching method and apparatus for use in a communications network |
US7911977B2 (en) | 2005-05-31 | 2011-03-22 | Cisco Technology, Inc. | Designated router assignment per multicast group address/range |
KR101290413B1 (ko) | 2005-07-17 | 2013-07-26 | 오브시디안 리서치 코포레이션 | 인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법 |
US7706303B2 (en) | 2006-06-26 | 2010-04-27 | Cisco Technology, Inc. | Port pooling |
US7936753B1 (en) | 2007-11-30 | 2011-05-03 | Qlogic, Corporation | Method and system for reliable multicast |
US8331381B2 (en) * | 2007-12-04 | 2012-12-11 | International Business Machines Corporation | Providing visibility of Ethernet components to a subnet manager in a converged InfiniBand over Ethernet network |
US7983265B1 (en) | 2008-01-17 | 2011-07-19 | Qlogic, Corporation | Method and system for processing a network packet |
US8949389B1 (en) * | 2008-03-31 | 2015-02-03 | Intel Corporation | Method and system for configuring virtual fabrics |
US7738371B1 (en) | 2008-08-29 | 2010-06-15 | Qlogic, Corporation | Method and system for routing network packets |
US8363569B2 (en) | 2009-04-22 | 2013-01-29 | Digi International Inc. | System and method for rejoining sleeping subnets in a wireless mesh network |
US8429647B2 (en) | 2009-05-06 | 2013-04-23 | Vmware, Inc. | Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine |
US8351431B2 (en) | 2009-05-13 | 2013-01-08 | Avaya Inc. | Method and apparatus for providing fast reroute of a multicast packet within a network element to an available port associated with a multi-link trunk |
US8140812B2 (en) | 2009-07-01 | 2012-03-20 | International Business Machines Corporation | Method and apparatus for two-phase storage-aware placement of virtual machines |
US8532116B2 (en) | 2009-07-21 | 2013-09-10 | Cisco Technology, Inc. | Extended subnets |
US8098677B1 (en) * | 2009-07-31 | 2012-01-17 | Anue Systems, Inc. | Superset packet forwarding for overlapping filters and related systems and methods |
US20110103391A1 (en) * | 2009-10-30 | 2011-05-05 | Smooth-Stone, Inc. C/O Barry Evans | System and method for high-performance, low-power data center interconnect fabric |
US8274987B2 (en) | 2010-03-22 | 2012-09-25 | International Business Machines Corporation | Contention free pipelined broadcasting within a constant bisection bandwidth network topology |
US8559332B2 (en) * | 2010-05-25 | 2013-10-15 | Telefonaktiebolaget L M Ericsson (Publ) | Method for enhancing table lookups with exact and wildcards matching for parallel environments |
CN103125098B (zh) | 2010-09-17 | 2016-08-17 | 甲骨文国际公司 | 支持中间机环境的系统和方法、子网管理器和网络交换机 |
US8730965B2 (en) * | 2011-01-05 | 2014-05-20 | Google Inc. | Systems and methods for dynamic routing in a multiprocessor network using local congestion sensing |
JP5594171B2 (ja) | 2011-02-02 | 2014-09-24 | 富士通株式会社 | 通信処理装置、アドレス学習プログラムおよびアドレス学習方法 |
JP5750973B2 (ja) | 2011-03-29 | 2015-07-22 | 富士通株式会社 | 通信方法および通信装置 |
CN102164090B (zh) | 2011-05-13 | 2013-12-25 | 杭州华三通信技术有限公司 | 基于通用路由封装隧道的报文转发的方法、系统及设备 |
US8743890B2 (en) | 2011-06-03 | 2014-06-03 | Oracle International Corporation | System and method for supporting sub-subnet in an infiniband (IB) network |
US8842671B2 (en) | 2011-06-07 | 2014-09-23 | Mellanox Technologies Ltd. | Packet switching based on global identifier |
US9274825B2 (en) | 2011-08-16 | 2016-03-01 | Microsoft Technology Licensing, Llc | Virtualization gateway between virtualized and non-virtualized networks |
CN103765833B (zh) * | 2011-08-23 | 2017-07-04 | 英特尔公司 | 用于无限带宽织状结构中的启用gid的交换的方法及装置 |
US8862865B2 (en) * | 2011-08-30 | 2014-10-14 | International Business Machines Corporation | Rebooting infiniband clusters |
US20130086298A1 (en) * | 2011-10-04 | 2013-04-04 | International Business Machines Corporation | Live Logical Partition Migration with Stateful Offload Connections Using Context Extraction and Insertion |
US8713169B2 (en) | 2011-10-11 | 2014-04-29 | Cisco Technology, Inc. | Distributed IPv6 neighbor discovery for large datacenter switching systems |
US9288555B2 (en) | 2011-11-01 | 2016-03-15 | Plexxi Inc. | Data center network architecture |
US8879396B2 (en) | 2011-11-15 | 2014-11-04 | Oracle International Corporation | System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology |
US8949489B1 (en) * | 2012-03-21 | 2015-02-03 | Google Inc. | Method for combining bulk and latency-sensitive input and output |
US9311122B2 (en) * | 2012-03-26 | 2016-04-12 | Oracle International Corporation | System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment |
US9450885B2 (en) | 2012-03-26 | 2016-09-20 | Oracle International Corporation | System and method for supporting live migration of virtual machines in a virtualization environment |
US9264382B2 (en) * | 2012-05-11 | 2016-02-16 | Oracle International Corporation | System and method for routing traffic between distinct infiniband subnets based on fat-tree routing |
WO2013171867A1 (ja) | 2012-05-16 | 2013-11-21 | 富士通株式会社 | ノード装置および通信方法 |
EP2873285B1 (en) | 2012-07-13 | 2017-10-18 | Telefonaktiebolaget LM Ericsson (publ) | Apparatuses and methods related to connecting tunnels through a virtual switch |
US9385949B2 (en) | 2012-12-20 | 2016-07-05 | Mellanox Technologies Tlv Ltd. | Routing controlled by subnet managers |
US9069633B2 (en) | 2012-12-20 | 2015-06-30 | Oracle America, Inc. | Proxy queue pair for offloading |
US9794107B2 (en) | 2013-02-06 | 2017-10-17 | Alcatel Lucent | Method and apparatus for providing migration of cloud components across address domains |
US9237111B2 (en) | 2013-03-14 | 2016-01-12 | International Business Machines Corporation | Credit-based flow control in lossless ethernet networks |
US10404621B2 (en) | 2013-03-15 | 2019-09-03 | Oracle International Corporation | Scalable InfiniBand packet-routing technique |
US9191441B2 (en) | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Cell fabric hardware acceleration |
US9307053B2 (en) | 2013-04-23 | 2016-04-05 | Cisco Technology, Inc. | Direct data placement over user datagram protocol in a network environment |
US9577956B2 (en) | 2013-07-29 | 2017-02-21 | Oracle International Corporation | System and method for supporting multi-homed fat-tree routing in a middleware machine environment |
US9577928B2 (en) | 2013-08-27 | 2017-02-21 | Oracle International Corporation | System and method for supporting data service addressing in an engineered system for middleware and application execution |
US9559990B2 (en) * | 2013-08-27 | 2017-01-31 | Oracle International Corporation | System and method for supporting host channel adapter (HCA) filtering in an engineered system for middleware and application execution |
US10212022B2 (en) | 2013-09-13 | 2019-02-19 | Microsoft Technology Licensing, Llc | Enhanced network virtualization using metadata in encapsulation header |
US9548960B2 (en) | 2013-10-06 | 2017-01-17 | Mellanox Technologies Ltd. | Simplified packet routing |
US20150142935A1 (en) | 2013-10-21 | 2015-05-21 | Nyansa, Inc. | System and method for observing and controlling a programmable network via higher layer attributes |
WO2015062006A1 (en) | 2013-10-31 | 2015-05-07 | Intel Corporation | A method, apparatus and system for dynamically controlling an addressing mode for a cache memory |
US9648148B2 (en) | 2013-12-24 | 2017-05-09 | Intel Corporation | Method, apparatus, and system for QoS within high performance fabrics |
US9628382B2 (en) | 2014-02-05 | 2017-04-18 | Intel Corporation | Reliable transport of ethernet packet data with wire-speed and packet data rate match |
US9519328B2 (en) | 2014-05-21 | 2016-12-13 | Intel Corporation | Techniques for selectively reducing power levels of ports and core switch logic in infiniband switches |
US9876737B2 (en) | 2014-07-11 | 2018-01-23 | Oracle International Corporation | System and method for supporting efficient load-balancing in a high performance computing (HPC) environment |
US10027602B2 (en) | 2014-07-29 | 2018-07-17 | Oracle International Corporation | Packet queue depth sorting scheme for switch fabric |
FR3025384B1 (fr) | 2014-09-03 | 2016-09-16 | Bull Sas | Procede de surveillance et d'alerte de configuration de routage dans un cluster comprenant des liens de communication statiques et programme d'ordinateur mettant en oeuvre ce procede |
US9723008B2 (en) | 2014-09-09 | 2017-08-01 | Oracle International Corporation | System and method for providing an integrated firewall for secure network communication in a multi-tenant environment |
US20160080255A1 (en) | 2014-09-17 | 2016-03-17 | Netapp, Inc. | Method and system for setting up routing in a clustered storage system |
US9311133B1 (en) | 2014-10-09 | 2016-04-12 | Cisco Technology, Inc. | Touchless multi-domain VLAN based orchestration in a network environment |
US9525636B2 (en) | 2014-10-20 | 2016-12-20 | Telefonaktiebolaget L M Ericsson (Publ) | QoS on a virtual interface over multi-path transport |
CN107113233B (zh) | 2014-10-31 | 2020-06-23 | 甲骨文国际公司 | 用于支持多租户集群环境中的分区感知路由的系统和方法 |
US10348428B2 (en) | 2014-12-23 | 2019-07-09 | Intel Corporation | Techniques for synchronized execution of a command at network fabric nodes |
US20160179582A1 (en) * | 2014-12-23 | 2016-06-23 | Intel Corporation | Techniques to dynamically allocate resources for local service chains of configurable computing resources |
US9928093B2 (en) | 2015-02-24 | 2018-03-27 | Red Hat Israel, Ltd. | Methods and systems for establishing connections associated with virtual machine migrations |
US9733968B2 (en) | 2015-03-16 | 2017-08-15 | Oracle International Corporation | Virtual machine (VM) migration from switched fabric based computing system to external systems |
US10104017B2 (en) | 2015-05-12 | 2018-10-16 | Jeda Networks, Inc. | Methods, systems and apparatus for the virtualization of high performance networks |
US11204791B2 (en) | 2015-06-30 | 2021-12-21 | Nicira, Inc. | Dynamic virtual machine network policy for ingress optimization |
US10284383B2 (en) | 2015-08-31 | 2019-05-07 | Mellanox Technologies, Ltd. | Aggregation protocol |
US10432470B2 (en) | 2015-09-23 | 2019-10-01 | International Business Machines Corporation | Distributed subnet manager for InfiniBand networks |
US10116528B2 (en) * | 2015-10-02 | 2018-10-30 | Keysight Technologies Singapore (Holdings) Ptd Ltd | Direct network traffic monitoring within VM platforms in virtual processing environments |
US10033647B2 (en) | 2015-10-13 | 2018-07-24 | Oracle International Corporation | System and method for efficient network isolation and load balancing in a multi-tenant cluster environment |
US10498654B2 (en) | 2015-12-28 | 2019-12-03 | Amazon Technologies, Inc. | Multi-path transport design |
US10581711B2 (en) | 2016-01-28 | 2020-03-03 | Oracle International Corporation | System and method for policing network traffic flows using a ternary content addressable memory in a high performance computing environment |
US10171353B2 (en) | 2016-03-04 | 2019-01-01 | Oracle International Corporation | System and method for supporting dual-port virtual router in a high performance computing environment |
US10225185B2 (en) | 2016-04-18 | 2019-03-05 | International Business Machines Corporation | Configuration mechanisms in a switchless network |
US20180026878A1 (en) | 2016-07-24 | 2018-01-25 | Mellanox Technologies Tlv Ltd. | Scalable deadlock-free deterministic minimal-path routing for dragonfly networks |
US10158500B2 (en) | 2016-09-13 | 2018-12-18 | Ciena Corporation | G.8032 prioritized ring switching systems and methods |
-
2017
- 2017-01-24 US US15/414,227 patent/US10581711B2/en active Active
- 2017-01-24 US US15/414,211 patent/US10374926B2/en active Active
- 2017-01-26 US US15/416,642 patent/US10230607B2/en active Active
- 2017-01-26 US US15/416,696 patent/US10205646B2/en active Active
- 2017-01-26 US US15/416,709 patent/US10284448B2/en active Active
- 2017-01-27 CN CN201780002951.4A patent/CN108028813B/zh active Active
- 2017-01-27 EP EP17703641.5A patent/EP3408978B1/en active Active
- 2017-01-27 CN CN202211067569.0A patent/CN115442278A/zh active Pending
- 2017-01-27 JP JP2018510374A patent/JP6957451B2/ja active Active
- 2017-01-27 EP EP17704622.4A patent/EP3408981B1/en active Active
- 2017-01-27 WO PCT/US2017/015484 patent/WO2017132599A1/en active Application Filing
- 2017-01-27 CN CN201780002937.4A patent/CN107925622A/zh active Pending
- 2017-01-27 WO PCT/US2017/015464 patent/WO2017132585A1/en active Application Filing
- 2017-01-27 JP JP2018510382A patent/JP6883568B2/ja active Active
-
2018
- 2018-12-21 US US16/230,167 patent/US10868746B2/en active Active
-
2019
- 2019-01-28 US US16/259,901 patent/US10581713B2/en active Active
- 2019-03-25 US US16/363,582 patent/US10637761B2/en active Active
- 2019-07-03 US US16/502,609 patent/US11140057B2/en active Active
-
2020
- 2020-01-31 US US16/778,674 patent/US11190429B2/en active Active
-
2021
- 2021-10-06 JP JP2021164659A patent/JP7241146B2/ja active Active
- 2021-11-05 US US17/520,273 patent/US11824749B2/en active Active
-
2023
- 2023-03-06 JP JP2023033737A patent/JP2023078206A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6957451B2 (ja) | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 | |
US11140065B2 (en) | System and method for supporting VM migration between subnets in a high performance computing environment | |
US10630816B2 (en) | System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment | |
JP2022050438A (ja) | 高性能コンピューティング環境における仮想ルータポートにわたるsmp接続性チェックのためのルータsma抽象化をサポートするためのシステムおよび方法 | |
US11233698B2 (en) | System and method for supporting subnet number aliasing in a high performance computing environment | |
US11496402B2 (en) | System and method for supporting aggressive credit waiting in a high performance computing environment | |
US10348847B2 (en) | System and method for supporting proxy based multicast forwarding in a high performance computing environment | |
JP2019507520A (ja) | 高性能コンピューティング環境においてデュアルポート仮想ルータをサポートするためのシステムおよび方法 | |
US10355972B2 (en) | System and method for supporting flexible P_Key mapping in a high performance computing environment | |
US10348649B2 (en) | System and method for supporting partitioned switch forwarding tables in a high performance computing environment | |
US10666611B2 (en) | System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment | |
US10333894B2 (en) | System and method for supporting flexible forwarding domain boundaries in a high performance computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200122 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210518 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210907 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6957451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |