JP2022008890A - 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 - Google Patents
高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2022008890A JP2022008890A JP2021164659A JP2021164659A JP2022008890A JP 2022008890 A JP2022008890 A JP 2022008890A JP 2021164659 A JP2021164659 A JP 2021164659A JP 2021164659 A JP2021164659 A JP 2021164659A JP 2022008890 A JP2022008890 A JP 2022008890A
- Authority
- JP
- Japan
- Prior art keywords
- subnet
- packet
- network
- port
- fabric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/20—Traffic policing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C15/00—Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/74—Address processing for routing
- H04L45/745—Address table lookup; Address filtering
- H04L45/74591—Address table lookup; Address filtering using content-addressable memories [CAM]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/70—Admission control; Resource allocation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/35—Switches specially adapted for specific applications
- H04L49/356—Switches specially adapted for specific applications for storage area networks
- H04L49/358—Infiniband Switches
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/88—Monitoring involving counting
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Security & Cryptography (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Multi Processors (AREA)
- Small-Scale Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
【解決手段】第1のインフィニバンド(IB)サブネット1100において、グローバルルートヘッダ(GRH)におけるサブネットプレフィックス値を、高性能コンピューティング環境でのLFT探索に使用する。IBアーキテクチャを有するネットワークのような高性能コンピューティング環境において、ネットワークスイッチ環境におけるLFT探索のためにGRHにおけるサブネットプレフィックス値に埋め込まれたサブネット間ルート番号(ISRN)の使用を提供する。ネットワークファブリックを含むコンピュータ環境において、1つ以上のネットワークスイッチまたはホストに各々が関連付けられる1つ以上のサブネットを提供する。
【選択図】図11
Description
この特許文献の開示の一部は、著作権保護の対象となる資料を含む。著作権保有者は、この特許文献または特許開示の、それが特許商標庁の特許ファイルまたは記録に現れているとおりの、何人による複写複製にも異議を唱えないが、それ以外の場合にはすべての著作権をどのようなものであろうと所有する。
本発明は、一般にコンピュータシステムに関し、特に、ネットワーク環境においてネットワークスイッチ機能を提供することに関する。
導入されるクラウドコンピューティングアーキテクチャがより大規模になるのに応じて、従来のネットワークおよびストレージに関する性能および管理の障害が深刻な問題になってきている。クラウドコンピューティングファブリックのための基礎としてインフィニバンド(登録商標)(InfiniBand:IB)技術などの高性能な無損失相互接続を用いることへの関心がますます高まってきている。
ここに開示されるのは、ミドルウェアおよびアプリケーション実行またはミドルウェアマシン環境のための設計されたシステムのような、ネットワーク環境においてサブネット内およびサブネット間アドレス解決をサポートできるシステムおよび方法であり、高性能コンピューティング環境での線形転送テーブル(LFT)探索のためにグローバルルートヘッダ(GRH)におけるサブネットプレフィックス値を用いる。例示のシステムおよび方法は、インフィニバンド(IB)アーキテクチャを有するネットワークのような高性能コンピューティング環境におけるネットワークスイッチ環境におけるLFT探索のためにGRHにおけるサブネットプレフィックス値の使用を提供することができる。実施形態は、ネットワークファブリックを含むコンピュータ環境において、1つ以上のネットワークスイッチまたはホストに各々が関連付けられる1つ以上のサブネットを提供することができる。本明細書のシステムおよび方法は、サブネット内転送判断およびサブネット間転送判断の両方に同じ線形転送テーブルを使用できるようにすることができる。
例示の実施形態は、同様の参照番号が同様の要素を指している添付図面の図において、限定のためではなく例示のために説明されている。なお、この開示における「ある」または「1つの」または「いくつかの」実施形態への参照は必ずしも同じ実施形態に対するものではなく、そのような参照は少なくとも1つを意味する。特定の実現例が説明されるが、これらの特定の実現例が例示的な目的のためにのみ提供されることが理解される。当業者であれば、他の構成要素および構成が、この発明の範囲および精神から逸脱することなく使用され得ることを認識するであろう。
とが望ましい。RDMAはOSスタックをバイパスし、ハードウェアと直接通信することで、シングルルートI/O仮想化(Single-Root I/O Virtualization:SR-IOV)ネットワークアダプタのようなパススルー技術が使用可能となる。一実施形態に従うと、高性能な無損失相互接続ネットワークにおける適用可能性のために、仮想スイッチ(virtual switch:vSwitch)SR-IOVアーキテクチャを提供することができる。ライブマイグレーションを実際に選択できるようにするためにネットワーク再構成時間が重要となるので、ネットワークアーキテクチャに加えて、スケーラブルであるとともにトポロジーに依存しない動的な再構成メカニズムを提供することができる。
的な再構成メカニズムは、ファットツリーにおいて課されるオーバーヘッドを最小限にするためにさらに調整することができる。
。このため、仮想化は、ライブマイグレーションによる統合、リソースのオン・デマンド・プロビジョニングおよび融通性を可能にし得る。
インフィニバンド(IB)は、インフィニバンド・トレード・アソシエーション(InfiniBandTM Trade Association)によって開発されたオープン標準無損失ネットワーク技術である。この技術は、特に高性能コンピューティング(high-performance computing:HPC)アプリケーションおよびデータセンタを対象とする、高スループットおよび少ない待ち時間の通信を提供するシリアルポイントツーポイント全二重相互接続(serial point-to-point full-duplex interconnect)に基づいている。
ポロジー分割をサポートする。低層では、IBネットワークはサブネットと呼ばれ、1つのサブネットは、スイッチおよびポイントツーポイントリンクを使用して相互接続される一組のホストを含み得る。より高いレベルでは、1つのIBファブリックは、ルータを使用して相互接続され得る1つ以上のサブネットを構成する。
ージェントは、すべてのIBサブネットデバイス上に存在する。SMPを使用することにより、サブネットマネージャは、ファブリックを発見し、エンドノードおよびスイッチを構成し、SMAから通知を受信することができる。
なる。テーブルにおけるLIDごとに1つのエントリのみがサポートされる。パケットがあるスイッチに到着すると、その出力ポートは、そのスイッチのフォワーディングテーブルにおいてDLIDを検索することによって判断される。所与の送信元-宛先ペア(LIDペア)間のネットワークにおいてパケットは同じ経路を通るため、ルーティングは決定
論的である。
ットワークを再構成する。
または、ネットワーク変化を信号で伝えるメッセージ(トラップ)をSMが受信した場合、SMは、発見された変化に従ってネットワークを再構成し得る。
一実施形態によれば、IBネットワークは、ネットワークファブリックを共有するシステムの論理グループの分離をもたらすためにセキュリティメカニズムとしてパーティショニングをサポートし得る。ファブリックにおけるノード上の各HCAポートは、1つ以上のパーティションのメンバであり得る。パーティションメンバーシップは、SMの一部であり得る集中型パーティションマネージャによって管理される。SMは、各ポートに関するパーティションメンバーシップ情報を、16ビットのパーティションキー(partition key:P_キー)のテーブルとして構成することができる。SMはまた、これらのポート
を介してデータトラフィックを送信または受信するエンドノードに関連付けられたP_Key情報を含むパーティション実施テーブルを用いて、スイッチポートおよびルータポートを構成することができる。加えて、一般的な場合には、スイッチポートのパーティショ
ンメンバーシップは、(リンクに向かう)出口方向に向かってポートを介してルーティングされたLIDに間接的に関連付けられたすべてのメンバーシップの集合を表わし得る。
過去10年の間に、ハードウェア仮想化サポートによってCPUオーバーヘッドが実質的に排除され、メモリ管理ユニットを仮想化することによってメモリオーバーヘッドが著しく削減され、高速SANストレージまたは分散型ネットワークファイルシステムの利用によってストレージオーバーヘッドが削減され、シングルルートI/O仮想化(Single Root Input/Output Virtualization:SR-IOV)のようなデバイス・パススルー技術
を使用することによってネットワークI/Oオーバーヘッドが削減されてきたことに応じて、仮想化された高性能コンピューティング(High Performance Computing:HPC)環境の将来見通しが大幅に改善されてきた。現在では、クラウドが、高性能相互接続ソリューションを用いて仮想HPC(virtual HPC:vHPC)クラスタに対応し、必要な性能
を提供することができる。
らのソリューションにおいて用いられる複雑なアドレス指定およびルーティングスキームのせいで、依然として問題となる。IBは、高帯域および低レイテンシを提供する相互接続ネットワーク技術であり、このため、HPCおよび他の通信集約型の作業負荷に非常によく適している。
が発生すると、IBサブネットマネージャ(Subnet Manager:SM)にサブネット管理(Subnet Administration:SA)経路記録クエリを送信することによって、再接続すべき
仮想マシンの新しいアドレスを突きとめることにより、失われた接続を回復させるように試みることができる。
IBアーキテクチャは、複数の層に分割され、複数の層の各々は、他の層とは別々にかつ独立して動作する。IB層抽象化の一端では、IB物理層はIBシステムの電気的および機械的特性を定義し、IB層抽象化の他端では、IB上位層はホストとリモートクライアントとの間でトランザクションを通信する。IBトランスポート層は、それぞれ、データの送受信時に、パーティショニング、チャネル多重化、トランスポートサービス、ならびにパケットセグメンテーションおよび再アセンブリを提供するように動作する。サブネット内におけるパケット転送およびスイッチングはIBリンク層で処理され、IBネットワーク層はあるサブネットから別のサブネットへのパケットのルーティングを処理する。
一実施形態によれば、IBベースのHPCシステムのいくつかは、ファットツリートポロジーを採用して、ファットツリーが提供する有用な特性を利用する。これらの特性は、各送信元宛先ペア間の複数経路の利用可能性に起因する、フルバイセクション帯域幅および固有の耐故障性を含む。ファットツリーの背後にある初期の概念は、ツリーがトポロジーのルート(root)に近づくにつれて、より利用可能な帯域幅を用いて、ノード間のより太いリンクを採用することであった。より太いリンクは、上位レベルのスイッチにおける輻輳を回避するのに役立てることができ、バイセクション帯域幅が維持される。
Distribution:IBベースのアプリケーションを構築しデプロイするための標準ソフト
ウェアスタック)サブネットマネージャ、すなわちOpenSMにおいて実現される。
ンのメンバではないノードは通信することを許可されない。実際には、これは、ファットツリールーティングアルゴリズムによって割当てられたルートのうちのいくつかがユーザトラフィックのために使用されないことを意味する。ファットツリールーティングメカニズムが、それらのルートについてのLFTを、他の機能的経路と同じやり方で生成する場合、問題が生じる。この動作は、リンク上でバランシングを劣化させるおそれがある。なぜなら、ノードが索引付けの順序でルーティングされているからである。パーティションに気づかずにルーティングが行なわれるため、ファットツリーでルーティングされたサブネットにより、概して、パーティション間の分離が不良なものとなる。
一実施形態に従うと、I/O仮想化(I/O Virtualization:IOV)は、基礎をなす物理リソースに仮想マシン(VM)がアクセスすることを可能にすることによって、I/Oを利用可能にすることができる。ストレージトラフィックとサーバ間通信とを組合せると、シングルサーバのI/Oリソースにとって抗し難い高い負荷が課され、結果として、データの待機中に、バックログが発生し、プロセッサがアイドル状態になる可能性がある。I/O要求の数が増えるにつれて、IOVにより利用可能性をもたらすことができ、最新のCPU仮想化において見られる性能レベルに匹敵するように、(仮想化された)I/Oリソースの性能、スケーラビリティおよび融通性を向上させることができる。
仮想化(SR-IOV)などのさまざまなタイプのIOV技術が存在し得る。
はネットワークダウンタイムのわずか数ミリ秒で実現可能である。しかしながら、ソフトウェアエミュレーションはさらなる不所望な計算上のオーバーヘッドをもたらしてしまう。
ハードウェア仮想化によって、物理装置がその同じ装置の複数の独立した軽量のインスタンスとして現われることを可能にし得る。これらのインスタンスは、パススルー装置としてVMに割当てることができ、仮想機能(Virtual Function:VF)としてアクセスすることができる。ハイパーバイザは、(1つのデバイスごとに)固有の、十分な機能を有する物理機能(Physical Function:PF)によってデバイスにアクセスする。SR-IO
Vは、純粋に直接的に割当てする際のスケーラビリティの問題を軽減する。しかしながら、SR-IOVによって提示される問題は、それがVMマイグレーションを損なう可能性があることである。これらのIOV技術の中でも、SR-IOVは、ほぼ固有の性能を維持しながらも、複数のVMから単一の物理デバイスに直接アクセスすることを可能にする手段を用いてPCI Express(PCIe)規格を拡張することができる。これにより、SR-IOVは優れた性能およびスケーラビリティを提供することができる。
常のPCIe機能であるのに対して、VFは軽量のPCIe機能である。各々のVFはそれ自体のベースアドレス(base address:BAR)を有しており、固有のリクエスタIDが割当てられている。固有のリクエスタIDは、I/Oメモリ管理ユニット(I/O memory
management unit:IOMMU)がさまざまなVFへの/からのトラフィックストリームを区別することを可能にする。IOMMUはまた、メモリを適用して、PFとVFとの間の変換を中断する。
できない。代わりに、VMに割当てられたSR-IOV VFが分離され、ライブマイグレーションが実行されることとなり、新しいVFが宛先において付与されることとなる。インフィニバンドおよびSR-IOVの場合、このプロセスがダウンタイムを数秒のオーダでもたらす可能性がある。さらに、SR-IOV共有型ポートモデルにおいては、VMのアドレスがマイグレーション後に変化することとなり、これにより、SMにオーバーヘッドが追加され、基礎をなすネットワークファブリックの性能に対して悪影響が及ぼされることとなる。
さまざまなタイプのSR-IOVモデル(たとえば共有ポートモデル、仮想スイッチモデルおよび仮想ポートモデル)があり得る。
図5は、一実施形態に従った例示的なvSwitchアーキテクチャを示す。図に示されるように、ホスト400(たとえばホストチャネルアダプタ)はハイパーバイザ410と対話することができ、当該ハイパーバイザ410は、さまざまな仮想機能430、44
0および450をいくつかの仮想マシンに割当てることができる。同様に、物理機能はハイパーバイザ410によって処理することができる。仮想スイッチ415もハイパーバイザ401によって処理することができる。
図6は、一実施形態に従った例示的なvPortの概念を示す。図に示されるように、ホスト300(たとえばホストチャネルアダプタ)は、さまざまな仮想機能330、340および350をいくつかの仮想マシンに割当てることができるハイパーバイザ410と対話することができる。同様に、物理機能はハイパーバイザ310によって処理することができる。
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
ァブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。さらに、ホストチャネルアダプタ510、520および530は、それぞれ、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550はハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当て、仮想マシン3
552を仮想機能3 516に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上で十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
LIDと、物理機能のために1つのLID)を消費する。このようなIBサブネットにおいては、単一のサブネットについて理論上のハイパーバイザ限度は利用可能なユニキャストLIDの数によって規定されており、(49151個の利用可能なLIDをハイパーバイザごとに17個のLIDで割って得られる)2891であり、VMの総数(すなわち限度)は(ハイパーバイザごとに2891個のハイパーバイザに16のVFを掛けて得られる)46256である(実質的には、IBサブネットにおける各々のスイッチ、ルータまたは専用のSMノードが同様にLIDを消費するので、これらの数は実際にはより小さくなる)。なお、vSwitchが、LIDをPFと共有することができるので、付加的なLIDを占有する必要がないことに留意されたい。
を可能にする。VMをマイグレートしてその関連するLIDを宛先に送達する必要がある場合、不連続なLIDを自由に使用できることは特に有用となる。
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
551を仮想機能2 515に割当て、仮想マシン3 552を仮想機能3 516に割当てることができる。ハイパーバイザ531はさらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
においては、新しい1セットのルートの演算には数分かかる可能性があり、この手順は、新しいVMがブートされるたびに繰返されなければならないだろう。
図9は、一実施形態に従った、動的LID割当てがなされてLIDが予めポピュレートされたvSwitchを備えた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501~504は、ネットワーク切替環境800(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、それぞれ、さらに、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550は、ハイパーバイザ511によって仮想機
能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2
551を仮想機能2 515に割当てることができる。ハイパーバイザ521は、仮想マシン3 552を仮想機能3 526に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能2 535に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
トを有することができ(冗長性のために2つのポートが共用となっている)、仮想HCAも2つのポートで表わされ、1つまたは2つ以上の仮想スイッチを介して外部IBサブネットに接続され得る。
一実施形態によれば、本開示の実施形態は、単一サブネット内にインフィニバンドファブリックを提供することに加えて、2つ以上のサブネットにまたがるインフィニバンドファブリックを提供することもできる。
ファブリックマネージャ(図示せず)に関連付けることができる。ファブリックマネージャは、例えば、サブネット間ファブリックトポロジを発見し、ファブリックプロファイル(例えば、仮想マシンファブリックプロファイル)を作成し、仮想マシンファブリックプロファイルを構築するための基礎を形成する仮想マシン関連データベースオブジェクトを構築するために使用することができる。加えて、ファブリックマネージャは、どのサブネットがどのパーティション番号を使用してどのルータポートを介して通信することが許可されているかに関して、法的なサブネット間接続を定義することができる。
レイヤ2(L2)アドレス指定の場合、例示的な実施形態は、各サブネット内において「通常の」ローカルIDベースのルーティング/転送を使用する。つまり、IBパケットのローカルルートヘッダ(LRH)における16ビットの宛先ローカル識別子(DLID)は、スイッチポートでルーティングされているときに探索され、出力ポートは、IBパケットのLRHにおけるDLID値を使用してハードウェアでLFTを直接索引付けすることによって迅速に発見される。
例示的な実施形態におけるパケットのグローバルルートヘッダ(GRH)は、本質的に128ビットスキーム、すなわち一意の64ビットのノードアドレス‐「GUID」、および64ビットのサブネットプレフィックス番号を使用する。例示的な実施形態は、多数の独立したサブネットに分割された非常に大きなファブリックを提供し、同じルート/ルーティング能力が異なるサブネットにまたがって使用可能にされる。すなわち、例示的な実施形態では、エンドポイント間の経路は、あたかも大きな単一のサブネットがあるかのような場合と同じ方法でルーティングすることができる。
のサブネットプレフィックス番号部分から指定されたビットフィールドを抽出するためのメカニズムが提供される。例示的な実施形態のメカニズムによれば、サブネット番号を符号化するためにL3アドレスの64ビット全体を使用する代わりに、本実施形態は、指定されたビットフィールド(ISRN)をL3アドレスの64ビットのサブネットプレフィックス番号部分から抽出するためのハードウェアサポートを提供する。したがって、中間インフラストラクチャを介して(仮想)サブネットAから(仮想)サブネットBへの通信がある場合、例示の実施形態は、L3アドレスの64ビットのサブネットプレフィックス番号部分の指定されたビットフィールドにおいて、
a)宛先サブネットにおけるLID/またはそのLIDおよび
b)「中間スイッチファブリック」インフラストラクチャの「中間」LIDの両方をエンコードする。
IBファブリック全体にわたるルーティング/転送の調整された管理を伴う単一のファブリック構成内においてサブネット内トラフィックおよびサブネット間トラフィックの両方に対してスケーラブルで柔軟性があり決定論的なルーティング/転送を可能にするために必要なスイッチ/ルータオンチップリソースの量を削減するために、ある実施形態に従って、単一のサブネット内のLIDベースのテーブル探索と同じ方法で線形テーブル探索のために使用される番号を介してサブネット間のルートを識別するためのスキームが使用される。これに関して、図11は、一実施形態による、ネットワーク環境においてパケット転送ロジックにアクセスするためにインフィニバンド(IB)アドレス指定スキームを使用するデータパケットフォーマットの図を示す。図に示すように、第1のIBサブネット1100は、複数の物理(または仮想)ノード1101および1102と、サブネットアドミニストレータ(SA)1120とを含むことができる。第1のIBサブネット1100内のソースノード1101は、中間ノード1102を介して、第1のIBサブネット1100以外の第2のIBサブネットにおける宛先ノード1103にパケット(たとえば、IBパケット1110)を送信することができる。宛先ノード1103は、それが第2のIBサブネット内にあることを表すために点線で示されている。
り」を定義する。これにより、単一のLFT探索操作を、LRH.DLID値ではなく、GRH.DGID.サブネットプレフィックスの関連セクションに基づかせることができる。
できるようにする。サポートスキームは、また、任意のサブネットプレフィックスおよびGUID値の転送を可能にするために、完全なDGID値のTCAMベースの探索およびマッピングを提供する。
例示的な実施形態によるコアファブリックモデルの概要として、IBファブリック構成は、個々のサブネットに分解することができる一方で、個々の物理的または仮想的な宛先に対する個々の経路を明示的にルーティングできる柔軟性を依然として維持することができる、非常に大きなファットツリー構成に対するスケーリングを容易にする。システムは、階層的な態様で管理される単一のファブリック構成として構築されるが、最上位の管理エンティティは完全なファブリックの完全な可視性を有する。
ブネットプレフィックス値を使用できるように、ファブリックローカル/内部サブネット番号および「グローバル」サブネット番号の両方をサポートする。さらに、GRH.DGID.サブネットプレフィックスフォーマットが提供され、サポートされる。例示的な実施形態では、GRH.DGIDサブネットプレフィックスフォーマットは、ソースから最終的な宛先への経路に沿った任意のポイントにおけるGRH.DGIDからDLIDへのどのようなマッピングも行なう必要性なしに、エンドツーエンドルートをパケットヘッダ内において完全に定義できるようにするために、「サブネット間ルート番号」、ターゲット「ファブリックローカルサブネット番号」、およびターゲットサブネットにおける宛先LID値の両方を含む。
一実施形態によれば、「ローカルファブリック」は、1つ以上の物理的な「リーフサブネット」および/または「コアファブリック」トポロジ内ならびにそのようなトポロジ間の接続性を表す物理的なIBファブリックインフラストラクチャである。ローカルファブリックは階層的な態様で管理されるが、たとえば制御プレーンソフトウェアなどの最上位の中央管理エンティティが任意のID値の割り当てを管理することができるという制約を伴い、物理接続およびルーティング(パケット転送)の両方の制約を完全なローカルファブリック(すなわち、ローカルファブリックの”全体的なビュー”)全体にわたって遵守する。
一実施形態によれば、「リモートファブリック」は、1つ以上のIBリンクを介してローカルファブリックに接続される任意のトポロジ/インフラストラクチャであるが、リンクのリモート側のポートは、ローカルファブリックと同じ最上位の中央管理エンティティによって制御されない。2つの独立したローカルファブリックを接続するポートは、典型的には、ルータポートとして設定される。したがって、これら2つのポートは、一実施形態によれば、最小IBサブネットを形成する。
一実施形態によれば、「ゲートウェイサブネット」は、典型的には、1つのローカルファブリックからの1つのルータポートを他のローカルファブリックからのちょうど1つのルータポート(すなわち、中間スイッチなし)と接続することによって形成される「単純な」物理IBサブネットである。ゲートウェイサブネットは、リンクアップ時に確立される単純な構成を持ち、パケット転送ポリシーは各側のルータによって独立して制御される。2つのルータポートは、リモートファブリックについて学習するために、相互発見プロトコルを実現する。これに代えて、および/または加えて、各ローカルファブリックにおける管理入力を、必要または所望に応じて選択的に用いて、異なるゲートウェイサブネットを介してルーティングされるべき1つ以上のリモートサブネット番号および個々のGIDのセットを定義することができる。ここでのゲートウェイサブネット定義の重要な局面は、管理すべきルータまたはスイッチデバイスではなく、IBリンク上の2つの最上位の管理ドメイン間の境界を配置することである。
「リーフサブネット」は、それ自体のユニキャストおよびマルチキャストLID空間を有する物理的なIBサブネットである。計算およびストレージサーバなどのホストタイプのエンドノードは、典型的には、単一のリーフサブネットを介してローカルファブリックに接続される。しかしながら、単一のホストが、さらに所望の通りに複数のリーフサブネットと接続されてもよい。リーフサブネットは、1つ以上の協働サブネットマネージャ(SM)インスタンスによって構成および制御され、リーフサブネット内では、パケットはパケットヘッダのLRH.DLID部分に基づいて転送される。リーフサブネットは、レガシースイッチで構成されてもよく、中央の最上位の管理エンティティと並んで、リーフサブネットを制御しているサブネットマネージャのセットに入力されるポリシーを表す管理上定義された「識別サブネット番号」(ISN)によって識別される。ISNは、グローバルに一意であってもよく、好ましくは、IBリンクを介して、すなわちゲートウェイサブネットを介して直接接続できるすべてのローカルファブリックにわたって一意である。各リーフサブネットは、ポートを介して1つ以上の「コアファブリック」に接続されてもよく、各リーフサブネットは、少なくとも1つのコアファブリックに接続されると、少なくとも1つの「ファブリックローカルサブネット番号」(FLSN)に関連付けられる。FLSN値は、ローカルファブリックについての範囲を持ち、ローカルファブリック管理インフラストラクチャによって割り当てられる。加えて、リーフサブネットは、コアファブリック接続性を表さないルータポートを介して他のIBサブネットに接続されてもよい。一般的な場合において、このような「グローバル」接続は、ゲートウェイサブネットを介したリモートファブリックへの接続を表し、この種のグローバル接続の場合、ISN値は、リモートサブネット/ファブリックからのこのリーフサブネットのDGIDベースのアドレス指定に使用される。しかしながら、2つのリーフサブネットを同じローカルファブリックにおいてこのように、すなわちローカルコアファブリックを使用せずに、接続することも可能である。この種の接続は、ISNまたはFLSNベースのDGIDアドレス指定のどちらを使用してもよい。直接、リーフサブネットからの、ローカルファブリック内またはリモートファブリックへの、ルータポートベースの接続には、システムポートまたは他のルータ実現例のどちらが関係してもよい。
一実施形態によれば、「コアファブリック」は、単一のローカルファブリックのコンテキスト内で1つ以上のリーフサブネットを接続する例示的な実施形態によるトポロジである。ここでは、「中間スイッチファブリック」という表現を代わりに使用してもよい。一実施形態によれば、コアファブリックは、たとえば、同じ物理サブネット内に既に直接的な接続性を有するセクションなど、単一のリーフサブネットの異なるセクション間に追加
の接続性を提供する。例示的な実施形態では、単一のコアファブリックは、単一の「サブネット間ルート番号」(ISRN)値空間を表すことが好ましい。単一のコアファブリックは直接接続されたエンドノードを有することができる。エンドノードの特殊なケースは、スイッチ管理ポート(ポート0)である。これらは専用のISRN値を介して到達することができ、GRHベースの通信が必要である。物理IBリンクおよび/またはシステムポートを介して接続される物理エンドノードは、一般に、別個のFLSN(またはISN)値を表し、通信は、好ましくはGRHベースである。このような直接接続されたエンドノードは、一般に、わずか2つのポートおよび単一のリンク、すなわちエンドノードポートおよび関連するシステムポートを有する、「単純な」リーフサブネットを表す。例示的な実施形態の環境では、直接接続された物理エンドノードは、DLID値が一意でないかもしれないことをエンドノード実現例が処理できる限り、専用ISRN値を介してアドレス指定することもできることを理解されたい。一般に、FLSN値はローカルファブリック全体に対してグローバルでなければならないので、必要な値の空間を減らすために、別個のFLSN値をそのようなエンドポートについて選択的に割り当てないかもしれない。
一実施形態によれば、パケットの「アドレス指定モード」は、パケットがソースから宛先へどのように送られるべきかを判断するために使用されるべき特定のヘッダ情報を定義する。IBパケットは、パケットがソースから宛先へどのように送られるべきかに関する情報を含む複数のヘッダ(すなわち、LRHおよびGRH)を含んでもよい。したがって、パケットのアドレス指定モードは、どのようなそのような情報が次の転送判断に使用されるべきかを定義する。
LRH/DLIDアドレス指定モード;
GRH/ISRNアドレス指定モード;
GRH/リーフスイッチアドレス指定モード;および
GRH/DGIDアドレス指定モード。
一実施形態によれば、「転送モード」は、パケット転送判断を実行するスイッチポートに適用される。「アドレス指定モード」の概念はIBパケットのヘッダに適用されるが、転送の判断を行うスイッチポートは、あるパケットアドレス指定モードに対応する「転送モード」で動作する。スイッチポートは1つより多いアドレス指定モードを同時にサポートしてもよい。したがって、スイッチポートが特定のパケットのために正しい転送モードを選択することを可能にするために、パケットは、スイッチポートが決定論的にアドレス指定モードを判断することを可能にする情報を含まなければならないかもしれない。そのような情報には、DGIDタイプ情報および特定の転送モード(たとえば、GRH/ISRN)を示すために予約された特殊なDLID値の両方が含まれる。また、場合によっては、次ホップアドレス指定モードは、パケットにおけるアドレス情報およびファブリックにおけるポートに関連付けられる構成情報の両方の関数である。宛先リーフサブネットに到達した時点を判断するための例示的な実施形態における能力は、次ホップアドレス指定モードがパケットにおけるアドレス情報およびファブリックにおけるポートに関連付けられる構成情報の両方の関数であることの例である。
一実施形態によれば、任意の特定のリーフサブネット、コアファブリックまたはゲートウェイサブネットインスタンスは、「転送ドメイン」を表わしてもよい。IBパケットが完全なIBファブリックを通じて転送されると、図13に示すような1つ以上の「転送ドメイン」を通過し、そのような各転送ドメインは特定の転送モードおよび特定のアドレス値空間を表す。一実施形態によれば、「転送ドメイン」は、複数のリーフサブネットおよび複数のコアファブリックの間の境界である。最も単純なスキームでは、個々のシステムインスタンスは、単一の転送ドメイン、たとえば単一のリーフサブネットまたは単一のコアファブリックインスタンスに属する。この場合、リーフサブネットまたはコアファブリックインスタンスの任意の対間のすべての境界は、異なるシステムインスタンスを接続する1つ以上のリンク上に存在する。リーフサブネットおよびコアファブリックインスタンスの両方が任意のサイズを有することを可能にするために、個々のシステムインスタンスは、2つ以上の「仮想スイッチ」インスタンスに選択的に分割され、各そのような仮想スイッチは、すべてが単一のリーフサブネットまたは単一のコアファブリックへの、またはその内における接続性を表す、1つ以上の「仮想スイッチポート」の集まりを表す。この場合、転送ドメインの任意の対間の境界は、2つ以上の仮想スイッチインスタンスを接続するシステムクロスバー内に存在する。
一実施形態によれば、転送ドメインへの接続性を表す物理的なシステムポートは、本明細書では「ゲートウェイポート」と呼ばれる。以下に述べる理由から、ゲートウェイポートは、パケットをゲートウェイポートに送信する同じシステムインスタンス上の別のポートの観点から定義される。まず、ゲートウェイポートにパケットを送信することは、送信が次のいずれかであるため、パケットに対するアドレス指定モードが変更されることを意味する。
II.コアファブリックを宛先リーフに送信する、または
III.ソースリーフを宛先リーフに送信する。
されたい。例として、リンクの一方の側がコアファブリックを表し、他方の側がリーフサブネットを表し、リーフサブネット側にゲートウェイポートがない場合は、リンクのコアファブリック側のポートはリーフサブネットの一部でもある必要があり、さらに、その転送ロジックが、そのリーフサブネットにおけるサブネットマネージャによって構成される必要もあるだろう。これは、このサブネットマネージャが、次いで、コアファブリック内の最初のホップ転送を効果的に実現することを意味するので、2つの転送ドメイン間の不要な依存性は、転送ドメイン間の境界をリンクからシステムクロスバーに移動させ、ゲートウェイはコアファブリック側に位置することによって、効果的に除去され得る。上述のことが、他の方向におけるパケットの転送に対して、対応して、行われる。
一実施形態によれば、「リーフサブネット仮想スイッチ」は、同じリーフサブネットに接続する単一のシステムインスタンス上の1つ以上の物理ポートの集まりをベースライン
として定義する。ファブリックローカルサブネット番号(FLSN)が使用されている場合、同じリーフサブネット仮想スイッチにおけるすべてのポートは、通常、同じFLSN値を表わすことになる。概念的には、同じリーフサブネット仮想スイッチ内の異なるポートは異なるFLSN値を表してもよく、各ポートは、すべて同じ物理サブネットを表すにもかかわらず、1つより多い値を表してもよいことに注目されたい。また、同じFLSN値が、異なる物理リーフサブネットにおけるリーフサブネット仮想スイッチポートに関連付けられてもよい。
例示的な実施形態によれば、リーフサブネット仮想スイッチポートは、リーフサブネッ
ト仮想スイッチインスタンスに属することができ、たとえばIBリンクに到着するパケットについて出力ポート番号を探索するためにLRH.DLID値を使用する。このリーフサブネット仮想スイッチインスタンスに対して出力ポート番号が表すポートのタイプは、例示的実施形態では、メンバーの物理ポートに利用可能な構成情報によって定義される。出力ポートは、同じリーフサブネット仮想スイッチにおける別の仮想スイッチポート、コアファブリックゲートウェイポート、仮想ルータポート、または別のリーフサブネットへの直接接続性を提供するリーフサブネットゲートウェイポートを表してもよい。出力ポートは一般に物理ルータポートではない可能性があり、なぜならば、これは、新たなLRHが、パケットGRHに基づく動的な態様で構築されることになることを意味し、そして、これは、仮想ルータポートを介してしか行われ得ないからである。
一実施形態によれば、「コアファブリック仮想スイッチ」は、同じコアファブリックに接続する単一のシステムインスタンス上の1つ以上の物理ポートの集まりをベースラインとして定義する。
例示的な実施形態によれば、コアファブリック仮想スイッチインスタンスのコアファブリック仮想スイッチポートは、IBリンクに到着するパケットについて出力ポート番号を探索するためにGRH.DGID.ISRN値を使用する。探索されたポート番号がこのコアファブリック仮想スイッチインスタンスに対して表す出力ポートのタイプは、メンバーの物理ポートに利用可能な構成情報によって定義される。出力ポートは、同じコアファブリック仮想スイッチにおける別のコアファブリック仮想スイッチポート、リーフサブネットゲートウェイポート、仮想ルータポート、または別のコアファブリックへの直接接続性を提供するコアファブリックゲートウェイポートを表してもよい。
システムクロスバーベースの仮想スイッチおよび転送ドメイン境界の場合、コアファブリックゲートウェイポートである物理ポートは、関連するコアファブリック接続性を表わすコアファブリック仮想スイッチの観点から、コアファブリック仮想スイッチポートとして動作してもよいことが理解されるべきである。したがって、物理スイッチポートの観点からは、パケット転送代替策は、このセクションで説明するゲートウェイポート関連の転送に加えて、上で「コアファブリック仮想スイッチポート」に関して説明したものを含む。
SSP1510を指す。SSPには、この点でこのサブネットにおける「エンドポート」を表すことを示す属性が与えられる。特殊属性は、転送のモードにおける変更を示し、次の転送レベルでは、ローカルルートヘッダ1112におけるDLID1122を使用する代わりに、GRH/L3アドレスの64ビットのサブネットプレフィックス番号部分からの指定/専用ビットフィールド1131を使用する。本質的に、元のDLID1122は、指定/専用のビットフィールドまたはその一部で置き換えられて、例示的な実施形態による、ISRNベースの転送で使用するための新たなDLID1110’を形成する。
DLID=0xFF
着信パケットが一致するDLIDを有する場合(たとえば、0xFまたは0xFF)、Rxフィルタ1520は、パケットをSSP1510に向けることができる。一方、着信パケットが一致するDLIDを有さない(すなわち、0xFおよび0xFF以外のDLIDを伴う)場合、Rxフィルタ1520は、着信パケットを通常/レガシー転送モダリティポート1530に向けることができ、それは、IBプロトコルエンジンを使用してIBパケットを標準的なIBプロトコルに従って処理できる。
システムクロスバーベースの転送ドメイン境界の場合、リーフサブネットゲートウェイポートである物理ポートは、関連するリーフサブネット接続性を表わすリーフサブネット仮想スイッチの観点から、リーフサブネット仮想スイッチポートとして動作してもよい。したがって、物理スイッチポートの観点からは、パケット転送代替策は、このセクションで説明するゲートウェイポート関連の転送に加えて、上で「リーフサブネット仮想スイッ
チポート」に関して説明したものを含む。
力ポートとのFLSN一致がある場合には、パケットは転送される。上記のコアファブリックゲートウェイポートの議論で指摘したのと同様に、ルーティングおよび転送テーブルの設定が正しく行われている限り、この場合でも一般的にFLSNマッチングを実行する必要はないことに注目されたい。
例示的な実施形態によれば、組み合わされたコアファブリックおよびリーフサブネット仮想スイッチ構成は、同じセットのポートがコアファブリックおよびリーフサブネット仮想スイッチの両方の特性を同時に提供することを可能にする。この構成の1つの動機は、非GRHベースのデータおよび制御トラフィックが、コアファブリックにおける1つ以上のシステムインスタンスと直接接続されたノード間で生ずることを可能にすることである。コアファブリック内の転送オプションについては上で説明した。
例示的な実施形態による組み合わされたコアファブリックおよびリーフサブネット仮想スイッチポートは、GRH/ISRN転送モードとLRH/DLID転送モードとの両方をサポートする。
Dエントリと、別の構成可能なISRN値範囲とをサポートすることができる。
仮想ルータポートは、例示的な実施形態では、物理ポートの範囲外のシステムポート番号によって表される。したがって、仮想ルータポートには直接関連付けられる物理リンクはない。どの仮想スイッチポートでも仮想ルータポートを探索でき、仮想ルータポートは次いで物理出力ポートおよび次ホップLRHを定義するためにパケットGRH上で構成可能なルーティング機能を使用する。
物理ルータポートは、例示的な実施形態では、ローカルファブリックインスタンスへの進入またはローカルファブリックインスタンスから外に出ることを処理するポートである。物理ルータポートは、リンク側からIB規格に準拠したルータポートとして表される。
他の態様で参照される。
例示的な実施形態によれば、サブネット間ルート番号(ISRN)は、コアファブリックインスタンス内においてLFTエントリを索引付けするために使用されるパケットGRH.DGID.サブネットプレフィックスの可変部分によって定義される値である。ISRN値空間はコアファブリックインスタンスごとであり、ファブリックグローバルマネージャ(FGM)はISRN値の使用を調整する。
例示的な実施形態によれば、ファブリックローカルサブネット番号(FLSN)は、ローカルファブリック内で宛先サブネットを識別する値である。すべてのFLSN番号は、ファブリックグローバルマネージャ(FGM)によって割り当てられ、管理されることが好ましい。ISRN値に基づいて転送されるパケットは、宛先FLSN値も有する。
例示的な実施形態によれば、ファブリックグローバルマネージャ(FGM)は、完全なローカルファブリックインスタンスの発見および構成を実行することができる「スーパーサブネットマネージャ」である。FGMは、個々のリーフサブネットにおける「FGM認識」サブネットマネージャと協働する。
例示的な実施形態によれば、識別サブネット番号(ISN)は、グローバルまたはサイトに特定の一意性を有してもよい、管理上割り当てられたサブネット番号である。ISN番号は、異なるローカルファブリックインスタンス間においてサブネット間トラフィック
に選択的に使用されるGID値を形成するために、GUIDとともに使用される。
例示的な実施形態によれば、ハードウェアGUIDは、ハードウェアリソースの64ビットのグローバルに一意の識別情報である。例示的な実施形態における各物理システムインスタンスは、ベースHW GUID値を有する。各システムベースの仮想スイッチインスタンスは、予め定義された方法でベースHW GUIDから導出されるHW GUIDを有する。各物理HCAは、ベースHW GUIDを有することになる。各仮想HCAポートは、予め定義された方法でベースHW GUIDから導出されるHW GUIDを有することになる。
例示的な実施形態によれば、仮想GUID(vGUID)は、グローバルに一意またはローカルファブリック内で一意である64ビットのGUID値である。仮想GUIDは、ローカルファブリックに存在する任意のHW GUIDに対して一意であることも保証される。
パケットローカルおよびグローバルルートヘッダ(LRH/GRH)フォーマットおよび規約のための基準について以下に説明する。第1に、本明細書の例示的な実施形態で使用されるローカルルートヘッダ(LRH)は、インフィニバンド(IB)規格によって定義される通りである。同様に、本明細書の例示的な実施形態で使用されるグローバルルートヘッダ(GRH)は、インフィニバンド(IB)規格によって定義される通りであるが、2つの追加/例外のセットを有する:1)GRH.DGID.SUBNET_PREFIXはタイプ「ISRN」を有することができ、2)GRH.DGID.SUBNET_PREFIXはタイプ「LeafSwitchHierarchy(
リーフスイッチ階層)」を有することができる。
(宛先)ファブリックローカルサブネット番号
サブネット間ルート番号(すなわち、ソースリーフサブネットにおいて最初のLRH.DLID値によって定義されるコアファブリックインスタンスにおける)
DLID(ファブリックローカルサブネット番号で定義される宛先リーフサブネットにおける)。
(宛先)ファブリックローカルサブネット番号
(宛先)リーフスイッチ番号
すべての特殊なサブフィールドは、ランタイムで定義されるサイズおよびオフセットを
有する。(すなわち、サブフィールド抽出を実行するために専用TCAMエントリを使用することによって可能にされる)。
本明細書の例示的な実施形態によれば、単一のリーフサブネット内において、LRHのみを有し、GRHを有さないパケットは、レガシーのSLからVLへのマッピングを使用していることになる。例示的な実施形態は、予約ビットおよび新たなヘッダバージョン番号を使用することによって、ローカルLIDおよび/またはSL/VL値空間を所望または必要に応じて選択的に拡張してもよい。LFTによって探索可能なポート番号の数を拡張することは、より多くのそのような「エイリアス」ポート番号が、関連付けられる物理ポートについて他のSL/VLマッピングを表すことを可能にする。(すなわち、SL/VL処理と同じ効果であるが、予約されたLRHビットの所有権を主張できる使用に頼るのではなく、LFTメモリを消費する。)これは、トラフィック分離を達成するために異なるSL値ではなく複数のDLID値を使用することを意味する。
デフォルトでは、ローカルファブリック内で使用するために定義されたものと同じGRHベースのスキームが、例示的な実施形態によってサポートされる。基本的なマッピングに加えて、たとえば、リモートファブリックにおいてゲートウェイサブネット/ルータポートにパケットを送信するルータポートなどの出口ルータポートは、すべてのそのようなパケットまたはサブセットを、定義された基準に基づいて、ローカルファブリックに輻輳ツリーが蓄積されないようにパケットを「早期に」ドロップする、より「積極的な」クレジット待機ポリシーを有するとして分類してもよい。
例示的な実施形態における各転送ドメインは、ローカルファブリックレベルでの調整なしにリーフサブネットの内部のトラフィックに使用できるP_Key値の範囲を有する。つまり、すべての転送ドメインによって、同じプライベート範囲を使用できる。ローカル範囲外のP_Key値は、FGMを介して割当てられる。FGMは、ゲートウェイポートが、関連する転送ドメインに転送されることを許されるP_Key値を持つパケットの転送のみを受け入れることを保証する。
でのP_Key値のマッピングを含む特殊な経路を定義することができる。一般に、そのようなマッピングは、パケット不変CRC(ICRC)が再計算されることを意味する。HCAなどのエンドノードからのサポートを含む代替スキームとして、あるスキームが提供され、通常のパケットICRCは、0のパケットP_Key値に基づいて計算されるが、加えて、GRHにおいて、ICRCに含まれない予約ビットフィールドを有し、しかし、それは、現在のP_Key値に対するCRCパリティ値を含む。
本明細書で説明される例示的な実施形態は、一般に、異なるローカルファブリックインスタンス間の調整されたP_Key値割り当てについての仮定をなさない。ネイティブIB通信は、この場合、関与するローカルファブリックインスタンス間の動的に交渉されるP_Key値に基づくか、または上記のローカルファブリックの場合について概説されたP_Keyマッピングスキームに基づく。
例示的な実施形態では、各転送ドメインは、各転送ドメインに対してプライベートであるとみなされるMLID値の範囲を有し、すべての転送ドメインが同じプライベート範囲を使用することができる。プライベートMLIDにマッピングされるマルチキャストグループは、ローカル転送ドメイン内でのみ転送できる。FGMは、プライベートMLID転送が転送ドメイン境界を超えて行われないようにし、完全なローカルファブリックインスタンス全体にわたるマルチキャスト転送を実現するために使用できる共有MLID値のセットを調整する。完全なローカルファブリック全体にわたって共有MLID値を介して使用されるMGID値は、FGMによって割当てられる。そのようなMGID値は、それをFGM制御されるMGIDであるよう定義する選択されたビットフィールドを有する。各転送ドメイン内におけるローカルSMは、FGM制御されるMGIDの競合する使用がないことを保証することを担う。
本明細書で説明される例示的な実施形態は、一般に、異なるローカルファブリックインスタンス間の調整されたMGID値割り当てについての仮定をなさない。純粋なハードウェアベースの転送を伴うネイティブIBマルチキャスト通信は、この場合、関与するローカルファブリックインスタンス間の動的に交渉されるMGID値に基づく。
て専用MLIDを使用する「デフォルトMC宛先」のスキームまたは概念を使用し得る。これは、受信機が任意の数のMGIDを受信し、プロキシインスタンスに関連付けられるQPに転送できる限り、実行可能である。これは、多数のパーティションも含んでもよい。この機能性が関連するHCAに対して保証することが困難である場合、本明細書の別の実施形態は、EnetパケットがEnetGWポートで受信されたときにトンネリングされる方法と同様の方法で、システムがIB MCパケットをIBユニキャストパケットでトンネリングするように機能することである。したがって、プロキシ実装は、着信リモートMCパケットを、ローカルファブリック上でどのようにトンネリングするかとは無関係に、解釈して処理することができる。
例示的な実施形態によれば、デフォルトでは、各システムインスタンスは、単一の従来のインフィニバンド(IB)スイッチとして動作する。このデフォルト構成では、既存のIB サブネットマネージャまたはSMPベースの診断および監視ツールは、完全な接続されたファブリックを単一のIBサブネットとして「見る」かまたは他の態様で学習することができる。
ISRN値と組合わせることに基づいて、完全な経路を構築できる。
例示的な実施形態によれば、各リーフサブネットにおける物理エンドノードおよび仮想エンドノードは、ローカルマスタサブネットマネージャ(SM)によって発見され、構成される。各マスタサブネットマネージャは、照会およびイベントによって、中央FGMに、それのローカルノードポピュレーションに関して通知する。物理および仮想管理サーバならびにスイッチ管理ポートを含む通信エンドノードを伴うコアファブリックの場合、関連するFGMインスタンスは、リーフサブネットにおけるマスタSMと同じ態様で、ポピュレーションに関する情報を追跡または他の態様で維持する。これにより、中央FGMは、GUIDに基づいて任意のエンドノードの所在を追跡することができ、したがって任意の必要な通信に関する関連する経路情報を構築することができる。
ける値の割当ては、関連する転送ドメイン外で可視になるよう許されもしなければ、他の転送ドメインに悪影響を与えもしないことになることに注目されたい。
例示的な実施形態によれば、単一リーフサブネット内での仮想マシン(VM)マイグレーションは、一意のDLID値を用いて、VMが表わしている仮想HCAポートを示す限り、アドレス情報の変更なしに生じ得る。
単一のリーフサブネット内では、例示的な実施形態のシステムは、インフィニバンド(IB)規格に従って線形転送テーブル(LFT)を使用してLRH.DLIDベースのパケット転送を実現する。デフォルトでは、各仮想スイッチは、完全な48KのユニキャストDLID空間をサポートするLFTと、完全な16KのマルチキャストDLID空間をサポートするマルチキャスト転送テーブルとを有する。システムに対するPORが、物理ポートの対によって共有されるプライベートユニキャストおよびマルチキャストLFTを有することになる限り、仮想スイッチポートメンバーシップを構成する最小限の細分性は、LFTを共有する2つのポートのグループである。次に、拡張されたSMおよびFGMルーティングロジックで、仮想スイッチごとの複数の独立したLFTをサポートしてもよい。しかしながら、LFTが1つより多い物理ポートによって共有されている限り、依存性は、実際の物理トポロジがそれ自体を複数の独立したLFTの処理に供することである。
ィ」を有することを可能にするために、各入力ポートに関連付けられるレジスタを介して利用可能なタイプの出力ポートを有することは最も柔軟なスキームである。これは、LFTエントリにおいてエンコードされるポートタイプを有することに対して空間を節約し、それは、柔軟性を与え、共有LFTエントリ、および出力ポートのタイプがチップ全体に対して一回定義される集中型アプローチを使用することの両方に対して、アクセス調停の必要性がない。新たなアドレス指定モードで新たなパケットを構築するためのハードウェアサポートは、内部レジスタに基づく固定されたLRH.DLIDの生成、およびGRHから正しいISRNビットフィールドを識別して抽出するロジックを含む。
ードで動作することを依然として可能にしながらアドレス指定モードにおける必要な変更を識別するためには、上記のケースに対してのように、入口ポートが、可能な出力ポートごとに、フラグを有して、出力ポートがアドレス指定モードにおける変更を表すかどうか、または出力ポートがアドレス指定モードの変更を表さないかどうかを示せば十分である。
任意の数の入力DGID.サブネットプレフィックス値をサポートするが、依然としてDGID.GUID値をターゲット物理または仮想HCAポートについて検証できるようにするために、そのようなターゲット(v)HCAは、実施形態に従って、あるモードを含み、着信GRH.DGIDを物理または仮想のHCAポートについてハードウェアおよびエイリアスGID値に対してチェックすることはGUID部分のみに制限され、サブネットプレフィックス部分は無視される。
図16は、高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するための一実施形態による方法1600を示す。ここで、図の方法について説明する。第1および第2のサブネットは、ネットワークファブリックを含むコンピュータ環境で提供される。第1のサブネットは第2のサブネットとは異なる。第1のサブネットは、第1のセットのネットワークスイッチを含み、第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含む。第2のサブネットは、第2のセットのネットワークスイッチを含み、第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含む。これは、本方法の例示的な実施形態の環境である。全体として、方法1600は、第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの同じ第1のLFTが、第1のサブネットの第1のセットのネットワークスイッチのネットワークスイッチ間で転送されるべきパケットのサブネット内転送判断、ならびに第1および第2のサブネットのそれぞれの第1のセットのネットワークスイッチおよび第2のセットのネットワ
ークスイッチの間で転送されるべきパケットのサブネット間転送判断の両方に対して用いられることを可能にする。
にルーティングすることとを含み、第2のサブネットはネットワークスイッチ環境の中間コアファブリックである。
ードウェアにおいて実現されてもよい。ここに説明された機能を行なうようにハードウェアステートマシンを実現することは、関連技術の当業者には明らかであろう。
いない。例示的実施形態の幅および範囲は、上述の例示的な実施形態のいずれによっても限定されるべきでない。多くの変更および変形が、当業者には明らかになるだろう。これらの変更および変形は、開示された特徴の関連するあらゆる組合せを含む。実施形態は、この発明の原理およびその実用的応用を最良に説明するために選択され説明されたものであり、それにより、考えられる特定の使用に適したさまざまな実施形態についての、およびさまざまな変更例を有するこの発明を、当業者が理解できるようにする。この発明の範囲は、請求項およびそれらの同等例によって定義されるよう意図されている。
Claims (22)
- 高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するための方法であって、
ネットワークファブリックを含むコンピュータ環境において、第1および第2のサブネットを提供することを備え、前記第1のサブネットは前記第2のサブネットとは異なり、前記第1のサブネットは、第1のセットのネットワークスイッチを含み、前記第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含み、前記第2のサブネットは、第2のセットのネットワークスイッチを含み、前記第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含み、前記方法はさらに、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの同じ第1のLFTが、前記第1のサブネットの前記第1のセットのネットワークスイッチのネットワークスイッチ間で転送されるべきパケットのサブネット内転送判断、ならびに前記第1および第2のサブネットのそれぞれの前記第1のセットのネットワークスイッチおよび前記第2のセットのネットワークスイッチの間で転送されるべきパケットのサブネット間転送判断の両方に対して用いられることを、
第1のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、
前記第1のパケットのヘッダの第1の部分を検査することと、
前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断することと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第1の条件に従って、前記サブネット内転送判断を選択的に行なうことと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第2のサブネットの第2のネットワークスイッチのセットのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第2の条件に従って、前記サブネット間転送判断を選択的に行なうこととによって、可能にすることを備える、高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するための方法。 - 前記第1のパケットの前記ヘッダの前記第1の部分を検査することは、前記第1のパケットの前記ヘッダのローカルルートヘッダ(LRH)部分を検査することを含み、
前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断することは、前記LRHの選択された部分を前記第1のネットワークスイッチに格納される所定の値と比較することと、
前記LRHの前記選択された部分と前記所定の値との間の不一致に従って前記第1の条件を選択的に判断することと、
前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することととを含む、請求項1に記載の方法。 - 前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することは、前記LFTを使用して、前記LRHの前記選択された部分を使用して特殊スイッチポート(SSP)を索引付することを含む、請求項2に記載の方法。
- 前記第1のパケットを、前記第2のサブネットの前記第2のネットワークスイッチのセ
ットのうちの選択されたネットワークスイッチにルーティングすることは、
前記第1のパケットの前記ヘッダのグローバルルートヘッダ(GRH)部分のセクションを選択することを含み、前記ヘッダの前記GRH部分の前記選択されたセクションは、サブネット間ルート番号(ISRN)を格納し、前記ルーティングすることはさらに、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のネットワークスイッチのセットのうちの前記選択されたネットワークスイッチにルーティングすることとを含み、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、先行する請求項のいずれか1つに記載の方法。 - 前記ネットワークスイッチ環境の前記中間コアファブリックから、第2のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、
中間コアファブリックから受信される前記第2のパケットが前記ISRNを使用して転送されていると判断することと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、中間コアファブリックから受信される前記第2のパケットが、前記ISRNを使用して、および前記第2のパケットのヘッダに含まれるターゲットローカル識別子(LID)を使用して転送されていると判断することに従って、前記サブネット内転送判断を行なうこととをさらに備える、請求項4に記載の方法。 - 前記第1のネットワークスイッチでフィルタを使用して、前記第1のパケットのターゲットローカル識別子(LID)をフィルタリングして、前記第1のパケットが特殊スイッチポート(SSP)をターゲットとしているかどうかを判断することをさらに備える、請求項1または2に記載の方法。
- 前記サブネット内転送判断を行うことは、第1のパケットが前記SSPをターゲットとしていないと判断することを含み、
前記サブネット間転送判断を行うことは、前記第1のパケットが前記SSPをターゲットとしていると判断することを含む、請求項6に記載の方法。 - 高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するためのシステムであって、
コンピューティング環境を備え、前記コンピューティング環境は、
ネットワークファブリックと、
第1のサブネットと、
第2のサブネットとを含み、前記第1のサブネットは前記第2のサブネットとは異なり、前記第1のサブネットは、第1のセットのネットワークスイッチを含み、前記第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含み、前記第2のサブネットは、第2のセットのネットワークスイッチを含み、前記第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含み、前記システムはさらに、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの第1のLFTを備え、
前記第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの同じ第1のLFTが、前記コンピューティング環境によって、前記第1のサブネットの前記第1のセットのネットワークスイッチのネットワークスイッチ間で転送されるべきパケットのサブネット内転送判断、ならびに前記第1および第2のサブネットのそれぞれの前記第
1のセットのネットワークスイッチおよび前記第2のセットのネットワークスイッチの間で転送されるべきパケットのサブネット間転送判断の両方に対して用いられ、前記コンピュータ環境は、
第1のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、
前記第1のパケットのヘッダの第1の部分を検査することと、
前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断することと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第1の条件に従って、前記サブネット内転送判断を選択的に行なうことと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第2のサブネットの第2のネットワークスイッチのセットのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第2の条件に従って、前記サブネット間転送判断を選択的に行なうこととによって行なわれる、高性能コンピューティング環境でのネットワークスイッチ環境における線形転送テーブル探索のためにパケットヘッダを使用するためのシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記第1のパケットの前記ヘッダのローカルルートヘッダ(LRH)部分を検査することによって前記第1のパケットの前記ヘッダの前記第1の部分を検査し、
前記LRHの選択された部分を前記第1のネットワークスイッチに格納される所定の値と比較することによって前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断し、
前記LRHの前記選択された部分と前記所定の値との間の不一致に従って前記第1の条件を選択的に判断し、
前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断するよう動作可能である、請求項8に記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断するよう動作可能であり、前記LFTを使用して、前記LRHの前記選択された部分を使用して特殊スイッチポート(SSP)を索引付することを含む、請求項9に記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、前記第1のパケットを、前記第2のサブネットの前記第2のネットワークスイッチのセットのうちの選択されたネットワークスイッチにルーティングするよう動作可能であり、前記ルーティングは、
前記第1のパケットの前記ヘッダのグローバルルートヘッダ(GRH)部分のセクションを選択することによって行われ、前記ヘッダの前記GRH部分の前記選択されたセクションは、サブネット間ルート番号(ISRN)を格納し、前記ルーティングはさらに、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のネットワークスイッチのセットのうちの前記選択されたネットワークスイッチにルーティングすることとによって行われ
、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、先行する請求項のいずれか1つに記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記ネットワークスイッチ環境の前記中間コアファブリックから、第2のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信し、
中間コアファブリックから受信される前記第2のパケットが前記ISRNを使用して転送されていると判断し、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、中間コアファブリックから受信される前記第2のパケットが、前記ISRNを使用して、および前記第2のパケットのヘッダに含まれるターゲットローカル識別子(LID)を使用して転送されていると判断することに従って、前記サブネット内転送判断を行なうよう動作可能である、請求項11に記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記第1のネットワークスイッチでフィルタを使用して、前記第1のパケットのターゲットローカル識別子(LID)をフィルタリングして、前記第1のパケットが特殊スイッチポート(SSP)をターゲットとしているかどうかを判断するよう動作可能である、請求項8または9に記載のシステム。 - 前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチは、
前記第1のパケットが前記SSPをターゲットとしていないと判断することを含む前記サブネット内転送判断を行ない、
前記第1のパケットが前記SSPをターゲットとしていると判断することを含む前記サブネット間転送判断を行うよう動作可能である、請求項13に記載のシステム。 - 命令が記憶される非一時的な機械可読媒体であって、前記命令は、ネットワークファブリックと第1サブネットおよび前記第1サブネットとは異なる第2のサブネットとを含む関連付けられるコンピュータによって実行されると、前記関連付けられるコンピュータにステップを実行させ、前記ステップは、
ネットワークファブリックを含むコンピュータ環境において、第1および第2のサブネットを提供することを含み、前記第1のサブネットは前記第2のサブネットとは異なり、前記第1のサブネットは、第1のセットのネットワークスイッチを含み、前記第1のセットのネットワークスイッチの各々は、線形転送テーブル(LFT)および複数の物理ポートを含み、前記第2のサブネットは、第2のセットのネットワークスイッチを含み、前記第2のセットのネットワークスイッチの各々は、LFTおよび複数の物理ポートを含み、前記ステップはさらに、
前記第1のサブネットの第1のセットのネットワークスイッチのうちの第1のネットワークスイッチの同じ第1のLFTが、前記第1のサブネットの前記第1のセットのネットワークスイッチのネットワークスイッチ間で転送されるべきパケットのサブネット内転送判断、ならびに前記第1および第2のサブネットのそれぞれの前記第1のセットのネットワークスイッチおよび前記第2のセットのネットワークスイッチの間で転送されるべきパケットのサブネット間転送判断の両方に対して用いられることを、
第1のパケットを、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの前記第1のネットワークスイッチで受信することと、
前記第1のパケットのヘッダの第1の部分を検査することと、
前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断することと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第1のサブネットの前記第1のセットのネットワークスイッチのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第1の条件に従って、前記サブネット内転送判断を選択的に行なうことと、
前記第1のネットワークスイッチの前記同じ第1のLFTを使用して、前記第2のサブネットの第2のネットワークスイッチのセットのうちの選択されたネットワークスイッチに前記第1のパケットをルーティングするために、前記第1のパケットの前記ヘッダの前記第1の部分の第2の条件に従って、前記サブネット間転送判断を選択的に行なうこととによって、可能にすることを含む、非一時的な機械可読媒体。 - 前記第1のパケットの前記ヘッダの前記第1の部分を検査することは、前記第1のパケットの前記ヘッダのローカルルートヘッダ(LRH)部分を検査することを含み、
前記第1のパケットの前記ヘッダの前記第1の部分の条件を判断することは、前記LRHの選択された部分を前記第1のネットワークスイッチに格納される所定の値と比較することと、
前記LRHの前記選択された部分と前記所定の値との間の不一致に従って前記第1の条件を選択的に判断することと、
前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することとを含む、請求項15に記載の非一時的な機械可読媒体。 - 前記LRHの前記選択された部分と前記所定の値との間の一致に従って前記第2の条件を選択的に判断することは、前記LFTを使用して、前記LRHの前記選択された部分を使用して特殊スイッチポート(SSP)を索引付することを含む、請求項16に記載の非一時的な機械可読媒体。
- 前記第1のパケットを、前記第2のサブネットの前記第2のネットワークスイッチのセットのうちの選択されたネットワークスイッチにルーティングすることは、
前記第1のパケットの前記ヘッダのグローバルルートヘッダ(GRH)部分のセクションを選択することを含み、前記ヘッダの前記GRH部分の前記選択されたセクションは、サブネット間ルート番号(ISRN)を格納し、前記ルーティングすることはさらに、
前記GRHの前記ISRNを使用して、前記第1のネットワークスイッチの前記第1のLFTを索引付けすることと、
前記GRHの前記ISRNを使用して前記第1のLFTを索引付けすることに従って、前記第1のパケットを前記第2のサブネットの前記第2のネットワークスイッチのセットのうちの前記選択されたネットワークスイッチにルーティングすることとを含み、前記第2のサブネットは前記ネットワークスイッチ環境の中間コアファブリックである、請求項15~17のいずれか1つに記載の非一時的な機械可読媒体。 - 前記第1のネットワークスイッチでフィルタを使用して、前記第1のパケットのターゲットローカル識別子(LID)をフィルタリングして、前記第1のパケットが特殊スイッチポート(SSP)をターゲットとしているかどうかを判断することをさらに含む、請求項15または16に記載の非一時的な機械可読媒体。
- 前記サブネット内転送判断を行なうことは、前記第1のパケットが前記SSPをターゲットとしていないと判断することを含み、
前記サブネット間転送判断を行なうことは、前記第1のパケットが前記SSPをターゲットとしていると判断することを含む、請求項19に記載の非一時的な機械可読媒体。 - コンピュータシステムによって実行されると、前記コンピュータシステムに請求項1~7のいずれか1つに記載の方法を実行させる、機械可読フォーマットにおけるプログラム命令を備える、コンピュータプログラム。
- 非一時的な機械可読データ記憶媒体に記憶される請求項21のコンピュータプログラムを備えるコンピュータプログラム製品。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023033737A JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662288101P | 2016-01-28 | 2016-01-28 | |
US62/288,101 | 2016-01-28 | ||
US15/416,642 US10230607B2 (en) | 2016-01-28 | 2017-01-26 | System and method for using subnet prefix values in global route header (GRH) for linear forwarding table (LFT) lookup in a high performance computing environment |
US15/416,642 | 2017-01-26 | ||
PCT/US2017/015464 WO2017132585A1 (en) | 2016-01-28 | 2017-01-27 | System and method for using subnet prefix values in global route header (grh) for linear forwarding table (lft) lookup in a high performance computing environment |
JP2018510374A JP6957451B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510374A Division JP6957451B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023033737A Division JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022008890A true JP2022008890A (ja) | 2022-01-14 |
JP7241146B2 JP7241146B2 (ja) | 2023-03-16 |
Family
ID=59387324
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510382A Active JP6883568B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境における着信パケット処理のために複数のグローバル識別子(gid)サブネットプレフィックス値を同時に許容するためのシステムおよび方法 |
JP2018510374A Active JP6957451B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
JP2021164659A Active JP7241146B2 (ja) | 2016-01-28 | 2021-10-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
JP2023033737A Pending JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510382A Active JP6883568B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境における着信パケット処理のために複数のグローバル識別子(gid)サブネットプレフィックス値を同時に許容するためのシステムおよび方法 |
JP2018510374A Active JP6957451B2 (ja) | 2016-01-28 | 2017-01-27 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023033737A Pending JP2023078206A (ja) | 2016-01-28 | 2023-03-06 | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (11) | US10581711B2 (ja) |
EP (2) | EP3408981B1 (ja) |
JP (4) | JP6883568B2 (ja) |
CN (3) | CN107925622A (ja) |
WO (2) | WO2017132585A1 (ja) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8942258B2 (en) | 2012-09-14 | 2015-01-27 | International Business Machines Corporation | Segmentation and reassembly of network packets for switched fabric networks |
US10581711B2 (en) | 2016-01-28 | 2020-03-03 | Oracle International Corporation | System and method for policing network traffic flows using a ternary content addressable memory in a high performance computing environment |
US10778612B2 (en) * | 2016-05-26 | 2020-09-15 | Arista Networks, Inc. | Variable TCAM actions |
US10397136B2 (en) | 2016-08-27 | 2019-08-27 | Nicira, Inc. | Managed forwarding element executing in separate namespace of public cloud data compute node than workload application |
US10341371B2 (en) | 2016-08-31 | 2019-07-02 | Nicira, Inc. | Identifying and handling threats to data compute nodes in public cloud |
US10594577B2 (en) | 2016-12-19 | 2020-03-17 | Cisco Technology, Inc. | Sorting and displaying network traffic analytics |
US20190045412A1 (en) * | 2017-08-02 | 2019-02-07 | Sears Brands, L.L.C. | Automatically switching communication pathways between connected devices |
US10567482B2 (en) | 2017-08-24 | 2020-02-18 | Nicira, Inc. | Accessing endpoints in logical networks and public cloud service providers native networks using a single network interface and a single routing table |
CN114584465A (zh) | 2017-08-27 | 2022-06-03 | Nicira股份有限公司 | 在公共云中执行在线服务 |
US20190068466A1 (en) * | 2017-08-30 | 2019-02-28 | Intel Corporation | Technologies for auto-discovery of fault domains |
CN107484201B (zh) * | 2017-09-30 | 2020-08-14 | Oppo广东移动通信有限公司 | 流量统计方法和装置、终端、计算机可读存储介质 |
US10862753B2 (en) | 2017-12-04 | 2020-12-08 | Nicira, Inc. | High availability for stateful services in public cloud logical networks |
US10601705B2 (en) | 2017-12-04 | 2020-03-24 | Nicira, Inc. | Failover of centralized routers in public cloud logical networks |
US10708309B2 (en) * | 2018-01-10 | 2020-07-07 | Cisco Technology, Inc. | Fine granularity authorization control in FC-NVMe storage area network |
US11343229B2 (en) | 2018-06-28 | 2022-05-24 | Vmware, Inc. | Managed forwarding element detecting invalid packet addresses |
US10491466B1 (en) * | 2018-08-24 | 2019-11-26 | Vmware, Inc. | Intelligent use of peering in public cloud |
US11196591B2 (en) | 2018-08-24 | 2021-12-07 | Vmware, Inc. | Centralized overlay gateway in public cloud |
US11374794B2 (en) | 2018-08-24 | 2022-06-28 | Vmware, Inc. | Transitive routing in public cloud |
US11700206B2 (en) * | 2019-11-19 | 2023-07-11 | Oracle International Corporation | System and method for supporting RDMA bandwidth restrictions in a private fabric in a high performance computing environment |
US11750534B2 (en) * | 2019-12-27 | 2023-09-05 | Texas Instruments Incorporated | Packet storage based on packet properties |
US11411911B2 (en) * | 2020-10-26 | 2022-08-09 | Mellanox Technologies, Ltd. | Routing across multiple subnetworks using address mapping |
CN114448882A (zh) * | 2020-11-04 | 2022-05-06 | 国家计算机网络与信息安全管理中心 | 一种实现高性能大容量路由设备的设计方法 |
CN112073321B (zh) * | 2020-11-16 | 2021-02-09 | 北京壁仞科技开发有限公司 | 信息处理方法、互连设备和计算机可读存储介质 |
US11734036B2 (en) * | 2021-03-03 | 2023-08-22 | Dell Products L.P. | System and method to monitor and manage a passthrough device |
KR102568909B1 (ko) * | 2021-04-13 | 2023-08-21 | 에스케이하이닉스 주식회사 | PCIe 펑션 및 그 동작 방법 |
KR102570943B1 (ko) | 2021-04-13 | 2023-08-28 | 에스케이하이닉스 주식회사 | PCIe 디바이스 및 그 동작 방법 |
US11928070B2 (en) | 2021-04-13 | 2024-03-12 | SK Hynix Inc. | PCIe device |
CN116032997A (zh) * | 2022-12-29 | 2023-04-28 | 南京先进计算产业发展有限公司 | 一种高性能计算环境中的两个子网之间的互连方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130259033A1 (en) * | 2011-08-23 | 2013-10-03 | Mark S. Hefty | Gid capable switching in an infiniband fabric |
KR20150009550A (ko) * | 2012-05-11 | 2015-01-26 | 오라클 인터내셔날 코포레이션 | 소스 라우팅에 근거한 별개의 인피니밴드 서브넷들 간에 트래픽을 라우팅하기 위한 시스템 및 방법 |
US20150098466A1 (en) * | 2013-10-06 | 2015-04-09 | Mellanox Technologies Ltd. | Simplified packet routing |
WO2016007760A2 (en) * | 2014-07-11 | 2016-01-14 | Oracle International Corporation | System and method for supporting efficient load-balancing in a high performance computing (hpc) environment |
Family Cites Families (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7010607B1 (en) | 1999-09-15 | 2006-03-07 | Hewlett-Packard Development Company, L.P. | Method for training a communication link between ports to correct for errors |
US7171484B1 (en) | 2000-05-24 | 2007-01-30 | Krause Michael R | Reliable datagram transport service |
US7103626B1 (en) | 2000-05-24 | 2006-09-05 | Hewlett-Packard Development, L.P. | Partitioning in distributed computer system |
US6954459B1 (en) | 2000-06-16 | 2005-10-11 | International Business Machines Corporation | Method for forwarding broadcast packets in a bridged IP network |
US7072360B2 (en) | 2000-09-22 | 2006-07-04 | Narad Networks, Inc. | Network architecture for intelligent network elements |
US6766467B1 (en) | 2000-10-19 | 2004-07-20 | International Business Machines Corporation | Method and apparatus for pausing a send queue without causing sympathy errors |
US20020156918A1 (en) | 2001-04-23 | 2002-10-24 | Brocade Communications Systems, Inc. | Dynamic path selection with in-order delivery within sequence in a communication network |
US8935333B2 (en) | 2001-08-09 | 2015-01-13 | International Business Machines Corporation | Implementing multicast on a system area network channel adapter |
US6922749B1 (en) | 2001-10-12 | 2005-07-26 | Agilent Technologies, Inc. | Apparatus and methodology for an input port of a switch that supports cut-through operation within the switch |
US6839794B1 (en) | 2001-10-12 | 2005-01-04 | Agilent Technologies, Inc. | Method and system to map a service level associated with a packet to one of a number of data streams at an interconnect device |
US7245627B2 (en) | 2002-04-23 | 2007-07-17 | Mellanox Technologies Ltd. | Sharing a network interface card among multiple hosts |
US7149221B2 (en) | 2002-05-31 | 2006-12-12 | Palau Acquisition Corporation (Delaware) | Apparatus and methods for increasing bandwidth in an infiniband switch |
US7307996B2 (en) | 2002-07-30 | 2007-12-11 | Brocade Communications Systems, Inc. | Infiniband router having an internal subnet architecture |
US7401157B2 (en) | 2002-07-30 | 2008-07-15 | Brocade Communications Systems, Inc. | Combining separate infiniband subnets into virtual subnets |
US7221676B2 (en) | 2002-07-30 | 2007-05-22 | Brocade Communications Systems, Inc. | Supporting local IB packet communication between separate subnets |
US20040030763A1 (en) * | 2002-08-08 | 2004-02-12 | Manter Venitha L. | Method for implementing vendor-specific mangement in an inifiniband device |
US7356033B2 (en) | 2002-11-21 | 2008-04-08 | Lucent Technologies Inc. | Method and apparatus for performing network routing with use of power efficient TCAM-based forwarding engine architectures |
US7493409B2 (en) | 2003-04-10 | 2009-02-17 | International Business Machines Corporation | Apparatus, system and method for implementing a generalized queue pair in a system area network |
US7574526B2 (en) | 2003-07-31 | 2009-08-11 | International Business Machines Corporation | Multicast group management in infiniband |
US7421488B2 (en) | 2003-08-14 | 2008-09-02 | International Business Machines Corporation | System, method, and computer program product for centralized management of an infiniband distributed system area network |
US7979548B2 (en) | 2003-09-30 | 2011-07-12 | International Business Machines Corporation | Hardware enforcement of logical partitioning of a channel adapter's resources in a system area network |
US20050074003A1 (en) * | 2003-10-02 | 2005-04-07 | Ball David Alexander | Distributed software architecture for implementing BGP |
US7428598B2 (en) | 2003-11-20 | 2008-09-23 | International Business Machines Corporation | Infiniband multicast operation in an LPAR environment |
US7602712B2 (en) | 2004-06-08 | 2009-10-13 | Sun Microsystems, Inc. | Switch method and apparatus with cut-through routing for use in a communications network |
US7639616B1 (en) | 2004-06-08 | 2009-12-29 | Sun Microsystems, Inc. | Adaptive cut-through algorithm |
US7400590B1 (en) | 2004-06-08 | 2008-07-15 | Sun Microsystems, Inc. | Service level to virtual lane mapping |
US7860096B2 (en) | 2004-06-08 | 2010-12-28 | Oracle America, Inc. | Switching method and apparatus for use in a communications network |
US7911977B2 (en) | 2005-05-31 | 2011-03-22 | Cisco Technology, Inc. | Designated router assignment per multicast group address/range |
WO2007009228A1 (en) | 2005-07-17 | 2007-01-25 | Obsidian Research Corporation | A method to extend the physical reach of an infiniband network |
US7706303B2 (en) | 2006-06-26 | 2010-04-27 | Cisco Technology, Inc. | Port pooling |
US7936753B1 (en) | 2007-11-30 | 2011-05-03 | Qlogic, Corporation | Method and system for reliable multicast |
US8331381B2 (en) * | 2007-12-04 | 2012-12-11 | International Business Machines Corporation | Providing visibility of Ethernet components to a subnet manager in a converged InfiniBand over Ethernet network |
US7983265B1 (en) | 2008-01-17 | 2011-07-19 | Qlogic, Corporation | Method and system for processing a network packet |
US8949389B1 (en) * | 2008-03-31 | 2015-02-03 | Intel Corporation | Method and system for configuring virtual fabrics |
US7738371B1 (en) | 2008-08-29 | 2010-06-15 | Qlogic, Corporation | Method and system for routing network packets |
US8363569B2 (en) | 2009-04-22 | 2013-01-29 | Digi International Inc. | System and method for rejoining sleeping subnets in a wireless mesh network |
US8429647B2 (en) | 2009-05-06 | 2013-04-23 | Vmware, Inc. | Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine |
US8351431B2 (en) | 2009-05-13 | 2013-01-08 | Avaya Inc. | Method and apparatus for providing fast reroute of a multicast packet within a network element to an available port associated with a multi-link trunk |
US8140812B2 (en) | 2009-07-01 | 2012-03-20 | International Business Machines Corporation | Method and apparatus for two-phase storage-aware placement of virtual machines |
US8532116B2 (en) | 2009-07-21 | 2013-09-10 | Cisco Technology, Inc. | Extended subnets |
US8098677B1 (en) * | 2009-07-31 | 2012-01-17 | Anue Systems, Inc. | Superset packet forwarding for overlapping filters and related systems and methods |
US20110103391A1 (en) * | 2009-10-30 | 2011-05-05 | Smooth-Stone, Inc. C/O Barry Evans | System and method for high-performance, low-power data center interconnect fabric |
US8274987B2 (en) | 2010-03-22 | 2012-09-25 | International Business Machines Corporation | Contention free pipelined broadcasting within a constant bisection bandwidth network topology |
US8559332B2 (en) * | 2010-05-25 | 2013-10-15 | Telefonaktiebolaget L M Ericsson (Publ) | Method for enhancing table lookups with exact and wildcards matching for parallel environments |
JP5893628B2 (ja) | 2010-09-17 | 2016-03-23 | オラクル・インターナショナル・コーポレイション | ミドルウェアマシン環境における部分的なサブネット初期化の実行 |
US8730965B2 (en) * | 2011-01-05 | 2014-05-20 | Google Inc. | Systems and methods for dynamic routing in a multiprocessor network using local congestion sensing |
JP5594171B2 (ja) | 2011-02-02 | 2014-09-24 | 富士通株式会社 | 通信処理装置、アドレス学習プログラムおよびアドレス学習方法 |
JP5750973B2 (ja) | 2011-03-29 | 2015-07-22 | 富士通株式会社 | 通信方法および通信装置 |
CN102164090B (zh) | 2011-05-13 | 2013-12-25 | 杭州华三通信技术有限公司 | 基于通用路由封装隧道的报文转发的方法、系统及设备 |
WO2012167268A1 (en) | 2011-06-03 | 2012-12-06 | Oracle International Corporation | System and method for authenticating components in a network |
US8842671B2 (en) | 2011-06-07 | 2014-09-23 | Mellanox Technologies Ltd. | Packet switching based on global identifier |
US9274825B2 (en) | 2011-08-16 | 2016-03-01 | Microsoft Technology Licensing, Llc | Virtualization gateway between virtualized and non-virtualized networks |
US8862865B2 (en) * | 2011-08-30 | 2014-10-14 | International Business Machines Corporation | Rebooting infiniband clusters |
US20130086298A1 (en) | 2011-10-04 | 2013-04-04 | International Business Machines Corporation | Live Logical Partition Migration with Stateful Offload Connections Using Context Extraction and Insertion |
US8713169B2 (en) | 2011-10-11 | 2014-04-29 | Cisco Technology, Inc. | Distributed IPv6 neighbor discovery for large datacenter switching systems |
US9288555B2 (en) | 2011-11-01 | 2016-03-15 | Plexxi Inc. | Data center network architecture |
US8879396B2 (en) | 2011-11-15 | 2014-11-04 | Oracle International Corporation | System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology |
US8949489B1 (en) * | 2012-03-21 | 2015-02-03 | Google Inc. | Method for combining bulk and latency-sensitive input and output |
US9432304B2 (en) | 2012-03-26 | 2016-08-30 | Oracle International Corporation | System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model |
US9311122B2 (en) * | 2012-03-26 | 2016-04-12 | Oracle International Corporation | System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment |
JP5928582B2 (ja) | 2012-05-16 | 2016-06-01 | 富士通株式会社 | ノード装置および通信方法 |
US11057268B2 (en) * | 2012-07-13 | 2021-07-06 | Telefonaktiebolaget L M Ericsson (Publ) | Apparatuses and methods related to connecting tunnels through a virtual switch |
US9385949B2 (en) | 2012-12-20 | 2016-07-05 | Mellanox Technologies Tlv Ltd. | Routing controlled by subnet managers |
US9069633B2 (en) | 2012-12-20 | 2015-06-30 | Oracle America, Inc. | Proxy queue pair for offloading |
US9794107B2 (en) | 2013-02-06 | 2017-10-17 | Alcatel Lucent | Method and apparatus for providing migration of cloud components across address domains |
US9237111B2 (en) | 2013-03-14 | 2016-01-12 | International Business Machines Corporation | Credit-based flow control in lossless ethernet networks |
US9191441B2 (en) | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Cell fabric hardware acceleration |
US10404621B2 (en) | 2013-03-15 | 2019-09-03 | Oracle International Corporation | Scalable InfiniBand packet-routing technique |
US9307053B2 (en) | 2013-04-23 | 2016-04-05 | Cisco Technology, Inc. | Direct data placement over user datagram protocol in a network environment |
US9577956B2 (en) | 2013-07-29 | 2017-02-21 | Oracle International Corporation | System and method for supporting multi-homed fat-tree routing in a middleware machine environment |
US9559990B2 (en) * | 2013-08-27 | 2017-01-31 | Oracle International Corporation | System and method for supporting host channel adapter (HCA) filtering in an engineered system for middleware and application execution |
US9973425B2 (en) | 2013-08-27 | 2018-05-15 | Oracle International Corporation | System and method for providing a data service in an engineered system for middleware and application execution |
US10212022B2 (en) | 2013-09-13 | 2019-02-19 | Microsoft Technology Licensing, Llc | Enhanced network virtualization using metadata in encapsulation header |
EP3061210A4 (en) * | 2013-10-21 | 2017-09-06 | Nyansa, Inc. | A system and method for observing and controlling a programmable network using a remote network manager |
EP3063637A4 (en) | 2013-10-31 | 2017-07-19 | Intel Corporation | A method, apparatus and system for dynamically controlling an addressing mode for a cache memory |
US9648148B2 (en) | 2013-12-24 | 2017-05-09 | Intel Corporation | Method, apparatus, and system for QoS within high performance fabrics |
US9628382B2 (en) | 2014-02-05 | 2017-04-18 | Intel Corporation | Reliable transport of ethernet packet data with wire-speed and packet data rate match |
US9519328B2 (en) | 2014-05-21 | 2016-12-13 | Intel Corporation | Techniques for selectively reducing power levels of ports and core switch logic in infiniband switches |
US10027602B2 (en) | 2014-07-29 | 2018-07-17 | Oracle International Corporation | Packet queue depth sorting scheme for switch fabric |
FR3025384B1 (fr) | 2014-09-03 | 2016-09-16 | Bull Sas | Procede de surveillance et d'alerte de configuration de routage dans un cluster comprenant des liens de communication statiques et programme d'ordinateur mettant en oeuvre ce procede |
US9723008B2 (en) | 2014-09-09 | 2017-08-01 | Oracle International Corporation | System and method for providing an integrated firewall for secure network communication in a multi-tenant environment |
US20160080255A1 (en) | 2014-09-17 | 2016-03-17 | Netapp, Inc. | Method and system for setting up routing in a clustered storage system |
US9311133B1 (en) | 2014-10-09 | 2016-04-12 | Cisco Technology, Inc. | Touchless multi-domain VLAN based orchestration in a network environment |
US9525636B2 (en) | 2014-10-20 | 2016-12-20 | Telefonaktiebolaget L M Ericsson (Publ) | QoS on a virtual interface over multi-path transport |
JP6653699B2 (ja) | 2014-10-31 | 2020-02-26 | オラクル・インターナショナル・コーポレイション | マルチテナントクラスタ環境においてパーティション認識ルーティングをサポートするためのシステムおよび方法 |
US20160179582A1 (en) * | 2014-12-23 | 2016-06-23 | Intel Corporation | Techniques to dynamically allocate resources for local service chains of configurable computing resources |
US10348428B2 (en) | 2014-12-23 | 2019-07-09 | Intel Corporation | Techniques for synchronized execution of a command at network fabric nodes |
US9928093B2 (en) | 2015-02-24 | 2018-03-27 | Red Hat Israel, Ltd. | Methods and systems for establishing connections associated with virtual machine migrations |
US9733968B2 (en) | 2015-03-16 | 2017-08-15 | Oracle International Corporation | Virtual machine (VM) migration from switched fabric based computing system to external systems |
US10104017B2 (en) | 2015-05-12 | 2018-10-16 | Jeda Networks, Inc. | Methods, systems and apparatus for the virtualization of high performance networks |
US11204791B2 (en) | 2015-06-30 | 2021-12-21 | Nicira, Inc. | Dynamic virtual machine network policy for ingress optimization |
US10284383B2 (en) | 2015-08-31 | 2019-05-07 | Mellanox Technologies, Ltd. | Aggregation protocol |
US10432470B2 (en) | 2015-09-23 | 2019-10-01 | International Business Machines Corporation | Distributed subnet manager for InfiniBand networks |
US10116528B2 (en) * | 2015-10-02 | 2018-10-30 | Keysight Technologies Singapore (Holdings) Ptd Ltd | Direct network traffic monitoring within VM platforms in virtual processing environments |
US10187310B2 (en) | 2015-10-13 | 2019-01-22 | Oracle International Corporation | System and method for efficient network isolation and load balancing in a multi-tenant cluster environment |
US10498654B2 (en) | 2015-12-28 | 2019-12-03 | Amazon Technologies, Inc. | Multi-path transport design |
US10581711B2 (en) | 2016-01-28 | 2020-03-03 | Oracle International Corporation | System and method for policing network traffic flows using a ternary content addressable memory in a high performance computing environment |
US10171353B2 (en) | 2016-03-04 | 2019-01-01 | Oracle International Corporation | System and method for supporting dual-port virtual router in a high performance computing environment |
US10225185B2 (en) | 2016-04-18 | 2019-03-05 | International Business Machines Corporation | Configuration mechanisms in a switchless network |
US20180026878A1 (en) | 2016-07-24 | 2018-01-25 | Mellanox Technologies Tlv Ltd. | Scalable deadlock-free deterministic minimal-path routing for dragonfly networks |
US10158500B2 (en) | 2016-09-13 | 2018-12-18 | Ciena Corporation | G.8032 prioritized ring switching systems and methods |
-
2017
- 2017-01-24 US US15/414,227 patent/US10581711B2/en active Active
- 2017-01-24 US US15/414,211 patent/US10374926B2/en active Active
- 2017-01-26 US US15/416,709 patent/US10284448B2/en active Active
- 2017-01-26 US US15/416,696 patent/US10205646B2/en active Active
- 2017-01-26 US US15/416,642 patent/US10230607B2/en active Active
- 2017-01-27 WO PCT/US2017/015464 patent/WO2017132585A1/en active Application Filing
- 2017-01-27 EP EP17704622.4A patent/EP3408981B1/en active Active
- 2017-01-27 CN CN201780002937.4A patent/CN107925622A/zh active Pending
- 2017-01-27 JP JP2018510382A patent/JP6883568B2/ja active Active
- 2017-01-27 CN CN202211067569.0A patent/CN115442278A/zh active Pending
- 2017-01-27 EP EP17703641.5A patent/EP3408978B1/en active Active
- 2017-01-27 CN CN201780002951.4A patent/CN108028813B/zh active Active
- 2017-01-27 WO PCT/US2017/015484 patent/WO2017132599A1/en active Application Filing
- 2017-01-27 JP JP2018510374A patent/JP6957451B2/ja active Active
-
2018
- 2018-12-21 US US16/230,167 patent/US10868746B2/en active Active
-
2019
- 2019-01-28 US US16/259,901 patent/US10581713B2/en active Active
- 2019-03-25 US US16/363,582 patent/US10637761B2/en active Active
- 2019-07-03 US US16/502,609 patent/US11140057B2/en active Active
-
2020
- 2020-01-31 US US16/778,674 patent/US11190429B2/en active Active
-
2021
- 2021-10-06 JP JP2021164659A patent/JP7241146B2/ja active Active
- 2021-11-05 US US17/520,273 patent/US11824749B2/en active Active
-
2023
- 2023-03-06 JP JP2023033737A patent/JP2023078206A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130259033A1 (en) * | 2011-08-23 | 2013-10-03 | Mark S. Hefty | Gid capable switching in an infiniband fabric |
KR20150009550A (ko) * | 2012-05-11 | 2015-01-26 | 오라클 인터내셔날 코포레이션 | 소스 라우팅에 근거한 별개의 인피니밴드 서브넷들 간에 트래픽을 라우팅하기 위한 시스템 및 방법 |
JP2015517762A (ja) * | 2012-05-11 | 2015-06-22 | オラクル・インターナショナル・コーポレイション | 別個のインフィニバンドサブネット間のトラフィックをソースルーティングに基づいてルーティングするためのシステムおよび方法 |
US20150098466A1 (en) * | 2013-10-06 | 2015-04-09 | Mellanox Technologies Ltd. | Simplified packet routing |
WO2016007760A2 (en) * | 2014-07-11 | 2016-01-14 | Oracle International Corporation | System and method for supporting efficient load-balancing in a high performance computing (hpc) environment |
JP2017525279A (ja) * | 2014-07-11 | 2017-08-31 | オラクル・インターナショナル・コーポレイション | 高性能コンピューティング(hpc:high performance computing)環境において効率的なロードバランシングをサポートするためのシステムおよび方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7241146B2 (ja) | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 | |
US11140065B2 (en) | System and method for supporting VM migration between subnets in a high performance computing environment | |
JP2022050438A (ja) | 高性能コンピューティング環境における仮想ルータポートにわたるsmp接続性チェックのためのルータsma抽象化をサポートするためのシステムおよび方法 | |
US10630816B2 (en) | System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment | |
US11233698B2 (en) | System and method for supporting subnet number aliasing in a high performance computing environment | |
US11496402B2 (en) | System and method for supporting aggressive credit waiting in a high performance computing environment | |
US10348847B2 (en) | System and method for supporting proxy based multicast forwarding in a high performance computing environment | |
US10348649B2 (en) | System and method for supporting partitioned switch forwarding tables in a high performance computing environment | |
US10355972B2 (en) | System and method for supporting flexible P_Key mapping in a high performance computing environment | |
US10666611B2 (en) | System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment | |
US10333894B2 (en) | System and method for supporting flexible forwarding domain boundaries in a high performance computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211025 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230207 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230306 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7241146 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |