JP2021185693A - 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 - Google Patents
高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2021185693A JP2021185693A JP2021131306A JP2021131306A JP2021185693A JP 2021185693 A JP2021185693 A JP 2021185693A JP 2021131306 A JP2021131306 A JP 2021131306A JP 2021131306 A JP2021131306 A JP 2021131306A JP 2021185693 A JP2021185693 A JP 2021185693A
- Authority
- JP
- Japan
- Prior art keywords
- subnet
- switches
- end nodes
- sub
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/083—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for increasing network speed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/0836—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/15—Interconnection of switching modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/35—Switches specially adapted for specific applications
- H04L49/356—Switches specially adapted for specific applications for storage area networks
- H04L49/358—Infiniband Switches
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/44—Star or tree networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Multi Processors (AREA)
- Stored Programmes (AREA)
Abstract
Description
この特許文献の開示の一部は、著作権保護の対象となる資料を含む。この特許文献または特許開示は特許商標庁の特許ファイルまたは記録に記載されているため、著作権保有者は、何人によるその複写複製に対しても異議はないが、その他の場合には如何なるときもすべての著作権を保有する。
本発明は、概して、コンピュータシステムに関し、特に、SR−IOV vSwitchアーキテクチャを用いるコンピュータシステム仮想化およびライブマイグレーションをサポートすることに関する。
導入されるクラウドコンピューティングアーキテクチャがより大規模になるのに応じて、従来のネットワークおよびストレージに関する性能および管理の障害が深刻な問題になってきている。クラウドコンピューティングファブリックのための基礎としてインフィニバンド(登録商標)(InfiniBand:IB)技術を用いることへの関心がますます高まってきている。これは、本発明の実施形態が対応するように意図された一般領域である。
一実施形態に従うと、システムおよび方法は、大規模な無損失ネットワークにおいて性能駆動型の再構成を提供することができる。ハイブリッド再構成方式は、ネットワークのうちさまざまな下位区分を選択するためのさまざまなルーティングアルゴリズムを用いた高速の部分的なネットワーク再構成を可能にし得る。部分的な再構成は、初期の全体構成よりも桁違いに高速であり得るので、無損失ネットワークにおける性能駆動型の再構成を検討することが可能となり得る。提案されているメカニズムは、大型のHPCシステムおよびクラウドが、隔離されたタスクを実行する複数のテナント(たとえば、さまざまなパーティション上のさまざまなテナント)によって共有されるという点を利用している。このようなシナリオにおいては、テナント間の相互通信が不可能となり、このため、ワークロード展開および配置スケジューラは、効率的なリソース利用を確実にするためにフラグメンテーションを回避しようと試みるはずである。すなわち、テナント当たりのトラフィックの大部分をネットワークのうち集約された下位区分内に含めることができ、SMは、全体的な性能を向上させるためにいくつかの下位区分を再構成することができる。SMは、ファットツリートポロジーおよびファットツリールーティングアルゴリズムを用いることができる。このようなハイブリッド再構成方式は、ネットワークを再構成するために提供されるノード順序付けを用いるカスタムのファットツリールーティングアルゴリズムを用いることによって、サブツリー内の性能をうまく再構成および向上させることができる。SMがネットワーク全体を再構成することを所望する場合、SMは、デフォルトのファットツリールーティングアルゴリズムを用いて、単一のサブネットにおけるさまざまな使用事例のための2つの異なるルーティングアルゴリズムの組合せを効果的に発揮することができる。
をサポートするための例示的な方法は、1つ以上のマイクロプロセッサにおいて第1のサブネットを設け得る。第1のサブネットは複数のスイッチを含み、複数のスイッチは少なくともリーフスイッチを含み、複数のスイッチの各々は、複数のスイッチポートと、各々が少なくとも1つのホストチャネルアダプタポートを含む複数のホストチャネルアダプタと、複数のエンドノードとを含み、複数のエンドノードの各々は、複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられている。当該方法は、複数のレベルを有するネットワークアーキテクチャにおいて第1のサブネットのうちの複数のスイッチを配置し得る。複数のレベルの各々は、複数のスイッチのうち少なくとも1つのスイッチを含む。当該方法は、第1の構成方法に従って複数のスイッチを構成し得る。第1の構成方法は、複数のエンドノードについての第1の順序付けに関連付けられている。当該方法は、複数のスイッチのサブセットを第1のサブネットのサブ・サブネット(sub-subnet)として構成し得る。第1のサブネットのサブ・サブネットは第1のサブネットの複数のレベルよりも少ないいくつかのレベルを含む。当該方法は、第2の構成方法に従って第1のサブネットのサブ・サブネットを再構成し得る。
本発明は、同様の参照番号が同様の要素を指している添付図面の図において、限定のた
めではなく例示のために説明されている。なお、この開示における「ある」または「1つの」または「いくつかの」実施形態への参照は必ずしも同じ実施形態に対するものではなく、そのような参照は少なくとも1つを意味する。特定の実現例が説明されるが、これらの特定の実現例が例示的な目的のためにのみ提供されることが理解される。当業者であれば、他の構成要素および構成が、この発明の範囲および精神から逸脱することなく使用され得ることを認識するであろう。
能にする。このため、仮想化は、ライブマイグレーションによる統合、リソースのオン・デマンド・プロビジョニングおよび融通性を可能にし得る。
インフィニバンド(IB)は、インフィニバンド・トレード・アソシエーション(InfiniBandTMTrade Association)によって開発されたオープン標準無損失ネットワーク技術
である。この技術は、特に高性能コンピューティング(high-performance computing:HPC)アプリケーションおよびデータセンタを対象とする、高スループットおよび少ない待ち時間の通信を提供するシリアルポイントツーポイント全二重相互接続(serial point-to-point full-duplex interconnect)に基づいている。
ロジー分割をサポートする。より低い層では、IBネットワークはサブネットと称され、1つのサブネットは、スイッチおよびポイントツーポイントリンクを使用して相互接続される一組のホストを含み得る。より高いレベルでは、1つのIBファブリックは、ルータを使用して相互接続され得る1つ以上のサブネットを構成する。
間の適正な負荷バランシングを目標とする。
ージェントは、すべてのIBサブネットデバイス上に存在する。SMPを使用することにより、サブネットマネージャは、ファブリックを発見し、エンドノードおよびスイッチを構成し、SMAから通知を受信することができる。
LIDごとに1つのエントリのみがサポートされる。パケットがあるスイッチに到着すると、その出力ポートは、そのスイッチのフォワーディングテーブルにおいてDLIDを検索することによって判断される。所与の送信元−宛先ペア(LIDペア)間のネットワークにおいてパケットは同じ経路を通るため、ルーティングは決定論的である。
ットワークを再構成する。
または、ネットワーク変化を信号で伝えるメッセージ(トラップ)をSMが受信した場合、SMは、発見された変化に従ってネットワークを再構成し得る。
テムの論理グループの分離をもたらすためにセキュリティメカニズムとしてパーティショニングをサポートし得る。ファブリックにおけるノード上の各HCAポートは、1つ以上のパーティションのメンバであり得る。パーティションメンバーシップは、SMの一部であり得る集中型パーティションマネージャによって管理される。SMは、各ポートに関するパーティションメンバーシップ情報を、16ビットのパーティションキー(partition key:Pキー)のテーブルとして構成することができる。SMはまた、LIDに関連付け
られたPキー情報を含むパーティション実施テーブルを用いて、スイッチおよびルータを構成することができる。加えて、一般的な場合には、スイッチポートのパーティションメンバーシップは、(リンクに向かう)出口方向に向かってポートを介してルーティングされたLIDに間接的に関連付けられたすべてのメンバーシップの集合を表わし得る。
過去10年の間に、ハードウェア仮想化サポートによってCPUオーバーヘッドが実質的に排除され、メモリ管理ユニットを仮想化することによってメモリオーバーヘッドが著しく削減され、高速SANストレージまたは分散型ネットワークファイルシステムの利用によってストレージオーバーヘッドが削減され、シングルルートI/O仮想化(Single Root Input/Output Virtualization:SR−IOV)のようなデバイス・パススルー技術
を使用することによってネットワークI/Oオーバーヘッドが削減されてきたことに応じて、仮想化された高性能コンピューティング(High Performance Computing:HPC)環境の将来見通しが大幅に改善されてきた。現在では、クラウドが、高性能相互接続ソリューションを用いて仮想HPC(virtual HPC:vHPC)クラスタに対応し、必要な性能
を提供することができる。
CA)が難易度の高いものであることが判明した。各々のIBが接続されているノードは、3つの異なるアドレス(すなわちLID、GUIDおよびGID)を有する。ライブマイグレーションが発生すると、これらのアドレスのうち1つ以上が変化する。マイグレーション中のVM(VM-in-migration)と通信する他のノードは接続性を失う可能性がある
。これが発生すると、IBサブネットマネージャ(Subnet Manager:SM)にサブネット管理(Subnet Administration:SA)経路記録クエリを送信することによって、再接続
すべき仮想マシンの新しいアドレスを突きとめることにより、失われた接続を回復させるように試みることができる。
一実施形態によれば、IBベースのHPCシステムのいくつかは、ファットツリートポロジーを採用して、ファットツリーが提供する有用な特性を利用する。これらの特性は、各送信元宛先ペア間の複数経路の利用可能性に起因する、フルバイセクション帯域幅および固有の耐故障性を含む。ファットツリーの背後にある初期の考えは、ツリーがトポロジーのルート(root)に近づくにつれて、より利用可能な帯域幅を用いて、ノード間のより太いリンクを採用することであった。より太いリンクは、上位レベルのスイッチにおける輻輳を回避するのに役立てることができ、バイセクション帯域幅が維持される。
し、ルートスイッチ233はスイッチポート5〜6を有し、ルートスイッチ234はスイッチポート7〜8を有し得る。
Distribution:IBベースのアプリケーションを構築しデプロイするための標準ソフト
ウェアスタック)サブネットマネージャ、すなわちOpenSMにおいて実現される。
一実施形態に従うと、I/O仮想化(I/O Virtualization:IOV)は、仮想マシン(VM)が基礎をなす物理リソースにアクセスできるようにすることによって、I/Oを利用できるようにすることができる。ストレージトラフィックとサーバ間通信とを組合わせると、シングルサーバのI/Oリソースにとって抗し難い高い負荷が課され、結果として、データの待機中に、バックログが発生し、プロセッサがアイドル状態になる可能性がある。I/O要求の数が増えるにつれて、IOVにより、利用可能性をもたらすことができるとともに、最新のCPU仮想化において見られる性能レベルに匹敵するように、(仮想化された)I/Oリソースの性能、スケーラビリティおよび融通性を向上させることができる。
仮想化(single root-I/O virtualization:SR−IOV)などのさまざまなタイプのIOV技術が存在し得る。
ックエンドと通信し得る。物理デバイス共有比率は高く、VMのライブマイグレーションはネットワークダウンタイムのわずか数ミリ秒で実現可能である。しかしながら、ソフトウェアエミュレーションはさらなる不所望な計算上のオーバーヘッドをもたらしてしまう。
ハードウェア仮想化によって、物理装置がその同じ装置の複数の独立した軽量のインスタンスとして現われることを可能にし得る。これらのインスタンスは、パススルー装置としてVMに割当てることができ、仮想機能(Virtual Function:VF)としてアクセスすることができる。ハイパーバイザは、(1つのデバイスごとに)固有の、十分な機能を有する物理機能(Physical Function:PF)によってデバイスにアクセスする。SR−IO
Vは、純粋に直接的に割当てする際のスケーラビリティの問題を軽減する。しかしながら、SR−IOVによって提示される問題は、それがVMマイグレーションを損なう可能性があることである。これらのIOV技術の中でも、SR−IOVは、ほぼ固有の性能を維持しながらも、複数のVMから単一の物理デバイスに直接アクセスすることを可能にする手段を用いてPCI Express(PCIe)規格を拡張することができる。これにより、SR−IOVは優れた性能およびスケーラビリティを提供することができる。
常のPCIe機能であるのに対して、VFは軽量のPCIe機能である。各々のVFはそれ自体のベースアドレス(base address:BAR)を有しており、固有のリクエスタIDが割当てられている。固有のリクエスタIDは、I/Oメモリ管理ユニット(I/O memory
management unit:IOMMU)がさまざまなVFへの/からのトラフィックストリームを区別することを可能にする。IOMMUはまた、メモリを適用して、PFとVFとの間の変換を中断する。
イスの内部状態全体は、それがハードウェアに結び付けられているのでコピーすることができない。代わりに、VMに割当てられたSR−IOV VFが分離され、ライブマイグレーションが実行されることとなり、新しいVFが宛先において付与されることとなる。インフィニバンドおよびSR−IOVの場合、このプロセスがダウンタイムを数秒のオーダでもたらす可能性がある。さらに、SR−IOV共有型ポートモデルにおいては、VMのアドレスがマイグレーション後に変化することとなり、これにより、SMにオーバーヘッドが追加され、基礎をなすネットワークファブリックの性能に対して悪影響が及ぼされることとなる。
さまざまなタイプのSR−IOVモデル(たとえば共有ポートモデルおよび仮想スイッチモデル)があり得る。
さまざまなタイプのSR−IOVモデル(たとえば共有ポートモデルおよび仮想スイッチモデル)があり得る。
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
552を仮想機能3 516に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上における十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
しいLIDを追加する必要はない。それ以外の場合、経路の再計算を含め、ネットワークを完全に再構成させ得る動作は、最も時間を消費する要素となる。代わりに、VMのための利用可能なポートはハイパーバイザのうちの1つに位置し(すなわち利用可能な仮想機能)、仮想マシンは利用可能な仮想機能に付与されている。
を可能にする。VMをマイグレートしてその関連するLIDを宛先に送達する必要がある場合、不連続なLIDを自由に使用できることは特に有用となる。
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
タ(vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSM(図示せず)については、HCA510、520および530は、仮想スイッチを介して、追加のノードが接続されているスイッチのように見えている。
がなされたvSwitchとで比較すると、動的LID割当てアーキテクチャにおいて割当てられたLIDが不連続であり、そこに予めポピュレートされたLIDが本質的に連続的であることが分かるだろう。さらに、vSwitch動的LID割当てアーキテクチャにおいては、新しいVMが作成されると、次に利用可能なLIDが、VMの生存期間の間中ずっと用いられる。逆に、LIDが予めポピュレートされたvSwitchにおいては、各々のVMは、対応するVFに既に割当てられているLIDを引継ぎ、ライブマイグレーションのないネットワークにおいては、所与のVFに連続的に付与されたVMが同じLIDを得る。
図7は、一実施形態に従った、動的LID割当てがなされてLIDが予めポピュレートされたvSwitchを備えた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501〜504は、ネットワーク切替環境500(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、それぞれ、さらに、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550は、ハイパーバイザ511によって仮想機能1 514に割当てることができることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当てることができる。ハイパーバイザ521は、仮想マシン3 552を仮想機能3 526に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能2 535に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上における十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
chアーキテクチャにおいては、各々の仮想機能は、完全な仮想ホストチャネルアダプタ(vHCA)であり、これは、ハードウェアにおいて、VFに割当てられたVMに、IBアドレス一式(たとえばGID、GUID、LID)および専用のQPスペースが割当てられていることを意味する。残りのネットワークおよびSM(図示せず)については、HCA510、520および530は、仮想スイッチを介して、追加のノードが接続されているスイッチのように見えている。
一実施形態に従うと、高性能コンピューティング(High Performance Computing:HPC)クラスタは、何千ものノードおよび何百万ものコアから成る大規模並列システムである。従来より、このようなシステムは科学学界に関連があり、複雑で高粒度の演算を実行するのに用いることができる。しかしながら、クラウドコンピューティングパラダイムおよびビッグデータ・アナリティクスが出現したことで、コンピュータ科学学会は、HPCおよびビッグデータの集約がなされるであろうこと、クラウドが、関連するサービスをより広範囲の視聴対象者に対して提供するための手段になりつつあることに同意する傾向がある。大型の従来のHPCクラスタは、通常、多様に広がっているユーザ間で共有される環境であるが予測可能なワークロードである。しかしながら、クラウドおよびよりダイナ
ミックなプリペイド型モデルの影響を受けた場合、システムのワークロードおよび利用は予測不可能になる可能性があり、これにより、ランタイム中に性能を最適化する必要が生じる可能性がある。
成が必要になった場合、SMは、デッドロックのないルートの新しいセットを再計算する。しかしながら、移行段階中に新しいLFTを分配すると、新しいルーティング機能Rnewが古いルーティング機能Roldと共存することになる。RoldおよびRnewはともにデッドロックがないが、これらを組合わせるとそうならない可能性もある。さらに、パス演算は、再構成のうちよりコストのかかる段階であるとともに、トポロジーおよび選択されたルーティング機能次第では最大で数分かかる可能性もある。これにより、再構成が重大な障害が発生しない限り回避されるべき過度な動作に変えられてしまうような障害物が導入される可能性がある。障害が発生した場合、性能の低下を犠牲にして、デッドロックのない接続性を迅速に回復させるために、再構成が最小限に維持される。
ットツリートポロジーのためのトポロジー認識型ルーティングアルゴリズムである。FTreeが初めにネットワークトポロジーを発見し、各々のスイッチには、トポロジーにおけるその位置を識別するタプルで印が付けられている。各々のタプルは、(l,ah,...,a1)の形式の値のベクトルであり、この場合、「l」はスイッチが位置するレベル
を表わしている。さらに、「ah」は、最上位のサブツリー内におけるスイッチインデックスを表わしており、「a1」がその第1のサブツリーなどの内部におけるサブツリーのインデックスを表わすようになるまで再帰的に数字「ah−1」を表わしている。nレベルのファットツリーの場合、ルートレベル(最上位またはコア)のスイッチはレベルl=0に位置するものの、リーフスイッチ(この場合、そこにノードが接続されている)はレベルl=n−1に位置する。一例としての2−ary−4−treeについてのタプル割当てが図8に示される。
Treeは、ルート同士のバランスを取るためにポート使用カウンタを維持しているとともに、下向きのルートを選択しつつロード量の最も少ないポートからファブリックを上方向に横断することを開始する。図に示されるように、最初の繰返し時には、すべてのポートカウンタはゼロであるため、第1の利用可能な上向きのポートが選択される。レベルが上がるごとに、新しく到達したスイッチ、この場合スイッチ5 905が、到達したスイッチが経由した入力ポートからルーティングされたノード(ノードA920)に向かってトラフィック全体を下方向にルーティングするためのスイッチとして選択される。図中の破線は、ノードAに割当てられたルートを表わしている。
に昇っていく2つのルートが実行され、一方のルートがスイッチ7とスイッチ3との間に存在し、もう一方のルートがスイッチ7とスイッチ4との間に存在している。図中の破線は、ノードAに割当てられたルートを表わしている。この時点で、すべてのノードからノードAまでのルートがシステムにおいて規定されている。このような動作は、すべてのノードのすべてのルートが計算されてしまうまで、ポートカウンタを維持しながら、システムにおける各ノードごとに繰返すことができる。
らに、部分的な再構成を適用する場合、当該方法は、サブ・サブネット1310内のノードの転送エントリを変更するだけでよい。ファブリックをルーティングするために用いられる初期のルーティングアルゴリズムがFTreeまたはその同様のものであり、仮想レーンを用いることなく上向き/下向きルーティングの変形例を適用することによって確実にデッドロックが解消されると想定すると、当該方法は、所与のサブツリーを隔離されたものとして再ルーティングするために任意の最適なルーティングアルゴリズムを用いることができる(ハイブリッド再構成)。
)べき第2のノードとなる。スイッチ4に接続されたノードは同じ態様でルーティングされる。残りのルーティングが、上述され図示されるように行なわれる。このシナリオにおいては、300%の性能向上を達成することができる。なぜなら、ノードB、CおよびDからノードE、IおよびMに流れ込むトラフィックと共有される上向きのリンクがもはや存在しないからである。
よって接続されている分散コンピューティング環境において実現される。分散コンピューティング環境は、一箇所においてすべてのコンピュータを有していてもよく、または、WANによって接続されているさまざまな遠隔地理位置においてコンピュータのクラスタを有していてもよい。
たい。クラウド展開モデルは、パブリック、プライベートおよびハイブリッドを含む。クラウドサービスモデルは、ソフトウェア・アズ・ア・サービス(Software as a Service
:SaaS)、プラットフォーム・アズ・ア・サービス(Platform as a Service:Pa
aS)、データベース・アズ・ア・サービス(Database as a Service:DBaaS)お
よびインフラストラクチャ・アズ・ア・サービス(Infrastructure as a Service:Ia
aS)を含む。この明細書中に用いられているように、クラウドは、セルフサービスの調整された態様で、共有される融通性のあるリソースをユーザに対して配信する、ハードウェア技術とソフトウェア技術とネットワーク技術とウェブ技術とを組合せたものである。特に既定のない限り、クラウドは、この明細書中において用いられているとおり、パブリッククラウド、プライベートクラウドおよびハイブリッドクラウドの実施形態を包含しており、すべてのクラウド展開モデルは、クラウドSaaS、クラウドDBaaS、クラウドPaaSおよびクラウドIaaSを含むもののこれらに限定されない。
ピュータ読取り可能媒体であるコンピュータプログラムプロダクトを含む。これらの命令は、本発明のプロセスまたは機能のいずれかを実行するようにコンピュータなどのシステムをプログラムするかまたは他の場合には構成するのに用いることができる。記憶媒体またはコンピュータ読取り可能媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、および磁気光ディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス、磁気もしくは光カード、(分子メモリICを含む)ナノシステムを含む任意のタイプのディスク、ならびに、命令および/もしくはデータを格納するのに適した任意のタイプの媒体もしくは装置、を含み得るが、これらには限定されない。特定の実施形態においては、記憶媒体またはコンピュータ読取り可能媒体は、非一時的な記憶媒体または非一時的なコンピュータ読取り可能媒体である。
Claims (23)
- 高性能コンピューティング環境において高速ハイブリッド再構成をサポートするためのシステムであって、
1つ以上のマイクロプロセッサと、
第1のサブネットとを含み、前記第1のサブネットは、
複数のスイッチを含み、前記複数のスイッチは少なくともリーフスイッチを含み、前記複数のスイッチの各々は複数のスイッチポートを含み、前記第1のサブネットはさらに、
各々が少なくとも1つのホストチャネルアダプタポートを含む複数のホストチャネルアダプタと、
複数のエンドノードとを含み、前記複数のエンドノードの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、
前記第1のサブネットのうちの前記複数のスイッチは、複数のレベルを有するネットワークアーキテクチャに配置され、前記複数のレベルの各々は、前記複数のスイッチのうち少なくとも1つのスイッチを含み、
前記複数のスイッチは、最初に第1の構成方法に従って構成され、前記第1の構成方法は、前記複数のエンドノードについての第1の順序付けに関連付けられており、
前記複数のスイッチのサブセットは前記第1のサブネットのサブ・サブネットとして構成されており、前記第1のサブネットの前記サブ・サブネットは、前記第1のサブネットの前記複数のレベルよりも少ないいくつかのレベルを含み、
前記第1のサブネットの前記サブ・サブネットは第2の構成方法に従って再構成される、システム。 - 前記第1のサブネットの前記複数のエンドノードは前記複数のスイッチを介して相互接続される、請求項1に記載のシステム。
- 前記複数のエンドノードのサブセットは前記第1のサブネットの前記サブ・サブネットに関連付けられており、
前記第1のサブネットの前記サブ・サブネットは、前記複数のエンドノードのサブセット間のトラフィックが前記第1のサブネットの前記サブ・サブネットとして構成された前記複数のスイッチの前記サブセットに制限されるように構成されている、請求項2に記載のシステム。 - 前記第2の再構成方法は、前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうち少なくとも2つのエンドノードについての第2の順序付けに関連付けられている、請求項3に記載のシステム。
- 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうち前記少なくとも2つのエンドノードについての前記第2の順序付けは、システムアドミニストレータから受取られる、請求項4に記載のシステム。
- 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうち少なくとも2つのエンドノードについての前記第2の順序付けは、管理エンティティから受取られる、請求項4に記載のシステム。
- 前記第1のサブネットはインフィニバンドサブネットを含み、
前記管理エンティティは、
サブネットマネージャ、
ファブリックマネージャ、および、
グローバルファブリックマネージャからなる群から選択される管理エンティティである、請求項6に記載のシステム。 - 高性能コンピューティング環境において高速ハイブリッド再構成をサポートするための方法であって、
1つ以上のマイクロプロセッサにおいて第1のサブネットを設けるステップを含み、前記第1のサブネットは、
複数のスイッチを含み、前記複数のスイッチは少なくともリーフスイッチを含み、前記複数のスイッチの各々は複数のスイッチポートを含み、前記第1のサブネットはさらに、
各々が少なくとも1つのホストチャネルアダプタポートを含む複数のホストチャネルアダプタと、
複数のエンドノードとを含み、前記複数のエンドノードの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、前記方法はさらに、
複数のレベルを有するネットワークアーキテクチャにおいて、前記第1のサブネットのうちの前記複数のスイッチを配置するステップを含み、前記複数のレベルの各々は、前記複数のスイッチのうち少なくとも1つのスイッチを含み、前記方法はさらに、
第1の構成方法に従って前記複数のスイッチを構成するステップを含み、前記第1の構成方法は、前記複数のエンドノードについての第1の順序付けに関連付けられており、前記方法はさらに、
前記複数のスイッチのサブセットを前記第1のサブネットのサブ・サブネットとして構成するステップを含み、前記第1のサブネットの前記サブ・サブネットは、前記第1のサブネットの前記複数のレベルよりも少ないいくつかのレベルを含み、前記方法はさらに、
第2の構成方法に従って前記第1のサブネットの前記サブ・サブネットを再構成するステップを含む、方法。 - 前記第1のサブネットの前記複数のエンドノードは前記複数のスイッチを介して相互接続される、請求項8に記載の方法。
- 前記複数のエンドノードのサブセットは前記第1のサブネットの前記サブ・サブネットに関連付けられており、
前記第1のサブネットの前記サブ・サブネットは、前記複数のエンドノードのサブセット間のトラフィックが前記第1のサブネットの前記サブ・サブネットとして構成された前記複数のスイッチの前記サブセットに制限されるように構成されている、請求項9に記載の方法。 - 前記第2の再構成方法は、前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうちの少なくとも2つのエンドノードについての第2の順序付けに関連付けられている、請求項10に記載の方法。
- 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうちの前記少なくとも2つのエンドノードについての前記第2の順序付けは、システムアドミニストレータから受取られる、請求項11に記載の方法。
- 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうちの前記少なくとも2つのエンドノードについての前記第2の順序付けは、管理エンティティから受取られる、請求項11に記載の方法。
- 前記第1のサブネットはインフィニバンドサブネットを含み、
前記管理エンティティは、
サブネットマネージャ、
ファブリックマネージャ、および、
グローバルファブリックマネージャからなる群から選択される管理エンティティである、請求項13に記載の方法。 - 高性能コンピューティング環境において高速ハイブリッド再構成をサポートするための命令が格納された非一時的なコンピュータ読取り可能記憶媒体であって、前記命令が1つ以上のコンピュータによって読出されて実行されると、前記1つ以上のコンピュータに、
1つ以上のマイクロプロセッサにおいて第1のサブネットを設けるステップを実行させ、前記第1のサブネットは、
複数のスイッチを含み、前記複数のスイッチは少なくともリーフスイッチを含み、前記複数のスイッチの各々は複数のスイッチポートを含み、前記第1のサブネットはさらに、
各々が少なくとも1つのホストチャネルアダプタポートを含む複数のホストチャネルアダプタと、
複数のエンドノードとを含み、前記複数のエンドノードの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、前記1つ以上のコンピュータに、さらに、
前記第1のサブネットのうちの前記複数のスイッチを、複数のレベルを有するネットワークアーキテクチャに配置するステップを実行させ、前記複数のレベルの各々は、前記複数のスイッチのうち少なくとも1つのスイッチを含み、前記1つ以上のコンピュータに、さらに、
第1の構成方法に従って前記複数のスイッチを構成するステップを実行させ、前記第1の構成方法は、前記複数のエンドノードについての第1の順序付けに関連付けられており、前記1つ以上のコンピュータに、さらに、
前記複数のスイッチのサブセットを前記第1のサブネットのサブ・サブネットとして構成するステップを実行させ、前記第1のサブネットの前記サブ・サブネットは、前記第1のサブネットの前記複数のレベルよりも少ないいくつかのレベルを含み、前記1つ以上のコンピュータに、さらに、
前記第1のサブネットの前記サブ・サブネットを第2の構成方法に従って再構成するステップを実行させる、非一時的なコンピュータ読取り可能記憶媒体。 - 前記第1のサブネットの前記複数のエンドノードは前記複数のスイッチを介して相互接続される、請求項15に記載の非一時的なコンピュータ読取り可能記憶媒体。
- 前記複数のエンドノードのサブセットは前記第1のサブネットの前記サブ・サブネットに関連付けられており、
前記第1のサブネットの前記サブ・サブネットは、前記複数のエンドノードのサブセット間のトラフィックが前記第1のサブネットの前記サブ・サブネットとして構成された前記複数のスイッチの前記サブセットに制限されるように構成されている、請求項16に記載の非一時的なコンピュータ読取り可能記憶媒体。 - 前記第2の再構成方法は、前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうち少なくとも2つのエンドノードについての第2の順序付けに関連付けられている、請求項17に記載の非一時的なコンピュータ読取り可能記憶媒体。
- 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノー
ドの前記サブセットのうちの前記少なくとも2つのエンドノードについての前記第2の順序付けは、システムアドミニストレータから受取られる、請求項18に記載の非一時的なコンピュータ読取り可能記憶媒体。 - 前記第1のサブネットの前記サブ・サブネットに関連付けられた前記複数のエンドノードの前記サブセットのうちの前記少なくとも2つのエンドノードについての前記第2の順序付けは、管理エンティティから受取られ、
前記第1のサブネットはインフィニバンドサブネットを含み、
前記管理エンティティは、
サブネットマネージャ、
ファブリックマネージャ、および、
グローバルファブリックマネージャからなる群から選択される管理エンティティである、請求項18に記載の非一時的なコンピュータ読取り可能記憶媒体。 - 機械読取り可能なフォーマットのプログラム命令を含むコンピュータプログラムであって、前記プログラム命令がコンピュータシステムによって実行されると、前記コンピュータシステムに請求項8から13のいずれかに記載の方法を実行させる、コンピュータプログラム。
- 非一時的な機械読取り可能データ記憶媒体に格納された、請求項21に記載のコンピュータプログラムを含むコンピュータプログラムプロダクト。
- 請求項8から13のいずれかに記載の方法を実行するための手段を含む装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023081518A JP2023106496A (ja) | 2016-08-23 | 2023-05-17 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662378583P | 2016-08-23 | 2016-08-23 | |
US62/378,583 | 2016-08-23 | ||
JP2018541609A JP6929863B2 (ja) | 2016-08-23 | 2017-08-18 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018541609A Division JP6929863B2 (ja) | 2016-08-23 | 2017-08-18 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023081518A Division JP2023106496A (ja) | 2016-08-23 | 2023-05-17 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021185693A true JP2021185693A (ja) | 2021-12-09 |
JP7282840B2 JP7282840B2 (ja) | 2023-05-29 |
Family
ID=59738493
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018541609A Active JP6929863B2 (ja) | 2016-08-23 | 2017-08-18 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
JP2021131306A Active JP7282840B2 (ja) | 2016-08-23 | 2021-08-11 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
JP2023081518A Pending JP2023106496A (ja) | 2016-08-23 | 2023-05-17 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018541609A Active JP6929863B2 (ja) | 2016-08-23 | 2017-08-18 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023081518A Pending JP2023106496A (ja) | 2016-08-23 | 2023-05-17 | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US10057119B2 (ja) |
EP (1) | EP3452909A1 (ja) |
JP (3) | JP6929863B2 (ja) |
CN (1) | CN108604199B (ja) |
WO (1) | WO2018039061A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10169120B2 (en) * | 2016-06-24 | 2019-01-01 | International Business Machines Corporation | Redundant software stack |
US10425324B2 (en) * | 2017-08-17 | 2019-09-24 | Fabriscale Technologies AS | Method of computing balanced routing paths in fat-trees |
US10574624B2 (en) * | 2017-10-09 | 2020-02-25 | Level 3 Communications, Llc | Staged deployment of rendezvous tables for selecting a content delivery network (CDN) |
CN111106974B (zh) * | 2018-10-25 | 2022-03-08 | 中国信息通信研究院 | 一种测试无损网络性能的方法和装置 |
CN113168391A (zh) * | 2018-11-26 | 2021-07-23 | 阿尔库斯有限公司 | 包括分解式网络元件的逻辑路由器 |
CN113806258B (zh) * | 2021-11-16 | 2022-02-18 | 苏州浪潮智能科技有限公司 | 一种动态自适应的虚拟通道映射方法、装置及存储介质 |
CN114422393B (zh) * | 2021-12-28 | 2023-06-13 | 中国信息通信研究院 | 用于确定无损网络性能的方法及装置、电子设备、存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140241208A1 (en) * | 2011-06-03 | 2014-08-28 | Oracle International Corporation | System and method for supporting sub-subnet in an infiniband (ib) network |
WO2015017145A1 (en) * | 2013-07-29 | 2015-02-05 | Oracle International Corporation | System and method for supporting multi-homed fat-tree routing in a middleware machine environment |
US20150098466A1 (en) * | 2013-10-06 | 2015-04-09 | Mellanox Technologies Ltd. | Simplified packet routing |
WO2016007760A2 (en) * | 2014-07-11 | 2016-01-14 | Oracle International Corporation | System and method for supporting efficient load-balancing in a high performance computing (hpc) environment |
US20160127236A1 (en) * | 2014-10-31 | 2016-05-05 | Oracle International Corporation | System and method for supporting partition-aware routing in a multi-tenant cluster environment |
JP2016119654A (ja) * | 2014-12-23 | 2016-06-30 | インテル コーポレイション | ネットワークファブリックノードにおけるコマンドの同期実行のための技術 |
Family Cites Families (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9828144D0 (en) * | 1998-12-22 | 1999-02-17 | Power X Limited | Data switching apparatus |
US7010607B1 (en) * | 1999-09-15 | 2006-03-07 | Hewlett-Packard Development Company, L.P. | Method for training a communication link between ports to correct for errors |
US7171484B1 (en) | 2000-05-24 | 2007-01-30 | Krause Michael R | Reliable datagram transport service |
US7103626B1 (en) | 2000-05-24 | 2006-09-05 | Hewlett-Packard Development, L.P. | Partitioning in distributed computer system |
US6954459B1 (en) | 2000-06-16 | 2005-10-11 | International Business Machines Corporation | Method for forwarding broadcast packets in a bridged IP network |
US7072360B2 (en) | 2000-09-22 | 2006-07-04 | Narad Networks, Inc. | Network architecture for intelligent network elements |
US8935333B2 (en) | 2001-08-09 | 2015-01-13 | International Business Machines Corporation | Implementing multicast on a system area network channel adapter |
US6839794B1 (en) | 2001-10-12 | 2005-01-04 | Agilent Technologies, Inc. | Method and system to map a service level associated with a packet to one of a number of data streams at an interconnect device |
US6922749B1 (en) | 2001-10-12 | 2005-07-26 | Agilent Technologies, Inc. | Apparatus and methodology for an input port of a switch that supports cut-through operation within the switch |
US20030101426A1 (en) * | 2001-11-27 | 2003-05-29 | Terago Communications, Inc. | System and method for providing isolated fabric interface in high-speed network switching and routing platforms |
US7245627B2 (en) | 2002-04-23 | 2007-07-17 | Mellanox Technologies Ltd. | Sharing a network interface card among multiple hosts |
US7149221B2 (en) | 2002-05-31 | 2006-12-12 | Palau Acquisition Corporation (Delaware) | Apparatus and methods for increasing bandwidth in an infiniband switch |
US7024672B2 (en) * | 2002-06-26 | 2006-04-04 | Microsoft Corporation | Process-mode independent driver model |
US7401157B2 (en) * | 2002-07-30 | 2008-07-15 | Brocade Communications Systems, Inc. | Combining separate infiniband subnets into virtual subnets |
US7221676B2 (en) * | 2002-07-30 | 2007-05-22 | Brocade Communications Systems, Inc. | Supporting local IB packet communication between separate subnets |
US7307996B2 (en) * | 2002-07-30 | 2007-12-11 | Brocade Communications Systems, Inc. | Infiniband router having an internal subnet architecture |
US20040030763A1 (en) | 2002-08-08 | 2004-02-12 | Manter Venitha L. | Method for implementing vendor-specific mangement in an inifiniband device |
US7574526B2 (en) | 2003-07-31 | 2009-08-11 | International Business Machines Corporation | Multicast group management in infiniband |
US7979548B2 (en) | 2003-09-30 | 2011-07-12 | International Business Machines Corporation | Hardware enforcement of logical partitioning of a channel adapter's resources in a system area network |
US7428598B2 (en) | 2003-11-20 | 2008-09-23 | International Business Machines Corporation | Infiniband multicast operation in an LPAR environment |
KR100606063B1 (ko) | 2004-03-16 | 2006-07-26 | 삼성전자주식회사 | 고속 데이터 전용 시스템에서 단말의 서브넷 이동에 따른임시식별자 할당방법 및 장치 |
US7602712B2 (en) | 2004-06-08 | 2009-10-13 | Sun Microsystems, Inc. | Switch method and apparatus with cut-through routing for use in a communications network |
US7400590B1 (en) | 2004-06-08 | 2008-07-15 | Sun Microsystems, Inc. | Service level to virtual lane mapping |
US7860096B2 (en) | 2004-06-08 | 2010-12-28 | Oracle America, Inc. | Switching method and apparatus for use in a communications network |
GB2419702A (en) * | 2004-10-29 | 2006-05-03 | Hewlett Packard Development Co | Virtual overlay infrastructures which can be suspended and later reactivated |
DE102005010476A1 (de) * | 2005-03-04 | 2006-09-07 | Daimlerchrysler Ag | Steuergerät mit konfigurierbaren Hardwaremodulen |
CN101542457B (zh) * | 2005-04-29 | 2015-11-25 | 微软技术许可有限责任公司 | 事务变换 |
US7911977B2 (en) | 2005-05-31 | 2011-03-22 | Cisco Technology, Inc. | Designated router assignment per multicast group address/range |
EP1905207B1 (en) | 2005-07-17 | 2018-04-25 | Obsidian Research Corporation | A method to extend the physical reach of an infiniband network |
US7681130B1 (en) * | 2006-03-31 | 2010-03-16 | Emc Corporation | Methods and apparatus for displaying network data |
US7706303B2 (en) * | 2006-06-26 | 2010-04-27 | Cisco Technology, Inc. | Port pooling |
US7936753B1 (en) | 2007-11-30 | 2011-05-03 | Qlogic, Corporation | Method and system for reliable multicast |
US7983265B1 (en) | 2008-01-17 | 2011-07-19 | Qlogic, Corporation | Method and system for processing a network packet |
US7738371B1 (en) | 2008-08-29 | 2010-06-15 | Qlogic, Corporation | Method and system for routing network packets |
US8363569B2 (en) | 2009-04-22 | 2013-01-29 | Digi International Inc. | System and method for rejoining sleeping subnets in a wireless mesh network |
US8429647B2 (en) | 2009-05-06 | 2013-04-23 | Vmware, Inc. | Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine |
US8351431B2 (en) | 2009-05-13 | 2013-01-08 | Avaya Inc. | Method and apparatus for providing fast reroute of a multicast packet within a network element to an available port associated with a multi-link trunk |
US8140812B2 (en) | 2009-07-01 | 2012-03-20 | International Business Machines Corporation | Method and apparatus for two-phase storage-aware placement of virtual machines |
US8532116B2 (en) | 2009-07-21 | 2013-09-10 | Cisco Technology, Inc. | Extended subnets |
US8274987B2 (en) * | 2010-03-22 | 2012-09-25 | International Business Machines Corporation | Contention free pipelined broadcasting within a constant bisection bandwidth network topology |
CN103125098B (zh) * | 2010-09-17 | 2016-08-17 | 甲骨文国际公司 | 支持中间机环境的系统和方法、子网管理器和网络交换机 |
IT1403031B1 (it) * | 2010-11-19 | 2013-09-27 | Eurotech S P A | Apparecchiatura di rete unificata per sistemi di supercalcolo scalabili |
JP5594171B2 (ja) | 2011-02-02 | 2014-09-24 | 富士通株式会社 | 通信処理装置、アドレス学習プログラムおよびアドレス学習方法 |
JP5750973B2 (ja) | 2011-03-29 | 2015-07-22 | 富士通株式会社 | 通信方法および通信装置 |
CN102761471B (zh) * | 2011-04-29 | 2015-10-07 | 无锡江南计算技术研究所 | 无线计算互连网络及座标空间变换方法 |
CN102164090B (zh) | 2011-05-13 | 2013-12-25 | 杭州华三通信技术有限公司 | 基于通用路由封装隧道的报文转发的方法、系统及设备 |
US8842671B2 (en) | 2011-06-07 | 2014-09-23 | Mellanox Technologies Ltd. | Packet switching based on global identifier |
US9274825B2 (en) | 2011-08-16 | 2016-03-01 | Microsoft Technology Licensing, Llc | Virtualization gateway between virtualized and non-virtualized networks |
US9288160B2 (en) * | 2011-08-23 | 2016-03-15 | Intel Corporation | GID capable switching in an infiniband fabric |
US20130083690A1 (en) * | 2011-10-04 | 2013-04-04 | International Business Machines Corporation | Network Adapter Hardware State Migration Discovery in a Stateful Environment |
US8713169B2 (en) * | 2011-10-11 | 2014-04-29 | Cisco Technology, Inc. | Distributed IPv6 neighbor discovery for large datacenter switching systems |
US9288555B2 (en) * | 2011-11-01 | 2016-03-15 | Plexxi Inc. | Data center network architecture |
US8879396B2 (en) * | 2011-11-15 | 2014-11-04 | Oracle International Corporation | System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology |
US8880932B2 (en) * | 2011-11-15 | 2014-11-04 | Oracle International Corporation | System and method for signaling dynamic reconfiguration events in a middleware machine environment |
US9311122B2 (en) | 2012-03-26 | 2016-04-12 | Oracle International Corporation | System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment |
US9432304B2 (en) | 2012-03-26 | 2016-08-30 | Oracle International Corporation | System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model |
US9264382B2 (en) | 2012-05-11 | 2016-02-16 | Oracle International Corporation | System and method for routing traffic between distinct infiniband subnets based on fat-tree routing |
JP5928582B2 (ja) | 2012-05-16 | 2016-06-01 | 富士通株式会社 | ノード装置および通信方法 |
EP2712239B1 (en) * | 2012-09-19 | 2016-12-21 | BlackBerry Limited | System and method for controlling network scan parameters for a network connection |
US9069633B2 (en) | 2012-12-20 | 2015-06-30 | Oracle America, Inc. | Proxy queue pair for offloading |
US9385949B2 (en) | 2012-12-20 | 2016-07-05 | Mellanox Technologies Tlv Ltd. | Routing controlled by subnet managers |
US9794107B2 (en) | 2013-02-06 | 2017-10-17 | Alcatel Lucent | Method and apparatus for providing migration of cloud components across address domains |
US9378068B2 (en) * | 2013-03-13 | 2016-06-28 | International Business Machines Corporation | Load balancing for a virtual networking system |
US9237111B2 (en) | 2013-03-14 | 2016-01-12 | International Business Machines Corporation | Credit-based flow control in lossless ethernet networks |
US10263839B2 (en) * | 2013-03-15 | 2019-04-16 | Fortinet, Inc. | Remote management system for configuring and/or controlling a computer network switch |
US9191441B2 (en) * | 2013-03-15 | 2015-11-17 | International Business Machines Corporation | Cell fabric hardware acceleration |
US10404621B2 (en) | 2013-03-15 | 2019-09-03 | Oracle International Corporation | Scalable InfiniBand packet-routing technique |
US9307053B2 (en) | 2013-04-23 | 2016-04-05 | Cisco Technology, Inc. | Direct data placement over user datagram protocol in a network environment |
US9477276B2 (en) * | 2013-06-13 | 2016-10-25 | Dell Products L.P. | System and method for switch management |
US9577928B2 (en) | 2013-08-27 | 2017-02-21 | Oracle International Corporation | System and method for supporting data service addressing in an engineered system for middleware and application execution |
US10212022B2 (en) | 2013-09-13 | 2019-02-19 | Microsoft Technology Licensing, Llc | Enhanced network virtualization using metadata in encapsulation header |
EP3063637A4 (en) * | 2013-10-31 | 2017-07-19 | Intel Corporation | A method, apparatus and system for dynamically controlling an addressing mode for a cache memory |
US9648148B2 (en) | 2013-12-24 | 2017-05-09 | Intel Corporation | Method, apparatus, and system for QoS within high performance fabrics |
US9628382B2 (en) * | 2014-02-05 | 2017-04-18 | Intel Corporation | Reliable transport of ethernet packet data with wire-speed and packet data rate match |
US10523753B2 (en) * | 2014-05-06 | 2019-12-31 | Western Digital Technologies, Inc. | Broadcast data operations in distributed file systems |
US9519328B2 (en) * | 2014-05-21 | 2016-12-13 | Intel Corporation | Techniques for selectively reducing power levels of ports and core switch logic in infiniband switches |
US9723009B2 (en) * | 2014-09-09 | 2017-08-01 | Oracle International Corporation | System and method for providing for secure network communication in a multi-tenant environment |
US20160080255A1 (en) * | 2014-09-17 | 2016-03-17 | Netapp, Inc. | Method and system for setting up routing in a clustered storage system |
US9311133B1 (en) | 2014-10-09 | 2016-04-12 | Cisco Technology, Inc. | Touchless multi-domain VLAN based orchestration in a network environment |
US9525636B2 (en) | 2014-10-20 | 2016-12-20 | Telefonaktiebolaget L M Ericsson (Publ) | QoS on a virtual interface over multi-path transport |
US10599458B2 (en) * | 2015-01-23 | 2020-03-24 | Unisys Corporation | Fabric computing system having an embedded software defined network |
US9928093B2 (en) | 2015-02-24 | 2018-03-27 | Red Hat Israel, Ltd. | Methods and systems for establishing connections associated with virtual machine migrations |
US9733968B2 (en) | 2015-03-16 | 2017-08-15 | Oracle International Corporation | Virtual machine (VM) migration from switched fabric based computing system to external systems |
US11204791B2 (en) | 2015-06-30 | 2021-12-21 | Nicira, Inc. | Dynamic virtual machine network policy for ingress optimization |
US10284383B2 (en) * | 2015-08-31 | 2019-05-07 | Mellanox Technologies, Ltd. | Aggregation protocol |
US10033647B2 (en) * | 2015-10-13 | 2018-07-24 | Oracle International Corporation | System and method for efficient network isolation and load balancing in a multi-tenant cluster environment |
US10498654B2 (en) * | 2015-12-28 | 2019-12-03 | Amazon Technologies, Inc. | Multi-path transport design |
US10171353B2 (en) * | 2016-03-04 | 2019-01-01 | Oracle International Corporation | System and method for supporting dual-port virtual router in a high performance computing environment |
US10623315B1 (en) * | 2016-03-22 | 2020-04-14 | Amazon Technologies, Inc. | Extending virtual routing and forwarding |
US10255213B1 (en) * | 2016-03-28 | 2019-04-09 | Amazon Technologies, Inc. | Adapter device for large address spaces |
US10877911B1 (en) * | 2016-03-30 | 2020-12-29 | Amazon Technologies, Inc. | Pattern generation using a direct memory access engine |
US10977192B1 (en) * | 2016-04-08 | 2021-04-13 | Amazon Technologies, Inc. | Real-time memory-page state tracking and its applications |
US11086801B1 (en) * | 2016-04-14 | 2021-08-10 | Amazon Technologies, Inc. | Dynamic resource management of network device |
US10225185B2 (en) | 2016-04-18 | 2019-03-05 | International Business Machines Corporation | Configuration mechanisms in a switchless network |
US10257080B1 (en) * | 2016-05-31 | 2019-04-09 | Amazon Technologies, Inc. | Hardware resource allocation for equal-cost multi-path groups |
US10237378B1 (en) * | 2016-06-29 | 2019-03-19 | Amazon Technologies, Inc. | Low-latency metadata-based packet rewriter |
US20180026878A1 (en) | 2016-07-24 | 2018-01-25 | Mellanox Technologies Tlv Ltd. | Scalable deadlock-free deterministic minimal-path routing for dragonfly networks |
US11042496B1 (en) * | 2016-08-17 | 2021-06-22 | Amazon Technologies, Inc. | Peer-to-peer PCI topology |
US10158500B2 (en) * | 2016-09-13 | 2018-12-18 | Ciena Corporation | G.8032 prioritized ring switching systems and methods |
US11076025B1 (en) * | 2016-12-27 | 2021-07-27 | Amazon Technologies, Inc. | Generating network packet centric signatures |
-
2017
- 2017-08-18 US US15/680,463 patent/US10057119B2/en active Active
- 2017-08-18 WO PCT/US2017/047552 patent/WO2018039061A1/en unknown
- 2017-08-18 CN CN201780010773.XA patent/CN108604199B/zh active Active
- 2017-08-18 JP JP2018541609A patent/JP6929863B2/ja active Active
- 2017-08-18 EP EP17758745.8A patent/EP3452909A1/en active Pending
-
2018
- 2018-02-07 US US15/891,183 patent/US10097412B2/en active Active
- 2018-07-19 US US16/040,114 patent/US10708131B2/en active Active
-
2020
- 2020-05-29 US US16/887,328 patent/US11716247B2/en active Active
-
2021
- 2021-08-11 JP JP2021131306A patent/JP7282840B2/ja active Active
-
2023
- 2023-05-17 JP JP2023081518A patent/JP2023106496A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140241208A1 (en) * | 2011-06-03 | 2014-08-28 | Oracle International Corporation | System and method for supporting sub-subnet in an infiniband (ib) network |
WO2015017145A1 (en) * | 2013-07-29 | 2015-02-05 | Oracle International Corporation | System and method for supporting multi-homed fat-tree routing in a middleware machine environment |
US20150098466A1 (en) * | 2013-10-06 | 2015-04-09 | Mellanox Technologies Ltd. | Simplified packet routing |
WO2016007760A2 (en) * | 2014-07-11 | 2016-01-14 | Oracle International Corporation | System and method for supporting efficient load-balancing in a high performance computing (hpc) environment |
US20160127236A1 (en) * | 2014-10-31 | 2016-05-05 | Oracle International Corporation | System and method for supporting partition-aware routing in a multi-tenant cluster environment |
JP2016119654A (ja) * | 2014-12-23 | 2016-06-30 | インテル コーポレイション | ネットワークファブリックノードにおけるコマンドの同期実行のための技術 |
Also Published As
Publication number | Publication date |
---|---|
JP2023106496A (ja) | 2023-08-01 |
JP2019526943A (ja) | 2019-09-19 |
US11716247B2 (en) | 2023-08-01 |
US20180167274A1 (en) | 2018-06-14 |
US20180062925A1 (en) | 2018-03-01 |
EP3452909A1 (en) | 2019-03-13 |
CN108604199A (zh) | 2018-09-28 |
US10708131B2 (en) | 2020-07-07 |
US20180351801A1 (en) | 2018-12-06 |
JP7282840B2 (ja) | 2023-05-29 |
US10097412B2 (en) | 2018-10-09 |
CN108604199B (zh) | 2022-08-23 |
JP6929863B2 (ja) | 2021-09-01 |
US20200295992A1 (en) | 2020-09-17 |
US10057119B2 (en) | 2018-08-21 |
WO2018039061A1 (en) | 2018-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7109527B2 (ja) | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 | |
US11740922B2 (en) | System and method for providing an InfiniBand SR-IOV vSwitch architecture for a high performance cloud computing environment | |
JP6850804B2 (ja) | 高性能コンピューティング環境においてデュアルポート仮想ルータをサポートするためのシステムおよび方法 | |
JP7282840B2 (ja) | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 | |
US10693809B2 (en) | System and method for representing PMA attributes as SMA attributes in a high performance computing environment | |
US11750513B2 (en) | System and method for scalable multi-homed routing for vSwitch based HCA virtualization | |
JP2022003791A (ja) | 高性能コンピューティング環境においてスケーラブルなビットマップに基づくP_Keyテーブルをサポートするためのシステムおよび方法 | |
EP3408983B1 (en) | System and method for supporting scalable representation of switch port status in a high performance computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210903 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210903 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7282840 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |