JP2022153494A - 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 - Google Patents
無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2022153494A JP2022153494A JP2022114933A JP2022114933A JP2022153494A JP 2022153494 A JP2022153494 A JP 2022153494A JP 2022114933 A JP2022114933 A JP 2022114933A JP 2022114933 A JP2022114933 A JP 2022114933A JP 2022153494 A JP2022153494 A JP 2022153494A
- Authority
- JP
- Japan
- Prior art keywords
- virtual
- switch
- switches
- lid
- host channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013508 migration Methods 0.000 claims description 41
- 230000005012 migration Effects 0.000 claims description 40
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 81
- 230000003863 physical function Effects 0.000 description 41
- 230000007246 mechanism Effects 0.000 description 32
- 239000004744 fabric Substances 0.000 description 30
- 238000007726 management method Methods 0.000 description 15
- 238000005192 partition Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 239000004230 Fast Yellow AB Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101100216234 Schizosaccharomyces pombe (strain 972 / ATCC 24843) cut20 gene Proteins 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000001341 grazing-angle X-ray diffraction Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 101100128228 Schizosaccharomyces pombe (strain 972 / ATCC 24843) lid2 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/485—Task life-cycle, e.g. stopping, restarting, resuming execution
- G06F9/4856—Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5077—Logical partitioning of resources; Management or configuration of virtualized resources
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/46—Interconnection of networks
- H04L12/4604—LAN interconnection over a backbone network, e.g. Internet, Frame Relay
- H04L12/462—LAN interconnection over a bridge based backbone
- H04L12/4625—Single bridge functionality, e.g. connection of two networks over a single bridge
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/0816—Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/24—Multipath
- H04L45/247—Multipath using M:N active or standby paths
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/48—Routing tree calculation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/48—Routing tree calculation
- H04L45/484—Routing tree calculation using multiple routing trees
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/70—Virtual switches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45595—Network integration; Enabling network access in virtual machine instances
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/22—Alternate routing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L47/00—Traffic control in data switching networks
- H04L47/10—Flow control; Congestion control
- H04L47/12—Avoiding congestion; Recovering from congestion
- H04L47/125—Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Small-Scale Networks (AREA)
- Multi Processors (AREA)
Abstract
Description
この特許文献の開示の一部は、著作権保護の対象となる資料を含む。この特許文献または特許開示は特許商標庁の特許ファイルまたは記録に記載されているため、著作権保有者は、何人によるその複写複製に対しても異議はないが、その他の場合には如何なるときもすべての著作権を保有する。
本発明は、概して、コンピュータシステムに関し、特に、SR-IOV vSwitchアーキテクチャを用いてコンピュータシステム仮想化およびライブマイグレーションをサポートすることに関する。
導入されるクラウドコンピューティングアーキテクチャがより大規模になるのに応じて、従来のネットワークおよびストレージに関する性能および管理の障害が深刻な問題になってきている。クラウドコンピューティングファブリックのための基礎としてインフィニバンド(登録商標)(InfiniBand:IB)技術などの高性能な無損失相互接続を用いることへの関心がますます高まってきている。これは、本発明の実施形態が対応するように意図された一般領域である。
サブネットにおいて仮想マシンマイグレーションをサポートするためのシステムおよび方法がこの明細書中に記載される。例示的な方法は、1つ以上のマイクロプロセッサを含む1つ以上のコンピュータにおいて、1つ以上のスイッチを設けることができ、当該1つ以上のスイッチは少なくともリーフスイッチを含み、当該1つ以上のスイッチの各々は複数のポートを含み、当該方法はさらに、複数のホストチャネルアダプタを設けることができる。複数のホストチャネルアダプタの各々は、少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含む。複数のホストチャネルアダプタは当該1つ以上のスイッチを介して相互接続されている。当該方法はさらに、複数のハイパーバイザを設けることができる。当該複数のハイパーバイザの各々は当該複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられている。当該方法はさらに、複数の仮想マシンを設けることができる。複数の仮想マシンの各々は、少なくとも1つの仮想機能に関連付けられている。当該方法はさらに、予めポピュレートされたローカル識別子(local identifier:LID)アーキテクチャを備えた仮想スイッチ、または動的LID割当てアーキテクチャを備えた仮想スイッチのうち1つ以上を備えた複数のホストチャネルアダプタを配置することができる。当該方法は、各々の仮想スイッチをLIDに割当てることができ、割当てられたLIDは関連付けられた物理機能のLIDに対応している。当該方法は、仮想スイッチの各々に割当てられたLIDに少なくとも基づいて、1つ以上のリニアフォワーディングテーブル(linear forwarding table:LFT)を計算することができる。1つ以上のLFTの各々は、1つ以上のスイ
ッチのうちの一のスイッチに関連付けられている。
つ以上のスイッチとを設けることができ、当該1つ以上のスイッチの各々は複数のポートを含み、さらに、複数のホストチャネルアダプタを設けることができ、ホストチャネルアダプタの各々は少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含み、複数のホストチャネルアダプタは1つ以上のスイッチを介して相互接続されており、さらに、複数のハイパーバイザを設けることができ、複数のハイパーバイザの各々は、複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、さらに、複数の仮想マシンを設けることができ、複数の仮想マシンの各々は少なくとも1つの仮想機能に関連付けられている。当該方法は、予めポピュレートされたローカル識別子(LID)アーキテクチャを備えた仮想スイッチまたは動的LID割当てアーキテクチャを備えた仮想スイッチのうち1つ以上を備えた複数のホストチャネルアダプタを配置することができる。当該方法は、仮想スイッチの各々に複数の物理的LID(physical LID:pLID)のうち1つのpLIDを割当てることができ、割当てられたpLIDは関連付けられた物理機能のpLIDに対応している。当該方法はまた、複数の仮想マシンの各々に複数の仮想LID(virtual LID:vLID)
のうち1つのvLIDを割当てることができ、LIDスペースは複数のpLIDおよび複数のvLIDを含んでいる。
本発明は、同様の参照番号が同様の要素を指している添付図面の図において、限定のためではなく例示のために説明されている。なお、この開示における「ある」または「1つの」または「いくつかの」実施形態への参照は必ずしも同じ実施形態に対するものではなく、そのような参照は少なくとも1つを意味する。特定の実現例が説明されるが、これらの特定の実現例が例示的な目的のためにのみ提供されることが理解される。当業者であれば、他の構成要素および構成が、この発明の範囲および精神から逸脱することなく使用され得ることを認識するであろう。
とが望ましい。RDMAはOSスタックをバイパスし、ハードウェアと直接通信することで、シングルルートI/O仮想化(Single-Root I/O Virtualization:SR-IOV)ネットワークアダプタのようなパススルー技術が使用可能となる。一実施形態に従うと、高性能な無損失相互接続ネットワークにおける適用可能性のために、仮想スイッチ(virtual switch:vSwitch)SR-IOVアーキテクチャを提供することができる。ライブマイグレーションを実際に選択できるようにするためにネットワーク再構成時間が重要となるので、ネットワークアーキテクチャに加えて、スケーラブルであるとともにトポロジーに依存しない動的な再構成メカニズムを提供することができる。
能にする。このため、仮想化は、ライブマイグレーションによる統合、リソースのオン・デマンド・プロビジョニングおよび融通性を可能にし得る。
インフィニバンド(IB)は、インフィニバンド・トレード・アソシエーション(InfiniBandTM Trade Association)によって開発されたオープン標準無損失ネットワーク技術である。この技術は、特に高性能コンピューティング(high-performance computing:HPC)アプリケーションおよびデータセンタを対象とする、高スループットおよび少ない待ち時間の通信を提供するシリアルポイントツーポイント全二重相互接続(serial point-to-point full-duplex interconnect)に基づいている。
ポロジー分割をサポートする。低層では、IBネットワークはサブネットと呼ばれ、1つのサブネットは、スイッチおよびポイントツーポイントリンクを使用して相互接続される一組のホストを含み得る。より高いレベルでは、1つのIBファブリックは、ルータを使用して相互接続され得る1つ以上のサブネットを構成する。
ージェントは、すべてのIBサブネットデバイス上に存在する。SMPを使用することにより、サブネットマネージャは、ファブリックを発見し、エンドノードおよびスイッチを構成し、SMAから通知を受信することができる。
エントリのみがサポートされる。パケットがあるスイッチに到着すると、その出力ポートは、そのスイッチのフォワーディングテーブルにおいてDLIDを検索することによって判断される。所与の送信元-宛先ペア(LIDペア)間のネットワークにおいてパケットは同じ経路を通るため、ルーティングは決定論的である。
耐故障性のために待機モードで作動する。しかしながら、マスターサブネットマネージャが故障した状況では、待機中のサブネットマネージャによって、新しいマスターサブネットマネージャが取り決められる。マスターサブネットマネージャはまた、サブネットの周期的なスイープ(sweep)を行なってあらゆるトポロジー変化を検出し、それに応じてネ
ットワークを再構成する。
または、ネットワーク変化を信号で伝えるメッセージ(トラップ)をSMが受信した場合、SMは、発見された変化に従ってネットワークを再構成し得る。
を介してデータトラフィックを送信または受信するエンドノードに関連付けられたP_Key情報を含むパーティション実施テーブルを用いて、スイッチポートおよびルータポートを構成することができる。加えて、一般的な場合には、スイッチポートのパーティションメンバーシップは、(リンクに向かう)出口方向に向かってポートを介してルーティングされたLIDに間接的に関連付けられたすべてのメンバーシップの集合を表わし得る。
過去10年の間に、ハードウェア仮想化サポートによってCPUオーバーヘッドが実質的に排除され、メモリ管理ユニットを仮想化することによってメモリオーバーヘッドが著しく削減され、高速SANストレージまたは分散型ネットワークファイルシステムの利用によってストレージオーバーヘッドが削減され、シングルルートI/O仮想化(Single Root Input/Output Virtualization:SR-IOV)のようなデバイス・パススルー技術
を使用することによってネットワークI/Oオーバーヘッドが削減されてきたことに応じて、仮想化された高性能コンピューティング(High Performance Computing:HPC)環境の将来見通しが大幅に改善されてきた。現在では、クラウドが、高性能相互接続ソリューションを用いて仮想HPC(virtual HPC:vHPC)クラスタに対応し、必要な性能
を提供することができる。
が発生すると、IBサブネットマネージャ(Subnet Manager:SM)にサブネット管理(Subnet Administration:SA)経路記録クエリを送信することによって、再接続すべき
仮想マシンの新しいアドレスを突きとめることにより、失われた接続を回復させるように試みることができる。
プのアドレスは128ビットのグローバル識別子(GID)である。GIDは有効なIPv6ユニキャストアドレスであり、少なくとも1つが各々のHCAポートに割当てられている。GIDは、ファブリックアドミニストレータによって割当てられたグローバルに固有の64ビットプレフィックスと各々のHCAポートのGUIDアドレスとを組合わせることによって形成される。
一実施形態によれば、IBベースのHPCシステムのいくつかは、ファットツリートポロジーを採用して、ファットツリーが提供する有用な特性を利用する。これらの特性は、各送信元宛先ペア間の複数経路の利用可能性に起因する、フルバイセクション帯域幅および固有の耐故障性を含む。ファットツリーの背後にある初期の概念は、ツリーがトポロジーのルート(root)に近づくにつれて、より利用可能な帯域幅を用いて、ノード間のより太いリンクを採用することであった。より太いリンクは、上位レベルのスイッチにおける輻輳を回避するのに役立てることができ、バイセクション帯域幅が維持される。
Distribution:IBベースのアプリケーションを構築しデプロイするための標準ソフト
ウェアスタック)サブネットマネージャ、すなわちOpenSMにおいて実現される。
ツリールーティングアルゴリズムによって割当てられたルートのうちのいくつかがユーザトラフィックのために使用されないことを意味する。ファットツリールーティングメカニズムが、それらのルートについてのLFTを、他の機能的経路と同じやり方で生成する場合、問題が生じる。この動作は、リンク上でバランシングを劣化させるおそれがある。なぜなら、ノードが索引付けの順序でルーティングされているからである。パーティションに気づかずにルーティングが行なわれるため、ファットツリーでルーティングされたサブネットにより、概して、パーティション間の分離が不良なものとなる。
ッチは、ツリーにおいて上下方向に同数の接続を有している。XGFTファットツリーは、スイッチのための異なる数の上下方向の接続と、ツリーにおける各レベルでの異なる数の接続とをともに可能にすることによって、k-ary-n-treeを拡張させる。PGFT定義はさらに、XGFTトポロジーを拡張して、スイッチ間の複数の接続を可能にする。多種多様なトポロジーはXGFTおよびPGFTを用いて定義することができる。しかしながら、実用化するために、現代のHPCクラスタにおいて一般に見出されるファットツリーを定義するために、PGFTの制限バージョンであるRLFTが導入されている。RLFTは、ファットツリーにおけるすべてのレベルに同じポートカウントスイッチを用いている。
一実施形態に従うと、I/O仮想化(I/O Virtualization:IOV)は、基礎をなす物理リソースに仮想マシン(VM)がアクセスすることを可能にすることによって、I/Oを利用可能にすることができる。ストレージトラフィックとサーバ間通信とを組合せると、シングルサーバのI/Oリソースにとって抗し難い高い負荷が課され、結果として、データの待機中に、バックログが発生し、プロセッサがアイドル状態になる可能性がある。I/O要求の数が増えるにつれて、IOVにより利用可能性をもたらすことができ、最新のCPU仮想化において見られる性能レベルに匹敵するように、(仮想化された)I/Oリソースの性能、スケーラビリティおよび融通性を向上させることができる。
仮想化(SR-IOV)などのさまざまなタイプのIOV技術が存在し得る。
ウェアエミュレーションはさらなる不所望な計算上のオーバーヘッドをもたらしてしまう。
ハードウェア仮想化によって、物理装置がその同じ装置の複数の独立した軽量のインスタンスとして現われることを可能にし得る。これらのインスタンスは、パススルー装置としてVMに割当てることができ、仮想機能(Virtual Function:VF)としてアクセスすることができる。ハイパーバイザは、(1つのデバイスごとに)固有の、十分な機能を有する物理機能(Physical Function:PF)によってデバイスにアクセスする。SR-IO
Vは、純粋に直接的に割当てする際のスケーラビリティの問題を軽減する。しかしながら、SR-IOVによって提示される問題は、それがVMマイグレーションを損なう可能性があることである。これらのIOV技術の中でも、SR-IOVは、ほぼ固有の性能を維持しながらも、複数のVMから単一の物理デバイスに直接アクセスすることを可能にする手段を用いてPCI Express(PCIe)規格を拡張することができる。これにより、SR-IOVは優れた性能およびスケーラビリティを提供することができる。
常のPCIe機能であるのに対して、VFは軽量のPCIe機能である。各々のVFはそれ自体のベースアドレス(base address:BAR)を有しており、固有のリクエスタIDが割当てられている。固有のリクエスタIDは、I/Oメモリ管理ユニット(I/O memory
management unit:IOMMU)がさまざまなVFへの/からのトラフィックストリームを区別することを可能にする。IOMMUはまた、メモリを適用して、PFとVFとの間の変換を中断する。
レーションが実行されることとなり、新しいVFが宛先において付与されることとなる。インフィニバンドおよびSR-IOVの場合、このプロセスがダウンタイムを数秒のオーダでもたらす可能性がある。さらに、SR-IOV共有型ポートモデルにおいては、VMのアドレスがマイグレーション後に変化することとなり、これにより、SMにオーバーヘッドが追加され、基礎をなすネットワークファブリックの性能に対して悪影響が及ぼされることとなる。
さまざまなタイプのSR-IOVモデル(たとえば共有ポートモデル、仮想スイッチモデルおよび仮想ポートモデル)があり得る。
図4は、一実施形態に従った例示的なvSwitchアーキテクチャを示す。図に示されるように、ホスト400(たとえばホストチャネルアダプタ)はハイパーバイザ410と対話することができ、当該ハイパーバイザ410は、さまざまな仮想機能430、440および450をいくつかの仮想マシンに割当てることができる。同様に、物理機能はハ
イパーバイザ410によって処理することができる。仮想スイッチ415もハイパーバイザ401によって処理することができる。
図5は、一実施形態に従った例示的なvPortの概念を示す。図に示されるように、ホスト300(たとえばホストチャネルアダプタ)は、さまざまな仮想機能330、340および350をいくつかの仮想マシンに割当てることができるハイパーバイザ410と対話することができる。同様に、物理機能はハイパーバイザ310によって処理することができる。
一実施形態に従うと、本開示は、LIDが予めポピュレートされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
はホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。さらに、ホストチャネルアダプタ510、520および530は、それぞれ、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550はハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2 551を仮想機能2 515に割当て、仮想マシン3
552を仮想機能3 516に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上で十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
いては、単一のサブネットについて理論上のハイパーバイザ限度は利用可能なユニキャストLIDの数によって規定されており、(49151個の利用可能なLIDをハイパーバイザごとに17個のLIDで割って得られる)2891であり、VMの総数(すなわち限度)は(ハイパーバイザごとに2891個のハイパーバイザに16のVFを掛けて得られる)46256である(実質的には、IBサブネットにおける各々のスイッチ、ルータまたは専用のSMノードが同様にLIDを消費するので、これらの数は実際にはより小さくなる)。なお、vSwitchが、LIDをPFと共有することができるので、付加的なLIDを占有する必要がないことに留意されたい。
を可能にする。VMをマイグレートしてその関連するLIDを宛先に送達する必要がある場合、不連続なLIDを自由に使用できることは特に有用となる。
一実施形態に従うと、本開示は、動的LID割当てがなされたvSwitchアーキテクチャを提供するためのシステムおよび方法を提供する。
52を仮想機能3 516に割当てることができる。ハイパーバイザ531はさらに、仮想マシン4 553を仮想機能1 534に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
図8は、一実施形態に従った、動的LID割当てがなされてLIDが予めポピュレートされたvSwitchを備えた例示的なvSwitchアーキテクチャを示す。図に示されるように、いくつかのスイッチ501~504は、ネットワーク切替環境800(たとえばIBサブネット)内においてインフィニバンドファブリックなどのファブリックのメンバ間で通信を確立することができる。ファブリックはホストチャネルアダプタ510、520、530などのいくつかのハードウェアデバイスを含み得る。ホストチャネルアダプタ510、520および530は、それぞれ、さらに、ハイパーバイザ511、521および531と対話することができる。各々のハイパーバイザは、さらに、ホストチャネルアダプタと共に、いくつかの仮想機能514、515、516、524、525、526、534、535および536と対話し、設定し、いくつかの仮想マシンに割当てることができる。たとえば、仮想マシン1 550は、ハイパーバイザ511によって仮想機能1 514に割当てることができる。ハイパーバイザ511は、加えて、仮想マシン2
551を仮想機能2 515に割当てることができる。ハイパーバイザ521は、仮想
マシン3 552を仮想機能3 526に割当てることができる。ハイパーバイザ531は、さらに、仮想マシン4 553を仮想機能2 535に割当てることができる。ハイパーバイザは、ホストチャネルアダプタの各々の上において十分な機能を有する物理機能513、523および533を介してホストチャネルアダプタにアクセスすることができる。
ットに接続され得る。
一実施形態に従うと、vSwitchアーキテクチャを用いる場合の問題はLIDスペースが制限されていることである。LIDスペースに関するスケーラビリティの問題を克服するために、以下の3つの代替例(各々を以下にさらに詳細に説明する)を独立して用いるかまたは組合わせることができる:すなわち、複数のサブネットを用いること;後方互換性のあるLIDスペース拡張を導入すること;および、軽量のvSwitchを形成するためにvPortアーキテクチャとvSwitchアーキテクチャとを組合わせること;である。
より、LIDスペースを18ビットに拡張する(LIDスペースを4倍にする)ことができ、物理的装置に割当てられた物理的LID(pLID)およびVMに割当てられた仮想LID(vLID)を用いたスキームを作成することができる。
ードウェアのすべてが拡張されたLIDスペースをサポートするかどうかを識別することができる。そうでなければ、SMはレガシー互換モードでフォールバックすることができ、VMはpLIDスペースからのLIDを占有するはずである。
extension flag:LEXTF)903は1ビットを含み、第1の予備ビット(R1)9
04は1ビットを含み、リンク次ヘッダ(link next header:LNH)905は2ビットを含み、宛先ローカルID(destination local ID:DLID)906は16ビットを含み、DLIDプレフィックス拡張(DLID prefix extension:DPF)907は2ビット
を含み、SLIDプレフィックス拡張(SLID prefix extension:SPF)908は2ビ
ットを含み、第2の予備ビット(R2)909は1ビットを含み、パケット長(packet length:PktLen)910は11ビット含み、送信元ローカルID(source local ID:SLID)911は16ビットを含む。一実施形態に従うと、両方の予備ビット904および909はゼロに設定することができる。
グを実行している間に別々に考慮されるようにするために)、多数のピアを備えたポピュラーなVM(たとえばサーバ)には専用のLIDが割当てられ得る一方で、多くのピアと対話しないかまたはステートレスなサービスを実行する(マイグレートされる必要がなく、再生成され得る)他のVMはLIDを共有することができる。
一実施形態に従うと、より高い性能を得るために、ルーティングアルゴリズムは、ルートを計算する際にvSwitchアーキテクチャを考慮に入れることができる。ファットツリーにおいては、vSwitchは、vSwitchが対応するリーフスイッチへの上りリンクを1つだけ有するという独特な特性によってトポロジー発見プロセスにおいて識別することができる。vSwitchが識別されると、ルーティング機能は、各VMからのトラフィックがネットワークにおける他のすべてのVMに向かう経路を発見することができるように、すべてのスイッチのためのLFTを生成することができる。各VMはそれ自体のアドレスを有しており、このため、各VMは、同じvSwitchに付与された他のVMからは独立してルーティングすることができる。これにより、結果として、トポロジーにおけるvSwitchに向かうとともに各々が特定のVMへのトラフィックを担持している独立した複数の経路を生成するルーティング機能が得られる。このアプローチの1つの欠点として、VM分配がvSwitchの間で均一でない場合、より多くのVMを備えたvSwitchには潜在的により大きなネットワークリソースが割当てられる点がある。しかしながら、vSwitchから対応するリーフスイッチまでの単一の上りリンクは、依然として、特定のvSwitchに付与されたすべてのVMによって共有されるボトルネックリンクのままである。結果として、準最適にネットワークが利用される可能性がある。最も単純で最速のルーティング戦略は、すべてのvSwitch-vSwitchの対の間に経路を生成して、対応するvSwitchに割当てられるのと同じ経路を備えたVMをルーティングすることである。予めポピュレートされたLID割当てスキームと動的LID割当てスキームとがあれば、各々のvSwitchは、SR-IOVアーキテクチャにおけるPFによって定義されたLIDを有する。vSwitchについてのこれらのPF LIDは、ルーティングの第1段階でLFTを生成するために用いることができ、第2段階では、VMのLIDを生成されたLFTに追加することができる。予めポピュレートされたLIDスキームにおいては、VF LIDへのエントリは対応するvSwitchの出力ポートをコピーすることによって追加することができる。同様に、新しいVMがブートされた場合の動的LID割当ての場合、VMのLIDと対応するvSwitchによって決定された出力ポートとを備えた新しいエントリがすべてのLFTにおいて追加される。この戦略についての問題点は、vSwitchを共有する別々のテナントに属するVMが、ネットワークにおいて同じ完全な経路を共有しているせいで、それらの間で固有に干渉する可能性がある点である。高いネットワーク利用率を維持しながらもこの問題を解決するために、仮想化されたサブネットのための重み付けされたルーティングスキームを用いることができる。
けるリンクは、実際のVM分配によって影響されことなくバランスを取ることができる。同時に、スキームは、トポロジーにおける中間リンクで同じvSwitch VM間における干渉をなくした上で、各VMがネットワークにおいて独立してルーティングされ得る多重通路を可能にする。当該スキームは、VMがその割当てられた容量を上回るのを確実に防止するために、VM率の上限ごとに、各vSwitch上での実施と組合わせることができる。加えて、ネットワークにおいて複数のテナントグループが存在している場合、テナント認識型ルーティングのような技術は、テナント間でネットワーク全体を分離させるために、提案されたルーティングスキームと統合することができる。
せている。各々のリーフスイッチのために、ルーティングメカニズムは、接続されたVM(行3)に基づいて減少する順序で、接続されたvSwitchをソートする。この順序は、より高い重みが付けられたVMが最初にルーティングされることを確実にするので、リンクに割当てられたルートのバランスを取ることができる。ルーティングメカニズムは、すべてのリーフスイッチおよびそれらの対応するvSwitchを通過し、各々のVMからツリー内を横断して、ROUTEDOWNGOINGBYGOINGUP(行10)をコールすることによって、ツリー内においてVMに向かう経路を再帰的に割当てる。各々のスイッチにおける下りポートは、利用可能な上りポート群のすべての中で最少累積の下り重み(downward weight)に基づいて選択されている(ROUTEDOWNGOIN
GBYGOINGUP;行16)。下りポートが選択されると、当該メカニズムは、ルーティングされているVMの重みによって、対応するポートについての下り累積重みを増やすことができる(ROUTEDOWNGOINGBYGOINGUP;行19)。下りポートが設定された後、ルーティングメカニズムは、ツリーを下降していくことによってすべての接続された下りスイッチ上において、VMに向かうルートのために上りポートを割当てることができる(ポートについての対応する上り重み(upward weight)を更新する
)(ROUTEUPGOINGBYGOINGDOWN;行20)。次いで、当該プロセスはツリーにおける次のレベルまで上っていくことによって繰返される。すべてのVMがルーティングされると、(擬似コードに図示されない)トポロジーにおいてvSwitch経路とvSwitch経路との間でバランスを取るように等しい重み付けがなされているにも関わらず、アルゴリズムはまた、VMと同じ方法でvSwitchの物理的LIDをルーティングする。これは、最小限の再構成方法がライブマイグレーションの文脈において用いられる際にバランスを取るのを向上させるのに望ましい。また、vSwitchのベースとなる物理的LID上のルーティング経路は、再構成を必要とすることなく、新しいVMを迅速にデプロイするために予め定められた経路として用いることができる。しかしながら、一定の期間にわたって、全体的なルーティング性能は、元のvSwitchFatTreeルーティングの間にわずかに減少するだろう。性能の低下を制限するために、ある性能しきい値を超えたとき、vSwitchFatTreeに基づいた再構成をオフラインで実行してもよい。
8 962のために接続性を提供する。
一実施形態に従うと、ItRC(Iterative Reconfiguration:反復再構成)と略され
得る動的な再構成メカニズムは、VMがマイグレートされたときに、必要に応じて、ルートの切替えおよび更新をすべてを繰返す。しかしながら、サブネットにおける既存のLFT(すなわち、既に計算されたLFTであって、サブネット内の各スイッチに存在しているLFT)に応じて、スイッチのサブセットだけを実際に更新する必要がある。
1301~スイッチ12 1312を含み得る。これらのスイッチのうちのいくつかは、スイッチ1 1301、スイッチ2 1302、スイッチ11 1311、スイッチ12 1312などのリーフスイッチを含み得る。サブネットは、付加的に、いくつかのホスト/ハイパーバイザ1330、1340、1350および1360、いくつかの仮想スイッチVS1 1331、VS2 1341、VS3 1351およびVS4 1361を含み得る。さまざまなホスト/ハイパーバイザは、仮想機能を介して、VM1 1332、VM2 1333、VM3 1334、VM4 1342、VM5 1343およびVM6 1352などのサブネット内の仮想マシンをホストすることができる。
パーバイザ1330からハイパーバイザ1340における自由な仮想機能にマイグレートする場合、リーフスイッチ1 1301におけるLFTだけが更新される必要がある。なぜなら、両方のハイパーバイザが同じリーフスイッチに接続されており、局所的な変更がネットワークの残りの部分に影響を及ぼさないからである。たとえば、最初のルーティングアルゴリズムは、ハイパーバイザ1360からハイパーバイザ1330に向かうトラフィックが実線(すなわち、12→9→5→3→1)によって印付けされた第1の経路を追従すると判断する。同様に、ハイパーバイザ1360からハイパーバイザ1340に向かうトラフィックは、破線(すなわち、12→10→6→4→1)によって印付けされた第2の経路を追従する。VM3がマイグレートされ、ネットワークを再構成するためにItRCが用いられる場合、VM3に向かうトラフィックは、マイグレーションの前にハイパーバイザ1330に向かう第1の経路を追従し、マイグレーションの後、ハイパーバイザ1340に向かう第2の経路を追従することとなるだろう。この状況においては、ファットツリールーティングアルゴリズムが最初のルーティングのために用いられたと想定すると、ItRC法は、スイッチの総数の半分(6/12)を更新するだろう。しかしながら、マイグレートされたVMを接続されたままにしておくためにリーフスイッチを1つだけ更新する必要がある。
TreeMinRCと称される、ファットツリー上でのVMマイグレーションをサポートするためのトポロジー認識型高速再構成方法によって達成することができる。
一実施形態に従うと、以下の記述は、例示的なファットツリーネットワークとしてXGFTを用いて、最小限のオーバーヘッドネットワーク再構成方法であるFTreeMinRCを利用する。しかしながら、ここで提示される概念は、PGFTおよびRLFTにとっても有効である。XGFT(n;m1,...,mn;w1,...,wn)は、n+1レベルのノードを備えたファットツリーである。レベルは0からnで表わされ、計算ノードがレベルnにあり、スイッチが他のすべてのレベルにある。子がない計算ノードを除いては、レベルi、0≦i≦n-1におけるすべてのノードは、miの子ノードを有する。同様に、親がないルートスイッチを除いては、レベルi、1≦i≦nにおける他のすべてのノードはwi+1の親ノードを有する。
一実施形態に従うと、スイッチタプルは、トポロジーにおけるサブツリーに対応するスイッチの位置についての情報を符号化する。FTreeMinRCは、ライブVMマイグレーションの場合における迅速な再構成を可能にするためにこの情報を用いることができる。タプル情報は、VMがマイグレートされたときにSMによって再構成される必要のあるスイッチの数が最も少ないスカイランを発見するために用いることができる。特に、VMがファットツリートポロジーにおける2つのハイパーバイザ間でマイグレートされると、更新される必要のある最小数のスイッチを表わしているスカイラインは、マイグレーションに関与しているすべてのサブツリーのうちすべての最上位レベルのスイッチによって形成されている。
しかしながら、タプルが一致していなければ、送信元リーフスイッチおよび宛先リーフスイッチの両方からの上りリンクがトレースされる。1レベル上に位置するスイッチは、リーフレベルのサブツリーが接続されているイミディエイト・スーパーツリーのうち最上位レベルのスイッチであり、ツリーを下方へと横切る際にリーフスイッチに到達する前に生じる可能性のある唯一のホップである。次いで、当該メカニズムは、送信元リーフスイッチタプルおよび宛先リーフスイッチタプルを新しくトレースされたスイッチと比較することができ、その時点のレベルを反映させるためにタプル値を調整した後、その時点のツリーのサブツリーに対応する値がワイルドカードにされる。さらに、(対応するサブツリーのための最上位レベルのスイッチである)トレースされたスイッチは更新されるべく印付けされ、送信元スイッチタプルおよび宛先スイッチタプルの両方からの比較がトレースされたすべてのスイッチのタプルと一致する場合、トレースが停止される。他の場合には、メカニズムが両端から共通の先祖スイッチを特定するまで、同じ手順が繰返される。最悪の場合、ファットツリートポロジーのルートスイッチに到達した後、メカニズムを停止することができる。すべての上り経路のトレースがリーフレベルから開始されており、かつ、連続したサブツリーのスカイラインスイッチに印付けされているので、メカニズムがマイグレーションによって影響される最上位のサブツリーに到達した場合、当該メカニズムは、その途中で、下位レベルスイッチに向かう潜在的なトラフィックゲートウェイであるすべてのスイッチや、ライブマイグレーションに関与するハイパーバイザを既に選択してしまっている。これにより、当該メカニズムは、ネットワークのうちライブマイグレーションによって影響を受けた部分のスカイラインを形成するすべてのスイッチに印を付けた。
接続されており、さらに、複数のハイパーバイザを設けることができ、複数のハイパーバイザの各々は、複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、さらに、複数の仮想マシンを設けることができ、複数の仮想マシンの各々は、少なくとも1つの仮想機能に関連付けられている。
ェアにおいて実現されてもよい。ここに説明された機能を行なうようにハードウェアステートマシンを実現することは、関連技術の当業者には明らかであろう。
プログラマによって容易に準備され得る。
Claims (21)
- 無損失相互接続ネットワークにおける効率的な仮想化をサポートするためのシステムであって、
1つ以上のマイクロプロセッサと、
1つ以上のスイッチとを含み、前記1つ以上のスイッチの各々は複数のポートを含み、前記システムはさらに、
複数のホストチャネルアダプタを含み、前記複数のホストチャネルアダプタの各々は少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含み、前記複数のホストチャネルアダプタは前記1つ以上のスイッチを介して相互接続されており、前記システムはさらに、
複数のハイパーバイザを含み、前記複数のハイパーバイザの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、前記システムはさらに、
複数の仮想マシンを含み、前記複数の仮想マシンの各々は、少なくとも1つの仮想機能に関連付けられており、
前記複数のホストチャネルアダプタは、予めポピュレートされたローカル識別子(LID)アーキテクチャを備えた仮想スイッチまたは動的LID割当てアーキテクチャを備えた仮想スイッチのうち1つ以上と共に配置されており、
前記仮想スイッチの各々には、関連付けられた物理機能のLIDに対応するLIDが割当てられており、
1つ以上のリニアフォワーディングテーブル(LFT)は、前記仮想スイッチの各々に割当てられた前記LIDに少なくとも基づいて計算され、前記1つ以上のLFTの各々は、前記1つ以上のスイッチのうちの一のスイッチに関連付けられている、システム。 - 前記仮想マシンの各々には重みパラメータが割当てられており、
前記重みパラメータの各々は前記1つ以上のリニアフォワーディングテーブルを計算するのに用いられる、請求項1に記載のシステム。 - 前記1つ以上のスイッチは少なくともリーフスイッチを含み、前記重みパラメータの各々は、仮想スイッチとリーフスイッチとの間の各リンクのトラフィックの割合を反映している、請求項2に記載のシステム。
- 前記1つ以上のリニアフォワーディングテーブルを計算することは、
仮想マシンのために、利用可能な上りポート群の間で最少累積の下り重みに基づいてスイッチにおける下りポートを選択することと、
前記仮想マシンの割当てられた前記重みパラメータによって、前記選択されたポートについて、累積された下り重みを増やすこととを含む、請求項2または3に記載のシステム。 - 前記1つ以上のリニアフォワーディングテーブルの各々は宛先ノードから計算が開始される、請求項1から4のいずれか1項に記載のシステム。
- 前記複数の仮想マシンのうち、前記複数のハイパーバイザのうちの第1のハイパーバイザ上で実行中である第1の仮想マシンは、前記複数のハイパーバイザのうち第2のハイパーバイザに対するライブマイグレーションを実行するように動作し、
前記第1の仮想マシンが前記第1のハイパーバイザから前記第2のハイパーバイザまでライブマイグレーションを実行した後、少なくとも1つのLFTが再計算される、請求項1から5のいずれか1項に記載のシステム。 - 前記少なくとも1つのLFTの再計算は最小数のLFTに制限され、前記最小数のLFTはスイッチタプルに少なくとも基づいて決定され、前記スイッチタプルは、再計算される必要のある前記最小数のLFTを備えたスカイラインを発見するために用いられる、請求項6に記載のシステム。
- 無損失相互接続ネットワークにおける効率的な仮想化をサポートするための方法であって、
1つ以上のマイクロプロセッサを含む1つ以上のコンピュータにおいて、1つ以上のスイッチと、複数のホストチャネルアダプタと、複数のハイパーバイザと、複数の仮想マシンとを設けるステップを含み、
前記1つ以上のスイッチの各々は複数のポートを含み、
前記複数のホストチャネルアダプタの各々は少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含み、前記複数のホストチャネルアダプタは前記1つ以上のスイッチを介して相互接続されており、
前記複数のハイパーバイザの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、
前記複数の仮想マシンの各々は、少なくとも1つの仮想機能に関連付けられており、前記方法はさらに、
予めポピュレートされたローカル識別子(LID)アーキテクチャを備えた仮想スイッチまたは動的LID割当てアーキテクチャを備えた仮想スイッチのうち1つ以上を備えた前記複数のホストチャネルアダプタを配置するステップと、
各々の仮想スイッチにLIDを割当てるステップとを含み、前記割当てられたLIDは関連付けられた物理機能のLIDに対応しており、前記方法はさらに、
前記仮想スイッチの各々に割当てられた前記LIDに少なくとも基づいて1つ以上のリニアフォワーディングテーブルを計算するステップを含み、前記1つ以上のLFTの各々は、前記1つ以上のスイッチのうちの一のスイッチに関連付けられている、方法。 - 前記仮想マシンの各々には、重みパラメータが割当てられており、
前記重みパラメータの各々は、前記1つ以上のリニアフォワーディングテーブルを計算するのに用いられる、請求項8に記載の方法。 - 前記1つ以上のスイッチは少なくともリーフスイッチを含み、前記重みパラメータの各々は、仮想スイッチとリーフスイッチとの間の各リンクのトラフィックの割合を反映している、請求項9に記載の方法。
- 前記1つ以上のリニアフォワーディングテーブルを計算するステップは、
仮想マシンのために、利用可能な上りポート群の間で最少累積の下り重みに基づいてスイッチにおける下りポートを選択するステップと、
前記仮想マシンの割当てられた前記重みパラメータによって、前記選択されたポートについて、累積された下り重みを増やすステップとを含む、請求項9または10に記載の方法。 - 前記1つ以上のリニアフォワーディングテーブルの各々は宛先ノードから計算が開始される、請求項9から11のいずれか1項に記載の方法。
- 前記複数の仮想マシンのうち、前記複数のハイパーバイザのうちの第1のハイパーバイザ上で実行中である第1の仮想マシンは、前記複数のハイパーバイザのうち第2のハイパーバイザに対するライブマイグレーションを実行するように動作し、
前記第1の仮想マシンが前記第1のハイパーバイザから前記第2のハイパーバイザまでライブマイグレーションを実行した後、少なくとも1つのLFTが再計算される、請求項
8から12のいずれか1項に記載の方法。 - 前記少なくとも1つのLFTの再計算は、最小数のLFTに制限され、前記最小数のLFTはスイッチタプルに少なくとも基づいて決定され、前記スイッチタプルは、再計算される必要のある前記最小数のLFTを備えたスカイラインを発見するために用いられる、請求項13に記載の方法。
- 無損失相互接続ネットワークにおける効率的な仮想化をサポートするための命令が格納されている非一時的なコンピュータ読取り可能記憶媒体であって、前記命令が1つ以上のコンピュータによって読出されて実行されると、前記1つ以上のコンピュータに、請求項8から14のいずれか1項に記載の方法を実行させる、非一時的なコンピュータ読取り可能記憶媒体。
- 無損失相互接続ネットワークにおける効率的な仮想化をサポートするための命令が格納されている非一時的なコンピュータ読取り可能記憶媒体であって、前記命令が1つ以上のコンピュータによって読出されて実行されると、前記1つ以上のコンピュータに以下のステップを実行させ、前記以下のステップは、
1つ以上のマイクロプロセッサを含む1つ以上のコンピュータにおいて、1つ以上のスイッチと、複数のホストチャネルアダプタと、複数のハイパーバイザと、複数の仮想マシンとを設けるステップを含み、
前記1つ以上のスイッチの各々は複数のポートを含み、
前記複数のホストチャネルアダプタの各々は少なくとも1つの仮想機能、少なくとも1つの仮想スイッチおよび少なくとも1つの物理機能を含み、前記複数のホストチャネルアダプタは前記1つ以上のスイッチを介して相互接続されており、
前記複数のハイパーバイザの各々は、前記複数のホストチャネルアダプタのうち少なくとも1つのホストチャネルアダプタに関連付けられており、
前記複数の仮想マシンの各々は、少なくとも1つの仮想機能に関連付けられており、前記以下のステップはさらに、
予めポピュレートされたローカル識別子(LID)アーキテクチャを備えた仮想スイッチまたは動的LID割当てアーキテクチャを備えた仮想スイッチのうち1つ以上を備えた前記複数のホストチャネルアダプタを配置するステップと、
各々の仮想スイッチにLIDを割当てるステップとを含み、前記割当てられたLIDは関連付けられた物理機能のLIDに対応しており、前記以下のステップはさらに、
前記仮想スイッチの各々に割当てられた前記LIDに少なくとも基づいて、1つ以上のリニアフォワーディングテーブルを計算するステップを含み、前記1つ以上のLFTの各々は、前記1つ以上のスイッチのうちの一のスイッチに関連付けられている、非一時的なコンピュータ読取り可能記憶媒体。 - 前記仮想マシンの各々には重みパラメータが割当てられており、
前記重みパラメータの各々は、前記1つ以上のリニアフォワーディングテーブルを計算するのに用いられる、請求項16に記載の非一時的なコンピュータ読取り可能記憶媒体。 - 前記1つ以上のスイッチは少なくともリーフスイッチを含み、前記重みパラメータの各々は、仮想スイッチとリーフスイッチとの間の各リンクのトラフィックの割合を反映している、請求項17に記載の非一時的なコンピュータ読取り可能記憶媒体。
- 前記1つ以上のリニアフォワーディングテーブルを計算するステップは、
仮想マシンのために、利用可能な上りポート群の間で最少累積の下り重みに基づいてスイッチにおける下りポートを選択するステップと、
前記仮想マシンの割当てられた前記重みパラメータによって、前記選択されたポートに
ついて、累積された下り重みを増やすステップとを含む、請求項17または18に記載の非一時的なコンピュータ読取り可能記憶媒体。 - 前記1つ以上のリニアフォワーディングテーブルの各々は宛先ノードから計算が開始される、請求項16から19のいずれか1項に記載の非一時的なコンピュータ読取り可能記憶媒体。
- 前記複数の仮想マシンのうち、前記複数のハイパーバイザのうちの第1のハイパーバイザ上で実行中である第1の仮想マシンは、前記複数のハイパーバイザのうち第2のハイパーバイザに対するライブマイグレーションを実行するように動作し、
前記第1の仮想マシンが前記第1のハイパーバイザから前記第2のハイパーバイザまでライブマイグレーションを実行した後、少なくとも1つのLFTが再計算され、
前記少なくとも1つのLFTの再計算は最小数のLFTに制限され、前記最小数のLFTはスイッチタプルに少なくとも基づいて決定され、前記スイッチタプルは、再計算される必要のある前記最小数のLFTを備えたスカイラインを発見するために用いられる、請求項16から20のいずれか1項に記載の非一時的なコンピュータ読取り可能記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024063248A JP2024096845A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2024063247A JP2024096844A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562259321P | 2015-11-24 | 2015-11-24 | |
US62/259,321 | 2015-11-24 | ||
US201562259831P | 2015-11-25 | 2015-11-25 | |
US62/259,831 | 2015-11-25 | ||
US201562261103P | 2015-11-30 | 2015-11-30 | |
US62/261,103 | 2015-11-30 | ||
US15/210,599 | 2016-07-14 | ||
US15/210,595 | 2016-07-14 | ||
US15/210,599 US10051054B2 (en) | 2013-03-15 | 2016-07-14 | System and method for efficient virtualization in lossless interconnection networks |
US15/210,595 US10230794B2 (en) | 2013-03-15 | 2016-07-14 | System and method for efficient virtualization in lossless interconnection networks |
JP2020212507A JP7109527B2 (ja) | 2015-11-24 | 2020-12-22 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020212507A Division JP7109527B2 (ja) | 2015-11-24 | 2020-12-22 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024063247A Division JP2024096844A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2024063248A Division JP2024096845A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022153494A true JP2022153494A (ja) | 2022-10-12 |
JP7472200B2 JP7472200B2 (ja) | 2024-04-22 |
Family
ID=58721366
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018501257A Active JP6843112B2 (ja) | 2015-11-24 | 2016-11-18 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2018501253A Active JP6878396B2 (ja) | 2015-11-24 | 2016-11-18 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2020212507A Active JP7109527B2 (ja) | 2015-11-24 | 2020-12-22 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2022114933A Active JP7472200B2 (ja) | 2015-11-24 | 2022-07-19 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2024063248A Pending JP2024096845A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2024063247A Pending JP2024096844A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018501257A Active JP6843112B2 (ja) | 2015-11-24 | 2016-11-18 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2018501253A Active JP6878396B2 (ja) | 2015-11-24 | 2016-11-18 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2020212507A Active JP7109527B2 (ja) | 2015-11-24 | 2020-12-22 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024063248A Pending JP2024096845A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
JP2024063247A Pending JP2024096844A (ja) | 2015-11-24 | 2024-04-10 | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (7) | US10051054B2 (ja) |
EP (2) | EP3381154B1 (ja) |
JP (6) | JP6843112B2 (ja) |
CN (2) | CN107710159B (ja) |
WO (2) | WO2017091475A1 (ja) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9990221B2 (en) | 2013-03-15 | 2018-06-05 | Oracle International Corporation | System and method for providing an infiniband SR-IOV vSwitch architecture for a high performance cloud computing environment |
US10051054B2 (en) | 2013-03-15 | 2018-08-14 | Oracle International Corporation | System and method for efficient virtualization in lossless interconnection networks |
US10397105B2 (en) * | 2014-03-26 | 2019-08-27 | Oracle International Corporation | System and method for scalable multi-homed routing for vSwitch based HCA virtualization |
EP3497571B1 (en) * | 2016-08-12 | 2021-12-29 | Liqid Inc. | Disaggregated fabric-switched computing platform |
US10848432B2 (en) * | 2016-12-18 | 2020-11-24 | Cisco Technology, Inc. | Switch fabric based load balancing |
US10228981B2 (en) * | 2017-05-02 | 2019-03-12 | Intel Corporation | High-performance input-output devices supporting scalable virtualization |
US10572295B2 (en) * | 2017-05-05 | 2020-02-25 | Micro Focus Llc | Ordering of interface adapters in virtual machines |
US10320654B2 (en) * | 2017-07-12 | 2019-06-11 | International Business Machines Corporation | Method for remote node discovery and communication channel validation and connection |
WO2019069120A1 (en) * | 2017-10-06 | 2019-04-11 | Telefonaktiebolaget Lm Ericsson (Publ) | REMOTE CONTROL OF NETWORK TRANCHES IN A NETWORK |
TWI635724B (zh) * | 2018-01-02 | 2018-09-11 | 中華電信股份有限公司 | 虛擬機器搬遷之系統與方法 |
CN110071900B (zh) * | 2018-01-23 | 2020-11-17 | 华为技术有限公司 | 数据发送的方法及设备 |
US10574755B2 (en) * | 2018-03-28 | 2020-02-25 | Wipro Limited | Method and high performance computing (HPC) switch for optimizing distribution of data packets |
CN111106974B (zh) * | 2018-10-25 | 2022-03-08 | 中国信息通信研究院 | 一种测试无损网络性能的方法和装置 |
JP7546572B6 (ja) * | 2019-01-29 | 2024-10-02 | オラクル・インターナショナル・コーポレイション | 高性能コンピューティング環境における複数の独立したレイヤ2(l2)サブネットにわたる単一の論理ipサブネットのためのシステムおよび方法 |
JP7193733B2 (ja) * | 2019-04-16 | 2022-12-21 | 富士通株式会社 | 通信制御プログラム、通信制御方法および情報処理装置 |
CN110086722A (zh) * | 2019-04-28 | 2019-08-02 | 新华三技术有限公司 | 一种路由路径确定方法及装置、路由设备 |
US10958560B2 (en) * | 2019-07-16 | 2021-03-23 | At&T Intellectual Property I, L.P. | Common abstraction for network traffic migration |
US11444881B2 (en) * | 2019-11-19 | 2022-09-13 | Oracle International Corporation | System and method for supporting use of forward and backward congestion notifications in a private fabric in a high performance computing environment |
CN111835653B (zh) * | 2020-07-20 | 2023-10-20 | 浙江亿邦通信科技有限公司 | 一种网络流量负载均衡的控制方法及系统 |
KR102704184B1 (ko) * | 2021-10-20 | 2024-09-05 | 국방과학연구소 | 가상화 기반 교전통제 통합 시험 시스템 및 시험 방법 |
CN114584868B (zh) * | 2022-02-12 | 2023-07-18 | 国网宁夏电力有限公司电力科学研究院 | 数据中心光电混合架构升级方法 |
US20240283741A1 (en) * | 2023-02-22 | 2024-08-22 | Mellanox Technologies, Ltd. | Segmented lookup table for large-scale routing |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011028408A (ja) * | 2009-07-23 | 2011-02-10 | Fujitsu Ltd | 仮想マシン移動制御プログラム,仮想マシン移動制御方法および仮想マシン移動制御装置 |
WO2011043270A1 (ja) * | 2009-10-07 | 2011-04-14 | 日本電気株式会社 | コンピュータシステム、及びコンピュータシステムのメンテナンス方法 |
JP2013069260A (ja) * | 2011-09-05 | 2013-04-18 | Fujitsu Ltd | データ中継装置、データ中継プログラムおよびデータ中継方法 |
US20130114620A1 (en) * | 2011-11-09 | 2013-05-09 | Oracle International Corporation | System and method for providing deadlock free routing between switches in a fat-tree topology |
Family Cites Families (61)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5644762A (en) | 1996-05-14 | 1997-07-01 | Resolve 2000, Inc. | Method and apparatus for recording and reading date data having coexisting formats |
US6055532A (en) | 1996-05-14 | 2000-04-25 | Soeder; Thomas B. | Method and apparatus for recording and reading date data having coexisting formats |
US20030208572A1 (en) | 2001-08-31 | 2003-11-06 | Shah Rajesh R. | Mechanism for reporting topology changes to clients in a cluster |
US7093024B2 (en) | 2001-09-27 | 2006-08-15 | International Business Machines Corporation | End node partitioning using virtualization |
US6988161B2 (en) | 2001-12-20 | 2006-01-17 | Intel Corporation | Multiple port allocation and configurations for different port operation modes on a host |
KR20050002865A (ko) | 2002-04-18 | 2005-01-10 | 인터내셔널 비지네스 머신즈 코포레이션 | 인피니밴드 채널 어댑터 장애용 리던던시 제공 방법 및 컴퓨터 시스템 |
US7493409B2 (en) | 2003-04-10 | 2009-02-17 | International Business Machines Corporation | Apparatus, system and method for implementing a generalized queue pair in a system area network |
US8776050B2 (en) | 2003-08-20 | 2014-07-08 | Oracle International Corporation | Distributed virtual machine monitor for managing multiple virtual resources across multiple physical nodes |
US7555002B2 (en) | 2003-11-06 | 2009-06-30 | International Business Machines Corporation | Infiniband general services queue pair virtualization for multiple logical ports on a single physical port |
US8335909B2 (en) | 2004-04-15 | 2012-12-18 | Raytheon Company | Coupling processors to each other for high performance computing (HPC) |
US7581021B2 (en) | 2005-04-07 | 2009-08-25 | International Business Machines Corporation | System and method for providing multiple virtual host channel adapters using virtual switches |
JP4883979B2 (ja) | 2005-10-11 | 2012-02-22 | 株式会社ソニー・コンピュータエンタテインメント | 情報処理装置および通信制御方法 |
US7813366B2 (en) | 2006-12-19 | 2010-10-12 | International Business Machines Corporation | Migration of a virtual endpoint from one virtual plane to another |
US20080186990A1 (en) | 2007-02-02 | 2008-08-07 | International Business Machines Corporation | Translation module, method and computer program product for providing multiple infiniband address support for vm migration using infiniband address translation |
US20080189432A1 (en) | 2007-02-02 | 2008-08-07 | International Business Machines Corporation | Method and system for vm migration in an infiniband network |
US8798056B2 (en) | 2007-09-24 | 2014-08-05 | Intel Corporation | Method and system for virtual port communications |
CN101227298B (zh) * | 2008-01-09 | 2010-06-02 | 南京大学 | 基于片上网络的路由器功耗确定方法 |
US7949721B2 (en) * | 2008-02-25 | 2011-05-24 | International Business Machines Corporation | Subnet management discovery of point-to-point network topologies |
JP2010039730A (ja) | 2008-08-05 | 2010-02-18 | Fujitsu Ltd | ネットワーク設定プログラム,ネットワーク設定方法及びネットワーク設定装置 |
JP5272265B2 (ja) | 2008-09-29 | 2013-08-28 | 株式会社日立製作所 | Pciデバイス共有方法 |
US7970913B2 (en) | 2008-12-31 | 2011-06-28 | International Business Machines Corporation | Virtualizing sockets to enable the migration of a system environment |
CN102334112B (zh) | 2009-02-27 | 2014-06-11 | 美国博通公司 | 用于虚拟机网络的方法和系统 |
US9817695B2 (en) | 2009-04-01 | 2017-11-14 | Vmware, Inc. | Method and system for migrating processes between virtual machines |
US8429647B2 (en) | 2009-05-06 | 2013-04-23 | Vmware, Inc. | Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine |
US8150971B2 (en) | 2009-05-31 | 2012-04-03 | Red Hat Israel, Ltd. | Mechanism for migration of client-side virtual machine system resources |
EP2309680B1 (en) | 2009-10-08 | 2017-07-19 | Solarflare Communications Inc | Switching API |
WO2011049019A1 (ja) * | 2009-10-19 | 2011-04-28 | 日本電気株式会社 | 通信システム、フロー制御装置、フローテーブルの更新方法およびプログラム |
EP3009941B1 (en) | 2009-12-14 | 2017-07-26 | Citrix Systems Inc. | Methods and systems for communicating between trusted and non-trusted virtual machines |
US9389895B2 (en) * | 2009-12-17 | 2016-07-12 | Microsoft Technology Licensing, Llc | Virtual storage target offload techniques |
PT2519225E (pt) * | 2009-12-30 | 2015-07-27 | Novartis Ag | Tiras finas de nicotina extrudidas por fusão |
JP5190084B2 (ja) | 2010-03-30 | 2013-04-24 | 株式会社日立製作所 | 仮想マシンのマイグレーション方法およびシステム |
US8489699B2 (en) | 2010-08-13 | 2013-07-16 | Vmware, Inc. | Live migration of virtual machine during direct access to storage over SR IOV adapter |
US20120173757A1 (en) | 2011-01-05 | 2012-07-05 | International Business Machines Corporation | Routing optimization for virtual machine migration between geographically remote data centers |
US20120287931A1 (en) | 2011-05-13 | 2012-11-15 | International Business Machines Corporation | Techniques for securing a virtualized computing environment using a physical network switch |
US8886783B2 (en) | 2011-06-03 | 2014-11-11 | Oracle International Corporation | System and method for providing secure subnet management agent (SMA) based fencing in an infiniband (IB) network |
WO2012176278A1 (ja) * | 2011-06-21 | 2012-12-27 | 富士通株式会社 | 情報処理装置、仮想マシン制御方法およびプログラム |
US20130025432A1 (en) * | 2011-07-27 | 2013-01-31 | Christopher George Schaff | Combination carrying case and kick drum creep preventer |
US8656389B2 (en) * | 2011-08-22 | 2014-02-18 | Vmware, Inc. | Virtual port command processing during migration of virtual machine |
US20130083690A1 (en) * | 2011-10-04 | 2013-04-04 | International Business Machines Corporation | Network Adapter Hardware State Migration Discovery in a Stateful Environment |
US8879396B2 (en) | 2011-11-15 | 2014-11-04 | Oracle International Corporation | System and method for using dynamic allocation of virtual lanes to alleviate congestion in a fat-tree topology |
US9083651B2 (en) * | 2011-12-07 | 2015-07-14 | Citrix Systems, Inc. | Controlling a network interface using virtual switch proxying |
US8930690B2 (en) * | 2012-03-21 | 2015-01-06 | Microsoft Corporation | Offloading packet processing for networking device virtualization |
US9432304B2 (en) * | 2012-03-26 | 2016-08-30 | Oracle International Corporation | System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model |
US9311122B2 (en) * | 2012-03-26 | 2016-04-12 | Oracle International Corporation | System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment |
US9135097B2 (en) | 2012-03-27 | 2015-09-15 | Oracle International Corporation | Node death detection by querying |
JP5383846B2 (ja) | 2012-03-27 | 2014-01-08 | ファナック株式会社 | 産業用ロボットの手首先端部における線条体案内機構部 |
US20140052877A1 (en) | 2012-08-16 | 2014-02-20 | Wenbo Mao | Method and apparatus for tenant programmable logical network for multi-tenancy cloud datacenters |
US9130858B2 (en) | 2012-08-29 | 2015-09-08 | Oracle International Corporation | System and method for supporting discovery and routing degraded fat-trees in a middleware machine environment |
US9461943B2 (en) * | 2012-09-12 | 2016-10-04 | Cisco Technology, Inc. | Network assisted virtual machine mobility |
CN102968344A (zh) | 2012-11-26 | 2013-03-13 | 北京航空航天大学 | 一种多虚拟机迁移调度的方法 |
US8937949B2 (en) * | 2012-12-20 | 2015-01-20 | Oracle International Corporation | Method and system for Infiniband host channel adapter multicast packet replication mechanism |
US9485188B2 (en) * | 2013-02-01 | 2016-11-01 | International Business Machines Corporation | Virtual switching based flow control |
US10404621B2 (en) * | 2013-03-15 | 2019-09-03 | Oracle International Corporation | Scalable InfiniBand packet-routing technique |
US10051054B2 (en) | 2013-03-15 | 2018-08-14 | Oracle International Corporation | System and method for efficient virtualization in lossless interconnection networks |
CN104079507B (zh) * | 2013-03-27 | 2019-04-09 | 联想企业解决方案(新加坡)私人有限公司 | 同步ip信息的方法和装置 |
US9912612B2 (en) * | 2013-10-28 | 2018-03-06 | Brocade Communications Systems LLC | Extended ethernet fabric switches |
US9306865B2 (en) * | 2014-03-12 | 2016-04-05 | Oracle International Corporation | Virtual port mappings for non-blocking behavior among physical ports |
US10454991B2 (en) * | 2014-03-24 | 2019-10-22 | Mellanox Technologies, Ltd. | NIC with switching functionality between network ports |
CN104184642B (zh) * | 2014-08-31 | 2017-05-10 | 西安电子科技大学 | 多级星型交换网络结构及优化方法 |
US9898430B2 (en) | 2014-11-12 | 2018-02-20 | Vmware, Inc. | Tracking virtual machine memory modified by a single root I/O virtualization (SR-IOV) device |
US10063446B2 (en) * | 2015-06-26 | 2018-08-28 | Intel Corporation | Netflow collection and export offload using network silicon |
-
2016
- 2016-07-14 US US15/210,599 patent/US10051054B2/en active Active
- 2016-07-14 US US15/210,595 patent/US10230794B2/en active Active
- 2016-11-18 WO PCT/US2016/062882 patent/WO2017091475A1/en active Application Filing
- 2016-11-18 JP JP2018501257A patent/JP6843112B2/ja active Active
- 2016-11-18 WO PCT/US2016/062795 patent/WO2017091465A1/en active Application Filing
- 2016-11-18 JP JP2018501253A patent/JP6878396B2/ja active Active
- 2016-11-18 CN CN201680038091.5A patent/CN107710159B/zh active Active
- 2016-11-18 EP EP16810156.6A patent/EP3381154B1/en active Active
- 2016-11-18 EP EP16806414.5A patent/EP3380934B1/en active Active
- 2016-11-18 CN CN201680040448.3A patent/CN107852339B/zh active Active
-
2018
- 2018-07-31 US US16/051,187 patent/US10432719B2/en active Active
-
2019
- 2019-02-06 US US16/269,272 patent/US10742734B2/en active Active
- 2019-09-03 US US16/558,977 patent/US10778764B2/en active Active
-
2020
- 2020-09-14 US US17/020,251 patent/US11533363B2/en active Active
- 2020-12-22 JP JP2020212507A patent/JP7109527B2/ja active Active
-
2022
- 2022-07-19 JP JP2022114933A patent/JP7472200B2/ja active Active
- 2022-12-09 US US18/078,323 patent/US11930075B2/en active Active
-
2024
- 2024-04-10 JP JP2024063248A patent/JP2024096845A/ja active Pending
- 2024-04-10 JP JP2024063247A patent/JP2024096844A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011028408A (ja) * | 2009-07-23 | 2011-02-10 | Fujitsu Ltd | 仮想マシン移動制御プログラム,仮想マシン移動制御方法および仮想マシン移動制御装置 |
WO2011043270A1 (ja) * | 2009-10-07 | 2011-04-14 | 日本電気株式会社 | コンピュータシステム、及びコンピュータシステムのメンテナンス方法 |
JP2013069260A (ja) * | 2011-09-05 | 2013-04-18 | Fujitsu Ltd | データ中継装置、データ中継プログラムおよびデータ中継方法 |
US20130114620A1 (en) * | 2011-11-09 | 2013-05-09 | Oracle International Corporation | System and method for providing deadlock free routing between switches in a fat-tree topology |
Non-Patent Citations (1)
Title |
---|
EVANGELOS TASOULAS: "Towards the InfiniBand SR-IOV vSwitch Architecture", 2015 IEEE INTERNATIONAL CONFERENCE ON CLUSTER COMPUTING, JPN6020036250, 8 September 2015 (2015-09-08), pages 371 - 380, XP032802479, ISSN: 0005150550, DOI: 10.1109/CLUSTER.2015.58 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7109527B2 (ja) | 無損失ネットワークにおける効率的な仮想化のためのシステムおよび方法 | |
JP7241146B2 (ja) | 高性能コンピューティング環境での線形転送テーブル(lft)探索のためにグローバルルートヘッダ(grh)におけるサブネットプレフィックス値を用いるためのシステムおよび方法 | |
JP6850804B2 (ja) | 高性能コンピューティング環境においてデュアルポート仮想ルータをサポートするためのシステムおよび方法 | |
KR102445870B1 (ko) | 고성능 클라우드 컴퓨팅 환경을 위한 인피니밴드 SR-IOV vSWITCH 아키텍쳐를 제공하는 시스템 및 방법 | |
JP7282840B2 (ja) | 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法 | |
JP7297830B2 (ja) | 高性能コンピューティング環境においてスケーラブルなビットマップに基づくP_Keyテーブルをサポートするためのシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220727 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7472200 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |