JP6195900B2 - 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法 - Google Patents

仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法 Download PDF

Info

Publication number
JP6195900B2
JP6195900B2 JP2015503439A JP2015503439A JP6195900B2 JP 6195900 B2 JP6195900 B2 JP 6195900B2 JP 2015503439 A JP2015503439 A JP 2015503439A JP 2015503439 A JP2015503439 A JP 2015503439A JP 6195900 B2 JP6195900 B2 JP 6195900B2
Authority
JP
Japan
Prior art keywords
virtual
migration
virtual machine
live migration
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015503439A
Other languages
English (en)
Other versions
JP2015514271A5 (ja
JP2015514271A (ja
Inventor
ヨンセン,ビョルン・ダグ
グアイ,ウェイ・リン
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/838,275 external-priority patent/US9432304B2/en
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2015514271A publication Critical patent/JP2015514271A/ja
Publication of JP2015514271A5 publication Critical patent/JP2015514271A5/ja
Application granted granted Critical
Publication of JP6195900B2 publication Critical patent/JP6195900B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/76Routing in software-defined topologies, e.g. routing between virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • H04L41/0897Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities by horizontal or vertical scaling of resources, or by migrating entities, e.g. virtual resources or entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Multi Processors (AREA)

Description

著作権表示
この特許文書の開示の一部は、著作権の保護下にある内容を含む。著作権所有者は、特許商標庁の特許ファイルまたはレコードに現れるので、誰でも当該特許文書または特許開示を複製することについて異議はないが、そうでなければ如何なる場合でもすべての著作権を留保する。
発明の分野
本発明は、一般にコンピュータシステムに関し、特にコンピュータシステム仮想化をサポートすることに関する。
背景
より大きなクラウドコンピューティングアーキテクチャが導入されるにつれて、従来のネットワークおよびストレージに関連付けられる性能および管理上のボトルネックが重要な問題になっている。インフィニバンド(InfiniBand(IB))技術は、クラウドコンピューティングファブリックの基礎として、展開が増加している。これは、本発明の実施例が対応することが意図される一般的な領域である。
概要
本願明細書では、ネットワークにおいてバーチャルマシンライブマイグレーションをサポートするためのシステムおよび方法が記載される。仮想スイッチは、複数の仮想機能(virtual function(VF))に関連付けられ得、各仮想機能(VF)は、別個の仮想インターフェイス(virtual interface(VI))スペースに関連付けられる。上記の仮想機能(VF)が付与される少なくとも1つのバーチャルマシンは、たとえばインフィニバンド(IB)アーキテクチャにおけるキューペア(queue pair(QP))といった仮想インターフェイス(VI)に関連付けられ得る。さらに、上記少なくとも1つのバーチャルマシンは、上記仮想機能(VF)が付与された状態で第1のホストから第2のホストにライブマイグレーションを行なうよう動作する。
本発明の実施例に従った、仮想インターフェイスアーキテクチャ(virtual interface architecture(VIA))ネットワークデバイスの図を示す図である。 本発明の実施例に従った、仮想インターフェイス(VI)に関連付けられる異なる状態の図を示す図である。 本発明の実施例に従った、キューペア(QP)に関連付けられる異なる状態の図を示す図である。 本発明の実施例に従った、ネットワークおよびルーティングの観点からのバーチャルマシン(VM)のライブマイグレーションの図を示す図である。 本発明の実施例に従った、バーチャルマシン(VM)ライブマイグレーションの前の仮想化環境の図を示す図である。 本発明の実施例に従った、バーチャルマシン(VM)ライブマイグレーションの後の仮想化環境の図を示す図である。 本発明の実施例に従った、仮想化環境におけるバーチャルマシンのライブマイグレーションをサポートするための例示的なフローチャートを示す図である。 本発明の実施例に従った、インフィニバンドアーキテクチャ(IBA)ネットワークデバイスの図を示す図である。 本発明の実施例に従った、マイグレートされるキューペア(QP)とリモートピアQPとの間での通信をサポートする図を示す図である。 本発明の実施例に従った、拡張vHCAモデルに基づいてバーチャルマシンのライブマイグレーションをサポートするための例示的なフローチャートを示す図である。 本発明の実施例に従った、仮想化環境においてローカル識別子(LID)の割り当てをサポートする図を示す図である。
詳細な説明
本発明は、限定目的ではなく例示目的で、添付の図面の図において示される。当該図面においては、同様の参照符号が同様の要素を示す。なお、この開示における「ある」、「1つ」または「いくつか」の実施例への参照は、必ずしも同じ実施例に対してなされるものではなく、このような参照は、少なくとも1つの実施例を意味する。
以下の本発明の記載は、高性能ネットワークについての例として、インフィニバンド(IB)ネットワークを使用する。他のタイプの高性能ネットワークが限定なしで使用され得るということは、当業者には明らかであろう。さらに、以下の本発明の記載は、仮想化モデルについての例として、Xen仮想化モデルを使用する。他のタイプの仮想化モデルが限定なしで使用され得るということは、当業者には明らかであろう。
本願明細書において、ネットワークにおいてバーチャルマシン(virtual machine(VM))ライブマイグレーション(live migration)をサポートすることができるシステムおよび方法が記載される。
本発明の実施例に従うと、仮想化は、クラウドコンピューティングでの効率的なリソース活用および弾性的なリソースアロケーションに有益になり得る。ライブマイグレーションは、物理サーバ同士の間でバーチャルマシン(VM)をアプリケーショントランスペアレントな態様で移動させることによって、リソースの使用を最適化することを可能にする。したがって仮想化は、コンソリデーション、リソースのオンデマンドプロビジョニング、およびライブマイグレーションによる弾性を可能にし得る。
インフィニバンド(IB)アーキテクチャ
IBアーキテクチャはシリアル・ポイント・ツー・ポイント全二重技術である。IBネットワークは、サブネットとも称され得る。サブネットは、スイッチとポイント・ツー・ポイントリンクとを使用して相互接続されるホストのセットからなる。IBサブネットは、サブネットにおけるすべてのスイッチ、ルータおよびホストチャネルアダプタ(HCA)のコンフィギュレーションを含み、ネットワークを初期化および起動することを担う、少なくとも1つのサブネットマネージャ(subnet manager(SM))を含み得る。
IBは、リモートダイレクトメモリアクセス(remote direct memory access(RDMA))および従来の送信/受信セマンティックスの両方を提供するために、伝送サービスの豊富なセットをサポートする。使用される伝送サービスから独立して、IB HCAはキューペア(QP)を使用して通信する。QPは、通信セットアップの間に作り出され、QPナンバー、HCAポート、宛先LID、キューサイズおよび伝送サービスといった提供される初期属性のセットを有し得る。HCAは、多くのQPを扱い得、各QPは、送信キュー(send queue(SQ))および受信キュー(receive queue(RQ))のようなキューのペアからなっており、このような1つのペアが、通信に参加する各エンドノードに存在する。送信キューは、リモートノードに転送されるワーク要求を保持する一方、受信キューは、リモートノードから受け取ったデータで何を行なうべきかについての情報を保持する。QPに加えて、各HCAは、送信キューおよび受信キューのセットに関連付けられる1つ以上の完了キュー(completion queue(CQ))を有する。CQは、送信キューおよび受信キューにポスティングされるワーク要求についての完了通知を保持する。通信の複雑性はユーザから隠されているが、QP状態情報はHCAに維持される。
各物理的なIBデバイスには、LIDおよびグローバルユニーク識別子(globally unique identifier(GUID))の2つのアドレスが割り当てられる。LIDは、サブネット内でIBパケットをルーティングするよう使用され、GUIDは、物理的IBデバイスを一意に示すハードウェアアドレスである。64ビットGUIDは、ローカルの(64ビット)サブネットプレフィックスと組み合わされてグローバル識別子を形成する。128ビットグローバル識別子は、IBサブネット同士の間でIBパケットをルーティングするよう使用される。
入出力(I/O)仮想化
I/O仮想化(I/O Virtualization(IOV))は、存在する物理リソースにVMがアクセスすることを可能にすることによって、I/Oの可用性を提供し得る。ストレージトラフィックおよびサーバ間通信の組合せによって、単一のサーバのI/Oリソースを圧倒し得るような増加した負荷が課され、これにより、データを待っている際に、バックログおよびアイドル状態になるプロセッサが引き起こされる。I/O要求の数の増加により、IOVは可用性を提供し得るとともに、現代のCPU仮想化において見られる性能のレベルに合致するよう、(仮想化された)I/Oリソースの性能、スケーラビリティおよびフレキシビリティを向上し得る。
エミュレーション、準仮想化、直接割当(direct assignment(DA))およびシングルルートI/O仮想化(single root-I/O virtualization(SR−IOV))といった、異なるタイプのIOV技術が存在し得る。これらのIOV技術のうち、SR−IOVは、ほぼネイティブの性能を維持しつつ、複数のVMから単一の物理デバイスへの直接アクセスを可能にする手段により、PCI Express(PCIe)規格を拡張し得る。したがってSR−IOVは、良好な性能およびスケーラビリティを提供し得る。
SR−IOVは、各ゲストに1つの仮想デバイスを割り当てることによって複数のゲスト同士の間で共有され得る複数の仮想デバイスをPCIeデバイスが公開することを可能にする。各SR−IOVデバイスは、少なくとも1つの物理的機能(physical function(PF))と、1つ以上の関連付けられる仮想機能(virtual function(VF))とを有する。PFは、バーチャルマシンモニタ(virtual machine monitor(VMM))またはハイパーバイザによって制御される通常のPCIe機能であり、VFは、軽量のPCIe機能である。各VFは、自身のベースアドレス(base address(BAR))を有しており、ユニークリクエスタIDが割り当てられている。ユニークリクエスタIDは、I/Oメモリ管理ユニット(I/O memory management unit(IOMMU))が、異なるVFに対するトラフィックストリーム同士を区別することを可能にする。IOMMUはさらに、PFとVFとの間でメモリおよび割込の変換を適用する。
たとえば共有ポートモデルおよび仮想スイッチモデルといった、異なるタイプのSR−IOVモデルが存在し得る。共有ポートモデルでは、すべてのVFは、単一のポートアドレスおよび単一のQPネームスペースを共有し得、単一のHCAポートのみがネットワークに公開される。仮想スイッチモデルでは、各VFは、ユニークポートアドレスおよびユニークQPネームスペースを含むバーチャルHCAであり、デバイス上のVFごとに1つのHCAがネットワークに公開される。したがって、より複雑なハードウェアであっても、仮想スイッチモデルはIOVを簡素化し得る。
SR−IOV対応のデバイスの使用によって、ほぼネイティブの性能およびスケーラビリティの向上が与えられ得る。その一方、SR−lOVは、ライブマイグレーションおよびチェックポイント/リスタートメカニズムと完全には互換性がないわけではない。
ライブマイグレーションのためのハードウェアソリューション
本発明の実施例に従って、ハードウェアソリューションは、アプリケーショントランスペアレントな態様で、フレキシブルで高性能かつスケーラブルな仮想化されたIOアーキテクチャに基づき、物理サーバ同士間でのバーチャルマシン(VM)のライブマイグレーションをサポートし得る。さらに、ハードウェアソリューションは、マイグレーションのトランスペアレンシーを増加し得、IBとSR−IOVとの間の相互運用性を改善し得る。さらに、当該システムは、仮想インターフェイスアーキテクチャ(virtual interface architecture(VIA))およびミリネット(Myrinet)のような他の高速ロスレスネットワーキング技術に適用可能であり得る。
ハードウェアソリューションを使用して、IBホストチャネルアダプタ(HCA)は、QPについて自身のリソースプールを有する仮想エンドポイントとして、各物理的な機能(VF)を区別し得る。さらに、QPNのようなQP属性は、マイグレーションの後に再使用され得る。さらに、IB HCAは、通信を中断および再開するためにQP状態に基づいて、VMライブマイグレーションをサポートし得る。
さらに、システムは、マイグレートされたQPとマイグレートされたQPのピアとの間で休止するよう用いられ得るハンドシェイクメカニズムを回避し得る。したがって、当該システムは、バーチャルマシン(VM)のライブマイグレーションが、IBにおける信頼性のある接続の再試行タイムアウトに相当するレベルにまでサービスダウンタイムを低減することを可能にする。
さらにシステムは、厳格なタイミング要件を有するシナリオおよびアプリケーションを含む、VMライブマイグレーションをサポートする一般的なソリューションを示し得る。たとえば高い可用性のクラスタにおいて、欠陥のある物理サーバによってホストされたVMは、限られた時間内に別のサーバにマイグレートされ得る。マイグレーションは、欠陥が発見された後に行なわれ得るが、当該欠陥のあるサーバが回復不能なエラーになる前に行なわれ得る。ソフトウェアアプローチは、オーバーヘッドに苦しんでいるので、この低いサービスダウンタイムの要求を満たすのに不十分である。さらに、ソフトウェアアプローチは開発コストの点で高価である。
仮想エンドポイント
本発明の実施例に従うと、仮想インターフェイスアーキテクチャ(VIA)ハードウェアは、各VFから作り出されたVIを区別するよう、PCI仮想スイッチを統合し得る。仮想スイッチの後ろでは、複数の独立した仮想エンドポイントがネットワークマネージャによって発見可能であり得る。
図1は、本発明の実施例に従った仮想インターフェイスアーキテクチャ(VIA)ネットワークデバイスの図を示す。図1に示されるように、仮想インターフェイスアーキテクチャ(VIA)ネットワークデバイス100は、ハードウェアレイヤー110、バーチャルマシンモニタ120、およびたとえばVM101−102といった1つ以上のバーチャルマシンを含み得る。ここで、VM101は、カーネルエージェント107に基づいて、固定されたメモリ105に関連付けられるユーザプロセス103をサポートし得る。VM102は、カーネルエージェント108に基づいて、固定されたメモリ106に関連付けられるユーザプロセス104をサポートし得る。
仮想スイッチ130は、ハードウェアレイヤー110上に設けられ得る。仮想スイッチ130は、たとえばVF111−119といった1つ以上の仮想機能(VF)に関連付けられ得る。VF111−119の各々は、1つ以上の仮想インターフェイス(VI)を作成および管理し得る。
本発明の実施例に従うと、仮想スイッチモデルを使用して、VF111−119の各々が、たとえばVM101またはVM102といったゲストVMに割り当てられ得る専用のPCIエンドポイントとして分離され得る。さらに、VF111−119の各々は、その専用のVIネームスペース121−129を有し得、完全なVIエンドポイントとして考えられ得る。VIネームスペースの分離は、仮想化された環境において保護およびフレキシビリティを提供し得る。各VFは、IO動作についてVMの保護および分離プロパティを拡張するパーティション内のVIリソースにアクセスするのが制限され得る。さらに、VI属性はマイグレーションの後に再使用され得る。
たとえば、ハードウェアレイヤー110は、IBアーキテクチャのような高速ネットワークアーキテクチャに基づき得る。VF111−119の各々は、ユニークなポートアドレスおよびユニークなQPネームスペースを含むバーチャルホストチャネルアダプタ(virtual host channel adaptor(vHCA))であり得る。さらに、IBデバイス上のVFごとに、1つのvHCAがネットワークに公開され得る。さらに、各vHCAは、自身のQPネームスペースに関連付けられ得、IBアーキテクチャにおけるQP131および132のような1つ以上のキューペア(QP)を作成および管理し得る。図1に示されるように、キューペア(QP)131−132の各々は、センダーキューおよびレシーバーキューを含み得る。
さらに、VIAデバイス100は、IOメモリ管理ユニット(IOMMU)の機能性を活用し得る。VI属性は、IOMMUによって変換(translate)されるIO仮想メモリを介してアクセスされるメモリ領域に格納され得る。新しいVFが、VMに再付与されると、ハイパーバイザは、IOMMUを変更して、明示的に新しいVIを再作成することなしに物理メモリの新しいセットにIO仮想メモリを再マッピングし得る。共有されたVIネームスペースモデルと比較して、仮想スイッチモデルは、リソースマイグレーションを緩和するとともに、VI属性を再マッピングするためのマッピングテーブルの使用を回避して、動作中のアプリケーションについてトランスペアレンシーを維持する。
キューペア(QP)中断状態
図2は、本発明の実施例に従った、仮想インターフェイス(VI)に関連付けられる異なる状態の図を示す。図2に示されるように、VIのライフサイクルは、アイドル状態201、ペンディング接続状態202、接続済状態203、エラー状態204および中断状態205といった複数の状態を含み得る。
中断状態205は、進行中の通信が、たとえばライブマイグレーションの間、VIを休止状態にするために一時的に停止されることを示す。接続済状態203と中断状態205との間の遷移は、ソフトウェアが開始した要求またはVIイベント要求によって行なわれ得る。たとえば、マイグレーションの間に、ソフトウェアインターフェイスは、接続済状態203から中断状態205まで、マイグレートするVIを修正し得る。
VIが中断状態205に入ると、VIは、如何なる以前に開始されたメッセージ送信も完了し得、それらを処理することなく、ハードウェアセンダーキュー上の如何なる残存するメッセージもフラッシュする。ハードウェアは、残存するメッセージが、フラッシュする前に、ユーザプロセスについてのセンダーキューによってキャッシュされることを保証し得る。中断状態205においては、如何なる新しいメッセージも、センダーキューおよびレシーバーキューの両方においてキューに入れられ得、処理されることなくポストされたままである。
さらに、入力メッセージが、中断されたVIを目標としている場合、中断状態205にピアVIを移行させるよう、中断されたVIによってSuspendRequestイベントが生成され得る。このような場合、ResumeRequestイベントを受け取った後、以前の開始されたメッセージが再送信され得、不完全な送信時にはタイムアウトエラーが生成され得ない。
新しいVFがマイグレートされたVMに付与された後およびマイグレートされたVMが新しい位置で再び開始される前に、ストップ・アンド・コピーステージ(stop-and-copy stage)が、IOMMUにおける新しいセットの物理メモリにIO仮想メモリを再登録し得る。その後、ソフトウェアインターフェイスは、マイグレートされたVMのVI状態を接続済状態203に修正し得る。その後、システムは、ピアVIへ転送されるResumeRequestイベントをトリガし得る。その後、ピアVIは、ResumeRequestイベントを生成することなく接続済状態203に移行し得る。したがって、中断状態205は、VMのライブマイグレーションの間にスムーズな遷移を提供し得、VIは休止状態にあり得る。
本発明の実施例に従うと、VMライブマイグレーションの間にダウンタイムを低減するために、最小遅延のアプローチは、すべての未完了の動作が完了する直前に、VIを中断またはVFを分離することである。したがって、延長によりタイムアウトが向上し得、中断状態205のハンドリングの部分として、信頼性のあるトランスポートプロトコルによって与えられるハンドリングが再試行され得る。延長された再試行およびタイムアウトロジックは、ピアVIまたはマイグレートされるVIのいずれかについて致命的なエラーを引き起こすことなくVIを中断状態205に移行し得る。
したがって、マイグレーションの後にVlの可用性に対してハードなリアルタイムの制約を課すことなく、VIはマイグレートされ得る。このアプローチはさらに、ネットワークの遅延によりイベント報告(SuspendRequestおよびResumeRequest)がVI同士の間で生成されない場合をカバーし得る。さらに、複数のVIを備えた場合において、各VIは上記の動作を同時に行ない得る。
図3は、本発明の実施例に従った、キューペア(QP)に関連付けられる異なる状態の図を示す。図3に示されるように、QPのライフサイクル300は、リセット状態301、初期化(INT)状態302、レディ・ツー・レシーブ(RTR)状態303、レディ・ツー・センド(RTS)状態304、SQエラー(SQE)状態305、エラー状態306、SQドレイン(SQD)状態307、および中断(SUS)状態308といった複数の状態を含む。
中断状態であるSUS308は、マイグレーションの間にQPを休止するよう進行中の通信を一時的に停止させ得る。RTS304とSUS308との間の遷移は、ソフトウェアが開始した要求またはイベント要求によってトリガされ得る。マイグレーションの間に、ソフトウェアインターフェイスは、マイグレートするQPをRTS304状態からSUS308状態まで移行し得る。QPは、中断状態に入ると、如何なる以前に開始されたメッセージ送信も完了し得、SQにおける如何なる残存するメッセージを、それらを処理することなく、フラッシュし得る。ハードウェアはさらに、残存するメッセージが、フラッシュする前にユーザプロセスバッファによってキャッシュされることを保証し得る。中断状態において、如何なる新しいメッセージも、SQおよびRQの両方にキューに入れられ得るが、処理されることなくポストされたままである。
VMライブマイグレーションのネットワーキングおよびルーティングの観点
図4は、本発明の実施例に従った、ネットワークおよびルーティングの観点からのバーチャルマシン(VM)のライブマイグレーションの図を示す。図4に示されるように、仮想化環境400は、たとえばvHCA A−C401−403といった複数のvHCAを含み得る。vHCA A−C401−403の各々は、仮想化についてトランスピアレンシーを提供し得る完全なIBエンドポイントとして機能し得る。
さらに、仮想化環境400はネットワークマネージャ410を含み得る。ネットワークマネージャは、IBスイッチA−B431−432の後ろにvHCA A−C401−403を発見し得、異なるLIDおよびvGUIDに基づき、vHCA A−C401−403の各々を認識し得る。たとえば、vHCA A401には、LID A411およびvGUID A421が割り当てられ得、vHCA A402にはLID B412およびvGUID B422が割り当てられ得、vHCA C403には、LID C413およびvGUID C423が割り当てられ得る。
本発明の実施例に従うと、VMマイグレーションの間、ネットワークマネージャ410は、たとえばvHCA B402のようなIBエンドポイントがIBスイッチA431の後ろでダウン(すなわち中断)し、ネットワークの他方に(vHCA B404として)IBスイッチB432の後ろに、たとえばLID B412およびvGUID B422のような同じアドレスが新しい位置に引き継がれた状態で再び現れることを観察し得る。
マイグレーションの後、ネットワークマネージャ410は、そのシフトの後にLIDの新しい再構成を反映するようルーティングテーブル420を更新し得る。さらに、全ネットワークのリルーティングタイムを低減するために、LIDをローカルに修正する新しいルーティングアルゴリズムが実現され得る。さらに、ネットワークマネージャ410はさらに、新しいLID構成はデッドロックがないことを保証し得る。
さらに、高速ネットワークでは、ローカルアドレスリソースが制限されている場合がある。たとえば、16ビットLIDを使用し得るIBネットワークは、各vHCAに自身のLIDが割り当てられるとともに1000ノードクラスタにおける各ノードが複数のVMをホストする場合、すぐにアドレススペースを使い果たし得る。
本発明の実施例に従うと、システムは、仮想化環境におけるスケーラビリティの問題を扱うために、異なるアプローチを使用し得る。たとえば、システムは、32ビットまでLIDアドレシングスペースを拡張し得るか、または、vHCA同士の間のルーティングを行なうようvGUIDをLIDに組み合わせ得る。第1のソリューションは、ネットワークマネージャにおける如何なるアーキテクチャの修正も必要としないが、より古いハードウェアとの後方互換性がない。
バーチャルマシンの観点
図5は、本発明の実施例に従った、バーチャルマシン(VM)ライブマイグレーションの前の仮想化環境の図を示す。図5に示されるように、IBネットワーク500は、たとえばホストA−B501−502といった複数のホストを含み得る。ホストA501は、HCA517を使用するVMM A515を含み、たとえばDomU 513といったゲストドメインを管理する特権ドメイン(または管理ドメイン)であるDom0 511をサポートし得る。さらに、ホストB502は、HCA 518を使用するVMM B516を含み、DomU 514を管理するDom0 512をサポートし得る。
さらに、ホストA501上のVMa503には、たとえばQPa507といったキューペアに接続されるVF505といったVFが付与され得る。さらに、VMa503は、QPb508に関連付けられるVMb504と通信し得る。
本発明の実施例に従うと、たとえばホストA501上のDom0 511といった特権ドメインは、たとえばマイグレーションの間に分離されるべきVF505のようなデバイスを必要としない。システムは単に、たとえばQPa507といったアクティブなQPがストップ・アンド・コピーステージで中断されることを必要とし得る。
図5に示されるように、ホストA501上の特権ドメインであるDom0 511は、ホストB102へのVMa503のマイグレーションを(図6におけるVMa604として)開始し得る。VMa503のマイグレーションの前に、システムは、それを中断状態にする状態遷移動作を行ない得る。さらに、QPb508から入力パケットを受け取った後、中断されたQPa507は、QPb508に同様に中断状態に入るように命令し得る。
その後、たとえばリモートダイレクトメモリアクセス(RDMA)接続520に基づき、I/O仮想メモリを含むダーティページ(メモリ)をソースサーバと宛先サーバとの間で同期させることによって、VMマイグレーションが行なわれ得る。
図6は、本発明の実施例に従った、バーチャルマシン(VM)ライブマイグレーションの後の仮想化環境の図を示す。図6に示されるように、IBネットワーク600は、たとえばホストA−B 601−602といった複数のホストを含み得る。(さらに図5と同じ番号を有する図6における要素は同じ機能を果たす)。
ホストB602へのマイグレーションの後に、VMa603には、たとえばQPa’607のようなキューペアに接続されるたとえばVF616のような新しいVFが付与され得る。ここで、QPa’607は、図5におけるQPa507と論理上同じQPであり、VMa503(またはVMa603)の仮想メモリにおいて同じコンテキスト情報を有する。
さらに、VMa603が停止から解放される前に、特権ドメインであるDom0 612は、QPa’607をRTS状態に戻し得る、QPa’607に対する状態遷移を行ない得る。さらに、QPa’607は、ホストA601上のQPb608との通信を再開し得る。
したがって、マイグレーションについてのサービスダウンタイムは、ストップ・アンド・コピーステージの期間と同等になり得る。さらに、マイグレーションを行なうようRDMA動作を使用することは、サービスダウンタイムおよびトータルマイグレーションタイムを低減し得る。
図7は、本発明の実施例に従った、仮想化環境におけるバーチャルマシンのライブマイグレーションをサポートするための例示的なフローチャートを示す。図7に示されるように、ステップ701では、システムは、各々が別個のキューペア(QP)スペースに関連付けられる複数の仮想機能(VF)に仮想スイッチを関連付け得る。さらに、ステップ702では、システムは、少なくとも1つのバーチャルマシンに上記仮想機能(VF)を付与し得る。上記仮想機能(VF)は、仮想インターフェイス(VI)に関連付けられる。次いで、ステップ703では、上記の少なくとも1つのバーチャルマシンは、上記仮想機能(VF)が付与された状態で第1のホストから第2のホストにライブマイグレーションを行ない得る。
拡張HCAモデル
図8は、本発明の実施例に従った、インフィニバンドアーキテクチャ(IBA)ネットワークデバイスの図を示す。図8に示されるように、インフィニバンドアーキテクチャ(IBA)ネットワークデバイス800は、ハードウェアレイヤー810、バーチャルマシンモニタ820、およびたとえばVM801−802といった1つ以上のバーチャルマシンを含み得る。VM801は、カーネル807およびユーザライブラリ837に基づき、固定されたメモリ805に関連付けられるアプリケーション803をサポートし得る。VM802は、カーネルエージェント808およびユーザライブラリ838に基づき、固定されたメモリ806に関連付けられるアプリケーション804をサポートし得る。
ハードウェアレイヤー810は、IB HCA830のような、IBサブネット840に接続するファブリックアダプタを含み得る。さらに、IB HCA830は、たとえばvHCA 811−819といった複数のvHCAインスタンスが関連付けられ得る。
本発明の実施例に従うと、たとえば物理HCA830といったファブリックアダプタは、仮想スイッチモデル、拡張HCAモデルまたは両方のモデルの組合せを実現することができる。さらに、拡張HCAモデルを使用して、スイッチなしの物理HCA830のみが存在し得る。バーチャルHCA811−819は、物理HCAモデルの拡張を示し、バーチャルHCAインスタンス811−819の1つ以上は、物理HCA830ポートを介して、たとえばIBサブネット840といったファブリックからアクセス可能であり得る。
本発明の実施例に従うと、ハードウェアレイヤー810は、VMライブマイグレーションを行なうための割り当てられたIBリソースを保存するよう、以下の機能をサポートし得る。
1.QPコンテキスト(たとえばQPナンバー)は、各vHCAがプライベートQPスペースを有することを可能にすることによって保存され得る。
2.メモリ領域ナンバーは、各vHCAがプライベートメモリ領域ナンバースペースを有することを可能にすることによって保存され得る。
3.登録したメモリは、各vHCAが、ローカルの物理的なホストのローカルメモリへのアクセスのためにプライベート仮想アドレススペースを実現することを可能にすることによって、保存され得る。
プライベートQPスペースは、上記のセクションで論じられた仮想スイッチベースのモデルを用いるか、または拡張HCAモデルを用いることのいずれかによって実現され得る。HCA規格を拡張する拡張HCAモデルは、各々がプライベートQPスペースを有し得る複数のvHCAインスタンス811−819の定義を可能にする。図8に示されるように、vHCA811−819の各々は、たとえばQP821−829のようなキューペア(QP)をサポートし得る。当該キューペア(QP)は、パケットを送信および受信するためのたとえばアプリケーション803または804といったアプリケーションに関連付けられるセンダー/レシーバーバッファによって使用され得る。
さらに、拡張HCA規格は、より複雑なファブリックトポロジに依存しないという長所を有し得る。さらに、プライベートメモリ領域ナンバースペースは、プライベートQPスペースに関する同じ代替例に基づいて、vHCAごとに実現され得る。
本発明の実施例に従うと、ローカルの物理メモリについてのプライベート仮想アドレススペースは、vHCAスキームが仮想スイッチモデルまたは拡張HCAモデルに基づくかどうかに関わらず実現され得る。
プライベート仮想アドレススペースを実現する1つの方法は、サーバプラットフォームを使用することによる。サーバプラットフォームでは、物理的なHCAによって観察されたローカルメモリアドレススペースが仮想メモリを示す。この仮想メモリは、具体的にSRIOV VFごとに、すなわち、vHCA811−819ごとにホストプラットフォームによって実現され得る。
プライベート仮想アドレススペースを実現する別の方法は、たとえばVMM820といったプラットフォームハイパーバイザによって制御されるシステムMMUのセット内の物理的なHCAのメモリ管理ユニット(MMU)を含むことによる。したがって、如何なる仮想アドレスも変更することなく、仮想アドレスから物理アドレスへのマッピングが必要に応じて更新される状態で、VM固有のアドレススペースが異なる物理的なホスト同士の間でマイグレートされ得る。(たとえばプライベート仮想アドレススペースは、物理的なHCAとローカルの物理メモリとの間にシステムMMUを有することによって実現することができる)。
本発明の実施例に従うと、接続状態は、マイグレートされているVMのローカルメモリに保存され得る。さらに、接続状態は、マイグレーションの後、新しいvHCAについて、如何なる新しいリソースも割り当てる必要なしで再確立(または再使用)され得る。
さらに、(図3に示されるような)中断状態は、マイグレートされたQPとマイグレートされたQPに接続されるリモートピアQPとの両方に適用され得る。したがって、システムは、VMマイグレーションの間にタイムアウトが発生せず、システムが、マイグレートされたVMのピアによって実現されるIB接続関連のタイムアウト値と無関係に、マイグレーション動作が任意の量の時間をかけることを可能にし得ることを保証し得る。さらに、接続に関連付けられるIBアドレスがマイグレーションの結果変化することを可能にするために、システムは、中断状態におけるQPについてアドレス情報を更新し得る。
リモートQPピアとの通信
本発明の実施例に従うと、システムは、ピア同士の間の通信をサポートするための特別のヘッダ情報および/または非送信請求(non-solicited)メッセージを使用し得る。システムは、リモートピア同士間の休止動作を行なうことなくVMライブマイグレーションが開始されることを可能にする。さらに、システムは、リモートピアがマイグレーションに関して学習すること、および非同期イベントドリブンの態様で中断状態に入ることを可能にする。
たとえば、vHCAルートヘッダ(VRH)が、サポートされ得、IBネットワークにおけるグローバルルートヘッダ(GRH)ベースのアドレシングの代わりに、VRHベースのvHCAアドレシングが使用され得る。VRHを含むパケットは、たとえばVRHにおける宛先vHCAタグ(DVT)が0でなく、かつヘッダにおけるDVTが、VRHにおけるDVIによって識別されたvHCAタグテーブルエントリにおけるDVTと同じ場合、VRHにおいて指定されたように宛先vHCAインデックス(DVI)に送達され得る。システムは、VRHの存在を規定するワイヤープロトコル拡張が存在しない場合、LIDポリシーを介して、どのパケットがVRHを含むと予想されるかを特定し得る。代替的には、システムは、すべてのvHCAに共通であるQPナンバー範囲を規定し得、異なる範囲がVRHまたは他のプロトコルポリシーの使用に関連付けられ得る。さらに、VRHは、vHCAインデックスがVRHから抽出されるまでQPコンテキストが知られていないので、QPコンテキストを介して特定され得ない。
図9は、本発明の実施例に従った、マイグレートされたキューペア(QP)とリモートピアQPとの間の通信をサポートする図を示す。図9に示されるように、仮想化環境900は、各々がたとえばSW911−913のうちの1つのようなソフトウェアスタックを含み得るホストA−C901−903といった複数のホストを含み得る。(ソフトウェアスタックは、カーネルスペース、ユーザスペースまたはその両方に存在し得る)。
さらに、ホストA901上のQPa910は、QPa910がホストC903に(QPa930として)マイグレートする前に、ホストB902上のQPb920と通信状態にあり得る。QPa910は、その時間の間にQPb920がQPa910にパケット(UD、UCまたはRC)を送信し得るマイグレーションを可能にするよう中断状態にセットされ得る。ホストA901上の無効なvHCA931を目標とするこのパケットは、GRHまたはVRH/LIDのいずれかのマップベースのアドレシングを使用し得る。
無効なvHCA931を目標とするパケットを受け取った後、ホストA901は、ローカルの非同期イベントを生成し得、随意にvHCA932上のQPb920に非送信請求応答パケットを送信し得る。さらにQPb920は、非送信請求応答パケットを受け取ると、当該非送信請求応答から情報を含むローカルの非同期イベントを生成し得る。その後、QPb920は、QPb920が、有効にされた信頼性のある接続された(reliable connected(RC))QPまたは信頼性のない接続(unreliable connection(UC))QPである場合、(図3に示されるように)自動的に中断状態への遷移を行ない得る。
本発明の実施例に従うと、IBAによって提供されるバーブズインターフェイス(verbs interface)は、キューペア(QP)を中断状態におよび中断状態から移すためにModifyQPおよびModifyAddressHandleオプションを含み得る。さらに、中断状態がRC QPについてリセットされると、再試行カウントおよびタイマーが初期値にリセットされ得る(すなわち中断状態に入る前に消費された如何なる「再試行バジェット(retry budget)」も「忘れられ(forgotten)」得る)。中断状態にある間、パス情報はRCまたはUC QPについて更新され得る。QPおよびアドレスハンドルは、たとえばSW A−C911−913のようなローカルのソフトウェアが明示的に中断状態をリセットするまで、中断状態のままであり得る。ここで、中断状態をリセットする前に、ローカルソフトウェアは、宛先LIDおよびVRH情報を含み得る更新されたパス情報を得ることができる。
本発明の実施例に従うと、そのvGUIDによって識別されたvHCAポートがIBネットワークにおいて作動状態になるたびに、vHCAポートは、適切な物理的なHCAポートについて、vGUIDおよびvHCA情報を介して報告され得る。VM/vHCAマイグレーションの場合には、宛先ノードの物理的なHCAポートのvGUIDおよびvHCA情報ならびにSMA情報が、マイグレートされるvHCAが作動状態になると、更新され得る。VMのマイグレーションの後に、中断されたQPまたはアドレスハンドルを有するリモートピアは、関連するパス情報を更新した後、関連情報を観察し得、中断状態をリセットし得る。
さらに、マイグレートされたVMおよびvHCAが新しい位置にて再び開始される場合、通信ピアは、当該マイグレートされたvHCAを認識していない場合がある。たとえば、QPa930のようなマイグレートされたRC QPがそのピアであるQPb920に要求を送信すると、QPa930は、QPb920が同じ時間フレーム中にマイグレートされなかったので、正しいパス情報を有し得る。さらに、QPb920が更新されたパス情報を有していなければ、マイグレートされたQPa930からの入力要求に対する承認および応答が、古い宛先へ送信され得る。その後、当該古い宛先は、QPb920に非送信請求応答を送信し得、これにより、パス情報が既に更新されたことをQPb920に認識させる。
さらに、たとえばホストC903のような新しい位置にて開始する、vHCA933のようなマイグレートされたvHCAは、送出要求がタイムアウトするのを回避するために、タイムリーな態様でパス情報を更新するようピアに依存し得る。たとえば、QPb920が正しいパス情報を有していない場合、マイグレートされたvHCA933からの送出要求は、承認および応答が戻ってこないという事実により、タイムアウトし得る。
マイグレートされたQPa930からのオリジナルの要求パケットが、マイグレーションが行われたことをピアQPb920に通知し得ることを保証するために、システムは、マイグレーション情報を、要求パケットにおけるヘッダコンテンツから検知できるようにし得る。たとえば、ソースアドレス情報における任意の関連する変更を検知するのをピアに依存する代わりに、VRHは、マイグレーションカウントフィールドを含み得る。マイグレーションカウントフィールドは、マイグレートされたvHCA930が新しい位置であるホストC903で再び作動状態になる前に更新され得る。さらに、ピアQP状態に記録されるものに対するマイグレーションカウントにおける変化によって、ピアノードに関する条件を識別する非同期イベントが引き起こされ得る。したがって、VRHマイグレーションカウントフィールドを介して明示的にリモートピアに通知することによって、システムは、ほとんどの場合、マイグレートされたHCA側上のQPについてタイムアウトを回避することができる。
本発明の実施例に従うと、パス情報を更新するのに完全にピアに対してリアルタイムに依存することを回避するために、マイグレートされたvHCAは、非中断ペンディング状態のQPで開始し得る。非中断ペンディングQP状態は、送出要求が可能にされるという例外を有する中断状態に類似する。さらに、vHCAがマイグレーションの後で再び開始された後に生成される要求についての応答または承認がリモートピアから受け取られた後、非中断ペンディング状態はリセットされ得、QPは正常なものとして挙動し得る。
さらに、システムの実現例(HW、FWまたはSW)は、タイムアウトおよび再試行を使用してパケットのロスに対応する一方、QP自体のタイムアウト挙動は中断状態におけるものと同じであり得る(すなわち、タイムアウトによりエラー状態にならない)。さらに、非中断ペンディング状態は、マイグレートされないvHCA/QPについて中断状態からの遷移を適切に行なうよう使用され得る。
代替的には、VRHが使用されない場合、マイグレーションの信号送信は非送信請求メッセージを介して達成され得る。たとえば、マイグレーションの後のリスタートに続いて、正常なメッセージとの間でインターリーブされた非送信請求メッセージが、場合によっては送られ得る。さらに、リモートピアQPからの要求または応答の受信により、このような非送信請求メッセージを送信する必要性が除去され得る。ここで、非送信請求メッセージの使用により、QP/接続に対する如何なる他の通信アクティビティとも無関係に、信号送信が行われることを可能にする。
したがって、付加的なヘッダ情報および/または非送信請求メッセージを使用して、システムは、マイグレートされたQPが、行われるマイグレーションについてそのピアQPに自動的に信号送信することを可能にし、含まれる新しいアドレス情報をそのピアQPに提供することを可能にする。アドレス情報の関連する更新は、サブネットマネージャの関連情報の通知および報告と並行して行われ得、接続を完全な作動状態にするためにレイテンシをさらに低減し得る。
図10は、本発明の実施例に従った、拡張vHCAモデルに基づいてバーチャルマシンのライブマイグレーションをサポートするための例示的なフローチャートを示す。図10に示されるように、ステップ1001では、システムは、複数のバーチャルホストチャネルアダプタ(HCA)にファブリックアダプタを関連付け得、上記バーチャルホストチャネルアダプタ(vHCA)の各々は、別個のキューペア(QP)スペースに関連付けられ得る。ここで、ファブリックアダプタは、仮想スイッチモデル、拡張ホストチャネルアダプタ(HCA)モデル、または両方のモデルの組合せを実現することができる。さらに、ステップ1002では、少なくとも1つのバーチャルマシンが、第1のホストから第2のホストにライブマイグレーションを行なうよう動作し得、前記少なくとも1つのバーチャルマシンには、上記キューペア(QP)スペースにおけるキューペア(QP)が関連付けられる上記のバーチャルホストチャネルアダプタ(vHCA)が付与される。その後、ステップ1003では、上記キューペア(QP)は、ライブマイグレーションについてピアQPに信号送信し得、マイグレーションの後に上記ピアQPにアドレス情報を提供し得る。
スケーラブルアドレシングスキーム
本発明の実施例に従うと、レイヤー3(L3)アドレスの一部であるVMに関連付けられる仮想GUIDが、ライブマイグレーションを通じて保存され得、仮想GUIDが、ピアに通信する観点と、サブネットマネージャの観点とから一意にVMを識別するよう使用され得る。
マイグレートされているリモート接続ピアに関連付けられるアドレス情報を更新する本質的な必要性が存在するソフトウェアアプローチと異なり、拡張HCAモデルは、VMに関連付けられるアドレス情報がマイグレーションに亘って保存されることを可能にする。したがって、接続ピアについてアドレス情報を更新する本質的な必要性が存在せず、システムはIBレイヤー2(L2)またはローカルルートヘッダ(LRH)を保存し得るので、L3またはグローバルルートヘッダ(GRH)アドレスに加えてアドレス情報が保存され得る。
本発明の実施例に従うと、システムは、IBサブネットにおいてスケーラビリティおよびフレキシビリティを達成することができる。たとえば、IBサブネットは、48KのLID値に限定され得る。システムは、関連するHCAポート(物理的なポートまたはvHCAポート)へのパケット転送を促進するよう用いることをIBサブネットにおけるサブネットマネージャが決定するどのようなLID値にでも基づきHCAがアドレス指定されることを可能にするignore LMC機能をサポートする。たとえば、HCAポートは、専用のLID、またはベースとなる2つの隣接するLIDの範囲(HCAポートLIDマスク、すなわちLMC値、によって規定されるような)についての権限を有することを強制され得ない。
さらに、システムは、物理的なポートについて静的に割り付けられたLID/LID範囲としてサブネットマネージャが使用しないLID値を示す範囲のadmin LIDの使用をサポートし得る。さらに、サブネットマネージャは、VM作成時または動的にVMライフタイム中のいずれかに、アドレシングのためにユニークなLIDを必要とするVMにadmin LIDを割り当て得る。
図11は、本発明の実施例に従った、仮想化環境においてローカル識別子(LID)の割り当てをサポートする図を示す。図11に示されるように、仮想化環境1100は、物理的なHCAポート1111−1112およびバーチャルHCAポート1121−1123のようなさまざまなネットワークデバイスについてLIDを割り当てることを担い得るサブネットマネージャ(SM)1101を含み得る。
SM1101は、ある範囲のadmin LID1120が保存され得るポリシーインターフェイスをサポートし得る。各admin LIDは、もしポリシー入力を介して命令が与えられなければ、SM1101がいずれのポートにもこの値を割り当て得ないという点で特別である。
さらに、SM1101は、ポリシーインターフェイスをサポートし得る。当該ポリシーインターフェイスでは、vGUIDが1つ以上のこのようなadmin LIDに関連付けられ得るとともに、vGUIDマイグレーションは、対応するLIDについてのルーティングが、関連する物理的なHCAポートに対してセットアップされることを示す。さらに、vGUIDがadmin LIDに関連付けられていれば、SM1101は、ignore LMC機能をサポートしない物理的なHCAポートにvGUIDを関連付けることを許可し得ない。
本発明の実施例に従うと、admin LIDのルーティングは、ルーティングアルゴリズムと、その時のSM101についてアクティブなポリシーに基づき得る。admin LIDに関連付けられるvGUIDについてのパス情報は、SM101によって規定されるポリシーに従って、割り当てられるadmin LIDを反映し得る。
したがって、当該システムは、ignore LMC機能およびadmin LID機能を使用して、IBサブネット内でのアドレシングについてスケーラビリティおよびフレキシビリティを、VMライブマイグレーション動作から独立して提供し得る。一般にこれらの機能は、IBサブネットの内の任意の物理的またはバーチャルHCAポートに到達するのに使用され得る1つ以上の付加的なLIDの動的な生成を促進するよう用いられ得る。
さらに、動的なサービス品質(quality of service(QoS))、高い可用性(high availability(HA))、および/または他のマルチアドレスベースのプロパティがランタイムにて動的に確立され得る。これらの機能は、サブネット再初期化を必要とすることなく、またはIBサブネット内での進行中の通信に対して如何なる他のネガティブなインパクトも引き起こすことなく、任意の特定の物理的または仮想のHCAポートに対して適用され得る。
本発明は、1つ以上のプロセッサ、メモリ、および/または本開示の教示に従ってプログラムされたコンピュータ読取可能な記録媒体を含む1つ以上の従来の汎用または専用デジタルコンピュータ、コンピューティングデバイス、マシン、またはマイクロプロセッサを用いて簡便に実施され得る。ソフトウェア技術の当業者には明らかであるように、適切なソフトウェアコーディングは、熟練したプログラマによって本開示の教示に基づき容易に用意され得る。
いくつかの実施例では、本発明は、本発明の処理のいずれかを実行するようコンピュータをプログラムするのに用いられ得る命令を格納した記録媒体またはコンピュータ読取可能媒体であるコンピュータプログラムプロダクトを含む。当該記録媒体は、フロッピー(登録商標)ディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、および光磁気ディスクを含む任意のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリ素子、磁気または光学カード、ナノシステム(分子メモリICを含む)、または命令および/またはデータを格納するのに好適な任意のタイプの媒体もしくはデバイスを含み得るが、これらに限定されない。
本発明の上記の記載は、例示および説明目的で与えられている。網羅的であることまたは開示されたそのものの形態に本発明を限定することを意図したものではない。当業者にとっては、多くの修正例および変形例が明確であろう。上記の実施例は、本発明の原理およびその実際的な適用をもっともよく説明するために選択および記載されたものであり、これにより他の当業者が、特定の使用に好適なさまざまな修正例を考慮して、さまざまな実施例について本発明を理解するのが可能になる。本発明の範囲は、添付の特許請求の範囲およびそれらの均等物によって定義されることが意図される。

Claims (12)

  1. ネットワークにおいてバーチャルマシンライブマイグレーションをサポートするためのシステムであって、
    1つ以上のマイクロプロセッサと、
    前記1つ以上のマイクロプロセッサ上で実行される仮想スイッチとを含み、前記仮想スイッチは複数の仮想機能(VF)に関連付けられており、前記仮想機能(VF)の各々は別個の仮想インターフェイス(VI)スペースに関連付けられ、前記システムはさらに、
    仮想インターフェイス(VI)に関連付けられる前記仮想機能(VF)が付与される少なくとも1つのバーチャルマシンを含み、前記少なくとも1つのバーチャルマシンは、第1のホストから第2のホストにライブマイグレーションを行なうよう動作する、システム。
  2. 前記少なくとも1つのバーチャルマシンを管理する少なくとも1つのバーチャルマシンモニタをさらに含む、請求項1に記載のシステム。
  3. 前記仮想インターフェイス(VI)は、マイグレーションの後で再使用可能である1つ以上のQP属性が関連付けられるキューペア(QP)である、請求項1または2に記載のシステム。
  4. 前記1つ以上のQP属性は、入出力メモリ管理ユニット(IOMMU)によって変換されるIO仮想メモリを介してアクセス可能なメモリ領域に格納される、請求項3に記載のシステム。
  5. 前記仮想インターフェイス(VI)は、マイグレーションの間に前記QPを休止するよう進行中の通信を一時的に停止する中断状態に入るよう動作する、請求項3または記載のシステム。
  6. LIDおよびvGUIDに基づき前記複数の仮想機能(VF)を発見可能であるネットワークマネージャをさらに含む、請求項1〜5のいずれか1項に記載のシステム。
  7. 前記ネットワークマネージャは、マイグレーションの後、前記LIDの再構成を反映するためにルーティングテーブルを更新するよう動作する、請求項6に記載のシステム。
  8. 前記ネットワークマネージャは、vHCA同士の間でルーティングを行なうようvGUIDをLIDに組み合わせるよう動作する、請求項6に記載のシステム。
  9. 前記仮想インターフェイス(VI)は、ストップ・アンド・コピーステージにて中断され、前記バーチャルマシンライブマイグレーションはメモリにおいてダーティページを同期させることにより行われる、請求項1〜8のいずれか1項に記載のシステム。
  10. 1つ以上のリモートダイレクトメモリアクセス(RDMA)動作が、前記バーチャルマシンライブマイグレーションを行なうよう用いられる、請求項9に記載のシステム。
  11. ネットワークにおいてバーチャルマシンライブマイグレーションをサポートするための方法であって、
    仮想スイッチを複数の仮想機能(VF)に関連付けるステップを含み、前記仮想機能(VF)の各々は別個のキューペア(QP)スペースに関連付けられており、前記方法はさらに、
    前記仮想機能(VF)を少なくとも1つのバーチャルマシンに付与するステップを含み、前記仮想機能(VF)は仮想インターフェイス(VI)に関連付けられており、前記方法はさらに、
    前記少なくとも1つのバーチャルマシンを介して第1のホストから第2のホストにライブマイグレーションを行なうステップを含む、方法。
  12. コンピュータ読取可能なプログラムであって、実行されると、システムに、
    仮想スイッチを複数の仮想機能(VF)に関連付けるステップを実行させ、前記仮想機能(VF)の各々は別個のキューペア(QP)スペースに関連付けられており、さらに、
    前記仮想機能(VF)を少なくとも1つのバーチャルマシンに付与するステップを実行させ、前記仮想機能(VF)は仮想インターフェイス(VI)に関連付けられており、さらに、
    前記少なくとも1つのバーチャルマシンを介して第1のホストから第2のホストにライブマイグレーションを行なうステップを実行させる、コンピュータ読取可能なプログラム。
JP2015503439A 2012-03-26 2013-03-25 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法 Active JP6195900B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261615731P 2012-03-26 2012-03-26
US61/615,731 2012-03-26
US201261693703P 2012-08-27 2012-08-27
US61/693,703 2012-08-27
US13/837,922 2013-03-15
US13/838,502 US9311122B2 (en) 2012-03-26 2013-03-15 System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment
US13/838,502 2013-03-15
US13/838,275 US9432304B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model
US13/837,922 US9397954B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines in an infiniband network
US13/838,275 2013-03-15
US13/838,121 2013-03-15
US13/838,121 US9450885B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines in a virtualization environment
PCT/US2013/033753 WO2013148599A1 (en) 2012-03-26 2013-03-25 System and method for supporting live migration of virtual machines in a virtualization environment

Publications (3)

Publication Number Publication Date
JP2015514271A JP2015514271A (ja) 2015-05-18
JP2015514271A5 JP2015514271A5 (ja) 2016-03-10
JP6195900B2 true JP6195900B2 (ja) 2017-09-13

Family

ID=49213417

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2015503440A Active JP6122483B2 (ja) 2012-03-26 2013-03-25 拡張ホストチャネルアダプタ(hca)モデルに基づいてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503438A Active JP6185045B2 (ja) 2012-03-26 2013-03-25 インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503441A Active JP6285906B2 (ja) 2012-03-26 2013-03-25 ミドルウェアマシン環境内で仮想マシン移行用のスケーラブルなシグナリングメカニズムを提供するシステムおよび方法
JP2015503439A Active JP6195900B2 (ja) 2012-03-26 2013-03-25 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法

Family Applications Before (3)

Application Number Title Priority Date Filing Date
JP2015503440A Active JP6122483B2 (ja) 2012-03-26 2013-03-25 拡張ホストチャネルアダプタ(hca)モデルに基づいてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503438A Active JP6185045B2 (ja) 2012-03-26 2013-03-25 インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503441A Active JP6285906B2 (ja) 2012-03-26 2013-03-25 ミドルウェアマシン環境内で仮想マシン移行用のスケーラブルなシグナリングメカニズムを提供するシステムおよび方法

Country Status (6)

Country Link
US (1) US9311122B2 (ja)
EP (4) EP2831732B1 (ja)
JP (4) JP6122483B2 (ja)
CN (4) CN104094230B (ja)
IN (1) IN2014CN04933A (ja)
WO (4) WO2013148599A1 (ja)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013099414A1 (ja) * 2011-12-26 2013-07-04 インターナショナル・ビジネス・マシーンズ・コーポレーション レジスタ・マッピング方法
US9432304B2 (en) 2012-03-26 2016-08-30 Oracle International Corporation System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model
US10025638B2 (en) * 2012-07-02 2018-07-17 Vmware, Inc. Multiple-cloud-computing-facility aggregation
US9990238B2 (en) * 2012-11-05 2018-06-05 Red Hat, Inc. Event notification
US10230794B2 (en) 2013-03-15 2019-03-12 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US9141416B2 (en) 2013-03-15 2015-09-22 Centurylink Intellectual Property Llc Virtualization congestion control framework for modifying execution of applications on virtual machine based on mass congestion indicator in host computing system
US9990221B2 (en) * 2013-03-15 2018-06-05 Oracle International Corporation System and method for providing an infiniband SR-IOV vSwitch architecture for a high performance cloud computing environment
US9729660B2 (en) * 2013-07-24 2017-08-08 Netapp, Inc. Method and system for detecting virtual machine migration
US10389577B2 (en) 2013-08-14 2019-08-20 Centurylink Intellectual Property Llc Ethernet carrier group alarm (CGA)
US10904201B1 (en) * 2013-10-11 2021-01-26 Cisco Technology, Inc. Updating distributed caches in network devices in the event of virtual machine changes in a virtualized network environment
US9864623B2 (en) 2013-11-21 2018-01-09 Centurylink Intellectual Property Llc Physical to virtual network transport function abstraction
US9436751B1 (en) * 2013-12-18 2016-09-06 Google Inc. System and method for live migration of guest
US9548890B2 (en) 2014-03-17 2017-01-17 Cisco Technology, Inc. Flexible remote direct memory access resource configuration in a network environment
US10397105B2 (en) * 2014-03-26 2019-08-27 Oracle International Corporation System and method for scalable multi-homed routing for vSwitch based HCA virtualization
US20150288767A1 (en) 2014-04-03 2015-10-08 Centurylink Intellectual Property Llc Network Functions Virtualization Interconnection Hub
US9588796B2 (en) 2014-06-28 2017-03-07 Vmware, Inc. Live migration with pre-opened shared disks
US9672120B2 (en) * 2014-06-28 2017-06-06 Vmware, Inc. Maintaining consistency using reverse replication during live migration
US9900391B2 (en) * 2014-08-05 2018-02-20 Microsoft Technology Licensing, Llc Automated orchestration of infrastructure service blocks in hosted services
US10225327B2 (en) 2014-08-13 2019-03-05 Centurylink Intellectual Property Llc Remoting application servers
US9898318B2 (en) 2014-08-15 2018-02-20 Centurylink Intellectual Property Llc Multi-line/multi-state virtualized OAM transponder
US10198288B2 (en) * 2014-10-30 2019-02-05 Oracle International Corporation System and method for providing a dynamic cloud with subnet administration (SA) query caching
CN107645407B (zh) * 2014-12-08 2021-02-12 华为技术有限公司 一种适配QoS的方法和装置
CN104753816A (zh) * 2015-03-27 2015-07-01 华为技术有限公司 一种rdma连接的报文处理方法及相关装置
US9588791B2 (en) 2015-04-27 2017-03-07 Altera Corporation Flexible physical function and virtual function mapping
US10853277B2 (en) * 2015-06-24 2020-12-01 Intel Corporation Systems and methods for isolating input/output computing resources
US10228969B1 (en) * 2015-06-25 2019-03-12 Amazon Technologies, Inc. Optimistic locking in virtual machine instance migration
US10970110B1 (en) 2015-06-25 2021-04-06 Amazon Technologies, Inc. Managed orchestration of virtual machine instance migration
US9825851B2 (en) 2015-06-27 2017-11-21 Nicira, Inc. Distributing routing information in a multi-datacenter environment
US9882833B2 (en) 2015-09-28 2018-01-30 Centurylink Intellectual Property Llc Intent-based services orchestration
WO2017065630A1 (en) 2015-10-13 2017-04-20 Huawei Technologies Co., Ltd. Multi root i/o virtualization system
CN106997306B (zh) * 2016-01-26 2021-03-09 阿里巴巴集团控股有限公司 物理机数据迁移至云端的方法、装置和系统
US10594627B2 (en) 2016-01-27 2020-03-17 Oracle International Corporation System and method for supporting scalable representation of switch port status in a high performance computing environment
US11271870B2 (en) 2016-01-27 2022-03-08 Oracle International Corporation System and method for supporting scalable bit map based P_Key table in a high performance computing environment
US10469621B2 (en) 2016-01-27 2019-11-05 Oracle International Corporation System and method of host-side configuration of a host channel adapter (HCA) in a high-performance computing environment
EP3408982B1 (en) * 2016-01-27 2020-12-09 Oracle International Corporation System and method for supporting scalable bit map based p_key table in a high performance computing environment
US10659340B2 (en) * 2016-01-28 2020-05-19 Oracle International Corporation System and method for supporting VM migration between subnets in a high performance computing environment
US10374926B2 (en) 2016-01-28 2019-08-06 Oracle International Corporation System and method for monitoring logical network traffic flows using a ternary content addressable memory in a high performance computing environment
US10666611B2 (en) 2016-01-28 2020-05-26 Oracle International Corporation System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment
US10616118B2 (en) 2016-01-28 2020-04-07 Oracle International Corporation System and method for supporting aggressive credit waiting in a high performance computing environment
US10536334B2 (en) 2016-01-28 2020-01-14 Oracle International Corporation System and method for supporting subnet number aliasing in a high performance computing environment
US10630816B2 (en) 2016-01-28 2020-04-21 Oracle International Corporation System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment
US10171353B2 (en) 2016-03-04 2019-01-01 Oracle International Corporation System and method for supporting dual-port virtual router in a high performance computing environment
CN107305506A (zh) * 2016-04-20 2017-10-31 阿里巴巴集团控股有限公司 动态分配内存的方法、装置及系统
US10379745B2 (en) * 2016-04-22 2019-08-13 Samsung Electronics Co., Ltd. Simultaneous kernel mode and user mode access to a device using the NVMe interface
US10678578B2 (en) * 2016-06-30 2020-06-09 Microsoft Technology Licensing, Llc Systems and methods for live migration of a virtual machine based on heat map and access pattern
US10565008B2 (en) 2016-07-28 2020-02-18 International Business Machines Corporation Reducing service downtime during service migration
US10423444B2 (en) 2016-08-09 2019-09-24 Red Hat Israel, Ltd. Routing table preservation for virtual machine migration with assigned devices
US10057119B2 (en) 2016-08-23 2018-08-21 Oracle International Corporation System and method for supporting fast hybrid reconfiguration in a high performance computing environment
CN107992352A (zh) * 2016-10-26 2018-05-04 阿里巴巴集团控股有限公司 用于虚拟化场景的数据交互方法及设备
US10558250B2 (en) 2016-12-23 2020-02-11 Oracle International Corporation System and method for coordinated link up handling following switch reset in a high performance computing network
CN109144972B (zh) * 2017-06-26 2022-07-12 华为技术有限公司 一种数据迁移的方法以及数据节点
US11469953B2 (en) 2017-09-27 2022-10-11 Intel Corporation Interworking of legacy appliances in virtualized networks
EP4220447A1 (en) 2017-10-24 2023-08-02 INTEL Corporation Hardware assisted virtual switch
TWI645293B (zh) * 2017-11-30 2018-12-21 財團法人工業技術研究院 在多根輸入輸出虛擬化環境中虛擬機器即時遷移的方法、系統及其計算主機
CN109918172A (zh) * 2019-02-26 2019-06-21 烽火通信科技股份有限公司 一种虚拟机热迁移方法及系统
US11537406B2 (en) * 2020-02-18 2022-12-27 Juniper Networks, Inc. Automatic formation of a virtual chassis using zero touch provisioning
US11258668B2 (en) 2020-04-06 2022-02-22 Vmware, Inc. Network controller for multi-site logical network
US11088902B1 (en) 2020-04-06 2021-08-10 Vmware, Inc. Synchronization of logical network state between global and local managers
US11777793B2 (en) 2020-04-06 2023-10-03 Vmware, Inc. Location criteria for security groups
US11870679B2 (en) 2020-04-06 2024-01-09 VMware LLC Primary datacenter for logical router
US11381456B2 (en) 2020-04-06 2022-07-05 Vmware, Inc. Replication of logical network data between global managers
US11757940B2 (en) 2020-09-28 2023-09-12 Vmware, Inc. Firewall rules for application connectivity
CN113326101B (zh) * 2021-08-02 2022-04-12 阿里云计算有限公司 基于远程直接数据存储的热迁移方法、装置及设备
US12107722B2 (en) 2022-07-20 2024-10-01 VMware LLC Sharing network manager between multiple tenants

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208572A1 (en) * 2001-08-31 2003-11-06 Shah Rajesh R. Mechanism for reporting topology changes to clients in a cluster
US7093024B2 (en) * 2001-09-27 2006-08-15 International Business Machines Corporation End node partitioning using virtualization
US6988161B2 (en) * 2001-12-20 2006-01-17 Intel Corporation Multiple port allocation and configurations for different port operation modes on a host
US7484208B1 (en) 2002-12-12 2009-01-27 Michael Nelson Virtual machine migration
US7493409B2 (en) 2003-04-10 2009-02-17 International Business Machines Corporation Apparatus, system and method for implementing a generalized queue pair in a system area network
US8776050B2 (en) * 2003-08-20 2014-07-08 Oracle International Corporation Distributed virtual machine monitor for managing multiple virtual resources across multiple physical nodes
US7555002B2 (en) 2003-11-06 2009-06-30 International Business Machines Corporation Infiniband general services queue pair virtualization for multiple logical ports on a single physical port
US8335909B2 (en) * 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US7581021B2 (en) 2005-04-07 2009-08-25 International Business Machines Corporation System and method for providing multiple virtual host channel adapters using virtual switches
JP4883979B2 (ja) * 2005-10-11 2012-02-22 株式会社ソニー・コンピュータエンタテインメント 情報処理装置および通信制御方法
US20080189432A1 (en) * 2007-02-02 2008-08-07 International Business Machines Corporation Method and system for vm migration in an infiniband network
US8645974B2 (en) * 2007-08-02 2014-02-04 International Business Machines Corporation Multiple partition adjunct instances interfacing multiple logical partitions to a self-virtualizing input/output device
US20090055831A1 (en) * 2007-08-24 2009-02-26 Bauman Ellen M Allocating Network Adapter Resources Among Logical Partitions
US8798056B2 (en) * 2007-09-24 2014-08-05 Intel Corporation Method and system for virtual port communications
JP2010039730A (ja) * 2008-08-05 2010-02-18 Fujitsu Ltd ネットワーク設定プログラム,ネットワーク設定方法及びネットワーク設定装置
US7996484B2 (en) 2008-12-11 2011-08-09 Microsoft Corporation Non-disruptive, reliable live migration of virtual machines with network data reception directly into virtual machines' memory
US8862538B2 (en) 2008-12-18 2014-10-14 International Business Machines Corporation Maintaining a network connection of a workload during transfer
US7970913B2 (en) 2008-12-31 2011-06-28 International Business Machines Corporation Virtualizing sockets to enable the migration of a system environment
WO2010099407A1 (en) * 2009-02-27 2010-09-02 Broadcom Corporation Method and system for virtual machine networking
US8429647B2 (en) 2009-05-06 2013-04-23 Vmware, Inc. Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine
US8150971B2 (en) 2009-05-31 2012-04-03 Red Hat Israel, Ltd. Mechanism for migration of client-side virtual machine system resources
US8489744B2 (en) 2009-06-29 2013-07-16 Red Hat Israel, Ltd. Selecting a host from a host cluster for live migration of a virtual machine
EP2309680B1 (en) * 2009-10-08 2017-07-19 Solarflare Communications Inc Switching API
US8370560B2 (en) 2009-11-16 2013-02-05 International Business Machines Corporation Symmetric live migration of virtual machines
US9507619B2 (en) * 2010-01-12 2016-11-29 International Business Machines Corporation Virtualizing a host USB adapter
JP5548489B2 (ja) * 2010-03-11 2014-07-16 株式会社日立製作所 計算機システム、仮想化機構、および計算機システムの障害回復方法
JP5190084B2 (ja) 2010-03-30 2013-04-24 株式会社日立製作所 仮想マシンのマイグレーション方法およびシステム
US8700811B2 (en) 2010-05-25 2014-04-15 Microsoft Corporation Virtual machine I/O multipath configuration
US8489699B2 (en) 2010-08-13 2013-07-16 Vmware, Inc. Live migration of virtual machine during direct access to storage over SR IOV adapter
US20120173757A1 (en) 2011-01-05 2012-07-05 International Business Machines Corporation Routing optimization for virtual machine migration between geographically remote data centers
US8407182B1 (en) 2011-01-21 2013-03-26 Symantec Corporation Systems and methods for facilitating long-distance live migrations of virtual machines
US9015709B2 (en) 2011-03-08 2015-04-21 Rackspace Us, Inc. Hypervisor-agnostic method of configuring a virtual machine
US8935506B1 (en) 2011-03-31 2015-01-13 The Research Foundation For The State University Of New York MemX: virtualization of cluster-wide memory
JP4894963B2 (ja) * 2011-04-01 2012-03-14 株式会社日立製作所 データ処理システム
US20120291024A1 (en) * 2011-05-13 2012-11-15 International Business Machines Corporation Virtual Managed Network
US20120287931A1 (en) 2011-05-13 2012-11-15 International Business Machines Corporation Techniques for securing a virtualized computing environment using a physical network switch
US9201679B2 (en) 2012-05-31 2015-12-01 Red Hat Israel, Ltd. Multiple destination live migration
CN102968344A (zh) * 2012-11-26 2013-03-13 北京航空航天大学 一种多虚拟机迁移调度的方法

Also Published As

Publication number Publication date
JP2015514271A (ja) 2015-05-18
JP6122483B2 (ja) 2017-04-26
CN104115121B (zh) 2018-04-03
CN104115121A (zh) 2014-10-22
JP6185045B2 (ja) 2017-08-23
US9311122B2 (en) 2016-04-12
JP2015514270A (ja) 2015-05-18
US20130254424A1 (en) 2013-09-26
EP2831731A1 (en) 2015-02-04
WO2013148598A1 (en) 2013-10-03
CN104094230A (zh) 2014-10-08
EP2831730B1 (en) 2019-07-31
EP2831732B1 (en) 2021-06-09
EP2831729B1 (en) 2019-01-09
CN104094229B (zh) 2017-12-22
CN104094231B (zh) 2017-12-01
CN104094229A (zh) 2014-10-08
WO2013148599A1 (en) 2013-10-03
CN104094230B (zh) 2017-10-17
EP2831730A1 (en) 2015-02-04
EP2831729A1 (en) 2015-02-04
JP2015515683A (ja) 2015-05-28
IN2014CN04933A (ja) 2015-09-18
EP2831732A1 (en) 2015-02-04
JP6285906B2 (ja) 2018-02-28
CN104094231A (zh) 2014-10-08
WO2013148601A1 (en) 2013-10-03
WO2013148600A1 (en) 2013-10-03
JP2015518602A (ja) 2015-07-02

Similar Documents

Publication Publication Date Title
JP6195900B2 (ja) 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法
US9893977B2 (en) System and method for supporting live migration of virtual machines in a virtualization environment
US11372802B2 (en) Virtual RDMA switching for containerized applications
US20080189432A1 (en) Method and system for vm migration in an infiniband network
US10552080B2 (en) Multi-target post-copy guest migration
JP2017538201A (ja) ダイナミッククラウドにサブネット管理(sa)クエリキャッシングを提供するためのシステムおよび方法
JP2016170669A (ja) 負荷分散機能配備方法、負荷分散機能配備装置および負荷分散機能配備プログラム
US11822970B2 (en) Identifier (ID) allocation in a virtualized computing environment
JP5662949B2 (ja) 仮想ネットワーク環境におけるコピーの迂回
Guay et al. Early experiences with live migration of SR-IOV enabled InfiniBand
US11593168B2 (en) Zero copy message reception for devices via page tables used to access receiving buffers

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170816

R150 Certificate of patent or registration of utility model

Ref document number: 6195900

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250