JP2015514270A - インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法 - Google Patents

インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法 Download PDF

Info

Publication number
JP2015514270A
JP2015514270A JP2015503438A JP2015503438A JP2015514270A JP 2015514270 A JP2015514270 A JP 2015514270A JP 2015503438 A JP2015503438 A JP 2015503438A JP 2015503438 A JP2015503438 A JP 2015503438A JP 2015514270 A JP2015514270 A JP 2015514270A
Authority
JP
Japan
Prior art keywords
host
virtual machine
virtual
live migration
migration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015503438A
Other languages
English (en)
Other versions
JP6185045B2 (ja
JP2015514270A5 (ja
Inventor
グアイ,ウェイ・リン
ヨンセン,ビョルン・ダグ
Original Assignee
オラクル・インターナショナル・コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/837,922 external-priority patent/US9397954B2/en
Application filed by オラクル・インターナショナル・コーポレイション filed Critical オラクル・インターナショナル・コーポレイション
Publication of JP2015514270A publication Critical patent/JP2015514270A/ja
Publication of JP2015514270A5 publication Critical patent/JP2015514270A5/ja
Application granted granted Critical
Publication of JP6185045B2 publication Critical patent/JP6185045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/76Routing in software-defined topologies, e.g. routing between virtual machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • H04L41/0897Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities by horizontal or vertical scaling of resources, or by migrating entities, e.g. virtual resources or entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

システムおよび方法が、ネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートし得る。複数のホストが、ネットワークを介して相互に接続され得る。各ホストは、1つ以上のバーチャルマシーンを含む。少なくとも1つのバーチャルマシーンは、第1のホストから第2のホストへのライブマイグレーションを行なうよう動作する。キューペア(QP)に付与される仮想機能は、ホスト上のホストチャネルアダプタ(HCA)によってサポートされ得る。

Description

著作権表示
この特許文書の開示の一部は、著作権の保護下にある内容を含む。著作権所有者は、特許商標庁の特許ファイルまたはレコードに現れるので、誰でも当該特許文書または特許開示を複製することについて異議はないが、そうでなければ如何なる場合でもすべての著作権を留保する。
発明の分野
本発明は、一般にコンピュータシステムに関し、特にコンピュータシステム仮想化をサポートすることに関する。
背景
より大きなクラウドコンピューティングアーキテクチャが導入されるにつれて、従来のネットワークおよびストレージに関連付けられる性能および管理上のボトルネックが重要な問題になっている。インフィニバンド(InfiniBand(IB))技術は、クラウドコンピューティングファブリックの基礎として、展開が増加している。これは、本発明の実施例が対応することが意図される一般的な領域である。
概要
本願明細書では、ネットワークにおいてバーチャルマシーンライブマイグレーションをサポートするためのシステムおよび方法が記載される。複数のホストが、ネットワークを介して相互に接続され得る。各ホストは、1つ以上のバーチャルマシーンを含む。少なくとも1つのバーチャルマシーンは、第1のホストから第2のホストにライブマイグレーションを行なうよう動作する。キューペア(queue pair(QP))に付与される仮想機能は、ホスト上のホストチャネルアダプタ(host channel adapter(HCA))によってサポートされ得る。
本発明の実施例に従った、仮想化環境におけるバーチャルマシーンのライブマイグレーションの図を示す図である。 本発明の実施例に従った、仮想化環境におけるバーチャルマシーンのライブマイグレーションをサポートするための例示的なフローチャートを示す図である。 本発明の実施例に従った、キューペアナンバー(QPN)変換テーブルに対するプロセスID(PID)の図を示す図である。 本発明の実施例に従った、位置依存の通信リソースを再割り当てする図を示す図である。 本発明の実施例に従った、キューペア(QP)を中断および再開するよう決定性状態を使用する図を示す図である。 本発明の実施例に従った、ボトムアップアプローチを使用するバーチャルマシーンのライブマイグレーションの図を示す図である。 本発明の実施例に従った、マイグレーションの後にバーチャルマシーンを再活性化する図を示す図である。 本発明の実施例に従った、バーチャルマシーンのライブマイグレーションの前の2つのキューペア(QP)の図を示す図である。 本発明の実施例に従った、バーチャルマシーンのライブマイグレーションの後の通信における2つのキューペア(QP)の図を示す図である。
詳細な説明
本発明は、限定目的ではなく例示目的で、添付の図面の図において示される。当該図面においては、同様の参照符号が同様の要素を示す。なお、この開示における「ある」、「1つ」または「いくつか」の実施例への参照は、必ずしも同じ実施例に対してなされるものではなく、このような参照は、少なくとも1つの実施例を意味する。
以下の本発明の記載は、高性能ネットワークについての例として、インフィニバンド(IB)ネットワークを使用する。他のタイプの高性能ネットワークが限定なしで使用され得るということは、当業者には明らかであろう。さらに、以下の本発明の記載は、仮想化モデルについての例として、Xen仮想化モデルを使用する。他のタイプの仮想化モデルが限定なしで使用され得るということは、当業者には明らかであろう。
本願明細書において、ネットワークにおいてバーチャルマシーン(virtual machine(VM))ライブマイグレーション(live migration)をサポートすることができるシステムおよび方法が記載される。
本発明の実施例に従うと、仮想化は、クラウドコンピューティングでの効率的なリソース活用および弾性的なリソースアロケーションに有益になり得る。ライブマイグレーションは、物理サーバ同士の間でバーチャルマシーン(VM)をアプリケーショントランスペアレントな態様で移動させることによって、リソースの使用を最適化することを可能にする。したがって仮想化は、コンソリデーション、リソースのオンデマンドプロビジョニング、およびライブマイグレーションによる弾性を可能にし得る。
インフィニバンド(IB)アーキテクチャ
IBアーキテクチャはシリアル・ポイント・ツー・ポイント全二重技術である。IBネットワークは、サブネットとも称され得る。サブネットは、スイッチとポイント・ツー・ポイントリンクとを使用して相互接続されるホストのセットからなる。IBサブネットは、サブネットにおけるすべてのスイッチ、ルータおよびホストチャネルアダプタ(HCA)のコンフィギュレーションを含み、ネットワークを初期化および起動することを担う、少なくとも1つのサブネットマネージャ(subnet manager(SM))を含み得る。
IBは、リモートダイレクトメモリアクセス(remote direct memory access(RDMA))および従来の送信/受信セマンティックスの両方を提供するために、伝送サービスの豊富なセットをサポートする。使用される伝送サービスから独立して、IB HCAはキューペア(QP)を使用して通信する。QPは、通信セットアップの間に作り出され、QPナンバー、HCAポート、宛先LID、キューサイズおよび伝送サービスといった提供される初期属性のセットを有し得る。HCAは、多くのQPを扱い得、各QPは、送信キュー(send queue(SQ))および受信キュー(receive queue(RQ))のようなキューのペアからなっており、このような1つのペアが、通信に参加する各エンドノードに存在する。送信キューは、リモートノードに転送されるワーク要求を保持する一方、受信キューは、リモートノードから受け取ったデータで何を行なうべきかについての情報を保持する。QPに加えて、各HCAは、送信キューおよび受信キューのセットに関連付けられる1つ以上の完了キュー(completion queue(CQ))を有する。CQは、送信および受信キューにポスティングしたワーク要求についての完了通知を保持する。通信の複雑性はユーザから隠されているが、QP状態情報はHCAに維持される。
入出力(I/O)仮想化
I/O仮想化(I/O Virtualization(IOV))は、存在する物理リソースにVMがアクセスすることを可能にすることによって、I/Oの可用性を提供し得る。ストレージトラフィックおよびサーバ間通信の組合せによって、単一のサーバのI/Oリソースを圧倒し得るような増加した負荷が課され、これにより、データを待っている際に、バックログおよびアイドル状態になるプロセッサが引き起こされる。I/O要求の数の増加により、IOVは可用性を提供し得るとともに、現代のCPU仮想化において見られる性能のレベルに合致するよう、(仮想化された)I/Oリソースの性能、スケーラビリティおよびフレキシビリティを向上し得る。
エミュレーション、準仮想化、直接割当(direct assignment(DA))およびシングルルートI/O仮想化(single root-I/O virtualization(SR−IOV))といった、異なるタイプのIOV技術が存在し得る。これらのIOV技術のうち、SR−IOVは、ほぼネイティブの性能を維持しつつ、複数のVMから単一の物理デバイスへの直接アクセスを可能にする手段により、PCI Express(PCIe)規格を拡張し得る。したがってSR−IOVは、良好な性能およびスケーラビリティを提供し得る。
SR−IOVは、各ゲストに1つの仮想デバイスを割り当てることによって複数のゲスト同士の間で共有され得る複数の仮想デバイスをPCIeデバイスが公開することを可能にする。各SR−IOVデバイスは、少なくとも1つの物理的機能(physical function(PF))と、1つ以上の関連付けられる仮想機能(virtual function(VF))とを有する。PFは、バーチャルマシーンモニタ(virtual machine monitor(VMM))またはハイパーバイザによって制御される通常のPCIe機能であり、VFは、軽量のPCIe機能である。各VFは、自身のベースアドレス(base address(BAR))を有しており、ユニークリクエスタIDが割り当てられている。ユニークリクエスタIDは、I/Oメモリ管理ユニット(I/O memory management unit(IOMMU))が、異なるVFに対する/異なるVFからのトラフィックストリーム同士を区別することを可能にする。IOMMUはさらに、PFとVFとの間でメモリおよび割込変換を適用する。
たとえば共有ポートモデルおよび仮想スイッチモデルといった、異なるタイプのSR−IOVモデルが存在し得る。共有ポートモデルでは、すべてのVFは、単一のポートアドレスおよび単一のQPネームスペースを共有し得、単一のHCAポートのみがネットワークに公開される。仮想スイッチモデルでは、各VFは、ユニークポートアドレスおよびユニークQPネームスペースを含む仮想HCAであり、デバイス上のVFごとに1つのHCAがネットワークに公開される。したがって、より複雑なハードウェアであっても、仮想スイッチモデルはIOVを簡素化し得る。
SR−IOV対応のデバイスの使用によって、ほぼネイティブの性能およびスケーラビリティの向上が与えられ得る。その一方、SR−lOVは、ライブマイグレーションおよびチェックポイント/リスタートメカニズムと完全には互換性がないわけではない。
ライブマイグレーション
本発明の実施例に従うと、仮想化環境は、バーチャルマシーンのライブマイグレーションを可能にする。すなわち、VM上で実行されているアプリケーションを中断することなく、実行中のVMをあるマシンから別のマシンに移動させることを可能にする。
図1は、本発明の実施例に従った、仮想化環境におけるバーチャルマシーンのライブマイグレーションの図を示す。図1に示されるように、たとえばホストA−B101−102といった複数のホストがIBネットワーク100を介して相互接続され得る。たとえばVMa103のようなVMは、たとえばホストA101のようなあるホストからホストB102のような別のホストに(VMa104として)マイグレートし得る。
さらに図1に示されるように、各ホストは、HCAを使用するVMMを含み得る。たとえば、ホストA101におけるVMM A115はHCA117を使用しており、ホストB102におけるVMM B116はHCA118を使用している。さらにVMa103には、たとえばQPa107といったキューペアに接続されるVF105のようなVFが付与され得る。
VMMの観点から、VF105が付与されるVMa103をホストA101からホストB102にマイグレートするよう、3段階のマイグレーションプロセスが行なわれ得る。
段階1:VMa103からVF105の分離
段階2:ホストA101からホストB102にVMa103を(VMa104として)マイグレート
段階3:VMa104に新しいVF106を付与
Xen仮想化モデルを使用して、各ホストは、特権ドメインと1つ以上のゲストVMを含むゲストドメインとを含み得る。たとえばホストA101は、特権ドメインであるDom0 111と、ゲストドメインであるDomU 113とを含み得、ホストB102は特権ドメインであるDom0 112と、ゲストドメインであるDomU 114とを含み得る。
図1に示されるように、特権ドメインであるDom0 111は、そのデバイスドライバをアンロードすることによりVF105を分離するために、ゲストドメインであるDomU 113への仮想割込を生成し得る。たとえば、PCleデバイスを切断するようハイパーバイザによってサポートされるホットプラグメカニズムがVF105を分離するよう使用され得る。
本発明の実施例に従うと、当該システムは、VMa103からVF105を分離するためのPID−QPN変換テーブルを使用し得る。QPa107が作り出されると、ユーザアプリケーション110のPIDは、VMa103のカーネルスペースに存在するPID−QPN変換テーブルに登録され得る。次いで、たとえばQPa107のようなアクティブなQPが存在しVF105に接続する状況で、図3に示され得るPID−QPN変換テーブルに基づきVF105の分離が成功し得る。さらに、VMa103がホストA101からホストB104まで(VMa104として)マイグレートした後、新しい仮想グローバルユニーク識別子(virtual globally unique identifier(vGUID))と新しいローカル識別子(local identifier(LID))とを含むVF106がVMa104に付与され得る。
IBネットワークでは、QPリソースは、ハードウェアによって直接的に管理され得、オパックハンドル(opaque handle)を通じてソフトウェアによってのみアクセスされ得る。したがって、VF106がVMa104に付与されると、ユーザアプリケーションは、QPa107を指す無効なオパックハンドルを有し得る。これは、ユーザプロセスによって固定された物理メモリについての仮想アドレスが変化し、メモリ登録の間に作り出されたオパックハンドルは無効になり得るからである。
本発明の実施例に従うと、変換メカニズムは、QPについて位置依存のリソースを扱うよう使用され得る。各QPコンテキストは、HCAおよびホストに関連付けられる位置依存の属性を含む。変換メカニズムを使用して、これらの位置依存の属性は、マイグレーションの後に再び作り出され得る。さらに、アプリケーショントランスペアレンシーを維持するために、マイグレーションの後に、ユーザプロセスにおける仮想アドレスは、正しい物理メモリの新しい位置にそれらを固定するよう再び割り当てられ得る。
さらに、IBネットワークは、VMのライブマイグレーションの前および後にQPを中断および再開するための決定性状態を使用し得る。この決定性状態は、2つの異なる物理デバイス間でQP状態をマイグレートするとともに、ロスレスネットワークであり得るIBネットワーク100において致命的なエラーを引き起こし得る如何なるドロップしたパケットまたは使用不能なパケットも防止するよう使用され得る。次いで、マイグレーションの時に、マイグレートするVMa103は、まだ伝送線で転送されていない各QPにおいて、未処理のパケットをマイグレートさせることができる。
図2は、本発明の実施例に従った、仮想化環境におけるバーチャルマシーンのライブマイグレーションをサポートするための例示的なフローチャートを示す。図2に示されるように、ステップ201では、1つ以上のバーチャルマシーンを含む複数のホストは、ネットワークを介して相互接続される。その後、ステップ202では、少なくとも1つのバーチャルマシーンには、キューペア(QP)に関連付けられる仮想機能が付与される。当該QPは、ホスト上のホストチャネルアダプタ(HCA)によってサポートされる。さらに、ステップ203では、上記の少なくとも1つのバーチャルマシーンが、第1のホストから第2のホストにライブマイグレーションを行い得る。
キューペアナンバー(Queue Pair Number(QPN))変換テーブルに対するプロセスID(Process ID(PID))
図3は、本発明の実施例に従った、キューペアナンバー(QPN)変換テーブルに対するプロセスID(PID)の図を示す。図3に示されるように、バーチャルマシーン(VM)環境300は、カーネルスペース301およびユーザスペース302を含み得る。
ユーザスペース302は、各々にプロセスID(PID)が割り当てられ得る、たとえばユーザプロセスA−C311−313のような1つ以上のユーザプロセスを含み得る。たとえば、プロセスID(PID)321がユーザプロセスA311に割り当てられ得る。
さらに、各ユーザプロセスA−C311−313は、システムにおける他のプロセスと通信するよう、1つ以上のキューペア(QP)を使用し得る。たとえば、ユーザプロセスA311は、キューペアナンバー(QPN)332に関連付けられるQPa322を使用し得る。
バーチャルマシーン300のライブマイグレーションの前および後に正しいユーザプロセスを識別するために、カーネルスペース301は、バーチャルマシーン300についてのQPを、QPを使用する異なるユーザプロセスに関係付ける変換テーブル310を維持し得る。
たとえば、変換テーブル310は、QPa322についての(値xを有する)QPN332を、ユーザプロセスA311に割り当てられる(値0xAを有する)PID321にマッピングし得る。さらに、変換テーブル310は、ユーザプロセスB−C312−313のような他のユーザプロセスにQPをマッピングするためのエントリを有し得る。
本発明の実施例に従うと、ユーザプロセスA311についてのPID321は、QPa322が作り出されると、変換テーブル310に登録され得、QPa322が破壊されると、ユーザプロセスA311についてのPID321は登録抹消され得る。
Xenベースのアーキテクチャの例においては、バーチャルマシーン300における特権ドメインは、登録されたQPN332が存在する場合、固定されたメモリを解放するよう、登録されたPID321でユーザプロセスA311に通知するためのイベントをトリガすることにより、IB VFを分離しようとし得る。ユーザプロセスA311による固定されたメモリが解放された後、ユーザプロセスA311に属するQPa322は、再開イベントを受け取るまで中断され得る。結果として、カーネルスペース301モジュールはアンロードされ得、QPa322に接続されたVFは、VM300からの分離が成功し得る。
さらに、ユーザスペース302とカーネルスペース301との間のインタラクションの欠如を解消するために、システムは、PCI IBモジュールを登録解除する前にカーネルスペース301によってトリガされ得るユーザスペースコールバック機能を構成し得る。
位置依存の通信リソース
図4は、本発明の実施例に従った、位置依存の通信リソースを再割り当てする図を示す。図4に示されるように、バーチャルマシーン環境400は、カーネルスペース410と、たとえばユーザプロセスA−C411−413といった1つ以上のユーザプロセスを有するユーザスペース401とを含み得る。
マイグレーションの後に、宛先ホストにて他のQPNとの競合を回避するために、各ユーザプロセスA−C411−413は、更新されたQP属性を検索および抽出する時間を最小化することができるマッピングテーブルを有し得る。
ユーザプロセスA411は、たとえばユーザプロセスA411の場合のユーザスペースデバイスドライバ422のようなユーザスペースライブラリの一部として実現され得るマッピングテーブル433を有し得る。さらに、マッピングテーブル433のサイズは、各ユーザプロセスA−C411−413が自身のマッピングテーブルを有し得るので、相対的に小さいサイズに維持され得る。
さらに、マッピングテーブル433は、新しいIB VFが宛先ホストにて付与された後で、更新された位置依存のQP属性を抽出するよう使用され得る。たとえば、各QP属性につき1つのマッピングテーブルを使用する代わりに、マッピングテーブル433は単に、(古いQPNがキーとして使用される状態で)メモリに格納される新しいQP属性へのポインタを含んでもよい。図4に示されるように、マッピングテーブル433において、第1のQPN値であるXは、位置依存の属性432のアドレス431を格納するQPコンテキストポインタである0xaaに関連付けられる。
本発明の実施例に従うと、QPコンテキストは、ローカル識別子(LID)、キューペアナンバー(QPN)、リモートキー(rkey)およびローカルキー(lkey)のようないくつかの位置依存の属性432を含み得る。LIDは、サブネット初期化の間にサブネットマネージャによって各HCAポートに割り当てられるローカルアドレスである。QPNは、QPを示す識別子であり、HCAの内でだけユニークである。ローカルキー(lkey)およびリモートキー(rkey)の両方は、マイグレーションの後で変更される必要がある位置依存の属性である。これらは、ローカルおよびリモートのメモリ領域にそれぞれアクセスするための認証キーである。
代替的には、これらのQP属性を再マッピングするのための他のアプローチが存在し得る。1つのアプローチは、再マッピングメカニズムをハードウェアにオフロードすることである。このアプローチは、ハードウェアおよびソフトウェアアーキテクチャへの修正を必要とし得る。別の代替案は、VFが再び付与された後、カーネルにマッピングテーブルを配置し、キャッシュされたQP属性をQP属性の新しいセットに再マッピングすることである。このアプローチは、LID、rkey、lkeyおよびQPNといったすべての属性についてのマッピングテーブルを必要とする場合がある。さらに、QPNはサブネット内でユニークでない場合があり得、マイグレーションの後で競合を引き起こし得る。
したがって、QP属性432のような位置依存のリソースは、ユーザアプリケーション421によってキャッシュされ得る。さらに、QPが確立された後、カーネル410からの割込なしで、ユーザアプリケーション421によるタイムクリティカルな動作が、ユーザスペース401におけるライブラリに基づき直接的に行なわれ得る。
キューペア(QP)状態
図5は、本発明の実施例に従った、キューペア(QP)を中断および再開するよう決定性状態を使用する図を示す。図5に示されるように、ネットワークモデル500は、レディ・ツー・リード(ready-to-read(RTS))状態501およびセンド・キュー・ドレイン(send-queue-drain(SQD))状態502といったさまざまな規定された状態にキューペア(QP)があることを可能にする。さらに、ネットワークモデル500はたとえば、ライブマイグレーション前および後にQPを中断および再開するよう、中断状態503のような決定性状態を使用し得る。
本発明の実施例に従うと、中断状態503は、センド・キュー・ドレイン(SQD)状態502に基づき得る。QPがRTS状態501からSQD状態502に移行される前に、QPのワークキューにおけるすべての未処理の動作のドレインが成功する。したがってSQD状態502は、QPが一時的に中断され得る前にすべての未処理の送信動作が完了することを確実にし得る。このアプローチを使用すると、QPは、送信中のパケットが存在しない決定性状態になり得、QPは安全に中断およびマイグレートされ得る。
遅延分離(Late-detach)マイグレーションプロセス
本発明の実施例に従うと、仮想環境は、VMマイグレーションの間、遅延分離アプローチを使用して、サービスダウンタイムを低減することができる。
図6は、本発明の実施例に従った、ボトムアップアプローチを使用してバーチャルマシーンのライブマイグレーションの図を示す。図6に示されるように、たとえばホストA−B601−602のような複数のホストは、IBネットワーク600を介して相互に接続され得る。各ホストA−B601−602は、VMM615−616のような、1つ以上のバーチャルマシーン(VM)を管理する1つ以上のバーチャルマシーンモニタ(VMM)を含み得る。
たとえばDomU 613におけるVMa603のようなバーチャルマシーン(VM)には、たとえばHCA617上のQPa607のようなキューペア(QP)に接続する仮想機能(VF)605が付与され得る。特権領域であるDom0 611は、ホストA601からホストB602へのVMa603の(VMa604としての)マイグレーションを開始し得る。
図6に示されるように、システムは、まずVF605を分離することなくVMa603がマイグレートすることを可能にする。その後、システムは、VMa604が(VMM616およびHCA618にサポートされる特権領域であるDom0 612と、ゲストドメインであるDomU 614とを含む)宛先ホストB602上でセットアップされた後で、VF605を分離し得る。
したがって、VMが中断されるまでIBデバイスは動作可能のままであり得るのでサービスダウンタイムは低減され得る。たとえばHCA617上のQPa607は、ストップ・アンド・コピーの段階の開始まで機能的なままであり得る。
図7は、本発明の実施例に従った、マイグレーションの後のバーチャルマシーン環境を再活性する図を示す。図7に示されるように、たとえばホストA−B701−702のような複数のホストは、IBネットワーク700を介して相互に接続され得る。各ホストA−B701−702は、1つ以上のバーチャルマシーン(VM)を管理する、ホストA701上のVMM615およびホストB702上のVMM716といった1つ以上のバーチャルマシーンモニタ(VMM)を含み得る。さらに、各ホストA−B701−702は、ホストA701上のHCA717およびホストB702上のHCA718のような1つ以上のHCAを含み得る。
VMa704が宛先ホストB702にマイグレートした後、VMa704が再開される前に、新しいVF706がVMa704に付与(または再付与)され得る。新しいVF706は、HCA718上の新しく作り出されたQPa’708に接続し得る。
Xen仮想化モデルを使用して、たとえばホストB702上のDom0 712のような特権領域は、初期の復元の間にVF706を初期化する代わりに、ゲストドメインであるDomU 714においてVMa704の復元の最終段階にて、新しいVF706を付与し得る。さらに、Dom0 712は、ハードウェア依存リソースを再び作り出すことと、リモートQPとの接続を再び確立することとを含み得る再コンフィギュレーションプロセスを行い得る。
リモート接続の再確立
IBネットワークは、複数の接続指向の伝送サービスを提供し得る。システムは、両方のQPがまだ動作中である際、たとえばRTS状態である際にVMマイグレーションが発生する状況において、マイグレーションが完了した後、宛先ホスト上にQPを再び作り出し得るとともにリモートのQPとの接続を再確立し得る。
図8は、本発明の実施例に従った、バーチャルマシーンのライブマイグレーションの前の2つのキューペア(QP)の図を示す。図8に示されるように、たとえばホストA−B801−802のような複数のホストは、IBネットワーク800を介して相互に接続され得る。各ホストA−B701−702は、VMM815−816のような1つ以上のバーチャルマシーンモニタ(VMM)と、HCA817−818のような1つ以上のHCAとを含み得る。
図8に示されるような例において、ホストA801上のVMa803に関連付けられるQPa808は、ホストA801からホストB802へのVMa803のライブマイグレーションの前に、たとえばVMc805に関連付けられるQPc807のようなピアQPと通信し得る。
VMa803のライブマイグレーションの間、VMa803のマイグレーションを成功させるために、通信マネージャ(communication manager(CM))810は、デバイス除去イベントを許容するよう構成され得る。CM810は、デバイスが除去された後、接続を切断し得、新しいデバイスが再び付与されると接続を再び開始し得る。さらにシステムは、たとえばユーザスペースライブラリにおいて、再接続メカニズムを実現し得る。
図8に示されるように、Xenベースのアーキテクチャの例において、ホストA801上の特権ドメインであるDom0 811は、ゲストドメインであるDomU 813におけるVMa803の、ホストB802へのマイグレーションを開始し得る。さらに、ホストB802は、特権ドメインであるDom0 812と、1つ以上のVM(たとえばVMx804)を含むゲストドメインであるDomU 814とを含み得る。
本発明の実施例に従うと、Xenモデルのような仮想化モデルにおいて、VMとゲストドメイン(すなわちDomU)との間に1対1の関係が存在し得る。さらに、VMM/Dom0の制御の下でVMをホストする物理サーバ上のリソースコンテナであるDomUは、VMのXenノーションを示すよう使用され得る。さらに、他の仮想化モデルにおいて、1対多または多対1の関係が、限定なしで、VMとゲストドメインとの間で存在し得る。たとえば、ゲストドメインは、異なるVMをホスト可能であり得る。
さらに、Dom0 811は、VMa803からVFをアンプラグするようPCI分離スクリプトを実行し得る。この動作はさらに、中断段階をトリガし得る。中断段階では、VMa803上のカーネルIB PCIモジュールが、PIDがQPN−PIDマッピングテーブル310に存在することを照合し得るとともに、VMa803におけるユーザプロセスに通知するよう中断イベントを信号送信し得る。
マイグレートするVMa808は、固定されたメモリが解放される前に、QP属性とVMc807への帯域外ソケットアドレスとを保存し得る。ここで、ソケットアドレスは、マイグレーションの後に変化しない、VMについての位置独立アドレスとして使用され得る。位置独立ソケットアドレスは、VMライフサイクルを通じてvGUIDがユニークかつ静的な「名前」として使用されない場合に、VMを識別するよう使用され得る。
次いで、固定されたメモリが解放された後、VMa808からのVFの分離が成功し得、再開イベントを受け取るまで、VMa808に関連付けられるユーザプロセスが中断状態のままであり得る。
ユーザプロセスは、中断イベントを受け取ると、中断フラグを設定し得るとともに、残っている送信動作を停止する。次いで、ユーザプロセスは、QPa808が中断されることをVMc807上のユーザライブラリに通知するよう、信頼性のある接続を使用して中断メッセージを生成し得る。両方のQP807−808上のワークキューがドレインされた場合、VMc805はQPc807をリセットし得、新しいCMイベントを待ち得る。
さらに、ライブマイグレーション中に、マイグレートするVMa803は、QPc807がマイグレートするVMa803にデータを送信するのを防止し得、マイグレーションについてQPc807に通知するよう、信頼性のある接続(reliable connection(RC))中断メッセージを転送し得る。QPc807は、メッセージを受け取った後、ワークキューのドレインがすべて成功することを保証し得る。その後、QPc807はリセット状態に変化し得、通信を再開するよう新しいCMイベントを待つ。
したがってシステムは、マイグレーションの後、VMa808とVMc805との間の接続を維持し得る。
図9は、本発明の実施例に従った、バーチャルマシーンのライブマイグレーションの後の通信における2つのキューペア(QP)の図を示す。図9に示されるように、複数のホスト、たとえば、ホストA−B901−902は、IBネットワーク900を介して相互に接続され得る。
ホストB902上のVMa904は、ホスト901からマイグレートされ得る。次いで、システムはVMa904に新しいVFを付与し得るとともに、再開段階をトリガし得る。システムは、再開フラグをセットするとともにたとえばQPa’908といった新しいQPを作り出すよう、VMa904におけるユーザプロセスに通知するための再開イベントを信号送信し得る。さらに、新しいQP属性へのポインタは、以前のQPNが抽出キーとして使用される状態で、マッピングテーブルに加えられ得る。
CM910がVMについての位置独立アドレスを使用してVMc905(または図8におけるVMc805)との接続を再確立した後、QP属性を交換するとともにQP907−908の両方をRTS状態に移すことにより通信が再開され得る。この点で、アプリケーションは、マッピングテーブルから正しいQP属性を抽出するよう、すべての動作がユーザライブラリによってインターセプトされた状態で、キャッシュされたQP属性を使用し続けることができる。
本発明は、1つ以上のプロセッサ、メモリ、および/または本開示の教示に従ってプログラムされたコンピュータ読取可能な記録媒体を含む1つ以上の従来の汎用または専用デジタルコンピュータ、コンピューティングデバイス、マシン、またはマイクロプロセッサを用いて簡便に実施され得る。ソフトウェア技術の当業者には明らかであるように、適切なソフトウェアコーディングは、熟練したプログラマによって本開示の教示に基づき容易に用意され得る。
いくつかの実施例では、本発明は、本発明の処理のいずれかを実行するようコンピュータをプログラムするのに用いられ得る命令を格納した記録媒体またはコンピュータ読取可能な媒体であるコンピュータプログラムプロダクトを含む。当該記録媒体は、フロッピーディスク(登録商標)、光ディスク、DVD、CD−ROM、マイクロドライブ、および光磁気ディスクを含む任意のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリ素子、磁気または光学カード、ナノシステム(分子メモリICを含む)、または命令および/またはデータを格納するのに好適な任意のタイプの媒体もしくはデバイスを含み得るが、これらに限定されない。
本発明の上記の記載は、例示および説明目的で与えられている。網羅的であることまたは開示されたそのものの形態に本発明を限定することを意図したものではない。当業者にとっては、多くの修正例および変形例が明確であろう。上記の実施例は、本発明の原理およびその実際的な適用をもっともよく説明するために選択および記載されたものであり、これにより他の当業者が、特定の使用に好適なさまざまな修正例を考慮して、さまざまな実施例について本発明を理解するのが可能になる。本発明の範囲は、添付の特許請求の範囲およびそれらの均等物によって定義されることが意図される。

Claims (20)

  1. ネットワークにおいてバーチャルマシーンのライブマイグレーションをサポートするためのシステムであって、
    1つ以上のマイクロプロセッサと、
    前記1つ以上のマイクロプロセッサ上で実行され、前記ネットワークを介して相互に接続される複数のホストと、
    1つ以上のバーチャルマシーンとを含み、前記1つ以上のバーチャルマシーンにおける少なくとも1つのバーチャルマシーンは、第1のホストから第2のホストへのライブマイグレーションを行なうよう動作し、
    前記少なくとも1つのバーチャルマシーンにはホスト上のホストチャネルアダプタ(HCA)によってサポートされるキューペア(QP)に関連付けられる仮想機能が付与される、システム。
  2. 前記1つ以上のバーチャルマシーンを管理する少なくとも1つのバーチャルマシーンモニタをさらに含む、請求項1に記載のシステム。
  3. 前記仮想機能は入出力(I/O)仮想化モデルにおいて提供される、請求項1に記載のシステム。
  4. 前記少なくとも1つのバーチャルマシーンは、
    各々がプロセス識別ナンバー(PID)に関連付けられる1つ以上のユーザプロセスを含むユーザスペースと、
    PIDをキューペアナンバー(QPN)にマッピングする変換テーブルを含むカーネルスペースとを含み、前記変換テーブルは、前記仮想機能を前記少なくとも1つのバーチャルマシーンから分離するよう用いられる、請求項1に記載のシステム。
  5. 遅延分離マイグレーションプロセスが、バーチャルマシーンライブマイグレーションの間のネットワーク/サービスダウンタイムを低減するよう用いられる、請求項1に記載のシステム。
  6. 前記少なくとも1つのバーチャルマシーンが前記第1のホストから前記第2のホストにマイグレートした後、1つ以上の位置依存のQP属性が更新されることが可能である、請求項1に記載のシステム。
  7. 各ユーザプロセスは、更新された前記1つ以上の位置依存のQP属性の検索および抽出を最適化するよう動作するマッピングテーブルを含む、請求項6に記載のシステム。
  8. QP状態情報は、QPの物理リソースを再割り当てするよう前記少なくとも1つのバーチャルマシーンのイメージとともにマイグレートされることが可能である、請求項1に記載のシステム。
  9. ピアQPは、前記少なくとも1つのバーチャルマシーンの前記ライブマイグレーションの間、前記QPとの通信を停止することが可能である、請求項1に記載のシステム。
  10. 接続マネージャ(CM)は、前記マイグレーションが完了した後で、マイグレートされた前記QPと前記ピアQPとの間の新しい接続を再確立することが可能である、請求項9に記載のシステム。
  11. ネットワークにおいてバーチャルマシーンのライブマイグレーションをサポートするための方法であって、
    前記ネットワークを介して相互に接続される複数のホストを提供するステップと、
    1つ以上のバーチャルマシーンを提供するステップとを含み、前記1つ以上のバーチャルマシーンにおける少なくとも1つのバーチャルマシーンには、ホスト上のホストチャネルアダプタ(HCA)によってサポートされるキューペア(QP)に関連付けられる仮想機能が付与され、前記方法はさらに、
    前記少なくとも1つのバーチャルマシーンを介して第1のホストから第2のホストへのライブマイグレーションを行なうステップを含む、方法。
  12. 前記1つ以上のバーチャルマシーンを管理する少なくとも1つのバーチャルマシーンモニタを提供するステップをさらに含む、請求項11に記載の方法。
  13. 前記第1のホスト上のホストチャネルアダプタ(HCA)によってサポートされるキューペア(QP)に前記仮想機能を関連付けるステップをさらに含む、請求項11に記載の方法。
  14. 各々がプロセス識別ナンバー(PID)に関連付けられる1つ以上のユーザプロセスを含むユーザスペースを前記少なくとも1つのバーチャルマシーンに含めるステップと、
    PIDをキューペアナンバー(QPN)にマッピングする変換テーブルを含むカーネルスペースを前記少なくとも1つのバーチャルマシーンに含めるステップとをさらに含み、前記変換テーブルは、前記仮想機能を前記少なくとも1つのバーチャルマシーンから分離するよう用いられる、請求項11に記載のシステム。
  15. バーチャルマシーンライブマイグレーションの間のネットワーク/サービスダウンタイムを低減するよう遅延分離マイグレーションプロセスを用いるステップをさらに含む、請求項11に記載の方法。
  16. 前記少なくとも1つのバーチャルマシーンが前記第1のホストから前記第2のホストにマイグレートされた後、1つ以上の位置依存のQP属性を更新するステップをさらに含む、請求項11に記載の方法。
  17. 更新された前記1つ以上の位置依存のQP属性の検索および抽出を最適化するよう動作するマッピングテーブルを各ユーザプロセスに関連付けるステップをさらに含む、請求項16に記載の方法。
  18. QPの物理リソースを再割り当てするよう前記少なくとも1つのバーチャルマシーンのイメージとともにQP状態情報をマイグレートするステップをさらに含む、請求項11に記載の方法。
  19. 前記少なくとも1つのバーチャルマシーンの前記ライブマイグレーションの間、前記QPとの通信を停止するようピアQPを構成するステップをさらに含む、請求項11に記載の方法。
  20. 実行されると、システムに、
    前記ネットワークを介して相互に接続される複数のホストを提供するステップと、
    1つ以上のバーチャルマシーンを提供するステップとを行なわせ、前記1つ以上のバーチャルマシーンにおける少なくとも1つのバーチャルマシーンには、ホスト上のホストチャネルアダプタ(HCA)によってサポートされるキューペア(QP)に関連付けられる仮想機能が付与され、さらに、
    前記少なくとも1つのバーチャルマシーンを介して第1のホストから第2のホストへのライブマイグレーションを行なうステップを行なわせる命令を格納する、一時的でない機械読取可能な記録媒体。
JP2015503438A 2012-03-26 2013-03-25 インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法 Active JP6185045B2 (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US201261615731P 2012-03-26 2012-03-26
US61/615,731 2012-03-26
US201261693703P 2012-08-27 2012-08-27
US61/693,703 2012-08-27
US13/837,922 US9397954B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines in an infiniband network
US13/838,121 2013-03-15
US13/838,502 2013-03-15
US13/838,275 US9432304B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines based on an extended host channel adaptor (HCA) model
US13/838,121 US9450885B2 (en) 2012-03-26 2013-03-15 System and method for supporting live migration of virtual machines in a virtualization environment
US13/838,275 2013-03-15
US13/838,502 US9311122B2 (en) 2012-03-26 2013-03-15 System and method for providing a scalable signaling mechanism for virtual machine migration in a middleware machine environment
US13/837,922 2013-03-15
PCT/US2013/033752 WO2013148598A1 (en) 2012-03-26 2013-03-25 System and method for supporting live migration of virtual machines in an infiniband network

Publications (3)

Publication Number Publication Date
JP2015514270A true JP2015514270A (ja) 2015-05-18
JP2015514270A5 JP2015514270A5 (ja) 2016-03-03
JP6185045B2 JP6185045B2 (ja) 2017-08-23

Family

ID=49213417

Family Applications (4)

Application Number Title Priority Date Filing Date
JP2015503440A Active JP6122483B2 (ja) 2012-03-26 2013-03-25 拡張ホストチャネルアダプタ(hca)モデルに基づいてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503438A Active JP6185045B2 (ja) 2012-03-26 2013-03-25 インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法
JP2015503441A Active JP6285906B2 (ja) 2012-03-26 2013-03-25 ミドルウェアマシン環境内で仮想マシン移行用のスケーラブルなシグナリングメカニズムを提供するシステムおよび方法
JP2015503439A Active JP6195900B2 (ja) 2012-03-26 2013-03-25 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2015503440A Active JP6122483B2 (ja) 2012-03-26 2013-03-25 拡張ホストチャネルアダプタ(hca)モデルに基づいてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2015503441A Active JP6285906B2 (ja) 2012-03-26 2013-03-25 ミドルウェアマシン環境内で仮想マシン移行用のスケーラブルなシグナリングメカニズムを提供するシステムおよび方法
JP2015503439A Active JP6195900B2 (ja) 2012-03-26 2013-03-25 仮想化環境においてバーチャルマシンのライブマイグレーションをサポートするためのシステムおよび方法

Country Status (6)

Country Link
US (1) US9311122B2 (ja)
EP (4) EP2831730B1 (ja)
JP (4) JP6122483B2 (ja)
CN (4) CN104094229B (ja)
IN (1) IN2014CN04933A (ja)
WO (4) WO2013148598A1 (ja)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5852677B2 (ja) * 2011-12-26 2016-02-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation レジスタ・マッピング方法
US9450885B2 (en) 2012-03-26 2016-09-20 Oracle International Corporation System and method for supporting live migration of virtual machines in a virtualization environment
US10025638B2 (en) * 2012-07-02 2018-07-17 Vmware, Inc. Multiple-cloud-computing-facility aggregation
US9990238B2 (en) * 2012-11-05 2018-06-05 Red Hat, Inc. Event notification
US9141416B2 (en) 2013-03-15 2015-09-22 Centurylink Intellectual Property Llc Virtualization congestion control framework for modifying execution of applications on virtual machine based on mass congestion indicator in host computing system
US10230794B2 (en) * 2013-03-15 2019-03-12 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US9990221B2 (en) 2013-03-15 2018-06-05 Oracle International Corporation System and method for providing an infiniband SR-IOV vSwitch architecture for a high performance cloud computing environment
US9729660B2 (en) * 2013-07-24 2017-08-08 Netapp, Inc. Method and system for detecting virtual machine migration
US10389577B2 (en) 2013-08-14 2019-08-20 Centurylink Intellectual Property Llc Ethernet carrier group alarm (CGA)
US10904201B1 (en) * 2013-10-11 2021-01-26 Cisco Technology, Inc. Updating distributed caches in network devices in the event of virtual machine changes in a virtualized network environment
US9864623B2 (en) * 2013-11-21 2018-01-09 Centurylink Intellectual Property Llc Physical to virtual network transport function abstraction
US9436751B1 (en) * 2013-12-18 2016-09-06 Google Inc. System and method for live migration of guest
US9548890B2 (en) 2014-03-17 2017-01-17 Cisco Technology, Inc. Flexible remote direct memory access resource configuration in a network environment
US10397105B2 (en) * 2014-03-26 2019-08-27 Oracle International Corporation System and method for scalable multi-homed routing for vSwitch based HCA virtualization
US9998320B2 (en) 2014-04-03 2018-06-12 Centurylink Intellectual Property Llc Customer environment network functions virtualization (NFV)
US9588796B2 (en) 2014-06-28 2017-03-07 Vmware, Inc. Live migration with pre-opened shared disks
US9672120B2 (en) * 2014-06-28 2017-06-06 Vmware, Inc. Maintaining consistency using reverse replication during live migration
US9900391B2 (en) * 2014-08-05 2018-02-20 Microsoft Technology Licensing, Llc Automated orchestration of infrastructure service blocks in hosted services
US10225327B2 (en) 2014-08-13 2019-03-05 Centurylink Intellectual Property Llc Remoting application servers
US9898318B2 (en) 2014-08-15 2018-02-20 Centurylink Intellectual Property Llc Multi-line/multi-state virtualized OAM transponder
US10198288B2 (en) * 2014-10-30 2019-02-05 Oracle International Corporation System and method for providing a dynamic cloud with subnet administration (SA) query caching
CN107645407B (zh) 2014-12-08 2021-02-12 华为技术有限公司 一种适配QoS的方法和装置
CN104753816A (zh) * 2015-03-27 2015-07-01 华为技术有限公司 一种rdma连接的报文处理方法及相关装置
US9588791B2 (en) 2015-04-27 2017-03-07 Altera Corporation Flexible physical function and virtual function mapping
WO2016206012A1 (en) * 2015-06-24 2016-12-29 Intel Corporation Systems and methods for isolating input/output computing resources
US10228969B1 (en) * 2015-06-25 2019-03-12 Amazon Technologies, Inc. Optimistic locking in virtual machine instance migration
US10970110B1 (en) 2015-06-25 2021-04-06 Amazon Technologies, Inc. Managed orchestration of virtual machine instance migration
US10243848B2 (en) 2015-06-27 2019-03-26 Nicira, Inc. Provisioning logical entities in a multi-datacenter environment
US9882833B2 (en) 2015-09-28 2018-01-30 Centurylink Intellectual Property Llc Intent-based services orchestration
CN108139937B (zh) 2015-10-13 2021-08-13 华为技术有限公司 多根i/o虚拟化系统
CN106997306B (zh) * 2016-01-26 2021-03-09 阿里巴巴集团控股有限公司 物理机数据迁移至云端的方法、装置和系统
CN107852378B (zh) * 2016-01-27 2020-12-08 甲骨文国际公司 用于在高性能计算环境中支持可伸缩的基于位图的P_Key表的系统和方法
US10348645B2 (en) 2016-01-27 2019-07-09 Oracle International Corporation System and method for supporting flexible framework for extendable SMA attributes in a high performance computing environment
US11271870B2 (en) 2016-01-27 2022-03-08 Oracle International Corporation System and method for supporting scalable bit map based P_Key table in a high performance computing environment
US10594547B2 (en) 2016-01-27 2020-03-17 Oracle International Corporation System and method for application of virtual host channel adapter configuration policies in a high-performance computing environment
US10630816B2 (en) 2016-01-28 2020-04-21 Oracle International Corporation System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment
US10536334B2 (en) 2016-01-28 2020-01-14 Oracle International Corporation System and method for supporting subnet number aliasing in a high performance computing environment
US10666611B2 (en) 2016-01-28 2020-05-26 Oracle International Corporation System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment
US10659340B2 (en) * 2016-01-28 2020-05-19 Oracle International Corporation System and method for supporting VM migration between subnets in a high performance computing environment
US10374926B2 (en) 2016-01-28 2019-08-06 Oracle International Corporation System and method for monitoring logical network traffic flows using a ternary content addressable memory in a high performance computing environment
US10616118B2 (en) 2016-01-28 2020-04-07 Oracle International Corporation System and method for supporting aggressive credit waiting in a high performance computing environment
US10171353B2 (en) 2016-03-04 2019-01-01 Oracle International Corporation System and method for supporting dual-port virtual router in a high performance computing environment
CN107305506A (zh) * 2016-04-20 2017-10-31 阿里巴巴集团控股有限公司 动态分配内存的方法、装置及系统
US10379745B2 (en) * 2016-04-22 2019-08-13 Samsung Electronics Co., Ltd. Simultaneous kernel mode and user mode access to a device using the NVMe interface
US10678578B2 (en) * 2016-06-30 2020-06-09 Microsoft Technology Licensing, Llc Systems and methods for live migration of a virtual machine based on heat map and access pattern
US10565008B2 (en) 2016-07-28 2020-02-18 International Business Machines Corporation Reducing service downtime during service migration
US10423444B2 (en) 2016-08-09 2019-09-24 Red Hat Israel, Ltd. Routing table preservation for virtual machine migration with assigned devices
JP6929863B2 (ja) 2016-08-23 2021-09-01 オラクル・インターナショナル・コーポレイション 高性能コンピューティング環境における高速ハイブリッド再構成をサポートするためのシステムおよび方法
CN107992352A (zh) * 2016-10-26 2018-05-04 阿里巴巴集团控股有限公司 用于虚拟化场景的数据交互方法及设备
US10558250B2 (en) * 2016-12-23 2020-02-11 Oracle International Corporation System and method for coordinated link up handling following switch reset in a high performance computing network
CN109144972B (zh) * 2017-06-26 2022-07-12 华为技术有限公司 一种数据迁移的方法以及数据节点
US11469953B2 (en) 2017-09-27 2022-10-11 Intel Corporation Interworking of legacy appliances in virtualized networks
EP3704602B1 (en) * 2017-10-24 2023-09-06 INTEL Corporation Hardware assisted virtual switch
TWI645293B (zh) 2017-11-30 2018-12-21 財團法人工業技術研究院 在多根輸入輸出虛擬化環境中虛擬機器即時遷移的方法、系統及其計算主機
CN109918172A (zh) * 2019-02-26 2019-06-21 烽火通信科技股份有限公司 一种虚拟机热迁移方法及系统
US11537406B2 (en) * 2020-02-18 2022-12-27 Juniper Networks, Inc. Automatic formation of a virtual chassis using zero touch provisioning
US11115301B1 (en) 2020-04-06 2021-09-07 Vmware, Inc. Presenting realized state of multi-site logical network
US11303557B2 (en) 2020-04-06 2022-04-12 Vmware, Inc. Tunnel endpoint group records for inter-datacenter traffic
US11777793B2 (en) 2020-04-06 2023-10-03 Vmware, Inc. Location criteria for security groups
US11088902B1 (en) 2020-04-06 2021-08-10 Vmware, Inc. Synchronization of logical network state between global and local managers
US11882000B2 (en) 2020-04-06 2024-01-23 VMware LLC Network management system for federated multi-site logical network
US20220103430A1 (en) 2020-09-28 2022-03-31 Vmware, Inc. Defining logical networks for deploying applications
CN113326101B (zh) * 2021-08-02 2022-04-12 阿里云计算有限公司 基于远程直接数据存储的热迁移方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010537297A (ja) * 2007-08-24 2010-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 論理区分の間におけるネットワーク・アダプタ・リソース割振り
JP2011146044A (ja) * 2010-01-12 2011-07-28 Internatl Business Mach Corp <Ibm> ホストusbアダプタを仮想化するための方法、装置、およびコンピュータ・プログラム(ホストusbアダプタの仮想化)
JP2011181080A (ja) * 2011-04-01 2011-09-15 Hitachi Ltd データ処理システム

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030208572A1 (en) * 2001-08-31 2003-11-06 Shah Rajesh R. Mechanism for reporting topology changes to clients in a cluster
US7093024B2 (en) * 2001-09-27 2006-08-15 International Business Machines Corporation End node partitioning using virtualization
US6988161B2 (en) * 2001-12-20 2006-01-17 Intel Corporation Multiple port allocation and configurations for different port operation modes on a host
US7484208B1 (en) 2002-12-12 2009-01-27 Michael Nelson Virtual machine migration
US7493409B2 (en) 2003-04-10 2009-02-17 International Business Machines Corporation Apparatus, system and method for implementing a generalized queue pair in a system area network
US8776050B2 (en) * 2003-08-20 2014-07-08 Oracle International Corporation Distributed virtual machine monitor for managing multiple virtual resources across multiple physical nodes
US7555002B2 (en) 2003-11-06 2009-06-30 International Business Machines Corporation Infiniband general services queue pair virtualization for multiple logical ports on a single physical port
US8335909B2 (en) * 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US7581021B2 (en) 2005-04-07 2009-08-25 International Business Machines Corporation System and method for providing multiple virtual host channel adapters using virtual switches
JP4883979B2 (ja) * 2005-10-11 2012-02-22 株式会社ソニー・コンピュータエンタテインメント 情報処理装置および通信制御方法
US20080189432A1 (en) * 2007-02-02 2008-08-07 International Business Machines Corporation Method and system for vm migration in an infiniband network
US8645974B2 (en) * 2007-08-02 2014-02-04 International Business Machines Corporation Multiple partition adjunct instances interfacing multiple logical partitions to a self-virtualizing input/output device
US8798056B2 (en) * 2007-09-24 2014-08-05 Intel Corporation Method and system for virtual port communications
JP2010039730A (ja) * 2008-08-05 2010-02-18 Fujitsu Ltd ネットワーク設定プログラム,ネットワーク設定方法及びネットワーク設定装置
US7996484B2 (en) 2008-12-11 2011-08-09 Microsoft Corporation Non-disruptive, reliable live migration of virtual machines with network data reception directly into virtual machines' memory
US8862538B2 (en) 2008-12-18 2014-10-14 International Business Machines Corporation Maintaining a network connection of a workload during transfer
US7970913B2 (en) 2008-12-31 2011-06-28 International Business Machines Corporation Virtualizing sockets to enable the migration of a system environment
EP2401683A4 (en) * 2009-02-27 2015-07-29 Broadcom Corp METHOD AND SYSTEM FOR NETWORKING VIRTUAL MACHINES
US8429647B2 (en) 2009-05-06 2013-04-23 Vmware, Inc. Virtual machine migration across network by publishing routes to the associated virtual networks via virtual router after the start of migration of the virtual machine
US8150971B2 (en) 2009-05-31 2012-04-03 Red Hat Israel, Ltd. Mechanism for migration of client-side virtual machine system resources
US8489744B2 (en) 2009-06-29 2013-07-16 Red Hat Israel, Ltd. Selecting a host from a host cluster for live migration of a virtual machine
EP2309680B1 (en) * 2009-10-08 2017-07-19 Solarflare Communications Inc Switching API
US8370560B2 (en) 2009-11-16 2013-02-05 International Business Machines Corporation Symmetric live migration of virtual machines
JP5548489B2 (ja) * 2010-03-11 2014-07-16 株式会社日立製作所 計算機システム、仮想化機構、および計算機システムの障害回復方法
JP5190084B2 (ja) * 2010-03-30 2013-04-24 株式会社日立製作所 仮想マシンのマイグレーション方法およびシステム
US8700811B2 (en) 2010-05-25 2014-04-15 Microsoft Corporation Virtual machine I/O multipath configuration
US8489699B2 (en) 2010-08-13 2013-07-16 Vmware, Inc. Live migration of virtual machine during direct access to storage over SR IOV adapter
US20120173757A1 (en) 2011-01-05 2012-07-05 International Business Machines Corporation Routing optimization for virtual machine migration between geographically remote data centers
US8407182B1 (en) 2011-01-21 2013-03-26 Symantec Corporation Systems and methods for facilitating long-distance live migrations of virtual machines
US9552215B2 (en) 2011-03-08 2017-01-24 Rackspace Us, Inc. Method and system for transferring a virtual machine
US8935506B1 (en) 2011-03-31 2015-01-13 The Research Foundation For The State University Of New York MemX: virtualization of cluster-wide memory
US20120287931A1 (en) 2011-05-13 2012-11-15 International Business Machines Corporation Techniques for securing a virtualized computing environment using a physical network switch
US20120291024A1 (en) * 2011-05-13 2012-11-15 International Business Machines Corporation Virtual Managed Network
US9201679B2 (en) 2012-05-31 2015-12-01 Red Hat Israel, Ltd. Multiple destination live migration
CN102968344A (zh) * 2012-11-26 2013-03-13 北京航空航天大学 一种多虚拟机迁移调度的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010537297A (ja) * 2007-08-24 2010-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション 論理区分の間におけるネットワーク・アダプタ・リソース割振り
JP2011146044A (ja) * 2010-01-12 2011-07-28 Internatl Business Mach Corp <Ibm> ホストusbアダプタを仮想化するための方法、装置、およびコンピュータ・プログラム(ホストusbアダプタの仮想化)
JP2011181080A (ja) * 2011-04-01 2011-09-15 Hitachi Ltd データ処理システム

Also Published As

Publication number Publication date
CN104115121B (zh) 2018-04-03
JP2015515683A (ja) 2015-05-28
EP2831732B1 (en) 2021-06-09
JP6122483B2 (ja) 2017-04-26
EP2831730B1 (en) 2019-07-31
JP6185045B2 (ja) 2017-08-23
EP2831729B1 (en) 2019-01-09
CN104094231B (zh) 2017-12-01
CN104094230A (zh) 2014-10-08
CN104094231A (zh) 2014-10-08
WO2013148600A1 (en) 2013-10-03
IN2014CN04933A (ja) 2015-09-18
JP2015514271A (ja) 2015-05-18
US9311122B2 (en) 2016-04-12
EP2831731A1 (en) 2015-02-04
CN104094229B (zh) 2017-12-22
EP2831732A1 (en) 2015-02-04
WO2013148601A1 (en) 2013-10-03
WO2013148598A1 (en) 2013-10-03
US20130254424A1 (en) 2013-09-26
EP2831729A1 (en) 2015-02-04
JP6195900B2 (ja) 2017-09-13
EP2831730A1 (en) 2015-02-04
CN104115121A (zh) 2014-10-22
WO2013148599A1 (en) 2013-10-03
CN104094229A (zh) 2014-10-08
JP6285906B2 (ja) 2018-02-28
JP2015518602A (ja) 2015-07-02
CN104094230B (zh) 2017-10-17

Similar Documents

Publication Publication Date Title
JP6185045B2 (ja) インフィニバンドネットワークにおけるバーチャルマシーンのライブマイグレーションをサポートするためのシステムおよび方法
US9397954B2 (en) System and method for supporting live migration of virtual machines in an infiniband network
CA2887427C (en) Distributed virtual switch for virtualized computer systems
US8533713B2 (en) Efficent migration of virtual functions to enable high availability and resource rebalance
EP2879053B1 (en) Virtual machine memory data migration method, related apparatus, and cluster system
US9854036B2 (en) Method for migrating memory data of virtual machine, and related apparatus and cluster system
US20080189432A1 (en) Method and system for vm migration in an infiniband network
WO2010060300A1 (zh) 一种设备驱动域的实现方法、系统及装置
Guay et al. Early experiences with live migration of SR-IOV enabled InfiniBand
Kawahara et al. The Continuity of Out-of-band Remote Management across Virtual Machine Migration in Clouds
US11593168B2 (en) Zero copy message reception for devices via page tables used to access receiving buffers

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160115

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170726

R150 Certificate of patent or registration of utility model

Ref document number: 6185045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250