WO2015193947A1

WO2015193947A1 - 物理計算機及び仮想計算機移行方法

Info

Publication number: WO2015193947A1
Application number: PCT/JP2014/065907
Authority: WO
Inventors: 真木子篠原
Original assignee: 株式会社日立製作所
Priority date: 2014-06-16
Filing date: 2014-06-16
Publication date: 2015-12-23

Abstract

　第１物理計算機は、複数の第１ＣＰＵと、複数の第１メモリと、それらを複数の仮想計算機へ割り当てる第１仮想化機構とを有する。第２物理計算機は、複数の第２ＣＰＵと、複数の第２メモリと、それらを管理する第２仮想化機構とを有する。第２仮想化機構が、第１物理計算機から第２物理計算機に移行される第１仮想計算機について、ＮＵＭＡ構成情報（第１仮想計算機と第１ＣＰＵと第１メモリとＮＵＭＡノードとの対応関係を表す情報）を基に、第１仮想計算機に割り当てられている第１ＣＰＵから前記第１仮想計算機に割り当てられている物理メモリへのアクセスに関する値であるノードアクセス値を、第１仮想計算機に割り当てられている物理ＣＰＵが属する各ＮＵＭＡノードについて特定し、特定したノードアクセス値を基に、第１仮想計算機に第２ＣＰＵ及び第２メモリを割り当てる。

Description

物理計算機及び仮想計算機移行方法

　本発明は、概して、第１物理計算機から第２物理計算機への仮想計算機の移行に関する。

　ハイパバイザのような仮想化機構により物理計算機の物理リソース（複数タイプの複数の物理リソースエレメント）を論理的に複数の物理リソース部分に分割し、複数の物理リソース部分を複数の仮想計算機（以下、「ＬＰＡＲ」（Logical　Partition）と言う）にそれぞれ割り当て、各ＬＰＡＲ上でＯＳ（Operating　System）を動作させる技術が知られている。複数タイプの複数の物理リソースエレメントとしては、例えば、１以上の物理ＣＰＵ（Central　Processing　Unit）、１以上の物理メモリ、及び、１以上のＩＯ（入出力）デバイスなどがある。物理リソース部分は、例えば、物理ＣＰＵ及び物理メモリのうちの少なくとも一方を含んでよい。

　ＮＵＭＡ（Non-Uniform　Memory　Access）構成の物理計算機が知られている。ＮＵＭＡ構成とは、あるＣＰＵ（この段落において「対象ＣＰＵ」）から見て同じノード（対象ＣＰＵを有するノード）内のメモリへのアクセスコストが、別ノード（対象ＣＰＵを有するノードと別のノード）内のメモリへのアクセスコストと比べて小さくなるような計算機構成を言う。「ノード」とは、１以上のＣＰＵと１以上のメモリとの１つの組を言う。同じノード内のメモリを「ローカルメモリ」と呼び、別ノード内のメモリを「リモートメモリ」と呼ぶ。ローカルメモリへのアクセスはリモートメモリへのアクセスに比べて高速である。

　したがって、物理計算機の物理リソース部分（例えばＣＰＵ及びメモリ）をＬＰＡＲに割り当てる場合には、各ＬＰＡＲに対して、同じノードに属する物理リソース部分を割り当てることが望ましい。しかしながら、物理計算機の物理リソースには制限があるため、そのような割り当てが可能とは限らない。特表２０１２－５２１６１１号公報（特許文献１）には、物理リソース部分がＬＰＡＲに動的に割り当てられる計算機システムにおいて、ＮＵＭＡノード（ＮＵＭＡ構成の物理計算機内のノード）を考慮して物理リソース部分がＬＰＡＲに動的に割り当てられる。

　一方、ＬＰＡＲに物理リソース部分を固定的に割り当てる計算機システムがある。このような計算機システムでは、複数のＮＵＭＡノードに跨る物理リソース部分を１つのＬＰＡＲにやむを得ず割り当てることがあり得る。

　また、現用系の物理計算機で障害が起きた等の原因により、ＬＰＡＲを現用系の物理計算機から予備系の物理計算機に移行して計算機システムを稼働させる技術がある。

特表２０１２－５２１６１１号公報

　物理リソース部分をＬＰＡＲに固定的に割り当てる計算機システムにおいて、現用系の物理計算機と予備系の物理計算機において、物理リソース構成（例えばＣＰＵの数及びメモリの容量）が同じであってもＮＵＭＡ構成が異なる場合がある。例えば、ＮＵＭＡ構成の異なる複数の現用系サーバブレード（サーバブレードは物理計算機の一例）で１つの予備系サーバブレードを共有する場合、現用系サーバブレードと予備系サーバブレードとで、少なくとも１つの現用系サーバブレードのＮＵＭＡ構成と予備系サーバブレードのＮＵＭＡ構成が異なる。このため、ＬＰＡＲの移行の失敗、或いは、ＬＰＡＲ移行後に予期せぬ性能低下が生じるおそれがある。

　第１物理計算機と第２物理計算機がある。第１物理計算機は、複数のＮＵＭＡノードに対応付けられる複数の第１ＣＰＵと、複数のＮＵＭＡノードに対応付けられる複数の第１メモリと、複数の第１ＣＰＵ及び複数の第１メモリを複数の仮想計算機へ割り当てる第１仮想化機構とを有する。第２物理計算機は、複数のＮＵＭＡノードに対応付けられる複数の第２ＣＰＵと、複数のＮＵＭＡノードに対応付けられる複数の第２メモリと、複数の第２ＣＰＵ及び複数の第２メモリを管理する第２仮想化機構とを有する。第２仮想化機構が、複数の仮想計算機のうちの移行対象であり第１物理計算機から第２物理計算機に移行される第１仮想計算機について、ＮＵＭＡ構成情報（第１仮想計算機と第１ＣＰＵと第１メモリとＮＵＭＡノードとの対応関係を表す情報）を基に、第１仮想計算機に割り当てられている第１ＣＰＵから第１仮想計算機に割り当てられている物理メモリへのアクセスに関する値であるノードアクセス値を特定する。第２仮想化機構は、特定したノードアクセス値を基に、第１仮想計算機に第２ＣＰＵ及び第２メモリを割り当てる。

　物理計算機間で第１仮想計算機を移行した後に、予期しない性能低下の発生を防ぐことが期待できる。

実施形態に係る計算機システムの構成を示す。現用系サーバブレードの論理構成と第１管理データの構成とを示す。ＬＰＡＲ移行処理の流れの一例を示す。現用系サーバブレードのＬＰＡＲ構成テーブルの一例を示す。現用系サーバブレードのＮＵＭＡ構成テーブルの一例を示す。予備系サーバブレードのＮＵＭＡ構成テーブルの一例（ＬＰＡＲ移行前）を示す。予備系サーバブレードのＮＵＭＡ構成テーブルの一例（ＬＰＡＲ移行後）を示す。図３のステップ３４５の詳細を示す図８のステップ８０３の詳細の一部を示す。図８のステップ８０３の詳細の残りを示す。Ｒ_ｎｍテーブルの一例を示す。サーバブレードの物理構成を示す。

　以下、図面を参照して、一実施形態を説明する。

　図１は、実施形態に係る計算機システムの構成を示す。

　計算機システムが、現用系サーバシャーシ１１０と、予備系サーバシャーシ１２０と、ＰＣ１０２と、管理サーバ１００と、複数（例えば３台）のＩＯ（入出力）デバイス１１６～１１８とを有する。ＩＯデバイスは１つでもよい。通信ネットワーク１０１に、現用系サーバシャーシ１１０、予備系サーバシャーシ１２０、ＰＣ１０２及び管理サーバ１００が接続されている。

　現用系サーバシャーシ１１０は、第１計算機サブシステムの一例でよく、複数（例えば３台）の現用系サーバブレード１１３、１１４及び１１５を有する。現用系サーバブレードは１つでもよい。１つの現用系サーバブレードは、第１物理計算機の一例である。また、現用系サーバシャーシ１１０は、複数の現用系サーバブレード１１３、１１４及び１１５により参照される第１管理データを保持するＳＶＰ（Service　Processor）１１１を有する。ＳＶＰ１１１は、第１管理データを記憶する記憶デバイス（例えば不揮発記憶デバイス）１１２を有した計算機でよい。ＳＶＰ１１１は、現用系サーバブレード１１３、１１４及び１１５を管理する。

　予備系サーバシャーシ１２０は、第２計算機サブシステムの一例でよく、その構成はシャーシ１１０と実質的に同様である。すなわち、予備系サーバシャーシ１２０は、複数（例えば２台）の予備系サーバブレード１２４及び１２５を有する。予備系サーバブレードは１つでもよい。１つの予備系サーバブレードは、第２物理計算機の一例である。本実施形態によれば、２台の予備系サーバブレード１２４及び１２５が３台の現用系サーバブレード１１３、１１４及び１１５に共有されている。予備系サーバブレードは、現用系サーバブレードより少ないことが望ましいが、現用系サーバブレードと同数でも現用系サーバブレードより多くてもよい。予備系サーバブレードは、現用系サーバブレードのＬＰＡＲの移行先となる。予備系サーバシャーシ１２０は、複数の予備系サーバブレード１２４及び１２５により参照される第２管理データを保持するＳＶＰ１２１を有する。ＳＶＰ１２１は、第２管理データを記憶する記憶デバイス（例えば不揮発記憶デバイス）１２２を有した計算機でよい。ＳＶＰ１２１は、予備系サーバブレード１２４及び１２５を管理する。

　ＰＣ１０２は、パーソナルコンピュータの略であり、入出力コンソールの一例である。ＰＣ１０２は、例えば管理サーバ１００のクライアントマシンでよい。ＰＣ１０２に代えて他種の計算機が採用されてもよい。ＰＣ１０２は、サーバブレードの状態を確認したりサーバブレードに対して指示を行ったりするためにユーザにより使用される。

　管理サーバ１００は、管理計算機の一例であり、複数のサーバシャーシ１１０及び１２０内のサーバブレード１１３～１１５、１２４及び１２５を管理する。

　ＩＯデバイス１１６～１１８の各々は、例えば、１以上の不揮発記憶デバイスを有するストレージ装置である。ＩＯデバイス１１６～１１８の各々は、サーバブレードで実行される複数のＬＰＡＲがそれぞれ実行する複数のＯＳ（ゲストＯＳ）を記憶する。ＬＰＡＲは１つでもよく、故にゲストＯＳも１つでもよい。ＩＯデバイス１１６～１１８の各々は、例えば、現用系サーバブレード１１３～１１５のうちの少なくとも１つと、予備系サーバブレード１２４及び１２５のうちの少なくとも１つとに通信可能に接続されている。

　図１２は、サーバブレード１１４の物理構成を示す。

　サーバブレード１１４は、物理リソースを有し、物理リソースは、例えば、１以上のＩ／Ｆ（通信インターフェイスデバイス）１２０２と、１以上の物理メモリ１２０３と、それらに接続された１以上の物理ＣＰＵ１２０１とを含む。Ｉ／Ｆ１２０２、物理メモリ１２０３及び物理ＣＰＵ１２０１の各々は、物理リソースエレメントの一例である。他のサーバブレードの各々の物理リソースも、１以上のＩ／Ｆと、１以上の物理メモリと、それらに接続された１以上の物理ＣＰＵとを含む。しかし、物理リソースの構成（例えば、物理リソースエレメントの数、物理リソースエレメントの仕様等）は、違っていてもよい。本実施形態では、説明を分かり易くするために、複数のサーバブレード１１３～１１５、１２４及び１２５において、同じ物理ＣＰＵ（同じ製品）が搭載されており、また、同じ物理メモリ（同じ製品）が搭載されているものとする。つまり、少なくとも物理ＣＰＵ及び物理メモリについては、それぞれ、数の違いが構成の違いに相当する。

　１以上のＩ／Ｆ１２０２は、ＳＶＰ１１１と通信するＩ／Ｆと、管理サーバ１００と通信するＩ／Ｆと、ＩＯデバイス１１６～１１８の少なくとも１つと通信するＩ／Ｆとを含んでよい。

　１以上の物理メモリ１２０３が、ハイパバイザ２０４を記憶する。ハイパバイザ２０４は、仮想化機構の一例である。ハイパバイザ２０４は、１以上の物理ＣＰＵ１２０１のうちの少なくとも１つに実行されることにより、物理リソースを複数の物理リソース部分に論理的に分割し、複数の物理リソース部分をそれぞれ複数（例えば３つ）のＬＰＡＲ２１１～２１３に割り当てることができる。物理リソース部分は、例えば少なくとも１つの物理ＣＰＵと少なくとも１つの物理メモリとを含む。

　図２は、現用系サーバブレード１１４の論理構成と第１管理データの構成とを示す。

　第１管理データは、複数の現用系サーバブレード１１３～１１５にそれぞれ対応した複数のサーバデータを含む。各サーバデータは、そのサーバデータに対応したサーバブレードのＬＰＡＲ構成を表すＬＰＡＲ構成データと、そのサーバデータに対応したサーバブレードのＮＵＭＡ構成を表すＮＵＭＡ構成データとを有する。サーバデータ２０１は、現用系サーバブレード１１４に対応し、故に、サーバデータ２０１内のＬＰＡＲ構成データ２０２及びＮＵＭＡ構成データ２０３は、現用系サーバブレード１１４に対応する。

　現用系サーバブレード１１４において、ハイパバイザ２０４は、ＳＶＰ－Ｉ／Ｆ部２０８と、ＬＰＡＲ構成テーブル２０５と、ＮＵＭＡ構成テーブル２０６と、構成管理部２０７とを有する。ＳＶＰ－Ｉ／Ｆ部２０８は、ＳＶＰ１１１とのインタフェースを制御する。構成管理部２０７は、ＬＰＡＲ２１１～２１３及び物理リソースの構成を管理したり、物理リソースを複数の物理リソース部分に論理的に分割し複数の物理リソース部分をそれぞれ複数のＬＰＡＲ２１１～２１３に割り当てたり、物理メモリ上にＬＰＡＲ構成テーブル２０５及びＮＵＭＡ構成テーブル２０６を格納したりする。これらのテーブル２０５及び２０６は、ＳＶＰ―ＩＦ部２０８を介して、ＳＶＰ１１１の記憶デバイス１１２に出力する。サーバデータ２０１内のＬＰＡＲ構成データ２０２及びＮＵＭＡ構成データ２０３は、それぞれ、ＬＰＡＲ構成テーブル２０５及びＮＵＭＡ構成テーブル２０６の出力結果である。ＬＰＡＲ構成テーブル２０５及びＮＵＭＡ構成テーブル２０６の各々の出力は、そのテーブルが更新される都度に行われてもよいし定期的に行われてもよい。

　ＬＰＡＲ２１１～２１３は、それぞれ、論理ＮＵＭＡ構成２１４～２１６を有する。なぜなら、ＬＰＡＲ２１１～２１３の各々に割り当てられた物理リソース部分は、ＮＵＭＡ構成が定義された物理リソースから分割された部分だからである。物理リソース部分に基づく論理リソース（論理ＣＰＵ及び論理メモリ等）をＬＰＡＲが有する。ＬＰＡＲ２１１は、現用系サーバブレード１１４に対応したＩＯデバイス１１６が記憶する複数のＯＳのうち、ＬＰＡＲ２１１に対応するＯＳを実行する。

　図３は、ＬＰＡＲ移行処理の流れの一例を示す。予備系サーバブレード１２４及び１２５のいずれの電源もオフ状態であるとする。

　例えば現用系サーバブレード１１４で障害が発生した場合（ステップ３００）、ＳＶＰ１１１が、現用系サーバブレード１１４の障害を検出し（ステップ３１０）、現用系サーバブレード１１４の障害を管理サーバ１００に通知する（ステップ３１１）。現用系サーバブレード１１４の障害が原因でＬＰＡＲ移行が行われる場合、現用系サーバブレード１１４で実行される全てのＬＰＡＲ２１１～２１３が移行対象である。

　管理サーバ１００は、現用系サーバブレード１１４の障害の通知を受けた場合、ＳＶＰ１１１に切替え要求（ＬＰＡＲ移行要求）を送信する（ステップ３２０）。

　切替え要求を受けたＳＶＰ１１１は、現用系サーバブレード１１４（障害サーバ）に対応したサーバデータ２０１を取得し、サーバデータ２０１を、予備系サーバシャーシ１２０内のＳＶＰ１２１に送信する（ステップ３１２）。ＳＶＰ１１１は、現用系サーバブレード１１４の電源を遮断する（ステップ３１３）。

　ＳＶＰ１２１は、サーバデータ２０１を受信し（ステップ３３０）、サーバデータ２０１を記憶デバイス１２２に格納する（ステップ３３１）。ＳＶＰ１２１は、予備系サーバブレード１２４及び１２５のうちの１つの予備系サーバブレード１２４の電源を投入する（ステップ３３２）。

　予備系サーバブレード１２４の電源が投入されると、予備系サーバブレード１２４において、ハイパバイザがロードされ（ステップ３４１）、ハイパバイザが起動する（ステップ３４２）。ハイパバイザは、予備系サーバブレード１２４の物理構成を特定する（ステップ３４３）。ステップ３４３は、例えば後述の図６のテーブルの参照でよい。ハイパバイザ（例えば構成管理部）は、現用系サーバブレード１１４（障害サーバ）に対応したサーバデータ２０１をＳＶＰ１２１から取得する（ステップ３４４）。ハイパバイザ（例えば構成管理部）は、ステップ３４３で特定した物理構成と、ステップ３４４で取得したサーバデータ２０１とを基に、リソース割当て制御を行う（ステップ３４５）。リソース割当て制御の詳細は、図８～図１０が示す。ハイパバイザ（例えば構成管理部）は、ステップ３４５において物理リソース部分が割り当てられたＬＰＡＲを起動する（ステップ３４６）。

　図４は、現用系サーバブレード１１４のＬＰＡＲ構成テーブル２０５の一例を示す。他のサーバブレード（現用系及び予備系の両方）のＬＰＡＲ構成テーブルも同様の構成である。

　現用系サーバブレード１１４内のＬＰＡＲ毎にレコードを有し、レコードは、ＬＰＡＲ番号４００、ＣＰＵ構成４１０、ノード係数４１３、メモリ構成４２０及び処理タイプ４３０を有する。以下、１つのＬＰＡＲを例に取り（図４の説明において「対象ＬＰＡＲ」と言う）、これらの項目を説明する。

　ＬＰＡＲ番号４００は、対象ＬＰＡＲの番号を表す。ノード係数４１３は、ノードアクセス値の一例であり、対象ＬＰＡＲに割り当てられた物理ＣＰＵのうち対象となるノードに属する物理ＣＰＵのメモリアクセス（例えばアクセス性能）に関する数値である。本実施形態の説明では、その数値を便宜上「ノード係数」と呼ぶ。ノード係数４１３が小さいほど、メモリアクセス性能が高い。なお、「ノード」とは、サーバブレード（ここでは現用系サーバブレード１１４）で定義されたオブジェクトであり、物理ＣＰＵと物理メモリの組である。

　ＣＰＵ構成４１０は、ノード番号４１１及び個数４１２で構成されている。ノード番号４１１は、対象ＬＰＡＲに割り当てられている物理ＣＰＵが属するノードの番号を表し、個数４１２は、そのノードに属する物理ＣＰＵの数を表す。すなわち、ＣＰＵ構成４１０は、対象ＬＰＡＲにどのノードに属する幾つの物理ＣＰＵが割り当てられているかを表す。

　メモリ構成４２０は、ノード番号４２１及び個数４２２で構成されている。ノード番号４２１は、対象ＬＰＡＲに割り当てられている物理メモリが属するノードの番号を表し、個数４２２は、そのノードに属する物理メモリの数を表す。すなわち、メモリ構成４２０は、対象ＬＰＡＲにどのノードに属する幾つの物理メモリが割り当てられているかを表す。

　対象ＬＰＡＲの論理ＮＵＭＡ構成は、対象ＬＰＡＲのＣＰＵ構成４１０及びメモリ構成４２０の組合せに従う構成、すなわち、対象ＬＰＡＲに、どのノードに属する幾つの物理ＣＰＵが割り当てられており、且つ、どのノードに属する幾つの物理メモリが割り当てられているかでよい。

　処理タイプ４３０は、移行ポリシーの一例であり、移行先である予備系サーバブレードでの対象ＬＰＡＲの処理のタイプを表す。「ｓｔｒｉｃｔ」は、現用系サーバブレードでの論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を予備系サーバブレードにおいて実現できなければ対象ＬＰＡＲの移行を中止するタイプである。「ｍｉｄ」は、予備系サーバブレードにおいて、対象ＬＰＡＲのノード毎のノード係数が現用系サーバブレードでのノード係数以下となるような論理ＮＵＭＡ構成を構築するタイプである。すなわち、「ｍｉｄ」は、現用系サーバブレードでの論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を予備系サーバブレードにおいて実現する必要は無いが、現用系サーバブレードでの性能と同等の性能を予備系サーバブレードにおいて実現することが望まれるタイプである。「loose」は、現用系サーバブレードでの論理ＮＵＭＡ構成に依存せず対象ＬＰＡＲを移行できればよいタイプである。従って、予備系サーバブレードでの対象ＬＰＡＲの論理ＮＵＭＡ構成は、現用系サーバブレードでの論理ＮＵＭＡ構成と同じであることもあれば違うこともあり、また、予備系サーバブレードでの対象ＬＰＡＲについて、ノード毎のノード係数が、現用系サーバブレードでのノード係数以下であることもあれば当該ノード係数を超えていることもある。

　対象ＬＰＡＲについて、ノード毎のノード係数４１３は、１つのノードを例に取れば（以下、この段落において「対象ノード」と言う）、以下の通りである。すなわち、対象ＬＰＡＲについて対象ノードのノード係数は、対象ノードに属する物理ＣＰＵからアクセス先ノード（対象ノード又は別ノード）に属する物理メモリへのアクセスに関する数値と、対象ノードに属する全ての物理ＣＰＵとアクセス先ノードに属する全ての物理メモリとの組合せ数（アクセスパターン数）とに基づいてハイパバイザにより算出される（管理サーバ又はＳＶＰ等、他のモジュールにより算出されてもよい）。「物理メモリへのアクセスに関する数値」は、物理メモリへのアクセスの性能及び発生率のうちの少なくとも１つに基づく数値でよい。対象ノードの物理ＣＰＵについてのノード係数Ｋ_ｎは、例えば下記の「数１」により算出することができる。ここで、ｎは、ＣＰＵノード番号（物理ＣＰＵが属するノードの番号）である。ｍは、メモリノード番号（物理メモリが属するノードの番号）である。Ｒ_ｎｍは、対象ノード内の物理ＣＰＵからアクセス先ノード内の物理メモリへのアクセスの性能に関する数値、具体的には図１１に例示するＲ_ｎｍテーブル１１００から特定された数値である。Ｒ_ｎｍテーブル１１００は、例えばハイパバイザ２０４に保持される。Ｒ_ｎｍが低いほどアクセス性能が高い（アクセス速度が速い）。Ｒ_ｎｍテーブル１１００によれば、対象ノードとアクセス先ノードが同一ノードであればアクセス性能が高く、対象ノードとアクセス先ノードが異なるノードであればアクセス性能が低い（アクセス速度が遅い）。また、対象ノードとアクセス先ノードが異なるノードであっても、対象ノードとアクセス先ノード間が近い程アクセス性能が高い。本実施形態では、ノード＃０とノード＃３が最も離れており、ノード＃０～＃３は、ノード＃０－ノード＃１－ノード＃２－ノード＃３のように直列に並んでいるものとする。なお、ノード間の距離や並びは論理的なものでよい。Ｃ_ｎｍは、対象ＬＰＡＲについて対象ノード内の物理ＣＰＵとアクセス先ノード内の物理メモリとの組合せ数、具体的には、対象ＬＰＡＲについての対象ノード内の物理ＣＰＵの数と対象ＬＰＡＲについてのアクセス先ノード内の物理メモリの数との積である。

　「数１」によれば、例えば、ＬＰＡＲ＃１（ＬＰＡＲ番号「１」のＬＰＡＲ）のノード＃０（ノード番号「０」のノード）について、ノード係数Ｋ_０が下記の通りとなる。図４のＬＰＡＲ構成テーブル２０５によれば、ＬＰＡＲ＃１に、ノード＃０の１個の物理ＣＰＵ及び１個の物理メモリが割り当てられており、ノード＃１の１個の物理ＣＰＵと１個の物理メモリが割り当てられており、ノード＃２及び＃３のいずれについても物理ＣＰＵ及び物理メモリのいずれも割り当てられていない。
ＬＰＡＲ＃１のＫ_０
＝１（＝Ｒ_００）×１（＝Ｃ_００）＋１．１（＝Ｒ_０１）×１（＝Ｃ_０１）
＝２．１

　また、「数１」によれば、例えば、ＬＰＡＲ＃２のノード＃０について、ノード係数Ｋ０が下記の通りとなる。図４のＬＰＡＲ構成テーブル２０５によれば、ＬＰＡＲ＃２に、ノード＃０～＃３の各々について、２個の物理ＣＰＵ及び１個の物理メモリが割り当てられている。
ＬＰＡＲ＃２のＫ_０
＝１（＝Ｒ_００）×２（＝Ｃ_００）＋１．１（＝Ｒ_０１）×２（＝Ｃ_０１）＋１．２（＝Ｒ_０２）×２（＝Ｃ_０２）＋１．３（＝Ｒ_０１）×２（＝Ｃ_０３）
＝９．２

　現用系サーバブレード１１４におけるＬＰＡＲ構成テーブル２０５は、ユーザ（例えば管理者）により予め定義されていてよい。一方、予備系サーバブレードでは、図３ステップ３４５（図８～図１０の処理）により、その予備系サーバブレードに対応したＬＰＡＲ構成テーブルが、その予備系サーバブレード内のハイパバイザにより生成される。

　図５は、現用系サーバブレード１１４のＮＵＭＡ構成テーブル２０６の一例を示す。他のサーバブレード（現用系及び予備系の両方）のＮＵＭＡ構成テーブルも同様の構成である。但し、レコードの数（サーブレードに定義されているノード（ＮＵＭＡノード）の数）、及び、１つのレコード内のサブレコードの数（１つのノードに属する物理ＣＰＵの数、及び、１つのノードに属する物理メモリの数）は、サーバブレードによって異なることがある。

　現用系サーバブレード１１４内のノード毎にレコードを有し、レコードは、ノード番号５００、ＣＰＵ構成５１０及びメモリ構成５２０を有する。以下、１つのノードを例に取り（図５の説明において「対象ノード」と言う）、これらの項目を説明する。

　ノード番号５００は、対象ノードの番号を表す。

　ＣＰＵ構成５１０は、ＣＰＵ番号５１１及びＬＰＡＲ番号５１２で構成されている。ＣＰＵ番号５１１は、対象ノードに属する物理ＣＰＵの番号を表し、ＬＰＡＲ番号５１２は、その物理ＣＰＵが割り当てられているＬＰＡＲの番号を表す。

　メモリ構成５２０は、メモリ番号５２１及びＬＰＡＲ番号５２２で構成されている。メモリ番号５２１は、対象ノードに属する物理メモリの番号を表し、ＬＰＡＲ番号５２２は、その物理メモリが割り当てられているＬＰＡＲの番号を表す。

　上述したように、対象ノード内の物理ＣＰＵからアクセス先ノード内の物理メモリへのアクセスは、対象ノードとアクセス先ノードが同一ノードであれば早く、対象ノードとアクセス先ノードが異なるノードであれば遅い。

　以下、図８～図１０を参照して、図３のステップ３４５を詳細に説明する。

　なお、図３のステップ３１２で、現用系サーバブレード１１４のサーバデータ２０１がＳＶＰ１１１からＳＶＰ１２１に送信され、ステップ３３０で、ＳＶＰ１２１によりそのサーバデータ２０１が受信され、ステップ３３１で、そのサーバデータ２０１がＳＶＰ１２１の記憶デバイス１２２に格納され、ステップ３４４で、そのサーバデータ２０１内のＬＰＡＲ構成データ２０２及びＮＵＭＡ構成データ２０３が、移行元のＬＰＡＲ構成テーブル及び移行元のＮＵＭＡ構成テーブルとして、移行先の予備系サーバブレード１２４のハイパバイザ（以下、移行先ハイパバイザ）に設定されたとする。なお、現用系サーバブレード（移行元サーバブレード）１１４のＮＵＭＡ構成等は、上述した方法以外の方法で移行先ハイパバイザへと引き継がれてもよい。

　また、移行先の予備系サーバブレード１２４のＮＵＭＡ構成テーブルは、例えば図６に示すＮＵＭＡ構成テーブル６０６であるとする。ＮＵＭＡ構成テーブル６０６の構成は、図５のＮＵＭＡ構成テーブル２０６と同じである。つまり、項目６００、６１０、６２０、６１１、６１２、６２１及び６２２は、それぞれ、項目５００、５１０、５２０、５１１、５１２、５２１及び５２２と同じである。予備系サーバブレード１２４のＮＵＭＡ構成と移行元の現用系サーバブレード１１４のＮＵＭＡ構成は、同じであることもあるが、図５及び図６の例によれば異なっている。具体的には、例えば、予備系サーバブレード１２４と現用系サーバブレード１１４において、物理ＣＰＵの数と、物理ＣＰＵとノードとの対応関係と、物理メモリの数は、同じであるが、物理メモリとノードとの対応関係が異なっている。また、図６のＮＵＭＡ構成テーブル６０６は、ステップ３４５の開始前のテーブルであり、故に、ＮＵＭＡ構成（ノード、物理ＣＰＵ及び物理メモリの対応関係）が表されているものの、物理リソースエレメント（物理ＣＰＵ及び物理メモリ）の割当て先のＬＰＡＲの番号は登録されていない。

　図８に示すように、移行先ハイパバイザは、移行元ＬＰＡＲ構成テーブルを基に、移行対象のＬＰＡＲ＃１～＃３を特定し、特定したＬＰＡＲ＃１～＃３の各々について、割当て制御（予備系サーバブレード１２４の物理リソース部分をＬＰＡＲに割り当てる処理）を行う（ステップ８０３）。ステップ８０３は、処理タイプ「strict」のＬＰＡＲについてまず行われ、次に、処理タイプ「mid」のＬＰＡＲについて行われ、最後に、処理タイプ「loose」のＬＰＡＲについて行われる。最初に「strict」のＬＰＡＲについてステップ８０３が行われる理由は、先に他の処理タイプのＬＰＡＲについてステップ８０３が行われてしまうと、移行元のサーバブレードでの論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を実現できる可能性が低くなるからである。また、最後に「loose」のＬＰＡＲについてステップ８０３が行われる理由は当該ＬＰＡＲの論理ＮＵＭＡ構成についての条件が全ての処理タイプのうち最も緩いからである。従って、図４の例によれば、ＬＰＡＲ＃１→ＬＰＡＲ＃２→ＬＰＡＲ＃３の順でステップ８０３が行われる。

　図９及び図１０は、ステップ８０３の詳細を示す。以下、ＬＰＡＲ＃１～＃３の各々について、ステップ８０３の詳細を説明する。ステップ８０３は、移行先ハイパバイザ（特に例えば構成管理部）により行われる。

　＜ＬＰＡＲ＃１についてのステップ８０３＞

　図９に示すように、移行先ハイパバイザは、移行元ＬＰＡＲ構成テーブルからＬＰＡＲ＃１の論理ＮＵＭＡ構成を特定し、その論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を予備系サーバブレード１２４においてＬＰＡＲ＃１に割り当てることが可能か否かを、ＮＵＭＡ構成テーブル６０６を基に判断する（ステップ９００）。この判断結果が肯定であれば、その同じ論理ＮＵＭＡ構成がＬＰＡＲ＃１に割り当てられることになるが（ステップ９１１）、図４及び図６の例によれば、ステップ９００の判断結果は否定となる。なぜなら、移行元ではノード＃０の物理メモリがＬＰＡＲ＃１に割り当てられていたが、ＮＵＭＡ構成テーブル６０６によれば、ノード＃０に属する物理メモリが無いからである。

　ステップ９００の判断結果が否定の場合（ステップ９００：Ｎｏ）、移行先ハイパバイザは、ＬＰＡＲ＃１の処理タイプが「strict」であるので（ステップ９０２：Ｙｅｓ）、ＬＰＡＲ＃１について移行を中止し、失敗を管理サーバ１００に報告する（ステップ９０３）。その報告は、ＳＶＰ１２１に送られ、ＳＶＰ１２１から管理サーバ１００に送られてもよい。また、割当ての失敗なので、ＮＵＭＡ構成テーブル６０６は更新されない。

　＜ＬＰＡＲ＃２についてのステップ８０３＞

　図９に示すように、移行先ハイパバイザは、移行元ＬＰＡＲ構成テーブルからＬＰＡＲ＃２の論理ＮＵＭＡ構成を特定し、その論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を予備系サーバブレード１２４においてＬＰＡＲ＃１に割り当てることが可能か否かを、ＮＵＭＡ構成テーブル６０６を基に判断する（ステップ９００）。図４及び図６の例によれば、ＬＰＡＲ＃１と同じ理由で、この判断結果も否定となる。

　ステップ９００の判断結果が否定の場合（ステップ９００：Ｎｏ）、移行先ハイパバイザは、ＬＰＡＲ＃２の処理タイプが「mid」であるので（ステップ９０２：Ｎｏ、且つ、ステップ９０４：Ｙｅｓ）、図１０のステップ９１０以降を行う。

　すなわち、移行先ハイパバイザは、ｎ（ＣＰＵノード番号）「０」を設定し（ステップ９１０）、ＬＰＡＲ＃２のノード＃０に対応したノード係数「９．２」を移行元ＬＰＡＲ構成テーブルから特定する（ステップ９１１）。ステップ９１１で特定されたノード係数が、閾値ノード係数である。そして、移行先ハイパバイザは、閾値ノード係数「９．２」以下のノード係数となるような割当てが予備系サーバブレード１２４においてＬＰＡＲ＃２のノード＃０について可能か否かを判断する（ステップ９１２）。この判断では、例えば、移行先ハイパバイザは、以下の処理、
（Ａ）移行元と同じノード番号「０」から移行元と同じ数「２」の物理ＣＰＵを割り当て候補とする、
（Ｂ）（Ａ）のノード番号のノードから最も近いノードであり物理メモリを有するノードからそのノードが有する全ての物理メモリのうち未だＬＰＡＲに割り当てていないものを割り当て候補とする、
（Ｃ）（Ａ）での物理ＣＰＵ数及びＣＰＵノード番号と、（Ｂ）での物理メモリ数及びメモリノード番号と、図１１のＲ_ｎｍテーブルとを基に、「数１」を用いて、（Ａ）及び（Ｂ）でのノード係数を算出する、
（Ｄ）（Ｃ）で算出したノード係数が閾値ノード係数以下か否かを判断する、
（Ｅ）（Ｄ）の判断結果が肯定であれば、（Ａ）及び（Ｂ）に従う論理ＮＵＭＡ構成を割り当て対象と決定する、
（Ｆ）（Ｄ）の判断結果が否定であれば、ノード番号を、（Ａ）で決定したノード番号の次のノード番号に変更し、（Ａ）を再度行う、
を行う。これにより、例えば、予備系サーバブレード１２４において、ノード＃０の２個の物理ＣＰＵを割当て候補とし、物理メモリを有するノードのうちノード＃０から一番近いノード＃２の全て（４個）の物理メモリを割当て候補とすると、算出されるノード係数は「９.６」になり、閾値ノード係数「９.２」より大きい。そのため、その割当ては不採用とし、次に、移行先ハイパバイザは、ノード＃１の２個の物理ＣＰＵとノード＃２の４個の物理メモリを割り当て候補とし、それによりノード係数「８.８」を算出する。その算出ノード係数「８.８」は、閾値ノード係数「９.２」以下であるので、ノード＃１の２個の物理ＣＰＵとノード＃２の４個の物理メモリが割り当て対象に決定される。このように、対象とされたノードから最も近いノード（対象とされたノードのノード番号に最も近いノード番号のノード）から順次物理ＣＰＵ及び物理メモリを選択するシンプルな処理ステップにより、移行先の構成決定にかかる処理時間を短く抑えることが期待できる。

　移行先ハイパバイザは、決定した割当て対象を、ＬＰＡＲ＃２に割り当て、且つ、ノード＃１の２個の物理ＣＰＵとノード＃２の４個の物理メモリのそれぞれの割当て先としてＬＰＡＲ番号「２」をＮＵＭＡ構成テーブル６０６に登録する（図７の参照符号７３０及び７４０が表す数値の登録）（ステップ９１３）。

　次に、移行先ハイパバイザは、ｎ＝ｎ＋１（＝１）とし（ステップ９１４）、更新後のｎ＝１は最大ノード番号（ノード数－１）（＝３）以下なので（ステップ９１５：Ｙｅｓ）、更新後のｎ（ノード＃１）について、ステップ９１１を行う。

　ステップ９１１～９１５によれば、例えば、ノード＃１について、算出ノード係数が閾値ノード係数「８．８」以下となるような割り当て候補（ノード＃１の残りの２個の物理ＣＰＵとノード＃２の４個の物理メモリ、算出ノード係数は「８．８」）が決定され、その候補が割り当て対象としてＬＰＡＲ＃２に割り当てられる（図７の参照符号７３１が表す数値の登録）。ノード＃２について、算出ノード係数が閾値ノード係数「８．８」以下となるような割り当て候補（ノード＃２の２個の物理ＣＰＵとノード＃２の４個の物理メモリ、算出ノード係数は「８．０」）が決定され、その候補が割り当て対象としてＬＰＡＲ＃２に割り当てられる（図７の参照符号７３２が表す数値の登録）。ノード＃３について、算出ノード係数が閾値ノード係数「９．２」以下となるような割り当て候補（ノード＃２の残りの２個の物理ＣＰＵとノード＃２の４個の物理メモリ、算出ノード係数は「８．０」）が決定され、その候補が割り当て対象としてＬＰＡＲ＃２に割り当てられる（図７の参照符号７３３が表す数値の登録）。ｎ＝３のときにステップ９１４が行われると、ステップ９１５の判断結果が否定となり、ＬＰＡＲ＃２についてのステップ８０３が終了する。

　なお、ステップ９１２の判断結果が否定の場合（ステップ９１２：Ｎｏ）、すなわち、ステップ９１２の条件を満たすような論理ＮＵＭＡ構成の確保が不可能な場合、移行先ハイパバイザは、ＬＰＡＲ＃２についてのこれまでの割当てをキャンセルし（図７の参照符号７３０、７４０等が表す数値（登録された数値）を削除し）、図９のステップ９０５を実行する。ステップ９０５では、移行先ハイパバイザは、ＬＰＡＲ＃２に少なくとも１つの物理ＣＰＵと少なくとも１つの物理メモリを割り当てる。

　処理タイプ「mid」のＬＰＡＲの移行によれば、移行元での論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を移行先で採用することができなくても、移行元でのアクセス性能と同等のアクセス性能を移行先でも実現できるような論理ＮＵＭＡ構成が特定され移行対象のＬＰＡＲに移行先において割り当てられる。これにより、移行前と同等の性能でＬＰＡＲが稼働することを可能にし、予期しない性能低下の発生を防ぐことが期待できる。

　＜ＬＰＡＲ＃３についてのステップ８０３＞

　図９に示すように、移行先ハイパバイザは、移行元ＬＰＡＲ構成テーブルからＬＰＡＲ＃３の論理ＮＵＭＡ構成を特定し、その論理ＮＵＭＡ構成と同じ論理ＮＵＭＡ構成を予備系サーバブレード１２４においてＬＰＡＲ＃３に割り当てることが可能か否かを、ＮＵＭＡ構成テーブル６０６を基に判断する（ステップ９００）。図４、図６及び図７の例によれば、この判断結果は否定となる。なぜなら、移行元ではノード＃２の物理メモリがＬＰＡＲ＃３に割り当てられていたが、図７のＮＵＭＡ構成テーブル６０６によれば、ノード＃２に属する物理メモリは全て既にＬＰＡＲ＃２に割り当て済であり、ノード＃２には割当て可能な物理メモリが無いからである。

　ステップ９００の判断結果が否定の場合（ステップ９００：Ｎｏ）、移行先ハイパバイザは、ＬＰＡＲ＃３の処理タイプが「loose」であるので（ステップ９０２：Ｎｏ、且つ、ステップ９０４：Ｎｏ）、ステップ９０５を実行する。ステップ９０５では、移行先ハイパバイザは、ＬＰＡＲ＃３に少なくとも１つの物理ＣＰＵと少なくとも１つの物理メモリを割り当てる。その結果、例えば図７に示すように、ノード＃０の２個の物理ＣＰＵとノード＃３の２個の物理メモリがＬＰＡＲ＃３に割り当てられる（図７の参照符号７４２及び７４１参照）。

　移行先ハイパバイザは、移行元ＬＰＡＲ構成テーブルと、全てのＬＰＡＲについてステップ８０３を行なった後のＮＵＭＡ構成テーブル６０６とを基に、予備系サーバブレード１２４でのＬＰＡＲ構成テーブルを生成し保持する。移行先ハイパバイザは、論理ＮＵＭＡ構成が割り当てられたＬＰＡＲを起動することができる。

　以上、一実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲をこの実施形態にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。例えば、処理タイプは、strict、mid、looseの３タイプより多くても少なくてもよい。また、例えば、上記実施形態では、移行元サーバブレードと移行先サーバブレードにおいて、ノード数（ＮＵＭＡノード数）が同じ（いずれも４つのノード）であるが、ノード数は異なっていてもよい。

１１３、１１４、１１５：現用系サーバブレード
１２４、１２５：予備系サーバブレード

Claims

　複数のＮＵＭＡ（Non-Uniform　Memory　Access）ノードに対応付けられる複数の第１ＣＰＵと、前記複数のＮＵＭＡノードに対応付けられる複数の第１メモリと、前記複数の第１ＣＰＵ及び前記複数の第１メモリを複数の仮想計算機へ割り当てる第１仮想化機構とを有する第１物理計算機から、前記複数の仮想計算機のうちの移行対象である第１仮想計算機が移行される第２物理計算機であって、
　複数のＮＵＭＡノードに対応付けられる複数の第２ＣＰＵと、
　前記複数のＮＵＭＡノードに対応付けられる複数の第２メモリと、
　前記複数の第２ＣＰＵ及び前記複数の第２メモリを管理する第２仮想化機構と
を有し、
　前記第２仮想化機構は、前記第１仮想計算機について、
　　前記第１仮想計算機と第１ＣＰＵと第１メモリとＮＵＭＡノードとの対応関係を表す情報であるＮＵＭＡ構成情報を基に、前記第１仮想計算機に割り当てられている第１ＣＰＵから前記第１仮想計算機に割り当てられている物理メモリへのアクセスに関する値であるノードアクセス値を、前記第１仮想計算機に割り当てられている物理ＣＰＵが属する各ＮＵＭＡノードについて特定し、
　　特定したノードアクセス値を基に、前記第１仮想計算機に第２ＣＰＵ及び第２メモリを割り当てる、
物理計算機。
　前記第２仮想化機構は、前記第１仮想計算機についてノードアクセス値が特定されたＮＵＭＡノード毎に、特定されたノードアクセス値に基づく条件を満たすようなノードアクセス値となる第２ＣＰＵ及び第２メモリを特定し、特定した第２ＣＰＵ及び第２メモリを前記第１仮想計算機に割り当てる、
請求項１記載の物理計算機。
　前記第１物理計算機について、ＮＵＭＡノードのノードアクセス値は、そのＮＵＭＡノードに属する第１ＣＰＵからアクセス先ノード内の第１メモリへのアクセスに関する値であるアクセス値と、そのＮＵＭＡノードに属する全ての第１ＣＰＵとアクセス先ノードに属する全ての第１メモリとの組合せ数とに基づく値であり、
　前記第２物理計算機について、ＮＵＭＡノードのノードアクセス値は、そのＮＵＭＡノードに属する第２ＣＰＵからアクセス先ノード内の第２メモリへのアクセスに関する値であるアクセス値と、そのＮＵＭＡノードに属する全ての第２ＣＰＵとアクセス先ノードに属する全ての第２メモリとの組合せ数とに基づく値である、
請求項２記載の物理計算機。
　前記アクセス値及び前記組合せ数は、ＮＵＭＡノードの複数のアクセス先ノードの各々について存在し、前記複数のアクセス先ノードは、ＮＵＭＡノード及びそのＮＵＭＡノード以外のＮＵＭＡノードであり、
　ＮＵＭＡノードであるアクセス先ノードに対応したアクセス値は、そのＮＵＭＡノード以外のいずれかのＮＵＭＡノードであるアクセス先ノードに対応したアクセス値が意味するアクセス性能よりも高いアクセス性能を意味する、
請求項３記載の物理計算機。
　前記複数の仮想計算機は、前記第１仮想計算機を含む２以上の仮想計算機を移行対象の仮想計算機として含み、
　前記第２仮想化機構は、前記２以上の仮想計算機のうち、割り当て対象とする第２ＣＰＵ及び第２メモリに関する条件が最も厳しい移行ポリシーの仮想計算機から、優先的に、割り当てる第２ＣＰＵ及び第２メモリを特定する、
請求項１記載の物理計算機。
　複数のＮＵＭＡ（Non-Uniform　Memory　Access）ノードに対応付けられる複数の第１ＣＰＵと、前記複数のＮＵＭＡノードに対応付けられる複数の第１メモリと、前記複数の第１ＣＰＵ及び前記複数の第１メモリを複数の仮想計算機へ割り当てる第１仮想化機構とを有する第１物理計算機から、前記複数の仮想計算機のうちの移行対象である第１仮想計算機を、複数のＮＵＭＡノードに対応付けられる複数の第２ＣＰＵと、前記複数のＮＵＭＡノードに対応付けられる複数の第２メモリと、前記複数の第２ＣＰＵ及び前記複数の第２メモリを管理する第２仮想化機構とを有する第２物理計算機に移行する仮想計算機移行方法であって、
　前記第１仮想計算機と第１ＣＰＵと第１メモリとＮＵＭＡノードとの対応関係を表す情報であるＮＵＭＡ構成情報を基に、前記第１仮想計算機に割り当てられている第１ＣＰＵから前記第１仮想計算機に割り当てられている物理メモリへのアクセスに関する値であるノードアクセス値を、前記第１仮想計算機に割り当てられている物理ＣＰＵが属する各ＮＵＭＡノードについて特定し、
　特定したノードアクセス値を基に、前記第１仮想計算機に第２ＣＰＵ及び第２メモリを割り当てる、
仮想計算機移行方法。
　第１物理計算機と、
　第２物理計算機と
を有し、
　前記第１物理計算機は、複数のＮＵＭＡ（Non-Uniform　Memory　Access）ノードに対応付けられる複数の第１ＣＰＵと、前記複数のＮＵＭＡノードに対応付けられる複数の第１メモリと、前記複数の第１ＣＰＵ及び前記複数の第１メモリを複数の仮想計算機へ割り当てる第１仮想化機構とを有し、
　前記第２物理計算機は、複数のＮＵＭＡノードに対応付けられる複数の第２ＣＰＵと、前記複数のＮＵＭＡノードに対応付けられる複数の第２メモリと、前記複数の第２ＣＰＵ及び前記複数の第２メモリを管理する第２仮想化機構とを有し、
　前記第２仮想化機構が、前記複数の仮想計算機のうちの移行対象であり前記第１物理計算機から前記第２物理計算機に移行される第１仮想計算機について、
　　前記第１仮想計算機と第１ＣＰＵと第１メモリとＮＵＭＡノードとの対応関係を表す情報であるＮＵＭＡ構成情報を基に、前記第１仮想計算機に割り当てられている第１ＣＰＵから前記第１仮想計算機に割り当てられている物理メモリへのアクセスに関する値であるノードアクセス値を、前記第１仮想計算機に割り当てられている物理ＣＰＵが属する各ＮＵＭＡノードについて特定し、
　　特定したノードアクセス値を基に、前記第１仮想計算機に第２ＣＰＵ及び第２メモリを割り当てる、
計算機システム。