JP5856925B2 - 計算機システム - Google Patents

計算機システム Download PDF

Info

Publication number
JP5856925B2
JP5856925B2 JP2012181989A JP2012181989A JP5856925B2 JP 5856925 B2 JP5856925 B2 JP 5856925B2 JP 2012181989 A JP2012181989 A JP 2012181989A JP 2012181989 A JP2012181989 A JP 2012181989A JP 5856925 B2 JP5856925 B2 JP 5856925B2
Authority
JP
Japan
Prior art keywords
hba
logical
key information
virtual machine
assigned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012181989A
Other languages
English (en)
Other versions
JP2014041395A (ja
Inventor
典充 早川
典充 早川
栄一郎 大岩
栄一郎 大岩
ゆかり 八田
ゆかり 八田
三木 博史
博史 三木
拓司 寺屋
拓司 寺屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012181989A priority Critical patent/JP5856925B2/ja
Priority to US13/956,411 priority patent/US9134915B2/en
Publication of JP2014041395A publication Critical patent/JP2014041395A/ja
Application granted granted Critical
Publication of JP5856925B2 publication Critical patent/JP5856925B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0625Power saving in storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ある物理計算機上で動作中の仮想計算機もしくは論理区画を物理的に異なる計算機上に移動する計算機システムに関する。
一つの物理計算機上に、複数の論理区画(以降、LPAR(Logical PARtition)と記す)を構築し、各LPARをそれぞれ個別の仮想的な計算機と見なし、その上でOS(オペレーティングシステム)を動作させることが可能な仮想計算機システムが実用化されている。これにより、一つの物理的な計算機を複数の独立した計算機として動作させることが可能となる。本技術は、サーバの遊休リソースの活用や、サーバの運転に要する電力の削減などTCOの削減の効果がある。
当該論理分割された計算機(もしくは仮想計算機)からのI/O要求を実現する方式として、仮想計算機上のOS(以降、ゲストOSと記す)から発行されるI/Oをハイパーバイザが一旦受け付け、ハイパーバイザが動作しているOSや、別の代理実行専用に設けられたOSを経由して再度実行し直す方式(以降、I/Oエミュレーション方式と記す)と、ゲストOSから直接物理I/Oデバイスに対しI/O実行を要求する方式(以降、I/Oパススルー方式と記す)とがある。
I/Oパススルー方式でのLPARマイグレーション処理に関して、特許文献1では、移動対象の仮想計算機に割り当てられているFC−HBA(Fibre Channel−Host Bus Adapter)のWorld Wide Name(以降WWNと記す)を移動先のLPARに引き継ぐことで移動先のLPARからも同一の論理ユニット(LU:Logical Unit)へのアクセス権を継承できるようにしている。なお、当該方式は、ゲストOSがシャットダウン中に物理計算機を移動するシャットダウン方式のLPARマイグレーションに関する解決方法である。
特開2008−299509号公報
仮想計算機を異なる物理計算機間で移動させるマイグレーションの方式のうち、ハイパーバイザ上のゲストOSを稼動させた状態のまま移動させ、移動先の物理計算機上でも対象のゲストOSを継続動作可能な状態にしておく移動方式を、ライブマイグレーションと呼ぶ。ライブマイグレーションによって、ゲストOSからのLUへのアクセスパスは移動元の物理計算機に搭載されている物理デバイスを使用するパスから、移動先の物理計算機に搭載されている物理デバイスを使用するパスへ切り替わる。
当該物理デバイスの変更に対し、I/O処理方式がI/Oエミュレーション方式の場合には、ハイパーバイザがI/O要求(MMIOアクセス)をトラップし、I/Oアクセスのパスをハイパーバイザの階層で切り替える。一方、I/O処理方式がI/Oパススルー方式の場合には、移行するゲストOSが移行先の物理計算機からもでも同一のLUへアクセスできる必要がある。その為には、移動元のLPARでFabricにログイン(LOGIN)しつつ、移動先のLPARからも同FabricにLOGINできている必要がある。しかしながら、同一のWWNを用いて、異なる2つのFC−HBAからFabricに同時にLOGINすることはできない。また、移動元FC−HBAのFabricからのログアウト(LOGOUT)と移動先でのLOGINをシーケンシャルに実施しようとしても、Fabricへのログイン・ログアウト処理には、最大数十秒かかる。
このため、I/Oパススルー方式でのマイグレーションとして、次の2つが考えられる。(1)移動元の計算機で動作しているゲストOSを停止させ、その期間に移動元計算機で使用しているFC−HBAのWWNをLOGOUTし、移動先のFC−HBAからLOGINし直すことで、LPAR再開前にLUへのアクセス経路を確保する方法がある。しかし、本方式を実施した場合、OSからディスクへアクセスができない期間が発生し、ゲストOSを継続稼働したままのライブマイグレーションは実現できない。
また、別の方式としては、(2)論理層では同一のWWNを用いるが物理層では異なるWWNを用いる方式である。本方式では、通常時に用いられるWWNとは異なる論理的なWWNを用いたFC−HBAを用いてストレージとの代替接続パスを設置する。マイグレーション実施時には一時的にそのパスを利用して、I/Oアクセスを実現する方式である。この方式では、ライブマイグレーション実施時にのみ代替パスを使用して、I/Oアクセスを実行しつつ、通常時に用いられていたWWNのパスは、一旦終了させる。そして、LPARを移動させる前に移動先にて、当該論理的なWWNを使用したFC−HBAのパスを初期化し、移動先からリンク(Link)を確立しておく。これにより、移動先のFC−HBAからのLUへのアクセス経路を事前に確保しておくことができる。このように事前にアクセス経路を構築しておくことでゲストOSのダウンタイムから、当該I/Oアクセスのパス構築所要時間を独立させることができる。
上記(2)の方式を採択した場合、SCSI Primary Commands−3(SPC−3)の排他コマンドであるPersistent Reservationコマンドに対応する必要がある。当該機能は、特にはパス冗長構成下でのクラスタシステムにおいて排他制御で使用されるコマンドである。
Persistent Reservationコマンドでは、ストレージコントローラが、FC−HBA側のポートのWWNとOS側で生成されたReservation Keyとを対に記憶して排他制御を実施している(別の方式も存在し得る)。その為、移動元と移動先でストレージに接続しているFC−HBAのWWNが変化する場合、論理的なWWNを変更する前のFC−HBAからのアクセスでは排他されずにアクセスできていたLUであるのにもかかわらず、代替した異なる論理的なWWNに変更した後のFC−HBAからはLUへのアクセスが許可されず、拒否される。
また、ライブマイグレーションではゲストOSに物理計算機の変更を意識させずに仮想計算機を移動させる必要がある。ゲストOSが移動することを検知し、移動元FC−HBAからのLUへの排他制御を一度キャンセルし、移動後には移動が完了したことを検知し、移動先のFC−HBAからLUへのアクセスを実施する前に再度排他制御をやり直し、アクセス制限を解除しておく方法がある。しかし、この方法を実現する為には、ミドルウェアやOSとのハンドシェークが必要となり、特殊なOS、もしくはミドルウェアが必要となり、ミドルウェアからプラットフォームまで一貫できないオープンな環境では適用するのが難しい。
第1の物理計算機は、第1の物理HBAと、第1の物理HBAを論理的に分割して、第1の論理HBA及び第1’の論理HBAを生成する第1のハイパーバイザと、WWN1が付与された第1の論理HBAが割り当てられ、第1の論理HBAと記憶装置とを接続するリンク1を経由して記憶装置にアクセスする第1のOSが動作する第1の仮想計算機と、を有する。第1のOSは第1のOS固有の第1の鍵情報を生成し、第1のハイパーバイザは、第1のOSによる第1の鍵情報を含む第1の登録要求の発行を監視して、第1の登録要求に含まれる第1の鍵情報を取得して、第1の論理HBAが有する第1の記憶領域に第1の鍵情報を記憶し、第1の論理HBAを経由して記憶装置を管理するストレージコントローラに第1の登録要求を送信し、ストレージコントローラに第1の登録要求に含まれる第1の鍵情報と、第1の登録要求の送信で経由した第1の論理HBAに付与されたWWN1とを対応づけてアクセス管理情報登録させる。第1のハイパーバイザは、第1の仮想計算機を第2の物理計算機上に移行するに際し、第1の記憶領域に記憶した第1の鍵情報を読み出し、第1’の論理HBAを経由してストレージコントローラに読み出した第1の鍵情報を含む第2の登録要求を送信して、ストレージコントローラに、第2の登録要求に含まれる第1の鍵情報と、第2の登録要求の送信で経由した第1’の論理HBAに付与されたWWN1’とを対応づけてアクセス管理情報登録させ、ストレージコントローラが第1’の論理HBAから記憶装置が有する論理ユニットへのアクセスを受け付けた場合、アクセス管理情報を参照して、アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が、第1の登録要求に含まれる第1の鍵情報か否かの判定によりアクセス制御を実行させ、第1の仮想計算機に割り当てられた第1の論理HBAから、登録したWWN1’が付与された第1’の論理HBAに第1の仮想計算機への割り当てを切り替える。第1の仮想計算機で動作する第1のOSは、第1の仮想計算機を第2の物理計算機上に移行する間、第1の仮想計算機への割り当てを切り替えたことにより、第1’の論理HBAと記憶装置とを接続するリンク1’を経由して論理ユニットにアクセスする。
ストレージでの排他制御方式に対応しつつ、I/Oパススルー方式でライブマイグレーションできる。上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
装置の全体的な構成図である。 LPARの構成図である。 ライブマイグレーションにて移動先に引き継ぐべき情報を示す。 ライブマイグレーションにおける外部環境との接続切り替え(ネットワーク)を示した図である。 ライブマイグレーションにおける外部環境との接続切り替え(ストレージ)を示した図である。 LPARを移動する前のWWN管理テーブルを示す。 LPARを移動途中のWWN管理テーブルを示す。 LPARを移動した後のWWN管理テーブルを示す。 Persistent Reservationの動作概要である。 LPARを移動する前のLU毎のアクセス管理テーブルである。 LPARを移動途中のLU毎のアクセス管理テーブルである。 LPARを移動した後のLU毎のアクセス管理テーブルである。 Persistent ReservationコマンドのReservation方式一覧である。 ライブマイグレーションの全体シーケンスである。 Persistent Reservation対応の為のHypervisorでの処理手順である。 RegisterされたReservation Keyの削除処理である。
以下、実施例を図面にて説明する。
図1はハイパーバイザ(Hypervisor)1−12、1−22を中心とした仮想化機構を含んだサーバ全体の構成図である。LPARマイグレーションを示すために、移動元構成(左側)と移動先(右側)構成との二つの構成を記載しているが、構成項目の内容としては同一である。図2はLPARの構成に注目した構成図である。当該仮想化機構は論理分割機構を使用した仮想化機構であり,CPUは物理CPU1−111、1−211をLPAR群(LPAR#1 1−13, LPAR#2)、(LPAR#3 1−23, LPAR#4)でタイムシェアリングして使用する形態である。また、メモリの分割/共有方式は、ホストOS上のアプリケーションとして動作している方式とは異なり、物理メモリ1−112、1−212をハイパーバイザ1−12、1−22上で論理的に分割し、物理メモリ1−112、1−212を特定のLPAR1−13、1−23に割り当てて使用する形態である。
以降、構成要素について順に説明する。物理計算機(Physical Computer)1−11、1−21は、主にCPU1−111、1−211と、メモリ(memory)1−112、1−212、I/OデバイスであるNIC(Network Interface Card)1−113、1−213と、FC−HBA(Fibre Channel−Host Bus Adapter)1−114、1−115、1−214、1−215から構成されるものとする。当該I/Oデバイスは各々スイッチに接続されている。
NIC1−113、1−213は、ネットワークスイッチ(LAN Switch)1−3に接続されている。FC−HBA1−114、1−214は、FCスイッチ(FC Switch)1−4−1に接続され、FC−HBA1−115、1−215は、FCスイッチ1−4−2に接続されている。この構成は、FC−HBAのパスを冗長化したものであり、FC Switch1−4−1、1−4−2の異なるパスから同一のストレージ(Storage、記憶装置)1−5に接続されている。
ストレージ1−5の内部には、実際の記憶装置である論理ユニット(LU:Logical Unit)1−51、ストレージコントローラ1−52が存在している。当該LU1−51には、図2で示すゲストOS(オペレーティングシステム)2−7が格納されている。
物理計算機1−11、1−21上では、ハイパーバイザ1−12、1−22がそれぞれ動作しており、物理計算機のリソース(CPU1−111,1−211、メモリ1−112,1−212、NIC1−113,1−213、FC−HBA1−114,1−115,1−214,1−215)の割り当てを管理している。当該ハイパーバイザ1−12、1−22上では、複数の論理区画であるLPAR群(LPAR#1 1−13, LPAR#2)、(LPAR#3 1−23, LPAR#4)が動作し、図2のゲストOS2−7を実行している。ここで、LPAR2−6は、LPAR1−13,1−23に相当する。
LPAR2−6は、論理CPU2−61、論理メモリ2−62、論理NIC2−63、論理FC−HBA2−64を備える。論理NIC2−63には論理MACアドレス2−63−1が、論理FC−HBA1−12−1には論理WWN2−64−1がハイパーバイザ1−12,1−22によって割り当てられている。
また、I/Oデバイスについて、ハイパーバイザ(1−12,1−22)により物理NIC1−113,1−213をLPAR#1、#2、#3、#4間で論理的に共有し、各LPARに割り当てることで論理NIC(1−12−3,1−22−3)が各LPAR内に存在する(2−63)。
同様に、ハイパーバイザ(1−12,1−22)により物理FC−HBA1−114,1−115,1−214,1−215をLPAR#1、#2、#3、#4間で論理的に共有し、各LPARに割り当てることで論理FC−HBA(1−12−1,1−12−2,1−22−1,1−22−2)が各LPARに存在する(2−64)。
各論理FC−HBA(1−12−1,1−12−2,1−22−1,1−22−2)には、論理FC−HBAに割り当てられた論理WWNを保持しておくWWN管理テーブル(1−12−1−1,1−12−2−1,1−22−1−1,1−22−2−1)がある。また、Persistent Reservationの鍵情報(以降、Reservation Key)を記憶しておくためのReservation Key記憶領域(1−12−1−2,1−12−2−2,1−22−1−2,1−22−2−2)がある。
図3はライブマイグレーションにおいて移動先LPAR1−23に引き継ぐべきデータを示している。前述の通りLPAR1−13を異なる物理サーバ1−21上のハイパーバイザ1−22へ移動することをLPARマイグレーションと呼ぶ。この際、異なる物理計算機1−21へ構成が変化したことをゲストOS2−7に意識させることが無いよう移動する必要がある。
さらには、ゲストOS2−7を稼働させたままLPAR1−13を移動させることをライブマイグレーションと呼ぶ。ライブマイグレーションでは、ゲストOS2−7は稼働したまま移動する為、論理CPU2−61のレジスタ情報2−61−1、内部変数2−61−2、論理メモリ2−62の内容、そして論理デバイス(論理NIC2−63、および論理FC−HBA2−64)のレジスタ情報2−63−2,2−64−2、内部変数2−63−3、2−64−3を移動先LPAR1−23に引き継ぐ必要がある。例えば、内部変数2−64−3にはゲストOS2−7で生成したReservevation Keyが含まれる。図3に示したライブマイグレーションにおいて移動先LPAR1−23に引き継ぐべきデータは、後述する図10のデバイス/CPU転送10−28で移動元から移動先へ送信される。
図4、図5ではLPAR1−13、1−23と外部環境との接続状態の維持について述べる。図4、図5で破線で記述しているもの、かつ番号に「’」が付記されているものは、ライブマイグレーションにより移動元から移動先へ移動しても上位層からみると相違は無く論理的には同番号が付与され「’」が付記されていない移動元の構成要素と同一の物であり、移動元構成(左側)における各々の状態を論理的に引き継ぐものである。ライブマイグレーションでは、移動元構成でのネットワーク接続や、ストレージエリアネットワークの接続を維持したまま移動する必要がある。
図4にはネットワーク構成に関する切り替え概要を示す。ゲストOS2−7は前述の通り、LPAR1−13で稼働しているOSである。論理NIC2−63は物理NIC1−113を介し、ネットワークスイッチ1−3に接続パス4−14で接続され、外部PC4−4と通信する。ネットワークの切り替えでは、論理NIC2−63に具備されているMACアドレス2−63−1と、ゲストOS2−7上で管理されているIPアドレス4−111を移動元から移動先へ引き継ぎ、移動後にネットワークスイッチ1−3の宛先管理テーブル1−31を更新する。そのため、ネットワークスイッチ1−3との物理結線が移動元の結線4−14と、移動先の結線4−24とで異なる移動先においても、移動元での外部PC4−4との接続関係4−15を移動先での接続関係4−25に更新し接続を維持し、移動後にもそのままネットワークを利用することができる。
図5にはストレージ構成に関する切り替え概要を示す。論理FC−HBA1−12−1,1−12−2は、Hypervisor1−12,1−22層を介して、物理FC−HBA1−114,1−115を経たうえで、FCスイッチ#1、#2(1−4−1、1−4−2)に接続されている。
ストレージ接続に関しては、ゲストOS2−7は、I/O発行先のLU1−51の番号5−113を保持する。また、ゲストOS2−7は、論理FC−HBA1−12−1,1−12−2のSCSI−ID5−111、およびストレージ側のSCSI−ID5−112を論理FC−HBA2−64毎に具備されている論理WWN2−64−1と紐付けて保持している。
移動先から同一のLU1−51へ継続してI/Oを発行する為には、同一の論理WWN(WWN1,WWN2)2−64−1を移動元から移動先へ引き継ぐ必要がある。I/Oパススルー方式において、移動元から移動先へ瞬時(1sec未満)に接続状態を切り替えるための方法について説明する。
移動元LPAR1−13に割り当てられた論理FC−HBA1−12−1,1−12−2を前記WWN管理テーブル1−12−1−1,1−12−2−1に保持された別の論理WWN(WWN1’,WWN2’)を別の論理FC−HBA1−12−1’,1−12−2’(同一物理Portを分割使用)に割り当てて、上位層のゲストOS2−7に気づかれないようにI/O発行先を切り替える方法がある。この方法によると、移動前に当初使用していた論理WWN(WWN1,WWN2)2−64−1を持つ論理FC−HBA2−64をFabricから登録解除(解放する)ことができ、移動先で前記論理WWN(WWN1,WWN2)2−64−1にてFabricにて新たにLoginし直すことが可能となり、これによりでライブマイグレーション実行時に移動先でのI/O発行処理の切り替え(I/O処理継続)を実施することができる。
図6にWWN管理テーブルを示す。図6(a)にLPAR2−6を移動する前のWWN管理テーブルを示す。ここで、このときゲストOS2−7からのI/O発行で使用する論理FC−HBA1−12−1をHBA1と定義し、マイグレーションで使用するHBA1の代替用の論理FC−HBA1−12−1’をHBA1’と定義する。同様に、論理FC−HBA1−12−2をHBA2と定義し、HBA2の代替用の論理FC−HBA1−12−2’をHBA2’と定義する。
ハイパーバイザ1−12により、HBA1とHBA1’に論理WWNとしてWWN1とWWN1’がそれぞれ付与される(6−1−1−1,6−1−1−2)。同様に、ハイパーバイザ1−12により、HBA2とHBA2’に論理WWNとしてWWN2とWWN2’がそれぞれ付与される(6−1−2−1,6−1−2−2)。
また、論理FC−HBA1−22−1をHBA3と定義し、HBA3の代替用の論理FC−HBAをHBA3’と定義する。論理FC−HBA1−22−2をHBA4と定義し、HBA4の代替用の論理FC−HBAをHBA4’と定義する。
ライブマイグレーション実行前の状態では移動元の論理FC−HBAのWWN管理テーブル1−12−1−1,1−12−2−1には、各々の論理FC−HBA1−12−1,1−12−2の論理WWN2−64−1(ID,WWN値)が登録されている。このとき、ゲストOS2−7からのI/O発行で使用する論理FC−HBAは、代替用の論理FC−HBA(HBA1’,HBA2’)と論理WWN(WWN1’,WWN2’)ではなく、本来の論理FC−HBA(HBA1,HBA2)と論理WWN(WWN1,WWN2)である。
移動先のWWN管理テーブル1−22−1−1,1−22−2−1では、マイグレーション実行前にはマイグレーション対象のLPAR1−23が使用する論理FC−HBA1−22−1,1−22−2のIDは未割り当てである(6−1−3−1,6−1−4−1)。
図6(b)にLPAR2−6を移動中のWWN管理テーブルを示す。移動中には、移動元の論理FC−HBA2−64で移動前に使用していた論理WWN(WWN1,WWN2)を有する論理FC−HBAを解放し、未使用とする(6−2−1−1,6−2−2−1)。代わりに、移動元の代替用論理FC−HBAに別の論理WWN(WWN1’,WWN2’)を割り当てることで使用中とする(6−2−1−2,6−2−2−2)。移動元で未使用となった論理WWN(WWN1,WWN2)6−2−1−1,6−2−2−1を、移動先の論理FC−HBA(1−22−1,1−22−2)に割り当て、使用中とする(6−2−3−1,6−2−4−1)。
図6(c)にLPAR2−6を移動後のWWN管理テーブルを示す。最終的に移動が完了すると、移動元の論理FC−HBA2−64は未使用状態となり、論理WWN2−64−1も未割り当てとなる(6−3−1−1、6−3−1−2、6−3−2−1、6−3−2−2)。これにより、I/Oパススルー方式でのライブマイグレーションでの瞬時のI/O切り替えが実現できる。なお、移動先の代替用論理FC−HBA(6−3−3−2、6−3−4−2)は一連の処理において使用されないが、改めて再度マイグレーションを実施する場合には移動元の情報となり、前述の通り使用される。
本方式は移動元のハイパーバイザ1−12が移動元LPARに割り当てる論理FC−HBAを、WWN1、WWN2を割り当てたHBA1,HBA2から,WWN1’、WWN2’を割り当てた代替用論理FC−HBA(HBA1’,HBA2’)にゲストOS2−7に隠蔽して変更することにより、I/Oに使用する論理WWN2−64−1の変化はゲストOS2−7には影響を与えない。
一方で、本方式の場合、FCスイッチ1−4−1,1−4−2、ストレージ1−5には、実際にLOGINしている論理FC−HBA2−64の論理WWN2−64−1を認識される。
ここで、ストレージで計算機のHBAに付与されたWWNを認識する方法の一例として、以下の方法がある。まず、計算機のHBAでのログイン時にストレージではHBAのポートIDとそのHBAに付与されたWWNとを対応づけて管理する管理テーブルを作成する。そして、サーバのHBAを経由してストレージに送信される命令(I/O)をストレージが受け取ると、HBAを経由した命令にはHBAのポートIDが含まれるので、ストレージは命令に含まれるHBAのポートIDをもとに管理テーブルからWWNを取得する。HBAが論理HBA、WWNが論理WWNの場合にも同様の方法にて、論理HBAを経由した命令からストレージは論理WWNを認識できる。
FCスイッチ1−4−1,1−4−2、ストレージ1−5には、実際にLOGINしている論理FC−HBA2−64の論理WWN2−64−1を認識される為に発生する、本方式における独自の問題点について下記で述べる。
SCSIコマンドには、排他制御を実現するためのコマンドとして、Persistent Reservationコマンドが存在する。ここで、本実施例における排他制御とは、ストレージコントローラ1-52が論理HBAからストレージ(記憶装置)1-5が有する論理ユニット(LU)1-51へのアクセスを受け付けた場合、アクセス管理テーブル7-41を参照して、アクセスした論理FC-HBA1-12-1に付与された論理WWN2-64-1に対応付けられているReservation Key(鍵情報)7−11に設定されたアクセス権限にてアクセス制御をすることを意味する。Reservation Key(鍵情報)7−11のアクセス権限は、図9に示すPersistent Reservationコマンドにより設定・変更され、論理FC-HBA1-12-1からLU1-51へのアクセス可否をきめる。
図7にPersistent Reservationコマンドの動作について概要を示す。対象とするシステムとして、LPAR1−13上で稼働するゲストOS2−7、およびパス冗長化ソフトウェア7−12、LPAR1−13に割り当てられている物理FC−HBA1−114,1−115を使用してパス冗長構成を組んでいる構成を有する。
また、当該システムは、他のOSとクラスタ構成を組んでいる構成を考える。移動対象のゲストOS2−7は、当該ゲストOS(あるいは排他制御を行う集合体単位)2−7にユニークなReservation Key7−11を生成する。ゲストOS2−7は、当該LU1−51へ同一OS2−7からのアクセスは許可し、他のOSからのアクセスは拒否する為にストレージコントローラ1−52側へ排他制御を要求する。
排他制御の要求を受けたストレージコントローラ1−52は、当該要求が発行されたFC−HBAのWWNを対象のLU1−51毎に管理されたアクセス管理テーブル7−41に、指定されたReservation Key7−11と共に登録する。ストレージ1-5は、Persistent ReservationでReserveしたReservation Key(鍵情報)7-11を記憶する。これにより、あるリザベーションの形態に依れば、ReserveしたReservation Key(鍵情報)7-11と同一のReservation Key7−11とともに登録したWWNを持つFC−HBAからはLU1−51にアクセスできるようになる。
図8にLU毎のアクセス管理テーブル7−41の概念を示す。図8(a)にLPAR2−6を移動する前のLU毎のアクセス管理テーブル7−41を示す。ストレージコントローラ1−52は、アクセス管理テーブル7−41をLU毎に保持している。アクセス管理テーブル7−41は、アクセスしてくるFC−HBAのWWNを8−1に保持し、ゲストOS2−7にて生成されたReservation Key7−11を8−2に保持している。当該エントリは複数個からなる。ストレージコントローラ1−52は、アクセス管理テーブル7−41に基づいて、アクセスしてきたWWNを持つFC−HBAに対してアクセスを許可するか、拒否するかを判断する。
図8(a)のアクセス管理テーブル7−41において、エントリ#1のWWN8−11とエントリ#2のWWN8−12は同じReservation Key8−21,8−22である“abc”を有している為、WWN8−11をもつFC−HBAとWWN8−12をもつFC−HBAは排他制御が掛らずにアクセス可能なグループである。
一方、エントリ#1のWWN8−11をもつFC−HBAがPersistent ReservationでReserveしている場合、エントリ#3や#4のWWN8−13,8−14を持つHBAは異なるReservation Key8−23,8−24である“xyz”を有しているため、エントリ#3や#4のWWN8−13,8−14を持つ他のHBAからは、ストレージコントローラ1−52による排他制御により当該LUにアクセスできない。
図8(b)に、前記I/Oパススルー方式を使用したマイグレーションを実行中のアクセス管理テーブル7−41を示す。ハイパーバイザ1−12が、代替用論理FC−HBA(1−12−1向けが6−1−1−2、1−12−2向けが6−1−2−2となる)から、代替用論理FC−HBAの論理WWN(WWN1’,WWN2’)と、ゲストOS2−7が生成したReservation Key7−11と同一のKey“abc”とを、アクセス管理テーブル7−41の#5、#6エントリに登録する(8−16,8−17,8−26,8−27)。
図8(c)にLPAR2−6を移動後のアクセス管理テーブル7−41を示す。その後マイグレーションが終了すると、Hypervisor1−12は自身が登録した代替用論理FC−HBA分のエントリ(8−16,8−17,8−26,8−27)を削除する。これにより、マイグレーション実行前のアクセス管理テーブル7−41を復元できる。
図9にSPC−3で規定されている排他制御方式について示す。Persistent ReserveコマンドでReservationを実施したWWNを有するFC−HBAをReservation保持者9−21と呼ぶ。ここで、一般的には同一の計算機であっても異なるFC−HBAには異なるWWNが具備されており、ストレージ装置への接続経路を冗長化している時などにおいて、別計算機と同一計算機の別FC−HBAとの違いを区別する為に同一のキーを持つことで同一計算機の別FC−HBAであると判別することができる。この同一キーにてアクセス判定が行われるものを同一キー(Reservation Key)登録者9−22と呼ぶ。
Write Exclusive(コマンドコード:1h)および、Exclusive Access(コマンドコード:3h)の場合は、Reservation保持者9−21はアクセス可能だが、それ以外のWWNを持つFC−HBAからはアクセス不可となる。
また、Write Exclusive −Registrants Only(コマンドコード:5h)および、Exclusive Access −Registrants Only(コマンドコード:6h)の場合は、Reservation保持者9−21のみならず、同一Reservation Key登録者9−22はアクセスが許可される。
さらに、Write Exclusive −All Registrants(コマンドコード:7h)および、Exclusive Access −All Registrants(コマンドコード:8h)の場合は、同一Reservation Keyを有するFC−HBA(同一Reservation Key登録者9−22)もReservation保持者9−21として扱われる。
図10に当該方式でのライブマイグレーションの全体シーケンスについて述べる。
まず、移動元のHypervisor1−12上でLPAR1−13を生成し(10−1)、ゲストOS2−7を起動する(10−2)。その後、ゲストOS2−7はクラスタ構成を実現する為にPersistent Reservationを発行する為の準備を始める。
ゲストOS2−7は他のホストからのアクセスを抑止する為Reservation Key7−11を生成する(10−3)。当該処理との順序は問わないが、一般的にOS起動時にはI/Oデバイスの初期化が実行される。具体的にはFC−HBAのF/Wを開始し、Linkを初期化し、FabricへLoginするといった手順である(10−4)(10−5)。
生成したReservation Key7−11とHBA1、HBA2のWWN(WWN1、WWN1’)とを関連付けてストレージ1−5に登録するために、ゲストOS2−7はストレージ1−5にPersistent ReservationのRegisterを発行する(10−6)。
移動元のHypervisor1−12は、Reservationに使用するReservation Key7−11を監視しておき、Reservation Key記憶領域1−12−1−2,1−12−2−2に記憶する(10−7)。さらに、Reservation Key7−11の登録コマンドをストレージ1−5に発行し(10−8)、ストレージ1−5がReservation Key7−11の管理を開始する(10−9)。ストレージ1-5は、Persistent ReservationでReserveしたReservation Key(鍵情報)7-11を記憶する。その後、通常の運用を開始し、ストレージ1−5は排他制御を考慮したI/Oアクセスを実施する(10−10)。
ひとたび、ユーザによりライブマイグレーションの実行要求が管理サーバ1−6に出されると、管理サーバ1−6はライブマイグレーション実行要求を受け付け、移動元Hypervisor1−12と移動先Hypervisor1−22にマイグレーション開始要求を通知する(10−11、10−12)。ここで、マイグレーションの開始の契機としては、管理サーバ1−6がライブマイグレーション実行要求を受け付ける場合に限定されず、例えば移動元の物理計算機1−11での予兆的な障害を検出した場合や、リソースの平準化を目的とした発動であっても良い。
マイグレーション開始要求の通知を受けた移動元Hypervisor1−12は、HBA1及びHBA2の代替用論理HBA1’及びHBA2’を初期化する(10−14、10−15)。その後、移動元のHypervisor1−12は、HBA1’及びHBA2’からReservation Key7−11の登録コマンドを発行する(10−16)。この際使用するReservation Key7−11は(10−7)において事前にReservation Key記憶領域1−12−1−2,1−12−2−2に記憶したReservation Key7−11を使用する。これにより、ストレージ側1−5では、HBA1’及びHBA2’に対しても元々使用しているHBA1及びHBA2と同様の排他制御が実施される(10−17)。
その後、移動元Hypervisor1−12は、図5で説明したように、HBA1及びHBA2からHBA1’からHBA2’へ移動元LPARへの論理FC−HBAの割り当てを変えることでI/O発行先の切り替えを実施する。移動元Hypervisor1−12は、HBA1及びHBA2のI/O実行状態を監視し(10−18)、I/Oが実行されていない状況、かつReservation Key7−11の登録が完了を受け取っている状態(10−19)になった処でI/Oの割り当てをHBA1及びHBA2からHBA1’及びHBA2’へ切り替える(10−20)。
移動元Hypervisor1−12は、HBA1及びHBA2が解放された処で、HBA1及びHBA2の論理WWN(WWN1、WWN2)を移動先Hypervisor1−22へ引き渡す(10−21)。この間に発行されたI/O要求(10−24)はHBA1’及びHBA2’を介してストレージ1−5へ伝達されることになる。
また、移動先Hypervisor1−22は、移動先のHBA3及びHBA4(1−22−1)を初期化する(10−22、10−23)。
移動先HBA3及びHBA4の初期化完了を確認した移動元Hypervisor1−12は移動先Hypervisor1−22にメモリ転送(10−25)を開始する。移動先Hypervisor1−22は、そのデータを受け取り移動先でデータの反映を実施する(10−26)。移動元Hypervisor1−12は転送すべきメモリのデータ量が一定の量以下になった時点で、LPARの停止要求を移動元LPAR1−13に通知する(10−27)。
移動元Hypervisor1−12は、LPAR1−13が停止された後、移動先Hypervisor1−22にデバイス、CPUの情報を転送する(10−28)。前述と同様、移動先Hypervisor1−22は受け取ったデータを反映する(10−29)。その後、移動元Hypervisor1−12はデータ転送が完了する契機で、移動先Hypervisorに対し、LPARの再開を要求する(10−30)。再開要求を受け取った移動先Hypervisor1−22は移動先LPAR1−23に対し、再開要求を指示する(10−31)。
LPAR再開を要求した移動元Hypervisor1−12は、終了処理(10−32)をHBA1’及びHBA2’に要求する。終了処理要求を受けたHBA1’及びHBA2’は自ら登録したReservation Keyの削除要求をストレージ1−5に発行(10−33)し、ストレージ1−5はReservation Keyの削除を実施する(10−34)。その後HBA1’及びHBA2’は終了処理として、LOGOUT処理を実施する(10−35)。終了要求を受けたストレージ1−5側も終了処理を実施する(10−36)。
この移動先Hypervisor1−22上のLPAR1−23で発行されるI/O要求(10−37)は、HBA3及びHBA4を介して、ストレージ1−5へ発行される。一方、HBA1’及びHBA2’の終了処理の完了を受け取った移動元Hypervisor1−12は移動元LPAR1−13の削除を要求する(10−38)。移動元LPAR1−13の削除が完了したことで、管理サーバ1−6へマイグレーションの完了を移動元、移動先各々のHypervisorから通知する(10−39)(10−40)。
図11に、前述したHypervisor1−12でのPersistent Reservationを発行する手順(10−16)の詳細を示す。まず、Hypervisor1−12はLPAR1−13が使用しているLU1−51の情報を取得する(REPORT LUNSコマンドを使用する等)(11−1−1、11−2−1,11−2−2,11−1−2)。次に、Hypervisor1−12は、前記全てのLU1−51に対し、Read Reservationを用いてReservation Typeを取得する(11−1−3,11−2−3、11−2−4、11−1−4)。
取得したReservation Typeが排他アクセスを許さない場合(Write Exclusive、及びExclusive Access)(11−1−5)には異なるWWNを有するポートからのアクセスは不可となる為、以降の処理を中止し、マイグレーションを中止する(11−1−6)。それ以外の場合には、別のWWNを有するFC−HBAであっても同一のReservation Keyを持てばアクセス可能である為、後続の処理を実施する。
次にHypervisor1−12は、対象のLU1−51のReservation Key記憶領域1−12−1−2,1−12−2−2からHBA1及びHBA2(1−12−1)で使用されているReservation Key7−11を読み出す(11−1−7)。HBA1及びHBA2(1−12−1)に対応する代替のHBA1’及びHBA2’(1−12−1’)を介して読み出したReservation Key7−11を使用してREGISTERを実施する(11−1−8、11−1−9)。REGISTER要求を受け取ったストレージ1−5側は、Reservation Keyの登録を実施し(11−2−7)、応答を返す(11−2−8)。
この処理は当該HBA1及びHBA2(1−12−1)から当該LUに登録されているReservation Key分実施する(11−1−10)。また、当該HBA1及びHBA2(1−12−1)が接続しているターゲットに接続されているLU数分について上記処理(11−1−3〜11−1−10)を実施する(11−1−11)。その処理が完了した後には当該LPAR1−13が接続している別のストレージに対して同様の処理(11−1−1〜11−1−11)を実施する(11−1−12)。さらに、同様の処理(11−1−1〜11−1−12)をLPAR1−13に割り当てられている論理FC−HBA(1−12−1相当)のPort数分実施する(11−1−13)。これらを実施することで物理的に異なるWWNをもつポートからも対象のLU1−51に継続してアクセスすることが可能となる。
なお、移動先のFC−HBAで実施している処理は、移動元のLPARにおいてOSが実行されている期間に移動元で移動元構成の別の物理FC−HBAを用いてReservation Keyの登録処理を実施しても良い。
図12にて、前述したReservation Keyの削除(10−33)の詳細について述べる。当該ライブマイグレーションではゲストOS2−7を終了しない為、移動元で最後にReservation Keyを削除しておく必要がある。しかし、移動元にゲストOS2−7は既に存在しない為、移動元のHypervisor1−12が移動元のFC−HBAを介してReservation KEYの削除を実施する。基本的な処理の流れは、図11と同じであるが、REGISTERを発行する際のサブコマンドは削除である(12−1−5)。なお、当該処理は、LPARマイグレーション失敗時に移動先でRegisterした情報を削除するエラー処理でも実行する。
1−5 ストレージ
1−52 ストレージコントローラ
1−6 管理サーバ
1−11 移動元物理計算機
1−12 移動元ハイパーバイザ
1−13 移動元LPAR
1−21 移動元物理計算機
1−22 移動先ハイパーバイザ
1−23 移動先LPAR
2−7 ゲストOS
7−11 Reservation KEY
7−41 アクセス管理テーブル

Claims (12)

  1. メモリとCPUを有する複数の物理計算機と記憶装置とを備え、前記物理計算機上でハイパーバイザにより前記メモリと前記CPUを論理分割して生成された仮想計算機が動作する計算機システムにおいて、
    第1の物理計算機は、
    第1の物理HBAと、
    前記第1の物理HBAを論理的に分割して、第1の論理HBA及び第1’の論理HBAを生成する第1のハイパーバイザと、
    WWN1が付与された前記第1の論理HBAが割り当てられ、前記第1の論理HBAと前記記憶装置とを接続するリンク1を経由して前記記憶装置にアクセスする第1のOSが動作する第1の仮想計算機と、を有し、
    前記第1のOSは前記第1のOS固有の第1の鍵情報を生成し、
    前記第1のハイパーバイザは、前記第1のOSによる前記第1の鍵情報を含む第1の登録要求の発行を監視して、前記第1の登録要求に含まれる前記第1の鍵情報を取得して、前記第1の論理HBAが有する第1の記憶領域に前記第1の鍵情報を記憶し、前記第1の論理HBAを経由して前記記憶装置を管理するストレージコントローラに前記第1の登録要求を送信し、
    前記ストレージコントローラに前記第1の登録要求に含まれる前記第1の鍵情報と、前記第1の登録要求の送信で経由した前記第1の論理HBAに付与されたWWN1とを対応づけてアクセス管理情報登録させ、
    前記第1のハイパーバイザは、前記第1の仮想計算機を第2の物理計算機上に移行するに際し、前記第1の記憶領域に記憶した前記第1の鍵情報を読み出し、前記第1’の論理HBAを経由して前記ストレージコントローラに前記読み出した第1の鍵情報を含む第2の登録要求を送信して、
    前記ストレージコントローラに、前記第2の登録要求に含まれる前記第1の鍵情報と、前記第2の登録要求の送信で経由した前記第1’の論理HBAに付与されたWWN1’とを対応づけて前記アクセス管理情報登録させ、
    前記ストレージコントローラが前記第1’の論理HBAから前記記憶装置が有する論理ユニットへのアクセスを受け付けた場合、前記アクセス管理情報を参照して、前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によりアクセス制御を実行させ、
    前記第1のハイパーバイザは、前記第1の仮想計算機に割り当てられた前記第1の論理HBAから、前記登録したWWN1’が付与された前記第1’の論理HBAに前記第1の仮想計算機への割り当てを切り替えて、
    前記第1の仮想計算機で動作する前記第1のOSは、前記第1の仮想計算機を前記第2の物理計算機上に移行する間、前記第1の仮想計算機への割り当てを切り替えたことにより、前記第1’の論理HBAと前記記憶装置とを接続するリンク1’を経由して前記論理ユニットにアクセスすることを特徴とする計算機システム。
  2. 前記第1のハイパーバイザは前記ストレージコントローラに前記第2の登録要求を送信することにより、
    前記第1の仮想計算機上で動作する前記第1のOSが、前記第1’の論理HBAと前記記憶装置とを接続するリンク1’を経由して前記論理ユニットにアクセスした場合、
    前記ストレージコントローラ前記アクセス管理情報に基づいて、前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によりアクセス制御を前記ストレージコントローラに実行させ、前記判定の結果前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が前記第1の鍵情報であるとの判定により前記論理ユニットへのアクセスを前記ストレージコントローラに許可させることを特徴とする請求項1記載の計算機システム。
  3. 前記第1のハイパーバイザは、前記第2の物理計算機に前記WWN1を送信し、
    前記第2の物理計算機は、
    第2の物理HBAと、
    前記第1のハイパーバイザから前記WWN1を受信し、前記第2の物理HBAを論理的に分割して、前記WWN1が付与された第2の論理HBAを生成する第2のハイパーバイザと、を有し、
    前記第1のハイパーバイザは、前記第1の仮想計算機に対応するメモリの情報を送信し、
    前記第2のハイパーバイザは、前記第1の仮想計算機に対応するメモリの情報を受信し、
    前記受信した第1の仮想計算機に対応するメモリの情報に基づいて第2の仮想計算機を生成し、前記第2の仮想計算機に前記第2の論理HBAを割り当て、前記第1の仮想計算機から移行された第1のOSを前記第2の仮想計算機上で動作させ、
    前記第2の仮想計算機上で動作する第1のOSは、前記WWN1が付与された前記第2の論理HBAと前記記憶装置とを接続するリンク2を経由して前記論理ユニットにアクセスすることを特徴とする請求項2記載の計算機システム。
  4. 前記第1のハイパーバイザは、前記ストレージコントローラに前記第1の登録要求を送信することにより、
    前記第2の仮想計算機上で動作する第1のOSが、前記第2の論理HBAと前記記憶装置とを接続するリンク2を経由して前記論理ユニットにアクセスした場合、
    前記ストレージコントローラ前記アクセス管理情報に基づいて、前記アクセスした第2の論理HBAに付与されたWWN1と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によるアクセス制御を前記ストレージコントローラに実行させ、前記判定の結果前記アクセスした第2の論理HBAに付与されたWWN1と対応づけられた鍵情報が前記第1の鍵情報であるとの判定により前記論理ユニットへのアクセスを前記ストレージコントローラに許可させることを特徴とする請求項3記載の計算機システム。
  5. 前記第1の物理計算機は第3の物理HBAを有し、
    前記第1のハイパーバイザは、前記第3の物理HBAを論理的に分割して、第3の論理HBA及び第3’の論理HBAを生成し、WWN3が付与された前記第3の論理HBAを前記第1の仮想計算機に割り当て、
    前記第1の仮想計算機上で動作する前記第1のOSは、前記第3の論理HBAと前記記憶装置とを接続するリンク3または前記リンク1を経由して前記記憶装置にアクセスし、
    前記第1のハイパーバイザは、前記第1のOSによる前記第1の鍵情報を含む前記第1の登録要求の発行を監視して、前記第1の登録要求に含まれる前記第1の鍵情報を取得して、前記第3の論理HBAが有する第3の記憶領域に前記第1の鍵情報を記憶し、前記第3の論理HBAを経由して前記記憶装置を管理する前記ストレージコントローラに前記第1の登録要求を送信し、
    前記ストレージコントローラに前記第1の登録要求に含まれる前記第1の鍵情報と、前記第1の登録要求の送信で経由した前記第3の論理HBAに付与された前記WWN3とを対応づけて前記アクセス管理情報登録させ、
    前記第1のハイパーバイザは、前記第1の仮想計算機を前記第2の物理計算機上に移行するに際し、前記第3の記憶領域に記憶した前記第1の鍵情報を読み出し、前記第3’の論理HBAを経由して前記ストレージコントローラに前記読み出した第1の鍵情報を含む第3の登録要求を送信して、
    前記ストレージコントローラに、前記第3の登録要求に含まれる前記第1の鍵情報と、前記第3の登録要求の送信で経由した前記第3’の論理HBAに付与されたWWN3’とを対応づけて前記アクセス管理情報登録させ、
    前記ストレージコントローラが前記第3’の論理HBAから前記記憶装置が有する前記論理ユニットへのアクセスを受け付けた場合、前記アクセス管理情報を参照して、前記アクセスした第3’の論理HBAに付与されたWWN3’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によりアクセス制御を実行させ、
    前記第1の仮想計算機に割り当てられた前記第3の論理HBAから、前記登録したWWN3’が付与された前記第3’の論理HBAに前記第1の仮想計算機への割り当てを切り替えて、
    前記第1の仮想計算機で動作する前記第1のOSは、前記第1の仮想計算機を前記第2の物理計算機上に移行する間、前記第1の仮想計算機への割り当てを切り替えたことにより、前記第3’の論理HBAと前記記憶装置とを接続するリンク3’または前記リンク1’を経由して前記論理ユニットにアクセスすることを特徴とする請求項4記載の計算機システム。
  6. 前記第1のハイパーバイザは前記ストレージコントローラに前記第3の登録要求を送信することにより、
    前記第1の仮想計算機上で動作する前記第1のOSが、前記第3’の論理HBAと前記記憶装置とを接続する前記リンク3’を経由して前記論理ユニットにアクセスした場合、
    前記ストレージコントローラ前記アクセス管理情報に基づいて、前記アクセスした第3’の論理HBAに付与されたWWN3’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によるアクセス制御を前記ストレージコントローラに実行させ、前記判定の結果前記アクセスした第3’の論理HBAに付与された前記WWN3’と対応づけられた鍵情報が前記第1の鍵情報であるとの判定により前記論理ユニットへのアクセスを前記ストレージコントローラに許可させることを特徴とする請求項5記載の計算機システム。
  7. 前記第1のハイパーバイザは、前記第2の物理計算機に前記WWN3を送信し、
    前記第2の物理計算機は第4の物理HBAを有し、
    前記第2のハイパーバイザは、前記第1のハイパーバイザから前記WWN3を受信し、前記第4の物理HBAを論理的に分割して、前記WWN3が付与された第4の論理HBAを生成し、
    前記第2のハイパーバイザは、前記第2の仮想計算機に前記第4の論理HBAを割り当て、前記第1の仮想計算機から移行された前記第1のOSを前記第2の仮想計算機上で動作させ、
    前記第2の仮想計算機上で動作する前記第1のOSは、前記WWN3が付与された前記第4の論理HBAと前記記憶装置とを接続するリンク4または前記リンク2を経由して前記論理ユニットにアクセスすることを特徴とする請求項6記載の計算機システム。
  8. 前記第1のハイパーバイザは、前記ストレージコントローラに前記第1の登録要求を送信することにより、
    前記第2の仮想計算機上で動作する前記第1のOSが、前記第4の論理HBAと前記記憶装置とを接続する前記リンク4を経由して前記論理ユニットにアクセスした場合、
    前記ストレージコントローラ前記アクセス管理情報に基づいて、前記アクセスした第4の論理HBAに付与されたWWN3と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によるアクセス制御を前記ストレージコントローラに実行させ、前記判定の結果前記アクセスした第4の論理HBAに付与された前記WWN3と対応づけられた鍵情報が前記第1の鍵情報であるとの判定により前記論理ユニットへのアクセスを前記ストレージコントローラに許可させることを特徴とする請求項7記載の計算機システム。
  9. メモリとCPUを有する複数の物理計算機と記憶装置とを備え、前記物理計算機上でハイパーバイザにより前記メモリと前記CPUを論理分割して生成された仮想計算機が動作する計算機システムにおいて、
    第1の物理計算機は、
    第1の物理HBAと、
    前記第1の物理HBAを論理的に分割して、第1の論理HBA及び第1’の論理HBAを生成する第1のハイパーバイザと、
    WWN1が付与された前記第1の論理HBAが割り当てられ、前記第1の論理HBAと前記記憶装置とを接続するリンク1を経由して前記記憶装置にアクセスする第1のOSが動作する第1の仮想計算機と、を有し、
    前記第1のOSは前記第1のOS固有の第1の鍵情報を生成し、
    前記第1のハイパーバイザは、前記第1のOSによる前記第1の鍵情報を含む第1の登録要求の発行を監視して、前記第1の登録要求に含まれる前記第1の鍵情報を取得して、前記第1の論理HBAが有する第1の記憶領域に前記第1の鍵情報を記憶し、前記第1の論理HBAを経由して前記記憶装置に前記第1の登録要求を送信し、
    前記記憶装置は、
    論理ユニットと、
    前記第1の論理HBAを経由して送信された第1の登録要求を受信して、前記第1の登録要求に含まれる前記第1の鍵情報と、前記第1の登録要求の送信で経由した前記第1の論理HBAに付与されたWWN1と対応づけアクセス管理情報として管理するストレージコントローラと、を有し、
    前記第1のハイパーバイザは、前記第1の仮想計算機を第2の物理計算機上に移行するに際し、前記第1の記憶領域に記憶した前記第1の鍵情報を読み出し、前記第1’の論理HBAを経由して前記記憶装置に前記読み出した第1の鍵情報を含む第2の登録要求を送信して、
    前記ストレージコントローラに、前記第2の登録要求に含まれる前記第1の鍵情報と、前記第2の登録要求の送信で経由した前記第1’の論理HBAに付与されたWWN1’と対応づけ前記アクセス管理情報として管理させ、
    前記ストレージコントローラが前記第1’の論理HBAから前記論理ユニットへのアクセスを受け付けた場合、前記アクセス管理情報を参照して、前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によりアクセス制御を実行させ、
    前記第1のハイパーバイザは、前記第1の仮想計算機に割り当てられた前記第1の論理HBAから、前記登録したWWN1’が付与された前記第1’の論理HBAに前記第1の仮想計算機への割り当てを切り替えて、
    前記第1の仮想計算機で動作する前記第1のOSは、前記第1の仮想計算機を前記第2の物理計算機上に移行する間、前記第1の仮想計算機への割り当てを切り替えたことにより、前記第1’の論理HBAと前記記憶装置とを接続するリンク1’を経由して前記論理ユニットにアクセスすることを特徴とする計算機システム。
  10. 前記ストレージコントローラは、
    前記第1の仮想計算機に割り当てられた前記第1’の論理HBAから前記論理ユニットへのアクセスを受け付けると、前記アクセス管理情報を参照して、前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によるアクセス制御を行い、前記判定の結果前記アクセスした第1’の論理HBAに付与されたWWN1’と対応づけられた鍵情報が前記第1の鍵情報であると判定して前記論理ユニットへのアクセスを許可することを特徴とする請求項9記載の計算機システム。
  11. 前記第1のハイパーバイザは、前記第2の物理計算機に前記WWN1を送信し、
    前記第2の物理計算機は、
    第2の物理HBAと、
    前記第1のハイパーバイザから前記WWN1を受信し、前記第2の物理HBAを論理的に分割して、前記WWN1が付与された第2の論理HBAを生成する第2のハイパーバイザと、を有し、
    前記第1のハイパーバイザは、前記第1の仮想計算機に対応するメモリの情報を送信し、
    前記第2のハイパーバイザは、前記第1の仮想計算機に対応するメモリの情報を受信し、
    前記受信した第1の仮想計算機に対応するメモリの情報に基づいて第2の仮想計算機を生成し、前記第2の仮想計算機に前記第2の論理HBAが割り当て、前記第1の仮想計算機から移行された第1のOSを動作させ、
    前記第2の仮想計算機で動作する第1のOSは、前記WWN1が付与された前記第2の論理HBAと前記記憶装置とを接続するリンク2を経由して前記論理ユニットにアクセスすることを特徴とする請求項10記載の計算機システム。
  12. 前記ストレージコントローラは、
    前記第2の仮想計算機に割り当てられた前記第2の論理HBAから前記論理ユニットへのアクセスを受け付けると、前記アクセス管理情報を参照して、前記アクセスした第2の論理HBAに付与されたWWN1と対応づけられた鍵情報が、前記第1の登録要求に含まれる前記第1の鍵情報か否かの判定によるアクセス制御を行い、前記判定の結果前記アクセスした第2の論理HBAに付与されたWWN1と対応づけられた鍵情報が前記第1の鍵情報であると判定して前記論理ユニットへのアクセスを許可することを特徴とする請求項11記載の計算機システム。
JP2012181989A 2012-08-21 2012-08-21 計算機システム Expired - Fee Related JP5856925B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012181989A JP5856925B2 (ja) 2012-08-21 2012-08-21 計算機システム
US13/956,411 US9134915B2 (en) 2012-08-21 2013-08-01 Computer system to migrate virtual computers or logical paritions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012181989A JP5856925B2 (ja) 2012-08-21 2012-08-21 計算機システム

Publications (2)

Publication Number Publication Date
JP2014041395A JP2014041395A (ja) 2014-03-06
JP5856925B2 true JP5856925B2 (ja) 2016-02-10

Family

ID=50149089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012181989A Expired - Fee Related JP5856925B2 (ja) 2012-08-21 2012-08-21 計算機システム

Country Status (2)

Country Link
US (1) US9134915B2 (ja)
JP (1) JP5856925B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5548647B2 (ja) * 2011-04-25 2014-07-16 株式会社日立製作所 計算機システムでの部分障害処理方法
US9626180B2 (en) 2013-12-16 2017-04-18 International Business Machines Corporation Live operating system update mechanisms
CN106068501A (zh) * 2014-03-07 2016-11-02 三菱电机株式会社 计算机装置和计算机机构
US9755991B2 (en) 2014-06-11 2017-09-05 International Business Machines Corporation Live partition mobility with shared persistent reservations
US9430223B2 (en) * 2014-09-25 2016-08-30 International Business Machines Corporation Live operating system update mechanisms
JP6231700B2 (ja) * 2014-11-06 2017-11-15 株式会社日立製作所 サーバストレージシステムと管理システムを有する計算機システム
JP6516875B2 (ja) 2016-01-08 2019-05-22 株式会社日立製作所 統合プラットフォーム、サーバ、及び、フェイルオーバ方法
US10409838B1 (en) * 2016-03-18 2019-09-10 EMC IP Holding Company LLC Managing registration and reservation information in an active-active configuration
US10158743B2 (en) * 2016-06-12 2018-12-18 International Business Machines Corporation Compute node cluster management
US10592155B2 (en) * 2018-04-10 2020-03-17 International Business Machines Corporation Live partition migration of virtual machines across storage ports
JP7142052B2 (ja) * 2020-03-23 2022-09-26 株式会社日立製作所 ハイブリッドクラウドにおけるデータを保護する方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4783086B2 (ja) * 2005-08-04 2011-09-28 株式会社日立製作所 ストレージシステム、ストレージアクセス制限方法、及びコンピュータプログラム
JP4744480B2 (ja) 2007-05-30 2011-08-10 株式会社日立製作所 仮想計算機システム
JP5222651B2 (ja) * 2008-07-30 2013-06-26 株式会社日立製作所 仮想計算機システムおよび仮想計算機システムの制御方法
JP2011227841A (ja) * 2010-04-23 2011-11-10 Hitachi Ltd 計算機システムおよび識別子管理方法

Also Published As

Publication number Publication date
US20140059302A1 (en) 2014-02-27
US9134915B2 (en) 2015-09-15
JP2014041395A (ja) 2014-03-06

Similar Documents

Publication Publication Date Title
JP5856925B2 (ja) 計算機システム
US11663029B2 (en) Virtual machine storage controller selection in hyperconverged infrastructure environment and storage system
JP5222651B2 (ja) 仮想計算機システムおよび仮想計算機システムの制御方法
US9038067B2 (en) Virtual computer system and control method of migrating virtual computer
US9606745B2 (en) Storage system and method for allocating resource
JP5272709B2 (ja) アドレス割当方法、コンピュータ、物理マシン、プログラム、及びシステム
US9223501B2 (en) Computer system and virtual server migration control method for computer system
US11256582B2 (en) System, and control method and program for input/output requests for storage systems
JP4972670B2 (ja) 仮想計算機システム、そのアクセス制御方法及び通信装置
US20210405902A1 (en) Rule-based provisioning for heterogeneous distributed systems
WO2011083522A1 (ja) 計算機システム及びその可用化方法
US20110004708A1 (en) Computer apparatus and path management method
JP2010257274A (ja) 仮想化環境におけるストレージ管理システム及びストレージ管理方法
JP2005216151A (ja) 資源運用管理システム及び資源運用管理方法
US20130179532A1 (en) Computer system and system switch control method for computer system
JP2007148812A (ja) ストレージシステム及びその負荷分散方法
US20120054460A1 (en) Method and system for storage system migration
US20110167067A1 (en) Classification of application commands
US9081509B2 (en) System and method for managing a physical storage system and determining a resource migration destination of a physical storage system based on migration groups
US11755438B2 (en) Automatic failover of a software-defined storage controller to handle input-output operations to and from an assigned namespace on a non-volatile memory device
JP5937772B1 (ja) ストレージシステム及びリソース割当て方法
WO2016056050A1 (ja) 計算機システム及びそれの管理システム
Guendert The IBM System z9, FICON/FCP Intermix and Node Port ID Virtualization (NPIV)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151214

R151 Written notification of patent or utility model registration

Ref document number: 5856925

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees