JP2015035175A - 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム - Google Patents

情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム Download PDF

Info

Publication number
JP2015035175A
JP2015035175A JP2013166784A JP2013166784A JP2015035175A JP 2015035175 A JP2015035175 A JP 2015035175A JP 2013166784 A JP2013166784 A JP 2013166784A JP 2013166784 A JP2013166784 A JP 2013166784A JP 2015035175 A JP2015035175 A JP 2015035175A
Authority
JP
Japan
Prior art keywords
power
information
virtual machine
power failure
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013166784A
Other languages
English (en)
Inventor
靖彦 内田
Yasuhiko Uchida
靖彦 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013166784A priority Critical patent/JP2015035175A/ja
Priority to US14/330,153 priority patent/US20150046748A1/en
Priority to EP14176887.9A priority patent/EP2835716A1/en
Publication of JP2015035175A publication Critical patent/JP2015035175A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45575Starting, stopping, suspending or resuming virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/1097Boot, Start, Initialise, Power
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/442Shutdown

Abstract

【課題】停電により全ドメインがシャットダウンした後、電源が復旧した際に自動でドメインの電源投入を行って、停電前の状態に情報処理装置を戻すことである。【解決手段】電源装置に接続された情報処理装置は、格納部と、停止制御部と、起動制御部とを有する。格納部は、停電発生の通知を受けたときに、情報処理装置内に実装されている仮想マシンの稼働状態を表す情報を取得して記憶部に格納する。停止制御部は、停電発生の通知を受けたときに、稼働中の仮想マシンを停止させ、その後、情報処理装置内のハードウェアへの電力の供給を停止する。起動制御部は、情報処理装置への電力の供給が開始されたときに、記憶部に格納されている情報に基づいて仮想マシンを起動する。【選択図】図2A

Description

この発明は、仮想マシンの制御に関する。
サーバは、所定の処理を踏まずに電源が切断されると、サーバ上のデータを正常に保持できないことがある。そのため、予期せぬ停電などの電源異常が発生した場合でも、所定の手順を踏んだ電源切断処理が完了するまでは、サーバに対して電源が供給され続けなければならない。これを実現する1つの方法として、サーバに対する給電を無停電電源装置(UPS:Uninterruptible Power Supply)経由とする方法がある。無停電電源装置は、停電等の電源異常を検知すると瞬時にサーバ等への出力電源のソースを内蔵バッテリーに切り替える。これにより、無停電電源装置は停電等の電源異常発生後も内蔵バッテリー電源が続く限りサーバ等に電力を供給し続けることができる。但し、内蔵バッテリーから電力を供給し続けられる時間には限りがあるため、停電が発生した際は、速やかにサーバの電源切断をする必要がある。
図1は、サーバの電源切断処理の例を説明する図である。図1において、サーバ100とUPS110とは、LAN(Local Area Network)ケーブルで接続されている。サーバ100は、パーティション101−1〜101−nを含む。パーティションは、1台以上のシステムボードを有し、複数のドメインが動作する。パーティション内には、1つのコントロールドメイン102と複数のゲストドメイン103−1〜103―mとが含まれる。コントロールドメイン102は、ゲストドメイン103の生成及び管理をする。それぞれのドメインでは、OS(Operation System)が稼動しており、これにより仮想システムが提供される。コントロールドメイン102は、指示部104を有する。
停電が発生すると、UPS110は、LANケーブルを経由して、指示部104に停電が発生したことを通知する。指示部104は、予めユーザが作成したスクリプトを保持している。指示部104は、スクリプトを用いて、全ドメインへのシャットダウンの指示を発行する。シャットダウンの指示を受けた各ドメインは、動作を停止する。
関連する技術として、自動的に論理区画、サーバ、ハードウェア管理コンソールをこの順で停止するサーバ電源自動制御モジュールを実装することが知られている(例えば特許文献1参照)。
特開2008−3735号公報
上述した背景技術では以下のような問題がある。
電源復旧後にサーバを起動する際に、ユーザが手動で各ドメインの電源投入処理を行わなければならない。
1つの側面において、本発明の目的は、停電により全ドメインがシャットダウンした後、電源が復旧した際に自動でドメインの電源投入を行って、停電前の状態に情報処理装置を戻すことである。
電源装置に接続された情報処理装置は、格納部と、停止制御部と、起動制御部とを有する。格納部は、停電発生の通知を受けたときに、情報処理装置内に実装されている仮想マシンの稼働状態を表す情報を取得して記憶部に格納する。停止制御部は、停電発生の通知を受けたときに、稼働中の仮想マシンを停止させ、その後、情報処理装置内のハードウェアへの電力の供給を停止する。起動制御部は、情報処理装置への電力の供給が開始されたときに、記憶部に格納されている情報に基づいて仮想マシンを起動する。
停電により全ドメインがシャットダウンした後、電源が復旧した際に自動でドメインの電源投入を行って、停電前の状態に情報処理装置を戻すことができる。
サーバの電源切断処理の例を説明する図である。 仮想システムを一括して停止する処理の例を説明する図である。 仮想システムを停電発生前の状態に戻す処理の例を説明する図である。 サーバのハードウェア構成の例である。 実施形態に係るサーバの構成例である。 エラーに関する情報の格納処理の例を説明する図である。 エラーに関する情報の実施例を説明する図である。 サーバの電源を切断する処理の例を説明する図である。 ドメインの稼動状態に関する情報の例を説明する図である。 サーバの電源投入処理の例を説明する図である。 仮想システムを一括して停止する処理の例を説明するフローチャートである。 仮想システムを停電発生前の状態に戻す処理の例を説明するフローチャートである。 エラーに関する情報の格納処理の例を説明するフローチャートである。 サーバの電源を切断する処理の例を説明するフローチャートである。 サーバの電源投入処理の例を説明するフローチャートである。
以下、本実施形態について、図面を参照しながら詳細に説明する。
図2Aおよび図2Bを参照して、本実施形態におけるサーバの停電時の処理及び復電時の処理の例を説明する。図2Aは、仮想システムを一括して停止する処理の例を説明する図である。図2Aにおいて、サーバ200とUPS210とは、LANケーブルで接続されている。サーバ200は、パーティション201(201−1〜201−n)及びSCF220を含む。パーティションは、1台以上のシステムボードを有し、複数のドメインを動作させる。SCF220は、サービスプロセッサであり、電源投入や電源切断、ハードウェアの故障監視を行う。SCF220は、データベース221、格納部222、制御部223を備える。データベース221は、パーティションの情報、ドメインの情報、エラーに関する情報を保持する。格納部222は、データベース221に対して各種情報を格納する処理を行う。制御部223は、パーティションの電源投入や電源切断の処理を制御する。パーティション内には、1つのコントロールドメイン202と複数のゲストドメイン203(203−1〜203―m)と、Hypervisor205とが含まれる。コントロールドメイン202は、指示部204を有する。Hypervisor205は、パーティションのドメインの制御及び管理を行うファームウェアである。
以下に、停電発生時の仮想システムを一括停止する処理を順に説明する。
(1)停電が発生すると、UPS210への電力供給が停止される。(停電)
(2)UPS210は、サーバ200の指示部204に対して停電が発生したことを通知する。(通知)
(3)指示部204は、停電が発生したことをSCF220に通知する。(通知)
(4)格納部222は、停電が発生したことを表すエラー情報をデータベース221に格納する。(格納)
(5)制御部223は、各パーティションのHypervisor205に対して全ドメインの稼動状態に関する情報の取得及び全ドメインへのシャットダウン要求を出力する。(シャットダウン)
(6)格納部222は、取得した全ドメインの稼動状態に関する情報をデータベース221に格納する。(格納)
(7)制御部223は、全パーティションの電源切断を実施する。(電源切断)
(8)一定時間経過後、UPS210は、SCF220への電力供給を停止する。(電力供給停止)
(9)電力供給の停止により、SCF220は停止する。(停止)
図2Aの(1)〜(9)の処理により、停電が発生しても、所定の手順を踏んだ電源切断処理が実行される。所定の手順を踏んだ電源の切断処理により、サーバ上のデータの破損や故障を防ぐことができる。なお、(8)における、一定時間は、(1)〜(7)の処理が完了するのに十分な時間であればよい。
図2Bは、仮想システムを停電発生前の状態に戻す処理の例を説明する図である。図2Bにおいて、図2Aと同じものは、同一の番号を付している。図2Bは、停電が復旧後の処理について説明した図である。図2BのSCF220は、制御部223、判定部231、電源投入部232を備える。
以下に、仮想システムを停電発生前の状態に戻す処理の例を説明する。
(1)電力が復旧する。(電力復旧)
(2)UPS210は、サーバ200に対して電力供給を再開する。(電力供給)
(3)電源供給が再開されると、SCF220は、起動処理を開始する。(起動)
(4)判定部231は、データベース221のエラーに関する情報が、停電によってサーバ200の電源が切断されたことに係わる情報を含んでいるかを判定する。停電によって情報処理装置の電源が切断されていた場合に、取得部232は、データベース221から、停電時にどのパーティション・ドメインがシャットダウン処理したかの情報を取得する。(確認)
(5)電源投入部232は、停電によりシャットダウン処理が行われたパーティションの電源を投入する。(電源投入)
(6)制御部223は、各パーティションのHypervisor205に対して、停電によりシャットダウン処理が行われたドメインの起動を要求する。(起動要求)
(7)Hypervisor205は、停電によりシャットダウン処理が行われたドメインのOSをブートして、停電前の状態に戻す。(起動)
図2Bの(1)〜(7)の処理を行うことにより、停電が起こっても、サーバ200は、停電前のパーティション・ドメインと同じ状態に戻る。停電時のパーティション・ドメイン・エラーに関する情報を記憶するデータベース221は、記憶部であってもよい。図2A、図2B共に、SCF220と各パーティションとはCMD(COMAND)パスと呼ばれる通信パスで接続されており、双方向の通信を行う。
図3は、サーバのハードウェア構成の例を示す。サーバ200は、プロセッサ11、メモリ12、バス15、外部記憶装置16、ネットワーク接続装置19を備える。さらにオプションとして、サーバ200は、入力装置13、出力装置14、媒体駆動装置17を備えても良い。サーバ200は、例えば、コンピュータなどで実現されることがある。
プロセッサ11は、Central Processing Unit(CPU)を含む任意の処理回路とすることができる。プロセッサ11は、指示部204、格納部222、制御部223、Hypervisor205、判定部231、電源投入部232として動作することができる。なお、プロセッサ11は、例えば、外部記憶装置16に記憶されたプログラムを実行することができる。メモリ12は、データベース221として動作し、パーティションの情報、ドメインの情報、エラーに関する情報を保持する。さらに、メモリ12は、プロセッサ11の動作により得られたデータや、プロセッサ11の処理に用いられるデータも、適宜、記憶する。ネットワーク接続装置19は、他の装置との通信に使用される。
入力装置13は、例えば、ボタン、キーボード、マウス等として実現され、出力装置14は、ディスプレイなどとして実現される。バス15は、プロセッサ11、メモリ12、入力装置13、出力装置14、外部記憶装置16、媒体駆動装置17、ネットワーク接続装置19の間を相互にデータの受け渡しが行えるように接続する。外部記憶装置16は、プログラムやデータなどを格納し、格納している情報を、適宜、プロセッサ11などに提供する。媒体駆動装置17は、メモリ12や外部記憶装置16のデータを可搬記憶媒体18に出力することができ、また、可搬記憶媒体18からプログラムやデータ等を読み出すことができる。ここで、可搬記憶媒体18は、フレキシブルディスク、Magnet−Optical(MO)ディスク、Compact Disc Recordable(CD−R)やDigital Versatile Disk Recordable(DVD−R)を含む、持ち運びが可能な任意の記憶媒体とすることができる。
図4は、実施形態に係るサーバの構成例を示す。図4は、図2と同じものは、同一の番号を付している。サーバ200は、複数のシステムボードを実装している。サーバ200の各パーティション201(201−1〜201−n)は、1台以上のシステムボード401(401−1〜401−a)を有し、システムボード401は各々が、CPU、メモリ、I/Oポートを備える。システムボード401は、複数のドメイン202、203(203−1〜203−m)、Hypervisor205及び指示部204を動作させる。なお、SCF220は、パーティションが有するシステムボード以外のCPU,メモリなどを使用して動作する。
図5は、エラーに関する情報の格納処理の例を説明する図である。図5は、図2Aの(3)〜(4)の処理を説明する図である。また、図5は、図2と同じものは、同一の番号を付している。パーティション201は、指示部204を有する。パーティション201とSCF220とはCMDパスで接続されており、双方向の通信を行う。SCF220は、制御部223、格納部222、データベース221を有する。エラーに関する情報の格納処理では、まず、指示部204は、停電が発生したことを示すエラー情報の格納依頼を、制御部223の処理への割り込み情報として通知する。次に、制御部223は、割り込み情報を受信すると、格納部222に対して情報の解析を行う指示を出力する。格納部222は、エラー情報の内容や格納日時などを解析し、その後、データベース221にエラー情報を格納する。
図6は、エラーに関する情報の実施例を説明する図である。図6(a)は、エラーに関する情報の実施例であり、図6(b)は、実施例を詳細に説明する図である。データベース221に格納されるエラーに関する情報は、図6(b)のDate、Code、Status、Occured、FRU、Msgのパラメータを有する。図6(a)の実施例におけるパラメータのDateは、「Mar 19 15:05:15 JST 2013」である。Dateは、エラー情報が格納された日時である。実施例は、日本時間(JST)の2013年3月19日15時5分15秒を示している。
図6(a)の実施例におけるパラメータのCodeは、「20−003f01−4080−3215」である。Codeは、エラー情報を示すコードである。実施例のCodeの先頭にある「20」は、エラーの深刻度を示す値である。一例として、Codeの先頭の20は、通知レベルである。停電は、故障ではないため、通知レベルに設定されるのが好ましい。Codeの先頭は、デバイスの交換を推奨するレベルであるのか、又は、予防的に交換を推奨するレベルであるのかを示す情報を表してもよい。実施例のCodeの「003f01」は、部品の識別情報である。一例として、「003f01」は、UPSを表している。これは、停電が発生したことの情報はUPSから通知されるためである。
次に、実施例のCodeの「4080」は、エラー情報に基づいて次にサーバに求めるリアクションに関する情報である。一例として「4080」の前2桁の「40」は、パーティションの電源切断の実施命令を表す。図7で後述するが、停電が発生すると、エラー情報がデータベース221に格納後、パーティションの電源切断が、Codeの情報に基づいて実行される。同様に、「40」は別の数字でもよく、パーティションの強制電源切断の命令や、何ら命令をしないという情報であってもよい。「4080」の後ろ2桁の「80」は、ユーザへの通報を行うかどうかを表す。「80」は別の数字でもよく、ユーザへの通報を行わない情報であってもよい。
実施例のCodeの「3215」は、エラーの事象を表す識別情報である。一例として、「3215」は、停電が発生したことを表す。「3215」は別の数字でもよく、他の故障や障害に関する情報であってもよい。
Status、FRU、Msgなどのパラメータは、実施例のCodeが含む情報をユーザに分かりやすく表示するために用いられる。図6(a)の実施例におけるパラメータのStatusは、「Notice」である。Statusは、エラーの深刻度を表す。Statusは、実施例のCodeの先頭にある「20」をユーザに分かりやすく表示するために用いられる。StatusのNoticeは、通知レベルを表している。
図6(a)の実施例におけるOccurredは、「Mar 19 15:05:04.611 JST 2013」である。Occurredは、エラーが発生した日時を表す。実施例は、日本時間(JST)の2013年3月19日15時5分4秒611を示している。
図6(a)の実施例におけるFRUは、UPSである。FRUは、エラーが起こった部品を表す情報である。FRUは、実施例のCodeの「003f01」をユーザに分かりやすく表示するために用いられる。図6(a)の実施例におけるMsgは、「The Machine Administration detected a power failure.」である。Msgは、エラーの内容を示す情報である。Msgは、図6(a)の実施例の「3215」をユーザに分かりやすく表示するために用いられる。
Date、Code、Status、Occured、FRU、Msgなどのパラメータは順番をエラー情報の順番を限定するものではない。また、パラメータに使用される番号やコードは、例示した内容に限定されない。
図7は、サーバの電源を切断する処理の例を説明する図である。図7は、図2と同じものは、同一の番号を付している。パーティション201は、Hypervisor205及びシステムボード401を有する。パーティション201とSCF220とはCMDパスで接続されており、双方向の通信を行う。SCF220は、制御部223、ハード管理部241、判定部231、データベース221を有する。ハード管理部241は、システムボード401に故障がないかの確認処理、動作停止処理、電源切断処理、FANの回転停止・温度・電圧監視を停止する処理を行う。サーバの電源を切断する処理は、図5に示したエラーに関する情報がデータベース221に格納された後に実行される。
サーバの電源を切断する処理では、まず判定部231は、データベース221に格納されたエラーに関する情報を解析する。判定部231は、エラーに関する情報に、パーティションの電源切断の実施を表すコードが含まれるかを判定する。パーティションの電源切断の実施を表すコードがエラーに関する情報に含まれていた場合、判定部231は、パーティションの電源切断を制御部223に指示する。制御部223は、各パーティションのHypervisor205に対して全ドメインの稼動状態に関する情報の取得を依頼し、併せて全ドメインへのシャットダウン要求を出力する。制御部222は、取得した全ドメインの稼動状態に関する情報をデータベース221に格納する。Hypervisor205は、全ドメインのシャットダウンが完了すると、処理が終了したことを制御部223に通知する。全ドメインがシャットダウンすると、ハード管理部241は、システムボード401に故障がないかの確認処理を行い、システムボード401の動作及び電源の停止などの処理を行う。
図8は、ドメインの稼動状態に関する情報の例を説明する図である。ドメインの稼動状態に関する情報は、Partition ID、Status、Resourceのパラメータを有する。Patition IDは、パーティション毎に割り当てられるシステム内で一意な識別情報である。Statusは、パーティション毎の稼動状態である。一例として、稼働中のパーティションはON、停止中のパーティションはOFFと表される。Resourceは、パーティションに実装されているシステムボードの番号を示す。
更に、図8は、パーティション毎に、Domain num、Domain Name、Domain Status、Domain Resourceのパラメータを有する。Domain numは、パーティション内のドメインの数である。Domain Nameは、ユーザが予め設定したドメイン名である。次に、Domain Statusは、ドメインの稼動状態である。一例として、稼動中のドメインはON、停止中のドメインはOFFと表される。Domain Resourceは、ドメインに割り当てられているCPU、メモリ、I/O情報である。
なお、ドメインの稼動状態に関する情報は、Hypervisor205によって収集される。Hypvervisor205は、制御部223からドメインの稼動状態に関する情報の取得する指示を受信すると、パーティションで稼動状態にあるドメインの情報を収集する。
図9は、サーバの電源投入処理の例を説明する図である。図9は、図2と同じものは、同一の番号を付している。パーティション201は、Hypervisor205及びシステムボード401を有する。パーティション201とSCF220とはCMDパスで接続されており、双方向の通信を行う。SCF220は、制御部223、ハード管理部241、判定部231、データベース221、電源投入部232を有する。電源投入処理は、停電から復旧した後に実行される。
停電から復旧し、UPS210に電力が供給されると、UPS210は、電力供給を再開する。電力が供給されると、SCF220は起動する。判定部231は、データベース221のエラーに関する情報に停電発生があったかを判定する。また、判定部231は、ドメインの稼動状態に関する情報を確認し、停電前にパーティション・ドメインが稼動中であったものを確認する。電源投入部232は、パーティションの電源投入処理として、まずシステムボード401の電源投入要求をハード管理部241に出力する。ハード管理部241は、システムボード401の電源を投入する。制御部223は、Hypervisor205にドメインの起動要求を出力する。Hypervisor205はドメインを起動する。
図10は、仮想システムを一括して停止する処理の例を説明するフローチャートである。停電が発生して、UPS210への電力供給が途絶えると、UPS210は、内蔵バッテリーに蓄えた電力を使ってシステムへの電力供給をする(ステップS101)。UPS210は、停電が発生したことを指示部204に通知する(ステップS102)。指示部204は、停電が発生したことをSCF220に通知する(ステップS103)。SCF220の格納部222は、停電が発生したことを示すエラー情報をデータベース221に格納する(ステップS104)。
制御部223は、Hypervisor205に対してドメインの稼動状態に関する情報の取得及び稼動中のドメインにシャットダウン要求を出力する(ステップS105)。制御部223は、パーティションの電源切断を実施する(ステップS106)。UPS210は、一定時間経過後、SCF220への電力供給を停止する(ステップS107)。
なお、S102に記載の停電が発生したという情報は、SNMP(Simple Network Management Protocol)トラップなどによりLANを使って通知される。S103に記載の停電が発生したという情報は、CMDパスを使って通知される。S105において、制御部223は、CMDパスを使ってHypervisor205に現在稼動しているドメインの情報の取得要求を出力する。制御部223は、取得した現在稼動しているドメインの情報を、データベース221に格納する。その後、制御部223は、CMDパスを使ってHypervisor205に、現在稼動しているドメインのシャットダウンを要求する。制御部223は、CMDパスを使ってHypervisor205と通信を行い、シャットダウンの完了を監視する。S106において、SCF220は、稼動中のドメインのシャットダウンを確認後に、パーティションの電源切断処理を行う。
S104において、エラー情報がデータベース221に格納されると、ユーザに停電が発生したことを通知するようにしてもよい。S107において、UPS210は、電力供給を停止する前に停電が復旧しても、SCF220に対する電力供給を停止する。これは、停電処理を開始しているため、確実にSCF220を停止するのが好ましいためである。
図11は、仮想システムを停電発生前の状態に戻す処理の例を説明するフローチャートである。電力が復旧する(ステップS201)。UPS210は、サーバ200に対して電力供給を再開する(ステップS202)。電源供給が再開されると、SCF220は、起動処理を開始する(ステップS203)。判定部231は、データベース221のエラーに関する情報を確認する(ステップS204)。判定部231は、データベース221のエラーに関する情報から、停電が発生していたかを判定する(ステップS205)。電源投入部232は、停電によりシャットダウン処理が行われたパーティションの電源を投入する(ステップS206、ステップS205でYES)。制御部223は、各パーティションのHypervisor205に対して、停電によりシャットダウン処理が行われたドメインの起動を要求する(ステップS207)。Hypervisor205は、停電によりシャットダウン処理が行われたドメインのOSをブートして、停電前の状態に戻す(ステップS208)。サーバ200は、仮想システムを停電発生前の状態に戻す処理を終了する。
S204において、判定部231は、停電が発生したことを示すエラー情報、停電前に稼動していたパーティションがあるか、停電前に稼動していたドメインがあるかを確認する。S206において、パーティションの電源投入が開始されると、SCF220は、パーティションの動作に使用されるCPU、メモリ、I/Oの初期化をする。並列して、SCF220は、パーティションの動作に使用されるCPU、メモリ、I/Oの正常性の診断を行う。S207において、ドメインの起動の要求は、CMDパスを使用して通知される。併せて、SCF220は、パーティションの動作に使用されるCPU、メモリ、I/Oの初期化をする。また、SCF220は、パーティションの動作に使用されるCPU、メモリ、I/Oの正常性の診断を行う。
図12は、エラーに関する情報の格納処理の例を説明するフローチャートである。SCF220の制御部223は、指示部204により発行される停電が発生したことを示すエラー情報の格納依頼を、割り込み情報として受信する(ステップS301)。制御部223は、割り込み情報を受信すると、格納部222に対して情報の解析を行う指示を出力する(ステップS302)。格納部222は、エラー情報の内容や格納日時などを解析する(ステップS303)。格納部222は、データベース221にエラー情報を格納する(ステップS304)。サーバ200は、エラーに関する情報の格納処理を終了する。
図13は、サーバの電源を切断する処理の例を説明するフローチャートである。図13は、図10のステップS105〜106を詳細に説明したフローチャートである。判定部231は、データベース221に格納されたエラーに関する情報を解析する(ステップS401)。判定部231は、エラーに関する情報に、パーティションの電源切断の実施を表すコードが含まれるかを判定する(ステップS402)。判定部231は、パーティションの電源切断を制御部223に指示する(ステップS403、ステップS402でYES)。制御部223は、パーティションの電源切断処理を開始する(ステップS404)。制御部223は、各パーティションのHypervisor205に対して全ドメインの稼動状態に関する情報の取得を依頼し、併せて全ドメインへのシャットダウン要求を出力する。制御部222は、取得した全ドメインの稼動状態に関する情報をデータベース221に格納する。Hypervisor205は、全ドメインのシャットダウンが完了すると、処理が終了したことを制御部223に通知する(ステップS405)。ハード管理部241は、システムボード401に故障がないかの確認処理を行い、システムボード401の動作及び電源の停止などの処理を行う(ステップS406)。サーバ200は、サーバの電源を切断する処理を終了する。
図14は、サーバの電源投入処理の例を説明するフローチャートである。図14は、図11の処理をより詳細に説明したフローチャートである。停電から復旧し、UPS210に電力が供給されると、UPS210は、電力供給を再開する(ステップS501)。電力が供給されると、SCF220は起動する(ステップS502)。判定部231は、データベース221のエラーに関する情報を確認する(ステップS503)。判定部231は、データベース221のエラーに関する情報から、停電が発生していたかを判定する(ステップS504)。判定部231は、パーティションの電源投入の要求を電源投入部232に出力する(ステップS505、ステップS504でYES)。電源投入部232は、パーティションの電源投入処理として、まずシステムボード401の電源投入要求をハード管理部241に出力する(ステップS506)。ハード管理部241は、システムボード401の電源を投入する(ステップS507)。制御部223は、Hypervisor205にドメインの起動要求を出力する(ステップS508)。Hypervisor205はドメインを起動する(ステップS509)。
S503において、判定部231は、停電が発生したことを示すエラー情報、停電前に稼動していたパーティションがあるか、停電前に稼動していたドメインがあるかを確認する。
以上、説明したように、実施形態にかかる方法では、サーバは、停電発生時に稼動状態にあったドメイン及びパーティションに関する情報をデータベースに保持する。停電から復旧すると、サーバは、停電発生時に稼動状態にあったドメイン及びパーティションを自動的に起動することができる。
100 サーバ
101−1〜101−n パーティション
102 コントロールドメイン
103−1〜103−m ゲストドメイン
104 指示部
110 UPS
200 サーバ
201−1〜201−n パーティション
202 コントロールドメイン
203−1〜203−m ゲストドメイン
204 指示部
205 Hypervisor
210 UPS
220 SCF
221 データベース
222 格納部
223 制御部
231 判定部
232 電源投入部
241 ハード管理部
401 システムボード

Claims (12)

  1. 電源装置に接続された情報処理装置であって、
    停電発生の通知を受けたときに、前記情報処理装置内に実装されている仮想マシンの稼働状態を表す情報を取得して記憶部に格納する格納部と、
    前記停電発生の通知を受けたときに、稼働中の仮想マシンを停止させ、その後、前記情報処理装置内のハードウェアへの電力の供給を停止する停止制御部と、
    前記情報処理装置への電力の供給が開始されたときに、前記記憶部に格納されている情報に基づいて前記仮想マシンを起動する起動制御部と、を有する
    ことを特徴とする情報処理装置。
  2. 前記格納部は、停電前の前記仮想マシンの稼動状態、停電前の前記情報処理装置内のハードウェアの稼動状態に関する情報及び、停電に関する情報をメモリに格納する
    ことを特徴とする請求項1記載の情報処理装置。
  3. 前記格納部に格納されている情報に基づいて、前記情報処理装置内のハードウェアを起動する電源投入部を更に有する
    ことを特徴とする請求項2記載の情報処理装置。
  4. 前記停止制御部は、停電が発生すると、前記電源装置が電力を供給している間に、
    稼動中の前記仮想マシンを一括して停止する
    ことを特徴とする請求項1〜3の何れかに記載の情報処理装置。
  5. 停電発生の通知を受けたときに、情報処理装置内に実装されている仮想マシンの稼働状態を表す情報を取得してメモリに格納し、
    前記停電発生の通知を受けたときに、稼働中の仮想マシンを停止させ、その後、前記情報処理装置内のハードウェアへの電力の供給を停止し、
    前記情報処理装置への電力の供給が開始されたときに、前記メモリに格納されている情報に基づいて前記仮想マシンを起動する
    ことを特徴とする仮想マシン制御方法。
  6. 前記メモリは、停電前の前記仮想マシンの稼動状態、停電前の前記情報処理装置内のハードウェアの稼動状態に関する情報及び、停電に関する情報を保持する
    ことを特徴とする請求項5記載の仮想マシン制御方法。
  7. 前記メモリに保持されている情報に基づいて、前記情報処理装置内のハードウェアを起動する
    ことを特徴とする請求項6記載の仮想マシン制御方法。
  8. 停電が発生すると、前記電源装置が電力を供給している間に、
    稼動中の前記仮想マシンを一括して停止する
    ことを特徴とする請求項5〜7の何れかに記載の仮想マシン制御方法。
  9. 停電発生の通知を受けたときに、情報処理装置内に実装されている仮想マシンの稼働状態を表す情報を取得してメモリに格納し、
    前記停電発生の通知を受けたときに、稼働中の仮想マシンを停止させ、その後、前記情報処理装置内のハードウェアへの電力の供給を停止し、
    前記情報処理装置への電力の供給が開始されたときに、前記メモリに格納されている情報に基づいて前記仮想マシンを起動する
    ことを特徴とする仮想マシン制御プログラム。
  10. 停電前の前記仮想マシンの稼動状態、停電前の前記情報処理装置内のハードウェアの稼動状態に関する情報及び、停電に関する情報を前記メモリに保持させる
    ことを特徴とする請求項9記載の仮想マシン制御プログラム。
  11. 前記メモリに保持されている情報に基づいて、前記情報処理装置内のハードウェアを起動させる
    ことを特徴とする請求項10記載の仮想マシン制御プログラム。
  12. 停電が発生すると、前記電源装置が電力を供給している間に、
    稼動中の前記仮想マシンを一括して停止させる
    ことを特徴とする請求項9〜11の何れかに記載の仮想マシン制御方法。
JP2013166784A 2013-08-09 2013-08-09 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム Pending JP2015035175A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013166784A JP2015035175A (ja) 2013-08-09 2013-08-09 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム
US14/330,153 US20150046748A1 (en) 2013-08-09 2014-07-14 Information processing device and virtual machine control method
EP14176887.9A EP2835716A1 (en) 2013-08-09 2014-07-14 Information processing device and virtual machine control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013166784A JP2015035175A (ja) 2013-08-09 2013-08-09 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム

Publications (1)

Publication Number Publication Date
JP2015035175A true JP2015035175A (ja) 2015-02-19

Family

ID=51224717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013166784A Pending JP2015035175A (ja) 2013-08-09 2013-08-09 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム

Country Status (3)

Country Link
US (1) US20150046748A1 (ja)
EP (1) EP2835716A1 (ja)
JP (1) JP2015035175A (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9780836B2 (en) 2014-04-23 2017-10-03 Dell Products L.P. Server information handling system NFC management sideband feedback
US9596149B2 (en) * 2014-04-23 2017-03-14 Dell Products L.P. Server information handling system NFC ticket management and fault storage
US9432798B2 (en) 2014-04-23 2016-08-30 Dell Products L.P. NFC communication with an information handling system supplemented by a management controller
US9331896B2 (en) 2014-04-23 2016-05-03 Dell Products L.P. Server information handling system NFC ticket management and fault storage
US9571165B2 (en) 2014-04-23 2017-02-14 Dell Products L.P. NFC communication with an information handling system supplemented by a management controller and advertised virtual tag memory
US11031804B2 (en) * 2017-11-06 2021-06-08 Nxp B.V. Power controller
US11960905B2 (en) 2020-12-03 2024-04-16 Schneider Electric It Corporation Network-management-card-assisted shutdown of hyperconverged infrastructure

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136765A1 (en) * 2004-12-03 2006-06-22 Poisner David L Prevention of data loss due to power failure
US7484109B2 (en) * 2005-03-31 2009-01-27 Microsemi Corp. - Analog Mixed Signal Group Ltd. Computer volatile memory power backup system
JP2008003735A (ja) 2006-06-21 2008-01-10 Hitachi Ltd 無停電電源装置に接続された情報処理システムの自動停止方式
US20110202728A1 (en) * 2010-02-17 2011-08-18 Lsi Corporation Methods and apparatus for managing cache persistence in a storage system using multiple virtual machines
US8464257B2 (en) * 2010-12-22 2013-06-11 Lsi Corporation Method and system for reducing power loss to backup IO start time of a storage device in a storage virtualization environment
US8707096B2 (en) * 2011-10-12 2014-04-22 Hitachi, Ltd. Storage system, data backup method, and system restarting method of a storage system incorporating volatile and nonvolatile memory devices
JP5835342B2 (ja) * 2011-10-31 2015-12-24 富士通株式会社 情報処理装置、情報処理装置の制御方法、仮想マシン制御プログラム及び情報処理システム

Also Published As

Publication number Publication date
US20150046748A1 (en) 2015-02-12
EP2835716A1 (en) 2015-02-11

Similar Documents

Publication Publication Date Title
JP2015035175A (ja) 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム
US8707290B2 (en) Firmware update in an information handling system employing redundant management modules
US8990632B2 (en) System for monitoring state information in a multiplex system
US20130013956A1 (en) Reducing impact of a repair action in a switch fabric
US20130117518A1 (en) System controller, information processing system and method of saving and restoring data in the information processing system
CN111045866B (zh) 一种bmc故障处理方法、装置、电子设备及存储介质
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
EP2648095B1 (en) System and method for controlling the booting of a computer
US20090171473A1 (en) Storage system, storage system control method and storage system control apparatus
CN110750309A (zh) 可远程控制电子设备的系统及方法
JP2008015803A (ja) ブレード型コンピュータ管理システム
JP6599725B2 (ja) 情報処理装置およびログ管理方法、並びにコンピュータ・プログラム
JP7063315B2 (ja) 情報処理装置、管理プログラム、管理方法、および、情報処理システム
CN111984471A (zh) 一种机柜电源bmc冗余管理系统及方法
JP2014191491A (ja) 情報処理装置および情報処理システム
JP4715552B2 (ja) 障害検出方式
JP2011076127A (ja) 情報処理装置
JP6953710B2 (ja) 計算機システム
JP5549688B2 (ja) 情報処理システム、及び、情報処理システムの制御方法
WO2022230116A1 (ja) 電源供給制御装置、電源供給制御方法、及び電源供給制御プログラム
US20210397240A1 (en) Systems and methods for enabling power budgeting in an information handling system comprising a plurality of modular information handling systems
JP7276526B2 (ja) 情報処理装置、管理プログラム、管理方法、および、情報処理システム
CN111427721B (zh) 异常恢复方法及装置