JP4651127B2 - 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法 - Google Patents

仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法 Download PDF

Info

Publication number
JP4651127B2
JP4651127B2 JP2008133570A JP2008133570A JP4651127B2 JP 4651127 B2 JP4651127 B2 JP 4651127B2 JP 2008133570 A JP2008133570 A JP 2008133570A JP 2008133570 A JP2008133570 A JP 2008133570A JP 4651127 B2 JP4651127 B2 JP 4651127B2
Authority
JP
Japan
Prior art keywords
virtual machine
identifier
power supply
uninterruptible power
list table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008133570A
Other languages
English (en)
Other versions
JP2009282714A (ja
Inventor
夏夫 吾郷
真由 荻野
義明 大島
洋典 ▲高▼木
淳弘 渡邉
Original Assignee
株式会社日立情報システムズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立情報システムズ filed Critical 株式会社日立情報システムズ
Priority to JP2008133570A priority Critical patent/JP4651127B2/ja
Publication of JP2009282714A publication Critical patent/JP2009282714A/ja
Application granted granted Critical
Publication of JP4651127B2 publication Critical patent/JP4651127B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、仮想マシンを構成する仮想化サーバ上で電源障害が発生した場合であっても好適にシャットダウン制御を行うことができる仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法に関する。
近年のコンピュータシステムにおいては、サーバのマシン資源をソフトウェアを使って複数に分割して独立させ、複数台のサーバ上に複数の仮想マシンを同時に稼働させる仮想マシン(VM:Virtual Machine)技術が実現している。この仮想マシン技術は、ハードウェアを仮想化し、その仮想ハードウェア上でOSを動作させる技術であり、仮想的なハードウェアを複数用意することによって同時に複数のOSやアプリケーションを実行することもできる。
尚、前記仮想マシン技術に関する技術が記載された文献としては、例えば下記特許文献1が挙げられる。
特開2005−115653号公報
しかしながら従来技術による仮想マシン技術は、電源障害が発生した場合の対策が充分に考慮されておらず、フェールセーフ機能が不十分であると言う不具合があった。これを具体的に説明すると従来技術による仮想マシン技術は、例えば無停電電源装置と同じネットワーク上に接続されている全ての仮想化サーバにシャットダウン処理の優先順位を設定した設定無停電電源装置監視プログラムを組み込み、無停電電源装置が電源障害を検知した場合、前記監視プログラムが複数の仮想化サーバのシャットダウン処理を行うものであって、複数仮想化サーバが複数の仮想マシンを実行中にもかかわらず、前記設定無停電電源装置監視プログラムに設定した優先順位のみの順番によりシャットダウンを行うため、実行中の仮想マシンの重要度に従ったシャットダウン処理を行うことが困難であると言う不具合があった。
また、従来の仮想マシン技術は、特定の仮想化サーバに電源障害が発生しても他の仮想化サーバにおいて仮想マシンを実行可能な仮想化環境であっても、他の仮想化サーバにおいて仮想マシンを実行することができないと言う不具合があった。
尚、フェールセーフ(fail safe)とは、障害が発生することをあらかじめ想定し、障害が起きた際の被害を最小限にとどめるような工夫をしておくという設計思想を意味する。
本発明の目的は、仮想化サーバ上の仮想マシンを重要度に従って安全にシャットダウンすると共に実行可能な仮想化サーバ上で仮想マシンの実行を継続することができる仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法を提供することである。
前記目的を達成するために本発明は、無停電電源装置が接続され、複数の仮想マシンを実行する複数の仮想化サーバと、該複数の仮想化サーバの電源障害に対するフェールセーフ機能を有するフェールセーフ装置とから構成される仮想マシンコンピュータシステムであって、
前記フェールセーフ装置が、
前記複数の無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する無停電電源装置一覧テーブル部と、
前記複数の仮想化サーバの識別子と該仮想化サーバ識別子に対応した無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する仮想化サーバ一覧テーブル部と、
前記仮想マシンを実行する仮想化サーバの識別子と該仮想化サーバ識別子に対応した仮想マシンの識別子と前記仮想マシンを実行可能な他の仮想化サーバの識別子であるフェールオーバ先識別子とシャッドダウンを優先的に行う仮想マシンを指定するユーザ指定優先度とを格納する仮想マシン一覧テーブル部とを備え、
前記無停電電源装置一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した無停電電源装置識別子を抽出する第1工程と、
該第1工程によって抽出した無停電電源装置識別子に対応する仮想化サーバ識別子を仮想化サーバ一覧テーブル部から抽出する第2工程と、
該第2工程によって抽出した仮想化サーバ識別子の仮想化サーバが実行中の仮想マシンの識別子を前記仮想マシン一覧テーブル部から抽出する第3工程と、
該第3工程によって抽出した仮想マシンを実行可能な仮想化サーバのフェールオーバ先識別子及びユーザ指定優先度を前記仮想マシン一覧テーブル部から抽出する第4工程と、
前記第3工程によって抽出した実行中の仮想マシン識別子が付与された仮想マシンを前記第4工程により抽出したフェールオーバ先識別子の仮想化サーバに移動するフェールオーバを行う第5工程と、
前記第4工程によって抽出したユーザ指定優先度により指定された仮想マシンの動作を優先的に停止する第6工程と、
前記第6工程に続いて前記第2工程によって抽出した仮想化サーバが実行している仮想マシンの動作を停止する第工程とを実行することを第1の特徴とする。
また本発明は、前記第1の特徴の仮想マシンコンピュータシステムにおいて、前記フェールセーフ装置が、
前記複数の無停電電源装置から無停電電源装置の電源障害検出有無情報を検出し、前記検出した電源障害検出有無情報を前記無停電電源装置一覧テーブル部に格納する第7工程を実行することを第2の特徴とする。
また本発明は、前記第2の特徴の仮想マシンコンピュータシステムにおいて、前記フェールセーフ装置が、
前記仮想化サーバ一覧テーブル部から複数の無停電電源装置識別子と該無停電電源装置識別子に対応する電源障害検出有無情報を抽出する第8工程と、
前記無停電電源装置一覧テーブル部から前記第8工程により抽出した無停電電源装置識別子と一致する無停電電源装置識別子の電源障害検出有無情報を仮想化サーバ一覧テーブル部に格納する第9工程とを実行することを含むことを第3の特徴とする。
また本発明は、前記第3の特徴の仮想マシンコンピュータシステムにおいて、前記フェールセーフ装置が、
前記仮想化サーバ一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した仮想マシン識別子を抽出する第10工程と、
前記仮想マシン一覧テーブル部から前記第10工程により抽出した仮想マシン識別子の仮想マシン実行中の仮想化サーバ識別子並びにフェールオーバ先識別子を抽出する第11工程と、
前記第11工程により抽出したフェールオーバ先識別子に対応する他の仮想化サーバに実行中の仮想マシンを移動させる第12工程とを実行することを第4の特徴とする。
また本発明は、前記第1の特徴の仮想マシンコンピュータシステムにおいて、前記フェールセーフ装置が、
前記第10工程により抽出した仮想マシン識別子の仮想マシンの実行を動作を停止する第12工程とを実行することを含むことを第5の特徴とする。
更に本発明は、無停電電源装置が接続され、複数の仮想マシンを実行する複数の仮想化サーバと、該複数の仮想化サーバの電源障害に対するフェールセーフ機能を有するフェールセーフ装置とから構成される仮想マシンコンピュータシステムのフェールセーフ方法であって、
前記フェールセーフ装置に、
前記複数の無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する無停電電源装置一覧テーブル部と、
前記複数の仮想化サーバの識別子と該仮想化サーバ識別子に対応した無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する仮想化サーバ一覧テーブル部と、
前記仮想マシンを実行する仮想化サーバの識別子と該仮想化サーバ識別子に対応した仮想マシンの識別子と前記仮想マシンを実行可能な他の仮想化サーバの識別子であるフェールオーバ先識別子とシャッドダウンを優先的に行う仮想マシンを指定するユーザ指定優先度とを格納する仮想マシン一覧テーブル部とを備え、
前記無停電電源装置一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した無停電電源装置識別子を抽出する第1工程と、
該第1工程によって抽出した無停電電源装置識別子に対応する仮想化サーバ識別子を仮想化サーバ一覧テーブル部から抽出する第2工程と、
該第2工程によって抽出した仮想化サーバ識別子の仮想化サーバが実行中の仮想マシンの識別子を前記仮想マシン一覧テーブル部から抽出する第3工程と、
該第3工程によって抽出した仮想マシンを実行可能な仮想化サーバのフェールオーバ先識別子及びユーザ指定優先度を前記仮想マシン一覧テーブル部から抽出する第4工程と、
前記第3工程によって抽出した実行中の仮想マシン識別子が付与された仮想マシンを前記第4工程によって抽出したフェールオーバ先識別子の仮想化サーバに移動するフェールオーバを行う第5工程と、
前記第4工程によって抽出したユーザ指定優先度により指定された仮想マシンの動作を優先的に停止する第6工程と、
前記第6工程に続いて前記第2工程によって抽出した仮想化サーバが実行している仮想マシンの動作を停止する第工程とを実行することを第6の特徴とする。
また本発明は、前記第6の特徴のフェールセーフ方法において、前記フェールセーフ装置に、
前記複数の無停電電源装置から無停電電源装置の電源障害検出有無情報を検出し、前記検出した電源障害検出有無情報を前記無停電電源装置一覧テーブル部に格納する第7工程を実行することを第7の特徴とする。
また本発明は、前記第7の特徴のフェールセーフ方法において、前記フェールセーフ装置に、
前記仮想化サーバ一覧テーブル部から複数の無停電電源装置識別子と該無停電電源装置識別子に対応する電源障害検出有無情報を抽出する第8工程と、
前記無停電電源装置一覧テーブル部から前記第8工程により抽出した無停電電源装置識別子と一致する無停電電源装置識別子の電源障害検出有無情報を仮想化サーバ一覧テーブル部に格納する第9工程とを実行することを含むことを第8の特徴とする。
また本発明は、前記第8の特徴のフェールセーフ方法において、前記フェールセーフ装置に、
前記仮想化サーバ一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した仮想マシン識別子を抽出する第10工程と、
前記仮想マシン一覧テーブル部から前記第10工程により抽出した仮想マシン識別子の仮想マシン実行中の仮想化サーバ識別子並びにフェールオーバ先識別子を抽出する第11工程と、
前記第11工程により抽出したフェールオーバ先識別子に対応する他の仮想化サーバに実行中の仮想マシンを移動させる第12工程とを実行することを第9の特徴とする。
また本発明は、前記第9の特徴のフェールセーフ方法において、前記フェールセーフ装置に、
前記第10工程により抽出した仮想マシン識別子の仮想マシンの実行を動作を停止する第12工程とを実行することを含むことを第10の特徴とする。
本発明による仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法は、フェールセーフ装置が、スケジュールに従って仮想化サーバの電源監視を行う工程と、該監視により電源障害を検出したときにフェールオーバ先の仮想化サーバを検索する工程と、仮想マシンのフェールオーバを実行する工程と、障害が発生した仮想マシンのシャットダウンを行う工程とを順次行うことによって、障害が発生した仮想化サーバ上の仮想化マシンを他の仮想化サーバに移動した後に障害が発生した仮想化サーバをシャットダウンすることができる。
以下、本発明によるフェールセーフ方法を適用した仮想マシンコンピュータシステムの一実施形態を図面を参照して詳細に説明する。図1は本実施形態によるフェールセーフ機能を実現する仮想マシンコンピュータシステムの全体構成図、図2は本実施形態による仮想化環境のフェールセーフ装置150の動作フローチャート図、図3は本実施形態による無停電電源装置監視部115の動作フローチャート図、図4は本実施形態による仮想化サーバ監視部125の動作フローチャート図、図5は本実施形態による仮想マシン移動処理部135の動作フローチャート図、図6は本実施形態によるシャットダウン処理部140の動作フローチャート図、図7は本実施形態による無停電電源装置一覧テーブル部110を示す図、図8は本実施形態による仮想化サーバ一覧テーブル部120を示す図、図9は本実施形態による仮想マシン一覧テーブル部130を示す図である。
[構成]
本実施形態による仮想マシンコンピュータシステムは、図1に示す如く、無停電電源装置160が接続され、仮想マシン164及び166を構成して実行する仮想化サーバ162と、無停電電源装置170が接続され、仮想マシン174及び176を構成して実行する仮想化サーバ172と、無停電電源装置180が接続され、前記仮想化サーバ162及び172を管理するための仮想化サーバ管理サーバ185と、仮想化環境において電源障害に対するフェールセーフ機能を有する本実施形態の特徴であるフェールセーフ装置150と、前記仮想化サーバ162及び172と仮想化サーバ管理サーバ185とフェールセーフ装置150とを接続するネットワーク187とから構成される。
前記フェールセーフ装置150は、予め設定したスケジュールにより電源障害発生の有無を各無停電電源装置160他に問合せ、この電源障害情報を収集する無停電電源装置監視部115と、該無停電電源装置監視部115が収集した電源障害情報を無停電電源装置の識別子に対応して格納する無停電電源装置一覧テーブル部110と、後述する仮想化サーバの一覧情報を格納する仮想化サーバ一覧テーブル部120と、前記無停電電源装置監視部115が無停電電源装置の電源障害を検知したとき、電源障害のステータス(電源障害情報)を仮想化サーバ一覧テーブル部120に格納する仮想化サーバ監視部125と、前記仮想化サーバ一覧テーブル部120に登録された電源障害情報を監視し、仮想マシン一覧テーブル部130を検索して、前記仮想化サーバ162上で動作する仮想マシン164及び166の内、フェールオーバ処理が予め設定されている仮想マシンに対してフェールオーバ処理(障害が発生したときに代替サーバが処理やデータを引き継ぐ機能)を行う仮想マシン移動処理部135と、前記仮想化サーバ一覧テーブル部120に登録された電源障害のステータスを監視し、仮想マシン一覧テーブル部130を検索して、前記仮想化サーバ162上で動作する仮想マシン164及び166に対して仮想マシン一覧テーブル部130のユーザ指定優先度とCPUリソース割当てを判断することにより、仮想マシンのシャットダウン処理順を決定し、仮想マシンのシャットダウン処理を行うシャットダウン処理部140と、これらを制御する図示しない制御部やメモリとから構成される。尚、前記制御部は、後述する電源障害が発生した無停電電源装置や仮想化サーバの数を計数するためのカウンタをメモリ上にて管理する。
前記無停電電源装置一覧テーブル部110に登録されるデータフォーマットは、図7に示す如く、無停電電源装置毎にユニークに付与された識別子710と、検出した電源装置の電源障害情報(「電源障害中」又は「未検出」)が格納される電源障害検出有無情報740の各欄とから構成され、例えば識別子710が「160」の仮想化サーバが「電源障害中」の如く登録される。
仮想化サーバ一覧テーブル部120のデータフォーマットは、図8に示す如く、仮想化サーバ毎に採番された仮想化サーバ識別子810と、該仮想化サーバの種別を示すサーバ種別820と、該サーバの電源投入状態を示すサーバ電源状態830と、接続されている無停電電源装置の識別子を示す無停電電源装置識別子840と、電源障害の検出有無を示す電源障害検出有無情報850の各欄から構成され、例えば、仮想化サーバ識別子810欄に識別子「164」、サーバ種別820欄に「仮想マシン実行」、サーバ電源状態830欄に「電源ON」、無停電電源装置識別子840欄に識別子「160」、電源障害検出有無情報850欄に「電源障害中」の如く各情報が登録され、これら登録は、識別子「164」の仮想化サーバが、識別子「160」の無停電電源装置が接続されたサーバ上において電源ONとして実行中であり、電源障害が検出されていることを表している。
前記仮想マシン一覧テーブル部130のデータフォーマットは、図9に示す如く、仮想マシンを実行するサーバの識別子である仮想化サーバ識別子910と、該仮想マシンの識別子を示す仮想マシン識別子920と、該仮想マシンの起動又は停止状態を示す起動停止状態930と、該仮想マシンを他のサーバにて実行する際の移行先仮想化サーバの識別子であるフェールオーバ先識別子940と、ユーザが仮想マシンの重要度等から予め設定した優先度を示すユーザ指定優先度950と、該仮想化サーバが仮想マシンに割り当てるCPUリソースを示すCPUリソース割当960の各欄とから構成されている。
前記仮想マシン一覧テーブル部130に登録される情報は、例えば、仮想化サーバ識別子91欄に識別子「164」、仮想マシン識別子920欄に「162」、起動停止状態930欄に「起動」、フェールオーバ先940欄に「174」、ユーザ指定優先度950欄に「なし」、CPUリソース割当960欄に「500MHz」の如く登録され、これら情報は、識別子「162」の仮想マシンを識別子「164」のサーバが起動中であり、この仮想マシンのフェールオーバ先のサージ識別子が「174」、ユーザ優先度が「なし」、CPUリソース割当が「500MHz」であることを表している。尚。図中の符号190は、CD−ROM装置またはフレキシブルディスク装置を示し、符号195は、本実施形態による仮想化環境におけるフェールセーフ機能のプログラムを格納したCD−ROMまたはフレキシブルディスクを示す。
[動作]
次に前述のように構成した仮想マシンコンピュータシステムの電源障害発生時の全体動作を図2を参照して説明する。
[全体動作]
本実施形態による仮想マシンコンピュータシステムのフェールセーフ装置150は、図2に示す如く、無停電電源装置一覧テーブル部110及び仮想化サーバ一覧テーブル部10の電源障害検出有無に未検出フラグを設定するステップ210と、予め設定された無停電電源装置監視スケジュールに従って無停電電源装置監視部115を用いてサーバの電源状態を監視し、電源障害有無を確認するステップ215と、該ステップ215によって電源障害を検出したか否かを判定するステップ220と、該ステップ220により電障害有りと判定したとき、仮想化サーバ監視部125を用いて電源障害を検出した無停電電源装置に対応する仮想化サーバの一覧を仮想化サーバ一覧テーブル部120から検索して抽出するステップ225と、該ステップ225により抽出した仮想化サーバの数が0以上か否かを判定するステップ230と、該ステップ203において0以上(電源障害が発生した仮想化サーバが有る)と判定したとき、仮想マシン移動処理部135を用いて仮想マシンのフェールオーバを仮想マシンの優先度や必要とするリソースに応じて実行するステップ235と、シャットダウン処理部140を用いて前記フェールオーバを行った障害が発生した仮想マシンのシャットダウン(停止)を行うステップ245とを実行し、前記ステップ210に戻るように動作する。
このように本実施形態によるフェールセーフ装置150は、無停電電源装置監視部115を用いて電源障害が発生している仮想化サーバを検出する工程と、電源障害が発生している判定したとき、仮想化サーバ監視部125が仮想化サーバ一覧テーブル部120を参照し電源障害が発生した仮想化サーバの識別子を判定する工程と、この電源障害が発生した仮想化サーバ上の仮想化マシンを他の仮想化サーバに割り当てる(移動させる)フェールオーバ処理を実行する工程と、前記電源障害が発生した仮想化サーバをシャットダウンさせる工程とを順次行うことによって、障害が発生した仮想化サーバ上の仮想化マシンを他の仮想化サーバに移動した後に障害が発生した仮想化サーバをシャットダウンすることができる。
前記フェールセーフ装置150他による動作の詳細を次に図3以降を参照して詳細に説明する。
[無停電電源装置監視部の動作]
前記無停電電源装置監視部115は、前記ステップ215において、図3に示す如く、無停電電源装置の電源障害カウンタ値に数値「0」を代入するステップ319と、無停電電源装置一覧テーブル部110から無停電電源装置情報を1件読み出すステップ320と、無停電電源装置一覧テーブル部110の最終データ読込み済みか否かを判定するステップ330と、該ステップ330により終了と判定したときに無停電電源装置の電源障害カウンタ値をリターン値に設定するステップ370と、前記ステップ330により最終データ読込み済みでないと判定したとき、前記ステップ320により読み出した無停電電源装置に電源状態の問い合わせを行って電源障害情報を入手するステップ350と、該ステップ350により入手した電源障害情報の内容が電源障害検出中か否かを判定し、電源障害検出中でないと判定したときに前記ステップ320に戻るステップ355と、該ステップ355において電源障害検出中であると判定したとき、該電源障害情報を無停電電源装置一覧テーブル部110の電源障害検出有無情報欄740に電源が障害中であることを格納するステップ360と、無停電電源装置の電源障害カウンタを+1カウントアップしてから前記ステップ320に戻るステップ365とを実行する。
この処理によって本実施形態による無停電電源装置監視部115は、無停電電源装置一覧テーブル部110から仮想化サーバに接続された全ての無停電電源装置情報を取得し、読み出した無停電電源装置情報毎に電源障害情報の問い合わせ、電源に障害があることを検出したときには当該障害情報を無停電電源装置一覧テーブル部110に登録するように動作する。
[仮想化サーバ監視部の動作]
次に本実施形態による仮想化サーバ監視部125の動作を図4を参照して説明する。本仮想化サーバ監視部125は、前記ステップ235において、仮想化サーバの電源障害カウンタの値に「0」を代入するステップ410と、仮想化サーバ一覧テーブル部120から仮想化サーバの識別子に対応した仮想化サーバ情報(図8)を1件読み出すステップ420と、前記仮想化サーバ一覧テーブル部120からの最終データ読み込み済みか否かを判定するステップ430と、該ステップ430において最終読み込み済みと判定したとき、仮想化サーバの電源障害カウンタの値を+1カウントアップするステップ480と、前記ステップ430において最終読み込み済みでないと判定したとき、無停電電源装置識別子が一致する無停電電源装置の情報(図7)を無停電電源装置一覧テーブル部110から抽出し、この抽出した無停電電源装置の電源障害検出有無情報740を仮想化サーバ一覧テーブル部120の電源障害検出有無情報840として格納するステップ440と、前記電源障害検出有無情報840が「電源障害中」か否かを判定し、「電源障害中」でないと判定したときに前記ステップ420に戻るステップ450と、該ステップ450において「電源障害中」と判定したとき、仮想化サーバの電源障害カウンタを+1カウントアップするステップ470とを順次実行する。
これら一連の処理によって本実施形態による仮想化サーバ監視部125は、仮想化サーバ一覧テーブル部120から読み出した無停電電源装置の識別子の無停電電源装置の電源障害検出有無情報を無停電電源装置一覧テーブル部110から抽出し、前記読み出した電源障害検出有無情報が「電源障害中」のとき、この障害情報を仮想化サーバ一覧テーブル部120に格納することによって、仮想化サーバの電源障害を仮想化サーバ一覧テーブル部120に更新(反映)することができる。
[仮想マシン移動部の動作]
本実施形態によるシャットダウン処理部140は、前記ステップ245において、図5に示す如く、仮想化サーバ管理サーバ185が電源障害が発生した仮想化サーバか否かを判定し、仮想化サーバ管理サーバ185が電源障害の対象サーバと判定したときに処理を終了するステップ510と、該ステップ510において仮想化サーバ管理サーバ185が電源障害の対象サーバでないと判定したとき、仮想化サーバ一覧テーブル部120から電源障害中の仮想化サーバを1件読み出すステップ520と、電源障害中の仮想化サーバを仮想化サーバ一覧テーブル部120から全て読込み済みか否かを判定し、読み出し済みでないと判定したときに処理を終了するステップ530と、仮想マシン一覧テーブル部130から電源障害中の仮想化サーバ162上で稼働中且つフェールオーバ後も電源障害の影響を受けない仮想マシン識別子を1件読み出すステップ540と、仮想マシン一覧テーブル部130からフェールオーバ先識別子を読み出し、仮想化サーバ管理サーバ185にフェールオーバ処理を依頼するステップ560と、仮想マシン一覧テーブル部130の仮想化サーバ識別子をフェールオーバ先の仮想化サーバに変更するステップ565と、仮想マシン一覧テーブル部130のフェールオーバ先の設定を、フェールオーバ前の仮想化サーバに変更するステップ570とを順次実行する。
これら一連の処理によって本実施形態によるシャットダウン処理部140は、前記障害が発生した仮想マシンを仮想マシンの優先度や必要とするリソースに応じて他の仮想化サーバにフェールオーバすることができる。
[シャットダウン処理部の動作]
次に前記シャットダウン処理部140のシャットダウン処理を図6を参照して説明する。このシャットダウン処理は、シャットダウン処理部140が、前述したステップ245において、仮想化サーバ一覧テーブル部120から電源障害検出中の仮想化サーバ情報を1件読み出すステップ620と、該ステップ620により読み出した電源障害検出中の仮想化サーバ件数がゼロ件か否かを判定し、ゼロ件のときに図2のステップ210に戻るステップ630と、該ステップ630においてゼロ件でないと判定したとき、仮想化サーバ上で稼働中の仮想マシン識別子を仮想マシン一覧テーブル部130からユーザ指定の優先度とCPU利用率とメモリ容量などのリソースパラメタの優先度順に1件読み出すステップ640と、仮想マシン一覧テーブル部130中の仮想マシン数がゼロ件か否かを判定し、ゼロ件のときに前記ステップ620に戻るステップ650と、仮想マシン一覧テーブル部130から該当仮想マシンに対応する移動先の仮想化サーバを検出し、この仮想化サーバに対して仮想マシン停止コマンドを発行して前記ステップ620に戻るステップ670とを順次実行することによって、障害が発生した仮想マシンのシャットダウンを行うように動作する。
このように本実施形態による仮想マシンコンピュータシステムは、フェールセーフ装置150が、スケジュールに従って無停電電源装置監視部115による仮想化サーバの電源監視を行う工程と、該監視により電源障害を検出したときに仮想化サーバ監視部125によりフェールオーバ先の仮想化サーバを検索する工程と、仮想マシン移動処理部135による仮想マシンのフェールオーバを実行する工程と、シャットダウン処理部140により障害が発生した仮想マシンを実行する仮想化サーバのシャットダウンを行う工程とを順次行うことによって、障害が発生した仮想化サーバ上の仮想化マシンを他の仮想化サーバに移動した後に障害が発生した仮想化サーバをシャットダウンすることができる。
本発明の一実施形態仮想マシンコンピュータシステムの全体構成図。 本実施形態による仮想化環境のフェールセーフ装置150の動作フローチャート図。 本実施形態による無停電電源装置監視部115の動作フローチャート図。 本実施形態による仮想化サーバ監視部125の動作フローチャート図。 本実施形態による仮想マシン移動処理部135の動作フローチャート図。 本実施形態によるシャットダウン処理部140の動作フローチャート図。 本実施形態による無停電電源装置一覧テーブル部110を示す図。 本実施形態による仮想化サーバ一覧テーブル部120を示す図。 本実施形態による仮想マシン一覧テーブル部130を示す図。
符号の説明
10:仮想化サーバ一覧テーブル、91:仮想化サーバ識別子、110:無停電電源装置一覧テーブル、115:無停電電源装置監視部、120:仮想化サーバ一覧テーブル、130:仮想マシン一覧テーブル、125:仮想化サーバ監視部、135:仮想マシン移動処理部、140:シャットダウン処理部、150:フェールセーフ装置、160:無停電電源装置、162:仮想化サーバ、164:仮想マシン、180:無停電電源装置、185:仮想化サーバ管理サーバ、187:ネットワーク。

Claims (10)

  1. 無停電電源装置が接続され、複数の仮想マシンを実行する複数の仮想化サーバと、該複数の仮想化サーバの電源障害に対するフェールセーフ機能を有するフェールセーフ装置とから構成される仮想マシンコンピュータシステムであって、
    前記フェールセーフ装置が、
    前記複数の無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する無停電電源装置一覧テーブル部と、
    前記複数の仮想化サーバの識別子と該仮想化サーバ識別子に対応した無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する仮想化サーバ一覧テーブル部と、
    前記仮想マシンを実行する仮想化サーバの識別子と該仮想化サーバ識別子に対応した仮想マシンの識別子と前記仮想マシンを実行可能な他の仮想化サーバの識別子であるフェールオーバ先識別子とシャッドダウンを優先的に行う仮想マシンを指定するユーザ指定優先度とを格納する仮想マシン一覧テーブル部とを備え、
    前記無停電電源装置一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した無停電電源装置識別子を抽出する第1工程と、
    該第1工程によって抽出した無停電電源装置識別子に対応する仮想化サーバ識別子を仮想化サーバ一覧テーブル部から抽出する第2工程と、
    該第2工程によって抽出した仮想化サーバ識別子の仮想化サーバが実行中の仮想マシンの識別子を前記仮想マシン一覧テーブル部から抽出する第3工程と、
    該第3工程によって抽出した仮想マシンを実行可能な仮想化サーバのフェールオーバ先識別子及びユーザ指定優先度を前記仮想マシン一覧テーブル部から抽出する第4工程と、
    前記第3工程によって抽出した実行中の仮想マシン識別子が付与された仮想マシンを前記第4工程により抽出したフェールオーバ先識別子の仮想化サーバに移動するフェールオーバを行う第5工程と、
    前記第4工程によって抽出したユーザ指定優先度により指定された仮想マシンの動作を優先的に停止する第6工程と、
    前記第6工程に続いて前記第2工程によって抽出した仮想化サーバが実行している仮想マシンの動作を停止する第工程とを実行する仮想マシンコンピュータシステム。
  2. 前記フェールセーフ装置が、
    前記複数の無停電電源装置から無停電電源装置の電源障害検出有無情報を検出し、前記検出した電源障害検出有無情報を前記無停電電源装置一覧テーブル部に格納する第7工程を実行する請求項1記載の仮想マシンコンピュータシステム。
  3. 前記フェールセーフ装置が、
    前記仮想化サーバ一覧テーブル部から複数の無停電電源装置識別子と該無停電電源装置識別子に対応する電源障害検出有無情報を抽出する第8工程と、
    前記無停電電源装置一覧テーブル部から前記第8工程によって抽出した無停電電源装置識別子と一致する無停電電源装置識別子の電源障害検出有無情報を仮想化サーバ一覧テーブル部に格納する第9工程とを実行することを含む請求項2記載の仮想マシンコンピュータシステム。
  4. 前記フェールセーフ装置が、
    前記仮想化サーバ一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した仮想マシン識別子を抽出する第10工程と、
    前記仮想マシン一覧テーブル部から前記第10工程によって抽出した仮想マシン識別子の仮想マシン実行中の仮想化サーバ識別子並びにフェールオーバ先識別子を抽出する第11工程と、
    前記第11工程によって抽出したフェールオーバ先識別子に対応する他の仮想化サーバに実行中の仮想マシンを移動させる第12工程とを実行することを含む請求項3記載の仮想マシンコンピュータシステム。
  5. 前記フェールセーフ装置が、
    前記第10工程によって抽出した仮想マシン識別子の仮想マシンの実行を動作を停止する第12工程とを実行することを含む請求項4記載の仮想マシンコンピュータシステム。
  6. 無停電電源装置が接続され、複数の仮想マシンを実行する複数の仮想化サーバと、該複数の仮想化サーバの電源障害に対するフェールセーフ機能を有するフェールセーフ装置とから構成される仮想マシンコンピュータシステムのフェールセーフ方法であって、
    前記フェールセーフ装置に、
    前記複数の無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する無停電電源装置一覧テーブル部と、
    前記複数の仮想化サーバの識別子と該仮想化サーバ識別子に対応した無停電電源装置の識別子と該無停電電源装置識別子に対応した電源障害検出有無情報を格納する仮想化サーバ一覧テーブル部と、
    前記仮想マシンを実行する仮想化サーバの識別子と該仮想化サーバ識別子に対応した仮想マシンの識別子と前記仮想マシンを実行可能な他の仮想化サーバの識別子であるフェールオーバ先識別子とシャッドダウンを優先的に行う仮想マシンを指定するユーザ指定優先度とを格納する仮想マシン一覧テーブル部とを備え、
    前記無停電電源装置一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した無停電電源装置識別子を抽出する第1工程と、
    該第1工程によって抽出した無停電電源装置識別子に対応する仮想化サーバ識別子を仮想化サーバ一覧テーブル部から抽出する第2工程と、
    該第2工程によって抽出した仮想化サーバ識別子の仮想化サーバが実行中の仮想マシンの識別子を前記仮想マシン一覧テーブル部から抽出する第3工程と、
    該第3工程によって抽出した仮想マシンを実行可能な仮想化サーバのフェールオーバ先識別子及びユーザ指定優先度を前記仮想マシン一覧テーブル部から抽出する第4工程と、
    前記第3工程によって抽出した実行中の仮想マシン識別子が付与された仮想マシンを前記第4工程によって抽出したフェールオーバ先識別子の仮想化サーバに移動するフェールオーバを行う第5工程と、
    前記第4工程によって抽出したユーザ指定優先度により指定された仮想マシンの動作を優先的に停止する第6工程と、
    前記第6工程に続いて前記第2工程によって抽出した仮想化サーバが実行している仮想マシンの動作を停止する第工程とを実行するフェールセーフ方法。
  7. 前記フェールセーフ装置に、
    前記複数の無停電電源装置から無停電電源装置の電源障害検出有無情報を検出し、前記検出した電源障害検出有無情報を前記無停電電源装置一覧テーブル部に格納する第7工程を実行する請求項6記載のフェールセーフ方法。
  8. 前記フェールセーフ装置に、
    前記仮想化サーバ一覧テーブル部から複数の無停電電源装置識別子と該無停電電源装置識別子に対応する電源障害検出有無情報を抽出する第8工程と、
    前記無停電電源装置一覧テーブル部から前記第8工程によって抽出した無停電電源装置識別子と一致する無停電電源装置識別子の電源障害検出有無情報を仮想化サーバ一覧テーブル部に格納する第9工程とを実行することを含む請求項7記載のフェールセーフ方法。
  9. 前記フェールセーフ装置に、
    前記仮想化サーバ一覧テーブル部から電源障害を検出している電源障害検出有無情報に対応した仮想マシン識別子を抽出する第10工程と、
    前記仮想マシン一覧テーブル部から前記第10工程によって抽出した仮想マシン識別子の仮想マシン実行中の仮想化サーバ識別子並びにフェールオーバ先識別子を抽出する第11工程と、
    前記第11工程によって抽出したフェールオーバ先識別子に対応する他の仮想化サーバに実行中の仮想マシンを移動させる第12工程とを実行することを含む請求項8記載のフェールセーフ方法。
  10. 前記フェールセーフ装置に、
    前記第10工程によって抽出した仮想マシン識別子の仮想マシンの実行を動作を停止する第12工程とを実行することを含む請求項9記載のフェールセーフ方法。
JP2008133570A 2008-05-21 2008-05-21 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法 Expired - Fee Related JP4651127B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008133570A JP4651127B2 (ja) 2008-05-21 2008-05-21 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008133570A JP4651127B2 (ja) 2008-05-21 2008-05-21 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法

Publications (2)

Publication Number Publication Date
JP2009282714A JP2009282714A (ja) 2009-12-03
JP4651127B2 true JP4651127B2 (ja) 2011-03-16

Family

ID=41453111

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008133570A Expired - Fee Related JP4651127B2 (ja) 2008-05-21 2008-05-21 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法

Country Status (1)

Country Link
JP (1) JP4651127B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8122282B2 (en) * 2010-03-12 2012-02-21 International Business Machines Corporation Starting virtual instances within a cloud computing environment
JP5206750B2 (ja) * 2010-08-09 2013-06-12 サンケン電気株式会社 電源装置およびプログラム
JP5664362B2 (ja) * 2011-03-10 2015-02-04 サンケン電気株式会社 電源装置およびプログラム
WO2013065115A1 (ja) * 2011-10-31 2013-05-10 富士通株式会社 情報処理装置、情報処理装置の制御方法、仮想マシン制御プログラム及び情報処理システム
JP5834939B2 (ja) 2012-01-17 2015-12-24 富士通株式会社 プログラム、仮想マシン制御方法、情報処理装置および情報処理システム
JP5948933B2 (ja) * 2012-02-17 2016-07-06 日本電気株式会社 ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
WO2013136502A1 (ja) 2012-03-16 2013-09-19 富士通株式会社 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体
JP6029165B2 (ja) * 2012-09-05 2016-11-24 Necエンジニアリング株式会社 仮想マシン管理システム、管理サーバ及び仮想マシン管理方法
JP6277069B2 (ja) * 2014-06-17 2018-02-07 日本電信電話株式会社 仮想機器管理装置、仮想機器管理方法及び仮想機器管理プログラム
JP7193701B2 (ja) * 2018-06-14 2022-12-21 富士通株式会社 障害対処プログラム及び障害対処方法
JP7276526B2 (ja) * 2019-11-29 2023-05-18 オムロン株式会社 情報処理装置、管理プログラム、管理方法、および、情報処理システム
JP7063315B2 (ja) * 2019-11-29 2022-05-09 オムロン株式会社 情報処理装置、管理プログラム、管理方法、および、情報処理システム
JP7276566B2 (ja) * 2022-01-20 2023-05-18 オムロン株式会社 情報処理システム、情報処理装置、管理プログラム、および、管理方法
JP7207595B2 (ja) * 2022-01-20 2023-01-18 オムロン株式会社 情報処理装置、管理プログラム、管理方法、および、情報処理システム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175488A (ja) * 1997-12-16 1999-07-02 Toshiba Corp サーバシステムおよびフェールオーバ制御方法
JP2002073221A (ja) * 2000-08-30 2002-03-12 Arufatekku Kk 無停電電源システム
JP2004030363A (ja) * 2002-06-27 2004-01-29 Hitachi Ltd 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
JP2005174117A (ja) * 2003-12-12 2005-06-30 Densei Lambda Kk 電源管理システム、管理端末装置、および電源管理用プログラム
JP2007053878A (ja) * 2005-08-19 2007-03-01 Fuji Electric Systems Co Ltd 無停電電源装置管理システム
JP2007148839A (ja) * 2005-11-29 2007-06-14 Hitachi Ltd 障害回復方法
JP2008003735A (ja) * 2006-06-21 2008-01-10 Hitachi Ltd 無停電電源装置に接続された情報処理システムの自動停止方式

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175488A (ja) * 1997-12-16 1999-07-02 Toshiba Corp サーバシステムおよびフェールオーバ制御方法
JP2002073221A (ja) * 2000-08-30 2002-03-12 Arufatekku Kk 無停電電源システム
JP2004030363A (ja) * 2002-06-27 2004-01-29 Hitachi Ltd 論理計算機システム、論理計算機システムの構成制御方法および論理計算機システムの構成制御プログラム
JP2005174117A (ja) * 2003-12-12 2005-06-30 Densei Lambda Kk 電源管理システム、管理端末装置、および電源管理用プログラム
JP2007053878A (ja) * 2005-08-19 2007-03-01 Fuji Electric Systems Co Ltd 無停電電源装置管理システム
JP2007148839A (ja) * 2005-11-29 2007-06-14 Hitachi Ltd 障害回復方法
JP2008003735A (ja) * 2006-06-21 2008-01-10 Hitachi Ltd 無停電電源装置に接続された情報処理システムの自動停止方式

Also Published As

Publication number Publication date
JP2009282714A (ja) 2009-12-03

Similar Documents

Publication Publication Date Title
JP4651127B2 (ja) 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法
JP4544146B2 (ja) 障害回復方法
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
JP5477602B2 (ja) サーバの信頼性可視化方法、計算機システム及び管理サーバ
JP5176837B2 (ja) 情報処理システム及びその管理方法、制御プログラム並びに記録媒体
JP5035299B2 (ja) マルチコアプロセッサ制御方法、その計算機システム、及び管理計算機のプログラム
US9727358B2 (en) Failover detection and treatment in checkpoint systems
US9229820B2 (en) Information processing device with memory dump function, memory dump method, and recording medium
WO2011148524A1 (ja) アプリケーションサーバの切替方法、管理計算機及びプログラムを格納した記憶媒体
JP6009089B2 (ja) 計算機システムを管理する管理システム及びその管理方法
JP4780237B2 (ja) 障害回復方法
US8799716B2 (en) Heap dump occurrence detection
JP2009037271A (ja) 仮想計算機システムの停止方法および計算機装置
JP5597293B2 (ja) 計算機システム及びプログラム
KR102174692B1 (ko) 가상화 환경에서의 장애 처리 방법
JP5333735B2 (ja) 仮想計算機システム、仮想計算機のマイグレーション方法、及びプログラム
JPWO2013160983A1 (ja) 情報取得方法、計算機システム及び管理計算機
EP2829974A2 (en) Memory dump method, information processing apparatus and program
US9400730B2 (en) Virtual machine system and method of measuring processor performance
US9274905B1 (en) Configuration tests for computer system
JP2011248616A (ja) サーバシステム、及び、仮想サーバの移行方式を選択する方法
US9292062B2 (en) Power supply and program to acquire virtual machine data
JP5321658B2 (ja) フェイルオーバ方法、およびその計算機システム。
KR101567879B1 (ko) 가상머신 상태 진단 시스템
KR101636796B1 (ko) 가상 인프라 장애 관리 시스템 및 방법

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101213

R150 Certificate of patent or registration of utility model

Ref document number: 4651127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees