JP5861767B2 - 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体 - Google Patents

稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体 Download PDF

Info

Publication number
JP5861767B2
JP5861767B2 JP2014504584A JP2014504584A JP5861767B2 JP 5861767 B2 JP5861767 B2 JP 5861767B2 JP 2014504584 A JP2014504584 A JP 2014504584A JP 2014504584 A JP2014504584 A JP 2014504584A JP 5861767 B2 JP5861767 B2 JP 5861767B2
Authority
JP
Japan
Prior art keywords
server
computers
operation stop
computer
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014504584A
Other languages
English (en)
Other versions
JPWO2013136502A1 (ja
Inventor
さつき 片野
さつき 片野
直広 田村
直広 田村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2013136502A1 publication Critical patent/JPWO2013136502A1/ja
Application granted granted Critical
Publication of JP5861767B2 publication Critical patent/JP5861767B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2015Redundant power supplies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体に関する。
業務に使用するサーバなどのコンピュータは、停電などの緊急時に電力供給が遮断された状態になったときに継続的に電力供給を行う無停電電源装置に接続されることが一般的である。また、無停電電源装置に接続された稼働停止に関して依存関係を有する複数のコンピュータが稼働される情報処理システムも知られている。例えば、複数のコンピュータが稼働している情報処理システムにおいて、各コンピュータは無停電電源装置を監視する監視プロセスを実行する。監視プロセスの一例としては、停電などの緊急時に無停電電源装置への電力供給が遮断された状態を検知すると、コンピュータの稼働停止処理を実行してコンピュータを稼働停止(所謂シャットダウン)する。
複数のコンピュータの稼働を停止する例として、管理装置が無停電電源装置等の非常用電源やコンピュータを監視する技術が知られている。この技術では、ユーザが管理装置に、コンピュータの稼働停止処理を実行する優先度を、手動で設定する。また、無停電電源装置等の非常用電源に接続された1台のコンピュータで実行中の複数のアプリケーションプロセスを監視し、そのプロセスの優先順位を記憶して、コンピュータの稼働停止処理に使用する技術が知られている。この技術では、停電などの緊急時に、非常用電源の給電時間内に処理を終了するようにプログラムの実行順序を制御する。
ところで、情報処理システムにおいて、依存関係を有する複数のコンピュータを稼働停止する場合、稼働中のコンピュータが非常用電源の給電時間内に稼働停止しない状態を防止する必要がある。このため、全コンピュータに一定の復電待機時間を設けて、一定の復電待機時間を経過した後に稼働停止処理を実行する。
例えば、無停電電源装置の電源容量と給電可能時間を求めてコンピュータの稼働停止処理に使用する技術が知られている。この技術では、無停電電源装置の給電可能時間から無停電電源装置に接続された1台のコンピュータの稼働停止処理に要する時間を差し引いて稼働停止処理を開始する。また、コンピュータの稼働停止完了後に通電を終了するために、無停電電源装置からコンピュータに対する通信結果が非通信の状態のときに、コンピュータへの通電を停止する技術が知られている。また、無停電電源装置が接続されたコンピュータおよび周辺機器に対して稼働停止に要する時間の長い順序で稼働停止を示す命令を送出する技術が知られている。
特開2009−282714号公報 特開平7−160370号公報 特開平6−113483号公報 特開2005−4381号公報 特開平11−155243号公報
ところで、依存関係を有する複数のコンピュータが稼働されている場合、複数のコンピュータに対して一律に稼働停止処理を実行すると、稼働停止処理が終了しないコンピュータが発生する。
1つの側面では、本発明は、稼働停止に関して依存関係を有する複数のコンピュータの稼働停止による障害発生を抑制することを目的とする。
開示の技術は、記憶部に、複数のコンピュータの間で移動可能な複数のノードについて、複数のノードの稼働停止順序情報と、複数のノードの各々の稼働停止に要する稼働停止時間情報とを記憶する。記憶部に記憶された稼働停止順序情報と稼働停止時間情報に基づき、複数のノードの稼働停止時間の総和を求めることができる。そこで、コンピュータシステムの稼働を停止させるよりも、複数のノードの稼働停止時間の総和以上前のタイミングから、稼働停止順序情報によって示される稼働停止順序で、複数のノードの稼働を停止させる。
1つの実施態様では、稼働停止処理に伴うコンピュータの障害発生を抑制することができる、という効果を有する。
本実施形態に係る稼働管理システムの概略構成を示すブロック図である。 本実施形態に係るコンピュータシステムの概略構成を示すブロック図である。 モデルテーブルの一例を示すイメージ図である。 サーバ種別一覧テーブルの一例を示すイメージ図である。 稼働停止履歴テーブルの一例を示すイメージ図である。 稼働管理プログラムの処理の流れを示すフローチャートである。 モデル照合処理の流れを示すフローチャートである。 稼働停止順序決定処理の流れを示すフローチャートである。 復電待機時間計算処理の流れを示すフローチャートである。 稼働停止実行処理の流れを示すフローチャートである。 復電待機時間の説明図である。 仮想マシンの移設の説明図である。
以下、図面を参照して開示の技術の実施形態の一例を詳細に説明する。
図1には、本実施形態に係る稼働管理システム10の概略構成が示されている。稼働管理システム10は、LAN等によるネットワーク30に、稼働管理装置12と、無停電電源装置32と、稼働管理装置12が管理する複数台のコンピュータ(本実施形態では、コンピュータ34,44,52)と、が各々接続されている。なお、ネットワーク30はインターネット等の通信ネットワークを含むことができる。また、無停電電源装置32は、コンピュータ34,44,52の各々に、専用線33を介して互いにデータを授受可能に接続されている。
なお、図1では、稼働管理装置12が管理する複数台のコンピュータとして、3台のコンピュータ34,44,52を一例として示したが、3台に限定されるものではなく、2台以上であれば何台あってもよい。
稼働管理装置12は、管理下のコンピュータ34,44,52について稼働停止(所謂シャットダウン)の処理を管理するためのものである。詳細は後述するが、稼働管理装置12は例えばコンピュータで実現される。稼働管理装置12は、モデル照合部14,稼働停止順序決定部16、復電待機時間計算部18,稼働停止実行部20及び記憶部22を備えている。また、記憶部22は、モデルテーブル24,サーバ種別一覧テーブル26,及び稼働停止履歴テーブル28の情報が格納されている。
なお、本実施形態では、稼働管理装置12がコンピュータ、仮想化サーバ及び仮想マシンについて稼働停止処理を管理する一例として、所謂シャットダウンなどのコンピュータの電源遮断処理を説明する。しかし、開示の技術は、電源遮断処理に限定されるものではない。例えば、コンピュータ等の稼働停止の処理を管理する他の例として、強制的にシステムを終了させる処理や再起動等のシステム処理を含むものである。
また、本実施形態におけるコンピュータに含まれる、仮想化サーバ及び仮想マシンの各々は、開示技術のノードの一例である。
無停電電源装置32は、停電等の緊急時に、接続された機器へ給電可能時間として予め定められた一定時間だけ電力供給する装置である。無停電電源装置32は、稼働管理装置12とデータやコマンドを授受すると共に、コンピュータ34,44,52の各々とデータやコマンドを授受する。
また、詳細は後述するが、コンピュータ34は、1台のコンピュータで複数のシステムを構築可能とする処理として一般的に知られた仮想化によって得られる仮想化サーバ36,及び3台の仮想マシン38,40,42を含んでいる。また、コンピュータ44は、仮想化サーバ46,及び2台の仮想マシン48,50を含んでいる。また、コンピュータ52は、仮想化サーバ54,及び1台の仮想マシン56を含んでいる。
なお、本実施形態では稼働管理システム10は、稼働管理装置12,無停電電源装置32、及び3台のコンピュータ34,44,52が含まれる構成例を示したが、稼働管理システム10に含まれるコンピュータの数は3台に限定されるものではない。例えばコンピュータは1台であってもよく、2台以上であってもよい。また、コンピュータに含まれる仮想マシンの数は1台以上であればよい。
また、本実施形態ではコンピュータ34,44,52に仮想化サーバ及び仮想マシンが含まれる構成の一例を示したが、仮想化サーバ及び仮想マシンが含まれるコンピュータのみに限定されるものではない。例えば稼働管理システム10に含まれるコンピュータは1つのシステムを構築したサーバであってもよい。
図2には、本実施形態に係る稼働管理装置12を含みかつ例えばコンピュータにより実現される管理装置60を備えたコンピュータシステム58の概略構成が示されている。
稼働管理装置12は、例えば図2に示す管理装置60の一部の機能により実現することができる。管理装置60は、コンピュータにより実現することができる。詳細には、管理装置60はCPU62、メモリ64、不揮発性の記憶部66を備え、これらはバス96を介して互いに接続されている。記憶部66はHDD(Hard Disk Drive)やフラッシュメモリ等によって実現できる。また、管理装置60はネットワーク30に接続するためのインタフェース(I/O)86を備え、I/O86はバス96に接続されている。また、管理装置60は、出力デバイスの一例の表示装置であるディスプレイ88、入力デバイスの一例の入力装置であるキーボード90とマウス92を備え、これらはバス96に接続されている。また、管理装置60は、記録媒体が挿入され、挿入された記録媒体に対して読み書きするための装置(R/W)94を備え、これらはバス96に接続されている。なお、ディスプレイ88、キーボード90、マウス92、装置(R/W)94は、省略してもよく、必要に応じてバス96に接続するようにしてもよい。
記憶部66には、管理装置60を、コンピュータ34,44,52の稼働を管理させる処理、例えばコンピュータの処理停止を実行する稼働管理装置12として機能させるための稼働管理プログラム68が記憶されている。CPU62は、稼働管理プログラム68を記憶部66から読み出してメモリ64に展開し、稼働管理プログラム68に含まれるプロセスを順次実行する。つまり、稼働管理装置12が管理装置60で実現され、CPU62が稼働管理プログラム68を実行することで、管理装置60は稼働管理装置12として動作される。
なお、稼働管理プログラムは、開示の技術における稼働管理プログラムの一例である。また、稼働管理プログラムは、管理装置60を稼働管理装置12として機能させるためのプログラムでもある。
稼働管理プログラム68は、モデル照合プロセス70、稼働停止順序決定プロセス72、復電待機時間計算プロセス74及び稼働停止実行プロセス76を有する。CPU62は、モデル照合プロセス70を実行することで、図1の稼働管理装置12におけるモデル照合部14として動作する。すなわち、稼働管理装置12が管理装置60で実現され、モデル照合プロセス70を実行することで管理装置60は稼働管理装置12のモデル照合部14として動作される。また、CPU62は、稼働停止順序決定プロセス72を実行することで、図1の稼働管理装置12における稼働停止順序決定部16として動作する。すなわち、稼働管理装置12が管理装置60で実現され、稼働停止順序決定プロセス72を実行することで管理装置60は稼働管理装置12の稼働停止順序決定部16として動作される。
CPU62は、復電待機時間計算プロセス74を実行することで、図1の稼働管理装置12における復電待機時間計算部18として動作する。すなわち、稼働管理装置12がコンピュータによる管理装置60で実現され、復電待機時間計算プロセス74を実行することで管理装置60は稼働管理装置12の復電待機時間計算部18として動作される。また、CPU62は、稼働停止実行プロセス76を実行することで、図1の稼働管理装置12における稼働停止実行部20として動作する。すなわち、稼働管理装置12が管理装置60で実現され、稼働停止実行プロセス76を実行することで管理装置60は稼働管理装置12の稼働停止実行部20として動作される。
また、管理装置60の記憶部66には、状態監視プログラム78,制御プログラム80,及びデータ管理プログラム82が記憶されている。状態監視プログラム78は、コンピュータシステム58において管理装置60が管理する無停電電源装置32,コンピュータ34、44,52の各々の状態を監視するプログラムである。制御プログラム80は、稼働管理プログラム68の処理に基づきコンピュータ34、44,52の各々の稼働停止制御するプログラムである。また、制御プログラム80は、後述する仮想マシンの移動を制御するプログラムを含む。データ管理プログラム82は、コンピュータ34、44,52の各々の稼働停止に関係する履歴データを記録するプログラムである。また、データ管理プログラム82は、コンピュータシステム58で稼働するモデルを管理するプログラムを含む。
また、記憶部66には、モデルテーブル24,サーバ種別一覧テーブル26,及び稼働停止履歴テーブル28を含むデータベース84が記憶されている。管理装置60の記憶部66に記憶されたデータベース84は図1の稼働管理装置12の記憶部22に対応する。
モデルテーブル24は、コンピュータシステム58において依存関係を有して稼働する複数のコンピュータをモデルと称し、当該モデルに関係する情報をデータベース84に格納したものである。なお、本実施形態では、モデルとは、ネットワークアーキテクチャが対応する。例えば、3階層システム(3-tier system)、サーバクライアントモデル(client-server)、ピアツーピアモデル(Peer to Peer)などのネットワークアーキテクチャがモデルに対応される。3階層システム(3-tier system)は、クライアントサーバシステムを「プレゼンテーション層」「アプリケーション層」「データ層」の3層に分割して構築したシステムである。サーバクライアントモデル(client-server)は、特定の役割を担当するコンピュータ(サーバ)と、ユーザの操作するコンピュータ(クライアント)に役割を分担し、相互にネットワークで接続されるシステムである。ピアツーピアモデル(Peer to Peer)は、役割を固定化しないで、ネットワークに参加するコンピュータ同士が情報を授受し、サーバまたはクライアントの双方の機能を有するものである。
データベース84に格納されるモデルテーブル24は、一例として図3に示すように、「モデル名」、「稼働停止順序」、「バッファ時間」、「稼働停止時間」の各情報が対応付けて各々登録されている。図3に示すモデルテーブル24における「モデル名」の情報は、依存関係を有して稼働する複数のコンピュータの呼称やグループ名を示す情報である。また、「稼働停止順序」の情報は、依存関係を有して稼働する複数のコンピュータについて、稼働停止順序を示す情報である。図3では、コンピュータの種別を示すデータを、稼働停止順序で配列した一例を示した。また、「バッファ時間」の情報は、依存関係を有して稼働する複数のコンピュータの各々について稼働停止後に設定する一定時間を示す情報である。図3では、「バッファ時間」として初期値が格納される一例を示した。また、「稼働停止時間」の情報は、依存関係を有して稼働する複数のコンピュータの各々について稼働停止に要する時間を示す情報である。図3では、「稼働停止時間」として初期値が格納される一例を示した。
サーバ種別一覧テーブル26は、コンピュータシステム58で稼働する複数のコンピュータの各々について、他のコンピュータに対する依存関係や自身を識別するための識別子などの情報を、データベース84に格納したものである。データベース84に格納されるサーバ種別一覧テーブル26の一例を図4に示す。サーバ種別一覧テーブル26には、「uuid」、「サーバ種別」、「依存先」、「復電待機時間」、「稼働停止時間」、「バッファ時間」、「稼働停止不可フラグ」、「稼働停止順位」の各情報が対応付けて各々登録されている。
図4に示すサーバ種別一覧テーブル26における「uuid」の情報は、個々のコンピュータを管理・識別するための情報である。図4では、「サーバ種別」としてコンピュータを一意に特定できるIDとして、UUID(universally unique identifier)を使用した一例を示した。また、「サーバ種別」の情報は、コンピュータシステム58で稼働する複数のコンピュータの各々について、コンピュータの種別を示す情報である。図4では、コンピュータで提供するサービスシステムの呼称や名称を示す情報を使用した一例を示した。また、「依存先」の情報は、自身のコンピュータが稼働するにあたり依存関係を有する他のコンピュータを示す情報である。図4では、他のコンピュータを一意に特定できるIDとして、UUIDを使用した一例を示した。
また、「復電待機時間」の情報は、コンピュータが稼働停止処理を開始するまでに待機する時間を示す情報である。また、「稼働停止時間」の情報は、コンピュータが稼働停止処理に要した時間を示す情報である。また、「バッファ時間」の情報は、コンピュータの稼働停止後に要する一定時間を示す情報である。また、「稼働停止不可フラグ」の情報は、コンピュータが無停電電源装置32による給電可能時間内に稼働停止することが可能か否かを示す情報である。また、「稼働停止順位」の情報は、コンピュータの稼働停止順序を示す情報である。
稼働停止履歴テーブル28は、コンピュータシステム58で稼働する複数のコンピュータの各々について、コンピュータの稼働停止に要した稼働停止時間の履歴を示す情報を、データベース84に格納したものである。データベース84に格納される稼働停止履歴テーブル28の一例を図5に示す。稼働停止履歴テーブル28には、「uuid」、「稼働停止時間」の各情報が対応付けて各々登録されている。稼働停止履歴テーブル28における「uuid」の情報は、コンピュータを管理・識別するための情報である。図5では、コンピュータを一意に特定できるUUIDを使用した一例を示した。また、「稼働停止時間」の情報は、コンピュータの稼働停止に要した稼働停止時間を履歴データとして格納した情報である。図5では、稼働停止に要した稼働停止時間を、過去から順に配列した一例を示した。
図2に示すように、管理装置60が管理するコンピュータ34は、CPU100、メモリ102、不揮発性の記憶部104を備え、これらはバス122を介して互いに接続されている。記憶部104はHDD(Hard Disk Drive)やフラッシュメモリ等によって実現できる。また、コンピュータ34はネットワーク30に接続するためのインタフェース(I/O)112を備え、I/O112はバス122に接続されている。また、コンピュータ34は、ディスプレイ114、キーボード116及びマウス118を備え、これらはバス122に接続されている。また、コンピュータ34は、記録媒体が挿入され、挿入された記録媒体に対して読み書きするための装置(R/W)120を備え、これらはバス122に接続されている。なお、ディスプレイ114、キーボード116、マウス118、装置(R/W)120は、省略してもよく、必要に応じてバス122に接続するようにしてもよい。
コンピュータ34の記憶部104には、OS(Operating System)106、コンピュータ34を仮想化する仮想化プログラム108、及びコンピュータ34において仮想マシンを稼働させるための仮想マシンプログラム110が記憶されている。CPU100は、OS106を記憶部104から読み出してメモリ102に展開して実行することで、コンピュータ34は物理サーバとして動作される。また、CPU100は、仮想化プログラム108を記憶部104から読み出してメモリ102に展開して実行することで、コンピュータ34で仮想化サーバ36(図1)として動作される。また、仮想マシンプログラム110を記憶部104から読み出してメモリ102に展開して実行することで、コンピュータ34で動作される仮想化サーバ上で稼働される仮想マシン(図1の仮想マシン38,40,42)が動作される。すなわち、仮想化サーバ36は、コンピュータ34内に仮想的に作成されたコンピュータである。また、仮想マシンは、仮想サーバの管理下にあるコンピュータ34内に仮想的に作成されたコンピュータである。
なお、例えば、仮想化サーバ36は、例えば仮想ホストと呼ばれる場合がある。また、仮想マシンは、仮想ゲストやゲストOSと呼ばれる場合もある。
一般的に、1台のコンピュータに所謂サーバ機能を有するOSを搭載することで物理サーバを得ることができる。物理サーバは、メールサーバ等のように1つのアプリケーションプログラムを実行する1つのシステムを構築することが一般的である。近年、物理サーバの利用効率向上などを目的として、1台の物理サーバで、複数のシステムを構築する仮想化システムの技術が実現されている。
そこで、本実施形態は、1台のコンピュータによって、複数のシステムを構築可能にする仮想化が施されたコンピュータを一例として説明する。
本実施形態では、コンピュータ34が物理サーバとして機能されるとき、コンピュータ34に仮想サーバ及び仮想マシンを含むシステムが構築できるようにすることができる。すなわち、CPU100がOS106を記憶部104から読み出してメモリ102に展開して実行することで、コンピュータ34は物理サーバとして動作される。さらに、CPU100が仮想化プログラム108を記憶部104から読み出してメモリ102に展開して実行することで、コンピュータ34は仮想化サーバ36として動作される。さらにまた、CPU100が仮想マシンプログラム110を記憶部104から読み出してメモリ102に展開して実行することで、仮想化サーバ36が管理する仮想マシン(図1では、仮想マシン38,40,42)が構築される。
なお、コンピュータ44とコンピュータ52の構成は、コンピュータ34と略同一のため、詳細な説明を省略する。
図1には、稼働管理システム10に含まれる複数のコンピュータの一例として、コンピュータ34が、仮想化サーバ36として動作し、仮想化サーバ36の管理下に仮想マシン38,40,42の3つの仮想マシンが接続された場合を示している。また、コンピュータ44が、仮想化サーバ46として動作し、仮想化サーバ46の管理下に仮想マシン48,50の2つの仮想マシンが接続された場合を示している。さらに、コンピュータ52が、仮想化サーバ54として動作し、仮想化サーバ54の管理下に仮想マシン56の1つの仮想マシンが接続された場合を示している。なお、図1では、仮想化サーバの管理下に3つ,2つ,1つの仮想マシンが接続される場合を示したが、開示の技術は3つ以下の仮想マシンに限定されるものではなく、4つ以上であってもよい。
(稼働管理処理)
次に本実施形態の作用を説明する。
本実施形態では、停電発生時に、無停電電源装置32に接続された各サーバ(36や38等)の稼働状況により稼働停止時間(シャットダウン時間)と、各サーバ間の依存関係を算出する。次に、予め定めた複数のモデルから、算出した稼働停止時間と、各サーバ間の依存関係基づき、最も適したモデルの稼働停止順序に従って稼働停止(シャットダウン)を行う。
なお、本実施形態では、コンピュータ34に構築された仮想化サーバ36の管理下の仮想マシン38、仮想化サーバ46の管理下の仮想マシン48、仮想化サーバ54の管理下の仮想マシン56に、サーバが構築され稼働している場合について説明する。仮想マシン38,48,56は、依存性を有するシステムとして稼働される。本実施形態では、依存性を有するシステムの一例として、3階層システム(3-tier system)が稼働される場合について説明する。3階層システム(3-tier system)は、クライアントサーバシステムを「プレゼンテーション層」「アプリケーション層」「データ層」の3層に分割して構築したシステムである。本実施形態では3階層システムの構築時に、「プレゼンテーション層」を担当するウェブサーバ(WEB_SERVER)が仮想マシン56に設定される。また、「アプリケーション層」を担当するアプリケーションサーバ(AP_SERVER)が仮想マシン48に設定される。また、「データ層」を担当するデータベースサーバ(DB_SERVER)が仮想マシン38に設定される。
また、本実施形態では、管理装置60において状態監視プログラム78、制御プログラム80、及びデータ管理プログラム82による処理が実行されているものとする。例えば、管理装置60のCPU62は、状態監視プログラム78を記憶部66から読み出してメモリ64に展開して実行することで、状態監視処理を実行する。状態監視処理は、例えば、ユーザによりキーボード90で指示されて実行できる。
状態監視処理の一例は、コンピュータシステム58において管理装置60が管理する無停電電源装置32,コンピュータ34、44,52の各々の状態を監視する。状態監視処理の具体例は、電力供給状態監視処理として、無停電電源装置32から受信または取得した電力供給可否信号に基づいて、無停電電源装置32に電力供給が成されているか否かの状態を判別する処理である。また、状態監視処理の他の例は、無停電電源装置32の状態監視処理として、無停電電源装置32の給電可能時間や給電可能残存時間等の時間、無停電電源装置32に接続されたコンピュータ等の稼働状態を確認する処理である。また、状態監視処理のその他の例は、仮想化状態監視処理として、コンピュータシステム58において稼働中の仮想化サーバ及び仮想マシンの状態を確認する処理である。この確認処理により、コンピュータシステム58において稼働中の仮想化サーバ及び仮想マシンのサーバ種別、名称や識別子(例えばuuid等)などを取得できる。
また、管理装置60のCPU62は、制御プログラム80を記憶部66から読み出してメモリ64に展開して実行することで、制御処理を実行する。制御処理の一例は、管理装置60が管理するコンピュータ34、44,52の各々に対する電源制御処理や仮想マシンの移動制御処理である。制御処理の具体例は、ネットワーク30を介して接続されたコンピュータ34、44,52及びコンピュータ34、44,52に含まれる仮想化サーバ34,46,54と仮想マシン38,40,42,48,50,56の電源制御を行う。詳細には、コンピュータ、仮想化サーバ、仮想マシンに対して電源遮断命令や休止状態への移行命令のコマンドを送信する制御を行う。また、制御処理の他例は、コンピュータ34、44,52に含まれる仮想マシンを、他の仮想化サーバの管理下に移動する制御処理である。
また、管理装置60のCPU62は、データ管理プログラム82を記憶部66から読み出してメモリ64に展開して実行することで、データ管理処理を実行する。データ管理処理の一例は、稼働停止履歴記録処理(シャットダウン履歴記録処理)、モデル管理処理(モデルの登録、修正、削除等)をする。データ管理処理の具体例である稼働停止履歴記録処理(シャットダウン履歴記録処理)は、少なくとも仮想マシンの稼働を停止したことの履歴をデータベース84に格納された稼働停止履歴テーブル28に記録する処理である。データ管理処理の他の例であるモデル管理処理は、コンピュータシステム58に含まれる依存関係を有するコンピュータ、または仮想化サーバ或いは仮想マシンについて、モデルとして登録すること、修正すること、削除すること等の処理を行うことである。このモデル管理処理では、ユーザによりキーボード90で入力されたデータやコマンドによって、データベース84のモデルテーブル24に登録したり修正したり削除したりする。
稼働管理装置12による稼働管理処理は、例えば、稼働管理システム10においてコンピュータ(仮想マシン及び仮想化サーバ)の稼働を停止することによりコンピュータのよる処理を停止する処理である(図1参照)。例えば、稼働管理システム10において停電などの緊急時に電力供給が遮断された状態になると、無停電電源装置32が一定時間だけ継続的に電力供給を行う。本実施形態では、稼働管理システム10に含まれるコンピュータを稼働停止したときのコンピュータの状態に起因した障害を抑制するように、無停電電源装置32による一定時間の電力供給中に、依存関係を有する複数のコンピュータの各々を稼働停止する。
つまり、稼働管理システム10において、停電などの電力供給が遮断された状態を無停電電源装置32が検知すると、稼働管理装置12は、モデル照合部14においてモデルを特定する(図1参照)。つまり、モデル照合部14は、稼働管理システム10で稼働中の依存関係を有する複数の仮想化サーバ及び仮想マシンに適するモデルをモデルテーブル24を参照して特定する。次に、稼働停止順序決定部16は、特定されたモデルの仮想化サーバ及び仮想マシンについて、サーバ種別一覧テーブル26を参照して稼働停止をする順序を決定する。次に、復電待機時間計算部18は、無停電電源装置32の電力供給が可能な時間内で特定されたモデルの仮想化サーバ及び仮想マシンの各々の稼働停止を開始する時間を計算する。次に、稼働停止実行部20は、復電待機時間計算部18で計算された時間に従って複数の仮想化サーバ及び仮想マシン、そして物理サーバの稼働停止処理を実行してコンピュータを稼働停止(所謂シャットダウン)する指示を実行する。すなわち、稼働停止実行部20は、仮想マシン38,40,42,48,50,56、仮想化サーバ36,46,54、そしてコンピュータ34,44,52を稼働停止(所謂シャットダウン)する指示を実行する。
図6は、本実施形態に係る稼働管理装置12で実行される稼働管理プログラム68の流れを示すフローチャートである。コンピュータシステム58における管理装置60において稼働管理プログラム68が実行されることで、管理装置60は稼働管理装置12として動作し、稼働管理処理を実行する。図6に示すように、稼働管理プログラムが実行されると、ステップ200へ進み、稼働管理装置12は無停電電源装置32の監視を開始し、停電等の緊急状態(緊急時)を検知するまで(ステップ202で肯定)、無停電電源装置32の監視を継続する。ここでは、状態監視プログラム78が実行され、一例である電力供給状態監視処理の結果、無停電電源装置32に電力供給が成されているか否かの状態を示す電力供給可否信号が非電力供給を示すときに、停電等を検知したこととする。
停電等が検知されると、稼働管理装置12のモデル照合部14は、ステップ204において、モデル照合処理を実行する。モデル照合処理は、モデル照合プロセス70の処理ルーチン(図7参照)が実行され、稼働中の依存関係を有する複数の仮想化サーバ及び仮想マシンによるモデルを特定する。
図7は、本実施形態に係るモデル照合処理の流れを示すフローチャートである。モデル照合処理が実行されると、ステップ220においてサーバ種別一覧テーブル26を参照し、無停電電源装置32に接続されたサーバの種別が取得される。ここでは、仮想マシン56のウェブサーバ(WEB_SERVER)、仮想マシン48のアプリケーションサーバ(AP_SERVER)、仮想マシン38のデータベースサーバ(DB_SERVER)が取得される。
次のステップ222では、モデルテーブル24を参照して、モデルテーブル24に稼働中のサーバ種別に最適なモデルが存在するか否かが判断される。最適なモデルとは、稼働中のサーバ種別の組み合わせに対するモデルテーブル24の項目におけるサーバ種別の組み合わせの一致度が所定値以上のネットワークアーキテクチャである。つまり、稼働中のサーバ種別の組み合わせがモデルテーブル24の項目のサーバ種別の組み合わせに一致するときが最も一致度が高い。一方、稼働中のサーバ種別の組み合わせのサーバ種別数がモデルテーブル24の項目のサーバ種別の組み合わせのサーバ種別数より少なくなるに従って一致度が低くなる。なお、モデルテーブル24の項目におけるサーバ種別の組み合わせとは、図3の例では、稼働停止順序の項目に含まれる、サーバ種別の組み合わせである。
ステップ222の判定が肯定されると、ステップ224において該当モデルを取得し、次のステップ228において、ステップ224で取得したモデルを戻り値に設定され、本ルーチンを終了する。一方、ステップ222の判定が否定されると、ステップ226において初期値として設定されたモデル(デフォルトモデル)が取得され、次のステップ228において、ステップ226で取得されたデフォルトモデルを戻り値に設定し、本ルーチンを終了する。本実施形態では、3階層システム(3-tier system)が稼働されているので、モデルテーブル24の稼働停止順序の欄に、登録されたサーバ種別(WEB_SERVER、AP_SERVER、DB_SERVER)が一致し、モデル名Model-1を該当モデルとして取得し、戻り値に設定される。
なお、初期値として設定されたモデル(デフォルトモデル)の一例には、サーバクライアントモデルがある。サーバクライアントモデルでは、コンピュータは、仮想マシンがサーバ(サーバ装置)、またはクライアント(クライアント端末)の何れかのコンピュータとして稼働している。
次に、稼働停止順序決定部16(図1)は、図6のステップ206において、特定されたモデルの仮想化サーバ及び仮想マシンについて、稼働停止をする順序を決定する。この稼働停止順序決定処理では、稼働停止順序決定プロセス72の処理ルーチン(図8参照)が実行される。
図8は、本実施形態に係る稼働停止順序決定処理の流れを示すフローチャートである。稼働停止順序決定処理が実行されると、ステップ230においてサーバ種別一覧テーブル26を参照し、上述のステップ224またはステップ226(図7)で取得されたモデルの稼働停止順序が読み取られる。ここでは、稼働停止順序として仮想マシン56のウェブサーバ(WEB_SERVER)、仮想マシン48のアプリケーションサーバ(AP_SERVER)、仮想マシン38のデータベースサーバ(DB_SERVER)の順序を示す情報が読み取られる。
次のステップ232では、取得されたモデルにおける最初の順序のサーバが指定される。ここでは、仮想マシン56のウェブサーバ(WEB_SERVER)が指定される。
次のステップ234では、サーバ種別一覧テーブル26(図4)を参照し、指定されたサーバに関する情報が取得される。例えば、ウェブサーバ(WEB_SERVER)が指定されている場合、図4では、項目「uuid」の「uuid−1」が該当する。次のステップ236では、稼働停止履歴テーブル28(図5)を参照すると共に、稼働停止履歴テーブル28に、指定されたサーバの稼働停止時間の履歴データが存在するか否かが判断される。例えば、ウェブサーバ(WEB_SERVER)が指定されている場合、図5では項目「uuid」の「uuid−1」に対応する稼働停止時間の欄に履歴データは登録されていない。
ステップ236で肯定されるとステップ268へ進み、履歴データのうち最長時間が取得される。なお、本実施形態では、履歴データのうち最長時間を取得する場合について説明するが、開示の技術はこれに限定されるものではない。例えば、最長時間に予め定めた所定時間を増減してもよい。また、履歴データの平均時間を求めて、その平均時間を使用してもよい。また、履歴データのうち出現頻度が所定値以上の時間を使用しても良い。
一方、ステップ236で否定されると、ステップ240においてモデルテーブル24を参照して、初期値として登録されている稼働停止時間が取得される。ここでは、ウェブサーバ(WEB_SERVER)が指定されているので、モデルテーブル24から稼働停止時間として[300秒]が取得される。
次のステップ242では、モデルテーブル24を参照し、該当するサーバのバッファ時間が取得される。ここでは、ウェブサーバ(WEB_SERVER)が指定されているので、モデルテーブル24におけるバッファ時間として[30秒]が取得される。次のステップ244では、モデルテーブル24を参照し、該当するサーバの稼働停止順序を示す情報が取得される。ここでは、ウェブサーバ(WEB_SERVER)の稼働停止順序として、順位[1]が取得される。これら取得した稼働停止時間、バッファ時間、及び稼働停止順序を示す情報を、次のステップ246においてサーバ種別一覧テーブル26に格納(登録)する。
次に、ステップ248において、現在処理しているサーバが該当モデルの最後のサーバであるか否かを判断し、最後のサーバであるときは(ステップ248で肯定)、本ルーチンを終了する。一方、モデルに残存するサーバが存在するときは(ステップ248で否定)、ステップ250においてモデルの次のサーバを指定し、ステップ234へ戻り、上記処理が繰り返し実行される。
次に、復電待機時間計算部18(図1)は、図6のステップ208において復電待機時間計算処理を実行する。すなわち、復電待機時間計算処理では、無停電電源装置32の電力供給が可能な時間内で特定されたモデルの仮想化サーバ及び仮想マシンの各々の稼働停止を開始する時間が計算される。復電待機時間計算処理は、復電待機時間計算プロセス74の処理ルーチン(図9参照)が実行される。
図9は、本実施形態に係る復電待機時間計算処理の流れを示すフローチャートである。復電待機時間計算処理が実行されると、ステップ252において無停電電源装置32の給電可能時間が取得される。すなわち、ステップ252では、既に実行中の状態監視プログラム78で取得されている無停電電源装置32の給電可能時間が取得される。次のステップ254では、ステップ204(図6)で取得したモデルにおける各サーバが稼働停止するのに要する所要時間(稼働停止時間とバッファ時間)が取得され、次のステップ256では合計所要時間として、取得した時間の合計時間が計算される。
次のステップ258では、ステップ252で取得した給電可能時間が、ステップ256で計算した合計所要時間以上か否かが判断される。給電可能時間が合計所要時間以上のときには(ステップ258で肯定)、ステップ272へ進み、最初に稼働を停止するサーバの復電待機時間を計算する。復電待機時間は、給電可能時間から合計所要時間を減算することにより求めることができる。次のステップ274では、最初に稼働を停止するサーバの所要時間を計算する。所要時間は、復電待機時間、稼働停止時間、及びバッファ時間の合計により求めることができる。
次のステップ276では、ステップ204(図6)で取得したモデルにおける次のサーバを指定し、次のステップ278において該当サーバの不可フラグが真(True)か否かが判断される。該当サーバの不可フラグが偽(False)のときは(ステップ278で否定)、ステップ280において該当サーバの復電待機時間及び所要時間を計算し、ステップ282へ進む。ステップ282では、該当サーバがステップ204(図6)で取得したモデルにおける最後のサーバか否かが判断され、肯定されると、ステップ284へ進み、否定されると、ステップ276へ戻り、上記処理を繰り返す。
一方、ステップ278で肯定されると、該当サーバ以降のサーバは給電可能時間内に稼働停止が困難であるため、ステップ280の計算は不要であり、そのままステップ284へ進む。ステップ284では、各サーバの不可フラグ及び復電待機時間をサーバ種別一覧テーブル26に登録し、本ルーチンを終了する。
ステップ256で計算した合計所要時間が給電可能時間未満のときは、ステップ258で否定され、ステップ260へ進む。ステップ260では、ステップ204(図6)で取得したモデルにおける最初のサーバを指定し、次のステップ262において、該当サーバまでの所要時間を取得し、合計所要時間を計算する。次のステップ264では、ステップ262で計算した合計所要時間が、ステップ256で計算した給電可能時間未満か否かが判断される。給電可能時間が合計所要時間以下のときには(ステップ264で否定)、ステップ266へ進み、稼働停止順序が該当サーバ以降のサーバについて不可フラグを真(True)に設定し、ステップ272へ進む。一方、給電可能時間が合計所要時間を超えるときには(ステップ264で肯定)、ステップ268へ進み、該当サーバがモデルの最後のサーバか否かが判断される。ステップ268で肯定されると、ステップ272へ進み、否定されると、ステップ270において稼働停止順で次のサーバを指定した後にステップ262へ戻り、上記処理を繰り返す。
上述のようにして、復電待機時間計算部18(図1)による復電待機時間の計算処理を終了すると、図6のステップ210へ進む。ステップ210では、サーバ種別一覧テーブル26を参照すると共に、サーバ種別一覧テーブル26に不可フラグが偽(False)のサーバが有るか否かが判断される。ステップ210で否定されると、給電時間内に依存性を有する全サーバを稼働停止することができるので、そのままステップ214へ進む。一方、ステップ210で肯定されたときには、給電時間内に依存性を有するサーバのうち稼働停止することが困難なサーバが存在する。ところで、サーバを休止モードへ移行させることは、所謂シャットダウンさせるに必要な時間に比較して、所要時間が短い。そこで、本実施形態では、稼働停止困難なサーバに対する対処の一例としてサーバを休止モードに移行させる。従って、ステップ212では、サーバ種別一覧テーブル26に不可フラグが偽(False)のサーバを休止モードに移行させるように設定し、ステップ214へ進み、稼働停止実行部20(図1)の処理へ移行する。
次に、稼働停止実行部20(図1)は、図6のステップ214において、復電待機時間計算部18で計算された時間に従ってサーバの稼働停止処理を実行してコンピュータを稼働停止(所謂シャットダウン)する指示を実行する。すなわち、稼働停止実行部20は、仮想マシン38,40,42,48,50,56、仮想化サーバ36,46,54、そしてコンピュータ34,44,52を稼働停止(所謂シャットダウン)する指示を実行する。稼働停止実行部20による稼働停止実行処理は、稼働停止実行プロセス76の処理ルーチン(図10参照)が実行され、稼働中の依存関係を有する複数の仮想化サーバ及び仮想マシンを稼働停止させる。
図10は、本実施形態に係る稼働停止実行処理の流れを示すフローチャートである。稼働停止実行処理が実行されると、ステップ286においてステップ204で取得したモデルの稼働停止順序を読み取る。ここでは、仮想マシン56のウェブサーバ(WEB_SERVER)、仮想マシン48のアプリケーションサーバ(AP_SERVER)、仮想マシン38のデータベースサーバ(DB_SERVER)の順序を示す情報が読み取られる。
次のステップ288では、取得されたモデルにおける最初の順序のサーバが指定される。ここでは、仮想マシン56のウェブサーバ(WEB_SERVER)が指定される。次のステップ290では、該当サーバを稼働停止する指示を実行する。すなわち、ステップ290では、既に実行中の制御プログラム80に対して、該当サーバへのシャットダウン命令または休止モードへの移行命令を出力する指示を出力する。該当サーバへのシャットダウン命令または休止モードへの移行命令の判別は、サーバ種別一覧テーブル26の稼働停止不可フラグの値から判断できる。
次のステップ292では、該当サーバ(仮想マシン)が稼働されている物理サーバに、他の仮想マシンが存在するか否かが判断され、肯定されるとステップ294へ進み、否定されるとステップ296へ進む。ステップ292の判断は、既に実行中の状態監視プログラム78において監視している物理サーバが担当している仮想マシンの有無を、状態監視プログラム78において記憶している情報から判別できる。ステップ292で肯定されると、ステップ294へ進み、該当物理サーバで稼働中の他の仮想マシンが全て休止モードに移行しているか否かが判断され、肯定されると、ステップ296へ進み、否定されるとステップ298へ進む。
ステップ296では、該当する物理サーバを稼働停止する指示を実行する。すなわち、ステップ296では、既に実行中の制御プログラム80に対して、該当物理サーバへのシャットダウン命令を出力する指示を出力する。
次のステップ298では、ステップ288で指定されたサーバ(仮想マシン)が、ステップ204で取得したモデルの最後のサーバであるか否かが判断され、肯定されるとそのまま本ルーチンを終了する。一方、ステップ298で否定されると、ステップ300へ進み、ステップ288で指定された該当サーバの稼働停止を確認する。該当サーバの稼働停止が確認された後に、ステップ302においてステップ204で取得したモデルの次のサーバを指定した後にステップ292へ戻り、上記処理を繰り返す。
本実施形態では、無停電電源装置32に接続された各仮想化サーバ及び仮想化マシンの稼働状況と、各仮想化サーバ及び仮想化マシンの依存関係から、各々の復電待機時間及び稼働停止の順番を設定する。
図11に示すように、コンピュータシステム58は、コンピュータ34の管理下に仮想マシン38,40,42が稼働し、コンピュータ44の管理下に仮想マシン48,50が稼働し、コンピュータ52の管理下に仮想マシン56が稼働している。例えば、3台の仮想マシン38,40,42が稼働するコンピュータ34は、コンピュータ44及びコンピュータ52に比べてCPUの処理負荷が大きい。このため、コンピュータ34を稼働停止するのに要する時間(稼働停止時間)は、コンピュータ44及びコンピュータ52に比べて長時間になる。本実施形態では、停電等が検知されてから稼働停止処理へ移行するまでの時間である復電待機時間を、仮想化サーバ及び仮想化マシンの稼働状況と依存関係から動的に求めている。
例えば、無停電電源装置32により給電可能な時間(給電可能時間)は一定の時間t1とすると、停電から時間t1を経過するまでに、稼働停止されることが要求される。しかし、復電待機時間を一定の時間t2とすると、コンピュータ34,44は稼働停止処理中に無停電電源装置32からの給電が停止され、コンピュータ34,44に障害が生じる虞がある。これに対して、本実施形態では、コンピュータ34では稼働停止に必要な時間t6及びバッファ時間t8の合計時間より以前の時期を稼働停止開始時期としている。つまり、無停電電源装置32の給電可能時間t1から、稼働停止時間t6とバッファ時間t8の合計時間を減算した時間t3以内となる。また、コンピュータ44では、無停電電源装置32の給電可能時間t1から、稼働停止時間t7とバッファ時間t9の合計時間を減算した時間t4以内となる。このように、本実施形態では、復電待機時間を一定値とする技術に比べて、復電待機時間を調整することで稼働停止開始時期の自由度が増加し、稼働停止に伴って生じるコンピュータの障害を抑制できる。なお、給電可能時間t1以内の時間t2で、停電が解消されれば、通常の稼働に復旧することができる。
また、本実施形態では、仮想化マシン等の稼働状況と、仮想化マシン等の依存関係から、稼働停止の順序を設定している。
図12に示すように、コンピュータシステム58において、コンピュータ34にデータベースサーバとして仮想マシン38が含まれる。また、コンピュータ44にアプリケーションサーバとして仮想マシン48が含まれる。そしてコンピュータ52にウェブブサーバとして仮想マシン56が含まれる3階層システムを当初に構築したものとする。この場合、3階層システムの構築当初は、稼働停止順序は、コンピュータ34,44,52であり、一般的にはこの順序に従って各コンピュータの稼働が停止されるように例えばバッチ処理等によって稼働停止処理が実行されるように設定される。しかし、コンピュータシステム58の運用中に、仮想マシンの移動が可能である機能を把握するユーザ(管理者)は、仮想マシンの移動を求める場合がある。例えば、システムメインテナンスやCPU負荷などの移動条件によって、例えばアプリケーションサーバの仮想マシン48をコンピュータ52に移動したり、ウェブブサーバの仮想マシン56をコンピュータ44に移動する場合がある。また、1台のコンピュータに複数の仮想亜mしんを片寄せする場合もある。
仮想マシンを構築当初より移動させた場合、構築当初に設定した稼働停止順序と相違する順序となり、誤った順序で稼働停止処理が実行されることになる。本実施形態では、仮想化マシン等の稼働状況と、仮想化マシン等の依存関係から、稼働停止の順序を決定し、決定した稼働停止順序に従って仮想マシン等の稼働を停止させる。従って、構築当初の稼働停止順序から変更があった場合であっても、変更された仮想マシンの位置に応じて仮想マシンの稼働を停止することができる。これにより、仮想化サーバ及び仮想化マシンが移動を伴って稼働されたシステムの状態に対応して、コンピュータの稼働を停止することができる。
以上説明したように、本実施形態では、管理装置60は、無停電電源装置32と、無停電電源装置32から電源が供給される物理サーバに含まれる仮想化サーバ及び仮想マシンを制御・監視する。管理装置60は無停電電源装置32を介して停電等を検知すると、無停電電源装置32に接続された各仮想化サーバ及び仮想マシンの稼働状況、及び依存関係から動的に復電待ち時間・稼働停止(シャットダウン)の順番を設定する。
また、復電待機時間は、無停電電源装置32の給電可能時間から、稼働停止時間(例えばシャットダウン時間)とバッファ時間の合計時間を引いた時間に設定する。つまり、復電待機時間、稼働停止時間とバッファ時間の合計が、給電可能時間以内となるように計算する。稼働停止時間は、仮想マシンが通常時に稼働停止に要する時間を履歴として記録しておき、その履歴より求めた最大時間や平均時間を使用する。また、バッファ時間はモデルから各サーバ(仮想化サーバ、仮想マシン)に設定する。なお、履歴がない場合は初期値を設定する。
稼働停止するための順序は、システムの稼働状況を監視し、依存関係として登録された複数のモデル(ネットワークアーキテクチャ)と照合して決定する。また、モデルテーブル24にはモデルごとに依存関係を考慮した適切な稼働停止順序が定義されている。依存関係は、予め定義されたサーバ種別と仮想マシンの識別情報(UUID)から確認できる。
また、稼働停止順序と稼働停止に要する時間を考慮した結果、給電可能時間内に稼働停止が完了しないことが予測される場合は、OSの休止モードを設定する。これにより稼働中の仮想マシンの容が記憶部に書き込まれるので、実行中の処理は保護される。
なお、復電待機時間が一定で稼働停止する技術では、復電時期により、稼働停止するコンピュータと、稼働停止しないコンピュータが混在するという問題が生じる。この問題は、本実施形態では、管理装置60が復電の検出時期で、無停電電源装置32に接続される全コンピュータ(物理サーバ、仮想化サーバ、仮想マシン)を起動することで解決する。
このように、本実施形態では、給電中に稼働停止を完了することができ、停電等の際にも安全なシステム管理ができる。また、動的に物理マシンや仮想マシンの状況・依存関係から稼働停止時間を算出し、十分な稼働停止時間を確保した上で復電待機時間を設定するので、停電等の緊急時のサーバ間の依存関係を考慮して給電中に稼働停止を完了することができる。これによって、稼働停止中に強制電源遮断になる障害を抑制でき、強制電源遮断によるコンピュータ資産の破壊や故障等の不具合発生を抑制することができる。
なお、上記では物理サーバに含まれる仮想マシンに機能を有するサーバの一例を説明したが、仮想マシンに機能を有するサーバに限定されるものではない。例えば、物理サーバを仮想化サーバを含めた何れかのコンピュータについて適用可能である。
また、上記では3階層システムをモデルとしたシステムを一例としたが、3階層システムをモデルとしたシステムに限定されるものではなく、上記説明した要旨を逸脱しない範囲において、各種の改良及び変更を行っても良いのはもちろんである。
また、上記ではプログラムがコンピュータの記憶部に予め記憶(インストール)されている態様を説明したが、プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
10 稼働管理システム
12 稼働管理装置
14 モデル照合部
16 稼働停止順序決定部
18 復電待機時間計算部
20 稼働停止実行部
22 記憶部
24 モデルテーブル
26 サーバ種別一覧テーブル
28 稼働停止履歴テーブル
32 無停電電源装置
34、44、52 コンピュータ
36、46,54 仮想化サーバ
38、40、42、48、50 仮想マシン
58 コンピュータシステム
60 管理装置
62 CPU
64 メモリ
66 記憶部
68 稼働管理プログラム
70 モデル照合プロセス
72 稼働停止順序決定プロセス
74 復電待機時間計算プロセス
76 稼働停止実行プロセス

Claims (3)

  1. 無停電電源装置と、
    停電が発生した場合に、前記無停電電源装置から電力が供給される複数のコンピュータと、
    稼働管理装置と、を備え、
    前記複数のコンピュータの各々は複数のサーバ種別に応じた処理を実行可能であって、前記複数のコンピュータは、前記複数のサーバ種別に応じて取りうる組み合わせに対応した複数の依存関係の何れかの下で稼働し、
    前記稼働管理装置は、
    前記複数のコンピュータの各々のサーバ種別と、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間とを、前記複数の依存関係毎に定めた情報を記憶する記憶部と、
    照合部と、を備え、
    前記照合部は、停電が発生した場合に、前記複数の依存関係毎に定めた情報を参照して、稼働中の前記複数のコンピュータの各々のサーバ種別と前記複数の依存関係毎に定めた情報に含まれる前記複数のコンピュータの各々のサーバ種別とを照合することで、前記サーバ種別が一致する数が最も多い依存関係を前記複数の依存関係の中から求め、求めた前記依存関係に対応する、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間を求める
    ことを特徴とする稼働管理システム
  2. 各々が複数のサーバ種別に応じた処理を実行可能であって、前記複数のサーバ種別に応じて取りうる組み合わせに対応した複数の依存関係の何れかの下で稼働する複数のコンピュータの各々のサーバ種別と、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間とを、前記複数の依存関係毎に定めた情報を記憶し、
    停電が発生した場合に、前記複数の依存関係毎に定めた情報を参照して、稼働中の前記複数のコンピュータの各々のサーバ種別と前記複数の依存関係毎に定めた情報に含まれる前記複数のコンピュータの各々のサーバ種別とを照合することで、前記サーバ種別が一致する数が最も多い依存関係を前記複数の依存関係の中から求め、求めた前記依存関係に対応する、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間を求める
    ことを特徴とする稼働管理方法
  3. コンピュータに、
    各々が複数のサーバ種別に応じた処理を実行可能であって、前記複数のサーバ種別に応じて取りうる組み合わせに対応した複数の依存関係の何れかの下で稼働する複数のコンピュータの各々のサーバ種別と、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間とを、前記複数の依存関係毎に定めた情報を記憶させ、
    停電が発生した場合に、前記複数の依存関係毎に定めた情報を参照して、稼働中の前記複数のコンピュータの各々のサーバ種別と前記複数の依存関係毎に定めた情報に含まれる前記複数のコンピュータの各々のサーバ種別とを照合することで、前記サーバ種別が一致する数が最も多い依存関係を前記複数の依存関係の中から求め、求めた前記依存関係に対応する、前記複数のコンピュータの各々の稼働停止順序と、前記複数のコンピュータの各々の稼働停止時間を求める
    処理を実行させるための稼働管理プログラム
JP2014504584A 2012-03-16 2012-03-16 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体 Expired - Fee Related JP5861767B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/056827 WO2013136502A1 (ja) 2012-03-16 2012-03-16 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体

Publications (2)

Publication Number Publication Date
JPWO2013136502A1 JPWO2013136502A1 (ja) 2015-08-03
JP5861767B2 true JP5861767B2 (ja) 2016-02-16

Family

ID=49160468

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014504584A Expired - Fee Related JP5861767B2 (ja) 2012-03-16 2012-03-16 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体

Country Status (3)

Country Link
US (1) US9541980B2 (ja)
JP (1) JP5861767B2 (ja)
WO (1) WO2013136502A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9183034B2 (en) * 2013-05-16 2015-11-10 Vmware, Inc. Managing availability of virtual machines in cloud computing services
US9729578B2 (en) * 2014-01-10 2017-08-08 Arista Networks, Inc. Method and system for implementing a network policy using a VXLAN network identifier
GB201513039D0 (en) * 2015-07-23 2015-09-09 Eaton Ind France Sas Shutting down of a virtual system
JP6487359B2 (ja) * 2016-03-16 2019-03-20 Kddi株式会社 ネットワークサービス評価システム
US10609134B2 (en) * 2016-03-24 2020-03-31 Wyse Technology L.L.C. Providing application virtualization using a peer-to-peer model
US10635539B2 (en) * 2018-05-01 2020-04-28 Allegro Microsystems, Llc Supply voltage disturbance immunity for digital circuits
JP7177349B2 (ja) * 2019-02-08 2022-11-24 富士通株式会社 スケジュールプログラム、スケジュール装置およびスケジュール方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6367617A (ja) * 1986-09-09 1988-03-26 Fujitsu Ltd 停電時のバツテリサポ−ト方式
US5117324A (en) * 1989-11-13 1992-05-26 Exide Electronics Ups-computer system and method for initiating computer shutdown based on remaining battery time as determined from sensed battery voltage and discharge curves
JPH07120230B2 (ja) * 1991-02-01 1995-12-20 株式会社ピーエフユー 無停電電源装置制御方式
JPH06113483A (ja) 1992-09-29 1994-04-22 Meidensha Corp 無停電電源装置のバッテリ容量監視方式
JPH07160370A (ja) 1993-12-06 1995-06-23 Nissan Motor Co Ltd 停電管理装置
JPH11155243A (ja) 1997-11-25 1999-06-08 Shin Kobe Electric Mach Co Ltd 無停電電源装置及び無停電電源装置を備えたコンピュータシステム
US6304981B1 (en) * 1998-10-19 2001-10-16 Gateway, Inc. Adaptive shutdown system and method for an information handling system
JP2002108515A (ja) * 2000-09-29 2002-04-12 Toshiba Tec Corp 電子機器および記憶媒体
JP4341305B2 (ja) 2003-06-10 2009-10-07 富士電機システムズ株式会社 電源管理装置
US7426715B2 (en) * 2004-06-14 2008-09-16 Lucent Technologies Inc. Shutting down a plurality of software components in an ordered sequence
JP2007179252A (ja) * 2005-12-27 2007-07-12 Nomura Research Institute Ltd サーバシステム、サーバシステムの制御方法
JP2007241827A (ja) 2006-03-10 2007-09-20 Densei Lambda Kk 無停電電源装置、無停電電源システムおよびシャットダウン処理プログラム
JP4924514B2 (ja) * 2008-03-31 2012-04-25 富士通株式会社 仮想マシン管理プログラム、管理サーバ装置及び仮想マシン管理方法
JP4651127B2 (ja) 2008-05-21 2011-03-16 株式会社日立情報システムズ 仮想マシンコンピュータシステム及び仮想マシンコンピュータシステムのフェールセーフ方法
JP5206750B2 (ja) * 2010-08-09 2013-06-12 サンケン電気株式会社 電源装置およびプログラム

Also Published As

Publication number Publication date
WO2013136502A1 (ja) 2013-09-19
US9541980B2 (en) 2017-01-10
JPWO2013136502A1 (ja) 2015-08-03
US20140380079A1 (en) 2014-12-25

Similar Documents

Publication Publication Date Title
JP5861767B2 (ja) 稼働管理装置、稼働管理方法、稼働管理プログラム及び記録媒体
US8898495B2 (en) Method and apparatus for switching an operating system by determining whether a boot-up mode is a general mode or a switch mode
CN104850435B (zh) 电源管理控制器与方法
US9904350B2 (en) Control device and computer program product
KR101799292B1 (ko) 전자 장치 및 그 부팅 방법
US7240189B2 (en) Fast resume to normal operation of a computer in a power saving mode
US20140108839A1 (en) Log record writing system, device, method, and program
JP6061495B2 (ja) 画像形成装置、画像形成装置の制御方法、及びプログラム
WO2014008653A1 (en) Method for switching a device between hibernat mode and wake-up
CN100384122C (zh) 网络终端产品的在线升级方法
KR101576370B1 (ko) 컴퓨터 시스템의 원격 복원 시스템 및 그 방법, 그리고 기록한 컴퓨터로 읽어 들일 수 있는 기록매체
JP7102198B2 (ja) 記憶手段を有する画像形成装置、画像形成装置の制御方法
JP2010204885A (ja) ディスクアレイ装置及びその制御方法
JP4359646B1 (ja) 情報処理装置、外部記憶装置、制御方法
JP6160688B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
WO2012126345A1 (zh) 计算机的启动方法、启动装置、状态转换方法和状态转换装置
JP2017174205A (ja) 印刷制御装置およびプログラム
JP6000655B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
JP6338645B2 (ja) 印刷装置及び印刷装置の制御方法
JP5422426B2 (ja) 情報処理装置
JP2008250506A (ja) ディスクアレイ装置,ディスクアレイ制御システム及び制御方法,制御用プログラム
JP2007164738A (ja) データ記憶装置及び画像処理装置
JP2015043178A (ja) 情報処理装置、情報処理方法及びプログラム
JP2018036804A (ja) 情報処理装置および情報処理装置の制御方法
JP2011159184A (ja) 情報処理システム及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151207

R150 Certificate of patent or registration of utility model

Ref document number: 5861767

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees