WO2011142042A1

WO2011142042A1 - サーバの信頼性可視化方法、計算機システム及び管理サーバ

Info

Publication number: WO2011142042A1
Application number: PCT/JP2010/058573
Authority: WO
Inventors: 誠司阿口; 高本　良史; 昇小幡
Original assignee: 株式会社日立製作所
Priority date: 2010-05-14
Filing date: 2010-05-14
Publication date: 2011-11-17
Also published as: US20130198370A1; JP5477602B2; JPWO2011142042A1

Abstract

物理サーバに搭載されたハードウェア及びソフトウェアの信頼性を数値化して、複数の物理サーバの信頼性の指標をそれぞれ算出する。物理サーバに搭載されているハードウェア及びソフトウェアの構成情報、障害情報、稼動情報を物理サーバのライフサイクル情報も考慮に入れて収集し、ハードウェア及びソフトウェアの信頼性の指標を数値化して算出する。さらに、ハードウェア及びソフトウェアの信頼性の指標を元に物理サーバ全体の信頼性の指標を求める。

Description

サーバの信頼性可視化方法、計算機システム及び管理サーバ

　本発明は、計算機の信頼性を数値化することにより可視化する方法に関するものである。

　仮想化が企業システムにも浸透し、サーバを統合する用途から企業内クラウドを支える基盤として活用され始めた。企業内クラウドの運用管理では、サーバリソースの割り当てを柔軟化するサーバリソース管理製品が注目されている。
サーバリソース管理は、リソースの割り当て状況や空き状況を把握することで、必要な業務を適切なサーバに割り当てや性能が不足した業務へのサーバの追加などが柔軟化できる。例えば、メモリやＣＰＵリソースの空き状況をスターレーティング機能（星の数）で評価する方法などが製品化されている。
　さらに、割り当てるサーバの空きリソースだけでなく、ハードウェアの障害履歴を考慮に入れる試みは、例えば、特許文献１に開示されている。特許文献１では、現用系から待機系への切り替え先のサーバを選択する際に、あらかじめ取得しておいたハードウェアの障害履歴を考慮することで、ハードウェア要因によるシステムダウン確率の低いサーバを選択することが可能となる。

特開平８−３６５０２号公報

　上記記特許文献１では、現用系から待機系への切り替え先のサーバを選択する際に、ハードウェアの障害履歴を考慮することで、ハードウェア要因によるシステムダウン確率の低いサーバを選択することが可能となる。
　一方、サーバ管理者がアプリケーションを実行させたい物理サーバを選択する場合や、仮想サーバを実行させたい物理サーバを選択する場合は、物理サーバの信頼性だけでなく、物理サーバで稼動しているＯＳや、仮想化部（ハイパバイザ）といったソフトウェアの信頼性もサーバを選択する際の重要な要素である。さらに、ＯＳを稼動させるために物理サーバを選択する場合でも、過去に搭載されているＯＳの動作実績が重要な要素となる。しかし、特許文献１では、これらソフトウェアの信頼性について考慮されていないため、サーバ管理者がリソースを割り当てる適切な物理サーバを選択できない、という問題があった。
　本発明の代表的な一例を示せば以下の通りである。すなわち、物理サーバに搭載されているハードウェア及びソフトウェアの構成情報、障害情報、稼動情報を物理サーバのライフサイクル情報も考慮に入れて取得し、ハードウェア及びソフトウェアの信頼性の指標を算出する。さらに、ハードウェア及びソフトウェアの信頼性の指標を元に物理サーバ全体の信頼性を評価する。
　本発明によれば、物理サーバに搭載されたハードウェア及びソフトウェアの信頼性を、物理サーバのライフサイクル情報も考慮して数値化し、数値化した信頼性の指標を元に、物理サーバ全体の信頼性を提供することで、より精度高く業務の割当先となる物理サーバの信頼性を評価することができる。

　図１は、本発明の実施の形態における計算機システムの全体の構成を示すブロック図である。
　図２は、本発明の実施の形態における管理サーバの構成を示すブロック図である。
　図３は、本発明の実施の形態における物理サーバの構成を示すブロック図である。
　図４は、本発明の実施の形態における概要の説明図である。
　図５は、本発明の実施の形態におけるサーバ管理テーブルの一例を示す説明図である。
　図６は、本発明の実施の形態における仮想サーバ管理テーブルの一例を示す説明図である。
　図７は、本発明の実施の形態におけるコンポーネント分類テーブルの一例を示す説明図である。
　図８は、本発明の実施の形態におけるログ分類テーブルの一例を示す説明図である。
　図９は、本発明の実施の形態におけるライフサイクル分類テーブルの一例を示す説明図である。
　図１０は、本発明の実施の形態における稼動履歴情報管理テーブルの一例を示す説明図である。
　図１１は、本発明の実施の形態におけるサーバ割当管理テーブルの一例を示す説明図である。
　図１２は、本発明の実施の形態における構成情報評価テーブルの一例を示す説明図である。
　図１３は、本発明の実施の形態における障害情報評価テーブルの一例を示す説明図である。
　図１４は、本発明の実施の形態における稼動情報評価テーブルの一例を示す説明図である。
　図１５は、本発明の実施の形態における信頼性評価重みテーブルの一例を示す説明図である。
　図１６は、本発明の実施の形態における信頼性表示画面の一例を示す説明図である。
　図１７は、本発明の実施の形態におけるサーバ情報取得部で行われる処理の一例を示すフローチャートである。
　図１８は、本発明の実施の形態におけるライフサイクル情報取得部で行われる処理の一例を示すフローチャートである。
　図１９は、本発明の実施の形態における構成情報取得部で行われる処理の一例を示すフローチャートである。
　図２０は、本発明の実施の形態における稼動履歴情報取得部で行われる処理の一例を示すフローチャートである。
　図２１は、本発明の実施の形態における最新障害情報取得部で行われる処理の一例を示すフローチャートである。
　図２２は、本発明の実施の形態における信頼性評価部で行われる処理の一例を示すフローチャートである。
　図２３は、本発明の実施の形態における物理サーバ信頼性算出部で行われる処理の一例を示すフローチャートである。
　図２４は、本発明の実施の形態における仮想化環境信頼性算出部で行われる処理の一例を示すフローチャートである。
　図２５は、本発明の実施の形態における図２４のステップ２４０４で行われる処理の一例を示すフローチャートである。

　以下、本発明の実施形態を、図面を用いて詳細に説明する。
　図１は、本発明における実施形態の全体図を示している。本実施形態における制御の中心は、管理サーバ１０１である。管理サーバ１０１は、サーバ情報取得部１０２、ライフサイクル情報取得部１０３、構成情報取得部１０４、稼動履歴情報取得部１０５、最新障害情報取得部１０６、信頼性評価部１０７、物理サーバ信頼性算出部１０８、仮想環境信頼性算出部１０９、サーバ管理テーブル１１０、仮想サーバ管理テーブル１１１コンポーネント分類テーブル１１２、ログ分類テーブル１１４、ライフサイクル分類テーブル１１５、サーバ割当管理テーブル１１６、構成情報評価テーブル１１７、障害情報評価テーブル１１８、稼動情報評価テーブル１１９、信頼性評価重みテーブル１２０から構成される。なお、サーバ情報取得部１０２は、ライフサイクル情報取得部１０３、構成情報取得部１０４、稼動履歴情報取得部１０５を含んでいてもよい。
　管理サーバ１０１の管理対象は、物理サーバ１２３、サーバ仮想化部１２２、仮想サーバ１２１、ディスクアレイ装置１２５、仮想サーバイメージ格納ディスク１２４である。ここで、サーバ仮想化部１２２は、例えば、ハイパーバイザやＶＭＭ（Ｖｉｒｔｕａｌ　Ｍａｃｈｉｎｅ　ｍｏｎｉｔｏｒ）等で構成され、物理サーバ１２３上で複数の仮想サーバ１２１を稼動させる機能を有しており、単一の物理サーバ１２３に複数のサーバを統合することができる。
　ディスクアレイ装置１２５は、ＳＡＮ３１０を介して物理サーバ１２３に接続される。ディスクアレイ装置１２５には、仮想サーバ１２１で実行されるプログラムが格納された仮想サーバイメージ格納ディスク１２４がある。本発明における実施形態では、管理サーバ１０１が物理サーバ１２３の信頼性を算出するシステムを構成する。
　図２は、本発明における管理サーバ１０１の構成を示す。管理サーバ１０１は、メモリ２０１、プロセッサ２０２、ＦＣＡ（Ｆｉｂｒｅ　Ｃｈａｎｎｅｌ　Ａｄａｐｔｅｒ）２０３、ＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）２０４、ＢＭＣ（Ｂａｓｅｂｏａｒｄ　Ｍａｎａｇｅｍｅｎｔ　Ｃｏｎｔｒｏｌｌｅｒ）２０５、入力装置２０７、出力装置２０８から構成される。プロセッサ２０２は、メモリ２０１内に格納された各種プログラムを実行する。ＦＣＡ２０３はＳＡＮ３１０を介してディスクアレイ装置２０９と接続される。ＮＩＣ２０４およびＢＭＣ２０５はネットワーク２０６に接続される。ＮＩＣ２０４は、主にメモリ２０１上の各種プログラムと通信し、ＢＭＣ２０５は管理サーバの障害などを検知し、ネットワーク２０６を介して他のサーバと通信するために使用する。本実施形態では、ＮＩＣ２０４とＢＭＣ２０５は同一のネットワーク２０６に接続されているが、異なるネットワークに接続しても良い。例えば、ＮＩＣ２０４を業務ネットワークに接続し、ＢＭＣ２０５を管理ネットワークに接続することができる。また、ＦＣＡ２０３、ＮＩＣ２０４はそれぞれ一つずつであるが、複数設けても良い。
　メモリ２０１上には、サーバ情報取得部１０２、ライフサイクル情報取得部１０３、構成情報取得部１０４、稼動履歴情報取得部１０５、最新障害情報取得部１０６、信頼性評価部１０７、物理サーバ信頼性算出部１０８、仮想環境信頼性算出部１０９、サーバ管理テーブル１１０、仮想サーバ管理テーブル１１１コンポーネント分類テーブル１１２、ログ分類テーブル１１４、ライフサイクル分類テーブル１１５、サーバ割当管理テーブル１１６、構成情報評価テーブル１１７、障害情報評価テーブル１１８、稼動情報評価テーブル１１９、信頼性評価重みテーブル１２０が格納される。プロセッサ２０２によりメモリ２０１に格納された各プログラムが実行される。
　図３は、管理サーバ１０１の管理対象となるサーバ仮想化部１２２が稼働している物理サーバ１２３の詳細な構成を示している。物理サーバ１２３は、メモリ３０１、プロセッサ３０４、ＦＣＡ（Ｆｉｂｒｅ　Ｃｈａｎｎｅｌ　Ａｄａｐｔｅｒ）３０５、ＮＩＣ（Ｎｅｔｗｏｒｋ　Ｉｎｔｅｒｆａｃｅ　Ｃａｒｄ）３０６、ＢＭＣ（Ｂａｓｅｂｏａｒｄ　Ｍａｎａｇｅｍｅｎｔ　Ｃｏｎｔｒｏｌｌｅｒ）３０７、入力装置３２０から構成される。
　プロセッサ３０４は、メモリ３０１内に格納された各種プログラムを実行する。ＦＣＡ３０５はＳＡＮ３１０を介してディスクアレイ装置１２５と接続される。ＮＩＣ３０６およびＢＭＣ３０７はネットワーク３０８に接続される。ＮＩＣ３０６は、主にメモリ３０１上の各種プログラムと通信し、ＢＭＣ３０７は物理サーバ１２３の障害などを検知し、ネットワーク３０８を介して管理サーバ１０１や他のサーバと通信するために使用する。また、ＢＭＣ３０７は管理サーバ１０１からの指令に応じて物理サーバ１２３の電源の制御を行う。本実施形態では、ＮＩＣ３０６とＢＭＣ３０７は同一のネットワーク３０８に接続されているが、異なるネットワークに接続しても良い。また、ＦＣＡ３０５、ＮＩＣ３０６はそれぞれ一つずつであるが、複数存在しても良い。
　メモリ３０１上では、サーバ仮想化部１２２が稼働することで、物理サーバ１２３の計算機資源を分割または共有することで複数の仮想サーバ１２１を構築することができる。仮想サーバ１２１は、それぞれ独立にＯＳ（Ｏｐｅｒａｔｉｎｇ　Ｓｙｓｔｅｍ）３０２を稼働させることができる。
　プロセッサ３０４によりサーバ仮想化部１２２が実行されると、仮想サーバ１２１を構築することができる。サーバ仮想化部１２２は、仮想サーバ１２１毎にあらかじめ設定された仮想サーバイメージ格納ディスク１２４内の所定の仮想サーバＯＳイメージ３０９を読み込み、それぞれ独立した仮想サーバ１２１をそれぞれ構築する。仮想サーバ１２１毎に仮想サーバＯＳイメージ３０９を設けておくことで、まったく異なるＯＳやアプリケーションを単一の物理サーバ１２３上で複数稼働させることができる。
　サーバ仮想化部１２２の制御Ｉ／Ｆ（Ｉｎｔｅｒｆａｃｅ）３０３は、サーバ仮想化部１２２の仮想的なネットワークインタフェースであり、ＮＩＣ３０６及びネットワーク３０８を介して外部（管理サーバ１０１）からサーバ仮想化部１２２を制御するためのものである。サーバ仮想化部１２２は制御Ｉ／Ｆ３０３を介して管理サーバ１０１からの指令を受け付けて仮想サーバ１２１の作成や削除などを行うことができる。入力装置３２０は、管理者がライフサイクル情報を手動で設定するために用いられる。
　図４は、本発明の動作概要を示す。管理サーバ１０１は、管理対象となる物理サーバ１２３とネットワークを介して接続され、サーバ情報取得部１０２が物理サーバ１２３の各コンポーネントの構成情報、障害情報、稼動情報、ライフサイクル情報などを取得して物理サーバ信頼性算出部１０８へ転送することができる。なお、サーバ情報取得部１０２は、後述するように、ライフサイクル情報取得部１０３、構成情報取得部１０４、稼動履歴情報取得部１０５を介して各情報を取得する。
　本実施形態では、物理サーバ信頼性算出部１０８が物理サーバ１２３から取得する構成情報は、例えば、サーバ仮想化部１２２及び各仮想サーバ１２１のＯＳ３０２からハードウェア及びソフトウェアに関する情報で構成される。
　また、物理サーバ信頼性算出部１０８が物理サーバ１２３から取得する障害情報は、例えば、ＢＭＣ３０７が検知した障害やサーバ仮想化部１２２及び各仮想サーバ１２１のＯＳ３０２が検知したエラー等で構成される。
　また、物理サーバ信頼性算出部１０８が物理サーバ１２３から取得するログ情報は、例えば、サーバ仮想化部１２２のログ情報、各仮想サーバ１２１のＯＳ３０２のログ情報、ＢＭＣ３０７のログ情報及びサーバ仮想化部１２２が存在しない環境では物理サーバ１２３上のＯＳのログ情報で構成される。
　なお、以下の説明では、サーバ仮想化部１２２、仮想サーバ１２１のＯＳ３０２のログ情報、ＢＭＣ３０７及びＯＳのログ情報の総称を物理サーバ１２３のログ情報とする。管理サーバ１０１は、物理サーバ１２３から取得したログ情報を蓄積したものを稼動履歴情報として扱う。
　本概要図では物理サーバ１２３は１台のみであるが、複数台の物理サーバ１２３が存在しても良い。本発明では、管理サーバ１０１が物理サーバ１２３の各コンポーネントの構成情報、障害情報、稼動情報、ライフサイクル情報を取得すると、物理サーバ信頼性算出部１０８が物理サーバ１２３の構成情報の信頼性算出４０２、稼動履歴情報の信頼性算出４０３、障害情報の信頼性算出４０４を行い、これらの情報をもとに物理サーバ１２３の信頼性算出結果の表示（４０６）を行う。尚、稼動履歴情報の信頼性を算出する際には、後述するように、システム障害の要因として、ＯＳ要因とハード要因を切り分ける（４０５）。
　なお、物理サーバ１２３のライフサイクル情報が「破棄」で停止している場合には、管理サーバ１０１が起動用のＯＳと、構成情報等を取得するエージェントとして情報取得部３３０を送信し、「破棄」となっている物理サーバ１２３上で情報取得部３３０を稼動させてからサーバ情報取得部１０２による上記情報の取得を行えばよい。
　また、情報取得部３３０は、物理サーバ１２３上やサーバ仮想化部１２２条に常駐してもよい。
　図５は、サーバ管理テーブル１１０の詳細を示している。サーバ管理テーブルは、物理サーバ１２３に関する詳細な情報が格納される。
　物理サーバ識別子５０１は、物理サーバ１２３を特定するための識別子を格納する。起動ディスク５０２は、物理サーバ１２３の起動ディスクの場所を示す。サーバ識別子５０３は、ディスクアレイ装置と接続されるＦＣＡが有する固有の識別子を示す。サーバモード５０４は、物理サーバ１２３の稼働状態を示しており、サーバ仮想化部１２２が稼働しているか否かを判別するための情報が格納されている。例えば、サーバモード５０４が「サーバ仮想化部」となっている物理サーバ１２３では、１つ以上の仮想サーバ１２１が実行可能であることを示す。また、サーバモード５０４が「基本」となっている物理サーバ１２３では、１つのＯＳが実行可能であることを示す。
　プロセッサ識別子及びメモリ識別子５０５はプロセッサ３０４やメモリ３０１を特定するための識別子を格納する。プロセッサ及びメモリ５０６は、物理サーバ１２３のプロセッサ３０４の周波数情報、コア数やメモリ容量等の性能情報が格納される。ネットワーク識別子５０７は、物理サーバ１２３が有するＮＩＣ３０６を識別するための情報が格納される。物理サーバ１２３が複数のＮＩＣ３０６を備える場合は、複数の識別子が格納される。
　ディスク５０８は、物理サーバ１２３が有する（またはアクセス可能な）ディスクの識別子が格納される。ＯＳ識別子５１０は、ＯＳを特定する識別子が格納されている。仮想化部識別子５１１は、物理サーバ１２３上でサーバ仮想化部１２２が稼働している場合に、サーバ仮想化部１２２を特定する識別子が格納される。この仮想化部識別子５１１は、後で述べる仮想サーバ管理テーブル１１１と関連づけられている。
　サーバ状態５１２は、物理サーバ１２３の状態や役割を示しており、図示の例では現用系か待機系かを示す情報が格納されている。サーバ状態５１２は、管理サーバ１０１を利用する管理者などが設定してもよいし、管理サーバ１０１が系切替を行ったときに更新することができる。ライフサイクル５１３は物理サーバ１２３のライフサイクル情報を特定する情報が格納されている。
　上記サーバ管理テーブル１１０の各情報は、サーバ情報取得部１０２が取得した構成情報、ライフサイクル情報を反映させる他に、管理サーバ１０１の管理者などが入力装置２０７から設定した値を格納してもよい。
　図６は、仮想サーバ管理テーブル１１１の詳細を示している。仮想サーバ管理テーブル１１１は、サーバ仮想化部１２２及び仮想サーバ１２１に関する詳細な情報が格納される。なお、仮想サーバ１２１に対する物理サーバ１２３のリソースの割り当ては、管理サーバ１０１の図示しない管理部が実行する。仮想サーバ１２１に対するリソースの割り当てについては公知または周知の技術を適用すればよいので、本実施形態では詳述しない。
　仮想化部識別子６０１は、管理サーバ１０１が管理している複数のサーバ仮想化部１２２を識別するための情報が格納される。制御Ｉ／Ｆ６０２は、サーバ仮想化部１２２を外部から制御するためのアクセス情報となるネットワークアドレスが格納される。
　仮想サーバ識別子６０３は、各サーバ仮想化部１２２が割り当てた仮想サーバ１２１毎にユニークな識別子が格納される。仮想サーバＯＳイメージ６０４は、仮想サーバ１２１がどのＯＳイメージを使用して起動したか、ＯＳイメージの場所が格納されている。プロセッサ及びメモリ割当量６０５は、当該仮想サーバ１２１に割当てられる計算機リソース量を示す。状態６０６は、仮想サーバ１２１が現在稼働中か否かが格納されている。プロセッサ及びメモリ実使用量６０７は、当該仮想サーバ１２１が実際に使用しているプロセッサ３０４やメモリ３０１の容量が格納される。実使用量６０７は、例えば、サーバ仮想化部１２２や仮想サーバ１２１上で稼動するＯＳなどから定期的に性能情報を収集する手段（図示省略）を有することによって取得することができる。また、実使用量６０７は、単位時間当たりの平均使用量を格納するなどの方法が考えられる。
　ネットワーク割当６０８は、仮想サーバ１２１に割り当てられた仮想ＮＩＣの識別子と、当該仮想ＮＩＣに対応する物理サーバ１２３が有するＮＩＣ３０６（物理ＮＩＣ）との割当情報が格納される。ディスク６０９は、仮想サーバに割り当てられたＯＳイメージファイルやデータ格納用のイメージファイルの場所が格納される。
　図７は、コンポーネント分類テーブル１１２の詳細を示している。コンポーネント分類テーブル１１２は、稼動履歴情報取得部１０５が物理サーバ１２３の各コンポーネントを分類するための情報が格納されている。コンポーネント７０１は、物理サーバ１２３を構成するコンポーネントの名称が格納されている。図示の例では、物理サーバ１２３を構成するコンポーネントを、プロセッサ、メモリ、ＮＩＣ、ＦＣＡ，ＢＭＣ、ディスクアレイ、サーバ仮想化部、仮想サーバ、ＯＳとした例を示す。
　図８は、ログ分類テーブル１１３の詳細を示している。ログ分類テーブル１１３は、物理サーバ１２３やサーバ仮想化部１２２から取得したログ情報を稼動履歴情報取得部１０５で分類するための識別子が格納されている。
　ログ分類８０１は、物理サーバ１２３等から取得したログ内容を「構成情報」のログ、「障害情報」のログ、「稼動情報」のログに分類した際の識別子が格納されている。ログ内容８０２は、分類したログの詳細な内容が格納されている。本実施形態では、構成情報に分類されたログは、ログ内容をコンポーネントの「追加」と「削除」に詳細化した例を示している。「障害情報」に分類されたログは、ログ内容を「一時的」と「致命的」に詳細化した例を示している。なお、「一時的」のログは物理サーバ１２３が停止に至らない障害を示し、「致命的」のログは物理サーバ１２３が停止した障害を示す。「稼動情報」に分類されたログは、物理サーバ１２３の「起動」と「停止」に詳細化した例を示している。
　図９は、ライフサイクル分類テーブル１１４の詳細を示している。ライフサイクル分類テーブル１１４は物理サーバ１２３のライフサイクル情報のフェーズを上述したようにライフサイクル情報取得部１０３で分類するための情報を格納している。なお、ライフサイクル情報は、物理サーバ１２３の運用状態を示す情報である。
　ライフサイクル９０１は、物理サーバ１２３のライフサイクル情報を識別するための情報が格納されている。本実施形態では、上述のように破棄、構築、運用、最適化に分類している。
　「破棄」とは、物理サーバ１２３のライフサイクルが一巡し、次に再利用されるまでの期間を意味する。ライフサイクル情報が「破棄」の場合は、物理サーバ１２３が業務を提供していない状態、換言すれば利用されていない状態を示す。
　「構築」とは、実際に物理サーバ１２３または仮想サーバ１２１を構築する期間を意味する。本実施形態の構築は、物理サーバ利用時の計画及び設計段階も含めた期間を表す。ライフサイクル情報が「構築」の場合は、物理サーバ１２３で業務を提供するための準備を行っている状態を示し、例えば、サーバ仮想化部１２２が、仮想サーバ１２１に仮想のＭＡＣを割り当てている期間などが「構築」の状態に含まれる。
　「運用」とは、実際に物理サーバ１２３が運用されている期間を意味する。ライフサイクル情報が「運用」の場合、物理サーバ１２３では、ＯＳ３０２または仮想サーバ１２１上でＯＳ３０２が実行されて、業務を提供している状態を示す。
　「最適化」とは、運用が進んだ段階で、負荷を平準化するために、サーバリソースを追加及び削除する期間を意味する。ライフサイクル情報が「最適化」の場合は、一旦、ライフサイクル情報が「運用」となった物理サーバ１２３の構成を変更する状態を示し、例えば、メモリ３０１などのハードウェアリソースの追加や仮想サーバ１２１に対するリソースの割り当ての変更を行っている期間を示す。
　上記のようなライフサイクル情報は、管理者などによって物理サーバ１２３毎に設定される。
　図１０は、稼動履歴情報管理テーブル１１５の詳細を示している。稼動履歴情報管理テーブル１１５は、物理サーバ１２３のログ情報を、コンポーネント分類テーブル１１２、ログ分類テーブル１１３、ライフサイクル分類テーブル１１４を用いて稼動履歴情報取得部１０５が分類した結果が格納されている。
　タイムスタンプ１００１は、取得したログ情報の発生時刻を格納する。ログ情報の発生時刻は、物理サーバ１２３等のログ情報を生成した際に記録されているタイムスタンプを当該ログ情報の発生時刻とすることができる。コンポーネント１００２は、ログ情報に対応するコンポーネントの名称と、コンポーネントの識別子が格納されている。ログ分類１００３は、物理サーバ１２３から取得したログ情報を稼動履歴情報取得部１０５がログ分類テーブル１１３を用いて分類した結果が格納される。ログ内容１００４は、物理サーバ１２３から取得したログ情報をログ分類テーブル１１３を稼動履歴情報取得部１０５が用いて分類した結果が格納される。ライフサイクル１００５は、物理サーバ１２３から取得したライフサイクル情報をライフサイクル情報取得部１０３がライフサイクル分類テーブル１１４を用いて分類した結果が格納される。
　図１１は、サーバ割当管理テーブル１１６の詳細を示している。サーバ割当管理テーブル１１６は、物理サーバ１２３に対する業務の割当状態に関する情報が構成情報取得部１０４により格納される。サーバ識別子１１０１は、物理サーバ１２３を識別するための情報が格納されている。ステータス１１０２は、物理サーバ１２３の業務の割当状態に関する情報として、「割当中」と「未割当」の何れかがが格納されている。なお、物理サーバ１２３または仮想サーバ１２１に対する業務（アプリケーション）の割り当ては、管理サーバ１０１の図示しない管理部が行うものとする。なお、業務の割り当てについては公知または周知の技術を適用すればよいので、本実施形態では詳述しない。
　図１２は、構成情報評価テーブル１１７の詳細を示している。構成情報評価テーブル１１７は、物理サーバ１２３を構成する各コンポーネントの識別子を元に、物理サーバ信頼性算出部１０８が各コンポーネントの信頼性の指標を算出した結果が格納されている。
　コンポーネント１２０１は、物理サーバ１２３のコンポーネントの名称が格納されている。評価１２０２は、物理サーバ１２３の各コンポーネントの識別子を元に、物理サーバ信頼性算出部１０８が信頼性を点数（数値）化した指標が格納されている。物理サーバ信頼性算出部１０８は、本実施形態では、あらかじめ各コンポーネントの識別子と評価１２０２の対応関係が取得できていることを前提としている。なお、評価１２０２は信頼性の指標が格納される。例えば、物理サーバ信頼性算出部１０８は、物理サーバ１２３の各コンポーネントの種類や性能情報から評価１２０２を算出するためのテーブルや関数を予め取得しておく。そして、物理サーバ信頼性算出部１０８は、サーバ管理テーブル１１０に格納された各コンポーネントの情報とテーブルから評価１２０２を算出する。一例を示せば、コンポーネント１２０１が、プロセッサの場合、物理サーバ信頼性算出部１０８は、プロセッサの動作周波数が高いほど評価１２０２を高くし、また、プロセッサのコア数が多いほど評価１２０２を高く設定する。また、コンポーネント１２０１がメモリの場合では、物理サーバ信頼性算出部１０８は、容量が大きくなるにつれて評価１２０２を高く設定する。
　構成情報評価テーブル１１７では、物理サーバ１２３に関する全てのログ情報からコンポーネント毎の信頼性の指標が評価１２０２に格納される。したがって、現在のコンポーネント（ハードウェアまたはソフトウェア）毎の構成に関する信頼性の指標と、過去のコンポーネント（ハードウェアまたはソフトウェア）毎の構成に関する信頼性の指標が格納される。なお、構成情報評価テーブル１１７を管理サーバ１０１の出力装置２０８に表示するようにしてもよい。
　図１３は、障害情報評価テーブル１１８の詳細を示している。障害情報評価テーブル１１８は、物理サーバ１２３を構成する各コンポーネントの障害発生回数と、その障害回数を元に物理サーバ信頼性算出部１０８が各コンポーネントについて信頼性の指標を点数化した結果が格納されている。
　コンポーネント１３０１には、物理サーバ１２３を構成するコンポーネント名称が格納されている。障害回数１３０２には、物理サーバ１２３を構成するコンポーネントの障害発生回数が格納されている。評価１３０３は、物理サーバ１２３の各コンポーネントの障害回数を元に物理サーバ信頼性算出部１０８が信頼性を点数（数値）化した指標である障害情報評価が格納されている。
　本実施形態の各コンポーネントの障害情報評価の計算式は以下の通りである。
コンポーネントの障害情報評価＝１００　−　障害発生回数×１０　…（１）
　なお、障害情報評価テーブル１１８では、物理サーバ１２３に関する全てのログ情報からコンポーネント毎に障害に対する信頼性の指標が評価１３０３に格納される。したがって、現在のコンポーネント（ハードウェアまたはソフトウェア）毎の障害に対する信頼性の指標と、過去のコンポーネント（ハードウェアまたはソフトウェア）毎の障害に対する信頼性の指標が格納される。なお、障害情報評価テーブル１１８を管理サーバ１０１の出力装置２０８に表示するようにしてもよい。
　図１４は、稼動情報評価テーブル１１９の詳細を示している。稼動情報評価テーブル１１９は、物理サーバ１２３の各コンポーネントの連続稼働時間と、その連続稼働時間を元に物理サーバ信頼性算出部１０８が信頼性の指標を点数（数値）化した結果が格納されている。コンポーネント１４０１は、物理サーバ１２３を構成するコンポーネント名称が格納されている。連続稼働時間１４０２は、物理サーバ１２３を構成するコンポーネントの連続稼働時間が格納されている。評価１４０３は、物理サーバ１２３の各コンポーネントの連続稼動時間を元に物理サーバ信頼性算出部１０８各コンポーネントの信頼性を点数化した指標である稼動情報評価が格納されている。
　本実施形態の各コンポーネントの稼動情報評価の計算式は以下の通りである。
コンポーネントの稼動情報評価＝最大連続稼動の月数×１０　……（２）
　なお、稼動情報評価テーブル１１９では、物理サーバ１２３に関する全てのログ情報からコンポーネント毎に稼動に対する信頼性の指標が評価１４０３に格納される。したがって、現在のコンポーネント（ハードウェアまたはソフトウェア）毎の稼動に対する信頼性の指標と、過去のコンポーネント（ハードウェアまたはソフトウェア）毎の稼動に対する信頼性の指標が格納される。なお、稼動情報評価テーブル１１９を管理サーバ１０１の出力装置２０８に表示するようにしてもよい。
　図１５は、信頼性評価重みテーブル１２０の詳細を示している。信頼性評価重みテーブル１２０は、物理サーバ信頼性算出部１０８が物理サーバ１２３の信頼性を算出する際の、構成情報、障害情報、稼動情報の重み付けの情報を格納する。信頼性情報１５０１は、物理サーバ１２３の信頼性を評価する際の元になる情報で、「構成情報」、「障害情報」または「稼動情報」が格納されている。重み１５０２は、物理サーバ１２３の信頼性を評価する際の重み付けの情報が格納されている。本実施形態では、「構成情報」、「障害情報」、「稼動情報」の合計が１００％となるように重みを割り振っている。本テーブルは、システム管理者が管理サーバ１０１の入力装置２０７から、手動で与えても良い。
　図１６は、信頼性表示画面の詳細を示している。信頼性評価画面は、信頼性を評価した物理サーバ１２３と、構成情報、障害情報、稼動情報を点数化した信頼性の指標と、総合評価を点数化した物理サーバ１２３全体の信頼性の指標を割り当て状態とともに出力装置２０８に出力した結果である。
　物理サーバ識別子１６０１は、信頼性を評価する物理サーバ１２３の識別子が格納されている。構成情報評価１６０２は、物理サーバ１２３の構成情報の信頼性の指標が格納されている。障害情報評価１６０３は、物理サーバ１２３の障害情報の信頼性の指標が格納されている。稼動情報評価１６０４は、物理サーバ１２３の稼動情報の信頼性の指標が格納されている。総合情報評価１６０５は、物理サーバ１２３の構成情報評価、障害情報評価、稼動情報評価と、信頼性評価重みテーブル１２０の内容を加味した物理サーバ１２３の信頼性の総合的な指標が格納されている。割当状態１６０６は、物理サーバ１２３の割当状態が格納されている。
　本実施形態の物理サーバ１２３の信頼性の構成情報評価、障害情報評価、稼動情報評価、総合評価の計算式は以下の通りである。
構成情報評価＝構成情報評価テーブル１１７の各コンポーネントの評価の合計
　　　　　　　÷コンポーネント数　　………（３）
障害情報評価＝障害情報評価テーブル１１８の各コンポーネントの評価の合計
　　　　　　　÷コンポーネント数　　………（４）
稼動情報評価＝稼動情報評価テーブル１１８の各コンポーネントの評価の合計
　　　　　　　÷コンポーネント数　　………（５）
総合評価＝構成情報評価×信頼性評価重みテーブルの構成情報の重み
　＋障害情報評価×信頼性評価重みテーブルの障害情報の重み
　＋稼動情報評価×信頼性評価重みテーブルの稼動情報の重み　……（６）
　上記（３）~（５）式より信頼性算出部１０７は、物理サーバ１２３毎の信頼性を示す指標としての各評価を算出し、さらに信頼性算出部１０７は、各評価から上記（６）式より総合的な指標を総合評価として算出して図１６で示すように出力装置２０８に表示する。
　図１７は、サーバ情報取得部１０２で行われる処理のフローチャートを示す。この処理は、管理サーバ１０１の入力装置２０７から管理者などが所定の指令を入力したときなどに実行される。または、所定の周期で実行してもよい。
　サーバ情報取得部１０２では、物理サーバ１２３のライフサイクル情報、構成情報、稼動履歴情報を取得する。ステップ１７０１ではライフサイクル情報取得部１０３を呼び出し、物理サーバ１２３のライフサイクル情報を取得する。ステップ１７０２では構成情報取得部を呼び出し、物理サーバ１２３の構成情報を取得する。ステップ１７０３では稼動履歴情報取得部を呼び出し、物理サーバ１２３の稼動履歴情報を取得する。情報を取得する物理サーバ１２３が複数ある場合は、全ての物理サーバ１２３の情報取得が完了するまで繰り返す。
　図１８は、ライフサイクル情報取得部１０３で行われる処理のフローチャートを示す。この処理は、図１７のステップ１７０１で実行される処理である。ライフサイクル情報取得部１０３では、物理サーバ１２３のライフサイクル情報を取得した後、物理サーバの情報を取得する方法を決定する。
　ステップ１８０１では、物理サーバ１２３からライフサイクル情報を取得する。ライフサイクル情報は入力装置３２０から管理者が手動で設定し、ディスクアレイ装置１２５に格納済みとする。物理サーバ１２３の電源が遮断されている場合は、管理サーバ１０１から物理サーバ１２３に起動を指令して、ディスクアレイ装置１２５からライフサイクル情報を取得する。外部から電源を入れる方法は、ＰＸＥ（Ｐｒｅｂｏｏｔ　ｅＸｅｃｕｔｉｏｎ　Ｅｎｖｉｒｏｎｍｅｎｔ）ブートのように外部のサーバから物理サーバ１２３を起動させる既存技術で実現することが可能である。
　ステップ１８０２では、ステップ１８０１で取得した物理サーバ１２３のライフサイクル情報が破棄か否かを判定する。ライフサイクル情報が破棄である場合は、ステップ１８０３で情報取得用ＯＳを物理サーバ１２３に送信する。情報取得用ＯＳは物理サーバ１２３でライフサイクル情報を取得し、管理サーバ１０１に通知する。その後、ステップ１８０５に移り、サーバ管理テーブル１１０にライフサイクル情報を設定する。ライフサイクル情報が破棄でない場合は、ステップ１８０４に移る。
　ステップ１８０４では、物理サーバ１２３に予めインストールした情報取得用ａｇｅｎｔを起動させてライフサイクル情報を取得させた後、ステップ１８０５に移り、サーバ管理テーブル１１０にライフサイクル情報を設定する。
　図１９は、構成情報取得部１０４で行われる処理のフローチャートを示す。この処理は、図１７のステップ１７０２で実行される処理である。構成情報取得部１０４では、物理サーバ１２３の構成情報を取得する。ステップ１９０１では、構成情報取得部１０４が物理サーバ１２３から仮想化部識別子を取得する。ステップ１９０２では、ステップ１９０１で取得した仮想化部識別子を参照し、物理サーバ１２３にサーバ仮想化部１２２が存在するかを判定する。サーバ仮想化部１２２が存在する場合は、ステップ１９０３で仮想サーバ１２１から構成情報を取得し、ステップ１９０４では取得した構成情報で仮想サーバ管理テーブル１１１を更新する。
　サーバ仮想化部１２２が存在しない場合は、ステップ１９０３、ステップ１９０４を実行しない。ステップ１９０５では、物理サーバ１２３のＯＳまたはサーバ仮想化部１２２からサーバ識別子、コンポーネントの種別と数、サーバ状態を取得する。ステップ１９０６では、ステップ１９０５で取得した情報でサーバ管理テーブル１１０を更新する。ステップ１９０７では、物理サーバ１２３のＯＳまたはサーバ仮想化部１２２からサーバ割当情報を取得する。ステップ１９０８では、取得したサーバ割当情報でサーバ割当管理テーブル１１６を更新する。
　上記処理により仮想サーバ管理テーブル１１１、サーバ管理テーブル１１０、サーバ割当管理テーブル１１６が最新の値に更新される。
　図２０は、稼動履歴情報取得部１０５で行われる処理のフローチャートを示す。この処理は、図１７のステップ１７０３で実行される処理である。稼動履歴情報取得部１０５では、コンポーネント分類テーブル１１２、ログ分類テーブル１１３、ライフサイクル分類テーブル１１４を用いて物理サーバ１２３から取得した稼動情報を分類し、稼動履歴情報管理テーブル１１５に登録する。
　ステップ２００１では、稼動履歴情報取得部１０５が物理サーバ１２３から稼動履歴情報（ログ情報）を取得する。ステップ２００２では、ステップ２００１で取得した稼動履歴情報をタイムスタンプでソートする。ステップ２００３では、稼動履歴情報の出力元のコンポーネントを、コンポーネント分類テーブル１１２を用いて識別する。
　ステップ２００４では、取得した稼動履歴情報が、構成情報、障害情報、稼動情報の何れに属するかをログ分類テーブル１１３を用いて識別する。ステップ２００５では、稼動履歴情報の分類結果に応じて、稼動履歴情報の内容を識別する。この識別の際にもログ分類テーブル１１３を用いる。ステップ２００６では、稼動履歴情報の出力時のライフサイクル情報を、ライフサイクル分類テーブル１１４を用いて分類する。この処理は、稼動履歴情報取得部１０５が物理サーバ１２３毎のライフサイクル情報と期間を蓄積しておくことで、稼動履歴情報（ログ情報）が生成された時点の物理サーバ１２３の運用状態を取得できる。
　ステップ２００７では、稼動履歴情報取得部１０５が稼動履歴情報を分類した結果を稼動履歴情報管理テーブル１１５へ格納する。ステップ２００８では、物理サーバ１２３の稼動履歴情報の分類が完了したか否かを判定する。分類が完了していない場合は、ステップ２００１からステップ２００８の処理を繰り返す。分類が完了している場合は、ステップ２００９に移る。ステップ２００９では、最新障害情報取得部１０６を呼び出す。
　図２１は、最新障害情報取得部１０６で行われる処理のフローチャートを示す。最新障害情報取得部１０６では、物理サーバ１２３の各コンポーネントを実際に検査し、検査の結果を稼動履歴情報管理テーブル１１５に反映する。
　ステップ２１０１では、最新障害情報取得部１０６が物理サーバ１２３の各コンポーネントを検査する。検査するコンポーネントを決定する際は、コンポーネント分類テーブル１１２を参照する。各コンポーネントの検査は、上述したエージェントや情報取得用ＯＳ等で実施し、検査結果を管理サーバ１０１に通知する。
　ステップ２１０２では、各コンポーネントの検査結果を判定して異常がない場合は、ステップ２１０５に移る。ステップ２１０５では全コンポーネントの検査が完了したか否を判定し、全てのコンポーネントの検査が完了していない場合は、ステップ２１０１に戻って、次のコンポーネントの検査を実施する。
　コンポーネントの検査結果が異常である場合は、ステップ２１０３に移る。ステップ２１０３では最新障害情報取得部１０６が現在時刻を取得する。ステップ２１０４では最新障害情報取得部１０６がコンポーネントの検査結果と現在時刻を稼動履歴情報管理テーブル１１５に反映する。
　上記処理によって、現在の物理サーバ１２３に異常があるか否かを検出することができる。
　図２２は、信頼性評価部１０７で行われる処理のフローチャートを示す。この処理は、管理サーバ１０１の入力装置２０７から管理者などが信頼性の表示の指令を入力したときなどに実行される。信頼性評価部１０７では、物理サーバ信頼性算出部１０８により点数化を実行させて、物理サーバの信頼性を出力装置２０８に出力する。
　ステップ２２０１では、物理サーバ信頼性算出部１０８を呼び出し、構成情報評価テーブル１１７を生成させる。ステップ２２０２では、物理サーバ信頼性算出部１０８により生成された構成情報評価テーブル１１７と信頼性重みテーブル１２０を元に、信頼性評価部１０７が物理サーバ１２３の構成情報評価を算出する。本実施形態では、各コンポーネントの構成情報評価の平均点数と、信頼性評価重みテーブル１２０の構成情報の重み１５０２を乗算する。
　ステップ２２０３では、物理サーバ信頼性算出部１０８により生成された障害情報評価テーブル１１８と信頼性重みテーブル１２０を元に、信頼性評価部１０７が物理サーバ１２３の障害情報評価を算出する。本実施形態では、各コンポーネントの平均点数と、信頼性評価重みテーブル１２０の障害情報の重み１５０２を乗算する。
　ステップ２２０４では、物理サーバ信頼性算出部１０８により生成された稼動情報評価テーブル１１８と信頼性重みテーブル１２０を元に、信頼性評価部１０７が物理サーバ１２３の稼動情報評価を算出する。本実施形態では、各コンポーネントの平均点数と、信頼性評価重みテーブル１２０の稼動情報の重み１５０２を乗算する。
　ステップ２２０５では、上記のように算出した構成情報評価、障害情報評価、稼動情報評価を元に信頼性評価部１０７が物理サーバ１２３の総合評価を上述した（６）式により算出する。本実施形態では、構成情報評価、障害情報評価、稼動情報評価を加算した総和を総合評価として算出する。なお、構成情報評価、障害情報評価、稼動情報評価以外の指標を用いて総合評価を算出しても良い。例えば、ハードウェアの視点では、物理サーバ１２３の導入時からの経過時間と、ハードウェアの故障発生回数の一般的な指標であるバスタブ曲線を元に、故障の発生確率が低い経過時間の物理サーバ１２３を加点するという方法も可能である。また、ソフトウェアの視点では、物理サーバ１２３に搭載されているソフトウェアに適用されているパッチ数や、パッチの重要度を加算する方法も可能である。
　ステップ２２０６では、全ての物理サーバ１２３の信頼性評価が完了したか否かを判定する。全ての物理サーバ１２３の信頼性評価が完了していない場合は、ステップ２２０１に戻って次の物理サーバ１２３の信頼性評価に移る。全ての物理サーバ１２３の信頼性の指標の算出が完了している場合は、ステップ２２０７で全物理サーバの信頼性評価結果を割当状態とともに出力装置２０８へ表示する。
　ステップ２２０７では、信頼性評価部１０７が構成情報評価テーブル１１７、障害情報評価テーブル１１８及び稼動情報評価テーブル１１９を参照して、上述した（３）~（５）式により、構成情報評価と障害情報評価及び稼動情報評価を求める。そして、信頼性評価部１０７は、信頼性評価重みテーブル１２０を参照して、上述の（６）式より総合評価を算出して図１６で示すように物理サーバ１２３毎の評価を出力装置２０８に表示する。
　図２３は、物理サーバ信頼性算出部１０８で行われる処理のフローチャートを示す。この処理は、図２２のステップ２２０１で行われる処理である。物理サーバ信頼性算出部１０８では物理サーバ１２３の構成情報、障害情報、稼動情報の信頼性を評価し、評価結果をそれぞれ構成情報評価テーブル１１７、障害情報評価テーブル１１８、稼動情報評価テーブル１１９に格納する。
　ステップ２３０１では、物理サーバ信頼性算出部１０８がサーバ管理テーブル１１０から現在物理サーバ１２３に搭載されているハードウェアの機種情報を取得する。ステップ２３０２では、ステップ２３０１で取得したサーバ管理テーブル１１０の情報から物理サーバ１２３を構成するコンポーネントについて、物理サーバ信頼性算出部１０８は、上述した各コンポーネントの識別子と評価１２０２の対応関係から評価１２０２を算出する。物理サーバ信頼性算出部１０８は算出した評価１２０２とコンポーネントで構成情報評価テーブル１１７を更新する。
　ステップ２３０３では、物理サーバ信頼性算出部１０８が、稼動履歴情報管理テーブル１１５を参照し、現在物理サーバ１２３に搭載されているコンポーネント毎に発生した障害の回数をカウントする。ステップ２３０４では、カウントした障害の回数からコンポーネント毎に上記（１）式を用いて障害情報評価を算出する。そして、物理サーバ信頼性算出部１０８は、コンポーネントと障害情報評価を対応付けて障害情報評価テーブル１１８を更新する。
　ステップ２３０５では、物理サーバ信頼性算出部１０８が、稼動履歴情報管理テーブル１１５を参照し、現在物理サーバ１２３に搭載されているコンポーネント毎に前回の障害発生または前回の起動からの連続稼働時間を算出する。また、物理サーバ１２３が停止している場合（ライフサイクル情報が「破棄」）には、前回の障害発生または前回の起動から直前の停止時までの期間を連続稼働時間として求める。
　ステップ２３０６では、物理サーバ信頼性算出部１０８が、物理サーバ１２３にサーバ仮想化部１２２が存在するか否かを判定する。サーバ仮想化部１２２が存在する場合は、仮想化環境信頼性算出部２３０８を呼び出す。サーバ仮想化部１２２が存在しない場合は、ステップ２３０７へ移る。
　ステップ２３０７では、物理サーバ信頼性算出部１０８が、稼動履歴情報管理テーブル１１５を参照し、ある物理サーバ１２３のシステム起動から、次回のシステム起動の間にＯＳによる致命的障害履歴があるか否かを判定する。ＯＳによる致命的な障害履歴がある場合は、ＯＳが要因のシステム障害としてコンポーネント毎にカウントし、ステップ２３１２で稼動情報評価テーブル１１９のＯＳの連続稼働時間に反映できるように保持する。
　一方、ＯＳによる致命的障害履歴が無い場合は、ステップ２３０９で、現在物理サーバ１２３に搭載されているハードウェア要因による物理サーバの致命的な障害履歴があるか否かを判定する。この判定は、例えば、ハードウェアの障害発生時に実行されるＯＳのマシンチェックハンドラなどの関数の実行の有無を稼動履歴情報に残しておくことにより、ハードウェア要因の致命的な障害を正確に把握することが可能である。ハードウェア要因による物理サーバの致命的な障害履歴が存在する場合は、ハードウェア要因のシステム障害としてコンポーネント毎にカウントし、ステップ２３１２ではハードウェアの稼動情報評価テーブル１１９の連続稼働時間に反映させる。
　システム障害の要因をカウントが終了したら、ステップ２３１２に移る。ステップ２３１２では、物理サーバ信頼性算出部１０８が上記算出したコンポーネント毎の連続稼動時間から、上記（２）式を用いて稼動情報評価を算出し、コンポーネントと稼動情報評価を対応付けて稼動情報評価テーブル１１９を更新する。
　上記処理により構成情報評価テーブル１１７、障害情報評価テーブル１１８、稼動情報評価テーブル１１９にはコンポーネント毎に信頼性を示す評価１２０２，１３０３及び１４０３が設定される。
　図２４は、仮想化環境信頼性算出部１０９で行われる処理のフローチャートを示す。この処理は、図２３のステップ２３０８で行われる処理である。仮想化環境信頼性算出部１０９では、サーバ仮想化部１２２を有する物理サーバ１２３のサーバ仮想化部１２２と仮想サーバ１２１の信頼性を算出する。
　ステップ２４０１では、仮想化環境信頼性算出部１０９が稼動履歴情報管理テーブル１１５を参照して、サーバ仮想化部１２２の稼動履歴を取得する。
　ステップ２４０２では、仮想化環境信頼性算出部１０９はサーバ仮想化部１２２が要因となる障害発生と、物理サーバ１２３のハードウェアが要因となる障害発生をコンポーネント毎に切り分けてカウントし、稼動情報評価テーブル１１９に結果を反映できるように保持する。
　ステップ２４０３では、仮想化環境信頼性算出部１０９が稼動履歴情報管理テーブル１１５を参照して、ひとつの仮想サーバ１２１を選択して稼動履歴を取得する。ステップ２４０４では、仮想化環境信頼性算出部１０９は、仮想サーバ１２１が要因となる障害発生と、物理サーバ１２３のハードウェアが要因となる障害発生をコンポーネント毎に切り分けてカウントし、稼動情報評価テーブル１１９に結果を反映できるように保持する。
　ステップ２４０５では、仮想化環境信頼性算出部１０９が、上記ステップ２４０２、２４０４でカウントしたコンポーネント毎に障害情報評価テーブル１１８を更新する。
　ステップ２４０６では、仮想サーバ１２１及びサーバ仮想化部１２２の稼動履歴から評価結果を求めて稼動情報評価テーブル１１９に反映する。ステップ２４０７では、全仮想サーバ１２１の評価が完了したかを判定する。完了していない場合は、ステップ２４０３へ戻り次の仮想サーバ１２１の信頼性の指標を算出する。
　図２５は、図２４のステップ２４０４で行われる処理の詳細を示すサブルーチンである。ステップ２５０１で仮想化環境信頼性算出部１０９は、稼動履歴情報管理テーブル１１５を参照して、図２４のステップ２４０３で選択した仮想サーバ１２１について、前回の起動時から次の起動時までの間にハードウェアまたはサーバ仮想化部１２２が要因となった障害の有無を判定する。ハードウェアまたはサーバ仮想化部１２２が要因となった障害がある場合には、サブルーチンを終了して図２４のステップ２４０５へ進む。一方、ハードウェアまたはサーバ仮想化部１２２が要因となった障害が無い場合には、ステップ２５０２へ進む。
　ステップ２５０２では、現在着目している仮想サーバ１２１について、仮想化環境信頼性算出部１０９は、稼動履歴情報管理テーブル１１５を参照して、前回の起動時から次の起動時までの間に仮想サーバ１２１（ＯＳ３０２）が要因となる障害の有無を判定する。仮想サーバ１２１（ＯＳ３０２）が要因となる障害がない場合にはサブルーチンを終了して図２４のステップ２４０５に進み、当該障害がある場合には、ステップ２５０３へ進む。
　ステップ２５０３では、仮想サーバ１２１が要因となる障害の発生数をカウントしてサブルーチンを終了する。
　上記処理によりで仮想化環境信頼性算出部１０９は仮想サーバ１２１に発生した障害を、ソフトウェアの要因とハードウェアまたはサーバ仮想化部１２２の要因に区別する。そして、仮想化環境信頼性算出部１０９は、仮想サーバ１２１が起因となる障害の発生回数をカウントする。
　以上のように、本発明では、管理サーバ１０１が複数の物理サーバ１２３の構成情報と稼動情報及び障害情報をそれぞれ収集して、各物理サーバ１２３の構成情報と稼動情報及び障害情報からコンポーネント毎の信頼性の指標を数値化した算出する。そして、図１６に示した信頼性表示画面では物理サーバ１２３毎の信頼性を示す総合評価１６０５と、物理サーバ１２３への業務の割り当て状態１６０６を出力装置２０８に出力する。
　管理サーバ１０１の管理者が物理サーバ１２３に業務を割り当てる際に、信頼性表示画面を参照することで、管理者は、物理サーバ１２３の空きリソースだけではなく、各物理サーバ１２３の信頼性の指標に基づいて信頼性を考慮することが可能となる。
　また、管理サーバ１０１が提供する信頼性表示画面は、物理サーバ１２３の種別や構成情報、稼動するＯＳやサーバ仮想化部１２２の情報、過去の稼動情報を分析した結果に基づいて、物理サーバ１２３の信頼性を可視化することができる。管理者は信頼性表示画面を参照することで、物理サーバ１２３へ割り当てる業務のＳＬＡ（Ｓｅｒｖｉｃｅ　Ｌｅｖｅｌ　Ａｇｒｅｅｍｅｎｔ）に対応した信頼性を備えたサーバを容易に割り当てることが可能となる。
　また、管理サーバ１０１は、ライフサイクル情報が「破棄」となる条件を満たしたときには、物理サーバ１２３に情報取得部３３０を送信して、物理サーバ１２３を起動させてから情報取得部３３０により各情報を取得する。そして、管理サーバ１０１は、ライフサイクル情報が「破棄」となる条件を満たしていないときには、物理サーバ１２３に予め稼動させた情報取得部３３０により各情報を取得する。このようにライフサイクル情報を用いることで、管理者が物理サーバ１２３の運用状態を把握することなく、物理サーバ１２３の構成情報、障害情報及び稼動情報を自動的に取得することが可能となる。

　本発明は、複数の物理サーバと、物理サーバに業務を割り当てる管理サーバを備えた計算機システム、管理サーバ及び管理サーバのプログラムに適用することができる。

Claims

　ネットワークを介してサーバに接続された管理サーバを有する計算機システムにおいて、
　前記管理サーバは、
　前記サーバの構成情報を取得する構成情報取得部と、
　前記サーバの障害情報を取得する障害情報取得部と、
　前記サーバの稼動情報を取得する稼動情報取得部と、
　前記取得した構成情報と、障害情報及び稼動情報から前記サーバの信頼性の指標を演算する信頼性評価部と、を備え、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するコンポーネントを抽出し、前記障害情報から前記コンポーネント毎の障害情報を抽出し、前記稼動情報から前記コンポーネント毎の連続稼動時間を算出し、前記コンポーネント毎の障害情報と前記連続稼動時間から前記サーバのコンポーネント毎の信頼性の指標を演算することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するハードウェアのコンポーネントを抽出し、前記障害情報から前記ハードウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ハードウェアのコンポーネント毎の連続稼動時間を演算し、前記ハードウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のハードウェアのコンポーネントと過去のハードウェアのコンポーネントの信頼性の指標を演算することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するソフトウェアのコンポーネントを抽出し、前記障害情報から前記ソフトウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ソフトウェアのコンポーネント毎の連続稼動時間を算出し、前記ソフトウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のソフトウェアのコンポーネントと過去のソフトウェアのコンポーネントの信頼の指標を算出することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記管理サーバは、
　前記サーバの運用状態を示すライフサイクル情報を取得するライフサイクル情報取得部をさらに備え、
　前記信頼性評価部は、
　前記ライフサイクル情報が所定の条件を満たしたときに、前記サーバに情報取得部を送信し、前記情報取得部から前記構成情報と前記障害情報及び前記稼動情報を取得することを特徴とする計算機システム。
　請求項４に記載の計算機システムであって、
　前記信頼性評価部は、
　前記ライフサイクル情報が所定の条件を満たしていないときには、予め前記サーバが備えた情報取得部から、前記構成情報と、前記障害情報及び前記稼動情報を取得することを特徴とする計算機システム。
　ネットワークを介してサーバに接続された管理サーバで前記サーバの信頼性を数値化するサーバの信頼性可視化方法において、
　前記管理サーバが、前記サーバの構成情報を取得する第１のステップと、
　前記管理サーバが、前記サーバの障害情報を取得する第２のステップと、
　前記管理サーバが、前記サーバの稼動情報を取得する第３のステップと、
　前記管理サーバが、前記取得した構成情報と、障害情報及び稼動情報から前記サーバの信頼性の指標を演算する第４のステップと、を含み、
　前記第４のステップは、
　前記構成情報から前記サーバを構成するコンポーネントを抽出し、前記障害情報から前記コンポーネント毎の障害情報を抽出し、前記稼動情報から前記コンポーネント毎の連続稼動時間を算出し、前記コンポーネント毎の障害情報と前記連続稼動時間から前記サーバのコンポーネント毎の信頼性の指標を演算することを特徴とするサーバの信頼性可視化方法。
　請求項６に記載のサーバのサーバの信頼性可視化方法であって、
　前記第４のステップは、
　前記構成情報から前記サーバを構成するハードウェアのコンポーネントを抽出し、前記障害情報から前記ハードウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ハードウェアのコンポーネント毎の連続稼動時間を演算し、前記ハードウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のハードウェアのコンポーネントと過去のハードウェアのコンポーネントの信頼性の指標を演算することを特徴とするサーバのサーバの信頼性可視化方法。
　請求項６に記載のサーバの信頼性可視化方法であって、
　前記第４のステップは、
　前記構成情報から前記サーバを構成するソフトウェアのコンポーネントを抽出し、前記障害情報から前記ソフトウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ソフトウェアのコンポーネント毎の連続稼動時間を算出し、前記ソフトウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のソフトウェアのコンポーネントと過去のソフトウェアのコンポーネントの信頼性の指標を算出することを特徴とするサーバの信頼性可視化方法。
　請求項６に記載のサーバの信頼性可視化方法であって、
　前記管理サーバが、前記サーバの運用状態を示すライフサイクル情報を取得するステップをさらに含み、
　前記第４のステップは、
　前記ライフサイクル情報が所定の条件を満たしたときに、前記サーバに情報取得部を送信し、前記情報取得部から前記構成情報と前記障害情報及び前記稼動情報を取得することを特徴とするサーバの信頼性可視化方法。
　請求項９に記載のサーバの信頼性可視化方法であって、
　前記第４のステップは、
　前記ライフサイクル情報が所定の条件を満たしていないときには、予め前記サーバが備えた情報取得部から、前記構成情報と、前記障害情報及び前記稼動情報を取得することを特徴とするサーバの信頼性可視化方法。
　ネットワークを介してサーバに接続された管理サーバにおいて、
　前記管理サーバは、
　前記サーバの構成情報を取得する構成情報取得部と、
　前記サーバの障害情報を取得する障害情報取得部と、
　前記サーバの稼動情報を取得する稼動情報取得部と、
　前記取得した構成情報と、障害情報及び稼動情報から前記サーバの信頼性の指標を演算する信頼性評価部と、を備え、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するコンポーネントを抽出し、前記障害情報から前記コンポーネント毎の障害情報を抽出し、前記稼動情報から前記コンポーネント毎の連続稼動時間を算出し、前記コンポーネント毎の障害情報と前記連続稼動時間から前記サーバのコンポーネント毎の信頼性の指標を演算することを特徴とする管理サーバ。
　請求項１１に記載の管理サーバであって、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するハードウェアのコンポーネントを抽出し、前記障害情報から前記ハードウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ハードウェアのコンポーネント毎の連続稼動時間を演算し、前記ハードウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のハードウェアのコンポーネントと過去のハードウェアのコンポーネントの信頼性の指標を演算することを特徴とする管理サーバ。
　請求項１１に記載の管理サーバであって、
　前記信頼性評価部は、
　前記構成情報から前記サーバを構成するソフトウェアのコンポーネントを抽出し、前記障害情報から前記ソフトウェアのコンポーネント毎の障害情報を抽出し、前記稼動情報から前記ソフトウェアのコンポーネント毎の連続稼動時間を算出し、前記ソフトウェアのコンポーネント毎の障害情報と前記連続稼動時間から前記サーバの現在のソフトウェアのコンポーネントと過去のソフトウェアのコンポーネントの信頼性の指標を算出することを特徴とする管理サーバ。
　請求項１１に記載の管理サーバであって、
　前記管理サーバは、
　前記サーバの運用状態を示すライフサイクル情報を取得するライフサイクル情報取得部をさらに備え、
　前記信頼性評価部は、
　前記ライフサイクル情報が所定の条件を満たしたときに、前記サーバに情報取得部を送信し、前記情報取得部から前記構成情報と前記障害情報及び前記稼動情報を取得することを特徴とする管理サーバ。
　請求項１４に記載の管理サーバであって、
　前記信頼性評価部は、
　前記ライフサイクル情報が所定の条件を満たしていないときには、予め前記サーバが備えた情報取得部から、前記構成情報と、前記障害情報及び前記稼動情報を取得することを特徴とする管理サーバ。