JP2010152704A - 計算機システムの運用管理システム及び管理方法 - Google Patents

計算機システムの運用管理システム及び管理方法 Download PDF

Info

Publication number
JP2010152704A
JP2010152704A JP2008330885A JP2008330885A JP2010152704A JP 2010152704 A JP2010152704 A JP 2010152704A JP 2008330885 A JP2008330885 A JP 2008330885A JP 2008330885 A JP2008330885 A JP 2008330885A JP 2010152704 A JP2010152704 A JP 2010152704A
Authority
JP
Japan
Prior art keywords
server
disk image
information
managed
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008330885A
Other languages
English (en)
Inventor
聡一 ▲高▼重
Soichi Takashige
Keisuke Hatasaki
恵介 畑▲崎▼
Yoshifumi Takamoto
良史 高本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008330885A priority Critical patent/JP2010152704A/ja
Priority to US12/535,724 priority patent/US20100169470A1/en
Publication of JP2010152704A publication Critical patent/JP2010152704A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/60Software deployment
    • G06F8/61Installation
    • G06F8/63Image based installation; Cloning; Build to order

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】サーバでのOSディスクイメージの動作を事前に確認する。
【解決手段】管理対象サーバと、管理対象サーバで動作するOSディスクイメージとを備える計算機システムのOSディスクイメージと管理対象サーバとの対応付けを管理する管理サーバにおける運用管理方法であって、第1の管理対象サーバ上のOSディスクイメージが認識するI/Oデバイス認識情報を収集し、第2の管理対象サーバのI/Oデバイスの構成を示す物理デバイス構成情報を収集し、I/Oデバイス認識情報と物理デバイス構成情報とに基づいて、第2の管理対象サーバにOSディスクイメージをロードし、実行した時の動作可否を判定する。
【選択図】図1

Description

本発明は、複数のサーバ計算機で構成される計算機システムの運用管理システム及び管理方法に関する。
本発明は、1つ以上の計算機(以下、サーバと呼称)で構成され、企業などの業務を実行する計算機システムの運用管理に関する。
計算機のストレージ技術、ストレージデータ管理技術の進展により、計算機の中で計算の実行主体となるCentral Processing Unit(CPU)、メモリ、IOデバイスなどのハードウェアと、記憶装置に格納されるOperating System(OS)、業務アプリケーションなどのソフトウェア (以下、OSディスクイメージと呼ぶ。ストレージ装置から主記憶装置へローディングされると、各種のセ一定なしで実行可能なソフトウェア)との対応付けを自由に変更できることが可能になった。
たとえば、特許文献1では、Storage Area Network(SAN)ストレージ装置を使用する構成において、SANストレージ機器上にLogical Unit(LU)を作成し、そのLUにあらかじめOSを格納しておき、SANストレージ装置もしくはSANスイッチの制御プログラムによって、論理的にLUにアクセスできるサーバをSANに接続された特定のサーバに制限することによりサーバとOSを排他的に対応付けられる。別の例として、特許文献2においては、OSディスクイメージを管理サーバに格納しておき、そのOSディスクイメージを実行すべきサーバの主記憶装置にコピー(リストア)することにより、サーバと対応付けるデプロイメントという方法がある。
サーバに障害が発生したときに、障害が発生したサーバのOSディスクイメージを予備サーバにローディングして実行して、迅速に業務を継続する運用や、サーバが実行するOSディスクイメージを入れ替え、サーバの用途を時間帯によって切り替えることにより、複数の業務でサーバのハードウェアを共有し、ハードウェア費用を削減するような運用を容易に実現することができ、注目される技術となっている。
特開2007-14013 US2005/0216911
OSは、サーバが有するI/Oデバイスをそれぞれ固有のデバイスドライバプログラム(以下、デバイスドライバ)を用いて制御する。デバイスドライバはNetwork Interface Card(NIC)、Host Bus Adaptor(HBA)などのI/Oデバイスごとに専用のプログラムである。同じI/Oデバイスであっても、I/Oデバイスごとの識別子などの情報を異にする。I/Oデバイスの識別子などの情報はOSが設定する設定情報である。 OSディスクイメージのデプロイメント、あるいは新たなOSディスクイメージを格納したLUへ接続を変更するといった、サーバとOSディスクイメージの対応付けを変更する運用においては、サーバとOSディスクイメージの対応付けを変更したときに、対応付けたサーバのI/Oデバイス構成に適合するデバイスドライバをOSが有し、適切に設定情報が設定されていないと、OSは正常に動作しない。
I/Oデバイスの設定情報には、I/Oデバイスごとに設定する論理的な情報、および、サーバに接続するI/Oデバイスの物理的な位置情報や物理的な固有情報に基づいて設定される物理的な情報がある。たとえば、NICには、論理的な情報としてIPアドレスが設定されるが、そのIPアドレスは個々のNIC固有のMACアドレスに対応付けられ、複数の同種のNICがサーバに接続されていても、各々が異なるNICとしてOSによって認識される。このようなデバイスドライバへの設定情報が、I/Oデバイスに適合していないとOSは正常動作しない。逆に言うと、デバイスドライバおよびその設定情報を有するOSディスクイメージにI/Oデバイスの構成が合っていないと、物理的に冗長なI/Oデバイスの構成であっても良いがOSディスクイメージが必要とするI/Oデバイスの構成を含んでいないと、OSは正常に動作しない。
本発明は次のような構成の運用管理システム及び管理方法である。管理対象サーバと、管理対象サーバで動作するOSディスクイメージとを備える計算機システムのOSディスクイメージと管理対象サーバとの対応付けを管理する管理サーバにおける運用管理方法であって、第1の管理対象サーバ上のOSディスクイメージが認識するI/Oデバイス認識情報を収集し、第2の管理対象サーバのI/Oデバイスの構成を示す物理デバイス構成情報を収集し、I/Oデバイス認識情報と物理デバイス構成情報とに基づいて、第2の管理対象サーバにOSディスクイメージをロードし、実行した時の動作可否を判定する。
本発明の他の態様は次のような構成である。OSディスクイメージをロードし、実行するサーバ及びOSディスクイメージをサーバに対応付けて管理する管理サーバによる運用管理方法であって、管理サーバは、OSディスクイメージが使用するI/Oデバイスに関する第1の情報を格納するI/Oデバイス認識テーブル、およびサーバが備えるI/Oデバイスに関する第2の情報を格納するI/Oデバイス構成テーブルを備え、I/Oデバイス認識テーブルに格納された第1の情報が、I/Oデバイス構成テーブルに格納された第2の情報に包含されるか否かを判定し、判定の結果として包含されるとき、そのOSディスクイメージをサーバに対応付ける。
本発明のさらに他の態様は、管理サーバは、I/Oデバイス認識テーブルに格納された第1の情報の中で、I/Oデバイス構成テーブルに格納された第2の情報に包含されない情報があるとき、包含されない情報を変更してもOSディスクイメージをサーバで実行可能である変更可能範囲内で、包含されない情報を変更し、変更した情報を含む第1の情報が、I/Oデバイス構成テーブルに格納された第2の情報に包含されるとき、OSディスクイメージをサーバに対応付ける。
本発明によれば、OSディスクイメージをサーバに対応付けるときに、そのOSディスクイメージがそのサーバで動作するかを事前に確認できる。
以下、本発明の実施形態を、実施例を用いて説明する。
本実施例の計算機システム構成を図1に示す。管理対象サーバ101〜103(以下、サーバ101)は、管理サーバ130の管理対象のサーバである。本実施例のシステムでは1台以上のサーバがある。管理サーバ130の各処理部131〜136に関しては、後述する。OSディスクイメージ111は、管理サーバ130およびサーバ101からアクセスできるストレージ装置などの外部記憶装置に格納されているプログラム(ファイル)であり、その詳細は後述する。デバイス認識情報テーブル120は、管理サーバ130によって使用されるテーブルであり、OSディスクイメージ111の各々に対応して設けてある。
サーバ101は、図2に示すような構成の計算機である。サーバ(計算機)101は、プログラムを実行するCPU201、プログラムおよびデータを保持するメモリ204を備え、CPU201とメモリ204は、メモリ204へのデータアクセス通信路であるシステムバス203によって接続されている。また、システムバス203には、PCI(Peripheral Component Interconnect)などに代表されるIOブリッジを介してSCSI/FC(Small Computer System Interface・/ Fiber Channel)207、NIC208、入出力装置インターフェース209などの装置(インターフェース)が接続されている。OS、アプリケーションなどのプログラムは外部記憶装置211からメモリ204に読み込まれ、CPU201によって実行される。
各管理対象サーバ101〜103のそれぞれでは、個別の業務が稼働している。業務に関するアプリケーションプログラム、および、OSなどの基本ソフトウェアはOSディスクイメージ111に含まれる。OSディスクイメージ111は外部記憶装置211などに格納されているプログラムとデータの総称を指す。
外部記憶装置211の例としては、SANなどで接続された外部ストレージ装置上のLUなどがある。本実施例では、OSディスクイメージ111の構成例として、LU上に配置されたディスク内容を用いて説明する。しかしながら、OSディスクイメージについてはLU上のイメージに限定されることはなく、内蔵ディスク上の内容、もしくは近年の計算機仮想化などで用いられているように、他のOSのファイルシステム上に仮想的に構築された単一の巨大なファイルなどを使用しても構わない。
図3に、OSディスクイメージの構成例を示す。OSディスクイメージ111は、デバイスドライバ503を含むOSカーネルプログラム502、デバイスドライバ設定情報505を含むOSカーネルデータ504、アプリケーションプログラム506およびアプリケーションデータ507を含んでいる。OSディスクイメージをサーバ101にローディングし、実行する手順は次のようになる。サーバ101のメモリ204には、予めブートローダプログラムが格納されている。ブートローダプログラムは、サーバ101への電源投入に伴って動作する、ファームウエアとして用意されるイニシャルローダプログラムによってメモリ204に格納される。管理サーバ130からブートローダプログラムへのロードすべきOSディスクイメージの指示(OSディスクイメージを格納しているLUやOSディスクイメージの識別子などのパラメータを伴った指示)に応答して、OSディスクイメージをメモリ204にロードする。ローディングが完了すると、ブートローダプログラムはOSカーネルプログラム502を起動する。OSカーネルプログラム502がアプリケーションプログラム506を実行し、業務が開始される。アプリケーションプログラム506を実行に伴い、入出力コマンドや送受信コマンドが発行され、OSカーネルプログラム502は、デバイスドライバ503を用いて、これらのコマンドを実行する。デバイスドライバプログラム503はデバイスドライバ設定情報505に基づいて動作するので、コマンドに対応したデバイスドライバ503又はI/Oデバイスが存在しない場合や、存在したとしてもデバイスドライバ設定情報505が、サーバ101に接続するI/Oデバイスに適合していない場合、サーバ101は正常に動作しない。サーバ101は正常に動作しないことをOSが正常に動作しないといっても良い。
各OSディスクイメージには、管理サーバ130によって、それぞれデバイス認識情報テーブル120が対応付けられて管理される。デバイス認識情報テーブル120には、対応付けられているOSディスクイメージ111に格納されたOSが、過去に認識したI/Oデバイスおよびそのデバイスドライバの設定情報が格納されている。デバイス認識情報テーブル120の詳細については後述する。
図4に、管理サーバ130の構成例を示す。管理サーバ130は、サーバ物理構成取得部131、デバイス認識情報テーブル管理部132、サーバ物理構成調査部133、OS動作推定部134、OS動作判定部135、及びユーザインターフェース136の各処理部を有する。また、管理サーバ130は、デバイス認識情報テーブル120、サーバ割り当て状態管理テーブル301、調査用OSイメージ302、OSディスクイメージ―デバイス認識テーブル対応付けテーブル303、及び動作判定ルール304を記憶している。
サーバ物理構成取得部131は、サーバ101から送信されるデバイス認識情報を受信して、デバイス認識情報テーブル120の内容との差分情報の抽出を行なう。デバイス認識情報テーブル管理部132は、サーバ物理構成取得部131が抽出した差分情報で、OSディスクイメージ111と関連付けてあるデバイス認識情報テーブル120の内容を更新する。
サーバ物理構成調査部133は、サーバ101の物理デバイス構成を取得する。
OS動作推定部134は、デバイス認識情報テーブル管理部132によって格納されたデバイス認識情報とサーバ物理構成調査部133によって取得された物理デバイス構成情報とを基に、OSの挙動を推定する。
OS動作判定部135は、OS動作推定部134の推定結果を基にOSが正常に稼働するかを判定する。
サーバ物理構成取得部131とサーバ−OSディスクイメージ対応付けプログラムとの関連を図5に示す。サーバ物理構成取得部131は、外部記憶装置211内にあるサーバ−OSディスクイメージ対応付けプログラム401と連携して動作する。サーバ物理構成取得部131はサーバ割り当て状態管理テーブル301を持つ。
サーバ割り当て状態管理テーブル301の一例を図6に示す。サーバ割り当て状態管理テーブル301は、サーバ識別子601、OSディスクイメージ管理用サーバ識別子602、および割り当て状態603を対応付けて格納する。
サーバ識別子601は、管理サーバ130が管理するシステム中の管理対象サーバ101を一意に特定するための識別子である。たとえば、サーバがブレード型のシステムである場合、サーバはサーバの属するシャーシ(エンクロージャ)を一意に識別子との組み合わせで一意に特定される。別の例としては、管理対象サーバが1つ以上のラック上に搭載されているシステムにおいては、サーバはラックを一意に識別するID(ラック番号)とラック上においてサーバが搭載される高さの位置情報(ラック内ID)によって一意に特定することが出来る。
OSディスクイメージ管理用サーバ識別子602は、管理サーバ130が管理するシステム内で一意に管理対象サーバを特定するための識別子である。サーバ識別子601と同一でも良い。OSディスクイメージの格納場所としてSANストレージ装置のLUを用いる場合のOSディスクイメージ管理用サーバ識別子602の例としては、サーバが所有するHost Bus Adaptor(HBA)のWWNなどがある。
サーバ割り当て状態603はサーバの稼働状態を示す。管理対象サーバ101があるOSディスクイメージを用いた業務を実行中であれば「割り当てあり」、OSディスクイメージが割り当てられていない(管理対象サーバ101は業務を実行していない)場合であれば「割り当てなし」を示す。
サーバ−OSディスクイメージ対応付けプログラム401は、サーバ-OSディスクイメージ対応付けテーブル411を持つ。サーバ-OSディスクイメージ対応付けテーブル411の一例を図7に示す。サーバ-OSディスクイメージ対応付けテーブル411はOSディスクイメージ管理用サーバ識別子701およびOSディスクイメージ識別子702の欄で構成される。OSディスクイメージ管理用サーバ識別子701はサーバ割り当て状態管理テーブル301中のOSディスクイメージ管理用サーバ識別子602と同一の内容である。サーバ−OSディスクイメージ対応付けプログラム401は、システム内の管理対象サーバ101を、OSディスクイメージ管理用サーバ識別子701を用いて管理する。OSディスクイメージ識別子702はシステム内のOSディスクイメージを一意に特定するIDである。本実施例では外部SANストレージ装置上のLUをOSディスクイメージの格納場所としているため、たとえば、外部SANストレージ装置を一意に識別する識別子と、外部SANストレージ装置内でLUを一意に識別するための識別子を組み合わせる。具体例としてはSANストレージ装置STORAGE1内のLU番号1番のLUを表す場合には/STORAGE1/LU001などとなる。
デバイス認識情報テーブル管理部132は、OSディスクイメージ-デバイス認識情報対応付けテーブル303、および、個々のOSディスクイメージに1:1に対応するデバイス認識情報テーブル120を保持する。
OSディスクイメージ-デバイス認識情報対応付けテーブル303は、OSディスクイメージの識別子と、対応するデバイス認識情報テーブル120との対応付けを管理するテーブルである。OSディスクイメージ-デバイス認識情報対応付けテーブル303の構成例を図8に示す。OSディスクイメージ-デバイス認識情報対応付けテーブル303はOSディスクイメージ識別子801と、デバイス認識テーブル識別子802の組で管理される。
デバイス認識情報テーブル120は、OSデバイス認識情報送信部140から送信されるデバイス認識情報を格納し、更新するテーブルである。管理対象サーバ101のデバイスとしてPCIデバイスを例にとり説明する。
デバイス認識情報テーブルの構成例を図9に示す。デバイス認識情報テーブル120はリビジョン番号901、バス番号902、デバイス番号903、ファンクション番号904、ベンダID905、デバイスID906、デバイス固有ID907、使用デバイスドライバ908、ドライバ対応設定909、動作実績910で構成される。
バス番号902、ファンクション番号903、ファンクション番号904はPCIデバイスを搭載する場所を示す情報である。また、ベンダID905、およびデバイスID906は該当するPCIデバイスを提供するベンダ、デバイスの識別子である。デバイス固有ID907は全世界で該当デバイスを一意に区別するための識別子である。NICやHBAなどのデバイスでは、MACアドレスやWorld Wide Name(WWN)など、デバイスを一意に特定するための識別子を持つ。OSはこの識別子に関連付けてドライバ情報を特定することがあるため、該当製品に関しては個別のIDを収集して保存する。使用デバイスドライバ908は該当デバイスを動作させるためにOSが使用するデバイスドライバプログラム505を特定するための識別子である。通常はデバイスドライバのファイル名とバージョン名などの組み合わせを用いる。
デバイスドライバ設定909は、該当デバイスドライバに関連付けられる設定情報である。本情報には、デバイスドライバのパラメータと、そのデバイスドライバに関連付けられる論理的な情報などを含む。論理的な情報の例としては、たとえばNICに対するIPアドレスの設定などが挙げられる。また、複数のNICを論理的に1つのデバイスとして扱う技術であるチーミング技術(一部ではBonding技術とも称する)の設定なども論理的な情報の例として扱う。
デバイスドライバ設定として収集する項目は、OSデバイス認識情報送信部の実装者がサポート対象とするOSに対するOS動作判定部135の判定に必要な項目を事前に決定しておき、OSデバイス認識情報送信部140が必要な情報を収集するようにプログラムをしておく必要がある。
動作実績910は、上記のデバイスドライバ909を用いて実際にアプリケーションを稼働させた実績があるか否かを示す情報である。たとえば「動作実績有り」「動作実績なし」などの実績に関する状態が記録される。動作実績910の具体的な更新例については後述する。
デバイス認識情報テーブル管理部132は、サーバ物理構成取得部131と同様に、サーバ−OSディスクイメージ対応付けプログラム401と連携してサーバと対応付けられているOSディスクイメージを特定し、サーバ物理構成取得部131が取得したデバイス認識情報を対応するデバイス認識情報テーブル120に格納する。
後の運用作業において、システムの運用管理者はサーバ増強、用途変更、スケールアウトによる負荷分散などの目的でサーバとOSディスクイメージの対応付けを変更する。そのときに、OS動作判定部135がデバイス認識情報テーブル120の内容と、後述するサーバ物理構成調査部133が取得したデバイス構成情報を参照してOS動作可否を判定し、動作が不可能なサーバでOSディスクイメージを実行することを抑止する。
サーバ物理構成調査部133は調査用OSを管理対象サーバ上101で実行し、物理サーバのデバイス構成情報を取得する処理を実行する。サーバ物理構成調査部133は調査用OSディスクイメージ302を管理サーバ130上に保管している。調査用OSは図3に示すOSディスクイメージであるが、デバイスの調査に必要な機能のみを実装しているため、不要なプログラムコードが必要なく、プログラムコードのサイズが小さい。調査用OSは物理デバイス構成情報送信メッセージをサーバ物理構成調査部133に送信する。物理デバイス構成情報送信メッセージの構成例を図11に示す。物理デバイス構成情報送信メッセージは、バス番号1101、デバイス番号1102、ファンクション番号1103、ベンダID1104、デバイスID1105、およびデバイス固有識別子1106で構成される。これらの情報はデバイス認識情報テーブル120が保持するバス番号902〜デバイス固有ID907と同一の種類の情報である。デバイス認識情報テーブル120はOSディスクイメージ111の動作時のデバイス構成を示すが、物理デバイス構成情報送信メッセージの情報は現状のデバイス構成を調査したものであり、サーバ物理構成取得部131においてOSディスクイメージのデバイス認識情報を取得したときの管理対象サーバ101と同一の管理対象サーバであっても、たとえばデバイスの部品交換などを行なったりした場合にはその構成が異なる。また、異なるサーバ識別子601で指定される管理対象サーバ101では、デバイス構成が異なる可能性が高い。これらの情報はPCI仕様などで定められた所定のフォーマットの情報を所定の手段で取得するものであり、詳細については省略する。
OS動作推定部134は、入力として図6のサーバ識別子601と、図7のOSディスクイメージ識別子702を受け取り、OSディスクイメージ識別子702と対応付けられたデバイス認識情報テーブル120と、サーバ物理構成調査部133がサーバ識別子601で示された管理対象サーバ101から取得した物理デバイス構成情報送信メッセージ(図11に図示)とを使用して、OSディスクイメージが管理対象サーバ101上で動作した場合に、各デバイスがどのように認識されるかを判定する。
OS動作推定部の実装形態の1つの例は、OSのデバイスドライバプログラムのロジックをシミュレートして、その動作結果としてのデバイス認識情報を返すプログラムである。OS動作推定部134は、システム提供者(通常は管理サーバのシステムの実装者)によってプログラムによって実装される。OSのデバイス認識動作の仕様が判明しているという前提では、本プログラムは対象とするOSの動作と同一のロジックをそのまま論理的に実行するモジュールであり実装可能である。
OS動作推定部134の別の実装形態の例としては、デバイス認識推定専用の仮想サーバを用意する方法がある。この方法では、仮想サーバ上のOSとしてOSディスクイメージ120と同一のものを用意し、仮想サーバのデバイス構成を前記デバイス構成情報に書き換え、さらに仮想サーバ上のOSのデバイス認識情報を前記デバイス認識情報テーブル120にある設定に書き換えて仮想サーバ上でOSを起動させる。起動後に仮想サーバのOS上でOSデバイス認識情報送信部のプログラムを実行させてデバイス認識情報を取得し、デバイス認識情報に含まれるデバイスドライバ設定909を結果として返す。
OS動作判定部135は入力として物理デバイス構成情報送信メッセージ(図11に図示)と、OS動作推定部134が各デバイスについて推定したデバイスドライバ設定909を受け取り、デバイスドライバ設定909の状態がOSの正常動作の状態であるか否かを判定する。OS動作判定部135はOS動作判定ルール304を参照してOSが正常動作するか否かの判定を行なう。OS動作判定ルール304はOSが正常に動作するために必要なOS設定909の条件を記したルールであり、事前に管理者もしくはシステム提供者によって作成される。OS動作判定ルール304の実装例の1つは、各デバイスドライバに対するOSのデバイスドライバ設定が事前に設定された状態であるかどうかを判断するプログラムである。たとえば、「NICに関連付けられたIPアドレスが所定の値になること」というチェック項目がOS動作判定ルール304の例である。
OS動作判定ルール304の別の実装例としては、状態判断をプログラムコードの代わりにデバイスドライバの正常動作時の設定をテーブルとして保持する方法がある。テーブルとして実装する場合には、OS動作判定ルール304で示されるOSデバイスドライバの設定と、OS動作推定部134が推定した結果のデバイスドライバ設定909が一致し、なおかつ事前に定義された実績確認手順1209を正常に終了した場合に正常に動作すると判断する。事前の定義は、システムの運用管理者などによって、管理システム構築時に作成されるなどの方法によって行なわれる。前記OS動作判定ルール304はデバイス認識情報テーブル120に対して個別に1つずつ存在する。すなわち、OSディスクイメージに対して一対一で対応付けられていることを意味する。OS動作判定ルール304をテーブルとして保持する場合の構成例を図12に示す。OS動作判定ルール304は、バス番号条件1201、デバイス番号条件1202、ファンクション番号1203、最低必要個数1204、最大許容回数1205、ベンダID条件1206、デバイスID条件1207、OS設定1208、および、実績確認手順1209で構成される。
バス番号条件1201〜デバイスID条件1207は、条件判定の対象となるデバイスを特定するための条件であり、デバイス認識情報テーブル120中のバス番号902〜デバイスID906のデータが前記バス番号条件1201〜デバイスID条件1207で示される条件に一致するものを判定の対象とする。PCIデバイスの位置を特定するバス番号条件1201〜ファンクション番号条件1203の例としては、特定の数値、任意の数値、あるグループの中での相対的な順番を指定できるようにする。相対的な順番の例としては「同一のベンダID、デバイスIDのデバイスの中でN番目に小さな値」といった条件がある。また、各条件には1つ以上の値が入ってもよく、その場合にはOS動作判定部135はいずれかの値に適合した場合に条件を満たすと判定する。
また、前記の条件を満たすデバイスの数は最低必要個数1204、最大許容個数1205の2つの数の間に収まる必要がある。
OS設定1208は、OSが動作する場合に満たすべきOS設定909の値の一覧である。たとえばOS設定1208の判定対象を、IPアドレスを例とすると「IPアドレスがXX.XX.XX.XXと等しい」「IPアドレスの設定がDHCP取得となる」「IPアドレスの設定なし」などの条件がある。判定対象となったデバイスのデバイスドライバ設定909がOS設定1208と適合した場合に、OSが動作すると判定される。
実績確認手順1209は、実アプリケーションが動作する実績を確認するための手順を示す情報である。実績確認手順はたとえば「YY.YY.YY.YYへのpingを実行する」「SQLプログラムにより、データベースYYへの接続を確認する」「アプリケーション疎通テストプログラムAを実行する」などの手順が書かれ、後述するOS動作実績フローで、指定された手順が実行される。各プログラムには正常終了の結果として返されるコードが事前に決定されており、その値が特定の値になったときに、正常に動作していると確認することが出来ることが保証されているものとする。
以下では、管理サーバ130の個々のプログラムの動作フローについて説明する。
まず、図10を用いてOSデバイス認識情報を収集する動作のフローについて説明する。OSデバイス認識情報は管理対象サーバ101上で動作するOSデバイス認識情報送信部140と、管理サーバ130上のサーバ物理構成取得部131が連動して行なう。
OSデバイス認識情報送信部140の動作フローの一例を、図10(a)を用いて説明する。まず、管理対象サーバ電源をオンにする(ステップ1001)。サーバ電源オンの動作は、任意の方法で行なってよい。たとえば、サーバの電源ボタンを人間が任意のタイミングで押すなどの方法でよい。その他の方法としては管理サーバのユーザインターフェースなどを用いて運用管理者が指定する方法、あるいは事前にスケジューリングしていた時刻に、管理対象サーバの電源を管理するプログラムが処理を自動的に開始するなどの方法によって開始される。ユーザインターフェースを用いて運用管理者が指定する方法の場合、前記サーバ識別子601を運用管理者に選択させるなどの方法によって指定させ、対応する管理対象サーバを起動する。運用管理者にサーバ識別子601を選択させる実装の例としては、管理サーバ130がサーバ割り当て状態管理テーブル301で保持するサーバ識別子601の一覧を管理サーバのユーザインターフェースに表示し、運用管理者に提示し、そのうちの1つを選択させる方法がある。
電源がオンになった管理対象サーバ101では、ブートローダプログラム501によってOSカーネルプログラム502が起動され、OSの機能を有効になる。OSの起動時にOSデバイス認識情報送信部プログラム508が起動する(ステップ1002)。
OSデバイス認識情報送信部プログラム508は、OS機能にアクセスするインターフェースを通してデバイスドライバ認識情報505を取得する(ステップ1003)。取得される情報は図9に示したデバイス認識情報テーブルに含まれる各項目を、OSが稼働する物理サーバが持つすべてのデバイスについて取得したものである。
デバイス認識情報送信部プログラム508は、デバイス認識情報送信先を特定する(ステップ1005)。デバイス認識情報送信先は管理サーバ130でなくてはならない。デバイス認識情報送信先を特定する例としては、事前に運用管理者が調査用OS上の設定ファイルなどに定義した管理サーバのアドレスを使用するなどの方法でよい。
デバイス認識情報メッセージを、前記ステップ1005で選択したデバイス認識情報送信先に送信する(ステップ1006)。情報の送信は、NICなどのインターフェースを通して管理サーバに前記デバイス認識情報メッセージを送信するなどの方法で実装可能である。
OSデバイス認識情報送信部プログラム508は、ステップ1006でメッセージを送信した相手から実績確認手順1209が送信されるのを待つ(ステップ1007) 。
OSデバイス認識情報送信部プログラム508は、管理サーバから実績確認手順1209を受信すると、実績確認手順1209に書かれた方法に従って実績手順を確認する(ステップ1008)。実績確認手順はたとえば個別の確認プログラム、もしくはプログラムの実行順序を記したバッチファイルなどの形式で記述されている。OSデバイス認識情報送信部プログラム508はプログラムを順次実行し、OSに返される終了コードなどの実行結果情報を収集する。
OSデバイス認識情報送信部プログラム508は、ステップ1005で選択されたデバイス情報送信先に対して、ステップ1008で取得した実績確認手順の実行結果を送信し、処理を終了する(ステップ1009)。
データを収集して格納する管理サーバ130側の動作フローの例を図10(b)に示す。
管理サーバ130はデバイス認識情報メッセージの受信待ちを行なう(ステップ1011)。受信待ちは通常のNICを使用したネットワークプログラムの受信処理と同様に実装すればよい。
サーバ物理構成取得部131がステップ1006で送信されたデバイス認識情報メッセージを受信する(ステップ1012)。
デバイス認識情報メッセージに含まれる情報から、図7で示されるサーバ識別子701を取得する(ステップ1013)。たとえば、OSディスクイメージがLUである例ではベンダID905、デバイスID906がHBA製品であることを示すものについてデバイス固有ID907を参照し、HBAのWWNを示す情報を抽出してサーバ識別子701として使用する。
サーバ物理構成取得部131は、デバイス認識情報テーブル管理部132にサーバ識別子701を渡し、サーバ識別子701で使用するOSデバイス認識情報テーブルの一覧を取得するように要請する。デバイス認識情報テーブル管理部132はパス管理プログラム401と連携して図7のサーバ-OSディスクイメージ対応付けテーブルを参照し、サーバ識別子に対応するOSディスクイメージ識別子702を取得し(ステップ1014)、次に図8に示すOSディスクイメージ-デバイス認識テーブル対応付けテーブルを参照してOSディスクイメージ識別子702に対応するデバイス認識情報テーブルを取得し、そのテーブル中のデータをサーバ物理構成取得部131に返す(ステップ1015)。
サーバ物理構成取得部131は、ステップ1012で取得したデバイス認識情報メッセージと、ステップ1015で取得したデバイス認識情報テーブルの各項目を比較して差分を抽出する(ステップ1016)。差分としては、(a)デバイス認識情報メッセージでは同一のバス番号902、デバイス番号903、ファンクション番号904、ベンダID905、デバイスID906が存在するデバイスであって、デバイス認識情報テーブルには対応するデバイスが存在しない項目、(b)デバイス認識情報メッセージ、デバイス認識情報テーブルの双方で存在するデバイスであって、対応する使用デバイスドライバ908もしくはデバイスドライバ設定909が異なる項目、の2種類の差分がある。抽出は、それぞれのデバイスのバス番号902〜デバイスドライバ設定909を比較して、上記(a)(b)に該当するか確認することによって実行できる。
ステップ1016において差分が発見された場合、差分情報をデバイス認識情報テーブルに更新する(ステップ1017)。(a)の更新は新規項目の追加、(b)の更新は既存項目の上書きとなる。
サーバ物理構成情報取得部131は、ステップ1015で取得したデバイス認識情報テーブルと対応付けられたOS動作判定ルール304を参照し、そのテーブル中に含まれるすべての実績確認手順1209を取得する(ステップ1018)。
サーバ物理構成情報取得部131は、ステップ1018で取得した実績確認手順1209のリストを、ステップ1012でデバイス認識情報メッセージを送信してきたOSデバイス認識情報送信部プログラム508に送信する(ステップ1019)。実行結果は、それぞれ実行したプログラムとその結果の組が確認できるように、たとえば2つの情報を組としたテーブルのような形式で送信する。
最後に、サーバ物理構成情報取得部131は、ステップ1019で送信した実績確認手順1209を、OSデバイス認識情報送信部が実行して結果を返信するのを待つ(ステップ1020)。結果を受信した場合、そのそれぞれの結果が正常終了を示しているかどうかを確認する。正常な戻り値であった場合には「動作実績有り」、不正な戻り値であった場合は「動作実績なし」を、それぞれ対応する動作実績910に書き込む(ステップ1021)。
図10の処理によって、OSのデバイス認識に関する情報と、稼働実績の情報が管理サーバ130に収集される。この情報は後に、OSディスクイメージ111と管理対象サーバ101の対応付けを変更する際に、OSが正常に動作するか否かを判定するための入力として用いられる。
次に、運用管理者がOSディスクイメージ111と管理対象サーバ101の対応付けを変更する場合に、変更先の管理対象サーバ101上でOSディスクイメージ111を用いて正常にOSが動作するか否か判定する動作フローについて、図13を用いて説明する。
管理サーバ130はサーバ識別子601の入力、および、OSディスクイメージ識別子702の入力を受け付ける(ステップ1301)。項目の入力方法の例としては、管理サーバのユーザインターフェースなどを用いて運用管理者が指定する方法が挙げられる。ユーザインターフェースを用いて管理者が指定する方法の場合、サーバ識別子601およびOSディスクイメージ識別子702は、管理サーバ130が保持するサーバ識別子601の一覧を管理サーバのユーザインターフェースに表示し、管理者に提示し、そのうちの1つを選択させる方法などによって選択させる方法などにより指定させることができる。
管理サーバ130はステップ1301で入力されたOSディスクイメージ識別子702を参照して、対応するデバイス認識情報テーブル120を取得する(ステップ1302)。取得方法はステップ1015の説明と同等の方法を用いればよい。
ステップ1302で対応するデバイス認識情報テーブル120が発見された場合、ステップ1304〜1310を実行する。対応するテーブルが発見されなかった場合、ステップ1311〜1312を実行する(ステップ1303)。
管理サーバ130はサーバ物理構成調査部133に、ステップ1301で取得したサーバ識別子601を渡して、サーバ物理デバイス構成情報を要求する。サーバ物理デバイス構成情報調査部133は図14に示す手順(物理サーバからのデバイス構成情報取得処理)を実行し、管理サーバにデバイス構成情報メッセージを返す(ステップ1304)。処理内容の具体例については後述する。
管理サーバ130は、OS動作推定部134に対して、ステップ1302で取得したデバイス認識情報テーブル120と、ステップ1304で取得したデバイス構成情報メッセージとを渡し、その入力情報のもとでOSがデバイスを認識した結果のデバイスドライバ認識情報テーブルを返すように要求する。OS動作推定部134は前述したエミュレーション処理などを実行し、結果としてOSのデバイス認識情報テーブルを返す(ステップ1305)。
管理サーバ130は、ステップ1305の結果として取得したデバイス認識情報テーブルをOS動作判定部135に渡し、サーバ識別子601で指定された管理対象サーバ101上で、OSディスクイメージ識別子702で指定されたOSが動作するか否かの判定を要求する。OS動作判定部135は図15に示す手順を実行し、OS動作判定結果を返す(ステップ1306)。
ステップ1306において判定結果が「OS動作実績有り」である場合はステップ1310を実行する。動作しないと判定された場合、ステップ1308を実行する(ステップ1307)。
OS設定による動作推定を行なうかどうかを確認する。確認方法の例としては、OS設定による動作推定を行なうか否かのフラグを事前に用意しておき、管理システム構築時に運用管理者に選択をさせておく方法、あるいは、ユーザインターフェースを通して「動作実績が確認できませんでした。OS設定による動作推定を行ないますか?(Y/N)」といった内容のダイアログを表示してOS設定による動作推定を行なうか否かを入力させる方法などがある。OS動作推定を行なうとの結果を得た場合はステップ1309から1310を、OS設定による動作推定を行なわないとの結果を得た場合はステップ1311、1312を実行する(ステップ1308)。
ステップ1306における判定結果が「OS設定のみ確認」であり、なおかつステップ1308においてOS設定による動作推定を行なうという結果を得た場合には、ステップ1310を実行する。いずれかの条件を満たさない場合はステップ1311、1312を実行する(ステップ1309)。
ステップ1306においてOS動作実績あり判定された場合、ステップ1309においてOS設定のみ確認と判定された場合、もしくは、後述するステップ1311においてOSディスクイメージ120と管理対象サーバ111の対応付けの変更を実行するように指示がされた場合に、実際にOSディスクイメージ120と管理対象サーバ111の対応付の変更を実施する(ステップ1310)。OSディスクイメージ120がSANストレージ機器上のLUとして実装されている場合、対応付けの変更は、パス管理プログラム401にサーバ-OSディスクイメージ対応付けテーブルを変更するように指示し、さらに実際にSANストレージ装置、SANのネットワーク設定などを設定してLUとサーバ識別子701であるWWNとの対応付けを変更する操作となる。
OSが動作するという判定結果を得られなかった場合、管理サーバ130はOSが動作するという判定結果が得られなかったことを対応付け変更操作の指示者(運用管理者など)に通知し、操作を継続して続行するか確認を求める(ステップ1311)。通知方法と確認方法の例としてはユーザインターフェースに「指定されたサーバには動作実績がありません。対応付け変更を続行しますか(Y/N)」といった内容のダイアログを表示して方法などがある。管理者は「Yes」「No」といった入力を回答として入力する。
ステップ1311において入力された結果が対応付け変更操作を継続する指示であった場合はステップ1310を実行する。それ以外であった場合は処理を終了する(ステップ1312)。
以上の動作フローにより、たとえば管理者がOSディスクイメージ120と管理対象サーバ101の対応付けを変更しようとした場合に、管理者が指定したOSディスクイメージ120と管理対象サーバ101の組み合わせにおいてOSがデバイス認識、論理的設定の割り当て、業務レベルでの動作の各レベルで動作しない状況になることを事前に察知して管理者に通知することができ、管理者の操作ミス、あるいは、物理サーバの部品交換などにより潜在的に発生しうる本来は意図していないOSの誤動作が起こることを未然に防ぐことが出来る。
図13中のステップ1304で参照された、デバイス構成情報調査フローの一例について、図14を用いて説明する。
デバイス構成情報調査フローは管理サーバ130と管理対象サーバ101が相互に動作することによって実行される。
管理サーバは管理対象サーバ101に調査用OSディスクイメージ302を使用してシステムを起動するように指示する(ステップ1401)。管理対象サーバ101は管理サーバの指示を受けて電源をオンにして(ステップ1411)、管理サーバ130から調査用OSディスクイメージ302を取得し、実行する(ステップ1412)。このステップ1401、1411、1412の実現方法の例としてはWake−on−LanとPXEブートとを組み合わせて行なう方法がある。管理サーバ130と管理対象サーバ101はNICを通して通信する。管理対象サーバ101はWake−on−Lanに対応したNICを持ち、管理サーバ130から通知される特定のパケットを受けて電源をオンにする。管理サーバ130はPXEブート対応のサーバ機能を持ち、調査用OSディスクイメージを管理対象サーバに配信する。管理対象サーバ101はPXEブート対応のクライアント機能を持ち、調査用OSディスクイメージを取得・実行する。
調査用OSは起動後に図11に示されるような管理対象サーバ101のデバイス構成を取得する(ステップ1413)。たとえば、PCIデバイスにおいては、起動時にPCIバス番号1101〜デバイスID1105がメモリの所定の位置に書き込まれるため、その内容を読み取る動作などにより実装可能である。
調査用OSはステップ1413で取得したデバイス構成情報を図11の物理デバイス構成情報送信メッセージの形式に整形し、管理サーバ130に送信する(ステップ1414)。その後電源をオフにする(ステップ1415)。
管理サーバ130は、ステップ1414において送信された物理デバイス構成情報送信メッセージを取得して、処理を要求したコンポーネントに引き渡す(ステップ1403)。
最後に、図13中のステップ1306で参照された、OS動作判定実行フローの一例について、図15を用いて説明する。
OS動作判定部135は、他のコンポーネントから図11の物理デバイス構成情報送信メッセージと、OS動作推定部134がOSの動作を推定した結果のOSデバイス認識情報テーブル(図9に図示)を入力として受け取り、その2つを参照してOSが動作するか否かを判定する。以下、OSデバイス認識情報テーブルをリストXと呼ぶ(ステップ1501)。
以降の処理において、OSの動作判定をした結果を格納する保存領域を単純に判定結果と呼ぶ。判定結果はメモリ中などに確保された保存領域であれば良い。判定結果の初期値は「動作可」であるとする(ステップ1502)。
OS動作判定部135は、図12のOS動作判定ルールの個々のルールに対してステップ1503〜1506を繰り返し実行する(ステップ1503)。以下では、本ステップで選択した項目を条件Aと呼ぶ。
OS動作判定部135はリストXに含まれるデバイスの中から、図12の説明において前述した規則に従って条件Aに適合するものを選択する(ステップ1504)。以下では、本ステップの結果選択されたデバイスの一覧をリストYと呼ぶ。選択されたデバイス数が図12中の最低必要個数1204、最大許容個数1205で示される範囲内に収まる場合、ステップ1505〜ステップ1507を実行する(ステップ1505)。前記の範囲内に収まらない場合はステップ1510を実行する。
ステップ1504で選択したそれぞれのデバイスに対応するデバイスドライバ情報(以下、デバイスドライバ情報Bと呼称)に対してステップ1507〜ステップ1509を実行する(ステップ1506)。
デバイスドライバ情報Bに含まれる動作実績の状態が「動作実績有り」であるか確認する。「動作実績有り」であればリストY中の次のデバイスドライバ情報の処理に移る(ステップ1507)。
デバイスドライバ情報Bが条件Aに含まれるOS設定1208に適合するかどうかを確認する。確認方法は図12のOS設定1208の説明で示した方法で行なう。OS設定1208中には、IPアドレス、チーミングなど複数の項目がある場合がある。この場合は、それぞれの項目に対して個別に適合するか確認する(ステップ1508)。
結果として、適合しないことが判明した場合、ステップ1510を実行する。適合することが判明した場合、判定結果を「OS設定のみ確認」という状態に上書きする(ステップ1509)。
もし、動作実績がなく、なおかつOS設定条件Bは条件AのOS設定と等しくない場合、判定結果を「動作不可」の状態に上書きし、ステップ1511を実行する(ステップ1510)。
前記のいずれかの処理において最後に上書きされた判定結果の値を、OS動作判定部の判定結果として他のコンポーネントに返す(ステップ1511)。
OSディスクイメージ111と管理対象サーバ101の対応付けを変更する場合、管理者が目的とすることは、業務アプリケーションを稼働させるハードウェアをシステム中に存在する複数の候補から選択することであることが多い。業務アプリケーションは特定のOSディスクイメージ111に含まれるため、選択肢は必然的に1つに絞られることが一般的である。その結果、運用管理者がOSディスクイメージ111と管理対象サーバ101の対応付けを変更する場合に行なう作業は(a)OSディスクイメージ111を選択する、(b)OSディスクイメージが正常に動作する管理対象サーバ101を探し出す、の2つの手順を(a)(b)の順で実行することになる。
実施例1では、運用管理者などが指定したサーバと、管理者などが指定したOSディスクイメージの組み合わせを指定された場合においてOSが正常に動作するか否かを判定した。実施例1の方法では、システム上の複数の管理対象サーバからOSディスクイメージが正常に動作するサーバを特定するためには、運用管理者が一台ずつサーバのOS動作判定を確認しなければならない。
実施例2では、運用管理者の確認作業の負荷を軽減するために、実績が確認できたサーバのみを管理者に提示して、その中から管理者などが適切なサーバを選択する操作を行なうようにする。
実施例2では、実施例1と同一のシステム構成であることを前提とする。ただし、実施例1では管理者などの、サーバとOSディスクイメージの対応付け操作者は図13の動作フローによって、対応付け変更操作を実施したが、実施例2では図16に示すサーバとOSディスクイメージ組み合わせでの動作判定処理フローのように変更する。
まず、管理サーバ130は、ステップ1301と同様の方法を用いて、OSディスクイメージ識別子702を入力として受け取る(ステップ1601)。このとき、サーバ識別子601を入力として受け取る必要はない。
次に、サーバ割り当て状態管理テーブル301に含まれるそれぞれのサーバに対して、ステップ1603〜ステップ1606を実行する(ステップ1602)。以下では、前記の各サーバをサーバAと呼称する。また、以降の処理ではサーバ動作保証リスト、サーバ動作可能リストを使用するが、これらのリストは動作が確認されたサーバを記録しておくためのリスト形式のデータである。前記のリストは、ステップ1601を実行し、ステップ1602の繰り返し処理を行う前にクリアしておくものとする。前記のリストはメモリ中に保存すればよい。
サーバ割り当て状態管理テーブル301のサーバAに対応する割り当て済み状態603が「割り当て済み」であるかどうか確認する。「割り当て済み」ではない場合にはステップ1604からステップ1606を実行する(ステップ1603)。
サーバAのサーバ識別子601、および、前記ステップ1601で入力されたOSディスクイメージ識別子を用いて、図13のステップ1302〜ステップ1309を実行する(ステップ1604)。ただし、ステップ1307ではユーザインターフェースを用いて「動作不可」という表示して確認を求める処理に替わって、「動作不可」という判定結果を記録してステップ1605〜ステップ1606を実行する。
ステップ1604の実行結果が、「OSの動作実績有り」であった場合、サーバAをサーバ動作保証リストに追加する(ステップ1605)。
ステップ1604の実行結果が、「OSの動作可能」であった場合、サーバAをサーバ動作可能リストに追加する(ステップ1606)。
サーバ割り当て状態管理テーブル301中のすべてのサーバAに対して前記ステップ1602〜ステップ1606を実行した後に、管理サーバ130はユーザインターフェースなどを通して、動作保証リスト、動作可能リストに含まれるサーバの一覧を操作者に提示する(ステップ1607)。このとき、表示される各サーバが動作保証リスト、動作可能リストのいずれに含まれるかを区別できるようにする。たとえば、リスト中のサーバに、動作保証、動作可能のそれぞれにおいて異なるアイコンを付与して表示するようにするなどの方法がある。
操作者はステップ1607で表示されたサーバの中から1つのサーバを選択する(ステップ1608)
管理サーバ1609は図13のステップ1309と同様の処理により、管理対象サーバ101とOSディスクイメージ111の対応付けを変更する(ステップ1609)。
サーバ割り当て状態管理テーブルの、前記ステップ1608で選択されたサーバ識別子に対応するエントリの割り当て状態を「割り当て済み」に変更する(ステップ1610)。
上記の動作により、管理者はすべてのサーバについてOSディスクイメージ111の動作判定を試す必要がなく、動作が保証されたサーバの中から選択を行なうことができ、作業が効率化できる。また、動作実績が過去に保証されているか、論理的に動作可能であることが推定できるレベルで保証されているのであるかを比較することが容易であり、OSディスクイメージ111を対応付けるサーバを複数の候補から選択する場合に選択の判断を行なう作業に有用な支援効果をもたらす。
図17は、本実施例のシステム構成図である。管理サーバや管理対象のサーバは、実施例1のそれらと細部において異なるので、新たに符号を付けている。したがって、符号の異なりが必ずしも異なることを表していない。
管理サーバ1は、管理用ネットワーク3を介して、管理対象のサーバ2と接続している。管理対象のサーバ2として1台のサーバを図示しているが、複数台であっても良い。管理サーバ1及びサーバ2は、ストレージ装置のLU5にアクセスできるようにストレージエリアネットワーク(SAN)4に接続している。また、管理サーバ1及びサーバ2は、他のサーバと通信するために通信ネットワーク6に接続している。実際の通信においては、管理サーバ1の通信相手は管理対象のサーバ2であるが、サーバ2の通信相手は他の管理対象のサーバ2であっても良いし、管理対象外のサーバやサーバ2のサービスを受けるクライアントコンピュータであっても良い。
サーバ2は、SAN4に接続するためのI/Oデバイス7としてHBAを、通信ネットワーク6に接続するためのI/Oデバイス7としてNICをそれぞれ用意している。図17では、HBAとしてHBA1及びHBA2を示し、NICとしてNIC1、NIC2及びNIC3を示している。
実施例1で説明したOSディスクイメージがサーバ2にロードされている状態を図17は示している。OSディスクイメージには、前述のようにOS20、I/Oドライバ(I/Oデバイスドライバ)21及びアプリケーションプログラム25が含まれている。図17では、I/Oドライバ21はOS20に含まれるように図示し、各I/OドライバはI/Oデバイス7に対応している。NIC2は、サーバ2に用意されているが、現状のOSディスクイメージからは使用されていないことを図示している。HBA1及びHBA2に対応付けられているI/Oドライバ21は、いずれも「ドライバ1」である。これは、HBA1及びHBA2のいずれもが、ドライバ21の種別として同じ「ドライバ1」によって動作することを示している。しかしながら、前述の設定情報は、HBA1とHBA2では異なるので、設定情報を含めたI/Oデバイスドライバプログラムとして個々に用意しても良いし、設定情報を個々に用意してプログラムを共用しても良い。
図18は、管理サーバ1が有するI/Oデバイス構成テーブルを示す。I/Oデバイス構成テーブルは、サーバ2が有する各I/Oデバイス7のID11とI/Oデバイス種別12を対応付けて格納している。図18では、説明を簡略化して分かり易くするために代表的な項目としてID11とI/Oデバイス種別12を示しているが、図9に示したベンダIDなどのI/Oデバイス7のハードウエアとして固有な情報を含んでも良い。I/Oデバイス構成テーブルの内容は、サーバ2を構築(設置)する際の仕様として決定する内容であり、管理サーバ1のユーザインタフェースを介してデーブルを初期設定する。また、サーバ2の運用を開始した後にも仕様変更に伴い、I/Oデバイス7の構成を変更することがあるが、初期設定と同様に設定する。しかし、I/Oデバイス7の構成を変更しても、I/Oデバイス構成テーブルの設定を変更しない場合もあり、そのような場合に備えてI/Oデバイス7の構成を取得する処理を設ける。この処理については後述する。
図18は、図17のサーバ2が有するI/Oデバイス7の構成に対応している。図17のHBA1とHBA2は同じI/Oデバイス種別HBAであり、ID11がWWN1とWWN2である。NICは、I/Oデバイス種別12がNIC(A)とNIC(B)があり、NIC(A)のID11はMAC1であり、NIC(B)のID11はMAC2とMAC3であることを示している。
図19は、サーバ2において現状のOSディスクイメージが認識している(使用する)I/Oデバイス7に関する情報を管理するために、管理サーバ1に設けるI/Oデバイス認識テーブルを示す。図18のI/Oデバイス構成テーブルをサーバ2に対応させて設けるのに対して、図19のI/Oデバイス認識テーブルはOSディスクイメージに対応させて設ける。
I/Oデバイス認識テーブルは、I/O14、ドライバ種別15、I/Oデバイス種別16、I/OデバイスのID17及びI/Oデバイス7の接続先18の各欄を設けている。I/O14は、アプリケーションプログラム25が、I/Oデバイス7にアクセスする際に用いる論理的な名称又はI/Oデバイス7の識別子である。アプリケーションプログラム25からI/Oデバイス7にアクセスするコマンド(入出力コマンドや送受信コマンド)が発行されると、OS20は、対応するドライバ種別15のI/Oデバイスドライバプログラムを実行し、対応するI/Oデバイス種別16及びID17のI/Oデバイスを動作させ、接続先18に示される相手との間でコマンドに従った処理を実行する。以上のサーバ2における説明から分かるように、I/Oデバイス認識テーブルの内容はOSディスクイメージに設定されている内容である。したがって、OSディスクイメージを生成する際に、その仕様に従って、管理サーバ1のユーザインタフェースを介してI/Oデバイス認識デーブルを初期設定する。また、OSディスクイメージの運用を開始した後にも仕様変更に伴い、I/Oデバイス7の構成の変更やOSディスクイメージの仕様を変更することがあるが、初期設定と同様に設定する。しかし、I/Oデバイス7の構成を変更しても、I/Oデバイス認識テーブルはOSディスクイメージに対応して設けるので、必ずしもI/Oデバイス認識テーブルの設定を変更できるとは限らない。そのような場合に備えてI/Oデバイス認識テーブルの設定をI/Oデバイス7の構成に対応させる、対応させられない場合はそのOSディスクイメージのサーバ2における実行を不可とする処理を設ける。この処理については後述する。
図19のI/Oデバイス認識テーブルは、図17のサーバ2上のOSディスクイメージが使用するI/Oデバイス7の構成に対応している。具体的なテーブル内容に関しては、管理サーバ1がI/Oデバイス認識テーブルを用いる動作例の中で後述する。
図20は、図17のOSディスクイメージをロードして実行しようとする他のサーバ2、または図17のOSディスクイメージを実行していた、図17の構成から時間が経過したサーバ2を含むシステム構成である。図20示すI/Oデバイスの構成は、図17示すI/Oデバイスの構成から次の2点が変化している。HBA2のサーバ2における搭載場所(実装位置)の変化とNIC3が存在しない点である。このような変化に伴い、図17に示したアプリケーション25を含むOSディスクイメージをロードして実行しても、NIC3にアクセスするとエラーが発生し、HBA2にアクセスするとエラーが発生する可能性がある。
前述したように、管理サーバ1が有するI/Oデバイス構成テーブルが、図20示すI/Oデバイスの構成に対応していない場合がある。
そこで、I/Oデバイス構成取得プログラム22を含むOSディスクイメージをサーバ2にロードして実行する。このOSディスクイメージは図4に示した調査用OSイメージに相当し、管理サーバ1が管理対象としているサーバ2に搭載されるI/Oデバイスの種別に対応するI/Oデバイスドライバプログラムを有している。
図21に、I/Oデバイス構成取得プログラム22の処理フローチャートを示す。サーバ2に搭載されるI/Oデバイスを順次チェックする(S30)。未チェックのI/Oデバイスを選択する(S31)。選択したI/Oデバイスに適合するドライバ種別を見つけるために、I/Oデバイスドライバプログラムの動作を順次チェックする(S32)。未チェックのI/Oデバイスドライバプログラムを選択し、実行する(S33)。I/Oデバイスドライバプログラムの選択は、OS20が有するドライバ管理テーブルを用いる。
図22に、ドライバ管理テーブルを示す。ドライバ管理テーブルは、ドライバ種別40、ドライバ先頭アドレス41、設定情報先頭アドレス42、設定情報43を有する。ドライバ種別40、ドライバ先頭アドレス41、及び設定情報先頭アドレス42は、OSディスクイメージを生成する際に設定される。したがって、I/Oデバイスドライバプログラムの選択は、ドライバ管理テーブルのドライバ種別40のI/Oデバイスドライバプログラムを先頭から順次選択する。選択したI/Oデバイスドライバプログラムの、ドライバ先頭アドレス41にある先頭アドレス(開始アドレス)から実行する。実行開始に際して、I/Oデバイス構成取得プログラム22は、I/Oデバイスにファームウエアとして設定されているI/Oデバイスの設定情報を読み取るようにパラメータを引き渡す。I/OデバイスドライバプログラムがI/Oデバイスに適合していれば正常に設定情報を読み取れるが、不適合であるとI/Oデバイスからエラー応答が得られる又は応答が得られない(タイムアウトエラー)。正常に読み取られた設定情報は、設定情報先頭アドレス42からの設定情報エリアに格納される。設定情報エリアは、設定情報43に示すように、先頭から順次設定情報とその容量(バイト数)に区切られている。図22のドライバ1においては、設定情報先頭アドレス42のxxxx番地から設定情報が格納され、その中にWWNがmバイトで格納されることを示している。
図21に戻り、説明する。I/Oデバイスドライバプログラムからの応答がエラー応答の場合は、S32に戻り、新たにI/Oデバイスドライバプログラムを選択する。適合するI/Oデバイスドライバプログラムがない場合は、その旨をI/Oデバイスに対応付けて記憶する(S37)。I/Oデバイスドライバプログラムからの応答が正常応答の場合は、設定情報先頭アドレス42及び設定情報43を参照して、I/Oデバイス種別を取得し(S35)、I/OデバイスのIDを取得する。サーバ2に搭載されているすべてのI/Oデバイスのチェックが完了したならば、取得したI/Oデバイス種別及びI/OデバイスのIDを管理サーバ1に管理用ネットワーク3を介して送信する(S38)。S37において、適合するI/OデバイスドライバプログラムがないI/Oデバイスを記憶していれば、記憶してある内容も送信する。
一般にI/Oデバイスドライバプログラムのインターフェース仕様がI/Oデバイスの仕様として、I/Oデバイスのベンダから公開されるのでI/Oデバイスドライバプログラムを用いたI/Oデバイスの特定を説明したが、設定情報が格納されているファームウエア(ROM)のアドレスが公開されている場合は、I/Oデバイス構成取得プログラム22が直接的に設定情報を読み取っても良い。
サーバ2からI/Oデバイス種別及びI/OデバイスのIDを受信すると、管理サーバ1は図23に示すようにI/Oデバイス構成テーブルを更新する。図23には、図18に示すI/Oデバイス構成テーブルに加えて、Noの欄10、及び対応付けフラグ欄13を設けている。対応付けフラグ欄13に関しては後述する。図23は、図20のサーバ2に搭載されたI/Oデバイスの構成を示しているが、No1、No3及びNo4のI/Oデバイスは、図17の構成と同じであり、No2はI/OデバイスのIDが異なることを示している。また、図18に示したI/OデバイスのID11がMAC3のI/Oデバイスがないことも表している。
管理サーバ1は、図19に示したI/Oデバイス認識テーブル、すなわち実行しようとしているOSディスクイメージに対応したI/Oデバイス認識テーブルをワークエリアにコピーする。図24(a)にコピーしたI/Oデバイス認識テーブルを示す。コピーしたI/Oデバイス認識テーブルに、図24(b)に示すように変更通知フラグ欄19を加える。
管理サーバ1は、図23のI/Oデバイス構成テーブル及び図24のI/Oデバイス認識テーブルが準備できたなら、図25に示す処理を実行する。
図25は、サーバ2でのOSディスクイメージの動作判定処理のフローチャートである。I/Oデバイス認識テーブルのI/Oを順次選択し、チェックする(S50)。選択したI/OのI/Oデバイス種別16とID17とが一致するI/Oデバイスが、I/Oデバイス構成テーブルにあるかを判定する(S52)。一致しなければ、I/Oデバイス構成テーブルを順次チェックし(S54)、I/Oデバイス種別16に一致するものがI/Oデバイス構成テーブルにあるかをチェックする(S56)。個々では、I/Oデバイス種別16を代表させて説明しているが、I/Oデバイスの型式なども含めて、OSディスクイメージが使用しているI/Oデバイスに係る情報の変更可能範囲をチェックしている。I/Oデバイス種別16に一致するものがI/Oデバイス構成テーブルにあれば、I/Oデバイス構成テーブルのそのI/Oデバイス種別12に対応する対応付けフラグ13がオンであるかをチェックする(S58)。対応付けフラグ13がオフである場合、I/Oデバイス認識テーブルのそのI/OデバイスのID17を変更し、変更通知フラグ19をオンにする(S60)。続いて、I/Oデバイス構成テーブルの対応付けフラグ13をオンにする。I/Oデバイス認識テーブルのすべてのI/Oデバイスに関して対応付けが完了したら、変更通知フラグ19がオンのI/Oデバイスに関する変更内容を、OSディスクイメージを変更するプログラムに通知する(S64、S66)。OSディスクイメージを変更するプログラムは、外部記憶装置に格納されているOSディスクイメージを変更するために管理サーバ1に設けてある。OSディスクイメージを変更するプログラムをサーバ2に設けても良いが、更に次の機会にOSディスクイメージを実行する場合、外部記憶装置に格納されているOSディスクイメージが変更されていないので、動作判定処理を再度実行する必要がある。S54でI/Oデバイス構成テーブルをチェックしても対応付けができないときは、サーバ2において実行させようとしているOSディスクイメージは動作不可であることを、管理サーバ1のユーザインタフェースを介して管理者に警告する(S68)。
図25の処理を具体例で示す。図24のI/O1を選択し、I/Oデバイス構成テーブルをチェックすると(S52)、No1のI/OデバイスのI/Oデバイス種別12及びID11が同一であるので、対応付けフラグをONにする。図23は、この状態を示している。次に図24のI/O2を選択し、I/Oデバイス構成テーブルをチェックすると(S52)、I/Oデバイス種別12及びID11が同一のものがなく(S52)、I/Oデバイス種別12が一致(ここでは、HBA)するものがあり(S56)、対応付けフラグ13はオフであるので、I/Oデバイス認識テーブルのID17を変更し、変更通知フラグ19をオンにする。この様子を、WWN2(図24(a)のI/O2)からWWN3(図24(b)のI/O2)への変化で示している。同様にI/O6のID17がMAC3からMAC2へ変化している。
図24(a)のI/Oデバイス認識テーブルは、コピーして作成すると前述したが、元のI/Oデバイス認識テーブルを順次変更すると、OSディスクイメージが用いる全てのI/Oをサーバ2のI/Oデバイスに対応付けられないときに、I/Oデバイス認識テーブルを元の状態に戻せないからである。OSディスクイメージが用いる全てのI/Oをサーバ2のI/Oデバイスに対応付けられたときには、ワークエリアで変更したI/Oデバイス認識テーブルの内容を元のI/Oデバイス認識テーブルに書き戻せばよい。
以上により、I/Oデバイス認識テーブルは図24(b)に示すようになる。このI/Oデバイス認識テーブルの内容に従って変更されたOSディスクイメージは、サーバ2にロードされると、I/Oデバイスドライバ21とI/Oデバイス7との対応は、図26に示すシステム構成となる。具体的には、I/Oデバイスドライバ21とI/Oデバイス7とが双方向矢印で示すように新たに対応付けられている。
本実施例によれば、OSディスクイメージの実行する前に、実行するサーバのI/Oデバイス構成がOSディスクイメージに適合するかを確認できる。
OSディスクイメージは、その一部に修正の必要性が生じたら、OSディスクイメージを全体として再生成する前提に使用されてきた。一部の修正がアプリケーションプログラムの修正であれば再生成しなければならないが、実行環境としてのサーバのI/Oデバイス構成に変化が生じたときにも再生成を必要とすることは、利便性を損なう。本実施例によれば、サーバのI/Oデバイス構成がOSディスクイメージのI/Oデバイス構成と一致(包含でも良い)していなくとも、設定情報を変更して対処できる場合が増えるので、従来に得られなかった利便性が得られる。
実施例1は、OSディスクイメージが管理者などによって指定された物理サーバ上で稼働するか否かを、OSディスクイメージ割り当て直前に調査する例である。実施例1では、多数のサーバの割り当てを変更する場合、あるいは即時の割り当て変更が必要な場合に、OSディスクイメージ割り当てを管理者が指示してからその可否が判明するまでに時間を要する。そこで、本実施例では、特にI/Oデバイスに焦点を絞り、管理者がOSディスクイメージを物理サーバに割り当てる作業を高速化する。
本実施例のシステム構成例を図27に示す。本実施例では、実施例1の構成に加えて、装置としてサーバ構成変更検知モジュール2701を新たに導入する。また、管理サーバ130にOSディスクイメージ動作判定テーブル2702を追加する。
サーバ構成変更検知モジュール2701は1つ以上の管理対象サーバの物理構成を管理するモジュールであり、CPU、メモリを備え、事前に定義されたプログラムを実行可能な機器として構成される。また、ネットワークインターフェースを持ち、管理サーバと通信してデータを送受信する機能を持つ。サーバ構成変更検知モジュール2701では、管理対象サーバ上のI/Oデバイスが追加された場合にその構成を検知する機能を持つ。検知の一例としては、I/Oデバイスがスロットに挿入された場合に、I/Oデバイス上のマイクロコードが専用バスに割り込みを送信し、その割り込みを前記サーバ構成変更検知モジュール2701が取得する。このとき、サーバ構成変更モジュールは割り込みが起こったサーバモジュールは、割込みを起こしたサーバの構成情報を取得する機能、および、管理対象サーバのBIOS(Basic Input Output System)と同等の方法でI/Oデバイスの情報を取得する機能を備える。すなわち、サーバ構成変更検知モジュール2701は、サーバのI/Oデバイス構成が変更された場合に、変更された部分のみについて、サーバ物理構成調査部133が取得するデバイス構成情報と同等の内容を取得する。また、サーバ構成変更検知モジュールは、調査用OSと同一の手順で、変更された部分のみを含むデバイス構成情報を管理サーバに送信する機能を有する。
前記の検知フローは管理対象サーバ上でOSが稼働しているか否かにかかわらず、管理対象サーバに追加されたI/Oデバイスとサーバ構成変更モジュール2701の動作のみで実行可能である。また、I/Oデバイスがスロットから抜去された場合にもその検知をサーバ構成変更モジュールが行なう。 OSディスクイメージ動作判定テーブル2702は、管理サーバが管理するOSディスクイメージと、管理サーバが管理する管理対象サーバの組み合わせのそれぞれにおいて、動作判定結果のリストを保持する。動作判定結果は、OSディスクイメージに対応付けられた個別のOS動作判定ルールと、その動作判定ルールに対する図15のステップ1504〜1509で判定した結果の組をリストとして記録している。個別のOS動作判定ルールの一例は図12に示す動作判定ルール304の各行が表す1つのルールである。
次に、本実施例における動作フローについて説明する。本実施例では、実施例1と比較して、二点の変更がある。
まず第一点目として、デバイスのハードウェア構成が変更された時点で、サーバ構成変更検知モジュールが変更された部分のみを含むデバイス構成情報を管理サーバに送信、変更点のみに対するOS動作推定部134の処理、および、図15に示すOS動作判定処理のフローの実行を行い、OS動作判定結果をOSディスクイメージ動作判定テーブル2702に格納する。
二点目の変更点としては、図16に示すサーバとOSディスクイメージ組み合わせでの動作判定処理フローにおけるステップ1604において、OS動作判定処理フローを実行する代わりに、図2702に格納された動作判定処理フローの実行結果のリストの中で最も動作実績がないケースの結果をステップ1604の判定結果として後続の判定を行なうこととする。
第一点目の変更点において、動作判定処理のフローの実行を行い、OS動作判定結果を格納するOSディスクイメージ動作判定テーブル2702の一例を図28に示す。OSディスクイメージ動作判定テーブル2702は、OSディスクイメージ識別子2801で示されるOSディスクイメージが、動作可能サーバ識別子2802で示されるサーバで動作するかを判定した動作判定結果を格納するテーブルである。それぞれの動作判定結果には、2811、2812で示されるように、図12のOS動作判定ルールに含まれる、個々のルールに対して、図15のステップ1502〜1511を実行した動作判定結果を格納する。
計算機システム構成例である。 サーバ(計算機)の構成例である。 OSディスクイメージの構成例である。 管理サーバの構成例である。 サーバ物理構成取得部とサーバ−OSディスクイメージ対応付けプログラムとの関連を示す図である。 サーバ割り当て状態管理テーブルの一例である。 サーバ-OSディスクイメージ対応付けテーブルの構成例である。 OSディスクイメージ-デバイス認識情報対応付けテーブルの構成例である。 デバイス認識情報テーブルの構成例である。 OSデバイス認識情報を収集する動作のフローチャートである。 物理デバイス構成情報送信メッセージの構成例である。 OS動作判定ルールである。 サーバとOSディスクイメージ組み合わせでの動作判定処理フローチャートである。 物理サーバからのデバイス構成情報取得処理フローチャートである。 OS動作判定処理のフローチャートである。 サーバとOSディスクイメージ組み合わせでの動作判定処理のフローチャートである。 システム構成図である。 I/Oデバイス構成テーブルである。 I/Oデバイス認識テーブルである。 システム構成である。 I/Oデバイス構成取得プログラムの処理フローチャートである。 ドライバ管理テーブルである。 I/Oデバイス構成テーブルである。 I/Oデバイス認識テーブルである。 OS動作判定処理のフローチャートである。 システム構成である。 計算機システム構成例である。 OSディスクイメージ動作判定テーブルである。
符号の説明
101〜103、2:サーバ、111:OSディスクイメージ、120:デバイス認識情報テーブル、130、1:管理サーバ、131:サーバ物理構成取得部、132:デバイス認識情報テーブル管理部、133:サーバ物理構成調査部、134:OS動作推定部、135:OS動作判定部、136:ユーザインターフェース、140:OSデバイス認識情報送信部。

Claims (16)

  1. 1つ以上の管理対象サーバと、前記管理対象サーバで動作するOSディスクイメージとを備える計算機システムのOSディスクイメージと前記管理対象サーバとの対応付けを管理する運用管理システムであって、
    第1の管理対象サーバ上の前記OSディスクイメージに含まれる、OSのデバイス制御の挙動を決定するソフトウェア制御情報、および、前記ソフトウェア制御情報を適用するI/Oデバイスを特定するための物理デバイス構成情報の組からなるI/Oデバイス認識情報を収集する手段と、
    第2の管理対象サーバのI/Oデバイスの構成を示す物理デバイス構成情報を収集する手段と、
    前記I/Oデバイス認識情報と前記物理デバイス構成情報とに基づいて、前記第2の管理対象サーバに前記OSディスクイメージをロードし、実行した時の動作可否を判定する手段とを備えることを特徴とした運用管理システム。
  2. 前記動作可否を判定する手段は、所定の確認手順を実施して、該確認手順の実施を成功した実績に基づいて判定することを特徴とする請求項1記載の運用管理システム。
  3. 前記動作可否を判定する手段は、前記所定の確認手順を複数持ち、前記複数の確認手順のいずれを実施したかを記録する手段を備えることを特徴とする請求項2記載の運用管理システム。
  4. 前記動作可否を判定する手段により動作可であると判定された場合に、前記第1の管理対象サーバに対応付けられていた前記OSディスクイメージを、前記第2の管理対象サーバに対応付けることを特徴とする請求項1記載の運用管理システム。
  5. 前記動作可否を判定する手段により動作不可であると判定された場合に、前記第1の管理対象サーバに対応付けられていた前記OSディスクイメージを、前記第2の管理対象サーバに対応付けしないことを特徴とする請求項1記載の運用管理システム。
  6. 前記第2の管理対象サーバの前記I/Oデバイスの追加および削除を検知する装置と、前記判定手段による判定結果を格納するOSディスクイメージ動作判定テーブルとをさらに備え、
    前記判定する手段は、前記I/Oデバイスの追加および削除の一方の通知に応答して、前記I/Oデバイス認識情報と前記物理デバイス構成情報とに基づいて、前記第2の管理対象サーバに前記OSディスクイメージをロードし、実行した時の動作可否を判定し、その判定結果を格納するOSディスクイメージ動作判定テーブルに格納し、
    前記第1の管理対象サーバに対応付けられていた前記OSディスクイメージを、前記第2の管理対象サーバに対応付ける際に、前記のOSディスクイメージ動作判定テーブルに格納された判定結果を参照して動作可否を決定することを特徴とする請求項1記載の運用管理システム。
  7. OSディスクイメージをロードし、実行するサーバ及び前記OSディスクイメージを前記サーバに対応付けて管理する運用管理サーバであって、
    前記OSディスクイメージが使用するI/Oデバイスに関する第1の情報を格納するI/Oデバイス認識テーブル、
    前記サーバが備えるI/Oデバイスに関する第2の情報を格納するI/Oデバイス構成テーブル、および
    前記I/Oデバイス認識テーブルに格納された前記第1の情報が、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されるとき、前記OSディスクイメージを前記サーバに対応付ける処理部
    を有することを特徴とする運用管理サーバ。
  8. 前記処理部は、前記I/Oデバイス認識テーブルに格納された前記第1の情報の中で、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されない情報があるとき、前記包含されない情報を変更しても前記OSディスクイメージを前記サーバで実行可能である変更可能範囲内で、前記包含されない情報を変更し、前記変更した情報を含む前記第1の情報が、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されるとき、前記OSディスクイメージを前記サーバに対応付けることを特徴とする請求項7記載の運用管理サーバ。
  9. 1つ以上の管理対象サーバと、前記管理対象サーバで動作するOSディスクイメージとを備える計算機システムのOSディスクイメージと前記管理対象サーバとの対応付けを管理する管理サーバにおける運用管理方法であって、
    第1の管理対象サーバ上の前記OSディスクイメージに含まれる、OSのデバイス制御の挙動を決定するソフトウェア制御情報、および、前記ソフトウェア制御情報を適用するI/Oデバイスを特定するための物理デバイス構成情報の組からなるI/Oデバイス認識情報を収集し、
    第2の管理対象サーバのI/Oデバイスの構成を示す物理デバイス構成情報を収集し、
    前記I/Oデバイス認識情報と前記物理デバイス構成情報とに基づいて、前記第2の管理対象サーバに前記OSディスクイメージをロードし、実行した時の動作可否を判定することを特徴とした運用管理方法。
  10. 前記動作可否を判定する手段は、所定の確認手順を実施して、該確認手順の実施を成功した実績に基づいて判定することを特徴とする請求項9記載の運用管理方法。
  11. 前記動作可否の判定は、前記所定の確認手順を複数持ち、前記複数の確認手順のいずれを実施したかを記録することを特徴とする請求項10記載の運用管理方法。
  12. 前記動作可否の判定により動作可であると判定された場合に、前記第1の管理対象サーバに対応付けられていた前記OSディスクイメージを、前記第2の管理対象サーバに対応付けることを特徴とする請求項9記載の運用管理方法。
  13. 前記動作可否の判定により動作不可であると判定された場合に、前記第1の管理対象サーバに対応付けられていた前記OSディスクイメージを、前記第2の管理対象サーバに対応付けしないことを特徴とする請求項9記載の運用管理方法。
  14. 前記第2の管理対象サーバの前記I/Oデバイスの追加および削除を検知する装置とOSディスクイメージ動作判定テーブルとを備え、
    前記I/Oデバイスの追加および削除の一方が通知された時点で、前記実行した時の動作可否を判定した結果を前記OSディスクイメージ動作判定テーブルに格納し、
    前記のOSディスクイメージ動作判定テーブルに格納された前記判定結果を参照して、前記OSディスクイメージを前記第2の管理対象サーバに対応付けることを特徴とする請求項9記載の運用管理方法。
  15. OSディスクイメージをロードし、実行するサーバ及び前記OSディスクイメージを前記サーバに対応付けて管理する管理サーバによる運用管理方法であって、
    前記管理サーバは、前記OSディスクイメージが使用するI/Oデバイスに関する第1の情報を格納するI/Oデバイス認識テーブル、および前記サーバが備えるI/Oデバイスに関する第2の情報を格納するI/Oデバイス構成テーブルを備え、
    前記I/Oデバイス認識テーブルに格納された前記第1の情報が、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されるか否かを判定し、
    前記判定の結果として包含されるとき、前記OSディスクイメージを前記サーバに対応付けることを特徴とする運用管理方法。
  16. 前記管理サーバは、前記I/Oデバイス認識テーブルに格納された前記第1の情報の中で、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されない情報があるとき、前記包含されない情報を変更しても前記OSディスクイメージを前記サーバで実行可能である変更可能範囲内で、前記包含されない情報を変更し、前記変更した情報を含む前記第1の情報が、前記I/Oデバイス構成テーブルに格納された前記第2の情報に包含されるとき、前記OSディスクイメージを前記サーバに対応付けることを特徴とする請求項15記載の運用管理方法。
JP2008330885A 2008-12-25 2008-12-25 計算機システムの運用管理システム及び管理方法 Pending JP2010152704A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008330885A JP2010152704A (ja) 2008-12-25 2008-12-25 計算機システムの運用管理システム及び管理方法
US12/535,724 US20100169470A1 (en) 2008-12-25 2009-08-05 System and method for operational management of computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008330885A JP2010152704A (ja) 2008-12-25 2008-12-25 計算機システムの運用管理システム及び管理方法

Publications (1)

Publication Number Publication Date
JP2010152704A true JP2010152704A (ja) 2010-07-08

Family

ID=42286236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008330885A Pending JP2010152704A (ja) 2008-12-25 2008-12-25 計算機システムの運用管理システム及び管理方法

Country Status (2)

Country Link
US (1) US20100169470A1 (ja)
JP (1) JP2010152704A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012081270A1 (ja) * 2010-12-14 2012-06-21 株式会社日立製作所 計算機システム及び管理サーバ
JP2014096126A (ja) * 2012-11-12 2014-05-22 Yec:Kk 外部接続記憶装置
JP2019160133A (ja) * 2018-03-16 2019-09-19 株式会社リコー 情報処理装置、情報処理システムおよび方法
JP2020095479A (ja) * 2018-12-12 2020-06-18 日本電気株式会社 検証装置、検証方法、プログラム

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011118837A (ja) * 2009-12-07 2011-06-16 Sony Corp 情報処理装置、情報処理方法およびプログラム
US9158550B2 (en) 2011-06-16 2015-10-13 Vmware, Inc. Caching based operating system installation
US8561075B2 (en) * 2011-11-02 2013-10-15 International Business Machines Corporation Load balancing servers
JP2013178697A (ja) * 2012-02-29 2013-09-09 Hitachi Ltd 計算機、計算機システムおよび計算機システムの起動方法
CN103324262A (zh) * 2012-03-20 2013-09-25 鸿富锦精密工业(深圳)有限公司 电源装置
US10884926B2 (en) 2017-06-16 2021-01-05 Alibaba Group Holding Limited Method and system for distributed storage using client-side global persistent cache
US10678443B2 (en) 2017-07-06 2020-06-09 Alibaba Group Holding Limited Method and system for high-density converged storage via memory bus
US10642522B2 (en) 2017-09-15 2020-05-05 Alibaba Group Holding Limited Method and system for in-line deduplication in a storage drive based on a non-collision hash
US10789011B2 (en) 2017-09-27 2020-09-29 Alibaba Group Holding Limited Performance enhancement of a storage device using an integrated controller-buffer
US10860334B2 (en) * 2017-10-25 2020-12-08 Alibaba Group Holding Limited System and method for centralized boot storage in an access switch shared by multiple servers
US10877898B2 (en) 2017-11-16 2020-12-29 Alibaba Group Holding Limited Method and system for enhancing flash translation layer mapping flexibility for performance and lifespan improvements
US10891239B2 (en) 2018-02-07 2021-01-12 Alibaba Group Holding Limited Method and system for operating NAND flash physical space to extend memory capacity
US10496548B2 (en) 2018-02-07 2019-12-03 Alibaba Group Holding Limited Method and system for user-space storage I/O stack with user-space flash translation layer
US10831404B2 (en) 2018-02-08 2020-11-10 Alibaba Group Holding Limited Method and system for facilitating high-capacity shared memory using DIMM from retired servers
US11379155B2 (en) 2018-05-24 2022-07-05 Alibaba Group Holding Limited System and method for flash storage management using multiple open page stripes
WO2020000136A1 (en) 2018-06-25 2020-01-02 Alibaba Group Holding Limited System and method for managing resources of a storage device and quantifying the cost of i/o requests
US10921992B2 (en) 2018-06-25 2021-02-16 Alibaba Group Holding Limited Method and system for data placement in a hard disk drive based on access frequency for improved IOPS and utilization efficiency
US10871921B2 (en) 2018-07-30 2020-12-22 Alibaba Group Holding Limited Method and system for facilitating atomicity assurance on metadata and data bundled storage
US10747673B2 (en) 2018-08-02 2020-08-18 Alibaba Group Holding Limited System and method for facilitating cluster-level cache and memory space
US10996886B2 (en) 2018-08-02 2021-05-04 Alibaba Group Holding Limited Method and system for facilitating atomicity and latency assurance on variable sized I/O
US11481296B2 (en) * 2018-09-10 2022-10-25 International Business Machines Corporation Detecting configuration errors in multiport I/O cards with simultaneous multi-processing
US11327929B2 (en) 2018-09-17 2022-05-10 Alibaba Group Holding Limited Method and system for reduced data movement compression using in-storage computing and a customized file system
US10852948B2 (en) 2018-10-19 2020-12-01 Alibaba Group Holding System and method for data organization in shingled magnetic recording drive
US10795586B2 (en) 2018-11-19 2020-10-06 Alibaba Group Holding Limited System and method for optimization of global data placement to mitigate wear-out of write cache and NAND flash
US10769018B2 (en) 2018-12-04 2020-09-08 Alibaba Group Holding Limited System and method for handling uncorrectable data errors in high-capacity storage
US10977122B2 (en) 2018-12-31 2021-04-13 Alibaba Group Holding Limited System and method for facilitating differentiated error correction in high-density flash devices
US10884654B2 (en) 2018-12-31 2021-01-05 Alibaba Group Holding Limited System and method for quality of service assurance of multi-stream scenarios in a hard disk drive
US11061735B2 (en) 2019-01-02 2021-07-13 Alibaba Group Holding Limited System and method for offloading computation to storage nodes in distributed system
US11132291B2 (en) 2019-01-04 2021-09-28 Alibaba Group Holding Limited System and method of FPGA-executed flash translation layer in multiple solid state drives
US10860420B2 (en) 2019-02-05 2020-12-08 Alibaba Group Holding Limited Method and system for mitigating read disturb impact on persistent memory
US11200337B2 (en) 2019-02-11 2021-12-14 Alibaba Group Holding Limited System and method for user data isolation
US10970212B2 (en) 2019-02-15 2021-04-06 Alibaba Group Holding Limited Method and system for facilitating a distributed storage system with a total cost of ownership reduction for multiple available zones
US11061834B2 (en) 2019-02-26 2021-07-13 Alibaba Group Holding Limited Method and system for facilitating an improved storage system by decoupling the controller from the storage medium
US10783035B1 (en) 2019-02-28 2020-09-22 Alibaba Group Holding Limited Method and system for improving throughput and reliability of storage media with high raw-error-rate
US10891065B2 (en) 2019-04-01 2021-01-12 Alibaba Group Holding Limited Method and system for online conversion of bad blocks for improvement of performance and longevity in a solid state drive
US10922234B2 (en) 2019-04-11 2021-02-16 Alibaba Group Holding Limited Method and system for online recovery of logical-to-physical mapping table affected by noise sources in a solid state drive
US10908960B2 (en) 2019-04-16 2021-02-02 Alibaba Group Holding Limited Resource allocation based on comprehensive I/O monitoring in a distributed storage system
US11169873B2 (en) 2019-05-21 2021-11-09 Alibaba Group Holding Limited Method and system for extending lifespan and enhancing throughput in a high-density solid state drive
US10860223B1 (en) 2019-07-18 2020-12-08 Alibaba Group Holding Limited Method and system for enhancing a distributed storage system by decoupling computation and network tasks
US11074124B2 (en) 2019-07-23 2021-07-27 Alibaba Group Holding Limited Method and system for enhancing throughput of big data analysis in a NAND-based read source storage
US11126561B2 (en) 2019-10-01 2021-09-21 Alibaba Group Holding Limited Method and system for organizing NAND blocks and placing data to facilitate high-throughput for random writes in a solid state drive
US11042307B1 (en) 2020-01-13 2021-06-22 Alibaba Group Holding Limited System and method for facilitating improved utilization of NAND flash based on page-wise operation
US11449455B2 (en) 2020-01-15 2022-09-20 Alibaba Group Holding Limited Method and system for facilitating a high-capacity object storage system with configuration agility and mixed deployment flexibility
US10872622B1 (en) 2020-02-19 2020-12-22 Alibaba Group Holding Limited Method and system for deploying mixed storage products on a uniform storage infrastructure
US10923156B1 (en) 2020-02-19 2021-02-16 Alibaba Group Holding Limited Method and system for facilitating low-cost high-throughput storage for accessing large-size I/O blocks in a hard disk drive
US11150986B2 (en) 2020-02-26 2021-10-19 Alibaba Group Holding Limited Efficient compaction on log-structured distributed file system using erasure coding for resource consumption reduction
US11144250B2 (en) 2020-03-13 2021-10-12 Alibaba Group Holding Limited Method and system for facilitating a persistent memory-centric system
US11200114B2 (en) 2020-03-17 2021-12-14 Alibaba Group Holding Limited System and method for facilitating elastic error correction code in memory
US11385833B2 (en) 2020-04-20 2022-07-12 Alibaba Group Holding Limited Method and system for facilitating a light-weight garbage collection with a reduced utilization of resources
US11281575B2 (en) 2020-05-11 2022-03-22 Alibaba Group Holding Limited Method and system for facilitating data placement and control of physical addresses with multi-queue I/O blocks
US11461262B2 (en) 2020-05-13 2022-10-04 Alibaba Group Holding Limited Method and system for facilitating a converged computation and storage node in a distributed storage system
US11494115B2 (en) 2020-05-13 2022-11-08 Alibaba Group Holding Limited System method for facilitating memory media as file storage device based on real-time hashing by performing integrity check with a cyclical redundancy check (CRC)
US11218165B2 (en) 2020-05-15 2022-01-04 Alibaba Group Holding Limited Memory-mapped two-dimensional error correction code for multi-bit error tolerance in DRAM
US11556277B2 (en) 2020-05-19 2023-01-17 Alibaba Group Holding Limited System and method for facilitating improved performance in ordering key-value storage with input/output stack simplification
US11507499B2 (en) 2020-05-19 2022-11-22 Alibaba Group Holding Limited System and method for facilitating mitigation of read/write amplification in data compression
US11263132B2 (en) 2020-06-11 2022-03-01 Alibaba Group Holding Limited Method and system for facilitating log-structure data organization
US11422931B2 (en) 2020-06-17 2022-08-23 Alibaba Group Holding Limited Method and system for facilitating a physically isolated storage unit for multi-tenancy virtualization
US11354200B2 (en) 2020-06-17 2022-06-07 Alibaba Group Holding Limited Method and system for facilitating data recovery and version rollback in a storage device
US11354233B2 (en) 2020-07-27 2022-06-07 Alibaba Group Holding Limited Method and system for facilitating fast crash recovery in a storage device
US11372774B2 (en) 2020-08-24 2022-06-28 Alibaba Group Holding Limited Method and system for a solid state drive with on-chip memory integration
US11487465B2 (en) 2020-12-11 2022-11-01 Alibaba Group Holding Limited Method and system for a local storage engine collaborating with a solid state drive controller
US11734115B2 (en) 2020-12-28 2023-08-22 Alibaba Group Holding Limited Method and system for facilitating write latency reduction in a queue depth of one scenario
US11416365B2 (en) 2020-12-30 2022-08-16 Alibaba Group Holding Limited Method and system for open NAND block detection and correction in an open-channel SSD
US11726699B2 (en) 2021-03-30 2023-08-15 Alibaba Singapore Holding Private Limited Method and system for facilitating multi-stream sequential read performance improvement with reduced read amplification
US11461173B1 (en) 2021-04-21 2022-10-04 Alibaba Singapore Holding Private Limited Method and system for facilitating efficient data compression based on error correction code and reorganization of data placement
US11476874B1 (en) 2021-05-14 2022-10-18 Alibaba Singapore Holding Private Limited Method and system for facilitating a storage server with hybrid memory for journaling and data storage

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011506A (ja) * 2004-06-22 2006-01-12 Nec Corp 起動イメージ提供システム及び方法、ブートノード装置、ブートサーバ装置並びにプログラム
JP2006079534A (ja) * 2004-09-13 2006-03-23 Fuji Xerox Co Ltd 情報処理装置及びこれを用いた情報処理システム
JP2006277277A (ja) * 2005-03-29 2006-10-12 Nec Corp 起動イメージ提供システム及びその動作方法、ブートノード装置、ブートサーバ装置並びにその動作プログラム
JP2007183747A (ja) * 2006-01-05 2007-07-19 Hitachi Ltd 物理サーバ間のシステム移動方法およびシステム移動システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7099912B2 (en) * 2001-04-24 2006-08-29 Hitachi, Ltd. Integrated service management system
JP4064914B2 (ja) * 2003-12-02 2008-03-19 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、サーバ装置、情報処理装置のための方法、サーバ装置のための方法および装置実行可能なプログラム
TWI278199B (en) * 2004-03-26 2007-04-01 Quanta Comp Inc Deployment method and system for multiple remote computers
US7797288B2 (en) * 2004-12-27 2010-09-14 Brocade Communications Systems, Inc. Use of server instances and processing elements to define a server
US7590648B2 (en) * 2004-12-27 2009-09-15 Brocade Communications Systems, Inc. Template-based development of servers
US20060230165A1 (en) * 2005-03-25 2006-10-12 Zimmer Vincent J Method and apparatus for provisioning network infrastructure
US7653894B2 (en) * 2005-05-04 2010-01-26 International Business Machines Corporation Method and apparatus for classifying and modeling operating system image for data center management
US7631175B2 (en) * 2006-02-21 2009-12-08 Microsoft Corporation Control protocol for image enumeration and transfer
US7631038B2 (en) * 2006-02-21 2009-12-08 Microsoft Corporation PXE server with multiple provider model
JP4655986B2 (ja) * 2006-04-12 2011-03-23 ブラザー工業株式会社 ノード装置、記憶制御プログラム及び情報記憶方法
US8677353B2 (en) * 2007-01-11 2014-03-18 Nec Corporation Provisioning a standby virtual machine based on the prediction of a provisioning request being generated
CN101911017A (zh) * 2007-12-31 2010-12-08 数据逻辑移动公司 用于配置、更新和引导便携式数据读取器上的可替代操作系统的系统和方法
US20090276774A1 (en) * 2008-05-01 2009-11-05 Junji Kinoshita Access control for virtual machines in an information system
US8041793B2 (en) * 2008-09-24 2011-10-18 Dell Products L.P. Boot image discovery and delivery system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006011506A (ja) * 2004-06-22 2006-01-12 Nec Corp 起動イメージ提供システム及び方法、ブートノード装置、ブートサーバ装置並びにプログラム
JP2006079534A (ja) * 2004-09-13 2006-03-23 Fuji Xerox Co Ltd 情報処理装置及びこれを用いた情報処理システム
JP2006277277A (ja) * 2005-03-29 2006-10-12 Nec Corp 起動イメージ提供システム及びその動作方法、ブートノード装置、ブートサーバ装置並びにその動作プログラム
JP2007183747A (ja) * 2006-01-05 2007-07-19 Hitachi Ltd 物理サーバ間のシステム移動方法およびシステム移動システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012081270A1 (ja) * 2010-12-14 2012-06-21 株式会社日立製作所 計算機システム及び管理サーバ
JP2014096126A (ja) * 2012-11-12 2014-05-22 Yec:Kk 外部接続記憶装置
JP2019160133A (ja) * 2018-03-16 2019-09-19 株式会社リコー 情報処理装置、情報処理システムおよび方法
JP7259203B2 (ja) 2018-03-16 2023-04-18 株式会社リコー 情報処理装置、情報処理システムおよび方法
JP2020095479A (ja) * 2018-12-12 2020-06-18 日本電気株式会社 検証装置、検証方法、プログラム
JP7279351B2 (ja) 2018-12-12 2023-05-23 日本電気株式会社 検証装置、検証方法、プログラム

Also Published As

Publication number Publication date
US20100169470A1 (en) 2010-07-01

Similar Documents

Publication Publication Date Title
JP2010152704A (ja) 計算機システムの運用管理システム及び管理方法
US7930371B2 (en) Deployment method and system
US7549076B2 (en) Fail over method through disk take over and computer system having fail over function
JP5266590B2 (ja) 計算機システムの管理方法、計算機システム及びプログラム
US8706850B2 (en) Computer system and configuration management method therefor
JP4448878B2 (ja) 障害回復環境の設定方法
JP4813385B2 (ja) ストレージシステムの複数の論理リソースを制御する制御装置
US7596676B2 (en) Method of inheriting information identifying virtual volume and storage system using the same
US8938528B2 (en) Computer system, and method for managing resource pool information
US9542249B2 (en) System redundancy verification method and computer system
US20060155837A1 (en) Diskless computer operation management system
EP1770502A2 (en) Data migration method, storage controller
JP4797636B2 (ja) 複合型情報プラットフォーム装置とその情報処理装置構成方法
US8745342B2 (en) Computer system for controlling backups using wide area network
US20060074957A1 (en) Method of configuration management of a computer system
JP2010134757A (ja) サーバのフェイルオーバの制御方法及び装置、並びに計算機システム群
JP2010003061A (ja) 計算機システム及びそのi/o構成変更方法
WO2018173164A1 (ja) データ処理システム
US20060167886A1 (en) System and method for transmitting data from a storage medium to a user-defined cluster of local and remote server blades
JP5316616B2 (ja) 業務引き継ぎ方法、計算機システム、及び管理サーバ
US20120030442A1 (en) Management system and management method for managing computer system
US8117405B2 (en) Storage control method for managing access environment enabling host to access data
US20110125938A1 (en) Storage System, Management Server, System Reconfiguration Support Method for a Storage System, and System Reconfiguration Support Method for a Management Server
JP5267544B2 (ja) ディスク引き継ぎによるフェイルオーバ方法
JP4877368B2 (ja) ディスク引き継ぎによるフェイルオーバ方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120918

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120919

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130129