JP5782563B2

JP5782563B2 - 情報取得方法、計算機システム及び管理計算機

Info

Publication number: JP5782563B2
Application number: JP2014512043A
Authority: JP
Inventors: 敬太嶋田; 高本　良史; 良史高本; 貴志爲重; 健太郎渡邊; 裕工藤
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2012-04-23
Filing date: 2012-04-23
Publication date: 2015-09-24
Anticipated expiration: 2032-04-23
Also published as: EP2833266A1; WO2013160983A1; JPWO2013160983A1; US20150095424A1; US9712615B2; EP2833266A4

Description

本発明は、データセンタなどのインフラの管理者や、上位管理製品が情報を利用する単位で、管理対象のＩＴ機器群の情報を集中して取得することにより、その単位内の管理対象情報の取得時間の差を縮小させる技術に関する。

現在、データセンタ内のＩＴ機器を統合管理する製品を用いて、全てのＩＴ機器のリソースを管理する市場の動きがある。また、サーバ仮想化技術の浸透により、管理対象となる仮想サーバを含むＩＴ機器やサーバの数が増える傾向にある。従来の運用では、管理サーバが管理対象となるＩＴ機器の全ての情報を予め登録した順序（ＩＰアドレスなど）で定期に取得しておく。管理者は、必要に応じて管理サーバに保持された情報を参照していた（例えば、特許文献１）。

国際公開第２００９/１４４９６９号

しかしながら、上記従来の定期的な情報取得方法では、管理者や、管理サーバと連携するアプリケーション（例えば、構成情報管理アプリケーションなど）が情報を利用するまとまりを考慮していない為、インフラの管理者や上位管理製品は、情報の鮮度に大きくばらつきのある情報を合わせて利用する恐れがあった。すなわち、予め登録した順序で取得した情報のうち最悪のケースでは、最初に取得した情報と最後に取得した情報を合わせて利用することになる。このため、情報を併せて利用する時点で最初の情報が変更されていないことを判定する必要があった。つまり、インフラの管理者などが障害の発生に対応して情報取得を行う際に、情報収集開始の時点で情報を取得する対象や順番を変更することができない、という問題があった。

そこで本発明は、インフラの管理者や、管理サーバと連携するアプリケーションが利用するＩＴ機器のグループ内で、管理対象のＩＴ機器群の情報を迅速に取得することを目的とする。

本発明は、プロセッサとメモリとインターフェースを備えた管理計算機と、前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機がネットワークを介して前記計算機の情報を取得する情報取得方法であって、前記管理計算機が、前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する第１のステップと、前記管理計算機が、情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する第２のステップと、前記管理計算機が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する第３のステップと、前記情報を取得する指令に基づいて情報取得実行部が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で前記グループ毎の計算機の情報を取得する第４のステップと、を含む。

本発明によれば、管理者や管理計算機と連携するアプリケーションが利用する計算機システムを構成する機器のグループにおいて、管理対象の機器の情報をグループ単位で集中して取得することが可能となり、当該グループ内の管理対象情報の取得時間を短く抑えることができる。

本発明の第１の実施形態を示し、計算機システムの一例を示すブロック図である。本発明の第１の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。本発明の第１の実施形態を示し、サーバの機能部位の一例を示すブロック図である。本発明の第１の実施形態を示し、ストレージ装置の機能部位の一例を示すブロック図である。本発明の第１の実施形態を示し、仮想サーバを提供するサーバの機能部位の一例を示すブロック図である。本発明の第１の実施形態を示し、管理機器登録テーブルの一例を示す図の前半である。本発明の第１の実施形態を示し、管理機器登録テーブルの一例を示す図の後半である。本発明の第１の実施形態を示し、構成情報トポロジーテーブルの一例を示す図である。本発明の第１の実施形態を示し、取得グループポリシーテーブルの一例を示す図である。本発明の第１の実施形態を示し、取得グループテーブルの一例を示す図である。本発明の第１の実施形態を示し、取得順序テーブルの一例を示す図である。本発明の第１の実施形態を示し、計算機システムで行われる処理の一例の概要を示すブロック図である。本発明の第１の実施形態を示し、管理サーバの制御部で行われる処理の一例を示すフローチャートである。本発明の第１の実施形態を示し、管理サーバの管理対象検出部で行われる処理の一例を示すフローチャートである。本発明の第１の実施形態を示し、管理サーバのトポロジー生成部で行われる処理の一例を示すフローチャートである。本発明の第１の実施形態を示し、管理サーバの取得グループ生成部で行われる処理の一例を示すフローチャートの前半である。本発明の第１の実施形態を示し、管理サーバの取得グループ生成部で行われる処理の一例を示すフローチャートの後半である。本発明の第１の実施形態を示し、管理サーバの取得順序決定部で行われる処理の一例を示すフローチャートの前半である。本発明の第１の実施形態を示し、管理サーバの取得順序決定部で行われる処理の一例を示すフローチャートの後半である。本発明の第１の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートである。本発明の第１の実施形態を示し、管理サーバの取得順序決定部で生成される一時登録テーブルの一例である。本発明の第１の実施形態を示し、ポーリングスレッド割当テーブルの一例を示す図である。本発明の第１の実施形態を示し、管理サーバのポーリングスレッド割当部で行われる処理の一例を示すフローチャートの後半である。本発明の第２の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。本発明の第２の実施形態を示し、制約テーブルの一例を示す図である。本発明の第２の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートの前半である。本発明の第２の実施形態を示し、管理サーバの情報取得部で行われる処理の一例を示すフローチャートの後半である。本発明の第３の実施形態を示し、管理サーバの機能部位の一例を示すブロック図である。本発明の第３の実施形態を示し、管理サーバのアラート検知部で行われる処理の一例を示すフローチャートである。本発明の第３の実施形態を示し、管理サーバの実行判定部で行われる処理の一例を示すフローチャートである。本発明の第４の実施形態を示し、計算機システムの一例を示すブロック図である。本発明の第４の実施形態を示し、ポーリングスレッド用サーバの機能部位の一例を示すブロック図である。本発明の第４の実施形態を示し、管理サーバの情報送受信部で行われる処理の一例を示すフローチャートである。本発明の第４の実施形態を示し、ポーリングスレッド用サーバの情報送受信部で行われる処理の一例を示すフローチャートである。本発明の第４の実施形態を示し、一時管理機器登録テーブルの一例を示す図である。本発明の第４の実施形態を示し、一時管理機器登録テーブルの一例を示す図である。本発明の第４の実施形態を示し、取得順序テーブルの一例を示す図である。

以下、本発明の一実施形態について添付図面を用いて説明する。

＜第１実施形態＞

図１は、本発明の第１の実施形態の計算機システムの一例を示すブロック図である。管理サーバ１０１は、管理ＬＡＮ１００とＮＷ−ＳＷ（管理用ネットワークスイッチ）１０２を介して、ＮＷ−ＳＷ１０２の管理インターフェース(管理Ｉ／Ｆ)１１２と、ＮＷ−ＳＷ（業務用ネットワークスイッチ）１０３の管理インターフェース１１３と、ＦＣ（Fibre Channel）−ＳＷ１０７の管理インターフェース１１７と、サーバ１０４−１〜１０４−３の管理インターフェース１１４と、サーバ１０５の管理インターフェース１１５と、仮想サーバ１０６−１〜１０６−２の管理インターフェース１１６と、ストレージ装置１０８[0]−１〜１０８−２の管理インターフェース１１８に接続されている。なお、各管理インターフェース１１２〜１１８は、管理サーバ１０１からの問い合わせに応じて各ＩＴ機器（以下、単に機器とする）の情報を送信するためのインターフェース（またはＩ／Ｏインターフェース）であり、例えば、後述のネットワークインターフェースを採用することができる。

管理ＬＡＮ１００とＮＷ−ＳＷ１０２は、管理サーバ１０１が複数のサーバ１０４−１〜１０４−３を管理するためのネットワークを構成する。なお、以下ではサーバ１０４−１〜１０４−３の総称をサーバ１０４で表し、仮想サーバ１０６−１〜１０６−２を仮想サーバ１０６で表す。

管理サーバ１０１は、各サーバ１０４で稼働するＯＳやアプリケーションの配布や電源制御等の運用管理をする。ＮＷ−ＳＷ１０３は、業務用のネットワークを構成し、サーバ１０４上で実行される業務アプリケーションによって使用されるネットワークである。なお、ＮＷ−ＳＷ１０３は、業務ＬＡＮ１０９を経由し、ＷＡＮ等に接続されて計算機システムの外部のクライアント計算機と通信を行う。

管理サーバ１０１上では、制御部１１０が実行され、管理テーブル群１１１を参照および更新する。管理テーブル群１１１は制御部１１０によって後述するように更新または設定される。

管理セグメント１５０は、管理サーバ１０１が管理する領域である。管理セグメント１５０の定義は、管理者が任意で設定することが可能である。例えば、ＩＰアドレスのネットワークセグメントで、１．１．１．Ｘ(Ｘは任意の数字)はセグメント１、１．１．２．Ｙ(Ｙは任意の数字)はセグメント２などと定義しても良いし、または、本実施形態のＮＷ−ＳＷ１０２の様に特定の機器を基準に定義しても良い。なお、図示はしないが、管理セグメントは複数存在しても良い。

図２は、管理サーバ１０１の構成を示すブロック図である。管理サーバ１０１は、演算を行うＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０１と、ＣＰＵ２０１で実行するプログラムや、プログラムの実行に伴うデータを格納するメモリ２０２と、プログラムやデータを格納するストレージ装置１０８などへアクセスするためのディスクインターフェース２０４と、ＩＰネットワークを介した通信のためのネットワークインターフェース２０５と、ＰＣＩＥｘｐｒｅｓｓ（Ｉ／Ｏインターフェース）規格のＩ／Ｏデバイス（ＮＩＣ（Network Interface Card）、ＨＢＡ（Host Bus Adapter）、ＣＮＡ（Converged Network Adapter）、といったＩ／ＯアダプタまたはＩ／Ｏデバイス）を接続することができるＰＣＩ−Ｅｘｐｒｅｓｓインターフェース２０６から構成される。

図２の管理サーバ１０１では、ネットワークインターフェース２０５と、ディスクインターフェース２０４を、それぞれ代表して一つずつ示しているが、各々が複数あってもよい。たとえば、管理用ネットワーク１０２と業務用ネットワーク１０３への接続は、各々異なるネットワークインターフェース２０５を用いるようにしてもよい。

メモリ２０２には、制御部１１０と管理テーブル群１１１と情報取得ポーリングスレッド（情報取得実行部）２３１が格納されている。制御部１１０は、管理対象検出部２１４（図１３参照）、トポロジー生成部２１５（図１４参照）、取得グループ生成部２１７（図１５参照）、取得順序決定部２１６（図１６参照）、情報取得部２１３（図１７参照）、ポーリングスレッド割当部２１８（図２０）、を有する。

管理対象検出部２１４と、トポロジー生成部２１５と、取得グループ生成部２１７と、取得順序決定部２１６と、情報取得部２１３と、ポーリングスレッド割当部２１８の各機能部はプログラムとしてメモリ２０２にロードされる。また、情報取得ポーリングスレッド２３１は、制御部１１０がロードされるタイミングで生成されても良いし、情報取得の際に生成されてもよい。

ＣＰＵ２０１は、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、ＣＰＵ２０１は、取得グループ生成プログラムに従って動作することで取得グループ生成部２１７として機能する。他のプログラムについても同様である。さらに、ＣＰＵ２０１は、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。

管理テーブル群１１１は、管理機器登録テーブル２２２（図６参照）、構成情報トポロジーテーブル２２６（図７参照）、取得グループポリシーテーブル２２３（図８参照）、取得グループテーブル２２４（図９参照）、取得順序テーブル２２５（図１０参照）、一時登録テーブル２２７(図１８参照) 、ポーリングスレッド割当テーブル２２８(図１９参照)を有する。

各テーブルの情報は、管理サーバ１０１内のプログラム（機能部位）により自動生成されたものでも良いし、手動で利用者（または管理端末）が入力したものでも良いし、管理サーバ１０１と連携するアプリケーションが入力したものでも良い。なお、管理サーバ１０１と連携するアプリケーションとしては、例えば、上位の構成管理アプリケーションなどで構成される。

管理サーバ１０１、サーバ１０４、サーバ１０５の種別について、物理サーバ、ブレードサーバ、仮想化されたサーバ、論理物理分割または物理分割されたサーバなどのいずれであっても良く、いずれを使った場合も本発明の効果を得ることが出来る。

制御部１１０の各機能を実現するプログラム、テーブル等の情報は、ストレージ装置１０８や不揮発性半導体メモリ、ハードディスクドライブ、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶デバイス、または、ＩＣカード、ＳＤカード、ＤＶＤ等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。

図３は、サーバ１０４の構成を示すブロック図である。サーバ１０４は、演算を行うＣＰＵ３０１と、ＣＰＵ３０１で実行するプログラムや、プログラムの実行に伴いデータを格納するメモリ３０２と、プログラムやデータを格納するストレージ装置（またはストレージサブシステム）１０８へアクセスするためのディスクインターフェース３０４と、ＩＰネットワークを介して通信を行うためのネットワークインターフェース３０５と、電源制御や各インターフェースの制御を行うＢＭＣ（ＢａｓｅｍｅｎｔＭａｎａｇｅｍｅｎｔＣｏｎｔｒｏｌｌｅｒ）３０３とを有する。メモリ３０２上のＯＳ３１１がＣＰＵ３０１によって実行され、サーバ１０２内のデバイス管理を行っている。ＯＳ３１３の下で、業務を提供するアプリケーション３１１や監視プログラム３１２などが実行される。

図３では、ネットワークインターフェース３０５と、ディスクインターフェース３０４を、それぞれ代表して一つずつ示しているが、各々が複数あってもよい。たとえば、管理用ネットワーク１０２と業務用ネットワーク１０３への接続は、各々異なるネットワークインターフェース３０５を用いる。本実施形態では、サーバ１０４は管理ネットワーク(ＮＷ−ＳＷ１０２)と業務用ネットワーク(ＮＷ−ＳＷ１０３)へ接続する為のネットワークインターフェース３０５を有している。また、管理Ｉ／Ｆ１１４(図１参照)は管理ネットワーク(ＮＷ−ＳＷ１０２)用のネットワークインターフェース３０５を示している。

図４は、ストレージ装置１０８の構成を示すブロック図である。ストレージ装置１０８は、演算を行うＣＰＵ４０１と、ＣＰＵ４０１で実行するプログラムや、プログラムの実行に伴いデータを格納するメモリ４０２と、ストレージ装置１０８およびストレージ装置１０８に接続した機器から送られたプログラムやデータを格納するディスク４０３と、サーバ１０４等がストレージ装置１０８に接続するためのポート４０４と、管理サーバ１０１がストレージ装置１０８を管理する為に利用する管理Ｉ／Ｆ１１８を有している。なお、管理Ｉ／Ｆ１１８としてはネットワークインターフェースを採用することができる。

図５は、仮想化部５２１を実行して複数の仮想サーバ１０６を提供するサーバ１０５のブロック図である。サーバ１０５は、サーバ１０４と同様にＣＰＵ５０２、メモリ５０１、ＢＭＣ５０３、ネットワークインターフェース５０４、ディスクインターフェース５０５、ＰＣＩｅインターフェース５０６から構成されている。

しかし、サーバ１０５は、仮想化部５２１と仮想サーバ１０６−１、１０６−２をメモリ５０１上に有している。サーバ１０５は、サーバ１０５の計算機資源を仮想化部５２１で仮想化し、１つ以上の仮想サーバ１０６を提供している。なお、仮想化部５２１は、例えば、ハイパーバイザやＶＭＭ（Virtual Machine Monitor）等で構成される。

メモリ５０１には、計算機資源を仮想化する上述の仮想化部５２１が格納され、サーバ１０５では１つ以上の仮想サーバ１０６を提供する。また、仮想化部５２１は、制御用インターフェースとして仮想化部管理用インターフェース５２２を備えている。仮想化部５２１は、サーバ１０５（ブレードサーバでも良い）の計算機資源を仮想化することで仮想サーバ１０６を構成する。仮想サーバ１０６は、仮想ＣＰＵ５３２、仮想メモリ５３１、仮想ネットワークインターフェース５３４、仮想ディスクインターフェース５３５、仮想ＰＣＩｅインターフェース５３６から構成されている。仮想メモリ５３１には、ＯＳ５４１が格納され仮想サーバ１０６内の仮想デバイス群を管理している。また、ＯＳ５４１上では、業務アプリケーション５４２が実行されている。ＯＳ５４１上で稼働する管理プログラム５４３によって、障害の検知やＯＳの電源制御、インベントリ管理などが提供されている。

仮想化部５２１は、サーバ１０５の物理計算機資源と仮想計算機資源の対応付けを管理している。仮想化部５２１は複数の仮想サーバ１０６間で通信を行うために仮想スイッチ５２３を有する。仮想スイッチ５２３は、サーバ１０５の物理的なインターフェースを複数の仮想サーバ１０６に接続させることができる。これにより、仮想サーバ１０６は、サーバ１０５の持つインターフェースを経由してサーバ１０５の外部の機器と接続可能となる。

仮想化部管理用インターフェース５２２は、仮想化部５２１が管理サーバ１０１と通信をするためのインターフェースであり、仮想化部５２１から管理サーバ１０１へ情報を通知したり、管理サーバ１０１から仮想化部５２１へ指示を送るときに使われる。また、ユーザ端末（図示省略）などから直接、使用することも可能である。

図６Ａ、図６Ｂは、管理サーバ１０１に格納される管理機器登録テーブル２２２を示す。管理機器登録テーブル２２２は、管理サーバ１０１が管理する機器が有する構成情報や、当該機器で稼働するソフトウェアや認証に関する情報取得を行う際にまとめて取得する範囲を示すグループの情報などを格納している。本実施形態では、サーバ１０４、１０５等の各種サーバや、ＮＷ−ＳＷ１０２等のネットワークスイッチや、ＦＣ−ＳＷ１０７等のＦＣスイッチや、ストレージ装置１０８等のストレージ装置などの種類の異なる機器が同じテーブル上に登録されているが、種類ごとにテーブルが分かれていても良い。

図６Ａ、図６Ｂにおいて、カラム６０１は、管理サーバ１０１が管理する、サーバ１０４等の機器のノードＩＤを格納しており、本識別子によって各機器を一意に識別する。カラム６０１へ格納するデータは、本テーブル２２２で使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記ノードＩＤは、昇順などで管理サーバ１０１が自動的に割り振っても良い。

カラム６０２は、サーバ１０４等の管理対象機器に割り当てられた管理ＩＰアドレスを格納している。この管理ＩＰアドレスに基づいて管理サーバ１０１はサーバ１０４等の管理対象機器に接続する。

カラム６０３は、サーバ１０４等の管理対象機器に管理サーバ１０１が接続する際に利用するユーザ名とパスワードを格納している。なお、図中セパレータ「：」の前方がユーザ名であり、後方がパスワードである。

カラム６０４は、サーバ１０４等の管理対象機器のＯＳの情報を格納している。

カラム６０５は、サーバ１０４等の管理対象機器のモデル名が格納されている。このモデル名は、インフラに関する情報であり、サーバ１０４等の管理対象機器のメーカや性能や構成可能なシステムの限界を知ることが出来る情報である。また、管理対象機器の構成が同じか否かを判別することが出来る情報である。

カラム６０６は、サーバ１０４等の管理対象機器の構成が格納されている。構成に関する情報としては、サーバ１０４やサーバ１０５等のサーバでは、プロセッサのアーキテクチャや、シャーシやスロットなどの物理位置情報と、特徴機能（ブレード間ＳＭＰ：ＳｙｍｍｅｔｒｉｃＭｕｌｔｉ-Ｐｒｏｃｅｓｓｉｎｇ、ＨＡ（High Availability）構成などの有無）を格納している。ＮＷ−ＳＷ１０２やＮＷ−ＳＷ１０３やＦＣ−ＳＷ１０７等のスイッチでは、ポート数などを格納している。

カラム６０７は、サーバ１０４等の管理対象機器の稼働情報を格納する。稼働情報は、管理対象機器の電源ＯＮ/ＯＦＦやＯＳや業務システムが正常稼働しているかを表す情報である。また、管理サーバ１０１と管理対象機器間で通信不可となった場合は、その旨を示す稼働情報が登録される。

カラム６０８は、サーバ１０４等の管理対象機器の性能情報が格納されている。サーバ１０４やサーバ１０５等のサーバでは、プロセッサの動作周波数やコア数、メモリの容量、割り当てられたストレージ装置１０８の容量と種別、Ｉ／Ｏデバイスの性能などを格納することができる。ＮＷ−ＳＷ１０２やＮＷ−ＳＷ１０３やＦＣ−ＳＷ１０７等のスイッチでは、スイッチ容量などを格納することができる。また、ストレージ装置１０８等のストレージ装置では、ストレージ全体の容量などの情報を格納することができる。

カラム６０９は、サーバ１０４等の管理対象機器の情報が取得された時刻またはタイムスタンプを格納している。

カラム６１０は、サーバ１０４等の管理対象機器それぞれに対する追加設定項目が格納されている。この追加設定項目は、クラスタ構成、バックアップ構成、負荷分散構成、ハイパーバイザと仮想マシンの関係などに関する情報などである。ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションから得た管理対象機器に関する情報や、それらの情報に基づいて管理サーバ１０１が生成した情報を格納しても良い。

カラム６１１は、サーバ１０４等の管理対象機器それぞれに関連するグループが格納されている。ここで、グループとは、所定の時間内に情報取得を行いたい管理対象機器をまとめたものであり、後に説明する取得グループ生成部２１７(図１５)で生成される取得グループである。関連するグループには、サーバ１０４等の管理対象機器それぞれについて、自身が含まれる取得グループが存在した場合、その取得グループのグループＩＤ(図９参照)を格納する。

カラム６１２は、取得順序登録がされているか否かの情報(登録状態)を格納する。登録状態とは、管理サーバ１０１が、サーバ１０４等の管理対象機器を、後に説明する取得順序テーブル(図１０)に登録しているということを示す。

カラム６１３は、管理対象全体に対する１回の情報取得処理の中で、それぞれのノードに対して処理が実行されたか否かを表す情報である。

図７は、管理サーバ１０１に格納される構成情報トポロジーテーブル２２６を示す。構成情報トポロジーテーブル２２６は、管理サーバ１０１の管理対象機器間の接続関係に関する情報を格納している。また、構成情報トポロジーテーブルは、管理サーバ１０１の管理対象機器全てについて登録されている。

カラム７０１は、トポロジーＩＤを格納している。トポロジーＩＤは、トポロジーの１つのまとまりを一意に識別する為の識別子である。カラム７０１へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記トポロジーＩＤは、昇順などで管理サーバ１０１が自動的に割り当てても良い。

カラム７０７は、トポロジーが存在する管理セグメントの管理セグメントＩＤを格納している。

カラム７０２は、トポロジーの起点となるネットワークスイッチを格納している。本実施形態では、ネットワークスイッチ１０２、１０３を起点にトポロジーを登録しているが、起点としてはサーバ１０４やサーバ１０５のようなサーバでも良いし、ＦＣ−ＳＷ１０７のようなＦＣスイッチでも良いし、ストレージ装置１０８のようなストレージ装置でも良い。

カラム７０３とカラム７０４とカラム７０５とカラム７０６は、関連ノードＩＤを格納している。関連ノードＩＤは、トポロジーＩＤが割り当てられたトポロジーのまとまりを構成する機器のノードＩＤ(図６参照)を示している。また、カラムが左右で隣あう関連ノード同士は接続関係にあることを示している。本実施形態では、関連ノードＩＤを格納するカラムはカラム７０３とカラム７０４とカラム７０５とカラム７０６の４列しか記載されていないが、トポロジーのまとまりを構成する管理対象機器の数により、カラムの数は変更される。

図８は、管理サーバ１０１に格納される取得グループポリシーテーブル２２３を示す。取得グループポリシーテーブル２２３は、管理サーバ１０１の管理対象機器から、特定の機器を選択し、取得グループを設定する際に使用するポリシーを格納している。

カラム８０１は、ポリシーＩＤを格納する。ポリシーＩＤは、取得グループ設定の為のポリシーを一意に識別する為の識別子である。カラム８０１へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記ポリシーＩＤは、昇順などで管理サーバ１０１が自動的に割り振っても良い。

カラム８０２は、ポリシーを格納する。ポリシーに基づいて取得グループ生成部２１７(図１５)は取得グループを生成する。ポリシーは、例えば、サーバ１０４がクラスタ構成であることや、バックアップ構成であることや、負荷分散構成であることや、ハイパーバイザと仮想サーバとの関係や、同一ハイパーバイザ上にある仮想マシン同士の関係などがある。それらのポリシーは、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションから直接得てもいいし、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションが持つ情報に基づいて管理サーバ１０１が生成しても良いし、管理サーバ１０１が持つ管理対象機器の情報から管理サーバ１０１が生成しても良い。

カラム８０３は、ポリシーに対する優先度を格納する。優先度は、ポリシーに基づいて取得グループを生成する際、グループ優先度を決定する為に参照される。優先度は、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションが必要に応じて変更することが可能である。なお、優先度は、値が小さいほど優先度が高くなる。

カラム８０４は、障害発生時の情報取得を優先するか否かの情報を格納している。ただし、本第１実施形態では使用しない。

図９は、管理サーバ１０１に格納される取得グループテーブル２２４を示す。取得グループテーブル２２４は、ほぼ同一の時間帯に情報取得を行いたい管理対象機器をまとめた取得グループを格納する。前記取得グループを参考に管理サーバ１０１は管理対象機器の取得の順番を変更する。なお、前記同一の時間帯は、取得グループ内で最初の情報取得機器から最後の情報取得機器までの時間が短時間（例えば、数十分ないし数分）であることを示す。

カラム９０１は、グループＩＤを格納する。グループＩＤは、取得グループを一意に識別する為の識別子である。カラム９０１へ格納するデータは、本テーブルで使用される各カラムのいずれか、または複数カラムを組み合わせたものを指定することで入力を省略することが出来る。また、前記グループＩＤは、昇順などで管理サーバ１０１が自動的に割り振っても良い。

カラム９０２は、グループの優先度を格納する。グループ優先度は、取得グループポリシーテーブル２２３のカラム８０３の優先度に基づいて設定されるもので、管理対象機器に対する情報取得の取得順序を決定する際に、優先すべき取得グループを決定する為に利用する。

カラム９０３は、グループの登録状態を格納する。登録状態は、管理対象機器に対する情報取得の取得順序を決定する際に、重複して取得グループを設定されるのを避ける為に参照する情報で、グループを構成する管理対象機器が全て取得順序テーブル２２５(図１０)に登録されていれば、グループの登録状態を「登録済」に変更する。

カラム９０４とカラム９０５とカラム９０６とカラム９０７は、関連ノードＩＤを格納している。関連ノードＩＤは、グループを構成する機器のノードＩＤ(図６参照)を示している。本実施形態では、関連ノードＩＤを格納するカラムはカラム９０４とカラム９０５とカラム９０６とカラム９０７の４つしか記載されていないが、グループを構成する管理対象機器の数により、カラムの数は変更される。

カラム９０８は、障害発生時の情報取得を優先するか否かの情報を格納している。この情報は、取得グループポリシーテーブル２２３のカラム８０４の優先度に基づいて設定される。ただし、本第１実施形態では使用しない。

図１０は、管理サーバ１０１に格納される取得順序テーブル２２５を示す。取得順序テーブル２２５は、管理サーバ１０１が管理対象機器の情報取得を行う際の情報取得順序の情報を格納している。カラム１００１は、取得番号を格納する。取得番号は、情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。

カラム１００２は、カラム１００３のノードＩＤが所属する管理セグメントのセグメントＩＤを格納する。

カラム１００３は、情報取得ポーリングスレッドに割り当てるノードＩＤを格納する。

図１８は、管理サーバ１０１に格納される一時登録テーブル２２７を示す。一時登録テーブル２２７は、取得順序決定部で行う処理中で、取得グループ(関連グループ)の情報を一時的に保持する為に使用するテーブルである。

カラム１７０１は、取得グループのグループＩＤを格納している。カラム１７０２は、取得グループのグループ優先度を格納している。カラム１７０３は、取得グループの情報のグループ登録状態を格納している。

特に、カラム１７０２及び１７０３は、それぞれ、取得グループテーブル２２４のカラム９０２、カラム９０３と同期している。よって、本実施形態のように一時取得テーブル２２７にカラム１７０２とカラム１７０３を作らずに、カラム１７０１のグループＩＤに基づいて、取得グループテーブル２２４のカラム９０２、カラム９０３を参照しても良い。

図１９は、ポーリングスレッド割当テーブル２２８を示す。ポーリングスレッド割当テーブル２２８は、情報取得ポーリングスレッドが情報取得を行う管理対象機器の情報を格納しており、情報取得部２１３は、ポーリングスレッド割当テーブル２２８を参照し、情報取得を行う。

カラム１８０１は、取得番号を格納する。取得番号は、情報取得ポーリングスレッド２３１が情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。

カラム１８０２とカラム１８０３は、情報取得ポーリングスレッドに割り当てる管理対象機器（ノードＩＤ）を格納する。本実施形態では、カラム１８０２とカラム１８０３の２つのみを記載しているが、管理サーバ１０１が使用する情報取得ポーリングスレッドの数によりカラムの数は変更される。

図１１は、計算機システムで行われる処理の一例の概要を表すブロック図である。管理サーバ１０１は、管理対象機器の情報の取得を行う際、構成情報トポロジーテーブル２２６に登録されたトポロジーと、取得グループテーブル２２４に登録された取得グループ３００１（図中破線内）を素にして、管理対象機器の情報取得順序を決定し、情報取得を行う。

情報を取得する順序は、基本的にはトポロジーの登録順で決定されるが、管理対象機器が取得グループ３００１に所属していた場合は、取得グループ３００１に含まれる管理対象機器（図中サーバ１、２）の情報を優先して取得するように情報取得順序を変更する。

また、管理対象機器が複数の取得グループ３００１に属していた場合は、優先度が高い取得グループ３００１の管理対象機器から情報取得を行うように情報取得順序を決定する。これによって、接続関係がある管理対象機器同士を近い順で情報取得することを可能とする。また、その中でも取得グループ３００１として関連性のある管理対象機器同士については、優先してかつ、近い順序で情報取得を行うことを可能とする。

図１２は、管理サーバ１０１の制御部１１０で行われる処理の一例を示すフローチャートである。

ステップ１１０１で、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションや、管理サーバ１０１のスケジュール機能からの開始指示を契機に管理対象検出部２１４が管理対象機器の探索処理を開始する。

ステップ１１０２で、管理対象検出部２１４が管理対象機器を検出し、検出された構成情報を管理機器登録テーブル２２２に登録する。

ステップ１１０３で、トポロジー生成部２１５が、管理対象機器間の接続関係を表す構成情報トポロジーテーブル２２６を生成する。

ステップ１１０４で、取得グループ生成部２１７が、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションや、管理サーバ１０１のスケジュール機能からの開始指示を契機に取得グループポリシーテーブル２２３と管理機器登録テーブル２２２の情報に基づいて、取得グループを生成する。ステップ１１０５で、取得グループ生成部２１７が、取得グループとそのグループ優先度を取得グループテーブル２２４に登録する。

取得グループテーブル２２４には、後述する取得グループポリシーテーブル２２３で示すように、バックアップ元のサーバとバックアップ先のサーバ及びこれらのサーバを接続する機器が一つのグループを構成するよう設定される。このグループが、管理サーバ１０１で構成情報を取得する計算機群（取得グループ）として設定され、管理サーバ１０１は、各取得グループごとに計算機や機器の情報を取得する。取得グループとしては、上述のバックアップの関係の他に、負荷分散を行う複数の計算機をひとつの取得グループとしたり、クラスタ構成が設定された複数の計算機をひとつの取得グループとしたり、仮想サーバとハイパーバイザなどの仮想化部（または物理計算機）をひとつの取得グループとしたり、ソフトウェアが連携する複数のサーバを取得グループとして抽出することができる。なお、ソフトウェアが連携する複数のサーバとしては、ＷＥＢサーバ、アプリケーションサーバ、データベースサーバが連携する計算機群をひとつの取得グループとして抽出することができる。管理サーバ１０１では、上記のように所定のポリシーまたは条件に基づいて、複数のサーバのうち関連のあるサーバを抽出し、取得グループとして設定することができる。

ステップ１１０６で、取得グループ生成部２１７が、管理機器登録テーブル２２２の各管理対象ノードに、それが所属する取得グループの情報を登録する。

ステップ１１０７で、取得順序決定部２１６が、管理機器登録テーブル２２２と取得グループテーブル２２４と構成情報トポロジーテーブル２２６を参照し、管理対象ノードの情報取得の順番を決定し、取得順序テーブル２２５に登録する。

ステップ１１０８で、ポーリングスレッド割当部２１８が、取得順序テーブル２２５を参照し、ポーリングスレッドに対して取得する管理対象ノードを割り当てる。

ステップ１１０９で、情報取得部２１３が、ポーリングスレッド割当テーブル２２８を参照し、必要な数の情報取得ポーリングスレッド２３１を生成し、前記ポーリングスレッドに、情報取得を指示する。
ステップ１１１０で、情報取得部２１３が、前記情報取得ポーリングスレッド２３１が取得した情報を管理機器登録テーブル２２２に登録する。
ステップ１１１１で、情報取得部２１３が、前記情報取得ポーリングスレッド２３１が取得した情報を管理機器登録テーブルに登録し、処理を完了する。

図１３は、管理サーバ１０１の管理対象検出部２１４で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０１で実行される。

ステップ１２０１で、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションや、管理サーバ１０１のスケジュール機能からの開始指示を検出する。

ステップ１２０２で、管理対象検出部２１４は管理対象機器の探索処理を実行する。

ステップ１２０３で、管理対象機器を検出し、管理対象検出部２１４は検出した構成情報を管理機器登録テーブルに登録する。

ステップ１２０４で、管理対象検出部２１４は取得グループ生成部２１７に処理が完了したことを示す通知を行って処理を完了する。

図１４は、管理サーバ１０１のトポロジー生成部２１５で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０３で実行される。

ステップ１３０１で、トポロジー生成部２１５は管理機器登録テーブル２２２を参照する。ステップ１３０２で、トポロジー生成部２１５は構成情報トポロジーテーブル２２６を生成する。ここでは、前述のステップ１３０１で参照した管理対象機器の構成情報を基にして接続関係を検出し、構成情報トポロジーテーブルを生成する。

ステップ１３０３で、トポロジー生成部２１５は取得グループ生成部２１７に処理完了を通知し、処理を完了する。

図１５Ａ、図１５Ｂは、管理サーバ１０１の取得グループ生成部２１７で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０４で実行される。

図１５Ａのステップ１４０１では、取得グループ生成部２１７が管理機器登録テーブル２２２から管理対象機器の情報を取得する。

ステップ１４０２では、取得グループ生成部２１７がユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションから、取得グループを生成する為の取得グループポリシーや、取得グループを直接指定する情報や、取得グループの管理対象機器の情報が入力されたか否かを判定する。判定の結果、情報が存在する場合は、ステップ１４１２に進み、存在しない場合は、ステップ１４０４へ進む。

ステップ１４１２では、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションから受け付けた情報に、取得グループポリシーが存在するか否かを判定する。取得グループポリシーが存在する場合はステップ１４１３へ進み、それ以外の場合は、ステップ１４０３へ進む。

ステップ１４１３では、取得グループ生成部２１７がステップ１４１２で判定した取得グループポリシーを、取得グループポリシーテーブル２２３(図８)に登録し、ステップ１４０４へ進む。

ステップ１４０３では、取得グループ生成部２１７がユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションからの前記情報を受理し、ステップ１４０６へ進む。

ステップ１４０６では、取得グループ生成部２１７がステップ１４０３で受理した、管理サーバ１０１と連携するアプリケーションからの情報に該当する管理対象機器を選択し、ステップ１４０８に進む。

ステップ１４０４では、取得グループ生成部２１７が取得グループポリシーテーブル２２３を参照し、図１５Ｂのステップ１４０５に進む。

ステップ１４０５では、取得グループ生成部２１７がステップ１４０１で得た管理対象機器の中から、取得グループポリシーテーブル２２３に合致する管理対象機器が存在するか否かを判定する。判定の結果、取得グループポリシーテーブル２２３に合致する管理対象機器が存在した場合は、ステップ１４０７に進む。合致する管理対象機器が存在しなかった場合は、ステップ１４１１へ進む。

ステップ１４０７では、取得グループ生成部２１７が前記ステップ１４０５でポリシーに合致すると判定された管理対象機器を選択し、ステップ１４０８へ進む。

ステップ１４０８では、取得グループ生成部２１７が前記ステップ１４０７で選択した管理対象機器を取得グループとして取得グループテーブル２２４に登録する。

ステップ１４０９では、取得グループ生成部２１７が取得グループポリシーの優先度に基づいて、取得グループにグループ優先度を設定し、ステップ１４１０に進む。

ステップ１４１０では、取得グループ生成部２１７が管理機器登録テーブル２２２の各管理対象機器の関連グループを格納するカラムに６１１に、関連する取得グループＩＤを設定して、ステップ１４１１に進む。

ステップ１４１１では、取得グループ生成部２１７が取得順序決定部２１６へ取得グループの設定処理が終わったことを通知し、取得グループ生成部２１７の処理を完了する。

図１６Ａ、図１６Ｂは、管理サーバ１０１の取得順序決定部２１６で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０７で実行される処理で、具体的には、図１５Ｂのステップ１４１１からの通知に基づいて開始される。

ステップ１５０１では、取得順序決定部２１６が管理機器登録テーブル２２２、取得グループテーブル２２４、構成情報トポロジーテーブル２２６を参照する。

ステップ１５０２では、取得順序決定部２１６が管理機器登録テーブル２２２の登録状態（カラム６１２）のステータスを全て未登録に変更する。

ステップ１５０３では、取得順序決定部２１６が一時登録テーブル２２７（図１８参照）を生成する。

ステップ１５０４では、取得順序決定部２１６が構成情報トポロジーテーブル２２６の登録順に管理機器登録テーブル２２２の全管理対象機器が登録状態になるまでループ処理を行う。

ステップ１５０５では、取得順序決定部２１６が管理対象機器の登録状態のカラム６１２が登録済か否かを判断する。登録済以外の場合は、ステップ１５０６に進む。登録済みの場合はステップ１５１６に進み、全ての管理対象機器の処理が完了していればステップ１５１３へ進み、完了していなければステップ１５０４のループ処理の先頭に戻って上記処理を繰り返す。

ステップ１５０６では、取得順序決定部２１６が、上記ステップ１５０５で登録済みではないと判定された管理対象機器を取得順序テーブル２２５に登録する。

ステップ１５０７では、取得順序決定部２１６が一時登録テーブル２２７上のグループ（１７０１）の内、関連ノードの登録状態が全て登録済のグループは、登録状態を登録済に変更し、一時登録テーブル２２７から削除する。

ステップ１５０８では、ステップ１５０６で登録した管理対象機器の関連グループの内、登録状態が未登録、かつ一時登録テーブルに登録されていないグループが存在するか否かを判定する。前記条件に該当するグループが存在する場合は、図１６Ｂのステップ１５１０へ進む。前記条件に該当するグループが存在しない場合は、図１６Ｂのステップ１５０９へ進む。

図１６Ｂのステップ１５０９では、取得順序決定部２１６が一時登録テーブル２２７に現在処理中のグループが登録されているか否かを判定する。一時登録テーブル２２７に現在処理中のグループが登録されていなければステップ１５１６へ進み、ステップ１５０４のループ処理の先頭に戻る。一時登録テーブル２２７に現在処理中のグループが登録されていれば、ステップ１５１１へ進む。

ステップ１５１０では、取得順序決定部２１６が一時登録テーブル２２７に登録状態が未登録の関連グループを登録する。

ステップ１５１１では、取得順序決定部２１６が一時登録テーブル２２７で最も優先度の高いグループを選択する。

ステップ１５１２では、取得順序決定部２１６がステップ１５１１で選択したグループを構成する関連ノードの内、未登録の関連ノードを１つ選択し、図１６Ａのステップ１５０６へ戻って上記処理を繰り返す。

ステップ１５１６では、管理機器登録テーブルの全管理機器の登録状態が、登録済に変更されたか否かを判断し、全管理機器の登録状態が登録済の場合は、ステップ１５１３に進む。そうでない場合は、ステップ１５０５に進み、管理機器登録テーブルに登録された次の管理機器について処理を行う。

ステップ１５１３では、ステップ１５０４のループ処理の終わりであり、ステップ１５０４のループ処理の終了条件を満たしていれば、ステップ１５１４へ進む。

ステップ１５１４では、取得順序決定部２１６がステップ１５０３で生成した一時登録テーブル２２７を消去する。

ステップ１５１５では、取得順序決定部２１６が管理対象機器の取得順序決定が終了したことをポーリングスレッド割当部２１８へ通知し、取得順序決定部２１６の処理を終了する。

以上の処理により、管理サーバ１０１は、管理機器登録テーブル２２２の機器について取得グループを設定し、取得グループごとの情報取得順位を決定して一時登録テーブル２２７に格納する。そして、管理サーバ１０１は、一時登録テーブル２２７の取得グループの順序に沿って取得グループ内の機器について情報を取得する順位を決定することができる。

図２０は、管理サーバ１０１のポーリングスレッド割当部２１８で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０８で実行される処理であり、具体的には、図１６Ｂのステップ１５１５で取得順序決定部２１６が送出した通知を契機として実行される。

ポーリングスレッド割当部２１８は、取得順序テーブル２２５の管理対象機器の情報を取得するために、情報取得ポーリングスレッド２３１を管理対象機器に割り当てる処理を行う。

ステップ１９０１では、ポーリングスレッド割当部２１８がポーリングスレッド割当テーブル２２８を生成する。この際、管理サーバ１０１で情報取得に使用する情報取得ポーリングスレッド２３１の数により、ポーリングスレッド割当テーブル２２８のカラム(カラム１８０２やカラム１８０３)の数も変化する。管理サーバ１０１が生成する情報取得ポーリングスレッド２３１の数は、予め管理者が設定しておいても良いし、管理サーバ１０１のマシンスペックから生成可能な情報取得ポーリングスレッド２３１の数をポーリングスレッド割当部２１８で推測し、自動的に設定しても良い。

ステップ１９０２では、ポーリングスレッド割当部２１８が取得順序テーブル２２５を参照する。

ステップ１９０３では、ポーリングスレッド割当部２１８が取得順序テーブル２２５に格納された全管理対象機器に対して取得番号順にステップ１９０４の処理を繰り返して行う、ループ処理を開始する。

ステップ１９０４では、ポーリングスレッド割当部２１８が取得順序テーブル２２５の取得番号順（１００１）の順に管理対象機器のノードＩＤを取得して、ポーリングスレッド割当テーブル２２８のカラム１８０２またはカラム１８０３へ格納する。この処理は、取得順序テーブル２２５の取得番号１から順に、「ＮＷ−ＳＷ１」をポーリングスレッド割当テーブル２２８のポーリングスレッド１（１８０２）へ格納した後、取得番号２の「サーバ１」をポーリングスレッド２（１８０３）へ格納する。次に、ポーリングスレッド割当部２１８は、取得番号３の「サーバ２」を格納するためポーリングスレッド割当テーブル２２８に新たなエントリを追加してからポーリングスレッド１（１８０２）へ「サーバ２」を格納する。このように、取得番号順にポーリングスレッドを割り当てて、割り当てるポーリングスレッドがなくなると新たなエントリを追加する。

ステップ１９０５では、ステップ１９０３で開始したループ処理がループ条件を全て満たした場合に、そのループ処理を完了させる。

ステップ１９０６では、情報取得部２１３に処理の完了を通知し、ポーリングスレッド割当部２１８の処理を完了とする。

上記処理により、取得順序テーブル２２５の各ノードＩＤには、情報取得ポーリングスレッド２３１が割り当てられ、ポーリングスレッド割当テーブル２２８が生成される。

図１７は、管理サーバ１０１の情報取得部２１３で行われる処理の一例を示すフローチャートである。この処理は、図１２のステップ１１０９とステップ１１１０とステップ１１１１で実行される処理であり、具体的には、上記図２０のステップ１９０６でポーリングスレッド割当部２１８が通知を送出した契機で開始される。

ステップ１６０１では、情報取得部２１３が管理機器登録テーブル２２２の全管理機器の定期取得カラム６１３を未取得に変更する。ステップ１６０２では、情報取得部２１３がポーリングスレッド割当テーブル２２８を参照する。

ステップ１６０３では、情報取得部２１３が、情報取得ポーリングスレッド２３１をポーリングスレッド割当テーブル２２８のポーリングスレッドの数だけ生成する。尚、既に情報取得ポーリングスレッドが生成されているのであれば、本ステップは無視することができる。図１９の例では、ポーリングスレッド１、２の２つの情報取得ポーリングスレッド２３１が起動する。

ステップ１６０４では、ポーリングスレッド割当テーブル２２８の全管理対象機器について情報取得が行われるまで続けるループ処理を開始する。

ステップ１６０５では、情報取得部２１３がポーリングスレッド割当テーブル２２８に従い、各情報取得ポーリングスレッド２３１に管理対象機器の情報を取得させる。

ステップ１６０６で、情報取得部２１３は情報取得ポーリングスレッド２３１が取得した管理対象機器の情報を管理機器登録テーブル２２２に登録する。

ステップ１６０７では、情報取得部２１３がポーリングスレッド割当テーブル２２８の全管理対象機器について情報取得が完了すると、ステップ１６０４で開始したループ処理を終了し、ステップ１６０８に進む。

ステップ１６０８では、情報取得部２１３がステップ１６０３で生成した、情報取得ポーリングスレッドを消去する。尚、情報取得ポーリングスレッドを消去せずに、メモリ上に保持する場合は、このステップを無視する。

ステップ１６０９では、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションに対して、情報取得処理の完了を通知し、処理を完了する。

以上のように、管理対象機器の情報を取得する順序は、基本的にはトポロジーの登録順で決定されるが、管理対象機器が取得グループ３００１に所属していた場合は、取得グループ３００１に含まれる管理対象機器の情報を優先して取得するように情報取得順序を変更することができる。

そして、本発明では、管理対象機器が複数の取得グループに属していた場合、優先度が高い取得グループの管理対象機器から情報取得を行うように情報取得の順序を決定する。これによって、接続関係がある管理対象機器同士の情報取得順序を近づけることで、同じ時間帯で情報の取得を行うことが可能となる。さらに、取得グループとして関連性のある管理対象機器同士については、優先してかつ、近い順序で情報取得を行うことが可能となるのである。これにより、取得グループ内では、情報取得の時刻が大幅（例えば、数時間など）に異なるのを防いで、ほぼ同一の時間帯（例えば、数十分以内あるいは数分以内）で取得することが可能となる。

以上より、管理サーバと連携するアプリケーションが利用する機器のグループや、管理者が指定したグループまたはグループ内の管理対象の機器の情報を迅速に取得することが可能となるのである。

＜第２実施形態＞

第２の実施形態では、取得時間の制約条件が存在した場合に、取得グループに対して制約条件を付加しておき、管理サーバ１０１は、情報の取得後に制約条件を満たしているか否かを判定する。そして、制約条件を満たしていない場合は、管理サーバ１０１が情報の再取得を行ったり、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションに対して情報取得の失敗を通知する。これにより、ユーザ（管理者）からの入力や管理サーバ１０１と連携するアプリケーションが設定した条件を満たした構成情報を提供することが可能となる。

本第２実施形態で使用する計算機システムの構成は、前記第１実施形態の図１と同じである。しかし、管理サーバ１０１の構成については、図２１で示すように、前記第１実施形態の構成に加えて制約テーブル(図２２)を使用する点が異なる。また、前記第１実施形態の情報取得部２１３の処理の一部が異なる。

図２２は、管理サーバ１０１に格納される制約テーブル２２９を示す。制約テーブル２２９は、ユーザ（管理者）からの入力や、管理サーバ１０１と連携するアプリケーションから情報取得の指令の際に入力された制約条件を格納する。

制約テーブル２２９のカラム２００１では、制約条件を識別する制約ＩＤを格納する。カラム２００２では、入力または設定された制約条件の内容を格納する。カラム２００３では、制約条件から抽出した、構成情報を取得するための時間条件を格納する。カラム２００４では、制約条件を適用するグループのグループＩＤを格納する。

図２３Ａと図２３Ｂは、第２実施形態において情報取得部２１３で行われる処理の一例を示すフローチャートである。

図２３Ａのステップ２１０１からステップ２１０７までは、前記第１実施形態における情報取得部２１３（図１７）のステップ１６０１からステップ１６０７と同様である。

ステップ２１０８では、情報取得部２１３が制約テーブル２２９を参照する。ステップ２１０９では、情報取得部２１３が制約テーブル２２９の個々の制約条件に対して処理が実施し、全ての制約条件に対して処理が行われるまで、ステップ２１１３との間でループ処理をする。

ステップ２１１０では、情報取得部２１３が制約テーブル２２９のカラム２００４で制約条件を適用するグループを参照する。

ステップ２１１１では、ステップ２１１０で参照したグループが制約条件を満たしているか否かを情報取得部２１３が判定する。例えば、「取得グループ内の管理対象機器は１時間以内に取得する」という制約が満たされているか否かを判定する場合、グループ中の関連ノードの内、最初に情報取得を行った管理対象機器の取得時刻と、最後に情報取得を行った管理対象機器の取得時刻を比較し、その時間差が１時間に収まっているか否かを判定する。制約条件を満たしている場合は、ステップ２１１３へ進む。制約条件を満たしていない場合は、ステップ２１１２に進む。

ステップ２１１２では、情報取得部２１３がステップ２１１１で制約条件を満たしているか否かを判定したグループの情報を再収集する。ここでは、再収集の代わりに、制約条件が満たされていないことをユーザ端末（図示省略）や連携するアプリケーションに通知しても良い。

ステップ２１１４、２１１５は、図１７のステップ１６０８，１６０９と同様であり、情報取得部２１３が情報取得ポーリングスレッドを消去してから、ユーザ（管理者）や、管理サーバ１０１と連携するアプリケーションに対して、情報取得処理の完了を通知して、処理を完了する。

以上のように第２実施形態では、構成情報の取得後に制約条件を取得グループが満たしていたか否かを管理サーバ１０１が判定し、ユーザ端末（図示省略）や管理サーバ１０１と連携するアプリケーションに対して、取得グループが制約条件を満たしたか否かを知らせることが可能となる。

＜第３実施形態＞

第３の実施形態は、管理サーバ１０１が情報取得を行った際に、障害発生や故障発生などのアラート（障害情報）を検出した場合、その後の情報取得の対象を変更することを可能にするものである。

アラートを発行した管理対象機器と取得グループが同じ機器は、同じ原因で障害が発生している可能性もあるため、管理サーバ１０１は該当する機器を特定する。そして、管理サーバ１０１は、特定した機器に対して情報取得の延期や、別のポーリングスレッドを特定された機器へ割り当てることで、情報取得処理全体の遅延やアラートが大量に通知されるアラートストームを回避する。

また、管理サーバ１０１はＲＣＡ(ＲｏｏｔＣａｕｓｅＡｎａｌｙｓｉｓ)による障害分析の為に、アラートが通知された管理対象機器と同じ取得グループのノードを優先して取得するように割当ポーリングスレッドを増やすことも可能となる。

本第３実施形態で使用する計算機システムの構成は、前記第１実施形態の図１と同じである。しかし、管理サーバ１０１の構成は図２４で示すように、前記第１実施形態の構成にアラート検知部２１９と実行判定部２２０を加えた点が相違する。

図２５は、管理サーバ１０１のアラート検知部２１９で行われる処理の一例を示すフローチャートである。

ステップ２１０１では、アラート検知部２１９が管理対象機器からのアラートを検知する。なお、アラートの検出は、情報取得ポーリングスレッド２３１が構成情報を取得するときに、管理対象機器からアラートを受け付けると、アラート検知部２１９に当該アラートを通知する。これにより、アラート検知部２１９は管理対象機器からのアラートを検出することができる。あるいは、ユーザ（管理者）によるアラートの入力や、管理サーバ１０１と連携するアプリケーションからのイベント通知からアラートを検出しても良い。

ステップ２１０２では、アラート検知部２１９が情報処理部２１３へ情報取得処理の中断指示を送出し、情報取得ポーリングスレッド２３１の情報取得を停止させる。

ステップ２１０３では、アラート検知部２１９がアラートを通知した管理対象機器を特定する。

ステップ２１０４では、ステップ２１０２で特定した管理対象機器の情報を、アラート検知部２１９が実行判定部２２０へ引き渡し、アラート検知部２１９の処理を完了する。

上記処理により、アラート検知部２１９は管理対象機器のうち、アラートを検出した機器については情報取得ポーリングスレッド２３１による情報取得を中止させる。

図２６は、管理サーバ１０１の実行判定部２２０で行われる処理の一例を示すフローチャートである。この処理は、図２５のステップ２１０４でアラート検知部２１９が通知したことを契機に、管理サーバ１０１の実行判定部２２０で行われる。

ステップ２３０１では、実行判定部２２０がアラート検知部２１９から引き渡された管理対象の機器情報を取得する。

ステップ２３０２では、実行判定部２２０が管理機器登録テーブル２２２を参照する。このステップでアラート検知部２１９から引き渡された管理対象機器の関連グループを特定する。

ステップ２３０３では、実行判定部２２０がアラート検知部２１９から引き渡された管理対象機器に関連グループが存在するか否かを判断する。関連グループが存在する場合はステップ２３０４に進む。関連グループが存在しない場合は、実行判定部２２０の処理を完了する。

ステップ２３０４では、実行判定部２２０がステップ２３０３で存在を特定した関連グループについて、障害対応策として、情報取得を優先的に行うか否かを判定する。判定については、には図９の取得グループテーブル２２４のカラム９０８の障害発生時に情報の取得を優先するか否かの情報を用いる。実行判定部２２０は、特定した関連グループのグループＩＤ（９０１）のカラム９０８の値が「優先」の場合はステップ２３０５へ進む。そうでない場合は、ステップ２３０７へ進む。

ステップ２３０５では、ポーリングスレッド割当部２１８が取得順序テーブル２２５を参照し、関連グループの関連ノードを除外して、ステップ２３０６へ進む。

ステップ２３０６では、ステップ２３０５で除外した関連ノードに対して、ポーリングスレッド割当部２１８で、新規に情報取得ポーリングスレッド２３１を生成して、関連ノードへ割り当て、ステップ２３０９へ進む。

優先的に取得しない場合のステップ２３０７では、実行判定部２２０が取得順序テーブル２２５を参照し、関連グループの関連ノードを全て取得順序テーブル２２５の最後に配置して、ステップ２３０８へ進む。

ステップ２３０８では、実行判定部２２０がポーリングスレッド割当部２１８へ指示を送り、情報取得ポーリングスレッド２３１への割り当てを再度実行させ、更新された取得順序テーブル２２５で情報取得ポーリングスレッド２３１を割り当てる順序を更新してからステップ２３０９へ進む。

尚、ステップ２３０７とステップ２３０８で行ったように、取得順序テーブル内の関連ノードの順番を変更する代わりに、ステップ２３０５とステップ２３０６で行ったように取得順序テーブルから関連ノードを除外し、新たに情報取得ポーリングスレッドを生成して割り当てるようにしても良い。

ステップ２３０９では、実行判定部２２０が情報取得部２１３に指令を出し、情報取得を再開させる。この際、情報取得部２１３のステップ１６０１で行う管理対象機器の定期取得カラムを未取得に変更するステップは省略する。

以上のように第３実施形態では、情報取得時に障害発生などのアラートが発生した際、それに対応して、その後の情報取得処理の順序を変更することにより、情報取得処理全体の遅延やアラートストームを防止したり、障害分析に役立つ情報を優先的に取得することが可能となる。

＜第４実施形態＞

第４実施形態は、管理サーバ１０１以外の一以上のサーバが情報取得ポーリングスレッドを生成し、管理対象機器の情報取得を行うことで、管理サーバ１０１の情報取得にかかる負荷を軽減することを可能とする。

図２７は、第４実施形態の計算機システムの一例を示すブロック図である。

本第４実施形態で使用する計算機システムが、前記第１実施形態の計算機システムと異なる点は、一以上のポーリングスレッド用サーバ１５１が存在する点と、管理サーバ１０１の制御部１１０にポーリングスレッド用サーバとの間で情報の送受信を実施する情報送受信部２４０１が加えられた点と、情報取得部２１３及び情報取得ポーリングスレッド２３１がポーリングスレッド用サーバ１５１へ移動した点である。その他の構成は前記第１実施形態と同様である。なお、管理サーバ１０１に情報取得部２１３及び情報取得ポーリングスレッド２３１が残しておくことを排除しない。

図２８は、ポーリングスレッド用サーバ１５１の一例を示すブロック図である。ポーリングスレッド用サーバ１５１の構成は、前記第１実施形態の管理サーバ１０１と同様の構成である。しかし、ポーリングスレッド用サーバ１５１では、制御部１１０Ａに、情報取得部２１３と情報送受信部２５０１が格納され、管理テーブル群１１１Ａに、一時管理機器登録テーブル２５０２と取得順序テーブル２５０３が格納される。

図２９は、管理サーバ１０１の制御部１１０に含まれる情報送受信部２４０１で行われる処理の一例を示すフローチャートである。

ステップ２６０１では、情報送受信部２４０１が前記第１実施形態のポーリングスレッド割当部２１８のステップ１９０６の情報取得部２１３への処理完了通知と同じタイミングで、ポーリングスレッド用サーバ１５１に対して、ポーリングスレッド割当テーブル２２８に基づいて、情報取得対象の管理対象機器の情報と、管理対象機器の取得順序の情報を送信する。

ステップ２６０２では、情報送受信部２４０１がポーリングスレッド用サーバ１５１から構成情報の取得完了通知と構成情報の取得結果を受信する。

ステップ２６０３では、情報送受信部２４０１が前記ステップ２６０２で取得した情報取得結果を管理機器登録テーブル２２２に反映する。

以上の処理により、管理サーバ１０１は管理対象機器の情報取得を外部のポーリングスレッド用サーバ１５１へ依頼することが可能となる。

なお、上記では管理サーバ１０１に管理機器登録テーブル２２２を格納する例を示したが、管理ＬＡＮ１００に接続された図示しないストレージ装置の共有領域に管理機器登録テーブル２２２を格納して、管理サーバ１０１とポーリングスレッド用サーバ１５１で共有してもよい。この場合、管理サーバ１０１とポーリングスレッド用サーバ１５１が、管理機器登録テーブル２２２を共有しており、ポーリングスレッド用サーバ１５１が管理機器登録テーブル２２２に対して、直接取得結果を反映する場合は、ステップ２６０２とステップ２６０３における取得結果の受信と反映は省略しても良い。

図３０は、ポーリングスレッド用サーバ１５１の制御部１１０Ａに含まれる情報送受信部２５０１の処理の一例を示すフローチャートである。

ステップ２７０１では、情報送受信部２５０１が管理サーバ１０１から情報を取得する管理対象機器と、管理対象機器の取得順序を受信し、取得順序テーブル２５０３（図３２参照）に格納する。

ステップ２７０２では、情報送受信部２５０１が情報取得部２１３へ取得順序テーブル２５０３の内容に基づいて、管理対象機器の情報取得を行うように指示を出す。情報取得部２１３は、前記第１実施形態と同様に情報取得ポーリングスレッド２３１を取得順序テーブル２５０３の順序で管理対象機器に割り当て、順次管理対象機器の構成情報を取得する。

ステップ２７０３では、情報送受信部２５０１が情報取得ポーリングスレッド２３１から情報を取得すると一時管理機器登録テーブル２５０２に登録させる。

ステップ２７０４では、情報送受信部２５０１が情報の取得が全ての管理対象機器について終了した時点で、管理サーバ１０１に完了通知と、一時管理機器登録テーブル２５０２の情報を送信する。

管理サーバ１０１は、上述のようにポーリングスレッド用サーバ１５１から受信した構成情報を、管理機器登録テーブル２２２へ反映させる。

図３１Ａ、図３１Ｂは、一時管理機器登録テーブル２５０２の一例を示す。一時管理機器登録テーブル２５０２は、ポーリングスレッド用サーバ１５１が情報取得をして、取得した情報を管理サーバ１０１に送信するまで、情報を格納しておくテーブルである。一時管理機器登録テーブル２５０２は、図６Ａ、図６Ｂに示した管理サーバ１０１が保持する管理対象機器登録テーブル２２２と比較して、関連グループ情報（カラム６１１）と登録状態情報（カラム６１２）が無い点が異なるのみで、他のカラムについても構成は同様である。

図３２は、取得順序テーブル２５０３の一例を示す。取得順序テーブル２５０３は、ポーリングスレッド用サーバ１５１が、情報取得を行う際に参照するテーブルである。取得順序テーブル２５０３は、前記第１実施形態の図１９に示したポーリングスレッド割当テーブル２２８の情報の内、ポーリングスレッド用サーバ１５１に割り当てられた分である。

取得順序テーブル２５０３は、ポーリングスレッド用サーバ１５１が生成した情報取得ポーリングスレッド２３１が情報取得を行う管理対象機器の情報を格納しており、情報取得部２１３は、取得順序テーブル２５０３を参照し、管理対象機器から情報の取得を実行する。

取得順序テーブル２５０３のカラム２９０１は、取得番号を格納する。取得番号は、情報取得ポーリングスレッド２３１が情報取得を行う際に参照する順番を示しており、本実施形態では、取得番号が小さな値を割り振られている行から順に情報取得を行う。

取得順序テーブル２５０３のカラム２９０２は、情報取得ポーリングスレッド２３１が情報取得を行う管理対象機器の識別子（ノードＩＤ）を格納する。

以上のように第４実施形態では、一以上のポーリングスレッド用サーバ１５１で情報取得ポーリングスレッド２３１を生成し、情報取得を行わせることで、管理サーバ１０１の情報取得にかかる負荷を軽減することを可能とする。

Claims

プロセッサとメモリとインターフェースを備えた管理計算機と、前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機がネットワークを介して前記計算機の情報を取得する情報取得方法であって、
前記管理計算機が、前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する第１のステップと、
前記管理計算機が、情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する第２のステップと、
前記管理計算機が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する第３のステップと、
前記情報を取得する指令に基づいて情報取得実行部が、前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で前記グループ毎の計算機の情報を取得する第４のステップと、
を含むことを特徴とする情報取得方法。
請求項１に記載の情報取得方法であって、
前記第１のステップは、
前記管理計算機が、前記グループに対する制約条件を設定する第５のステップと、
前記管理計算機が、前記グループと前記制約条件とを結び付ける第６のステップと、を含み、
前記管理計算機は、前記情報取得実行部で前記グループの前記計算機から情報を取得した時刻が、前記制約条件を満たすか否かを判定する第７のステップと、
前記管理計算機が、前記判定結果が前記制約条件を満たしていないときには、前記グループに属する前記計算機の情報の取得を再度実行する第８のステップと、
をさらに含むことを特徴とする情報取得方法。
請求項１に記載の情報取得方法であって、
前記第４のステップは、
前記計算機から障害情報を検出して、前記障害情報を発行した前記計算機と関連する前記グループを特定する第９のステップと、
前記特定したグループに属する前記計算機の情報取得の順序を変更する第１０のステップと、
を含むことを特徴とする情報取得方法。
請求項１に記載の情報取得方法であって、
前記第３のステップは、
前記管理計算機が、前記決定された順序で計算機の情報を取得する指令を第１の計算機へ出力し、
前記第４のステップは、
前記第１の計算機は前記情報取得実行部を有して、前記決定された順序で前記グループ毎の計算機の情報を取得し、前記情報の取得結果を前記管理計算機へ送信する第１１のステップと、
前記管理計算機は、前記第１の計算機から前記情報の取得結果を受信する第１２のステップと、
を含むことを特徴とする情報取得方法。
請求項１に記載の情報取得方法であって、
前記第１のステップは、
前記管理計算機が、予め設定されたポリシー情報に基づいて、前記複数の計算機のうち、情報を取得する計算機のグループを抽出して前記取得グループ情報に設定することを特徴とする情報取得方法。
プロセッサとメモリとインターフェースを備えた管理計算機と、
前記管理計算機と複数の計算機を接続するネットワークと、を備えて前記管理計算機が前記ネットワークを介して前記計算機の情報を取得する計算機システムであって、
前記管理計算機は、
前記複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する取得グループ生成部と、
情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する取得順序決定部と、
前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する情報取得部と、
前記情報を取得する指令に基づいて、前記決定された順序で前記グループ毎の計算機の情報を取得する情報取得実行部と、
を備えたことを特徴とする計算機システム。
請求項６に記載の計算機システムであって、
取得グループ生成部は、
前記グループに対する制約条件を設定して、前記グループと前記制約条件とを結び付け、
前記情報取得部は、前記情報取得実行部で前記グループの前記計算機から情報を取得した時刻が、前記制約条件を満たすか否かを判定し、前記判定結果が前記制約条件を満たしていないときには、前記グループに属する前記計算機の情報の取得を再度実行することを特徴とする計算機システム。
請求項６に記載の計算機システムであって、
前記管理計算機は、
前記計算機から障害情報を検出して、前記障害情報を発行した前記計算機と関連する前記グループを特定する障害情報検出部をさらに有し、
前記取得順序決定部は、
前記特定したグループに属する前記計算機の情報取得の順序を変更することを特徴とする計算機システム。
請求項６に記載の計算機システムであって、
前記情報取得部は、
前記決定された順序で計算機の情報を取得する指令を第１の計算機へ出力し、
前記第１の計算機は前記情報取得実行部を有して、前記決定された順序で前記グループ毎の計算機の情報を取得し、前記情報の取得結果を前記管理計算機へ送信し、
前記管理計算機は、前記第１の計算機から前記情報の取得結果を受信することを特徴とする計算機システム。
請求項６に記載の計算機システムであって、
前記取得グループ生成部は、
予め設定されたポリシー情報に基づいて、前記複数の計算機のうち、情報を取得する計算機のグループを抽出して前記取得グループ情報に設定することを特徴とする計算機システム。
プロセッサとメモリとインターフェースを備えた管理計算機であって、
前記管理計算機は、
ネットワークを介して接続された複数の計算機のうち、情報を取得する計算機のグループを取得グループ情報に設定する取得グループ生成部と、
情報の取得対象とするグループの順序を決定した後に、前記情報の取得対象とする計算機のグループ内の順序を決定する取得順序決定部と、
前記決定された情報の取得対象とするグループの順序と前記情報の取得対象とする計算機のグループ内の順序で計算機の情報を取得する指令を出力する情報取得部と、
前記情報を取得する指令に基づいて、前記決定された順序で前記グループ毎の計算機の情報を取得する情報取得実行部と、
を備えたことを特徴とする管理計算機。