JP6675023B2 - 計算機システムを管理する管理システム - Google Patents

計算機システムを管理する管理システム Download PDF

Info

Publication number
JP6675023B2
JP6675023B2 JP2019049353A JP2019049353A JP6675023B2 JP 6675023 B2 JP6675023 B2 JP 6675023B2 JP 2019049353 A JP2019049353 A JP 2019049353A JP 2019049353 A JP2019049353 A JP 2019049353A JP 6675023 B2 JP6675023 B2 JP 6675023B2
Authority
JP
Japan
Prior art keywords
resource
graph
resources
metric
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019049353A
Other languages
English (en)
Other versions
JP2019125387A (ja
Inventor
俊輔 上坂
俊輔 上坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019049353A priority Critical patent/JP6675023B2/ja
Publication of JP2019125387A publication Critical patent/JP2019125387A/ja
Application granted granted Critical
Publication of JP6675023B2 publication Critical patent/JP6675023B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、概して、複数のリソースタイプのリソースを含む複数のリソースを有する計算機システムの管理に関する。
近年、ITシステム(例えばクラウド基盤)について、「CPU」や「メモリ」等の物理リソースを「仮想マシン」や「ボリューム」などの論理リソースの単位でユーザに割り当てて運用していることが多くなっている。ユーザリソース(例えばユーザが認識する論理リソース)とシステムリソース(例えばユーザが認識しない物理リソース)の関係が複雑となっているITシステムの性能情報を監視するために、ベースライン監視等のシステム監視技術を用いてITシステムの運用を行う技術が存在する。この種の技術では、IT基盤システムにおける特定のリソース(例えば異常が発生したリソース)の性能情報のグラフを表示することができる。例えば、特許文献1の技術によれば、複数の仮想計算機が物理リソースを共有するシステムで、物理リソースの割当ポリシ、ソフトウェアへの影響を考慮してボトルネックを判定することができる。
特開2010-250689号公報
以下、管理対象の計算機システムにおける少なくとも1つのリソースに関する情報の表示を、便宜上、「リソース表示」と言うことがある。
特許文献1の技術によれば、着目された物理リソースを使用する複数のLPARにそれぞれ対応した複数のリソース使用量が積み上げられたグラフが表示される。このグラフから、複数のLPARのうちボトルネックのLPARを特定することができる。つまり、1つの物理リソースを基点としたリソース表示を行うことはできる。しかし、異なる2以上のリソースを基点としたリソース表示を行うことはできない。
ボトルネックの特定を目的として、リソースのツリー構造の表示、つまりトポロジー表示を採用することが考えられる。トポロジー表示では、各リソースの状態を表示可能である。しかし、表示されるリソース状態は、或る時点の状態にすぎず、且つ、複数段階の状態のうちのいずれかの状態にすぎない。つまり、グラフのような時系列表示に比べて、情報量が落ちてしまう。
管理システムが、2以上のリソースを基点とした時系列変化一覧を表示する。時系列変化一覧は、1以上の第1ラインと2以上の第2ラインとを含んだマトリクスである。各第1ラインは、第1方向に平行に並んだ時系列変化オブジェクトである。各第2ラインは、第1方向と直交する第2方向に平行に並んだ時系列変化オブジェクトである。2以上の第2ラインは、2以上の基点リソースがそれぞれ関連付けられている。1以上の第1ラインは、2以上の基点リソースの1以上の関連リソースに対応した1以上のメトリックタイプがそれぞれ関連付けられている。m番目の第1ラインとn番目の第2ラインとに対応した時系列変化オブジェクトは、n番目の第2ラインに関連付いた基点リソースの関連リソースについてm番目の第1ラインに関連付いたメトリックタイプのメトリック値の時系列変化を表す。
2以上のリソースを基点とした視認性の高いリソース表示が実現される。
実施例1に係る計算機システム及び管理システムの構成を示す。 計算機システムのトポロジーの一部の一例を示す。 リソーステーブルの一例を示す。 関連リソーステーブルの一例を示す。 リソースタイプテーブルの一例を示す。 メトリックタイプテーブルの一例を示す。 時系列データテーブルの一例を示す。 行順序テーブルの一例を示す。 列順序テーブルの一例を示す。 閾値テーブルの一例を示す。 トポロジー画面の一例を示す。 グラフ一覧画面の一例を示す。 メトリックタイプ絞込み処理後且つグラフ行並び替え後のグラフ一覧画面の一例を示す。 グラフ列並び替え後のグラフ一覧画面の一例を示す。 強調表示処理後のグラフ一覧画面の一例を示す。 実施例1に係るグラフ一覧表示処理の流れを示す。 実施例2に係る計算機システム及び管理システムの構成を示す。 時系列スコアテーブルの一例を示す。 メトリックタイプ絞込み処理の説明図である。 グラフ行並び替え処理の説明図である。 グラフ列並び替え処理の説明図である。 実施例2に係るグラフ一覧表示処理の流れを示す。
以下、幾つかの実施例を説明する。
なお、以下の説明では、「abcテーブル」の表現にて情報を説明することがあるが、情報は、テーブル以外のデータ構成で表現されていてもよい。データ構成に依存しないことを示すために「abcテーブル」のうちの少なくとも1つを「abc情報」と呼ぶことができる。
また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)及び/又は通信インターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主語がプロセッサとされてもよい。プログラムを主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理としてもよい。また、プロセッサは、処理の一部または全部を行うハードウエア回路を含んでもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサ(例えばCPU)と記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムとを記憶している。そして、プログラム配布サーバのプロセッサが配布プログラムを実行することで、プログラム配布サーバのプロセッサは配布対象のプログラムを他の計算機に配布する。
また、管理システムは、一以上の計算機で構成されてよい。具体的には、例えば、管理計算機が情報を表示する場合(具体的には、管理計算機が自分の表示デバイスに情報を表示する、或いは、管理計算機が表示用情報を遠隔の表示用計算機に送信する場合)、管理計算機が管理システムである。また、例えば、複数の計算機で管理計算機と同等の機能が実現されている場合は、当該複数の計算機(表示を表示用計算機が行う場合は表示用計算機を含んでよい)が、管理システムである。計算機への情報の入力や、計算機からの情報の出力は、計算機が有する入出力デバイスにより行われてよい。入出力デバイスの例としては、表示デバイス、キーボード及びポインティングデバイスが考えられるが、これらのうちの少なくとも1つに代えて又は加えて別のデバイスが採用されてよい。また、入出力デバイスの代替として、シリアルインターフェースデバイスやイーサーネットインターフェースデバイス(イーサネットは登録商標)が採用され、そのようなインターフェースデバイスに、表示デバイスとキーボード及びポインタデバイスとを有する表示用計算機が接続され、計算機が表示用情報を表示用計算機に送信したり、計算機が入力用情報を表示用計算機から受信したりすることで、情報の出力(例えば表示)及び入力が行われてよい。以下の説明では、管理サーバ557が管理計算機であり、管理クライアント555が表示用計算機である。
また、以下の説明において、「リソース」とは、計算機システムの構成要素を意味し、具体的には、計算機システムを構成する複数のノード(装置)の各々、及び、各ノードが有する複数のコンポーネントの各々の総称である。ノードとして、物理的なノード(例えばネットワークスイッチ)もあれば論理的なノード(例えば仮想マシン)もある。同様に、コンポーネントとして、物理的なコンポーネント(例えばマイクロプロセッサ)もあれば論理的なコンポーネント(例えばLDEV(論理ボリューム))もある。すなわち、リソースとしては、物理リソースと論理リソースとがある。物理リソースは、例えば、物理CPU及び物理メモリ等である。論理リソースは、1以上の物理リソースの少なくとも一部が割り当てられたリソース、及び、1以上の物理リソースの少なくとも一部を使用するリソースのうちの少なくとも1つに該当するリソースである。論理リソースは、例えば、APP、論理ボリューム及びVM(Virtual Machine)等である。
また、以下の説明において、リソースの「関連リソース」(リソースに関連するリソース)とは、リソースに直接的又は間接的にリンクしたリソースである。リソースに関連リソースが「直接的に」リンクしている場合、リソースと関連リソースの間に他のリソースが介在せず、リソースに関連リソースが「間接的に」リンクしている場合、リソースと関連リソースの間に他の1以上のリソースが介在する。リソースよりも上位の関連リソースを、「上位関連リソース」と言うことができ、リソースよりも下位の関連リソースを、「下位関連リソース」と言うことができる。また、上位関連リソースのうち、リソースに直接的にリンクしている関連リソースを「親リソース」と言うことができ、下位関連リソースのうち、リソースに直接的にリンクしている関連リソースを「子リソース」と言うことができる。なお、「上位/下位」や「親/子」の概念は、ユーザが何を管理(例えば監視)する立場であるかによって変化する場合があり、また省略されてもかまわない。例えば、関連が、サーバとストレージシステムとのFC(Fibre Channel)スイッチを介した「接続関係」の場合、単に接続されているというレベルで見ればサーバとストレージシステムはどちらが上位や親かは一意に定まるものではなく、ユーザの立場によってサーバを上位と考えるか、ストレージシステムを上位と考えるか、又は上下という概念を持ち込まないかが決まってよい。反対に、関連が、包含(例えばノードがコンポーネントを含む)場合は、ノードの下位(又は子)はコンポーネントであるという概念はユーザの立場によらず共通である場合が多い。
また、以下の説明では、リソースの識別情報として、名前或いはIDが使用されるが、それらは相互に置換可能であってもよいし、それらのうちの少なくとも1つに代えて又は加えて他種の識別情報が使用されてもよい。
また、以下の説明では、計算機システムの管理画面としてのGUI(Graphical User Interface)に対してユーザ(例えば管理者)が入力デバイスを使用して行う操作を、「ユーザ操作」と言う。ユーザ操作に使用される入力デバイスは、一般に、ポインティングデバイス或いはタッチスクリーンである。以下の実施例において、管理システムのプロセッサは、情報の入出力(例えば、GUIの表示、GUIに入力された情報の受付等)を、インターフェース部を介して行うことができる。インターフェース部は、ネットワークインターフェース(例えば上記I/F537)、入力デバイスのためのインターフェースデバイス、及び、表示デバイスのためのインターフェースデバイスのうちの少なくとも1つを含んでよい。これらのインターフェースデバイスのうちの2以上のインターフェースデバイスが一体でもよい。
また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号における共通部分を使用し、同種の要素を区別して説明する場合は、要素のID(又は要素の参照符号)を使用することがある。例えば、後述の図12を参照してグラフ行を特に区別しないで説明する場合には、「グラフ行121」、「グラフ行121L」又は「グラフ行121P」と記載し、個々のグラフ行を区別して説明する場合には、「グラフ行121L1」、「グラフ行121L2」、「グラフ行121P1」、…のように記載することがある。
図1は、実施例1に係る計算機システム及び管理システムの構成を示す。
計算機システム100は、1以上のホスト553と、1以上のホスト553に接続された1以上のストレージシステム551とを含む。ストレージシステム551には、例えば、通信ネットワーク521(例えばSAN(Storage Area Network)又はLAN(Local Area Network))を介してホスト553が接続される。
ストレージシステム551は、物理記憶デバイス群563と、物理記憶デバイス群563に接続されたコントローラ561とを有する。
物理記憶デバイス群563は、1以上のPG(Parity Group)を有する。PGは、RAID(Redundant Array of Independent (or Inexpensive) Disks)グループと呼ぶこともある。PGは、複数の物理記憶デバイスで構成されており、所定のRAIDレベルに従いデータを記憶する。物理記憶デバイスは、例えば、HDD(Hard Disk Drive)或いはSSD(Solid State Drive)である。
ストレージシステム551は、複数の論理ボリュームを有する。論理ボリュームとしては、PGに基づく実体的な論理ボリューム(実ボリューム)565もあれば、シンプロビジョニング或いはストレージ仮想化技術に従う仮想的な論理ボリューム(仮想ボリューム)567もある。1つのストレージシステム551が必ずしも複数種類の論理ボリュームを有さないでよい。例えば、ストレージシステム551は、論理ボリュームとして、実ボリューム565のみを有してもよい。シンプロビジョニングに従う仮想ボリュームにはプールから記憶領域が割り当てられる。プールは、1以上の物理記憶デバイス(例えばPG)に基づく記憶領域群であり、例えば、1以上の論理ボリュームの集合でよい。プールは、シンプロビジョニングに従う仮想ボリュームに割り当てられる記憶領域を有するプールに代えて、オリジナルの論理ボリュームとそのスナップショットとの差分が格納されるプールでもよい。
コントローラ561は、複数のデバイス、例えば、ポート、MPB(1又は複数のマイクロプロセッサ(MP)を有するブレード(回路基板))及びキャッシュメモリを有している。例えば、ポートが、ホスト553からI/O(Input/Output)コマンド(ライトコマンド又はリードコマンド)を受信し、MPBが有するMPが、そのI/Oコマンドに従うデータのI/Oを制御する。具体的には、例えば、MPは、受信したI/OコマンドからI/O先の論理ボリュームを特定し、特定した論理ボリュームに対してデータのI/Oを行う。論理ボリュームに対してI/Oされるデータは、一時的に、キャッシュメモリに格納される。
ホスト553は、物理マシン(物理計算機)でも仮想マシン(VM)でもよい。ホスト553で、1以上のアプリケーションプログラム(APP)552が実行される。APP552が実行されることにより、論理ボリュームを指定したI/Oコマンドがホスト553からストレージシステム551に送信する。
以上のように、計算機システム100は、階層的な複数のリソースを有する。複数のリソースは、具体的には、APP552、ホスト553、ストレージシステム551、コントローラ561、ポート、MPB、キャッシュメモリ、論理ボリューム及びPG等のうちの2つのリソースタイプ以上のリソースを含む。同じレイヤの複数のリソースがグループ化されることでそのレイヤのリソースより上位レイヤのリソースが定義されてもよい。「リソース」は、APPや論理ボリュームのような実体的なリソース(論理リソースと物理リソースのいずれでもよい)と、複数の実体的なリソースのグループである仮想的なリソースとがあってよい。
管理システムは、管理サーバ557と、管理サーバ557に接続された1以上の管理クライアント555とを含む。管理サーバ557には、通信ネットワーク(例えばLAN、WAN(World Area Network)又はインターネット)521を介して、管理クライアント555が接続される。
管理クライアント555は、入力デバイス501、表示デバイス502、記憶デバイス(例えばメモリ)505、通信インターフェースデバイス(以下、I/F)507、及び、それらに接続されたプロセッサ(例えばCPU(Central Processing Unit))503を有する。入力デバイス501は、例えば、ポインティングデバイス及びキーボードである。表示デバイス502は、例えば、情報が表示される物理画面を有するデバイスである。入力デバイス501及び表示デバイス502が一体となったタッチスクリーンが採用されてもよい。I/F507は、通信ネットワーク521に接続され、I/F507を介して、管理クライアント555は管理サーバ557と通信することができる。なお、通信ネットワーク521と、ホスト553とストレージシステム551と、を接続するネットワークとは一部または全てが共通であってもよい。
記憶資源505は、例えば、主記憶デバイス及び補助記憶デバイスのうちの少なくとも主記憶デバイス(典型的にはメモリ)を有する。記憶資源505は、プロセッサ503で実行されるコンピュータプログラム、及び、プロセッサ503に使用される情報を記憶することができる。具体的には、例えば、記憶資源505は、Webブラウザ511、及び、管理クライアントプログラム513を記憶する。管理クライアントプログラム513は、RIA(Rich Internet Application)でよい。具体的には、例えば、管理クライアントプログラムは、プログラムファイルであり、管理サーバ557(或いは他の計算機)からダウンロードされ、記憶資源505に記憶されてよい。
管理サーバ557は、記憶資源535、I/F537、及び、それらに接続されたプロセッサ(例えばCPU(Central Processing Unit))533を有する。I/F537は、通信ネットワーク521に接続され、I/F537を介して、管理サーバ557は管理クライアント555と通信することができる。管理サーバ557は、I/F537を介して、ユーザ操作に従う指示を受信したり、レイアウト領域に表示オブジェクトを描画したりすることができる。このため、I/F537は、I/Oインターフェースデバイスの一例である。なお、ここで言う「レイアウト領域」とは、表示オブジェクトが描画され得る領域である。レイアウト領域の全部又は一部の範囲が、Webブラウザ511(又は管理クライアントプログラム513)によって表示されるフレーム(例えばウィンドウ)での表示範囲である。表示オブジェクトが描画されたレイアウト領域の、上記フレーム内における表示イメージ(表示オブジェクトを含む)を、表示画面又はGUI画面と言うことができる。レイアウト領域に描画されたオブジェクトのうち、表示範囲に重なるオブジェクトが、表示デバイス502の物理画面上に表示される。このため、レイアウト領域にオブジェクトを描画することは、実質的に、オブジェクトを表示することの一例である。
記憶資源535は、例えば、主記憶デバイス及び補助記憶デバイスのうちの少なくとも主記憶デバイス(典型的にはメモリ)を有する。記憶資源535は、プロセッサ533で実行されるコンピュータプログラム、及び、プロセッサ533に使用される情報を記憶することができる。具体的には、例えば、記憶資源535は、管理サーバプログラム541及び管理テーブル群543を記憶する。管理テーブル群543は、計算機システムが有する複数のリソースの階層関係(構成情報)や、各リソースの障害情報等を含む。管理テーブル群543の少なくとも一部の情報は、管理サーバプログラム541により収集されてもよいし、情報を保有する他の管理システムにアクセスすることで取得してもよい。管理サーバプログラム541は、ユーザ操作に従う指示を管理クライアント555から受信したり、レイアウト領域に描画される情報を管理クライアント555に送信したりする。管理サーバプログラム541は、表示制御を実行する表示制御プログラム130を含む。表示制御プログラム130は、管理テーブル群543の少なくとも一部を参照して表示を制御する。具体的には、例えば、表示制御プログラム130は、後述のグラフ一覧画面を表示するグラフ一覧表示モジュール131と、後述の強調表示を行う強調表示モジュール132とを含む。本実施例では、表示制御プログラム130が行う処理のうち、強調表示モジュール132が行う処理以外の処理は、グラフ一覧表示モジュール131により行われる。本実施例では、説明の冗長を避けるため、表示制御プログラム130は、管理サーバプログラム541に含まれているとする。しかし、表示制御は、管理テーブル群543のうち、表示制御プログラム130以外の機能により収集又は更新された情報に基づき行うことができる。このため、表示制御プログラム130は、管理サーバプログラム541の外にあってもよい(例えば、追加的にインストールされたプログラムでもよい)。
管理サーバプログラム541と、Webブラウザ511(またはクライアントのRIA実行環境)と、管理クライアントプログラム513と、の連携処理によって、ユーザ操作に応じたGUI画面表示が実現される。管理サーバプログラム541が、画面を作成し、作成した画面の表示用情報を管理クライアントプログラム513に提供し、管理クライアントプログラム513が、その表示用情報を基に画面を表示してもよいし、画面作成処理の一部(例えば描画処理)が管理サーバプログラム541から管理クライアントプログラム513にオフロードされてもよい。連携の例としては以下がある。説明の簡略化のために、本実施例において(連携例2)が採用される場合を説明するが、連携例1にも適用可能であることは言うまでもない。
(連携例1)管理サーバプログラム541が、管理テーブル群543が有する情報の少なくとも一部を、Webブラウザ511(又は管理クライアントプログラム513)に送信し、それを、Webブラウザ511(又は管理クライアントプログラム513)が一時情報として記憶資源505に格納する。Webブラウザ511(又は管理クライアントプログラム513)が、ユーザ操作に従う指示と一時情報とを基に、レイアウト領域に表示オブジェクトを描画する(例えば、表示オブジェクトを新規描画、拡大又は縮小する)。
(連携例2)管理サーバプログラム541が、表示画面に対するユーザ操作に従う指示をWebブラウザ511(又は管理クライアントプログラム513)から受け、その指示と管理テーブル群543とを基に表示オブジェクトの表示用情報を作成し、その表示用情報を送信する。Webブラウザ511(又は管理クライアントプログラム513)は、表示用情報を受信し、その表示用情報に従い表示オブジェクトをレイアウト領域に描画する。つまり、端的に言えば、管理サーバプログラム541が、レイアウト領域に表示オブジェクトを描画する。Webブラウザ511(又は管理クライアントプログラム513)は、GUI画面に対するユーザ操作がされたら、そのユーザ操作に従う指示を管理サーバプログラム541に送信する。
以下、冗長な説明を避けるために、表示の制御は管理サーバプログラム541(表示制御プログラム130)により行われるとする。
図2は、計算機システム100のトポロジーの一部の一例を示す。
複数のレイヤとして、例えば、上位レイヤから順に、LAN、Server、SAN及びStorageがある。レイヤ「LAN」に属するリソースは、「IP-Switch」(LANにおけるIPスイッチ)である。レイヤ「Server」に属するリソースは、「VM」、「HV」及び「DS」である。「VM」は、仮想マシンである。「HV」は、1又は複数の仮想マシンを制御しホストで実行されるハイパバイザである。HV(例えばHV4)に含まれるリソースの一例として、CPUとDISK(物理記憶デバイスの一例)がある。複数のHVが1つのクラスタ(「Cluster」)を構成する。クラスタも、リソースの1つであってよい。「DS」は、ハイパバイザから記憶デバイスとして認識されるデータストアである。レイヤ「SAN」に属するリソースは、「FC-Switch」(SANにおけるFC(Fibre Channel)スイッチ)である。レイヤ「Storage」に属するリソースは、「Storage」(ストレージシステム)である。Storage(例えばStorage#02)に含まれるリソースの一例として、ストレージシステムにおける複数のコンポーネント、例えば、「Port」、「LDEV」、「MP」、「Pool」及び「PG」がある。「Port」は、FCスイッチに接続されVMからI/Oコマンドを受け付ける通信ポートである。「LDEV」は、論理ボリューム(実ボリューム又は仮想ボリューム)である。「MP」は、マイクロプロセッサである。「Pool」は、仮想ボリュームにシンプロビジョニングに従い割り当てられる実領域を含んだ記憶領域である。「PG」は、パリティグループである。
図2に示したようなトポロジー構成は、管理テーブル群543が表す構成情報から特定される構成である。1又は複数のリソースタイプが1つのレイヤに属してもよい。同一リソースタイプの2以上のリソースにより1つのグループが構成されてもよく、その場合、1つのリソースタイプについて異なる複数のグループが存在し、グループ毎に、そのリソースタイプの1以上のリソースが存在してもよい。つまり、「レイヤ」は、異なるリソースタイプの集約であり、「グループ」は、同一リソースタイプでの異なるリソースの集約である。レイヤ及びグループのうちの少なくとも一方がユーザにより定義されてもよい。
以下、図3〜図10を参照して、管理テーブル群543に含まれるテーブルの一例を説明する。
図3は、リソーステーブルの一例を示す。
リソーステーブル400は、リソースに関する情報を有する。リソーステーブル400は、例えば、リソース毎にレコードを有する。各レコードが、リソースID、リソース名、及びリソースタイプIDを有する。
図4は、関連リソーステーブルの一例を示す。
関連リソーステーブル500は、リソース同士の関連を表す。例えば、関連リソーステーブル500は、リソース毎にレコード有し、各レコードは、リソースID及び子リソースID(リソースの子リソースのID)を有する。管理サーバプログラム541は、選択されたリソースのIDを用いて、関連リソーステーブル500から、選択されたリソースの関連リソースを特定できる。例えば、管理サーバプログラム541は、選択されたリソースのIDをリソースIDとして有するレコードを基点に関連リソーステーブル500から特定されるレコードから、下位関連リソースを特定でき、選択されたリソースのIDを子リソースIDとして有するレコードを基点に関連リソーステーブル500から特定されるレコードから、上位関連リソースを特定できる。関連リソーステーブル500の各レコードは、子リソースIDに代えて又は加えて親リソースIDを有していてもよい。
図5は、リソースタイプテーブルの一例を示す。
リソースタイプテーブル550は、リソースタイプに関する情報を有する。例えば、リソースタイプテーブル550は、リソースタイプ毎にレコード有し、各レコードは、リソースタイプID、リソースタイプ名、属性(論理リソースと物理リソースのどちらであるか)、及び、レイヤ名(リソースタイプが属するレイヤの名前)を有する。
図6は、メトリックタイプテーブルの一例を示す。
メトリックタイプテーブル600は、メトリックタイプに関する情報を有する。メトリックタイプテーブル600は、例えば、メトリックタイプ毎にレコードを有する。各レコードが、メトリックタイプID、メトリックタイプ名及びリソースタイプID(メトリックタイプに属するメトリック値が収集されるリソースのリソースタイプのID)を有する。
なお、本実施例において、「メトリック値」は、リソースについて収集された値であり、例えば、性能及びリソース消費量のうちの少なくとも1つの値である。メトリック値の優劣は、メトリックタイプに依存する。例えば、メトリックタイプがレスポンスタイムの場合、メトリック値が小さいほど優れており、メトリック値が大きいほど劣る。メトリックタイプがデータ転送速度の場合、メトリック値が大きいほど優れており、メトリック値が小さいほど劣る。
また、本実施例において、メトリックタイプIDとリソースタイプIDは1:1又は多:1で対応する。すなわち、1つのリソースタイプにつき、メトリックタイプは1又は複数存在するが、1つのメトリックタイプが複数のリソースタイプに対応することはない。しかし、本発明はそれに限定されず、例えば、1つのメトリックタイプが複数のリソースタイプに対応していてもよい。
図7は、時系列データテーブルの一例を示す。
時系列データテーブルは、時系列情報の一例であり、リソースについて収集されたメトリックデータを有するテーブルである。時系列データテーブルの各レコードは、1件のメトリックデータに含まれる情報を有する。具体的には、例えば、各レコードは、リソースID(収集されたメトリック値に対応したリソースのID)、メトリックタイプID(収集されたメトリック値のメトリックタイプのID)、取得時刻(収集されたメトリック値が取得された時刻(メトリックの収集時刻でもよい))、及び、メトリック値を有する。時刻は、年月日時分秒で表現されているが、表現方式はそれに限られない。
図8は、行順序テーブルの一例を示す。図9は、列順序テーブルの一例を示す。
行順序テーブル800は、グラフマトリクスのグラフ行の順序を表すテーブルである。行順序テーブル800は、例えば、グラフ行毎にレコードを有する。各レコードは、行番号(グラフ行の番号)と、メトリックタイプIDとを有する。先頭のグラフ行の行番号が最も小さい番号である。本実施例では、先頭のグラフ行は、一番上のグラフ行であるが、それ限られないでもよい。本実施例では、行番号が小さいほど上位であるが、行番号が大きいほど上位であってもよい。
列順序テーブル900は、グラフマトリクスのグラフ列の順序を表すテーブルである。列順序テーブル900は、例えば、グラフ列毎にレコードを有する。各レコードは、列番号(グラフ列の番号)と、リソースIDとを有する。先頭のグラフ列の列番号が最も小さい番号である。本実施例では、先頭のグラフ列は、一番左のグラフ列であるが、それ限られないでもよい。本実施例では、列番号が小さいほど上位であるが、列番号が大きいほど上位であってもよい。
なお、「グラフマトリクス」とは、グラフ一覧を表示したマトリクスであり、グラフ行とグラフ列で構成されている。「グラフ行」とは、メトリックタイプが関連付けられた行である。「グラフ列」とは、リソースが関連付けられた列である。グラフ行とグラフ列の交点(交差エリア)を「セル」と言う。セルに、そのセルを有するグラフ行に関連付けられたメトリックタイプのメトリック値の時系列変化を表すグラフが、そのセルを有するグラフ列に関連付けられたリソースに関して表示される。グラフマトリクスについては後に詳細に説明する。
図10は、閾値テーブルの一例を示す。
閾値テーブル1000は、メトリック値と比較される閾値に関する情報を有する。閾値テーブル1000は、例えば、リソースとメトリックタイプとの組毎に、レコードを有する。各レコードは、リソースID、メトリックタイプID、警告閾値及び異常閾値を有する。警告閾値は、第1の閾値の一例である。異常閾値は、第2の閾値の一例である。第2の閾値は、第1の閾値より悪い。第1の閾値より悪い第2の閾値が、第1の閾値よりも大きいか小さいかは、メトリックタイプに依存する(つまり、優劣とメトリック値の大小との関係に依存する)。少なくとも1つの組(リソースとメトリックタイプとの組)について、閾値は、2つに限らず、1つであっても3つ以上であってもよい。また、閾値は、メトリックタイプ毎に用意されてもよい(言い換えれば、リソースIDは少なくとも1つのメトリックタイプについて関連付けられていなくてもよい)。
以上の図3〜図10に示したテーブルを含む管理テーブル群543を基に、リソース表示が行われる。「リソース表示」とは、計算機システム100における少なくとも1つのリソースに関する情報の表示である。リソース表示として、トポロジー表示とグラフ一覧表示とがある。トポロジー表示がされた画面(例えばGUI)を、「トポロジー画面」と言い、グラフ一覧表示がされた画面を、「グラフ一覧画面」と言う。トポロジー画面及びグラフ一覧画面のいずれも、表示制御プログラム130により表示される。また、トポロジー画面及びグラフ一覧画面のいずれについても、ユーザ操作(例えばクリック)の受付、及び、そのユーザ操作に応じた画面更新は、表示制御プログラム130により行われる。
以下、本実施例で行われる処理の一例を説明する。なお、以下の説明では、説明の冗長を避ける目的で、表示が「管理サーバ557(管理サーバプログラム541)により」行われることの記載を省略することがある。また、以下の説明は、主に、表示の制御に関する処理の説明を含む。表示の制御に関する処理は、表示制御プログラム130により(例えば、表示制御プログラム130が管理サーバプログラム541のうちの表示制御プログラム130以外のプログラム(図示せず)と協働することにより)行われる。表示の制御に関する処理では、適宜、管理テーブル群543における少なくとも1つのテーブルが表示制御プログラム130により参照される。表示の制御に関する処理以外の処理、例えば、計算機システム100における複数のリソースの各々のメトリックデータを収集する処理と、収集されたメトリックデータの少なくとも一部の情報を含んだレコードを時系列データテーブル700に追加する処理は、管理サーバプログラム541のうちの表示制御プログラム130以外のプログラム(図示せず)により行われてよい。
図11は、トポロジー画面の一例を示す。
表示制御プログラム130により、トポロジー画面51が表示される。トポロジー画面51は、リソース選択画面(複数のリソースを選択可能に表示した画面)の一例である。トポロジー画面51には、計算機システム100のトポロジー114が表示される。トポロジー114は、ノードとリンクを有するツリー構造である。ノードは、リソースオブジェクト110である。リソースオブジェクト110は、リソースに対応した表示オブジェクト(例えば方形のオブジェクト)である。リソースオブジェクト110内に、例えば、そのリソースオブジェクト110に対応したリソースのリソース名(例えば「IP Switch 12」)が表示される。リンクは、リソース間の関連を表す。
表示制御プログラム130が、ユーザによるリソース選択、具体的には、トポロジー114におけるリソースオブジェクト110の選択をユーザから受け付ける。表示制御プログラム130が、リソースの選択を受け付けた場合、その選択されたリソースを含む2以上のリソースを基点としたグラフ一覧画面を表示する。
選択されるリソースの数は1でも2以上でもよい。ここでは、リソースオブジェクト「VM21」が選択され、その結果として、図12に例示するグラフ一覧画面53が表示されたとする。
また、トポロジー画面51は、リソース選択画面の一例である。表示制御プログラム130は、ユーザによるリソース選択に応答して、グラフ一覧画面を表示する。グラフ一覧画面では、2以上のリソース(1つのリソースでもよい)を基点としたグラフ一覧表示がされる。その2以上の基点リソース(基点とされたリソース)の各々は、選択リソース(リソース選択画面からユーザにより選択されたリソース)と、条件該当リソース(所定のリソース条件に該当したリソース)とのうちのいずれかである。つまり、2以上の基点リソースは、選択リソースと条件該当リソースとのうちの少なくとも1つを含む。リソース選択画面は、トポロジー画面51に限らず、リソースが選択可能に表示された画面であればよい。例えば、リソース選択画面は、計算機システム100のリソースの一覧画面でもよい。その一覧画面では、リソースオブジェクトが一覧表示されていてもよいし、リソース名がプルダウン等のメニューで一覧表示される画面でもよい。また、リソース選択画面(例えばトポロジー画面51)では、リソースの状態が表示されてよい。リソースの状態は、文字列、マーク(アイコン)及び強調表示(例えば、書体又は色の変更)等のいずれで表現されてもよい。例えば、トポロジー画面51において、警告閾値を超えたリソースのリソースオブジェクトに、状態「Warning」を意味するマークが表示されてよく、異常閾値を超えたリソースのリソースオブジェクトに、状態「Error」を意味するマークが表示されてよい。
図12は、グラフ一覧画面の一例を示す。
グラフ一覧画面53は、表示制御プログラム130内のグラフ一覧表示モジュール131により表示される。グラフ一覧画面53の概要は次の通りである。
すなわち、グラフ一覧画面53には、グラフマトリクス120が表示される。グラフマトリクス120は、上述したように、グラフ行121とグラフ列123で構成されている。破線枠が、1つのグラフ行121L1の範囲を表す枠である。一点鎖線枠が、1つのグラフ列123L1の範囲を表す枠である。グラフ行121は、典型的には複数存在するが、1つということもあり得る。
グラフ行121には、基点リソースに関連するリソースのリソースタイプに対応したメトリックタイプが関連付けられている。グラフ列123には、基点リソース(基点となるリソース)が関連付けられている。複数のセル(グラフ行121とグラフ列123の複数の交点(交差エリア))に、それぞれ、複数のグラフ129が表示される。つまり、列方向にも、行方向にも、グラフ129が並ぶ。複数のグラフ129の各々は、所定の時間帯におけるメトリック値の時系列変化を表す情報の一例である。グラフ129が表すメトリック値変化は、そのグラフ129が表示されるセルを有するグラフ行121に関連付けられているメトリックタイプのメトリック値(基点リソースに関連したリソースのメトリック値)の時系列変化である。グラフ129は、そのグラフ129が表示されるセルを有するグラフ列に関連付けられたリソースに関してのグラフである。グラフ129は、2次元直交座標系のグラフである。複数のグラフ129の各々において、横軸(x軸)は、時間軸であり、縦軸(y軸)は、数値軸(メトリック値軸)である。全てのグラフ129の時間軸(表示対象の時間帯)は同一である。また、各グラフ行において、そのグラフ行における全てのグラフ129の数値軸(表示対象のメトリック値範囲)は同一である。
グラフ一覧画面53によれば、2以上のリソースを基点としてリソース状態よりも情報量の多いメトリック値変化(時系列変化)が規則性を持って行列方向に並ぶ。つまり、2以上のリソースを基点とした視認性の高いリソース表示が実現される。
具体的には、基点リソース毎に、時間軸と直交する方向(ここでは列方向)に、同一時間軸(同一時間帯)の複数のグラフ129(異なる複数のメトリックタイプにそれぞれ対応した複数のグラフ129)が並ぶ。また、メトリックタイプ毎に、数値軸と直交する方向(ここでは行方向)に、同一数値軸(同一数値範囲)の2以上のグラフ129(2以上の基点リソースにそれぞれ対応した2以上のグラフ129)が並ぶ。これにより、同一基点リソースについて、複数のメトリックタイプのメトリック値変化の比較が容易であり、同一メトリックタイプについて、異なる2以上の基点リソースについてのメトリック値変化の比較が容易である。
これは、分析の容易性及び正確性のうちの少なくとも1つの向上に貢献することが期待される。
例えば、計算機システム100(例えば、大規模化又は複雑化したシステム)の監視において、リソースの障害が検出されたとする。この場合、トポロジー表示のようなリソース一覧表示においてリソースの状態が表示されたとしても、障害が検出されたリソースのボトルネックを迅速且つ正確に特定することは必ずしも容易ではない。なぜなら、表示されるリソース状態は、或る時点での状態であり、且つ、複数段階の状態のうちのいずれかの状態だからである。つまり、情報量が落ちているためである。
また、ボトルネックは、障害が検出されたリソースの稼働状況に代えて又は加えて、他のリソースの稼働状況が原因で生じている可能性もある。
以上のことから、リソース状態よりも多量の情報を表示するリソース表示を、2以上のリソースを基点として実現することが望ましい。リソース状態よりも多量の情報の一例として、メトリック値の時系列変化を表すグラフがあるが、上述した特許文献1の技術に従うグラフ表示では、2以上のリソースを基点としたリソース表示はされない。
そこで、本実施例によれば、2以上のリソースを基点とした視認性の高いリソース表示が実現される。ユーザは、同一基点リソースについて、複数のメトリックタイプのメトリック値変化を同一時間軸で比較でき(列方向に沿った視線移動)、同一のメトリックタイプ(同一リソースタイプ)について、2以上の基点リソースに関してのメトリック値変化を同一数値軸で比較できる(行方向に沿った視線移動)。これにより、障害の原因を迅速且つ正確に見つけることが期待できる。例えば、障害のボトルネックとしてのリソースを迅速に見つけることが期待できる。また、障害が検出されたリソースと同一リソースタイプのリソースのうち、ボトルネックの原因に比較的大きく影響したリソースを見つけることも期待できる。
以下、グラフ一覧画面53を詳細に説明する。
<グラフ行>
グラフ行121(例えば121L1)には、そのグラフ行121に関連付けられているメトリックタイプを表す情報(例えばメトリックタイプ名「VM CPU Load」)と、そのメトリックタイプに対応したリソースタイプを表す情報(例えばリソースタイプ名「VM」)とが表示される。
表示制御プログラム130が、ユーザ操作に応答して(例えば、ボタン126の押下に応答して)、そのグラフ行121L1に関連付けられるメトリックタイプに対応したリソースタイプについて、表示対象のメトリックタイプを追加することができる。メトリックタイプの追加は、同一のグラフ行について行われてもよいし、新たにグラフ行を追加することであってもよい。これは、他のグラフ行121についても同様である。なお、表示対象のメトリックタイプが追加された場合、表示制御プログラム130が、行順序テーブル800を更新する(具体的には、グラフ行121の行番号に対応したメトリックタイプIDを追加する、又は、行番号とメトリックタイプIDとを含んだ新たなレコードを追加する)。なお、1つのグラフ行121に2以上のメトリックタイプが関連付けられた場合、表示制御プログラム130は、その2以上のメトリックタイプのうち表示対象のメトリックタイプを1つに維持してもよいし、2以上のメトリックタイプのうちの2つ(又はそれより多く)のメトリックタイプを表示対象としてもよい。後者の場合、例えば、2以上のメトリックタイプが関連付けられているグラフ行121において、各グラフ129が、第1のメトリックタイプに対応した第1の数値軸(例えば左の縦軸)の他に、第2のメトリックタイプに対応した第2の数値軸(例えば右の縦軸)を有する。
表示制御プログラム130が、グラフ行121L1に関連付けられているメトリックタイプを、ユーザ操作に応答して変更することができる(例えば、プルダウンボタン127の押下に応答して表示されるメニューからユーザにより選択されたメトリックタイプに変更することができる)。但し、選択可能なメトリックタイプ(例えば、プルダウンメニューに表示される選択肢)は、グラフ行121L1に関連付けられているメトリックタイプに対応したリソースタイプに対応する1以上のメトリックタイプであり、他のリソースタイプに対応するメトリックタイプは含まれない。これは、他のグラフ行121についても同様である。なお、グラフ行121に関連付けられているメトリックタイプが変更された場合、表示制御プログラム130が、行順序テーブル800を更新する(具体的には、そのグラフ行121の行番号に対応したメトリックタイプのIDを、変更後のメトリックタイプのIDに変更する)。
グラフ行121は、論理グラフ行121Lと物理グラフ行121Pのいずれかである。複数のグラフ行121は、論理グラフ行121Lと物理グラフ行121Pとのうちの少なくとも1つを含む。図12の例によれば、複数のグラフ行121は、2つの論理グラフ行121L(121L1及び121L2)と、6つの論理グラフ行121P(121P1〜121P6)である。「論理グラフ行」とは、論理メトリックタイプが関連付けられたグラフ行である。「論理メトリックタイプ」とは、論理リソースのリソースタイプに対応したメトリックタイプである。「物理グラフ行」とは、物理メトリックタイプが関連付けられたグラフ行である。「物理メトリックタイプ」とは、物理リソースのリソースタイプに対応したメトリックタイプである。
論理グラフ行121Lは、例えば、少なくとも1つのグラフ列123が後述の論理グラフ列123Lの場合に存在してよい。具体的には、例えば、論理グラフ行121Lに関連付けられる論理メトリックタイプとして採用されるメトリックタイプは、論理グラフ列123Lに関連付けられた論理リソースのリソースタイプ「VM」と同じリソースタイプ「VM」に対応したメトリックタイプでよい。全てのグラフ列123が後述の物理グラフ列の場合、論理グラフ行121Lは無くてよい。いずれの論理グラフ行121Lも、いずれの物理グラフ行121Pよりも上位に位置する。言い換えれば、先頭のグラフ行から1以上の論理グラフ行121Lが連続(隣接)する。これは、視認性の向上に貢献すると考えられる。なぜなら、ユーザに認識されるリソースである論理リソースの論理メトリックタイプのグラフが、物理リソースの物理メトリックタイプのグラフよりも上位に位置し、このような位置関係は、物理リソースの上位に論理リソースが位置するというリソース位置関係と同じだからである。また、グラフ列123に関連付いたリソースは基点リソースであるが、基点リソースのリソースタイプと同一のリソースタイプに対応したメトリックタイプが関連付けられたグラフ行121があることで、例えば複数の論理リソースのボトルネックになっている物理リソースの存在を特定しやすくなるなど、分析の容易性及び正確性の1つの向上が期待できる。
<グラフ列>
グラフ列123(例えば123L1)には、そのグラフ列123に関連付けられている基点リソースを表す情報(例えばリソース名「VM21」)が表示される。基点リソースが論理リソースの場合、その論理リソースの基になる物理リソースを表す情報(例えば物理リソース名を含んだ情報「@HV4」)もグラフ列123(例えば123L1)に表示される。
グラフ列123は、論理グラフ列123Lと物理グラフ列(図示せず)とのうちのいずれかである。すなわち、複数のグラフ列123は、論理グラフ列123Lと物理グラフ列(図示せず)のうちの少なくとも1つを含む。図12の例によれば、複数のグラフ列123は、5つの論理グラフ列123L(123L1〜123L5)である。「論理グラフ列」とは、論理リソースが関連付けられたグラフ列である。「物理グラフ列」とは、物理リソースが関連付けられたグラフ列である。
<グラフ>
グラフ129には、時系列データテーブル700を基に、表示対象の時間帯における複数の取得時刻にそれぞれ対応した複数のメトリック値がプロットされ、プロットされたメトリック値を線で結ばれる。つまり、グラフ129において、メトリック値変化(系列)は、折れ線で表現される。しかし、メトリック値変化は、折れ線に代えて、棒の並び(メトリック値に応じた長さの棒の並び)等、他の形式で表現されてもよい。
表示対象の時間帯(全てのグラフ129に共通の時間帯)は、ユーザにより指定された時間帯であってもよいし、所定の時刻を基準とした時間帯であってもよい。「所定の時刻」は、現在時刻であってもよいし、障害発生時刻(障害(例えばWarning又はError)が発生した時刻)であってもよい。「障害発生時刻」は、ユーザにより選択されたリソースに障害が発生した時刻でもよいし、1以上の2以上の基点リソースのうちのいずれかのリソースに障害が発生した時刻でもよい。時間帯は、基準時刻(基準とされた所定の時刻)から基準時刻の一定時間過去までの時刻であってもよいし、基準時刻から基準時刻の一定時間未来までの時刻であってもよいし、基準時刻の一定時間過去から基準時刻の一定時間未来までの時刻であってもよい。
各グラフ行121において、表示対象の数値範囲は、固定範囲でもよいし、可変範囲でもよい。後者の場合、例えば、表示対象の時間帯における最悪メトリック値(例えば最大メトリック値)と最良メトリック値(例えば最小メトリック値)とに応じて表示制御プログラム130により決められた範囲でもよい。表示対象の数値範囲は、対応するメトリックタイプ及びリソースタイプについての警告閾値と異常閾値の両方を含む範囲でよい。グラフ129には、警告閾値及び異常閾値の各々の閾値(例えばその閾値に対応した線)が表示されていてもよい。
全てのグラフ129において、表示対象の時間帯が同一のため、グラフ129の時間軸近傍に時刻を表す数字が無くても、分析の上でユーザにとって差し支えがないと考えられる。つまり、表示対象の情報量が削減されることで視認性が向上しても、分析の正確性に悪影響が出ないと考えられる。
同様に、各グラフ行121において、表示対象の数値範囲が同一のため、グラフ129の数値軸近傍にメトリック値を表す数字が無くても、分析の上でユーザにとって差し支えがないと考えられる。つまり、表示対象の情報量が削減されることで視認性が向上しても、分析の正確性に悪影響が出ないと考えられる。
また、或る基点リソースについては、或るメトリックタイプのメトリック値が無いこともあり得る。その場合、その或る基点リソースとその或るメトリックタイプとに対応したセルは、対応するメトリック値が無いことを意味する状態であってよい(例えば、ブランクでもよいし、データプロットの無いグラフが表示されてもよい)。
<基点リソース>
基点とされる2以上のリソースは、例えば、下記の(C1)〜(C4)のうちの少なくとも1つ、
(C1)同一のリソースタイプに属する、
(C2)同一のレイヤに属する、
(C3)影響元リソースが同一である影響先リソースである、
(C4)同一筐体に存在する(同一筐体に存在するか否かは、例えば、筐体IDとリソースIDとの対応関係を保持するテーブル(図示せず)を参照することにより判断可能)、
に該当するリソースである。
なお、「影響元リソース」とは、影響を与えるリソースである。「影響先リソース」とは、影響元リソースから影響(例えば性能の影響)を受けるリソースである。影響元リソース(例えば「HV4」)が複数のリソース(例えば「CPU1」、「CPU2」、…)を含み、且つ、2以上の影響先リソース(例えば「VM21」〜「VM26」)がその複数のリソースのうちの少なくとも1つに関連している場合、その影響元リソースは、2以上の影響先リソースにとって同一の影響元リソースでよい。
影響を与える/受けるは、観点によって異なり得る。具体的には、影響元リソースは、影響先リソースの特定の下位関連リソース(例えば子リソース又は物理リソース)であるが、影響先リソースの特定の上位関連リソース(例えば親リソース又は論理リソース)であることもあり得る。
影響元リソースの一例は、2以上のリソースから共有される共有先リソースであり、影響先リソースの一例は、共有先リソースを共有する2以上のリソースの各々である共有元リソースである。例えば、2以上の論理リソース(例えばVM)が同一の物理リソース(例えば同一HV(ハイパバイザ)が管理するいずれかの物理リソース)に基づいている場合、各論理リソースが、基点リソースの一例としての共有元リソースである。また、例えば、2以上の物理リソース(例えば、物理マシン)が同一の論理リソース(例えばLDEV)を共有する場合、各物理リソースが、基点リソースの一例としての共有元リソースである。
基点リソースは、選択リソース(選択されたリソース(典型的にはユーザにより選択されたリソース))と、条件該当リソース(選択リソースに関わる所定のリソース条件に該当するリソースであって選択リソース以外のリソース)とのうちのいずれかでよい。2以上の基点リソースは、選択リソースのみであってもよいし、条件該当リソースのみであってもよいし、選択リソース及び条件該当リソースであってもよい。条件該当リソースは、上記(C1)〜(C4)によれば、下記の(c1)〜(c4)のうちの少なくとも1つ、
(c1)選択リソースと同一のリソースタイプに属する、
(c2)選択リソースと同一のレイヤに属する、
(c3)選択リソースと影響元リソース(例えば子リソース)が同一である、
(c4)選択リソースと同一筐体に存在する、
に該当するリソースである。なお、(c1)は、例えば、「選択リソースと同一のリソースタイプを含む連続した2以上のリソースタイプ」のように拡張されてもよい。また、(c2)は、例えば、「選択リソースと同一のレイヤを含む連続した2以上のレイヤに属する」のように拡張されてもよい。
本実施例では、2以上の基点リソースは、同一のリソースレイヤに属する論理リソースである。論理リソースは、ユーザから認識されるリソースであるが、物理リソースは、必ずしもユーザから認識されるリソースであるとは限らない。
<グラフ列(基点リソース)とグラフ行(表示対象のメトリックタイプ)との関係>
表示対象のメトリックタイプとして採用されるメトリックタイプは、基点リソースに依存し、具体的には、下記の(d1)及び(d2)のうちの少なくとも1つ、
(d1)基点リソースのリソースタイプに対応したメトリックタイプ、
(d2)基点リソースの関連リソースのリソースタイプに対応したメトリックタイプ、
である。
「基点リソースの関連リソース」は、基点リソースの上位関連リソースと基点リソースの下位関連リソースのうちの一方又は両方でよい。具体的には、基点リソースの影響元リソースが下位関連リソースの場合、「基点リソースの関連リソース」は、その影響元リソース(例えばその影響元リソース内のリソース)と、その影響元リソースよりも下位の関連リソースとのうちの少なくとも影響元リソースである。一方、基点リソースの影響元リソースが上位関連リソースの場合、「基点リソースの関連リソース」は、その影響元リソース(例えばその影響元リソース内のリソース)と、その影響元リソースよりも上位の関連リソースとのうちの少なくとも影響元リソースである。
「基点リソースの関連リソース」として採用されるリソースは、所定の規則に従い絞り込まれてよい。例えば、「基点リソースの関連リソース」として採用されるリソースは、下記の(e1)又は(e2)、
(e1)基点リソースと同一のリソースタイプを含む連続したp個のリソースタイプに属する(pは自然数)、
(e2)基点リソースと同一のレイヤを含む連続したq個のレイヤに属する(qは自然数)、
に該当するリソースでよい。p個のリソースタイプは、複数のリソースタイプのうちの一部である。q個のレイヤは、複数のレイヤのうちの一部である。
また、1つリソースタイプについて、表示対象とされるメトリックタイプは、図12に例示するように複数存在してもよいし、図13〜図15に例示するように、1つとされてもよい。なお、図13〜図15において、リソースタイプ「HBA」のメトリックタイプに対応したグラフ行において、「No Data」は、時系列のメトリック値が無いことを意味する。
<詳細情報の表示>
表示制御プログラム130は、グラフ129を指定するユーザ操作がされた場合(例えば、マウスカーソル124がグラフ129に重ねられた場合)、指定されたグラフ129に対応したメトリックタイプに対応するリソースタイプのリソースのうち、基点リソースに関連するリソースの詳細情報(例えば、関連リソース名)を、グラフ一覧画面53上に(例えばポップアップ画面により)表示する。
表示制御プログラム130は、基点リソースを指定するユーザ操作がされた場合(例えば、マウスカーソル124が基点リソース名に重ねられた場合)、指定された基点リソースに関連するリソースの詳細情報(例えば、基点リソースに関連するリソースのうちの、表示対象のメトリックタイプに対応したリソースタイプの関連リソースの名称)を、グラフ一覧画面53上に(例えばポップアップ画面により)表示する。
<グラフ行及びグラフ列の並び替え>
表示制御プログラム130は、グラフ行121を並び替える(図13参照)。具体的には、例えば、表示制御プログラム130は、ユーザ操作に応答して、指定されたグラフ行121を、指定された位置に挿入する(例えば、ドラッグされたグラフ行121をドロップされた位置に挿入する)。但し、論理グラフ行121Lの連続(隣接)と、物理グラフ行121Pの連続は、維持されてよい。つまり、論理グラフ行121L間に物理グラフ行121Pが挿入されることや、物理グラフ行121P間に論理グラフ行121Lが挿入されることは、表示制御プログラム130により禁止されてよい。なお、図13は、図12のグラフ一覧画面の表示後の画面の一例であって、ユーザ操作に応答してメトリックタイプ絞込み処理が行われた結果としての画面の一例でもある。つまり、図13によれば、図12の表示対象メトリックタイプが絞り込まれている。なお、メトリックタイプ絞込み処理の詳細は実施例2の説明において述べる。
また、表示制御プログラム130は、グラフ列123を並び替える(図14参照)。具体的には、例えば、表示制御プログラム130は、ユーザ操作に応答して、指定されたグラフ列123を、指定された位置に挿入する(例えば、ドラッグされたグラフ列123をドロップされた位置に挿入する)。
これにより、ユーザは、所望の観点で、離れていたグラフ行121を隣接させたり、離れていたグラフ列123を隣接させたりすることができる。結果として、比較したいグラフ129同士が隣接することになる。これは、分析の正確性及び容易性のうちの少なくとも1つの向上に貢献する(例えば、ユーザにとってボトルネックを見つけ易くなる)。
<同一の関連リソースを有する基点リソースの明示>
物理グラフ行121Pは、基点リソースの関連リソースのリソースタイプに対応したグラフ行121の一例である。各物理グラフ行121Pについて、その物理グラフ行121Pに対応したリソースタイプの関連リソースのうち複数の基点リソースに関連する関連リソースがあれば、表示制御プログラム130内の強調表示モジュール132は、その複数の基点リソースを明示する。具体的には、例えば、強調表示モジュール132は、物理グラフ行121Pについて、その物理グラフ行121Pに対応したリソースタイプの同一の関連リソースを共有する複数の基点リソースにそれぞれ対応した複数のグラフ129(又はセル)を強調表示する。ここで言う強調表示は、グラフ129(又はセル)の外枠を太線とする又はグラフ129の背景を所定の色とすることである。強調表示の態様として、他種の態様が採用されてよい。
強調表示処理の詳細の一例は、次の通りである。強調表示モジュール132は、テーブル400、500、550、600、800及び900を参照し、物理グラフ行121P毎に、その物理グラフ行121Pのメトリックタイプに対応したリソースタイプの物理リソースであって、複数の基点リソースに関連する物理リソースがあるか否かを判断する。そのような物理リソースがあれば、強調表示モジュール132は、その物理グラフ行121Pに存在し、その複数の基点リソースにそれぞれ対応した複数のグラフ129を強調表示する。強調表示は、グラフ一覧画面53の表示後にユーザ操作に応答して行われてもよいし、表示されたグラフ一覧画面53において既にされていてもよい。
<処理フロー>
図16は、実施例1に係るグラフ一覧表示処理の流れを示す。
S1601で、グラフ構成取得処理が行われる。S1602で、グラフ一覧描画処理が行われる。
S1601のグラフ構成取得処理は、次のS1611〜S1617を含んだ処理である。
S1611で、グラフ一覧表示モジュール131は、例えばトポロジー画面51のようなリソース選択画面を介して、リソースの選択をユーザから受け付ける。以下、説明を分かり易くするため、その選択されたリソースは、図11におけるリソース「VM21」であるとする。
S1612で、グラフ一覧表示モジュール131は、テーブル400、500及び550を基に、選択リソース「VM21」と同一レイヤ「Server」に属する子リソース「HV4」を特定する。
S1613で、グラフ一覧表示モジュール131は、テーブル400、500及び550を基に、S1612で特定された子リソース「HV4」と同一レイヤに属する関連リソースを特定する。特定される関連リソースは、上位でも下位でもよいため、ここでは、関連リソースとして、リソース「HV4」の親リソースであって選択リソース「VM21」以外のリソース「VM22」、「VM23」、「VM24」及び「VM25」が特定される。また、関連リソースとして、リソース「HV4」の子リソース「DS3」が特定される。
S1614で、グラフ一覧表示モジュール131は、テーブル400及び550を基に、S1611〜S1613で特定された複数のリソースのうちの各論理リソースについて、列番号を付与し、且つ、その列番号と、その論理リソースのリソースIDとの組を列順序テーブル900に登録する。
つまり、S1614では、グラフ列に関連付けられるリソース(言い換えれば、グラフ列として表示されるリソース)、つまり基点リソースが決定される。基点リソースは、S1614の処理に代えて、選択リソースと条件該当リソースに決定されてよい。ここで言う「条件該当リソース」は、選択リソースと子リソースが同一であるリソースであり、且つ、選択リソースと同一リソースタイプのリソースでよい。いずれにしても、S1614では、基点リソースとして、リソース「VM21」〜「VM25」が決定される。
S1615で、グラフ一覧表示モジュール131は、テーブル400及び600を基に、S1611〜S1613で特定されたリソース毎に、そのリソースタイプに対応したメトリックタイプを特定する。
S1616で、グラフ一覧表示モジュール131は、テーブル400、550及び600を基に、S1615で特定された複数のメトリックタイプのうちの各論理メトリックタイプ(論理リソースのリソースタイプに対応したメトリックタイプ)について、行番号を付与し、且つ、その行番号と、その論理メトリックタイプのメトリックタイプIDとの組を行順序テーブル800に登録する。
S1617で、グラフ一覧表示モジュール131は、テーブル400、550及び600を基に、S1615で特定された複数のメトリックタイプのうちの各物理メトリックタイプ(物理リソースのリソースタイプに対応したメトリックタイプ)について、行番号を付与し、且つ、その行番号と、その物理メトリックタイプのメトリックタイプIDとの組を行順序テーブル800に登録する。なお、物理メトリックタイプについて最も小さい行番号は、論理メトリックタイプについて最も大きい行番号に1が加算された番号である。
つまり、S1615〜S1617では、グラフ行に関連付けられるメトリックタイプ(言い換えれば、グラフ行として表示対象とされるメトリックタイプ)が決定される。ここでは、1つのリソースタイプについて、複数のメトリックタイプがあれば、それら複数のメトリックタイプにそれぞれ対応した複数のグラフ行が用意される。ここでは、表示対象とされるメトリックタイプは、選択リソースのリソースタイプ「VM」に対応したメトリックタイプと、選択リソースの子リソース「HV4」内のリソースのリソースタイプ(例えば、「CPU」、「DISK」等)に対応したメトリックタイプと、リソース「HV4」の子リソース「DS3」のリソースタイプに対応したメトリックタイプとなる。
S1602のグラフ一覧描画処理は、次のループ(A)及び(B)と、次のS1621〜S1625とを含んだ処理である。
ループ(A)は、列順序テーブル900の列番号「1」から末尾までの各々について、ループ(B)と、次のS1621〜S1625とが実行されることである。以下、1つの列番号(以下、便宜上「列番号Q」と言う)を例に取る。
S1621で、グラフ一覧表示モジュール131は、テーブル500を基に、列番号Qに対応したリソースIDに関連するリソースIDを特定する。
ループ(A)は、行順序テーブル800の行番号「1」から末尾までの各々について、次のS1622〜S1625が実行されることである。以下、1つの行番号(以下、便宜上「行番号P」と言う)を例に取る。
S1622で、グラフ一覧表示モジュール131は、テーブル700、800及び1000を基に、S1621で特定されたリソースIDと行番号Pに対応したメトリックタイプIDとに対応した警告閾値及び異常閾値と、表示対象の時間帯に属する取得時刻(S1621で特定されたリソースID)に対応したメトリック値とを特定する。
S1623で、グラフ一覧表示モジュール131は、時系列のメトリック値が存在するか否かを判断する。
S1623の判断結果が真の場合、S1624で、グラフ一覧表示モジュール131は、行番号P及び列番号Qに対応したセルに、メトリック値の時系列変化を表すグラフ129を描画する。
S1623の判断結果が偽の場合、S1625で、グラフ一覧表示モジュール131は、行番号P及び列番号Qに対応したセルに、時系列のメトリック値が無いことを示すオブジェクト(例えば、文字列「No data」)を描画する。
実施例2では、表示対象のメトリックタイプとグラフ行及びグラフ列の各々の並び順とが自動最適化されたグラフ一覧画面が表示される。具体的には、例えば、実施例1では、リソース選択後の画面が、図12の画面53であり、ユーザが手動でグラフ行及びグラフ列を並び替えることで、図15の画面53が得られるが(強調表示処理はされてもされなくてもよい)、実施例2では、リソース選択後の画面が、図15の画面53である。
以下、実施例2を詳細に説明する。その際、実施例1との相違点を主に説明し、実施例1との共通点については説明を省略又は簡略する。
図17は、実施例2に係る計算機システム及び管理システムの構成を示す。
管理サーバプログラム1541は、表示制御を実行する表示制御プログラム1130を含む。表示制御プログラム1130は、グラフ一覧表示モジュール1131及び強調表示モジュール132の他に、時系列スコアを算出するスコア算出モジュール133と、表示対象のメトリックタイプを絞り込むメトリックタイプ絞込みモジュール134と、グラフ行及びグラフ列のうちの少なくとも1つの並び替えを行う並び替えモジュール135とを含む。本実施例では、表示制御プログラム1130が行う処理のうち、モジュール132〜135が行う処理以外の処理は、グラフ一覧表示モジュール1131により行われる。
管理テーブル群1543が、図3〜図10に示したテーブルの他に、時系列スコアテーブルを含む。
図18は、時系列スコアテーブルの一例を示す。
時系列スコアテーブル1800は、時系列スコアに関する情報を有する。時系列スコアテーブル1800は、例えば、リソースとメトリックタイプとの組毎に、レコードを有する。各レコードは、リソースID、メトリックタイプID、最悪メトリック値(表示対象の時間帯における最悪のメトリック値)及び時系列スコア(算出された時系列スコア)を有する。「時系列スコア」とは、表示対象の時間帯での時系列変化のスコアであり、具体的には、表示対象の時間帯に属する複数の取得時刻にそれぞれ取得された複数のメトリック値のうちの少なくとも1つの値に基づくスコアである。本実施例では、時系列スコアは、最悪メトリック値に基づくスコアである。時系列スコアは、リソースとメトリックタイプとの組毎に算出される。
実施例2では、表示対象のメトリックタイプ、グラフ行の並び順、及び、グラフ列の並び順が、時系列スコアに基づき自動で最適化され、その結果としてのグラフ一覧画面が表示される。
図22は、実施例2に係るグラフ一覧表示処理の流れを示す。図22に加えて、適宜、図19〜図22を参照して、本実施例に係るグラフ一覧表示処理を説明する。
S2201で、実施例1と同様のグラフ構成取得処理が行われる。S2202で、時系列スコア算出処理が行われる。S2203で、メトリックタイプ絞込み処理が行われる。S2204で、順序並び替え処理が行われる。S2205で、実施例1と同様のグラフ一覧描画処理が行われる。S2206で、実施例1と同様の強調表示処理が行われる。
以下、実施例2に特有の処理である時系列スコア算出処理、メトリックタイプ絞込み処理及び順序並び替え処理を説明する。
<時系列スコア算出処理>
S2202の時系列スコア算出処理は、ループ(C)と、S2211及びS2212とを含んだ処理である。
ループ(C)は、グラフ構成取得処理のS1615〜S1617で決定されたメトリックタイプ毎に、S2211及びS2212が実行されることである。S1615〜S1617で決定されたメトリックタイプは、実施例1では表示対象メトリックタイプであるが、実施例2では候補メトリックタイプである。複数の候補メトリックタイプが、後述のメトリックタイプ絞込み処理により、2以上の表示対象メトリックタイプに絞り込まれる。以下、時系列スコア算出処理についての以下の説明では、1つの候補メトリックタイプ(以下、対象候補メトリックタイプ))を例に取る。
S2211で、スコア算出モジュール133は、テーブル700を基に、対象候補メトリックタイプに対応した各リソースについて、そのリソースに対応した最悪メトリック値から時系列スコアを算出する。ここで言う「最悪メトリック値」は、リソース値の一例である。「リソース値」は、表示対象の時間帯に属する複数の取得時刻にそれぞれ取得された複数のメトリック値のうちの少なくとも1つの値に基づく値である。リソース値は、「最悪メトリック値」に代えて又は加えて、表示対象の時間帯に属する複数のメトリック値の平均値であってもよい。時系列スコアは、最悪メトリック値が大きいと高い傾向にある。例えば、時系列スコアは、最悪メトリック値とそれの閾値(例えば、警告閾値及び異常閾値のうちの少なくとも1つ)に基づき算出される。具体的には、例えば、時系列スコア=(最悪メトリック値÷異常閾値)×100である。
S2212で、スコア算出モジュール133は、S2211で算出された時系列スコア、その時系列スコアの基になった最悪メトリック値、その時系列スコアに対応するリソースのリソースID、及び、その時系列スコアに対応する候補メトリックタイプのメトリックタイプIDを、時系列スコアテーブル1800に登録する。
<メトリックタイプ絞込み処理>
S2203のメトリックタイプ絞込み処理は、ループ(D)、ループ(E)、ループ(F)、S2221及びS2222を含んだ処理である。
ループ(D)は、候補メトリックタイプに対応したリソースタイプ毎に、ループ(E)、ループ(F)、S2221及びS2222が実行されることである。以下、1つのリソースタイプを例に取る(メトリックタイプ絞込み処理の説明において、「対象リソースタイプ」と言う)。
ループ(E)は、対象リソースタイプについて、そのリソースタイプに対応した候補メトリックタイプ毎に、ループ(F)及びS2221が実行されることである。
ループ(F)は、基点リソース毎に、S2221が実行されることである。
S2221で、メトリックタイプ絞込みモジュール134は、基点リソース又はその基点リソースの関連リソースと、候補メトリックタイプとに対応した時系列スコアを、時系列スコアテーブルから特定する。メトリックタイプ絞込みモジュール134は、その特定された時系列スコアを基に、集約スコアを更新する。「集約スコア」とは、基点リソースと候補メトリックタイプとの組毎のスコアであり、その候補メトリックタイプに対応したリソースのうちの基点リソース又はそれの関連リソースに対応した時系列スコアに基づく値(例えば時系列スコアの合計)である。図19は、対象リソースタイプの集計結果(S2221の結果)の一例を示すが、図19によれば、基点リソース(LR1〜LR5)の各々について、候補メトリックタイプ(メトリックタイプID「1」〜「3」)毎に、集約スコアがある。例えば、基点リソース(LR1)及び候補メトリックタイプ(メトリックタイプID「1」)に対応した集約スコアは、「120」である。
S2222で、メトリックタイプ絞込みモジュール134は、対象リソースタイプの集計結果から、1以上のスコア条件(集約スコアに関する条件)のうちの少なくとも1つに該当するメトリックタイプを、表示対象メトリックタイプとして決定する。例えば、第1のスコア条件が、「最高集約スコア」である場合、図19の例によれば、最高集約スコアは、「150」であり(図19において灰色のセルにあるスコア)、故に、表示対象メトリックタイプは、最高集約スコア「150」に対応したメトリックタイプ2(IDが「2」のメトリックタイプ)である。また、例えば、第2のスコア条件が、「集約スコア≧100」である場合、図19の例によれば、その条件を満たす集約スコアは、「110」、「120」及び「150」であり(図19において円で囲まれたスコア)、故に、表示対象メトリックタイプは、集約スコア「120」を有するメトリックタイプ1と、集約スコア「110」及び「150」を有するメトリックタイプ2である。
第1のスコア条件は、相対的な条件の一例である。第2のスコア条件は、絶対的な条件の一例である。スコア条件として、相対的な条件と絶対的な条件の少なくとも1つがある。例えば、1つのリソースタイプにつき表示対象として所定数(例えば1つ)のメトリックタイプがあることが決められている場合、常に相対的な条件が採用されてもよいし、所定数以下のメトリックタイプが決まるまで絶対的な条件を採用しメトリックタイプが所定数に満たないときに相対的な条件が採用されてもよい。
<順序並び替え処理>
S2204の順序並び替え処理は、S2231の行並び替え処理と、S2232の列並び替え処理とを含んだ処理である。以下、順序並び替え処理の説明では、適宜に、図20及び図21を参照する。なお、図20及び図21の各々に記載の集約スコアは、図19に記載の集約スコアに対応していない。すなわち、図20及び図21の各々に記載の集約スコアは、順序並び替え処理を理解し易いように用意された例であり、図19に記載の集約スコアの例とは別の例である。
<<行並び替え処理>>
S2231の行並び替え処理は、S2241〜S2244を含んだ処理である。行並び替え処理の説明では、適宜に、図20を参照する。
S2241で、並び替えモジュール135は、グラフ行毎に(表示対象メトリックタイプ毎に)、代表スコアを算出する。グラフ行について、「代表スコア」とは、そのグラフ行に対応した2以上の集約スコア(2以上の基点リソースにそれぞれ対応した2以上の集約スコア)のうちの1つに基づくスコア、例えば、集約スコアの最高値又は平均値である。ここでは、代表スコアは、2以上の集約スコアの最高値とする。図20の参照符号20Aは、行並び替え処理開始時の集約スコアマトリクスの一例を示す。集約スコアマトリクスは、グラフ行及びグラフ列に対応した集約スコアの一覧であり、例えば記憶資源535に展開される。参照符号20Aによれば、各グラフ行について、集約スコアの最高値が、円で囲まれている。また、図20において、「LR」は、論理リソースの略である(基点リソース)。「LM」は、論理メトリックタイプの略である。「PM」は、物理メトリックタイプの略である。
S2242で、並び替えモジュール135は、論理グラフ行を、代表スコアの降順でソートする。S2243で、並び替えモジュール135は、物理グラフ行を、代表スコアの降順でソートする。S2242及びS2243の結果、図20の参照符号20Aに示すグラフ行並びが、図20の参照符号20Bに示すグラフ行並びとなる。すなわち、論理グラフ行の並び順が、LM1→LM2からLM2→LM1に変更され、物理グラフ行の並び順が、PM3→PM4→PM5からPM5→PM3→PM4に変更される。いずれの論理グラフ行もいずれの物理グラフ行よりも上の位置に存在することが維持されている。
S2244で、並び替えモジュール135は、S2242及びS2243の結果に基づき、行順序テーブル800を更新する(メトリックタイプIDに対応した行番号を更新する)。
<<列並び替え処理>>
S2232の列並び替え処理は、S2251及びS2252を含んだ処理、つまり、すなわち、2段階の処理を含む。S2251は、1段階目の列並び替えである。S2252は、2段階目の列並び替えである。S2253で、並び替えモジュール135は、S2251及びS2252の結果に基づき、列順序テーブル800を更新する(メトリックタイプIDに対応した行番号を更新する)。
以下、1段階目の列並び替え及び2段階目の列並び替えを説明する。その説明では、適宜に、図21を参照する。また、以下の説明では、論理グラフ行の集合を「論理グラフ行群」と言い、物理グラフ行の集合を「物理グラフ行群」と言う。
<<<1段階目の列並び替え>>>
S2251(1段階目の列並び替え)は、論理グラフ行の並びに応じた処理であり、ループ(G)、ループ(H)、及びS2261〜S2263を含む。1段階目の列並び替えの説明では、図21のうち参照符号20B〜参照符号20Dが参照される。1段階目の列並び替えでは、論理グラフ行が考慮され、物理グラフ行が考慮されない(このため、参照符号20B〜20Dでは、物理グラフ行の色がグレーである)。参照符号20Bが、行並び替え処理終了時の集約スコアマトリクスである。
ループ(G)は、論理グラフ行毎に、ループ(H)、及びS2261〜S2263が行われることである。1つの論理グラフ行を例に取る(1段階目の列並び替えの説明において、「対象論理グラフ行」と言う)。
ループ(H)は、グラフ列毎に、S2261及びS2262が行われることである。非固定化グラフ列群における1つのグラフ列を例に取る(1段階目の列並び替えの説明において、「対象グラフ列」と言う)。なお、「非固定化グラフ列群」とは、固定化されていない(移動され得る)1以上のグラフ列である。それに対し、後述の「固定化グラフ列群」とは、固定化された(移動され得ない)1以上のグラフ列である。1段階目の列並び替えの開始時(行並び替え処理の終了時)では、全てのグラフ列が、固定化されていないグラフ列である。
S2261で、並び替えモジュール135は、対象集約スコア(対象論理グラフ行及び対象グラフ列に対応した集約スコア)が、論理グラフ行群と対象グラフ列とに対応した範囲に存在する集約スコアのうちの最高値か否かを判断する。図21の参照符号20Bによれば、対象論理グラフ行(LM2)において、S2261の判断結果が肯定となる集約スコア(すなわち、同一グラフ列において、他の論理グラフ行(LM1)の集約スコアより高い集約スコア)が、円で囲まれている。
S2261の判断結果が肯定の場合、S2262で、並び替えモジュール135は、対象グラフ列を最も左へ移動させる。既に移動されたグラフ列が存在する場合、並び替えモジュール135は、移動された2以上のグラフ列を、対象論理グラフ行における集約スコアの降順に並び替える。
S2263で、並び替えモジュール135は、移動したグラフ列があれば、それらのグラフ列を「固定化グラフ列群」とする。1番目の論理グラフ行(LM2)についてS2261〜S2263が完了した場合、マトリクス20Bがマトリクス20Cに変わる。マトリクス20Cにおいて、太線で囲まれた1番目〜3番目のグラフ列(LR3、LR2及びLR4)が、固定化グラフ列群Xである。
2番目の論理グラフ行(LM1)についても、S2261〜S2263が行われる。その結果、マトリクス20Cがマトリクス20Dに変わる。マトリクス20Dにおいて、太線で囲まれた4番目及び5番目のグラフ列(LR5及びLR1)が、固定化グラフ列群Yである。
<<<2段階目の列並び替え>>>
S2252(2段階目の列並び替え)は、物理グラフ行の並びに応じた処理であり、ループ(J)、ループ(K)、ループ(L)、及びS2271〜S2273を含む。2段階目の列並び替えの説明では、図21のうち参照符号20E〜参照符号20Gが参照される。2段階目の列並び替えでは、物理グラフ行が考慮され、論理グラフ行が考慮されない(このため、参照符号20E〜20Gでは、論理グラフ行の色がグレーである)。参照符号20Eが、1段階目の列並び替え終了時の集約スコアマトリクスである。また、1番目〜3番目のグラフ列(LR3、LR2及びLR4)が、固定化グラフ列群Xであり、4番目及び5番目のグラフ列(LR5及びLR1)が、固定化グラフ列群Yである。
ループ(J)は、固定化グラフ列群毎に、ループ(K)、ループ(L)、及びS2271〜S2273が行われることである。1つの固定化グラフ列群を例に取る。なお、処理にあたり、固定化は解除されるため、例に取ったグラフ列群を、2段階目の列並び替えの説明において、「対象グラフ列群」と言う。
ループ(K)は、物理グラフ行毎に、ループ(L)、及びS2271〜S2273が行われることである。1つの物理グラフ行を例に取る(2段階目の列並び替えの説明において、「対象物理グラフ行」と言う)。
ループ(L)は、対象グラフ群におけるグラフ列毎に、S2271及びS2272が行われることである。非固定化グラフ列群における1つのグラフ列を例に取る(1段階目の列並び替えの説明において、「対象グラフ列」と言う)。
S2271で、並び替えモジュール135は、対象集約スコア(対象物理グラフ行及び対象グラフ列に対応した集約スコア)が、物理グラフ行群と対象グラフ列とに対応した範囲に存在する集約スコアのうちの最高値か否かを判断する。図21の参照符号20Eによれば、対象物理グラフ行(PM3)において、S2271の判断結果が肯定となる集約スコア(すなわち、同一グラフ列において、他の論理グラフ行(PM1及びPM2)の集約スコアより高い集約スコア)が、円で囲まれている。なお、S2271は、1段階目の列並び替えの1番目のグラフ列群X(つまり、最も左にある1番目〜3番目のグラフ列(LR3、LR2及びLR4)で構成されたグラフ列群)について、行番号の小さい順に(すなわち、物理グラフ行(PM3)、(PM1)、(PM2)の順に)、行われる。S2271の判断結果が肯定の場合、S2272及びS2273が行われる。
S2272で、並び替えモジュール135は、対象グラフ列を最も左へ移動させる。既に移動されたグラフ列が存在する場合、並び替えモジュール135は、移動された2以上のグラフ列を、対象物理グラフ行における集約スコアの降順に並び替える。
S2273で、並び替えモジュール135は、移動したグラフ列があれば、それらのグラフ列を「固定化グラフ列群」とする。
1番目のグラフ列群XについてS2271〜S2273が完了した場合、マトリクス20Eがマトリクス20Fに変わる。マトリクス20Fにおいて、鎖線で囲まれた1番目及び2番目のグラフ列(LR2及びLR4)が、固定化グラフ列群x1であり、鎖線で囲まれた3番目のグラフ列(LR3)が、固定化グラフ列群x2である。
1段階目の列並び替えの2番目のグラフ列群Y(つまり、4番目及び5番目のグラフ列(LR5及びLR1)で構成されたグラフ列群)についても、行番号の小さい順に(すなわち、物理グラフ行(PM3)、(PM1)、(PM2)の順に)、S2271が行われる。そして、S2271の判断結果が肯定の場合、S2272及びS2273が行われる。その結果、マトリクス20Fがマトリクス20Gに変わる。
以上のメトリックタイプ絞込み処理、グラフ行並び替え処理及びグラフ列並び替え処理の結果としてのグラフ一覧画面が表示される。つまり、実施例2では、リソース選択後の画面が、図12の画面53ではなく、図15の画面53である。すなわち、表示対象のメトリックタイプとグラフ行及びグラフ列の各々の並び順とが自動最適化されている。これは、分析の容易性及び正確性のうちの少なくとも1つの向上に一層貢献すると考えられる。なお、図15の画面53についても、手動によって、グラフ行の並び替えとグラフ列の並び替えとのうちの少なくとも一方が可能であってもよい。
実施例2の説明によれば、例えば以下のことが言える。
時系列スコアは、最悪メトリック値(表示対象の時間帯に属する複数のメトリック値の少なくとも1つに基づくリソース値の一例)が正規化された値である。時系列スコアは、メトリック値が悪いと高い傾向にある。表示対象のグラフの決定(メトリックタイプの絞込み)とグラフの並び替えの両方が、時系列スコアに基づき行われる。リソース値は、最悪メトリック値に代えて又は加えて、表示対象の時間帯においてメトリック値が閾値(例えば異常閾値又警告閾値)を超えている時間長であってもよい。この場合、例えば、最悪メトリック値が低くても、警告閾値を超えている時間長が長ければ、時系列スコアが高いことがあり得る。
少なくとも1つの集約スコアが高いメトリックタイプが表示対象として決定される傾向にある。このような観点によれば、悪いメトリック値に対応したメトリックタイプが表示対象として決定される傾向にある。つまり、悪いメトリック値に対応したグラフが表示対象として決定される傾向にある。
グラフ行の並び替えにおいて、代表スコアが高いほど、グラフ行が上位に配置される(小さい行番号が付与される)傾向にある。グラフ列の並び替えにおいて、集約スコアが高いほど、グラフ列が上位に配置される(小さい列番号が付与される)傾向にある。代表スコアは、同一メトリックタイプに対応した2以上の集約スコアのうちの少なくとも1つに基づくスコアの一例であるが、基になる集約スコアが高いと、高い傾向にある。従って、条件該当グラフが行方向及び列方向の少なくとも1つに沿って隣り合う(例えば隣接する)ことが期待される。「条件該当グラフ」とは、代表スコア又は集約スコアのようなスコア(メトリック値を基に算出されたスコア)が所定のスコア条件に該当するグラフである。条件該当グラフは、例えば、表示対象の時間帯において、下記の(x1)〜(x2)の少なくとも1つのような条件(表示対象の時間帯においてメトリック値が悪いと定義された条件)、
(x1)閾値(例えば異常閾値)を超えるメトリック値が連続してW回以上取得された(Wは自然数)、
(x2)閾値以下であるが閾値との差が所定値未満のメトリック値が連続してw回以上取得された(wは自然数、且つ、w>W)、
を満たすグラフでよい。(x1)が該当する場合も(x2)が該当する場合も、時系列スコア、集約スコア及び代表スコアのうちの少なくとも1つのスコアが所定値以上に高くてよい。(x1)が該当する場合のスコアの方が、(x2)が該当する場合のスコアより高くてよい。
また、グラフ列の並び替えでは、グラフ行毎に、最高の集約スコアを含んだグラフ列が上位へと移動し、移動した1以上のグラフ列が固定化グラフ群とされる。固定化グラフ列群単位で、条件該当グラフが行方向に沿って隣接することが期待される。
また、グラフ列の並び替えでは、グラフ行群について、上位のグラフ行から下位のグラフ行へと順に参照され、参照されたグラフ行毎に、固定化グラフ列群が設定される。グラフ列の並び替えの前に、グラフ行の並び替えが行われ、グラフ行の並び替えでは、代表スコアの高いグラフ行が上位に配置される。つまり、代表スコアの高いグラフ行に対応した固定化グラフ列群ほど上位に配置される。
また、グラフ行の並び替えは、グラフ行群単位で行われる。第1のグラフ行群は、影響先リソースのメトリックタイプに対応したグラフ行群、例えば、基点リソースのメトリックタイプに対応したグラフ行群、具体的には、例えば、論理リソースのメトリックタイプに対応したグラフ行群である。第2のグラフ行群は、影響元リソースのメトリックタイプに対応したグラフ行群、例えば、基点リソースの関連リソースのメトリックタイプに対応したグラフ行群、具体的には、例えば、物理リソースのメトリックタイプに対応したグラフ行群である。そして、グラフ列の並び替えも、グラフ行群単位で行われる。具体的には、第1のグラフ行群に属する各グラフ行についてグラフ列が上位に集約され(グラフ列群が設定され)、その集約された範囲(設定されたグラフ列群の範囲)で、第2のグラフ行群に属する各グラフ行についてグラフ列が上位に集約される。つまり、影響先リソース(例えば論理リソース)及び影響元リソース(例えば物理リソース)の観点で区切られた範囲別に、条件該当グラフが行方向及び列方向の少なくとも1つに沿って隣接することが期待される。
また、複数の候補メトリックタイプから表示対象のメトリックタイプを絞り込むことは、「1つのリソースタイプにつきK個以下のメトリックタイプが表示対象とされる(Kは自然数)」のように、表示対象のメトリックタイプの数に制限がある場合には、有効である(例えばK=1)。
以上、幾つかの実施例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
例えば、互いに隣接したグラフ行間に隙間があってもよい。また、互いに隣接したグラフ列間に隙間があってもよい。
また、例えば、基点リソースが行に関連付けられ、メトリックタイプが列に関連付けられてもよい。この場合、時間軸が縦軸であって、数値軸が横軸であってもよい。
100:計算機システム 555:管理クライアント 557:管理サーバ

Claims (12)

  1. 複数のリソースタイプのリソースを含む複数のリソースを有する計算機システムの管理方法であって、
    前記複数のリソースそれぞれのメトリック時系列データを収集し、
    前記収集した各リソースのメトリック時系列データを記憶部に格納し、
    リソースの選択を受け付け、
    前記選択リソースと、前記記憶部にあらかじめ記憶されている複数のリソース情報および複数のリソース同士の関連情報に基づき、複数の基点となるリソースである基点リソースおよび該基点リソースの関連リソースを決定し、
    前記記憶部から、前記複数の基点リソースおよび該基点リソースの関連リソースの、所定の時間帯におけるメトリック時系列データを取得し、
    列方向に並べられた前記複数の基点リソースごとに、前記基点リソースのメトリック時系列データおよび前記基点リソースの関連リソースそれぞれのメトリック時系列データとして、横軸を時間軸とし、縦軸をメトリック値とした2次元直交座標系のグラフを行方向に並べて一括表示する、
    ことを特徴とする管理方法。
  2. 前記メトリック時系列データは、リソースタイプごとに選択されたメトリックタイプごとの時系列データである、
    請求項1記載の管理方法。
  3. 同一のリソースを共有するリソースのメトリック時系列データを強調表示する、
    ことを特徴とする請求項1記載の管理方法。
  4. 前記複数の基点リソースは、リソース一覧からユーザにより選択されたリソースと、所定のリソース条件に該当するリソースとのうちの少なくとも1つに該当するリソースである、
    ことを特徴とする請求項1記載の管理方法。
  5. 所定のリソース条件に該当するリソースは、下記のうちの少なくとも1つに該当するリソースである、
    同一のリソースタイプに属する、
    同一のレイヤに属する、
    同一のリソースに関連する、及び、
    同一筐体に存在する
    ことを特徴とする請求項4に記載の管理方法。
  6. ユーザ操作に応答して、表示対象を絞り込む、
    ことを特徴とする請求項1に記載の管理方法。
  7. ユーザ操作に応答して、表示されている時系列データを行単位で並び替える、
    ことを特徴とする請求項1に記載の管理方法。
  8. ユーザ操作に応答して、表示されている時系列データを列単位で並び替える、
    ことを特徴とする請求項1に記載の管理方法。
  9. 前記複数の基点リソースは、同一のリソースレイヤに属する論理リソースであり、前記複数の基点リソースの関連リソースは物理リソースである、
    ことを特徴とする請求項1に記載の管理方法。
  10. 前記論理リソースの時系列メトリックデータは、前記物理リソースの時系列データよりも上位に位置する、
    ことを特徴とする請求項9に記載の管理方法。
  11. ユーザ操作に応答して、前記リソースタイプに対応した前記メトリックタイプを追加する、
    ことを特徴とする請求項2記載の管理方法。
  12. ユーザ操作に応答して、前記メトリック時系列データを追加する、
    ことを特徴とする請求項1または請求項2に記載の管理方法。
JP2019049353A 2019-03-18 2019-03-18 計算機システムを管理する管理システム Active JP6675023B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019049353A JP6675023B2 (ja) 2019-03-18 2019-03-18 計算機システムを管理する管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019049353A JP6675023B2 (ja) 2019-03-18 2019-03-18 計算機システムを管理する管理システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018513964A Division JP6500165B2 (ja) 2016-04-26 2016-04-26 計算機システムを管理する管理システム

Publications (2)

Publication Number Publication Date
JP2019125387A JP2019125387A (ja) 2019-07-25
JP6675023B2 true JP6675023B2 (ja) 2020-04-01

Family

ID=67398937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019049353A Active JP6675023B2 (ja) 2019-03-18 2019-03-18 計算機システムを管理する管理システム

Country Status (1)

Country Link
JP (1) JP6675023B2 (ja)

Also Published As

Publication number Publication date
JP2019125387A (ja) 2019-07-25

Similar Documents

Publication Publication Date Title
JP6077660B2 (ja) 計算機システムの管理システム
US10523538B2 (en) User interface that provides a proactive monitoring tree with severity state sorting
US20190377463A1 (en) User interface that facilitates node pinning for a proactive monitoring tree
US10169303B2 (en) Management system for managing information system
JP4434235B2 (ja) 計算機システムまたは計算機システムの性能管理方法
US10417195B2 (en) Management system for managing information system
US20180096499A1 (en) Proactive monitoring tree providing pinned performance information associated with a selected node
US20160026552A1 (en) System, Method, and Computer Program Product for Storage Management Dashboard
US20140320500A1 (en) Proactive monitoring tree with state distribution ring
US10275411B2 (en) Management system for computer system
US11086682B2 (en) Management system for managing computer system
JP2007533034A (ja) Hpcクラスタを管理するためのグラフィカル・ユーザ・インタフェース
JP6993495B2 (ja) クラウド・ネットワーキングにおけるスケーラブルな統計及び分析メカニズム
JP6448779B2 (ja) サーバストレージシステムを含んだ計算機システム
JP6675023B2 (ja) 計算機システムを管理する管理システム
JP6878369B2 (ja) ボリューム配置管理装置、ボリューム配置管理方法、及びボリューム配置管理プログラム
US20140089473A1 (en) Information processing system and management method thereof
US11222072B1 (en) Graph database management system and method for a distributed computing environment
JP2011070464A (ja) 計算機システム及び計算機システムの性能管理方法
US20170160704A1 (en) Management system for managing information system
US11860835B1 (en) Efficient drop column requests in a non-relational data store
JP6421240B2 (ja) 計算機システムを管理する管理システム
JP6842502B2 (ja) 障害解析支援システム、障害解析支援方法、及び、コンピュータプログラム
JP2007133482A (ja) 親オブジェクトを自動的に表示する計算機及びその表示方法
JP7451697B2 (ja) データ記憶方法、装置、クエリ方法、電子機器および可読媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190318

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200309

R150 Certificate of patent or registration of utility model

Ref document number: 6675023

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150