JP6588956B2 - 計算機、ボトルネック特定方法、及びプログラム - Google Patents

計算機、ボトルネック特定方法、及びプログラム Download PDF

Info

Publication number
JP6588956B2
JP6588956B2 JP2017218981A JP2017218981A JP6588956B2 JP 6588956 B2 JP6588956 B2 JP 6588956B2 JP 2017218981 A JP2017218981 A JP 2017218981A JP 2017218981 A JP2017218981 A JP 2017218981A JP 6588956 B2 JP6588956 B2 JP 6588956B2
Authority
JP
Japan
Prior art keywords
metric
correlation
monitoring
metric value
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017218981A
Other languages
English (en)
Other versions
JP2019091199A (ja
Inventor
拓海 平田
拓海 平田
大坪 一紀
一紀 大坪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017218981A priority Critical patent/JP6588956B2/ja
Priority to US16/121,522 priority patent/US11042463B2/en
Publication of JP2019091199A publication Critical patent/JP2019091199A/ja
Application granted granted Critical
Publication of JP6588956B2 publication Critical patent/JP6588956B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems

Description

本発明は、監視対象のシステムのボトルネックを特定する計算機、方法、及びプログラムに関する。
データセンタ等のような計算機システムでは、仮想化技術等を用いて所定のサービスを実現するシステムが構成される。このような計算機システムでは、監視対象のリソースの数及びリソースから計測されるメトリックの数が多いため、ボトルネックを特定することが非常に困難である。
前述の課題を解決する技術として、特許文献1に記載の技術が知られている。特許文献1には、「運用管理装置は、性能情報の時系列変化を示す性能系列情報から性能情報間の複数の相関関数および各相関関数の予測誤差を示す重み情報を含む相関モデルを生成する相関モデル生成部と、性能情報のうちの第1の性能情報から第2の性能情報を予測しうる相関関数またはその組み合わせによる経路が相関モデルの中に複数存在する場合に、重み情報の数値が最大となる経路を利用して第2の性能情報を予測するモデル探索部を含む。」ことが記載されている。
特開2011−146074号公報
特許文献1を用いることによって、管理者の負担を低減しつつ、ボトルネックを特定することができる。しかし、リソース及びメトリックの数が多い場合、すなわち、分析する要素が多い場合、ボトルネックを特定するためには非常に時間が掛かるという問題がある。
本発明は、迅速にボトルネックを特定することができるシステム及び方法を提供することを目的とする。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、性能を評価するための指標であるメトリックの計測対象となるリソースを管理する計算機であって、前記計算機は、プロセッサ、前記プロセッサに接続される記憶装置、及び、前記プロセッサに接続されるインタフェースを有し、前記インタフェースを介して、複数のリソースから構成される管理対象システムと接続し、前記記憶装置は、前記メトリック間の相関の強さを示す相関係数を管理するための相関情報を格納し、前記計算機は、監視リソースの監視メトリックのメトリック値に基づいて、ボトルネックを特定する契機を検出し、前記監視リソースと接続関係を有する関連リソースを特定し、前記相関情報に基づいて、前記関連リソースのメトリックの中から前記監視メトリックとの間の相関が強い相関メトリックを特定し、前記関連リソース及び前記相関メトリックの組合せをボトルネック候補として特定し、前記ボトルネック候補を通知する通知情報を生成して、前記通知情報を出力することを特徴とする。
本発明の一形態によれば、計算機は、迅速に、ボトルネック(ボトルネック候補)を特定することができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1の計算機システムの構成例を示す図である。 実施例1の管理対象システムに構築された業務システムの構成例を示す図である。 実施例1の構成情報のデータ構造の一例を示す図である。 実施例1のリソース関連情報のデータ構造の一例を示す図である。 実施例1のメトリック相関情報のデータ構造の一例を示す図である。 実施例1の相関係数情報のデータ構造の一例を示す図である。 実施例1のメトリック値履歴情報のデータ構造の一例を示す図である。 実施例1のメトリック変換情報のデータ構造の一例を示す図である。 実施例1の変換関数情報のデータ構造の一例を示す図である。 実施例1の管理サーバがボトルネックを特定する契機を検出した場合に実行する処理の概要を説明するフローチャートである。 実施例1の管理サーバが実行する関連リソース特定処理を説明するフローチャートである。 実施例1の管理サーバが実行する高相関メトリック特定処理を説明するフローチャートである。 実施例1の管理サーバが実行するボトルネック候補特定処理を説明するフローチャートである。 実施例1の管理サーバが実行する推定メトリック値算出処理を説明するフローチャートである。 実施例1のクライアント端末に表示される操作画面の一例を示す図である。 実施例1の管理サーバが実行するメトリック相関情報及び相関係数情報の更新処理の一例を説明するフローチャートである。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。
図1は、実施例1の計算機システムの構成例を示す図である。図2は、実施例1の管理対象システム103に構築された業務システムの構成例を示す図である。
計算機システムは、管理サーバ100、クライアント端末101、及び管理対象システム103から構成される。管理サーバ100、クライアント端末101、及び管理対象システム103は、ネットワーク105を介して互いに接続される。ネットワーク105は、例えば、LAN(Local Area Network)及びWAN(Wide Area Network)等である。なお、接続方式は、有線又は無線のいずれでもよい。
管理対象システム103は、複数の装置から構成されるシステムである。管理対象システム103上には、所定のサービスを実現する業務システムが構築される。業務システムは、物理的及び仮想的なリソース群から構成される。
本実施例の管理対象システム103は、図2に示すように、三つの計算機201−1、201−2、201−3、二つのスイッチ202−1、202−2、及びストレージ装置203を含む。管理対象システム103では、ホスト計算機、ストレージシステム、及びSAN(Storage Area Network)から構成される業務システムが稼働する。
ホスト計算機は、アプリケーション(APP)、仮想計算機(VM)、ハイパバイザ(HV)、及びデータストア(DS)をリソースとして有する。SANは、スイッチ202をリソースとして有する。ストレージシステムは、ポート、論理デバイス(LDEV)、MPブレード(MP)、記憶領域プール(Pool)、物理ボリュームグループ(PG)、及びキャッシュをリソースとして有する。
リソースからはリソースの性能を評価するための指標の値を計測することができる。以下の説明では、指標をメトリックと記載する。また、前述の指標の値をメトリック値と記載する。メトリックは、例えば、プロセッサの使用率、メモリの使用率、レスポンスタイム、及び通信の遅延等である。
本実施例では、リソース及びメトリックの組合せがボトルネックとして特定される。なお、ボトルネックとして特定されるリソースにはアプリケーションは含まれないものとする。
管理サーバ100は、管理対象システム103を管理し、また、障害又は性能低下等が発生した場合、ボトルネックを特定する。管理対象システム103の管理には、システムの構築、システム構成の変更、及びシステムの監視等が含まれる。
クライアント端末101は、管理サーバ100を操作するユーザが使用する端末である。なお、ユーザが管理サーバ100を直接操作することができる場合、計算機システムには、クライアント端末101が含まれなくてもよい。
管理サーバ100のハードウェア構成及びソフトウェア構成について説明する。
管理サーバ100は、ハードウェアとして、プロセッサ111、メモリ112、及びネットワークインタフェース113を有する。各ハードウェアは内部バス等を介して互いに接続される。なお、管理サーバ100は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等の記憶媒体を有してもよい。
プロセッサ111は、メモリ112に格納されるプログラムを実行する。プロセッサ111がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、プロセッサ111が当該機能部を実現するプログラムを実行していることを示す。
メモリ112は、プロセッサ111が実行するプログラム及びプログラムが使用する情報を格納する。また、メモリ112は、プログラムが使用するワークエリアを含む。メモリ112に格納されるプログラム及び情報の詳細は後述する。
ネットワークインタフェース113は、ネットワークを介して他の装置と接続するためのインタフェースである。
メモリ112に格納されるプログラム及び情報について説明する。メモリ112は、サーバ制御部121、分析対象判定部122、相関情報生成部123、ボトルネック特定部124、及びメトリック値推定部125を実現するプログラムを格納する。また、メモリ112は、構成情報141、リソース関連情報142、メトリック相関情報143、相関係数情報144、メトリック値履歴情報145、メトリック変換情報146、及び変換関数情報147を格納する。
構成情報141は、業務システムを構成するリソースを管理するための情報である。構成情報141の詳細は図3を用いて説明する。リソース関連情報142は、リソースの関連性を管理するための情報である。リソース関連情報142の詳細は図4を用いて説明する。
メトリック相関情報143は、各リソースのメトリック間の相関関係を管理するための情報である。相関係数情報144は、メトリック相関情報143において定義された相関関係の強さを表す相関係数を管理するための情報である。メトリック相関情報143及び相関係数情報144の詳細は図5及び図6を用いて説明する。
メトリック値履歴情報145は、計測されたメトリック値の履歴を管理するための情報である。メトリック値履歴情報145の詳細は図7を用いて説明する。
メトリック変換情報146は、任意のリソースのメトリック値から他のリソースのメトリック値への変換方法を管理するための情報である。変換関数情報147は、メトリック値を変換する変換関数を管理するための情報である。メトリック変換情報146及び変換関数情報147の詳細は図8及び図9を用いて説明する。
サーバ制御部121は、管理サーバ100全体を制御する。分析対象判定部122は、分析を行うリソース及びメトリックの組合せを決定する。分析対象判定部122は、リソース絞込み部131及びメトリック絞込み部132を含む。相関情報生成部123は、メトリック相関情報143及び相関係数情報144を生成し、また、更新する。ボトルネック特定部124は、分析を行い、分析結果に基づいてボトルネックを特定する。メトリック値推定部125は、メトリック値の推定値(推定メトリック値)を算出する。
分析対象判定部122、相関情報生成部123、ボトルネック特定部124、及びメトリック値推定部125が実行する処理の詳細については後述する。
以上が、管理サーバ100のハードウェア構成及びソフトウェア構成の説明である。次に、クライアント端末101のハードウェア構成及びソフトウェア構成について説明する。
クライアント端末101は、ハードウェアとして、プロセッサ151、メモリ152、ネットワークインタフェース153、入力デバイス154、及び出力デバイス155を有する。各ハードウェアは内部バス等を介して互いに接続される。
プロセッサ151、メモリ152、及びネットワークインタフェース153は、プロセッサ111、メモリ112、及びネットワークインタフェース113と同様のハードウェアである。入力デバイス154は、データを入力するためのデバイスである。入力デバイス154は、例えば、キーボード、マウス、及びタッチパネル等である。出力デバイス155は、データを出力するためのデバイスである。出力デバイス155は、例えば、タッチパネル及びディスプレイ等である。なお、ネットワークインタフェース113が出力デバイス155として用いられてもよい。
メモリ152は、クライアント端末101全体を制御するクライアント制御部161を格納する。
なお、管理サーバ100及びクライアント端末101のそれぞれが有する機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を複数の機能部に分けてもよい。
図3は、実施例1の構成情報141のデータ構造の一例を示す図である。
構成情報141は、リソース名301及びコンポーネント種別302から構成されるエントリを含む。一つのエントリが業務システムを構成する一つのリソースに対応する。
リソース名301は、業務システムを構成するリソースを一意に識別するための識別名称を格納するフィールドである。コンポーネント種別302は、リソースを実現するハードウェア及びソフトウェア等のリソースの種別を識別するための情報を格納するフィールドである。
本実施例では、管理サーバ100は、周期的に、構成情報141を用いて管理される複数のリソースのメトリックを計測する。計測されたメトリック値はメトリック値履歴情報145に格納される。
図4は、実施例1のリソース関連情報142のデータ構造の一例を示す図である。
リソース関連情報142は、リソース名401及び使用リソース名402から構成されるエントリを含む。リソース及び使用リソースの一つの組合せに対してエントリが一つ存在する。
リソース名401は、リソース名301と同一のフィールドである。使用リソース名402は、リソース名401に対応するリソースと関連があるリソースの識別名称を格納するフィールドである。
本実施例では、仮想計算機を最上位の層とし、物理ボリューム又はキャッシュを最下位の層としたツリー構造としてリソースの関連性(接続関係)を定義している。
図5は、実施例1のメトリック相関情報143のデータ構造の一例を示す図である。図6は、実施例1の相関係数情報144のデータ構造の一例を示す図である。
メトリック相関情報143は、行列形式のデータ構造の情報である。メトリック相関情報143は、一つのリソースの組合せに対して一つ存在する。行及び列は、各リソースのメトリックに対応する。
メトリック間に相関がある場合、当該メトリックの組合せによって特定されるセルには相関係数情報144から相関係数を読み出すための識別情報が格納される。なお、同一のメトリックのセルには相関係数が設定されないように制御される。
相関係数情報144は、一つのリソースの組合せに対して一つ存在する。相関係数情報144は、相関係数ID601及び相関係数602から構成されるエントリを含む。一つのエントリが一つの相関係数に対応する。
相関係数ID601は、相関係数の識別情報を格納するフィールドである。相関係数602は、メトリック間の相関の強さを表す相関係数を格納するフィールドである。なお、相関係数は「−1」以上かつ「1」以下の実数である。相関係数の絶対値が1に近いほど、メトリック間の相関が強いことを示す。
本実施例の管理サーバ100は、メトリックの相関関係を管理するために、メトリック相関情報143及び相関係数情報144を保持しているが、セルに相関係数が設定されたメトリック相関情報143のみを保持してもよい。
図7は、実施例1のメトリック値履歴情報145のデータ構造の一例を示す図である。
メトリック値履歴情報145は、リソース名701、メトリック702、時刻703、及びメトリック値704から構成されるエントリを含む。
リソース名701は、リソース名301と同一のフィールドである。メトリック702は、リソース名701に対応するリソースから取得可能なメトリックの識別情報を格納するフィールドである。時刻703は、計測時刻を格納するフィールドである。メトリック値704は、計測されたメトリック値を格納するフィールドである。
図8は、実施例1のメトリック変換情報146のデータ構造の一例を示す図である。図9は、実施例1の変換関数情報147のデータ構造の一例を示す図である。
メトリック変換情報146は、変換元801、変換先802、及び関数ID803から構成されるエントリを含む。一つのエントリが一つの変換方法の定義情報に対応する。
変換元801は、変換元のメトリックを指定するフィールド群であり、リソース名811及びメトリック812を含む。変換先802は、変換先のメトリックを指定するフィールド群であり、リソース名821及びメトリック822を含む。関数ID803は、変換関数の識別情報を格納するフィールドである。変換関数は、変換元801によって指定されるメトリック値から変換先802によって指定されるメトリック値を算出するための関数である。
変換関数情報147は、関数ID901、関数902、及びパラメータ903から構成されるエントリを含む。一つのエントリが一つの変換関数に対応する。
関数ID901は関数ID803と同一のフィールドである。関数902は、変換関数を格納するフィールドである。パラメータ903は、変換関数に設定されたパラメータの値を格納するフィールドである。パラメータを含む関数及びパラメータを分けて管理することによって、変換関数の管理を容易にすることができる。
本実施例の管理サーバ100は、変換関数を管理するために、メトリック変換情報146及び変換関数情報147を保持しているが、関数ID803の代わりに、パラメータ値が設定された変換関数を格納するフィールドを含むメトリック変換情報146のみを保持してもよい。
次に、図10から図14を用いて、管理サーバ100がボトルネック候補を特定するために実行する処理について説明する。
図10は、実施例1の管理サーバ100がボトルネックを特定する契機を検出した場合に実行する処理の概要を説明するフローチャートである。
本実施例では、以下で説明する処理の実行契機を検出するために監視するリソース及びメトリックの組合せは予め設定されているものとする。以下の説明では、処理の実行契機を検出するために監視するリソース及びメトリックを監視リソース及び監視メトリックと記載する。
なお、本発明はボトルネックと特定する契機に限定されない。例えば、管理サーバ100は、任意のリソースのメトリック値及び閾値を比較し、比較結果に基づいて性能劣化が発生しているか否かを判定する。性能劣化が発生していると判定された場合、管理サーバ100は、以下で説明する処理を開始する。なお、管理サーバ100は、外部から性能劣化の発生通知を受信した場合に処理を開始するようにしてもよい。
まず、管理サーバ100のサーバ制御部121は、分析対象判定部122を呼び出し、監視リソースの関連リソースを特定するための関連リソース特定処理の実行を指示する(ステップS101)。当該処理を実行することによって分析対象のリソースの数を削減することができる。関連リソース特定処理の詳細は図11を用いて説明する。ここで、関連リソースは、起点となるリソースが直接又は他のリソースを介して接続可能なリソースを表す。
次に、管理サーバ100のサーバ制御部121は、分析対象判定部122を呼び出し、関連リソースのメトリックの中から監視リソースと高い相関があるメトリック(高相関メトリック)を特定するための高相関メトリック特定処理の実行を指示する(ステップS102)。当該処理を実行することによって分析対象のメトリックの数を削減することができる。高相関メトリック特定処理の詳細は図12を用いて説明する。
次に、管理サーバ100のサーバ制御部121は、ボトルネック特定部124を呼び出し、ボトルネック候補特定処理の実行を指示する(ステップS103)。当該処理を実行することによって、ボトルネック候補リストが生成される。ボトルネック候補特定処理の詳細は図13を用いて説明する。
次に、管理サーバ100のボトルネック特定部124は、ボトルネック候補リストを提示するための表示情報を生成し、当該表示情報を出力し(ステップS104)、その後、処理を終了する。例えば、管理サーバ100は、表示情報をクライアント端末101に送信する。
図11は、実施例1の管理サーバ100が実行する関連リソース特定処理を説明するフローチャートである。
分析対象判定部122のリソース絞込み部131は、監視リソースを起点リソースに設定する(ステップS201)。
具体的には、リソース絞込み部131は、起点リソースを表す変数に監視リソースの識別名称を設定する。また、リソース絞込み部131は、経路情報及び関連リソースリストを初期化する。
次に、リソース絞込み部131は、リソース関連情報142を参照し(ステップS202)、起点リソースに接続可能なリソースが存在するか否かを判定する(ステップS203)。
具体的には、リソース絞込み部131は、リソース名401に起点リソースとして設定されるリソースの識別名称が設定されたエントリを検索する。前述のエントリが存在する場合、リソース絞込み部131は、起点リソースに接続可能なリソースが存在すると判定する。
起点リソースに接続可能なリソースが存在すると判定された場合、リソース絞込み部131は、検索されたエントリを経路情報に登録することによって、経路情報を更新する(ステップS204)。このとき、リソース絞込み部131は、起点リソースに接続可能なリソースを未処理の関連リソースのリストに登録する。
次に、リソース絞込み部131は、未処理の関連リソースを新たな起点リソースに設定する(ステップS205)。その後、リソース絞込み部131は、ステップS202に戻り、同様の処理を実行する。このとき、リソース絞込み部131は、未処理の関連リソースのリストから、新たな起点リソースの識別名称を削除する。
起点リソースに接続可能なリソースが存在しないと判定された場合、リソース絞込み部131は、未処理の関連リソースが存在するか否かを判定する(ステップS206)。
未処理の関連リソースが存在すると判定された場合、リソース絞込み部131は、ステップS205に進む。
未処理の関連リソースが存在しないと判定された場合、リソース絞込み部131は、経路情報を用いて関連リソースリストを生成する(ステップS207)。
具体的には、リソース絞込み部131は、経路情報に登録されたエントリの使用リソース名402の値を読み出し、当該値を関連リソースリストに登録する。このとき、リソース絞込み部131は、重複する値が関連リソースリストに登録されないように制御する。リソース絞込み部131は、生成された関連リソースリストをメトリック絞込み部132に出力する。
図12は、実施例1の管理サーバ100が実行する高相関メトリック特定処理を説明するフローチャートである。
分析対象判定部122のメトリック絞込み部132は、関連リソースのループ処理を開始する(ステップS301)。
具体的には、メトリック絞込み部132は、関連リソースリストに登録された関連リソースの中から一つの関連リソースを選択する。このとき、メトリック絞込み部132は、高相関メトリックリストを初期化する。
次に、メトリック絞込み部132は、関連リソースのメトリックのループ処理を開始する(ステップS302)。
具体的には、メトリック絞込み部132は、関連リソースから取得可能なメトリックの中から一つのメトリックを選択する。以下の説明では、メトリック絞込み部132によって選択されたメトリックを選択メトリックと記載する。
次に、メトリック絞込み部132は、監視リソース及び関連リソースの組合せに対応するメトリック相関情報143及び相関係数情報144を参照して、監視メトリック及び選択メトリックの相関係数を取得する(ステップS303)。
具体的には、メトリック絞込み部132は、監視リソース及び関連リソースの組合せに対応するメトリック相関情報143を参照して、監視メトリック及び選択メトリックの組合せに一致するセルに設定された相関係数の識別情報を取得する。また、メトリック絞込み部132は、監視リソース及び関連リソースの組合せに対応する相関係数情報144を参照し、相関係数ID601が取得した相関係数の識別情報に一致するエントリを検索し、検索されたエントリの相関係数602に格納される相関係数を取得する。
次に、メトリック絞込み部132は、相関係数が第1閾値以上であるか否かを判定する(ステップS304)。第1閾値は予め設定されているものとする。ただし、第1閾値は適宜変更することができる。
相関係数が第1閾値より小さいと判定された場合、メトリック絞込み部132は、ステップS306に進む。
相関係数が第1閾値以上であると判定された場合、メトリック絞込み部132は、高相関メトリックリストに、関連リソース、選択メトリック、及び相関係数から構成されるエントリを登録する(ステップS305)。その後、メトリック絞込み部132は、ステップS306に進む。
ステップS306において、メトリック絞込み部132は、選択された関連リソースの全てのメトリックについて処理が完了したか否かを判定する(ステップS306)。
選択された関連リソースの全てのメトリックについて処理が完了していないと判定された場合、メトリック絞込み部132は、ステップS302に戻り、新たなメトリックを選択し、同様の処理を実行する。
選択された関連リソースの全てのメトリックについて処理が完了したと判定された場合、メトリック絞込み部132は、関連リソースリストに登録された全ての関連リソースについて処理が完了したか否かを判定する(ステップS307)。
関連リソースリストに登録された全ての関連リソースについて処理が完了していないと判定された場合、メトリック絞込み部132は、ステップS301に戻り、関連リソースリストの中から新たな関連リソースを選択し、同様の処理を実行する。
関連リソースリストに登録された全ての関連リソースについて処理が完了したと判定された場合、メトリック絞込み部132は、処理を終了する。このとき、メトリック絞込み部132は、高相関メトリックリストをボトルネック特定部124に出力する。
図13は、実施例1の管理サーバ100が実行するボトルネック候補特定処理を説明するフローチャートである。
管理サーバ100のボトルネック特定部124は、高相関メトリックのループ処理を開始する(ステップS401)。
具体的には、ボトルネック特定部124は、高相関メトリックリストの中からリソース及びメトリックの組合せを一つ選択する。このとき、ボトルネック特定部124は、ボトルネック候補リストを初期化する。以下の説明では、ボトルネック特定部124によって選択されたリソース及びメトリックを、ターゲットリソース及びターゲットメトリックと記載する。
次に、ボトルネック特定部124は、メトリック値推定部125に、推定メトリック値算出処理の実行を指示する(ステップS402)。推定メトリック値算出処理の詳細は図14を用いて説明する。推定メトリック値算出処理では、監視メトリックの推定メトリック値の時系列データが算出される。
ボトルネック特定部124は、メトリック値推定部125から監視メトリックの推定メトリック値の時系列データが出力されるまで待ち状態に移行する。
メトリック値推定部125から監視メトリックの推定メトリック値が出力された場合、ボトルネック特定部124は、相関分析処理を実行する(ステップS403)。
具体的には、ボトルネック特定部124は、メトリック値履歴情報145から監視メトリックのメトリック値の時系列データを取得する。ボトルネック特定部124は、監視メトリックのメトリック値の時系列データ及び推定メトリック値の時系列データを用いて、二つのメトリック間の相関係数を算出する。また、ボトルネック特定部124は、メトリック相関情報143及び相関係数情報144を参照して、ターゲットメトリック及び監視メトリックの相関係数を取得し、算出された相関係数及び取得された相関係数の誤差を算出する。
相関係数は、性能劣化の発生時における高相関メトリック及び監視メトリックの間の相関の強さを評価する指標として用いられる。相関係数の誤差は、性能劣化等の発生時における相関関係の異常を評価する指標として用いられる。
高相関メトリック及び監視メトリックの相関が強い場合、高相関メトリックが、監視メトリックに影響を与えている可能性が高い。すなわち、関連リソースの高相関メトリックがボトルネックである可能性が高い。また、相関係数の誤差が大きい場合、性能劣化等によって相関関係が破壊されていることを示すことから、高相関メトリックが、監視メトリックに影響を与えている可能性が高い。すなわち、関連リソースの高相関メトリックがボトルネックである可能性が高い。
ボトルネック特定部124は、算出された相関係数が第2閾値以上であるか否かを判定する(ステップS404)。
算出された相関係数が第2閾値より小さいと判定された場合、ボトルネック特定部124は、取得された相関係数が第3閾値以上、かつ、算出された相関係数の誤差が第4閾値以上であるか否かを判定する(ステップS405)。
ステップS405の条件を満たさないと判定された場合、ボトルネック特定部124は、ステップS407に進む。
ステップS405の条件を満たすと判定された場合、ボトルネック特定部124は、ステップS406に進む。
ステップS404において、算出された相関係数が第2閾値以上であると判定された場合、ボトルネック特定部124は、ステップS406に進む。
ステップS406では、ボトルネック特定部124は、ターゲットリソース及びターゲットメトリックの組合せをボトルネック候補としてボトルネック候補リストに登録する(ステップS406)。その後、ボトルネック特定部124は、ステップS407に進む。
具体的には、ボトルネック特定部124は、ターゲットリソース及びターゲットメトリックから構成されるエントリをボトルネック候補リストに登録する。なお、ターゲットリソース、ターゲットメトリック、及び算出された相関係数から構成されるエントリがボトルネック候補リストに登録されてもよい。
ステップS407では、ボトルネック特定部124は、高相関メトリックリストに登録された全てのリソース及びメトリックの組合せについて処理が完了したか否かを判定する。
高相関メトリックリストに登録された全てのリソース及びメトリックの組合せについて処理が完了していないと判定された場合、ボトルネック特定部124は、ステップS401に戻り、新たな組合せを選択し、同様の処理を実行する。
高相関メトリックリストに登録された全てのリソース及びメトリックの組合せについて処理が完了したと判定された場合、ボトルネック特定部124は処理を終了する。
なお、相関分析は統計分析処理の一例であってこれに限定されない。例えば、ステップS403において、ボトルネック特定部124は、監視メトリックのメトリック値の時系列データ及び推定メトリック値の時系列データの差の合計値を算出し、ステップS404において当該合計値が閾値以上であるか否かを判定する。合計値が閾値より小さい場合、ボトルネック特定部124はステップS406に進み、合計値が閾値以上の場合、ボトルネック特定部124はステップS407に進む。
なお、ボトルネック特定部124は、ステップS402から及びステップS405までの処理を実行せずに、高相関メトリックリストをボトルネック候補リストとして出力してもよい。例えば、高相関メトリックリストに登録されている高相関メトリックの数が閾値より小さい場合、前述のような操作を行うことによって、高速にボトルネック候補を提示することができる。
なお、ボトルネック特定部124は、ステップS401において、ターゲットメトリックのメトリック値の時系列データを取得し、メトリック値の時間変化が小さい場合、当該ターゲットメトリックについては、ステップS402からステップS406の処理を実行せずにステップS407に進んでもよい。メトリック値の時間変化は、移動平均等のメトリックの時間変化を示す指標に基づいて判定できる。障害が発生した時の時系列データの変化が小さい場合、当該メトリックは、障害に関係がないと推定できる。したがって、前述のような操作を行うことによって、分析対象のメトリックを削減できるため、ボトルネック特定処理の高速化を実現できる。
図14は、実施例1の管理サーバ100が実行する推定メトリック値算出処理を説明するフローチャートである。
管理サーバ100のメトリック値推定部125は、メトリック値履歴情報145から高相関メトリックのメトリック値の時系列データを取得する(ステップS501)。
具体的には、メトリック値推定部125は、リソース名701及びメトリック702の組合せが関連リソース及び選択メトリックの組合せに一致するエントリを検索する。さらに、メトリック値推定部125は、検索されたエントリの時刻703を参照し、所定の時間範囲に含まれるエントリのメトリック値704の値を読み出す。すなわち、メトリック値の時系列データが読み出される。なお、時間範囲は予め設定されているものとする。
次に、メトリック値推定部125は、読み出されたメトリック値の時系列データを用いて、監視メトリックの推定メトリック値の時系列データを算出する(ステップS502)。その後、メトリック値推定部125は、処理を終了する。具体的には、以下のような処理が実行される。
メトリック値推定部125は、メトリック変換情報146を参照し、変換元801のリソース名811及びメトリック812の組合せが、ターゲットリソース及びターゲットメトリックの組合せに一致し、かつ、変換先802のリソース名821及びメトリック822の組合せが、監視リソース及び監視メトリックの組合せに一致するエントリを検索する。メトリック値推定部125は、検索されたエントリの関数ID803から識別情報を取得する。
メトリック値推定部125は、変換関数情報147を参照し、関数ID901が取得した識別情報と一致するエントリを検索する。メトリック値推定部125は、検索されたエントリに格納される変換関数の情報及び高相関メトリックのメトリック値の時系列データに基づいて、監視メトリックの推定メトリック値の時系列データを算出する。以上がステップS502の処理の説明である。
図15は、実施例1のクライアント端末101に表示される操作画面の一例を示す図である。
操作画面1500は、ボトルネックを特定するために必要な情報を設定し、また、ボトルネック候補リストを表示するための画面である。操作画面1500は、監視リソース表示欄1510、監視メトリック表示欄1511、閾値設定欄1512、1513、期間設定欄1514、対象メトリック選択欄1515、対象リソース選択欄1516、閾値設定欄1517、関連リソースリスト表示欄1520、ボトルネック候補リスト表示欄1530、及びグラフ表示欄1540を含む。
監視リソース表示欄1510は、監視リソースを表示する欄である。監視メトリック表示欄1511は、監視メトリックを表示する欄である。
閾値設定欄1512は、第2閾値を設定するための欄である。閾値設定欄1513は、第3閾値を設定するための欄である。
期間設定欄1514は、推定メトリック値の算出時に取得する時系列データの時間幅を設定するための欄である。
対象メトリック選択欄1515及び対象リソース選択欄1516は、処理対象のメトリック及びリソースを指定するための欄である。対象メトリック選択欄1515は、高相関メトリックとして特定されたメトリックの全て又は一部を対象とするかを選択するためのラジオボタンを含む。対象リソース選択欄1516は、高相関メトリックを特定する場合に対象とする関連リソースを選択するためのラジオボタンを含む。
閾値設定欄1517は、第1閾値を設定するための欄である。本実施例では、対象リソース選択欄1516の「絞込み」のラジオボタンが操作された場合、閾値設定欄1517への値の入力が可能となる。
関連リソースリスト表示欄1520は関連リソースリストを表示する欄である。関連リソースリスト表示欄1520では、リソースの識別名称がリスト形式に表示される。
ボトルネック候補リスト表示欄1530は、ボトルネック候補リストを表示する欄である。ボトルネック候補リスト表示欄1530は、選択ボタン1531、リソース名1532、メトリック1533、及び相関係数1534から構成されるエントリを一つ以上含む。リソース名1532及びメトリック1533は、リソース名301及びメトリック702と同一のフィールドである。相関係数1534は、ステップS403において算出された相関係数を格納するフィールドである。選択ボタン1531は、グラフ表示欄1540に、表示するメトリック値を選択するためのボタンである。
グラフ表示欄1540は、選択ボタン1531が操作されたエントリに対応する監視メトリックのメトリック値及び推定メトリック値の時系列データを表示する欄である。なお、図15では、実線がメトリック値履歴情報145から読み出されたメトリック値の時系列データを表し、破線が推定メトリック値の時系列データを表す。
次に、メトリック相関情報143及び相関係数情報144の更新処理について説明する。図16は、実施例1の管理サーバ100が実行するメトリック相関情報143及び相関係数情報144の更新処理の一例を説明するフローチャートである。
管理サーバ100は、以下で説明する処理を周期的に実行する。なお、管理サーバはユーザからの指示を受け付けた場合に処理を実行してもよい。
管理サーバ100の相関情報生成部123は、リソースのループ処理を開始する(ステップS601)。
具体的には、相関情報生成部123は、構成情報141からリソースを一つ選択する。例えば、上のエントリから順に選択する方法が考えられる。
次に、相関情報生成部123は、関連リソース特定処理を実行する(ステップS602)。関連リソース特定処理は、図11に示す処理と同一であるため説明を省略する。
次に、相関情報生成部123は、関連リソースのループ処理を開始する(ステップS603)。
具体的には、相関情報生成部123は、関連リソースリストに登録された関連リソースの中から一つの関連リソースを選択する。
次に、相関情報生成部123は、リソースのメトリックのループ処理を開始する(ステップS604)。
具体的には、相関情報生成部123は、リソースのメトリックの中からメトリックを一つ選択する。以下の説明では、ステップS604において選択されたメトリックを第1ターゲットメトリックと記載する。
次に、相関情報生成部123は、関連リソースのメトリックのループ処理を開始する(ステップS605)。
具体的には、相関情報生成部123は、関連リソースのメトリックの中からメトリックを一つ選択する。以下の説明では、ステップS605において選択されたメトリックを第2ターゲットメトリックと記載する。
次に、相関情報生成部123は、メトリック値推定部125に、推定メトリック値算出処理の実行を指示する(ステップS606)。相関情報生成部123は、メトリック値推定部125から第1ターゲットメトリックの推定メトリック値が出力されるまで待ち状態に移行する。
なお、推定メトリック値算出処理の流れは、図14で説明した推定メトリック値算出処理と同一である。ただし、ステップS501では、メトリック値推定部125は、第2ターゲットメトリックのメトリック値の時系列データを取得する。また、ステップS502では、メトリック値推定部125は、第2ターゲットメトリックのメトリック値の時系列データを用いて、第1ターゲットメトリックの推定メトリック値の時系列データを算出する。
次に、相関情報生成部123は、相関分析を実行する(ステップS607)。
具体的には、相関情報生成部123は、第1ターゲットメトリックのメトリック値の時系列データ及び推定メトリック値の時系列データを用いた相関分析を実行し、相関係数を算出する。
次に、相関情報生成部123は、メトリック相関情報143及び相関係数情報144を更新する(ステップS608)。具体的には、以下のような処理が実行される。
メトリック相関情報143及び相関係数情報144が生成されていない場合、相関情報生成部123は、行をリソースのメトリックとし、列を関連リソースのメトリックとする行列形式のデータを生成する。相関情報生成部123は、第1ターゲットメトリック及び第2ターゲットメトリックの組み合わせに対応するセルに識別情報を設定する。また、相関情報生成部123は、相関係数情報144にエントリを追加し、追加されたエントリの相関係数ID601及び相関係数602に値を設定する。
メトリック相関情報143及び相関係数情報144が生成されている場合、相関情報生成部123は、第1ターゲットメトリック及び第2ターゲットメトリックの組み合わせに対応するセルに識別情報が設定されているか否かを判定する。
セルに識別情報が設定されていない場合、セルに識別情報を設定する。また、相関情報生成部123は、相関係数情報144にエントリを追加し、追加されたエントリの相関係数ID601及び相関係数602に値を設定する。
セルに識別情報が設定されている場合、相関情報生成部123は、相関係数情報144を参照し、セルに設定された識別情報に対応するエントリを検索する。相関情報生成部123は、検索されたエントリの相関係数602に値を設定する。以上がステップS608の処理の説明である。
次に、相関情報生成部123は、関連リソースの全てのメトリックについて処理が完了したか否かを判定する(ステップS609)。
関連リソースの全てのメトリックについて処理が完了していないと判定された場合、相関情報生成部123は、ステップS605に戻り、新たなメトリックを選択し、同様の処理を実行する。
関連リソースの全てのメトリックについて処理が完了したと判定された場合、相関情報生成部123は、リソースの全てのメトリックについて処理が完了したか否かを判定する(ステップS610)。
リソースの全てのメトリックについて処理が完了していないと判定された場合、相関情報生成部123は、ステップS604に戻り、新たなメトリックを選択し、同様の処理を実行する。
リソースの全てのメトリックについて処理が完了したと判定された場合、相関情報生成部123は、全ての関連リソースについて処理が完了したか否かを判定する(ステップS611)。
全ての関連リソースについて処理が完了していないと判定された場合、相関情報生成部123は、ステップS603に戻り、新たな関連リソースを選択し、同様の処理を実行する。
全ての関連リソースについて処理が完了したと判定された場合、相関情報生成部123は、全てのリソースについて処理が完了したか否かを判定する(ステップS612)。
全てのリソースについて処理が完了していないと判定された場合、相関情報生成部123は、ステップS601に戻り、新たなリソースを選択し、同様の処理を実行する。
全てのリソースについて処理が完了したと判定された場合、相関情報生成部123は、処理を終了する。
以上で説明したように、本実施例によれば、監視リソースの監視メトリックと相関が高いメトリックに絞って分析を行うことによって、ボトルネックを迅速に特定することができる。また、メトリック相関情報143及び相関係数情報144を周期的に更新することによって、監視対象システムの運用状態を考慮したメトリックの絞込みが可能となる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための非一時的なコンピュータが読み取り可能な記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 管理サーバ
101 クライアント端末
103 管理対象システム
105 ネットワーク
111、151 プロセッサ
112、152 メモリ
113、153 ネットワークインタフェース
121 サーバ制御部
122 分析対象判定部
123 相関情報生成部
124 ボトルネック特定部
125 メトリック値推定部
131 リソース絞込み部
132 メトリック絞込み部
141 構成情報
142 リソース関連情報
143 メトリック相関情報
144 相関係数情報
145 メトリック値履歴情報
146 メトリック変換情報
147 変換関数情報
154 入力デバイス
155 出力デバイス
161 クライアント制御部
201 計算機
202 スイッチ
203 ストレージ装置
1500 操作画面

Claims (15)

  1. 性能を評価するための指標であるメトリックの計測対象となるリソースを管理する計算機であって、
    前記計算機は、
    プロセッサ、前記プロセッサに接続される記憶装置、及び、前記プロセッサに接続されるインタフェースを有し、
    前記インタフェースを介して、複数のリソースから構成される管理対象システムと接続し、
    前記記憶装置は、前記メトリック間の相関の強さを示す相関係数を管理するための相関情報を格納し、
    前記計算機は、
    監視リソースの監視メトリックのメトリック値に基づいて、ボトルネックを特定する契機を検出し、
    前記監視リソースと接続関係を有する関連リソースを特定し、
    前記相関情報に基づいて、前記関連リソースのメトリックの中から前記監視メトリックとの間の相関が強い相関メトリックを特定し、
    前記関連リソース及び前記相関メトリックの組合せをボトルネック候補として特定し、
    前記ボトルネック候補を通知する通知情報を生成して、前記通知情報を出力することを特徴とする計算機。
  2. 請求項1に記載の計算機であって、
    前記相関メトリックのメトリック値を用いて、推定された前記監視メトリックのメトリック値である推定メトリック値を算出し、
    実際に計測された前記監視メトリックのメトリック値及び前記推定メトリック値を用いた統計分析を実行し、
    前記統計分析の結果に基づいて、前記相関メトリックが前記監視メトリックに影響を与えている可能性があるか否かを判定することを特徴とする計算機。
  3. 請求項2に記載の計算機であって、
    前記記憶装置は、前記相関メトリックのメトリック値を前記監視メトリックのメトリック値に変換する変換関数を管理するための関数情報を格納し、
    前記計算機は、
    前記推定メトリック値を算出する処理では、前記関数情報を参照して、前記相関メトリックのメトリック値を、前記監視メトリックのメトリック値に変換する第1変換関数を特定し、
    前記第1変換関数に、前記相関メトリックのメトリック値を代入することによって、前記推定メトリック値を算出することを特徴とする計算機。
  4. 請求項3に記載の計算機であって、
    前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出し、
    前記相関係数及び閾値の比較結果に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定し、
    前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定することを特徴とする計算機。
  5. 請求項3に記載の計算機であって、
    前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出し、
    前記相関情報を参照して、前記監視メトリックのメトリック値及び前記相関メトリックのメトリック値の間の相関係数を取得し、
    前記算出された相関係数及び前記取得された相関係数の差に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定し、
    前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定することを特徴とする計算機。
  6. 性能を評価するための指標であるメトリックの計測対象となるリソースを管理する計算機が実行するボトルネック特定方法であって、
    前記計算機は、
    プロセッサ、前記プロセッサに接続される記憶装置、及び、前記プロセッサに接続されるインタフェースを有し、
    前記インタフェースを介して、複数のリソースから構成される管理対象システムと接続し、
    前記記憶装置は、前記メトリック間の相関の強さを示す相関係数を管理するための相関情報を格納し、
    前記ボトルネック特定方法は、
    前記計算機が、監視リソースの監視メトリックのメトリック値に基づいて、ボトルネックを特定する契機を検出する第1のステップと、
    前記計算機が、前記監視リソースと接続関係を有する関連リソースを特定する第2のステップと、
    前記計算機が、前記相関情報に基づいて、前記関連リソースのメトリックの中から前記監視メトリックとの間の相関が強い相関メトリックを特定する第3のステップと、
    前記計算機が、前記関連リソース及び前記相関メトリックの組合せをボトルネック候補として特定する第4のステップと、
    前記計算機が、前記ボトルネック候補を通知する通知情報を生成して、前記通知情報を出力する第5のステップと、を含むことを特徴とするボトルネック特定方法。
  7. 請求項6に記載のボトルネック特定方法であって、
    前記第4のステップは、
    前記計算機が、前記相関メトリックのメトリック値を用いて、推定された前記監視メトリックのメトリック値である推定メトリック値を算出する第6のステップと、
    前記計算機が、実際に計測された前記監視メトリックのメトリック値及び前記推定メトリック値を用いた統計分析を実行する第7のステップと、
    前記計算機が、前記統計分析の結果に基づいて、前記相関メトリックが前記監視メトリックに影響を与えている可能性があるか否かを判定する第8のステップと、を含むことを特徴とするボトルネック特定方法。
  8. 請求項7に記載のボトルネック特定方法であって、
    前記記憶装置は、前記相関メトリックのメトリック値を前記監視メトリックのメトリック値に変換する変換関数を管理するための関数情報を格納し、
    前記第6のステップは、
    前記計算機が、前記推定メトリック値を算出する処理では、前記関数情報を参照して、前記相関メトリックのメトリック値を、前記監視メトリックのメトリック値に変換する第1変換関数を特定するステップと、
    前記計算機が、前記第1変換関数に、前記相関メトリックのメトリック値を代入することによって、前記推定メトリック値を算出するステップと、を含むことを特徴とするボトルネック特定方法。
  9. 請求項8に記載のボトルネック特定方法であって、
    前記第7のステップは、前記計算機が、前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出するステップを含み、
    前記第8のステップは、
    前記計算機が、前記相関係数及び閾値の比較結果に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定するステップと、
    前記計算機が、前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定するステップと、を含むことを特徴とするボトルネック特定方法。
  10. 請求項8に記載のボトルネック特定方法であって、
    前記第7のステップは、前記計算機が、前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出するステップを含み、
    前記第8のステップは、
    前記計算機が、前記相関情報を参照して、前記監視メトリックのメトリック値及び前記相関メトリックのメトリック値の間の相関係数を取得するステップと、
    前記計算機が、前記算出された相関係数及び前記取得された相関係数の差に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定するステップと、
    前記計算機が、前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定するステップと、を含むことを特徴とするボトルネック特定方法。
  11. 性能を評価するための指標であるメトリックの計測対象となるリソースを管理する計算機に実行させるためのプログラムであって、
    前記計算機は、
    複数のリソースから構成される管理対象システムと接続し、
    前記メトリック間の相関の強さを示す相関係数を管理するための相関情報を保持し、
    前記プログラムは、
    監視リソースの監視メトリックのメトリック値に基づいて、ボトルネックを特定する契機を検出する第1の手順と、
    前記監視リソースと接続関係を有する関連リソースを特定する第2の手順と、
    前記相関情報に基づいて、前記関連リソースのメトリックの中から前記監視メトリックとの間の相関が強い相関メトリックを特定する第3の手順と、
    前記関連リソース及び前記相関メトリックの組合せをボトルネック候補として特定する第4の手順と、
    前記ボトルネック候補を通知する通知情報を生成して、前記通知情報を出力する第5の手順と、を前記計算機に実行させるためのプログラム。
  12. 請求項11に記載のプログラムであって、
    前記第4の手順は、
    前記相関メトリックのメトリック値を用いて、推定された前記監視メトリックのメトリック値である推定メトリック値を算出させる第6の手順と、
    実際に計測された前記監視メトリックのメトリック値及び前記推定メトリック値を用いた統計分析を実行させる第7の手順と、
    前記統計分析の結果に基づいて、前記相関メトリックが前記監視メトリックに影響を与えている可能性があるか否かを判定させる第8の手順と、を含むことを特徴とするプログラム。
  13. 請求項12に記載のプログラムであって、
    前記計算機は、前記相関メトリックのメトリック値を前記監視メトリックのメトリック値に変換する変換関数を管理するための関数情報を保持し、
    前記第6の手順は、
    前記推定メトリック値を算出する処理では、前記関数情報を参照して、前記相関メトリックのメトリック値を、前記監視メトリックのメトリック値に変換する第1変換関数を特定させる手順と、
    前記第1変換関数に、前記相関メトリックのメトリック値を代入することによって、前記推定メトリック値を算出させる手順と、を含むことを特徴とするプログラム。
  14. 請求項13に記載のプログラムであって、
    前記第7の手順は、前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出させる手順を含み、
    前記第8の手順は、
    前記相関係数及び閾値の比較結果に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定させる手順と、
    前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定させる手順と、を含むことを特徴とするプログラム。
  15. 請求項13に記載のプログラムであって、
    前記第7の手順は、前記実際に計測された監視メトリックのメトリック値及び前記推定メトリック値の間の相関係数を算出するための相関分析を実行することによって、前記相関係数を算出させる手順を含み、
    前記第8の手順は、
    前記相関情報を参照して、前記監視メトリックのメトリック値及び前記相関メトリックのメトリック値の間の相関係数を取得させる手順と、
    前記算出された相関係数及び前記取得された相関係数の差に基づいて、前記監視メトリックに影響を与えている可能性がある前記相関メトリックを特定させる手順と、
    前記関連リソース及び前記特定された相関メトリックの組合せを前記ボトルネック候補として特定させる手順と、を含むことを特徴とするプログラム。
JP2017218981A 2017-11-14 2017-11-14 計算機、ボトルネック特定方法、及びプログラム Active JP6588956B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017218981A JP6588956B2 (ja) 2017-11-14 2017-11-14 計算機、ボトルネック特定方法、及びプログラム
US16/121,522 US11042463B2 (en) 2017-11-14 2018-09-04 Computer, bottleneck identification method, and non-transitory computer readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017218981A JP6588956B2 (ja) 2017-11-14 2017-11-14 計算機、ボトルネック特定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019091199A JP2019091199A (ja) 2019-06-13
JP6588956B2 true JP6588956B2 (ja) 2019-10-09

Family

ID=66433284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017218981A Active JP6588956B2 (ja) 2017-11-14 2017-11-14 計算機、ボトルネック特定方法、及びプログラム

Country Status (2)

Country Link
US (1) US11042463B2 (ja)
JP (1) JP6588956B2 (ja)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002342182A (ja) * 2001-05-21 2002-11-29 Hitachi Ltd ネットワークシステムにおける運用管理の支援システム
JP4421230B2 (ja) * 2003-08-12 2010-02-24 株式会社日立製作所 性能情報分析方法
JP4430989B2 (ja) * 2004-06-28 2010-03-10 株式会社日立製作所 運用管理支援システムおよび性能情報表示方法
JP4872945B2 (ja) * 2008-02-25 2012-02-08 日本電気株式会社 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
JP2009223442A (ja) * 2008-03-13 2009-10-01 Hitachi Ltd ストレージシステム
JP5141789B2 (ja) 2011-04-26 2013-02-13 日本電気株式会社 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
US8843901B2 (en) * 2013-02-12 2014-09-23 Concurix Corporation Cost analysis for selecting trace objectives
IN2014MU00158A (ja) * 2014-01-16 2015-08-28 Tata Consultancy Services Ltd
US10122605B2 (en) * 2014-07-09 2018-11-06 Cisco Technology, Inc Annotation of network activity through different phases of execution
US10057142B2 (en) * 2015-08-19 2018-08-21 Microsoft Technology Licensing, Llc Diagnostic framework in computing systems
JP2017041191A (ja) * 2015-08-21 2017-02-23 富士通株式会社 リソース管理装置、リソース管理プログラム、及びリソース管理方法
US10198339B2 (en) * 2016-05-16 2019-02-05 Oracle International Corporation Correlation-based analytic for time-series data
US10552390B2 (en) * 2017-01-06 2020-02-04 International Business Machines Corporation Root cause analysis of performance problems

Also Published As

Publication number Publication date
JP2019091199A (ja) 2019-06-13
US20190146892A1 (en) 2019-05-16
US11042463B2 (en) 2021-06-22

Similar Documents

Publication Publication Date Title
JP5719974B2 (ja) 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
US11016836B2 (en) Graphical user interface for visualizing a plurality of issues with an infrastructure
US9619314B2 (en) Management system and management program
US9696982B1 (en) Safe host deployment for a heterogeneous host fleet
WO2016138375A1 (en) Method and apparatus for predicting gpu malfunctions
CN108897496B (zh) 磁盘阵列配置管理方法、装置、计算机设备及存储介质
US9569251B2 (en) Analytics platform spanning a subset using pipeline analytics
WO2015121925A1 (ja) システム管理方法
US11165665B2 (en) Apparatus and method to improve precision of identifying a range of effects of a failure in a system providing a multilayer structure of services
JP6588956B2 (ja) 計算機、ボトルネック特定方法、及びプログラム
JP2015141552A (ja) 性能予測装置および性能モデル生成方法
JP7369219B2 (ja) 運用管理装置及び方法
JP6226895B2 (ja) ネットワーク評価システム及びネットワーク評価方法
WO2013114911A1 (ja) リスク評価システム、リスク評価方法、及びプログラム
US20200394091A1 (en) Failure analysis support system, failure analysis support method, and computer readable recording medium
JPWO2014097598A1 (ja) リスク分析を行う情報処理装置及びリスク分析方法
JP2008293103A (ja) 分散配置装置及び仮想装置の配置方法
US20230342175A1 (en) Intelligent capacity planning based on what-if operations for storage in a hyperconverged infrastructure
JP2015156225A (ja) 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
WO2017208413A1 (ja) 計算機システム及び計算機リソース管理方法
JPWO2015186342A1 (ja) 要因順序推定装置、要因順序推定方法、及び、要因順序推定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190913

R150 Certificate of patent or registration of utility model

Ref document number: 6588956

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150