JP5928104B2 - 性能監視装置、性能監視方法、及びそのプログラム - Google Patents

性能監視装置、性能監視方法、及びそのプログラム Download PDF

Info

Publication number
JP5928104B2
JP5928104B2 JP2012083364A JP2012083364A JP5928104B2 JP 5928104 B2 JP5928104 B2 JP 5928104B2 JP 2012083364 A JP2012083364 A JP 2012083364A JP 2012083364 A JP2012083364 A JP 2012083364A JP 5928104 B2 JP5928104 B2 JP 5928104B2
Authority
JP
Japan
Prior art keywords
probability density
density distribution
performance
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012083364A
Other languages
English (en)
Other versions
JP2013214171A (ja
Inventor
鈴木 琢也
琢也 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012083364A priority Critical patent/JP5928104B2/ja
Publication of JP2013214171A publication Critical patent/JP2013214171A/ja
Application granted granted Critical
Publication of JP5928104B2 publication Critical patent/JP5928104B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、監視対象装置の性能を監視する性能監視装置、性能監視方法、及びそのプログラムに関する。
従来より、情報処理装置などの監視対象装置に性能上の問題が発生していないかどうかを監視する性能監視装置が知られている。この従来公知の一般的な性能監視装置においては、監視対象装置の性能を監視するために自動的に設定する閾値は、監視項目ごとに一意であった。
このため、監視対象装置の性能を示す性能値が日付や時間帯によって大きく異なる場合は、各々の日付や時間帯にとって適した閾値を設定できないという問題があった。
このような問題点を解決するため、従来、次に示すような性能監視装置(特許文献1)が提案されている。この特許文献1に記載されている従来の性能監視装置によれば、監視対象装置の運用状態が時間帯によって異なる場合であっても、個々の時間帯にあった閾値が自動的に設定される構成となっている。
しかし、監視対象装置が稼働する時間帯をどのように複数の部分時間帯に分割するかの設定は、予め監視対象装置の運用状態のサイクルを把握した管理者が行わなければならないため、管理者に設定上の負担がかかる。また、この特許文献1には、適切な部分時間帯を設定する技術的な手法については、特に開示されていない。
そこで、このような問題点を解決するため、従来、次に示すような性能監視装置(特許文献2)が提案されている。この特許文献2に記載されている従来の性能監視装置によれば、監視対象装置の運用状態のサイクルを、予め与えられた複数の期間と周期などの組み合わせに基づいて、各周期の同一点間において回帰分析を行うことによって自動的に見つけ出し、そのサイクルにおける個々の時間帯にあった閾値を自動的に設定できるようにしている。
しかしながら、サイクルを発見するための組み合わせの数が多い場合は必然的に計算量が多くなってしまい、また同一時間帯に複数のサイクルが観測される場合にはどのサイクルが最も有効なのかを判別することができないという不都合があった。
更に、従来、次に示すような稼動性能情報の管理システムが提案されている(特許文献3)。特許文献3に記載されている従来の稼動性能情報の管理システムによれば、取得した一定区間の稼動性能情報を一定区間に区切り、同周期におけるモデルデータとの相関が高い稼動性能情報においては、モデルデータ及び相関係数のみを保存し、相関が低い稼動性能情報においては、収集した稼動性能情報をそのまま保存する。
特開2005−316808号公報 特開2009−70017号公報 特開2008−108154号公報
上述した特許文献1の不都合を改善するものとして存在する特許文献2には、前述したように、周期性を導出して閾値を自動設定する技術が提案されている。しかしながら、この特許文献2に記載された技術は、予め与えられた複数の周期について、性能情報のデータを回帰分析により合致するかどうかの判定を繰り返す方法であり、周期性を発見するための周期のパターンが多いと計算量が膨大になるという問題がある。
また、想定される周期がいくつか成り立つ場合、個々の周期の適切さを示す指標については、従来提案されていなかった。上記他の特許文献1,3についても同様である。
〔発明の目的〕
本発明は、上記関連技術の有する不都合を改善し、特に、システム固有の高いレベルの知識を持たない管理者であっても監視対象装置の運用状態における時刻に応じた最適な周期の把握を容易に成し得ると共に、当該時刻に応じた最適な性能データ評価用の閾値を自動的に設定できるようにした性能監視装置、性能監視方法、及びそのプログラムを提供することを、その目的とする。
上記目的を達成するため、本発明にかかる性能監視装置は、監視対象装置の性能を示す性能データを収集する情報収集部と、前記情報収集部により収集した評価対象の性能データを蓄積する性能情報蓄積部とを備えた監視装置本体を有して成る。
そして、前記監視装置本体が、前記蓄積部に蓄積された評価対象の1日の性能情報データを所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定するモデル生成部と、このモデル生成部で推定された確率密度分布モデル情報を格納する生成情報記憶部と、前記生成情報記憶部に格納された確率密度分布モデルに基づいて当該性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する異常検出部とを有し、
前記異常検出部が、当該異常検出部が設定した最適な閾値に基づいて前記性能情報蓄積部に蓄積された性能データの問題点の有無を評価しその異常を検出するデータ異常検出機能を備え、
また、前記モデル生成部は、外部指令によって作動して前記蓄積手段に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能情報データの前記確率密度分布モデルを推定する機能と、当該各時間帯と対応する確率密度分布モデルとを対応づけたモデル周期テーブルを作成する機能とを備え、
更に、前記生成情報記憶部は、前記モデル生成部で推定され作成された確率密度分布モデル情報と前記モデル周期テーブルとをそれぞれ各別に記憶する一方と他方の生成情報記憶部を備えていることを特徴とする。
上記目的を達成するため、本発明にかかる性能監視方法は、監視対象装置の性能を示す性能データを収集する情報収集部と、前記情報収集部により収集した評価対象の性能データを蓄積する性能情報蓄積部とを備えた監視装置本体を有して成る性能監視装置にあって、
前記蓄積部に蓄積された評価対象の1日の性能情報データを、前記監視装置本体のモデル生成部が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し、
この推定された確率密度分布モデル情報を、前記モデル生成部が生成情報記憶部に格納し、
前記生成情報記憶部に格納された確率密度分布モデルに基づいて、前記監視装置本体の異常検出部が機能し前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定し、
この設定された最適な閾値に基づいて前記性能情報蓄積部に蓄積された性能データの問題点の有無を、前記異常検出部が評価しその異常を検出するようにし
前記性能データの確率密度分布モデルを推定する工程にあっては、
まず、外部指令によって作動し前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を、前記モデル生成部が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定し、同時に当該各時間帯と対応する確率密度分布モデルとを対応づけたモデル周期テーブルを作成し、
この推定された確率密度分布モデルを予め装備された一方の生成情報記憶部に、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部に、それぞれ前記モデル生成部が格納制御するようにしたことを特徴とする。
上記目的を達成するため、本発明にかかる性能監視プログラムは、監視対象装置の性能を示す性能データを収集する情報収集部と、前記情報収集部により収集した評価対象の性能データを蓄積する性能情報蓄積部とを備えた監視装置本体を有して成る性能監視装置にあって、
前記生成情報蓄積部に蓄積された評価対象の1日の性能情報データを、所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し生成する確率密度分布モデル生成処理機能、
この生成された確率密度分布モデル情報を生成情報記憶部に格納する格納処理機能、
前記生成情報記憶部に格納された確率密度分布モデルに基づいて、前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する最適閾値設定処理機能、
及びこの設定された最適な閾値に基づいて前記性能情報蓄積手段に蓄積された性能データの問題点の有無を評価しその異常を検出する評価異常検出処理機能を設けると共に
上記性能データの確率密度分布モデル生成処理機能にあっては、
外部指令によって作動し前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定する確率密度分布モデル推定処理機能、
前記確率密度分布モデルとこれに対応する前記各時間帯とを対応づけたモデル周期テーブルを作成するモデル周期テーブル作成処理機能、
及び推定された前記確率密度分布モデルを予め装備された一方の生成情報記憶部に、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部に、それぞれ格納制御する確率密度分布モデル等格納処理機能を備え、
これらの各処理機能を前記監視装置本体が備えているコンピュータに実現させるようにしたことを特徴とする。
本発明は以上のように構成されているので、これによると、性能監視装置で収集した監視対象装置の運用状態における性能データから、時間帯ごとの性能データの確率密度分布を推定し、それを基に周期性を自動的に見つけだすことができ、そのため、システム固有の深い知識を持たない管理者であっても、時刻に応じた最適な周期を検出することができる。また、見つけ出した周期における最適な閾値を、推定した確率密度分布のモデルより自動的に設定すると共に、これにより時刻に応じた最適な性能データの閾値を自動的に設定することができるという優れた性能監視装置、性能監視方法、及びそのプログラムを提供することができる。
本発明の一実施形態における性能監視システムの構成例を示すブロック図である。 性能情報データを示す図である。 確率密度分布モデル作成の処理の流れを示すフローチャートである。 図3のステップS102の動作の詳細を示すフローチャートである。 日付パターンの設定の具体例を示す図である。 確率密度分布モデル周期テーブルの具体例を示す図である。 性能情報データの評価の処理の流れを示すフローチャートである。 図7のステップS301の動作の詳細を示すフローチャートである。 図7のステップS303の動作の詳細を示すフローチャートである。 他の実施形態1における、図7のステップS301の動作の拡張例の詳細を示すフローチャートである。 他の実施形態2における、図7のステップS303の動作の拡張例の詳細を示すフローチャートである。
以下、本発明の一実施形態を添付図面に基づいて説明する。
最初に、本実施形態において重要とする主たる内容について説明し、その後に、本実施形態の全体的内容を詳述する。
まず、図1に、本発明の一実施形態における性能監視システムの構成例を示す。
この図1において、性能監視システムは、それぞれが監視制御エージェント11を備えた複数の被監視サーバ(監視対象装置)1と、この監視制御エージェント11で収集した性能データ値から時間帯ごとの性能データ値の確率密度分布を推定すると共にそれを基に周期性を自動的に見つけ出す監視制御サーバ(性能監視装置)2と、管理者側に配置され運用管理画面31を備えた監視端末3とから構成されている。符号2Aは監視装置本体2Aを示す。
この監視装置本体2Aは、前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データを所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定する最適モデル生成部25と、この最適モデル生成部で推定された確率密度分布モデル情報を格納する生成情報記憶部23と、前記生成情報記憶部23に格納された確率密度分布モデルに基づいて当該性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する異常検出部26とを含んで構成されている。
このため、システム固有の深い知識を持たない管理者であっても、時刻に応じた最適な周期を検出することができるようになっている。
この内、異常検出部26は、当該異常検出部26が設定した最適な閾値に基づいて前記性能情報蓄積部22に蓄積された性能データの問題点の有無を評価しその異常を検出するデータ異常検出機能26Aを備えている。
又、最適モデル生成部25は、外部指令によって作動して前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能情報データの前記確率密度分布モデルを推定する機能と、当該各時間帯と対応する確率密度分布モデルとを対応付けたモデル周期テーブルを作成する機能とを備えている。更に、生成情報記憶部23は、前記最適モデル生成部25で推定され作成された確率密度分布モデル情報と前記モデル周期テーブルとをそれぞれ各別に記憶する一方と他方の生成情報記憶部23A,23Bを備えている。
更に、前述した異常検出部26は、前記他方の生成情報記憶部23Bに記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定する確率密度分布モデル選定機能と、当該選定された確率密度分布モデルを前記一方の生成情報記憶部23Aから読み出す確率密度分布モデル読出機能を備えている。
又、前述した最適モデル生成部25は、具体的には後述するが、前記性能データの確率密度分布モデルの推定に際しては、隣り合う時間帯同志の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出する機能と、逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同志のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同志のデータは分割したままにする機能と有し、これにより前記確率密度分布を時間帯毎に設定する機能を備えている。
前述した最適モデル生成部25については、更に、外部指定される期間が複数の日付を含む場合には、これに対応するため、当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定する機能と、この各日付の同一時間帯毎の前記確率密度分布の逆類似度を算出する機能と、この算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を前記一方の生成情報記憶部23Aに格納する機能とを備えている。
又、前述した他方の生成情報記憶部23Bには、日付パターンにより特定される複数の日付と、各日付で共通する複数の時間帯と、各時間帯に対応した確率密度分布データとが対応付けられてモデル周期テーブルとして記憶されている。
更に又、前述した異常検出部26は、評価対象である性能データに対応する最適な確率密度分布データの取得に際しては、前記他方の生成情報記憶部23Bから前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に当該逆類似度が最小の場合に当該確率密度分布を選定する機能と、この選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部23Aから取得する機能とを備えている。
そして、異常検出部26は、性能データの評価判定に際しては、前記確率密度分布モデルを作成した性能データから標準偏差を算出すると共に、前記評価対象の性能データが前記標準偏差に基づいて設定される閾値の範囲内に有れば問題がないデータと判定するデータ評価判定機能26Aを備えている。
ここで、異常検出部26により特定される前記閾値は、後述するように、標準偏差を用いた設定、統計指標を用いた設定、確率密度を用いた設定、或いは複数のガウスモデルの重み係数と標準偏差を用いた設定、の何れか一つの手法に基づいてを算定されたものであってもよい。
以下、これを更に詳述する。
上記したように、監視制御サーバ2は、性能情報蓄積部22に蓄積された評価対象の性能データを所定の時間間隔で分割した時間帯ごとの評価対象の性能データの確率密度分布を推定し、確率密度分布の推定を基に周期性を見つけ出し、その周期における評価対象の性能データが所定の範囲内にあるか否かを判定する基準となる閾値を設定する最適モデル生成部25を装備している。
このため、システム固有の深い知識を持たない管理者であっても、時刻に応じた最適な周期を検出することができるようになっている。
更に、監視制御サーバ2の最適モデル生成部25は、時間帯ごとの評価対象の性能データの確率密度分布を推定し、隣り合った時間帯どうしの確率密度分布の逆類似度を算出することで周期を導出すると共に、過去の性能データから導出した確率密度分布との逆類似度から最適かつ最短の周期を求めることで、その周期に適した閾値を設定する。このため、時刻に応じた最適な性能データの閾値を自動的に設定することができるようになっている。
また、監視制御サーバ2は、上述したように評価対象の性能データが閾値の範囲内であるか否かを判定することで評価対象の性能データの評価を行う異常検出部26を装備している。このため、性能データの適切な評価を行うことができるようになっている。
又、この監視制御サーバ2は、収集した性能データ値から時間帯ごとの性能データ値の確率密度分布を推定し、それを基に周期性を自動的に見つけ出すものであり、情報収集部21と、性能情報蓄積部22と、生成情報記憶部(確率密度分布モデル蓄積部)23と、モデル周期テーブル蓄積部24と、最適モデル生成部25と、異常検出部26を備えている。
監視端末3は、前述した運用管理画面31と、必要に応じて前記最適モデル生成部25に所定の動作指令を送り込む動作指令出力部3Aとを備えている。
前述した被監視サーバ1の監視制御エージェント11は、被監視サーバ1のCPU使用率やメモリ使用量といった一定間隔で測定される性能データを、時系列データとして自身のメモリ上に保存する機能を備えている。そして、この監視制御エージェント11で得られた性能データは、定期的に監視制御サーバ2の情報収集部21にネットワーク等を介して送信されるようになっている。
監視制御サーバ2の情報収集部21は、監視制御エージェント11から受信した性能データを性能情報蓄積部22に順次格納する。又、この性能情報蓄積部22は、性能データをメトリック毎に過去に渡って永続的に保存管理し、外部からの要求に応じて性能データを提供する機能を備えている。
ここで、本実施形態における性能監視システムでは、管理者は、監視端末3の運用管理画面31を介して最適モデル生成部25に対して確率密度分布モデルの生成を指示する。この指示は、前述した指令出力部3Aを介して実行される。
この場合、パラメータとしては、確率密度分布モデル生成の対象とする期間を指定する。最適モデル生成部25は、性能情報蓄積部22から取得した性能データから、時間帯ごとの性能データ値の確率密度分布の推定を行い、確率密度分布モデルと、モデル周期テーブルを生成する。
確率密度分布モデル蓄積部23は、最適モデル生成部25が生成した確率密度分布モデルを受け取り、確率密度分布モデルデータとして蓄積する。また、確率密度分布モデル蓄積部23は、異常検出部26からの要求に応じて確率密度分布モデルを提供する。モデル周期テーブル蓄積部24は、最適モデル生成部25が生成したモデル周期テーブルを受け取り、モデル周期テーブルを蓄積する。また、モデル周期テーブル蓄積部24は、異常検出部26からの要求に応じてモデル周期テーブルを提供する。
異常検出部26は、ある時間帯の性能データを性能情報蓄積部22から取得する。また、この異常検出部26は、前述したように当該時間帯に適合する確率密度分布モデルをモデル周期テーブル蓄積部24から判別し、確率密度分布モデル蓄積部23から確率密度分布モデルを取得する。
そして、異常検出部26は、確率密度分布モデルから作成した評価指標を基に性能データを評価し、その評価結果を監視端末3の運用管理画面31に表示する。
図2に、性能データの例を示す。図2の例では、Webサーバ、データベースサーバ等の監視対象装置の性能データ(CPU使用率〔%〕、ディスクリクエストの回数等)が時刻別に分類されている。図2中の上側のデータが平日のデータであり、下側が休日のデータである。性能データに平日と休日で大きな傾向変化があることは、目視でも確認することができる。
〔動作説明〕
次に、上記実施形態の動作を説明する。
最初に、各構成要素の基本的な連係動作を説明し、その後にフローチャートに基づいて具体的な動作を説明する。
本実施形態にあっては、まず、前述した性能情報蓄積部22に蓄積された評価対象の1日の性能情報データを、前記監視装置本体2Aの最適モデル生成部25が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し生成する(確率密度分布モデルの推定する工程)。この推定され生成された確率密度分布モデル情報を、前記最適モデル生成部25が生成情報記憶部23に格納する。
続いて、前記生成情報記憶部23に格納された確率密度分布モデルに基づいて、前記監視装置本体の異常検出部26が機能し前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する。そして、この設定された最適な閾値に基づいて前記性能情報蓄積部22に蓄積された性能データの問題点の有無を、前記異常検出部26が評価しその異常を検出する(性能データの評価工程)。
ここで、上記した性能データの確率密度分布モデルの推定する工程にあっては、本実施形態では、まず、外部指令によって作動し前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データの内の指定された期間を、前記最適モデル生成部25が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定し、同時に当該各時間帯と対応する確率密度分布モデルとを対応付けたモデル周期テーブルを作成する。
そして、この推定された確率密度分布モデルを予め装備された一方の生成情報記憶部(確率密度分布モデル蓄積部)23Aに、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部(モデル周期テーブル蓄積部)23Bに、それぞれ前記最適モデル生成部25が格納制御する。
この場合、前記性能データの確率密度分布モデルを推定する工程にあっては、具体的には後述するが、最適モデル生成部25が稼働し、前記隣り合う時間帯同志の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出し、更に、逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同志のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同志のデータは分割したままにして放置するようにし、これにより、前記確率密度分布を時間帯毎に推定し生成する。
更に、前記性能データの確率密度分布モデルを推定する工程にあっては、前記最適モデル生成部25が作動し、外部指定される期間が複数の日付を含む場合には当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定する。この場合、各日付の同一時間帯毎の前記確率密度分布については、その逆類似度を算出すると共に当該算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を、前記一方の生成情報記憶部23Aに格納する。
又、この性能データの評価工程にあっては、前記他方の生成情報記憶部23Bに記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定し且つ当該選定された確率密度分布モデルを前記一方の生成情報記憶部23Aから読み出すようにし、これらの各選定および読み出しにかかる制御動作を、前記異常検出部26が実行する。
更に、この最適な閾値を設定する工程にあっては、評価対象である性能データに対応する最適な確率密度分布データの取得に際しては、前記他方の生成情報記憶部23Bから前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に、当該逆類似度が最小の場合に当該確率密度分布を選定し、この選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部23Aから取得するようにし、これらの各選定及び取得の各制御動作を、前記異常検出部26が実行する。
そして、この性能データを評価し異常を検出する工程にあっては、閾値の特定に際しては、具体的には記確率密度分布モデルを作成した性能データから標準偏差を算出し、続いて、この標準偏差に基づいて閾値が設定される。その後、前記評価対象の性能データはこの標準偏差に基づいて設定された閾値の範囲内に有れば問題がないデータと判定される。これらの各算出および判定にかかる工程は、異常検出部26が順次実行する。
以下、これを更に詳述する。
本実施形態における性能監視システムについて、管理者の指示に基づいて行われる全体の処理の流れを、図3及び図4のフローチャートを用いて具体的に説明する。
図3は、本実施形態の手法による確率密度分布モデル作成の処理の流れを示すフローチャートである。
最初に、性能監視システムの管理者は、監視端末3の運用管理画面31に併設された指令入力部3Aを介して監視制御サーバ(性能監視装置)2に確率密度分布モデルの自動作成を指示する。この場合、監視対象とする性能データの期間をパラメータとして指定する(図3:ステップS101)。
次に、監視制御サーバ2の最適モデル生成部25は、周期・時間帯に応じた確率密度分布モデルを推定し生成する(図3:ステップS102)。
図4は、図3のステップS102の動作の詳細を示すフローチャートである。
この場合、管理者が、監視端末3の運用管理画面31を見ながら指令出力部3Aを介して、図2の性能データにおける例えば6月1日0時0分から6月30日23時55分の期間を指定し、監視制御サーバ2に最適な確率密度分布モデルの作成を指示する。
これに伴い、監視制御サーバ2の最適モデル生成部25は、直ちに作動して図4のフローチャートに従って以下の処理を行う。
まず、管理者は、監視端末3の指令入力部3Aを介して、例えば6月1日0時0分から6月30日23時55分の期間をパラメータに指定する(図4:ステップS201)。
これに伴い、監視制御サーバ2の最適モデル生成部25は、監視端末3から最適な確率密度分布モデルを作成する前記指示を受けると共に、パラメータとして前記期間を受け取る。
続いて、監視制御サーバ2の最適モデル生成部25は、前記期間(パラメータ)内の性能データを取得する(図4:ステップS202)。
そして、次のステップS203では、監視制御サーバ2の最適モデル生成部25が、前記パラメータ期間内に含まれる全ての日付について、以下のステップS204からステップS208の処理の実行を繰り返す。
まず、監視制御サーバ2の最適モデル生成部25は、一日間の性能データを任意の時間間隔で分割し、それぞれの時間帯における性能データの確率密度分布を推定する(図4:ステップS204)。ここで、確率密度分布の推定には、最尤推定法などのパラメトリック法や、カーネル密度推定法などのノンパラメトリック法などの、一般的な手法を用いるように、予め設定されている。
続いて、隣り合った時間帯同志の確率密度分布の逆類似度を、例えば式1に示すカルバック・ライブラー情報量(確率論と情報理論における2つの確率分布の差異を計る尺度)により算出する(図4:ステップS205)。
Figure 0005928104
そして、算出した確率密度分布の逆類似度が任意の値以下ならば、隣り合った時間帯どうしの性能データの分割を解除し、結合させた時間帯の確率密度分布を推定する。
一方、算出した確率密度分布の逆類似度が任意の値以上ならば、隣り合った時間帯どうしの性能データを分割したままにする。
このようにして、確率密度分布を時間帯ごとにまとめあげる。
次に、監視制御サーバ2の最適モデル生成部25は、日付パターンを設定し、それぞれの日付パターンについて、下記のステップS207乃至ステップS208の処理の実行を繰り返す(図4:ステップS206)。
ここで、図5に、日付パターンの設定の具体例を示す。
この図5の例では、番号(1、2、……)と日付パターンのルール(平日、休日、……)を対応付けている。
即ち、監視制御サーバ2の最適モデル生成部25は、日付パターンにマッチする(処理中の日付を除いた)全ての日付の性能データについて、前述したステップS205と同様の時間帯で区切り、まとめ上げ、性能データの確率密度分布を推定する(図4:ステップS207)。
具体例として、モデル生成の期間が11月1 日から11月31日で、処理中の日付が2011年11月1 日(火曜日)であり、日付パターンが「毎日」であるとする。また、前記ステップS205では、0 時から12時、12時から24時までの時間間隔を区切ったとする。
この場合は、11月2 日から31日のデータについて、0 時から12時、12時から24時迄の時間間隔で区切り、区切った範囲で性能データをまとめ上げ、確率密度分布を推定する。
このとき、日付パターン「月曜日」は、処理中の日付11月1 日(火曜日)にマッチしないため処理を行わない。また、日付パターン「火曜日」は、処理を行う。
尚、このとき、もし性能データの実際の周期が「毎日」の日付パターンであった場合は、日付パターンが「毎日」と日付パターンが「火曜日」との両方で、同様の確率密度分布が生成される。しかし、日付パターンが「毎日」のデータのほうが、確率密度分布の推定に使用できるデータの量(即ち標本の量)が多い。
チェビシェフの不等式(不等式で表される確率論の基本的な定理)によれば、標本の量が多ければ多いほど標本平均の分散は小さくなる。このため、日付パターンが「毎日」と日付パターンが「火曜日」の場合において、推定した確率密度分布を比較した場合、日付パターンが「毎日」のほうが、より正確な確率密度分布となる。
続いて、監視制御サーバ2の最適モデル生成部25は、前記ステップS205と前記ステップS207で作成した同時間帯ごとの性能データ値の確率密度分布の逆類似度を算出する(図4:ステップS208)。そして、最小値の逆類似度を持つ確率密度分布を、生成情報記憶部23の一方の生成情報記憶部(確率密度分布モデル蓄積部)23Aに格納する。
同時に、どの日付パターンのどの時間帯にどの確率密度分布モデルを使用するかを示すモデル周期テーブルを、一方の生成情報記憶部(モデル周期テーブル蓄積部)23Bに格納する(図4:ステップS209)。
以上により、ステップS209で処理を終了する。
ここで、図6に、上記モデル周期テーブル蓄積部(他方の生成情報記憶部)23Bにおけるモデル周期テーブルの具体例を示す。
この図6の例では、メトリック「APサーバ1のCPUのprocessor time」の日付パターン「火曜日」について、1時から2時までの間は、確率密度分布モデルID「2454898 」の確率密度分布が「逆類似度0.8で使用できる」という情報を、モデル周期テーブルに格納していることを示している。
次に、異常検出部26による性能データの評価について、図7乃至図9のフローチャートを用いて説明する。
まず、図7において、監視制御サーバ2の異常検出部26は、モデル周期テーブル蓄積部24から評価対象の性能データの時刻に最適な確率密度分布モデルを判定し特定すると共に、確率密度分布モデル蓄積部23から評価対象の性能データの時刻に最適な確率密度分布モデルを取得する(図7:ステップS301)。
次に、監視制御サーバ2の異常検出部26は、性能情報蓄積部22から評価対象の時刻の性能データを取得する(図7:ステップS302)。
続いて、監視制御サーバ2の異常検出部26は、前記ステップS302で取得した性能データについて、前記ステップS301で取得した確率密度分布モデルを用いて評価する(図7:ステップS303)。
図8は、異常検出部26の動作の内、図7におけるステップS301の動作の詳細を示すフローチャートである。
まず、図8において、まず、監視制御サーバ2の異常検出部26は、性能情報蓄積部22から評価対象の性能データを受け取る(図8:ステップS401)。
次に、監視制御サーバ2の異常検出部26は、性能データを評価する日付に適した日付パターンについて、以下のステップS403の処理を繰り返す(図8:ステップS402)。
まず、監視制御サーバ2の異常検出部26は、性能データを評価する時刻に適した確率密度分布の逆類似度を取得する(図8:ステップS403)。
そして、取得した逆類似度の値が最小であれば、逆類似度の値が最小の確率密度分布モデルを確率密度分布モデル蓄積部23に記憶する。
次に、監視制御サーバ2の異常検出部26は、確率密度分布モデル蓄積部23から逆類似度が最小の確率密度分布モデルを取得する(図8:ステップS404)。
ここで、これを具体例に基づいて説明する。
例えば、評価対象の性能データの時刻が11月1 日(火曜日)の1:50であり、日付パターン「毎日」と「火曜日」に確率密度分布モデルがマッチしたとする。そして、それぞれの逆類似度が0.4 と0.8 であったとした場合、最小の逆類似度をもつ日付パターン「毎日」の 確率密度分布モデルを取得する。
図9は、異常検出部26の動作の内、図7のステップS303の動作の詳細を示すフローチャートである。
この図9において、監視制御サーバ2の異常検出部26は、確率密度分布モデルを作成した性能データから平均値μ、標準偏差σを求める(図9:ステップS501)。
次に、監視制御サーバ2の異常検出部26は、評価対象の性能データがσ×2の範囲内であるかどうかを閾値に設定する(図9:ステップS502)。
更に、監視制御サーバ2の異常検出部26は、評価対象の性能データが閾値の範囲内か否かを判定し(図9:ステップS503)、範囲内であれば問題ないデータであると判断する(図9:ステップS504)。
一方、監視制御サーバ2の異常検出部26は、評価対象の性能データが閾値の範囲外であれば、問題があるデータであると判断する(図9:ステップS505)。
以上により、性能データの評価を完了する(図9:ステップS506)。
尚、前述した例では、閾値の設定にσ×2の範囲内であるかどうかを用いたが、必要に応じて、例えば、よく知られているように、σ×1.5を注意レベル、σ×2を警告レベル、σ×3を異常レベル、のように設定してもよい。又、閾値としては、標準偏差に限らず、パーセンタイルなどその他の統計指標を用いてもよい。更に、確率密度そのものを、評価の指標として用いてもよい。
ここで、上述した実施形態における図3、図4、図7、図8、図9の各フローチャートおよびこれに基づく上記各構成の動作説明にあって、上述した各構成部材の機能および動作内容を工程として開示したが、これら各工程に示した実行内容をプログラム化し、前述した監視装置本体2Aが備えているコンピュータに実行させるように構成してもよい。
(実施形態の効果)
以上説明したように、本実施形態においては、下記のような効果を奏する。
監視制御サーバ2の最適モデル生成部25により、監視端末3が収集した性能データ値から、時間帯ごとの性能データ値の確率密度分布を推定し、それを基に周期性を自動的に見つけだすことができる。そのため、システム固有の深い知識を持たない管理者であっても、時刻に応じた最適な周期を検出することができる。
また、見つけ出した周期における最適な閾値を、推定した確率密度分布のモデルより、異常検出部26が自動的に設定することができ、時刻に応じた最適な性能データの閾値を自動的に設定することができる。
〔異常検出部26の実施例(その1)〕
上記実施形態で説明したように、監視制御サーバ2の異常検出部26は、単一のメトリクスにより周期を特定し、性能データの評価を行う。
しかしながら、実際のシステムでは、同一の周期を有するメトリクスは複数存在することもある。このため、周期の特定は、複数のメトリクスを用いて行ったほうが精度が高くなる。
図10では、本項の実施例(その1)における前述した図7のステップS301の動作(拡張例)の詳細を示すフローチャートである。この図10では、複数のメトリクスを用いて行う場合について説明する。
この図10にあって、ステップS601で、監視制御サーバ2の異常検出部26は、性能情報蓄積部22から評価対象の性能データを受け取る。
ステップS602では、監視制御サーバ2の異常検出部26は、評価対象の全てのメトリクスについて、以下のステップS602からステップS604の処理を繰り返す。
ステップS603では、監視制御サーバ2の異常検出部26は、性能データを評価する日付に適した日付パターンについて、以下のステップS604を繰り返す。
ステップS604では、監視制御サーバ2の異常検出部26は、性能データを評価する時刻に適した確率密度分布の逆類似度を取得し、日付パターンごとの逆類似度に足し合わせる。
そして、ステップS605では、監視制御サーバ2の異常検出部26は、全てのメトリクスの、日付パターンの逆類似度の合計値が最小の確率密度分布モデルを取得する。
〔異常検出部26の実施例(その2)〕
前述した実施形態で説明したように、監視制御サーバ2の異常検出部26は、確率密度分布モデルを使用した異常判定について、標準偏差のみを用いて行っている。性能データの真の確率密度分布がガウス分布(正規分布)である場合は問題ないが、そうでない場合は不適切な閾値を設定してしまう可能性が高い。
このため、ここでは、確率密度分布の推定を、EMアルゴリズム(期待値最大化法)等を用いた混合ガウス分布のパラメータ推定として行い、複数のガウスモデルの重み係数と標準偏差から閾値を決定する。
図11に、本項の他の実施例(その2)における前述した図7のステップS303の動作(拡張例)の詳細を示すフローチャートを示す。
この図11において、ステップS701では、監視制御サーバ2の異常検出部26は、確率密度分布モデルを作成した性能データから、混合ガウス分布のパラメータである重み係数wm、平均値μm、標準偏差σmを求める。なお、mは任意の混合数である。
ステップS702では、監視制御サーバ2の異常検出部26は、全ての推定した混合ガウス分布について、以下のステップS703の処理を行う。
ステップS703では、監視制御サーバ2の異常検出部26は、評価対象の性能データがσm×2の範囲内であるかどうかを判定する。
ステップS704では、監視制御サーバ2の異常検出部26は、全ての混合ガウス分布で性能データ値はσm×2の範囲内であるかどうかを判定する。全ての混合ガウス分布で性能データ値がσm×2の範囲内であれば、ステップS705で問題ないデータと判断する。一方、一つのガウス分布でも性能データ値がσm×2の範囲外であれば、ステップS706で問題があるデータと判断する。
以上により、ステップS707で性能データの評価を完了する。
ここで、上述した他の実施形態における図10、図11のフローチャートおよびこれに基づく上記各構成の動作説明にあって、上述した各構成部材の機能および動作内容を工程として開示したが、これら各工程に示した実行内容をプログラム化し、コンピュータに実行させるように構成してもよい。
本発明にかかる上記実施形態では、図1に示した性能監視システムの場合の例を説明したが、図1に示した性能監視システムへの適用に限定されず、サービスレベルを満たす必要があるシステムの運用管理にも適用することが可能である。
次に、上記実施形態に開示した新規な技術的な内容については、その全体をまとめると、以下の付記のようになる。尚、この技術的な内容は、本発明をこれに限定すするものではない。
[付記1]
監視対象装置(被監視サーバ)1の性能を示す性能データを収集する情報収集部21と、前記情報収集部21により収集した評価対象の性能データを蓄積する性能情報蓄積部22とを備えた監視装置本体2Aを有して成る性能監視装置(監視制御サーバ)2において、
前記監視装置本体2Aが、
前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データを所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定する最適モデル生成部25と、この最適モデル生成部で推定された確率密度分布モデル情報を格納する生成情報記憶部23と、前記生成情報記憶部23に格納された確率密度分布モデルに基づいて当該性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する異常検出部26とを有すると共に、
前記異常検出部26は、当該異常検出部26が設定した最適な閾値に基づいて前記性能情報蓄積部22に蓄積された性能データの問題点の有無を評価しその異常を検出するデータ異常検出機能26Aを備えていることを特徴とした性能監視装置。
[付記2]
前記付記1に記載の性能監視装置において、
前記最適モデル生成部25は、
外部指令によって作動して前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能情報データの前記確率密度分布モデルを推定する機能と、当該各時間帯と対応する確率密度分布モデルとを対応付けたモデル周期テーブルを作成する機能とを備え、
前記生成情報記憶部23は、前記最適モデル生成部25で推定され作成された確率密度分布モデル情報と前記モデル周期テーブルとをそれぞれ各別に記憶する一方と他方の生成情報記憶部23A,23Bを備えていることを特徴とした性能監視装置。
[付記3]
前記付記2に記載の性能監視装置において、
前記異常検出部26は、
前記他方の生成情報記憶部23Bに記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定する確率密度分布モデル選定機能と、当該選定された確率密度分布モデルを前記一方の生成情報記憶部23Aから読み出す確率密度分布モデル読出機能を備えていることを特徴とした性能監視装置。
[付記4]
前記付記1乃至3の何れか一つに記載の性能監視装置において、
前記最適モデル生成部25は、
前記性能データの確率密度分布モデルの推定に際しては、隣り合う時間帯同志の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出する機能と、逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同志のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同志のデータは分割したままにする機能と有し、これにより前記確率密度分布を時間帯毎に設定する機能を備えていることを特徴とした性能監視装置。
[付記5]
前記付記2又は3に記載の性能監視装置において、
前記最適モデル生成部25は、
外部指定される期間が複数の日付を含む場合には、当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定する機能と、この各日付の同一時間帯毎の前記確率密度分布の逆類似度を算出する機能と、この算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を前記一方の生成情報記憶部23Aに格納する機能とを備えていることを特徴とした性能監視装置。
[付記6]
前記付記5に記載の性能監視装置において、
前記他方の生成情報記憶部23Bには、日付パターンにより特定される複数の日付と、各日付で共通する複数の時間帯と、各時間帯に対応した確率密度分布データとが対応付けられてモデル周期テーブルとして記憶されていることを特徴とした性能監視装置。
[付記7]
前記付記5に記載の性能監視装置において、
前記異常検出部26は、評価対象である性能データに対応する最適な確率密度分布データの取得に際しては、前記他方の生成情報記憶部23Bから前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に当該逆類似度が最小の場合に当該確率密度分布を選定する機能と、この選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部23Aから取得する機能とを備えていることを特徴とした性能監視装置。
[付記8]
前記付記1乃至7の何れか一つに記載の性能監視装置において、
前記異常検出部26は、前記確率密度分布モデルを作成した性能データから標準偏差を算出すると共に、前記評価対象の性能データが前記標準偏差に基づいて設定される閾値の範囲内に有れば問題がないデータと判定するデータ評価判定機能26Aを備えていることを特徴とした性能監視装置。
[付記9]
前記付記1に記載の性能監視装置において、
前記異常検出部26による特定される前記閾値は、標準偏差を用いた設定、統計指標を用いた設定、確率密度を用いた設定、或いは複数のガウスモデルの重み係数と標準偏差を用いた設定、の何れか一つの手法に基づいて算定されたものであることを特徴とした性能監視装置。
[付記10](方法の発明/付記1対応)
監視対象装置(被監視サーバ)1の性能を示す性能データを収集する情報収集部21と、前記情報収集部21により収集した評価対象の性能データを蓄積する性能情報蓄積部22とを備えた監視装置本体2Aを有して成る性能監視装置(監視制御サーバ)2にあって、
前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データを、前記監視装置本体2Aの最適モデル生成部25が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し、
この推定された確率密度分布モデル情報を、前記最適モデル生成部25が生成情報記憶部23に格納し、
前記生成情報記憶部23に格納された確率密度分布モデルに基づいて、前記監視装置本体の異常検出部26が機能し前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定し、
この設定された最適な閾値に基づいて前記性能情報蓄積部に蓄積された性能データの問題点の有無を、前記異常検出部26が評価しその異常を検出するようにしたことを特徴とする性能監視方法。
[付記11](付記2対応)
前記付記10に記載の性能監視方法において、
前記性能データの確率密度分布モデルの推定する工程にあっては、
まず、外部指令によって作動し前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を、前記最適モデル生成部25が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定し、同時に当該各時間帯と対応する確率密度分布モデルとを対応付けたモデル周期テーブルを作成し、
この推定された確率密度分布モデルを予め装備された一方の生成情報記憶部23Aに、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部23Bに、それぞれ前記最適モデル生成部25が格納制御するようにしたことを特徴とする性能監視方法。
[付記12](付記3対応)
前記付記11に記載の性能監視方法において、
前記性能データの評価工程にあっては、
前記他方の生成情報記憶部23Bに記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定し且つ当該選定された確率密度分布モデルを前記一方の生成情報記憶部23Aから読み出すようにし、
これらの各選定および読み出しにかかる制御動作を、前記異常検出部26が実行することを特徴とした性能監視方法。
[付記13](付記4対応)
前記付記10乃至12の何れか一つに記載の性能監視方法において、
前記性能データの確率密度分布モデルを推定する工程にあっては、
前記隣り合う時間帯同志の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出し、
逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同志のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同志のデータは分割したままにして放置するようにし、
これにより、前記確率密度分布を時間帯毎に設定するようにし
これらの各工程を前記最適モデル生成部25が実行することを特徴とした性能監視方法。
[付記14](付記5対応)
前記付記11又は12に記載の性能監視方法において、
前記性能データの確率密度分布モデルを推定する工程にあっては、
外部指定される期間が複数の日付を含む場合には当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定し、
この各日付の同一時間帯毎の前記確率密度分布の逆類似度を算出すると共に当該算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を前記一方の生成情報記憶部23Aに格納するようにし、
これらの各設定,算出,及び格納の各制御動作を、前記最適モデル生成部25が実行するようにしたことを特徴とする性能監視方法。
[付記15](付記7対応)
前記付記14に記載の性能監視方法において、
前記最適な閾値を設定する工程にあっては、
評価対象である性能データに対応する最適な確率密度分布データの取得に際し、前記他方の生成情報記憶部23Bから前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に、当該逆類似度が最小の場合に当該確率密度分布を選定し、
この選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部23Aから取得するようにし、
これらの各選定及び取得の各制御動作を、前記異常検出部26が実行することを特徴とした性能監視方法。
[付記16](付記8対応)
前記付記10乃至15の何れか一つに記載の性能監視方法において、
前記性能データを評価し異常を検出する工程にあっては、
まず、前記確率密度分布モデルを作成した性能データから標準偏差を算出し、
続いて、前記評価対象の性能データが前記標準偏差に基づいて設定される閾値の範囲内に有れば問題がないデータと判定するようにし、
これらの各算出および判定にかかる工程を、前記異常検出部26が順次実行するようにしたことを特徴とする性能監視方法。
[付記17](プログラム発明/付記10対応)
監視対象装置(被監視サーバ)1の性能を示す性能データを収集する情報収集部21と、前記情報収集部21により収集した評価対象の性能データを蓄積する性能情報蓄積部22とを備えた監視装置本体2Aを有して成る性能監視装置(監視制御サーバ)2にあって、
前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データを、所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し生成する確率密度分布モデル生成処理機能、
この生成された確率密度分布モデル情報を生成情報記憶部23に格納する格納処理機能、
前記生成情報記憶部23に格納された確率密度分布モデルに基づいて、前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する最適閾値設定処理機能、
及びこの設定された最適な閾値に基づいて前記性能情報蓄積部22に蓄積された性能データの問題点の有無を評価しその異常を検出する評価異常検出処理機能を設け、
これらの各処理機能を前記監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記18](付記11対応)
前記付記17に記載の性能監視プログラムにおいて、
前記性能データの確率密度分布モデルの生成処理機能にあっては、
まず、外部指令によって作動し前記性能情報蓄積部22に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定する確率密度分布モデル推定処理機能、
前記確率密度分布モデルとこれに対応する各時間帯と対応付けたモデル周期テーブルを作成するモデル周期テーブル作成処理機能、
およびこの推定された確率密度分布モデルを予め装備された一方の生成情報記憶部23Aに又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部23Bに、それぞれ格納処理する確率密度分布モデル等格納処理機能を設け、
これらの各処理機能を前記監視装置本体が備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記19](付記12対応)
前記付記18に記載の性能監視プログラムにおいて、
前記性能データの評価異常検出処理機能では、
前記他方の生成情報記憶部23Bに記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定し且つ当該選定された確率密度分布モデルを前記一方の生成情報記憶部23Aから読み出す確率密度分布モデル選定読出処理機能を備えた構成とし、
これらの各選定および読み出しにかかる処理機能を、前記監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記20](付記13対応)
前記付記17乃至19の何れか一つに記載の性能監視プログラムにおいて、
前記確率密度分布モデルの生成処理機能にあっては、
前記隣り合う時間帯同志の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出する逆類似度算出処理機能、
および逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同志のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同志のデータは分割したままにして放置する隣接時間帯一体化処理機能、
を含むと共に、これにより前記確率密度分布を時間帯毎に設定する構成とし、
これらの各処理機能を監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記21](付記14対応)
前記付記18又は19に記載の性能監視プログラムにおいて、
前記確率密度分布モデルの生成処理機能にあっては、
外部指定される期間が複数の日付を含む場合には当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定する確率密度分布時間帯別設定処理機能、
およびこの各日付の同一時間帯毎の前記確率密度分布の逆類似度を算出すると共に当該算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を前記一方の生成情報記憶部23Aに格納する逆類似度込み確率密度分布格納処理機能を設け、
これらの各処理機能を監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記22](付記15対応)
前記付記21に記載の性能監視プログラムにおいて、
前記最適閾値設定処理機能にあっては、
評価対象である性能データに対応する最適な確率密度分布データの取得に際し、前記他方の生成情報記憶部23から前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に、当該逆類似度が最小の場合に当該確率密度分布を選定する逆類似度対応確率密度分布選定処理機能、
及びこの選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部23Aから取得する逆類似度対応確率密度分布取得処理機能を設け、
これらの各処理機能を監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
[付記23](付記16対応)
前記付記17乃至22の何れか一つに記載の性能監視プログラムにおいて、
前記性能データを評価し異常を検出する評価異常検出処理機能にあっては、
前記確率密度分布モデルを作成した性能データから標準偏差を算出する標準偏差算出処理機能、
及び前記評価対象の性能データが前記標準偏差に基づいて設定される閾値の範囲内に有れば問題がないデータと判定する性能データ正常評価処理機能を設け、
これらの各算出および判定にかかる各処理機能を監視装置本体2Aが備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
1 被監視サーバ(監視対象装置)
2 監視制御サーバ(性能監視装置)
3 監視端末
3A 指令入力部
11 監視制御エージェント
21 情報収集部
22 性能情報蓄積部
23 生成情報記憶部
23A 一方の生成情報記憶部(確率密度分布モデル蓄積部)
23B 他方の生成情報記憶部(モデル周期テーブル蓄積部)
25 最適モデル生成部(モデル生成部)
26 異常検出部
26A データ評価判定機能

Claims (9)

  1. 監視対象装置の性能を示す性能データを収集する情報収集手段と、前記情報収集手段により収集した評価対象の性能データを蓄積する性能情報蓄積手段とを備えた監視装置本体を有して成る性能監視装置において、
    前記監視装置本体が、
    前記蓄積手段に蓄積された評価対象の1日の性能情報データを所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定するモデル生成部と、このモデル生成部で推定された確率密度分布モデル情報を格納する生成情報記憶部と、前記生成情報記憶部に格納された確率密度分布モデルに基づいて当該性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する異常検出部とを有すると共に、
    前記異常検出部は、当該異常検出部が設定した最適な閾値に基づいて前記性能情報蓄積手段に蓄積された性能データの問題点の有無を評価しその異常を検出するデータ異常検出機能を備え、
    前記モデル生成部は、
    外部指令によって作動して前記蓄積手段に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能情報データの前記確率密度分布モデルを推定する機能と、当該各時間帯と対応する確率密度分布モデルとを対応づけたモデル周期テーブルを作成する機能とを備え、
    前記生成情報記憶部は、前記モデル生成部で推定され作成された確率密度分布モデル情報と前記モデル周期テーブルとをそれぞれ各別に記憶する一方と他方の生成情報記憶部を備えていることを特徴とした性能監視装置。
  2. 請求項1に記載の性能監視装置において、
    前記異常検出部は、
    前記他方の生成情報記憶部に記憶されたモデル周期テーブルに基づいて外部指令にて指定された期間に対応する所定の時間帯の前記確率密度分布モデルを選定する確率密度分布モデル選定機能と、当該選定された確率密度分布モデルを前記一方の生成情報記憶部から読み出す確率密度分布モデル読出機能を備えていることを特徴とした性能監視装置。
  3. 請求項1又は2に記載の性能監視装置において、
    前記モデル生成部は、
    前記性能データの確率密度分布モデルの推定に際しては、隣り合う時間帯同士の確率密度分布の逆類似度をカルバック・ラウブラー情報量により算出する機能と、逆類似度が予め設定した任意の値以下の場合には隣り合う時間帯同士のデータの分割を解除し又逆類似度が予め特定した任意の値以上の場合には隣り合う時間帯同士のデータは分割したままにする機能と有し、これにより前記確率密度分布を時間帯毎に設定する機能を備えていることを特徴とした性能監視装置。
  4. 請求項1又は2に記載の性能監視装置において、
    前記モデル生成部は、
    外部指定される期間が複数の日付を含む場合には、当該期間に含まれる全ての日付について日付パターンを設定すると共に全ての日付のデータに共通の時間帯で区切って性能データの確率密度分布を時間帯毎に設定する機能と、この各日付の同一時間帯毎の前記確率密度分布の逆類似度を算出する機能と、この算出した逆類似度の内の最小の逆類似度を持つ確率密度分布を前記一方の生成情報記憶部に格納する機能とを備えていることを特徴とした性能監視装置。
  5. 請求項に記載の性能監視装置において、
    前記他方の生成情報記憶部には、日付パターンにより特定される複数の日付と、各日付で共通する複数の時間帯と、各時間帯に対応した確率密度分布データとが対応付けられてモデル周期テーブルとして記憶されていることを特徴とした性能監視装置。
  6. 請求項に記載の性能監視装置において、
    前記異常検出部は、評価対象である性能データに対応する最適な確率密度分布データの取得に際しては、前記他方の生成情報記憶部から前記性能データを評価する時刻に適した確率密度分布の逆類似度を取得すると共に当該逆類似度が最小の場合に当該確率密度分布を選定する機能と、この選定した確率密度分布については逆類似度が最小の確率密度分布を閾値設定用として前記一方の生成情報記憶部から取得する機能とを備えていることを特徴とした性能監視装置。
  7. 請求項1乃至の何れか一つに記載の性能監視装置において、
    前記異常検出部は、前記確率密度分布モデルを作成した性能データから標準偏差を算出すると共に、前記評価対象の性能データが前記標準偏差に基づいて設定される閾値の範囲内に有れば問題がないデータと判定するデータ評価判定機能を備えていることを特徴とした性能監視装置。
  8. 監視対象装置の性能を示す性能データを収集する情報収集手段と、前記情報収集手段により収集した評価対象の性能データを蓄積する性能情報蓄積手段とを備えた監視装置本体を有して成る性能監視装置にあって、
    前記蓄積手段に蓄積された評価対象の1日の性能情報データを、前記監視装置本体のモデル生成部が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し、
    この推定された確率密度分布モデル情報を、前記モデル生成部が生成情報記憶部に格納し、
    前記生成情報記憶部に格納された確率密度分布モデルに基づいて、前記監視装置本体の異常検出部が機能し前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定し、
    この設定された最適な閾値に基づいて前記性能情報蓄積手段に蓄積された性能データの問題点の有無を、前記異常検出部が評価しその異常を検出するようにし
    前記性能データの確率密度分布モデルを推定する工程にあっては、
    まず、外部指令によって作動し前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を、前記モデル生成部が所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定し、同時に当該各時間帯と対応する確率密度分布モデルとを対応づけたモデル周期テーブルを作成し、
    この推定された確率密度分布モデルを予め装備された一方の生成情報記憶部に、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部に、それぞれ前記モデル生成部が格納制御するようにしたことを特徴とする性能監視方法。
  9. 監視対象装置の性能を示す性能データを収集する情報収集手段と、前記情報収集手段により収集した評価対象の性能データを蓄積する性能情報蓄積手段とを備えた監視装置本体を有して成る性能監視装置にあって、
    前記蓄積手段に蓄積された評価対象の1日の性能情報データを、所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの確率密度分布モデルを推定し生成する確率密度分布モデル生成処理機能、
    この生成された確率密度分布モデル情報を生成情報記憶部に格納する格納処理機能、
    前記生成情報記憶部に格納された確率密度分布モデルに基づいて、前記性能データの周期性を特定すると共に当該特定した周期における最適な閾値を設定する最適閾値設定処理機能、
    及びこの設定された最適な閾値に基づいて前記性能情報蓄積手段に蓄積された性能データの問題点の有無を評価しその異常を検出する評価異常検出処理機能を設けると共に、
    上記性能データの確率密度分布モデル生成処理機能にあっては、
    外部指令によって作動し前記蓄積部に蓄積された評価対象の1日の性能情報データの内の指定された期間を所定の時間間隔で分割して時間帯ごとに前記評価対象の性能データの前記確率密度分布モデルを推定する確率密度分布モデル推定処理機能、
    前記確率密度分布モデルとこれに対応する前記各時間帯とを対応づけたモデル周期テーブルを作成するモデル周期テーブル作成処理機能、
    及び推定された前記確率密度分布モデルを予め装備された一方の生成情報記憶部に、又前記作成されたモデル周期テーブルを予め装備された他方の生成情報記憶部に、それぞれ格納制御する確率密度分布モデル等格納処理機能を備え、
    これらの各処理機能を前記監視装置本体が備えているコンピュータに実現させるようにしたことを特徴とする性能監視プログラム。
JP2012083364A 2012-03-31 2012-03-31 性能監視装置、性能監視方法、及びそのプログラム Expired - Fee Related JP5928104B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012083364A JP5928104B2 (ja) 2012-03-31 2012-03-31 性能監視装置、性能監視方法、及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012083364A JP5928104B2 (ja) 2012-03-31 2012-03-31 性能監視装置、性能監視方法、及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2013214171A JP2013214171A (ja) 2013-10-17
JP5928104B2 true JP5928104B2 (ja) 2016-06-01

Family

ID=49587454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012083364A Expired - Fee Related JP5928104B2 (ja) 2012-03-31 2012-03-31 性能監視装置、性能監視方法、及びそのプログラム

Country Status (1)

Country Link
JP (1) JP5928104B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107250936B (zh) * 2015-02-17 2019-09-20 富士通株式会社 判定装置及判定方法
JP2016177676A (ja) * 2015-03-20 2016-10-06 株式会社東芝 診断装置、診断方法、診断システムおよび診断プログラム
JP6440203B2 (ja) 2015-09-02 2018-12-19 Kddi株式会社 ネットワーク監視システム、ネットワーク監視方法およびプログラム
JP7091872B2 (ja) * 2018-06-21 2022-06-28 日本電信電話株式会社 検知装置及び検知方法
JP7111173B2 (ja) * 2018-10-29 2022-08-02 日本電気株式会社 情報処理装置
GB2589593B (en) * 2019-12-03 2022-05-11 Siemens Ind Software Inc Identifying causes of anomalies observed in an integrated circuit chip
CN117290787B (zh) * 2023-11-24 2024-03-08 珠海格力电器股份有限公司 信息生成方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005316808A (ja) * 2004-04-30 2005-11-10 Nec Software Chubu Ltd 性能監視装置および性能監視方法並びにプログラム
JP2009070017A (ja) * 2007-09-12 2009-04-02 Hitachi Ltd 性能監視システム
JP5163404B2 (ja) * 2008-09-30 2013-03-13 日本電気株式会社 障害分析システム、障害分析方法および障害分析用プログラム

Also Published As

Publication number Publication date
JP2013214171A (ja) 2013-10-17

Similar Documents

Publication Publication Date Title
JP5928104B2 (ja) 性能監視装置、性能監視方法、及びそのプログラム
JP6354755B2 (ja) システム分析装置、システム分析方法、及びシステム分析プログラム
US7702485B2 (en) Method and apparatus for predicting remaining useful life for a computer system
CN108700851B (zh) 用于预测能量消耗的系统、方法和基于云的平台
CN105787248B (zh) 基于时间序列数据的分析的异常感测和预测系统及方法
JP6330922B2 (ja) 情報処理装置および情報処理方法
JP6571914B2 (ja) 情報の複数のドメインを組合せることによる仕事の実施データ内の異常の検知
US20160217378A1 (en) Identifying anomalous behavior of a monitored entity
KR101948604B1 (ko) 센서 군집화 기반의 설비 건강 모니터링 방법 및 장치
CN105871634B (zh) 检测集群异常的方法及应用、管理集群的系统
US20140052489A1 (en) Time derivative-based program management systems and methods
JP5387779B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP5827426B1 (ja) 予兆診断システム及び予兆診断方法
JP5827425B1 (ja) 予兆診断システム及び予兆診断方法
JP6489235B2 (ja) システム分析方法、システム分析装置、および、プログラム
JP6777142B2 (ja) システム分析装置、システム分析方法、及び、プログラム
WO2018073960A1 (ja) 表示方法、表示装置、および、プログラム
JP5634599B2 (ja) データ処理システム、データ処理方法、及び、プログラム
US20140188777A1 (en) Methods and systems for identifying a precursor to a failure of a component in a physical system
US20220245010A1 (en) Time-series anomaly detection using an inverted index
CN106598822A (zh) 一种用于容量评估的异常数据检测方法及装置
Schiöler et al. Multivariate outbreak detection
Özaltın et al. Predicting the solution time of branch-and-bound algorithms for mixed-integer programs
JP2015122825A (ja) 配電系統の負荷予測装置および配電系統の負荷予測方法
JP2011044592A (ja) 信頼度判断装置、信頼度判断方法、及び信頼度判断用コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160411

R150 Certificate of patent or registration of utility model

Ref document number: 5928104

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees