WO2012086444A1

WO2012086444A1 - 監視データ分析装置、監視データ分析方法および監視データ分析プログラム

Info

Publication number: WO2012086444A1
Application number: PCT/JP2011/078714
Authority: WO
Inventors: 敏夫登内
Original assignee: 日本電気株式会社
Priority date: 2010-12-24
Filing date: 2011-12-12
Publication date: 2012-06-28
Also published as: US9465713B2; JPWO2012086444A1; US20130191107A1; JP5871193B2

Abstract

　監視対象システムの性能値が利用パターンごとに大きく相違する場合であっても、性能値の予測精度を向上させる。性能管理の対象となる監視対象システムにおける監視データを含むログデータを複数のグループに分類し、当該グループごとに生成した回帰モデルを、それぞれの回帰モデルに対応するグループに属するログデータ、および性能検査の対象となるログデータである検査対象ログデータを用いて合成することで、回帰モデルを再計算する回帰モデル再計算部１４を、備える。

Description

監視データ分析装置、監視データ分析方法および監視データ分析プログラム

　本発明は、監視データ分析装置、監視データ分析方法および監視データ分析プログラムに関する。

　システムの性能管理を行う場合に、監視対象システムにおける過去の監視データを回帰分析して回帰モデルを求め、この回帰モデルを用いてシステムの性能値を予測する技術がある。例えば、下記特許文献１には、ＷＷＷサイトの性能監視装置に関する技術が開示されている。

特開２００２－２６８９２２号公報

　ところで、システムの中には、例えば昼間は閲覧処理等のデータ検索による利用が多く、夜間はバッチ処理等のデータ更新による利用が多いなどのように、複数の利用パターンを有するものがある。このようなシステムにおいて、例えば読出しや書込み等の操作要求数に対するディスクの利用率を、性能値として予測する場合、従来の性能管理手法では、全ての利用パターンにおける監視データを用いて回帰モデルを生成し、予測することになる。しかしながら、ディスクの利用率は利用パターンによって大きく相違するため、従来の手法では、回帰モデルに基づく予測値と実際の値との間に生ずる誤差が大きくなり、性能値の予測精度が低下してしまう。

　本発明は、上述した課題を解決するためになされたものであり、監視対象システムの性能値が利用パターンごとに大きく相違する場合であっても、性能値の予測精度を向上させることができる監視データ分析装置、監視データ分析方法および監視データ分析プログラムを提供することを目的とする。

　本発明の監視データ分析装置は、性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算部を、備える。

　本発明の監視データ分析方法は、性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算ステップを、含む。

　本発明の監視データ分析プログラムは、上記監視データ分析方法に含まれるステップをコンピュータに実行させる。

　本発明によれば、監視対象システムの性能値が利用パターンごとに大きく相違する場合であっても、性能値の予測精度を向上させることができる。

第１実施形態における監視データ分析装置の構成を例示した図である。ログデータファイルのデータ構成を例示する図である。特徴データ項目を例示するグラフである。行列Ａの要素を例示する図である。検査対象ログデータの一例を示す図である。第１実施形態における回帰モデルを用いてディスク利用率を算出する際の動作を説明するためのフローチャートである。図６に示す特徴データ項目抽出処理の手順を説明するためのフローチャートである。図６に示す回帰モデル再計算処理の手順を説明するためのフローチャートである。第２実施形態における監視データ分析装置の構成を例示した図である。回帰モデルを例示する図である。第２実施形態におけるログデータを複数のグループに分類してグループごとに回帰モデルを生成する際の動作を説明するためのフローチャートである。第２実施形態における監視対象システムの異常判定処理の手順を説明するためのフローチャートである。

　以下、添付図面を参照して、本発明に係る監視データ分析装置、監視データ分析方法および監視データ分析プログラムの好適な実施形態について説明する。本発明に係る監視データ分析装置は、性能管理の対象となる監視対象システムにおける監視データを分析する装置である。

　[第１実施形態]
　まず、第１実施形態における監視データ分析装置の構成について説明する。

　監視データ分析装置は、物理的には、例えば、ＣＰＵ（Central Processing Unit）と、記憶装置と、入出力インターフェースとを含んで構成される。記憶装置には、例えば、ＣＰＵで処理されるプログラムやデータを記憶するＲＯＭ（Read Only Memory）やＨＤＤ（Hard Disk Drive）、主として制御処理のための各種作業領域として使用されるＲＡＭ（Random Access Memory）等の要素が含まれる。これらの要素は、互いにバスを介して接続されている。ＣＰＵが、ＲＯＭに記憶されたプログラムを実行し、入出力インターフェースを介して受信されるメッセージや、ＲＡＭに展開されるデータを処理することで、後述する監視データ分析装置における各部の機能を実現することができる。

　図１に示すように、監視データ分析装置１は、機能的には、例えば、特徴データ項目抽出部１３と、回帰モデル再計算部１４と、性能値算出部１５とを有する。また、各部が参照するファイルとして、ログデータを蓄積するログデータファイル２１と、回帰モデルを格納する回帰モデルファイル２２とを備える。ログデータは、監視対象システムにおける監視データを時系列に記録したデータである。回帰モデルは、利用パターンごとのグループに分類した各ログデータを回帰分析することで生成される。利用パターンとしては、例えばデータ検索型（読出し型）や、データ更新型（書込み型）が該当する。本実施形態では、予め上記回帰分析が行われ、複数の回帰モデルが回帰モデルファイル２２に格納されていることとする。

　図２を参照して、ログデータファイル２１のデータ構成について説明する。ログデータファイル２１は、データ項目として、例えば、時刻区分項目、ディスク利用率項目、リクエスト数項目、書込回数項目、読出回数項目および平均データ長項目を有する。ログデータファイル２１は、時刻区分項目ごとに一件のレコード（以下、「ログレコード」という。）を生成する。

　時刻区分項目は、ログレコードの各データが属する時間帯を識別する区分情報を格納する。ディスク利用率項目は、監視対象システムにおけるディスク（例えばＨＤＤ）の利用率を格納する。本実施形態では、監視対象システムの資源利用率として、ディスク利用率を用いて説明するが、資源利用率をディスク利用率に限定するものではない。資源利用率には、監視対象システムの構成要素の利用状況を示すデータを用いることができる。具体的には、上記ディスク利用率の他に、例えば、ＣＰＵの利用率や、メモリ（例えばＲＡＭ）の利用率、ネットワークの利用率等が該当する。

　リクエスト数項目は、監視対象システムが受信したリクエストの件数を格納する。なお、リクエストの件数であることには限定されず、例えば、リクエストの到着率を用いてもよい。

　書込回数項目は、監視対象システムのディスクにデータを書き込んだ回数を格納する。読出回数項目は、監視対象システムのディスクからデータを読み出した回数を格納する。平均データ長項目は、対象時間帯に受信した各リクエストのデータ長の対象時間帯での平均値を格納する。

　図１に示す特徴データ項目抽出部１３は、ログデータに含まれるデータ項目の中から、回帰モデルの説明変数（リクエスト数λ）と関連があるデータ項目を、特徴データ項目として抽出する。

　特徴データ項目抽出部１３は、回帰分析時に分類されたグループごとに、そのグループを形成するログデータに含まれる各データ項目について、各データ項目の説明変数への依存度を算出する。特徴データ項目抽出部１３は、上記依存度が所定閾値よりも高いデータ項目を、特徴データ項目として抽出する。

　各データ項目の説明変数への依存度は、例えば、以下のように算出することができる。

　特徴データ項目抽出部１３は、下記式（１）に示すように、回帰分析時に分類された全グループＸを対象にして、ログデータのデータ項目ａ_ｊごとに、そのデータ項目ａ_ｊの値ｘ．ａ_ｊを回帰モデルの説明変数の値（リクエスト数）ｘ．λで除算した値の分散ｄ_ｊ（以下、「グループ全体での分散ｄ_ｊ」という。）を算出する。

　特徴データ項目抽出部１３は、下記式（２）に示すように、回帰分析時に分類された各グループＸ_ｉを対象にして、各グループＸ_ｉに属するログデータのデータ項目ａ_ｊごとに、データ項目ａ_ｊの値ｘ．ａ_ｊを回帰モデルの説明変数の値（リクエスト数）ｘ．λで除算した値の分散ｄ_ｊｉを、グループＸ_ｉごとに算出する。

　特徴データ項目抽出部１３は、下記式（３）に示すように、グループＸ_ｉごとに算出した各データ項目ａ_ｊの分散ｄ_ｊｉを全グループＸで集計することで、各グループＸ_ｉでの分散ｄ_ｊｉのグループ全体における合計ｄ_ｊ’（以下、「各グループでの分散の総和ｄ_ｊ’」という。）を算出する。

　特徴データ項目抽出部１３は、各グループでの分散の総和ｄ_ｊ’をグループ全体での分散ｄ_ｊで除算した値が所定閾値ｋよりも小さい場合（ｄ_ｊ’／ｄ_ｊ　＜　ｋ）に、その条件を満たすデータ項目ａ_ｊは説明変数への依存度が高いと判定し、そのデータ項目ａ_ｊを特徴データ項目として抽出する。

　図３に、データ項目ａ_ｊ別に（ｄ_ｊ’／ｄ_ｊ）の値を棒グラフで表した図を示す。図３では、各データ項目ａ_ｊを横軸に配置し、（ｄ_ｊ’／ｄ_ｊ）の値を縦軸に示す。また、閾値ｋを０．３に設定している。この場合に、（ｄ_ｊ’／ｄ_ｊ）の値が０．３よりも小さいデータ項目は、“書込回数項目”と“読出回数項目”とである。したがって、“書込回数項目”と“読出回数項目”とが、特徴データ項目として抽出される。

　図１に示す回帰モデル再計算部１４は、回帰モデルファイル２２に格納された複数の回帰モデルを、特徴データ項目抽出部１３により抽出された特徴データ項目を参照して合成することで、監視対象システムの性能検査をするときに用いる回帰モデルを算出（再計算）する。

　なお、予め特徴データ項目が判明している場合には、特徴データ項目抽出部１３により抽出された特徴データ項目を参照する代わりに、判明しているデータ項目を利用することもできる。例えば、Ｗｅｂシステムでは、データベースへの書き込みが有る場合と無い場合とでは、処理性能が大きく異なることが知られている。したがって、このような場合には、“書込回数項目”と“読出回数項目”とが特徴データ項目になることが予め判明していることになる。

　具体的に、回帰モデル再計算部１４は、説明変数に対する各特徴データ項目の値の割合をグループごとに算出し、この算出した割合を用いて各グループの回帰モデルを合成することで、各特徴データ項目に関する回帰モデルである特徴データ項目別回帰モデルを算出する。回帰モデル再計算部１４は、算出した各特徴データ項目別回帰モデルを、監視対象システムでの性能検査の対象となるログデータ（以下、「検査対象ログデータ」という。）に含まれる各特徴データ項目の値の出現率に応じて合成することで、回帰モデルを算出する。

　特徴データ項目別回帰モデルは、例えば、以下のように算出する。

　最初に、分類したグループ数をｍとし、抽出した特徴データ項目数をｎとした場合に、回帰モデル再計算部１４は、ｍ行ｎ列の行列Ａを生成する。この行列Ａの各要素（ｉ、ｊ）には、特徴データ項目ａ_ｊの値を説明変数（リクエスト数λ）で除算した値のグループＸ_ｉでの平均値が配列される。

　例えば、図４に示すように、分類したグループが“グループ１”と“グループ２”との２グループであり、抽出した特徴データ項目が“書込回数項目”と“読出回数項目”との２データ項目である場合には、行列Ａは２行×２列の行列となる。図４に示す各データ欄には、各特徴データ項目の値をリクエスト数λで除算した値の各グループでの平均値が格納されている。つまり、この各データ欄の値が、行列Ａの各要素（ｉ、ｊ）となる。この場合の行列Ａは、以下のように表される。

　続いて、回帰モデル再計算部１４は、行列Ａの疑似逆行列Ａ^＋を算出する。疑似逆行列を算出する手法は、例えば、下記参考文献１に記載されている手法を用いることができる。

　[参考文献１]
　Ｄ．Ａ．ハーヴィル著、「統計のための行列代数下（２）」、２０章ムーア＿ベンローズ形逆行列、シュプリンガー・ジャパン（株）

　例えば、上記例示した行列Ａの疑似逆行列Ａ^＋は、以下のように表される。

　続いて、回帰モデル再計算部１４は、ある特徴データ項目ａ_ｊの値を“１”とし、その他の特徴データ項目の値を“０”とした場合の回帰モデルｈ_ａｊ（λ）を、下記式（４）を用いて算出することで、特徴データ項目別回帰モデルを算出する。下記式（４）のｆ_ｉ（λ）は、回帰モデル生成部１２により生成されたグループＸ_ｉの回帰モデルである。

　ここで、図４に示す“グループ１”の回帰モデルが、“ｆ_１（λ）＝０．００４１λ＋０．０９５１”であり、“グループ２”の回帰モデルが、“ｆ_２（λ）＝０．００１９λ＋０．１１８８”であると仮定する。この場合に、“書込回数項目ａ_１”の特徴データ項目別回帰モデルは、上記式（４）を用いて“ｈ_ａ１（λ）＝１．２（０．００４１λ＋０．０９５１）－０．２（０．００１９λ＋０．１１８８）”と算出される。また、“読出回数項目ａ_２”の特徴データ項目別回帰モデルは、上記式（４）を用いて“ｈ_ａ２（λ）＝－０．３（０．００４１λ＋０．０９５１）＋１．３（０．００１９λ＋０．１１８８）”と算出される。

　次に、特徴データ項目別回帰モデルを用いて回帰モデルを再計算する際の手順を以下に述べる。

　最初に、回帰モデル再計算部１４は、検査対象ログデータに含まれる各特徴データ項目ａ_ｊの値を説明変数（リクエスト数λ）で除算した値の検査対象ログデータでの平均値ｂ_ｊを算出する。

　続いて、回帰モデル再計算部１４は、下記式（５）を用いて回帰モデルｆ（λ）を生成する。つまり、既存の複数の回帰モデルを利用して、検査対象ログデータに基づいて性能検査をするときに用いる回帰モデルを再計算する。

　ここで、検査対象ログデータが、図５に示すログデータであると仮定する。この場合、特徴データ項目である“書込回数項目ａ_１”の値をリクエスト数λで除算した値の平均値ｂ_１は、９０／１００＝０．９となる。また、特徴データ項目である“読出回数項目ａ_２”の値をリクエスト数λで除算した値の平均値ｂ_２は、１０／１００＝０．１となる。

　したがって、図５に示す検査対象ログデータに基づいて性能検査をするときに用いる回帰モデルは、上記式（５）より、“ｆ（λ）＝０．９ｈ_ａ１（λ）＋０．１ｈ_ａ２（λ）”となる。

　図１に示す性能値算出部１５は、回帰モデル再計算部１４により再計算された回帰モデルｆ（λ）を用いて、リクエスト数λに対応するディスク利用率ρを算出する。これにより、検査対象ログデータに基づく性能値を算出することができる。

　ここで、例えば、再計算された回帰モデルが“ｆ（λ）＝０．９ｈ_ａ１（λ）＋０．１ｈ_ａ２（λ）”であり、書込回数項目ａ_１の特徴データ項目別回帰モデルが“ｈ_ａ１（λ）＝１．２（０．００４１λ＋０．０９５１）－０．２（０．００１９λ＋０．１１８８）”であり、読出回数項目ａ_２の特徴データ項目別回帰モデルが“ｈ_ａ２（λ）＝－０．３（０．００４１λ＋０．０９５１）＋１．３（０．００１９λ＋０．１１８８）”である場合に、想定するリクエスト数λが“４００”に設定されたときのディスク利用率ρを求めてみる。

　この場合、ディスク利用率ρは、ρ＝ｆ（４００）＝０．９ｈ_ａ１（４００）＋０．１ｈ_ａ２（４００）＝１．７７と求まる。つまり、この例では、ディスク利用率ρが１を超えることになる。したがって、この場合、管理者は、ディスク資源を増強する等の処置を講ずることになる。

　次に、第１実施形態における監視データ分析装置の動作について説明する。図６を参照して、回帰モデルを用いてディスク利用率を算出する際の動作について説明する。

　最初に、特徴データ項目抽出部１３が、後述する特徴データ項目抽出処理を実行する（ステップＳ１０１）。続いて、回帰モデル再計算部１４が、後述する回帰モデル再計算処理を実行する（ステップＳ１０２）。続いて、性能値算出部１５は、回帰モデル再計算部１４により再計算された回帰モデルｆ（λ）を用いて、想定するリクエスト数に対応するディスク利用率を算出する（ステップＳ１０３）。想定するリクエスト数は、管理者が監視データ分析装置に任意に設定することができる。

　図７を参照して、上記ステップＳ１０１で実行される特徴データ項目抽出処理について説明する。

　以下に説明するステップＳ２０１～ステップＳ２０４までの各処理は、ログデータに含まれる全てのデータ項目ａ_ｊを対象にして、データ項目ａ_ｊごとに順次ループして実行する。

　最初に、特徴データ項目抽出部１３は、上記式（１）を用い、回帰分析時に分類された全グループＸのログデータを対象にして、対象データ項目ａ_ｊの値をリクエスト数λで除算した値の分散ｄ_ｊを算出する（ステップＳ２０１）。

　続いて、特徴データ項目抽出部１３は、上記式（２）を用い、各グループＸ_ｉのログデータを対象にして、対象データ項目ａ_ｊの値をリクエスト数λで除算した値の分散ｄ_ｊｉを、グループＸ_ｉごとに求め、さらに、上記式（３）を用い、分散ｄ_ｊｉのグループ全体での総和ｄ_ｊ’を算出する（ステップＳ２０２）。

　続いて、特徴データ項目抽出部１３は、上記ステップＳ２０２で算出した総和ｄ_ｊ’を、上記ステップＳ２０１で算出した分散ｄ_ｊで除算した値が、閾値ｋよりも小さいか否かを判定する（ステップＳ２０３）。この判定がＮＯである場合（ステップＳ２０３；ＮＯ）には、処理をステップＳ２０４の後段に移行する。

　一方、上記ステップＳ２０３の判定で、上記（ｄ_ｊ’／ｄ_ｊ）の値が閾値ｋよりも小さいと判定された場合（ステップＳ２０３；ＹＥＳ）に、特徴データ項目抽出部１３は、対象データ項目ａ_ｊを特徴データ項目として抽出する（ステップＳ２０４）。

　図８を参照して、上記ステップＳ１０２で実行される回帰モデル再計算処理について説明する。

　最初に、回帰モデル再計算部１４は、上記ステップＳ１０１で抽出された各特徴データ項目ａ_ｊの値を説明変数（リクエスト数λ）で除算した値のグループＸ_ｉでの平均値を行列の要素とし、グループ数ｍ行×特徴データ項目数ｎ列の行列Ａを生成する（ステップＳ３０１）。

　続いて、回帰モデル再計算部１４は、行列Ａの疑似逆行列Ａ^＋を算出する（ステップＳ３０２）。

　続いて、回帰モデル再計算部１４は、上記式（４）を用い、特徴データ項目別回帰モデルｈ_ａｊ（λ）を算出する（ステップＳ３０３）。

　続いて、回帰モデル再計算部１４は、検査対象ログデータに含まれる各特徴データ項目ａ_ｊの値をリクエスト数λで除算した値の検査対象ログデータでの平均値ｂ_ｊを算出する（ステップＳ３０４）。

　続いて、回帰モデル再計算部１４は、上記ステップＳ３０３で算出した特徴データ項目別回帰モデルｈ_ａｊ（λ）と、上記ステップＳ３０４で算出した平均値ｂ_ｊとを、上記式（５）に代入して回帰モデルｆ（λ）を算出することで、検査対象ログデータ用の回帰モデルｆ（λ）を生成（再計算）する（ステップＳ３０５）。

　上述したように、第１実施形態の監視データ分析装置によれば、検査対象ログデータに含まれる各特徴データ項目の値の割合に応じて、既存の複数の回帰モデルを合成し、新たな回帰モデルを生成（再計算）することができる。これにより、想定する利用パターンに適応させた回帰モデルを生成し、この回帰モデルを用いてディスク利用率等の資源利用率を予測することができる。それゆえに、ディスク利用率等の資源利用率が利用パターンごとに大きく相違する場合であっても、資源利用率の予測精度を向上させることができる。また、この資源利用率に応じて的確な処置を講ずることが可能となる。

　なお、上述した第１実施形態における特徴データ項目抽出部１３は、各データ項目の説明変数への依存度を用いて特徴データ項目を抽出しているが、特徴データ項目を抽出する方法は、これに限定されない。例えば、以下のような抽出方法を用いることができる。

　特徴データ項目抽出部１３は、回帰分析時に分類されたグループＸ_ｉごとに、そのグループを形成するログデータに含まれる各データ項目ａ_ｊについて、各データ項目ａ_ｊと説明変数（リクエスト数λ）との間の相関係数のグループＸ_ｉでの平均値を算出する。特徴データ項目抽出部１３は、算出した上記平均値が所定閾値ｋ’以上となるデータ項目ａ_ｊを、特徴データ項目として抽出する。

　各データ項目ａ_ｊと説明変数との間の相関係数の平均値は、例えば、以下の手順で算出することができる。

　最初に、特徴データ項目抽出部１３は、下記式（６）を用い、グループＸ_ｉごとに、各データ項目ａ_ｊと説明変数（リクエスト数λ）との間の相関係数ｒ_ｊｉを算出する。

　上記式（６）のｐ^（ｋ）．ａ_ｊはグループＸ_ｉに属するｋ番目のログレコードのデータ項目ａ_ｊの値であり、ｐ^（ｋ）．λはグループＸ_ｉに属するｋ番目のログレコードのリクエスト数項目の値であり、ｍはグループ数である。

　続いて、特徴データ項目抽出部１３は、グループＸ_ｉごとの相関係数ｒ_ｊｉを全グループＸで集計した値を、グループ数ｍで除算することで、各データ項目ａ_ｊと説明変数との間の相関係数の平均値ｒ_ｊを算出する。

　続いて、特徴データ項目抽出部１３は、｜ｒ_ｊ｜が閾値ｋ’以上となるデータ項目ａ_ｊを、特徴データ項目として抽出する。

　また、上述した第１実施形態では、特徴データ項目抽出部１３によって特徴データ項目を抽出しているが、これに限定されない。例えば、特徴データ項目が明らかである場合には、管理者が予め特徴データ項目をメモリに登録する等して設定してもよい。この場合には、特徴データ項目抽出部１３を不要にすることができる。特徴データ項目抽出部１３を不要とした場合、回帰モデル再計算部１４は、上記メモリを参照して特徴データ項目の値を取得すればよい。

　また、上述した第１実施形態では、性能値算出部１５を、特徴データ項目抽出部１３および回帰モデル再計算部１４と同一の装置内に設けているが、性能値算出部１５を外部の装置に設けることとしてもよい。

　[第２実施形態]
　本発明の第２実施形態について説明する。まず、第２実施形態における監視データ分析装置の構成について説明する。

　図９に示すように、第２実施形態の監視データ分析装置は、上述した第１実施形態の監視データ分析装置（図１参照）が有する各種機能に加え、データ分類部１１、回帰モデル生成部１２および異常判定部１６をさらに有する点で第１実施形態の監視データ分析装置と異なる。それ以外の構成については、第１実施形態の監視データ分析装置と同様であるため、各構成要素には同一の符合を付し、その説明は省略する。以下においては、主に第１実施形態との相違点について説明する。

　データ分類部１１は、ログデータファイル２１に格納されたログデータを、利用パターン（例えばデータ検索型やデータ更新型）ごとのグループに分類する。

　利用パターンごとのグループに分類する手法として、例えば、最短距離法、最長距離法、群平均法、ウォード方等の公知のクラスタリング手法を用いることができる。

　クラスタリング手法を用いてログデータを複数のグループに分類する際の手順の一例を、以下に述べる。本実施形態では、グループに分類する際の特性として、リクエスト数λに対するディスク利用率ρの特性を用いる。

　最初に、ログデータをログレコード単位に、図１０に示す座標平面上に配置する。図１０の横軸はリクエスト数λを示し、縦軸はディスク利用率ρを示す。

　続いて、上記クラスタリング手法を用い、リクエスト数λに対するディスク利用率ρの特性に基づいて、座標平面上に配置した各データを順次まとめていく。ここでは、最終的に、図１０に示す第１グループＧ１と第２グループＧ２とに分類される。この場合、第１グループＧ１には、データ更新型の利用パターンに属するログデータが分類され、第２グループＧ２には、データ検索型の利用パターンに属するログデータが分類される。

　図９に示す回帰モデル生成部１２は、分類されたグループごとにログデータの回帰分析を実行し、回帰モデルを生成する。回帰モデルを生成する手法としては、例えば、下記参考文献２に記載されている手法を用いることができる。

　[参考文献２]
　長畑秀和著、「多変量解析へのステップ」、２章回帰分析、共立出版

　具体的に、回帰モデル生成部１２は、例えば、回帰分析の目的変数としてディスク利用率ρを用い、回帰分析の説明変数としてリクエスト数λを用いて回帰分析を行う。例えば、図１０に示すログデータを回帰分析した場合に、第１グループＧ１に属するログデータの回帰モデルＭ１として下記式（７）で表される回帰モデルが生成され、第２グループＧ２に属するログデータの回帰モデルＭ２として、下記式（８）で表される回帰モデルが生成される。

　回帰モデルＭ１：ｆ_１（λ）＝ρ＝０．００４１λ＋０．０９５１　…　式（７）
　回帰モデルＭ２：ｆ_２（λ）＝ρ＝０．００１９λ＋０．１１８８　…　式（８）

　回帰モデル生成部１２は、生成した回帰モデルＭ１および回帰モデルＭ２を回帰モデルファイル２２に格納する。

　図９に示す異常判定部１６は、検査対象ログデータのログレコードごとに、リクエスト数項目の値λ’を回帰モデルｆ（λ）に代入して得られる値ｆ（λ’）と、ディスク利用率項目の値ρ’との差（｜ｆ（λ’）－ρ’｜）が所定の閾値よりも大きいか否かを判定する。異常判定部１６は、｜ｆ（λ’）－ρ’｜が所定の閾値よりも大きい場合に、監視対象システムに異常が有ると判定する。

　具体的に、監視対象システムにおける異常の有無は、以下のように判定することができる。

　異常判定部１６は、回帰モデル再計算部１４により再計算された回帰モデルｆ（λ）の目的変数（ディスク利用率ρ）に関して、分散Ｖ（ρ）を求め、その標準偏差（√Ｖ）を算出する。異常判定部１６は、｜ｆ（λ’）－ρ’｜を算出し、この値を標準偏差（√Ｖ）で除算した値が、閾値ａよりも大きい場合に、監視対象システムに異常が有ると判定する。閾値ａの値は任意に設定することができる。言い替えると、異常判定部１６は、｜ｆ（λ’）－ρ’｜の値が、標準偏差（√Ｖ）に対してどの程度の隔たりを有するのかを基準にして異常の有無を判定する。

　上記分散Ｖ（ρ）は、例えば、下記式（９）から導出される下記式（１０）を計算することで求めることができる。下記式（９）の回帰モデルｆ（λ）は、上記式（４）および式（５）から導出することができ、下記式（１０）の分散Ｖ（ρ）は、下記式（９）から導出することができる。

　上記式（１０）のＶ（ρ_j）は、グループＸ_ｉごとに算出される回帰モデルの目的変数（ディスク利用率ρ）に関する分散である。ρ_jは、グループＸ_ｉにおける目的変数の分布を示す確率変数である。

　次に、第２実施形態における監視データ分析装置の動作について説明する。ここで、回帰モデルを用いてディスク利用率を算出する際の動作については、上述した第１実施形態における監視データ分析装置の動作（図６～図８参照）と同様であるため、その説明を省略する。

　まず、図１１を参照して、ログデータを複数のグループに分類し、グループごとに回帰モデルを生成する際の動作について説明する。

　最初に、データ分類部１１は、ログデータファイル２１に格納されたログデータをクラスタリングし、複数のグループに分類する（ステップＳ４０１）。

　続いて、回帰モデル生成部１２は、分類されたグループごとにログデータの回帰分析を実行し、回帰モデルを生成する（ステップＳ４０２）。

　なお、生成した回帰モデルは、後述するように、例えば、ディスク利用率等の資源利用率を算出する際や、監視対象システムの異常を判定する際等に用いることができる。

　次に、図１２を参照して、監視対象システムの異常判定処理について説明する。この異常判定処理は、上述した図６のステップＳ１０２が実行された後に実行する。異常判定処理は、図６のステップＳ１０３と並行して実行してもよいし、ステップＳ１０３の前または後に実行してもよい。

　最初に、異常判定部１６は、回帰モデル再計算部１４により再計算された再計算回帰モデルｆ（λ）を参照して、目的変数（ディスク利用率ρ）に関する標準偏差（√Ｖ）を算出する（ステップＳ５０１）。

　以下に説明するステップＳ５０２～ステップＳ５０３までの各処理は、検査対象ログデータに含まれる全てのログレコードを対象にして、ログレコードごとに順次ループして実行する。

　続いて、異常判定部１６は、検査対象ログデータのリクエスト数項目の値λ’を、再計算回帰モデルｆ（λ）に代入して得られる値ｆ（λ’）と、検査対象ログデータのディスク利用率項目の値ρ’との差を求め、この差を、上記ステップＳ５０１で算出した標準偏差（√Ｖ）で除算した値を算出する（ステップＳ５０２）。

　続いて、異常判定部１６は、上記ステップＳ５０２で算出した値が、閾値ａよりも大きいか否かを判定する（ステップＳ５０３）。この判定がＮＯである場合（ステップＳ５０３；ＮＯ）には、処理を後段に移行する。

　一方、上記ステップＳ５０３の判定で、上記ステップＳ５０２で算出した値が閾値ａよりも大きいと判定された場合（ステップＳ５０３；ＹＥＳ）に、異常判定部１６は、監視対象システムに異常が有ると判定し、管理者に異常を通知する（ステップＳ５０４）。管理者に異常を通知する手法としては、例えば、その旨のメッセージを出力する手法や、警告音を出力する手法等が該当する。

　上述したように、第２実施形態における監視データ分析装置によれば、第１実施形態の監視データ分析装置による効果に加え、ログデータを、データ更新型やデータ検索型等の利用パターンに応じたグループに分類することができ、分類したグループごとに回帰モデルを生成することができる。これにより、ディスク利用率等の資源利用率が利用パターンごとに大きく相違する場合であっても、それぞれの利用パターンに応じた回帰モデルをそれぞれ生成することが可能となる。したがって、監視対象システムが複数の利用パターンを有する場合であっても、回帰モデルを用いて予測する際の誤差を低減することができる。

　また、想定する利用パターンに適応させた回帰モデルとの差に基づいて監視対象システムの異常を発見することができるため、異常発見の精度を向上さることが可能となる。

　[各実施形態の変形例]
　上述した各実施形態は、単なる例示に過ぎず、各実施形態に明示していない種々の変形や技術の適用を排除するものではない。すなわち、本発明は、その趣旨を逸脱しない範囲で様々な形態に変形して実施することができる。

　例えば、上述した各実施形態では一つの監視データ分析装置で本発明を実施しているが、本発明は複数の装置で実施することもできる。この場合には、上述した各実施形態における監視データ分析装置が有する各機能を複数の装置に分散し、これら複数の装置群を上述した各実施形態における監視データ分析装置と同様に機能させればよい。

　また、上記の各実施形態の一部または全部は、以下の付記のようにも記載され得るが、本発明を以下に限定するものではない。

　（付記１）　性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算部を、備えることを特徴とする監視データ分析装置。

　（付記２）　前記ログデータを蓄積するデータ蓄積部と、前記ログデータに含まれる前記監視対象システムの構成要素の利用状況を示す利用状況データの特性に基づいて、前記ログデータを前記グループに分類するデータ分類部と、前記グループごとに前記ログデータの回帰分析を実行して前記回帰モデルを生成する回帰モデル生成部と、さらに備えることを特徴とする付記１記載の監視データ分析装置。

　（付記３）　前記ログデータに含まれるデータ項目の中から、前記回帰モデルの説明変数と関連がある前記データ項目を特徴データ項目として抽出する特徴データ項目抽出部を、さらに備えることを特徴とする付記１記載の監視データ分析装置。

　（付記４）　前記特徴データ抽出部は、前記グループごとに、当該グループを形成するデータの各データ項目における前記説明変数への依存度を算出し、当該算出した前記依存度が所定閾値よりも高いデータ項目を、前記特徴データ項目として抽出する、ことを特徴とする付記３記載の監視データ分析装置。

　（付記５）　前記特徴データ抽出部は、前記グループごとに、当該グループを形成するデータの各データ項目における前記説明変数との間の相関係数を算出し、当該算出した各前記相関係数の平均値が所定閾値よりも大きいデータ項目を、前記特徴データ項目として抽出する、ことを特徴とする付記３記載の監視データ分析装置。

　（付記６）　前記回帰モデル再計算部は、前記説明変数に対する各前記特徴データ項目の値の割合を前記グループごとに算出し、当該算出した前記割合を用いて各前記グループの前記回帰モデルを合成することで、各前記特徴データ項目に関する前記回帰モデルである特徴データ項目別回帰モデルを算出し、当該算出した各前記特徴データ項目別回帰モデルを、前記検査対象ログデータに含まれる前記特徴データ項目の値の出現率に応じて合成することで、前記回帰モデルを再計算する、ことを特徴とする付記３～５のいずれかに記載の監視データ分析装置。

　（付記７）　前記回帰モデル再計算部により再計算された前記回帰モデルを用いて、当該回帰モデルの目的変数である性能値を算出する性能値算出部を、さらに備えることを特徴とする付記１～６のいずれかに記載の監視データ分析装置。

　（付記８）　前記検査対象ログデータに含まれる前記回帰モデルの説明変数に対応するデータ項目の値を前記回帰モデル再計算部により再計算された回帰モデルに代入して得られる値と、前記検査対象ログデータに含まれる前記回帰モデルの目的変数に対応するデータ項目の値との差に基づいて、前記監視対象システムにおける異常の有無を判定する異常判定部を、さらに備える、ことを特徴とする付記１～６のいずれかに記載の監視データ分析装置。

　（付記９）　性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算ステップを、含むことを特徴とする監視データ分析方法。

　（付記１０）　付記９に記載のステップをコンピュータに実行させるための監視データ分析プログラム。

　この出願は、２０１０年１２月２４日に出願された日本出願特願２０１０－２８８５２９を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明に係る監視データ分析装置、監視データ分析方法および監視データ分析プログラムは、監視対象システムの性能値が利用パターンごとに大きく相違する場合であっても、性能値の予測精度を向上させることに適している。

　１…監視データ分析装置、１１…データ分類部、１２…回帰モデル生成部、１３…特徴データ項目抽出部、１４…回帰モデル再計算部、１５…性能値算出部、１６…異常判定部、２１…ログデータファイル、２２…回帰モデルファイル。

Claims

　性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算部を、備えることを特徴とする監視データ分析装置。
　前記ログデータを蓄積するデータ蓄積部と、
　前記ログデータに含まれる前記監視対象システムの構成要素の利用状況を示す利用状況データの特性に基づいて、前記ログデータを前記グループに分類するデータ分類部と、
　前記グループごとに前記ログデータの回帰分析を実行して前記回帰モデルを生成する回帰モデル生成部と、
　さらに備えることを特徴とする請求項１記載の監視データ分析装置。
　前記ログデータに含まれるデータ項目の中から、前記回帰モデルの説明変数と関連がある前記データ項目を特徴データ項目として抽出する特徴データ項目抽出部を、
　さらに備えることを特徴とする請求項１記載の監視データ分析装置。
　前記特徴データ抽出部は、前記グループごとに、当該グループを形成するデータの各データ項目における前記説明変数への依存度を算出し、当該算出した前記依存度が所定閾値よりも高いデータ項目を、前記特徴データ項目として抽出する、
　ことを特徴とする請求項３記載の監視データ分析装置。
　前記特徴データ抽出部は、前記グループごとに、当該グループを形成するデータの各データ項目における前記説明変数との間の相関係数を算出し、当該算出した各前記相関係数の平均値が所定閾値よりも大きいデータ項目を、前記特徴データ項目として抽出する、
　ことを特徴とする請求項３記載の監視データ分析装置。
　前記回帰モデル再計算部は、前記説明変数に対する各前記特徴データ項目の値の割合を前記グループごとに算出し、当該算出した前記割合を用いて各前記グループの前記回帰モデルを合成することで、各前記特徴データ項目に関する前記回帰モデルである特徴データ項目別回帰モデルを算出し、当該算出した各前記特徴データ項目別回帰モデルを、前記検査対象ログデータに含まれる前記特徴データ項目の値の出現率に応じて合成することで、前記回帰モデルを再計算する、
　ことを特徴とする請求項３～５のいずれか１項に記載の監視データ分析装置。
　前記回帰モデル再計算部により再計算された前記回帰モデルを用いて、当該回帰モデルの目的変数である性能値を算出する性能値算出部を、
　さらに備えることを特徴とする請求項１～６のいずれか１項に記載の監視データ分析装置。
　前記検査対象ログデータに含まれる前記回帰モデルの説明変数に対応するデータ項目の値を前記回帰モデル再計算部により再計算された回帰モデルに代入して得られる値と、前記検査対象ログデータに含まれる前記回帰モデルの目的変数に対応するデータ項目の値との差に基づいて、前記監視対象システムにおける異常の有無を判定する異常判定部を、
　さらに備えることを特徴とする請求項１～６のいずれか１項に記載の監視データ分析装置。
　性能管理の対象となる監視対象システムにおける監視データを含むログデータが複数のグループに分類されて、当該グループごとに生成された回帰モデルを、それぞれの前記回帰モデルに対応する前記グループに属する前記ログデータ、および性能検査の対象となる前記ログデータである検査対象ログデータを用いて合成することで、前記回帰モデルを再計算する回帰モデル再計算ステップを、含むことを特徴とする監視データ分析方法。
　請求項９に記載のステップをコンピュータに実行させるための監視データ分析プログラム。