JP4983604B2 - 性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法 - Google Patents
性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法 Download PDFInfo
- Publication number
- JP4983604B2 JP4983604B2 JP2007542548A JP2007542548A JP4983604B2 JP 4983604 B2 JP4983604 B2 JP 4983604B2 JP 2007542548 A JP2007542548 A JP 2007542548A JP 2007542548 A JP2007542548 A JP 2007542548A JP 4983604 B2 JP4983604 B2 JP 4983604B2
- Authority
- JP
- Japan
- Prior art keywords
- sample
- abnormal
- samples
- acquired
- performance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005856 abnormality Effects 0.000 title claims description 111
- 238000004458 analytical method Methods 0.000 title claims description 95
- 238000000034 method Methods 0.000 title claims description 58
- 238000003066 decision tree Methods 0.000 claims description 95
- 230000002159 abnormal effect Effects 0.000 claims description 71
- 238000011156 evaluation Methods 0.000 claims description 47
- 238000010586 diagram Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 description 42
- 230000004044 response Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 241000288113 Gallirallus australis Species 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010563 solid-state fermentation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3409—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/81—Threshold
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
T.Horikawa, Application of Event Trace Framework for Performance Problem Solutions, IPSJ SIG Technical Report, 2003. D.G.Hart, J.L.Hellerstein, and P.C.Yue, Failure Diagnosis Using Detection Trees Automated Drill Down: An Approach to Automated Problem Isolation for Performance Management, Proc. of the Computer Measurement Group, 1999. M.Chen, A.X.Zheng, J.Lloyd, M.I.Jordan, and E.Brewer, Failure Diagnosis Using Detection Trees, Proc. of International Conference on Autonomic Computing, 2004.
を用いた評価関数を用いることを特徴とする。
本実施の形態において、性能異常の分析対象とするシステムは、一例としてWebを基本としたシステムであり、複数のUNIXサーバなどが連携してトランザクション処理を行うようなシステムを対象としている。例えば、e-commerceシステムや、エンタプライズにおける基幹業務システムなどが挙げられる。
分析対象となるシステムを監視し、それらの挙動を示すパラメータを獲得するための手法には様々なものが存在している。例えば、監視のためのコードをOSに埋め込んだり、特別な監視用機器をネットワークに挿入したりする方法がある。しかし、それらの方法は、実際に稼働中のシステムに導入するのに困難が伴う場合が多い。
(決定木)
決定木(L.Breiman, J.H.Friedman, R.A.Olsen, and C.J.Stone, Classification and Regression Trees, Wadsworth, 1984.)は、一般的には自動制御などの意思決定や事象の判断に用いられることが多い分類手法である。この決定木は、クラスタ分析など他の分類手法に比べて、分類や状況分析の理由を説明するのに適している。そこで、本実施の形態では、この手法を性能異常が発生した状況の分析に用いることにする。
分析に用いるデータの構造を構造体形式で記述したものを図2に示す。データは(1)日時、(2)リクエスト頻度、(3)リソース消費量、そして(4)正常/異常を区別するフラグの4つのカテゴリの情報によって構成されている。本実施の形態の手法においては、各パラメータを一定間隔のタイムスライスでサンプリングし、そのタイムスライス1個分のデータを1サンプルとして定義し、決定木による分析に用いる。
年、月、日、時、分
(2)リクエスト頻度:タイムスライス内で発生したHTTPリクエストの数を、以下の種類別にカウントしたもの
レスポンスコード(200, 304, 404, etc)
拡張子(.html, .gif, .jsp, .cgi, etc)
リクエストタイプ(GET or POST)
性能異常監視対象のリクエスト(URL)
(3)リソース消費量:以下の場合を一例とする。
CPU使用率 (Usr, Sys, I/O wait, total, キュー長, etc)
Disk (読込/書込回数, R/W 待ち時間等)
Memory (空きメモリ, ページフォルト数等)
Process(アクティブプロセス数)
(4)フラグ属性: 各タイムスライスについて、そのタイムスライス内の着目リクエストのレスポンスタイムが所定の性能異常判定条件を満たした場合に、そのタイムスライスを性能異常サンプルと判定し、条件を満たさない場合は、正常サンプルと判定する。
(1)着目リクエストの閾値越えが1回でも発生した。
(2)着目リクエストの閾値越えが所定の回数以上(例えば5回以上) 発生した。
(3)着目リクエストの閾値越えが所定の割合以上(例えば、そのタイムスライス内での着目リクエストの発生回数の50%以上) 発生した。
(4)着目リクエストのレスポンスタイムが長いものから上位20%のレスポンスタイムが閾値を超えた。
上記で定義したサンプルを、決定木によって状況分析を行う方法の例を図3に示す。図3には、1つの親ノードPと、2つの子ノードC1,C2からなる木が示されている。
決定木アルゴリズムは多数のパラメータの中から、分岐に適切と思われるパラメータを1つずつ抽出して、状況の分岐を行うことで決定木を構築していくが、本発明の目的であるシステムの性能異常分析の場合のように、利用可能なパラメータの数が非常に大きかったり、独立でないパラメータが多数存在する場合には、最適なパラメータ選択を行うことができずに、状況を適切に表す決定木を獲得できないような状況も発生する。
パラメータとして使用可能なパラメータがn個あり、それらの集合が[α1,α2,…,αn]であるとき、V=[α1,α2,…,αn]とおく。また、評価関数の最大値を表すパラメータMAXを0とおく(ステップS1)。
パラメータの集合Vを使って決定木T0を構築する(ステップS2)。このとき、集合V中の全てのパラメータが決定木の生成に使用されるとは限らない。集合Vのうち、T0の構築に実際に使用されたパラメータの集合をV0とする。そして、以下のように、V0にパラメータαiを加える、もしくはV0からパラメータαiを削除した集合をViとする。
ここでは、Phase2で構築したn+1個の決定木T0,T1,…,Tnの中から、もっとも適切な決定木の選択を行う(ステップS3)。決定木の適切さを評価する関数としては、一般的には「False positive rate」や「False negative rate」、そしてそれらの複合的な関数である「F-Measure」の値などが用いられている。しかし、前述したように、異常サンプルに比べて正常サンプルの数が非常に大きいような場合には、あらゆる葉で異常サンプルよりも正常サンプルの方が多く、全ての結果において「False negative」になるような場合も存在するため、これらの評価関数は本実施の形態が適用される分析対象には適さない。
N: 正常サンプル全体の数
A: 異常サンプル全体の数
T: 閾値
Lj: 決定木Tの葉ノード
Aj: 葉Ljに属する異常サンプルの数
Nj: 葉Ljに属する正常サンプルの数
ここでは、TEFの値が極大値になったかどうかを調査する(ステップS4)。Phase3で得られたTEF(TM)を、以前のループにおけるTEFの最大値MAXと比較し、TEF(TM)>MAXの場合は、MAX=TEF(TM)と代入し(ステップS5)、再度Phase2よりループを繰り返す。TEF(TM)=MAXの場合は、TEF(TM)の値が極大値に達したと判断し、ループを終了し、TMを最終的に得られた決定木として採択する(ステップS6)。
決定木により、性能異常が発生しやすい状況を特定することは可能になるが、決定木のサイズが大きくなり、ノードの数が増加すると、決定木を見ただけでは、その決定木の分析結果を解釈することが非常に困難になる。実際、決定木を目にしたこともないシステム管理者も多数存在すると考えられる。本実施の形態では、管理者がより直感的に状況を把握できるように、決定木をそのまま出力するのではなく、その決定木の分析結果を表形式とベン図形式という、より分かりやすい形式で出力する。
決定木の分析結果を表形式に変換するために、異常サンプルを含むような状況を表す決定木の葉に対して、根からそれらの葉までのそれぞれのパスに現れる条件式を抽出する。そして、その条件式を、日時、リクエスト頻度、リソース消費量の3つのカテゴリにまとめて表形式で表示する。例として、図6に決定木を、図7にその決定木を表形式で現したものを示す。
ベン図には、異常状態と関係の大きい3つの条件式と、その AND/ORで構成されるエリアに、それぞれのエリアに該当する全サンプル数と異常サンプルの数及びそれらの比を表示する。
(条件)
本実施の形態を実際に多数のユーザによって利用されている環境に適用し、その分析および評価を行った。
比較のため、本実施の形態で説明したアルゴリズムにおいて、評価関数SSFの代わりに、Information Gainを用いて分析を行う。
決定木生成の評価関数にはSSFを用いるが、全パラメータを使用した場合の決定木のみを採用し、パラメータ探索のためのループを行わない。
本発明の実施の形態のアプローチそのものを使用する。評価関数SSFを利用し、パラメータの探索を行う。
また、それぞれの条件下における分析結果の評価を行うために、以下の3つの指標を設定した。
作成された決定木を、評価関数TEF(式5)によって評価する。この値が大きいほど、正常サンプルと異常サンプルが適切に分離できていると評価できる。
決定木において、異常サンプル全体の10%以上の異常サンプルを含む決定木の葉に対し、根から葉に至る経路に現れるパラメータの個数をカウントし、決定木全体で平均する。この値が小さければ小さいほど、少ないパラメータで状況が分析できており、好ましいと評価できる。
決定木の生成にかかった時間およびパラメータ選択におけるループ回数をカウントし、その値を評価する。計算時間が小さい方が好ましい。
(確度)
図12に、それぞれの実験条件下における評価関数TEFの値を示す。図より、決定木の生成にゲインを用いた場合や、パラメータ探索を行わなかった場合に比べて、本実施の形態におけるアルゴリズムは高いTEFの値を示している。このことから、本実施の形態における評価関数およびパラメータ選択手法は、分析の精度向上に大きく寄与している。
図13に、各条件下で生成された決定木において、個々の異常状態の説明に必要なパラメータの平均個数を示す。図13より、評価関数としてゲインを用いた場合よりも、SSFを利用した場合の方が説明に必要なパラメータの個数が少なかった。よって、評価関数SSFの利用は、状況の記述の簡潔化に寄与していると言える。
図14に実験パターン1(ゲイン)とパターン3(本実施の形態)における、計算時間とパラメータ探索のためのループ回数の関係を示す。図より、ゲインを用いた場合よりも、SSFを用いた場合の方が、結果が収束するまでにかかるループの回数は多いが、決定木の生成にかかる時間は非常に小さいことがわかる。また、ループ1回あたりの平均計算時間は、ゲインの場合が334.11秒なのに対し、SSFの方は21.308秒と、約1/15になっている。これは、ゲインの算出に必要な対数の計算に時間がかかることや、生成される決定木のサイズが大きくなるために、1つの決定木を生成するのにかかる時間が大きくなることなどが原因であると考えられる。このことから、評価関数SSFの採用は、精度や説明の簡潔さのみならず、計算時間の短縮にも寄与していると言える。
上記の実験のうち、評価関数TEFの値が一番大きかった場合(Pattern 3(本実施の形態)閾値5秒)のときのベン図形式での出力結果を図15に例として示す。この図においては、DB(データベース)サーバのI/O read回数が143203回/10分という条件と、DBサーバの総Disk busy時間が445秒以上605秒以下/10分という条件(Diskが複数あるので、総計が600秒/10分以上になる場合もある)と、4台目のアプリサーバのプロセス間通信メッセージ関連システムコールの発行回数が840回/10分という3つの条件によりベン図が構成されている。
(1)多種多様なパラメータを出力する大規模システムにおいて、どのようなパラメータがどれくらいの値になると性能異常が発生しやすくなるかを瞬時に把握でき、システムの性能改善にかかる時間やコストを大幅に削減することが可能になる。
(2)また、決定木の手法を利用して、観測時の状況を、性能異常の発生割合が高い状況と、性能異常の発生割合が低い状況に分離し、性能異常の発生割合が高い場合の条件を判断することで、また、決定木中のある状況を表す親ノードを、2つの子ノードに分岐する際に、親ノードに属する正常値の大部分が一方の子ノードに所属し、親ノードに属する異常値の大部分が他方の子ノードに属するように分岐を行うような評価関数を用いて決定木を生成し、性能異常の発生割合が高い場合の条件を判断することで、異常が発生しやすい状況と正常な状況を、より少ない条件式で分離することが可能になるため、より少ない条件で異常が発生しやすい状況を説明することが可能になる。
(3)決定木を生成する際に、使用するパラメータの集合を探索的に変化させながら、複数の決定木を生成し、その中から最適な一つの決定木を選択することで、性能異常の発生割合が高い場合の条件を判断することで、より妥当な分析結果を得ることが可能になる。
(4)性能異常の発生割合が高くなる場合の条件を、パラメータとその閾値の集合で表し、性能異常の発生頻度や発生割合と、それらの性能異常が発生したときの条件を、表形式およびベン図形式で出力することで、決定木そのものを出力するよりも、性能異常が発生しやすい条件をより直感的に把握することが可能になる。
(5)ベン図の各領域の描画方法(色や模様など)を、各領域が表す状況下における性能異常発生頻度や発生回数に対応させて変化させることで、異なる条件下における性能異常発生頻度や割合の差異をより直感的に把握することが可能になる。
(6)分析の出力結果におけるパラメータや閾値を任意に変更する手段と、その変更による結果を図表に反映する手段を備えることにより、分析の結果として得られた条件を任意に変更し、その変更した条件下における性能異常発生割合や発生頻度を容易に確認することが可能になる。
Claims (8)
- 複数のコンピュータを含むシステムの性能異常の分析をコンピュータに実行させる性能異常分析プログラムであって、
システムの資源利用状況を取得する資源利用状況取得ステップと、
システムに送信されるリクエストの発生頻度を取得するリクエスト発生頻度取得ステップと、
システムに送信されるリクエストをシステムが処理するのに要した処理時間を取得する処理時間取得ステップと、
前記処理時間取得ステップにより取得された処理時間が予め設定された閾値を越えているか否か判定する閾値超過判定ステップと、
一定時間間隔で、前記資源利用状況取得ステップにより取得された資源利用状況と前記リクエスト発生頻度取得ステップにより取得されたリクエストの発生頻度と、前記閾値超過判定ステップにより判定された判定結果とを取得し、前記判定結果に基づいて正常サンプルであるか異常サンプルであるか判断し、前記取得した資源利用状況と、前記取得した発生頻度と、前記正常サンプルであるか異常サンプルであるかの判断結果とを含む1つのサンプルを定義するサンプル定義ステップと、
前記サンプル定義ステップにより定義されたサンプルを複数個用いて、性能異常の発生する条件を特定する条件分析ステップであって、決定木の手法における親ノードの正常サンプル数、異常サンプル数、一方の子ノードの正常サンプル数、および、他方の子ノードの異常サンプル数から求められる評価関数を用いて、親ノードを2つの子ノードに分岐する際に、前記資源利用状況及び前記リクエストの発生頻度の各々の閾値を前記分岐する条件として選択することにより、親ノードに属する正常サンプルの大部分が一方の子ノードに所属し、親ノードに属する異常サンプルの大部分が他方の子ノードに属するように分岐を行う決定木を生成し、該決定木のうち前記異常サンプルの大部分が属する葉ノードから根ノードまでのパスに存在する前記分岐する条件のリストを前記性能異常の発生する条件として特定する前記条件分析ステップと
を備えてコンピュータに実行させる性能異常分析プログラム。 - 請求項1に記載の性能異常分析プログラムにおいて、
前記親ノードの正常サンプル数をN0、前記親ノードの異常サンプル数をA0、前記一方の子ノードの正常サンプル数をA1、前記他方の子ノードの異常サンプル数をN2とした場合、前記条件分析ステップは、前記評価関数として、A1/A0とN2/N0との積を用いることを特徴とする性能異常分析プログラム。 - 請求項1または2に記載の性能異常分析プログラムにおいて、
前記条件分析ステップは、決定木を生成する際に、資源利用状況取得ステップにより取得された資源利用状況やリクエスト発生頻度取得ステップにより取得された発生頻度から採取される情報の種類を示すパラメータの集合を探索的に変化させながら、複数の決定木を生成し、その中から所定の一つの決定木を選択することで、性能異常の発生割合が高い場合の条件を判断する性能異常分析プログラム。 - 請求項3に記載の性能異常分析プログラムにおいて、
前記条件分析ステップにより複数の条件が特定された場合、この条件の内、評価関数の高いものから所定数の条件を、性能異常の発生割合が高くなる場合の条件として特定し、特定された所定数の条件から前記評価関数を大きくする条件式をパラメータとその閾値の集合で表し、表形式又は、各条件式とベン図のエリアを合致させたベン図形式で出力する分析結果出力ステップを備えることを特徴とする性能異常分析プログラム。 - 複数のコンピュータを含むシステムの性能異常の分析を行う性能異常分析方法であって、
システムの資源利用状況を取得する資源利用状況取得ステップと、
システムに送信されるリクエストの発生頻度を取得するリクエスト発生頻度取得ステップと、
システムに送信されるリクエストをシステムが処理するのに要した処理時間を取得する処理時間取得ステップと、
前記処理時間取得ステップにより取得された処理時間が予め設定された閾値を越えているか否か判定する閾値超過判定ステップと、
一定時間間隔で、前記資源利用状況取得ステップにより取得された資源利用状況と前記リクエスト発生頻度取得ステップにより取得されたリクエストの発生頻度と、前記閾値超過判定ステップにより判定された判定結果とを取得し、前記判定結果に基づいて正常サンプルであるか異常サンプルであるか判断し、前記取得した資源利用状況と、前記取得した発生頻度と、前記正常サンプルであるか異常サンプルであるかの判断結果とを含む1つのサンプルを定義するサンプル定義ステップと、
前記サンプル定義ステップにより定義されたサンプルを複数個用いて、性能異常の発生する条件を特定する条件分析ステップであって、決定木の手法における親ノードの正常サンプル数、異常サンプル数、一方の子ノードの正常サンプル数、および、他方の子ノードの異常サンプル数から求められる評価関数を用いて、親ノードを2つの子ノードに分岐する際に、前記資源利用状況及び前記リクエストの発生頻度の各々の閾値を前記分岐する条件として選択することにより、親ノードに属する正常サンプルの大部分が一方の子ノードに所属し、親ノードに属する異常サンプルの大部分が他方の子ノードに属するように分岐を行う決定木を生成し、該決定木のうち前記異常サンプルの大部分が属する葉ノードから根ノードまでのパスに存在する前記分岐する条件のリストを前記性能異常の発生する条件として特定する前記条件分析ステップと
を備える性能異常分析方法。 - 複数のコンピュータを含むシステムの性能異常を分析する性能異常分析装置であって、
システムの資源利用状況を取得する資源利用状況取得部と、
システムに送信されるリクエストの発生頻度を取得するリクエスト発生頻度取得部と、
システムに送信されるリクエストをシステムが処理するのに要した処理時間を取得する処理時間取得部と、
前記処理時間取得部により取得された処理時間が予め設定された閾値を越えているか否か判定する閾値超過判定部と、
一定時間間隔で、前記資源利用状況取得部により取得された資源利用状況と前記リクエスト発生頻度取得部により取得されたリクエストの発生頻度と、前記閾値超過判定部により判定された判定結果とを取得し、前記判定結果に基づいて正常サンプルであるか異常サンプルであるか判断し、前記取得した資源利用状況と、前記取得した発生頻度と、前記正常サンプルであるか異常サンプルであるかの判断結果とを含む1つのサンプルを定義するサンプル定義部と、
前記サンプル定義部により定義されたサンプルを複数個用いて、性能異常の発生する条件を特定する条件分析部であって、決定木の手法における親ノードの正常サンプル数、異常サンプル数、一方の子ノードの正常サンプル数、および、他方の子ノードの異常サンプル数から求められる評価関数を用いて、親ノードを2つの子ノードに分岐する際に、前記資源利用状況及び前記リクエストの発生頻度の各々の閾値を前記分岐する条件として選択することにより、親ノードに属する正常サンプルの大部分が一方の子ノードに所属し、親ノードに属する異常サンプルの大部分が他方の子ノードに属するように分岐を行う決定木を生成し、該決定木のうち前記異常サンプルの大部分が属する葉ノードから根ノードまでのパスに存在する前記分岐する条件のリストを前記性能異常の発生する条件として特定する前記条件分析部と
を備える性能異常分析装置。 - 請求項6に記載の性能異常分析装置において、
前記親ノードの正常サンプル数をN0、前記親ノードの異常サンプル数をA0、前記一方の子ノードの正常サンプル数をA1、前記他方の子ノードの異常サンプル数をN2とした場合、前記条件分析部は、前記評価関数として、A1/A0とN2/N0の積を用いることを特徴とする性能異常分析装置。 - システムの資源利用状況を取得する資源利用状況取得ステップと、
システムに送信されるリクエストの発生頻度を取得するリクエスト発生頻度取得ステップと、
システムに送信されるリクエストをシステムが処理するのに要した処理時間を取得する処理時間取得ステップと、
前記処理時間取得ステップにより取得された処理時間が予め設定された閾値を越えているか否か判定する閾値超過判定ステップと、
一定時間間隔で、前記資源利用状況取得ステップにより取得された資源利用状況と前記リクエスト発生頻度取得ステップにより取得されたリクエストの発生頻度と、前記閾値超過判定ステップにより判定された判定結果とを取得し、前記判定結果に基づいて正常サンプルであるか異常サンプルであるか判断し、前記取得した資源利用状況と、前記取得した発生頻度と、前記正常サンプルであるか異常サンプルであるかの判断結果とを含む1つのサンプルを定義するサンプル定義ステップと、
前記サンプル定義ステップにより定義されたサンプルを複数個用いて、性能異常の発生する条件を特定する条件分析ステップであって、決定木の手法における親ノードの正常サンプル数、異常サンプル数、一方の子ノードの正常サンプル数、および、他方の子ノードの異常サンプル数から求められる評価関数を用いて、親ノードを2つの子ノードに分岐する際に、前記資源利用状況及び前記リクエストの発生頻度の各々の閾値を前記分岐する条件として選択することにより、親ノードに属する正常サンプルの大部分が一方の子ノードに所属し、親ノードに属する異常サンプルの大部分が他方の子ノードに属するように分岐を行う決定木を生成し、該決定木のうち前記異常サンプルの大部分が属する葉ノードから根ノードまでのパスに存在する前記分岐する条件のリストを前記性能異常の発生する条件として特定する前記条件分析ステップと
を備え、
前記条件分析ステップにより複数の条件が特定された場合、この条件の内、評価関数の高いものから所定数の条件を、性能異常の発生割合が高くなる場合の条件として特定し、特定された所定数の条件から前記評価関数を大きくする条件式をパラメータとその閾値の集合で表し、各条件式とベン図エリアを合致させたベン図形式で表示するようにした性能異常分析装置の分析結果表示方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2005/019974 WO2007052327A1 (ja) | 2005-10-31 | 2005-10-31 | 性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007052327A1 JPWO2007052327A1 (ja) | 2009-04-30 |
JP4983604B2 true JP4983604B2 (ja) | 2012-07-25 |
Family
ID=38005491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007542548A Expired - Fee Related JP4983604B2 (ja) | 2005-10-31 | 2005-10-31 | 性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7970584B2 (ja) |
EP (1) | EP1944699B1 (ja) |
JP (1) | JP4983604B2 (ja) |
WO (1) | WO2007052327A1 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008210212A (ja) * | 2007-02-27 | 2008-09-11 | Nec Corp | 項目選択装置及び項目選択方法並びにプログラム |
JP5277667B2 (ja) | 2008-03-07 | 2013-08-28 | 日本電気株式会社 | 障害分析システム、障害分析方法、障害分析サーバおよび障害分析プログラム |
JP5217886B2 (ja) * | 2008-10-14 | 2013-06-19 | 富士通株式会社 | ループバック装置及びミラーリング方法 |
GB2473194A (en) * | 2009-09-02 | 2011-03-09 | 1E Ltd | Monitoring the performance of a computer based on the value of a net useful activity metric |
US8934352B2 (en) | 2011-08-30 | 2015-01-13 | At&T Intellectual Property I, L.P. | Hierarchical anomaly localization and prioritization |
WO2015081307A1 (en) * | 2013-11-26 | 2015-06-04 | Anunta Technology Management Services Ltd. | Management of cloud-based application delivery |
JP6308077B2 (ja) * | 2014-09-08 | 2018-04-11 | 京セラドキュメントソリューションズ株式会社 | アプリケーション作成プログラム及び情報処理装置 |
CN110378591A (zh) * | 2019-07-11 | 2019-10-25 | 仲恺农业工程学院 | 一种基于决策树的作物育种信息测定系统及方法 |
CN112784113A (zh) * | 2019-11-07 | 2021-05-11 | 北京京东尚科信息技术有限公司 | 数据处理方法及装置、计算机可读存储介质、电子设备 |
CN110837432A (zh) * | 2019-11-14 | 2020-02-25 | 北京金山云网络技术有限公司 | 服务集群中异常节点的确定方法、装置和监控服务器 |
CN113360348B (zh) * | 2021-06-30 | 2022-09-09 | 北京字节跳动网络技术有限公司 | 异常请求处理方法、装置、电子设备和存储介质 |
US20230071606A1 (en) * | 2021-08-18 | 2023-03-09 | Rakuten Symphony Singapore Pte. Ltd. | Ai model used in an ai inference engine configured to avoid unplanned downtime of servers due to hardware failures |
US11966757B2 (en) * | 2022-08-30 | 2024-04-23 | SOURCE Ltd. | System and method for selecting an execution strategy depending on validations |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02267631A (ja) * | 1989-04-07 | 1990-11-01 | Fujitsu Ltd | 決定木生成処理方式 |
JPH08278901A (ja) * | 1995-04-04 | 1996-10-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 決定木形式の診断知識を用いた診断装置 |
JPH09330224A (ja) * | 1996-06-10 | 1997-12-22 | Fujitsu Ltd | 決定木生成装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6351561B1 (en) * | 1999-03-26 | 2002-02-26 | International Business Machines Corporation | Generating decision-tree classifiers with oblique hyperplanes |
JP2002342182A (ja) * | 2001-05-21 | 2002-11-29 | Hitachi Ltd | ネットワークシステムにおける運用管理の支援システム |
JP3805711B2 (ja) * | 2002-04-05 | 2006-08-09 | 日本電信電話株式会社 | サイト領域内ボトルネック特定方法 |
JP4298531B2 (ja) * | 2003-01-31 | 2009-07-22 | シャープ株式会社 | 入力属性条件決定装置、入力属性条件決定方法、入力属性条件決定プログラム、データ分析装置、データ分析方法、および、データ分析プログラム |
US20040199484A1 (en) | 2003-04-04 | 2004-10-07 | Laurence Smith | Decision tree analysis |
JP2005135130A (ja) * | 2003-10-30 | 2005-05-26 | Fujitsu Ltd | 負荷監視条件決定プログラム,負荷監視条件決定システム,負荷監視条件決定方法および負荷監視プログラム |
WO2007047375A1 (en) * | 2005-10-14 | 2007-04-26 | Fisher-Rosemount Systems, Inc. | Statistical signatures used with multivariate statistical analysis for fault detection and isolation and abnormal condition prevention in a process |
-
2005
- 2005-10-31 JP JP2007542548A patent/JP4983604B2/ja not_active Expired - Fee Related
- 2005-10-31 EP EP05800458.1A patent/EP1944699B1/en not_active Ceased
- 2005-10-31 WO PCT/JP2005/019974 patent/WO2007052327A1/ja active Application Filing
-
2008
- 2008-04-28 US US12/110,616 patent/US7970584B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02267631A (ja) * | 1989-04-07 | 1990-11-01 | Fujitsu Ltd | 決定木生成処理方式 |
JPH08278901A (ja) * | 1995-04-04 | 1996-10-22 | Kokusai Denshin Denwa Co Ltd <Kdd> | 決定木形式の診断知識を用いた診断装置 |
JPH09330224A (ja) * | 1996-06-10 | 1997-12-22 | Fujitsu Ltd | 決定木生成装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2007052327A1 (ja) | 2007-05-10 |
US20090048807A1 (en) | 2009-02-19 |
JPWO2007052327A1 (ja) | 2009-04-30 |
US7970584B2 (en) | 2011-06-28 |
EP1944699B1 (en) | 2015-07-08 |
EP1944699A4 (en) | 2009-04-08 |
EP1944699A1 (en) | 2008-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4983604B2 (ja) | 性能異常分析装置、方法及びプログラム、並びに性能異常分析装置の分析結果表示方法 | |
US20200250024A1 (en) | High-volume distributed script error handling | |
US9996409B2 (en) | Identification of distinguishable anomalies extracted from real time data streams | |
KR101828506B1 (ko) | Jvm 및 크로스-jvm 호출 스택들의 시각화 | |
US10922164B2 (en) | Fault analysis and prediction using empirical architecture analytics | |
US9122602B1 (en) | Root cause detection service | |
US20050125213A1 (en) | Apparatus, system, and method for modeling and analyzing a plurality of computing workloads | |
KR101797185B1 (ko) | 분산 환경에서 효율적으로 트랜젝션-분리 메트릭들을 수집하는 방법 | |
Wu et al. | Zeno: Diagnosing performance problems with temporal provenance | |
US10365995B2 (en) | Composing future application tests including test action data | |
US20180143897A1 (en) | Determining idle testing periods | |
US9201752B2 (en) | System and method for correlating empirical data with user experience | |
CN108920322A (zh) | 一种中间件运行监测的方法、装置及计算机存储介质 | |
US10706108B2 (en) | Field name recommendation | |
Ding et al. | TraceDiag: Adaptive, Interpretable, and Efficient Root Cause Analysis on Large-Scale Microservice Systems | |
Munteanu et al. | Cloud incident management, challenges, research directions, and architectural approach | |
CN110968479A (zh) | 一种针对应用程序的业务级全链路监控方法及服务器 | |
US10644971B2 (en) | Graph search in structured query language style query | |
CN115766768A (zh) | 一种算力网络操作系统中感知中枢设计方法及装置 | |
Semeraro et al. | It takes a village: Monitoring the blue waters supercomputer | |
CN115408236A (zh) | 一种日志数据审计系统、方法、设备及介质 | |
US11379444B1 (en) | Data-analysis-based facility for adjusting trace fields of a database trace | |
Kleehaus et al. | Multi-layer monitoring and visualization | |
Kikuchi et al. | Performance problem analysis method for Web systems using multiple decision trees | |
Teggi et al. | AIOPS Prediction for server stability based on ARIMA model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120327 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120409 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |