JP2009070017A - 性能監視システム - Google Patents

性能監視システム Download PDF

Info

Publication number
JP2009070017A
JP2009070017A JP2007236103A JP2007236103A JP2009070017A JP 2009070017 A JP2009070017 A JP 2009070017A JP 2007236103 A JP2007236103 A JP 2007236103A JP 2007236103 A JP2007236103 A JP 2007236103A JP 2009070017 A JP2009070017 A JP 2009070017A
Authority
JP
Japan
Prior art keywords
performance
period
value
time
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007236103A
Other languages
English (en)
Inventor
Goro Kazama
悟朗 風間
Takashi Nakagawa
高志 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007236103A priority Critical patent/JP2009070017A/ja
Publication of JP2009070017A publication Critical patent/JP2009070017A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】運用状況に合った閾値を自動設定する性能監視システムにおいて、定常ではない
監視項目に対して、時間帯によって異なる閾値を設定する場合、時間帯の分割を手動で行
う必要があった。
【解決手段】予め与えられた複数の期間と周期の組合せに基づいて、直近の過去における
周期性の有無を判定して、周期性があると判定された全ての期間と周期の組合せについて
、次の周期の期間に対する予測性能値の遷移を算出して保存する。収集した性能値に対し
て、保存された予測性能値が1つ以上ある場合は、それら予測性能値との比較によって、
監視対象に性能的問題が発生しているか否かを判定する。なお、周期性の有無の判定にお
いては、稼働性能の遷移として考えられる、遷移全体の単調増加減少や、遷移全体の振幅
に対する単調増加減少の傾向がある場合も、周期性があると見なす。
【選択図】図2

Description

本発明は、情報処理装置などの監視対象装置に性能的問題が発生しているか否かを判定
する性能監視技術に関し、特に、監視対象装置から収集した性能値と閾値を比較すること
により監視対象装置に性能的問題が発生しているか否かを判定する性能監視技術に関する
情報処理装置などの監視対象装置に性能的な問題が発生しているか否かを判定する従来
の一般的な性能監視装置は、予め定められている複数の監視項目(CPU使用率、メモリ使
用率、ディスクI/Oなど)の性能値を監視対象装置から収集し、この収集した各性能値と
、各監視項目の能力の限界を示す閾値とを比較することにより、性能的問題が発生してい
るか否かを判定するようにしている。
また、監視項目の能力の限界を示す閾値ではなく、監視対象装置の実際の運用状況に合
った、より狭い範囲の閾値を設定することで、監視対象装置に性能的な問題が発生してい
ることを早期に検出できる。この監視対象の実際の運用状況に合った閾値は、監視対象装
置の運用が開始されてから予め定められているサンプリング期間に収集した性能値の平均
値や標準偏差などの統計値から自動的に算出することで、管理者が経験に基づいて手動で
設定する場合に比べて、設定に掛かる負担や、設定値の妥当性の問題を軽減している。
しかし、この従来の一般的な性能監視装置では、自動的に設定する閾値は、監視項目ご
とに一意であり、性能値が期間や時間帯によって大きく異なる場合は、それぞれの期間や
時間帯にとって適切な閾値が設定されないという問題があった。
そこで、このような問題点を解決するため、従来、次のような性能監視装置が提案され
た(例えば、特許文献1)。
特許文献1に記載されている従来の性能監視装置では、監視対象装置の運用状態が時間
帯によって異なる場合であっても、適切な閾値を設定できるようにするため、次のように
している。サンプリング期間に収集した性能値を、監視対象装置の稼働時間帯を複数の部
分時間帯に分割した際の、各部分時間帯毎の性能値に分割すると共に、各部分時間帯毎に
、その部分時間帯に含まれる性能値から、その部分時間帯に対する閾値を設定する。閾値
の判定時は、収集した性能値と、該性能値の収集時刻に対応する部分時間帯の閾値とに基
づいて、監視対象装置に性能的問題が発生しているか否かを判定する。
特開2005−316808号公報
上述した特許文献1に記載されている従来の性能監視装置によれば、監視対象装置の運
用状態が時間帯によって異なる場合であっても、個々の時間帯にあった閾値が自動的に設
定される。しかし、稼働時間帯をどのように複数の部分時間帯に分割するかは、予め運用
状態のサイクルを把握した管理者が設定しなければならないため、管理者に設定の負担が
かかると共に、適切な部分時間帯を設定する手段については、記載されていない。
そこで、本発明の目的は、運用状態のサイクルを自動的に見つけ出し、そのサイクルに
おける個々の時間帯にあった閾値を自動設定することで、管理者が設定する負担を軽減で
きるようにすることにある。
本発明にかかる第1の性能監視システムは、収集した性能値の時系列データから、運用
状態のサイクルを自動的に見つけ出し、そのサイクルにおける個々の時間帯にあった閾値
を自動設定するため、予め与えられた複数の期間と周期の組合せについて、性能値の遷移
に対する周期性の有無を判定する手段と、周期性があると判定された期間と周期の組合せ
について、次の周期の期間に対する予測性能値の遷移を算出して、保存する手段とを備え
たことを特徴とする。
本発明にかかる第2の性能監視システムは、第1の性能監視システムの、性能値の遷移
に対する周期性の有無を判定する処理において、各周期の遷移が一致する場合だけではな
く、遷移全体の単調増加減少や、遷移全体の振幅に対する単調増加減少の傾向がある場合
も、周期性があると見なすため、相似の観点から遷移の形状を比較する手段を有し、予測
性能値の遷移を算出する際も、前期傾向を加味した予測性能値を算出することを特徴とす
る。
本発明にかかる第3の性能監視システムは、第2の性能監視システムにおいて、性能値
を収集した時刻に対して、前記保存した予測性能値が1つ以上存在する場合に、前期性能
値が全ての予測性能値から著しく外れている場合に、前記監視対象装置に性能的問題が発
生していると判定することを特徴とする。
本発明にかかる第4の性能監視システムは、第3の性能監視システムにおいて、前期監
視対象装置に性能的問題が発生しているかの判定の精度を上げるため、性能値から著しく
外れている予測性能値の遷移については、次回以降の比較対象から除外することを特徴と
する。
本発明にかかる第5の性能監視システムは、第2の性能監視システムにおいて、ユーザ
ーが定義した任意の期間と任意の周期の組合せについても、周期性の有無を判定すること
を特徴とし、特に一定ではない間隔の周期を指定された場合でも、前期遷移全体の単調増
加減少や、遷移全体の振幅に対する単調増加減少の傾向を加味することを特徴とする。
本発明にかかる第1、第3の性能監視システムによれば、監視対象装置の運用状態が時
間帯によって異なる場合で、予め運用状態のサイクルが分からない場合でも、監視対象装
置の運用状態に合った閾値を設定することが可能となる。その理由は、複数の期間と周期
の組合せから、直近の過去に周期性があると認められた組合せを元に、閾値を設定するか
らである。
本発明にかかる第2、第3の性能監視システムによれば、運用状態のサイクルとは別の
要因によって、性能値全体に単調な増加、減少、発散、収束の傾向がある場合も、性能値
に周期性があると判定した上で、前期傾向を加味した閾値を設定することが可能となる。
その理由は、周期性の有無の判定において、相似の観点から遷移の形状を比較するからで
ある。
なお、本閾値の判定だけを適用すると、性能値に周期性がない場合や、周期性がありな
おかつ全体が徐々に増加減少、発散収束する傾向がある性能値に対して、性能的問題が発
生していると判定することはできない。そのため、従来技術である、各監視項目の能力の
限界を示す閾値との比較を、並行して実行することが望ましい。
本発明にかかる第4の性能監視システムによれば、複数の周期に対する周期性があると
判定された結果、互いに矛盾する予測性能値の遷移が生成された場合でも、性能値の実態
に合った方の予測性能値の遷移を採用して閾値を設定することが可能となる。その理由は
、性能値と予測性能値の比較の結果、性能値から著しく外れた予測性能値の遷移について
は、次回以降の比較対象から除外するからである。
本発明にかかる第5の性能監視システムによれば、予め運用サイクルが判明して、ユー
ザーが定義できる場合、任意の期間と任意の(一定ではない)周期による複雑な組合せにつ
いても、監視対象装置の運用状態に合った閾値を設定することが可能となる。その理由は
、周期性の判定と、予測性能値の算出において、各周期の間の時間差を考慮するからであ
る。
次に本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明にかかる性能監視システムの実施の形態の構成例を示すシステム構成図で
ある。本実施例に係わる性能監視サーバー100は、ネットワーク103を介して、複数
の監視対象装置102から、CPU使用率や、メモリ使用率や、ディスクI/Oなどの監視項目
に対する性能値を収集して保持する。監視端末101は、ネットワーク103を介して、
性能監視サーバー100と接続することにより、性能監視サーバー100に収集された性
能値の情報を参照することができる。また、性能監視サーバー100が、収集した性能値
に対して何らかの異常を検知した場合に、監視端末に異常を通知することができる。
図2に性能監視サーバー100の構成を示す。性能監視サーバー100は、メモリと、
CPUと、ディスクインタフェースを経由して接続された記憶装置207と、ネットワー
ク103に接続する通信インタフェースから構成される。
メモリ上で動作する性能監視プログラムは、性能値収集部200と、性能値要約部20
1と、周期モデル生成部202と、閾値判定部203と、監視設定編集部206を備えて
おり、閾値判定部203は、周期閾値判定部204と、限界閾値判定部205とを含んで
いる。
記憶装置207は、監視設定記憶部208と、性能値記憶部209と、周期モデル記憶
部210と、限界閾値記憶部211とを備えている。
図3に性能値の収集・分析する制御と、閾値判定をする制御における機能ブロック図を
示す。
性能値収集部200は、監視設定記憶部208に設定された収集間隔に従って、監視対
象装置102から各監視項目の性能値を定期的に収集して、時系列データとして性能値記
憶部209に記録する。またデータ間隔(=収集間隔)とデータ時刻(=収集時刻)を引
数にして、性能値要約部201と限界閾値判定部205の処理を呼び出す。
性能値要約部201は、後述の周期モデル生成部202で使用される、複数のデータ間
隔の時系列データを生成する。呼び出し元のデータ間隔とデータ時刻が、監視設定記憶部
208に設定された要約条件に適合した場合、同監視設定記憶部208に設定された要約
方法に従って、性能値記憶部209に記録された、呼び出し元のデータ間隔の時系列デー
タを読み込んで、一定区間ごとに要約する。要約した性能値を、より粗いデータ間隔の時
系列データとして性能値記憶部209に記録する。またデータ間隔(=要約先の間隔)と
データ時刻(=要約先の代表時刻)を引数にして、自身を再帰呼び出しする他、周期モデ
ル生成部202と周期閾値判定部204の処理を呼び出す。
周期モデル生成部202は、呼び出し元のデータ間隔とデータ時刻が、監視設定記憶部
208に設定された周期分析の対象に適合した場合、対象の設定に従って、周期モデルを
生成する。次に、生成した周期モデルを周期性の有無によって評価して、有効と判定した
場合は、同モデルから1周期分未来の性能値の予測データを生成する。生成した予測デー
タは、周期モデル記憶部210に記録される。
周期閾値判定部204は、呼び出し元のデータ間隔とデータ時刻に対する予測データが
、周期モデル記憶部210に存在しないか検索する。適合する予測データが1つ以上あっ
た場合は、性能値が予測データの閾値の範囲内に収まっているかを判定して、超過してい
た場合は、監視端末101に通知する。
限界閾値判定部205は、呼び出し元の性能値が、限界閾値記憶部211に設定された
閾値の範囲内に収まっているかを判定して、超過していた場合は、監視端末101に通知
する。
図4に監視設定記憶部208の内容例を示す。監視設定記憶部208は、要約条件記憶
部400と、要約方法記憶部401と、周期分析係数記憶部402と、周期分析対象記憶
部403から構成される。
図5に要約条件記憶部400の内容例を示す。要約条件記憶部400には、ある間隔の
時系列データを要約して、より粗い間隔の時系列データを生成するための要約条件が1つ
以上格納されており、性能値要約部201から参照される。例えば、要約元間隔501が
5分である場合、区切り時刻条件502は0時、2時、4時…となるため、5分間隔で0
時0分から1時55分までの24点の時系列データが要約されて、要約先間隔500が2
時間である時系列データが1点生成される。要約元間隔501に格納される最も細かい間
隔が、性能値収集部200の収集間隔として使用される。また、その他の要約元間隔50
1については、異なる要約条件の要約先間隔に存在する値である必要がある。なお、1日
間隔の時系列データから1ヶ月間隔の時系列データへ要約する場合、要約するデータの数
は28から31まで変動する。
図6に要約方法記憶部401の内容例を示す。要約方法記憶部401には、性能値の監
視項目600ごとに、時系列データをどのように要約するかが格納されている。要約方法
601は監視項目600の特性によって、平均値602または累積値603または最大値
604のいずれかが割り当てられている。
図7に周期分析係数記憶部402の内容例を示す。周期分析係数記憶部402には、周
期モデル生成部202が、周期モデルを生成して評価するために使用するパラメータが格
納されている。これらのパラメータは、ユーザーが何をもって周期性があると判断するか
の基準に合わせて、デフォルト値から変更することができる。
周期数700には、周期モデルを生成するために、過去何周期分の時系列データを使用
するかが格納されている。二乗誤差境界値701には、生成した周期モデルが無効である
かを、各周期の同一点間における回帰分析の観点から判定するための閾値が格納されてい
る。傾き境界値702には、生成した周期モデルが有効であり、かつ発散や収束の傾向が
ないことを判定するための閾値が格納されている。中心点距離境界値703には、生成し
た周期モデルが有効であり、かつ発散や収束の傾向があることを判定するための閾値が格
納されている。信頼区間704には、有効と判定された周期モデルから算出した1周期先
の予測値に対して回帰分析から上下の閾値を計算するための係数が格納されている。
図8に周期分析対象記憶部403の内容例を示す。周期分析対象記憶部403には、周
期モデルを生成する期間と周期の組合せが複数格納されており、周期モデル生成部202
から参照される。単位期間800は周期モデルを生成する1周期分の時間幅で、例えば1
日、1週間、1ヶ月、1年といった値が格納されている。データ間隔801は、単位期間
800に対する周期モデルの生成で使用する時系列データの間隔で、要約条件記憶部40
0の要約先間隔500のいずれかが選択される。また、データ数802は単位期間800
をデータ間隔801で割った値であり、この値が周期分析にとって適切になるようなデー
タ間隔802が選択されている。適切なデータ数とは、1周期の時系列データを折れ線グ
ラフで表示した際に、その全体的な山谷の遷移を形状として比較できる必要最小限なデー
タ数で4〜10数点程度に収めるものとする。例では、単位期間1日に対するデータ間隔
を2時間として、1日の時系列データの遷移を12点で表している。
周期テーブル803には、単位期間800ごとに、周期モデルを生成するための周期の
パターンが複数格納されている。個々の周期804は、それぞれ実期間805の組合せと
して登録されている。例えば、単位期間が1日の場合、周期Aは連続した毎日に対する周
期を表しており、周期Bは毎週月曜日の周期を表している。デフォルトでは、一般的な周
期として、日、週、月単位で計算された周期が格納されているが、ユーザーが任意の実期
間の組合せで周期を追加することもできる。例えば、毎週月〜金と土日で異なる運用をし
ている場合、「毎日(月〜金)」と「毎日(土日)」といった二つの周期を追加することが
できる。
図9に性能値記憶部209の内容例を示す。性能値記憶部209には、性能値の監視項
目900とデータ間隔901の組合せごとに、データテーブル902が作成される。デー
タテーブル902には、時刻903と性能値904の時系列データが格納される。なお、
データ間隔901には、性能値収集部200の収集間隔と、性能値要約部201が要約す
る全ての要約先間隔500の組合せが格納される。
図10に周期モデル記憶部210の内容例を示す。周期モデル記憶部210には、性能
値の監視項目1000とデータ間隔1001の組合せごとに、周期モデルテーブル100
2が作成される。周期モデルテーブル1002には、時刻1003と周期1004の組合
せごとに、予測性能値1005と、上限閾値1006と、下限閾値1007が格納される
。周期1004は、周期テーブル803の周期804に対して生成された周期モデルのう
ち、有効と判定されたものだけが格納される。
図11に限界閾値記憶部411の内容例を示す。限界閾値記憶部411には、性能値の
監視項目1100と閾値種別1101ごとに、閾値1102が格納されている。閾値種別
1101は上限1103または下限1104のいずれかになる。
次に、本実施の形態の動作について説明する。
性能値収集部200は、予め設定された収集間隔に従って定期的に性能値の収集を行う
。1つの監視項目の1回分の収集に対する、性能値収集部200の処理フローを、図12
に示す。性能値収集部は、監視対象装置102から性能値を収集する(ステップ1200
)と、収集した性能値と収集時刻の情報を、性能値記憶部209のデータテーブル902
に追加する(ステップ1201)。次に収集した性能値を引数に限界閾値判定部205の
処理を呼び出して、該性能値について監視項目のリソース限界に関する異常がないかを判
定する(ステップ1202)。最後にデータ間隔(=収集間隔)とデータ時刻(=収集時
刻)を引数に性能値要約部201の処理を呼び出し、必要に応じて要約した時系列データ
を生成する(ステップ1203)。
性能値要約部201は、性能値収集部200または自身から再帰的に呼び出され、必要
に応じて性能値の時系列データの要約を行う。1回の呼び出しに対する、性能値要約部2
01の処理フローを図13に示す。性能値要約部201は、要約条件記憶部400の要約
条件についてループを実行する(ステップ1300,1310)。個々のループでは、デ
ータ間隔とデータ時刻が共に要約条件を満たした場合だけ、要約の処理を実行する(ステ
ップ1301,1302)。
要約条件を満たすと、まず要約方法記憶部401から、性能値の監視項目に対応する要
約方法を取得する(ステップ1303)。次に、性能値記憶部209の、性能値の監視項
目とデータ間隔に対応するデータテーブル902から、要約対象の期間の時系列データを
取得する(ステップ1304)。ここで取得する時系列データの期間とは、1つ前の区切
り時刻以上かつ当該の区切り時刻未満を満たす期間である。
取得した時系列データを、要約方法に従って要約して、1つの性能値を算出する。また
、要約対象の期間の先頭時刻を要約時刻として採用する(ステップ1305)。要約した
性能値とデータ時刻(=要約時刻)の情報を、性能値記憶部209のデータテーブル90
2に追加する(ステップ1306)。
次に要約した性能値と、データ間隔(=要約先間隔)と、データ時刻(=要約時刻)を
引数に周期閾値判定部204の処理を呼び出して、性能値に対して、監視項目の周期的な
挙動の観点から異常が発生していないかを判定する(ステップ1307)。また、データ
間隔(=要約先間隔)とデータ時刻(=要約時刻)を引数に自身の処理を再帰的に呼び出
し、必要に応じて更に上位に要約した時系列データを生成する(ステップ1308)。
最後に、データ間隔(=要約先間隔)とデータ時刻(=要約時刻)を引数に周期モデル
生成部202の処理を呼び出して、必要に応じて周期モデルを生成する(ステップ130
9)。
周期モデル生成部202は、性能値要約部201から呼び出され、必要に応じて周期モ
デルを生成する。1回の呼び出しに対する、周期モデル生成部202の処理フローを図1
4に示す。周期モデル生成部202は、周期分析対象記憶部403の周期分析対象につい
てループを実行する(ステップ1400,1409)。個々のループでは、データ間隔が
一致した場合だけ、処理を続行する(ステップ1401)。データ間隔が一致すると、対
象の周期テーブル803の全ての実期間についてループする(ステップ1402,140
8)。個々のループでは、今回の収集によって、データが揃った実期間に対してだけ、処
理を続行する(ステップ1403)。例えば、データ間隔が2時間で、データ時刻が2007
/01/15(月) 22時だった場合、周期Aや周期Bで該当する実期間が存在する。
該当する実期間が存在した場合、当該実期間を含む過去数周期分の実期間に対する性能
値の時系列データを、性能値記憶部209の、データテーブル902から取得する(ステ
ップ1404)。なお、取得する周期数は、周期分析係数記憶部402の周期数700の
設定値である。例えば、周期数が3で、該実期間が2007/01/15の1日だった場合、周期A
(毎日)については、2007/01/13、2007/01/14、2007/01/15の3日分の時系列データが取得
し、周期B(毎週月曜日)については、2007/01/01、2007/01/08、2007/01/15の3日分の時
系列データを取得する。なお、周期数分の過去データが記憶部に格納されていないなどの
理由で取得できない場合は、周期モデルが生成できないため、該ループに対する処理を終
了する。
次に取得した周期数分の時系列データから、1つの周期モデルを生成して評価する(ス
テップ1405)。評価の結果、周期モデルが有効と判定された場合(ステップ1406
)、同周期モデルから、1周期分未来の性能値の予測データを生成して、周期モデル記憶
部210に記録する(ステップ1407)。例えば、前述の3日分の時系列データから生
成された周期モデルが、共に有効であると判定された場合、周期A(毎日)については、20
07/01/16の予測データ、周期B(毎週月曜日)については、2007/01/22の予測データをそれ
ぞれ生成して、記録する。
1つの周期モデルを生成して評価する処理フローを図15に示す。また、算出における
内部計算の過程をグラフで表現したものを図19と図20に示す。まず、データのプロッ
ト1900のように、取得した周期数分の過去データを隣合わせで並べてプロットする(
ステップ1500)。
周期テーブル803の実期間が等間隔でない場合は、データのプロット1901のよう
に、実期間の間隔の比率を、プロットする間隔へ反映する。例えば、1時間掛かるバッチ
処理の実行スケジュールに合わせて、12:00〜13:00、14:00〜15:00、17:00〜18:00という
組合せの実期間による周期を定義した場合、実期間の間隔は2時間と3時間で異ってしま
う。このような場合、実期間の間隔が最も短い間隔を基準幅として隣り合うように並べる
に対して、他の周期について基準幅との比率分だけ離して並べるようにする。
各周期の同一時刻ごとに回帰直線を計算する。各回帰直線は最小二乗法によって計算さ
れる(ステップ1501)。周期モデルは、本回帰直線の集合として表現される。
算出した全ての回帰直線の縦軸と横軸に対して正規化を実行する(ステップ1502)
。縦軸に対する正規化は、回帰直線の平均線を算出して、各回帰直線から平均線の値を引
くことで、平均値を0にするステップと、回帰直線と平均線の標準偏差が1になるように
係数を掛けるステップからなる。横軸に対する正規化は、開始時刻が0、基準幅が1とな
るように係数を掛けるステップからなる。
縦軸と横軸に対して実行した正規化を、元の時系列データの個々の点に対しても実行し
て、図20に示す正規化実行後のプロットを得る(ステップ1503)。
この正規化した空間で、個々の点と、対応する回帰直線の二乗誤差の平均値を算出する
(ステップ1504)。ここで、最小二乗誤差の平均値が、二乗誤差境界値701の値よ
りも大きかった場合、周期モデルは無効と判定され、周期モデルを生成して評価する処理
のフローは終了する(ステップ1505,1511)。
最小時二乗誤差の平均値が、二乗誤差境界値701の値よりも小さかった場合、各点に
おいては、線形の傾向が強いことが分かるため、引き続き、各周期の遷移の形状に対して
類似性があるかの観点で、周期モデルの評価を続行する。
各周期の遷移の形状に対して類似性があるか判定する際、遷移全体の単調増加減少傾向
や、遷移全体の振幅の単調増加減少傾向があった場合も、形状が一致していれば周期性が
あると判定したい。遷移全体の単調増加減少傾向については、縦軸の正規化を実施した時
点で無効化できている。遷移全体の振幅の単調増加減少傾向がなく、かつ形状が一致して
いる場合に該当するかを判定するため、正規化された回帰直線の傾きに着目する(ステッ
プ1506,1507)。全ての正規化された回帰直線の傾きの絶対値が傾き境界値70
2の値よりも小さければ、遷移上の各点が同じ線形の傾向にあり、遷移の形状としても周
期性があると言える。この場合周期モデルは有効と判定される(ステップ1510)。
正規化された回帰直線の傾きの絶対値が傾き境界値702の値より大きいものがあった
場合、引き続き、遷移全体の振幅の単調増加減少傾向があり、かつ形状が一致している場
合に該当するかを判定する。この判定をもって、周期モデルが有効であるか、無効である
かを完全に判別することができる。遷移全体の振幅の単調増加減少傾向があり、かつ形状
が一致しているための正確な条件は、全ての回帰直線が1つの点で交わることであり、そ
の場合、相似の理論をもって、各周期における遷移の形状が一致することを証明できる。
またその際、交点が過去であれば発散の傾向があり、交点が未来であれば収束の傾向があ
ると言える。
全ての回帰直線が正確に1つの点で交差することは実質ありえないため、次の方法を用
いることで、一定のずれを許容する。まず、回帰直線の集合から交点の中心点を求める。
回帰直線の数がnで、それらが互いに並行でない場合、全ての直線間の交点の数はn(n
−1)/2となる。これらの座標を全て計算して、その平均座標を中心点とする。
次に各回帰直線から中心点への距離の平均値を計算する。中心点からの平均距離の値が
、中心点距離境界値703の値よりも小さかった場合、回帰直線の交点が1点に収束して
おり、各周期の波形の形状は相似の関係にあり、周期モデルは有効であると判定する。逆
に平均距離の値が大きかった場合、回帰直線の交点が1点に収束しておらず、各周期の波
形の形状も類似とはならないため、周期モデルは無効であると判定する(ステップ150
9,1510,1511)。
周期モデルが有効と判定された場合に、同周期モデルから、1周期分未来の性能値の予
測データを生成して、周期モデル記憶部210に記録する手順を図16に示す。また、算
出における内部計算の過程をグラフで表現したものを図21に示す。予測性能値は、周期
モデル生成時に算出した各時刻ごとの回帰直線の当該時刻における値を採用する(ステッ
プ1600)。また、上限閾値と下限閾値については、回帰直線の上下に対して、信頼区
間704の係数で算出する(ステップ1601)。算出された予測性能値と上限閾値と下
限閾値は、周期モデル記憶部210の周期モデルテーブル1002に格納される。
周期閾値判定部204は、性能値要約部201から呼び出されると、渡された性能値と
、周期モデル記憶部210に記憶された予測性能値の閾値を比較し、閾値を超過していた
場合に閾値超過を監視端末に通知する。周期閾値判定部204の処理フローを図17に示
す。まず、引数のデータ間隔とデータ時刻に対応する予測性能値のデータが、周期モデル
テーブルに1つも登録されていない場合は、評価対象の閾値が存在しないとして、終了す
る(ステップ1700)。周期性のないランダムな性能値の監視項目については、ほとん
どこのフローを通る。
予測性能値のデータが1つ以上ある場合は、まず閾値超過のフラグをTRUEとする(ステ
ップ1701)。次に、周期モデルテーブルの当該時刻の各周期についてループする(ス
テップ1702,1706)。各ループでは、性能値が予測性能値の上限閾値と下限閾値
の範囲内に収まっているかを判定し、収まっていた場合は、閾値超過のフラグをFALSEと
する(ステップ1704)。一方、性能値が予測性能値の上限閾値と下限閾値の範囲外に
あった場合、当該周期の周期モデルが実態に当てはまらなかったとして、同周期モデルか
ら生成された後続の予測性能値と上限閾値と下限閾値のデータを、直ちに周期モデルテー
ブルから削除する(ステップ1705)。これにより、後続のデータ時刻に対する周期閾
値判定の精度が向上する。ループが完了したら、超過フラグの状態を判定して、超過フラ
グがTRUEのままであった場合は、監視端末に対して、閾値の超過を通知する(ステップ1
707,1708)。
限界閾値判定部205は、性能値収集部200から呼び出されると、渡された性能値と
、限界閾値記憶部411に格納された性能値の閾値を比較し、閾値を超過していた場合に
閾値超過を監視端末に通知する。限界閾値判定部205の処理フローを図18に示す。ま
ず閾値超過のフラグをFALSEとする(ステップ1800)。限界閾値記憶部411の監視
項目分ループする(ステップ1801,1802)。各ループでは、閾値種別と閾値の組
合せによって、性能値が閾値を超過していると判定された場合は、閾値超過フラグをTRUE
とする(ステップ1802,1803,1804)。ループが完了したら、超過フラグの
状態を判定して、超過フラグがTRUEのままであった場合は、監視端末に対して、閾値の超
過を通知する(ステップ1806,1807)。
図22は、任意の期間と周期の組合せを追加登録するGUIの画面例である。単位期間
2200は、整数を入力するテキストボックスと単位(分、時間、日、週、月、年)を選
択するコンボボックスから構成されており、周期分析対象記憶部403の単位期間800
に入力する値を指定する。また、単位期間が決定されると、要約条件記憶部400から適
切なデータ間隔が自動的に選択される。
周期2201は、整数を入力するテキストボックスと単位(分、時間、日、週、月、年
)を選択するコンボボックスから構成されており、周期の間隔を指定する。周期2201
に指定する値は、単位期間2200に指定する値より大きくなければならない。基準日時
2202は、周期の基点となる時刻であり、4つのパターンから選択する。追加ボタン2
203を選択すると、指定した内容の組合せが追加される。例では、毎月隔週(第一と第
三)日曜日の午前2時から、約2時間半かかるバックアップ業務を行っているシステムに
おいて、バックアップ業務のサイクルに合わせた期間と周期の組合せを指定している。
本発明の実施の形態の構成例を示すシステム構成図である。 本発明の実施の形態の構成例を示す性能監視サーバーの構成図である。 性能値の収集・分析する制御と、閾値を判定する制御における機能ブロック図である。 監視設定記憶部の内容例を示す図である。 要約条件記憶部の内容例を示す図である。 要約方法記憶部の内容例を示す図である。 周期分析係数記憶部の内容例を示す図である。 周期分析対象記憶部の内容例を示す図である。 性能値記憶部の内容例を示す図である。 周期モデル記憶部の内容例を示す図である。 限界閾値記憶部の内容例を示す図である。 性能値採取部の処理例を示すフローチャートである。 性能値要約部の処理例を示すフローチャートである。 周期モデル生成部の処理例を示すフローチャートである。 1回分の周期モデルを生成、評価する処理例を示すフローチャートである。 予測値、閾値を計算、記録する処理例を示すフローチャートである。 周期閾値判定部の処理例を示すフローチャートである。 限界閾値判定部の処理例を示すフローチャートである。 周期モデル生成時におけるグラフのプロットイメージである。 周期モデル生成時における正規化後のグラフのプロットイメージである。 周期モデルから次の1周期の予測データを計算する際のグラフのプロットイメージである。 任意の期間と周期の組合せを追加登録するGUIの画面例である。
符号の説明
100…性能監視サーバー、101…監視端末、102…監視対象装置、103…ネッ
トワーク、200…性能値収集部、201…性能値要約部、202…周期モデル生成部、
203…閾値判定部、204…周期閾値判定部、205…限界閾値判定部、206…監視
設定編集部、207…記憶装置、208…監視設定記憶部、209…性能値記憶部、21
0…周期モデル記憶部、211…限界閾値記憶部、400…要約条件記憶部、401…要
約方法記憶部、402…周期分析係数記憶部、403…周期分析対象記憶部、500…要
約先間隔、501…要約元間隔、502…区切り時刻条件、600…監視項目、601…
要約方法、602…平均値、603…累積値、604…最大値、700…周期数、701
…二乗誤差境界値、702…傾き境界値、703…中心点距離境界値、704…信頼区間
、800…単位期間、801…データ間隔、802…データ数、803…周期テーブル、
804…周期、805…実期間、900…監視項目、901…データ間隔、902…デー
タテーブル、903…時刻、904…性能値、1000…監視項目、1001…データ間
隔、1002…周期モデルテーブル、1003…時刻、1004…周期、1005…予測
性能値、1006…上限閾値、1007…下限閾値、1100…監視項目、1101…閾
値種別、1102…閾値、1103…上限、1104…下限、1900…実期間が等間隔
の場合のプロット、1901…実期間が等間隔ではない場合のプロット、2200…単位
期間、2201…周期、2202…基準日時、2203…追加ボタン。

Claims (5)

  1. 監視対象装置から性能値を収集する手段と、収集した性能値を時系列データとして保存
    する手段を持つ性能監視サーバーにおいて、予め与えられた複数の期間と周期の組合せに
    ついて、性能値の遷移に対する周期性の有無を判定する処理を持ち、周期性があると判定
    された期間と周期の組合せについて、次の周期の期間に対する予測性能値の遷移を算出し
    て、保存する手段を持つ性能監視システム。
  2. 請求項1記載の性能監視システムの、性能値の遷移に対する周期性の有無を判定する処
    理において、各周期の遷移が完全に一致する場合だけではなく、遷移全体の単調増加減少
    や、遷移全体の振幅に対する単調増加減少の傾向がある場合も、周期性があると見なした
    上で、前記傾向を加味した予測性能値の遷移を算出することを特徴とする性能監視システ
    ム。
  3. 請求項1,2記載の性能監視システムにおいて、性能値を収集した時刻に対して、前記
    保存した予測性能値が1つ以上存在する場合に、性能値と予測性能値とに基づいて、前記
    監視対象装置に性能的問題が発生しているかを判定する判定手段とを備えたことを特徴と
    する性能監視システム。
  4. 請求項3記載の性能監視システムにおいて、性能値と予測性能値の比較の結果、性能値
    から著しく外れた予測性能値の遷移については、次回以降の比較対象から除外することを
    特徴とする性能監視システム。
  5. 請求項2記載の性能監視システムにおいて、予め与えられた期間と周期の組合せに加え
    て、ユーザーが定義した任意の期間と任意の周期の組合せについても、周期性の有無を判
    定することを特徴とする性能監視システム。
JP2007236103A 2007-09-12 2007-09-12 性能監視システム Pending JP2009070017A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007236103A JP2009070017A (ja) 2007-09-12 2007-09-12 性能監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007236103A JP2009070017A (ja) 2007-09-12 2007-09-12 性能監視システム

Publications (1)

Publication Number Publication Date
JP2009070017A true JP2009070017A (ja) 2009-04-02

Family

ID=40606224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007236103A Pending JP2009070017A (ja) 2007-09-12 2007-09-12 性能監視システム

Country Status (1)

Country Link
JP (1) JP2009070017A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013214171A (ja) * 2012-03-31 2013-10-17 Nec Corp 性能監視装置、性能監視方法、及びそのプログラム
US9477736B2 (en) 2013-10-31 2016-10-25 Samsung Sds Co., Ltd. Apparatus and method for active and passive data gathering using stochastic model in control network

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013214171A (ja) * 2012-03-31 2013-10-17 Nec Corp 性能監視装置、性能監視方法、及びそのプログラム
US9477736B2 (en) 2013-10-31 2016-10-25 Samsung Sds Co., Ltd. Apparatus and method for active and passive data gathering using stochastic model in control network

Similar Documents

Publication Publication Date Title
JP6661052B2 (ja) 時系列データ処理装置、時系列データ処理システムおよび時系列データ処理方法
JP6319271B2 (ja) イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム
JP2004171249A (ja) データベースのバックアップ実行判断方法
JP2004534340A5 (ja)
US20100131952A1 (en) Assistance In Performing Action Responsive To Detected Event
JP2006268529A (ja) データセンタの需要予測システム、需要予測方法および需要予測プログラム
JP2008165352A (ja) 定期点検データ分析装置およびその方法
JP5387779B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP5634599B2 (ja) データ処理システム、データ処理方法、及び、プログラム
US20190347621A1 (en) Predicting task durations
JP2000194745A (ja) トレンド評価装置及びトレンド評価方法
JP5928104B2 (ja) 性能監視装置、性能監視方法、及びそのプログラム
JP2009070017A (ja) 性能監視システム
JP6018024B2 (ja) 変化検知装置、変化検知システム、変化検知方法及びプログラム
CN110138638A (zh) 一种网络流量的处理方法及装置
CN111596619B (zh) 计算机系统及设施的监视方法
US8108363B2 (en) Computer product, method, and apparatus for analyzing computer system
JP2009064354A (ja) データベースの容量監視システム及びデータベースの容量予測方法
JP2010128841A (ja) プロセス管理システム、管理方法およびプログラム
US20110125762A1 (en) Method for generating processing specifications for a stream of data items
RU2809254C1 (ru) Способ и система мониторинга автоматизированных систем
WO2022269959A1 (ja) ヒューマンライフ・トレーサビリティ装置および改善案提案支援方法
WO2023140079A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US20220108196A1 (en) Improved computer-implemented event forecasting and information provision
TW202416189A (zh) 預測值決策的方法和電子裝置及其電腦可讀取記錄媒體