JP2008108154A - 稼働性能情報の管理システム - Google Patents

稼働性能情報の管理システム Download PDF

Info

Publication number
JP2008108154A
JP2008108154A JP2006291961A JP2006291961A JP2008108154A JP 2008108154 A JP2008108154 A JP 2008108154A JP 2006291961 A JP2006291961 A JP 2006291961A JP 2006291961 A JP2006291961 A JP 2006291961A JP 2008108154 A JP2008108154 A JP 2008108154A
Authority
JP
Japan
Prior art keywords
performance information
operation performance
model data
correlation
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006291961A
Other languages
English (en)
Inventor
Masaru Naka
賢 仲
Shigeru Horikawa
茂 堀川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006291961A priority Critical patent/JP2008108154A/ja
Publication of JP2008108154A publication Critical patent/JP2008108154A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】複数の監視対象サーバから稼働性能情報を収集するシステムにおいて、収集した稼働性能情報を詳細に保持していると、データベースが圧迫される。また、平均などの要約方法を用いると、問題が発生した時点の情報の重要度が低下する。
【解決手段】取得した一定区間の稼働性能情報を、一定周期に区切り、同周期におけるモデルデータとの相関係数を求め、相関が高い稼働性能情報においては、モデルデータおよび相関係数のみを保存し、相関が低い稼働性能情報においては、収集した稼働性能情報をそのまま保存する。このことより、監視対象において定常状態の稼働性能情報でなく、異常時の稼働性能情報をそのまま保持することができ、異常が発生した時点の重要度の高い情報をそのまま分析に用いることができる。また、モデルデータは各相関比較する処理において、更新し、モデルデータを成熟される処理を持つ。
【選択図】図4

Description

本発明は、ネットワークで接続された複数の監視対象サーバから収集した稼働性能情報を保存する稼働性能情報管理システムであり、収集した稼働性能情報で、重要度が低い稼働性能情報と重要度が高い稼働性能情報を判断し、重要度の低い稼働性能情報に対しては、情報量を減らす処理を持ち、長期間監視を行うことを可能とする方法に関する。
システム管理者はシステムが安定して稼働しているかを調査するにあたり、CPU使用率や、トランザクション数、セッション数などの稼働性能情報を収集・保存し、異常が発生した場合にアラームを発生させたり、過去の履歴を参照することで分析を行う。近年では、監視対象サーバやシステム、および監視対象のリソース数も膨大になっている。また、長期的な運用監視を踏まえて、稼働性能情報も長期間保持しておく必要もある。このようなことから、収集した稼働性能情報を保存しておくために必要なデータベースのサイズも膨大になっている。
特開2001−326641号公報
現在、収集した稼働性能情報に対して、一定時間分の情報を平均化するなどの方法を用いて、稼働性能情報を要約することでデータベースサイズの削減を行い、長期的な運用監視を行っている。しかし、単純に一定時間分の情報を要約してしまうと、障害があった時間の稼働性能情報、つまり重要度の高い稼働性能情報に対しても要約処理を行ってしまい、情報の重要度が下がってしまう。
本発明は、稼働性能情報を収集するシステムにおいて、長期間収集を行うと保存する稼働性能情報の情報量が肥大してしまい、システム内のデータベースのサイズが肥大化してしまうことを解決し、長期間の稼働性能情報の保存および収集を可能にする発明である。
本発明では、一定区間の周期的な稼働性能情報に対してモデルデータを生成する。生成したモデルデータと同一周期毎に求めた近似式との相関係数を計算し、類似性がある稼働性能情報かを判定する。一般的に相関が高い場合の相関係数は0.7〜1.0である。
モデルデータと相関が高い稼働性能情報を持つ周期に対しては、モデルデータとそのモデルデータとの相関係数のみを保存し、収集間隔毎の稼働性能情報は保存しない。モデルデータとの相関が低い稼働性能情報を持つ周期に対しては、収集した稼働性能情報を収集間隔毎に保存する。このことで、収集間隔毎に稼働性能情報を保存するのではなく、モデルデータとの相関が高い情報に関しては、モデルデータの数式および相関係数のみを保存することでデータ量を削減することが可能となる。また、相関係数を保存しておくことで、モデルデータとの類似性も確認することができる。
周期的な稼働性能情報に対して、モデルデータとの相関が低い場合は、その周期内に何らかの事象があったことを意味するため、重要な情報として判断することができる。このような情報に対しては、収集間隔毎の稼働性能情報をそのまま保存してあるので、問題解決を行うための分析等に用いることが可能となる。
本発明によれば、稼働性能情報として異常が発生した時点の重要度の高い情報のみ詳細に保存することが可能となり、データベースの情報量を削減し、長期的な運用監視を行うことが可能となる。
以下、本発明の実施例を、図面を用いて説明する。
図1は本発明による一実施例である。
同図に示すように、本実施例に係わる稼働性能情報収集システムは、複数の監視対象サーバ104、105、106と、CPU使用率やトランザクション数、セッション数などの稼働性能情報を収集および分析する手段を持つ監視サーバ101および稼働性能情報を保持する稼働性能情報格納部102から構成される。稼働性能情報格納部102は、モデルデータ格納テーブル107および、稼働性能情報格納テーブル108を含む。監視端末100では、監視サーバ101とネットワークを介して接続することにより、稼働性能情報格納部102に保持している稼働性能情報を参照することができる。
図2に監視サーバ101の構成を示す。監視サーバ101では、稼働性能情報取得部201により、監視対象サーバ104、105、106からCPU使用率や、トランザクション数、セッション数などの稼働性能情報を取得する。稼働性能情報の取得手段はMIB(Management Information Base)を用いたり、監視対象サーバにエージェントを配置するなどして取得する。稼働性能情報の取得は、分単位など、対象周期より小さい間隔を指定する。稼働性能情報を取得する間隔は条件設定部202で指定されている。
稼働性能情報分析部203では、条件設定部202で設定されている月、週、日などの対象区間や、週、日、時などの対象周期といった区間条件300および稼働性能情報301を用いて、稼働性能情報区間分割処理部302において一定周期の稼働性能情報303に分割する。対象区間および対象周期はユーザーの運用により定義する。対象周期は対象区間が1ヶ月とした場合は、1週間や、1日のように区間より小さく設定する。稼働性能情報管理処理部204では、稼働性能情報分析部203において処理された稼働性能情報を稼働性能情報格納部102に保存する。モデルデータ管理処理部205では、稼働性能情報分析部203において処理されたモデルデータを稼働性能情報格納部102へ保存する。稼働性能情報参照部206は、監視端末101からの接続を受け、稼働性能情報格納部102に格納されている稼働性能情報を取得する処理を持つ。
稼働性能情報分析部203での処理を図3を用いて説明する。稼働性能情報区間分割処理部302により区間条件300で指定された区間で区切った図7の一定区間の稼働性能情報701に示すような稼働性能情報を801、901、1001に示すような区間条件300で指定された周期に区切った一定周期の稼働性能情報303に分割する。ここで、図7の時系列Aの一定区間の稼働性能情報700および、時系列Bの一定区間の稼働性能情報701は、区間条件300で指定された区間で区切った一定区間の稼働性能情報の一例である。また、時系列Aにおける一定周期の稼働性能情報800、900、1000は区間条件300で指定された周期で時系列Aの一定区間の稼働性能情報700を区切った一定周期の稼働性能情報の一部であり、時系列Bにおける一定周期の稼働性能情報801、901、1001は区間条件300で指定された周期で時系列Bの一定区間の稼働性能情報701を区切った一定周期の稼働性能情報の一部である。
分割された一定周期の稼働性能情報303は近似式算出処理部304において一定周期の稼働性能情報の近似式305を算出する。近似式の算出方法は最小二乗法などを用いる。算出した近似式は、稼働性能情報とモデルデータの相関比較する処理部306において前記求めた近似式とモデルデータ格納テーブルに格納されているモデルデータとの相関を求める。求めた相関により、稼働性能情報管理処理部204を通して、稼働性能情報格納部102に稼働性能情報を保存し、モデルデータ管理処理部205を通して、一定周期のモデルデータ307を作成する。
以下、稼働性能乗法とモデルデータの相関比較する処理部306の詳細を図4を用いて説明する。
稼働性能情報とモデルデータの相関比較する処理部306では、稼働性能情報区間分割処理302によって周期毎に分割された稼働性能情報に対して、モデルデータとの比較処理を行う。モデルデータとの比較処理は、稼働性能情報区間分割処理302によって分割された稼働性能情報周期数分ループ(400)する。
402において、モデルデータがモデルデータ格納テーブル107に400でのループ対象となっている周期のモデルデータが存在するか確認し、存在しない場合は、401において、400でのループ対象となっている周期に対しての近似式を求め、前記求めた近似式をモデルデータとし、モデルデータとの相関係数は0.7とし、モデルデータ格納テーブル107におけるモデルデータ式列502、稼働性能情報格納テーブル108におけるモデルデータ列602、および相関係数列604を更新する。
402において、モデルデータが存在する場合は、モデルデータ格納テーブル107に格納されている同じ周期のモデルデータを取得(403)する。
前記取得したモデルデータと近似式算出処理部304で算出した稼働性能情報の近似式との相関係数を比較(404)し、相関が高い(一般的に相関係数が0.7より大きい場合は相関が高い)場合は、一つ前の区間にある同じ周期の相関係数と比較(405)し、対象の周期の相関係数が大きければ、406にあるように、モデルデータ格納テーブル107の周期列501にある該当周期を検索し、同行のモデルデータ式列502を更新し、稼働性能情報格納テーブル108の該当周期のモデルデータ列602に格納および、相関係数列604に相関係数を格納する。ここで、モデルデータ列602に、対象周期のモデルデータを格納するため、稼働性能情報取得部201で取得した対象周期の稼働性能情報を稼働性能情報列603には格納しない。このことにより、情報量の削減を行う。また、一つ前の周期にある同じ周期の相関係数と比較することにより、モデルデータを固定することなく、長期的な運用において、モデルデータの成熟を行うことが可能となる。
対象周期の相関係数が一つ前の期間にある同じ周期の相関係数より小さい場合は、407にあるように、モデルデータ格納テーブル107に格納されている該当周期のモデルデータを検索しモデルデータ列602に該当モデルデータを格納し、相関係数列603に相関係数を格納する。前記格納ステップにおいても、モデルデータ列602に、対象周期のモデルデータを格納するため、稼働性能情報取得部201で取得した対象周期の稼働性能情報を稼働性能情報列603に格納しない。
取得したモデルデータと稼働性能情報の近似式との相関係数を比較(404)し、相関が低い場合は、定常時な稼働性能情報ではなく、なんらかの異常が発生していると考えられるため、重要度の高い情報として、408にあるように、稼働性能情報を稼働性能情報格納テーブル108の稼働性能情報列603に、該当周期における収集した間隔で得た稼働性能情報の値をそのまま格納する。該当周期において、なんらかの異常が発生していると考えられるので、稼働性能情報格納テーブル108の該当周期に対応しているモデルデータ列602および相関係数列604にはデータを格納しない。
以上説明したように、本実施例によると、一定の周期に対して相関が低い、つまり、異常が発生した周期の稼働性能情報のみを詳細に保持することが可能になり、定常的な稼働性能情報に対しては、最小限の情報として、モデルデータおよび相関係数を保持する。このことにより、格納する情報量を削減し、長期的な運用監視が可能となり、異常時の調査を行う場合には、詳細な稼働性能情報を参照することができる。また、定常時の情報に関しても、モデルデータを用いることによって、分析等を行うことが可能となる。
本発明による実施例を示す図。 監視サーバの構成図。 稼働性能情報分析部における処理関連図。 稼働性能情報とモデルデータの相関比較する処理を説明する図。 モデルデータ格納テーブルを示す図。 稼働性能情報格納テーブルを示す図。 一定区間の稼働性能情報を説明する図。 一定周期の稼働性能情報を説明する図。 一定周期の稼働性能情報を説明する図。 一定周期の稼働性能情報を説明する図。
符号の説明
100…監視端末、101…監視サーバ、102…稼働性能情報格納部、104、105、106…監視対象サーバ、107…モデルデータ格納テーブル、108…稼働性能情報格納テーブル、201…稼働性能情報取得部、202…条件設定部、203…稼働性能情報分析部、204…稼働性能情報管理処理部、205…モデルデータ管理処理部、206…稼働性能情報参照部、300…区間条件、301…稼働性能情報、302…稼働性能情報区間分割処理、303…一定周期の稼働性能情報、304…近似式算出処理部、305…一定周期の稼働性能情報の近似式、306…稼働性能情報とモデルデータの相関比較する処理部、307…一定周期のモデルデータ、501…周期名列、502…モデルデータ式列、601…周期名列、602…モデルデータ列、603…稼働性能情報列、604…相関係数列、700…時系列Aの一定区間の稼働性能情報、701…時系列Bの一定区間の稼働性能情報、800…時系列Aにおける一定周期の稼働性能情報、801…時系列Bにおける一定周期の稼働性能情報、900…時系列Aにおける一定周期の稼働性能情報、901…時系列Bにおける一定周期の稼働性能情報、1000…時系列Aにおける一定周期の稼働性能情報、1001…時系列Bにおける一定周期の稼働性能情報。

Claims (6)

  1. 複数の監視対象サーバから稼働性能情報を収集する手段と、収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、稼働性能情報を一定区間に分割する処理と、一定区間内の稼働性能情報を一定周期に分割する処理を持ち、異なる区間にある同一周期の稼働性能情報と比較する手段を持つ稼働性能情報管理システム。
  2. 複数の監視対象サーバから稼働性能情報を収集する手段と、収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、一定周期毎の稼働性能情報をモデルデータとしての近似式を求める処理と、求めたモデルデータと異なる区間にある同一周期の稼働性能情報との相関を求める処理を持つ稼働性能情報管理システム。
  3. 複数の監視対象サーバから収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、一定周期の近似式を求める処理と、前記求めた近似式とモデルデータとの相関を求める処理を持ち、相関が強い場合は一定周期の稼働性能情報をすべて保存するのではなく、モデルデータとの相関係数の値を保存するステップを持つ稼働性能情報管理システム。
  4. 複数の監視対象サーバから収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、一定周期の近似式を求める処理と、前記求めた近似式とモデルデータとの相関を求める処理を持ち、相関が弱い場合は相関係数の値ではなく、稼働性能情報をそのまま保存するステップを持つ稼働性能情報管理システム。
  5. 複数の監視対象サーバから収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、一定周期の近似式を求める処理と、前記求めた近似式とモデルデータと相関を求める処理を持ち、相関の強さによってモデルデータを更新する処理を持つ稼働性能情報管理システム。
  6. 複数の監視対象サーバから収集した稼働性能情報を保存する手段を持つ監視サーバにおいて、一定周期の近似式を求める処理と、前記求めた近似式とモデルデータと相関を求める処理を持ち、相関の強さによって一定周期の稼働性能情報をすべて保存するのではなく、モデルデータとの相関の値を保存するステップを持ち、保存する情報量の削減を行うことが可能な稼働性能情報管理システム。
JP2006291961A 2006-10-27 2006-10-27 稼働性能情報の管理システム Pending JP2008108154A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006291961A JP2008108154A (ja) 2006-10-27 2006-10-27 稼働性能情報の管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006291961A JP2008108154A (ja) 2006-10-27 2006-10-27 稼働性能情報の管理システム

Publications (1)

Publication Number Publication Date
JP2008108154A true JP2008108154A (ja) 2008-05-08

Family

ID=39441440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006291961A Pending JP2008108154A (ja) 2006-10-27 2006-10-27 稼働性能情報の管理システム

Country Status (1)

Country Link
JP (1) JP2008108154A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170526A (ja) * 2008-10-20 2010-08-05 Amazon Technologies Inc 監視のための大量データ記憶システム
WO2012029500A1 (ja) 2010-09-01 2012-03-08 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
JP2013041574A (ja) * 2011-07-21 2013-02-28 Hitachi Ltd 情報処理システム運用管理装置、運用管理方法及び運用管理プログラム
US8819497B1 (en) 2008-10-20 2014-08-26 Amazon Technologies, Inc. Storage of mass data for monitoring
WO2016092629A1 (ja) * 2014-12-09 2016-06-16 株式会社日立製作所 計算機システム及び監視方法
US10126956B2 (en) 2015-06-16 2018-11-13 Mitsubishi Electric Corporation Information processing device and information processing method

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010170526A (ja) * 2008-10-20 2010-08-05 Amazon Technologies Inc 監視のための大量データ記憶システム
US8819497B1 (en) 2008-10-20 2014-08-26 Amazon Technologies, Inc. Storage of mass data for monitoring
US9563531B2 (en) 2008-10-20 2017-02-07 Amazon Technologies, Inc. Storage of mass data for monitoring
US10296435B2 (en) 2008-10-20 2019-05-21 Amazon Technologies, Inc. Storage of mass data for monitoring
WO2012029500A1 (ja) 2010-09-01 2012-03-08 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
CN103154904A (zh) * 2010-09-01 2013-06-12 日本电气株式会社 操作管理设备、操作管理方法和程序
JP5387779B2 (ja) * 2010-09-01 2014-01-15 日本電気株式会社 運用管理装置、運用管理方法、及びプログラム
CN103154904B (zh) * 2010-09-01 2015-09-02 日本电气株式会社 操作管理设备、操作管理方法和程序
US9600391B2 (en) 2010-09-01 2017-03-21 Nec Corporation Operations management apparatus, operations management method and program
JP2013041574A (ja) * 2011-07-21 2013-02-28 Hitachi Ltd 情報処理システム運用管理装置、運用管理方法及び運用管理プログラム
WO2016092629A1 (ja) * 2014-12-09 2016-06-16 株式会社日立製作所 計算機システム及び監視方法
US10126956B2 (en) 2015-06-16 2018-11-13 Mitsubishi Electric Corporation Information processing device and information processing method

Similar Documents

Publication Publication Date Title
JP6706321B2 (ja) サービス呼び出し情報処理の方法及びデバイス
US10229129B2 (en) Method and apparatus for managing time series database
US9672085B2 (en) Adaptive fault diagnosis
US10171335B2 (en) Analysis of site speed performance anomalies caused by server-side issues
US10275301B2 (en) Detecting and analyzing performance anomalies of client-server based applications
US7502971B2 (en) Determining a recurrent problem of a computer resource using signatures
US8078913B2 (en) Automated identification of performance crisis
US9459942B2 (en) Correlation of metrics monitored from a virtual environment
US6973415B1 (en) System and method for monitoring and modeling system performance
US8930757B2 (en) Operations management apparatus, operations management method and program
US9047348B2 (en) Event correlation in cloud computing
US7082381B1 (en) Method for performance monitoring and modeling
US10515083B2 (en) Event analysis apparatus, an event analysis system, an event analysis method, and an event analysis program
US10263833B2 (en) Root cause investigation of site speed performance anomalies
US7184935B1 (en) Determining and annotating a signature of a computer resource
US20160217378A1 (en) Identifying anomalous behavior of a monitored entity
US20060100969A1 (en) Learning-based method for estimating cost and statistics of complex operators in continuous queries
Smith et al. An anomaly detection framework for autonomic management of compute cloud systems
CN110058977A (zh) 基于流式处理的监控指标异常检测方法、装置及设备
JP2008108154A (ja) 稼働性能情報の管理システム
US20160321128A1 (en) Operations management system, operations management method and program thereof
US10504026B2 (en) Statistical detection of site speed performance anomalies
CN112751726A (zh) 一种数据处理方法、装置、电子设备和存储介质
WO2012153400A1 (ja) データ処理システム、データ処理方法、及び、プログラム
JP2019095822A (ja) パラメータ設定方法、データ分析装置、データ分析システム及びプログラム