JP4120371B2 - 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム - Google Patents

運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム Download PDF

Info

Publication number
JP4120371B2
JP4120371B2 JP2002344811A JP2002344811A JP4120371B2 JP 4120371 B2 JP4120371 B2 JP 4120371B2 JP 2002344811 A JP2002344811 A JP 2002344811A JP 2002344811 A JP2002344811 A JP 2002344811A JP 4120371 B2 JP4120371 B2 JP 4120371B2
Authority
JP
Japan
Prior art keywords
operation data
event
data
computer
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002344811A
Other languages
English (en)
Other versions
JP2004178336A (ja
Inventor
裕教 江丸
平田  俊明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002344811A priority Critical patent/JP4120371B2/ja
Priority to US10/660,300 priority patent/US7680921B2/en
Publication of JP2004178336A publication Critical patent/JP2004178336A/ja
Application granted granted Critical
Publication of JP4120371B2 publication Critical patent/JP4120371B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、運用管理システムにおいて稼動データを採取し、障害解析を実施する技術に関する。特に、発生するイベントに応じて、障害解析に必要な稼動データを特定する技術に関する。
【0002】
【従来の技術】
一般に、運用管理ツールが扱うデータには、稼動データと、イベントとがある。
【0003】
稼動データとは、採取する監視ポイント、監視する時間などを決めて、監視対象から採取するデータをいい、イベントとは、監視対象において障害が発生、性能が低下などの事象が発生したときに、その事象の発生を管理装置へ通知するために使用されるデータをいう。
【0004】
従来技術では、採取した稼動データは、テキストやデータベースといった形式で永続的な2次記憶装置に保存することにより、稼動情報を時系列に集約して蓄積する技術がある(例えば、特許文献1)。また、イベントが発生したことをあらかじめ登録しておいたメールアドレスにメールすることにより、イベントの発生に伴い、自動的にあらかじめ登録しておいた処理を行う技術もある(例えば、特許文献2)。
【0005】
【特許文献1】
特開平5−134902号公報
【特許文献2】
特開平11−45195号公報
【0006】
【発明が解決しようとする課題】
従来技術では、稼動データとイベントとが別々に保存されるものである。従って、どの時刻に障害が発生したかを知るためには、個々にイベントのログを見なければならなかった。また、そのイベントが稼動データにどのように現れているのかのマッピングをとるのが困難であった。さらに、障害解析を行う場合、稼動データの大部分は定常時のデータであるが故に、大量の稼動データから少数の障害時のデータを抽出する作業を行わなくてはならなかった。
【0007】
一方、稼動データは、定期的に採取しておかなくてはならないため、それらを格納しておくために大容量のファイル装置を必要としていた。
【0008】
本発明の目的は、運用管理システムにおいて、必要な記憶装置容量の資源を抑えつつ、障害解析に必要なデータを効率的に抽出することである。
【0009】
【課題を解決するための手段】
本発明の一実施形態の運用管理システムは、管理計算機と、管理計算機により管理される監視対象計算機とを有する。ここで、管理計算機は、監視対象計算機内部の監視対象の稼動データを受信する通信装置と、稼動データと前記監視対象の障害発生又は性能低下を示すためのイベントに関する情報とに基づいて、障害解析に必要な前記稼動データを特定し、障害解析を実施するプロセッサとを有する。
【0010】
また、上述した実施形態において、監視対象計算機は、装置内部の監視対象から稼動データを取得し、稼動データが所定の基準を満たすことを示すためのイベントに関する情報を発生させるプロセッサと、稼動データと前記イベントに関する情報とに基づいて、障害解析に必要な前記稼動データを特定し、特定した稼動データを前記管理計算機へ送信する通信装置とを有するようにしてもよい。
【0011】
また、上記実施形態において、イベントに関する情報には、イベントの発生の有無を示す情報、イベントを発生させた監視対象計算機が前記稼動データを採取した計算機かどうかを示すホスト情報、イベントの発生時刻を示す情報のうち少なくとも1つを含むようにしてもよい。
【0012】
また、上記実施形態において、管理計算機は、さらに、格納バッファと、データ格納部とを有してもよい。ここで、管理計算機のプロセッサは、監視対象計算機からの稼動データを前記格納バッファに格納し、イベントに関する情報を受けたときに、格納バッファに、イベントに関する情報の全部あるいは一部を格納バッファに格納された稼動データに関連付けて格納し、稼動データとイベントに関する情報とを、格納バッファから前記データ格納部へ書き込むようにしてもよい。ここで、管理計算機のプロセッサは、別の実施例として、イベントに関する情報に基づいて、格納バッファからデータ格納部へ書き込む稼動データを決定し、特定された稼動データを前記データ格納部へ書き込み、稼動データに基づいて障害解析を実施するようにしてもよい。
【0013】
【発明の実施の形態】
(1)第1の実施形態
図1は、本実施形態の稼動データ収集方法を実現する計算機システムの構成図である。
【0014】
本計算機システムは、収集した稼動データ及びイベントの処理ならびに2次記憶装置への永続化を行うプログラムである計算モジュール1101を搭載する計算機1203、稼動データ、イベントを取得する対象である監視対象を実行する計算機1201、1202、及び計算機間を接続するLAN1210からなる。
【0015】
計算機1201は、監視対象を含む対象計算機であって、記憶装置1501、CPU1502、メモリ1503、表示装置1504、キーボード、マウスなどの入力装置1505及びLAN1210に接続するための通信装置1506を有する。これら構成はバスによって接続される。
【0016】
記憶装置には、監視対象であるプログラム1001、1002とイベント発生モジュールとして機能するプログラム1102および稼動データ採取モジュールとして機能するプログラム1104が格納されている。CPUは、記憶装置からメモリにロードしたプログラムを実行する。表示部は、監視対象のプログラムの実行結果を表示する。入力装置は、監視対象のプログラムに対して指示するための入力データを受付ける。
【0017】
本実施形態では、監視の対象となる計算機は2台であるが、その台数に制限はない。
【0018】
イベント発生モジュール1102、1103は、監視対象を監視し、定められた条件にしたがってイベントを発生させ、LAN1210を介して計算モジュール1101へと転送するプログラムである。イベント発生条件の例として、監視対象における障害の発生や、レスポンス時間、メモリ量など監視している値の閾値のオーバなどが挙げられる。
【0019】
稼動データ採取モジュール1104、1105は、監視対象を監視し、計算モジュール1101から指示を受け、必要に応じて稼動データの採取を行い、採取した稼動データをLAN1210を介して計算モジュール1101へと転送するプログラムである。
【0020】
監視対象1001〜1003は、障害の発生や、レスポンス時間、メモリ量などを監視される対象をいう。なお、本実施形態の図では、監視対象としてプログラムの例であるが、メモリ、入力装置、通信装置、CPU、表示装置等の計算機を構成するハードウェアも監視対象とすることが可能である。
【0021】
また、計算機1201の代わりに記憶装置(たとえば、RAID装置等)をネットワーク(SAN)を介して計算機1203により管理する場合、記憶装置の特性(たとえば、記憶領域の性能特性等)を本実施形態の稼動データとしてもよい。RAID装置1204はこの例であって、記憶装置1801、RAIDコントローラ1082、ROM1810及びSAN1220に接続するための通信装置1806を有する。これら構成はバスによって接続される。ROM1810には、イベント発生モジュールとして機能するプログラム1109および稼動データ採取モジュールとして機能するプログラム1108が格納されている。RAIDコントローラ1802は、記憶装置からメモリにロードしたプログラムの実行及びRAID装置の制御を行う。なお、稼動データ取得手段1108及びイベント発生手段1109は記憶装置1801に配置されていても本発明の実施は可能である。
【0022】
計算機1203は、対象計算機1201、1202を監視する監視計算機であって、記憶装置1701、CPU1702、メモリ1703、表示装置1704、キーボード、マウスなどの入力装置1705及びLAN1210に接続するための通信装置1706を有する。これら構成はバスによって接続される。
【0023】
記憶装置には、計算モジュールとして機能するプログラム1101およびデータ格納領域1710が格納されている。CPUは、記憶部からメモリにロードした計算モジュール1101を実行する。格納バッファ1706及びデータ格納領域1710には、CPUにより稼動データが保存される。メモリの格納バッファには、一定個数の稼動データを一時的に時系列順にバッファリングした後、一定個数ごとに記憶装置のデータ格納領域に格納される。表示装置1301は、障害解析を行うために必要な情報を出力する。記憶装置1701は、障害解析に必要な稼動データを格納する。入力装置は、計算モジュールに対する指示を行うために、管理者からの入力値を受付ける。
【0025】
また、計算モジュール1101、イベント発生モジュール1102、1103、及び稼動データ採取モジュール1104、1105は、計算機1201、1202、1203により読み取り可能なプログラムとして格納する記憶媒体を作成してもよい。各々の計算機に配置されるプログラム部分である計算モジュール1101、イベント発生モジュール1102、1103、及び稼動データ採取モジュール1104、1105は、他の計算機等からネットワークを経由して計算機1201、1202、1203の記憶装置へ転送し、その計算機のメモリにロードしてその計算機のCPUによって実行することが出来る。
【0026】
図2は、第1の実施形態の計算モジュール1101の処理の概略手順を示す図である。
【0027】
ステップ2105において、計算モジュール1101は、稼動データ採取モジュールから稼動データを取得する。
【0028】
ステップ2110において、取得した稼動データを、格納バッファに1106に格納する。
【0029】
ステップ2115において、計算モジュール1101は、イベント発生モジュールからのイベントの到着の有無をチェックする。
【0030】
ステップ2120において、ステップ2115においてイベントが到着していない場合、計算機モジュール1101は、格納バッファが全て稼動データで満たされているかをチェックする。
【0031】
格納バッファに空きがある場合、ステップ2120において、ステップ2105に戻る。
【0032】
格納バッファが全て稼動データで満たされている場合、ステップ2125において、計算モジュール1101は、格納バッファ内に格納されている全ての稼動データを記憶装置1701のデータ格納領域1710に格納する。
【0033】
ステップ2115においてイベントが到着している場合、ステップ2130において、計算モジュール1101は、格納バッファ内に格納されている稼動データにイベント種別の付与を行う。ここで、イベント種別を付与する稼動データは、格納バッファに格納されている全ての稼動データであってもよいが、障害解析を行うために必要な範囲であればよい。
【0034】
ステップ2135において、計算モジュール1101は、イベント種別の付与した稼動データを記憶装置1701のデータ格納領域1710に格納する。
【0035】
ステップ2140において、計算モジュール1101は、ステップ2125、2135において稼動データを記憶装置に格納した後、格納バッファに格納されている稼動データを消去することにより、格納バッファの初期化を行う。ここで、格納バッファから消去する格納データは、全部であってもよいし、後述するようにその一部であってもよい。
【0036】
ステップ2145において、計算モジュール1101は、入力装置からの稼動データ収集停止指示があるか否かをチェックする。停止指示があれば終了し、なければステップ2105に戻る。
【0037】
図3は、計算機1203のメモリ上の稼動データを格納するためのバッファの構成図である。
【0038】
格納バッファ3100は、3001から3006までの6つの稼動データフィールドから構成される。計算モジュールは、稼動データ採取モジュールから取得した稼動データを、稼動データフィールドに格納する。なお、図3では格納バッファを構成する稼動データフィールドの数は6個であるが、この個数は6個に限定されない。
【0039】
図4は、格納バッファ3100を構成する稼動データフィールドの構成図である。
【0040】
稼動データフィールド4100は、時刻フィールド4001、ホストフィールド4002、稼動データ送出元フィールド4003、性能データフィールド4004、およびイベントフィールド4005とを有する。
【0041】
時刻フィールド4001には、取得した稼動データの取得時刻が格納される。
【0042】
ホストフィールド4002には、取得した稼動データを発生させたホスト計算機1201、1202のIDが格納される。なお、ホストフィールド4002には、監視対象単位、プロセス単位でそのIDを格納してもよい。
【0043】
稼動データ送出元フィールド4003には、取得した稼動データがどこから得られたものであるかを表す値が格納される。例えば、稼動データがプロセスより得られたものである場合、このフィールドにはプロセス名もしくはプロセスIDが格納される。
【0044】
性能データフィールド4004には、稼動データ採取モジュールから取得した稼動データが格納される。ここで、稼動データとは、「システムの使われ方」「システムの特性」「プログラムの特性」などを複合的に反映したデータであって、たとえばメモリ使用量、CPU使用時間、レスポンスタイムといった稼動情報を表す値がある。従って、複数の稼動データに基づいて、監視対象の特性が明らかになる場合もある。たとえば、監視対象をプログラムとした場合、リクエストをスレッドが処理するアプリケーションサーバでは、リクエストごとにスレッドを生成していたのではコストがかかるため、一般にスレッドをプールして利用する。ここで、1) レスポンスタイムと 2) スレッドの生成/消失 を稼動データとして採取することにより、レスポンスタイムが遅く、かつリクエストごとにスレッドの生成/消失が行われているようであれば、そのプログラムはコネクションプーリングを使用していないことから、コネクションの生成効率の悪いプログラムであるといったとプログラムの特性が明らかになる。
【0045】
イベントフィールド4005には、計算モジュール1101がイベント発生モジュールから受け取ったイベントの種別を格納する。即ち、図2のステップ2135において説明したように、計算モジュール1101は、稼動データ格納バッファに格納されている稼動データのイベントフィールドに、イベント発生モジュールから受け取ったイベントのイベント種別を書き込んだ後に、稼動データの記憶装置への格納を行う。ここで、イベントとは、メモリ使用量、CPU使用時間、レスポンスタイム等の稼動データが所定の基準を満たした場合に、発生する情報であって、たとえば、障害発生、CPUの性能低下、メモリ不足等がある。
【0046】
なお、本実施形態では、イベントフィールドは、必ずしも格納バッファ上に配置しなくてもよい。この場合、稼動データが記憶装置に格納されるときに、イベントフィールドにイベントの種別を付与するようにしてもよい。即ち、図2のステップ2125および2135において、計算モジュールは、稼動データを記憶装置に格納するときに、データ格納領域に稼動データフィールドを設け、ステップ2135において、稼動データに対応するイベントフィールドにイベントの種類を付与する。ステップ2125もしくはステップ2135の処理により、記憶装置1701には、イベントが発生時に稼動データ格納バッファに格納されていた稼動データのイベントフィールドに、稼動データに対応するイベント種別が格納される。
【0047】
また、計算モジュール1101は、イベント発生後の一定期間の稼動データのみを稼動データ採取モジュールから取得し、格納バッファに格納するようにしてもよい。
【0048】
以上本実施形態により、記憶装置1701に格納されている稼動データを利用して障害解析を行う場合、以下のような効果が得られる。
【0049】
解析すべき稼動データは、稼動データの中からイベントフィールドにイベント種別が書き込まれたものに限定することができるため、障害解析のオーバヘッドが軽減することができる。また、解析すべき稼動データを、特定のイベントの種別に対応するものに限定することにより、更に、障害解析のオーバヘッドが軽減することができる。
(2)第2の実施形態
第1の実施形態では、1つのイベントに対してイベント種別が付与される稼動データの数が、0から格納バッファの個数の間で可変であり、その個数はイベント発生モジュールがイベントを発生させるタイミングによって決定される。したがって、稼動データを記憶装置に格納した直後にイベントが発生すると、そのイベント種別が付与される稼動データは1つしかないことになる。このように実施の形態1には、イベント種別が付与される稼動データの数が1から格納バッファの個数の間で可変であり、その数がタイミング次第であるという問題点がある。
【0050】
本実施形態では、その欠点を補うため、稼動データ格納バッファを論理的に2分割することにより、イベント種別が付与される稼動データの数が一定個数以上になるようにする。以下に、図1で示される計算機システムにおける実施の形態から、図2に示される計算モジュールの処理の概略手順を用いて、本発明の特徴を説明する。
【0051】
ステップ2115までは実施の形態1と同様である。
【0052】
ステップ2125において、ステップ2120において格納バッファが全て稼動データで満たされている場合、計算モジュール1101は、稼動データを記憶装置へと格納するが、この際、全ての稼動データを記憶装置へと格納するのではなく、格納バッファの一部の稼動データのみを記憶装置へと格納し、残りの稼動データはメモリに保持したままとする。なお、実施の形態1で述べたとおり、格納バッファには時系列に稼動データが収められるものとし、古い稼動データから順に記憶装置へと格納し、メモリに残すデータは新しいものから順に残るようにする。
【0053】
引き続いて実行されるステップ2140において、計算モジュール1101は、記憶装置に格納された稼動データを消去し、それ以外のメモリ上に残された稼動データを配置し直す。
【0054】
ステップ2115において、イベントがあった場合の処理は、上記した実施形態1と同様であり、ステップ2140において、全ての稼動データをメモリ上から消去する。
【0055】
図5は、本実施形態における計算機1203のメモリ上に確保された稼動データ格納バッファを表す図である。
【0056】
格納バッファ5100は、5001から5006までの6つの稼動データフィールドから構成される。稼動データ採取モジュールから取得した1つの稼動データが、1つの稼動データフィールドに収められる。なお、図5では格納バッファを構成する稼動データフィールドの数は6個であるが、この個数は6個に限定されない。
【0057】
ここで、稼動データ格納バッファを3つずつに2分割する。5001から5003までの3つの稼動データ格納フィールド5200を格納対象フィールドと呼ぶ。なお、稼動データ格納フィールドを、2分割3つを1グループとして格納対象フィールドとしているが、格納対象フィールドを構成する稼動データ格納フィールドの数及び分割数はこれらに限定されない。
【0058】
図5のケースでは、格納バッファ5100の全てのバッファに稼動データが入っているため、ステップ2125において稼動データの記憶装置への格納を行うが、格納対象フィールドである5001から5003まで3つの稼動データのみを記憶装置に格納し、残りの5004から5006に格納されている稼動データは、ステップ2140において格納バッファ5001から5003までに配置しなおす。該処理を行った後の稼動データフィールドが図6の6100である。こうすることにより、イベントが発生した際に格納バッファ内に最低でも4つの稼動データが入っていることになる。
【0059】
なお、本実施の形態を持ってしても、イベントが連続して発生するようなケースでは、2回目以降のイベントに対しは一定個数以上のデータにイベント種別が付与されることは保証されない。その場合には、格納バッファをN分割することによって、連続するN回までのイベントに対応することが可能である。ただし、同時に多イベントが発生する場合、一般にそれらのイベントは同一の障害に基づくものと考えられるため、格納バッファを2分割することで実用上は充分であろう。
(3)第3の実施形態
第1の実施形態、第2の実施形態では、イベントの発生有無に関わらず全ての稼動データが記憶装置に格納される。収集した稼動データの用途として、障害解析やキャパシティプランニングなどが考えられるが、稼動データの用途が障害解析だけにある場合、イベントと関連付けられない稼動データは不要である。そこで、本実施の形態では、障害解析には必要のない稼動データを記憶装置に格納しないことにより、障害解析の効率向上と、記憶装置容量の削減を実現する。
【0060】
図7は、本実施形態における計算モジュールの処理の概略手順を説明する。
【0061】
図7に示される計算モジュールの処理の概略手順7001と、図2に示される計算モジュールの処理の概略手順2001との違いは、格納バッファがすべて稼動データで満たされているときに、それらの稼動データを記憶装置へ格納するステップ2125の有無のみである。すなわち、稼動データ採取モジュールが採取した稼動データは、計算モジュール1101によって格納バッファに一時的に収められるが、格納バッファが満たされるまでの間にイベントが発生しなければ、記憶装置1701に格納することなく消去する。こうすることにより、記憶装置1701に格納される稼動データは、イベントフィールドにイベントが設定されたもののみとなる。なお、特に特定のイベントの種類に関する稼動データのみを格納するようにしてもよい。
【0062】
本実施形態により、イベントと関連付けられた稼動データのみを、記憶装置に格納することが可能となり、障害解析の効率向上と、記憶装置容量の削減が実現される。
(4)第4の実施形態
第3の実施形態では、イベントが発生した際に、格納バッファに格納されている全ての稼動データのイベントフィールドに該イベントのイベント種別を書き込む。しかし、障害解析を行う際には、イベントの発生元である計算機から収集した稼動データのみが必要であるというケースも少なくない。そこで本実施の形態では、イベント発生時に該イベントのイベント種別を書き込み、記憶装置へと格納する稼動データを、イベントの発生元である計算機から収集した稼動データに限定することによって、障害解析の効率向上を実現する。
【0063】
図8は、本実施形態における計算モジュールの処理の概略手順を説明する。
【0064】
図8に示される計算モジュールの処理の概略手順8001と、図7に示される計算モジュールの処理の概略手順7001との違いは、計算モジュール1101が格納バッファに格納されている稼動データのイベントフィールドへのイベント種別設定を行うステップ8130と、計算モジュール1101が格納バッファに格納されている稼動データの記憶装置への永続化を行うステップ8135である。
【0065】
ステップ8130では、計算モジュール1101がイベントの送信元ホストと、格納バッファに格納されている稼動データの稼動データ送出元フィールドとを比較し、この2つが同じであれば、稼動データはイベント送信元ホストと同じホストから収集された稼動データであることがわかるため、稼動データのイベントフィールドに対し、イベントのイベント種別を書き込む。異なるホストであれば、何も行わない。ステップ8135では、計算モジュール1101が格納バッファに格納されている稼動データの中から、イベントフィールドにイベント種別が書き込まれたもののみを選択し、記憶装置への格納を行う。他のステップにおける 処理は図7に示される計算モジュールの処理の概略手順7001と同様である。
【0066】
本実施の形態により、記憶装置に格納する稼動データを、イベント発生時にイベントの発生元である計算機から収集した稼動データに限定することが可能となり、障害解析の効率向上と、記憶装置容量の削減が実現される。
【0067】
なお、本実施の形態で示した、イベント発生時に、イベント種別を書き込む稼動データをイベントの発生元である計算機から収集した稼動データに限定する方法を、実施の形態1に適用することも可能である。この場合、全ての稼動データが記憶装置に格納されるが、その中でイベントフィールドにイベント種別が書き込まれるのは、格納バッファに収められているときに、イベントが発生し、そのイベントのイベント送信元ホストと同じホストから収集された稼動データに限定される。これにより、障害解析の効率向上が実現される。
【0068】
【発明の効果】
本発明によれば、運用管理システムにおいて、必要な記憶装置容量の資源を抑えつつ、障害解析に必要なデータを効率的に抽出することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1におけるシステムの構成図である。
【図2】本発明の実施の形態1における計算モジュールの全体フロー図である。
【図3】本発明の実施の形態1における稼動データ格納バッファの具体例である。
【図4】本発明の実施の形態1における稼動データフィールドの具体例である。
【図5】本発明の実施の形態2における稼動データ格納バッファの具体例である。
【図6】本発明の実施の形態2における稼動データ格納バッファの具体例である。
【図7】本発明の実施の形態3における計算モジュールの全体フロー図である。
【図8】本発明の実施の形態4における計算モジュールの全体フロー図である。
【符号の説明】
1001〜1003…監視対象、1201〜1203…計算機、1101…計算モジュール、1102〜1103…イベント発生モジュール、1104〜1105…稼動データ採取モジュール、1210…LAN

Claims (2)

  1. 管理計算機と、前記管理計算機にネットワークを介して接続され、前記管理計算機により管理される監視対象計算機とを有する運用管理システムであって、
    前記監視対象計算機は、
    前記監視対象計算機内部の監視対象と、
    前記監視対象の稼動データを定期的に採取する手段と、
    前記稼動データが定められた条件を満足した場合に発生する情報であるイベントを発生する手段と、および、
    前記定期的に採取した稼動データと前記発生手段が発生したイベントとを前記管理計算機へ前記ネットワークを介して通信する通信装置と、を有し、
    前記管理計算機は、
    複数の稼動データを時系列に格納し、且つ2分割されているメモリである格納バッファと、
    前記監視対象計算機の通信装置から前記定期的に採取された稼動データを受信し、また、前記発生したイベントを受信する前記管理計算機の通信装置と、
    前記管理計算機の通信装置により前記定期的に採取された稼動データを受信した場合、前記受信した前記稼動データを前記格納バッファに格納する手段と、
    データを格納する記憶装置と、
    前記管理計算機の通信装置により前記発生したイベントを受信した場合、前記格納バッファに格納されている全ての前記稼動データと前記受信したイベントとを対応付けて前記記憶装置に格納し、かつ、前記格納バッファ内の全ての稼動データを削除する手段と、
    前記格納バッファが前記稼動データで満杯になった場合に、前記2分割されている格納バッファのうちの時間的に古い分割部分に格納されている稼動データを前記記憶装置に格納し、その後、前記古い分割部分に格納されている稼動データを格納バッファから削除する手段と、
    および、
    前記記憶装置に格納された前記発生したイベントと対応付けられた稼動データを解析する手段
    を有することを特徴とする運用管理システム。
  2. 請求項1記載の運用管理システムであって、
    前記定められた条件は、前記監視対象の障害発生又は性能低下を示すものであることを特徴とする運用管理システム。
JP2002344811A 2002-11-28 2002-11-28 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム Expired - Fee Related JP4120371B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002344811A JP4120371B2 (ja) 2002-11-28 2002-11-28 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム
US10/660,300 US7680921B2 (en) 2002-11-28 2003-09-10 Management system, management computer, managed computer, management method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002344811A JP4120371B2 (ja) 2002-11-28 2002-11-28 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2004178336A JP2004178336A (ja) 2004-06-24
JP4120371B2 true JP4120371B2 (ja) 2008-07-16

Family

ID=32375969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002344811A Expired - Fee Related JP4120371B2 (ja) 2002-11-28 2002-11-28 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム

Country Status (2)

Country Link
US (1) US7680921B2 (ja)
JP (1) JP4120371B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050066027A1 (en) * 2003-09-22 2005-03-24 International Business Machines Corporation Method of displaying events
JP2007257475A (ja) * 2006-03-24 2007-10-04 Seiko Epson Corp 情報処理システム、クライアント装置制御方法をコンピュータに実行させるためのプログラム
US8086905B2 (en) 2008-05-27 2011-12-27 Hitachi, Ltd. Method of collecting information in system network
US8677018B2 (en) * 2008-08-25 2014-03-18 Google Inc. Parallel, side-effect based DNS pre-caching
US9197486B2 (en) 2008-08-29 2015-11-24 Google Inc. Adaptive accelerated application startup
US9225794B2 (en) 2009-03-31 2015-12-29 Google Inc. Adaptive DNS pre-resolution
US8156212B2 (en) * 2009-06-16 2012-04-10 JumpSoft, Inc. Method, system and apparatus for managing computer processes
JP7036106B2 (ja) 2017-02-22 2022-03-15 日本電気株式会社 情報処理装置、情報処理システム、監視方法、及び、プログラム
WO2018225115A1 (ja) * 2017-06-05 2018-12-13 株式会社日立製作所 運用支援システム及び方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0740235B2 (ja) 1986-09-29 1995-05-01 日本電気株式会社 トレ−ス情報の収集方式
JPH05134902A (ja) 1991-11-15 1993-06-01 Hitachi Ltd 分散コンピユーテイングシステムでの稼動情報管理方式
JP2871923B2 (ja) 1991-12-16 1999-03-17 日本電気株式会社 アラーム情報収集方式
US6714976B1 (en) * 1997-03-20 2004-03-30 Concord Communications, Inc. Systems and methods for monitoring distributed applications using diagnostic information
JPH1145195A (ja) 1997-07-28 1999-02-16 N T T Data:Kk コンピュータシステム、異常検出装置及び記録媒体
GB2372667B (en) * 2001-02-21 2003-05-07 3Com Corp Apparatus and method for providing improved stress thresholds in network management systems
GB2372673B (en) * 2001-02-27 2003-05-28 3Com Corp Apparatus and method for processing data relating to events on a network
US6643613B2 (en) * 2001-07-03 2003-11-04 Altaworks Corporation System and method for monitoring performance metrics

Also Published As

Publication number Publication date
US7680921B2 (en) 2010-03-16
US20040107278A1 (en) 2004-06-03
JP2004178336A (ja) 2004-06-24

Similar Documents

Publication Publication Date Title
JP7325584B2 (ja) アラームログ圧縮方法、装置、およびシステム、並びに記憶媒体
US20100011026A1 (en) Method and system for dynamically collecting data for checkpoint tuning and reduce recovery time
US7552115B2 (en) Method and system for efficient generation of storage reports
US9389916B1 (en) Job scheduling management
US7721290B2 (en) Job scheduling management method using system resources, and a system and recording medium for implementing the method
JP4560367B2 (ja) ストレージネットワーク性能情報の収集・保存方法及び計算機システム並びにプログラム
US8886610B2 (en) Backup simulation for backing up filesystems to a storage device
US6996807B1 (en) Consolidation and reduction of usage data
US7653714B2 (en) Computer-readable recording medium with system managing program recorded therein, system managing method and system managing apparatus
US8024296B1 (en) Method and apparatus for agent-less auditing of server
CN109710615B (zh) 数据库的访问管理方法、系统、电子设备和存储介质
US8521692B1 (en) Storage system and method for controlling storage system
WO2003073203A2 (en) System and method for analyzing input/output activity on local attached storage
US7546220B1 (en) System and method for preparing trace data for analysis
EP2424190B1 (en) Monitoring connections
JP4120371B2 (ja) 運用管理システム、管理計算機、監視対象計算機、運用管理方法及びプログラム
US7506117B2 (en) Data recovery method for computer system
CN102893261B (zh) 空闲转换采样方法及其系统
CN111367760A (zh) 日志采集方法及装置、计算机设备、存储介质
CN113010289A (zh) 一种任务调度方法、装置和系统
US7680983B2 (en) Method of restoring data by CDP utilizing file system information
CN111290942A (zh) 压力测试方法、装置以及计算机可读介质
US7039707B2 (en) Disk subsystem, computer system, storage managing method and program
CN115016890A (zh) 虚拟机资源分配方法、装置、电子设备及存储介质
CN111143177B (zh) Ibm主机的rmf iii数据的收集方法、系统、装置及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050412

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080401

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080414

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees