JP6002856B2 - 監視システム、及び、監視方法 - Google Patents

監視システム、及び、監視方法 Download PDF

Info

Publication number
JP6002856B2
JP6002856B2 JP2015546237A JP2015546237A JP6002856B2 JP 6002856 B2 JP6002856 B2 JP 6002856B2 JP 2015546237 A JP2015546237 A JP 2015546237A JP 2015546237 A JP2015546237 A JP 2015546237A JP 6002856 B2 JP6002856 B2 JP 6002856B2
Authority
JP
Japan
Prior art keywords
time
failure
screen
occurred
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015546237A
Other languages
English (en)
Other versions
JPWO2015068275A1 (ja
Inventor
中島 勝己
勝己 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of JP6002856B2 publication Critical patent/JP6002856B2/ja
Publication of JPWO2015068275A1 publication Critical patent/JPWO2015068275A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)

Description

本発明は、監視システムに関する。
企業によるビジネスを支えるシステムが大規模化及び複雑化するに伴い、システムの安定稼働を支えるため、システムの稼働情報及び性能情報などを管理する運用管理システムのニーズが高まっている。多くの運用管理製品は、ユーザーに、イベントの発生時期及び発生順序を把握させるため、イベントを時系列に一覧で表示するイベントコンソールを提供する。
また、多くの運用管理製品は、視覚的に障害の発生状況を把握させるために、システムが備える被監視装置の位置を示すマップを監視画面に表示し、被監視装置の障害発生時に警告色を表示することによって、障害を効率的に検知させる。
従来、ネットワークに散在する各サイト及び各サイトに設置された機器のいずれかに障害が発生した場合、その障害内容に応じた情報が収集され、モニター画面の該当する図形の表示色を変更する技術が提案されている(例えば、特許文献1参照)。さらに、特許文献1の技術は、ユーザーが、警告を受ける必要のない軽度のエラーの種類を適宜に指定でき、システムの構成に応じて警告又は非警告の組み合わせを柔軟に設定することができる技術である。
特開2004−078369号公報
特許文献1の技術を用いるシステムにおいて、大規模システムにおいて障害イベントが多数発生し、障害への対処が追いつかない場合、モニター画面は、常に被監視装置の障害を示す警告色を表示する。このため、ユーザーは、モニター画面から、障害が発生した被監視装置の位置を把握できるが、複数の障害イベントの発生時期、発生順序及び発生件数、並びに、障害イベントへの対処の緊急度等の障害の発生状況を正確に把握できない。
また、障害イベントを列挙して表示する従来のイベントコンソールを用いて監視した場合、ユーザーは、イベントの発生時期及び発生順序を把握できるが、各被監視装置の位置を、視覚を通じて把握することができない。
本発明の目的は、被監視装置の位置情報と、障害の発生状況とを適切に表示する監視システムの提供である。
本発明の代表的な一形態によると、監視システムであって、計算機に接続するネットワークインタフェースと、指定期間の終了時刻を受け付ける入力インタフェースと、前記計算機において発生した障害を画面に表示する位置を示す位置情報と、前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する画面生成部と、前記生成された画面を表示する表示部と、を有する。
本発明の一実施形態によると、被監視装置の位置情報と、障害の発生状況とを適切に表示できる。
上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。
本実施例1の計算機システムの構成を示すブロック図である。 本実施例1の監視装置の構成を示すブロック図である。 本実施例1の指定期間における任意の時刻の障害の発生状況を表示した画面を示す説明図である。 本実施例1のイベント情報を示す説明図である。 本実施例1の被監視装置の表示用情報を示す説明図である。 本実施例1の表示画面情報を示す説明図である。 本実施例1のイベントマッピング情報を示す説明図である。 本実施例1の画面生成サブプログラムによる処理の前半を示すフローチャートである。 本実施例1の画面生成サブプログラムによる処理の後半を示すフローチャートである。 本実施例1の表示用サブプログラムの処理を示すフローチャートである。 本実施例2の監視装置の構成を示すブロック図である。 本実施例2の任意の指定期間における障害の発生状況を表示した画面を示す説明図である。 本実施例2の被監視装置の障害レベルを示す図形を示す説明図である。 本実施例2の障害レベルルール情報を示す説明図である。 本実施例2の対処時間レベルを示す説明図である。 本実施例2の最終対処日レベルを示す説明図である。 本実施例2のルール更新サブプログラムの処理を示すフローチャートである。 本実施例2の画面生成サブプログラムの処理を示すフローチャートである。 本実施例3の指定期間における障害の発生状況を表示する画面を示す説明図である。 本実施例3の画面生成サブプログラムの処理の前半を示すフローチャートである。 本実施例3の画面生成サブプログラムの処理の後半を示すフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。
実施例1の計算機システムは、指定された期間(以下、指定期間)において発生した障害を画面に表示する。そして、実施例1の計算機システムは、指定期間の終了時刻(時刻2)までに被監視装置において発生した障害の発生状況を、指定期間における時系列に、連続して表示する。
以下に具体的な内容について図を用いて説明する。
図1は、本実施例1の計算機システムの構成を示すブロック図である。
本実施例の計算機システムは、監視装置10、表示装置20、少なくとも一つの被監視装置30、ネットワーク40及びネットワーク50を有する。監視装置10は、ネットワーク50を介して被監視装置30と接続され、被監視装置30において発生する障害イベントを収集する。
表示装置20は、ネットワーク40を介して監視装置10と接続され、監視装置10によって検知された障害の発生状況(実施例1において、特に、発生を示す情報)を画面に表示する。実施例1の表示装置20は、監視装置10の物理的な位置又は役割を、ユーザーが視覚的に認識できるような画面を表示する。
監視装置10は、ネットワークアダプタ11、CPU12、記憶デバイス13及びネットワークアダプタ14を有する。ネットワークアダプタ11は、ネットワーク40と通信するためのネットワークインタフェースであり、ネットワークアダプタ14は、ネットワーク50と通信するためのネットワークインタフェースである。
CPU12は、演算装置である。記憶デバイス13は、メモリを含む。また、記憶デバイス13は、必要に応じてハードディスク等の補助記憶デバイスを含む。CPU12は、記憶デバイス13を用いてプログラムを実行する。
なお、監視装置10は、入出力デバイスを有してもよい。監視装置10が有する入出力デバイスは、例えば、ディスプレイ、キーボード、又は、ポインタデバイス等である。また、監視装置10は、シリアルインタフェース、又は、イーサーネットインタフェースを、入出力デバイスと接続するためのインタフェースとして有してもよい。
このような監視装置10のインタフェースは、ディスプレイ、キーボード又はポインタデバイスを有する表示用計算機と接続されてもよい。そして、監視装置10は、インタフェース及び表示用計算機を介してユーザーからの指示を受け付けてもよいし、ユーザーへの出力結果を表示用計算機に表示させてもよい。
表示装置20は、ネットワークアダプタ21、CPU22、記憶デバイス23及び入出力デバイス24を有する。ネットワークアダプタ21は、ネットワーク40と接続するためのネットワークインタフェースである。
CPU22は、演算装置である。記憶デバイス23は、メモリを含む。また、記憶デバイス23は、必要に応じてハードディスク等の補助記憶デバイスを含む。CPU22は、記憶デバイス23を用いてプログラムを実行する。
入出力デバイス24は、ユーザーからの指示を受け付ける入力デバイスと、ユーザーに障害の状況を表示する出力デバイスとを含む。入出力デバイス24は、例えば、キーボード、ポインタデバイス、及び、ディスプレイ等である。
被監視装置30は、例えば、負荷分散装置、Webサーバ、APサーバ、及び、DBサーバ等である。被監視装置30は、ネットワークアダプタ31、CPU32及び記憶デバイス33を有する。ネットワークアダプタ31は、ネットワーク50と接続するためのネットワークインタフェースである。
CPU32は、演算装置である。記憶デバイス33は、メモリを含む。また、記憶デバイス33は、必要に応じてハードディスク等の補助記憶デバイスを含む。CPU32は、記憶デバイス33を用いてプログラムを実行する。
以後、被監視装置30を監視し、本実施例の画面を表示する一つ以上の計算機の集合を監視システムと呼ぶ。監視装置10が、自らが有する入出力デバイスに画面を表示する場合、監視装置10が管理システムである。また、監視装置10と表示装置20との組み合わせも監視システムである。また、監視処理の高速化又は高信頼化のために複数の計算機によって、監視装置10を実装してもよく、この場合、当該複数の計算機(表示装置20が本実施例の画面を表示する場合、表示装置20も含め)が監視システムである。
図2は、本実施例1の監視装置10の構成を示すブロック図である。
監視装置10の記憶デバイス13は、イベント取得サブプログラム101、イベント更新サブプログラム102、画面生成サブプログラム103、表示用サブプログラム104及び構成情報サブプログラム105を、プログラムとして含む。また、記憶デバイス13は、イベント情報106、構成情報107、表示用情報108、表示画面情報109、及び、イベントマッピング情報110を、データとして含む。
イベント取得サブプログラム101は、被監視装置30において発生した障害イベントを検知し、ネットワークアダプタ14を介して障害イベントの情報を収集する。そして、イベント取得サブプログラム101は、収集された障害イベントを、イベント情報106に格納する。
イベント更新サブプログラム102は、ユーザーが障害イベントに対処した際に、障害イベントが対処済みであることを示す情報を、イベント情報106に格納する。
画面生成サブプログラム103は、障害イベントをユーザーに表示するための画面を生成する。表示用サブプログラム104は、画面生成サブプログラム103によって生成された画面を、表示装置20の入出力デバイス24に表示させる。
構成情報107は、少なくとも被監視装置30のホスト名及びIPアドレスを保持する。構成情報サブプログラム105は、少なくとも検知した障害イベントに含まれるIPアドレスをホスト名に変換するため、構成情報107からホスト名及びIPアドレスを取得する。記憶デバイス13が有するプログラムは、構成情報サブプログラム105を用いて被監視装置30のホスト名とIPアドレスとを変換することができる。
イベント情報106は、被監視装置30において発生する障害を示す障害イベントを保持する。イベント取得サブプログラム101は、発生した障害を示す障害イベントを被監視装置30から収集するために、構成情報107を用いる。
表示用情報108は、障害を表示する画面を生成するために必要な情報を保持する。表示画面情報109は、画面に表示する内容を保持する。イベントマッピング情報110は、障害イベントと被監視装置30とに従って定められる、画面の停止時間を示す。
図3は、本実施例1の指定期間における任意の時刻の障害の発生状況を表示した画面300を示す説明図である。
画面300a〜画面300cは、負荷分散装置、Webサーバ、APサーバ、及び、DBサーバの障害の発生状況を表示する。しかし、本実施例の画面は、これらの装置以外のいかなる被監視装置30の障害の発生状況を表示してもよい。
また、表示用サブプログラム104は、画面300a〜画面300cにおけるレイアウト、及び、被監視装置30が表示される位置を、ユーザーの指示に従って変更してもよい。
さらに、画面300a〜画面300cは、表示する障害の発生状況に関する時間を入力するためのスクロールバー301を表示する。スクロールバー301は、時間軸を示す。ユーザーは、スクロールバー301を操作することによって、表示する障害の発生状況に関する情報を、監視装置10に入力する。
具体的には、ユーザーがスクロールバー301において、Replay start time(時刻1)及びReplay end time(時刻2)を指定し、Replay Button を押すことによって、ユーザーは、障害の発生状況を確認するためのアニメーションの再生を指示する。そして、表示用サブプログラム104は、指示に従って、画面300a、画面300b及び画面300cを連続して順に表示する。
スクロールバー301において時刻1及び時刻2を指定することによって、局所的な期間も含め、任意の期間における障害の発生及び対処状況を表示できる。
画面300a〜画面300cは、時刻1から時刻2までの任意の時刻(Point in time:時刻3)における、障害の発生状況を表示する。図3の画面300a〜画面300cは、障害イベントが発生した場合、被監視装置30を示す図形の周囲の一定の範囲に、障害イベントが発生したことを示す情報として、警告色を表示する。障害イベントが発生したことを示す情報は、ユーザーの注意をひくことができる方法であれば、円等の図形、文字、記号、模様又は色彩のいかなる方法によって表示されてもよい。
また、画面300a〜画面300cは、時刻3までに被監視装置30において発生した障害であり、かつ、現在時刻までに対処が済んでいない障害を示す情報(例えば、記号302H及び記号302I)を表示する。図3に示す画面300a〜画面300cは、時間が経過するにつれて、発生した障害が増えていく様子を表示する。
このため、表示用サブプログラム104が、時刻1から時刻2までの複数の時刻3における複数の画面300を、連続して順に表示することにより、ユーザーは、時刻1から時刻2までの障害の発生状況をアニメーションによって認識することができる。
このとき、画面300の再生中において、時刻3を示す情報(図3において黒い三角形)は、時刻1から時刻2までの間を移動する。
また、画面300は、緊急度の高い障害イベントの発生を示す場合、一定時間同じ画面を表示し続ける。すなわち、表示用サブプログラム104は、アニメーションを一時的に停止する。ユーザーは、アニメーションを停止させる時間を任意に指定する。なお、一時的にアニメーションを停止した場合、表示用サブプログラム104は、緊急度の高い障害を示す被監視装置の記号又は図形等を、強調して表示してもよい。
実施例1において、表示用サブプログラム104が、任意の時刻1から時刻2までの被監視装置30の障害の発生状況を画面に連続して表示させるため、被監視装置30において障害が発生したタイミングを容易に把握することができる。また、複数の被監視装置30において障害が発生した順序もユーザーは把握でき、根本的な原因を特定する際にも役立つ。
これは、例えば、ユーザーが実施例1の画面によって、障害が最初に発生した被監視装置30を特定し、さらに、最初の障害の影響によって他の被監視装置30において発生した障害を特定できるため、ユーザーは、障害の根本的な原因を特定できる。
さらに、実施例1の表示用サブプログラム104は、緊急度が高いイベントが発生した際、画面を一時的に停止させ、一つの画面を継続して表示させため、優先すべき被監視装置30の障害イベントを即時に把握させることができる。
図4は、本実施例1のイベント情報106を示す説明図である。
イベント情報106は、被監視装置30から収集された障害イベントを格納する。イベント情報106は、イベントID161、発生日時162、ホスト名163、対処状況164、及び、対処時間165を、少なくとも含む。
イベントID161は、発生した障害イベントが示す事象及び内容に従って予め定められた識別子である。発生日時162は、障害が発生した日時を示す。ホスト名163は、障害が発生した被監視装置30を示す。
対処状況164は、障害イベントが示す障害がユーザーによって対処済みであるか未対処であるかを示す。本実施例における未対処とは、対処が終了しておらず、障害が解決していないことである。また、本実施例における対処済みとは、対処が終了し、障害が解決したことを示す。
対処時間165は、障害イベントが発生してから障害イベントが示す障害の対処が終了するまでの時間を示す。
イベント取得サブプログラム101は、収集した障害イベントに基づいて、イベントID161、発生日時162、及び、ホスト名163を更新する。また、イベント更新サブプログラム102は、ユーザーからの入力に従って、対処状況164及び対処時間165を更新する。
図5は、本実施例1の被監視装置30の表示用情報108を示す説明図である。
表示用情報108は、表示装置20が出力する画面における、被監視装置30の位置を示す座標を格納する。表示用情報108は、ホスト名181、座標182及び更新日時183を含む。
ホスト名181は、被監視装置30を示し、イベント情報106のホスト名163に対応する。
座標182は、被監視装置30を示す情報が表示される、画面上の位置を示す。座標182は、ユーザーによって指定される。なお、表示装置20が有するプログラムは、複数の被監視装置30を一つの位置に表示しないように、ユーザーが座標を入力する際に入出力デバイス24に警告を出力してもよい。
更新日時183は、ユーザーが座標182を設定した日時を示す。
被監視装置30が削除された場合、又は、ユーザーが被監視装置30を画面300から除外する指示を監視装置10に入力した場合、監視装置10のプログラムは、図5に示す表示用情報108における、削除された又は除外される被監視装置30を示すエントリを削除する。
なお、被監視装置30を表示する位置が移動した場合、表示用情報108は、移動前と移動後の座標を保持してもよい。このため、表示用情報108は、一つの被監視装置30に対応づけられた複数の座標を示すエントリを含んでもよい。
図6は、本実施例1の表示画面情報109を示す説明図である。
表示画面情報109は、指定期間における任意の時刻における画面を表示するために必要な情報を格納する。画面生成サブプログラム103は、指定期間を受け付けた場合、表示画面情報109を生成する。表示画面情報109は、表示時刻191、表示情報192及び停止時間193を含む。
表示時刻191は、画面300に表示する障害の発生状況が実際に起こっている時刻を示す。実施例1の表示時刻191は、表示時刻191は、図3における時刻3に該当する。
表示情報192は、表示時刻191が示す時刻の画面に表示される内容を示す。具体的には、表示情報192は、被監視装置30に対応する情報が表示される位置と、被監視装置30において障害が発生した場合に障害を示す情報を表示するか否かとを示す。
なお、以下の説明において、被監視装置30が表示される位置と、当該被監視装置30において発生した障害が表示される位置とは、同じ場所である。障害が表示される位置が被監視装置30が表示される位置とは異なる場合、表示情報192は、被監視装置30が表示される位置を基準に、障害が表示される位置を求める方法を保持してもよい。
停止時間193は、画面を連続して表示する際に、表示時刻191が示す時刻の画面を表示し続けることによって、アニメーションを一時的に停止させる時間を示す。図6に示す停止時間193は、秒の単位で時間を示す。
なお、図6に示す停止時間193は、アニメーションを再生するために表示されることが必要な1画面あたりの最低限の時間に加算する時間を示す。このため、停止時間193は、「0秒」を示してもよい。
図7は、本実施例1のイベントマッピング情報110を示す説明図である。
イベントマッピング情報110は、アニメーションを停止させる必要がある障害イベントの条件と、アニメーションを停止させる時間とを示す。イベントマッピング情報110は、ユーザーによって設定される。イベントマッピング情報110は、イベントID111、ホスト名112及び停止時間113を含む。
イベントID111は、発生した障害イベントの事象及び内容に従って予め定められた識別子であり、イベント情報106のイベントID161に対応する。
ホスト名112は、被監視装置30を示す。ホスト名112は、イベント情報106のホスト名163及び表示用情報108のホスト名181に対応する。
停止時間113は、アニメーションを停止させる時間を示す。図7に示す停止時間113は、秒の単位で時間を示す。
図7に示すイベントマッピング情報110において、イベントID111とホスト名112に従って停止時間が定められるが、本実施例の停止時間は、これら以外によって定められてもよい。
図8Aは、本実施例1の画面生成サブプログラム103による処理の前半を示すフローチャートである。
ユーザーが表示装置20の入出力デバイス24を用いてReplay Start time及びReplay End timeを指定した場合、画面生成サブプログラム103は、Replay Start timeから時刻1を取得し、Replay End timeから時刻2を取得する(201)。
S201の後、画面生成サブプログラム103は、ユーザーが入出力デバイス24を用いて指定したサンプリング間隔を取得する(202)。ここで、本実施例のサンプリング間隔とは、指定期間において、画面を生成する時刻の間隔を示す。
サンプリング間隔が短い場合、指定期間における単位時間当たりに表示される画面300の数が多くなり、障害の発生状況の表示の精度が向上する。しかし、この場合、アニメーションを再生する際に必要な画面300の数が増えるため、画面300を生成するために必要な時間が増大する。
一方で、サンプリング間隔が長い場合、指定期間における単位時間当たりに表示される画面300の数は減少し、障害の発生状況の表示の精度は下がる。しかし、この場合、アニメーションを再生する際に必要な画面300の数が減少するため、画面300を生成するために必要な時間は減少する。
S202の後、画面生成サブプログラム103は、ループ処理Aを実行する。画面生成サブプログラム103は、ループ処理Aにおいて、サンプリング間隔ごとに、ループ処理B及びステップ212を実行する。
ループ処理Aの開始時において、画面生成サブプログラム103は、時刻1及びサンプリング間隔に基づいて時刻3を算出する(203)。時刻3は、初期値が時刻1である。画面生成サブプログラム103は、ループ処理Aを繰返し実行するごとに、時刻3にサンプリング間隔を加算する。
そして、画面生成サブプログラム103は、時刻3における画面300を、ループB及びステップ212によって生成する。そして、算出された時刻3が時刻2を超えた場合、画面生成サブプログラム103は、ループ処理Aを終了する。
ステップ203の後、画面生成サブプログラム103は、ループ処理Bにおいて、時刻3における画面に表示される被監視装置30の数を算出し、算出された被監視装置30の数分、ステップ205〜ステップ211の処理を繰り返す。
ループ処理Bの開始時に、画面生成サブプログラム103は、表示用情報108のエントリを、ホスト名181が示す被監視装置30の数を算出する。そして、画面生成サブプログラム103は、算出された数を、時刻3において画面に表示される被監視装置30の数として取得する(204)。
また、画面生成サブプログラム103は、ステップ204において、表示用情報108のホスト名181が示す被監視装置30のうち、ステップ205以降の処理が実行されていない一つの被監視装置30を、被監視装置Cとして選択する。
ステップ204の後、画面生成サブプログラム103は、時刻3における被監視装置Cの座標172を取得する(205)。すなわち、画面生成サブプログラム103は、被監視装置Cが時刻3において表示される位置の位置情報を取得する。
図8Bは、本実施例1の画面生成サブプログラム103による処理の後半を示すフローチャートである。
ステップ205の後、画面生成サブプログラム103は、イベント情報106の発生日時162及びホスト名163を参照し、時刻3までに被監視装置Cにおいて発生したすべての障害イベントを示すエントリを、イベント情報106から取得する(206)。
ステップ206の後、画面生成サブプログラム103は、ステップ206において取得したエントリのイベントID161とホスト名163とに一致する、イベントマッピング情報110のすべてのエントリを取得する(207)。
ステップ207の後、画面生成サブプログラム103は、ステップ206において取得した障害イベントのエントリのうち、対処状況164が未対処を示すエントリがあるか否かを判定する(208)。
対処状況164が未対処を示すエントリがある場合、画面生成サブプログラム103は、被監視装置Cに障害を示す警告色等の図形を表示するフラグを生成し、被監視装置Cに対応させて生成したフラグを保持する(209)。
ステップ209の後、画面生成サブプログラム103は、ステップ207において取得したイベントマッピング情報110のエントリから、未対処である障害イベントに該当するエントリを特定できるか否かを判定する(210)。
具体的には、画面生成サブプログラム103は、ステップ207において取得したイベントマッピング情報110のイベントID111及びホスト名112と、対処状況164が未対処を示すイベント情報106のエントリのイベントID161及びホスト名163とが一致する、イベントマッピング情報110のエントリを特定できるか否かを判定する。
ここで、画面生成サブプログラム103は、イベントID及びホスト名の少なくとも一つが一致しているエントリを特定してもよい。
そして、ステップ207において取得したイベントマッピング情報110のエントリから、未対処である障害イベントに該当するエントリを特定できた場合、画面生成サブプログラム103は、特定したイベントマッピング情報110のエントリの停止時間113を、時刻3における画面の被監視装置Cの停止時間として取得する(211)。
ステップ211において取得した停止時間113が複数である場合、画面生成サブプログラム103は、最も長い停止時間113を時刻3における画面の被監視装置Cの停止時間として取得する。
なお、停止時間113は0秒であってもよい。例えば、全ての未対処の障害イベントが、イベントマッピング情報110のイベントID111及びホスト名112が示す条件と一致しない場合、画面生成サブプログラム103は、停止時間を0秒に定めてもよい。
ステップ208において、ステップ206において取得した障害イベントのエントリのうち、対処状況164が未対処を示すエントリがないと判定された場合、ステップ210において、ステップ207において取得したイベントマッピング情報110のエントリから、未対処である障害イベントに該当するエントリを特定できない場合、又は、ステップ211の後、画面生成サブプログラム103は、ループ処理Bによって、ステップ204に戻る。
ループ処理Bによって、時刻3におけるすべての被監視装置30に、ステップ205〜ステップ211の処理を実行した後、画面生成サブプログラム103は、時刻3において表示する画面の情報を、表示画面情報109に格納する(212)。
具体的には、画面生成サブプログラム103は、表示時刻191に時刻3を格納する。また、画面生成サブプログラム103は、ステップ205において取得した被監視装置30の位置情報、及び、ステップ209において生成したフラグを、表示情報192に格納する。
また、画面生成サブプログラム103は、ステップ211において取得した、時刻3における画面の被監視装置Cの停止時間によって、停止時間193を更新する。しかし、画面生成サブプログラム103は、停止時間193に、既に被監視装置Cの停止時間よりも長い時間が格納されている場合、被監視装置Cの停止時間を停止時間193に格納しなくてもよい。
ステップ211の後、画面生成サブプログラム103は、ステップ203に戻る。そして、画面生成サブプログラム103は、ループ処理Aによって、指定期間に含まれるすべての時刻3に、ステップ204〜ステップ211の処理を実行する。ループ処理Aが終了した場合、画面生成サブプログラム103は、図8A及び図8Bに示す処理を終了する。
図8A及び図8Bに示す処理によって、指定期間において表示される画面を示す情報が表示画面情報109に格納される。
図9は、本実施例1の表示用サブプログラム104の処理を示すフローチャートである。
表示用サブプログラム104は、図8A及び図8Bに示す処理の後、図9に示す処理を実行する。また、表示用サブプログラム104は、図9に示す処理を、ユーザーの指示に従って、又は、定期的に実行してもよい。
表示用サブプログラム104は、まず、ユーザーによってあらかじめ指定された再生速度を、記憶デバイス13から取得する(221)。
ステップ221の後、表示用サブプログラム104は、取得した再生速度に従って、ループ処理Dを実行する。なお、ループ処理Dの開始時において、表示用サブプログラム104は、表示時刻191が早い順に表示画面情報109のエントリを選択する(222)。ここで選択されたエントリをエントリDと記載する。
表示用サブプログラム104は、表示画面情報109のエントリDを取得する(223)。ステップ223の後、表示用サブプログラム104は、エントリDの表示情報192に従って、エントリDの表示時刻191における画面を表示するための画面データを生成する。そして、表示用サブプログラム104は、生成された画面データを表示装置20に表示させる(224)。
表示装置20は、監視装置10から画面データが送信された場合、送信された画面データと、入出力デバイス24とを用いて、画面300を表示する。表示装置20は、送信された画面データを、送信された順に連続して表示することによって、アニメーションを再生する。なお、表示装置20は、画面300を切り替えることによって連続して画面データを表示してもよいし、画面300を並べて表示することによって、時間の経過による障害の発生状況の変化をユーザーに表示してもよい。
また、表示装置20は、送信された画面データに含まれるフラグの情報に基づいて、画面300の被監視装置30の位置に、障害を示す警告色等を表示する。
ステップ224の後、表示用サブプログラム104は、エントリDの停止時間193に従って、表示装置20に画面を表示させ続ける。すなわち、表示用サブプログラム104は、表示装置20において、停止時間193間、画面を停止させる(225)。
ステップ225の後、表示用サブプログラム104は、再生速度に従ってループ処理Dを繰り返すことによって、指定期間における画面をアニメーションによって表示する。
なお、図9に示す処理は、表示用サブプログラム104が生成した画面を、再生速度に従って表示装置20に随時表示させる処理であるが、表示用サブプログラム104は、指定期間におけるすべての画面を生成した後、表示装置20に画面を表示させてもよい。
具体的には、表示用サブプログラム104は、生成された画面データをキャッシュに格納し、表示画面情報109のすべてのエントリに対応する画面データを生成した後、キャッシュに格納された画面データと停止時間193とを表示装置20に送ってもよい。そして、表示用サブプログラム104は、再生速度と停止時間193とに従って、表示装置20に複数の画面を表示させてもよい。
実施例1によれば、監視装置10が、時刻2までに発生した障害イベントのうち、現在時刻において未対処の障害イベントを、アニメーションによって表示する。これによって、ユーザーは、未対処の障害イベントの発生時刻を、視覚的に速やかに把握することができる。
また、本実施例の監視装置10は、位置情報に基づいて被監視装置30を表示するため、ユーザーは、障害イベントが発生した被監視装置30の位置等を視覚的に速やかに把握できる。
また、実施例1の表示用サブプログラム104は、障害イベントの内容に従って、表示するアニメーションを停止させる。このため、ユーザーは、重要で注意すべき障害イベントが発生したことを速やかに把握することができる。また、実施例1の表示用サブプログラム104は、時刻1から時刻2までの画面を順次表示する。このため、ユーザーは、複数の被監視装置30において発生した障害の発生順序を、視覚的に容易に認識できる。
実施例2の監視装置10は、時刻1から時刻2までの指定期間において発生した障害イベントのみを画面に表示させる。そして、実施例2の監視装置10は、指定期間において発生した障害イベントの発生時期、及び、障害イベントの重要度等に従って、被監視装置30において発生した障害イベントを示す表示を変更する。
実施例2における計算機システム及び監視システムの構成は、図1に示す計算機システム及び監視システムの構成と同じである。
図10は、本実施例2の監視装置10の構成を示すブロック図である。
実施例2の記憶デバイス13は、イベント取得サブプログラム101、イベント更新サブプログラム102、画面生成サブプログラム103、表示用サブプログラム104、構成情報サブプログラム105及びルール更新サブプログラム230を、プログラムとして含む。また、記憶デバイス13は、イベント情報106、構成情報107、表示用情報108、表示画面情報109、及び、障害レベルルール情報231を、データとして含む。
実施例2のイベント取得サブプログラム101、イベント更新サブプログラム102、及び構成情報サブプログラム105は、実施例1の同符号のプログラムと同じである。実施例2のイベント情報106、及び構成情報107は、実施例1の同符号のデータと同じである。
実施例2の表示画面情報109は、実施例1の表示時刻191及び表示情報192を含む。しかし、実施例2の表示時刻191は、一つのカラムが指定期間の開始時刻と終了時刻とを示し、実施例2の表示情報192は、被監視装置30の障害レベルを示す図形の特徴を示す値を含む。
図11は、本実施例2の任意の指定期間における障害の発生状況を表示した画面310を示す説明図である。
実施例2において、ユーザーが、時刻1(Start time)及び時刻2(End time)を指定することによって、実施例2の指定期間が定まる。画面310は、指定期間において発生した障害イベントの障害レベルを表示する。実施例2における障害レベルとは、障害イベントの発生時期、及び、障害イベントの重大度等に基づいて算出された値であり、ユーザーが対処する緊急度を示す。
画面310は、障害レベルの値に従って、被監視装置30の表示に付加する警告色、図形又は記号の領域を変化させる。具体的には、画面310は、直前に表示していた障害レベルから次に表示する障害レベルが変化した場合、ユーザーの注意をひくような図形、文字、記号、模様又は色彩等を表示することによって、変化の程度を表示する。
図11において、第1の指定期間、第2の指定期間及び第3の指定期間の順に指定された場合の画面310の遷移を示す。
第1の指定期間は、第2の指定期間よりも短く、かつ、第3の指定期間よりも長い。ユーザーは、スクロールバー311を用いて、第1の指定期間、第2の指定期間、及び、第3の指定期間の順に指定する。
ユーザーが第1の指定期間をスクロールバー311を用いて入力した場合、入出力デバイス24は、画面310aを表示する。画面310aは、被監視装置30であるHost Iの表示部分に、第1の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル312を表示する。
また、ユーザーが第2の指定期間をスクロールバー311を用いて入力した場合、入出力デバイス24は、画面310bを表示する。
画面310bは、Host Iの表示部分に、第2の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル313を表示する。さらに、画面310bは、障害レベル312と障害レベル313との変化の程度を示すため、障害レベル312の外周と障害レベル313の外周との間に特徴的な色彩を表示する。
また、ユーザーが第3の指定期間をスクロールバー311を用いて入力した場合、入出力デバイス24は、画面310cを表示する。
画面310cは、Host Iの表示部分に、第3の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル314を表示する。さらに、画面310cは、障害レベル313と障害レベル314との変化の程度を示すため、障害レベル313と障害レベル314との間に特徴的な色彩を表示する。
画面310は、障害レベルを円の図形によって表示したが、これには限られず、障害レベルは、ユーザーの注意をひくことができる表示であれば、いかなる図形、記号、模様若又は色彩等の方法によって表示されてもよい。また、画面310は、変化の程度も、いかなる方法によって表示してもよい。
また、表示装置20は、入出力デバイス24としてスピーカーを有してもよく、障害レベルが増加した場合、入出力デバイス24は、画面310を表示し、さらに、増加したことを示す特徴的な音声をスピーカーから出力してもよい。
画面310が、障害レベルと障害レベルの変化の程度とを表示することによって、ユーザーは、指定期間において発生した障害イベントの障害の発生状況を視覚的に一目で把握でき、対処の緊急度の高い障害イベントを早期に発見できる。
また、画面310が障害レベルの変化の程度を表示するため、ユーザーは、障害レベルの高さを視覚的に把握し易くなり、障害レベルの高い被監視装置30で発生した障害イベントに優先的に対処できる。
図12は、本実施例2の被監視装置30の障害レベルを示す図形を示す説明図である。
図12に示す画面310は、障害レベルとして円の図形239を表示する。画面生成サブプログラム103は、図形239の直径rを定めることによって、障害レベルを示す円の図形239を生成し、表示する画面310を生成する。
画面生成サブプログラム103は、障害レベルが変化したことを、円の色彩又は模様等の変化によって表現してもよい。また、ユーザーは、円の最大直径及び最小直径をあらかじめ監視装置10に入力してもよい。最大直径及び最小直径が入力された場合、画面生成サブプログラム103は、最大直径及び最小直径を用いて、直径rと障害レベルとの対応関係を、あらかじめ定めてもよい。
例えば、画面生成サブプログラム103は、指定された最大直径及び最小直径、並びに、最大の障害レベル(あらかじめ定められる)に基づいて、障害レベルが1増加する度に増加する直径の値を定めてもよい。具体的には、画面生成サブプログラム103は、((最大直径−最小直径)/最大の障害レベルの合計値)によって算出された結果の、小数第2位以下を切り捨ててもよい。そして、この結果を、直径の増分(Δr)として保持してもよい。
画面310が円以外の表示方法によって、障害レベルを表示する場合、画面生成サブプログラム103は、前述の直径rを用いて図形の大きさを定めてもよいし、直径rに比例した音量の警告音を定めてもよい。
ユーザーが、障害レベルを示す円の最大の大きさ等を指定することによって、実施例2の画面生成サブプログラム103は、例えば、円が大きくなりすぎて、ユーザーがかえって障害レベルを認識しづらくなることを回避することができる。
図13は、本実施例2の障害レベルルール情報231を示す説明図である。
障害レベルルール情報231は、画面310に表示される障害レベルを算出する際に用いられる。障害レベルルール情報231は、イベントID232、平均対処時間233、重要度234、及び、最後に対処した日時235を含む。ルール更新サブプログラム230は、後述の処理によってイベント情報106に基づいて障害レベルルール情報231を生成する。
イベントID232は、障害イベントの識別子を示し、イベント情報106のイベントID161に対応する。
平均対処時間233は、イベントID232が示す障害イベントが発生してから、当該障害イベントの原因が解消されるまでの平均時間を示す。平均対処時間が長い場合、障害イベントは、一般に困難な障害を示すため、障害に対処する緊急度が高くなる。
重要度234は、ユーザーによって任意に定められる値である。重要度234は、イベントID232が示す障害イベントの重要性を示す。
図13に示す重要度234は、「緊急」、「エラー」及び「警告」などのメッセージを示すが、各々のメッセージには、障害レベルが対応付けられる。例えば、「緊急」には、障害レベルとして「5」が割り当てられ、「エラー」には、「2」が割り当てられる。
最後に対処した日時235は、イベントID232が示す障害イベントが、最後に解消された日時を示す。
平均対処時間233、重要度234及び最後に対処した日時235に基づいて、障害レベルが定められ、画面310に表示される図形の大きさが定まる。
なお、迅速に対処すべき障害イベントには、障害レベルが高く定められる。また、障害レベルルール情報231は、前述の平均対処時間233及び重要度234等以外にも、いかなる指標値を保持してもよく、例えば、障害イベントの発生件数を含んでもよい。
図14は、本実施例2の対処時間レベル241を示す説明図である。
対処時間レベル241は、平均対処時間と障害への対処が終了していない時間との差と、障害レベルとの対応づけを保持する。対処時間レベル241は、経過時間242及び障害レベル243を含む。
経過時間242は、平均対処時間と障害への対処が終了していない時間との差である。具体的には、経過時間242は、障害の発生日時(イベント情報106の発生日時162に相当する)から現在時刻までの時間から、障害レベルルール情報231の平均対処時間233を減算した値に相当する。障害レベル243は、経過時間に割り当てられた障害レベルを示す。
発生した障害への対処が終了しておらず、かつ、障害の発生日時から現在時刻までの時間が平均対処時間よりも長い場合、監視装置10は、発生した障害への対処の緊急度が高いことを強調して表示する必要がある。このため、図14において、経過時間242が示す時間が長いほど、障害レベル243の値が大きい。ただし、ユーザーは、割り当てる障害レベルを任意に選択してよい。
例えば、ユーザーは、障害の発生日時から現在時刻までの時間が、平均対処時間よりも60分以上120分未満多い場合、障害レベルとして2を割り当ててもよい。また、ここでユーザーは、障害の発生日時から現在時刻までの時間が、平均対処時間よりも120分以上180分未満多い場合、障害レベルとして、2より大きい障害レベルを割り当ててもよい。
図15は、本実施例2の最終対処日レベル251を示す説明図である。
最終対処日レベル251は、最後に対処をした日時からの経過日数と、障害レベルとを保持する。経過日数252は、障害レベルルール情報231の最後に対処した日時235から現在時刻までの日数を示す。障害レベル253は、経過日数に割り当てられた障害レベルを示す。
一般的に、経過日数が長い場合、障害への対処方法が古くなったり、紛失したりするなどによって、障害に適切に対処できないことが多い。このため、図15において、経過日数252が示す日数が大きいほど、障害レベル253の値が大きい。
図16は、本実施例2のルール更新サブプログラム230の処理を示すフローチャートである。
図16に示す処理は、定期的、又は、ユーザーによる指示によって実行される。また、図16に示す処理は、監視装置10が障害イベントを受信した場合に実行されてもよい。
ルール更新サブプログラム230は、イベント情報106を取得する(261)。ステップ261の後、ルール更新サブプログラム230は、イベント情報106のイベントID161を取得する。そして、ルール更新サブプログラム230は、取得したイベントID161から重複するイベントIDを排除することによって、イベントID一覧を生成する。そして、ルール更新サブプログラム230は、イベントID一覧のイベントIDの数を算出する(262)。
ステップ262の後、ルール更新サブプログラム230は、算出されたイベントIDの数、ステップ264〜ステップ257の処理を繰り返す。具体的には、ルール更新サブプログラム230は、イベントID一覧から、ステップ264〜267の処理を実行していないイベントIDを一つ選択する(263)。
ステップ263の後、ルール更新サブプログラム230は、選択されたイベントIDを示すイベントID161のエントリをイベント情報106からすべて取得する(264)。なお、ルール更新サブプログラム230は、イベントID一覧から、対処状況164が「未対処」を示すエントリを除いてもよい。
ステップ264の後、ルール更新サブプログラム230は、取得したすべてのエントリの対処状況164及び対処時間165に基づいて、平均対処時間を算出する(265)。
ステップ265の後、ルール更新サブプログラム230は、取得したすべてのエントリの発生日時162、対処状況164及び対処時間165に基づいて、最後に対処した日時を算出する。具体的には、ルール更新サブプログラム230は、対処状況164が「対処済み」を示すエントリの、発生日時162に対処時間165を加算することによって、最後に対処した日時を算出する(266)。
なお、障害レベルルール情報231が、障害レベルの指標として障害イベントの発生件数を有する場合、ルール更新サブプログラム230は、取得したすべてのエントリの数を算出し、障害レベルルール情報231に格納する。
ステップ266の後、ルール更新サブプログラム230は、障害レベルルール情報231の新たなエントリにおいて、選択されたIDをイベントID232に格納し、ステップ265において算出された平均対処時間を平均対処時間233に格納し、ステップ266において算出された日時を、最後に対処した日時235に格納する(267)。
また、ルール更新サブプログラム230は、ステップ267において、選択されたイベントIDに重要度を割り当てるための画面を、表示装置20に出力させ、選択されたイベントIDに割り当てられた重要度を、ユーザーから受け付けてもよい。そして、ルール更新サブプログラム230は、受け付けた重要度を、新たなエントリの重要度234に格納してもよい。
ステップ267の後、ルール更新サブプログラム230は、ステップ263に戻り、新たなイベントIDを選択する。
図16に示す処理によって、障害レベルルール情報231が生成される。そして、障害レベルルール情報231が生成されることにより、実施例2の監視装置10は、ユーザーが指定した指標によって障害レベルを算出することができる。
図17は、本実施例2の画面生成サブプログラム103の処理を示すフローチャートである。
まず、画面生成サブプログラム103は、画面310のスクロールバー311において指定されたStart time及びEnd timeを、時刻1及び時刻2として取得する。これによって、画面生成サブプログラム103は、時刻1と時刻2との間の期間である指定期間を取得する(271)。
ステップ271の後、画面生成サブプログラム103は、指定期間内に存在する被監視装置30にステップ273〜ステップ281の処理を実行する。
ステップ271の後、まず、画面生成サブプログラム103は、指定期間内に存在する被監視装置30の画面310における位置情報を、表示用情報108から取得する。具体的には、画面生成サブプログラム103は、時刻2の後に新たに追加されていないすべての被監視装置30を、表示用情報108から取得する。
そして、画面生成サブプログラム103は、取得した被監視装置30から、ステップ273以降の処理を実行していない被監視装置30(以下、被監視装置Eと記載)を選択する(272)。
ステップ272の後、画面生成サブプログラム103は、被監視装置Eを示す表示用情報108のエントリから、座標182を取得する(273)。
ステップ273の後、画面生成サブプログラム103は、指定期間の被監視装置Eにおいて発生した障害イベントであり、かつ、現在時刻において未対処であるイベント情報106のエントリをすべて取得する(274)。なお、ステップ274において障害イベントを取得できない場合、画面生成サブプログラム103は、ステップ272に戻り、新たな被監視装置30を選択する。
ステップ274の後、画面生成サブプログラム103は、ステップ274において取得したエントリのイベントID161と、障害レベルルール情報231のイベントID232とが一致する障害レベルルール情報231のエントリをすべて取得する(275)。
ステップ275の後、画面生成サブプログラム103は、ステップ277及びステップ278の処理を、ステップ274において取得したイベント情報106のエントリの各々に実行する。具体的には、画面生成サブプログラム103は、ステップ274において取得したエントリから、ステップ277以降の処理を実行していないエントリ(以下、イベントFと記載)を一つ選択する(276)。
ステップ276の後、画面生成サブプログラム103は、イベントFに基づいて障害レベルを算出する(277)。
具体的には、画面生成サブプログラム103は、イベントFの発生日時162から現在時刻までの時間を算出する。そして、画面生成サブプログラム103は、算出した時間から、イベントFのイベントID161に対応する平均対処時間233を減算することによって、経過時間を算出する。そして、画面生成サブプログラム103は、算出した経過時間(経過時間242に対応)に割り当てられた障害レベルを、対処時間レベル241の障害レベル243から取得する。
また、画面生成サブプログラム103は、ステップ277において、重要度234及び最後に対処した日時235の各々に割り当てられた障害レベルを取得する。具体的には、画面生成サブプログラム103は、イベントFのイベントID161に対応する最後に対処した日時235に割り当てられた障害レベルを、最終対処日レベル251の障害レベル253から取得する。また、画面生成サブプログラム103は、重要度234に割り当てられた障害レベルを、あらかじめ保持した障害レベルから取得する。
そして、ステップ277において、画面生成サブプログラム103は、取得した各障害レベルの合計値を算出する。
ステップ277の後、画面生成サブプログラム103は、算出された障害レベルの合計値を、表示用障害レベルに加算する(278)。ここで、表示用障害レベルとは、被監視装置Eの障害レベルを示す円の直径rを算出するために用いられる障害レベルであり、指標が複数であり、障害イベントが複数である場合、障害レベルの合計値である。表示用障害レベルは、記憶デバイス13に保持される。
ステップ278の後、画面生成サブプログラム103は、ステップ276に戻り、新たなエントリを選択する。
ステップ276〜ステップ278を実行することにより、画面生成サブプログラム103は、指定期間において被監視装置Eにおいて発生し、現在時刻まで未対処の障害イベントすべての障害レベルを表示する図形の大きさ等を定めることができる。
ステップ276〜ステップ278が終了した後、画面生成サブプログラム103は、算出された表示用障害レベルの値に従って、被監視装置Eの円の直径rを定める(279)。画面生成サブプログラム103は、前述した直径rと障害レベルとの対応関係と、表示用障害レベルの値とに基づいて、被監視装置Eの円の直径rを定める。
ステップ279の後、画面生成サブプログラム103は、表示装置20において現在表示されている画面310がある場合、現在表示されている画面310に対応する表示画面情報109のエントリを複製し、複製した表示画面情報109のエントリ(以下、既存画面情報)を記憶デバイス13に格納する(280)。既存画面情報には、現在表示されている被監視装置Eの障害レベルを示す円の直径r1が含まれる。
ステップ280の後、画面生成サブプログラム103は、次に表示する画面のための表示画面情報109を生成する(281)。具体的には、画面生成サブプログラム103は、表示画面情報109の表示時刻191がステップ271において取得した指定期間を示すエントリの表示情報192に、ステップ273において取得した被監視装置Eの位置情報と、ステップ279において決定された障害レベルを示す円の直径rとを、格納する。
なお、ステップ281において、表示時刻191が指定期間を示すエントリが表示画面情報109にない場合、画面生成サブプログラム103は、新たなエントリを生成する。
ステップ281の後、画面生成サブプログラム103は、ステップ280において取得した既存画面情報に含まれる直径r1と、ステップ279において決定された直径rとを比較し、比較の結果に従って定められた差分の表示方法を、差分画面情報に格納する(282)。差分画面情報とは、記憶デバイス13に保持される値である。
例えば、直径r1よりも直径rが大きい場合、画面生成サブプログラム103は、比較の結果に従って定められた表示方法として、障害レベルが増大したことを示す色彩を、被監視装置Eの障害レベルの円(直径r1)の外周と円(直径r)の外周との間に付加することを差分画面情報に格納する。
ステップ282の後、画面生成サブプログラム103は、ステップ272に戻り、新たな被監視装置Eを選択する。
図17に示す処理を実行することによって、実施例2の表示画面情報109に、指定期間において表示する被監視装置30の位置情報と、当該被監視装置30の障害レベルを示す円の直径とが格納される。
そして、表示用サブプログラム104は、表示画面情報109と差分画面情報とを参照し、例えば、画面310bを表示装置20に表示させる。障害レベル312の直径は、前述の例における直径r1であり、障害レベル313の直径は、前述の例における直径rである。そして、表示用サブプログラム104は、障害レベル312の円と障害レベル313の円との色彩を、差分画面情報が示す比較の結果に従って定められた表示方法を用いて表示する。
時刻1以前に発生した障害イベントであり、現在時刻において未対処の障害イベントであり、時刻1から時刻2までの間に同じ被監視装置30において同じ障害イベントが発生した場合、実施例1の表示用サブプログラム104は、正確に障害イベントの発生時刻を、画面に表示できない。
一方、実施例2によれば、表示用サブプログラム104は、時刻1から時刻2までに発生した障害イベントのみを画面310に表示するため、時刻1前のイベントが対処であるか又は未対処であるかにかかわらず、時刻1から時刻2までに発生した障害イベントを表示する。
また、実施例2の監視装置10は、障害への対処状況、及び障害の重要度等の指標によって算出された障害レベルを用い、障害の緊急度を示す図形等を、障害の発生状況として画面に表示する。このため、ユーザーは、実施例2による画面を見ることによって、指定期間において発生し、かつ、未対処である障害イベントに対処する緊急度を適切に把握することができる。
実施例3の監視システムは、実施例1におけるアニメーションによる画面表示と実施例2における障害レベルの表示とを行う。実施例3における計算機システムは、図1に示す実施例1及び実施例2の計算機システムと同じ構成である。
また、実施例3における記憶デバイス13が有するプログラム及びデータは、図10に示す実施例2のプログラム及びデータと同じである。しかし、プログラムの処理及びデータの内容が、実施例3と実施例2とにおいて異なる。
図18は、本実施例3の時刻1から時刻2までの障害の発生状況を連続して表示する画面320を示す説明図である。
ユーザーは、表示装置20の入出力デバイス24に表示された画面320のスクロールバー321を介して、時刻1(Replay start time)、時刻2(Replay End time)及び時刻3(Point in time)を入力する。
実施例3の画面320は、時刻1(Replay start time)及び時刻2(Replay End time)の間に発生した障害イベントを、発生した時刻の順にアニメーションによって表示する。また、画面320は、発生した障害イベントの時刻3(Point in time)における障害レベルを表示する。
以下における画面生成サブプログラム103は、実施例1と同じく障害の発生状況をアニメーションによって表示し、実施例2と同じく障害レベルを表示する。しかし、以下に示す画面生成サブプログラム103は、実施例1と異なり、表示画面情報の停止時間193に従ってアニメーションを停止し、同じ画面320を表示し続けない。また、以下に示す画面生成サブプログラム103は、実施例2と異なり、表示されていた障害レベルと表示する障害レベルとの差分を、強調して表示しない。
図19Aは、本実施例3の画面生成サブプログラム103の処理の前半を示すフローチャートである。
ステップ351〜ステップ355は、図8Aに示すステップ201〜ステップ205と同じである。
ステップ355の後、画面生成サブプログラム103は、イベント情報106の発生日時162及びホスト名163を参照し、時刻1から時刻3までに被監視装置Cにおいて発生したすべての障害イベントを示すエントリを、イベント情報106から取得する(356)。
ステップ356の後、画面生成サブプログラム103は、ステップ356において取得したエントリのイベントID161と、障害レベルルール情報231のイベントID232とが一致する障害レベルルール情報231のエントリをすべて取得する(357)。
図19Bは、本実施例3の画面生成サブプログラム103の処理の後半を示すフローチャートである。
ステップ358〜ステップ361は、図17に示すステップ276〜ステップ279と同じである。
ステップ354〜ステップ361の処理が終了した後、画面生成サブプログラム103は、時刻3における表示画面情報109を生成する。具体的には、画面生成サブプログラム103は、表示時刻191に時刻3を格納し、表示情報192にステップ355において取得した位置情報と、ステップ361において決定された円の直径rと、を表示情報192に格納する(362)。
ステップ362の後、画面生成サブプログラム103は、ステップ353に戻る。そして、時刻3が時刻2を超えた場合、画面生成サブプログラム103は、図19A及び図19Bに示す処理を終了する。
図19A及び図19Bに示す処理が終了した後、図9に示す処理が実行され、表示用サブプログラム104は、被監視装置30において障害が発生した時刻において、障害レベルを示す図形を画面320に表示する。
なお、実施例3の画面生成サブプログラム103は、実施例1と同じく表示画面情報の停止時間193に従ってアニメーションを停止させてもよい。この場合、図8Bに示すステップ208〜ステップ211を、図19Aに示すステップ356において実行してもよい。
また、実施例3における画面生成サブプログラム103は、実施例2の差分画面情報を用いて、表示されていた障害レベルと表示する障害レベルとの差分を、色彩等によって強調してもよい。この場合、画面生成サブプログラム103は、ステップ280〜ステップ282を、ステップ361の後に実行し、サンプリング間隔ごとの障害レベルの差分を強調して表示してもよい。
実施例3によれば、ユーザーが指定した指定期間において発生した障害イベントに対する障害の発生状況を、画面320にアニメーションによって表示し、さらに、障害レベルの程度を視覚的に表示する。このため、ユーザーは、指定期間中の障害レベルの変化を、視覚的に把握することができ、さらに、障害の発生時刻及び発生順序を把握することができる。
なお、前述において、本実施例のプログラムを実行するために必要なデータを「aaa情報」と記載したが、これらはいかなるデータ構造によって記憶デバイス23に保持されてもよい。例えば、イベント情報106は、リストの構造によって保持された「イベントリスト」であってもよく、また、データベースによって保持された「イベントDB」であってもよい。
さらに、各情報の内容を説明する際に、「識別子」、「名」、「ID」と表現したが、これらについては互いに置換が可能である。
また、前述の説明では「プログラム」が処理を実行したが、プログラムはCPU12又はCPU22によって実行されることで、あらかじめ定められた処理を記憶デバイス13、記憶デバイス23及びネットワークアダプタ(通信制御デバイス)を用いながら行うため、CPU12又はCPU22を主語とした説明としてもよい。また、プログラムを主語として記載した処理は、監視装置10等の計算機が行う処理として表現してもよい。また、プログラムの一部又は全ては専用ハードウェアによって実現されてもよい。
また、各種プログラムはプログラム配布サーバ、計算機が読み取り可能な記憶メディアによって各計算機にインストールされてもよい。この場合、プログラム配布サーバはCPUと記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムを記憶している。そして、配布プログラムをCPUが実行することで、プログラム配布サーバのCPUは配布対象のプログラムを他の計算機に配布してもよい。
また、本発明は前述した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除又は置換をすることが可能である。
また、前述の各構成、機能、処理部及び処理方法等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実装してもよい。また、前述の各構成及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル又はファイル等の情報は、メモリ、ハードディスク若しくはSSD(Solid State Drive)等の記録装置、又は、ICカード、SDカード若しくはDVD等の記録媒体に置くことができる。
また、図における制御線及び情報線は、説明上必要と考えられるものが示されており、製品上必ずしも全ての制御線及び情報線が示されているとは限らない。実際には、ほとんどすべての構成が相互に接続されていると考えてよい。
複数の計算機を有するシステムを監視する監視システムに適用できる。

Claims (5)

  1. 監視システムであって、
    計算機に接続するネットワークインタフェースと、
    指定期間の終了時刻を受け付ける入力インタフェースと、
    前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
    前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
    前記監視システムは、
    前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
    前記生成された画面の画面データを出力し、
    前記指定期間は、複数の表示時刻を含み、
    前記監視システムは、
    前記複数の表示時刻のうちの一つの表示時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成することによって、前記複数の表示時刻の複数の画面を生成し、
    前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力し、
    前記障害が発生した場合、一つの画面を表示し続ける時間を示す停止時間情報を有し、
    前記複数の画面が示す障害と、前記停止時間情報とに基づいて、前記複数の画面の各々を表示する時間を決定し、
    前記決定された時間に従って、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力することを特徴とする監視システム。
  2. 監視システムであって、
    計算機に接続するネットワークインタフェースと、
    指定期間の終了時刻を受け付ける入力インタフェースと、
    前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
    前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
    前記監視システムは、
    前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
    前記生成された画面の画面データを出力し、
    前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
    前記監視システムは、
    前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出し、
    前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成し、
    前記イベント情報に基づいて、前記障害が過去に複数回発生した場合に前記障害の対処が終了するまでに必要だった時間の平均時間と、前記障害の対処が最後に終了した日から前記現在時刻までの経過日数とを算出し、
    前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記対処が終了していない障害が発生した時刻から前記現在時刻までの時間から、前記算出された平均時間を減算した値を、経過時間として算出し、
    前記算出された経過時間及び経過日数に基づいて、前記緊急度を算出することを特徴とする監視システム。
  3. 監視システムであって、
    計算機に接続するネットワークインタフェースと、
    指定期間の終了時刻を受け付ける入力インタフェースと、
    前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
    前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
    前記監視システムは、
    前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
    前記生成された画面の画面データを出力し、
    前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
    前記監視システムは、
    前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出し、
    前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成し、
    前記入力インタフェースは、第1の指定期間の第1の開始時刻及び第1の終了時刻を受け付けた後、第2の指定期間の第2の開始時刻及び第2の終了時刻を受け付け、
    前記監視システムは、
    前記第1の開始時刻から前記第1の終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、第1の緊急度を算出し、
    前記第2の開始時刻から前記第2の終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、第2の緊急度を算出し、
    前記算出された第1の緊急度と第2の緊急度との差を表示する画面を生成することを特徴とする監視システム。
  4. 監視システムによる監視方法であって、
    前記監視システムは、
    プロセッサと、
    計算機に接続するネットワークインタフェースと、
    指定期間の終了時刻を受け付ける入力インタフェースと、
    前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
    前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
    前記方法は、
    前記プロセッサが、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する手順と、
    前記生成された画面の画面データを出力する手順と、を含み、
    前記指定期間は、複数の表示時刻を含み、
    前記方法は、
    前記プロセッサが、前記複数の表示時刻のうちの一つの表示時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成することによって、前記複数の表示時刻の複数の画面を生成する手順と、
    前記プロセッサが、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力する手順と、を含み、
    前記監視システムは、前記障害が発生した場合、一つの画面を表示し続ける時間を示す停止時間情報を有し、
    前記方法は、
    前記プロセッサが、前記複数の画面が示す障害と、前記停止時間情報とに基づいて、前記複数の画面の各々を表示する時間を決定する手順と、
    前記プロセッサが、前記決定された時間に従って、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力する手順と、を含むことを特徴とする監視方法。
  5. 監視システムによる監視方法であって、
    前記監視システムは、
    プロセッサと、
    計算機に接続するネットワークインタフェースと、
    指定期間の終了時刻を受け付ける入力インタフェースと、
    前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
    前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
    前記方法は、
    前記プロセッサが、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する手順と、
    前記生成された画面の画面データを出力する手順と、を含み、
    前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
    前記方法は、
    前記プロセッサが、前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出する手順と、
    前記プロセッサが、前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成する手順と、
    前記プロセッサが、前記イベント情報に基づいて、前記障害が過去に複数回発生した場合に前記障害の対処が終了するまでに必要だった時間の平均時間と、前記障害の対処が最後に終了した日から前記現在時刻までの経過日数とを算出する手順と、
    前記プロセッサが、前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記対処が終了していない障害が発生した時刻から前記現在時刻までの時間から、前記算出された平均時間を減算した値を、経過時間として算出する手順と、
    前記プロセッサが、前記算出された経過時間及び経過日数に基づいて、前記緊急度を算出する手順と、を含むことを特徴とする監視方法。
JP2015546237A 2013-11-08 2013-11-08 監視システム、及び、監視方法 Active JP6002856B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/080289 WO2015068275A1 (ja) 2013-11-08 2013-11-08 監視システム、及び、監視方法

Publications (2)

Publication Number Publication Date
JP6002856B2 true JP6002856B2 (ja) 2016-10-05
JPWO2015068275A1 JPWO2015068275A1 (ja) 2017-03-09

Family

ID=53041076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015546237A Active JP6002856B2 (ja) 2013-11-08 2013-11-08 監視システム、及び、監視方法

Country Status (3)

Country Link
US (1) US9697067B2 (ja)
JP (1) JP6002856B2 (ja)
WO (1) WO2015068275A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180766A1 (de) * 2014-05-28 2015-12-03 Siemens Aktiengesellschaft Verfahren und leitstelleneinrichtung zum überwachen einer anlage
CN106464541B (zh) * 2015-03-19 2019-09-20 华为技术有限公司 基于网络功能虚拟化的故障处理方法及设备
JP6904223B2 (ja) 2017-11-10 2021-07-14 オムロン株式会社 異常状態検出装置、異常状態検出方法、及び、異常状態検出プログラム
IT201800003234A1 (it) * 2018-03-02 2019-09-02 Stmicroelectronics Application Gmbh Sistema di elaborazione, relativo circuito integrato e procedimento
US11288117B2 (en) 2019-08-06 2022-03-29 Oracle International Corporation Predictive system remediation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07143123A (ja) * 1993-11-18 1995-06-02 Hitachi Ltd ネットワーク管理のための障害情報表示方法およびネットワーク監視システム
JPH11306108A (ja) * 1998-04-23 1999-11-05 Toshiba Corp 通信ネットワークシステム
JP2003050622A (ja) * 2001-08-07 2003-02-21 Mitsubishi Electric Corp 監視制御装置
JP2003162504A (ja) * 2001-11-26 2003-06-06 Hitachi Ltd 障害分析支援システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004078369A (ja) 2002-08-12 2004-03-11 Sony Corp サイト状態監視方法、サイト状態監視装置及びその制御プログラム並びにその制御プログラムを格納した記録媒体
US7523349B2 (en) * 2006-08-25 2009-04-21 Accenture Global Services Gmbh Data visualization for diagnosing computing systems
US20090210813A1 (en) * 2008-02-15 2009-08-20 Sawczak Stephen D Systems and methods for computer equipment management
KR20110065067A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 멀티 쓰레드 테스팅시 발생되는 에러 정보에 대한 비주얼 인터페이스를 제공하는 장치 및 방법
US20110154117A1 (en) * 2009-12-22 2011-06-23 General Electric Company, A New York Corporation Methods and apparatus to perform log file analyses
US8707111B2 (en) * 2011-02-09 2014-04-22 Ebay Inc. High-volume distributed script error handling
US9020921B2 (en) * 2011-09-30 2015-04-28 Oracle International Corporation Storage tape analytics user interface providing library analysis and monitoring alerts
US9507686B2 (en) * 2013-12-20 2016-11-29 Netapp, Inc. System, method, and computer program product for monitoring health of computer system assets
US9319288B2 (en) * 2014-02-12 2016-04-19 Vmware, Inc. Graphical user interface for displaying information related to a virtual machine network

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07143123A (ja) * 1993-11-18 1995-06-02 Hitachi Ltd ネットワーク管理のための障害情報表示方法およびネットワーク監視システム
JPH11306108A (ja) * 1998-04-23 1999-11-05 Toshiba Corp 通信ネットワークシステム
JP2003050622A (ja) * 2001-08-07 2003-02-21 Mitsubishi Electric Corp 監視制御装置
JP2003162504A (ja) * 2001-11-26 2003-06-06 Hitachi Ltd 障害分析支援システム

Also Published As

Publication number Publication date
WO2015068275A1 (ja) 2015-05-14
JPWO2015068275A1 (ja) 2017-03-09
US9697067B2 (en) 2017-07-04
US20150370625A1 (en) 2015-12-24

Similar Documents

Publication Publication Date Title
JP6002856B2 (ja) 監視システム、及び、監視方法
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
CN111049705A (zh) 一种监控分布式存储系统的方法及装置
US20120120078A1 (en) Displaying system performance information
EP3239840B1 (en) Fault information provision server and fault information provision method
JP6109662B2 (ja) 運用管理装置、運用管理方法およびプログラム
JPWO2011104983A1 (ja) 監視状況表示装置、監視状況表示方法および監視状況表示プログラム
CN109800124B (zh) Cpu使用率监控方法、装置、电子设备及存储介质
JP2010231293A (ja) 監視装置
US9356848B2 (en) Monitoring apparatus, monitoring method, and non-transitory storage medium
JP5544929B2 (ja) 運用管理装置、運用管理方法、運用管理プログラム
CN114978923B (zh) 故障演练方法、装置和系统
JP2014153736A (ja) 障害予兆検出方法、プログラムおよび装置
CN115687026A (zh) 多节点服务器故障预警方法、装置、设备及介质
JP2001256032A (ja) 障害メッセージ表示装置
CN109766238B (zh) 基于session数的运维平台性能监控方法、装置及相关设备
JP5586322B2 (ja) プラント監視システムおよびプラント監視方法
JPWO2012070475A1 (ja) 情報処理装置、情報処理方法、並びに情報処理プログラム
JP6636656B2 (ja) 管理システム、管理装置、および管理方法
JP2017059152A (ja) 分析システム、及び、分析方法
CN109840179A (zh) RocketMQ线程数监控方法、装置、电子设备及存储介质
JP2007164494A (ja) 情報出力方法、システム及びプログラム
JP2013003896A (ja) 情報提供装置、情報提供方法およびプログラム
JP2015230568A (ja) 作業支援装置、作業支援システム、および、作業支援方法
JP2013164734A (ja) ポリシー管理装置、ポリシー管理システム、ポリシー管理方法、及び、ポリシー管理プログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160905

R150 Certificate of patent or registration of utility model

Ref document number: 6002856

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150