JP2004094701A - 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 - Google Patents
監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 Download PDFInfo
- Publication number
- JP2004094701A JP2004094701A JP2002256306A JP2002256306A JP2004094701A JP 2004094701 A JP2004094701 A JP 2004094701A JP 2002256306 A JP2002256306 A JP 2002256306A JP 2002256306 A JP2002256306 A JP 2002256306A JP 2004094701 A JP2004094701 A JP 2004094701A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- information
- failure
- monitored
- monitoring information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】監視装置またはネットワークが停止中に被監視装置に発生した監視情報を、障害復旧後に、監視装置において、効率良く表示させる。
【解決手段】被監視装置200は、監視装置100またはネットワーク300の停止中、自装置で監視する監視情報を、障害保存部204において保存し、監視装置復旧後、監視装置は、情報収集部101により、被監視装置が保存しておいた監視情報を収集し、その監視情報を表示する。その際、監視装置は情報表示処理部102により、当該被監視装置に障害が発生したことを示す通知情報を表示し監視員の注目度をあげ、障害の早期発見、早期解析を実現すると共に、監視員の当該通知情報の選択操作に応じて、当該被監視装置の状態、障害名称、障害発生時間等の詳細を時系列で表示する。
【選択図】 図1
【解決手段】被監視装置200は、監視装置100またはネットワーク300の停止中、自装置で監視する監視情報を、障害保存部204において保存し、監視装置復旧後、監視装置は、情報収集部101により、被監視装置が保存しておいた監視情報を収集し、その監視情報を表示する。その際、監視装置は情報表示処理部102により、当該被監視装置に障害が発生したことを示す通知情報を表示し監視員の注目度をあげ、障害の早期発見、早期解析を実現すると共に、監視員の当該通知情報の選択操作に応じて、当該被監視装置の状態、障害名称、障害発生時間等の詳細を時系列で表示する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、システムの障害情報を表示する技術に係わり、特に、リアルタイムプロセス制御監視システムにおいて、監視装置がメンテナンスや故障、プログラム不良、またはネットワークの障害などにより、リアルタイムに被監視装置の障害情報、及び、運転状態を表示できない時に、障害回復後に障害中の監視情報を表示する監視情報表示システムと方法およびそのプログラムと監視装置に関するものである。
【0002】
【従来の技術】
FA(Factory Automation)システムなどで使われるネットワークでは、ネットワーク内の各機器の監視情報を、リアルタイムで1台の監視装置に集め、この監視装置において、各機器毎の監視情報を表示し集中管理している。
【0003】
この技術の利点は、一台のマシン(監視装置)で、各監視対象の機器(被監視装置)の監視情報をリアルタイムに確認できることにある。
【0004】
しかし、この技術では、監視装置がメンテナンスや故障、プログラム不良などにより停止中の場合、または、ネットワークの障害等により通信停止中の場合には、停止中に被監視装置で発生した監視情報は、監視装置において収集されておらず表示することができない。その結果、監視装置停止中、もしくはネットワーク停止中に発生した監視情報は、見逃されてしまう。
【0005】
また、警告情報(送信バッファの使用量がしきい値を超えた場合等に生成される警告情報など)があった場合は、被監視装置の状態は、「正常→警告」と変化するが、時間の経過と共ににしきい値を下回った場合は、正常状態に戻る。そのため、監視装置やネットワークの停止中に、被監視装置が「正常→警告→正常」と状態遷移した場合、監視装置もしくはネットワークが復旧した後に、監視装置側で被監視装置の最新状態を見ても正常状態となっており、障害発生に気づくのが遅れてしまう。
【0006】
このような監視装置側の異常時もしくは通信回線側の異常時においても、監視情報を紛失することなく、また被監視システムにおける監視情報の発生時刻を正確に把握することを可能とする技術が、例えば、特開平8−79335号公報に記載されている。
【0007】
この技術では、被監視システムで発生した監視情報に対して時刻情報を付加する手段と、時刻情報を付加した監視情報を蓄積する手段と、蓄積した監視情報を監視システムへ送信する手段と、送信が正常に終了した場合、蓄積した監視情報を削除する手段と、送信が正常に終了しなかった場合、蓄積した監視情報の監視システムへの送信を再試行する手段を設けている。
【0008】
さらに、監視システムや通信回線の状態を監視し異常を検出する手段を有し、監視システムまたは通信回線の異常を検出した場合、蓄積した監視情報を監視システムへ送信せず、監視システムまたは通信回線の異常回復を検出した場合に、蓄積した監視情報を監視システムへ送信するようにしている。
【0009】
これらの手段を有することにより、被監視システムにおいて発生した全ての監視情報が紛失することなく監視システムへ転送されるので、通信回線の状態に影響されずに被監視システムを監視することが可能になり、また、被監視システムで発生した監視情報にその正確な発声時刻を付与して監視システムに転送するので、監視システムではその監視情報が被監視システムのどの故障に関係あるものなのかを容易に判定でき、故障原因や故障の前兆を分析するのに有効である。
【0010】
しかしながら、この技術では、被監視システム側の監視情報を、漏れなく、監視システム側に転送するだけであり、監視システム側において、転送されてきた監視情報を効率的に処理することはできない。
【0011】
すなわち、この従来技術では、監視システムや通信回線の異常回復時に、被監視システムから、蓄えられた監視情報が全て監視システム側に送信されてくる。そのため、例えば、監視システムまたは通信回線の異常による送信停止が長時間に渡った場合、異常復旧時には大量の監視情報が監視システムに送られてくる。
【0012】
このように、大量の監視情報が送られてくると、監視システムでは、送信停止中の被監視装置の状況把握や、分析に多大な時間を要してしまう。また、被監視装置の状態が変わらない障害(警告やインフォメーションなど)が発生した場合は、障害の発生があったことを見逃してしまう可能性が高い。
【0013】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、監視装置またはネットワークの障害回復後に監視装置が受信した、障害発生中の被監視装置で一時保存された、被監視装置の障害情報および被監視装置の動作情報を、システム運用管理者に分かりやすく迅速に表示することができない点である。
【0014】
本発明の目的は、これら従来技術の課題を解決し、監視装置と、FA装置等の被監視装置、および、それらを接続するネットワークから構成されるネットワーク監視システムの性能の向上を図ることである。
【0015】
【課題を解決するための手段】
上記目的を達成するため、本発明では、監視装置停止中、またはネットワーク停止中に被監視装置で発生した障害を、被監視装置で障害情報と合わせて、動作情報も保存蓄積し、監視装置との通信回復後に、監視装置において、監視装置停止、もしくはネットワーク停止中に被監視装置にて蓄積されていた障害情報、及び動作情報を収集して記憶装置に保存し、再表示する。この再表示の際、監視装置のモニターで表示されるシステム構成図(監視画面)において、監視装置停止中、またはネットワーク停止中に状態変化があった被監視装置を表す図形の近傍に、状態変化があったことを示すマーク(通知情報)を表示する。そして、監視者が、状態変化のあるマークをマウス等でクリック操作して選択することに伴い、記憶装置に保存しておいた被監視装置の状態、障害名称、障害発生時間を読み出して、レプレイ表示する。複数の状態変化があった場合には、監視者が連続して状態変化のあるマークをマウス等で選択することにより、複数の障害情報を順次、表示する。このように、障害情報と合わせて、被監視装置の動作情報も保存することにより、被監視装置の動作状態も監視画面において再表示(リプレイ表示)することができる。また、動作状態が変化した被監視装置に特定の印を付けることにより、監視員による障害の早期発見に非常に効果がある。さらに、監視画面において、障害情報と合わせて動作状態を、障害の発生した順番で時系列に表示することにより、監視者によるシステム全体の障害の把握に効果があり、それによって、迅速な障害解析が可能となる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
【0017】
図1は、本発明に係わる監視情報表示システムの構成例を示すブロック図であり、図2は、図1における監視情報表示システムの正常時の動作例を示す説明図、図3は、図1における監視情報表示システムの異常発生時の動作例を示す説明図、図4は、図1における監視情報表示システムの第1の画面表示例を示す説明図、図5は、図1における監視情報表示システムの第2の画面表示例を示す説明図、図6は、図1における監視情報表示システムの第3の画面表示例を示す説明図である。
【0018】
図1において、100は監視装置、200はFA装置等の被監視装置、300がそれらを繋ぐネットワークであり、監視装置100と被監視装置200のそれぞれは、CPU(Central Processing Unit)や主メモリ、表示装置、入力装置、外部記憶装置等からなるコンピュータ構成となっており、光ディスク駆動装置等を介してCD−ROM等の記憶媒体に記録されたプログラムやデータを外部記憶装置内にインストールした後、この外部記憶装置から主メモリに読み込みCPUで処理することにより、各処理部の機能が実装される。
【0019】
例えば、監視装置100においては、情報収集部101と情報表示処理部102が設けられ、被監視装置200においては、障害通信部202と動作情報通信部203および障害保存部204が設けられている。
【0020】
尚、本図では、被監視装置200は、ネットワーク300に接続された複数の被監視装置を代表して図示されているものであり、実際には、被監視装置200と同様の構成の複数の被監視装置がネットワーク300に接続されており、監視装置100において、これら被監視装置200を含む複数の被監視装置の稼働状況を集中管理する構成である。
【0021】
このような監視装置100と複数の被監視装置200およびそれらを接続するネットワーク300からなる本システムでは、監視装置100において、被監視装置200の稼働状態をリアルタイムに監視するために、被監視装置200から監視情報がイベントとして監視装置100に報告され、監視装置100で表示する。
【0022】
監視装置100では、ネットワーク300の構成を模した図形でシステム構成を表示しており、被監視装置200が停止した時は、該当する被監視装置200を示す図形を青色(被監視装置停止中)表示に変える等する。
【0023】
また、被監視装置200で障害報告があった場合は、障害名称を監視装置100のモニターに表示して、ネットワーク300内の各被監視装置200の障害状態を監視装置1台で把握できるようにしている。
【0024】
被監視装置200の実際の状態(動作状態、または動作情報)について説明する。被監視装置200は、自装置に埋め込まれたランプの点灯によって、自装置の2種類の状態を表すことができる。
【0025】
1つは運転状態によって、「運転中」と「停止中」に分けられる。もう一つは、障害の発生有無によって「正常」と「異常」に分けられる。被監視装置200は重故障発生の場合、「異常」となる。
【0026】
また、被監視装置200の稼働状態としては「正常」と「異常」以外に「警告」があるが、これは、被監視装置200のランプの状態からは判断できない、内部的な状態である。
【0027】
従って、監視装置100において、被監視装置200の障害を表示する場合、被監視装置200の稼働状態を示すものとして「正常」と「異常」に「警告」が加わる。
【0028】
被監視装置200から監視装置100に報告される障害情報としては、このような被監視装置200で発生した障害のレベルを示す障害種別、障害名称(エラーメッセージ)、障害発生時刻情報、障害詳細情報(障害解析に必要なログなど)などと共に、被監視装置200の立上げ立ち下げなどの状態変化等、障害と直接関係ない情報も含まれる。
【0029】
障害種別(エラーレベル)は、障害の重要度に応じてレベル分けを行うものであり、ここでは便宜上3つのレベル(重故障、警告、インフォメーション)に分ける。監視装置100においては、それぞれの障害の重要度に応じて被監視装置200の状態表示を変える構成とする。
【0030】
例えば、システム(被監視装置)停止を伴う重大な障害は、状態表示を「重故障」として、監視装置100のネットワーク300内の機器を示す図形の表示を元々の緑色(正常)から青色(被監視装置停止中)表示に変える。
【0031】
また、送信バッファの使用量がしきい値を超えた等のような、当該被監視装置の停止を伴わない一時的で軽微な故障は、「警告」のレベルとして、当該被監視装置の状態を一時的に黄色(警告)表示にするが、その後に正常復帰(送信バッファの使用量がしきい値を下回った等)した場合は、回復メッセージの出力と共に、被監視装置の状態を緑色表示に戻す。
【0032】
そして、各機器の状態変化やネットワーク構成の変化など、障害ではない情報は、「インフォメーション」のレベルとして、機器の状態表示はそのまま緑色とする。
【0033】
このように、障害の重要度を色分けすることにより、監視員に障害の重要度を認識させ易くし、障害発生後の対応を誤らないようにしている。
【0034】
このような構成において、図1の監視情報表示システムでは、通常は、ネットワーク300を介して接続された複数の被監視装置200の稼働状態を一台の監視装置100においてリアルタイムに監視しているが、監視装置100またはネットワーク300に障害が発生して通信停止状態となった場合には、その通信停止中、被監視装置200において、自装置で検出した自装置の稼働状態や障害状態を示す監視情報を時系列に蓄積しておき、このように、被監視装置200において蓄積された監視情報を、障害回復後に監視装置100が受信し、監視装置100において、具備した表示装置に、その監視情報(障害情報)を時系列に表示する。
【0035】
特に、本例の監視装置100では、情報収集部101により、障害回復後に被監視装置200から時系列の監視情報(障害情報)を受信し、障害情報ファイル204aとして記憶装置に蓄積し、情報表示処理部102により、蓄積した時系列の障害情報ファイル204aを参照して被監視装置200の障害中における稼働状態の変化を検出し、具備した表示装置に、被監視装置200の障害中における状態変化があったことを示す通知情報を表示すると共に、この通知情報に対する操作者の指示に応じて順次に、障害情報ファイル204aから被監視装置200の監視情報(障害情報)を時系列に読み出して表示装置で表示する。
【0036】
さらに、監視装置100は、ネットワーク300およびネットワーク300上での自装置と被監視装置200の配置構成および通知情報を、図形により表示装置の第1の画面領域に表示し、通知情報に対する操作者の指示に対応して読み出した監視情報を、表示装置の第2の画面領域に表示する。特に、第1の画面領域においては、通知情報の図形を当該被監視装置の近傍に表示する。
【0037】
以下、図2から図6に基づき、本例の監視情報表示システムの動作説明を行なう。
【0038】
図2においては、監視装置100およびネットワーク300が正常に動作している際に、被監視装置200で障害が発生した場合の障害情報の流れを示している。
【0039】
すなわち、被監視装置200で障害が発生した場合、その障害情報201は、障害通信部202によって、監視装置100に送信される。また、動作情報通信部203によって、被監視装置200の動作情報が一定間隔で、監視装置100に送信される。
【0040】
監視装置100では、障害通信部202および動作情報通信部203から送られてきた情報を情報収集部101で収集し、情報表示処理部102により、これらの情報を基に、被監視装置200の障害情報や動作状態を、監視画面として、表示装置のディスプレイ上に表示する。
【0041】
図3では、被監視装置200から監視装置100に、被監視装置200の障害情報と動作情報を送信できない場合における、被監視装置200で発生した障害の障害情報の流れを示している。
【0042】
このような場合、被監視装置200で障害が発生すると、被監視装置200は、その障害情報201を、障害通信部202によって、監視装置100に送信するが、送信が失敗するので、被監視装置200は、監視装置100もしくはネットワーク300上に障害が発生したとみなして、障害保存部204により、当該障害情報と、動作情報通信部203で収集した動作情報を、障害情報ファイル204aとして保存する。
【0043】
この後の処理の流れ、すなわち、被監視装置200から監視装置100への送信が回復した場合の障害情報の流れを、図1を用いて説明する。
【0044】
図1において、監視装置100は、被監視装置200との通信が回復した後、情報収集部101により、被監視装置200にアクセスして障害保存部204をチェックし、障害保存部204に障害情報ファイル204aがあれば、それらを取り込む。
【0045】
全ての情報を取り込んだら、監視装置100は、情報表示処理部102により、監視情報として画面表示すると共に、被監視装置200に対して、障害保存部204で保存している障害情報ファイル204aの削除を指示する。指示を受けた被監視装置200では障害保存部204に蓄えられた障害情報ファイル204aを削除する。
【0046】
図4においては、監視装置100と被監視装置A200が通信不可となり、その後復旧した時の、監視装置100の表示装置に表示する監視画面の表示例を示している。
【0047】
監視画面は、障害名称、障害発生時刻などを表示するエラー表示領域400と、監視装置が監視しているシステム内の監視装置100、被監視装置200,210、及びそれらを繋ぐネットワーク300を図形化して表示するシステム構成図表示部(図中「レイアウト表示領域」と記載)401からなる。このシステム構成図表示部401において、監視装置100a、被監視装置200a,210a、ネットワーク300aの図形が表示されている。
【0048】
そして、監視装置100と被監視装置200間の通信不可の間に被監視装置200で障害が発生した場合、被監視装置200の図形(被監視装置A200a)の近傍に、四角いボックスの要チェック表示マーク402を点滅表示する。
【0049】
この要チェック表示マーク402をマウス等で選択すると、監視装置100と被監視装置200間の通信不可の間に被監視装置200で発生した障害情報の中の一番古い障害情報の障害名称を、障害発生時刻とともに、エラー表示領域400に表示する。この時、動作情報も変わっている場合は、システム構成図表示部401における各監視装置、被監視装置の動作情報も変更する。
【0050】
図5においては、図4に示す画面上の要チェック表示マーク402を、操作者がマウス等で一回クリックした際に、過去の障害情報を表示させた画面の表示例を示している。
【0051】
ここでは、被監視装置200で警告が発生していた場合を示し、エラー表示領域400に「被監視装置A警告発生」と表示し、且つシステム構成図表示部401には、過去の障害情報を表示していることを示すために、再生中表示アイコン((図中「Replay中」と記載)403と表示される。
【0052】
図6では、図5に示す画面上で要チェック表示マーク402がもう一度クリックされ、被監視装置200で発生していた警告が復旧していた状態を表示した画面を表している。
【0053】
図5の画面において過去の全ての障害情報が再表示されると、図6における要チェック表示マーク402は点滅をしなくなる。そして、さらに要チェック表示マーク402を操作者がクリックすると、要チェック表示マーク402と再生中表示アイコン403(「Replay中」)の表示が消え、リアルタイムの表示に戻る。
【0054】
図7は、図1における監視情報表示システムで管理する障害情報のデータフォーマット例を示す説明図である。
【0055】
障害情報(図中「障害情報データ」と記載)500は、障害発生機器名称501、障害発生時刻502、障害名称503、障害種別504、障害ログ情報505で構成される。障害種別504は、エラーレベルとも呼ばれ、障害の重要度を表すデータであり、その内容を図10に示し、また、障害ログ情報505は、障害を検出したソフトウエアやハードウエアからのリターンコードなど、障害解析を行う為に必要な情報である。
【0056】
図10は、図7における障害種別の詳細を示す説明図である。
【0057】
障害種別(エラーレベル)504は、機器にあたえる影響が一番深刻な障害で被監視装置の停止を伴う重故障504aと、一時的な障害で、障害の要因が取り除かれれば自然復旧する可能性がある警告504b、および、各機器の状態変化やネットワーク構成の変化など障害ではない情報であるインフォメーション504cの3分類で区別する。
【0058】
図8は、図1における監視情報表示システムで管理される動作情報のデータフォーマット例を示す説明図である。
【0059】
動作情報(図中「動作情報データ」と記載)600は、運転状態601と動作状態602の情報からなり、運転状態601のデータ内容を図11に、動作状態602のデータ内容を図12に示す。
【0060】
図11は、図8における動作情報の運転状態情報の詳細例を示す説明図であり、図12は、図8における動作情報の動作状態情報の詳細例を示す説明図である。
【0061】
図11に示すように、運転状態601は、被監視装置(200)の運転状態によって、運転中601aと停止中601bに分けられ、また、図12に示すように、動作状態602は、被監視装置(200)の障害の発生有無(異常状態)によって正常602aと異常602bに分けられる。被監視装置(200)が重故障発生の場合、動作状態602は異常602bとなる。
【0062】
図9は、図1における監視情報表示システムで管理される障害情報ファイルのファイルフォーマット例を示す説明図である。
【0063】
障害情報ファイル700は、図7に示す障害情報500と図8に示す動作情報600の内容が合わさったもので、これに、発生した障害情報順に通番701を追加したものである。この通番は、障害発生時刻の早い順に、「1」から始まる通し番号が付けられて、障害情報ファイル700に格納される。
【0064】
この障害情報ファイル700は、被監視装置(200)と監視装置(100)との通信が可能になった場合、全ファイルが被監視装置(200)から監視装置(100)に転送され、転送後、被監視装置(200)における障害情報ファイル700の中身は消去される。
【0065】
図13は、図1における監視情報表示システムによる監視画面の表示処理動作例を示すフローチャートである。
【0066】
まず、監視装置(100)は、一定周期で、各FA装置(被監視装置)に障害情報ファイル204aがないかチェックする(ステップS1301)。
【0067】
障害情報ファイル204aが存在した場合、該当FA装置の障害情報ファイル204aを監視装置(100)で複製し(ステップS1302)、複製完了後、FA装置上の障害情報ファイル204aを消去する(ステップS1303)。
【0068】
監視装置(100)では、収集した障害情報ファイル204aのデータをチェックし(ステップS1304)、障害情報ファイルフォーマットの通番単位に障害種別504の値をチェックし、障害種別504の値が、重故障504a又は、警告504bが含まれているか否か判別する(ステップS1305)。
【0069】
障害種別504の値として、重故障504a又は、警告504bが含まれておらず、インフォメーション504cしかなかった場合は、何もせず、ステップS1301の処理に戻り、障害情報ファイル204aが存在した他のFA装置に関しても同様に、障害種別504の値のチェックを行う。
【0070】
障害種別504の値として重故障504a又は警告504bが含まれているならば、表示画面上で、障害情報ファイル204aが存在したFA装置を表す図形に、またはその近傍に、要チェック表示マーク402を表示し、点滅表示にする(ステップS1306)。
【0071】
そして、点滅表示した要チェック表示マーク402に対するオペレーターによるクリック操作により、リアルタイム表示を中止し、障害情報再生画面に切り替え、再生中表示アイコン403(「Replay中」)の表示を行なう(ステップS1307)。
【0072】
さらに、要チェック表示マーク402を点滅表示しながら(ステップS1308)、障害情報ファイル204aの通番701で最も番号の大きいもの(最新の情報)をエラー表示領域(400)に表示する(ステップS1309)。尚、この際、障害発生時の該当FA装置の状態(図8に示す動作情報データフォーマット600のデータを参照)も併せて表示する。
【0073】
表示している障害情報の他にまだ障害情報があり(ステップS1310)、ステップS1308において点滅している要チェック表示マーク402がクリックされると、次に新しい障害情報(一つ前の通番701の情報を表示)を同様に表示する動作を繰り返す(ステップS1308〜S1310)。
【0074】
再生表示する障害情報がなくなった場合、要チェック表示マーク402は点滅表示を止め、通常表示に切り替わる(ステップS1311)。そして、このような通常表示の要チェック表示マーク402がオペレータによる再度押された場合、障害情報再生画面を中止し、リアルタイム表示に戻し、再生中表示アイコン403(「Replay中」)の表示を消去する(ステップS1312)。
【0075】
尚、再生表示中に、各FA装置で障害が発生した場合も、再生表示を中止し、リアルタイム表示に戻し、再生中表示アイコン403(「Replay中」)の表示を消去する。要チェック表示マーク402は、任意の処理で消すことができる。
【0076】
図14は、図1の監視情報表示システムによる正常時における監視画面の表示処理動作例を示す説明図であり、図15は、図1の監視情報表示システムによる異常時における監視画面の表示処理動作例を示す説明図である。
【0077】
図14においては、監視装置100の正常(オンライン)時に被監視装置で発生した障害の表示動作例を示している。例えば、障害種別が「重故障」であれば、被監視装置(200)における実際の運転状態は「停止中」で、異常状態は「異常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態も「停止中」と「異常」となり、当該メッセージが出力される。
【0078】
また、障害種別が「警告」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「警告」となり、当該メッセージが出力される。
【0079】
そして、障害種別が「インフォメーション」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「正常」となり、当該メッセージが出力される。
【0080】
図15においては、監視装置100の停止(オフライン)中に被監視装置で発生した障害の、監視装置100復旧時における表示動作例を示している。例えば、障害種別が「重故障」であれば、被監視装置(200)における実際の運転状態は「停止中」で、異常状態は「異常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態も「停止中」と「異常」となるが、当該メッセージは出力しない。
【0081】
また、障害種別が「警告」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態は、正常復帰後であれば「運転中」と「正常」となり、また、正常復帰前であれば「運転中」と「警告」となる。尚、当該メッセージは出力しない。
【0082】
そして、障害種別が「インフォメーション」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「正常」となり、当該メッセージは出力しない。
【0083】
以上、図1〜図15を用いて説明したように、本例では、監視装置100と、被監視装置200であるFA装置とそれらを接続するネットワーク300から構成されるリアルタイムプロセス制御システムにおいて、監視装置100またはネットワーク300の障害回復後に監視装置200が受信した、障害発生中に被監視装置200で一時保存された、被監視装置200の障害情報及び動作情報を、システム運用管理者に分かりやすく、迅速に障害状況を表示する。
【0084】
すなわち、本例では、監視装置100の停止中またはネットワーク300の停止中の通信停止中に被監視装置200で発生した障害を、被監視装置200において、障害情報と合わせて、動作情報も保存蓄積する。
【0085】
そして、監視装置100との通信回復後に、監視装置100において、通信停止中に被監視装置200で蓄積されていた障害情報および動作情報を収集し、再表示する。
【0086】
この再表示する際に、監視装置100では、具備したモニターで表示するシステム構成図(監視画面)において、通信停止中に状態変化があった被監視装置200を表す図形の近傍に、状態変化があったことを示すマークを表示する。
【0087】
そして、このマークをオペレータ(監視者)が、マウス等でクリック操作して選択すると、被監視装置200の状態、障害名称、障害発生時間等をモニタに表示する。通信停止中に、被監視装置200において複数の状態変化があった場合には、オペレータが連続してマークをマウス等で選択することにより、複数の障害情報を順次、表示する。
【0088】
このように、障害情報と合わせて、被監視装置200の動作情報も保存することにより、監視装置100の監視画面において、被監視装置200の動作状態も監視画面において再表示することができる。
【0089】
また、監視装置100の監視画面において、動作状態が変化した被監視装置200に特定の印(要チェック表示マーク402)を付けることにより、オペレータ(監視員)による障害の早期発見に非常に効果がある。
【0090】
さらに、監視装置100の監視画面において、障害情報と合わせて動作状態を、障害の発生した順番で時系列に表示することにより、システム全体の障害の把握に効果があり、それによって、迅速な障害解析が可能となる。
【0091】
本発明によれば、障害情報と合わせて、被監視装置の動作情報も一緒に一時保存することにより、被監視装置の動作状態も監視画面において再表示することができる。
【0092】
尚、本発明は、図1〜図15を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例では、被監視装置200としてFA装置を例に説明したが、コンピュータネットワークに接続されたコンピュータ処理による障害監視・通信機能を有する装置であれば良い。
【0093】
また、ネットワーク300に関しても、本例では特に特定していないが、インターネットやイントラネット、ローカルエリアネットワーク、ワイドエリアネットワーク等を用いる構成でも良い。
【0094】
また、監視装置100および被監視装置200のコンピュータ構成例としては、キーボードや光ディスクの駆動装置の無いコンピュータ構成としても良い。また、本例では、光ディスクを記録媒体として用いているが、FD(Flexible Disk)等を記録媒体として用いることでも良い。また、プログラムのインストールに関しても、通信装置を介してネットワーク経由でプログラムをダウンロードしてインストールすることでも良い。
【0095】
【発明の効果】
本発明によれば、監視装置またはネットワークの障害回復後に監視装置が受信した、障害発生中の被監視装置で一時保存された、被監視装置の障害情報および被監視装置の動作情報を、システム運用管理者に分かりやすく迅速に表示することができ、監視装置と、FA装置等の被監視装置、および、それらを接続するネットワークから構成されるネットワーク監視システムの性能の向上を図りることが可能である。
【図面の簡単な説明】
【図1】本発明に係わる監視情報表示システムの構成例を示すブロック図である。
【図2】図1における監視情報表示システムの正常時の動作例を示す説明図である。
【図3】図1における監視情報表示システムの異常発生時の動作例を示す説明図である。
【図4】図1における監視情報表示システムの第1の画面表示例を示す説明図である。
【図5】図1における監視情報表示システムの第2の画面表示例を示す説明図である。
【図6】図1における監視情報表示システムの第3の画面表示例を示す説明図である。
【図7】図1における監視情報表示システムで管理する障害情報のデータフォーマット例を示す説明図である。
【図8】図1における監視情報表示システムで管理される動作情報のデータフォーマット例を示す説明図である。
【図9】図1における監視情報表示システムで管理される障害情報ファイルのファイルフォーマット例を示す説明図である。
【図10】図7における障害種別の詳細を示す説明図である。
【図11】図8における動作情報の運転状態情報の詳細例を示す説明図である。
【図12】図8における動作情報の動作状態情報の詳細例を示す説明図である。
【図13】図1における監視情報表示システムによる監視画面の表示処理動作例を示すフローチャートである。
【図14】図1の監視情報表示システムによる正常時における監視画面の表示処理動作例を示す説明図である。
【図15】図1の監視情報表示システムによる異常時における監視画面の表示処理動作例を示す説明図である。
【符号の説明】
100:監視装置、100a:監視装置の図形、101:情報収集部、102:情報表示処理部、200:被監視装置、200a,210a:被監視装置の図形、201:障害情報、202:障害通信部、203:動作情報通信部、204:障害保存部、204a:障害情報ファイル、300:ネットワーク、300a:ネットワークの図形、400:エラー表示領域、401:システム構成図表示部(「レイアウト表示領域」)、402:要チェック表示マーク(通知情報)、403:再生中表示アイコン(「Replay中」)、500:障害情報(「障害情報データ」)、501:障害発生機器名称、502:障害発生時刻、503:障害名称、504:障害種別、504a:重故障、504b:警告、504c:インフォメーション、505:障害ログ情報、600:動作情報(「動作情報データ」)、601:運転状態、601a:運転中、601b:停止中、602:動作状態、602a:正常、602b:異常、700:障害情報ファイル、701:通番。
【発明の属する技術分野】
本発明は、システムの障害情報を表示する技術に係わり、特に、リアルタイムプロセス制御監視システムにおいて、監視装置がメンテナンスや故障、プログラム不良、またはネットワークの障害などにより、リアルタイムに被監視装置の障害情報、及び、運転状態を表示できない時に、障害回復後に障害中の監視情報を表示する監視情報表示システムと方法およびそのプログラムと監視装置に関するものである。
【0002】
【従来の技術】
FA(Factory Automation)システムなどで使われるネットワークでは、ネットワーク内の各機器の監視情報を、リアルタイムで1台の監視装置に集め、この監視装置において、各機器毎の監視情報を表示し集中管理している。
【0003】
この技術の利点は、一台のマシン(監視装置)で、各監視対象の機器(被監視装置)の監視情報をリアルタイムに確認できることにある。
【0004】
しかし、この技術では、監視装置がメンテナンスや故障、プログラム不良などにより停止中の場合、または、ネットワークの障害等により通信停止中の場合には、停止中に被監視装置で発生した監視情報は、監視装置において収集されておらず表示することができない。その結果、監視装置停止中、もしくはネットワーク停止中に発生した監視情報は、見逃されてしまう。
【0005】
また、警告情報(送信バッファの使用量がしきい値を超えた場合等に生成される警告情報など)があった場合は、被監視装置の状態は、「正常→警告」と変化するが、時間の経過と共ににしきい値を下回った場合は、正常状態に戻る。そのため、監視装置やネットワークの停止中に、被監視装置が「正常→警告→正常」と状態遷移した場合、監視装置もしくはネットワークが復旧した後に、監視装置側で被監視装置の最新状態を見ても正常状態となっており、障害発生に気づくのが遅れてしまう。
【0006】
このような監視装置側の異常時もしくは通信回線側の異常時においても、監視情報を紛失することなく、また被監視システムにおける監視情報の発生時刻を正確に把握することを可能とする技術が、例えば、特開平8−79335号公報に記載されている。
【0007】
この技術では、被監視システムで発生した監視情報に対して時刻情報を付加する手段と、時刻情報を付加した監視情報を蓄積する手段と、蓄積した監視情報を監視システムへ送信する手段と、送信が正常に終了した場合、蓄積した監視情報を削除する手段と、送信が正常に終了しなかった場合、蓄積した監視情報の監視システムへの送信を再試行する手段を設けている。
【0008】
さらに、監視システムや通信回線の状態を監視し異常を検出する手段を有し、監視システムまたは通信回線の異常を検出した場合、蓄積した監視情報を監視システムへ送信せず、監視システムまたは通信回線の異常回復を検出した場合に、蓄積した監視情報を監視システムへ送信するようにしている。
【0009】
これらの手段を有することにより、被監視システムにおいて発生した全ての監視情報が紛失することなく監視システムへ転送されるので、通信回線の状態に影響されずに被監視システムを監視することが可能になり、また、被監視システムで発生した監視情報にその正確な発声時刻を付与して監視システムに転送するので、監視システムではその監視情報が被監視システムのどの故障に関係あるものなのかを容易に判定でき、故障原因や故障の前兆を分析するのに有効である。
【0010】
しかしながら、この技術では、被監視システム側の監視情報を、漏れなく、監視システム側に転送するだけであり、監視システム側において、転送されてきた監視情報を効率的に処理することはできない。
【0011】
すなわち、この従来技術では、監視システムや通信回線の異常回復時に、被監視システムから、蓄えられた監視情報が全て監視システム側に送信されてくる。そのため、例えば、監視システムまたは通信回線の異常による送信停止が長時間に渡った場合、異常復旧時には大量の監視情報が監視システムに送られてくる。
【0012】
このように、大量の監視情報が送られてくると、監視システムでは、送信停止中の被監視装置の状況把握や、分析に多大な時間を要してしまう。また、被監視装置の状態が変わらない障害(警告やインフォメーションなど)が発生した場合は、障害の発生があったことを見逃してしまう可能性が高い。
【0013】
【発明が解決しようとする課題】
解決しようとする問題点は、従来の技術では、監視装置またはネットワークの障害回復後に監視装置が受信した、障害発生中の被監視装置で一時保存された、被監視装置の障害情報および被監視装置の動作情報を、システム運用管理者に分かりやすく迅速に表示することができない点である。
【0014】
本発明の目的は、これら従来技術の課題を解決し、監視装置と、FA装置等の被監視装置、および、それらを接続するネットワークから構成されるネットワーク監視システムの性能の向上を図ることである。
【0015】
【課題を解決するための手段】
上記目的を達成するため、本発明では、監視装置停止中、またはネットワーク停止中に被監視装置で発生した障害を、被監視装置で障害情報と合わせて、動作情報も保存蓄積し、監視装置との通信回復後に、監視装置において、監視装置停止、もしくはネットワーク停止中に被監視装置にて蓄積されていた障害情報、及び動作情報を収集して記憶装置に保存し、再表示する。この再表示の際、監視装置のモニターで表示されるシステム構成図(監視画面)において、監視装置停止中、またはネットワーク停止中に状態変化があった被監視装置を表す図形の近傍に、状態変化があったことを示すマーク(通知情報)を表示する。そして、監視者が、状態変化のあるマークをマウス等でクリック操作して選択することに伴い、記憶装置に保存しておいた被監視装置の状態、障害名称、障害発生時間を読み出して、レプレイ表示する。複数の状態変化があった場合には、監視者が連続して状態変化のあるマークをマウス等で選択することにより、複数の障害情報を順次、表示する。このように、障害情報と合わせて、被監視装置の動作情報も保存することにより、被監視装置の動作状態も監視画面において再表示(リプレイ表示)することができる。また、動作状態が変化した被監視装置に特定の印を付けることにより、監視員による障害の早期発見に非常に効果がある。さらに、監視画面において、障害情報と合わせて動作状態を、障害の発生した順番で時系列に表示することにより、監視者によるシステム全体の障害の把握に効果があり、それによって、迅速な障害解析が可能となる。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
【0017】
図1は、本発明に係わる監視情報表示システムの構成例を示すブロック図であり、図2は、図1における監視情報表示システムの正常時の動作例を示す説明図、図3は、図1における監視情報表示システムの異常発生時の動作例を示す説明図、図4は、図1における監視情報表示システムの第1の画面表示例を示す説明図、図5は、図1における監視情報表示システムの第2の画面表示例を示す説明図、図6は、図1における監視情報表示システムの第3の画面表示例を示す説明図である。
【0018】
図1において、100は監視装置、200はFA装置等の被監視装置、300がそれらを繋ぐネットワークであり、監視装置100と被監視装置200のそれぞれは、CPU(Central Processing Unit)や主メモリ、表示装置、入力装置、外部記憶装置等からなるコンピュータ構成となっており、光ディスク駆動装置等を介してCD−ROM等の記憶媒体に記録されたプログラムやデータを外部記憶装置内にインストールした後、この外部記憶装置から主メモリに読み込みCPUで処理することにより、各処理部の機能が実装される。
【0019】
例えば、監視装置100においては、情報収集部101と情報表示処理部102が設けられ、被監視装置200においては、障害通信部202と動作情報通信部203および障害保存部204が設けられている。
【0020】
尚、本図では、被監視装置200は、ネットワーク300に接続された複数の被監視装置を代表して図示されているものであり、実際には、被監視装置200と同様の構成の複数の被監視装置がネットワーク300に接続されており、監視装置100において、これら被監視装置200を含む複数の被監視装置の稼働状況を集中管理する構成である。
【0021】
このような監視装置100と複数の被監視装置200およびそれらを接続するネットワーク300からなる本システムでは、監視装置100において、被監視装置200の稼働状態をリアルタイムに監視するために、被監視装置200から監視情報がイベントとして監視装置100に報告され、監視装置100で表示する。
【0022】
監視装置100では、ネットワーク300の構成を模した図形でシステム構成を表示しており、被監視装置200が停止した時は、該当する被監視装置200を示す図形を青色(被監視装置停止中)表示に変える等する。
【0023】
また、被監視装置200で障害報告があった場合は、障害名称を監視装置100のモニターに表示して、ネットワーク300内の各被監視装置200の障害状態を監視装置1台で把握できるようにしている。
【0024】
被監視装置200の実際の状態(動作状態、または動作情報)について説明する。被監視装置200は、自装置に埋め込まれたランプの点灯によって、自装置の2種類の状態を表すことができる。
【0025】
1つは運転状態によって、「運転中」と「停止中」に分けられる。もう一つは、障害の発生有無によって「正常」と「異常」に分けられる。被監視装置200は重故障発生の場合、「異常」となる。
【0026】
また、被監視装置200の稼働状態としては「正常」と「異常」以外に「警告」があるが、これは、被監視装置200のランプの状態からは判断できない、内部的な状態である。
【0027】
従って、監視装置100において、被監視装置200の障害を表示する場合、被監視装置200の稼働状態を示すものとして「正常」と「異常」に「警告」が加わる。
【0028】
被監視装置200から監視装置100に報告される障害情報としては、このような被監視装置200で発生した障害のレベルを示す障害種別、障害名称(エラーメッセージ)、障害発生時刻情報、障害詳細情報(障害解析に必要なログなど)などと共に、被監視装置200の立上げ立ち下げなどの状態変化等、障害と直接関係ない情報も含まれる。
【0029】
障害種別(エラーレベル)は、障害の重要度に応じてレベル分けを行うものであり、ここでは便宜上3つのレベル(重故障、警告、インフォメーション)に分ける。監視装置100においては、それぞれの障害の重要度に応じて被監視装置200の状態表示を変える構成とする。
【0030】
例えば、システム(被監視装置)停止を伴う重大な障害は、状態表示を「重故障」として、監視装置100のネットワーク300内の機器を示す図形の表示を元々の緑色(正常)から青色(被監視装置停止中)表示に変える。
【0031】
また、送信バッファの使用量がしきい値を超えた等のような、当該被監視装置の停止を伴わない一時的で軽微な故障は、「警告」のレベルとして、当該被監視装置の状態を一時的に黄色(警告)表示にするが、その後に正常復帰(送信バッファの使用量がしきい値を下回った等)した場合は、回復メッセージの出力と共に、被監視装置の状態を緑色表示に戻す。
【0032】
そして、各機器の状態変化やネットワーク構成の変化など、障害ではない情報は、「インフォメーション」のレベルとして、機器の状態表示はそのまま緑色とする。
【0033】
このように、障害の重要度を色分けすることにより、監視員に障害の重要度を認識させ易くし、障害発生後の対応を誤らないようにしている。
【0034】
このような構成において、図1の監視情報表示システムでは、通常は、ネットワーク300を介して接続された複数の被監視装置200の稼働状態を一台の監視装置100においてリアルタイムに監視しているが、監視装置100またはネットワーク300に障害が発生して通信停止状態となった場合には、その通信停止中、被監視装置200において、自装置で検出した自装置の稼働状態や障害状態を示す監視情報を時系列に蓄積しておき、このように、被監視装置200において蓄積された監視情報を、障害回復後に監視装置100が受信し、監視装置100において、具備した表示装置に、その監視情報(障害情報)を時系列に表示する。
【0035】
特に、本例の監視装置100では、情報収集部101により、障害回復後に被監視装置200から時系列の監視情報(障害情報)を受信し、障害情報ファイル204aとして記憶装置に蓄積し、情報表示処理部102により、蓄積した時系列の障害情報ファイル204aを参照して被監視装置200の障害中における稼働状態の変化を検出し、具備した表示装置に、被監視装置200の障害中における状態変化があったことを示す通知情報を表示すると共に、この通知情報に対する操作者の指示に応じて順次に、障害情報ファイル204aから被監視装置200の監視情報(障害情報)を時系列に読み出して表示装置で表示する。
【0036】
さらに、監視装置100は、ネットワーク300およびネットワーク300上での自装置と被監視装置200の配置構成および通知情報を、図形により表示装置の第1の画面領域に表示し、通知情報に対する操作者の指示に対応して読み出した監視情報を、表示装置の第2の画面領域に表示する。特に、第1の画面領域においては、通知情報の図形を当該被監視装置の近傍に表示する。
【0037】
以下、図2から図6に基づき、本例の監視情報表示システムの動作説明を行なう。
【0038】
図2においては、監視装置100およびネットワーク300が正常に動作している際に、被監視装置200で障害が発生した場合の障害情報の流れを示している。
【0039】
すなわち、被監視装置200で障害が発生した場合、その障害情報201は、障害通信部202によって、監視装置100に送信される。また、動作情報通信部203によって、被監視装置200の動作情報が一定間隔で、監視装置100に送信される。
【0040】
監視装置100では、障害通信部202および動作情報通信部203から送られてきた情報を情報収集部101で収集し、情報表示処理部102により、これらの情報を基に、被監視装置200の障害情報や動作状態を、監視画面として、表示装置のディスプレイ上に表示する。
【0041】
図3では、被監視装置200から監視装置100に、被監視装置200の障害情報と動作情報を送信できない場合における、被監視装置200で発生した障害の障害情報の流れを示している。
【0042】
このような場合、被監視装置200で障害が発生すると、被監視装置200は、その障害情報201を、障害通信部202によって、監視装置100に送信するが、送信が失敗するので、被監視装置200は、監視装置100もしくはネットワーク300上に障害が発生したとみなして、障害保存部204により、当該障害情報と、動作情報通信部203で収集した動作情報を、障害情報ファイル204aとして保存する。
【0043】
この後の処理の流れ、すなわち、被監視装置200から監視装置100への送信が回復した場合の障害情報の流れを、図1を用いて説明する。
【0044】
図1において、監視装置100は、被監視装置200との通信が回復した後、情報収集部101により、被監視装置200にアクセスして障害保存部204をチェックし、障害保存部204に障害情報ファイル204aがあれば、それらを取り込む。
【0045】
全ての情報を取り込んだら、監視装置100は、情報表示処理部102により、監視情報として画面表示すると共に、被監視装置200に対して、障害保存部204で保存している障害情報ファイル204aの削除を指示する。指示を受けた被監視装置200では障害保存部204に蓄えられた障害情報ファイル204aを削除する。
【0046】
図4においては、監視装置100と被監視装置A200が通信不可となり、その後復旧した時の、監視装置100の表示装置に表示する監視画面の表示例を示している。
【0047】
監視画面は、障害名称、障害発生時刻などを表示するエラー表示領域400と、監視装置が監視しているシステム内の監視装置100、被監視装置200,210、及びそれらを繋ぐネットワーク300を図形化して表示するシステム構成図表示部(図中「レイアウト表示領域」と記載)401からなる。このシステム構成図表示部401において、監視装置100a、被監視装置200a,210a、ネットワーク300aの図形が表示されている。
【0048】
そして、監視装置100と被監視装置200間の通信不可の間に被監視装置200で障害が発生した場合、被監視装置200の図形(被監視装置A200a)の近傍に、四角いボックスの要チェック表示マーク402を点滅表示する。
【0049】
この要チェック表示マーク402をマウス等で選択すると、監視装置100と被監視装置200間の通信不可の間に被監視装置200で発生した障害情報の中の一番古い障害情報の障害名称を、障害発生時刻とともに、エラー表示領域400に表示する。この時、動作情報も変わっている場合は、システム構成図表示部401における各監視装置、被監視装置の動作情報も変更する。
【0050】
図5においては、図4に示す画面上の要チェック表示マーク402を、操作者がマウス等で一回クリックした際に、過去の障害情報を表示させた画面の表示例を示している。
【0051】
ここでは、被監視装置200で警告が発生していた場合を示し、エラー表示領域400に「被監視装置A警告発生」と表示し、且つシステム構成図表示部401には、過去の障害情報を表示していることを示すために、再生中表示アイコン((図中「Replay中」と記載)403と表示される。
【0052】
図6では、図5に示す画面上で要チェック表示マーク402がもう一度クリックされ、被監視装置200で発生していた警告が復旧していた状態を表示した画面を表している。
【0053】
図5の画面において過去の全ての障害情報が再表示されると、図6における要チェック表示マーク402は点滅をしなくなる。そして、さらに要チェック表示マーク402を操作者がクリックすると、要チェック表示マーク402と再生中表示アイコン403(「Replay中」)の表示が消え、リアルタイムの表示に戻る。
【0054】
図7は、図1における監視情報表示システムで管理する障害情報のデータフォーマット例を示す説明図である。
【0055】
障害情報(図中「障害情報データ」と記載)500は、障害発生機器名称501、障害発生時刻502、障害名称503、障害種別504、障害ログ情報505で構成される。障害種別504は、エラーレベルとも呼ばれ、障害の重要度を表すデータであり、その内容を図10に示し、また、障害ログ情報505は、障害を検出したソフトウエアやハードウエアからのリターンコードなど、障害解析を行う為に必要な情報である。
【0056】
図10は、図7における障害種別の詳細を示す説明図である。
【0057】
障害種別(エラーレベル)504は、機器にあたえる影響が一番深刻な障害で被監視装置の停止を伴う重故障504aと、一時的な障害で、障害の要因が取り除かれれば自然復旧する可能性がある警告504b、および、各機器の状態変化やネットワーク構成の変化など障害ではない情報であるインフォメーション504cの3分類で区別する。
【0058】
図8は、図1における監視情報表示システムで管理される動作情報のデータフォーマット例を示す説明図である。
【0059】
動作情報(図中「動作情報データ」と記載)600は、運転状態601と動作状態602の情報からなり、運転状態601のデータ内容を図11に、動作状態602のデータ内容を図12に示す。
【0060】
図11は、図8における動作情報の運転状態情報の詳細例を示す説明図であり、図12は、図8における動作情報の動作状態情報の詳細例を示す説明図である。
【0061】
図11に示すように、運転状態601は、被監視装置(200)の運転状態によって、運転中601aと停止中601bに分けられ、また、図12に示すように、動作状態602は、被監視装置(200)の障害の発生有無(異常状態)によって正常602aと異常602bに分けられる。被監視装置(200)が重故障発生の場合、動作状態602は異常602bとなる。
【0062】
図9は、図1における監視情報表示システムで管理される障害情報ファイルのファイルフォーマット例を示す説明図である。
【0063】
障害情報ファイル700は、図7に示す障害情報500と図8に示す動作情報600の内容が合わさったもので、これに、発生した障害情報順に通番701を追加したものである。この通番は、障害発生時刻の早い順に、「1」から始まる通し番号が付けられて、障害情報ファイル700に格納される。
【0064】
この障害情報ファイル700は、被監視装置(200)と監視装置(100)との通信が可能になった場合、全ファイルが被監視装置(200)から監視装置(100)に転送され、転送後、被監視装置(200)における障害情報ファイル700の中身は消去される。
【0065】
図13は、図1における監視情報表示システムによる監視画面の表示処理動作例を示すフローチャートである。
【0066】
まず、監視装置(100)は、一定周期で、各FA装置(被監視装置)に障害情報ファイル204aがないかチェックする(ステップS1301)。
【0067】
障害情報ファイル204aが存在した場合、該当FA装置の障害情報ファイル204aを監視装置(100)で複製し(ステップS1302)、複製完了後、FA装置上の障害情報ファイル204aを消去する(ステップS1303)。
【0068】
監視装置(100)では、収集した障害情報ファイル204aのデータをチェックし(ステップS1304)、障害情報ファイルフォーマットの通番単位に障害種別504の値をチェックし、障害種別504の値が、重故障504a又は、警告504bが含まれているか否か判別する(ステップS1305)。
【0069】
障害種別504の値として、重故障504a又は、警告504bが含まれておらず、インフォメーション504cしかなかった場合は、何もせず、ステップS1301の処理に戻り、障害情報ファイル204aが存在した他のFA装置に関しても同様に、障害種別504の値のチェックを行う。
【0070】
障害種別504の値として重故障504a又は警告504bが含まれているならば、表示画面上で、障害情報ファイル204aが存在したFA装置を表す図形に、またはその近傍に、要チェック表示マーク402を表示し、点滅表示にする(ステップS1306)。
【0071】
そして、点滅表示した要チェック表示マーク402に対するオペレーターによるクリック操作により、リアルタイム表示を中止し、障害情報再生画面に切り替え、再生中表示アイコン403(「Replay中」)の表示を行なう(ステップS1307)。
【0072】
さらに、要チェック表示マーク402を点滅表示しながら(ステップS1308)、障害情報ファイル204aの通番701で最も番号の大きいもの(最新の情報)をエラー表示領域(400)に表示する(ステップS1309)。尚、この際、障害発生時の該当FA装置の状態(図8に示す動作情報データフォーマット600のデータを参照)も併せて表示する。
【0073】
表示している障害情報の他にまだ障害情報があり(ステップS1310)、ステップS1308において点滅している要チェック表示マーク402がクリックされると、次に新しい障害情報(一つ前の通番701の情報を表示)を同様に表示する動作を繰り返す(ステップS1308〜S1310)。
【0074】
再生表示する障害情報がなくなった場合、要チェック表示マーク402は点滅表示を止め、通常表示に切り替わる(ステップS1311)。そして、このような通常表示の要チェック表示マーク402がオペレータによる再度押された場合、障害情報再生画面を中止し、リアルタイム表示に戻し、再生中表示アイコン403(「Replay中」)の表示を消去する(ステップS1312)。
【0075】
尚、再生表示中に、各FA装置で障害が発生した場合も、再生表示を中止し、リアルタイム表示に戻し、再生中表示アイコン403(「Replay中」)の表示を消去する。要チェック表示マーク402は、任意の処理で消すことができる。
【0076】
図14は、図1の監視情報表示システムによる正常時における監視画面の表示処理動作例を示す説明図であり、図15は、図1の監視情報表示システムによる異常時における監視画面の表示処理動作例を示す説明図である。
【0077】
図14においては、監視装置100の正常(オンライン)時に被監視装置で発生した障害の表示動作例を示している。例えば、障害種別が「重故障」であれば、被監視装置(200)における実際の運転状態は「停止中」で、異常状態は「異常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態も「停止中」と「異常」となり、当該メッセージが出力される。
【0078】
また、障害種別が「警告」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「警告」となり、当該メッセージが出力される。
【0079】
そして、障害種別が「インフォメーション」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「正常」となり、当該メッセージが出力される。
【0080】
図15においては、監視装置100の停止(オフライン)中に被監視装置で発生した障害の、監視装置100復旧時における表示動作例を示している。例えば、障害種別が「重故障」であれば、被監視装置(200)における実際の運転状態は「停止中」で、異常状態は「異常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態も「停止中」と「異常」となるが、当該メッセージは出力しない。
【0081】
また、障害種別が「警告」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態は、正常復帰後であれば「運転中」と「正常」となり、また、正常復帰前であれば「運転中」と「警告」となる。尚、当該メッセージは出力しない。
【0082】
そして、障害種別が「インフォメーション」であれば、被監視装置(200)における実際の運転状態は「運転中」で、異常状態は「正常」であり、それに伴い復旧した監視装置(100)において表示される被監視装置(200)の状態は「運転中」と「正常」となり、当該メッセージは出力しない。
【0083】
以上、図1〜図15を用いて説明したように、本例では、監視装置100と、被監視装置200であるFA装置とそれらを接続するネットワーク300から構成されるリアルタイムプロセス制御システムにおいて、監視装置100またはネットワーク300の障害回復後に監視装置200が受信した、障害発生中に被監視装置200で一時保存された、被監視装置200の障害情報及び動作情報を、システム運用管理者に分かりやすく、迅速に障害状況を表示する。
【0084】
すなわち、本例では、監視装置100の停止中またはネットワーク300の停止中の通信停止中に被監視装置200で発生した障害を、被監視装置200において、障害情報と合わせて、動作情報も保存蓄積する。
【0085】
そして、監視装置100との通信回復後に、監視装置100において、通信停止中に被監視装置200で蓄積されていた障害情報および動作情報を収集し、再表示する。
【0086】
この再表示する際に、監視装置100では、具備したモニターで表示するシステム構成図(監視画面)において、通信停止中に状態変化があった被監視装置200を表す図形の近傍に、状態変化があったことを示すマークを表示する。
【0087】
そして、このマークをオペレータ(監視者)が、マウス等でクリック操作して選択すると、被監視装置200の状態、障害名称、障害発生時間等をモニタに表示する。通信停止中に、被監視装置200において複数の状態変化があった場合には、オペレータが連続してマークをマウス等で選択することにより、複数の障害情報を順次、表示する。
【0088】
このように、障害情報と合わせて、被監視装置200の動作情報も保存することにより、監視装置100の監視画面において、被監視装置200の動作状態も監視画面において再表示することができる。
【0089】
また、監視装置100の監視画面において、動作状態が変化した被監視装置200に特定の印(要チェック表示マーク402)を付けることにより、オペレータ(監視員)による障害の早期発見に非常に効果がある。
【0090】
さらに、監視装置100の監視画面において、障害情報と合わせて動作状態を、障害の発生した順番で時系列に表示することにより、システム全体の障害の把握に効果があり、それによって、迅速な障害解析が可能となる。
【0091】
本発明によれば、障害情報と合わせて、被監視装置の動作情報も一緒に一時保存することにより、被監視装置の動作状態も監視画面において再表示することができる。
【0092】
尚、本発明は、図1〜図15を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例では、被監視装置200としてFA装置を例に説明したが、コンピュータネットワークに接続されたコンピュータ処理による障害監視・通信機能を有する装置であれば良い。
【0093】
また、ネットワーク300に関しても、本例では特に特定していないが、インターネットやイントラネット、ローカルエリアネットワーク、ワイドエリアネットワーク等を用いる構成でも良い。
【0094】
また、監視装置100および被監視装置200のコンピュータ構成例としては、キーボードや光ディスクの駆動装置の無いコンピュータ構成としても良い。また、本例では、光ディスクを記録媒体として用いているが、FD(Flexible Disk)等を記録媒体として用いることでも良い。また、プログラムのインストールに関しても、通信装置を介してネットワーク経由でプログラムをダウンロードしてインストールすることでも良い。
【0095】
【発明の効果】
本発明によれば、監視装置またはネットワークの障害回復後に監視装置が受信した、障害発生中の被監視装置で一時保存された、被監視装置の障害情報および被監視装置の動作情報を、システム運用管理者に分かりやすく迅速に表示することができ、監視装置と、FA装置等の被監視装置、および、それらを接続するネットワークから構成されるネットワーク監視システムの性能の向上を図りることが可能である。
【図面の簡単な説明】
【図1】本発明に係わる監視情報表示システムの構成例を示すブロック図である。
【図2】図1における監視情報表示システムの正常時の動作例を示す説明図である。
【図3】図1における監視情報表示システムの異常発生時の動作例を示す説明図である。
【図4】図1における監視情報表示システムの第1の画面表示例を示す説明図である。
【図5】図1における監視情報表示システムの第2の画面表示例を示す説明図である。
【図6】図1における監視情報表示システムの第3の画面表示例を示す説明図である。
【図7】図1における監視情報表示システムで管理する障害情報のデータフォーマット例を示す説明図である。
【図8】図1における監視情報表示システムで管理される動作情報のデータフォーマット例を示す説明図である。
【図9】図1における監視情報表示システムで管理される障害情報ファイルのファイルフォーマット例を示す説明図である。
【図10】図7における障害種別の詳細を示す説明図である。
【図11】図8における動作情報の運転状態情報の詳細例を示す説明図である。
【図12】図8における動作情報の動作状態情報の詳細例を示す説明図である。
【図13】図1における監視情報表示システムによる監視画面の表示処理動作例を示すフローチャートである。
【図14】図1の監視情報表示システムによる正常時における監視画面の表示処理動作例を示す説明図である。
【図15】図1の監視情報表示システムによる異常時における監視画面の表示処理動作例を示す説明図である。
【符号の説明】
100:監視装置、100a:監視装置の図形、101:情報収集部、102:情報表示処理部、200:被監視装置、200a,210a:被監視装置の図形、201:障害情報、202:障害通信部、203:動作情報通信部、204:障害保存部、204a:障害情報ファイル、300:ネットワーク、300a:ネットワークの図形、400:エラー表示領域、401:システム構成図表示部(「レイアウト表示領域」)、402:要チェック表示マーク(通知情報)、403:再生中表示アイコン(「Replay中」)、500:障害情報(「障害情報データ」)、501:障害発生機器名称、502:障害発生時刻、503:障害名称、504:障害種別、504a:重故障、504b:警告、504c:インフォメーション、505:障害ログ情報、600:動作情報(「動作情報データ」)、601:運転状態、601a:運転中、601b:停止中、602:動作状態、602a:正常、602b:異常、700:障害情報ファイル、701:通番。
Claims (7)
- 監視装置またはコンピュータネットワークの障害中に被監視装置において蓄積された監視情報を、障害回復後に監視装置が受信し、該監視装置の表示装置に表示する監視情報表示システムであって、
上記監視装置は、上記障害回復後に受信した監視情報を記憶装置に蓄積する収集手段と、
上記記憶装置に蓄積した監視情報を参照して当該被監視装置の上記障害中における稼働状態の変化を検出し、上記表示装置に、当該被監視装置の上記障害中における状態変化があったことを示す通知情報を表示すると共に、該通知情報に対する操作者の指示に応じて順次に上記記憶装置から当該被監視装置の監視情報を時系列に読み出して上記表示装置で表示する表示処理手段と
を有することを特徴とする監視情報表示システム。 - ネットワークを介して接続された複数の被監視装置の稼働状態を一台の監視装置においてリアルタイムに監視するシステムであって、
上記被監視装置は、上記監視装置または上記ネットワークの障害中における自装置の稼働状態を示す監視情報を時系列に蓄積する保存手段を有し、
上記監視装置は、上記障害の回復に伴い、上記被監視装置が蓄積した監視情報を収集して記憶装置に蓄積する収集手段と、
上記記憶装置に蓄積した監視情報を参照して当該被監視装置の上記障害中における稼働状態の変化を検出し、上記表示装置に、当該被監視装置の上記障害中における状態変化があったことを示す通知情報を表示すると共に、該通知情報に対する操作者の指示に応じて順次に上記記憶装置から当該被監視装置の監視情報を時系列に読み出して上記表示装置で表示する表示処理手段と
を有することを特徴とする監視情報表示システム。 - 監視装置またはコンピュータネットワークの障害中に被監視装置において蓄積された監視情報を、障害回復後に監視装置が受信し、該監視装置の表示装置に表示する監視情報表示方法であって、
上記監視装置において、
上記障害の回復後に受信した監視情報を記憶装置に蓄積し、
上記記憶装置に蓄積した監視情報を参照して当該被監視装置の上記障害中における稼働状態の変化を検出し、
上記表示装置に、当該被監視装置の上記障害中における状態変化があったことを示す通知情報を表示し、
該通知情報に対する操作者の指示に応じて順次に上記記憶装置から当該被監視装置の上記障害中における監視情報を時系列に読み出して上記表示装置で表示することを特徴とする監視情報表示方法。 - 請求項3に記載の監視情報表示方法であって、
上記監視装置は、
上記ネットワーク上での自装置と上記被監視装置の配置構成および上記通知情報を図形により上記表示装置の第1の画面領域に表示し、上記通知情報に対する操作者の指示に対応して読み出した上記監視情報を上記表示装置の第2の画面領域に表示することを特徴とする監視情報表示方法。 - 請求項4に記載の監視情報表示方法であって、
上記監視装置は、上記第1の画面領域において上記通知情報の図形を当該被監視装置の近傍に表示することを特徴とする監視情報表示方法。 - コンピュータに、請求項3から請求項5のいずれかに記載の監視情報表示方法における各手順を実行させるためのプログラム。
- ネットワークを介して接続された複数の被監視装置を集中監視する監視装置であって、
自装置または上記ネットワークの障害中に上記被監視装置が時系列に蓄積した監視情報を、上記障害の回復後に収集して記憶装置に蓄積する収集手段と、
上記記憶装置に蓄積した監視情報を参照して当該被監視装置の稼働状態変化を検出して上記表示装置に表示すると共に、検出結果表示に対する操作者の指示に応じて順次に上記記憶装置から当該被監視装置の監視情報を時系列に読み出し上記表示装置に表示する表示処理手段と
を有することを特徴とする監視装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002256306A JP2004094701A (ja) | 2002-09-02 | 2002-09-02 | 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002256306A JP2004094701A (ja) | 2002-09-02 | 2002-09-02 | 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004094701A true JP2004094701A (ja) | 2004-03-25 |
Family
ID=32061565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002256306A Pending JP2004094701A (ja) | 2002-09-02 | 2002-09-02 | 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004094701A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006260434A (ja) * | 2005-03-18 | 2006-09-28 | Yaskawa Electric Corp | 制御装置 |
JP2008131074A (ja) * | 2006-11-16 | 2008-06-05 | Toshiba Corp | 遠隔監視システム |
JP2008129783A (ja) * | 2006-11-20 | 2008-06-05 | Mitsubishi Electric Corp | Pio伝送装置システム |
JP2009230206A (ja) * | 2008-03-19 | 2009-10-08 | Toshiba Corp | 情報処理装置及び情報処理方法 |
JP2010152683A (ja) * | 2008-12-25 | 2010-07-08 | Toshiba Corp | 故障要因表示機能を備えた情報処理装置 |
JP2010287256A (ja) * | 2004-04-30 | 2010-12-24 | Hitachi Ltd | サーバシステム及びサーバの配置方法 |
JP2011044121A (ja) * | 2009-08-21 | 2011-03-03 | Power Assist Co Ltd | パソコンのシステム監視プログラム |
JP2012027635A (ja) * | 2010-07-22 | 2012-02-09 | Hitachi Information Systems Ltd | 機器情報管理システム及び方法 |
JP2015537315A (ja) * | 2012-12-04 | 2015-12-24 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | ヒートマップを用いて情報技術の状況を表示 |
JP2017220139A (ja) * | 2016-06-10 | 2017-12-14 | 三菱電機株式会社 | ログ解析装置、ログ解析方法及びログ解析プログラム |
-
2002
- 2002-09-02 JP JP2002256306A patent/JP2004094701A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010287256A (ja) * | 2004-04-30 | 2010-12-24 | Hitachi Ltd | サーバシステム及びサーバの配置方法 |
JP2006260434A (ja) * | 2005-03-18 | 2006-09-28 | Yaskawa Electric Corp | 制御装置 |
JP2008131074A (ja) * | 2006-11-16 | 2008-06-05 | Toshiba Corp | 遠隔監視システム |
JP2008129783A (ja) * | 2006-11-20 | 2008-06-05 | Mitsubishi Electric Corp | Pio伝送装置システム |
JP4646896B2 (ja) * | 2006-11-20 | 2011-03-09 | 三菱電機株式会社 | Pio伝送装置システム |
JP2009230206A (ja) * | 2008-03-19 | 2009-10-08 | Toshiba Corp | 情報処理装置及び情報処理方法 |
JP2010152683A (ja) * | 2008-12-25 | 2010-07-08 | Toshiba Corp | 故障要因表示機能を備えた情報処理装置 |
JP2011044121A (ja) * | 2009-08-21 | 2011-03-03 | Power Assist Co Ltd | パソコンのシステム監視プログラム |
JP2012027635A (ja) * | 2010-07-22 | 2012-02-09 | Hitachi Information Systems Ltd | 機器情報管理システム及び方法 |
JP2015537315A (ja) * | 2012-12-04 | 2015-12-24 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | ヒートマップを用いて情報技術の状況を表示 |
US10121268B2 (en) | 2012-12-04 | 2018-11-06 | Entit Software Llc | Displaying information technology conditions with heat maps |
JP2017220139A (ja) * | 2016-06-10 | 2017-12-14 | 三菱電機株式会社 | ログ解析装置、ログ解析方法及びログ解析プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4172807B2 (ja) | 障害発生の原因箇所の発見を支援する技術 | |
CN102880522B (zh) | 面向硬件故障的系统关键文件故障纠正方法及装置 | |
US20090106363A1 (en) | Intelligent collection of diagnostic data for communication to diagnosis site | |
CN103207820B (zh) | 基于raid卡日志的硬盘的故障定位方法及装置 | |
US8286034B2 (en) | Accurate fault status tracking of variable access sensors | |
US20080028370A1 (en) | Simultaneous viewing of multiple tool execution results | |
CN105740110A (zh) | 一种linux系统下硬盘smart信息的检测方法 | |
JP2004094701A (ja) | 監視情報表示システムと監視情報表示方法およびプログラムならびに監視装置 | |
CN102055615A (zh) | 服务器监控方法 | |
JP3085844B2 (ja) | 集中監視システムにおける障害表示方式 | |
US20080215601A1 (en) | System monitoring program, system monitoring method, and system monitoring apparatus | |
CN114675791B (zh) | 一种磁盘处理方法、系统及电子设备 | |
JP3916232B2 (ja) | ナレッジ型運用管理システム,方法およびプログラム | |
JP5888239B2 (ja) | サービス管理装置、表示方法およびプログラム | |
JP2014120001A (ja) | 監視装置、監視対象ホストの監視方法、監視プログラム及び記録媒体 | |
WO2015068275A1 (ja) | 監視システム、及び、監視方法 | |
US10712735B2 (en) | Methods and systems for infrastructure-monitoring control | |
JP4850733B2 (ja) | ヘルスチェック装置及びヘルスチェック方法及びプログラム | |
JP2014228932A (ja) | 障害通知装置、障害通知プログラムならびに障害通知方法 | |
JPH04257035A (ja) | 仮想計算機システム配下における障害情報処理方式 | |
JPH0541706A (ja) | ネツトワーク自動監視・制御システム | |
JPH06324916A (ja) | 障害情報ロギング方式 | |
KR101738770B1 (ko) | 엔터프라이즈 비즈니스 서비스 레벨의 통합 모니터링 방법 및 시스템 | |
JP2002091561A (ja) | 監視制御装置及び記憶媒体 | |
JPH0291735A (ja) | リモート障害保守管理システム |