JP3675851B2 - 計算機監視方式 - Google Patents

計算機監視方式 Download PDF

Info

Publication number
JP3675851B2
JP3675851B2 JP04372794A JP4372794A JP3675851B2 JP 3675851 B2 JP3675851 B2 JP 3675851B2 JP 04372794 A JP04372794 A JP 04372794A JP 4372794 A JP4372794 A JP 4372794A JP 3675851 B2 JP3675851 B2 JP 3675851B2
Authority
JP
Japan
Prior art keywords
display
handling
error message
failure
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04372794A
Other languages
English (en)
Other versions
JPH07253956A (ja
Inventor
浩 伊藤
直子 吉田
省悟 垂髪
正 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04372794A priority Critical patent/JP3675851B2/ja
Priority to GB9500973A priority patent/GB2287558B/en
Priority to AU11421/95A priority patent/AU661805B1/en
Publication of JPH07253956A publication Critical patent/JPH07253956A/ja
Priority to US08/718,017 priority patent/US5748880A/en
Application granted granted Critical
Publication of JP3675851B2 publication Critical patent/JP3675851B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2294Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by remote test
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Description

【0001】
【産業上の利用分野】
本発明はネットワークによって互いに接続された多数の被監視計算機を集中監視装置によって監視する計算機監視方式に関し、特にエラーメッセージの対処を行う計算機監視方式に関する。
【0002】
従来、LAN等のネットワークによって互いに接続された多数の被監視計算機を集中監視装置によって監視する計算機監視方式としては、各計算機で生じた障害を上位の計算機が監視し、さらにそれらを最上位の集中監視装置で監視するようにした方式が知られている。
【0003】
【従来の技術】
図11は従来の計算機監視方式の構成を示す図である。ネットワーク全体を監視する集中監視装置60には、LAN(Local Area Network) 65を介して被監視側の計算機61,62,63,64等が接続されている。これら計算機61,62,63,64の下位には、さらにそれぞれ計算機61a,61b,61c、計算機62a,62b,62c、計算機63a,63b,63c、計算機64a,64b,64cが接続されている。また、場合によってはさらにこれらの下にも複数の計算機が接続される。
【0004】
各上位の計算機61,62,63,64は、下位の計算機の障害および自装置の障害を検出し、集中監視装置60に送る。この集中監視装置60では、複数の端末装置60a,60b,60cが接続されている。これら端末装置60a,60b,60cには、図示されていないキーボードおよび表示装置が設けられており、それぞれオペレータにより様々な操作がなされる。
【0005】
このような計算機ネットワークでは、計算機の何れかに障害が発生すると、集中監視装置60の各端末装置60a,60b,60cの表示装置にその障害に応じたエラーメッセージが表示される。このエラーメッセージを認識したオペレータは、介入等を行って障害に対処していた。
【0006】
【発明が解決しようとする課題】
しかし、従来の監視方式では、エラーメッセージの分類が一目で分かるようになっていないため、オペレータは、表示されたエラーメッセージがどの障害に対応しているかを予め熟知している必要があり、異常の確認が迅速に行えないという問題点があった。
【0007】
また、従来は、全ての障害に対してオペレータ側が対処方法を把握している必要があった。また、たとえ同種類の障害であっても、計算機毎に対処が異なる場合にはその分だけ対処方法を把握している必要があり、障害の対処が迅速に行えないという問題点があった。
【0008】
さらに、従来は、一度行った処理の記録がなされないため、全く同じ処理の障害であってもオペレータはその都度対処方法を思い出しながら操作を行う必要があり、このような理由からも対処が迅速に行えないという問題があった。
【0009】
本発明はこのような点に鑑みてなされたものであり、障害の種類の確認やその対処をより迅速に行うことのできる計算機監視方式を提供することを目的とする。
【0010】
【課題を解決するための手段】
図1は上記目的を達成する本発明の計算機監視方式の原理図である。本発明では、障害に対応した対処方法を格納する対処方法格納手段1aを、集中監視装置1側に設けておく。そして、障害に応じたエラーメッセージを、予め各被監視計算機2a,2b・・・において付加された分類データとともに表示画面1c上に表示するメッセージ表示手段1bと、エラーメッセージが表示された障害の中から対処したいものをオペレータの操作に従って選択する対処障害選択手段1dと、選択された障害の対処方法を対処方法格納手段1aから読み出して表示画面1c上に表示する対処方法表示手段1eと、表示された対処方法に従ってオペレータの操作により障害対処を実行する障害対処実行手段1fと、障害対処実行手段1fによる対処内容の履歴を格納する対処履歴格納手段1gと、格納された対処履歴の中から表示させたいものをオペレータの操作に従って選択する対処履歴選択手段1hと、選択された対処履歴を表示画面1c上に表示する対処履歴表示手段1iとを設ける。
【0011】
【作用】
集中監視装置1側には、障害に対応した対処方法を格納する対処方法格納手段1aを設けておく。メッセージ表示手段1bは、障害に応じたエラーメッセージを予め各被監視計算機2a,2b・・・において付加された分類データとともに表示画面1c上に表示する。エラーメッセージが表示された障害の中から対処したいものをオペレータの操作に従って対処障害選択手段1dが選択すると、対処方法表示手段1eは、選択された障害の対処方法を対処方法格納手段1aから読み出して表示画面1c上に表示する。
【0012】
障害対処実行手段1fは、表示された対処方法に従ってオペレータの操作により障害対処を実行し、この障害対処実行手段1fによる対処内容の履歴を対処履歴格納手段1gが格納する。対処履歴選択手段1hは、格納された対処履歴の中から表示させたいものをオペレータの操作に従って選択し、選択された対処履歴を対処履歴表示手段1iが表示画面1c上に表示する。
【0013】
【実施例】
以下、本発明の一実施例を図面に基づいて説明する。
図1は本発明の計算機監視方式の原理図である。集中監視装置1側には、障害に対応した対処方法を格納する対処方法格納手段1aが設けられている。メッセージ表示手段1bは、障害に応じたエラーメッセージを、予め各被監視計算機2a,2b・・・において付加された分類データとともに表示画面1c上に表示する。エラーメッセージが表示された障害の中から対処したいものをオペレータの操作に従って対処障害選択手段1dが選択すると、対処方法表示手段1eは、選択された障害の対処方法を対処方法格納手段1aから読み出して表示画面1c上に表示する。
【0014】
障害対処実行手段1fは、表示された対処方法に従ってオペレータの操作により障害対処を実行し、この障害対処実行手段1fによる対処内容の履歴を対処履歴格納手段1gが格納する。対処履歴選択手段1hは、格納された対処履歴の中から表示させたいものをオペレータの操作に従って選択し、選択された対処履歴を対処履歴表示手段1iが表示画面1c上に表示する。
【0015】
図2は本発明の計算機監視方式を実施する計算機ネットワークの一例を示す図である。ネットワーク全体を監視する集中監視装置10には、LAN41を介して被監視側の計算機20,30、および図示されていない他の計算機が接続されている。計算機20,30には、それぞれコンソール21,31が設けられている。また、計算機20,30には、それぞれLAN42,43を介して計算機201,202,203,301,302,303等が接続されている。各計算機201,202,203,301,302,303にも、計算機20,30と同様に図示されていないコンソールが設けられている。
【0016】
集中監視装置10には、例えば3個の端末装置11,12,13と、コンソール14が設けられている。各端末装置11,12,13の図示されていない表示画面には、後述するエラーメッセージ表示画面等が表示される。オペレータは、これら端末装置11,12,13の図示されていないキーボードやマウス等により障害対処を行う。集中監視装置10は、プロセッサを中心とした構成となっており、内蔵されたシステムプログラムに従って計算機監視を行う。
【0017】
各計算機20,30等は、集中監視装置10と同様にプロセッサを中心とした構成となっており、内蔵されたシステムプログラムに従って、後述する監視機能等を実行する。
【0018】
図3は被監視側の計算機20の監視機能の構成を示すブロック図である。計算機20の監視機能としては、主にエラー送受信手段22と、集中監視中継手段23と、自己障害監視手段24とから構成されている。エラー送受信手段22は、下位の計算機201等から送られたエラーメッセージを受信し、集中監視中継手段23に供給する。
【0019】
自己障害監視手段24は、計算機20自身の障害を監視し、障害の発生時には、エラーメッセージを集中監視中継手段23に送る。これを受けた集中監視中継手段23は、エラーメッセージに分類データを付加してエラー送受信手段22に送る。また、集中監視中継手段23は、下位の計算機201等からのエラーメッセージを中継してエラー送受信手段22に送る。計算機201からのエラーメッセージには、それぞれの集中監視中継手段によって分類データが既に付加されている。エラー送受信手段22は、この分類データの付加されたエラーメッセージをLAN41を介して集中監視装置10に送る。
【0020】
なお、ここでは、計算機20の監視機能の構成を示したが、他の計算機30,201,202,203,301,302,303についてもほぼ同じ構成となっている。
【0021】
図4は集中監視装置10の監視機能の構成を示すブロック図である。被監視側の計算機20や30から送られたエラーメッセージは、エラー受信手段10aが受け取り、集中監視中継手段10bに送る。集中監視中継手段10bは、このエラーメッセージを各集中監視制御手段10c,10d,10eに送る。自己障害監視手段10fは、集中監視装置10自身の障害を監視し、障害の発生時には、エラーメッセージを集中監視中継手段10bに送る。これを受けた集中監視中継手段は、エラーメッセージに分類データを付加して各集中監視制御手段10c,10d,10eに送る。
【0022】
集中監視制御手段10c,10d,10eは、それぞれ端末装置11,12,13との間で障害対処の制御を行う手段である。集中監視制御手段10c,10d,10eは、集中監視中継手段10bから送られたエラーメッセージをそれぞれ端末装置11,12,13に送る。また、集中監視制御手段10c,10d,10eは、ハードディスク装置(HDD)15内に格納された対処方法のデータを読み込み、端末装置11,12,13に送る。これらのデータを受けた端末装置11,12,13は、それぞれ表示装置11a,12a,13aでエラーメッセージおよびその分類を表示する。この表示例は後述する。
【0023】
端末装置11,12,13には、それぞれオペレータがついており、各オペレータはエラーメッセージとその分類を認識することにより、所望の障害対処操作を行う。オペレータが行った障害対処操作の手順は、それぞれ集中監視制御手段10c,10d,10eに送られ、さらにハードディスク装置15に送られて格納される。
【0024】
なお、前述の図4における集中監視制御手段10c,10d,10eは、図1のメッセージ表示手段1b、対処方法表示手段1e、および対処履歴表示手段1iに対応する。また、ハードディスク装置15は、対処方法格納手段1a、および対処履歴格納手段1gに対応する。さらに、各端末装置11,12,13は、対処障害選択手段1d、障害対処実行手段1f、および対処履歴選択手段1hに対応する。
【0025】
図5は端末装置11,12,13の各表示装置11a,12a,13aで表示されるエラーメッセージ表示画面の表示例を示す図である。ここでは、表示装置11aについて説明する。ネットワーク内で障害が発生すると、表示装置11aのエラーメッセージ表示画面50に、今起きた障害のエラーメッセージが表示される。このエラーメッセージは、他の表示装置12a,13aにも同時に表示される。エラーメッセージ表示画面50は、主に状態表示欄50a、分類表示欄50b、およびメッセージ表示欄50cから構成されている。
【0026】
状態表示欄50aは、各エラーの処理状態を表示する欄であり、エラーの処理がなされていない状態では「障害」と表示される。また、対処の保留中には「保留」と表示され、いずれかの端末装置から対処が行われているときには「調査中」と表示される。さらに、対処済みの場合には「対処済」と表示される。これにより、オペレータは、自装置のみならず、他の端末装置12,13で行っている処理状態をも認識することができ、操作の重複等が避けられる。
【0027】
分類表示欄50bには、メッセージ表示欄50cの各エラーメッセージがシステム系、ネットワーク系、業務系、性能系の何れに対応するものなのかを示すデータが表示される。エラーメッセージが何れにも対応しない場合には、「その他」と表示される。
【0028】
端末装置11の操作を行うオペレータは、対処を行いたいエラーメッセージの表示域をカーソル50dで指定する。これにより、画面上には対処操作画面が表示される。このとき、エラーメッセージ表示画面50側の状態表示欄50aは「調査中」に切り替わる。この切替えは他の端末装置12,13においても行われる。またこの時選択したエラーメッセージに対する対処方法がハードディスク装置15から読み出され、対処方法表示欄51eに表示される。
【0029】
図6は対処操作画面の表示例を示す図である。ここでは、番号01のエラーメッセージが対処選択されたものとする。対処操作画面51は、エラーメッセージ表示画面50上にウィンドウ形式で表示される。対処操作画面51は、主に、状態表示欄51a,分類表示欄51b,対応者記入欄51c,メッセージ表示欄51d,対処方法表示欄51e,メモ欄51f,メニュー表示欄51gから構成されている。
【0030】
状態表示欄51aは、対処操作画面51が起動される前のエラーメッセージ表示画面50の状態表示欄50aと同じものが表示される。分類表示欄51b,メッセージ表示欄51dには、それぞれエラーメッセージ表示画面50の分類表示欄50a,メッセージ表示欄50cと同じものが表示される。対応者記入欄51cには、対処を行ったオペレータの名前が記入される。対処方法表示欄51eには、選択したエラーメッセージに対応する対処方法が表示される。メモ欄51fには、オペレータのコメント等を入力することができる。
【0031】
メニュー表示欄51gには、操作実行のための機能メニューが表示される。「ログ」をカーソル50dで指定すると、選択したエラーメッセージの前回の対処操作ログ(対処履歴)がハードディスク装置15から読み出され、図7に示すように、対処方法表示欄51eの上に対処操作ログ表示画面52としてウィンドウ表示される。オペレータは、対処方法表示欄51eまたは対処操作ログ表示画面52の表示に従って操作を行うことにより、障害の対処を実行していく。
【0032】
対処が終了した場合には、オペレータは、メニュー表示欄51gの「対処済」を指定する。この場合には、対処操作画面51は終了し、エラーメッセージ表示画面50側の状態表示欄50aは「調査中」から「対処済」に切り替わる。この表示の切替えは、他の端末装置12,13においても行われる。
【0033】
作業の途中、オペレータが何らかの処理のためエラーメッセージの状態を保留にしたい場合には、メニュー表示欄51gの「保留」をカーソル指定することにより、エラーメッセージ表示画面50側の状態表示欄50aが「保留」に切り替わる。また、今回の処理を全て無効にしたい場合には、メニュー表示欄51gの「取消」を指定することにより可能となる。当然、このときには、他の端末装置12および13の表示画面でも対応する部分の表示が切り替わる。
【0034】
このように障害に対する対処が終了すると、対処操作画面51上には、対処操作ログの登録を行うための対処操作ログ登録画面が表示される。
図8は対処操作ログ登録画面の表示例を示す図である。対処操作ログ登録画面53は、対処操作画面51上にウィンドウ形式で表示される。この対処操作ログ登録画面53では、対処操作ログを登録するか,しないのか指示を行う。登録を行う場合は「登録」をカーソル50dで選択する。登録を行わない場合は「取消」をカーソル50dで選択する。これにより、今回行った対処操作の手順が、ハードディスク装置15に格納される。この格納されたデータは、次回の対処操作のときに、メニュー表示欄51gの「ログ」を指定することにより、図7に示した対処操作ログ表示画面52として表示することができる。
【0035】
図9はこのようなエラーメッセージ処理を行うための被監視側の計算機の処理手順を示すフローチャートである。なお、このフローチャートは障害が発生したときから開始される。
〔S1〕エラーメッセージの分類を判断する。
〔S2〕エラーメッセージに分類データを付加する。
〔S3〕分類データを付加したエラーメッセージを上位の計算機または集中監視装置10へ送る。
【0036】
図10はエラーメッセージ処理を行うための集中監視装置10側の処理手順を示すフローチャートである。なお、このフローチャートは各計算機からエラーメッセージが送られたときから開始される。
〔S11〕各端末装置11,12,13の表示装置11a,12a,13aのエラーメッセージ表示画面50上にエラーメッセージを表示する。
〔S12〕対処操作すべきエラーメッセージの選択がなされたか否かを判断し、選択されればステップS13に進み、そうでなければステップS12を繰り返す。
〔S13〕エラーメッセージ表示画面50が表示されている各端末の画面上に対処操作画面51を表示するとともに、状態表示欄50aの対応するエラーメッセージの部分の表示内容を切り替える。
【0037】
〔S14〕選択されたエラーメッセージの対処方法がハードディスク装置15に登録されているか否かを判断し、登録されていればステップS15に進み、されていなければステップS16に進む。
〔S15〕ハードディスク装置15から対処方法を読み出し、対処操作画面51上に表示する。
〔S16〕現在対処操作のなされている端末装置以外に端末装置が集中監視装置10に接続されているか否かを判断し、接続されていればステップS17に進み、接続されていなければステップS18に進む。
〔S17〕他の端末装置の表示装置に表示されているエラーメッセージ表示画面の状態表示欄の対応する部分の表示内容を切り替える。
〔S18〕対処操作ログの表示指令があるか否かを判断し、あればステップS19に進み、なければステップS21に進む。
〔S19〕表示指令された対処操作のログがハードディスク装置15に登録されているか否かを判断し、登録されていればステップS20に進み、なければステップS21に進む。
〔S20〕対処操作ログ表示画面52を表示する。
〔S21〕オペレータに対処操作を実行させる。
〔S22〕対処操作の実行後、その対処操作ログの登録指令があるか否かを判断し、あればステップS23に進み、なければ本フローチャートを終了する。
〔S23〕指令された対処操作ログをハードディスク装置15に登録する。
【0038】
このように、本実施例では、集中監視装置10に接続された端末装置11,12,13の各表示装置11a,12a,13aの画面上に、エラーメッセージとともにその分類を表示するようにしたので、オペレータは各エラーメッセージに対して迅速な認識を行うことができる。
【0039】
また、本実施例では、エラーメッセージに応じた対処方法を画面表示するようにしたので、オペレータの熟練度に係わらず、迅速にかつ適切な対処操作が可能となる。
【0040】
さらに、本実施例では、対処操作のログを登録できるようにし、さらにその登録した対処操作ログを次回の対処操作時に参照できるようにしたので、より迅速な操作が可能になるとともに、ノウハウの継承が可能となる。
【0041】
また、本実施例では、端末装置11,12,13の各表示装置11a,12a,13aで、「障害」、「調査中」等のエラーメッセージに対する操作の状態を表示するようにしたので、その処理状態を各端末装置のオペレータが認識することができる。これによって、同一のエラーメッセージに対する介入が重複することが避けられる。
【0042】
なお、本実施例では、対処方法表示画面51等をウィンドウ形式で表示するようにしたが、本発明では必ずしもこの表示形式に限られる必要はなく、切替え表示や分割表示等にしてもよい。
【0043】
【発明の効果】
以上説明したように本発明では、障害に応じたエラーメッセージを分類データとともに表示画面上に表示し、その中からオペレータに選択された障害の対処方法を表示画面に表示し、表示された対処方法に従ってオペレータの操作により障害対処を実行し、この対処内容の履歴を格納し、格納された対処履歴の中から表示させたいものをオペレータの操作に従って選択し、選択された対処履歴を表示画面上に表示するようにしたので、障害の種類の確認やその対処をより迅速に行うことができる。
特に、各エラーに対して、障害、保留、調査中、対処済の表示を行うようにしたので、オペレータは障害の対処状態を明確に把握でき、操作が容易となる。
【図面の簡単な説明】
【図1】本発明の計算機監視方式の原理図である。
【図2】本発明の計算機監視方式を実施する計算機ネットワークの一例を示す図である。
【図3】被監視側の計算機の監視機能の構成を示すブロック図である。
【図4】集中監視装置の監視機能の構成を示すブロック図である。
【図5】端末装置の各表示装置で表示されるエラーメッセージ表示画面の表示例を示す図である。
【図6】対処操作画面の表示例を示す図である。
【図7】対処操作ログ画面の表示例を示す図である。
【図8】対処操作ログ登録画面の表示例を示す図である。
【図9】エラーメッセージ処理を行うための被監視側の計算機の処理手順を示すフローチャートである。
【図10】エラーメッセージ処理を行うための集中監視装置側の処理手順を示すフローチャートである。
【図11】従来の計算機監視方式の構成を示す図である。
【符号の説明】
1 集中監視装置
1a 対処方法格納手段
1b メッセージ表示手段
1c 表示画面
1d 対処障害選択手段
1e 対処方法表示手段
1f 障害対処実行手段
1g 対処履歴格納手段
1h 対処履歴選択手段
1i 対処履歴表示手段
2a,2b 被監視計算機
10 集中監視装置
11,12,13 端末装置
11a,12a,13a 表示装置
14 コンソール
20,30,201,202,203,301,302,303 計算機
41,42,43, LAN

Claims (1)

  1. ネットワークによって互いに接続された多数の被監視計算機を集中監視装置によって監視する計算機監視方式において、
    害に対応した対処方法を格納する対処方法格納手段と、
    発生した障害に応じたエラーメッセージを、予め前記各被監視計算機において付加した分類データと、前記発生した障害に対する対処がなされていない状態、対処の保留中である状態、何れかの端末装置から対処が行われている状態及び対処済みである状態をそれぞれ示す状態データとともに表示画面上に表示するメッセージ表示手段と、
    前記エラーメッセージが表示された障害の中から対処したいものをオペレータの操作に従って選択する対処障害選択手段と、
    択された障害の対処方法を前記対処方法格納手段から読み出して、前記選択された障害のエラーメッセージとともに前記表示画面上にウィンドウ形式で表示する対処方法表示手段と、
    前記表示された対処方法に従ってオペレータの操作により障害対処を実行する障害対処実行手段と、
    前記障害対処実行手段による対処内容の履歴を格納する対処履歴格納手段と、
    前記格納された対処履歴の中から表示させたいものをオペレータの操作に従って選択する対処履歴選択手段と、
    前記選択された対処履歴を前記表示画面上にウィンドウ形式で表示する対処履歴表示手段と、
    から構成されていることを特徴とする計算機監視方式。
JP04372794A 1994-03-15 1994-03-15 計算機監視方式 Expired - Fee Related JP3675851B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP04372794A JP3675851B2 (ja) 1994-03-15 1994-03-15 計算機監視方式
GB9500973A GB2287558B (en) 1994-03-15 1995-01-18 Supervising system in a computer network
AU11421/95A AU661805B1 (en) 1994-03-15 1995-01-25 Computer-supervising system
US08/718,017 US5748880A (en) 1994-03-15 1996-09-03 Computer-supervising system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04372794A JP3675851B2 (ja) 1994-03-15 1994-03-15 計算機監視方式

Publications (2)

Publication Number Publication Date
JPH07253956A JPH07253956A (ja) 1995-10-03
JP3675851B2 true JP3675851B2 (ja) 2005-07-27

Family

ID=12671826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04372794A Expired - Fee Related JP3675851B2 (ja) 1994-03-15 1994-03-15 計算機監視方式

Country Status (4)

Country Link
US (1) US5748880A (ja)
JP (1) JP3675851B2 (ja)
AU (1) AU661805B1 (ja)
GB (1) GB2287558B (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010017563A (ja) * 1996-06-07 2010-01-28 Toshiba Corp 診断ネットワークシステム
JPH10149064A (ja) * 1996-11-19 1998-06-02 Canon Inc 画像処理装置
JP3308852B2 (ja) 1997-04-25 2002-07-29 キヤノン株式会社 出力制御方法及び装置
US6138253A (en) * 1997-05-29 2000-10-24 Oracle Corporation Method and apparatus for reporting errors in a computer system
DE19752792B4 (de) * 1997-11-28 2004-04-15 Phoenix Contact Gmbh & Co. Kg Einrichtung zur Selbstdiagnose von im wesentlichen sporadischen Fehlern in seriellen Übertragungssystemen
JP3782568B2 (ja) * 1997-12-25 2006-06-07 富士通株式会社 メッセージ対処装置
US6363503B1 (en) * 1998-11-24 2002-03-26 Autodesk, Inc. Error handling and representation in a computer-aided design environment
US6964010B1 (en) * 1998-12-14 2005-11-08 International Business Machines Corporation Formatted-item list control
US6918059B1 (en) * 1999-04-28 2005-07-12 Universal Music Group Method and system for handling errors in a distributed computer system
WO2000065448A1 (en) * 1999-04-28 2000-11-02 Universal Music Group A method and system for handling errors in a distributed computer system
US6408407B1 (en) * 1999-06-03 2002-06-18 Ncr Corporation Methods and apparatus for delegated error handling
GB2350983B (en) * 1999-06-10 2001-10-03 3Com Corp Network problem indication
US6708291B1 (en) * 2000-05-20 2004-03-16 Equipe Communications Corporation Hierarchical fault descriptors in computer systems
US6983362B1 (en) 2000-05-20 2006-01-03 Ciena Corporation Configurable fault recovery policy for a computer system
US7123372B2 (en) * 2000-06-22 2006-10-17 Konica Corporation Image forming apparatus administration system
JP2002230195A (ja) * 2001-01-30 2002-08-16 Konica Corp 管理システム、管理装置、中継サーバー、被管理装置及び管理方法
US7110936B2 (en) * 2001-02-23 2006-09-19 Complementsoft Llc System and method for generating and maintaining software code
JP2002351701A (ja) * 2001-05-23 2002-12-06 Hitachi Ltd システム障害対応支援方法
US6810496B1 (en) * 2001-11-07 2004-10-26 Ciena Corporation System and method for troubleshooting a network
US20030090503A1 (en) * 2001-11-13 2003-05-15 Gateway, Inc. Embedded graphical connection diagram for monitors
JP2006071649A (ja) * 2001-12-05 2006-03-16 Sysmex Corp 生体試料分析装置
JP2003216924A (ja) * 2002-01-22 2003-07-31 Sumitomo Metal Micro Devices Inc 情報処理システム、情報処理装置、コンピュータプログラム、及び記録媒体
TW584805B (en) * 2002-02-01 2004-04-21 Far Stone Tech Inc Computer equipment having a prompt access function and related method
JP2003256367A (ja) * 2002-03-06 2003-09-12 Seiko Epson Corp 電子機器のエラーに関する情報提供システムおよび電気機器のエラー実績を管理するサーバ
AU2003241016A1 (en) * 2002-05-27 2003-12-12 Sendo International Limited Processor re-start control
JP2004012752A (ja) * 2002-06-06 2004-01-15 Fujitsu Ltd 端末操作教育装置
CA2433766A1 (en) * 2002-08-14 2004-02-14 Tropic Networks Inc. A method for describing problems in a telecommunications network
US7263634B2 (en) * 2003-10-21 2007-08-28 Sap Aktiengesellschaft Failures of computer system diagnostic procedures addressed in specified order
US7260744B2 (en) 2003-10-21 2007-08-21 Sap Aktiengesellschaft Computer system diagnosis with user-developed procedure
US7260750B2 (en) * 2003-10-22 2007-08-21 Sap Aktiengesellschaft Computer system diagnostic procedures performed in specified order
US20050102569A1 (en) * 2003-10-22 2005-05-12 Yuh-Cherng Wu Performing diagnosis in a computer system
JP4445300B2 (ja) * 2004-03-18 2010-04-07 富士通株式会社 ネットワーク障害推定方法及びネットワーク障害推定装置
US7343529B1 (en) * 2004-04-30 2008-03-11 Network Appliance, Inc. Automatic error and corrective action reporting system for a network storage appliance
JP2006040222A (ja) * 2004-07-30 2006-02-09 Fujitsu Ltd メッセージ表示方法およびメッセージ表示装置
US7624377B2 (en) * 2005-01-04 2009-11-24 Sap Ag Methods relating to configuration of software
US8234485B2 (en) * 2005-01-04 2012-07-31 Sap Ag Method relating to rule-regulated software configuration
US7409595B2 (en) * 2005-01-18 2008-08-05 International Business Machines Corporation History-based prioritizing of suspected components
JP4617937B2 (ja) * 2005-03-15 2011-01-26 日本電気株式会社 システム運用管理支援装置、システム運用管理支援方法、およびシステム運用管理支援プログラム
JP2006338734A (ja) * 2005-05-31 2006-12-14 Hitachi Global Storage Technologies Netherlands Bv データ記憶装置及びエラーリカバリ方法
JP4872262B2 (ja) 2005-07-27 2012-02-08 日本電気株式会社 管理支援システム、管理支援方法、および管理支援プログラム
US7685477B2 (en) * 2005-12-09 2010-03-23 Dell Products L.P. System and method for auxiliary channel error messaging
JP2007207169A (ja) * 2006-02-06 2007-08-16 Mitsubishi Electric Corp 運用監視業務支援装置
EP2144166A4 (en) * 2007-03-29 2011-01-12 Nec Corp DIAGNOSTIC SYSTEM
US8806273B2 (en) * 2008-10-30 2014-08-12 International Business Machines Corporation Supporting detection of failure event
FR2967272B1 (fr) * 2010-11-09 2012-11-16 Peugeot Citroen Automobiles Sa Procede de verification d'un resultat de calcul realise par simulation numerique
WO2012132101A1 (ja) * 2011-03-29 2012-10-04 オムロン株式会社 情報処理装置、および障害対応プログラム
US8707086B2 (en) * 2011-04-21 2014-04-22 Intel Corporation System recovery using external communication device
JP2013257679A (ja) * 2012-06-12 2013-12-26 Sony Corp 情報処理装置および方法、並びに、プログラム
JP5518948B2 (ja) * 2012-07-10 2014-06-11 キヤノンマシナリー株式会社 エラー情報表示装置およびエラー情報表示方法
JP2014016866A (ja) * 2012-07-10 2014-01-30 Canon Machinery Inc エラー情報表示装置およびエラー情報表示方法
JP5518947B2 (ja) * 2012-07-10 2014-06-11 キヤノンマシナリー株式会社 エラー情報表示装置およびエラー情報表示方法
JP5506906B1 (ja) * 2012-12-28 2014-05-28 株式会社日立システムズ 事象対応支援装置、事象対応支援方法、及びプログラム
US9361204B2 (en) * 2013-02-19 2016-06-07 Arm Limited Generating trace data including a lockup identifier indicating occurrence of a lockup state
JP6296440B2 (ja) * 2013-12-18 2018-03-20 シャープ株式会社 電気機器
JP6527442B2 (ja) * 2015-10-02 2019-06-05 日本電信電話株式会社 ネットワーク監視装置およびネットワーク監視方法
JP6517677B2 (ja) * 2015-12-09 2019-05-22 株式会社日立製作所 統合運用監視システム及び運用操作ログの関連度計算方法
WO2019171704A1 (ja) * 2018-03-06 2019-09-12 日本電気株式会社 管理サーバ、クラスタシステム、クラスタシステムの制御方法、及びプログラムが格納された非一時的なコンピュータ可読媒体

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3575589A (en) * 1968-11-20 1971-04-20 Honeywell Inc Error recovery apparatus and method
PH16346A (en) * 1978-10-03 1983-09-05 Kubota Ltd Method of forming a socket end on a plastic pipe and a molding device for use of the method
US4881230A (en) * 1987-10-05 1989-11-14 Ibm Corporation Expert system for processing errors in a multiplex communications system
US5090014A (en) * 1988-03-30 1992-02-18 Digital Equipment Corporation Identifying likely failure points in a digital data processing system
US5047977A (en) * 1988-04-08 1991-09-10 International Business Machines Corporation Methods of generating and retrieving error and task message records within a multitasking computer system
US4964125A (en) * 1988-08-19 1990-10-16 Hughes Aircraft Company Method and apparatus for diagnosing faults
US4922491A (en) * 1988-08-31 1990-05-01 International Business Machines Corporation Input/output device service alert function
JP2510696B2 (ja) * 1988-09-26 1996-06-26 株式会社日立製作所 計算機システム自動運転制御方式
US5167010A (en) * 1989-08-03 1992-11-24 Westinghouse Electric Corp. Expert advice display processing system
US5161158A (en) * 1989-10-16 1992-11-03 The Boeing Company Failure analysis system
JP2804125B2 (ja) * 1989-11-08 1998-09-24 株式会社日立製作所 情報処理システムの障害監視装置と制御方法
US5159685A (en) * 1989-12-06 1992-10-27 Racal Data Communications Inc. Expert system for communications network
JPH0816956B2 (ja) * 1990-01-18 1996-02-21 株式会社日立製作所 フォールト・トリー表示方法、フォールト・トリー表示装置およびプロセス診断支援システム
US5072370A (en) * 1990-05-08 1991-12-10 International Business Machines Corporation System and method for monitoring electronic data processing equipment
JP3098584B2 (ja) * 1990-09-28 2000-10-16 ゼロックス コーポレイション 電子複写システムにおける障害除去及び回復方法及び装置
JPH04245751A (ja) * 1991-01-31 1992-09-02 Nec Corp イベント処理分散型網監視システム
AU645174B2 (en) * 1991-03-15 1994-01-06 Fujitsu Limited Centralized supervisory system for transmission network elements and method of supervising transmission network elements
JP2985505B2 (ja) * 1991-07-08 1999-12-06 株式会社日立製作所 品質情報収集診断システム及びその方法
GB9211368D0 (en) * 1992-05-29 1992-07-15 British Telecomm Software fault location
EP0573686A1 (de) * 1992-06-10 1993-12-15 B.O.S. SOFTWARE GmbH Verfahren zur Erfassung des Zustandes eines Rechnersystems
US5448722A (en) * 1993-03-10 1995-09-05 International Business Machines Corporation Method and system for data processing system error diagnosis utilizing hierarchical blackboard diagnostic sessions
GB9313255D0 (en) * 1993-06-26 1993-08-11 Int Computers Ltd Fault-tolerant computer systmes

Also Published As

Publication number Publication date
JPH07253956A (ja) 1995-10-03
GB2287558B (en) 1998-03-11
GB2287558A (en) 1995-09-20
US5748880A (en) 1998-05-05
AU661805B1 (en) 1995-08-03
GB9500973D0 (en) 1995-03-08

Similar Documents

Publication Publication Date Title
JP3675851B2 (ja) 計算機監視方式
CN1899774B (zh) 机器人系统以及机器人控制装置
JP4872262B2 (ja) 管理支援システム、管理支援方法、および管理支援プログラム
JP3782568B2 (ja) メッセージ対処装置
JPH0695321B2 (ja) コンピュータ・システムのサービス・ネットワークへの装置登録方法
JPH05274186A (ja) 入力データ処理装置
JPH0541706A (ja) ネツトワーク自動監視・制御システム
JP2712833B2 (ja) 故障対応支援装置
JPH0693172B2 (ja) プラント監視制御装置
WO2024052999A1 (ja) 情報処理装置
JPH10187232A (ja) 監視制御装置
JPH04291428A (ja) 障害情報表示装置
JPH1173336A (ja) 計算機システムの障害自動復旧システム
JPH0695324B2 (ja) コンピュータ・システム用の柔軟なサービス・ネットワーク
JPH05244156A (ja) ネットワーク管理装置
JP3346424B2 (ja) 動作監視機能付き端末装置
JPH04251333A (ja) 故障診断装置
JP2752907B2 (ja) 交換機におけるソフトウェア障害復旧方式
JPH01256896A (ja) プロセス状態表示装置
JP4350964B2 (ja) 運用情報管理システム
JP2001338375A (ja) ビル設備遠隔監視装置
JP2001157235A (ja) 蓄積プログラム制御式自動交換機
CA2046747A1 (en) Tracking the resolution of a problem on a computer system in a service network of computer systems
JPH0675823A (ja) コンピュータ・システムのサービス・ネットワーク内のコンピュータ・システムの問題予防方法
JPH05297840A (ja) フラットディスプレイ装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050427

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080513

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100513

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees