JP2004341779A - コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム - Google Patents

コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム Download PDF

Info

Publication number
JP2004341779A
JP2004341779A JP2003137007A JP2003137007A JP2004341779A JP 2004341779 A JP2004341779 A JP 2004341779A JP 2003137007 A JP2003137007 A JP 2003137007A JP 2003137007 A JP2003137007 A JP 2003137007A JP 2004341779 A JP2004341779 A JP 2004341779A
Authority
JP
Japan
Prior art keywords
computer
monitoring
program
monitored
management program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003137007A
Other languages
English (en)
Inventor
Tomohiko Inoue
智彦 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003137007A priority Critical patent/JP2004341779A/ja
Publication of JP2004341779A publication Critical patent/JP2004341779A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】監視管理プログラム自身の監視を強化することにより、監視管理プログラムで問題が発生した場合でも迅速に検出できるようにする。
【解決手段】自コンピュータ監視プログラム監視手段12は、自コンピュータ監視プログラム動作確認応答手段22を呼び出し、自コンピュータ監視プログラム21の動作を確認する。自コンピュータ監視プログラム動作確認応答手段22は、呼び出されると、自コンピュータ監視プログラム21の動作状況を返却する。被監視コンピュータ管理プログラム監視手段23は、被監視コンピュータ管理プログラム動作確認応答手段13を呼び出し、被監視コンピュータ管理プログラム11の動作を確認する。被監視コンピュータ管理プログラム監視手段13は、呼び出されると、被監視コンピュータ管理プログラム11の動作状況を返却する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明はコンピュータ相互監視方式,コンピュータ相互監視方法およびコンピュータ相互監視プログラムに関し、特に監視管理コンピュータと被監視コンピュータとが接続されたコンピュータシステムにおけるコンピュータ相互監視方式,コンピュータ相互監視方法およびコンピュータ相互監視プログラムに関する。
【0002】
【従来の技術】
従来のコンピュータ監視方式では、被監視コンピュータ上の自コンピュータ監視プログラムが、検出した異常を監視管理コンピュータ上の被監視コンピュータ管理プログラムに通知するのみであった。この通知が来た内容を監視管理コンピュータ上の被監視コンピュータ管理プログラムは、一元的に管理して警告を発生していた。
【0003】
このような従来の技術に対して、二重化同期運転中のプロセッサで同期不一致を検出した場合に二重化同期プロセッサが各々独自に自己診断プログラムを実行し、結果を他のプロセッサが判定し、二重化されたプロセッサのいずれの障害かを決定するようにした障害処理方式が提案されている(例えば、特許文献1参照)。
【0004】
また、第1のプロセッサを有する0系プロセッサ装置と、第2のプロセッサを有する1系プロセッサ装置とを有し、一方のプロセッサが動作中は他方のプロセッサは待機し、動作中のプロセッサが監視している待機側のプロセッサ装置の部分の異常を検出すると監視装置に知らせる2重化プロセッサシステムにおいて、0系,1系のプロセッサ装置には、それぞれ、自己診断プログラム,動作中は待機中のプロセッサを起動し自己診断プログラムにて自己診断をさせるモノマルチ,モノマルチを起動するパルスを出力するパルス発生器,および他系のプロセッサが監視している診断結果を記憶する状態レジスタを設け、動作中のプロセッサは、自系のパルス発生器より定期的にパルスを他系のモノマルチに出力し待機中のプロセッサを起動して該モノマルチが動作中に自己診断をさせ、診断結果を、動作中のプロセッサが監視している状態レジスタに記憶させるようにした2重化プロセッサシステムが提案されている(例えば、特許文献2参照)。
【0005】
さらに、処理装置および複数のユニットとともに表示部を備えた装置において、処理装置に設けられてた自己診断部が、接続された各ユニットについて自己診断のテストを行うテスト実行部を備え、テスト実行部が、各テストの起動時に準備状態を表示部に表示し、続くテスト時にテスト中であることを表示するようにした自己診断状況表示方式が提案されている(例えば、特許文献3参照)。
【0006】
【特許文献1】
特開昭56―129957号公報(第2頁、第2図)
【特許文献2】
特開平06―139088号公報(第2頁、図1)
【特許文献3】
特開平08―087426号公報(第3頁、図1)
【0007】
【発明が解決しようとする課題】
しかし、上述した従来技術には、次のような問題点があった。
【0008】
第1の問題点は、被監視コンピュータ上の自コンピュータ監視プログラムに異常が発生してもすぐには分からないということである。その理由は、被監視コンピュータ上の自コンピュータ監視プログラムが異常になった場合でも、被監視コンピュータからの通知が来なくなるのみであり、被監視コンピュータ上の自コンピュータ監視プログラムが異常を検出しない場合と動作が変わらないからである。
【0009】
第2の問題点は、監視管理コンピュータ上の被監視コンピュータ管理プログラムが異常となった場合でも、警告が発生しないということである。その理由は、監視管理コンピュータ上の被監視コンピュータ管理プログラムが異常になった場合でも、監視管理コンピュータからの警告が発生しなくなるのみであり、被監視コンピュータ上の自コンピュータ監視プログラムが異常を検出しない場合と動作が変わらないからである。
【0010】
本発明の目的は、監視管理コンピュータと被監視コンピュータとが接続されたコンピュータシステムにおいて、監視管理プログラム自身の監視を強化することにより、監視管理プログラムで問題が発生した場合でも迅速に検出できるようにしたコンピュータ相互監視方式,コンピュータ相互監視方法およびコンピュータ相互監視プログラムを提供することにある。
【0011】
【課題を解決するための手段】
本発明のコンピュータ相互監視方式は、被監視コンピュータ管理プログラムが常に動作している監視管理コンピュータと、自コンピュータ監視プログラムが常に動作している被監視コンピュータとが接続されたコンピュータシステムにおいて、被監視コンピュータ管理プログラムに含まれ、自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段と、自コンピュータ監視プログラムに含まれ、自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段と、自コンピュータ監視プログラムに含まれ、被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段と、被監視コンピュータ管理プログラムに含まれ、被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段とを有することを特徴とする。
【0012】
また、本発明のコンピュータ相互監視方式は、前記自コンピュータ監視プログラム監視手段が、自コンピュータ監視プログラムの動作状況を確認するために自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラム動作確認応答手段からの応答を一定時間待ち、自コンピュータ監視プログラム動作確認応答手段から正常通知が返却されなかった場合は異常警告を通常の監視ルートを使用して通知し、一定時間処理待ちをした後に制御を戻して処理を繰り返すことを特徴とする。
【0013】
さらに、本発明のコンピュータ相互監視方式は、前記自コンピュータ監視プログラム動作確認応答手段が、自コンピュータ監視プログラム監視手段から呼び出されたときに自コンピュータ監視プログラムの動作状態を調査し、自コンピュータ監視プログラムが正常に動作していた場合に正常通知を自コンピュータ監視プログラム監視手段に送信し、自コンピュータ監視プログラムが正常に動作していなかった場合に異常通知を自コンピュータ監視プログラム監視手段に送信することを特徴とする。
【0014】
さらにまた、本発明のコンピュータ相互監視方式は、前記被監視コンピュータ管理プログラム監視手段が、被監視コンピュータ管理プログラムの動作状況を確認するために被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラム動作確認応答手段からの応答を一定時間待ち、被監視コンピュータ管理プログラム動作確認応答手段から一定時間内に正常通知が返却されなかった場合に異常警告を通常の監視ルートを使用して通知し、一定時間処理待ちをした後に制御を戻して処理を繰り返すことを特徴とする。
【0015】
また、本発明のコンピュータ相互監視方式は、前記被監視コンピュータ管理プログラム動作確認応答手段が、被監視コンピュータ管理プログラム監視手段から呼び出されたときに被監視コンピュータ管理プログラムの動作状態を調査し、被監視コンピュータ管理プログラムが正常に動作していた場合に被監視コンピュータ管理プログラム監視手段に正常通知を送信し、被監視コンピュータ管理プログラムが正常に動作していなかった場合に被監視コンピュータ管理プログラム監視手段に異常通知を送信することを特徴とする。
【0016】
一方、本発明のコンピュータ相互監視方法は、監視管理コンピュータ上で動作している被監視コンピュータ管理プログラムから被監視コンピュータ上で動作している自コンピュータ監視プログラムの動作状況を定期的に確認することにより被監視コンピュータが正しく監視されていることを確認する工程と、被監視コンピュータ上で動作している自コンピュータ監視プログラムから監視管理コンピュータ上で動作している被監視コンピュータ管理プログラムの動作状況を定期的に確認することにより監視管理コンピュータが正しく監視していることを確認する工程とを含むことを特徴とする。
【0017】
また、本発明のコンピュータ相互監視方法は、被監視コンピュータ管理プログラムが常に動作している監視管理コンピュータと、自コンピュータ監視プログラムが常に動作している被監視コンピュータとが接続されたコンピュータシステムにおいて、自コンピュータ監視プログラム動作確認応答工程を呼び出し、被監視コンピュータ上の自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視工程と、自コンピュータ監視プログラム監視工程から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答工程と、被監視コンピュータ管理プログラム動作確認応答工程を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視工程と、被監視コンピュータ管理プログラム監視工程から呼び出され、監視管理コンピュータ上の被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答工程とを含む。
【0018】
他方、本発明のコンピュータ相互監視プログラムは、監視管理コンピュータを、被監視コンピュータ上の自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段,および被監視コンピュータ上の被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段として動作させる被監視コンピュータ管理プログラムと、被監視コンピュータを、監視管理コンピュータ上の自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段,および監視管理コンピュータ上の被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段として動作させる自コンピュータ監視プログラムとからなることを特徴とする。
【0019】
また、本発明の被監視コンピュータ管理プログラムは、監視管理コンピュータを、被監視コンピュータ上の自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段,および被監視コンピュータ上の被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段として動作させることを特徴とする。
【0020】
さらに、本発明の自コンピュータ監視プログラムは、被監視コンピュータを、監視管理コンピュータ上の自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段,および監視管理コンピュータ上の被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段として動作させることを特徴とする。
【0021】
図1において、監視管理コンピュータ1上で動作している被監視コンピュータ管理プログラム11から被監視コンピュータ2上で動作している自コンピュータ監視プログラム21の動作状況を定期的に確認することにより被監視コンピュータ2が正しく監視されていることを確認するとともに、被監視コンピュータ2上で動作している自コンピュータ監視プログラム21から監視管理コンピュータ1上で動作している被監視コンピュータ管理プログラム11の動作状況を定期的に確認することにより監視管理コンピュータ1が正しく監視していることを確認する。このようにして、個々のプログラムで異常状態となった場合でも確認な異常検出を可能にする。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
【0023】
[第1の実施の形態]
図1を参照すると、本発明の第1の実施の形態に係るコンピュータ相互監視方式は、プログラム制御により動作する監視管理コンピュータ1と、プログラム制御により動作する被監視コンピュータ2とが、図示しない通信回線を介して接続されて構成されている。
【0024】
監視管理コンピュータ1は、被監視コンピュータ管理プログラム11を含み、被監視コンピュータ管理プログラム11は、自コンピュータ監視プログラム監視手段12および被監視コンピュータ管理プログラム動作確認応答手段13を含んで構成されている。
【0025】
被監視コンピュータ2は、自コンピュータ監視プログラム21を含み、自コンピュータ監視プログラム21は、自コンピュータ監視プログラム動作確認応答手段22および被監視コンピュータ管理プログラム監視手段23を含んで構成されている。
【0026】
これらの手段は、それぞれ概略つぎのように動作する。
【0027】
被監視コンピュータ管理プログラム11は、被監視コンピュータ2の動作状態を管理するプログラムであり、監視管理コンピュータ1上で常に動作している。
【0028】
自コンピュータ監視プログラム監視手段12は、自コンピュータ監視プログラム動作確認応答手段22を呼び出し自コンピュータ監視プログラム21の動作を確認する手段である。
【0029】
図2を参照すると、自コンピュータ監視プログラム監視手段12の処理は、自コンピュータ監視プログラム動作確認応答手段呼び出しステップ121と、応答待ちステップ122と、正常応答受付判定ステップ123と、異常通知ステップ124と、一定時間処理待ちステップ125とからなる。
【0030】
被監視コンピュータ管理プログラム動作確認応答手段13は、被監視コンピュータ管理プログラム監視手段23から呼び出され、被監視コンピュータ管理プログラム11の動作状況を返却する手段である。
【0031】
図3を参照すると、被監視コンピュータ管理プログラム動作確認応答手段13の処理は、被監視コンピュータ管理プログラム動作確認ステップ131と、動作確認結果正常判定ステップ132と、正常通知返却ステップ133と、異常通知返却ステップ134とからなる。
【0032】
自コンピュータ監視プログラム21は、主に被監視コンピュータ2の動作状態を確認し、監視管理コンピュータ1に通知するプログラムであり、被監視コンピュータ2上で常に動作している。
【0033】
自コンピュータ監視プログラム動作確認応答手段22は、自コンピュータ監視プログラム監視手段12から呼び出され、自コンピュータ監視プログラム21の動作状況を返却する手段である。
【0034】
図4を参照すると、自コンピュータ監視プログラム動作確認応答手段22の処理は、自コンピュータ監視プログラム動作確認ステップ221と、動作確認結果正常判定ステップ222と、正常通知返却ステップ223と、異常通知返却ステップ224とからなる。
【0035】
被監視コンピュータ管理プログラム監視手段23は、被監視コンピュータ管理プログラム動作確認応答手段13を呼び出し被監視コンピュータ管理プログラム11の動作を確認するための手段である。
【0036】
図5を参照すると、被監視コンピュータ管理プログラム監視手段23の処理は、被監視コンピュータ管理プログラム動作確認応答手段呼び出しステップ231と、応答待ちステップ232と、一定時間内応答有無判定ステップ233と、異常通知ステップ234と、一定時間処理待ちステップ235とからなる。
【0037】
次に、このように構成された第1の実施の形態に係るコンピュータ相互監視方式の全体の動作について詳細に説明する。
【0038】
まず、自コンピュータ監視プログラム監視手段12は、被監視コンピュータ2上の自コンピュータ監視プログラム21の動作状況を確認するために、被監視コンピュータ2上の自コンピュータ監視プログラム動作確認応答手段22を呼び出す(ステップ121)。
【0039】
次に、自コンピュータ監視プログラム監視手段12は、自コンピュータ監視プログラム動作確認応答手段22からの応答を一定時間待つ(ステップ122)。
【0040】
被監視コンピュータ2では、 自コンピュータ監視プログラム動作確認応答手段22は、自コンピュータ監視プログラム監視手段12から呼び出されると、自コンピュータ監視プログラム21の動作状態を調査する(ステップ221)。
【0041】
次に、自コンピュータ監視プログラム動作確認応答手段22は、自コンピュータ監視プログラム21の動作状態を調査した結果、正常に動作しているかどうかを判断する(ステップ222)。
【0042】
自コンピュータ監視プログラム21が正常に動作していた場合(ステップ222でイエス)、自コンピュータ監視プログラム動作確認応答手段22は、正常通知を自コンピュータ監視プログラム監視手段12に送信する(ステップ223)。
【0043】
自コンピュータ監視プログラム21が正常に動作していなかった場合(ステップ222でノー)、自コンピュータ監視プログラム動作確認応答手段22は、異常通知を監視管理コンピュータ1上の自コンピュータ監視プログラム監視手段12に送信する(ステップ224)。
【0044】
監視管理コンピュータ1では、自コンピュータ監視プログラム監視手段12が、自コンピュータ監視プログラム動作確認応答手段22から正常通知が返却されたかどうかを確認する(ステップ123)。
【0045】
自コンピュータ監視プログラム動作確認応答手段22より正常通知が返却されなかった場合は(ステップ123でノー)、自コンピュータ監視プログラム監視手段12は、異常警告を通常の監視ルートを使用して通知する(ステップ124)。これにより、被監視コンピュータ2上の自コンピュータ監視プログラム21が異常となったことを正しく知ることができる。
【0046】
自コンピュータ監視プログラム動作確認応答手段22より正常通知が届いた場合(ステップ123でイエス)、自コンピュータ監視プログラム監視手段12は、ステップ124をスキップする。
【0047】
一定時間処理待ちをした後(ステップ125)、自コンピュータ監視プログラム監視手段12は、ステップ121に制御を戻して処理を繰り返す。
【0048】
他方、被監視コンピュータ2上の被監視コンピュータ管理プログラム監視手段23は、被監視コンピュータ管理プログラム11の動作状況を確認するために、監視管理コンピュータ1上の被監視コンピュータ管理プログラム動作確認応答手段13を呼び出す(ステップ231)。
【0049】
次に、被監視コンピュータ管理プログラム監視手段23は、被監視コンピュータ管理プログラム動作確認応答手段13からの応答を一定時間待つ(ステップ232)。
【0050】
監視管理コンピュータ1では、被監視コンピュータ管理プログラム動作確認応答手段13が、被監視コンピュータ管理プログラム監視手段23から呼び出されると、被監視コンピュータ管理プログラム11の動作状態を調査する(ステップ131)。
【0051】
次に、被監視コンピュータ管理プログラム動作確認応答手段13は、被監視コンピュータ管理プログラム11の動作状態を調査した結果、正常に動作しているかどうかを判断する(ステップ132)。
【0052】
被監視コンピュータ管理プログラム11が正常に動作していた場合(ステップ132でイエス)、被監視コンピュータ管理プログラム動作確認応答手段13は、被監視コンピュータ2上の被監視コンピュータ管理プログラム監視手段23に正常通知を送信する(ステップ133)。
【0053】
被監視コンピュータ管理プログラム11が正常に動作していなかった場合(ステップ132でノー)、被監視コンピュータ管理プログラム動作確認応答手段13は、被監視コンピュータ2上の被監視コンピュータ管理プログラム監視手段23に異常通知を送信する(ステップ134)。
【0054】
被監視コンピュータ2では、被監視コンピュータ管理プログラム監視手段23が、被監視コンピュータ管理プログラム動作確認応答手段13から一定時間内に正常通知が返却されたかどうかを確認する(ステップ233)。
【0055】
被監視コンピュータ管理プログラム動作確認応答手段13より一定時間内に正常通知が返却されなかった場合は、被監視コンピュータ管理プログラム監視手段23は、異常警告を通常の監視ルートを使用して通知する(ステップ234)。これにより、監視管理コンピュータ1上の被監視コンピュータ管理プログラム11が異常となったことを正しく知ることができる。
【0056】
被監視コンピュータ管理プログラム動作確認応答手段13より一定時間内に正常通知が届いた場合は、被監視コンピュータ管理プログラム監視手段23は、ステップ234をスキップする。
【0057】
一定時間処理待ちをした後(ステップ235)、被監視コンピュータ管理プログラム監視手段23は、ステップ231に制御を戻して処理を繰り返す。
【0058】
このように、第1の実施の形態によれば、監視管理コンピュータ1上の被監視コンピュータ管理プログラム11から定期的に自コンピュータ監視プログラム21を呼び出すことにより、呼び出しが失敗した時点で異常状態が検出できるようになるため、被監視コンピュータ2上の自コンピュータ監視プログラム21に異常が発生した場合も確実に検出することができる。
【0059】
また、被監視コンピュータ管理プログラム21上の自コンピュータ監視プログラム21から定期的に被監視コンピュータ2から被監視コンピュータ管理プログラムを呼び出すことにより、呼び出しが失敗した時点で異常状態が検出できるようになるため、監視管理コンピュータ1上の被監視コンピュータ管理プログラム11に異常が発生した場合も確実に検出することができる。
【0060】
【発明の効果】
第1の効果は、被監視コンピュータ上の自コンピュータ監視プログラムに異常が発生した場合も確実に検出できることである。その理由は、監視管理コンピュータ上の被監視コンピュータ管理プログラムから定期的に自コンピュータ監視プログラムを呼び出すため、呼び出しが失敗した時点で異常状態が検出できるからである。
【0061】
第2の効果は、監視管理コンピュータ上の被監視コンピュータ管理プログラムに異常が発生した場合も確実に検出できることである。その理由は、被監視コンピュータ管理プログラム上の自コンピュータ監視プログラムから定期的に被監視コンピュータから被監視コンピュータ管理プログラムを呼び出すため、呼び出しが失敗した時点で異常状態が検出できるからである。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係るコンピュータ相互監視方式の構成を示すブロック図である。
【図2】図1中の自コンピュータ監視プログラム監視手段の処理を示すフローチャートである。
【図3】図1中の被監視コンピュータ管理プログラム動作確認応答手段の処理を示すフローチャートである。
【図4】図1中の自コンピュータ監視プログラム動作確認応答手段の処理を示すフローチャートである。
【図5】図1中の被監視コンピュータ管理プログラム監視手段の処理を示すフローチャートである。
【符号の説明】
1 監視管理コンピュータ
2 被監視コンピュータ
11 被監視コンピュータ管理プログラム
12 自コンピュータ監視プログラム監視手段
13 被監視コンピュータ管理プログラム動作確認応答手段
21 自コンピュータ監視プログラム
22 自コンピュータ監視プログラム動作確認応答手段
23 被監視コンピュータ管理プログラム監視手段
121 自コンピュータ監視プログラム動作確認応答手段呼び出しステップ
122 応答待ちステップ
123 正常応答受付判定ステップ
124 異常通知ステップ
125 一定時間処理待ちステップ
131 被監視コンピュータ管理プログラム動作確認ステップ
132 動作確認結果正常判定ステップ
133 正常通知返却ステップ
134 異常通知返却ステップ
221 自コンピュータ監視プログラム動作確認ステップ
222 動作確認結果正常判定ステップ
223 正常通知返却ステップ
224 異常通知返却ステップ
231 被監視コンピュータ管理プログラム動作確認応答手段呼び出しステップ
232 応答待ちステップ
233 一定時間内応答有無判定ステップ
234 異常通知ステップ
235 一定時間処理待ちステップ

Claims (10)

  1. 被監視コンピュータ管理プログラムが常に動作している監視管理コンピュータと、自コンピュータ監視プログラムが常に動作している被監視コンピュータとが接続されたコンピュータシステムにおいて、
    被監視コンピュータ管理プログラムに含まれ、自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段と、
    自コンピュータ監視プログラムに含まれ、自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段と、
    自コンピュータ監視プログラムに含まれ、被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段と、
    被監視コンピュータ管理プログラムに含まれ、被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段と
    を有することを特徴とするコンピュータ相互監視方式。
  2. 前記自コンピュータ監視プログラム監視手段が、自コンピュータ監視プログラムの動作状況を確認するために自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラム動作確認応答手段からの応答を一定時間待ち、自コンピュータ監視プログラム動作確認応答手段から正常通知が返却されなかった場合は異常警告を通常の監視ルートを使用して通知し、一定時間処理待ちをした後に制御を戻して処理を繰り返すことを特徴とする請求項1記載のコンピュータ相互監視方式。
  3. 前記自コンピュータ監視プログラム動作確認応答手段が、自コンピュータ監視プログラム監視手段から呼び出されたときに自コンピュータ監視プログラムの動作状態を調査し、自コンピュータ監視プログラムが正常に動作していた場合に正常通知を自コンピュータ監視プログラム監視手段に送信し、自コンピュータ監視プログラムが正常に動作していなかった場合に異常通知を自コンピュータ監視プログラム監視手段に送信することを特徴とする請求項1記載のコンピュータ相互監視方式。
  4. 前記被監視コンピュータ管理プログラム監視手段が、被監視コンピュータ管理プログラムの動作状況を確認するために被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラム動作確認応答手段からの応答を一定時間待ち、被監視コンピュータ管理プログラム動作確認応答手段から一定時間内に正常通知が返却されなかった場合に異常警告を通常の監視ルートを使用して通知し、一定時間処理待ちをした後に制御を戻して処理を繰り返すことを特徴とする請求項1記載のコンピュータ相互監視方式。
  5. 前記被監視コンピュータ管理プログラム動作確認応答手段が、被監視コンピュータ管理プログラム監視手段から呼び出されたときに被監視コンピュータ管理プログラムの動作状態を調査し、被監視コンピュータ管理プログラムが正常に動作していた場合に被監視コンピュータ管理プログラム監視手段に正常通知を送信し、被監視コンピュータ管理プログラムが正常に動作していなかった場合に被監視コンピュータ管理プログラム監視手段に異常通知を送信することを特徴とする請求項1記載のコンピュータ相互監視方式。
  6. 監視管理コンピュータ上で動作している被監視コンピュータ管理プログラムから被監視コンピュータ上で動作している自コンピュータ監視プログラムの動作状況を定期的に確認することにより被監視コンピュータが正しく監視されていることを確認する工程と、
    被監視コンピュータ上で動作している自コンピュータ監視プログラムから監視管理コンピュータ上で動作している被監視コンピュータ管理プログラムの動作状況を定期的に確認することにより監視管理コンピュータが正しく監視していることを確認する工程と
    を含むことを特徴とするコンピュータ相互監視方法。
  7. 被監視コンピュータ管理プログラムが常に動作している監視管理コンピュータと、自コンピュータ監視プログラムが常に動作している被監視コンピュータとが接続されたコンピュータシステムにおいて、
    自コンピュータ監視プログラム動作確認応答工程を呼び出し、被監視コンピュータ上の自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視工程と、
    自コンピュータ監視プログラム監視工程から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答工程と、
    被監視コンピュータ管理プログラム動作確認応答工程を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視工程と、
    被監視コンピュータ管理プログラム監視工程から呼び出され、監視管理コンピュータ上の被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答工程と
    を含むことを特徴とするコンピュータ相互監視方法。
  8. 監視管理コンピュータを、被監視コンピュータ上の自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段,および被監視コンピュータ上の被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段として動作させる被監視コンピュータ管理プログラムと、被監視コンピュータを、監視管理コンピュータ上の自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段,および監視管理コンピュータ上の被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段として動作させる自コンピュータ監視プログラムと
    からなることを特徴とするコンピュータ相互監視プログラム。
  9. 監視管理コンピュータを、被監視コンピュータ上の自コンピュータ監視プログラム動作確認応答手段を呼び出し、自コンピュータ監視プログラムの動作を確認する自コンピュータ監視プログラム監視手段,および被監視コンピュータ上の被監視コンピュータ管理プログラム監視手段から呼び出され、被監視コンピュータ管理プログラムの動作状況を返却する被監視コンピュータ管理プログラム動作確認応答手段として動作させる被監視コンピュータ管理プログラム。
  10. 被監視コンピュータを、監視管理コンピュータ上の自コンピュータ監視プログラム監視手段から呼び出され、自コンピュータ監視プログラムの動作状況を返却する自コンピュータ監視プログラム動作確認応答手段,および監視管理コンピュータ上の被監視コンピュータ管理プログラム動作確認応答手段を呼び出し、被監視コンピュータ管理プログラムの動作を確認する被監視コンピュータ管理プログラム監視手段として動作させる自コンピュータ監視プログラム。
JP2003137007A 2003-05-15 2003-05-15 コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム Pending JP2004341779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003137007A JP2004341779A (ja) 2003-05-15 2003-05-15 コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003137007A JP2004341779A (ja) 2003-05-15 2003-05-15 コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム

Publications (1)

Publication Number Publication Date
JP2004341779A true JP2004341779A (ja) 2004-12-02

Family

ID=33526778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003137007A Pending JP2004341779A (ja) 2003-05-15 2003-05-15 コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム

Country Status (1)

Country Link
JP (1) JP2004341779A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405311C (zh) * 2005-01-04 2008-07-23 国际商业机器公司 用于计算机系统中的多个分区的错误监视的方法
CN110716822A (zh) * 2019-10-14 2020-01-21 深圳市网心科技有限公司 嵌入式设备、跨芯片监控方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100405311C (zh) * 2005-01-04 2008-07-23 国际商业机器公司 用于计算机系统中的多个分区的错误监视的方法
CN110716822A (zh) * 2019-10-14 2020-01-21 深圳市网心科技有限公司 嵌入式设备、跨芯片监控方法、装置及存储介质

Similar Documents

Publication Publication Date Title
US5870301A (en) System control apparatus including a master control unit and a slave control unit which maintain coherent information
JP5548647B2 (ja) 計算機システムでの部分障害処理方法
JP5558279B2 (ja) 監視制御システム、およびこれに利用する監視制御装置、監視制御方法
JP2004341779A (ja) コンピュータ相互監視方式および方法ならびにコンピュータ相互監視プログラム
JP4034436B2 (ja) クライアント・サーバシステム及びクライアント稼働監視方法
JP6089766B2 (ja) 情報処理システム、及び情報処理装置の障害処理方法
JP2006172050A (ja) ホットスタンバイ式2重化システム
JPH10116211A (ja) システムコンソール故障通知方式
JP4848979B2 (ja) 監視システムおよび監視方法ならびにプログラム
JPH11338724A (ja) スタンバイシステム、スタンバイ方法、および記録媒体
JP2006171995A (ja) 制御用計算機
JPH06290126A (ja) 計算機システム障害監視方式
JP2008059531A (ja) コンピュータシステムの障害通報方法
JP2007042017A (ja) 障害診断システム、障害診断方法、および障害診断プログラム
JP6944799B2 (ja) 情報処理装置
JP2000244520A (ja) 二重化ネットワークの異常診断方法
JPH11327897A (ja) ウィルスアラートリモート監視システム
JP2005267051A (ja) 通信システム異常検出方法および計算機システム
JP2007249343A (ja) 障害監視装置、クラスタシステム及び障害監視方法
JPH0567016A (ja) プログラム異常動作監視方式
JPS6224354A (ja) デユプレツクス計算機システム
JPH01237873A (ja) 通信制御装置
JP2009015472A (ja) コンピュータシステムのデバイス監視方式
JPH03288958A (ja) マルチプロセッサの障害処理装置
JPH02310755A (ja) ヘルスチェック方式

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050124

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050314

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060317

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070119

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090508

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090707