JPH11272508A

JPH11272508A - 監視対象装置の異常検出方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体

Info

Publication number: JPH11272508A
Application number: JP10093981A
Authority: JP
Inventors: Kiyoko Matsumura; 聖子松村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1998-03-23
Filing date: 1998-03-23
Publication date: 1999-10-08
Anticipated expiration: 2018-03-23
Also published as: JP3127880B2

Abstract

(57)【要約】【課題】監視対象装置から一定時間以内毎に出力され
るべき通知の有無に基づき監視対象の異常を検出する装
置において、監視処理の起動周期の乱れによる誤検出を
防止する。【解決手段】監視カウンタ11は、監視対象装置から通
知がある毎にカウンタリセット手段７によってリセット
され、望ましくは所定周期毎に実行される監視処理部21
の監視カウンタ加算手段25によって＋１ずつ加算され
る。時刻格納手段24はカウンタ更新時刻の履歴を時刻記
憶部28に採取する。監視カウンタ検査手段26は、監視カ
ウンタ11の値が限界値を超えたか否かを検査する。限界
値を超えていたとき、カウンタ補正手段27は、カウンタ
更新処理が行われた時刻の履歴を参照して、監視対象装
置に異常が発生しているか否かの最終判断を下すことに
より、監視処理部21の起動周期の乱れによる誤検出を防
止する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は監視対象装置から一
定時間以内毎に出力されるべき通知の有無に基づき監視
対象の異常を検出する技術に関する。

【０００２】

【従来の技術】情報処理システムにおいて、システムの
構成要素となる或る情報処理装置（ホストコンピュータ
や排他制御装置など）の異常を他の情報処理装置で検出
する手法の一種に、監視対象となる装置が正常ならば一
定時間以内にリセットされるカウンタを設け、監視側の
装置において当該カウンタを一定周期でカウントアップ
し、カウンタ値が予め定められた限界値を越えたら、監
視対象装置の異常とみなす手法がある（例えば特開平１
−２００４４１号公報）。

【０００３】

【発明が解決しようとする課題】上述した手法による異
常検出は構成が簡単であるため、各種の分野で広く採用
されているが、従来はカウンタをカウントアップする周
期が常に一定であることを想定しているため、カウント
アップ周期の変動に対する対策は全く講じられていな
い。そのため、カウンタを更新する周期が変動する状況
の下では誤検出するという問題があった。

【０００４】例えば監視対象装置から当該装置が正常で
あれば例えば８秒以内に通知が送られて来るものとし、
また、その通知を受ける毎に監視側の装置においてカウ
ンタをリセットしてカウント値を０にし、カウントアッ
プは例えば１秒毎に＋１だけ加算し、限界値の例えば１
０を越えたら異常として検出するものとする。この場
合、カウンタを更新する周期が１秒より短く、例えば
０.5秒間隔で１０回のカウンタ更新が行われると、５秒
間通知がない時点で異常として検出してしまうことにな
る。一般に異常として検出された装置はシステムから切
り離されたり、初期化されるなどの処置が行われるた
め、誤検出するとシステムに多大な影響を及ぼす。

【０００５】本発明の目的は、このようなカウンタ更新
周期の変動による誤検出を防止することにある。

【０００６】

【課題を解決するための手段】本発明の監視対象装置の
異常検出方法は、監視対象装置から一定時間以内毎に出
力されるべき通知の有無に基づき監視対象装置の異常を
検出する方法において、監視対象装置から通知がある毎
にリセットされ且つカウンタ更新処理毎に一定値ずつ更
新されるカウンタの値が予め定められた限界値を越えた
とき、カウンタ更新処理の周期が予め定められた周期よ
り短くなっていなかったか否かを調べ、短くなっていな
かった場合に限って、監視対象装置の異常と判定するこ
とを特徴とする。カウンタ更新処理の周期が予め定めら
れた周期より短くなっていなかったか否かの調査は、例
えばリセット後に初めてカウンタを更新した時刻を少な
くとも含むカウンタ更新時刻の履歴を採取しておき、こ
の採取したカウンタ更新時刻の履歴に基づき行われる。

【０００７】このように構成された監視対象装置の異常
検出方法にあっては、カウンタの値が限界値を越えたと
きにカウンタ更新処理の周期が所定の周期より短くなっ
ていなかった場合に限って異常と判定することにより、
カウンタ更新周期の変動による誤検出を防止することが
できる。

【０００８】また、本発明の監視対象装置の異常検出方
法は、自装置が担う主たる処理以外に、監視対象装置か
ら一定時間以内毎に出力されるべき通知の有無に基づき
監視対象装置の異常を検出する処理をも行う装置におい
て、（ａ）監視対象装置から通知がある毎に監視用のカウン
タをリセットするステップ。（ｂ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｃ）待ちキューから要求を取り出すステップ。（ｄ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｅ）取り出された要求が監視処理の起動要求であれ
ば、前記カウンタを一定値だけ更新してその更新時刻を
記録すると共に、更新後のカウンタの値が予め定められ
た限界値を越えたか否かを検査し、越えていたときは、
カウンタがリセット後に初めて更新された時刻に（限界
値×カウンタ更新周期の正規の値）を足した時刻と今回
の更新時刻との比較結果に応じて、監視対象装置の異常
の有無を判定するステップ。を含むことを特徴とする。

【０００９】主たる処理の要求が一度に多量に発生する
と、それ以降に待ちキューに格納された監視処理起動要
求は、待ちキューに滞留している主たる処理の要求が処
理されるまで処理されず、主たる処理要求の処理が終わ
った時点で次々と処理され、過渡的に、短い周期で監視
処理が連続して実行され、カウンタが短い周期でカウン
トアップされる事象が発生する。しかし、ステップ
（ｅ）において、カウンタ値が限界値を越えていたと
き、カウンタがリセット後に初めて更新された時刻に
（限界値×カウンタ更新周期の正規の値）を足した時刻
と今回の更新時刻との比較結果に応じて、監視対象装置
の異常の有無を判定するため、カウンタ更新周期の変動
による誤検出が防止される。

【００１０】また、本発明の監視対象装置の異常検出方
法は、自装置が担う主たる処理以外に、相手装置から一
定時間以内毎に出力されるべき通知の有無に基づき相手
装置の異常を検出する処理、および相手装置で自装置の
異常の検出が行えるように自装置から相手装置に一定時
間毎に通知を出す処理をも行う装置において、（ａ）相手装置から通知がある毎に監視用のカウンタを
リセットするステップ。（ｂ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｃ）待ちキューから要求を取り出すステップ。（ｄ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｅ）取り出された要求が監視処理の起動要求であれ
ば、相手装置に通知を送出すると共に、前記カウンタを
一定値だけ更新してその更新時刻を記録し、且つ、更新
後のカウンタの値が予め定められた限界値を越えたか否
かを検査し、越えていたときは、カウンタがリセット後
に初めて更新された時刻に（限界値×カウンタ更新周期
の正規の値）を足した時刻と今回の更新時刻との比較結
果に応じて、監視対象装置の異常の有無を判定するステ
ップ。を含むことを特徴とする。

【００１１】このように構成された監視対象装置の異常
検出方法にあっては、ステップ（ｅ）において、カウン
タ値が限界値を越えていたとき、カウンタがリセット後
に初めて更新された時刻に（限界値×カウンタ更新周期
の正規の値）を足した時刻と今回の更新時刻との比較結
果に応じて、監視対象装置の異常の有無を判定するた
め、カウンタ更新周期の変動による誤検出が防止される
と共に、相手装置に通知を送出する処理をステップ
（ｅ）内で行っているため、カウンタ更新処理を含む監
視処理の起動要求を所定周期で待ちキューに入れるだけ
で、相手装置の監視と相手装置への通知の送出とを同時
に行わせることができる。

【００１２】また、本発明の監視対象装置の異常検出方
法は、カウンタ更新処理に先立って、直前のカウンタ更
新時刻と現在の時刻とから前回から今回までのカウンタ
更新処理周期を計算してこの計算した周期が予め定めら
れた周期より短くなっているか否かを調べ、短くなって
いる場合には、今回の監視処理を終了するステップを更
に含むことを特徴とする。

【００１３】このように構成された監視対象装置の異常
検出方法にあっては、待ちキューに要求が滞留するほど
負荷が上がっている装置の処理ステップを削減すること
ができる。

【００１４】また、本発明の監視対象装置の異常検出方
法は、カウンタがリセット後に初めて更新された時刻の
履歴のみを記録するようにして、時刻の採取回数の削
減、時刻の履歴を格納する領域の削減を図るようにして
いる。

【００１５】また、本発明の監視対象装置の異常検出装
置は、自装置が担う主たる処理以外に、監視対象装置か
ら一定時間以内毎に出力されるべき通知の有無に基づき
監視対象装置の異常を検出する処理をも行う装置におい
て、監視用のカウンタと、監視対象装置から通知がある
毎に前記カウンタをリセットするカウンタリセット手段
と、カウンタ更新処理を含む監視処理の起動要求及び主
たる処理の要求を格納するための待ちキューと、所定時
間毎に監視処理の起動要求を前記待ちキューに格納する
監視タイマと、主たる処理の要求が発生する毎にその要
求を前記待ちキューに格納する主処理要求部と、前記待
ちキューから順に要求を取り出して実行する要求実行部
内に設けられた、主たる処理を実行する主処理部および
監視処理を実行する対象装置監視処理部とを備え、前記
対象装置監視処理部は、前記カウンタを一定値だけ更新
するカウンタ加算手段と、カウンタが更新された時刻の
履歴をとる時刻格納手段と、更新後のカウンタの値が、
予め定められた限界値を越えたか否かを検査する監視カ
ウンタ検査手段と、カウンタの値が限界値を越えていた
とき、カウンタがリセット後に初めて更新された時刻に
（限界値×カウンタ更新周期の正規の値）を足した時刻
と今回の更新時刻との比較結果に応じて、監視対象装置
の異常の有無を判定するカウンタ補正手段とを備えるこ
とを特徴とする。

【００１６】このように構成された監視対象装置の異常
検出装置にあっては、カウンタリセット手段が監視対象
装置から通知がある毎に監視用のカウンタをリセットす
ると共に、監視タイマが所定時間毎に監視処理の起動要
求を待ちキューに格納し、また、主たる処理の要求が発
生する毎にその要求を主処理要求部が待ちキューに格納
する。そして、待ちキューから順に要求を取り出して実
行する要求実行部内に設けられた主処理部が主たる処理
の要求を処理し、他方、対象装置監視処理部が監視処理
を実行する。この対象装置監視処理部では、カウンタ加
算手段によりカウンタを一定値だけ更新し、時刻格納手
段によりカウンタが更新された時刻の履歴をとり、監視
カウンタ検査手段により更新後のカウンタの値が予め定
められた限界値を越えたか否かを検査する。そして、カ
ウンタの値が限界値を越えていたとき、カウンタ補正手
段が、カウンタがリセット後に初めて更新された時刻に
（限界値×カウンタ更新周期の正規の値）を足した時刻
と今回の更新時刻との比較結果に応じて、監視対象装置
の異常の有無を判定する。

【００１７】また、本発明の監視対象装置の異常検出装
置は、自装置が担う主たる処理以外に、相手装置から一
定時間以内毎に出力されるべき通知の有無に基づき相手
装置の異常を検出する処理、および相手装置で自装置の
異常の検出が行えるように自装置から相手装置に一定時
間毎に通知を出す処理をも行う装置において、監視用の
カウンタと、相手装置から通知がある毎に前記カウンタ
をリセットするカウンタリセット手段と、カウンタ更新
処理を含む監視処理の起動要求及び主たる処理の要求を
格納するための待ちキューと、所定時間毎に監視処理の
起動要求を前記待ちキューに格納する監視タイマと、主
たる処理の要求が発生する毎にその要求を前記待ちキュ
ーに格納する主処理要求部と、前記待ちキューから順に
要求を取り出して実行する要求実行部内に設けられた、
主たる処理を実行する主処理部および監視処理を実行す
る対象装置監視処理部とを備え、前記対象装置監視処理
部は、相手装置に自装置が正常である旨の通知を送出す
るヘルスメッセージ送出手段と、前記カウンタを一定値
だけ更新するカウンタ加算手段と、カウンタが更新され
た時刻の履歴をとる時刻格納手段と、更新後のカウンタ
の値が、予め定められた限界値を越えたか否かを検査す
る監視カウンタ検査手段と、カウンタの値が限界値を越
えていたとき、カウンタがリセット後に初めて更新され
た時刻に（限界値×カウンタ更新周期の正規の値）を足
した時刻と今回の更新時刻との比較結果に応じて、監視
対象装置の異常の有無を判定するカウンタ補正手段とを
備えることを特徴とする。

【００１８】このように構成された監視対象装置の異常
検出装置にあっては、カウンタリセット手段が相手装置
から通知がある毎に監視用のカウンタをリセットすると
共に、監視タイマが所定時間毎に監視処理の起動要求を
待ちキューに格納し、また、主たる処理の要求が発生す
る毎にその要求を主処理要求部が待ちキューに格納す
る。そして、待ちキューから順に要求を取り出して実行
する要求実行部内に設けられた主処理部が主たる処理の
要求を処理し、他方、対象装置監視処理部が監視処理を
実行する。この対象装置監視処理部では、ヘルスメッセ
ージ送出手段により相手装置に自装置が正常である旨の
通知を送出し、カウンタ加算手段によりカウンタを一定
値だけ更新し、時刻格納手段によりカウンタが更新され
た時刻の履歴をとり、監視カウンタ検査手段により更新
後のカウンタの値が予め定められた限界値を越えたか否
かを検査する。そして、カウンタの値が限界値を越えて
いたとき、カウンタ補正手段が、カウンタがリセット後
に初めて更新された時刻に（限界値×カウンタ更新周期
の正規の値）を足した時刻と今回の更新時刻との比較結
果に応じて、相手装置の異常の有無を判定する。

【００１９】また、本発明の監視対象装置の異常検出装
置は、前記対象装置監視処理部が、更に、カウンタ更新
処理に先立って、直前のカウンタ更新時刻と現在の時刻
とから前回から今回までのカウンタ更新処理周期を計算
してこの計算した周期が予め定められた周期より短くな
っているか否かを調べ、短くなっている場合には、今回
の対象装置監視処理を終了せしめる時刻確認手段を備え
ることを特徴とする。

【００２０】また、本発明の監視対象装置の異常検出装
置は、前記対象装置監視処理部が、更に、前記カウンタ
がリセット後に初めて更新されたか否かを調べるカウン
タ値確認手段を備え、前記時刻格納手段は、リセット後
に初めて更新された時刻のみの履歴をとる構成を有する
ことを特徴とする。

【００２１】

【発明の実施の形態】次に本発明の実施の形態の例につ
いて図面を参照して詳細に説明する。

【００２２】（１）第１の実施の形態図１は本発明における第１の実施の形態のブロック図で
ある。図１において、情報処理装置１は、ホストコンピ
ュータ，入出力処理装置，排他制御装置などの情報処理
システムの構成要素の一つであり、自装置本来の機能に
加えて、監視対象装置１５の異常を検出する機能を備え
ている。自装置本来の機能とは、情報処理装置１がホス
トコンピュータであればホスト処理、入出力処理装置で
あれば入出力処理、排他制御装置であれば排他制御処理
のことである。また、監視対象装置１５は、ホストコン
ピュータ，入出力処理装置，排他制御装置など情報処理
システムを構成する他の構成要素である。

【００２３】情報処理装置１は、プロセッサ２と、主記
憶３と、時計４と、主処理要求部５と、監視タイマ６
と、カウンタリセット手段７と、記録媒体８とを備え
る。また、プロセッサ２は待ちキュー９と要求実行部１
０とを有し、主記憶３は監視カウンタ１１を含む監視用
管理情報１２を格納する。更に、要求実行部１０は主処
理部１３と対象装置監視処理部１４とを含んでいる。

【００２４】カウンタリセット手段７は、監視対象装置
１５からその装置が正常である旨を示すヘルスメッセー
ジを受信した時、主記憶３の監視用管理情報１２中の監
視カウンタ１１を０にリセットする手段である。ここ
で、監視対象装置１５は、自装置が正常である旨を示す
ヘルスメッセージを予め定められた周期で情報処理装置
１に送出するようプログラミングされている。若し、監
視対象装置１５に障害が発生した場合、ヘルスメッセー
ジは送出されなくなり、監視カウンタ１１もリセットさ
れなくなる。

【００２５】主処理要求部５は、情報処理装置１本来の
機能にかかる処理（主たる処理）の要求をプロセッサ２
中の待ちキュー９に格納する手段であり、監視タイマ６
は、監視対象装置１５の監視処理を起動する要求を待ち
キュー９に格納する手段である。監視タイマ６は予め定
められた周期（例えば１秒周期）で、監視処理の起動要
求を待ちキュー９に格納する。

【００２６】待ちキュー９は例えばＦＩＦＯレジスタで
構成され、主処理要求部５および監視タイマ６から格納
された要求を格納順に保持する。要求実行部１０は、待
ちキュー９に要求が１つ以上存在する場合、待ちキュー
９から要求を１つずつ順番に取り出し、その要求の種類
に応じた処理を実行する。即ち、取り出した要求が情報
処理装置１の主たる処理の要求であれば、主処理部１３
でその要求に応じた処理を実行する。また、取り出した
要求が監視処理起動要求であれば、対象装置監視処理部
１４を起動し、対象装置監視処理を実行する。この対象
装置監視処理では、監視カウンタ１１の値を例えば＋１
だけ更新する処理、更新後のカウンタ値が予め定められ
た限界値を越えたか否かをチェックする処理などが行わ
れる。

【００２７】前述したように監視タイマ６から待ちキュ
ー９へは予め定められた周期毎に１つの監視処理起動要
求が格納される。主処理要求部５から待ちキュー９への
単位時間当たりの要求格納数が少ない場合、待ちキュー
９に格納された監視処理起動要求はほぼ所定周期ごとに
実行され、その結果、監視カウンタ１１のカウントアッ
プも所定周期ごとに行われる。しかし、主処理要求部５
から待ちキュー９へ一度に多量の要求が格納されると、
それ以降に待ちキュー９に格納される監視処理起動要求
は、待ちキュー９に滞留している主たる処理の要求が処
理されるまで処理されず、そして、主たる処理要求の処
理が終わった時点で、それまで待ちキュー９に滞留して
いた複数の監視処理起動要求が次々と処理される。この
結果、過渡的に、短い周期で対象装置監視処理部１４が
連続して起動され、監視カウンタ１１が短い周期でカウ
ントアップされる事象が発生し、限界値との比較のみに
よる異常検出では誤検出する危険性がある。このため、
対象装置監視処理部１４では、カウンタ値が限界値を越
えた場合、カウンタ更新処理の周期の乱れを調査して最
終的な判断を下す。

【００２８】上述した対象装置監視処理部１４は、プロ
セッサ２のハードウェアで実現することも可能である
が、ソフトウェアによって実現することもできる。この
場合、ＣＤ−ＲＯＭ，半導体メモリ，磁気ディスク等の
機械読み取り可能な記録媒体８に記録された対象装置監
視用プログラムが、例えば情報処理装置１の立ち上げ時
にプロセッサ２に読み取られ、プロセッサ２の動作を制
御することにより、プロセッサ２上に対象装置監視処理
部１４を実現し、また、主記憶３上に監視用管理情報１
２を初期生成する。

【００２９】時計４は現在時刻を計時する手段であり、
プロセッサ２上の対象装置監視処理部１４等はＯＳ（図
示せず）のシステムコールによって時計４から現在時刻
を取得することが可能になっている。この時計４は、カ
ウンタ更新処理が行われた時刻の履歴をとるため等に使
用される。

【００３０】次に、本発明の第１の実施の形態における
対象装置監視処理部１４および監視用管理情報１２の第
１の実施例について説明する。

【００３１】図２を参照すると、第１の実施例の対象装
置監視処理部１４Ａは、監視処理部２１と障害対処手段
２２とから構成され、監視処理部２１は現在時刻取り出
し手段２３と、時刻格納手段２４と、監視カウンタ加算
手段２５と、監視カウンタ検査手段２６と、カウンタ補
正手段２７とを含んでいる。また、第１の実施例の監視
用管理情報１２Ａは、時刻記憶部２８と、監視カウンタ
記憶部２９と、監視カウンタ限界値記憶部３０とから構
成されている。なお、図２において、実線はデータの流
れを、破線は制御の流れを、それぞれ示している。

【００３２】監視カウンタ記憶部２９は監視カウンタ１
１を記憶している。監視カウンタ１１は監視対象装置１
５からのヘルスメッセージを受信する毎にカウンタリセ
ット手段７によって値０にリセットされ、監視処理部２
１の監視カウンタ加算手段２５によって＋１ずつ加算さ
れる。

【００３３】監視カウンタ限界値記憶部３０は、監視カ
ウンタ１１の値がどの程度の値を越えたら監視対象装置
１５の異常と判定するかの限界値（しきい値）を記憶す
る。監視対象装置１５がヘルスメッセージを出す周期を
Ｔ、監視タイマ６が監視処理起動要求を出す周期をｔと
すると、限界値ＴＨは［Ｔ／ｔ］＋αである。ここで、
［Ｔ／ｔ］はＴをｔで割った商を、αは余裕度を示す値
であり、一般に小さな値の整数値が用いられる。

【００３４】時刻記憶部２８は、監視カウンタ１１が更
新された時刻の履歴を保持する部分である。図３に時刻
記憶部２８の構成例を示す。この例の時刻記憶部２８
は、時刻情報を格納するｎ＋１個の時刻エントリＥ０〜
Ｅｎと、最新の時刻を書き込んだ時刻エントリを指し示
すポインタ４１とから構成されている。ポインタ４１は
初期状態では先頭の時刻エントリＥ０を指し示してい
る。この例の時刻記憶部２８では、過去ｎ＋１回分の時
刻の履歴を保存することができる。ここで、時刻エント
リの個数、つまり過去何回分までの更新時刻の履歴を保
持するかは、限界値ＴＨの値と、監視カウンタ１１の更
新周期が所定の周期よりどれだけ短くなり得るか、その
短い周期がどれほど連続し得るか等の状況を考慮して予
め決定されている。つまり、ｎ＋１＞ＴＨ＋β（β；余
裕個数）である。例えば、限界値ＴＨの２倍程度の個数
にされる。

【００３５】再び図２を参照すると、対象装置監視処理
部１４Ａは起動されると、監視処理部２１を実行する。
監視処理部２１内では、現在時刻取り出し手段２３、時
刻格納手段２４、監視カウンタ加算手段２５、監視カウ
ンタ検査手段２６、カウンタ補正手段２７の順に実行さ
れる。また、監視処理部２１の処理により監視対象装置
１５の異常が検出された場合、障害対処手段２２が引き
続き実行される。

【００３６】図４は対象装置監視処理部１４Ａのフロー
チャートである。対象装置監視処理部１４Ａは起動され
ると、監視処理部２１を起動する。これにより、先ず、
現在時刻取り出し手段２３は、図１の時計４から現在時
刻を取り出す（Ｓ１）。取り出された現在時刻は、現在
時刻取り出し手段２３から時刻格納手段２４及びカウン
タ補正手段２７に出力される。

【００３７】次に、時刻格納手段２４は、現在時刻取り
出し手段２３で取り出された現在時刻を、最新の時刻と
して時刻記憶部２８に格納する（Ｓ２）。新たな時刻情
報を書き込む場合、図３のポインタ４１が指し示す時刻
エントリに書き込み、ポインタ４１を更新して次の時刻
エントリを指し示すようにしておく。但し、最後の時刻
エントリＥｎに時刻情報を書き込んだときは、先頭の時
刻エントリＥ０を指し示すようにポインタ４１を更新す
る。

【００３８】次に、監視カウンタ加算手段２５は、監視
カウンタ記憶部２９中の監視カウンタ１１の値を＋１す
る（Ｓ３）。＋１された後の監視カウンタ１１の値は、
監視カウンタ加算手段２５から監視カウンタ検査手段２
６に出力される。

【００３９】次に、監視カウンタ検査手段２６は、監視
カウンタ限界値記憶部３０に記憶された限界値を取り出
し（Ｓ４）、監視カウンタ１１の値と比較する（Ｓ
５）。監視カウンタ１１の値が限界値を越えていない場
合、対象装置監視処理部１４Ａの今回の処理は終了す
る。監視カウンタ１１の値が限界値を越えていた場合、
限界値を渡してカウンタ補正手段２７を起動する。

【００４０】カウンタ補正手段２７は、時刻記憶部２８
に記憶されている時刻の履歴に基づき、監視対象装置１
５に異常が発生しているか否かを最終的に判定する。監
視対象装置１５を異常と判定しない場合、対象装置監視
処理部１４Ａの今回の処理は終了する。他方、異常と判
定した場合、カウンタ補正手段２７はその旨を障害対処
手段２２に通知する。

【００４１】監視対象装置１５に異常が発生しているか
否かの最終的な判定は、時刻記憶部２８に記憶されてい
る時刻の履歴を調査して行われる。具体的には、カウン
タ補正手段２７は、時刻記憶部２８に記憶されている履
歴中の監視カウンタの値−１番目に古い時刻を基準時刻
として取り出し（Ｓ６）、（基準時刻＋限界値×起動周
期）で表される時刻と、最新の時刻（今回ステップＳ１
で取り出された時刻）とを比較する（Ｓ７）。ここで、
起動周期とは、監視タイマ６が監視処理起動要求を送出
する正規の周期のことである。そして、最新の時刻が、
（基準時刻＋限界値×起動周期）で表される時刻より過
去の時刻であれば、監視カウンタ１１が所定の周期より
短い周期で更新されており、異常と判定して良いだけの
時間が未だ経過していないので、監視対象装置１５の異
常とは判定せずに今回の処理を終了する。他方、最新の
時刻が（基準時刻＋限界値×起動周期）で表される時刻
と同じか将来の時刻であれば、監視対象装置１５の異常
と判定する。この点を図５を参照して説明する。

【００４２】図５では、説明の便宜上、カウンタの限界
値ＴＨを３としている。時刻ｔ４で監視カウンタ１１が
更新されて３となった後、次の更新タイミングｔ３に至
る前に監視対象装置１５からのヘルスメッセージで監視
カウンタ１１が０にリセットされ、その後、時刻ｔ３，
ｔ２，ｔ１のタイミングで監視カウンタ１１が更新さ
れ、さらに時刻ｔ０で監視カウンタ１１が更新されて、
限界値３を越える値４になっている。この場合、監視カ
ウンタの値「４」−１番目に古い時刻はｔ３（カウンタ
がリセット後に初めて更新された時刻）であり、若し、
この時刻ｔ３から正規の周期ｔで更新が３回（限界値）
行われたとすると、時刻ｔ０は、ｔ４＋ｔ×３と一致す
るはずである。にもかかわらず、時刻ｔ０がｔ４＋ｔ×
３で表される時刻より過去の時刻であったとすると、そ
れはｔ３とｔ２間の時間、ｔ２とｔ１間の時間、ｔ１と
ｔ０間の時間の合計時間がｔ×３より短かったことを意
味する。従って、その場合には異常と判定しない。

【００４３】さて、障害対処手段２２は、カウンタ補正
手段２７から監視対象装置１５に異常が発生した旨の通
知を受けると、監視対象装置１５を障害発生装置として
処理し、必要な障害対処処理を実施する（Ｓ８）。この
障害対処処理の具体的な内容としては、監視対象装置１
５をシステムから論理的に切り離したり、初期化したり
すること等が考えられる。また、監視対象装置１５と同
種の機能を持つ他の装置がシステム中に存在する場合、
監視対象装置１５の処理を他の装置（自情報処理装置１
を含む）に引き継ぐ等の処理も考えられる。なお、監視
対象装置１５の障害が検出された後は、監視対象装置１
５の障害監視は停止される。

【００４４】図６に本発明の第１の実施の形態における
第１の実施例の動作タイミングチャートを示す。同図に
おいて、（ａ）は主処理要求部５が待ちキュー９に格納
する主処理の単位時間当たりの要求量の推移を、（ｂ）
は監視タイマ６が監視処理起動要求を待ちキュー９に格
納するタイミングを、（ｃ）は監視カウンタ加算手段２
５による監視カウンタ１１の更新タイミングを、（ｄ）
は監視対象装置１５からのヘルスメッセージによる監視
カウンタ１１のリセットのタイミングを、（ｅ）は監視
カウンタ１１のカウンタ値の推移を、それぞれ示してい
る。また、ここでは、監視カウンタの限界値を「３」と
している。

【００４５】主処理要求部５から待ちキュー９に送られ
る主処理要求の単位時間当たりの要求数が少ない場合、
情報処理装置１は負荷が小さいため、図６の区間Ａに示
されるように、待ちキュー９に格納された監視処理起動
要求は迅速に処理され、カウンタ加算手段２５による監
視カウンタ１１の更新周期はほぼ所定の周期で行われ
る。

【００４６】単位時間当たりの主処理要求数が増大し、
情報処理装置１の負荷が大きくなると、図６の区間Ｂに
示されるように、待ちキュー９に格納された監視処理起
動要求は処理されずに滞留し、カウンタ加算手段２５に
よる監視カウンタ１１の更新も一時的に停止する。

【００４７】その後、単位時間当たりの主処理要求数が
減り且つ待ちキュー９内に滞留していた主処理要求が処
理され尽くされると、図６の区間Ｃに示されるように、
待ちキュー９に滞留していた監視処理起動要求が次々と
処理され、カウンタ加算手段２５による監視カウンタ１
１の更新周期が所定周期よりも短くなる。このため、監
視対象装置１５から一定周期以内にヘルスメッセージが
出ているにもかかわらず、時刻ｔ０の時点で監視カウン
タ１１の値が限界値の３を越えている。従来はこれをも
って監視対象装置１５の異常と判定していた為に誤検出
していた。しかし、本実施例では、カウンタ補正手段２
７が最終的な判定を下すため、誤検出が防止される。つ
まり、図６の時刻ｔ０の場合、監視カウンタの値が１か
ら当該値「４」に至るまでの時間が、（限界値「３」×
正規の周期）より短いため、異常とは判定されない。

【００４８】次に、本発明の第１の実施の形態における
対象装置監視処理部１４の第２の実施例について説明す
る。

【００４９】図７を参照すると、第２の実施例の対象装
置監視処理部１４Ｂは、監視処理部２１中に時刻確認手
段３１を備えている点で、図２に示した第１の実施例の
対象装置監視処理部１４Ａと相違している。その他、監
視用管理情報１２Ｂを含め、他の構成は第１の実施例と
同じである。なお、図７において、実線はデータの流れ
を、破線は制御の流れを、それぞれ示している。

【００５０】図８に対象装置監視処理部１４Ｂのフロー
チャートを示す。Ｓ１１，Ｓ１２が時刻確認手段３１に
よる処理ステップである。時刻確認手段３１は、時刻記
憶部２８に記憶されている最新の時刻（監視カウンタ１
１を前回更新した時刻）を取り出し（Ｓ１１）、この時
刻と現在時刻取り出し手段２３で今回取り出された現在
時刻との差が予め定められた一定時間内か否かを判定し
（Ｓ１２）、一定時間内であれば監視処理部２１の以降
の処理を割愛して処理を終了せしめ、一定時間内でなけ
れば時刻格納手段２４以降の処理を行わせる手段であ
る。ここで、比較対象となる一定時間は、監視カウンタ
１１の正規の更新周期より短い時間に設定される。

【００５１】図９に図６と同様な動作タイミングチャー
トを示す。図６との相違点は、時刻ｔ２と監視カウンタ
１１が前回更新された時刻ｔ３との差が一定時間内であ
るため、時刻ｔ２では監視カウンタ１１が更新されてい
ないこと、同じく時刻ｔ０と前回の更新時刻ｔ１との差
が一定時間内であるため、時刻ｔ０では監視カウンタ１
１が更新されていないことである。

【００５２】このように第２の実施例の対象装置監視処
理部１４Ｂによれば、時刻確認手段３１を備えることに
より、異常検出のタイミングがごく短い間だけ抜ける可
能性はあるが、待ちキュー９に要求が滞留するほど負荷
が上がっている情報処理装置１の処理ステップの削減が
実現でき、負荷軽減に効果がある。

【００５３】次に、本発明の第１の実施の形態における
対象装置監視処理部１４及び監視用管理情報１１の第３
の実施例について説明する。

【００５４】図１０を参照すると、第３の実施例の対象
装置監視処理部１４Ｃは、監視処理部２１中にカウンタ
値確認手段３２を備え、時刻格納手段２４による時刻の
格納前に監視カウンタ加算手段２５による監視カウンタ
１１の加算を行い、その加算後のカウンタ値が「１」で
あることがカウンタ値確認手段３２で確認された場合に
時刻格納手段２４による時刻の格納を行って今回の処理
を終了し、加算後のカウンタ値が「１」以外であれば、
監視カウンタ検査手段２６以降の処理を行う点で、図２
に示した第１の実施例の対象装置監視処理部１４Ａと相
違している。また、監視用管理情報１１Ｃ中の時刻記憶
部２８は１つの時刻エントリのみで構成されている点が
図２のものと相違する。なお、図１０において、実線は
データの流れを、破線は制御の流れを、それぞれ示して
いる。

【００５５】図１１に対象装置監視処理部１４Ｃのフロ
ーチャートを示す。以下、本実施例の動作を説明する。

【００５６】現在時刻取り出し手段２３が図１の時計４
から現在時刻を取り出すと（Ｓ２１）、続いて監視カウ
ンタ加算手段２５が監視カウンタ１１の値を＋１だけ加
算する（Ｓ２２）。次に、カウンタ値確認手段３２が、
この加算後の監視カウンタ１１の値が「１」か否かを判
定する（Ｓ２３）。監視カウンタ１１の値が「１」であ
れば、時刻格納手段２４がステップＳ２１で取り出され
た現在時刻を基準時刻として時刻記憶部２８に格納する
（Ｓ２４）。時刻記憶部２８は１つの時刻エントリしか
有していないので、新たな基準時刻の格納は上書きによ
って行われる。そして、対象装置監視処理部１４Ｃは今
回の処理を終える。

【００５７】他方、監視カウンタ１１の値が「１」以外
の値であるときは、監視カウンタ検査手段２６によって
カウンタ値が限界値を越えているか否かが検査され（Ｓ
２５，Ｓ２６）、若し越えていればカウンタ補正手段２
７による処理が実行される。つまり、カウンタ補正手段
２７は時刻記憶部２８に格納されている基準時刻を取り
出し（Ｓ２７）、（基準時刻＋限界値×起動周期）で表
される時刻と、最新の時刻（今回ステップＳ２１で取り
出された時刻）とを比較する（Ｓ２８）。そして、最新
の時刻が、（基準時刻＋限界値×起動周期）で表される
時刻より過去の時刻であれば、今回の処理を終了し、最
新の時刻が（基準時刻＋限界値×起動周期）で表される
時刻と同じか将来の時刻であれば、監視対象装置１５の
異常と判定し、障害対処手段２２にその旨通知する。

【００５８】このように第３の実施例の対象装置監視処
理部１４Ｃによれば、カウンタ値確認手段３２を備える
ことにより、カウンタ補正手段２７の判定に使用する基
準時刻のみを時刻記憶部２８に採取することができ、時
刻記憶部２８の容量を削減することができる。但し、監
視カウンタ１１の更新毎の時刻の履歴を採取していない
ので、第２の実施例の対象装置監視処理部１４Ｂにおけ
る時刻確認手段３１の付加は行えない。

【００５９】（２）第２の実施の形態図１２は本発明における第２の実施の形態のブロック図
である。この第２の実施の形態では、情報処理装置５１
と情報処理装置６６間で相互に相手装置の異常を監視す
る。図１２において、情報処理装置５１および情報処理
装置６６は、ホストコンピュータ，入出力処理装置，排
他制御装置などの情報処理システムの構成要素の一つで
あり、自装置本来の機能に加えて、相手の情報処理装置
の異常を検出する機能を備えている。自装置本来の機能
とは、情報処理装置５１，６６がホストコンピュータで
あればホスト処理、入出力処理装置であれば入出力処
理、排他制御装置であれば排他制御処理のことである。
また、自装置本来の機能の遂行に伴い、情報処理装置５
１と情報処理装置６６は互いにメッセージを授受し合う
関係にある。

【００６０】情報処理装置５１は、プロセッサ５２と、
主記憶５３と、時計５４と、主処理要求部５５と、監視
タイマ５６と、カウンタリセット手段５７を含む送受信
部６５と、記録媒体５８とを備える。また、プロセッサ
５２は待ちキュー５９と要求実行部６０とを有し、主記
憶５３は監視カウンタ６１を含む監視用管理情報６２を
格納する。更に、要求実行部６０は主処理部６３と対象
装置監視処理部６４とを含んでいる。

【００６１】送受信部６５内のカウンタリセット手段５
７は、情報処理装置６６から自装置が正常である旨のヘ
ルスメッセージ及びその他の何らかのメッセージを送受
信部６５が受信した時、主記憶５３の監視用管理情報５
２中の監視カウンタ６１を０にリセットする手段であ
る。ここで、情報処理装置６６は、情報処理装置５１と
同様に、自装置が正常である旨を示すヘルスメッセージ
を予め定められた周期で情報処理装置５１に送出するよ
うプログラミングされている。若し、情報処理装置６６
に障害が発生した場合、ヘルスメッセージ及び他の如何
なるメッセージも送出されなくなり、監視カウンタ６１
もリセットされなくなる。

【００６２】主処理要求部５５は、情報処理装置５１本
来の機能にかかる処理（主たる処理）の要求をプロセッ
サ５２中の待ちキュー５９に格納する手段であり、監視
タイマ５６は、監視処理を起動する要求を待ちキュー５
９に格納する手段である。監視タイマ５６は予め定めら
れた周期（例えば１秒周期）で、監視処理の起動要求を
待ちキュー５９に格納する。

【００６３】待ちキュー５９は例えばＦＩＦＯレジスタ
で構成され、主処理要求部５５および監視タイマ５６か
ら格納された要求を格納順に保持する。要求実行部６０
は、待ちキュー５９に要求が１つ以上存在する場合、待
ちキュー５９から要求を１つずつ順番に取り出し、その
要求の種類に応じた処理を実行する。即ち、取り出した
要求が情報処理装置５１の主たる処理の要求であれば、
主処理部６３でその要求に応じた処理を実行する。ここ
で、主処理部６３では、情報処理装置５１がホストコン
ピュータであればホスト処理、入出力処理装置であれば
入出力処理、排他制御装置であれば排他制御処理が行わ
れる。また、主処理に関連して情報処理装置６６と送受
信部６５を通じてメッセージの送受信を行う。

【００６４】他方、取り出した要求が監視処理起動要求
であれば、要求実行部６０は対象装置監視処理部６４を
起動し、対象装置監視処理を実行する。この対象装置監
視処理では、自装置５１が正常である旨を示すヘルスメ
ッセージを送受信部６５を通じて情報処理装置６６に送
出する処理、監視カウンタ６１の値を例えば＋１だけ更
新する処理、更新後のカウンタ値が予め定められた限界
値を越えたか否かをチェックする処理などが行われる。

【００６５】前述したように監視タイマ５６から待ちキ
ュー５９へは予め定められた周期毎に１つの監視処理起
動要求が格納される。主処理要求部５５から待ちキュー
５９への単位時間当たりの要求格納数が少ない場合、待
ちキュー５９に格納された監視処理起動要求はほぼ所定
周期ごとに実行され、その結果、監視カウンタ６１のカ
ウントアップも所定周期ごとに行われる。しかし、主処
理要求部５５から待ちキュー５９へ一度に多量の要求が
格納されると、それ以降に待ちキュー５９に格納された
監視処理起動要求は、待ちキュー５９に滞留している主
たる処理の要求が処理されるまで処理されず、そして、
主たる処理要求の処理が終わった時点で、それまで待ち
キュー５９に滞留していた複数の監視処理起動要求が次
々と処理される。この結果、過渡的に、短い周期で対象
装置監視処理部６４が連続して起動され、監視カウンタ
６１が短い周期でカウントアップされる事象が発生し、
限界値との比較のみによる異常検出では誤検出する危険
性がある。このため、対象装置監視処理部６４では、カ
ウンタ値が限界値を越えた場合、カウンタ更新処理の周
期の乱れを調査して最終的な判断を下す。

【００６６】上述した対象装置監視処理部６４は、プロ
セッサ５２のハードウェアで実現することも可能である
が、ソフトウェアによって実現することもできる。この
場合、ＣＤ−ＲＯＭ，半導体メモリ，磁気ディスク等の
機械読み取り可能な記録媒体５８に記録された対象装置
監視用プログラムが、例えば情報処理装置５１の立ち上
げ時にプロセッサ５２に読み取られ、プロセッサ５２の
動作を制御することにより、プロセッサ５２上に対象装
置監視処理部６４を実現し、また、主記憶５３上に監視
用管理情報６２を初期生成する。

【００６７】時計５４は現在時刻を計時する手段であ
り、プロセッサ５２上の対象装置監視処理部６４等はＯ
Ｓ（図示せず）のシステムコールによって時計５４から
現在時刻を取得することが可能になっている。この時計
５４は、カウンタ更新処理が行われた時刻の履歴をとる
ため等に使用される。

【００６８】情報処理装置６６も、図１２では内部のブ
ロックは省略しているが、情報処理装置５１と同様の構
成を有しており、双方の送受信部６５間が通信路を通じ
て接続され、相互に通信可能となっている。

【００６９】次に、本発明の第２の実施の形態における
対象装置監視処理部６４および監視用管理情報６２の第
１の実施例について説明する。

【００７０】図１３を参照すると、第１の実施例の対象
装置監視処理部６４Ａは、ヘルスメッセージ送出手段７
１と監視処理部７２と障害対処手段７３とから構成さ
れ、監視処理部７２は現在時刻取り出し手段７４と、時
刻格納手段７５と、監視カウンタ加算手段７６と、監視
カウンタ検査手段７７と、カウンタ補正手段７８とを含
んでいる。また、第１の実施例の監視用管理情報６２Ａ
は、時刻記憶部７９と、監視カウンタ記憶部８０と、監
視カウンタ限界値記憶部８１とから構成されている。な
お、図１３において、実線はデータの流れを、破線は制
御の流れを、それぞれ示している。

【００７１】監視カウンタ記憶部８０は監視カウンタ６
１を記憶している。監視カウンタ６１は情報処理装置６
６から何らかのメッセージを受信する毎にカウンタリセ
ット手段５７によって値０にリセットされ、監視処理部
７２の監視カウンタ加算手段７６によって＋１ずつ加算
される。

【００７２】監視カウンタ限界値記憶部８１は、監視カ
ウンタ６１の値がどの程度の値を越えたら情報処理装置
６６の異常と判定するかの限界値（しきい値）を記憶す
る。情報処理装置６６がヘルスメッセージを出す周期を
Ｔ、監視タイマ５６が監視処理起動要求を出す周期をｔ
とすると、限界値ＴＨは［Ｔ／ｔ］＋αである。ここ
で、［Ｔ／ｔ］はＴをｔで割った商を、αは余裕度を示
す値であり、一般に小さな値の整数値が用いられる。こ
こで、本第２の実施の形態では、相手装置に対してヘル
スメッセージを送出する処理と相手装置の監視のために
監視カウンタ６１を更新する処理とが同じ対象装置監視
処理部６４内で行われるため、［Ｔ／ｔ］の商は１にな
り、従って限界値ＴＨは例えば「２」程度に設定され
る。

【００７３】時刻記憶部７９は、監視カウンタ６１が更
新された時刻の履歴を保持する部分であり、その構成の
一例は図３に示したものと同様である。即ち、時刻記憶
部７９は、時刻情報を格納するｎ＋１個の時刻エントリ
Ｅ０〜Ｅｎと、最新の時刻を書き込んだ時刻エントリを
指し示すポインタ４１とから構成されている。ポインタ
４１は初期状態では先頭の時刻エントリＥ０を指し示し
ている。この例の時刻記憶部７９では、過去ｎ＋１回分
の時刻の履歴を保存することができる。ここで、時刻エ
ントリの個数、つまり過去何回分までの更新時刻の履歴
を保持するかは、限界値ＴＨの値と、監視カウンタ６１
の更新周期が所定の周期よりどれだけ短くなり得るか、
その短い周期がどれほど連続し得るか等の状況を考慮し
て予め決定されている。つまり、ｎ＋１＞ＴＨ＋β
（β；余裕個数）である。例えば、限界値ＴＨの２倍程
度、従って４個程度の時刻エントリが設けられる。

【００７４】対象装置監視処理部６４Ａは起動される
と、まずヘルスメッセージ送出手段７１を実行し、次い
で、監視処理部７２を実行する。監視処理部７１内で
は、現在時刻取り出し手段７４、時刻格納手段７５、監
視カウンタ加算手段７６、監視カウンタ検査手段７７、
カウンタ補正手段７８の順に実行される。また、監視処
理部７２の処理により情報処理装置６６の異常が検出さ
れた場合、障害対処手段７３が引き続き実行される。

【００７５】図１４は対象装置監視処理部６４Ａのフロ
ーチャートである。対象装置監視処理部６４Ａが起動さ
れると、先ずヘルスメッセージ送出手段７１が送受信部
６５を通じて情報処理装置６６に対しヘルスメッセージ
を送信する（Ｓ５１）。

【００７６】次に、監視処理部７２が起動され、現在時
刻取り出し手段７４が、図１２の時計５４から現在時刻
を取り出す（Ｓ５２）。取り出された現在時刻は、現在
時刻取り出し手段７４から時刻格納手段７５及びカウン
タ補正手段７８に出力される。

【００７７】次に、時刻格納手段７５は、現在時刻取り
出し手段７４で取り出された現在時刻を、最新の時刻と
して時刻記憶部７９に格納する（Ｓ５３）。新たな時刻
情報を書き込む場合、図３のポインタ４１が指し示す時
刻エントリに書き込み、ポインタ４１を更新して次の時
刻エントリを指し示すようにしておく。但し、最後の時
刻エントリＥｎに時刻情報を書き込んだときは、先頭の
時刻エントリＥ０を指し示すようにポインタ４１を更新
する。

【００７８】次に、監視カウンタ加算手段７６は、監視
カウンタ記憶部８０中の監視カウンタ６１の値を＋１す
る（Ｓ５４）。＋１された後の監視カウンタ６１の値
は、監視カウンタ加算手段７６から監視カウンタ検査手
段７７に出力される。

【００７９】次に、監視カウンタ検査手段７７は、監視
カウンタ限界値記憶部８１に記憶された限界値を取り出
し（Ｓ５５）、監視カウンタ６１の値と比較する（Ｓ５
６）。監視カウンタ６１の値が限界値を越えていない場
合、対象装置監視処理部６４Ａの今回の処理は終了す
る。監視カウンタ６１の値が限界値を越えていた場合、
カウンタ補正手段７８が起動される。

【００８０】カウンタ補正手段７８は、第１の実施の形
態と同様の方法で、時刻記憶部７９に記憶されている時
刻の履歴に基づき、情報処理装置６６に異常が発生して
いるか否かの最終判断を下す（Ｓ５７，Ｓ５８）。情報
処理装置６６に異常が発生していないと判断した場合、
対象装置監視処理部６４Ａの今回の処理は終了する。他
方、情報処理装置６６に異常が発生していると判断した
場合、カウンタ補正手段７８はその旨を障害対処手段７
３に通知する。

【００８１】障害対処手段７３は、カウンタ補正手段７
８から情報処理装置６６に異常が発生した旨の通知を受
けると、情報処理装置６６を障害発生装置として処理
し、必要な障害対処処理を実施する（Ｓ５９）。この障
害対処処理の具体的な内容としては、情報処理装置６６
をシステムから論理的に切り離したり、初期化したりす
ることが考えられる。また、情報処理装置６６と同種の
機能を持つ他の装置がシステム中に存在する場合、情報
処理装置６６の処理を他の装置（自情報処理装置５１を
含む）に引き継ぐ等の処理も考えられる。なお、情報処
理装置６６の障害が検出された後は、情報処理装置５１
における情報処理装置６６の障害監視は停止される。

【００８２】図１５に本発明の第２の実施の形態におけ
る第１の実施例の動作タイミングチャートを示す。同図
において、（ａ）は主処理要求部５５が待ちキュー５９
に格納する主処理の単位時間当たりの要求量の推移を、
（ｂ）は監視タイマ５６が監視処理起動要求を待ちキュ
ー５９に格納するタイミングを、（ｃ）は監視カウンタ
加算手段７６による監視カウンタ６１の更新タイミング
を、（ｄ）は情報処理装置６６からのヘルスメッセージ
による監視カウンタ６１のリセットのタイミングを、
（ｅ）は監視カウンタ６１のカウンタ値の推移を、それ
ぞれ示している。また、ここでは、監視カウンタの限界
値を「２」としている。

【００８３】主処理要求部５５から待ちキュー５９に送
られる主処理要求の単位時間当たりの要求数が少ない場
合、情報処理装置５１は負荷が小さいため、図１５の区
間Ａに示されるように、待ちキュー５９に格納された監
視処理起動要求は迅速に処理され、カウンタ加算手段７
６による監視カウンタ６１の更新周期はほぼ所定の周期
で行われる。

【００８４】単位時間当たりの主処理要求数が増大し、
情報処理装置５１の負荷が大きくなると、図１５の区間
Ｂに示されるように、待ちキュー５９に格納された監視
処理起動要求は処理されずに滞留し、カウンタ加算手段
７６による監視カウンタ６１の更新も一時的に停止す
る。

【００８５】その後、単位時間当たりの主処理要求数が
減り且つ待ちキュー５９内に滞留していた主処理要求が
処理され尽くされると、図１５の区間Ｃに示されるよう
に、待ちキュー５９に滞留していた監視処理起動要求が
次々と処理され、カウンタ加算手段７６による監視カウ
ンタ６１の更新周期が所定周期よりも短くなる。このた
め、情報処理装置６６から一定周期以内にヘルスメッセ
ージが出ているにもかかわらず、時刻ｔ０の時点で監視
カウンタ６１の値が限界値の２を越えている。従来はこ
れをもって情報処理装置６６の異常と判定していた為に
誤検出していた。しかし、本実施例では、カウンタ補正
手段７８が最終的な判断を下すため、誤検出が防止され
る。つまり、図１５の時刻ｔ０の場合、監視カウンタ６
１の値が１から当該値「３」に至るまでの時間が、（限
界値「２」×正規の周期）より短いため、異常とは判定
されない。

【００８６】なお、図１５において、（ｃ）のカウンタ
更新のタイミングは、情報処理装置５１から情報処理装
置６６に対しヘルスメッセージを送出するタイミングで
もある。このため、時刻ｔ３と時刻ｔ２間に見られるよ
うに主処理の高負荷時にはヘルスメッセージを送出する
周期が延びる。しかし、本第２の実施の形態では、情報
処理装置５１における主処理時に、主処理に関連するメ
ッセージが情報処理装置６６に送られ、情報処理装置６
６側のカウンタリセット手段５７によって監視カウンタ
がリセットされるため、問題はない。

【００８７】次に、本発明の第２の実施の形態における
対象装置監視処理部６４及び監視用管理情報６２の第２
の実施例について説明する。

【００８８】図１６を参照すると、第２の実施例の対象
装置監視処理部６４Ｂは、監視処理部７２中に時刻確認
手段８２を備えている点で、図１３に示した第１の実施
例の対象装置監視処理部６４Ａと相違している。その
他、監視用管理情報６２Ｂを含め、他の構成は第１の実
施例と同じである。なお、図１６において、実線はデー
タの流れを、破線は制御の流れを、それぞれ示してい
る。

【００８９】図１７に対象装置監視処理部６４Ｂのフロ
ーチャートを示す。Ｓ６１，Ｓ６２が時刻確認手段８２
による処理ステップである。

【００９０】時刻確認手段８２は、時刻記憶部７９に記
憶されている最新の時刻（監視カウンタ６１を前回更新
した時刻）を取り出し（Ｓ６１）、この時刻と現在時刻
取り出し手段７４で今回取り出された現在時刻との差が
予め定められた一定時間内か否かを判定し（Ｓ６２）、
一定時間内であれば監視処理部７２の以降の処理を割愛
して処理を終了せしめ、一定時間内でなければ時刻格納
手段７５以降の処理を行わせる手段である。ここで、比
較対象となる一定時間は、監視カウンタ６１の正規の更
新周期より短い時間に設定される。

【００９１】図１８に図１５と同様な動作タイミングチ
ャートを示す。図１５との相違点は、時刻ｔ１と監視カ
ウンタ６１が前回更新された時刻ｔ２との差が一定時間
内であるため、時刻ｔ１では監視カウンタ６１が更新さ
れていないこと、同じく時刻ｔ０と前回の更新時刻ｔ２
との差が一定時間内であるため、時刻ｔ０でも監視カウ
ンタ６１が更新されていないことである。

【００９２】このように第２の実施例の対象装置監視処
理部６４Ｂによれば、時刻確認手段８２を備えることに
より、異常検出のタイミングがごく短い間だけ抜ける可
能性はあるが、待ちキュー５９に要求が滞留するほど負
荷が上がっている情報処理装置５１の処理ステップの削
減が実現でき、負荷軽減に効果がある。

【００９３】次に、本発明の第２の実施の形態における
対象装置監視処理部６４及び監視用管理情報６２の第３
の実施例について説明する。

【００９４】図１９を参照すると、第３の実施例の対象
装置監視処理部６４Ｃは、監視処理部７２中にカウンタ
値確認手段８３を備え、時刻格納手段７５による時刻の
格納前に監視カウンタ加算手段７６による監視カウンタ
６１の加算を行い、その加算後のカウンタ値が「１」で
あることがカウンタ値確認手段８３で確認された場合に
時刻格納手段７５による時刻の格納を行って今回の処理
を終了し、加算後のカウンタ値が「１」以外であれば、
監視カウンタ検査手段７７以降の処理を行う点で、図１
３に示した第１の実施例の対象装置監視処理部６４Ａと
相違している。また、監視用管理情報６２Ｃ中の時刻記
憶部７９は１つの時刻エントリのみで構成されている点
が図１３のものと相違する。なお、図１９において、実
線はデータの流れを、破線は制御の流れを、それぞれ示
している。

【００９５】図２０に対象装置監視処理部６４Ｃのフロ
ーチャートを示す。まず、ヘルスメッセージ送出手段７
１が情報処理処置６６に対しヘルスメッセージを送出す
る（Ｓ７１）。次に、現在時刻取り出し手段７４が図１
２の時計５４から現在時刻を取り出し（Ｓ７２）、続い
て監視カウンタ加算手段７６が監視カウンタ６１の値を
＋１だけ加算する（Ｓ７３）。次に、カウンタ値確認手
段８３が、この加算後の監視カウンタ６１の値が「１」
か否かを判定する（Ｓ７４）。監視カウンタ６１の値が
「１」であれば、時刻格納手段７５がステップＳ７２で
取り出された現在時刻を基準時刻として時刻記憶部７９
に格納する（Ｓ７５）。時刻記憶部７９は１つの時刻エ
ントリしか有していないので、新たな基準時刻の格納は
上書きによって行われる。そして、対象装置監視処理部
６４Ｃは今回の処理を終える。

【００９６】他方、監視カウンタ６１の値が「１」以外
の値であるときは、監視カウンタ検査手段７７によって
カウンタ値が限界値を越えているか否かが検査され（Ｓ
７６，Ｓ７７）、若し越えていればカウンタ補正手段７
８による処理が実行される。つまり、カウンタ補正手段
７８は時刻記憶部７９に格納されている基準時刻を取り
出し（Ｓ７８）、（基準時刻＋限界値×起動周期）で表
される時刻と、最新の時刻（今回ステップＳ７２で取り
出された時刻）とを比較する（Ｓ７９）。そして、最新
の時刻が、（基準時刻＋限界値×起動周期）で表される
時刻より過去の時刻であれば、今回の処理を終了し、最
新の時刻が（基準時刻＋限界値×起動周期）で表される
時刻と同じか将来の時刻であれば、情報処理装置６６の
異常と判定し、障害対処手段７３にその旨通知する。

【００９７】このように第３の実施例の対象装置監視処
理部６４Ｃによれば、カウンタ値確認手段８３を備える
ことにより、カウンタ補正手段７８の判定に使用する基
準時刻のみを時刻記憶部７９に採取することができ、時
刻記憶部７９の容量を削減することができる。但し、監
視カウンタ６１の更新毎の時刻の履歴を採取していない
ので、第２の実施例の対象装置監視処理部６４Ｂにおけ
る時刻確認手段８２の付加は行えない。

【００９８】次に本発明の第２の実施の形態の適用例に
ついて説明する。

【００９９】図２１は、本発明の第２の実施の形態を、
二重化された排他制御装置に対して適用した際の排他制
御装置の構成例を示し、図２２は、二重化された排他制
御装置を有する情報処理システムの構成例を示す。

【０１００】まず図２２を参照すると、この例の情報処
理システムは、各々独立に動作する複数のホスト（ホス
トコンピュータ）１０１−１〜１０１−ｍと、これら複
数のホスト１０１−１〜１０１−ｍで共有される共有資
源１０２と、共有資源１０２を複数のホスト１０１−１
〜１０１−ｍで矛盾無く使用できるように排他制御を行
う二重化された排他制御装置１０３とを含んでいる。共
有資源１０２としては、メモリの一部の領域やファイ
ル，プリンタ等がある。また、二重化された排他制御装
置１０３は、同じ構成を有する２台の排他制御装置９
１，９２で構成されている。

【０１０１】次に図２１を参照すると、排他制御装置９
１は、プロセッサ５２と、主記憶５３と、時計５４と、
監視タイマ５６と、記録媒体５８と、カウンタリセット
手段５７を含むペアインターフェース９６と、ホストイ
ンターフェース９３とを備える。また、プロセッサ５２
は待ちキュー５９と要求実行部６０とを有し、主記憶５
３は監視カウンタ６１を含む監視用管理情報６２と排他
制御用管理情報９５とを格納する。更に、要求実行部６
０は、主処理部である排他制御処理部９４と対象装置監
視処理部６４とを含んでいる。ここで、図１２と同一符
号は同一部分を示している。また、排他制御装置９２も
図２１では内部のブロックは図示を省略しているが、排
他制御装置９１と同様の構成を有しており、双方のペア
インターフェース９６間が接続され、相互に通信可能に
なっている。

【０１０２】システム立ち上げ時、２台の排他制御装置
９１，９２の一方、例えば排他制御装置９１が主の排他
制御装置、他方の排他制御装置９２が従の排他制御装置
となる。各ホスト１０１−１〜１０１−ｍは、共有資源
１０２中の或る資源をアクセスするのに先立ち、その資
源の使用権を得るために主の排他制御装置９１に対しロ
ック取得要求を送出する。また、既に或る資源の使用権
を得ていたホスト１０１−１〜１０１−ｍがその資源の
アクセスを終了し、使用権を手放す場合は、主の排他制
御装置９１に対しロック解放要求を送出する。

【０１０３】主の排他制御装置９１では、上記のロック
取得要求，ロック解放要求はホストインターフェース９
３で受け取られ、ホストインターフェース９３はその要
求をプロセッサ５２の待ちキュー５９に格納する。同様
の要求が他のホストから送出された場合も、それらの要
求が待ちキュー５９に順次格納される。また、監視タイ
マ５６からは所定周期で監視処理起動要求が待ちキュー
５９に格納される。

【０１０４】要求実行部６０は、待ちキュー５９から要
求を１つずつ取り出し、その要求がロック取得要求，ロ
ック解放要求であれば排他制御処理部９４にその要求を
処理させる。

【０１０５】排他制御処理部９４は、主記憶５３上の排
他制御用管理情報９５によって、共有資源１０２のどの
資源がどのホストで使用中であるか、また未使用である
かを管理している。ロック取得要求の場合、要求された
資源が使用中で他のホストで使用できなければ、要求元
のホストに対してホストインターフェース９３を通じて
不許可を通知する。他方、要求された資源が使用中でな
ければ管理情報９５上でその資源を使用中に更新して、
要求元のホストに対してホストインターフェース９３を
通じて使用の許可を返却する。このとき、管理情報９５
の更新内容をペアインターフェース９６を通じて従の排
他制御装置９２にメッセージとして送出し、排他制御装
置９２側では、自身の主記憶上の排他制御用管理情報を
同様に更新し、更新終了時点で正常終了を示すメッセー
ジを主の排他制御装置９１にペアインターフェースを通
じて返却する。

【０１０６】また、要求がロック解放要求の場合、排他
制御処理部９４は、管理情報９５上で解放要求された資
源を未使用中に更新し、管理情報９５の更新内容をペア
インターフェース９６を通じて従の排他制御装置９２に
メッセージとして送出する。排他制御装置９２側では、
自身の主記憶上の排他制御用管理情報を同様に更新し、
更新終了時点で正常終了を示すメッセージを主の排他制
御装置９１にペアインターフェース９６を通じて返却す
る。

【０１０７】以上のような排他制御処理部９４による処
理に伴って排他制御装置９１と排他制御装置９２との間
でメッセージの授受が行われると、ペアインターフェー
ス９６内に設けられたカウンタリセット手段５７が、相
手装置からメッセージを受信した時点で監視カウンタ６
１を値０にリセットする。

【０１０８】他方、待ちキュー５９から取り出された要
求が監視処理起動要求である場合、要求実行部６０は、
対象装置監視処理部６４を起動する。この対象装置監視
処理部６４としては、図１３で説明した第１の実施例、
図１６で説明した第２の実施例、図１９で説明した第３
の実施例のうちの任意のものを使用することができる。
そして、対象装置監視処理部６４で従の排他制御装置９
２の異常が検出された場合、障害対処手段７３におい
て、従の排他制御装置９２に異常が発生した旨がホスト
１０１−１〜１０１−ｍにホストインターフェース９３
を通じて通知される。また、早期の交換を促すためにオ
ペレータへの通知を行う。一方、従の排他制御装置９２
において主の排他制御装置９１の異常が検出された場
合、その障害対処手段７３において、主の排他制御装置
９１に異常が発生した旨がホスト１０１−１〜１０１−
ｍにホストインターフェースを通じて通知され、以後、
従の排他制御装置９２が主の排他制御装置として動作す
る。また、早期の交換を促すためにオペレータへの通知
を行う。

【０１０９】以上の適用例では、一方を主、他方を従と
する二重化構成の排他制御装置に対し本発明を適用した
が、双方の排他制御装置が全く同じ処理を並行して行う
形態の二重化構成や、受け持つホストや共有資源を各々
で分担する形態の二重化構成の排他制御装置に対しても
適用可能である。また、二重化された排他制御装置に対
して適用したが、二重化されたホストコンピュータや、
二重化された入出力処理装置等に対しても適用できる。

【０１１０】

【発明の効果】以上説明したように本発明によれば以下
のような効果を得ることができる。

【０１１１】監視対象装置から一定時間以内毎に出力さ
れるべき通知の有無に基づき監視対象装置の異常を検出
する際、監視用のカウンタの更新周期の変動による誤検
出を防止することができる。その理由は、カウンタの値
が限界値を越えたとき、カウンタ更新処理の周期が予め
定められた周期より短くなっていなかった場合に限っ
て、監視対象装置の異常と判定するからであり、また、
カウンタがリセット後に初めて更新された時刻に（限界
値×カウンタ更新周期の正規の値）を足した時刻と今回
の更新時刻との比較結果に応じて、監視対象装置の異常
の有無を最終的に判定するからである。

【０１１２】監視処理に要する負荷の増大を極力抑える
ことができる。その理由は、カウンタが限界値を越える
まではカウンタ補正手段が動作せず、時刻の比較等によ
る最終的な判断を下す必要がないからである。

【０１１３】時刻確認手段またはそれに該当する処理を
備える構成にあっては、監視処理に要するステップ数の
削減が行える。その理由は、前回のカウンタ更新処理か
ら予め定められた周期より短い周期で到来するカウンタ
更新処理を無効にして監視処理を速やかに終了させるか
らである。

【０１１４】カウンタ値確認手段またはそれに該当する
処理を備える構成にあっては、カウンタがリセット後に
初めて更新された時刻の履歴のみを記録するため、時刻
の採取回数の削減、時刻の履歴を格納する領域の削減が
可能となる。

【０１１５】相手装置から一定時間以内毎に出力される
べき通知の有無に基づき相手装置の異常を検出すると共
に、相手装置で自装置の異常の検出が行えるように自装
置から相手装置に一定時間毎に通知を出す処理をも行う
装置において、相手装置の異常を検出する処理と相手装
置へ通知を出す処理とを同じ監視処理内で実行する構成
にあっては、監視処理の起動要求を所定周期で待ちキュ
ーに入れるだけで、相手装置の監視と相手装置への通知
の送出とを同時に行わせることができる。また、監視タ
イマを相手装置への通知用と監視用とに兼用することが
できる。

【図面の簡単な説明】

【図１】本発明における第１の実施の形態のブロック図
である。

【図２】本発明の第１の実施の形態における対象装置監
視処理部および監視用管理情報の第１の実施例を示すブ
ロック図である。

【図３】本発明の第１の実施の形態の第１の実施例にお
ける時刻記憶部の構成例を示すブロック図である。

【図４】本発明の第１の実施の形態の第１の実施例にお
ける対象装置監視処理部のフローチャートである。

【図５】本発明の第１の実施の形態の第１の実施例にお
けるカウンタ補正手段の動作説明図である。

【図６】本発明の第１の実施の形態における第１の実施
例の動作タイミングチャートである。

【図７】本発明の第１の実施の形態における対象装置監
視処理部および監視用管理情報の第２の実施例のブロッ
ク図である。

【図８】本発明の第１の実施の形態の第２の実施例にお
ける対象装置監視処理部のフローチャートである。

【図９】本発明の第１の実施の形態における第２の実施
例の動作タイミングチャートである。

【図１０】本発明の第１の実施の形態における対象装置
監視処理部および監視用管理情報の第３の実施例を示す
ブロック図である。

【図１１】本発明の第１の実施の形態の第３の実施例に
おける対象装置監視処理部のフローチャートである。

【図１２】本発明における第２の実施の形態のブロック
図である。

【図１３】本発明の第２の実施の形態における対象装置
監視処理部および監視用管理情報の第１の実施例のブロ
ック図である。

【図１４】本発明の第２の実施の形態の第１の実施例に
おける対象装置監視処理部のフローチャートである。

【図１５】本発明の第２の実施の形態における第１の実
施例の動作タイミングチャートである。

【図１６】本発明の第２の実施の形態における対象装置
監視処理部および監視用管理情報の第２の実施例のブロ
ック図である。

【図１７】本発明の第２の実施の形態の第２の実施例に
おける対象装置監視処理部のフローチャートである。

【図１８】本発明の第２の実施の形態における第２の実
施例の動作タイミングチャートである。

【図１９】本発明の第２の実施の形態における対象装置
監視処理部及び監視用管理情報の第３の実施例のブロッ
ク図である。

【図２０】本発明の第２の実施の形態の第３の実施例に
おける対象装置監視処理部のフローチャートである。

【図２１】本発明の第２の実施の形態を二重化された排
他制御装置に対して適用した際の排他制御装置の構成例
を示すブロック図である。

【図２２】二重化された排他制御装置を有する情報処理
システムの構成例を示すブロック図である。

【符号の説明】

１，５１，６６…情報処理装置２，５２…プロセッサ３，５３…主記憶４，５４…時計５，５５…主処理部６，５６…監視タイマ７，５７…カウンタリセット手段８，５８…記録媒体９，５９…待ちキュー１０，６０…要求実行部１１，６１…監視カウンタ１２，６２…監視用管理情報１３，６３…主処理部１４，６４…対象装置監視処理部１５…監視対象装置６５…送受信部

Claims

【特許請求の範囲】

【請求項１】監視対象装置から一定時間以内毎に出力
されるべき通知の有無に基づき監視対象装置の異常を検
出する方法において、監視対象装置から通知がある毎にリセットされ且つカウ
ンタ更新処理毎に一定値ずつ更新されるカウンタの値が
予め定められた限界値を越えたとき、カウンタ更新処理
の周期が予め定められた周期より短くなっていなかった
か否かを調べ、短くなっていなかった場合に限って、監
視対象装置の異常と判定することを特徴とする監視対象
装置の異常検出方法。
【請求項２】リセット後に初めてカウンタを更新した
時刻を少なくとも含むカウンタ更新時刻の履歴を採取し
ておき、採取したカウンタ更新時刻の履歴に基づき、カ
ウンタ更新処理の周期が予め定められた周期より短くな
っていなかったか否かを調べることを特徴とする請求項
１記載の監視対象装置の異常検出方法。
【請求項３】自装置が担う主たる処理以外に、監視対
象装置から一定時間以内毎に出力されるべき通知の有無
に基づき監視対象装置の異常を検出する処理をも行う装
置において、（ａ）監視対象装置から通知がある毎に監視用のカウン
タをリセットするステップ。（ｂ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｃ）待ちキューから要求を取り出すステップ。（ｄ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｅ）取り出された要求が監視処理の起動要求であれ
ば、前記カウンタを一定値だけ更新してその更新時刻を
記録すると共に、更新後のカウンタの値が予め定められ
た限界値を越えたか否かを検査し、越えていたときは、
カウンタがリセット後に初めて更新された時刻に（限界
値×カウンタ更新周期の正規の値）を足した時刻と今回
の更新時刻との比較結果に応じて、監視対象装置の異常
の有無を判定するステップ。を含むことを特徴とする監視対象装置の異常検出方法。
【請求項４】自装置が担う主たる処理以外に、相手装
置から一定時間以内毎に出力されるべき通知の有無に基
づき相手装置の異常を検出する処理、および相手装置で
自装置の異常の検出が行えるように自装置から相手装置
に一定時間毎に通知を出す処理をも行う装置において、（ａ）相手装置から通知がある毎に監視用のカウンタを
リセットするステップ。（ｂ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｃ）待ちキューから要求を取り出すステップ。（ｄ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｅ）取り出された要求が監視処理の起動要求であれ
ば、相手装置に通知を送出すると共に、前記カウンタを
一定値だけ更新してその更新時刻を記録し、且つ、更新
後のカウンタの値が予め定められた限界値を越えたか否
かを検査し、越えていたときは、カウンタがリセット後
に初めて更新された時刻に（限界値×カウンタ更新周期
の正規の値）を足した時刻と今回の更新時刻との比較結
果に応じて、監視対象装置の異常の有無を判定するステ
ップ。を含むことを特徴とする監視対象装置の異常検出方法。
【請求項５】カウンタ更新処理に先立って、直前のカ
ウンタ更新時刻と現在の時刻とから前回から今回までの
カウンタ更新処理周期を計算してこの計算した周期が予
め定められた周期より短くなっているか否かを調べ、短
くなっている場合には、今回の監視処理を終了するステ
ップを更に含むことを特徴とする請求項３または４記載
の監視対象装置の異常検出方法。
【請求項６】カウンタがリセット後に初めて更新され
た時刻の履歴のみを記録するようにした請求項３または
４記載の監視対象装置の異常検出方法。
【請求項７】自装置が担う主たる処理以外に、監視対
象装置から一定時間以内毎に出力されるべき通知の有無
に基づき監視対象装置の異常を検出する処理をも行う装
置において、監視用のカウンタと、監視対象装置から通知がある毎に前記カウンタをリセッ
トするカウンタリセット手段と、カウンタ更新処理を含む監視処理の起動要求及び主たる
処理の要求を格納するための待ちキューと、所定時間毎に監視処理の起動要求を前記待ちキューに格
納する監視タイマと、主たる処理の要求が発生する毎にその要求を前記待ちキ
ューに格納する主処理要求部と、前記待ちキューから順に要求を取り出して実行する要求
実行部内に設けられた、主たる処理を実行する主処理部
および監視処理を実行する対象装置監視処理部とを備
え、前記対象装置監視処理部は、前記カウンタを一定値だけ更新するカウンタ加算手段
と、カウンタが更新された時刻の履歴をとる時刻格納手段
と、更新後のカウンタの値が、予め定められた限界値を越え
たか否かを検査する監視カウンタ検査手段と、カウンタの値が限界値を越えていたとき、カウンタがリ
セット後に初めて更新された時刻に（限界値×カウンタ
更新周期の正規の値）を足した時刻と今回の更新時刻と
の比較結果に応じて、監視対象装置の異常の有無を判定
するカウンタ補正手段とを備えることを特徴とする監視
対象装置の異常検出装置。
【請求項８】自装置が担う主たる処理以外に、相手装
置から一定時間以内毎に出力されるべき通知の有無に基
づき相手装置の異常を検出する処理、および相手装置で
自装置の異常の検出が行えるように自装置から相手装置
に一定時間毎に通知を出す処理をも行う装置において、監視用のカウンタと、相手装置から通知がある毎に前記カウンタをリセットす
るカウンタリセット手段と、カウンタ更新処理を含む監視処理の起動要求及び主たる
処理の要求を格納するための待ちキューと、所定時間毎に監視処理の起動要求を前記待ちキューに格
納する監視タイマと、主たる処理の要求が発生する毎にその要求を前記待ちキ
ューに格納する主処理要求部と、前記待ちキューから順に要求を取り出して実行する要求
実行部内に設けられた、主たる処理を実行する主処理部
および監視処理を実行する対象装置監視処理部とを備
え、前記対象装置監視処理部は、相手装置に自装置が正常である旨の通知を送出するヘル
スメッセージ送出手段と、前記カウンタを一定値だけ更新するカウンタ加算手段
と、カウンタが更新された時刻の履歴をとる時刻格納手段
と、更新後のカウンタの値が、予め定められた限界値を越え
たか否かを検査する監視カウンタ検査手段と、カウンタの値が限界値を越えていたとき、カウンタがリ
セット後に初めて更新された時刻に（限界値×カウンタ
更新周期の正規の値）を足した時刻と今回の更新時刻と
の比較結果に応じて、相手装置の異常の有無を判定する
カウンタ補正手段とを備えることを特徴とする監視対象
装置の異常検出装置。
【請求項９】自装置が二重化された排他制御装置の一
方の排他制御装置、相手装置が他方の排他制御装置であ
り、主たる処理が排他制御処理であることを特徴とする
請求項８記載の監視対象装置の異常検出装置。
【請求項１０】前記対象装置監視処理部は、更に、カ
ウンタ更新処理に先立って、直前のカウンタ更新時刻と
現在の時刻とから前回から今回までのカウンタ更新処理
周期を計算してこの計算した周期が予め定められた周期
より短くなっているか否かを調べ、短くなっている場合
には、今回の対象装置監視処理を終了せしめる時刻確認
手段を備えることを特徴とする請求項７、８または９記
載の監視対象装置の異常検出装置。
【請求項１１】前記対象装置監視処理部は、更に、前
記カウンタがリセット後に初めて更新されたか否かを調
べるカウンタ値確認手段を備え、前記時刻格納手段は、
リセット後に初めて更新された時刻のみの履歴をとる構
成を有することを特徴とする請求項７、８または９記載
の監視対象装置の異常検出装置。
【請求項１２】自装置が担う主たる処理以外に、監視
対象装置から一定時間以内毎に出力されるべき通知の有
無に基づき監視対象装置の異常を検出する処理をも行う
装置を構成するプロセッサに、以下の処理を実行させる
プログラムを記録した機械読み取り可能な記録媒体。（ａ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｂ）待ちキューから要求を取り出すステップ。（ｃ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｄ）取り出された要求が監視処理の起動要求であれ
ば、監視対象装置から通知がある毎にリセットされるカ
ウンタを一定値だけ更新してその更新時刻を記録すると
共に、更新後のカウンタの値が予め定められた限界値を
越えたか否かを検査し、越えていたときは、カウンタが
リセット後に初めて更新された時刻に（限界値×カウン
タ更新周期の正規の値）を足した時刻と今回の更新時刻
との比較結果に応じて、監視対象装置の異常の有無を判
定するステップ。
【請求項１３】自装置が担う主たる処理以外に、相手
装置から一定時間以内毎に出力されるべき通知の有無に
基づき相手装置の異常を検出する処理、および相手装置
で自装置の異常の検出が行えるように自装置から相手装
置に一定時間毎に通知を出す処理をも行う装置を構成す
るプロセッサに、以下の処理を実行させるプログラムを
記録した機械読み取り可能な記録媒体。（ａ）カウンタ更新処理を含む監視処理の起動要求は所
定周期で、主たる処理の要求はその発生時に、それぞれ
待ちキューに格納するステップ。（ｂ）待ちキューから要求を取り出すステップ。（ｃ）取り出された要求が主たる処理の要求であれば、
主たる処理を実行するステップ。（ｄ）取り出された要求が監視処理の起動要求であれ
ば、相手装置に通知を送出すると共に、相手装置から通
知がある毎にリセットされるカウンタを一定値だけ更新
してその更新時刻を記録し、且つ、更新後のカウンタの
値が予め定められた限界値を越えたか否かを検査し、越
えていたときは、カウンタがリセット後に初めて更新さ
れた時刻に（限界値×カウンタ更新周期の正規の値）を
足した時刻と今回の更新時刻との比較結果に応じて、相
手装置の異常の有無を判定するステップ。
【請求項１４】カウンタ更新処理に先立って、直前の
カウンタ更新時刻と現在の時刻とから前回から今回まで
のカウンタ更新処理周期を計算してこの計算した周期が
予め定められた周期より短くなっているか否かを調べ、
短くなっている場合には、今回の監視処理を終了するス
テップを前記プロセッサに更に実行させるプログラムを
記録した請求項１２または１３記載のプログラムを記録
した機械読み取り可能な記録媒体。