JP3090054B2 - ストール監視方式 - Google Patents
ストール監視方式Info
- Publication number
- JP3090054B2 JP3090054B2 JP08202865A JP20286596A JP3090054B2 JP 3090054 B2 JP3090054 B2 JP 3090054B2 JP 08202865 A JP08202865 A JP 08202865A JP 20286596 A JP20286596 A JP 20286596A JP 3090054 B2 JP3090054 B2 JP 3090054B2
- Authority
- JP
- Japan
- Prior art keywords
- program
- group
- stall
- processes
- request
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
を有するコンピュータ等の情報処理装置におけるストー
ル監視方式に関し、特に複数プロセスから構成されるプ
ログラムのストール監視方式に関する。
て、例えば特開平4−349542号公報には、各タス
ク(プロセス)毎に、インターバル毎の割り込み処理に
おいてカウンタを加算し、該当プロセスが他のプロセス
からの要求受け付け可能状態となった場合にカウンタを
リセットし、インターバル毎の割り込み処理の結果、プ
ロセス毎に設けられた障害検出用のカウンタの値を越え
た場合に、該当プロセスが障害(ストール)状態となっ
たことを検出するリアルタイムオペレーティングシステ
ムの診断方式が提案されている。
は、プログラム(プロセス)をグループに区分し、各グ
ループ毎に設けられたストール監視要求手段が、各グル
ープに属するプログラムの実行開始または実行終了時に
ストール監視要求をストール監視外部タイマに発行し、
この発行を受けたストール監視外部タイマが、そのグル
ープに対して定められた時間を経過しても新たなストー
ル監視要求が発行されない場合に、そのプログラムがス
トール状態となったことを検出するシステムストール検
出方式が提案されている。
開平4−349542号公報のように、各プロセス毎に
カウンタを設け、一定時間にわたって他のプロセスから
の要求受け付け可能状態とならない場合に障害を検出す
る従来の方式では、複数プロセスから構成されるプログ
ラムにおいて、そのプログラムを構成するプロセス間で
互いに処理要求の発行を無制限に繰り返すことにより他
のプログラムからの処理要求を受け付けられないような
ストール状態を検出することができないという問題があ
る。
監視する制御が各プロセス単位で行われているため、プ
ロセス間にまたがってストール状態を監視することがで
きないからである。
のように、プログラム(プロセス)をグループに区分
し、各グループに属するプロセスの実行開始および実行
終了時にストール監視要求を発行し、一定時間にわたっ
てストール監視要求がない場合に障害を検出する従来の
方式では、処理要求を受け付けることができず、ストー
ル監視要求を発行し続けるようなループ状態となったプ
ログラムのストール状態を検出することができないとい
う問題がある。
ログラム自体から発行される要求を監視の手段として利
用しているため、ストール監視対象のプログラムの不正
動作による要求発行の不正に対して監視が有効に行えな
いからである。
されたものであり、複数プロセスから構成されるプログ
ラムにおいて、そのプログラムを構成するプロセス間で
互いに処理要求の発行を無制限に繰り返すことによって
他のプログラムからの処理要求を実行できなくなるよう
なストール状態を有効に検出することができるストール
監視方式を提供することを目的とする。
ため、本発明は、複数プロセスを該当プログラムの「プ
ロセスグループ」という)のストール監視方式におい
て、該当プログラムのプロセスグループの各プロセス
が、前記各プロセスに対して一定時間毎に割り込みが行
われた際に、前記プロセスグループの各プロセスの障害
検出用カウンタを加算する割り込み受信手段と、該当プ
ログラムのプロセスグループ以外の他のプロセスからの
処理要求を受けて処理を行ったときに、前記プロセスグ
ループの該当プロセスの前記障害検出用カウンタをリセ
ットするカウンタリセット手段と、をそれぞれ備え、該
当プログラムのプロセスグループに属さない他のプロセ
スが、一定時間毎に、該当プログラムのプロセスグルー
プの全てのプロセスに対して、該当プログラムが、該当
プログラムのプロセスグループ以外の他のプロセスから
の処理要求が受け付け可能か否かの問い合わせ要求を発
行するストール監視手段を備え、該当プログラムのプロ
セスグループの各プロセスが、前記各プロセスの前記割
り込み受信手段による割り込み受信処理により前記障害
検出用カウンタを加算した結果、そのカウント値が所定
の値を越えた場合に、該当プログラムがストール状態に
なったものと判断するストール検出手段を含むことを特
徴とするストール監視方式を提供する。
る。
セスから構成されるプログラムにおいて、各プロセス毎
に一定時間毎に割り込みが発生し、その割り込み処理に
おいて各プロセスの障害検出用カウンタが加算されるよ
うにする。なお、この各プロセスの障害検出用カウンタ
は、該当プログラムのプロセスグループ以外のプロセス
からの処理要求を受け付けて処理を実行した場合にリセ
ットされるものとする。
の各プロセスに対して一定時間毎にプロセス状態の問い
合わせ要求を発行するストール監視手段を持ち、一定時
間毎に該当プログラムのプロセスグループの全プロセス
に対してプロセスグループ以外のプロセスから処理要求
が発生するようにする。
ロセスは、自プロセスでの処理不正等に起因する無制限
なループ処理等によりプロセスグループの他のプロセス
からの処理要求を受け付けることができない場合や、プ
ロセスグループの他のプロセスとの間で互いに処理要求
の発行を無制限に繰り返すことによりプロセスグループ
以外のプロセスからの処理要求を受け付けることができ
ない場合には、該当プログラムのプロセスグループの各
プロセス毎の割り込み処理において加算される障害検出
用カウンタがリセットされなくなり、各プロセス毎に予
め定められた値以上の値に障害検出用カウンタの値がな
った時点でストールが発生したと判断することができ
る。
に必ず問い合わせ要求が発生することにより、該当プロ
グラムのプロセスグループの各プロセスにおいて、正常
な動作としてプロセスグループ以外のプロセスからの処
理要求が発生しないことによって、障害検出用カウンタ
がリセットされないという事象を回避することができ
る。
よれば、監視の対象となるプログラムを構成する各プロ
セスにおいて、そのプロセス自身の処理不正によって他
のプロセスからの処理要求の受け付けが不可能になった
り、プロセスグループのプロセス間で互いに処理要求の
発行を無制限に繰り返すことによってCPUを占有し続
けたりしてプロセスグループ以外の他のプロセスからの
処理要求の受け付けが不可能となるストール状態を検出
することが可能となり、プログラムが実行されるコンピ
ュータ等の情報処理装置の信頼性を向上させることがで
きる。
て図面を参照して説明する。
ブロック図である。
は、コンピュータ1と、コンピュータ1上で動作するス
トール監視の対象となるプログラム2と、コンピュータ
1上で動作するプログラム2以外の他プロセス群8と、
を含む。
−1、…、3−nから構成され、各プロセス3−m(m
は1以上n以下の整数、以下同じ)は、障害検出のため
に用いられる障害検出用カウンタ4−mと、割り込みを
受けた際に障害検出用カウンタ4−mを更新する割り込
み受信手段5−mと、プログラム2を構成するプロセス
3−1、…、3−n以外の他プロセス群8からの処理要
求を受け付けた場合に障害検出用カウンタ4−mをリセ
ットするカウンタリセット手段6−mと、を含む。
構成するプロセス3−1、…、3−nに対して一定時間
毎に問い合わせ要求を発行するストール監視手段7を含
む。
の実施の形態の動作について説明する。図2ないし図5
は、図1に示した各手段の処理の流れを示すフローチャ
ートである。
2の各プロセス3−mは、プログラム2の起動時に、障
害検出用カウンタ4−mをリセットし(ステップ20
1)、一定時間毎に割り込みが行われるとともに、割り
込みが発生した際に割り込み受信手段5−mが実行され
るように設定しておく(ステップ202)。
−mは、処理要求を受け付けた際に、処理に先立ってカ
ウンタリセット手段6−mを呼び出す。カウンタリセッ
ト手段6−mは、受け付けた処理要求の発行元をチェッ
クし(ステップ301)、処理要求がプログラム2のプ
ロセス3−1、…、3−nからのものであった場合に
は、障害検出用カウンタ3−mのリセットを行うことな
くカウンタリセット手段6−mの処理を終了し、処理要
求が他プロセス群8からのものであった場合には、障害
検出用カウンタ4−mをリセットする(ステップ30
2)。
−mは、割り込みを受けた際に、割り込み受信手段5−
mを実行する。割り込み受信手段5−mは、障害検出用
カウンタ4−mに“1”を加算した後(ステップ40
1)、障害検出用カウンタ4−mの値が予め定められた
値(I)以上になっているか否かをチェックし(ステッ
プ402)、障害検出用カウンタ4−mの値の方が小さ
い場合(I>(障害検出用カウンタ4−m))には、割
り込み受信手段5−mの処理を終了し、障害検出用カウ
ンタ4−mの値が予め定められた値(I)以上となった
場合(I≦(障害検出用カウンタ4−m))には、スト
ール障害が発生したと判断して障害復旧処理を実行する
(ステップ403)。
群8のストール監視手段7は、タイマを起動しておき
(ステップ501)、タイムアウト発生時にプロセス3
−1、…、3−nに問い合わせ要求を発行し(ステップ
503)、再びタイマを起動する(ステップ501)。
−mが処理要求を受け付けた際には、他プロセス群8か
らの処理要求となるため、カウンタリセット手段6−m
において障害検出用カウンタ4−mのリセットが行われ
る(ステップ302)。ただし、この問い合わせ要求
は、カウンタリセット手段6−mでの障害検出用カウン
タ4−mのリセットのみに用いられるものであるため、
プロセス3−mではそれ以上の処理は行わない。
時間毎の問い合わせ要求(処理要求)により、正常な動
作として他プロセス群8からの処理要求が発生しない場
合のストール障害の不正検出を防止することができる。
体的に説明するために、本発明の実施例について図面を
参照して詳細に説明する。
ロック図である。
コンピュータ1と、コンピュータ1上で動作するストー
ル監視の対象となるプログラム2と、コンピュータ1上
で動作するプログラム2以外の他プロセス群8と、を含
む。
ス3−1、3−2から構成され、各プロセス3−m(m
=1、2)は、障害検出のために用いられる障害検出用
カウンタ4−mと、割り込みを受けた際に障害検出用カ
ウンタ4−mを更新する割り込み受信手段5−mと、プ
ログラム2を構成するプロセス3−1、3−2以外の他
プロセス群8からの処理要求を受け付けた場合に障害検
出用カウンタ4−mをリセットするカウンタリセット手
段6−mと、を含む。
構成するプロセス3−1、3−2に対して一定時間毎に
問い合わせ要求を発行するストール監視手段7と、他プ
ログラム9と、を含む。
ンターバルタイマを10秒、ストール監視手段7からの
問い合わせ要求の発行のインターバルを30秒、プロセ
ス3−1、3−2のストール障害の判断のためのタイマ
を60秒(10秒インターバル6回分)とする。
の一実施例の動作について説明する。
2の各プロセス3−mは、プログラム2の起動時に、障
害検出用カウンタ4−mをリセット、すなわち“0”を
設定し(ステップ201)、10秒毎に割り込みが行わ
れるとともに、割り込みが発生した際に割り込み受信手
段5−mが実行されるように設定しておく(ステップ2
02)。
−mは、処理要求を受け付けた際に、処理に先だってカ
ウンタリセット手段6−mを呼び出す。カウンタリセッ
ト手段6−mは、受け付けた処理要求の発行元をチェッ
クし(ステップ301)、処理要求の発行元がプロセス
3−1または3−2の場合には、何ら処理を行うことな
くカウンタリセット手段6−mの処理を終了し、処理要
求の発行元がプロセス3−1や3−2以外の、例えばス
トール監視手段7や他プログラム9の場合には、障害検
出用カウンタ4−mをリセット、すなわち“0”を設定
する(ステップ302)。
−mは、10秒毎に発生する割り込みで、割り込み受信
手段5−mを実行する。割り込み受信手段5−mは、障
害検出用カウンタ4−mに“1”を加算した後(ステッ
プ401)、障害検出用カウンタ4−mの値が“6”以
上となっているか否かをチェックし(ステップ40
2)、障害検出用カウンタ4−mの値が“6”未満の場
合には、ストール障害が発生していないものと判断して
割り込み受信手段5−mの処理を終了し、“6”以上の
場合には、ストール障害が発生したと判断して障害復旧
処理を実行する(ステップ403)。
処理要求を無制限に繰り返して発行し、処理の優先度の
関係でプロセス3−1、3−2以外のプロセスへのCP
U割り当てが行われず、他プロセス群8の動作が不可能
となるストール障害が発生した場合には、カウンタリセ
ット手段6−1、6−2による障害検出用カウンタ4−
1、4−2のリセットが行われないため、ストール障害
の発生から最大6回の割り込みが発生した時点で、障害
検出用カウンタ4−1、4−2の値が“6”以上とな
り、ストール障害の発生を検出することができる。
群8のストール監視手段7は、30秒のタイマを起動時
に設定しておき(ステップ501)、タイムアウトした
契機にプロセス3−1、3−2に問い合わせ要求を発行
し(ステップ503)、再び30秒のタイマを起動する
(ステップ501)。
他プロセス群8からの処理要求が30秒以上間隔が空く
ことがなくなり、プロセス3−1、3−2が正常に動作
している限りは、最大30秒の間隔で障害検出用カウン
タ4−1、4−2のリセットが行われ、ストール障害の
不正検出を防止することができる。
ル監視手段7からの問い合わせ要求を受け付けた際に
は、カウンタリセット手段6−1、6−2を呼び出す処
理だけを行う。
複数プロセスから構成されるプログラムにおいて、プロ
グラムを構成するプロセス以外の他のプロセスからの処
理要求の受け付け状況を監視し、一定時間にわたってそ
のようなプロセスからの処理要求を実行していない場合
にストール状態になったものと判断しているため、プロ
グラムを構成するプロセス間で互いに処理要求の発行を
無制限に繰り返すことにより、CPUを占有し続けたり
して他のプログラム等の実行が不可能となるようなスト
ール状態の検出が可能となり、コンピュータ等の情報処
理装置のシステム障害の早期自動検出および復旧が可能
となる。
して監視対象であるプログラム自体からのストール監視
用の通知を利用していないため、監視対象のストール障
害の種別に依存しないでストール状態を検出することが
可能となり、監視対象のプログラム自体の不正動作によ
ってストール状態の検出が行えないという事態の発生を
防止することができる。
ある。
−mの処理の流れを示すフローチャートである。
ト手段6−mの処理の流れを示すフローチャートであ
る。
段5−mの処理の流れを示すフローチャートである。
段7の処理の流れを示すフローチャートである。
る。
Claims (2)
- 【請求項1】複数プロセスから構成されるプログラム
(以下、該当プログラムを構成する複数プロセスを該当
プログラムの「プロセスグループ」という)のストール
監視方式において、 該当プログラムのプロセスグループの各プロセスが、前
記各プロセスに対して一定時間毎に割り込みが行われた
際に、前記プロセスグループの各プロセスの障害検出用
カウンタを加算する割り込み受信手段と、該当プログラ
ムのプロセスグループ以外の他のプロセスからの処理要
求を受けて処理を行ったときに、前記プロセスグループ
の該当プロセスの前記障害検出用カウンタをリセットす
るカウンタリセット手段と、をそれぞれ備え、 該当プログラムのプロセスグループに属さない他のプロ
セスが、一定時間毎に、該当プログラムのプロセスグル
ープの全てのプロセスに対して、該当プログラムが、該
当プログラムのプロセスグループ以外の他のプロセスか
らの処理要求が受け付け可能か否かの問い合わせ要求を
発行するストール監視手段を備え、該当プログラムのプロセスグループの各プロセスが、前
記各プロセスの 前記割り込み受信手段による割り込み受
信処理により前記障害検出用カウンタを加算した結果、
そのカウント値が所定の値を越えた場合に、該当プログ
ラムがストール状態になったものと判断するストール検
出手段を含むことを特徴とするストール監視方式。 - 【請求項2】複数プロセスから構成されるプログラム
(以下、該当プログラムを構成する複数プロセスを該当
プログラムの「プロセスグループ」という)のストール
監視方式において、 該当プログラムのプロセスグループ以外の他のプロセス
が、前記プログラムのプロセスグループの全プロセスに
対して、一定時間毎に、問い合わせ要求を発行する手段
を備え、 該当プログラムのプロセスグループの各プロセスは、予
め定められた所定時間毎に割り込みが行われた際に加算
され、前記他のプロセスからの問い合わせ要求を受け付
けた際にリセットされる障害検出用カウンタをそれぞれ
備え、 該当プログラムのプロセスグループの各プロセスは、前
記プロセスの前記障害検出カウンタのカウント値から、
前記プロセスグループ を構成するプロセス以外の前記他
のプロセスからの問い合わせの受け付け状況を監視し、
一定時間にわたって前記他のプロセスからの問い合わせ
要求を実行していない場合に、該当プログラムがストー
ル状態になったものと判断する、ことを特徴とするスト
ール監視方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08202865A JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08202865A JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1031596A JPH1031596A (ja) | 1998-02-03 |
JP3090054B2 true JP3090054B2 (ja) | 2000-09-18 |
Family
ID=16464485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08202865A Expired - Fee Related JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3090054B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6350452B2 (ja) | 2015-08-27 | 2018-07-04 | 京セラドキュメントソリューションズ株式会社 | 電子機器および割り込み処理プログラム |
-
1996
- 1996-07-12 JP JP08202865A patent/JP3090054B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1031596A (ja) | 1998-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7003775B2 (en) | Hardware implementation of an application-level watchdog timer | |
JPH10214208A (ja) | ソフトウェアの異常監視方式 | |
CA1212478A (en) | Data processor with interrupt facility | |
JP3090054B2 (ja) | ストール監視方式 | |
JP3269489B2 (ja) | プロセス監視システムおよびプロセス監視方法 | |
JP2004086520A (ja) | 監視制御装置及び監視制御方法 | |
JP2870250B2 (ja) | マイクロプロセッサの暴走監視装置 | |
JPH10269110A (ja) | 計算機システムのハングアップ回避方法並びにこの方法を用いた計算機システム。 | |
JPH09212389A (ja) | コンピュータシステムの異常状態検出方法および装置 | |
JP2677175B2 (ja) | コンピュータシステムの外部イベント検出方式 | |
JP2004070458A (ja) | 自己診断機能を持つプログラムと、プログラム監視装置及びその方法と、プログラム監視機能を持つプログラム | |
JP2814988B2 (ja) | 障害処理方式 | |
JPH02293939A (ja) | スタックオーバーフロー検出時処理方式 | |
JPS63280345A (ja) | プログラム異常検出方法 | |
JP2000089971A (ja) | 割込み順位制御方法及び割込み順位制御装置 | |
JPH06318159A (ja) | 装置内異常検出方式 | |
JP2746184B2 (ja) | 障害ロギングシステム | |
JP2705401B2 (ja) | マルチプロセッサ制御方法 | |
JPH0293738A (ja) | 割込み処理方式 | |
JPH041831A (ja) | プログラム暴走監視方式 | |
JPH04279940A (ja) | 多重タイムアウト事象制御方式 | |
JPH0588944A (ja) | 情報処理システムの入出力制御監視方式 | |
JPS5827538B2 (ja) | 相互監視方式 | |
JPH0477935A (ja) | 故障検出回路 | |
JPS61194540A (ja) | スト−ル検出方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070721 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080721 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090721 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100721 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110721 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |