JPH1031596A - ストール監視方式 - Google Patents
ストール監視方式Info
- Publication number
- JPH1031596A JPH1031596A JP8202865A JP20286596A JPH1031596A JP H1031596 A JPH1031596 A JP H1031596A JP 8202865 A JP8202865 A JP 8202865A JP 20286596 A JP20286596 A JP 20286596A JP H1031596 A JPH1031596 A JP H1031596A
- Authority
- JP
- Japan
- Prior art keywords
- program
- stall
- processes
- request
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
て、そのプログラムを構成するプロセス間で処理要求の
発行を互いに無制限に繰り返することによって他のプロ
グラムからの処理要求を実行できなくなるようなストー
ル状態を有効に検出する。 【解決手段】プログラム2の各プロセス3-mに対して一定
時間毎に割り込みが行われた際に、そのプロセスグルー
プの各プロセスの障害検出用カウンタ4-mを加算する割
り込み受信手段5-mと、プログラム2以外の他プロセス群
8からの処理要求を受けて処理を行ったときに、そのプ
ロセスグループの該当プロセス3-mの障害検出用カウン
タ4-mをリセットするカウンタリセット手段6-mと、一定
時間毎にプログラム2の全プロセスに対して問い合わせ
要求を発行するストール監視手段7と、を含み、障害検
出用カウンタ4-mの値が所定の値を越えた場合にプログ
ラム2がストール状態になったものと判断する。
Description
を有するコンピュータ等の情報処理装置におけるストー
ル監視方式に関し、特に複数プロセスから構成されるプ
ログラムのストール監視方式に関する。
て、例えば特開平4−349542号公報には、各タス
ク(プロセス)毎に、インターバル毎の割り込み処理に
おいてカウンタを加算し、該当プロセスが他のプロセス
からの要求受け付け可能状態となった場合にカウンタを
リセットし、インターバル毎の割り込み処理の結果、プ
ロセス毎に設けられた障害検出用のカウンタの値を越え
た場合に、該当プロセスが障害(ストール)状態となっ
たことを検出するリアルタイムオペレーティングシステ
ムの診断方式が提案されている。
は、プログラム(プロセス)をグループに区分し、各グ
ループ毎に設けられたストール監視要求手段が、各グル
ープに属するプログラムの実行開始または実行終了時に
ストール監視要求をストール監視外部タイマに発行し、
この発行を受けたストール監視外部タイマが、そのグル
ープに対して定められた時間を経過しても新たなストー
ル監視要求が発行されない場合に、そのプログラムがス
トール状態となったことを検出するシステムストール検
出方式が提案されている。
開平4−349542号公報のように、各プロセス毎に
カウンタを設け、一定時間にわたって他のプロセスから
の要求受け付け可能状態とならない場合に障害を検出す
る従来の方式では、複数プロセスから構成されるプログ
ラムにおいて、そのプログラムを構成するプロセス間で
互いに処理要求の発行を無制限に繰り返すことにより他
のプログラムからの処理要求を受け付けられないような
ストール状態を検出することができないという問題があ
る。
監視する制御が各プロセス単位で行われているため、プ
ロセス間にまたがってストール状態を監視することがで
きないからである。
のように、プログラム(プロセス)をグループに区分
し、各グループに属するプロセスの実行開始および実行
終了時にストール監視要求を発行し、一定時間にわたっ
てストール監視要求がない場合に障害を検出する従来の
方式では、処理要求を受け付けることができず、ストー
ル監視要求を発行し続けるようなループ状態となったプ
ログラムのストール状態を検出することができないとい
う問題がある。
ログラム自体から発行される要求を監視の手段として利
用しているため、ストール監視対象のプログラムの不正
動作による要求発行の不正に対して監視が有効に行えな
いからである。
されたものであり、複数プロセスから構成されるプログ
ラムにおいて、そのプログラムを構成するプロセス間で
互いに処理要求の発行を無制限に繰り返すことによって
他のプログラムからの処理要求を実行できなくなるよう
なストール状態を有効に検出することができるストール
監視方式を提供することを目的とする。
ため、本発明は、複数プロセスから構成されるプログラ
ム(以下、該当プログラムを構成する複数プロセスを該
当プログラムの「プロセスグループ」という)のストー
ル監視方式において、該当プログラムのプロセスグルー
プの各プロセスに対して一定時間毎に割り込みが行われ
た際に、前記プロセスグループの各プロセスの障害検出
用カウンタを加算する割り込み受信手段と、該当プログ
ラムのプロセスグループ以外のプロセスからの処理要求
を受けて処理を行ったときに、前記プロセスグループの
該当プロセスの障害検出用カウンタをリセットするカウ
ンタリセット手段と、該当プログラムのプロセスグルー
プに属さず、一定時間毎に該当プログラムのプロセスグ
ループの全プロセスに対して該当プログラムがそのプロ
グラムのプロセスグループ以外のプロセスからの要求が
受け付け可能か否かの問い合わせ要求を発行するストー
ル監視手段と、前記割り込み受信手段による割り込み受
信処理の結果、前記障害検出用カウンタの値が所定の値
を越えた場合に、該当プログラムがストール状態になっ
たものと判断するストール検出手段と、を含むことを特
徴とするストール監視方式を提供する。
る。
セスから構成されるプログラムにおいて、各プロセス毎
に一定時間毎に割り込みが発生し、その割り込み処理に
おいて各プロセスの障害検出用カウンタが加算されるよ
うにする。なお、この各プロセスの障害検出用カウンタ
は、該当プログラムのプロセスグループ以外のプロセス
からの処理要求を受け付けて処理を実行した場合にリセ
ットされるものとする。
の各プロセスに対して一定時間毎にプロセス状態の問い
合わせ要求を発行するストール監視手段を持ち、一定時
間毎に該当プログラムのプロセスグループの全プロセス
に対してプロセスグループ以外のプロセスから処理要求
が発生するようにする。
ロセスは、自プロセスでの処理不正等に起因する無制限
なループ処理等によりプロセスグループの他のプロセス
からの処理要求を受け付けることができない場合や、プ
ロセスグループの他のプロセスとの間で互いに処理要求
の発行を無制限に繰り返すことによりプロセスグループ
以外のプロセスからの処理要求を受け付けることができ
ない場合には、該当プログラムのプロセスグループの各
プロセス毎の割り込み処理において加算される障害検出
用カウンタがリセットされなくなり、各プロセス毎に予
め定められた値以上の値に障害検出用カウンタの値がな
った時点でストールが発生したと判断することができ
る。
に必ず問い合わせ要求が発生することにより、該当プロ
グラムのプロセスグループの各プロセスにおいて、正常
な動作としてプロセスグループ以外のプロセスからの処
理要求が発生しないことによって、障害検出用カウンタ
がリセットされないという事象を回避することができ
る。
よれば、監視の対象となるプログラムを構成する各プロ
セスにおいて、そのプロセス自身の処理不正によって他
のプロセスからの処理要求の受け付けが不可能になった
り、プロセスグループのプロセス間で互いに処理要求の
発行を無制限に繰り返すことによってCPUを占有し続
けたりしてプロセスグループ以外の他のプロセスからの
処理要求の受け付けが不可能となるストール状態を検出
することが可能となり、プログラムが実行されるコンピ
ュータ等の情報処理装置の信頼性を向上させることがで
きる。
て図面を参照して説明する。
ブロック図である。
は、コンピュータ1と、コンピュータ1上で動作するス
トール監視の対象となるプログラム2と、コンピュータ
1上で動作するプログラム2以外の他プロセス群8と、
を含む。
−1、…、3−nから構成され、各プロセス3−m(m
は1以上n以下の整数、以下同じ)は、障害検出のため
に用いられる障害検出用カウンタ4−mと、割り込みを
受けた際に障害検出用カウンタ4−mを更新する割り込
み受信手段5−mと、プログラム2を構成するプロセス
3−1、…、3−n以外の他プロセス群8からの処理要
求を受け付けた場合に障害検出用カウンタ4−mをリセ
ットするカウンタリセット手段6−mと、を含む。
構成するプロセス3−1、…、3−nに対して一定時間
毎に問い合わせ要求を発行するストール監視手段7を含
む。
の実施の形態の動作について説明する。図2ないし図5
は、図1に示した各手段の処理の流れを示すフローチャ
ートである。
2の各プロセス3−mは、プログラム2の起動時に、障
害検出用カウンタ4−mをリセットし(ステップ20
1)、一定時間毎に割り込みが行われるとともに、割り
込みが発生した際に割り込み受信手段5−mが実行され
るように設定しておく(ステップ202)。
−mは、処理要求を受け付けた際に、処理に先立ってカ
ウンタリセット手段6−mを呼び出す。カウンタリセッ
ト手段6−mは、受け付けた処理要求の発行元をチェッ
クし(ステップ301)、処理要求がプログラム2のプ
ロセス3−1、…、3−nからのものであった場合に
は、障害検出用カウンタ3−mのリセットを行うことな
くカウンタリセット手段6−mの処理を終了し、処理要
求が他プロセス群8からのものであった場合には、障害
検出用カウンタ4−mをリセットする(ステップ30
2)。
−mは、割り込みを受けた際に、割り込み受信手段5−
mを実行する。割り込み受信手段5−mは、障害検出用
カウンタ4−mに“1”を加算した後(ステップ40
1)、障害検出用カウンタ4−mの値が予め定められた
値(I)以上になっているか否かをチェックし(ステッ
プ402)、障害検出用カウンタ4−mの値の方が小さ
い場合(I>(障害検出用カウンタ4−m))には、割
り込み受信手段5−mの処理を終了し、障害検出用カウ
ンタ4−mの値が予め定められた値(I)以上となった
場合(I≦(障害検出用カウンタ4−m))には、スト
ール障害が発生したと判断して障害復旧処理を実行する
(ステップ403)。
群8のストール監視手段7は、タイマを起動しておき
(ステップ501)、タイムアウト発生時にプロセス3
−1、…、3−nに問い合わせ要求を発行し(ステップ
503)、再びタイマを起動する(ステップ501)。
−mが処理要求を受け付けた際には、他プロセス群8か
らの処理要求となるため、カウンタリセット手段6−m
において障害検出用カウンタ4−mのリセットが行われ
る(ステップ302)。ただし、この問い合わせ要求
は、カウンタリセット手段6−mでの障害検出用カウン
タ4−mのリセットのみに用いられるものであるため、
プロセス3−mではそれ以上の処理は行わない。
時間毎の問い合わせ要求(処理要求)により、正常な動
作として他プロセス群8からの処理要求が発生しない場
合のストール障害の不正検出を防止することができる。
体的に説明するために、本発明の実施例について図面を
参照して詳細に説明する。
ロック図である。
コンピュータ1と、コンピュータ1上で動作するストー
ル監視の対象となるプログラム2と、コンピュータ1上
で動作するプログラム2以外の他プロセス群8と、を含
む。
ス3−1、3−2から構成され、各プロセス3−m(m
=1、2)は、障害検出のために用いられる障害検出用
カウンタ4−mと、割り込みを受けた際に障害検出用カ
ウンタ4−mを更新する割り込み受信手段5−mと、プ
ログラム2を構成するプロセス3−1、3−2以外の他
プロセス群8からの処理要求を受け付けた場合に障害検
出用カウンタ4−mをリセットするカウンタリセット手
段6−mと、を含む。
構成するプロセス3−1、3−2に対して一定時間毎に
問い合わせ要求を発行するストール監視手段7と、他プ
ログラム9と、を含む。
ンターバルタイマを10秒、ストール監視手段7からの
問い合わせ要求の発行のインターバルを30秒、プロセ
ス3−1、3−2のストール障害の判断のためのタイマ
を60秒(10秒インターバル6回分)とする。
の一実施例の動作について説明する。
2の各プロセス3−mは、プログラム2の起動時に、障
害検出用カウンタ4−mをリセット、すなわち“0”を
設定し(ステップ201)、10秒毎に割り込みが行わ
れるとともに、割り込みが発生した際に割り込み受信手
段5−mが実行されるように設定しておく(ステップ2
02)。
−mは、処理要求を受け付けた際に、処理に先だってカ
ウンタリセット手段6−mを呼び出す。カウンタリセッ
ト手段6−mは、受け付けた処理要求の発行元をチェッ
クし(ステップ301)、処理要求の発行元がプロセス
3−1または3−2の場合には、何ら処理を行うことな
くカウンタリセット手段6−mの処理を終了し、処理要
求の発行元がプロセス3−1や3−2以外の、例えばス
トール監視手段7や他プログラム9の場合には、障害検
出用カウンタ4−mをリセット、すなわち“0”を設定
する(ステップ302)。
−mは、10秒毎に発生する割り込みで、割り込み受信
手段5−mを実行する。割り込み受信手段5−mは、障
害検出用カウンタ4−mに“1”を加算した後(ステッ
プ401)、障害検出用カウンタ4−mの値が“6”以
上となっているか否かをチェックし(ステップ40
2)、障害検出用カウンタ4−mの値が“6”未満の場
合には、ストール障害が発生していないものと判断して
割り込み受信手段5−mの処理を終了し、“6”以上の
場合には、ストール障害が発生したと判断して障害復旧
処理を実行する(ステップ403)。
処理要求を無制限に繰り返して発行し、処理の優先度の
関係でプロセス3−1、3−2以外のプロセスへのCP
U割り当てが行われず、他プロセス群8の動作が不可能
となるストール障害が発生した場合には、カウンタリセ
ット手段6−1、6−2による障害検出用カウンタ4−
1、4−2のリセットが行われないため、ストール障害
の発生から最大6回の割り込みが発生した時点で、障害
検出用カウンタ4−1、4−2の値が“6”以上とな
り、ストール障害の発生を検出することができる。
群8のストール監視手段7は、30秒のタイマを起動時
に設定しておき(ステップ501)、タイムアウトした
契機にプロセス3−1、3−2に問い合わせ要求を発行
し(ステップ503)、再び30秒のタイマを起動する
(ステップ501)。
他プロセス群8からの処理要求が30秒以上間隔が空く
ことがなくなり、プロセス3−1、3−2が正常に動作
している限りは、最大30秒の間隔で障害検出用カウン
タ4−1、4−2のリセットが行われ、ストール障害の
不正検出を防止することができる。
ル監視手段7からの問い合わせ要求を受け付けた際に
は、カウンタリセット手段6−1、6−2を呼び出す処
理だけを行う。
複数プロセスから構成されるプログラムにおいて、プロ
グラムを構成するプロセス以外の他のプロセスからの処
理要求の受け付け状況を監視し、一定時間にわたってそ
のようなプロセスからの処理要求を実行していない場合
にストール状態になったものと判断しているため、プロ
グラムを構成するプロセス間で互いに処理要求の発行を
無制限に繰り返すことにより、CPUを占有し続けたり
して他のプログラム等の実行が不可能となるようなスト
ール状態の検出が可能となり、コンピュータ等の情報処
理装置のシステム障害の早期自動検出および復旧が可能
となる。
して監視対象であるプログラム自体からのストール監視
用の通知を利用していないため、監視対象のストール障
害の種別に依存しないでストール状態を検出することが
可能となり、監視対象のプログラム自体の不正動作によ
ってストール状態の検出が行えないという事態の発生を
防止することができる。
ある。
−mの処理の流れを示すフローチャートである。
ト手段6−mの処理の流れを示すフローチャートであ
る。
段5−mの処理の流れを示すフローチャートである。
段7の処理の流れを示すフローチャートである。
る。
Claims (2)
- 【請求項1】複数プロセスから構成されるプログラム
(以下、該当プログラムを構成する複数プロセスを該当
プログラムの「プロセスグループ」という)のストール
監視方式において、 該当プログラムのプロセスグループの各プロセスに対し
て一定時間毎に割り込みが行われた際に、前記プロセス
グループの各プロセスの障害検出用カウンタを加算する
割り込み受信手段と、 該当プログラムのプロセスグループ以外のプロセスから
の処理要求を受けて処理を行ったときに、前記プロセス
グループの該当プロセスの障害検出用カウンタをリセッ
トするカウンタリセット手段と、 該当プログラムのプロセスグループに属さず、一定時間
毎に該当プログラムのプロセスグループの全プロセスに
対して該当プログラムがそのプログラムのプロセスグル
ープ以外のプロセスからの要求が受け付け可能か否かの
問い合わせ要求を発行するストール監視手段と、 前記割り込み受信手段による割り込み受信処理の結果、
前記障害検出用カウンタの値が所定の値を越えた場合
に、該当プログラムがストール状態になったものと判断
するストール検出手段と、 を含むことを特徴とするストール監視方式。 - 【請求項2】複数プロセスから構成されるプログラム
(以下、該当プログラムを構成する複数プロセスを該当
プログラムの「プロセスグループ」という)のストール
監視方式において、 該当プログラムのプロセスグループ以外の他のプロセス
から一定時間毎に該当プログラムのプロセスグループの
全プロセスに対して問い合わせ要求を発行する一方で、
該当プログラムのプロセスグループの各プロセスにおい
て前記他のプロセスからの処理要求の受け付け状況を監
視し、一定時間にわたって前記他のプロセスからの処理
要求を受け付けていない場合に該当プログラムがストー
ル状態になったものと判断することを特徴とするストー
ル監視方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08202865A JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08202865A JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1031596A true JPH1031596A (ja) | 1998-02-03 |
JP3090054B2 JP3090054B2 (ja) | 2000-09-18 |
Family
ID=16464485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08202865A Expired - Fee Related JP3090054B2 (ja) | 1996-07-12 | 1996-07-12 | ストール監視方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3090054B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037226B2 (en) | 2015-08-27 | 2018-07-31 | Kyocera Document Solutions, Inc. | Electronic device with plurality of processes executing processings corresponding to interrupts, interrupt processing method, and recording |
-
1996
- 1996-07-12 JP JP08202865A patent/JP3090054B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10037226B2 (en) | 2015-08-27 | 2018-07-31 | Kyocera Document Solutions, Inc. | Electronic device with plurality of processes executing processings corresponding to interrupts, interrupt processing method, and recording |
Also Published As
Publication number | Publication date |
---|---|
JP3090054B2 (ja) | 2000-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6434591B1 (en) | Thread control system and method in a computer system | |
JPH10214208A (ja) | ソフトウェアの異常監視方式 | |
JP3090054B2 (ja) | ストール監視方式 | |
JP3859564B2 (ja) | イベント通知タスク制御処理方式及び方法並びにプログラム | |
JP2004029992A (ja) | 電子制御装置 | |
JPH10116261A (ja) | 並列計算機システムのチェックポイントリスタート方法 | |
JPH10269110A (ja) | 計算機システムのハングアップ回避方法並びにこの方法を用いた計算機システム。 | |
JP2870250B2 (ja) | マイクロプロセッサの暴走監視装置 | |
JP2677175B2 (ja) | コンピュータシステムの外部イベント検出方式 | |
JP2918297B2 (ja) | 割込規制方式 | |
JPS63280345A (ja) | プログラム異常検出方法 | |
JP2004070458A (ja) | 自己診断機能を持つプログラムと、プログラム監視装置及びその方法と、プログラム監視機能を持つプログラム | |
JPH02293939A (ja) | スタックオーバーフロー検出時処理方式 | |
JP2000089971A (ja) | 割込み順位制御方法及び割込み順位制御装置 | |
JPH0293738A (ja) | 割込み処理方式 | |
JP2746184B2 (ja) | 障害ロギングシステム | |
JP2814988B2 (ja) | 障害処理方式 | |
JPH041831A (ja) | プログラム暴走監視方式 | |
JP2002244885A (ja) | コンピュータシステム監視システム | |
JPH05257748A (ja) | マイクロプロセッサ装置 | |
JPH0477935A (ja) | 故障検出回路 | |
JP2004199423A (ja) | 処理監視装置 | |
JPH0612293A (ja) | マイクロコンピュータの暴走防止方法 | |
JPH04279940A (ja) | 多重タイムアウト事象制御方式 | |
JPH10143393A (ja) | 診断処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070721 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080721 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090721 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100721 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110721 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |