JPH1021096A

JPH1021096A - プロセスの異常終了検出方法

Info

Publication number: JPH1021096A
Application number: JP8192992A
Authority: JP
Inventors: Masaomi Okamoto; 政臣岡本
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1996-07-03
Filing date: 1996-07-03
Publication date: 1998-01-23

Abstract

(57)【要約】【解決手段】管理プロセス１と被管理プロセス２と
は、ソケットインタフェース３により接続される。被管
理プロセス２が動作中は管理プロセス１によるソケット
インタフェース３の読み込みがブロックされる。一方、
被管理プロセス２が動作を終了するとソケットインタフ
ェース３はクローズされ、管理プロセス１はソケットイ
ンタフェース３の読み込みが可能になる。この読み込み
ができたとき、被管理プロセス２が動作を終了したと判
断する。【効果】プロセス間通信やコマンド等によって被管理
プロセス２の異常終了を検出する場合に比べて速やかに
簡単に動作の終了を検出できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、様々なプロセスの
動作異常終了を速やかに検出するためのプロセスの異常
終了検出方法に関する。

【０００２】

【従来の技術】例えば、ＵＮＩＸシステムにおいてマル
チタスクを実現する場合に、複数のプロセスの動作状態
をあるプロセスが監視し、一定の処理を実行するといっ
たことが行われる。ここで、これらのプロセスを管理す
るプロセスのことを管理プロセスと呼び、管理プロセス
によって状態を監視されるプロセスを被管理プロセスと
呼ぶことにする。各プロセスは、それぞれ任意の処理を
実行し、処理を終了するとプロセス間通信の手法によっ
て、管理プロセスに対しプロセス動作終了の通知を送
る。管理プロセスはこうして各プロセスの動作終了を検
知する。一方、ある被管理プロセスに何らかの障害が発
生して動作が停止した場合を考える。この場合に、障害
により異常終了したプロセスは同様の手順で終了通知を
行うことはできない。管理プロセスは被管理プロセスの
状態を監視しようとする場合に一定の監視用コマンドを
出力する。これによって、被制御装置が動作していない
ことを知ると、制御装置はコマンドを出力し個別にプロ
セスの状態を調べる。

【０００３】

【発明が解決しようとする課題】ところで、上記のよう
な従来のプロセスの異常検出方法には次のような解決す
べき課題があった。管理プロセスが被管理プロセスの状
態を検出するために、被管理プロセスに対し適当なタイ
ミングで問合せ等を行っていると、実際に被管理プロセ
スに障害が発生してから、その障害の発生を管理プロセ
スが認識するまでの時間が長くなり、処理のタイミング
が遅れるという問題があった。

【０００４】

【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。〈構成１〉管理プロセスと被管理プロセスとの間を、被
管理プロセスの動作状態に応じて読み込みが許可される
ソケットインタフェースを介して接続し、管理プロセス
が所定のタイミングでソケットの読み込みを行って、ソ
ケットの読み込みができないときは被管理プロセスが動
作中と判断し、ソケットの読み込みができたときは被管
理プロセスの動作が終了したと判断することを特徴とす
るプロセスの終了検出方法。

【０００５】〈説明〉管理プロセスは、任意の数の被管
理プロセスの動作を管理し、異常終了があればこれを検
出する。被管理プロセスとは、管理プロセスが動作終了
を検出する任意の対象をいう。ソケットは、被管理プロ
セスが動作中は、管理プロセスによる読み込みができ
ず、被管理プロセスの動作終了時、管理プロセスにより
読み込みが可能となるインタフェースである。所定のタ
イミングとは、管理プロセスによる該当する被管理プロ
セスの動作状態検出動作時をいい、定期でも不定期でも
よい。異常終了の場合には、プロセス終了時に被管理プ
ロセスから所定の終了通知が無い。従って、一般的な通
信手順によって被管理プロセスの異常終了を検出する場
合に比べて、この方法は、異常終了の速やかな検出に適
する。

【０００６】〈構成２〉構成１において、管理プロセス
を、被管理プロセスとソケットインタフェースを介して
直接接続することができないときは、当該管理プロセス
をコピーして、被管理プロセスを取り込むモジュールを
生成して、そのモジュールと管理プロセスとをソケット
インタフェースを介して接続することを特徴とするプロ
セスの異常終了検出方法。

【０００７】〈説明〉管理プロセスと被管理プロセスと
をソケットインタフェースを介して接続するには、被管
理プロセスがソケットインタフェースを接続できる構造
でなければならない。このような構造でない被管理プロ
セスに構成１を適用するために、管理プロセスをコピー
して、被管理プロセスを取り込むモジュールを仲介させ
る。このモジュールは、被管理プロセスをソケットに接
続した場合と同一の動作をする。こうして被管理プロセ
スに間接的に被管理プロセスをソケットインタフェース
を介して接続できる。

【０００８】

【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。〈具体例〉図１は、本発明によるプロセスの異常終了検
出方法具体例を示す説明図である。このシステムは、例
えばＵＮＩＸシステム上で動作する多数のプロセスから
構成される。図に示す管理プロセス１は任意の数の被管
理プロセス２を管理する。即ち、被管理プロセス２の動
作の開始や終了状態を管理する。ここでは、説明の都合
上被管理プロセス２を１個だけ表示した。管理プロセス
１と被管理プロセス２とはソケット（インタフェース）
３により相互に接続されている。

【０００９】このソケットインタフェースとは、プロセ
ス間通信手段の一種であるが、プロセスに対して仮想的
な通信用のソケットを与えて、そのソケット同士を論理
的につなぎ合わせたものである。こうして、プロセス間
のデータのやり取りを行う。実体はメモリ上に配置され
たデータである。なお、プロセス間通信を行うための手
段として、ソケットの他に更に簡単なパイプという手段
もある。本発明では、このパイプもソケットと同等のも
のとして、ソケットの概念に含まれるものとして説明を
行う。

【００１０】本発明においては、このソケットをプロセ
ス間通信の手段として使用するのでなく、その性質を利
用して相手方のプロセスの状態を速やかに検出するため
に使用する。即ち、ここでは次のようなソケットの性質
を利用する。１．ソケットは、相手方のプロセスの動作中には通常読
み込み不可能な状態になっており、もし読み込みを行う
とブロックしてしまう。一方、ソケットは相手方が書き
込みを行ったときと、相手方がクローズしたとき読み込
みが可能な状態になる。相手方が書き込みを行ってその
内容を読み込む場合には、プロセス間通信が実現する。２．相手方がクローズした場合に読み込みを行うと、０
バイトのデータを読み込むことができる。即ち、相手方
が書き込みを行った場合とクローズされた場合とはいず
れも読み込みが可能な状態になる。３．ソケットはプロセスの終了時、正常終了の場合と異
常終了の場合に関わらず自動的にクローズされる。ソケ
ットの代わりにパイプを使用したとしても同様の機能を
利用することになる。

【００１１】図１を用いて、本発明によるプロセスの異
常終了検出方法の説明を行う。図に示すように、被管理
プロセス２がソケット３に対し何も書き込みを行ってい
ない場合には、管理プロセス１はソケット３の読み込み
をすることができない。従って、被管理プロセス２から
の通信が無くても、被管理プロセス２が動作中であると
判断できる。

【００１２】ここで、被管理プロセス２が何らかの原因
で異常終了したとする。この場合には先に説明したよう
にソケット３が自動的にクローズされる。この場合、ソ
ケット３には何もメッセージは書き込まれていない。一
方、管理プロセス１は適当なタイミングでソケット３の
読み込みを行う。ソケット３がクローズされた後は読み
込みが可能となる。このとき、０バイトのデータを読み
込むことができる。管理プロセス１はこのように０バイ
トのデータを読み込んだことを認識すると、被管理プロ
セス２の終了を検出する。このようにすれば、被管理プ
ロセス２の正常終了も異常終了も速やかに検出すること
が可能になる。しかしながら、正常終了の場合には、通
常、終了メッセージ等のメッセージ通信が行われること
から必ずしもこのような監視を必要としない。従って、
本発明は特に、被管理プロセスが何の通知も無く動作を
終了するような異常終了検出に効果がある。

【００１３】図２には、本発明の方法の動作フローチャ
ートを示す。まず、ステップＳ１において、管理プロセ
ス１はソケット３の読み込みを実行する。即ち、被管理
プロセス２の状態を検出したい場合、ソケットの読み込
み処理を実行する。そして、ステップＳ２において、そ
の読み込みが可能かどうかを判断する。読み込みができ
ない場合には、被管理プロセスが動作中であると判断す
る（ステップＳ３）。一方、ステップＳ２において、ソ
ケットの読み込みが可能であればステップＳ４に進み、
読み込んだデータの内容を点検する。読み込んだデータ
が０バイトであればステップＳ５からステップＳ６に移
り、先に説明した通り、被管理プロセスの動作が終了し
ていることを検出する。一方、ステップＳ５において、
読み込んだデータが０バイトでないと判断されると、そ
の内容がプロセス間通信のためのデータであると判断
し、所定のプロセス間通信処理を実行する（ステップＳ
７）。

【００１４】以上のようにして、本発明では被管理プロ
セスの状態を知りたい場合、ソケットの読み込み処理に
よって、直ちに被管理プロセスが動作中か終了している
かを判断することができる。従って、管理プロセスは障
害に対する迅速な対応が可能となる。

【００１５】図３は、比較例として障害検出遅れが発生
したケースの説明図を示す。例えば、従来の被管理プロ
セスの障害を割り込み通知等を待って検出するようにし
た場合には、この図に示すように、検出遅れ時間が無視
できない状態になることもある。ここでは、時刻ｔ１に
障害が発生し、Ｉ／Ｏ割り込みにより管理プロセス１に
その状態が通知されたとする。管理プロセス１はその通
知を判断して時刻ｔ２に障害検出処理を終了する。即
ち、被管理プロセスにおける障害発生からその通知を受
けて障害と判断するまでの検出時間遅れが生じる。ある
プロセスの異常終了は、多数のプロセスによって各種の
業務を実行している場合に多くの処理に影響を及ぼすか
ら、可能な限り速やかな検出が望ましい。図１や図２に
示した本発明の方法では、管理プロセスが希望するタイ
ミングで即座に該当する被管理プロセスの終了を検出で
きるという効果がある。

【００１６】図４には、本発明の変形例として管理プロ
セスの複製による検出方法説明図を示す。例えば、管理
プロセスを提供するソフトウェアメーカーと、被管理プ
ロセスを提供するソフトウェアメーカーとが異なること
も少なくない。こうした場合、被管理プロセスと管理プ
ロセスとの間をソケットで接続する作業が容易でないこ
ともある。即ち、被管理プロセスの加工が容易でないこ
とがある。この図の例には、このような場合の対処方法
を示している。

【００１７】まず、管理プロセス１が直接ソケットによ
り接続することのできない被管理プロセス２を管理する
場合を考える。このとき、初めにステップＳ１におい
て、ＦＯＲＫシステムコールという処理を実行する。こ
の処理は、管理プロセス１の複製プロセスを作成するシ
ステムコールである。これによって、ステップＳ２で管
理プロセスの複製４即ちコピーが生成される。次に、ス
テップＳ３では、管理プロセス１とその複製との間を接
続するソケットの作成処理を行う。ステップＳ４では複
製された管理プロセスの側でも同様にソケット作成処理
を行う。こうして、ステップＳ５に示すようにソケット
インタフェースが確立すると、今度は管理プロセスの複
製４の側でＥＸＥＣシステムコールを実行する（ステッ
プＳ６）。このＥＸＥＣシステムコールは自己のプロセ
スの領域に任意の実行ファイルを読み込むシステムコー
ルである。即ち、ここで管理プロセスの複製４の部分に
被管理プロセス２の実行ファイルをロードしてしまう。
こうして管理プロセスの複製４は被管理プロセス２と一
体化してその動作を実行する。なお、この場合、既に作
成したソケットはそのまま引き継がれている。従って、
被管理プロセス２を実行する部分を含む管理プロセスの
複製４は、動作を終了すると、ソケットをクローズす
る。その結果、既に説明した例と同様にして、管理プロ
セス１は、被管理プロセス２の動作終了あるいは異常終
了を検出することができる。

【００１８】図５には、被管理プロセス以外のプロセス
終了検出動作説明図を示す。上記の例では、管理プロセ
スが予め管理対象とする被管理プロセスの動作を監視
し、その異常終了を検出した。しかしながら、必ずしも
予め設定した被管理プロセスのみならず各種のプロセス
について、その異常終了を監視することが可能になる。
本発明では、これらの各種のプロセスも被管理プロセス
に含めてしまっている。この図の例では、管理プロセス
１がＧＵＩ（グラフィカルユーザインタフェース）や他
のプロセス６を監視してその異常終了を検出する構成に
なっている。ＧＵＩはユーザが操作してユーザの意思を
プロセスに伝えるための端末装置等から構成される。Ｇ
ＵＩ５はソケット３−１を介して管理プロセス１に接続
される。他プロセス６はソケット３−２を介して管理プ
ロセス１に接続される。被管理プロセス２はソケット３
−３を介して管理プロセス１に接続される。

【００１９】このように複数のソケット３−１，３−
２，３−３から入力するイベントを自由に選択して受け
付けるためにＳＥＬＥＣＴシステムコール７が設けられ
る。このＳＥＬＥＣＴシステムコール７はソケットやパ
イプ等の通信路の状態を検査するシステムコールであ
る。従って、管理プロセス１がＳＥＬＥＣＴシステムコ
ール７に対しある特定のソケット３−１の状態を検査す
るよう指示すればその状態が応答として返る。この状態
検査は、先に説明したようにソケットの読み取りにより
実行される。こうして、任意の数のプロセスやその他の
アプリケーションをソケットを介して管理プロセスに接
続し、それぞれの異常終了を即座に検出するシステムを
構築することができる。

【００２０】以上により、ＵＮＩＸシステム等におい
て、被管理アプリケーションに直接又は間接的にソケッ
トを接続して速やかな異常終了検出処理が可能となる。

【図面の簡単な説明】

【図１】本発明によるプロセスの異常終了検出方法説明
図である。

【図２】本発明の方法の動作フローチャートである。

【図３】障害検出遅れの説明図である。

【図４】管理プロセスの複製による検出動作説明図であ
る。

【図５】被管理プロセス以外のプロセス終了検出動作説
明図である。

【符号の説明】

１管理プロセス２被管理プロセス３ソケット

Claims

【特許請求の範囲】

【請求項１】管理プロセスと被管理プロセスとの間
を、被管理プロセスの動作状態に応じて読み込みが許可
されるソケットインタフェースを介して接続し、管理プロセスが所定のタイミングでソケットの読み込み
を行って、ソケットの読み込みができないときは被管理プロセスが
動作中と判断し、ソケットの読み込みができたときは被管理プロセスの動
作が終了したと判断することを特徴とするプロセスの終
了検出方法。
【請求項２】請求項１において、管理プロセスを、被管理プロセスとソケットインタフェ
ースを介して直接接続することができないときは、当該
管理プロセスをコピーして、被管理プロセスを取り込む
モジュールを生成して、そのモジュールと管理プロセス
とをソケットインタフェースを介して接続することを特
徴とするプロセスの異常終了検出方法。