JPH11232143A

JPH11232143A - マルチスレッドの監視方法

Info

Publication number: JPH11232143A
Application number: JP10052793A
Authority: JP
Inventors: Toshihito Nishii; 俊仁西井
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1998-02-18
Filing date: 1998-02-18
Publication date: 1999-08-27

Abstract

(57)【要約】【課題】コンピュータ等でプロセスを処理する場合
に、プロセスを構成する複数のスレッドのうちの一つで
異常が発生したときに、その異常を早期に発見し、か
つ、プロセスを復旧させる。【解決手段】プロセス１中のプライマリスレッド２
が、プロセス１を構成する複数のスレッド３、４、５の
動作を、ポーリングを通じて監視する。異常が発生する
と、そのスレッドは、プライマリスレッド２の問い合わ
せ信号に対し、応答信号を返すことができない。応答信
号の有無に基づき、プライマリスレッド２は、各スレッ
ドの動作が正常か否かを判断する。異常が発生したと判
断すると、プライマリスレッド２は、全てのスレッド
３、４、５の動作を終了させ、かつ、初期化を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コンピュータで実
行されるプロセスを構成する複数のスレッドの動作を監
視するマルチスレッドの監視方法に関する。

【０００２】

【従来の技術】従来から、コンピュータが実行すべき処
理の基本単位として、プロセスが用いられている。例え
ば、特定の処理がＣＰＵ（Central Processing Unit）
を専有せずに、複数のタスクを公平に進めるという、プ
リエンプティブなマルチタスクＯＳでは、ＣＰＵの実行
単位としてスレッドを採用する。これにより、リソース
を浪費しない効率的なシステムを構築することが可能に
ある。

【０００３】一般のマルチタスクで実行されるプロセス
間通信が増大すると、システムのパフォーマンスの向上
が妨げられる虞れがある。しかし、１つのプロセスに複
数のスレッドを割り当てることにより、プロセス間通信
を使用せずに、同等の機能を実現することが可能であ
り、より高速なプログラムを作ることができる。

【０００４】

【発明が解決しようとする課題】ところで、上記のよう
な従来の技術の場合、複数のスレッドから構成されるプ
ロセスでは、各スレッドが非同期に動作する。この結
果、様々な不具合を引き起こす虞れがある。これらの不
具合は、プログラムを作成する過程において、完全に取
り除かれることが望ましい。しかし、現実には、不具合
を完全に除去することは困難である。特に、スレッドの
数が多かったり、処理が複雑であったりする場合には、
予期し難い不具合が発生する虞れがある。それらの不具
合をプログラムの開発段階で発見し、その対策を講じる
ことは時間的にも経済的にも極めて困難である。しか
も、プログラムの運用が開始された後に、何らかの原因
でスレッドの動作に不具合が生じたときには、プログラ
ムが停止する。この場合、オペレータや保守員がその不
具合を発見し、プログラムを復旧させるために必要な再
立上げ等を行わなければならない。無人の場所で運用さ
れる自動化装置の場合には、適切な監視システムが無い
と、不具合の発見並びに再立上げが遅れて、異常の状態
のままで放置されてしまう虞れもある。

【０００５】

【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。〈構成１〉プロセスが実行するべき処理の一部を割り当
てられて動作する複数のスレッドに対して、プライマリ
スレッドから周期的に問い合わせ信号を送信し、上記ス
レッドのうちのいずれかから応答信号を受信することが
できないときには、プライマリスレッドは、全てのスレ
ッドを初期化することを特徴とするマルチスレッドの監
視方法。

【０００６】〈構成２〉プロセスが実行するべき処理の
一部を割り当てられて動作する複数のスレッドに対し
て、プライマリスレッドから周期的に問い合わせ信号を
送信し、上記スレッドのうちのいずれかから応答信号を
受信することができないときには、プライマリスレッド
は、上記全てのスレッドとスレッド同士の間の通信を初
期化することを特徴とするマルチスレッドの監視方法。

【０００７】〈構成３〉プロセスが実行するべき処理の
一部を割り当てられて動作する複数のスレッドに対し
て、プライマリスレッドから周期的に問い合わせ信号を
送信し、上記スレッドのうちのいずれかから応答信号を
受信することができないときには、プライマリスレッド
は、異常が発生したスレッドを初期化し、初期化したス
レッド以外のスレッドの動作状態を収集し、収集された
動作状態を初期化されたスレッドに通知して、その動作
状態を設定することを特徴とするマルチスレッドの監視
方法。

【０００８】

【発明の実施の形態】本発明に係るマルチスレッドの監
視方法を用いたプロセスの具体例について説明する。〈具体例１〉図１は、本発明に係るマルチスレッドの監
視方法を用いたプロセスの具体例１の構成図である。図
１に示すように、具体例１のプロセス１は、コンピュー
タ９によって処理され、その処理Ｐは、外部から入力さ
れた値Ａについて、値Ｂを出力することである。このプ
ロセス１は、プライマリスレッド２及び複数のスレッド
３、４、５から構成される。プライマリスレッド２は、
コンピュータ９がプロセス１の実行を開始する際に生成
される。スレッド３、４、５は、プライマリスレッド２
によって生成される。

【０００９】スレッド３、４、５は、プロセス１が実行
する処理Ｐを実行するのに必要な処理の一部をそれぞれ
割り当てられている。より具体的には、処理Ｐを実行す
るのに処理Ｓａ、処理Ｓｂ、処理Ｓｃが必要であるとす
ると、スレッド３は、処理Ｓａを割り当てられ、スレッ
ド４は、処理Ｓｂを割り当てられ、スレッド５は、処理
Ｓｃを割り当てられる。処理Ｐを実行するときには、ス
レッド３、４、５は、他のスレッドの動作とは非同期的
に、すなわち、他のスレッドの動作とは独立して、それ
ぞれの処理Ｓａ、Ｓｂ、Ｓｃを実行する。必要に応じ、
スレッド３、４、５は、他のスレッドとの間で通信を行
う。ここで、スレッド同士の間の通信とは、一のスレッ
ドから他のスレッドへ処理の結果を出力したり、一のス
レッドから他のスレッドへコマンドとパラメータを受け
渡し、そのパラメータを用いた、そのコマンドに対応す
る処理の結果を他のスレッドから一のスレッドへ戻した
りすることをいう。例えば、各スレッド３、４、５は、
周期的にイベントの受信関数をコールし、イベントを受
信した場合には、そのイベントの内容（コマンド、パラ
メータ）に対応する処理を行う。と同時に、スレッド間
でイベントを送受することにより、処理Ｐが進行する。

【００１０】プライマリスレッド２は、主としてスレッ
ド３、４、５を管理する機能を有する。スレッド３、
４、５を生成することに加えて、プライマリスレッド２
は、それらのスレッド３、４、５を初期化したり、終了
させたりする。また、プライマリスレッド２は、スレッ
ド同士の間の通信に必要な初期設定を行う。さらに、プ
ライマリスレッド２は、各スレッド３、４、５の動作を
監視する。

【００１１】プロセス１がコンピュータ９によって起動
されると、まず、プライマリスレッド２が生成される。
生成されたプライマリスレッド２は、スレッド３、４、
５を生成する。そして、それぞれに処理Ｓａ、Ｓｂ、Ｓ
ｃを割り当てた後、それらのスレッド３、４、５を初期
化するとともに、スレッド同士の間の通信も初期化す
る。生成され、かつ、初期化されると、スレッド３、
４、５は、それぞれ割り当てられた処理Ｓａ、Ｓｂ、Ｓ
ｃを実行すべきか否かを確認し、実行する必要が生じる
と、それらの処理Ｓａ、Ｓｂ、Ｓｃを実行する。例え
ば、スレッド３は、外部から入力を与えられると、処理
Ｓａを開始する。以後、各スレッドは、各々の処理Ｓ
ａ、Ｓｂ、Ｓｃを、他のスレッドとは非同期的に実行す
ると共に、必要に応じて他のスレッドとの間で通信を行
うことにより、プロセス１の処理Ｐを完了する。例え
ば、スレッド３は、値Ａを入力されたことを契機に処理
Ｓａを開始し、値Ａを用いて処理Ｓａを完了すると、ス
レッド間の通信により、コマンドと、パラメータ、すな
わち、処理の結果をスレッド４、５にいずれかに、ある
いは、その両方に出力する。スレッド４、５も同様にし
て、入力されたコマンドとパラメータとに基づき、それ
ぞれの処理Ｓｂ、Ｓｃを実行する。このようにして、最
後に、スレッド５が値Ｂを出力する。

【００１２】スレッド３、４、５が上述した処理を行っ
ている間、プライマリスレッド２は、それぞれのスレッ
ド３、４、５が正常に動作しているか否かを確認するべ
く、予め定められた問い合わせ信号を周期的に送信す
る。各スレッドは、その動作が正常であれば、プライマ
リスレッド２から受信した問い合わせ信号に応答して、
予め定められた応答信号をプライマリスレッド２へ返信
する。反対に、スレッド３、４、５は、その動作が異常
であれば、問い合わせ信号を受信することができず、あ
るいは、たとえ受信することができても、予め定められ
た応答信号を返信することができない。

【００１３】プライマリスレッド２は、スレッド３、
４、５から応答信号を受信することができている限りに
おいては、スレッド３、４、５に対し何ら特別な処理を
行わない。従って、例えば、スレッド３へ問い合わせ信
号を送信、スレッド３から応答信号を受信、スレッド４
へ問い合わせ信号を送信、スレッド４から応答信号を受
信、…、スレッド５から応答信号を受信、スレッド３へ
問い合わせ信号を送信、というようなポーリングの動作
を続ける。

【００１４】しかしながら、万が一、いずれかのスレッ
ド３、４、５から応答信号を受信することができないと
きには、プライマリスレッド２は、直ちに、全てのスレ
ッド３、４、５の動作を終了させた後、異常を生じたス
レッドだけでなく、他のスレッドをも初期化する。より
具体的には、プライマリスレッド２は、異常を生じた時
点において存在する全てのスレッド３、４、５の動作を
終了させた後、それら全てのスレッド３、４、５を消滅
させ、それらのスレッド３、４、５に対応する新たなス
レッド６、７、８を生成した後、それらのスレッド６、
７、８を初期化すると共に、スレッド同士の間の通信も
初期化する。

【００１５】図２は、新たなスレッドが生成されたプロ
セスの構成図である。図２に示すように、新たなスレッ
ド６、７、８によりプロセス１の処理Ｐが実行される。
これらのスレッド６、７、８によりそれぞれの処理Ｓ
ａ、Ｓｂ、Ｓｃが実行されている間も、上記の場合と同
様に、プライマリスレッド２は、それらのスレッド６、
７、８に対しポーリングを行うことにより、各スレッド
６、７、８の動作が正常か否かを確認する。

【００１６】〈具体例１の効果〉上述したように、具体
例１のマルチスレッドの監視方法では、プライマリスレ
ッド２が周期的にスレッド３、４、５の動作を確認する
べく、問い合わせ信号を送信する。それらのスレッド
３、４、５が正常であれば、問い合わせ信号に対応する
応答信号を受信し、異常であれば、問い合わせ信号に対
応する応答信号を受信しない。これにより、万が一、ス
レッド同士の間で予期し難いタイミングでコマンドやパ
ラメータの授受が行われ、スレッドの動作が異常になっ
た場合であっても、プライマリスレッド２は、早期にそ
の異常を検出することが可能となる。従って、従来の場
合と異なり、保守員等が異常を発見する必要がないだけ
でなく、保守員等がいない無人の場所であっても、異常
を発見して立上げを行うことができる。これにより、保
守員等による発見が遅れて、そのプロセスの稼働率が低
下してしまうという事態を回避することが可能になる。
言い換えれば、プロセスの稼働率の低減を最小限に押さ
えることが可能になる。スレッドに発生した異常を検出
した場合に、プライマリスレッド２は、その検出した時
点において存在する全てのスレッド３、４、５や通信を
初期化することにより、誤動作の結果として、例えば、
値Ｂの代わりに値ｂが出力されてしまうという事態を回
避することが可能になる。プライマリスレッド２は、現
存するスレッド３、４、５を単に初期化するだけでな
く、それらのスレッド３、４、５に相当するスレッドを
新たに生成することにより、プロセス１の処理Ｐを早期
に再開することが可能となる。

【００１７】〈変形例〉具体例１のマルチスレッドの監
視方法では、あるスレッドに異常が発生した場合に、プ
ライマリスレッド２は、その時点において存在する全て
のスレッドの動作を終了させたり、初期化したりする。
このようなプライマリスレッド２の動作とは対照的に、
プライマリスレッド２は、異常が発生したスレッドの動
作のみを終了させ、かつ、そのスレッドのみを初期化す
ることも可能である。これにより、全てのスレッドの動
作を終了させ、かつそれら全てのスレッドを初期化する
場合に比べて、プロセス１の処理Ｐをより早期に再開す
ることが可能となる。プライマリスレッド２は、異常が
発生したスレッド以外のスレッドの動作の状況を収集す
る。そして、その収集された動作の状況を、初期化され
たスレッドに通知あるいはその動作の状況に対応する、
初期化されたスレッドが有するべき動作の状況を設定す
る。これにより、さらに迅速かつ確実にプロセス１の処
理Ｐを再開することが可能となる。

【００１８】〈具体例２〉本発明に係るマルチスレッド
の監視方法の具体例２について説明する。具体例２のマ
ルチスレッドの監視方法は、具体例１のマルチスレッド
の監視方法と概ね同じである。具体例２は、具体例１の
マルチスレッドの監視方法が実際の通信ネットワークシ
ステムに適用された例である。図３は、具体例２のマル
チスレッドの監視方法を用いたプロセスの構成図であ
る。図３に示すように、複数の端末同士の間で通信を行
うためのシステムである通信ネットワークシステム１０
は、通信プロセス２０を含む網管理システム（ＮＭＳ：
Network Management System）により管理される。通信
プロセス２０は、通信ネットワークシステム１０を管理
するために必要なデータやコマンド等を格納するＭＩＢ
（Management Information Base）プロセス３０との間
で、適宜、それらのデータやコマンド等を授受する。通
信プロセス２０は、複数のスレッド２１〜２７及びプラ
イマリスレッド２８から構成される。以下の説明におい
て、通信ネットワークシステム１０と通信プロセス２０
との間、通信プロセス２０とＭＩＢプロセス３０との
間、通信プロセス２０内のスレッド同士の間で授受され
るデータやコマンドをメッセージと総称する。

【００１９】各スレッド２１〜２７及びプライマリスレ
ッド２８の機能は、以下の通りである。スレッド２１
は、通信プロセス２０を代表して、ＭＩＢプロセス３０
との間で、メッセージを授受する。スレッド２２は、ス
レッド２１から渡されたメッセージを元に、通信ネット
ワークシステム１０に適したメッセージ２０Ｓを生成す
る。スレッド２３は、生成されたメッセージ２０Ｓの送
信を制御する。スレッド２４は、所定の通信プロトコル
に従って、メッセージ２０Ｓを通信ネットワークシステ
ム１０へ送信する。スレッド２５は、スレッド２４と同
様に、所定の通信プロトコルに従って、通信ネットワー
クシステム１０からメッセージを受信する。スレッド２
６は、スレッド２５から渡されたメッセージを元に、Ｍ
ＩＢプロセス３０に適したメッセージ２０Ｒを生成す
る。スレッド２７は、生成されたメッセージ２０Ｒの送
信を制御する。スレッド２１は、メッセージ２０ＲをＭ
ＩＢプロセス３０へ送出する。

【００２０】このような通信プロセス２０の処理におい
て、スレッド２３は、スレッド２６と協同して、メッセ
ージ２０Ｓに対応するメッセージが通信ネットワークシ
ステムから返送されたか否かを確認する。返送されたこ
とが確認されると、スレッド２１は、そのメッセージ２
０Ｓを消去する。同様に、スレッド２７は、スレッド２
２と協同して、メッセージ２０Ｒに対応するメッセージ
がＭＩＢプロセス３０から返送されたか否かを確認す
る。返送されたことが確認されると、スレッド２６は、
そのメッセージ２０Ｒを消去する。プライマリスレッド
２８は、通信プロセス２０の実行が開始される際に生成
される。そして、スレッド２１〜２７を生成し、それら
のスレッド及びスレッド間の通信を初期化した後、それ
らのスレッドの動作を監視する。

【００２１】上述したような通信プロセス２０の処理が
実行される間、即ち、各スレッド２１〜２７の処理が実
行される間、プライマリスレッド２８は、それらのスレ
ッド２１〜２７の動作が正常か否かを確認するべく、問
い合わせ信号を周期的に送信する。各スレッド２１〜２
７は、正常であれば、その問い合わせ信号に対応する応
答信号をプライマリスレッド２８へ返答することができ
る。しかし、異常であれば、応答信号をプライマリスレ
ッド２８へ返答することができない。プライマリスレッ
ド２８は、応答信号の有無に基づき、各スレッド２１〜
２７が正常であるか異常であるかを判断する。あるスレ
ッドに異常が発生したと判断した場合には、プライマリ
スレッド２８は、全てのスレッド２１〜２７の動作を終
了させた後、それらのスレッド２１〜２７を初期化す
る。このようにして、通信プロセス２０の処理が再開さ
れる。

【００２２】〈具体例２の効果〉上述したように、具体
例２の通信プロセス２０では、具体例１のプロセス１と
同様に、プライマリスレッド２８が、複数のスレッド２
１〜２７へ周期的に各スレッドの動作が正常か否かを確
認するための問い合わせ信号を送信し、各スレッドは、
正常であれば応答信号を返送し、異常であれば応答信号
を返送しない。従って、プライマリスレッド２８は、各
スレッド２１〜２７から応答信号が返信されるか否かに
基づいて、各スレッド２１〜２７が正常に動作している
か否かを速やかに検出することができる。さらに、異常
を検出した場合に、プライマリスレッド２８は、全ての
スレッド２１〜２７の動作を終了させ、かつ、全てのス
レッド２１〜２７を初期化する。従って、通信プロセス
２０の処理を速やかに再開することが可能となる。

【図面の簡単な説明】

【図１】具体例１のプロセスの構成図である。

【図２】新たなスレッドが生成されたプロセスの構成図
である。

【図３】具体例２のプロセスの構成図である。

【符号の説明】

１プロセス２プライマリスレッド３，４，５スレッド９コンピュータ

Claims

【特許請求の範囲】

【請求項１】プロセスが実行するべき処理の一部を割
り当てられて動作する複数のスレッドに対して、プライマリスレッドから周期的に問い合わせ信号を送信
し、前記スレッドのうちのいずれかから応答信号を受信する
ことができないときには、プライマリスレッドは、全て
のスレッドを初期化することを特徴とするマルチスレッ
ドの監視方法。
【請求項２】プロセスが実行するべき処理の一部を割
り当てられて動作する複数のスレッドに対して、プライマリスレッドから周期的に問い合わせ信号を送信
し、前記スレッドのうちのいずれかから応答信号を受信する
ことができないときには、プライマリスレッドは、前記
全てのスレッドとスレッド同士の間の通信を初期化する
ことを特徴とするマルチスレッドの監視方法。
【請求項３】プロセスが実行するべき処理の一部を割
り当てられて動作する複数のスレッドに対して、プライマリスレッドから周期的に問い合わせ信号を送信
し、前記スレッドのうちのいずれかから応答信号を受信する
ことができないときには、プライマリスレッドは、異常
が発生したスレッドを初期化し、初期化したスレッド以
外のスレッドの動作状態を収集し、収集された動作状態
を初期化されたスレッドに通知して、その動作状態を設
定することを特徴とするマルチスレッドの監視方法。