JP2000099101A - デーモンプログラム管理システム - Google Patents

デーモンプログラム管理システム

Info

Publication number
JP2000099101A
JP2000099101A JP10268015A JP26801598A JP2000099101A JP 2000099101 A JP2000099101 A JP 2000099101A JP 10268015 A JP10268015 A JP 10268015A JP 26801598 A JP26801598 A JP 26801598A JP 2000099101 A JP2000099101 A JP 2000099101A
Authority
JP
Japan
Prior art keywords
daemon
daemon process
determined
abnormal
program management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP10268015A
Other languages
English (en)
Inventor
Takahiro Gouko
湖 隆 裕 郷
Junichi Suzuki
木 順 一 鈴
Yasuhiro Morikawa
川 泰 浩 森
Hiroshi Toda
田 博 志 遠
Sachiko Matsukawa
川 幸 子 松
Toshiharu Iwase
瀬 敏 治 岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Electronic Device Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Microelectronics Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Microelectronics Corp filed Critical Toshiba Corp
Priority to JP10268015A priority Critical patent/JP2000099101A/ja
Publication of JP2000099101A publication Critical patent/JP2000099101A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Safety Devices In Control Systems (AREA)
  • Control By Computers (AREA)

Abstract

(57)【要約】 【課題】 デーモンプログラムの異常動作を防止し、再
起動回数を減らす。 【解決手段】 本発明のデーモンプログラム管理システ
ムは、デーモン管理部1、デーモンログ監視部2、デー
モン動作監視部3、デーモン動作制御部4、システム監
視部5、メモリ6、および制御部7を備える。メモリ6
には、起動中のデーモンプロセスのプロセス名、子プロ
セス名、必要最小システム残量、および処理サイクルか
らなる監視対象プロセスマスタが格納される。デーモン
プロセスの出力ログ日時とシステム時間との時間差に基
づいてデーモンプロセスの異常の有無を判断し、デーモ
ンプロセスに異常がある場合には、デーモンプロセスの
異常動作/異常停止を判断し、異常動作している場合に
は停止させ、次に、システム領域に空きがあるか否かを
判断して、空きがあればデーモンプロセスを再起動する
ようにしたため、デーモンプロセスの異常動作を防止し
つつ、再起動回数を少なくできる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、CIM(Computer Int
egrated Manufacturing)等の複数のプロセスで構成され
るネットワーク環境を利用した各種システムにおいて、
CPUが実行する各種プロセス(例えば、常時実行され
るデーモンプロセス)がハングアップやダウンした場合
の対処手法に関し、具体的には、異常動作/異常停止し
ているプロセスを検知したときに自動的に動作環境を診
断して異常プロセスの回復処理を行う技術に関する。
【0002】
【従来の技術】CPUが実行するプロセスの中には常時
実行させるプロセスがあり、このようなプロセスはデー
モンプロセス(daemon process)と呼ばれる。
【0003】
【発明が解決しようとする課題】従来は、CPUが実行
する各種のプロセスがハングアップまたはダウンした場
合には、CPUをいったんリブートしてプロセスを再起
動していた。このため、以下のの問題が指摘されて
いた。
【0004】正常動作しているプロセスまで再起動し
てしまう。
【0005】異常プロセスの回復処理を即座に行えな
い。
【0006】監視対象プロセスがダウンした場合に、監
視対象プロセスを自動的に再起動する仕組みは従来から
存在したが、監視対象プロセスやデーモンプロセスが同
一プロセス内に存在するような構成では、監視対象プロ
セスがダウンすると、デーモンプロセス自体もダウンす
る可能性があり、デーモンプロセスが正常に動作してい
ても、再起動する必要があった。
【0007】本発明は、このような点に鑑みてなされた
ものであり、その目的は、デーモンプログラムの異常動
作を防止しつつ、その再起動回数を減らしてプロセスダ
ウンによる被害を最小限に抑えることができるデーモン
プログラム管理システムを提供することにある。
【0008】
【課題を解決するための手段】上述した課題を解決する
ために、本発明は、制御手段により常時実行されるデー
モンプロセスが正常に動作しているか否かを監視するデ
ーモンプログラム管理システムにおいて、デーモンプロ
セスに異常が発生したか否かを判定するデーモン異常判
定手段と、前記デーモンプロセスに異常があると判定さ
れた場合に、前記デーモンプロセスが異常動作している
のか、あるいは異常停止しているのかを判定する異常動
作/停止判定手段と、前記デーモンプロセスが異常動作
していると判定された場合に、前記デーモンプロセスを
停止させるデーモン停止手段と、異常停止した前記デー
モンプロセス、あるいは前記デーモン停止手段により停
止させた前記デーモンプロセスを起動するのに必要なシ
ステム領域に空きがあるか否かを判定するシステム領域
空き判定手段と、前記システム領域に空きがあると判定
された場合に、前記デーモンプロセスを再起動するデー
モン再起動手段と、を備えるものである。
【0009】請求項1〜5の発明を、例えば図1に対応
づけて説明すると、「デーモン異常判定手段」はデーモ
ンログ監視部2に、「異常動作/停止判定手段」はデー
モン動作監視部3に、「デーモン停止手段」、「システ
ム領域空き判定手段」、および「デーモン再起動手段」
はデーモン動作制御部4に、「警告手段」はシステム監
視部5に、それぞれ対応する。
【0010】
【発明の実施の形態】以下、本発明に係るデーモンプロ
グラム管理システムについて、図面を参照しながら具体
的に説明する。
【0011】図1は本発明に係るデーモンプログラム管
理システムの一実施形態のブロック図である。図1のデ
ーモンプログラム管理システムは、デーモン管理部1、
デーモンログ監視部2、デーモン動作監視部3、デーモ
ン動作制御部4、システム監視部5、メモリ6、および
制御部7を備える。
【0012】デーモン管理部1は、メモリ6に格納され
る監視対象プロセスマスタに各デーモンプロセスを登録
する処理や、監視対象プロセスマスタに登録した内容を
削除する処理を行う。なお、監視対象プロセスマスタの
詳細については後述する。
【0013】デーモンログ監視部2は、監視対象プロセ
スマスタに登録されたデーモンプロセスの出力ログの更
新日時とコンピュータのシステム日時との比較を行う。
デーモン動作制御部4は、監視対象プロセスマスタに登
録されたデーモンプロセスの動作状態を監視する。具体
的には、デーモン動作制御部4は、デーモン動作監視部
3で異常と判断されたデーモンプロセスの停止や再起動
を行う。システム監視部5は、デーモンプロセスの起動
に必要なシステム領域の空き容量を確認する。制御部7
は、システム全体の制御を行う。
【0014】制御部7を除く、デーモン管理部1、デー
モンログ監視部2、デーモン動作監視部3、デーモン動
作制御部4、およびシステム監視部5は、通常はソフト
ウエアで構成される。以下では、これらソフトウエアを
総称して監視プログラムと呼ぶ。
【0015】図2はメモリ6に格納される監視対象プロ
セスマスタのデータ構造を示す図である。図2に示すよ
うに、監視対象プロセスマスタは、デーモンプロセスの
名称を示すプロセス名と、デーモンプロセスが起動する
子プロセスの名称を示す子プロセス名と、デーモンプロ
セス起動時に必要なシステム領域の空き容量を示す必要
最小システム残量と、デーモンプロセスの全処理を行う
のに要する時間を示す処理サイクルとで構成される。
【0016】すなわち、監視対象プロセスマスタには、
起動中のデーモンプロセスのプロセス名、それに対応す
る子プロセス名、必要最小システム残量、および処理サ
イクルがリスト形式で登録される。以下、このリストを
デーモンリストと呼ぶ。
【0017】図3は監視プログラムの処理概要を示すフ
ローチャートである。まず、制御部7は、監視プログラ
ムを起動する(ステップS1)。次に、デーモン管理部
1は、監視対象プロセスマスタに登録されたデーモンリ
ストを読み込む(ステップS2)。次に、デーモンログ
監視部2は、データリストに登録された各デーモンプロ
セスが出力するログ日時を読み込む(ステップS3)。
このログ日時は、各プロセスの実際の処理時間を記録し
たものである。
【0018】次に、デーモンログ監視部2は、読み込ん
だログ日時とシステム時間との時間差を演算する。この
時間差が監視対象プロセスマスタにある「処理サイク
ル」の時間内であれば、デーモンプロセスが正常動作し
ていると判断してステップS2に戻る。一方、この時間
差が「処理サイクル」の時間を越えていれば、デーモン
プロセスに異常が起こったと判断し(ステップS4)、
次のステップS5に進む。
【0019】このステップS5において、デーモン動作
監視部3は、デーモンプロセスの動作ステータスを読み
込む。次に、デーモン動作監視部3は、読み込んだ動作
ステータスに基づいてデーモンプロセスの動作状態を確
認する(ステップS6)。ここでは、動作ステータスを
読み込めた場合には異常動作していると判断し、動作ス
テータスを読み込めない場合には異常停止していると判
断する。
【0020】ステップS6で異常動作していると判断さ
れた場合には、デーモン動作制御部4は、デーモンプロ
セスを停止させる(ステップS7)。また、監視対象プ
ロセスに登録されたデーモンプロセスの子プロセスが動
作しているときは、デーモン動作制御部4は、その子プ
ロセスも強制停止させる。
【0021】一方、ステップS6で異常停止していると
判断された場合、またはステップS7の処理が終了した
場合には、システム監視部5は、システム領域に空きが
あるか否かを判定する(ステップS8)。ここで、シス
テム領域とは、各プロセスを実行するのに必要なメモリ
6等の作業領域をいう。
【0022】デーモン動作制御部4は、システム領域に
空きがあればデーモンプロセスを再起動し(ステップS
9)、システム領域に空きがなければ電子メール等で制
御部7に警告する(ステップS10)。警告手段は、電子
メールの他に、アラームや表示装置への警告表示等でも
よい。
【0023】ステップS9またはS10の処理が終了する
と、次にデーモン動作監視部3は、異常動作しているデ
ーモンプロセスがまだ他に存在するか否かを判定し、ま
だ他に存在すればステップS5に戻り、他に存在しなけ
ればステップS2に戻る。
【0024】図4は監視対象プロセスマスタの具体例を
示す図であり、3つのデーモンプロセスdmn1.exe,dmn
2.exe,dmn3.exeが存在する例を示している。図4は、
これらデーモンプロセスdmn1.exe,dmn2.exe,dmn3.exe
を起動するのに必要なシステム領域がそれぞれ50kバイ
ト、3Mバイト、20kバイトであり、各デーモンプロセ
スの処理サイクルがそれぞれ10sec、15sec、3secであ
り、デーモンプロセスdmn2.exe,dmn3.exeにそれぞれ子
プロセスdmn2*.exe,dmn31.exeが存在する例を示してい
る。
【0025】図4の例の場合、デーモンログ監視部2
は、まず、監視対象プロセスマスタから3つのデーモン
プロセスdmn1.exe,dmn2.exe,dmn3.exeのリストと、こ
れら各デーモンリストのログ日時とを読み込み、各ログ
日時とシステム時間との時間差を計算する。
【0026】仮に、計算した時間差が、デーモンプロセ
スdmn1.exeは15sec、デーモンプロセスdmn2.exeは10se
c、デーモンプロセスdmn3.exeは5secであったとする。
この場合、デーモン動作監視部3は、図4に示す処理サ
イクルを越えているデーモンプロセスdmn1.exe,dmn3.e
xeが異常と判断する。
【0027】次に、デーモン動作監視部3は、異常と判
断されたデーモンプロセスdmn1.exeの動作ステータスを
読み込む。ここで、デーモンプロセスdmn1.exeの動作ス
テータスを読み込めない場合、デーモン動作監視部3は
デーモンプロセスdmn1.exeが異常停止していると判断
し、次に、システム監視部5は、このデーモンプロセス
dmn1.exeのシステム領域の空きがその起動に必要な50k
バイト以上あるか否かを判定する。ここで、システム領
域の空きが50kバイト以上あると仮定すると、システム
監視部5はデーモンプロセスdmn1.exeを再起動する。
【0028】続いて、デーモン動作監視部3は、同様
に、異常と判断されたデーモンプロセスdmn3.exeの動作
ステータスを読み込む。ここで、デーモンプロセスdmn
3.exeの動作ステータスを読み込めないとすると、デー
モン動作監視部3はデーモンプロセスdmn3.exeが異常動
作していると判断してこのデーモンプロセスを停止さ
せ、その子プロセスdmn31.exeも停止させる。ここで、
このデーモンプロセスdmn3.exeのシステム領域の空きが
20kバイト未満だったとすると、電子メール等でデーモ
ンプロセスdmn3.exeの再起動ができない旨の通知をす
る。以下、同様の処理を繰り返す。
【0029】このように、本実施形態は、デーモンプロ
セスの出力ログ日時とシステム時間とを比較してデーモ
ンプロセスの異常の有無を判断し、デーモンプロセスに
異常がある場合には、次に、デーモンプロセスが異常動
作しているか、異常停止しているかを判断し、異常動作
している場合にはデーモンプロセスを停止させ、次に、
システム領域に空きがあるか否かを判断して、空きがあ
ればデーモンプロセスを再起動するようにしたため、デ
ーモンプロセスの異常動作を防止しつつ、その再起動回
数を少なくできる。また、異常動作しているデーモンプ
ロセスの子プロセスが起動している場合には、その子プ
ロセスの起動も停止させるようにしたため、デーモンプ
ロセスの異常動作を確実に防止できる。
【0030】
【発明の効果】以上詳細に説明したように、本発明によ
れば、デーモンプロセスが異常動作しているか否かを判
断し、異常動作している場合には、デーモンプロセスの
起動を停止させて、システム領域の空きの有無を判断
し、空きがあればデーモンプロセスを再起動させるよう
にしたため、異常プロセスの異常事態に昼夜を問わず迅
速に対応でき、プロセスダウンによる被害を最小限に抑
えることができる。また、トラブル発生時の回復処理を
自動的に行えるため、エンジニアによるプロセス監視に
要する時間を削減できる。
【図面の簡単な説明】
【図1】本発明に係るデーモンプログラム管理システム
の一実施形態のブロック図。
【図2】監視対象プロセスマスタのデータ構造を示す
図。
【図3】監視プログラムの処理概要を示すフローチャー
ト。
【図4】監視対象プロセスマスタの具体例を示す図。
【符号の説明】
1 デーモン管理部 2 デーモンログ監視部 3 デーモン動作監視部 4 デーモン動作制御部 5 システム監視部 6 メモリ 7 制御部
フロントページの続き (72)発明者 鈴 木 順 一 神奈川県川崎市川崎区駅前本町25番地1 東芝マイクロエレクトロニクス株式会社内 (72)発明者 森 川 泰 浩 神奈川県川崎市川崎区駅前本町25番地1 東芝マイクロエレクトロニクス株式会社内 (72)発明者 遠 田 博 志 神奈川県川崎市川崎区駅前本町25番地1 東芝マイクロエレクトロニクス株式会社内 (72)発明者 松 川 幸 子 神奈川県川崎市川崎区駅前本町25番地1 東芝マイクロエレクトロニクス株式会社内 (72)発明者 岩 瀬 敏 治 神奈川県川崎市川崎区駅前本町25番地1 東芝マイクロエレクトロニクス株式会社内 Fターム(参考) 5B042 GA12 GA23 JJ19 KK02 5H209 AA05 DD04 EE18 GG04 HH02 HH04 HH06 5H215 AA06 BB12 CC05 CX01 GG05 GG09

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】制御手段により常時実行されるデーモンプ
    ロセスが正常に動作しているか否かを監視するデーモン
    プログラム管理システムにおいて、 デーモンプロセスに異常が発生したか否かを判定するデ
    ーモン異常判定手段と、 前記デーモンプロセスに異常があると判定された場合
    に、前記デーモンプロセスが異常動作しているのか、あ
    るいは異常停止しているのかを判定する異常動作/停止
    判定手段と、 前記デーモンプロセスが異常動作していると判定された
    場合に、前記デーモンプロセスを停止させるデーモン停
    止手段と、 異常停止した前記デーモンプロセス、あるいは前記デー
    モン停止手段により停止させた前記デーモンプロセスを
    起動するのに必要なシステム領域に空きがあるか否かを
    判定するシステム領域空き判定手段と、 前記システム領域に空きがあると判定された場合に、前
    記デーモンプロセスを再起動するデーモン再起動手段
    と、を備えることを特徴とするデーモンプログラム管理
    システム。
  2. 【請求項2】前記システム領域に空きがないと判定され
    た場合に所定の警告を行う警告手段を備えることを特徴
    とする請求項1に記載のデーモンプログラム管理システ
    ム。
  3. 【請求項3】前記デーモン停止手段は、異常動作してい
    ると判定された前記デーモンプロセスの子プロセスが起
    動している場合には、前記デーモンプロセスを停止させ
    るとともに、該子プロセスも停止させることを特徴とす
    る請求項1または2に記載のデーモンプログラム管理シ
    ステム。
  4. 【請求項4】起動中の前記デーモンプロセスの名称、該
    デーモンプロセスの子プロセスの名称、該デーモンプロ
    セスを起動するのに必要なシステム領域の容量、および
    該デーモンプロセスの処理サイクル時間を登録した監視
    対象プロセスマスタを備え、 前記デーモン停止手段は、前記監視対象プロセスマスタ
    に登録された各情報に基づいて、前記デーモンプロセス
    の異常の有無と、前記システム領域の空きの有無と、前
    記デーモンプロセスの子プロセスの有無とを判断するこ
    とを特徴とする請求項1〜3のいずれかに記載のデーモ
    ンプログラム管理システム。
  5. 【請求項5】前記デーモン異常判定手段は、前記デーモ
    ンプロセスが出力する実際の処理時刻を示すログ日時と
    システムの基準時間との時間差が前記監視対象プロセス
    マスタに登録された処理サイクル時間以内か否かに基づ
    いて、前記デーモンプロセスに異常があるか否かを判定
    することを特徴とする請求項4に記載のデーモンプログ
    ラム管理システム。
JP10268015A 1998-09-22 1998-09-22 デーモンプログラム管理システム Abandoned JP2000099101A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10268015A JP2000099101A (ja) 1998-09-22 1998-09-22 デーモンプログラム管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10268015A JP2000099101A (ja) 1998-09-22 1998-09-22 デーモンプログラム管理システム

Publications (1)

Publication Number Publication Date
JP2000099101A true JP2000099101A (ja) 2000-04-07

Family

ID=17452724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10268015A Abandoned JP2000099101A (ja) 1998-09-22 1998-09-22 デーモンプログラム管理システム

Country Status (1)

Country Link
JP (1) JP2000099101A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718310B1 (en) * 1999-07-12 2004-04-06 Rxdrugstore.Com Limited Methods for determining customer motivations in purchasing decisions
JP2020086767A (ja) * 2018-11-21 2020-06-04 富士通株式会社 情報処理装置および情報処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718310B1 (en) * 1999-07-12 2004-04-06 Rxdrugstore.Com Limited Methods for determining customer motivations in purchasing decisions
US7127418B2 (en) 1999-07-12 2006-10-24 Fuisz Richard C Methods for determining customer motivations in purchasing decisions
US8660907B2 (en) 1999-07-12 2014-02-25 Meyer Cordless Llc Methods for determining customer motivations in purchasing decisions
JP2020086767A (ja) * 2018-11-21 2020-06-04 富士通株式会社 情報処理装置および情報処理プログラム
JP7100260B2 (ja) 2018-11-21 2022-07-13 富士通株式会社 情報処理装置および情報処理プログラム

Similar Documents

Publication Publication Date Title
US7716520B2 (en) Multi-CPU computer and method of restarting system
US7120823B2 (en) Method and apparatus for recovering logical partition configuration data
JP5183542B2 (ja) 計算機システム及び設定管理方法
US5751966A (en) Notification of disconnected service machines that have stopped running
JP3481737B2 (ja) ダンプ採取装置およびダンプ採取方法
US20040246893A1 (en) Method and apparatus for customizable surveillance of network interfaces
US7340594B2 (en) Bios-level incident response system and method
JP2000099101A (ja) デーモンプログラム管理システム
JP2735514B2 (ja) プロセス状態管理方式
JP2001331330A (ja) プロセス異常検知及び復旧システム
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JPH0821025B2 (ja) マルチプロセッサシステムおよび同システムの初期化方法
JP2000155708A (ja) ジャーナルファイル使用状況自動監視方法
JP2002215428A (ja) タスク監視装置、タスク監視方法及びこの方法を記録した記録媒体
JP3604171B2 (ja) プロセス自動再起動処理方式
JP2000293407A (ja) 監視制御装置及びcpu監視方法並びにプログラム記録媒体
KR100235570B1 (ko) 2이상의 주전산기를 병립 연결한 시스템의 클러스터 관리 마스터 시스템의 클러스터 관리방법
KR100286222B1 (ko) 망관리부 자동 재부팅 방법
JPH0520231A (ja) 広域ネツトワーク計算機システム
JPH04124735A (ja) システム起動方式
JP2002215427A (ja) システム暴走検出方法および装置
JP2004054816A (ja) データベース管理方法および装置
JPH11282726A (ja) 情報処理システム及びウォッチドッグタイマ運用方法並びにその制御プログラムを記録した記録媒体
JPS61133443A (ja) 電子計算機システムの異常処理方式
JPH09325929A (ja) 障害自動通報システム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050107

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20050304