JPH05342058A - Process abnormality detection system - Google Patents

Process abnormality detection system

Info

Publication number
JPH05342058A
JPH05342058A JP4150228A JP15022892A JPH05342058A JP H05342058 A JPH05342058 A JP H05342058A JP 4150228 A JP4150228 A JP 4150228A JP 15022892 A JP15022892 A JP 15022892A JP H05342058 A JPH05342058 A JP H05342058A
Authority
JP
Japan
Prior art keywords
management
abnormal
processing
detected
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4150228A
Other languages
Japanese (ja)
Inventor
Yoshimi Kagaya
芳美 加賀屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP4150228A priority Critical patent/JPH05342058A/en
Publication of JPH05342058A publication Critical patent/JPH05342058A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To provide the high reliability of a system by performing processing while detecting the abnormal end of processes. CONSTITUTION:An application program (process) group 3 is constituted so as to be activated from a managing process 1 and further, a monitor process 2 activated from the managing process 1 is constituted so as to monitor the managing process 1 and to easily detect the abnormal end of the managing process 1 itself as well. Thus, since the abnormal end of processes can be detected and processing can be performed even after the abnormal end, the high-reliability system can be provided.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、例えばUNIXシス
テム(UNIXはAT&T社の登録商標である)におけ
るプロセスの異常終了を検知するシステムに関するもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for detecting abnormal termination of a process in, for example, UNIX system (UNIX is a registered trademark of AT & T Corporation).

【0002】[0002]

【従来の技術】図3は、UNIXシステムにおける、ア
プリケーションプログラムを作成した場合のプロセス構
成の図である。アプリケーションプロセス群4は、それ
ぞれ、システムにより起動されたプロセスの集合であ
る。次に動作について説明する。各アプリケーションプ
ロセス群4に対して、システムが異常を検知した場合、
システムは、プロセス群4に対して強制終了の割り込み
(UNIXシステムでは、SIGKILLというsig
nal)を発生させる。強制終了の割り込みを受けたプ
ロセスは、その割り込みをキャッチすることができない
ため、異常終了という形で終了させられてしまう。この
プロセスの異常終了を、アプリケーション側で検知する
ことができないことにより、そのプロセスが終了した場
合の処理が行えないため、このまま、システムを動作さ
せた場合、アプリケーションにより構築したシステムに
対して誤動作を引き起す結果となるおそれがでてくる。
2. Description of the Related Art FIG. 3 is a diagram showing a process configuration when an application program is created in a UNIX system. The application process group 4 is a set of processes activated by the system. Next, the operation will be described. When the system detects an error for each application process group 4,
The system interrupts the process group 4 by a forced termination (in UNIX systems, a sig called SIGKILL).
nal) is generated. The process that received the interrupt for forced termination cannot catch the interrupt, so it is terminated in the form of abnormal termination. Abnormal termination of this process cannot be detected by the application, so processing when the process is terminated cannot be performed.Therefore, if the system is operated as it is, malfunction will occur in the system constructed by the application. There is a risk of causing this.

【0003】[0003]

【発明が解決しようとする課題】従来のシステムにおい
ては、プロセスが強制終了させられた場合、そのプロセ
スの異常終了を検知することができないため、そのプロ
セス終了時の異常処理が行えないことによりその後のシ
ステムの正常動作が保障できないという問題点があっ
た。本発明は、上記のような問題点を解消するためにな
されたもので、プロセスの異常終了の検知を行えるプロ
セス管理ができるとともに、プロセス異常終了に対する
信頼性を向上させることのできるプロセス異常検出方式
を提供することを目的としている。
In the conventional system, when a process is forcibly terminated, the abnormal termination of the process cannot be detected. Therefore, the abnormal processing at the end of the process cannot be performed. There was a problem that normal operation of the system could not be guaranteed. The present invention has been made in order to solve the above problems, and is a process abnormality detection method capable of performing process management capable of detecting abnormal termination of a process and improving reliability with respect to abnormal process termination. Is intended to provide.

【0004】[0004]

【課題を解決するための手段】この発明に係るプロセス
異常検出方式は、例えば管理プロセスが各アプリケーシ
ョンプログラム(プロセス)を起動させ異常終了を検知
し、異常処理を行なうとともに、その管理プロセスの異
常終了に対しても検知できるような監視プロセスを備え
たものであり、以下の要素を有するものである。 (a)以下の要素を有する管理プロセス、(a1)プロ
セスを起動させる起動手段、(a2)上記起動手段によ
り起動されたプロセスの異常終了を検知する検知手段、
(a3)上記検知手段により検知されたプロセスの異常
発生後の処理を行なう事後処理手段、(b)上記起動手
段により起動され、上記管理プロセスの監視を行なう監
視プロセス。
In the process abnormality detection method according to the present invention, for example, a management process activates each application program (process) to detect an abnormal termination, performs abnormal processing, and abnormally terminates the management process. It is equipped with a monitoring process that can detect even the following, and has the following elements. (A) a management process having the following elements, (a1) a starting means for starting the process, (a2) a detecting means for detecting an abnormal end of the process started by the starting means,
(A3) Post-processing means for performing processing after the occurrence of an abnormality in the process detected by the detection means, and (b) a monitoring process which is started by the starting means and monitors the management process.

【0005】[0005]

【作用】この発明によるプロセス異常検出方式は、プロ
セスを管理プロセスにより起動させることにより、各プ
ロセスの異常終了に対する検知が可能となり、異常終了
発生後の処理が行えることになる。また、管理プロセス
の異常終了に対しても監視プロセスにより検知可能とな
る。このことにより、プロセスの異常終了を即時に検知
し異常処理を行なえるため信頼性の高いシステムを得る
事が出来る。
In the process abnormality detecting method according to the present invention, by starting the process by the management process, the abnormal end of each process can be detected, and the processing after the abnormal end can be performed. Further, the abnormal termination of the management process can be detected by the monitoring process. As a result, abnormal termination of a process can be immediately detected and abnormal processing can be performed, so that a highly reliable system can be obtained.

【0006】[0006]

【実施例】【Example】

実施例1.図1は、本発明に係るプロセス構成図の一実
施例を示す図であり、1は管理プロセス、2は管理プロ
セス1の異常終了を監視するための監視プロセス、3は
各アプリケーションにより作成されたプロセス群であ
る。
Example 1. FIG. 1 is a diagram showing an embodiment of a process configuration diagram according to the present invention. 1 is a management process, 2 is a monitoring process for monitoring abnormal termination of the management process 1, and 3 is created by each application. It is a group of processes.

【0007】管理プロセス1は、システムからの起動時
に、監視プロセス2を起動させるようにする。一般に、
UNIXシステムにおいて、あるプロセスより起動され
たプロセスは、親子というプロセス関係を結ぶことにな
る。この場合、起動したプロセスが親プロセスとなり、
起動されたプロセスが子プロセスとなる。従って、図1
において、管理プロセス1より起動されたプロセスはす
べて管理プロセスが親プロセスとなる。つまり、管理プ
ロセス1より起動された、プロセス群3の中のプロセス
A、プロセスBは、管理プロセス1を親とする子プロセ
スということになる。また、システム起動時に管理プロ
セス1により起動された監視プロセス2も同様に管理プ
ロセス1を親とする子プロセスである。
The management process 1 activates the monitoring process 2 when the system is activated. In general,
In the UNIX system, a process activated by a certain process has a parent-child process relationship. In this case, the started process becomes the parent process,
The started process becomes a child process. Therefore, FIG.
In, all the processes started by the management process 1 are parent processes. That is, the processes A and B in the process group 3 started by the management process 1 are child processes having the management process 1 as a parent. The monitoring process 2 started by the management process 1 when the system is started is also a child process having the management process 1 as a parent.

【0008】次に動作について、図2を用いて説明す
る。図2は、図1で示された各プロセスの処理を時間の
経過にともなって表わしたものである。点線は、親プロ
セスから子プロセス、または子プロセスから親プロセス
への動作をあらわす。まず、管理プロセス1はシステム
を起動させ、初めに監視プロセス3を起動させる。以
後、監視プロセス3は、getppidという親プロセ
スの存在を確認できるシステムコールを周期的に使用す
ることで親プロセスである管理プロセス1が異常終了し
ていないことを確認する。
Next, the operation will be described with reference to FIG. FIG. 2 shows the processing of each process shown in FIG. 1 over time. The dotted line represents the operation from the parent process to the child process or from the child process to the parent process. First, the management process 1 activates the system, and first activates the monitoring process 3. After that, the monitoring process 3 periodically uses a system call called getppid, which can confirm the existence of the parent process, and confirms that the management process 1, which is the parent process, has not terminated abnormally.

【0009】次に管理プロセスは、プロセスAを起動さ
せ、続いてプロセスBを起動させる。ここで、プロセス
Aが異常終了した例を想定し、プロセスBは、プロセス
Aが正常終了した時にのみ更新処理を行なうものとす
る。プロセスAは異常終了した事を管理プロセス1に知
らせる。異常終了を検知した管理プロセス1は、事後処
理を行なうよう、プロセスBに通知する。通知を受けた
プロセスBは、事後処理(たとえば更新結果を元にもど
す等の処理)を行ない、正常終了しその旨管理プロセス
1に通知する。その間監視プロセス2は、管理プロセス
1が動作している事を確認している。
Next, the management process activates process A and subsequently process B. Here, assuming an example in which the process A abnormally ends, the process B performs the update processing only when the process A ends normally. The process A notifies the management process 1 of the abnormal termination. The management process 1 that has detected the abnormal termination notifies the process B to perform post-processing. The process B that has received the notification performs post-processing (for example, processing such as returning the update result to the original), completes normally, and notifies the management process 1 to that effect. Meanwhile, the monitoring process 2 confirms that the management process 1 is operating.

【0010】この様にして管理プロセス1によって起動
されたアプリケーションプロセス群3の中のプロセスが
強制終了させられた場合、子プロセスは終了時に必ず親
プロセスに対して、その終了を通知することから、アプ
リケーションプロセス群3の中の各プロセスの異常終了
が必ず管理プロセス1に通知されることになり、異常終
了が検知可能となる。そして、異常終了が検知可能とな
るため、異常終了発生後の処理がタイミングよく行なえ
ることになる。さらに管理プロセス1が異常終了した場
合は、監視プロセス2が管理プロセス1の異常終了を検
知することができる。
When a process in the application process group 3 activated by the management process 1 is forcibly terminated in this way, the child process always notifies the parent process of its termination at the time of termination. Abnormal termination of each process in the application process group 3 is always notified to the management process 1, and the abnormal termination can be detected. Since the abnormal end can be detected, the processing after the abnormal end occurs can be performed at a proper timing. Further, when the management process 1 ends abnormally, the monitoring process 2 can detect the abnormal end of the management process 1.

【0011】実施例2.上記実施例1においては、UN
IXシステムの場合を例にして説明したが、この発明
は、UNIXシステムに限らず、あるプロセスが他のプ
ロセスの異常終了を検出できるシステムであれば適用す
ることができる。
Embodiment 2. In the first embodiment, the UN
Although the case of the IX system has been described as an example, the present invention is not limited to the UNIX system, but can be applied to any system in which a process can detect abnormal termination of another process.

【0012】[0012]

【発明の効果】以上のように、この発明によれば管理プ
ロセスによりプロセスの励動を行うように構成したので
アプリケーションプロセスの異常終了を検知できるよう
になり、又、管理プロセス自体の異常終了に対しても容
易に検知できるように構成したため、異常終了に対する
システムの高信頼性を容易に構築できる効果がある。
As described above, according to the present invention, since the process is excited by the management process, the abnormal termination of the application process can be detected, and the abnormal termination of the management process itself can be detected. Since it is configured so that it can be easily detected, it is possible to easily establish high reliability of the system against abnormal termination.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の実施例1のプロセス構成を示した図
である。
FIG. 1 is a diagram showing a process configuration according to a first embodiment of the present invention.

【図2】この発明の実施例1の動作を示した図である。FIG. 2 is a diagram showing the operation of the first embodiment of the present invention.

【図3】従来のプロセス構成を示した図である。FIG. 3 is a diagram showing a conventional process configuration.

【符号の説明】[Explanation of symbols]

1 管理プロセス 2 監視プロセス 3 アプリケーションプロセス群 1 Management process 2 Monitoring process 3 Application process group

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 以下の要素を有するプロセス異常検知方
式 (a)以下の要素を有する管理プロセス、(a1)プロ
セスを起動させる起動手段、(a2)上記起動手段によ
り起動されたプロセスの異常終了を検知する検知手段、
(a3)上記検知手段により検知されたプロセスの異常
発生後の処理を行なう事後処理手段、 (b)上記起動手段により起動され、上記管理プロセス
の監視を行なう監視プロセス。
1. A process abnormality detection method having the following elements: (a) a management process having the following elements, (a1) an activation means for activating a process, (a2) an abnormal termination of a process activated by the activation means. Detection means to detect,
(A3) Post-processing means for performing processing after occurrence of an abnormality in the process detected by the detection means, (b) Monitoring process started by the starting means and monitoring the management process.
JP4150228A 1992-06-10 1992-06-10 Process abnormality detection system Pending JPH05342058A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4150228A JPH05342058A (en) 1992-06-10 1992-06-10 Process abnormality detection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4150228A JPH05342058A (en) 1992-06-10 1992-06-10 Process abnormality detection system

Publications (1)

Publication Number Publication Date
JPH05342058A true JPH05342058A (en) 1993-12-24

Family

ID=15492350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4150228A Pending JPH05342058A (en) 1992-06-10 1992-06-10 Process abnormality detection system

Country Status (1)

Country Link
JP (1) JPH05342058A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083778A1 (en) * 2010-01-06 2011-07-14 三菱重工業株式会社 Computer, computer management method, and computer management program
JP2015043127A (en) * 2013-08-26 2015-03-05 株式会社リコー Program, information processor and image processing system
WO2024055654A1 (en) * 2022-09-13 2024-03-21 华为技术有限公司 Process starting method, process management method, and management apparatus

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011083778A1 (en) * 2010-01-06 2011-07-14 三菱重工業株式会社 Computer, computer management method, and computer management program
JP2011141675A (en) * 2010-01-06 2011-07-21 Mitsubishi Heavy Ind Ltd Computer, method and program for managing computer
US9164825B2 (en) 2010-01-06 2015-10-20 Mitsubishi Heavy Industries, Ltd. Computing unit, method of managing computing unit, and computing unit management program
JP2015043127A (en) * 2013-08-26 2015-03-05 株式会社リコー Program, information processor and image processing system
WO2024055654A1 (en) * 2022-09-13 2024-03-21 华为技术有限公司 Process starting method, process management method, and management apparatus

Similar Documents

Publication Publication Date Title
JPH10214208A (en) System for monitoring abnormality of software
JPH05342058A (en) Process abnormality detection system
JPH11175488A (en) Server system and fail over control method
JP2578985B2 (en) Redundant controller
JP2658683B2 (en) System stall monitoring and control method for mutual standby system
JPH02293939A (en) Stack overflow detection time processing system
JPS63238641A (en) Simplified detecting system for fault of microprocessor
JPS6389941A (en) Monitor and control equipment for microprocessor applied equipment
JPH09251402A (en) Computer fault detection system
KR100244195B1 (en) The method of detection error in wireless local loop
JP2545763B2 (en) Restart method of batch processing in hot standby system
JPH05290011A (en) Fault monitoring method in loose-coupled electronic computer system using shared resource exclusive controller
JPH04168534A (en) Automatic recovery system for computer system
JP2003173274A (en) Software system
JPH01163859A (en) Channel fault restoration controller
JPH02201675A (en) Computer nonstop control system in unsuitable line environment
JPH04340649A (en) Detection of subsystem down
JPH1031596A (en) Stall monitor system
JPH02216931A (en) Fault information reporting system
JPH035856A (en) Monitoring system for memory content holding function
JPH04349542A (en) Diagnostic system for real time operating system
JPH10269098A (en) Duplex system
JPH01129713A (en) Method for confirming power source abnormality detecting function
JPH0683489A (en) Reset control system
JPH03171232A (en) Restarting system