JPH06290126A - Fault monitoring system for computer system - Google Patents

Fault monitoring system for computer system

Info

Publication number
JPH06290126A
JPH06290126A JP5079637A JP7963793A JPH06290126A JP H06290126 A JPH06290126 A JP H06290126A JP 5079637 A JP5079637 A JP 5079637A JP 7963793 A JP7963793 A JP 7963793A JP H06290126 A JPH06290126 A JP H06290126A
Authority
JP
Japan
Prior art keywords
client
machine
computer
server
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5079637A
Other languages
Japanese (ja)
Inventor
Takuro Kanamori
卓郎 金森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP5079637A priority Critical patent/JPH06290126A/en
Publication of JPH06290126A publication Critical patent/JPH06290126A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To early and surely detect the fault of a client machine and to recovery the fault by providing a monitoring process on the client machine to monitor the state of a client process. CONSTITUTION:By providing a client machine with a monitoring process, and a server machine with a monitoring process check request means 12, respectively, the state of the client machine is monitored. The means 12 periodically transmits the requests to the processing process of the client machine for notification of the client machine state independently of the general work processing. The monitoring process of the client machine receives the state notification request from the server machine and checks the state of the client process to notify the server machine side of this checking result. If the answer contents includes the fault occurred in the client process or if no answer is received, the occurrence of a fault is decided and the recovery processing is carried out for the fault.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ネットワークシステム
における障害検出方式に関するものであり、更に詳しく
は、サーバマシンと、これに相互に接続されたクライア
ントマシンより構成されたクライアント・サーバシステ
ムにおいて、クライアントマシン上で発生した障害を検
出回復し、システムとしての一貫性及びデータの処理の
継続性維持を目的とした障害検出方式に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a failure detection method in a network system, and more specifically, in a client / server system composed of a server machine and client machines connected to each other, a client The present invention relates to a failure detection method for detecting and recovering a failure that has occurred on a machine and maintaining consistency as a system and continuity of data processing.

【0002】[0002]

【従来の技術】従来、クライアント・サーバシステムに
おいては、クライアントプログラムは1つのプロセスで
構成されていた。このため、サーバマシンによる障害検
出は、該サーバマシンがクライアントプロセスからのリ
クエスト待ちの状態にあった時にクライアントプロセス
から障害発生の報告を受けた場合、或はサーバマシンか
らクライアントマシンへ処理結果を返答する時点で、ネ
ットワーク伝送路を含めクライアントマシンの障害を検
出した場合、というように、その障害検出可能なタイミ
ングに制限があった。
2. Description of the Related Art Conventionally, in a client / server system, a client program is composed of one process. Therefore, the failure detection by the server machine is performed when the failure report is received from the client process while the server machine is waiting for the request from the client process, or the processing result is returned from the server machine to the client machine. When a failure of the client machine including the network transmission path is detected at the time of, there is a limit to the timing at which the failure can be detected.

【0003】以下、従来システムにおける障害検出方式
について、図3について説明する。サーバプロセスにお
ける処理は、クライアントプロセスからの処理要求待ち
の状態(ステップ1)、クライアントからのメッセージ
が、処理要求か異常状態であるかによって処理を分ける
分岐(ステップ2)、クライアントからの処理要求に対
する処理の実施(ステップ3)、サーバプロセスによる
処理結果をクライアントプロセスに送信(ステップ
4)、送信が正常に行なわれたか否かによる分岐(ステ
ップ5)、異常を検知した場合の回復処理(ステップ
6)より構成される。一方、クライアントプロセスにお
ける処理は、ユーザからの処理要求待ちの状態(ステッ
プ7)、ユーザからの入力受け付け(ステップ8)、サ
ーバプロセスに対する処理依頼(ステップ9)、サーバ
プロセスからの処理結果待ちの状態(ステップ10)、
サーバプロセスからの処理結果に対するクライアントプ
ロセスによる処理(ステップ11)の実施より構成され
る。このように、サーバプロセスは、クライアントプロ
セスからの処理要求を待っている状態でクライアントマ
シンの異常状態が通知された場合、或は、サーバマシン
側から処理結果を転送する際に、ネットワーク或はクラ
イアントプロセスの異常を検出した場合にのみ異常処理
を実施していた。
A fault detection method in the conventional system will be described below with reference to FIG. The process in the server process waits for a processing request from the client process (step 1), branches to divide the process depending on whether the message from the client is a processing request or an abnormal state (step 2), and responds to the processing request from the client. Execution of processing (step 3), transmission of the processing result by the server process to the client process (step 4), branching depending on whether the transmission was performed normally (step 5), recovery processing when an abnormality is detected (step 6) ). On the other hand, the processing in the client process is in a state of waiting for a processing request from the user (step 7), receiving an input from the user (step 8), processing request to the server process (step 9), and waiting for a processing result from the server process. (Step 10),
The process is performed by the client process (step 11) on the processing result from the server process. In this manner, the server process waits for a processing request from the client process, when an abnormal state of the client machine is notified, or when the processing result is transferred from the server machine side, the server process Abnormality processing was performed only when abnormalities in the process were detected.

【0004】[0004]

【発明が解決しようとする課題】上記のような構成をと
るクライアント・サーバシステムにおいては、障害検出
タイミングに制約があり、サーバプロセスがクライアン
トプロセスからの処理要求待ちの状態においてネットワ
ークで障害が発生した場合や、クライアントプロセスが
サーバプロセスに障害を伝えることができないような状
態においては、サーバプロセスではその障害を検出する
ことができず、従ってリソースがロックされたままの状
態が発生してもこれを回復することができず、システム
としての処理の一貫性・及び信頼性に欠けるという問題
点があった。
In the client / server system configured as described above, there is a restriction on the timing of failure detection, and a failure occurs in the network while the server process is waiting for a processing request from the client process. In some cases, or in situations where the client process is unable to communicate the failure to the server process, the server process cannot detect the failure, and therefore may see this even if the resource remains locked. There was a problem that the system could not be recovered and the processing as a system lacked consistency and reliability.

【0005】この発明は、上記のような問題を解消する
ためになされたもので、クライアントマシンで発生した
障害を確実、かつ早期に検知し回復処理を実行すること
により信頼性の高いクライアント・サーバシステムを提
供することを目的としている。
The present invention has been made in order to solve the above problems, and a reliable client / server by detecting a failure occurring in a client machine reliably and early and executing recovery processing. The purpose is to provide a system.

【0006】[0006]

【課題を解決するための手段】この発明におけるクライ
アント・サーバシステムにおける障害検出処理方式は、
クライアントマシン上にクライアントプロセスの状態を
監視する監視プロセスを設け、サーバマシン上に、前記
監視プロセスに対するクライアント状態情報を定期的に
要求するための監視プロセスへのチェック依頼(ポーリ
ング)手段を設けるようにしたものである。また、この
発明におけるクライアント・サーバシステムにおける障
害検出処理方式は、クライアントマシン上においてクラ
イアントプロセスの状態情報をサーバマシンに対して定
期的に通知する手段を設け、サーバマシン側にクライア
ントマシンからの前記クライアントプロセス状態に関す
る通知情報の欠落をチェックするためのタイマー監視手
段を設けるようにしたものである。
A failure detection processing method in a client / server system according to the present invention comprises:
A monitoring process for monitoring the status of the client process is provided on the client machine, and a check request (polling) means to the monitoring process for periodically requesting the client status information for the monitoring process is provided on the server machine. It was done. Further, the failure detection processing method in the client / server system according to the present invention is provided with means for periodically notifying the server machine of the status information of the client process on the client machine, and the client machine from the client machine is provided on the server machine side. A timer monitoring means for checking the lack of notification information regarding the process state is provided.

【0007】[0007]

【作用】この発明による障害検出方式においては、サー
バマシンからクライアントマシンへの状態監視が定期的
に行われているので、クライアントマシンで発生した障
害に対し、これを見過ごすことなく早期に検出すること
ができる。また、この発明による障害検出方式において
は、サーバマシンに対して、クライアントマシンから定
期的に状態情報を通知し、一方、サーバマシン上ではタ
イマー監視を行ない、状態情報の欠落検知を可能とする
ことによりクライアントマシンで発生した障害を早期に
検出することができる。
In the fault detection system according to the present invention, the state of the server machine is monitored by the client machine on a regular basis, so that a fault occurring in the client machine can be detected early without overlooking it. You can Further, in the failure detection method according to the present invention, the client machine periodically notifies the server machine of the status information, and on the other hand, the server machine performs timer monitoring to detect the missing status information. With this, it is possible to detect a failure occurring in the client machine at an early stage.

【0008】[0008]

【実施例】【Example】

実施例1.以下この発明の実施例を図について説明す
る。図1は、クライアントマシン側に監視プロセスを設
け、サーバマシン側に監視プロセスチェック依頼手段を
設けることにより、クライアントマシンの状態を監視す
る障害検出処理方式の処理概要を示した図である。図に
おいて1〜11は、従来方式における相当番号と同一の
ものである。12は、定期的に起動されて、クライアン
トマシンに対して、クライアントマシン側のプロセス状
態通知を促すための監視プロセスチェック依頼手段、1
3は、上記監視プロセスチェック依頼手段から状態通知
要求待ちをするステップであり、14はクライアントプ
ロセスの状態をチェックしてサーバマシンに通知するた
めのステップであり、クライアントマシン上の監視プロ
セスは、上記13、及び14の2つのステップから構成
されている。
Example 1. Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a processing outline of a failure detection processing method for monitoring the status of a client machine by providing a monitoring process on the client machine side and providing a monitoring process check request means on the server machine side. In the figure, 1 to 11 are the same as the corresponding numbers in the conventional method. Reference numeral 12 is a monitoring process check requesting unit that is activated at regular intervals to prompt the client machine to notify the client machine of the process status.
3 is a step of waiting for a status notification request from the monitoring process check requesting means, 14 is a step for checking the status of the client process and notifying the server machine, and the monitoring process on the client machine is It is composed of two steps 13 and 14.

【0009】次に動作について説明する。クライアント
マシン上では、クライアントプロセスが起動されたタイ
ミングで、監視プロセスも同時に起動される。クライア
ントマシン、及びサーバマシン間において、一般の業務
処理がクライアントプロセス(ステップ7〜11)、及
びサーバプロセス(ステップ1〜6)で実行されてい
る。サーバマシン上の監視プロセスチェック手段12
は、上記一般業務処理とは独立して、定期的にクライア
ントマシン側の監視プロセスに対して状態通知の要求を
出す。クライアントマシン上の監視プロセスも、クライ
アントプロセスとは独立に動作しており、サーバマシン
からの上記状態通知要求を受けて、クライアントプロセ
ス側の状態をチェックして、その結果をサーバマシン側
に通知する。クライアントマシン上の監視プロセスに対
するサーバマシンからの状態通知チェック依頼に対する
応答内容に、クライアントプロセスにおける障害発生が
報告されていた場合、あるいは、状態通知依頼に対して
応答がなかった場合には、サーバマシン側では、該クラ
イアントマシンに障害が発生したとして異常回復処理を
実施する。
Next, the operation will be described. On the client machine, when the client process is started, the monitoring process is also started at the same time. Between the client machine and the server machine, general business processing is executed by the client process (steps 7 to 11) and the server process (steps 1 to 6). Monitoring process check means 12 on the server machine
Independently issues a status notification request to the monitoring process on the client machine side, independently of the above general business processing. The monitoring process on the client machine also operates independently of the client process, receives the above status notification request from the server machine, checks the status on the client process side, and notifies the result to the server machine side. . If there is a failure in the client process in the response contents to the status notification check request from the server machine for the monitoring process on the client machine, or if there is no response to the status notification request, the server machine On the side, an abnormality recovery process is performed assuming that a failure has occurred in the client machine.

【0010】実施例2.また、この発明の第2の実施例
を図について説明する。図2はクライアントマシン上に
おいて、クライアントプロセスの状態情報をサーバプロ
セスに定期的に通知する手段を設け、サーバマシン上で
は、前記クライアントマシンからの状態情報の通知をタ
イマー監視する手段を設けることによって、クライアン
トプロセスの状態監視を行なう障害検出方式の処理概要
を示した図である。図において、1〜11は、従来方式
における相当番号と同一のものである。15は、定期的
に起動されて、クライアントプロセス状態をサーバマシ
ンへ通知するクライアント状態通知手段、16は、前記
クライアント状態通知手段からクライアント状態情報が
定期的に報告されてきているかをチェックする為のタイ
マー監視手段である。
Embodiment 2. A second embodiment of the present invention will be described with reference to the drawings. In FIG. 2, means for periodically notifying the server process of the status information of the client process is provided on the client machine, and means for monitoring the notification of the status information from the client machine is provided on the server machine by a timer. It is a figure showing the processing outline of the failure detection system which monitors the state of a client process. In the figure, 1 to 11 are the same as the corresponding numbers in the conventional method. Reference numeral 15 is a client state notifying unit which is activated periodically to notify the client machine of the client process state, and 16 is for checking whether the client state information is periodically reported from the client state notifying unit. It is a timer monitoring means.

【0011】次に動作について説明する。クライアント
マシン上では、クライアントプロセスが起動されたタイ
ミングでクライアント状態通知プロセスも同時に起動さ
れている。クライアントマシン、及びサーバマシン間に
おいて、一般の業務処理がクライアントプロセス(7〜
11)及びサーバプロセス(ステップ1〜6)で実行さ
れている。上記一般業務処理とは独立して、クライアン
ト状態通知プロセス15が、クライアントマシンの状態
をサーバマシンに対し定期的に通知している。サーバマ
シン上では、タイマー監視チェック手段16により、前
記、クライアント状態情報が定期的に送出されて来てい
るかをチェックする。通知内容にクライアントプロセス
の障害発生が報告されていた場合や、通知の遅れている
クライアントプロセス、あるいはある一定時間以上通知
のなかったクライアントプロセスに対しては、障害が発
生したものと見なして障害回復処理を実施する。
Next, the operation will be described. On the client machine, when the client process is started, the client status notification process is also started. Between the client machine and the server machine, general business processes are client processes (7-
11) and the server process (steps 1 to 6). The client status notification process 15 periodically notifies the server machine of the status of the client machine, independently of the above general business processing. On the server machine, the timer monitoring check means 16 checks whether or not the client status information is periodically sent. If the notification content reports that a client process failure has occurred, or a client process that has been delayed for notification or has not been notified for a certain period of time, considers that a failure has occurred and recovers from the failure. Perform processing.

【0012】[0012]

【発明の効果】この発明は、以上説明したように構成さ
れているので、以下に示すような効果を奏する。クライ
アントマシンにおける一般業務処理プロセスの実行状態
に依存することなく、クライアントプロセスの状態を、
遅滞することなくサーバマシンへ容易に通知することが
できる。また、サーバマシン上におけるタイマーチェッ
ク監視手段を設けたことにより、サーバマシンからの状
態通知要求に応じて、あるいは、クライアントマシン上
で定期的に起動されて、サーバマシンへ送出されてくる
状態情報に欠落があってもこれを検出し、且つクライア
ントプロセス側で間欠的に発生した障害に対しても、こ
れを見過ごすことなく早期に検出することによって、デ
ータ処理の継続性、さらにはネットワークシステム全体
としての信頼性を高めることができる。
Since the present invention is constructed as described above, it has the following effects. The client process status can be changed without depending on the execution status of the general business process on the client machine.
It is possible to notify the server machine easily without delay. Also, by providing the timer check monitoring means on the server machine, the status information sent to the server machine in response to a status notification request from the server machine or periodically started on the client machine can be used. Detects even if there is a loss, and detects even intermittent failures on the client process side without failing to detect them early so that the continuity of data processing and the overall network system The reliability of can be increased.

【図面の簡単な説明】[Brief description of drawings]

【図1】監視プロセスを用いた異常処理方式の処理概要
を示した図である。
FIG. 1 is a diagram showing a processing outline of an abnormality processing method using a monitoring process.

【図2】クライアント側からの定期的な状態情報の通知
を用いた異常処理方式の処理概要を示した図である。
FIG. 2 is a diagram showing a processing outline of an abnormality processing method using periodic notification of status information from a client side.

【図3】従来方式の処理内容を示した図である。FIG. 3 is a diagram showing processing contents of a conventional method.

【符号の説明】[Explanation of symbols]

12 監視プロセスへのチェック依頼手段 13 状態通知要求待ち手段 14 クライアントプロセス状態チェックと通知手段 15 クライアントプロセス状態チェックと通知手段 16 タイマー監視手段 12 Check Request Means to Monitor Process 13 Status Notification Request Waiting Means 14 Client Process Status Check and Notification Means 15 Client Process Status Check and Notification Means 16 Timer Monitoring Means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 ネットワーク接続された計算機システム
における障害監視システムであって、前記計算機システ
ムは、クライアントの業務プロセスが搭載された第1の
計算機と、上記ネットワークシステム内におけるリソー
ス管理、及びサービス提供を行う第2の計算機から構成
され、上記、第1の計算機上には、該計算機上で動作す
るクライアントプロセス状態を監視し、通知するための
クライアントプロセス状態監視手段を備え、上記、第2
の計算機上には、前記クライアントプロセス状態監視手
段に対し、クライアントプロセス状態情報を定期的に該
計算機へ通知要求するためのポーリング手段を備えたこ
とを特徴とする計算機システム障害監視方式。
1. A fault monitoring system in a network-connected computer system, wherein the computer system is provided with a first computer on which a client business process is installed, resource management and service provision in the network system. And a client process status monitoring unit for monitoring and notifying the client process status operating on the first computer.
The computer system failure monitoring method, wherein the computer is provided with polling means for periodically requesting the client process status information to the client process status monitoring means.
【請求項2】 ネットワーク接続された計算機システム
における障害監視システムであって、前記計算機システ
ムは、クライアントの業務プロセスが搭載された第1の
計算機と、上記ネットワークシステム内におけるリソー
ス管理、及びサービス提供を行う第2の計算機から構成
され、上記、第1の計算機上には、該計算機上で動作す
るクライアントプロセス状態を監視し、第2の計算機に
対し、該クライアントプロセス状態情報を定期的に転送
するためのプロセス状態監視手段を備え、上記、第2の
計算機上には、定期的に起動されて、前記第1の計算機
から送出されてくるクライアントプロセス状態情報を監
視する手段を備えたことを特徴とする計算機システム障
害監視方式。
2. A fault monitoring system in a computer system connected to a network, the computer system including a first computer having a client business process installed therein, resource management and service provision in the network system. The second computer is configured to monitor the client process status operating on the first computer, and periodically transfers the client process status information to the second computer. And a means for monitoring the client process state information sent from the first computer, which is regularly activated on the second computer. Computer system fault monitoring method.
JP5079637A 1993-04-06 1993-04-06 Fault monitoring system for computer system Pending JPH06290126A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5079637A JPH06290126A (en) 1993-04-06 1993-04-06 Fault monitoring system for computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5079637A JPH06290126A (en) 1993-04-06 1993-04-06 Fault monitoring system for computer system

Publications (1)

Publication Number Publication Date
JPH06290126A true JPH06290126A (en) 1994-10-18

Family

ID=13695615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5079637A Pending JPH06290126A (en) 1993-04-06 1993-04-06 Fault monitoring system for computer system

Country Status (1)

Country Link
JP (1) JPH06290126A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161207A (en) * 1994-12-07 1996-06-21 Nec Corp Network system
JPH1021059A (en) * 1996-07-02 1998-01-23 Mitsubishi Electric Corp Software version management system for network system
JPH10161960A (en) * 1996-11-29 1998-06-19 Canon Inc Monitor system, control method, and information processor

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161207A (en) * 1994-12-07 1996-06-21 Nec Corp Network system
JPH1021059A (en) * 1996-07-02 1998-01-23 Mitsubishi Electric Corp Software version management system for network system
JPH10161960A (en) * 1996-11-29 1998-06-19 Canon Inc Monitor system, control method, and information processor

Similar Documents

Publication Publication Date Title
EP1134658B1 (en) System and method for comprehensive availability management in a high-availability computer system
US20080288812A1 (en) Cluster system and an error recovery method thereof
JPH06290126A (en) Fault monitoring system for computer system
JP2007280155A (en) Reliability improving method in dispersion system
JP3208885B2 (en) Fault monitoring system
JPH07319836A (en) Fault monitoring system
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
JP4034436B2 (en) Client / server system and client operation monitoring method
JP4848979B2 (en) Monitoring system, monitoring method and program
JPH01217666A (en) Fault detecting system for multiprocessor system
JPH1188471A (en) Test method and test equipment
JPH1196033A (en) Information processor
JP5951520B2 (en) Multiple processing system
JPH11338724A (en) Standby system, standby method and recording medium
JPH10171769A (en) Composite computer system
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
KR100257162B1 (en) Method and apparatus for supervising relative system in duplex system
JPH02310755A (en) Health check system
JPH0342943A (en) Duplexed control system
JPH11250026A (en) Fault recovery method and its system for parallel multiprocessor system
JPH11331194A (en) Device and system for monitor
JPH02281368A (en) Trouble detecting mechanism for controller
JPH09160875A (en) Multi-agent mutual back-up system
JPH08147255A (en) Fault monitoring system
JP3646346B2 (en) Abnormal processing method of computer system