JPH06290126A - Fault monitoring system for computer system - Google Patents
Fault monitoring system for computer systemInfo
- Publication number
- JPH06290126A JPH06290126A JP5079637A JP7963793A JPH06290126A JP H06290126 A JPH06290126 A JP H06290126A JP 5079637 A JP5079637 A JP 5079637A JP 7963793 A JP7963793 A JP 7963793A JP H06290126 A JPH06290126 A JP H06290126A
- Authority
- JP
- Japan
- Prior art keywords
- client
- machine
- computer
- server
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Multi Processors (AREA)
- Computer And Data Communications (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、ネットワークシステム
における障害検出方式に関するものであり、更に詳しく
は、サーバマシンと、これに相互に接続されたクライア
ントマシンより構成されたクライアント・サーバシステ
ムにおいて、クライアントマシン上で発生した障害を検
出回復し、システムとしての一貫性及びデータの処理の
継続性維持を目的とした障害検出方式に関するものであ
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a failure detection method in a network system, and more specifically, in a client / server system composed of a server machine and client machines connected to each other, a client The present invention relates to a failure detection method for detecting and recovering a failure that has occurred on a machine and maintaining consistency as a system and continuity of data processing.
【0002】[0002]
【従来の技術】従来、クライアント・サーバシステムに
おいては、クライアントプログラムは1つのプロセスで
構成されていた。このため、サーバマシンによる障害検
出は、該サーバマシンがクライアントプロセスからのリ
クエスト待ちの状態にあった時にクライアントプロセス
から障害発生の報告を受けた場合、或はサーバマシンか
らクライアントマシンへ処理結果を返答する時点で、ネ
ットワーク伝送路を含めクライアントマシンの障害を検
出した場合、というように、その障害検出可能なタイミ
ングに制限があった。2. Description of the Related Art Conventionally, in a client / server system, a client program is composed of one process. Therefore, the failure detection by the server machine is performed when the failure report is received from the client process while the server machine is waiting for the request from the client process, or the processing result is returned from the server machine to the client machine. When a failure of the client machine including the network transmission path is detected at the time of, there is a limit to the timing at which the failure can be detected.
【0003】以下、従来システムにおける障害検出方式
について、図3について説明する。サーバプロセスにお
ける処理は、クライアントプロセスからの処理要求待ち
の状態(ステップ1)、クライアントからのメッセージ
が、処理要求か異常状態であるかによって処理を分ける
分岐(ステップ2)、クライアントからの処理要求に対
する処理の実施(ステップ3)、サーバプロセスによる
処理結果をクライアントプロセスに送信(ステップ
4)、送信が正常に行なわれたか否かによる分岐(ステ
ップ5)、異常を検知した場合の回復処理(ステップ
6)より構成される。一方、クライアントプロセスにお
ける処理は、ユーザからの処理要求待ちの状態(ステッ
プ7)、ユーザからの入力受け付け(ステップ8)、サ
ーバプロセスに対する処理依頼(ステップ9)、サーバ
プロセスからの処理結果待ちの状態(ステップ10)、
サーバプロセスからの処理結果に対するクライアントプ
ロセスによる処理(ステップ11)の実施より構成され
る。このように、サーバプロセスは、クライアントプロ
セスからの処理要求を待っている状態でクライアントマ
シンの異常状態が通知された場合、或は、サーバマシン
側から処理結果を転送する際に、ネットワーク或はクラ
イアントプロセスの異常を検出した場合にのみ異常処理
を実施していた。A fault detection method in the conventional system will be described below with reference to FIG. The process in the server process waits for a processing request from the client process (step 1), branches to divide the process depending on whether the message from the client is a processing request or an abnormal state (step 2), and responds to the processing request from the client. Execution of processing (step 3), transmission of the processing result by the server process to the client process (step 4), branching depending on whether the transmission was performed normally (step 5), recovery processing when an abnormality is detected (step 6) ). On the other hand, the processing in the client process is in a state of waiting for a processing request from the user (step 7), receiving an input from the user (step 8), processing request to the server process (step 9), and waiting for a processing result from the server process. (Step 10),
The process is performed by the client process (step 11) on the processing result from the server process. In this manner, the server process waits for a processing request from the client process, when an abnormal state of the client machine is notified, or when the processing result is transferred from the server machine side, the server process Abnormality processing was performed only when abnormalities in the process were detected.
【0004】[0004]
【発明が解決しようとする課題】上記のような構成をと
るクライアント・サーバシステムにおいては、障害検出
タイミングに制約があり、サーバプロセスがクライアン
トプロセスからの処理要求待ちの状態においてネットワ
ークで障害が発生した場合や、クライアントプロセスが
サーバプロセスに障害を伝えることができないような状
態においては、サーバプロセスではその障害を検出する
ことができず、従ってリソースがロックされたままの状
態が発生してもこれを回復することができず、システム
としての処理の一貫性・及び信頼性に欠けるという問題
点があった。In the client / server system configured as described above, there is a restriction on the timing of failure detection, and a failure occurs in the network while the server process is waiting for a processing request from the client process. In some cases, or in situations where the client process is unable to communicate the failure to the server process, the server process cannot detect the failure, and therefore may see this even if the resource remains locked. There was a problem that the system could not be recovered and the processing as a system lacked consistency and reliability.
【0005】この発明は、上記のような問題を解消する
ためになされたもので、クライアントマシンで発生した
障害を確実、かつ早期に検知し回復処理を実行すること
により信頼性の高いクライアント・サーバシステムを提
供することを目的としている。The present invention has been made in order to solve the above problems, and a reliable client / server by detecting a failure occurring in a client machine reliably and early and executing recovery processing. The purpose is to provide a system.
【0006】[0006]
【課題を解決するための手段】この発明におけるクライ
アント・サーバシステムにおける障害検出処理方式は、
クライアントマシン上にクライアントプロセスの状態を
監視する監視プロセスを設け、サーバマシン上に、前記
監視プロセスに対するクライアント状態情報を定期的に
要求するための監視プロセスへのチェック依頼(ポーリ
ング)手段を設けるようにしたものである。また、この
発明におけるクライアント・サーバシステムにおける障
害検出処理方式は、クライアントマシン上においてクラ
イアントプロセスの状態情報をサーバマシンに対して定
期的に通知する手段を設け、サーバマシン側にクライア
ントマシンからの前記クライアントプロセス状態に関す
る通知情報の欠落をチェックするためのタイマー監視手
段を設けるようにしたものである。A failure detection processing method in a client / server system according to the present invention comprises:
A monitoring process for monitoring the status of the client process is provided on the client machine, and a check request (polling) means to the monitoring process for periodically requesting the client status information for the monitoring process is provided on the server machine. It was done. Further, the failure detection processing method in the client / server system according to the present invention is provided with means for periodically notifying the server machine of the status information of the client process on the client machine, and the client machine from the client machine is provided on the server machine side. A timer monitoring means for checking the lack of notification information regarding the process state is provided.
【0007】[0007]
【作用】この発明による障害検出方式においては、サー
バマシンからクライアントマシンへの状態監視が定期的
に行われているので、クライアントマシンで発生した障
害に対し、これを見過ごすことなく早期に検出すること
ができる。また、この発明による障害検出方式において
は、サーバマシンに対して、クライアントマシンから定
期的に状態情報を通知し、一方、サーバマシン上ではタ
イマー監視を行ない、状態情報の欠落検知を可能とする
ことによりクライアントマシンで発生した障害を早期に
検出することができる。In the fault detection system according to the present invention, the state of the server machine is monitored by the client machine on a regular basis, so that a fault occurring in the client machine can be detected early without overlooking it. You can Further, in the failure detection method according to the present invention, the client machine periodically notifies the server machine of the status information, and on the other hand, the server machine performs timer monitoring to detect the missing status information. With this, it is possible to detect a failure occurring in the client machine at an early stage.
【0008】[0008]
実施例1.以下この発明の実施例を図について説明す
る。図1は、クライアントマシン側に監視プロセスを設
け、サーバマシン側に監視プロセスチェック依頼手段を
設けることにより、クライアントマシンの状態を監視す
る障害検出処理方式の処理概要を示した図である。図に
おいて1〜11は、従来方式における相当番号と同一の
ものである。12は、定期的に起動されて、クライアン
トマシンに対して、クライアントマシン側のプロセス状
態通知を促すための監視プロセスチェック依頼手段、1
3は、上記監視プロセスチェック依頼手段から状態通知
要求待ちをするステップであり、14はクライアントプ
ロセスの状態をチェックしてサーバマシンに通知するた
めのステップであり、クライアントマシン上の監視プロ
セスは、上記13、及び14の2つのステップから構成
されている。Example 1. Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a diagram showing a processing outline of a failure detection processing method for monitoring the status of a client machine by providing a monitoring process on the client machine side and providing a monitoring process check request means on the server machine side. In the figure, 1 to 11 are the same as the corresponding numbers in the conventional method. Reference numeral 12 is a monitoring process check requesting unit that is activated at regular intervals to prompt the client machine to notify the client machine of the process status.
3 is a step of waiting for a status notification request from the monitoring process check requesting means, 14 is a step for checking the status of the client process and notifying the server machine, and the monitoring process on the client machine is It is composed of two steps 13 and 14.
【0009】次に動作について説明する。クライアント
マシン上では、クライアントプロセスが起動されたタイ
ミングで、監視プロセスも同時に起動される。クライア
ントマシン、及びサーバマシン間において、一般の業務
処理がクライアントプロセス(ステップ7〜11)、及
びサーバプロセス(ステップ1〜6)で実行されてい
る。サーバマシン上の監視プロセスチェック手段12
は、上記一般業務処理とは独立して、定期的にクライア
ントマシン側の監視プロセスに対して状態通知の要求を
出す。クライアントマシン上の監視プロセスも、クライ
アントプロセスとは独立に動作しており、サーバマシン
からの上記状態通知要求を受けて、クライアントプロセ
ス側の状態をチェックして、その結果をサーバマシン側
に通知する。クライアントマシン上の監視プロセスに対
するサーバマシンからの状態通知チェック依頼に対する
応答内容に、クライアントプロセスにおける障害発生が
報告されていた場合、あるいは、状態通知依頼に対して
応答がなかった場合には、サーバマシン側では、該クラ
イアントマシンに障害が発生したとして異常回復処理を
実施する。Next, the operation will be described. On the client machine, when the client process is started, the monitoring process is also started at the same time. Between the client machine and the server machine, general business processing is executed by the client process (steps 7 to 11) and the server process (steps 1 to 6). Monitoring process check means 12 on the server machine
Independently issues a status notification request to the monitoring process on the client machine side, independently of the above general business processing. The monitoring process on the client machine also operates independently of the client process, receives the above status notification request from the server machine, checks the status on the client process side, and notifies the result to the server machine side. . If there is a failure in the client process in the response contents to the status notification check request from the server machine for the monitoring process on the client machine, or if there is no response to the status notification request, the server machine On the side, an abnormality recovery process is performed assuming that a failure has occurred in the client machine.
【0010】実施例2.また、この発明の第2の実施例
を図について説明する。図2はクライアントマシン上に
おいて、クライアントプロセスの状態情報をサーバプロ
セスに定期的に通知する手段を設け、サーバマシン上で
は、前記クライアントマシンからの状態情報の通知をタ
イマー監視する手段を設けることによって、クライアン
トプロセスの状態監視を行なう障害検出方式の処理概要
を示した図である。図において、1〜11は、従来方式
における相当番号と同一のものである。15は、定期的
に起動されて、クライアントプロセス状態をサーバマシ
ンへ通知するクライアント状態通知手段、16は、前記
クライアント状態通知手段からクライアント状態情報が
定期的に報告されてきているかをチェックする為のタイ
マー監視手段である。Embodiment 2. A second embodiment of the present invention will be described with reference to the drawings. In FIG. 2, means for periodically notifying the server process of the status information of the client process is provided on the client machine, and means for monitoring the notification of the status information from the client machine is provided on the server machine by a timer. It is a figure showing the processing outline of the failure detection system which monitors the state of a client process. In the figure, 1 to 11 are the same as the corresponding numbers in the conventional method. Reference numeral 15 is a client state notifying unit which is activated periodically to notify the client machine of the client process state, and 16 is for checking whether the client state information is periodically reported from the client state notifying unit. It is a timer monitoring means.
【0011】次に動作について説明する。クライアント
マシン上では、クライアントプロセスが起動されたタイ
ミングでクライアント状態通知プロセスも同時に起動さ
れている。クライアントマシン、及びサーバマシン間に
おいて、一般の業務処理がクライアントプロセス(7〜
11)及びサーバプロセス(ステップ1〜6)で実行さ
れている。上記一般業務処理とは独立して、クライアン
ト状態通知プロセス15が、クライアントマシンの状態
をサーバマシンに対し定期的に通知している。サーバマ
シン上では、タイマー監視チェック手段16により、前
記、クライアント状態情報が定期的に送出されて来てい
るかをチェックする。通知内容にクライアントプロセス
の障害発生が報告されていた場合や、通知の遅れている
クライアントプロセス、あるいはある一定時間以上通知
のなかったクライアントプロセスに対しては、障害が発
生したものと見なして障害回復処理を実施する。Next, the operation will be described. On the client machine, when the client process is started, the client status notification process is also started. Between the client machine and the server machine, general business processes are client processes (7-
11) and the server process (steps 1 to 6). The client status notification process 15 periodically notifies the server machine of the status of the client machine, independently of the above general business processing. On the server machine, the timer monitoring check means 16 checks whether or not the client status information is periodically sent. If the notification content reports that a client process failure has occurred, or a client process that has been delayed for notification or has not been notified for a certain period of time, considers that a failure has occurred and recovers from the failure. Perform processing.
【0012】[0012]
【発明の効果】この発明は、以上説明したように構成さ
れているので、以下に示すような効果を奏する。クライ
アントマシンにおける一般業務処理プロセスの実行状態
に依存することなく、クライアントプロセスの状態を、
遅滞することなくサーバマシンへ容易に通知することが
できる。また、サーバマシン上におけるタイマーチェッ
ク監視手段を設けたことにより、サーバマシンからの状
態通知要求に応じて、あるいは、クライアントマシン上
で定期的に起動されて、サーバマシンへ送出されてくる
状態情報に欠落があってもこれを検出し、且つクライア
ントプロセス側で間欠的に発生した障害に対しても、こ
れを見過ごすことなく早期に検出することによって、デ
ータ処理の継続性、さらにはネットワークシステム全体
としての信頼性を高めることができる。Since the present invention is constructed as described above, it has the following effects. The client process status can be changed without depending on the execution status of the general business process on the client machine.
It is possible to notify the server machine easily without delay. Also, by providing the timer check monitoring means on the server machine, the status information sent to the server machine in response to a status notification request from the server machine or periodically started on the client machine can be used. Detects even if there is a loss, and detects even intermittent failures on the client process side without failing to detect them early so that the continuity of data processing and the overall network system The reliability of can be increased.
【図1】監視プロセスを用いた異常処理方式の処理概要
を示した図である。FIG. 1 is a diagram showing a processing outline of an abnormality processing method using a monitoring process.
【図2】クライアント側からの定期的な状態情報の通知
を用いた異常処理方式の処理概要を示した図である。FIG. 2 is a diagram showing a processing outline of an abnormality processing method using periodic notification of status information from a client side.
【図3】従来方式の処理内容を示した図である。FIG. 3 is a diagram showing processing contents of a conventional method.
12 監視プロセスへのチェック依頼手段 13 状態通知要求待ち手段 14 クライアントプロセス状態チェックと通知手段 15 クライアントプロセス状態チェックと通知手段 16 タイマー監視手段 12 Check Request Means to Monitor Process 13 Status Notification Request Waiting Means 14 Client Process Status Check and Notification Means 15 Client Process Status Check and Notification Means 16 Timer Monitoring Means
Claims (2)
における障害監視システムであって、前記計算機システ
ムは、クライアントの業務プロセスが搭載された第1の
計算機と、上記ネットワークシステム内におけるリソー
ス管理、及びサービス提供を行う第2の計算機から構成
され、上記、第1の計算機上には、該計算機上で動作す
るクライアントプロセス状態を監視し、通知するための
クライアントプロセス状態監視手段を備え、上記、第2
の計算機上には、前記クライアントプロセス状態監視手
段に対し、クライアントプロセス状態情報を定期的に該
計算機へ通知要求するためのポーリング手段を備えたこ
とを特徴とする計算機システム障害監視方式。1. A fault monitoring system in a network-connected computer system, wherein the computer system is provided with a first computer on which a client business process is installed, resource management and service provision in the network system. And a client process status monitoring unit for monitoring and notifying the client process status operating on the first computer.
The computer system failure monitoring method, wherein the computer is provided with polling means for periodically requesting the client process status information to the client process status monitoring means.
における障害監視システムであって、前記計算機システ
ムは、クライアントの業務プロセスが搭載された第1の
計算機と、上記ネットワークシステム内におけるリソー
ス管理、及びサービス提供を行う第2の計算機から構成
され、上記、第1の計算機上には、該計算機上で動作す
るクライアントプロセス状態を監視し、第2の計算機に
対し、該クライアントプロセス状態情報を定期的に転送
するためのプロセス状態監視手段を備え、上記、第2の
計算機上には、定期的に起動されて、前記第1の計算機
から送出されてくるクライアントプロセス状態情報を監
視する手段を備えたことを特徴とする計算機システム障
害監視方式。2. A fault monitoring system in a computer system connected to a network, the computer system including a first computer having a client business process installed therein, resource management and service provision in the network system. The second computer is configured to monitor the client process status operating on the first computer, and periodically transfers the client process status information to the second computer. And a means for monitoring the client process state information sent from the first computer, which is regularly activated on the second computer. Computer system fault monitoring method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5079637A JPH06290126A (en) | 1993-04-06 | 1993-04-06 | Fault monitoring system for computer system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5079637A JPH06290126A (en) | 1993-04-06 | 1993-04-06 | Fault monitoring system for computer system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06290126A true JPH06290126A (en) | 1994-10-18 |
Family
ID=13695615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5079637A Pending JPH06290126A (en) | 1993-04-06 | 1993-04-06 | Fault monitoring system for computer system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06290126A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08161207A (en) * | 1994-12-07 | 1996-06-21 | Nec Corp | Network system |
JPH1021059A (en) * | 1996-07-02 | 1998-01-23 | Mitsubishi Electric Corp | Software version management system for network system |
JPH10161960A (en) * | 1996-11-29 | 1998-06-19 | Canon Inc | Monitor system, control method, and information processor |
-
1993
- 1993-04-06 JP JP5079637A patent/JPH06290126A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08161207A (en) * | 1994-12-07 | 1996-06-21 | Nec Corp | Network system |
JPH1021059A (en) * | 1996-07-02 | 1998-01-23 | Mitsubishi Electric Corp | Software version management system for network system |
JPH10161960A (en) * | 1996-11-29 | 1998-06-19 | Canon Inc | Monitor system, control method, and information processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1134658B1 (en) | System and method for comprehensive availability management in a high-availability computer system | |
US20080288812A1 (en) | Cluster system and an error recovery method thereof | |
JPH06290126A (en) | Fault monitoring system for computer system | |
JP2007280155A (en) | Reliability improving method in dispersion system | |
JP3208885B2 (en) | Fault monitoring system | |
JPH07319836A (en) | Fault monitoring system | |
US11954509B2 (en) | Service continuation system and service continuation method between active and standby virtual servers | |
JP4034436B2 (en) | Client / server system and client operation monitoring method | |
JP4848979B2 (en) | Monitoring system, monitoring method and program | |
JPH01217666A (en) | Fault detecting system for multiprocessor system | |
JPH1188471A (en) | Test method and test equipment | |
JPH1196033A (en) | Information processor | |
JP5951520B2 (en) | Multiple processing system | |
JPH11338724A (en) | Standby system, standby method and recording medium | |
JPH10171769A (en) | Composite computer system | |
JP2000148525A (en) | Method for reducing load of active system in service processor duplex system | |
KR100257162B1 (en) | Method and apparatus for supervising relative system in duplex system | |
JPH02310755A (en) | Health check system | |
JPH0342943A (en) | Duplexed control system | |
JPH11250026A (en) | Fault recovery method and its system for parallel multiprocessor system | |
JPH11331194A (en) | Device and system for monitor | |
JPH02281368A (en) | Trouble detecting mechanism for controller | |
JPH09160875A (en) | Multi-agent mutual back-up system | |
JPH08147255A (en) | Fault monitoring system | |
JP3646346B2 (en) | Abnormal processing method of computer system |