JPH0895932A - System switching control method for distributed processing system - Google Patents

System switching control method for distributed processing system

Info

Publication number
JPH0895932A
JPH0895932A JP6226450A JP22645094A JPH0895932A JP H0895932 A JPH0895932 A JP H0895932A JP 6226450 A JP6226450 A JP 6226450A JP 22645094 A JP22645094 A JP 22645094A JP H0895932 A JPH0895932 A JP H0895932A
Authority
JP
Japan
Prior art keywords
computer
standby
address information
execution
executing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6226450A
Other languages
Japanese (ja)
Inventor
Akio Igarashi
明夫 五十嵐
Osamu Suzuki
治 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6226450A priority Critical patent/JPH0895932A/en
Publication of JPH0895932A publication Critical patent/JPH0895932A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

PURPOSE: To provide a technique with which the service provided by an executing computer can be speedily succeeded to a reserve computer without loading any heavy burden on other computers on a communication network when any fault is generated at the executing computer while utilizing the reserve computer disconnected from the communication network when the executing computer is normal. CONSTITUTION: Concerning a distributed processing system provided with an executing computer 200 and a reserve computer 300 to be the reserve system of the executing computer 200 to be connected by a communication network 400 for a client computer 100 for executing the distributed processing with the reserve computer 300 in place of the executing computer 200 when any fault is generated at the executing computer 200, the client computer 100 previously registers address information specifying the executing computer 200 and the reserve computer 300 and attribute information distinguishing whether it is the executing system or the reserve system and when any fault is generated at the executing computer 200 of which the attribute information shows the executing system, after the erasure of address information specifying the executing computer 200 where the fault is generated, the required distributed processing is executed by the reserve computer 300 of which the attribute information shows a standby state.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、通信ネットワークで接
続した複数の計算機の中で、実行計算機と待機計算機を
持ち、実行計算機に障害が発生した場合、その処理を待
機計算機で引き継ぎ実行する分散処理システムの系切り
替え制御方法に係わり、特に、待機計算機を有効利用す
る系切り替え制御方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention is a distributed system which has an execution computer and a standby computer among a plurality of computers connected by a communication network, and when a failure occurs in the execution computer, the processing is taken over and executed by the standby computer. The present invention relates to a system switching control method for a processing system, and particularly to a system switching control method for effectively using a standby computer.

【0002】[0002]

【従来の技術】従来、この種の系切り替え制御方法とし
て、例えば、IBM(インターナショナル・ビジネス・
マシーンズ・コーポレーション)のHACMP/600
0(Hight Availability Clus
ter Multi−processing/600
0)では、TCP/IP(Transmission
Control Protocol/Internet
Protocol)プロトコルによる通信ネットワー
クで接続した実行計算機のIP(InternetPr
otocol)アドレスを実行計算機障害で切り替わっ
た際に、待機計算機のIPアドレスに引き継ぐ方法をと
っている。
2. Description of the Related Art Conventionally, as a system switching control method of this kind, for example, IBM (International Business
Machines Corporation HACMP / 600
0 (High Availability Clus
ter Multi-processing / 600
0), TCP / IP (Transmission)
Control Protocol / Internet
IP (InternetPr) of the execution computer connected by the communication network by the Protocol)
auto) address is taken over by the IP address of the standby computer when the execution computer fails.

【0003】図5は、この系切り替え制御方法を用いた
分散処理システムの構成図である。同図において、70
0は分散処理システムにおけるクライアント計算機、7
40はクライアント計算機700の持つクライアントプ
ログラム、730はクライアントプログラム740が必
要とするサーバプロセスのアドレス情報の問い合わせ、
及び新たに取得したアドレス情報の記憶を行うネームサ
ービスである。
FIG. 5 is a block diagram of a distributed processing system using this system switching control method. In the figure, 70
0 is a client computer in the distributed processing system, 7
40 is a client program of the client computer 700, 730 is an inquiry about the address information of the server process required by the client program 740,
And a name service that stores the newly acquired address information.

【0004】800は各種のオンラインサービスを行う
実行計算機、810は実行計算機800の障害を検知し
計算機切り替えを指示する切り替えモニタ、820は実
行計算機800が持つオンライン制御プログラム、82
1はオンラインサービスを行うサーバプロセス、830
は実行計算機800のアドレス情報を持つネームサービ
スである。
Reference numeral 800 is an execution computer for performing various online services, 810 is a switching monitor for detecting a failure of the execution computer 800 and instructing computer switching, 820 is an online control program of the execution computer 800, 82
1 is a server process for performing online service, 830
Is a name service having address information of the execution computer 800.

【0005】900は実行計算機800に障害が発生し
た場合、実行計算機800に代わりオンラインサービス
を提供する待機計算機、910は待機計算機900の障
害を検知し、計算機切り替えを指示する切り替えモニ
タ、920は実行計算機800の持つオンライン制御プ
ログラム820と同一のオンライン制御プログラム、9
21は実行計算機800のサーバプロセス821と同一
のオンラインサービスを提供するサーバプロセス、93
0は実行計算機800障害時に実行計算機800のネー
ムサービス830のアドレス情報を引き継ぐネームサー
ビスである。
Reference numeral 900 denotes a standby computer that provides an online service in place of the executing computer 800 when a failure occurs in the executing computer 800, 910 a switching monitor that detects a failure of the standby computer 900 and instructs computer switching, and 920 executes An online control program that is the same as the online control program 820 of the computer 800, 9
21 is a server process that provides the same online service as the server process 821 of the execution computer 800;
0 is a name service that inherits the address information of the name service 830 of the execution computer 800 when the execution computer 800 fails.

【0006】1100は実行計算機800と待機計算機
900の間で計算機の切り替え連絡を行う切り替え連絡
回線であり、実行計算機800の切り替えモニタ810
と待機計算機900の切り替えモニタ910に直接接続
されている。
Reference numeral 1100 is a switching communication line for performing switching communication between computers between the executing computer 800 and the standby computer 900, and a switching monitor 810 of the executing computer 800.
Is directly connected to the switching monitor 910 of the standby computer 900.

【0007】最後に、1000は前記各計算機を結ぶT
CP/IPプロトコルによる通信ネットワーク回線であ
る。
Finally, 1000 is a T connecting the computers.
It is a communication network line based on the CP / IP protocol.

【0008】図6は実行計算機800及び待機計算機9
00のネームサービス830、930の持つアドレス情
報で、1210はネットワーク内での計算機名称が入る
サーバ名称フィールド、1220はネットワーク内での
計算機アドレスが入るIPアドレスフィールド、123
0は各サーバプロセスのアドレス情報が入る計算機内サ
ーバプロセスアドレスフィールドである。
FIG. 6 shows an execution computer 800 and a standby computer 9.
Address information of the name services 830 and 930 of 00, 1210 is a server name field in which the computer name in the network is entered, 1220 is an IP address field in which the computer address in the network is entered, 123
0 is an in-computer server process address field in which address information of each server process is entered.

【0009】この場合、ネームサービス自信のアドレス
情報は、計算機内サーバアドレスフィールド1230が
通信ネットワーク内で一意に設定されている。
In this case, the in-computer server address field 1230 of the address information of the name service is uniquely set in the communication network.

【0010】次に、図5及び図6にもとづき、従来の分
散処理システムの動作について説明する。
Next, the operation of the conventional distributed processing system will be described with reference to FIGS.

【0011】実行計算機800が正常動作時おいては、
待機計算機900にはIPアドレスが設定されていない
ため、クライアント計算機700は待機計算機900に
通信ネットワーク1000を介して通信することは不可
能である。つまり、図5において、通信ネットワーク1
000によってクライアント計算機700に接続されて
いるのは、実行計算機800のみである。
During normal operation of the execution computer 800,
Since no IP address is set in the standby computer 900, the client computer 700 cannot communicate with the standby computer 900 via the communication network 1000. That is, in FIG. 5, the communication network 1
Only the execution computer 800 is connected to the client computer 700 by 000.

【0012】この状態において、実行計算機800に障
害が発生し、この障害発生を切り替えモニタ810が検
知すると、系切り替え連絡回線1100を通じ待機計算
機900の切り替えモニタ910に計算機の切り替え要
求を出す。この要求により、待機計算機900のIPア
ドレスフィールド1220に、実行計算機800のIP
アドレスが設定される。
In this state, a failure occurs in the executing computer 800, and when the switching monitor 810 detects this failure, it issues a computer switching request to the switching monitor 910 of the standby computer 900 through the system switching communication line 1100. By this request, the IP address field 1220 of the standby computer 900 is set to the IP address of the executing computer 800.
The address is set.

【0013】一方、実行計算機800内のIPアドレス
は消去され、実行計算機800は通信ネットワーク10
00より切り離される。
On the other hand, the IP address in the execution computer 800 is deleted, and the execution computer 800 becomes the communication network 10.
Separated from 00.

【0014】この実行計算機800に障害が発生し、待
機計算機900に系が切り替わるまでをクライアント計
算機700より見ると、障害が発生した実行計算機80
0から待機計算機900にアドレス情報が移行するまで
の間は、通信ネットワーク1000を介したネームサー
ビス730からのサーバ名称をキーにしたサーバプロセ
ス821のアドレス情報の問い合わせ等を初めとするす
べてのサービスが停止してしまう。
From the point of view of the client computer 700 until a failure occurs in the execution computer 800 and the system is switched to the standby computer 900, the execution computer 80 in which the failure has occurred
During the period from 0 to the transfer of the address information to the standby computer 900, all services including the inquiry of the address information of the server process 821 using the server name as a key from the name service 730 via the communication network 1000 It will stop.

【0015】しかし、実行計算機800のアドレス情報
の消去、及び待機計算機900のアドレス設定が完了す
ると、待機計算機900の持つアドレス情報は、全て実
行計算より引き継いだものであることより、以前、実行
計算機800より取得したアドレス情報をもとに、目的
とするサーバプロセスにサービス要求を出すと、待機計
算機900のサーバプロセスが実行計算機800に代わ
り、目的とするサービスを提供する。
However, when the deletion of the address information of the execution computer 800 and the setting of the address of the standby computer 900 are completed, all the address information of the standby computer 900 is inherited from the execution calculation. When a service request is issued to the target server process based on the address information acquired from 800, the server process of the standby computer 900 replaces the executing computer 800 and provides the target service.

【0016】このように、従来の系切り替え方法による
と、実行計算機800と待機計算機900の切り替えの
際にIPアドレスが引き継がれるため、クライアントプ
ログラム740は系切り替えを意識することなく処理を
継続することが可能である。
As described above, according to the conventional system switching method, since the IP address is inherited when the execution computer 800 and the standby computer 900 are switched, the client program 740 can continue the processing without being aware of the system switching. Is possible.

【0017】[0017]

【発明が解決しようとする課題】本発明者は、前記従来
技術を検討した結果、以下の問題点を見いだした。
The present inventor has found the following problems as a result of examining the above-mentioned prior art.

【0018】前記従来技術では、実行計算機800が正
常に動作している状態においては、待機計算機900に
はIPアドレスが設定されず、通信ネットワーク100
0から切り離されているため、待機計算機900を有効
に活用しようとしても不可能であった。すなわち、例え
ば実行計算機800の負荷が一時的に重くなり、この負
荷を待機計算機900に分散させようとしても不可能で
あるという問題があった。
In the above-mentioned conventional technique, when the executing computer 800 is operating normally, the IP address is not set in the standby computer 900, and the communication network 100
Since it was separated from 0, it was impossible to effectively utilize the standby computer 900. That is, for example, the load of the execution computer 800 becomes temporarily heavy, and there is a problem that it is impossible to distribute this load to the standby computers 900.

【0019】本発明の目的は、待機計算機としての性格
を維持しつつ、必要に応じて有効に活用可能にする分散
処理システムの系切り替え制御方法を提供することにあ
る。
It is an object of the present invention to provide a system switching control method for a distributed processing system that enables effective utilization as needed while maintaining the character of a standby computer.

【0020】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
になるであろう。
The above and other objects and novel features of the present invention will be apparent from the description of this specification and the accompanying drawings.

【0021】[0021]

【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
以下のとおりである。
Of the inventions disclosed in the present application, a representative one will be briefly described below.
It is as follows.

【0022】クライアント計算機に対し、通信ネットワ
ークで接続される実行計算機と該実行計算機の待機系と
なる待機計算機とを備え、前記実行計算機の障害発生時
は該実行計算機に代えて前記待機計算機に分散処理を実
行させる分散処理システムにおいて、前記クライアント
計算機に、前記実行計算機及び待機計算機を特定するア
ドレス情報と実行系か待機系かを区別する属性情報とを
予め登録しておき、前記属性情報が実行系を示している
実行計算機の障害発生時は障害が発生した実行計算機を
特定する前記アドレス情報を消去した後、前記属性情報
が待機状態となっている待機計算機に必要な分散処理を
実行させる。
The client computer is provided with an execution computer connected by a communication network and a standby computer serving as a standby system for the execution computer. When a failure occurs in the execution computer, the execution computer is distributed to the standby computer instead of the execution computer. In a distributed processing system for executing processing, address information specifying the executing computer and standby computer and attribute information for distinguishing between an active system and a standby system are registered in advance in the client computer, and the attribute information is executed. When a failure occurs in the execution computer indicating the system, the address information for specifying the failed execution computer is deleted, and then the standby computer having the attribute information in the standby state executes the necessary distributed processing.

【0023】[0023]

【作用】前記手段によれば、クライアント計算機に実行
計算機と待機計算機を特定するためのアドレス情報、及
び実行系か待機系かを区別する属性情報を予め登録して
おくことにより、待機計算機を通信ネットワークに接続
し、通信ネットワーク上の他の計算機から待機計算機を
利用可能とする。
According to the above means, the standby computer can be communicated by registering in advance the address information for identifying the executing computer and the standby computer and the attribute information for distinguishing between the active system and the standby system in the client computer. It connects to the network and makes the standby computer available to other computers on the communication network.

【0024】ここで、クライアント計算機が計算機名称
をキーに、サーバプロセスのアドレス情報を問い合わせ
ると、実行計算機と待機計算機の両方からアドレス情報
がクライアント計算機に返信されるが、アドレス情報の
待機属性フィールドを参照することにより、クライアン
ト計算機は「実行状態」にある実行計算機にサービス要
求を出す。
When the client computer inquires the address information of the server process using the computer name as a key, the address information is returned from both the executing computer and the standby computer to the client computer, but the standby attribute field of the address information is set. By referring, the client computer issues a service request to the execution computer in the "execution state".

【0025】一方、クライアント計算機が必要に応じて
待機計算機に対し必要な処理を実行させる場合は、前記
アドレス情報をもとに「待機状態」にあることを認識し
たうえで可能となり、待機計算機の計算機資源を有効に
活用できる。この場合、待機計算機本来の目的を損なう
ような、負荷の重い処理や長時間かかる処理は、例えば
クライアント計算機からのサービス要求の時点で受け付
けないようにしておくことにより、解決する。
On the other hand, when the client computer causes the standby computer to execute necessary processing as necessary, it becomes possible after recognizing that the client computer is in the "standby state" based on the address information. Effective use of computer resources. In this case, a heavy-load process or a long-time process that impairs the original purpose of the standby computer can be solved by, for example, not accepting the service request from the client computer.

【0026】実行計算機に障害が発生した場合には、通
信ネットワーク上の全ての計算機に対し、実行計算機と
待機計算機に関するアドレス情報を消去させる一方で、
実行計算機の待機属性を「待機状態」とし、待機計算機
の待機属性を「実行状態」とすることにより、クライア
ント計算機より出されるサービス要求を待機計算機が実
行する。
When a failure occurs in the execution computer, all computers on the communication network are made to erase the address information regarding the execution computer and the standby computer, while
By setting the standby attribute of the execution computer to "standby state" and the standby attribute of the standby computer to "execution state", the standby computer executes the service request issued by the client computer.

【0027】これにより、待機計算機を通信ネットワー
クに加入させたまま、実行計算機と待機計算機の系切り
替えを実現することができる。
With this, it is possible to realize the system switching between the executing computer and the standby computer while the standby computer remains in the communication network.

【0028】[0028]

【実施例】以下、本発明の構成について、実施例ととも
に説明する。
EXAMPLES The structure of the present invention will be described below with reference to examples.

【0029】なお、実施例を説明するための全図におい
て、同一機能を有するものは同一符号を付け、その繰り
返しの説明は省略する。
In all the drawings for explaining the embodiments, those having the same function are designated by the same reference numerals, and the repeated description thereof will be omitted.

【0030】図1は、本発明を適用した分散処理システ
ムの一実施例を示す構成図であり、100はクライアン
ト計算機、140はクライアントプログラム、130は
クライアント計算機100のネームサービスである。
FIG. 1 is a block diagram showing an embodiment of a distributed processing system to which the present invention is applied. 100 is a client computer, 140 is a client program, and 130 is a name service of the client computer 100.

【0031】200は実行計算機、210は障害を検知
し計算機切り替え信号を出す切り替えモニタ、220は
実行計算機200のオンライン制御プログラム、221
はオンライン制御プログラム220の配下にあるサーバ
プロセス、230はサーバプロセス221のアドレス情
報が登録されているネームサービスである。
Reference numeral 200 is an execution computer, 210 is a switching monitor which detects a failure and outputs a computer switching signal, 220 is an online control program for the execution computer 200, 221
Is a server process under the online control program 220, and 230 is a name service in which the address information of the server process 221 is registered.

【0032】300は待機計算機、310は障害を検知
し計算機切り替え信号を出す切り替えモニタ、320は
待機計算機300のオンライン制御プログラム、321
及び322はオンライン制御プログラム320の配下に
あるサーバプロセス、330はサーバプロセス321の
アドレス情報が登録されているネームサービスである。
Reference numeral 300 is a standby computer, 310 is a switching monitor which detects a failure and outputs a computer switching signal, 320 is an online control program for the standby computer 300, 321
And 322 are server processes under the control of the online control program 320, and 330 is a name service in which the address information of the server process 321 is registered.

【0033】500は実行計算200の切り替えモニタ
210と待機計算機300の切り替えモニタ300を結
ぶ系切り替え連絡回線、400はTCP/IPプロトコ
ルによる通信ネットワークである。
Reference numeral 500 is a system switching communication line connecting the switching monitor 210 of the execution calculation 200 and the switching monitor 300 of the standby computer 300, and 400 is a communication network using the TCP / IP protocol.

【0034】図2は、ネットワーク内のネームサービス
が有するアドレス情報であり、610はサーバ名称(計
算機名称)フィールド、620はIPアドレスフィール
ド、630は計算機内サーバプロセスアドレスフィール
ド、640は待機属性フィールドである。
FIG. 2 shows address information possessed by the name service in the network. 610 is a server name (computer name) field, 620 is an IP address field, 630 is a server process address in computer, and 640 is a standby attribute field. is there.

【0035】次に、本実施例の分散処理システムの動作
を、図3および図4に示す動作シーケンス図にもとづき
説明すると、実行計算機200が正常に動作している状
態においては、図3に示すように、クライアントプログ
ラム140がネームサービス130にサーバ名称をキー
に、要求するサービスを提供するサーバプロセス221
のアドレス情報を問い合わせる(S301)。
Next, the operation of the distributed processing system of this embodiment will be described with reference to the operation sequence diagrams shown in FIGS. 3 and 4, and when the execution computer 200 is operating normally, it is shown in FIG. As described above, the client process 140 uses the server name as a key for the name service 130 to provide the requested service to the server process 221.
Is inquired about the address information (S301).

【0036】すると、ネームサービス130は、以前記
憶したアドレス情報内に、サーバプロセス221のアド
レス情報があるか調べ、該当するアドレス情報が無い場
合、通信ネットワーク400で接続されている他の計算
機に、サーバ名称をキーにサーバプロセス221のアド
レス情報を問い合わせる(S302、S303)。
Then, the name service 130 checks whether or not the address information of the server process 221 is included in the previously stored address information, and if there is no corresponding address information, another computer connected by the communication network 400, Inquiry is made about the address information of the server process 221 using the server name as a key (S302, S303).

【0037】このとき、実行計算機200および待機計
算機300には同じサーバ名称が設定されているため、
図3に示すように、実行計算機200及び待機計算機3
00のネームサービス230及び330がそれぞれアド
レス情報を返信する(S304、S305)。
At this time, since the same server name is set in the executing computer 200 and the standby computer 300,
As shown in FIG. 3, the execution computer 200 and the standby computer 3
The name services 230 and 330 of 00 each return address information (S304, S305).

【0038】そこで、ネームサービス130は、返信さ
れてきた2つのアドレス情報の待機属性フィールド64
0の内容を調べ、「実行状態」となっている実行計算機
200のサーバプロセス221のアドレス情報を取得す
る。
Therefore, the name service 130 uses the standby attribute field 64 of the two pieces of returned address information.
The contents of 0 are checked, and the address information of the server process 221 of the execution computer 200 in the "execution state" is acquired.

【0039】ここで、ネームサービス130は、アドレ
ス情報をクライアントプログラム140に返信すると共
に、また次にクライアントプログラム140より同じ要
求が来たときのために記憶する(S306)。
Here, the name service 130 returns the address information to the client program 140, and stores the address information in case the same request comes from the client program 140 next time (S306).

【0040】クライアントプログラム140は、ネーム
サービス130のアドレス情報にもとづき、実行計算機
200のサーバプロセス221にサービス要求を出す
(S307)。
The client program 140 issues a service request to the server process 221 of the execution computer 200 based on the address information of the name service 130 (S307).

【0041】そして、次回、同じ要求が来たときには、
ネームサービス130は今記憶したアドレス情報をもと
に、クライアントプログラム140に実行計算機200
のサーバプロセス221のアドレス情報を返信する(S
308、S309、S310)。
Then, next time the same request comes in,
The name service 130 causes the client computer 140 to execute the execution computer 200 based on the address information just stored.
Address information of the server process 221 of
308, S309, S310).

【0042】一方、待機計算機300は常に利用可能な
状態にある。
On the other hand, the standby computer 300 is always available.

【0043】ここで、図3中のCにもとづいて、実行計
算機200の正常動作中に待機計算機300に処理要求
を行う場合の動作について説明する。
The operation for making a processing request to the standby computer 300 during normal operation of the execution computer 200 will now be described with reference to C in FIG.

【0044】まず、クライアント計算機100のクライ
アントプログラム140がネームサービス130にサー
バ名称をキーに、要求するサービスを提供するサーバプ
ロセス322のアドレス情報を問い合わせる(S31
1)。
First, the client program 140 of the client computer 100 inquires of the name service 130 about the address information of the server process 322 which provides the requested service, using the server name as a key (S31).
1).

【0045】すると、ネームサービス130は、以前記
憶したアドレス情報内に、サーバプロセス322のアド
レス情報があるか調べ、該当するアドレス情報が無い場
合、通信ネットワーク400で接続されている他の計算
機に、サーバ名称をキーにサーバプロセス322のアド
レス情報を問い合わせる(S312、S313)。
Then, the name service 130 checks whether or not the address information of the server process 322 is included in the previously stored address information, and if there is no corresponding address information, another computer connected via the communication network 400 Inquiry is made about the address information of the server process 322 using the server name as a key (S312, S313).

【0046】このとき、実行計算機200および待機計
算機300には同じサーバ名称が設定されているため、
実行計算機200及び待機計算機300のネームサービ
ス230及び330がそれぞれアドレス情報を返信する
(S314、S315)。
At this time, since the same server name is set in the executing computer 200 and the standby computer 300,
The name services 230 and 330 of the executing computer 200 and the standby computer 300 respectively return the address information (S314, S315).

【0047】そこで、ネームサービス130は、返信さ
れてきた2つのアドレス情報の待機属性フィールド64
0の内容を調べ、「待機状態」となっている待機計算機
300のサーバプロセス322のアドレス情報を得る。
ここで、ネームサービス130は、アドレス情報をクラ
イアントプログラム140に返信する(S316)。
Therefore, the name service 130 uses the standby attribute field 64 of the two pieces of returned address information.
By checking the content of 0, the address information of the server process 322 of the standby computer 300 in the "standby state" is obtained.
Here, the name service 130 returns the address information to the client program 140 (S316).

【0048】クライアントプログラム140は、ネーム
サービス130のアドレス情報にもとづき、待機計算機
300のサーバプロセス322にサービス要求を出す
(S317)。
The client program 140 issues a service request to the server process 322 of the standby computer 300 based on the address information of the name service 130 (S317).

【0049】これによって、待機計算機300が待機状
態であっても、クライアント計算機100から必要に応
じて待機計算機300に対し必要な処理を実行させ、待
機計算機300の計算機資源を有効に活用することがで
きる。
As a result, even if the standby computer 300 is in the standby state, the client computer 100 can cause the standby computer 300 to execute necessary processing as needed, and the computer resources of the standby computer 300 can be effectively utilized. it can.

【0050】この場合、待機計算機300は「待機」と
いう性格を基本的に維持させることが必要であるので、
クライアント計算機100は「待機」という性格が保た
れるように、例えば時間を制限して処理を依頼する。
In this case, since the standby computer 300 basically needs to maintain the character of "standby",
The client computer 100 requests processing, for example, by limiting the time so that the character “waiting” can be maintained.

【0051】この結果、待機計算機300には「待機」
という性格を維持させつつ、必要な処理を一時的に実行
させることができる。
As a result, the standby computer 300 has a "standby" status.
While maintaining this character, it is possible to temporarily execute the necessary processing.

【0052】次に、実行計算機200に障害が発生した
場合を図4にもとづき説明すると、まず、実行計算機2
00の切り替えモニタ回路210が障害を検知すると、
通信ネットワーク400内の全計算機(ここでは、クラ
イアント計算機100)に対し、実行計算機200に関
するアドレス情報を消去するようにブロードキャストす
る(S401、S402)。これにより、ネームサービ
ス130内に記憶されていた実行計算機200のアドレ
ス情報は消去される。
Next, the case where a failure occurs in the execution computer 200 will be described with reference to FIG.
When the switching monitor circuit 210 of 00 detects a failure,
Broadcast to all computers (here, the client computer 100) in the communication network 400 so as to erase the address information regarding the executing computer 200 (S401, S402). As a result, the address information of the execution computer 200 stored in the name service 130 is deleted.

【0053】次に、実行計算機200のネームサービス
230の持つアドレステーブルの待機属性フィールドを
「実行状態」より「待機状態」に書き換える(S40
3)。
Next, the standby attribute field of the address table of the name service 230 of the execution computer 200 is rewritten from "execution state" to "standby state" (S40).
3).

【0054】一方、切り替えモニタ回路210は、計算
機切り替え信号専用回線500により待機計算機300
に障害発生を伝達する。これを受け、待機計算機300
のネームサービス330は、アドレステーブルの待機属
性フィールドを「待機状態」から「実行状態」に書き換
える。以上で、実行計算機200から待機計算機300
への系切り替えが完了する(S404、S405)。
On the other hand, the switching monitor circuit 210 uses the computer switching signal dedicated line 500 to connect the standby computer 300.
Communicate the occurrence of failure to. In response to this, the standby computer 300
Name service 330 rewrites the standby attribute field of the address table from “standby state” to “execution state”. Thus, the execution computer 200 to the standby computer 300
The system switching to is completed (S404, S405).

【0055】前記処理の終了後、図3のA同様、クライ
アント計算機100のクライアントプログラム140が
サーバ名称をキーにサーバプロセス221のアドレス情
報をネームサービス130に問い合わせると、記憶して
いたアドレス情報は消去したため、再び、通信ネットワ
ーク400で接続されている他の計算機(実行計算機2
00及び待機計算機300)に、サーバ名称をキーにサ
ーバプロセス221のアドレス情報を問い合わせる(S
406、S407、S408)。
When the client program 140 of the client computer 100 inquires of the name service 130 about the address information of the server process 221 using the server name as a key after the above processing is completed, the stored address information is deleted. Therefore, another computer (execution computer 2) connected to the communication network 400 again.
00 and the standby computer 300) for the address information of the server process 221 using the server name as a key (S
406, S407, S408).

【0056】このとき、実行計算機200が障害が発生
したまま稼働していると、前記同様、実行計算機200
及び待機計算機300のネームサービス230及び33
0がそれぞれアドレス情報を返答する(S409、S4
10)。
At this time, if the execution computer 200 is operating with a failure, the execution computer 200 is operated as described above.
And the name services 230 and 33 of the standby computer 300
0 returns address information (S409, S4)
10).

【0057】そこで、再びネームサービス130は、返
答されてきたアドレス情報のうち、「実行状態」となっ
ているアドレス情報を得るために、アドレス情報内の待
機属性テーブル640を調べ、「実行状態」となってい
る待機計算機300のサーバプロセス321のアドレス
情報を得る。ネームサービス130はこの待機計算機3
00のサーバプロセス321のアドレス情報をクライア
ントプログラム140に返答し、次回要求のために記憶
する(S411)。
Then, again, the name service 130 checks the standby attribute table 640 in the address information to obtain the address information in the "execution state" among the returned address information, and checks the "execution state". The address information of the server process 321 of the standby computer 300 that is The name service 130 is the standby computer 3
The address information of the server process 321 of 00 is returned to the client program 140 and stored for the next request (S411).

【0058】そして、クライアントプログラム140
は、このアドレス情報にもとづき待機計算機300にサ
ービス要求を出す。次回からは、図4のEに示すよう
に、クライアント計算機100のネームサービス130
の記憶しているアドレス情報に基づき、クライアントプ
ログラム140は直接待機計算機300のサーバプロセ
ス321にサービス要求を行う(S412)。
Then, the client program 140
Issues a service request to the standby computer 300 based on this address information. From the next time, as shown in E of FIG. 4, the name service 130 of the client computer 100
The client program 140 directly makes a service request to the server process 321 of the standby computer 300 based on the address information stored by the client computer 140 (S412).

【0059】以上で、待機計算機300が実行状態にな
り、実行計算機200の点検及び修理が可能となり、復
旧した実行計算機200は今度は実行状態にある待機計
算機300のバックアップを行うこととなり、実行計算
機200と待機計算機300の役割が交代することにな
る。
As described above, the standby computer 300 becomes the running state, the running computer 200 can be inspected and repaired, and the restored running computer 200 now backs up the running computer 300 in the running state. The roles of 200 and standby computer 300 will change.

【0060】ただし、実行計算機200が復旧した時点
で、ネットワーク管理者が再び実行計算機200を実行
状態にし、待機計算機300を待機状態に戻せることは
言うまでもない。
However, it goes without saying that at the time when the execution computer 200 is restored, the network administrator can put the execution computer 200 into the execution state again and return the standby computer 300 to the standby state.

【0061】以上動作からも明らかなように、実行計算
機200に障害が発生するまでは、待機計算機300の
計算機資源をクライアント計算機100から必要に応じ
て有効に活用することができる。
As is clear from the above operation, the computer resources of the standby computer 300 can be effectively utilized from the client computer 100 as needed until a failure occurs in the execution computer 200.

【0062】以上、本発明者によってなされた発明を、
前記実施例に基づき具体的に説明したが、本発明は、前
記実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能であることは勿論であ
る。
As described above, the invention made by the present inventor is
Although the present invention has been specifically described based on the above-mentioned embodiments, the present invention is not limited to the above-mentioned embodiments, and it goes without saying that various modifications can be made without departing from the scope of the invention.

【0063】[0063]

【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、下
記のとおりである。
The effects obtained by the typical ones of the inventions disclosed in the present application will be briefly described as follows.

【0064】待機計算機に通信ネットワーク上で計算機
を特定するアドレスをもたせ、実行計算機及び待機計算
機の切り替えを、アドレス情報に基づきクライアント計
算機が行うことにより、実行計算機が正常に動作してい
る間は、通信ネットワークに接続された他の計算機で、
待機計算機としての性格を維持しつつ、必要に応じて有
効に利用することが可能となる。
The standby computer is given an address for specifying the computer on the communication network, and the execution computer and the standby computer are switched by the client computer based on the address information, so that while the execution computer is operating normally, With another computer connected to the communication network,
It is possible to use it effectively as needed while maintaining the character as a standby computer.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例である系切り替え方法を用い
た分散処理システムの構成図である。
FIG. 1 is a configuration diagram of a distributed processing system using a system switching method according to an embodiment of the present invention.

【図2】実施例の計算機のネームサービスが持つアドレ
ステーブルを示す図である。
FIG. 2 is a diagram showing an address table of a name service of a computer according to the embodiment.

【図3】実施例の分散処理システムの正常時における動
作シーケンスを示す図である。
FIG. 3 is a diagram showing an operation sequence of the distributed processing system according to the embodiment at a normal time.

【図4】実施例の分散処理システムの障害発生時におけ
る動作シーケンスを示す図である。
FIG. 4 is a diagram showing an operation sequence when a failure occurs in the distributed processing system according to the embodiment.

【図5】従来の系切り替え方法を用いた分散処理システ
ムの構成図である。
FIG. 5 is a configuration diagram of a distributed processing system using a conventional system switching method.

【図6】従来例の計算機のネームサービスが持つアドレ
ステーブルを示す図である。
FIG. 6 is a diagram showing an address table included in a name service of a computer of a conventional example.

【符号の説明】[Explanation of symbols]

100…クライアント計算機、130…ネームサービ
ス、140…クライアントプログラム、200…実行計
算機、210…切り替えモニタ、220…オンライン制
御プログラム、221…サーバプロセス、230…ネー
ムサービス、300…待機計算機、310…切り替えモ
ニタ、320…オンライン制御プログラム、321、3
22…サーバプロセス、330…ネームサービス、40
0…通信ネットワーク、500…系切り替え連絡回線、
610…サーバ名称フィールド、620…IPアドレス
フィールド、630…計算機内サーバプロセスアドレス
フィールド、640…待機属性フィールド。
100 ... Client computer, 130 ... Name service, 140 ... Client program, 200 ... Execution computer, 210 ... Switching monitor, 220 ... Online control program, 221 ... Server process, 230 ... Name service, 300 ... Standby computer, 310 ... Switching monitor , 320 ... Online control program, 321, 3
22 ... Server process, 330 ... Name service, 40
0 ... communication network, 500 ... system switching communication line,
610 ... Server name field, 620 ... IP address field, 630 ... In-computer server process address field, 640 ... Standby attribute field.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 クライアント計算機に対し、通信ネット
ワークで接続される実行計算機と該実行計算機の待機系
となる待機計算機とを備え、前記実行計算機の障害発生
時は該実行計算機に代えて前記待機計算機に分散処理を
実行させる分散処理システムにおいて、前記クライアン
ト計算機に、前記実行計算機及び待機計算機を特定する
アドレス情報と実行系か待機系かを区別する属性情報と
を予め登録しておき、前記属性情報が実行系を示してい
る実行計算機の障害発生時は障害が発生した実行計算機
を特定する前記アドレス情報を消去した後、前記属性情
報が待機状態となっている待機計算機に必要な分散処理
を実行させることを特徴とする分散処理システムの系切
り替え制御方法。
1. A client computer, comprising: an execution computer connected by a communication network; and a standby computer serving as a standby system for the execution computer. When a failure occurs in the execution computer, the standby computer is replaced with the execution computer. In the distributed processing system for executing distributed processing, the client computer is preregistered with address information for specifying the executing computer and the standby computer and attribute information for distinguishing between the active system and the standby system. Indicates the active system.When a failure occurs in the execution computer, the address information that identifies the execution computer where the failure occurred is deleted, and then the distributed processing required for the standby computer whose attribute information is in the standby state is executed. A system switching control method for a distributed processing system, comprising:
JP6226450A 1994-09-21 1994-09-21 System switching control method for distributed processing system Pending JPH0895932A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6226450A JPH0895932A (en) 1994-09-21 1994-09-21 System switching control method for distributed processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6226450A JPH0895932A (en) 1994-09-21 1994-09-21 System switching control method for distributed processing system

Publications (1)

Publication Number Publication Date
JPH0895932A true JPH0895932A (en) 1996-04-12

Family

ID=16845293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6226450A Pending JPH0895932A (en) 1994-09-21 1994-09-21 System switching control method for distributed processing system

Country Status (1)

Country Link
JP (1) JPH0895932A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007251818A (en) * 2006-03-17 2007-09-27 Fujitsu Ltd Program, method and device for transmission control
US7305434B2 (en) 2001-05-22 2007-12-04 Risei Notsu Terminal group image recognition system
JP2008305070A (en) * 2007-06-06 2008-12-18 Hitachi Communication Technologies Ltd Information processor and information processor system
JP2009003491A (en) * 2007-06-19 2009-01-08 Hitachi Ltd Server switching method in cluster system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7305434B2 (en) 2001-05-22 2007-12-04 Risei Notsu Terminal group image recognition system
JP2007251818A (en) * 2006-03-17 2007-09-27 Fujitsu Ltd Program, method and device for transmission control
JP2008305070A (en) * 2007-06-06 2008-12-18 Hitachi Communication Technologies Ltd Information processor and information processor system
US8032786B2 (en) 2007-06-06 2011-10-04 Hitachi, Ltd. Information-processing equipment and system therefor with switching control for switchover operation
JP2009003491A (en) * 2007-06-19 2009-01-08 Hitachi Ltd Server switching method in cluster system

Similar Documents

Publication Publication Date Title
US6868442B1 (en) Methods and apparatus for processing administrative requests of a distributed network application executing in a clustered computing environment
US7350098B2 (en) Detecting events of interest for managing components on a high availability framework
CN100485676C (en) Apparatus, system, and method for file system serialization reinitialization
US6021507A (en) Method for a non-disruptive host connection switch after detection of an error condition or during a host outage or failure
US6857082B1 (en) Method for providing a transition from one server to another server clustered together
US8713352B2 (en) Method, system and program for securing redundancy in parallel computing system
US20070244999A1 (en) Method, apparatus, and computer product for updating software
US20060123121A1 (en) System and method for service session management
US20110185228A1 (en) Remedying method for troubles in virtual server system and system thereof
US7899897B2 (en) System and program for dual agent processes and dual active server processes
US8082344B2 (en) Transaction manager virtualization
US20030135617A1 (en) Intelligent system control agent
EP2645635B1 (en) Cluster monitor, method for monitoring a cluster, and computer-readable recording medium
US7093163B2 (en) Processing takeover method in multiple computer system
CN110677280A (en) Service node switching method, device, equipment and computer readable storage medium
JPH11259326A (en) Hot standby system, automatic re-execution method for the same and storage medium therefor
US20040216126A1 (en) Method, system, and article of manufacture for agent processing
JPH0895932A (en) System switching control method for distributed processing system
US5613133A (en) Microcode loading with continued program execution
JPH08235132A (en) Hot stand-by control method for multiserver system
US20080229315A1 (en) Distributed processing program, system, and method
US20050160242A1 (en) Asynchronous hybrid mirroring system
JP2002149439A (en) Method for switching server and server device in distributed processing system
JP2007164494A (en) Information output method, system and program
JP2001084234A (en) On-line processing system