JP2000347959A - Cluster system and its switching method at fault time - Google Patents

Cluster system and its switching method at fault time

Info

Publication number
JP2000347959A
JP2000347959A JP11161698A JP16169899A JP2000347959A JP 2000347959 A JP2000347959 A JP 2000347959A JP 11161698 A JP11161698 A JP 11161698A JP 16169899 A JP16169899 A JP 16169899A JP 2000347959 A JP2000347959 A JP 2000347959A
Authority
JP
Japan
Prior art keywords
cluster
client
server device
server
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11161698A
Other languages
Japanese (ja)
Inventor
Naoteru Shimizu
直輝 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Aerospace Systems Ltd
Original Assignee
NEC Aerospace Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Aerospace Systems Ltd filed Critical NEC Aerospace Systems Ltd
Priority to JP11161698A priority Critical patent/JP2000347959A/en
Publication of JP2000347959A publication Critical patent/JP2000347959A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To switch the connection of a cluster client device to a substitute cluster configuration server device under the leadership of a cluster management server device when the cluster configuration server device has a fault. SOLUTION: A cluster management server device 100 collects previously the information on a cluster client device 310 that is managed by a cluster configuration server device 210. When a fault of the device 210 is detected, the device 100 decides a substitute cluster configuration server device 220 and switches the connection of the device 310 managed by the device 210 to the device 220 to reconfigure a cluster system. Thus, it is possible to reconfigure a cluster system by scattering the load of a cluster configuration server device and also to operate the cluster system without stopping it when the cluster configuration server device has a fault.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数のコンピュー
タで構成されるクラスタシステムにおいて、一のコンピ
ュータに障害が発生しても、他のコンピュータがバック
アップを行い、運用を中断することなく継続できるクラ
スタシステムおよびその障害時切り替え方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a cluster system comprising a plurality of computers, in which even if a failure occurs in one computer, another computer can perform backup and continue operation without interruption. The present invention relates to a system and a switching method at the time of failure.

【0002】[0002]

【従来の技術】図6は、従来のクラスタシステムの構成
を示す図である。図6において、10,11はクラスタ
クライアント装置20,21を管理するクラスタサーバ
ー装置であり、クラスタクライアント装置20,21は
クラスタサーバー装置10,11からサービスの提供を
受ける。このような構成を有する従来のクラスタシステ
ムは次のように動作する。すなわち、クラスタサーバー
装置10に障害が発生した場合、クラスタクライアント
装置20,21は現在サービスを受けているクラスタサ
ーバー装置10の代替として利用可能なクラスタサーバ
ー装置11を探し、クラスタサーバー装置10からクラ
スタサーバー装置11に切り替えて接続する。しかし、
この従来技術によるクラスタシステムでは、クラスタク
ライアント装置20,21の主導による接続であるた
め、どのクラスタサーバー装置に接続すべきかをクラス
タクライアント装置20,21に指示することができな
い。そのため、クラスタサーバー装置が3台以上の場合
において、クラスタサーバー装置が障害になった場合
に、クラスタサーバー装置の負荷が均等になるように代
替のクラスタサーバー装置を選択することができず、ク
ラスタサーバー装置の負荷分散が不可能であるという問
題があった。
2. Description of the Related Art FIG. 6 is a diagram showing a configuration of a conventional cluster system. In FIG. 6, reference numerals 10 and 11 denote cluster server devices that manage the cluster client devices 20 and 21, and the cluster client devices 20 and 21 receive services from the cluster server devices 10 and 11. The conventional cluster system having such a configuration operates as follows. That is, when a failure occurs in the cluster server device 10, the cluster client devices 20 and 21 search for a cluster server device 11 that can be used as a substitute for the cluster server device 10 currently receiving a service, and the cluster server device 10 and Switch to device 11 and connect. But,
In the cluster system according to the related art, since the connection is led by the cluster client devices 20 and 21, it is not possible to instruct the cluster client devices 20 and 21 to which cluster server device to connect. Therefore, when there are three or more cluster server devices, if a cluster server device fails, an alternative cluster server device cannot be selected so that the load on the cluster server device becomes equal, and the cluster server device cannot be selected. There is a problem that load distribution of the apparatus is impossible.

【0003】また、特開平06−274433号公報に
記載されている従来の技術は、サーバークライアントモ
デルのかな漢字変換サーバの負荷情報を収集し、この負
荷情報をもとに低い負荷状態にあるかな漢字変換サーバ
ーにクライアントを接続するようにして、かな漢字変換
サーバーの負荷を分散し、特定のかな漢字変換サーバー
に負荷が集中しないようにするものである。
A conventional technique described in Japanese Patent Application Laid-Open No. 06-274433 collects load information of a kana-kanji conversion server of a server client model, and converts kana-kanji conversion in a low load state based on this load information. By connecting a client to the server, the load on the kana-kanji conversion server is distributed so that the load is not concentrated on a specific kana-kanji conversion server.

【0004】特開平09−167140号公報に記載さ
れている従来の技術は、親サーバーから子サーバーに転
送する作業データの振り分けを、親サーバーに対して指
示する作業進行管理サーバーを設けることにより、クラ
イアント側のデータ処理作業を効率良く行うことができ
るようにしたものである。
The prior art described in Japanese Patent Application Laid-Open No. 09-167140 discloses a work progress management server that instructs a parent server to distribute work data to be transferred from a parent server to a child server. The data processing work on the client side can be performed efficiently.

【0005】そして、特開平10−320184号公報
に記載されている従来の技術は、バージョン管理サーバ
ー、メタサーバーおよび複数のサーバーを設け、バージ
ョン管理サーバーがバージョンアップの作業を管理し、
メタサーバーが自動的に各サーバーのプログラムの起動
や停止を制御するようにしたものであり、プログラムの
バージョンアップを自動化して効率化するものである。
[0005] The prior art described in Japanese Patent Application Laid-Open No. 10-320184 is provided with a version management server, a meta server, and a plurality of servers.
The meta server automatically controls the start and stop of the program of each server, and automates the version upgrade of the program to improve efficiency.

【0006】また、特開平11−055327号公報に
記載されている従来の技術は、複数の代理サーバーを有
するネットワークにおいて、接続制御サーバーを設け、
クライアントからの代理サーバー接続要求に対して、各
代理サーバーの負荷を検出して、検出した負荷に基づい
て最も負荷の低い代理サーバーに接続するように制御す
るものであり、各代理サーバーの負荷を分散し、またコ
ンピュータ資源の効果的な運用を図るものである。
[0006] Further, in the conventional technology described in Japanese Patent Application Laid-Open No. H11-055327, a connection control server is provided in a network having a plurality of proxy servers,
In response to a proxy server connection request from a client, the load on each proxy server is detected, and based on the detected load, control is performed to connect to the least loaded proxy server. Distributed and effective use of computer resources.

【0007】以上に述べたように、従来の技術は、いず
れもサーバー装置に障害が発生した場合に、サーバー装
置側の主導により代替のサーバー装置を決定し、障害の
発生したサーバー装置に接続されていたクライアント装
置を代替のサーバー装置に接続替えしてクラスタシステ
ムを再構成するものではない。
As described above, in the conventional techniques, when a failure occurs in a server device, an alternative server device is determined under the initiative of the server device side and connected to the failed server device. It does not reconfigure the cluster system by connecting the client device to the alternative server device.

【0008】[0008]

【発明が解決しようとする課題】本発明は、上記の問題
に鑑みてなされたもので、サーバー装置に障害が発生し
た場合に、サーバー装置側の主導により代替のサーバー
装置を決定し、障害の発生したサーバー装置に接続され
ていたクライアント装置を代替のサーバー装置に接続替
えしてクラスタシステムを再構成する、クラスタシステ
ムおよびその障害時切り替え方法を提供することを目的
とする。
SUMMARY OF THE INVENTION The present invention has been made in view of the above problems, and when a failure occurs in a server device, an alternative server device is determined under the initiative of the server device, and the failure is determined. It is an object of the present invention to provide a cluster system and a failure switching method for reconfiguring a cluster system by reconnecting a client device connected to the generated server device to an alternative server device.

【0009】[0009]

【課題を解決するための手段】上記目的を達成するため
に、請求項1に記載の発明は、複数のサーバー装置と前
記各サーバー装置に接続された複数のクライアント装置
からなるクラスタシステムの障害時切り替え方法におい
て、上記サーバー装置の中の特定のサーバー装置は上記
各サーバー装置が管理している前記クライアント装置の
情報を収集しておき、上記特定のサーバー装置が上記一
のサーバー装置の障害を検出した場合に、前記特定のサ
ーバー装置は前記情報を基に1台以上の代替のサーバー
装置を決定し、前記1台以上の代替のサーバー装置に対
して上記一のサーバー装置で管理されていた前記クライ
アント装置を追加して管理するように通知し、前記1台
以上の代替のサーバー装置は通知された前記クライアン
ト装置を追加して管理するように制御することを特徴と
する。
In order to achieve the above-mentioned object, the present invention is directed to a system for managing a failure of a cluster system including a plurality of server devices and a plurality of client devices connected to each of the server devices. In the switching method, a specific server device among the server devices collects information of the client devices managed by the respective server devices, and the specific server device detects a failure of the one server device. In this case, the specific server device determines one or more alternative server devices based on the information, and the one or more alternative server devices are managed by the one server device. Notifying the client device to be added and managed, and the one or more alternative server devices add the notified client device and And controls so that sense.

【0010】請求項2に記載の発明は、請求項1に記載
のクラスタシステムの障害時切り替え方法において、前
記情報は、前記各サーバー装置の負荷情報であることを
特徴とする。
According to a second aspect of the present invention, in the failure switching method for a cluster system according to the first aspect, the information is load information of each of the server devices.

【0011】請求項3に記載の発明は、各クラスタ構成
サーバー装置が管理しているクライアント装置の情報を
収集し、前記一のクラスタ構成サーバー装置の障害を検
出した場合に前記情報を基に前記一のクラスタ構成サー
バー装置が管理していた前記クライアント装置を代わっ
て管理する前記他の1台以上のクラスタ構成サーバー装
置を決定し、前記他の1台以上のクラスタ構成サーバー
装置に前記クライアント装置を追加して管理するように
通知するクラスタ構成管理手段を少なくとも備えたクラ
スタ管理サーバー装置と、前記クラスタ管理サーバー装
置に接続され、クライアント装置を管理し、前記クラス
タ管理サーバー装置からの問い合わせにより管理してい
るクライアント装置を報告し、またクラスタ管理サーバ
ー装置からの指示により管理する前記クライアント装置
を追加または削除するクライアント管理手段を少なくと
も備えたクラスタ構成サーバー装置と、前記一のクラス
タ構成サーバー装置からの指示により、前記一のクラス
タ構成サーバー装置と接続または接続解除するクライア
ント通信手段を少なくとも備えたクライアント装置とを
具備することを特徴とする。
According to a third aspect of the present invention, when information on a client device managed by each cluster configuration server device is collected and a failure of the one cluster configuration server device is detected, the information is collected based on the information. One or more other cluster configuration server devices to be managed in place of the client device managed by one cluster configuration server device are determined, and the client device is assigned to the other one or more cluster configuration server devices. A cluster management server device having at least a cluster configuration management means for notifying that it is additionally managed; and a client device connected to the cluster management server device for managing the client device and managing the client device by an inquiry from the cluster management server device. Reports the client device that is running, and gives instructions from the cluster management server device. A cluster configuration server device having at least client management means for adding or deleting the client device to be managed, and a client connecting or disconnecting from the one cluster configuration server device according to an instruction from the one cluster configuration server device And a client device having at least communication means.

【0012】請求項4に記載の発明は、請求項3に記載
のクラスタシステムにおいて、前記情報は、前記各クラ
スタ構成サーバー装置の負荷情報であることを特徴とす
る。
According to a fourth aspect of the present invention, in the cluster system according to the third aspect, the information is load information of each of the cluster configuration server devices.

【0013】[0013]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は本発明の第1の実施の形態
によるクラスタシステムの構成を示すブロック図であ
る。図1において、100はクラスタシステムの構成を
管理するクラスタ管理サーバー装置、101はクラスタ
構成サーバー装置210,220から情報を収集し、ク
ラスタシステムの構成や変更を行うクラスタ構成管理手
段である。クラスタ構成サーバー装置210,220は
クラスタを構成し、クラスタクライアント装置310,
320にサービスを提供する。211,221はクラス
タ構成管理手段101からのクラスタクライアント管理
追加要求またはクラスタクライアント管理削除要求に基
づいて、クラスタクライアント装置310,320を管
理対象として追加または削除して管理するクラスタクラ
イアント管理手段である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of the cluster system according to the first embodiment of the present invention. In FIG. 1, reference numeral 100 denotes a cluster management server device for managing the configuration of a cluster system, and 101 denotes a cluster configuration management means for collecting information from the cluster configuration server devices 210 and 220 and performing configuration and change of the cluster system. The cluster configuration server devices 210 and 220 form a cluster, and the cluster client devices 310 and 220
The service is provided to 320. Cluster client management units 211 and 221 add and delete cluster client devices 310 and 320 as management targets based on a cluster client management addition request or a cluster client management deletion request from the cluster configuration management unit 101 and manage them.

【0014】また、クラスタクライアント装置310,
320は、クラスタ構成サーバー装置210またはクラ
スタ構成サーバー装置220からサービスの提供を受け
る。311,321はそれぞれクラスタクライアント管
理手段211またはクラスタクライアント管理手段22
1からの接続要求または切断要求により、クラスタクラ
イアント管理手段211またはクラスタクライアント管
理手段221との接続または切断を行うクラスタクライ
アント通信手段である。
The cluster client device 310,
320 receives a service from the cluster configuration server device 210 or the cluster configuration server device 220. Reference numerals 311 and 321 denote cluster client management means 211 or cluster client management means 22, respectively.
1 is a cluster client communication unit that connects or disconnects with the cluster client management unit 211 or the cluster client management unit 221 in response to a connection request or a disconnection request from the client 1.

【0015】次に、図1、図2を参照して本実施の形態
によるクラスタシステムの基本的な構成動作を説明す
る。図2は図1のクラスタシステムの基本的な構成動作
を示すフローチャートである。クラスタ構成管理手段1
01は、クラスタクライアント管理手段211に対して
問い合わせを行い、クラスタクライアント管理手段21
1が管理しているクラスタクライアント装置の情報を収
集する(S1)。同様にして、クラスタ構成管理手段1
01は、クラスタクライアント管理手段221が管理し
ているクラスタクライアント装置の情報を収集する(S
2,S1)。これにより、クラスタ構成管理手段101
は、現在のクラスタシステムの構成を把握する。
Next, a basic configuration operation of the cluster system according to the present embodiment will be described with reference to FIGS. FIG. 2 is a flowchart showing a basic configuration operation of the cluster system of FIG. Cluster configuration management means 1
01 makes an inquiry to the cluster client management means 211 and
1 collects information on the cluster client devices managed by S1 (S1). Similarly, the cluster configuration management means 1
01 collects information on cluster client devices managed by the cluster client management means 221 (S
2, S1). Thereby, the cluster configuration management unit 101
Grasps the current configuration of the cluster system.

【0016】そして、クラスタ構成管理手段101は、
クラスタクライアント管理手段211,221から収集
した情報を基に判定し、クラスタクライアント管理手段
211およびクラスタクライアント管理手段221が現
在管理しているクラスタクライアント装置が存在しなけ
れば(S3)、先に収集した情報をもとにクラスタ構成
サーバー装置211を決定し、クラスタクライアント管
理手段211に対してクラスタクライアント装置31
0,320を管理するようにクラスタクライアント管理
追加要求を通知する(S4)。クラスタクライアント管
理手段211は、クラスタクライアント管理追加要求を
受け取ると、クラスタクライアン通信手段311,32
1に接続要求を出し、クラスタクライアン通信手段31
1,321との間で接続処理を行う(S4)。これによ
り、クラスタクライアン装置310,320はクラスタ
構成サーバー装置210に接続され、クラスタシステム
が構成される(S4)。
The cluster configuration management means 101
The determination is made based on the information collected from the cluster client management means 211 and 221. If there is no cluster client device currently managed by the cluster client management means 211 and the cluster client management means 221 (S3), the information is collected first. The cluster configuration server device 211 is determined based on the information, and the cluster client device 31 is
A cluster client management addition request is notified to manage 0, 320 (S4). When the cluster client management unit 211 receives the cluster client management addition request, the cluster client communication units 311 and 32
1 sends a connection request to the cluster client communication means 31
A connection process is performed with the first and the second 321 (S4). Thus, the cluster client devices 310 and 320 are connected to the cluster configuration server device 210, and a cluster system is configured (S4).

【0017】一方、クラスタクライアント管理手段21
1またはクラスタクライアント管理手段221が管理し
ているクラスタクライアント装置が存在する場合には、
現状のクラスタシステムの構成を維持し構成変更は行わ
われない(S3)。
On the other hand, the cluster client management means 21
1 or a cluster client device managed by the cluster client management means 221 exists.
The current configuration of the cluster system is maintained and the configuration is not changed (S3).

【0018】次に、図1を参照して本実施形態によるク
ラスタシステムにおいてクラスタ構成サーバー装置21
0に障害が発生した場合のクラスタシステムの構成変更
動作を説明する。クラスタ構成サーバー装置210に障
害が発生した場合、クラスタ管理サーバー装置100の
クラスタ構成管理手段101がクラスタ構成サーバー装
置210の障害を検出する。そして、クラスタ構成管理
手段101は先に収集した情報を基にクラスタシステム
の構成を変更する。すなわち、クラスタ構成管理手段1
01は、先に収集した情報を基に代替のクラスタ構成サ
ーバー装置220を決定し、クラスタクライアント管理
手段211が管理していたクラスタクライアント装置3
10,320をクラスタクライアント管理手段221で
管理するように、クラスタクライアント管理手段221
に対してクラスタクライアント管理追加要求を行う。
Next, referring to FIG. 1, in the cluster system according to the present embodiment,
The operation of changing the configuration of the cluster system when a failure occurs in 0 will be described. When a failure occurs in the cluster configuration server device 210, the cluster configuration management means 101 of the cluster management server device 100 detects the failure of the cluster configuration server device 210. Then, the cluster configuration management unit 101 changes the configuration of the cluster system based on the previously collected information. That is, the cluster configuration management means 1
01 designates an alternative cluster configuration server device 220 based on previously collected information, and the cluster client device 3 managed by the cluster client management means 211.
The cluster client management means 221 is controlled so that the cluster client management means 221 is managed by the cluster client management means 221.
Issue a cluster client management addition request to.

【0019】クラスタクライアント管理手段221は、
クラスタ構成管理手段101からのクラスタクライアン
ト管理追加要求に従い、クラスタクライアント通信手段
311,321に接続要求を行う。クラスタクライアン
ト通信手段311,312は、接続要求を受信すると、
それぞれクラスタクライアント管理手段221との間で
接続処理を行う。これにより、クラスタクライアント装
置310,320は、クラスタ構成サーバー装置200
に接続され、クラスタシステムが再構成される。
The cluster client management means 221 comprises:
In accordance with the cluster client management addition request from the cluster configuration management unit 101, a connection request is made to the cluster client communication units 311 and 321. When the cluster client communication units 311 and 312 receive the connection request,
A connection process is performed with each of the cluster client management units 221. As a result, the cluster client devices 310 and 320 are
And the cluster system is reconfigured.

【0020】次に、本発明の第2の実施形態について、
図3を参照して説明する。図3は同実施の形態によるク
ラスタシステムの構成を示すブロック図である。図3に
おいて、図1と同一部分には同一符号を付してその説明
を省略する。230はクラスタ構成サーバー装置21
0,220と同一構成のクラスタ構成サーバー装置であ
り、また、231はクラスタクライアント管理手段21
1,221と同一構成のクラスタクライアント管理手段
である。330はクラスタクライアント装置310,3
20と同一構成のクラスタクライアント装置であり、3
31はクラスタ通信手段311,321と同一構成のク
ラスタクライアント通信手段である。
Next, a second embodiment of the present invention will be described.
This will be described with reference to FIG. FIG. 3 is a block diagram showing a configuration of the cluster system according to the embodiment. 3, the same parts as those in FIG. 1 are denoted by the same reference numerals, and description thereof will be omitted. 230 is a cluster configuration server device 21
Reference numeral 231 denotes a cluster client server having the same configuration as that of the cluster client management unit 21.
This is a cluster client management unit having the same configuration as that of the cluster client management unit 221. 330 is a cluster client device 310,3
20 is a cluster client device having the same configuration as 20.
Reference numeral 31 denotes a cluster client communication unit having the same configuration as the cluster communication units 311 and 321.

【0021】次に、図3,図4を参照して本実施形態に
よるクラスタシステムの基本的な構成動作を説明する。
図4は図3のクラスタシステムの基本的な構成動作を示
すフローチャートである。クラスタ構成管理手段101
は、クラスタクライアント管理手段211に問い合わせ
を行い、クラスタクライアント管理手段211が現在管
理しているクラスタクライアント装置の情報を収集する
(S11)。同様にして、クラスタ構成管理手段101
は、クラスタクライアント管理手段221,231がそ
れぞれ管理しているクラスタクライアント装置の情報を
収集する(S12,S11)。これにより、クラスタ構
成管理手段101は、現在のクラスタシステムの構成を
把握する。
Next, a basic configuration operation of the cluster system according to the present embodiment will be described with reference to FIGS.
FIG. 4 is a flowchart showing a basic configuration operation of the cluster system of FIG. Cluster configuration management means 101
Makes an inquiry to the cluster client management unit 211 and collects information on the cluster client devices currently managed by the cluster client management unit 211 (S11). Similarly, the cluster configuration management means 101
Collects information on the cluster client devices managed by the cluster client management units 221 and 231, respectively (S12, S11). Thus, the cluster configuration management unit 101 grasps the current configuration of the cluster system.

【0022】そして、クラスタ構成管理手段101は、
クラスタ管理サーバー装置210,220,230から
収集した情報を基に判定し、クラスタクライアント管理
手段211、221,231のすべてにおいて現在管理
しているクラスタクライアント装置が存在しなければ
(S13)、先に収集した情報を基にクラスタ構成サー
バー装置211を決定し、クラスタクライアント管理手
段211に対して、クラスタクライアント装置310,
320を追加して管理するように、クラスタクライアン
ト管理追加要求を通知する(S14)。クラスタクライ
アント管理手段211は、クラスタクライアント管理追
加要求を受け取ると、クラスタクライアン通信手段31
1,321に接続要求を出し、クラスタクライアン通信
手段311,321との間で接続処理を行う。これによ
り、クラスタクライアン装置310,320はクラスタ
構成サーバー装置210に接続され、クラスタシステム
が構成される(S14)。
Then, the cluster configuration management means 101
Judgment is made based on the information collected from the cluster management server devices 210, 220, 230. If there is no cluster client device currently managed by all of the cluster client management means 211, 221, 231 (S13), first, The cluster configuration server device 211 is determined on the basis of the collected information, and the cluster client device 310,
A cluster client management addition request is notified to add and manage 320 (S14). When the cluster client management unit 211 receives the cluster client management addition request, the cluster client communication unit 31
A connection request is issued to the cluster client communication units 311 and 321 to perform connection processing. Thus, the cluster client devices 310 and 320 are connected to the cluster configuration server device 210, and a cluster system is configured (S14).

【0023】一方、クラスタクライアント管理手段21
1,221,231のいずれかで管理しているクラスタ
クライアント装置が存在する場合には、現状のクラスタ
システムの構成を維持し構成変更は行わわれない(S1
3)。
On the other hand, the cluster client management means 21
If there is a cluster client device managed by any of the cluster clients 1, 221, 231 the current cluster system configuration is maintained and the configuration is not changed (S1).
3).

【0024】次に、図3を参照して本実施の形態による
クラスタシステムのクラスタ構成サーバー装置210に
障害が発生した場合のクラスタシステムの構成変更動作
を説明する。クラスタ構成サーバー装置210に障害が
発生した場合、クラスタ構成管理手段101がクラスタ
構成サーバー装置210の障害を検出する。そして、ク
ラスタ構成管理手段101が先に収集した情報を基にク
ラスタシステムの構成を変更する。すなわち、クラスタ
構成管理手段101は、先に収集した情報を基に代替の
クラスタ構成サーバー装置221を決定し、クラスタク
ライアント管理手段211が管理していたクラスタクラ
イアント装置310,320をクラスタクライアント管
理手段221で管理するように、クラスタクライアント
管理手段221にクラスタクライアント管理追加要求を
行う。
Next, with reference to FIG. 3, a description will be given of a configuration change operation of the cluster system when a failure occurs in the cluster configuration server device 210 of the cluster system according to the present embodiment. When a failure occurs in the cluster configuration server device 210, the cluster configuration management means 101 detects the failure of the cluster configuration server device 210. Then, the cluster configuration management unit 101 changes the configuration of the cluster system based on the information previously collected. That is, the cluster configuration management unit 101 determines an alternative cluster configuration server device 221 based on the information collected first, and replaces the cluster client devices 310 and 320 managed by the cluster client management unit 211 with the cluster client management unit 221. A cluster client management addition request is made to the cluster client management means 221 so as to be managed by.

【0025】クラスタクライアント管理手段221は、
クラスタ構成管理手段101からのクラスタクライアン
ト管理追加要求に従い、クラスタクライアント通信手段
311,321に接続要求を行う。クラスタクライアン
ト通信手段311,321は、接続要求を受け取ると、
クラスタクライアント管理手段221と接続処理を行
う。これにより、クラスタクライアント装置310,3
20はクラスタ構成サーバー装置220に接続され、ク
ラスタシステムが再構成される。
The cluster client management means 221 comprises:
In accordance with the cluster client management addition request from the cluster configuration management unit 101, a connection request is made to the cluster client communication units 311 and 321. When the cluster client communication units 311 and 321 receive the connection request,
The connection processing is performed with the cluster client management unit 221. Thereby, the cluster client devices 310 and 3
20 is connected to the cluster configuration server device 220, and the cluster system is reconfigured.

【0026】また、この状態でさらにクラスタ構成サー
バー装置220に障害が発生した場合にも、同様の動作
により、クラスタクライアント装置310,320はク
ラスタ構成サーバー装置230に接続され、クラスタシ
ステムが再構成される。
Further, even if a failure occurs in the cluster configuration server device 220 in this state, the cluster client devices 310 and 320 are connected to the cluster configuration server device 230 by the same operation, and the cluster system is reconfigured. You.

【0027】次に、本発明の第3の実施の形態につい
て、図5を参照して説明する。図5は本実施の形態によ
るクラスタシステムの構成を示すブロック図である。図
5において、図1、図3と同一部分には同一符号を付し
てその説明を省略する。図5において、400はクラス
タプログラムを格納した記録媒体である。このクラスタ
プログラムは、クラスタ管理サーバ装置100、クラス
タ構成サーバー装置210,220,230およびクラ
スタクライアント装置310,320,330を構成す
るコンピュータ(図示せず)の動作を制御する。また、
記録媒体400は磁気ディスク、半導体メモリ、その他
の記録媒体のいずれであってもよい。
Next, a third embodiment of the present invention will be described with reference to FIG. FIG. 5 is a block diagram showing the configuration of the cluster system according to the present embodiment. 5, the same parts as those in FIGS. 1 and 3 are denoted by the same reference numerals, and description thereof will be omitted. In FIG. 5, reference numeral 400 denotes a recording medium storing a cluster program. This cluster program controls operations of computers (not shown) constituting the cluster management server device 100, the cluster configuration server devices 210, 220, 230 and the cluster client devices 310, 320, 330. Also,
The recording medium 400 may be any of a magnetic disk, a semiconductor memory, and another recording medium.

【0028】次に、図5を参照して本実施の形態の動作
を説明する。クラスタプログラムは記録媒体400から
クラスタ管理サーバー装置100、クラスタ構成サーバ
ー装置210,220,230およびクラスタクライア
ント装置310,320,330を構成するコンピュー
タのメモリ(図示せず)に読み込まれる。これにより、
クラスタ管理サーバー装置100、クラスタ構成サーバ
ー装置210,220,230およびクラスタクライア
ント装置310,320,330は、クラスタプログラ
ムの制御により、第1および第2の実施形態におけるク
ラスタ管理サーバー装置100、クラスタ構成サーバー
装置210,220,230およびクラスタクライアン
ト装置310,320,330による処理と同一の処理
を実行する。
Next, the operation of this embodiment will be described with reference to FIG. The cluster program is read from the recording medium 400 into a memory (not shown) of a computer constituting the cluster management server device 100, the cluster configuration server devices 210, 220, 230 and the cluster client devices 310, 320, 330. This allows
The cluster management server device 100, the cluster configuration server devices 210, 220, 230, and the cluster client devices 310, 320, 330 are controlled by a cluster program to control the cluster management server device 100 and the cluster configuration server in the first and second embodiments. The same processing as the processing by the devices 210, 220, 230 and the cluster client devices 310, 320, 330 is executed.

【0029】[0029]

【発明の効果】以上説明したように、この発明によれ
ば、クラスタ管理サーバー装置がクラスタ構成サーバー
装置が管理しているクラスタクライアント装置の情報を
収集しておき、クラスタ構成サーバー装置に障害が発生
した場合に、これをクラスタ管理サーバー装置が検出
し、クラスタ構成サーバー装置が先に収集した情報を基
に代替のクラスタ構成サーバー装置を決定して、障害が
発生したクラスタ構成サーバー装置が管理していたクラ
スタクライアント装置を追加して管理するように制御し
てクラスタシステムを再構成するようにしたので、クラ
スタ構成サーバー装置に障害が発生した場合に、クラス
タ構成サーバー装置の負荷を分散してクラスタシステム
を再構成することができ、また、システムを停止するこ
となく運用を継続することができる。
As described above, according to the present invention, the cluster management server device collects information on the cluster client devices managed by the cluster configuration server device, and a failure occurs in the cluster configuration server device. In this case, the cluster management server detects this, and based on the information previously collected by the cluster configuration server, determines an alternative cluster configuration server and manages it by the failed cluster configuration server. The cluster system is reconfigured by controlling the added cluster client device to manage it. Therefore, when a failure occurs in the cluster configuration server device, the load on the cluster configuration server device is distributed and the cluster system is reconfigured. Can be reconfigured, and operations can be continued without stopping the system Door can be.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 この発明の第1の実施形態によるクラスタシ
ステムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a cluster system according to a first embodiment of the present invention.

【図2】 同実施形態によるクラスタシステムの基本的
な構成動作を示すフローチャートである。
FIG. 2 is a flowchart showing a basic configuration operation of the cluster system according to the embodiment.

【図3】 この発明の第2の実施形態によるクラスタシ
ステムの構成を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of a cluster system according to a second embodiment of the present invention.

【図4】 同実施形態によるクラスタシステムの基本的
な構成動作を示すフローチャートである。
FIG. 4 is a flowchart showing a basic configuration operation of the cluster system according to the embodiment.

【図5】 この発明の第3の実施形態によるクラスタシ
ステムの構成を示すブロック図である。
FIG. 5 is a block diagram showing a configuration of a cluster system according to a third embodiment of the present invention.

【図6】 従来のクラスタシステムの構成を示すブロッ
ク図である。
FIG. 6 is a block diagram showing a configuration of a conventional cluster system.

【符号の説明】[Explanation of symbols]

10,11…クラスタサーバー装置 20,21…クラスタクライアント装置 100…クラスタ管理サーバー装置 101…クラスタ構成管理手段 210,220,230…クラスタ構成サーバー装置 211,221,231…クラスタクライアント管理手
段 310,320,330…クラスタクライアント装置 311,321,331…クラスタクライアント通信手
段 400…記録媒体
10, 11 ... cluster server device 20, 21 ... cluster client device 100 ... cluster management server device 101 ... cluster configuration management means 210, 220, 230 ... cluster configuration server device 211, 221, 231 ... cluster client management means 310, 320, 330 cluster client device 311, 321, 331 cluster client communication means 400 recording medium

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 複数のサーバー装置と前記各サーバー装
置に接続された複数のクライアント装置からなるクラス
タシステムの障害時切り替え方法において、 上記サーバー装置の中の特定のサーバー装置は上記各サ
ーバー装置が管理している前記クライアント装置の情報
を収集しておき、 上記特定のサーバー装置が上記一のサーバー装置の障害
を検出した場合に、前記特定のサーバー装置は前記情報
を基に1台以上の代替のサーバー装置を決定し、前記1
台以上の代替のサーバー装置に対して上記一のサーバー
装置で管理されていた前記クライアント装置を追加して
管理するように通知し、 前記1台以上の代替のサーバー装置は通知された前記ク
ライアント装置を追加して管理するように制御すること
を特徴とするクラスタシステムの障害時切り替え方法。
1. A failure switching method for a cluster system comprising a plurality of server devices and a plurality of client devices connected to each of the server devices, wherein each server device manages a specific server device among the server devices. Collecting information on the client device, and when the specific server device detects a failure of the one server device, the specific server device may perform one or more alternative server based on the information. Determine the server device, and
Notifying the one or more alternative server devices to add and manage the client device managed by the one server device, the one or more alternative server devices being notified of the client device A method for switching at the time of a failure in a cluster system, characterized in that the system is controlled to be added.
【請求項2】 前記情報は、前記各サーバー装置の負荷
情報であることを特徴とする請求項1に記載のクラスタ
システムの障害時切り替え方法。
2. The method according to claim 1, wherein the information is load information of each of the server devices.
【請求項3】 複数のクラスタ構成サーバー装置が管理
しているクライアント装置の情報を収集し、前記一のク
ラスタ構成サーバー装置の障害を検出した場合に前記情
報を基に前記一のクラスタ構成サーバー装置が管理して
いた前記クライアント装置を代わって管理する前記他の
1台以上のクラスタ構成サーバー装置を決定し、前記他
の1台以上のクラスタ構成サーバー装置に前記クライア
ント装置を追加して管理するように通知するクラスタ構
成管理手段を少なくとも備えたクラスタ管理サーバー装
置と、 前記クラスタ管理サーバー装置に接続され、クライアン
ト装置を管理し、前記クラスタ管理サーバー装置からの
問い合わせにより管理しているクライアント装置を報告
し、またクラスタ管理サーバー装置からの指示により管
理する前記クライアント装置を追加または削除するクラ
イアント管理手段を少なくとも備えたクラスタ構成サー
バー装置と、 前記一のクラスタ構成サーバー装置からの指示により、
前記一のクラスタ構成サーバー装置と接続または接続解
除するクライアント通信手段を少なくとも備えたクライ
アント装置と、 を具備してなるクラスタシステム。
3. Collecting information on a client device managed by a plurality of cluster configuration server devices, and detecting a failure of the one cluster configuration server device based on the information when detecting a failure of the one cluster configuration server device. Determining the other one or more cluster configuration server devices to manage the client device that has been managed by the client device, and adding and managing the client device to the other one or more cluster configuration server devices. A cluster management server device provided with at least a cluster configuration management means for notifying the client device, a client device connected to the cluster management server device, managing the client device, and reporting the client device managed by an inquiry from the cluster management server device. , Which is managed by an instruction from the cluster management server device. And cluster configuration server apparatus having at least a client management unit to add or remove client device, according to an instruction from the one of the cluster configuration server device,
A client device having at least client communication means for connecting to or disconnecting from the one cluster configuration server device.
【請求項4】 前記情報は、前記各クラスタ構成サーバ
ー装置の負荷情報であることを特徴とする請求項3に記
載のクラスタシステム。
4. The cluster system according to claim 3, wherein the information is load information of each of the cluster configuration server devices.
JP11161698A 1999-06-08 1999-06-08 Cluster system and its switching method at fault time Pending JP2000347959A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11161698A JP2000347959A (en) 1999-06-08 1999-06-08 Cluster system and its switching method at fault time

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11161698A JP2000347959A (en) 1999-06-08 1999-06-08 Cluster system and its switching method at fault time

Publications (1)

Publication Number Publication Date
JP2000347959A true JP2000347959A (en) 2000-12-15

Family

ID=15740175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11161698A Pending JP2000347959A (en) 1999-06-08 1999-06-08 Cluster system and its switching method at fault time

Country Status (1)

Country Link
JP (1) JP2000347959A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100420266B1 (en) * 2001-10-23 2004-03-02 한국전자통신연구원 Apparatus and method for improving the availability of cluster computer systems
WO2021034114A1 (en) * 2019-08-21 2021-02-25 주식회사 이노지에스코리아 Method and system for detecting fault-inducing client using fault-corresponding edge server grouping

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100420266B1 (en) * 2001-10-23 2004-03-02 한국전자통신연구원 Apparatus and method for improving the availability of cluster computer systems
WO2021034114A1 (en) * 2019-08-21 2021-02-25 주식회사 이노지에스코리아 Method and system for detecting fault-inducing client using fault-corresponding edge server grouping
US11909577B2 (en) 2019-08-21 2024-02-20 Innogs Korea Corp. Method and system for detecting failure-causing client with failure handling edge server grouping

Similar Documents

Publication Publication Date Title
US9729666B2 (en) Large scale storage system and method of operating thereof
US7430616B2 (en) System and method for reducing user-application interactions to archivable form
CN100544342C (en) Storage system
US7139809B2 (en) System and method for providing virtual network attached storage using excess distributed storage capacity
KR100491541B1 (en) A contents synchronization system in network environment and a method therefor
CN102640108B (en) The monitoring of replicated data
US8856091B2 (en) Method and apparatus for sequencing transactions globally in distributed database cluster
US20070061379A1 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
US20110040799A1 (en) Systems and methods for allocating control of storage media in a network environment
US20040078455A1 (en) Switchable resource management in clustered computer system
JP2006510976A5 (en)
EP1214663B1 (en) Scalable file server with highly available pairs
KR100489690B1 (en) Method for procesing event and controlling real error and modeling database table
US7093163B2 (en) Processing takeover method in multiple computer system
US20070180452A1 (en) Load distributing system and method
JPH09293059A (en) Decentralized system and its operation management method
JP2000347959A (en) Cluster system and its switching method at fault time
CN111367711A (en) Safety disaster recovery method based on super fusion data
WO2006043322A1 (en) Server management program, server management method, and server management apparatus
WO2006057349A1 (en) Management system, device for use in the system, program therefor, and management method
JP2003345770A (en) Cluster system and its method for switching server
Van Roy et al. Self management of large-scale distributed systems by combining structured overlay networks and components
JP2006085520A (en) Monitoring program and monitoring server
JP2000082040A (en) Business store backup system, center server, business store server and business store backup method and recording medium
JPH11250015A (en) Server controller

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040330