JP2001125878A - Cluster type computer system - Google Patents

Cluster type computer system

Info

Publication number
JP2001125878A
JP2001125878A JP31037899A JP31037899A JP2001125878A JP 2001125878 A JP2001125878 A JP 2001125878A JP 31037899 A JP31037899 A JP 31037899A JP 31037899 A JP31037899 A JP 31037899A JP 2001125878 A JP2001125878 A JP 2001125878A
Authority
JP
Japan
Prior art keywords
host
timer
notification
information
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP31037899A
Other languages
Japanese (ja)
Other versions
JP3334695B2 (en
Inventor
Masayuki Noriya
雅之 法谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP31037899A priority Critical patent/JP3334695B2/en
Publication of JP2001125878A publication Critical patent/JP2001125878A/en
Application granted granted Critical
Publication of JP3334695B2 publication Critical patent/JP3334695B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a cluster type computer system in which even when any failure occurs in a host which should execute timer announcement, the other host can execute the timer announcement instead. SOLUTION: Each host is provided with a timer registering means for receiving information (timer announcement information) related with timer announcement being a request for the start of processing to the designated destination at a designated time, the other host monitoring means for monitoring whether or not the other host can normally operate, and for changing the value of an execution flag indicating whether or not the host can execute timer announcement, a timer announcement table for storing the execution flag and the announcement information, and a timer communicating means to be called from an on-line real time processor at the designated time for executing the timer announcement according to the execution flag and the timer announcement table.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、クラスタ型計算機
システムに関し、特に、タイマ通知を実行すべきホスト
に障害が生じても、他のホストがその機能を代行して実
行することができるクラスタ型計算機システムに関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a cluster-type computer system, and more particularly to a cluster-type computer system in which, even if a failure occurs in a host for which timer notification is to be performed, another host can execute the function on behalf of the host. It relates to a computer system.

【0002】[0002]

【従来の技術】システム内に複数のホスト計算機が存在
するクラスタ型計算機システムがある。従来のクラスタ
型計算機システムとして、例えば、特開平8−6910
号公報や特開平8−314875号公報に開示された計
算機システムがある。
2. Description of the Related Art There is a cluster computer system in which a plurality of host computers exist in the system. As a conventional cluster-type computer system, for example, Japanese Patent Application Laid-Open No. 8-6910
And a computer system disclosed in Japanese Patent Application Laid-Open No. 8-314875.

【0003】特開平8−6910号公報記載のクラスタ
型計算機システムでは、現用ホストと待機用ホストとを
備え、相互に接続されている。待機用ホストは、現用ホ
ストから一定時間の間隔で発せられる電文(アライブメ
ッセージ)をもとに、現用ホストの動作の存否を確認す
る。つまり、一定時間経過しても電文を受信できなかっ
たとき、現用ホストに障害が発生したと判断する。
[0003] The cluster type computer system described in Japanese Patent Application Laid-Open No. Hei 8-6910 has a working host and a standby host, which are interconnected. The standby host confirms the presence or absence of the operation of the active host based on a message (alive message) issued from the active host at regular intervals. That is, when a message cannot be received even after a certain period of time has elapsed, it is determined that a failure has occurred in the active host.

【0004】そして、現用ホストに障害が発生したと
き、待機用ホストは現用ホストの動作状態を変移させた
り、現用ホストからプロセスの処理情報を受信したりす
ることによって、現用ホストが実行すべきプロセスを代
行する。そのような処理によって、一部のホストに障害
が発生することによるシステム全体のダウンの防止を図
っている。
When a failure occurs in the active host, the standby host changes the operating state of the active host or receives processing information of the process from the active host. On behalf of Such processing is intended to prevent the entire system from going down due to a failure of some of the hosts.

【0005】また、特開平8−314875号公報記載
の協調分散処理装置では、複数のホストを備え、各ホス
トは、相互に接続されており、相互に各ホストにおける
障害発生の存否を監視をしながらプロセスを実行する。
複数接続されているホストに障害が発生した場合、他の
ホストは、障害が発生したホストが実行すべきプロセス
を自己が実行すべきプロセスに取り込み、プロセスを再
編成して実行する。
The cooperative distributed processing apparatus described in Japanese Patent Application Laid-Open No. 8-314875 includes a plurality of hosts, each of which is connected to each other, and mutually monitors whether or not a failure has occurred in each host. While running the process.
When a failure occurs in a plurality of connected hosts, the other hosts take in the processes to be executed by the failed host into the processes to be executed by themselves, and reorganize and execute the processes.

【0006】例えば、あるホストXがプロセスAを実行
するとし、他のホストYがプロセスB、プロセスCを実
行するとする。このとき、ホストXに障害が発生したと
き、他のホストであるホストYは、ホストXが実行すべ
きプロセスAを取り込み、プロセスの再編成を行う。再
編成されたプロセスは、例えば、プロセスB、プロセス
A、プロセスCといった具合になる。そして、ホストY
は、再編成されたプロセスを実行することで、ホストX
が実行すべきプロセスを代行することができる。
For example, suppose that a certain host X executes a process A, and another host Y executes a process B and a process C. At this time, when a failure occurs in the host X, the host Y, which is another host, takes in the process A to be executed by the host X and reorganizes the process. The rearranged processes are, for example, process B, process A, and process C. And host Y
Executes the reorganized process, and the host X
Can perform the process to be performed.

【0007】そのような処理によって、複数接続されて
いるホストの一部に障害が発生した場合、他のホストが
障害が発生したホストが実行すべきプロセスを代行する
ことで、システム全体の信頼度の向上を図っている。
When a failure occurs in a part of a plurality of connected hosts due to such processing, another host takes over a process to be executed by the failed host, thereby improving the reliability of the entire system. Is being improved.

【0008】[0008]

【発明が解決しようとする課題】特開平8−6910号
公報記載のクラスタ型計算機システムでは、現用ホスト
に障害が発生した場合、待機用ホストが現用ホストが実
行すべきプロセスを代行して実行するまでの過程が複雑
で、障害が発生してから復旧までに時間がかかってしま
うという課題がある。また、特開平8−314875号
公報記載の協調分散処理装置では、プロセスの再編成に
時間がかかってしまい、障害が発生してから復旧までに
時間がかかってしまうという課題がある。
In the cluster computer system described in Japanese Patent Application Laid-Open No. Hei 8-6910, when a failure occurs in the active host, the standby host executes the process to be executed by the active host on behalf of the active host. However, there is a problem in that the process up to the point is complicated, and it takes time from the occurrence of a failure to the recovery. Further, in the cooperative distributed processing apparatus described in Japanese Patent Application Laid-Open No. 8-314875, there is a problem that it takes time to reorganize a process, and it takes time to recover after a failure occurs.

【0009】そこで、本発明は、接続されているホスト
に障害が発生しても、迅速に、そのホストが行うべきプ
ロセスを他のホストが代行することができるクラスタ型
計算機システムを提供することを目的とする。
Accordingly, the present invention provides a cluster-type computer system in which even if a failure occurs in a connected host, another host can quickly perform a process to be performed by the host. Aim.

【0010】[0010]

【課題を解決するための手段】請求項1記載の発明に係
るクラスタ型計算機システムは、複数のホストを備え、
ホスト間相互で情報伝達が可能なクラスタ型計算機シス
テムにおいて、指定された時刻における指定されたホス
トに対する処理開始要求であるタイマ通知に関する情報
であるタイマ情報を各ホストが共有することにより、タ
イマ通知を実行すべきホストに障害が生じた場合に、他
のホストがタイマ通知を代行する構成とした。
According to a first aspect of the present invention, there is provided a cluster type computer system comprising a plurality of hosts,
In a cluster-based computer system capable of transmitting information between hosts, each host shares timer information, which is information on a timer notification that is a processing start request for a specified host at a specified time, so that a timer notification is transmitted. When a failure occurs in the host to be executed, another host substitutes for the timer notification.

【0011】請求項2記載の発明に係るクラスタ型計算
機システムでは、各ホストは、タイマ情報を記憶するタ
イマ情報記憶手段と、タイマ通知の要求が発生するとタ
イマ情報をタイマ情報記憶手段に設定するとともに他の
ホストに対してタイマ情報を送信するタイマ登録手段と
を備えた構成とした。
In the cluster-type computer system according to the second aspect of the invention, each host sets timer information in the timer information storage means, and sets timer information in the timer information storage means when a timer notification request occurs. A configuration is provided that includes timer registration means for transmitting timer information to another host.

【0012】請求項3記載の発明に係るクラスタ型計算
機システムでは、タイマ情報は、タイマ通知を実行する
時刻を示す通知時刻、タイマ通知を行う宛先を示す通知
宛先、および当該ホストがタイマ通知を実行するか否か
を示す実行フラグである。
In the cluster type computer system according to the third aspect of the present invention, the timer information includes a notification time indicating a time at which the timer notification is executed, a notification destination indicating a destination at which the timer notification is executed, and the host executing the timer notification. This is an execution flag indicating whether or not to execute.

【0013】請求項4記載の発明に係るクラスタ型計算
機システムでは、タイマ通知の要求を受けたホストにお
けるタイマ登録手段は、実行フラグに自ホストがタイマ
通知を行う情報を設定し、他のホストにおけるタイマ登
録手段は、実行フラグにタイマ通知を行うホストを示す
情報を設定する。
In the cluster type computer system according to the present invention, the timer registering means in the host which has received the timer notification request sets the execution flag to the information for the host to perform the timer notification, and sets the execution flag in the other host. The timer registration unit sets information indicating a host that performs timer notification in the execution flag.

【0014】請求項5記載の発明に係るクラスタ型計算
機システムでは、各ホストは、他のホストにおける障害
発生の存否を監視し、当該ホストがタイマ通知を実行す
べきか否かを判断する他ホスト監視手段を備えた構成と
した。
In the cluster type computer system according to the present invention, each host monitors whether or not a failure has occurred in another host, and determines whether or not the host should execute a timer notification. Means.

【0015】請求項6記載の発明に係るクラスタ型計算
機システムでは、他ホスト監視手段は、自ホストがタイ
マ通知を代わって実行すべきと判断した場合には、実行
フラグの設定情報を自ホストがタイマ通知を行う情報に
変更する。
In the cluster computer system according to the present invention, when the other host monitoring means determines that the own host should execute the timer notification in place of the timer notification, the other host monitoring means transmits the execution flag setting information to the own host. Change to the information for timer notification.

【0016】[0016]

【発明の実施の形態】本発明による実施の形態を図面を
参照して説明する。図1は、本発明によるクラスタ型計
算機システムの実施の形態を示すブロック図である。図
1に示すクラスタ型計算機システムでは、複数のホスト
101〜10nが接続され、ホスト間相互での情報伝達
が可能である。各ホスト101〜10nにおいて、オン
ラインリアルタイム処理装置は111〜11nは、タイ
マ登録手段131〜13n、他ホスト監視手段141〜
14n、タイマ通知手段151〜15nおよびタイマ通
知要求登録テーブル121〜12nを含む。各ホスト1
01〜10nにおけるタイマ登録手段131〜13n、
他ホスト監視手段141〜14nおよびタイマ通知手段
151〜15nは、ホスト間で相互に接続されている。
ここで、ホスト101のホスト番号を1とし、ホスト1
02のホスト番号を2とし、・・・ホスト10nのホス
ト番号をnとする。
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a cluster computer system according to the present invention. In the cluster computer system shown in FIG. 1, a plurality of hosts 101 to 10n are connected, and information can be transmitted between the hosts. In each of the hosts 101 to 10n, the online real-time processing apparatuses 111 to 11n include timer registration units 131 to 13n, and other host monitoring units 141 to
14n, timer notification means 151 to 15n and timer notification request registration tables 121 to 12n. Each host 1
Timer registration means 131 to 13n in 01 to 10n,
The other host monitoring means 141 to 14n and the timer notification means 151 to 15n are mutually connected between the hosts.
Here, the host number of the host 101 is set to 1, and the host 1
The host number of 02 is 2, and the host number of the host 10n is n.

【0017】ホスト101では、タイマ登録手段131
は、タイマ通知要求を受信し、その情報を実行フラグと
ともにタイマ通知要求登録テーブル121に記憶する。
実行フラグについては後で詳しく説明する。タイマ通知
要求とは、タイマ通知を実行することの要求である。ま
た、タイマ通知とは、指定時刻における指定宛先(ホス
ト)に対する処理開始要求である。従って、タイマ通知
を受けたホストは、あらかじめ決められている処理を開
始する。
In the host 101, the timer registration means 131
Receives the timer notification request and stores the information in the timer notification request registration table 121 together with the execution flag.
The execution flag will be described later in detail. The timer notification request is a request to execute a timer notification. The timer notification is a processing start request to a designated destination (host) at a designated time. Therefore, the host that has received the timer notification starts a predetermined process.

【0018】他ホスト監視手段141は、他に接続され
ているホストにおける障害発生の存否を判断し、当該ホ
ストがタイマ通知を実行するか否かのフラグである実行
フラグの値を変更する。そして、オンラインリアルタイ
ム処理装置111は、タイマ通知を実行する時刻になる
と、タイマ通知手段151を呼び出す。そして、タイマ
通知手段151は、タイマ通知要求登録テーブル121
に記憶されている情報をもとに、タイマ通知を行う。そ
して、他のホストもホスト101と同様な構成である。
The other host monitoring means 141 determines whether or not a failure has occurred in a host connected to another, and changes the value of an execution flag which is a flag indicating whether or not the host executes timer notification. Then, the online real-time processing device 111 calls the timer notification unit 151 at the time of executing the timer notification. Then, the timer notification unit 151 stores the timer notification request registration table 121
A timer notification is performed based on the information stored in. The other hosts have the same configuration as the host 101.

【0019】図2は、タイマ通知要求登録テーブル12
1〜12nに記憶される情報の一例を示す説明図であ
る。図3は、タイマ登録手段131〜13nの動作を説
明するためのフローチャートである。図4は、タイマ通
知手段151〜15nの動作を説明するためのフローチ
ャートである。図5は、他ホスト監視手段141〜14
nの動作を説明するためのフローチャートである。
FIG. 2 shows the timer notification request registration table 12
It is explanatory drawing which shows an example of the information stored in 1-12n. FIG. 3 is a flowchart for explaining the operation of the timer registration units 131 to 13n. FIG. 4 is a flowchart for explaining the operation of the timer notification means 151 to 15n. FIG. 5 shows another host monitoring means 141 to 14.
4 is a flowchart for explaining the operation of the n.

【0020】以下、図3〜図5のフローチャートを参照
して、図1に示すクラスタ型計算機システムの動作につ
いて説明する。本クラスタ型計算機システムは、例え
ば、銀行のホストコンピュータシステムに用いられる。
The operation of the cluster computer system shown in FIG. 1 will be described below with reference to the flowcharts of FIGS. This cluster computer system is used, for example, in a bank host computer system.

【0021】ホスト101に対してタイマ通知要求が発
生したとする。つまり、ホスト101が受付ホストとな
る。タイマ通知要求の情報として、何時タイマ通知を行
うかを特定し得る通知時刻情報と、どのホストに対して
タイマ通知を行うかを示す通知宛先とがある。今回の例
では、通知時刻情報から特定される時刻を10:00、
通知宛先をホスト104とする。また、タイマ通知要求
をホスト101が受信した時刻を同日の9:00をす
る。
It is assumed that a timer notification request has been issued to the host 101. That is, the host 101 becomes the reception host. The information of the timer notification request includes notification time information that can specify when the timer notification is to be performed and a notification destination that indicates to which host the timer notification is performed. In this example, the time specified from the notification time information is 10:00,
The notification destination is the host 104. The time when the host 101 receives the timer notification request is set to 9:00 on the same day.

【0022】タイマ登録手段131は、タイマ通知要求
が配信によるものか否かを判断する(ステップS30
1)。今回の例では、ホスト101が受付ホストなの
で、ここでの判断はNOとなる。ここで、配信とは、あ
るホストがタイマ通知要求を受信した場合、そのホスト
が、タイマ通知要求の情報を、他のホストにも通知して
おくことをいう。
The timer registration unit 131 determines whether the timer notification request is for distribution (step S30).
1). In this example, since the host 101 is the receiving host, the determination here is NO. Here, distribution means that when a certain host receives a timer notification request, the host notifies other hosts of the information of the timer notification request.

【0023】次に、タイマ登録手段131は、タイマ通
知要求から、通知時刻を計算する(ステップS30
2)。そして、通知時刻の指定が正しいか否かを判断す
る(ステップS303)。通知時刻は必ず未来の時刻が
指定されなければならない。よって、例えば、過去の時
刻が指定された場合、ステップS303での判断はNO
となり、以降の処理を終了する。今回の例では、タイマ
通知要求を受信した時刻が9:00であり、通知時刻情
報から特定される時刻が10:00であるので、ステッ
プS303での判断はYESとなる。
Next, the timer registration means 131 calculates the notification time from the timer notification request (step S30).
2). Then, it is determined whether the designation of the notification time is correct (step S303). The notification time must always be specified in the future. Therefore, for example, when a past time is specified, the determination in step S303 is NO.
And the subsequent processing ends. In this example, the time at which the timer notification request was received is 9:00, and the time specified from the notification time information is 10:00, so the determination in step S303 is YES.

【0024】次に、タイマ登録手段131は、通知宛先
の指定が正しいか否かを判断する(ステップS30
4)。通知宛先は接続されているホストが指定されなけ
ればならない。よって、例えば、接続されていないホス
トが指定された場合、ステップ304での判断はNOと
なり、以降の処理を終了する。今回の例では、ホスト1
04は接続されているので、ステップS304での判断
はYESとなる。
Next, the timer registration means 131 determines whether or not the designation of the notification destination is correct (step S30).
4). The notification destination must specify the connected host. Therefore, for example, if a host that is not connected is specified, the determination in step 304 is NO, and the subsequent processing ends. In this example, host 1
04 is connected, the determination in step S304 is YES.

【0025】次に、タイマ登録手段131は、通知時刻
および通知宛先をタイマ通知要求登録テーブル121に
記憶する(ステップS305)。そして、実行フラグの
値を0に変更して、タイマ通知要求登録テーブル121
に記憶する(ステップS306)。つまり、タイマ通知
要求登録テーブル121に記憶される情報(以下、通知
情報という。)は、図2(a)に示すようになる。ここ
で、通知情報には、通知時刻、通知宛先および実行フラ
グが含まれる。
Next, the timer registration unit 131 stores the notification time and the notification destination in the timer notification request registration table 121 (step S305). Then, the value of the execution flag is changed to 0, and the timer notification request registration table 121 is changed.
(Step S306). That is, the information stored in the timer notification request registration table 121 (hereinafter referred to as notification information) is as shown in FIG. Here, the notification information includes a notification time, a notification destination, and an execution flag.

【0026】次に、タイマ登録手段131は、タイマ通
知要求登録テーブル121に記憶されている通知情報
を、他のホストに対して配信する(ステップS30
7)。よって、他のホストも通知情報を保持する。従っ
て、ホスト101に障害が発生したときに、他のホスト
がホスト101が実行すべきタイマ通知を代行すること
ができる。
Next, the timer registration means 131 distributes the notification information stored in the timer notification request registration table 121 to another host (step S30).
7). Therefore, other hosts also hold the notification information. Therefore, when a failure occurs in the host 101, another host can substitute for a timer notification to be executed by the host 101.

【0027】例えば、ホスト102では、タイマ登録手
段132は、ホスト101から配信された通知情報をタ
イマ通知要求登録テーブル122に記憶する(ステップ
S308)。そして、実行フラグの値を受付ホスト番号
に変更し、タイマ通知要求登録テーブル122に記憶す
る(ステップS309)。今回の例では、ホスト101
が受付ホストであるので、実行フラグの値は1に変更さ
れる。つまり、タイマ通知要求登録テーブル122に記
憶される通知情報は、図2(b)に示すようになる。他
のホストの動作もホスト102の動作と同様である。
For example, in the host 102, the timer registration unit 132 stores the notification information distributed from the host 101 in the timer notification request registration table 122 (Step S308). Then, the value of the execution flag is changed to the reception host number, and stored in the timer notification request registration table 122 (step S309). In this example, host 101
Is the accepting host, the value of the execution flag is changed to 1. That is, the notification information stored in the timer notification request registration table 122 is as shown in FIG. The operations of the other hosts are the same as the operations of the host 102.

【0028】ホスト101では、オンラインリアルタイ
ム処理装置111は、通知時刻になると、タイマ通知手
段151を呼び出す。すると、タイマ通知手段151
は、実行フラグの値が0であるか否かを判断する(ステ
ップS401)。実行フラグの値が0のとき、当該ホス
トがタイマ通知を実行する。つまり、今回の例では、ス
テップS401での判断はYESとなり、タイマ通知を
実行する(ステップS402)。つまり、今回の例で
は、10:00に、タイマ通知手段151はオンライン
リアルタイム処理装置111から呼び出され、ホスト1
04に対してタイマ通知を実行する。
In the host 101, the online real-time processing device 111 calls the timer notification means 151 when the notification time comes. Then, the timer notification means 151
Determines whether the value of the execution flag is 0 (step S401). When the value of the execution flag is 0, the host executes the timer notification. That is, in this example, the determination in step S401 is YES, and a timer notification is executed (step S402). That is, in this example, at 10:00, the timer notification unit 151 is called from the online real-time processing device 111 and
04 is notified of a timer.

【0029】次に、タイマ通知を実行すべきホスト10
1に障害が発生した場合について図5のフローチャート
を参照して説明する。各ホスト101〜10nは、相互
にホスト内における障害発生の存否を監視する。例え
ば、ホスト102を例にとる。他ホスト監視手段142
は、接続されているホストに対して、ホストにおける障
害発生の存否を確認するための電文(アライブメッセー
ジ)を通知する(ステップS501)。
Next, the host 10 that should execute the timer notification
The case where a failure has occurred in No. 1 will be described with reference to the flowchart in FIG. The hosts 101 to 10n mutually monitor whether a failure has occurred in the host. For example, the host 102 is taken as an example. Other host monitoring means 142
Notifies the connected host of a message (alive message) for confirming whether or not a failure has occurred in the host (step S501).

【0030】そして、全てのホストから応答があったか
否かを判断する(ステップS502)。全てのホストか
ら応答があった場合(NOの場合)、全てのホストは正
常に動作しているので、以降の処理を終了する。今回の
例では、ホスト101に故障が発生したことになり、ホ
スト101からの応答はない。よって、ステップS50
2での判断はYESとなる。
Then, it is determined whether or not responses have been received from all the hosts (step S502). If there is a response from all the hosts (in the case of NO), since all the hosts are operating normally, the subsequent processing ends. In this example, a failure has occurred in the host 101, and there is no response from the host 101. Therefore, step S50
The determination at 2 is YES.

【0031】次に、応答が無かったホストはタイマ通知
を実行すべきホストであるか否かを判断する(ステップ
S503)。タイマ通知を実行すべきホストでなかった
場合(NOの場合)、以降の処理を終了する。今回の例
では、タイマ通知を実行すべきホスト101に障害が発
生したことにより、ステップS503での判断はYES
となる。
Next, it is determined whether the host that has not received a response is a host that should execute timer notification (step S503). If the host is not the one that should execute the timer notification (NO), the subsequent processing ends. In this example, the determination in step S503 is YES because a failure has occurred in the host 101 that should execute the timer notification.
Becomes

【0032】次に、自己のホストのホスト番号がタイマ
通知を実行すべきホスト番号の次番号であるか否かを判
断する(ステップS504)。ここで、次番号とは、タ
イマ通知を実行すべきホストのホスト番号に1を加算し
た番号、または、タイマ通知を実行すべきホストのホス
ト番号が最後の番号(今回の例では、nである。)であ
るときは1である。
Next, it is determined whether or not the host number of its own host is the next number of the host number for which the timer notification is to be executed (step S504). Here, the next number is a number obtained by adding 1 to the host number of the host that should execute the timer notification, or the last number (n in this example, n is the host number of the host that should execute the timer notification). ) Is 1.

【0033】今回の例では、タイマ通知を実行すべきホ
ストのホスト番号は1であり、自己のホスト番号は2で
あるので、ステップS504での判断はYESとなる。
そして、実行フラグの値を0に変更し、タイマ通知要求
登録テーブル122に記憶する(ステップS505)。
つまり、タイマ通知要求登録テーブル112に記憶され
る通知情報は、図2(a)に示すように設定される。
In this example, the host number of the host that should execute the timer notification is 1 and its own host number is 2, so the determination in step S504 is YES.
Then, the value of the execution flag is changed to 0 and stored in the timer notification request registration table 122 (step S505).
That is, the notification information stored in the timer notification request registration table 112 is set as shown in FIG.

【0034】オンラインリアルタイム処理装置112
は、通知時刻になったとき、タイマ通知手段152を呼
び出す。タイマ通知手段152は、実行フラグの値が0
であるか否かを判断する(ステップS401)。実行フ
ラグの値が0であるので、ホスト104に対してタイマ
通知を実行する。よって、ホスト102は、ホスト10
1がすべきタイマ通知を代行することができる。
Online real-time processor 112
Calls the timer notification means 152 when the notification time comes. The timer notification unit 152 determines that the value of the execution flag is 0.
Is determined (step S401). Since the value of the execution flag is 0, a timer notification is executed to the host 104. Therefore, the host 102
The timer notification that 1 should perform can be substituted.

【0035】その他のホストの動作は、ステップS50
1からステップS503まで、ホスト102と同様であ
る。ただし、ステップS504での判断はNOとなる。
ここで、その他のホストとしてホスト103を例にと
る。ホスト103では、ステップS506にて、他ホス
ト監視手段143は、実行フラグの値をタイマ通知を代
行するホストのホスト番号に変更する。今回の例では、
ホスト102がタイマ通知を代行するので、実行フラグ
の値は2に変更される。そして、タイマ通知要求登録テ
ーブル123に記憶される通知情報は、図2(c)に示
すようになる。そして、タイマ通知手段153は、通知
時刻になるとオンラインリアルタイム処理装置103か
ら呼び出されるが、実行フラグの値は0でないので、ホ
スト101が実行すべきタイマ通知を代行しない。他の
ホスト104〜ホスト105の動作もホスト103と同
様である。
The other host operations are performed in step S50.
Steps 1 to S503 are the same as those of the host 102. However, the determination in step S504 is NO.
Here, the host 103 is taken as an example of another host. In the host 103, in step S506, the other host monitoring unit 143 changes the value of the execution flag to the host number of the host that performs the timer notification. In this example,
Since the host 102 substitutes for the timer notification, the value of the execution flag is changed to 2. Then, the notification information stored in the timer notification request registration table 123 is as shown in FIG. Then, the timer notification unit 153 is called from the online real-time processing device 103 when the notification time comes. However, since the value of the execution flag is not 0, the timer notification unit 153 does not perform the timer notification to be executed by the host 101. The operations of the other hosts 104 to 105 are the same as those of the host 103.

【0036】ここで、ホスト101が実行すべきタイマ
通知を代行するホスト102にも障害が発生した場合に
ついて説明する。ホスト103を例にとる。ステップS
501〜S503までの動作は、ホスト102と同様で
ある。
Here, a case in which a failure has occurred in the host 102 acting as a substitute for the timer notification to be executed by the host 101 will be described. Take the host 103 as an example. Step S
The operations from 501 to S503 are the same as those of the host 102.

【0037】タイマ通知手段153は、自己のホスト番
号がタイマ通知を実行すべきホストのホスト番号の次番
号であるか否かを判断する(ステップS504)。先の
ステップS506で、タイマ通知要求登録テーブル12
3に記憶される通知情報は、図2(c)に示すとおりに
なっている。そして、タイマ通知をすべきホストのホス
ト番号は2であり、自己のホスト番号は3であるので、
ステップS504での判断はYESとなる。
The timer notification means 153 determines whether or not its own host number is the next number of the host number of the host to execute the timer notification (step S504). In the previous step S506, the timer notification request registration table 12
The notification information stored in No. 3 is as shown in FIG. Since the host number of the host to be notified of the timer is 2 and its own host number is 3,
The determination in step S504 is YES.

【0038】そして、タイマ通知手段153は、実行フ
ラグの値を0に変更して、タイマ通知要求登録テーブル
123に記憶する。つまり、タイマ通知要求登録テーブ
ル123に記憶される通知情報は、図2(a)に示すよ
うに変更される。通知時刻になると、タイマ通知手段1
53は、オンラインリアルタイム処理装置113から呼
び出され、タイマ通知を実行する。よって、ホスト10
3は、ホスト101が実行すべきタイマ通知を代行する
ことができる。
Then, the timer notification means 153 changes the value of the execution flag to 0 and stores it in the timer notification request registration table 123. That is, the notification information stored in the timer notification request registration table 123 is changed as shown in FIG. When the notification time comes, the timer notification means 1
53 is called from the online real-time processing device 113 and executes timer notification. Therefore, the host 10
3 can substitute for a timer notification to be executed by the host 101.

【0039】以上のように、各ホスト101〜10n
は、通知情報を、タイマ通知要求登録テーブル121〜
12nに記憶させることにより、共有する。他ホスト監
視手段141〜14nが他のホストにおける障害発生の
存否を判断することにより、当該ホストがタイマ通知を
代行すべきか否かを判断し、代行すべきと判断したとき
には、実行フラグの値を変更する。そして、オンライン
リアルタイム処理装置111〜11nによって呼び出さ
れたタイマ通知手段151〜15nは、タイマ通知要求
登録テーブル121〜12nに記憶されている通知情報
をもとにタイマ通知を実行する。よって、タイマ通知を
すべきホストに障害が発生したとしても、他のホスト
が、通知情報を参照することにより、タイマ通知を代行
することができる。また、複数のホストに障害が生じた
場合でも、他のホストがタイマ通知を代行することが可
能となる。
As described above, each of the hosts 101 to 10n
Stores the notification information in the timer notification request registration tables 121-121.
12n to be shared. The other host monitoring means 141 to 14n determine whether or not a failure has occurred in another host, thereby determining whether or not the host should substitute for the timer notification. change. Then, the timer notification means 151 to 15n called by the online real-time processing devices 111 to 11n execute the timer notification based on the notification information stored in the timer notification request registration tables 121 to 12n. Therefore, even if a failure occurs in the host to which the timer notification should be made, another host can substitute the timer notification by referring to the notification information. Further, even when a failure occurs in a plurality of hosts, another host can substitute for the timer notification.

【0040】加えて、タイマ通知を実行すべきホストに
障害が生じた場合でも、他のホストがそのタイマ通知を
即座に代行することができるので、障害発生から復旧ま
で時間がかかっていたという従来の技術の課題を解消す
ることができる。
In addition, even if a failure occurs in the host that should execute the timer notification, another host can immediately substitute for the timer notification. Can solve the problem of the technology.

【0041】[0041]

【発明の効果】請求項1記載の発明によれば、複数のホ
ストを備え、ホスト間相互で情報伝達が可能なクラスタ
型計算機システムにおいて、指定された時刻における指
定されたホストに対する処理開始要求であるタイマ通知
に関する情報であるタイマ情報を各ホストが共有するこ
とにより、タイマ通知を実行すべきホストに障害が生じ
た場合に、他のホストがタイマ通知を代行することがで
きるという効果を奏する。
According to the first aspect of the present invention, in a cluster-type computer system including a plurality of hosts and capable of transmitting information between hosts, a processing start request to a designated host at a designated time is issued. By sharing the timer information, which is information related to a certain timer notification, with each host, when a failure occurs in the host that should execute the timer notification, another host can perform the timer notification on behalf of the host.

【0042】請求項2記載の発明によれば、各ホスト
は、タイマ情報を記憶するタイマ情報記憶手段と、タイ
マ通知の要求が発生するとタイマ情報をタイマ情報記憶
手段に設定するとともに他のホストに対してタイマ情報
を送信するタイマ登録手段とを備えた構成となっている
ので、全てのホストはタイマ情報を共有することができ
るという効果を奏する。
According to the second aspect of the present invention, each host has a timer information storage means for storing timer information, and sets a timer information in the timer information storage means when a request for timer notification is generated, and transmits the timer information to another host. On the other hand, since the configuration includes the timer registration means for transmitting the timer information, all the hosts can share the timer information.

【0043】請求項3記載の発明によれば、タイマ情報
は、タイマ通知を実行する時刻を示す通知時刻、タイマ
通知を行う宛先を示す通知宛先、および当該ホストがタ
イマ通知を実行するか否かを示す実行フラグであるの
で、各ホストは、実行フラグに応じて、通知時刻におい
て、通知宛先にタイマ通知を実行することができるとい
う効果を奏する。
According to the third aspect of the present invention, the timer information includes a notification time indicating a time at which the timer notification is performed, a notification destination indicating a destination at which the timer notification is performed, and whether or not the host performs the timer notification. Therefore, each host can execute the timer notification to the notification destination at the notification time according to the execution flag.

【0044】請求項4記載の発明によれば、タイマ通知
の要求を受けたホストにおけるタイマ登録手段は実行フ
ラグに自ホストがタイマ通知を行う情報を設定し、他の
ホストにおけるタイマ登録手段は、実行フラグにタイマ
通知を行うホストを示す情報を設定するので、他のホス
トは、タイマ通知を実行するホストを認識することがで
きるという効果を奏する。
According to the fourth aspect of the present invention, the timer registering means in the host that has received the timer notification request sets the execution flag to the information on which the own host performs the timer notification. Since information indicating the host that performs the timer notification is set in the execution flag, another host has the effect of being able to recognize the host that performs the timer notification.

【0045】請求項5記載の発明によれば、各ホストは
他のホストにおける障害発生の存否を監視し、当該ホス
トがタイマ通知を実行すべきか否かを判断する他ホスト
監視手段を備えた構成としたので、各ホストは、他に接
続されているホストにおける障害発生の存否を判断する
ことができ、当該ホストがタイマ通知を実行するか否か
を判断することができるという効果を奏する。
According to the fifth aspect of the present invention, each host is provided with another host monitoring means for monitoring whether or not a failure has occurred in another host, and determining whether or not the host should execute timer notification. Therefore, each host can determine whether or not a failure has occurred in the other connected host, and has an effect that it can determine whether or not the host executes the timer notification.

【0046】請求項6記載の発明によれば、他ホスト監
視手段は、自ホストがタイマ通知を代わって実行すべき
と判断した場合には、実行フラグの設定情報を自ホスト
がタイマ通知を行う情報に変更するので、タイマ通知を
すべきホストに障害が発生しても、他のホストは、自己
の実行フラグの値を変更することによって、タイマ通知
を代行することができるという効果を奏する。
According to the sixth aspect of the present invention, when the other host monitoring means determines that the own host should execute the timer notification in place of the timer notification, the own host performs the timer notification of the setting information of the execution flag. Since the information is changed, even if a failure occurs in the host to which the timer notification is to be made, another host can perform the timer notification by changing the value of its own execution flag.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明によるクラスタ型計算機システムの実
施の一形態を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a cluster computer system according to the present invention.

【図2】 タイマ通知要求登録テーブル121〜12n
に記憶される通知情報の一例を示す説明図である。
FIG. 2 shows timer notification request registration tables 121 to 12n.
FIG. 5 is an explanatory diagram showing an example of notification information stored in a storage device.

【図3】 タイマ登録手段131〜13nの動作を説明
するためのフローチャートである。
FIG. 3 is a flowchart for explaining operations of timer registration units 131 to 13n.

【図4】 タイマ通知手段151〜15nの動作を説明
するためのフローチャートである。
FIG. 4 is a flowchart for explaining the operation of timer notification means 151 to 15n.

【図5】 他ホスト監視手段141〜14nの動作を説
明するためのフローチャートである。
FIG. 5 is a flowchart for explaining the operation of other host monitoring means 141 to 14n.

【符号の説明】[Explanation of symbols]

101〜10n ホスト 111〜11n オンラインリアルタイム処理装置 121〜12n タイマ通知要求登録テーブル 131〜13n タイマ登録手段 141〜14n 他ホスト監視手段 151〜15n タイマ通知手段 101 to 10n Host 111 to 11n Online real-time processing device 121 to 12n Timer notification request registration table 131 to 13n Timer registration means 141 to 14n Other host monitoring means 151 to 15n Timer notification means

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】 複数のホストを備え、ホスト間相互で情
報伝達が可能なクラスタ型計算機システムにおいて、 指定された時刻における指定されたホストに対する処理
開始要求であるタイマ通知に関する情報であるタイマ情
報を各ホストが共有することにより、タイマ通知を実行
すべきホストに障害が生じた場合に、他のホストがタイ
マ通知を代行することを特徴とするクラスタ型計算機シ
ステム。
1. A cluster-type computer system comprising a plurality of hosts and capable of transmitting information between hosts, wherein timer information, which is information relating to a timer notification which is a processing start request to a specified host at a specified time, is transmitted. A cluster-type computer system characterized in that, when a host that should execute timer notification fails due to sharing by each host, another host substitutes for timer notification.
【請求項2】 各ホストは、タイマ情報を記憶するタイ
マ情報記憶手段と、タイマ通知の要求が発生するとタイ
マ情報をタイマ情報記憶手段に設定するとともに他のホ
ストに対してタイマ情報を送信するタイマ登録手段とを
備えた請求項1記載のクラスタ型計算機システム。
2. A host, comprising: a timer information storage unit for storing timer information; and a timer for setting the timer information in the timer information storage unit when a timer notification request occurs, and transmitting the timer information to another host. 2. The cluster-type computer system according to claim 1, further comprising registration means.
【請求項3】 タイマ情報は、タイマ通知を実行する時
刻を示す通知時刻、タイマ通知を行う宛先を示す通知宛
先、および当該ホストがタイマ通知を実行するか否かを
示す実行フラグである請求項1または請求項2記載のク
ラスタ型計算機システム。
3. The timer information is a notification time indicating a time at which the timer notification is executed, a notification destination indicating a destination at which the timer notification is executed, and an execution flag indicating whether the host executes the timer notification. The cluster-type computer system according to claim 1 or 2.
【請求項4】 タイマ通知の要求を受けたホストにおけ
るタイマ登録手段は実行フラグに自ホストがタイマ通知
を行う情報を設定し、他のホストにおけるタイマ登録手
段は、実行フラグにタイマ通知を行うホストを示す情報
を設定する請求項3記載のクラスタ型計算機システム。
4. The timer registering means of the host which has received the request for timer notification sets information for the host to perform timer notification in the execution flag, and the timer registration means of the other host transmits the timer to the execution flag. 4. The cluster-type computer system according to claim 3, wherein information indicating the following is set.
【請求項5】 各ホストは、他のホストにおける障害発
生の存否を監視し、当該ホストがタイマ通知を実行すべ
きか否かを判断する他ホスト監視手段を備えた請求項4
記載のクラスタ型計算機システム。
5. Each host further comprises another host monitoring means for monitoring whether or not a failure has occurred in another host and determining whether or not the host should execute timer notification.
The cluster-type computer system as described.
【請求項6】 他ホスト監視手段は、自ホストがタイマ
通知を代わって実行すべきと判断した場合には、実行フ
ラグの設定情報を自ホストがタイマ通知を行う情報に変
更する請求項5記載のクラスタ型計算機システム。
6. The other host monitoring means changes the setting information of the execution flag to information on which the own host issues a timer notification when the own host determines that the timer notification should be executed instead. Cluster computer system.
JP31037899A 1999-10-29 1999-10-29 Cluster type computer system Expired - Fee Related JP3334695B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31037899A JP3334695B2 (en) 1999-10-29 1999-10-29 Cluster type computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31037899A JP3334695B2 (en) 1999-10-29 1999-10-29 Cluster type computer system

Publications (2)

Publication Number Publication Date
JP2001125878A true JP2001125878A (en) 2001-05-11
JP3334695B2 JP3334695B2 (en) 2002-10-15

Family

ID=18004539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31037899A Expired - Fee Related JP3334695B2 (en) 1999-10-29 1999-10-29 Cluster type computer system

Country Status (1)

Country Link
JP (1) JP3334695B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9733997B2 (en) 2013-11-13 2017-08-15 Fujitsu Limited Event management method and distributed system

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113260A (en) * 1985-11-12 1987-05-25 Fujitsu Ltd Timer monitor control system for multi-cpu system
JPH0410046A (en) * 1990-04-27 1992-01-14 Hitachi Ltd Hour and time control method for message addressed to terminal of on-line system
JPH04153837A (en) * 1990-10-18 1992-05-27 Nec Corp Timer request processing system
JPH0594428A (en) * 1991-10-01 1993-04-16 Nec Corp Data processing system for multiprocessor
JPH05250281A (en) * 1992-03-05 1993-09-28 Toshiba Corp Time matching system for lan system
JPH06187187A (en) * 1992-12-21 1994-07-08 Nec Corp Takeover system for timer information request
JPH11184825A (en) * 1997-12-19 1999-07-09 Mitsubishi Electric Corp Cluster system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62113260A (en) * 1985-11-12 1987-05-25 Fujitsu Ltd Timer monitor control system for multi-cpu system
JPH0410046A (en) * 1990-04-27 1992-01-14 Hitachi Ltd Hour and time control method for message addressed to terminal of on-line system
JPH04153837A (en) * 1990-10-18 1992-05-27 Nec Corp Timer request processing system
JPH0594428A (en) * 1991-10-01 1993-04-16 Nec Corp Data processing system for multiprocessor
JPH05250281A (en) * 1992-03-05 1993-09-28 Toshiba Corp Time matching system for lan system
JPH06187187A (en) * 1992-12-21 1994-07-08 Nec Corp Takeover system for timer information request
JPH11184825A (en) * 1997-12-19 1999-07-09 Mitsubishi Electric Corp Cluster system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9733997B2 (en) 2013-11-13 2017-08-15 Fujitsu Limited Event management method and distributed system

Also Published As

Publication number Publication date
JP3334695B2 (en) 2002-10-15

Similar Documents

Publication Publication Date Title
US7370223B2 (en) System and method for managing clusters containing multiple nodes
US7225356B2 (en) System for managing operational failure occurrences in processing devices
US7843811B2 (en) Method of solving a split-brain condition
US20130159487A1 (en) Migration of Virtual IP Addresses in a Failover Cluster
CN107919994B (en) Method and server for realizing hot standby of network service dual-computer
US20070121490A1 (en) Cluster system, load balancer, node reassigning method and recording medium storing node reassigning program
KR20030067712A (en) A method of improving the availability of a computer clustering system through the use of a network medium link state function
JP2005512190A (en) Real composite objects that provide high availability of resources in networked systems
EP3291487B1 (en) Method for processing virtual machine cluster and computer system
US20170289044A1 (en) Highly available servers
CN110750393A (en) Method, device, medium and equipment for avoiding network service dual-computer hot standby split brain
CN109189854B (en) Method and node equipment for providing continuous service
JP2011203941A (en) Information processing apparatus, monitoring method and monitoring program
JP3334695B2 (en) Cluster type computer system
JP2002344450A (en) High availability processing method, and executing system and processing program thereof
US20230126682A1 (en) Fault tolerance method and apparatus of network device system, computer device, and storage medium
WO2022222403A1 (en) Task distribution system, method, and apparatus, computer device, and storage medium
CN113518116B (en) Leader server election method and device based on Fast Paxos algorithm
JP4863984B2 (en) Monitoring processing program, method and apparatus
JP6901677B2 (en) Management program, management device and management method
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
JP2002351855A (en) Computer abnormality handling system, computer abnormality handling method, computer abnormality handling program running on computer and computer abnormality handling program stored in machine readable storage medium
JP5790420B2 (en) Communication device, failure detection method, and failure detection program
JPH10289215A (en) Computer system having current and spare switching function in application program unit and machine readable recording medium recording program
JP2006235845A (en) Variable transaction processor for web system

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees