JP4856561B2 - Node control method, node control program, and node - Google Patents
Node control method, node control program, and node Download PDFInfo
- Publication number
- JP4856561B2 JP4856561B2 JP2007022174A JP2007022174A JP4856561B2 JP 4856561 B2 JP4856561 B2 JP 4856561B2 JP 2007022174 A JP2007022174 A JP 2007022174A JP 2007022174 A JP2007022174 A JP 2007022174A JP 4856561 B2 JP4856561 B2 JP 4856561B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- management unit
- data management
- active
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Description
本発明は、冗長構成システムのノード制御技術に関する。 The present invention relates to a node control technique for a redundant configuration system.
従来、単一ノードにおいて、管理しているデータベースの任意の時点のスナップショット(以下、チェックポイントと呼ぶ)と、チェックポイントからの更新差分情報(以下、ジャーナルと呼ぶ)とをハードディスク等の記憶媒体(補助記憶部)に記録しておき、このデータベースに障害が発生した場合には、ノードは、このチェックポイントとジャーナルとを用いてデータベースを障害直前の状態に復旧(リカバリ)する技術がある。 Conventionally, in a single node, a snapshot at an arbitrary point of a database managed (hereinafter referred to as a checkpoint) and update difference information (hereinafter referred to as a journal) from the checkpoint are stored in a storage medium such as a hard disk. There is a technique that is recorded in the (auxiliary storage unit), and when a failure occurs in this database, the node uses the checkpoint and the journal to recover the database to the state immediately before the failure.
また、データベースを管理するノードを冗長構成とし、これらのノード間でデータベースを共有するシステム(冗長構成システム)もある。このようなシステムにおいて、サービスを提供するノード(以下、Activeノードと呼ぶ)に障害が発生して待機中のノード(以下、Standbyノードと呼ぶ)に切り替わるとき、長時間を要するという問題がある。 There is also a system (redundant configuration system) in which nodes that manage databases have a redundant configuration and the database is shared between these nodes. In such a system, there is a problem that it takes a long time when a failure occurs in a node that provides a service (hereinafter referred to as an Active node) and the node is switched to a standby node (hereinafter referred to as a Standby node).
このような問題を解決するため、ActiveノードとStandbyノードと間でデータベースを非共有とする冗長構成システムが提案されている。この冗長構成システムを、図7を用いて説明する。図7は、従来の冗長構成システムを例示した図である。図7において、ノード3はActiveノードであり、ノード4はStandbyノードであるものとする。 In order to solve such a problem, a redundant configuration system in which a database is not shared between an Active node and a Standby node has been proposed. This redundant configuration system will be described with reference to FIG. FIG. 7 is a diagram illustrating a conventional redundant configuration system. In FIG. 7, it is assumed that the node 3 is an active node and the node 4 is a standby node.
図7に示すように、ノード4がStandbyノードとして起動する際には、自ノードのチェックポイントとジャーナルではなく、Activeノードであるノード3のチェックポイントとジャーナルとを読み込んで起動する(S1)。そして、ノード4が起動した後、Activeノードであるノード3は、自ノードで発生したジャーナルを自ノードの補助記憶部に蓄積する(S2)。また、このノード3は、この自ノードで発生したジャーナルをノード4へ送信する(S3)。そして、ノード4は、ノード3から送信されたジャーナルを、自ノードの記憶部に反映し、自身の補助記憶部のジャーナルに蓄積する(S4)。 As shown in FIG. 7, when the node 4 is activated as a standby node, the checkpoint and journal of the node 3 that is the active node are read and activated instead of the checkpoint and journal of the own node (S1). Then, after the node 4 is activated, the node 3 as the active node accumulates the journal generated in the own node in the auxiliary storage unit of the own node (S2). Further, this node 3 transmits the journal generated in this node to the node 4 (S3). Then, the node 4 reflects the journal transmitted from the node 3 in the storage unit of its own node, and accumulates it in the journal of its own auxiliary storage unit (S4).
このように、Standbyノード(ノード4)とActiveノード(ノード3)との間で、データベースと、チェックポイントおよびジャーナルの同期をとっておくことで、このノード3に障害が発生した場合でも、Standbyノード(ノード4)は自ノードを起動することができる。つまり、Activeノードに障害が発生した場合でも、その障害によるサービス停止時間を短くすることができる。 In this way, by synchronizing the database, the checkpoint, and the journal between the standby node (node 4) and the active node (node 3), even if a failure occurs in this node 3, the standby is performed. The node (node 4) can activate its own node. That is, even when a failure occurs in the Active node, the service stop time due to the failure can be shortened.
以下の非特許文献1には、このような冗長構成システムにおける各ノードのActive化/Standby化の制御技術が開示されている。
しかし、前記した従来の冗長構成システムは、いずれかのノードがActiveノードとして起動完了しないと、他のノードは補助記憶部からのデータ(チェックポイントとジャーナル)を読み込まなかった。このため、このような冗長構成システムにおいて障害が発生し、すべてのノードの再起動が必要になったとき、サービス開始までに時間がかかるという問題があった。 However, in the above-described conventional redundant configuration system, if any node does not complete activation as an active node, the other nodes do not read data (checkpoint and journal) from the auxiliary storage unit. For this reason, when a failure occurs in such a redundant configuration system and it is necessary to restart all nodes, there is a problem that it takes time to start the service.
このような問題を、図8および図9を用いて詳細に説明する。図8および図9は、従来技術の問題を説明するために引用した図である。ここでは、冗長構成システムのノード3,4が、ノード3→ノード4の順に起動し、このノード3が起動に失敗する場合を例に説明する。なお、システム管理部320,420は、ActiveノードおよびStandbyノードを選択(決定)する。ここでは、システム管理部320,420が、冗長構成システムを構成するノード3,4のうち、最初に起動したノードをActiveノードとして選択する場合を例に説明する。データ管理部321,421は、各ノードの補助記憶部のデータを管理する。なお、以下の説明において、補助記憶部のデータ読み込み(チェックポイントとジャーナルのロード)とは、データ管理部321,421が補助記憶部のチェックポイントとジャーナルとを使って、記憶部にデータベースを構築することを示す。
Such a problem will be described in detail with reference to FIGS. FIG. 8 and FIG. 9 are diagrams cited for explaining the problems of the prior art. Here, a case will be described as an example where the nodes 3 and 4 of the redundant configuration system are activated in the order of the node 3 → the node 4 and the node 3 fails to be activated. The
図8に示すように、ノード3のシステム管理部320は、ノード3の電源投入等を契機として、データ管理部321に起動指示を出力する(S801)。そして、起動指示を受けたデータ管理部321は自ノードのデータ管理部321を起動すると、システム管理部320へ起動完了通知を返す(S802)。そして、システム管理部320は、ActiveノードおよびStandbyノードを決定する(S803:Active/Standbyの決定)。ここでは、例えば、システム管理部320は最初に起動したノード(つまり、自ノードであるノード3)をActiveノードとして決定する。
As illustrated in FIG. 8, the
そして、システム管理部320は、データ管理部321にActive化指示を行う(S804)。これを受けて、データ管理部321はActive化処理を開始する(S805)。そして、データ管理部321は自ノードの補助記憶部からデータ(チェックポイントとジャーナル)読み込みを開始する(S814)。
Then, the
また、ノード4においても同様に、システム管理部420は、ノード4の電源投入等を契機として、データ管理部421に起動指示を出力する(S811)。そして、起動指示を受けたデータ管理部421は起動を完了すると、システム管理部420へ起動完了通知を返す(S812)。そして、ノード3のシステム管理部320は、ActiveノードおよびStandbyノードを決定する(S813:Active/Standbyの決定)。前記したとおり、ここではノード3が最初に起動しているので、このノード3がActiveノードになる可能性が高い。しかし、ノード4は、ノード3がActiveノードとして起動完了したことを確認しないと、ノード4はStandbyノードになれないので、ノード4のシステム管理部420は、Activeノードであるノード3の処理を待つ。つまり、このノード3からのActive化の完了通知(Active化完了通知)の受信を待つ。
Similarly, in the node 4, the
図9の説明に移る。ここで、ノード3のシステム管理部320が自ノードの異常通知(例えば、ノード3のデータベースにおける障害発生の通知)を受信すると(S901)、ノード3のシステム管理部320およびノード4のシステム管理部420はActiveノードの変更を行う(S902:Active/Standbyの変更)。例えば、ノード3のシステム管理部320が自ノードの障害発生をノード4のシステム管理部420へ通知し、これに基づきシステム管理部420は、自ノードをActiveノードに変更すると決定する。このような決定をしたシステム管理部420は、データ管理部421へActive化指示を出力する(S903)。これを受けて、データ管理部421はActive化処理を開始し(S904)、自ノードからデータを読み込む(S905)。
Turning to the description of FIG. Here, when the
一方、障害が発生したノード3は、自ノードの異常に対する後処理を行う(S911)。この後のS912〜S914の処理は、前記した図8のS811〜S813の処理と同様なので説明を省略する。このような処理の後、ノード3のシステム管理部320は、Activeノードであるノード4の処理を待つ。
On the other hand, the node 3 in which the failure has occurred performs post-processing for the abnormality of the own node (S911). The subsequent processing of S912 to S914 is the same as the processing of S811 to S813 of FIG. After such processing, the
一方、ノード4のデータ管理部421はActive化を完了すると、システム管理部420へActive化完了通知を出力し(S915)、これを受けてシステム管理部420はサービスを開始する(S916)。例えば、自ノードのデータベースに記憶されたデータの読み出しや書込みを可能にする。
On the other hand, when the
この後、ノード4のシステム管理部420は、自ノードのActive化完了通知をノード3のシステム管理部320へ送信し(S917)、このような通知を受信したシステム管理部320は、自ノードをStandbyノードと決定する(S918)。そして、データ管理部321へ自ノードのStandby化指示を出力する(S919)。これを受けてデータ管理部321はStandby化処理を開始し(S920)、Activeノード(ノード4)からのデータ読み込みを行う(S921)。そして、データ管理部321は、このようなStandby化を完了すると、Standby化完了通知をシステム管理部320へ出力し(S922)、処理を終了する。つまり、ノード4はActiveノードとなり、ノード3はStandbyノードとなる。
Thereafter, the
このように、従来の冗長構成システムにおいて障害が発生し、システムのすべてのノードを再起動させたとき、Activeノードに決定されたノード(図8、図9に例示したノード3)に障害が発生すると、他のノード(図8、図9に例示したノード4)は、その障害発生後からデータの読み込みを開始する。このとき、ハードディスク等の記憶媒体に記憶されたデータの読み込み処理にはI/O(Input/Output)処理が発生する。このため、Activeノードに決定されたノードが起動に失敗すると、サービス開始に長時間を要してしまうという問題があった。 Thus, when a failure occurs in a conventional redundant configuration system and all nodes of the system are restarted, a failure occurs in the node determined as the active node (node 3 illustrated in FIGS. 8 and 9). Then, another node (node 4 illustrated in FIGS. 8 and 9) starts reading data after the occurrence of the failure. At this time, an input / output (I / O) process occurs in a process of reading data stored in a storage medium such as a hard disk. For this reason, when a node determined as an active node fails to start, there is a problem that it takes a long time to start a service.
本発明は、前記した問題を解決し、冗長構成システムの障害等により、すべてのノードを再起動する場合において、この再起動に失敗するノードがあったとしても、速やかにサービス開始できるようにすることを目的とする。 The present invention solves the above-described problem, and when all nodes are restarted due to a failure in a redundant configuration system, etc., even if there is a node that fails to restart, the service can be started promptly. For the purpose.
前記した課題を解決するため、本発明は、冗長構成システムのノードが起動されると、このノードのデータ管理部は、システム管理部からの指示を待たずに補助記憶部から記憶部上にチェックポイントとジャーナル(データ)を読み出す(読み込む)構成とした。ここでノードは、データ読み出し前に、他のノード(他のノードのデータ管理部)がまだActive状態ではないことを確認する。そして、他のノードのデータ管理部がまだActive状態でなければ、自ノードの補助記憶部からデータを読み出しておく。つまり、仮Active状態になる。一方、他のノードのデータ管理部が既にActive状態であれば、このActive状態のノードの補助記憶部からデータを読み出しておく。つまり、仮Standby状態になる。このようにすることで、ノードのデータ管理部は、起動後、システム管理部から自ノードのActive化指示を受信したとき、自ノードをすぐにActive状態に遷移させることができる。従って、冗長構成システムのノードのうち、Activeノードとして起動中の他のノードに障害が発生した場合であっても、自ノードがすぐにActiveノードになることができる。つまり、冗長構成システムは速やかにサービスを開始できるので、サービス停止時間を短くすることができる。 In order to solve the above-described problem, according to the present invention, when a node of a redundant configuration system is activated, the data management unit of this node checks from the auxiliary storage unit to the storage unit without waiting for an instruction from the system management unit. The point and journal (data) are read (read). Here, the node confirms that the other node (data management unit of the other node) is not yet in the active state before reading the data. If the data management unit of another node is not yet in the active state, data is read from the auxiliary storage unit of the own node. That is, it becomes a temporary active state. On the other hand, if the data management unit of another node is already in the active state, data is read from the auxiliary storage unit of the node in the active state. That is, it becomes a temporary standby state. By doing so, the data management unit of the node can immediately transition the own node to the active state when receiving the activation instruction of the own node from the system management unit after being activated. Therefore, even if a failure occurs in another node that is active as an active node among the nodes of the redundant configuration system, the local node can immediately become an active node. That is, since the redundant configuration system can start the service quickly, the service stop time can be shortened.
なお、データ管理部は、他のノード(他のノードのデータ管理部)がActive状態でないことを確認した上で、自ノードの補助記憶部からデータを読み込むようにしたのは、もし他のノードがActive状態であれば、自ノードがActive状態になる(Activeノードになる)可能性は低いからである。つまり、この場合、自ノードは、Standby状態になる(Standbyノードになる)可能性が高いので、他のノードの補助記憶部からデータを読み込み、Standby状態になるための準備をしておく。一方、データ管理部は、他のノードがまだActive状態でないことの確認ができれば、自ノードがActive状態になる可能性があるので、自ノードの補助記憶部からデータ読み込みを行い、Active状態になるための準備をしておく。 The data management unit confirms that the other node (data management unit of the other node) is not in the active state, and then reads the data from the auxiliary storage unit of its own node if the other node This is because if the node is in the active state, it is unlikely that the local node is in the active state (becomes an active node). That is, in this case, since the own node is highly likely to be in the Standby state (becomes a Standby node), data is read from the auxiliary storage unit of another node and preparations for entering the Standby state are made. On the other hand, if the data management unit can confirm that the other nodes are not yet in the active state, the local node may be in the active state. Therefore, the data management unit reads the data from the auxiliary storage unit of the local node and enters the active state. Get ready for.
なお、ここでの補助記憶部とは、例えば、HDD(Hard Disk Drive)や、フラッシュメモリ等、不揮発性の記憶媒体である。また、記憶部は、例えば、RAM(Random Access Memory)、HDD(Hard Disk Drive)や、フラッシュメモリ等である。 Here, the auxiliary storage unit is a non-volatile storage medium such as an HDD (Hard Disk Drive) or a flash memory. The storage unit is, for example, a RAM (Random Access Memory), a HDD (Hard Disk Drive), a flash memory, or the like.
また、ここでのチェックポイントとは、前記したとおり、ノードが管理しているデータベース中のデータの任意の時点のスナップショットである。また、ジャーナルとは、このチェックポイントからの更新差分情報である。なお、前記したとおり、補助記憶部のデータ読み込み(チェックポイントとジャーナルのロード)とは、ノードが補助記憶部のチェックポイントとジャーナルとを使って、記憶部上にデータベースを構築することを示す。 Further, the check point here is a snapshot at an arbitrary point in time of data in the database managed by the node as described above. The journal is update difference information from this checkpoint. As described above, reading data in the auxiliary storage unit (loading checkpoints and journals) indicates that the node constructs a database on the storage unit using the checkpoints and journals in the auxiliary storage unit.
すなわち、請求項1に記載の発明は、複数のノードを備える冗長構成システムにおいて、前記複数のノードの起動時に、前記複数のノードそれぞれがネットワーク経由でお互いの状態を確認し、前記複数のノードのうち、いずれか1つのノードを、サービスを提供するActiveノードとし、前記Activeノード以外のノードをStandbyノードとするノード制御方法であって、前記ノードのデータ管理部が、前記ノードのシステム管理部から、前記ノードの起動指示を受信したとき、前記ネットワーク経由で、前記冗長構成システムにおける他のノードへ、前記他のノードのデータ管理部がActive状態か否かの問い合わせ情報を送信し、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態ではないと判断したとき、自ノードの補助記憶部から、この補助記憶部に記憶されたチェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記ノードのシステム管理部が、前記複数のノードのうち、前記チェックポイントおよびジャーナルの読み出しが最初に完了したノードを前記Activeノードとして選択し、それ以外のノードを前記Standbyノードとして選択し、前記ノードのデータ管理部が、前記ノードのシステム管理部が前記自ノードを前記Activeノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、前記自ノードのデータ管理部をActive化することを特徴とするノード制御方法とした。 That is, according to the first aspect of the present invention, in the redundant configuration system including a plurality of nodes, each of the plurality of nodes confirms the state of each other via the network when the plurality of nodes are activated. A node control method in which any one of the nodes is an active node that provides a service and a node other than the active node is a standby node, wherein the data management unit of the node is connected to the system management unit of the node. When the start instruction of the node is received, the inquiry information as to whether or not the data management unit of the other node is in the active state is transmitted to the other node in the redundant configuration system via the network, and the other the response of the inquiry information from the node, the data management unit of said other node is determined not to be the Active state When reading the checkpoint and journal stored in the auxiliary storage unit from the auxiliary storage unit of the own node onto the storage unit of the own node, the system management unit of the node, among the plurality of nodes, the select the node checkpoint and journal reading has been completed first as the Active node, select the other node as the Standby node, the data management unit of the node, the system management unit of the node the own A node control method comprising: activating a data management unit of the own node when an instruction to activate the own node is received from a system management unit of the node by selecting a node as the Active node It was.
請求項7に記載の発明は、サービスを提供するActiveノードおよびそのActiveノードの待機ノードであるStandbyノードを備える冗長構成システムに用いられるノードであって、前記ノードのシステム管理部から、前記ノードの起動指示を受信したとき、ネットワーク経由で、前記冗長構成システムにおける他のノードへ、前記他のノードのデータ管理部がActive状態か否かの問い合わせ情報を送信し、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態か否かを判断する他ノード状態管理部と、前記他ノード状態管理部において、前記他のノードのデータ管理部が前記Active状態でないと判断したとき、自ノードの補助記憶部から、この補助記憶部に記憶されたチェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出す自ノードデータロード部と、前記冗長構成システムのノードのうち、前記チェックポイントおよびジャーナルの読み出しが最初に完了したノードを前記Activeノードとして選択し、それ以外のノードを前記Standbyノードとして選択するシステム管理部と、前記ノードのシステム管理部が前記自ノードを前記Activeノードとして選択したことにより、このシステム管理部から、前記自ノードのActive化指示を受信したとき、前記自ノードのデータ管理部をActive化する自ノード状態管理部とを備えることを特徴とするノードとした。 The invention according to claim 7 is a node used in a redundant configuration system including an active node that provides a service and a standby node that is a standby node of the active node. When receiving the activation instruction, the inquiry information from the other nodes is transmitted via the network to other nodes in the redundant configuration system whether or not the data management unit of the other nodes is in the active state. the response information, and the other node state management unit the data managing unit of the other nodes to determine whether the Active state, the in another node status management unit, a data management unit of the other nodes the Active state When it is determined that the checkpoint and the journal stored in the auxiliary storage unit are The node that has read the checkpoint and the journal first is selected as the Active node among the node data load unit to be read on the storage unit of the node and the node of the redundant configuration system , and the other nodes When the system management unit that selects the standby node and the system management unit of the node select the local node as the active node, the system management unit receives an activation instruction for the local node. The node includes a self-node state management unit that activates the data management unit of the self-node.
このようにすることで、冗長構成システムのノードのうち、他のノードのデータ管理部がまだActive状態でないことが確認できたノードは、自ノードの補助記憶部からデータを読み出す。つまり、仮Active状態になる。そして、ノードのデータ管理部は、システム管理部から自ノードのActive化指示を受信したとき、自ノードをすぐにActive状態に遷移させることができる。従って、冗長構成システムのノードのうち、Activeノードとして起動中の他のノードに障害が発生した場合であっても、自ノードがすぐにActive状態になることができ、速やかにサービスを開始できる。 By doing so, a node that has confirmed that the data management unit of another node is not yet in the active state among the nodes of the redundant configuration system reads the data from the auxiliary storage unit of its own node. That is, it becomes a temporary active state. Then, the data management unit of the node can immediately transition the own node to the active state when receiving the activation instruction of the own node from the system management unit. Therefore, even when a failure occurs in another node that is active as an active node among the nodes of the redundant configuration system, the own node can immediately enter the active state, and the service can be started promptly.
請求項2に記載の発明は、請求項1に記載のノード制御方法において、前記ノードのデータ管理部が、前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、前記自ノードの記憶部上の前記チェックポイントおよびジャーナルを破棄し、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記自ノードのデータ管理部をStandby化することを特徴とするノード制御方法とした。 According to a second aspect of the present invention, in the node control method according to the first aspect, the data management unit of the node causes the system management unit of the node to select the own node as the standby node. When the standby instruction of the local node is received from the system management unit of the local node, the checkpoint and journal on the storage unit of the local node are discarded, and another node selected as the active node via the network The node control method is characterized in that the checkpoint and the journal are read out from the auxiliary storage unit to the storage unit of the own node, and the data management unit of the own node is set to Standby.
請求項8に記載の発明は、請求項7に記載のノードにおいて、前記他ノード状態管理部において、前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、前記他ノードデータロード部は、前記自ノードの前記記憶部上の前記チェックポイントおよびジャーナルを破棄し、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、この補助記憶部に記憶された前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記自ノード状態管理部は、前記自ノードのデータ管理部をStandby化することを特徴とするノードとした。 According to an eighth aspect of the present invention, in the node according to the seventh aspect, in the other node state management unit, the system management unit of the node selects the own node as the Standby node, whereby the system of the node When receiving the standby instruction of the own node from the management unit, the other node data load unit discards the checkpoint and journal on the storage unit of the own node, and the Active node via the network The check point and journal stored in the auxiliary storage unit are read out from the auxiliary storage unit of the other node selected as the local node storage unit, and the local node state management unit reads the data of the local node The node is characterized in that the management unit is set to Standby.
このようにすることで、冗長構成システムのノードのうち、他のノードのデータ管理部がまだActive状態でないことが確認できたノードは、自ノードの補助記憶部からデータを読み出す(仮Active状態になる)。そして、このノードのデータ管理部は、システム管理部から自ノードのStandby化指示を受信したとき、いったん自ノードの記憶部上のデータを破棄し、ネットワーク経由で、Activeノードの補助記憶部からデータを読み出し直す。つまり、仮Active状態のノードを、Standby化することができる。 In this way, among the nodes of the redundant configuration system, the node that has confirmed that the data management unit of the other node is not yet in the active state reads the data from the auxiliary storage unit of its own node (in the temporary active state) Become). When the data management unit of this node receives the standby instruction of its own node from the system management unit, the data management unit once discards the data on the storage unit of its own node and transmits data from the auxiliary storage unit of the Active node via the network. Read again. That is, the node in the temporary active state can be changed to standby.
請求項3に記載の発明は、請求項1または請求項2に記載のノード制御方法において、前記ノードのデータ管理部が、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記ノードのデータ管理部が、前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、前記自ノードのデータ管理部をStandby化することを特徴とするノード制御方法とした。 According to a third aspect of the present invention, in the node control method according to the first or second aspect, the data management unit of the node causes a response of the inquiry information from the other node to when the data management unit determines that the is an Active state, via the network, from the auxiliary storage unit of another node selected as the Active node reads the checkpoint and journal in a storage unit of the own node The data management unit of the node receives the standby instruction of the local node from the system management unit of the node by the system management unit of the node selecting the local node as the standby node. The node control method is characterized in that the data management unit of its own node is set to Standby.
請求項9に記載の発明は、請求項7または請求項8に記載のノードにおいて、前記ノードのデータ管理部において、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断し、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記ノードのデータ管理部が、前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、前記自ノードのデータ管理部をStandby化することを特徴とするノードとした。 According to a ninth aspect of the present invention, in the node according to the seventh or eighth aspect, in the data management unit of the node, the data management of the other node is performed based on a response to the inquiry information from the other node. part is determined to the be Active state, via the network, from the auxiliary storage unit of another node selected as the Active node reads the checkpoint and journal in a storage unit of the own node, the node When the node's system management unit has selected the local node as the standby node , the data management unit of the node receives the standby instruction of the local node from the system management unit of the node. The node is characterized by changing the data management unit to Standby.
このようにすることで、冗長構成システムのノードが起動され、他のノードのデータ管理部がActive状態であることが確認できたノードは、他ノードの補助記憶部からデータを読み出す(仮Standby状態になる)。そして、このノードのデータ管理部は、システム管理部から自ノードのStandby化指示を受信したとき、自ノードのデータ管理部をStandby化する。つまり、仮Standby状態のノードを、Standby化することができる。 By doing so, the node of the redundant configuration system is activated, and the node that has confirmed that the data management unit of the other node is in the active state reads the data from the auxiliary storage unit of the other node (provisional standby state) become). Then, when the data management unit of the node receives the standby instruction for the local node from the system management unit, the data management unit of the local node is switched to the standby mode. That is, a node in the temporary standby state can be changed to standby.
請求項4に記載の発明は、請求項1または請求項2に記載のノード制御方法において、前記ノードのデータ管理部が、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記ノードのデータ管理部が、前記他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出した後に、前記ノードのシステム管理部が、前記他のノードが前記Active状態でなくたったことを検知したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、前記自ノードのデータ管理部をActive化することを特徴とするノード制御方法とした。 According to a fourth aspect of the present invention, in the node control method according to the first or second aspect , the data management unit of the node causes the other node to respond to the inquiry information from the other node. When the data management unit determines that it is in the Active state, the checkpoint and journal are read out from the auxiliary storage unit of another node selected as the Active node to the storage unit of the local node via the network. The data management unit of the node reads the checkpoint and journal from the auxiliary storage unit of the other node onto the storage unit of the own node, and then the system management unit of the node by it is detected that the standing rather than the Active state, the system management unit of the node, Active directive of the own node When receiving, and the node control method characterized by Active the data management unit of the own node.
請求項10に記載の発明は、請求項7または請求項8に記載のノードにおいて、前記ノードのデータ管理部において、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断し、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、前記ノードのデータ管理部が、前記他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出した後に、前記ノードのシステム管理部が、前記他のノードが前記Active状態でなくたったことを検知したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、前記自ノードのデータ管理部をActive化することを特徴とするノードとした。 According to a tenth aspect of the present invention, in the node according to the seventh or eighth aspect , in the data management unit of the node, the data management of the other node is performed based on a response to the inquiry information from the other node. And the node reads out the checkpoint and journal from the auxiliary storage unit of another node selected as the Active node via the network to the storage unit of the own node, data management unit, from the auxiliary storage unit of the other nodes, after reading the checkpoint and journal in a storage unit of the own node, the system management unit of the node, the other nodes the Active state by standing and that it has been detected but, from the system management unit of the node, receiving an Active directive of the own node When I was a node, characterized in that Active the data management unit of the own node.
このようにすることで、冗長構成システムのノードが起動され、他のノードのデータ管理部がActive状態であることが確認できたノードは、他ノードの補助記憶部からデータを読み出す(仮Standby状態になる)。そして、このノードのデータ管理部は、システム管理部から自ノードのActive指示を受信したとき、自ノードのデータ管理部をActive化する。つまり、仮Standby状態のノードを、Active化することができる。 By doing so, the node of the redundant configuration system is activated, and the node that has confirmed that the data management unit of the other node is in the active state reads the data from the auxiliary storage unit of the other node (provisional standby state) become). Then, the data management unit of this node activates the data management unit of the own node when receiving the Active instruction of the own node from the system management unit. In other words, a node in the temporary standby state can be made active.
請求項5に記載の発明は、請求項3または請求項4に記載のノード制御方法において、前記ノードのデータ管理部が、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出す際に、前記チェックポイントおよびジャーナルを読み出せなかったとき、前記自ノードの補助記憶部から、前記チェックポイントおよびジャーナルを読み出すことを特徴とするノード制御方法とした。 According to a fifth aspect of the present invention, in the node control method according to the third or fourth aspect, the data management unit of the node causes a response of the inquiry information from the other node in response to the inquiry information from the other node. When the data management unit determines that it is in the active state, the checkpoint and journal are read out from the auxiliary storage unit of the other node selected as the active node onto the storage unit of the own node via the network. In this case, the node control method is characterized in that, when the checkpoint and the journal cannot be read , the checkpoint and the journal are read from the auxiliary storage unit of the own node.
このようにすることで、冗長構成システムのノードが、仮Standby状態になるため、またはStandbyノードになるため、他のノードからのデータ読み込もうとして失敗した場合、仮Active状態になることができる。 By doing in this way, since the node of the redundant configuration system is in a temporary standby state or becomes a standby node, if an attempt to read data from another node fails, it can be in a temporary active state.
請求項6に記載の発明は、請求項1ないし請求項5のいずれか1項に記載のノード制御方法を、コンピュータであるノードに実行させるためのノード制御プログラムとした。 The invention described in claim 6 is a node control program for causing a node which is a computer to execute the node control method according to any one of claims 1 to 5.
このような制御プログラムによれば、請求項1ないし請求項5のいずれか1項に記載の制御方法をコンピュータであるノードに実行させることができる。 According to such a control program, a control method according to any one of claims 1 to 5 can be executed by a node which is a computer.
本発明によれば、冗長構成のノードを含むシステムの障害等により、すべてのノードを再起動する場合において、この再起動に失敗するノードがあったとしても、速やかにサービスを開始できる。 According to the present invention, when all nodes are restarted due to a failure or the like of a system including redundantly configured nodes, even if there is a node that fails to restart, the service can be started promptly.
以下、本発明を実施するための最良の形態(以下、実施の形態という)を、図面を参照しながら説明する。 Hereinafter, the best mode for carrying out the present invention (hereinafter referred to as an embodiment) will be described with reference to the drawings.
<冗長構成システムの概要>
まず、図1を用いて本実施の形態の冗長構成システムの概要を説明する。図1は、本実施の形態の冗長構成システムの概要を説明する図である。ここでは、図1の冗長構成システムは、補助記憶部を非共有とするノード1,2の2台のノードにより構成される場合を例に説明する。
<Overview of redundant configuration system>
First, the outline of the redundant configuration system according to the present embodiment will be described with reference to FIG. FIG. 1 is a diagram for explaining the outline of the redundant configuration system according to the present embodiment. Here, the redundant configuration system of FIG. 1 will be described as an example in which the redundant configuration system is configured by two nodes 1 and 2 that do not share the auxiliary storage unit.
ノード1は、システム管理部120と、データ管理部121と、補助記憶部13と、記憶部14とを備える。このシステム管理部120は、他のノード(ノード2)と情報を交換して、ActiveノードとStandbyノードとを決定する。また、データ管理部121は、補助記憶部13(または、補助記憶部23)に記憶されるデータの管理を行う。さらに、このデータ管理部121は、他のノード(ノード2)のデータ管理部221がActive状態か否かを確認して、自ノードを仮Active状態(詳細は後記)または仮Standby状態(詳細は後記)に遷移させる。また、このデータ管理部121は、補助記憶部13(または、補助記憶部23)に記憶されるデータを記憶部14上に読み出す。また、補助記憶部13は、このデータベースのチェックポイントおよびジャーナルを記憶する。なお、この補助記憶部13は、HDD、フラッシュメモリ等の不揮発性の記憶媒体から構成される。また、記憶部14は、RAM、HDD、フラッシュメモリ等の記憶媒体から構成される。さらに、以下の説明において、補助記憶部13,23のデータ読み込み(チェックポイントとジャーナルのロード)とは、データ管理部121が補助記憶部13,23のチェックポイントとジャーナルとを使って、自ノードの記憶部14(記憶部24)にデータベースを構築することを示す。
The node 1 includes a
また、このノード1のペアとなるノード2も、システム管理部220と、データ管理部221と、補助記憶部23と、記憶部24とを備える。このシステム管理部220と、データ管理部221と、補助記憶部23とは、それぞれ、ノード1のシステム管理部120と、データ管理部121と、補助記憶部13と同じ機能なので説明を省略する。このノード1とノード2とはクロスケーブル等により接続され、お互いにデータの送受信を行う。ここでは、冗長構成システムの障害発生後、ノード1,2両方のリセットのため、ノード1,2に電源を投入して再起動させる場合を例に説明する。
Further, the node 2 that is a pair of the node 1 also includes a
電源投入等により、ノード1が起動すると、データ管理部121は、ノード2のデータ管理部221がActive状態か否かを確認する状態確認を行う。そして、データ管理部121は、ノード2のデータ管理部221がActive状態でないことを確認すると、自ノードの補助記憶部13から記憶部14上にデータ(チェックポイントとジャーナル)を読み込む。つまり、ノード2のデータ管理部221がActive状態でなければ、自ノードがActiveノードになる可能性があるので、事前に自身の補助記憶部13からデータを読み込んで、記憶部14上にデータベースを構築しておく。以下、このようなノードの状態を仮Active状態と呼ぶ。
When the node 1 is activated due to power-on or the like, the
また、ノード2も電源投入等により起動する。そして、ノード2のデータ管理部221も、ノード1のデータ管理部121がActive状態でないことを確認すると、自ノードの補助記憶部23からデータ(チェックポイントとジャーナル)を読み込み、仮Active状態になる。このように、ノード1,2は、他のノードのデータ管理部121,221がActive状態でなければ、自ノードがActiveノードになる可能性があるので、事前に自身の補助記憶部13,23からデータを読み込んでおき、記憶部14,24上にデータベースを構築しておく。
The node 2 is also activated when the power is turned on. When the
なお、ここでは説明を省略しているが、ノード1,2は他のノードのデータ管理部221,121がActive状態である場合、この他のノードの補助記憶部23,13からデータを読み込む。つまり、ノード1,2は、他のノードのデータ管理部221,121がActive状態であれば、自ノードがStandbyノードになる可能性があるので、事前に他のノードの補助記憶部23,13からデータを読み込んでおき、記憶部24,14上にデータベースを構築しておく。以下、このようなノードの状態を仮Standby状態と呼ぶ。
Although explanation is omitted here, the nodes 1 and 2 read data from the
このようにして仮Active状態になったノード1に障害が発生すると、ノード2は以下のような処理を行う。すなわち、ノード2のシステム管理部220において、ノード1に障害が発生したことを検知すると、自ノード(ノード2)をActiveノードにすることを決定する。次に、システム管理部220からのActive化指示を受けたデータ管理部221は自身のActive化処理を行う。そして、Active化処理を完了すると、ノード2はサービスを開始する。このようにノード2は、既にデータの読み込みを済ませてあるので、ノード1が起動に失敗した場合でも、ノード2は速やかにActiveノードに切り替わり、データベースを用いたサービスを開始できる。
When a failure occurs in the node 1 in the temporary active state in this way, the node 2 performs the following processing. That is, when the
なお、起動に失敗したノード1は、その後の電源再投入等により、再起動を開始する。そして、ノード1は、ノード2のデータ管理部221がActive状態であることを確認すると、このノード2からデータを読み込み、仮Standby状態になる。この後、システム管理部120からのStandby化指示を受信すると、これを受けてデータ管理部121はStandby状態になる。
Note that the node 1 that has failed to start up restarts when the power is turned on again thereafter. When the node 1 confirms that the
<ノードの詳細>
次に、図2を用いて、本実施の形態の冗長構成システムのノード1,2を詳細に説明する。図2は、図1の各ノードの構成を示したブロック図である。ノード1,2は同じ構成であるので、ここでは代表してノード1を説明する。
<Node details>
Next, the nodes 1 and 2 of the redundant configuration system of this embodiment will be described in detail with reference to FIG. FIG. 2 is a block diagram showing the configuration of each node in FIG. Since the nodes 1 and 2 have the same configuration, the node 1 will be described as a representative here.
なお、ノード1は、例えば、コンピュータにより実現され、ノード2等の外部装置とデータ送受信を行うための入出力部11と、補助記憶部13および記憶部14のデータの管理や、ActiveノードおよびStandbyノードの決定等を行う処理部12と、データベース140が構築される記憶部14と、このデータベース140のチェックポイント131やジャーナル132等を記憶する補助記憶部13とを含んで構成される。
Note that the node 1 is realized by, for example, a computer and manages data in the input /
入出力部11は、外部装置と各種データの入出力を行うための入出力インタフェースや、通信インタフェース等から構成される。
The input /
また、処理部12は、このノード1が備えるCPU(Central Processing Unit)によるプログラム実行処理や、専用回路等により実現される。
The
補助記憶部13は、HDD、フラッシュメモリ等の記憶媒体から構成される。また、記憶部14は、RAM、HDD、フラッシュメモリ等の記憶媒体から構成される。なお、処理部12の機能をソフトウェア的に実現する場合、この補助記憶部13には、ノード1の機能を実現するためのプログラムが記憶される。つまり、CPUが、この補助記憶部13に記憶されるプログラムを記憶部14上に展開し、実行することで前記した処理部12の機能を実現する。
The
なお、以下の説明において、冗長構成システムのStandbyノードが1台である場合を例に説明するが、Standbyノードは複数台であってもよい。また、このノード1,2はLAN(Local Area Network)、インターネット等のネットワークに接続されていてもよい。さらに、このノード1には、キーボードやマウス等の入力装置、液晶ディスプレイ等の出力装置等が接続されていてもよい。 In the following description, a case where there is one standby node in the redundant configuration system will be described as an example, but there may be a plurality of standby nodes. The nodes 1 and 2 may be connected to a network such as a LAN (Local Area Network) or the Internet. Further, an input device such as a keyboard and a mouse, an output device such as a liquid crystal display, and the like may be connected to the node 1.
<入出力部>
入出力部11は、前記したとおり、外部装置と各種データの入出力を司る。例えば、他のノードの状態確認(詳細は後記)、Active化完了通知、他ノードとの間でのデータ等の入出力を司る。
<Input / output unit>
As described above, the input /
<処理部>
処理部12は、システム管理部120と、データ管理部121とを備える。
<Processing unit>
The
このシステム管理部120は、Activeノードになるノード、Standbyノードになるノードを決定する。つまり、システム管理部120は、冗長構成システムにおいて、矛盾がないよう、データ管理部121の状態(Active状態か、Standby状態か)を管理する。なお、このシステム管理部120は、冗長構成システムのノードに実装される公知のミドルウェア等を用いてよい。
The
データ管理部121は、システム管理部120から起動指示を受け付けると、他のノード(ノード2)のデータ管理部221の状態確認を行い、自ノードが仮Active状態になるか、仮Standby状態になるかを判断する。また、システム管理部120からの指示に基づき自ノードのデータ管理部121をActive状態に遷移させたり、Standby状態に遷移させたりする。このようなデータ管理部121は、インタフェース部122と、状態制御部123と、データロード部126とを備える。なお、データ管理部121をActive状態にするとは、外部からのアプリケーション処理を受け付ける状態にすることであり、データ管理部121をStandby状態にするとは、Activeノードから送信されるジャーナルを自ノードの補助記憶部13に反映できる状態にすることを示す。
When the
インタフェース部122は、前記したシステム管理部120とデータ管理部121とのデータ送受信のインタフェースである。例えば、システム管理部120からの起動指示や、Active状態またはStandby状態への状態遷移指示(Active化指示またはStandby化指示)を受信したり、データ管理部121からの起動完了通知を出力したりするためのインタフェースである。
The
状態制御部123は、自ノードのデータ管理部121の状態(Active状態かStandby状態か)を制御する。この状態制御部123は、他ノード状態管理部124と自ノード状態管理部125とを備える。
The
他ノード状態管理部124は、他のノード(例えば、ノード2)に対し、この他のノードのデータ管理部(例えば、ノード2のデータ管理部221)の状態がActive状態か否かを問い合わせる情報を送信する。そして、その情報の応答により、データ管理部221がActive状態か否かを判断し、この判断結果を記憶部14の所定領域に記憶しておく。例えば、Active状態か否かを問い合わせる情報の送信後、所定時間経過しても、ノード2からこのノード2のデータ管理部221の状態がActive状態である旨の応答がなかった場合、このノード2はActive状態ではないと判断する。そして、その判断結果を記憶部14の所定領域に記憶しておく。一方、所定時間以内に、ノード2からこのノード2のデータ管理部221の状態がActive状態である旨の応答があれば、このノード2はActive状態であると判断する。そして、その判断結果を記憶部14の所定領域に記憶しておく。
The other node
自ノード状態管理部125は、記憶部14に記憶された他のノードのデータ管理部221の状態(Active状態か否か)や、システム管理部120からの状態遷移指示に基づき自ノードの状態(例えば、仮Active状態、仮Standby状態、Active状態、Standby状態等)を決定する。そして、決定した自ノードの状態を記憶部14に記憶しておく。また、他のノード(ノード2等)側から、自ノードのデータ管理部(例えば、ノード1のデータ管理部121)の状態がActive状態か否かを問い合わせる情報を受信したとき、その応答をノード2へ返す。
The own node
データロード部126は、自ノードの補助記憶部13または他のノードの補助記憶部23から、自ノードの記憶部14上にデータ(チェックポイント131,231とジャーナル132,232)を読み込むことで、記憶部14上にデータベース140を構築する。このようなデータロード部126は、自ノードデータロード部127と、他ノードデータロード部128とを備える。
The
自ノードデータロード部127は、状態制御部123からの指示に基づき、自ノードの補助記憶部13から、自ノードの記憶部14上にデータを読み込ことで、記憶部14上にデータベース140を構築する。また、他ノードデータロード部128は、入出力部11,21経由で他のノード(例えば、ノード2)の補助記憶部23から、データを読み込む。
The own node data load
なお、前記したデータ管理部121の機能は、システム管理部120の一部に組み込むようにしてもよい。
Note that the functions of the
<記憶部>
記憶部14は、データ管理処理部121が構築したデータベース140を記憶する。また、図示を省略しているが、自ノードおよび他のノードの状態(例えば、仮Active状態、仮Standby状態、Active状態、Standby状態等)を記憶する。
<Storage unit>
The
<補助記憶部>
補助記憶部13は、記憶部14のデータベース140のチェックポイント131およびジャーナル132を記憶する。
<Auxiliary storage unit>
The
これらの構成の詳細は、動作手順の説明の項で後記する。 Details of these configurations will be described later in the description of the operation procedure.
<動作手順>
次に、図2を参照しつつ、図3を用いてノード1,2の動作手順を説明する。図3は、図2の各ノードの動作手順を例示したフローチャートである。ここでも代表してノード1の動作手順を説明する。
<Operation procedure>
Next, the operation procedure of the nodes 1 and 2 will be described with reference to FIG. FIG. 3 is a flowchart illustrating an operation procedure of each node in FIG. Here again, the operation procedure of the node 1 will be described as a representative.
電源投入等により、ノード1が起動すると、データ管理部121のインタフェース部122は、システム管理部120から起動指示を受け付ける(S301)。このような起動指示を受けたデータ管理部121は、他のノードの状態確認を行う(S302)。つまり、ノード1の他ノード状態管理部124は、他のノード(ノード2)のデータ管理部221の状態がActive状態か否かを問い合わせる情報を送信し、その応答を待つ。そして、他ノード状態管理部124は、この応答から、ノード2のデータ管理部221の状態がActive状態ではないと判断したとき(S303でActive以外)、自ノード状態管理部125は自ノードを仮Active状態にすることを決定し(S307)、データロード部126に対して、自ノード(ノード1)からのデータ読み込みを指示する。そして、自ノードデータロード部127は、ノード1の補助記憶部13からのデータ読み込みを開始する(S308)。この後、データ読み込みが完了し、自ノードの起動が完了すると、自ノード状態管理部125は自ノードの状態が仮Active状態になったことを記憶部14等に記憶し、起動完了通知をインタフェース部122経由でシステム管理部120へ出力する(S309)。
When the node 1 is activated due to power-on or the like, the
一方、S303において、他ノード状態管理部124は、ノード2のデータ管理部221の状態をActive状態と判断したとき(S303でActive)、自ノード状態管理部125は自ノードを仮Standby状態にすることを決定し(S304)、データロード部126に対して、他ノード(ノード2)からのデータ読み込みを指示する。そして、他ノードデータロード部128は、入出力部11経由でノード2の補助記憶部23からのデータ読み込みを開始する(S305)。この後、ノード2の補助記憶部23からのデータ読み込みに成功し(S306でNo)、自ノードの起動が完了すると、自ノード状態管理部125は自ノードの状態が仮Standby状態になったことを記憶部14等に記憶する。そして、起動完了通知をインタフェース部122経由でシステム管理部120へ出力する(S309)。
On the other hand, in S303, when the other node
一方、S306において他ノードデータロード部128がノード2の補助記憶部23からのデータ読み込みに失敗した場合(S306でYes)、自ノード状態管理部125は、自ノードを仮Active状態にすることを決定し(S307)、データロード部126に対して、自ノード(ノード1)からのデータ読み込みを指示する。そして、自ノードデータロード部127は、補助記憶部13からデータを読み込む(S309)。
On the other hand, when the other node data load
このようにノード1は、他のノードの状態確認を行った上で、自ノードからデータを読み込んで仮Active状態になったり、他ノードからデータを読み込んで仮Standby状態になったりする。 As described above, the node 1 confirms the state of the other node, and then reads data from its own node to enter a temporary active state, or reads data from another node to enter a temporary standby state.
なお、ここでは説明を省略したが、前記した処理によりデータ管理部121から起動完了通知を受け付けると、システム管理部120は自ノードをActiveノードとするか、Standbyノードとするかを決定する。すなわち、システム管理部120は、他のノード(ノード2)のシステム管理部220に、このノード2がActiveノードであるかStandbyノードであるかを確認し、その結果、他のノードがActiveノードであるとき、自ノードをStandbyノードにすると決定する。そして、状態遷移指示としてデータ管理部121に対し、Standby化指示を出力する。一方、他のノードがStandbyノードであるとき、または障害等が発生しているとき、システム管理部120は、自ノードをActiveノードにすると決定する。そして、状態遷移指示として、データ管理部121に対しActive化指示を出力する。
Although not described here, when the activation completion notification is received from the
この後の処理を、図2を参照しつつ、図4を用いて説明する。図4は、図2の各ノードの動作手順を例示したフローチャートである。ここでも代表してノード1の動作手順を説明する。 The subsequent processing will be described with reference to FIG. 4 and FIG. FIG. 4 is a flowchart illustrating an operation procedure of each node in FIG. Here again, the operation procedure of the node 1 will be described as a representative.
まず、データ管理部121の状態制御部123は、インタフェース部122経由でシステム管理部120から状態遷移指示を受け付けると(S401)、この指示種別を判断する(S402)。ここで、指示種別がActive化指示である場合(S402でActive化)、データ管理部121は自ノード(自ノードのデータ管理部121)をActive化した後(S407)、Active化完了を示す状態遷移完了通知をシステム管理部120へ出力する(S408)。これを受けて、システム管理部120は自ノード全体のActive化処理(例えば、自ノードのアプリケーションモジュールのActive化)を行い、サービスを開始する。つまり、起動後、自ノードまたは他のノードからデータの読み込みをしておいたデータ管理部121は、システム管理部120からのActive化指示が出力されたとき、アプリケーション13からのデータ検索処理等を行えるようにする。
First, when the
一方、S402において、システム管理部120からの指示種別がStandby化指示であり(S402でStandby化)、かつ、自ノード状態管理部125が自ノードの状態(つまり、データ管理部121の状態)を仮Standby状態と判断したとき(S403で仮Standby状態)、データ管理部121は自ノード(自ノードのデータ管理部121)をStandby化した後(S406)、Standby化完了を示す状態遷移完了通知をシステム管理部120へ出力する(S408)。
On the other hand, in S402, the instruction type from the
また、S403において、自ノード状態管理部125が自ノードの状態(つまり、データ管理部121の状態)を仮Active状態と判断したとき(S403で仮Active状態)、データ管理部121は自ノードの状態をStandby化するため以下の処理を行う。すなわち、まず、自ノード状態管理部125は、自ノードの補助記憶部13から読み込んだデータを破棄する(S404)。そして、自ノード状態管理部125は、他ノードデータロード部128へ他のノードの補助記憶部23からのデータ読み込みを指示する。これを受けて、他ノードデータロード部128は、入出力部11経由で、他のノードの補助記憶部23からデータを読み込む(S405)。そして、データ読み込みを完了し、データ管理部121は自ノード(自ノードのデータ管理部121)をStandby化した後(S406)、Standby化完了を示す状態遷移完了通知をシステム管理部120へ出力する(S408)。このような状態遷移完了通知を受けたシステム管理部120は自ノード全体のStandby化処理を行う。
In S403, when the own node
<動作手順の例>
次に、図2を参照しつつ、図5および図6を用いて、ノード1,2の動作手順の例を説明する。図5および図6は、図2の各ノードの動作手順を例示したフローチャートである。また、ここでは、短時間の時間差をもってノード1,2に電源が投入され、最初に起動したノード1に障害が発生し、後から起動したノード2がActiveノードになる場合を例に説明する。
<Example of operation procedure>
Next, an example of the operation procedure of the nodes 1 and 2 will be described using FIG. 5 and FIG. 6 with reference to FIG. 5 and 6 are flowcharts illustrating the operation procedure of each node in FIG. Here, a case will be described as an example where the nodes 1 and 2 are powered on with a short time lag, a failure occurs in the first activated node 1, and the later activated node 2 becomes an active node.
ノード1において、インタフェース部122は、システム管理部120から起動指示を受ける(S501)。このような起動指示を受けると状態制御部123の他ノード状態管理部124は、ノード2のデータ管理部221に対し状態確認を行う(S502)。つまり、ノード1の他ノード状態管理部124は、ノード2のデータ管理部121の状態がActive状態か否かを問い合わせる情報を送信し、その応答を受信する(S503)。この段階では、ノード2はまだ起動されていないため、状態は不定である。このため、ノード1の自ノード状態管理部125は、自ノードを仮Active状態にすると決定し(S504)、自ノードデータロード部127に対し、自ノードからのデータ読み込みを指示する。そして、自ノードデータロード部127は自ノードの補助記憶部13からのデータ読み込みを開始する(S505)。
In the node 1, the
一方、ノード2において、インタフェース部222は、システム管理部220から起動指示を受けると(S511)、ノード1での処理と同様に、他ノード状態管理部224は、ノード1のデータ管理部121に対し状態確認を行う(S512)。つまり、ノード2の他ノード状態管理部224は、ノード1のデータ管理部121の状態がActive状態か否かを問い合わせる情報を送信し、その応答を受信する(S513)。この段階では、ノード1はまだ完全にActiveノードにはなっていない。そのため、このノード1からの応答をもとに、ノード2の他ノード状態管理部224は、ノード1はActive状態ではないと判断する。そして、自ノード状態管理部225は、自ノードを仮Active状態にすると決定し(S514)、自ノードデータロード部227に対し、自ノードからのデータ読み込みを指示する。そして、自ノードデータロード部227は自ノードの補助記憶部23からのデータ読み込みを開始する(S515)。
On the other hand, in the node 2, when the
図6の説明に移る。通常、このような冗長構成システムにおいて先に起動を開始したノードが早く起動完了するが、先に起動を開始したノード1の起動中に何らかの障害が発生した場合、データ管理部121は、システム管理部120へ異常通知(障害が発生したこと)を出力する(図6のS601)。
Turning to the description of FIG. Normally, in such a redundant configuration system, the node that started first completes the startup earlier, but if any failure occurs during the startup of the node 1 that started first, the
異常検知を受信したシステム管理部120は、後処理を行い(S602)、ノード1の再起動を行う。なお、障害の状態によっては、データ管理部121はシステム管理部120へ異常通知を出力することができない場合もあるが、このような場合、システム管理部120の備えるプロセス管理機能や、起動監視プロセスのタイムアウトにより異常検知を行うようにしてもよい。
Upon receiving the abnormality detection, the
一方、ノード2の自ノードデータロード部227において、自ノードからのデータ読み込みが完了すると、データ管理部221は、インタフェース部222によりシステム管理部220へ起動完了通知を出力する(S611)。これを受けたシステム管理部220は、冗長構成システムのノードのうち、どのノードをActiveノードとするかを決定する(S612)。なお、ここでのActiveノードの決定は、公知の技術を用いてよいが、サービス停止時間を極力短縮するために、例えば、最初に起動完了したノードをActiveノードとして決定する。すなわち、システム管理部220は、他のノード(ノード1)がActiveノードかStandbyノードかの確認を行い、その結果、他のノード(ノード1)が既にActiveノードであれば、自ノード(ノード2)をStandbyノードにすると決定し、まだActiveノードでなければ、自ノード(ノード2)をActiveノードにすると決定する。ここでは、自ノード(ノード2)のシステム管理部220は、まだ他のノード(ノード1)がActiveノードではないので、自ノード(ノード2)をActiveノードにすると決定する。
On the other hand, when the own node data load
このような決定をしたシステム管理部220は、データ管理部221へActive化指示を出力する(S613)。そして、データ管理部221の自ノード状態管理部225は、自ノード(自ノードのデータ管理部221)のActive化処理を実行する(S614)。この後、自ノード状態管理部225はActive化処理を完了すると、システム管理部220へActive化完了通知(Active化完了を示す状態遷移完了通知)を出力する(S615)。これを受けて、システム管理部220は、自ノード全体のActive化処理(例えば、自ノードのアプリケーションモジュールのActive化)を行い、サービスを開始する(S616)。
The
このようにすることで、冗長構成システムにおいてノード1が起動に失敗した場合でも、速やかにサービスを開始できる。なお、図示を省略しているが、ノード2のシステム管理部220は、自ノード全体のActive化処理を完了すると、入出力部21経由で自ノードのActive化完了通知をノード1のシステム管理部120へ送信しておく。
In this way, even if the node 1 fails to start in the redundant configuration system, the service can be started promptly. Although not shown, when the
一方、起動に失敗し、再起動を行ったノード1は、前記した図5のS501〜S503と同様に以下の処理を行う。すなわち、データ管理部121は、システム管理部120からの起動指示を受けると(S621)、他ノード状態管理部124により、ノード2のデータ管理部221に対し状態確認を行い(S622)、このデータ管理部221からその応答を受信する(S623)。
On the other hand, the node 1 that failed to start and restarted performs the following processing in the same manner as S501 to S503 in FIG. That is, when the
この段階では、ノード2のデータ管理部221はActive状態である。そのため、他ノード状態管理部124は、ノード2から、データ管理部221はActive状態である旨の応答を受信する。これにより、他ノード状態管理部124は、ノード2のデータ管理部221はActive状態と判断し、自ノード状態管理部125は、自ノードを仮Standby状態にすると決定する(S624)。そして、データロード部126に対し、ノード2からのデータ読み込みを指示し、他ノードデータロード部128は、ノード2の補助記憶部23からデータを読み出す(S625)。
At this stage, the
この後、ノード1のデータ管理部121は起動を完了すると、システム管理部120へ起動完了通知を出力する(S626)。このような通知を受けたノード1のシステム管理部120は、他のノード(ノード2)に、このノード2の状態を問い合わせ、自ノード(ノード1)をStandbyノードにすると決定する(S627)。そして、ノード1のシステム管理部120は、データ管理部121へStandby化指示を出力し(S628)、これを受けてデータ管理部121は、自ノード状態管理部125において、自ノード(自ノードのデータ管理部121)のStandby化処理を実行する(S629)。次に、自ノード状態管理部125は自ノード(自ノードのデータ管理部121)のStandby化処理を完了すると、システム管理部120へStandby化完了通知を出力し(S630)、処理を終了する。
Thereafter, when the
このようにノード1が起動に失敗し、ノード2がActiveノードになった場合、ノード1はいったん仮Standby状態になり、その後、Standbyノードとして起動する。 In this way, when the node 1 fails to start and the node 2 becomes an active node, the node 1 temporarily enters the standby state, and then starts as a standby node.
なお、ここでは説明を省略したが、前記した処理によりActiveノードとして起動したノード2は、Standbyノードとして起動したノード1へジャーナルの送信を開始する。 Although explanation is omitted here, the node 2 activated as the active node by the above-described processing starts transmission of the journal to the node 1 activated as the standby node.
また、前記した実施の形態において、仮Standby状態のノードがStandbyノードとして起動する場合について説明したが、Activeノードとして起動する場合もある。例えば、ノード1が仮Standby状態になった後、障害発生等によりノード2側がActive状態ではなくなった場合、これを検知したノード1は仮Standby状態からActive状態に遷移する。つまり、ノード1がActiveノードになり、サービスを開始する。 Further, in the above-described embodiment, the case where the node in the temporary standby state is activated as the standby node has been described. However, the node may be activated as the active node. For example, after the node 1 is in the temporary standby state, if the node 2 is no longer in the active state due to a failure or the like, the node 1 that detects this transitions from the temporary standby state to the active state. That is, node 1 becomes an active node and starts the service.
冗長構成システムのノード1,2が以上のような処理を行うことで、ノード1,2の起動中に障害が発生しても速やかにサービスを開始できるようになる。 When the nodes 1 and 2 of the redundant configuration system perform the processing as described above, the service can be started promptly even if a failure occurs while the nodes 1 and 2 are activated.
本実施の形態に係る冗長構成システムは、コンピュータであるノード1,2が所定のプログラムを実行することで実現することができ、そのプログラムをコンピュータによる読み取り可能な記憶媒体(CD−ROM等)に記憶して提供することも可能である。また、そのプログラムを、インターネット等のネットワークを通して提供することも可能である。 The redundant configuration system according to the present embodiment can be realized by the nodes 1 and 2 being computers executing a predetermined program, and the program is stored in a computer-readable storage medium (CD-ROM or the like). It can also be stored and provided. It is also possible to provide the program through a network such as the Internet.
1,2,3,4 ノード
11,21 入出力部
12,22 処理部
13,23 補助記憶部
14,24 記憶部
120,220,320,420 システム管理部
121,221,321,421 データ管理部
122,222 インタフェース部
123,223 状態制御部
124,224 他ノード状態管理部
125,225 自ノード状態管理部
126,226 データロード部
127,227 自ノードデータロード部
128,228 他ノードデータロード部
140,240 データベース
131,231 チェックポイント
132,232 ジャーナル
1, 2, 3, 4
Claims (10)
前記ノードのデータ管理部が、
前記ノードのシステム管理部から、前記ノードの起動指示を受信したとき、前記ネットワーク経由で、前記冗長構成システムにおける他のノードへ、前記他のノードのデータ管理部がActive状態か否かの問い合わせ情報を送信し、
前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態ではないと判断したとき、
自ノードの補助記憶部から、この補助記憶部に記憶されたチェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記ノードのシステム管理部が、
前記複数のノードのうち、前記チェックポイントおよびジャーナルの読み出しが最初に完了したノードを前記Activeノードとして選択し、それ以外のノードを前記Standbyノードとして選択し、
前記ノードのデータ管理部が、
前記ノードのシステム管理部が前記自ノードを前記Activeノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、
前記自ノードのデータ管理部をActive化することを特徴とするノード制御方法。 In a redundant configuration system including a plurality of nodes, each of the plurality of nodes confirms the state of each other via a network when the plurality of nodes are activated, and any one of the plurality of nodes is serviced. A node control method in which an active node is provided and a node other than the active node is a standby node,
The data management unit of the node
Inquiry information on whether or not the data management unit of the other node is in the Active state to the other node in the redundant configuration system via the network when the node activation instruction is received from the system management unit of the node Send
The response of the inquiry information from the other nodes, when the data management section of said other node is determined not to be the Active state,
From the auxiliary storage unit of the own node, the checkpoint and journal stored in the auxiliary storage unit are read out on the storage unit of the own node,
A system management unit of the node;
Wherein the plurality of nodes, said nodes to the check point and journal reading has been completed first selected as Active node, select the other node as the Standby node,
The data management unit of the node
When the system management unit of the node has selected the own node as the Active node, when receiving an activation instruction of the own node from the system management unit of the node,
A node control method comprising: activating the data management unit of the own node.
前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、
前記自ノードの記憶部上の前記チェックポイントおよびジャーナルを破棄し、
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記自ノードのデータ管理部をStandby化することを特徴とする請求項1に記載のノード制御方法。 The data management unit of the node
When the system management unit of the node has selected the local node as the standby node, when receiving the standby instruction of the local node from the system management unit of the node,
Discard the checkpoint and journal on the storage unit of the node,
Via the network, from the auxiliary storage unit of the other node selected as the Active node , read the checkpoint and journal on the storage unit of the own node ,
The node control method according to claim 1, wherein the data management unit of the own node is set to Standby.
前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記ノードのデータ管理部が、
前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、
前記自ノードのデータ管理部をStandby化することを特徴とする請求項1または請求項2に記載のノード制御方法。 The data management unit of the node
The response of the inquiry information from the other nodes, when the data management portion of the other nodes is determined that the an Active state,
Via the network, from the auxiliary storage unit of the other node selected as the Active node, read the checkpoint and journal on the storage unit of the own node,
The data management unit of the node
When the system management unit of the node has selected the local node as the standby node, when receiving the standby instruction of the local node from the system management unit of the node,
The node control method according to claim 1 or 2, wherein the data management unit of the own node is set to Standby.
前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記ノードのデータ管理部が、
前記他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出した後に、前記ノードのシステム管理部が、前記他のノードが前記Active状態でなくたったことを検知したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、
前記自ノードのデータ管理部をActive化することを特徴とする請求項1または請求項2に記載のノード制御方法。 The data management unit of the node
When it is determined that the data management unit of the other node is in the Active state by the response of the inquiry information from the other node,
Via the network, from the auxiliary storage unit of the other node selected as the Active node, read the checkpoint and journal on the storage unit of the own node,
The data management unit of the node
After reading the checkpoint and journal from the auxiliary storage unit of the other node onto the storage unit of the local node, the system management unit of the node detects that the other node is not in the Active state. Therefore, when receiving the activation instruction of the own node from the system management unit of the node,
The node control method according to claim 1 or 2 , wherein the data management unit of the own node is activated.
前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態であると判断したとき、
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出す際に、前記チェックポイントおよびジャーナルを読み出せなかったとき、
前記自ノードの補助記憶部から、前記チェックポイントおよびジャーナルを読み出すことを特徴とする請求項3または請求項4に記載のノード制御方法。 The data management unit of the node
When it is determined that the data management unit of the other node is in the Active state by the response of the inquiry information from the other node,
When the checkpoint and journal cannot be read out when reading the checkpoint and journal from the auxiliary storage unit of another node selected as the Active node via the network onto the storage unit of the local node. ,
The node control method according to claim 3 or 4 , wherein the checkpoint and the journal are read from an auxiliary storage unit of the own node.
前記ノードのシステム管理部から、前記ノードの起動指示を受信したとき、ネットワーク経由で、前記冗長構成システムにおける他のノードへ、前記他のノードのデータ管理部がActive状態か否かの問い合わせ情報を送信し、前記他のノードからの前記問い合わせ情報の応答により、前記他のノードのデータ管理部が前記Active状態か否かを判断する他ノード状態管理部と、
前記他ノード状態管理部において、前記他のノードのデータ管理部が前記Active状態でないと判断したとき、自ノードの補助記憶部から、この補助記憶部に記憶されたチェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出す自ノードデータロード部と、
前記冗長構成システムのノードのうち、前記チェックポイントおよびジャーナルの読み出しが最初に完了したノードを前記Activeノードとして選択し、それ以外のノードを前記Standbyノードとして選択するシステム管理部と、
前記ノードのシステム管理部が前記自ノードを前記Activeノードとして選択したことにより、このシステム管理部から、前記自ノードのActive化指示を受信したとき、前記自ノードのデータ管理部をActive化する自ノード状態管理部とを備えることを特徴とするノード。 A node used in a redundant configuration system including an active node that provides a service and a standby node that is a standby node of the active node,
When receiving an instruction to start the node from the system management unit of the node, the inquiry information on whether the data management unit of the other node is in an active state is sent to another node in the redundant configuration system via the network. and transmitted, the response of the inquiry information from said other node, the other node state management unit data management unit determines whether the Active state of the other nodes,
Wherein the other-node status management unit, when said data management unit of another node determines that the non-Active state, from the auxiliary storage unit of the node, the local node checkpoints and journal stored in the auxiliary storage unit A self-node data load unit to be read on the storage unit of
Among the nodes of the redundant configuration system, a node that first reads the checkpoint and journal is selected as the Active node, and a system management unit that selects other nodes as the Standby node ;
When the system management unit of the node selects the own node as the Active node, when receiving an activation instruction for the own node from the system management unit, the node's data management unit is activated. A node comprising a node state management unit.
前記他ノードデータロード部は、
前記自ノードの前記記憶部上の前記チェックポイントおよびジャーナルを破棄し、前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、この補助記憶部に記憶された前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記自ノード状態管理部は、
前記自ノードのデータ管理部をStandby化することを特徴とする請求項7に記載のノード。 In the other node state management unit, when the system management unit of the node has selected the local node as the standby node, when the standby instruction of the local node is received from the system management unit of the node,
The other node data load unit
The checkpoint and journal stored on the storage unit of the local node are discarded, and the checkpoint stored in the auxiliary storage unit from the auxiliary storage unit of another node selected as the Active node via the network And read the journal onto the storage unit of the node ,
The own node state management unit
The node according to claim 7, wherein the data management unit of the own node is set to Standby.
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記ノードのデータ管理部が、
前記ノードのシステム管理部が前記自ノードを前記Standbyノードとして選択したことにより、前記ノードのシステム管理部から、前記自ノードのStandby化指示を受信したとき、
前記自ノードのデータ管理部をStandby化することを特徴とする請求項7または請求項8に記載のノード。 In the data management unit of the node, the response of the inquiry information from the other nodes, it is determined that the data management section of said other node is the Active state,
Via the network, from the auxiliary storage unit of the other node selected as the Active node, read the checkpoint and journal on the storage unit of the own node,
The data management unit of the node
When the system management unit of the node has selected the local node as the standby node, when receiving the standby instruction of the local node from the system management unit of the node,
The node according to claim 7 or 8, wherein the data management unit of the own node is set to Standby.
前記ネットワーク経由で、前記Activeノードとして選択された他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出し、
前記ノードのデータ管理部が、
前記他のノードの補助記憶部から、前記チェックポイントおよびジャーナルを前記自ノードの記憶部上に読み出した後に、前記ノードのシステム管理部が、前記他のノードが前記Active状態でなくたったことを検知したことにより、前記ノードのシステム管理部から、前記自ノードのActive化指示を受信したとき、
前記自ノードのデータ管理部をActive化することを特徴とする請求項7または請求項8に記載のノード。 In the data management unit of the node, it is determined that the data management unit of the other node is in the Active state based on a response to the inquiry information from the other node.
Via the network, from the auxiliary storage unit of the other node selected as the Active node, read the checkpoint and journal on the storage unit of the own node,
Data management unit of the node,
After reading the checkpoint and journal from the auxiliary storage unit of the other node onto the storage unit of the local node, the system management unit of the node detects that the other node is not in the Active state. Therefore, when receiving the activation instruction of the own node from the system management unit of the node,
The node according to claim 7 or 8 , wherein the data management unit of the own node is activated.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007022174A JP4856561B2 (en) | 2007-01-31 | 2007-01-31 | Node control method, node control program, and node |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007022174A JP4856561B2 (en) | 2007-01-31 | 2007-01-31 | Node control method, node control program, and node |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008191705A JP2008191705A (en) | 2008-08-21 |
JP4856561B2 true JP4856561B2 (en) | 2012-01-18 |
Family
ID=39751790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007022174A Active JP4856561B2 (en) | 2007-01-31 | 2007-01-31 | Node control method, node control program, and node |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4856561B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9098439B2 (en) * | 2012-01-05 | 2015-08-04 | International Business Machines Corporation | Providing a fault tolerant system in a loosely-coupled cluster environment using application checkpoints and logs |
CN103984768B (en) * | 2014-05-30 | 2017-09-29 | 华为技术有限公司 | A kind of data-base cluster manages method, node and the system of data |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0648481B2 (en) * | 1985-08-29 | 1994-06-22 | 富士通株式会社 | Message processing method for shared peripheral device management |
JPS63196958A (en) * | 1987-02-12 | 1988-08-15 | Hitachi Ltd | Fault recovery processing method |
JPH0198012A (en) * | 1987-10-09 | 1989-04-17 | Nec Corp | Automatic deciding system for operating state of multi-computer system |
JP3111935B2 (en) * | 1997-08-15 | 2000-11-27 | 日本電気株式会社 | LAN emulation server redundant system |
-
2007
- 2007-01-31 JP JP2007022174A patent/JP4856561B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008191705A (en) | 2008-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108616382B (en) | Method and device for upgrading network card firmware, network card and equipment | |
JP5431111B2 (en) | Information processing apparatus and system setting method | |
JP2007219757A (en) | Program for making virtual computer system function | |
JP2010283696A (en) | Information processing apparatus and method of controlling the same | |
JP6504764B2 (en) | Image processing apparatus, control method for image processing apparatus, and program | |
JP5478917B2 (en) | Image processing apparatus, image processing apparatus control method, and program | |
JP4856561B2 (en) | Node control method, node control program, and node | |
JP5534021B2 (en) | Storage device, control unit, and storage device control method | |
JP4806382B2 (en) | Redundant system | |
JP4630234B2 (en) | Dual system | |
JP4982388B2 (en) | Computer system, server, computer terminal and program | |
JP2011054146A (en) | Image forming apparatus, and failure recovery method and program of the same | |
JP2011025562A (en) | Image forming apparatus, control method thereof and control program thereof | |
JP5470884B2 (en) | Multi-node system, abnormality processing method, switch, node, and program | |
CN114407909A (en) | Control device | |
JP4483947B2 (en) | I / O controller | |
JP2008310517A (en) | Data identification method, data identification program, and active system device | |
JP2010152742A (en) | Communication control device | |
JP4816983B2 (en) | Disk array device, power control method and power control program for disk array device | |
JP6023898B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2020095322A (en) | Distributed file device, failover method, program, and storage medium | |
JP2023014652A (en) | Information processing device, control method for information processing device, and program | |
US20160308710A1 (en) | System, switch device and method of controlling a plurality of switch devices | |
JP2005115472A (en) | Operation control system | |
JP7556593B1 (en) | Control system, control device, control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110713 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110810 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111025 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111028 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4856561 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |