WO2000070461A1 - Method for controlling inheritance information in combined computer system - Google Patents

Method for controlling inheritance information in combined computer system Download PDF

Info

Publication number
WO2000070461A1
WO2000070461A1 PCT/JP1999/002466 JP9902466W WO0070461A1 WO 2000070461 A1 WO2000070461 A1 WO 2000070461A1 JP 9902466 W JP9902466 W JP 9902466W WO 0070461 A1 WO0070461 A1 WO 0070461A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
cluster
computer system
takeover
storage device
Prior art date
Application number
PCT/JP1999/002466
Other languages
French (fr)
Japanese (ja)
Inventor
Takashi Ando
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP1999/002466 priority Critical patent/WO2000070461A1/en
Publication of WO2000070461A1 publication Critical patent/WO2000070461A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring

Definitions

  • the present invention relates to a method for controlling takeover information in a multi-computer system, and more particularly, when a failure occurs in a representative cluster that controls a multi-computer system, a representative cluster is used as a proxy cluster that controls the system instead of the down representative cluster.
  • a representative cluster is used as a proxy cluster that controls the system instead of the down representative cluster.
  • each cluster is connected to a shared storage device and configured to exchange information via the shared storage device.
  • One of the clusters functions as a representative cluster that controls the entire system based on command information input from the console.
  • the representative cluster performs control of passing console information indicating the operation state of the console to another cluster via the shared storage device as takeover information.
  • each cluster stores console information in the same state. This is because the system continues processing when the representative cluster goes out of control due to a failure. In other words, if a failure occurs in the representative cluster, one of the other clusters controls the system in place of the representative cluster.
  • a proxy cluster Such a cluster replacing the representative cluster.
  • the representative cluster takes over the console information of the representative cluster via the shared storage device and controls the entire system based on the information. In this way, by continuing the console information of the representative cluster to the proxy cluster, processing can be continued.
  • the takeover information on the shared storage device may lack credibility.
  • the proxy cluster cannot correctly take over the console information when the representative cluster is running, and the processing continues. was not guaranteed, leading to a decrease in system reliability.
  • An object of the present invention is to provide a control method of takeover information in a highly reliable compound computer. Disclosure of the invention
  • a method for controlling takeover information in a multifunction computer system is configured by connecting a plurality of clusters by a shared storage device, and the surrogate cluster takes over control based on takeover information reflected from a representative cluster that controls the multifunction computer system.
  • the shared storage device manages the generation of the inherited information from the representative cluster.
  • the proxy cluster checks the credibility of the inherited information based on multiple generations of inherited information, and rebuilds information lacking credibility based on the result. And transfer the new takeover information to another cluster.
  • FIG. 1 is a schematic configuration diagram of a compound computer system according to an embodiment of the present invention.
  • FIG. 2 is a schematic configuration diagram of a cluster.
  • FIG. 3 is a schematic configuration diagram of the shared storage device.
  • FIG. 4 is an explanatory diagram of a method for controlling takeover information during normal operation.
  • FIG. 5 is an explanatory diagram of a method of controlling takeover information when a failure occurs.
  • Each cluster ll] ⁇ ll n are connected to the shared storage device 1 2, the shared storage device 1 2 Has a shared area to be accessed from each cluster 1 1 ⁇ 1 1 n.
  • Each cluster 1 1 E to 1 l n is the row exchanges information with each other through a shared region of the shared storage device 1 2
  • each cluster 1 1 ⁇ ⁇ 1 1 n are connected to the switching device 1 3, the console 1 4 is connected via a switching device 1 3 in any one of them.
  • the console 14 is connected to the first cluster 11 ⁇ via the switching device 13.
  • the first cluster 11 provides a function as a representative cluster for controlling the entire multifunction computer system.
  • each of the other cluster 1 1 2 ⁇ 1 1 n when a failure occurs in the first cluster 1 1] which functions as a representative cluster, functions as a substitutional cluster which controls the entire system in place thereto.
  • the representative cluster 1 1 fails, one output through the shared storage device 1 2 as much as possible control signal representative to another cluster of the cluster 1 1 2 ⁇ 1 l n
  • the switching device 13 connects the console 14 to the cluster that outputs the control signal.
  • the cluster that has output the control signal functions as a proxy cluster that controls the entire system.
  • FIG. 2 is a schematic configuration diagram of the first cluster 11 1.
  • the clusters 1 1 2 to 1 1 ⁇ have the same configuration as the first cluster 11, and therefore the drawings and explanation are omitted.
  • the first cluster 11 1] has at least one CPU 21 , A memory 23, a disk device 24, and an input / output channel 22 in a state of being connected thereto.
  • I / O channel 22 is connected to shared storage device 12 and switching device 13, and CPU 21 exchanges information with shared storage device 12 and switching device 13 via I / O channel 22. Do.
  • the memory 23 includes an area 23a for storing command information and an area 23b for storing console information.
  • CPU 21 stores command information input from console 14 in area 23a. If this command information is for you The CPU 21 executes processing based on this, and displays the processing result on the console 14.
  • CPU 2 1 when the command information is Ru der intended for other clusters 1 1 2 ⁇ 1 1 n, performs control to pass to the desired cluster through the shared storage device 1 2 that information.
  • the cluster that has received the information executes processing based on the information, and passes the processing result to the representative cluster 11.
  • the typical cluster 1 1 x which has received the processing result, and displays the processing result to the console 1 4.
  • the CPU 21 stores console information indicating the operation state of the console 14 in the area 23b.
  • This console information is passed from the representative cluster to another cluster via the shared storage device 12. That is, the CPU 21 of the representative cluster stores attribute information (for example, for a system operator, for a general user, etc.) indicating the identification information and the status information of the console 14 and the range of functions in the area 23b. It has a configuration.
  • the CPU 21 of the representative cluster outputs the console information to the other clusters via the shared storage device 12, and each other cluster stores the received console information in its own area 23b.
  • the CPU 21 of the representative cluster outputs the changed console information to another cluster when the multifunction computer system starts up and when any change is made to the console information. In this way, the console information is passed from the representative cluster to other clusters.
  • the disk device 24 includes a plurality of areas 24a and 24b. Cluster 1 1 in the first area 2 4 a! Is stored.
  • This program data includes general operating systems and various business programs.
  • the CPU 21 executes a business program for processing corresponding to the command information stored in the memory 23.
  • the second area 24b stores initialization information.
  • This initialization information is information for initializing the hardware resources and the software resources. That is, the CPU 21 of the representative cluster that controls the entire system executes the console based on this initialization information. Initialize the rule information. Also, the proxy cluster that replaces the representative cluster initializes the console information based on the initialization information when the information (console information) inherited from the representative cluster is low in reliability (information is damaged or missing).
  • storage devices such as a magnetic disk device, an optical disk device, and a magneto-optical disk device are usually used for the disk device 24, and these storage devices depend on the type and state of data stored in the disk device 24. It is appropriately selected and used.
  • FIG. 2 functionally illustrates the disk device 24, and may have a configuration including one or a plurality of storage devices corresponding to each area.
  • FIG. 3 is a schematic configuration diagram of the shared storage device 12.
  • the shared storage device 12 includes a control unit 31, a first area 32 for storing command information, and a second area 33 for storing console information.
  • the control unit 31 stores command information input from each cluster in the first area 32, and stores console information in the second area 33.
  • the second area 33 includes first and second generation storage units 34 and 35, and a generation management unit 36 that manages the generation of information stored in the storage units 34 and 35.
  • the generation management unit 36 provides a function of performing generation management of console information input via the control unit 31.
  • the generation management unit 36 when console information is input from the representative cluster, The console information of the generation storage unit 35 is moved or copied to the first generation storage unit 34 and input.
  • the stored console information is stored in the second generation storage unit 35.
  • the second generation storage unit 35 always stores the latest console information
  • the first generation storage unit 34 stores the console information of the previous generation.
  • the proxy cluster reads the console information stored in both storage units 34 and 35 of the shared storage device 12 and compares them. If the console information matches based on the comparison result, the proxy cluster determines that the console information has been correctly inherited as the inherited information from the representative cluster. Then, the proxy cluster stores the takeover information in its own memory 23, and controls the entire system based on the information.
  • the proxy cluster determines that the takeover information taken over from the representative cluster is suspicious information. Then, the proxy cluster resets the console information to the area 22b of the memory 23 based on the initialization information stored in the area 24b of the disk device 24 for the suspicious information.
  • Figure 4 shows the takeover control of console information during normal operation.
  • the first cluster 11 i controls and controls the entire system as a representative cluster.
  • the first cluster 11 i outputs console information 41 indicating the operation state of the console 14 to the shared storage device 12.
  • the shared storage device 12 moves or copies the console information 42 stored in the second-generation storage unit 35 of FIG. 3 to the first-generation storage unit 34 and is input to the second-generation storage unit 35.
  • the console information 41 is stored.
  • other Cluster 1 1 2 ⁇ 1 1 n is out read this console information 4 1 from the shared storage device 1 2 and stores it in its own memory 2 3. In this way, the multifunction computer system passes the console information of the representative cluster to another cluster. Next, control when a failure occurs will be described.
  • Figure 5 shows the takeover control of console information when a failure occurs.
  • the first cluster 1 fails a representative cluster
  • the second cluster 1 1 2 controls the entire system as a proxy cluster lieu.
  • the console information 51 of the first cluster 11 i is reflected in the information of the shared storage device 12. That is, the shared storage device 12 stores the console information 51 and the console information 52 one generation earlier.
  • the second cluster 1 1 2 to take over the control from the first cluster 1 1 i, before starting a new process as a representative cluster, implementing the following.
  • console information 51 and 52 takeover information on the shared memory are read and compared.
  • the console information 5 1, 5 2 if there is no difference, the second cluster 1 1 2 authenticity of the console information 5 2 is high, to ensure its legitimacy.
  • the second cluster 11 has console information 52; and operates as a representative cluster for controlling the entire system. That is, the second cluster 1 1 2 reflects the console one Le information 5 2 to another cluster 1 1 3 ⁇ 1 1 n, to start a new process as a representative cluster.
  • console information 53 Generates console information 53 with the extracted difference information reset (initialized, re-read from definition body, re-opened file, etc.) using initialization information.
  • the credibility of the console information 51, 52 is checked by comparing 52. As a result, the validity of the console information 51 and 52 can be easily guaranteed, and the reliability of the multifunction computer system can be improved.
  • the difference is extracted as a proxy cluster, and new takeover information 53 is reset based on the difference information. Then, the proxy cluster 1 1 2 reflects the reset takeover information 53 on the other clusters 1 1 n . As a result, the processing time is shorter than when all the console information is reset, and a new process can be executed in a short time.
  • the shared storage device 21 is configured to include the first and second generation storage units 34 and 35 as areas for managing two generations of console information. However, three or more generations are managed. Alternatively, the configuration may be changed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

A method for controlling inheritance information in a highly-reliable combined computer system. An acting cluster (112) inheriting the control from a representing cluster (111), before starting a new processing as a representing cluster, compares a set of inheritance information (51) with another set of inheritance information (52) for which generation management is performed by a shared storage (12) to extract the difference. The acting cluster (112) then sets a new set of inheritance information (53) based on the difference information. The acting cluster (112) reflects the inheritance information (53) on other clusters (11n).

Description

明細書  Specification
複合計算機システムにおける引継情報の制御方式 技術分野  Control method of handover information in multi-computer system
本発明は、 複合計算機システムにおける引継情報の制御方式に関し、 詳しくは 、 複合計算機システムを制御する代表クラスタに障害が発生した場合に、 ダウン した代表クラスタに替わってシステムを制御する代行クラスタに代表クラスタの 情報を引き継ぐための制御方式に関する。 背景技術  The present invention relates to a method for controlling takeover information in a multi-computer system, and more particularly, when a failure occurs in a representative cluster that controls a multi-computer system, a representative cluster is used as a proxy cluster that controls the system instead of the down representative cluster. Related to the control method for inheriting the information of Background art
従来、 複数の計算機 (クラスタ) を含む複合計算機システムでは、 各クラスタ は共有記憶装置に接続され、 その共有記憶装置を介して情報の授受を行うように 構成されている。 複数のクラスタのうちの 1つが、 コンソールから入力されるコ マンド情報に基づいてシステム全体を制御する代表クラスタとして機能する。 代表クラスタは、 コンソールの動作状態を表すコンソール情報を、 引継情報と して共有記憶装置を介して他のクラスタへ受け渡す制御を行う。 これにより、 各 クラスタは、 同一状態のコンソール情報を記憶する。 これは、 代表クラスタが障 害により制御不能に陥つた場合に、 システムが処理を継続するためである。 即ち、 代表クラスタに障害が発生した場合、 他のクラスタの內の 1つが代表ク ラスタに替わってシステムを制御する。 このように代表クラスタに替わるクラス タを代行クラスタと呼ぶ。  Conventionally, in a complex computer system including a plurality of computers (clusters), each cluster is connected to a shared storage device and configured to exchange information via the shared storage device. One of the clusters functions as a representative cluster that controls the entire system based on command information input from the console. The representative cluster performs control of passing console information indicating the operation state of the console to another cluster via the shared storage device as takeover information. As a result, each cluster stores console information in the same state. This is because the system continues processing when the representative cluster goes out of control due to a failure. In other words, if a failure occurs in the representative cluster, one of the other clusters controls the system in place of the representative cluster. Such a cluster replacing the representative cluster is called a proxy cluster.
代表クラスタは、 代表クラスタのコンソール情報を共有記憶装置を介して引き 継ぎ、 その情報に基づいてシステム全体を制御する。 このように、 代表クラスタ のコンソール情報を代行クラスタに引き継ぐことで、 処理の継続を可能としてい る。  The representative cluster takes over the console information of the representative cluster via the shared storage device and controls the entire system based on the information. In this way, by continuing the console information of the representative cluster to the proxy cluster, processing can be continued.
しかし、 代表クラスタに障害が発生した場合、 共有記憶装置上の引継情報は、 信憑性に欠ける場合がある。 このため、 代行クラスタは、 代表クラスタの稼働時 におけるコンソール情報を正確に引く継ぐことができなくなるため、 処理の継続 が保証されず、 システムの信頼性低下を招いていた However, if a failure occurs in the representative cluster, the takeover information on the shared storage device may lack credibility. As a result, the proxy cluster cannot correctly take over the console information when the representative cluster is running, and the processing continues. Was not guaranteed, leading to a decrease in system reliability.
本発明の目的は、 信頼性が高い複合計算機 :おける引継情報の制御方 式を提供することにある。 発明の開示  SUMMARY OF THE INVENTION An object of the present invention is to provide a control method of takeover information in a highly reliable compound computer. Disclosure of the invention
本発明の第 1の態様において、 複合計算機システムにおける引継情報の制御方 式が提供される。 複合計算機システムは、 複数のクラスタを共有記憶装置によつ て結合して構成され、 代行クラスタは、 複合計算機システムを制御する代表クラ スタから反映された引継情報により制御を引き継ぐ。 共有記憶装置は、 代表クラ スタからの引継情報を世代管理する。 代行クラスタは、 代表クラスタから制御を 引き継いで新たな処理を開始する前に、 複数世代の引継情報により当該引継情報 の信憑性をチェックし、 当該結果に基づいて信憑性が欠ける情報については再設 定を実施して新たな引継情報を他のクラスタへ引き継ぐ。 図面の簡単な説明  According to a first aspect of the present invention, there is provided a method for controlling takeover information in a multifunction computer system. The multifunction computer system is configured by connecting a plurality of clusters by a shared storage device, and the surrogate cluster takes over control based on takeover information reflected from a representative cluster that controls the multifunction computer system. The shared storage device manages the generation of the inherited information from the representative cluster. Before taking over control from the representative cluster and starting a new process, the proxy cluster checks the credibility of the inherited information based on multiple generations of inherited information, and rebuilds information lacking credibility based on the result. And transfer the new takeover information to another cluster. BRIEF DESCRIPTION OF THE FIGURES
図 1は、 本発明の一実施形態の複合計算機システムの概略構成図である。 図 2は、 クラスタの概略構成図である。  FIG. 1 is a schematic configuration diagram of a compound computer system according to an embodiment of the present invention. FIG. 2 is a schematic configuration diagram of a cluster.
図 3は、 共有記憶装置の概略構成図である。  FIG. 3 is a schematic configuration diagram of the shared storage device.
図 4は、 通常動作時における引継情報の制御方式の説明図である。  FIG. 4 is an explanatory diagram of a method for controlling takeover information during normal operation.
図 5は、 障害発生時における引継情報の制御方式の説明図である。 発明を実施するための最良の形態  FIG. 5 is an explanatory diagram of a method of controlling takeover information when a failure occurs. BEST MODE FOR CARRYING OUT THE INVENTION
以下、 本発明を複合計算機システムに具体化した一実施形態を図面に従って説 明する。  An embodiment in which the present invention is embodied in a compound computer system will be described below with reference to the drawings.
図 1の複合計算機システムは、 複数のクラスタ 1 1 , 1 1 , 1 1 ;! , · · · ,Complex computer system of FIG. 1, a plurality of clusters 1 1, 1 1, 1 1;!, - - -,
1 1 n 、 共有記憶装置 1 2、 切替装置 1 3、 コンソール 1 4を備えている。 1 1 n , shared storage device 12, switching device 13, console 14.
各クラスタ l l 】 〜 l l n は共有記憶装置 1 2に接続され、 共有記憶装置 1 2 は各クラスタ 1 1 〜 1 1 n からアクセスされる共有な領域を持つ。 各クラスタ 1 1ェ 〜1 l n は、 共有記憶装置 1 2の共有領域を介して相互に情報の授受を行Each cluster ll] ~ ll n are connected to the shared storage device 1 2, the shared storage device 1 2 Has a shared area to be accessed from each cluster 1 1 ~ 1 1 n. Each cluster 1 1 E to 1 l n is the row exchanges information with each other through a shared region of the shared storage device 1 2
Ό Ό
また、 各クラスタ 1 1〗 〜 1 1 n は、 切替装置 1 3に接続され、 それらのうち の何れか 1つにコンソール 1 4が切替装置 1 3を介して接続される。 初期状態に おいて、 コンソール 1 4は切替装置 1 3を介して第 1クラスタ 1 1〗 に接続され る。 これにより、 第 1クラスタ 1 1 は、 複合計算機システム全体を制御する代 表クラスタとしての機能を提供する。 Also, each cluster 1 1〗 ~ 1 1 n are connected to the switching device 1 3, the console 1 4 is connected via a switching device 1 3 in any one of them. In the initial state, the console 14 is connected to the first cluster 11〗 via the switching device 13. As a result, the first cluster 11 provides a function as a representative cluster for controlling the entire multifunction computer system.
また、 他の各クラスタ 1 12 〜 1 1 n は、 代表クラスタとして機能する第 1ク ラスタ 1 1】 に障害が発生した時に、 それに替わってシステム全体を制御する代 行クラスタとして機能する。 詳述すると、 代表クラスタ 1 1 に障害が発生する と、 各クラスタ 1 12 〜 1 l n のうちの 1つが代表となるべく制御信号を他のク ラスタへ共有記憶装置 1 2を介して出力するとともに、 切替装置 1 3に出力する 。 切替装置 1 3は、 制御信号を出力するクラスタへコンソール 1 4を接続する。 これにより、 制御信号を出力したクラスタは、 システム全体を制御する代行クラ スタとして機能する。 Further, each of the other cluster 1 1 2 ~ 1 1 n, when a failure occurs in the first cluster 1 1] which functions as a representative cluster, functions as a substitutional cluster which controls the entire system in place thereto. In detail, when the representative cluster 1 1 fails, one output through the shared storage device 1 2 as much as possible control signal representative to another cluster of the cluster 1 1 2 ~ 1 l n At the same time, output to the switching device 13. The switching device 13 connects the console 14 to the cluster that outputs the control signal. Thus, the cluster that has output the control signal functions as a proxy cluster that controls the entire system.
図 2は、 第 1クラスタ 1 1 , の概略構成図である。 尚、 ;也のクラスタ 1 12 〜 1 1 η は、 第 1クラスタ 1 1 と同じ構成であるため、 図面及び説明を省略する 第 1クラスタ 1 1 】 は、 少なく とも 1つの C PU 2 1 と、 メモリ 2 3、 デイス ク装置 24、 入出力チャネル 2 2をそれと接続された状態で持つ。 FIG. 2 is a schematic configuration diagram of the first cluster 11 1. The clusters 1 1 2 to 1 1 η have the same configuration as the first cluster 11, and therefore the drawings and explanation are omitted. The first cluster 11 1] has at least one CPU 21 , A memory 23, a disk device 24, and an input / output channel 22 in a state of being connected thereto.
入出力チャネル 2 2は、 共有記憶装置 1 2, 切替装置 1 3に接続され、 C PU 2 1は、 入出力チャネル 2 2を介して共有記憶装置 1 2, 切替装置 1 3と情報の 授受を行う。  I / O channel 22 is connected to shared storage device 12 and switching device 13, and CPU 21 exchanges information with shared storage device 12 and switching device 13 via I / O channel 22. Do.
メモリ 23は、 コマン ド情報を格納する領域 2 3 a と、 コンソール情報を格納 する領域 2 3 bを含む。 C PU 2 1は、 コンソール 1 4から入力されるコマンド 情報を領域 2 3 aに格納する。 このコマン ド情報が自己のためのものである場合 、 C P U 2 1は、 これに基づく処理を実行し、 その処理結果をコンソール 1 4に 表示する。 The memory 23 includes an area 23a for storing command information and an area 23b for storing console information. CPU 21 stores command information input from console 14 in area 23a. If this command information is for you The CPU 21 executes processing based on this, and displays the processing result on the console 14.
C P U 2 1は、 コマンド情報が他のクラスタ 1 1 2〜 1 1 n のためのものであ る場合、 その情報を共有記憶装置 1 2を介して目的のクラスタへ受け渡す制御を 行う。 その情報を受け取ったクラスタは、 当該情報に基づく処理を実行し、 処理 結果を代表クラスタ 1 1 へ受け渡す。 処理結果を受け取った代表クラスタ 1 1 x は、 その処理結果をコンソール 1 4に表示する。 CPU 2 1, when the command information is Ru der intended for other clusters 1 1 2 ~ 1 1 n, performs control to pass to the desired cluster through the shared storage device 1 2 that information. The cluster that has received the information executes processing based on the information, and passes the processing result to the representative cluster 11. The typical cluster 1 1 x, which has received the processing result, and displays the processing result to the console 1 4.
また、 C P U 2 1は、 コンソール 1 4の動作状態を表すコンソール情報を領域 2 3 bに格納する。 このコンソール情報は、 代表クラスタから共有記憶装置 1 2 を介して他のクラスタへ引き継がれる。 即ち、 代表クラスタの C P U 2 1は、 領 域 2 3 bにコンソール 1 4の識別情報や状態情報および機能の範囲などを示す属 性情報 (例えば、 システムオペレータ用、 一般ユーザ用など) を格納する構成と なっている。 代表クラスタの C P U 2 1は、 コンソール情報を共有記憶装置 1 2 を介して他のクラスタへ出力し、 各他のクラスタは、 受け取ったコンソール情報 を自己の領域 2 3 bに格納する。  Further, the CPU 21 stores console information indicating the operation state of the console 14 in the area 23b. This console information is passed from the representative cluster to another cluster via the shared storage device 12. That is, the CPU 21 of the representative cluster stores attribute information (for example, for a system operator, for a general user, etc.) indicating the identification information and the status information of the console 14 and the range of functions in the area 23b. It has a configuration. The CPU 21 of the representative cluster outputs the console information to the other clusters via the shared storage device 12, and each other cluster stores the received console information in its own area 23b.
また、 代表クラスタの C P U 2 1は、 複合計算機システムの立ち上げ時および コンソール情報に何らかの変更が加えられたときに、 その変更されたコンソール 情報を他のクラスタへ出力する。 この様にして、 コンソール情報は、 代表クラス タから他のクラスタに引き継がれる。  The CPU 21 of the representative cluster outputs the changed console information to another cluster when the multifunction computer system starts up and when any change is made to the console information. In this way, the console information is passed from the representative cluster to other clusters.
ディスク装置 2 4は、 複数の領域 2 4 a, 2 4 bを含む。 第 1領域 2 4 aには 、 クラスタ 1 1 ! が実行するプログラムデータが格納される。 このプログラムデ ータは、 一般的なオペレーティングシステム、 各種業務プログラムを含む。 C P U 2 1は、 メモリ 2 3に格納されたコマンド情報に対応する処理のための業務プ 口グラムを実行する。  The disk device 24 includes a plurality of areas 24a and 24b. Cluster 1 1 in the first area 2 4 a! Is stored. This program data includes general operating systems and various business programs. The CPU 21 executes a business program for processing corresponding to the command information stored in the memory 23.
第 2領域 2 4 bには、 初期化情報が格納される。 この初期化情報は、 のハード資源及びソフト資源の初期化を行うための情報である。 即ち、 全体を制御する代表クラスタの C P U 2 1は、 この初期化情報に基づいてコンソ ール情報を初期化する。 また、 代表クラスタに替わる代行クラスタは、 代表クラ スタから引き継いだ情報 (コンソール情報) の信頼性が低い (情報の破損, 欠落 等が存在する) 場合に、 初期化情報に基づいてコンソール情報を初期化する。 尚、 ディスク装置 2 4には、 通常、 磁気ディスク装置、 光ディスク装置、 光磁 気ディスク装置等の記憶装置が用いられ、 これらはディスク装置 2 4に格納され るデータの種類, 状態等に応じて適宜選択され用いられる。 尚、 図 2はディスク 装置 2 4を機能的に示しており、 各領域毎に対応する 1又は複数の記憶装置を備 える構成としても良い。 The second area 24b stores initialization information. This initialization information is information for initializing the hardware resources and the software resources. That is, the CPU 21 of the representative cluster that controls the entire system executes the console based on this initialization information. Initialize the rule information. Also, the proxy cluster that replaces the representative cluster initializes the console information based on the initialization information when the information (console information) inherited from the representative cluster is low in reliability (information is damaged or missing). Become Incidentally, storage devices such as a magnetic disk device, an optical disk device, and a magneto-optical disk device are usually used for the disk device 24, and these storage devices depend on the type and state of data stored in the disk device 24. It is appropriately selected and used. FIG. 2 functionally illustrates the disk device 24, and may have a configuration including one or a plurality of storage devices corresponding to each area.
ディスク装置 2 4に記憶されるプログラムデータ, 初期化情報を含む各種情報 は、 記録媒体 (図示略) により提供され、 記録媒体としては、 M T、 メモリカー ド、 フロッピーディスク、 光ディスク (CD-ROM, DVD- ROM,… ) 、 '光磁気ディスク (M0, MD, · · · ) 等、 任意のコンピュータ読み取り可能な記録媒体を使用することが できる。 また、 記録媒体又はディスク装置 2 4に通信媒体を介して各種情報を口 ードしてもよい。 C P U 2 1は、 図示しないドライブ装置を駆動し、 記録媒体に 記録されたプログラムデーをディスク装置 2 4にロードし、 それを実行する。 尚 、 記録媒体に記録されたプログラムデータを直接実行する構成としても良い。 図 3は、 共有記憶装置 1 2の概略構成図である。  Various information including program data and initialization information stored in the disk device 24 is provided by a recording medium (not shown). The recording medium includes an MT, a memory card, a floppy disk, an optical disk (CD-ROM, Any computer-readable recording media such as DVD-ROM, ...), and magneto-optical disks (M0, MD,...) Can be used. Further, various kinds of information may be recorded on the recording medium or the disk device 24 via the communication medium. The CPU 21 drives a drive device (not shown), loads the program data recorded on the recording medium into the disk device 24, and executes it. It should be noted that the configuration may be such that the program data recorded on the recording medium is directly executed. FIG. 3 is a schematic configuration diagram of the shared storage device 12.
共有記憶装置 1 2は、 制御部 3 1、 コマンド情報を格納する第 1領域 3 2、 コ ンソール情報を格納する第 2領域 3 3を含む。 制御部 3 1は、 各クラスタから入 力されるコマンド情報を第 1領域 3 2に格納し、 コンソール情報を第 2領域 3 3 に格納する。  The shared storage device 12 includes a control unit 31, a first area 32 for storing command information, and a second area 33 for storing console information. The control unit 31 stores command information input from each cluster in the first area 32, and stores console information in the second area 33.
第 2領域 3 3は、 第 1, 第 2世代記憶部 3 4, 3 5と、 それら記憶部 3 4, 3 5に格納する情報の世代を管理する世代管理部 3 6を含む。 世代管理部 3 6は、 制御部 3 1を介して入力されるコンソ一ル情報の世代管理を行う機能を提供する 世代管理部 3 6は、 代表クラスタからコンソール情報が入力されると、 第 2世 代記憶部 3 5のコンソール情報を第 1世代記憶部 3 4に移動又は複写し、 入力さ れたコンソール情報を第 2世代記憶部 3 5に格納する。 これにより、 第 2世代記 憶部 3 5は常に最新のコンソール情報を記憶し、 第 1世代記憶部 3 4は 1世代前 のコンソ一ル情報を記億する。 The second area 33 includes first and second generation storage units 34 and 35, and a generation management unit 36 that manages the generation of information stored in the storage units 34 and 35. The generation management unit 36 provides a function of performing generation management of console information input via the control unit 31. The generation management unit 36, when console information is input from the representative cluster, The console information of the generation storage unit 35 is moved or copied to the first generation storage unit 34 and input. The stored console information is stored in the second generation storage unit 35. As a result, the second generation storage unit 35 always stores the latest console information, and the first generation storage unit 34 stores the console information of the previous generation.
これら 2つの世代のコンソール情報は、 代表クラスタに代わってシステム全体 を制御する代行クラスタにより利用される。 代行クラスタは、 代表クラスタから 制御を引き継ぐと、 先ず引継情報の信憑性をチェックする。  These two generations of console information are used by a proxy cluster that controls the entire system instead of the representative cluster. When the proxy cluster takes over control from the representative cluster, it first checks the credibility of the takeover information.
即ち、 代行クラスタは、 共有記憶装置 1 2の両記憶部 3 4, 3 5に記憶された コンソール情報を読み出し、 それらを比較する。 その比較結果に基づいて両コン ソ一ル情報が一致している場合、 代行クラスタは、 代表クラスタからコンソール 情報が引継情報として正しく引き継がれていると判断する。 そして、 代行クラス タは、 引継情報を自己のメモリ 2 3へ格納し、 その情報に基づいてシステム全体 を制御する。  That is, the proxy cluster reads the console information stored in both storage units 34 and 35 of the shared storage device 12 and compares them. If the console information matches based on the comparison result, the proxy cluster determines that the console information has been correctly inherited as the inherited information from the representative cluster. Then, the proxy cluster stores the takeover information in its own memory 23, and controls the entire system based on the information.
一方、 その比較結果に基づいて、 両コンソール情報に差分がある場合、 代行ク ラスタは、 代表クラスタから引き継がれた引継情報が疑わしい情報であると判断 する。 そして、 代行クラスタは、 疑わしい情報についてディスク装置 2 4の領域 2 4 bに格納された初期化情報に基づいて、 メモリ 2 3の領域 2 2 bにコンソ一 ル情報を再設定する。  On the other hand, if there is a difference between the two console information based on the comparison result, the proxy cluster determines that the takeover information taken over from the representative cluster is suspicious information. Then, the proxy cluster resets the console information to the area 22b of the memory 23 based on the initialization information stored in the area 24b of the disk device 24 for the suspicious information.
次に、 上記のように構成された複合計算機システムの作用を図 4, 5に従って 説明する。  Next, the operation of the composite computer system configured as described above will be described with reference to FIGS.
先ず、 通常動作時における制御を説明する。  First, control during normal operation will be described.
図 4は、 通常動作時におけるコンソール情報の引き継ぎ制御を示す。 今、 初期 状態にあり、 第 1 クラスタ 1 1 i が代表クラスタとしてシステム全体を制御して レヽる。  Figure 4 shows the takeover control of console information during normal operation. Now, in an initial state, the first cluster 11 i controls and controls the entire system as a representative cluster.
この時、 第 1 クラスタ 1 1 i は、 コンソール 1 4の動作状態を示すコンソール 情報 4 1を共有記憶装置 1 2に出力する。 共有記憶装置 1 2は、 図 3の第 2世代 記憶部 3 5に記憶しているコンソール情報 4 2を第 1世代記憶部 3 4に移動又は 複写し、 第 2世代記憶部 3 5に入力されるコンソ一ル情報 4 1を記憶する。 他の クラスタ 1 1 2〜 1 1 n は、 共有記憶装置 1 2からこのコンソール情報 4 1を読 み出し、 これを自己のメモリ 2 3に記憶する。 このようにして、 複合計算機シス テムは、 代表クラスタのコンソール情報を他のクラスタに引き継いでいる。 次に、 障害発生時における制御を説明する。 At this time, the first cluster 11 i outputs console information 41 indicating the operation state of the console 14 to the shared storage device 12. The shared storage device 12 moves or copies the console information 42 stored in the second-generation storage unit 35 of FIG. 3 to the first-generation storage unit 34 and is input to the second-generation storage unit 35. The console information 41 is stored. other Cluster 1 1 2 ~ 1 1 n is out read this console information 4 1 from the shared storage device 1 2 and stores it in its own memory 2 3. In this way, the multifunction computer system passes the console information of the representative cluster to another cluster. Next, control when a failure occurs will be described.
図 5は、 障害発生時におけるコンソール情報の引き継ぎ制御を示す。 今、 代表 クラスタである第 1クラスタ 1 に障害が発生し、 それに代わって第 2クラス タ 1 1 2 が代行クラスタとしてシステム全体を制御する。 Figure 5 shows the takeover control of console information when a failure occurs. Now, the first cluster 1 fails a representative cluster, the second cluster 1 1 2 controls the entire system as a proxy cluster lieu.
この時、 第 1 クラスタ 1 1 i のコンソール情報 5 1は、 共有記憶装置 1 2の情 報に反映される。 即ち、 共有記憶装置 1 2は、 コンソール情報 5 1 と、 それより 1世代前のコンソール情報 5 2を記憶する。  At this time, the console information 51 of the first cluster 11 i is reflected in the information of the shared storage device 12. That is, the shared storage device 12 stores the console information 51 and the console information 52 one generation earlier.
第 1 クラスタ 1 1 i から制御を引き継ぐ第 2クラスタ 1 1 2 は、 代表クラスタ として新たな処理を開始する前に、 以下のことを実施する。 The second cluster 1 1 2 to take over the control from the first cluster 1 1 i, before starting a new process as a representative cluster, implementing the following.
(1) 共有メモリ上にある 2つの世代のコンソール情報 5 1, 5 2 (引継情報) を読み込んで比較する。  (1) The two generations of console information 51 and 52 (takeover information) on the shared memory are read and compared.
この工程において、 コンソール情報 5 1, 5 2に差がない場合、 第 2 クラスタ 1 1 2 は、 そのコンソール情報 5 2の信憑性が高く、 その正当性を保証する。 そ して、 第 2クラスタ 1 1 は、 コンソール情報 5 2を有 ;と してシステム全体を 制御する代表クラスタと して動作する。 即ち、 第 2クラスタ 1 1 2 は、 コンソ一 ル情報 5 2を他のクラスタ 1 1 3〜 1 1 n に反映させ、 代表クラスタとして新た な処理を開始する。 In this step, the console information 5 1, 5 2 if there is no difference, the second cluster 1 1 2 authenticity of the console information 5 2 is high, to ensure its legitimacy. The second cluster 11 has console information 52; and operates as a representative cluster for controlling the entire system. That is, the second cluster 1 1 2 reflects the console one Le information 5 2 to another cluster 1 1 3 ~ 1 1 n, to start a new process as a representative cluster.
上記工程において、 コンソール情報 5 2, 5 1に差分が存在する場合、 第 2ク ラスタ 1 1 2 は以下の工程を実施する。 In the above process, if there is a difference in the console information 5 2, 5 1, second cluster 1 1 2 is carried out the following steps.
(2) コンソール情報 5 1, 5 2の差分を抽出する。 その差分を図 5に破線の丸 で囲んで示す。  (2) Extract the difference between the console information 51 and 52. The difference is shown in Fig. 5 with a dashed circle.
(3) 抽出した差分の情報を初期化情報により再設定 (初期化、 定義体より再読 み込み、 ファイルの再オープン、 等) したコンソール情報 5 3を生成する。  (3) Generates console information 53 with the extracted difference information reset (initialized, re-read from definition body, re-opened file, etc.) using initialization information.
(4) 再設定したコンソール情報 5 3を他クラスタに反映する。 次に、 本発明の一実施形態の複合計算機システムの特徴を以下に記載する。 (4) Reflect the reset console information 53 on other clusters. Next, features of the compound computer system according to the embodiment of the present invention will be described below.
( 1 ) 代表クラスタとして機能する第 1クラスタ 1 1 i から制御を引き継ぐ代 行クラスタとして動作する第 2クラスタ 1 1 2 は、 代表クラスタとして新たな処 理を開始する前に、 共有記憶装置 1 2にて世代管理されたコンソール情報 5 1,(1) the second cluster 1 1 2 that operates as a substitutional cluster to take over control from the first cluster 1 1 i which functions as a representative cluster, before starting a new processing as a representative cluster shared storage device 1 2 Console information 51, generation-managed by
5 2を比較してそのコンソール情報 5 1 , 5 2の信憑性をチェックするようにし た。 その結果、 コンソール情報 5 1, 5 2の正当性を容易に保証し、 複合計算機 システムの信頼性を高めることができる。 The credibility of the console information 51, 52 is checked by comparing 52. As a result, the validity of the console information 51 and 52 can be easily guaranteed, and the reliability of the multifunction computer system can be improved.
( 2 ) 代行クラスタとして差分を抽出し、 その差分の情報に基づいて新たな引 継情報 5 3を再設定する。 そして、 代行クラスタ 1 1 2 は、 再設定した引継情報 5 3を他のクラスタ 1 1 n に反映するようにした。 その結果、 コンソール情報の 全てを再設定する場合に比べてその処理時間が短く、 短時間で新たな処理を実行 することができる。 (2) The difference is extracted as a proxy cluster, and new takeover information 53 is reset based on the difference information. Then, the proxy cluster 1 1 2 reflects the reset takeover information 53 on the other clusters 1 1 n . As a result, the processing time is shorter than when all the console information is reset, and a new process can be executed in a short time.
上記実施形態は以下のように変更してもよい。  The above embodiment may be modified as follows.
上記実施形態では、 共有記憶装置 2 1は 2つの世代のコンソール情報を管理す る領域として第 1, 第 2世代記憶部 3 4, 3 5を含む構成としたが、 3つ以上の 世代を管理する構成に変更しても良い。  In the above embodiment, the shared storage device 21 is configured to include the first and second generation storage units 34 and 35 as areas for managing two generations of console information. However, three or more generations are managed. Alternatively, the configuration may be changed.

Claims

請求の範囲 The scope of the claims
1 . 複数のクラスタ (1 1 i 〜1 1 n ) を共有記憶装置 (1 2 ) によって結 合した複合計算機システムの制御を代表クラスタから引き継ぐ代行クラスタにお レ、て、 1. A plurality of clusters (1 1 i to 1 1 n) sharing storage device (1 2) Contact the proxy cluster take over control of the complex computer system combined binding from the typical cluster by Les Te,
前記共有記憶装置は、 前記代表クラスタからの引継情報を世代管理し、 前記代行クラスタは、 前記代表クラスタから制御を引き継いで新たな処理を開 始する前に、 前記複数世代の引継情報により当該引継情報の信憑性をチェックし 、 当該結果に基づいて信憑性が欠ける情報については再設定を実施して新たな引 継情報を他のクラスタへ引き継ぐ、 複合計算機システムにおける引継情報の制御 方式。  The shared storage device generationally manages the takeover information from the representative cluster, and the proxy cluster uses the takeover information of the multiple generations before taking over control from the representative cluster and starting a new process. A method of controlling inherited information in a multifunction computer system that checks the authenticity of information and, based on the result, resets information that lacks authenticity and inherits new inherited information to another cluster.
2 . 請求項 1に記載の複合計算機システムにおける引継情報の制御方式にお いて、 2. In the control method of takeover information in the compound computer system according to claim 1,
前記代行クラスタは、 前記共有記憶装置にて管理される複数世代の前記引継情 報を比較し、 各引継情報が差を有する場合に再設定を実施する、 複合計算機シス テムにおける引継情報の制御方式。  The proxy cluster compares the takeover information of a plurality of generations managed by the shared storage device, and performs a reset if each takeover information has a difference. .
3 . 請求項 1に記載の複合計算機システムにおける引継情報の制御方式にお いて、 3. In the control method of takeover information in the complex computer system according to claim 1,
前記代行クラスタは、 初期化情報が予め格納された領域 (2 4 b ) を含む記憶 装置 (2 4 ) を備え、 該初期化情報により前記再設定を実施する複合計算機シス テムにおける引継情報の制御方式。  The proxy cluster includes a storage device (24) including an area (24b) in which initialization information is stored in advance, and controls the takeover information in the complex computer system that performs the reset by the initialization information. method.
4 . 請求項 1に記載の複合計算機システムにおける引継情報の制御方式にお いて、 4. In the control method of takeover information in the compound computer system according to claim 1,
前記代行クラスタは、 前記世代管理された複数の引継情報を比較する工程と、 The proxy cluster is A step of comparing the plurality of pieces of inherited information whose generation is managed,
各引継情報の差分を抽出する工程と、  A step of extracting a difference between the respective handover information;
抽出した引継情報の差分を再設定する工程と、  A step of resetting the difference of the extracted handover information;
再設定した引継情報を他のクラスタに反映する工程と、  A step of reflecting the reconfigured takeover information on other clusters;
を含む、 複合計算機システムにおける引継情報の制御方式。 A method for controlling handover information in a multi-function computer system.
5 . 請求項 1に記載の複合計算機システムにおける引継情報の制御方式にお いて、 5. In the control method of takeover information in the complex computer system according to claim 1,
前記共有記憶装置は、  The shared storage device,
前記複数の引継情報を記憶する領域 (3 4, 3 5 ) と、  An area (34, 35) for storing the plurality of pieces of transfer information;
前記引継情報の世代を管理する世代管理部 (3 6 ) と、  A generation management unit (36) for managing the generation of the handover information;
を含む、 複合計算機システムにおける引継情報の制御方式。 A method for controlling handover information in a multi-function computer system.
PCT/JP1999/002466 1999-05-13 1999-05-13 Method for controlling inheritance information in combined computer system WO2000070461A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP1999/002466 WO2000070461A1 (en) 1999-05-13 1999-05-13 Method for controlling inheritance information in combined computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP1999/002466 WO2000070461A1 (en) 1999-05-13 1999-05-13 Method for controlling inheritance information in combined computer system

Publications (1)

Publication Number Publication Date
WO2000070461A1 true WO2000070461A1 (en) 2000-11-23

Family

ID=14235655

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1999/002466 WO2000070461A1 (en) 1999-05-13 1999-05-13 Method for controlling inheritance information in combined computer system

Country Status (1)

Country Link
WO (1) WO2000070461A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3151152A1 (en) 2015-09-30 2017-04-05 Secure-Nok AS Non-intrusive software agent for monitoring and detection of cyber security events and cyber-attacks in an industrial control system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054052A (en) * 1983-09-02 1985-03-28 Nec Corp Processing continuing system
JPS61206045A (en) * 1985-03-08 1986-09-12 Nec Corp Information processing system
JPS63305432A (en) * 1987-06-08 1988-12-13 Nec Corp Reconstitution system for information processor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054052A (en) * 1983-09-02 1985-03-28 Nec Corp Processing continuing system
JPS61206045A (en) * 1985-03-08 1986-09-12 Nec Corp Information processing system
JPS63305432A (en) * 1987-06-08 1988-12-13 Nec Corp Reconstitution system for information processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3151152A1 (en) 2015-09-30 2017-04-05 Secure-Nok AS Non-intrusive software agent for monitoring and detection of cyber security events and cyber-attacks in an industrial control system

Similar Documents

Publication Publication Date Title
CN1776675B (en) Method and system for storing and using metadata in multiple storage locations
US7464378B1 (en) System and method for allowing multiple sub-clusters to survive a cluster partition
CN102521010B (en) Virtual and unloading read and write
US7925831B2 (en) Disk array apparatus and disk array apparatus control method
JP4248510B2 (en) Computer system, disk device, and data update control method
US7558915B2 (en) System and method for updating the firmware of a device in a storage network
US6651165B1 (en) Method and apparatus for directly booting a RAID volume as the primary operating system memory
US6868496B2 (en) Host protected area (HPA) duplication process
US6658587B1 (en) Emulation of persistent group reservations
TW201011538A (en) Managing cache data and metadata
JP4579492B2 (en) Method for securing drive access to a data storage medium based on a medium identifier
US7953890B1 (en) System and method for switching to a new coordinator resource
US20050066145A1 (en) Apparatus and method for controlling booting operation of computer system
US7146526B2 (en) Data I/O system using a plurality of mirror volumes
JP2003263397A (en) Method for providing peripheral device virtual functionality overlay system
US20080209136A1 (en) System and method of storage system assisted i/o fencing for shared storage configuration
JP3617437B2 (en) Data copy method and program recording medium recording data copy program
US6415382B1 (en) Hard disk bootstrap redirection
WO2020232859A1 (en) Distributed storage system, data writing method, device, and storage medium
JP2009026091A (en) Connection management program, connection management method, and information processing device
US20100082793A1 (en) Server-Embedded Distributed Storage System
US6742093B2 (en) Subsystem and method of reorganizing multiplexed data
JP5159777B2 (en) Apparatus and method for managing and storing information and metadata
US20080250421A1 (en) Data Processing System And Method
WO2000070461A1 (en) Method for controlling inheritance information in combined computer system

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
ENP Entry into the national phase

Ref country code: JP

Ref document number: 2000 618837

Kind code of ref document: A

Format of ref document f/p: F

122 Ep: pct application non-entry in european phase