JPH117430A - Parallel processing system backup method - Google Patents

Parallel processing system backup method

Info

Publication number
JPH117430A
JPH117430A JP9158307A JP15830797A JPH117430A JP H117430 A JPH117430 A JP H117430A JP 9158307 A JP9158307 A JP 9158307A JP 15830797 A JP15830797 A JP 15830797A JP H117430 A JPH117430 A JP H117430A
Authority
JP
Japan
Prior art keywords
cpn
parallel processing
monitoring
failure
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9158307A
Other languages
Japanese (ja)
Inventor
Yasuhiro Kawase
康裕 川瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP9158307A priority Critical patent/JPH117430A/en
Publication of JPH117430A publication Critical patent/JPH117430A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To inexpensively construct an inter-CPN parallel processing system which has high efficiency and reliability and to operate it by deciding the number of connection mechanisms(CF) in accordance-with the number of CPNs in an inter-processing node(CPN) parallel processing system, sharing hardware resources and assigning an alternate CF. SOLUTION: When a CF supervisory program detects a failure in a CF1 (4), the supervision of the CF1 (4) is suspended and all of copy data that are managed by an CF0 (3) are nullified. A CF state supervisory CPN1 (18) sucks contents of memory M1 (5) through a link cable 19, writes them on memory 2 (6) and moves all of necessary data that are under the management of the CF0 (3) onto a coupling device 2. Processor 1(7) to n(9) are given a lock right to shared memory M3 (16) and processing in each CPN is resumed. In such times, the connection between the alternate CF1(18) and CPN0 (10) to n-1 (12) shares a link cable 21 that connects the CF1 (4) and the CPN0 (10) to n-1 (12).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、複数のCFと複数
のCPNを備えたシステムで、一つのCFに障害が起き
た際、システムをダウンさせることなく運用させること
を目的とする、CF多重化方式、CF監視方式、及びC
F移行方式にかかわるものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system provided with a plurality of CFs and a plurality of CPNs, which is intended to be operated without causing a system down when one CF fails. System, CF monitoring system, and C
This is related to the F transition method.

【0002】[0002]

【従来の技術】今日の莫大な情報量を処理するために不
可欠な、高速な並列処理実現のため、結合装置を導入し
たが、システムが大きくなると結合装置上にあるCFの
負荷が増大し、さらにCFがダウンすると、システムに
大きなダメージを与える。そこで、結合装置を多重化す
ることにより、負荷と障害時のリスクを分散してきた
が、従来の障害バックアップ方式には、以下に示す2つ
の問題があった。
2. Description of the Related Art Coupling devices have been introduced to realize high-speed parallel processing, which is indispensable for processing today's huge amount of information. However, as the size of the system increases, the CF load on the coupling device increases. Further, if the CF goes down, the system is seriously damaged. Therefore, the load and the risk at the time of failure have been dispersed by multiplexing the coupling devices. However, the conventional failure backup method has the following two problems.

【0003】1)完全二重化方式では、コストが2倍か
かる。
1) The cost is doubled in the complete duplex system.

【0004】2)機能分散して障害時に並列システムを
構築しなおす方式では、システムの回復に時間がかか
る。
2) In a system in which functions are distributed and a parallel system is reconstructed when a failure occurs, it takes time to recover the system.

【0005】[0005]

【発明が解決しようとする課題】本発明では、結合装置
を多重化し、各結合装置上にあるCFを該CFとハード
ウェアを共有した状態監視用CPNで常に監視すること
により、CFの負荷を分散させるだけでなく、CF障害
時のシステムダウンを未然に防ぐ手段を、コストを掛け
ずに提供するものである。
According to the present invention, the load on the CFs is reduced by multiplexing the coupling devices and constantly monitoring the CFs on each coupling device by the status monitoring CPN sharing hardware with the CFs. It is intended to provide a means for preventing the system from being down due to a CF failure as well as dispersing the data without increasing the cost.

【0006】[0006]

【課題を解決するための手段】以上に示した課題を解決
するために、本発明では、複数の結合装置と、結合装置
上にある各CFとハードウェア資源を論理分割されたC
F状態監視用CPN、CF機能移行後に動作する交代C
F、またCF状態監視用CPN上で動作するCF監視プ
ログラムとCF移行プログラムを用意する。
In order to solve the above-mentioned problems, according to the present invention, a plurality of coupling devices, each CF and hardware resources on the coupling device are logically divided into Cs.
Alternating C that operates after transition to FPN monitoring CPN and CF functions
F, a CF monitoring program and a CF migration program that operate on the CF state monitoring CPN are prepared.

【0007】ここで、CFの障害発見時には、該プログ
ラムにより障害の起きたCFのローカルメモリの内容を
他のCFのローカルメモリにコピーし、該CPNを交代
CFとして動作させることで、障害の起こる前の状態
で、システムをダウンさせることなく運用を継続するこ
とが可能となる。
Here, when a failure of a CF is found, the contents of the local memory of the failed CF are copied to the local memory of another CF by the program, and the CPN is operated as a replacement CF to cause a failure. In the previous state, the operation can be continued without bringing down the system.

【0008】[0008]

【発明の実施の形態】以下、本発明による、CF監視か
ら、CF障害時におけるCF移行にいたるまでの形態
を、図面により詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention, from CF monitoring to CF transition at the time of a CF failure, will be described in detail with reference to the drawings.

【0009】図1は、本発明の一つの実施形態を示した
ものである。図1において、(1)は、第1の結合装置、
(2)は、第2の結合装置である。結合装置上には、それ
ぞれ結合機構CF0(3),CF1(4)とローカルメモリM
1(5),M2(6)を備えている。(7)は第1の処理装置で
あり、(8),(9)はそれぞれ第2、第n番目の処理装置で
ある。各処理装置は、中央処理ノード(以下CPNとい
う)とローカルメモリを備えていて、それぞれ、処理装
置毎に、CPN0(10),CPN1(11),CPNn−1(1
2)、ローカルメモリM4(13),M5(14),M6(15)のよ
うになっている。これらn個のCPNは、すべてOSが
動作するためのCPNで、それぞれCF0(3)はリンク
ケーブル(20)、CF1(4)はリンクケーブル(21)を介し
て各結合機構と接続されている。これら処理装置1
(7)、処理装置2(8)、処理装置n(9)はまた、共有メモ
リM3(16)に接続されている。処理装置1(7)、処理装
置2(8)、処理装置n(9)から共有メモリM3(16)へのア
クセスは、各処理装置間での独立な動作が可能となって
いて、さらにローカルメモリに必要データのコピーを持
つため、共有メモリに変更が無い限りローカルメモリへ
のアクセスで済む。データのコピーが複数あるため、こ
のうちどれか一つのデータが書換えられた時点で、その
他のデータは無効となる。また、共有メモリ上のデータ
は、データごとにロックを取ってからでないとアクセス
できないようになっていて、コピーデータはまず、共有
メモリを書換えてからでないと書換えられない。これに
より、同時に複数のコピーデータが書換えられないよう
になっている。このコピーデータが有効かどうかといっ
た情報は、例えば、図4に示すように処理装置1(7)上
のCPN0(10)によって該ローカルメモリM4(13)にあ
るコピーデータが書換えられた時、CPN0(10)は結合
装置1(1)上にあるCF0(3)にデータを書換えたことを
通知する、するとCF0(3)によってCPN(10)以外の
全CPNつまり、CPN1(11),CPNn−1(12)の有
効フラグテーブル(24)へ該データは無効であると書き込
まれる。CPN1(11),CPNn−1(12)はデータを使
用する時、各処理装置ごとの有効フラグテーブルを見
て、データの無効を確認すると、共有メモリM3(16)か
らデータを再びローカルメモリM5(14)又はM6(15)へ
コピーしないとデータを使用できない。このようにCF
0(3),CF1(4)によりコピーデータの有効性が、共有
メモリのロック制御と共に制御され、その制御データ
は、それぞれローカルメモリM1(5),M2(6)に格納さ
れている。
FIG. 1 shows one embodiment of the present invention. In FIG. 1, (1) is a first coupling device,
(2) is a second coupling device. On the coupling device, coupling mechanisms CF0 (3) and CF1 (4) and local memory M are respectively provided.
1 (5) and M2 (6). (7) is the first processing device, and (8) and (9) are the second and n-th processing devices, respectively. Each processing device is provided with a central processing node (hereinafter referred to as CPN) and a local memory. CPN0 (10), CPN1 (11), and CPNn-1 (1
2) Local memory M4 (13), M5 (14), M6 (15). These n CPNs are all CPNs for operating the OS. CF0 (3) is connected to each coupling mechanism via a link cable (20) and CF1 (4) is connected to each coupling mechanism via a link cable (21). . These processing devices 1
(7), the processing device 2 (8) and the processing device n (9) are also connected to the shared memory M3 (16). The processing device 1 (7), the processing device 2 (8), and the processing device n (9) can access the shared memory M3 (16) independently of each other. Since a copy of necessary data is stored in the memory, access to the local memory is sufficient as long as there is no change in the shared memory. Since there are a plurality of copies of data, when any one of the data is rewritten, the other data becomes invalid. Further, data on the shared memory cannot be accessed until a lock is obtained for each data, and copy data cannot be rewritten unless the shared memory is first rewritten. This prevents a plurality of copy data from being rewritten at the same time. The information such as whether the copy data is valid is, for example, as shown in FIG. 4, when the copy data in the local memory M4 (13) is rewritten by the CPN 0 (10) on the processing device 1 (7), (10) notifies the CF0 (3) on the coupling device 1 (1) that the data has been rewritten. Then, all the CPNs other than the CPN (10) by the CF0 (3), that is, CPN1 (11), CPNn- The data is written as invalid in the valid flag table 24 of 1 (12). When using the data, the CPN1 (11) and the CPNn-1 (12) check the validity flag table of each processing unit and confirm that the data is invalid. Data cannot be used unless it is copied to (14) or M6 (15). Thus CF
0 (3) and CF1 (4) control the validity of the copy data together with the lock control of the shared memory, and the control data is stored in the local memories M1 (5) and M2 (6), respectively.

【0010】また、CF状態監視CPN0(17)は、CF
0(3)とハードウェアを共有し、CF0(3)とCF(4)の
状態を監視するプログラムが常駐し動作する専用のCP
Nであり、CF状態監視CPN1(18)は、CF1(4)と
ハードウェアを共有し、CF0(3),CF1(4)の状態を
監視する専用のCPNである。CF状態監視CPN0(1
7)は、CF状態監視プログラムにより、障害が検出され
た時にはCF1(4)の交替用CFとしても機能するよう
になっていて、CF(3)のローカルメモリを共有してい
る。またCF状態監視CPN1(18)は、CF状態監視プ
ログラムにより、障害が検出された時にはCF0(3)の
交替用CFとしても機能するようになっていて、CF1
(4)のローカルメモリを共有している。CF状態監視C
PN0(17)、CF状態監視CPN1(18)はまた、お互い
にCF0(3),CF1(4)とも外部接続されていて、CF
監視プログラムにより定期的にCFの状態をチェックし
ている。
Further, the CF status monitoring CPN0 (17)
0 (3) and a dedicated CP which shares the hardware and monitors the status of CF0 (3) and CF (4).
N, the CF state monitoring CPN1 (18) is a dedicated CPN that shares hardware with CF1 (4) and monitors the states of CF0 (3) and CF1 (4). CF status monitoring CPN0 (1
7) functions as a replacement CF for CF1 (4) when a failure is detected by the CF status monitoring program, and shares the local memory of CF (3). The CF status monitor CPN1 (18) also functions as a replacement CF for CF0 (3) when a failure is detected by the CF status monitor program.
The local memory of (4) is shared. CF status monitoring C
PN0 (17) and CF status monitoring CPN1 (18) are also externally connected to CF0 (3) and CF1 (4).
The status of the CF is regularly checked by a monitoring program.

【0011】ここで、CF状態監視CPN1(18)で動作
しているCF監視プログラムにより、CF1(3)に障害
が検出された場合、CF状態監視CPN1(18)上のCF
監視プログラムは、CF状態監視CPN0(17)上のCF
監視プログラムに、CF1(3)の監視の中断を伝える。
さらにCF状態監視CPN1(18)上のCF監視プログラ
ムは、CF1(3)の監視を中断し、さらにCF移行プロ
グラムを起動する。CF移行プログラムは、まず図5に
示すようにCF0(3)が管理しているコピーデータを全
て無効とする。この間、処理装置1(7)、処理装置2
(8)、処理装置n(9)には、共有メモリM3(16)のロック
権が与えられないので、誤ったデータを用いて処理を続
行することはない。次にメモリM1(5)の内容を、CF
監視に使用していたリンクケーブル(19)を介して、CF
状態監視CPN1(18)が吸上げ、メモリM2(6)へ書込
むことにより、CF0(3)管理下の必要データを全て結
合装置(2)上へ移行させる。もしこの時、メモリM1(5)
の障害によりデータが読み出せない場合でも、共有メモ
リM3(16)と各CPN上にあるコピーデータを比較する
ことにより、読み出せなくなったメモリM1(5)にある
データと同様のデータをCF移行プログラムが作成し、
メモリM2(6)に格納する。ただし、この場合、障害後
のホットスタンバイ動作に多少時間を要してしまう。そ
の後、CF状態監視CPN1(18)上で、CFプログラム
を起動させることにより、CF0(3)から交代CF1(1
8)への移行が完了する。そして、処理装置1(7)、処理
装置2(8)、処理装置n(9)に共有メモリM3(16)へのロ
ック権を与え、各CPNでの処理を再開させる。この
時、交代CF1(18)とCPN0(10),CPN1(11),C
PNn−1(12)間の接続は、CF1(4)とCPN0(1
0),CPN1(11),CPNn−1(12)を接続しているリ
ンクケーブル(21)を共有する。これにより、CPN0(1
0),CPN1(11),CPNn−1(12)間でのパラレル制
御は保たれるため、障害前の状態でシステムダウンさせ
ることなく運用を継続することが可能である。
Here, if a failure is detected in CF1 (3) by the CF monitoring program running on CF status monitoring CPN1 (18), the CF on CF status monitoring CPN1 (18)
The monitoring program executes the CF monitoring on the CF status monitoring CPN0 (17).
Inform the monitoring program that monitoring of CF1 (3) has been interrupted.
Further, the CF monitoring program on the CF status monitoring CPN1 (18) suspends the monitoring of CF1 (3), and starts the CF migration program. The CF migration program first invalidates all copy data managed by CF0 (3) as shown in FIG. During this time, processing device 1 (7), processing device 2
(8) Since the right to lock the shared memory M3 (16) is not given to the processing device n (9), the processing will not be continued using incorrect data. Next, the content of the memory M1 (5) is stored in CF
Via the link cable (19) used for monitoring, CF
The status monitor CPN1 (18) siphons and writes it to the memory M2 (6), thereby transferring all necessary data under the control of the CF0 (3) to the coupling device (2). If this time, the memory M1 (5)
Even if the data cannot be read due to the failure, the same data as the data in the unreadable memory M1 (5) is transferred to the CF by comparing the shared memory M3 (16) with the copy data on each CPN. The program creates
It is stored in the memory M2 (6). However, in this case, some time is required for the hot standby operation after the failure. Thereafter, by starting a CF program on the CF state monitoring CPN1 (18), the CF1 (1) is changed from CF0 (3).
The transition to 8) is completed. Then, the right to lock the shared memory M3 (16) is given to the processing device 1 (7), the processing device 2 (8), and the processing device n (9), and the processing in each CPN is restarted. At this time, the replacement CF1 (18), CPN0 (10), CPN1 (11), C
The connection between PNn-1 (12) is CF1 (4) and CPN0 (1
0), CPN1 (11) and CPNn-1 (12) share a link cable (21). Thereby, CPN0 (1
0), CPN1 (11), and CPNn-1 (12) are maintained in parallel control, so that the operation can be continued in the state before the failure without causing the system to go down.

【0012】図2は、図1以外の一つの実施形態を示し
たものである。図2において、図1と異なるのは、結合
装置間の接続方法である。通常時の動作は、図1に説明
した通りである。結合装置間をTCMP結合(20)するこ
とにより、CF障害時にホットスタンバイ動作のうち、
最も処理時間を要するメモリの内容のコピーをしなくて
も、直接相手側のメモリ内容を読めるので、CF機能の
交代がスムーズに行えるという利点がある。
FIG. 2 shows an embodiment other than FIG. 2 differs from FIG. 1 in the connection method between the coupling devices. The operation in the normal state is as described in FIG. By performing the TCMP coupling (20) between the coupling devices, the hot standby operation during the CF failure can be performed.
Since the memory contents of the other party can be read directly without copying the contents of the memory which requires the most processing time, there is an advantage that the CF function can be switched smoothly.

【0013】図3は、図1,2以外の一つの実施形態を
示したものである。すべての結合装置、処理装置、共有
メモリがバス接続(23)されることにより、CFとCPN
間を接続していたリンクケーブルは必要なくなるだけ
で、通常時の動作及びCF移行プログラムの動作は、図
1に説明した通りである。
FIG. 3 shows an embodiment other than FIGS. By connecting all coupling devices, processing devices, and shared memories via a bus (23), CF and CPN are connected.
Only the link cable connecting between them becomes unnecessary, and the normal operation and the operation of the CF transfer program are as described in FIG.

【0014】[0014]

【発明の効果】以上説明したように、本発明によれば、
多くのCPNが接続されたCPN間並列処理システム
で、CPNの台数に合わせてCFの台数を決め、さら
に、ハードウェア資源を共有して交代CFを割り当てる
ことにより、効率が良いだけでなく、信頼性の高いCP
N間並列処理システムを、コストを掛けずに構築し、運
用することが可能となる。
As described above, according to the present invention,
In an inter-CPN parallel processing system to which many CPNs are connected, the number of CFs is determined in accordance with the number of CPNs, and hardware resources are shared to assign replacement CFs. High CP
It is possible to construct and operate the N-to-N parallel processing system without increasing the cost.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明を適用したシステム構成図の一例を示し
た図面
FIG. 1 shows an example of a system configuration diagram to which the present invention is applied.

【図2】本発明を適用した、図1以外の一例を示した図
FIG. 2 is a diagram showing an example other than FIG. 1 to which the present invention is applied.

【図3】本発明を適用した、図1,2以外の一例を示し
た図面
FIG. 3 is a diagram showing an example other than FIGS.

【図4】CFのパラレル制御方式を説明する図面FIG. 4 is a diagram illustrating a parallel control method of a CF.

【図5】本発明の、CF交代方式を説明する図面FIG. 5 is a diagram illustrating a CF replacement method according to the present invention.

【符号の説明】[Explanation of symbols]

1…第1の結合装置、2…第2の結合装置、3…第1の
結合機構(CF0)、4…第2の結合機構(CF1) 、 5
…CF0のローカルメモリ(M1)、6…CF1のローカル
メモリ(M2)、 7…第1の処理装置、8…第2の処理装
置、 9…第nの処理装置、10…第1の
中央処理ノード(CPN0)、 11…第2の中央処理ノード
(CPN1)、12…第nの中央処理ノード(CPNn-1)、13…
CPN0のローカルメモリ(M4)、14…CPN1のロー
カルメモリ(M5)、15…CPNn−1のローカルメモリ
(M6)、16…共有メモリ(M3)、17…第1のCF状態監
視CPN0(兼交代CF0)、18…第2のCF状態監
視CPN1(兼交代CF1)、19…CF状態監視CP
NとCF間を接続する外部リンクケーブル郡、20…C
F0とCPN0,CPN1,CPNn間を接続するリン
クケーブル郡、21…CF1とCPN0,CPN1,C
PNn間を接続するリンクケーブル郡、22…結合装置
間を密結合マルチプロセッサ接続するケーブル、23…
各処理装置、結合装置、共有メモリを接続するバス、2
4…コピーデータの有効フラグテーブル。
DESCRIPTION OF SYMBOLS 1 ... 1st coupling apparatus, 2 ... 2nd coupling apparatus, 3 ... 1st coupling mechanism (CF0), 4 ... 2nd coupling mechanism (CF1), 5
... Local memory (M1) of CF0, 6 ... Local memory (M2) of CF1, 7 ... First processing device, 8 ... Second processing device, 9 ... Nth processing device, 10 ... First central processing Node (CPN0), 11: second central processing node
(CPN1), 12 ... n-th central processing node (CPNn-1), 13 ...
CPN0 local memory (M4), 14... CPN1 local memory (M5), 15... CPNn-1 local memory
(M6), 16: Shared memory (M3), 17: First CF status monitor CPN0 (alternate CF0), 18: Second CF status monitor CPN1 (alternate CF1), 19: CF status monitor CP
External link cables connecting N and CF, 20 ... C
Link cable group connecting F0 and CPN0, CPN1, CPNn, 21 ... CF1 and CPN0, CPN1, C
Link cable group connecting between PNn, 22 ... Cable connecting tightly-coupled multiprocessor between coupling devices, 23 ...
A bus connecting each processing device, coupling device, shared memory, 2
4: Valid flag table for copy data

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】図1に示されるように、いくつかの並列処
理システム内の処理装置上にある処理ノード(CPN)
が、結合装置と結合されることにより構成されたCPN
間並列処理システムにおいて、結合装置を多重化するこ
とにより、システムの並列処理性能を高めた、結合装置
多重化CPN間並列処理システムにおいて、結合装置を
論理的に結合機構(CF)と処理ノード(CPN)とに
分割させ、該CPNが、各CFの状態を常に監視し、あ
るCFに障害が発見された際、該CPNそのものが交代
CFとして機能することにより、システム全体のダウン
を未然に防ぐとともに迅速な交代動作(ホットスタンバ
イ)を可能とする、CF状態監視型CPN間並列処理シ
ステム。
1. A processing node (CPN) on a processing unit in several parallel processing systems as shown in FIG.
Is coupled to a coupling device.
In the inter-parallel processing system, the multiplexing of the coupling devices improves the parallel processing performance of the system. CPN), the CPN constantly monitors the state of each CF, and when a failure is found in a certain CF, the CPN itself functions as a replacement CF to prevent the entire system from going down. A CF status monitoring type inter-CPN parallel processing system that enables quick switching operation (hot standby).
【請求項2】請求項1に記載のCF状態監視型CPN間
並列処理システムにおいて、CFとハードウェア資源を
共有し、各CFを監視している結合装置同士が、図2に
示されるように、CF障害検出時に配下以外のローカル
メモリ内容を読みだせるよう密結合マルチプロセッサ
(TCMP)接続されている、高速なCF機能の移行を
可能とした、CF状態監視用CPN。
2. In the CF status monitoring type inter-CPN parallel processing system according to claim 1, the coupling devices sharing hardware resources with the CF and monitoring each CF are connected as shown in FIG. A CF state monitoring CPN connected to a tightly-coupled multiprocessor (TCMP) so that a local memory content other than the subordinate memory can be read when a CF failure is detected, and enabling a high-speed transition of the CF function.
【請求項3】図3に示されるような、各処理装置上にあ
るCPNと結合装置上にあるCFがバス接続により接続
されたシステムで、請求項1,2に記載の機能を持った
CF状態監視型CPN間並列処理システム、及びCF状
態監視専用CPN。
3. A system as shown in FIG. 3, wherein a CPN on each processing unit and a CF on a coupling unit are connected by a bus connection. A state monitoring type parallel processing system between CPNs and a CPN dedicated to CF state monitoring.
【請求項4】請求項1,2,3に記載のCF状態監視用
CPN上でCFの状態を監視し、CF障害検出時にCF
機能の移行処理を行う、CF状態監視用プログラム。
4. A CF status monitor on the CF status monitoring CPN according to claim 1, wherein the CF status is detected when a CF fault is detected.
A CF state monitoring program that performs function transfer processing.
【請求項5】請求項4に記載のCF状態監視用プログラ
ムが、CF障害を検出した時に交代CFへの移行処理を
行う、CF移行プログラム。
5. A CF transition program, wherein the CF state monitoring program according to claim 4 performs transition processing to a replacement CF when a CF failure is detected.
JP9158307A 1997-06-16 1997-06-16 Parallel processing system backup method Pending JPH117430A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9158307A JPH117430A (en) 1997-06-16 1997-06-16 Parallel processing system backup method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9158307A JPH117430A (en) 1997-06-16 1997-06-16 Parallel processing system backup method

Publications (1)

Publication Number Publication Date
JPH117430A true JPH117430A (en) 1999-01-12

Family

ID=15668779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9158307A Pending JPH117430A (en) 1997-06-16 1997-06-16 Parallel processing system backup method

Country Status (1)

Country Link
JP (1) JPH117430A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104049916A (en) * 2014-06-24 2014-09-17 东南大学 Self-organizing distributed storage system and method based on node role switching mechanism

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104049916A (en) * 2014-06-24 2014-09-17 东南大学 Self-organizing distributed storage system and method based on node role switching mechanism

Similar Documents

Publication Publication Date Title
US5758157A (en) Method and system for providing service processor capability in a data processing by transmitting service processor requests between processing complexes
US5495570A (en) Mirrored memory multi-processor system
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
JP4341571B2 (en) Storage device system, control method therefor, and control program
IE52678B1 (en) Computer or processor control systems
CN1366242A (en) Method for implementing dual-system standby
WO2007051901A1 (en) Methods and apparatus for automatically multi-booting a computer system
JP2006178659A (en) Fault tolerant computer system and interrupt control method therefor
JP3490002B2 (en) Computers that make up a multi-cluster system
WO1997049034A1 (en) Job taking-over system
JP2001022599A (en) Fault tolerant system, fault tolerant processing method and recording medium for fault tolerant control program
JPH117430A (en) Parallel processing system backup method
US5737509A (en) Method and apparatus for restoring data coherency in a duplex shared memory subsystem
JPH09293001A (en) Non-stop maintenance system
CN113874842A (en) Fault tolerant system, server, method for operating fault tolerant system, method for operating server, and program for operating method for server
WO2002008929A9 (en) High-availability shared-memory system
US7661026B2 (en) Access by distributed computers to a same hardware resource
JP3363579B2 (en) Monitoring device and monitoring system
US11366618B2 (en) All flash array server and control method thereof
JP2005115472A (en) Operation control system
US11809293B2 (en) Storage node failure detection based on register values for an all flash array server
JP2767831B2 (en) Access control method for shared devices
JPH09293011A (en) File exclusive control processor and its fault restoring system
JPH0553938A (en) System for switching duplex central processing units
JPH0474739B2 (en)