JPH03127231A - 引き継ぎ情報のデータ保証処理方法 - Google Patents

引き継ぎ情報のデータ保証処理方法

Info

Publication number
JPH03127231A
JPH03127231A JP1266425A JP26642589A JPH03127231A JP H03127231 A JPH03127231 A JP H03127231A JP 1266425 A JP1266425 A JP 1266425A JP 26642589 A JP26642589 A JP 26642589A JP H03127231 A JPH03127231 A JP H03127231A
Authority
JP
Japan
Prior art keywords
information
area
edition
current
standby process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1266425A
Other languages
English (en)
Other versions
JP2772068B2 (ja
Inventor
Kunio Shimizu
邦男 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1266425A priority Critical patent/JP2772068B2/ja
Priority to EP90309008A priority patent/EP0413586B1/en
Priority to AU61081/90A priority patent/AU645757B2/en
Priority to DE69031965T priority patent/DE69031965T2/de
Publication of JPH03127231A publication Critical patent/JPH03127231A/ja
Priority to US08/181,368 priority patent/US5446875A/en
Application granted granted Critical
Publication of JP2772068B2 publication Critical patent/JP2772068B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 不揮発性共用メモリに設定された情報を、現用プロセス
から待機プロセスへ引き継ぐことにより。
現用プロセスの障害時に、待機プロセスが現用プロセス
に代わり、業務を継続して運用する計算機システムにお
けるフォールトトレラント化のための引き継ぎ情報のデ
ータ保証処理方法に関し。
フォールトトレラント化のための動作環境の事前構築を
、効率よ<、li1実に行うことができるようにするこ
とを目的とし。
引き継ぎ情報が設定される不揮発性共用メモリの領域を
、現版と新版の二重構造とし、現版と新版のそれぞれに
基情報域と差分域とを設け、現用プロセスは、現版に書
き込みを行い、待機プロセスは、新版から読み出しを行
い、現用プロセスは。
所定時間の経過または所定量の情報の蓄積により。
現版の基情報域の内容を、新版の基情報域に複写すると
ともに、現版と新版とを切り換え、それを通知するよう
に構成する。
〔産業上の利用分野〕
本発明は、不揮発性共用メモリに設定された情報を、現
用プロセスから待機プロセスへ引き継ぐことにより、現
用プロセスの障害時に、待機プロセスが現用プロセスに
代わり、業務を継続して運用する計算機システムにおけ
るフォールトトレラント化のための引き継ぎ情報のデー
タ保証処理方法に関する。
計算機システムにおいて、フォールトトレラント化を実
現するためには、制御プロセスを二重化する方式が有効
である。1つは1通常運用のため動作する制御プロセス
であり、もう1つは1通常運用の制御プロセスが何らか
の障害で停止した場合に、業務を継続して運用するため
に待機している制御プロセスである。
前者の制御プロセスを、現用プロセスといい。
後者の制御プロセスを、待機プロセスという。
障害により、現用プロセスから待機プロセスへ処理主体
を切り換える場合には、各種の資源情報の引き継ぎが必
要である。この資源情報の引き継ぎを高速に、かつ確実
に行う手段が必要とされている。
〔従来の技術〕
第5図は従来技術の例を示す。
第5図において、現用プロセス10が障害により停止し
た場合に、待機プロセス11が、現用プロセス10に代
わって、業務を継続するためには。
現用プロセス10が扱っている動的に変化する動作環境
を、待機プロセス11が引き継ぐ必要がある。
その動作環境を引き継ぐための情報を、現用プロセス1
0のクラッシュ時に、すべて−括して引き継ぐようにす
ると、その引き継ぎ情報による動作環境の設定に時間が
かかるため、現用プロセス10から待機プロセス11へ
の切り換え性能が悪くなる。
そこで、現用プロセス10め運用時に、第5図に示すよ
うに、逐次に動作環境等の資源情報を引き継ぐ方法が考
えられている。
(発明が解決しようとする課題) 例えば9通信制御プログラムなどをホットスタンバイさ
せるために、待機プロセス11において。
事前にネットワーク資源を制御するための動作環境を構
築する場合、現用プロセス10が、変更のあった動作環
境の情報を、不揮発性共用メモリ12に書き込み、ある
周期で、または変更情報量が所定量になったときに、待
機プロセス11に通知する方式を採用した場合1次の要
件を満たす必要がある。
(1)  現用プロセスIOにおける運用に対し、性能
面(処理ステップ)の支障がないこと、すなわち、待機
プロセス11において間欠的に行う動作環境の事前構築
により、現用プロセスIOの処理に影響がないこと。
(2)  現用プロセスlOおよび待機プロセス!■か
ら時間断面で見たデータの一意性が保証されること。
しかしながら、従来考えられている方法では。
不揮発性共用メモリ12のw4域を、単に1つの構造と
して使用するため、上記2つの要件を同時に満たすこと
はできなかった。すなわち、現用プロセス10が書き込
んでいるときに、その箇所を。
同時に待機プロセス11が読み出すと、データの完結性
が保証されないことがある。そのため、ロック制御など
により、排他制御を行うと、現用プロセス10の処理が
待たされることがあり1通常の運用時でも、レスポンス
等が遅くなるという問題があった。
本発明は上記問題点の解決を図り、フォールトトレラン
ト化のための動作環境の事前構築を、効率よ<、lil
実に行うことができるようにすることを目的としている
〔課題を解決するための手段〕
第1図は本発明の原理説明図である。
第1図において、10は通常運用のために動作する現用
プロセス、11は現用プロセスlOの障害時に業務を継
続して運用するために待機している待機プロセス、12
は不揮発性共用メモリ、13A、13Bはそれぞれ規板
、新版と呼ばれる引き継ぎ情報の格納のための領域、1
4A、14Bは差分域、15A、15Bは基情報域、1
6は不揮発性共用メモリ管理プロセスを表す。
不揮発性共用メモリ12は、現用プロセス10または待
機プロセス11のプログラムが停止しても、記憶内容が
保証される記憶装置である。例えば、別系統の電源が付
いた半導体記憶装置などにより構成される。
現用プロセスIOが障害になったときに、待機プロセス
11が、その処理を代行することができるように、現用
プロセス10の動作環境などの資源引き継ぎ情報を、不
揮発性共用メモリ12に逐次設定し、待機プロセス11
は、その情報をもとに、動作環境の事前生成を行う。
本発明では、この引き継ぎ情報が設定される不揮発性共
用メモリ12の領域を、視版13Aと新版13Bの二重
構造としている。
規板13A、新版13Bには、それぞれ現用プロセス1
0から待機プロセス11へ伝達すべき情報が格納される
基情報域15A、15Bと、変更分の情報を示す情報が
格納される差分域14A。
14Bとを設ける。
現用プロセスIOは、動作環境などの引き継ぎ情報が発
生した場合、処理P1により、視版13Aの基情報域1
5Aの内容を更新するとともに。
その基情報域15Aにおけるどの情報が変更されたかを
示す情報を差分域14Aに設定する。
そして、ある時間の経過または変更量がある量以上にな
ったときに、処理P2により、基情報域15Aの内容を
基情報域15Bに複写する。その後、視版13Aを新版
に、新版13Bを視版に切り換える処理を、不揮発性共
用メモリ管理プロセス16に依頼する。
次に、処理P3により、待機プロセス11に対し、引き
継ぎ情報の反映の依頼を意味する間欠同期通知を行う。
一方、待機プロセス11では、現用プロセス10が視版
13Aに書き込みを行っている間、新版13Bからの読
み出しを行い、待機プロセス11内に反映して、動作環
境の事前生成を行う。
なお、現用プロセス10が、規板13Aに書き込みを行
っている間に、待機プロセス11において新版13Bか
らの動作環境の事前生成が完了するように1間欠間期処
理の起動要因である時間間隔値および情報の変更量を、
システム設計時に決定しておく。
現用プロセス10から1間欠間期通知があると。
新たな引き継ぎ情報が通知されたため、待機プロセス1
1は、不揮発性共用メモリ管理プロセス16に問い合わ
せることにより、ちと視版13Aが現新版であることを
判断して、その新版の領域を。
新たな引き継ぎ情報の読み出し対象とする。
〔作用〕
不揮発性共用メモリ12の領域を、従来技術のように、
単に1つの構造として、現用プロセス10から待機プロ
セス11への間欠的な情報の引き継ぎを行った場合、待
機プロセス11が読み出しを行っている間は、現用プロ
セス10の処理が待たされるので、業務上の支障をもた
らす。
本発明では、不揮発性共用メモリ12における引き継ぎ
用の領域を、視版13Aと新版13Bとに分け、この二
重構造域をサイクリックにスイッチして使用するので、
現用プロセス10の性能上の支障がなくなる。
また、単に規板と新版とを、切り換えたのでは。
待機プロセス11において、新版13Bからの読み出し
を完了していないときに1強制的に切り換えが実行され
る可能性もある。この場合、まだ読み出していない部分
について、待機プロセス11側への反映が行われないこ
とになる。ごく稀なケースと考えられるが、もし起きた
場合には、正常な処理の続行ができなくなる。
そこで1本発明では、特に2間欠同期処理が正常なサイ
クルで実施されているかどうか、待機プロセス11で判
断できるよう1間欠同期通知内に。
現用プロセス10がシーケンス番号(通知ごとに1ずつ
加算)を付加する。
これにより、待機プロセスll側で9間欠同期処理がシ
ーケンシャルでないときには、変更部分の引き継ぎ(差
分域)情報のみでは、正確な引き継ぎが実施できないと
判断し、基情報域からの引き継ぎ処理を実施する。なお
、基情報域は、常に引き継ぎ情報をすべて保持するよう
、規板と新版との切り換えにあたって、基情報域15A
の情報を2次に新たに規板となる新版13Bの基情報域
15Bに複写している。
〔実施例〕
第2図は本発明の適用システムの例、第3図は本発明の
一実施例に係る不揮発性共用メモリ域のデータ構造、第
4図は本発明の一実施例による処理の例を示す。
本発明は9例えば第2図に示すような複合システムに適
用することができる。第2図において。
第1図と同符号のものは第1図に示すものに対応し、2
0−1.20−2はそれぞれCPtJやメモリを専属に
使用することができる物理的な単位であるプロセッサモ
ジュール(PM)、21はPM相互間およびI’Mと不
揮発性共用メモリ12間を接続する転送経路であるバス
(SS−BUS)を表す。
第2図に示すシステムにおいて、資源情報の引き継ぎの
ために、以下の処理が行われる。
■ 同−PM内の他プロセスまたは他PM内の他プロセ
スから、現用プロセス10に対して、データ送受信等の
外部事象が入力される。
■ 外部事象を入力したことを、現用プロセスIOは内
部制御表などに記憶し、かつこの情報を待機プロセス1
1に引き継ぐために、不揮発性共用メモリ12の規板1
3Aに書き込む。
■ ある時間が経過するか、書き込み量がある量販上に
なると、必要な情報を新版13Bヘコピーシ、規板と新
版とをスイッチする。
■ 待機プロセス11に対し、メツセージ送信により、
引き継ぎ情報の読み込み処理を指示する。
■ 現用プロセスlOに対して通知される外部事象は、
継続して発生するため、引き続いて、現用プロセス10
は、不揮発性共用メモリ12内のスイッチ後の現iC元
の新版13B)に、引き継ぎ情報を書き込む。
■ 待機プロセス11では、■の通知により、処理■で
現用プロセス10により書き込まれた情報を読み出し、
待機プロセス11内に反映する。
■ 処理■の情報が、スイッチ後の規板(元の新版13
B)内に、ある量販上書き込まれるか。
またはある時間が経過したならば、再び規板と新版のス
イッチを実施する。規板と新版の関係は、処理■のスイ
ッチ前の状態に戻る。
■ 上記■と同様に、待機プロセス11に対し。
メツセージ送信により、引き継ぎ情報の読み込み指示を
行った後、現用プロセス10は引き続いて、不揮発性共
用メモリ12内のスイッチ後の規板13Aに、引き継ぎ
情報を書き込む。
■ ■の通知により、処理■で現用プロセスIOにより
書き込まれた情報を、待機プロセス11は、不揮発性共
用メモリ12から読み出しで反映する。
以上の処理を繰り返すことにより、不揮発性共用メモリ
12内のデータの一意性を保証する。
第3図は、その不揮発性共用メモリ域の本実施例におけ
るデータ構造を示しでいる。
現用プロセスから待機プロセスへの引き継ぎ情報の伝達
を間欠的に実施するため、不揮発性共用メモリ域のデー
タ構造を、第3図に示すように。
規板13Aと新版13Bの二重構造とする。この情報の
引き継ぎは、ある時間の経過またはある量の情報が蓄積
された契機で行われるが、伝達する情報として、不揮発
性共用メモリ12域内のすべてを対象とするのではなく
、更新分の情報のみを対象とする。
差分域14A、14Bは、変更分の情報を待機プロセス
において限定可能とするためのものであり、これには、
基情報域15A、15B内へのポインタが格納されてい
る。基情報域15A、15Bには、実際の引き継ぎ情報
が格納されており。
ここには、現用プロセスから待機プロセスへ伝達する全
情報が格納されている。ただし、情報の中には、現用プ
ロセスの業務如何により、不要となるものがあり、その
ようなものは、途中で破棄されるので、基情報域15A
、15Bがオーバフローすることはない。
通信制御プロセスを例に説明すると、以下のとおりであ
る。
通信制御プロセスでは1例えば回線やデータリンクなど
の通信資源を活性化した場合、どのような属性の通信資
源を活性化したかを情報として伝達する必要がある。ま
た、非活性化が行われた場合には、既に通知したどの資
源が非活性化されたかを情報として伝達する必要がある
。この非活性化が通知された以降は、資源の属性等の引
き継ぎ情報が不要となり、基情報域15Aまたは15B
内に保持する必要がなくなる。
規板13Aは、現用プロセスが引き継ぎ情報を書き込む
領域であり、新版13Bは、待機プロセスが引き継ぎ情
報を読み出す領域である。したがって、差分域14A、
14Bから基情報域15A。
15Bへのポインタ形式は、規板と新版とでは相違する
通信資源である回線の活性化および非活性化の事象を例
に、第4図に従って現用プロセスおよび待機プロセスの
処理の流れを説明する。説明を簡易化するために、差分
域14A、14Bのエントリ数を2.基情報域15A、
15B内情報量を4とする。
■ 現用プロセスは9回線L1の活性化要求がコマンド
等により指示された場合、規板の基情報域15Aから、
未使用領域を獲得し1回線L1の伝達すべき属性情報を
設定するとともに、差分域14Aに、活性化要求コード
および基情報域15A内における回線L1の情報域への
ポインタを設定する。
■ 回線L2に対する活性化要求があった場合。
処理■と同様に、引き継ぎ情報の設定を行う。
これにより、規板の差分域14A、基情報域」5Aは、
第4図(a)に示すような状態になる。
■ 現用プロセスは、差分域14Aが一杯になったため
1間欠同期処理を開始する。
■ まず、規板における基情報域15A内の必要な情報
を、第4図(b)に示すように、すべて新版の基情報域
15Bヘコピーする。
■ 次に、第4図(c)に示すように、規板と新版とを
スイッチする。
■ その後、待機プロセスに対し1間欠同期通知を行う
■ 待機プロセスでは、この間欠同期通知により。
新版となった差分域14Aの情報から更新分の情報、す
なわち1回線L1と回線L2の活性化を知り、待機プロ
セス内に反映する。反映した後の差分域!JA内の情報
は、クリアまたは無効化する。
■ 現用プロセスでは、待機プロセスにおける処理■と
並行して、新たな規板の差分域14Bおよび基情報域1
5Bを対象に、引き継ぎ情報の設定処理を行う6例えば
1回IL2の非活性化要求がコマンド等により指示され
ると、差分域14Bに、非活性化要求コードを設定する
とともに1回線L2に関する情報が格納されている基情
報域15B内へのポインタを設定する。
■ さらに2回LAL3に対する活性化要求があった場
合、処理■と同様に、引き継ぎ情報の設定を行う。これ
により、規板の差分域14B、基情報域15Bは、第4
図(d)に示すような状態になる。
[相] 現用プロセスは、差分域14Bが一杯になった
ため2間欠同期処理を開始する。
■ まず、現版における基情報域15B内の必要な情報
を、すべて新版の基情報域15Aヘコビーする。
@ このとき9回線L2で使用していた基情報域15A
内の領域は、非活性化により不要となるため、未使用領
域として解放する。これにより。
第4図(e)に示すような状態になる。
■ 次に、第4図(f)に示すように、現版と新版とを
スイッチする。
■ そして、待機プロセスに対し9間欠同期通知を行う
■ 待機プロセスでは、この間欠同期通知により。
新版となった差分域14Bの情報から5回線L2の非活
性化と回線L3の活性化を知り、待機プロセス内に反映
する。
■ 現用プロセスでは、待機プロセスにおける処理■と
並行して、新たな現版の差分域14Aおよび基情報域1
5Aを対象に、引き継ぎ情報の設定処理を行う、以下、
上記の以降の処理と同様な処理が、サイクリックに行わ
れる。
なお、非活性化とは、結果的にその資源情報を破棄する
ことを意味する。
〔発明の効果〕
以上説明したように1本発明によれば、待機プロセスに
おいて間欠的に行う動作環境の事前構築により、現用プ
ロセスの処理が待たされることはなく、また、待機プロ
セスにおける処理の遅れによって、引き継ぐべきデータ
が喪失することを防ぐことが可能になる。したがって2
通信制御プログラム等のフォールトトレラント化を、確
実に実現できるようになる。
【図面の簡単な説明】
第1図は本発明の原理説明図。 第2図は本発明の適用システムの例。 第3図は本発明の一実施例に係る不揮発性共用メモリ域
のデータ構造。 第4図は本発明の一実施例による処理の例。 第5図は従来技術の例を示す。 図中、10は現用プロセス、11は待機プロセス、12
は不揮発性共用メモリ、13Aは現版。 13Bは新版、14A、14Bは差分域、15A。 15Bは基情報域、16は不揮発性共用メモリ管理プロ
セス、PI〜P4は処理過程を表す。

Claims (1)

  1. 【特許請求の範囲】 現用プロセス(10)と待機プロセス(11)とを有し
    、不揮発性共用メモリ(12)に設定された情報を、現
    用プロセス(10)から待機プロセス(11)へ引き継
    ぐことにより、現用プロセス(10)の障害時に、待機
    プロセス(11)が現用プロセス(10)に代わり、業
    務を継続して運用する計算機システムにおける引き継ぎ
    情報のデータ保証処理方法において、 引き継ぎ情報が設定される不揮発性共用メモリ(12)
    の領域を、現版(13A)と新版(13B)の二重構造
    とし、 現版(13A)と新版(13B)のそれぞれに、現用プ
    ロセス(10)から待機プロセス(11)へ伝達すべき
    情報が格納される基情報域(15A、15B)と、変更
    分の情報を示す情報が格納される差分域(14A、14
    B)とを設け、 現用プロセス(10)は、現版(13A)に書き込みを
    行い(P1)、 待機プロセス(11)は、新版(13B)から読み出し
    を行い(P4)、 現用プロセス(10)は、所定時間の経過または所定量
    の情報の蓄積により、現版(13A)の基情報域(15
    A)の内容を、新版(13B)の基情報域(15B)に
    複写するとともに、現版を新版に、新版を現版に切り換
    え(P2)、 現版と新版の切り換えを、現用プロセス(10)から待
    機プロセス(11)に通知する(P3)ことを特徴とす
    る引き継ぎ情報のデータ保証処理方法。
JP1266425A 1989-08-17 1989-10-13 引き継ぎ情報のデータ保証処理方法 Expired - Fee Related JP2772068B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP1266425A JP2772068B2 (ja) 1989-10-13 1989-10-13 引き継ぎ情報のデータ保証処理方法
EP90309008A EP0413586B1 (en) 1989-08-17 1990-08-16 A system to pass through resource information
AU61081/90A AU645757B2 (en) 1989-08-17 1990-08-16 A system to pass through resource information
DE69031965T DE69031965T2 (de) 1989-08-17 1990-08-16 System zum Durchgang von Hilfsmittelinformation
US08/181,368 US5446875A (en) 1989-08-17 1994-01-14 System to pass through resource information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1266425A JP2772068B2 (ja) 1989-10-13 1989-10-13 引き継ぎ情報のデータ保証処理方法

Publications (2)

Publication Number Publication Date
JPH03127231A true JPH03127231A (ja) 1991-05-30
JP2772068B2 JP2772068B2 (ja) 1998-07-02

Family

ID=17430760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1266425A Expired - Fee Related JP2772068B2 (ja) 1989-08-17 1989-10-13 引き継ぎ情報のデータ保証処理方法

Country Status (1)

Country Link
JP (1) JP2772068B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309188A (ja) * 1993-04-23 1994-11-04 Nec Corp デュープレックスシステムにおける共有装置のスタテックアサイン方法およびその装置
JPH06342382A (ja) * 1993-05-31 1994-12-13 Nec Corp ホットスタンバイ高速切替えシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309188A (ja) * 1993-04-23 1994-11-04 Nec Corp デュープレックスシステムにおける共有装置のスタテックアサイン方法およびその装置
JPH06342382A (ja) * 1993-05-31 1994-12-13 Nec Corp ホットスタンバイ高速切替えシステム

Also Published As

Publication number Publication date
JP2772068B2 (ja) 1998-07-02

Similar Documents

Publication Publication Date Title
CA2091993C (en) Fault tolerant computer system
JP2514208B2 (ja) ホットスタンドバイメモリ−コピ−方式
US5802267A (en) Method for checkpointing in computer system under distributed processing environment
US7523344B2 (en) Method and apparatus for facilitating process migration
JP2002522845A (ja) フォールトトレラント・コンピュータシステム
JPS61289458A (ja) プロセス間通信装置
JPH09171441A (ja) 二重化記憶装置の記憶一致方法および装置
CN115550384B (zh) 集群数据同步方法、装置、设备及计算机可读存储介质
JPH07262034A (ja) データ引き継ぎシステム
JPH03127231A (ja) 引き継ぎ情報のデータ保証処理方法
US5446875A (en) System to pass through resource information
JP2001109642A (ja) クラスタシステム、及びそのデータ複写方法
JPH1069470A (ja) マルチプロセッサシステム
KR100319742B1 (ko) 분산데이터베이스관리시스템에서의중복데이터일치성제어방법
KR0168947B1 (ko) 실시간 분산시스템에서 디스크를 갖지 않는 노드의 부팅 방법
JP3434311B2 (ja) 電子交換機
JP3570639B2 (ja) システム定義情報の管理方法
JP3697467B2 (ja) 交換機のオブジェクト更新システム
JP2633742B2 (ja) フォールトトレラント・システム
KR950009430B1 (ko) 실시간 운용체계에서의 병행처리 프로세스 시간지연 방법
JPH02139630A (ja) オンラインタスク入替え装置
CN116820833A (zh) 崩溃恢复方法及装置
KR100204036B1 (ko) 고속 데이터 전송 채널의 에러 처리 장치
JPH11202906A (ja) 工程管理システム及びデータ収集装置及びその制御方法及び記憶媒体
JPH09152996A (ja) データ引き継ぎシステム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees