JPH08202627A - 二重化された共用メモリの等価性回復処理方法および装置 - Google Patents

二重化された共用メモリの等価性回復処理方法および装置

Info

Publication number
JPH08202627A
JPH08202627A JP7011194A JP1119495A JPH08202627A JP H08202627 A JPH08202627 A JP H08202627A JP 7011194 A JP7011194 A JP 7011194A JP 1119495 A JP1119495 A JP 1119495A JP H08202627 A JPH08202627 A JP H08202627A
Authority
JP
Japan
Prior art keywords
cluster
synchronization
equivalence
shared memory
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7011194A
Other languages
English (en)
Other versions
JP3253473B2 (ja
Inventor
Masato Fushimi
眞人 伏見
Kazunori Hiraishi
寿徳 平石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP01119495A priority Critical patent/JP3253473B2/ja
Priority to US08/524,580 priority patent/US5737509A/en
Publication of JPH08202627A publication Critical patent/JPH08202627A/ja
Application granted granted Critical
Publication of JP3253473B2 publication Critical patent/JP3253473B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation

Abstract

(57)【要約】 【目的】 二重化されたメモリの一方が故障したときの
等価性回復の処理をする方法に関し、等価性回復処理を
短時間で行うことができるようにすることを目的とす
る。 【構成】 二重化された共用メモリをある複写単位に分
割し(ステップS1)、他の動作中のクラスタと同期を
取った後(ステップS3)、分割された領域を動作中の
クラスタが分担して等価性回復処理を行う(ステップS
4)ように構成した。これにより、等価性の回復処理に
要する時間が短縮され、等価性が崩れた信頼性の低い状
態でのシステム運用の時間を短縮することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は二重化された共用メモリ
の等価性回復処理方法および装置に関し、特に二重化さ
れた共用メモリを介して複数の計算機(以下、クラスタ
という)が接続されているシステムにおいて、その二重
化された共用メモリの等価性が損なわれた場合に等価性
の回復処理を行う二重化された共用メモリの等価性回復
処理方法および装置に関する。
【0002】従来、容量の大きなメモリを外部に持ち、
このメモリを複数のクラスタが共用して使用するシステ
ムがある。この外部メモリは二重化されていて、内部メ
モリの延長という性格を持ち、転送性能が内部メモリよ
り劣るが直接アクセス記憶装置に比べれば転送速度が早
いので、高速のホットスタンバイシステムが可能であ
る。また、共用されているメモリを介してこれに接続さ
れているクラスタ同士で通信も可能である。
【0003】
【従来の技術】従来、メモリが外部に対で装備されてい
てその内容が二重化されている共用メモリを介して複数
のクラスタが接続されているシステムでは、対となって
いる一方のメモリが故障して共用メモリの等価性が損な
われた場合に、そのメモリを修復した後に再び二重化す
るという等価性回復処理を行う機能を有している。
【0004】二重化された共用メモリに対してアクセス
を行っているときに、共用メモリの等価性が損なわれた
ことをあるクラスタが検出した場合、共用メモリに対す
る等価性の回復処理は、等価性損傷を検出したクラスタ
が正常なメモリからその全領域を修復されたメモリに複
写することによって行うようにしている。この等価性回
復処理が行われている間は、等価性回復領域に対するア
クセスはできないので、他のクラスタは共用メモリに対
してアクセス待ち状態となる。
【0005】
【発明が解決しようとする課題】しかし、従来の等価性
回復処理では、等価性損傷を検出した1台のクラスタが
1回にすべてのメモリ領域の複写を行うようにしている
ので、等価性回復処理に要する時間が長くなり、しか
も、等価性回復処理中は他のクラスタから共用メモリに
対するアクセスができないので、他のクラスタは長時間
アクセス不可能になる、という問題点があった。
【0006】また、等価性回復処理中に、等価性回復処
理を行っているクラスタに異常が発生する可能性はある
が、従来の等価性回復処理には、このような場合に対す
る対処の技術はない。
【0007】本発明はこのような点に鑑みてなされたも
のであり、等価性回復処理を短時間で行うことができ、
また、共用メモリに対するアクセスが長時間抑止されな
いような、二重化された共用メモリの等価性回復処理方
法および装置を提供することを目的とする。
【0008】また、本発明は、等価性回復処理中に、等
価性回復処理を行っているクラスタに異常が発生して
も、それまでに行ってきた回復処理を無駄にすることな
く、回復処理を続行することができる、二重化された共
用メモリの等価性回復処理方法および装置を提供するこ
とを目的とする。
【0009】
【課題を解決するための手段】図1は上記目的を達成す
る本発明の原理図である。二重化されたメモリを複数の
クラスタで共用するシステムにおいて、メモリの一方が
故障して、等価性回復の処理をするときには、まず、各
メモリを複数の領域に分割し(ステップS1)、特定の
クラスタは他のクラスタに複写する領域を指示し(ステ
ップS2)、動作中の他のクラスタと同期を取って等価
性回復の処理中に他のクラスタが共用メモリへアクセス
しないようにする(ステップS3)。次いで、すべての
クラスタはそれぞれに割り当てられた領域を一斉に複写
する(ステップS4)。すべてのクラスタによる複写が
完了すると、他のクラスタに同期の解除を通知して、等
価性回復処理を終了する(ステップS5)。
【0010】
【作用】上述の手段によれば、二重化された共用メモリ
を複数の小さな複写単位に分割し、各クラスタがそれぞ
れに割り当てられた小さな領域を一斉に複写するように
したので、等価性回復処理に要する時間は大幅に短縮さ
れる。
【0011】
【実施例】まず、本発明の実施例の概略について図面を
参照して説明する。図1は本発明の二重化された共用メ
モリの等価性回復処理方法を示すフローチャートであ
る。
【0012】このフローチャートによれば、二重化され
たメモリを複数のクラスタで共用するシステムにおい
て、ある特定のクラスタが対となっている一方のメモリ
の故障を検出し、故障したメモリが修復されて、メモリ
を再び二重化するとき、すなわち、等価性回復の処理を
するとき、まず、各メモリを複数の領域に分割する(ス
テップS1)。特定のクラスタは他のクラスタに複写す
る領域を指示する(ステップS2)。次いで、等価性回
復の処理中に他のクラスタが共用メモリへアクセスしな
いようにするため、特定のクラスタは他のクラスタと同
期を取る(ステップS3)。
【0013】次に、すべてのクラスタがそれぞれに割り
当てられた領域を一斉に複写して、等価性を回復する
(ステップS4)。特定のクラスタはすべてのクラスタ
による複写が完了したことを認識すると、他のクラスタ
に同期の解除を通知して、等価性回復処理を終了する
(ステップS5)。
【0014】このように、本発明による等価性回復処理
方法は、二重化された共用メモリを複数の小さな領域に
分割し、そして各クラスタはそれぞれに割り当てられた
小さな領域を一斉に複写するようにしたので、等価性回
復処理に要する時間を大幅に短縮することが可能にな
る。
【0015】図2は共用メモリの等価性の損傷の検出を
表す説明図である。この図2において、共用メモリ1は
一対のメモリ1a,1bによって構成され、それぞれ同
じ内容を有して二重化されている。共用メモリ1には、
複数のクラスタ2a,2b,・・・,2nが接続されて
おり、共有メモリ1に対する書き込みのときには、それ
ぞれのメモリ1a,1bにアクセスされ、書き込みが行
われる。ここで、この二重化格納オペレーション実行中
に一方のメモリ、たとえばメモリ1bに故障が発生した
とすると、このメモリ1bからシステム記憶使用不可が
あるクラスタ、たとえばクラスタ2aに通知され、これ
によってクラスタ2aは共用メモリの等価性の損傷を検
出することになる。その後、故障したメモリ1bは適当
な手段によって修復される。次に、修復されたメモリ1
bを再び二重化するための等価性の回復処理が行われ
る。
【0016】図3は等価性回復処理方法を説明する図で
ある。等価性の回復処理では、まず、(A)に示したよ
うに、各メモリ1a,1bは複数の小さな複写単位に分
割される。ここでは、クラスタの数であるn個の領域に
分割される。等価性の損傷を検出したクラスタ2aは他
のクラスタ2b,・・・,2nとの間で同期を取る。こ
こでは、クラスタ間通信を行って、相手のクラスタ2
b,・・・,2nに、クラスタ2aからの指示があるま
で共用メモリ1に対するアクセスを止めるように通知す
ることを、特に、「同期」と呼んでいる。このように、
クラスタ2aは他のクラスタ2b,・・・,2nに対し
て同期の依頼を行い、他のクラスタ2b,・・・,2n
は同期が完了すると、その旨をクラスタ2aに通知す
る。この同期の状態では、各クラスタでの業務アプリケ
ーションは共有メモリ1に対するアクセスに関して抑止
され、通常の処理が行われることはない。
【0017】同期が取れたことを他のクラスタ2b,・
・・,2nから通知されると、次に、クラスタ2aは他
のクラスタ2b,・・・,2nに対して回復処理の開始
を通知する。そして、(B)に示したように、分割され
た各領域の複写はクラスタ2a,2b,・・・,2nが
それぞれ分担して行い、メモリ1aにおいて分割された
領域はメモリ1bの対応する領域にそれぞれ複写され
る。この複写処理をすべてのクラスタが一斉に行うこと
によって、二重化するための等価性の回復処理は短時間
に実行されることになる。
【0018】他のクラスタ2b,・・・,2nは等価性
の回復が完了すると、クラスタ2aに通知する。そし
て、(C)に示したように、クラスタ2aは他のクラス
タ2b,・・・,2nに対して同期の解除を通知する。
これにより、各クラスタは共有メモリ1に対するアクセ
スが可能になり、業務アプリケーションは普通に動ける
ようになる。
【0019】次に、本発明の具体的な実施例について説
明する。図4は等価性回復処理が適用されるシステム構
成図である。この図によれば、外部の共用メモリとし
て、システム記憶装置(SSU)10がある。実際に
は、共用メモリとしては、このようなシステム記憶装置
10が2台あり、二重化されている。このシステム記憶
装置10には、複数のクラスタ20aおよび20bが接
続されている。ここでは、システム記憶装置10の等価
性損傷を検出して等価性の回復処理を行う主クラスタと
してクラスタ20aが、その他の複数のクラスタとして
代表的にクラスタ20bが接続されている。また、各ク
ラスタ20a,20bの構成についても、すべてのクラ
スタが主クラスタとなり得るので、実際には、同じ構成
を有している。
【0020】システム記憶装置10には、クラスタによ
って使用される記憶領域として、クラスタ間同期を取る
ときに使用される同期制御テーブル11と、各クラスタ
が複写すべき領域を設定している複写分担テーブル12
とを有している。主クラスタとしてのクラスタ20a
は、システム記憶装置10の故障を検出する等価性損傷
検出手段21と、等価性回復手段22と、同期制御手段
23aと、複写処理手段24aとを備えている。等価性
回復手段22は複写領域指定手段221および複写処理
完了手段222とを有している。クラスタ20bは、そ
の他のクラスタとして、同期制御手段23bおよび複写
処理手段24bを備えていればよい。
【0021】クラスタ20aの等価性損傷検出手段21
がシステム記憶装置10の故障を検出すると、等価性回
復手段22の複写領域指定手段221がシステム記憶装
置10の領域をある複写単位で分割してそれを各クラス
タに分担させた情報をシステム記憶装置10の複写分担
テーブル12に書き込む。次いで、同期制御手段23a
はシステム記憶装置10の同期制御テーブル11を通じ
て同期対象のクラスタ20bに対して同期要求を行い、
クラスタ20bは同期要求を確認すると、同期制御テー
ブル11を通じて同期要求元のクラスタ20aに通知す
る。同期制御手段23aは自クラスタ20aの複写処理
手段24aに複写処理を指示するとともに、他クラスタ
20bの複写処理手段24bに対して複写処理を依頼す
る。複写処理手段24a,24bはシステム記憶装置1
0の複写分担テーブル12を参照し、自クラスタが担当
する領域の複写処理を実行する。複写処理が完了する
と、その結果が複写分担テーブル12に書き込まれ、等
価性回復手段22の複写処理完了手段222はすべての
クラスタによる複写処理の完了を確認した後で、同期制
御手段23aに対し、同期解除処理を依頼する。同期制
御手段23aは同期制御テーブル11を通じて他のすべ
てのクラスタに対して同期の解除を通知する。
【0022】図5は主クラスタの等価性回復処理の流れ
を示すフローチャートである。たとえば、クラスタ20
aが等価性損傷検出手段21によってシステム記憶装置
10の故障を検出し、何らかの手段によって故障したシ
ステム記憶装置10が修復されたとする。その後、修復
されたシステム記憶装置10についての等価性回復処理
が開始される。
【0023】まず、等価性を回復する領域の開始アドレ
スおよび終了アドレスを決定する(ステップS11)。
通常は、システム記憶装置10のすべての記憶領域が対
象となる。次いで、最終アドレスまで等価性回復が完了
したかどうかが判断される(ステップS12)。ここ
で、最終アドレスまで等価性回復が完了した場合にはこ
の処理は終了する。等価性回復が完了していない場合
は、次に、動作中の他のクラスタを決定する(ステップ
S13)。これは共用メモリを介してのクラスタ間通信
によって動作中のクラスタを互いに認識することができ
るので、この機能を利用して動作中の他のクラスタが決
定される。各クラスタがどの領域を複写するかを指示す
るためのクラスタ毎の複写分担テーブル12を作成し、
正常な方のシステム記憶装置(SSU)上に設定する
(ステップS14)。次いで、クラスタ間同期を取っ
て、他クラスタに複写を依頼する(ステップS15)。
このクラスタ間同期処理については後述する。そして、
各クラスタが複写分担テーブルに設定した複写の結果を
確認する(ステップS16)。
【0024】なお、この処理の流れでは、等価性回復処
理を何回かに分けて行うためステップS12を設けてあ
る。これは次の理由による。すなわち、図3に示した処
理方法は、共有メモリを動作中のクラスタ数で分割し、
等価性回復処理を一度で行う方法である。しかし、この
方法では、共有メモリが増加したり、動作中のクラスタ
の数が減少した場合には、クラスタは等価性回復処理に
専有されることになる。このため、ステップS14で複
写分担テーブルを作成するときに、1台のクラスタによ
って一度に複写される領域は小さく設定される。
【0025】図6は他クラスタの等価性回復処理の流れ
を示すフローチャートである。主クラスタから複写の依
頼があると、他クラスタでは、まず、システム記憶装置
(SSU)上の複写分担テーブルを読み込む(ステップ
S21)。複写分担テーブルに格納されている情報に従
ってシステム記憶装置上の割り当てられた領域のデータ
を修復済のシステム記憶装置の対応する領域に複写する
(ステップS22)。複写処理が完了すると、その複写
結果を複写分担テーブルに設定する(ステップS2
3)。
【0026】次に、図5のステップS15にて行われる
クラスタ間同期の詳細について説明する。まず、クラス
タ間同期を取るときに使用される同期制御テーブルにつ
いて説明する。
【0027】図7は同期制御テーブルの構造を示す図で
ある。同期制御テーブル11は、同期取得情報域11a
と、同期中情報域11bと、同期解除情報11cとから
構成されている。同期取得情報域11a、同期中情報域
11bおよび同期解除情報11cは、同じビット配列を
有し、1ビットは1クラスタに対応させている。
【0028】図8はクラスタ間同期要求元のクラスタで
の処理の流れを示すフローチャートである。まず、共用
メモリに接続されているクラスタのうち、クラスタ間同
期を取る必要のある動作中の対象クラスタを決定し、シ
ステム記憶装置上にある同期制御テーブルの同期取得情
報域のうち同期対象クラスタに対応したビットをオンに
設定する(ステップS31)。そして、対象クラスタに
対して同期を依頼する(ステップS32)。同期取得情
報域では、対象クラスタにおいて同期要求が認識される
とそのクラスタによって対応するビットがオフにされる
ので、同期要求元のクラスタは、同期取得情報域のすべ
てのビットがオフになって、同期対象クラスタがすべて
同期を認識したことをループしながら待つ(ステップS
33)。
【0029】同期要求元のクラスタは、同期取得情報域
のすべてのビットがオフになったら同期が完了した旨を
対象クラスタに通知するため、同期中情報域のうち同期
対象クラスタに対応したビットをオンに設定する(ステ
ップS34)。その後、クラスタ間同期が取れた状態で
行うべき処理、すなわち、等価性回復処理を実行する
(ステップS35)。同期中情報域では、対象クラスタ
において同期状態で行うべき処理の完了が認識されると
そのクラスタによって対応するビットがオフにされるの
で、同期要求元のクラスタは、同期中情報域のすべての
ビットがオフになって、同期対象クラスタがすべて同期
状態で行うべき処理の完了を認識したことをループしな
がら待つ(ステップS36)。同期中情報域のすべての
ビットがオフになって、同期が取れた状態での処理がす
べてのクラスタで完了すると、同期制御テーブルの同期
解除情報のうち同期対象クラスタに対応したビットをオ
ンに設定して同期対象クラスタに対して同期解除を通知
し、クラスタ間同期の処理を終了する(ステップS3
7)。
【0030】なお、自クラスタがマルチプロセッサで構
成されている場合には、クラスタ間同期の処理を開始す
る前に、自クラスタ内のプロセッサ同士で同期を取る必
要がある。
【0031】図9はクラスタ間同期要求先のクラスタで
の処理の流れを示すフローチャートである。クラスタ間
同期要求元のクラスタから同期の依頼(ステップS3
2)があると、まず、システム記憶装置上の同期制御テ
ーブルの同期取得情報域のうち、自クラスタに対応する
ビットをオフに設定して同期要求を認識したことを同期
要求元のクラスタに通知する(ステップS41)。その
後、同期要求元のクラスタはすべての同期要求先のクラ
スタでの同期取得が完了したことを同期中情報域の同期
対象クラスタに対応するビットをオンに設定する(ステ
ップS34)ことによって通知するので、同期要求先の
クラスタは同期中情報域のうち自クラスタに対応するビ
ットがオンに設定されるのをループしながら待つ(ステ
ップS42)。その後、クラスタ間同期が取れた状態で
行うべき処理、すなわち、図6に示した処理を実行する
(ステップS43)。同期状態で行うべき処理が完了す
ると、同期要求先のクラスタは同期中情報域のうち自ク
ラスタに対応するビットをオフに設定する(ステップS
44)。そして、同期要求先のクラスタは同期要求元の
クラスタからの同期解除の通知を待つ(ステップS4
5)。同期要求元のクラスタが同期解除情報の同期対象
クラスタに対応するビットをオンに設定すると、同期要
求先のクラスタは同期解除情報を監視していてそのうち
の自クラスタに対応するビットのオンを確認し、これを
同期解除通知と認識してクラスタ間同期の処理は終了す
る。
【0032】図10は等価性回復処理を複数回に分けて
行う方法の説明図である。等価性回復処理を複数回に分
けて行う方法では、まず、(A)に示したように、二重
化された共用メモリの各システム記憶装置10a,10
bでは、各クラスタが1回に回復することができる回復
量を決定して、その回復量を単位とした分割が行われ
る。好適な実施例では、1回あたりの回復量、すなわ
ち、複写単位として、たとえば4メガバイトとしてあ
る。なお、ここでは、システム記憶装置10bに等価性
の損傷があったとし、したがって、等価性回復処理はシ
ステム記憶装置10aからシステム記憶装置10bへの
複写となる。また、ここでは、説明を簡単にするため、
動作中のクラスタは3台のクラスタ20a,20b,2
0cであるとする。
【0033】1回目の等価性回復処理において、(B)
に示したように、システム記憶装置10aにて分割され
た領域,およびはそれぞれクラスタ20a,20
b,20cが分担してシステム記憶装置10bの対応す
る領域に複写される。同様にして、2回目の等価性回復
処理では、(C)に示したように、それぞれクラスタ2
0a,20b,20cによりシステム記憶装置10aの
領域,およびがシステム記憶装置10bの対応す
る領域に複写されていき、以下、同様な方法で繰り返さ
れる。
【0034】好適な実施例では、回復処理は、たとえば
5秒に1回の割合で実行される。1回の回復処理が行わ
れて次回の回復処理が行われるまでの間は、各クラスタ
20a,20b,20cは同期が解除されているので、
この間は各クラスタ20a,20b,20cは共有メモ
リに対するアクセスが可能になり、業務アプリケーショ
ンは動作することができ、等価性回復処理のために長時
間中断されることがなく、実質的には、連続して動作し
ているように見える。
【0035】図11は等価性回復処理中のクラスタに異
常が発生した場合の処理を示す説明図である。等価性回
復処理中に処理中のクラスタに異常が発生する可能性が
ある。このような場合に、等価性回復処理をどのように
続行するかについて以下に説明する。ここでは、図10
の(C)に例示したような回復処理を行っている途中
に、たとえばクラスタ20bに異常が発生したとする。
【0036】クラスタ20bに異常が発生すると、ま
ず、(A)に示したように、その異常はクラスタ20a
において検出される。異常が発生した場合、そのクラス
タ20bは以降の等価性回復処理を分担することができ
なくなり、しかも、そのクラスタ20bが分担していた
領域の回復処理は終了していない可能性が高い。した
がって、クラスタ20aは次回の回復処理では、クラス
タ20bが異常発生時に回復処理を分担していた領域
を含めて改めて未処理領域の分割を行い、クラスタ20
aおよび20cの複写分担を作成する。ここでは、新た
に設定された領域はクラスタ20aにより、そして領
域はクラスタ20cによりシステム記憶装置10bの
対応する領域へ複写されることになる。これ以降は、こ
の2台のクラスタ20aおよび20cによって、残りの
未処理領域の回復処理が続行される。このため、等価性
回復処理中にクラスタに異常が発生したとしても、既に
回復処理が完了した領域については、無駄にすることは
ない。
【0037】図12は本発明を実施するためのハードウ
ェアの構成例を示す図である。ここでは、システム記憶
装置に接続された複数のクラスタはそれぞれほぼ同じ構
成を有しているので、代表して1台について説明する。
【0038】二重化されたシステム記憶装置31および
32は外部共有メモリを構成している。これらシステム
記憶装置31および32はクラスタ40のメモリ制御装
置(MCU)41に接続されている。メモリ制御装置4
1には、プロセッサ(CPU)42、主記憶装置(MS
U)43および入出力プロセッサ(IOP)44が接続
されており、入出力プロセッサ44には外部記憶装置で
あるハードディスク(HD)50が接続されている。通
常は、メモリ制御装置41に複数個のプロセッサが接続
されてマルチプロセッサ構成となっていることが多い。
また、この場合、主記憶装置についても、複数個の主記
憶装置がメモリ制御装置41に接続される。
【0039】ハードディスク50には、オペレーティン
グシステムや業務アプリケーションプログラムの他に、
等価性回復処理を実行するプログラムなどが記憶されて
いる。
【0040】
【発明の効果】以上説明したように本発明では、二重化
された共用メモリをある複写単位に分割し、分割された
領域を動作中のクラスタが分担して等価性回復処理を行
うように構成した。このため、等価性の回復処理に要す
る時間を短縮することができる。このことは、等価性が
崩れているという、信頼性の低い状態でのシステム運用
の時間を短縮することができ、システム全体の信頼性向
上に寄与する。
【0041】また、複写単位を小さくし、等価性回復処
理を複数回に分けて実施するようにしたことで、等価性
回復処理のためのクラスタの長時間専有を回避すること
ができる。
【図面の簡単な説明】
【図1】本発明の二重化された共用メモリの等価性回復
処理方法を示すフローチャートである。
【図2】共用メモリの等価性の損傷の検出を表す説明図
である。
【図3】等価性回復処理方法を説明する図である。
【図4】等価性回復処理が適用されるシステム構成図で
ある。
【図5】主クラスタの等価性回復処理の流れを示すフロ
ーチャートである。
【図6】他クラスタの等価性回復処理の流れを示すフロ
ーチャートである。
【図7】同期制御テーブルの構造を示す図である。
【図8】クラスタ間同期要求元のクラスタでの処理の流
れを示すフローチャートである。
【図9】クラスタ間同期要求先のクラスタでの処理の流
れを示すフローチャートである。
【図10】等価性回復処理を複数回に分けて行う方法の
説明図である。
【図11】等価性回復処理中のクラスタに異常が発生し
た場合の処理を示す説明図である。
【図12】本発明を実施するためのハードウェアの構成
例を示す図である。
【符号の説明】
1 共用メモリ 1a,1b 一対のメモリ 2a〜2n クラスタ 10 システム記憶装置(SSU) 11 同期制御テーブル 11a 同期取得情報域 11b 同期中情報域 11c 同期解除情報 12 複写分担テーブル 20a,20b クラスタ 21 等価性損傷検出手段 22 等価性回復手段 221 複写領域指定手段 222 複写処理完了手段 23a,23b 同期制御手段 24a,24b 複写処理手段

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 複数のクラスタによって共用されている
    二重化された共用メモリの等価性回復処理方法におい
    て、 等価性損失を検出した特定のクラスタにより前記共用メ
    モリの各メモリを複数の領域に分割するステップ、 前記特定のクラスタが動作中の他のクラスタと同期を取
    ることで等価性回復の処理中に他のクラスタによる共用
    メモリへのアクセスを抑止するステップ、 前記特定のクラスタにより指示された領域を一斉に複写
    するステップ、 前記特定のクラスタにより他のクラスタに対して同期の
    解除を通知するステップ、 とからなることを特徴とする二重化された共用メモリの
    等価性回復処理方法。
  2. 【請求項2】 前記分割するステップは、前記二重化さ
    れた共用メモリに接続された動作中の他のクラスタを決
    定し、動作中のクラスタの数によって前記各メモリをそ
    れぞれ分割することを特徴とする請求項1記載の二重化
    された共用メモリの等価性回復処理方法。
  3. 【請求項3】 前記分割するステップは、前記各メモリ
    をそれぞれ小さな領域を有する複写単位で分割し、前記
    二重化された共用メモリの等価性がすべて回復するま
    で、各メモリの分割、他クラスタとの同期、指示された
    領域の複写、および同期の解除のステップを繰り返すこ
    とを特徴とする請求項1記載の二重化された共用メモリ
    の等価性回復処理方法。
  4. 【請求項4】 等価性回復処理中のクラスタが故障の場
    合、既に等価性回復処理が終了していることが保証され
    る領域を除いた領域に対して、改めて他のクラスタを決
    定するステップから再開することを特徴とする請求項3
    記載の二重化された共用メモリの等価性回復処理方法。
  5. 【請求項5】 前記複写するステップは、前記特定のク
    ラスタにより指示された複写分担テーブルを参照して自
    クラスタに指示された領域だけを複写し、複写完了後の
    結果を前記複写分担テーブルに設定することからなるこ
    とを特徴とする請求項1記載の二重化された共用メモリ
    の等価性回復処理方法。
  6. 【請求項6】 前記同期を取るステップは、同期要求元
    クラスタが同期制御テーブルの同期取得情報域に同期対
    象クラスタに相当するビットをオンにし、同期対象クラ
    スタが同期要求の認識完了後に前記同期取得情報域の自
    クラスタに相当するビットをオフにし、前記同期要求元
    クラスタが前記同期取得情報域のすべてのビットがオフ
    になったことを認識して前記同期制御テーブルの同期中
    情報域の同期対象クラスタに相当するビットをオンにす
    ることで同期取得完了を同期対象クラスタに通知するこ
    とからなり、前記複写するステップは、分担された自ク
    ラスタによる領域の複写完了の後に、前記同期制御テー
    ブルの同期中情報域の自クラスタに相当するビットをオ
    フにすることからなり、前記同期の解除を通知するステ
    ップは、前記同期要求元クラスタが前記同期中情報域の
    すべてのビットがオフになったことを認識して前記同期
    制御テーブルの同期解除情報の同期対象クラスタに相当
    するビットをオンにすることで回復処理完了を同期対象
    クラスタに通知することからなることを特徴とする請求
    項1記載の二重化された共用メモリの等価性回復処理方
    法。
  7. 【請求項7】 複数のクラスタによって共用されている
    二重化された共用メモリの等価性回復処理装置におい
    て、 二重化された共用メモリから通知される等価性損傷を検
    出する等価性損傷検出手段と、 等価性回復処理に必要な情報の作成を行う等価性回復手
    段と、 動作中の他のクラスタと同期を取るための処理を行う同
    期制御手段と、 同期状態で二重化された共用メモリに対して等価性回復
    のための複写処理を行う複写処理手段と、 前記等価性回復手段によって作成されたクラスタと複写
    領域との対応情報が格納され前記複写処理手段が複写処
    理を行うときに参照される複写分担テーブルと、 前記同期制御手段による他クラスタへの同期依頼、他ク
    ラスタからの同期完了、他クラスタへの同期中情報、他
    クラスタからの等価性回復完了、および他クラスタへの
    同期解除に関する通知を仲介する同期制御テーブルと、 を備えていることを特徴とする二重化された共用メモリ
    の等価性回復処理装置。
  8. 【請求項8】 前記等価性回復手段は、前記複写分担テ
    ーブルにクラスタと複写領域との対応情報を書き込む複
    写領域指定手段と、前記複写分担テーブル中の複写処理
    の結果を読み取って前記同期制御手段に同期解除の処理
    を依頼する複写処理完了手段とを有していることを特徴
    とする請求項7記載の二重化された共用メモリの等価性
    回復処理装置。
JP01119495A 1995-01-27 1995-01-27 二重化された共用メモリの等価性回復処理方法および装置 Expired - Fee Related JP3253473B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP01119495A JP3253473B2 (ja) 1995-01-27 1995-01-27 二重化された共用メモリの等価性回復処理方法および装置
US08/524,580 US5737509A (en) 1995-01-27 1995-09-07 Method and apparatus for restoring data coherency in a duplex shared memory subsystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01119495A JP3253473B2 (ja) 1995-01-27 1995-01-27 二重化された共用メモリの等価性回復処理方法および装置

Publications (2)

Publication Number Publication Date
JPH08202627A true JPH08202627A (ja) 1996-08-09
JP3253473B2 JP3253473B2 (ja) 2002-02-04

Family

ID=11771252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01119495A Expired - Fee Related JP3253473B2 (ja) 1995-01-27 1995-01-27 二重化された共用メモリの等価性回復処理方法および装置

Country Status (2)

Country Link
US (1) US5737509A (ja)
JP (1) JP3253473B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199197A (ja) * 2008-02-20 2009-09-03 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム
JP2012208964A (ja) * 2012-08-03 2012-10-25 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6170045B1 (en) * 1997-04-30 2001-01-02 International Business Machines Corporation Cross-system data piping using an external shared memory
US6665777B2 (en) * 2000-07-26 2003-12-16 Tns Holdings, Inc. Method, apparatus, network, and kit for multiple block sequential memory management
US6944787B2 (en) * 2001-10-01 2005-09-13 International Business Machines Corporation System-managed duplexing of coupling facility structures
CN103443774A (zh) 2007-09-25 2013-12-11 富士通株式会社 信息处理装置和控制方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5222217A (en) * 1989-01-18 1993-06-22 International Business Machines Corporation System and method for implementing operating system message queues with recoverable shared virtual storage
US5208813A (en) * 1990-10-23 1993-05-04 Array Technology Corporation On-line reconstruction of a failed redundant array system
US5265235A (en) * 1990-11-30 1993-11-23 Xerox Corporation Consistency protocols for shared memory multiprocessors
US5235601A (en) * 1990-12-21 1993-08-10 Array Technology Corporation On-line restoration of redundancy information in a redundant array system
US5333305A (en) * 1991-12-27 1994-07-26 Compaq Computer Corporation Method for improving partial stripe write performance in disk array subsystems
US5398331A (en) * 1992-07-08 1995-03-14 International Business Machines Corporation Shared storage controller for dual copy shared data
US5487160A (en) * 1992-12-04 1996-01-23 At&T Global Information Solutions Company Concurrent image backup for disk storage system
US5574851A (en) * 1993-04-19 1996-11-12 At&T Global Information Solutions Company Method for performing on-line reconfiguration of a disk array concurrent with execution of disk I/O operations
US5434994A (en) * 1994-05-23 1995-07-18 International Business Machines Corporation System and method for maintaining replicated data coherency in a data processing system
US5533190A (en) * 1994-12-21 1996-07-02 At&T Global Information Solutions Company Method for maintaining parity-data consistency in a disk array

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199197A (ja) * 2008-02-20 2009-09-03 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム
JP2012208964A (ja) * 2012-08-03 2012-10-25 Hitachi Ltd 計算機システム、データ一致化方法およびデータ一致化処理プログラム

Also Published As

Publication number Publication date
US5737509A (en) 1998-04-07
JP3253473B2 (ja) 2002-02-04

Similar Documents

Publication Publication Date Title
EP0988596B1 (en) Method and system for recovery in a partitioned shared nothing database system using virtual shared disks
JP4870816B2 (ja) 改良された同期データ・ミラー・スワップのための装置、システム、および方法
US7971011B2 (en) Remote copy method and storage system
US7716518B2 (en) Remote copy synchronization in disaster recovery computer systems
US7493517B2 (en) Fault tolerant computer system and a synchronization method for the same
JP3772369B2 (ja) 記憶サブシステム
US20060179218A1 (en) Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks
US20090150630A1 (en) Computer system and control method for the computer system
JP4452438B2 (ja) 記憶システム
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
JP3774826B2 (ja) 情報処理装置
JP3253473B2 (ja) 二重化された共用メモリの等価性回復処理方法および装置
TWI669605B (zh) 虛擬機器群組的容錯方法及其容錯系統
JP2006114064A (ja) 記憶サブシステム
JP2009265973A (ja) データ同期システム、障害復旧方法、及び、プログラム
JPH09160773A (ja) マルチプロセッサシステムのマイクロプログラム交換方法
JP2006065773A (ja) 計算機システム及び同システムに適用される論理ユニット切り替え方法
CN110618951A (zh) 系统高可用存储控制方法、装置、通信设备及存储介质
JPH07281933A (ja) 計算機システム
JP2001100930A (ja) ミラーディスク制御装置
JP3463696B2 (ja) オンラインガーベッジコレクション処理方法
JPH08110840A (ja) 2重化冗長構成磁気ディスク装置の復旧方式
JP2001084179A (ja) 自動バックアップシステム及び自動バックアッププログラムを記録した記録媒体
JP2004054615A (ja) 多重化された外部メモリの等価性回復プログラム
JP2004199116A (ja) 分割バックアップ/リストア運用方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees