JP2003006015A - 分散ミラードディスクシステム - Google Patents

分散ミラードディスクシステム

Info

Publication number
JP2003006015A
JP2003006015A JP2001191719A JP2001191719A JP2003006015A JP 2003006015 A JP2003006015 A JP 2003006015A JP 2001191719 A JP2001191719 A JP 2001191719A JP 2001191719 A JP2001191719 A JP 2001191719A JP 2003006015 A JP2003006015 A JP 2003006015A
Authority
JP
Japan
Prior art keywords
flag
computer
data
disk
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001191719A
Other languages
English (en)
Other versions
JP4131621B2 (ja
Inventor
Koji Yamamoto
浩司 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001191719A priority Critical patent/JP4131621B2/ja
Publication of JP2003006015A publication Critical patent/JP2003006015A/ja
Application granted granted Critical
Publication of JP4131621B2 publication Critical patent/JP4131621B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】いわゆる組み込み処理に費やされる時間を大幅
に短縮することを可能とした分散ミラードディスクシス
テムを提供する。 【解決手段】多重化を構成するディスク8をもつ各コン
ピュータ2が、ディスク8の書き込み単位であるデータ
ブロック14に対応して設けられるフラグ12を保持
し、書き込み処理部4によるデータの書き込みの前後
に、書き込み前処理部10および書き込み後処理部11
が、他のコンピュータ2と同期して、対応するフラグ1
2のセットおよびリセットを行う。これにより、あるコ
ンピュータ2が障害から復帰した際に、最新のデータを
保持するコンピュータ2のもつフラグ12が不一致の状
態を示すデータブロック14とその障害から復帰したコ
ンピュータ2のもつフラグ12が不一致の状態を示すデ
ータブロック14とをコピーするのみで良いようにし、
組み込み処理に費やされる時間を大幅に短縮する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ネットワークで
接続される2台のコンピュータそれぞれに備えられたデ
ィスクを用いて2重化ディスクを構成する分散ミラード
ディスクシステムに係り、特に、いずれかのコンピュー
タが障害から復帰した際に他のコンピュータから最新の
データをコピーする、いわゆる組み込み処理に費やされ
る時間を大幅に短縮することを可能とした分散ミラード
ディスクシステムに関する。
【0002】
【従来の技術】データの記憶装置を2重化し、その可用
性を高めた装置として、2重化ディスク装置が存在す
る。一般的な2重化ディスク装置は、図20に示すよう
に、1台のコントローラ21と2台のディスク22とか
ら構成され、一般のディスクと同じようにコンピュータ
に接続されてデータを保存するために使用される。この
2重化ディスク装置では、コンピュータからコントロー
ラ21に書き込み要求が送られてくると、2台のディス
ク22に同じデータが書き込まれる。また、1台のディ
スク22が故障し、データの読み書きができなくなった
場合には、コントローラ21が、故障したディスク22
を切り離す。そして、これ以降に送られてきた書き込み
要求は、残ったディスク22だけに書き込まれる。
【0003】すなわち、1台のディスク22が故障して
も、それまでに書き込んだデータはすべて保存され、読
み出すことが可能である。また、1台のディスク22が
故障しても、引き続きデータの読み書きが可能である。
【0004】さらに、故障したディスク22を交換する
と、コントローラ21がそれを検知し、他のディスク2
2からデータをコピーして内容を一致させる。この処理
により、再度、2台のディスク22を持つ構成に戻すこ
とができる。
【0005】この2重化ディスク装置を分散システムに
応用したのが、分散ミラードディスクシステムである。
このシステムは、図21に示すように、ネットワーク1
で接続される2台のコンピュータ2が、それぞれディス
ク8を持つ構成である。
【0006】この分散ミラードディスクシステムでは、
いずれかのコンピュータ2で書き込み要求が発生する
と、書き込み検知部3がそれを検知し、書き込み処理部
4に書き込むべき場所と内容を含んだデータを送る。一
方、書き込み処理部4は、もう1台のコンピュータ2の
書き込み処理部4にネットワーク1経由でそのデータを
送る。そして、2台のコンピュータ2の書き込み処理部
4は、そのデータに基づいて、書き込み要求で指示され
た内容をそれぞれのディスク8に書き込む。これを更新
コピーと呼ぶ。
【0007】この分散ミラードディスクシステムでは、
2台のコンピュータ2を集中管理する、2重化ディスク
装置のコントローラ21にあたる装置を持たない。その
代わりに、この分散ミラードディスクシステムは、他の
コンピュータ2の状態を監視するために、クラスタマネ
ージャ5を用いる。そして、このクラスタマネージャ5
は、次のような場合に、コンピュータ2の障害として検
知する。
【0008】・ディスク8への書き込み/読み出しに失
敗・コンピュータ2が応答しない(電源が切れている、
コンピュータ2が動作していない)・ネットワーク1が
切れているクラスタマネージャ5によって検出されたコ
ンピュータ2の障害の情報は、ノードマップ6に書き込
まれる。書き込み処理部4は、ノードマップ6を参照
し、相手のコンピュータ2に障害が発生しているときに
はデータを送らなくなる。
【0009】また、コンピュータ2が障害から復帰した
場合には、その旨をクラスタマネージャ5が検知し、再
度システムの一部として動作するための処理、いわゆる
組み込み処理を実行するように組み込みコピー処理部7
に通知する。そして、組み込みコピー処理部7は、障害
の起きていないコンピュータ2が持つ最新のデータを障
害から復帰したコンピュータ2の持つディスク8にコピ
ーする。これを組み込みコピーと呼ぶ。この時、同じデ
ータについて更新コピーと組み込みコピーとが同時に動
作しないよう、更新コピーは組み込みコピーと排他をと
って行なわれることになる。
【0010】
【発明が解決しようとする課題】ところで、この分散ミ
ラードディスクシステムでは、組み込みコピーをすべて
のデータをコピーすることによって実施していた。した
がって、このコピーを行なっている間は、ネットワーク
やコンピュータに過度な負荷がかかり、また、コピーす
べきデータの量が多い場合には、そのコピーが長期化し
てしまうといった問題があった。
【0011】この発明は、このような事情を考慮してな
されたものであり、いずれかのコンピュータが障害から
復帰した際に他のコンピュータから最新のデータをコピ
ーする、いわゆる組み込み処理に費やされる時間を大幅
に短縮することを可能とした分散ミラードディスクシス
テムを提供することを目的とする。
【0012】
【課題を解決するための手段】前述した目的を達成する
ために、この発明は、多重化を構成するディスクをもつ
コンピュータそれぞれが、ディスクの書き込み単位であ
るブロックそれぞれに対応して設けられる複数のフラグ
を保持し、データの書き込み処理の前後に、他のコンピ
ュータと同期して、対応するフラグのセットおよびリセ
ットを行うようにしたものである。つまり、あるコンピ
ュータのディスクには書き込まれたが、あるコンピュー
タのディスクには書き込まれていないといった不一致の
状態にあるブロックをフラグにより管理するようにした
ものである。より具体的には、この発明は、ネットワー
クで接続される2台のコンピュータそれぞれに備えられ
たディスクを用いて2重化ディスクを構成する分散ミラ
ードディスクシステムにおいて、前記各コンピュータ
は、前記ディスクの書き込み単位であるブロックそれぞ
れに対応して設けられる複数のフラグを格納するフラグ
格納手段と、前記ディスクにデータを書き込む前に、そ
のブロックに対応するフラグをオンにするとともに、相
手のコンピュータが稼働中であれば、そのフラグをオン
にする旨を相手のコンピュータに通知する書き込み前処
理手段と、前記ディスクに対するデータの書き込み時
に、相手のコンピュータが稼働中であれば、前記書き込
み前処理手段により通知されたフラグのオンを完了した
旨が相手のコンピュータから通知されるのを待って、そ
の書き込みを実行するとともに、そのデータを相手のコ
ンピュータに送信し、相手のコンピュータが停止中であ
れば、その書き込みを即座に実行する書き込み処理手段
と、前記ディスクにデータを書き込んだ後に、相手のコ
ンピュータが稼働中であれば、前記書き込み処理手段に
より送信されたデータの書き込みを完了した旨が相手の
コンピュータから通知されるのを待って、そのブロック
に対応するフラグをオフにするとともに、そのフラグを
オフにする旨を相手のコンピュータに通知する書き込み
後処理手段と、オン状態にあるフラグに対応するブロッ
クのデータを相手のコンピュータに順次送信するととも
に、そのデータの書き込みを完了した旨が相手のコンピ
ュータから通知されるのを待って、そのフラグをオフに
する組み込みコピー手段とを具備することを特徴とする
分散ミラードディスクシステムを提供する。
【0013】この分散ミラードディスクシステムにおい
ては、いずれかのコンピュータが障害から復帰した際に
は、最新のデータを保持するコンピュータのもつフラグ
が不一致の状態を示すブロックと、その障害から復帰し
たコンピュータのもつフラグが不一致の状態を示すブロ
ックとをコピーするのみでよいため、いわゆる組み込み
処理に費やされる時間を大幅に短縮することを可能とす
る。
【0014】
【発明の実施の形態】以下、図面を参照してこの発明の
一実施形態を説明する。
【0015】まず、この発明の実施形態に係る分散ミラ
ードディスクシステムが実行する組み込みコピーの基本
原理について説明する。
【0016】組み込みコピーを行なう理由は、障害から
復帰したコンピュータのディスクの内容と、障害の起き
ていないコンピュータのディスクの内容とを同じにする
ためである。
【0017】コンピュータの障害のうち、ディスクに障
害が発生し、新しいディスクと交換した場合は、すべて
のデータをコピーする必要がある。一方、コンピュータ
の処理は停止しても、ディスクの内容がそのまま残って
いるような場合には、組み込み時に、他のコンピュータ
と異なっているデータだけをコピーすれば、他のコンピ
ュータの持つデータと一致させることが可能である。そ
こで、この実施形態の分散ミラードディスクシステムで
は、この点を考慮して、組み込み処理に費やされる時間
を大幅に短縮するための仕組みを構築する。
【0018】しかしながら、単純に、コンピュータが停
止している間に変更されたデータの位置情報を別のコン
ピュータで記憶しておき、再開した時にそのデータをコ
ピーする方法では、すべてのデータを一致させることが
できない場合がある。具体的には、あるコンピュータの
データが更新され、そのデータを他のコンピュータにコ
ピーする前に、データが更新されたコンピュータが停止
してしまった場合である。この場合、データが更新され
たコンピュータの持つデータと他のコンピュータの持つ
データは異なっているが、データが更新された時点では
すべてのコンピュータが動作していたので、データが異
なっているという情報は記憶されず、組み込みコピーで
データを一致させることができなくなってしまう。
【0019】ここで、図1を参照して、この実施形態の
分散ミラードディスクシステムにおいて組み込みコピー
を行うデータの条件を説明する。図1中、横軸は時間の
流れを表し、縦軸はコンピュータの状態を表す。
【0020】いま、コンピュータ1,2があり、1が停
止、再開したとする。このとき組み込みコピーするデー
タの条件は、 (条件1)コンピュータ1のデータで、変更されたがコ
ンピュータ2にはコピーされなかったデータ (条件2)コンピュータ2のデータで、変更されたがコ
ンピュータ1にはコピーされなかったデータの2種類で
ある。
【0021】この2種類のデータを記憶するために、こ
の実施形態の分散ミラードディスクシステムでは、ディ
スク内をデータブロックに分割し、各データブロックに
対応するフラグを記憶する。(条件1)のデータを記憶
するには、データを書き込む前にフラグをセットする必
要がある。なぜなら、データを書き込んでいる間にコン
ピュータ1が停止した場合、このデータはコンピュータ
2のデータとは異なっており、組み込みコピーをしなけ
ればならないためである。また、書き込みが終了し、コ
ンピュータ2へのコピーが終了したら、データは一致し
ているため、フラグをリセットする。
【0022】一方、(条件2)のデータを記憶するに
は、コピーが完了しなかったデータブロックに対応する
フラグをセットすればよい。また、(条件1)と同様、
書き込む前にフラグをセットし、書き込みが完了したら
リセットするという手順でも、結果は同じとなる。
【0023】このように、データを書き込む前にフラグ
をセットし、書き込みが完了したらリセットする、とい
う処理を行なうことにより、(条件1)および(条件
2)の両方のデータを記憶することができる。
【0024】次に、フラグをどこで記憶するかを考え
る。2重化ディスク装置では、コントローラという、ど
ちらのディスクが停止しても常に動作しているという前
提の装置があるために、フラグをコントローラで記憶し
ておくことにすれば問題はないが、分散システムでは、
コンピュータが停止する可能性があるため、フラグを記
憶する場所が重要な意味を持つ。
【0025】コンピュータの記憶装置には、コンピュー
タが停止しても情報を保持しているものと、コンピュー
タが停止すると情報が消えてしまうものとの2種類が存
在する。前者を不揮発性の記憶装置、後者を揮発性の記
憶装置と呼ぶことにする。また、不揮発性の記憶装置に
あるフラグを不揮発性のフラグ、揮発性の記憶装置にあ
るフラグを揮発性のフラグと呼ぶことにする。つまり、
コンピュータが停止したとき、揮発性のフラグの内容は
消えてしまうことになる。
【0026】代表的な不揮発性の記憶装置である磁気デ
ィスク装置は、同じく代表的な揮発性の記憶装置である
メモリ(RAM)と比較して、データの読み書き速度が
遅いため、以下では、前述した組み込みコピーの基本原
理と合わせて、不揮発性の記憶装置を使わない方法や、
不揮発性の記憶装置と揮発性の記憶装置を組み合わせる
ことによって内容を変更する時間を短くする方法など、
種々の方法について各実施形態ごとに説明する。
【0027】(第1実施形態)図2は、この発明の第1
実施形態に係わる分散ミラードディスクシステムの構成
を示す図である。
【0028】図2に示すように、この分散ミラードディ
スクシステムは、2台のコンピュータ2が、ネットワー
ク1によって接続されている。また、各コンピュータ
は、揮発性のフラグ12を持ち、ディスク8に記憶され
ているデータ9は、データブロック14という複数の領
域に分割されている。そして、フラグ12とこのデータ
ブロック14は1対1に対応している。
【0029】各コンピュータでは、クラスタマネージャ
5が動作する。クラスタマネージャ5は、互いに通信す
ることによって相手のコンピュータ2の停止、復旧を検
知することができる。また、クラスタマネージャ5は、
ノードマップ6を持ち、このノードマップ6にコンピュ
ータ2の障害の情報を記録する。
【0030】また、各コンピュータは、組み込みコピー
制御部7を持つ。組み込みコピー制御部7は、クラスタ
マネージャ5から組み込みコピー開始通知を受け取る
と、ノードマップ6およびフラグ12を参照して、組み
込みコピーを行なうデータブロック14を決定し、2台
の組み込みコピー制御部7間でそのデータのコピーを実
行させる。そして、フラグ12を1つずつ参照する際
に、いくつ目のフラグ12までを処理したかを記憶する
ため、フラグカウンタ13を用いる。
【0031】さらに、各コンピュータ2は、不揮発性の
記憶領域中に、フラグ12を退避するためのフラグ待避
領域16を持つ。
【0032】(更新コピー)まず、この分散ミラードデ
ィスクシステムにおける更新コピー時の動作を説明す
る。なお、ここでは、書き込み要求が発生した側を更新
コピー元、もう1台を更新コピー先と呼ぶことにする。
【0033】この更新コピー元のコンピュータの処理を
図3に、更新コピー先のコンピュータの処理を図4に示
す。
【0034】書き込み要求が送られてくると、書き込み
検知部3がそれを検知し、書き込み前処理部10に書き
込むべき場所と内容とを含んだデータを送る。一方、書
き込み前処理部10は、書き込むべき場所の情報から、
変更するデータブロック14に対応するフラグ12を決
定する。そして、ノードマップ6を参照して、相手のコ
ンピュータが動作しているかどうかを確認する(図3の
ステップA1)。
【0035】相手のコンピュータ2が停止している場合
(図3のステップA1のNO)、書き込み前処理部10
は、フラグ12をセットし(図3のステップA11)、
書き込み処理部4に書き込み検知部3から受け取ったデ
ータを送る。書き込み処理部4は、ディスク8に書き込
みを行ない(図3のステップA12)、書き込み後処理
部11に書き込み終了通知を送る。この場合、書き込み
後処理部11は何もせず、更新コピーは終了する。
【0036】相手のコンピュータ2が動作している場合
(図3のステップA1のYES)、書き込み前処理部1
0は、フラグセット通知を相手のコンピュータ2に送り
(図3のステップA2)、自分のフラグ12をセットす
る(図3のステップA3)。ここで、書き込み前処理部
10は、フラグセット完了通知を待機し(図3のステッ
プA4)、受け取ったら、書き込み検知部3から受け取
ったデータを書き込み処理部4に送信する。
【0037】書き込み処理部4は、相手のコンピュータ
2にそのデータを送り(図3のステップA5)、自分の
ディスク8に書き込みを行なう(図3のステップA
6)。書き込み処理部4は、書き込み完了通知を待機し
(図3のステップA7)、受け取ったら、書き込み後処
理部11に書き込み終了を通知する。
【0038】そして、書き込み後処理部11は、相手の
コンピュータ2にフラグリセット通知を送り(図3のス
テップA8)、自分のフラグ12をリセットする(図3
のステップA9)。そして、フラグリセット完了通知を
待機し(図3のステップA10)、受け取ったら、更新
コピーの処理を終了する。
【0039】一方、フラグセット通知を受け取った場
合、書き込み前処理部10は、フラグ12をセットし
(図4のステップB1)、フラグセット完了通知を返送
して(図4のステップB2)、書き込み要求を待機する
(図4のステップB3)。
【0040】また、データを受け取ると、書き込み処理
部4は、ディスク8に書き込みを行ない(図4のステッ
プB4)、書き込み完了通知を返送して(図4のステッ
プB5)、フラグリセット通知を待機する(図4のステ
ップB6)。
【0041】そして、フラグリセット通知を受け取る
と、書き込み後処理部11は、フラグ12をリセットし
て(図4のステップB7)、フラグリセット完了通知を
返送する(図4のステップB8)。
【0042】(組み込みコピー)次に、この分散ミラー
ドディスクシステムにおける組み込みコピー時の動作を
説明する。なお、ここでは、障害から復帰した側を組み
込みコピー先、もう1台を組み込みコピー元と呼ぶこと
にする。組み込みコピー元が主導のコピー処理を図5
に、組み込みコピー先が主導のコピー処理を図6に示
す。
【0043】組み込みコピー元において、クラスタマネ
ージャ5から組み込みコピー開始の通知を受け取ると、
組み込みコピー制御部7は、まず、フラグカウンタ13
を0にする(ステップC1)。そして、組み込みコピー
制御部7は、フラグカウンタ13がフラグ12の数を越
えるまで(図5のステップC2のYES)、このフラグ
カウンタ13を1つずつ増やしながら(図5のステップ
C7)、フラグ12の状態を1つずつ読み込み、以下の
処理を繰り返す。
【0044】フラグ12の状態を読み込んだとき、その
状態がリセットであれば(図5のステップC3のN
O)、組み込みコピー制御部7は何もしない。一方、フ
ラグ12の状態がセットであった場合(図5のステップ
C3のYES)、組み込みコピー制御部7は、そのフラ
グ12に対応するデータブロック14の位置情報と内容
とを含んだデータを相手のコンピュータに送信し(図5
のステップC4)、完了通知を待機する(図5のステッ
プC5)。そして、完了通知を受け取ったら、組み込み
コピー制御部7は、フラグ12をリセットする(図5の
ステップC6)。
【0045】一方、組み込みコピー先において、データ
ブロック14の位置情報と内容とを含んだデータを受け
取った場合は(図5のステップD1)、組み込みコピー
制御部7は、ディスク8に書き込みを行ない(図5のス
テップD2)、完了通知を返して(図5のステップD
3)、フラグ12をリセットする(図5のステップD
4)。
【0046】また、組み込みコピー先においても、クラ
スタマネージャ5から組み込みコピー開始の通知を受け
取ると、同様に、組み込みコピー制御部7は、フラグカ
ウンタ13を0にした後(図6のステップE1)、フラ
グカウンタ13がフラグ12の数を越えるまで(図6の
ステップE2のYES)、このフラグカウンタ13を1
つずつ増やしながら(図6のステップE9)、フラグ1
2の状態を1つずつ読み込み、以下の処理を繰り返す。
【0047】フラグ12の状態を読み込んだとき、その
状態がリセットであれば(図6のステップE3のN
O)、組み込みコピー制御部7は何もしない。一方、フ
ラグ12の状態がセットであった場合(図6のステップ
E3のYES)、組み込みコピー制御部7は、相手のコ
ンピュータ2に対し、コピーすべきデータブロック14
の情報を含んだ組み込みコピー要求を送る(図6のステ
ップE4)。
【0048】そして、このデータを受信すると(図6の
ステップE5)、組み込みコピー制御部7は、そのデー
タをディスク8に書き込み(図6のステップE6)、完
了通知を返送した後(図6のステップE7)、そのフラ
グ12をリセットする(図6のステップE8)。
【0049】一方、組み込みコピー元において、組み込
みコピー要求を受け取った場合、組み込みコピー制御部
7は、相手のコンピュータ2に対し、その組み込みコピ
ー要求で指定されたデータブロック14の内容を含んだ
データを送信する(図6のステップF1)。そして、組
み込みコピー制御部7は、完了通知を待機し(図6のス
テップF2)、受け取ったら、そのデータブロック14
に対応するフラグ12をリセットする(図6のステップ
F3)。
【0050】なお、この組み込みコピーと前述した更新
コピーとは、従来技術と同様、同時に同じデータブロッ
ク14に対して行わないようにする。
【0051】(全体停止)この分散ミラードディスクシ
ステムでは、揮発性のフラグ12を使っているため、2
台のコンピュータ2が両方とも停止してしまった場合
は、フラグ12の内容がすべて消えてしまう。
【0052】2台のコンピュータ2が両方とも停止する
のは、2台のコンピュータ2が両方とも障害を起こして
停止する場合の他に、コンピュータ2は正常に動作して
いるが、停電やメンテナンス等でシステム全体を停止す
る場合がある。そして、この分散ミラードディスクシス
テムは、後者について、次のようにして、組み込みコピ
ーにかかる時間を短縮する。
【0053】コンピュータ2を停止する際、フラグ待避
制御部15は、フラグ12の状態をすべてフラグ待避領
域16にコピーするとともに、正常停止したという情報
をフラグ待避領域16に記憶する。また、コンピュータ
2が起動されると、フラグ待避制御部15は、フラグ待
避領域16を参照し、前回正常に停止したかどうかを確
認する。そして、正常停止したという情報がフラグ待避
領域16にあれば、フラグ待避制御部15は、フラグ待
避領域の状態をフラグにコピーする。この仕組みによっ
て、システムを停止するときにもフラグ12を利用する
ことができ、組み込みコピーにかかる時間を短縮するこ
とができる。
【0054】ただし、この方法は、コンピュータ2の障
害のときには利用できない。コンピュータ2に障害が発
生している状態では、フラグ待避制御部15が正常に動
作する保証ができないためである。したがって、コンピ
ュータ2が2台とも障害を起こして停止した場合には、
すべてのデータブロック14を組み込みコピーする必要
がある。
【0055】(処理の中断)ところで、前述した更新コ
ピーや組み込みコピーの途中で、コンピュータ2が停止
することもあり得る。そのような場合でも、この分散ミ
ラードディスクシステムでは、フラグ12が正しくセッ
トされ、停止したコンピュータ2が再開したときには組
み込みコピーが行なわれることを説明する。
【0056】まず、更新コピーの途中でコンピュータ2
が停止する場合について説明する。更新コピーのフラグ
12の変化とデータの変化の順序とを考えると、2台の
コンピュータ2のフラグ12が両方ともがセット状態に
なるまで書き込みは行なわれない。また、2台のコンピ
ュータ2の書き込みが両方とも完了するまでは、どちら
のフラグ12もリセットされない。よって、どちらかの
コンピュータ2でデータを書き込んでいる間に、どちら
かのコンピュータ2が停止した場合は、必ずもう一台の
停止していないコンピュータ2のフラグ12がセット状
態になり、停止したコンピュータ2が復帰した際には組
み込みコピーが行なわれる。
【0057】一方、組み込みコピーは、組み込みコピー
元のフラグ12がセットでないと開始されない。また、
フラグ12はリセットされないので、組み込みコピー先
のコンピュータ2が停止しても問題は発生しない。しか
しながら、組み込みコピー元のコンピュータ2が停止し
た場合には、2台のコンピュータ2が両方とも障害で停
止した場合と同様に、フラグ情報が消えてしまう。組み
込みコピーがすべて終わらないうちに組み込みコピー元
のコンピュータ2が停止した場合には、2台とも障害で
停止したときと同様に、再開時にはすべてのデータを組
み込みコピーする必要がある。
【0058】以上のように、この第1実施形態の分散ミ
ラードディスクシステムでは、揮発性の記憶領域にフラ
グを置くことにより、低速な不揮発性の記憶装置を用い
ることなく組み込みコピーにかかる時間を短縮できる。
【0059】また、正常に停止する場合には、フラグを
不揮発性の記憶領域に待避することにより、2台のコン
ピュータが両方停止する場合でも、組み込みコピーにか
かる時間を短縮できる。
【0060】(第2実施形態)次に、この発明の第2実
施形態を説明する。図7は、この第2実施形態に係わる
分散ミラードディスクシステムの構成を示す図である。
【0061】前述した第1実施形態とこの第2実施形態
との違いは、図7に示すように、フラグ12が不揮発性
の記憶領域にあり、揮発性の記憶領域に、フラグ12の
セット/リセットを高速化するためのフラグキャッシュ
17がある点にある。
【0062】(更新コピー)まず、この第2実施形態の
分散ミラードディスクシステムにおける更新コピー時の
動作を説明する。更新コピー元のコンピュータの処理を
図8に、更新コピー先のコンピュータの処理を図9に示
す。
【0063】書き込み処理部4は、書き込み要求を解析
し、変更するデータブロック14に対応するフラグ12
を決定し、フラグキャッシュ17にセット要求を送る。
キャッシュへのセット要求が完了したら、ノードマップ
6を参照し、相手のコンピュータ2が動作しているか停
止しているかを確認する(図8のステップG1)。
【0064】相手のコンピュータが停止している場合
(図8のステップG1のNO)、書き込み処理部4は、
フラグキャッシュ17にフラグセット通知を送信し(図
8のステップG9)、フラグキャッシュ17からの完了
通知を待機する(図8のステップG10)。そして、完
了通知を受け取ると、書き込み処理部4は、ディスク8
に書き込みを行ない(図8のステップG10)、書き込
み後処理部11に書き込み終了通知を送る。この場合、
書き込み後処理部11は何もせず、更新コピーは終了す
る。
【0065】相手のコンピュータが動作している場合
(図8のステップG1のYES)、書き込み処理部4
は、フラグキャッシュ17にフラグセット通知を送信し
(図8のステップG2)、フラグキャッシュ17からの
完了通知を待機する(図8のステップG3)。そして、
完了通知を受け取ると、書き込み処理部4は、相手のコ
ンピュータ2に書き込み通知を送り(図8のステップG
4)、自分のディスク8に書き込みを行なう(図8のス
テップG5)。書き込み処理部4は、書き込み完了通知
を待機し(図8のステップG6)、受け取ったら、フラ
グキャッシュ17にリセット要求を送り(図8のステッ
プG7)、フラグキャッシュ17からの完了通知を待機
する(図8のステップG8)。そして、完了通知を受け
取ると、書き込み処理部4は、更新コピーの処理を終了
する。
【0066】一方、書き込み要求を受け取った場合、書
き込み処理部4は、ディスク8に書き込みを行ない(図
9のステップH1)、書き込み完了通知を返す(図9の
ステップH2)。
【0067】ところで、不揮発性の記憶装置は、揮発性
の記憶装置に比べ、データの変更に時間がかかる場合が
ある。そこで、この第2実施形態の分散ミラードディス
クシステムでは、フラグキャッシュ17を用いることに
より、フラグ12のセット/リセット要求を高速に処理
するように工夫している。
【0068】図10は、フラグキャッシュ17の構成図
である。図10に示すように、フラグキャッシュ17
は、フラグ制御部171がセット/リセット通知を受け
取り、フラグ12に対してセット/リセット通知を送
る。図11を参照して、このフラグキャッシュ17の動
作を説明する。
【0069】リセット通知が送られてきた場合は(図1
1のステップJ1のYES)、完了を返した後(図11
のステップJ2)、フラグ12を参照し(図11のステ
ップJ3)、リセット状態ならは(図11のステップJ
3のYES)、何もせずに終了する。一方、セット状態
ならば(図11のステップJ3のNO)、セット通知が
来るのを一定の時間待つために、セット通知待機状態に
設定する(図11のステップJ4)。
【0070】一方、セット通知がきた場合には(図11
のステップJ1のNO,ステップJ5のYES)、完了
を返した後(図11のステップJ6)、フラグ12を参
照し(図11のステップJ7)、セット状態であれば
(図11のステップJ7のYES)、何もせずに終了す
る。一方、リセット状態ならば(図11のステップJ7
のNO)、フラグ12をセットし(図11のステップJ
8)、セット通知待機状態であれば(図11のステップ
J9)、そのセット通知待機状態を解除する(図11の
ステップJ10)。
【0071】一方、セット通知待機状態のまま一定時間
経過したとき(図11のステップJ1のNO,ステップ
J5のNO,ステップJ11のYES,ステップJ12
のYES)、フラグ12をリセットし(図11のステッ
プJ13)、そのセット通知待機状態を解除する(図1
1のステップJ14)。
【0072】つまり、このフラグキャッシュ17によれ
ば、フラグ12のセット/リセットを頻繁に繰り返す場
合、フラグ12はセット状態のまま変更されないため、
不揮発性の記憶領域であるフラグ12が変更されず、フ
ラグキャッシュ17に対するセット要求/リセット要求
はすぐに完了する。より具体的には、このフラグキャッ
シュ17は、セット通知がきたときは必ずフラグ12を
セットするが、リセット通知が来ても一定時間はフラグ
12をリセットしないことにより、フラグ12の変更回
数を減らす効果がある。リセット通知が来たデータブロ
ック14は、組み込みコピーを行なう必要がなくなった
ことを意味しているので、このフラグキャッシュ17を
用いることによって、組み込みコピーを行なうデータブ
ロック14は増える。その代わり、通常の更新コピー時
に行なわなければならないフラグキャッシュ17のセッ
ト/リセットの性能を上げることができる。
【0073】(組み込みコピー)組み込みコピーの方法
は、前述した第1実施形態と基本的には同じだが、フラ
グ12の参照およびリセット方法のみ異なる。フラグ1
2の参照は、直接フラグ12から行ない、コピーが終了
してフラグ12をリセットするときは、フラグキャッシ
ュ17に対してリセット要求を送る。
【0074】(全体停止)この第2実施形態では、不揮
発のフラグ12を使っているため、2台のコンピュータ
2が両方とも停止してしまった場合でも、フラグ12の
内容が保持されている。したがって、第1実施形態とは
異なり、2台のコンピュータ2が障害で停止した場合で
も、フラグ12の内容は消えないため、2台とも再開し
たときの組み込みコピーにかかる時間を短縮することが
できる。
【0075】以上のように、この第2実施形態の分散ミ
ラードディスクシステムでは、不揮発性のフラグを使う
ことにより、2台のコンピュータが同時に停止した場合
においても、組み込みコピーにかかる時間を短縮するこ
とができる。
【0076】また、不揮発性の記憶装置は揮発性の記憶
装置に比べて、内容の変更に時間がかかることが多い
が、揮発性の記憶装置を使ったフラグキャッシュを用い
ることにより、フラグの変更にかかる時間を短縮するこ
とができる。
【0077】(第3実施形態)次に、この発明の第3実
施形態を説明する。図12は、この第3実施形態に係わ
る分散ミラードディスクシステムの構成を示す図であ
る。
【0078】前述した第1実施形態では、2台のコンピ
ュータ2でミラードディスクを構成したが、この第2実
施形態では、これをN台(3台以上)に拡張する。
【0079】書き込み前処理部10、書き込み処理部
4、書き込み後処理部11、クラスタマネージャ5およ
び組み込みコピー制御部7は、第1実施形態では1対1
で通信を行なっていたが、この第2実施形態では、N台
で相互に通信を行なう。
【0080】また、第1実施形態では、組み込みコピー
が行なわれるときは、必ず2台のコンピュータ2が動作
していたが、この第2実施形態では、組み込みコピーの
ときに必ずしもすべてのコンピュータが動作していると
は限らない。そのため、組み込みコピー制御部7がノー
ドマップ6を参照する必要がある。
【0081】フラグ12の構成は、第1実施形態と同
様、データブロック14と1対1である。そして、すべ
てのコンピュータ2の持つデータが同じであればリセッ
ト、1台でもデータの違うコンピュータ2があればセッ
トとなるように制御を行なう。具体的な方法を以下に述
べる。
【0082】(更新コピー)いずれかのコンピュータ2
の持つディスク8に対して書き込み要求が行なわれた場
合、残りのコンピュータ2にも書き込みが行なわれる。
ここでは、書き込み要求を受け取ったコンピュータ2を
更新コピー元のコンピュータ、残りのN−1台のコンピ
ュータ2を更新コピー先のコンピュータと呼ぶことにす
る。
【0083】更新コピー元のコンピュータの処理を図1
3に、更新コピー先のコンピュータの処理を図14に示
す。
【0084】書き込み前処理部10は、書き込み要求を
解析し、変更するデータブロック14に対応するフラグ
12を決定する。また、書き込み前処理部10は、ノー
ドマップ6を参照し(図13のステップK1)、更新コ
ピー先のコンピュータが動作しているか停止しているか
を確認する。そして、書き込み前処理部10は、動作し
ている更新コピー先のコンピュータすべてにフラグセッ
ト通知を送り(図13のステップK2)、自分のフラグ
12をセットする(図13のステップK3)。ここで、
書き込み前処理部10は、フラグセット完了通知を待機
し(図13のステップK4)、そして、動作しているす
べてのコンピュータ2からフラグセット完了通知を受け
取ったら、書き込み処理部4に書き込み通知を送る。
【0085】また、書き込み処理部4は、動作している
すべての更新コピー先へ書き込み通知を送り(図13の
ステップK5)、自分のディスク8に書き込みを行なう
(図13のステップK6)。書き込み処理部4は、書き
込み完了通知を待機し(図13のステップK7)、動作
しているすべてのコンピュータから書き込み完了通知を
受け取ったら、書き込み後処理部11に書き込み終了を
通知する。
【0086】書き込み後処理部11は、システムのすべ
てのコンピュータ2が動作しているかどうかを調べ(図
13のステップK8)、すべてのコンピュータ2が動作
している場合には(図13のステップK8のYES)、
すべての更新コピー先へフラグリセット通知を送り(図
13のステップK9)、自分のフラグ12をリセットす
る(図13のステップK10)。書き込み後処理部11
は、フラグリセット完了通知を待機し(図13のステッ
プK11)、受け取ったら、更新コピーの処理を終了す
る。
【0087】また、動作していないコンピュータがあっ
た場合には(図13のステップK8のNO)、書き込み
後処理部11は、動作しているすべての更新コピー先へ
終了通知を送り(図13のステップK13)、終了確認
通知を待機して(図13のステップK14)、受け取っ
たら、この更新コピーの処理を終了する。つまり、この
場合は、フラグ12のリセットは行わない。
【0088】一方、フラグセット通知を受け取った場
合、書き込み前処理部10は、フラグ12をセットし
(図14のステップL1)、フラグセット完了通知を返
して(図14のステップL2)、書き込み要求を待機す
る(図14のステップL3)。
【0089】また、書き込み要求を受け取ると、書き込
み処理部4は、ディスク8に書き込みを行ない(図14
のステップL4)、書き込み完了通知を返す(図14の
ステップL5)。そして、書き込み後処理部11は、フ
ラッグリセット通知または終了通知を待機し(図14の
ステップL6)、フラグリセット完了通知を受け取った
ら(図14のステップL7のYES)、フラグ12をリ
セットし(図14のステップL8)、フラグリセット完
了通知を返す(図14のステップL9)。
【0090】また、終了通知を受け取ったら(図14の
ステップL7のNO)、終了確認通知を返す(図14の
ステップL10)。
【0091】(組み込みコピー)ここでは、組み込まれ
る側(停止し再開した側)を組み込みコピー先、残りの
N−1台を組み込みコピー元と呼ぶことにする。組み込
みコピー元が主導のコピー処理を図15および図16
に、組み込みコピー先が主導のコピー処理を図17およ
び図18に示す。
【0092】組み込みコピー元において、クラスタマネ
ージャ5から組み込みコピー開始の通知を受け取ると、
組み込みコピー制御部7は、まず、フラグカウンタ13
を0にする(図15のステップM1)。そして、組み込
みコピー制御部7は、フラグカウンタ13がフラグ12
の数を越えるまで(図15のステップM2)、このフラ
グカウンタ13を1つずつ増やしながら(図15のステ
ップM12)、フラグ12の状態を1つずつ読み込み、
以下の処理を繰り返す。
【0093】フラグ12の状態を読み込んだとき、その
状態がリセットであれば(図15のステップM3のN
O)、組み込みコピー制御部7は何もしない。一方、フ
ラグ12の状態がセットであった場合(図15のステッ
プM3のYES)、組み込みコピー制御部7は、ノード
マップ6を参照し(図15のステップM4)、自分を除
く動作しているすべての組み込みコピー元と組み込みコ
ピー先のコンピュータとにデータを送信する(図15の
ステップM5)。
【0094】組み込みコピー制御部7は、完了通知を待
機し、すべてのコンピュータから完了通知を受け取った
ら(図15のステップM6のYES)、すべてのコンピ
ュータにフラグリセット通知を送信するとともに(図1
5のステップM7)、自分のフラグ12をリセットし
(図15のステップM8)、フラグリセット完了通知を
待機する(図15のステップM9)。一方、いずれかの
コンピュータから完了通知がなければ(図15のステッ
プM6のNO)、組み込みコピー制御部7は、動作して
いるすべてのコンピュータに終了通知を送信して(図1
5のステップM10)、終了確認通知を待機する(図1
5のステップM11)。
【0095】一方、組み込みコピー先において、データ
を受信すると(図16のステップN1)、組み込みコピ
ー制御部7は、ディスク8に書き込みを行い(図16の
ステップN2)、書き込み完了通知を返送して(図16
のステップN3)、フラグリセット通知または終了通知
を待機する(図16のステップN4)。
【0096】フラグリセット通知を受信した場合(図1
6のステップN5のYES)、組み込みコピー制御部7
は、フラグ12をリセットし(図16のステップN
6)、フラグリセット完了通知を送信する(図16のス
テップN7)。一方、終了確認通知であれば(図16の
ステップN5のNO)、組み込みコピー制御部7は、終
了確認通知を送信する(図16のステップN8)。
【0097】また、組み込みコピー先においても、クラ
スタマネージャ5から組み込みコピー開始の通知を受け
取ると、同様に、組み込みコピー制御部7は、フラグカ
ウンタ13を0にした後(図17のステップP1)、フ
ラグカウンタ13がフラグ12の数を越えるまで(図1
7のステップP2のYES)、このフラグカウンタ13
を1つずつ増やしながら(図17のステップP6)、フ
ラグ12の状態を1つずつ読み込み、以下の処理を繰り
返す。
【0098】フラグ12の状態を読み込んだとき、その
状態がリセットであれば(図17のステップP3のN
O)、組み込みコピー制御部7は何もしない。一方、フ
ラグ12の状態がセットであった場合(図17のステッ
プP3のYES)、組み込みコピー制御部7は、ノード
マップ6を参照し(図17のステップP4)動作してい
る任意のコンピュータにコピー要求を送信する(図17
のステップP6)。
【0099】一方、組み込みコピー元において、組み込
みコピー要求を受け取ると(図18のステップQ1)、
組み込みコピー制御部7は、ノードマップ6を参照し
(図18のステップQ2)、動作しているすべての組み
込みコピー元と、組み込みコピー先にデータを送信する
(図18のステップQ3)。そして、組み込みコピー制
御部7は、完了通知を待機し、すべてのコンピュータか
ら書き込み完了通知が返ってきたら(図18のステップ
Q4のYES)、今度は、すべてのコンピュータにフラ
グリセット通知を送信する(図18のステップQ5)。
そして、自分のフラグ12をリセットし(図18のステ
ップQ6)、フラグリセット完了通知を待機する(図1
8のステップQ7)。また、いずれかのコンピュータか
ら書き込み完了通知が返ってこなければ(図18のステ
ップQ4のNO)、動作しているすべてのコンピュータ
に終了通知を送信して(図18のステップQ8)、終了
確認通知を待機する(図18のステップQ9)。
【0100】以上のように、この第3実施形態の分散ミ
ラードディスクシステムでは、3台以上のシステムにお
いても、第1実施形態で示した2台のシステムと同様
に、組み込みコピーにかかる時間を短縮することを可能
とする。
【0101】(第4実施形態)次に、この発明の第4実
施形態を説明する。この第4実施形態の分散ミラードデ
ィスクシステムでは、第3実施形態のフラグ12を拡張
したものであり、図19に示したように、N台構成のシ
ステムにおいて、1つのデータブロック14にN−1個
のフラグ12を対応させる。そして、このフラグ12
を、自分の持つデータと異なるデータを持つコンピュー
タについてはセット、同じデータを持つコンピュータに
ついてはリセットとなるように制御する。
【0102】(更新コピー)第3実施形態との違いは、
書き込み完了通知を受け取った後の動作にある。より具
体的には、フラグリセット通知または終了通知を送るの
ではなく、どのコンピュータ2が書き込み完了を返して
きたかという情報を、動作しているすべてのマシンに送
り、書き込み完了を返してきたコンピュータ2のフラグ
12をリセットする。その他のマシンも、受け取った情
報をもとに、書き込み完了を返してきたコンピュータ2
のフラグ12をリセットする。
【0103】(組み込みコピー)第3実施形態との違い
は、すべての組み込み元マシンと組み込みコピーをする
必要はなく、動作しているコンピュータ2で、フラグ1
2がセットされているコンピュータ2とだけ組み込みコ
ピーを行なえばよいという点にある。コピーが完了した
ら、対応するコンピュータ2のフラグ12だけをリセッ
トする。
【0104】この第4実施形態では、フラグ12を拡張
し、自分の持つデータが他のどのコンピュータ2のデー
タと異なっているかを保持するようにしたため、2台以
上のコンピュータ2が停止した場合に、不必要な組み込
みコピーを行なわなくて済むようになる。
【0105】(第5実施形態)次に、この発明の第5実
施形態を説明する。この第5実施形態の分散ミラードデ
ィスクシステムでは、第3実施形態のフラグ12を不揮
発性にする。この第5実施形態と第3実施形態との違い
は、フラグ12が揮発性であるか不揮発性であるかとい
う点だけであるので、第1実施形態と第2実施形態との
違いと同じである。
【0106】(更新コピー)第3実施形態との違いは、
書き込み処理の前に、フラグセット通知およびフラグセ
ット完了通知のやり取りを行なわず、自分の持つフラグ
12をセットするだけである点にある。
【0107】フラグ12のリセットは、第3実施形態と
同様に、システムのすべてのコンピュータ2から書き込
み完了が来たかどうかを確認し、すべてのコンピュータ
2から書き込み完了が来た場合のみリセット動作を行な
う。
【0108】(組み込みコピー)組み込みコピーの方法
は、第3実施形態と同じだが、フラグ12の参照および
リセット方法のみ異なる。フラグ12の参照は、直接フ
ラグ12から行ない、コピーが終了してフラグ12をリ
セットするときは、フラグキャッシュ17に対してリセ
ット要求を送る。
【0109】この第5実施形態の分散ミラードディスク
システムでは、第3実施形態の効果に加えて、すべての
コンピュータが同時に停止した場合においても、組み込
みコピーにかかる時間を短縮することができる。
【0110】また、不揮発性の記憶装置は、揮発性の記
憶装置に比べて内容の変更に時間がかかることが多い
が、揮発性の記憶装置を使ったフラグキャッシュ17を
用いることにより、フラグ12の変更にかかる時間を短
縮することができる。
【0111】(第6実施形態)次に、この発明の第6実
施形態を説明する。この第6実施形態の分散ミラードデ
ィスクシステムでは、第4実施形態のフラグ12を不揮
発性にする。この第6実施形態と第4実施形態との違い
は、フラグ12が揮発性であるか不揮発性であるかとい
う点だけであるので、第1実施形態と第2実施形態との
違いと同じである。
【0112】(更新コピー)第4実施形態との違いは、
書き込み処理の前に、フラグセット通知およびフラグセ
ット完了通知のやり取りを行なわず、自分の持つフラグ
12をセットするだけである点にある。
【0113】フラグ12のリセットは、第4実施形態と
同様に、すべての組み込み元マシンと組み込みコピーを
する必要はなく、動作しているコンピュータ2で、フラ
グ12がセットされているコンピュータ2とだけ組み込
みコピーを行なう。データの書き込みが終了したら、対
応するコンピュータ2のフラグ12だけをリセットす
る。
【0114】(組み込みコピー)組み込みコピーの方法
は、第3実施形態と同じだが、フラグ12の参照および
リセット方法のみ異なる。フラグ12の参照は、直接フ
ラグ12から行ない、コピーが終了してフラグをリセッ
トするときは、フラグキャッシュ17に対してリセット
要求を送る。
【0115】この第6実施形態の分散ミラードディスク
システムでは、第4実施形態の効果に加えて、すべての
コンピュータが同時に停止した場合においても、組み込
みコピーにかかる時間を短縮することができる。
【0116】また、不揮発性の記憶装置は、揮発性の記
憶装置に比べて内容の変更に時間がかかることが多い
が、揮発性の記憶装置を使ったフラグキャッシュ17を
用いることにより、フラグ12の変更にかかる時間を短
縮することができる。
【0117】なお、本発明は、上記実施形態に限定され
るものではなく、実施段階ではその要旨を逸脱しない範
囲で種々に変形することが可能である。更に、上記実施
形態には種々の段階の発明が含まれており、開示される
複数の構成要件における適宜な組み合わせにより種々の
発明が抽出され得る。例えば、実施形態に示される全構
成要件から幾つかの構成要件が削除されても、発明が解
決しようとする課題の欄で述べた課題が解決でき、発明
の効果の欄で述べられている効果が得られる場合には、
この構成要件が削除された構成が発明として抽出され得
る。
【0118】
【発明の効果】以上、詳述したように、この発明によれ
ば、多重化を構成するディスクをもつコンピュータそれ
ぞれが、ディスクの書き込み単位であるブロックそれぞ
れに対応して設けられる複数のフラグを保持し、データ
の書き込み処理の前後に、他のコンピュータと同期し
て、対応するフラグのセットおよびリセットを行うこと
により、あるコンピュータのディスクには書き込まれた
が、あるコンピュータのディスクには書き込まれていな
いといった不一致の状態にあるブロックをこのフラグに
より管理するようにしたことから、いずれかのコンピュ
ータが障害から復帰した際には、最新のデータを保持す
るコンピュータのもつフラグが不一致の状態を示すブロ
ックと、その障害から復帰したコンピュータのもつフラ
グが不一致の状態を示すブロックとをコピーするのみで
よいため、いわゆる組み込み処理に費やされる時間を大
幅に短縮することを可能とする。
【図面の簡単な説明】
【図1】この発明の実施形態の分散ミラードディスクシ
ステムにおいて組み込みコピーを行うデータの条件を説
明するための図。
【図2】同第1実施形態の分散ミラードディスクシステ
ムの構成を示す図。
【図3】同第1実施形態の分散ミラードディスクシステ
ムの更新コピー元のコンピュータの処理を示す図。
【図4】同第1実施形態の分散ミラードディスクシステ
ムの更新コピー先のコンピュータの処理を示す図。
【図5】同第1実施形態の分散ミラードディスクシステ
ムの組み込みコピー元が主導のコピー処理を示す図。
【図6】同第1実施形態の分散ミラードディスクシステ
ムの組み込みコピー先が主導のコピー処理を示す図。
【図7】同第2実施形態の分散ミラードディスクシステ
ムの構成を示す図。
【図8】同第2実施形態の分散ミラードディスクシステ
ムの更新コピー元のコンピュータの処理を示す図。
【図9】同第2実施形態の分散ミラードディスクシステ
ムの更新コピー先のコンピュータの処理を示す図。
【図10】同第2実施形態の分散ミラードディスクシス
テムに適用されるフラグキャッシュの構成図。
【図11】同第2実施形態の分散ミラードディスクシス
テムに適用されるフラグキャッシュの動作を説明するた
めの図。
【図12】同第3実施形態の分散ミラードディスクシス
テムの構成を示す図。
【図13】同第3実施形態の分散ミラードディスクシス
テムの更新コピー元のコンピュータの処理を示す図。
【図14】同第3実施形態の分散ミラードディスクシス
テムの更新コピー先のコンピュータの処理を示す図。
【図15】同第3実施形態の分散ミラードディスクシス
テムの組み込みコピー元が主導のコピー処理を示す第1
の図。
【図16】同第3実施形態の分散ミラードディスクシス
テムの組み込みコピー元が主導のコピー処理を示す第2
の図。
【図17】同第3実施形態の分散ミラードディスクシス
テムの組み込みコピー先が主導のコピー処理を示す第1
の図。
【図18】同第3実施形態の分散ミラードディスクシス
テムの組み込みコピー先が主導のコピー処理を示す第2
の図。
【図19】同第4実施形態の分散ミラードディスクシス
テムに適用されるフラグの構成を説明するための図。
【図20】従来の2重化ディスク装置の構成を示す図。
【図21】従来の分散ミラードディスクシステムの構成
を示す図。
【符号の説明】
1…ネットワーク 2…コンピュータ 3…書き込み検知部 4…書き込み処理部 5…クラスタマネージャ 6…ノードマップ 7…組み込みコピー制御部 8…ディスク 9…データ 10…書き込み前処理部 11…書き込み後処理部 12…フラグ 13…フラグカウンタ 14…データブロック 15…フラグ待避制御部 16…フラグ待避領域 17…フラグキャッシュ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 ネットワークで接続される2台のコンピ
    ュータそれぞれに備えられたディスクを用いて2重化デ
    ィスクを構成する分散ミラードディスクシステムにおい
    て、 前記各コンピュータは、 前記ディスクの書き込み単位であるブロックそれぞれに
    対応して設けられる複数のフラグを格納するフラグ格納
    手段と、 前記ディスクにデータを書き込む前に、そのブロックに
    対応するフラグをオンにするとともに、相手のコンピュ
    ータが稼働中であれば、そのフラグをオンにする旨を相
    手のコンピュータに通知する書き込み前処理手段と、 前記ディスクに対するデータの書き込み時に、相手のコ
    ンピュータが稼働中であれば、前記書き込み前処理手段
    により通知されたフラグのオンを完了した旨が相手のコ
    ンピュータから通知されるのを待って、その書き込みを
    実行するとともに、そのデータを相手のコンピュータに
    送信し、相手のコンピュータが停止中であれば、その書
    き込みを即座に実行する書き込み処理手段と、 前記ディスクにデータを書き込んだ後に、相手のコンピ
    ュータが稼働中であれば、前記書き込み処理手段により
    送信されたデータの書き込みを完了した旨が相手のコン
    ピュータから通知されるのを待って、そのブロックに対
    応するフラグをオフにするとともに、そのフラグをオフ
    にする旨を相手のコンピュータに通知する書き込み後処
    理手段と、 オン状態にあるフラグに対応するブロックのデータを相
    手のコンピュータに順次送信するとともに、そのデータ
    の書き込みを完了した旨が相手のコンピュータから通知
    されるのを待って、そのフラグをオフにする組み込みコ
    ピー手段とを具備することを特徴とする分散ミラードデ
    ィスクシステム。
  2. 【請求項2】 前記フラグ格納手段は、揮発性の記憶装
    置に設けられ、 前記フラグ格納手段により格納されるフラグを退避する
    ために不揮発性の記憶装置に設けられるフラグ待避手段
    と、 システム全体を停止するときに、前記フラグ格納手段に
    格納されたフラグを前記フラグ退避手段に退避し、シス
    テム全体を再開するときに、前記フラグ待避手段に退避
    されたフラグを前記フラグ格納手段に復元するフラグ退
    避制御手段と をさらに具備することを特徴とする請求項1記載の分散
    ミラードディスクシステム。
  3. 【請求項3】 前記フラグ格納手段は、不揮発性の記憶
    装置に設けられることを特徴とする請求項1記載の分散
    ミラードディスクシステム。
  4. 【請求項4】 前記フラグ格納手段に格納されたフラグ
    に対する更新の内容を一時的に蓄積するキャッシュ手段
    を揮発性の記憶装置に設けたことを特徴とする請求項3
    記載の分散ミラードディスクシステム。
  5. 【請求項5】 ネットワークで接続される3台以上のコ
    ンピュータそれぞれに備えられたディスクを用いて多重
    化ディスクを構成する分散ミラードディスクシステムに
    おいて、 前記各コンピュータは、 前記ディスクの書き込み単位であるブロックそれぞれに
    対応して設けられる複数のフラグを格納するフラグ格納
    手段と、 前記ディスクにデータを書き込む前に、そのブロックに
    対応するフラグをオンにするとともに、そのフラグをオ
    ンにする旨を稼働中の他のコンピュータすべてに通知す
    る書き込み前処理手段と、 前記ディスクに対するデータの書き込み時に、前記書き
    込み前処理手段により通知されたフラグのオンを完了し
    た旨が稼働中の他のコンピュータすべてから通知される
    のを待って、その書き込みを実行するとともに、そのデ
    ータを稼働中の他のコンピュータすべてに送信する書き
    込み処理手段と、 前記ディスクにデータを書き込んだ後に、他のすべての
    コンピュータが稼働中であれば、前記書き込み処理手段
    により送信されたデータの書き込みが完了した旨を稼働
    中の他のコンピュータすべてから通知されるのを待っ
    て、そのブロックに対応するフラグをオフにするととも
    に、そのフラグをオフにする旨を稼働中の他のコンピュ
    ータすべてに通知する書き込み後処理手段と、 オン状態にあるフラグに対応するブロックのデータを他
    のすべてのコンピュータに順次送信するとともに、その
    データの書き込みを完了した旨が他のすべてのコンピュ
    ータから通知されるのを待って、そのフラグをオフにす
    る組み込みコピー手段とを具備することを特徴とする分
    散ミラードディスクシステム。
  6. 【請求項6】 ネットワークで接続される3台以上のコ
    ンピュータそれぞれに備えられたディスクを用いて多重
    化ディスクを構成する分散ミラードディスクシステムに
    おいて、 前記各コンピュータは、 前記ディスクの書き込み単位であるブロックそれぞれに
    対応して他のコンピュータごとに設けられる複数のフラ
    グを格納するフラグ格納手段と、 前記ディスクにデータを書き込む前に、そのブロックに
    対応するすべてのフラグをオンにするとともに、そのフ
    ラグをオンにする旨を稼働中の他のコンピュータすべて
    に通知する書き込み前処理手段と、 前記ディスクに対するデータの書き込み時に、前記書き
    込み前処理手段により通知されたフラグのオンを完了し
    た旨が稼働中の他のコンピュータすべてから通知される
    のを待って、その書き込みを実行するとともに、そのデ
    ータを稼働中の他のコンピュータすべてに送信する書き
    込み処理手段と、 前記ディスクにデータを書き込んだ後に、そのブロック
    に対応するフラグであって前記書き込み処理手段により
    送信されたデータの書き込みを完了した旨を通知してき
    た他のコンピュータ用のフラグをオフにするとともに、
    そのフラグをオフにする旨と、その通知してきたコンピ
    ュータ以外のどのコンピュータが書き込み完了を通知し
    てきたのかをその通知してきたコンピュータに通知する
    書き込み後処理手段と、 オン状態にあるフラグに対応するブロックのデータをそ
    のフラグに対応するコンピュータに順次送信するととも
    に、そのデータの書き込みを完了した旨がそのコンピュ
    ータから通知されるのを待って、そのフラグをオフにす
    る組み込みコピー手段とを具備することを特徴とする分
    散ミラードディスクシステム。
JP2001191719A 2001-06-25 2001-06-25 分散ミラードディスクシステム Expired - Fee Related JP4131621B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001191719A JP4131621B2 (ja) 2001-06-25 2001-06-25 分散ミラードディスクシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001191719A JP4131621B2 (ja) 2001-06-25 2001-06-25 分散ミラードディスクシステム

Publications (2)

Publication Number Publication Date
JP2003006015A true JP2003006015A (ja) 2003-01-10
JP4131621B2 JP4131621B2 (ja) 2008-08-13

Family

ID=19030300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001191719A Expired - Fee Related JP4131621B2 (ja) 2001-06-25 2001-06-25 分散ミラードディスクシステム

Country Status (1)

Country Link
JP (1) JP4131621B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106898A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk ネットワークraidシステム、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP2006106901A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk 仮想サーバ、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP2011253400A (ja) * 2010-06-03 2011-12-15 Nec System Technologies Ltd 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム
JP2012164075A (ja) * 2011-02-04 2012-08-30 Nippon Telegr & Teleph Corp <Ntt> ストレージ同期システム及び仮想マシン及びストレージ同期方法及びプログラム
JP2019082897A (ja) * 2017-10-31 2019-05-30 富士通株式会社 情報処理装置、情報処理システム及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106898A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk ネットワークraidシステム、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP2006106901A (ja) * 2004-09-30 2006-04-20 Nippon Digital Kenkyusho:Kk 仮想サーバ、そのコンピュータ、およびコンピュータが実行するためのプログラム
JP4575740B2 (ja) * 2004-09-30 2010-11-04 株式会社日本デジタル研究所 仮想サーバ
JP4575739B2 (ja) * 2004-09-30 2010-11-04 株式会社日本デジタル研究所 ネットワークraidシステム
JP2011253400A (ja) * 2010-06-03 2011-12-15 Nec System Technologies Ltd 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム
JP2012164075A (ja) * 2011-02-04 2012-08-30 Nippon Telegr & Teleph Corp <Ntt> ストレージ同期システム及び仮想マシン及びストレージ同期方法及びプログラム
JP2019082897A (ja) * 2017-10-31 2019-05-30 富士通株式会社 情報処理装置、情報処理システム及びプログラム

Also Published As

Publication number Publication date
JP4131621B2 (ja) 2008-08-13

Similar Documents

Publication Publication Date Title
JP3968207B2 (ja) データ多重化方法およびデータ多重化システム
JP4142438B2 (ja) 1次およびバックアップシステムの間のデータのリストア
US7130868B2 (en) File system for creating switched logical I/O paths for fault recovery
JP4282030B2 (ja) データ二重化制御方法および二重化した記憶サブシステム
JP4624829B2 (ja) データバックアップシステム及び方法
US7013371B2 (en) Data transfer control system
JP2003507791A (ja) 遠隔ミラーリングシステム、装置及び方法
JP2004021989A (ja) データをバックアップする方法
JP4662743B2 (ja) データ2重化システム
JP5331892B2 (ja) ストレージシステム及びストレージシステムにおけるデータ複製方法
JPH0991099A (ja) ディスク更新ログ記録方式
CN110825763B (zh) 基于共享存储的MySQL数据库高可用系统及其高可用方法
JP2003006015A (ja) 分散ミラードディスクシステム
JP3774826B2 (ja) 情報処理装置
US20050268188A1 (en) Backup method, backup system, disk controller and backup program
WO2024174906A1 (zh) 文件型数据库升级优化的方法、系统、设备和存储介质
JPH10326220A (ja) ファイルシステムおよびファイル管理方法
JPH1115604A (ja) データ多重化方法
JP4305007B2 (ja) 系切り替えシステムおよびその処理方法並びにその処理プログラム
CN112099999A (zh) 一种存储系统的集群结构中元数据的恢复方法及系统
JP2006285336A (ja) 記憶装置及びストレージシステム並びにその制御方法
JP2004070456A (ja) データバックアップ方法、データバックアップ装置、及び情報処理装置
JP2011209834A (ja) 冗長システム
JP2002082826A (ja) データベースシステム
CN100437499C (zh) 计算机平台快取资料备援处理方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080527

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees