JP4131621B2 - 分散ミラードディスクシステム - Google Patents
分散ミラードディスクシステム Download PDFInfo
- Publication number
- JP4131621B2 JP4131621B2 JP2001191719A JP2001191719A JP4131621B2 JP 4131621 B2 JP4131621 B2 JP 4131621B2 JP 2001191719 A JP2001191719 A JP 2001191719A JP 2001191719 A JP2001191719 A JP 2001191719A JP 4131621 B2 JP4131621 B2 JP 4131621B2
- Authority
- JP
- Japan
- Prior art keywords
- flag
- computer
- data
- notification
- disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
この発明は、ネットワークで接続される2台のコンピュータそれぞれに備えられたディスクを用いて2重化ディスクを構成する分散ミラードディスクシステムに係り、特に、いずれかのコンピュータが障害から復帰した際に他のコンピュータから最新のデータをコピーする、いわゆる組み込み処理に費やされる時間を大幅に短縮することを可能とした分散ミラードディスクシステムに関する。
【0002】
【従来の技術】
データの記憶装置を2重化し、その可用性を高めた装置として、2重化ディスク装置が存在する。一般的な2重化ディスク装置は、図20に示すように、1台のコントローラ21と2台のディスク22とから構成され、一般のディスクと同じようにコンピュータに接続されてデータを保存するために使用される。この2重化ディスク装置では、コンピュータからコントローラ21に書き込み要求が送られてくると、2台のディスク22に同じデータが書き込まれる。また、1台のディスク22が故障し、データの読み書きができなくなった場合には、コントローラ21が、故障したディスク22を切り離す。そして、これ以降に送られてきた書き込み要求は、残ったディスク22だけに書き込まれる。
【0003】
すなわち、1台のディスク22が故障しても、それまでに書き込んだデータはすべて保存され、読み出すことが可能である。また、1台のディスク22が故障しても、引き続きデータの読み書きが可能である。
【0004】
さらに、故障したディスク22を交換すると、コントローラ21がそれを検知し、他のディスク22からデータをコピーして内容を一致させる。この処理により、再度、2台のディスク22を持つ構成に戻すことができる。
【0005】
この2重化ディスク装置を分散システムに応用したのが、分散ミラードディスクシステムである。このシステムは、図21に示すように、ネットワーク1で接続される2台のコンピュータ2が、それぞれディスク8を持つ構成である。
【0006】
この分散ミラードディスクシステムでは、いずれかのコンピュータ2で書き込み要求が発生すると、書き込み検知部3がそれを検知し、書き込み処理部4に書き込むべき場所と内容を含んだデータを送る。一方、書き込み処理部4は、もう1台のコンピュータ2の書き込み処理部4にネットワーク1経由でそのデータを送る。そして、2台のコンピュータ2の書き込み処理部4は、そのデータに基づいて、書き込み要求で指示された内容をそれぞれのディスク8に書き込む。これを更新コピーと呼ぶ。
【0007】
この分散ミラードディスクシステムでは、2台のコンピュータ2を集中管理する、2重化ディスク装置のコントローラ21にあたる装置を持たない。その代わりに、この分散ミラードディスクシステムは、他のコンピュータ2の状態を監視するために、クラスタマネージャ5を用いる。そして、このクラスタマネージャ5は、次のような場合に、コンピュータ2の障害として検知する。
【0008】
・ディスク8への書き込み/読み出しに失敗
・コンピュータ2が応答しない(電源が切れている、コンピュータ2が動作していない)
・ネットワーク1が切れている
クラスタマネージャ5によって検出されたコンピュータ2の障害の情報は、ノードマップ6に書き込まれる。書き込み処理部4は、ノードマップ6を参照し、相手のコンピュータ2に障害が発生しているときにはデータを送らなくなる。
【0009】
また、コンピュータ2が障害から復帰した場合には、その旨をクラスタマネージャ5が検知し、再度システムの一部として動作するための処理、いわゆる組み込み処理を実行するように組み込みコピー処理部7に通知する。そして、組み込みコピー処理部7は、障害の起きていないコンピュータ2が持つ最新のデータを障害から復帰したコンピュータ2の持つディスク8にコピーする。これを組み込みコピーと呼ぶ。この時、同じデータについて更新コピーと組み込みコピーとが同時に動作しないよう、更新コピーは組み込みコピーと排他をとって行なわれることになる。
【0010】
【発明が解決しようとする課題】
ところで、この分散ミラードディスクシステムでは、組み込みコピーをすべてのデータをコピーすることによって実施していた。したがって、このコピーを行なっている間は、ネットワークやコンピュータに過度な負荷がかかり、また、コピーすべきデータの量が多い場合には、そのコピーが長期化してしまうといった問題があった。
【0011】
この発明は、このような事情を考慮してなされたものであり、いずれかのコンピュータが障害から復帰した際に他のコンピュータから最新のデータをコピーする、いわゆる組み込み処理に費やされる時間を大幅に短縮することを可能とした分散ミラードディスクシステムを提供することを目的とする。
【0012】
【課題を解決するための手段】
前述した目的を達成するために、この発明は、ネットワークで接続される2台のコンピュータそれぞれに備えられたディスクを用いて2重化ディスクを構成する分散ミラードディスクシステムにおいて、前記各コンピュータは、前記ディスクの書き込み単位であるブロックそれぞれに対応して設けられる複数のフラグを格納する、不揮発性の記憶装置に設けられるフラグ格納手段と、前記フラグ格納手段に格納されたフラグについての前記不揮発性の記憶装置に対するセット/リセット通知を揮発性の記憶装置にて一時的に蓄積するためのキャッシュ手段と、前記ディスクにデータを書き込む前に、そのブロックに対応するフラグをセットする旨を前記キャッシュ手段に通知するとともに、相手のコンピュータが稼働中であれば、そのデータを相手のコンピュータに送信してその書き込みを要求し、前記ディスクにデータを書き込んだ後に、相手のコンピュータが稼働中であれば、前記要求したデータの書き込みを完了した旨が相手のコンピュータから通知されるのを待って、そのブロックに対応するフラグをリセットする旨を前記キャッシュ手段に通知する書き込み処理手段と、相手のコンピュータが障害から復帰したときに、前記フラグ格納手段に格納されたフラグの中のセット状態にあるフラグに対応するブロックのデータを相手のコンピュータに順次送信するとともに、そのデータの書き込みを完了した旨が相手のコンピュータから通知されるのを待って、そのフラグをリセットする組み込みコピー手段とを具備し、前記キャッシュ手段は、前記フラグ格納手段に格納されたフラグについて、あるフラグをリセットする旨の通知を前記書き込み処理手段から受けた際、当該フラグをリセットする旨の通知を一定時間待機し、前記一定時間を越えて当該フラグをセットする旨の通知を受けなかった場合に、前記不揮発性の記憶装置に対して、前記フラグ格納手段が格納する当該フラグをリセットする旨を通知する手段を有することを特徴とする。
【0013】
この分散ミラードディスクシステムにおいては、いずれかのコンピュータが障害から復帰した際には、最新のデータを保持するコンピュータのもつフラグが不一致の状態を示すブロックと、その障害から復帰したコンピュータのもつフラグが不一致の状態を示すブロックとをコピーするのみでよいため、いわゆる組み込み処理に費やされる時間を大幅に短縮することを可能とする。
【0014】
【発明の実施の形態】
以下、図面を参照してこの発明の一実施形態を説明する。
【0015】
まず、この発明の実施形態に係る分散ミラードディスクシステムが実行する組み込みコピーの基本原理について説明する。
【0016】
組み込みコピーを行なう理由は、障害から復帰したコンピュータのディスクの内容と、障害の起きていないコンピュータのディスクの内容とを同じにするためである。
【0017】
コンピュータの障害のうち、ディスクに障害が発生し、新しいディスクと交換した場合は、すべてのデータをコピーする必要がある。一方、コンピュータの処理は停止しても、ディスクの内容がそのまま残っているような場合には、組み込み時に、他のコンピュータと異なっているデータだけをコピーすれば、他のコンピュータの持つデータと一致させることが可能である。そこで、この実施形態の分散ミラードディスクシステムでは、この点を考慮して、組み込み処理に費やされる時間を大幅に短縮するための仕組みを構築する。
【0018】
しかしながら、単純に、コンピュータが停止している間に変更されたデータの位置情報を別のコンピュータで記憶しておき、再開した時にそのデータをコピーする方法では、すべてのデータを一致させることができない場合がある。具体的には、あるコンピュータのデータが更新され、そのデータを他のコンピュータにコピーする前に、データが更新されたコンピュータが停止してしまった場合である。この場合、データが更新されたコンピュータの持つデータと他のコンピュータの持つデータは異なっているが、データが更新された時点ではすべてのコンピュータが動作していたので、データが異なっているという情報は記憶されず、組み込みコピーでデータを一致させることができなくなってしまう。
【0019】
ここで、図1を参照して、この実施形態の分散ミラードディスクシステムにおいて組み込みコピーを行うデータの条件を説明する。図1中、横軸は時間の流れを表し、縦軸はコンピュータの状態を表す。
【0020】
いま、コンピュータ1,2があり、1が停止、再開したとする。このとき組み込みコピーするデータの条件は、
(条件1)コンピュータ1のデータで、変更されたがコンピュータ2にはコピーされなかったデータ
(条件2)コンピュータ2のデータで、変更されたがコンピュータ1にはコピーされなかったデータ
の2種類である。
【0021】
この2種類のデータを記憶するために、この実施形態の分散ミラードディスクシステムでは、ディスク内をデータブロックに分割し、各データブロックに対応するフラグを記憶する。(条件1)のデータを記憶するには、データを書き込む前にフラグをセットする必要がある。なぜなら、データを書き込んでいる間にコンピュータ1が停止した場合、このデータはコンピュータ2のデータとは異なっており、組み込みコピーをしなければならないためである。また、書き込みが終了し、コンピュータ2へのコピーが終了したら、データは一致しているため、フラグをリセットする。
【0022】
一方、(条件2)のデータを記憶するには、コピーが完了しなかったデータブロックに対応するフラグをセットすればよい。また、(条件1)と同様、書き込む前にフラグをセットし、書き込みが完了したらリセットするという手順でも、結果は同じとなる。
【0023】
このように、データを書き込む前にフラグをセットし、書き込みが完了したらリセットする、という処理を行なうことにより、(条件1)および(条件2)の両方のデータを記憶することができる。
【0024】
次に、フラグをどこで記憶するかを考える。2重化ディスク装置では、コントローラという、どちらのディスクが停止しても常に動作しているという前提の装置があるために、フラグをコントローラで記憶しておくことにすれば問題はないが、分散システムでは、コンピュータが停止する可能性があるため、フラグを記憶する場所が重要な意味を持つ。
【0025】
コンピュータの記憶装置には、コンピュータが停止しても情報を保持しているものと、コンピュータが停止すると情報が消えてしまうものとの2種類が存在する。前者を不揮発性の記憶装置、後者を揮発性の記憶装置と呼ぶことにする。また、不揮発性の記憶装置にあるフラグを不揮発性のフラグ、揮発性の記憶装置にあるフラグを揮発性のフラグと呼ぶことにする。つまり、コンピュータが停止したとき、揮発性のフラグの内容は消えてしまうことになる。
【0026】
代表的な不揮発性の記憶装置である磁気ディスク装置は、同じく代表的な揮発性の記憶装置であるメモリ(RAM)と比較して、データの読み書き速度が遅いため、以下では、前述した組み込みコピーの基本原理と合わせて、不揮発性の記憶装置を使わない方法や、不揮発性の記憶装置と揮発性の記憶装置を組み合わせることによって内容を変更する時間を短くする方法など、種々の方法について各実施形態ごとに説明する。
【0027】
(第1実施形態)
図2は、この発明の第1実施形態に係わる分散ミラードディスクシステムの構成を示す図である。
【0028】
図2に示すように、この分散ミラードディスクシステムは、2台のコンピュータ2が、ネットワーク1によって接続されている。また、各コンピュータは、揮発性のフラグ12を持ち、ディスク8に記憶されているデータ9は、データブロック14という複数の領域に分割されている。そして、フラグ12とこのデータブロック14は1対1に対応している。
【0029】
各コンピュータでは、クラスタマネージャ5が動作する。クラスタマネージャ5は、互いに通信することによって相手のコンピュータ2の停止、復旧を検知することができる。また、クラスタマネージャ5は、ノードマップ6を持ち、このノードマップ6にコンピュータ2の障害の情報を記録する。
【0030】
また、各コンピュータは、組み込みコピー制御部7を持つ。組み込みコピー制御部7は、クラスタマネージャ5から組み込みコピー開始通知を受け取ると、ノードマップ6およびフラグ12を参照して、組み込みコピーを行なうデータブロック14を決定し、2台の組み込みコピー制御部7間でそのデータのコピーを実行させる。そして、フラグ12を1つずつ参照する際に、いくつ目のフラグ12までを処理したかを記憶するため、フラグカウンタ13を用いる。
【0031】
さらに、各コンピュータ2は、不揮発性の記憶領域中に、フラグ12を退避するためのフラグ待避領域16を持つ。
【0032】
(更新コピー)
まず、この分散ミラードディスクシステムにおける更新コピー時の動作を説明する。なお、ここでは、書き込み要求が発生した側を更新コピー元、もう1台を更新コピー先と呼ぶことにする。
【0033】
この更新コピー元のコンピュータの処理を図3に、更新コピー先のコンピュータの処理を図4に示す。
【0034】
書き込み要求が送られてくると、書き込み検知部3がそれを検知し、書き込み前処理部10に書き込むべき場所と内容とを含んだデータを送る。一方、書き込み前処理部10は、書き込むべき場所の情報から、変更するデータブロック14に対応するフラグ12を決定する。そして、ノードマップ6を参照して、相手のコンピュータが動作しているかどうかを確認する(図3のステップA1)。
【0035】
相手のコンピュータ2が停止している場合(図3のステップA1のNO)、書き込み前処理部10は、フラグ12をセットし(図3のステップA11)、書き込み処理部4に書き込み検知部3から受け取ったデータを送る。書き込み処理部4は、ディスク8に書き込みを行ない(図3のステップA12)、書き込み後処理部11に書き込み終了通知を送る。この場合、書き込み後処理部11は何もせず、更新コピーは終了する。
【0036】
相手のコンピュータ2が動作している場合(図3のステップA1のYES)、書き込み前処理部10は、フラグセット通知を相手のコンピュータ2に送り(図3のステップA2)、自分のフラグ12をセットする(図3のステップA3)。ここで、書き込み前処理部10は、フラグセット完了通知を待機し(図3のステップA4)、受け取ったら、書き込み検知部3から受け取ったデータを書き込み処理部4に送信する。
【0037】
書き込み処理部4は、相手のコンピュータ2にそのデータを送り(図3のステップA5)、自分のディスク8に書き込みを行なう(図3のステップA6)。書き込み処理部4は、書き込み完了通知を待機し(図3のステップA7)、受け取ったら、書き込み後処理部11に書き込み終了を通知する。
【0038】
そして、書き込み後処理部11は、相手のコンピュータ2にフラグリセット通知を送り(図3のステップA8)、自分のフラグ12をリセットする(図3のステップA9)。そして、フラグリセット完了通知を待機し(図3のステップA10)、受け取ったら、更新コピーの処理を終了する。
【0039】
一方、フラグセット通知を受け取った場合、書き込み前処理部10は、フラグ12をセットし(図4のステップB1)、フラグセット完了通知を返送して(図4のステップB2)、書き込み要求を待機する(図4のステップB3)。
【0040】
また、データを受け取ると、書き込み処理部4は、ディスク8に書き込みを行ない(図4のステップB4)、書き込み完了通知を返送して(図4のステップB5)、フラグリセット通知を待機する(図4のステップB6)。
【0041】
そして、フラグリセット通知を受け取ると、書き込み後処理部11は、フラグ12をリセットして(図4のステップB7)、フラグリセット完了通知を返送する(図4のステップB8)。
【0042】
(組み込みコピー)
次に、この分散ミラードディスクシステムにおける組み込みコピー時の動作を説明する。なお、ここでは、障害から復帰した側を組み込みコピー先、もう1台を組み込みコピー元と呼ぶことにする。組み込みコピー元が主導のコピー処理を図5に、組み込みコピー先が主導のコピー処理を図6に示す。
【0043】
組み込みコピー元において、クラスタマネージャ5から組み込みコピー開始の通知を受け取ると、組み込みコピー制御部7は、まず、フラグカウンタ13を0にする(ステップC1)。そして、組み込みコピー制御部7は、フラグカウンタ13がフラグ12の数を越えるまで(図5のステップC2のYES)、このフラグカウンタ13を1つずつ増やしながら(図5のステップC7)、フラグ12の状態を1つずつ読み込み、以下の処理を繰り返す。
【0044】
フラグ12の状態を読み込んだとき、その状態がリセットであれば(図5のステップC3のNO)、組み込みコピー制御部7は何もしない。一方、フラグ12の状態がセットであった場合(図5のステップC3のYES)、組み込みコピー制御部7は、そのフラグ12に対応するデータブロック14の位置情報と内容とを含んだデータを相手のコンピュータに送信し(図5のステップC4)、完了通知を待機する(図5のステップC5)。そして、完了通知を受け取ったら、組み込みコピー制御部7は、フラグ12をリセットする(図5のステップC6)。
【0045】
一方、組み込みコピー先において、データブロック14の位置情報と内容とを含んだデータを受け取った場合は(図5のステップD1)、組み込みコピー制御部7は、ディスク8に書き込みを行ない(図5のステップD2)、完了通知を返して(図5のステップD3)、フラグ12をリセットする(図5のステップD4)。
【0046】
また、組み込みコピー先においても、クラスタマネージャ5から組み込みコピー開始の通知を受け取ると、同様に、組み込みコピー制御部7は、フラグカウンタ13を0にした後(図6のステップE1)、フラグカウンタ13がフラグ12の数を越えるまで(図6のステップE2のYES)、このフラグカウンタ13を1つずつ増やしながら(図6のステップE9)、フラグ12の状態を1つずつ読み込み、以下の処理を繰り返す。
【0047】
フラグ12の状態を読み込んだとき、その状態がリセットであれば(図6のステップE3のNO)、組み込みコピー制御部7は何もしない。一方、フラグ12の状態がセットであった場合(図6のステップE3のYES)、組み込みコピー制御部7は、相手のコンピュータ2に対し、コピーすべきデータブロック14の情報を含んだ組み込みコピー要求を送る(図6のステップE4)。
【0048】
そして、このデータを受信すると(図6のステップE5)、組み込みコピー制御部7は、そのデータをディスク8に書き込み(図6のステップE6)、完了通知を返送した後(図6のステップE7)、そのフラグ12をリセットする(図6のステップE8)。
【0049】
一方、組み込みコピー元において、組み込みコピー要求を受け取った場合、組み込みコピー制御部7は、相手のコンピュータ2に対し、その組み込みコピー要求で指定されたデータブロック14の内容を含んだデータを送信する(図6のステップF1)。そして、組み込みコピー制御部7は、完了通知を待機し(図6のステップF2)、受け取ったら、そのデータブロック14に対応するフラグ12をリセットする(図6のステップF3)。
【0050】
なお、この組み込みコピーと前述した更新コピーとは、従来技術と同様、同時に同じデータブロック14に対して行わないようにする。
【0051】
(全体停止)
この分散ミラードディスクシステムでは、揮発性のフラグ12を使っているため、2台のコンピュータ2が両方とも停止してしまった場合は、フラグ12の内容がすべて消えてしまう。
【0052】
2台のコンピュータ2が両方とも停止するのは、2台のコンピュータ2が両方とも障害を起こして停止する場合の他に、コンピュータ2は正常に動作しているが、停電やメンテナンス等でシステム全体を停止する場合がある。そして、この分散ミラードディスクシステムは、後者について、次のようにして、組み込みコピーにかかる時間を短縮する。
【0053】
コンピュータ2を停止する際、フラグ待避制御部15は、フラグ12の状態をすべてフラグ待避領域16にコピーするとともに、正常停止したという情報をフラグ待避領域16に記憶する。また、コンピュータ2が起動されると、フラグ待避制御部15は、フラグ待避領域16を参照し、前回正常に停止したかどうかを確認する。そして、正常停止したという情報がフラグ待避領域16にあれば、フラグ待避制御部15は、フラグ待避領域の状態をフラグにコピーする。この仕組みによって、システムを停止するときにもフラグ12を利用することができ、組み込みコピーにかかる時間を短縮することができる。
【0054】
ただし、この方法は、コンピュータ2の障害のときには利用できない。コンピュータ2に障害が発生している状態では、フラグ待避制御部15が正常に動作する保証ができないためである。したがって、コンピュータ2が2台とも障害を起こして停止した場合には、すべてのデータブロック14を組み込みコピーする必要がある。
【0055】
(処理の中断)
ところで、前述した更新コピーや組み込みコピーの途中で、コンピュータ2が停止することもあり得る。そのような場合でも、この分散ミラードディスクシステムでは、フラグ12が正しくセットされ、停止したコンピュータ2が再開したときには組み込みコピーが行なわれることを説明する。
【0056】
まず、更新コピーの途中でコンピュータ2が停止する場合について説明する。更新コピーのフラグ12の変化とデータの変化の順序とを考えると、2台のコンピュータ2のフラグ12が両方ともがセット状態になるまで書き込みは行なわれない。また、2台のコンピュータ2の書き込みが両方とも完了するまでは、どちらのフラグ12もリセットされない。よって、どちらかのコンピュータ2でデータを書き込んでいる間に、どちらかのコンピュータ2が停止した場合は、必ずもう一台の停止していないコンピュータ2のフラグ12がセット状態になり、停止したコンピュータ2が復帰した際には組み込みコピーが行なわれる。
【0057】
一方、組み込みコピーは、組み込みコピー元のフラグ12がセットでないと開始されない。また、フラグ12はリセットされないので、組み込みコピー先のコンピュータ2が停止しても問題は発生しない。しかしながら、組み込みコピー元のコンピュータ2が停止した場合には、2台のコンピュータ2が両方とも障害で停止した場合と同様に、フラグ情報が消えてしまう。組み込みコピーがすべて終わらないうちに組み込みコピー元のコンピュータ2が停止した場合には、2台とも障害で停止したときと同様に、再開時にはすべてのデータを組み込みコピーする必要がある。
【0058】
以上のように、この第1実施形態の分散ミラードディスクシステムでは、揮発性の記憶領域にフラグを置くことにより、低速な不揮発性の記憶装置を用いることなく組み込みコピーにかかる時間を短縮できる。
【0059】
また、正常に停止する場合には、フラグを不揮発性の記憶領域に待避することにより、2台のコンピュータが両方停止する場合でも、組み込みコピーにかかる時間を短縮できる。
【0060】
(第2実施形態)
次に、この発明の第2実施形態を説明する。図7は、この第2実施形態に係わる分散ミラードディスクシステムの構成を示す図である。
【0061】
前述した第1実施形態とこの第2実施形態との違いは、図7に示すように、フラグ12が不揮発性の記憶領域にあり、揮発性の記憶領域に、フラグ12のセット/リセットを高速化するためのフラグキャッシュ17がある点にある。
【0062】
(更新コピー)
まず、この第2実施形態の分散ミラードディスクシステムにおける更新コピー時の動作を説明する。更新コピー元のコンピュータの処理を図8に、更新コピー先のコンピュータの処理を図9に示す。
【0063】
書き込み処理部4は、書き込み要求を解析し、変更するデータブロック14に対応するフラグ12を決定し、フラグキャッシュ17にセット要求を送る。キャッシュへのセット要求が完了したら、ノードマップ6を参照し、相手のコンピュータ2が動作しているか停止しているかを確認する(図8のステップG1)。
【0064】
相手のコンピュータが停止している場合(図8のステップG1のNO)、書き込み処理部4は、フラグキャッシュ17にフラグセット通知を送信し(図8のステップG9)、フラグキャッシュ17からの完了通知を待機する(図8のステップG10)。そして、完了通知を受け取ると、書き込み処理部4は、ディスク8に書き込みを行ない(図8のステップG10)、書き込み後処理部11に書き込み終了通知を送る。この場合、書き込み後処理部11は何もせず、更新コピーは終了する。
【0065】
相手のコンピュータが動作している場合(図8のステップG1のYES)、書き込み処理部4は、フラグキャッシュ17にフラグセット通知を送信し(図8のステップG2)、フラグキャッシュ17からの完了通知を待機する(図8のステップG3)。そして、完了通知を受け取ると、書き込み処理部4は、相手のコンピュータ2に書き込み通知を送り(図8のステップG4)、自分のディスク8に書き込みを行なう(図8のステップG5)。書き込み処理部4は、書き込み完了通知を待機し(図8のステップG6)、受け取ったら、フラグキャッシュ17にリセット要求を送り(図8のステップG7)、フラグキャッシュ17からの完了通知を待機する(図8のステップG8)。そして、完了通知を受け取ると、書き込み処理部4は、更新コピーの処理を終了する。
【0066】
一方、書き込み要求を受け取った場合、書き込み処理部4は、ディスク8に書き込みを行ない(図9のステップH1)、書き込み完了通知を返す(図9のステップH2)。
【0067】
ところで、不揮発性の記憶装置は、揮発性の記憶装置に比べ、データの変更に時間がかかる場合がある。そこで、この第2実施形態の分散ミラードディスクシステムでは、フラグキャッシュ17を用いることにより、フラグ12のセット/リセット要求を高速に処理するように工夫している。
【0068】
図10は、フラグキャッシュ17の構成図である。図10に示すように、フラグキャッシュ17は、フラグ制御部171がセット/リセット通知を受け取り、フラグ12に対してセット/リセット通知を送る。図11を参照して、このフラグキャッシュ17の動作を説明する。
【0069】
リセット通知が送られてきた場合は(図11のステップJ1のYES)、完了を返した後(図11のステップJ2)、フラグ12を参照し(図11のステップJ3)、リセット状態ならは(図11のステップJ3のYES)、何もせずに終了する。一方、セット状態ならば(図11のステップJ3のNO)、セット通知が来るのを一定の時間待つために、セット通知待機状態に設定する(図11のステップJ4)。
【0070】
一方、セット通知がきた場合には(図11のステップJ1のNO,ステップJ5のYES)、完了を返した後(図11のステップJ6)、フラグ12を参照し(図11のステップJ7)、セット状態であれば(図11のステップJ7のYES)、何もせずに終了する。一方、リセット状態ならば(図11のステップJ7のNO)、フラグ12をセットし(図11のステップJ8)、セット通知待機状態であれば(図11のステップJ9)、そのセット通知待機状態を解除する(図11のステップJ10)。
【0071】
一方、セット通知待機状態のまま一定時間経過したとき(図11のステップJ1のNO,ステップJ5のNO,ステップJ11のYES,ステップJ12のYES)、フラグ12をリセットし(図11のステップJ13)、そのセット通知待機状態を解除する(図11のステップJ14)。
【0072】
つまり、このフラグキャッシュ17によれば、フラグ12のセット/リセットを頻繁に繰り返す場合、フラグ12はセット状態のまま変更されないため、不揮発性の記憶領域であるフラグ12が変更されず、フラグキャッシュ17に対するセット要求/リセット要求はすぐに完了する。より具体的には、このフラグキャッシュ17は、セット通知がきたときは必ずフラグ12をセットするが、リセット通知が来ても一定時間はフラグ12をリセットしないことにより、フラグ12の変更回数を減らす効果がある。リセット通知が来たデータブロック14は、組み込みコピーを行なう必要がなくなったことを意味しているので、このフラグキャッシュ17を用いることによって、組み込みコピーを行なうデータブロック14は増える。その代わり、通常の更新コピー時に行なわなければならないフラグキャッシュ17のセット/リセットの性能を上げることができる。
【0073】
(組み込みコピー)
組み込みコピーの方法は、前述した第1実施形態と基本的には同じだが、フラグ12の参照およびリセット方法のみ異なる。フラグ12の参照は、直接フラグ12から行ない、コピーが終了してフラグ12をリセットするときは、フラグキャッシュ17に対してリセット要求を送る。
【0074】
(全体停止)
この第2実施形態では、不揮発のフラグ12を使っているため、2台のコンピュータ2が両方とも停止してしまった場合でも、フラグ12の内容が保持されている。したがって、第1実施形態とは異なり、2台のコンピュータ2が障害で停止した場合でも、フラグ12の内容は消えないため、2台とも再開したときの組み込みコピーにかかる時間を短縮することができる。
【0075】
以上のように、この第2実施形態の分散ミラードディスクシステムでは、不揮発性のフラグを使うことにより、2台のコンピュータが同時に停止した場合においても、組み込みコピーにかかる時間を短縮することができる。
【0076】
また、不揮発性の記憶装置は揮発性の記憶装置に比べて、内容の変更に時間がかかることが多いが、揮発性の記憶装置を使ったフラグキャッシュを用いることにより、フラグの変更にかかる時間を短縮することができる。
【0077】
(第3実施形態)
次に、この発明の第3実施形態を説明する。図12は、この第3実施形態に係わる分散ミラードディスクシステムの構成を示す図である。
【0078】
前述した第1実施形態では、2台のコンピュータ2でミラードディスクを構成したが、この第2実施形態では、これをN台(3台以上)に拡張する。
【0079】
書き込み前処理部10、書き込み処理部4、書き込み後処理部11、クラスタマネージャ5および組み込みコピー制御部7は、第1実施形態では1対1で通信を行なっていたが、この第2実施形態では、N台で相互に通信を行なう。
【0080】
また、第1実施形態では、組み込みコピーが行なわれるときは、必ず2台のコンピュータ2が動作していたが、この第2実施形態では、組み込みコピーのときに必ずしもすべてのコンピュータが動作しているとは限らない。そのため、組み込みコピー制御部7がノードマップ6を参照する必要がある。
【0081】
フラグ12の構成は、第1実施形態と同様、データブロック14と1対1である。そして、すべてのコンピュータ2の持つデータが同じであればリセット、1台でもデータの違うコンピュータ2があればセットとなるように制御を行なう。具体的な方法を以下に述べる。
【0082】
(更新コピー)
いずれかのコンピュータ2の持つディスク8に対して書き込み要求が行なわれた場合、残りのコンピュータ2にも書き込みが行なわれる。ここでは、書き込み要求を受け取ったコンピュータ2を更新コピー元のコンピュータ、残りのN−1台のコンピュータ2を更新コピー先のコンピュータと呼ぶことにする。
【0083】
更新コピー元のコンピュータの処理を図13に、更新コピー先のコンピュータの処理を図14に示す。
【0084】
書き込み前処理部10は、書き込み要求を解析し、変更するデータブロック14に対応するフラグ12を決定する。また、書き込み前処理部10は、ノードマップ6を参照し(図13のステップK1)、更新コピー先のコンピュータが動作しているか停止しているかを確認する。そして、書き込み前処理部10は、動作している更新コピー先のコンピュータすべてにフラグセット通知を送り(図13のステップK2)、自分のフラグ12をセットする(図13のステップK3)。ここで、書き込み前処理部10は、フラグセット完了通知を待機し(図13のステップK4)、そして、動作しているすべてのコンピュータ2からフラグセット完了通知を受け取ったら、書き込み処理部4に書き込み通知を送る。
【0085】
また、書き込み処理部4は、動作しているすべての更新コピー先へ書き込み通知を送り(図13のステップK5)、自分のディスク8に書き込みを行なう(図13のステップK6)。書き込み処理部4は、書き込み完了通知を待機し(図13のステップK7)、動作しているすべてのコンピュータから書き込み完了通知を受け取ったら、書き込み後処理部11に書き込み終了を通知する。
【0086】
書き込み後処理部11は、システムのすべてのコンピュータ2が動作しているかどうかを調べ(図13のステップK8)、すべてのコンピュータ2が動作している場合には(図13のステップK8のYES)、すべての更新コピー先へフラグリセット通知を送り(図13のステップK9)、自分のフラグ12をリセットする(図13のステップK10)。書き込み後処理部11は、フラグリセット完了通知を待機し(図13のステップK11)、受け取ったら、更新コピーの処理を終了する。
【0087】
また、動作していないコンピュータがあった場合には(図13のステップK8のNO)、書き込み後処理部11は、動作しているすべての更新コピー先へ終了通知を送り(図13のステップK13)、終了確認通知を待機して(図13のステップK14)、受け取ったら、この更新コピーの処理を終了する。つまり、この場合は、フラグ12のリセットは行わない。
【0088】
一方、フラグセット通知を受け取った場合、書き込み前処理部10は、フラグ12をセットし(図14のステップL1)、フラグセット完了通知を返して(図14のステップL2)、書き込み要求を待機する(図14のステップL3)。
【0089】
また、書き込み要求を受け取ると、書き込み処理部4は、ディスク8に書き込みを行ない(図14のステップL4)、書き込み完了通知を返す(図14のステップL5)。そして、書き込み後処理部11は、フラッグリセット通知または終了通知を待機し(図14のステップL6)、フラグリセット完了通知を受け取ったら(図14のステップL7のYES)、フラグ12をリセットし(図14のステップL8)、フラグリセット完了通知を返す(図14のステップL9)。
【0090】
また、終了通知を受け取ったら(図14のステップL7のNO)、終了確認通知を返す(図14のステップL10)。
【0091】
(組み込みコピー)
ここでは、組み込まれる側(停止し再開した側)を組み込みコピー先、残りのN−1台を組み込みコピー元と呼ぶことにする。組み込みコピー元が主導のコピー処理を図15および図16に、組み込みコピー先が主導のコピー処理を図17および図18に示す。
【0092】
組み込みコピー元において、クラスタマネージャ5から組み込みコピー開始の通知を受け取ると、組み込みコピー制御部7は、まず、フラグカウンタ13を0にする(図15のステップM1)。そして、組み込みコピー制御部7は、フラグカウンタ13がフラグ12の数を越えるまで(図15のステップM2)、このフラグカウンタ13を1つずつ増やしながら(図15のステップM12)、フラグ12の状態を1つずつ読み込み、以下の処理を繰り返す。
【0093】
フラグ12の状態を読み込んだとき、その状態がリセットであれば(図15のステップM3のNO)、組み込みコピー制御部7は何もしない。一方、フラグ12の状態がセットであった場合(図15のステップM3のYES)、組み込みコピー制御部7は、ノードマップ6を参照し(図15のステップM4)、自分を除く動作しているすべての組み込みコピー元と組み込みコピー先のコンピュータとにデータを送信する(図15のステップM5)。
【0094】
組み込みコピー制御部7は、完了通知を待機し、すべてのコンピュータから完了通知を受け取ったら(図15のステップM6のYES)、すべてのコンピュータにフラグリセット通知を送信するとともに(図15のステップM7)、自分のフラグ12をリセットし(図15のステップM8)、フラグリセット完了通知を待機する(図15のステップM9)。一方、いずれかのコンピュータから完了通知がなければ(図15のステップM6のNO)、組み込みコピー制御部7は、動作しているすべてのコンピュータに終了通知を送信して(図15のステップM10)、終了確認通知を待機する(図15のステップM11)。
【0095】
一方、組み込みコピー先において、データを受信すると(図16のステップN1)、組み込みコピー制御部7は、ディスク8に書き込みを行い(図16のステップN2)、書き込み完了通知を返送して(図16のステップN3)、フラグリセット通知または終了通知を待機する(図16のステップN4)。
【0096】
フラグリセット通知を受信した場合(図16のステップN5のYES)、組み込みコピー制御部7は、フラグ12をリセットし(図16のステップN6)、フラグリセット完了通知を送信する(図16のステップN7)。一方、終了確認通知であれば(図16のステップN5のNO)、組み込みコピー制御部7は、終了確認通知を送信する(図16のステップN8)。
【0097】
また、組み込みコピー先においても、クラスタマネージャ5から組み込みコピー開始の通知を受け取ると、同様に、組み込みコピー制御部7は、フラグカウンタ13を0にした後(図17のステップP1)、フラグカウンタ13がフラグ12の数を越えるまで(図17のステップP2のYES)、このフラグカウンタ13を1つずつ増やしながら(図17のステップP6)、フラグ12の状態を1つずつ読み込み、以下の処理を繰り返す。
【0098】
フラグ12の状態を読み込んだとき、その状態がリセットであれば(図17のステップP3のNO)、組み込みコピー制御部7は何もしない。一方、フラグ12の状態がセットであった場合(図17のステップP3のYES)、組み込みコピー制御部7は、ノードマップ6を参照し(図17のステップP4)動作している任意のコンピュータにコピー要求を送信する(図17のステップP6)。
【0099】
一方、組み込みコピー元において、組み込みコピー要求を受け取ると(図18のステップQ1)、組み込みコピー制御部7は、ノードマップ6を参照し(図18のステップQ2)、動作しているすべての組み込みコピー元と、組み込みコピー先にデータを送信する(図18のステップQ3)。そして、組み込みコピー制御部7は、完了通知を待機し、すべてのコンピュータから書き込み完了通知が返ってきたら(図18のステップQ4のYES)、今度は、すべてのコンピュータにフラグリセット通知を送信する(図18のステップQ5)。そして、自分のフラグ12をリセットし(図18のステップQ6)、フラグリセット完了通知を待機する(図18のステップQ7)。また、いずれかのコンピュータから書き込み完了通知が返ってこなければ(図18のステップQ4のNO)、動作しているすべてのコンピュータに終了通知を送信して(図18のステップQ8)、終了確認通知を待機する(図18のステップQ9)。
【0100】
以上のように、この第3実施形態の分散ミラードディスクシステムでは、3台以上のシステムにおいても、第1実施形態で示した2台のシステムと同様に、組み込みコピーにかかる時間を短縮することを可能とする。
【0101】
(第4実施形態)
次に、この発明の第4実施形態を説明する。この第4実施形態の分散ミラードディスクシステムでは、第3実施形態のフラグ12を拡張したものであり、図19に示したように、N台構成のシステムにおいて、1つのデータブロック14にN−1個のフラグ12を対応させる。そして、このフラグ12を、自分の持つデータと異なるデータを持つコンピュータについてはセット、同じデータを持つコンピュータについてはリセットとなるように制御する。
【0102】
(更新コピー)
第3実施形態との違いは、書き込み完了通知を受け取った後の動作にある。より具体的には、フラグリセット通知または終了通知を送るのではなく、どのコンピュータ2が書き込み完了を返してきたかという情報を、動作しているすべてのマシンに送り、書き込み完了を返してきたコンピュータ2のフラグ12をリセットする。その他のマシンも、受け取った情報をもとに、書き込み完了を返してきたコンピュータ2のフラグ12をリセットする。
【0103】
(組み込みコピー)
第3実施形態との違いは、すべての組み込み元マシンと組み込みコピーをする必要はなく、動作しているコンピュータ2で、フラグ12がセットされているコンピュータ2とだけ組み込みコピーを行なえばよいという点にある。コピーが完了したら、対応するコンピュータ2のフラグ12だけをリセットする。
【0104】
この第4実施形態では、フラグ12を拡張し、自分の持つデータが他のどのコンピュータ2のデータと異なっているかを保持するようにしたため、2台以上のコンピュータ2が停止した場合に、不必要な組み込みコピーを行なわなくて済むようになる。
【0105】
(第5実施形態)
次に、この発明の第5実施形態を説明する。この第5実施形態の分散ミラードディスクシステムでは、第3実施形態のフラグ12を不揮発性にする。この第5実施形態と第3実施形態との違いは、フラグ12が揮発性であるか不揮発性であるかという点だけであるので、第1実施形態と第2実施形態との違いと同じである。
【0106】
(更新コピー)
第3実施形態との違いは、書き込み処理の前に、フラグセット通知およびフラグセット完了通知のやり取りを行なわず、自分の持つフラグ12をセットするだけである点にある。
【0107】
フラグ12のリセットは、第3実施形態と同様に、システムのすべてのコンピュータ2から書き込み完了が来たかどうかを確認し、すべてのコンピュータ2から書き込み完了が来た場合のみリセット動作を行なう。
【0108】
(組み込みコピー)
組み込みコピーの方法は、第3実施形態と同じだが、フラグ12の参照およびリセット方法のみ異なる。フラグ12の参照は、直接フラグ12から行ない、コピーが終了してフラグ12をリセットするときは、フラグキャッシュ17に対してリセット要求を送る。
【0109】
この第5実施形態の分散ミラードディスクシステムでは、第3実施形態の効果に加えて、すべてのコンピュータが同時に停止した場合においても、組み込みコピーにかかる時間を短縮することができる。
【0110】
また、不揮発性の記憶装置は、揮発性の記憶装置に比べて内容の変更に時間がかかることが多いが、揮発性の記憶装置を使ったフラグキャッシュ17を用いることにより、フラグ12の変更にかかる時間を短縮することができる。
【0111】
(第6実施形態)
次に、この発明の第6実施形態を説明する。この第6実施形態の分散ミラードディスクシステムでは、第4実施形態のフラグ12を不揮発性にする。この第6実施形態と第4実施形態との違いは、フラグ12が揮発性であるか不揮発性であるかという点だけであるので、第1実施形態と第2実施形態との違いと同じである。
【0112】
(更新コピー)
第4実施形態との違いは、書き込み処理の前に、フラグセット通知およびフラグセット完了通知のやり取りを行なわず、自分の持つフラグ12をセットするだけである点にある。
【0113】
フラグ12のリセットは、第4実施形態と同様に、すべての組み込み元マシンと組み込みコピーをする必要はなく、動作しているコンピュータ2で、フラグ12がセットされているコンピュータ2とだけ組み込みコピーを行なう。データの書き込みが終了したら、対応するコンピュータ2のフラグ12だけをリセットする。
【0114】
(組み込みコピー)
組み込みコピーの方法は、第3実施形態と同じだが、フラグ12の参照およびリセット方法のみ異なる。フラグ12の参照は、直接フラグ12から行ない、コピーが終了してフラグをリセットするときは、フラグキャッシュ17に対してリセット要求を送る。
【0115】
この第6実施形態の分散ミラードディスクシステムでは、第4実施形態の効果に加えて、すべてのコンピュータが同時に停止した場合においても、組み込みコピーにかかる時間を短縮することができる。
【0116】
また、不揮発性の記憶装置は、揮発性の記憶装置に比べて内容の変更に時間がかかることが多いが、揮発性の記憶装置を使ったフラグキャッシュ17を用いることにより、フラグ12の変更にかかる時間を短縮することができる。
【0117】
なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0118】
【発明の効果】
以上、詳述したように、この発明によれば、多重化を構成するディスクをもつコンピュータそれぞれが、ディスクの書き込み単位であるブロックそれぞれに対応して設けられる複数のフラグを保持し、データの書き込み処理の前後に、他のコンピュータと同期して、対応するフラグのセットおよびリセットを行うことにより、あるコンピュータのディスクには書き込まれたが、あるコンピュータのディスクには書き込まれていないといった不一致の状態にあるブロックをこのフラグにより管理するようにしたことから、いずれかのコンピュータが障害から復帰した際には、最新のデータを保持するコンピュータのもつフラグが不一致の状態を示すブロックと、その障害から復帰したコンピュータのもつフラグが不一致の状態を示すブロックとをコピーするのみでよいため、いわゆる組み込み処理に費やされる時間を大幅に短縮することを可能とする。
【図面の簡単な説明】
【図1】この発明の実施形態の分散ミラードディスクシステムにおいて組み込みコピーを行うデータの条件を説明するための図。
【図2】同第1実施形態の分散ミラードディスクシステムの構成を示す図。
【図3】同第1実施形態の分散ミラードディスクシステムの更新コピー元のコンピュータの処理を示す図。
【図4】同第1実施形態の分散ミラードディスクシステムの更新コピー先のコンピュータの処理を示す図。
【図5】同第1実施形態の分散ミラードディスクシステムの組み込みコピー元が主導のコピー処理を示す図。
【図6】同第1実施形態の分散ミラードディスクシステムの組み込みコピー先が主導のコピー処理を示す図。
【図7】同第2実施形態の分散ミラードディスクシステムの構成を示す図。
【図8】同第2実施形態の分散ミラードディスクシステムの更新コピー元のコンピュータの処理を示す図。
【図9】同第2実施形態の分散ミラードディスクシステムの更新コピー先のコンピュータの処理を示す図。
【図10】同第2実施形態の分散ミラードディスクシステムに適用されるフラグキャッシュの構成図。
【図11】同第2実施形態の分散ミラードディスクシステムに適用されるフラグキャッシュの動作を説明するための図。
【図12】同第3実施形態の分散ミラードディスクシステムの構成を示す図。
【図13】同第3実施形態の分散ミラードディスクシステムの更新コピー元のコンピュータの処理を示す図。
【図14】同第3実施形態の分散ミラードディスクシステムの更新コピー先のコンピュータの処理を示す図。
【図15】同第3実施形態の分散ミラードディスクシステムの組み込みコピー元が主導のコピー処理を示す第1の図。
【図16】同第3実施形態の分散ミラードディスクシステムの組み込みコピー元が主導のコピー処理を示す第2の図。
【図17】同第3実施形態の分散ミラードディスクシステムの組み込みコピー先が主導のコピー処理を示す第1の図。
【図18】同第3実施形態の分散ミラードディスクシステムの組み込みコピー先が主導のコピー処理を示す第2の図。
【図19】同第4実施形態の分散ミラードディスクシステムに適用されるフラグの構成を説明するための図。
【図20】従来の2重化ディスク装置の構成を示す図。
【図21】従来の分散ミラードディスクシステムの構成を示す図。
【符号の説明】
1…ネットワーク
2…コンピュータ
3…書き込み検知部
4…書き込み処理部
5…クラスタマネージャ
6…ノードマップ
7…組み込みコピー制御部
8…ディスク
9…データ
10…書き込み前処理部
11…書き込み後処理部
12…フラグ
13…フラグカウンタ
14…データブロック
15…フラグ待避制御部
16…フラグ待避領域
17…フラグキャッシュ
Claims (3)
- ネットワークで接続される2台のコンピュータそれぞれに備えられたディスクを用いて2重化ディスクを構成する分散ミラードディスクシステムにおいて、
前記各コンピュータは、
前記ディスクの書き込み単位であるブロックそれぞれに対応して設けられる複数のフラグを格納する、不揮発性の記憶装置に設けられるフラグ格納手段と、
前記フラグ格納手段に格納されたフラグについての前記不揮発性の記憶装置に対するセット/リセット通知を揮発性の記憶装置にて一時的に蓄積するためのキャッシュ手段と、
前記ディスクにデータを書き込む前に、そのブロックに対応するフラグをセットする旨を前記キャッシュ手段に通知するとともに、相手のコンピュータが稼働中であれば、そのデータを相手のコンピュータに送信してその書き込みを要求し、前記ディスクにデータを書き込んだ後に、相手のコンピュータが稼働中であれば、前記要求したデータの書き込みを完了した旨が相手のコンピュータから通知されるのを待って、そのブロックに対応するフラグをリセットする旨を前記キャッシュ手段に通知する書き込み処理手段と、
相手のコンピュータが障害から復帰したときに、前記フラグ格納手段に格納されたフラグの中のセット状態にあるフラグに対応するブロックのデータを相手のコンピュータに順次送信するとともに、そのデータの書き込みを完了した旨が相手のコンピュータから通知されるのを待って、そのフラグをリセットする組み込みコピー手段と
を具備し、
前記キャッシュ手段は、前記フラグ格納手段に格納されたフラグについて、あるフラグをリセットする旨の通知を前記書き込み処理手段から受けた際、当該フラグをリセットする旨の通知を一定時間待機し、前記一定時間を越えて当該フラグをセットする旨の通知を受けなかった場合に、前記不揮発性の記憶装置に対して、前記フラグ格納手段が格納する当該フラグをリセットする旨を通知する手段を有する
ことを特徴とする分散ミラードディスクシステム。 - ネットワークで接続される3台以上のコンピュータそれぞれに備えられたディスクを用いて多重化ディスクを構成する分散ミラードディスクシステムにおいて、
前記各コンピュータは、
前記ディスクの書き込み単位であるブロックそれぞれに対応して設けられる複数のフラグを格納する、不揮発性の記憶装置に設けられるフラグ格納手段と、
前記フラグ格納手段に格納されたフラグについての前記不揮発性の記憶装置に対するセット/リセット通知を揮発性の記憶装置にて一時的に蓄積するためのキャッシュ手段と、
前記ディスクにデータを書き込む前に、そのブロックに対応するフラグをセットする旨を前記キャッシュ手段に通知するとともに、そのデータを稼働中の他のコンピュータすべてに送信してその書き込みを要求し、前記ディスクにデータを書き込んだ後に、他のすべてのコンピュータが稼働中であれば、前記要求したデータの書き込みが完了した旨を稼働中の他のコンピュータすべてから通知されるのを待って、そのブロックに対応するフラグをリセットする旨を前記キャッシュ手段に通知する書き込み処理手段と、
他のコンピュータが障害から復帰したときに、前記フラグ格納手段に格納されたフラグの中のセット状態にあるフラグに対応するブロックのデータを当該他のコンピュータに順次送信するとともに、そのデータの書き込みを完了した旨が当該他のコンピュータから通知されるのを待って、そのフラグをリセットする組み込みコピー手段と
を具備し、
前記キャッシュ手段は、前記フラグ格納手段に格納されたフラグについて、あるフラグをリセットする旨の通知を前記書き込み処理手段から受けた際、当該フラグをリセットする旨の通知を一定時間待機し、前記一定時間を越えて当該フラグをセットする旨の通知を受けなかった場合に、前記不揮発性の記憶装置に対して、前記フラグ格納手段が格納する当該フラグをリセットする旨を通知する手段を有する
ことを特徴とする分散ミラードディスクシステム。 - ネットワークで接続される3台以上のコンピュータそれぞれに備えられたディスクを用いて多重化ディスクを構成する分散ミラードディスクシステムにおいて、
前記各コンピュータは、
前記ディスクの書き込み単位であるブロックそれぞれに対応して他のコンピュータごとに設けられる複数のフラグを格納する、不揮発性の記憶装置に設けられるフラグ格納手段と、
前記フラグ格納手段に格納されたフラグについての前記不揮発性の記憶装置に対するセット/リセット通知を揮発性の記憶装置にて一時的に蓄積するためのキャッシュ手段と、
前記ディスクにデータを書き込む前に、そのブロックに対応するすべてのフラグをセットする旨を前記キャッシュ手段に通知するとともに、そのデータを稼働中の他のコンピュータすべてに送信してその書き込みを要求し、前記ディスクにデータを書き込んだ後に、そのブロックに対応するフラグであって前記要求したデータの書き込みを完了した旨を通知してきた他のコンピュータ用のフラグをリセットする旨を前記キャッシュ手段に通知する書き込み処理手段と、
他のコンピュータが障害から復帰したときに、前記フラグ格納手段に格納された当該他のコンピュータに関するフラグの中のセット状態にあるフラグに対応するブロックのデータを当該他のコンピュータに順次送信するとともに、そのデータの書き込みを完了した旨が当該他のコンピュータから通知されるのを待って、そのフラグをリセットする組み込みコピー手段と
を具備し、
前記キャッシュ手段は、前記フラグ格納手段に格納されたフラグについて、あるフラグをリセットする旨の通知を前記書き込み処理手段から受けた際、当該フラグをリセットする旨の通知を一定時間待機し、前記一定時間を越えて当該フラグをリセットする旨の通知を受けなかった場合に、前記不揮発性の記憶装置に対して、前記フラグ格納手段が格納する当該フラグをリセットする旨を通知する手段を有する
ことを特徴とする分散ミラードディスクシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001191719A JP4131621B2 (ja) | 2001-06-25 | 2001-06-25 | 分散ミラードディスクシステム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001191719A JP4131621B2 (ja) | 2001-06-25 | 2001-06-25 | 分散ミラードディスクシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003006015A JP2003006015A (ja) | 2003-01-10 |
JP4131621B2 true JP4131621B2 (ja) | 2008-08-13 |
Family
ID=19030300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001191719A Expired - Fee Related JP4131621B2 (ja) | 2001-06-25 | 2001-06-25 | 分散ミラードディスクシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4131621B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4575739B2 (ja) * | 2004-09-30 | 2010-11-04 | 株式会社日本デジタル研究所 | ネットワークraidシステム |
JP4575740B2 (ja) * | 2004-09-30 | 2010-11-04 | 株式会社日本デジタル研究所 | 仮想サーバ |
JP2011253400A (ja) * | 2010-06-03 | 2011-12-15 | Nec System Technologies Ltd | 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム |
JP2012164075A (ja) * | 2011-02-04 | 2012-08-30 | Nippon Telegr & Teleph Corp <Ntt> | ストレージ同期システム及び仮想マシン及びストレージ同期方法及びプログラム |
JP2019082897A (ja) * | 2017-10-31 | 2019-05-30 | 富士通株式会社 | 情報処理装置、情報処理システム及びプログラム |
-
2001
- 2001-06-25 JP JP2001191719A patent/JP4131621B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003006015A (ja) | 2003-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3968207B2 (ja) | データ多重化方法およびデータ多重化システム | |
US8108606B2 (en) | Computer system and control method for the computer system | |
US8209507B2 (en) | Storage device and information management system | |
JP4142438B2 (ja) | 1次およびバックアップシステムの間のデータのリストア | |
US6640291B2 (en) | Apparatus and method for online data migration with remote copy | |
US20020078296A1 (en) | Method and apparatus for resynchronizing paired volumes via communication line | |
JP4277873B2 (ja) | トランザクション処理装置、トランザクション処理方法 | |
JP2003507791A (ja) | 遠隔ミラーリングシステム、装置及び方法 | |
JP2005250676A (ja) | ストレージシステム及びストレージシステムの制御方法 | |
JP2010503089A (ja) | 改良された同期データ・ミラー・スワップのための装置、システム、および方法 | |
JP2004303122A (ja) | データ転送制御システム | |
JP5331892B2 (ja) | ストレージシステム及びストレージシステムにおけるデータ複製方法 | |
JP3136258B2 (ja) | ディスク更新ログ記録方式 | |
JP3904894B2 (ja) | バックアップ管理方法およびこの方法に用いる記憶制御装置 | |
JP4131621B2 (ja) | 分散ミラードディスクシステム | |
JP2006285336A (ja) | 記憶装置及びストレージシステム並びにその制御方法 | |
JPH10326220A (ja) | ファイルシステムおよびファイル管理方法 | |
US7194675B2 (en) | Backup method, backup system, disk controller and backup program | |
JP4305007B2 (ja) | 系切り替えシステムおよびその処理方法並びにその処理プログラム | |
JP2000330730A (ja) | ディスクアレイ装置の差分コピー方式 | |
JP4721057B2 (ja) | データ管理システム,データ管理方法及びデータ管理用プログラム | |
JP2004070456A (ja) | データバックアップ方法、データバックアップ装置、及び情報処理装置 | |
JP2004272884A (ja) | 複数リモートストレージでのリモートコピー停止後のデータ同期化方式 | |
JPH07281933A (ja) | 計算機システム | |
JP2004272884A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080527 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110606 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120606 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130606 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |