JP2005284980A - 2重化システム及びリモートディスクミラーリングの初期化処理方法 - Google Patents
2重化システム及びリモートディスクミラーリングの初期化処理方法 Download PDFInfo
- Publication number
- JP2005284980A JP2005284980A JP2004100984A JP2004100984A JP2005284980A JP 2005284980 A JP2005284980 A JP 2005284980A JP 2004100984 A JP2004100984 A JP 2004100984A JP 2004100984 A JP2004100984 A JP 2004100984A JP 2005284980 A JP2005284980 A JP 2005284980A
- Authority
- JP
- Japan
- Prior art keywords
- disk
- computer
- block
- data
- active
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
- G06F11/1448—Management of the data involved in backup or backup restore
- G06F11/1451—Management of the data involved in backup or backup restore by selection of backup contents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2048—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】リモートディスクミラーリングの初期化処理において不要なデータブロックのコピーをなくすことにより当該初期化処理の高速化を図る。
【解決手段】
リモートディスクミラーリングの初期化処理において、ホスト計算機10-1が稼動系となった場合、当該計算機10-1のコピードライバ12-1は、ディスク30-1の管理領域に格納されているビットマップテーブル310-1により有効なデータが格納されているブロックであるとして管理されているブロックのデータのみを、待機系の計算機10-2のミラーリング対象ディスク30-2にコピーする。
【選択図】 図1
【解決手段】
リモートディスクミラーリングの初期化処理において、ホスト計算機10-1が稼動系となった場合、当該計算機10-1のコピードライバ12-1は、ディスク30-1の管理領域に格納されているビットマップテーブル310-1により有効なデータが格納されているブロックであるとして管理されているブロックのデータのみを、待機系の計算機10-2のミラーリング対象ディスク30-2にコピーする。
【選択図】 図1
Description
本発明は、稼動系計算機のディスクへのデータ書き込み要求を2重化して、当該稼動系計算機とネットワークにより接続された待機系計算機のディスクにも同一データを書き込ませることでディスクのデータを2重化する2重化システムに係り、特に待機系計算機のディスクの内容を稼動系計算機のディスクに一致化させるのに好適な2重化システム及びリモートディスクミラーリングの初期化処理方法に関する。
従来から、稼働状態にある計算機(稼動系計算機)で障害が発生した場合に、その障害が発生した計算機で実行されていたサービス(業務)を、システム内の他の計算機、例えば待機状態(ホットスイタンバイ状態)にある他の計算機(待機系計算機)に引き継がせる(フェイルオーバする)、クラスタシステムと呼ばれる、フェイルオーバ方式の2重化システム(分散システム)が知られている(例えば、非特許文献1参照)。
この種の2重化システムでは、データの保守性を高めるため、書き込みデータを、ネットワークで相互接続された異なる計算機(ノード)間で2重化する、リモートディスクミラーリング(RDM)技術が適用される。一般的に、この技術では、運用を開始する前にミラーリング対象となる計算機(ノード)及びディスク(ディスク装置)の設定が行われる。また、実際の運用の際には、各計算機(ノード)間でネットワーク経由で通信が行われて、稼動系の計算機が当該稼動系のディスク(ミラーリング対象ディスク)に書き込んだデータが、待機系の計算機のディスク(ミラーリング対象ディスク)にコピーされることで、各計算機のディスクのデータが2重化される。
リモートディスクミラーリング技術では、運用開始時に稼動系となる計算機(稼動系計算機)のミラーリング対象ディスク内のデータに、待機系となる計算機(待機系計算機)のミラーリング対象ディスクのデータを一致化させる初期化処理(リモートディスクミラーリングの初期化処理)が必要がある。この初期化処理は、稼動系計算機のミラーリング対象ディスクの全面のデータを、ネットワークを経由しての通信により待機系計算機のミラーリング対象ディスクにコピーすることによって実行される。このため、フェイルオーバ方式の2重化システムにおけるリモートディスクミラーリングの初期化処理は、実行に長時間を要する。
一方、各計算機がそれぞれ当該計算機のディスクにデータを書き込むことができ、その際に相手の計算機(が稼働中であれば、その相手の計算機)のディスクに当該データをコピーすることにより、各計算機のデータを2重化する2重化システム(分散ミラードディスクシステム)も知られている(例えば、特許文献1参照)。この特許文献1に記載のシステムでは、各計算機は、ディスクの書き込み単位であるブロック毎に当該ブロックへの書き込みを管理するフラグを保持している。各計算機は、自身のディスクにデータを書き込む前に対応するフラグをオンすると共に相手計算機の対応するフラグもオンさせる。そして各計算機は、相手計算機の対応するフラグがオンされたのを確認すると、自身のディスクにデータを書き込むと共に、そのデータを相手計算機のディスクにコピーさせ、コピーが完了したことを確認すると、対応する自身のフラグをオフすると共に相手計算機の対応するフラグもオフさせる。このようなフラグ操作により、システム内のいずれかの計算機が障害を起こして停止し、その後障害から復帰した場合には、最新のデータを保持する計算機の持つフラグが不一致の状態(オン状態)を示すブロックと、障害から復帰した計算機の持つフラグが不一致の状態(オン状態)を示すブロックとを相互にコピーするだけで良い。なお、ディスクに障害が発生して、新しいディスクと交換した場合には、全てのデータをコピーする必要がある。
特開2003−6015号公報(段落0012,0013,0017)
金子哲夫、森良哉、「クラスタソフトウェア」、東芝レビュー、Vol.54 No.12(1999)、p.18-21
上記したように従来のフェイルオーバ方式の2重化システムに適用されるリモートディスクミラーリング技術では、運用開始時にミラーリング対象ディスク内のデータを一致化させる初期化処理(リモートディスクミラーリングの初期化処理)が必要がある。この初期化処理は、稼動系計算機のミラーリング対象ディスクの全面のデータを、ネットワークを経由しての通信により待機系計算機のミラーリング対象ディスクにコピーすることによって実行されるため、長時間を要する。
そこで、上記特許文献1に記載された分散ミラードディスクシステムの技術を適用することが考えられる。しかし、この特許文献1に記載の技術は、システムを構成する計算機のいずれかに障害が発生し、その後当該障害が発生した計算機が復帰した場合に、各計算機のディスクのデータを効率的に多重化(一致化)する技術であり、ディスクの障害で当該ディスクを別の新たなディスクに交換した場合は想定していない。当然、ディスクを交換した場合には、他のディスクのデータを全てコピーしなければならない(特許文献1の段落0017)。また、特許文献1に記載の技術では、データが書き込まれたブロックが、その後不要となった場合でも、対応するフラグにより不一致が示されていれば、コピーの対象となる。このため、特許文献1に記載の技術は、フェイルオーバ方式の2重化システムにおけるリモートディスクミラーリングの初期化処理には適さない。、
本発明は上記事情を考慮してなされたものでその目的は、リモートディスクミラーリングの初期化処理において不要なデータのコピーをなくすことにより当該初期化処理の高速化を図ることができる2重化システム及びリモートディスクミラーリングの初期化処理方法を提供することにある。
本発明は上記事情を考慮してなされたものでその目的は、リモートディスクミラーリングの初期化処理において不要なデータのコピーをなくすことにより当該初期化処理の高速化を図ることができる2重化システム及びリモートディスクミラーリングの初期化処理方法を提供することにある。
本発明の1つの観点によれば、ディスクを備えた2台の計算機がネットワークにより相互接続され、上記2台の計算機の一方が稼動系計算機として、他方が待機系計算機としてそれぞれ動作し、上記稼動系計算機の上記ディスクへのデータ書き込み要求を2重化して上記ネットワークを介して上記待機系計算機の上記ディスクにも同一データを書き込ませることで上記ディスクのデータを2重化する2重化システムが提供される。この2重化システムの上記2台の計算機の各々は、上記計算機の上記ディスク内のデータを管理するファイルシステムであって、上記ディスクのデータ領域を予め定められたサイズのブロックを単位に区分して、当該ブロック毎に有効なデータが格納されている有効ブロックであるか否かをブロック管理情報により管理するファイルシステムと、リモートディスクミラーリングの初期化処理において、自身が上記稼動系計算機となった場合、上記ファイルシステムによる管理に用いられる上記ブロック管理情報に従い、有効ブロックのデータのみを上記稼動系計算機の上記ディスクから上記待機系計算機の上記ディスクにコピーする有効ブロックコピー手段とを備えている。
このような構成においては、稼動系計算機のファイルシステムがディスク内のデータを管理するのに用いられるブロック管理情報を利用して、リモートディスクミラーリングの初期化処理が行われる。この初期化処理では、稼動系計算機のファイルシステムによってブロック単位で管理される当該稼動系計算機のディスクのデータのうち、ブロック管理情報によって有効なデータが格納されていることが示されている有効ブロックのデータのみが、待機系計算機のディスクにコピーされる。
このように上記の構成では、リモートディスクミラーリングの初期化処理において、稼動系計算機のディスク内のデータのうちの有効なデータ部分だけが待機系計算機のディスクにコピーされ、不要なデータ部分がコピーされるのを防止できるため、コピー総量を削減でき、初期化処理を高速化できる。
ここで、上記ブロック管理情報が、ディスクの管理領域に格納されるファイルシステム管理情報の一部として上記ファイルシステムにより管理される構成とし、リモートディスクミラーリングの初期化処理において、このファイルシステム管理情報を上記有効ブロックコピー手段によるデータのコピーに先行して、稼動系計算機のディスクから待機系計算機のディスクにコピーするファイルシステム管理情報コピー手段を追加すると良い。
本発明によれば、リモートディスクミラーリングの初期化処理に、稼動系計算機のファイルシステムがディスク内のデータを管理するのに用いられるブロック管理情報を利用して、稼動系計算機のディスク内のデータのうち有効なデータ部分だけを待機系計算機のディスクにコピーすることにより、不要なデータ部分のコピーを防止してコピー総量を削減することができるため、初期化処理の所用時間を短縮して当該初期化処理の高速化を図ることができる。
以下、本発明の一実施形態につき図面を参照して説明する。
図1は本発明の一実施形態に係るリモートディスクミラーリングを適用する2重化システムの構成を示すブロック図である。図1の2重化システムは、2台のホスト計算機10-1,10-2から構成される。ホスト計算機10-1,10-2はネットワーク20を介して相互に通信が可能なように構成されている。このホスト計算機10-1,10-2(から構成される2重化システム)は、ネットワーク20を介して図示せぬクライアント端末から利用可能である。ホスト計算機10-1,10-2のうちのいずれか一方は稼動系計算機となって、クライアント端末から要求されたサービスを提供する。ホスト計算機10-1,10-2のうちの他方は待機系計算機となって、稼動系計算機に障害が発生した場合に当該稼動系計算機が実行していたサービス(業務)を引き継ぐ、ここではホスト計算機10-1が稼動系計算機、ホスト計算機10-2が待機系計算機であるとする。
図1は本発明の一実施形態に係るリモートディスクミラーリングを適用する2重化システムの構成を示すブロック図である。図1の2重化システムは、2台のホスト計算機10-1,10-2から構成される。ホスト計算機10-1,10-2はネットワーク20を介して相互に通信が可能なように構成されている。このホスト計算機10-1,10-2(から構成される2重化システム)は、ネットワーク20を介して図示せぬクライアント端末から利用可能である。ホスト計算機10-1,10-2のうちのいずれか一方は稼動系計算機となって、クライアント端末から要求されたサービスを提供する。ホスト計算機10-1,10-2のうちの他方は待機系計算機となって、稼動系計算機に障害が発生した場合に当該稼動系計算機が実行していたサービス(業務)を引き継ぐ、ここではホスト計算機10-1が稼動系計算機、ホスト計算機10-2が待機系計算機であるとする。
ホスト計算機10-1,10-2は、それぞれ2重化の対象となるディスク(ディスク装置)、つまりミラーリング対象ディスク(ディスク装置)30-1,30-2と接続されている。このミラーリング対象ディスク30-1,30-2は、必ずしも物理的に1つであるとは限らない。稼動系計算機10-1のミラーリング対象ディスク30-1へのデータ書き込み時には、書き込みデータは、待機系計算機10-2のミラーリング対象ディスク30-2へとコピーされ、両ディスク30-1,30-2の内容が同一になるよう保たれる。
ホスト計算機10-1,10-2は、それぞれリモートディスクミラーリングモジュール(以下、RDMモジュールと称する)11-1,11-2と、コピードライバ12-1,12-2と、ファイルシステム13-1,13-2と、リモートディスクミラーリングドライバ(以下、RDMドライバと称する)14-1,14-2と、ディスクドライバ15-1,15-2とを備えている。
RDMモジュール11-1,11-2は、ネットワーク20を介して相互に通信が可能となった場合、どちらが稼動系となるか等のネゴシエーション、更にはリモートディスクミラーリングの初期化処理を含む初期化処理等を行う。RDMモジュール11-1,11-2は、ハートビート機構110-1,110-2を含む。本実施形態では、RDMモジュール11-1,11-2は、ホスト計算機10-1,10-2内にインストールされた特定のアプリケーションプログラム(クラスタプログラム)を当該ホスト計算機10-1,10-2が読み取って実行することにより実現される。このプログラムは、コンピュータで読み取り可能な記憶媒体、例えばフロッピー(登録商標)ディスクに代表される磁気ディスク、CD−ROM、DVDに代表される光ディスク、フラッシュメモリに代表される半導体メモリ等の記憶媒体に予め格納して頒布可能である。また、このプログラムが、ネットワーク20を介してダウンロード(頒布)されても構わない。
ハートビート機構110-1,110-2は、ネットワーク20を介して定期的に相互に通信をして、お互いの動作状況を確認し合う。この通信は「ハートビート」と呼ばれる。計算機の故障停止は、ハートビートのタイムアウトによって検出される。つまり一定時間ハートビートが送出されていない計算機は故障停止したものとみなされる。ハートビート機構110-1,110-2が、RDMモジュール11-1,11-2とは別に設けられても構わない。
コピードライバ12-1,12-2は、ミラーリング対象ディスク30-1,30-2間の初期化処理の際に、コピーすべき領域とコピーする必要のない領域とを選別してコピー処理を実行する。この選別には、後述するビットマップテーブル(BMT)31-1,31-2が用いられる。
ファイルシステム13-1,13-2は、ミラーリング対象ディスク30-1,30-2内のデータを管理する。ここでは、ファイルシステム13-1,13-2は、ミラーリング対象ディスク30-1,30-2のデータ領域を予め定められたサイズのブロックを単位に区分して、そのブロック毎に有効なデータが格納されているか否かを、ブロック管理情報としてのビットマップ情報、例えばビットマップテーブル310-1,310-2を用いて管理する。ビットマップテーブル310-1,310-2は、ファイルシステム13-1,13-2の管理情報であるファイルシステム(FS)管理情報31-1,31-2の一部である。このファイルシステム管理情報31-1,31-2は、ミラーリング対象ディスク30-1,30-2内の管理領域として割り当てられている特定の領域に格納されている。
図2は、ビットマップテーブル310-1のデータ構造例を示す。ビットマップテーブル310-1は、ミラーリング対象ディスク30-1内の各ブロックのブロック番号に対応して設けられる有効ビットの列から構成される。ここで、有効ビットは、値が“1”の場合、対応するブロックが、使用されているブロック、つまり有効なブロックであることを示す。また有効ビットは、値が“0”の場合は、対応するブロックが、使用されていないブロック、つまり無効なブロックであることを示す。この無効ブロック(使用されていないブロック)には、データとしては意味のない値が格納されている。図2のビットマップテーブル310-1の例では、ブロック番号が2,3,6のブロックは使用中の有効ブロックであることが示され、ブロック番号が1,4,5のブロックは使用されていない無効ブロックであることが示されている。この図2のビットマップテーブル310-1の内容に対応する、ミラーリング対象ディスク30-1のデータの状態を図3に示す。
再び図1を参照すると、RDMドライバ14-1,14-5は、システム(リモートディスクミラーリング)の運用状態において、ミラーリング対象ディスク30-1,31-2間で内容を一致化(同期化)させるように、ディスク入出力(ディスクIO)を管理する。稼動系計算機、例えばホスト計算機10-1のRDMドライバ14-1は、書込み要求を2重化して、待機系計算機、例えばホスト計算機10-2のミラーリング対象ディスク30-2の同一ブロックに同一データを書き込ませる。一方、待機系のホスト計算機10-2のRDMドライバ14-2は、当該待機系が稼動系から独立してミラーリング対象ディスク30-2にデータを書き込むのを禁止する。
ディスクドライバ15-1,15-2は、RDMドライバ14-1,14-2に従ってミラーリング対象ディスク30-1,31-2を対象とするディスク入出力を行う。
ディスクドライバ15-1,15-2は、RDMドライバ14-1,14-2に従ってミラーリング対象ディスク30-1,31-2を対象とするディスク入出力を行う。
次に、図1の2重化システムにおけるリモートディスクミラーリングの初期化処理について、図4のフローチャートを参照して説明する。
ホスト計算機10-1及び10-2内のRDMモジュール11-1及び11-2は、ネットワーク20を介して通信を行う。もし、ホスト計算機10-2が障害から復帰した場合、或いはホスト計算機10-2のミラーリング対象ディスク30-2が故障して新たなミラーリング対象ディスク30-2に交換された場合、RDMモジュール11-1及び11-2は相互に通信が可能となった段階で、2重化システムを構成する計算機として運用を開始しようとする。この場合、ホスト計算機10-1及び10-2では、図4のフローチャートに示す手順によって、リモートディスクミラーリングの初期化処理が次のように行われる。
ホスト計算機10-1及び10-2内のRDMモジュール11-1及び11-2は、ネットワーク20を介して通信を行う。もし、ホスト計算機10-2が障害から復帰した場合、或いはホスト計算機10-2のミラーリング対象ディスク30-2が故障して新たなミラーリング対象ディスク30-2に交換された場合、RDMモジュール11-1及び11-2は相互に通信が可能となった段階で、2重化システムを構成する計算機として運用を開始しようとする。この場合、ホスト計算機10-1及び10-2では、図4のフローチャートに示す手順によって、リモートディスクミラーリングの初期化処理が次のように行われる。
まず。ホスト計算機10-1及び10-2内のRDMモジュール11-1及び11-2は、相互に通信を行うことで、ホスト計算機10-1及び10-2の一方を稼動系とし、他方を待機系とするための決定処理を行う(ステップS1)。この決定処理が、一般にはミラーリング対象ディスク30-1,31-2に格納されている世代管理情報など、リモートディスクミラーリングのための管理情報に従って行われることは従来から良く知られている。したがって、この決定処理のアルゴリズムについては説明は省略する。
さて、ステップS1では、ホスト計算機10-1が稼動系、ホスト計算機10-2が待機系として、それぞれ決定されたものとする。すると稼動系計算機10-1のRDMモジュール11-1は、待機系計算機10-2のRDMモジュール11-2とネットワーク20を介して通信を行い、稼動系計算機10-1のミラーリング対象ディスク30-1内の管理領域に格納されているファイルシステム(FS)管理情報31-1を、待機系計算機10-2のミラーリング対象ディスク30-2の同一アドレスの領域(つまりミラーリング対象ディスク30-2内の管理領域)にファイルシステム管理情報31-2としてコピーする(ステップS2)。これにより、ファイルシステム管理情報31-に含まれているビットマップテーブル(BMT)310-1は、ビットマップテーブル(BMT)310-2としてミラーリング対象ディスク30-2にコピーされることになる。
すると、稼動系計算機10-1のコピードライバ12-1が起動される。コピードライバ12-1は、ミラーリング対象ディスク30-1,30-2の管理領域以外の領域(データ領域)を対象に、ファイルシステム13-1によって管理されるブロック(データブロック)単位でコピーを行う。即ちコピードライバ12-1は、ブロック単位で、そのブロックに対応するビットマップテーブル310-1(ビットマップ情報)の有効ビットを参照する(ステップS3,S4)。そしてコピードライバ12-1は、ビットマップテーブル310-1によって有効なデータが格納されている有効ブロックとして管理されている、ミラーリング対象ディスク30-1内の使用中のブロックについては、待機系計算機10-2のミラーリング対象ディスク30-2の同一アドレスのブロックにデータをコピーする(ステップS5,S6)。これに対し、ビットマップテーブル310-1によって無効ブロックとして管理されている使用されていないブロックに関しては、コピードライバ12-1はミラーリング対象ディスク30-1,30-2間のコピーを行わずに、そのブロックはコピー完了したとみなす。コピードライバ12-1は、以上の動作を、ビットマップテーブル310-1によって管理されている全ブロックについて繰り返す。
この初期化処理により、ファイルシステム管理情報31-1が図2に示す状態にあり、したがってミラーリング対象ディスク30-1の内容が図3に示す状態にある場合には、ミラーリング対象ディスク30-1からミラーリング対象ディスク30-2に対し、図5に示すコピーが行われる。即ち、ファイルシステム管理情報31-1、及びブロック番号が2,3,6のブロック(データブロック)のデータのみがコピーされる。
このように、本実施形態のリモートディスクミラーリングの初期化処理では、稼動系計算機10-1のミラーリング対象ディスク30-1から待機系ホスト計算機10-2のミラーリング対象ディスク30-2に対し、ファイルシステム管理情報と有効ブロックのデータだけをコピーすることから、コピー総量を削減でき、初期化処理に要する時間を短縮して初期化処理の高速化を図ることができる。しかも、コピーの対象とならなかったブロックは使用されていない無効ブロックであり、当該無効ブロックのデータがコピーされなくても、システムの運用に何ら支障をきたさない。
さて、図4のフローチャートに従う初期化処理を全ブロックについて実行し終えると(ステップS3)、ミラーリング対象ディスク30-2のミラーリング対象ディスク30-1への一致化が完了する。図1の2重化システムは、この一致化が完了した時点で、通常のリモートディスクミラーリングの運用を開始する。即ち、稼動系計算機10-1(内のRDMドライバ14-1)は、ミラーリング対象ディスク30-1への書込み要求を2重化して、待機系計算機10-2のミラーリング対象ディスク30-2の同一ブロックに同一データを書き込ませる。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
10-1,10-2…ホスト計算機、11-1,11-2…RDM(リモートディスクミラーリング)モジュール(ファイルシステム管理情報コピー手段)、12-1,12-2…コピードライバ(有効ブロックコピー手段)、13-1,13-2…ファイルシステム、20…ネットワーク、30-1,30-2…ミラーリング対象ディスク、31-1,31-2…ファイルシステム管理情報、310-1,310-2…ビットマップテーブル(BMT、ブロック管理情報)。
Claims (4)
- ディスクを備えた2台の計算機がネットワークにより相互接続され、前記2台の計算機の一方が稼動系計算機として、他方が待機系計算機としてそれぞれ動作し、前記稼動系計算機の前記ディスクへのデータ書き込み要求を2重化して前記ネットワークを介して前記待機系計算機の前記ディスクにも同一データを書き込ませることで前記ディスクのデータを2重化する2重化システムにおいて、
前記2台の計算機の各々は、
前記計算機の前記ディスク内のデータを管理するファイルシステムであって、前記ディスクのデータ領域を予め定められたサイズのブロックを単位に区分して、当該ブロック毎に有効なデータが格納されている有効ブロックであるか否かをブロック管理情報により管理するファイルシステムと、
リモートディスクミラーリングの初期化処理において、自身が前記稼動系計算機となった場合、当該稼動系計算機の前記ファイルシステムによる管理に用いられる前記ブロック管理情報に従い、前記有効ブロックのデータのみを当該稼動系計算機の前記ディスクから前記待機系計算機の前記ディスクにコピーする有効ブロックコピー手段と
を具備することを特徴とする2重化システム。 - 前記ファイルシステムは、前記ディスクの管理領域に格納される、前記ブロック管理情報を含むファイルシステム管理情報により、当該ディスク内のデータを管理し、
前記2台の計算機の各々は、前記リモートディスクミラーリングの初期化処理において、自身が前記稼動系計算機となった場合、当該稼動系計算機の前記ディスクの前記管理領域に格納されている前記ファイルシステム管理情報を、前記有効ブロックコピー手段によるデータのコピーに先行して、前記待機系計算機の前記ディスクにコピーするファイルシステム管理情報コピー手段を更に具備する
ことを特徴とする請求項1記載の2重化システム。 - ディスクを備えた2台の計算機がネットワークにより相互接続され、前記2台の計算機の一方が稼動系計算機として、他方が待機系計算機としてそれぞれ動作し、前記稼動系計算機の前記ディスクへのデータ書き込み要求を2重化して前記ネットワークを介して前記待機系計算機の前記ディスクにも同一データを書き込ませることで前記ディスクのデータを2重化する2重化システムに適用されるリモートディスクミラーリングの初期化処理方法であって、
前記2台の計算機が相互に通信をしていずれが前記稼動系計算機となるかを決定するステップと、
前記稼動系計算機として決定された場合、当該計算機のファイルシステムが、前記ディスクのデータ領域を予め定められたサイズのブロックを単位に区分して、当該ブロック毎に有効なデータが格納されている有効ブロックであるか否かを管理するのに用いられるブロック管理情報に従い、前記ブロック毎に、当該ブロックが有効ブロックであるか否かを前記稼動系計算機が判定するステップと、
前記有効ブロックであると判定されたブロックのデータのみを前記稼動系計算機の前記ディスクから前記待機系計算機の前記ディスクにコピーするブロックコピーステップと
を具備することを特徴とするリモートディスクミラーリングの初期化処理方法。 - 前記稼動系計算機の前記ファイルシステムによって前記ディスクのデータを管理するのに用いられる、前記ブロック管理情報を含むファイルシステム管理情報が、当該ディスクの管理領域に格納されており、
前記稼動系計算機の前記ディスクの前記管理領域に格納されている前記ファイルシステム管理情報を、前記ブロックコピーステップに先行して、前記待機系計算機の前記ディスクにコピーするステップを更に具備する
ことを特徴とする請求項3記載のリモートディスクミラーリングの初期化処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004100984A JP2005284980A (ja) | 2004-03-30 | 2004-03-30 | 2重化システム及びリモートディスクミラーリングの初期化処理方法 |
US11/080,815 US20050246576A1 (en) | 2004-03-30 | 2005-03-16 | Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004100984A JP2005284980A (ja) | 2004-03-30 | 2004-03-30 | 2重化システム及びリモートディスクミラーリングの初期化処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005284980A true JP2005284980A (ja) | 2005-10-13 |
Family
ID=35183261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004100984A Pending JP2005284980A (ja) | 2004-03-30 | 2004-03-30 | 2重化システム及びリモートディスクミラーリングの初期化処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20050246576A1 (ja) |
JP (1) | JP2005284980A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006277723A (ja) * | 2005-03-29 | 2006-10-12 | Hitachi Ltd | 少量配備システムにおけるデータコピーの方法と装置 |
JP2008130080A (ja) * | 2006-11-22 | 2008-06-05 | Hitachi Ltd | 動的チャンク割付けストレージシステムにおけるバックアップおよび復元のための方法および装置 |
JP2009522677A (ja) * | 2006-01-05 | 2009-06-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス |
JP2010146492A (ja) * | 2008-12-22 | 2010-07-01 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム |
JP2010198420A (ja) * | 2009-02-26 | 2010-09-09 | Fujitsu Ltd | ストレージ制御装置,ストレージ制御方法およびストレージ制御プログラム |
JP2011253400A (ja) * | 2010-06-03 | 2011-12-15 | Nec System Technologies Ltd | 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム |
JP2014170567A (ja) * | 2009-10-26 | 2014-09-18 | Amazon Technologies Inc | 複製されたデータインスタンスのためのフェイルオーバーおよび復旧 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4927408B2 (ja) * | 2006-01-25 | 2012-05-09 | 株式会社日立製作所 | 記憶システム及びそのデータ復元方法 |
US20070282967A1 (en) * | 2006-06-05 | 2007-12-06 | Fineberg Samuel A | Method and system of a persistent memory |
US9497266B2 (en) * | 2013-02-22 | 2016-11-15 | International Business Machines Corporation | Disk mirroring for personal storage |
CN114385573A (zh) * | 2022-03-23 | 2022-04-22 | 广东睿江云计算股份有限公司 | Drbd块设备初始化方法、装置、计算机设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978565A (en) * | 1993-07-20 | 1999-11-02 | Vinca Corporation | Method for rapid recovery from a network file server failure including method for operating co-standby servers |
US7546364B2 (en) * | 2002-05-16 | 2009-06-09 | Emc Corporation | Replication of remote copy data for internet protocol (IP) transmission |
JP4452438B2 (ja) * | 2002-11-11 | 2010-04-21 | 株式会社日立製作所 | 記憶システム |
JP4325843B2 (ja) * | 2002-12-20 | 2009-09-02 | 株式会社日立製作所 | 論理ボリュームコピー先性能調整方法及び装置 |
US7043665B2 (en) * | 2003-06-18 | 2006-05-09 | International Business Machines Corporation | Method, system, and program for handling a failover to a remote storage location |
-
2004
- 2004-03-30 JP JP2004100984A patent/JP2005284980A/ja active Pending
-
2005
- 2005-03-16 US US11/080,815 patent/US20050246576A1/en not_active Abandoned
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006277723A (ja) * | 2005-03-29 | 2006-10-12 | Hitachi Ltd | 少量配備システムにおけるデータコピーの方法と装置 |
JP2009522677A (ja) * | 2006-01-05 | 2009-06-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス |
JP2008130080A (ja) * | 2006-11-22 | 2008-06-05 | Hitachi Ltd | 動的チャンク割付けストレージシステムにおけるバックアップおよび復元のための方法および装置 |
JP2010146492A (ja) * | 2008-12-22 | 2010-07-01 | Ricoh Co Ltd | 情報処理装置、情報処理方法、情報処理プログラム |
JP2010198420A (ja) * | 2009-02-26 | 2010-09-09 | Fujitsu Ltd | ストレージ制御装置,ストレージ制御方法およびストレージ制御プログラム |
US8707089B2 (en) | 2009-02-26 | 2014-04-22 | Fujitsu Limited | Storage control device for formatting to storage media, storage control method for formatting to storage media, and medium for storing storage control program for formatting to storage media |
JP2014170567A (ja) * | 2009-10-26 | 2014-09-18 | Amazon Technologies Inc | 複製されたデータインスタンスのためのフェイルオーバーおよび復旧 |
JP2011253400A (ja) * | 2010-06-03 | 2011-12-15 | Nec System Technologies Ltd | 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20050246576A1 (en) | 2005-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3741609B2 (ja) | 複製されたデータに独立してアクセスできるようにするためのデータプロセッシングの方法及び装置 | |
JP4927408B2 (ja) | 記憶システム及びそのデータ復元方法 | |
JP5031341B2 (ja) | 記憶システム及びデータ管理方法 | |
JP4277873B2 (ja) | トランザクション処理装置、トランザクション処理方法 | |
JP4170056B2 (ja) | 複製ボリューム間でのバックアップ・リストア管理方法およびこの方法に用いる記憶制御装置 | |
CN106407040A (zh) | 一种远程数据复制方法及系统 | |
US8726261B2 (en) | Zero downtime hard disk firmware update | |
JP2005196683A (ja) | 情報処理システム、情報処理装置、及び情報処理システムの制御方法 | |
JP2006023889A (ja) | リモートコピーシステム及び記憶装置システム | |
US20050246576A1 (en) | Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system | |
JP2008159045A (ja) | サポート・プロセッサによる最適化されたデータ・マイグレーションのための方法、システム、およびプログラム | |
US20210042051A1 (en) | Storage system and storage control method | |
JP2012507788A (ja) | ストレージ・エリア・ネットワークを使用してコンピュータシステムを復旧するための方法およびシステム | |
JP2004005358A5 (ja) | ||
JP6931081B2 (ja) | データバックアップシステム、中継サイトストレージ、データバックアップ方法、及び中継サイトストレージの制御プログラム | |
JP2007323657A (ja) | 過渡状態情報を格納するための方法、システムおよびコンピュータ・プログラム | |
JP2009265920A (ja) | 情報処理装置、データ書込み方法及びプログラム | |
JP4398596B2 (ja) | ディスクアレイ装置 | |
JP2009265973A (ja) | データ同期システム、障害復旧方法、及び、プログラム | |
JP2007034551A (ja) | データの二重化管理方法 | |
JP2005196641A (ja) | ディスクアレイ装置、バックアップシステムおよびバックアップ方法 | |
JP3614328B2 (ja) | ミラーディスク制御装置 | |
JP2009157880A (ja) | サーバ装置及びファイルシステム | |
JP2014089608A (ja) | 記憶装置およびデータバックアップ方法 | |
JP2014106811A (ja) | 記憶装置、冗長性回復方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070925 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080219 |