JP4833734B2 - データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法 - Google Patents

データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法 Download PDF

Info

Publication number
JP4833734B2
JP4833734B2 JP2006139966A JP2006139966A JP4833734B2 JP 4833734 B2 JP4833734 B2 JP 4833734B2 JP 2006139966 A JP2006139966 A JP 2006139966A JP 2006139966 A JP2006139966 A JP 2006139966A JP 4833734 B2 JP4833734 B2 JP 4833734B2
Authority
JP
Japan
Prior art keywords
volume
data
log
storage device
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006139966A
Other languages
English (en)
Other versions
JP2007310701A (ja
Inventor
和彦 水野
真二 藤原
芳生 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006139966A priority Critical patent/JP4833734B2/ja
Priority to US11/455,751 priority patent/US7539703B2/en
Publication of JP2007310701A publication Critical patent/JP2007310701A/ja
Application granted granted Critical
Publication of JP4833734B2 publication Critical patent/JP4833734B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Description

本発明は、データベースサーバとストレージ装置との連携によるディザスタリカバリシステムのセットアップ技術に関する。
近年、情報システムはビジネスの基盤となっており、その重要性はますます高まっている。そのため、災害などによるシステムの停止が及ぼす影響は非常に大きくなっており、例えば、金融業の場合には、時間あたり数百万ドルの損失が発生するおそれがある。そこで、災害時においても業務を継続するために遠隔地にバックアップを生成し、早期に復旧させるディザスタリカバリ(DR)が注目を集めている。
業務データは、データベース(DB)に格納されており、災害時にも欠損なくDBを回復させることが重要である。また、平常時にも継続してデータのバックアップを取得する必要があるため、業務に与える影響を最小限にしなければならない。さらに、地震などの広域災害に対応するために、バックアップを格納するリモートサイトを数百〜数千km離れた遠隔地に配置する必要がある。
ディザスタリカバリには、プライマリサイトのデータ更新履歴情報(ログ)をリモートサイトに複製(以下、「リモートコピー」)し、複製したログを適用してプライマリサイトのデータをリモートサイトに回復させる技術(以下、「ログ適用」)が知られている(特許文献1参照)。
ログ適用によるDRシステム(以下、「ログベースのDRシステム」)では、プライマリサイトのログを更新し、更新されたログがリモートサイトに複写されたことを確認してからプライマリサイトの処理を継続する(以下、「同期コピー」)。また、リモートコピーについては、データベースサーバを介さずに、異なる記憶制御装置間でデータを複製する技術が開示されている(特許文献2参照)。
ログベースのDRシステムでは、初期設定としてプライマリサイトに格納されたデータをリモートサイトに予め複写し(以下、「初期コピー」)、初期コピー終了後はログについてのみ同期コピーを実行する。初期コピー終了後、同期コピーされたログを適用してDBを回復させ、リモートサイトにプライマリサイトのデータを複製する。初期コピーには、記録媒体によるコピー又はストレージ装置のリモートコピー機能が利用される。リモートコピー機能を利用した初期コピー方法には、例えば、コピー元のストレージ装置に更新があると、更新対象となる領域に格納されたデータをコピー先のストレージ装置に転送する方法がある(特許文献3参照)。
特開2006−4147号公報 特開平11−85408号公報 特開2002−297455号公報
しかし、初期コピー実行中は、コピー元となるプライマリサイトの記憶装置を静止化させる必要がある。静止化とは、記憶装置に格納されたデータの更新を禁止した状態とすることである。したがって、初期コピーの完了を待ってオンライン処理を開始すると、コピーするデータの容量が大きい場合には、初期コピーの完了までに膨大な時間を必要とし、プライマリサイトのオンライン処理の開始が遅れてしまう問題がある。
一方、プライマリサイトにローカルミラーを保持することによって、オンライン処理に使用される記憶装置と、初期コピーのために使用され、コピー元となる記憶装置とを備えるシステムも考えられる。このようにDBを二重化することによって、プライマリサイトのオンライン処理と初期コピー処理を並列して実行することができる。
しかし、初期コピーに膨大な時間を要すると、リモートサイトのログ適用が大幅に遅れて開始される。ログベースのDRシステムでは、ログをリングバッファ構成で使用するため、ログ適用の開始が大幅に遅れると、プラマリサイトのオンライン処理によってリモートサイトのログが上書きされる問題(ラップラウンド)が生じてしまう。このままの状態でリモートサイトのログを適用すると、データに不整合が生じてしまう。
本発明は、このような問題点に着目してなされたものであり、プライマリサイトのオンライン処理を受け付けながらDRシステムのセットアップを実行し、さらに、ログのラップラウンドを防止する技術を提供することにある。
本発明の代表的な一形態では、第1のサイトと、前記第1のサイトとネットワークを介して接続し、前記第1のサイトのデータの複製を格納する第2のサイトとを含むディザスタリカバリシステムであって、前記第1のサイトは、データベース管理システムを備え、クライアントからの要求に応じて参照又は更新処理を実行する第1の計算機と、前記第1の計算機が処理するデータを格納する第1のストレージ装置とを含み、前記第2のサイトは、第2の計算機と、前記第1のストレージ装置に格納されたデータの複製を格納する第2のストレージ装置とを含み、前記第1の計算機は、前記ネットワークと接続する第1の通信インターフェイスと、前記第1のストレージ装置に接続される第1の入出力インターフェイスと、前記第1の入出力インターフェイスに接続される第1のプロセッサと、前記第1のプロセッサに接続される第1のメモリとを備え、前記第1のストレージ装置は、前記第1の計算機及び前記第2のストレージ装置に接続される第2の入出力インターフェイスと、前記第2の入出力インターフェイスに接続される第2のプロセッサと、前記第2のプロセッサに接続される第2のメモリと、前記第1の計算機から書き込み要求がされるデータを格納する第1の記憶装置と、を備え、前記第2の計算機は、前記ネットワークと接続する第3の通信インターフェイスと、前記第2のストレージ装置に接続される第3の入出力インターフェイスと、前記第3の入出力インターフェイスに接続される第3のプロセッサと、前記第3のプロセッサに接続される第3のメモリと、を備え、前記第2のストレージ装置は、前記第1のストレージ装置及び前記第2の計算機に接続される第4の入出力インターフェイスと、前記第4の入出力インターフェイスに接続される第4のプロセッサと、前記第4のプロセッサに接続される第4のメモリと、前記第1のサイトに格納されたデータの複製を格納する第2の記憶装置と、を備え、前記第1の記憶装置は、前記第1の計算機によって処理されるデータを格納する第1のボリューム、前記第1のボリュームの複製であって、静止化された第2のボリューム、及び前記参照又は更新処理のログを格納する第3のボリュームを含み、前記第2の記憶装置は、前記第1のボリュームの複製である第4のボリューム、及び前記第3のボリュームの複製である第5のボリュームを含み、前記第1のストレージ装置は、前記第2のボリュームに格納されたデータのコピー状況を記録する第1のデータ領域コピー状況管理情報を含み、前記第2の計算機は、前記第5のボリュームに格納されたログを前記第4のボリュームに適用し、データを回復させるログ適用部を含み、前記第2のストレージ装置は、前記第4のボリュームに格納されたデータのコピー状況を記録する第2のデータ領域コピー状況管理情報を含み、前記第2のボリュームに格納されたデータは、順次、前記第4のボリュームにコピーされ、前記第1の計算機は、前記クライアントから更新要求を受信したとき、更新されたデータ、及びログを生成して前記第1のストレージ装置に送信し、前記第1のストレージ装置は、前記第1のボリュームに格納された更新対象のデータに対応し、前記第2のボリュームに格納されたデータが、前記第4のボリュームにコピー済みであるか否かを前記第1のデータ領域コピー状況管理情報を参照して判定し、前記第2のボリュームに格納されたデータのコピーが完了していないとき、前記第2のボリュームに格納されたデータを前記第4のボリュームに優先してコピーし、前記生成されたログを前記第3のボリュームに記録し、前記第2のストレージ装置に前記生成されたログを送信し、前記第2のストレージ装置は、受信したログを前記第5のボリュームに記録し、前記第2の計算機に通知し、前記第2の計算機は、前記ログ適用部によって前記第4のボリュームに格納されたデータに前記受信したログを適用するために、前記ログを適用する対象のデータの取得を前記第2ストレージ装置に指示し、第2ストレージ装置は、前記ログ適用対象のデータのコピーが完了しているか否かを前記第2のデータ領域コピー状況管理情報を参照して判定し、前記ログ適用対象のデータのコピーが完了していないときには、コピーが完了するまで待機し、前記第2の計算機に前記ログ適用対象のデータを送信し、前記第2の計算機は、前記ログ適用部によって受信した前記ログ適用対象のデータに前記生成されたログを適用し、前記第4のボリュームに格納することを特徴とする。
本発明の一形態によれば、第1のサイトであるプライマリサイトのオンライン処理を停止せずに、初期コピーを実行することができる。
以下、本発明の実施の形態を添付図面に基づいて説明する。
(第1の実施の形態)
図1は、第1の実施の形態のログベースのDRシステムのハードウェア構成図である。第1の実施の形態のログベースのDRシステムは、プライマリサイト100及びリモートサイト110によって構成される。プライマリサイト100及びリモートサイト110は、ネットワーク1によって接続される。ネットワーク1は、例えば、IPネットワークによって構成される。また、ネットワーク1には、データの処理要求を送信するクライアント80が接続される。
プライマリサイト100は、クライアント80からの処理要求を受信し、オンライン処理を実行する。プライマリサイト100は、データベースサーバ(DBサーバ)2及びストレージ装置3を含む。DBサーバ2及びストレージ装置3は、サーバ・ストレージ間接続インタフェース8によって接続される。サーバ・ストレージ間接続インタフェース8は、例えば、ファイバーチャネルが用いられ、SAN(Storage Area Network)に接続される。
DBサーバ2は、クライアント80からの処理要求を受信し、ストレージ装置3に格納されたデータを処理する。DBサーバ2は、CPU101、メモリ102、通信インターフェイス103及びI/Oインターフェイス104を備える。
CPU101は、メモリ102に格納されたプログラムを実行することによって、各種処理を実行する。メモリ102は、CPU101によって実行されるプログラム及び処理に必要なデータを記憶する。通信インターフェイス103は、ネットワーク1と接続し、クライアント80からの処理要求を受信する。I/Oインターフェイス104は、サーバ・ストレージ間接続インタフェース8を介してストレージ装置3と接続する。
ストレージ装置3は、DBサーバ2によって処理されるデータ及びログを格納する。ログとは、DBサーバ2の更新作業の履歴であり、更新前のデータにログを適用することでDBの再構築が可能なものである。例えば、ログは、DBサーバ2が実行したトランザクションログ又はDBサーバ2が受信した業務に関するすべてのSQLコマンドである。
ストレージ装置3は、CPU121、メモリ122、ディスクドライブ105〜107及びI/Oインターフェイス124を備える。
CPU121は、メモリ122に格納されたプログラムを実行することによって、各種処理を実行する。メモリ122は、CPU121によって実行されるプログラム及び処理に必要なデータを記憶する。ディスクドライブ105〜107は、DBサーバ2が処理するデータ及びログを格納する。
I/Oインターフェイス124は、サーバ・ストレージ間接続インタフェース8を介して、DBサーバ2と接続する。さらに、I/Oインターフェイス124は、後述するリモートサイト110のストレージ装置13と接続する。ストレージ装置3は、ストレージ装置13とストレージ装置間接続インタフェース9によって接続される。ストレージ装置間接続インタフェース9は、例えば、ファイバーチャネルが用いられ、SANに接続される。
リモートサイト110は、プライマリサイト100に格納された業務データの複製を生成及び格納する。リモートサイト110は、簡易サーバ12及びストレージ装置13を含む。簡易サーバ12及びストレージ装置13は、サーバ・ストレージ間接続インタフェース18によって接続される。サーバ・ストレージ間接続インタフェース18は、例えば、ファイバーチャネルが用いられ、SANに接続される。
簡易サーバ12は、プライマリサイト100に格納された業務データの複製を生成する。簡易サーバ12は、初期コピーされたデータに対してログを適用することによってデータを回復させる機能を有する。なお、簡易サーバ12は、DBサーバ2の処理を代替可能なデータベースサーバであってもよい。簡易サーバ12は、CPU111、メモリ112、通信インターフェイス113及びI/Oインターフェイス114を備える。
CPU111は、メモリ112に格納されたプログラムを実行することによって、各種処理を実行する。メモリ112は、CPU111によって実行されるプログラム及び処理に必要なデータを記憶する。通信インターフェイス113は、ネットワーク1と接続し、システムに障害が発生したときの回復要求などを受け付ける。I/Oインターフェイス114は、サーバ・ストレージ間接続インタフェース18を介してストレージ装置13と接続する。
ストレージ装置13は、プライマリサイト100に格納されたデータの複製及びログの複製を格納する。ストレージ装置13は、CPU131、メモリ132、I/Oインターフェイス134及びディスクドライブ115及び116を備える。
CPU121は、メモリ122に格納されたプログラムを実行することによって、各種処理を実行する。メモリ122は、CPU121によって実行されるプログラム及び処理に必要なデータを記憶する。I/Oインターフェイス124は、サーバ・ストレージ間接続インタフェース18を介して、簡易サーバ2と接続する。さらに、前述のように、I/Oインターフェイス124は、ストレージ装置間接続インタフェース9を介してプライマリサイト100のストレージ装置3と接続する。ディスクドライブ115及び116は、プライマリサイト100に格納されたデータ及びログの複製を格納する。
ストレージ装置3とストレージ装置13とは、一方のディスクドライブをコピー元に、他方のディスクドライブをコピー先に予め設定しておくことで、ストレージ装置間接続インタフェース9を介して直接コピーすることができる。
図2Aは、第1の実施の形態のプライマリサイト100のブロック図である。プライマリサイト100は、前述のように、DBサーバ2及びストレージ装置3を含む。
DBサーバ2は、データベース管理システム(DBMS)201を含む。DBMS201は、格納されたデータに対する処理要求を受け付け、処理要求に応じてデータを取得及び更新する。また、DBMS201は、トランザクション実行部211及びログ生成部212を含む。
トランザクション実行部211は、要求されたデータボリューム7のデータを取得又は更新する。トランザクションとは、データベースサーバの一連の処理を複数まとめた処理単位であり、処理全体がすべて実行されるか全く実行されないかのいずれかとなる。業務システムでは、トランザクション単位で処理することによって、DBに不整合の発生を防いでいる。
ログ生成部212は、トランザクション実行部211によって実行された処理の履歴を生成し、ストレージ装置3のログボリューム5に格納する。
ストレージ装置3は、ストレージ装置制御部4及びディスクドライブ105〜107を備える。
ディスクドライブ105は、ログボリューム5を含む。ログボリューム5には、DBの更新作業の履歴を示すログが格納される。
ディスクドライブ107は、データボリューム7を含む。データボリューム7には、オンライン処理のデータ、オンライン処理に必要なデータ及びDBサーバ2の内部で使用されるデータなどが格納される。
ディスクドライブ106は、ミラーボリューム6を含む。ミラーボリューム6は、静止化されたデータボリューム7の複製が格納される。
ストレージ装置制御部4は、DBMS201からの処理要求を受信し、各ディスクドライブに格納されたデータを取得及び更新する。また、ストレージ装置制御部4は、データの取得又は更新が完了すると、DBサーバ2に通知する。
ストレージ装置制御部4は、キャッシュメモリ21、データ領域算出部22、初期コピー操作部23及びデータ領域コピー状況管理テーブル24を含む。
キャッシュメモリ21は、データを一時的に格納し、読み書きを高速に処理する。データ領域算出部22は、DBサーバ2からの処理要求によって更新されるデータが含まれるデータ領域を特定する。
データ領域コピー状況管理テーブル24は、ミラーボリューム6のデータ領域に対応したビットマップであり、バックアップデータボリューム16にコピーが完了したデータ領域にフラグが設定される。
初期コピー操作部23は、DBサーバ2から更新要求を受信したとき、更新対象となる領域をデータ領域コピー状況管理テーブル24と照合し、更新対象の領域がリモートサイト110にコピーされていなければ優先的にコピーする。
図2Bは、第1の実施の形態のリモートサイト110のブロック図である。リモートサイト110は、前述のように、簡易サーバ12とストレージ装置13を含む。
簡易サーバ12は、ログ適用部30を含む。ログ適用部30は、プライマリサイト100からコピーされたログを適用し、ストレージ装置13に格納されるプライマリサイト100に格納されたデータの複製を最新状態に維持する。
ストレージ装置13は、ストレージ装置制御部14、ディスクドライブ115及び116を備える。
ディスクドライブ115は、バックアップログボリューム15を含む。バックアップログボリューム15は、プライマリサイト100で実行された処理のログがコピーされる。
ディスクドライブ116は、バックアップデータボリューム16を含む。バックアップデータボリューム16は、プライマリサイト100に格納された業務データの複製を格納する。
ストレージ装置制御部14は、各ディスクドライブに格納されたデータを取得及び更新する。また、ストレージ装置制御部14は、ストレージ装置間インターフェイス9を介してバックアップログボリューム15が更新された場合には、簡易サーバ12に通知する。
ストレージ装置制御部14は、キャッシュメモリ31、データ領域算出部32、DB更新制御部33及びデータ領域コピー状況管理テーブル34を含む。
キャッシュメモリ31は、データを一時的に格納し、読み書きを高速に処理する。データ領域算出部22は、簡易サーバ12の処理要求に対応するログボリューム15及びデータボリューム16のデータ領域を特定する。データ領域算出部32は、取得対象となるバックアップログボリューム15及びバックアップデータボリューム16のデータ領域を特定する。
データ領域コピー状況管理テーブル34は、バックアップデータボリューム16のデータ領域に対応したビットマップであり、ミラーボリューム6からのコピーが完了したデータ領域にフラグが設定される。
DB更新制御部33は、ログ適用部30がデータの取得を要求したとき、データ領域コピー状況管理テーブル34と照合し、取得対象のデータ領域のコピーが完了していない場合には、完了するまでログ適用部30の処理を待機させる。
図3は、第1の実施の形態のログベースのDRシステムのブロック図である。ここで、プライマリサイト100に格納された最新状態のデータの複製をリモートサイト110に作成する手順を説明する。
リモートサイト110に格納されたデータを最新状態に維持するためには、ある時点で静止化されたデータ及び静止化された時点以降のログを必要とする。そこで、第1の実施の形態では、静止化されたミラーボリューム6をバックアップデータボリューム16に初期コピーを実行する。そして、プライマリサイト100でオンライン処理を開始した後、プライマリサイト100のログと同期コピーされたログを初期コピーされたデータに随時適用することによって、リモートサイト110のデータを最新状態に維持することができる。
ここで、初期コピーの手順を説明する前にDRシステムの初期設定について説明する。具体的には、DBMSの設定及びストレージ装置の設定などの実行環境の構築である。例えば、プライマリサイト100では、DBサーバ2からデータボリューム7及びログボリューム5にアクセス可能となるように設定する。
次に、DBサーバ2は、ローカルミラーによってデータボリューム7に格納された業務データをミラーボリューム6にコピーする。DBサーバ2は、すべてのデータのコピーが完了すると、ローカルミラーを解除する。したがって、ミラーボリューム6には、初期設定時のデータボリューム7の複製が格納され、オンライン処理の受付を開始した後であっても静止化された状態となる。
一方、リモートサイト110では、簡易サーバ12からバックアップデータボリューム16及びバックアップログボリューム15にアクセス可能となるように設定する。さらに、ストレージ装置3及びストレージ装置13がストレージ装置間接続インタフェース9を介して相互に通信可能となるように設定する。例えば、DBサーバ2及び簡易サーバ12を経由せずに各ストレージ装置がデータを相互にコピーするリモートコピー機能の初期設定をする。
初期設定が完了すると、初期コピーを開始する。初期コピーには、データ領域の先頭アドレスから順にコピーするシーケンシャルコピーと、特定のデータ領域を優先的にコピーする優先コピーの2種類が含まれる。
プライマリサイト100は、初期コピーが開始されると、プライマリサイト100のDBサーバ2でオンライン処理の受付を開始する。初期コピーが完了していないデータが更新されると、更新対象のデータに対して優先的にコピーする。
以下、図3を参照しながら、初期コピー制御処理を説明する。矢印1000〜1008は、処理を示している。なお、矢印に付された符号は、処理順序を示すものではない。
(初期コピー制御処理第1ステップ1000)
ステップ1000では、クライアント80からネットワーク1を介してDBサーバ2にオンライン処理要求が送信される。オンライン処理要求は、ネットワーク1のプロトコルに従って送信され、DBサーバ2に実行させる処理を含む。例えば、TCP/IPプロトコルに従って、SQLコマンドの組み合わせが送信される。
DBサーバ2は、送信されたオンライン処理要求を受信してオンライン処理を実行する。例えば、DBサーバ2は、オンライン処理要求に含まれるSQLコマンドを解析し、データの更新などの要求された処理を実行する。
(初期コピー制御処理第2ステップ1001)
ステップ1001では、ステップ1000で受信したオンライン処理要求に従って、ストレージ装置3に格納されたデータを取得又は更新する。
DBサーバ2は、サーバ・ストレージ接続インタフェース8を介してストレージ装置制御部4にデータの取得又は更新を指示する。例えば、DBサーバ2にホストバスアダプタを装着し、ファイバーチャネルを通じてSCSIコマンドをディスクコントローラに送信する。また、DBサーバ2は、データを更新する処理を伴う場合には、ログの更新もストレージ装置制御部4に指示する。
なお、ログ及びデータを更新する方法は、更新要求ごとに実行する方法のほか、トランザクション単位で実行する方法、又はDBサーバ2のバッファ容量又は一定時間の経過などDBサーバ2が指定する入出力の単位で実行する方法であってもよい。また、第1の実施の形態では、簡単のためDBサーバ2からストレージ装置3に対する書き込み要求を1回の書き込み要求のように図示したが、通常は異なるディスクドライブに対する書き込み要求は、複数に分割されて送信される。
(初期コピー制御処理第3ステップ1002)
ステップ1002では、更新対象のデータ領域に書き込む。データの更新要求を受信したストレージ装置制御部4は、更新対象となるデータ領域をデータ領域算出部22によって特定し、データボリューム7及びログボリューム5を更新する。
(初期コピー制御処理第4ステップ1003)
ステップ1003は、データボリューム7の更新に対応するデータ領域のコピー進捗状況をチェックする。ストレージ装置制御部4は、データボリューム7のデータが更新されると、データ領域コピー状況管理テーブル24を参照し、更新されたデータに対応するミラーボリューム6のデータが格納されたデータ領域がリモートサイト110にコピー済みか否かを判定する。ストレージ装置制御部4は、コピーが完了している場合には、そのまま処理を継続する。
一方、コピーが完了していない場合には、初期コピー操作部23は、シーケンシャルコピーの進捗状況にかかわらず、対応するミラーボリューム6のデータ領域を優先してバックアップデータボリューム16にコピーする。具体的には、まず、初期コピー操作部23がストレージ装置間接続インタフェース9を介してリモートサイト110に更新データを送信する。ストレージ装置制御部14は、バックアップデータボリューム16に受信した更新データを書き込み、DBサーバ2に書き込みが完了した旨を通知する。DBサーバ2は、更新データを書き込みが完了した旨の通知を受信すると、データ領域コピー状況管理テーブル24にコピー済である旨を登録する。例えば、データ領域コピー状況管理テーブル24は、コピーが完了した領域に対応するレコードには“1”が設定され、コピーが完了していない領域に対応するレコードには“0”が設定される。
(初期コピー制御処理第5ステップ1004)
ステップ1004では、ログボリューム5の更新をバックアップログボリューム15に反映させる。
ストレージ装置制御部4は、ストレージ装置間接続インタフェース9を介してストレージ装置制御部14にログボリューム5の更新内容を送信し、バックアップログボリューム15の更新を指示する。ストレージ装置制御部14は、バックアップログボリューム15に受信したログボリューム5の更新内容を書き込む。ストレージ装置制御部4は、書き込み完了後、DBサーバ2にログの書き込みが完了した旨を通知する。
また、第1の実施の形態では、ログボリューム5が更新されると、バックアップログボリューム15に更新内容を反映させる同期コピーを採用しているが、一定時間間隔でコピーする非同期コピーであってもよい。
(初期コピー制御処理第6ステップ1005)
ステップ1005は、初期設定完了後から継続して実行されているシーケンシャルコピーの処理である。
ストレージ装置制御部4は、ストレージ装置間接続インタフェース9を介して、ストレージ装置制御部14に、コピーが完了していないミラーボリューム6のデータを、格納されたデータ領域のアドレスが小さい順に送信する。ストレージ装置制御部14は、送信されたデータを受信し、バックアップデータボリューム16の対応するデータ領域を更新する。ストレージ装置制御部4は、更新完了後、データ領域コピー状況管理テーブル24に、コピーの完了したデータ領域がコピー済みである旨を登録する。
また、初期コピーの進捗は、リモートサイト110のストレージ装置13に格納されたデータ領域コピー状況管理テーブル34にも登録される。データ領域コピー状況管理テーブル34は、データ領域コピー状況管理テーブル24と同様に、コピーが完了した領域に対応するレコードには“1”が設定され、コピーが完了していない領域に対応するレコードには“0”が設定される。
(初期コピー制御処理第7ステップ1006)
ステップ1006では、バックアップログボリューム15の更新が完了すると、簡易サーバ12に更新の完了を通知する。簡易サーバ12に通知する方法としては、例えば、簡易サーバ12から更新通知を要求する専用コマンドの応答としてストレージ装置制御部14が通知する方法がある。また、ストレージ装置制御部14からバックアップログボリューム15の更新を通知する専用の割り込みインタフェースを簡易サーバ12に設けてもよい。
なお、ストレージ装置制御部14の簡易サーバ12に対する通知は、更新が発生するたびに通知する方法に限定する必要はなく、一定時間間隔ごとに通知する方法であってもよい。
(初期コピー制御処理第8ステップ1007、1008)
ステップ1007及び1008では、簡易サーバ12がバックアップログボリューム15の更新通知を受信し、ログ適用部30がバックアップデータボリューム16に更新されたログを適用する。
簡易サーバ12は、まず、ログ適用部30によってバックアップログボリューム15の更新されたログを取得する。
次に、ログ適用部30は、取得したログを適用する対象のデータ領域をバックアップデータボリューム16から取得する。ログ適用部30は、サーバ・ストレージ間接続インタフェース18を介してストレージ装置制御部14にデータ領域の取得要求を通知する。
ストレージ装置制御部14は、データ領域の取得要求を受信すると、データ領域算出部32によって取得対象のデータ領域を特定する。
さらに、DB更新制御部33は、データ領域コピー状況管理テーブル34を参照して、取得対象のデータ領域がコピー済であるか否かを判定する。そして、コピーが完了している場合には、要求されたデータ領域の内容を取得してログ適用部30に送信する。
一方、取得対象のデータ領域のコピーが完了していない場合には、コピーが完了するまで待機する。なお、取得対象のデータ領域のコピーが完了していない場合であっても、ステップ1003の処理(優先コピー)が実行されるため、対象のデータ領域のコピーは早期に完了する。
ログ適用部30は、更新対象のデータ領域を取得すると、ログを適用し、更新後のデータの書き込み要求をストレージ装置制御部14に送信する(ステップ1007)。
ストレージ装置制御部14は、受信した書き込み要求に従って、バックアップデータボリューム16を更新する(ステップ1008)。
以上のように、オンライン処理によってプライマリサイト100のデータが更新されるたびに、ログ適用の対象となるデータをリモートサイト110に優先的にコピーすることによって、オンライン処理とログ適用を並列して実行することができる。
また、優先コピーの対象でないデータ領域についてもシーケンシャルコピーによってミラーボリューム6に格納されたデータ全体をバックアップデータボリューム16にコピーできることを保証できる。
また、プライマリサイト100とリモートサイト110とが1対1に対応する構成で説明したが、プライマリサイト100から複数のリモートサイト110にデータを複製する構成としてもよい。
続いて、第1の実施の形態のプライマリサイト100のDBサーバ2及びストレージ装置3、リモートサイト110の簡易サーバ12及びストレージ装置13の処理手順について説明する。
図4は、第1の実施の形態のプライマリサイト100のDBサーバ2の処理手順を示すフローチャートである。図4は、初期設定及び更新時のオンライン処理の処理手順を示す。
DBサーバ2では、データベースの構築及びディスクドライブの割り当てなどの初期設定が実行される(401)。また、DBサーバ2は、ストレージ装置3の初期設定及びリモートサイト110の初期設定が完了するまで待機する(402)。具体的には、プライマリサイト100及びリモートサイト110のストレージ装置間の設定及びリモートサイト110の簡易サーバ12の環境構築などの処理が完了するまで待機する。
DBサーバ2は、プライマリサイト100及びリモートサイト110の初期設定が完了すると、クライアント80からのオンライン処理要求の受付を開始する(403)。例えば、インターネット経由で処理される商取引の商品管理などがオンライン処理に該当する。
DBサーバ2は、オンライン処理要求を受け付けると、オンライン処理を実行する(404の結果が「Yes」)。オンライン処理要求がデータの更新を伴う場合には、ログ生成部26は、ログを生成する(405A)。そして、トランザクション実行部27は、ストレージ装置3にログの書き込み要求を送信し(405B)、ログの書き込みが完了すると、書込完了報告を受信する(406)。
続いて、トランザクション実行部27は、データの更新要求をストレージ装置3に送信し(407)、データの更新が完了すると、更新完了報告を受信する(408)。
更新完了報告を受信すると、DBサーバ2は、オンライン処理要求を再び受け付けるまで待機する。
図5は、第1の実施の形態のリモートサイト110の簡易サーバ12のログ適用処理の処理手順を示すフローチャートである。
リモートサイト110では、ログ適用によってプライマリサイト100に格納されたデータの複製を格納するため、プライマリサイト100の設定に応じて初期設定される(501)。例えば、プライマリサイト100からデータがコピーされるディスクドライブなどが設定される。
さらに、バックアップログボリューム15の更新を検知する設定が実行される(502)。プライマリサイト100のログボリューム5が更新されると、バックアップログボリューム15には、ストレージ装置間接続インタフェース9を介してストレージ装置13が受信した更新内容が記録される。このとき、簡易サーバ12は、バックアップログボリューム15の更新を検出する。更新を検出する方法には、例えば、バックアップログボリューム15が更新されるとストレージ装置13が簡易サーバ12に通知する方法、又は簡易サーバ12が定期的にバックアップログボリューム15の更新を確認する方法などがある。
以上の設定が完了すると、簡易サーバ12は、ログ適用処理の受付を開始する(503)。簡易サーバ12は、バックアップログボリューム15の更新を検出すると(504の結果が「Yes」)、ログ適用部30によってログ適用処理を実行する。
ログ適用部30は、更新されたログをバックアップログボリューム15から取得し、バックアップデータボリューム16から更新対象のデータを取得する(505)。さらに、ログ適用部30は、取得したデータに更新されたログを適用し、データを更新する(506)。更新されたデータは、ログ適用部30によって、ストレージ装置13に送信され、バックアップデータボリューム16に書き込まれる(507)。簡易サーバ12は、データの更新が完了すると、ストレージ装置13からの更新完了報告を受信する(508)。その後、簡易サーバ12は、バックアップログボリューム15の更新の検出を再び待機する。
以上のようにして、バックアップデータボリューム16の内容をプライマリサイト100のデータボリューム7の内容と一致させることができる。
図6は、第1の実施の形態のプライマリサイト100のストレージ装置3のオンライン処理手順のフローチャートについて説明する。
ストレージ装置3では、まず、ディスクドライブ105〜107をDBサーバ2に割り当てるなどの初期設定が実行される(601)。また、プライマリサイト100のログボリューム5とリモートサイト110のバックアップログボリューム15とが対応付けられ、同期コピーの設定が実行される(602)。なお、ボリュームの対応付けを設定する前に、リモートサイト110の簡易サーバ12とストレージ装置13の初期設定が完了している必要がある。
以上の設定が完了すると、ストレージ装置3は、参照及び更新処理の受付を開始し(603)、DBサーバ2からのデータ更新要求などのオンライン処理要求を待機する(604)。ストレージ装置3のストレージ装置制御部4は、処理要求を受信すると(604の結果が「Yes」)、処理要求が更新要求であるか否かを判定する(605)。
ストレージ装置制御部4は、受信した処理要求が更新要求でない場合には(605の結果が「No」)、参照要求された情報をDBサーバ2に送信し(611)、DBサーバ2に参照完了報告を送信する(612)。なお、実際にはディスクドライブのコントロールなどの要求も受信するが、参照要求にこれらの要求が含まれているものとしている。
ストレージ装置制御部4は、受信した処理要求が更新要求の場合には(605の結果が「Yes」)、更新データをストレージ装置3の指定されたボリュームに記録する(606)。
さらに、更新されたボリュームがリモートサイト110に同期コピーが設定されたボリュームであるか否かを判定する(607)。更新されたボリュームが同期コピーの対象でなかった場合には(607の結果が「No」)、DBサーバ2に書込完了報告を送信する(610)。
一方、更新されたボリュームが同期コピーの対象であった場合には(607の結果が「Yes」)、リモートサイト110のストレージ装置13に更新要求及び更新内容を送信する(608)。そして、ストレージ装置13からの更新完了報告を待機し(609)、更新完了報告を受信すると、DBサーバ2に書込完了報告を送信する(610)。
図7は、第1の実施の形態のプライマリサイト100のストレージ装置3で実行されるシーケンシャルコピーの処理手順を示すフローチャートである。
ストレージ装置3では、まず、データボリューム7をローカルミラーによって二重化し、ミラーボリューム6を作成するなどの初期設定が実行される(701)。ミラーボリューム6の作成が完了すると、データボリューム7とミラーボリューム6をスプリットし、ミラーボリューム6を静止化させる。そして、プライマリサイト100のミラーボリューム6をリモートサイト110のバックアップデータボリューム16に対応付けるなど、初期コピーの設定が実行される(702)。
続いて、ストレージ制御部4は、データ領域コピー状況テーブル24を初期化する(703)。データ領域コピー状況テーブル24は、前述のように、ミラーボリューム6のデータ領域に対応したビットマップである。初期化とは、例えば、ビットマップに格納された全データ領域に対応するレコードに“0”を設定することである。
以上の設定が完了すると、ストレージ制御部4は、ミラーボリューム6からバックアップデータボリューム16にシーケンシャルコピーを開始する。ストレージ制御部4は、シーケンシャルコピーが開始されると、データ領域コピー状況テーブル24を参照してコピー状況を監視する。
ストレージ制御部4は、ミラーボリューム6の全データ領域のコピーが完了したならば、データの初期コピーを終了する(704の結果が「Yes」)。具体的には、データ領域コピー状況テーブル24のビットマップに格納された全データ領域に対応するレコードに“1”が設定されたとき、データの初期コピーを終了する。
また、初期コピーが完了していないデータ領域が存在する場合には(704の結果が「No」)、ストレージ制御部4は、データ領域コピー状況テーブル24を参照し、コピーが完了していないデータ領域でアドレスが最小となる領域に格納されたデータをコピーする(705)。ストレージ制御部4は、データ領域コピー状況テーブル24のコピーが完了したデータ領域に該当する部分を更新する(706)。そして、ストレージ制御部4は、ミラーボリューム6の全データ領域のコピーが完了したか否かを判定し、完了していなければ全データ領域のコピーが完了するまで処理を継続する。また、ストレージ制御部4は、全データ領域のコピーが完了していれば(704の結果が「Yes」)、ミラーボリューム6をDRシステムから開放し(707)、初期コピーを終了する。
なお、707の処理では、DRシステムからミラーボリューム6を開放しているが、第1の実施の形態のログベースのDRシステムでは、初期コピー完了後にミラーボリューム6を使用する必要がない。初期コピーが完了すると、プライマリサイト100から転送されたログをバックアップデータボリューム16に適用することによって、リモートサイト110に格納されたデータを最新の状態に維持できるからである。
図8は、第1の実施の形態のプライマリサイト100のストレージ装置3で実行される優先コピーの処理手順を示すフローチャートである。
ストレージ制御部4は、まず、DBサーバ2から処理要求として更新要求を受信すると(801の結果が「Yes」)、更新対象となるデータ領域を特定する(802)。そして、特定されたデータ領域の初期コピーが完了しているか否かをデータ領域コピー状況テーブル24を参照して判定する(803)。
ストレージ制御部4は、特定されたデータ領域の初期コピーが完了していなければ(803の結果が「No」)、特定されたデータ領域を優先してバックアップデータボリューム16にコピーする(804)。ストレージ制御部4は、コピー完了後、データ領域コピー状況テーブル24を更新する(805)。
また、ストレージ制御部4は、該当するデータ領域がバックアップデータボリューム16にコピーされていれば(803の結果が「Yes」)、全データ領域のコピーが完了したか否かを確認する(806)。ストレージ制御部4は、全データ領域のコピーが完了していれば(806の結果が「Yes」)、ミラーボリューム6をDRシステムから開放し(807)、初期コピーを終了する。ストレージ制御部4は、全データ領域のコピーが完了していなければ(806の結果が「No」)、全データ領域のコピーが完了するまで処理を継続する。
このように、ストレージ装置3は、業務データを格納したデータボリューム7を二重化することによって、オンライン処理に影響を与えずに初期コピーを実行することができる。また、初期コピーでは、データ領域の先頭から順次、コピーするシーケンシャルコピーと、更新要求があったデータ領域を優先的にコピーする優先コピーが並行して実行される。
図9は、第1の実施の形態のリモートサイト110のストレージ装置13で実行される処理の手順を示すフローチャートである。
ストレージ装置13では、まず、ストレージ装置3とのリモートコピーの設定などの初期設定が実行される(901)。さらに、データが更新されたときに簡易サーバ12に通知するボリュームが指定される(902)。具体的には、通知先にはバックアップログボリューム15が指定される。バックアップログボリューム15が更新されると、バックアップデータボリューム16に更新されたログを適用するために簡易サーバ12に通知する必要があるからである。
以上の設定が完了すると、ストレージ装置13は、参照及び更新処理の受付を開始し(903)、ストレージ装置3又は簡易サーバ12からの処理要求を受信可能な状態となる。ストレージ装置制御部14は、処理要求を受信すると(904の結果が「Yes」)、受信した処理要求が更新要求か否かを判定する(905)。
ストレージ装置制御部14は、受信した処理要求が更新要求であった場合には(905の結果が「Yes」)、ディスクドライブに要求されたデータを書き込む(906)。データの書き込みが完了すると、ストレージ装置制御部14は、要求元に書込完了報告を送信する(907)。また、ストレージ装置制御部14は、簡易サーバ12に通知する必要があるか否かを判定し(908)、通知する必要があれば、簡易サーバ12に更新を通知する(909)。
一方、ストレージ装置制御部14は、受信した処理要求が更新要求でなければ、参照対象となるデータ領域のコピー状況をデータ領域コピー状況テーブル24を参照し、初期コピーが完了しているか否かを判定する(910)。初期コピーが完了してなければ(910の結果が「No」)、コピーが完了するまで待機する(911)。ストレージ制御部14は、コピーが完了していれば(910の結果が「Yes」)、参照要求されたデータを要求元に送信し(912)、さらに、情報転送完了報告を送信する(913)。
このように、リモートサイト110のストレージ装置13は、プライマリサイト100からの更新要求と、リモートサイト110の簡易サーバからの参照及び更新要求に応答し、必要な処理を実行する。更新要求においては、更新対象となるディスクドライブのデータ領域のコピー状況を確認し、コピーされていない場合は待機させることにより、オンライン処理と並行してログ適用処理を実行することができる。
前述したように、第1の実施の形態によれば、ミラーボリューム6を作成してデータボリューム7を二重化することによって、初期コピーが完了する前にオンライン処理を開始することができる。
また、第1の実施の形態によれば、初期コピーが完了していないデータが更新された場合には、更新対象のデータを優先してバックアップデータボリューム16にコピーする。そして、コピーの完了を待ってログを適用し、データを最新状態に維持する。したがって、初期コピーに膨大な時間を要する場合であっても、ログのラップラウンドを生じさせることがなく、DRシステムのセットアップを容易にすることができる。
(第2の実施の形態)
第1の実施の形態では、プライマリサイト100のデータボリューム7を二重化することによって、オンライン処理と初期コピー処理を並行して実行する。第2の実施の形態では、データボリューム7を非同期にコピーすることによって、DBを二重化せずに、オンライン処理と初期コピー処理を並行して実行する。
図10は、第2の実施の形態のログベースのDRシステムのブロック図である。なお、第1の実施の形態と同様の機能を果たす構成には同一の符号を付して重複する説明を適宜省略する。
第2の実施の形態のDRシステムでは、第1の実施の形態のミラーボリュームに対応するボリュームを備えていない。したがって、データボリューム7が更新され、優先コピーが実行されると、更新後のデータがバックアップデータボリューム16にコピーされる(1009)。
また、第2の実施の形態では、データボリューム7及びログボリューム5を更新した後、リモートサイト110に対する更新データのコピーの完了を待機せずにDBサーバ2に書込完了通知を送信する。このように、リモートサイト110に更新データを非同期でコピーすることによって、オンライン処理と並行して初期コピーを実行することができる。ただし、プライマリサイト100でデータが更新された直後にストレージ装置間インターフェース9に障害が発生すると、リモートサイト110にデータの更新が反映されない場合がある。
前述したように、第2の実施の形態によれば、第1の実施の形態と同様に、DBを二重化することなく、初期コピーが完了する前にプライマリサイト100のオンライン処理を開始することができる。また、第1の実施の形態と同様に、ログのラップラウンドを防止してセットアップを容易にすることができる。
本発明は、以上説明した実施形態に限定されることなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。
例えば、第1の実施の形態及び第2の実施の形態では、初期コピー操作部及びデータ領域コピー状況管理テーブルをプライマリサイト100のストレージ装置3に備えているが、DBサーバ2に備えていてもよい。この場合、DBサーバ2においてデータ領域コピー状況管理テーブルを参照して初期コピーの進捗状況を確認し、ログを適用する対象のデータ領域を転送するコマンドをストレージ装置3に発行させればよい。
本発明は、災害等による障害に備えてサイト間でデータをコピーする情報処理システムに利用可能である。
第1の実施の形態のログベースのDRシステムのハードウェア構成図である。 第1の実施の形態のプライマリサイトの構成を示すブロック図である。 第1の実施の形態のリモートサイトの構成を示すブロック図である。 第1の実施の形態のログベースのDRシステムのブロック図である。 第1の実施の形態のプライマリサイトのデータベースサーバのオンライン処理を示すフローチャートである。 第1の実施の形態のリモートサイトの簡易サーバのログ適用処理を示すフローチャートである。 第1の実施の形態のプライマリサイトのストレージ装置の参照及び更新処理を示すフローチャートである。 第1の実施の形態のプライマリサイトのストレージ装置のシーケンシャルコピーの手順を示すフローチャートである。 第1の実施の形態のプライマリサイトのストレージ装置の優先コピーの手順を示すフローチャートである。 第1の実施の形態のリモートサイトのストレージ装置の参照及び更新処理を示すフローチャートである。 第2の実施の形態のログベースのDRシステムのブロック図である。
符号の説明
1 ネットワーク
2 データベースサーバ
3、13 ストレージ装置
4、14 ストレージ装置制御部
5 ログボリューム
6 ミラーボリューム
7 データボリューム
15 バックアップログボリューム
16 バックアップデータボリューム
8、18 サーバ・ストレージ間接続インタフェース
9 ストレージ装置間接続インタフェース
12 簡易サーバ
21、31 キャッシュメモリ
22、32 データ領域算出部
23 初期コピー操作部
24、34 データ領域コピー状況管理テーブル
30 ログ適用部
33 DB更新制御部
100 プライマリサイト
110 リモートサイト
105、106、107、115、116 ディスクドライブ

Claims (13)

  1. 第1のサイトと、前記第1のサイトとネットワークを介して接続し、前記第1のサイトのデータの複製を格納する第2のサイトとを含むディザスタリカバリシステムであって、
    前記第1のサイトは、データベース管理システムを備え、クライアントからの要求に応じて参照又は更新処理を実行する第1の計算機と、前記第1の計算機が処理するデータを格納する第1のストレージ装置とを含み、
    前記第2のサイトは、第2の計算機と、前記第1のストレージ装置に格納されたデータの複製を格納する第2のストレージ装置とを含み、
    前記第1の計算機は、前記ネットワークと接続する第1の通信インターフェイスと、前記第1のストレージ装置に接続される第1の入出力インターフェイスと、前記第1の入出力インターフェイスに接続される第1のプロセッサと、前記第1のプロセッサに接続される第1のメモリとを備え、
    前記第1のストレージ装置は、前記第1の計算機及び前記第2のストレージ装置に接続される第2の入出力インターフェイスと、前記第2の入出力インターフェイスに接続される第2のプロセッサと、前記第2のプロセッサに接続される第2のメモリと、前記第1の計算機から書き込み要求がされるデータを格納する第1の記憶装置と、を備え、
    前記第2の計算機は、前記ネットワークと接続する第3の通信インターフェイスと、前記第2のストレージ装置に接続される第3の入出力インターフェイスと、前記第3の入出力インターフェイスに接続される第3のプロセッサと、前記第3のプロセッサに接続される第3のメモリと、を備え、
    前記第2のストレージ装置は、前記第1のストレージ装置及び前記第2の計算機に接続される第4の入出力インターフェイスと、前記第4の入出力インターフェイスに接続される第4のプロセッサと、前記第4のプロセッサに接続される第4のメモリと、前記第1のサイトに格納されたデータの複製を格納する第2の記憶装置と、を備え、
    前記第1の記憶装置は、前記第1の計算機によって処理されるデータを格納する第1のボリューム、前記第1のボリュームの複製であって、静止化された第2のボリューム、及び前記参照又は更新処理のログを格納する第3のボリュームを含み、
    前記第2の記憶装置は、前記第1のボリュームの複製である第4のボリューム、及び前記第3のボリュームの複製である第5のボリュームを含み、
    前記第1のストレージ装置は、前記第2のボリュームに格納されたデータのコピー状況を記録する第1のデータ領域コピー状況管理情報を含み、
    前記第2の計算機は、前記第5のボリュームに格納されたログを前記第4のボリュームに適用し、データを回復させるログ適用部を含み、
    前記第2のストレージ装置は、前記第4のボリュームに格納されたデータのコピー状況を記録する第2のデータ領域コピー状況管理情報を含み、
    前記第2のボリュームに格納されたデータは、順次、前記第4のボリュームにコピーされ、
    前記第1の計算機は、前記クライアントから更新要求を受信したとき、更新されたデータ、及びログを生成して前記第1のストレージ装置に送信し、
    前記第1のストレージ装置は、
    前記第1のボリュームに格納された更新対象のデータに対応し、前記第2のボリュームに格納されたデータが、前記第4のボリュームにコピー済みであるか否かを前記第1のデータ領域コピー状況管理情報を参照して判定し、
    前記第2のボリュームに格納されたデータのコピーが完了していないとき、前記第2のボリュームに格納されたデータを前記第4のボリュームに優先してコピーし、
    前記生成されたログを前記第3のボリュームに記録し、前記第2のストレージ装置に前記生成されたログを送信し、
    前記第2のストレージ装置は、受信したログを前記第5のボリュームに記録し、前記第2の計算機に通知し、
    前記第2の計算機は、前記ログ適用部によって前記第4のボリュームに格納されたデータに前記受信したログを適用するために、前記ログを適用する対象のデータの取得を前記第2ストレージ装置に指示し、
    第2ストレージ装置は、
    前記ログ適用対象のデータのコピーが完了しているか否かを前記第2のデータ領域コピー状況管理情報を参照して判定し、
    前記ログ適用対象のデータのコピーが完了していないときには、コピーが完了するまで待機し、
    前記第2の計算機に前記ログ適用対象のデータを送信し、
    前記第2の計算機は、前記ログ適用部によって受信した前記ログ適用対象のデータに前記生成されたログを適用し、前記第4のボリュームに格納することを特徴とするディザスタリカバリシステム。
  2. 前記第1のストレージ装置は、前記第2のボリュームに格納された全てのデータを前記第4のボリュームにコピーし終えたとき、前記第2のボリュームを開放することを特徴とする請求項1に記載のディザスタリカバリシステム。
  3. 前記第1のストレージ装置は、前記生成されたログを前記第5のボリュームに順次コピーすることを特徴とする請求項1に記載のディザスタリカバリシステム。
  4. 前記第2の計算機は、前記第2のボリュームのデータが前記第4のボリュームにコピーされている間に、前記生成されたログが前記第5のボリュームに記録されたことを前記第2のストレージ装置から通知を受けたとき、前記ログ適用部によって前記ログ適用対象のデータに前記生成されたログを適用し、前記第4のボリュームに格納することを特徴とする請求項1に記載のディザスタリカバリシステム。
  5. 第1のサイトと、前記第1のサイトとネットワークを介して接続し、前記第1のサイトに格納されたデータの複製を格納する第2のサイトとを含むディザスタリカバリシステムで、前記第2のサイトを構成し、前記第1のサイトに格納されたデータの複製を作成する計算機及び前記データの複製を格納するストレージ装置を含む計算機システムであって、
    前記計算機は、前記ネットワークと接続する通信インターフェイスと、前記ストレージ装置に接続される第1の入出力インターフェイスと、前記第1の入出力インターフェイスに接続される第1のプロセッサと、前記第1のプロセッサに接続される第1のメモリと、を備え、
    前記ストレージ装置は、前記第1のサイト及び前記計算機に接続される第2の入出力インターフェイスと、前記第2の入出力インターフェイスに接続される第2のプロセッサと、前記第2のプロセッサに接続される第2のメモリと、前記第1のサイトに格納されたデータの複製を格納する記憶装置と、を備え、
    前記記憶装置は、前記第1のサイトに格納されたデータの複製を格納する第1のボリューム、及び前記第1のサイトに格納されたデータのログを格納する第2のボリュームを含み、
    前記計算機は、前記第1のボリュームに格納されたデータに第2のボリュームに格納されたログを適用するログ適用部を備え、
    前記ストレージ装置は、前記第1のボリュームに格納されたデータのコピー状況を記録するデータ領域コピー状況管理情報を備え、
    前記ログ適用部が前記ログを適用する対象のデータを前記第1のボリュームから取得するとき、前記ログ適用対象のデータが前記第1のサイトからコピー済みであるか否かを前記データ領域コピー状況管理情報を参照して判定し、
    前記ログ適用対象のデータのコピーが完了していない場合には、前記ログ適用対象のデータのコピーが完了するまで前記ログ適用対象のデータの取得を待機することを特徴とする計算機システム。
  6. 第1のサイトと、前記第1のサイトとネットワークを介して接続し、前記第1のサイトのデータの複製を格納する第2のサイトとを含むディザスタリカバリシステムで、前記第1のサイトに格納されたデータを更新したログを前記第2のサイトに転送し、予めコピーされた初期データに対して前記転送されたログを適用するログ適用方法であって、
    前記第1のサイトは、データベース管理システムを備え、クライアントからの要求に応じて参照又は更新処理を実行する第1の計算機と、前記第1の計算機が処理するデータを格納する第1のストレージ装置とを含み、
    前記第2のサイトは、第2の計算機と、前記第1のストレージ装置に格納されたデータの複製を格納する第2のストレージ装置とを含み、
    前記第1の記憶装置は、前記第1の計算機によって処理されるデータを格納するデータボリューム及び前記参照又は更新処理のログを格納する第3のボリュームを含み、
    前記第2の記憶装置は、前記データボリュームの複製である第4のボリューム、及び前記第3のボリュームの複製である第5のボリュームを含み、
    前記方法は、前記データボリュームの複製を前記第4のボリュームに作成し、
    前記データボリュームから前記第4のボリュームに複製が完了した領域について、第1のデータのコピー状況を前記第1のサイトに記録し、
    前記第1のボリュームから前記第4のボリュームに複製が完了した領域について、第2のデータのコピー状況を前記第2のサイトに記録し、
    前記第1の計算機が更新要求を受信したとき、前記第1のデータのコピー状況を参照し、前記データボリュームの更新対象のデータ領域について前記第4のボリュームにコピーが完了しているか否かを判定し、
    前記更新対象のデータ領域のコピーが完了していないとき、前記更新対象のデータ領域を優先して前記第4のボリュームにコピーし、
    前記第3のボリュームに書き込まれたログを前記第5のボリュームにコピーし、
    前記第5のボリュームが更新されたことを前記第2の計算機に通知し、
    前記第2のデータのコピー状況を参照して、前記第4のボリュームに前記更新対象のデータ領域のコピーが完了しているか否かを判定し、
    前記更新対象のデータ領域のコピーが完了していないとき、前記更新対象のデータ領域のコピーが完了するまで待機し、
    前記第4のボリュームに前記第5のボリュームにコピーされたログを適用することを特徴とするログ適用方法。
  7. 前記データボリュームは、更新が反映される第1のボリュームと、前記第1のボリュームの複製である第2のボリュームとを含み、
    前記第1のボリュームの複製を前記第2のボリュームに作成し、
    前記第2のボリュームを静止化し、
    前記第2のボリュームを前記第4のボリュームにコピーすることを特徴とする請求項6に記載のログ適用方法。
  8. 前記データボリュームの複製を前記第4のボリュームに作成する処理と、前記第4のボリュームに前記ログを適用する処理と、が並列して実行されることを特徴とする請求項6に記載のログ適用方法。
  9. 前記更新対象のデータ領域のコピーが完了していないとき、前記更新対象のデータ領域を更新した後、前記第4のボリュームにコピーすることを特徴とする請求項6に記載のログ適用方法。
  10. 前記第2のボリュームに格納されたデータを前記第4のボリュームに優先的にコピーする処理、及び前記第2のボリュームに格納されたデータを前記第4のボリュームに順次コピーする処理は、並列又は独立して実行されることを特徴とする請求項6に記載のログ適用方法。
  11. 前記更新対象のデータのコピーが完了していないとき、前記更新対象のデータを更新した後に、前記第4のボリュームにコピーすることを特徴とする請求項6に記載のログ適用方法。
  12. 前記更新対象のデータは、更新と同期して前記第4のボリュームにコピーされることを特徴とする請求項6に記載のログ適用方法。
  13. 前記更新対象のデータは、更新と非同期で前記第4のボリュームにコピーされることを特徴とする請求項6に記載のログ適用方法。
JP2006139966A 2006-05-19 2006-05-19 データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法 Active JP4833734B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006139966A JP4833734B2 (ja) 2006-05-19 2006-05-19 データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
US11/455,751 US7539703B2 (en) 2006-05-19 2006-06-20 Setup method for disaster recovery system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006139966A JP4833734B2 (ja) 2006-05-19 2006-05-19 データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法

Publications (2)

Publication Number Publication Date
JP2007310701A JP2007310701A (ja) 2007-11-29
JP4833734B2 true JP4833734B2 (ja) 2011-12-07

Family

ID=38713202

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006139966A Active JP4833734B2 (ja) 2006-05-19 2006-05-19 データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法

Country Status (2)

Country Link
US (1) US7539703B2 (ja)
JP (1) JP4833734B2 (ja)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8589400B2 (en) 2001-11-30 2013-11-19 Intelligent Medical Objects, Inc. Longitudinal electronic record system and method
US7693917B2 (en) 2001-11-30 2010-04-06 Intelligent Medical Objects, Inc. Method for adaptive data management
US9195397B2 (en) 2005-04-20 2015-11-24 Axxana (Israel) Ltd. Disaster-proof data recovery
US8706687B2 (en) * 2007-01-24 2014-04-22 Hewlett-Packard Development Company, L.P. Log driven storage controller with network persistent memory
JP4512201B2 (ja) * 2007-12-21 2010-07-28 株式会社日立製作所 データ処理方法及びシステム
US8250031B2 (en) * 2008-08-26 2012-08-21 Hitachi, Ltd. Low traffic failback remote copy
EP2164002A1 (en) * 2008-09-16 2010-03-17 Siemens Aktiengesellschaft Method for archiving data stored in a database by partition rotation
JP4868012B2 (ja) 2009-03-09 2012-02-01 日本電気株式会社 コンピュータシステム、コンピュータシステムの制御方法、及びプログラム
US8706960B1 (en) * 2009-09-29 2014-04-22 Emc Corporation Techniques for performing data migration
JP5508798B2 (ja) * 2009-09-29 2014-06-04 株式会社日立製作所 クラスタを考慮してレプリケーションを管理する管理方法及びシステム
JP5686034B2 (ja) * 2011-04-28 2015-03-18 富士通株式会社 クラスタシステム、同期制御方法、サーバ装置および同期制御プログラム
US8682855B2 (en) 2011-06-06 2014-03-25 International Business Machines Corporation Methods, systems, and physical computer storage media for backing up a database
AU2012357655B2 (en) * 2011-12-23 2017-08-10 Secure Software Pty Ltd Memory content protection
US20130332413A1 (en) * 2012-06-07 2013-12-12 International Business Machines Corporation Reducing data transfers while eliminating data loss for asynchronous replication of databases
JP5948416B2 (ja) * 2012-07-03 2016-07-06 富士通株式会社 情報処理装置、情報保存処理プログラム及び情報保存処理方法
EP2728477A1 (de) * 2012-11-05 2014-05-07 Siemens Aktiengesellschaft Verfahren und Logikschaltung zum Kopieren von Daten, Speichervorrichtung und Datenverarbeitungsvorrichtung
EP2937788A4 (en) 2012-12-21 2016-06-22 Murakumo Corp INFORMATION PROCESSING METHOD, INFORMATION PROCESSING DEVICE, AND PROGRAM
WO2015056169A1 (en) * 2013-10-16 2015-04-23 Axxana (Israel) Ltd. Zero-transaction-loss recovery for database systems
EP3125123A4 (en) 2014-03-25 2017-11-22 Murakumo Corporation Database system, information processing device, method, and program
EP3125121A4 (en) * 2014-03-25 2017-12-06 Murakumo Corporation Database system, information processing device, method, and program
US10082980B1 (en) * 2014-06-20 2018-09-25 EMC IP Holding Company LLC Migration of snapshot in replication system using a log
US9612769B1 (en) * 2014-06-30 2017-04-04 EMC IP Holding Company LLC Method and apparatus for automated multi site protection and recovery for cloud storage
US10379958B2 (en) 2015-06-03 2019-08-13 Axxana (Israel) Ltd. Fast archiving for database systems
US10506042B2 (en) 2015-09-22 2019-12-10 Toshiba Memory Corporation Storage system that includes a plurality of routing circuits and a plurality of node modules connected thereto
US10348807B2 (en) * 2016-07-28 2019-07-09 Caringo Inc. Multi-part upload
US10592326B2 (en) 2017-03-08 2020-03-17 Axxana (Israel) Ltd. Method and apparatus for data loss assessment
US11226875B2 (en) * 2017-07-20 2022-01-18 International Business Machines Corporation System halt event recovery
US10585756B2 (en) 2017-08-07 2020-03-10 International Business Machines Corporation Point-in-time copy on a remote system
US10700711B1 (en) 2017-11-03 2020-06-30 Caringo Inc. Multi-part upload and editing of erasure-coded objects
US10795776B2 (en) 2017-11-06 2020-10-06 International Business Machines Corporation Multiple point-in-time copies on a remote system
JP7007565B2 (ja) * 2017-11-20 2022-01-24 富士通株式会社 情報処理装置および情報処理プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5530855A (en) * 1992-10-13 1996-06-25 International Business Machines Corporation Replicating a database by the sequential application of hierarchically sorted log records
GB2273180A (en) * 1992-12-02 1994-06-08 Ibm Database backup and recovery.
JP3414218B2 (ja) * 1997-09-12 2003-06-09 株式会社日立製作所 記憶制御装置
US6988176B2 (en) * 1997-09-12 2006-01-17 Hitachi, Ltd. Method and apparatus for data duplexing in storage unit system
US6065018A (en) * 1998-03-04 2000-05-16 International Business Machines Corporation Synchronizing recovery log having time stamp to a remote site for disaster recovery of a primary database having related hierarchial and relational databases
US6226651B1 (en) * 1998-03-27 2001-05-01 International Business Machines Corporation Database disaster remote site recovery
JP3726559B2 (ja) * 1999-06-01 2005-12-14 株式会社日立製作所 ダイレクトバックアップ方法および記憶装置システム
JP3822431B2 (ja) * 2000-10-31 2006-09-20 株式会社東芝 データコピーシステム、データコピー方法及び記憶媒体
JP3714184B2 (ja) * 2001-03-29 2005-11-09 富士通株式会社 記憶装置のデータ領域間複写処理方法、及び記憶システム
JP2003248605A (ja) * 2002-02-26 2003-09-05 Hitachi Ltd ストレージシステム、主記憶システム、副記憶システム、及びそのデータ複写方法
US7844577B2 (en) * 2002-07-15 2010-11-30 Symantec Corporation System and method for maintaining a backup storage system for a computer system
US7065674B2 (en) * 2002-08-01 2006-06-20 Microsoft Corporation Computer system fault recovery using distributed fault-recovery information
US8121978B2 (en) * 2002-11-15 2012-02-21 Sybase, Inc. Database system providing improved methods for data replication
JP4393762B2 (ja) * 2002-12-19 2010-01-06 株式会社日立製作所 データベース処理方法及び装置並びにその処理プログラム
JP4301849B2 (ja) * 2003-03-31 2009-07-22 株式会社日立製作所 情報処理方法及びその実施システム並びにその処理プログラム並びにディザスタリカバリ方法およびシステム並びにその処理を実施する記憶装置およびその制御処理方法
US7065589B2 (en) * 2003-06-23 2006-06-20 Hitachi, Ltd. Three data center remote copy system with journaling
JP4551096B2 (ja) * 2004-02-03 2010-09-22 株式会社日立製作所 ストレージサブシステム
JP4452533B2 (ja) * 2004-03-19 2010-04-21 株式会社日立製作所 システムおよび記憶装置システム
JP4581500B2 (ja) * 2004-06-17 2010-11-17 株式会社日立製作所 ディザスタリカバリシステム、プログラム及びデータベースのリカバリ方法

Also Published As

Publication number Publication date
US7539703B2 (en) 2009-05-26
US20070271313A1 (en) 2007-11-22
JP2007310701A (ja) 2007-11-29

Similar Documents

Publication Publication Date Title
JP4833734B2 (ja) データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
EP1204923B1 (en) Remote data copy using a prospective suspend command
US6189079B1 (en) Data copy between peer-to-peer controllers
US8954645B2 (en) Storage writes in a mirrored virtual machine system
US7225307B2 (en) Apparatus, system, and method for synchronizing an asynchronous mirror volume using a synchronous mirror volume
US8028192B1 (en) Method and system for rapid failback of a computer system in a disaster recovery environment
JP4668763B2 (ja) ストレージ装置のリストア方法及びストレージ装置
US7278049B2 (en) Method, system, and program for recovery from a failure in an asynchronous data copying system
JP3655963B2 (ja) 記憶制御装置、それを含むデータ記憶システムおよび二重ペア抑止方法
US5870537A (en) Concurrent switch to shadowed device for storage controller and device errors
US8005800B2 (en) Data storage system for fast reverse restore
US8027952B2 (en) System and article of manufacture for mirroring data at storage locations
US7139851B2 (en) Method and apparatus for re-synchronizing mirroring pair with data consistency
US20040260899A1 (en) Method, system, and program for handling a failover to a remote storage location
JP2006023889A (ja) リモートコピーシステム及び記憶装置システム
CN101243446A (zh) 从数据库镜像进行在线页还原
JP2004252686A (ja) 情報処理システム
JP2006004147A (ja) ディザスタリカバリシステム、プログラム及びデータベースのリカバリ方法
JP4289056B2 (ja) 計算機システム間のデータ二重化制御方法
WO2015104835A1 (ja) データベースシステムの制御方法及びデータベースシステム
US8677088B1 (en) Systems and methods for recovering primary sites after failovers to remote secondary sites
US7302604B2 (en) Remote management commands in a mass storage system
US20040139366A1 (en) Method, system, and article of manufacture for creating a consistent copy
JP2004094710A (ja) 記憶サブシステムのデータ二重化方法およびシステム
JP2009151635A (ja) 業務継続システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090127

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110922

R150 Certificate of patent or registration of utility model

Ref document number: 4833734

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3