JP2006134204A - リモートコピーシステムおよびその制御方法 - Google Patents
リモートコピーシステムおよびその制御方法 Download PDFInfo
- Publication number
- JP2006134204A JP2006134204A JP2004324680A JP2004324680A JP2006134204A JP 2006134204 A JP2006134204 A JP 2006134204A JP 2004324680 A JP2004324680 A JP 2004324680A JP 2004324680 A JP2004324680 A JP 2004324680A JP 2006134204 A JP2006134204 A JP 2006134204A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage device
- logical volume
- log data
- remote copy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
- G06F11/2074—Asynchronous techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2066—Optimisation of the communication load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2082—Data synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0646—Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
- G06F3/065—Replication mechanisms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Abstract
【課題】 記憶装置の持つ記憶装置間コピー機能により、データベースのデータを転送するディザスタリカバリシステムを構築し、そのデータ転送に必要な公衆回線を極小化する機能を実現可能とするリモートコピーシステムの制御技術を提供する。
【解決手段】 メイン側記憶装置102のデータをリモート側記憶装置104へデータ転送するリモートコピーシステムにおいて、メイン側記憶装置102は、データの更新順序を保障する論理ボリュームのグループを複数の小グループに分類し、この分類した小グループごとに、データ転送を中断するサイドファイルの使用率を設定して、サイドファイルに滞留するデータ量が閾値を越えた場合に、グループ内の全ての論理ボリュームのデータ転送を停止することなく、設定されたサイドファイルの使用率の低い方の小グループからデータ転送を中断するように制御する。
【選択図】 図1
【解決手段】 メイン側記憶装置102のデータをリモート側記憶装置104へデータ転送するリモートコピーシステムにおいて、メイン側記憶装置102は、データの更新順序を保障する論理ボリュームのグループを複数の小グループに分類し、この分類した小グループごとに、データ転送を中断するサイドファイルの使用率を設定して、サイドファイルに滞留するデータ量が閾値を越えた場合に、グループ内の全ての論理ボリュームのデータ転送を停止することなく、設定されたサイドファイルの使用率の低い方の小グループからデータ転送を中断するように制御する。
【選択図】 図1
Description
本発明は、リモートコピーシステムの制御技術に関し、特に、遠隔地に配置した記憶装置間で、データを転送するリモートコピー技術に適用して有効な技術に関する。
近年、コンピュータシステムではテロや地震などの災害に起因するデータの喪失を回避するために、記憶装置内に蓄積されたデータの複製を遠隔地の記憶装置で多重に保持する必要性が高くなっている。
このような記憶装置間のデータのリモートコピー技術を利用したディザスタリカバリシステムは、一般に上位装置からのデータをメインセンタ(メインサイト)の記憶装置に書き込むと共に、遠隔地に設置されたリモートセンタ(リモートサイト)の記憶装置にも書き込んでデータの多重化を実現している。
これにより、災害でメインセンタの記憶装置の運用が不可能となった場合でも、短時間でリモートセンタの記憶装置に切り替えて運用を再開することができる(特許文献1)。
一方、メインセンタからリモートセンタにデータを転送する際のデータベースのログについては、メインセンタのログの更新に同期してリモートセンタのログを更新することにより、リモートセンタにあるデータベースのデータコピーとログからデータベースを復元する技術(特許文献2)なども提案されており、これによりデータベースが壊れた際であっても、長時間を要さずに最も間近で整合性のあるデータベースを復元することが可能になる。
さらに他の技術として、メインセンタにおいて、データベース表データをディスク装置に書き出し、それ以降の更新要求が起こっても更新を保留し、ディスク装置のデータベース表データをリモートセンタに転送し、データベース表データを複写して二重化する技術(特許文献3)などがある。
さらに、リモートコピーでペアを構成している場合に、何らかの障害が発生し、その後その回復中に再度障害が発生した場合に、リモートサイト側のデータが完全喪失されてしまうという事態を防止するために、リモートサイト側の論理ボリュームと同じデータを持つペアボリュームをさらに構築しておく方法などが知られている(特許文献4)。
特開平11−15604号公報
特開平6−214853号公報
特開2000−347917号公報
特開2002−189570号公報
ところで、リモートコピーシステムを構築する場合、メインセンタとリモートセンタ間の記憶装置を繋ぐ回線の帯域は、そのシステムの転送ピーク時の更新データをも転送可能な帯域が必要となる。
そこで、本発明は、記憶装置の持つ記憶装置間コピー機能により、データベースのデータを転送するディザスタリカバリシステムを構築し、そのデータ転送に必要な公衆回線を極小化する機能を実現可能とするリモートコピーシステムの制御技術を提供することを目的とする。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
本発明は、第1の記憶装置と、第2の記憶装置とを有し、第1の記憶装置のデータを第2の記憶装置へデータ転送するリモートコピーシステム、およびその制御方法に適用される。第1の記憶装置および第2の記憶装置のそれぞれは、外部からのデータ授受を行うインタフェース制御部と、データを一時的に格納するメモリと、データを記録するディスクドライブと、メモリ上のデータを監視するマイクロプロセッサと、メモリ上のデータのディスクドライブへの書き込みや読み出しを制御するディスク制御部と、記憶装置の設定管理を行うサービスプロセッサとを有し、以下のような特徴を有するものである。
(1)第1の記憶装置のメモリは、データ転送のための情報を格納するサイドファイルを有する。第1の記憶装置のサービスプロセッサは、データの更新順序を保障する論理ボリュームのグループをログデータを蓄積する論理ボリュームのグループとログデータ以外の論理ボリュームのグループとに区分して、この区分したグループごとに、データ転送を中断するサイドファイルの使用率を設定する機能を有する。
(2)第1の記憶装置のマイクロプロセッサは、サイドファイルに滞留するデータ量を監視し、この監視の結果、サイドファイルへ滞留するデータ量が閾値を越えた場合に、グループ内の全ての論理ボリュームのうち、設定されたサイドファイルの使用率の低い方のグループからデータ転送を中断するように制御する機能を有する。
(3)第1の記憶装置のマイクロプロセッサは、監視の結果、サイドファイルへ滞留するデータ量が閾値未満になった場合に、データ転送を中断していたグループのデータ転送を再開するように制御する機能を有する。
(4)第1の記憶装置のサービスプロセッサは、ログデータの論理ボリュームのグループのサイドファイルの使用率を高く設定し、ログデータ以外の論理ボリュームのグループのサイドファイルの使用率を低く設定する。そして、第1の記憶装置のマイクロプロセッサは、サイドファイルへ滞留するデータ量が第2の閾値を越えた場合に、ログデータ以外の論理ボリュームのグループのデータ転送を中断し、第2の閾値より低い第3の閾値未満になった場合に、データ転送を中断していたログデータ以外の論理ボリュームのグループのデータ転送を再開する。
(5)第1の記憶装置のマイクロプロセッサは、サイドファイルへ滞留するデータ量が第2の閾値より高い第1の閾値を越えた場合に、ログデータの論理ボリュームのグループのデータ転送を中断し、第1の閾値より低い第4の閾値未満になった場合に、データ転送を中断していたログデータの論理ボリュームのグループのデータ転送を再開する。
(6)第1の記憶装置のディスクドライブは、第1の論理ボリュームを有する。第2の記憶装置のディスクドライブは、第2の論理ボリュームと第3の論理ボリュームとを有する。そして、第1の記憶装置および第2の記憶装置のマイクロプロセッサは、第1の論理ボリュームから第2の論理ボリュームへデータ転送して記憶装置間コピーを行い、第2の論理ボリュームから第3の論理ボリュームへ記憶装置内コピーを行うように制御する機能を有する。
(7)第1の記憶装置および第2の記憶装置のマイクロプロセッサは、ログデータおよびログデータ以外のデータの両方が第1の論理ボリュームから第2の論理ボリュームへデータ転送されている状態で、第1の記憶装置に障害が発生した場合、第1の論理ボリュームから第2の論理ボリュームへのコピーを中断し、第2の論理ボリュームから第3の論理ボリュームへ記憶装置内コピーを行い、第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有する。
(8)第1の記憶装置および第2の記憶装置のマイクロプロセッサは、ログデータが第1の論理ボリュームから第2の論理ボリュームへデータ転送され、ログデータ以外のデータのデータ転送が中断されている状態で、第1の記憶装置に障害が発生した場合、第1の論理ボリュームから第2の論理ボリュームへのログデータのコピーを中断し、第2の論理ボリュームのログデータを第3の論理ボリュームにコピーして、第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有する。
(9)第1の記憶装置および第2の記憶装置のマイクロプロセッサは、ログデータが第1の論理ボリュームから第2の論理ボリュームへデータ転送され、ログデータ以外のデータのデータ転送が中断された後に再開され、差分データのコピーが行われている状態で、第1の記憶装置に障害が発生した場合、第1の論理ボリュームから第2の論理ボリュームへのログデータのコピーを中断し、第2の論理ボリュームのログデータを第3の論理ボリュームにコピーして、第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有する。
(10)第1の記憶装置および第2の記憶装置のマイクロプロセッサは、ログデータおよびログデータ以外のデータのデータ転送が中断されている状態で、または中断された後に再開され、差分データのコピーが行われている状態で、第1の記憶装置に障害が発生した場合、第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有する。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
本発明によれば、記憶装置の持つ記憶装置間コピー機能により、データベースのデータをリアルタイムにデータ転送するディザスタリカバリシステムを構築し、そのデータ転送に必要な公衆回線を極小化する機能を実現することが可能となる。
<本発明の概念>
一般に、メインサイトからリモートサイトへデータを転送するリモートコピーシステムにおいて、その対象データとしては、データベースがよく適用される。データベースには、ログデータというものがあり、これはデータベースの更新情報を管理するデータである。このログデータを用いれば、障害回復の時に、ある時点でのデータベースのデータにそれ以降のログデータ(更新情報)を反映させることにより、データベースのデータを最新の時点まで回復させることが可能となる。
一般に、メインサイトからリモートサイトへデータを転送するリモートコピーシステムにおいて、その対象データとしては、データベースがよく適用される。データベースには、ログデータというものがあり、これはデータベースの更新情報を管理するデータである。このログデータを用いれば、障害回復の時に、ある時点でのデータベースのデータにそれ以降のログデータ(更新情報)を反映させることにより、データベースのデータを最新の時点まで回復させることが可能となる。
このデータベースの性質に着想すると、データを転送する方式として次のような方式が考えられる。
すなわち、本願の第1の発明である更新されたデータのログ情報のみを転送する方式である。この方式によれば、転送データはログファイルのみなので、必要回線帯域は小さくてすむため、運用コストは安くてすむ。
併しながら、リモートサイトにおいて転送されるログデータ(情報)をある時点でのデータベースに反映する必要がある。この反映に要する時間のために、運用上の制約が生じる場合がある。そこで、本願の第2の発明は、データベース全体を転送するという状態をデータ転送帯域が許容する間は続け、転送するべきデータが転送帯域を上回る場合には、ログデータの送信に切り換える。
ここで、簡単にリモートコピーについて説明する。リモートコピーは、大きく2つに大別される。1つは同期リモートコピーで、もう1つは非同期リモートコピーである。同期リモートコピーというのは、上位装置からデータの書き込み命令を受けたメインサイトの記憶装置が、リモートサイトの記憶装置においてもそのデータの書き込み命令を完了したことを確認した上で、上位装置に書き込み命令の完了を報告するシステムである。この場合、メインサイトの記憶装置が保持するデータイメージと、リモートサイトの記憶装置が保持するデータイメージは、その運用中、同じ状態を保持することができる。
一方、非同期リモートコピーと呼ばれる方法では、メインサイトの記憶装置は、上位装置からデータの書き込み命令を受領した場合に、その処理が終わると直ちに上位装置にデータ書き込み処理の終了を報告する。そして、リモートサイトの記憶装置へのそのデータの転送は、その書き込み処理とは非同期に行われる。この場合、リモートサイトの記憶装置に送るべきデータをメインサイトの記憶装置は所定のメモリ(以下、サイドファイルと呼ぶ)上に保持しておく。そして、サイト間の回線を利用してサイドファイル上のデータを順次リモートサイトに転送する。回線の帯域(データ転送能力)が十分にある場合には、サイドファイルに停滞するデータの量は増加しないが、回線帯域を小さく設定すると、リモートサイトに転送されていないデータがサイドファイルに滞留することとなる。
なお、サイドファイルの容量をオーバーフローするような更新データが発生して、リモートコピーの運用ができなくなることを避けるために、サイドファイルの利用率が所定の閾値を越えた場合には、サイドファイルを用いたリモートコピーの方式を中断し、後述する差分コピーという方式に切り換える。
次に、メインサイトの記憶装置に構成されている論理ボリュームについて説明する。記憶対象としてデータベースを取り扱う場合は、データそのものを保持する論理ボリュームとデータベース更新の記録であるログデータを保持する論理ボリュームとで構成される。
ここで、サイドファイルの利用率に着目する。つまり、サイドファイルの利用率が高くなった場合(第2の閾値)に、ログデータの論理ボリューム以外の論理ボリューム、すなわちデータそのものを保持する論理ボリュームの更新データの転送を中断する。
データそのものを保持する論理ボリュームのデータ転送中断のサイドファイル使用率を低く設定しておき、ログデータの論理ボリュームのデータ転送中断のサイドファイル使用率を高く設定することにより、データ転送回線帯域を越えるデータ更新がメインサイトにて発生した場合にも、データベース全体のデータ転送が中断されるのではなく、ログデータ以外のデータのみ転送が中断されるので、ログデータは常にリモートサイトに転送され、極小化された回線帯域であっても、ログデータを用いることにより被災時のリモートサイトでのデータ回復は可能となる。
さらに、本発明に対し、データ転送の自動再開機能を適用することにより、中断されたログデータ以外のデータ転送は自動的に再開され、かつ、静止点におけるデータの整合性が確保されるので、ディザスタリカバリシステムの構築が可能となる。
ところで、後述する図1に示すように、データベースのデータやログデータを保持する論理ボリュームは通常複数で構成される。この複数の論理ボリュームのグループを以下、コンシステンシーグループと呼ぶ。データベースが行ったデータの更新の順序は、このコンシステンシーグループの中で維持される。
本発明においては、このコンシステンシーグループを構成する論理ボリュームを、さらにログデータを保持する論理ボリュームのグループとそれ以外のデータを保持する論理ボリュームのグループとに区分してデータの転送を制御する。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。但し、下記の説明に本発明が限定されるわけではない。
<リモートコピーシステムの全体構成>
図1により、本発明の一実施の形態に係るリモートコピーシステムの全体構成の一例を説明する。図1は、本実施の形態に係るリモートコピーシステムの全体構成を示す構成図である。
図1により、本発明の一実施の形態に係るリモートコピーシステムの全体構成の一例を説明する。図1は、本実施の形態に係るリモートコピーシステムの全体構成を示す構成図である。
本実施の形態に係るリモートコピーシステムは、図1に示すように、メインサイトに設置されたメインセンタ101と、リモートサイトに設置されたリモートセンタ103との2つのデータセンタ間でのデータの二重化を行うシステムである。メインセンタ101には、メイン側記憶装置102と、これに接続される上位装置105が備えられている。リモートセンタ103には、リモート側記憶装置104と、これに接続される上位装置106が備えられている。
メインセンタ101のメイン側記憶装置102と、リモートセンタ103のリモート側記憶装置104は、両センタ内の上位装置105,106を介さずに互いに接続され、メイン側記憶装置102が保有するデータをリモート側記憶装置104へ二重化を行うリモートコピーシステムを実現している。
メインセンタ101において、メイン側記憶装置102は、インタフェースケーブル107を介して、メイン側記憶装置102に対して参照および更新のデータ処理を行うCPUを持つ上位装置105に接続されている。この上位装置105には、データベースなどの各種のアプリケーション113が備えられている。
また、メイン側記憶装置102には、上位装置105から参照および更新処理を行うためのデータを格納する複数のプライマリ論理ボリューム(P−VOL)108(108−1,108−2,・・・,108−n)を有する。
一方、リモートセンタ103において、リモート側記憶装置104は、インタフェースケーブル110を介してCPUを持つ上位装置106に接続されている。この上位装置106には、データベースなどの各種のアプリケーション114が備えられている。
この上位装置106は、メインセンタ101の上位装置105が災害や故障などにより本来の機能が果たせなくなった場合に、上位装置105の代替となって処理を行うことができる。また、災害や故障時以外にも、リモート側記憶装置104に格納されているデータを利用して、メインセンタ101の上位装置105とは異なる処理を、上位装置105とは独立に実行することもできる。
さらに、リモート側記憶装置104には、上位装置106から参照および更新処理を行うためのデータを格納した複数のセカンダリ論理ボリューム(S−VOL)111(111−1,111−2,・・・,111−n)と、ターゲット論理ボリューム(T−VOL)112(112−1,112−2、・・・,112−n)を有する。
メインセンタ101内の上位装置105からメイン側記憶装置102が有するP−VOL108に対してデータの書き込み指示があった場合、各P−VOL108および各S−VOL111に対応する各インタフェースケーブル109(109−1,109−2,・・・,109−n)を介して、リモートセンタ103内のリモート側記憶装置104が有するS−VOL111へ向けて送出される。
なお、複数のプライマリ論理ボリューム(P−VOL)108の少なくとも1つはアプリケーションソフトで提供されるデータベースの更新情報(ログデータ)を保持するログ用論理ボリュームである。
同様に、セカンダリ論理ボリューム(S−VOL)111、およびターゲット論理ボリューム(T−VOL)112のそれぞれも、プライマリ論理ボリュームのログ用の論理ボリュームに対応してログ用論理ボリュームを有する。
インタフェースケーブル109から送出された書き込みデータは、途中、回線多重分離かつ公衆網対応の回線多重分離・公衆網インタフェース(I/F)部130で多重化され、公衆網上のある特定の公衆回線140を経由してS−VOL111へ向けて送出される。つまり、S−VOL111への書き込みデータのコピーにおいては、全ての書き込みデータがこの公衆回線140上を通過することになる。
従って、この公衆回線140上に一度に大きなトラフィックがかかると、ここがボトルネックになることになる。なお、回線多重分離・公衆網I/F部130はインタフェースケーブル109と1対1で接続されていても構わない。
本実施の形態では、大きなトラフィックがこの公衆回線140上に一度にかかった場合でも、データの更新順序を保障する論理ボリュームのコンシステンシーグループ内の全ての論理ボリュームのデータ転送を停止するのではなく、予めコンシステンシーグループをさらに小グループ分けしておき、その小グループごとに、データ転送を中断するサイドファイルの使用率を設定する機能を持つことにより、小グループの優先順位が決まり、重要なデータが必ずリモートサイトへ転送されることを可能にする。詳細については後述する。
<記憶装置の構成>
図2により、記憶装置の内部構成の一例を説明する。図2は、記憶装置の内部構成を示す構成図である。なお、図2は、メイン側記憶装置102を示すが、リモート側記憶装置104の内部構成も同様であるので、ここでの説明は省略する。
図2により、記憶装置の内部構成の一例を説明する。図2は、記憶装置の内部構成を示す構成図である。なお、図2は、メイン側記憶装置102を示すが、リモート側記憶装置104の内部構成も同様であるので、ここでの説明は省略する。
メイン側記憶装置102は、上位装置105からのデータ授受を行うインタフェース制御部115と、上位装置105から参照または更新されるデータを一時的に格納するメモリ116と、リモートコピーが一時停止中の更新データの格納位置に関する情報などを格納するリモートコピー制御情報格納部117と、上位装置105のデータを記録する記録媒体としての磁気ディスクドライブ118と、これらのデータのやり取りを制御するマイクロプロセッサ119と、磁気ディスクドライブ118へのデータ授受を行い、これらの要素を制御する記憶制御部120と、それに加えてリモートコピーの実行状態の監視、および、リモートコピーをどのような設定にて行うかをユーザが設定できるサービスプロセッサ121を備える。
メモリ116は、参照または更新されるデータを格納するためのキャッシュ116aと、データ転送用キャッシュのサイドファイル116bを格納する領域などを有する。サイドファイル116bには、データ転送用のデータとこのデータの格納位置、更新順序などを関連付けた情報などを含むデータ転送のための情報が格納されている。
磁気ディスクドライブ118は、メイン側記憶装置102には上位装置105から参照および更新処理を行うためのデータを格納した図1に示す複数のP−VOL108を有する。なお、リモート側記憶装置104の磁気ディスクドライブ118には、図1に示す複数のS−VOL111、T−VOL112を有する。
また、図2のメイン側記憶装置102は、リモートセンタ103とデータの送受信を行うためのインタフェース制御部115を有する。そして、このインタフェース制御部115から、図1で示したインタフェースケーブル109が接続される。これらインタフェースケーブル109は、回線多重分離・公衆網I/F部130に接続される。
回線多重分離・公衆網I/F部130は、各インタフェースケーブル109から受け取ったデータを、公衆回線140を介してリモートセンタ103側の回線多重分離・公衆網I/F部131に送信する。リモートセンタ103側の回線多重分離・公衆網I/F部131は、リモート側記憶装置104内のインタフェース制御部115とインタフェースケーブル109を介して接続される。
この構成のため、メインセンタ101からリモートセンタ103へリモートコピーを行う場合、各記憶装置102,104内では各論理ボリューム対応に互いに異なる通信路でデータ転送が可能であるが、公衆網上では全ての論理ボリュームに対する通信が1つの公衆回線140上で行われることとなり、データ転送の負荷が集中する。
なお、センタ間を結ぶインタフェースケーブル109には、たとえばLED駆動装置によって駆動されている光ファイバリンクや、光ファイバケーブルを用いて、一般にファイバチャネルと呼ばれるインタフェースプロトコルで駆動される。
また、公衆回線140とは、T3ネットワークやATMネットワークに代表される電気通信リンクであり、回線多重分離・公衆網I/F部130はチャネルエクステンダやファイバチャネルスイッチに代表されるインタフェースの接続距離を延長できるデータ転送機器である。
従って、メイン側記憶装置102とリモート側記憶装置104の間には、途中に一般のファイバチャネルを接続したり、T3ネットワークなどと接続することも可能である。
以上のように構成されるメイン側記憶装置102、リモート側記憶装置104において、特に、サービスプロセッサ121は、ログデータ以外の論理ボリュームのデータ転送を中断するサイドファイル116bの使用率を設定する機能を持っている。このサービスプロセッサ121により設定された各種情報(閾値など)は、リモートコピー制御情報格納部117に格納される。
また、マイクロプロセッサ119は、サイドファイル116bに滞留するデータ量を監視し、この監視の結果、サイドファイル116bへ滞留するデータ量が閾値を越えた場合に、ログデータ以外の論理ボリュームのデータ転送を停止する。
ここで、論理ボリュームのコンシステンシーグループについて説明する。容量の大きなデータベースを取り扱う場合、それに必要な論理ボリュームは複数とする必要がある。また、データベースの巨大化に伴いログデータを保持する論理ボリュームもまた、複数の論理ボリュームで構成される場合がある。
この点について図1を用いて説明する。複数のプライマリ論理ボリューム108−1〜108−nのうち、たとえばP−VOL108−1とP−VOL108−2がデータベースのログデータを保持するプライマリ論理ボリュームであり、それ以外のP−VOL108−nまでをデータベースのデータを扱うプライマリ論理ボリュームとして設定した場合、これら複数のプライマリ論理ボリュームが一まとまりの意味のあるデータでなければならない。ところが、インタフェースケーブル109−1〜109−nによる通信回線の転送状態によっては、実際には、後に更新されたプライマリ論理ボリュームのデータが、先に更新を受けたプライマリ論理ボリュームのデータよりも先に公衆回線140に送出されることがあり得る。
このような結果として、後に更新を受けたプライマリ論理ボリュームのデータが、先に更新を受けたプライマリ論理ボリュームのデータより早く、対応するセカンダリ論理ボリュームに送信されてしまうことがあり得る。このような状態においては、リモートセンタ103のセカンダリ論理ボリュームは、データベースの更新進行と同期の取れていないものになってしまう。このような状態で、メインセンタ101側に障害が発生してしまうと、最悪の場合、データの完全喪失に陥ってしまう。
そこで、このような非同期のリモートコピーシステムにおいては、コンシステンシーを維持しなければならない論理ボリューム群をコンシステンシーグループと呼んで、書き込みI/Oに順序番号を付与するなどして、リモートセンタ103側においても、上位装置105がデータを更新したときの順序でそのデータを更新するように制御する。他の方法として、あるタイミング毎に整合性のとれた状態を保証し、その状態をリモートセンタ103のターゲット論理ボリュームに保持しておく制御方法もある。
一般に、このコンシステンシーグループは、そのデータベースのログデータを保持する論理ボリュームも含めて構成される。本発明においては、このコンシステンシーグループをさらにログデータの論理ボリュームとログデータ以外の論理ボリュームとに分けてリモートコピーの実行を制御する。
最適な実施の形態においては、公衆回線140の回線帯域をデータ転送が最も多くなるときを想定した大きさにするのではなく、それよりも少ない帯域とする。そして、サイドファイルの使用率がある閾値に達した場合に、情報量の多いログデータ以外のデータを構成する論理ボリューム分の転送を中止して、ログデータの論理ボリューム分だけを転送するように制御する。ログデータさえリモートサイトのリモート側記憶装置104が受領していれば、セカンダリ論理ボリューム111がすでに受領しているデータにログデータを反映することにより、データの最新の状態まで更新することができるからである。
さらに、マイクロプロセッサ119は、監視の結果、サイドファイル116bへ滞留するデータ量が閾値未満になった場合に、データ転送を中断していたログデータ以外のデータを構成する論理ボリューム分のデータ転送を再開するように制御する機能を持っている。さらに、マイクロプロセッサ119は、万が一災害が発生した場合に、リモートサイトのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能も持っている。
<コピー機能による二重化>
図1に示すようなリモートコピーシステムに含まれる、図2に示すようなメイン側記憶装置102は、上位装置105からメイン側記憶装置102が保有するP−VOL108への通常の参照および更新処理と、P−VOL108のデータをリモート側記憶装置104が保有するS−VOL111へコピーする制御を行う。このリモートコピー制御は、マイクロプロセッサ119により実行される。無論、記憶制御部120に配置されるような図示しないマイクロプロセッサが行うように構成することもできることは言うまでもない。
図1に示すようなリモートコピーシステムに含まれる、図2に示すようなメイン側記憶装置102は、上位装置105からメイン側記憶装置102が保有するP−VOL108への通常の参照および更新処理と、P−VOL108のデータをリモート側記憶装置104が保有するS−VOL111へコピーする制御を行う。このリモートコピー制御は、マイクロプロセッサ119により実行される。無論、記憶制御部120に配置されるような図示しないマイクロプロセッサが行うように構成することもできることは言うまでもない。
具体的には、メイン側記憶装置102は、P−VOL108とコピー対象のS−VOL111の一組の論理ボリュームをペアとして構成する。たとえば、P−VOL108−1とペアを成すのがS−VOL111−1、P−VOL108−2とペアを成すのがS−VOL111−2といったペア論理ボリュームの構成と、ペア論理ボリュームのコピー実行状態(ステータス)を管理する。リモート側記憶装置104は、メイン側記憶装置102から送信されたデータの書き込みの実行とペア論理ボリュームの構成およびステータスを管理する。
ここで、ステータスとは、P−VOL108とS−VOL111間のコピー実行状態を示すものであり、「デュプレックス」、「デュプレックスペンディング」、「サスペンド」の3つの状態である。
「デュプレックス」は、P−VOL108とS−VOL111でペアの関係を維持した二重化の状態、言い換えればP−VOL108の更新処理を逐次S−VOL111へ反映する状態である。
「デュプレックスペンディング」は、P−VOL108からS−VOL111へコピーは行われるが、二重化状態ではなく、差分のデータが送付されている状態である。
「サスペンド」は、ペアの関係を維持したまま、P−VOL108の更新データをS−VOL111へ反映する処理を一次中断した状態である。
これらステータスは、上位装置105,106上のアプリケーション113,114もしくは記憶装置102,104内のサービスプロセッサ121、記憶装置102,104とLANで直接に接続されたコンソール上のアプリケーションからペア論理ボリュームに対して発行するコマンドによって遷移させることができる。
また、本実施の形態では、データ内容の一貫性を保持する論理ボリュームグループをP−VOL108とS−VOL111のペア論理ボリュームとする。これにより、ペア論理ボリュームがデュプレックスのステータスにある時、P−VOL108の更新順序とS−VOL111の更新反映の順序を一致させ、P−VOL108とS−VOL111のデータ内容に一貫性(コンシステンシー)を保持させる。
さらに、本実施の形態におけるリモート側記憶装置104が保有するT−VOL112は、論理ボリュームグループとして定義したP−VOL108とS−VOL111の全ペア論理ボリュームをサスペンドにした時点のS−VOL111の複製を格納した論理ボリューム群である。
なお、本実施の形態におけるS−VOL111の複製をT−VOL112に作成する技術は、ここでは詳細には説明しないが、リモートコピー機能が記憶装置間でデータを二重化する技術であるのに対し、当該作成技術は同一記憶装置内でデータを二重化する技術を利用することができる。
この構成により、S−VOL111と同一記憶装置内のT−VOL112を一組のペア論理ボリュームとして、S−VOL111のデータをT−VOL112に二重化することができる。
<リモートコピーの詳細>
図3および図4により、本実施の形態に係るリモートコピーをさらに詳細に説明する。図3は、論理ボリュームのログデータとログデータ以外のデータのサイドファイル使用率に対する論理ボリュームのペア状態を示す説明図である。図4は、1日の運用におけるデータベースのデータ更新量の推移を示す説明図である。これらを用いて、本発明をさらに詳細に説明する。
図3および図4により、本実施の形態に係るリモートコピーをさらに詳細に説明する。図3は、論理ボリュームのログデータとログデータ以外のデータのサイドファイル使用率に対する論理ボリュームのペア状態を示す説明図である。図4は、1日の運用におけるデータベースのデータ更新量の推移を示す説明図である。これらを用いて、本発明をさらに詳細に説明する。
リモートコピーシステムにおいては、メインサイトのデータベース全体のデータの整合性を確保するために、データベース全体を1つのコンシステンシーグループに登録するが、そのコンシステンシーグループを2つの小グループに分割する。1つはログデータの論理ボリュームの小グループで、もう1つはログデータ以外のデータの論理ボリュームの小グループとする。そして、各小グループごとにサイドファイル116bの使用率の閾値を設定し、この閾値を越えると各小グループはリモートサイトへのデータ転送を中断する。
ここでは、ログデータの閾値を第1の閾値(1)とし、ログデータ以外のデータの閾値を第2の閾値(2)とし、閾値(2)<閾値(1)とすることで、各論理ボリュームの小グループのサイドファイル使用率に対する論理ボリュームのペアの状態は、図3のようになる。
すなわち、図3に示すように、ログデータの論理ボリュームの小グループでは、サイドファイル使用率<閾値(2)の場合、閾値(2)<サイドファイル使用率<閾値(1)の場合は共にデュプレックス状態、閾値(1)<サイドファイル使用率の場合はサスペンド状態となる。ログデータ以外のデータの論理ボリュームの小グループでは、サイドファイル使用率<閾値(2)の場合はデュプレックス状態、閾値(2)<サイドファイル使用率<閾値(1)の場合、閾値(1)<サイドファイル使用率の場合は共にサスペンド状態となる。
実際の運用では、1日の運用が、図4に示すように、一時的に更新量が大きくなるデータベースにおいては、状態(1)の時点では、データベース全体をリモートサイトへデータ転送し、状態(2)の時点では、ログデータのみをリモートサイトへ転送し、万が一障害が発生した場合にも、ログデータからの障害回復が可能となる。1日の運用が終了した時点が、静止点となる。
これにより、一時的なデータ更新のピーク値を考慮したデータ転送回線を契約しなくても、突発的なデータ増に対応可能なシステムを構築することが可能となる。但し、このような運用を行った場合、一度、状態(2)のような状態になり、ログデータ以外のデータのデータ転送が中断された場合には、自動的に再度データ転送を開始する機能が必要となるため、後述するデータ転送の自動再開機能を適用することにより、データの整合性を保つことが必要である。
なお、リモートサイトへのデータ転送においては、データベースのデータ更新量、すなわちサイドファイル116bに滞留するデータ量に着目する他に、公衆回線140上のデータ転送量に着目することも可能である。公衆回線140上のデータ転送量に着目する場合には、公衆回線や回線多重分離・公衆網I/F部における圧縮などの仕様を記憶装置で認識する仕組みを有することによって実現することができる。
<データ転送の自動再開機能>
図5により、データ転送の自動再開機能の一例を説明する。図5は、データ転送の自動再開機能において、1日の運用におけるデータベースのデータ更新量の推移(a)と、サイドファイル使用率の推移(b)を示す説明図である。
図5により、データ転送の自動再開機能の一例を説明する。図5は、データ転送の自動再開機能において、1日の運用におけるデータベースのデータ更新量の推移(a)と、サイドファイル使用率の推移(b)を示す説明図である。
本実施の形態においては、予想外のデータ更新が発生した場合においても、データベースのログデータはデータ転送が継続される。このため、万が一災害が発生した場合においても、リモートサイトにてデータベースの回復は可能となる。しかし、このままではログデータ以外のデータは転送されないので、転送を中断されたログデータ以外のデータを再度データ転送する必要がある。そこで、データ転送の自動再開機能を適用してデータの整合性を確保する。
ここで、図5に示すように、サイドファイル使用率の第3の閾値(A)を設定する。この閾値(A)は、閾値(1)および閾値(2)よりも低い値に設定される値である。メインセンタ101のメイン側記憶装置102は、サイドファイルの利用率がこの閾値(A)以下になったことを契機に、データ転送が中断されていた期間の分の更新データをリモートセンタ103に転送する。
ここで、図3のデュプレックスの状態について詳細に説明する。
メインサイトとリモートサイトの論理ボリューム(P−VOLとS−VOL)がペアとして設定されると、そのペアの態様(ステータス)に応じて、P−VOLに対して発生した書き込み処理が、S−VOLに対する各種の処理を行う契機となる。ペアの態様(ステータス)には、サスペンド状態、デュプレックス状態、初期コピー状態などがあり、ペアの態様(ステータス)が、デュプレックス状態の場合は、正論理ボリュームに書き込まれたデータが、副論理ボリュームにも書き込まれるという処理がなされ、サスペンド状態の場合は、正論理ボリュームに書き込まれたデータが、副論理ボリュームには反映されず、その更新された部分位置情報が差分ビットマップを用いてメイン側記憶装置102内に保持される。
つまり、一旦データ部分の転送がサスペンドによって中断されると、中断された期間に更新されたデータ位置情報はメイン側記憶装置102内のメモリ(ビットマップと呼ばれる)に保持される。そして、その後、ペア状態を再度構築する前にビットマップを参照して更新があった部分のデータのみがキャッシュ116a上から読み出されて、リモートサイトのリモート側記憶装置104へ転送される。この場合の転送は、更新の順序を保持して送信しないので、この転送中に何らかの障害が発生した場合には、リモート側記憶装置104の論理ボリュームのデータは、一貫性を失い、完全に回復することができなくなる(データベースのログ情報との整合性が取れなくなる)。
このことを防止するために、図1に示すように、リモートサイト側の論理ボリューム(S−VOL111−1〜111−n)のそれぞれとペア関係にある論理ボリューム(T−VOL112−1〜112−n)をリモート側記憶装置104内に保持して、S−VOLが一貫性を維持していたときの状態を保持する。この点に関しては、前述の通り、特開2002−189570号に詳しい(本発明にこの特開2002−189570号を援用する)。
前記図4で示したデータ更新が発生するリモートコピーシステムでは、図4:状態(1)が、閾値(2)以下である場合には、データベースのすべての更新データとログデータが転送される。
この場合の状態を図5を用いて説明する。図5(a)のデータ更新量を示すグラフは、ある期間ごとの平均データ更新量を示している。図5の状態(1)のように、データ更新量が低い場合(図4の状態(1))のような期間においては、サイドファイルの使用率も低くなる(図5の状態(1))。
そして、図4:状態(2)のようにデータ更新がピークになると、サイドファイル使用率が徐々に増加し始め(図5の状態(2))、閾値(2)を超えると、ログデータのデータ転送は継続されるが、ログデータ以外のデータのデータ転送は中断される(図5の状態(2)と(3)の境界)。
ログデータ以外のデータのデータ転送が中断されると、転送されるデータ更新量は減るため、サイドファイル使用率は徐々に下がり始める(図5の状態(3))。そして、サイドファイル使用率が閾値(A)以下となると(図5の再開ポイント)、中断されていたログデータ以外のデータのデータ転送が再開される(図5の状態(4))。
この点について、詳細に説明する。図5(b)の閾値(A)が示すように、サイドファイルの使用率が低い状態に戻った場合、再度、ログデータ以外のデータの転送を行うようにして、有効に通信回線の帯域を利用することが望ましい。併しながら、図5の状態(2)で、サイドファイルの使用率が、閾値(2)に達した時点で、ログデータ以外のデータの転送を止めている(ペアをサスペンドしている)ので、リモートサイトのデータを、まずサスペンドがされた時点のデータまで戻す必要がある。併せて、サイドファイルへの更新データの蓄積を開始する。
この場合のデータ転送は、上述の通り、ビットマップに保持された更新領域に対応する個所のデータを送信することで行う。この更新データ分の送信中は、データベースに対する更新順序の通りにデータの転送がされるわけではない。従って、その期間は後述するようにリモート側記憶装置104内のS−VOLとT−VOLをサスペンド状態にしておく必要がある。このT−VOLによって、データベースの更新順序順に更新されている状態を維持しておくことができる。この更新順序を維持しないデータ転送期間が終了した後、このS−VOLとT−VOLが再度、ペア状態に設定されることは言うまでもない。
なお、この更新順序を維持しないデータ転送の期間に何らかの障害が発生して、S−VOLが利用不可能になった場合、このT−VOLのデータイメージをログデータによって更新することで、リモートサイトに再度、整合性のとれたデータを復元することができる。
その後、サイドファイルに蓄積されているデータのデータ転送を開始し、リモート側記憶装置104は、そのデータでS−VOLの更新を行う。つまり、この再開されたデータ転送では、中断中のデータ更新も転送され、1日の運用における静止点までに全て転送が完了すれば、ディザスタリカバリ運用は継続可能である。
なお、サイドファイル使用率が閾値(1)を超えるような場合には、ログデータ以外のデータの他に、ログデータのデータ転送も中断し、サイドファイル使用率が下がった時点で、中断されていたログデータ、ログデータ以外のデータの順にデータ転送を再開することも可能である。ログデータのデータ転送の再開ポイントは、たとえば閾値(A)と閾値(2)との間の第4の閾値とする。この場合も、中断中のデータはログデータもそれ以外のデータも差分ビットマップで管理され、再開に先立って、それらビットマップ上の差分データがまず転送される点は上述の通りである。
これらの機能は、このマイクロプロセッサの制御を規定するマイクロプログラムによって実現される。メイン側記憶装置102のマイクロプロセッサ119や記憶制御部120などのマイクロプロセッサは、このマイクロプログラムによって、上述のような制御を実行するのである。
<リモートサイトのデータ回復方法>
図6により、リモート側記憶装置104のデータ回復方法の一例を説明する。図6は、ログデータとログデータ以外のデータの論理ボリュームを作成する場合を示す説明図である。
図6により、リモート側記憶装置104のデータ回復方法の一例を説明する。図6は、ログデータとログデータ以外のデータの論理ボリュームを作成する場合を示す説明図である。
本実施の形態において、図6に示すように、P−VOL108、S−VOL111、T−VOL112を構成する論理ボリュームを、ログデータ(LOG)のファイルの論理ボリューム(論理ユニット:LU)と、ログデータ以外のデータ(DB)のファイルの論理ボリューム(論理ユニット:LU)とに分けて管理することにより、ログデータ以外のデータを転送できなかった場合でも、リモート側記憶装置104のS−VOL111のログデータ以外のデータ部分の回復が可能となる。
まず、ログデータ以外のデータ部分を蓄積する論理ボリュームのみがサスペンドされた状態で、何らかの障害が発生された場合について説明する。LOGファイルの内容は、(1)ログ通番(時刻を含む)、(2)ログレコードの種別、(3)更新前の状態/内容のログ、(4)更新後の状態/内容のログ、(5)付属情報、などからなる。これらのログデータの内容で、リモートセンタ103側のT−VOL112を更新すればよい。その処理は、リモート側記憶装置104の制御部を用いて行ってもよいし、一旦リモートサイト側の上位装置がログデータを読み出して、上位装置側のデータベースアプリケーションがそのログデータに相当するコマンドをリモート側記憶装置104のS−VOL111に対して発行するようにしてもよい。
一方、ログデータ部分を蓄積するP−VOL108とS−VOL111がサスペンドされている場合に何らかの障害が発生した場合には、リモート側記憶装置104のT−VOL112のログデータで、必要な場合に、S−VOL111のデータの回復処理を行えばよい。ここで必要な場合としたのは、T−VOL112のログデータで回復できる分までのデータを既にT−VOL112のログデータ以外のデータ部が有している場合があるので、その場合はこの処理は必要ない。
データの回復作業は、(1)ログデータの通番順に、(3)更新前の状態/内容のログを確認しながら、(4)更新後の状態/内容のログの内容に書き換えていく作業を繰り返すことにより実行される。
いずれにしても、データの回復は、整合性の取れているデータとログファイルで行うので、ログファイルのクリアタイミングはバックアップのタイミングとなり、運用上の問題が生じることはない。
実際に障害が発生した場合のデータの回復方法には、以下の4つのケースが考えられ、順に説明する。なお、このような場合において、リモートサイトとメインサイトのそれぞれに接続される上位装置は、互いに通信してメインサイトが終了したジョブまでの情報をリモートサイトに引き継ぐように構成する(フェイルオーバー機能)。
(1)ケース1
LOGファイルを蓄積するP−VOLと、DBファイルを蓄積するP−VOLの両方がペア関係を維持している状態での転送の場合、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのコピーが中断される。この場合、S−VOL111のデータは整合性のとれたデータなので、T−VOL112へ記憶装置104内コピーを行い、上位装置106上のデータベースアプリケーションの機能で、データベースの回復処理を行う。T−VOL112内のログデータと、データベースのチェックポイント機能などとを利用して、DBファイル上のデータを更新する。これにより、データベースアプリケーションが障害発生直前までに行った分の処理を再現して、T−VOL112に構成されたデータベースの復元を行う。
LOGファイルを蓄積するP−VOLと、DBファイルを蓄積するP−VOLの両方がペア関係を維持している状態での転送の場合、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのコピーが中断される。この場合、S−VOL111のデータは整合性のとれたデータなので、T−VOL112へ記憶装置104内コピーを行い、上位装置106上のデータベースアプリケーションの機能で、データベースの回復処理を行う。T−VOL112内のログデータと、データベースのチェックポイント機能などとを利用して、DBファイル上のデータを更新する。これにより、データベースアプリケーションが障害発生直前までに行った分の処理を再現して、T−VOL112に構成されたデータベースの復元を行う。
(2)ケース2
P−VOL108からS−VOL111へのデータの転送量が多いため、DBファイルのデータ転送のみが中断されているときに、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのLOGファイルのコピーが中断される。この状態では、直近のLOGファイルはあるが、直近のDBファイルはない。併しながら、T−VOL112に前回静止点でのDBファイルがあるので、S−VOL111のLOGファイルをT−VOL112のLOGファイルにコピーして、上位装置上のデータベースアプロケーションの機能で、T−VOL112のLOGファイルとDBファイルを用いてデータベースの復元を行う。
P−VOL108からS−VOL111へのデータの転送量が多いため、DBファイルのデータ転送のみが中断されているときに、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのLOGファイルのコピーが中断される。この状態では、直近のLOGファイルはあるが、直近のDBファイルはない。併しながら、T−VOL112に前回静止点でのDBファイルがあるので、S−VOL111のLOGファイルをT−VOL112のLOGファイルにコピーして、上位装置上のデータベースアプロケーションの機能で、T−VOL112のLOGファイルとDBファイルを用いてデータベースの復元を行う。
(3)ケース3
P−VOL108からS−VOL111へのデータの転送量が多いときには、DBファイルのデータ転送のみが中断された後に、データ転送の自動再開機能によりコピーが再開されるが、そのコピーがサイドファイルを利用する更新順序を保証するものではなく、ビットマップ上の差分データの転送をしている状態で、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのLOGファイルのコピーが中断される。この状態では、前記ケース2と同様、S−VOL111のDBファイルには整合性が無いため、ケース2と同様に、T−VOL112を更新する方式により、データベースの復元を行う。
P−VOL108からS−VOL111へのデータの転送量が多いときには、DBファイルのデータ転送のみが中断された後に、データ転送の自動再開機能によりコピーが再開されるが、そのコピーがサイドファイルを利用する更新順序を保証するものではなく、ビットマップ上の差分データの転送をしている状態で、メインサイトに障害が発生した場合には、まずP−VOL108からS−VOL111へのLOGファイルのコピーが中断される。この状態では、前記ケース2と同様、S−VOL111のDBファイルには整合性が無いため、ケース2と同様に、T−VOL112を更新する方式により、データベースの復元を行う。
(4)ケース4
P−VOL108からS−VOL111へのデータの転送量が多く、LOGファイルおよびDBファイルのどちらもデータ転送が中断されている状態で、メインサイトに障害が発生した場合、もしくはデータ転送の自動再開機能によりコピーが再開されているが、LOGファイルおよびDBファイルのどちらもコピーが差分コピーである状態で、メインサイトに障害が発生した場合は、S−VOL111のLOGファイルおよびDBファイルには整合性が無いため、T−VOL112のLOGファイルとDBファイルにてデータベースの回復を行う。
P−VOL108からS−VOL111へのデータの転送量が多く、LOGファイルおよびDBファイルのどちらもデータ転送が中断されている状態で、メインサイトに障害が発生した場合、もしくはデータ転送の自動再開機能によりコピーが再開されているが、LOGファイルおよびDBファイルのどちらもコピーが差分コピーである状態で、メインサイトに障害が発生した場合は、S−VOL111のLOGファイルおよびDBファイルには整合性が無いため、T−VOL112のLOGファイルとDBファイルにてデータベースの回復を行う。
但し、静止点において計画的にコピーがされた状態で、メインサイトに障害が発生した場合には、S−VOL111のLOGファイルもDBファイルも整合性があるため、S−VOL111のLOGファイルとDBファイルのデータをT−VOL112にコピーしてデータベースとして使用する。
<データ転送機能の設定方法>
図7〜図10により、データ転送機能の設定方法の一例を説明する。図7は、データ転送機能の設定方法において、設定したいLUを選択する場合を示す説明図である。図8は、コピー先VOL、コンシステンシーグループを設定する場合を示す説明図である。図9は、設定するコンシステンシーグループを選択する場合を示す説明図である。図10は、サイドファイルの要領を設定する場合を示す説明図である。
図7〜図10により、データ転送機能の設定方法の一例を説明する。図7は、データ転送機能の設定方法において、設定したいLUを選択する場合を示す説明図である。図8は、コピー先VOL、コンシステンシーグループを設定する場合を示す説明図である。図9は、設定するコンシステンシーグループを選択する場合を示す説明図である。図10は、サイドファイルの要領を設定する場合を示す説明図である。
本実施の形態において、記憶装置のデータ転送機能の設定は、前記図2のサービスプロセッサ121によって行われる。
具体的には、まず、図7の画面より、設定したいLUを選択する。この画面の例では、記憶装置のCU#0Dにおいて、PortがCL2−A、Groupが0D、LUN(Logical Unit Number)が05(0D:C5)が選択される。
さらに、図7のポップアップメニューより図8の画面を出すことにより、コピー先VOLの設定や、コンシステンシーグループを設定する。この画面の例では、コピー元であるP−VOLのCL1−A−00−0Aに対して、コピー先のS−VOLとしてCL1−Aが設定され、CT Groupとして02が設定される。
さらに、コンシステンシーグループ内の小グループも設定する。このとき、小グループがサスペンドするときのサイドファイルの閾値も設定する。このコンシステンシーグループの設定は、図9のコンシステンシーグループ(CTG)の一覧から、設定するコンシステンシーグループを選択する。この画面の例では、CTGの10が選択される。
また、小グループの詳細設定は、図10の画面にて、サイドファイルの要領などを設定する。この画面の例では、Pending Update Data Rateとして50%、Offloading Timerとして90sec、I/O Delay Startとして30%、I/O Delay Increaseとして40%が設定される。
<リモートデータ転送の制御>
図11により、リモートデータ転送の制御方法の一例を説明する。図11は、リモートデータ転送の制御方法を示すフロー図である。
図11により、リモートデータ転送の制御方法の一例を説明する。図11は、リモートデータ転送の制御方法を示すフロー図である。
リモートデータ転送の制御は、上位装置105からの書き込み要求コマンドをメイン側記憶装置102が受領することにより開始される。
具体的には、メイン側記憶装置102において、インタフェース制御部115が上位装置105からの書き込みデータ要求を受信する(S201)。そして、受信した書き込みデータはキャッシュ116aに記憶される(S202)。なお、キャッシュ116aにデータが記憶された時点で、そのデータの記憶は保証され、このデータは記憶制御部120を介してP−VOL108に記憶される。
次に、メイン側記憶装置102の記憶制御部120は、このシステムが差分データ転送方式で、データを転送している状態であるかを判定する(S203)。この判定結果が、差分データ転送方式でのデータ転送中である場合(YES)については後述する。
S203の判定の結果、データ転送中でない場合(NO)は、S201で受信された書き込みコマンドに基づいて、ログデータもキャッシュ116aに蓄積される。このログデータと書き込みデータは、データ転送用のサイドファイル116bに蓄積され、その滞留量(サイドファイル使用率)は、インタフェース制御部115に接続されたマイクロプロセッサ119によって監視されている(S204)。
そして、その滞留量が図4に示す閾値(2)よりも少ない場合(NO)には、そのログデータおよびログデータ以外のデータは、順次二重化のためにリモートセンタ103のリモート側記憶装置104へ転送され、リモート側記憶装置104内のキャッシュ116aに書き込まれる(S205)。この場合の転送は、必ずしもデータ受領後に直ちに行われるのではなく、一旦サイドファイル116bに蓄積されてその蓄積順に従って、通信回線の帯域が許す限り順次転送していく。当然、更新データが増加すれば、徐々にサイドファイル116bに滞留するデータが増加する。すなわち、サイドファイル116bの使用率が増加する。
リモート側記憶装置104では、サイドファイル116bを経由して受領したデータをメイン側記憶装置102側のP−VOL108に書き込まれたのと同様に、キャッシュ116aに一旦保持し、その後S−VOL111に記憶する。いずれにしても、P−VOL108とS−VOL111のペアの状態がデュプレックス状態(二重化状態)である限り、サイドファイル116b上にその更新データは順次蓄積される。
ここで、マイクロプロセッサ119が、サイドファイル116bのデータ滞留量(サイドファイルの使用率)が、図4に示す閾値(2)よりも大きく、閾値(1)よりも小さいと判定した場合(YES)には、メイン側記憶装置102およびリモート側記憶装置104内の記憶制御部120が、ログデータ以外のデータを保持するP−VOL108とS−VOL111とのペア状態をペアステータスからサスペンドステータスに移行させる(S206)。この場合においても、サイドファイル116b上のデータの転送は順次継続されている。但し、P−VOL108とS−VOL111の状況がサスペンド状態に移行した場合は、更新データはサイドファイル116b上に蓄積されず、更新した位置情報だけをメイン側記憶装置102のビットマップ上に保持することとなる。
そして、メイン側記憶装置102内の記憶制御部120は、リモート側記憶装置104に、サスペンド状態時のデータ確保要求を通知する(S207)。このデータ確保要求を受領したリモート側記憶装置104内の記憶制御部120は、ログデータ以外のデータを蓄積するS−VOL111とT−VOL112をサスペンド状態に移行させる(S208、S209)。
S209について説明する。リモート側記憶装置104内のS−VOL111とT−VOL112は、S−VOL111とメイン側記憶装置102内のP−VOL108とのペア状態がデュプレックス状態である場合には、同様にペアの状態を維持しているように運用するとよい。この場合、S−VOL111のデータが更新されるのと同期してT−VOL112内のデータも更新されるので、S−VOL111とT−VOL112は同様のデータイメージを保持する。リモート側記憶装置104内のS−VOL111とT−VOL112とがこのように同期コピーをリモート側記憶装置104内で行うように制御しない場合は、S208が示すサスペンド状態時のデータ確保要求を受信した場合に、内部コピー機能により、S−VOL111とT−VOL112との間のデータの同期化(S−VOLからT−VOLへのコピーなど)処理を行う。
そして、S−VOL111とP−VOL108がサスペンド状態になったタイミングで、S−VOL111とT−VOL112をサスペンドすれば、T−VOL112は、少なくともデータの順序性が保持されている状態のS−VOL111と同様のデータイメージを保持し続けることが可能になる。リモート側記憶装置104の記憶制御部120は、サスペンド状態への移行が完了したことを、メイン側記憶装置102の記憶制御部120に通知する(S210)。
メイン側記憶装置102の記憶制御部120は、リモート側記憶装置104からのコピー完了通知、またはS−VOL111とT−VOL112のサスペンド完了通知を受領する(S211)。そして、上位装置105から受領した書き込みデータはメイン側記憶装置102のビットマップ上に蓄積する(S212)。
ところで、S204の説明において、マイクロプロセッサ119が、サイドファイル116bのデータ滞留量(サイドファイルの使用率)が、図4に示す閾値(2)よりも大きく、閾値(1)よりも小さいと判定した場合について説明したが、閾値(1)よりもサイドファイル116bの使用率が高い場合には、ログデータを保持する論理ボリューム間のみならず、ログデータ以外のデータを保持する論理ボリューム間もサスペンド状態に移行させる。
以上が、サイドファイル116bでのリモートコピー状態から差分データ転送方式(ビットマップ上に更新データを保持しておく方式)への移行の手順を示す説明である。
次に、図12を用いてビットマップ上に蓄積された更新データをリモート側記憶装置104に送信する場合の手順について説明する。
メイン側記憶装置102は、上位装置105からの書き込み命令を受領すると(S301)、キャッシュ116aにその情報を蓄積する。併せて、ビットマップ上にその更新されたデータの位置情報を保持する(S302)。キャッシュ116aの一部をビットマップとして利用する方法もある。
次に、メイン側記憶装置102のマイクロプロセッサ119は、サイドファイル116bの使用率を判定する(S303)。図4に示す閾値(A)よりも使用率が低くなったことを判定した場合(YES)は、差分データの送信を開始する(S304)。この間のP−VOL108とS−VOL111のペア状態はサスペンド状態からリシンク状態へと移行する。このリシンク状態において、メイン側記憶装置102は、ビットマップ上に記録されたデータ更新個所に相当するデータをキャッシュ116aから読み出して、リモート側記憶装置104のS−VOL111に書き込み命令として発行する。
この差分データの転送時は、ビットマップ上で更新された部分が示されている更新データをアドレスの先頭から送信するので、リモートセンタ側のS−VOL111は、更新順序を維持することができない。但し、この場合、図11で示すS208〜S210によって、T−VOL112上に順序性を保持したデータが蓄積されているので、この差分データの転送(S304)の間に何らかの通信障害や、メイン側記憶装置102の障害が発生した場合でもリモート側記憶装置104のデータが完全に喪失されることを防ぐことができる。
なお、メイン側記憶装置102が、差分データの送信が開始された後に、上位装置105から受領したデータは、図11のS202〜S204に至る過程で説明したとおり、サイドファイル116bの使用率が所定の閾値よりも低い場合には、サイドファイル116b上に蓄積されていく。差分データの転送中、その完了は、メイン側記憶装置102内の記憶制御部120で随時監視され、差分データの転送が完了した場合には、サイドファイル116bの使用率が所定の閾値を越えない間は、随時サイドファイル116bのデータを転送する処理に戻る。
次に、図11のS203で、差分データ転送方式で差分データが転送されている場合(YES)について説明する。
差分データの転送がされている間に受領した更新データは、そのデータが書き込まれた領域に対応するエリアが既にリモートサイトのリモート側記憶装置104に送信済みである場合には、直ちにリモートサイトに送信して書き込みを行う。まだ、送信がされていない場合は、差分ビットマップの更新位置に対応する個所のビットをオンにしておけばよい。その後、転送されるからである。
このように、リモート側記憶装置104で更新順序が保証されている個所までのデータを別の記憶領域に退避するようにすれば、メイン側記憶装置102からの差分コピーデータの送信(回復コピー)の間に、メイン側記憶装置102のメインサイトに何らかの障害が発生して回復コピーが中断しても、リモート側記憶装置104に即切り替えて、運用移行が迅速に行える。しかも、T−VOL112に退避されたデータを使用してデータの二重化を速やかに再開できる。
よって、サイドファイル116bの滞留量を監視し、その監視に応じて、サスペンド状態への移行制御、およびデータの二重化状態への移行制御といったリモート転送機能の制御を自動的に行うことができる。
<本実施の形態の効果>
(1)サイドファイル116bに滞留するデータ量を監視し、この監視の結果、サイドファイル116bへ滞留するデータ量が閾値を越えた場合に、コンシステンシーグループ内の全ての論理ボリュームのデータ転送を停止することなく、設定されたサイドファイル116bの使用率の低い方の小グループからデータ転送を自動的に中断することができる。特に、ログデータ以外のデータの論理ボリュームの小グループのデータ転送を中断することができ、必要に応じて、ログデータの論理ボリュームの小グループのデータ転送を中断することも可能となる。
(1)サイドファイル116bに滞留するデータ量を監視し、この監視の結果、サイドファイル116bへ滞留するデータ量が閾値を越えた場合に、コンシステンシーグループ内の全ての論理ボリュームのデータ転送を停止することなく、設定されたサイドファイル116bの使用率の低い方の小グループからデータ転送を自動的に中断することができる。特に、ログデータ以外のデータの論理ボリュームの小グループのデータ転送を中断することができ、必要に応じて、ログデータの論理ボリュームの小グループのデータ転送を中断することも可能となる。
(2)サイドファイル116bに滞留するデータ量を監視し、この監視の結果、サイドファイル116bへ滞留するデータ量が閾値未満になった場合に、データ転送を中断していた小グループのデータ転送を自動的に再開することができる。特に、ログデータ以外のデータの論理ボリュームの小グループのデータ転送を再開することができ、必要に応じて、ログデータの論理ボリュームの小グループのデータ転送を再開することも可能となる。
(3)万が一災害が発生した場合に、データ転送の中断と再開の自動化により、リモートサイトのログデータおよびログデータ以外のデータを用いてデータベースを復元することができる。
(4)使用する公衆回線140の帯域は、データ転送のピーク時の帯域以下の帯域での運用が可能となるので、データ転送に必要な公衆回線を極小化し、運用コストを低減することができる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
本発明のリモートコピーシステムの制御技術は、低コストであるにも関わらず、障害に対する回復の早い記憶システムの構築に適用して有効である。
101…メインセンタ、102…メイン側記憶装置、103…リモートセンタ、104…リモート側記憶装置、105…上位装置、106…上位装置、107…インタフェースケーブル、108…プライマリ論理ボリューム、109…インタフェースケーブル、110…インタフェースケーブル、111…セカンダリ論理ボリューム、112…ターゲット論理ボリューム、113…アプリケーション、114…アプリケーション、115…インタフェース制御部、116…メモリ、117…リモートコピー制御情報格納部、118…磁気ディスクドライブ、119…マイクロプロセッサ、120…記憶制御部、121…サービスプロセッサ、130…回線多重分離・公衆網I/F部、131…回線多重分離・公衆網I/F部、140…公衆回線。
Claims (20)
- 第1の記憶装置と、第2の記憶装置とを有し、前記第1の記憶装置のデータを前記第2の記憶装置へデータ転送するリモートコピーシステムであって、
前記第1の記憶装置および前記第2の記憶装置のそれぞれは、外部からのデータ授受を行うインタフェース制御部と、前記データを一時的に格納するメモリと、前記データを記録するディスクドライブと、前記メモリ上のデータを監視するマイクロプロセッサと、前記メモリ上のデータの前記ディスクドライブへの書き込みや読み出しを制御するディスク制御部と、記憶装置の設定管理を行うサービスプロセッサとを有し、
前記第1の記憶装置の前記メモリは、データ転送のための情報を格納するサイドファイルを有し、
前記第1の記憶装置の前記サービスプロセッサは、データの更新順序を保障する論理ボリュームのグループをログデータを蓄積する論理ボリュームのグループとログデータ以外の論理ボリュームのグループとに区分して、この区分したグループごとに、データ転送を中断するサイドファイルの使用率を設定する機能を有することを特徴とするリモートコピーシステム。 - 請求項1記載のリモートコピーシステムにおいて、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルに滞留するデータ量を監視し、この監視の結果、前記サイドファイルへ滞留するデータ量が閾値を越えた場合に、前記グループ内の全ての論理ボリュームのうち、前記設定されたサイドファイルの使用率の低い方のグループからデータ転送を中断するように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項2記載のリモートコピーシステムにおいて、
前記第1の記憶装置の前記マイクロプロセッサは、前記監視の結果、前記サイドファイルへ滞留するデータ量が閾値未満になった場合に、前記データ転送を中断していたグループのデータ転送を再開するように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項3記載のリモートコピーシステムにおいて、
前記第1の記憶装置の前記サービスプロセッサは、前記ログデータの論理ボリュームのグループのサイドファイルの使用率を高く設定し、前記ログデータ以外の論理ボリュームのグループのサイドファイルの使用率を低く設定し、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルへ滞留するデータ量が第2の閾値を越えた場合に、前記ログデータ以外の論理ボリュームのグループのデータ転送を中断し、前記第2の閾値より低い第3の閾値未満になった場合に、前記データ転送を中断していた前記ログデータ以外の論理ボリュームのグループのデータ転送を再開することを特徴とするリモートコピーシステム。 - 請求項4記載のリモートコピーシステムにおいて、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルへ滞留するデータ量が前記第2の閾値より高い第1の閾値を越えた場合に、前記ログデータの論理ボリュームのグループのデータ転送を中断し、前記第1の閾値より低い第4の閾値未満になった場合に、前記データ転送を中断していた前記ログデータの論理ボリュームのグループのデータ転送を再開することを特徴とするリモートコピーシステム。 - 請求項5記載のリモートコピーシステムにおいて、
前記第1の記憶装置の前記ディスクドライブは、第1の論理ボリュームを有し、
前記第2の記憶装置の前記ディスクドライブは、第2の論理ボリュームと第3の論理ボリュームとを有し、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送して記憶装置間コピーを行い、前記第2の論理ボリュームから前記第3の論理ボリュームへ記憶装置内コピーを行うように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項6記載のリモートコピーシステムにおいて、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータおよび前記ログデータ以外のデータの両方が前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送されている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのコピーを中断し、前記第2の論理ボリュームから前記第3の論理ボリュームへ記憶装置内コピーを行い、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項6記載のリモートコピーシステムにおいて、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータが前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送され、前記ログデータ以外のデータのデータ転送が中断されている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのログデータのコピーを中断し、前記第2の論理ボリュームのログデータを前記第3の論理ボリュームにコピーして、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項6記載のリモートコピーシステムにおいて、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータが前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送され、前記ログデータ以外のデータのデータ転送が中断された後に再開され、差分データのコピーが行われている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのログデータのコピーを中断し、前記第2の論理ボリュームのログデータを前記第3の論理ボリュームにコピーして、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有することを特徴とするリモートコピーシステム。 - 請求項6記載のリモートコピーシステムにおいて、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータおよび前記ログデータ以外のデータのデータ転送が中断されている状態で、または中断された後に再開され、差分データのコピーが行われている状態で、前記第1の記憶装置に障害が発生した場合、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御する機能を有することを特徴とするリモートコピーシステム。 - 第1の記憶装置と、第2の記憶装置とを有し、前記第1の記憶装置のデータを前記第2の記憶装置へデータ転送するリモートコピーシステムの制御方法であって、
前記第1の記憶装置および前記第2の記憶装置のそれぞれは、外部からのデータ授受を行うインタフェース制御部と、前記データを一時的に格納するメモリと、前記データを記録するディスクドライブと、前記メモリ上のデータを監視するマイクロプロセッサと、前記メモリ上のデータの前記ディスクドライブへの書き込みや読み出しを制御するディスク制御部と、記憶装置の設定管理を行うサービスプロセッサとを有し、
前記第1の記憶装置の前記メモリは、データ転送のための情報を格納するサイドファイルを有し、
前記第1の記憶装置の前記サービスプロセッサは、データの更新順序を保障する論理ボリュームのグループをログデータを蓄積する論理ボリュームのグループとログデータ以外の論理ボリュームのグループとに区分して、この区分したグループごとに、データ転送を中断するサイドファイルの使用率を設定することを特徴とするリモートコピーシステムの制御方法。 - 請求項11記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルに滞留するデータ量を監視し、この監視の結果、前記サイドファイルへ滞留するデータ量が閾値を越えた場合に、前記グループ内の全ての論理ボリュームのうち、前記設定されたサイドファイルの使用率の低い方のグループからデータ転送を中断するように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項12記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置の前記マイクロプロセッサは、前記監視の結果、前記サイドファイルへ滞留するデータ量が閾値未満になった場合に、前記データ転送を中断していたグループのデータ転送を再開するように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項13記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置の前記サービスプロセッサは、前記ログデータの論理ボリュームのグループのサイドファイルの使用率を高く設定し、前記ログデータ以外の論理ボリュームのグループのサイドファイルの使用率を低く設定し、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルへ滞留するデータ量が第2の閾値を越えた場合に、前記ログデータ以外の論理ボリュームのグループのデータ転送を中断し、前記第2の閾値より低い第3の閾値未満になった場合に、前記データ転送を中断していた前記ログデータ以外の論理ボリュームのグループのデータ転送を再開することを特徴とするリモートコピーシステムの制御方法。 - 請求項14記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置の前記マイクロプロセッサは、前記サイドファイルへ滞留するデータ量が前記第2の閾値より高い第1の閾値を越えた場合に、前記ログデータの論理ボリュームのグループのデータ転送を中断し、前記第1の閾値より低い第4の閾値未満になった場合に、前記データ転送を中断していた前記ログデータの論理ボリュームのグループのデータ転送を再開することを特徴とするリモートコピーシステムの制御方法。 - 請求項15記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置の前記ディスクドライブは、第1の論理ボリュームを有し、
前記第2の記憶装置の前記ディスクドライブは、第2の論理ボリュームと第3の論理ボリュームとを有し、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送して記憶装置間コピーを行い、前記第2の論理ボリュームから前記第3の論理ボリュームへ記憶装置内コピーを行うように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項16記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータおよび前記ログデータ以外のデータの両方が前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送されている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのコピーを中断し、前記第2の論理ボリュームから前記第3の論理ボリュームへ記憶装置内コピーを行い、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項16記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータが前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送され、前記ログデータ以外のデータのデータ転送が中断されている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのログデータのコピーを中断し、前記第2の論理ボリュームのログデータを前記第3の論理ボリュームにコピーして、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項16記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータが前記第1の論理ボリュームから前記第2の論理ボリュームへデータ転送され、前記ログデータ以外のデータのデータ転送が中断された後に再開され、差分データのコピーが行われている状態で、前記第1の記憶装置に障害が発生した場合、前記第1の論理ボリュームから前記第2の論理ボリュームへのログデータのコピーを中断し、前記第2の論理ボリュームのログデータを前記第3の論理ボリュームにコピーして、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御することを特徴とするリモートコピーシステムの制御方法。 - 請求項16記載のリモートコピーシステムの制御方法において、
前記第1の記憶装置および前記第2の記憶装置の前記マイクロプロセッサは、前記ログデータおよび前記ログデータ以外のデータのデータ転送が中断されている状態で、または中断された後に再開され、差分データのコピーが行われている状態で、前記第1の記憶装置に障害が発生した場合、前記第3の論理ボリュームのログデータおよびログデータ以外のデータを用いてデータベースを復元するように制御することを特徴とするリモートコピーシステムの制御方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004324680A JP2006134204A (ja) | 2004-11-09 | 2004-11-09 | リモートコピーシステムおよびその制御方法 |
US11/023,430 US20060101213A1 (en) | 2004-11-09 | 2004-12-29 | Remote copy system and control method thereof |
US11/896,587 US20080010424A1 (en) | 2004-11-09 | 2007-09-04 | Remote copy system and control method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004324680A JP2006134204A (ja) | 2004-11-09 | 2004-11-09 | リモートコピーシステムおよびその制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006134204A true JP2006134204A (ja) | 2006-05-25 |
Family
ID=36317692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004324680A Withdrawn JP2006134204A (ja) | 2004-11-09 | 2004-11-09 | リモートコピーシステムおよびその制御方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US20060101213A1 (ja) |
JP (1) | JP2006134204A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257364A (ja) * | 2007-04-02 | 2008-10-23 | Hitachi Ltd | ストレージ装置及びボリューム復元方法 |
JP2008305288A (ja) * | 2007-06-11 | 2008-12-18 | Hitachi Ltd | 情報システム、および、情報システムの情報保存方法 |
JP2009087184A (ja) * | 2007-10-02 | 2009-04-23 | Nippon Telegr & Teleph Corp <Ntt> | データバックアップ方法、情報処理装置、復元処理装置、プログラム及び記録媒体 |
JP2009251972A (ja) * | 2008-04-07 | 2009-10-29 | Nec Corp | ストレージシステム |
WO2011039803A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社日立製作所 | ストレージシステム及びストレージシステムにおけるデータ複製方法 |
US8458420B2 (en) | 2008-08-19 | 2013-06-04 | International Business Machines Corporation | Executing host data transfer operations during setup of copy services operations |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006112937A2 (en) | 2005-02-17 | 2006-10-26 | Overland Storage, Inc. | Tape library emulation with automatic configuration and data retention |
US7672979B1 (en) * | 2005-04-22 | 2010-03-02 | Symantec Operating Corporation | Backup and restore techniques using inconsistent state indicators |
US7647525B2 (en) * | 2006-03-31 | 2010-01-12 | Emc Corporation | Resumption of operations following failover in connection with triangular asynchronous replication |
US7930497B2 (en) * | 2008-01-10 | 2011-04-19 | International Business Machines Corporation | Using multiple sidefiles to buffer writes to primary storage volumes to transfer to corresponding secondary storage volumes in a mirror relationship |
US9063993B2 (en) * | 2008-01-31 | 2015-06-23 | Microsoft Technology Licensing, Llc | Coexistence tools for synchronizing properties between on-premises customer locations and remote hosting services |
US8032730B2 (en) * | 2008-05-15 | 2011-10-04 | Hitachi, Ltd. | Method and apparatus for I/O priority control in storage systems |
JP5366480B2 (ja) | 2008-08-27 | 2013-12-11 | 株式会社日立製作所 | 計算機システム及びそのバックアップ方法 |
US8838920B2 (en) | 2010-11-17 | 2014-09-16 | International Business Machines Corporation | Determining whether to extend a drain time to copy data blocks from a first storage to a second storage |
US9223843B1 (en) * | 2013-12-02 | 2015-12-29 | Amazon Technologies, Inc. | Optimized log storage for asynchronous log updates |
US9626367B1 (en) | 2014-06-18 | 2017-04-18 | Veritas Technologies Llc | Managing a backup procedure |
US9921776B2 (en) * | 2016-08-22 | 2018-03-20 | International Business Machines Corporation | Efficient sidefile utilization in asynchronous data replication systems |
US10929041B1 (en) * | 2019-09-04 | 2021-02-23 | Amazon Technologies, Inc. | Block-storage service supporting multi-attach |
US10983717B1 (en) * | 2020-05-01 | 2021-04-20 | EMC IP Holding Company LLC | Uninterrupted block-based restore using a conditional construction container |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5933653A (en) * | 1996-05-31 | 1999-08-03 | Emc Corporation | Method and apparatus for mirroring data in a remote data storage system |
JP2002189570A (ja) * | 2000-12-20 | 2002-07-05 | Hitachi Ltd | 記憶システムの二重化方法および記憶システム |
JP2004303122A (ja) * | 2003-04-01 | 2004-10-28 | Hitachi Ltd | データ転送制御システム |
US7120825B2 (en) * | 2003-06-06 | 2006-10-10 | Hewlett-Packard Development Company, L.P. | Adaptive batch sizing for asynchronous data redundancy |
-
2004
- 2004-11-09 JP JP2004324680A patent/JP2006134204A/ja not_active Withdrawn
- 2004-12-29 US US11/023,430 patent/US20060101213A1/en not_active Abandoned
-
2007
- 2007-09-04 US US11/896,587 patent/US20080010424A1/en not_active Abandoned
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008257364A (ja) * | 2007-04-02 | 2008-10-23 | Hitachi Ltd | ストレージ装置及びボリューム復元方法 |
JP2008305288A (ja) * | 2007-06-11 | 2008-12-18 | Hitachi Ltd | 情報システム、および、情報システムの情報保存方法 |
JP2009087184A (ja) * | 2007-10-02 | 2009-04-23 | Nippon Telegr & Teleph Corp <Ntt> | データバックアップ方法、情報処理装置、復元処理装置、プログラム及び記録媒体 |
JP2009251972A (ja) * | 2008-04-07 | 2009-10-29 | Nec Corp | ストレージシステム |
US8458420B2 (en) | 2008-08-19 | 2013-06-04 | International Business Machines Corporation | Executing host data transfer operations during setup of copy services operations |
US8782366B2 (en) | 2008-08-19 | 2014-07-15 | International Business Machines Corporation | Executing host data transfer operations during setup of copy services operations |
WO2011039803A1 (ja) * | 2009-09-29 | 2011-04-07 | 株式会社日立製作所 | ストレージシステム及びストレージシステムにおけるデータ複製方法 |
JP5331892B2 (ja) * | 2009-09-29 | 2013-10-30 | 株式会社日立製作所 | ストレージシステム及びストレージシステムにおけるデータ複製方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080010424A1 (en) | 2008-01-10 |
US20060101213A1 (en) | 2006-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6978347B2 (en) | Method and apparatus for re-synchronizing paired volumes via communication line | |
US20080010424A1 (en) | Remote copy system and control method thereof | |
US7370228B2 (en) | Data processing system and copy processing method thereof | |
US7185152B2 (en) | Storage system, method of controlling storage system, and storage device | |
US7802137B2 (en) | Journaling system switching to another logical volume to store subsequently received update history | |
US7320058B2 (en) | Apparatus and method for online data migration with remote copy | |
US7398367B2 (en) | Storage subsystem that connects fibre channel and supports online backup | |
US8108606B2 (en) | Computer system and control method for the computer system | |
US7260625B2 (en) | Data center system and method for controlling the same | |
CN100570574C (zh) | 用于管理存储系统之间的数据拷贝的系统和方法 | |
JP5352115B2 (ja) | ストレージシステム及びその監視条件変更方法 | |
US20030177321A1 (en) | Data synchronization of multiple remote storage after remote copy suspension | |
JP5286212B2 (ja) | ストレージクラスタ環境でのリモートコピー制御方法及びシステム | |
US7013371B2 (en) | Data transfer control system | |
US20100042795A1 (en) | Storage system, storage apparatus, and remote copy method | |
JP2009009333A (ja) | 非同期リモートコピーシステムの制御方法及び非同期リモートコピーシステム | |
JP4508798B2 (ja) | ストレージリモートコピー方式 | |
JPH10198607A (ja) | データ多重化システム | |
JP2009146169A (ja) | ストレージシステム、ストレージ装置、データバックアップ方法 | |
JP2005309793A (ja) | データ処理システム | |
JP2006099440A (ja) | リモートコピーシステム | |
JP4721057B2 (ja) | データ管理システム,データ管理方法及びデータ管理用プログラム | |
WO2010097962A1 (en) | Storage system and its initial copy method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070912 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20090601 |