JP4800056B2 - ストレージシステム及びその制御方法 - Google Patents

ストレージシステム及びその制御方法 Download PDF

Info

Publication number
JP4800056B2
JP4800056B2 JP2006032927A JP2006032927A JP4800056B2 JP 4800056 B2 JP4800056 B2 JP 4800056B2 JP 2006032927 A JP2006032927 A JP 2006032927A JP 2006032927 A JP2006032927 A JP 2006032927A JP 4800056 B2 JP4800056 B2 JP 4800056B2
Authority
JP
Japan
Prior art keywords
logical volume
data
control block
vol
differential data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006032927A
Other languages
English (en)
Other versions
JP2007213345A (ja
Inventor
幸司 永田
昇司 児玉
育哉 八木沢
克雄 茂木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006032927A priority Critical patent/JP4800056B2/ja
Priority to US11/449,668 priority patent/US7472243B2/en
Priority to DE602006002241T priority patent/DE602006002241D1/de
Priority to EP06255689A priority patent/EP1818828B1/en
Priority to US11/822,253 priority patent/US7509467B2/en
Publication of JP2007213345A publication Critical patent/JP2007213345A/ja
Priority to US12/292,991 priority patent/US7765372B2/en
Priority to US12/822,874 priority patent/US7925852B2/en
Priority to US13/039,122 priority patent/US8266401B2/en
Application granted granted Critical
Publication of JP4800056B2 publication Critical patent/JP4800056B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Description

本発明はストレージシステム及びその制御方法に関する。
データセンタのような大規模なデータを取り扱うデータベースシステムでは、ホストシステムとは別に構成されたストレージシステムを用いてデータを管理する。このようなストレージシステムとして、例えば、ディスクアレイシステムが知られている。ディスクアレイシステムは、アレイ状に配列された多数のディスクドライブをRAID(Redundant Array of Independent Inexpensive Disks)管理する。多数のディスクドライブが提供する物理的な記憶領域上には、少なくとも1つ以上の論理ユニットが形成され、この論理ユニットがホストシステムに提供される。ホストシステムは、論理ユニットを一つの物理的なデバイスとして認識し、論理ユニットへのデータアクセスを行う。
この種のストレージシステムでは、災害等に備えてデータを確実に保護するための措置が講じられている。例えば、特開2005−293469号公報には、正記憶制御装置に書き込まれるデータを副記憶制御装置にリモートコピーし、データを二重化することで、耐障害性を高めるシステムが開示されている。
特開2005−293469号公報
ところで、正記憶制御装置へのデータ入出力を要求するホストシステムに障害が生じたり、或いは正記憶制御装置とホストシステムの両方に障害が生じたりすると、記憶制御装置の正副を切り替えて、運用を継続する必要がある。非同期リモートコピーにより、正記憶制御装置から副記憶制御装置にデータが転送される場合には、正副切り替え時点で、正記憶制御装置から副記憶制御装置に未だ転送されていない未転送データが存在する場合も想定されるので、副記憶制御装置のデータをできるだけ新しいものにするには、未転送データを適切に処理する必要がある。更に、ホストシステムに障害が生じると、正副切り替え処理の最中にも正記憶制御装置にライトアクセスが要求される場合も想定されるので、このようなライトアクセスを適切に処理する必要もある。
そこで、本発明は、システム障害時における記憶制御装置の正副切り替え処理を適切に行うことを課題とする。本発明の更なる目的は、後述する実施の形態の記載から明らかになるであろう。
上記の課題を解決するため、本発明のストレージシステムは、第一の論理ボリュームを有する正記憶制御装置と、第一の論理ボリュームとコピーペアを形成可能な第二の論理ボリュームを有する副記憶制御装置とを備える。
正記憶制御装置は、ホストアクセスによる第一の論理ボリュームの更新位置を管理する第一の差分ビットマップテーブルと、第一の論理ボリュームのデータイメージを論理的に復元するための第一のスナップショット管理情報と、ホストアクセスによって更新される前のデータであって、且つ第一の論理ボリュームに書かれていたデータである更新前データを格納する第一のプール領域と、所定のタイミング以降に第一の論理ボリュームが更新されるときに更新前データを第一のプール領域に書き込む第一の書き込み手段と、所定のタイミング以降に第一の論理ボリュームが更新されると、第一のスナップショット管理情報を所定のタイミングの時点における第一の論理ボリュームのデータイメージを論理的に復元するための情報に更新する第一のスナップショット更新手段と、第一の論理ボリュームの更新データが第二の論理ボリュームにリモートコピーされたか否かを管理する第一の転送差分ビットマップテーブルと、第一の差分ビットマップテーブルのビット情報を第一の転送差分ビットマップテーブルにマージすることにより第一の転送差分ビットマップテーブルを更新する転送ビットマップテーブル更新手段と、更新された第一の転送差分ビットマップテーブルに基づいて、所定のタイミングの時点における第一の論理ボリュームのデータイメージを構成する各データが第一の論理ボリュームと第一のプール領域の何れに存在するのかを判別し、判別された方からデータを取得して第二の論理ボリュームに送信するリモートコピー手段と、を備える。
副記憶制御装置は、リモートコピーによる第二の論理ボリュームの更新位置を管理する第二の転送差分ビットマップテーブルと、第二の論理ボリュームのデータイメージを論理的に復元するための第二のスナップショット管理情報と、リモートコピーによって更新される前のデータであって、且つ第二の論理ボリュームに書かれていたデータである更新前データを格納する第二のプール領域と、リモートコピーによって第二の論理ボリュームが更新されるときに更新前データを前記プール領域に書き込む第二の書き込み手段と、第二の論理ボリュームが更新されると第二のスナップショット管理情報を所定のタイミングの時点における第二の論理ボリュームのデータイメージを論理的に復元する情報に更新する第二のスナップショット更新手段と、を備える。
副記憶制御装置は、ホストシステムから正副切り替えコマンドを受信すると、正記憶制御装置から副記憶制御装置にリモートコピーされていない未転送データが存在するか否かを正記憶制御装置に問い合せ、未転送データが存在する場合に、正記憶制御装置から未転送データを受信し、第二の論理ボリュームを更新する。
正記憶制御装置は、副記憶制御装置が正副切り替えコマンドを受信した時点以降における、第一の論理ボリュームへのホストアクセスによる第一の論理ボリュームの更新位置を第一の差分ビットマップテーブルにより管理する。
副記憶制御装置は、未転送データの問い合わせに対する正記憶制御装置からの応答がない場合には、第二のスナップショット管理情報に基づいて、過去のある時点における第二の論理ボリュームのデータイメージを復元する。
本発明によれば、システム障害時における記憶制御装置の正副切り替え処理を適切に行うことができる。
以下、各図を参照しながら本発明の実施形態について説明する。
図1は本実施形態に係るストレージシステム10のシステム構成を示す。ストレージシステム10は、ローカルサイトに設置されている正記憶制御装置20と、リモートサイトに設置されている副記憶制御装置50とを備える。正記憶制御装置20、副記憶制御装置50、正ホストシステム100、及び副ホストシステム110は、SAN(Storage Area Network)120を介して相互に接続されている。
正ホストシステム100は、常用系のホストシステムであり、主として、システムが正常なときに、正記憶制御装置20にI/O処理を要求する。副ホストシステム110は、待機系のホストシステムであり、主として、システムに障害が発生したときに、副記憶制御装置50にI/O処理を要求し、障害発生時に正ホストシステム100が行っていた処理を引き継ぐ。正ホストシステム100、及び副ホストシステム110は、例えば、パーソナルコンピュータ、ワークステーション、メインフレームコンピュータ等である。
ストレージシステム10は、正記憶制御装置20に書き込まれたデータが副記憶制御装置50にリモートコピーされるように構成されている。副記憶制御装置50は、正記憶制御装置20が過去に保持していたデータイメージと同一のデータイメージを保持する。これにより、正記憶制御装置20に障害が生じた場合でも、副記憶制御装置50を用いて、システムを稼動させることができる。リモートコピー方式としては、正記憶制御装置20と副記憶制御装置50との両方にデータを書き込んだことを条件として、正ホストシステム100にライト完了を報告する同期コピーでもよく、或いは正記憶制御装置20にデータが書き込まれた段階で、正ホストシステム100にライト完了を報告し、適当な時期にそのデータを副記憶制御装置50に転送する非同期コピーでもよい。以下の説明では、正記憶制御装置20を稼働系の正記憶制御装置として運用し、副記憶制御装置50を待機系の副記憶制御装置として運用する例を示す。
正記憶制御装置20は、主に、コントローラ30と、記憶装置40とを備える。
コントローラ30は、LAN(Local Area Network)インターフェース31、フロントエンドインターフェース32、CPU33、データ転送コントローラ34、キャッシュメモリ35、ローカルメモリ36、及びバックエンドインターフェース37を備える。
コントローラ30は、複数のディスクドライブ41をいわゆるRAID方式に規定されるRAIDレベル(例えば、0,1,5)で制御することができる。RAID方式においては、複数のディスクドライブ41が一つのRAIDグループとして管理される。RAIDグループ上には、正ホストシステム100からのアクセス単位である複数の論理ボリューム42が定義されている。それぞれの論理ボリューム42には、LUN(Logical Unit Number)がアサインされる。
CPU33は、正ホストシステム100からのデータ入出力要求に応答して、複数のディスクドライブ41へのI/O処理(ライトアクセス、又はリードアクセス)を制御するプロセッサである。
ローカルメモリ36には、各種マイクロプログラム、及びボリューム管理テーブルなどが格納されている。各種マイクロプログラム、及びボリューム管理テーブルの詳細については、後述する。
キャッシュメモリ35は、ディスクドライブ41に書き込むためのライトデータ、又はディスクドライブ41から読み出したリードデータを一時的に格納するバッファメモリである。キャッシュメモリ35は、電源バックアップされており、正記憶制御装置20に電源障害が発生した場合でも、キャッシュデータのロストを防ぐ不揮発性メモリとして構成されている。
データ転送コントローラ34は、キャッシュメモリ35、フロントエンドインターフェース32、バックエンドインターフェース37、及びCPU33を相互に接続し、正ホストシステム100とディスクドライブ41との間のデータ転送を制御する。正ホストシステム100からのライトアクセスが要求されると、データ転送コントローラ34は、フロントエンドインターフェース32を介して正ホストシステム100から受け取ったデータをキャッシュメモリ35に書き込み、その後、そのライトデータをディスクドライブ41へ非同期書き込みすることを目的として、そのライトデータをバックエンドインターフェース37へ転送する。また、正ホストシステム100からのリードアクセスが要求されると、バックエンドインターフェース37を介してディスクドライブ41から読みとったリードデータをキャッシュメモリ35に書き込むとともに、フロントエンドインターフェース32にそのリードデータを転送する。
フロントエンドインターフェース32は、正ホストシステム100とのインターフェースを制御するコントローラであり、例えば、ファイバチャネルプロトコルに基づく正ホストシステム100からのブロックアクセス要求を受信する機能を有する。
バックエンドインターフェース37は、ディスクドライブ41とのインターフェースを制御するコントローラであり、例えば、ディスクドライブ41を制御するプロトコルに基づくディスクドライブ41へのデータ入出力要求を制御する機能を有する。
LANインターフェース31は、LAN90に接続するインターフェースであり、TCP/IPに基づいて管理端末80との間でデータ及び制御信号の送受信を制御する。
記憶装置40は、複数のディスクドライブ41を備える。ディスクドライブ41は、FC(Fibre Channel)ディスクドライブ、SATA(Serial Advanced Technology Attachment)ディスクドライブ、PATA(Parallel Advanced Technology Attachment)ディスクドライブ、FATA(Fibre Attached Technology Adapted)ディスクドライブ、SAS(Serial Attached SCSI)ディスクドライブ或いはSCSI(Small Computer System Interface)ディスクドライブ等のストレージデバイスである。
正記憶制御装置20は、LAN(Local Area Network)90を介して管理端末80に接続されている。管理端末80は、例えば、CPU、メモリ及びディスプレイ等のハードウェア資源を備えるコンピュータシステムである。システム管理者は、管理端末80を入力操作することにより、正記憶制御装置20を管理するためのコマンドを正記憶制御装置20に送信する。正記憶制御装置20を管理するためのコマンドとして、例えば、ディスクドライブ41の増設或いは減設、又はRAID構成の変更を指示するためのコマンド、正ホストシステム100と正記憶制御装置20との間の通信パスを設定するためのコマンド、CPU33のマイクロプログラムをメモリ26にインストールするためのコマンド、正記憶制御装置20の動作状態の確認や故障部位を特定するためのコマンド等がある。
副記憶制御装置50は、主に、コントローラ60と、記憶装置70とを備える。
コントローラ60の詳細構成は、上述したコントローラ30の詳細構成と同様である。記憶装置70は、複数のディスクドライブ71を備える。コントローラ60は、複数のディスクドライブ71をいわゆるRAID方式に規定されるRAIDレベル(例えば、0,1,5)で制御することができる。RAID方式においては、複数のディスクドライブ71が一つのRAIDグループとして管理される。RAIDグループ上には、副ホストシステム110からのアクセス単位である複数の論理ボリューム72が定義されている。それぞれの論理ボリューム72には、LUN(Logical Unit Number)がアサインされる。
図2は各種マイクロプログラム及びボリューム管理テーブルを示す。
ローカルメモリ36は、内部コピー実行プログラム200、リモートコピー実行プログラム210、制御プログラム220、及びボリューム管理テーブル230を格納する。内部コピー実行プログラム220は、内部コピー処理、及びスナップショット更新処理を実行する。リモートコピー実行プログラム210は、リモートコピーを実行する。制御プログラム220は、内部コピー実行プログラム200、及びリモートコピー実行プログラム210を制御する。ボリューム管理テーブル230は、複数の論理ボリューム42に関する情報を格納する。
図3はボリューム管理テーブル230のテーブル構造を示す。
ボリューム管理テーブル230には、複数の論理ボリューム42の各々について、論理ボリューム(以下、「VOL」と略記することがある。)を識別するためのVOL−IDと、その論理ボリュームへのアクセスパスを示すパス情報と、その論理ボリュームの種類(以下、「VOL種類」と記す。)と、その論理ボリュームがプールVOLであるか否かを示すフラグ(以下、「プールVOL」フラグと記す。)と、その論理ボリュームを含んだVOLペアに関する情報(以下、「ペア情報」と記す。)と、が対応付けられて格納される。ボリューム管理テーブル230に格納される情報のうちの少なくとも一つの情報要素(例えば、VOL−ID、VOL種類、プールVOLフラグ)は、管理端末80又は正ホストシステム100などから入力できる。
VOL種類としては、例えば、「プライマリ」、「セカンダリ」、「プール」がある。「プライマリ」という種類のVOL(以下、「プライマリVOL」又は「PVOL」と記す。)は、コピー処理(例えば、リモートコピー処理)において、コピー元となるVOLである。「セカンダリ」という種類のVOL(以下、「セカンダリVOL」又は「SVOL」と記す。)は、コピー処理(例えば、リモートコピー処理)において、コピー先となるVOLである。セカンダリVOLは、少なくともプライマリVOLの容量以上の記憶容量を有する。プライマリVOLもセカンダリVOLも、パス情報は定義されている。但し、「プール」という種類のVOL(以下、「プールVOL」と記す。)は、パス情報が未定義である。プールVOLの詳細については、後述する。
プールVOLフラグは、それに対応する論理ボリュームがプールVOLであるか否かを示す。具体的には、例えば、プールVOLフラグが「1」であれば、それに対応する論理ボリュームは、プールVOLであり、プールVOLフラグが「0」であれば、それに対応する論理ボリュームは、プールVOLでない。
ペア情報には、例えば、ペア相手情報、及びペア状態が含まれている。ペア相手情報には、例えば、ペア相手となる論理ボリューム(以下、ペア相手VOL)に関する情報として、ペア相手VOLを有する記憶制御装置のID、ペア相手VOLのVOL−ID、及びパス情報などがある。ペア状態としては、例えば、「SMPL」、「COPY」、「PAIR」、「PSUS」、「SPLIT」、「SSWS」などがある。
「SMPL」とは、ペア生成前の正副関係のない状態を示す。
「COPY」は、プライマリVOLのデータをセカンダリVOLにコピーする形成コピー中の状態を示す。「COPY」では、セカンダリVOLへのライトは禁止される。
「PAIR」は、プライマリVOLからセカンダリVOLへ非同期コピーを行っている状態を示す。「PAIR」では、セカンダリVOLへのライトは禁止される。
「PSUS」は、プライマリVOLからセカンダリVOLへ非同期コピーを停止している状態を示す。「PSUS」では、セカンダリVOLへのリード/ライトは禁止される。
「SPLIT」は、プライマリVOLとセカンダリVOLとを論理的に分離して、プライマリVOLの更新前後の差分データのみをセカンダリVOLにコピーする状態を示す。
「SSWS」は、セカンダリVOLがリード/ライト可能な状態を示す。「SSWS」では、セカンダリVOLのデータは、前回の確定内容にリストアされ、プライマリVOLは、「PSUS」に遷移する。
CPU33は、ボリューム管理テーブル230を参照することにより、アクセスすべき論理ボリューム42の種類、及びペア情報を特定することができる。また、CPU33は、プールVOLが後述のバーチャルVOLに割りアサインされた場合には、そのプールVOLへのパスを表す情報を定義し、定義されたパス情報をボリューム管理テーブル230に登録することができる。また、CPU33は、アサインされなくなったプールVOLについてのパス情報を消去することにより、プールVOLを未使用状態にすることができる。CPU33は、各プールVOLについて、パス情報が登録されているか否かにより、各プールVOLが使用中であるか、或いは未使用状態であるかを判別することができる。
図4は正記憶制御装置20が実行する非同期リモートコピーの処理概要を示す。
正記憶制御装置20は、CPU33、キャッシュメモリ35、プライマリVOL600、バーチャルVOL610、複数のプールVOL620、スナップショット管理情報300、及び転送差分ビットマップテーブル510を備える。
プールVOL620は、プライマリVOL600とバーチャルVOL610とのペア状態がスプリットされた時点以降にプライマリVOL600のデータイメージが更新されたときに、更新前後の差分データを退避させるための論理ボリュームである。
バーチャルVOL610は、ある時刻にプライマリVOL600に格納されているデータと、ある時刻以降にプライマリVOL600からプールVOL620に退避されたデータとから、ある時刻におけるプライマリVOL600のデータイメージを復元するための仮想的な論理ボリュームである。バーチャルVOL610は、プライマリVOL600のスナップショットを論理的に保持することができる。本明細書では、過去のある時点におけるプライマリVOL600のデータイメージを論理的にバーチャルVOL610上に復元する処理(即ち、スナップショットを作成する処理)を「内部コピー」と称する。バーチャルVOL610は、プライマリVOL600又はセカンダリVOL700とペアを形成することができる。本実施形態では、バーチャルVOL610は、キャッシュメモリ35の記憶領域に形成される場合を例示するが、ディスクドライブ41の記憶領域に形成されていてもよい。説明の便宜上、バーチャルVOL610をP_VVOLと略記する場合がある。
CPU33は、バーチャルVOL610に、複数のプールVOL620の中から一以上のプールVOL620(例えば、どのVOLにも対応付けられていない未使用のプールVOL)を選択し、選択された一以上のプールVOL620をバーチャルVOL610にアサインできる。CPU33は、バーチャルVOL610にアサインされるプールVOL620の数を、記憶資源の消費状況に応じて、適宜に増減することができる。
スナップショット管理情報300は、ある時刻におけるプライマリVOL600のデータイメージを、スナップショットを用いて復元するための情報である。CPU33は、スナップショット管理情報300を参照することにより、ある時刻におけるプライマリVOL600のデータイメージを構成する各データがプールVOL620に存在するのか、或いはプライマリVOL600に存在するのかを判別し、判別された方からデータを取得することにより、ある時刻におけるプライマリVOL600のデータイメージをバーチャルVOL610に復元できる。スナップショット管理情報300は、プライマリVOL600のデータ更新位置を示す差分ビットマップテーブル310を含む。
転送差分ビットマップテーブル510は、プライマリVOL600とセカンダリVOL700とが同期した後において、プライマリVOL600のデータが更新されたときに、セカンダリVOL700にリモートコピーされるべき差分データの位置を示す。
CPU33は、プライマリVOL600とバーチャルVOL610との間のペア状態をコピー状態にすることができる。ライマリVOL600とバーチャルVOL610との間のペア状態がコピー状態になっているときに、プライマリVOL600にデータが書き込まれると、CPU33は、そのデータをバーチャルVOL610又はプールVOL620に書き込む。
CPU33は、プライマリVOL600とバーチャルVOL610との間のペア状態をスプリット状態にすることができる。ライマリVOL600とバーチャルVOL610との間のペア状態がスプリット状態になっているときに、プライマリVOL600にデータが書き込まれると、CPU33は、内部コピープログラム200を動作させて、内部コピー処理及びスナップショット更新処理を実行する。
副記憶制御装置50は、CPU63、キャッシュメモリ65、セカンダリVOL700、複数のバーチャルVOL710A,710B、複数のプールVOL720、スナップショット管理情報400、及び転送差分ビットマップテーブル520を備える。
プールVOL720は、セカンダリVOL700とバーチャルVOL710A又はバーチャルVOL710Bとのペア状態がスプリットされた時点以降にセカンダリVOL700のデータイメージが更新されたときに、更新前後の差分データを退避させるための論理ボリュームである。
バーチャルVOL710A,710Bは、ある時刻にセカンダリVOL700に格納されているデータと、ある時刻以降にセカンダリVOL700からプールVOL720に退避されたデータとから、ある時刻におけるセカンダリVOL700のデータイメージを復元するための仮想的な論理ボリュームである。バーチャルVOL710A,710Bは、セカンダリVOL700のスナップショットを論理的に保持することができる。本実施形態では、バーチャルVOL710A,710Bは、キャッシュメモリ65の記憶領域に形成される場合を例示するが、ディスクドライブ71の記憶領域に形成されていてもよい。説明の便宜上、バーチャルVOL710A,710BをS_VVOLと略記する場合がある。
スナップショット管理情報400は、ある時刻におけるセカンダリVOL700のデータイメージを、スナップショットを用いて復元するための情報である。CPU63は、スナップショット管理情報400を参照することにより、ある時刻におけるセカンダリVOL700のデータイメージを構成する各データがプールVOL720に存在するのか、或いはセカンダリVOL700に存在するのかを判別し、判別された方からデータを取得することにより、ある時刻におけるセカンダリVOL700のデータイメージをバーチャルVOL710A,710Bに復元できる。スナップショット管理情報400は、セカンダリVOL700のデータ更新位置を示す差分ビットマップテーブル410A,410Bを含む。
転送差分ビットマップテーブル520は、プライマリVOL600とセカンダリVOL700とが同期した後において、プライマリVOL600のデータが更新されたときに、リモートコピーによりセカンダリVOL700のデータが更新された位置を示す。
次に、内部コピー処理、スナップショット更新処理、及びリモートコピー処理の詳細について説明を加える。以降の説明では、プライマリVOL600とバーチャルVOL610との間のペア状態がスプリット状態にあることを前提とする。
正記憶制御装置20は、正ホストシステム100からライトアクセス要求を受けると(S101)、ライトデータをキャッシュメモリ35に格納し(S102)、ライト完了を正ホストシステム100に報告する(S103)。
CPU33は、キャッシュメモリ35に書き込まれたライトデータを読み出し、プライマリVOL600に書き込む(S104)。このとき、CPU33は、更新前データ(ライトデータによって更新(上書き)される前のデータであって、且つプライマリVOL600に書かれていた過去のデータ)をプライマリVOL600からプールVOL620に移動させる(S105)。
プライマリVOL600とバーチャルVOL610との間のペア状態がスプリット状態にあるときに、内部コピーを実行すると、ある時刻におけるプライマリVOL600のデータイメージを構成する各データは、プライマリVOL600とプールVOL620とに分散される。
次に、CPU33は、スナップショット管理情報300を、プライマリVOL600とバーチャルVOL610との間のペア状態がスプリットされた時点(以下、「スプリット時点」と称する。)にプライマリVOL600に格納されているデータと、そのスプリット時点以降にプライマリVOL600からプールVOL620に移動されたデータとから、そのスプリット時点におけるプライマリVOL600のデータイメージを復元するための情報に更新する(S106)。このスナップショット更新処理により、バーチャルVOL610は、ライマリVOL600のスナップショットを論理的に保持することができる。
CPU33は、プライマリVOL600とバーチャルVOL610との間のペア状態がスプリット状態にあるときに、正ホストシステム100からライトアクセス要求を受ける都度に、上述したS102〜S106の処理を繰り返し実行する。
CPU33は、スプリット時点から所定時間経過後にリモートコピー実行プログラム210を動作させ、リモートコピー処理を実行する。リモートコピー実行プログラム210は、差分ビットマップテーブル310を転送差分ビットマップテーブル510にマージする。そして、リモートコピー実行プログラム210は、転送差分ビットマップテーブル510に基づいて、スプリット時点におけるプライマリVOL600のデータイメージを復元するための各データがプライマリVOL600に存在するのか、或いはプールVOL620に存在するのかを判別し、判別された方からデータを取得してそのデータを副記憶制御装置50に転送する(S107)。このリモートコピー処理により、スプリット時点におけるプライマリVOL600のデータイメージがセカンダリVOL700に復元される。
副記憶制御装置50は、正記憶制御装置20からデータを受信すると、正記憶制御装置20にライト完了を報告する(S108)。
以後、CPU63は、正記憶制御装置20から受信したデータをセカンダリVOL700に書き込む際に、更新前データ(ライトデータによって更新(上書き)される前のデータであって、且つセカンダリVOL700に書かれていた過去のデータ)をセカンダリVOL700からプールVOL720に移動させる(S109)。
更に、CPU63は、スナップショット管理情報400を、スプリット時点にセカンダリVOL700に格納されているデータと、スプリット時点以降にセカンダリVOL700からプールVOL720に移動されたデータとから、スプリット時点におけるセカンダリVOL700のデータイメージを復元するための情報に更新する(S110)。
尚、CPU63は、バーチャルVOL710A,710Bを交互に切り替えて使用する。これにより、例えば、CPU63は、バーチャルVOL710AにセカンダリVOL700のスナップショットを論理的に作成しつつ、差分ビットマップテーブル410Bをクリアすることができる。差分ビットマップテーブル410A,410Bをクリアするには、長時間を要する。バーチャルVOL710A,710Bを交互に切り替えて使用することで、スナップショットの作成と、差分ビットマップテーブル410A,410Bのクリアを並行処理できるので、効率がよい。
CPU33は、正記憶制御装置20を制御するための手段(例えば、プライマリVOL600の更新前データをプールVOL620に書き込むための書き込み手段、スナップショット管理情報300を更新するスナップショット更新手段、転送差分ビットマップテーブル510を更新する転送差分ビットマップテーブル更新手段、正記憶制御装置20から副記憶制御装置50へ未転送データをリモートコピーするリモートコピー手段など)として機能する。
CPU63は、副記憶制御装置50を制御するための手段(例えば、セカンダリVOL700の更新前データをプールVOL720に書き込むための書き込み手段、スナップショット管理情報400を更新するスナップショット更新手段など)として機能する。
図5は正記憶制御装置20において実行される非同期リモートコピーの処理シーケンスを示す。
時刻t0は、プライマリVOL600とバーチャルVOL610との間のペア状態がスプリットされたスプリット時点を示す。この時刻t0におけるプライマリVOL600のデータイメージを「イメージT0」と称する。イメージT0は、プライマリVOL600の第一のブロック領域にデータブロックAが格納されているデータイメージとする。この時刻t0の時点では、プールVOL620に更新前データは格納されていない。スナップショット管理情報300は、イメージT0を復元するための情報になっている。
時刻t1で(つまり、スプリット状態の期間中に)、プライマリVOL600の第一のブロック領域にデータブロックBが上書きされると、プライマリVOL600のデータイメージがイメージT0からイメージT1に変化する。このとき、内部コピー実行プログラム200は、データブロックA(更新前データ)をプライマリVOL600からバーチャルVOL620に書き込み、スナップショット管理情報300を、プライマリVOL600の第一のブロック領域に更新があり、且つその第一のブロック領域に存在していたデータブロックA(更新前データ)がバーチャルVOL620に格納されたことを示す情報に更新する。
また、時刻t1で、制御プログラム220がリモートコピー処理の実行をリモートコピー実行プログラム210に命じる。リモートコピー実行プログラム210は、転送差分ビットマップテーブル510を参照することにより、イメージT0を構成するデータブロックAがバーチャルVOL610に存在することを特定し、バーチャルVOL610からデータブロックAを取得し、データブロックAを副記憶制御装置50に送信する。
時刻t2は、リモートコピー処理が完了した時点である。この結果、時刻t0の時点でプライマリVOL600に形成されていたイメージT0が、セカンダリVOL700に複製される。
また、時刻t2で(つまり、スプリット状態の期間中に)、プライマリVOL600の第二のブロック領域にデータブロックCが書かれると、プライマリVOL600のデータイメージがイメージT1からイメージT2に変化する。このとき、内部コピー実行プログラム200は、スナップショット管理情報300を、プライマリVOL600第二のブロック領域に更新があったことを示す情報に更新する。
例えば、時刻t2の後であって時刻t3の前に、プライマリVOL600の第二のブロック領域にデータブロックDが上書きされると、プライマリVOL600のデータイメージがイメージT2からイメージT3(第一のブロック領域にデータブロックBが存在し、第二のブロック領域にデータブロックDが存在するデータイメージ)に変化する。このとき、内部コピー実行プログラム200は、データブロックC(更新前データ)をプライマリVOL600からプールVOL620に移動させ、スナップショット管理情報300を、プライマリVOL600の第二のブロック領域に更新があり、その第二のブロック領域に存在していたデータブロックCがプールVOL620に格納されたことを示す情報に更新する。
その後、プライマリVOL600の更新が行われる前に、時刻t3で、再び、プライマリVOL600とバーチャルVOL610とがスプリット状態にされる。
この時刻t3の時点で、換言すれば、スプリット状態にされた場合に、CPU33は、その時刻t3におけるプライマリVOL600のイメージT3をバーチャルVOL610に論理的に保持することを目的として、プールVOL620に格納されている全ての更新前データを消去する。
また、CPU33は、スナップショット管理情報300を、イメージT0を復元するための情報からイメージT3を復元するための情報に更新する。具体的には、例えば、時刻t3の時点では、プライマリVOL600において、未だ更新が行われていない状態なので、CPU33は、スナップショット管理情報300を、プライマリVOL600で更新が行われていないことを示す情報に更新する。
時刻t4の時点でプライマリVOL600の第二のブロック領域にデータブロックEが上書きされると、プライマリVOL600のデータイメージがイメージT3からイメージT4に変化する。このとき、内部コピー実行プログラム200は、データブロックD(更新前データ)をプライマリVOL600からバーチャルVOL610に書き込み、スナップショット管理情報300を、プライマリVOL600の第二のブロック領域で更新があり、且つその第二のブロック領域に存在していたデータブロックDがプールVOL620に移動したことを示す情報に更新する。
時刻t4の時点でリモートコピー処理が行われる。リモートコピー実行プログラム210は、転送差分ビットマップテーブル510を参照することにより、プライマリVOL600の第一のブロック領域に更新が無いので、イメージT3を構成するデータブロックBがプライマリVOL600に存在することを把握し、更にプライマリVOL600の第二のブロック領域に更新があったので、イメージT3を構成する別のデータブロックDがプールVOL620に存在することを把握する。リモートコピー実行プログラ210は、プライマリVOL600からデータブロックBを取得し、更にプールVOL620からデータブロックDを取得し、データブロックB及びデータブロックDを副記憶制御装置50に転送する。
時刻t5の時点は、リモートコピー処理が完了した時点である。この結果、セカンダリVOL700におけるイメージT0が、時刻t3におけるプライマリVOL600のイメージT3に更新される。つまり、セカンダリVOL700の第一ブロック領域のデータブロックAにデータブロックBが上書きされ、更にセカンダリVOL700の第二のブロック領域にデータブロックDが書き込まれる。
尚、これ以降、副記憶制御装置50は、次のスプリット時点t6のイメージT6を構成するデータを受信するまでの期間、イメージT3を保存する。
以後、時刻t3乃至時刻t5において実行された上述の処理が繰り返される。
つまり、正記憶制御装置20では、定期的に又は不定期的に、プライマリVOL600とバーチャルVOL610とがスプリット状態にされる。そのスプリット状態にされている期間中であって、次にスプリット状態にされる時点までに(換言すれば、内部コピー処理及びスナップショット更新処理に並行して)、リモートコピー処理が実行される。そのリモートコピー処理が完了した時点以降に、再び、プライマリVOL600とバーチャルVOL610とがスプリット状態にされ、プールVOL620から更新前データが消去される。このような処理が繰り返されることにより、定期的に又は不定期的になされたスプリット時点におけるプライマリVOL600のデータイメージ(図5の例では、時刻t0におけるイメージT0、時刻t3におけるイメージT3、時刻t6におけるイメージT6)をバーチャルVOL610に論理的に保持し、そのデータイメージをセカンダリVOL700にコピーできる。
図6は本実施形態に係るスナップショット更新処理の概要を示し、より詳細には、プライマリVOL600のデータイメージがイメージT3からイメージT4に変化し、バーチャルVOL610によってイメージT3が論理的に保持される様子を示す。
スナップショット管理情報300は、差分ビットマップテーブル310、アドレステーブル320、及び差分データ制御ブロック(Differential Data Control Block)330を含む。
差分ビットマップテーブル310は、プライマリVOL600内の複数のブロック領域(例えば、1ブロック領域は64Kバイト)にそれぞれ対応する複数のビットを有する。例えば、イメージT3からイメージT4に変わる場合、図6に示すように、プライマリVOL600の第一のブロック領域は、更新されないので、その第一のブロック領域に対応するビットは「0」のままであり、第二のブロック領域のデータブロックDにデータブロックDが上書きされるので、その第二のブロック領域に対応するビットが「0」から「1」に更新される。
アドレステーブル320は、プライマリVOL600の複数のブロック領域にそれぞれ対応したアドレス領域を有する。あるブロック領域に対応する更新前データが存在していれば、そのあるブロック領域に対応するアドレス領域には、そのアドレス領域に対応するアドレスであって、差分データ制御ブロック330上のアドレスが格納される。
差分データ制御ブロック330は、例えば、プールVOL620内の複数のブロック領域にそれぞれ対応する管理領域を有する。各管理領域には、プールVOL620内のブロック領域に対応する位置に格納された更新前データがどの世代のスナップショットのデータであるかが記録される。それぞれの差分データ制御ブロック330は、ポインタによって他の差分データ制御ブロック300に接続されている。本明細書では、差分データ制御ブロック330のキュー構造を「DDCBキュー」と称する。また、便宜上、差分データ制御ブロック330を「DDCB」と称する場合がある。CPU33は、管理領域を辿ることによって、複数世代の更新前データを取得することができる。
尚、差分データ制御ブロック330の使用されていない領域は、空きキューとして管理される。空きキューは、空きキューカウンタ340によって管理される。
上述の構成により、スナップショット作成時点におけるプライマリVOL600のデータイメージを論理的にバーチャルVOL610に複写できる。そして、バーチャルVOL610内のデータがどの世代の更新前データであるかは、差分データ制御ブロック330によって管理される。
図7は差分ビットマップテーブル310の詳細構成を示す。
差分ビットマップテーブル310は、ブロック情報テーブル311、ブロック管理詳細テーブル312、及びブロック管理テーブル313を含む。
ブロック管理テーブル313は、プライマリVOL600内の各ブロック領域(以下、「BLK」と記す場合がある。)について、「BLK使用状態」、及び「初期化状態」を管理する。BLK使用状態には、「使用」、及び「未使用」がある。「使用」は、ブロック領域が何れかのコピー系で使用されていることを示す。「未使用」は、ブロック領域が何れかのコピー系で使用されていないことを示す。「初期化状態」には、「未使用」、「未初期化0」、「未初期化1」、及び「初期化済」がある。「未使用」は、ブロック領域が確保されていないことを示す。「未初期化0」は、ブロック領域が「0」に初期化されていないことを示す。「未初期化1」は、ブロック領域が「1」に初期化されていないことを示す。「初期化済」は、ブロック領域が「0」又は「1」に初期化されていることを示す。
ブロック管理詳細テーブル312は、複数のブロック領域に関するブロック管理テーブル313を一纏めにしたものである。
ブロック情報テーブル311は、複数のブロック管理詳細テーブル312を一纏めにしたものであり、プライマリVOL600内の各LU(Logical Unit)に属するブロック領域を管理する。
差分マージ状態管理テーブル350は、差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理の有無を管理する。マージ完了フラグは、マージ処理が「実施済み」であるか、或いは「未実施」であるかを示す。マージ処理の詳細については、後述する。
図8は差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理の概要を示す。これらのビットマップテーブル310,510の「黒」は、ビットが「1」であること、即ち、ビットオンであることを示し、「白」は、ビットが「0」であること、即ち、ビットオフであることを示す。
図8(A)は、プライマリVOL600とセカンダリVOL700とがペア状態にあり、マージ完了フラグが「未実施」にあることを示す。
図8(B)は、プライマリVOL600へのライトアクセス時におけるマージ処理を示す。プライマリVOL600へライトアクセスがあると、CPU33は、マージ完了フラグを参照し、差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理の有無をチェックする。
マージ完了フラグは、「未実施」を示しているため、CPU33は、ビットのマージ処理を行い、マージ完了フラグを「実施済み」に更新する。更に、CPU33は、差分ビットマップテーブル310のビットのうちマージ処理を行ったビットを「未初期化0」に更新するとともに、プライマリVOL600へライトアクセスがあった位置に対応するビットを「1」に更新する。
図8(C)は、リモートコピー時におけるマージ処理を示す。CPU33は、リモートコピー実施時に差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理を行い、マージ完了フラグを「実施済み」に更新する。更に、CPU33は、差分ビットマップテーブル310のビットのうちマージ処理を行ったビットを「未初期化0」に更新するとともに、転送差分ビットマップテーブル510のビットのうちセカンダリVOL700へリモートコピーされたデータの位置に対応するビットを「0」に更新する。
図8(D)は、リモートコピー時における転送差分ビットマップテーブル510のビットオフ処理を示す。CPU33は、転送差分ビットマップテーブル510を参照しながら引き続きリモートコピーを実施し、転送差分ビットマップテーブル510のビットのうちセカンダリVOL700へリモートコピーされたデータの位置に対応するビットを「0」に更新する。尚、差分ビットマップテーブル310には、プライマリVOL600にライトアクセスがあるまで、ビット「1」は存在しない。
尚、プールVOL620は、バーチャルVOL610からセカンダリVOL700へ更新前データをリモートコピーすることを前提に、更新前データを一時的に退避するものであるため、プールVOL620に退避する必要のある更新前データは、差分ビットマップテーブル310のビットのうちビット「1」を有し、且つ、転送差分ビットマップテーブル510に未だマージされていないビットに対応するブロック領域の更新前データである。プールVOL610に退避する更新前データをリモートコピーする必要のあるデータに限定することで、プールVOL610に格納されるデータ量の増加を抑制できる。
一方、プールVOL720に保存される更新前データは、セカンダリVOL700のデータリカバリに用いられるものであるため、セカンダリVOL700の更新前データは、全てプールVOL720に保存しておく必要がある。
図9は正記憶制御装置20において実行される非同期リモートコピーのフローチャートを示す。
CPU33は、プライマリVOL600とバーチャルVOL610との間のペア状態をスプリット状態にし、ボリューム管理テーブル230を更新する(S201;YES)。
プライマリVOL600へのライトアクセスにより、新たなデータがプライマリVOL600に書き込まれると(S202;YES)、CPU33は、上述した内部コピー処理、及びスナップショット更新処理を実行する(S203)。
プライマリVOL600へのライトアクセスと、そのライトアクセスに伴う内部コピー処理及びスナップショット更新処理は、少なくとも、スプリット状態の期間中にリモートコピーが実施されるまで繰り返される(S204;NO)。
スプリット状態の期間中にリモートコピー処理を実行することになると(S204;YES)、CPU33は、マージ完了フラグを参照し、差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理が未実施であるか否かをチェックする(S205)。
マージ処理が未実施の場合には(S205;YES)、CPU33は、差分ビットマップテーブル310から転送差分ビットマップテーブル510へのマージ処理を行い(S206)、転送差分ビットマップテーブル510を参照し(S207)、リモートコピーを実施する(S208)。
マージ処理が実施済みの場合には(S205;NO)、CPU33は、転送差分ビットマップテーブル510を参照し(S207)、リモートコピーを実施する(S208)。
リモートコピーが完了し、再度、スプリット状態に移行すると(S209;YES)、CPU33は、プールVOL620に格納されている全ての更新前データを消去するとともに、スナップショット管理情報300の更新情報も消去する(S210)。これにより、バーチャルVOL610もスナップショット管理情報300も、再びスプリット状態が開始された時点におけるプライマリVOL600のデータイメージを復元する情報に更新される。
以後、S202乃至S210の処理が繰り返される。即ち、点線枠800に示されるループが形成される。このループにおいて、例えば、スプリット状態が解除された場合、CPU33は、このループから抜けてS201の処理を実行する。上述した図5の処理は、点線枠800に示されるループの処理の一例である。
一方、スプリット状態が開始されておらず(S201;NO)、プライマリVOL600とバーチャルVOL610との間のペア状態がコピー状態であれば(S211;YES)、プライマリVOL600へのライトアクセスにより、新たなデータがプライマリVOL600に書き込まれると(S212;YES)、上述した通常コピー処理が実行される(S213)。
プライマリVOL600とバーチャルVOL610とのペア状態がスプリット状態でもなく(S201;NO)、且つコピー状態でもない場合には(S211;NO)、そのときのペア状態に応じた処理が行われる(S214)。
尚、上述の説明では、説明の便宜上、一つのPVOL600を一つのプールVOL620に対応付ける例を示したが、これに限られるものではない。正記憶制御装置20は、複数のPVOLと、複数のプールグループとを備え、ある一つのPVOLから退避される更新前データは、ある一つのプールグループにのみに格納されるように構成されてもよい。同様に、副記憶制御装置50は、複数のSVOLと、複数のプールグループとを備え、ある一つのSVOLから退避される更新前データは、ある一つのプールグループにのみに格納されるように構成されてもよい。プールグループは、一つ以上のLU(Logical Unit)から成る記憶領域である。プールグループは、プール領域と別称することもできる。
図10はPVOLとプールグループとの対応関係を示す説明図である。同図に示すように、正記憶制御装置20は、複数のPVOL1,PVOL2,PVOL3と、複数のプールグループ1,2とを備える。PVOL1は、プールグループ1に対応付けられており、PVOL1からの退避データは、プールグループ1に格納される。プールグループ1は、LU1,LU2,LU3から成る記憶領域である。PVOL2及びPVOL3は、プールグループ2に対応付けられており、PVOL2又はPVOL3からの退避データは、プールグループ2に格納される。プールグループ2は、LU4,LU5,LU6から成る記憶領域である。
図11はプールグループ−PVOL対応テーブル900を示す。プールグループ−PVOL対応テーブル900は、「プールグループ#」、「所属LU」、「PVOL#」をそれぞれ対応付けて格納する。「プールグループ#」は、プールグループの番号を示す。「所属LU」は、プールグループに所属しているLUの番号を示す。「PVOL#」は、PVOLの番号を示す。
このように、ある一つのPVOLからの退避データを、ある一つのプールグループにのみ格納しておくことで、何れかのプールグループに障害(例えば、オーバーフローなど)が生じたとしても、他のプールグループに影響を与えることはない。
次に、差分データ制御ブロック330のキュー管理について説明する。アドレステーブル320内の番号は、差分データ制御ブロック330の番号(以下、「DDCB番号」又は「DDCB#」と記す。)を示す。プールVOL620に格納されているデータが消去されると、その消去されたデータを管理していたDDCBキューを空きキューに遷移させる必要がある。DDCBを接続して空きキューを形成するには、以下のアルゴリズムを適用できる。
(1)「新たに接続するDDCB」のDDCB#±1,DDCB#±2,…,又はDDCB#±NのDDCB#を有するDDCBが空きキューに存在するか否かをチェックする。
(2)「新たに接続するDDCB」のDDCB#+1,DDCB#+2,…,又はDDCB#+NのDDCB#を有するDDCBが複数存在する場合には、「新たに接続するDDCB」のDDCB#に一番近いDDCB#を有するDDCBの直前に「新たに接続するDDCB」を接続する。
(3)「新たに接続するDDCB」のDDCB#+1,DDCB#+2,…,又はDDCB#+NのDDCB#を有するDDCBが一つのみ存在する場合には、そのDDCBの直前に「新たに接続するDDCB」を接続する。
(4)「新たに接続するDDCB」のDDCB#−1,DDCB#−2,…,又はDDCB#−NのDDCB#を有するDDCBが複数存在する場合には、「新たに接続するDDCB」のDDCB#に一番近いDDCB#を有するDDCBの直後に「新たに接続するDDCB」を接続する。
(5)新たに接続するDDCBのDDCB#−1,DDCB#−2,…,又はDDCB#−NのDDCB#を有するDDCBが一つのみ存在する場合には、そのDDCBの直後に「新たに接続するDDCB」を接続する。
(6)「新たに接続するDDCB」のDDCB#±1,DDCB#±2,…,又はDDCB#±NのDDCB#を有するDDCBが存在しない場合には、空きキューの最後尾に「新たに接続するDDCB」を接続する。
図12及び図13は、上述のアルゴリズムにおいて、N=1とした例を示す。
図12(A)は、初期状態を示す。何れのDDCBキューも空きキューに遷移していない。
図12(B)は、DDCB#10、DDCB#5、及びDDCB#3のDDCBキューが空きキューに遷移した状態を示す。
DDCB#5のDDCBを空きキューに接続する前処理として、DDCB#4又はDDCB#6のDDCBをサーチする。空きキューには、DDCB#10のDDCBしか存在しないので、DDCB#5のDDCBを空きキューの最後尾に接続する。
DDCB#3のDDCBを空きキューに接続する前処理として、DDCB#2又はDDCB#4のDDCBをサーチする。空きキューには、DDCB#10、及びDDCB#5しか存在しないので、DDC#3のDDCBを空きキューの最後尾に接続する。
図12(C)は、更に、DDCB#11、及びDDCB#4のDDCBキューが空きキューに遷移した状態を示す。
DDCB#11のDDCBを空きキューに接続する前処理として、DDCB#10又はDDCB#12のDDCBをサーチする。空きキューには、DDCB#10のDDCBが存在するので、DDCB#10のDDCBの直後にDDCB#11のDDCBを挿入して、空きキューを形成する。
DDCB#4のDDCBを空きキューに接続する前処理として、DDCB#3又はDDCB#5のDDCBをサーチする。空きキューには、DDCB#3のDDCBが存在するので、DDCB#3のDDCBの直後にDDCB#4のDDCBを挿入して、空きキューを形成する。
図13(A)は、更に、DDCB#30、DDCB#1、及びDDCB#21のDDCBキューが空きキューに遷移した状態を示す。
DDCB#30のDDCBを空きキューに接続する前処理として、DDCB#29又はDDCB#31のDDCBをサーチする。空きキューには、DDCB#10、DDCB#5、DDCB#3、DDCB#11、DDCB#4のDDCBしか存在しないので、DDCB#30のDDCBを空きキューの最後尾に接続する。
DDCB#1のDDCBを空きキューに接続する前処理として、DDCB#0又はDDCB#2のDDCBをサーチする。空きキューには、DDCB#10、DDCB#5、DDCB#3、DDCB#11、DDCB#4、DDCB#30のDDCBしか存在しないので、DDCB#1のDDCBを空きキューの最後尾に接続する。
DDCB#21のDDCBを空きキューに接続する前処理として、DDCB#20又はDDCB#22のDDCBをサーチする。空きキューには、DDCB#10、DDCB#5、DDCB#3、DDCB#11、DDCB#4、DDCB#30、DDCB#1のDDCBしか存在しないので、DDCB#21のDDCBを空きキューの最後尾に接続する。
図13(B)は、更に、DDCB#22、DDCB#23、DDCB#9、及びDDCB8#のDDCBキューが空きキューに遷移した状態を示す。
DDCB#22のDDCBを空きキューに接続する前処理として、DDCB#21又はDDCB#23のDDCBをサーチする。空きキューには、DDCB#21のDDCBが存在するので、DDCB#21のDDCBの直後にDDCB#22のDDCBを接続して、空きキューを形成する。
DDCB#23のDDCBを空きキューに接続する前処理として、DDCB#22又はDDCB#24のDDCBをサーチする。空きキューには、DDCB#22のDDCBが存在するので、DDCB#22のDDCBの直後にDDCB#23のDDCBを接続して、空きキューを形成する。
DDCB#9のDDCBを空きキューに接続する前処理として、DDCB#8又はDDCB#10のDDCBをサーチする。空きキューには、DDCB#10のDDCBが存在するので、DDCB#10のDDCBの直前にDDCB#9のDDCBを接続して、空きキューを形成する。
DDCB#8のDDCBを空きキューに接続する前処理として、DDCB#7又はDDCB#9のDDCBをサーチする。空きキューには、DDCB#9のDDCBが存在するので、DDCB#9のDDCBの直前にDDCB#8のDDCBを接続して、空きキューを形成する。
図13(C)は、更に、DDCB#20、及びDDCB#19のDDCBキューが空きキューに遷移した状態を示す。
DDCB#20のDDCBを空きキューに接続する前処理として、DDCB#19又はDDCB#21のDDCBをサーチする。空きキューには、DDCB#21のDDCBが存在するので、DDCB#21のDDCBの直前にDDCB#20のDDCBを接続して、空きキューを形成する。
DDCB#19のDDCBを空きキューに接続する前処理として、DDCB#18又はDDCB#20のDDCBをサーチする。空きキューには、DDCB#20のDDCBが存在するので、DDCB#20のDDCBの直前にDDCB#19のDDCBを接続して、空きキューを形成する。
図13(C)に示すように、空きキューを構成する複数のDDCBのうち一部のDDCBの並びはシーケンシャルになっている。複数のDDCBがシーケンシャルに連続していると、プールVOL620へのディスクアクセス時におけるシークタイムが短くなり、高速アクセスを実現できる。
上述のアルゴリズムでは、空きキューの全てにおいて、DDCBの並びがシーケンシャルになるとは限らない。そこで、上述のアルゴリズムを適用せずに、空きキューの全てにおいて、DDCBの並びがシーケンシャルになるようなアルゴリズムを適用してもよい。
上述の説明では、プールVOL620を管理するDDCBキューについて例示したが、プールVOL720を管理するDDCBキューについても同様に適用できる。特に、プールVOL620に退避されるデータは、スプリット時点におけるプライマリVOL600のデータを更新したデータであって、且つセカンダリVOL700へ転送されていないデータに制限できるものの、プールVOL720は、セカンダリVOL700をリストアするために使用されるものであるから、プールVOL720に退避されるデータに制限はない。しかも、プールVOL720は、データが書き込まれる順序とデータが削除される順序が異なるので、プールVOL720を管理するDDCBキューの並びが無秩序となる。そこで、プールVOL720を管理するDDCBキューのキュー管理方法として、上述の方法を適用すれば、プールVOL720にシーケンシャルアクセスできる。副記憶制御装置50がRAIDレベル5又は6でRAID管理している場合には、パリティ生成のオーバーヘッドが大幅に減るので、その効果は大きい。
次に、図14乃至図17を参照しながら、正副を切り替える処理の流れについて説明する。正副切り替え処理は、例えば、正ホストシステム100又は正記憶制御装置20に障害が生じたことを契機として、実行される。正副切り替え処理は、副ホストシステム110から記憶制御装置30へ正副切り替えコマンドが送信されることにより、実行される。正副切り替えコマンドは、単一のコマンドによって構成することもできるが、本実施形態では、二つのコマンド(SVOL-takeoverコマンド、及びSwap-takeoverコマンド)によって構成される例を示す。SVOL-takeoverコマンドは、正副切り替えの前処理として、プライマリVOL600からセカンダリVOL700への未転送データを処理するためのコマンドである。Swap-takeoverコマンドは、旧プライマリVOLを新セカンダリVOLに、旧セカンダリVOLを新プライマリVOLに切り替えるためのコマンドである。
尚、図14乃至図17において、「TCA」は、プライマリVOL600とセカンダリVOL700との間のペアを称する。「TCB」は、バーチャルVOL610とセカンダリVOL700との間のペアを称する。「QS」は、プライマリVOL600とバーチャルVOL610との間のペア、又はセカンダリVOL700とバーチャルVOL710との間のペアを称する。
まず、図14及び図15を参照しながら、プライマリVOL600へのライトアクセスがない状態で正副を切り替える処理の流れについて説明する。
図14(A)は、副記憶制御装置50が副ホストシステム110からSVOL-takeoverコマンドを受信した時点での各ボリュームのペア状態を示す。プライマリVOL600とセカンダリVOL700との間のペア状態は「PAIR」、バーチャルVOL610とセカンダリVOL700との間のペア状態は「PAIR」、プライマリVOL600とバーチャルVOL610との間のペア状態は「PSUS」、セカンダリVOL700とバーチャルVOL710との間のペア状態は「PSUS」である。
図14(B)に示すように、副記憶制御装置50は、SVOL-takeoverコマンドを受信すると、正記憶制御装置20にSSWSコマンドを送信する。SSWSコマンドとは、プライマリVOL600からセカンダリVOL700への未転送データがあるか否かを正記憶制御装置20に問い合わせ、未転送データがある場合には、その未転送データを副記憶制御装置50に転送することを要求するコマンドである。各ボリューム間のペア状態に変化はない。
図14(C)に示すように、正記憶制御装置20は、副記憶制御装置50からSSWSコマンドを受信すると、プライマリVOL600とバーチャルVOL610との間のペア状態を「PSUS」→「PAIR」→「PSUS」に変更するとともに、バーチャルVOL610とセカンダリVOL700との間のペア状態を「PAIR」→「PSUS」→「PAIR」に変更することにより、バーチャルVOL610内のデータがその時点(プライマリVOL600とバーチャルVOL610との間のペア状態が「PSUS」に変更された時点)のプライマリVOL600のデータで更新され、更新前後の差分データがバーチャルVOL610からセカンダリVOL700へ転送される。
図14(D)に示すように、バーチャルVOL610からセカンダリVOL700への差分データ転送が完了すると、ストレージシステム10は、バーチャルVOL610とセカンダリVOL700との間のペア状態を「PAIR」から「SSWS」に変更するとともに、バーチャルVOL710のボリューム状態を「SMPL」に変更する。「SMPL」は、どのボリュームとも正副関係のない状態を示す。
図14(E)に示すように、ストレージシステム10は、セカンダリVOL700の状態を「SSWS」に変更する。「SSWS」は、セカンダリVOL700がリード/ライト可能な状態を示す。この状態では、セカンダリVOL700のデータは、前回の確定内容にリストアされる。
図15(A)に示すように、憶制御装置50が副ホストシステム110からSwap-takeoverコマンドを受信すると、副記憶制御装置50は、旧セカンダリVOL700を新プライマリVOL700Aに切り替えるとともに、旧プライマリVOL600を新セカンダリVOL600Aに切り替える処理(正副切り替え処理)を実行する。このとき、仮に正記憶制御装置20がバーチャルVOL610内のスナップショットを用いて、新プライマリVOL600Aのデータをリストアしている場合には、そのリストアが完了するのを持って、図15(B)の状態に遷移する。
図15(B)に示すように、新セカンダリVOL600AとバーチャルVOL610との間のペア状態が「SMPL」に変更されるとともに、新プライマリVOL700AとバーチャルVOL610との間のペア状態が「SMPL」に変更される。
図15(C)に示すように、正記憶制御装置20から副記憶制御装置50へ転送差分ビットマップテーブル510が転送され、転送差分ビットマップテーブル510が転送差分ビットマップテーブル520にマージされる。
図15(D)に示すように、転送差分ビットマップテーブル520に基づいて、副記憶制御装置50が新セカンダリVOL600Aに差分データを書き込む処理(初期コピー)が実行される。
図15(E)は、初期コピー完了後の各ボリュームのペア状態を示す。旧プライマリVOL600用のバーチャルVOL610は、新セカンダリVOL600A用のバーチャルVOL610Aに切り替えられとともに、旧セカンダリVOL700用のバーチャルVOL710は、新プライマリVOL700A用のバーチャルVOL710Aに切り替えられる。新プライマリVOL700Aと新セカンダリVOL600Aとの間のペア状態は「PAIR」になり、新セカンダリVOL600AとバーチャルVOL710Aとの間のペア状態は「PAIR」になる。副記憶制御装置50は、副ホストシステム110からのライトアクセスを受け付けることができる。
次に、図16を参照しながら、プライマリVOL600へのライトアクセスがある状態で正副を切り替える処理の流れについて説明する。
図16(A)は、副記憶制御装置50が副ホストシステム110からSVOL-takeoverコマンドを受信した時点での各ボリュームのペア状態を示す。プライマリVOL600とセカンダリVOL700との間のペア状態は「PAIR」、バーチャルVOL610とセカンダリVOL700との間のペア状態は「PAIR」、プライマリVOL600とバーチャルVOL610との間のペア状態は「PSUS」、セカンダリVOL700とバーチャルVOL710との間のペア状態は「PSUS」である。
図16(B)に示すように、副記憶制御装置50は、SVOL-takeoverコマンドを受信すると、正記憶制御装置20にSSWSコマンドを送信する。各ボリューム間のペア状態に変化はない。
図16(C)に示すように、正記憶制御装置20は、副記憶制御装置50からSSWSコマンドを受信すると、プライマリVOL600とバーチャルVOL610との間のペア状態を「PSUS」→「PAIR」→「PSUS」に変更するとともに、バーチャルVOL610とセカンダリVOL700との間のペア状態を「PAIR」→「PSUS」→「PAIR」に変更することにより、バーチャルVOL610内のデータがその時点(プライマリVOL600とバーチャルVOL610との間のペア状態が「PSUS」に変更された時点)のプライマリVOL600のデータで更新され、更新前後の差分データがバーチャルVOL610からセカンダリVOL700へ転送される。
図16(D)に示すように、正記憶制御装置20は、正ホストシステム100からライトアクセスを受けると、PVOL600のデータ更新位置に対応する差分ビットマップテーブル310のビットをオンにする。プライマリVOL600とセカンダリVOL700との間のペア状態は「PSUS」である。正ホストシステム100からのライトアクセスによるプライマリVOL600のデータ更新については、正記憶制御装置20は、プライマリVOL600のデータ更新位置を差分ビットマップテーブル310で追跡するのみで、スナップショットの作成は行わない。
図16(E)に示すように、バーチャルVOL610からセカンダリVOL700への差分データ転送が完了すると、ストレージシステム10は、バーチャルVOL610とセカンダリVOL700との間のペア状態を「PAIR」から「SSWS」に変更するとともに、バーチャルVOL710のボリューム状態を「SMPL」に変更する。
図16(F)に示すように、ストレージシステム10は、セカンダリVOL700の状態を「SSWS」に変更する。「SSWS」は、セカンダリVOL700がリード/ライト可能な状態を示す。この状態では、セカンダリVOL700のデータは、前回の確定内容にリストアされる。
その後、正副切り替え処理は、図15に示す処理に移行する。図15に示す処理の詳細については、既述してあるので、ここでの説明は省略する。
次に、図17を参照しながら、正記憶制御装置20の状態が不明の状態で正副を切り替える処理の流れについて説明する。
図17(A)は、副記憶制御装置50が副ホストシステム110からSVOL-takeoverコマンドを受信した時点での各ボリュームのペア状態を示す。
図17(B)に示すように、副記憶制御装置50は、SVOL-takeoverコマンドを受信すると、正記憶制御装置20にSSWSコマンドを送信する。ところが、正記憶制御装置20は、障害等が生じているので、SSWSコマンドに対する応答が返ってこないまま、タイムアウトになる。
図17(C)に示すように、副記憶制御装置50は、バーチャルVOL710に論理的に保持されているスナップショットを用いてセカンダリVOL700のデータをリストアする。セカンダリVOL700は、最新のスナップショットを取得した時刻におけるデータイメージにまで復元できる。副記憶制御装置50は、セカンダリVOL700の状態を「SSWS」に変更する。
図17(D)に示すように、副記憶制御装置50は、バーチャルVOL710の状態を「SMPL」に変更する。
正ホストシステム100又は正記憶制御装置20に障害が生じた場合に、上述した正副切り替え処理を実行することにより、副ホストシステム110及び副記憶制御装置50を稼働系システムとして運用することができる。
本実施形態に係るストレージシステムのシステム構成図である。 各種マイクロプログラム及びボリューム管理テーブルの説明図である。 ボリューム管理テーブルの説明図である。 非同期リモートコピーの処理概要を示す説明図である。 非同期リモートコピーの処理シーケンスを示す説明図である。 スナップショット更新処理の概要を示す説明図である。 差分ビットマップテーブルの詳細構成図である。 マージ処理の概要を示す説明図である。 非同期リモートコピーのフローチャートを示す説明図である。 PVOLとプールグループとの対応関係を示す説明図である。 プールグループ−PVOL対応テーブルの説明図である。 差分データ制御ブロックのキュー管理の概要を示す説明図である。 差分データ制御ブロックのキュー管理の概要を示す説明図である。 プライマリVOLへのライトアクセスがない場合のSVOL-takeovber処理を示す説明図である。 Swap-Takeover処理を示す説明図である。 プライマリVOLへのライトアクセスがある場合のSVOL-takeovber処理を示す説明図である。 正記憶制御装置に障害が生じている場合のSVOL-takeovber処理を示す説明図である。
符号の説明
10…ストレージシステム 20…正記憶制御装置 50…副記憶制御装置 300,400…スナップショット管理情報 310,410A、410B…差分ビットマップテーブル 510,520…転送差分ビットマップテーブル 600…PVOL 700…SVOL 610,710…バーチャルVOL 620,720…プールVOL

Claims (10)

  1. 第一の論理ボリュームを有する正記憶制御装置と、前記第一の論理ボリュームとコピーペアを形成可能な第二の論理ボリュームを有する副記憶制御装置とを備えるストレージシステムであって、
    前記正記憶制御装置は、
    ホストアクセスによる前記第一の論理ボリュームの更新位置を管理する第一の差分ビットマップテーブルと、
    前記第一の論理ボリュームのデータイメージを論理的に復元するための第一のスナップショット管理情報と、
    前記ホストアクセスによって更新される前のデータであって、且つ前記第一の論理ボリュームに書かれていたデータである更新前データを格納する第一のプール領域と、
    所定のタイミング以降に前記第一の論理ボリュームが更新されるときに前記更新前データを前記第一のプール領域に書き込む第一の書き込み手段と、
    前記所定のタイミング以降に前記第一の論理ボリュームが更新されると、前記第一のスナップショット管理情報を前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを論理的に復元するための情報に更新する第一のスナップショット更新手段と、
    前記第一の論理ボリュームの更新データが前記第二の論理ボリュームにリモートコピーされたか否かを管理する第一の転送差分ビットマップテーブルと、
    前記第一の差分ビットマップテーブルのビット情報を前記第一の転送差分ビットマップテーブルにマージすることにより前記第一の転送差分ビットマップテーブルを更新する転送差分ビットマップテーブル更新手段と、
    更新された前記第一の転送差分ビットマップテーブルに基づいて、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを構成する各データが前記第一の論理ボリュームと前記第一のプール領域の何れに存在するのかを判別し、判別された方からデータを取得して前記第二の論理ボリュームに送信するリモートコピー手段と、
    を備え、
    前記副記憶制御装置は、
    前記リモートコピーによる前記第二の論理ボリュームの更新位置を管理する第二の転送差分ビットマップテーブルと、
    前記第二の論理ボリュームのデータイメージを論理的に復元するための第二のスナップショット管理情報と、
    前記リモートコピーによって更新される前のデータであって、且つ前記第二の論理ボリュームに書かれていたデータである更新前データを格納する第二のプール領域と、
    前記リモートコピーによって前記第二の論理ボリュームが更新されるときに前記更新前データを前記プール領域に書き込む第二の書き込み手段と、
    前記第二の論理ボリュームが更新されると、前記第二のスナップショット管理情報を所定のタイミングの時点における前記第二の論理ボリュームのデータイメージを論理的に復元する情報に更新する第二のスナップショット更新手段と、
    を備え
    前記第一のスナップショット管理情報は、前記第一のプール領域の各ブロックに対応付けられた複数の差分データ制御ブロックを含み、
    前記正記憶制御装置は、前記第一のプール領域に書き込まれた前記更新前データが消去されると、消去された前記更新前データを管理していた差分データ制御ブロックを空きキューに接続する空きキュー管理手段を更に備え、
    前記空きキュー管理手段は、接続対象となる差分データ制御ブロックを前記空きキューに接続する際に、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されているか否かをチェックし、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックの直前に前記接続対象となる差分データ制御ブロックを接続し、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックの直後に前記接続対象となる差分データ制御ブロックを接続し、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されてない場合には、前記空きキューの最後尾に前記接続対象となる差分データ制御ブロックを接続する、ストレージシステム。
  2. 第一の論理ボリュームを有する正記憶制御装置と、前記第一の論理ボリュームとコピーペアを形成可能な第二の論理ボリュームを有する副記憶制御装置とを備えるストレージシステムであって、
    前記正記憶制御装置は、
    ホストアクセスによる前記第一の論理ボリュームの更新位置を管理する第一の差分ビットマップテーブルと、
    前記第一の論理ボリュームのデータイメージを論理的に復元するための第一のスナップショット管理情報と、
    前記ホストアクセスによって更新される前のデータであって、且つ前記第一の論理ボリュームに書かれていたデータである更新前データを格納する第一のプール領域と、
    所定のタイミング以降に前記第一の論理ボリュームが更新されるときに前記更新前データを前記第一のプール領域に書き込む第一の書き込み手段と、
    前記所定のタイミング以降に前記第一の論理ボリュームが更新されると、前記第一のスナップショット管理情報を前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを論理的に復元するための情報に更新する第一のスナップショット更新手段と、
    前記第一の論理ボリュームの更新データが前記第二の論理ボリュームにリモートコピーされたか否かを管理する第一の転送差分ビットマップテーブルと、
    前記第一の差分ビットマップテーブルのビット情報を前記第一の転送差分ビットマップテーブルにマージすることにより前記第一の転送差分ビットマップテーブルを更新する転送差分ビットマップテーブル更新手段と、
    更新された前記第一の転送差分ビットマップテーブルに基づいて、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを構成する各データが前記第一の論理ボリュームと前記第一のプール領域の何れに存在するのかを判別し、判別された方からデータを取得して前記第二の論理ボリュームに送信するリモートコピー手段と、
    を備え、
    前記副記憶制御装置は、
    前記リモートコピーによる前記第二の論理ボリュームの更新位置を管理する第二の転送差分ビットマップテーブルと、
    前記第二の論理ボリュームのデータイメージを論理的に復元するための第二のスナップショット管理情報と、
    前記リモートコピーによって更新される前のデータであって、且つ前記第二の論理ボリュームに書かれていたデータである更新前データを格納する第二のプール領域と、
    前記リモートコピーによって前記第二の論理ボリュームが更新されるときに前記更新前データを前記プール領域に書き込む第二の書き込み手段と、
    前記第二の論理ボリュームが更新されると、前記第二のスナップショット管理情報を所定のタイミングの時点における前記第二の論理ボリュームのデータイメージを論理的に復元する情報に更新する第二のスナップショット更新手段と、
    を備え、
    前記第二のスナップショット管理情報は、前記第二のプール領域の各ブロックに対応付けられた複数の差分データ制御ブロックを含み、
    前記副記憶制御装置は、前記第二のプール領域に書き込まれた前記更新前データが消去されると、消去された前記更新前データを管理していた差分データ制御ブロックを空きキューに接続する空きキュー管理手段を更に備え、
    前記空きキュー管理手段は、接続対象となる差分データ制御ブロックを前記空きキューに接続する際に、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されているか否かをチェックし、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックの直前に前記接続対象となる差分データ制御ブロックを接続し、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックの直後に前記接続対象となる差分データ制御ブロックを接続し、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されてない場合には、前記空きキューの最後尾に前記接続対象となる差分データ制御ブロックを接続する、ストレージシステム。
  3. 請求項1又は2に記載のストレージシステムであって、
    前記副記憶制御装置は、
    ホストシステムから正副切り替えコマンドを受信すると、前記正記憶制御装置から前記副記憶制御装置にリモートコピーされていない未転送データが存在するか否かを前記正記憶制御装置に問い合せる手段と、
    前記未転送データが存在する場合に、前記正記憶制御装置から前記未転送データを受信し、前記第二の論理ボリュームを更新する手段と、
    を更に備える、ストレージシステム。
  4. 請求項1又は2に記載のストレージシステムであって、
    前記第一の書き込み手段は、前記第一の差分ビットマップテーブルのうちデータ更新有りを示すビットであって、且つ前記第一の転送差分ビットマップテーブルに未だマージされていないビットに対応する前記第一の論理ボリュームの前記更新前データを前記第一のプール領域に書き込む、ストレージシステム。
  5. 請求項1又は2に記載のストレージシステムであって、
    前記正記憶制御装置は、複数の第一の論理ボリュームと、複数の第一のプール領域とを備えており、
    各々の第一の論理ボリュームは、何れかの第一のプール領域に対応けられており、
    前記第一の書き込み手段は、前記第一の論理ボリュームに対応付けられている前記第一のプール領域に前記第一の論理ボリュームの更新前データを書き込む、ストレージシステム。
  6. 第一の論理ボリュームを有する正記憶制御装置へのホストアクセスを受け付けるステップと、
    前記ホストアクセスによる前記第一の論理ボリュームの更新位置を第一の差分ビットマップテーブルにより管理するステップと、
    所定のタイミング以降に前記第一の論理ボリュームが更新されるときに、前記ホストアクセスによって更新される前のデータであって、且つ前記第一の論理ボリュームに書かれていたデータである更新前データを第一のプール領域に書き込むステップと、
    前記所定のタイミング以降に前記第一の論理ボリュームが更新されると、前記第一の論理ボリュームのデータイメージを論理的に復元するための第一のスナップショット管理情報を、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを論理的に復元する情報に更新するステップと、
    前記正記憶制御装置が有する前記第一の論理ボリュームの更新データが、副記憶制御装置が有する第二の論理ボリュームにリモートコピーされたか否かを管理する第一の転送差分ビットマップテーブルに前記第一の差分ビットマップテーブルのビット情報をマージするステップと、
    更新された前記第一の転送差分ビットマップテーブルに基づいて、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを構成する各データが前記第一の論理ボリュームと前記第一のプール領域の何れに存在するのかを判別し、判別された方からデータを取得して前記第二の論理ボリュームにリモートコピーするステップと、
    前記リモートコピーによる前記第二の論理ボリュームの更新位置を第二の転送差分ビットマップテーブルにより管理するステップと、
    前記リモートコピーによって更新される前のデータであって、且つ前記第二の論理ボリュームに書かれていたデータである更新前データを第二のプール領域に書き込むステップと、
    前記第二の論理ボリュームが更新されると、前記第二の論理ボリュームのデータイメージを論理的に復元するための第二のスナップショット管理情報を、所定のタイミングの時点における前記第二の論理ボリュームのデータイメージを論理的に復元する情報に更新するステップと、
    を備え
    前記第一のスナップショット管理情報は、前記第一のプール領域の各ブロックに対応付けられた複数の差分データ制御ブロックを含み、
    前記正記憶制御装置は、前記第一のプール領域に書き込まれた前記更新前データが消去されると、消去された前記更新前データを管理していた差分データ制御ブロックを空きキューに接続する空きキュー管理手段を更に備え、
    接続対象となる差分データ制御ブロックを前記空きキューに接続する際に、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されているか否かをチェックするステップと、
    前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックの直前に前記接続対象となる差分データ制御ブロックを接続するステップと、
    前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックの直後に前記接続対象となる差分データ制御ブロックを接続するステップと、
    前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されてない場合には、前記空きキューの最後尾に前記接続対象となる差分データ制御ブロックを接続するステップと、
    を更に備える、ストレージシステムの制御方法。
  7. 第一の論理ボリュームを有する正記憶制御装置へのホストアクセスを受け付けるステップと、
    前記ホストアクセスによる前記第一の論理ボリュームの更新位置を第一の差分ビットマップテーブルにより管理するステップと、
    所定のタイミング以降に前記第一の論理ボリュームが更新されるときに、前記ホストアクセスによって更新される前のデータであって、且つ前記第一の論理ボリュームに書かれていたデータである更新前データを第一のプール領域に書き込むステップと、
    前記所定のタイミング以降に前記第一の論理ボリュームが更新されると、前記第一の論理ボリュームのデータイメージを論理的に復元するための第一のスナップショット管理情報を、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを論理的に復元する情報に更新するステップと、
    前記正記憶制御装置が有する前記第一の論理ボリュームの更新データが、副記憶制御装置が有する第二の論理ボリュームにリモートコピーされたか否かを管理する第一の転送差分ビットマップテーブルに前記第一の差分ビットマップテーブルのビット情報をマージするステップと、
    更新された前記第一の転送差分ビットマップテーブルに基づいて、前記所定のタイミングの時点における前記第一の論理ボリュームのデータイメージを構成する各データが前記第一の論理ボリュームと前記第一のプール領域の何れに存在するのかを判別し、判別された方からデータを取得して前記第二の論理ボリュームにリモートコピーするステップと、
    前記リモートコピーによる前記第二の論理ボリュームの更新位置を第二の転送差分ビットマップテーブルにより管理するステップと、
    前記リモートコピーによって更新される前のデータであって、且つ前記第二の論理ボリュームに書かれていたデータである更新前データを第二のプール領域に書き込むステップと、
    前記第二の論理ボリュームが更新されると、前記第二の論理ボリュームのデータイメージを論理的に復元するための第二のスナップショット管理情報を、所定のタイミングの時点における前記第二の論理ボリュームのデータイメージを論理的に復元する情報に更新するステップと、
    を備え、
    前記第二のスナップショット管理情報は、前記第二のプール領域の各ブロックに対応付けられた複数の差分データ制御ブロックを含み、
    前記副記憶制御装置は、前記第二のプール領域に書き込まれた前記更新前データが消去されると、消去された前記更新前データを管理していた差分データ制御ブロックを空きキューに接続する空きキュー管理手段を更に備え、
    接続対象となる差分データ制御ブロックを前記空きキューに接続する際に、前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されているか否かをチェックするステップと、
    前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号+1の番号を有する差分データ制御ブロックの直前に前記接続対象となる差分データ制御ブロックを接続するステップと、
    前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックが前記空きキューに接続されている場合には、前記接続対象となる差分データ制御ブロックの番号−1の番号を有する差分データ制御ブロックの直後に前記接続対象となる差分データ制御ブロックを接続するステップと、
    前記接続対象となる差分データ制御ブロックの番号±1の番号を有する差分データ制御ブロックが前記空きキューに接続されてない場合には、前記空きキューの最後尾に前記接続対象となる差分データ制御ブロックを接続するステップと、
    を更に備える、ストレージシステムの制御方法。
  8. 請求項6又は7に記載のストレージシステムの制御方法であって、
    ホストシステムから正副切り替えコマンドを受信するステップと、
    前記正記憶制御装置から前記副記憶制御装置にリモートコピーされていない未転送データが存在するか否かを前記正記憶制御装置に問い合せるステップと、
    前記未転送データが存在する場合に、前記正記憶制御装置から前記未転送データを受信して前記第二の論理ボリュームを更新するステップと、
    を更に備える、ストレージシステムの制御方法。
  9. 請求項6又は7に記載のストレージシステムの制御方法であって、
    前記第一の差分ビットマップテーブルのうちデータ更新有りを示すビットであって、且つ前記第一の転送差分ビットマップテーブルに未だマージされていないビットに対応する前記第一の論理ボリュームの前記更新前データを前記第一のプール領域に書き込むステップを更に備える、ストレージシステムの制御方法。
  10. 請求項6又は7に記載のストレージシステムの制御方法であって、
    前記正記憶制御装置は、複数の第一の論理ボリュームと、複数の第一のプール領域とを備えており、
    各々の第一の論理ボリュームは、何れかの第一のプール領域に対応けられており、
    前記第一の論理ボリュームに対応付けられている前記第一のプール領域に前記第一の論理ボリュームの更新前データを書き込むステップを更に備える、ストレージシステムの制御方法。
JP2006032927A 2006-01-13 2006-02-09 ストレージシステム及びその制御方法 Expired - Fee Related JP4800056B2 (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP2006032927A JP4800056B2 (ja) 2006-02-09 2006-02-09 ストレージシステム及びその制御方法
US11/449,668 US7472243B2 (en) 2006-02-09 2006-06-09 Storage system and control method thereof
EP06255689A EP1818828B1 (en) 2006-02-09 2006-11-03 Storage system and control method thereof
DE602006002241T DE602006002241D1 (de) 2006-02-09 2006-11-03 Speichersystem und Steuerungsverfahren dafür
US11/822,253 US7509467B2 (en) 2006-01-13 2007-07-03 Storage controller and data management method
US12/292,991 US7765372B2 (en) 2006-01-13 2008-12-02 Storage controller and data management method
US12/822,874 US7925852B2 (en) 2006-01-13 2010-06-24 Storage controller and data management method
US13/039,122 US8266401B2 (en) 2006-01-13 2011-03-02 Storage controller and data management method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006032927A JP4800056B2 (ja) 2006-02-09 2006-02-09 ストレージシステム及びその制御方法

Publications (2)

Publication Number Publication Date
JP2007213345A JP2007213345A (ja) 2007-08-23
JP4800056B2 true JP4800056B2 (ja) 2011-10-26

Family

ID=37969692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006032927A Expired - Fee Related JP4800056B2 (ja) 2006-01-13 2006-02-09 ストレージシステム及びその制御方法

Country Status (4)

Country Link
US (4) US7472243B2 (ja)
EP (1) EP1818828B1 (ja)
JP (1) JP4800056B2 (ja)
DE (1) DE602006002241D1 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4809040B2 (ja) * 2005-11-08 2011-11-02 株式会社日立製作所 ストレージ装置及びスナップショットのリストア方法
JP4800056B2 (ja) * 2006-02-09 2011-10-26 株式会社日立製作所 ストレージシステム及びその制御方法
JP4842720B2 (ja) * 2006-06-29 2011-12-21 株式会社日立製作所 ストレージシステム及びデータ複製方法
JP4990066B2 (ja) * 2007-08-21 2012-08-01 株式会社日立製作所 論理ボリュームのペアを利用したデータ保存の方式を変更する機能を備えたストレージシステム
WO2009040954A1 (ja) * 2007-09-28 2009-04-02 Fujitsu Limited 正センタの仮想テープ装置、副センタの仮想テープ装置、仮想ライブラリシステムおよび仮想テープ制御方法
JP2009104421A (ja) * 2007-10-23 2009-05-14 Hitachi Ltd ストレージアクセス装置
JP2009181206A (ja) 2008-01-29 2009-08-13 Hitachi Ltd ストレージシステム及びスナップショット構成の移行方法
JP5156518B2 (ja) * 2008-07-23 2013-03-06 株式会社日立製作所 記憶制御装置及び方法
TWI514249B (zh) * 2009-01-23 2015-12-21 Infortrend Technology Inc 遠端非同步資料卷複製的方法及執行該方法的儲存系統
WO2010106694A1 (en) * 2009-03-18 2010-09-23 Hitachi, Ltd. Data backup system and data backup method
JP2013011919A (ja) 2009-09-17 2013-01-17 Hitachi Ltd ストレージ装置及びそのスナップショット制御方法
KR101673233B1 (ko) * 2010-05-11 2016-11-17 삼성전자주식회사 트랜잭션 분할 장치 및 방법
JP2012027869A (ja) * 2010-07-28 2012-02-09 Pfu Ltd 管理サーバ、情報処理装置、方法およびプログラム
WO2012127537A1 (en) * 2011-03-24 2012-09-27 Hitachi, Ltd. Computer system and data backup method
US10386346B2 (en) * 2011-09-05 2019-08-20 Shimadzu Corporation System and method for processing chromatogram data
US9229758B2 (en) 2011-10-28 2016-01-05 International Business Machines Corporation Passive monitoring of virtual systems using extensible indexing
JP5982826B2 (ja) * 2012-01-06 2016-08-31 富士通株式会社 環境構築装置、環境登録装置、環境切替装置、環境構築方法、環境登録方法、環境切替方法、環境構築プログラム、環境登録プログラム、及び環境切替プログラム
US9940019B2 (en) * 2013-06-12 2018-04-10 International Business Machines Corporation Online migration of a logical volume between storage systems
US8819317B1 (en) 2013-06-12 2014-08-26 International Business Machines Corporation Processing input/output requests using proxy and owner storage systems
US9779003B2 (en) 2013-06-12 2017-10-03 International Business Machines Corporation Safely mapping and unmapping host SCSI volumes
US9769062B2 (en) 2013-06-12 2017-09-19 International Business Machines Corporation Load balancing input/output operations between two computers
US9304885B2 (en) 2013-06-18 2016-04-05 International Business Machines Corporation Passive monitoring of virtual systems using agent-less, near-real-time indexing
US9654560B2 (en) 2013-06-27 2017-05-16 Hitachi, Ltd. Management system and method
US9218139B2 (en) * 2013-08-16 2015-12-22 International Business Machines Corporation Minimally disruptive virtual machine snapshots
JP6194784B2 (ja) * 2013-12-13 2017-09-13 富士通株式会社 ストレージ制御装置、制御方法および制御プログラム
US9600203B2 (en) 2014-03-11 2017-03-21 Amazon Technologies, Inc. Reducing data volume durability state for block-based storage
US9720620B1 (en) 2014-03-11 2017-08-01 Amazon Technologies, Inc. Efficient data volume replication for block-based storage
US10530837B2 (en) 2014-04-10 2020-01-07 International Business Machines Corporation Always-on monitoring in the cloud
JP6350090B2 (ja) * 2014-08-06 2018-07-04 富士通株式会社 ストレージ制御装置、コピー制御プログラム、およびコピー制御方法
WO2016042650A1 (ja) * 2014-09-19 2016-03-24 株式会社日立製作所 非同期リモートコピーを構成するストレージシステム、ストレージ装置及び非同期リモートコピー制御方法
JP7062951B2 (ja) * 2017-12-27 2022-05-09 株式会社リコー 電子機器、機器管理システム、及びプログラム
TWI791966B (zh) * 2020-03-27 2023-02-11 瑞昱半導體股份有限公司 記憶體控制器與資料處理方法
JP7088567B2 (ja) * 2020-04-30 2022-06-21 Necプラットフォームズ株式会社 Raid制御装置、raid制御方法及びプログラム
CN116974454A (zh) * 2022-04-21 2023-10-31 戴尔产品有限公司 用于数据处理的方法、电子设备和计算机程序产品

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835953A (en) 1994-10-13 1998-11-10 Vinca Corporation Backup system that takes a snapshot of the locations in a mass storage device that has been identified for updating prior to updating
US5790773A (en) 1995-12-29 1998-08-04 Symbios, Inc. Method and apparatus for generating snapshot copies for data backup in a raid subsystem
US6038639A (en) 1997-09-09 2000-03-14 Storage Technology Corporation Data file storage management system for snapshot copy operations
US6131148A (en) 1998-01-26 2000-10-10 International Business Machines Corporation Snapshot copy of a secondary volume of a PPRC pair
US6434186B2 (en) 1998-03-27 2002-08-13 Nokia Mobile Phones Limited Priority channel search based on spectral analysis and signal recognition
US6253295B1 (en) 1998-07-20 2001-06-26 International Business Machines Corporation System and method for enabling pair-pair remote copy storage volumes to mirror data in another pair of storage volumes
US6397308B1 (en) * 1998-12-31 2002-05-28 Emc Corporation Apparatus and method for differential backup and restoration of data in a computer storage system
US6434681B1 (en) 1999-12-02 2002-08-13 Emc Corporation Snapshot copy facility for a data storage system permitting continued host read/write access
JP3868708B2 (ja) 2000-04-19 2007-01-17 株式会社日立製作所 スナップショット管理方法及び計算機システム
US6542962B2 (en) 2001-03-21 2003-04-01 Hitachi, Ltd. Multiple processor data processing system with mirrored data for distributed access
US6728736B2 (en) 2001-03-14 2004-04-27 Storage Technology Corporation System and method for synchronizing a data copy using an accumulation remote copy trio
US6771843B1 (en) 2001-05-11 2004-08-03 Lsi Logic Corporation Data timeline management using snapshot volumes
US6823436B2 (en) 2001-10-02 2004-11-23 International Business Machines Corporation System for conserving metadata about data snapshots
US7296125B2 (en) 2001-11-29 2007-11-13 Emc Corporation Preserving a snapshot of selected data of a mass storage system
US6948089B2 (en) 2002-01-10 2005-09-20 Hitachi, Ltd. Apparatus and method for multiple generation remote backup and fast restore
US6748504B2 (en) 2002-02-15 2004-06-08 International Business Machines Corporation Deferred copy-on-write of a snapshot
JP4704659B2 (ja) 2002-04-26 2011-06-15 株式会社日立製作所 記憶装置システムの制御方法および記憶制御装置
US6857001B2 (en) 2002-06-07 2005-02-15 Network Appliance, Inc. Multiple concurrent active file systems
US6981114B1 (en) 2002-10-16 2005-12-27 Veritas Operating Corporation Snapshot reconstruction from an existing snapshot and one or more modification logs
JP4199993B2 (ja) 2002-11-27 2008-12-24 株式会社日立製作所 スナップショット取得方法
TWI308270B (en) 2003-03-06 2009-04-01 Icp Electronics Inc Storage system and method with snapshot backup funtion
JP2004303122A (ja) 2003-04-01 2004-10-28 Hitachi Ltd データ転送制御システム
JP2005018510A (ja) 2003-06-27 2005-01-20 Hitachi Ltd データセンタシステム及びその制御方法
JP4386694B2 (ja) * 2003-09-16 2009-12-16 株式会社日立製作所 記憶システム及び記憶制御装置
JP2005141381A (ja) * 2003-11-05 2005-06-02 Hitachi Ltd 記憶装置システム
JP4319017B2 (ja) 2003-12-02 2009-08-26 株式会社日立製作所 ストレージシステムの制御方法、ストレージシステム、及び記憶装置
US7343449B2 (en) * 2004-03-22 2008-03-11 Hitachi, Ltd. Storage subsystem and storage system
JP4439960B2 (ja) 2004-03-22 2010-03-24 株式会社日立製作所 ストレージ装置
JP2005275494A (ja) 2004-03-23 2005-10-06 Hitachi Ltd ストレージシステム及びストレージシステムのリモートコピー方法
JP2005293469A (ja) * 2004-04-05 2005-10-20 Nippon Telegr & Teleph Corp <Ntt> データコピーシステムおよびデータコピー方法
JP4681247B2 (ja) 2004-04-08 2011-05-11 株式会社日立製作所 ディスクアレイ装置及びディスクアレイ装置の制御方法
JP2006011811A (ja) * 2004-06-25 2006-01-12 Hitachi Ltd 記憶制御システム及び記憶制御方法
JP2006099440A (ja) * 2004-09-29 2006-04-13 Hitachi Ltd リモートコピーシステム
US7509467B2 (en) * 2006-01-13 2009-03-24 Hitachi, Ltd. Storage controller and data management method
JP4800056B2 (ja) * 2006-02-09 2011-10-26 株式会社日立製作所 ストレージシステム及びその制御方法

Also Published As

Publication number Publication date
US20090094428A1 (en) 2009-04-09
US20070186067A1 (en) 2007-08-09
US20110153966A1 (en) 2011-06-23
US8266401B2 (en) 2012-09-11
US7765372B2 (en) 2010-07-27
US7925852B2 (en) 2011-04-12
EP1818828A1 (en) 2007-08-15
US20100262798A1 (en) 2010-10-14
JP2007213345A (ja) 2007-08-23
EP1818828B1 (en) 2008-08-13
DE602006002241D1 (de) 2008-09-25
US7472243B2 (en) 2008-12-30

Similar Documents

Publication Publication Date Title
JP4800056B2 (ja) ストレージシステム及びその制御方法
JP5124183B2 (ja) 非同期リモートコピーシステムの制御方法及び非同期リモートコピーシステム
JP4800031B2 (ja) ストレージシステム及びスナップショット管理方法
US8001344B2 (en) Storage control apparatus, storage control program, and storage control method
JP4993913B2 (ja) 記憶制御装置及びそのデータ管理方法
US7461100B2 (en) Method for fast reverse restore
US7707377B2 (en) Remote storage disk control device and method for controlling the same
US20070083567A1 (en) Storage control system and method
US7509467B2 (en) Storage controller and data management method
US20050268054A1 (en) Instant virtual copy to a primary mirroring portion of data
JPH0683677A (ja) データの増分タイム・ゼロ・バックアップ・コピーの方法及びシステム
US8108637B2 (en) Information processing system, controlling method in information processing system, and managing apparatus to manage remote copy in consideration of saving power
JP4311532B2 (ja) 記憶システム及び同システムにおけるスナップショット管理方法
US8131958B2 (en) Storage system, storage device, and data updating method using a journal volume
JP5275691B2 (ja) ストレージシステム
JP4790283B2 (ja) ストレージサブシステム及びストレージシステム
Bertrand Examining Hitachi Copy-on-Write Snapshot Software Capabilities

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20081215

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140812

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees