JP6927725B2 - ストレージ装置、レプリケーションシステム及びレプリケーション方法 - Google Patents

ストレージ装置、レプリケーションシステム及びレプリケーション方法 Download PDF

Info

Publication number
JP6927725B2
JP6927725B2 JP2017060277A JP2017060277A JP6927725B2 JP 6927725 B2 JP6927725 B2 JP 6927725B2 JP 2017060277 A JP2017060277 A JP 2017060277A JP 2017060277 A JP2017060277 A JP 2017060277A JP 6927725 B2 JP6927725 B2 JP 6927725B2
Authority
JP
Japan
Prior art keywords
update
storage system
storage
update process
order information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017060277A
Other languages
English (en)
Other versions
JP2018163520A (ja
Inventor
優二 石川
優二 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2017060277A priority Critical patent/JP6927725B2/ja
Publication of JP2018163520A publication Critical patent/JP2018163520A/ja
Application granted granted Critical
Publication of JP6927725B2 publication Critical patent/JP6927725B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ストレージ装置、レプリケーションシステム及びレプリケーション方法にかかり、特に、ある記憶装置のデータを更新したときの更新情報を他の記憶装置へ転送するストレージ装置、レプリケーションシステム及びレプリケーション方法に関する。
コンピュータシステムの災害対策構成として、三拠点にストレージシステムを配置し、それらをネットワーク接続してデータバックアップを行う、三拠点間レプリケーションが一般的に知られている(特許文献1参照)。ここで、互いにネットワーク接続される各拠点のストレージシステムはそれぞれフロントサイト、近地サイト、遠地サイトに設置されているとし、フロントサイトのストレージシステムはホストと接続され、ホストからデータ更新を受け、近地サイトは遠地サイトより地理的またはネットワーク的にフロントサイトに近い拠点であるとする。このような場合に、各拠点のストレージシステム間が例えば以下のようにデータ同期される。
まず、フロントサイトと近地サイトとのストレージシステム間は、同期レプリケーションにてデータ同期が行われ、次に、近地サイトと遠地サイトとのストレージシステム間は、例えば特許文献2で開示される、データ更新順序を保証する準同期モードのレプリケーション、又は特許文献3で開示されるデータ更新順序を保証する非同期レプリケーションにてデータ同期が行われる。
前述のように、近地サイトと遠地サイトとの間では準同期または非同期レプリケーションにてデータ同期が行われることで、ホストの更新IO性能への影響を軽減することができる。
特開2006―119745号公報 特開2003−167684号公報 特開2001−209565号公報
しかしながら、前述の三拠点間レプリケーションでは近地サイトが被災した場合に遠地サイトへの継続的なデータバックアップができなくなる可能性がある。具体的には、近地サイトで蓄積されたデータが被災などによる障害発生によって失われた場合、近地サイトと遠地サイトとの間でのデータ同期がどこまで行われたかは、フロントサイトからは不明である。このため、フロントサイトから遠地サイトへ直接データバックアップを行う場合は、全てのデータをコピーする必要があり、大規模環境では長時間を要すという問題がある。また、フロントサイトから遠地サイトへ直接全てのデータをコピーする場合、データをコピーしている間はフロントサイトにおけるデータ更新が行えないか、更新が行われたとしても、このデータ更新に対応する更新処理を、更新順序を保障して保持し、転送する構成をフロントサイトが持たないため、遠地サイトとのデータ同期が行えないという問題がある。
本発明は、ホストの更新IO性能への影響を低減し、更に、近地サイト被災時に、フロントサイトと遠地サイトとでフロントサイトにおけるデータ更新順序を保障してデータ同期するレプリケーションシステムを提供することを一つの目的とする。
本発明の第1の側面は、第一のストレージシステム内の第一のストレージ装置のデータ更新を、第二のストレージシステム内の第二のストレージ装置に同期レプリケーションによって反映させ、第二のストレージ装置のデータ更新を、第三のストレージシステム内の第三のストレージ装置に準同期または非同期レプリケーションよって反映させるレプリケーションシステムにおいて、第一のストレージシステムは、第二のストレージシステム及び第三のストレージシステムと通信可能に接続され、第一のストレージ装置に対して行われたデータ更新に対応する更新処理を特定する特定情報と複数の更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部と、更新処理と該更新処理の順序情報とを第二のストレージシステムに転送する転送部と、更新処理を蓄積する更新処理蓄積部と、をさらに備え、第三のストレージシステムは、第二のストレージシステムと通信可能に接続され、第二のストレージシステムを介し更新処理と該更新処理の順序情報とを受信する受信部と、更新処理を第三のストレージ装置に反映させる更新処理反映部と、更新処理反映部が第三のストレージ装置に最後に反映させた更新処理の順序情報を保持する順序情報保持部と、順序情報保持部が保持する順序情報を第一のストレージシステムに通知する順序情報通知部と、をさらに備え、第二のストレージシステムに障害が発生したとき、順序情報通知部が順序情報を第一のストレージシステムに通知し、対応情報保持部において順序情報に対応する更新処理より後に行われた更新処理が特定され、転送部が、更新処理蓄積部に蓄積された更新処理のうち、特定された更新処理を第三のストレージシステムに転送する、レプリケーションシステムである。
本発明の第2の側面は、第一のストレージシステムのデータ更新を第二のストレージシステムに同期レプリケーションし、第二のストレージシステムのデータ更新を第三のストレージシステムに準同期または非同期レプリケーションするレプリケーションシステムにおいて、第一のストレージシステムのデータに対して行われた更新処理の更新順序を示す順序を特定する特定情報を生成し、更新処理と順序特定情報とを対応付けて更新順に第一のストレージシステムにて蓄積し、第三のストレージシステムにて、最後に同期した更新処理に対応する順序特定情報を保持し、第二のストレージシステムに障害が発生したとき、第三のストレージシステムが最後に同期した更新処理に対応する順序特定情報を第一のストレージシステムに通知し、第一のストレージシステムは、受信した順序特定情報に対応する前期更新処理より後の続きの更新処理を第三のストレージシステムに送信する、レプリケーション方法である。
本発明の第三の側面は、第二のストレージ装置及び第三のストレージ装置と通信可能に接続され、データ更新が行われると当該データ更新を第二のストレージ装置に同期レプリケーションによって反映させ、第二のストレージ装置におけるデータ更新は第三のストレージ装置に準同期または非同期レプリケーションよって反映されるストレージ装置であって、データ更新に対応する更新処理を蓄積する更新処理蓄積部と、更新処理 を特定する特定情報と複数の更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部と、更新処理と該更新処理の順序情報とを第二のストレージ装置に転送する転送部と、を備え、第二のストレージ装置に障害が発生したとき、第三のストレージ装置から順序情報を受信して、対応情報保持部において順序情報に対応する更新処理より後に行われた更新処理を特定し、転送部が特定された更新処理を第三のストレージに転送する、ストレージ装置である。
本発明におけるストレージ装置、レプリケーションシステム及びレプリケーション方法は、以上のように構成されることにより、近地サイトで障害が発生した場合に、フロントサイトから遠地サイトへ全てのデータを送信することなく、フロントサイトと遠地サイトとの間で同期できるという効果を有する。
本発明の第一の実施形態におけるレプリケーションシステムの構成の概略を示すブロック図である。 本発明のレプリケーションシステムを実現するハードウェア構成の一例を示す概略図である。 第一の実施形態におけるレプリケーションシステムの動作を説明するためのフローチャートである。 本発明の第二の実施形態におけるレプリケーションシステムの構成の概略を示すブロック図である。 本発明の第二の実施形態におけるフロントサイトの構成の概略を示すブロック図である。 本発明の第二の実施形態における近地サイトの構成の概略を示すブロック図である。 本発明の第二の実施形態における遠地サイトの構成の概略を示すブロック図である。 本発明の第二の実施形態におけるフロントサイトの動作を説明するためのフローチャートである。 本発明の第二の実施形態における近地サイトの動作を説明するためのフローチャートである。 本発明の第二の実施形態における遠地サイトの動作を説明するためのフローチャートである。 本発明の第二の実施形態において近地サイトに障害が発生した場合のレプリケーションシステムの動作を説明するためのフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。
[第一の実施形態]本発明の第一の実施形態を、図1及び2を参照して説明する。図1は、レプリケーションシステムの構成を説明するための図である。図2は、レプリケーションシステムを実現するハードウェア構成の一例を示す図である。
[構成の説明]最初に、第一の実施形態におけるレプリケーションシステム1の構成を、図1を用いて説明する。第一の実施形態におけるレプリケーションシステム1は、第一のストレージシステム10と、第二のストレージシステム20と、第三のストレージシステム30と、を備え、各ストレージシステム10、20、30間は通信可能に接続されている。また、レプリケーションシステム1は、全体として、第一のストレージシステム10内の第一のストレージ装置のデータ更新を、第二のストレージシステム20内の第二のストレージ装置に同期レプリケーションによって反映させ、第二のストレージ装置のデータ更新を、第三のストレージシステム30内の第三のストレージ装置に準同期または非同期レプリケーションよって反映させるという動作を行う。
第一のストレージシステム10は、第一のストレージ装置12と、第一のストレージ装置12に対して行われたデータ更新に対応する更新処理を特定する特定情報と複数の更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部13と、更新処理とその順序情報とを第二のストレージシステム20に転送する転送部14と、更新処理を蓄積する更新処理蓄積部15と、を備える。第一のストレージシステム10は、後述する順序情報通知部34から順序情報が通知されると、対応情報保持部13において、通知された順序情報に対応する更新処理より後に行われた更新処理を特定し、転送部14が、更新処理蓄積部15に蓄積された更新処理のうち、特定された更新処理を第三のストレージシステム30に転送する。ここで更新処理は、例えばトランザクションログファイルまたはトランザクションログなど、一連の更新処理を実行するために必要とされるデータである。
第二のストレージシステム20は、第二のストレージ装置23と、データ反映部21と、送受信部22と、を備える。
第三のストレージシステム30は、第二のストレージシステム20を介し更新処理とその順序情報とを受信する受信部31と、更新処理を第三のストレージ装置35に反映させる更新処理反映部32と、更新処理反映部32が第三のストレージ装置35に最後に反映させた更新処理の順序情報を保持する順序情報保持部33と、順序情報保持部33が保持する順序情報を第一のストレージシステム10に通知する順序情報通知部34と、を備える。順序情報通知部34は、第二のストレージシステム20に障害が発生したとき、順序情報を第一のストレージシステム10に通知する。
(レプリケーションシステム1のハードウェア構成の一例)次に、図2を参照し、第一の実施形態にかかる第一のストレージシステム10を実現可能なハードウェア構成の一例を説明する。第一のストレージシステム10(コンピュータ)を構成するハードウェアは、CPU(Central Processing Unit)41、メモリ42、HDD(Hard Disk Drive)43、通信インターフェース(I/F)44を備える。第一のストレージシステム10は、さらに入力装置または出力装置を備えていてもよい。第一のストレージシステム10の機能は、例えばCPU41が、メモリ42に読み出されたコンピュータプログラム(ソフトウェアプログラム、以下単に「プログラム」と記載する)を実行することにより実現される。実行に際して、CPU41は、通信インターフェース44、入力装置および出力装置を適宜制御する。
尚、本実施形態および後述する各実施形態を例として説明される本発明は、係るプログラムが格納されたコンパクトディスク等の不揮発性の記憶媒体によって構成されてもよい。記憶媒体が格納するプログラムは、例えばドライブ装置により読み出される。
第一のストレージシステム10が実行する通信は、例えばOS(Operating System)が提供する機能を使ってアプリケーションプログラムが通信インターフェース44を制御することによって実現される。入力装置は、例えばキーボード、マウスまたはタッチパネルである。出力装置は、例えばディスプレイである。第一のストレージシステム10は、2つ以上の物理的に分離した装置が有線または無線で接続されることによって構成されていてもよい。例えば、前述のHDD43の代わりにストレージ装置を用いることで、コンピュータとストレージ装置によって第一のストレージシステム10が構成される。また、コンピュータとストレージ装置は各々が複数であってもよい。
図2に示すハードウェア構成例は、後述する各実施形態にも適用可能である。なお、第一のストレージシステム10は専用の装置であってもよい。なお、第一のストレージシステムおよびその各機能部のハードウェア構成は、上述の構成に限定されない。第二のストレージシステム20、第三のストレージシステム30も同様に構成することができる。
[動作の説明]次に、レプリケーションシステム1の動作を、図3を参照して説明する。レプリケーションシステム1は、通常時、全体として、第一のストレージシステム10内の第一のストレージ装置12のデータ更新を、第二のストレージシステム20内の第二のストレージ装置23に同期レプリケーションによって反映させ、前記第二のストレージ装置23のデータ更新を、第三のストレージシステム30内の第三のストレージ装置35に準同期または非同期レプリケーションよって反映させるという動作を行う。
一方、レプリケーションシステム1は、第二のストレージシステム20に障害が発生したとき、まず順序情報通知部34が順序情報を第一のストレージシステム10に通知する(ステップS41)。第一のストレージシステム10は、順序情報を受信すると、対応情報保持部13において順序情報に対応する更新処理より後に行われた更新処理を特定し(ステップS42)、転送部14で第三のストレージシステム30に、特定された更新処理を転送する(ステップS43)。
[効果の説明]上記構成により、第一の実施形態におけるレプリケーションシステム1は、第二のストレージシステム20に障害が発生したとき、まず順序情報通知部34が順序情報を第一のストレージシステム10に通知する。第一のストレージシステム10は、順序情報を受信すると、対応情報保持部13において順序情報に対応する更新処理より後に行われた更新処理を特定し、転送部14で第三のストレージシステム30に、特定された更新処理を転送する。このように、第三のストレージシステム30から第一のストレージシステム10に順序情報が通知されることで、第一のストレージシステム10から転送する更新処理が特定できるため、全てのデータを第一のストレージシステム10から第三のストレージシステム30へ送信することなく、第一のストレージシステム10と第三のストレージシステム30とが同期される。
[第二の実施形態]本発明の第二の実施形態を図4から図11を参照して説明する。図4は、レプリケーションシステムの構成を説明するための図である。図5は、レプリケーションシステムを構成するフロントサイトの構成を説明するための図である。図6は、レプリケーションシステムを構成する近地サイトの構成を説明するための図である。図7は、レプリケーションシステムを構成する遠地サイトの構成を説明するための図である。図8は、フロントサイトの動作を説明するための図である。図9は、近地サイトの動作を説明するための図である。図10は、遠地サイトの動作を説明するための図である。図11は、近地サイトに障害が発生した場合のレプリケーションシステムの動作を説明するための図である。
[構成の説明]最初に、第二の実施形態におけるレプリケーションシステム500の構成を、図4を用いて説明する。第二の実施形態におけるレプリケーションシステム500は、第一の実施形態におけるレプリケーションシステム1の一構成例である。レプリケーションシステム500は、フロントサイトに設置されたストレージシステム(以下フロントサイト100とする)と、近地サイトに設置されたストレージシステム(以下近地サイト200とする)と、遠地サイトに設置されたストレージシステム(以下遠地サイト300とする)と、ネットワーク410、420、430、及び440と、を備える。フロントサイト100は第一の実施形態における第一のストレージシステム10の一構成例である。同様に、近地サイト200は第二のストレージシステム20の、遠地サイト300は第三のストレージシステム30の一構成例である。また、ネットワーク410、420、430、及び440は、例えばWAN(Wide Area Network)やLAN(Local Area Network)で構成され、有線または無線通信である。ストレージシステム間の通信は広い帯域を必要とするため、通常は有線回線で構成される。
ここで、フロントサイト100は、ネットワーク410を介してホスト50と通信可能に接続され、ホスト50からデータ更新を受ける。また、フロントサイト100と近地サイト200とは地理的に近距離の関係にあり、これらのシステム間は、ネットワーク420を介して通信可能に接続され、同期レプリケーションによってデータ同期が行われる。また、近地サイト200と遠地サイト300とは地理的に遠距離の関係にあり、これらの装置間は、ネットワーク430を介して通信可能に接続され、非同期レプリケーションまたは準同期レプリケーションによってデータ同期が行われる。
次に、レプリケーションシステム500を構成するフロントサイト100の構成を、図5を参照して説明する。フロントサイト100は、ホスト50からデータを受信する第一のデータ受信部110と、受信したデータのうちレプリケーション対象データである更新処理をジャーナルボリューム122に格納するデータ格納部111と、更新処理を格納するジャーナルボリューム122を備える。さらにフロントサイト100は、前述の更新処理の更新処理情報、後述する更新処理に付与された更新順番、ジャーナルボリューム122内での更新処理の格納位置情報を示すジャーナルリンク情報を更新順番管理テーブル112aに書き込む更新処理情報格納部113と、テーブル格納ボリューム112とを備える。テーブル格納ボリューム112には、更新処理情報、更新処理に付与された更新順番、ジャーナルリンク情報を持つ更新順番管理テーブル112aが格納される。さらにフロントサイト100は、更新処理に更新順番を付与し、更新順番管理テーブル112aに書き込む更新順番付与部114と、ホスト50からの更新処理をマスターボリューム120、121に反映させる第一のデータ更新部115と、更新処理を反映したデータを記憶するマスターボリューム120、121と、更新処理、更新処理情報及び付与された更新順番をレプリケーションデータとして近地サイト200に転送する第一のデータ転送部116と、を備える。ここで、更新処理情報は、データ格納先のマスターボリューム順序情報(図5においてはマスターボリューム120、121の論理ディスク番号(LDN、Logical Disk Number))、ブロックアドレス、レングス)を含む。また、ジャーナルリンク情報は、データ格納先ジャーナルボリューム情報(図5においては、ジャーナルボリューム122のLDN)、ブロックアドレス、レングスを含む。ここで、データ格納部111とジャーナルボリューム122が第一の実施形態における更新処理蓄積部15の一構成例である。また、更新処理情報格納部113と、更新順番管理テーブル112aと、更新順番付与部114は、第一の実施形態における対応情報保持部13の一構成例である。またマスターボリューム120、121は、第一の実施形態における第一のストレージ装置12の一構成例である。また、第一のデータ転送部116は、第一の実施形態における転送部14の一構成例である。
ここで、更新処理に更新順番を付与する代わりに、更新処理に含まれる、タイプスタンプを活用して更新順序を判断してもよい。タイプスタンプの情報を更新処理と別で保持しても良く、更新処理の記載を読み出して活用しても良い。この場合、フロントサイト100は、例えば更新順番付与部114が更新処理を付与する代わりに、更新情報格納部113がタイムスタンプを読み出し、更新順番の代わりに更新順番管理テーブル112aに書き込むことができる。また、ジャーナルボリューム122は1つ、マスターボリューム120、121は2つとして記載しているが、おのおの1つだけであってもよく、複数あってもよい。後述する、他のサイトの各ボリュームについても同様である。マスターボリューム120、121は後述する近地サイト200の第一の複製ボリューム220、221とデータ同期が行われる、すなわちペアの関係である。
次に、レプリケーションシステム500を構成する近地サイト200の構成を、図6を参照して説明する。近地サイト200は、フロントサイト100からレプリケーションデータを受信する第二のデータ受信部210と、受信したレプリケーションデータ内に付与された更新順番、更新処理の更新処理情報を更新順番管理テーブル211aに書き込む第二の更新処理情報格納部213と、テーブル格納ボリューム211と、更新順番、更新処理の更新処理情報を格納する更新順番管理テーブル211aと、受信したレプリケーションデータを後述する第一の複製ボリューム220、221に反映させる第二のデータ更新部212と、レプリケーションデータを遠地サイト300に転送する第二のデータ転送部214と、データを記憶する第一の複製ボリューム220、221とを備える。ここで、第二のデータ受信部210と第二のデータ転送部214は、第一の実施形態における送受信部22の一構成例である。また、第二のデータ更新部212は第一の実施形態におけるデータ反映部21の一構成例である。さらに、第一の複製ボリューム220、221は、第一の実施形態における第二のストレージ装置23の一構成例である。第一の複製ボリューム220、221は、後述する遠地サイト300の第二の複製ボリューム320、321とデータ同期が行われる、すなわちペアの関係である。
近地サイト200と遠地サイト300との間のデータ同期は、準同期または非同期レプリケーションのどちらで行うことも可能であるが、準同期レプリケーションを行う場合には、準同期送信用バッファ230が近地サイト200に必要である。この場合、準同期送信用バッファ230には、フロントサイト100から受信したレプリケーションデータ(更新処理、更新順番、更新処理情報を含む)が格納される。非同期レプリケーションを行う場合には、フロントサイト100と同様、ジャーナルボリュームが近地サイト200に必要である。さらに、非同期レプリケーションを行う場合には、更新順番管理テーブル211aは、フロントサイト100と同様、更新処理の更新処理情報(第一の複製ボリューム220、221のLDN、ブロックアドレス、レングス)、フロントサイト100で更新処理に付与された更新順番、近地サイト200におけるジャーナルボリューム内での格納情報、を持つ。
次に、レプリケーションシステム500を構成する遠地サイト300の構成を、図7を参照して説明する。遠地サイト300は、近地サイト200からレプリケーションデータを受信する第三のデータ受信部310と、受信したデータを準同期受信用バッファ330に格納するバッファ格納部311と、データを格納する準同期受信用バッファ330を備える。さらに、遠地サイト300は、準同期受信用バッファ330に格納されたデータから更新順に更新処理を取り出し、第二の複製ボリューム320、321に反映させるデータ取り出し部313と、データを記憶する第二の複製ボリューム320、321と、最後に取り出されたデータの更新順番で、更新順番管理テーブル312aの更新順番を更新する第三の更新処理情報格納部314を備える。さらに、遠地サイト300は、テーブル格納ボリューム312と、テーブル格納ボリューム312に格納され、更新順番を記憶する更新順番管理テーブル312aと、更新順番管理テーブル312aをフロントサイト100に転送する第三のデータ転送部315と、を備える。ここで、第三のデータ受信部310は、第一の実施形態における受信部31の一構成例である。以下同様に、データ取り出し部313は更新処理反映部32の、第二の複製ボリューム320、321は第三のストレージ装置35の、第三の更新処理情報格納部314は順序情報保持部33の、第三のデータ転送部315は順序情報通知部34の一構成例である。
[動作の説明]次に、フロントサイト100におけるデータ更新処理を、図8を参照して説明する。フロントサイト100は、ホスト50からデータを第一のデータ受信部110で受信する(ステップS1)と、レプリケーション対象データである更新処理をデータ格納部111がジャーナルボリューム122に格納する(ステップS2)。ジャーナルボリューム122への格納に成功した場合(ステップS3:Yes)、更新順番管理テーブル112aに更新処理情報、ジャーナルリンク情報を追加する(ステップS4)。ジャーナルボリューム122への格納に失敗した場合(ステップS3:No)、同期コピーを停止する。フロントサイト100から近地サイト200にホスト50からのデータ更新と同期してデータコピーを行うとき、更新処理のコピーIOに更新順番を付与し、付与した更新順番を更新順番管理テーブル112aに書き込む(ステップS5)。図5を参照すると、例えば、ホスト50からの更新処理がLDN=0000/Address=00001000/Length=0040の場合、コピーIOには更新順番=00003を付与する。レプリケーションデータの転送後、マスターボリューム120、121に更新処理を反映させる(ステップS6)。
次に、近地サイト200におけるデータ更新処理を、図9を参照して説明する。ここでは、近地サイト200は、遠地サイト300と準同期レプリケーションでデータ同期を行うとする。近地サイト200は、フロントサイト100からのレプリケーションデータ受信時(ステップS11)、準同期送信用バッファ230に受信したデータを格納する(ステップS12)。準同期送信用バッファ230への格納に成功した場合(ステップS13:Yes)、更新順番管理テーブル211aに更新処理情報を追加する(ステップS14)。準同期送信用バッファ230への格納に失敗した場合(ステップS13:No)、同期コピーを停止する。更新処理情報には、データ格納先の第一の複製先ボリューム順序情報(図6においては第一の複製ボリューム220、221のLDN)、ブロックアドレス、レングスが含まれる。次に、近地サイト200から遠地サイト300に準同期レプリケーションでデータコピーを行うとき(ステップS15)、更新処理のコピーIOに更新順番を付与する。例えば、遠地サイト300に送信するレプリケーションデータが特許文献2のパッキングデータである場合、パッキングデータが、LDN=0200/Address=00001000/Length=0008、LDN=0201/Address=00002080/Length=0020、LDN=0200/Address=00001000/Length=0040、である場合、それぞれの行(更新処理情報)に対して更新順番00001、00002、00003が付与される。また、パッキングデータには複製先である第二の複製ボリューム320、321のLDNを格納する。レプリケーションデータの転送後、第一の複製ボリューム220、221に更新処理を反映させる(ステップS16)。
次に、遠地サイト300におけるデータ更新処理を、図10を参照して説明する。遠地サイト300は、近地サイト200からのレプリケーションデータを第三のデータ受信部310で受信した時(ステップS21)、特許文献2に記載の準同期レプリケーションにて、受信したデータをバッファ格納部311が準同期受信用バッファ330に格納する(ステップS22)。準同期受信用バッファ330への格納に成功した場合(S23:Yes)、準同期受信用バッファ330に格納されたデータは、データ取り出し部313に更新順にデータを取り出され(ステップS24)、第二の複製ボリューム320、321に反映される(ステップS25)。準同期受信用バッファ330への格納に失敗した場合(S23:No)、同期コピーを停止する。次に、データ取り出し部313が最後に取り出したデータの更新順番で、第三の更新処理情報格納部314が更新順番管理テーブル312aの更新順番を更新する(ステップS26)。準同期受信用バッファ330から全てのデータが取り出されるまで、S25からS26の処理を繰り返す(ステップS27)。
次に、近地サイト200に障害が発生した場合の処理を、近地サイト200が被災したことにより障害が発生した場合を例に図11を参照して説明する。近地サイト200が被災したことにより障害が発生すると、ネットワーク440を介して接続したフロントサイト100のマスターボリューム120、121と遠地サイト300の第二の複製ボリューム320、321とのペア構成に組み替えを行う。具体的には、フロントサイト100のマスターボリューム120、121と近地サイト200の第一の複製ボリューム220、221との間で構築されているペアを切り離す(ステップS31)。次に、近地サイト200の第一の複製ボリューム220、221と遠地サイト300の第二の複製ボリューム320、321との間で構築されているペアを切り離す(ステップS32)。次に、フロントサイト100のマスターボリューム120、121と遠地サイト300の第二の複製ボリューム320、321との間でペアを構築する(ステップS33)。
次に、遠地サイト300から更新順番管理テーブル312aが第三のデータ転送部315によってフロントサイト100に送信される(ステップS34)。フロントサイト100は、受信した更新順番管理テーブル312aに記載の更新順番で、自サイト100の更新順番管理テーブル112aを検索し、更新順番の位置を特定する(ステップS35)。フロントサイト100は、特定した位置より後の更新順番に対応するジャーナルボリューム122に格納された更新処理を遠地サイト300に更新順番どおりに送信する(ステップS36)。
例えば、遠地サイト300から受信した更新順番管理テーブル312a内の更新順番が00003であれば、フロントサイト100の更新順番管理テーブル112aの更新順番00004、00005に該当するデータが遠地サイト300に送信される。
ここで、近地サイト200と遠地サイト300との間の準同期または非同期レプリケーション時に、送信されるレプリケーションデータが更新順番どおりに第三のデータ受信部310で受信されない場合、例えば後から発生した更新処理の送信によって追い越しが発生する場合、以下の構成をとることもできる。すなわち、準同期受信用バッファ330に格納済みで、第二の複製ボリューム320,321に反映されていない更新処理の更新順番も更新順番管理テーブル312aで保持する。この未反映の更新処理は、先に更新されるべき更新処理の受信、格納を待っている状態である。近地サイト200の障害時に、第三のデータ転送部315によって更新順番管理テーブル312aがフロントサイト100に送信され、フロントサイト100は、遠地サイト300で更新済みの更新順番の位置を特定し、さらに遠地サイト300が既に保持しており、かつ未更新の更新処理を特定する。そして、フロントサイト100は、特定した位置より後の更新順番に対応するジャーナルボリューム122に格納された更新処理のうち、遠地サイト300が既に保持しており、かつ未更新の更新処理以外の更新処理を遠地サイト300に更新順番どおりに送信する。
以上のように、本発明におけるレプリケーションシステム500によると、近地サイト200が被災し障害が発生すると、新たにペア構成となったフロントサイト100と遠地サイト300とにおいて、遠地サイト300からフロントサイト100に更新順番管理テーブル312aが送信され、フロントサイト100は、受信した更新順番管理テーブル312aに記載の更新順番で、自サイト100の更新順番管理テーブル112aを検索し、特定した位置より後の更新順番に対応するジャーナルボリューム122に格納された更新処理を遠地サイト300に更新順番どおりに送信する。
[効果の説明]このように、遠地サイト300が近地サイト200と同期済みのものより後の更新処理について、フロントサイト100と遠地サイト300とで、データ同期することにより、全データをフロントサイト100から遠地サイト300へ送信することなく、フロントサイト100と遠地サイト300とを同期することができる。また、フロントサイト100と遠地サイト300とは準同期または非同期レプリケーションによって同期するため、近地サイト200の障害時においても、ホスト50の更新IO性能の低下を低減できる。
[他の実施形態]上述した構成に加え、遠地サイト300の更新順番管理テーブル312aに書き込まれた更新順番は、近地サイト200が被災した時以外にも、定期的にフロントサイト100に送信されてもよい。フロントサイト100は、定期的に更新順番を受信する場合、遠地サイト300へのバックアップが完了したデータとして、更新順番管理テーブル112aで特定した、受信した更新順番以前の更新処理をジャーナルボリューム122から削除する。これにより近地サイト100のジャーナルボリューム122内のデータ記憶領域の消費を低減することができる。また、削除した更新処理に対応する、更新順番管理テーブル112a内の情報を削除し、さらに記憶領域の消費を低減してもよい。
また、上述した各実施形態は、適宜組み合わせて実施されることが可能である。
各ブロック図に示したブロック分けは、説明の便宜上から表された構成である。各実施形態を例に説明された本発明は、その実装に際して、各ブロック図に示した構成には限定されない。
以上、本発明を実施するための形態について説明したが、上記実施の形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明はその趣旨を逸脱することなく変更、改良され得ると共に、本発明にはその等価物も含まれる。
1 レプリケーションシステム
10 第一のストレージシステム
12 第一のストレージ装置
13 対応情報保持部
14 転送部
15 更新処理蓄積部
20 第二のストレージシステム
21 データ反映部
22 送受信部
23 第二のストレージ装置
30 第三のストレージシステム
31 受信部
32 更新処理反映部
33 順序情報保持部
34 順序情報通知部
35 第三のストレージ装置
41 CPU
42 メモリ
43 HDD
44 I/F
50 ホスト
100 フロントサイト
110 第一のデータ受信部
111 データ格納部
112 テーブル格納ボリューム
112a 更新順番管理テーブル
113 更新処理情報格納部
114 更新順番付与部
115 第一のデータ更新部
116 第一のデータ転送部
120、121 マスターボリューム
122 ジャーナルボリューム
200 近地サイト
210 第二のデータ受信部
211 テーブル格納ボリューム
211a 更新順番管理テーブル
212 第二のデータ更新部
213 第二の更新処理情報格納部
214 第二のデータ転送部
220、221 第一の複製ボリューム
230 準同期送信用バッファ
300 遠地サイト
310 第三のデータ受信部
311 バッファ格納部
312 テーブル格納ボリューム
312a 更新順番管理テーブル
313 データ取り出し部
314 第三の更新処理情報格納部
315 第三のデータ転送部
320、321 第二の複製ボリューム
410、420、430、440 ネットワーク
500 レプリケーションシステム

Claims (9)

  1. 第一のストレージシステム内の第一のストレージ装置のデータ更新を、第二のストレージシステム内の第二のストレージ装置に同期レプリケーションによって反映させ、前記第二のストレージ装置のデータ更新を、第三のストレージシステム内の第三のストレージ装置に準同期または非同期レプリケーションよって反映させるレプリケーションシステムにおいて、
    前記第一のストレージシステムは、前記第二のストレージシステム及び前記第三のストレージシステムと通信可能に接続され、前記第一のストレージ装置に対して行われたデータ更新に対応する更新処理を特定する特定情報と複数の前記更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部と、前記更新処理と該更新処理の順序情報とを前記第二のストレージシステムに転送する転送部と、前記更新処理を蓄積する更新処理蓄積部と、をさらに備え、
    前記第三のストレージシステムは、前記第二のストレージシステムと通信可能に接続され、前記第二のストレージシステムを介し前記更新処理と該更新処理の前記順序情報とを受信する受信部と、前記更新処理を前記第三のストレージ装置に反映させる更新処理反映部と、前記更新処理反映部が前記第三のストレージ装置に最後に反映させた前記更新処理の前記順序情報を保持する順序情報保持部と、前記順序情報保持部が保持する前記順序情報を前記第一のストレージシステムに通知する順序情報通知部と、をさらに備え、
    前記第二のストレージシステムに障害が発生したとき、前記順序情報通知部が前記順序情報を前記第一のストレージシステムに通知し、前記対応情報保持部において前記順序情報に対応する前記更新処理より後に行われた前記更新処理が特定され、前記転送部が、前記更新処理蓄積部に蓄積された前記更新処理のうち、特定された前記更新処理を前記第三のストレージシステムに転送し、
    前記第一のストレージシステムは、前記第三のストレージシステムから前記順序情報を受信すると、蓄積している前記更新処理のうち、前記順序情報と対応する前記更新処理より前の更新処理と、該更新処理に対応する前記順序情報とを削除する、レプリケーションシステム。
  2. 前記対応情報保持部は、前記特定情報を、前記更新処理の更新順番で並べて保持すること
    で、前記更新順序を示す順序情報とする、請求項1に記載のレプリケーションシステム。
  3. 前記第三のストレージシステムが、前記受信部が受信した前記更新処理を保持するバッファを更に備え、前記順序情報保持部は、前記更新処理反映部が前記第三のストレージ装置に最後に反映させた前記更新処理の前記順序情報に加え、前記受信部が受信し、かつ前記前記第三のストレージ装置に反映していない前記更新処理の前記順序情報も保持する、請求項1または2に記載のレプリケーションシステム。
  4. 前記第一のストレージシステムは、データ更新を行うための更新処理を通信可能に接続したホストから受信する更新処理受信部を更に備えている、請求項1からのいずれか一項に記載のレプリケーションシステム。
  5. 前記第一のストレージシステムが設置されている第一の拠点と、前記第三のストレージシステムが設置されている第三の拠点とは、地理的に離れている、請求項1からのいずれか一項に記載のレプリケーションシステム。
  6. 前記第二のストレージシステムが設置されている第二の拠点は、前記第一のストレージシステムが設置されている第一の拠点と、前記第三のストレージシステムが設置されている第三の拠点との間に位置している、請求項1からのいずれか一項に記載のレプリケーションシステム。
  7. 第一のストレージシステム内の第一のストレージ装置のデータ更新を、第二のストレージシステム内の第二のストレージ装置に同期レプリケーションによって反映させ、前記第二のストレージ装置のデータ更新を、第三のストレージシステム内の第三のストレージ装置に準同期または非同期レプリケーションよって反映させるレプリケーションシステムにおいて、
    前記第一のストレージシステムは、前記第二のストレージシステム及び前記第三のストレージシステムと通信可能に接続され、前記第一のストレージ装置に対して行われたデータ更新に対応する更新処理を特定する特定情報と複数の前記更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部と、前記更新処理と該更新処理の順序情報とを前記第二のストレージシステムに転送する転送部と、前記更新処理を蓄積する更新処理蓄積部と、をさらに備え、
    前記第三のストレージシステムは、前記第二のストレージシステムと通信可能に接続され、前記第二のストレージシステムを介し前記更新処理と該更新処理の前記順序情報とを受信する受信部と、前記更新処理を前記第三のストレージ装置に反映させる更新処理反映部と、前記更新処理反映部が前記第三のストレージ装置に最後に反映させた前記更新処理の前記順序情報を保持する順序情報保持部と、前記順序情報保持部が保持する前記順序情報を前記第一のストレージシステムに通知する順序情報通知部と、をさらに備え、
    前記第二のストレージシステムに障害が発生したとき、前記順序情報通知部が前記順序情報を前記第一のストレージシステムに通知し、前記対応情報保持部において前記順序情報に対応する前記更新処理より後に行われた前記更新処理が特定され、前記転送部が、前記更新処理蓄積部に蓄積された前記更新処理のうち、特定された前記更新処理を前記第三のストレージシステムに転送し、
    前記第一のストレージシステムは、前記第三のストレージシステムから前記順序情報を受信すると、蓄積している前記更新処理のうち、前記順序情報と対応する前記更新処理より前の更新処理と、該更新処理に対応する前記順序情報とを削除する、レプリケーション方法。
  8. 第一のストレージシステムのデータ更新を第二のストレージシステムに同期レプリケーションし、前記第二のストレージシステムのデータ更新を第三のストレージシステムに準同期または非同期レプリケーションするレプリケーションシステムにおいて、
    前記第一のストレージシステムのデータに対して行われた更新処理の更新順序を示す順序情報を生成し、前記更新処理と前記順序情報とを対応付けて前記第一のストレージシステムにて蓄積し、前記第三のストレージシステムにて、最後に同期した前記更新処理に対応する前記順序情報を保持し、
    前記第二のストレージシステムに障害が発生したとき、前記第三のストレージシステムが最後に同期した前記更新処理に対応する前記順序情報を前記第一のストレージシステムに通知し、前記第一のストレージシステムは、受信した前記順序情報に対応する前更新処理より後の前記更新処理を前記第三のストレージシステムに送信し、
    前記第一のストレージシステムは、前記第三のストレージシステムから前記順序情報を受信すると、蓄積している前記更新処理のうち、前記順序情報と対応する前記更新処理より前の更新処理と、該更新処理に対応する前記順序情報とを削除する、レプリケーション方法。
  9. 第二のストレージ及び第三のストレージと通信可能に接続され、データ更新が行われると当該データ更新を第二のストレージに同期レプリケーションによって反映させ、前記第二のストレージにおけるデータ更新は第三のストレージに準同期または非同期レプリケーションよって反映されるストレージであって、
    データ更新に対応する更新処理を蓄積する更新処理蓄積部と、前記更新処理を特定する特定情報と複数の前記更新処理の間での更新順序を示す順序情報とを対応付けて保持する対応情報保持部と、前記更新処理と該更新処理の順序情報とを前記第二のストレージに転送する転送部と、を備え、
    前記第二のストレージに障害が発生したとき、前記第三のストレージから前記順序情報を受信して、前記対応情報保持部において前記順序情報に対応する更新処理より後に行われた更新処理を特定し、前記転送部が特定された更新処理を前記第三のストレージに転送し、
    前記第三のストレージから前記順序情報を受信すると、蓄積している前記更新処理のうち、前記順序情報と対応する前記更新処理より前の更新処理と、該更新処理に対応する前記順序情報とを削除する、ストレージ。
JP2017060277A 2017-03-27 2017-03-27 ストレージ装置、レプリケーションシステム及びレプリケーション方法 Active JP6927725B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017060277A JP6927725B2 (ja) 2017-03-27 2017-03-27 ストレージ装置、レプリケーションシステム及びレプリケーション方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017060277A JP6927725B2 (ja) 2017-03-27 2017-03-27 ストレージ装置、レプリケーションシステム及びレプリケーション方法

Publications (2)

Publication Number Publication Date
JP2018163520A JP2018163520A (ja) 2018-10-18
JP6927725B2 true JP6927725B2 (ja) 2021-09-01

Family

ID=63859301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017060277A Active JP6927725B2 (ja) 2017-03-27 2017-03-27 ストレージ装置、レプリケーションシステム及びレプリケーション方法

Country Status (1)

Country Link
JP (1) JP6927725B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7475621B2 (ja) 2018-08-31 2024-04-30 株式会社タニタ 長さ測定装置、長さ測定方法、プログラム、及び身長計

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285336A (ja) * 2005-03-31 2006-10-19 Nec Corp 記憶装置及びストレージシステム並びにその制御方法
JP5218121B2 (ja) * 2009-02-06 2013-06-26 日本電気株式会社 情報システム及びディザスタリカバリ方法
WO2011125127A1 (ja) * 2010-04-07 2011-10-13 株式会社日立製作所 非同期リモートコピーシステム、及び、記憶制御方法

Also Published As

Publication number Publication date
JP2018163520A (ja) 2018-10-18

Similar Documents

Publication Publication Date Title
JP4477950B2 (ja) リモートコピーシステム及び記憶装置システム
US8055865B2 (en) Managing write requests to data sets in a primary volume subject to being copied to a secondary volume
JP6344798B2 (ja) データ送信方法、データ受信方法、及びストレージデバイス
US7308545B1 (en) Method and system of providing replication
US7406487B1 (en) Method and system for performing periodic replication using a log
JP5165206B2 (ja) バックアップシステムおよびバックアップ方法
JP4644684B2 (ja) 仮想化を用いるリモート・コピーの一貫性の維持(ストレージをコピーする方法およびシステム)
JP4935901B2 (ja) ストレージシステム、ストレージ装置、リモートコピー方法
US8495014B2 (en) Asynchronous remote copy system and storage control method
JP4170056B2 (ja) 複製ボリューム間でのバックアップ・リストア管理方法およびこの方法に用いる記憶制御装置
US8825968B2 (en) Information processing apparatus and storage control method
JP6136629B2 (ja) ストレージ制御装置,ストレージシステム,および制御プログラム
KR101200453B1 (ko) 통신 네트워크를 통한 데이터 세트 업데이트 시스템, 방법및 장치
KR20040110977A (ko) 싸이트간 데이타 미러링을 위한 방법, 시스템, 및 기록 매체
JP2005309793A (ja) データ処理システム
JP4412722B2 (ja) リモートコピーシステム
US20060265431A1 (en) Information processing system, replication method, difference information holding apparatus and program
JP2006099440A (ja) リモートコピーシステム
JP6927725B2 (ja) ストレージ装置、レプリケーションシステム及びレプリケーション方法
US8583884B2 (en) Computing system and backup method
JP4677443B2 (ja) データ・ストレージ・システムおよび複数の異機種ストレージ・コントローラに渡って書き込みセットおよび書き込みセットの境界を保持するための方法
JP4790283B2 (ja) ストレージサブシステム及びストレージシステム
JP2015095015A (ja) データ配置方法、データ配置プログラムおよび情報処理システム
JP2004272884A5 (ja)
JP2004272884A (ja) 複数リモートストレージでのリモートコピー停止後のデータ同期化方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210326

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210805

R150 Certificate of patent or registration of utility model

Ref document number: 6927725

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150