JP6744545B2 - 情報処理装置、情報処理プログラムおよび情報処理システム - Google Patents

情報処理装置、情報処理プログラムおよび情報処理システム Download PDF

Info

Publication number
JP6744545B2
JP6744545B2 JP2016139099A JP2016139099A JP6744545B2 JP 6744545 B2 JP6744545 B2 JP 6744545B2 JP 2016139099 A JP2016139099 A JP 2016139099A JP 2016139099 A JP2016139099 A JP 2016139099A JP 6744545 B2 JP6744545 B2 JP 6744545B2
Authority
JP
Japan
Prior art keywords
data
save
storage device
disaster
saved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016139099A
Other languages
English (en)
Other versions
JP2018010495A (ja
Inventor
雄司 森多
雄司 森多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016139099A priority Critical patent/JP6744545B2/ja
Priority to US15/631,671 priority patent/US20180018237A1/en
Publication of JP2018010495A publication Critical patent/JP2018010495A/ja
Application granted granted Critical
Publication of JP6744545B2 publication Critical patent/JP6744545B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報処理装置、情報処理プログラムおよび情報処理システムに関する。
データのバックアップ方法として、非同期方式のリモートコピーが知られている。情報処理装置は、非同期方式のリモートコピーを実行する場合、上位装置から受信したデータを保持し、リモートコピーの完了を待たずにリモートコピーが完了した旨を上位装置に通知する。情報処理装置は、リモートコピー完了の通知に遅れてリモートコピー先にデータを転送してリモートコピーを完了する。
このような非同期方式のリモートコピーは、リモートコピー先へのデータ転送完了前に情報処理装置が災害等で被災した場合、リモートコピー先に転送前のデータを失うリスクを有する。
そこで、災害等で被災してもリモートコピー先に転送前のデータの喪失を防止する技術が提案されている。例えば、リモートコピー元のミラーリング・アプリケーションは、非同期方式による1次記憶デバイスから2次記憶デバイスへのリモートコピーが完了したことの応答を待つ間、耐災害性を有する記憶ユニットにコピー対象のデータを記憶する。
特表2008−538624号公報
しかしながら、耐災害性を有する記憶ユニットは一般に高価であり、退避対象となるデータのすべてを記憶可能な記憶ユニットを用意することは、システムにかかるコストを上昇させる。また、WAN(Wide Area Network)回線等の高速回線は、退避対象となるデータを縮減することができるが、これもまたシステムにかかるコストを上昇させる。
1つの側面では、本発明は、低コストにしてデータロストの危険を低減可能な情報処理装置、情報処理プログラムおよび情報処理システムを提供することを目的とする。
1つの態様では、遠隔地にある第1のストレージ装置にデータをコピー可能、かつ耐災害性を有する第2のストレージ装置にデータをコピー可能な情報処理装置が提供される。情報処理装置は、記憶部と制御部とを含む。記憶部は、第1のストレージ装置へのデータ伝送速度および第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報と被災時に退避対象になる退避対象データとを記憶する。制御部は、被災予測に関する被災予測情報を取得し、被災予測情報から特定する被災予測時間とデータ伝送速度情報とに基づいて、第1のストレージ装置へのコピーおよび第2のストレージ装置へのコピーにより退避対象データを退避する退避計画を作成し、退避計画に基づいて第1のストレージ装置および第2のストレージ装置に退避対象データを退避する。また、制御部は、第1のストレージ装置へのデータ伝送速度で被災予測時間までに第1のストレージ装置に対して退避可能な第1のデータを第1のストレージ装置へ退避させ、第2のストレージ装置へのデータ伝送速度で被災予測時間までに第2のストレージ装置に対して退避可能であり、第1のストレージ装置に対しては退避できない第2のデータを第2のストレージ装置へ退避させる退避計画を作成する。
また、1つの態様では、情報処理プログラムが提供される。情報処理プログラムは、遠隔地にある第1のストレージ装置にデータをコピー可能、かつ耐災害性を有する第2のストレージ装置にデータをコピー可能なコンピュータに、被災予測に関する被災予測情報を取得し、被災予測情報から特定する被災予測時間と、第1のストレージ装置へのデータ伝送速度および第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報とに基づいて、第1のストレージ装置へのコピーおよび第2のストレージ装置へのコピーにより被災時に退避対象になる退避対象データを退避する退避計画を作成し、退避計画に基づいて第1のストレージ装置および第2のストレージ装置に退避対象データを退避第1のストレージ装置へのデータ伝送速度で被災予測時間までに第1のストレージ装置に対して退避可能な第1のデータを第1のストレージ装置へ退避させ、第2のストレージ装置へのデータ伝送速度で被災予測時間までに第2のストレージ装置に対して退避可能であり、第1のストレージ装置に対しては退避できない第2のデータを第2のストレージ装置へ退避させる退避計画を作成する、処理を実行させる。
また、1つの態様では、情報処理システムが提供される。情報処理システムは、第1のストレージ装置と第2のストレージ装置と情報処理装置とを含む。第1のストレージ装置は、遠隔地にある。第2のストレージ装置は、耐災害性を有する。情報処理装置は、記憶部と制御部とを備える。記憶部は、第1のストレージ装置へのデータ伝送速度および第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報と被災時に退避対象になる退避対象データとを記憶する。制御部は、被災予測に関する被災予測情報を取得し、被災予測情報から特定する被災予測時間とデータ伝送速度情報とに基づいて、第1のストレージ装置へのコピーおよび第2のストレージ装置へのコピーにより退避対象データを退避する退避計画を作成し、退避計画に基づいて第1のストレージ装置および第2のストレージ装置に退避対象データを退避する。また、制御部は、第1のストレージ装置へのデータ伝送速度で被災予測時間までに第1のストレージ装置に対して退避可能な第1のデータを第1のストレージ装置へ退避させ、第2のストレージ装置へのデータ伝送速度で被災予測時間までに第2のストレージ装置に対して退避可能であり、第1のストレージ装置に対しては退避できない第2のデータを第2のストレージ装置へ退避させる退避計画を作成する。
1つの側面では、低コストにしてデータロストの危険を低減できる。
第1の実施の形態の情報処理システムの一例を示す図である。 第2の実施の形態の情報処理システムの一例を示す図である。 第2の実施の形態のCMのハードウェアの一例を示す図である。 第2の実施の形態のリモートコピー元のCMの機能の一例を示す図である。 第2の実施の形態のリモートコピー先のCMの機能の一例を示す図である。 第2の実施の形態の災害情報一覧の一例を示す図である。 第2の実施の形態の退避プランの一例を示す図である。 第2の実施の形態の退避データリストの一例を示す図である。 第2の実施の形態のデータ退避処理のフローチャートの一例を示す図(その1)である。 第2の実施の形態のデータ退避処理のフローチャートの一例を示す図(その2)である。 第2の実施の形態の退避プラン作成処理のフローチャートの一例を示す図(その1)である。 第2の実施の形態の退避プラン作成処理のフローチャートの一例を示す図(その2)である。 第2の実施の形態のソート処理のフローチャートの一例を示す図である。 第2の実施の形態のマージ処理のフローチャートの一例を示す図である。 第2の実施の形態の格納処理のフローチャートの一例を示す図である。 第2の実施の形態の復旧処理のフローチャートの一例を示す図(その1)である。 第2の実施の形態の復旧処理のフローチャートの一例を示す図(その2)である。
以下、実施の形態について図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態の情報処理システムの一例を示す図である。情報処理システム1は、情報処理装置2、ストレージ装置3およびストレージ装置4を含む。情報処理装置2とストレージ装置3は、ネットワークを介して接続する。情報処理装置2は、遠隔地にあるストレージ装置3にデータコピーを実行可能である。例えば、情報処理装置2は、ストレージ装置3に非同期方式でデータコピー(非同期コピー、例えばリモートコピー)を実行可能である。また、情報処理装置2は、耐災害性を有するストレージ装置4にデータコピーを実行可能である。例えば、情報処理装置2は、ストレージ装置4に同期方式でデータコピー(同期コピー)を実行可能である。
情報処理装置2は、記憶部5と制御部6とを含む。記憶部5は、データ伝送速度情報5aと退避対象データ5bとを記憶する。記憶部5は、例えば、RAM(Random Access Memory)などである。データ伝送速度情報5aは、ストレージ装置3へのデータ伝送速度およびストレージ装置4へのデータ伝送速度に関する情報である。退避対象データ5bは、被災時に退避対象になるデータである。例えば、退避対象データ5bは、ストレージ装置3に非同期方式でリモートコピーを実行する際、コピー対象になるデータである。
制御部6は、被災予測に関する被災予測情報7を取得する。制御部6は、例えば、プロセッサが所要の処理を実行することにより実現し得る。例えば、制御部6は、外部装置(図示を省略)から被災予測情報7を取得するものであってもよいし、ユーザによって入力された被災予測情報7を取得するものであってもよい。被災予測情報7は、情報処理装置2の被災予測に関する情報であり、被災予測時間を特定可能な情報を含む。被災予測時間は、情報処理装置2が被災すると予測される時間を示す。
制御部6は、被災予測情報7から被災予測時間を特定する。制御部6は、被災予測時間とデータ伝送速度情報5aとに基づいて退避計画8を作成する。退避計画8は、ストレージ装置3へのコピーおよびストレージ装置4へのコピーにより退避対象データ5bを退避する計画を示す。
例えば、制御部6は、退避対象データ5bのうち第1のデータをストレージ装置3に退避することを計画する。第1のデータは、退避対象データ5bのうち、データ伝送速度情報5aが示すストレージ装置3へのデータ伝送速度で被災予測時間までにストレージ装置3に退避可能なデータである。また、制御部6は、退避対象データ5bのうち第2のデータをストレージ装置4に退避すると計画する。第2のデータは、退避対象データ5bのうち、データ伝送速度情報5aが示すストレージ装置4へのデータ伝送速度で被災予測時間までにストレージ装置4に退避可能なデータである。なお、一観点によれば、第2のデータは、退避対象データ5bのうち、データ伝送速度情報5aが示すストレージ装置3へのデータ伝送速度で被災予測時間までにストレージ装置3に退避できないデータである。このようにして、制御部6は、第1のデータをストレージ装置3に退避し、第2のデータをストレージ装置4に退避する退避計画8を作成する。
制御部6は、退避計画8に基づいてストレージ装置3およびストレージ装置4に退避対象データ5bを退避する。例えば、制御部6は、退避計画8に基づいて第1のデータをストレージ装置3に退避し、第2のデータをストレージ装置4に退避する。
第1の実施の形態によれば、制御部6は、第1のデータをストレージ装置3に退避し、第2のデータをストレージ装置4に退避する。これにより、情報処理装置2は、退避対象データ5bがロストする危険を低減できる。
また、第1の実施の形態によれば、制御部6は、ストレージ装置3とストレージ装置4に分散して退避対象データ5bを退避する。これにより、情報処理装置2は、必ずしもすべての退避対象データ5bをストレージ装置3に退避することを要しない。したがって、情報処理システム1は、情報処理装置2とストレージ装置3とを接続する通信回線の帯域確保にかかるコストを低減できる。
また、情報処理装置2は、退避対象データ5bの退避をストレージ装置3とストレージ装置4とに分担させることからストレージ装置4に必要とされる記憶容量を低減できる。したがって、情報処理システム1は、退避対象データ5bのすべてを記憶可能な耐災害性の記憶ユニットを用意しなくてよいので、耐災害性の記憶ユニットにかかるコストを低減できる。
よって、情報処理システム1および情報処理装置2は、低コストにしてデータロストの危険を低減できる。
[第2の実施の形態]
図2は、第2の実施の形態の情報処理システムの一例を示す図である。情報処理システムは、ストレージシステム100,200および対災害デバイス300を含む。ストレージシステム100は、ホスト装置400が扱うデータを記憶する。ストレージシステム100は、CM(Controller Module)100aおよびDE(Device Enclosure)100bを有する。CM100aは、ホスト装置400からDE100bへのアクセスを制御する。なお、ストレージシステム100は、2以上のCMを有してもよい。DE100bは、複数の記憶デバイスを搭載可能なディスクアレイ装置である。なお、DE100bは、記憶デバイスとして、HDD(Hard Disk Drive)やSSD(Solid State Drive)などを搭載できる。また、ストレージシステム100は、必ずしもデータセンタに設置されることを要しない。例えば、ストレージシステム100は、ブランチオフィスや町工場などの低コストに構築された環境に設置される。
対災害デバイス300は、耐災害性を有するストレージデバイスである。ストレージデバイスにおける耐災害性は、格納しているデータを災害から守ることを示す。対災害デバイス300は、災害から逃れられる筐体の中に複数の記憶デバイスが含まれているデバイスである。なお、対災害デバイス300は、ストレージシステム100と一体にして備えられるものであってもよいし、別体にして備えられるものであってもよい。
ストレージシステム200は、ストレージシステム100に格納されているデータのバックアップ装置としての機能を提供する。ストレージシステム200は、ストレージシステム100と同時に被災するおそれのない遠隔地に設置される。例えば、ストレージシステム200は、ストレージシステム100から100km以上離れた遠隔地に設置される。
ストレージシステム200は、CM200aおよびDE200bを有する。CM200aは、ストレージシステム200全体を制御する。なお、ストレージシステム200は、2以上のCMを有してもよい。DE200bは、複数の記憶デバイスを搭載可能なディスクアレイ装置である。なお、DE200bは、HDDやSSDなどを搭載できる。
管理端末500,700は、管理者が使用する端末である。災害情報発信装置600は、災害情報を発信する。例えば、災害情報発信装置600は、気象庁が有する災害情報発信装置である。なお、災害情報は、第1の実施の形態の被災予測情報7の一形態である。管理端末500は、災害情報発信装置600から災害情報を受信する。
ストレージシステム100とストレージシステム200は、ネットワークを介して接続する。ストレージシステム100とホスト装置400と管理端末500は、ネットワークを介して接続する。例えば、ストレージシステム100とホスト装置400と管理端末500は、ファイバチャネル(FC:Fibre Channel)などの伝送方式で接続する。
管理端末500と災害情報発信装置600は、ネットワークを介して接続する。例えば、管理端末500と災害情報発信装置600は、インターネットなどの広域ネットワークで接続する。また、ストレージシステム200と管理端末700は、ネットワークを介して接続する。例えば、ストレージシステム200と管理端末700は、FCなどの伝送方式で接続する。
ストレージシステム100は、ストレージシステム200をリモートコピー先にして、ホスト装置400から受信したデータのリモートコピーを非同期方式で実行する。
なお、ストレージシステム100またはCM100aは、第1の実施の形態の情報処理装置2の一形態である。ストレージシステム200は、第1の実施の形態のストレージ装置3の一形態である。対災害デバイス300は、第1の実施の形態のストレージ装置4の一形態である。
図3は、第2の実施の形態のCMのハードウェアの一例を示す図である。CM100aは、CPU(Central Processing Unit)101、RAM102、フラッシュメモリ103、IOC(Input-Output Controller)104、DA(Disc Adapter)105、CA(Channel Adapter)106,106a、RA(Remote Adapter)107およびデバイスインタフェース108を有する。
CPU101は、CM100aの情報処理を制御する。CPU101は、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などでもよい。また、CPU101は、マルチプロセッサでもよい。
RAM102は、CM100aの主記憶装置である。RAM102は、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部を一時的に記憶する。また、RAM102は、CPU101による情報処理に用いる各種データを記憶する。
フラッシュメモリ103は、CM100aの補助記憶装置である。フラッシュメモリ103は、不揮発性記憶装置である。フラッシュメモリ103は、OSのプログラム、アプリケーションプログラム、および各種データを格納する。なお、CM100aは、補助記憶装置として、フラッシュメモリ103の代わりにHDDを備えていてもよい。
IOC104は、ホスト装置400からDE100bへのアクセスを制御する。DA105は、DE100bと通信するためのインタフェースである。CA106は、ホスト装置400と通信するためのインタフェースである。CA106aは、管理端末500と通信するためのインタフェースである。RA107は、ストレージシステム200と通信するためのインタフェースである。デバイスインタフェース108は、対災害デバイス300と通信するためのインタフェースである。なお、CM200aもCM100aと同様のハードウェアで実現できる。
図4は、第2の実施の形態のリモートコピー元のCMの機能の一例を示す図である。CM100aは、記憶部110および制御部120を含む。
記憶部110は、プログラム格納部111、キャッシュ領域112、リモートコピー用領域113、退避判定用領域114、退避プラン格納部115、ソート/マージ処理用領域116、位置情報117、災害レベル情報118および伝送速度情報119を含む。記憶部110は、例えば、RAM102に確保した記憶領域として実装される。
プログラム格納部111は、CPU101が実行するプログラムを記憶する。キャッシュ領域112は、CPU101によって情報処理されるデータを記憶する。リモートコピー用領域113は、ストレージシステム200に非同期方式でリモートコピーを実行する際にコピー対象となるデータを格納する領域である。
退避判定用領域114は、退避判定処理部122で使用される領域である。退避プラン格納部115は、退避プランを格納する領域である。退避プランは、第1の実施の形態の退避計画8の一形態である。ソート/マージ処理用領域116は、後述するソート処理およびマージ処理で使用される領域である。
位置情報117は、ストレージシステム100が設置されている位置を示す情報である。災害レベル情報118は、被災の判定基準となる災害レベルの閾値を示す情報である。災害レベルの閾値は、災害の種類毎に設定されている。伝送速度情報119は、ストレージシステム200にリモートコピーを実行するときの実効回線速度を示す情報を含む。例えば、実効回線速度は、80Mbpsである。伝送速度情報119は、対災害デバイス300にデータをコピーするときの実効コピー速度を示す情報を含む。例えば、実効コピー速度は、190Mbpsである。なお、伝送速度情報119は、第1の実施の形態のデータ伝送速度情報5aの一形態である。
また、記憶部110は、優先度情報を有してもよい。優先度情報は、ソート処理で用いられる優先度を示す情報である。ソート処理については、後で詳細に説明する。
制御部120は、災害情報受信部121、退避判定処理部122、退避プラン作成部123および退避コピー実施部124を含む。制御部120の少なくとも一部は、例えば、CPU101が所定のプログラムを実行することによって実現される。
災害情報受信部121は、災害情報発信装置600が発信した災害情報を受信する。退避判定処理部122は、災害情報を参照し、ストレージシステム100が被災するか否かを判定する。退避判定処理部122は、被災すると判定した場合、リモートコピー用領域113に格納されているリモートコピーのコピー対象のデータを退避対象とする。以下、退避対象とされたデータを退避データと称する。
退避プラン作成部123は、退避プランを作成する。退避プランは、ストレージシステム100がストレージシステム200にリモートコピーで退避するデータ量、ストレージシステム100が対災害デバイス300にコピーして退避するデータ量などの情報を含む。また、退避プラン作成部123は、退避プランを作成する際、ソート処理およびマージ処理を実行する。ソート処理およびマージ処理については、後で詳細に説明する。
退避コピー実施部124は、退避プランをストレージシステム200に送信する。また、退避コピー実施部124は、退避プランに基づいてストレージシステム200と対災害デバイス300に退避データをコピーする。これにより、CM100aは退避データがロストする危険を低減できる。
図5は、第2の実施の形態のリモートコピー先のCMの機能の一例を示す図である。CM200aは、記憶部210および制御部220を含む。記憶部210は、プログラム格納部211、キャッシュ領域212、リモートコピー用領域213、退避プラン格納部214、ソート解除処理用領域215および復旧処理用領域216を有する。記憶部210は、例えば、CM200aが有するRAMに確保した記憶領域として実装される。
プログラム格納部211は、CM200aが有するCPUが実行するプログラムを記憶する。キャッシュ領域212は、CM200aが有するCPUによって情報処理されるデータを記憶する。リモートコピー用領域213は、ストレージシステム100から受信したリモートコピーのデータを格納する領域である。退避プラン格納部214は、退避プランを格納する領域である。ソート解除処理用領域215は、後述するソートを解除する処理で用いられる領域である。復旧処理用領域216は、復旧処理実施部222で使用される領域である。
制御部220は、退避コピー実施部221および復旧処理実施部222を含む。制御部220の少なくとも一部は、例えば、CM200aが有するCPUが所定のプログラムを実行することによって実現される。
退避コピー実施部221は、退避プランをCM100aから受信する。退避コピー実施部221は、退避データをCM100aから受信する。
復旧処理実施部222は、CM100aから受信した退避データと対災害デバイス300に格納されている退避データとを結合する。復旧処理実施部222は、結合した退避データがCM100aで実行されたソートされた状態である場合にソートを解除する。復旧処理実施部222は、結合した退避データを用いて復旧処理を実行する。これにより、CM200aは、CM200aに退避された退避データと対災害デバイス300に退避された退避データとを復旧できる。
図6は、第2の実施の形態の災害情報一覧の一例を示す図である。災害情報一覧601は、災害情報発信装置600が発信する災害情報の例を一覧にしたものである。災害情報一覧601は、災害の種類、警報名、被災地域、到達予測時刻、災害レベルの項目を含む。
災害の種類の項目は、災害の名称を示す。例えば、災害の種類は、地震、津波、噴火、台風、大雨、火災、ミサイル、テロなどである。警報名の項目は、警報の名称を示す。被災地域の項目は、被災が予測される地域を示す。到達予測時刻の項目は、被災が予測される地域が被災すると予測される時刻を示す。災害レベルの項目は、災害レベルを示す。
例えば、災害情報受信部121は、災害の種類が“地震”、警報名が“緊急地震速報”、被災地域が“震度4以上と予測される地域X1”、到達予測時刻が“主要動到達予測時刻Y1”、災害レベルが“震度Z1”という災害情報を受信する。
なお、災害情報は、災害情報一覧601で示した項目以外の情報を含んでもよい。例えば、災害情報は、災害の種類が台風の場合に台風の移動速度、台風の予測進路などの情報を含んでもよい。また、災害情報は、被災地域が被災するまでの時間を示す情報を含んでもよい。例えば、被災地域が被災するまでの時間は、25秒である。
図7は、第2の実施の形態の退避プランの一例を示す図である。退避プラン800は、総退避データ量、リモートコピー対象ボリューム、優先度、災害の種類、災害到達までの時間、RTO(Recovery Time Objective)、退避データリスト801などの情報を含む。退避プラン800は、伝送速度情報119や優先度情報などに基づいて退避プラン作成部123によって作成される。
図8は、第2の実施の形態の退避データリストの一例を示す図である。退避データリスト801は、番号(ソート後)、番号(ソート前)、対象ボリューム、開始アドレス、データ長、マージ、書き込みデータへのポインタ、退避方法の項目を含む。
番号(ソート後)の項目は、ソート処理を実行した後の状態を示す。番号(ソート前)の項目は、ソート処理を実行する前の状態を示す。対象ボリュームの項目は、退避データを格納している論理ボリュームの名称を示す。開始アドレスの項目は、退避データを格納している論理ボリュームの先頭のLBA(Logical Block Addressing)を示す。データ長の項目は、退避データのデータ長を示す。マージの項目は、マージされているか否かを示す。例えば、退避データリスト801のソート後の番号“1”のマージの項目“済(3)”は、ソート後の番号“1”がソート後の番号“3”にマージされることを示す。
書き込みデータへのポインタの項目は、リモートコピー用領域113に格納されている退避データのポインタを示す。退避方法の項目は、例えば、リモートコピー、対災害デバイス、ロストデータを示す。リモートコピーは、リモートコピーで退避データをストレージシステム200に退避することを示す。対災害デバイスは、退避データを対災害デバイス300に退避することを示す。ロストデータは、ストレージシステム200および対災害デバイス300の何れにも退避できなかった退避データであることを示す。なお、退避プラン作成部123は、退避データがマージの対象になっている場合、退避方法の項目にリモートコピー、対災害デバイス、ロストデータの何れも登録しない。
次に、CM100aが実行する各処理について、フローチャートを用いて説明する。図9は、第2の実施の形態のデータ退避処理のフローチャートの一例を示す図(その1)である。図10は、第2の実施の形態のデータ退避処理のフローチャートの一例を示す図(その2)である。CM100aは、災害情報の受信を契機にデータ退避処理を実行する。
(S11)災害情報受信部121は、管理端末500を介して災害情報発信装置600が発信した災害情報を受信する。なお、災害情報受信部121は、管理者が管理端末500に入力した災害情報を管理端末500から受信してもよい。また、災害情報受信部121は、管理端末500を介さずに災害情報発信装置600から専用回線を介して災害情報を受信してもよい。
(S12)退避判定処理部122は、位置情報117を参照し、ストレージシステム100が設置されている位置を特定する。退避判定処理部122は、災害情報に含まれている被災地域を参照し、ストレージシステム100の位置が被災地域に含まれるか否かを判定する。被災地域に含まれる場合、退避判定処理部122は、ステップS13に進む。被災地域に含まれない場合、退避判定処理部122は、データ退避処理を終了する。
(S13)退避判定処理部122は、災害情報に到達予測時刻が含まれているか否かを判定する。到達予測時刻が含まれている場合、退避判定処理部122は、ステップS16に進む。到達予測時刻が含まれていない場合、退避判定処理部122は、ステップS14に進む。
(S14)退避判定処理部122は、到達予測時刻を予測可能であるか否かを判定する。例えば、退避判定処理部122は、噴火警報や台風警報などから災害の到達予測時刻を予測可能である。到達予測時刻を予測可能な場合、退避判定処理部122は、ステップS15に進む。到達予測時刻を予測できない場合、退避判定処理部122は、データ退避処理を終了する。
(S15)退避判定処理部122は、到達予測時刻を予測する。例えば、退避判定処理部122は、所定のパラメータを用いて算出することで到達予測時刻を予測することができる。
(S16)退避判定処理部122は、災害情報に災害レベルが含まれているか否かを判定する。災害レベルが含まれている場合、退避判定処理部122は、ステップS17に進む。災害レベルが含まれていない場合、退避判定処理部122は、データ退避処理を終了する。
(S17)退避判定処理部122は、災害レベル情報118を参照し、災害情報の災害レベルが災害レベル情報118の閾値を超えるか否かを判定する。例えば、退避判定処理部122は、災害情報の災害レベルが“震度5、災害レベル情報118の閾値が“震度4”の場合、災害情報の災害レベルが災害レベル情報118の閾値を超えると判定する。閾値を超える場合、退避判定処理部122は、ストレージシステム100が被災すると判定する。退避判定処理部122は、ステップS18に進む。閾値を超えない場合、退避判定処理部122は、データ退避処理を終了する。
(S18)退避判定処理部122は、ホスト装置400からのI/Oの停止指示をホスト装置400に送信する。
(S19)退避判定処理部122は、到達予測時刻までに静止点を作成可能であるか否かを判定する。なお、静止点は、I/Oを停止した時点を示す情報である。静止点を作成可能な場合、退避判定処理部122は、静止点を作成する。退避判定処理部122は、静止点までにリモートコピー用領域113に格納されているリモートコピーのコピー対象のデータを退避対象とする。これにより、退避判定処理部122は、退避対象のデータを退避データと確定する。以下、確定した退避データのデータ量を総退避データ量と称する。退避判定処理部122は、ステップS20に進む。静止点を作成できない場合、退避判定処理部122は、データ退避処理を終了する。
(S20)退避判定処理部122は、到達予測時刻までに全ての退避データをリモートコピー可能であるか否かを判定する。例えば、退避判定処理部122は、伝送速度情報119からリモートコピーの実効回線速度を取得する。退避判定処理部122は、現時刻から到達予測時刻までの災害到達時間を算出する。退避判定処理部122は、式(1)を用いてリモートコピー可能なデータ量(リモートコピー可能データ量)を算出する。なお、例えば、安全係数は、0.8である。
リモートコピー可能データ量=実効回線速度×災害到達時間×安全係数・・・(1)
退避判定処理部122は、リモートコピー可能データ量と総退避データ量を比較する。退避判定処理部122は、リモートコピー可能データ量が総退避データ量よりも大きい場合、ストレージシステム200に、リモートコピー用領域113に格納されている退避データのリモートコピーを実行する。そして、退避判定処理部122は、データ退避処理を終了する。一方、退避判定処理部122は、リモートコピー可能データ量が総退避データ量よりも小さい場合、ステップS21に進む。
(S21)退避プラン作成部123は、退避プラン作成処理を実行する。退避プラン作成部123は、退避プラン作成処理により退避プラン800を作成する。また、退避プラン作成部123は、リモートコピー用領域113に格納されている退避データに関する情報を退避データリスト801に登録する。これにより、退避プラン作成部123は、リモートコピー用領域113に格納されている退避データと退避データリスト801の情報とを対応付けることができる。
(S22)退避コピー実施部124は、退避プラン格納部115に格納されている退避プラン800をストレージシステム200にコピーする。なお、退避コピー実施部124は、退避プラン800を対災害デバイス300にコピーしてもよい。
なお、退避コピー実施部124は、2回目以降のステップS22で、退避データリスト801の退避方法の項目がロストデータからリモートコピーまたは対災害デバイスに変更された退避プランをストレージシステム200にコピーする。
(S23)退避コピー実施部124は、退避プラン800を参照し、ストレージシステム200に、退避データリスト801の退避方法の項目がリモートコピーの退避データのリモートコピーを実行する。また、退避コピー実施部124は、退避プラン800を参照し、退避データリスト801の退避方法の項目が対災害デバイスの退避データを対災害デバイス300にコピーする。
なお、退避コピー実施部124は、2回目以降のステップS23で、退避データリスト801の退避方法の項目がロストデータから対災害デバイスまたはリモートコピーに変更した退避データのみを対災害デバイス300またはストレージシステム200にコピーする。
(S24)退避コピー実施部124は、ストレージシステム200および対災害デバイス300に対するコピーが完了したか否かを判定する。コピーが完了している場合、退避コピー実施部124は、ステップS25に進む。コピーが完了していない場合、退避コピー実施部124は、ステップS23に進む。
(S25)退避コピー実施部124は、ストレージシステム200にコピー完了通知を送信する。
(S26)災害情報受信部121は、最新の災害情報を受信する。最新の災害情報の受信は、ステップS11で示した何れかの方法で取得できる。
(S27)退避判定処理部122は、被災するまでの余裕時間を算出する。退避判定処理部122は、ステップS27の時点でストレージシステム100が被災していない場合にステップS27の処理を実行する。なお、余裕時間は、現時刻から最新の災害情報に含まれている到達予測時刻までの時間である。また、退避判定処理部122は、最新の災害情報に到達予測時刻が含まれていない場合、ステップS14,15と同様の処理を行い、到達予測時刻を算出する。
(S28)退避判定処理部122は、退避データリスト801の退避方法の項目がロストデータのうち少なくとも一部の退避データを再度退避することが可能な余裕時間があるか否かを判定する。退避判定処理部122は、少なくとも一部の退避データを再度退避することが可能な時間として5秒を設定する。再度退避することが可能な時間以上ある場合、退避判定処理部122は、ステップS29に進む。再度退避することが可能な時間未満の場合、退避判定処理部122は、ステップS30に進む。
(S29)退避プラン作成部123は、退避プラン800を参照し、退避データリスト801の退避方法の項目がロストデータのうち、余裕時間内に対災害デバイス300にコピー可能な退避データを対災害デバイスに変更した退避プラン800を作成する。例えば、退避プラン作成部123は、対災害デバイス300にコピーする実効コピー速度と余裕時間と安全係数とを乗算してデータ量を算出する。退避プラン作成部123は、算出したデータ量をロストデータから対災害デバイスに変更する。退避プラン作成部123は、ステップS22に進む。
また、退避プラン作成部123は、退避データリスト801の退避方法の項目がロストデータのうち、余裕時間内にストレージシステム200にコピー可能な退避データをリモートコピーに変更してもよい。この場合、退避プラン作成部123は、ストレージシステム200にリモートコピーを実行する実効回線速度と余裕時間と安全係数とを乗算してデータ量を算出する。退避プラン作成部123は、算出したデータ量をロストデータからリモートコピーに変更する。
さらに、退避プラン作成部123は、退避データリスト801の退避方法の項目がロストデータのうち、余裕時間内にストレージシステム200および対災害デバイス300にコピー可能な退避データをリモートコピーおよび対災害デバイスに変更してもよい。
(S30)退避コピー実施部124は、リモートコピーセッションを停止する。退避コピー実施部124は、データ退避処理を終了する。
ストレージシステム100は、被災するまでに時間の余裕がある場合、ロストデータを対災害デバイス300またはストレージシステム200にコピーする。これにより、ストレージシステム100は、ロストデータのデータ量を削減できる。
図11は、第2の実施の形態の退避プラン作成処理のフローチャートの一例を示す図(その1)である。図12は、第2の実施の形態の退避プラン作成処理のフローチャートの一例を示す図(その2)である。CM100aは、ステップS21の実行を契機に退避プラン作成処理を実行する。
(S31)退避プラン作成部123は、伝送速度情報119などに基づいて退避プラン800を作成する。例えば、退避プラン作成部123は、総退避データ量、災害の種類、リモートコピーの実効回線速度などを含む退避プラン800を作成する。また、退避プラン作成部123は、リモートコピー用領域113に格納されている退避データに関する情報を退避データリスト801に登録する。なお、退避プラン作成部123は、退避データリスト801の番号(ソート後)、マージ、退避方法の項目にNULLを設定する。退避プラン作成部123は、退避プラン800を退避プラン格納部115に格納する。
(S32)退避プラン作成部123は、複数のリモートコピーセッションが存在するか否かを判定する。複数のリモートコピーセッションが存在する場合、退避プラン作成部123は、ステップS33に進む。複数のリモートコピーセッションが存在しない場合、退避プラン作成部123は、ステップS35に進む。
(S33)退避プラン作成部123は、記憶部110に優先度情報が格納されているか否かを判定する。優先度情報が格納されている場合、退避プラン作成部123は、ステップS34に進む。優先度情報が格納されていない場合、退避プラン作成部123は、ステップS35に進む。
(S34)退避プラン作成部123は、ソート処理を実行する。退避プラン作成部123は、ソート処理により、優先度順に退避データをソートする。退避プラン作成部123は、ソート後の状態を退避データリスト801の番号(ソート後)の項目に登録する。退避プラン作成部123は、ステップS36に進む。
(S35)退避プラン作成部123は、退避データリスト801の対象ボリュームの項目を参照し、ボリューム番号順に退避データをソートする。退避プラン作成部123は、ソート後の状態を退避データリスト801の番号(ソート後)の項目に登録する。
(S36)退避プラン作成部123は、マージ処理を実行する。退避プラン作成部123は、マージ処理により、重複する退避データを特定する。
(S37)退避判定処理部122は、現時刻から到達予測時刻までの災害到達時間を算出する。退避判定処理部122は、伝送速度情報119を参照し、リモートコピーの実効回線速度を取得する。退避判定処理部122は、式(1)を用いてストレージシステム200にリモートコピーを実行するリモートコピー可能データ量を算出する。
また、退避判定処理部122は、伝送速度情報119を参照し、対災害デバイス300にコピーする実効コピー速度を取得する。退避判定処理部122は、式(2)を用いて対災害デバイス300にコピーするデータ量(コピー可能データ量)を算出する。なお、例えば、安全係数は、0.8である。
コピー可能データ量=実効コピー速度×災害到達時間×安全係数・・・(2)
(S38)退避プラン作成部123は、退避データリスト801の番号(ソート後)の項目の先頭から順番に1つの番号を選択する。また、退避プラン作成部123は、選択した番号が退避データリスト801の中でマージを示している場合、選択した番号をスキップして、次の番号を選択する。
(S39)退避プラン作成部123は、退避データリスト801の退避方法の項目がリモートコピーのデータ長を全て加算したデータ量とステップS38で選択した番号のデータ長とを加算してデータ量を算出する。退避プラン作成部123は、算出したデータ量がステップS37の式(1)で算出したリモートコピー可能データ量を超えるか否かを判定する。リモートコピー可能データ量を超える場合、退避プラン作成部123は、ステップS41に進む。リモートコピー可能データ量を超えない場合、退避プラン作成部123は、ステップS40に進む。
なお、退避プラン作成部123は、退避データリスト801の退避方法の項目にリモートコピーが存在しない場合、ステップS40に進む。
(S40)退避プラン作成部123は、ステップS38で選択した番号に対応する退避データリスト801の退避方法の項目にリモートコピーを登録する。退避プラン作成部123は、ステップS38に進む。
(S41)退避プラン作成部123は、退避データリスト801の退避方法の項目に対災害デバイスを登録する。
(S42)退避プラン作成部123は、退避データリスト801の全ての番号を選択したか否かを判定する。全て選択した場合、退避プラン作成部123は、ストレージシステム200にリモートコピーで退避データを退避するデータ量、対災害デバイス300に退避データをコピーするデータ量を退避プラン800に登録する。退避プラン作成部123は、退避プラン作成処理を終了する。全て選択していない場合、退避プラン作成部123は、ステップS43に進む。
(S43)退避プラン作成部123は、ステップS38で選択した番号の続きから順に退避データリスト801の番号(ソート後)の項目の番号を1つ選択する。また、退避プラン作成部123は、退避データリスト801の番号の中でマージされている番号をスキップする。
(S44)退避プラン作成部123は、退避データリスト801の退避方法の項目が対災害デバイスのデータ長を全て加算したデータ量とステップS43で選択した番号のデータ長とを加算してデータ量を算出する。退避プラン作成部123は、算出したデータ量がステップS37の式(2)で算出したコピー可能データ量を超えるか否かを判定する。コピー可能データ量を超える場合、退避プラン作成部123は、ステップS45に進む。コピー可能データ量を超えない場合、退避プラン作成部123は、ステップS41に進む。
なお、退避プラン作成部123は、退避データリスト801の退避方法の項目に対災害デバイスが存在しない場合、ステップS41に進む。
(S45)退避プラン作成部123は、ステップS43で選択した番号に対応する退避データリスト801の退避方法の項目にロストデータを登録する。また、退避プラン作成部123は、退避データリスト801の残りの番号の退避方法の項目にロストデータを登録する。退避プラン作成部123は、ストレージシステム200にリモートコピーで退避データを退避するデータ量、対災害デバイス300に退避データをコピーするデータ量、ロストデータのデータ量を退避プラン800に登録する。退避プラン作成部123は、退避プラン作成処理を終了する。
このように、退避プラン作成部123は、優先度の高い順に退避データをストレージシステム200と対災害デバイス300にコピーすることを退避プラン800に登録する。
図13は、第2の実施の形態のソート処理のフローチャートの一例を示す図である。CM100aは、ステップS34の実行を契機にソート処理を実行する。
(S51)退避プラン作成部123は、記憶部110から優先度情報を取得する。例えば、優先度情報は、Volume1の優先度が最も高いこと(優先度が高)を示している。優先度情報は、Volume2の優先度が2番目に高いこと(優先度が中)を示している。優先度情報は、Volume3の優先度が最も低いこと(優先度が低)を示している。退避プラン作成部123は、退避プラン800に優先度情報を登録する。
(S52)退避プラン作成部123は、リモートコピー用領域113から退避データを取得し、ソート/マージ処理用領域116に退避データをキュー構造にして格納する。なお、退避データのキュー構造は、以下、退避データキューである。退避プラン作成部123は、ソート/マージ処理用領域116に優先度“高”用、優先度“中”用、優先度“低”用のバッファ領域を用意する。用意したバッファ領域は、キュー構造である。
(S53)退避プラン作成部123は、退避データキューが空であるか否かを判定する。退避データキューが空の場合、退避プラン作成部123は、ステップS57に進む。退避データキューが空でない場合、退避プラン作成部123は、ステップS54に進む。
(S54)退避プラン作成部123は、退避データキューの先頭の退避データを取り出す。なお、退避データは、退避データリスト801の番号(ソート前)の順で退避データキューに格納されている。そのため、初期状態の退避データキューの先頭の退避データは、退避データリスト801の番号(ソート前)が“1”の退避データである。
(S55)退避プラン作成部123は、退避データリスト801と優先度情報を参照し、取り出した退避データに対応するボリューム名の優先度を特定する。
(S56)退避プラン作成部123は、特定した優先度に対応するバッファ領域にステップS54で取り出した退避データを格納する。例えば、退避プラン作成部123は、特定した優先度が“高”の場合、優先度“高”用のバッファ領域にステップS54で取り出した退避データを格納する。退避プラン作成部123は、ステップS53に進む。
(S57)退避プラン作成部123は、優先度“高”用、優先度“中”用、優先度“低”用のバッファ領域に格納された退避データを取り出し、優先度の高い順に並べる。すなわち、退避プラン作成部123は、優先度“高”の退避データの次に優先度“中”の退避データを並べる。退避プラン作成部123は、優先度“中”の退避データの次に優先度“低”の退避データを並べる。退避プラン作成部123は、並べた後の退避データを退避データキューにコピーする。退避プラン作成部123は、並べた後の退避データの順番を退避データリスト801の番号(ソート後)の項目に登録する。
図14は、第2の実施の形態のマージ処理のフローチャートの一例を示す図である。CM100aは、ステップS36の実行を契機にマージ処理を実行する。
(S61)退避プラン作成部123は、退避データキューに格納されている退避データを先頭から順に1つのデータを読み出す。
(S62)退避プラン作成部123は、読み出した退避データの次の退避データが退避データキューに存在するか否かを判定する。次の退避データが退避データキューに存在する場合、退避プラン作成部123は、ステップS63に進む。次の退避データが退避データキューに存在しない場合、退避プラン作成部123は、退避データキューに格納されている退避データをリモートコピー用領域113に格納する。退避プラン作成部123は、マージ処理を終了する。
また、例えば、ステップS62の判定は、退避プラン作成部123が退避データキューに格納されている全てのデータを読み出したか否かを判定すると考えてもよい。
(S63)退避プラン作成部123は、ステップS61で読み出した退避データの次の退避データを読み出す。また、退避プラン作成部123は、ステップS65またはステップS66の次にステップS63を実行する場合、前回、ステップS63で読み出した退避データの次の退避データを読み出す。
(S64)退避プラン作成部123は、退避データリスト801を参照し、ステップS61で読み出した退避データとステップS63で読み出した退避データに対応するボリューム名が同じであるか否かを判定する。ボリューム名が同じ場合、退避プラン作成部123は、ステップS65に進む。ボリューム名が異なる場合、退避プラン作成部123は、ステップS68に進む。
(S65)退避プラン作成部123は、退避データリスト801を参照し、ステップS61で読み出した退避データとステップS63で読み出した退避データに対応する開始アドレスが同じであるか否かを判定する。開始アドレスが同じ場合、退避プラン作成部123は、ステップS66に進む。開始アドレスが異なる場合、退避プラン作成部123は、ステップS63に進む。
(S66)退避プラン作成部123は、退避データリスト801を参照し、ステップS61で読み出した退避データのデータ長がステップS63で読み出した退避データのデータ長以上であるか否かを判定する。データ長以上の場合、退避プラン作成部123は、ステップS67に進む。データ長未満の場合、退避プラン作成部123は、ステップS63に進む。
(S67)退避プラン作成部123は、ステップS61で読み出した退避データに対応する退避データリスト801のマージの項目に、マージ済みであることを登録する。また、退避プラン作成部123は、退避データリスト801のマージの項目に、マージ先を登録する。
(S68)退避プラン作成部123は、読み出しのポインタを1つ進む。退避プラン作成部123は、ステップS61に進む。
ストレージシステム100は、重複している退避データをマージの対象にする。これにより、ストレージシステム100は、総退避データ量を削減することができる。ストレージシステム100は、総退避データ量を削減することで、ストレージシステム200および対災害デバイス300に退避できるデータ量が増えるので、ロストデータのデータ量を削減できる。
次に、CM200aが退避プラン800および退避データを受信したときの処理について、フローチャートを用いて説明する。図15は、第2の実施の形態の格納処理のフローチャートの一例を示す図である。CM200aは、退避プラン800の受信を契機に格納処理を実行する。
(S71)退避コピー実施部221は、退避プラン800をCM100aから受信する。退避コピー実施部221は、退避プラン800を退避プラン格納部214に格納する。
(S72)退避コピー実施部221は、退避プラン800をDE200b内の記憶デバイスに格納する。
(S73)退避コピー実施部221は、退避データをCM100aから受信する。退避コピー実施部221は、退避データをリモートコピー用領域213に格納する。
(S74)退避コピー実施部221は、退避データをDE200b内の記憶デバイスに格納する。
(S75)退避コピー実施部221は、コピー完了通知をCM100aから受信する。退避コピー実施部221は、格納処理を終了する。
次に、復旧処理について、フローチャートを用いて説明する。図16は、第2の実施の形態の復旧処理のフローチャートの一例を示す図(その1)である。図17は、第2の実施の形態の復旧処理のフローチャートの一例を示す図(その2)である。CM200aは、管理端末700からの復旧指示の受信を契機に復旧処理を実行する。
(S81)復旧処理実施部222は、DE200b内の記憶デバイスから退避プラン800を読み出す。復旧処理実施部222は、読み出した退避プラン800を退避プラン格納部214に格納する。
(S82)復旧処理実施部222は、DE200b内の記憶デバイスから退避データを読み出す。復旧処理実施部222は、読み出した退避データを復旧処理用領域216に格納する。
(S83)復旧処理実施部222は、ストレージシステム200に対災害デバイス300が接続されているか否かを判定する。例えば、管理者は、ストレージシステム100に接続されていた対災害デバイス300をストレージシステム200まで持ち込む。管理者は、対災害デバイス300をストレージシステム200に接続する。または、対災害デバイス300とストレージシステム200とが、ネットワークを介して接続している場合もあり得る。この場合、復旧処理実施部222は、対災害デバイス300がネットワークを介してストレージシステム200に接続されているか(通信が可能であるか)否かを判定する。
接続されている場合、復旧処理実施部222は、ステップS84に進む。接続されていない場合、復旧処理実施部222は、ステップS90に進む。
(S84)復旧処理実施部222は、退避プラン800を参照し、RTOを取得する。復旧処理実施部222は、管理者が対災害デバイス300を持ち込んでいる場合、ストレージシステム100からストレージシステム200までの移動時間を予測する。復旧処理実施部222は、予め予測されている場合、予測しない。復旧処理実施部222は、対災害デバイス300に格納されている退避データを読み出す時間と移動時間との合計時間がRTO内に収まるか否かを判定する。なお、対災害デバイス300から退避データを読み出す時間は、予め記憶部210に格納されている対災害デバイス300からデータを読み出す速度に基づいて算出可能である。
また、復旧処理実施部222は、対災害デバイス300がネットワークを介してストレージシステム200に接続されている場合、対災害デバイス300に格納されている退避データを読み出す時間がRTO内に収まるか否かを判定する。なお、対災害デバイス300から退避データを読み出す時間は、予め記憶部210に格納されている対災害デバイス300からデータを読み出す速度に基づいて算出可能である。
RTO内に収まる場合、復旧処理実施部222は、ステップS85に進む。RTO内に収まらない場合、復旧処理実施部222は、ステップS86に進む。
(S85)復旧処理実施部222は、対災害デバイス300に格納されている退避データを読み出す。復旧処理実施部222は、ステップS87に進む。
(S86)復旧処理実施部222は、対災害デバイス300に格納された退避データのうち、RTO内に読み出せる分の退避データを読み出す。例えば、復旧処理実施部222は、記憶部210に対災害デバイス300からデータを読み出す速度の情報が格納され、速度の情報を基にRTO内に読み出せる分のデータ量を算出する。復旧処理実施部222は、算出したデータ量を対災害デバイス300から読み出す。
復旧処理実施部222は、退避データリスト801を参照して、RTO内に読み出せない分の退避データの退避方法の項目にロストデータを登録する。
(S87)復旧処理実施部222は、ステップS85またはステップS86で読み出した退避データと復旧処理用領域216に格納されている退避データとを結合する。復旧処理実施部222は、結合した退避データが優先度順にソートされているか否かを判定する。すなわち、復旧処理実施部222は、退避データリスト801の番号(ソート後)の順にソートされているか否かを判定する。優先度順にソートされている場合、復旧処理実施部222は、ステップS88に進む。優先度順にソートされていない場合、復旧処理実施部222は、ステップS89に進む。
(S88)復旧処理実施部222は、結合した退避データをソート解除処理用領域215に格納する。復旧処理実施部222は、結合した退避データを優先度順にソートする前の状態に並び替える。すなわち、復旧処理実施部222は、退避データリスト801の番号(ソート前)の順に、結合した退避データを並び替える。
(S89)復旧処理実施部222は、退避データリスト801に基づいて復旧を開始する。例えば、復旧処理実施部222は、対象ボリューム“Volume1”の退避データをストレージシステム200内の対象ボリューム“Volume1”に適用する。復旧処理実施部222は、ステップS91に進む。
(S90)復旧処理実施部222は、退避データリスト801を参照し、対災害デバイス300に格納された退避データの退避方法の項目を対災害デバイスからロストデータに変更する。復旧処理実施部222は、ステップS91に進む。
(S91)復旧処理実施部222は、退避データリスト801を参照し、ロストデータが存在するか否かを判定する。ロストデータが存在する場合、復旧処理実施部222は、ステップS93に進む。ロストデータが存在しない場合、復旧処理実施部222は、ステップS92に進む。
(S92)復旧処理実施部222は、復旧処理を完了する。復旧処理実施部222は、復旧処理を終了する。
(S93)復旧処理実施部222は、ロストデータのリストを作成する。復旧処理実施部222は、リストを管理端末700に送信する。復旧処理実施部222は、復旧処理を終了する。
第2の実施の形態によれば、CM100aは、退避データをストレージシステム200と対災害デバイス300に退避する。これにより、CM100aは、退避データがロストする危険を低減できる。
また、第2の実施の形態によれば、CM100aは、ストレージシステム200と対災害デバイス300に分散して退避データを退避する。これにより、CM100aは、必ずしもすべての退避データを対災害デバイス300に退避することを要しない。したがって、第2の実施の形態の情報処理システムは、CM100aとストレージシステム200とを接続する通信回線の帯域確保にかかるコストを低減できる。
また、CM100aは、退避データの退避をストレージシステム200と対災害デバイス300とに分担させることから対災害デバイス300に必要とされる記憶容量を低減できる。したがって、第2の実施の形態の情報処理システムは、退避データのすべてを記憶可能な耐災害性の記憶ユニットを用意しなくてよいので、耐災害性の記憶ユニットにかかるコストを低減できる。
よって、第2の実施の形態は、低コストにしてデータロストの危険を低減できる。
ストレージシステム100は、退避プラン800を作成する。退避プラン800は、ストレージシステム200および対災害デバイス300にコピーした退避データを示す。また、退避プラン800は、ストレージシステム200および対災害デバイス300のいずれにもコピーされなかったロストデータを示す。ストレージシステム200は、復旧処理をする際に退避プラン800を参照することで、何れの退避データがストレージシステム200または対災害デバイス300に格納されているのかを特定できる。また、ストレージシステム200は、復旧処理をする際に退避プラン800を参照することで、何れの退避データがロストデータであるかを特定できる。
また、第1の実施の形態の情報処理は、情報処理装置2に用いられるプロセッサに、プログラムを実行させることで実現できる。第2の実施の形態の情報処理は、CPU101およびCM200aが有するCPUにプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体に記録できる。
例えば、プログラムを記録した記録媒体は、プログラムを流通させることで配布することができる。また、災害情報受信部121、退避判定処理部122、退避プラン作成部123、退避コピー実施部124、退避コピー実施部221および復旧処理実施部222に相当する機能を実現するプログラムは、別個のプログラムとして各プログラムを別個に配布することができる。災害情報受信部121、退避判定処理部122、退避プラン作成部123、退避コピー実施部124、退避コピー実施部221および復旧処理実施部222の機能は、別個のコンピュータにより実現されてもよい。コンピュータは、例えば、記録媒体に記録されたプログラムを、RAM102、フラッシュメモリ103またはCM200aが有するRAM、フラッシュメモリに格納し(インストールし)、プログラムを読み込んで実行してもよい。
1 情報処理システム
2 情報処理装置
3,4 ストレージ装置
5 記憶部
5a データ伝送速度情報
5b 退避対象データ
6 制御部
7 被災予測情報
8 退避計画

Claims (9)

  1. 遠隔地にある第1のストレージ装置にデータをコピー可能、かつ耐災害性を有する第2のストレージ装置にデータをコピー可能な情報処理装置であって、
    前記第1のストレージ装置へのデータ伝送速度および前記第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報と被災時に退避対象になる退避対象データとを記憶する記憶部と、
    被災予測に関する被災予測情報を取得し、
    前記被災予測情報から特定する被災予測時間と前記データ伝送速度情報とに基づいて、前記第1のストレージ装置へのコピーおよび前記第2のストレージ装置へのコピーにより前記退避対象データを退避する退避計画を作成し、
    前記退避計画に基づいて前記第1のストレージ装置および前記第2のストレージ装置に前記退避対象データを退避する制御部と
    を備え
    前記制御部は、
    前記第1のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第1のストレージ装置に対して退避可能な第1のデータを前記第1のストレージ装置へ退避させ、前記第2のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第2のストレージ装置に対して退避可能であり、前記第1のストレージ装置に対しては退避できない第2のデータを前記第2のストレージ装置へ退避させる前記退避計画を作成する、
    情報処理装置。
  2. 前記制御部は、前記被災予測時間と前記データ伝送速度情報とに基づいて、前記第1のストレージ装置への非同期方式によるデータのコピーおよび前記第2のストレージ装置への同期方式によるデータのコピーにより前記退避対象データを退避する前記退避計画を作成する、請求項1に記載の情報処理装置。
  3. 前記制御部は、前記被災予測情報に基づいて前記情報処理装置が被災すると判定した場合、上位装置にアクセスの停止を指示し、前記指示までのコピー対象となるデータを前記退避対象データとする、請求項に記載の情報処理装置。
  4. 前記制御部は、前記退避対象データに前記被災予測時間までに退避できない非退避データを含む場合、前記非退避データを特定可能な非退避情報を含む前記退避計画を作成し、前記退避計画を前記第1のストレージ装置に送信する、請求項1乃至の何れか1項に記載の情報処理装置。
  5. 前記制御部は、前記退避計画に基づいて前記第1のストレージ装置および前記第2のストレージ装置に前記退避対象データを退避した後に前記情報処理装置が被災していない場合、前記第1のストレージ装置および前記第2のストレージ装置に前記非退避データのうち少なくとも一部を退避する再退避計画を作成し、前記再退避計画に基づいて前記第1のストレージ装置および前記第2のストレージ装置に前記非退避データのうち少なくとも一部を退避する、請求項に記載の情報処理装置。
  6. 前記制御部は、前記退避対象データの退避優先度を示す優先度情報に基づいて前記退避対象データのうちから前記非退避データを決定する、請求項4または5に記載の情報処理装置。
  7. 遠隔地にある第1のストレージ装置にデータをコピー可能、かつ耐災害性を有する第2のストレージ装置にデータをコピー可能なコンピュータに、
    被災予測に関する被災予測情報を取得し、
    前記被災予測情報から特定する被災予測時間と、前記第1のストレージ装置へのデータ伝送速度および前記第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報とに基づいて、前記第1のストレージ装置へのコピーおよび前記第2のストレージ装置へのコピーにより被災時に退避対象になる退避対象データを退避する退避計画を作成し、
    前記退避計画に基づいて前記第1のストレージ装置および前記第2のストレージ装置に前記退避対象データを退避
    前記第1のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第1のストレージ装置に対して退避可能な第1のデータを前記第1のストレージ装置へ退避させ、前記第2のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第2のストレージ装置に対して退避可能であり、前記第1のストレージ装置に対しては退避できない第2のデータを前記第2のストレージ装置へ退避させる前記退避計画を作成する、
    処理を実行させる情報処理プログラム。
  8. 遠隔地にあり、データのコピーが可能な第1のストレージ装置と、
    耐災害性を有し、データのコピーが可能な第2のストレージ装置と、
    前記第1のストレージ装置へのデータ伝送速度および前記第2のストレージ装置へのデータ伝送速度に関するデータ伝送速度情報と被災時に退避対象になる退避対象データとを記憶する記憶部と、被災予測に関する被災予測情報を取得し、前記被災予測情報から特定する被災予測時間と前記データ伝送速度情報とに基づいて、前記第1のストレージ装置へのコピーおよび前記第2のストレージ装置へのコピーにより前記退避対象データを退避する退避計画を作成し、前記退避計画に基づいて前記第1のストレージ装置および前記第2のストレージ装置に前記退避対象データを退避する制御部を備える情報処理装置と、
    を備え、
    前記制御部は、
    前記第1のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第1のストレージ装置に対して退避可能な第1のデータを前記第1のストレージ装置へ退避させ、前記第2のストレージ装置への前記データ伝送速度で前記被災予測時間までに前記第2のストレージ装置に対して退避可能であり、前記第1のストレージ装置に対しては退避できない第2のデータを前記第2のストレージ装置へ退避させる前記退避計画を作成する、
    情報処理システム。
  9. 前記情報処理装置は、前記退避計画を前記第1のストレージ装置に送信し、
    前記第1のストレージ装置は、前記退避計画を参照し、前記第1のストレージ装置および前記第2のストレージ装置に退避されたデータを用いて前記退避対象データを復旧する復旧処理を実行する、請求項に記載の情報処理システム。
JP2016139099A 2016-07-14 2016-07-14 情報処理装置、情報処理プログラムおよび情報処理システム Active JP6744545B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016139099A JP6744545B2 (ja) 2016-07-14 2016-07-14 情報処理装置、情報処理プログラムおよび情報処理システム
US15/631,671 US20180018237A1 (en) 2016-07-14 2017-06-23 Information processing apparatus and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016139099A JP6744545B2 (ja) 2016-07-14 2016-07-14 情報処理装置、情報処理プログラムおよび情報処理システム

Publications (2)

Publication Number Publication Date
JP2018010495A JP2018010495A (ja) 2018-01-18
JP6744545B2 true JP6744545B2 (ja) 2020-08-19

Family

ID=60941109

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016139099A Active JP6744545B2 (ja) 2016-07-14 2016-07-14 情報処理装置、情報処理プログラムおよび情報処理システム

Country Status (2)

Country Link
US (1) US20180018237A1 (ja)
JP (1) JP6744545B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10528433B2 (en) * 2016-04-01 2020-01-07 Acronis International Gmbh Systems and methods for disaster recovery using a cloud-based data center
US11204842B2 (en) * 2017-11-22 2021-12-21 Acronis International Gmbh System and method for automating formation and execution of a backup strategy using machine learning
JP7486226B2 (ja) * 2020-02-21 2024-05-17 パナソニックIpマネジメント株式会社 データ管理システムおよびデータ管理方法
US11841773B2 (en) * 2021-09-14 2023-12-12 Dell Products L.P. Persistence of learned profiles

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006119745A (ja) * 2004-10-19 2006-05-11 Hitachi Ltd コンピュータシステム及びコンピュータシステムの制御方法
JP2007286860A (ja) * 2006-04-17 2007-11-01 Hitachi Ltd データ転送方法及び情報処理装置
WO2011015970A1 (en) * 2009-08-04 2011-02-10 Axxana (Israel) Ltd. Data gap management in a remote data mirroring system
JP5183650B2 (ja) * 2010-02-17 2013-04-17 株式会社日立製作所 計算機システム,計算機システムにおけるバックアップ方法及びプログラム
JP2013258511A (ja) * 2012-06-12 2013-12-26 Ricoh Co Ltd 画像形成装置、バックアップレストア方法及びプログラム

Also Published As

Publication number Publication date
JP2018010495A (ja) 2018-01-18
US20180018237A1 (en) 2018-01-18

Similar Documents

Publication Publication Date Title
US10169163B2 (en) Managing backup operations from a client system to a primary server and secondary server
US9804934B1 (en) Production recovery using a point in time snapshot
US10747606B1 (en) Risk based analysis of adverse event impact on system availability
CN103890729B (zh) 计算机化方法、存储服务器及管理服务器
JP6744545B2 (ja) 情報処理装置、情報処理プログラムおよび情報処理システム
US8495313B2 (en) Transferring learning metadata between storage servers having clusters via copy services operations on a shared virtual logical unit that stores the learning metadata
JP2017531250A (ja) 粒状同期/半同期アーキテクチャ
EP1344154A1 (en) Restoration of data between primary and backup systems
US9552370B1 (en) Signaling impending out of storage condition from a virtual tape drive
US20090210462A1 (en) Methods and apparatus to control transition of backup data
US11182094B2 (en) Performing a recovery copy command using a recovery copy data structure for a backup volume lookup
US11010295B2 (en) Asynchronous update of metadata tracks in response to a cache hit generated via an i/o operation over a bus interface
US10599339B2 (en) Sequential write management in a data storage system
CN101436150A (zh) 用于复制数据到辅助存储装置上的方法和系统
US11023159B2 (en) Method for fast recovering of data on a failed storage device
US20200145359A1 (en) Handling large messages via pointer and log
US20170228411A1 (en) Performing conflict analysis of replicated changes among nodes in a network
CN110633046A (zh) 一种分布式系统的存储方法、装置、存储设备及存储介质
US11128708B2 (en) Managing remote replication in storage systems
CN109739691A (zh) 数据库备份和恢复方法、装置、终端设备及存储介质
US9146685B2 (en) Marking local regions and providing a snapshot thereof for asynchronous mirroring
US10976941B2 (en) Validation of storage volumes that are in a peer to peer remote copy relationship
US10802868B1 (en) Management of transactions from a source node to a target node through intermediary nodes in a replication environment
US10120598B2 (en) Validation of write data subsequent to destaging to auxiliary storage for completion of peer to peer remote copy
EP2962201A1 (en) Sending a request to a management service

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190409

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20190416

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190416

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200713

R150 Certificate of patent or registration of utility model

Ref document number: 6744545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150