JP5968554B2 - ディザスタリカバリ仮想化の方法及び装置 - Google Patents

ディザスタリカバリ仮想化の方法及び装置 Download PDF

Info

Publication number
JP5968554B2
JP5968554B2 JP2015545027A JP2015545027A JP5968554B2 JP 5968554 B2 JP5968554 B2 JP 5968554B2 JP 2015545027 A JP2015545027 A JP 2015545027A JP 2015545027 A JP2015545027 A JP 2015545027A JP 5968554 B2 JP5968554 B2 JP 5968554B2
Authority
JP
Japan
Prior art keywords
volume
state
storage system
computer
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015545027A
Other languages
English (en)
Other versions
JP2016503552A (ja
Inventor
昭夫 中嶋
昭夫 中嶋
彰 出口
彰 出口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2016503552A publication Critical patent/JP2016503552A/ja
Application granted granted Critical
Publication of JP5968554B2 publication Critical patent/JP5968554B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0664Virtualisation aspects at device level, e.g. emulation of a storage device or system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Description

本願は、一般に、計算機及びストレージシステム、インタフェースプロトコル、並びにディザスタリカバリ技術に関し、特に、ストレージシステム障害時のディザスタリカバリに関する。
関連技術において、論理ボリュームが、リモートコピーボリュームに関連付けられる。リモートコピーボリュームは、リモートコピーボリュームへのI/Oを許可する状態、拒否する状態のように、I/Oについての複数の状態と関連づけられる。サーバ管理者は、ディザスタリカバリの間におけるI/Oエラーを防ぐためのボリューム状態の管理を提供する。
ストレージシステムのためのディザスタリカバリ管理は、様々な問題を提示する。なぜなら、ストレージシステムそれぞれのサーバ管理者は、様々なサーバとストレージシステムの間において設定を調整し、フェイルオーバやフェイルバックを実行するためのテストを行う必要がある場合がある。例えば、ストレージシステムは、プライマリボリュームとセカンダリボリュームの、二つのボリュームタイプと関連付けられ得る。非同期コピー処理の間、いくつかのタイプのコピー処理が存在する。例えば、ビットマップリシンクコピー処理が失敗すると、コピーボリュームにおいて、コピーボリュームと関連するアプリケーションやファイルシステムに対するコンシステンシ問題が発生し得る。ジャーナルコピー処理が失敗すると、コピーボリュームに関連するアプリケーションがコピーボリュームをチェックし、コピーボリュームをチェックポイントまで戻し得る。サーバ管理者は、ボリューム状態を管理するためのカスタムDRスクリプトを構成し、各クラスタソフトウェアへの通信を可能とすることができる。
ここで説明される実施例は、複数ストレージシステムであって、第1論理ボリュームを含む第1ストレージシステムと、第2論理ボリュームを含む第2ストレージシステムと、を含み、前記第1ストレージシステム及び前記第2ストレージシステムは、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供し、前記一つの仮想ボリュームは、第1状態を有し、前記第1状態は、前記第1論理ボリュームがプライマリボリュームであり、前記第2論理ボリュームが、前記プライマリボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、前記第1ストレージシステム及び前記第2ストレージシステムは、それぞれ、前記複数計算機のうちの第1計算機及び第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、前記第1状態において、データが前記第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記第1論理ボリューム及び前記第2論理ボリュームに格納され、前記第2ストレージシステムは、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、前記第2ストレージシステムは、前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、前記第2ストレージシステムは、前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記第2論理ボリュームへの前記第2計算機からのI/O処理を実行し、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害である場合、前記第2ストレージシステムは、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す。
ここで説明される実施例は、コントローラと、前記コントローラに制御される複数記憶デバイスと、を含むストレージシステムを含み、前記コントローラは、前記複数記憶デバイスに対応する論理ボリュームを管理し、前記コントローラは、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供し、前記一つの仮想ボリュームは、第1状態を有し、前記第1状態は、外部ストレージシステムと関連づけられている外部論理ボリュームがプライマリボリュームであり、前記論理ボリュームが、前記外部論理ボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、前記第1状態において、データが前記複数計算機のうちの第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記外部論理ボリューム及び前記論理ボリュームに格納され、前記コントローラは、前記複数計算機のうちの第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、前記コントローラは、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、前記コントローラは、前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、前記コントローラは、前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記論理ボリュームへの前記第2計算機からのI/O処理を実行し、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害である場合、前記コントローラは、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す
ここで説明される実施例は、プロセスを実行するための命令を格納する計算機読み取り可能な記憶媒体であって、前記命令は、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供することを含み、前記一つの仮想ボリュームは、第1状態を有し、前記第1状態は、第1ストレージシステムと関連付けられている第1論理ボリュームがプライマリボリュームであり、第2ストレージシステムと関連付けられている第2論理ボリュームが、前記プライマリボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、前記第1状態において、データが前記複数計算機のうちの第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記第1論理ボリューム及び前記第2論理ボリュームに格納され、前記命令は、前記複数計算機のうちの第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記第2論理ボリュームへの前記第2計算機からのI/O処理を実行し、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害である場合、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す、ことを含む。
図1は、同期または非同期のリモートコピーの構成例。 図2は、実施例における、同期または非同期のリモートコピー構成のためのストレージ仮想化の構成例。 図3(a)及び3(b)は、本実施例に係る、ストレージシステム及びストレージメモリの構成例を示す。 図4(a)及び4(b)は、本実施例に係る、ホストサーバ及びホストメモリの構成例を示す。 図5は、本実施例に係る、物理ストレージリソーステーブルを示す。 図6は、本実施例に係る、仮想ストレージリソーステーブルを示す。 図7は、本実施例に係る、仮想マルチパステーブルを示す。 図8は、本実施例に係る、リモートコピーパステーブルを示す。 図9は、本実施例に係る、SCSI応答例を示す。 図10(a)は、本実施例に係る、DRVVOLコマンドの仮想マルチパス状態を報告/設定するためのデータペイロードを示す。図10(b)は、本実施例に係る、MPAAS、I/O状態及び内部VOL状態の状態値テーブル例を示す。 図11は、マルチパスI/Oパス変更フローの関連技術例を示す。 図12は、本実施例に係る、DEVVOLコマンドの仮想マルチパス状態を方向するチャート例である。 図13は、プライマリサイト障害に起因して同期リモートコピーモードへ変更される仮想マルチパスを示す。 図14は、同期コピーDRVVOLのために、仮想マルチパス状態を変更するフローチャート例を示す。 図15は、本実施例に係る、プライマリサイト障害に起因して非同期リモートコピーモードへ変更される仮想マルチパスを示す。 図16は、本実施例において、非同期コピーDRVVOLのために仮想マルチパス状態を変更するフローチャート例を示す。 図17は、本実施例において、3データセンタ構成の同期及び非同期リモートコピーのための仮想マルチパスを、プライマリサイトの障害及び最も近いセカンダリサイトの障害に起因して、変更することを示す。 図18は、本実施例に係る、仮想ストレージのサイト選択フローを示す。 図19は、本実施例において、プライマリサイト障害に起因して、仮想マルチパスを非同期リモートコピーモードに変更することを示す。 図20は、本実施例において、非同期コピーDRVVOLのために仮想マルチパス状態を変更するフローチャート例を示す。
以下の詳細な説明は、本願の図面及び実施例のさらなる詳細を与える。図面間の冗長要素の参照符号及び説明は、明確化のために省略される。本開示を通じて使用される用語は、例として与えられるものであり、これらに限定されるものではない。たとえば、「自動的」との用語の使用は、完全に自動又は半自動の実装を含み、本願を実際に実施する技術分野における当業者の所望の実施に応じて、ユーザ又は管理者が実施におけるいくつかの態様を制御することを含む。ここで説明される実施例は、なんら限定を意図するものではなく、所望の実施に依存して様々な方法での実施が可能である。
実施例において、仮想ストレージを利用して、複数サイトに跨る複数ストレージシステムからなるストレージを仮想化する。仮想ストレージは、仮想マルチパス制御と関連付けられる。仮想マルチパス制御は、物理ストレージ間の仮想パスの状態、プライマリボリューム状態またはセカンダリボリューム状態を持つリモートコピーボリューム状態、並びに、同期コピーモード、ジャーナルコピーモード、及びビットマップリシンクモード等のボリュームコピー処理モード、を管理する。仮想ストレージの仮想マルチパス制御は、仮想マルチパス情報コマンドから得られる仮想マルチパス状態を利用することによって、好ましいサイト、パス、状態、そしてボリュームのホストからの選択を可能とする。仮想化によって、サーバ管理者が、様々なサーバ管理者及びストレージ管理者との間で調整することなく、ディザスタリカバリ構成のセットアップを実行できる。
図1は、同期または非同期リモートコピーボリュームの構成例を示す。構成は、2以上のサイト1a、1b、2以上のストレージシステム2a、2b、2以上のホスト3a、3b、関連するストレージエリアネットワーク(SAN)4a、4b、リモートコピーパス5、関連するインターネットプロトコル(IP)ネットワーク6a、6b、関連するサイト間ネットワーク7、2以上のコピーペアボリューム8a、8b、そして、関連するアプリケーション9を含む。
関連技術において、複数管理者は、それぞれ、プライマリサイト1aとセカンダリサイト1bとを管理する。これは、プライマリサイト1aの構成要素(例えば、プライマリストレージ2a、ホスト3a、ストレージネットワーク4a、IPネットワーク6a等)は、セカンダリサイト1bとは異なる識別子を持っている、または、セカンダリサイト1bの構成要素と比較して異なる構成に対して構成されているからである。
図2は、本実施例による、同期または非同期リモートコピーボリュームの構成例を示す。本例において、構成は、仮想ストレージ20を含む。仮想ストレージ20は、プライマリストレージ2aとセカンダリストレージ2bを含む。プライマリストレージ2aとセカンダリストレージ2bは、それぞれ、各物理ストレージのための通信を可能とする仮想化ソフトウェア23を有する。仮想化ソフトウェア23は、プライマリボリューム(PVOL)8aとセカンダリボリューム(SVOL)8bとを、ディザスタリカバリ(DR)仮想ボリューム(VVOL)24に対する仮想化ペアとして与える。物理ホスト3a、3bのそれぞれは、仮想マルチパスソフトウェア21を有し、仮想マルチパスソフトウェア21は、DRVVOL24についての情報を共有するように構成されている。
DRVVOL24は、仮想マルチパス状態を有し、仮想マルチパス状態は物理ストレージシステム間へのアクセスを可能にする。例えば、一つのパスが、プライマリ物理ストレージ2aのPVOLに与えられアクセス可能に構成される。他のパスは、セカンダリ物理ストレージ2bにおけるSVOLに与えられアクセス不能に構成される。
また、仮想マルチパス状態は、PVOLとSVOLそれぞれの、整合性及び/またはコピー状態を持っている。例えば、DRVVOLのマルチパス状態から、クラスタソフトウェアは、サイトがアクセス可能な不可能かを認識でき、DRVVOLがリモートコピー差分データからの同期リモートコピーの状態の下にあることを認識でき、そして、プライマリ物理ストレージの障害及び差分データの消失のためにDRVVOLデータが最新ではないことを認識できる。
図3(a)、(b)は、本実施例における、ストレージシステム2とストレージメモリ33の構成例を示す。物理ストレージシステム2は、ホストからのインタラクションを可能するホストインタフェース(I/F)、CPU、メモリ、ディスクI/F、ストレージシステム2のための論理ボリュームを形成するように動作する1以上のディスク(ハードディスクドライブ(HDD)やソリッドステイトドライブ(SSD))、を含む。構成要素は、PCI,DDR,SCSI等のバスI/Fによって相互接続される。
ストレージメモリ33は、ストレージプログラム34、物理ストレージリソーステーブル50、仮想ストレージリソーステーブル60、仮想マルチパステーブル70、そして、リモートコピーパステーブル80を格納する。ストレージメモリ33は、計算機読み取り可能な記憶媒体であり、フラッシュメモリ、RAM、HDDのような有体の媒体を含む。または、ストレージメモリ33に代えて、例えば、搬送波のような非有体の媒体の形をとる計算機読み取り可能な信号媒体を使用してもよい。ストレージメモリ33とCPUは、ストレージシステム2のストレージコントローラとして機能するように協働してもよい。
図4(a)、(b)は、本実施例に係る、ホストサーバ3とホストメモリ43の構成例を示す。各物理ホスト3は、計算機として実装でき、CPU、メモリ、ストレージシステムに接続するディスクI/F、1以上のHDDを含む、それらは、PCI,DDR,SCSI等のバスI/Fによって相互接続される。ホストメモリ43は、アプリケーションソフトウェア44、クラスタソフトウェア45、そして仮想マルチパスソフトウェア46を格納する。ホストメモリ43は、計算機読み取り可能な記憶媒体で形成され、フラッシュメモリ、RAM、HDDのような有体の媒体を含む。または、ホストメモリ43に代えて、例えば、搬送波のような非有体の媒体の形をとる計算機読み取り可能な信号媒体を使用してもよい。ホストメモリ43とCPUは、ホスト3のホストコントローラとして機能するように協働してもよい。
図5は、本実施例に係る、物理ストレージリソーステーブル50を示す。テーブル50は、物理ストレージ識別子(PSID)51、論理ユニット番号(LUN)52、ホストポートワールドワイドネーム(WWN)ローカルマルチパスリスト53、相関ポートオフセットID54、リモートコピー(RC)ポートWWNローカルリソースリスト55、DRVVOLLUN56、DRグルーピングID57、を有する。物理ストレージリソーステーブル50は、アクセスポートのリストと共に、ストレージシステムの論理ボリュームの各仮想ボリュームへのマッピングを与える。
図6は、本実施例に係る、仮想ストレージリソーステーブル60を示す。テーブル60は、物理ストレージリソーステーブル50から拡張され、仮想ストレージ(VS)ID61、仮想相関ポートID62、DR内部ボリューム(iVOL)状態63を有する。DRVVOLLUN56は、仮想ストレージのPVOLとSVOLのペアのペア情報を与える。
DR内部ボリュームの状態63は、PVOLまたはSVOL情報を含み、さらに、ボリュームが同期または非同期リモートコピー処理と関連付けられているかに関する情報を示す。内部ボリューム状態63は、ボリュームをPVOLまたはSVOLとして示し、必要により更新される。例えば、プライマリサイトで障害が発生すると、故障したPVOLに関連付けられているSVOLの内部ボリューム状態が、PVOLに変更される。
図7は、本実施例に係る、仮想マルチパステーブル70を示す。テーブル70は、DRVVOLLUN56のマルチパス状態の情報を管理する。マルチパス非同期アクセス状態(MPAAS)71は、DRVVOLの物理(物理マルチパス内)及び仮想(物理マルチパス間)状態に関する情報を含む。DR距離オフセットフィールド72は、距離(例えば、長いまたは短い)またはレイテンシを決定するための情報であり、ファイバチャネルSAN(FC−SAN)またはIP−SANping情報によって計算される。例えば、100km以内または5msレイテンシ以内であれば、同期リモートコピー処理を実行できる。より長い距離の場合、非同期コピー処理が実行され、同期コピー処理は拒否される。ホストI/O状態フィールド73は、ホストI/O状態(例えば、アクティブ、スタンバイ、オフライン等)を含む。
例えば、プライマリサイトが障害に会うと、ホストI/O状態73は、プライマリサイトがスタンバイに変更され、セカンダリサイト(例えば、最も近いサイト)がアクティブに変更される。他の例において、プライマリサイト及び最も近いセカンダリサイトの双方が障害に会う場合、より遠くに位置するSVOLのMPAASがオフライン状態からオンライン状態に変更され、アプリケーションリカバリまたはファイルシステムチェック(FSCK)シーケンスが当該SVOLに適用される。より遠くに位置する当該セカンダリSVOLのVOL状態57は、SVOLからPVOLに変更され、ホストI/O状態73が、オフライン状態からオンライン状態に変更される。
図8は、本実施例に係る、リモートコピーパステーブル80を示す。テーブル80は、DRVVOLLUN56に基づく情報を与え、物理ストレージID51、リモートコピーポートリスト55、FC/IPping状態に基づく距離情報81、FC/IPSANネットワーク(NW)到達可能情報82、物理ストレージ健全性状態フィールド83、を有する。物理ストレージ健全性状態フィールド83は、物理ストレージの健全性状態を示し、所望の実装に依存する様々な状態(グッド、デッド、故障、ビジー等)を示す。
図9は、本実施例に係る、SCSI応答コード90の例を示す。SCSI応答コード90は、センスコード、追加状態コード/追加状態コート修飾子(ASC/ASCQ)を含むことができる。SCSI応答コードは、マルチプルパスAAS、DRVVOL状態、またはホストI/O状態が変更される場合に、状態変化を通知するために使用される。SCSI応答コード90は、ホストI/Oが、オフライン、非アクティブまたはSVOLの内部状態(ホストI/Oにアクセスしない)の間に受信されると、エラー状態を与えてもよい。
ユースケース例において、「Unit Attention」のセンスコードは、I/Oを返して状態変更を通知し、ホストに仮想マルチパステーブルを得ることを知らせるために使用できる。「State is changed」のASC/ASCQ901は、AAS、DRVVOL状態または内部VOL状態が変更されていることの通知である。ホスト仮想マルチパスソフトウェアは、それにより、新しい状態に更新する。「State is transitioning」のASC/ASCQ902は、AAS、DRVVOL状態または内部VOL状態が変化中であることの通知である。ホスト仮想マルチパスソフトウェアは、それにより、新しい状態に更新することを待つ。
ユースケース例において、「Not Ready」のセンスコードは、I/O状態を返してホストに他のパスに再発行させるために使用される。LU not accessのASCは、ASCQの理由からLUにアクセスしないことをホストに対して示す。「LU not access, AAS in standby state」のASC/ASCQ903は、物理ストレージの物理マルチパスペアの特定パスの非同期アクセス状態(AAS)を示し、さらに、スタンバイ状態を示す。ホストマルチパスソフトウェアは、これにより、ホストI/Oを、物理マルチパスペアの他の物理パスに経路変更する。
「LU not access, AAS in unavailable state」のASC/ASCQ904は、物理ストレージの物理マルチパスペアの特定パスの非同期アクセス状態(AAS)を示し、さらに、利用不可能状態を示す。ホストマルチパスソフトウェアは、これにより、ホストI/Oを、物理マルチパスペアの他の物理パスに経路変更する。
「LU not access, DRVVOL under resync」のASC/ASCQ905は、DRVVOL状態はSVOLであり、ビットマップ差分コピーを使用するデータ処理中であることを示す。ホスト仮想マルチパスソフトウェアは、これにより、PVOL状態の論理ボリュームにアクセスできる他のパスを検索し、I/Oをそのパスに経路変更する。DRVVOLがPVOL状態ではない場合、ホスト仮想マルチパスソフトウェアは、リシンクコピー処理が終了した後にDRVVOLがPVOL状態に変化するのを待つ。
「LU not access, DRVVOL under SVOL pair」のSC/ASCQ906は、DRVVOL状態がSVOLであり、ジャーナルコピーを使用するデータコピー処理中であることを示す。ホスト仮想マルチパスソフトウェアは、これにより、PVOL状態のボリュームにアクセスできる他のパスを検索し、I/Oをそのパスに経路変更する。DRVVOLがPVOL状態ではない場合、ホスト仮想マルチパスソフトウェアは、ペアスプリットが終了した後にDRVVOLがPVOL状態に移行するのを待つ。
「LU not access, internal VOL is OLD data」のASC/ASCQ907は、DRVVOL状態がSVOLであり、そのSVOLが失敗したジャーナルコピーペアスプリットのために古いデータを格納している、ことを示す。ホスト仮想マルチパスソフトウェアは、これにより、FSCKまたはデータベース復旧シーケンスを使用してボリュームを復旧する。
「LU not access, internal VOL mapped to SVOL」のASC/ASCQ908は、DRVVOLが、最近のローカルコピーバックアップデータを含む他の古いSVOLにマッピングされていることを示す。ホスト仮想マルチパスソフトウェアは、ボリュームを、FSCKまたはデータベース復旧シーケンスを使用することによってボリュームを復旧し、アプリケーションは古いデータを検出し、解析する。
「LU not access, I/O state is offline」のASC/ASCQ909は、DRVVOLのI/O状態が、PVOLからSVOLへの移行のために、オフラインであることを示す。ホスト仮想マルチパスソフトウェアは、PVOLにアクセスできる他のパスに経路変更する、または、SVOLからPVOLへの変化に準備ができてないパスのために、リシンクを待って、内部パスをDRVVOLからSVOL仮想パスへ変化させる。
「LU not access, I/O state is offline」のASC/ASCQ910は、DRVVOL状態がSVOLであり、失敗したジャーナルコピーペアスプリットに起因する古いデータを含むことを示す。ホスト仮想マルチパスソフトウェアは、ボリュームを、FSCKまたはデータベース復旧シーケンスを使用することによって復旧する。
「Check Condition」のセンスコードは、コマンドパラメータのために使用される。「Illegal Request, Parameter Error」のASC/ASCQ911は、コマンドがパラメータエラーを含むことを示す。
図10(a)は、本実施例に係る、DRVVOLコマンドの仮想マルチパス状態の報告/設定のためのデータペイロードを示す。DRVVOLの仮想マルチパスディスクリプタ100は、仮想パスの数のフィールド101と、仮想パスディスクリプタフォーマット102の形での1以上のデータペイロードを含む。
仮想パスディスクリプタフォーマット102は、仮想相関ポートID62、そして、後に続く、仮想パス、内部ボリューム、VVOL、または物理リソース状態情報:MPAAS71、I/O状態73、内部VOL状態63、物理ストレージ健全性状態83、物理ストレージID51、物理ストレージ距離72、好ましいパスビット103を含む。
ホストが、仮想マルチパス報告コマンドを発行する場合、ホストは、データペイロード100を受信し、ホスト仮想マルチパスソフトウェアは仮想ストレージのいずれの仮想パスがアクティブパスであるかを決定するための状態を取得する。
ホストが仮想マルチパス設定コマンドを発行する場合、ホストは、ディスクリプタのリードデータに基づくデータペイロード100を送信し、ホスト仮想マルチパスソフトウェアは、サーバ管理者が予定されているサイトメンテナンスを実行するときのために、状態を設定する。
図10(b)は、本実施例に係る、MPAAS71、I/O状態73、及び内部VOL状態63からなる状態値テーブル109の例を示す。状態値テーブルは、MPAAS71、I/O状態73、及び内部VOL状態63に対応付けることができる様々な状態例を示す。
図11は、マルチパスI/Oパスの変更フローの関連技術例を示す。フローは、イニシエータポート及びストレージターゲットポート駆動型である。ストレージ2は、マルチパス状態情報51とストレージボリューム12を有する。ストレージ2が状態変化をホストサーバ1にポート111を介して知らせると、ホストサーバ1は、「Report Target Port Group」SCSIコマンド(例えば、技術委員会10、SCSIプライマリコマンド( T10 SPC)から定義される)のような、SCSIコマンドを発行し、マルチパス状態情報51、例えば、T10SPCによって定義されるターゲットポートグループディスクリプタを取得する。ターゲットポートグループディスクリプタは、ポートオフセット識別子と、T10SPCによって定義される非同期アクセス状態(AAS)とを有する。
ホストサーバ1のマルチパスプログラムは、マルチパス状態情報を、前状態のテーブル104から後状態のテーブル105に更新する。ストレージプログラムは、マルチパス状態情報を、「パス4がアクティブであり、パス5がオフラインである」状態から、「パス4がオフラインであり、パス5がアクティブである」状態に変更するので、マルチパスプログラムは、I/Oパスを、パス4からパス5に変更する(例えば、ターゲットポートA102からターゲットポートB103に変更)。
図12は、本実施例に係る、DRVVOLコマンドの仮想マルチパス状態を報告するシーケンス図の例を示す。S1201において、ホストはI/Oリードまたはライトコマンドを、仮想ストレージのプライマリ物理ストレージに発行する。S1202において、ホストI/O中のストレージシステム警告によりDRVVOLアクセス状態がオフライン状態に変更されることを示す通知が受信された場合、ストレージは対応するSCSIセンス状態90を返す。S1203において、ホストI/Oは、S1202によって、失敗したと示される。ホスト仮想マルチパスソフトウェアは、仮想マルチパス状態報告コマンドを、状態変更通知を与えたストレージに発行する。S1204において、仮想ストレージのプライマリ物理ストレージは、DRVVOLの仮想マルチパスディスクリプタのSCSIデータペイロード100を返す。そのために、仮想ストレージのプライマリ物理ストレージは、仮想マルチパス状態、内部ボリューム状態等のDRVVOL状態を集める。S1205において、仮想ストレージのプライマリ物理ストレージは、SCSIグッド状態を返す。S1206において、プライマリホストは、S1204のDRVVOL状態ボリュームをチェックすると、ボリュームをアンマウントする。S1207において、ホスト仮想マルチパスソフトウェアは、必要な時にパス情報をチェックする(例えば、一定周期)。
図13は、プライマリサイトの障害によって、同期リモードコピーモードへ変更される仮想マルチパスを示す。状態131は、プライマリサイト障害の前のDRVVOL仮想マルチパス状態であり、プライマリストレージのMPAASとI/O状態はアクティブであり、セカンダリストレージのMPAASとI/O状態はスタンバイである。状態132は、プライマリサイト障害後のDRVVOL想マルチパス状態であり、プライマリストレージのMPAASとI/O状態はオフラインであり、セカンダリストレージのMPAASとI/O状態はアクティブである。さらなる詳細は、図14を参照して与えられる。
図14は、同期コピーDRVVOLのための仮想マルチパス状態を変更するフローチャート例1400を示す。S1401において、クラスタサイトは、プライマリサイトにおける障害を検出し、アプリケーション引き継ぎを開始する。S1402において、セカンダリストレージが、リモートコピーネットワークの障害なく、プライマリストレージの障害を検出すると(Yes)、フローはS1410に進み、他の場合(No)、フローはS1403に進む。S1403において、仮想ストレージのセカンダリ物理ストレージは、DRVVOLにマッピングされているセカンダリストレージボリュームの内部VOL状態を、セカンダリ物理ストレージのSVOL状態からPVOL状態に変更する。さらに、仮想ストレージのプライマリ物理ストレージは、DRVVOLの内部VOL状態を、プライマリ物理ストレージのPVOL状態からSVOL状態に変更する。同期コピー処理がスワップされ、コピー元がセカンダリ物理ストレージとなり、コピー先がプライマリ物理ストレージになる。S1404において、仮想ストレージは、DRVVOLを、プライマリストレージの前のPVOLからセカンダリストレージの現在のPVOLに内部的に再マッピングする。S1405において、コピーモードは同期であり、前のPVOLと前のSVOLは同じデータセットを格納している。したがって、コピー障害は起きない。仮想ストレージのセカンダリ物理ストレージは、ホストI/O状態をオフラインからアクティブ状態に変更し、MPAASは、前のMPAASがアクティブ状態でない場合には、アクティブ状態に変更される。S1406において、ホスト仮想マルチパスソフトウェアが仮想マルチパス情報をマルチパス情報のポーリングの間に取得する、または、クラスタソフトウェアがプライマリサイト障害の検出を通信する場合、セカンダリホストの仮想マルチパスソフトウェアは、仮想ストレージのセカンダリ物理ストレージから取得した新しい状態に更新する。セカンダリホストは、DRVVOLをマウントし、I/OをDRVVOLに発行する。ボリューム状態をチェックし、処理を調整するためのカスタムスクリプトを使用してもよい。
S1410において、セカンダリストレージは、プライマリ物理ストレージ障害のために、プライマリ物理ストレージがアクセス不能であることを検出する。S1411において、同期コピー処理は、プライマリストレージ障害のために、停止される。障害がリモートコピーネットワーク障害の場合、セカンダリストレージは、差分データビットマップの記録を開始し、プライマリ物理ストレージの再同期を試みる。S1412において、仮想ストレージのセカンダリ物理ストレージは、DRVVOLにマッピングされているセカンダリボリュームの内部VOL状態を、セカンダリ物理ストレージのSVOLからPVOL状態に変更する。S1413において、仮想ストレージは、内部的に、DRVVOLの状態を変更し、仮想マルチパス状態をそれに応じて変更する。状態変化は、S1404とS1405との間において、プライマリストレージの健全性状態のみ異なる(障害対非障害)、または、S1404とS1405で同じである。セカンダリホストI/Oはポーリングを実行し、仮想マルチパス状態を更新し、S1406に進む。
さらに、プライマリホストのアプリケーションは、プライマリストレージ障害を検出するために、SCSI I/Oのタイムアウトを待つ必要はない。I/Oタイムアウトは、仮想マルチパス状態変化にかかる時間よりも長いからである。仮想ストレージは、物理ストレージ健全性状態を、仮想マルチパス状態変化から検出でき、それにより、物理ストレージ障害を迅速に検出できる。
図15は、本実施例において、プライマリサイト障害によって、非同期リモートコピーモードへ変更される仮想マルチパスを示す。状態153は、プライマリサイト障害前のDRVVOL仮想マルチパス状態である。プライマリストレージのMPAASとI/O状態はアクティブである。セカンダリストレージのMPAASとI/O状態はスタンバイである。状態154は、プライマリサイト障害後のDRVVOL仮想マルチパス状態である。プライマリストレージのMPAASとI/O状態は、それぞれ、スタンバイとオフラインである。セカンダリストレージのMPAASとI/O状態はアクティブである。DRVVOL状態変更処理は、プライマリサイトの差分データが成功裏に送信されるか、ネットワークエラーのために失敗するかによって、異なる。I/O状態も、障害状況に応じて変化する。I/O状態は、完全リシンクまたはペアスプリットの場合に「オンライン状態」155に変化し、リモートコピーネットワーク障害のために完全なコピーオーバーが失敗している場合に「復旧必要」156に変更される。詳細は、図16を参照して説明する。
図16は、本実施例に係る、非同期コピーDRVVOLのための仮想マルチパス状態を変更するフローチャート例1600を示す。フローは、図14のフローに類似する。違いは、障害が検出された後、リモートコピー障害が考慮される点である。下記は図14から要素の冗長記載を省略し、図14のフローとの差異のみを示す。S1601において、プライマリサイトで障害が発生すると、クラスタソフトウェアがプライマリサイト障害を検出し、アプリケーション引き継ぎを開始する。S1602において、プライマリストレージで障害が発生している場合(Yes)フローはS1603に進み、そうでない場合(No)フローはS1610に進む。S1603において、PVOLとSVOLは、サスペンドされ、プライマリストレージシンクジャーナルデータは、セカンダリサイトのSVOLに送信される。セカンダリホストがI/OをSVOLのセカンダリストレージに発行すると、セカンダリストレージは、リモードコピー処理のためにセカンダリストレージはサスペンド中であり、通知を待っている、ことを示すSCSI応答を返す。S1604において、仮想ストレージのDRVVOLは、サスペンド処理を完了する。SVOLはPVOLに同期される。S1605において、仮想ストレージは状態を変更し、ホストは仮想マルチパス状態を更新する。この処理は、図14におけるS1405に類似する。S1606において、セカンダリホストは、セカンダリストレージのPVOLにI/Oを発行する。
S1610において、プライマリホストは、I/O障害を検出し、クラスタソフトウェアはセカンダリホストに通知を与え、セカンダリホストはアプリケーション引き継ぎを開始する。セカンダリホストは、I/Oをセカンダリストレージに発行することを試みる。S1611において、セカンダリ物理ストレージリシンク処理は、プライマリストレージ障害のために、失敗する。S1612において、セカンダリ物理ストレージは状態を変更し、ホストは仮想マルチパス状態を更新する。S1613において、ホストはI/Oを発行し、セカンダリ物理ストレージは、回復が必要であることを示すSCSI状態を返す。S1614において、セカンダリ物理ストレージは、クラスタソフトウェアにデータ復旧の処理が必要であることを通知する。ボリューム状態をチェックし、行為を調整するカスタムスクリプトも、使用してもよい。
図17は、本実施例において、プライマリサイトの障害と最も近いセカンダリサイトの障害のために、3データセンタ構成の同期及び非同期リモートコピーのための仮想マルチパスを変更することを示す。図17の例において、パス171と172のI/O状態は、オフラインに変更され、パス173のI/O状態は、オンラインにされる。プライマリサイトとしてしてのリモートセカンダリサイトへの移行のための状態変化は、状態174及び175において示されている。本構成は、図14及び図16で説明された処理の組み合わせにより形成される。仮想ストレージのサイト選択のフローの詳細は、図18の記述において説明される。
図18は、本実施例に係る、仮想ストレージのサイト選択フロー1800を示す。S1801において、プライマリサイトで障害が発生し、クラスタソフトウェアがプライマリサイト障害を検出し、アプリケーション引き継ぎを開始する。S1802において、チェックが実行され、最も近いセカンダリサイトが健全であるかを見る。最も近いセカンダリサイトが健全である場合(YES)、フローはS1803に進み、図14のフローを呼び出す。そうではない場合(NO)、フローはS1811に進み、図16のフローを呼び出す。
図19は、本実施例において、プライマリサイト障害のために、仮想マルチパスを非同期リモートコピーモードに変更することを示す。図19の例において、プライマリホストが故障し、ネットワーク障害191がプライマリ物理ストレージとセカンダリ物理ストレージの間でリシンクプロセスの間に発生すると、セカンダリストレージのSVOLリシンクプロセスが失敗し192、SVOLは不明データを含む。この例から復旧するためには、セカンダリストレージは、最新のローカルコピーSVOL(バックアップボリューム)193を復旧のために選択し、ホストにバックアップボリュームへの新しいマッピングを通知する。ホストアプリケーションは、バックアップボリューム193を使用することによって、ボリュームを復旧する。本例のさらなる詳細は、図20において説明される。
図20は、本実施例において、非同期コピーディザスタリカバリ(DR)仮想ボリューム(VVOL)のために、仮想マルチパス状態を変化させるフローチャート例2000を示す。S2001において、プライマリホストがプライマリサイト障害を検出すると、アプリケーションは、セカンダリサイトに移動される。セカンダリホストは、I/Oをセカンダリホストに発行し、セカンダリ物理ストレージは、PVOLとSVOLのサスペンド処理を開始する。S2002において、S2001のリシンクコピー処理の間、プライマリストレージが故障する、またはリモートコピーネットワークが故障すると、ストレージはリシンクを停止して(Yes)、フローはS2010に進む。そうでない場合(No)、フローはS2003に進む。
S2003において、リシンクコピー処理が成功し、リシンクが完了する。結果は、SVOLがPVOLと同一のデータを格納する。S2004において、DRボリュームマッピングが変更される(例えばS1605に類似)。ホストI/Oはアプリケーション復旧なしに、再開する。
S2010において、プライマリストレージ障害または復旧ネットワーク障害のために、プライマリストレージがアクティブであっても、リシンクが失敗する。プライマリストレージ障害のため、図16で記述された復旧処理を使用できる。S2010のためのフローは、復旧ネットワーク障害のための状況を考慮する。S2011において、チェックが実行され、オーバーフローがプライマリストレージジャーナルボリュームにおいて起きたか判定する。起きていない場合(No)、フローはS2015に進む。そうではない場合、フローはS2012に進む。
S2015のフローは、リシンク失敗ケースに向けられており、ジャーナルデータのオーバーフローは起きなかった。S2015において、セカンダリストレージサスペンド処理は、完了しており、ジャーナルデータの部分的なリシンクのみが発生した。仮想ストレージは、ホストにリカバリDRVVOL状態が古いデータであることを通知する。S2016において、仮想ストレージは、DRVVOLのための内部マッピングを変更する。リシンクコピーデータ処理はS2010で未完了であるので、ホストはセカンダリストレージのPVOLの古いデータを復旧する、または、PVOLからセカンダリストレージにおけるローカルコピーボリューム193に変更する。ホストI/Oは、アプリケーション復旧の後に再開する。
S2012のフローは、リシンク失敗ケースに向けられており、ジャーナルデータのオーバーフローが発生した。S2012において、セカンダリストレージサスペンド処理は、プライマリボリュームのジャーナルデータのオーバーフロー及びビットマップを使用するコピーデータのために失敗する。この結果、セカンダリストレージのSVOLのためのデータ不整合が起きる。そのため、SVOLは復旧のためにアプリケーションによって使用されることができない。S2013において、セカンダリストレージは、SVOLの最新のローカルコピーのバックアップボリュームを選択する。S2014において、セカンダリストレージがSVOLのローカルコピーを持っていない場合(No)、フローはバックアップボリュームのロールバックのために失敗を示す通知を発行する。そうでない場合(Yes)、古いSVOLへのロールバックが成功し、フローはS2015に進む。
さらに、詳細説明のいくつかの部分は、計算機内の処理のアルゴリズム及び記号表現の観点において提供される。これらアルゴリズムの記述及び記号表現は、データ処理技術の当業者によって、最も効果的に技術革新を他の当業者に最も効果的に伝えるために使用される手段である。アルゴリズムは、所望の最終状態又は結果につながる定義された一連のステップである。実施例において、実行されるステップは、実体の結果を得るための実体量の物理的な操作を必要とする。
さらに、本願の他の実施例は、ここに開示された実施例の詳細及び実際を考慮することによって、当業者にとって明らかである。説明された実施例の様々な観点及び/又は構成要素は、単独又は任意の組み合わせで使用することができる。明細書及び実施例は実施例にすぎず、本願の本来の範囲及び精神は以下の請求範囲によって示される。

Claims (18)

  1. 複数ストレージシステムであって、
    第1論理ボリュームを含む第1ストレージシステムと、
    第2論理ボリュームを含む第2ストレージシステムと、を含み、
    前記第1ストレージシステム及び前記第2ストレージシステムは、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供し、
    前記一つの仮想ボリュームは、第1状態を有し、
    前記第1状態は、前記第1論理ボリュームがプライマリボリュームであり、前記第2論理ボリュームが、前記プライマリボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、
    前記第1ストレージシステム及び前記第2ストレージシステムは、それぞれ、前記複数計算機のうちの第1計算機及び第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、
    前記第1状態において、データが前記第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記第1論理ボリューム及び前記第2論理ボリュームに格納され、
    前記第2ストレージシステムは、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、
    前記第2ストレージシステムは、前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、
    前記第2ストレージシステムは、前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記第2論理ボリュームへの前記第2計算機からのI/O処理を実行し、
    前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害である場合、前記第2ストレージシステムは、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す、複数ストレージシステム。
  2. 請求項1に記載の複数ストレージシステムであって、
    第3論理ボリュームを含む第3ストレージシステムをさらに含み、
    前記第1状態は、さらに、前記第3論理ボリュームが、前記プライマリボリュームとリモートコピー処理のための非同期関係を形成するセカンダリボリュームであることを示し、
    前記第1ストレージシステム、前記第2ストレージシステム及び前記第3ストレージシステムは、前記第1ストレージシステム及び前記第2ストレージシステムの障害の発生のために、前記仮想ボリュームの状態を前記第1状態から前記第3論理ボリュームがプライマリボリュームであることを示す状態に変更する、複数ストレージシステム
  3. 請求項1に記載の複数ストレージシステムであって、
    前記第1ストレージシステム及び前記第2ストレージシステムは、前記第1論理ボリューム及び前記第2論理ボリュームの前記仮想ボリュームに対するマッピング情報を格納する、複数ストレージシステム。
  4. 請求項1に記載の複数ストレージシステムであって、
    前記状態情報はマルチパス非同期アクセス状態(MPAAS)の情報を含み、
    前記マルチパス非同期アクセス状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、複数ストレージシステム。
  5. 請求項1に記載の複数ストレージシステムであって、
    前記状態情報は入力/出力(I/O)状態の情報を含み、
    前記I/O状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、複数ストレージシステム。
  6. 請求項1に記載の複数ストレージシステムであって、
    前記状態情報は障害発生を示す物理ストレージ健全性状態の情報を含む、複数ストレージシステム。
  7. コントローラと、
    前記コントローラに制御される複数記憶デバイスと、を含み、
    前記コントローラは、前記複数記憶デバイスに対応する論理ボリュームを管理し、
    前記コントローラは、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供し、
    前記一つの仮想ボリュームは、第1状態を有し、
    前記第1状態は、外部ストレージシステムと関連づけられている外部論理ボリュームがプライマリボリュームであり、前記論理ボリュームが、前記外部論理ボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、
    前記第1状態において、データが前記複数計算機のうちの第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記外部論理ボリューム及び前記論理ボリュームに格納され、
    前記コントローラは、前記複数計算機のうちの第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、
    前記コントローラは、前記第1計算機から前記第2計算機への引き継ぎ開始後、前記外部ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、
    前記コントローラは、前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、
    前記コントローラは、前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記論理ボリュームへの前記第2計算機からのI/O処理を実行し、
    前記第1計算機から前記第2計算機への引き継ぎ開始後、前記外部ストレージシステムの障害である場合、前記コントローラは、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す、ストレージシステム。
  8. 請求項7に記載のストレージシステムであって、
    前記第1状態は、さらに、第2外部ストレージシステムと関連づけられている第2外部論理ボリュームが、前記プライマリボリュームとリモートコピー処理のための非同期関係を形成するセカンダリボリュームであることを示し、
    前記コントローラは、前記外部ストレージシステム及び前記ストレージシステムの障害の発生のために、前記仮想ボリュームの状態を前記第1状態から前記第2外部論理ボリュームがプライマリボリュームであることを示す第3状態に変更する、ストレージシステム。
  9. 請求項7に記載のストレージシステムであって、
    前記コントローラは、前記外部論理ボリューム及び前記論理ボリュームの前記仮想ボリュームに対するマッピング情報を格納する、ストレージシステム。
  10. 請求項7に記載のストレージシステムであって、
    前記状態情報は、マルチパス非同期アクセス状態(MPAAS)の情報を含み、
    前記マルチパス非同期アクセス状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、ストレージシステム。
  11. 請求項7に記載のストレージシステムであって、
    前記状態情報は入力/出力(I/O)状態の情報を含み、
    前記I/O状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、ストレージシステム。
  12. 請求項7に記載のストレージシステムであって、
    前記状態情報は障害発生を示す物理ストレージ健全性状態の情報を含む、ストレージシステム。
  13. プロセスを実行するための命令を格納する計算機読み取り可能な記憶媒体であって、
    前記命令は、複数仮想ボリュームから一つの仮想ボリュームを複数計算機に提供することを含み、
    前記一つの仮想ボリュームは、第1状態を有し、
    前記第1状態は、第1ストレージシステムと関連付けられている第1論理ボリュームがプライマリボリュームであり、第2ストレージシステムと関連付けられている第2論理ボリュームが、前記プライマリボリュームとリモートコピー処理のためのペア関係を形成するセカンダリボリュームである、ことを示し、
    前記第1状態において、データが前記複数計算機のうちの第1計算機から前記仮想ボリュームに書き込まれると、前記データはリモートコピー処理に基づき、前記第1論理ボリューム及び前記第2論理ボリュームに格納され、
    前記命令は、
    前記複数計算機のうちの第2計算機からの要求に応じて、前記仮想ボリュームの内部ボリュームについての情報とパス状態の情報とを含む状態情報を返し、
    前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害ではない場合、前記セカンダリボリュームを前記プライマリボリュームに再同期させるためにサスペンド処理を開始し、
    前記サスペンド処理中に前記第2計算機からI/Oコマンドを受信すると、前記サスペンド処理中であることを示す応答を返し、
    前記サスペンド処理完了後に前記仮想ボリュームの状態を変更し、前記第2計算機が前記仮想ボリュームのパス状態を更新した後に、前記プライマリボリュームに変更された前記第2論理ボリュームへの前記第2計算機からのI/O処理を実行し、
    前記第1計算機から前記第2計算機への引き継ぎ開始後、前記第1ストレージシステムの障害である場合、前記セカンダリボリュームの前記プライマリボリュームへの再同期に失敗すると、前記仮想ボリュームの状態を変更した後、前記第2計算機から受信したI/Oコマンドに対して、回復が必要であることを示す応答を返す、ことを含む、計算機読み取り可能な記憶媒体。
  14. 請求項13に記載の計算機読み取り可能な記憶媒体であって、
    前記第1状態は、さらに、第3論理ボリュームが、前記プライマリボリュームと前記リモートコピー処理のための非同期関係を形成するセカンダリボリュームであることを示し、
    前記命令は、前記第1ストレージシステム及び前記第2ストレージシステムの障害の発生のために、前記仮想ボリュームの状態を前記第1状態から第3論理ボリュームがプライマリボリュームであることを示す第3状態に変更することを含む、計算機読み取り可能な記憶媒体。
  15. 請求項13に記載の計算機読み取り可能な記憶媒体であって、
    前記命令は、前記第1論理ボリューム及び前記第2論理ボリュームの前記仮想ボリュームに対するマッピング情報を格納することを含む、計算機読み取り可能な記憶媒体。
  16. 請求項13に記載の計算機読み取り可能な記憶媒体であって、
    前記状態情報はマルチパス非同期アクセス状態(MPAAS)の情報を含み、
    前記マルチパス非同期アクセス状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、計算機読み取り可能な記憶媒体。
  17. 請求項13に記載の計算機読み取り可能な記憶媒体であって、
    前記状態情報は入力/出力(I/O)状態の情報を含み、
    前記I/O状態は、前記プライマリボリュームに対してアクティブを示し、前記セカンダリボリュームに対してスタンバイを示す、計算機読み取り可能な記憶媒体。
  18. 請求項13に記載の計算機読み取り可能な記憶媒体であって、
    前記状態情報は障害発生を示す物理ストレージ健全性状態の情報を含む、計算機読み取り可能な記憶媒体。
JP2015545027A 2013-03-14 2013-03-14 ディザスタリカバリ仮想化の方法及び装置 Active JP5968554B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2013/031548 WO2014142898A1 (en) 2013-03-14 2013-03-14 Method and apparatus of disaster recovery virtualization

Publications (2)

Publication Number Publication Date
JP2016503552A JP2016503552A (ja) 2016-02-04
JP5968554B2 true JP5968554B2 (ja) 2016-08-10

Family

ID=51537286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015545027A Active JP5968554B2 (ja) 2013-03-14 2013-03-14 ディザスタリカバリ仮想化の方法及び装置

Country Status (6)

Country Link
US (1) US9697082B2 (ja)
JP (1) JP5968554B2 (ja)
CN (1) CN104838367A (ja)
DE (1) DE112013005758T5 (ja)
GB (1) GB2521964A (ja)
WO (1) WO2014142898A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2549242B (en) * 2013-08-20 2020-10-28 Hitachi Ltd Storage system and control method for storage system
US9846555B2 (en) * 2014-06-26 2017-12-19 Hitachi, Ltd. Storage system and method of creating backup of storage system
CN105141459A (zh) * 2015-08-27 2015-12-09 浪潮电子信息产业股份有限公司 一种基于多路径技术的优化方法
CN107168656B (zh) * 2017-06-09 2020-07-24 苏州浪潮智能科技有限公司 一种基于多路径磁盘驱动的卷复本集系统及其实现方法
US10585756B2 (en) 2017-08-07 2020-03-10 International Business Machines Corporation Point-in-time copy on a remote system
CN107688522A (zh) * 2017-09-01 2018-02-13 郑州云海信息技术有限公司 一种存储系统性能判定方法及系统
JP2019125075A (ja) * 2018-01-15 2019-07-25 富士通株式会社 ストレージ装置、ストレージシステムおよびプログラム
US11233850B2 (en) 2018-04-17 2022-01-25 Hewlett Packard Enterprise Development Lp Replicating data over a public network
US10944819B2 (en) * 2018-10-26 2021-03-09 Hewlett Packard Enterprise Development Lp Replication of an encrypted volume
US11467923B2 (en) 2019-05-15 2022-10-11 Kyndryl, Inc. Application recovery using pooled resources
US11372842B2 (en) * 2020-06-04 2022-06-28 International Business Machines Corporation Prioritization of data in mounted filesystems for FSCK operations
CN112035319B (zh) * 2020-08-31 2023-12-26 浪潮云信息技术股份公司 一种针对多路径状态的监控告警系统
CN113625944B (zh) * 2021-06-25 2024-02-02 济南浪潮数据技术有限公司 一种基于多路径和远程复制技术的容灾方法、系统
US20230034463A1 (en) * 2021-07-30 2023-02-02 International Business Machines Corporation Selectively using summary bitmaps for data synchronization
US12001303B2 (en) * 2021-10-21 2024-06-04 EMC IP Holding Company LLC Data center restoration and migration
CN115794499B (zh) * 2023-02-03 2023-05-16 创云融达信息技术(天津)股份有限公司 一种用于分布式块存储集群间双活复制数据的方法和系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4689137B2 (ja) 2001-08-08 2011-05-25 株式会社日立製作所 リモートコピー制御方法、及びストレージシステム
ATE480822T1 (de) * 2001-02-13 2010-09-15 Candera Inc Failover-verarbeitung in einem speicherungssystem
US9087319B2 (en) 2002-03-11 2015-07-21 Oracle America, Inc. System and method for designing, developing and implementing internet service provider architectures
JP2005309550A (ja) * 2004-04-19 2005-11-04 Hitachi Ltd リモートコピー方法及びリモートコピーシステム
JP2005157712A (ja) * 2003-11-26 2005-06-16 Hitachi Ltd リモートコピーネットワーク
US7757033B1 (en) * 2004-02-13 2010-07-13 Habanero Holdings, Inc. Data exchanges among SMP physical partitions and I/O interfaces enterprise servers
US7058731B2 (en) * 2004-08-03 2006-06-06 Hitachi, Ltd. Failover and data migration using data replication
JP2006099440A (ja) * 2004-09-29 2006-04-13 Hitachi Ltd リモートコピーシステム
US9032164B2 (en) * 2006-02-17 2015-05-12 Emulex Corporation Apparatus for performing storage virtualization
JP2009093316A (ja) * 2007-10-05 2009-04-30 Hitachi Ltd ストレージシステム及び仮想化方法
JP5147570B2 (ja) * 2008-07-02 2013-02-20 株式会社日立製作所 ストレージシステム及びリモートコピー復旧方法
JP5226125B2 (ja) * 2009-03-19 2013-07-03 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法
US8935496B2 (en) * 2012-08-31 2015-01-13 Hitachi, Ltd. Management method of virtual storage system and remote copy system

Also Published As

Publication number Publication date
US20150331753A1 (en) 2015-11-19
GB2521964A (en) 2015-07-08
GB201506864D0 (en) 2015-06-03
JP2016503552A (ja) 2016-02-04
WO2014142898A1 (en) 2014-09-18
DE112013005758T5 (de) 2015-09-24
CN104838367A (zh) 2015-08-12
US9697082B2 (en) 2017-07-04

Similar Documents

Publication Publication Date Title
JP5968554B2 (ja) ディザスタリカバリ仮想化の方法及び装置
US11983083B2 (en) Trust relationship migration for data mirroring
US10146453B2 (en) Data migration using multi-storage volume swap
US9769259B2 (en) Network storage systems having clustered RAIDs for improved redundancy and load balancing
US9170743B2 (en) Management method of virtual storage system and remote copy system
US10152281B2 (en) Systems, devices, apparatus, and methods for transparently inserting a virtual storage layer in a fibre channel based storage area network while maintaining continuous input/output operations
US20190310925A1 (en) Information processing system and path management method
US8966211B1 (en) Techniques for dynamic binding of device identifiers to data storage devices
US9098466B2 (en) Switching between mirrored volumes
JP5620614B1 (ja) ストレージシステム
US10114691B2 (en) Information storage system
US10185636B2 (en) Method and apparatus to virtualize remote copy pair in three data center configuration
JP2008033829A (ja) バックアップシステム及びバックアップ方法
JP2008269469A (ja) ストレージシステム及びその管理方法
US7886186B2 (en) Storage system and management method for the same
JP2009003499A (ja) ファイル共有システム及びファイル共有システムを用いて単一の論理的ディレクトリ構成を生成する方法
US10761767B2 (en) Computer system and method for controlling storage apparatus that has replication direction from first logical device (in first storage) to second logical device (in second storage) and from said second logical device to third logical device (in said second storage), wherein said replication direction is reversed when second computer takes over for first computer
US20120131287A1 (en) Storage control apparatus and logical volume size setting method
JP2016119062A (ja) ストレージ装置、ストレージシステムおよびストレージ制御プログラム
US8996908B1 (en) Information system, host system and access control method
US11308122B2 (en) Remote copy system
JP6013420B2 (ja) ストレージシステム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160705

R150 Certificate of patent or registration of utility model

Ref document number: 5968554

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150