JP2012504793A - ストレージシステム及びストレージシステムの制御方法 - Google Patents

ストレージシステム及びストレージシステムの制御方法 Download PDF

Info

Publication number
JP2012504793A
JP2012504793A JP2011514950A JP2011514950A JP2012504793A JP 2012504793 A JP2012504793 A JP 2012504793A JP 2011514950 A JP2011514950 A JP 2011514950A JP 2011514950 A JP2011514950 A JP 2011514950A JP 2012504793 A JP2012504793 A JP 2012504793A
Authority
JP
Japan
Prior art keywords
volume
storage
storage device
control device
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011514950A
Other languages
English (en)
Other versions
JP5199464B2 (ja
Inventor
貴仁 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2012504793A publication Critical patent/JP2012504793A/ja
Application granted granted Critical
Publication of JP5199464B2 publication Critical patent/JP5199464B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0605Improving or facilitating administration, e.g. storage management by facilitating the interaction with a user or administrator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0617Improving the reliability of storage systems in relation to availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/062Securing storage systems
    • G06F3/0622Securing storage systems in relation to access
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0637Permissions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Abstract

本発明のストレージシステムは、リモートコピーペアに基づく仮想ボリュームを生成して、その仮想ボリュームをホストに提供する。第1ストレージ装置と第2ストレージ装置とは、第3ストレージ装置内のロックディスクを共有する。ロックディスクには、仮想ボリュームの使用を制御するための情報が記憶される。その仮想ボリュームは、正ボリュームと副ボリュームとから構成されるリモートコピーペアに基づいて生成される。ユーザは、管理サーバから指示を発行させることにより、仮想ボリュームの作成及び削除、ロックディスクの作成及び削除を行わせることができる。

Description

本発明は、ストレージシステム及びストレージシステムの制御方法に関する。
例えば、企業等では、多種多量のデータを取り扱うために、比較的大規模なストレージシステムを用いてデータを管理する。このストレージシステムは、少なくとも一つの記憶制御装置を備える。記憶制御装置は、例えば、多数の記憶装置を備えており、RAID(Redundant Array of Inexpensive Disks)に基づく記憶領域を提供する。記憶装置群が提供する物理的な記憶領域上には、少なくとも1つ以上の論理デバイス(論理ボリュームとも呼ばれる)が形成される。ホストコンピュータ(以下、「ホスト」)は、論理デバイスに対してライトコマンドやリードコマンドを発行することにより、データの書込みやデータの読出しを行う。
ストレージシステムは、データの安全性等を改善するために、複数の論理デバイスに同一のデータをそれぞれ記憶させることができる。例えば、第1の従来技術として、ストレージシステムは、同一の記憶制御装置内のそれぞれ異なる論理デバイスに同一のデータをそれぞれ記憶させることができ、または、別々の記憶制御装置内の論理デバイスに同一のデータをそれぞれ記憶させることができる(JP−A−2007−150409)。
さらに、第2の従来技術として、一方の記憶制御装置内の正ボリュームと他方の記憶制御装置内の副ボリュームとでリモートコピーのペアを形成し、そのリモートコピーペアを形成する2つの論理ボリュームを同一のデバイスとしてホストに認識させる、技術も知られている(JP−A−2008−134988)。
前記第1の従来技術では、同一筐体内の複数の論理デバイスにデータをそれぞれ記憶させたり、あるいは、それぞれ別々の筐体内に位置する複数の論理デバイスにデータを記憶させることにより、プライマリの論理デバイスが使用不能な場合でも、セカンダリの論理デバイスを用いて業務処理を続行可能である。しかし、プライマリの論理デバイスからセカンダリの論理デバイスに切り替えるためには、ホストのアクセス先デバイスをプライマリの論理デバイスからセカンダリの論理デバイスに意図的に切り替える必要があり、切替作業に手間がかかる。
前記第2の従来技術では、リモートコピーペアを形成する正ボリューム及び副ボリュームを同一の論理ボリュームとしてホストに認識させることにより、データを二重化して管理することができ、さらに、障害発生時に、ホストは副ボリュームに切り替えて情報処理を継続することができる。しかし、第2の従来技術では、各記憶制御装置の障害の有無をホスト側で管理する必要がある。
本発明は、上記の問題点に鑑みてなされたもので、その目的は、異なる記憶制御装置内に存在する別々の論理ボリュームデバイスを一つの仮想ボリュームとして仮想化することができ、さらに、その仮想ボリューム設定、及び、その仮想ボリュームの使用を制御するための情報を別の論理ボリュームに格納して、データアクセスの整合性を確保できるようにしたストレージシステム、及びストレージシステムの制御方法を提供することにある。本発明の更なる目的は、後述する実施の形態の記載から明らかになるであろう。
上記課題を解決すべく、本発明の第1観点に従うストレージシステムは、ホストコンピュータと、そのホストコンピュータにより利用される複数の記憶制御装置と、各記憶制御装置を管理するための管理装置とが通信可能に接続されているストレージシステムであって、複数の記憶制御装置には、第1記憶制御装置と第2記憶制御装置及び第3記憶制御装置が含まれており、第1記憶制御装置の有する第1ボリュームと第2記憶制御装置の有する第2ボリュームとをペアとして設定することにより、一つの仮想ボリュームを生成してホストコンピュータに提供させる仮想ボリューム設定部と、第3記憶制御装置の有する第3ボリュームを、仮想ボリュームの使用を制御するための使用制御情報を記憶させる制御用ボリュームとして設定する、制御用ボリューム設定部と、を備えており、第3ボリュームに記憶される使用制御情報には、第1記憶制御装置及び第2記憶制御装置をそれぞれ特定するための識別情報が含まれている。
第2観点では、ホストコンピュータと第1記憶制御装置及び第2記憶制御装置とは、第1通信経路を介して接続されており、第1記憶制御装置と第2記憶制御装置とは第2通信経路を介して接続されており、第3記憶制御装置は、第3通信経路を介して第1記憶制御装置及び第2記憶制御装置に接続されており、管理装置は、ホストコンピュータと第1記憶制御装置と第2記憶制御装置及び第3記憶制御装置とに第4通信経路を介して接続されており、第1記憶制御装置は、第1管理部と、第1ボリューム及び仮想的に形成される第4ボリュームを備えており、第2記憶制御装置は、第2管理部と、第2ボリューム及び仮想的に形成される第5ボリュームを備えており、管理装置は、(1)第1管理部及び第2管理部に所定の指示を与えることにより、仮想ボリュームを生成してホストコンピュータに提供させる、仮想ボリューム設定部と、(2)第1管理部及び第2管理部に他の所定の指示を与えることにより、第3ボリュームを制御用ボリュームとして設定させる、制御用ボリューム設定部と、(3)第1管理部及び第2管理部にさらに別の指示を与えることにより、第4ボリューム及び第5ボリュームを第3ボリュームにそれぞれ対応付ける、対応付け設定部と、を備えており、使用制御情報は、第3ボリュームを特定するための第3ボリューム識別情報と、第1記憶制御装置を特定するための第1識別情報と、第2記憶制御装置を特定するための第2識別情報と、第1記憶制御装置が第3ボリュームを使用しているか否かを示す第1使用情報と、第2記憶制御装置が第3ボリュームを使用しているか否かを示す第2使用情報と、ペアの解消後に第1ボリュームに差分データが生じていることを示す第1差分発生情報と、ペアの解消後に第2ボリュームに差分データが生じていることを示す第2差分発生情報と、を含み、第1識別情報と、第1使用情報と、第1差分発生情報とは、第1記憶制御装置のみが更新可能であり、第2識別情報と、第2使用情報と、第2差分発生情報とは、第2記憶制御装置のみが更新可能であり、第3ボリュームは、使用制御情報に対応付けられている第1記憶制御装置及び第2記憶制御装置のみが使用でき、使用制御情報に含まれている識別情報以外の他の識別情報を有する他の記憶制御装置は、第3ボリュームを使用できないようになっている。
第3観点では、第1観点において、第1記憶制御装置内に設けられる仮想的な第4ボリュームを第3ボリュームに対応付け、かつ、第2記憶制御装置内に設けられる仮想的な第5ボリュームを第3ボリュームに対応付ける、対応付け設定部をさらに備え、第1記憶制御装置は第4ボリュームを介して第3ボリュームを使用し、第2記憶制御装置は第5ボリュームを介して第3ボリュームを使用する。
第4観点では、第3観点において、第3ボリュームは、第1記憶制御装置及び第2記憶制御装置のみが使用でき、使用制御情報に含まれている識別情報以外の他の識別情報を有する他の記憶制御装置は、第3ボリュームを使用できないようになっている。
第5観点では、第1観点において、仮想ボリューム設定部と制御用ボリューム設定部とは、管理装置に設けられている。
第6観点では、第3観点において、仮想ボリューム設定部と制御用ボリューム設定部及び対応付け設定部とは、管理装置に設けられている。
第7観点では、第1観点において、使用制御情報は、第1記憶制御装置のみが更新可能な領域と第2記憶制御装置のみが更新可能な領域とが含まれる。
第8観点では、第1観点において、使用制御情報は、第3ボリュームを特定するための第3ボリューム識別情報と、第1記憶制御装置を特定するための第1識別情報と、第2記憶制御装置を特定するための第2識別情報と、第1記憶制御装置が第3ボリュームを使用しているか否かを示す第1使用情報と、第2記憶制御装置が第3ボリュームを使用しているか否かを示す第2使用情報と、ペアの解消後に第1ボリュームに差分データが生じていることを示す第1差分発生情報と、ペアの解消後に第2ボリュームに差分データが生じていることを示す第2差分発生情報と、を含んでいる。
第9観点では、第8観点において、第1識別情報と、第1使用情報と、第1差分発生情報とは、第1記憶制御装置のみが更新可能であり、第2識別情報と、第2使用情報と、第2差分発生情報とは、第2記憶制御装置のみが更新可能である。
第10観点では、第1観点において、使用制御情報を更新する場合には、更新後に、第3ボリュームから使用制御情報を読み出して正しく更新されたか否かを確認するようになっている。
第11観点では、第1観点において、第1記憶制御装置は、使用制御情報に対応する第1管理テーブルを有しており、第2記憶制御装置は、使用制御情報に対応する第2管理テーブルを有しており、第1管理テーブル及び第2管理テーブルは、使用制御情報の更新に対応して更新される。
第12観点では、第1観点において、仮想ボリューム設定部は、第1ボリュームと第2ボリュームとの間に差分が発生した場合に、所定の契機に基づいて、差分が解消するように第1ボリュームの記憶内容と第2ボリュームの記憶内容とを再同期させる。
第13観点では、第1観点において、仮想ボリュームに関するペアを削除する場合、仮想ボリューム設定部がペアを削除した後で、制御用ボリューム設定部は、仮想ボリュームに関する使用制御情報を削除させる。
本発明の第14観点に従うストレージシステムの制御方法は、ホストコンピュータと、そのホストコンピュータにより利用される複数の記憶制御装置と、各記憶制御装置を管理するための管理装置とが通信可能に接続されているストレージシステムを制御するための制御方法であって、複数の記憶制御装置には、第1記憶制御装置と第2記憶制御装置及び第3記憶制御装置が含まれており、第1記憶制御装置の有する第1ボリュームと第2記憶制御装置の有する第2ボリュームとをペアとして設定することにより、一つの仮想ボリュームを生成してホストコンピュータに提供させるステップと、第3記憶制御装置の有する第3ボリュームを、仮想ボリュームの使用を制御するための使用制御情報を記憶させる制御用ボリュームとして設定するステップと、第3ボリュームに記憶される使用制御情報に、第1記憶制御装置及び第2記憶制御装置をそれぞれ特定するための識別情報を含ませるステップと、を備え、各ステップは、管理装置から第1記憶制御装置及び第2記憶制御装置に送られる指示に基づいて実行される。
本発明の手段、機能、ステップの全部または一部は、コンピュータシステムにより実行されるコンピュータプログラムとして構成可能な場合がある。本発明の構成の全部または一部がコンピュータプログラムから構成された場合、このコンピュータプログラムは、例えば、各種記憶媒体に固定して配布等することができ、あるいは、通信ネットワークを介して送信することもできる。
さらに、本発明の観点は明示された以外に種々組み合わせることも可能であり、そのような組合せは本発明の範囲に含まれる。
本発明の実施形態を示す概念図である。 本発明の実施例に係るストレージシステムのハードウェア構成図である。 ホスト及び管理サーバのソフトウェア構成を模式的に示す説明図である。 ストレージ装置の記憶階層構造を示す説明図である。 仮想ボリュームの構成例を示す説明図である。 ロックディスクを管理するテーブルを示す説明図である。 ロック情報ビットマップの構成を模式的に示す説明図である。 使用制御情報の構成を示す説明図である。 仮想ボリュームを構成するリモートコピーペアを管理するためのテーブルを示す説明図である。 論理ボリュームを管理するテーブルを示す説明図である。 外部ボリュームを管理するテーブルを示す説明図である。 ロックディスク管理画面の説明図である。 第1ストレージ装置により実行される、ロックディスクを作成する処理を示すフローチャートである。 第2ストレージ装置により実行される、ロックディスクを作成する処理を示すフローチャートである。 ロックディスク作成時のロックディスク管理画面を示す説明図である。 ロックディスク作成時のロックディスク管理テーブルを示す説明図である。 リモートコピー管理画面の説明図である。 リモートコピーペアに関するメニューの内容を示す説明図である。 リモートコピーペアを作成するための画面を示す説明図である。 リモートコピーペアに基づく仮想ボリュームを作成させるための処理を示すフローチャートである。 仮想ボリューム作成時のリモートコピー管理画面の説明図である。 仮想ボリューム作成時のペア管理テーブルT20を示す説明図である。 ロックディスクを複数作成する場合のロックディスク管理画面を示す説明図である。 一つのロックディスクに複数の仮想ボリュームを対応付ける場合のリモートコピー管理画面を示す説明図である。 複数のロックディスクを作成する場合の、ロックディスク管理テーブルを示す説明図である。 ペア管理テーブルを示す説明図である。 ロックディスクを更新する場合の処理を示すフローチャートである。 第1ストレージ装置の正ボリュームからデータを読み出す場合のリード処理を示すフローチャートである。 第2ストレージ装置の副ボリュームからデータを読み出す場合のリード処理を示すフローチャートである。 第1ストレージ装置の正ボリュームにデータを書き込む場合のライト処理を示すフローチャートである。 第2ストレージ装置の副ボリュームにデータを書き込む場合のライト処理を示すフローチャートである。 第2ストレージ装置の副ボリュームにデータを書き込む処理が失敗する場合を示すフローチャートである。 仮想ボリュームの削除を行う場合の処理を示すフローチャートである。 ロックディスクの削除を行う場合の処理を示すフローチャートである。 ロックディスクの削除に問題が生じる場合を示すフローチャートである。 リザーブコマンドを用いてロックディスクを削除する処理のフローチャートである。 ロックディスクの削除と仮想ボリュームの削除とを連動して実行する処理を示すフローチャートである。 サスペンド状態に移行する場合の処理を示すフローチャートである。 リシンク処理を示すフローチャートである。 スワップサスペンド状態に移行する場合の処理を示すフローチャートである。 リバースリシンク処理を示すフローチャートである。 自動的リバースリシンク処理を示すフローチャートである。
1,2,3:ストレージ装置
1A,2A:論理ボリューム
1B,2B:論理ボリューム
3A:ロックディスク
4:管理サーバ
4A:仮想ボリューム設定部
4B:ロックディスク設定部
4C:外部接続設定部
5:ホスト
6:仮想ボリューム
10,20,30:ストレージ装置
70:ホスト
80:管理サーバ
100:コントローラ
140:共有メモリ
160:サービスプロセッサ
231:仮想ボリューム
232:ロックディスク
L10:使用制御情報。
図1は、本発明の実施形態の全体概要を示す構成説明図である。本実施形態では、後述のように、それぞれ異なるストレージ装置1,2内の論理ボリューム1A,2Aによって一つの仮想ボリューム6を形成する構成と、仮想的に形成される論理ボリューム1B,2Bを別のストレージ装置3内の論理ボリューム3Aに接続させる構成と、論理ボリューム3Aを、仮想ボリューム6の使用を制御するための情報を記憶するロックディスクとして使用する構成とが、開示されている。
ストレージシステムは、別々のストレージ装置1,2内に存在する論理ボリューム1A,2Aを仮想化して仮想ボリューム6を生成し、この仮想ボリューム6をホスト5に提供する。各論理ボリューム1A,2Aには、同一のデバイス識別情報(LUN:Logical Unit Number)が設定されているため、ホスト5からは区別がつかない。正確には、副ボリューム2Aには、正ボリューム1Aのデバイス識別情報が設定されている。
論理ボリューム1A,2Aはリモートコピーのペアを形成しており、例えば、論理ボリューム1Aが正ボリュームに、論理ボリューム2Aが副ボリュームに、なっている。正ボリューム1Aに書き込まれたデータは、副ボリューム2Aに転送されて書き込まれる。正ボリューム1Aまたは副ボリューム2Aのいずれか一つに障害が発生した場合でも、正常なボリュームを用いてデータ入出力を行うことができる。
ロックディスク3Aには、正ボリューム1Aと副ボリューム2Aとのどちらに差分が発生したか等を示す情報が記憶されている。各ストレージ装置1,2は、ロックディスク3Aを共有しており、ロックディスク3Aに記憶された情報(使用制御情報)に基づいて、仮想ボリューム6を運用する。
従って、本実施形態では、ロックディスク3Aを用いることにより、障害発生時等に、ホスト5が古いデータにアクセスするのを防止する。さらに、本実施形態では、管理サーバ4からの操作によって、仮想ボリューム6の設定及びロックディスク3Aの設定等を行うことができるようになっている。
図1に示すストレージシステムを説明する。ストレージシステムは、例えば、「記憶制御装置」としてのストレージ装置1,2,3と、「管理装置」としての管理サーバ4と、「ホストコンピュータ」としてのホスト5とを備えて構成される。
先に接続構成について説明する。第1ストレージ装置1及び第2ストレージ装置2は、「第1通信経路」としての第1通信ネットワークCN1を介して、ホスト5に接続されている。さらに、第1ストレージ装置1と第2ストレージ装置2とは、第2通信経路CN2を介して接続されている。
第1ストレージ装置1と第2ストレージ装置2とは、「第3通信経路」としての第3通信ネットワークCN3を介して、第3ストレージ装置3に接続されている。管理サーバ4は、「第4通信経路」としての第4通信ネットワークCN4を介して、各ストレージ装置1〜3及びホスト5と接続されている。
例えば、通信ネットワークCN1,CN3は、FC_SAN(Fibre Channel_Storage Area Network)、または、IP_SAN(Internet Protocol_SAN)等を用いて構成することができる。第4通信ネットワークCN4は、例えば、LAN(Local Area Network)、または、WAN(Wide Area Network)等を用いて構成可能である。第2通信経路CN2は、例えば、各ストレージ装置1,2間を直接結ぶファイバケーブルまたはメタルケーブルとFCプロトコルとから構成可能である。なお、以上は例示であって、本発明は、上記の接続構成に限定されない。また、有線接続に限らず、無線によってデータ通信可能に接続する構成でもよい。
各ストレージ装置1〜3は、それぞれ物理的に異なる装置として構成されており、論理ボリューム1A〜3Aをそれぞれ備えている。各ストレージ装置1〜3は、複数の記憶装置を備えることができ、これら記憶装置の有する物理的記憶領域上に、論理デバイスとしての論理ボリュームが形成される。論理ボリューム1A〜3Aは、例えば、RAID5やRAID6のような冗長化された物理的記憶領域上に設けることができる。なお、以下の説明では、「論理ボリューム」を「ボリューム」と略記する場合がある。図中では、論理デバイスとしての論理ボリュームを「LDEV」と表示している。
記憶装置としては、例えば、ハードディスクデバイス、半導体メモリデバイス、光ディスクデバイス、光磁気ディスクデバイス、磁気テープデバイス、フレキシブルディスクデバイス等のデータを読み書き可能な種々のデバイスを利用可能である。
記憶装置としてハードディスクデバイスを用いる場合、例えば、FC(Fibre Channel)ディスク、SCSI(Small Computer System Interface)ディスク、SATAディスク、ATA(AT Attachment)ディスク、SAS(Serial Attached SCSI)ディスク等を用いることができる。
記憶装置として半導体メモリデバイスを用いる場合、例えば、フラッシュメモリ、FeRAM(Ferroelectric Random Access Memory)、MRAM(Magnetoresistive Random Access Memory)、相変化メモリ(Ovonic Unified Memory)、RRAM(Resistance RAM)等の種々のメモリデバイスを利用可能である。なお、記憶装置の種類は、上記のものに限定されず、将来製品化される他の種類の記憶装置を利用できるであろう。
図1では、各ストレージ装置1〜3が、それぞれ実論理ボリューム1A〜3Aを有する場合を示している。実論理ボリュームとは、記憶装置の物理的記憶領域に直接的に対応付けられているボリュームである。第1ストレージ装置1及び第2ストレージ装置2は、外部の第3ストレージ装置3が有する論理ボリューム3Aを取り込んで、使用することもできる。外部のストレージ装置3が有する論理ボリューム3Aを自装置内に取り込み、それがあたかも自分自身の実論理ボリュームであるかのようにして使用する技術は、特開2005−107645号公報に記載されている。この公報に記載の技術を、本実施形態において援用することができる。
従って、第1ストレージ装置1及び第2ストレージ装置2は、ハードディスクドライブ等の記憶装置を備えない構成でもよい。この場合、各ストレージ装置1,2は、例えば、スイッチ装置や仮想化装置のようなコンピュータ装置として構成可能である。
管理サーバ4は、各ストレージ装置1〜3の構成を管理したり、ホスト5に指示を与えるための装置である。管理サーバ4は、ストレージシステムを管理するための基本的機能に加えて、仮想ボリューム設定部4Aと、「制御用ボリューム設定部」としてのロックディスク設定部4Bと、「対応付け設定部」としての外部接続設定部4Cを備える。
仮想ボリューム設定部4Aは、それぞれ異なるストレージ装置1,2内に存在する別々の論理ボリューム1A,2Aを、一つの仮想ボリューム6に仮想化してホスト5に提供させるための機能である。その仮想ボリューム6を、例えば、リモートコピーペア型仮想ボリュームと呼ぶこともできる。
ロックディスク設定部4Bは、第3ストレージ装置3内の論理ボリューム3Aをロックディスクとして使用するための設定を行う機能である。以下、便宜上、論理ボリューム3Aをロックディスク3Aと呼ぶ場合がある。ロックディスク3Aには、仮想ボリューム6を使用するために参照される使用制御情報が記憶される。
使用制御情報には、図8で後述するように、例えば、ロックディスク3Aを特定するための識別情報と、第1ストレージ装置1を特定するための識別情報と、第2ストレージ装置2を特定するための識別情報と、第1ストレージ装置1がロックディスク3Aを使用しているか否かを示す情報と、第2ストレージ装置2がロックディスク3Aを使用しているか否かを示す使用情報と、リモートコピーペアの解消後に第1ボリューム1Aに差分データが生じていることを示す情報と、リモートコピーペアの解消後に第2ボリューム2Aに差分データが生じていることを示す情報と、が含まれている。
外部接続設定部4Cは、第1ストレージ装置1内のボリューム1Bと第3ストレージ装置3内のロックディスク3Aとを対応付け、さらに、第2ストレージ装置2内のボリューム2Bと第3ストレージ装置3内のロックディスク3Aとを対応付ける。第1ストレージ装置1は、自装置内のボリューム1Bを介して、ロックディスク3Aにアクセスする。同様に、第2ストレージ装置2は、自装置内のボリューム2Bを介して、ロックディスク3Aにアクセスする。ボリューム1Bに関するコマンドは、外部のロックディスク3Aへのコマンドに変換されて、第1ストレージ装置1から第3ストレージ装置3に転送される。同様に、ボリューム2Bへのコマンドは、外部のロックディスク3Aへのコマンドに変換されて、第2ストレージ装置2から第3ストレージ装置3に転送される。
ホスト5は、例えば、メインフレームコンピュータ、サーバコンピュータ、エンジニアリングワークステーション、パーソナルコンピュータ等のコンピュータ装置として構成される。ホスト5がメインフレームコンピュータである場合、例えば、FICON(Fibre Connection:登録商標)、ESCON(Enterprise System Connection:登録商標)、ACONARC(Advanced Connection Architecture:登録商標)、FIBARC(Fibre Connection Architecture:登録商標)のような通信プロトコルが用いられる。ホスト5がサーバコンピュータやパーソナルコンピュータ等である場合、例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)、FCP(Fibre Channel Protocol)、iSCSI(internet Small Computer System Interface)のような通信プロトコルが用いられる。
ホスト5は、例えば、アプリケーションプログラム(以下、「アプリケーション」と略記する場合がある)5Aと、パス制御部5Bと、通信部5Cとを備えている。なお、各ストレージ装置1〜3,管理サーバ4,ホスト5のハードウェア構成については、後述の実施例で説明する。アプリケーションプログラム5Aは、例えば、電子メール管理ソフトウェア、顧客管理ソフトウェア、文書作成ソフトウェア等の各種業務を遂行するための一つまたは複数のソフトウェア製品である。
パス制御部5Bは、ホスト5が使用するアクセスパス(以下、「パス」と略記する場合がある)を切り替えて使用するソフトウェアである。ホスト5は、一方のパスP1を介して第1ストレージ装置1の論理ボリューム1Aに接続されている。ホスト5は、他方のパスP2を介して第2ストレージ装置2の論理ボリューム2Aに接続されている。
通常の場合、一方のパスP1がアクティブパスとなり、他方のパスP2がパッシブパスとなる。パス制御部5Bは、アクティブパスP1を用いて仮想ボリューム6にアクセスできない場合、パッシブパスP2に切り替えて仮想ボリューム6にアクセスする。
ホスト5は、例えば、Inquiryコマンドのような問合せコマンドを各ストレージ装置1,2に送信することにより、各ストレージ装置1,2内に設けられている各論理ボリューム1A,2Aの識別子、装置番号、LU番号、パス情報等を得ることができる。パス制御部5Bは、同一の識別子を有するパスが複数検出された場合、その複数のパスを交替パスとして認識する。
つまり、同一の仮想ボリューム6へアクセスするためのパスが複数検出された場合、一方のパスP1を通常時に使用するアクティブパス(プライマリパスとも呼ぶ)として認識し、他方のパスP2を異常時に使用するパッシブパス(セカンダリパスとも呼ぶ)として認識する。
仮想ボリューム6は、それぞれ異なるストレージ装置1,2内の論理ボリューム1A,2Aを仮想化することにより構成される。仮想ボリューム6は、仮想ボリューム設定部4Aが各ストレージ装置1,2に指示を与えることにより、生成される。仮想ボリューム6を構成する各論理ボリューム1A,2Aは、例えば、構成要素ボリュームと呼ぶことができる。
論理ボリューム1Aは、仮想ボリューム6内の正ボリュームとして設定されており、論理ボリューム2Aは、仮想ボリューム6内の副ボリュームとして設定される。但し、後述の実施例から明らかなように、正ボリュームであるか副ボリュームであるかは、必要に応じて変更される。論理ボリューム1Aにアクセス障害が発生した場合、論理ボリューム2Aの属性が「副ボリューム」から「正ボリューム」に変更される。論理ボリューム2Aの属性を正ボリュームに変更する場合、論理ボリューム2Aに設定されているデバイス識別情報は、そのまま保持される。論理ボリューム2Aのデバイス識別情報を、論理ボリューム1Aのデバイス識別情報とは別の値に変更してしまうと、ホスト5は、別の論理ボリュームとして認識してしまうためである。
正ボリュームは、通常時にホスト5からアクセスされるボリュームであり、副ボリュームは、障害発生時にホスト5からアクセスされるボリュームである。従って、正ボリュームはアクティブボリュームと、副ボリュームはパッシブボリュームと呼び変えることもできる。仮想ボリューム6を構成する正ボリュームと副ボリュームとがコピーペアを形成する場合、正ボリュームをコピー元ボリュームと、副ボリュームをコピー先ボリュームと呼ぶことができる。
仮想ボリューム6には、ストレージシステム内で仮想ボリューム6を一意に特定するための識別子が設定される。図1に示す例では、識別子として「#12」が仮想ボリューム6に設定されている。
仮想ボリューム6に設定される識別子は、例えば、仮想ボリューム6を構成する各論理ボリューム1A,2Aの元の識別子に基づいて生成される。図1に示す例では、一方の論理ボリューム1Aの元の識別子「#1」、他方の論理ボリューム2Aの元の識別子は「#2」である。そこで、仮想ボリューム6には、一方の論理ボリューム1Aの識別子「#1」と他方の論理ボリューム2Aの識別子「#2」とを合体させて得られる識別子「#12」が設定されている。仮想ボリューム6に設定される識別子は、ストレージシステム内に存在する他の各論理ボリュームの識別子と重複しないように生成される。
仮想ボリューム6が設定されると、各ストレージ装置1,2は、仮想ボリューム6を構成する論理ボリューム1A,2Aに、仮想ボリューム6の識別子「#12」と同一の識別子を設定する。つまり、第1ストレージ装置1は、論理ボリューム1Aの識別子として識別子「#12」を設定する。ストレージ装置2も、論理ボリューム2Aの識別子として識別子「#12」を設定する。「#12」を仮想ボリューム6を特定するための仮想識別子と呼ぶことができる。
仮想識別子「#12」は、仮想ボリューム6を構成する各論理ボリューム1A,2Aの元々の識別子「#1」,「#2」に優先して設定される。従って、ホスト5からの問合せに対し、第1ストレージ装置1は論理ボリューム1Aの識別子として仮想識別子「#12」を返し、第2ストレージ装置2も論理ボリューム2Aの識別子として仮想識別子「#12」を返す。これにより、パス制御部5Bは、論理ボリューム1A及び論理ボリューム2Aを、同一のボリューム(仮想ボリューム6)として認識する。
各論理ボリューム1A,2Aに元々設定されている識別子「#1」,「#2」は、各ストレージ装置1,2内で論理ボリューム1A,2Aを管理するために使用される、内部的な識別情報である。これに対し、仮想識別子「#12」は、仮想ボリューム6をホスト5に認識させるための、対外的な識別情報である。
論理ボリューム1AにアクセスするためのパスP1と、論理ボリューム2AにアクセスするためのパスP2とは、仮想ボリューム6にアクセスするためのパスとして、パス制御部5Bに認識される。
本ストレージシステムの動作について説明する。最初に、ユーザは、外部接続設定部4Cを用いて、第3ストレージ装置3内の論理ボリューム3Aと、第1ストレージ装置1内の仮想的な論理ボリューム1B及び第2ストレージ装置2内の仮想的な論理ボリューム2Bとを対応付けておく。
次に、ユーザは、ロックディスク設定部4Bを用いて、第3ストレージ装置3内の論理ボリューム3Aを、仮想ボリューム6の使用を制御するためのロックディスク3Aとして設定する。
さらに、ユーザは、仮想ボリューム設定部4Aを用いて、仮想ボリューム6を構成させる各論理ボリューム1A,2Aをそれぞれ指定し、各論理ボリューム1A,2Aとロックディスク3Aとの対応関係を設定する。
アプリケーションプログラム5Aが、仮想ボリューム6にデータを書き込む場合、パス制御部5Bは、アクティブパスP1を用いて、論理ボリューム1Aにライトコマンドを発行する。
第1ストレージ装置1は、ホスト5から受信したライトデータを論理ボリューム1Aに書き込む。さらに、第1ストレージ装置1は、論理ボリューム1Aと共に仮想ボリューム6を構成する論理ボリューム2Aに、通信経路CN2を介して、そのライトデータを送信する。
第2ストレージ装置2は、第1ストレージ装置1から受信したライトデータを論理ボリューム2Aに書込む。このように、仮想ボリューム6を提供する各ストレージ装置1,2は、それぞれの論理ボリューム1A,2Aにライトデータを書き込む。従って、通常の場合、仮想ボリューム6を構成する各論理ボリューム1A,2Aは、それぞれの記憶内容が一致している。
もしも第2ストレージ装置2に障害が発生したり、あるいは、第1ストレージ装置1と第2ストレージ装置2とを結ぶ通信経路CN2が切断された場合、ストレージシステムは運用を停止せずに、第1ストレージ装置1を用いて、仮想ボリューム6をホスト5に提供する。
ストレージシステムの運用を継続すると、第1ストレージ装置1内の論理ボリューム1Aに新たなデータが蓄積されていき、論理ボリューム2Aの記憶内容と論理ボリューム1Aの記憶内容とに差分が生じる。論理ボリューム1Aに差分が発生した事は、第1ストレージ装置1によって、ロックディスク3A内の使用制御情報に書き込まれる。
例えば、第2ストレージ装置2が障害から復旧した場合、または、第1ストレージ装置1と第2ストレージ装置2とを接続する通信経路CN2とが正常に戻った場合、論理ボリューム1A(正ボリューム)に蓄積された差分データは、論理ボリューム2A(副ボリューム)に転送される。これにより、正ボリューム1Aの記憶内容と副ボリューム2Aの記憶内容とは同期する。
ホスト5が論理ボリューム2Aにアクセスしようとした場合、第2ストレージ装置2は、ロックディスク3A内の使用制御情報を参照する。使用制御情報には、各ボリューム1A,2Aが同期していないこと、及び、論理ボリューム1Aを用いて仮想ボリューム6が運用されていること等が記憶されている。従って、第2ストレージ装置2は、ホスト5からのアクセスに応答せず、エラーを返す。これにより、ホスト5が古いデータにアクセスするのを未然に防止することができる。
上記例とは逆に、第1ストレージ装置1に障害等が発生し、第2ストレージ装置2が論理ボリューム2Aを用いて仮想ボリューム6を運用する場合も同様である。この場合は、論理ボリューム2Aに差分データが蓄積される。使用制御情報には、論理ボリューム2Aに差分データが蓄積されていること、及び、論理ボリューム2Aを用いて仮想ボリューム6が運用されていること等が記憶される。仮想ボリューム6に関する主導権を得ていない第1ストレージ装置1は、ホスト5からのアクセスに対応しない。従って、ホスト5が古いデータ(論理ボリューム1A内のデータ)にアクセスするのを未然に防止できる。
このように構成される本実施形態によれば、以下の効果を奏する。本実施形態では、第1ストレージ装置1及び第2ストレージ装置2とは別の第3ストレージ装置3内にロックディスク3Aを設け、そのロックディスク3A内に、論理ボリューム1Aと論理ボリューム2Aとから構成される仮想ボリューム6の使用を制御するための使用制御情報を格納させる。従って、本実施形態では、各ストレージ装置1,2は、ロックディスク3Aを共有することにより、ストレージ装置1,2間での切替を適切に行うことができ、ホスト5が各ストレージ装置1,2の切替を意識する必要は無い。
本実施形態では、使用制御情報には、第1ストレージ装置1及び第2ストレージ装置2をそれぞれ特定するための識別情報が含まれている。これにより、他のストレージ装置にロックディスク3Aを関連づける等の誤りを未然に防止できる。
本実施形態では、各ストレージ装置1,2内に仮想的に設けられる論理ボリューム1B,2Bにロックディスク3Aを対応付け、論理ボリューム1B,2Bを介してロックディスク3Aを使用する。従って、第1ストレージ装置1,2の有するキャッシュメモリ量や機能を利用して、ロックディスク3Aにアクセスできる。
本実施形態では、管理サーバ4内に、仮想ボリューム設定部4A,ロックディスク設定部4B,外部接続設定部4Cを設ける。従って、ユーザは、管理サーバ4の各設定部4A〜4Cを用いて、例えば、仮想ボリューム6の生成及び削除、ロックディスク3Aの生成及び対応付け、論理ボリューム1B,2Bとロックディスク3Aとの接続等を行うことができ、使い勝手が向上する。
後述の実施例に記載のように、使用制御情報に含まれる各情報のうち、第1ストレージ装置1を識別するための情報と、第1ストレージ装置1がロックディスク3Aを使用していることを示す情報と、論理ボリューム1Aに差分データが発生していることを示す情報とは、第1ストレージ装置1のみが更新可能である。同様に、使用制御情報に含まれる各情報のうち、第2ストレージ装置2を識別するための情報と、第2ストレージ装置2がロックディスク3Aを使用していることを示す情報と、論理ボリューム2Aに差分データが発生していることを示す情報とは、第2ストレージ装置2のみが更新可能である。従って、第1ストレージ装置1が誤って第2ストレージ装置2に関する情報を書き換えたり、その逆に、第2ストレージ装置2が誤って第1ストレージ装置1に関する情報を書き換えたりするのを未然に防止でき、信頼性が向上する。
さらに、後述の実施例で明らかとなるように、使用制御情報を更新する場合には、その更新後に、ロックディスク3Aから使用制御情報を読み出して、正しく更新されたか否かを確認する。従って、それぞれ異なるストレージ装置1,2が一つのロックディスク3Aを共有する場合でも、使用制御情報が適切に更新されることを保証でき、ストレージシステムの信頼性を高めることができる。
さらに、後述の実施例で明らかにされるように、ロックディスクの削除時に、一つの指示で、仮想ボリュームも削除させることができる。これにより、使い勝手を高めることができる。以下、本実施形態を詳細に説明する。
図2は、本実施例によるストレージシステムの全体概要を示す説明図である。先に図1との対応関係について説明すると、図2中のストレージ装置10,20,30は、図1中のストレージ装置1,2,3にそれぞれ対応する。図2中のホスト70は図1中のホスト5に、図2中の管理サーバ80は図1中の管理サーバ4に、それぞれ対応する。
図5に示す仮想ボリューム231は、図1中の仮想ボリューム6に対応する。図5に示すロックディスク232は、図1中のロックディスク3Aに対応する。図4に示す論理ボリューム230は、図1中の論理ボリューム1A,2Aに対応する。第1通信ネットワークCN10は第1通信ネットワークCN1に、第2通信経路CN20は第2通信経路CN2に、第3通信ネットワークCN30は第3通信ネットワークCN3に、第4通信経路CN40は第4通信経路CN4に、対応する。以下、図1で述べた説明と重複する部分は簡単に説明する。
ストレージシステムは、複数のストレージ装置10,20,30と、ホスト70と、管理サーバ80とを備えている。ストレージ装置10,20とホスト70とは、通信ネットワークCN10を介して接続される。ストレージ装置10とストレージ装置20とは、通信経路CN20を介して接続される。管理サーバ80は、通信ネットワークCN40を介して、各ストレージ装置10〜30及びホスト70と接続される。ストレージ装置10,20とストレージ装置30とは、通信経路CN30を介して接続される。
但し、これに限らず、例えば、通信ネットワークCN10とCN30とを同一の通信ネットワークとして構成してもよい。また、管理用ネットワークCN40を廃止し、通信ネットワークCN10を用いて管理用の情報を流通させる構成でもよい。
図2に示す構成は、ストレージ装置10,20が外部接続の接続元となり、ストレージ装置30が外部接続の接続先となっている例を示している。外部接続とは、上述の通り、自装置の外部に存在する論理ボリュームを自装置の内部に取り込む技術である。外部接続の接続元となるストレージ装置10,20は、ストレージ装置30内の論理ボリューム230を利用可能である。従って、ある程度の量のキャッシュメモリを備えているのであれば、ストレージ装置10,20は、実ボリュームを備える必要はない。各ストレージ装置10,20は、スイッチ装置または仮想化専用装置等のように構成できる。
ストレージ装置10〜30の構成を説明する。各ストレージ装置10〜30は、同一構成であってもよい。そこで、ストレージ装置10を例に挙げて説明する。
ストレージ装置10は、例えば、コントローラ100と記憶装置搭載部(以下、HDUとも呼ぶ)200とを備える。コントローラ100は、ストレージ装置10の動作を制御するものである。コントローラ100は、例えば、チャネルアダプタ110(以下、「CHA110」)と、ディスクアダプタ120(以下、「DKA120」)と、キャッシュメモリ130(図中、「CM」)と、共有メモリ140(図中、「SM」)と、接続制御部150(図中、「SW」)と、サービスプロセッサ160(図中、「SVP」)とを備えている。
第1通信制御部と表現可能なCHA110は、ホスト70または他のストレージ装置との間でデータ通信を行うものである。各CHA110は、図4に示すように、通信ポート111(111A及び111Bの総称として符号111を用いる)をそれぞれ少なくとも一つ以上備える。各CHA110は、それぞれCPUやメモリ等を備えたマイクロコンピュータシステムとして構成される。各CHA110は、ホスト70から受信したリードコマンドやライトコマンド等の各種コマンドを解釈して実行する。
なお、通信機能とコマンド解釈及び実行機能とを分ける構成としてもよい。例えば、ホスト70または他のストレージ装置と通信を行うための通信制御基板と、コマンドを解釈して実行するための実行制御基板とを分ける構成でもよい。
各CHA110には、それぞれを識別するためのネットワークアドレス(例えば、IPアドレスやWWN(World Wide Name))が割り当てられている。各CHA110は、それぞれが個別にNAS(Network Attached Storage)として振る舞うこともできる。複数のホスト70が存在する場合、各CHA110は、各ホスト70からの要求をそれぞれ個別に受け付けて処理する。
第2通信制御部と表現可能なDKA120は、HDU200が有するディスクドライブ210との間でデータ授受を行う。各DKA120は、CHA110と同様に、CPUやメモリ等を備えたマイクロコンピュータシステムとして構成される。前記同様に、通信機能とコマンド解釈及び実行機能とを分離する構成でもよい。
各DKA120は、例えば、CHA110がホスト70から受信したデータや、他のストレージ装置からのデータ等を、所定のディスクドライブ210に書込む。また、各DKA120は、所定のディスクドライブ210からデータを読み出し、ホスト70または外部のストレージ装置に送信する。ディスクドライブ210との間でデータ入出力を行う場合、各DKA120は、論理的なアドレスを物理的なアドレスに変換する。
各DKA120は、ディスクドライブ210がRAIDに従って管理されている場合、RAID構成に応じたデータアクセスを行う。例えば、各DKA120は、同一のデータを別々のディスクドライブ群(RAIDグループ)にそれぞれ書き込んだり(RAID1)、あるいは、パリティ計算を実行し、データ及びパリティをディスクドライブ群に分散させて書き込む(RAID5、RAID6等)。
キャッシュメモリ130は、ホスト70または外部のストレージ装置から受信したデータを記憶する。また、キャッシュメモリ130は、ディスクドライブ210から読み出されたデータを記憶する。後述のように、キャッシュメモリ130の記憶空間を利用して、仮想的な中間記憶装置(VDEV)が構築される。
共有メモリ(制御メモリとも呼ばれる場合もある)140には、ストレージ装置10の作動に使用するための各種制御情報等が格納される。また、共有メモリ140には、ワーク領域が設定されるほか、後述する各種テーブル類も格納される。
なお、ディスクドライブ210のいずれか一つあるいは複数を、キャッシュ用のディスクとして使用してもよい。また、キャッシュメモリ130と共有メモリ140とは、それぞれ別々のメモリとして構成することもできるし、同一のメモリの一部の記憶領域をキャッシュ領域として使用し、他の記憶領域を制御領域として使用することもできる。
接続制御部150は、各CHA110,各DKA120,キャッシュメモリ130及び共有メモリ140を相互に接続させる。接続制御部150は、例えば、クロスバスイッチ等として構成可能である。
HDU200は、複数のディスクドライブ210を備えている。ディスクドライブ210としては、例えば、ハードディスクドライブ、フラッシュメモリデバイス、磁気テープドライブ、半導体メモリドライブ、光ディスクドライブ等のような各種記憶装置及びこれらの均等物を用いることができる。
例えば、複数のディスクドライブ210の物理的記憶領域を一つにまとめてRAIDグループ220を構成することができる。このRAIDグループ220の物理的記憶領域には、論理ボリューム230を少なくとも一つ以上設けることができる。
SVP160は、LAN等の内部ネットワークを介して、各CHA110とそれぞれ接続されている。SVP160は、CHA110を介して、共有メモリ140やDKA120とデータ授受を行うことができる。SVP160は、ストレージ装置10内の各種情報を収集し、管理サーバ80に提供する。
他のストレージ装置20,30もストレージ装置10と同様に構成可能である。しかし、ストレージ装置10〜30の構成がそれぞれ異なっていてもよい。例えば、各ストレージ装置10〜30の機種、ベンダ、型式、世代等が異なっていても、本発明を適用することができる。
ホスト70のハードウェア構成を説明する。ホスト70は、例えば、CPU71と、メモリ72と、HBA(Host Bus Adapter)73と、LANインターフェース74及び内蔵ディスク75を備えて構成される。
HBA73は、通信ネットワークCN10を介して、ストレージ装置10,20にアクセスするための通信部であり、図1中の通信部5Cに対応する。LANインターフェース74は、管理用の通信ネットワークCN40を介して、管理サーバ80と通信するための回路である。
管理サーバ80の構成を説明する。管理サーバ80は、ストレージシステムの構成等を管理するためのコンピュータ装置であり、例えば、システム管理者や保守員等のユーザにより操作される。管理サーバ80は、例えば、CPU81と、メモリ82と、ユーザインターフェース83(図中、「UI」)と、LANインターフェース84及び内蔵ディスク85を備えて構成される。LANインターフェース84は、管理用の通信ネットワークCN40を介して、各ストレージ装置10〜30及びホスト70と通信を行う。
ユーザインターフェース83は、ユーザに後述の管理画面を提供し、かつ、ユーザからの入力を受け取るためのものである。ユーザインターフェース83は、例えば、ディスプレイ装置、キーボードスイッチ、ポインティングデバイス等から構成される。なお、例えば、音声入力によって各種の入力を行うことができる構成でもよい。
図3は、ホスト70及び管理サーバ80のソフトウェア構成を示す説明図である。図3(a)に示すように、ホスト70は、例えば、オペレーティングシステム76と、HBAドライバ77と、パス制御ソフトウェア78と、アプリケーションプログラム79とを備えている。
HBAドライバ77は、HBA73を制御するためのソフトウェアである。パス制御ソフトウェア78は、図1中のパス制御部5Bに対応する。パス制御ソフトウェア78は、アプリケーションプログラム79からのアクセス要求に応じて、どのアクセスパスを用いてアクセスすべきかを決定する。パス制御ソフトウェア78は、アクセス先のボリュームに繋がるアクセスパスが複数存在する場合、プライマリに設定されているアクセスパス(アクティブパス)とセカンダリに設定されているパス(パッシブパス)とを切り替えて使用する。
以下の説明では、パス制御ソフトウェア78をパス制御部78と呼ぶ場合がある。アプリケーションプログラム79は、図1中のアプリケーションプログラム5Aに対応するソフトウェアである。
図3(b)に示すように、管理サーバ80は、オペレーティングシステム86と、LANカードドライバ87と、管理プログラム88とを備えている。管理プログラム88は、仮想ボリューム231の設定をストレージ装置に指示する機能と、ロックディスク232の作成等をストレージ装置に指示する機能と、ストレージ装置30の有する実ボリューム230をストレージ装置10,20内の仮想的なボリューム(外部接続ボリューム)として設定するための機能とを備える。管理プログラム88は、図1中の仮想ボリューム設定部4A、ロックディスク設定部4B及び外部接続設定部4Cに対応する。
図4は、ストレージシステムの記憶構造を示す説明図である。図4には、上述した外部接続に関する構成等が示されている。
ストレージ装置10,20の記憶構造は、例えば、物理的記憶階層と論理的記憶階層とに大別できる。物理的記憶階層は、物理的なディスクであるPDEV(Physical Device)210により構成される。PDEVは、ディスクドライブ210に該当する。
論理的記憶階層は、複数の(例えば2種類の)階層から構成可能である。一つの論理的階層は、VDEV(Virtual Device)220、または、VDEV220のように扱われる仮想的なVDEV221のいずか一つから構成可能である。他の一つの論理的階層は、LDEV(Logical Device)230から構成することができる。
VDEV220は、例えば、4個1組(3D+1P)、8個1組(7D+1P)等のような所定数のPDEV210をグループ化して構成される。グループに属する各PDEV210によりそれぞれ提供する記憶領域を集合させて、一つのRAID記憶領域が形成される。このRAID記憶領域がVDEV220となる。
VDEV220が物理的な記憶領域上に構築されるのとは対照的に、VDEV221は、物理的な記憶領域を直接には必要としない仮想的な中間記憶装置である。VDEV221は、物理的な記憶領域に直接関係づけられるものではなく、外部ストレージ装置としての第3ストレージ装置30のLU(Logical Unit)をマッピングするための受け皿となっている。ここでは、接続元であるストレージ装置10,20から見て、接続先のストレージ装置30はストレージ装置10,20の外部に存在するため、外部ストレージ装置30と呼ぶ。
LDEV230は、VDEV220またはVDEV221上に、それぞれ少なくとも一つ以上設けることができる。LDEV230とは、上述の論理ボリューム230のことである。LDEV230は、例えば、VDEV220を所定サイズで分割することにより構成される。
オープン系ホストの場合、LDEV230がLU240にマッピングされることにより、ホスト70は、LDEV230を一つの物理的なディスクとして認識する。オープン系のホストは、LUN(Logical Unit Number )や論理ブロックアドレスを指定することにより、所望のLDEV230にアクセスする。なお、メインフレーム系ホストの場合は、LDEV230を直接認識する。
LU240は、SCSIの論理ユニットとして認識可能なデバイスである。各LU240は、ターゲットポート111Aを介してホスト70に接続される。各LU240には、少なくとも一つ以上のLDEV230をそれぞれ関連付けることができる。なお、一つのLU240に複数のLDEV230を関連付けることにより、LUサイズを仮想的に拡張することもできる。
CMD(Command Device)250は、ホスト70とストレージ装置10,20との間で、コマンドやステータスを受け渡すために使用される専用のLUである。ホスト70からのコマンドは、CMD250に書き込まれる。ストレージ装置10,20は、CMD250に書き込まれたコマンドに応じた処理を実行し、その実行結果をステータスとしてCMD250に書き込む。ホスト70は、CMD250に書き込まれたステータスを読み出して確認し、次に実行すべき処理内容をCMD250に書き込む。このようにして、ホスト70は、CMD250を介して、ストレージ装置10,20に各種の指示を与えることができる。
なお、ホスト70から受信したコマンドを、CMD250に格納せずに、ストレージ装置10,20は、直接的に処理することもできる。また、実体のデバイス(LU)を定義せずに、CMDを仮想的なデバイスとして生成し、ホスト70からのコマンドを受け付けて処理するように構成してもよい。例えば、CHA110は、ホスト70から受信したコマンドを共有メモリ140に書き込み、この共有メモリ140に記憶されたコマンドを、CHA110又はDKA120が処理する。その処理結果は共有メモリ140に書き込まれ、CHA110からホスト70に送信される。
ストレージ装置10,20のイニシエータポート(External Port)111Bには、通信経路CN30を介して、外部ストレージ装置30が接続されている。この通信ポート111Bは、外部接続用の通信ポートである。
外部ストレージ装置30は、複数のPDEV210と、PDEV210の提供する記憶領域上に設定されたVDEV220と、VDEV220上に少なくとも一つ以上設定可能なLDEV230とを備えている。そして、各LDEV230は、LU240にそれぞれ関連付けられている。
外部ストレージ装置30のLU240は、VDEV221にマッピングされている。LDEV230Aは、仮想的なVDEV221に対応付けられている。ストレージ装置10,20は、LDEV230Aを介して、外部ストレージ装置30内の論理ボリューム(ロックディスク)を使用する。
図5は、ストレージシステムの構成を模式的に示す説明図である。図5に示すように、ホスト70とストレージ装置10とは複数の通信パスP11(1),P11(2)で接続されている。ホスト70とストレージ装置20も、複数の通信パスP12(1),P12(2)に接続されている。通常の場合、各通信パスP11(1),P11(2)はアクティブパスであり、各通信パスP12(1),P12(2)はパッシブパスである。パス制御部78は、複数のアクティブパスP11(1),P11(2)のいずれも使用できない場合に、パッシブパスP12(1),P12(2)に切り替える。パス制御部78は、ラウンドロビン方式に基づいて、2つのアクティブパスP11(1),P11(2)を切り替えて使用する。同様に、パス制御部78は、2つのパッシブパスP12(1),P12(2)を切り替えて使用する。
ストレージ装置10内の論理ボリューム230(正ボリューム)とストレージ装置20内の論理ボリューム230(副ボリューム)とにより、一つの仮想ボリューム231が形成される。正ボリュームと副ボリュームとは、リモートコピーペアを形成する。
通常の場合、ホスト70は、ストレージ装置10内の正ボリュームにアクセスする。ホスト70が正ボリュームに記憶されているデータを更新させると、更新データはストレージ装置10からストレージ装置20に送信され、ストレージ装置20内の副ボリュームに反映される。仮想ボリューム231を構成する各論理ボリューム230には、それぞれ同一の識別子が設定されているため、パス制御部78は、各論理ボリューム230の見分けがつかず、同一のデバイスとして認識する。
図6は、ロックディスクを管理するためのテーブルT10を示す。そのロックディスク管理テーブルT10は、各ストレージ装置10,20内の共有メモリ140に記憶されている。
ロックディスク管理テーブルT10は、例えば、ロックディスク識別子C11(以下、識別子をIDと略す場合がある)と、管理フラグC12と、ロックディスクのLDEV番号C13と、自装置の製造番号C14と、相手装置の製造番号C15と、コントロール識別子C16と、ロックディスク情報ビットマップC17とを備えている。
ロックディスクID_C11とは、ロックディスク232をストレージシステム内で一意に識別するための情報である。管理フラグC12は、ロックディスク232の状態等を管理するための情報である。管理フラグC12には、例えば、有効/無効フラグC121と、ロックディスク作成中状態フラグC122と、ロックディスク削除中状態フラグC123とが含まれる。
有効/無効フラグC121は、そのロックディスク232が有効であるか無効であるかを示すためのフラグである。ロックディスク作成中状態フラグC122は、ロックディスク232が作成されている最中であることを示すフラグである。ロックディスク232の作成をストレージ装置に指示してから、ロックディスクの作成完了が報告されるまでの間、ロックディスクの状態は「作成中」に設定される。
ロックディスク削除中状態フラグC123は、ロックディスク232が削除されている最中であることを示すフラグである。ロックディスクの削除を指示してから、ロックディスクの削除完了が報告されるまでの間、そのロックディスクの状態は「削除中」に設定される。
LDEV番号C13は、ロックディスク232として使用される論理ボリューム230の番号を示す。第3ストレージ装置30内の論理ボリューム230が、ロックディスク232として使用される。
自装置の製造番号C14には、そのロックディスク管理テーブルT10がストレージ装置10に記憶されている場合には、ストレージ装置10の製造番号が設定される。これに対し、ストレージ装置20内のロックディスク管理テーブルT10には、自装置の製造番号C14として、ストレージ装置20の製造番号が設定される。
相手装置の製造番号C15には、そのロックディスク管理テーブルT10がストレージ装置10に記憶されている場合には、ストレージ装置20の製造番号が設定される。これに対し、ストレージ装置20内のロックディスク管理テーブルT10の場合、相手装置の製造番号C15にはストレージ装置10の製造番号が設定される。
コントロールID_C16には、ストレージ装置の世代を示す番号が設定される。ストレージシステム内に異なる世代のストレージ装置が混在する場合でも、各ストレージ装置を正確に識別するためにストレージ装置の世代の情報も管理する。コントロールIDと製造番号との組合せにより、各ストレージ装置を一意に特定することができる。
ロック情報ビットマップc17には、そのロックディスク232に対応付けられている仮想ボリューム231のロック情報(つまり、その仮想ボリューム231を構成するリモートコピーペアに関するロック情報)が、ビットマップ形式で設定される。
図7は、ロックディスク情報ビットマップC17を模式的に示す説明図である。ロック情報ビットマップC17では、そのロックディスク232によって管理されている、一つまたは複数の仮想ボリューム(図7中「ペア」と表示)毎に(図7(b))、それぞれ1ビットを割り当てている(図7(a))。
図7(c),(d)に示すように、仮想ボリューム231に関するリモートコピーペアを構成する各ボリューム(正ボリュームと副ボリューム)がペア状態である場合、そのペアに対応するビットには「0」が設定される。
これに対し、障害等によってペアが解除された場合、正ボリュームまたは副ボリュームのいずれか一方がホスト70により更新され、正ボリュームの記憶内容と副ボリュームの記憶内容とが一致しなくなる。そこで、リモートコピーペアが解除された場合、その仮想ボリュームに対応するビットには「1」が設定される。
正ボリュームを用いて仮想ボリューム231の運用を継続する場合、ストレージ装置10内のロックディスク管理テーブルT10において、ロック情報ビットマップC17の対応ビットに「1」が設定される。ストレージ装置20内のロックディスク管理テーブルT10では、ロック情報ビットマップC17内の対応ビットの値は「0」である。
これとは逆に、もしも副ボリュームを用いて仮想ボリューム231の運用が継続される場合、ストレージ装置20内のロックディスク管理テーブルT10において、ロック情報ビットマップC17の対応ビットに「1」が設定される。ストレージ装置10内のロックディスク管理テーブルT10では、ロック情報ビットマップC17内の対応ビットの値は「1」である。
つまり、ロック情報ビットマップC17は、仮想ボリューム231を構成する複数のボリュームのうち、いずれのボリュームを用いて仮想ボリューム231が運用されているかを示す。換言すれば、複数のストレージ装置10,20のうち、いずれのストレージ装置が仮想ボリューム231の運用を担当しているかを示す。
図8は、ロックディスク232に記憶される使用制御情報L10の構成例を示す説明図である。使用制御情報L10は、例えば、管理情報L11と、第1ストレージ装置10の制御情報L12と、第2ストレージ装置20の制御情報L13と、第1ストレージ装置のロック情報ビットマップL14と、第2ストレージ装置20のロック情報ビットマップL15とを備えている。
管理情報L11は、例えば、ロックディスクID_L111と、第1ストレージ装置10の製造番号L112と、第2ストレージ装置20の製造番号L113とを含む。ロックディスクID_L111は、上述の通り、ロックディスク232をストレージシステム内で一意に特定するための識別情報である。
第1ストレージ装置10の制御情報L12は、第1ストレージ装置10がロックディスク232を使用しているか否かを示す情報である。使用中の場合には「1」が設定され、未使用の場合には「0」が設定される。同様に、第2ストレージ装置20の制御情報L13は、第2ストレージ装置20がロックディスク232を使用しているか否かを示す情報である。
第1ストレージ装置10のロック情報ビットマップL14及び第2ストレージ装置20のロック情報ビットマップL15は、上述の通り、そのロックディスク232で管理されている仮想ボリューム231をどちらのストレージ装置が使用しているか否か、換言すれば、正副の両ボリュームのうちいずれの論理ボリュームに差分データが蓄積されているかを示す情報である。
ここで、第1ストレージ装置10は、ロックディスク232にアクセスすることにより、第1ストレージ装置10の製造番号L112と、第1ストレージ装置10の制御情報L12と、第1ストレージ装置10のロック情報ビットマップL14とに、それぞれ値を書き込むことができる。第1ストレージ装置10は、第2ストレージ装置20の製造番号L113と、第2ストレージ装置20の制御情報L13と、第2ストレージ装置20のロック情報ビットマップL15とを書き換えることはできない。
同様に、第2ストレージ装置20も、自分自身に関する項目L113,L13,L15のみ更新できる。なお、ロックディスクID_L111は、ロックディスク232を作成した方のストレージ装置が書き込む。
図9は、ペア管理テーブルT20を示す説明図である。ペア管理テーブルT20は、仮想ボリューム231を構成するリモートコピーペアを管理する。ペア管理テーブルT20は、例えば、正ボリューム(図中、「PVOL」)に関する項目C21と、副ボリューム(図中、「SVOL」)に関する項目C22と、ロックディスクID_C23とを備えている。
正ボリュームに関する項目C21は、例えば、正ボリュームの存在するストレージ装置の製造番号C211と、正ボリュームとして使用されている論理ボリュームのLDEV番号C212と、ペア状態C213とを含む。
同様に、副ボリュームに関する項目C22は、副ボリュームの存在するストレージ装置の製造番号C221と、副ボリュームとして使用されている論理ボリュームのLDEV番号C222と、ペア状態C223とを含む。
ペア状態としては、例えば、「ペア」、「SMPL(シンプレックス)」、「PSUS(サスペンド:PVOLの単独運用)」、「SSWS(スワップサスペンド:SVOLの単独運用)」、「ペアリシンク」、「リバースリシンク」等がある。
「ペア」とは、正ボリュームと副ボリュームとがリモートコピーペアを形成しており、正ボリュームの記憶内容と副ボリュームの記憶内容とが一致している状態である。「SMPL」とは、通常の論理ボリュームであることを示す状態である。「PSUS」とは、正ボリュームがサスペンド状態であり、正ボリューム単独で仮想ボリューム231を運用している状態を示す。「SSWS」とは、副ボリュームに切り替えられて、副ボリューム単独で仮想ボリューム231を運用している状態を示す。「ペアリシンク」とは、正ボリュームの記憶内容と副ボリュームの記憶内容とを再同期させている状態を示す。「リバースリシンク」とは、副ボリュームに蓄積された差分を正ボリュームに書き込んで、正ボリュームと副ボリュームとを同期させる状態を示す。
図10は、各ストレージ装置が論理ボリュームを管理するためのテーブルT30を示す説明図である。各ストレージ装置10,20の共有メモリ140には、LDEV管理テーブルT30がそれぞれ記憶されている。
LDEV管理テーブルT30は、例えば、LDEV番号C31と、ボリューム種別C32と、VDEV番号C33と、開始アドレスC34と、サイズC35とを含む。LDEV番号C31とは、各ストレージ装置内で論理ボリューム230を管理するための識別情報である。
ボリューム種別C32とは、内部ボリュームとして構成されているか外部ボリュームを利用して構成されているかの区別を示す。内部ボリュームとして構成されるボリュームとは、ストレージ装置内の物理的記憶領域を利用している実ボリュームである。外部ボリュームを利用して構成されるボリュームとは、外部ストレージ装置30内のボリューム(外部ボリューム)を利用しているボリューム(外部接続ボリューム)である。
VDEV番号C33とは、そのボリュームの属するVDEVを特定する情報である。開始アドレスC34とは、VDEVの物理的記憶領域のどの部分からボリュームが開始するかを示す。サイズC35とは、ボリュームの記憶容量である。
図11は、外部ボリュームを管理するためのテーブルT40を示す。この外部ボリューム管理テーブルT40は、各ストレージ装置10,20の共有メモリ140にそれぞれ記憶されている。
外部ボリューム管理テーブルT40は、例えば、VDEV番号C41と、接続ポートC42と、外部ストレージ情報C43とを含む。VDEV番号C41とは、VDEVを特定する情報である。接続ポートC42とは、外部ストレージ装置が接続されている通信ポート111Bを特定する情報である。
外部ストレージ情報C43は、外部ストレージ装置30の構成を示す。外部ストレージ情報C43は、例えば、LUN_C44と、ベンダ名C45と、装置名C46と、ボリューム識別子C47とを含む。LUN_C44とは、外部ボリュームに対応付けられているLUNを示す。ベンダ名C45とは、外部ストレージ装置の提供者名を示す。装置名C46とは、外部ストレージ装置を特定するための番号(製造番号)を示す。ボリューム識別子C47とは、外部ストレージ装置30内の外部ボリュームを外部ストレージ装置30が識別するための、識別子である。
図12は、ロックディスク管理画面G10を示す説明図である。管理サーバ80は、SVP160にアクセスして、図12に示すような設定画面を管理サーバ80の表示装置に表示させることができる。
ロックディスク管理画面G10は、例えば、ストレージシステムのツリー構成を示すツリー表示部G11と、LDEVに関する情報を表示するLDEV情報表示部G12と、プレビュー表示部G13とを含む。
ツリー表示部G11は、ストレージシステムの構成を、例えば、ストレージ装置単位(DKC単位)、ストレージ装置内に仮想的に設けられる仮想ストレージ装置単位(LDKC単位)、使用中のロックディスク単位、未使用のロックディスク単位のようなレベルで、表示させる。
LDEV情報表示部G12は、例えば、ロックディスクIDを表示するロックディスクID表示部G121と、ロックディスクとして使用されるLDEV(論理ボリューム230)を特定するためのLDEV特定情報を表示するLDEV特定部G122と、仮想ボリューム231を構成するための、他方のボリュームを有する装置(つまり、相手装置)の製造番号を表示する製造番号表示部G123と、その相手方のストレージ装置の世代を示すコントロールIDを表示するコントロールID表示部G124と、を備えている。
LDEV情報表示部G12において、例えば、マウスポインタを所望の行に合わせて右クリックすると、いわゆるコンテキストメニューM10が出現する。そのメニューM10には、例えば、「ロックディスクの作成」と「ロックディスクの削除」という項目が含まれる。ユーザは、メニューM10を使用することにより、ロックディスク232の作成または削除を行うことができる。
プレビュー表示部G13には、ユーザがLDEV情報表示部G12で設定した値が表示される。その設定値の使用をユーザが希望する場合、ユーザは、「Apply」ボタンB11を操作する。これにより、後述のロックディスク作成処理またはロックディスク削除処理が実行される。
図13,図14は、ロックディスク作成処理を示すフローチャートである。以下に述べる各フローチャートは、いわゆる当業者が理解及び実施可能な程度に、各処理の概要をそれぞれ示しており、実際のコンピュータプログラムとは相違する場合がある。いわゆる当業者であれば、図示されたステップの変更または削除、新たなステップの追加を行うことができるであろう。なお、以下の説明では、第1ストレージ装置10内のSVP160を第1SVPと呼び、第2ストレージ装置20内のSVP160を第2SVPと呼ぶ。
図13は、第1ストレージ装置10によるロックディスク作成処理を示し、図14は、第2ストレージ装置20によるロックディスク作成処理を示す。両方のロックディスク作成処理は同一のため、第1ストレージ装置10によるロックディスク作成処理を中心に説明する。
ユーザは、管理サーバ80を介して第1SVPにアクセスし、そして図12で述べたロックディスク管理画面G10を用いて、第1ストレージ装置10に、ロックディスクの作成を指示する(S10)。
そのロックディスク作成指示には、ロックディスクID(G121)と、LDEV特定情報(G122)と、相手方のストレージ装置の製造番号(G123)及びコントロールID(G124)が含まれている。
第1ストレージ装置10は、第1ストレージ装置10内の共有メモリ140に記憶されているロックディスク管理テーブルT10を参照し、第1SVPから指定されたロックディスクIDが、使用中では無いことを確認する。
そして、第1ストレージ装置10は、第3ストレージ装置30にリードコマンドを発行し、ロックディスク232内の使用制御情報L10を読み出す(S11)。第3ストレージ装置30は、要求された使用制御情報L10を第1ストレージ装置10に送信する(S12)。
第1ストレージ装置10は、使用制御情報L10に基づいて、S10で指定されたロックディスクIDが他のストレージ装置(不図示)で使用されていないことを確認する。第1ストレージ装置10は、S10で指定されたロックディスクIDが未使用の場合、あるいは、そのロックディスクIDは使用中であるが、指定されたロックディスクIDと自装置の製造番号及び相手装置の製造番号とが3つとも一致する場合、のいずれかの場合に、使用制御情報L10を更新するためのライトデータを生成する(S13)。
ライトデータは、例えば、以下のように作成される。第1SVPから指定されたロックディスクIDが未使用の場合、第1ストレージ装置10は、その指定されたロックディスクIDをロックディスクID_L111として、使用する。
指定されたロックディスクIDは既に使用中であるが、指定されたロックディスクIDと、そのロックディスクIDに対応する第1ストレージ装置10の製造番号L112と第2ストレージ装置20の製造番号L113とが、管理情報L11の値に一致する場合、第1ストレージ装置10は、管理情報L11内のロックディスクID_L111の値をそのまま使用する。
さらに、第1ストレージ装置10は、第1ストレージ装置の制御情報L12に使用中であることを示すフラグ(=1)を設定する。さらに、第1ストレージ装置10は、第1ストレージ装置のロック情報ビットマップL14を0で初期化する。
第1ストレージ装置10は、上記のように作成されたライトデータを、ロックディスク232に書き込む(S14)。第3ストレージ装置30は、書込みが完了した旨を第1ストレージ装置10に通知する(S15)。
ここで、ライトデータをロックディスク232に書き込んでいる最中に、図外の他のストレージ装置から第3ストレージ装置30に別のライトコマンドが発行されて、ロックディスク232の内容が書き換えられてしまう可能性がある。そこで、本実施例では、第1ストレージ装置10は、第3ストレージ装置30にリードコマンドを発行し、ロックディスク232の使用制御情報L10を再び読み出す(S16)。第3ストレージ装置30は、リードコマンドに応じて、使用制御情報L10を第1ストレージ装置10に転送する(S17)。
第1ストレージ装置10は、ロックディスク232から取得した使用制御情報L10に基づいて、S14の書込み処理(更新処理)が正常に完了していることを確認する。もしも、S16,S17で再度取得した使用制御情報L10とS14,S15で更新した使用制御情報L10とが不一致の場合、第1ストレージ装置10は、S14以下の処理を再度実行する。
使用制御情報L10が正しく更新されていた場合、第1ストレージ装置10は、その使用制御情報L10に基づいて、共有メモリ140内のロックディスク管理テーブルT10を作成(更新)する(S18)。
第1ストレージ装置10は、ロックディスク管理テーブルT10における、管理フラグC12と、LDEV番号C13と、自装置製造番号C14と、相手装置製造番号C15と、コントロールID_C16と、ロック情報ビットマップC17の、各値をそれぞれ更新させる(S18)。
管理サーバ80は、第1SVPを介して第1ストレージ装置10に、ロックディスクの作成が完了したか否かを定期的に問い合わせている。ロックディスクの作成が完了したことを確認した場合、管理サーバ80は、ロックディスクの作成が完了したことをコンピュータ画面に表示して、ユーザに通知する。
図14は、第2ストレージ装置20によるロックディスク作成処理を示すフローチャートである。この処理は、図13で述べた処理と同様のステップを備えている。図14中のS20〜S28は、図13中のS10〜S18に対応する。従って、重複した説明を割愛する。
図15は、ロックディスクを作成する場合のロックディスク管理画面G10の例を示す説明図である。例えば、ユーザは、ロックディスクID(G121)として「00」を選択し、「00:40:00」で特定される論理ボリュームをロックディスク232として選択し、仮想ボリューム231に関する相手装置の製造番号として「64016」を選択し、コントロールIDとして「6」を選択する。
図16は、ロックディスクの作成後におけるロックディスク管理テーブルT10を示す説明図である。例えば、ロックディスクID_C11には「0x00(=00)」が設定され、有効/無効フラグC12には「有効」が設定され、LDEV番号C13には「0x0040(=00:40:00」が設定され、自装置製造番号C14には「64036」が設定され、相手装置製造番号には「64016」が設定され、コントロールID_C16には「0x0006(=6)」が設定される。ロック情報ビットマップC17には、0の列が設定される。
図17は、リモートコピーを管理するための画面G20を示す説明図である。リモートコピー管理画面G20は、例えば、ツリー表示部G21と、LDEV情報表示部G22と、プレビュー表示部G23とを備える。
ツリー表示部G21は、例えば、ストレージ装置全体、ストレージ装置内の仮想ストレージ装置毎に、あるいは、ポート毎に、LDEV情報を表示させる。
LDEV情報表示部G22は、例えば、LDEV(論理ボリューム)を特定するためのLDEV特定部G221と、そのLDEVのステータスG222と、相手装置の製造番号C223と、コントロールID_G224と、ロックディスクID_G225とを備えている。
プレビュー表示部G23は、例えば、LDEV特定部G231と、ステータスG232と、相手装置の製造番号C233と、コントロールID_G234と、ロックディスクID_G225とを備える。
ユーザが、例えば、LDEV情報表示部G22でマウスを右クリックすると、コンテキストメニューM20が表示される。図18は、メニューM20の構成例を模式的に示す説明図である。
このメニューM20は、例えば、ペア作成M21、ペア削除M22、サスペンドM23、スワップサスペンドM24、リシンクM25及びリバースリシンクM26という複数のサブメニューを備える。
ペア作成M21は、仮想ボリューム231を構成するリモートコピーペアを作成するためのサブメニューである。ペア削除M22は、仮想ボリューム231を構成するリモートコピーペアを削除するためのサブメニューである。サスペンドM23は、リモートコピーペアをサスペンド状態にするためのサブメニューである。スワップサスペンドM24は、リモートコピーペアをサスペンド状態とし、副ボリュームを用いて仮想ボリューム231の運用を継続させるためのサブメニューである。つまり、スワップサスペンドは、正ボリュームから副ボリュームへのフェイルオーバーを指示する。リシンクM25は、正ボリュームに生じた差分を副ボリュームに転送し、両方のボリューム内容を同期させるためのサブメニューである。リバースリシンクM26は、副ボリュームに生じた差分を正ボリュームに転送し、両方のボリューム内容を同期させるためのサブメニューである。
ユーザは、シンプレックス状態の論理ボリュームを2つ選択して、ペア作成M21を指定することにより、仮想ボリューム231を構成するリモートコピーペアを作成することができる。さらに、ユーザは、リモートコピーペアを形成する正ボリュームまたは副ボリュームのいずれかを選択して、ペア削除M22を指定することにより、そのリモートコピーペアを削除させることができる。
ユーザは、プレビュー表示部G23に表示された内容を承認する場合、「Apply」ボタンB21を操作する。取り消す場合は、「Cancel」ボタンを操作する。
図19は、ペア作成M21を操作した場合に管理サーバ80のコンピュータ画面に表示される、ペア作成画面G30を示す。ペア作成画面G30は、例えば、正ボリューム設定部G31A,G31Bと、副ボリューム設定部G32A,G32Bと、ストレージ装置間のパス設定部G33A,G33Bと、正ボリュームのフェンスレベル設定部G34A,G34Bと、ロックディスクID設定部G35A,G35Bとを備える。
正ボリューム設定部G31A,G31Bでは、正ボリュームとして使用する論理ボリュームを特定するための情報と、その論理ボリュームに接続されている通信ポートを特定するための情報とを、設定する。
副ボリューム設定部G32A,G32Bでは、副ボリュームとして使用する論理ボリュームを特定するための情報と、その論理ボリュームに接続されている通信ポートを特定するための情報とを、設定する。
ストレージ装置間のパス設定部G33A,G33Bでは、正ボリュームを有するストレージ装置と副ボリュームを有するストレージ装置との間でリモートコピーを行うための通信経路CN20を設定する。
正ボリュームのフェンスレベル設定部G34A,G34Bでは、フェンスレベルを設定する。フェンスレベルの値としては、「データ」と「Never」とがある。フェンスレベルの値に「データ」が設定されると、障害発生時に、正ボリュームの記憶内容と副ボリュームの記憶内容とが同期していることが保証される。つまり、障害発生時に、仮想ボリューム231へのデータ更新は停止される。これに対し、フェンスレベルの値に「Never」が設定されると、障害発生時でも、正ボリュームまたは副ボリュームのいずれかを用いて、仮想ボリューム231のデータ更新が行われる。仮想ボリューム231を構成するリモートコピーペアにおいて、フェンスレベルの値を「データ」とすると、障害発生時の業務継続という仮想ボリューム231の特徴が失われる。そこで、本実施例では、フェンスレベルの初期値を「Never」に設定する。
ロックディスクID設定部G35A,G35Bでは、仮想ボリューム231の使用を管理するためのロックディスク232のIDを設定する。各設定値を承認する場合、ユーザは「Set」ボタンB31を操作する。取り消す場合、ユーザは「Cancel」ボタンB32を操作する。
図20は、リモートコピーペアを設定するための処理を示すフローチャートである。管理サーバ80は、第1SVPを介して第1ストレージ装置10に、リモートコピーペアに基づく仮想ボリューム231の作成を指示する(S30)。
その作成指示には、G30に含まれる各値(G31B−G35B)が含まれており、第1ストレージ装置10は、それらの各値に基づいてペア管理テーブルT20を作成する(G31)。
第1ストレージ装置10は、装置間通信経路CN20を介して、ペア管理テーブルT20の内容を第2ストレージ装置20に転送する(S32)。第2ストレージ装置20は、第1ストレージ装置10から受け取った情報を、第2ストレージ装置20内のペア管理テーブルT20に登録する(S33)。
第2ストレージ装置20は、ロックディスク管理テーブルT10を参照して、第3ストレージ装置30内のロックディスク232を更新する(S34)。第3ストレージ装置30は、第2ストレージ装置20からの要求に基づいてロックディスク232内の使用制御情報L10を更新し(S35)、更新が完了した旨を第2ストレージ装置20に報告する(S36)。
その更新処理では、上述のように、第2ストレージ装置20は、更新直後の使用制御情報L10をロックディスク232から読み出して検査することにより、更新が正常に完了したか否かを確認する。そして、使用制御情報L10の更新が完了すると、第2ストレージ装置20は、第1ストレージ装置10にロックディスク232の更新が完了した旨を通知する(S37)。
ここで、第2ストレージ装置20は、使用制御情報L10のうち第2ストレージ装置20に関する項目L113,L13,L15のみを更新可能であり、第1ストレージ装置10に関する項目L112,L12,L14を更新させることはできない(ロックディスクID_L111は、第2ストレージ装置20が設定可能である。)。
そこで、次に、第1ストレージ装置10は、使用制御情報L10の未設定項目を設定する(S38)。第3ストレージ装置30は、第1ストレージ装置10からの要求に基づいて、ロックディスク232内の使用制御情報L10を更新し(S39)、更新が完了した旨を第1ストレージ装置10に通知する(S40)。
第1ストレージ装置10は、使用制御情報L10が作成されたことを確認すると、第1SVPを介して管理サーバ80に、リモートコピーペアに基づく仮想ボリューム231が作成された旨を報告する(S41)。
その後、別のタイミングで、リモートコピーペアの初期コピー(形成コピー)が実行される(S42−S44)。第1ストレージ装置10は、第2ストレージ装置20に形成コピーの開始を通知し(S42)、正ボリュームの記憶内容を副ボリュームに転送させる(S43)。第2ストレージ装置20は、正ボリュームの記憶内容を副ボリュームに書込み、書込み完了を第1ストレージ装置10に報告する(S44)。形成コピーが完了することにより、正ボリュームの記憶内容と副ボリュームの記憶内容とが同期する。
図21は、仮想ボリューム231を構成するリモートコピーペアが作成された後の、リモートコピー管理画面G20を示す。図22は、仮想ボリューム231を構成するリモートコピーペアが作成された後の、ペア管理テーブルT20を示す。リモートコピーペアに関するボリュームのステータスは、「シンプレックス」から「ペア」に変化する。
図23〜図26は、一つのロックディスク232に複数の仮想ボリューム231を関連づける場合を示している。まず、図23のロックディスク管理テーブルT10に示すように、例えば、ロックディスクID「00」、「01」の2つのロックディスク232を作成する。
図24のリモートコピー管理画面G20に示すように、一方のロックディスク「00」には、正ボリューム「00:01:00」と、正ボリューム「00:01:01」との2つのリモートコピーペアが関連づけられる。他方のロックディスク「01」には、正ボリューム「00:01:0A」のリモートコピーペアが関連づけられる。
図25に示すロックディスク管理テーブルT10には、複数のロックディスク「00」,「01」が登録される。図26に示すペア管理テーブルT20では、一方のロックディスク「00」に2つのリモートコピーペアが関連づけられ、他方のロックディスク「01」に1つのリモートコピーペアが関連づけられる。
このように本実施例では、1つのロックディスク232に、リモートコピーペアに基づく仮想ボリュームを複数対応付けて管理することができる。
図27は、ロックディスク232の使用制御情報L10を更新するための処理を示すフローチャートである。更新の契機としては、例えば、ロックディスクを作成する場合、ロックディスクを削除する場合、リモートコピーペア(仮想ボリューム。以下同様)を設定する場合、リモートコピーペアを削除する場合、仮想ボリュームにサスペンドを指示する場合、仮想ボリュームにリシンクを指示する場合、仮想ボリュームにスワップサスペンドを指示する場合、仮想ボリュームにリバースリシンクを指示する場合、を挙げることができる。
上記の更新契機が発生すると、管理サーバ80から第1ストレージ装置10に、更新契機に対応する所定の指示が入力される(S50)。第1ストレージ装置10は、ロックディスク232から読み出した使用制御情報L10がキャッシュメモリ130に残っているか否かを確認する。使用制御情報L10がキャッシュメモリ130に記憶されている場合、第1ストレージ装置10は、使用制御情報L10を破棄する。キャッシュメモリ上の使用制御情報L10は、古い情報となっている可能性があるためである。
そして、第1ストレージ装置10は、第3ストレージ装置30に、最新の使用制御情報L10を要求する(S51)。第3ストレージ装置30は、ロックディスク232から読み出した使用制御情報L10を第1ストレージ装置10に転送する(S52)。
第1ストレージ装置10は、前記更新契機に応じたライトデータ(使用制御情報L10を更新するためのデータ)を作成し(S53)、そのライトデータを第3ストレージ装置30に転送する(S54)。これにより、第3ストレージ装置30は、ロックディスク232内の使用制御情報L10を更新し、更新が完了した旨を第1ストレージ装置10に報告する(S55)。
第1ストレージ装置10は、更新が正常に完了したことを確かめるべく、第3ストレージ装置30に使用制御情報L10の転送を再び要求する(S56)。第3ストレージ装置30は、ロックディスク232から読み出した使用制御情報L10を第1ストレージ装置10に転送する(S57)。
第1ストレージ装置10は、使用制御情報L10が正しく更新されたことを確認すると、ロックディスク管理テーブルT10を更新する(S58)。なお、上述の通り、第1ストレージ装置10は、使用制御情報L10のうち第1ストレージ装置10に関する項目のみを更新可能である。従って、第2ストレージ装置20が図27に示す処理を実施することにより、使用制御情報L10の全体が適切に更新される。
図28は、ホスト70が正ボリュームからデータを読み出す場合の処理を示すフローチャートである。ホスト70は、アクティブパスを用いて、第1ストレージ装置10にリードコマンドを発行する(S60)。
第1ストレージ装置10は、仮想ボリューム231を構成する正ボリュームから、要求されたデータを読出し(S61)、そのデータをホスト70に送信する(S62)。そして、第1ストレージ装置10は、リードコマンドの処理が完了した旨をホスト70に通知する(S63)。
図29は、ホスト70が副ボリュームからデータを読み出す場合の処理を示すフローチャートである。まず最初に、ホスト70は、アクティブパスを用いて、第1ストレージ装置10にリードコマンドを発行する(S70)。
もしも、ホスト70と第1ストレージ装置10とを接続するアクティブパスに障害が発生していたり、あるいは、第1ストレージ装置10が停止していた場合、第1ストレージ装置10は、そのリードコマンドを処理することができない(S71)。ホスト70のパス制御部78は、第1ストレージ装置10からのエラー応答によって、あるいは、所定時間内に応答が無かった事実によって、第1ストレージ装置10がリードコマンドを処理できないことを検出する(S72)。
そこで、ホスト70のパス制御部78は、アクティブパスからパッシブパスに切り替えて(S73)、第2ストレージ装置20にリードコマンドを発行する(S74)。
第2ストレージ装置20は、ホスト70からのリードコマンドを受信すると、第3ストレージ装置30に、ロックディスク232内の使用制御情報L10の転送を要求する(S75)。第3ストレージ装置30は、第2ストレージ装置20からの要求に応じて、ロックディスク232から読み出した使用制御情報L10を、第2ストレージ装置10に転送する(S76)。
第2ストレージ装置20は、使用制御情報L10内の第1ストレージ装置のロック情報ビットマップL14を参照し、仮想ボリューム231に対応するビットの値が「1」であるか「0」であるかを判定する(S77)。
仮想ボリューム231に対応するビットの値が「0」の場合は、正ボリュームと副ボリュームとは同期しているため、ホスト70から要求されたデータを副ボリュームから読み出してホスト70に送信する(S78)。そして、第2ストレージ装置20は、リードコマンドの処理が完了した旨をホスト70に通知する(S79)。
これに対し、ロック情報ビットマップL14において、リードコマンドに対応する仮想ボリューム231に関連づけられているビットの値が「1」である場合は、正ボリュームと副ボリュームとは同期しておらず、正ボリュームに最新データが記憶されている場合である。つまり、副ボリュームに記憶されているデータは古い可能性がある。そこで、ホスト70が古いデータを誤って読み出したりしないように、第2ストレージ装置20は、チェック応答を返す(S80)。
図30は、ホスト70が正ボリュームにデータを書き込む場合の処理を示すフローチャートである。ホスト70は、第1ストレージ装置10にライトコマンドを発行する(S90)。第1ストレージ装置10は、ライトコマンドを受領すると、ライトデータを記憶するための領域をキャッシュメモリ上に確保し、ホスト70にライトデータの受信準備が完了した旨を通知する。その通知を受信したホスト70は、アクティブパスを用いて、第1ストレージ装置10にライトデータを送信する(S90)。そのライトデータは、第1ストレージ装置10内のキャッシュメモリ130に記憶される。
第1ストレージ装置10は、自身が正ボリュームを有する正ストレージ装置であることを確認する(S92)。そして、第1ストレージ装置10は、装置間通信経路CN20を介して、副ボリュームを有する第2ストレージ装置20にライトコマンドを発行する(S93)。
第2ストレージ装置20は、ライトデータの受信準備が完了すると、第1ストレージ装置10にライトデータの転送を要求する。その要求を受信した第1ストレージ装置10は、S91で受信したライトデータを第2ストレージ装置20に送信する(S94)。第2ストレージ装置20は、第1ストレージ装置10から受信したライトデータを、第2ストレージ装置20内のキャッシュメモリ130に記憶し、第1ストレージ装置10に処理完了を報告する(S95)。
第1ストレージ装置10は、ホスト70からのライトデータが副ボリュームに書き込まれたことを確認すると、ホスト70にS90で受信したライトコマンドの処理が完了した旨をホスト70に報告する(S96)。
なお、所定のタイミングを見計らって、キャッシュメモリ130に記憶されたライトデータは、対応するディスクドライブ210に書き込まれる。キャッシュメモリ上のデータをディスクドライブに書き込んで保存する処理をデステージ処理と呼ぶ。デステージ処理は、ライトデータの受信直後に行ってもよいし(同期式)、ライトデータの受信とは別のタイミングで行ってもよい(非同期式)。
図31は、ホスト70が副ボリュームにデータを書き込む場合の処理を示すフローチャートである。まず最初に、ホスト70は、正ボリュームを有する第1ストレージ装置10にライトコマンドを発行する(S100)。
しかし、アクティブパスに障害が発生していたり、あるいは、第1ストレージ装置10が停止している場合、第1ストレージ装置10はライトコマンドを処理することができない(S101)。この場合、ホスト70は、第1ストレージ装置10からのエラー応答またはタイムアウトエラーによって、障害発生を検出する(S102)。パス制御部78は、アクティブパスからパッシブパスに切り替える(S103)。
ホスト70は、パッシブパスを用いて、第2ストレージ装置20にライトコマンドを発行する(S104)。第2ストレージ装置20は、ライトデータの受け入れ準備が完了すると、ホスト70に通知する。その通知を受信したホスト70は、ライトデータを第2ストレージ装置20に送信する。第2ストレージ装置20は、ホスト70から受信したライトデータをキャッシュメモリ130に格納する。
第2ストレージ装置20は、ロックディスク232にアクセスして、使用制御情報L10を更新する(S105)。第2ストレージ装置20は、使用制御情報L10内の第2ストレージ装置の制御情報を「1」に設定する。これにより、第2ストレージ装置20がロックディスク232を使用中であることが、設定される。さらに、第2ストレージ装置20は、第2ストレージ装置のロック情報ビットマップL15中、ライトデータが書き込まれた仮想ボリューム231に対応するビットを「1」に設定する。これにより、副ボリュームの記憶内容が最新であると設定される。
S105に示すロックディスク更新処理(使用制御情報L10の更新処理)では、上述の通り、更新直後に使用制御情報L10を読み出すことによって、使用制御情報L10が正しく更新されたことを確認する。「ロックディスク更新」を行う各ステップは、同様の確認作業を行うため、以下は説明を省略する。
第2ストレージ装置20は、第1ストレージ装置10にペア状態の変更を指示する(S106)。正ボリュームの状態は「ペア」から「サスペンド(PSUS)」に変更され、副ボリュームの状態は「ペア」から「スワップサスペンド(SSWS)」に変更される(S106)。
第1ストレージ装置10は、ペア状態の変更を終えると、第2ストレージ装置20に処理完了を通知する(S107)。その通知を受信した第2ストレージ装置20は、ホスト70にライトコマンドの処理が完了した旨を通知する(S108)。
図31では、副ボリュームへの書込みが成功した場合を示す。次に、副ボリュームへの書込みが失敗する場合を、図32のフローチャートを参照して説明する。図32の処理では、正ボリュームが単独で運用されているものとする。まず最初に、正ボリュームへの書込みが正常に行われる(S120−S124)。
ホスト70は、正ボリュームを有する第1ストレージ装置10にライトコマンドを送信し(S120)、受信準備を確認した後でライトデータを送信する(S121)。第1ストレージ装置10は、正ボリュームが単独で運用されていることを確認し(S122)、ロックディスク232内の使用制御情報L10を更新する(S123)。ここでは、例えば、第1ストレージ装置のロック情報ビットマップL14内の、S120のライトコマンドに対応する仮想ボリューム231に関連するビットの値が「1」に設定される。ロックディスクの更新が完了すると、第1ストレージ装置10は、ホスト70にライトコマンドの処理が完了した旨を通知する(S124)。
別のタイミングで、ホスト70は、別のライトコマンドを第1ストレージ装置10に発行する(S130)。S124とS130との間で、アクティブパスに障害が発生したり、あるいは、第1ストレージ装置10が作動を停止したとする。
その場合、第1ストレージ装置10は、ライトコマンドを処理することができない(S131)。ホスト70は、エラー応答等により、第1ストレージ装置10を使用できないことを知る(S132)。そこで、パス制御部78は、アクティブパスからパッシブパスに切り替える(S133)。
ホスト70は、副ボリュームを有する第2ストレージ装置20にライトコマンドを発行する(S134)。第2ストレージ装置20は、副ボリュームの状態が「スワップサスペンド(SSWS)」以外の場合、ロックディスク232内の使用制御情報L10の更新処理を試みる(S135)。
第2ストレージ装置20は、使用制御情報L10に記憶されている第1ストレージ装置のロック情報ビットマップL14によって、第1ストレージ装置10がロックディスクを使用する権利(ロック権)を有していることを知る(S136)。その場合、正ボリュームの記憶内容の方が副ボリュームの記憶内容よりも新しいため、副ボリュームを用いてホスト70からの要求に応答することはできない。従って、第2ストレージ装置20は、ホスト70にチェック応答を送信する(S137)。
図33は、仮想ボリューム231を構成するリモートコピーペアを削除する処理を示すフローチャートである。管理サーバ80は、第1SVPを介して第1ストレージ装置10に、仮想ボリュームを構成するリモートコピーペアの削除を指示する(S140)。
第1ストレージ装置10は、ペア管理テーブルT20を参照し、削除を指示されたリモートコピーペアが存在しているか否か、及び、削除を指示されたリモートコピーペアを削除可能であるか否かを確認する。
例えば、指示されたリモートコピーペアに基づく仮想ボリューム231がホスト70によって使用されている場合、そのリモートコピーペアを削除することはできない。なお、指示されたリモートコピーペアが存在しない場合、または、指示されたリモートコピーペアを削除できない場合のいずれかの場合は、本処理は中断される。
指定されたリモートコピーペアが存在し、かつ、削除可能である場合、第1ストレージ装置10は、リモートコピーペアの削除指示を第2ストレージ装置20に転送する(S141)。その指示を受信した第2ストレージ装置20は、ロックディスク232内の使用制御情報L10を更新する(S142)。第2ストレージ装置は、第2ストレージ装置のロック情報ビットマップL15内の、削除指定されたリモートコピーペア(仮想ボリューム)に対応するビットを「0」に設定する。
さらに、第2ストレージ装置20は、副ボリュームの状態を「ペア」から「シンプレックス」に変更し(S143)、リモートコピーペアに関する情報をペア管理テーブルT20から削除する(S144)。そして、第2ストレージ装置20は、第1ストレージ装置10にリモートコピーペアの削除が完了した旨を通知する(S145)。
その通知を受信した第1ストレージ装置10は、第3ストレージ装置30のロックディスク232にアクセスし、使用制御情報L10を更新する(S146)。第1ストレージ装置10は、第1ストレージ装置のロック情報ビットマップL14内の、削除指定されたリモートコピーペアに対応するビットを「0」に設定する。
さらに、第1ストレージ装置10は、正ボリュームの状態を「ペア」から「シンプレックス」に変更し(S147)、第1ストレージ装置10内のペア管理テーブルT20から、削除指示されたリモートコピーペアに関する情報を削除する(S148)。第1ストレージ装置10は、管理サーバ80に、リモートコピーペアの削除が完了した旨を通知する(S149)。
図34は、ロックディスク232を削除させる処理を示すフローチャートである。本処理では、第1ストレージ装置10から第3ストレージ装置30への指示と、第2ストレージ装置20から第3ストレージ装置30への指示とが競合しない場合を述べる。
管理サーバ80は、第1SVPを介して第1ストレージ装置10に、ロックディスクの削除を指示する(S160)。第1ストレージ装置10は、ペア管理テーブルT20を参照し、削除指示されたロックディスクがいずれかの仮想ボリューム231で使用されているか否かを確認する(S161)。もしも、いずれかの仮想ボリューム231で使用されているロックディスクの場合、本処理は中断される。
ロックディスクが使用されていない場合、第1ストレージ装置10は、キャッシュメモリ130に使用制御情報L10が記憶されているか否かを確認する。もしも、キャッシュメモリ130に使用制御情報L10が既に記憶されている場合、その内容は古くなっている可能性があるため、第1ストレージ装置10は、キャッシュメモリ上の使用制御情報L10を破棄する(S161)。S161では、ペア管理テーブルT20の参照及び古い使用制御情報L10の破棄が実行される。
第1ストレージ装置10は、第3ストレージ装置30に使用制御情報L10の読み出しを要求する(S162)。第3ストレージ装置30は、ロックディスクから使用制御情報L10を読み出して第1ストレージ装置10に送信する(S163)。
第1ストレージ装置10は、使用制御情報L10内の管理情報L11とロックディスク管理テーブルT10の内容とが一致するか否かを確認した後、使用制御情報L10を更新させるためのライトデータを作成する(S164)。
そのライトデータにおいて、第1ストレージ装置10は、第1ストレージ装置の制御情報を「1」から「0」に変更し、第1ストレージ装置10がロックディスクを使用していない状態に戻す。さらに、第1ストレージ装置10は、第1ストレージ装置のロック情報ビットマップL14を0で初期化する。
そして、第1ストレージ装置10は、上記のように作成されたライトデータを第3ストレージ装置30に送信し、ロックディスク232内の使用制御情報L10を更新させる(S165)。第1ストレージ装置10は、削除されたロックディスクに関する情報を、第1ストレージ装置10内のロックディスク管理テーブルT10から消去させる。
続いて、管理サーバ80は、第2SVPを介して、第2ストレージ装置20に、ロックディスクの削除を指示する(S166)。第2ストレージ装置20は、ペア管理テーブルT20を参照し、削除指示されたロックディスクがいずれかの仮想ボリューム231で使用されているか否かを確認する(S167)。さらに、第2ストレージ装置20は、キャッシュメモリ130に使用制御情報L10が記憶されている場合、その使用制御情報L10を破棄する(S167)。
第2ストレージ装置20は、第3ストレージ装置30に使用制御情報L10の読み出しを要求する(S168)。第3ストレージ装置30は、使用制御情報L10を第2ストレージ装置20に送信する(S169)。
第2ストレージ装置20は、以下のように、使用制御情報L10を更新させるためのライトデータを作成する(S170)。そのライトデータでは、管理情報L11が消去される。第1ストレージ装置10はロックディスクを使用していないため、管理情報L11を消去できる。そのライトデータでは、第2ストレージ装置の制御情報は「1」から「0」に変更され、さらに、第2ストレージ装置のロック情報ビットマップL15は0で初期化される。
第2ストレージ装置20は、そのライトデータを第3ストレージ装置30に送信し、使用制御情報L10を更新させる(S171)。これにより、そのロックディスクは削除される。
図35は、ロックディスクの削除について、第1ストレージ装置から第3ストレージ装置30への指示と、第2ストレージ装置20から第3ストレージ装置30への指示とが競合する場合を示す。通信ネットワークの混雑の程度、または、ストレージ装置の応答の遅れ等により、適切な実行順序が得られない場合があり得る。なお、以下の説明では、指示が競合する点を中心に説明し、テーブルの更新内容等の詳細を割愛する。
管理サーバ80は、第1SVPを介して第1ストレージ装置10に、ロックディスクの削除を指示する(S180)。続いて、管理サーバ80は、第2SVPを介して第2ストレージ装置20に、ロックディスクの削除を指示する(S181)。
第1ストレージ装置10は、第3ストレージ装置30に使用制御情報L10の転送を要求する(S182)。第3ストレージ装置30は、第1ストレージ装置10に使用制御情報L10を転送する(S183)。第1ストレージ装置10は、読み出された使用制御情報L10を利用してライトデータを作成する(S188)。
図35に示す例では、第1ストレージ装置10がライトデータを作成して使用制御情報L10を更新させるよりも前に、第2ストレージ装置20が、第3ストレージ装置30から使用制御情報L10を取得し(S184,S185)、ライトデータを作成する(S186)。そして、第2ストレージ装置20は、作成されたライトデータを第3ストレージ装置30に転送し、使用制御情報L10を更新させる(S187)。
第2ストレージ装置20による使用制御情報L10の更新が完了した後で、第1ストレージ装置10は、ライトデータ(S188)を第3ストレージ装置30に送信し、ロックディスク内の使用制御情報L10を更新させる(S189)。
第1ストレージ装置10は、予定通り更新されたか否かを確認するために、ロックディスクから使用制御情報L10を読み出し、ライトデータの内容と比較する。しかし、第2ストレージ装置20による更新処理が先に完了しているため、S182で取得された使用制御情報L10に基づくライトデータと、S189の処理で再度取得された使用制御情報L10とは一致しない(S190)。
そこで、第1ストレージ装置10は、改めてライトデータを作り直し(S188)、その新たなライトデータを用いてロックディスク内の使用制御情報L10を更新させる(S191)。そのライトデータでは、管理情報L11は消去される。
図36は、図35で示した問題をリザーブコマンドの採用によって解消する例を示すフローチャートである。リザーブコマンドとは、処理の実行について予約するためのコマンドである。
管理サーバ80は、第1ストレージ装置10にロックディスクの削除を指示する(S200)。続けて、管理サーバ80は、第2ストレージ装置20にもロックディスクの削除を指示する(S201)。
第1ストレージ装置10は、第3ストレージ装置30にリザーブコマンドを発行する(S202)。第3ストレージ装置30は、リザーブコマンドを受け付けた旨を第1ストレージ装置10に通知する(S203)。これにより、削除対象のロックディスクについて、第1ストレージ装置10以外の他のストレージ装置によるリードアクセス及びライトアクセスが禁止される。
第1ストレージ装置10は、第3ストレージ装置30に使用制御情報L10の転送を要求する(S204)。第3ストレージ装置30は、第1ストレージ装置10に使用制御情報L10を送信する(S205)。
第1ストレージ装置10は、読み出された使用制御情報L10に基づいて、ロックディスクを削除するためのライトデータを作成する(S208)。
第1ストレージ装置10によってロックディスク内の使用制御情報L10が更新されるよりも前に、第2ストレージ装置20が、第3ストレージ装置30にリザーブコマンドを発行したとする(S206)。既に、削除対象のロックディスクについては、第1ストレージ装置10からリザーブコマンドが発行されている(S202)。従って、第3ストレージ装置30は、第2ストレージ装置20にエラーを返す。リザーブコマンドは、リリースコマンドによって明示的に解除される必要がある。
第1ストレージ装置10は、ライトデータ(S208)を第3ストレージ装置30に送信し、ロックディスク内の使用制御情報L10を更新させる(S209)。更新完了後に、第1ストレージ装置10は、第3ストレージ装置30にリリースコマンドを発行する(S210)。第3ストレージ装置30は、リリースコマンドを受信すると、S202で受け付けたリザーブコマンドによるリザーブ状態を解除する(S211)。
その後で、第2ストレージ装置20は、ロックディスク内の使用制御情報L10を更新させる(S202−S205,S208−S210)。これにより、ロックディスクが削除される。
図37は、一回の指示で、ロックディスクの削除及び仮想ボリュームの削除を行う場合の例を示す。管理サーバ80は、第1SVPを介して第1ストレージ装置10に、ロックディスクの削除を指示する(S220)。
第1ストレージ装置10は、ロックディスクの削除指示を受信すると、まず最初に、削除を指示されたロックディスクに関連する全てのリモートコピーペア(仮想ボリューム)の削除を、第2ストレージ装置20に指示する(S221)。
第2ストレージ装置20は、仮想ボリュームを削除するためのライトデータを作成して第3ストレージ装置30に送信し、使用制御情報L10を更新させる(S222)。第2ストレージ装置20は、副ボリュームの状態を「ペア」から「シンプレックス」に変更し、さらに、削除対象の仮想ボリュームに関する情報をペア管理テーブルT20から消去する(S223)。第2ストレージ装置20は、第2ストレージ装置側における仮想ボリュームの削除が完了した旨を、第1ストレージ装置10に報告する(S224)。
第1ストレージ装置10は、第2ストレージ装置20からの通知を受信すると、削除対象のロックディスクに対応付けられている仮想ボリュームを削除するべく、ライトデータを作成して第3ストレージ装置30に送信し、ロックディスク内の使用制御情報L10を更新させる(S225)。第1ストレージ装置10は、正ボリュームの状態を「ペア」から「シンプレックス」に変更し、さらに、削除対象の仮想ボリュームに関する情報をペア管理テーブルT20から消去する(S226)。
続いて、第1ストレージ装置10は、ロックディスクを削除するためのライトデータを作成し、そのライトデータを第3ストレージ装置30に送信し、使用制御情報L10を更新させる(S227)。第1ストレージ装置10は、ロックディスク管理テーブルT10から、削除対象のロックディスクに関する情報を消去する(S228)。そして、第1ストレージ装置10は、ロックディスクの削除が完了した旨をホスト70に通知する(S229)。
図38は、正ボリューム単独で運用する場合を示すフローチャートである。例えば、第2ストレージ装置の保守作業のために、第1ストレージ装置10のみを作動させる必要が生じる。
管理サーバ80は、第1SVPを介して第1ストレージ装置10に、サスペンドを指示する(S240)。第1ストレージ装置10は、ペア管理テーブルT10を参照し、サスペンド可能か否かを判定する。サスペンドできない場合、本処理は中断する。
サスペンド可能な場合、第1ストレージ装置10は、使用制御情報L10を更新させる(S241)。具体的には、第1ストレージ装置のロック情報ビットマップL14において、正ボリュームに関する仮想ボリュームに対応するビットを「1」に設定する。
第1ストレージ装置10は、ロックディスク管理テーブルT10を更新し(S242)、第2ストレージ装置20にサスペンドへの移行を指示する(S243)。第2ストレージ装置20は、その指示を受けて、ペア状態を「PSUS」に変更し(S244)、ステータス変更が完了した旨を第1ストレージ装置10に通知する(S245)。
第1ストレージ装置10は、第2ストレージ装置20からの通知を受信すると、ペア管理テーブルT20に記憶されているペア状態を「PSUS」に変更する(S246)。第1ストレージ装置10は、サスペンドへの移行が完了した旨を管理サーバ80に通知する(S247)。
図39は、正ボリューム単独で運用する状態から通常の状態に戻すためのペアリシンク処理を示すフローチャートである。管理サーバ80は、第1ストレージ装置10に、ペアリシンクを指示する(S250)。第1ストレージ装置10は、ペア管理テーブルT20を参照し、ペアリシンクが可能か否かを判定する。ペアリシンクが不可能な場合、本処理は中断する。
ペアリシンクが可能な場合、第1ストレージ装置10は、ロックディスク内の使用制御情報L10を更新させる(S251)。具体的には、第1ストレージ装置のロック情報ビットマップL14内の、対応するビットの値を「1」から「0」に変更させる。第1ストレージ装置10は、第1ストレージ装置10内のロックディスク管理テーブルT10を更新する(S252)。
そして、第1ストレージ装置10は、第2ストレージ装置20にペアリシンクを指示する(S253)。第2ストレージ装置20は、第2ストレージ装置内のペア管理テーブルT20において、リシンク対象のリモートコピーペアの状態を「ペア」に変更させる(S254)。第2ストレージ装置20は、ペア状態を変更した旨を第1ストレージ装置10に通知する(S255)。
第1ストレージ装置10は、第1ストレージ装置内のペア管理テーブルT20において、リシンク対象のリモートコピーペアの状態を「ペア」に変更させる(S256)。第1ストレージ装置10は、管理サーバ80に、ペアリシンクが完了した旨を報告する(S257)。
その後、ペア状態の変更とは別のタイミングで、正ボリュームの記憶内容と副ボリュームの記憶内容との再同期が行われる。正ボリューム単独で運用されている間に、ホスト70によって更新されたデータの位置は、差分ビットマップで管理されている。差分ビットマップは、正ボリュームの記憶内容と副ボリュームの記憶内容との間で生じた差分を管理するための情報である。
第1ストレージ装置10は、第2ストレージ装置20に、差分コピーの開始を指示する(S260)。第1ストレージ装置10は、差分ビットマップを用いて、第2ストレージ装置20に差分データを転送する(S261)。第2ストレージ装置20は、第1ストレージ装置10から受信した差分データを副ボリュームに書き込む。差分コピーが完了すると、第2ストレージ装置20は、第1ストレージ装置10に差分コピーの完了を通知する(S262)。
図40は、副ボリューム単独で運用する場合の処理を示すフローチャートである。例えば、保守作業等のために、副ボリュームのみを稼働させる場合がある。まず最初に、管理サーバ80は、第2SVPを介して第2ストレージ装置20に、スワップサスペンドへの移行を指示する(S270)。
第2ストレージ装置20は、ペア管理テーブルT20を参照してスワップサスペンドが可能か否かを判定する。スワップサスペンドが可能な場合、第2ストレージ装置20は、第3ストレージ装置30内のロックディスク232にアクセスし、使用制御情報L10を更新させる(S271)。具体的には、第2ストレージ装置20は、第2ストレージ装置のロック情報ビットマップL15内の、スワップサスペンド対象の仮想ボリュームに対応するビットの値を「1」に設定させる。
第2ストレージ装置20は、項目C17についてロックディスク管理テーブルT10を更新し(S272)、さらに、第1ストレージ装置10にスワップサスペンドへの移行を通知する(S273)。
第1ストレージ装置10は、第1ストレージ装置の有するペア管理テーブルT20内の正ボリュームのペア状態を、「PSUS(サスペンド)」に変更し(S274)、状態変更が完了した旨を第2ストレージ装置20に通知する。
第1ストレージ装置10からの通知を受信した第2ストレージ装置20は、第2ストレージ装置の有するペア管理テーブルT20内の副ボリュームのペア状態を、「SSWS(スワップサスペンド)」に変更する(S275)。第2ストレージ装置20は、管理サーバ80にスワップサスペンドへの移行が完了した旨を通知する(S277)。
図41は、副ボリューム単独での運用状態から、通常のリモートコピーペア状態に戻すための処理を示すフローチャートである。
管理サーバ80は、第2ストレージ装置20にリバースリシンクの実行を指示する(S280)。第2ストレージ装置20は、ペア管理テーブルT20を参照し、リバースリシンクが可能か否かを判定する。リバースリシンクが可能な場合、第2ストレージ装置20は、ロックディスク232内の使用制御情報L10を更新させる(S281)。第2ストレージ装置20は、第2ストレージ装置のロック情報ビットマップL15内の、リバースリシンク対象のボリュームに対応するビットの値を「0」に変更させる。
第2ストレージ装置20は、ロックディスク管理テーブルT10を更新し(S282)、第1ストレージ装置10にリバースリシンクの実行を通知する(S283)。第1ストレージ装置10は、ペア管理テーブルT20において、正ボリュームを副ボリュームに変更し、さらに、ペア状態を「PAIR」に変更する(S284)。第1ストレージ装置10は、第2ストレージ装置20に変更完了を通知する(S285)。
第2ストレージ装置20は、ペア管理テーブルT20において、副ボリュームを正ボリュームに変更し、ペア状態を「PAIR」に変更する(S286)。つまり、正ボリュームを副ボリュームに変更し(S284)、かつ、副ボリュームを正ボリュームに変更することにより(S286)、正ボリュームと副ボリュームとを入れ替える。
第2ストレージ装置20は、管理サーバ80に、リバースリシンクの完了を通知する(S287)。そして、別のタイミングで、正ボリューム(以前の副ボリューム)から副ボリューム(以前の正ボリューム)に、差分データのコピーが行われる。
正ストレージ装置となった第2ストレージ装置20は、副ストレージ装置となった第1ストレージ装置10に、差分コピーの実行を通知する(S290)。第2ストレージ装置20は、第1ストレージ装置10に差分データを転送する(S291)。第1ストレージ装置10は、差分データをキャッシュメモリ130に保存した後で、副ボリュームに書き込む。第2ストレージ装置20は、第1ストレージ装置10に差分コピーの完了を通知する(S292)。
図42は、所定の契機が到来した場合に、自動的にリバースリシンクを行うための処理を示すフローチャートである。図41の場合は、ユーザが管理サーバ80から、リバースリシンクの実行を手動で指示している。これに対し、図42に示す処理では、例えば、スワップサスペンドの移行後に、リバースリシンクを自動的に実行する。
ホスト70は、第1ストレージ装置10内の正ボリュームにライトコマンドを発行する(S301)。しかし、障害等により、第1ストレージ装置10はライトコマンドを処理することができず、エラー応答が返される(S302)。
そこで、ホスト70のパス制御部78は、アクティブパスからパッシブパスに切り替えて(S303)、第2ストレージ装置20内の副ボリュームにライトコマンドを発行する(S304)。
第2ストレージ装置20は、ロックディスク内の使用制御情報L10を更新し、スワップサスペンド状態に移行する(S304)。ライトデータは、副ボリュームにのみ書き込まれる。第2ストレージ装置20は、副ボリュームにライトデータを書き込んだ後、ホスト70に処理完了を通知する(不図示)。
スワップサスペンドに移行した後で、第2ストレージ装置20は、リバースリシンクの実行契機が到来したか否かを判定し、実行契機の到来を検出した場合には(S305)、リバースリシンクを実行する(S306−S322)。
リバースリシンクの実行契機としては、例えば、スワップサスペンド状態への移行直後、あるいは、スワップサスペンド状態への移行から所定時間経過後、あるいは、スワップサスペンド状態への移行からハートビート通信の再開後等、を挙げることができる。
第2ストレージ装置20は、第1ストレージ装置10にリバースリシンクの実行を通知する(S306)。この通知を受信した第1ストレージ装置10は、ペア管理テーブルT20において、正ボリュームを副ボリュームに変更し、かつ、ペア状態を「PAIR」に変更する(S307)。
第2ストレージ装置20は、第1ストレージ装置10側の変更完了を確認すると、ペア管理テーブルT20において、副ボリュームを正ボリュームに変更し、かつ、ペア状態を「PAIR」に変更する(S308)。第2ストレージ装置20は、ロックディスク内の使用制御情報L10を更新し、ロック情報ビットマップL15内の対応ビットを「0」に変更させる(S309)。第2ストレージ装置20は、ホスト70に、リバースリシンクが完了した旨を通知する(S310)。
そして、別のタイミングで、第2ストレージ装置20は、第1ストレージ装置10に差分コピーの実行を通知し(S320)、差分データを第1ストレージ装置10に転送する(S321)。第1ストレージ装置10は、差分データをキャッシュメモリ130に格納し、差分コピーが完了した旨を第2ストレージ装置20に報告する(S322)。
本実施例は、上述のように構成されるため、以下の効果を奏する。本実施例では、第1ストレージ装置10及び第2ストレージ装置20とは別の第3ストレージ装置30内にロックディスク232を設け、そのロックディスク232内に、正ボリュームと副ボリュームとから構成される仮想ボリューム231の使用を制御するための使用制御情報L10を格納させる。従って、本実施形態では、各ストレージ装置10,20は、ロックディスク232を共有することにより、ストレージ装置10,20間での切替を適切に行うことができ、ホスト70が各ストレージ装置10,20の切替を意識する必要は無い。
本実施例では、使用制御情報L10の管理情報L11に、ロックディスクID_L111と、第1ストレージ装置10及び第2ストレージ装置20をそれぞれ特定するための識別情報L112,L113とが含まれている。つまり、本実施例では、ロックディスクIDと各ストレージ装置の製造番号との合計3つの情報を対応付けて管理することができ、他のストレージ装置にロックディスク232が関連づけられてしまう等の誤りを未然に防止できる。
本実施例では、各ストレージ装置10,20内に仮想的に設けられる外部接続ボリュームに、外部ボリュームとして構成されるロックディスク232を対応付ける。従って、第3ストレージ装置30の記憶資源を活用することができる。
本実施例では、ユーザは、管理サーバ80から、仮想ボリュームの設定と、ロックディスクの設定と、外部接続の設定とを、ストレージ装置に指示することができる。従って、使い勝手が高まる。
本実施例では、第1ストレージ装置10は、使用制御情報L10のうち第1ストレージ装置に関する情報のみを更新可能であり、第2ストレージ装置20は、使用制御情報L10のうち第2ストレージ装置に関する情報のみを更新可能である。従って、第1ストレージ装置10が誤って第2ストレージ装置20に関する情報を書き換えたり、その逆に、第2ストレージ装置20が誤って第1ストレージ装置10に関する情報を書き換えたりするのを未然に防止でき、信頼性が向上する。
本実施例では、使用制御情報L10を更新する場合、その更新直後に、ロックディスク232から使用制御情報L10を読み出して、正しく更新されたか否かを確認する。従って、それぞれ異なるストレージ装置10,20が一つのロックディスク232を共有する場合でも、使用制御情報L10が適切に更新されることを保証でき、ストレージシステムの信頼性を高めることができる。
本実施例では、ロックディスク232の削除を一回指示するだけで、そのロックディスク232に関連する仮想ボリューム231も削除することができる。従って、ユーザの使い勝手が向上する。
本実施例では、スワップサスペンドへの移行後に、所定の実行契機が検出された場合には、自動的にリバースリシンクを行うこともできる。従って、ユーザの使い勝手を高めることができる。
なお、本発明は、上述した実施例に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。

Claims (14)

  1. ホストコンピュータ(1)と、そのホストコンピュータにより利用される複数の記憶制御装置(1−3)と、前記各記憶制御装置を管理するための管理装置(4)とが通信可能に接続されているストレージシステムであって、
    前記複数の記憶制御装置には、第1記憶制御装置(1)と第2記憶制御装置(2)及び第3記憶制御装置(3)が含まれており、
    前記第1記憶制御装置の有する第1ボリューム(1A)と前記第2記憶制御装置の有する第2ボリューム(2A)とをペアとして設定することにより、一つの仮想ボリューム(6)を生成して前記ホストコンピュータに提供させる仮想ボリューム設定部(4A)と、
    前記第3記憶制御装置の有する第3ボリューム(3A)を、前記仮想ボリュームの使用を制御するための使用制御情報(L10)を記憶させる制御用ボリュームとして設定する、制御用ボリューム設定部(4B)と、
    を備えており、
    前記第3ボリュームに記憶される前記使用制御情報には、前記第1記憶制御装置及び前記第2記憶制御装置をそれぞれ特定するための識別情報(L112,L113)が含まれている、
    ストレージシステム。
  2. 前記ホストコンピュータと前記第1記憶制御装置及び前記第2記憶制御装置とは、第1通信経路(CN1)を介して接続されており、前記第1記憶制御装置と前記第2記憶制御装置とは第2通信経路(CN2)を介して接続されており、前記第3記憶制御装置は、第3通信経路(CN3)を介して前記第1記憶制御装置及び前記第2記憶制御装置に接続されており、管理装置は、前記ホストコンピュータと前記第1記憶制御装置と前記第2記憶制御装置及び前記第3記憶制御装置とに第4通信経路(CN4)を介して接続されており、
    前記第1記憶制御装置は、第1管理部(第1SVP)と、前記第1ボリューム及び仮想的に形成される第4ボリューム(1B)を備えており、
    前記第2記憶制御装置は、第2管理部(第2SVP)と、前記第2ボリューム及び仮想的に形成される第5ボリューム(2B)を備えており、
    前記管理装置は、
    (1)前記第1管理部及び前記第2管理部に所定の指示を与えることにより、前記仮想ボリュームを生成して前記ホストコンピュータに提供させる、前記仮想ボリューム設定部と、
    (2)前記第1管理部及び前記第2管理部に他の所定の指示を与えることにより、前記第3ボリュームを前記制御用ボリュームとして設定させる、前記制御用ボリューム設定部と、
    (3)前記第1管理部及び前記第2管理部にさらに別の指示を与えることにより、前記第4ボリューム及び前記第5ボリュームを前記第3ボリュームにそれぞれ対応付ける、対応付け設定部(4C)と、
    を備えており、
    前記使用制御情報は、前記第3ボリュームを特定するための第3ボリューム識別情報と(L111)、前記第1記憶制御装置を特定するための第1識別情報(L112)と、前記第2記憶制御装置を特定するための第2識別情報(L113)と、前記第1記憶制御装置が前記第3ボリュームを使用しているか否かを示す第1使用情報(L12)と、前記第2記憶制御装置が前記第3ボリュームを使用しているか否かを示す第2使用情報(L13)と、前記ペアの解消後に前記第1ボリュームに差分データが生じていることを示す第1差分発生情報(L14)と、前記ペアの解消後に前記第2ボリュームに差分データが生じていることを示す第2差分発生情報(L15)と、を含み、
    前記第1識別情報と、前記第1使用情報と、前記第1差分発生情報とは、前記第1記憶制御装置のみが更新可能であり、
    前記第2識別情報と、前記第2使用情報と、前記第2差分発生情報とは、前記第2記憶制御装置のみが更新可能であり、
    前記第3ボリュームは、前記使用制御情報に対応付けられている前記第1記憶制御装置及び前記第2記憶制御装置のみが使用でき、前記使用制御情報に含まれている識別情報以外の他の識別情報を有する他の記憶制御装置は、前記第3ボリュームを使用できないようになっている、
    請求項1に記載のストレージシステム。
  3. 前記第1記憶制御装置内に設けられる仮想的な第4ボリュームを前記第3ボリュームに対応付け、かつ、前記第2記憶制御装置内に設けられる仮想的な第5ボリュームを前記第3ボリュームに対応付ける、対応付け設定部をさらに備え、
    前記第1記憶制御装置は前記第4ボリュームを介して前記第3ボリュームを使用し、前記第2記憶制御装置は前記第5ボリュームを介して前記第3ボリュームを使用する、請求項1に記載のストレージシステム。
  4. 前記第3ボリュームは、前記第1記憶制御装置及び前記第2記憶制御装置のみが使用でき、前記使用制御情報に含まれている識別情報以外の他の識別情報を有する他の記憶制御装置は、前記第3ボリュームを使用できないようになっている、請求項3に記載のストレージシステム。
  5. 前記仮想ボリューム設定部と前記制御用ボリューム設定部とは、前記管理装置に設けられている、請求項1に記載のストレージシステム。
  6. 前記仮想ボリューム設定部と前記制御用ボリューム設定部及び前記対応付け設定部とは、前記管理装置に設けられている、請求項3に記載のストレージシステム。
  7. 前記使用制御情報は、前記第1記憶制御装置のみが更新可能な領域と前記第2記憶制御装置のみが更新可能な領域とが含まれている、請求項1に記載のストレージシステム。
  8. 前記使用制御情報は、前記第3ボリュームを特定するための第3ボリューム識別情報と、前記第1記憶制御装置を特定するための第1識別情報と、前記第2記憶制御装置を特定するための第2識別情報と、前記第1記憶制御装置が前記第3ボリュームを使用しているか否かを示す第1使用情報と、前記第2記憶制御装置が前記第3ボリュームを使用しているか否かを示す第2使用情報と、前記ペアの解消後に前記第1ボリュームに差分データが生じていることを示す第1差分発生情報と、前記ペアの解消後に前記第2ボリュームに差分データが生じていることを示す第2差分発生情報と、を含んでいる、請求項1に記載のストレージシステム。
  9. 前記第1識別情報と、前記第1使用情報と、前記第1差分発生情報とは、前記第1記憶制御装置のみが更新可能であり、
    前記第2識別情報と、前記第2使用情報と、前記第2差分発生情報とは、前記第2記憶制御装置のみが更新可能である、請求項8に記載のストレージシステム。
  10. 前記使用制御情報を更新する場合には、更新後に、前記第3ボリュームから前記使用制御情報を読み出して正しく更新されたか否かを確認するようになっている、請求項1に記載のストレージシステム。
  11. 前記第1記憶制御装置は、前記使用制御情報に対応する第1管理テーブルを有しており、前記第2記憶制御装置は、前記使用制御情報に対応する第2管理テーブルを有しており、前記第1管理テーブル及び前記第2管理テーブルは、前記使用制御情報の更新に対応して更新される、請求項1に記載のストレージシステム。
  12. 前記仮想ボリューム設定部は、前記第1ボリュームと前記第2ボリュームとの間に差分が発生した場合に、所定の契機に基づいて、前記差分が解消するように前記第1ボリュームの記憶内容と前記第2ボリュームの記憶内容とを再同期させる、請求項1に記載のストレージシステム。
  13. 前記仮想ボリュームに関する前記ペアを削除する場合、前記仮想ボリューム設定部が前記ペアを削除した後で、前記制御用ボリューム設定部は、前記仮想ボリュームに関する前記使用制御情報を削除させる、請求項1に記載のストレージシステム。
  14. ホストコンピュータと、そのホストコンピュータにより利用される複数の記憶制御装置と、前記各記憶制御装置を管理するための管理装置とが通信可能に接続されているストレージシステムを制御するための制御方法であって、
    前記複数の記憶制御装置には、第1記憶制御装置と第2記憶制御装置及び第3記憶制御装置が含まれており、
    前記第1記憶制御装置の有する第1ボリュームと前記第2記憶制御装置の有する第2ボリュームとをペアとして設定することにより、一つの仮想ボリュームを生成して前記ホストコンピュータに提供させるステップと、
    前記第3記憶制御装置の有する第3ボリュームを、前記仮想ボリュームの使用を制御するための使用制御情報を記憶させる制御用ボリュームとして設定するステップと、
    前記第3ボリュームに記憶される前記使用制御情報に、前記第1記憶制御装置及び前記第2記憶制御装置をそれぞれ特定するための識別情報を含ませるステップと、
    を備え、
    前記各ステップは、前記管理装置から前記第1記憶制御装置及び前記第2記憶制御装置に送られる指示に基づいて実行される、ストレージシステムの制御方法。
JP2011514950A 2009-01-20 2009-01-20 ストレージシステム及びストレージシステムの制御方法 Expired - Fee Related JP5199464B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/000182 WO2010084522A1 (en) 2009-01-20 2009-01-20 Storage system and method for controlling the same

Publications (2)

Publication Number Publication Date
JP2012504793A true JP2012504793A (ja) 2012-02-23
JP5199464B2 JP5199464B2 (ja) 2013-05-15

Family

ID=40897542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011514950A Expired - Fee Related JP5199464B2 (ja) 2009-01-20 2009-01-20 ストレージシステム及びストレージシステムの制御方法

Country Status (3)

Country Link
US (1) US20110066801A1 (ja)
JP (1) JP5199464B2 (ja)
WO (1) WO2010084522A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504790A (ja) * 2009-03-19 2012-02-23 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法
JP2014507691A (ja) * 2011-04-27 2014-03-27 株式会社日立製作所 情報記憶システム及びストレージシステム管理方法
WO2014147794A1 (ja) * 2013-03-21 2014-09-25 株式会社 日立製作所 ストレージ装置およびデータ管理方法
JP2015069342A (ja) * 2013-09-27 2015-04-13 富士通株式会社 ストレージ制御装置、ストレージ制御方法及びストレージ制御プログラム
WO2015198449A1 (ja) * 2014-06-26 2015-12-30 株式会社日立製作所 ストレージシステム
WO2016009504A1 (ja) * 2014-07-16 2016-01-21 株式会社日立製作所 ストレージシステム及び通知制御方法
JP2017151857A (ja) * 2016-02-26 2017-08-31 日本電気株式会社 ストレージ装置の制御装置、ストレージ装置の制御方法、およびストレージ装置の制御プログラム
WO2018016041A1 (ja) * 2016-07-21 2018-01-25 株式会社日立製作所 ストレージシステム

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012127528A1 (en) * 2011-03-23 2012-09-27 Hitachi, Ltd. Storage system and method of controlling the same
WO2013046254A1 (en) 2011-09-27 2013-04-04 Hitachi, Ltd. Management server and data migration method
WO2013118195A1 (en) * 2012-02-10 2013-08-15 Hitachi, Ltd. Storage management method and storage system in virtual volume having data arranged astride storage devices
US9098200B2 (en) 2012-02-10 2015-08-04 Hitachi, Ltd. Storage system with virtual volume having data arranged astride storage devices, and volume management method
WO2014076736A1 (en) 2012-11-15 2014-05-22 Hitachi, Ltd. Storage system and control method for storage system
US9886451B2 (en) * 2013-04-30 2018-02-06 Hitachi, Ltd. Computer system and method to assist analysis of asynchronous remote replication
WO2015136665A1 (ja) * 2014-03-13 2015-09-17 株式会社日立製作所 ストレージシステム、ストレージ制御方法、および計算機システム
US10185636B2 (en) * 2014-08-15 2019-01-22 Hitachi, Ltd. Method and apparatus to virtualize remote copy pair in three data center configuration
US20180101457A1 (en) * 2014-10-29 2018-04-12 International Business Machines Corporation Retrying failed write operations in a dispersed storage network
US10572357B2 (en) * 2017-03-29 2020-02-25 International Business Machines Corporation Switching over from using a first primary storage to using a second primary storage when the first primary storage is in a mirror relationship
CN110096232B (zh) * 2019-04-25 2022-09-09 新华三云计算技术有限公司 磁盘锁的处理方法、存储单元的创建方法及相关装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001063424A1 (fr) * 2000-02-24 2001-08-30 Fujitsu Limited Controleur d'entree/sortie, procede d'identification de dispositif, et procede de commande des entrees/sorties
JP2003131917A (ja) * 2001-10-25 2003-05-09 Hitachi Ltd 記憶装置システム
JP2006134021A (ja) * 2004-11-05 2006-05-25 Hitachi Ltd ストレージシステム及びストレージシステムの構成管理方法
JP2006285336A (ja) * 2005-03-31 2006-10-19 Nec Corp 記憶装置及びストレージシステム並びにその制御方法
JP2007213611A (ja) * 2007-05-01 2007-08-23 Hitachi Ltd ストレージシステムの制御方法、ストレージシステム、及びストレージ装置
JP2008033704A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd リモートコピーを行うストレージシステム
JP2008134987A (ja) * 2006-10-30 2008-06-12 Hitachi Ltd 情報システム及び情報システムのデータ転送方法
JP2008134988A (ja) * 2006-10-30 2008-06-12 Hitachi Ltd 情報システム及びデータ転送方法
JP2008181271A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd 仮想ボリュームに記憶されたデータをバックアップする記憶制御装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7650412B2 (en) * 2001-12-21 2010-01-19 Netapp, Inc. Systems and method of implementing disk ownership in networked storage
US6948089B2 (en) * 2002-01-10 2005-09-20 Hitachi, Ltd. Apparatus and method for multiple generation remote backup and fast restore
JP2005301880A (ja) * 2004-04-15 2005-10-27 Hitachi Ltd 計算機システムにおけるデータ入出力処理方法、ストレージ装置、ホスト計算機、および計算機システム、
US20070022314A1 (en) * 2005-07-22 2007-01-25 Pranoop Erasani Architecture and method for configuring a simplified cluster over a network with fencing and quorum
JP4571576B2 (ja) * 2005-11-24 2010-10-27 株式会社日立製作所 リモートコピー記憶装置システムおよびリモートコピー方法
JP5147570B2 (ja) * 2008-07-02 2013-02-20 株式会社日立製作所 ストレージシステム及びリモートコピー復旧方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001063424A1 (fr) * 2000-02-24 2001-08-30 Fujitsu Limited Controleur d'entree/sortie, procede d'identification de dispositif, et procede de commande des entrees/sorties
JP2003131917A (ja) * 2001-10-25 2003-05-09 Hitachi Ltd 記憶装置システム
JP2006134021A (ja) * 2004-11-05 2006-05-25 Hitachi Ltd ストレージシステム及びストレージシステムの構成管理方法
JP2006285336A (ja) * 2005-03-31 2006-10-19 Nec Corp 記憶装置及びストレージシステム並びにその制御方法
JP2008033704A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd リモートコピーを行うストレージシステム
JP2008134987A (ja) * 2006-10-30 2008-06-12 Hitachi Ltd 情報システム及び情報システムのデータ転送方法
JP2008134988A (ja) * 2006-10-30 2008-06-12 Hitachi Ltd 情報システム及びデータ転送方法
JP2008181271A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd 仮想ボリュームに記憶されたデータをバックアップする記憶制御装置
JP2007213611A (ja) * 2007-05-01 2007-08-23 Hitachi Ltd ストレージシステムの制御方法、ストレージシステム、及びストレージ装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012504790A (ja) * 2009-03-19 2012-02-23 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法
US8275958B2 (en) 2009-03-19 2012-09-25 Hitachi, Ltd. Storage system with remote copy controllers
JP2014507691A (ja) * 2011-04-27 2014-03-27 株式会社日立製作所 情報記憶システム及びストレージシステム管理方法
US9652165B2 (en) 2013-03-21 2017-05-16 Hitachi, Ltd. Storage device and data management method
JP5945065B2 (ja) * 2013-03-21 2016-07-05 株式会社日立製作所 ストレージ装置およびデータ管理方法
WO2014147794A1 (ja) * 2013-03-21 2014-09-25 株式会社 日立製作所 ストレージ装置およびデータ管理方法
JP2015069342A (ja) * 2013-09-27 2015-04-13 富士通株式会社 ストレージ制御装置、ストレージ制御方法及びストレージ制御プログラム
WO2015198449A1 (ja) * 2014-06-26 2015-12-30 株式会社日立製作所 ストレージシステム
US10025655B2 (en) 2014-06-26 2018-07-17 Hitachi, Ltd. Storage system
WO2016009504A1 (ja) * 2014-07-16 2016-01-21 株式会社日立製作所 ストレージシステム及び通知制御方法
JPWO2016009504A1 (ja) * 2014-07-16 2017-04-27 株式会社日立製作所 ストレージシステム及び通知制御方法
US10108363B2 (en) 2014-07-16 2018-10-23 Hitachi, Ltd. Storage system and notification control method
JP2017151857A (ja) * 2016-02-26 2017-08-31 日本電気株式会社 ストレージ装置の制御装置、ストレージ装置の制御方法、およびストレージ装置の制御プログラム
WO2018016041A1 (ja) * 2016-07-21 2018-01-25 株式会社日立製作所 ストレージシステム

Also Published As

Publication number Publication date
WO2010084522A1 (en) 2010-07-29
US20110066801A1 (en) 2011-03-17
JP5199464B2 (ja) 2013-05-15

Similar Documents

Publication Publication Date Title
JP5199464B2 (ja) ストレージシステム及びストレージシステムの制御方法
US8683157B2 (en) Storage system and virtualization method
US9619171B2 (en) Storage system and virtualization method
US7673107B2 (en) Storage system and storage control device
JP5341184B2 (ja) ストレージシステム及びストレージシステムの運用方法
JP5057656B2 (ja) ストレージシステム及びストレージシステムの運用方法
JP4738941B2 (ja) ストレージシステム及びストレージシステムの管理方法
JP4575059B2 (ja) ストレージ装置
JP4648751B2 (ja) 記憶制御システム及び記憶制御方法
JP2006178811A (ja) ストレージシステム及びストレージシステムのパス制御方法
US20100036896A1 (en) Computer System and Method of Managing Backup of Data
JP2009116809A (ja) 記憶制御装置、ストレージシステム及び仮想ボリュームの制御方法
EP2009562A2 (en) File-sharing system and method of using file-sharing system to generate single logical directory structure
JP2007066162A (ja) ストレージシステム及びストレージシステムの管理方法
US7526627B2 (en) Storage system and storage system construction control method
JP2006092120A (ja) ストレージ装置及びストレージ装置のライトアクセス処理方法
JP5052257B2 (ja) 記憶システム及び記憶制御装置
US20060221721A1 (en) Computer system, storage device and computer software and data migration method
JP5272185B2 (ja) 計算機システム及びストレージシステム
JP4604068B2 (ja) ストレージ装置
EP1785835A2 (en) Storage control method for managing access environment enabling host to access data
JP5335848B2 (ja) ストレージシステム及びストレージシステムの運用方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120710

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5199464

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees