JP4818843B2 - リモートコピーを行うストレージシステム - Google Patents

リモートコピーを行うストレージシステム Download PDF

Info

Publication number
JP4818843B2
JP4818843B2 JP2006207457A JP2006207457A JP4818843B2 JP 4818843 B2 JP4818843 B2 JP 4818843B2 JP 2006207457 A JP2006207457 A JP 2006207457A JP 2006207457 A JP2006207457 A JP 2006207457A JP 4818843 B2 JP4818843 B2 JP 4818843B2
Authority
JP
Japan
Prior art keywords
volume
pair
primary
status
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006207457A
Other languages
English (en)
Other versions
JP2008033704A (ja
Inventor
正充 高橋
匡二 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006207457A priority Critical patent/JP4818843B2/ja
Priority to US11/527,477 priority patent/US7610461B2/en
Priority to EP07252257A priority patent/EP1901167B1/en
Priority to DE602007008804T priority patent/DE602007008804D1/de
Publication of JP2008033704A publication Critical patent/JP2008033704A/ja
Application granted granted Critical
Publication of JP4818843B2 publication Critical patent/JP4818843B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2069Management of state, configuration or failover
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、プライマリのストレージシステムのプライマリボリュームからセカンダリのストレージシステムのセカンダリボリュームへのリモートコピーに関する。
リモートコピーに関する技術として、例えば文献1(特開2005−332354号公報)に開示の技術がある。この技術によれば、計算機システムは、ホスト計算機と、複数の第1の論理ディスクを有する複数の第1のストレージシステムと、複数の第2の論理ディスクを有する複数の第2のストレージシステムとを有する。第一の論理ディスクと第2の論理ディスクとはペアを構成しており、各ペアは第一のコピーグループ若しくは第2のコピーグループのいずれかに属する。コピーグループ毎に、リモートコピーを停止させる場合、まずコピーグループを特定し、次にコピーグループに属するペアを特定する。そして特定されたペアの第1の論理ディスクを有する第1のストレージシステムが、特定されたペアのリモートコピー処理を停止する。
特開2005−332354号公報
リモートコピーには、同期方式と非同期方式の二種類ある。
同期方式は、ホストからプライマリストレージシステムに書き込み命令があった場合に、プライマリストレージシステムが、セカンダリストレージシステムに書き込み対象データを転送した後、ホストからの上記書き込み命令に対する完了報告を、そのホストに返信する方式である。以下、同期方式でのリモートコピーを「同期リモートコピー」と言う。
一方、非同期方式は、ホストからプライマリストレージシステムに書き込み命令があった場合に、プライマリストレージシステムが、書き込み命令に対する完了報告をホストに返信した後、セカンダリストレージシステムへ書き込み対象データを転送する方式である。以下、非同期方式でのリモートコピーを「非同期リモートコピー」と言う。
一つのコピーグループに、オープン系のホスト(以下、オープンホスト)が利用するプライマリボリュームを含んだボリュームペアと、メインフレーム系のホスト(以下、メインフレームホスト)が利用するプライマリボリュームを含んだボリュームペアとを混在させた運用形態を考察する。以下の説明では、第Nのボリュームペアは、第Nのプライマリボリューム(コピー元ボリューム)と第Nのセカンダリボリューム(コピー先ボリューム)とで構成されているものとする(Nは一以上の整数)。
この運用形態において、コピーグループのうちの第一のボリュームペアに障害が生じた場合、第一のプライマリボリュームにデータが書き込まれても、そのデータは第一のセカンダリボリュームには転送されない。しかし、そのコピーグループに属する第二のボリュームペアで同期リモートコピーが行われるようになっているならば、第二のプライマリボリュームに対するデータが第二のセカンダリボリュームに転送される。このため、コピーグループにおけるプライマリボリューム群とセカンダリボリューム群との間で整合性がなくなる。これを防ぐためには、コピーグループのうちの第一のボリュームペアに障害が生じた場合には、そのコピーグループに属する全てのボリュームペアでのリモートコピーを停止する必要がある。
これを実現するための方法としては、各ホストの主導の下で、コピーグループに属する全てのボリュームペアでのリモートコピーを停止する方法が考えられる。具体的には、そのコピーグループ内の各プライマリボリュームを利用する各ホストに、ボリュームペアを制御するためのコンピュータプログラム(以下、ペア制御プログラム)をインストールしておく。プライマリストレージシステムが、各ホストに、障害を通知する。各ホストのペア制御プログラムが、IO保留状態(プライマリボリュームへの書き込みを行わない状態)にするためのIO制御コマンドや、自分が利用するプライマリボリュームを有したボリュームペアをサスペンド状態(プライマリボリュームに対するデータをそれのセカンダリボリュームにコピーしない状態)にするためのペア状態制御コマンドを、プライマリストレージシステムに送信する。プライマリストレージシステムが、ホストからのIO制御コマンドに従って、そのホストに対してIO保留状態とする。また、プライマリストレージシステムは、そのペア状態制御コマンドで指定されているボリュームペアのステータスをサスペンド状態に変更することで、ボリュームペアでのリモートコピーを停止する。
しかし、この方法は、必ずしも好適な方法とは言えない。なぜなら、オープン系では、いろいろなOS(オペレーティングシステム)があり、そのOSが搭載された環境で、ペア制御プログラムが動作するので、障害の通知を通知しても、必ずしも期待通りの処理が実行されるとは限らないためである。
従って、本発明の目的は、一つのコピーグループに、オープン系のホストが利用するプライマリボリュームを含んだボリュームペアと、メインフレーム系のホストが利用するプライマリボリュームを含んだボリュームペアとが混在している場合に、そのコピーグループに属する全ボリュームペアのリモートコピー停止や各プライマリボリュームに対する書込みの停止を、少なくともオープン系のホストに主導させることなく実現することにある。
本発明の更なる目的は、後の記載から明らかになるであろう。
本発明に従うプライマリのストレージシステムは、ライトコマンドを送信するメインフレーム系のホストであるメインフレームホストと、ライトコマンドを送信するオープン系のホストであるオープンホストと、複数のセカンダリボリュームを備えた一以上のセカンダリのストレージシステムとに接続され、前記メインフレームホスト及び前記オープンホストからそれぞれライトコマンドを受信する。このプライマリストレージシステムは、前記複数のセカンダリボリュームとそれぞれ複数のボリュームペアを構成する複数のプライマリボリュームを含んだ複数の論理ボリュームと、前記メインフレームホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第一のIO処理部と、前記オープンホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第二のIO処理部と、ライトデータの書込み先のプライマリボリュームとボリュームペアを構成するセカンダリボリュームにコピーするためのリモートコピーを実行するリモートコピー部と、前記複数のボリュームペアの各々のペア状態を監視し監視結果に応じた制御を実行するペア状態監視部とを備える。
複数のボリュームペアのうちの二以上のボリュームペアで構成された一つのコピーグループに、前記メインフレームホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるメインフレームペアと、前記オープンホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるオープンペアとが混在している。
前記ペア状態監視部は、前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、該コピーグループについてライト保留状態を設定し、その後で、該コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定する。ライト保留状態の設定や、コピー停止設定状態の設定の実行にあたり、前記オープンホストからのコマンドは不要である。
前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を行わない。
前記リモートコピー部は、コピー停止状態となったボリューペアについては前記リモートコピーを行わない。
一つの実施態様では、前記ペア状態監視部が、前記コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定した場合に、前記ライト保留状態をライト保留解除状態に変更する。前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留解除状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を実行する。
前述した各部は各手段と言い換えてもよい。前記各部は、ハードウェア(例えば回路)、コンピュータプログラム、或いはそれらの組み合わせ(例えば、一部をコンピュータプログラムで実現し残りをハードウェアで実現する)によって実現することもできる。各コンピュータプログラムは、コンピュータマシンに備えられる記憶資源(例えばメモリ)から読み込むことができる。その記憶資源には、CD−ROMやDVD(Digital Versatile Disk)等の記録媒体を介してインストールすることもできるし、インターネットやLAN等の通信ネットワークを介してダウンロードすることもできる。
本発明によれば、一つのコピーグループに、オープン系のホストが利用するプライマリボリュームを含んだボリュームペアと、メインフレーム系のホストが利用するプライマリボリュームを含んだボリュームペアとが混在している場合に、そのコピーグループに属する全ボリュームペアのリモートコピー停止や各プライマリボリュームに対する書込みの停止を、少なくともオープン系のホストに主導させることなく実現することができる。
以下、本発明の幾つかの実施例を説明する。なお、以下の説明では、オープンホストとメインフレームホストのいずれでも良い場合には単に「ホスト」と言うことにする。
図1は、本発明の実施例1に係るシステム全体構成の一例を示す。
ローカルサイト1Aと、リモートサイト1Bとがある。
ローカルサイト1Aに、プライマリストレージシステム40Pと、プライマリストレージシステム40Pに接続されたメインフレームホスト10Aとオープンホスト10Cとがある。プライマリストレージシステム40Pとメインフレームホスト10Aは、メインフレーム系の通信として、例えば、ESCON(Enterprise Systems Connection)(登録商標)、或いはFICON(Fibre Connection)(登録商標)に従う通信を行うことができる。プライマリストレージ40Pとオープンホスト10Cは、オープン系の通信として、例えば、iSCSI(Internet Small Computer System Interface)或いはFibre Channelに従う通信を行うことができる。
リモートサイト1Bに、プライマリストレージシステム40Pに接続されたセカンダリストレージシステム40Sがある。セカンダリストレージシステム40Sには、ホストが接続されていてもいなくてもよい。
図2は、メインフレームホスト10Aの構成例を示す。
メインフレームホスト10Aは、一種の計算機であり、CPU511と、メモリ513(他種の記憶資源でも良い)と、ポート515(プライマリストレージシステム40Pとの通信ポート)と、入力装置505(例えばキーボードやマウス)と、出力装置507(例えば表示装置)と、記録媒体501(例えばフレキシブルディスク)からデータを読み取る記録媒体読取装置503とを備える。メモリ513には、コンピュータプログラムとして、例えば、プライマリストレージシステム40Pを制御するためのペア制御プログラム517と、所定の業務を実行するためのアプリケーションプログラム519と、図示しないOSとが記憶される(ペア制御プログラム517は、OSに組み込まれていても良い)。それらのコンピュータプログラムは、CPU511で実行される。以下、コンピュータプログラムが主語になる場合は、実際にはそのコンピュータプログラムを実行するCPUによって処理が行われるものとする。
なお、この図2は、メインフレームホスト10Aの構成を代表的に示しているが、オープンホスト10Cも、実質的に同様の構成とすることができる。その際、メモリには、ペア制御プログラムは無くてもよい。
図3は、プライマリストレージシステム40Pの構成例を示す。
プライマリストレージシステム40Pは、例えば、アレイ状に配列された多数のディスク400を備えるRAID(Redundant Array of Independent (or Inexpensive) Disks)システムとすることができる。
プライマリストレージシステム40Pは、コントローラ部20と、ディスクユニット30とに大別することができる。
コントローラ部20は、例えば、複数のインタフェース制御装置(以下、I/F)と、キャッシュメモリ24と、共有メモリ25と、スイッチング制御部26とを備えている。複数のインタフェース制御装置として、メインフレーム用のホストI/F(以下、メインフレームI/F)21Aと、オープンシステム用のホストI/F(以下、オープンI/F)21Cと、他のストレージシステムとのI/F(以下、リモート通信I/F)21Bと、ディスク400とのI/F(以下、ディスクI/F)22とがある。コントローラ部20には、プライマリストレージシステム20を管理するための管理端末250が接続されても良い。
各I/Fは、相手との通信を制御する装置であり、実質的に同様のハードウェア構成とすることができる。図4に、メインフレームI/F21Aの構成例を示す。メインフレームI/F21Aは、メインフレームホスト10Aと通信するためのポート601と、スイッチング制御部26に接続されるポート609と、送受信されるデータを一時的に記憶するためのキャッシュメモリ605と、制御プログラム611を記憶した制御メモリ607と、その制御プログラム611を実行するCPU603とが備えられる。
制御プログラム611は、メインフレームI/F21A、オープンI/F21C及びリモート通信I/F21Bのそれぞれに記憶される。本実施例1では、メインフレームI/F21A及びオープンI/F21Cに記憶される制御プログラム611は、ホストからのIOコマンド(ライトコマンド又はリードコマンド)を処理するIO処理プログラムである。一方、リモート通信I/F21Bに記憶される制御プログラム611は、リモートコピーを実行するリモートコピープログラムや、ボリュームペアのペア状態を監視しその監視結果に基づく処理を実行するペア状態監視プログラムである。
キャッシュメモリ24は、例えば揮発性又は不揮発性のメモリであり、ホスト10A、10Cから受信したデータや、ディスク400から読出されたデータを一時的に記憶することができる。共有メモリ25は、例えば揮発性或いは不揮発性のメモリであり、プライマリストレージシステム40Pでの制御に関する情報(以下、制御データ群)が格納される。例えば、共有メモリ25とキャッシュメモリ24は、別々のメモリでなく、一つのメモリに共有メモリ領域とキャッシュメモリ領域とが設けられても良い。
スイッチング制御部26は、各I/F21A〜21B、22、キャッシュメモリ24及び共有メモリ25を相互に接続させる装置であり、例えば、高速スイッチング動作によってデータ伝送を行う超高速クロスバスイッチ等のような高速バスとして構成することができる。
ディスユニット30には、アレイ状に配列された複数のディスク400が含まれている。内部ディスク400としては、例えば、ハードディスク、フレキシブルディスク、光ディスクなどのディスク型記憶装置とすることができる。ディスク400に代えて、他種の記憶装置、例えば、磁気テープ、半導体メモリ(例えばフラッシュメモリ)を用いることもできる。ディスク400の記憶領域上には、論理ボリューム31が設けられる。複数の論理ボリュームが、一つの論理的な記憶ユニットとして構成されても良い。その記憶ユニットには、メインフレームホストが利用するプライマリボリュームと、オープンホストが利用するプライマリボリュームとが混在しても良い。
前述したリモート通信I/F21Bには、セカンダリストレージシステム40Sが接続されるが、それに加えて、他のプライマリストレージシステムが接続されても良い。或いは、コントローラ部20には、セカンダリストレージシステム40Sに接続されるリモート通信I/Fと、他のプライマリストレージシステムに接続されるリモート通信I/Fとが別々に設けられても良い。また、セカンダリストレージシステム40Sが、リモート通信I/F21Bに接続され、他のプライマリストレージシステムは、図示しない所定のI/Fを介して専用線で接続されても良い。
セカンダリストレージサブシステム40Sは、プライマリストレージシステム40Pのような構成であっても良い。また、プライマリストレージシステム40P及びセカンダリストレージシステム40Sの少なくとも一方のコントローラ部20は、例えば、CPU、メモリ及び通信ポートを備えた、図3に記載の構成よりも簡易な構成の回路基盤であっても良い。この場合、CPUが、複数のI/Fによって行われる処理を実行することができる。
さて、前述した共有メモリ25に記憶される制御データ群としては、例えば、以下に説明するリモートコピーペア制御テーブル、同期リモートコピーグループ制御テーブル、及び同期リモートコピー拡張制御テーブルがある。
図5は、リモートコピーペア制御テーブルの構成例を示す。
リモートコピーペア制御テーブルは、プライマリストレージシステム内の各ボリュームに関する情報が登録され、リモートコピーの制御に使用されるテーブルである。具体的には、例えば、各プライマリボリューム毎に、プライマリボリュームのボリューム#(#は識別子)、コピー先装置#(プライマリストレージシステムの識別子)、コピー先ボリューム#(セカンダリボリュームの識別子)、コピー種別(同期方式と非同期方式のどちらのリモートコピーか)、グループ#(コピーグループの識別子)、ペア状態、及びMF/OPEN(メインフレームかオープンか)がある。
ペア状態において、"Simplex"は、ボリュームペアを構成していないボリュームを意味し、"Duplex"が、ボリュームペアを構成するプライマリボリュームであることを意味する。ペア状態"Duplex"且つコピー種別"同期"のボリュームを指定したライトコマンドを受けた場合、IO処理プログラムは、それを契機にリモートコピープログラムを起動することができる。IO処理プログラムは、そのライトコマンドに従うデータをキャッシュメモリ24に書き、起動したリモートコピープログラムが、キャッシュメモリ24上のデータを、そのコマンドで指定されているボリュームに対応したセカンダリボリュームに転送する。その転送に対して所定の応答(例えば完了報告)を受領した場合、リモートコピープログラムは、そのIO処理プログラムに応答を返送し、IO処理プログラムは、その応答を受けた場合に、ライトコマンドの送信元ホストに、完了報告を返す。なお、ライトコマンドで指定されたボリュームのコピー種別が"非同期"の場合には、IO処理プログラムは、ライトコマンドを受信してキャッシュメモリ24にデータを書いたら、そのライトコマンドの送信元ホストに完了報告を返すことができる。また、その場合、ライトコマンドの受信とは別のタイミングでリモートコピープログラムが実行される。
また、図示しないが、ペア状態には、"障害Suspend"と"Suspend"があり、それは、いずれも、リモートコピーが一時停止中であることを意味する。ペア状態が"障害Suspend"や"Suspend"のボリュームにライトコマンドが発生しても、リモートコピープログラムが実行されない。
また、この図5のテーブルにおいて、任意のボリューム(ペア状態"障害Suspend"のボリューム)のグループ#やMF/OPENから、そのボリュームが属するコピーグループの識別子や、そのボリュームを使用するホストがメインフレームホストであるかオープンホストであるかを識別することができる。
図6は、同期リモートコピーグループ制御テーブルの構成例を示す。
このテーブルには、同期リモートコピーが実行されるコピーグループ(以下、同期コピーグループ)に関する情報が登録される。具体的には、例えば、同期コピーグループ毎に、グループ#、制御情報、IO保留開始時間、タイムアウト時間が登録される。制御情報は、例えばON(1)とOFF(0)の2値で表される。制御情報ONは、IO保留状態であることを意味し、制御情報OFFは、IO保留状態ではないことを意味する。IO保留開始時間は、IO保留状態が開始した時刻を表し、その時刻から、それに対応したタイムアウト時間(例えば120秒)が経過したときに、強制的に制御情報がONからOFFにされる。なお、IO保留状態とは、ライトコマンドの受け付けを禁止するわけではないが、ライトコマンドに従うIO処理を実行しない状態であることを意味する。具体的には、例えば、IO保留状態において、ライトコマンドを受けた場合には、特定の応答(例えば、ビジー、或いはリトライ要求)を返すことで、そのライトコマンドを再度受け付ける旨を、そのライトコマンドの発行元ホストに通知することができる。より具体的には、例えば、IO保留状態とは、メインフレームホストに対しては、SCP(State Change Pending)にすることであり、オープンホストに対しては、busy(queue full)状態にすることである。
図7は、同期リモートコピー拡張制御テーブルの構成例を示す。
このテーブルには、同期コピーグループの拡張グループに関する情報が登録される。拡張グループとは、一つのコピーグループに属するプライマリボリューム群の一部が、第一のプライマリストレージシステムに存在し、別の一部が、第二のプライマリストレージシステムに存在する場合の、上記一つのコピーグループである。このテーブルには、例えば、拡張グループが有効か否かのフラグと、拡張グループの#と、拡張グループのプライマリボリュームを備える他のプライマリストレージシステムの台数とが登録される。また、装置#(他のプライマリストレージシステムの#)と、コマンドデバイスボリューム#(コマンドデバイスが格納されたボリュームの識別子)とが登録される。
以下、本実施例1で行われる処理流れの一例を説明する。
<ケース1>コピーグループに属する全プライマリボリュームが一つのプライマリストレージシステムにあるケース。
つまり、このケース1は、コピーグループが拡張グループでは無いケースである。このケース1では、コピーグループに属する全プライマリボリュームは一つのプライマリストレージシステム40Pにあるが、全セカンダリボリュームが、一つのセカンダリストレージシステムに存在しなければならないわけではなく、複数のセカンダリストレージシステムに存在しても良い。このケース1で行われる処理流れの概要を図8に示す。
まず、図8Aに示すように、メインフレームホスト10Aのペア制御プログラムが、ペア形成指示(コピーグループを定義しそのコピーグループを構成する各ボリュームペアを形成するためのコマンド)を、メインフレームI/F21Aに発行する。そのペア形成指示に応答して、メインフレームI/F21Aが、少なくとも一つのオープンペア(オープンホストが利用するプライマリボリュームを含んだペア)と、少なくとも一つのメインフレームペア(メインフレームホストが利用するプライマリボリュームを含んだペア)とを含んだ同期コピーグループをプライマリストレージシステム40P内に定義する。そのようなコピーグループを表す情報として、例えば、ボリューム#、コピー先装置#、コピー先ボリューム#、コピー種別、グループ#、ペア状態、MF/OPENが、リモートコピーペア制御テーブル(図5参照)に登録される。また、そのペア状態が"同期"であるので、そのグループ#が、同期リモートコピーグループ制御テーブルにも登録される。
次に、図8Bに示すように、そのコピーグループ内の或るボリュームペア(例えばオープンペア)で障害が発生したとする。この障害は、例えば、そのボリュームペアの同期リモートコピーの転送経路で障害が生じる(例えばリモート通信I/F間が切断される)ことにより、起こる。リモート通信I/Fにおいて、この障害を検知したモジュール(コンピュータプログラムでもハードウェア回路でも良い)が、その転送経路で同期リモートコピーがされる各ボリュームペアを特定し、特定した全ボリュームペアのペア状態(図5のテーブル上のペア状態)を"障害Suspend"に変更する。なお、各ボリュームペアの特定は、例えば、各ボリューム"毎に、利用する転送経路の識別子(例えば、ポート#、ボリューム#などで表されるパス名)を登録しておくことで、行うことができる。
リモート通信I/Fのペア状態監視プログラムが、各ボリューム毎のペア状態を監視している。一つでもペア状態"障害Suspend"を検出した場合、ペア常態監視プログラムは、そのペア状態に対応するコピーグループに属する全ホストに対してIO保留状態とする。以後、少なくとも、そのIO保留状態が解除されるまでは、そのコピーグループに属するどのプライマリボリュームにも新たにデータが書かれない。
その後、図8Cに示すように、ペア状態監視プログラムが、そのコピーグループに属する全ボリュームペアの状態を"Suspend"に変更する。これにより、それら全ボリュームペアのどのプライマリボリュームにデータが書かれたとしても、セカンダリボリュームにはコピーされない。
このため、それが終了した後、図8Dに示すように、IO保留状態が解除されてもよい。IO保留状態が解除されると、"Suspend"状態のボリュームペアのプライマリボリュームに新たにデータが書かれる。この場合、ボリュームペアの両ボリューム間で差分が生じるが、ペア状態"Suspend"では、その差分データが管理される(例えば、プライマリボリュームのどの場所にどんなデータ(差分データ)が書かれたか管理される)。その後、再同期が行われると、その管理されている差分データが、セカンダリボリュームに反映されることで、プライマリボリュームとセカンダリボリュームとの間の差分を無くすことができる。
図9は、ケース1でのペア状態監視プログラムの処理フローを示す。
ペア状態監視プログラムは、ペア状態の監視の結果、ペア状態が変化し(S101でYES)、且つ、変化後のペア状態が"障害Suspend"である場合には(S102でYES)、そのペア状態のボリュームペアが属するコピーグループが同期コピーグループか否か、具体的には、そのコピーグループの識別子が、同期リモートコピーグループ制御テーブル(図6参照)に登録されているか否かを判断する(S103)。本実施例1では、少なくとも一つのボリュームペアのコピー種別が"同期"の場合に、そのボリュームペアを有するコピーグループの識別子が、図6のテーブルに登録され、全てのボリュームペアのコピー種別が"非同期"の場合に、そのコピーグループの識別子は、図6のテーブルには登録されない。
ペア状態監視プログラムは、S103で同期コピーグループと判断した場合(S103でYES)、そのコピーグループの識別子を特定し(S104)、特定したグループ#に対応した制御情報をONにする(S105)。つまり、IO保留状態を開始する。その際、IO保留開始時間を図6のテーブルに登録する。なお、例えば、S104の前にグループ#は特定されているので、S104は無くても良い。
次に、ペア状態監視プログラムは、特定されたグループ#に属する全ボリュームペアを特定し、特定した全ボリュームペアのペア状態を"Suspend"に変更する(S106、S107、S108)。
その後、ペア状態監視プログラムは、当該グループ#に対応した制御情報をONからOFFにする(S109)。なお、ペア状態監視プログラムは、制御情報をONからOFFに変更するタイミングとして、登録したIO保留開始時間から、それに対応するタイムアウト時間が経過したタイミングを採用することもできる。これにより、例えば、何らかの原因で、S108でYESとなってもS109が実行されなかった場合、IO保留状態が無意味に長く続いてしまうが、この工夫によれば、IO保留状態が無意味に長く続いてしまうことを防ぐことができる。
図10は、ケース1でのIO処理プログラムの処理フローを示す。この処理フローは、メインフレームI/FのIO処理プログラムもオープンI/FのIO処理プログラムも実行する。
IO処理プログラムは、リードコマンドを受信した場合には(S201でNO)、そのリードコマンドを実行し(つまり、ボリュームからデータを読み出してホストに送信し)(S204)、ホストに正常終了を返却する(S205)。
一方、IO処理プログラムは、ライトコマンドを受信した場合には(S201でYES)、ライトコマンドで指定されているボリュームが属するコピーグループを特定し、そのコピーグループの制御情報がONになっていれば(S202でYES)、IO保留処理を実行する(例えば、ホストにビジー状態を返却する)(S203)。そのコピーグループの制御情報がOFFになっていれば(S202でNO)、IO処理プログラムは、受信したライトコマンドに従うデータを書いて(S204)、ホストに正常終了(書込完了)を返却する(S205)。
この処理フローによれば、制御情報がONになっていれば、その制御情報に対応するコピーグループのどのプライマリボリュームにも新たにデータが書かれてしまうことを防ぐことができる。
<ケース2>コピーグループに属するプライマリボリュームが複数のプライマリストレージシステムにあるケース。
つまり、このケース2は、コピーグループが拡張グループであるケースである。このケース2では、複数のプライマリストレージシステムにそれぞれ存在するプライマリボリュームを含んだコピーグループが定義されるため、図5、図6及び図7に示したテーブルが、全てのプライマリストレージシステムの記憶域(例えば、共有メモリ)に記憶される。そのコピーグループに属する複数のセカンダリボリュームは、一つのセカンダリストレージシステムに存在しても良いし、複数のセカンダリストレージシステムに分散して存在しても良い。
このケース2で行われる処理流れの概要を図11に示す。なお、図11には、格別図示していないが、図8Aと同様の方法でコピーグループ(拡張グループ)が定義される。
図11Aに示すように、第一のボリュームペアで障害が発生した場合、その第一のボリュームペアの第一のプライマリボリュームを有する第一のプライマリストレージシステムにおいて、ケース1と同様に、その第一のプライマリボリュームについてペア状態"障害Suspend"が登録される。この場合、第一のプライマリストレージシステムの第一のペア状態監視プログラムが、その第一のプライマリボリュームが属するコピーグループについてのIO保留状態を開始し、且つ、その第一のプライマリボリュームを有する拡張グループに属する第二のプライマリボリュームを有する第二のプライマリストレージシステムに、その拡張グループの識別子を通知する。
次に、図11Bに示すように、第一のプライマリストレージシステムでは、第一のペア状態監視プログラムによって、拡張グループに属する全プライマリボリューム(但し、第一のプライマリストレージシステム内のプライマリボリューム)のボリュームペアが、"Suspend"とされる。第二のプライマリストレージシステムでは、そのシステムで実行される第二のペア状態監視プログラムによって、通知されたグループ#についてIO保留状態にされる(制御情報がON)にされる。
次に、図11Cに示すように、第一のプライマリストレージシステムでは、第一のペア状態監視プログラムによって、その拡張グループのIO保留状態が解除される。第二のプライマリストレージシステムでは、IO保留状態となった拡張グループにおける全プライマリボリューム(但し、第一のプライマリストレージシステム内のプライマリボリューム)のボリュームペアが、第二のペア状態監視プログラムによって、"Suspend"とされる。
最後に、図11Dに示すように、第二のプライマリストレージシステムでは、第二のペア状態監視プログラムによって、その拡張グループのIO保留状態が解除される。
図11での説明は、一つのコピーグループに関わるプライマリストレージシステムが2台である場合を例に採った説明であるが、3台以上のプライマリストレージシステムがいわゆるカスケード状に接続されている場合には、ペアボリュームの障害を検出したプライマリストレージシステムから、順次に、IO保留状態の設定、当該拡張グループに属する全プライマリボリュームのペア状態を"Suspend"に変更、IO保留状態の解除が行われる。
図12は、ケース2でのペア状態監視プログラムの処理フローを示す。
この処理フローによれば、図9のS105とS106との間に、S301とS302がある。
S301では、第一のペア状態監視プログラムが、特定されたグループ#について拡張グループ設定があるか否かを判断する。ここでは、そのグループ#が、同期リモートコピー拡張グループ制御テーブル(図7参照)に登録されており、且つ、有効か否かを示すフラグがオンになっている場合に、拡張グループ設定があるとの判断になる。
拡張グループ設定があるとの判断になった場合(S301でYES)、S302において、第一のペア状態監視プログラムが、この処理フローで特定されたグループ#と"障害Suspend"とを、第二のプライマリストレージシステムに通知する。通知先となる第二のプライマリストレージシステムは、そのグループ#に対応した装置#(図7参照)を有したストレージシステムである。このS302では、第一のペア状態監視プログラムが、その装置#に対応したコマンドデバイスボリューム#に、グループ#と"障害Suspend"とを含んだ状態変更コマンド(ペア状態を変更することのコマンド)を書き込むことができる。
ここで、コマンドデバイスボリュームとは、そのボリュームを備えるストレージシステムを制御するためのコマンドが書かれるボリュームであり、ホストからのデータが書かれるボリュームとは種類が異なる。第二のプライマリストレージシステムでは、状態変更コマンドがコマンドデバイスボリュームから読み出された場合、第二のペア状態監視プログラムが、図13の処理フローを開始することができる。具体的には、例えば、第二の状態監視プログラムは、状態変更コマンドのため、ペア状態変化と判断し、その状態変更コマンドに"障害Suspend"が含まれているため、障害Suspendと判断する。また、その状態変更コマンドに含まれているグループ#は、第二のプライマリストレージシステム内の同期リモートコピー制御テーブルに書かれているので、制御情報をONにすることでIO保留状態を開始し、そのグループ#に対応する全プライマリボリューム(第二のプライマリストレージシステム内のプライマリボリューム)のペア状態を全て"Suspend"に変更する。その後、第二のペア状態監視プログラムは、制御情報をOFFにする。
なお、第二のプライマリストレージシステムにペア状態変更を実行させる方法としては、上記のようなコマンドデバイスボリュームに状態変更コマンドを書込む方法に限らず、他の方法を採用することもできる。例えば、第一のペア状態監視プログラムが、グループ#や"障害Suspend"を用いて第二のペア状態監視プログラムを呼び出す方法も考えられる。
以上、上述した実施例1によれば、各種ホストI/Fで実行されるIO処理プログラムは、ライトコマンドを受信した場合には、そのライトコマンドで指定されているボリュームが属するコピーグループの制御情報がOFFになっているかONになっているかによって、ライトコマンドを実行するか否かを決定するように構成されている。ペア状態監視プログラムが、各ボリュームペアのペア状態を監視し、"障害Suspend"を検知した場合に、その障害Suspend"のボリュームペアが属するコピーグループの制御情報をONにする。それにより、そのコピーグループに属する全プライマリボリュームに書込みが生じない状態とした上で、ペア状態監視プログラムは、その全プライマリボリュームに属するペア状態を"Suspend"に変更し、それが終了したら、ONにした制御情報をOFFに戻す。これにより、ケース1及びケース2の両方の場合で、メインフレームペアとオープンペアが混在するコピーグループにおいて、プライマリボリューム群とセカンダリボリューム群との整合性を保証することができる。そして、そのために、IO保留状態の設定やペア状態を一斉に"Suspend"に変更することが行われるが、それを、オープンホストの主導だけでなくメインフレームホストの主導の無しに実行することができる。つまり、オープンホストにもメインフレームホストにも、IO保留状態の設定を行うためのコマンドを発行する機能や、ペア状態を一斉に"Suspend"に変更するためのコマンドを発行する機能など、特別な機能を持たせなくて済む。
本発明の実施例2を説明する。以下、実施例1との相違点を主に説明し、実施例2との共通点については説明を省略或いは簡略する。
この実施例2では、ケース2に代えて又は加えてケース3が実行される。ケース3とは、一つのコピーグループに関わる複数のプライマリストレージシステムが互いに通信可能に接続されていないケースである。そのケースとしては、具体的には、例えば、予め専用線などで接続されていない場合や、或いは、プライマリストレージシステム間の接続が切断されてしまった場合などがある。その接続の切断が検出された場合には、第一のペア状態監視プログラムが、ケース2に代えてケース3の処理流れを実行することを選択することができる。
図13及び図14は、ケース3の処理流れの概要を示す。
図13Aに示すように、第一のボリュームペアで障害が発生した場合、その第一のボリュームペアの第一のプライマリボリュームを有する第一のプライマリストレージシステムにおいて、その第一のプライマリボリュームについてペア状態"障害Suspend"が登録される。この場合、第一のペア状態監視プログラムが、その第一のプライマリボリュームが属するコピーグループについてIO保留状態を開始する。これにより、そのコピーグループに属する全プライマリボリューム(第一のプライマリストレージシステムのプライマリボリューム)についてIO保留状態となる。
次に、図13Bに示すように、第一のペア状態監視プログラムが、そのコピーグループに属する全ボリュームペア(第一のプライマリストレージシステムのプライマリボリュームを含んだボリュームペア)のペア状態を全て"Suspend"に変更する。これにより、"障害Suspend"となったボリュームペアが、メインフレームペアであろうがなかろうが、メインフレームペアが"Suspend"となる。これを契機に、第一のペア状態監視プログラムは、メインフレームペアが"Suspend"となったことの状態変更通知を、メインフレームホストのペア制御プログラムに送信する。本処理を実行するための方法として、例えば、図5のテーブルにおいて、メインフレームペアに対応するエントリに、メインフレームホストの識別子を登録しておき、そのエントリから、状態変更通知の送信先とするメインフレームホストを特定する方法が考えられる。
次に、図13Cに示すように、メインフレームホストのペア制御プログラムが、その状態変更通知に応答して、"Suspend"となったメインフレームペアが属するコピーグループを特定し、特定したコピーグループに属するプライマリボリュームを有した第二のプライマリストレージシステムを特定し、特定した第二のプライマリストレージシステムに対し、特定したコピーグループについてIO保留状態とすることのIO保留指示コマンドを発行する。メインフレームI/F21Aで、そのIO保留指示コマンドが受信されるが、そのメインフレームI/F21Aが、受信したコマンドがIO保留指示コマンドであることを特定した場合に、そのコマンドをリモート通信I/F21Bに転送する。これにより、第二のペア状態監視プログラムが、そのIO保留指示コマンドに応答して、そのコマンドで指定されているグループ#に対応した制御情報をONにする(つまりIO保留状態を設定する)。コピーグループの特定の方法や、IO保留指示コマンドの発行先とする第二のプライマリストレージシステムを特定する方法としては、例えば、第一のプライマリストレージシステムから、状態変更通知と共に、"Suspend"となったメインフレームペアが属するコピーグループの識別子や第二のプライマリストレージしシステムの装置#を受信する方法、ペア制御プログラムが、各プライマリストレージシステムに記憶される図5、図6、図7のテーブルを記憶しており、各テーブルを参照する方法、など種々の方法が考えられる。
次に、図14Aに示すように、ペア制御プログラムが、特定した第二のプライマリストレージシステムに対し、特定されたコピーグループに属する全ボリュームペアのペア状態を"Suspend"に変更することのサスペンド指示コマンドを発行する。第二のペア状態監視プログラムが、そのサスペンド指示コマンドに応答して、上記コピーグループに属する全ボリュームペアのペア状態を"Suspend"に変更する。それが終了した場合、第二の状態変更プログラムは、所定の応答をペア制御プログラムに返してもよい。特定されたコピーグループに属する全ボリュームペアは、そのコピーグループのグループ#を用いて、ペア制御プログラムによって特定されサスペンド指示コマンドで指定されても良いし、第二のペア状態監視プログラムによって特定されても良い。
最後に、図14Bに示すように、ペア制御プログラムが、所定のタイミング(例えば、サスペンド指示コマンドを発行して一定時間が経過したタイミング、或いは、所定の応答を第二のペア状態監視プログラムから受領したタイミング)で、上記特定されたコピーグループについてIO保留状態を解除することのIO保留解除指示コマンドを発行する。これにより、第二のペア状態監視プログラムが、そのIO保留解除指示コマンドに応答して、そのコマンドで指定されているグループ#に対応した制御情報をOFFにする(つまりIO保留状態を解除する)。
以上が、ケース3についての説明である。なお、このケース3では、上述したIO保留指示コマンドの発行、サスペンド指示コマンドの発行、IO保留解除指示コマンドの発行は、一つの第二のプライマリストレージシステムにつき、1回で済む。コピーグループ単位での発行となるからである。
以上、本実施例2によれば、一つのコピーグループに関わる複数のプライマリストレージシステムが互いに通信可能に接続されていなくても、IO保留状態の設定やペア状態を一斉に"Suspend"に変更することを、オープンホストの主導無しに実行することができる。すなわち、メインフレームホストでは、IO保留指示コマンドの発行、サスペンド指示コマンドの発行及びIO保留解除指示コマンドの発行といった特別な機能を有したペア制御プログラムを実行する必要があるが、オープンホストでは、そのような必要がない。オープンホストには搭載されているOSには様々なものが考えられ、メインフレームホストと比較するとオープンホストは信頼性が低いので、そのようなオープンホストに上記特別の機能を有したペア制御プログラムを搭載しなくて済むのは、効果的である。
これまで説明した実施例1、2の内容を、ここで補足する。これは実施例1、2に共通する内容である。
メインフレーム系とオープン系ではボリュームのフォーマットが異なり、また、処理するためのコマンド体系が異なる。従って、メインフレームI/F、オープンI/Fは、相互にボリュームを認識することができず、制御体系が異なる。
一般に、メインフレーム系は、基幹系業務に利用されることが多く、信頼性、性能ともオープン系に比べて高くなっている。そのため、本実施例では、メインフレーム系においてメインフレーム系のホストからオープン系のコピーペアの設定、解除等を行うことができるようにしている。具体的には、メインフレーム系のホストからコピーペアの設定、解除のコマンドを受領するボリュームは、オープン系コピーペアのボリュームとは関係ないメインフレーム系ボリューム(コマンドデバイスボリューム)である。メインフレームI/Fでは、このコマンドデバイスボリュームに受領されたコマンドを解釈し、コピーペアの設定コマンドであれば、このコマンドのパラメータ(例えば、プライマリボリュームのオープン系ボリューム#、コピー先装置#、コピー先オープン系ボリューム#、コピー種別、グループ#)を、リモートコピーペア制御テーブルに設定する。本実施例では、更に、このリモートコピーペア制御テーブルに格納されるデータは、メインフレームI/F、オープンI/Fが利用できるように共通のフォームで格納するようにしている。これにより、メインフレーム系のホストから、オープン系のコピーペアが形成できるようにしている。また、メインフレーム系のホストからオープン系のコピーペアが形成できるので、メインフレーム系のコピーペアと、オープン系のコピーペアとをコピーグループとして設定することができる。
また、メインフレーム系は、既に説明したように、コピーペアのペア状態が変わるたびに、メインフレーム系のホストに対して状態変更を通知できるようになっている。オープン系のコピーペアに障害があって中断(サスペンド)した場合、同時にグループ内のメインフレーム系コピーペアを中断状態にすることで、そのコピーペアの状態変更を通知することにより、メインフレームI/Fでこれを検出する。オープン系とメインフレーム系のデータ形式が共通なためにこれが可能となる。これにより、オープン系のコピーペアの障害をメインフレームI/Fに通知することが可能となり、メインフレーム系のホストへ障害を通知することが可能となる。
なお、以上の説明において、メインフレームI/F、オープンI/Fがそれぞれ処理を行うよう説明したが、これらは、メインフレームI/F、オープンI/FのCPUにより実行されるものである。
以上、本発明の幾つかの実施例を説明したが、これらは本発明の説明のための例示であって、本発明の範囲をこれらの実施例にのみ限定する趣旨ではない。本発明は、他の種々の形態でも実施することが可能である。
図1は、本発明の実施例1に係るシステム全体構成の一例を示す。 図2は、メインフレームホスト10Aの構成例を示す。 図3は、プライマリストレージシステム40Pの構成例を示す。 図4は、メインフレームI/F21Aの構成例を示す。 図5は、リモートコピーペア制御テーブルの構成例を示す。 図6は、同期リモートコピーグループ制御テーブルの構成例を示す。 図7は、同期リモートコピー拡張制御テーブルの構成例を示す。 図8は、コピーグループに属する全プライマリボリュームが一つのプライマリストレージシステムにあるケース(ケース1)での処理流れの概要を示す。 図9は、ケース1でのペア状態監視プログラムの処理フローを示す。 図10は、ケース1でのIO処理プログラムの処理フローを示す。 図11は、コピーグループに属するプライマリボリュームが複数のプライマリストレージシステムにあるケース(ケース2)での処理流れの概要を示す。 図12は、ケース2でのペア状態監視プログラムの処理フローを示す。 図13は、一つのコピーグループに関わる複数のプライマリストレージシステムが互いに通信可能に接続されていないケース(ケース3)での処理流れの概要の一部を示す。 図14は、ケース3での処理流れの概要の残りの一部を示す。
符号の説明
10A…メインフレームホスト 10C…オープンホスト 20…コントローラ部 21A…メインフレームI/F 21C…オープンI/F 21B…リモート通信I/F 22…ディスクI/F 24…キャッシュメモリ 25…共有メモリ 30…ディスクユニット 31…論理ボリューム 40P…プライマリストレージサブシステム 40S…セカンダリストレージサブシステム

Claims (12)

  1. ライトコマンドを送信するメインフレーム系のホストであるメインフレームホストと、
    ライトコマンドを送信するオープン系のホストであるオープンホストと、
    複数のセカンダリボリュームを備えた一以上のセカンダリのストレージシステムと
    に接続され、前記メインフレームホスト及び前記オープンホストからそれぞれライトコマンドを受信するプライマリのストレージシステムであって、
    前記複数のセカンダリボリュームとそれぞれ複数のボリュームペアを構成する複数のプライマリボリュームを含んだ複数の論理ボリュームと、
    前記メインフレームホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第一のIO処理部と、
    前記オープンホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第二のIO処理部と、
    ライトデータの書込み先のプライマリボリュームとボリュームペアを構成するセカンダリボリュームにコピーするためのリモートコピーを実行するリモートコピー部と、
    前記複数のボリュームペアの各々のペア状態を監視し監視結果に応じた制御を実行するペア状態監視部と、
    を備え、
    前記複数のボリュームペアのうちの二以上のボリュームペアで構成された一つのコピーグループに、前記メインフレームホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるメインフレームペアと、前記オープンホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるオープンペアとが混在しており、
    前記ペア状態監視部は、前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、該コピーグループについてライト保留状態を設定し、その後で、該コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定し、
    前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を行わず、
    前記リモートコピー部は、コピー停止状態となったボリューペアについては前記リモートコピーを行わない、
    ストレージシステム。
  2. キャッシュ記憶域と、
    共有記憶域と、
    前記メインフレームホストと通信するための通信インタフェース装置であり、前記メインフレームホストからライトコマンドを受信し、該ライトコマンドに従うライトデータを前記キャッシュ記憶域に記憶させるメインフレームホストI/Fと、
    前記オープンホストと通信するための通信インタフェース装置であり、前記オープンホストからライトコマンドを受信し、該ライトコマンドに従うライトデータを前記キャッシュ記憶域に記憶させるオープンホストI/Fと、
    前記セカンダリストレージシステムと通信するための通信インタフェース装置であるセカンダリI/Fと、
    前記複数の論理ボリュームを有する二以上の記憶装置と通信するための通信インタフェース装置であり、前記キャッシュ記憶域に記憶されたライトデータを読み出して、該ライトデータの格納先となる論理ボリュームを有した記憶装置に該ライトデータを書きこむ記憶装置I/Fと、
    を備え、
    前記第一のIO処理部は、前記メインフレームホストI/Fに備えられ、
    前記第二のIO処理部は、前記オープンホストI/Fに備えられ、
    前記リモートコピー部及び前記ペア状態監視部は、前記セカンダリI/Fに備えられ、
    前記ライト保留状態及び各ペア状態が、前記共有記憶域に設定される、
    請求項1記載のストレージシステム。
  3. 前記ペア状態監視部が、前記コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定した場合に、前記ライト保留状態をライト保留解除状態に変更し、
    前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留解除状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を実行する、
    請求項1記載のストレージシステム。
  4. 前記プライマリのストレージシステムに、別のプライマリのストレージシステムが接続されており、
    前記一つのコピーグループに属する複数のプライマリボリュームのうちの少なくとも一つが、前記別のプライマリストレージシステムに備えられ、
    前記ペア状態監視部は、前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、そのコピーグループに属するプライマリボリュームを備えた前記別のプライマリストレージシステムに、該コピーグループに関する所定の通知を発行する、
    請求項1記載のストレージシステム。
  5. 前記メインフレームホストに、別のプライマリのストレージシステムが接続されており、
    前記一つのコピーグループに属する複数のプライマリボリュームのうちの少なくとも一つが、前記別のプライマリストレージシステムに備えられ、
    前記ペア状態監視部は、前記一つのコピーグループのうちの或るメインフレームペアのペア状態が、前記障害状態又は前記コピー停止状態であれば、該メインフレームペアのプライマリボリュームに対してライトコマンドを発行する前記メインフレームホストに、ペア状態の変更を通知する、
    請求項1記載のストレージシステム。
  6. 前記プライマリのストレージシステムに、別のプライマリのストレージシステムが接続されており、前記メインフレームホストに、前記別のプライマリストレージシステムが接続され、
    前記一つのコピーグループに属する複数のプライマリボリュームのうちの少なくとも一つが、前記別のプライマリストレージシステムに備えられ、
    前記ペア状態監視部は、以下の(A)の処理、
    (A)前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、そのコピーグループに属するプライマリボリュームを備えた前記別のプライマリストレージシステムに、該コピーグループに関する所定の通知を発行する、
    を実行し、前記プライマリのストレージシステムと前記別のプライマリストレージシステムとの接続が切断されたことが検知された場合に、前記(A)の処理に代えて(B)の処理、
    (B)前記一つのコピーグループのうちの或るメインフレームペアのペア状態が、前記障害状態又は前記コピー停止状態であれば、該メインフレームペアのプライマリボリュームに対してライトコマンドを発行する前記メインフレームホストに、ペア状態の変更を通知する、
    を実行する、
    請求項1記載のストレージシステム。
  7. 前記ペア状態監視部は、前記ライト保留状態を開始してから一定時間経過した場合には、前記コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定したか否かに関わらず、前記ライト保留状態をライト保留解除状態に変更する、
    請求項3の記載のストレージシステム。
  8. 複数のプライマリストレージシステムを備えた計算機システムであって、
    前記複数のプライマリストレージシステムの各々が、
    ライトコマンドを送信するメインフレーム系のホストであるメインフレームホストと、
    ライトコマンドを送信するオープン系のホストであるオープンホストと、
    複数のセカンダリボリュームを備えた一以上のセカンダリのストレージシステムと
    に接続され、前記メインフレームホスト及び前記オープンホストからそれぞれライトコマンドを受信し、
    前記複数のセカンダリボリュームとそれぞれ複数のボリュームペアを構成する複数のプライマリボリュームのうちの少なくとも一つを含んだ複数の論理ボリュームと、
    前記メインフレームホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第一のIO処理部と、
    前記オープンホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第二のIO処理部と、
    ライトデータの書込み先のプライマリボリュームとボリュームペアを構成するセカンダリボリュームにコピーするためのリモートコピーを実行するリモートコピー部と、
    前記複数のボリュームペアの各々のペア状態を監視し監視結果に応じた制御を実行するペア状態監視部と、
    を備え、
    前記複数のボリュームペアのうちの二以上のボリュームペアで構成された一つのコピーグループに、前記メインフレームホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるメインフレームペアと、前記オープンホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるオープンペアとが混在しており、前記一つのコピーグループに属する複数のプライマリボリュームが、前記複数のプライマリストレージシステムに分散して備えられ、
    前記複数のプライマリストレージシステムのうちの第一のプライマリストレージシステムにおいて、前記ペア状態監視部は、前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、該コピーグループに属するプライマリボリュームを備えた第二のプライマリストレージシステムに、該コピーグループに関わる所定の通知を発行し、且つ、該コピーグループについてライト保留状態を設定し、前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を行わず、
    前記第一のプライマリストレージシステムにおいて、前記ペア状態監視部は、該コピーグループに属する、該第一のプライマリストレージシステムに備えられるプライマリボリュームを有した全ボリュームペアのペア状態をコピー停止状態に設定し、前記リモートコピー部は、コピー停止状態となったボリューペアについては前記リモートコピーを行わず、
    前記第二のプライマリストレージシステムにおいて、前記ペア状態監視部は、前記第一のプライマリストレージシステムからの前記所定の通知に応答し、該所定の通知に関わるコピーグループについてライト保留状態を設定し、その後で、前記ペア状態監視部は、該コピーグループに属する、該第二のプライマリストレージシステムに備えられるプライマリボリュームを有した全ボリュームペアのペア状態をコピー停止状態に設定する、
    計算機システム。
  9. 前記複数のプライマリストレージシステムの各々において、前記ペア状態監視部が、前記コピーグループに属するボリュームペアのペア状態をコピー停止状態に設定した場合に、前記ライト保留状態をライト保留解除状態に変更し、前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留解除状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を実行する、
    請求項8記載の計算機システム。
  10. ライトコマンドを送信するメインフレーム系のホストである一以上のメインフレームホストと、
    前記一以上のメインフレームホストにそれぞれ接続された複数のプライマリストレージシステムを備えた計算機システムであって、
    各メインフレームホストが、ボリュームペアの制御を行うペア制御部を備え、
    前記複数のプライマリストレージシステムの各々が、
    ライトコマンドを送信するオープン系のホストであるオープンホストと、
    複数のセカンダリボリュームを備えた一以上のセカンダリのストレージシステムと
    に接続され、前記メインフレームホスト及び前記オープンホストからそれぞれライトコマンドを受信し、
    前記複数のセカンダリボリュームとそれぞれ複数のボリュームペアを構成する複数のプライマリボリュームのうちの少なくとも一つを含んだ複数の論理ボリュームと、
    前記メインフレームホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第一のIO処理部と、
    前記オープンホストから受信したライトコマンドに従うライトデータを前記複数の論理ボリュームのうちの該ライトコマンドに従う論理ボリュームに書くためのIO処理を実行する第二のIO処理部と、
    ライトデータの書込み先のプライマリボリュームとボリュームペアを構成するセカンダリボリュームにコピーするためのリモートコピーを実行するリモートコピー部と、
    前記複数のボリュームペアの各々のペア状態を監視し監視結果に応じた制御を実行するペア状態監視部と、
    を備え、
    前記複数のボリュームペアのうちの二以上のボリュームペアで構成された一つのコピーグループに、前記メインフレームホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるメインフレームペアと、前記オープンホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるオープンペアとが混在しており、前記一つのコピーグループに属する複数のプライマリボリュームが、前記複数のプライマリストレージシステムに分散して備えられ、
    前記複数のプライマリストレージシステムのうちの第一のプライマリストレージシステムにおいて、前記ペア状態監視部は、前記一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、該コピーグループについてライト保留状態を設定し、前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を行わず、
    前記第一のプライマリストレージシステムにおいて、前記ペア状態監視部は、該コピーグループに属する、該第一のプライマリストレージシステムに備えられるプライマリボリュームを有した全ボリュームペアのペア状態をコピー停止状態に設定し、それにより、前記リモートコピー部は、コピー停止状態となったボリューペアについては前記リモートコピーを行わず、
    前記第一のプライマリストレージシステムにおいて、前記ペア状態監視部は、前記一つのコピーグループのうちの或るメインフレームペアのペア状態が、前記障害状態又は前記コピー停止状態であれば、該メインフレームペアのプライマリボリュームに対してライトコマンドを発行する前記メインフレームホストに、ペア状態の変更を通知し、
    前記メインフレームホストの前記ペア制御部が、前記通知されたペア状態変更に対応するボリュームペアが属するコピーグループについてライト保留状態を設定することのライト保留指示を、該コピーグループに属するプライマリボリュームを有した第二のプライマリストレージシステムに送信し、該ライト保留指示を受信した前記第二のプライマリストレージシステムにおいて、前記ペア状態監視部が、前記ライト保留指示に応答して、該コピーグループについてライト保留状態を設定し、
    前記メインフレームホストの前記ペア制御部が、前記コピーグループに属するボリュームペアのペア状態をコピー停止状態にすることのペア状態変更指示を、前記第二のプライマリストレージシステムに送信し、該ペア状態指示を受信した前記第二のプライマリストレージシステムにおいて、前記ペア状態監視部が、前記ペア状態指示に応答して、該コピーグループに属する、該第二のプライマリストレージシステムに備えられるプライマリボリュームを有した全ボリュームペアのペア状態をコピー停止状態に設定する、
    計算機システム。
  11. 前記複数のプライマリストレージシステムの各々において、前記ペア状態監視部が、前記コピーグループに属するボリュームペアのペア状態をコピー停止状態に設定した場合に、前記ライト保留状態をライト保留解除状態に変更し、前記第一のIO処理部と前記第二のIO処理部のいずれも、前記受信したライトコマンドに従う論理ボリュームが、前記ライト保留解除状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を実行する、
    請求項10記載の計算機システム。
  12. 複数のボリュームペアのうちの二以上のボリュームペアで構成された一つのコピーグループに、メインフレーム系のホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるメインフレームペアと、オープン系のホストからのライトコマンドに従う論理ボリュームをプライマリボリュームとしたボリュームペアであるオープンペアとが混在しており、前記コピーグループにおけるプライマリボリュームは、プライマリストレージシステムに存在し、前記コピーグループにおけるセカンダリボリュームは、前記プライマリストレージシステムに接続されたセカンダリストレージシステムに存在し、
    各ボリュームペアのペア状態を監視し、一つのコピーグループのうちの或るボリュームペアのペア状態が、該ボリュームペアで障害が生じたことにより変更された障害状態であれば、該コピーグループについてライト保留状態を設定し、もし、その後に、或るホストからライトコマンドを受信し、該ライトコマンドに従う論理ボリュームが、前記ライト保留状態であるコピーグループに属するプライマリボリュームであれば、該プライマリボリュームにライトデータを書き込むためのIO処理を行わず、
    前記ライト保留状態の設定の後、該コピーグループに属する全ての他のボリュームペアのペア状態をコピー停止状態に設定する、
    リモートコピー制御方法。
JP2006207457A 2006-07-31 2006-07-31 リモートコピーを行うストレージシステム Expired - Fee Related JP4818843B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2006207457A JP4818843B2 (ja) 2006-07-31 2006-07-31 リモートコピーを行うストレージシステム
US11/527,477 US7610461B2 (en) 2006-07-31 2006-09-27 Storage system with mainframe and open host performing remote copying by setting a copy group
EP07252257A EP1901167B1 (en) 2006-07-31 2007-06-05 Storage system performing remote copying
DE602007008804T DE602007008804D1 (de) 2006-07-31 2007-06-05 Fernkopien ausführendes Speichersystem

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006207457A JP4818843B2 (ja) 2006-07-31 2006-07-31 リモートコピーを行うストレージシステム

Publications (2)

Publication Number Publication Date
JP2008033704A JP2008033704A (ja) 2008-02-14
JP4818843B2 true JP4818843B2 (ja) 2011-11-16

Family

ID=38951727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006207457A Expired - Fee Related JP4818843B2 (ja) 2006-07-31 2006-07-31 リモートコピーを行うストレージシステム

Country Status (4)

Country Link
US (1) US7610461B2 (ja)
EP (1) EP1901167B1 (ja)
JP (1) JP4818843B2 (ja)
DE (1) DE602007008804D1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080162828A1 (en) * 2007-01-02 2008-07-03 Guillaume Comeau Methods and Systems for Applications to Interact with Hardware
US20110066801A1 (en) * 2009-01-20 2011-03-17 Takahito Sato Storage system and method for controlling the same
US8433866B2 (en) 2009-10-23 2013-04-30 Hitachi, Ltd. Remote copy system and remote copy control method in which a copy pair is changed from a first consistency group to a second consistency group (STG)
JP5521595B2 (ja) * 2010-02-05 2014-06-18 富士通株式会社 ストレージシステム及びストレージ制御方法
US20150120530A1 (en) * 2013-10-29 2015-04-30 Elwha LLC, a limited liability corporation of the State of Delaware Guaranty provisioning via social networking
WO2015072026A1 (ja) * 2013-11-18 2015-05-21 株式会社日立製作所 計算機システム
US9513827B1 (en) * 2015-05-21 2016-12-06 Intetrnational Business Machines Corporation Determining adjustments of storage device timeout values based on synchronous or asynchronous remote copy state
US20210117235A1 (en) * 2019-10-16 2021-04-22 EMC IP Holding Company LLC Storage system with efficient release of address lock waiters during synchronous replication
US20210117234A1 (en) * 2019-10-16 2021-04-22 EMC IP Holding Company LLC Storage system with efficient release of failed component resources during synchronous replication

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6052758A (en) * 1997-12-22 2000-04-18 International Business Machines Corporation Interface error detection and isolation in a direct access storage device DASD system
US6480953B1 (en) * 1999-12-13 2002-11-12 International Business Machines Corporation Method and apparatus for ensuring system configuration data structure coherency across multiple controllers in a data storage system
JP3997061B2 (ja) * 2001-05-11 2007-10-24 株式会社日立製作所 記憶サブシステムおよび記憶サブシステムの制御方法
JP4021823B2 (ja) * 2003-09-01 2007-12-12 株式会社日立製作所 リモートコピーシステム及びリモートコピーの方法
US7441052B2 (en) * 2003-09-29 2008-10-21 Hitachi Data Systems Corporation Methods and apparatuses for providing copies of stored data for disaster recovery and other uses
JP4401788B2 (ja) * 2004-01-06 2010-01-20 株式会社日立製作所 ストレージ制御装置
JP4382602B2 (ja) 2004-04-23 2009-12-16 株式会社日立製作所 リモートコピーシステム
JP4412722B2 (ja) 2004-07-28 2010-02-10 株式会社日立製作所 リモートコピーシステム
JP2006072635A (ja) 2004-09-01 2006-03-16 Hitachi Ltd データ処理システムおよびそのコピー処理方法
JP2006185108A (ja) 2004-12-27 2006-07-13 Hitachi Ltd ストレージシステムのデータを管理する管理計算機及びデータ管理方法
US7627775B2 (en) * 2005-12-13 2009-12-01 International Business Machines Corporation Managing failures in mirrored systems

Also Published As

Publication number Publication date
DE602007008804D1 (de) 2010-10-14
EP1901167B1 (en) 2010-09-01
US7610461B2 (en) 2009-10-27
JP2008033704A (ja) 2008-02-14
EP1901167A2 (en) 2008-03-19
EP1901167A3 (en) 2009-07-29
US20080028172A1 (en) 2008-01-31

Similar Documents

Publication Publication Date Title
JP4818843B2 (ja) リモートコピーを行うストレージシステム
US8607230B2 (en) Virtual computer system and migration method of virtual computer
US7441145B2 (en) Failure monitoring for storage systems constituting multiple stages
EP1860560B1 (en) Storage control method and system for performing backup and/or restoration
US10922135B2 (en) Dynamic multitasking for distributed storage systems by detecting events for triggering a context switch
JP4382602B2 (ja) リモートコピーシステム
US8468314B2 (en) Storage system, storage apparatus, and remote copy method for storage apparatus in middle of plural storage apparatuses
JP2007072571A (ja) 計算機システム及び管理計算機ならびにアクセスパス管理方法
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
JP2007140601A (ja) 記憶制御システム
US10191685B2 (en) Storage system, storage device, and data transfer method
GB2539829A (en) Storage system
JP2002259063A (ja) バックアップ処理可能な記憶システム
JP2008065525A (ja) 計算機システム、データ管理方法及び管理計算機
JP2010271808A (ja) ストレージ装置及びデータコピー方法
JP2006031694A (ja) 1次ミラーシャドウを有するストレージシステム
JP2007156911A (ja) ストレージ装置間のデータコピーを行うストレージシステム、コンピュータシステム、マスタ側ストレージ装置、リモート側ストレージ装置、データコピー方法、データコピープログラム
JP2008269469A (ja) ストレージシステム及びその管理方法
JP2007310448A (ja) 計算機システム、管理計算機、および、ストレージシステム管理方法
KR20100095519A (ko) 스토리지 복사 서비스 시스템들을 관리하기 위한 장치 및 방법
US8627034B2 (en) Storage control apparatus and storage control method
US20090228672A1 (en) Remote copy system and check method
JP2008009622A (ja) 管理サーバ、およびサーバシステム
US10248511B2 (en) Storage system having multiple local and remote volumes and multiple journal volumes using dummy journals for sequence control
JP2005301880A (ja) 計算機システムにおけるデータ入出力処理方法、ストレージ装置、ホスト計算機、および計算機システム、

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090520

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110830

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110831

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees