JP2016143248A - ストレージ制御装置及びストレージ制御プログラム - Google Patents

ストレージ制御装置及びストレージ制御プログラム Download PDF

Info

Publication number
JP2016143248A
JP2016143248A JP2015018855A JP2015018855A JP2016143248A JP 2016143248 A JP2016143248 A JP 2016143248A JP 2015018855 A JP2015018855 A JP 2015018855A JP 2015018855 A JP2015018855 A JP 2015018855A JP 2016143248 A JP2016143248 A JP 2016143248A
Authority
JP
Japan
Prior art keywords
control module
storage control
control device
mirror
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015018855A
Other languages
English (en)
Inventor
義勝 御宿
Yoshimasa Mishuku
義勝 御宿
秀治郎 大黒谷
Hidejiro Daikokuya
秀治郎 大黒谷
藤田 賢一
Kenichi Fujita
賢一 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015018855A priority Critical patent/JP2016143248A/ja
Priority to US14/980,090 priority patent/US9600383B2/en
Publication of JP2016143248A publication Critical patent/JP2016143248A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】アクティブ−アクティブ方式のストレージシステムにおいてストレージ制御装置に障害が発生した場合の処理時間を短縮すること。
【解決手段】セグメントグループ毎に通常識別子とバディ識別子をミラーLUN管理テーブル40bで対応付け、制御モジュール3の識別子と状態情報をモジュール管理テーブル40aで対応付ける。そして、ボリューム処理部47がミラーLUN管理テーブル40b及びモジュール管理テーブル40aに基づいてミラーLUNの処理を行う制御モジュール3を決定し、決定した制御モジュール3にI/Oを発行する。
【選択図】図6

Description

本発明は、ストレージ制御装置及びストレージ制御プログラムに関する。
複数のストレージ制御装置を有するストレージシステムにおいて、ストレージシステムを利用する業務サーバからのアクセス方式には、アクティブ−スタンバイ方式とアクティブ−アクティブ方式がある。アクティブ−スタンバイ方式は、ストレージシステムを利用する業務サーバからのアクセス要求をアクティブな1つのストレージ制御装置だけが受け付ける方式である。一方、アクティブ−アクティブ方式は、業務サーバからのアクセス要求をどのストレージ制御装置も受け付けることができる方式である。
アクティブ−アクティブ方式は、業務サーバからのアクセス要求に対する処理が複雑になるが、ストレージ制御装置の負荷を分散できる、障害からの復旧が迅速に行える等の長所があるため、アクティブ−アクティブ方式のストレージシステムが増加する傾向にある。
なお、ボリューム切替に関して、切替元ボリュームのホスト内IDと切替先ボリュームのストレージ内IDとを対応付けた切替テーブルを参照して切替元ボリュームへのアクセス要求を切替先ボリュームに切替えることで、ホスト内IDの枯渇を抑制する技術がある。
また、通常時にはストレージベースの第1のリモートコピーを行い、第1のリモートコピーに障害が発生するとホストベースの第2のリモードコピーに切り替えることにより、ホストへの負荷を抑えつつ障害対応を可能とする技術がある。
また、リモートコピーのボリュームペアのうちの第1のボリュームへのI/Oリクエストが失敗したときに、第2のボリュームにI/Oリスエストを送信し、第2のボリュームを最新の状態とすることでシステムの可用性を向上させる技術がある。
特開2006−309638号公報 特開2006−285919号公報 特開2009−266120号公報
しかしながら、アクティブ−アクティブ方式のストレージシステムでは、ストレージ制御装置に障害が発生した場合に、ストレージシステムの等価性を保つために、処理に時間がかかるという問題がある。ここで、ストレージシステムの等価性が崩れるとは、冗長化のためにミラーリングした2つのデータが等しくなくなることである。
本発明は、1つの側面では、アクティブ−アクティブ方式のストレージシステムにおいてストレージ制御装置に障害が発生した場合の処理時間を短縮することを目的とする。
本願の開示するストレージ制御装置は、1つの態様において、ミラー装置情報記憶部と、装置状態情報記憶部と、入出力処理部とを有する。ミラー装置情報記憶部は、データのミラー処理を制御する複数のストレージ制御装置の識別子を優先度とともにミラー処理の単位毎に記憶する。装置状態情報記憶部は、ストレージ制御装置毎に正常か否かを示す状態情報を記憶する。入出力処理部は、ボリュームに対する入出力要求の発行先のストレージ制御装置を前記ミラー装置情報記憶部及び装置状態情報記憶部に基づいて決定し、該決定したストレージ制御装置に前記入出力要求を発行する。
1実施態様によれば、ストレージ制御装置に障害が発生した場合の処理時間を短縮することができる。
図1は、ミラーLUNを説明するための図である。 図2は、制御モジュールがダウンしたときのミラーLUNへのアクセスパスの切り替えを説明するための図である。 図3Aは、等価性が崩れる例を説明するための第1の図である。 図3Bは、等価性が崩れる例を説明するための第2の図である。 図4は、マネージャによって等価性を保つ方式を説明するための図である。 図5は、実施例に係るストレージシステムの構成を示す図である。 図6は、各制御モジュールの機能構成を示す図である。 図7は、モジュール管理テーブルの一例を示す図である。 図8は、ミラーLUN管理テーブルの一例を示す図である。 図9は、モジュール管理テーブルを用いたミラーLUNへのI/Oを説明するための図である。 図10Aは、制御モジュールがダウンした場合のモジュール管理テーブルの更新を説明するための図である。 図10Bは、制御モジュールがダウンした場合のミラーLUNへのI/Oを説明するための図である。 図11は、I/O再発行を説明するための図である。 図12は、高速等価性回復機構を説明するための図である。 図13は、等価性回復処理を説明するための図である。 図14Aは、ダウンした制御モジュールの再起動時のI/Oの流れを説明するための第1の図である。 図14Bは、ダウンした制御モジュールの再起動時のI/Oの流れを説明するための第2の図である。 図15は、ボリューム処理部によるI/O発行処理のフローを示すフローチャートである。 図16は、クラスタが制御モジュールの異常を検出した時の処理のフローを示すフローチャートである。 図17は、ダウン通知を受信した時のエージェントの処理のフローを示すフローチャートである。 図18は、制御モジュールが再起動した時の処理のフローを示すフローチャートである。 図19は、制御モジュールの再起動時のI/Oの流れを示すシーケンス図である。 図20は、ストレージ制御プログラムを実行する制御モジュールのハードウェア構成を示す図である。
以下に、本願の開示するストレージ制御装置及びストレージ制御プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、アクティブ−アクティブ方式のストレージシステムにおいて等価性を崩すことなくミラーボリュームを構成するためのミラーLUN(Logical Unit Number)について説明する。図1は、ミラーLUNを説明するための図である。
図1において、ストレージシステムは、2台のシェルフ2aを有する。シェルフ2aは、2台の制御モジュール3aとLUNで識別される複数のディスク装置を収容する筐体である。なお、図1では、ディスク装置は省略されている。また、2台のシェルフ2aは、シェルフ#1及びシェルフ#2と表され、4台の制御モジュール3aは、制御モジュール#1〜制御モジュール#4と表される。
ミラーLUN44は、複数のセグメントグループ46を束ねた仮想的なディスク装置であり、1つの制御モジュール3aに1つのミラーLUN44が存在する。ここで、セグメントグループ46は、ミラーリングの処理単位であり、複数のセグメントから構成される。また、セグメントは、ディスク領域の管理単位である。各セグメントグループ46は、いずれかのミラーLUNに属する。ただし、図1では、ミラーLUNが2重化されており、1つのセグメントグループ46が制御モジュール#1のミラーLUN44と制御モジュール#2のミラーLUN44に属する。また、制御モジュール#3と制御モジュール#4に存在するミラーLUN44は省略されている。
ストレージシステムを利用する業務サーバ10は、ストレージシステムが提供するボリューム45へのアクセスを制御モジュール3aに要求する。図1では、例えば、制御モジュール#3及び制御モジュール#4にボリューム45へのアクセスを要求する。業務サーバ10からのアクセス要求を受け付けた制御モジュール3aは、ボリューム45のアクセス領域を含むセグメントグループ46が属するミラーLUN44が存在する制御モジュール3aへアクセス要求を送信する。すなわち、業務サーバ10からのアクセス要求を受け付けた制御モジュール3aは、ボリューム45のアクセス領域を含むセグメントグループ46が属するミラーLUN44へ仮想的にアクセス要求を発行する。図1では、制御モジュール#1及び制御モジュール#2へアクセス要求が発行されている。
そして、アクセス要求が発行された制御モジュール3aは、ミラーLUN44の処理すなわちアクセス要求で指定されるセグメントグループ46についてミラーリング処理を行う。アクセス要求が発行された制御モジュール3aは、セグメントグループ46へのデータの書き込みの場合、ミラーLUN44が存在する制御モジュール3aが2つのディスク装置にデータを書き込むように制御する。
このように、業務サーバ10からボリューム45へのアクセスをミラーLUN44を経由して行うことによって、アクティブ−アクティブ方式のストレージシステムは、等価性を維持することができる。ミラーLUN44を経由しないで業務サーバ10から要求を受け付けた制御モジュール3aがミラーリング処理を行うと、複数の制御モジュール3aが同一セグメントグループ46へ異なるデータを書き込むタイミングによっては等価性が崩れる場合がある。
次に、制御モジュール3aがダウンしたときのミラーLUN44へのアクセスパスの切り替えについて説明する。図2は、制御モジュール3aがダウンしたときのミラーLUN44へのアクセスパスの切り替えを説明するための図である。図2において、シェルフ#1は、4台のディスク装置4を有する。
図2に示すように、制御モジュール#1がダウンすると、バディ制御モジュール3aである制御モジュール#2へミラーLUN44へのアクセスパスの切り替えが行われる。ここで、バディ制御モジュール3aは、同じシェルフ2aに含まれる他の制御モジュール3aである。図2では、制御モジュール#1のバディ制御モジュール3aは制御モジュール#2であり、制御モジュール#2のバディ制御モジュール3aは制御モジュール#1である。
制御モジュール#2は、制御モジュール#1がダウンした場合に、制御モジュール#1のミラーLUN44へのアクセスを引き継ぐ。すなわち、業務サーバ10からアクセス要求を受け付けた制御モジュール3aは、制御モジュール#1に対して行っていたミラーLUN44へのアクセスを制御モジュール#2へ切り替える。図2では、制御モジュール#4が、制御モジュール#1に対して行っていたミラーLUN44へのアクセスを制御モジュール#2へ切り替える。
そして、制御モジュール#2が制御モジュール#1の代わりにディスク装置4へアクセスする。制御モジュール#2が制御モジュール#1の代わりに行うディスク装置4へのアクセスは、バディアクセスと呼ばれる。なお、図2では、説明の便宜上、ミラーディスク装置4へのアクセスは省略されている。
このように、ミラーLUNの存在する制御モジュール3aがダウンした場合に、ミラーLUNを介したアクセスをバディアクセスに切り替えることで、ストレージシステムは運用を継続することができる。そして、ダウンした制御モジュール3aが再起動した場合には、ストレージシステムはバディアクセスを元の通常アクセスに切り替える。
ただし、アクセスパスをバディアクセスから通常のアクセスに切り替える場合に、等価性が崩れる場合がある。図3A及び図3Bは、等価性が崩れる例を説明するための図である。図3Aでは、制御モジュール#2がダウンし、制御モジュール#1がバディ制御モジュール3aとして動作する場合を示す。
図3Aに示すように、制御モジュール#5は、ボリューム45へのデータaのWriteを業務サーバ10から受信する(1)と、バディ制御モジュール3aである制御モジュール#1へデータaの書き込みを要求する(2)。すると、制御モジュール#1は、データaを2つのディスク装置4へ書き込むようにミラー制御を行う。図3Aでは、データが書き込まれる2つのディスク装置4のLUNがlun#1及びlun#2と表わされている。
そして、lun#1へデータaの書き込みが行われる(3)。ここで、lun#1へのデータaの書き込みとは、LUNがlun#1であるディスク装置4へのデータaの書き込みを表す。以下、LUNがlun#n(nは整数)であるディスク装置を単にlun#nと呼ぶ。
一方、lun#2へのデータaの書き込みが何らかの理由で遅れる(4)とする。そして、その間に制御モジュール#2の再起動が行われた(5)とする。すると、図3Bに示すように、ミラーLUNの処理が制御モジュール#2に切り替えられ(6)、制御モジュール#4へ制御モジュール#2の再起動が通知される(7)。そして、業務サーバ10が同じ領域へデータbのWriteを制御モジュール#4に要求する(8)と、制御モジュール#4は、再起動が行われた制御モジュール#2へデータbの書き込みを要求する(9)。
そして、lun#1へデータbの書き込みが行われ(10)、lun#2へデータbの書き込みが行われる(11)。その後、遅れていた制御モジュール#1からのlun#2へのデータaの書き込みが発生する(12)。
このように、バディ制御モジュール3aによるデータaの書き込みが何らかの理由により遅れると、再起動した制御モジュール3aからのデータbの書き込み後にデータaの書き込みが行われる場合があり、lun#1とlun#2が不整合となる(13)。
このような問題の発生を防ぐために、マネージャによって等価性を保つ方式が採用されている。ここで、マネージャとは、ストレージシステム全体を制御するモジュールである。マネージャは、複数の制御モジュール3aのうちの1つで動作する。図4は、マネージャによって等価性を保つ方式を説明するための図である。図4では、制御モジュール#3でマネージャ43aが動作する。
図4に示すように、制御モジュール#2が再起動する(1)と、マネージャ43aは、ボリューム#1への全アクセスを停止させる(2)。ここで、ボリューム#1は、切り替えられた制御モジュール3aに存在するミラーLUN44にアクセス領域が含まれるボリューム45である。
そして、業務サーバ10から同じ領域へのデータbのWriteは停止される(3)。そして、ミラーLUNの処理が制御モジュール#2へ切り替えられる(4)と、マネージャ43aは、ボリューム#1への全アクセスを再開させる(5)。すると、業務サーバ10から同じ領域へのデータbのWriteの要求を受信していた制御モジュール#5は、再起動した制御モジュール#2へデータbの書き込みを要求する(6)。そして、lun#1へのデータbの書き込みが行われ(7)、lun#2へのデータbの書き込みが行われる(8)。
このように、ダウンした制御モジュール3aが復旧した際に、マネージャ43aは、ダウンした制御モジュール3aに存在するミラーLUN44にアクセス領域が含まれるボリューム45へのアクセスを停止させることで、等価性が崩れることを防ぐことができる。
しかしながら、この方式には、ダウンした制御モジュール3aに存在するミラーLUN44にアクセス領域が含まれるボリューム45をマネージャ43aが計算して各制御モジュール3にアクセスの停止を指示する処理に時間がかかるという問題がある。ミラーLUN44は、多くのボリューム45のセグメントグループ46を束ねたものであるため、ミラーLUN44にアクセス領域が含まれるボリューム45の数は多く、ミラーLUN44にアクセス領域が含まれるボリューム45の計算には時間がかかる。したがって、マネージャ43aがボトルネックとなって、I(Input)/O(Output)停止時間が延びてしまう。また、マネージャ43aが動作する制御モジュール3aがダウンした場合、マネージャ43aの再起動が必要になるため、切り替え処理が遅延する。
そこで、実施例に係るストレージシステムは、マネージャに負担をかけることなく等価性を保つように業務サーバ10からのアクセスを制御する。図5は、実施例に係るストレージシステムの構成を示す図である。
図5に示すように、実施例に係るストレージシステム1は、3台のシェルフ2と、インタコネクトスイッチ5とを有する。3台のシェルフ2は、シェルフ#1〜シェルフ#3で表される。なお、ここでは説明の便宜上、3台のシェルフ2のみを示したが、ストレージシステム1は、任意の台数のシェルフ2を有してよい。
シェルフ2は、ストレージシステム1を制御する2台の制御モジュール3と、LUNで識別される4台のディスク装置4とを収容する筐体である。なお、ここでは説明の便宜上、4台のディスク装置4を示したが、シェルフ2は、任意の台数のディスク装置4を収容してよい。また、シェルフ#1が収容する制御モジュール3は、制御モジュール#1及び制御モジュール#2で表され、シェルフ#2が収容する制御モジュール3は、制御モジュール#3及び制御モジュール#4で表される。また、シェルフ#3が収容する制御モジュール3は、制御モジュール#5及び制御モジュール#6で表される。
インタコネクトスイッチ5は、制御モジュール3間を接続するスイッチである。制御モジュール3は、インタコネクトスイッチ5を介して他の制御モジュール3と通信する。
制御モジュール3は、インタフェース31と、インタコネクトインタフェース32と、SAS33(Serial-Attached SCSI)とを有する。インタフェース31は、ストレージシステムを利用する業務サーバ10と通信を行う装置である。インタコネクトインタフェース32は、インタコネクトスイッチ5を介して他のインタコネクトインタフェース32と通信を行う装置である。SAS33は、ディスク装置4と通信を行う装置である。
ディスク装置4は、業務サーバ10が使用するデータを記憶する不揮発性記憶装置であり、HDD(Hard Disk Drive)により実現される。なお、シェルフ2は、ディスク装置4の代わりにSSD(Solid State Drive)を収容しても用いてもよい。
図6は、各制御モジュール3の機能構成を示す図である。図6では、説明の便宜上、シェルフ#3に収容される制御モジュール3は示さないが、シェルフ#3に収容される制御モジュール3はシェルフ#2に収容される制御モジュール3と同様の機能構成を有する。
図6に示すように、各制御モジュール3は、記憶部40と、クラスタ41と、エージェント42と、ボリューム処理部47と、ミラー制御部48とを有する。また、制御モジュール#2は、さらに、マネージャ43を有する。なお、ここでは、制御モジュール#2でマネージャ43が動作するが、マネージャ43は他の制御モジュール3で動作してもよく、いずれか1つの制御モジュール3でマネージャ43が動作する。
記憶部40は、ストレージシステム1の制御に使用されるデータを記憶する。記憶部40は、モジュール管理テーブル40aとミラーLUN管理テーブル40bとを記憶する。モジュール管理テーブル40aは、各制御モジュール3が正常であるか異常であるかを示すテーブルである。
図7は、モジュール管理テーブル40aの一例を示す図である。図7に示すように、モジュール管理テーブル40aは、識別子と状態情報を制御モジュール3毎に対応付けるテーブルである。識別子は、制御モジュール3を識別する番号である。状態情報は、制御モジュール3が正常であるか異常であるかを示す情報である。図7において、○は対応する制御モジュール3が正常であることを示し、×は対応する制御モジュール3がダウンしていることを示す。例えば、識別子が1である制御モジュール3すなわち制御モジュール#1はダウンしている。
ミラーLUN管理テーブル40bは、セグメントグループ46と、ミラーLUN44が存在する2つの制御モジュール3の番号とを対応付けるテーブルである。図8は、ミラーLUN管理テーブル40bの一例を示す図である。図8に示すように、ミラーLUN管理テーブル40bは、グループ番号と、通常識別子と、バディ識別子とを対応付ける。グループ番号は、セグメントグループ46を識別する番号である。
通常識別子は、対応するセグメントグループ46を含むミラーLUN44が存在する制御モジュール3を識別する番号である。バディ識別子は、通常識別子で識別される制御モジュール3がダウンしている場合に代わりに使用されるバディ制御モジュール3を識別する番号である。すなわち、通常識別子で識別される制御モジュール3は、バディ識別子で識別される制御モジュール3より高い優先度でミラーLUN44の処理を行う。例えば、番号が1であるセグメントグループ46を含むミラーLUN44は制御モジュール#1と制御モジュール#2に存在し、通常は制御モジュール#1に存在するミラーLUN44が用いられる。
クラスタ41は、他の制御モジュール3のクラスタ41と連携してストレージクラスタに関する制御を行う。ここで、ストレージクラスタとは、制御モジュール3が故障した場合に、他の制御モジュール3が故障した制御モジュール3の機能を自動的に引き継ぐ機能である。
エージェント42は、制御モジュール3の状態を監視し、異常な制御モジュール3を検出するとクラスタ41に通知する。クラスタ41は、エージェント42から異常な制御モジュール3を通知されると、その制御モジュール3をストレージシステム1から切り離す。また、クラスタ41は、故障した制御モジュール3を他の全ての制御モジュール3に通知する。
エージェント42は、クラスタ41から故障した制御モジュール3を通知されると、モジュール管理テーブル40aを更新する。また、故障した制御モジュール3のバディ制御モジュール3のエージェント42は、クラスタ41から制御モジュール3の故障を通知されると、等価性回復処理を行う。
ボリューム処理部47は、業務サーバ10からのボリューム45へのアクセス要求を処理する。ボリューム処理部47は、アクセスされる領域についてミラーLUN44が存在する2つの制御モジュール3をミラーLUN管理テーブル40bを用いて特定する。そして、ボリューム処理部47は、特定した2つの制御モジュール3のうち通常用いられる制御モジュール3が正常であれば通常用いられる制御モジュール3にI/Oを発行する。また、ボリューム処理部47は、通常用いられる制御モジュール3が正常でなければ、バディ制御モジュール3にI/Oを発行する。
ここで、I/Oを発行するとは、ミラーLUN44の処理を要求することである。また、ボリューム処理部47は、制御モジュール3が正常であるか否かをモジュール管理テーブル40aを参照して判定する。
図9は、モジュール管理テーブル40aを用いたミラーLUN44へのI/Oを説明するための図である。なお、図9〜図14Bにおいて、ミラーLUN#1は制御モジュール#1に存在するミラーLUN44であり、ミラーLUN#2は制御モジュール#2に存在するミラーLUN44である。
業務サーバ10からボリューム45へのI/Oを受信すると(1)、ボリューム処理部47は、モジュール管理テーブル40aを確認する(2)。そして、ボリューム処理部47は、正常な制御モジュール3で優先度が最も高い制御モジュール3にI/Oを発行する(3)。優先度は、通常使用される制御モジュール3がバディ制御モジュール3より高い。したがって、図9では、制御モジュール#1にI/Oが発行される。
このように、ボリューム処理部47は、I/Oを発行する制御モジュール3をモジュール管理テーブル40aを参照して特定することで、通常使用される制御モジュール3が故障した場合にも、I/Oを発行する制御モジュール3を簡単に特定することができる。
図10Aは、制御モジュール3がダウンした場合のモジュール管理テーブル40aの更新を説明するための図であり、図10Bは、制御モジュール3がダウンした場合のミラーLUN44へのI/Oを説明するための図である。
図10Aに示すように、通常I/Oが発行される制御モジュール#1がダウンする(1)と、クラスタ41からのダウン通知に基づいて、制御モジュール#1以外の全制御モジュール3のエージェント42がモジュール管理テーブル40aを更新する(2)。図10Aでは、制御モジュール#2〜#4のモジュール管理テーブル40aにおいて制御モジュール#1の状態が異常であることを示す×に更新される。
そして、図10Bに示すように、ボリューム45に対する業務サーバ10からのI/Oを制御モジュール#4が受信し(3)、制御モジュール#4のボリューム処理部47がモジュール管理テーブル40aを確認する(4)。そして、ボリューム処理部47は、制御モジュール#1が故障しているので、バディ制御モジュール3である制御モジュール#2にI/Oを発行する(5)。
なお、制御モジュール#1がダウンするタイミングによっては、制御モジュール#1に発行したI/Oがボリューム処理部47にエラーで返却される場合がある。そのような場合、ボリューム処理部47は、図11に示すように、バディ制御モジュール3にI/Oを再発行し、業務サーバ10へはエラーが返らないようにする。
図6に戻って、ミラー制御部48は、ミラーLUN44に含まれるセグメントグループ46へのアクセスを制御し、ミラーリングを行う。ミラー制御部48は、アクセスがWriteである場合には、2つのディスク装置4への書き込みを行う。
また、ミラー制御部48は、等価性を回復するための高速等価性回復機構(JRM:Just Resynchronization Mechanism)が等価性回復に用いるJRMセグメントを管理する。ここで、JRMセグメントは、セグメントグループ46毎に書き込み処理中であるか否かを示すビットの集まりである。
図12は、高速等価性回復機構を説明するための図である。ミラー制御部48は、セグメントグループ46への書き込みを行う場合に、JRMセグメント49の対応するビットを1にセットする。そして、ミラー関係にある2つのセグメントグループ46への書き込みが終了すると、ミラー制御部48は、JRMセグメント49の対応するビットを0にリセットする。したがって、制御モジュール3がダウンした場合に、JRMセグメント49に1がセットされているセグメントグループ46は、等価性が崩れている可能性がある。
そこで、エージェント42は、クラスタ41から制御モジュール3のダウンを通知されると、ダウンした制御モジュール3が管理するJRMセグメント49を読み込み、1がセットされているセグメントグループ46について等価性回復処理を行う。ここで、エージェント42は、ダウンした制御モジュール3が管理するJRMセグメント49をマネージャ43を経由せずに直接読み込む。すなわち、バディ制御モジュール3からJRMセグメント49を読み込むことが可能である。JRMセグメント49は、各制御モジュール3に配置され、バディ制御モジュール3からのアクセスは通常のアクセスに比べ性能が劣るため、通常はJRMセグメント49を配置する制御モジュール3からアクセスされる。
図13は、等価性回復処理を説明するための図である。図13に示すように、制御モジュール#1がダウンする(1)と、クラスタ41はバディ制御モジュール3である制御モジュール#2に等価性回復処理を依頼する(2)。すると、制御モジュール#2のエージェント42は、JRMセグメント49を読み込み(3)、オンライン化を行う(4)。ここで、オンライン化とは、バディ制御モジュール3へのI/Oを受け付け可能とすることである。通常時はバディ制御モジュール3へのI/Oは受け付けられないが、異常時には、バディ制御モジュール3へのI/Oが受け付け可能となる。そして、エージェント42は、ミラー関係にある2つのセグメントグループ46について等価性の回復を行う(5)。
ただし、オンライン直後に等価性が回復していない領域にI/Oが来た場合はI/Oを滞留させておき、等価性回復後にバディ制御モジュール3が滞留させたI/Oを処理する。
図6に戻って、マネージャ43は、ストレージシステム1を制御する。マネージャ43はいずれか1つの制御モジュール3で動作し、動作する制御モジュール3が故障すると、クラスタ41により別の制御モジュール3のマネージャ43が起動される。また、各制御モジュール3には1つのミラーLUN44が存在し、各制御モジュール3がミラー制御を行うセグメントグループ46が定義される。
また、ダウンした制御モジュール3が再起動してミラーLUN44へのアクセスをダウンした制御モジュール3へ切り戻す場合に、マネージャ43は、切り替え元の制御モジュール3でI/Oを滞留させる。その理由は、切り戻すときにミラーLUN44へのアクセスが切り替え元と切り替え先の2つの制御モジュール3で二重になることを防ぐためである。切り替え元の制御モジュール3は、ボリューム処理部47からのI/Oを受け付けるが、一時的にI/O処理を滞留させる状態とし、切り替え完了後にエラーを返信してボリューム処理部47にI/Oを再発行させる。
図14A及び図14Bは、ダウンした制御モジュール3の再起動時のI/Oの流れを説明するための図である。図14Aに示すように、制御モジュール#1は、再起動する(1)と、ミラーLUN44を構築する(2)。また、マネージャ43は、制御モジュール#1の代わりにミラーLUN44の処理を行っていた制御モジュール#2にI/O滞留の開始を指示する(3)。
そして、ボリューム45に対する業務サーバ10からのI/Oを制御モジュール#4が受信し(4)、制御モジュール#4のボリューム処理部47がモジュール管理テーブル40aを確認する(5)。そして、ボリューム処理部47は、制御モジュール#1が故障しているので、バディ制御モジュール3である制御モジュール#2にI/Oを発行する(6)。ここで、制御モジュール#2は、I/Oを処理せず、滞留させる(7)。
そして、図14Bに示すように、マネージャ43が各制御モジュール3にモジュール管理テーブル40aを更新するように指示し、各制御モジュール3のエージェント42がモジュール管理テーブル40aを更新する(8)。図14Bでは、制御モジュール#1の状態が正常に更新されている。
そして、制御モジュール#2は、I/Oの滞留を終了し(9)、滞留させたI/OについてI/Oエラーを制御モジュール#4に返却する(10)。すると、制御モジュール#4のボリューム処理部47は、更新されたモジュール管理テーブル40aを参照して制御モジュール#1にI/Oを再発行する(11)。
次に、ボリューム処理部47によるI/O発行処理のフローについて説明する。図15は、ボリューム処理部47によるI/O発行処理のフローを示すフローチャートである。図15に示すように、ボリューム処理部47は、業務サーバ10からI/Oを受信する(ステップS1)。
そして、ボリューム処理部47は、I/O領域についてミラーLUN管理テーブル40bを参照して通常識別子とバディ識別子を取得する(ステップS2)。そして、ボリューム処理部47は、通常識別子で識別される制御モジュール3は正常であるか否かをモジュール管理テーブル40aを参照して判定する(ステップS3)。
そして、通常識別子で識別される制御モジュール3が正常である場合には、ボリューム処理部47は、通常識別子で識別される制御モジュール3をI/Oの発行先として決定し(ステップS4)、決定した制御モジュール3へI/Oを発行する(ステップS5)。
一方、通常識別子で識別される制御モジュール3が正常でない場合には、ボリューム処理部47は、バディ識別子で識別される制御モジュール3は正常であるか否かをモジュール管理テーブル40aを参照して判定する(ステップS6)。
そして、バディ識別子で識別される制御モジュール3が正常である場合には、ボリューム処理部47は、バディ識別子で識別される制御モジュール3をI/Oの発行先として決定し(ステップS7)、決定した制御モジュール3へI/Oを発行する(ステップS5)。一方、バディ識別子で識別される制御モジュール3が正常でない場合には、ボリューム処理部47は、マネージャ43にエラーを報告する(ステップS8)。
このように、ボリューム処理部47は、モジュール管理テーブル40aを参照して制御モジュール3の状態を判定することで、制御モジュール3に故障が発生した場合にもマネージャ43に頼ることなく適切な制御モジュール3へI/Oを発行することができる。
次に、クラスタ41が制御モジュール3の異常を検出した時の処理のフローについて説明する。図16は、クラスタ41が制御モジュール3の異常を検出した時の処理のフローを示すフローチャートである。
図16に示すように、クラスタ41は、制御モジュール3の異常を検出すると、異常が発生した制御モジュール3を切り離す(ステップS11)。そして、異常が発生した制御モジュール3を除く全ての制御モジュール3に、異常が発生した制御モジュール3がダウンしたことを知らせるダウン通知を送信する(ステップS12)。
図17は、ダウン通知を受信した時のエージェント42の処理のフローを示すフローチャートである。図17に示すように、異常が発生した制御モジュール3以外の制御モジュール3のエージェント42は、ダウン通知を受信すると、自装置が異常制御モジュール3のバディであるか否かを判定する(ステップS21)。その結果、バディでない場合には、エージェント42は、モジュール管理テーブル40aを更新して(ステップS22)、処理を終了する。
一方、バディである場合には、エージェント42は、等価性回復対象のセグメントグループ46に対してステップS23〜ステップS27の間の処理を行う。すなわち、エージェント42は、JRMセグメント49を読み込み(ステップS24)、等価性回復対象のセグメントグループ46を特定する。
そして、エージェント42は、オンライン化を行い(ステップS25)、等価性回復処理を行う(ステップS26)。そして、エージェント42は、モジュール管理テーブル40aを更新して(ステップS22)、処理を終了する。
このように、クラスタ41が制御モジュール3の異常を検出した時にダウン通知を異常が発生した制御モジュール3を除く全ての制御モジュール3に送信し、エージェント42がモジュール管理テーブル40aを更新する。したがって、ストレージシステム1は、制御モジュール3に異常が発生した場合にも、マネージャ43を煩わすことなく簡単にバディ制御モジュール3への切り替えを行うことができる。
次に、制御モジュール3が再起動した時の処理のフローについて説明する。図18は、制御モジュール3が再起動した時の処理のフローを示すフローチャートである。図18に示すように、再起動した制御モジュール3は、ミラーLUNを再構築する(ステップS31)。
そして、切り替え元の制御モジュール3がミラーLUNI/Oの滞留を開始する(ステップS32)。ここで、ミラーLUNI/Oとは、ミラーLUN44が存在する制御モジュール3へ発行されるI/Oである。そして、各制御モジュール3は、モジュール管理テーブル40aを更新する(ステップS33)。
そして、切り替え元の制御モジュール3は、ミラーLUNI/Oの滞留を終了する(ステップS34)。そして、切り替え元の制御モジュール3は、滞留I/Oをエラー返却し、発行した制御モジュール3へ再発行を要求する(ステップS35)。
図19は、制御モジュール3の再起動時のI/Oの流れを示すシーケンス図である。図19に示すように、ダウンした制御モジュール3は、再起動を行い(ステップS41)、ミラーLUNを構築する(ステップS42)。そして、再起動した制御モジュール3は、切り替え開始をマネージャ43に依頼する(ステップS43)。
そして、マネージャ43が、切り替え元制御モジュール3にI/O滞留開始を指示する(ステップS44)。その後、業務サーバ10がI/Oを発行すると(ステップS45)、I/Oを受信した制御モジュール3のボリューム処理部47が、モジュール管理テーブル40aを確認し(ステップS46)、切り替え元制御モジュール3にI/Oを発行する(ステップS47)。そして、切り替え元制御モジュールがI/Oを滞留させる(ステップS48)。
また、マネージャ43は、全制御モジュール3にモジュール管理テーブル40aの更新を指示し(ステップS49)、各制御モジュール3は、モジュール管理テーブル40aを更新してマネージャ43に応答する(ステップS50)。そして、マネージャ43は、切り替え元制御モジュール3にI/O滞留の終了を指示する(ステップS51)。すると、切り替え元制御モジュール3は、滞留させたI/OについてI/Oエラーを返却する(ステップS52)。
すると、I/Oエラーを受信したボリューム処理部47は、モジュール管理テーブル40aを確認し(ステップS53)、再起動制御モジュール3にI/Oを再発行する(ステップS54)。そして、再起動制御モジュールがI/Oの処理後、応答をボリューム処理部47に返し(ステップS55)、ボリューム処理部47が業務サーバ10に応答を返す(ステップS56)。
このように、ダウンした制御モジュール3が再起動すると、切り替え元制御モジュールは、I/Oを滞留させ、モジュール管理テーブル40aが更新されると、I/Oエラーを返却する。したがって、ストレージシステム1は、ダウンした制御モジュール3の再起動時にマネージャ43の処理負荷を高くすることなく、等価性を保つことができる。
なお、実施例では、制御モジュール3の機能について説明したが、制御モジュール3が有する機能をファームウェアによって実現することで、同様の機能を有するストレージ制御プログラムを得ることができる。そこで、ストレージ制御プログラムを実行する制御モジュール3のハードウェア構成について説明する。
図20は、実施例に係るストレージ制御プログラムを実行する制御モジュール3のハードウェア構成を示す図である。図20に示すように、制御モジュール3は、図5に示したインタフェース31、インタコネクトインタフェース32及びSAS33に加えて、MPU(Micro Processing Unit)36と、フラッシュメモリ37と、RAM(Random Access Memory)38とを有する。
MPU36は、RAM38に記憶されたファームウェアを読み出して実行する処理装置である。フラッシュメモリ37は、ストレージ制御プログラムとしてファームウェアを記憶する不揮発性のメモリである。RAM38は、フラッシュメモリ37から読み出されたファームウェアを記憶する揮発性メモリである。また、RAM38は、ファームウェアの実行に必要なデータ、ファームウェア実行の途中結果等を記憶する。
なお、ストレージ制御プログラムを記憶する記憶装置としては、他に磁気記憶装置、光ディスク、光磁気記録媒体等がある。磁気記憶装置には、ハードディスク装置(HDD)等がある。光ディスクには、DVD(Digital Versatile Disk)、DVD−RAM、CD−ROM/RW等がある。光磁気記録媒体には、MO(Magneto-Optical disk)等がある。
ストレージ制御プログラムを流通させる場合には、例えば、ストレージ制御プログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、ストレージ制御プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから制御モジュール3にストレージ制御プログラムを転送することもできる。
制御モジュール3は、例えば、可搬型記録媒体に記録されたストレージ制御プログラムもしくはサーバコンピュータから転送されたストレージ制御プログラムを、フラッシュメモリ37に格納する。そして、MPU36は、フラッシュメモリ37からストレージ制御プログラムを読み取り、ストレージ制御プログラムに従った処理を実行する。なお、MPU36は、可搬型記録媒体から直接ストレージ制御プログラムを読み取り、ストレージ制御プログラムに従った処理を実行することもできる。
上述してきたように、実施例では、セグメントグループ46毎に通常識別子とバディ識別子をミラーLUN管理テーブル40bで対応付け、制御モジュール3の識別子と状態情報をモジュール管理テーブル40aで対応付ける。そして、ボリューム処理部47がミラーLUN管理テーブル40b及びモジュール管理テーブル40aに基づいてミラーLUNの処理を行う制御モジュール3を決定し、決定した制御モジュール3にI/Oを発行する。したがって、ストレージシステム1は、制御モジュール3に障害が発生した場合にも、マネージャ43が管理する構成情報に依存することなく、ミラーLUN44の処理を行う制御モジュール3を簡単に切り替えることができる。このため、ストレージシステム1は、障害発生時の処理時間を短縮することができる。
また、実施例では、クラスタ41からのダウン通知に基づいてエージェント42がモジュール管理テーブル40aを更新する。したがって、ストレージシステム1は、制御モジュール3の障害状況をモジュール管理テーブル40aに迅速に反映することができる。
また、実施例では、クラスタ41からのダウン通知に基づいてバディ制御モジュール3のエージェント42が等価性回復処理を行う。したがって、ストレージシステム1は、障害が発生した場合にも、ミラーデータの等価性を保つことができる。
また、実施例では、ミラーLUN44の処理を行う制御モジュール3に障害が発生した場合に、ボリューム処理部47はI/Oエラーを受け取ってバディ制御モジュール3へI/Oを再発行する。したがって、ミラーLUN44の処理を行う制御モジュール3にI/O発行後に、発行先の制御モジュール3がダウンした場合にも、ストレージシステム1は、発行されたI/Oを確実に処理することができる。
また、実施例では、障害が発生した制御モジュール3が復旧した場合に、エージェント42がモジュール管理テーブル40aを更新する。したがって、ストレージシステム1は、ミラーLUNの処理を行う制御モジュール3を簡単に切り戻すことができる。
また、実施例では、障害が発生した制御モジュール3が復旧した場合に、バディ制御モジュール3がI/Oを滞留させ、モジュール管理テーブル40aが更新された後、滞留させたI/Oについてエラーを応答する。したがって、ストレージシステム1は、障害が発生した制御モジュール3が復旧した場合に等価性が崩れることを防ぐことができる。また、ストレージシステム1は、障害が発生した制御モジュール3が復旧した場合に、等価性を保つためにマネージャ43が行う処理を少なくすることができる。したがって、ストレージシステム1は、障害復旧時にマネージャ43による処理がボトルネックとなることを防ぎ、障害復旧の時間を短縮することができる。
また、実施例では、シェルフ2が2台の制御モジュール3を有する場合について説明したが、本発明はこれに限定されるものではなく、シェルフ2が3台以上の制御モジュール3を有する場合にも同様に適用することができる。また、実施例では、同じシェルフ2内の2台の制御モジュール3の一方が他方の制御モジュール3のバディ制御モジュール3となる場合について説明した。しかし、本発明はこれに限定されるものではなく、別のシェルフ2内の制御モジュール3がバディ制御モジュール3となる場合にも同様に適用することができる。
また、バディ制御モジュール3のエージェント42は、等価性回復処理を行う場合に、セグメントグループ46のアクセス属性がRead Onlyでなく、かつ、ミラー面数が2以上のときに限り等価性回復処理を行ってもよい。その理由は、ボリューム処理部47からのアクセスがRead Onlyの場合やミラー面数が1の場合には等価性が崩れることがなく、これらのセグメントグループ46は等価性回復対象から除外することができるためである。
また、全制御モジュール3のダウン後に制御モジュール3が再起動してきた場合も等価性が崩れている可能性があるため、回復処理を行う必要がある。このとき、通常使われる制御モジュール3及びバディ制御モジュール3が同時に立ち上がってきた場合においても両制御モジュール3で等価性回復を行ってしまうと等価性が崩れるため、一方のみで回復処理を行う必要がある。クラスタ41は、全制御モジュール3を等価的に管理しており、通常使われる制御モジュール3とバディ制御モジュール3の特別な構成を認識できない。この構成を認識できるのはマネージャ43のみであるため、全制御モジュール3がダウンした場合には、マネージャ43が等価性回復処理を行う。
1 ストレージシステム
2,2a シェルフ
3,3a 制御モジュール
4 ディスク装置
10 業務サーバ
31 インタフェース
32 インタコネクトインタフェース
33 SAS
36 MPU
37 フラッシュメモリ
38 RAM
40 記憶部
40a モジュール管理テーブル
40b ミラーLUN管理テーブル
41 クラスタ
42 エージェント
43,43a マネージャ
44 ミラーLUN
45 ボリューム
46 セグメントグループ
47 ボリューム処理部
48 ミラー制御部
49 JRMセグメント

Claims (7)

  1. データのミラー処理を制御する複数のストレージ制御装置の識別子を優先度とともにミラー処理の単位毎に記憶するミラー装置情報記憶部と、
    ストレージ制御装置毎に正常か否かを示す状態情報を記憶する装置状態情報記憶部と、
    ボリュームに対する入出力要求の発行先のストレージ制御装置を前記ミラー装置情報記憶部及び装置状態情報記憶部に基づいて決定し、該決定したストレージ制御装置に前記入出力要求を発行する入出力処理部と
    を備えたことを特徴とするストレージ制御装置。
  2. 前記入出力処理部により前記入出力要求が発行されるストレージ制御装置に障害が発生した場合に、障害が発生したストレージ制御装置の状態が異常であることを示すように前記装置状態情報記憶部を更新する更新部
    をさらに備えたことを特徴とする請求項1に記載のストレージ制御装置。
  3. 1つのミラー処理の単位に対応付けられた複数のストレージ制御装置のうちミラー処理を行っていたストレージ制御装置に障害が発生した場合に、ミラーデータ間の等価性回復処理を行う等価性回復部
    をさらに備えたことを特徴とする請求項2に記載のストレージ制御装置。
  4. 前記入出力処理部は、前記入出力要求を発行したストレージ制御装置に障害が発生し、前記入出力要求に対してエラー応答を受け取った場合に、前記更新部により更新された装置状態情報記憶部及び前記ミラー装置情報記憶部に基づいて前記入出力要求の再発行先の他のストレージ制御装置を決定し、該決定した他のストレージ制御装置に前記入出力要求を再発行することを特徴とする請求項2に記載のストレージ制御装置。
  5. 前記更新部は、前記障害からストレージ制御装置が復旧した場合に、復旧したストレージ制御装置の状態が正常であることを示すように前記装置状態情報記憶部を更新することを特徴とする請求項2に記載のストレージ制御装置。
  6. 前記障害からストレージ制御装置が復旧した際に、前記更新部により前記装置状態情報記憶部が記憶する情報が更新されるまでは前記入出力処理部により発行される入出力要求を滞留させるように前記他のストレージ制御装置へ指示する指示部
    をさらに備えたことを特徴とする請求項5に記載のストレージ制御装置。
  7. データのミラー処理を制御する複数のストレージ制御装置の識別子を優先度とともにミラー処理の単位毎に記憶するミラー装置情報記憶部と、ストレージ制御装置毎に正常か否かを示す状態情報を記憶する装置状態情報記憶部とに基づいて、ボリュームに対する入出力要求の発行先のストレージ制御装置を決定し、
    決定したストレージ制御装置に前記入出力要求を発行する
    処理をコンピュータに実行させることを特徴とするストレージ制御プログラム。
JP2015018855A 2015-02-02 2015-02-02 ストレージ制御装置及びストレージ制御プログラム Pending JP2016143248A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015018855A JP2016143248A (ja) 2015-02-02 2015-02-02 ストレージ制御装置及びストレージ制御プログラム
US14/980,090 US9600383B2 (en) 2015-02-02 2015-12-28 Storage controller, method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015018855A JP2016143248A (ja) 2015-02-02 2015-02-02 ストレージ制御装置及びストレージ制御プログラム

Publications (1)

Publication Number Publication Date
JP2016143248A true JP2016143248A (ja) 2016-08-08

Family

ID=56554344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015018855A Pending JP2016143248A (ja) 2015-02-02 2015-02-02 ストレージ制御装置及びストレージ制御プログラム

Country Status (2)

Country Link
US (1) US9600383B2 (ja)
JP (1) JP2016143248A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6307962B2 (ja) * 2014-03-19 2018-04-11 日本電気株式会社 情報処理システム、情報処理方法、及び、情報処理プログラム
US10572357B2 (en) * 2017-03-29 2020-02-25 International Business Machines Corporation Switching over from using a first primary storage to using a second primary storage when the first primary storage is in a mirror relationship

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7152078B2 (en) 2001-12-27 2006-12-19 Hitachi, Ltd. Systems, methods and computer program products for backup and restoring storage volumes in a storage area network
US20060036904A1 (en) * 2004-08-13 2006-02-16 Gemini Storage Data replication method over a limited bandwidth network by mirroring parities
JP2006285919A (ja) 2005-04-05 2006-10-19 Hitachi Ltd 計算機システム、計算機及びリモートコピー処理方法
JP2006309638A (ja) 2005-05-02 2006-11-09 Hitachi Ltd 計算機システムおよびその計算機システムに用いられるホスト計算機およびストレージ装置、ならびに、計算機システムに用いられるボリューム切替方法
JP2009003499A (ja) 2007-06-19 2009-01-08 Hitachi Ltd ファイル共有システム及びファイル共有システムを用いて単一の論理的ディレクトリ構成を生成する方法
JP5222617B2 (ja) 2008-04-28 2013-06-26 株式会社日立製作所 情報システム及びi/o処理方法
JP5521595B2 (ja) 2010-02-05 2014-06-18 富士通株式会社 ストレージシステム及びストレージ制御方法
WO2011161725A1 (en) * 2010-06-24 2011-12-29 Hitachi, Ltd. Storage apparatus and storage management method
JP5954081B2 (ja) * 2012-09-26 2016-07-20 富士通株式会社 ストレージ制御装置、ストレージ制御方法、およびストレージ制御プログラム
US9495251B2 (en) * 2014-01-24 2016-11-15 Commvault Systems, Inc. Snapshot readiness checking and reporting

Also Published As

Publication number Publication date
US9600383B2 (en) 2017-03-21
US20160224446A1 (en) 2016-08-04

Similar Documents

Publication Publication Date Title
US9678686B2 (en) Managing sequentiality of tracks for asynchronous PPRC tracks on secondary
US20180095849A1 (en) Storage cluster failure detection
US8924622B2 (en) Extender storage pool system
JP5968554B2 (ja) ディザスタリカバリ仮想化の方法及び装置
TWI403891B (zh) 直接附加儲存系統之主動-主動失效切換
US20060179218A1 (en) Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks
US20140122816A1 (en) Switching between mirrored volumes
US10719244B2 (en) Multi-mode data replication for data loss risk reduction
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
WO2012075845A1 (zh) 分布式文件系统
JP6040612B2 (ja) ストレージ装置、情報処理装置、情報処理システム、アクセス制御方法、およびアクセス制御プログラム
JP2008112399A (ja) ストレージ仮想化スイッチおよびコンピュータシステム
JP2017010390A (ja) ストレージ制御装置、ストレージ制御プログラム、およびストレージ制御方法
US9342418B2 (en) Storage system, storage control device and data transfer method
CN104268038A (zh) 磁盘阵列的高可用系统
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
CN111158955A (zh) 一种基于卷复制的高可用系统以及多服务器数据同步方法
US8862846B2 (en) Control apparatus, control method, and storage apparatus
JP2016143248A (ja) ストレージ制御装置及びストレージ制御プログラム
JP2016057876A (ja) 情報処理装置、入出力制御プログラム、及び入出力制御方法
JP5505329B2 (ja) ディスクアレイ装置及びその制御方法
JP5947974B2 (ja) 情報処理装置及び情報処理装置の交換支援システム並びに交換支援方法
JP5691227B2 (ja) ストレージ装置及びその制御方法
JP2014041523A (ja) データ管理装置、及び、データ管理方法
JP2012194867A (ja) ストレージ装置および制御装置