JPWO2015198449A1 - ストレージシステム - Google Patents
ストレージシステム Download PDFInfo
- Publication number
- JPWO2015198449A1 JPWO2015198449A1 JP2016528943A JP2016528943A JPWO2015198449A1 JP WO2015198449 A1 JPWO2015198449 A1 JP WO2015198449A1 JP 2016528943 A JP2016528943 A JP 2016528943A JP 2016528943 A JP2016528943 A JP 2016528943A JP WO2015198449 A1 JPWO2015198449 A1 JP WO2015198449A1
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- dkc
- volume
- storage
- health check
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1446—Point-in-time backing up or restoration of persistent data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2028—Failover techniques eliminating a faulty processor or activating a spare
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2058—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2069—Management of state, configuration or failover
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2082—Data synchronisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/10—Program control for peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
- G06F11/0757—Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2056—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
- G06F11/2071—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
図1は、本発明の一実施形態に係る計算機システムの構成例を示す。計算機システムは、ストレージシステム1とホスト2から構成される。ストレージシステム1は、ストレージ装置10a、ストレージ装置10b、Quorum Storage15からなる。
続いて、ストレージシステム1で行われる、ホスト2からのI/O要求に係る処理の概要を説明する。まずストレージ装置10がホスト2に提供するボリュームについて説明する。ストレージ装置10は、自身のディスクユニット12に存在する複数のドライブ121の記憶領域を用いて1以上の論理ボリューム(ボリューム、またはLDEVとも呼ばれる)を形成する。またストレージ装置10は、各論理ボリュームに一意な識別番号(論理ボリューム番号またはLDEV#)を付して管理している。そしてホスト2には、この論理ボリュームを提供する。論理ボリュームの形成方法、及び形成された論理ボリュームをホスト2に提供する方法は、公知のストレージ装置で行われているものと同じである。
続いて、ストレージ装置10とQuorum Storage15との関係について説明する。Quorum Storage15は、少なくとも1つのボリュームを有するストレージデバイスである。またストレージ装置10は、FEPK112のインタフェースにQuorum Storage15等のストレージデバイスが接続された場合、当該ストレージデバイスが有するボリュームにアクセス(リードやライト)できる機能を有している。以下、本実施例では、Quorum Storage15は1つのボリュームを有しているとする。そしてこのボリュームのことを、「Quorum Disk」と呼ぶ。
続いて、図4〜図6を用いて、ストレージ装置10が有する管理情報の内容について説明する。本実施例のストレージ装置10は少なくとも、ペア管理情報T300とLDEVステータス情報T400という管理情報をSM143に格納している。また、SM143には、DKC管理情報ステージングエリア200’、Quorum格納時刻領域250という領域が設けられている。DKC管理情報ステージングエリア200’には、Quorum Disk上に格納されているDKC管理情報(後述)が一時格納(ステージング)される。そして、Quorum格納時刻領域250には、MP141がQuorum Disk上のDKC管理情報を更新した時の時刻が格納される。なお、本実施例では、これらの情報がSM143に格納されていて、MP141はSM143にアクセスすることで上記情報の参照更新を行う例について説明するが、アクセス性能向上のために、SM143に格納されている情報の一部をLM142に複製(キャッシング)しておき、MP141はLM142上にキャッシングされた情報にアクセスするようにしてもよい。
ストレージシステム1は、ボリュームペアを形成する際、最初にP−VOLの内容をすべてS−VOLへとコピーする処理(初期コピー処理と呼ばれる)を行う。この処理中の状態のことを「Initial−Copy状態」と呼ぶ。
初期コピー処理または後述する再同期処理により、P−VOLの内容とS−VOLの内容が同一になったボリュームペアの状態を「Duplex状態」と呼ぶ。
P−VOLの内容がS−VOLに反映されない状態のことを「Suspend状態」と呼ぶ。たとえばストレージ装置10aとストレージ装置10bを接続する伝送線が遮断されて、コピーが不可能になった場合に、ボリュームペアは「Suspend状態」になる。あるいはユーザからの指示によって、ボリュームペアが「Suspend状態」になることもある。なお、ボリュームペアを「Suspend状態」にする処理のことを、サスペンド(Suspend)処理と呼ぶ。
ボリュームペアが、Suspend状態からDuplex状態に遷移するまでの過渡状態にある場合、そのボリュームペアの状態は「Duplex−Pending状態」と呼ばれる。この状態の時、Suspend状態にあったボリュームペアについて、P−VOLとS−VOLの内容を一致(同期)させるため、P−VOL(またはS−VOL)のデータがS−VOL(またはP−VOL)へとコピーされる。コピーが完了した時点で、そのボリュームペアの状態は「Duplex状態」になる。なお、「Suspend状態」のボリュームペアをDuplex状態に遷移させる処理のことを、再同期処理(リシンク処理)と呼ぶ。
続いて、ストレージシステム1で実行される処理の流れを説明していく。以下で説明する処理は、ストレージ装置10のMP141が、LM142上に格納されているプログラムを実行することによって行われる。ストレージ装置10のMP141で実行されるプログラムについて、図4を用いて説明する。
(b) 通信不能ビットマップBのj番目のビットは、通信不能BM_B{j}と表記される。
(c) 閉塞了承ビットマップのj番目のビットは、閉塞了承BM{j}と表記される。
(d) 応答不能ビットマップAのj番目のビットは、応答不能BM_A{j}と表記される。
(e) 応答不能ビットマップBのj番目のビットは、応答不能BM_B{j}と表記される。
(f) 回復中ビットマップのj番目のビットは、回復中BM{j}と表記される。
(現在の時刻−自DKC管理情報.前回時刻[ctc])≧閾値
であるか比較する(閾値はたとえば5秒等の値である)。この閾値のことを、以下では「タイムアウト時間」と呼ぶこともある。自DKC管理情報.前回時刻[ctc]にはS212を実行した時刻(更新世代が更新されていないことを初めて検出した時刻)が格納されている。つまりここでは、更新世代が更新されていないことを初めて検出した時刻から、タイムアウト時間に相当する時間が経過したかを判定しているといえる。タイムアウトでない(更新世代が更新されていないことを初めて検出した時刻から、まだタイムアウト時間に相当する時間は経過していない)場合には(S213:No)、S217に進む。
(更新世代が更新されていないことを検知した時刻した時刻(S212が行われた時刻))+タイムアウト時間=タイムアウト時刻
の関係にある。
(a) 自装置が、自装置とDKC#ctcとの間のパスが遮断されていることをまだ検知していない(自DKC管理情報.通信不能BM_A{ctc}が0)
(b) 自装置が、自装置とDKC#ctcとの間のパスが遮断されていることを検知し(自DKC管理情報.通信不能BM_A{ctc}が1)、かつ自装置の製番がDKC#ctcの製番よりも大きい(自DKC管理情報.製番>DKC管理情報[ctc].製番)
(c) DKC#ctcは、自装置が応答不能の状態にあると判断している(実DKC管理情報[ctc].応答不能BM_A{selfbl}が1である)
(d) DKC#ctcのボリュームがInvalid状態でない(DKC管理情報[ctc].閉塞了承BM{selfbl}が0)
(e) 自装置は、DKC#ctcが応答不能と判定していない(自DKC管理情報.応答不能BM_A{ctc}が0)
(f) 自装置のボリュームがInvalid状態でない(自DKC管理情報.閉塞了承BM{ctc}が0)
以下では、ストレージ装置10に障害が発生した時、またはストレージ装置10aとストレージ装置10b間のパス(DKC間パス)に障害が発生した場合を例にとって、ストレージシステム1で行われる処理の流れを説明する。また最後に、Quorum Diskへの書き込みが遅延した場合の、ストレージシステム1の動作について説明する。
以下では一例として、ストレージ装置10bに障害が発生し、ストレージ装置10bが停止した場合について説明する。なお、上で述べたとおり、ストレージシステム1には、2台より多くのストレージ装置10が含まれる構成もあり得るが、以下では説明の簡単化のため、ストレージシステム1にはホスト2とQuorum Storage15の他には、2台のストレージ装置10(ストレージ装置10a及び10b)のみが存在する構成を例にとって説明する。ストレージ装置10aにはP−VOLが存在し、当該P−VOLとペア関係にあるS−VOLがストレージ装置10bに存在しているものとする。また、Quorum Diskへの登録処理が行われた結果、ストレージ装置10aの配列番号が0、ストレージ装置10bの配列番号が1に決定されているものとする。
以下では一例として、ストレージ装置10a、10b間のパスに障害が発生した場合(ただしストレージ装置10は正常に稼動している)について説明する。なお、(6−1)と同様、ストレージシステム1にはホスト2とQuorum Storage15の他には、2台のストレージ装置10(ストレージ装置10a及び10b)のみが存在する構成を例にとって説明する。ストレージ装置10aにはP−VOLが存在し、当該P−VOLとペア関係にあるS−VOLがストレージ装置10bに存在しているものとする。また、Quorum Diskへの登録処理が行われた結果、ストレージ装置10aの配列番号が0、ストレージ装置10bの配列番号が1に決定されているものとする。
上で説明した(6−2)のケースでは、ストレージ装置10bは、ストレージ装置10bで定期的にヘルスチェック処理(S41)を実行していることが前提のケースである。ただし、ストレージ装置10bで定期的にヘルスチェック処理が行われず、Quorum Diskへの書き込みが遅延する場合もある。これはたとえば、ストレージ装置10bのMP141の負荷が高くなりすぎた場合に発生し得る。このような場合でも、ホスト2が誤ったデータにアクセスすることを防ぐ必要がある。
(現在時刻―格納時刻)>上限値
の関係にあると判定されるため、所定時間待機し(S58)、ふたたびS51からの処理が行われる。
2: ホスト
6: SAN
10a: ストレージ装置
10b: ストレージ装置
11: ストレージコントローラ
12: ディスクユニット
15: Quorum Storage
111: MPB
112: FEPK
113: BEPK
114: CMPK
115: スイッチ(SW)
121: ドライブ
141: MP
142: LM
143: SM
144: CM
Claims (12)
- 第1ストレージ装置と、装置間パスを介して前記第1ストレージ装置に接続された第2ストレージ装置と、前記第1ストレージ装置及び前記第2ストレージ装置に接続された第3ストレージ装置とから構成されるストレージシステムであって、
前記第1ストレージ装置と前記第2ストレージ装置はそれぞれ、ボリュームと、1以上の記憶デバイスを有し、定期的に前記第3ストレージ装置にヘルスチェック情報を書き込むように構成されており、
前記第1ストレージ装置は、ホスト計算機から前記第1ストレージ装置内の第1ボリュームに対するライトデータ及び該ライトデータのライト要求を受け付けると、前記第1ボリュームに前記ライトデータを書き込むとともに、前記装置間パスを介して前記第2ストレージ装置に、前記第2ストレージ装置内の第2ボリュームに前記ライトデータを書き込む指示を発行するよう構成され、
前記第2ストレージ装置は、前記ホスト計算機から前記第2ボリュームに対するライトデータ及び該ライトデータのライト要求を受け付けると、前記装置間パスを介して前記第1ストレージ装置に、前記第1ボリュームに前記ライトデータを書き込む指示を発行するとともに、前記第2ボリュームに前記ライトデータを書き込むように構成されており、
前記第1ストレージ装置は、前記ホスト計算機から受け付けた前記ライト要求の処理中に、前記第2ボリュームへのライトデータの書き込みに失敗した場合、
前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出し、
前記読み出したヘルスチェック情報に基づいて、前記第2ボリュームがI/O不可状態にあるか否かを判断し、
前記第2ボリュームがI/O不可状態にあると判断した後、前記ライト要求に係る処理を再開する、
ことを特徴とする、ストレージシステム。 - 前記第2ストレージ装置は、前記ホスト計算機から受け付けた前記ライト要求の処理中に、前記第1ボリュームへのライトデータの書き込みに失敗した場合、
前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出し、
前記読み出したヘルスチェック情報に基づいて、前記第1ボリュームがI/O不可状態にあるか否かを判断し、
前記第1ボリュームがI/O不可状態にあると判断した後、前記ライト要求に係る処理を再開する、
ことを特徴とする、請求項1に記載のストレージシステム。 - 前記第1ストレージ装置は、前記ホスト計算機から受け付けたライト要求の処理中に、前記第2ボリュームへのライトデータの書き込みに失敗した場合、
前記装置間パスを介した通信ができない状態である旨を表す情報を、前記ヘルスチェック情報に含めて前記第3ストレージ装置に格納し、
前記第2ストレージ装置は、前記第1ストレージ装置が格納した前記ヘルスチェック情報の中に、前記装置間パスを介した通信ができない状態である旨を表す情報が含まれていることを確認すると、前記第2ボリュームをI/O不可状態にする、
ことを特徴とする、請求項1に記載のストレージシステム。 - 前記第2ストレージ装置は、前記第2ボリュームをI/O不可状態にした後、前記第2ボリュームがI/O不可状態にある旨を表す情報を前記ヘルスチェック情報に含めて前記第3ストレージ装置に格納し、
前記第1ストレージ装置は、前記第2ストレージ装置が格納した前記ヘルスチェック情報の中に、前記第2ボリュームがI/O不可状態にある旨を表す情報が含まれていることを確認すると、前記ライト要求に係る処理を再開する、
ことを特徴とする、請求項3に記載のストレージシステム。 - 前記第1ストレージ装置は、前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出した時、前記第2ストレージ装置が前記ヘルスチェック情報を所定時間以上の間、前記第3ストレージ装置に書き込んでいないか否かを判断し、
前記第2ストレージ装置が前記ヘルスチェック情報を所定時間以上、前記第3ストレージ装置に書き込んでいない場合、前記第1ストレージ装置は前記第2ストレージ装置が停止状態にあると判断する、
ことを特徴とする、請求項1に記載のストレージシステム。 - 前記第1ストレージ装置及び前記第2ストレージ装置は、前記ヘルスチェック情報の更新回数に相当する値である更新世代番号を、前記ヘルスチェック情報に含めて前記第3ストレージ装置に格納するよう構成されており、
前記第1ストレージ装置は、前記第2ストレージ装置の書き込んだ更新世代番号が、所定時間以上の間変更されていない場合、前記第2ストレージ装置が停止状態にあると判断することを特徴とする、
請求項5に記載のストレージシステム。 - 前記第1ストレージ装置は、前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出すたびに、前記ヘルスチェック情報に含まれる、前記第2ストレージ装置の書き込んだ更新世代番号を記録しており、
前記第1ストレージ装置はまた、前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出すと、前記読み出されたヘルスチェック情報に含まれる前記第2ストレージ装置の書き込んだ更新世代番号が、前記記録されている更新世代番号と同じか否かを判定することによって、前記第2ストレージ装置の書き込んだ更新世代番号が変更されていないことを判定することを特徴とする、
請求項6に記載のストレージシステム。 - 前記第1ストレージ装置は、前記ヘルスチェック情報に含まれる、前記第2ストレージ装置の書き込んだ更新世代番号が、前記記録されている更新世代番号と同じであることを、初めて検知した時点の時刻を記録しておき、
前記第1ストレージ装置が、前記記録された時刻から所定時間以上経過した後に前記第3ストレージ装置に書き込まれた前記ヘルスチェック情報を読み出した時、
前記読み出されたヘルスチェック情報に含まれる前記第2ストレージ装置の書き込んだ更新世代番号と、前記記録されている更新世代番号が同じである場合、前記第2ストレージ装置の書き込んだ更新世代番号が所定時間以上の間更新されていないと判断することを特徴とする、
請求項7に記載のストレージシステム。 - 前記第1ストレージ装置は前記第2ストレージ装置が停止状態にあると判断すると、前記第2ストレージ装置が停止状態にある旨を表す情報を前記ヘルスチェック情報に含めて前記第3ストレージ装置に書き込み、
前記第2ストレージ装置は起動時に、第3ストレージ装置から前記ヘルスチェック情報を読み出し、
前記ヘルスチェック情報に、前記第2ストレージ装置が停止状態にある旨を表す情報が前記第1ストレージ装置によって書き込まれていることを検出すると、
前記第2ボリュームをI/O不可状態にすることを特徴とする、
請求項5に記載のストレージシステム。 - 前記第2ストレージ装置は、前記第1ボリュームがI/O不可状態にあることを確認した後、前記第2ボリュームに前記ライトデータを書き込むことを特徴とする、
請求項2に記載のストレージシステム。 - 前記第1ストレージ装置及び前記第2ストレージ装置は、前記第3ストレージ装置に前記ヘルスチェック情報を書き込むたびに、前記ヘルスチェック情報を書き込んだ時刻を記憶しており、
前記第2ストレージ装置は、前記ホスト計算機から前記第2ボリュームに対するリード要求を受け付けると、
前記記憶された時刻に基づいて、前記第2ストレージ装置が前記ヘルスチェック情報を一定時間以内に更新したか判定し、
前記ヘルスチェック情報が一定時間以内に更新されていない場合、前記ヘルスチェック情報が更新されるまで、前記リード要求に係る処理を所定時間待機する、
ことを特徴とする、請求項1に記載のストレージシステム。 - 前記ヘルスチェック情報が一定時間以内に更新されている場合、前記第2ボリュームからデータをリードして、前記ホスト計算機に返送する、
ことを特徴とする、請求項11に記載のストレージシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2014/066989 WO2015198449A1 (ja) | 2014-06-26 | 2014-06-26 | ストレージシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015198449A1 true JPWO2015198449A1 (ja) | 2017-04-20 |
JP6230707B2 JP6230707B2 (ja) | 2017-11-15 |
Family
ID=54937579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016528943A Active JP6230707B2 (ja) | 2014-06-26 | 2014-06-26 | ストレージシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10025655B2 (ja) |
JP (1) | JP6230707B2 (ja) |
WO (1) | WO2015198449A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107329698B (zh) * | 2017-06-29 | 2020-08-11 | 杭州宏杉科技股份有限公司 | 一种数据保护方法及存储设备 |
CN107480014B (zh) * | 2017-07-24 | 2021-01-01 | 奇安信科技集团股份有限公司 | 一种高可用设备切换方法及装置 |
JP7363413B2 (ja) | 2019-11-27 | 2023-10-18 | 富士通株式会社 | 情報処理装置、情報処理システム及びプログラム |
JP7315222B2 (ja) * | 2020-04-28 | 2023-07-26 | Necプラットフォームズ株式会社 | ストレージ装置、ストレージ装置の処理方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009266120A (ja) * | 2008-04-28 | 2009-11-12 | Hitachi Ltd | 情報システム及びi/o処理方法 |
JP2009282776A (ja) * | 2008-05-22 | 2009-12-03 | Toshiba Corp | 計算機システム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003076592A (ja) * | 2001-09-04 | 2003-03-14 | Hitachi Ltd | データ格納システム |
US7191298B2 (en) * | 2002-08-02 | 2007-03-13 | International Business Machines Corporation | Flexible system and method for mirroring data |
US7412576B2 (en) * | 2004-12-08 | 2008-08-12 | Hitachi, Ltd. | Remote copy system having multiple data centers |
US20060259815A1 (en) * | 2005-05-10 | 2006-11-16 | Stratus Technologies Bermuda Ltd. | Systems and methods for ensuring high availability |
JP5244332B2 (ja) * | 2006-10-30 | 2013-07-24 | 株式会社日立製作所 | 情報システム、データ転送方法及びデータ保護方法 |
US7610510B2 (en) * | 2007-02-16 | 2009-10-27 | Symantec Corporation | Method and apparatus for transactional fault tolerance in a client-server system |
JP5090022B2 (ja) * | 2007-03-12 | 2012-12-05 | 株式会社日立製作所 | 計算機システム、アクセス制御方法及び管理計算機 |
US7805632B1 (en) * | 2007-09-24 | 2010-09-28 | Net App, Inc. | Storage system and method for rapidly recovering from a system failure |
WO2009141752A2 (en) * | 2008-05-19 | 2009-11-26 | Axxana (Israel) Ltd. | Resilient data storage in the presence of replication faults and rolling disasters |
JP5486793B2 (ja) * | 2008-11-07 | 2014-05-07 | 株式会社日立製作所 | リモートコピー管理システム、方法及び装置 |
US8166136B2 (en) * | 2008-12-24 | 2012-04-24 | National Institute Of Advanced Industrial Science And Technology | Performance reservation storage management system, storage management method, and storage medium |
JP5199464B2 (ja) * | 2009-01-20 | 2013-05-15 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの制御方法 |
WO2010106579A1 (en) * | 2009-03-19 | 2010-09-23 | Hitachi, Ltd. | Storage system and method for controlling storage system |
US8484510B2 (en) * | 2009-12-15 | 2013-07-09 | Symantec Corporation | Enhanced cluster failover management |
US8417899B2 (en) | 2010-01-21 | 2013-04-09 | Oracle America, Inc. | System and method for controlling access to shared storage device |
JP5699852B2 (ja) * | 2011-08-12 | 2015-04-15 | 富士通株式会社 | 情報処理装置、ストレージ制御方法およびプログラム |
US8645649B2 (en) * | 2011-09-29 | 2014-02-04 | Hitachi, Ltd. | Computer system with reservation control |
CN104424048A (zh) * | 2013-08-29 | 2015-03-18 | 国际商业机器公司 | 用于数据存储的方法和装置 |
-
2014
- 2014-06-26 US US15/120,888 patent/US10025655B2/en active Active
- 2014-06-26 WO PCT/JP2014/066989 patent/WO2015198449A1/ja active Application Filing
- 2014-06-26 JP JP2016528943A patent/JP6230707B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009266120A (ja) * | 2008-04-28 | 2009-11-12 | Hitachi Ltd | 情報システム及びi/o処理方法 |
JP2009282776A (ja) * | 2008-05-22 | 2009-12-03 | Toshiba Corp | 計算機システム |
Also Published As
Publication number | Publication date |
---|---|
US20160371136A1 (en) | 2016-12-22 |
WO2015198449A1 (ja) | 2015-12-30 |
JP6230707B2 (ja) | 2017-11-15 |
US10025655B2 (en) | 2018-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6510500B2 (en) | System and method for minimizing message transactions for fault-tolerant snapshots in a dual-controller environment | |
US7827367B2 (en) | Backup control method for acquiring plurality of backups in one or more secondary storage systems | |
RU2596585C2 (ru) | Способ отправки данных, способ приема данных и устройство хранения данных | |
KR101091225B1 (ko) | 메타데이터를 이용한 연속 원격 복사에서 부정합의 검출을 위한 장치, 시스템, 및 방법 | |
US6330642B1 (en) | Three interconnected raid disk controller data processing system architecture | |
US7464236B2 (en) | Storage system and storage management method | |
US7421550B2 (en) | Storage system and storage system management method | |
US6732231B1 (en) | System and method for management of mirrored storage devices storing device serial numbers | |
JP5286212B2 (ja) | ストレージクラスタ環境でのリモートコピー制御方法及びシステム | |
US20100036896A1 (en) | Computer System and Method of Managing Backup of Data | |
US7146526B2 (en) | Data I/O system using a plurality of mirror volumes | |
JPH07239799A (ja) | 遠隔データ・シャドーイングを提供する方法および遠隔データ二重化システム | |
JP6230707B2 (ja) | ストレージシステム | |
US20110196825A1 (en) | Storage system and data duplication method in the same | |
US11126514B2 (en) | Information processing apparatus, information processing system, and recording medium recording program | |
JP6039818B2 (ja) | 情報システム、ホストシステム、及びアクセス制御方法 | |
JP4898609B2 (ja) | ストレージ装置、データ回復方法及び計算機システム | |
US10248511B2 (en) | Storage system having multiple local and remote volumes and multiple journal volumes using dummy journals for sequence control | |
JP2021033782A (ja) | リモートコピーシステム | |
US11256586B2 (en) | Remote copy system and remote copy management method | |
US7130931B2 (en) | Method, system, and article of manufacture for selecting replication volumes | |
US11487459B2 (en) | Information processing apparatus, information processing system, and recording medium storing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6230707 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |