JP2008269105A - 記憶制御装置および記憶制御方法 - Google Patents

記憶制御装置および記憶制御方法 Download PDF

Info

Publication number
JP2008269105A
JP2008269105A JP2007108633A JP2007108633A JP2008269105A JP 2008269105 A JP2008269105 A JP 2008269105A JP 2007108633 A JP2007108633 A JP 2007108633A JP 2007108633 A JP2007108633 A JP 2007108633A JP 2008269105 A JP2008269105 A JP 2008269105A
Authority
JP
Japan
Prior art keywords
storage device
data
repair
additional
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007108633A
Other languages
English (en)
Other versions
JP5052193B2 (ja
Inventor
Tetsuya Shirogane
哲也 白銀
Azuma Kano
東 加納
Ikuya Yagisawa
育哉 八木沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007108633A priority Critical patent/JP5052193B2/ja
Priority to US12/014,233 priority patent/US8074108B2/en
Priority to EP08250225A priority patent/EP2048580A3/en
Publication of JP2008269105A publication Critical patent/JP2008269105A/ja
Application granted granted Critical
Publication of JP5052193B2 publication Critical patent/JP5052193B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Abstract

【課題】メンテナンスに要するコストとRAIDレベルの維持による信頼性とのバランスを考慮して、記憶デバイスの故障に有効に対処する。
【解決手段】記憶デバイス16を収納する筐体42にリペアスロット20、22を設け、RAIDを構成する記憶デバイスのいずかが故障したときに、故障記憶デバイスのデータをスペア記憶デバイスにコピーし、リペアスロットに挿入された追加記憶デバイスをスペア記憶デバイスとして認識し、記憶デバイス16が故障したときには故障記憶デバイスのデータを再生して、リペアスロットに挿入された追加記憶デバイスにコピーし、リペアスロットに挿入された追加記憶デバイスをスペア記憶デバイスとして認識し、記憶デバイスが故障したときには故障記憶デバイスのデータを再生して、リペアスロットに挿入された追加記憶デバイス18にコピーし、RAID6を維持する。
【選択図】図1

Description

本発明は、記憶制御装置および記憶制御方法に係り、特に、上位装置に接続され、上位装置との間で送受信されるデータを、記憶デバイスであるHDD(Hard Disk Drive)に、RAID(Redundant Arrays of Inexpensive Disks)方式によって記憶する記憶制御装置および記憶制御方法に関するものである。
この種の記憶制御装置として、例えば、データが格納される回転型記憶デバイスを備えたドライブと、ドライブと上位装置との間に介在し、ドライブと上位装置との間におけるデータの授受を制御する記憶制御装置とを含むものが知られている(特許文献1参照)。
特許文献1には、ディスクドライブに障害が発生し、動作不能となったときに、ECCグループ(RAIDグループ)の残りのドライブから障害ドライブの全データを回復し、予備のディスクドライブにコピーすること(コレクションコピー)が記載されている。
また、スペアディスクドライブを有する記憶制御システムとして、RAIDを構成しているディスクドライブの1台に障害が起こったときに、RAIDを構成している他のディスクドライブからデータを復旧して、RAIDの縮退状態での動作から、RAIDを構成しているディスクドライブが全て動作する通常のアクセス状態に復旧するようにしたものが提案されている(特許文献2参照)。
さらに、ディスクアレイコントローラと、ドライブインターフェイスによってディスクアレイコントローラに接続され、アレイ状に配列された複数のデータなどを格納するためのディスクドライブと、ディスクドライブに格納されているデータをバックアップするためのデータバックアップ装置とを備え、複数のディスクドライブを予備ディスクドライブとし、残りをデータなどが格納されるデータ/パリティディスクドライブとし、予備ディスクドライブを、障害が生じたデータ/パリティディスクドライブに代わってデータ/パリティディスクドライブとする記憶制御システムが提案されている(特許文献3参照)。
また、記憶制御装置としては、ラックマウント型のディスクアレイ装置が知られており、ラックマウント型のディスクアレイ装置は、筐体に搭載されるラックの内部に、複数のハードディスクユニットやインターフェイスユニットなどが交換可能に設けられている。ハードディスクユニットを交換する場合、ユーザは、筐体の前面側から交換対象のハードディスクユニットを引き抜き、新品のハードディスクユニットを装着する。
一方、ディスクドライブの故障に伴うメンテナンスを容易にするために、障害の生じた障害ディスクドライブを交換不能とし、RAIDを構成するディスクドライブに障害が生じたときには、リペアスロットにリペアディスクドライブを装着させ、リペアディスクドライブを故障ディスクドライブの代わりに用いることが試みられている。この場合、RAIDを構成しているディスクドライブの1台に障害が生じたときに、RAIDを構成している他のディスクドライブからデータを再生してスペアディスクドライブに格納し、スペアディスクドライブをデータディスクドライブとして構成し、リペアスロットに装着されたリペアディスクドライブをスペアディスクドライブとして構成する方式を採用することができる(特許文献2参照)。なお、ホストと情報の授受を行うものも提案されている(特許文献4参照)。
特開平11−191037号公報
特開2002−297322号公報
特開平6−139027号公報
特開平7−14760号公報
しかし、従来技術においては、リペアスロットにリペアディスクドライブが装着されたときに、リペアディスクドライブをスペアディスクドライブとして構成するための操作を手動で行っていたため、この操作が面倒であった。またメンテナンスに要するコストや作業性を考慮すると、リペアスロットの数を多くすればRAIDを構成するディスクドライブに障害が生じたときでも、障害が発生する毎に、リペアスロットにリペアディスクドライブを装着することで故障に対処することはできるが、メンテナンスに要するコストが高くなる。逆に、リペアスロットの数が少なすぎると、RAIDを構成するディスクドライブが複数台故障したときには、この故障に対処することができなくなる。
そこで、この発明は、メンテナンスに要するコストとRAIDレベルの維持による信頼性とのバランスを考慮して、記憶デバイスの故障に有効に対処することを目的とするものである。
前記目的を達成するために、本発明は、予め配置されていた複数の記憶デバイスに故障が生じたときには、複数の記憶デバイスまたはリペアスロットに追加された追加記憶デバイスのうちいずれかをスペア記憶デバイスとして構成し、スペア記憶デバイスに故障記憶デバイスのデータを再生して記憶することを特徴とするものである。
すなわち、本発明は、筐体と、前記筐体内に配置された複数の記憶デバイスと、上位装置と前記各記憶デバイスとの間のデータの入出力を制御するコントローラと、前記コントローラに電力と供給する周辺装置と、前記複数の記憶デバイスのうちいずれかの故障時に追加される追加記憶デバイスを前記筐体に固定する複数のリペアスロットと、を備え、前記コントローラは、前記複数の記憶デバイスの故障時に、前記複数の記憶デバイスまたは前記追加記憶デバイスのうちスペア記憶デバイスを構成する記憶デバイスに、故障記憶デバイスのデータを再生して記憶する、ことを特徴とするものである。
本発明の好適な形態は、さらに以下の特徴を備える。前記リペアスロットに固定された追加記憶デバイスは、前記複数の記憶デバイスに優先して、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる。前記複数の記憶デバイスは、データ記憶デバイスと、スペア記憶デバイスを備え、前記リペアスロットに固定された追加記憶デバイスは、前記複数の記憶デバイスに属するスペア記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる。
前記複数の記憶デバイスは、データ記憶デバイスと、スペア記憶デバイスを備え、前記複数のリペアスロットにそれぞれ固定された追加記憶デバイスのうち先に固定された追加記憶デバイスは、前記複数の記憶デバイスに属するスペア記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成し、前記リペアスロットに後に固定された追加記憶デバイスは、前記リペアスロットに先に固定された追加記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、故障記憶デバイスのデータを前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに追加記憶デバイスが固定されていないことを条件に、故障記憶デバイスのデータを再生して前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記リペアスロットの一方に追加記憶デバイスが固定されているときには、故障記憶デバイスのデータを再生して前記リペアスロットの一方に固定された追加記憶デバイスに記憶し、前記リペアスロットの他方に追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに追加記憶デバイスが固定されていないことを条件に、前記いずれかのリペアスロットに対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを再生して前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記リペアスロットの一方に追加記憶デバイスが固定されているときには、前記リペアスロットの他方に対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを再生して前記リペアスロットの一方に固定された追加記憶デバイスに記憶し、前記リペアスロットの他方に追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する。
さらに、他の発明は、互いにRAIDグループを構成する複数の記憶デバイスと、故障が生じた記憶デバイスのデータを退避させるためのスペア記憶デバイスと、複数のリペアスロットに固定された追加記憶デバイスとを備える記憶装置と上位計算機との間でのデータの授受を制御する記憶制御方法において、前記記憶デバイスの故障を検出する第1工程と、故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記スペア記憶デバイスにコピーする第2工程と、前記複数のリペアスロットのうち一方に固定された追加記憶デバイスを前記スペア記憶デバイスに代わる第2のスペア記憶デバイスとして処理する第3工程と、故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記第2のスペア記憶デバイスにコピーする第4工程と、前記複数のリペアスロットのうち他方に固定された追加記憶デバイスを前記第2のスペア記憶デバイスに代わる第3のスペア記憶デバイスとして処理する第5工程と、故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記第3のスペア記憶デバイスにコピーする第6工程と、を実行することを特徴とするものである。
本発明によれば、メンテナンスに要するコストとRAIDレベルの維持による信頼性とのバランスを考慮して、記憶デバイスの故障に有効に対処することできる。
次に、本発明の実施形態を、図面を用いて説明する。図1は、本発明の実施形態が適用される記憶制御装置のブロック構成図である。図1において、記憶制御装置(ディスクアレイ装置)10は、2台のコントローラ12、2台のSAS(Serial Attached SCSI)エキスパンダ14、複数台の記憶デバイス16、追加記憶デバイス18を挿入するためのリペアスロット20、22、周辺装置24を備えて構成されている。周辺装置24は、電源26、ファン28などを備え、電源26から各部に電力を供給するようになっている。
各コントローラ12は、制御プロセッサ30、ホスト通信ポート32、キャッシュメモリ34、ディスク通信ポート36を備え、ホスト通信ポート32がファイバチャネルなどの接続用インターフェイス38を介してホスト(上位計算機)40に接続されている。各コントローラ12における制御プロセッサ30は、プログラムにしたがって各種の演算を行うとともに、ホスト通信ポート32、接続用インターフェイス38を介して、ホスト40との間のデータの入出力を制御するとともに、ディスク通信ポート36、SASエキスパンダ14を介して記憶デバイス16、追加記憶デバイス18との間のデータの入出力を制御する制御部として構成されている。制御プロセッサ30の処理に伴うデータはキャッシュメモリ34に一時的に格納されるようになっている。
12台の記憶デバイス16は、それぞれSASエキスパンダ14のポートP0〜P11に接続されており、ポートP0〜ポートP8に接続された9台の記憶デバイス(#0〜#8の記憶デバイス)16はデータドライブ(9D)を構成し、ポートP9、P10にそれぞれ接続された記憶デバイス(#9〜#10の記憶デバイス)16はパリティドライブ(2P)を構成し、ポートP11に接続された記憶デバイス(#11の記憶デバイス)16はスペアドライブ(1S)を構成するようになっている。すなわち、記憶デバイス16は、9台のデータドライブ(9D)と2台のパリティドライブ(2P)と1台のスペアドライブ(1P)によってRAID6を構成し、図2に示すように、筐体42内に収納されて固定されている。なお、記憶デバイス16としては、ハードディスク装置(HDD)、フレキシブルディスク装置、フラッシュメモリなどの記憶装置を用いることができる。
筐体42は、ほぼ直方体形状に形成されており、その前面側には警告ランプ44、レディ表示ランプ46が装着されているとともに、リペアスロット20、22が形成されている。各リペアスロット20、22には追加記憶デバイス18がリペアドライブ(リペアディスク)として挿入可能に形成されている。
各リペアスロット20、22には、図3に示すように、キャニスタ48に、ばね力を利用した返し50、52がリペアスロット20、22に沿って配置されている。各返し50、52は、リペアスロット20、22内に追加記憶デバイス18が挿入されたときに、追加記憶デバイス18の挿入を容易とするが、物理的な取り外しを不可能とするように、追加記憶デバイス18を固定する構造となっている。そして各リペアスロット20、22の側面側には追加記憶デバイス18を装着するためのコネクタ54が固定されており、各コネクタ54はSASエキスパンダ14のポートP12、P13にそれぞれ接続されている。
次に、記憶デバイス16の故障に伴う処理を図4のフローチャートに基づいて説明する。この一連の処理は、各コントローラ12における制御プロセッサ30によって実行される。
まず、制御プロセッサ30は、一定の時間間隔あるいは割り込み処理にしたがって、各記憶デバイス16を管理するためのテーブルとして、例えば、図5に示すように、制御テーブル60と監視テーブル62を検索して、各記憶デバイス16等の状態に関するデータを取り込み(S1)、ポートP0〜ポートP10に接続された記憶デバイス(#0〜#10の記憶デバイス)16がインストールされ、RG(Raid Group)0を構成するディスクドライブであることを判別するとともに、ポートP11に接続された記憶デバイス(#11の記憶デバイス)16をスペアドライブとして判別し、リペアスロット20、22には追加記憶デバイス18がインストールされていないことを判別する。
この後、制御プロセッサ30は、制御テーブル60と監視テーブル62を常時監視しながら処理を実行し、制御テーブル60と監視テーブル62の状態を基に記憶デバイス16に故障が生じたか否かを判定する(S2)。記憶デバイス16に故障が生じていないと判定したときには、制御プロセッサ30は、記憶デバイス16は、正常状態にあって、RAID6(9D+2P)を構成していると判断し、再びステップS2の処理を実行する。
一方、記憶デバイス16のいずれかが故障したと判定したとき、例えば、ポートP4に接続された記憶デバイス(#4の記憶デバイス)16が故障(Failure)したときには(図5(b)参照)、制御プロセッサ30は、リペアスロット20、22が空か否かを判定する(S3)。このとき、記憶デバイス16は、RAID5(9D+1B)を構成することになる。
ここで、リペアスロット20、22が空であると判定したときには、制御プロセッサ30は、リペアスロット20、22のうちいずれか一方、例えば、リペアスロット20に、リペアドライブ(追加記憶デバイス18)の挿入を促すために、警告ランプ44を点灯するとともに、監視テーブル62の状態を「Warning」、RAID5(9D+1P)とし(S4)、ポートP4に接続された記憶デバイス(#4の記憶デバイス)16を故障記憶デバイスとして閉塞(OFF)し(S5)、ポートP11に接続された記憶デバイス(#11の記憶デバイス)16をスペアドライブ(1S)として起動し(図5(c)、(d)参照)、故障記憶デバイス(#4の記憶デバイス)16のデータを、パリティドライブを構成する記憶デバイス16とデータドライブを構成する記憶デバイス16から再生して、スペアドライブ(1S)にコピー(コレクションコピー)する(S6)。このときの制御テーブル60と監視テーブル62の状態を図5(e)に示す。
この後、制御プロセッサ30は、リペアスロット20にリペアドライブ(リペアディスク)がインストールされるまで、リペアスロット20にリペアディスクがインストールされた否かを判定する(S7)。ここで、リペアスロット20に追加記憶デバイス(リペアディスク)18がインストールされると、制御プロセッサ30は、この状態を識別し(図5(f)、(g)参照)、インストールされた追加記憶デバイス(リペアディスク)18をスペアディスク(1S)として認識する(S8)。このとき、制御プロセッサ30は、図5(f)〜(i)に示すように、正常状態に復帰したと判断し、記憶デバイス16は、RAID6(9D+2B)を構成することになる。
次に、リペアスロット20にインストールされた追加記憶デバイス(リペアディスク)18をスペアディスク(1S)として認識した後、制御プロセッサ30は、制御テーブル60と監視テーブル62の状態を監視しながら、記憶デバイス16に故障が生じたか否かを判定し(S2)、故障が生じた場合、例えば、図6(a)に示すように、ポートP9に接続された記憶デバイス(#9の記憶デバイス)16が故障(Failure)したときには、リペアスロット22が空か否かを判定し(S3)、リペアスロット22が空であるときには、リペアスロット22に、リペアドライブ(追加記憶デバイス18)の挿入を促すために、警告ランプ44を点灯するとともに、監視テーブル62の状態を「Warning」、RAID5(9D+1P)とし(S4)、ポートP9に接続された記憶デバイス(#9の記憶デバイス)16を故障記憶デバイスとして閉塞(OFF)し(S5)、故障記憶デバイス(#9の記憶デバイス)16のデータをパリティディスクの記憶デバイス16とデータドライブの記憶デバイス16から再生し、ポートP12に接続された追加記憶デバイス(スペアディスク)18にコピー(コレクションコピー)する(S6)。このときの状態を図6(b)〜(f)に示す。
次に、制御プロセッサ30は、リペアスロット22にリペアディスクがインストールされるまで、リペアスロット22にリペアディスクがインストールされた否かを判定する(S7)。ここで、リペアスロット22に追加記憶デバイス(リペアディスク)18がインストールされると、制御プロセッサ30は、この状態を識別し(図6(f)、(g)参照)、インストールされた追加記憶デバイス(リペアディスク)18をスペアディスク(1S)として認識する(S8)。このとき、制御プロセッサ30は、図6(g)に示すように、正常状態に復帰したと判断し、記憶デバイス16は、RAID6(9D+2P)を構成することになる。
次に、リペアスロット22にインストールされた追加記憶デバイス(リペアディスク)18をスペアディスク(1S)として認識した後、制御プロセッサ30は、制御テーブル60と監視テーブル62の状態を監視しながら、記憶デバイス16に故障が生じたか否かを判定し(S2)、故障が生じた場合、例えば、図6(i)に示すように、ポートP6に接続された記憶デバイス(#6の記憶デバイス)16が故障(Failure)したときには、リペアスロット20、22が空か否かを判定し(S3)、リペアスロット20、22がそれぞれ空でないと判定したときには、故障した記憶デバイス16は、3台目か否かを判定し(S9)、3台目と判定したときには、ポートP4に接続された記憶デバイス(#4の記憶デバイス)16、ポートP9に接続された記憶デバイス(#9の記憶デバイス)16に続いて、ポートP6に接続された記憶デバイス(#6の記憶デバイス)16が故障(Failure)したとして、監視用ディスプレイ上に警告文、例えば「これ以上リペアスロットを使用して冗長度を維持できないので、新しい装置を導入する必要があります。」といった警告文をディスプレイ上に表示し(S10)、ステップS2の処理に戻る。
この後、さらに制御プロセッサ30は、制御テーブル60と監視テーブル62の状態を監視しながら、記憶デバイス16が故障したか否かを判定し(S2)、例えば、ポートP5に接続された記憶デバイス(#5の記憶デバイス)16が故障(Failure)したときには、リペアスロット20、22に空きかあるか否かを判定し(S3)、リペアスロット20、22に空きがないときには、3台目の記憶デバイス16の故障か否かを判定し(S9)、4台目であるとき、すなわち、ポートP4、P6、P9に接続された記憶デバイス(#4、#6、#9の記憶デバイス)16に続いて、ポートP5に接続された記憶デバイス(#5の記憶デバイス)16が故障したときには、システムを停止し(S11)、このルーチンでの処理を終了する。このときの状態を図6(j)に示す。
次に、プロセッサ130の処理内容を、コントローラ12に接続されたディスプレイ80の画面上に表示するときの表示例について説明する。例えば、図7(a)に示すように、ディスプレイ80の画面上には、ハードウエア構成82、論理構成84、ファンクション86、88に関する要素がアレイ状に表示される。このときハードウエア構成82をクリックすると、シャーシ90が表示され(図7(b)参照)、このあとシャーシ90をクリックすると、図7(c)に示すように、コントローラ92、内部デバイス94、リペアスロット96、98が表示される。このとき、コントローラ92をクリックすると、図7(d)に示すように、コントローラの状態が表示され、内部デバイス94をクリックすると、図7(e)に示すように、各記憶デバイス16の状態が表示される。
またファンクション88をクリックすると、図7(f)に示すように、その内容がアラートとして表示される。またポートP4に接続された記憶デバイス(#4の記憶デバイス)16が故障したときには、図7(g)に示すように、その旨が表示される。この場合、Order89を操作することで、オンラインのWebサイトへリンクされ、部品を発注することが可能となっている。処理を終了するときには、図7(h)に示すような画面表示となる。
一方、リペアスロット20、22にリペアドライブが挿入されたときには、図8(a)に示すように、ディスプレイ80の画面上には、リペアディスクが挿入された旨が表示される。このあと、リペアドライブがスペアドライブとして認識されたときには、図8(b)に示すように、ディスプレイ80の画面上にはその旨が表示される。
一方、ツリー表示を更新するための操作を行うと、図8(c)に示すように、ディスプレイ80にはツリー表示更新画面が表示され、このあと、マウスでリペアスロット20に対応したリペアスロット96を選択すると、リペアスロット20に関する情報がディスプレイ80の画面上に表示される。次にマウスでリペアスロット22に対応したリペアスロット98を選択すると、図8(e)に示すように、リペアスロット22に関する情報がディスプレイ80の画面上に表示される。
また、コレクションコピーが行われているときには、図8(f)に示すように、その旨がディスプレイ80の画面上に表示され、リペアディスクがスペアディスクとして認識されたときには、その旨がディスプレイ80の画面上に表示され(図8(g)参照)、リペアスロット20にインストールされたリペアディスクも故障したときには、その旨がディスプレイ80の画面上に表示される(図8(h)参照)。
一方、リペアスロット20、22に規格外のリペアディスクがインストールされたときには、その旨がディスプレイ80の画面上に表示され(図8(i)参照)、この後、ツリー表示更新操作を行うと、その旨がディスプレイ80の画面上に表示され(図8(j)参照)、マウスでリペアスロット96を操作すると、リペアスロット20にインストールされたリペアディスクが正規のものでない旨がディスプレイ80の画面上に表示される(図8(k)参照)。
本実施形態によれば、記憶デバイス16を収納する筐体42にリペアスロット20、22を設け、RAID6レベルを構成する記憶デバイス16のいずれかが故障したときに、故障記憶デバイスのデータをスペア記憶デバイスにコピーし、リペアスロット20に挿入された追加記憶デバイス18をスペア記憶デバイスとして認識することで、RAID6レベルを維持し、その後、記憶デバイス16が故障したときには故障記憶デバイス16のデータを再生して、リペアスロット20に挿入された追加記憶デバイス18にコピーし、リペアスロット22に挿入された追加記憶デバイス18をスペア記憶デバイスとして認識することで、RAID6レベルを維持し、その後、記憶デバイス16が故障したときには故障記憶デバイスのデータを再生して、リペアスロット22に挿入された追加記憶デバイス18にコピーすることで、RAID6レベルを維持することができる。
本実施形態の記憶制御装置のブロック構成図である。 筐体の斜視図である。 (a)はキャニスタの透視図、(b)はキャニスタの斜視図、(c)はキャニスタの拡大図である。 記憶デバイスの故障発生時の処理を説明するためのフローチャートである。 記憶デバイスの状態を説明するための制御テーブルと監視テーブルの構成図である。 記憶デバイスの状態を説明するための制御テーブルと監視テーブルの構成図である。 保守用ディスプレイの表示例を説明するための図である。 保守用ディスプレイの表示例を説明するための図である。
符号の説明
10 記憶制御装置、12 コントローラ、16 記憶デバイス、18 追加記憶デバイス、20、22 リペアスロット、30 制御プロセッサ

Claims (11)

  1. 筐体と、
    前記筐体内に配置された複数の記憶デバイスと、
    上位装置と前記各記憶デバイスとの間のデータの入出力を制御するコントローラと、
    前記コントローラに電力と供給する周辺装置と、
    前記複数の記憶デバイスのうちいずれかの故障時に追加される追加記憶デバイスを前記筐体に固定する複数のリペアスロットと、を備え、
    前記コントローラは、前記複数の記憶デバイスの故障時に、前記複数の記憶デバイスまたは前記追加記憶デバイスのうちスペア記憶デバイスを構成する記憶デバイスに、故障の生じた故障記憶デバイスのデータを再生して記憶する、ことを特徴とする記憶制御装置。
  2. 前記リペアスロットに固定された追加記憶デバイスは、前記複数の記憶デバイスに優先して、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる、ことを特徴とする請求項1に記載の記憶制御装置。
  3. 前記複数の記憶デバイスは、RAIDを構成する記憶デバイスと、故障の生じた故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを備え、前記リペアスロットに固定された追加記憶デバイスは、前記スペア記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる、ことを特徴とする請求項1に記載の記憶制御装置。
  4. 前記複数の記憶デバイスは、RAIDを構成する記憶デバイスと、故障の生じた故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを備え、前記複数のリペアスロットにそれぞれ固定された追加記憶デバイスのうち先に固定された追加記憶デバイスは、前記スペア記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成し、前記リペアスロットに後に固定された追加記憶デバイスは、前記リペアスロットに先に固定された追加記憶デバイスの代わりに、前記故障記憶デバイスのデータを記憶するためのスペア記憶デバイスを構成してなる、ことを特徴とする請求項1に記載の記憶制御装置。
  5. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、故障の生じた故障記憶デバイスのデータを前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  6. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに追加記憶デバイスが固定されていないことを条件に、故障の生じた故障記憶デバイスのデータを再生して前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  7. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記リペアスロットの一方に追加記憶デバイスが固定されているときには、故障記憶デバイスのデータを再生して前記リペアスロットの一方に固定された追加記憶デバイスに記憶し、前記リペアスロットの他方に追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  8. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  9. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記いずれかのリペアスロットに追加記憶デバイスが固定されていないことを条件に、前記いずれかのリペアスロットに対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを再生して前記複数の記憶デバイスの中のスペア記憶デバイスに記憶し、前記いずれかのリペアスロットに追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  10. 前記コントローラは、前記複数の記憶デバイスのうちいずれかの故障時に、前記リペアスロットの一方に追加記憶デバイスが固定されているときには、前記リペアスロットの他方に対する追加記憶デバイスの追加を促す警告信号を外部装置に出力するとともに、故障記憶デバイスのデータを再生して前記リペアスロットの一方に固定された追加記憶デバイスに記憶し、前記リペアスロットの他方に追加記憶デバイスが固定されたときに、当該追加記憶デバイスに、その後の故障記憶デバイスのデータを再生して記憶する、ことを特徴とする請求項1に記載の記憶制御装置。
  11. 互いにRAIDグループを構成する複数の記憶デバイスと、故障が生じた記憶デバイスのデータを退避させるためのスペア記憶デバイスと、複数のリペアスロットに固定された追加記憶デバイスとを備える記憶装置と上位計算機との間でのデータの授受を制御する記憶制御方法において、
    前記記憶デバイスの故障を検出する第1工程と、
    故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記スペア記憶デバイスにコピーする第2工程と、
    前記複数のリペアスロットのうち一方に固定された追加記憶デバイスを前記スペア記憶デバイスに代わる第2のスペア記憶デバイスとして処理する第3工程と、
    故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記第2のスペア記憶デバイスにコピーする第4工程と、
    前記複数のリペアスロットのうち他方に固定された追加記憶デバイスを前記第2のスペア記憶デバイスに代わる第3のスペア記憶デバイスとして処理する第5工程と、
    故障が生じた記憶デバイスのデータを、前記RAIDグループを構成する他の記憶デバイスのデータに基づいて再生し、これを前記第3のスペア記憶デバイスにコピーする第6工程と、を実行する記憶制御方法。
JP2007108633A 2007-04-17 2007-04-17 記憶制御装置および記憶制御方法 Expired - Fee Related JP5052193B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007108633A JP5052193B2 (ja) 2007-04-17 2007-04-17 記憶制御装置および記憶制御方法
US12/014,233 US8074108B2 (en) 2007-04-17 2008-01-15 Storage controller and storage control method
EP08250225A EP2048580A3 (en) 2007-04-17 2008-01-17 Storage controller and storage control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007108633A JP5052193B2 (ja) 2007-04-17 2007-04-17 記憶制御装置および記憶制御方法

Publications (2)

Publication Number Publication Date
JP2008269105A true JP2008269105A (ja) 2008-11-06
JP5052193B2 JP5052193B2 (ja) 2012-10-17

Family

ID=39873444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007108633A Expired - Fee Related JP5052193B2 (ja) 2007-04-17 2007-04-17 記憶制御装置および記憶制御方法

Country Status (3)

Country Link
US (1) US8074108B2 (ja)
EP (1) EP2048580A3 (ja)
JP (1) JP5052193B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015162037A (ja) * 2014-02-27 2015-09-07 富士通株式会社 中継装置、ストレージ装置、および中継プログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7647526B1 (en) * 2006-12-06 2010-01-12 Netapp, Inc. Reducing reconstruct input/output operations in storage systems
JP2010020570A (ja) * 2008-07-11 2010-01-28 Hitachi Ltd 情報処理システム及びデータ回復方法
JP4719802B2 (ja) * 2009-03-09 2011-07-06 富士通株式会社 ストレージ管理装置、ストレージ管理方法およびストレージシステム
US8201019B2 (en) * 2009-04-28 2012-06-12 International Business Machines Corporation Data storage device in-situ self test, repair, and recovery
US8566496B2 (en) * 2010-12-03 2013-10-22 Lsi Corporation Data prefetch in SAS expanders
US20140149785A1 (en) * 2011-10-25 2014-05-29 M. Scott Bunker Distributed management
US20150378858A1 (en) * 2013-02-28 2015-12-31 Hitachi, Ltd. Storage system and memory device fault recovery method
JP6212934B2 (ja) * 2013-05-07 2017-10-18 富士通株式会社 ストレージシステム、情報処理装置の制御プログラム、およびストレージシステムの制御方法
JP2015005037A (ja) * 2013-06-19 2015-01-08 富士通株式会社 情報処理装置、情報処理装置の制御プログラム、および情報処理装置の制御方法
TWI512603B (zh) 2013-08-23 2015-12-11 Ibm 電子裝置及其資料回置方法
US10042730B2 (en) * 2014-08-19 2018-08-07 Western Digital Technologies, Inc. Mass storage chassis assembly configured to accommodate predetermined number of storage drive failures
US10089307B2 (en) 2014-12-31 2018-10-02 International Business Machines Corporation Scalable distributed data store
US10223222B2 (en) * 2015-12-21 2019-03-05 International Business Machines Corporation Storage system-based replication for disaster recovery in virtualized environments
CN107168817B (zh) * 2016-03-07 2020-05-08 华为技术有限公司 应用于存储阵列的数据修复方法与装置及存储设备
CN107046485A (zh) * 2017-06-01 2017-08-15 郑州云海信息技术有限公司 一种远程定位异常设备位置的方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221875A (ja) * 1995-02-01 1996-08-30 Hewlett Packard Co <Hp> データ記憶システムにおける仮想容量の過大割当てを避ける方法
JP2007087039A (ja) * 2005-09-21 2007-04-05 Hitachi Ltd ディスクアレイシステム及びその制御方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2742186B2 (ja) 1992-10-28 1998-04-22 株式会社日立製作所 ディスクドライバ,ディスクアレイ装置,データ記憶システム及びディスクアレイシステムのデータバックアップ方法
GB2278228B (en) 1993-05-21 1997-01-29 Mitsubishi Electric Corp An arrayed recording apparatus
JP3009987B2 (ja) 1993-11-19 2000-02-14 武藤工業株式会社 ディスクアレイ装置
JPH10254642A (ja) * 1997-03-14 1998-09-25 Hitachi Ltd 記憶装置システム
JP3400328B2 (ja) 1997-12-26 2003-04-28 株式会社日立製作所 データ記憶方法およびデータ記憶装置
US6598174B1 (en) * 2000-04-26 2003-07-22 Dell Products L.P. Method and apparatus for storage unit replacement in non-redundant array
JP2002297322A (ja) 2001-03-30 2002-10-11 Hitachi Ltd 冗長性を有するディスク記憶装置
US20030217305A1 (en) * 2002-05-14 2003-11-20 Krehbiel Stanley E. System, method, and computer program product within a data processing system for assigning an unused, unassigned storage device as a replacement device
US7139931B2 (en) * 2002-08-19 2006-11-21 Aristos Logic Corporation Method of controlling the system performance and reliability impact of hard disk drive rebuild
JP2005100259A (ja) * 2003-09-26 2005-04-14 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP4634049B2 (ja) * 2004-02-04 2011-02-16 株式会社日立製作所 ディスクアレイ装置における異常通知制御
US7249277B2 (en) * 2004-03-11 2007-07-24 Hitachi, Ltd. Disk array including plural exchangeable magnetic disk unit
US7533292B2 (en) * 2004-07-15 2009-05-12 International Business Machines Corporation Management method for spare disk drives in a raid system
WO2007012920A1 (en) * 2005-07-27 2007-02-01 Adaptec, Inc. Method and system for improving the performance of reed-solomon parity operations in redundant array of inexpensive disks
US7644304B2 (en) * 2006-08-28 2010-01-05 Dell Products L.P. Using SAS address zoning to add/replace hot spares to RAID set
US20080126839A1 (en) * 2006-09-19 2008-05-29 Satish Sangapu Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc
JP2008250566A (ja) * 2007-03-29 2008-10-16 Nec Corp ディスクアレイ装置、該装置の運用方法、およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221875A (ja) * 1995-02-01 1996-08-30 Hewlett Packard Co <Hp> データ記憶システムにおける仮想容量の過大割当てを避ける方法
JP2007087039A (ja) * 2005-09-21 2007-04-05 Hitachi Ltd ディスクアレイシステム及びその制御方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015162037A (ja) * 2014-02-27 2015-09-07 富士通株式会社 中継装置、ストレージ装置、および中継プログラム

Also Published As

Publication number Publication date
US8074108B2 (en) 2011-12-06
EP2048580A2 (en) 2009-04-15
US20080263393A1 (en) 2008-10-23
JP5052193B2 (ja) 2012-10-17
EP2048580A3 (en) 2010-12-08

Similar Documents

Publication Publication Date Title
JP5052193B2 (ja) 記憶制御装置および記憶制御方法
JP4884885B2 (ja) 記憶制御装置及び記憶制御装置の障害回復方法
US7418622B2 (en) Storage control system and storage control method
JP5285610B2 (ja) グローバルホットスペアディスクが存在するときに、故障したドライブを復元、及びコピーバックする最適化された方法
US8171379B2 (en) Methods, systems and media for data recovery using global parity for multiple independent RAID levels
CN100368976C (zh) 盘阵列设备和数据备份方法
US7805633B2 (en) Optimized reconstruction and copyback methodology for a disconnected drive in the presence of a global hot spare disk
JP2008071209A (ja) ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法
JP2007086972A (ja) ストレージシステム、二重化制御方法、及びプログラム
US8438429B2 (en) Storage control apparatus and storage control method
JP2005071196A (ja) ディスクアレイ装置、及びその障害情報の制御方法
US7620786B2 (en) Storage recovery using a delta log
EP2026208A2 (en) Storage control system and storage control method
JP2001337792A (ja) ディスクアレイ装置
US8015437B2 (en) Restoring data to a distributed storage node
JP4426939B2 (ja) ストレージ装置
US7363531B2 (en) Data synchronization for system controllers
US9256490B2 (en) Storage apparatus, storage system, and data management method
JP2006235673A (ja) ディスクアレイ装置
JP2005174178A (ja) ディスクアレイ装置及びディスクアレイ装置の保守方法
US7457990B2 (en) Information processing apparatus and information processing recovery method
JP2010198314A (ja) 情報管理装置
JP2004078437A (ja) ファイルシステム管理情報の二重化方法および方式
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium
JP2006260025A (ja) ディスクアレイ装置、ディスクアレイ装置の制御方法、及び電子機器

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110905

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120626

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120724

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees