JP6957845B2 - ストレージ制御装置及びストレージ装置 - Google Patents

ストレージ制御装置及びストレージ装置 Download PDF

Info

Publication number
JP6957845B2
JP6957845B2 JP2016178561A JP2016178561A JP6957845B2 JP 6957845 B2 JP6957845 B2 JP 6957845B2 JP 2016178561 A JP2016178561 A JP 2016178561A JP 2016178561 A JP2016178561 A JP 2016178561A JP 6957845 B2 JP6957845 B2 JP 6957845B2
Authority
JP
Japan
Prior art keywords
storage device
processing unit
backup
backup area
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016178561A
Other languages
English (en)
Other versions
JP2018045365A (ja
Inventor
篤 遠藤
藤原 隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016178561A priority Critical patent/JP6957845B2/ja
Priority to US15/695,481 priority patent/US10592349B2/en
Publication of JP2018045365A publication Critical patent/JP2018045365A/ja
Application granted granted Critical
Publication of JP6957845B2 publication Critical patent/JP6957845B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0646Horizontal data movement in storage systems, i.e. moving data in between storage devices or systems
    • G06F3/065Replication mechanisms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1883Methods for assignment of alternate areas for defective areas
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B2020/1869Preventing ageing phenomena from causing data loss, e.g. by monitoring the age of record carriers or by recognising wear, and by copying information elsewhere when a record carrier becomes unreliable
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/40Combinations of multiple record carriers
    • G11B2220/41Flat as opposed to hierarchical combination, e.g. library of tapes or discs, CD changer, or groups of record carriers that together store one title
    • G11B2220/415Redundant array of inexpensive disks [RAID] systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ストレージ制御装置及びストレージ装置に関する。
HDD(Hard Disk Drive)が複数組み合わせられることにより、RAID(Redundant Arrays of Inexpensive Disks)グループを作成するRAID装置が知られている。このようなRAID装置においては、一部のディスクが故障しても、データを保証することができる。更に、RAID装置がホットスペアディスク(以下、単に「HS」と称される場合がある。)を備える場合には、HSは一時的にRAIDグループのディスクとして使用される。そして、故障ディスクが交換されることで、RAID装置は、故障ディスクの発生前の状態に復旧する。
RAID装置の復旧は、例えば、以下の手順で行なわれる。
(1)RAIDグループを構成するディスク(「メンバーディスク」と称されてもよい。)が故障する。
(2)正常なメンバーディスクから故障ディスクのデータを生成し、HSに書き込む(「リビルド」と称されてもよい。)。
(3)故障ディスクを交換し、HSのデータをメンバーディスクに書き戻す(「コピーバック」と称されてもよい。)。
また、HDDでの故障の予兆が検出された場合には、HDDがRAID装置から切り離される前に、予めHSにデータがコピー(「リダンダントコピー」と称されてもよい。)されることで、RAIDグループの冗長性が確保される。
特開平8−249133号公報 特開2006−268502号公報 特開2010−128773号公報
リビルド又はリダンダントコピーの処理中に元のメンバーディスクが故障すると、故障ディスクのデータを生成できなくなり、データロストが発生するおそれがある。
リビルド及びリダンダントコピーにかかる時間は、HDDの回転数や容量に依存する。このため、HDDの回転数が低いほど、又は、HDDの容量が大きいほど、処理に要する時間が長くなるため、リビルド又はリダンダントコピーの処理中にメンバーディスクの故障が発生する可能性が高まる。
1つの側面では、データの保障を確実に行なうことを目的とする。
このため、このストレージシステムは、第1の記憶装置における故障予兆を検出する検出部と、RAID(Redundant Arrays of Inexpensive Disks)を構成する複数の記憶装置によって提供される、複数のバックアップ領域がある場合に、書き込み速度が最大の記憶装置を含むと共に他のRAIDグループに使用されている領域が最小のバックアップ領域を選択する選択部と、前記検出部において前記故障予兆が検出された場合に、前記第1の記憶装置に記憶されているデータを、前記選択部が選択した第1のバックアップ領域にコピーする第1コピー処理部と、前記検出部において前記故障予兆が検出された場合に、上位装置からの書き込み要求によって前記第1の記憶装置に書き込まれるデータを、前記第1のバックアップ領域に書き込む書き込み処理部と、前記第1のバックアップ領域に記憶されたデータを、第2の記憶装置に更にコピーする第2コピー処理部と、前記第1の記憶装置に対する前記書き込み要求を前記第2の記憶装置に対して行なうアクセス処理部と、を備える。
開示のストレージシステムによれば、データの保障を確実に行なうことができる。
実施形態の一例としてのストレージシステムのハードウェア構成を模式的に示す図である。 図1に示したCM(Controller Module)の機能構成を模式的に示す図である。 図1に示したエラーカウントテーブルを例示する図である。 図1に示したRAID管理テーブルを例示する図である。 図1に示したバックアップ領域管理テーブルを例示する図である。 図1に示したエラー領域管理テーブルを例示する図である。 図1に示したRAID装置におけるバックアップ領域決定処理を説明するフローチャートである。 図1に示したRAID装置におけるコピー処理及び書き込み処理を説明するフローチャートである。
以下、図面を参照して一実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。
また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。
以下、図中において、同一の各符号は同様の部分を示しているので、その説明は省略する。
〔A〕実施形態
〔A−1〕システム構成
図1は、実施形態の一例としてのストレージシステム100のハードウェア構成を模式的に示す図である。
図1に示されるストレージシステム100は、ホスト装置4に対して記憶領域を提供する。ストレージシステム100は、RAID装置1及びホスト装置4(「ホスト#1又はホスト#2」と称されてもよい。)を備える。
ホスト装置4は、例えば、サーバ機能を備えたコンピュータである。図1に示される例においてはストレージシステム100が2つのホスト#1及び#2を備えることとしているが、ストレージシステム100が備えるホスト装置4の数は種々変更することができる。
RAID装置1は、ストレージ装置の一例である。RAID装置1は、後述する複数の記憶装置200を搭載し、ホスト装置4に対して記憶領域を提供する装置である。RAID装置1は、RAIDを用いて複数の記憶装置200にデータを分散又は冗長化した状態で保存する。
RAID装置1は、図1に示されるように、CM10、複数の記憶装置200(「記憶装置#1〜#n」と称されてもよい。)及び複数のHS31(「HS#1〜#n」と称されてもよい。)を備える。n及びnは、いずれも自然数である。
記憶装置200は、データを読み書き可能に記憶する。記憶装置200は、例えば、HDDやSSD(Solid State Drive)、SCM(Storage Class Memory)である。
記憶装置200の記憶領域の一部には、物理アドレス情報210が記憶されている。物理アドレス情報210は、記憶装置200に記憶されているデータの物理的な格納位置を示すヘッド211、シリンダ212及びセクタ213を含む。なお、図1において、記憶装置#nの物理アドレス情報210におけるヘッド211、シリンダ212及びセクタ213の図示は、省略されている。
RAID装置1に備えられる複数の記憶装置200の少なくとも一部は、RAIDグループ20(「RAIDグループ#1又は#2」と称されてもよい。)に属する。図1に示される例において、記憶装置#1及び#2はRAIDグループ#1に属し、記憶装置#nはRAIDグループ#2に属する。RAIDグループ20は、1つの論理ボリュームを構成する複数の物理ディスク(別言されれば、「記憶装置200」)の集合である。
HS31は、故障又は故障予兆が検出された記憶装置200が記憶するデータを記憶する。図1に示される例において、HS#1〜#3は、データを一時的に記憶するバックアップに使用されるバックアップ領域(図1では「BU領域」)30として定義されている。
図1に示される例において、RAIDグループ#2に属する記憶装置#n及びバックアップ領域30に属するHS#1〜#3は、データを記憶していない未使用領域300である。記憶装置200の未使用領域300がバックアップ領域30として使用されてもよい。すなわち、HS31と記憶装置200の未使用領域300とがバックアップ領域30として使用されてもよい。また、RAID装置1に未使用領域300を有するHS31が備えられない場合には、記憶装置200の未使用領域300に限ってバックアップ領域30として使用されてもよい。
CM10は、種々の制御を行なう制御装置であり、ホスト装置4からのストレージアクセス要求(「アクセス制御信号」や「ホストI/O」と称されてもよい。)に従って、各種制御を行なう。
CM10は、図2を用いて後述されるCPU(Central Processing Unit)11、図2を用いて後述されるメモリ12及び4つのポート13を備える。なお、図1に示される例においてRAID装置1は1つのCM10を備えているが、これに限定されない。RAID装置10には、図2を用いて後述するCPU11の機能を有するマスタCM10の他に、スレーブCMが備えられてもよい。また、RAID装置1にはRAIDグループ20毎にCM10が備えられてもよく、各RAIDグループ20のCM10は互いに連携して機能してもよい。
ポート13は、CM10と記憶装置200とを通信可能に接続するためのインタフェースであり、例えばFC(Fibre Channel)アダプタである。CM10は、これらのポート13を介して、記憶装置200に対するデータの書き込みや読み出しを行なう。なお、図1に示される例においては、CM10が4つのポート13を備えることとしているが、これに限定されるものではなく、CM10は3つ以下又は5つ以上のポート13を備えてもよい。
CM10に備えられるメモリ12には、複数のRAID管理テーブル101、複数のエラー領域管理テーブル102、エラーカウントテーブル103及び複数のバックアップ領域管理テーブル104に関する情報が記憶されている。RAID管理テーブル101はRAID管理テーブル#1〜#nと称されてよく、エラー領域管理テーブル102はエラー領域管理テーブル#1〜#nと称されてよく、バックアップ領域管理テーブル104はBU領域管理テーブル#1〜#nと称されてよい。n、n及びnは、いずれも自然数である。
図2は、図1に示したCM10の機能構成を模式的に示す図である。
CM10は、前述したように、CPU11、メモリ12及び図1に示した4つのポート13を備える。
メモリ12は、例示的に、ROM(Read Only Memory)及びRAM(Random Access Memory)の少なくとも一方を含む記憶装置である。メモリ12のROMには、BIOS(Basic Input/Output System)等のプログラムが書き込まれてよい。メモリ12のソフトウェアプログラムは、CPU11に適宜に読み込まれて実行されてよい。また、メモリ12のRAMは、一次記録メモリあるいはワーキングメモリとして利用されてよい。
CPU11は、例示的に、種々の制御や演算を行なう処理装置であり、メモリ12に格納されたOS(Operating System)やプログラムを実行することにより、種々の機能を実現する。すなわち、CPU11は、図2に示されるように、故障検出部111、情報管理部112、バックアップ判定部113、コピー処理部114、書き込み処理部115及びアクセス処理部116として機能してよい。
なお、これらの故障検出部111、情報管理部112、バックアップ判定部113、コピー処理部114、書き込み処理部115及びアクセス処理部116としての機能を実現するためのプログラムは、例えばフレキシブルディスク、CD(CD−ROM、CD−R、CD−RW等)、DVD(DVD−ROM、DVD−RAM、DVD−R、DVD+R、DVD−RW、DVD+RW、HD DVD等)、ブルーレイディスク、磁気ディスク、光ディスク、光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供されてよい。そして、コンピュータ(本実施形態ではCPU11)は上述した記録媒体から図示しない読取装置を介してプログラムを読み取って内部記録装置または外部記録装置に転送し格納して用いてよい。また、プログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、記憶装置から通信経路を介してコンピュータに提供してもよい。
故障検出部111、情報管理部112、バックアップ判定部113、コピー処理部114、書き込み処理部115及びアクセス処理部116としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ12)に格納されたプログラムがコンピュータ(本実施形態ではCPU11)によって実行されてよい。また、記録媒体に記録されたプログラムをコンピュータが読み取って実行してもよい。
故障検出部111は、検出部の一例であり、記憶装置200における故障又は故障予兆(以下、まとめて「エラー」と称される場合がある。)を検出する。
図3は、図1に示したエラーカウントテーブル103を例示する図である。
故障検出部111は、エラーカウントテーブル103を管理する。故障検出部111は、記憶装置200においてエラーを検出した場合に、検出したエラーの内容をエラーカウントテーブル103に登録する。
エラーカウントテーブル103は、記憶装置200において発生したエラーの内容や発生数と、発生箇所とを対応付けて保持する。エラーカウントテーブル103は、「予兆検出HDD搭載位置」、「RAID管理テーブルNo.」、「エラー内容」、「発生数」、「ヘッド」、「シリンダ」、「セクタ」及び「アドレス」のカラムを有する。
「予兆検出HDD搭載位置」には、RAID装置1においてエラーが検出された記憶装置200が搭載されている位置(別言されれば、「接続されているポート13」)を特定する情報が登録される。図3に示される例においては、「予兆検出HDD搭載位置」には、“0001”及び“0203”が登録されている。
「RAID管理テーブルNo.」には、エラーが検出された記憶装置200が登録されているRAID管理テーブル101を特定する情報が登録されている。図3に示されている例において、「RAID管理テーブルNo.」には、“2”及び“7”が登録されている。
「エラー内容」には、記憶装置200において発生したエラーの内容を示す情報が登録されている。図3に示されている例において、「エラー内容」には、“SNS=03/11/00”及び“SNS=01/17/01”が登録されている。
「発生数」には、同一の記憶装置200の領域における同一のエラー内容が発生した回数が登録されている。図3に示されている例において、「発生数」には、“1”及び“2”が登録されている。
「ヘッド」には、エラーが発生した記憶装置200のヘッド211が登録されている。図3に示されている例において、「ヘッド」には、“0”及び“2”が登録されている。
「シリンダ」には、エラーが発生した記憶装置200のシリンダ212が登録されている。図3に示されている例において、「シリンダ」には、“124”及び“100”が登録されている。
「セクタ」には、エラーが発生した記憶装置200のセクタ213が登録されている。図3に示されている例において、「セクタ」には、“0”及び“2”が登録されている。
「アドレス」には、エラーが発生した記憶装置200の領域を特定するアドレスが登録されている。図3に示されている例において、「アドレス」には、“0x000122”、“0x000123”及び“0x000400”が登録されている。
情報管理部112は、RAID管理テーブル101、エラー領域管理テーブル102及びバックアップ領域管理テーブル104を管理する。
図4は、図1に示したRAID管理テーブル101を例示する図である。図4には、RAID管理テーブル#1〜#nが示されている。
情報管理部112は、RAID装置1にRAIDグループ20を設定する際に、「RAIDレベル」及びRAIDグループ20を構成している記憶装置200を示す情報を、RAID管理テーブル101に登録する。
RAID管理テーブル101は、各RAIDグループ20に属する記憶装置200(「メンバーディスク」と称されてもよい。)を示す情報を保持する。RAID管理テーブル101は、「No.」、「RAIDグループNo.」、「RAIDレベル」、「メンバーディスク#1〜#n」のカラムを有する。nは、自然数である。
「No.」には、RAID管理テーブル#1〜#nを特定するための番号が登録される。図4に示される例において、「No.」には、“1”〜“n1”が登録されている。
「搭載Slot」には、RAIDグループ20を構成する記憶装置200が搭載されているRAID装置1のスロット(不図示)を特定するための情報が登録される。図4に示される例において、「搭載Slot」には、“0000”〜“0004”及び“100a”が登録されている。
「RAIDグループNo.」には、RAIDグループ20を特定するための情報が登録される。図4に示される例において、「RAIDグループNo.」には、“0x0000”〜“0x0004”及び“0x0010”が登録されている。
「RAIDレベル」には、RAIDグループ20に設定されるRAIDレベルが登録される。図4に示される例において、「RAIDレベル」には、“RAID1”、“RAID6”及び“RAID6-FR”が登録されている。
「メンバーディスク#1〜#n」には、各RAIDグループ20に属する記憶装置200を特定する情報が登録される。図4に示される例において、「メンバーディスク#1〜#n」には、“0001”〜“0004”、“1000”、“1001”及び“1009”が登録されている。また、図4に示される例において、「メンバーディスク#2〜#n」に登録されている“-”は、記憶装置200が属していないことを示す。
図5は、図1に示したバックアップ領域管理テーブル104を例示する図である。図5には、バックアップ領域管理テーブル#1及び#2が示されている。
情報管理部112は、HS31の設定の際に、バックアップ領域管理テーブル104にバックアップ領域30及び記憶装置200の未使用領域300を登録する。図1に示されたように、バックアップ領域30には、2以上のHS31が指定されてよい。
バックアップ領域管理テーブル104は、バックアップ処理に使用されるHS31等の情報を保持する。バックアップ領域管理テーブル104は、「No.」、「使用中フラグ」、「Slot」、「種別」、「容量」、「回転数(rpm)」、「用途」、「RAIDレベル」及び「LBA(Logical Block Addressing)範囲」のカラムを有する。なお、rpmは、単位であり、revolution per minuteの略である。
「No.」には、バックアップ領域管理テーブル#1〜#nを特定するための番号が登録される。図5に示される例において、「No.」には、“1”及び“2”が登録されている。
「使用中フラグ」には、記憶装置200又はHS31が使用中であることを示すフラグが登録される。また、「使用中フラグ」には、記憶装置200又はHS31が使用可能(別言されれば、「未使用である」)ことを示すフラグが登録される。図5に示される例において、「使用中フラグ」には、“使用中”及び“使用可”が登録されている。
「Slot」には、記憶装置200又はHS31が搭載されているRAID装置1のスロット(不図示)を特定するための情報が登録される。図5に示される例において、「Slot」には、“020b”、“030b”、“0400”、“040b”及び“050b”が登録されている。
「種別」には、記憶装置200及びHS31の種別が登録される。図5に示される例において、「種別」には、“SSD”又は“HDD”が登録されている。
「容量」には、記憶装置200及びHS31の記憶容量が登録される。図5に示される例において、「容量」には、“400GB”及び“600GB”が登録されている。
「回転数(rpm)」には、記憶装置200又はHS31がHDDである場合に、HDDの回転数を示す値が登録される。図5に示される例において、「回転数(rpm)」には、“15,000”が登録されている。
「用途」には、データ(DATA)を記憶する記憶装置200と、記憶装置200に記憶されているデータのコピーを記憶するHS31との別が登録される。図5に示される例において、「用途」には、“HS”及び“DATA”が登録されている。
「RAIDレベル」には、記憶装置200又はHS31に設定されているRAIDレベルが登録される。図5に示される例において、「RAIDレベル」には、“RAID1”及び“RAID5”が登録されている。
「LBA範囲」には、記憶装置200又はHS31の記憶領域を特定するための論理アドレスの範囲が示されている。図5に示される例において、「LBA範囲」には、“0x00000000 - 0x01000000”及び“0x09800000 - 0x01000000”が登録されている。
図6は、図1に示したエラー領域管理テーブル102を例示する図である。図6には、エラー領域管理テーブル#1及び#2が示されている。
情報管理部112は、故障検出部111によって記憶装置200におけるエラーが検出された場合に、エラー領域管理テーブル102に情報を登録する。
具体的には、情報管理部112は、物理アドレス情報210(図1参照)に含まれるエラーが発生した領域のヘッド211、シリンダ212及びセクタ213を記憶装置200から取得する。そして、情報管理部112は、取得したヘッド211、シリンダ212及びセクタ213を、RAID管理テーブル101に含まれる情報とともに、エラー領域管理テーブル102に登録する。
情報管理部112は、後述するコピー処理部114によるコピー処理が完了した後に、エラーが発生した記憶装置200に係るデータを有するエラー領域管理テーブル102を削除してよい。
エラー領域管理テーブル102は、記憶装置200におけるエラーの発生位置(「障害予兆位置」と称されてもよい。)を保持する。エラー領域管理テーブル102は、「領域No.」、「予兆検出HDD搭載位置」、「RAID管理テーブルNo.」、「ヘッド」、「シリンダ」、「セクタ」、「アドレス」、「バックアップ生成開始アドレス」及び「バックアップ生成終了アドレス」のカラムを有する。
「領域No.」には、エラー領域管理テーブル#1〜#nを特定するための番号が登録される。図6に示される例において、「領域No.」には、“1”及び“2”が登録されている。
「予兆検出HDD搭載位置」には、エラーが検出された記憶装置200が搭載されているRAID装置1のスロット(不図示)を特定するための情報が登録される。図6に示される例において、「予兆検出HDD搭載位置」には、“1“及び“203”が登録されている。
「RAID管理テーブルNo.」には、エラーが検出された記憶装置200が属するRAIDグループ20が登録されているRAID管理テーブル101を特定するための番号が登録されている。図6に示される例において、「RAID管理テーブルNo.」には、“2”及び“7”が登録されている。
「ヘッド」、「シリンダ」及び「セクタ」には、エラーが発生した記憶装置200の領域のヘッド211、シリンダ212及びセクタ213がそれぞれ登録される。図6に示される例において、「ヘッド」には“0”及び“2”が登録されており、「シリンダ」には“124”及び“222”が登録されており、「セクタ」には“0”が登録されている。
「アドレス」には、エラーが発生した記憶装置200の領域を特定するためのアドレスが登録される。図6に示される例において、「アドレス」には、“0x000122”及び“0x87878”が登録されている。
「バックアップ生成開始アドレス」には、エラーが発生した記憶装置200のデータのバックアップを開始するアドレスが登録される。図6に示される例において、「バックアップ生成開始アドレス」には、“0x000122 - a”及び“0x87878 - b”が登録されている。
「バックアップ生成終了アドレス」には、エラーが発生した記憶装置200のデータのバックアップを終了するアドレスが登録される。図6に示される例において、「バックアップ生成終了アドレス」には、“0x000122 + a”及び“0x87878 + b”が登録されている。
このように、「領域No.」が“1”で示されるエラー発生領域については、エラーが発生した「アドレス」である“0x000122”の前後の“0x000122 - a”〜“0x000122 + a”の領域でバックアップが行なわれる。また、「領域No.」が“2”で示されるエラー発生領域については、エラーが発生した「アドレス」である“0x87878”の前後の“0x87878 - b”〜“0x87878 + b”の領域でバックアップが行なわれる。すなわち、「バックアップ生成開始アドレス」及び「バックアップ生成終了アドレス」における“±a”と“±b”とは、バックアップを行なうマージンと称されてもよい。
バックアップ判定部113は、エラーカウントテーブル103に含まれる情報に基づき、通常のリビルド及びリダンダントコピーの処理を行なうか、バックアップデータを作成してバックアップデータをバックアップ領域30に書き込むかを判定する。バックアップ判定部113は、エラーカウントテーブル103に含まれる情報が記憶装置200におけるエラーが故障予兆によって登録されている場合に、バックアップ領域30へのバックアップを行なう。
バックアップ判定部113は、リカバードエラーやアンリカバードエラー等の統計加点方式のエラーが発生した場合には、記憶装置200が救済可能であるとして、バックアップを行なうことを判定してよい。一方、バックアップ判定部113は、記憶装置200のヘッド(不図示)の故障やタイムアウト等の継続使用が困難なエラーが発生した場合には、記憶装置200が救済不可であるとして、通常のリビルド及びリダンダントコピーを行なってよい。バックアップ判定部113は、エラーカウントテーブル103(図3参照)の「エラー内容」のカラムを参照することにより、記憶装置200が救済可能であるか否かの判断を行なってよい。
バックアップ判定部113は、バックアップ領域30へのバックアップを行なうことを決定し、バックアップに使用可能なHS31の領域が複数ある場合に、バックアップに使用するHS31の領域を選択する。バックアップ判定部113は、「使用中フラグ」に“使用可”が登録されているバックアップ領域管理テーブル104が複数領域(「バックアップ候補」と称されてもよい。)ある場合に、バックアップに使用するHS31の領域を選択してよい。
バックアップ判定部113は、例えば、以下の(1)〜(3)の順に優先度を持たせて、バックアップ候補の中からバックアップに使用するHS31の領域を選択する。
(1)バックアップ候補にHDDとSSDとがある場合には、SSDを選択する。
(2)バックアップ候補がいずれもHDDである場合には、回転数が最大のHDDを選択する。
(3)バックアップ候補に複数のHDD又は複数のSSDがある場合には、他のRAIDグループ20に使用されている領域が最小のHS31を選択する。
すなわち、バックアップ判定部113は、選択部の一例であり、バックアップに使用するHS31として、書き込み速度が最大のHS31を選択する。
コピー処理部114は、エラーが検出された記憶装置200(以下、「被疑ディスク」と称される場合がある。)が記憶するデータを、バックアップ判定部113によって選択されたHS31にコピーする。具体的には、コピー処理部114は、被疑ディスクが記憶するデータをバックアップ領域30の任意の領域に一時的にコピーし、バックアップ領域30へのコピーが完了すると、バックアップ領域30へコピーされたデータを所定のHS31へコピーする。「バックアップ領域30へのコピーが完了する」は、「バックアップ領域30のデータと被疑ディスクのデータとが等価になる」と称されてもよい。
すなわち、コピー処理部114は、故障検出部111において故障予兆が検出された場合に、被疑ディスクに記憶されているデータを、RAIDを構成するバックアップ領域30にコピーする第1コピー処理部の一例である。また、コピー処理部114は、バックアップ領域30に記憶されたデータを、所定のHS31に更にコピーする第2コピー処理部の一例である。
ここで、「所定のHS31」としては、被疑ディスクと同一機種であり、同一容量を有するHS31が優先的に選択されてよい。
コピー処理部114がデータのコピーを行なうバックアップ領域30に複数のHS31が属している場合には、コピー処理部114は、複数のHS31に分散してデータのコピーを行なってよい。また、バックアップ領域30に属するHS31が複数ない場合には、コピー処理部114は、被疑ディスクに記憶されているデータを、バックアップ領域30に属する単一のHS31にコピーしてよい。
コピー対象のデータの容量がバックアップ領域30の容量よりも大きい場合には、コピー処理部114は、被疑ディスクに記憶されているデータを、上述した所定のHS31に直接にコピーしてよい。また、RAID装置1に上述した所定のHS31が存在しない場合には、コピー処理部114は、バックアップ領域30にコピーしたデータを、被疑ディスクと交換されて新たに組み入れられる記憶装置200にコピーしてもよい。
書き込み処理部115は、ホスト装置4からのライト要求に従い、記憶装置200にデータを書き込む。また、書き込み処理部115は、コピー処理部114によるバックアップ領域30へのコピー処理中に、記憶装置200へのデータの書き込みと並行して、バックアップ領域30へ同一のデータの書き込みを行なう。
書き込み処理部115がデータの書き込みを行なうバックアップ領域30に複数のHS31が属している場合には、書き込み処理部115は、複数のHS31に分散してデータの書き込みを行なってよい。また、バックアップ領域30に属するHS31が複数ない場合には、書き込み処理部115は、被疑ディスクに書き込まれるデータを、バックアップ領域30に属する単一のHS31に書き込んでよい。
書き込み対象のデータの容量がバックアップ領域30の容量よりも大きい場合には、書き込み処理部115は、被疑ディスクに書き込まれるデータを、上述した所定のHS31に直接に書き込んでもよい。
書き込み処理部115は、コピー処理部114によるバックアップ領域30へのコピー処理が完了した場合に、記憶装置200へのデータの書き込みを中止してよい。
アクセス処理部116は、コピー処理部114及び書き込み処理部115によってデータのバックアップが実行されていない際に、ホスト装置4からのデータアクセス要求に応じた、記憶装置200及びHS31に対するデータの読み書き処理を行なう。
アクセス処理部116は、コピー処理部114及び書き込み処理部115によるデータのバックアップが完了すると、被疑ディスクに代えて、上述した所定のHS31に対してデータアクセスを行なう。別言されれば、アクセス処理部116は、被疑ディスクに代えて、被疑ディスクが属するRAIDグループ20にデータのコピーが完了した所定のHS31を組み入れる。
アクセス処理部116は、情報管理部112によって被疑ディスクに係る情報がエラー領域管理テーブル102から削除された後に、RAID装置1から被疑ディスクを切り離す。被疑ディスクの交換によってRAID装置1に搭載された新たな記憶装置は、HS31として使用されてよい。
なお、バックアップ領域30を構成するHS31においてエラーが発生した場合においても、記憶装置200においてエラーが発生した場合と同様に、バックアップ処理が行なわれてよい。
また、RAID装置1においては、SSD等の高性能ディスクで構成されたHS31を有するバックアップ領域30と、HDDやオンラインディスク等の低性能ディスクで構成されたHS31を有するバックアップ領域30とが、別々に定義されていてもよい。これにより、バックアップ判定部113によるバックアップ領域30の選択が容易になる。
更に、バックアップ判定部113は、データのバックアップを行なう領域として、複数のバックアップ領域30を選択してもよい。これにより、バックアップ先のHS31が分散され、バックアップ処理を短時間で行なうことができる。
〔A−2〕動作
上述した実施形態の一例のRAID装置1におけるバックアップ領域決定処理を、図7に示されるフローチャート(ステップS1〜S9)に従って説明する。
故障検出部111は、記憶装置200における故障又は故障予兆を検出する(ステップS1)。
情報管理部112は、エラー領域管理テーブル102に被疑ディスクの情報を登録する(ステップS2)。
バックアップ判定部113は、被疑ディスクの情報をRAID管理テーブル101から読み出す(ステップS3)。
バックアップ判定部113は、エラー内容が故障予兆であるかを判定する(ステップS4)。
エラー内容が故障予兆でない場合には(ステップS4のNoルート参照)、RAID装置1は、通常のリビルド及びリダンダントコピーを行なう(ステップS5)。そして、処理は終了する。
一方、エラー内容が故障予兆である場合には(ステップS4のYesルート参照)、バックアップ判定部113は、バックアップ領域管理テーブル104を参照して、バックアップ領域30の使用状態を確認する(ステップS6)。
バックアップ判定部113は、使用可能なバックアップ領域30が存在するかを判定する(ステップS7)。
使用可能なバックアップ領域30が存在しない場合には(ステップS7のNoルート参照)、処理はステップS6へ戻る。バックアップ判定部113は、所定時間毎に(例えば、10分間隔で)ステップS6における確認を行なってよい。
一方、使用可能なバックアップ領域30が存在する場合には(ステップS7のYesルート参照)、バックアップ判定部113は、使用可能なバックアップ領域30が複数存在するかを判定する(ステップS8)。
使用可能なバックアップ領域30が複数存在しない場合には(ステップS8のNoルート参照)、処理は図8のステップS11及びS21へ移行する。
一方、使用可能なバックアップ領域30が複数存在する場合には(ステップS8のYesルート参照)、バックアップ判定部113は、所定の優先度に基づいて、バックアップ候補中からバックアップに使用するHS31を選択する(ステップS9)。そして、処理は、図8のステップS11及びS21へ移行する。
次に、実施形態の一例のRAID装置1におけるコピー処理及び書き込み処理を、図8に示されるフローチャート(ステップS11〜S19及びS21〜S23)に従って説明する。
コピー処理部114は、図7のステップS8又はS9の処理が完了すると、被疑ディスクが記憶しているデータをバックアップ領域30にコピーする(ステップS11)。
書き込み処理部115は、ステップS11の処理と並行して、ホスト装置4からのライト要求に従って、被疑ディスクにデータを書き込むとともに、バックアップ領域30に同一のデータを書き込む。別言されれば、書き込み処理部115は、被疑ディスクに書き込むデータをバックアップ領域30に並行して書き込む(ステップS21)。また、書き込み処理部115は、バックアップ領域30を構成する複数のHS31に並行してデータを書き込む。
コピー処理部114は、バックアップ領域30へのデータのコピーが完了したかを判定する(ステップS12)。
バックアップ領域30へのデータのコピーが完了していない場合には(ステップS12のNoルート参照)、処理はステップS11へ戻る。
一方、バックアップ領域30へのデータのコピーが完了した場合には(ステップS12のYesルート参照)、コピー処理部114は、バックアップ領域管理テーブル104を参照して、HS31の空き状況を確認する(ステップS13)。
コピー処理部114は、使用可能なHS31が存在するかを判定する(ステップS14)。
使用可能なHS31が存在しない場合には(ステップS14のNoルート参照)、処理はステップS13へ戻る。
一方、使用可能なHS31が存在する場合には(ステップS14のYesルート参照)、コピー処理部114は、使用可能なHS31が被疑ディスクと同一種類のHS31であるかを判定する(ステップS15)。
使用可能なHS31が被疑ディスクと同一種類のHS31でない場合には(ステップS15のNoルート参照)、処理はステップS13へ戻る。
一方、使用可能なHS31が被疑ディスクと同一種類のHS31である場合には(ステップS15のYesルート参照)、コピー処理部114は、バックアップ領域(BU領域)30に格納したデータを当該HS31にコピーする(ステップS16)。
アクセス処理部116は、バックアップ領域30に格納した全データのHS31へのコピーが完了すると(ステップS17)、当該HS31を被疑ディスクが属していたRAIDグループ20に組み入れる(ステップS18)。
なお、RAID装置1に被疑ディスクと同一種類のHS31が存在しない場合には、コピー処理部114は、バックアップ領域30にコピーしたデータを、被疑ディスクと交換されて新たに組み入れられる記憶装置200に直接にコピーしてもよい。
情報管理部112は、バックアップ領域管理テーブル104に登録した“使用中”フラグを削除することによって、バックアップ領域(図8では「BU領域」)30を解放する(ステップS19)。そして、コピー処理は終了する。
ステップS12において、バックアップ領域30へのデータのコピーが完了した場合には(ステップS12のYesルート参照)、書き込み処理部115は、ホスト装置4からのライト要求に基づく被疑ディスクへの書き込みを中止する(ステップS22)。
アクセス処理部116は、被疑ディスクをRAID装置1から切り離し(ステップS23)、書き込み処理は終了する。
以上のように、コピー処理部114は、故障検出部111において故障予兆が検出された場合に、記憶装置200に記憶されているデータを、RAIDを構成するバックアップ領域30にコピーする。また、書き込み処理部115は、故障検出部111において故障予兆が検出された場合に、ホスト装置4からのライト要求によって記憶装置200に書き込まれるデータを、バックアップ領域30に書き込む。更に、コピー処理部114は、バックアップ領域30に記憶されたデータを、所定のHS31に更にコピーする。そして、アクセス処理部116は、記憶装置200に代えて、所定のHS31に対して書き込み要求に応じたアクセスを行なう。
これにより、データの保障を確実に行なうことができる。例えば、RAIDグループを構成するバックアップ領域30に並列書き込みでデータを保存するため、早期にデータを保全(別言されれば、「保障」)することができ、コピーによるデータアクセスへの影響を低減できる。所定のHS31のアクセス性能が低い場合でも、所定のHS31へのデータのコピーを、ホスト装置4からのアクセス要求が少ない任意の時刻に、時間をかけて行なうことができる。データの一時バックアップ先に記憶装置200の未使用領域300(図1を参照)が使用される場合にはバックアップ動作中に当該記憶装置200が故障することも想定されるが、バックアップ領域30がRAID化されることにより、データを保障できる。また、バックアップ処理に使用されるバックアップ領域30の構成に拘わらず、迅速にバックアップ処理を開始することができる。
バックアップ領域30に属する記憶装置が複数ない場合に、コピー処理部114は、記憶装置200に記憶されているデータを、バックアップ領域30に属する単一のHS31(又は記憶装置200の未使用領域300)にコピーする。また、バックアップ領域30に属する記憶装置が複数ない場合に、書き込み処理部115は、記憶装置200に書き込まれるデータを、バックアップ領域30に属する単一のHS31(又は記憶装置200の未使用領域300)に書き込む。これにより、バックアップ領域30に属する記憶装置が複数ない場合においても、バックアップ動作を行なうことができる。
バックアップ判定部113は、バックアップ領域30が複数ある場合に、書き込み速度が最大のHS31を含むバックアップ領域30を選択する。これにより、データのバックアップを短時間で完了でき、バックアップ処理中に記憶装置200が故障してデータロストが発生する可能性を低減できる。
コピー処理部114は、故障予兆が検出された記憶装置200に代えてRAIDグループ20に組み入れるHS31として、故障予兆が検出された記憶装置200と同種類である記憶装置を選択する。これにより、故障予兆の検出前後でRAID装置1の構成が変わらないため、RAID装置1の信頼性を向上できる。
書き込み処理部115は、コピー処理部114によるバックアップ領域30へのデータのコピーが完了した場合に、故障予兆が検出された記憶装置200に対するデータの書き込みを中止する。これにより、故障予兆が検出された記憶装置200を早期にRAID装置1から切り離すことができ、正常な記憶装置200に入れ替えることができる。
〔B〕その他
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成及び各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。
〔C〕付記
(付記1)
第1の記憶装置における故障予兆を検出する検出部と、
前記検出部において前記故障予兆が検出された場合に、前記第1の記憶装置に記憶されているデータを、RAID(Redundant Arrays of Inexpensive Disks)を構成するバックアップ領域にコピーする第1コピー処理部と、
前記検出部において前記故障予兆が検出された場合に、上位装置からの書き込み要求によって前記第1の記憶装置に書き込まれるデータを、前記バックアップ領域に書き込む書き込み処理部と、
前記バックアップ領域に記憶されたデータを、第2の記憶装置に更にコピーする第2コピー処理部と、
前記第1の記憶装置に代えて、前記第2の記憶装置に対して前記書き込み要求に応じたアクセスを行なうアクセス処理部と、
を備える、ストレージ制御装置。
(付記2)
前記バックアップ領域に属する記憶装置が複数ない場合に、
前記第1コピー処理部は、前記第1の記憶装置に記憶されているデータを、前記バックアップ領域に属する単一の記憶装置にコピーし、
前記書き込み処理部は、前記第1の記憶装置に書き込まれるデータを、前記バックアップ領域に属する単一の記憶装置に書き込む、
付記1に記載のストレージ制御装置。
(付記3)
前記バックアップ領域が複数ある場合に、書き込み速度が最大の記憶装置を含むバックアップ領域を選択する選択部
を更に備える、付記1又は2に記載のストレージ制御装置。
(付記4)
前記第2コピー処理部は、前記第2の記憶装置として、前記第1の記憶装置と同一種類である記憶装置を選択する、
付記1〜3のいずれか1項に記載のストレージ制御装置。
(付記5)
前記書き込み処理部は、前記第1コピー処理部による前記バックアップ領域へのデータのコピーが完了した場合に、前記第1の記憶装置に対するデータの書き込みを中止する、
付記1〜4のいずれか1項に記載のストレージ制御装置。
(付記6)
複数の記憶装置と、
前記複数の記憶装置のうちの第1の記憶装置における故障予兆を検出する検出部と、
前記検出部において前記故障予兆が検出された場合に、前記第1の記憶装置に記憶されているデータを、RAID(Redundant Arrays of Inexpensive Disks)を構成するバックアップ領域にコピーする第1コピー処理部と、
前記検出部において前記故障予兆が検出された場合に、上位装置からの書き込み要求によって前記第1の記憶装置に書き込まれるデータを、前記バックアップ領域に書き込む書き込み処理部と、
前記バックアップ領域に記憶されたデータを、前記複数の記憶装置のうちの第2の記憶装置に更にコピーする第2コピー処理部と、
前記第1の記憶装置に代えて、前記第2の記憶装置に対して前記書き込み要求に応じたアクセスを行なうアクセス処理部と、
を備える、ストレージ装置。
(付記7)
前記バックアップ領域に属する記憶装置が複数ない場合に、
前記第1コピー処理部は、前記第1の記憶装置に記憶されているデータを、前記バックアップ領域に属する単一の記憶装置にコピーし、
前記書き込み処理部は、前記第1の記憶装置に書き込まれるデータを、前記バックアップ領域に属する単一の記憶装置に書き込む、
付記6に記載のストレージ装置。
(付記8)
前記バックアップ領域が複数ある場合に、書き込み速度が最大の記憶装置を選択する選択部
を更に備える、付記6又は7に記載のストレージ装置。
(付記9)
前記第2コピー処理部は、前記第2の記憶装置として、前記第1の記憶装置と同一種類である記憶装置を選択する、
付記6〜8のいずれか1項に記載のストレージ装置。
(付記10)
前記書き込み処理部は、前記第1コピー処理部による前記バックアップ領域へのデータのコピーが完了した場合に、前記第1の記憶装置に対するデータの書き込みを中止する、
付記6〜9のいずれか1項に記載のストレージ装置。
100 :ストレージシステム
1 :RAID装置
101 :RAID管理テーブル
102 :エラー領域管理テーブル
103 :エラーカウントテーブル
104 :バックアップ領域管理テーブル
11 :CPU
111 :故障検出部
112 :情報管理部
113 :バックアップ判定部
114 :コピー処理部
115 :書き込み処理部
116 :アクセス処理部
12 :メモリ
13 :ポート
20 :RAIDグループ
200 :記憶装置
210 :物理アドレス情報
211 :ヘッド
212 :シリンダ
213 :セクタ
300 :未使用領域
30 :バックアップ領域
31 :HS
4 :ホスト装置

Claims (5)

  1. 第1の記憶装置における故障予兆を検出する検出部と、
    RAID(Redundant Arrays of Inexpensive Disks)を構成する複数の記憶装置によって提供される、複数のバックアップ領域がある場合に、書き込み速度が最大の記憶装置を含むと共に他のRAIDグループに使用されている領域が最小のバックアップ領域を選択する選択部と、
    前記検出部において前記故障予兆が検出された場合に、前記第1の記憶装置に記憶されているデータを、前記選択部が選択した第1のバックアップ領域にコピーする第1コピー処理部と、
    前記検出部において前記故障予兆が検出された場合に、上位装置からの書き込み要求によって前記第1の記憶装置に書き込まれるデータを、前記第1のバックアップ領域に書き込む書き込み処理部と、
    前記第1のバックアップ領域に記憶されたデータを、第2の記憶装置に更にコピーする第2コピー処理部と、
    前記第1の記憶装置に対する前記書き込み要求を前記第2の記憶装置に対して行なうアクセス処理部と、
    を備える、
    ストレージ制御装置。
  2. 前記第1のバックアップ領域に属しており、前記第1コピー処理部によるデータのコピーが可能な記憶装置が複数ない場合に、
    前記第1コピー処理部は、前記第1の記憶装置に記憶されているデータを、前記第1のバックアップ領域に属する単一の記憶装置にコピーし、
    前記書き込み処理部は、前記第1の記憶装置に書き込まれるデータを、前記第1のバックアップ領域に属する単一の記憶装置に書き込む、
    請求項1に記載のストレージ制御装置。
  3. 前記第2コピー処理部は、前記第2の記憶装置として、前記第1の記憶装置と同一種類である記憶装置を選択する、
    請求項1又は2に記載のストレージ制御装置。
  4. 前記書き込み処理部は、前記第1コピー処理部による前記第1のバックアップ領域へのデータのコピーが完了した場合に、前記第1の記憶装置に対するデータの書き込みを中止する、請求項1〜3のいずれか1項に記載のストレージ制御装置。
  5. 複数の記憶装置と、
    前記複数の記憶装置のうちの第1の記憶装置における故障予兆を検出する検出部と、
    RAID(Redundant Arrays of Inexpensive Disks)を構成する前記複数の記憶装置によって提供される、複数のバックアップ領域がある場合に、書き込み速度が最大の記憶装置を含むと共に他のRAIDグループに使用されている領域が最小のバックアップ領域を選択する選択部と、
    前記検出部において前記故障予兆が検出された場合に、前記第1の記憶装置に記憶されているデータを、前記選択部が選択した第1のバックアップ領域にコピーする第1コピー処理部と、
    前記検出部において前記故障予兆が検出された場合に、上位装置からの書き込み要求によって前記第1の記憶装置に書き込まれるデータを、前記第1のバックアップ領域に書き込む書き込み処理部と、
    前記第1のバックアップ領域に記憶されたデータを、前記複数の記憶装置のうちの第2の記憶装置に更にコピーする第2コピー処理部と、
    前記第1の記憶装置に対する前記書き込み要求を前記第2の記憶装置に対して行なうアクセス処理部と、
    を備える、
    ストレージ装置。
JP2016178561A 2016-09-13 2016-09-13 ストレージ制御装置及びストレージ装置 Active JP6957845B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016178561A JP6957845B2 (ja) 2016-09-13 2016-09-13 ストレージ制御装置及びストレージ装置
US15/695,481 US10592349B2 (en) 2016-09-13 2017-09-05 Storage control device and storage apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016178561A JP6957845B2 (ja) 2016-09-13 2016-09-13 ストレージ制御装置及びストレージ装置

Publications (2)

Publication Number Publication Date
JP2018045365A JP2018045365A (ja) 2018-03-22
JP6957845B2 true JP6957845B2 (ja) 2021-11-02

Family

ID=61559894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016178561A Active JP6957845B2 (ja) 2016-09-13 2016-09-13 ストレージ制御装置及びストレージ装置

Country Status (2)

Country Link
US (1) US10592349B2 (ja)
JP (1) JP6957845B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10754735B2 (en) * 2017-11-20 2020-08-25 Salesforce.Com, Inc. Distributed storage reservation for recovering distributed data

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08249133A (ja) 1994-12-15 1996-09-27 Internatl Business Mach Corp <Ibm> ディスク・ドライブ・アレイの故障対策の方法及びシステム
JPH11184643A (ja) * 1997-12-22 1999-07-09 Nec Corp ディスクアレイ装置の管理方法及びプログラムを記録した機械読み取り可能な記録媒体
JP4322068B2 (ja) * 2003-03-07 2009-08-26 富士通株式会社 ストレージシステム及びそのデイスク負荷バランス制御方法
JP2005122338A (ja) * 2003-10-15 2005-05-12 Hitachi Ltd スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法
JP4634049B2 (ja) * 2004-02-04 2011-02-16 株式会社日立製作所 ディスクアレイ装置における異常通知制御
JP4203034B2 (ja) 2005-03-24 2008-12-24 株式会社東芝 アレイコントローラ、メディアエラー修復方法及びプログラム
US7574623B1 (en) * 2005-04-29 2009-08-11 Network Appliance, Inc. Method and system for rapidly recovering data from a “sick” disk in a RAID disk group
JP4884885B2 (ja) * 2006-08-25 2012-02-29 株式会社日立製作所 記憶制御装置及び記憶制御装置の障害回復方法
US20080126839A1 (en) * 2006-09-19 2008-05-29 Satish Sangapu Optimized reconstruction and copyback methodology for a failed drive in the presence of a global hot spare disc
US20080172571A1 (en) * 2007-01-11 2008-07-17 International Business Machines Corporation Method and system for providing backup storage capacity in disk array systems
JP2008250566A (ja) * 2007-03-29 2008-10-16 Nec Corp ディスクアレイ装置、該装置の運用方法、およびプログラム
US8473779B2 (en) * 2008-02-29 2013-06-25 Assurance Software And Hardware Solutions, Llc Systems and methods for error correction and detection, isolation, and recovery of faults in a fail-in-place storage array
US20090327603A1 (en) * 2008-06-26 2009-12-31 Mckean Brian System including solid state drives paired with hard disk drives in a RAID 1 configuration and a method for providing/implementing said system
JP2010128773A (ja) 2008-11-27 2010-06-10 Nec Fielding Ltd ディスクアレイ装置、そのディスク管理方法及びそのディスク管理プログラム
JP5056747B2 (ja) * 2008-12-25 2012-10-24 富士通株式会社 記憶領域管理装置、記憶領域管理方法
US8417989B2 (en) * 2010-10-15 2013-04-09 Lsi Corporation Method and system for extra redundancy in a raid system
US9032146B2 (en) * 2010-11-30 2015-05-12 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Dynamic use of raid levels responsive to workload requirements
US8839046B2 (en) * 2012-07-10 2014-09-16 International Business Machines Corporation Arranging data handling in a computer-implemented system in accordance with reliability ratings based on reverse predictive failure analysis in response to changes
JP2014041523A (ja) * 2012-08-23 2014-03-06 Nec Corp データ管理装置、及び、データ管理方法
JP2014056445A (ja) * 2012-09-12 2014-03-27 Fujitsu Ltd ストレージ装置、ストレージ制御プログラムおよびストレージ制御方法
US8943359B2 (en) * 2012-10-05 2015-01-27 Lsi Corporation Common hot spare for multiple RAID groups
EP3022736A1 (en) * 2013-07-15 2016-05-25 Hewlett Packard Enterprise Development LP Rebuilding drive data
US9229796B1 (en) * 2013-09-25 2016-01-05 Emc Corporation System and method for determining disk failure indicator to predict future disk failures
US9244790B1 (en) * 2013-09-25 2016-01-26 Emc Corporation System and method for predicting future disk failures
US9519556B2 (en) * 2014-09-09 2016-12-13 Dell Products, Lp Member replacement in an array of information storage devices
US9632891B2 (en) * 2015-02-12 2017-04-25 Netapp, Inc. Faster reconstruction of segments using a dedicated spare memory unit

Also Published As

Publication number Publication date
JP2018045365A (ja) 2018-03-22
US20180074913A1 (en) 2018-03-15
US10592349B2 (en) 2020-03-17

Similar Documents

Publication Publication Date Title
US9542272B2 (en) Write redirection in redundant array of independent disks systems
US8176359B2 (en) Disk array system and control method thereof
US10120769B2 (en) Raid rebuild algorithm with low I/O impact
US7587631B2 (en) RAID controller, RAID system and control method for RAID controller
US7774643B2 (en) Method and apparatus for preventing permanent data loss due to single failure of a fault tolerant array
US20150234709A1 (en) Storage controller, storage system, and control method
JP2008204041A (ja) ストレージ装置及びデータ配置制御方法
JPWO2006123416A1 (ja) ディスク故障復旧方法及びディスクアレイ装置
JP2005122338A (ja) スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法
JP2016057795A (ja) ストレージ制御装置,ストレージシステム及びストレージ制御プログラム
WO2014132373A1 (ja) ストレージシステム及び記憶デバイス障害回復方法
JP4491330B2 (ja) ディスクアレイ装置とそのデータのリカバリ方法およびデータリカバリプログラム
JP2002049511A (ja) アドレスの割付変更方法及びこれを用いた外部記憶サブシステム
US8433949B2 (en) Disk array apparatus and physical disk restoration method
US7529776B2 (en) Multiple copy track stage recovery in a data storage system
US9535791B2 (en) Storage control device, non-transitory computer-readable recording medium having stored therein program, and control method
US20180307427A1 (en) Storage control apparatus and storage control method
JP4905510B2 (ja) ストレージ制御装置及びストレージ装置のデータ回復方法
JP2006285527A (ja) ストレージ装置およびプログラム。
JP6957845B2 (ja) ストレージ制御装置及びストレージ装置
JP2010267037A (ja) ディスクアレイ装置
JP6171616B2 (ja) ストレージ制御装置、及びストレージ制御プログラム
JP6277878B2 (ja) ストレージ装置の制御装置、ストレージ装置の制御方法及びストレージ装置の制御プログラム
JP6556980B2 (ja) ストレージ制御装置、ストレージ制御方法及びストレージ制御プログラム
JP6805838B2 (ja) ディスク管理システム、ディスク管理方法、および、ディスク管理プログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190611

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210907

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210920

R150 Certificate of patent or registration of utility model

Ref document number: 6957845

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150