JP6171616B2 - ストレージ制御装置、及びストレージ制御プログラム - Google Patents

ストレージ制御装置、及びストレージ制御プログラム Download PDF

Info

Publication number
JP6171616B2
JP6171616B2 JP2013131592A JP2013131592A JP6171616B2 JP 6171616 B2 JP6171616 B2 JP 6171616B2 JP 2013131592 A JP2013131592 A JP 2013131592A JP 2013131592 A JP2013131592 A JP 2013131592A JP 6171616 B2 JP6171616 B2 JP 6171616B2
Authority
JP
Japan
Prior art keywords
storage device
disk
copy
area
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013131592A
Other languages
English (en)
Other versions
JP2015005248A (ja
Inventor
小林 賢次
賢次 小林
典秀 久保田
典秀 久保田
良太 塚原
良太 塚原
秀治郎 大黒谷
秀治郎 大黒谷
和彦 池内
和彦 池内
親志 前田
親志 前田
岳志 渡辺
岳志 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013131592A priority Critical patent/JP6171616B2/ja
Priority to US14/273,891 priority patent/US20140380090A1/en
Publication of JP2015005248A publication Critical patent/JP2015005248A/ja
Application granted granted Critical
Publication of JP6171616B2 publication Critical patent/JP6171616B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk

Description

本発明は、ストレージ制御装置、及びストレージ制御プログラムに関する。
ストレージ装置は、例えばディスクアレイ装置によって構成される。ディスクアレイ装置では、例えば、複数のディスク(記憶装置;HDD (Hard Disk Drive)等)を組み合わせ仮想的な1台のディスク(RAIDグループ)として管理するRAID(Redundant Array of Independent Inexpensive Devices)技術が採用されている。RAID技術の採用により、ディスクに記憶したデータの消失等が防止される。また、RAID技術では、RAIDのレベル(RAID1〜6等)に応じ、各ディスクへのデータ配置と冗長性とが異なる。
なお、RAID装置とは、RAID技術を利用したディスクアレイ装置のことをいう。RAID装置では、データ保証の観点から、RAID装置の制御部を冗長化する場合が多い。以下の説明では、RAID装置の制御部のことを「RAID装置」もしくは「ストレージ制御装置」と記述する場合がある。
ところで、光磁気ディスクや光ディスク等の情報記憶媒体では、製造時やその後の使用時に記憶媒体上に物理的な欠陥が生じる場合がある。例えば、ディスク表面に汚れやゴミ等が付着したり、ディスク表面に傷などが生じたりする場合がある。このような欠陥が存在する領域(データブロック)に対し読出アクセス(ディスクRead)を行なうと、当該領域からデータを正しく読み出すことができず、媒体エラーが発生する。
媒体エラーが発生した場合、媒体リカバリを含むデータリカバリが実施されるが、そのデータリカバリの対象は、一般に、媒体エラーを検出したデータブロックのみである。このデータブロックは、例えばディスク上で適当なサイズに区切られた単位領域(セクタ)に対応する。ここで、図7に示すフローチャート(ステップA1〜A6)に従って、RAIDグループの正常運用時におけるデータリカバリ処理について説明する。
RAIDグループの正常運用時(ステップA1)にディスクReadが行なわれると(ステップA2)、当該ディスクReadに対するディスクからの応答がチェックされる(ステップA3)。ディスクからの応答が正常である場合、つまりディスクから正しくデータが読み出された場合(ステップA3の“正常”ルート)、RAIDグループの正常運用が継続して実行される(ステップA4)。
一方、ディスクからの応答が正常でない場合、つまりディスクから正しくデータが読み出されず媒体エラーが生じている場合(ステップA3の“エラー”ルート)、データリカバリ処理が行なわれる(ステップA5)。データリカバリ処理に際しては、媒体エラーの生じた媒体エラー領域(単位領域)におけるデータが、当該媒体エラー領域を有するディスク以外のディスクにおけるデータを用いて復元される。復元されたデータは、当該媒体エラー領域を有するディスクにおいて、欠陥の無い領域(交替領域)に保存される。当該欠陥の無い領域は、当該媒体エラー領域に論理的に対応付けられている。このようにデータリカバリ処理を行なった後、RAIDグループの正常運用が継続して実行される(ステップA6)。
特開平7−176142号公報 特開2005−157739号公報
近年、ディスク容量の増大に伴い情報記憶媒体における記憶単位領域がミクロ化しているのに対し、媒体エラーの発生要因となる傷やゴミ等の物理的サイズは変わらない。このため、媒体エラーを検出した媒体エラー領域(データブロック)の周辺領域、つまり媒体エラー領域に対し物理的に連続する隣接領域においても、媒体エラーが頻発する傾向がある。
このとき、あるデータブロックで媒体エラーが発生した時点で同時または略同時に当該データブロックの周辺領域でも媒体エラーが発生することがある。一方で、上記時点では周辺領域の媒体は正常であったが、のちに、当該周辺領域で媒体エラーが発生することもある。いずれにしても、周辺領域の媒体エラーは、周辺領域に対し実際にアクセスしないと検出することができないため、後述するように、リビルド(Rebuild)動作時にデータロストとなる可能性が高い。
なお、リビルドは、RAIDグループの冗長性を自動回復する処理であり、RAIDグループに属するディスクが故障した際に、HS(Hot Spare)に対し、故障ディスクのデータを、同一RAIDグループにおける故障ディスク以外のディスクのデータを用いて再構築する処理である。また、HSは、リビルド等の過程で使用される代替ディスクであり、ディスク故障に備えて待機している。さらに、ディスクは、例えば媒体エラーが所定の頻度以上で生じる場合に、故障したと判断される。
ホストから媒体に対する入出力(I/O)要求に際しては、一回のI/O要求によってアクセスされる領域は比較的小さい(データブロック数が比較的少ない)。このため、I/O要求によるアクセス時には、連続的なエラー(周辺領域の媒体エラー)は検出され難いが、アクセス領域におけるデータの冗長性が保たれている可能性が高い。したがって、媒体エラーを検出した領域のデータが復旧される可能性は高い。
これに対し、リビルド処理に際しては、RAIDグループ内において故障ディスク以外のディスク(リビルド元)からHS(リビルド先)へ所定サイズの領域のデータが順次読み出されるが、前記所定サイズは、一回のI/O要求によってアクセスされる領域よりも大きい。このため、リビルド動作時には、連続的なエラー(周辺領域の媒体エラー)が検出され易い上に、前記所定サイズの領域におけるデータの冗長性が保たれている可能性が低い。したがって、媒体エラーを検出された領域のデータが復旧される可能性が低く、つまりはデータロストが発生する可能性が高く、媒体エラー領域の周辺領域のデータを保証することができないという課題がある。
ここで、図8に示すフローチャート(ステップB1〜B6)に従って、RAIDグループの非冗長状態時におけるリビルド処理について説明する。
リビルド処理が開始されると(ステップB1,B2)、リビルド元に対するディスクReadが行なわれ、リビルド元からHS(リビルド先)へ所定サイズの領域のデータが順次読み出される(ステップB3)。その際、ディスクReadが行なわれる都度、当該ディスクReadに対するリビルド元からの応答がチェックされる(ステップB4)。
リビルド元からの応答が正常である場合、つまりリビルド元から所定サイズの領域のデータが正しく読み出された場合(ステップB4の“正常”ルート)、リビルド処理が継続して実行される(ステップB5)。
一方、リビルド元からの応答が正常でない場合、つまりリビルド元から所定サイズの領域のデータが正しく読み出されず当該領域で媒体エラーが生じている場合(ステップB4の“異常”ルート)、データロストが生じる(ステップB6)。つまり、非冗長状態であるため、当該領域のデータをリビルド先に再構築することができない。
一つの側面で、本発明は、記憶装置の媒体エラー領域の周辺領域のデータの保証を行なうことを目的とする。
なお、前記目的に限らず、後述する発明を実施するための最良の形態に示す各構成により導かれる作用効果であって、従来の技術によっては得られない作用効果を奏することも本件の他の目的の一つとして位置付けることができる。
本件のストレージ制御装置は、RAIDグループに属する複数の第1記憶装置のうちの一つの記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行するリカバリ処理部と、コピー管理情報にアドレス情報が登録されたコピー対象の前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーするコピー処理を制御するコピー制御部と、を有し、前記リカバリ処理部は、前記RAIDグループに属する残りの複数の第1記憶装置のデータを用いて前記媒体エラー領域のデータのリカバリ処理を実行し、前記媒体エラー領域のデータが前記残りの複数の第1記憶装置のデータを用いてリカバリすることができない場合であって、当該媒体エラー領域のアドレス情報が前記コピー管理情報に登録されている場合に、前記他の記憶装置から前記データを読み出すことで前記データのリカバリ処理を行なう
一実施形態によれば、記憶装置の媒体エラー領域の周辺領域のデータの保証を行なうことができる。
本実施形態のストレージシステムの構成およびストレージ制御装置の機能構成を示すブロック図である。 本実施形態における周辺領域の具体的な定義を説明する図である。 本実施形態における専用領域の具体的な使用法およびコピー管理テーブルの具体的な登録内容を説明する図である。 本実施形態におけるリカバリ制御部によるリカバリ処理およびコピー制御部によるコピー処理を説明するフローチャートである。 本実施形態におけるコピー制御部によるコピー先ディスクの決定処理を説明するフローチャートである。 本実施形態におけるリビルド制御部によるリビルド処理を説明するフローチャートである。 RAIDグループの正常運用時におけるデータリカバリ処理を説明するフローチャートである。 RAIDグループの非冗長状態時におけるリビルド処理を説明するフローチャートである。
以下、図面を参照して実施の形態を説明する。
〔1〕本実施形態のストレージシステムの構成
図1を参照しながら、本実施形態におけるストレージシステム1の構成およびストレージ制御装置5の機能構成について説明する。なお、図1は、本実施形態のストレージシステム1の構成およびストレージ制御装置5の機能構成を示すブロック図である。
図1に示すように、本実施形態のストレージシステム1は、ホスト装置2およびストレージ装置3を有している。ホスト装置(ホストコンピュータ;以下、単に「ホスト」という)2は、ストレージ装置3における媒体(後述するディスク40)に対する、Read/Writeアクセス等のI/O要求を行なう。また、ストレージ装置3は、例えば、ディスクアレイ装置によって構成され、複数(図1ではn+1台)のディスク部4と、複数(図1では2台)のストレージ制御装置5とを有している。
ディスク部4は、複数(図1ではn+1台)のディスク40を有している。各ディスク(記憶装置)40は、例えばHDDであり、ホスト2によってアクセスされるユーザデータや、各種制御情報などを格納・記憶する。また、本実施形態のストレージ装置3においても、複数(図1では4台)のディスク40を組み合わせ仮想的な1台のディスク(RAIDグループ)41として管理するRAID技術が採用されている。図1に示すディスク部4では、n+1台のディスク40によって、k+1組のRAIDグループ41が構成されている。
ここで、n,kは自然数であり、n=4k+3であり、図1に示す例では、RAIDグループ#0には4台のディスク#0〜#3が含まれ、RAIDグループ#kには4台のディスク#n−3〜#nが含まれる。以下の説明において、任意のディスクを示す場合には符号40が用いられ、一のディスクを特定する場合には符号#0〜#nが用いられる。同様に、任意のRAIDグループを示す場合には符号41が用いられ、一のRAIDグループを特定する場合には符号#0〜#kが用いられる。なお、図1に図示されていないが、ディスク部4には、後述するリビルド先ディスク(代替記憶装置)として用いられるディスク40(HS;ホットスペア)が含まれている。本実施形態では、記憶装置としてディスク40が用いられているが、ディスク40に代えSSD(Solid State Device)等の記憶装置(媒体)が用いられてもよい。
また、本実施形態では、データ保証の観点から、ストレージ制御装置5は、2台備えられ冗長化(二重化)されている。2台のストレージ制御装置5は、同一または略同一の構成を有し、以下の説明において、任意のストレージ制御装置を示す場合には符号5が用いられ、一のストレージ制御装置を特定する場合には符号#0,#1が用いられる。
各ストレージ制御装置5は、ホストI/F(InterFace)10,ディスクI/F20および制御部30を有している。
ホストI/F10は、ホスト2と制御部30との間のインタフェースとして機能するもので、本実施形態では、2つ備えられ冗長化(二重化)されている。ディスクI/F20は、ディスク部4(ディスク40)と制御部30との間のインタフェースとして機能するもので、本実施形態では、2つ備えられ冗長化(二重化)されている。
制御部30は、ホスト2からのI/O要求等に応じてディスク部4(ディスク40,RAIDグループ41)を制御するもので、CPU(Central Processing Unit:処理部,コンピュータ)31およびメモリ32を有している。なお、図1には図示していないが、ユーザによって操作され各種指示や各種情報をCPU31に入力するGUI(Graphical User Interface)が備えられてもよい。当該GUIには、マウス,キーボード等の入力機器や、LCD(Liquid Crystal Display)等の表示機器が含まれる。
CPU31は、OS等に従って処理を実行し各種制御を行なうもので、メモリ32に保存されるストレージ制御プログラムを実行することにより、後述するリカバリ制御部31a,コピー制御部31bおよびリビルド制御部31cとしての機能を果たす。なお、メモリ32は、上記ストレージ制御プログラムや後述するコピー管理テーブル32aを含む各種情報を保存するほか、後述する候補ディスク情報格納領域32bを有し、RAM(Random Access Memory)等によって構成される。
〔2〕本実施形態のストレージ制御装置の機能構成
以下、本実施形態のCPU31によって実現される、リカバリ制御部31a,コピー制御部31bおよびリビルド制御部31cとしての機能について説明する。
〔2−1〕概要
ここで、本実施形態で実現される当該機能の概要は、以下の通りである。
つまり、ディスク40に対する所定のアクセスで媒体エラー領域を検出した場合、リカバリ制御部31aは、媒体エラー領域のデータリカバリ処理を行なう。そして、コピー制御部31bは、媒体エラー領域を含む周辺領域のデータをディスク40から他のディスク40の専用領域(図3の符号40b参照)へコピーする。これにより、当該周辺領域のデータについての冗長度が上げられる。なお、他のディスク40の専用領域にコピーされたデータは、コピー管理テーブル32aによって後述するごとく管理される。
また、コピー制御部31bが専用領域へのコピー処理を行なう際、コピー対象の周辺領域で媒体エラー領域を検出した場合、リカバリ制御部31aは、検出した媒体エラー領域のデータリカバリ処理を行なう。
ディスク40の故障を検出した場合、リビルド制御部31cは、故障したディスク40の属するRAIDグループにおける残りのディスク40のデータを用いて、故障したディスク40のデータを代替ディスク40に再構築する。その際、残りのディスク40からデータを読み出せない場合、リビルド制御部31cは、コピー管理テーブル32aを用いて上記他のディスク40から対応データを読み出す。
なお、以下の説明において、媒体エラー領域を検出されたディスク40を、エラーディスク40もしくはコピー元ディスク40という場合がある。また、コピー制御部31bによってエラーディスク40のデータをコピーされる他のディスク40を、コピー先ディスク40という場合がある。さらに、故障を検出されたディスク40を、故障ディスク40といい、故障ディスク40の属するRAIDグループにおける残りのディスク40(故障ディスクの再構築に用いられるディスク40)を、リビルド元ディスク40という場合がある。また、故障ディスク40を再構築される代替ディスク(代替記憶装置)40を、リビルド先ディスク40という場合がある。またさらに、周辺領域を周辺エリアといい、専用領域を専用エリアという場合がある。
〔2−2〕リカバリ制御部およびコピー制御部の機能
リカバリ制御部31aは、ディスク40において媒体エラーの生じた媒体エラー領域を検出した場合、当該媒体エラー領域のデータリカバリ処理を実行する。このとき、リカバリ制御部31aは、ディスク40において所定のアクセス(例えば本実施形態ではディスクRead)を実行できなかった領域を媒体エラー領域として検出する。なお、媒体エラーは上述したような物理的な欠陥であり、媒体エラー領域は、媒体エラーの生じた媒体を含むデータブロックである。
このとき、エラーディスク40は、一のRAIDグループ41に属する複数のディスク(第1記憶装置)40のうちの一つである。リカバリ制御部31aは、前記複数のディスク(第1記憶装置)40のうちの、エラーディスク40以外のディスク40におけるデータを用いて、媒体エラー領域のデータリカバリ処理を実行する。これにより、媒体エラー領域におけるデータが復元される。復元されたデータは、エラーディスク40において、欠陥の無い領域(交替領域)に保存される。当該欠陥の無い領域は、当該媒体エラー領域に論理的に対応付けられている。
コピー制御部31bは、ディスク40において媒体エラー領域を検出した場合、当該媒体エラー領域のデータリカバリ処理の実行後、当該媒体エラー領域の周辺領域のデータをエラーディスク40から他のディスク40の専用領域(図3の符号40b参照)にコピーする。エラーディスク40から他のディスク40にコピーされる周辺領域のデータは、媒体エラー領域のデータリカバリ後のデータ、および、媒体エラー領域に対し物理的に連続する隣接領域のデータを含んでいる。
〔2−2−1〕周辺領域(周辺エリア)の定義
図2を参照しながら、本実施形態における周辺領域(周辺エリア)の具体的な定義について説明する。本実施形態では、ディスク40としてHDDが用いられており、周辺エリアは、検出された媒体エラー領域Eを含むエラートラック、および、当該エラートラックに隣接する隣接トラックである。
例えば図2に示すように、周辺エリアは、ディスク40のディスク媒体(プラッタ)における、媒体エラー領域Eを含むエラートラックTi(iは自然数)と、当該トラックTi内側のトラックTi-1と、当該トラックTi外側のトラックTi+1との3本のトラックTi-1〜Ti+1の全セクタとする。このように周辺エリアを3本のトラックTi-1〜Ti+1の全セクタとした場合、周辺エリアの容量は、例えば数MB(メガバイト)程度となる。
なお、本実施形態では、エラートラックと当該エラートラック内外側のトラックとを周辺領域としているが、これに限定されるものでなく、エラートラックと、当該エラートラック内側の1本以上のトラックと、当該エラートラック外側の1本以上のトラックとを周辺領域としてもよい。
コピー制御部31bが周辺領域のデータのエラーディスク40から他のディスク40へのコピー処理を行なうべく周辺領域のデータの読出アクセスを行なった際にディスク40において媒体エラー領域が検出された場合も、リカバリ制御部31aは、当該媒体エラー領域のデータリカバリ処理を実行する。このとき、媒体エラー領域の検出箇所が例えば図2のエラートラックTiに属している場合、コピー制御部31bは、3本のトラックTi-1〜Ti+1をそのまま周辺領域(コピー対象)としてコピー処理を行なう。
一方、媒体エラー領域の検出箇所が例えば図2のトラックTi-1に属している場合、コピー制御部31bは、トラックTi-1よりも内側のトラックTi-2を周辺領域に加え、4本のトラックTi-2〜Ti+1をコピー対象としてコピー処理を行なう。同様に、媒体エラー領域の検出箇所が例えば図2のトラックTi+1に属している場合、コピー制御部31bは、トラックTi+1よりも外側のトラックTi+2を周辺領域に加え、4本のトラックTi-1〜Ti+2をコピー対象としてコピー処理を行なう。
〔2−2−2〕専用領域(専用エリア)の使用法およびコピー管理テーブルの登録内容
図3を参照しながら、本実施形態における専用領域(専用エリア)の具体的な使用法およびコピー管理テーブル32aの具体的な登録内容について説明する。
本実施形態のディスク部4を構成する各ディスク40においては、図に示すように、ユーザによって使用されるユーザ領域(ユーザエリア)40aが確保されるほか、数十MB程度の領域が、専用エリア40bとして定義され確保されている。各ディスク40における専用エリア40bは、複数のRAIDグループ41(#0〜#k)によって共用可能になっている。各ディスク40の専用エリア40bには、図3に示すように、エラーディスク40で生じた媒体エラー領域の周辺領域のデータが、コピー制御部31bによってコピーされ保存される。また、各ディスク40の専用エリア40bにおけるコピー状態は、メモリ32のコピー管理テーブル32aによって管理される。
図3に示す例において、エラーディスク40で生じた媒体エラー領域の周辺領域のデータは、当該エラーディスク40の属するRAIDグループ41とは異なるRAIDグループ41に属するディスク40の専用エリア40bに優先的にコピーされ保存される。より具体的に説明すると、図3では、RAIDグループ#1に属するエラーディスク#4のユーザエリア40aにおける周辺エリアデータAが、コピー制御部31bによって、RAIDグループ#0に属するコピー先ディスク#0の専用エリア40bにコピーされ保存される。このようなコピー処理に伴い、コピー制御部31bは、図3に示すように、メモリ32のコピー管理テーブル32aのレコード#0に例えば以下の情報(a1)〜(a5)を登録保存する。
(a1)コピー元ディスクつまりエラーディスク40のディスク番号(識別情報)#4
(a2)コピー先ディスク40のディスク番号(識別情報)#0
(a3)周辺エリアデータAの開始論理ブロックアドレス(開始LBA:Logical Block Address)0x2100
(a4)周辺エリアデータAのブロック数0x1000
(a5)コピー制御部31bによる周辺エリアデータAのコピー開始時刻14時30分50秒
また、図3では、RAIDグループ#2に属するエラーディスク#8のユーザエリア40aにおける周辺エリアデータBが、コピー制御部31bによって、RAIDグループ#0に属するコピー先ディスク#0の専用エリア40bにコピーされ保存される。このようなコピー処理に伴い、コピー制御部31bは、図3に示すように、メモリ32のコピー管理テーブル32aのレコード#1に例えば以下の情報(b1)〜(b5)を登録保存する。
(b1)コピー元ディスクつまりエラーディスク40のディスク番号#8
(b2)コピー先ディスク40のディスク番号#0
(b3)周辺エリアデータBの開始LBA0x5280
(b4)周辺エリアデータBのブロック数0x1000
(b5)コピー制御部31bによる周辺エリアデータBのコピー開始時刻17時34分30秒
同様に、図3では、RAIDグループ#2に属するエラーディスク#8のユーザエリア40aにおける周辺エリアデータCが、コピー制御部31bによって、RAIDグループ#3に属するコピー先ディスク#12の専用エリア40bにコピーされ保存される。このようなコピー処理に伴い、コピー制御部31bは、図3に示すように、メモリ32のコピー管理テーブル32aのレコード#2に例えば以下の情報(c1)〜(c5)を登録保存する。
(c1)コピー元ディスクつまりエラーディスク40のディスク番号#8
(c2)コピー先ディスク40のディスク番号#12
(c3)周辺エリアデータCの開始LBA0x1280
(c4)周辺エリアデータCのブロック数0x1000
(c5)コピー制御部31bによる周辺エリアデータCのコピー開始時刻18時24分10秒
上述のような情報を登録されるコピー管理テーブル32aは、後述するように、コピー制御部31bによる周辺領域データのコピー処理(コピー重複回避)や、リビルド制御部31cによるリビルド処理に際して用いられる。
なお、各ディスク40の専用エリア40bにおいてデータをコピーする空き領域が無くなった場合、コピー制御部31bは、コピー管理テーブル32aにおけるコピー先ディスク40に係るレコードを参照して、以下のように動作する。つまり、コピー制御部31bは、コピー先ディスク40に係るレコードのコピー開始時刻を参照し、コピー開始時刻が最も古いデータブロックを選択し、選択したデータブロックに、コピー対象の周辺エリアデータを上書きする。
〔2−2−3〕コピー先ディスクの決定手法
コピー制御部31bは、以下の3つの判断基準(d1)〜(d3)を組み合わせることにより、周辺エリアのデータをコピーすべきコピー先ディスク(他のディスク)40の候補を複数のディスク40から選択し、選択した候補からコピー先ディスク40を決定する。なお、コピー制御部31bによる、コピー先ディスク40のより詳細な決定処理については、図5を参照しながら後述する。
(d1)ディスク40が、媒体エラーを検出されたエラーディスク40の属すRAIDグループ(自RAIDグループ)41に属しているか否か。
(d2)ディスク40の専用エリア40bに空き領域があるか否か。
(d3)ディスク40が今回のエラーディスク40について初のコピー先であるか否か。
これらの判断基準(d1)〜(d3)に従って、例えば図5を参照しながら後述するように、HS(代替ディスク)または未使用ディスクであって、且つ今回のエラーディスク40について初のコピー先となるディスクが、最優先でコピー先ディスク40として決定される。
特に、本実施形態のコピー制御部31bは、以下のように、所定規則およびコピー管理テーブル32aに従って、自RAIDグループ41に属するディスク40、および、自RAIDグループ41に属さない一以上のディスク(第2記憶装置)40の中から、コピー先ディスク40を決定する。
つまり、コピー制御部31bは、ディスク部4における全てのディスク40のそれぞれが下記の第1候補(e1)〜第8候補(e8)のいずれに当てはまるかを判断する。
第1候補(e1)に当てはまるディスク40が見出された場合、コピー制御部31bは、他のディスク40についての判断を行なうことなく、第1候補(e1)に当てはまるディスク40をコピー先ディスク40として決定する。
一方、メモリ32の候補ディスク情報格納領域32bには、第2候補(e2)〜第8候補(e8)のディスク40を特定する識別情報(ディスクID等)を候補ディスク情報としてそれぞれ保存する領域1〜領域7が確保されている。第2候補(e2)〜第8候補(e8)のいずれかに当てはまるディスク40が見出された場合、コピー制御部31bは、見出されたディスク40の識別情報を、候補ディスク情報格納領域32bの対応領域に書き込み保存する。例えば、第5候補(e5)に当てはまるディスク40が見出された場合、コピー制御部31bは、見出されたディスク40の識別情報を領域4に書き込み保存する。ただし、コピー制御部31bがディスク40の識別情報を候補ディスク情報格納領域32bに保存する際、対応領域に他の識別情報が保存済みであれば、コピー制御部31bは、今回の識別情報の保存を行なわない。
そして、第1候補(e1)に当てはまるディスク40が見出されることなく全てのディスクについての判断を完了した場合、コピー制御部31bは、候補ディスク情報格納領域32bの領域1〜領域7を参照し、所定の優先順位に従って、第2候補(e2)〜第8候補(e8)のうちの一つをコピー先ディスク40として決定する。例えば、本実施形態では、優先順位を第2候補(e2)〜第8候補(e8)の順とし、第1候補(e1)に当てはまるディスク40が見出されなかった場合、コピー制御部31bは、領域1に保存された識別情報によって特定されるディスク40(第2候補(e2))をコピー先ディスク40として決定する。また、領域1に識別情報が保存されていない場合つまり第2候補(e2)に当てはまるディスク40が存在しなかった場合、コピー制御部31bは、領域2に保存された識別情報によって特定されるディスク40(第3候補(e3))をコピー先ディスク40として決定する。以下、同様にして、コピー制御部31bは、第4候補(e4)〜第8候補(e8)のいずれかをコピー先ディスク40として決定する。
(e1)第1候補:エラーディスクの属するRAIDグループ41に属さず且つ専用エリア40bに空きがあり且つエラーディスクについて初のコピー先であるディスク40
(e2)第2候補:エラーディスクの属するRAIDグループ41に属さず且つ専用エリア40bに空きがあり且つエラーディスクについて初のコピー先でないディスク40
(e3)第3候補:エラーディスクの属するRAIDグループ41に属さず且つ専用エリア40bに空きがなく且つエラーディスクについて初のコピー先であるディスク40
(e4)第4候補:エラーディスクの属するRAIDグループ41に属さず且つ専用エリア40bに空きがなく且つエラーディスクについて初のコピー先でないディスク40
(e5)第5候補:エラーディスクの属するRAIDグループ41に属し且つ専用エリア40bに空きがあり且つエラーディスクについて初のコピー先であるディスク40
(e6)第6候補:エラーディスクの属するRAIDグループ41に属し且つ専用エリア40bに空きがあり且つエラーディスクについて初のコピー先でないディスク40
(e7)第7候補:エラーディスクの属するRAIDグループ41に属し且つ専用エリア40bに空きがなく且つエラーディスクについて初のコピー先であるディスク40
(e8)第8候補:エラーディスクの属するRAIDグループ41に属し且つ専用エリア40bに空きがなく且つエラーディスクについて初のコピー先でないディスク40
なお、コピー制御部31bは、第3候補(e3),第4候補(e4),第7候補(e7)および第8候補(e8)のうちの一つをコピー先ディスク40として決定した場合、コピー管理テーブル32aのコピー開始時刻を参照し、コピー先ディスク40の専用エリア40bにおける最古データブロックを、コピー対象の周辺エリアデータによって上書きする。
〔2−2−4〕専用エリアへのコピー重複回避
コピー制御部31bは、周辺エリアデータのコピー処理を実行する場合、コピー管理テーブル32aを参照して今回のコピー対象データの範囲とコピー済みデータの範囲との重複の有無を判断する。そして、重複が無いと判断した場合、コピー制御部31bは、上述した第1候補(e1)〜第8候補(e8)の中からコピー先ディスク40を決定し、周辺エリアデータをエラーディスク40からコピー先ディスク40にコピーする。
一方、今回のコピー対象データの範囲とコピー済みデータの範囲とが一部重複すると判断した場合、コピー制御部31bは、前述した第1候補(e1)〜第8候補(e8)の中からコピー先ディスク40を決定せず、重複するデータを保存するディスク40をコピー先ディスク40として決定する。そして、コピー制御部31bは、今回のコピー対象データの範囲のうち、コピー済みデータ範囲と重複しない範囲(非重複エリア)のデータを、エラーディスク40からコピー先ディスク40にコピーする。これにより、周辺エリアデータの重複コピーが回避される。
また、コピー制御部31bは、コピー管理テーブル32aにおけるコピー先ディスク40に係るレコードであって、前記重複するデータについて先に登録されているレコードの情報、つまり開始LBA,データのブロック数およびコピー開始時刻を更新する。このとき、コピー制御部31bは、コピー先ディスク40において前記重複するデータの前側に非重複エリアのデータを追加する場合、開始LBA,データのブロック数およびコピー開始時刻を更新する。また、コピー制御部31bは、コピー先ディスク40において前記重複するデータの後側に非重複エリアのデータを追加する場合、データのブロック数およびコピー開始時刻を更新する。
なお、今回のコピー対象データの範囲とコピー済みデータの範囲とが全て重複する、つまり一致すると判断した場合、コピー制御部31bは、コピー処理を行なわず、重複するデータを保存するディスク40に係る、コピー管理テーブル32aのレコードのコピー開始時刻のみを更新してもよい。
また、今回のコピー対象データの範囲が2つの異なるディスク40におけるコピー済みデータの範囲と重複すると判断した場合、コピー制御部31bは、2つの異なるディスク40のうち、今回のコピー対象データの範囲と重複する量の多い方のディスク40を、コピー先ディスク40として決定する。そして、コピー制御部31bは、上述と同様、コピー処理、および、コピー管理テーブル32aの更新処理を行なう。
〔2−2−5〕コピーのタイミング
ところで、各ディスク40の専用エリア40bへのコピー処理は、ストレージ制御装置(RAID装置)5における負荷を高める可能性がある。そこで、できるだけストレージ制御装置5において負荷を高めることなくあるいは処理性能の低下を招くことなくコピー処理が行なわれるように、コピー制御部31bは、以下のタイミングで、周辺エリアのデータのコピー処理を行なうように構成される。つまり、コピー制御部31bは、ディスク部4を含むストレージシステム1に対する負荷が低い時間帯(f1)に、もしくは、ある程度性能を問われない機能がストレージシステム1において実行される時間帯(f2)にコピー処理を実行する。
ここで、ストレージシステム1に対する負荷が低い時間帯(f1)としては、例えば深夜や週末が考えられ、コピー制御部31bは、このような時間帯(f1)にコピー処理を行なうようにスケジューリングする。
また、ストレージシステム1においてある程度性能を問われない機能が実行される時間帯(f2)にコピー処理を実行する場合、コピー制御部31bは、コピー処理が当該機能と連動するようにスケジューリングする。ある程度性能を問われない機能としては、例えばコピー機能や診断機能が考えられる。このとき、コピー制御部31bは、コピー機能や診断機能によるディスクReadと、周辺エリアデータを専用エリア40bにコピーするためのディスクReadとを同時に実行するようにスケジューリングする。
〔2−3〕リビルド制御部の機能
前述したように、リビルドは、RAIDグループ41の冗長性を自動回復する処理であり、RAIDグループ41に属するディスク40が故障した際に、代替ディスク(HS)40に対し、故障ディスク40のデータを、同一RAIDグループ41における故障ディスク40以外のディスク40のデータを用いて再構築する処理である。また、ディスク40は、例えば媒体エラーが所定の頻度以上で生じる場合に、故障したと判断される。
リビルド制御部31cは、ディスク40の故障を検出した場合(故障ディスク40を検出した場合)、上述のようなリビルド処理を実行制御する。つまり、リビルド制御部31cは、故障ディスクを検出すると、リビルド元ディスク40のデータを用いて、故障ディスク40に代わる代替ディスク(リビルド先ディスク)40に故障ディスク40のデータを再構築する。ここで、リビルド元ディスク40は、故障ディスク40の属するRAIDグループ41における、当該故障ディスク40以外のディスク40である。
リビルド制御部31cは、リビルド元ディスク40から、代替ディスク(リビルド先ディスク)40に再構築すべきデータブロックを読み出せない場合、つまりリビルド元ディスク40で媒体エラーが発生した場合、当該データブロックに係る情報を含むレコードがコピー管理テーブル32aに登録されているか否かを判断する。
当該データブロックに係る情報を含むレコードがコピー管理テーブル32aに登録されている場合、リビルド制御部31cは、当該データブロックに係る情報に基づき、当該データブロックを専用エリア40bに保存しているディスク(他の記憶装置)40から当該データブロックを読み出す。つまり、リビルド制御部31cは、当該データブロックを専用エリア40bに保存しているディスク40をリビルド元ディスク40として扱い、当該データブロックのディスクReadを行なう。リビルド元ディスク40から当該データブロックを読み出せた場合、リビルド制御部31cは、読み出した当該データブロックを代替ディスク40に書き込むことで、故障ディスク40のデータを再構築する。
このようにして、リビルド時に初回媒体エラー(最初に発生した媒体エラー)の周辺エリアで媒体エラーが発生した場合、コピー管理テーブル32aに基づき、専用エリア40bのデータを用いて媒体エラーのリカバリ処理が実行される。
なお、当該データブロックに係る情報を含むレコードがコピー管理テーブル32aに登録されていない場合や、リビルド元ディスク40から当該データブロックを読み出せなかった場合、リビルド制御部31cは、データロストが生じたものと判断し、ユーザに対する通知処理等を行なう。
また、上述したリビルド制御部31cによる、より詳細なリビルド処理については、図6を参照しながら後述する。
〔3〕本実施形態の動作
次に、図4〜図6を参照しながら、上述のごとく構成された本実施形態のストレージシステム1およびストレージ制御装置5の動作について説明する。
〔3−1〕リカバリ処理およびコピー処理
まず、図4に示すフローチャート(ステップS11〜S22)に従って、本実施形態におけるリカバリ制御部31aによるリカバリ処理およびコピー制御部31bによるコピー処理について説明する。
RAIDグループ41の正常運用時(ステップS11)にディスクReadが行なわれると(ステップS12)、当該ディスクReadに対するディスク40からの応答がチェックされる(ステップS13)。ディスク40からの応答が正常である場合、つまりディスク40から正しくデータが読み出された場合(ステップS13の“正常”ルート)、RAIDグループ41の正常運用が継続して実行される(ステップS14)。
一方、ディスク40からの応答が正常でない場合、つまりディスク40から正しくデータが読み出されず媒体エラーが生じている場合(ステップS13の“エラー”ルート)、媒体リカバリを含むデータリカバリ処理が行なわれる(ステップS15)。このとき、リカバリ制御部31aによって、RAIDグループ41におけるエラーディスク40以外のディスク40のデータを用い媒体エラー領域のデータリカバリ処理が実行される。これにより、媒体エラー領域におけるデータが復元される。
この後、コピー制御部31bによって、コピー管理テーブル32aが参照され、項目〔2−2−4〕で上述した、専用エリア40bへのコピー重複を回避するためのチェックが行なわれる(ステップS16)。つまり、コピー制御部31bによって、ステップS15で復元された媒体エラー領域の周辺エリア(今回のコピー対象データの範囲)と専用エリア40bにおけるコピー済みデータの範囲との重複の有無がチェックされる。ステップS16での重複の有無のチェック結果は、コピー制御部31bによってステップS19でのコピー先ディスク40の決定処理とステップS2でのコピーデータのディスクWrite処理(コピー処理)とを実行する際に用いられる。
そして、コピー制御部31bによって、当該媒体エラー領域の周辺エリアのデータをエラーディスク40から他のディスク40の専用エリア40bにコピーすべく、コピー対象である周辺エリアのデータの読出(ディスクRead)が実行される(ステップS17)。ディスクReadが実行されると、ステップS13と同様、当該ディスクReadに対するディスク40からの応答がチェックされる(ステップS18)。ディスク40からの応答が正常である場合、つまりディスク40から正しくデータが読み出された場合(ステップS18の“正常”ルート)、CPU30は、ステップS19の処理へ移行する。
一方、ディスク40からの応答が正常でない場合、つまりディスク40から正しくデータが読み出されず媒体エラーが生じている場合(ステップS18の“エラー”ルート)、再びステップS15〜S18の処理が繰り返し実行される。
媒体エラー領域の周辺エリアのデータがディスク40から正しくデータが読み出されると(ステップS18の“正常”ルート)、コピー制御部31bによって、コピー先ディスクが決定される(ステップS19)。
ステップS19においては、ステップS16でのチェック結果が重複無しの場合、コピー制御部31bによって、図5を参照しながら後述する手順に従い、項目〔2−2−3〕で上述した第1候補(e1)〜第8候補(e8)の中からコピー先ディスク40が決定される。一方、ステップS16でのチェック結果が重複有り(一部重複)の場合、項目〔2−2−4〕で上述したように、コピー制御部31bによって、周辺エリアデータと重複するデータを既に保存しているディスク40が、コピー先ディスク40として決定される。
そして、コピー制御部31bによって、今回実行されるコピー処理の内容に応じて、メモリ32のコピー管理テーブル32aにおける対応レコードの作成もしくは更新が実行される(ステップS20)。
ステップS20においては、今回コピーされる周辺エリアデータに係るレコードがコピー管理テーブル32aに登録されていない場合(つまりステップS16でのチェック結果が重複無しの場合)、コピー管理テーブル32aにレコードが新規に作成される。作成したレコードには、前述した情報(a1)〜(a5)や(b1)〜(b5)や(c1)〜(c5)と同様の情報つまり今回のコピー処理に係る下記情報(f1)〜(f5)が設定登録される。一方、今回コピーされる周辺エリアデータに係るレコードがコピー管理テーブル32aに登録されている場合(つまりステップS16でのチェック結果が重複有りの場合)、前述したように、下記情報(f3)〜(f5)もしくは下記情報(f4), (f5)が更新される。
(f1)コピー元ディスクつまりエラーディスク40のディスク番号(識別情報)
(f2)コピー先ディスク40のディスク番号(識別情報)
(f3)コピー対象の周辺エリアデータの開始LBA
(f4)コピー対象の周辺エリアデータのブロック数
(f5)コピー制御部31bによるコピー開始時刻
コピー管理テーブル32aのレコードが作成または更新されると、コピー制御部31bによって、ステップS17でエラーディスク40から読み出された周辺エリアデータ(コピーデータ)が、ステップS19で決定されたコピー先ディスク40の専用エリア40bに書き込まれ保存される(ディスクWrite;ステップS21)。
ステップS21においては、ステップS16でのチェック結果が重複無しの場合、ステップS19で第1候補(e1)〜第8候補(e8)の中から決定されたコピー先ディスク40の専用エリア40bに、読み出された周辺エリアデータの全てがコピーされる。一方、ステップS16でのチェック結果が重複有り(一部重複)の場合、コピー範囲が調整される。つまり、重複するデータを保存するディスク40の専用エリア40bに、読み出された周辺エリアデータのうち、コピー済みデータ範囲と重複しない範囲(非重複エリア)のデータがコピーされる。これにより、周辺エリアデータの重複コピーが回避される。
以上の処理により、媒体エラーの生じた媒体エラー領域の周辺エリアデータについての冗長度が上げられる。特に、本実施形態においては、コピー処理後、当該周辺エリアデータは、二重化された状態から三重化された状態になる。
なお、図4に示すフローチャートにおいて、コピー制御部31bは、ステップS20の処理を実行してから、ステップS21の処理を実行しているが、ステップS21の処理を実行してから、ステップS20の処理を実行してもよい。
〔3−2〕コピー先ディスクの決定処理
ついで、図5に示すフローチャート(ステップS31〜S48)に従って、本実施形態におけるコピー制御部31bによるコピー先ディスク40の決定処理について説明する。特に、ここでは、ステップS16でのチェック結果が重複無しの場合の、コピー先ディスク40の決定処理について説明する。この場合、ディスク部4における全てのディスク40のそれぞれが第1候補(e1)〜第8候補(e8)のいずれに当てはまるかが判断され、第1候補(e1)〜第8候補(e8)の中からコピー先ディスク40が決定される。
まず、コピー制御部31bは、ディスク部4の全ディスク40に対する処理を完了したか否かを判断する(ステップS31)。全ディスク40に対する処理を完了した場合(ステップS31のYESルート)、コピー制御部31bは、後述するステップS48の処理へ移行する。
一方、全ディスク40に対する決定処理を完了していない場合(ステップS31のNOルート)、コピー制御部13bは、今回の処理対象ディスク40が媒体エラー領域を含むエラーディスクであるか否かを判断する(ステップS32)。処理対象ディスク40がエラーディスクであるか否かは、例えば、コピー管理テーブル32aの情報(f1)として処理対象ディスク40のディスク番号(識別情報)が登録されているか否かによって判断される。つまり、コピー管理テーブル32aの情報(f1)として処理対象ディスク40のディスク番号(識別情報)が登録されている場合、処理対象ディスク40はエラーディスクであると判断される。
今回の処理対象ディスク40がエラーディスクである場合(ステップS32のYESルート)、コピー制御部31bは、処理対象ディスク40をコピー先ディスク40とすることなく、ステップS31の処理に戻る。一方、処理対象ディスク40がエラーディスクでない場合(ステップS32のNOルート)、コピー制御部31bは、以下に説明するステップS33〜S47の処理を実行する。
つまり、処理対象ディスク40がエラーディスクでない場合(ステップS32のNOルート)、コピー制御部31bは、処理対象ディスク40がエラーディスクの属するRAIDグループ(自RAIDグループ)41以外のディスクであるか否かを判断する(ステップS33)。処理対象ディスク40が自RAIDグループ41以外のディスクである場合(ステップS33のYESルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40の専用エリア40bに空き領域があるか否かを判断する(ステップS34)。
処理対象ディスク40の専用エリア40bに空き領域がある場合(ステップS34のYESルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40が今回のエラーディスクについて初のコピー先であるか否かを判断する(ステップS35)。
処理対象ディスク40が今回のエラーディスクについて初のコピー先である場合(ステップS35のYESルート)、今回の処理対象ディスク40は第1候補(e1)に当てはまっており、コピー制御部31bは、今回の処理対象ディスク40をコピー先ディスク40として決定し(ステップS36)、処理を終了する。
このように第1候補(e1)に当てはまるディスク40が見出された場合、コピー制御部31bは、それ以降、他のディスク40についての判断を行なうことなく、第1候補(e1)に当てはまるディスク40をコピー先ディスク40として決定する。これにより、自RAIDグループ41に属さないHS(代替ディスク)または未使用ディスクであって且つ今回のエラーディスクについて初のコピー先となるディスク40が、最優先でコピー先ディスク40として決定される。
一方、処理対象ディスク40が今回のエラーディスクについて初のコピー先でない場合(ステップS35のNOルート)、コピー制御部31bは、処理対象ディスク40が第2候補(e2)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域1に保存してから(ステップS37)、ステップS31の処理に戻る。ただし、領域1に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
また、処理対象ディスク40の専用エリア40bに空き領域がない場合(ステップS34のNOルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40が今回のエラーディスクについて初のコピー先であるか否かを判断する(ステップS38)。
処理対象ディスク40が今回のエラーディスクについて初のコピー先である場合(ステップS38のYESルート)、コピー制御部31bは、処理対象ディスク40が第3候補(e3)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域2に保存してから(ステップS39)、ステップS31の処理に戻る。ただし、領域2に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
一方、処理対象ディスク40が今回のエラーディスクについて初のコピー先でない場合(ステップS38のNOルート)、コピー制御部31bは、処理対象ディスク40が第4候補(e4)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域3に保存してから(ステップS40)、ステップS31の処理に戻る。ただし、領域3に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
ステップS33において、処理対象ディスク40が自RAIDグループ41以外のディスクでないと判定された場合(ステップS33のNOルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40の専用エリア40bに空き領域があるか否かを判断する(ステップS41)。
処理対象ディスク40の専用エリア40bに空き領域がある場合(ステップS41のYESルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40が今回のエラーディスクについて初のコピー先であるか否かを判断する(ステップS42)。
処理対象ディスク40が今回のエラーディスクについて初のコピー先である場合(ステップS42のYESルート)、コピー制御部31bは、処理対象ディスク40が第5候補(e5)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域4に保存してから(ステップS43)、ステップS31の処理に戻る。ただし、領域4に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
一方、処理対象ディスク40が今回のエラーディスクについて初のコピー先でない場合(ステップS42のNOルート)、コピー制御部31bは、処理対象ディスク40が第6候補(e6)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域5に保存してから(ステップS44)、ステップS31の処理に戻る。ただし、領域5に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
また、処理対象ディスク40の専用エリア40bに空き領域がない場合(ステップS41のNOルート)、コピー制御部31bは、コピー管理テーブル32aの情報等に基づき、処理対象ディスク40が今回のエラーディスクについて初のコピー先であるか否かを判断する(ステップS45)。
処理対象ディスク40が今回のエラーディスクについて初のコピー先である場合(ステップS45のYESルート)、コピー制御部31bは、処理対象ディスク40が第7候補(e7)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域6に保存してから(ステップS46)、ステップS31の処理に戻る。ただし、領域6に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
一方、処理対象ディスク40が今回のエラーディスクについて初のコピー先でない場合(ステップS45のNOルート)、コピー制御部31bは、処理対象ディスク40が第8候補(e8)に当てはまると判断する。そして、コピー制御部31bは、今回の処理対象ディスク40の識別情報(ディスクID等)を、候補ディスク情報として、メモリ32の候補ディスク情報格納領域32bにおける領域7に保存してから(ステップS47)、ステップS31の処理に戻る。ただし、領域7に既に識別情報が保存されている場合、今回の処理対象ディスク40の識別情報の保存は行なわれない。
以上の処理によって、第1候補(e1)に当てはまるディスク40が見出されることなく全てのディスク40に対する処理を完了した場合(ステップS31のYESルート)、コピー制御部31bは、ステップS48の処理に移行する。この時点で、ステップS31〜S47の処理によって、第2候補(e2)〜第8候補(e8)のいずれかに当てはまると判断されたディスク40の識別情報が、それぞれ、候補ディスク情報格納領域32bの領域1〜領域7に保存されている。
ステップS48においては、コピー制御部31bによって、候補ディスク情報格納領域32bの領域1〜領域7が参照され、領域1〜領域7(第2候補(e2)〜第8候補(e8))の順で、コピー先ディスク40が決定される。
以上のようにして、自RAIDグループに属すディスク40よりも属さないディスク40が優先的にコピー先ディスク40として決定される。また、専用エリア40bに空き領域の無いディスク40よりも空き領域のあるディスク40が優先的にコピー先ディスク40として決定される。さらに、エラーディスクについて初のコピー先でないディスク40よりも初のコピー先であるディスク40が優先的にコピー先ディスク40として決定される。
これにより、エラーディスクに対し安全性の高いと考えられるディスク40が優先的にコピー先ディスク40として決定される。したがって、媒体エラー領域の周辺エリアデータは、エラーディスクに対し安全性の高いと考えられるディスク40に保存されることになり、周辺エリアデータが確実に保存され周辺エリアデータの冗長性が確保される。
なお、第3候補(e3),第4候補(e4),第7候補(e7)および第8候補(e8)のうちの一つがコピー先ディスク40として決定された場合、コピー管理テーブル32aのコピー開始時刻が参照される。そして、コピー先ディスク40の専用エリア40bにおける最古データブロックが選択され、選択された最古データブロックが、コピー対象の周辺エリアデータによって上書きされる。
〔3−3〕リビルド処理
ついで、図6に示すフローチャート(ステップS51〜S65)に従って、本実施形態におけるリビルド制御部31cによるリビルド処理について説明する。
故障ディスク40が検出されると、リビルド制御部31cによって、リビルド元ディスク40のデータを用い、故障ディスク40に代わる代替ディスク(リビルド先ディスク)40に故障ディスク40のデータを再構築するリビルド処理が開始される(ステップS51)。
リビルド処理が起動されると、まず、リビルド元ディスク40に対するディスクReadが行なわれ、リビルド元ディスク40からHS(リビルド先ディスク,代替ディスク)40へデータブロックが順次読み出される(ステップS52)。その際、ディスクReadが行なわれる都度、当該ディスクReadに対するリビルド元ディスク40からの応答がチェックされる(ステップS53)。
リビルド元ディスク40からの応答が正常である場合、つまりリビルド元ディスク40からデータブロックが正しく読み出された場合(ステップB53の“正常”ルート)、リビルド処理が継続して実行される(ステップS54)。
一方、リビルド元ディスク40からの応答が正常でない場合、つまりリビルド元ディスク40で媒体エラーが発生した場合(ステップS53の“異常”ルート)、リビルド制御部31cによって、コピー管理テーブル32aが参照される。そして、リビルド制御部31cによって、ステップS52でアクセスしたデータブロックに係る情報を含むレコードがコピー管理テーブル32aに登録されているか否かが確認される(ステップS55)。
コピー管理テーブル32aに当該データブロックに係るレコードが登録されていない場合(ステップS55のNOルート)、リビルド制御部31cはデータロストが生じたものと判断し(ステップS64)、ユーザに対する通知処理等が行なわれる。
コピー管理テーブル32aに当該データブロックに係るレコードが登録されている場合(ステップS55のYESルート)、リビルド制御部31cは、コピー管理テーブル32aに登録されている当該データブロックに係る情報に基づき、当該データブロックを専用エリア40bに保存しているディスク40をリビルド元ディスクとする。そして、リビルド制御部31cによって、当該データブロックを保存するリビルド元ディスク40に対するディスクReadが行なわれ、リビルド元ディスク40(専用エリア40b)からリビルド先ディスク40へ当該データブロックが読み出される(ステップS56)。
このときも、当該ディスクReadに対するリビルド元ディスク40からの応答がチェックされる(ステップS57)。リビルド元ディスク40からの応答が正常でない場合、つまりリビルド元ディスク40で媒体エラーが発生した場合(ステップS57の“異常”ルート)、リビルド制御部31cはデータロストが生じたものと判断し(ステップS65)、ユーザに対する通知処理等が行なわれる。
一方、リビルド元ディスク40からの応答が正常である場合、つまりリビルド元ディスク40から当該データブロックが正しく読み出された場合(ステップB57の“正常”ルート)、リビルド制御部31cによって、読み出された当該データブロックをリビルド先ディスク40に書き込むことで、故障ディスク40のデータがリビルド先ディスク40上でリカバリされる(ステップS58)。これにより、リビルド時に初回媒体エラー(最初に発生した媒体エラー)の周辺エリアで媒体エラーが発生した場合、コピー管理テーブル32aに基づき、専用エリア40bのデータを用いて媒体エラーのリカバリ処理が実行される。
この後、上述と同様にして、リビルド処理が継続され、故障ディスク40におけるユーザエリア40a(図3参照)のリビルド処理が完了すると(ステップS59)、リビルド制御部31cは、故障ディスク40における専用エリア40bの復元を実行するか否かを判断する(ステップS60)。この判断は、ユーザ(RAID装置の使用者)からの指示に応じて行なわれる。専用エリア40bの復元を実行するか否かは、ユーザによって事前に設定されている。
専用エリア40bの復元を実行する場合(ステップS60のYESルート)、リビルド制御部31cは、コピー管理テーブル32aから、故障ディスク40がコピー先として登録されているレコードを検索する。そして、リビルド制御部31cは、検索したレコードにおいて指定される範囲のデータブロックを、再度、リビルド先ディスク40の専用エリア40bにコピーするとともに、当該コピーに従ったコピー管理テーブル32aの更新を行なってから(ステップS61)、リビルド処理を完了する(ステップS63)。
また、専用エリア40bの復元を実行しない場合(ステップS60のNOルート)、リビルド制御部31cは、コピー管理テーブル32aから、故障ディスク40がコピー先として登録されているレコードを検索する。そして、リビルド制御部31cは、検索したレコードを、コピー管理テーブル32aから削除してから(ステップS62)、リビルド処理を完了する(ステップS63)。
〔4〕まとめ
本実施形態のストレージシステム1およびストレージ制御装置5によれば、ディスクRead時に媒体エラーを検出した場合、媒体エラー領域の周辺エリアにおけるデータのコピーが行なわれる。これにより、媒体エラーの生じた媒体エラー領域の周辺エリアデータについての冗長度が高められ、ストレージ装置3におけるディスク内異常領域について予防的データ構築が実現され、ディスク40の媒体エラー領域の周辺エリアのデータが保証される。
また、媒体エラー領域の周辺エリアにおけるデータのコピーを行なうことで、周辺エリアにおける媒体エラーを早期に検出してリカバリすることができる。
さらに、周辺エリアデータのコピーはコピー管理テーブル32aによって管理されている。このため、故障ディスク40のリビルド時に初回媒体エラーの周辺エリアで媒体エラーが発生した場合、コピー管理テーブル32aに基づき、専用エリア40bのデータを用いて媒体エラーのリカバリ処理が実行される。これにより、データロストの発生を抑制することができる。
また、コピー管理テーブル32aに基づき、専用エリア40bにコピーされるべきデータ範囲と専用エリア40bにおけるコピー済みデータの範囲との重複の有無がチェックされる。当該チェック結果が重複有り(一部重複)の場合、専用エリア40bに、コピー済みデータ範囲と重複しない範囲(非重複エリア)のデータがコピーされる。これにより、周辺エリアデータの重複コピーが回避され、専用エリア40bを効率的に利用することができる。
さらに、本実施形態では、自RAIDグループ41に属さないHS(代替ディスク)または未使用ディスクであって且つ今回のエラーディスクについて初のコピー先となるディスク40が、最優先でコピー先ディスク40として決定される。また、エラーディスクに対し安全性の高いと考えられるディスク40が優先的にコピー先ディスク40として決定される。したがって、媒体エラー領域の周辺エリアデータは、エラーディスクに対し安全性の高いと考えられるディスク40に保存されることになり、周辺エリアデータが確実に保存され周辺エリアデータの冗長性が確保される。
また、本実施形態において、各ディスク40の専用エリア40bへのコピー処理は、ストレージシステム1に対する負荷が低い時間帯(f1)に、もしくは、ある程度性能を問われない機能がストレージシステム1で実行される時間帯(f2)に実施される。これにより、できるだけストレージ制御装置5において負荷を高めることなくもしくは処理性能の低下を招くことなくコピー処理が行なわれる。
〔5〕その他
以上、本発明の好ましい実施形態について詳述したが、本発明は、係る特定の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲内において、種々の変形、変更して実施することができる。
上述したリカバリ制御部31a,コピー制御部31b,リビルド制御部31cとしての機能の全部もしくは一部は、コンピュータ(CPU,情報処理装置,各種端末を含む)が所定のアプリケーションプログラム(ストレージ制御プログラム)を実行することによって実現される。
また、上記アプリケーションプログラムは、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RWなど),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD−RW,DVD+R,DVD+RWなど),ブルーレイディスク等のコンピュータ読取可能な記録媒体に記録された形態で提供される。この場合、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。
〔6〕付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行するリカバリ制御部と、
前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーするコピー制御部と、を有する、ストレージ制御装置。
(付記2)
前記リカバリ制御部は、前記コピー制御部による前記周辺領域のデータのコピー処理に伴い前記記憶装置において前記媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行する、付記1記載のストレージ制御装置。
(付記3)
前記周辺領域のデータは、前記媒体エラー領域の前記データリカバリ後のデータ、および、前記媒体エラー領域に対し物理的に連続する隣接領域のデータを含む、付記1または付記2に記載のストレージ制御装置。
(付記4)
前記記憶装置は、HDD(Hard Disk Drive)であり、
前記周辺領域は、前記媒体エラー領域を含むエラートラック、および、前記エラートラックに隣接する隣接トラックである、付記1〜付記3のいずれか一項に記載のストレージ制御装置。
(付記5)
前記リカバリ制御部は、前記記憶装置において所定のアクセスを実行できなかった領域を前記媒体エラー領域として検出する、付記1〜付記4のいずれか一項に記載のストレージ制御装置。
(付記6)
前記コピー制御部による前記周辺領域のデータのコピー処理に伴い、少なくとも、前記記憶装置の識別情報と、前記他の記憶装置の識別情報と、前記コピー制御部によってコピーされる前記周辺領域のデータの開始論理ブロックアドレスおよびブロック数と、前記コピー制御部によるコピー開始時刻とを登録・更新されるコピー管理テーブルを有し、
前記コピー制御部は、前記コピー管理テーブルに基づき、前記周辺領域のデータのコピー処理を実行する、付記1〜付記5のいずれか一項に記載のストレージ制御装置。
(付記7)
前記コピー制御部は、前記周辺領域のデータのコピー処理を実行する場合、前記コピー管理テーブルを参照して今回のコピー対象データ範囲とコピー済みデータ範囲との重複の有無を判断し、前記今回のコピー対象データ範囲のうち、前記コピー済みデータ範囲と重複しない範囲のデータを、前記記憶装置から前記他の記憶装置にコピーする、付記6記載のストレージ制御装置。
(付記8)
前記記憶装置は、一のRAID(Redundant Arrays of Inexpensive Drives)グループに属する複数の第1記憶装置のうちの一つであり、
前記リカバリ制御部は、前記複数の第1記憶装置のうちの、前記記憶装置以外の一以上の第1記憶装置におけるデータを用いて、前記媒体エラー領域のデータリカバリ処理を実行する、付記6または付記7のいずれか一項に記載のストレージ制御装置。
(付記9)
前記コピー制御部は、所定規則および前記コピー管理テーブルに従って、前記一以上の第1記憶装置、および、前記一のRAIDグループに属さない一以上の第2記憶装置の中から前記他の記憶装置を決定する、付記8記載のストレージ制御装置。
(付記10)
前記複数の第1記憶装置および前記一以上の第2記憶装置のそれぞれは、前記コピー制御部によって前記周辺領域のデータをコピーされる専用領域を有し、
前記コピー制御部は、
前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第1候補とし、
前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第2候補とし、
前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第3候補とし、
前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第4候補とし、
前記一以上の第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第5候補とし、
前記一以上の第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第6候補とし、
前記一以上の第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第7候補とし、
前記一以上の第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第8候補とし、
所定の優先順位に従って、前記第1〜第8候補のうちの一つを前記他の記憶装置として決定する、付記9記載のストレージ制御装置。
(付記11)
前記コピー制御部は、前記第3候補,前記第4候補,前記第7候補および前記第8候補のうちの一つを前記他の記憶装置として決定した場合、前記コピー管理テーブルの前記コピー開始時刻を参照し、前記専用領域における最古データを、前記周辺領域のデータによって上書きする、付記10記載のストレージ制御装置。
(付記12)
前記記憶装置の故障を検出した場合、前記一以上の第1記憶装置のデータを用いて、前記記憶装置に代わる代替記憶装置に前記記憶装置のデータを再構築するリビルド制御部を、さらに有する、付記8〜付記11のいずれか一項に記載のストレージ制御装置。
(付記13)
前記リビルド制御部は、
前記一以上の第1記憶装置から、前記代替記憶装置に再構築すべきデータブロックを読み出せない場合、前記データブロックに係る情報が前記コピー管理テーブルに登録されているか否かを判断し、
前記データブロックに係る情報が前記コピー管理テーブルに登録されている場合、前記データブロックに係る情報に基づき、前記他の記憶装置から前記データブロックを読み出す、付記12記載のストレージ制御装置。
(付記14)
前記リビルド制御部は、前記他の記憶装置から前記データブロックを読み出した場合、読み出した前記データブロックを前記代替記憶装置に書き込むことで、前記記憶装置のデータを再構築する、付記13記載のストレージ制御装置。
(付記15)
前記コピー制御部は、前記記憶装置を含むシステムに対する負荷が低い時間帯に、もしくは、前記システムにおいて性能を問われない機能が実行される時間帯に、前記周辺領域のデータのコピー処理を実行する、付記1〜付記14のいずれか一項に記載のストレージ制御装置。
(付記16)
記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行し、
前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーする、ストレージ制御方法。
(付記17)
前記周辺領域のデータのコピー処理に伴い前記記憶装置において前記媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行する、付記16記載のストレージ制御方法。
(付記18)
前記周辺領域のデータは、前記媒体エラー領域の前記データリカバリ後のデータ、および、前記媒体エラー領域に対し物理的に連続する隣接領域のデータを含む、付記16または付記17に記載のストレージ制御方法。
(付記19)
前記記憶装置は、HDD(Hard Disk Drive)であり、
前記周辺領域は、前記媒体エラー領域を含むエラートラック、および、前記エラートラックに隣接する隣接トラックである、付記16〜付記18のいずれか一項に記載のストレージ制御方法。
(付記20)
記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行し、
前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーする、
処理を、コンピュータに実行させる、ストレージ制御プログラム。
1 ストレージシステム
2 ホスト装置
3 ストレージ装置(ディスクアレイ装置)
4 ディスク部
5 ストレージ制御装置(RAID装置)
10 ホストI/F
20 ディスクI/F
30 制御部
31 CPU(処理部,コンピュータ)
31a リカバリ制御部
31b コピー制御部
31c リビルド制御部
32 メモリ
32a コピー管理テーブル
32b 候補ディスク情報格納領域
40 ディスク(HDD,媒体,記憶装置,他の記憶装置,第1記憶装置,第2記憶装置,代替記憶装置)
40a ユーザ領域(ユーザエリア)
40b 専用領域(専用エリア)
41 RAIDグループ

Claims (10)

  1. RAID(Redundant Arrays of Inexpensive Drives)グループに属する複数の第1記憶装置のうちの一つの記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行するリカバリ処理部と、
    コピー管理情報にアドレス情報が登録されたコピー対象の前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーするコピー処理を制御するコピー制御部と、を有し、
    前記リカバリ処理部は、
    前記RAIDグループに属する残りの第1記憶装置のデータを用いて前記媒体エラー領域のデータのリカバリ処理を実行し、
    前記媒体エラー領域のデータが前記残りの第1記憶装置のデータを用いてリカバリすることができない場合であって、当該媒体エラー領域のアドレス情報が前記コピー管理情報に登録されている場合に、前記他の記憶装置から前記データを読み出すことで前記データのリカバリ処理を行なう、
    ことを特徴とする、ストレージ制御装置。
  2. 前記リカバリ処理部は、前記コピー制御部による前記周辺領域のデータのコピー処理に伴い前記記憶装置において前記媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行する、請求項1記載のストレージ制御装置。
  3. 前記コピー管理情報は、前記記憶装置の識別情報と、前記他の記憶装置の識別情報と、前記コピー制御部によってコピーされる前記周辺領域のデータの開始論理ブロックアドレスおよびブロック数とを含む、請求項1または請求項に記載のストレージ制御装置。
  4. 前記コピー制御部は、前記他の記憶装置が前記RAIDグループに属しているか否かの第1判断基準と、前記他の記憶装置において前記コピー制御部によって前記周辺領域のデータをコピーされる専用領域に空き領域があるか否かの第2判断基準と、前記他の記憶装置が前記記憶装置について初めてのコピー先であるか否かの第3判断基準と、前記コピー管理情報とに従って、前記残りの第1記憶装置、および、前記RAIDグループに属さない一以上の第2記憶装置の中から前記他の記憶装置を決定する、請求項1〜請求項3のいずれか一項に記載のストレージ制御装置。
  5. 前記コピー制御部は、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第1候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第2候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第3候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第4候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第5候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第6候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第7候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第8候補とし、
    所定の優先順位に従って、前記第1〜第8候補のうちの一つを前記他の記憶装置として決定する、請求項4記載のストレージ制御装置。
  6. (段落0143に記載の付記11)
    前記コピー制御部は、前記第3候補,前記第4候補,前記第7候補および前記第8候補のうちの一つを前記他の記憶装置として決定した場合、前記専用領域における最古データを、前記周辺領域のデータによって上書きする、請求項5記載のストレージ制御装置。
  7. RAID(Redundant Arrays of Inexpensive Drives)グループに属する複数の第1記憶装置のうちの一つの記憶装置において媒体エラーの生じた媒体エラー領域を検出した場合、前記媒体エラー領域のデータリカバリ処理を実行し、
    コピー管理情報にアドレス情報が登録されたコピー対象の前記媒体エラー領域の周辺領域のデータを、前記記憶装置から他の記憶装置にコピーするとともに
    前記リカバリ処理に際して、
    前記RAIDグループに属する残りの第1記憶装置のデータを用いて前記媒体エラー領域のデータのリカバリ処理を実行し、
    前記媒体エラー領域のデータが前記残りの第1記憶装置のデータを用いてリカバリすることができない場合であって、当該媒体エラー領域のアドレス情報が前記コピー管理情報に登録されている場合に、前記他の記憶装置から前記データを読み出すことで前記データのリカバリ処理を行なう
    処理を、コンピュータに実行させる、ストレージ制御プログラム。
  8. 前記他の記憶装置が前記RAIDグループに属しているか否かの第1判断基準と、前記他の記憶装置において前記コピー制御部によって前記周辺領域のデータをコピーされる専用領域に空き領域があるか否かの第2判断基準と、前記他の記憶装置が前記記憶装置について初めてのコピー先であるか否かの第3判断基準と、前記コピー管理情報とに従って、前記残りの第1記憶装置、および、前記RAIDグループに属さない一以上の第2記憶装置の中から前記他の記憶装置を決定する、
    処理を、前記コンピュータに実行させる、請求項7記載のストレージ制御プログラム。
  9. 前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第1候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第2候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第3候補とし、
    前記一以上の第2記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第4候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先である記憶装置を第5候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがあり且つ前記記憶装置について初めてのコピー先でない記憶装置を第6候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先である記憶装置を第7候補とし、
    前記残りの第1記憶装置の一つであり且つ前記専用領域に空きがなく且つ前記記憶装置について初めてのコピー先でない記憶装置を第8候補とし、
    所定の優先順位に従って、前記第1〜第8候補のうちの一つを前記他の記憶装置として決定する、
    処理を、前記コンピュータに実行させる、請求項8記載のストレージ制御プログラム。
  10. 前記第3候補,前記第4候補,前記第7候補および前記第8候補のうちの一つを前記他の記憶装置として決定した場合、前記専用領域における最古データを、前記周辺領域のデータによって上書きする、
    処理を、前記コンピュータに実行させる、請求項9記載のストレージ制御プログラム。
JP2013131592A 2013-06-24 2013-06-24 ストレージ制御装置、及びストレージ制御プログラム Expired - Fee Related JP6171616B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013131592A JP6171616B2 (ja) 2013-06-24 2013-06-24 ストレージ制御装置、及びストレージ制御プログラム
US14/273,891 US20140380090A1 (en) 2013-06-24 2014-05-09 Storage control device and storage control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013131592A JP6171616B2 (ja) 2013-06-24 2013-06-24 ストレージ制御装置、及びストレージ制御プログラム

Publications (2)

Publication Number Publication Date
JP2015005248A JP2015005248A (ja) 2015-01-08
JP6171616B2 true JP6171616B2 (ja) 2017-08-02

Family

ID=52111989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013131592A Expired - Fee Related JP6171616B2 (ja) 2013-06-24 2013-06-24 ストレージ制御装置、及びストレージ制御プログラム

Country Status (2)

Country Link
US (1) US20140380090A1 (ja)
JP (1) JP6171616B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999399B (zh) * 2012-11-13 2016-08-03 浙江宇视科技有限公司 一种jbod阵列自动恢复存储的方法和装置
US11288255B2 (en) * 2017-06-08 2022-03-29 Visier Solutions, Inc. Systems and methods for generating event stream data
US9990389B1 (en) 2017-06-08 2018-06-05 Visier Solutions, Inc. Systems and methods for generating event stream data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06215491A (ja) * 1993-01-14 1994-08-05 Nec Field Service Ltd 磁気ディスク制御装置
JPH09269871A (ja) * 1996-03-29 1997-10-14 Mitsubishi Electric Corp ディスクアレイ装置におけるデータ再冗長化方式
JP4754852B2 (ja) * 2005-03-15 2011-08-24 富士通株式会社 ストレージ制御装置および方法
JP4817783B2 (ja) * 2005-09-30 2011-11-16 富士通株式会社 Raidシステム及びそのリビルド/コピーバック処理方法
JP4984613B2 (ja) * 2006-04-10 2012-07-25 富士通株式会社 Raid装置の制御方法、raid装置、およびraid装置の制御プログラム
JP4499776B2 (ja) * 2007-10-31 2010-07-07 富士通株式会社 ストレージ制御装置、方法、及びプログラム
JP2010267037A (ja) * 2009-05-14 2010-11-25 Fujitsu Ltd ディスクアレイ装置
JP5696483B2 (ja) * 2011-01-12 2015-04-08 富士通株式会社 情報記憶システム
US8650435B2 (en) * 2011-06-08 2014-02-11 Dell Products L.P. Enhanced storage device replacement system and method
JP5887757B2 (ja) * 2011-08-17 2016-03-16 富士通株式会社 ストレージシステム、ストレージ制御装置およびストレージ制御方法

Also Published As

Publication number Publication date
JP2015005248A (ja) 2015-01-08
US20140380090A1 (en) 2014-12-25

Similar Documents

Publication Publication Date Title
US7721143B2 (en) Method for reducing rebuild time on a RAID device
US9009526B2 (en) Rebuilding drive data
JP5942511B2 (ja) バックアップ装置,バックアップ方法,およびバックアッププログラム
JP6064608B2 (ja) ストレージ装置、バックアッププログラム、およびバックアップ方法
US20140075240A1 (en) Storage apparatus, computer product, and storage control method
JP2016057795A (ja) ストレージ制御装置,ストレージシステム及びストレージ制御プログラム
JP2008033874A (ja) 独立ディスクのリダンダントアレイ毀損時のデータ救援方法及びそのシステム
JPWO2006123416A1 (ja) ディスク故障復旧方法及びディスクアレイ装置
TWI456389B (zh) 儲存虛擬化系統中更新實體儲存裝置控制程式之方法及用此方法之儲存虛擬化控制器與系統
JP2002259062A (ja) 記憶装置システム及び記憶装置システムにおけるデータの複写方法
JP6171616B2 (ja) ストレージ制御装置、及びストレージ制御プログラム
JP4405421B2 (ja) ストレージ装置およびプログラム。
JP2015225603A (ja) ストレージ制御装置、ストレージ制御方法およびストレージ制御プログラム
US7529776B2 (en) Multiple copy track stage recovery in a data storage system
JP6880769B2 (ja) 情報処理装置,制御プログラムおよび情報処理方法
JP5218147B2 (ja) ストレージ制御装置,ストレージ制御方法およびストレージ制御プログラム
JP2014203285A (ja) ドライブアレイ装置、コントローラ、データ記憶ドライブ及び方法
JP2004213470A (ja) ディスクアレイ装置及びディスクアレイ装置におけるデータ書き込み方法
JP2006260376A (ja) ストレージ装置およびメディアエラー回復方法
CN106557264B (zh) 针对固态硬盘的存储方法及设备
US20130212428A1 (en) Information storage medium library array apparatus, information recording method and information recording program
JP2010026812A (ja) 磁気ディスク装置
JP2010267037A (ja) ディスクアレイ装置
JP6957845B2 (ja) ストレージ制御装置及びストレージ装置
JP2005293119A (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R150 Certificate of patent or registration of utility model

Ref document number: 6171616

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees