WO2014111979A1

WO2014111979A1 - ディスクアレイ制御装置およびディスクアレイ装置

Info

Publication number: WO2014111979A1
Application number: PCT/JP2013/004782
Authority: WO
Inventors: 真由美鳴川
Original assignee: 株式会社東芝
Priority date: 2013-01-16
Filing date: 2013-08-07
Publication date: 2014-07-24
Also published as: JP5586712B2; JP2014137702A

Abstract

　実施形態のディスクアレイ制御装置は、ＲＡＩＤ５による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行う。このディスクアレイ制御装置は、ＲＡＩＤ５で現用するディスク装置に不良セクタが発生した場合、不良セクタのデータを復元し、復元されたデータを予備ディスク装置にコピーする復元コピー部を備える。また、ディスクアレイ制御装置は、不良セクタに対するアクセス要求があった場合、予備ディスク装置に不良セクタのデータの復元コピーがなされた予備ディスク装置の対応セクタへのアクセスに変換するアクセス変換部と、を備える。

Description

ディスクアレイ制御装置およびディスクアレイ装置

関連出願の引用

　本出願は、２０１３年１月１６日に出願した先行する日本国特許出願第２０１３－００５７４１号による優先権の利益に基礎をおき、かつ、その利益を求めており、その内容全体が引用によりここに包含される。

　本発明の実施形態は、ディスクアレイ制御装置およびディスクアレイ装置に関する。

　従来より、ＲＡＩＤ（Redundant Arrays of Inexpensive DisksもしくはRedundant　Arrays of Independent Disksの略）と呼ばれる、複数台の、ハードディスクドライブ等のディスク装置を仮想的な１台の記憶装置として使用する技術がある。ＲＡＩＤにはいくつかの種類があり、ＲＡＩＤ５は、複数のハードディスクドライブに、データと、誤り訂正符号データとしての水平パリティとを分散させて記録する方式であり、冗長性を向上させることができる。

日本国特許出願公報平５－３５４１３号公報

　ＲＡＩＤ５で動作するディスクアレイ装置において、１台のディスク装置に障害が発生した場合、残りのディスク装置のデータと水平パリティを元に障害データを回復させることができる。しかし、２台以上のディスク装置に障害が発生した場合には回復が不可能になる、という問題があった。

　本発明が解決しようとする課題は、ディスクアレイを構成する複数のディスク装置にデータと水平パリティとを分散させて記録するディスクアレイシステムにおいて、複数のディスク装置の水平方向のセクタに不良セクタが発生した場合でも、データを回復させることができるディスクアレイ制御装置およびディスクアレイ装置を提供することである。

　実施形態のディスクアレイ制御装置は、ＲＡＩＤ５による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行うディスクアレイ制御装置である。

　このディスクアレイ装置は、ＲＡＩＤ５で使用される運用ディスク装置に不良セクタが発生した場合、不良セクタのデータを復元し、復元されたデータを予備ディスク装置へコピーする復元コピー部を備える。

　また、ディスクアレイ装置は、不良セクタに対するアクセス要求があった場合、不良セクタに対するアクセスを、復元されたデータがコピーされた予備ディスク装置のセクタへのアクセスに変換するアクセス変換部と、を備える。

図１は、一実施形態における、ホストＣＰＵに接続されたディスクアレイ装置の概略構成を示す。図２は、一実施形態のＲＡＩＤコントローラの制御回路の機能構成を示すブロック図である。図３は、一実施形態のＲＡＩＤコントローラに特有の動作を説明するフローチャートである。図４は、一実施形態のＲＡＩＤコントローラに特有の動作を説明するフローチャートである。図５は、一実施形態のディスクアレイ装置における運用例を説明するための図である。図６は、一実施形態のディスクアレイ装置における運用例を説明するための図である。図７は、一実施形態のディスクアレイ装置における運用例を説明するための図である。図８は、一実施形態のディスクアレイ装置における運用例を説明するための図である。図９は、４台のディスク装置を使用したＲＡＩＤ５による従来のディスクアレイ装置におけるデータ記録の様子を示す。図１０は、４台のディスク装置を使用したＲＡＩＤ５による従来のディスクアレイ装置におけるデータ記録の様子を示し、２個の不良セクタが発生した例を示す。

　以下、実施例を説明する。

　図１は、ホストＣＰＵ２に接続された、本実施形態のディスクアレイ装置１の概略構成を示す。ディスクアレイ装置１は、複数のＨＤＤ（Hard Disk Drive）等からなるディスク装置１４Ａ、１４Ｂからなるディスクアレイと、ＲＡＩＤコントローラ１０とを備える。ＲＡＩＤコントローラ１０は、ディスクアレイを制御し、またディスクアレイへのアクセス制御を行う。ディスクアレイはＲＡＩＤコントローラ１０を介してホストＣＰＵ２接続される。

　ＲＡＩＤコントローラ１０はディスクアレイの制御を行うコントローラであり、分割・多重化回路（ＭＰＸ）１１と、マトリクス回路（Ｘ－ＳＷ）１２と、制御回路１３とを有する。分割・多重化回路（ＭＰＸ）１１と５台のディスク装置１４Ａ，１４Ｂとがマトリクス回路（Ｘ－ＳＷ）１２へ接続されている。

　本実施形態において、５台のディスク装置のうち１台のディスク装置は予備ディスク装置１４Ｂであり、残りの４台のディスク装置は運用ディスク装置１４Ａである。４台の運用ディスク装置１４ＡはＲＡＩＤ５によるディスクアレイを構成する。なお、本実施形態では、ディスクアレイとして５台のディスク装置１４Ａ，１４Ｂを用いる。しかし、ディスク装置の台数はこれに限られるものではなく、予備ディスク装置１４Ｂの台数も１台に限られるものではない。また、以下の説明においては、ＲＡＩＤ５で使用されるディスク装置を運用ディスク装置１４Ａと記し、また予備ディスク装置を予備ディスク装置１４Ｂと記す。

　本実施例では、ホスト側からの入力データを４台の運用ディスク装置１４Ａのうちの３台に分散して記録する。分割・多重化回路１１は、ホスト側（ここではホストＣＰＵ２）からの入力データを３つに分割して３つのデータを生成し、またこれら３つのデータに対する水平パリティ（誤り訂正符号データ）を生成し、そして３つのデータと水平パリティとをマトリクス回路１２を介して４台の運用ディスク装置１４Ａへ出力する。また分割・多重化回路１１は、４台の運用ディスク装置１４Ａからの、水平パリティを除く３つのデータを、マトリクス回路１２を介して受取り、３つのデータを多重化し、多重化されたデータをホスト側へ出力する。

　マトリクス回路１２は、４台の運用ディスク装置１４Ａと、予備ディスク装置１４Ｂと、分割・多重化回路１１との間の接続を切り替える。

　制御回路１３は、プログラムされたプロセッサにより構成され、ホストＣＰＵ２からの要求に応じて分割・多重化回路１１およびマトリクス回路１２を制御する。制御回路１３は、通常時は、ＲＡＩＤ５に準拠したアクセス制御を行う。図２に示されるように、制御回路１３は復元コピー部１３Ａ、通知部１３Ｂ、およびアクセス変換部１３Ｃを有する。いずれかの運用ディスク装置１４Ａに不良セクタが発生した場合には、制御回路１３は、復元コピー部１３Ａ、通知部１３Ｂ、およびアクセス変換部１３Ｃにより、本実施形態に特有の下記の制御を行う。

　いずれかの運用ディスク装置１４Ａの、あるセクタが不良セクタとなった場合に、復元コピー部１３Ａは、該当不良セクタのデータを復元し、復元されたデータを予備ディスク装置１４Ｂへコピーする。なお、読み出しエラーや書き込みエラーを検知することにより、不良セクタを特定することができる。

　いずれかの運用ディスク装置１４Ａに不良セクタが発生した場合、通知部１３Ｂは、ホストＣＰＵ２へ不良セクタの発生を通知する。その際、不良セクタを特定するため、通知部１３Ｂは、不良セクタが発生した運用ディスク装置１４ＡのディスクＮｏ．（以下、ディスク装置のＮｏ．をディスクＮｏ．と記す）および不良セクタのセクタＮｏ．を含むアドレス情報をホストＣＰＵ２へ通知する。なお、ここでは、説明を簡単にするため、ディスク装置１４Ａ、１４Ｂ上のセクタの位置を特定するためのアドレス情報としてディスクＮｏ．およびセクタＮｏ．を用いる。なお、実際には、アドレス情報は、シリンダＮｏ．、ヘッドＮｏ．も含む。

　復元されたデータの予備ディスク装置１４Ｂへのコピーが完了すると、ホストＣＰＵ２は、不良セクタが発生した運用ディスク装置１４ＡのディスクＮｏ．および不良セクタのセクタＮｏ．を含むアドレス情報と、予備ディスク装置１４ＢのディスクＮｏ．および復元されたデータがコピーされたセクタのセクタＮｏ．を含むアドレス情報を、変換テーブル１３Ｄに書き込む。なお、変換テーブル１３Ｄは後述される。復元されたデータがコピーされる予備ディスク装置１４Ｂのセクタは、使われていないセクタから、例えば、後述するセクタＮｏ．順に選定される。

　ホストＣＰＵ２から運用ディスク装置１４Ａの不良セクタへのアクセス要求があった場合に、アクセス変換部１３Ｃは、不良セクタへのアクセスを、復元されたデータがコピーされた、予備ディスク装置１４Ｂのセクタへのアクセスに変換する。具体的には、復元されたデータがコピーされた、予備ディスク装置１４Ｂのセクタがアクセスされるように、アクセス変換部１３Ｃは、後述の変換テーブル１３Ｄを基にマトリクス回路１２の内部接続を切り替える。

　次に、参考のため、ＲＡＩＤ５による従来のディスクアレイ装置について、図９、図１０を用いて説明する。

　図９は、４台のディスク装置を使用したＲＡＩＤ５による従来のディスクアレイ装置におけるデータ記録の様子を示す。図９に示されるように、Ｆｉｌｅ１のデータａ，ｂ，ｃと、Ｆｉｌｅ２のデータｄ，ｅ，ｆ，ｇ，ｈ，ｉが、４台のディスク装置に分散されて記録されている。ディスクＮｏ．０～ディスクＮｏ．３の各ディスク装置の同一セクタ（セクタＮｏ．０、セクタＮｏ．１またはセクタＮｏ．２）に、３つのデータと１つの水平パリティが分散されて記録されている。なお、図９において、Ｐａｂｃは、データａ，ｂ，ｃの水平パリティであり、Ｐｄｅｆは、データｄ，ｅ，ｆの水平パリティであり、Ｐｇｈｉは、データｇ，ｈ，ｉの水平パリティである（後述する他図においても同様である）。また、以下では、ディスクＮｏ．０～ディスクＮｏ．３の各ディスク装置をそれぞれ、ディスク０～ディスク３と記す。同様にセクタＮｏ．０～セクタＮｏ．２の各セクタをそれぞれセクタ０～セクタ２と記す。

　ＲＡＩＤ５では、図９に示すように各データと水平パリティが記録されるので、このディスクアレイ装置の中の１台のディスク装置が故障しても（あるいは水平方向に不良セクタが１つ発生しても）、水平パリティを用いて、読み取れなくなったデータを復元（あるいは再生）することが可能である。しかし、２台以上のディスク装置が故障した場合は（あるいは図１０に示すように水平方向において２個以上の不良セクタが発生した場合は）、水平パリティを用いてもデータを復元できず、システムに致命的な障害が発生する。

　ここで、説明を本実施形態のディスクアレイ装置１に戻す。図３、図４は、本実施形態における、ＲＡＩＤコントローラ１０に特有の動作を説明するフローチャートである。

　いずれかの運用ディスク装置１４Ａに不良セクタが発生した場合（ステップＳ１０１でＹｅｓ）、ＲＡＩＤコントローラ１０の復元コピー部１３Ａにより、他の運用ディスク装置１４Ａの水平方向における対応するデータを用いて（対応するデータのうち、復元されたデータが予備ディスク装置１４Ｂにコピーされているものがあれば、コピーされたデータも用いて）不良セクタのデータを復元し、復元されたデータを予備ディスク装置１４Ｂにコピーする（ステップＳ１０２）。

　次いで、ＲＡＩＤコントローラ１０の通知部１３Ｂは、ホストＣＰＵ２にいずれかの運用ディスク装置１４Ａに不良セクタが発生したことを通知する（ステップＳ１０３）。その際、不良セクタを特定するため、通知部１３Ｂは、不良セクタが発生した運用ディスク装置１４ＡのディスクＮｏ．および不良セクタのセクタＮｏ．を含む情報を通知する。なお、不良セクタの発生がない場合は（ステップＳ１０１でＮｏ）、上記のような特別な処理は行われない。以上の一連の処理を、不良セクタの発生が検出された時点に行う。

　また、ホストＣＰＵ２から不良セクタへのアクセス要求があった場合（ステップＳ２０１でＹｅｓ）、ＲＡＩＤコントローラ１０の制御回路は、この不良セクタへのアクセスを、その不良セクタのデータが復元されたデータがコピーされた予備ディスク装置１４Ｂのセクタへのアクセスに変換する（ステップＳ２０２）。アクセス要求が不良セクタへのアクセス要求でない場合は（ステップＳ２０１でＮｏ）、運用ディスク装置１４Ａに対する通常のアクセス制御を行う（ステップＳ２０３）。

　なお、不良セクタのデータの復元コピーを開始する前あるいは不良セクタのデータの復元コピーを完了する前に、不良セクタに対する読み出しがあった場合、他の運用ディスク装置１４Ａの水平方向における対応するデータを用いて（対応するデータのうち復元されたデータが予備ディスク装置１４Ｂにコピーされているものがあれば、コピーされたデータも用いて）不良セクタのデータを復元し、復元されたデータを不良セクタのデータとして再生する。

　次に、本実施形態のディスクアレイ装置１の具体的な運用例を説明する。図５～図８は、本実施形態のディスクアレイ装置１における運用例を説明する。なお、以下では、図中のディスクＮｏ．０～ディスクＮｏ．４のディスク装置をそれぞれディスク０～ディスク４と記す。同様に、セクタＮｏ．０～セクタＮｏ．２のセクタをそれぞれセクタ０～セクタ２と記す。

　図１のディスクアレイ装置１において、ＲＡＩＤ５で使用する１台の運用ディスク装置（例えば、ディスク１）に不良セクタが発生した場合、前述のステップＳ１０３にて、例えば不良セクタになったディスク１のセクタ２の水平パリティＰｇｈｉは、ｇ、ｈ、ｉのデータを用いて復元され、復元された水平パリティＰｇｈｉは予備ディスク装置（ここではディスク４）のセクタ０にコピーされる（図６を参照）。またホストＣＰＵ２により、図７の変換テーブル１３Ｄに、データ、元アドレス、移行後のアドレスが書き込まれる。そして、ホストＣＰＵ２から不良セクタへのアクセス要求があった場合には、アクセス変換部１３Ｃにより、図７に例示した変換テーブル１３Ｄに基づき、このアクセスは、不良セクタの対応する予備ディスク装置１４Ｂのセクタへのアクセスに変換される。例えば、上記の不良セクタとなったディスク１のセクタ２の水平パリティＰｇｈｉへのアクセス要求があった場合、復元された水平パリティＰｇｈｉがコピーされているディスク４のセクタ０へのアクセスに変換される。このようにして、ディスクアレイを継続して運用することができる。

　また、このとき、ＲＡＩＤコントローラ１０はホストＣＰＵ２に対して、不良セクタが発生したこと、あるいはディスク装置の故障ないし障害が発生したことを通知する。この通知に応じて、ホストＣＰＵ２は、図示しないディスプレイやスピーカを通じて管理者等のユーザに、不良セクタが発生したこと、あるいはディスク装置の故障ないし障害が発生したことを通知し、該当のディスク装置の交換を促す。これに応じて、ユーザが、該当のディスク装置を新しいディスク装置に交換することとなる。

　また、１台の運用ディスク装置１４Ａそのものが故障した場合、故障した運用ディスク装置１４Ａに記録された内容をすべて再現できる容量が予備ディスク装置１４Ｂにあれば、故障した運用ディスク装置１４Ａの全内容を復元し、復元した全内容を予備ディスク装置１４Ｂにコピーする。コピー完了後、この予備ディスク装置１４Ｂを運用ディスク装置として用いる。そして予備ディスク装置１４Ｂと他の運用ディスク装置１４Ａを用いたＲＡＩＤ５のシステムを再構築する。また、前述のように不良セクタの発生やディスク装置１４Ａの故障に応じて、不良セクタの発生やディスク装置１４Ａの故障がホストＣＰＵ２へ通知され、それらがホストＣＰＵ２によりユーザへ通知される。この通知に応じて故障した運用ディスク装置１４Ａが新しいディスク装置と交換されると、新しいディスク装置を予備ディスク装置１４Ｂとして運用する。その際、運用ディスク装置として使用される元の予備ディスク装置１４Ｂに記録されている、交換されていない他の運用ディスク装置１４Ａの不良セクタのデータが復元されたデータを、図７に例示した変換テーブル１３Ｄの対応関係と対応するように、新しい予備ディスク装置１４Ｂへ移行させる。また、交換された故障したディスク装置１４Ａの不良セクタに関連する、図７に例示した変換テーブル１３Ｄの情報は、交換後の新しい運用ディスク装置１４Ａと対応しないので、それに関する変換テーブル１３Ｄの情報は削除される。なお、上記データの移行の際、不良セクタと、予備ディスク装置１４Ｂの対応セクタとの対応関係をあらためて構築し、この対応関係を示す変換テーブル１３Ｄを作成してもよい。なお、変換テーブル１３Ｄへの書込み、削除は、ホストＣＰＵ１２によって行われる。

　一方、予備ディスク装置１４Ｂに故障した運用ディスク装置１４Ａに記録された内容をすべて復元できる容量がない場合、故障した運用ディスク装置１４Ａの内容を復元し、復元された内容を前述の通知に応じてユーザにより用意された新しいディスク装置へコピーする。コピーの完了後、この新しいディスク装置を新たな運用ディスク装置１４Ａとして他の運用ディスク装置１４ＡとともにＲＡＩＤ５のシステムを再構築する。現行の予備ディスク装置１４Ｂを、そのまま予備ディスク装置１４Ｂとして運用する。このようにして故障した運用ディスク装置１４Ａが新たしいディスク装置１４と交換されると、予備ディスク装置１４Ｂに残っている、交換された故障したディスク装置１４Ａの不良セクタに関連したデータ、及び図７に例示した変換テーブル１３Ｄの対応する情報は、交換後の新たしい運用ディスク装置１４Ａと対応しないので、それらは削除される。

　なお、予備ディスク装置１４Ｂは、ＲＡＩＤ５のディスクアレイとして使用される運用ディスク装置１４Ａよりも故障率が低いものであることが望ましい。

　以上説明したとおり、本実施形態では、２個以上の不良セクタの発生が同時でなければ、先に発生した不良セクタのデータ（例えば、図８：“ｅ”）は復元され、復元されたデータが予備ディスク装置１４Ｂに先にコピーされるので、この予備ディスク装置１４Ｂにコピーされたデータ（例えば、図８：“ｅ”）を利用して、次に発生した不良セクタのデータ（例えば、図８：“ｄ”）を再生、復元、または、コピーすることができる（図８）。すなわち、本実施形態では、同じ水平方向において２個以上不良セクタが発生しても、それが同時でなければ、これらの不良セクタのデータを、再生しおよび復元しコピーすることが可能となる。また、不良セクタが検出され復元コピーがなされる際、ホストＣＰＵ２へ不良セクタの発生を通知し、さらに不具合のある運用ディスク装置１４Ａの交換をユーザへ促す。したがって、本実施形態のディスクアレイ制御装置およびディスクアレイ装置によれば、運用への致命的な影響を抑えることができる。

　以上、本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

　１　ディスクアレイ装置
　２　ホストＣＰＵ
　１０　ＲＡＩＤコントローラ
　１１　分割・多重化回路
　１２　マトリクス回路
　１３　制御回路
　１３Ａ　復元コピー部
　１３Ｂ　通知部
　１３Ｃ　アクセス変換部
　１３Ｄ　変換テーブル
　１４Ａ　ディスク装置（運用）
　１４Ｂ　ディスク装置（予備）

Claims

　ＲＡＩＤ５による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行うディスクアレイ制御装置であって、
　ＲＡＩＤ５で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタのデータを復元し、復元されたデータを前記予備ディスク装置のセクタへコピーする復元コピー部と、
　前記不良セクタに対するアクセス要求があった場合、前記不良セクタに対するアクセスを、前記復元されたデータがコピーされた前記予備ディスク装置の前記セクタへのアクセスに変換するアクセス変換部と、
　を備える、ディスクアレイ制御装置。
　ＲＡＩＤ５で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタの発生をホスト側へ通知する通知部を備える、請求項１に記載のディスクアレイ制御装置。
　さらに、前記不良セクタが発生した運用ディスク装置及び前記不良セクタの情報を含むアドレス情報と、前記予備ディスク装置および前記復元されたデータがコピーされた前記セクタの情報を含むアドレス情報とが書き込まれる変換テーブルを備え、
　前記アクセス変換部は、前記変換テーブルに基づいて前記不良セクタに対するアクセスを、前記予備ディスク装置の前記セクタへのアクセスに変換する、
　請求項１に記載のディスクアレイ制御装置。
　前記アクセス変換部が前記変換テーブルを備える請求項３に記載のディスクアレイ制御装置。
　予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイと、ＲＡＩＤ５による、前記ディスクアレイへのアクセス制御を行うディスクアレイ制御装置と、を備えるディスクアレイ装置であって、
　前記ディスクアレイ制御装置は、ＲＡＩＤ５で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタのデータを復元し、復元されたデータを前記予備ディスク装置のセクタへコピーする復元コピー部と、
　前記不良セクタに対するアクセス要求が発生した場合、前記不良セクタに対するアクセスを、前記復元されたデータがコピーされた前記予備ディスク装置の前記セクタへのアクセスに変換するアクセス変換部と、
　を備える、ディスクアレイ装置。
　ＲＡＩＤ５で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタの発生をホスト側へ通知する通知部を備える、請求項３に記載のディスクアレイ装置。