JP2011129039A - Raidシステム - Google Patents

Raidシステム Download PDF

Info

Publication number
JP2011129039A
JP2011129039A JP2009289203A JP2009289203A JP2011129039A JP 2011129039 A JP2011129039 A JP 2011129039A JP 2009289203 A JP2009289203 A JP 2009289203A JP 2009289203 A JP2009289203 A JP 2009289203A JP 2011129039 A JP2011129039 A JP 2011129039A
Authority
JP
Japan
Prior art keywords
recording medium
data
recording
physical
physical recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009289203A
Other languages
English (en)
Inventor
Takeshi Mio
武史 三尾
Takahiro Hiramatsu
隆宏 平松
Koichi Nakajima
宏一 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2009289203A priority Critical patent/JP2011129039A/ja
Publication of JP2011129039A publication Critical patent/JP2011129039A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】複数の記録媒体の何れかに故障が発生しても、システムの信頼性の低下を回避することができるようにする。
【解決手段】動作状態監視部11により異常が検出されていない正常な物理的記録媒体を使用対象の物理的記録媒体に設定する構成管理部12と、記録対象データ及びパリティデータPを構成管理部12により設定された使用対象の物理的記録媒体に書き込む記録制御部14とを設け、構成管理部12が、使用対象の物理的記録媒体を設定した後、動作状態監視部11により何れかの使用対象の物理的記録媒体の動作状態の異常が検出されると、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外する。
【選択図】図1

Description

この発明は、複数台の物理的記録媒体(例えば、ハードディスク)を組み合わせて、信頼性が高い大容量の仮想的な論理的記録媒体を構成しているRAID(Redundant Arrays of Inexpensive Disks)システムに関するものである。
従来のRAIDシステムに相当するディスクアレイ装置が、以下の特許文献1に開示されている。
このディスクアレイ装置では、RAIDグループを構成するディスクの個数を運用中に増減する際、性能と信頼性を最適に維持する方法を採用している。
このディスクアレイ装置は、以下の(1)〜(5)の要素から構成されている。
(1)複数のハードディスクドライブ装置
(2)ホストとハードディスクドライブ装置間のデータの入出力を制御する入出力制御部
(3)ハードディスクドライブ装置と入出力制御部を接続する複数のパス
(4)ハードディスクドライブ装置を所定数毎に収納している筐体
(5)ディスクアレイ装置の設定などを管理する管理端末装置
操作者は、ディスクアレイ装置の設定や保守管理を行う場合、管理端末装置のディスプレイ上に表示される設定状況などを確認しながら、画面上に表示されたドライブ装置の中からグループを組むドライブの選択を行う。
RAIDグループを構成するディスクの個数を運用中に増減させる場合、既にRAIDグループを構成しているディスクの入出力経路や筐体との重なりが最も少なくなる(入出力経路や筐体の冗長度が高くなる)ように、候補となるディスクや筐体を選択して操作者に提示することで、性能と信頼性を最適化することを可能にしている。
特開2005−234825号公報(請求項12,13)
従来のRAIDシステムは以上のように構成されているので、RAIDグループを構成するディスクの個数を運用中に増減する際には、性能と信頼性を最適に維持することができるが、RAIDグループを構成しているディスクのいずれかが運用中に故障した場合には、システムの信頼性の低下を防ぐ手段が開示されておらず、システムの信頼性の低下を回避することができない課題があった。
この発明は上記のような課題を解決するためになされたもので、複数の記録媒体の何れかに故障が発生しても、システムの信頼性の低下を回避することができるRAIDシステムを得ることを目的とする。
この発明に係るRAIDシステムは、記録手段を構成している複数の記録媒体の動作状態を監視して、動作状態が異常な記録媒体を検出する動作状態監視手段と、記録手段を構成している複数の記録媒体の中で、動作状態監視手段により異常が検出されていない正常な記録媒体を使用対象の記録媒体に設定する使用対象管理手段と、記録対象データ及びパリティデータを使用対象管理手段により設定された使用対象の記録媒体に書き込むデータ書込処理を実施する一方、使用対象の記録媒体から記録対象データを読み込むデータ読込処理を実施するデータ読書手段とを設け、使用対象管理手段が、使用対象の記録媒体を設定した後、動作状態監視手段により何れかの使用対象の記録媒体の動作状態の異常が検出されると、異常が検出された記録媒体を使用対象の記録媒体から除外するようにしたものである。
この発明によれば、記録手段を構成している複数の記録媒体の動作状態を監視して、動作状態が異常な記録媒体を検出する動作状態監視手段と、記録手段を構成している複数の記録媒体の中で、動作状態監視手段により異常が検出されていない正常な記録媒体を使用対象の記録媒体に設定する使用対象管理手段と、記録対象データ及びパリティデータを使用対象管理手段により設定された使用対象の記録媒体に書き込むデータ書込処理を実施する一方、使用対象の記録媒体から記録対象データを読み込むデータ読込処理を実施するデータ読書手段とを設け、使用対象管理手段が、使用対象の記録媒体を設定した後、動作状態監視手段により何れかの使用対象の記録媒体の動作状態の異常が検出されると、異常が検出された記録媒体を使用対象の記録媒体から除外するように構成したので、記録手段を構成している複数の記録媒体の何れかに故障が発生しても、RAIDシステムの信頼性の低下を回避することができる効果がある。
この発明の実施の形態1によるRAIDシステムを示す構成図である。 図1のRAIDシステムにおけるデータ記録部1が6台の物理的記録媒体1−1〜1−6から構成されて運用される場合の動作を示す概念図である。 構成管理部12により管理されている管理テーブルの記録内容の一例を示す説明図である。 動作状態監視部11から物理的記録媒体1−4に故障が発生している旨の通知を受けて、物理的記録媒体1−4の状態が「正常」から「故障」に変更された様子を示す説明図である。 論理的記録媒体L1の状態が「正常」から「構成変更運転」に変更された様子を示す説明図である。 論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されて、記録対象データが物理的記録媒体に書き込まれた様子を示す説明図である。 RAIDタイプが“6”である場合の動作を示す概念図である。 物理的記録媒体1−4の状態が「故障」から「正常」に変更された様子を示す説明図である。 RAIDタイプが“5”である場合における一般的な記録対象データ又はパリティデータPの復元を示す説明図である。 故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換された場合の動作を示す説明図である。 故障が検出された物理的記録媒体1−4を正常な物理的記録媒体に交換する前のストライプSと、故障が検出された物理的記録媒体1−4を正常な物理的記録媒体に交換した後のストライプsとの対応関係を示す説明図である。 RAIDタイプが“6”である場合における一般的な記録対象データ又はパリティデータPの復元を示す説明図である。 故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換された場合の動作を示す説明図である。 故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換された場合の動作を示す説明図である。
実施の形態1.
図1はこの発明の実施の形態1によるRAIDシステムを示す構成図である。
図1において、データ記録部1はN個の物理的記録媒体1−1〜1−Nにより構成されており、制御部2の指示の下、電子的データ(記録対象データ、パリティデータ)の記録を行う。なお、データ記録部1は記録手段を構成している。
データ記録部1内の物理的記録媒体1−1〜1−Nは電子的データを記録する物理的デバイスであり、例えば、HDD(Hard Disk Drive)、磁気テープなどの磁気による記録媒体、SSD(Solid State Drive)と呼ばれる半導体技術を用いた記録媒体などが該当する。
制御部2はデータ記録部1とバス3を介して接続されており、RAIDシステム全体の制御を行う。
バス3はデータ記録部1と制御部2の間で、制御データや記録対象データの送受信を行う伝送路である。
制御部2の動作状態監視部11は物理的記録媒体1−1〜1−Nの動作状態を監視して、動作状態が異常な物理的記録媒体を検出する処理を実施する。なお、動作状態監視部11は動作状態監視手段を構成している。
構成管理部12はデータ記録部1内の物理的記録媒体1−1〜1−Nの中で、動作状態監視部11により異常が検出されていない正常な物理的記録媒体を使用対象の物理的記録媒体に設定する処理を実施する。
ただし、構成管理部12は使用対象の物理的記録媒体を設定した後、動作状態監視部11により何れかの使用対象の物理的記録媒体の動作状態の異常が検出されると、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外する。
なお、構成管理部12は使用対象管理手段を構成している。
パリティ演算部13は記録対象データに対するパリティ演算を実施してパリティデータを生成する処理を実施する。なお、パリティ演算部13はパリティ演算手段を構成している。
記録制御部14は記録対象データ及びパリティ演算部13により生成されたパリティデータを構成管理部12により設定された使用対象の物理的記録媒体に書き込むデータ書込処理を実施する一方、使用対象の物理的記録媒体から記録対象データを読み込むデータ読込処理を実施する。なお、記録制御部14はデータ読書手段を構成している。
図1では、RAIDシステムの構成要素である動作状態監視部11、構成管理部12、パリティ演算部13、記録制御部14のそれぞれが専用のハードウェア(例えば、CPUを搭載している半導体集積回路、あるいは、ワンチップマイコン)で構成されているものを想定しているが、RAIDシステムがコンピュータで構成される場合、動作状態監視部11、構成管理部12、パリティ演算部13、記録制御部14の処理内容を記述しているプログラムをコンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図2は図1のRAIDシステムにおけるデータ記録部1が6台の物理的記録媒体1−1〜1−6から構成されて運用される場合の動作を示す概念図である。
図2では、RAIDタイプが“5”(記録対象データを記録する5台の物理的記録媒体と、パリティデータを記録する1台の物理的記録媒体とから、1台の論理的記録媒体を構成している)である例を示している。以下、RAIDタイプが“5”の構成を「5D+1P」と称する。
図2において、DLINEは物理的記録媒体1−1〜1−6に書き込みを行う記録対象データのデータ列である。
図3は構成管理部12により管理されている管理テーブルの記録内容の一例を示す説明図である。
図3の例では、データ記録部1における1以上の論理的記録媒体の識別番号、状態(例えば、正常、構成変更運転など)、RAIDタイプ(例えば、“5”)、ブロックサイズ(例えば、64kbyte、128kbyte)を示している。
また、各論理的記録媒体に含まれている物理的記録媒体の識別番号及び状態(例えば、正常、故障)を示している。
なお、図3における論理的記録媒体L1は、図2に記載されている「5D+1P」の構成の論理的記録媒体に対応している。
次に動作について説明する。
最初に、図1、図2及び図3を参照しながら、正常時のRAIDシステムの動作を説明する。
ただし、この実施の形態1では、説明の便宜上、データ記録部1を構成している物理的記録媒体の台数が6台である例を説明する。
制御部2の記録制御部14は、外部から記録対象データのデータ列DLINEを入力、あるいは、内部で記録対象データのデータ列DLINEを生成すると、構成管理部12により管理されている図3の管理テーブル内の“ブロックサイズ”を参照して、その記録対象データのデータ列DLINEを固定のサイズ(図3の例では、ブロックサイズ=64kbyte)に分割する。
即ち、記録制御部14は、記録対象データのデータ列DLINEを複数のブロック(D11,D12,D13,D14,D15,D21,D22,D23,D24,D25,D31,D32,・・・)に分割する。
制御部2のパリティ演算部13は、記録制御部14が記録対象データのデータ列DLINEを固定のサイズに分割すると、記録制御部14の指示の下、記録対象データを記録する物理的記録媒体と同数(図2の例では、記録対象データを記録する物理的記録媒体の台数は5台)の記録対象データ(図2の例では、5個のブロック)を一単位として、パリティ演算を実施する。
具体的には、例えば、記録対象データD11,D12,D13,D14,D15からなる5個のブロックに対するパリティ演算を実施することで、記録対象データD11等と同サイズ(64kbyte)のパリティデータP1を生成する。
また、記録対象データD21,D22,D23,D24,D25からなる5個のブロックに対するパリティ演算を実施することで、記録対象データD21等と同サイズ(64kbyte)のパリティデータP2を生成し、記録対象データD31,D32,D33,D34,D35からなる5個のブロックデータ列に対するパリティ演算を実施することで、記録対象データD31等と同サイズ(64kbyte)のパリティデータP3を生成する。
ただし、パリティ演算の演算方法自体は公知の技術であるため、ここでは詳細な説明を省略する。
制御部2の記録制御部14は、パリティ演算部13がパリティデータP1,P2,P3,P4,・・・を生成すると、5個のブロックとパリティデータPを合わせてストライプSを生成する。
即ち、記録制御部14は、下記に示すようなストライプS1〜S7を生成する。
ストライプS1=D11,D12,D13,D14,D15,P1
ストライプS2=D21,D22,D23,D24,D25,P2
ストライプS3=D31,D32,D33,D34,D35,P3
ストライプS4=D41,D42,D43,D44,D45,P4

記録制御部14は、ストライプS1〜S7を生成すると、物理的記録媒体1−1〜1−6に対するストライプS1〜S7の書き込みを行う。
ただし、記録制御部14は、同一の物理的記録媒体に対するパリティデータPの書き込み集中を回避して、負荷集中による一つの物理的記録媒体の性能低下等を回避するため、各ストライプSにおけるパリティデータPを書き込む物理的記録媒体をずらしながら、物理的記録媒体1−1〜1−6に対するストライプS1〜S7の書き込みを行う。
具体的には、記録制御部14は、下記に示す順序で、ストライプS1〜S7の書き込みを行うことで、同一の物理的記録媒体に対するパリティデータPの書き込み集中を回避する(図2を参照)。
ストライプS1 D11→D12→D13→D14→D15→P1
ストライプS2 D21→D22→D23→D24→P2 →D25
ストライプS3 D31→D32→D33→P3 →D34→D35
ストライプS4 D41→D42→P4 →D43→D44→D45

なお、1つのストライプS毎に、1つのパリティデータPを生成して、いずれかの物理的記録媒体にパリティデータPを書き込んでいるので、論理的記録媒体を構成している複数台の物理的記録媒体のうち、1台の物理的記録媒体が故障しても、故障していない正常な物理的記録媒体に書き込まれていた記録対象データ及びパリティデータPから、故障した物理的記録媒体に書き込まれていた記録対象データ又はパリティデータPの復元が可能である。
次に、論理的記録媒体L1を構成している6台の物理的記録媒体1−1〜1−6のうち、1台の物理的記録媒体が故障した場合の動作について説明する。ここでは、物理的記録媒体1−4が故障している例を説明する。
制御部2の動作状態監視部11は、常時、物理的記録媒体1−1〜1−6の動作状態を監視しており、動作状態が異常な物理的記録媒体(故障している物理的記録媒体)を検出する。
例えば、動作状態監視部11は、制御コマンドを物理的記録媒体1−1〜1−6に送信し、その制御コマンドの送信後、所定時間を経過しても、応答信号を返送してこない物理的記録媒体があれば、当該物理的記録媒体の動作状態が異常であると認定する。
あるいは、物理的記録媒体1−1〜1−6から送信される内部状態通知(例えば、故障の有無を示す状態通知信号)を参照して、当該物理的記録媒体の動作状態が異常であるか否かを判別する。
動作状態監視部11は、例えば、物理的記録媒体1−4の動作状態が異常であることを検出すると、物理的記録媒体1−4に故障が発生している旨を構成管理部12及び記録制御部14に通知する。
制御部2の構成管理部12は、動作状態監視部11から物理的記録媒体1−4に故障が発生している旨の通知を受けると、図4に示すように、物理的記録媒体1−4の状態を「正常」から「故障」に変更することで、異常が検出されていない正常な物理的記録媒体が、物理的記録媒体1−4以外の物理的記録媒体であることを記録制御部14が認識できるようにする。
また、図5に示すように、論理的記録媒体L1の状態を「正常」から「構成変更運転」に変更して、論理的記録媒体L1の構成を「5D+1P」から「4D+1P」に変更する。
これにより、動作状態の異常が検出された物理的記録媒体1−4が使用対象の物理的記録媒体から除外され、異常が検出されていない正常な物理的記録媒体(物理的記録媒体1−4以外の物理的記録媒体)が使用対象の物理的記録媒体に設定されたことになる。
制御部2の記録制御部14は、動作状態監視部11から物理的記録媒体1−4に故障が発生している旨の通知を受けると、論理的記録媒体L1における物理的記録媒体1−4に故障が発生している旨をユーザに通知する。
ただし、ユーザに対する通知方法は特に問うものではなく、いかなる方法で通知してもよい。
ここでは、動作状態監視部11から物理的記録媒体1−4に故障が発生している旨の通知を受けると、構成管理部12が、使用対象の物理的記録媒体を変更して、論理的記録媒体L1の状態を「構成変更運転」に変更しているが、使用対象の物理的記録媒体を変更せずに(使用対象の物理的記録媒体を、故障が発生している物理的記録媒体1−4を含む物理的記録媒体1−1〜1−6のままとする)、論理的記録媒体L1の状態を「縮退運転」に変更するようにしても、パリティ演算部13が、故障していない正常な物理的記録媒体(物理的記録媒体1−4以外の物理的記録媒体)に書き込まれていた記録対象データ及びパリティデータPから、故障が発生している物理的記録媒体1−4に書き込まれていた記録対象データD14,D24,D43,D53・・・及びパリティデータP3を復元することが可能である。
しかし、論理的記録媒体L1の状態を「縮退運転」に変更すると、物理的記録媒体1−1〜1−6の冗長性がなくなり、更にもう1台の物理的記録媒体に故障が発生すると、先に故障が発生している物理的記録媒体1−4に書き込まれていた記録対象データD14,D24,D43,D53・・・及びパリティデータP3の復元が不可能になる。
また、物理的記録媒体1−4以外の物理的記録媒体(新たに故障が発生している物理的記録媒体を除く4台の物理的記録媒体)に書き込まれているデータの正常性の確認も不可能になる。
したがって、長時間、論理的記録媒体L1の状態を「縮退運転」にしておくことは望ましくないので、構成管理部12は、上記のように、論理的記録媒体L1の状態を「縮退運転」ではなく、「構成変更運転」に変更している。
記録制御部14は、構成管理部12により管理されている管理テーブル内の論理的記録媒体L1の状態が「正常」から「構成変更運転」に変更されると(図5を参照)、論理的記録媒体L1を構成している物理的記録媒体1−1〜1−6の状態を参照して、使用対象の物理的記録媒体を認識する。
即ち、記録制御部14は、物理的記録媒体1−1〜1−6の中で、故障が発生している物理的記録媒体1−4以外の物理的記録媒体が使用対象の物理的記録媒体であると認識する。
記録制御部14は、物理的記録媒体1−4以外の物理的記録媒体が使用対象の物理的記録媒体を認識すると、物理的記録媒体1−4の故障が検出された以降のストライプSについては、物理的記録媒体1−4以外の物理的記録媒体に書き込みを行う。
例えば、ストライプS3の書き込み時に物理的記録媒体1−4の故障が検出された場合には、図6に示すように、記録対象データD34,D35を物理的記録媒体1−5,1−6に書き込んだ後、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されるので、以降、物理的記録媒体1−1,1−2,1−3,1−5,1−6に対して、記録対象データD41,D42,パリティデータP4,記録対象データD43,D44の書き込みを行う。
次に、物理的記録媒体1−1,1−2,1−3,1−5,1−6に対して、記録対象データD51,パリティデータP5,記録対象データD52,D53,D54の書き込みを行う。
ただし、記録対象データD51は、本来のストライプS5における記録対象データD51ではなく(図2における記録対象データD51と異なる)、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、ストライプS4に含まれなくなった図2の記録対象データD45に相当するデータである。
また、記録対象データD52,D53,D54は、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、書き込む物理的記録媒体がずれた図2における記録対象データD51,D52,D53に相当するデータである。
以降、同様にして、ストライプS6,S7を物理的記録媒体1−4以外の物理的記録媒体に書き込みを行う。
以上で明らかなように、この実施の形態1によれば、論理的記録媒体L1を構成している物理的記録媒体1−1〜1−6の動作状態を監視して、動作状態が異常な物理的記録媒体を検出する動作状態監視部11と、物理的記録媒体1−1〜1−6の中で、動作状態監視部11により異常が検出されていない正常な物理的記録媒体を使用対象の物理的記録媒体に設定する構成管理部12と、記録対象データ及びパリティデータPを構成管理部12により設定された使用対象の物理的記録媒体に書き込むデータ書込処理を実施する一方、使用対象の物理的記録媒体から記録対象データを読み込むデータ読込処理を実施する記録制御部14とを設け、構成管理部12が、使用対象の物理的記録媒体を設定した後、動作状態監視部11により何れかの使用対象の物理的記録媒体の動作状態の異常が検出されると、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外するように構成したので、物理的記録媒体1−1〜1−6の何れかに故障が発生しても、RAIDシステムの信頼性の低下を回避することができる効果を奏する。
即ち、この実施の形態1によれば、動作状態監視部11により動作状態が異常な物理的記録媒体が検出されると、信頼性の低いデグレードモードである「縮退運転」を実施するのではなく、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外するようにしているので、同じ冗長度(同じRAIDタイプ)を持ちながら、論理的記録媒体L1を再構成することができるようになり、その結果、物理的記録媒体に故障が発生した後の記録対象データに対する信頼性の低下を防ぐことができる。
なお、この実施の形態1では、RAIDタイプが“5”である運用例を示したが、図7に示すように、RAIDタイプが“6”(記録対象データを記録する4台の物理的記録媒体と、パリティデータを記録する2台の物理的記録媒体とから、1台の論理的記録媒体を構成している)で運用されてもよい。以下、RAIDタイプが“6”の構成を「4D+2P」と称する。
RAIDタイプが“6”の場合、1つのストライプS毎に、2種のパリティデータP,Qを生成して、2種のパリティデータP,Qを異なる物理的記録媒体に書き込んでいるので、論理的記録媒体を構成している複数台の物理的記録媒体のうち、2台の物理的記録媒体が故障しても、故障していない正常な物理的記録媒体に書き込まれていた記録対象データ及びパリティデータP,Qから、故障した物理的記録媒体に書き込まれていた記録対象データ又はパリティデータP,Qの復元が可能である。
したがって、RAIDタイプが“6”の場合、RAIDタイプが“5”の場合よりも、更に信頼性を高めることができる。
なお、RAIDタイプが“6”の場合は、1つの物理的記録媒体に故障が発生すると、RAIDタイプが“5”の場合と同様に、論理的記録媒体L1の状態を「正常」から「構成変更運転」に変更し、論理的記録媒体L1の構成を「4D+2P」から「3D+2P」に変更する。
実施の形態2.
上記実施の形態1では、構成管理部12が、使用対象の物理的記録媒体を設定した後、動作状態監視部11により何れかの使用対象の物理的記録媒体の動作状態の異常が検出されると、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外するものについて示したが、動作状態監視部11により故障が検出された物理的記録媒体が正常な物理的記録媒体に交換された場合、構成管理部12が、交換された正常な物理的記録媒体を使用対象の物理的記録媒体に含めるように変更してもよい。
具体的には、以下の通りである。
構成管理部12は、使用対象の物理的記録媒体を設定した後、動作状態監視部11により、何れかの使用対象の物理的記録媒体の動作状態の異常が検出されると、上記実施の形態1と同様に、異常が検出された物理的記録媒体を使用対象の物理的記録媒体から除外する。
ここでは、説明の便宜上、物理的記録媒体1−4の故障が検出されて、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されて、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されているものとする。
動作状態監視部11は、常時、物理的記録媒体1−1〜1−6の動作状態を監視しており、動作状態が異常な物理的記録媒体(故障している物理的記録媒体)を検出する。
また、動作状態監視部11は、先に故障を検出している物理的記録媒体1−4が正常な物理的記録媒体に交換されたか否かを監視する。
例えば、動作状態監視部11は、制御コマンドを先に故障を検出している物理的記録媒体1−4に送信し、物理的記録媒体1−4から当該制御コマンドに対する応答信号があれば、正常な物理的記録媒体に交換されたものと認識する。
あるいは、正常な物理的記録媒体の実装有無を伝える電気信号レベルの変化を監視して、物理的記録媒体1−4が正常な物理的記録媒体に交換されたか否かを判別する。
動作状態監視部11は、物理的記録媒体1−4が正常な物理的記録媒体に交換されたことを検出すると、その旨を構成管理部12及び記録制御部14に通知する。
構成管理部12は、動作状態監視部11から物理的記録媒体1−4が正常な物理的記録媒体に交換された旨の通知を受けると、図8に示すように、物理的記録媒体1−4の状態を「正常」に変更する。
これにより、正常な物理的記録媒体に交換された物理的記録媒体1−4が使用対象の物理的記録媒体に含められたことになる。
ここでは、説明の便宜上、ストライプS3の書き込み時に物理的記録媒体1−4の故障が検出されて、ストライプS7の書き込み時に物理的記録媒体1−4が正常な物理的記録媒体に交換されたものとする。
図8の管理テーブルには、構成管理部12が、ストライプS3の書き込み時に物理的記録媒体1−4の故障が検出されて、ストライプS7の書き込み時に物理的記録媒体1−4が正常な物理的記録媒体に交換された旨が記録されている。
パリティ演算部13は、動作状態監視部11が正常な物理的記録媒体に交換された物理的記録媒体1−4を使用対象の物理的記録媒体に含めると、記録制御部14の指示の下、正常な物理的記録媒体(物理的記録媒体1−4以外の物理的記録媒体)に書き込んでいた記録対象データ及びパリティデータPを参照して、故障前に物理的記録媒体1−4に書き込んでいた記録対象データ又はパリティデータPを復元する。
ここで、図9はRAIDタイプが“5”である場合における一般的な記録対象データ又はパリティデータPの復元を示す説明図である。
例えば、記録対象データD14の復元を行う場合、記録対象データD11,D12,D13,D15とパリティデータP1を用いたパリティ演算を実施することで、記録対象データD14を算出する。
また、パリティデータP3の復元を行う場合、記録対象データD31,D32,D33,D34,D35を用いたパリティ演算を実施することで、パリティデータP3を算出する。
図10は故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換された場合の動作を示す説明図である。
特に、(a)は物理的記録媒体1−4の故障が検出されて、物理的記録媒体1−4以外の物理的記録媒体に記録対象データ及びパリティデータPが書き込まれている様子を示している。
(b)は論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたデータを読み出し、交換された物理的記録媒体を含む使用対象の物理的記録媒体1−1〜1−6に対して、上記データを再度書き込む再構成処理(以下、「リビルド動作」と称する)を実施している様子を示している。
図11は故障が検出された物理的記録媒体1−4を正常な物理的記録媒体に交換する前のストライプSと、故障が検出された物理的記録媒体1−4を正常な物理的記録媒体に交換した後のストライプsとの対応関係を示す説明図である。
記録制御部14は、パリティ演算部13が故障前に物理的記録媒体1−4に書き込んでいた記録対象データD14,D24とパリティデータP3を復元すると、その記録対象データD14,D24をd14,d24、そのパリティデータP3をp3として、その記録対象データd14,d24とパリティデータp3を交換された正常な物理的記録媒体1−4に書き込む処理を行う。
この場合、ストライプS1(D11,D12,D13,D14,D15,P1)とストライプs1(d11,d12,d13,d14,d15,p1)は同じデータである。
即ち、ストライプs1における記録対象データd11,d12,d13,d15及びパリティデータp1は、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたデータであって、ストライプS1における記録対象データD11,D12,D13,D15及びパリティデータP1と同じデータである。
また、ストライプs1における記録対象データd14は、パリティ演算部13により復元された記録対象データであって、ストライプS1における記録対象データD14と同じデータである。
また、ストライプS2(D21,D22,D23,D24,P2,D25)とストライプs2(d21,d22,d23,d24,p2,d25)は同じデータである。
即ち、ストライプs2における記録対象データd21,d22,d23,d25及びパリティデータp2は、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたデータであって、ストライプS2における記録対象データD21,D22,D23,D25及びパリティデータP2と同じデータである。
また、ストライプs2における記録対象データd24は、パリティ演算部13により復元された記録対象データであって、ストライプS2における記録対象データD24と同じデータである。
また、ストライプS3(D31,D32,D33,P3,D34,D35)とストライプs3(d31,d32,d33,p3,d34,d35)は同じデータである。
即ち、ストライプs3における記録対象データd31,d32,d33,d34,d35は、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたデータであって、ストライプS3における記録対象データD31,D32,D33,D34,D35と同じデータである。
また、ストライプs3におけるパリティデータp3は、パリティ演算部13により復元されたパリティデータであって、ストライプS3におけるパリティデータP3と同じデータである。
次に、記録制御部14は、論理的記録媒体L1の構成を実際に「4D+1P」から「5D+1P」に戻すため、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたストライプSを読み出し、再度、そのストライプSを物理的記録媒体1−1〜1−6に書き込むリビルド動作を実施する。
即ち、記録制御部14は、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、物理的記録媒体1−4以外の物理的記録媒体に書き込まれていたストライプS4における記録対象データD41,D42,D44,D45を読み出すとともに、物理的記録媒体1−1に書き込まれていたストライプS5における記録対象データD51(記録対象データD51は、本来のストライプS5における記録対象データD51ではなく(図2における記録対象データD51と異なる)、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更されたことで、ストライプS4に含まれなくなった図2の記録対象データD45に相当するデータである)を読み出す処理を実施する。
記録制御部14は、記録対象データD41,D42,D44,D45,D51を読み出すと、その記録対象データD41,D42,D44,D45,D51を一単位としてパリティ演算を実施して、パリティデータp4を生成する。
記録制御部14は、パリティデータp4を生成すると、記録対象データD41,D42,パリティデータp4,記録対象データD44,D45,D51をストライプs4における記録対象データd41,d42,パリティデータp4,d43,d44,d45として、再度、物理的記録媒体1−1〜1−6に書き込むリビルド動作を実施する。
以下、記録制御部14は、ストライプs5,s6,s7・・・に対して、同様のリビルド動作を実施する(図10(b)を参照)。
以上で明らかなように、この実施の形態2によれば、動作状態監視部11により異常が検出された物理的記録媒体が正常な物理的記録媒体に交換された場合、正常な物理的記録媒体を使用対象の物理的記録媒体に含めるように構成したので、論理的記録媒体L1の構成を元に戻して、物理的記録媒体1−1〜1−6の利用効率を高めることができる効果を奏する。
また、この実施の形態2によれば、パリティ演算部13が、動作状態監視部11により異常が検出されていない正常な物理的記録媒体に書き込んでいたデータを参照して、動作状態監視部11により異常が検出された物理的記録媒体に書き込んでいた記録対象データ又はパリティデータを復元し、記録制御部14が、パリティ演算部13により復元された記録対象データ又はパリティデータを交換された正常な物理的記録媒体に書き込むように構成したので、記録対象データの信頼性を高めることができる効果を奏する。
また、この実施の形態2によれば、動作状態監視部11により異常が検出された物理的記録媒体が使用対象の物理的記録媒体から除外された後、記録制御部14が、使用対象の物理的記録媒体に書き込んでいた記録対象データを読み出し、交換された物理的記録媒体を含む使用対象の物理的記録媒体に対して、その記録対象データを再度書き込む再構成処理を実施するように構成したので、動作状態監視部11により異常が検出された物理的記録媒体が使用対象の物理的記録媒体から除外されてから、その物理的記録媒体が正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における物理的記録媒体1−1〜1−6の利用効率を高めることができる効果を奏する。
この実施の形態2では、RAIDタイプが“5”である運用例を示したが、RAIDタイプが“6”であっても、記録対象データを記録する論理的記録媒体が4台になり、パリティデータを記録する論理的記録媒体が2台になる点を除いて、RAIDタイプが“5”である場合と同様に、異常が検出された物理的記録媒体に書き込んでいた記録対象データ又はパリティデータの復元処理や、リビルド動作を適用することができる。
ここで、図12はRAIDタイプが“6”である場合における一般的な記録対象データ又はパリティデータPの復元を示す説明図である。
例えば、記録対象データD14の復元を行う場合、記録対象データD11,D12,D13とパリティデータP1,Q1を用いたパリティ演算を実施することで、記録対象データD14を算出する。
また、パリティデータQ3の復元を行う場合、記録対象データD31,D32,D33,D34とパリティデータP3を用いたパリティ演算を実施することで、パリティデータQ3を算出する。
実施の形態3.
上記実施の形態2では、故障が検出された物理的記録媒体1−4が使用対象の物理的記録媒体から除外されて、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更された後、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されると、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を「4D+1P」から「5D+1P」に戻しているものを示したが、図13に示すように、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を変更せずに、「4D+1P」を維持するようにしてもよい。
即ち、ストライプS1,S2,S3については、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されると、上記実施の形態2と同様に、故障が検出された物理的記録媒体1−4に書き込まれていた記録対象データD14,D24とパリティデータP3を復元して、その記録対象データD14,D24とパリティデータP3を交換された正常な物理的記録媒体1−4に書き込む通常のリビルド動作を行う。
ストライプS4,S5,S6,S7については、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されても、特に何もせず、論理的記録媒体L1の構成を「4D+1P」のままとする。
ストライプS8,S9については、既に、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されているので、論理的記録媒体L1の構成を「4D+1P」から「5D+1P」に戻して、記録対象データD81,D82,D83,D84,D85からパリティデータP8を生成するとともに、記録対象データD91,D92,D93,D94,D95からパリティデータP9を生成する。
そして、ストライプS8については、記録対象データD81,D82,D83,D84,パリティデータP8,記録対象データD85の順番で物理的記録媒体1−1〜1−6に書き込みを行う。
ストライプS9については、記録対象データD91,D92,D93,パリティデータP9,記録対象データD94,D95の順番で物理的記録媒体1−1〜1−6に書き込みを行う。
以上で明らかなように、この実施の形態3によれば、上記実施の形態2と同様に、動作状態監視部11により異常が検出された物理的記録媒体が正常な物理的記録媒体に交換された場合、正常な物理的記録媒体を使用対象の物理的記録媒体に含めるように構成したので、論理的記録媒体L1の構成を元に戻して、物理的記録媒体1−1〜1−6の利用効率を高めることができる効果を奏する。
この実施の形態3によれば、上記実施の形態2と異なり、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を変更せずに、「4D+1P」を維持するようにしているので、この期間における物理的記録媒体1−1〜1−6の利用効率が、上記実施の形態2よりも低下するが、上記実施の形態2と同様に、パリティ演算部13が、動作状態監視部11により異常が検出されていない正常な物理的記録媒体に書き込んでいたデータを参照して、動作状態監視部11により異常が検出された物理的記録媒体に書き込んでいた記録対象データ又はパリティデータを復元し、記録制御部14が、パリティ演算部13により復元された記録対象データ又はパリティデータを交換された正常な物理的記録媒体に書き込むようにしているので、記録対象データの信頼性を高めることができる。
この実施の形態3では、RAIDタイプが“5”である運用例を示したが、RAIDタイプが“6”であっても、記録対象データを記録する論理的記録媒体が4台になり、パリティデータを記録する論理的記録媒体が2台になる点を除いて、RAIDタイプが“5”である場合と同様に、異常が検出された物理的記録媒体に書き込んでいた記録対象データ又はパリティデータの復元処理や、リビルド動作を適用することができる。
実施の形態4.
上記実施の形態2では、故障が検出された物理的記録媒体1−4が使用対象の物理的記録媒体から除外されて、論理的記録媒体L1の構成が「5D+1P」から「4D+1P」に変更された後、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されると、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を「4D+1P」から「5D+1P」に戻しているものを示したが、図14に示すように、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を変更せずに、「4D+1P」を維持するようにしてもよい。
また、上記実施の形態2では、故障が検出された物理的記録媒体1−4に書き込まれていた記録対象データD14,D24とパリティデータP3を復元して、その記録対象データD14,D24とパリティデータP3を交換された正常な物理的記録媒体1−4に書き込む通常のリビルド動作を行うものについて示したが、故障が検出された物理的記録媒体1−4に書き込まれていた記録対象データD14,D24とパリティデータP3を復元せず、その記録対象データD14,D24とパリティデータP3を交換された正常な物理的記録媒体1−4に書き込む通常のリビルド動作を行わないようにしてもよい。
即ち、ストライプS1,S2,S3については、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されても、特に何もしないようにする。
ストライプS4,S5,S6,S7については、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されても、特に何もせず、論理的記録媒体L1の構成を「4D+1P」のままとする。
ストライプS8,S9については、既に、故障が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換されているので、論理的記録媒体L1の構成を「4D+1P」から「5D+1P」に戻して、記録対象データD81,D82,D83,D84,D85からパリティデータP8を生成するとともに、記録対象データD91,D92,D93,D94,D95からパリティデータP9を生成する。
そして、ストライプS8については、記録対象データD81,D82,D83,D84,パリティデータP8,記録対象データD85の順番で物理的記録媒体1−1〜1−6に書き込みを行う。
ストライプS9については、記録対象データD91,D92,D93,パリティデータP9,記録対象データD94,D95の順番で物理的記録媒体1−1〜1−6に書き込みを行う。
以上で明らかなように、この実施の形態4によれば、上記実施の形態2と異なり、物理的記録媒体1−4が使用対象の物理的記録媒体から除外されてから、正常な物理的記録媒体に交換されるまでの期間(ストライプS4〜S7の期間)における論理的記録媒体L1の構成を変更せずに、「4D+1P」を維持するようにしているので、この期間における物理的記録媒体1−1〜1−6の利用効率が、上記実施の形態2よりも低下する。
また、故障が検出された物理的記録媒体1−4に書き込まれていた記録対象データD14,D24とパリティデータP3を復元せず、その記録対象データD14,D24とパリティデータP3を交換された正常な物理的記録媒体1−4に書き込む通常のリビルド動作を行わないので、ストライプS1〜S3の期間における記録対象データの信頼性が、上記実施の形態2よりも低下する。
しかし、上記実施の形態2と同様に、動作状態監視部11により異常が検出された物理的記録媒体1−4が正常な物理的記録媒体に交換された場合、正常な物理的記録媒体を使用対象の物理的記録媒体に含めるようにしているので、ストライプS8以降では、論理的記録媒体L1の構成を元に戻して、物理的記録媒体1−1〜1−6の利用効率を高めることができる。
この実施の形態4では、RAIDタイプが“5”である運用例を示したが、RAIDタイプが“6”であっても、記録対象データを記録する論理的記録媒体が4台になり、パリティデータを記録する論理的記録媒体が2台になる点を除いて、RAIDタイプが“5”である場合と同様に処理することができる。
1 データ記録部(記録手段)、2 制御部、3 バス、11 動作状態監視部(動作状態監視手段)、12 構成管理部(使用対象管理手段)、13 パリティ演算部(パリティ演算手段)、14 記録制御部(データ読書手段)。

Claims (5)

  1. 複数の記録媒体により構成されている記録手段と、上記記録手段を構成している複数の記録媒体の動作状態を監視して、動作状態が異常な記録媒体を検出する動作状態監視手段と、上記記録手段を構成している複数の記録媒体の中で、上記動作状態監視手段により異常が検出されていない正常な記録媒体を使用対象の記録媒体に設定する使用対象管理手段と、記録対象データに対するパリティ演算を実施してパリティデータを生成するパリティ演算手段と、上記記録対象データ及び上記パリティ演算手段により生成されたパリティデータを上記使用対象管理手段により設定された使用対象の記録媒体に書き込むデータ書込処理を実施する一方、使用対象の記録媒体から記録対象データを読み込むデータ読込処理を実施するデータ読書手段とを備え、上記使用対象管理手段は、使用対象の記録媒体を設定した後、上記動作状態監視手段により何れかの使用対象の記録媒体の動作状態の異常が検出されると、異常が検出された記録媒体を使用対象の記録媒体から除外することを特徴とするRAIDシステム。
  2. 使用対象管理手段は、動作状態監視手段により異常が検出された記録媒体が正常な記録媒体に交換された場合、上記記録媒体を使用対象の記録媒体に含めることを特徴とする請求項1記載のRAIDシステム。
  3. パリティ演算手段は、動作状態監視手段により異常が検出されていない正常な記録媒体に書き込んでいたデータを参照して、上記動作状態監視手段により異常が検出された記録媒体に書き込んでいた記録対象データ又はパリティデータを復元し、
    データ読書手段は、上記パリティ演算手段により復元された記録対象データ又はパリティデータを交換された正常な記録媒体に書き込むことを特徴とする請求項2記載のRAIDシステム。
  4. データ読書手段は、動作状態監視手段により異常が検出された記録媒体が使用対象の記録媒体から除外された後、使用対象の記録媒体に書き込んでいた記録対象データを読み出し、交換された記録媒体を含む使用対象の記録媒体に対して、上記記録対象データを再度書き込む再構成処理を実施することを特徴とする請求項2または請求項3記載のRAIDシステム。
  5. 使用対象管理手段は、記録手段を構成している複数の記録媒体の動作状態を記録している管理テーブルを備え、
    データ読書手段は、上記管理テーブルにより記録されている動作状態を参照して、使用対象の記録媒体を認識することを特徴とする請求項1から請求項4のうちのいずれか1項記載のRAIDシステム。
JP2009289203A 2009-12-21 2009-12-21 Raidシステム Pending JP2011129039A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009289203A JP2011129039A (ja) 2009-12-21 2009-12-21 Raidシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009289203A JP2011129039A (ja) 2009-12-21 2009-12-21 Raidシステム

Publications (1)

Publication Number Publication Date
JP2011129039A true JP2011129039A (ja) 2011-06-30

Family

ID=44291539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009289203A Pending JP2011129039A (ja) 2009-12-21 2009-12-21 Raidシステム

Country Status (1)

Country Link
JP (1) JP2011129039A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140058444A (ko) 2011-09-07 2014-05-14 오레가 인크. 파일 관리 시스템 및 파일 관리 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140058444A (ko) 2011-09-07 2014-05-14 오레가 인크. 파일 관리 시스템 및 파일 관리 방법

Similar Documents

Publication Publication Date Title
JP5220185B2 (ja) 故障したデータ記憶機構を検出し、置き換えるための装置、システム及び方法
US9104321B2 (en) Redundant array of independent disks (RAID) system backup management
US7549084B2 (en) Storage control apparatus and failure recovery method for storage control apparatus
JP5768587B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US6892276B2 (en) Increased data availability in raid arrays using smart drives
US9081697B2 (en) Storage control apparatus and storage control method
JP2005122338A (ja) スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法
US9104604B2 (en) Preventing unrecoverable errors during a disk regeneration in a disk array
JPWO2006123416A1 (ja) ディスク故障復旧方法及びディスクアレイ装置
JPH07129331A (ja) ディスクアレイ装置
US8438429B2 (en) Storage control apparatus and storage control method
US20070101188A1 (en) Method for establishing stable storage mechanism
JP2006236001A (ja) ディスクアレイ装置
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
JP2006079418A (ja) 記憶制御装置、制御方法及びプログラム
JP2006268673A (ja) 記憶制御装置及び記憶デバイスのエラー制御方法
JP2005174178A (ja) ディスクアレイ装置及びディスクアレイ装置の保守方法
US7457990B2 (en) Information processing apparatus and information processing recovery method
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
US11074118B2 (en) Reporting incidents of data loss in RAID arrays
JP2010267037A (ja) ディスクアレイ装置
JP2011129039A (ja) Raidシステム
JP2008197886A (ja) ストレージ装置及びその制御方法
JP4605374B2 (ja) 記憶装置の試験方法及び装置