JP4609034B2 - ディスクアレイ装置 - Google Patents

ディスクアレイ装置 Download PDF

Info

Publication number
JP4609034B2
JP4609034B2 JP2004309218A JP2004309218A JP4609034B2 JP 4609034 B2 JP4609034 B2 JP 4609034B2 JP 2004309218 A JP2004309218 A JP 2004309218A JP 2004309218 A JP2004309218 A JP 2004309218A JP 4609034 B2 JP4609034 B2 JP 4609034B2
Authority
JP
Japan
Prior art keywords
read
hard disk
data
disk
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004309218A
Other languages
English (en)
Other versions
JP2006120042A (ja
Inventor
隆一 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2004309218A priority Critical patent/JP4609034B2/ja
Publication of JP2006120042A publication Critical patent/JP2006120042A/ja
Application granted granted Critical
Publication of JP4609034B2 publication Critical patent/JP4609034B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明はディスクアレイに関し、特にRAID1のディスクアレイの復旧制御に関する。
ディスクアレイ装置は、複数のハードディスクを並列接続してそれら全体を1つのディスク装置として動作させることで、データ読み書きの高速化、又は耐障害性の向上、あるいはその両方を実現する。このようなディスクアレイの装置の制御レベルとして、RAID(redundant array of independent disks)0〜5やそれらの組み合わせが知られている。
このなかで、RAID1は、ハードディスクを2台利用して、双方のディスクに同一のデータを記録することにより、データ記録機構を利用する上位システムに対してハードディスクの信頼性よりも遥かに高いデータ記録機構を提供するものである。1つのハードディスクの故障率をλとすると、RAID1の故障率は双方のハードディスクが同時に故障する確率となるから2λである。いずれかのハードディスクが故障する確率は2λであり、一方が故障したときに残りが故障する確率がλであり、双方が同時に故障する確率はそれらの積となるからである。たとえば、λが1%(0.01)の場合には、RAID1の故障率は0.02%となる。
しかし、RAID1がこの信頼性を得るためには、2台が正常動作する冗長化状態を常に維持することが必要である。これに対し、一方のハードディスクが故障し、停止している状態(この状態を縮退状態と呼ぶ)では、RAID1の故障率はλに低下してしまい、これでは信頼性の点では1台のハードディスクと変わるところがない。そこで、RAID1の高い信頼性を維持するには、一方のハードディスクにエラーが生じた場合でも、できるだけすみやかに冗長化状態へ復旧させる必要がある。
さて、ハードディスクの故障の検出は、書込時と読出時の両方で行われる。エラーは、(a) ハードディスクの全体に関係する障害を原因とするもの、(b) 記録媒体の部分の障害を原因とするものとがある。(a) に属するエラーが発生した場合には、書込時および読出時ともに、この障害は復旧できないため、エラーを検出したハードディスクを切り離す。RAID1の場合、この結果縮退状態になってしまうが、ディスク全体の障害なのでこれ自体は仕方がない。この場合、エラーの生じたハードディスクを新たなハードディスクに交換し、正常なディスクのデータをコピーすることで冗長性を回復するより他はない。
一方、(b) に属するエラーは、書込時のエラーであれば、ベリファイ処理を実施するハードディスクの場合にはハードディスク自体の再割当機構により自動的に修復される。しかし、IDE(Integrated Drive Electronics)ハードディスクドライブのようにベリファイ処理を実施しない場合には、書込時に修復がなされないので、そのエラーが読出時に検出されることとなる。
上記(b) に属する読出時のエラーの場合は、一方のハードディスクからの読出においてエラーが発生しても、他方のハードディスクから読み出すことにより、上位システムからの読出要求には応えられるが、ハードディスク自体はエラーとなるために何らかの対応が必要である。そこで、従来のRAID1のディスクアレイ制御では、このような部分障害が一方のハードディスクの読出時に生じた場合には、もう一方のハードディスクの全体のデータをそのエラーを検出したハードディスクにコピーすることで、冗長性回復を図っていた。また、ソフトウエアRAID方式のRAID1ディスクアレイ・システムの中には、ハードディスク全体ではなく、エラーを検出したパーティションを単位として正常なハードディスクからデータコピーを行うことで冗長性復旧を図るものも知られている。
また、特許文献1には、冗長構成のハードディスクシステムにおけるディスク間の復旧コピーについて示されている。この文献に示される方式では、復旧時に正常なディスクから、異常を修復したディスクへとデータをコピーする際、コピー元からの読出にエラーが発生しても、強制的に続行することにより、少なくともエラーが発生しないデータの復旧を実施することにより、全体システムの動作継続を試みることを可能とするものである。
また特許文献2には、ディスクアレイ装置において、故障したディスクを交換した後のデータ再構築(リビルト)時の制御方式について示されている。この方式では、データ再構築時に読出エラーが発生した場合に、発生箇所が未使用領域であればエラーを無視することにより、復旧処理における実質的なエラー発生率を低減するものである。
また特許文献3には、ディスクアレイのディスク交換後のデータ復旧処理における二次障害の復旧支援のための方式が示されている。この方式は、復旧処理において読出エラーが発生した状況からの障害回復に際して、障害復旧技術者の支援を行うものである。
また特許文献4には、データ読出時に障害が発生した際に、他方の正常なハードディスクからデータを読み出して、障害が発生したハードディスクに再度書き込むことで冗長性を回復させるとともに、その再書込時には、過去にエラーが発生した領域を避けて新たな領域に書き込むという方式が開示されている。この文献には、エラーが発生したディスクの復旧のために、RAID3〜5の場合は、他のディスクやパリティー用ディスクのうち、エラーの生じたブロック(セクタ)領域に対応するブロック(セクタ)領域内のデータを読み出して、エラーの生じたディスクに再書込する点が開示されている。また、RAID1については「このとき読み出すデータは、RAID1の場合はエラーが生じたディスク装置14と全く同じデータが記録された他のディスク装置14から読み込む同一のデータである。」と記載されている。
特開平05−242593号公報 特開平08−185274号公報 特開平09−305326号公報 特開2001−100948号公報
特許文献1の方式は、エラーをあえて無視して全体システムの動作継続を試みるだけであって、正常なディスクで読出エラーが発生した部分については、復旧対象であるディスクには正常なデータが書き込まれないまま復旧が終了してしまう。これでは、復旧後にその読出エラーの発生した部分の読出が行われる場合、復旧したディスクからその部分を読み出すと、正しいデータがない部分から読出が行われるので、不正なデータを読み出し上位システムに返すことになり、その結果は全く予期できないものとなる。これは非常に危険な方法である。
特許文献2の方式は、ハードディスクの使用率の低さに依存してエラー発生率を低減するものであるが、未使用部分のエラーを無視するだけでは発生率はせいぜい数分の1に低減されるだけである。
特許文献3の方式は、自動復旧を試みるものではないため、縮退動作を避けることもできないし、これで縮退動作期間をどの程度低減できるかについては示されておらず、不明である。
特許文献4の方式は、RAID3〜5のように、小さいサイズの記録単位制御を行うRAID方式には適用可能である。しかし、RAID1のようにディスク全体やパーティションといった大きなサイズでしかデータ復旧を管理しない方式では、過去にエラーが発生した領域を避けた新たな領域を確保するといっても、同じディスク内にディスク全体やパーティションと同等な大きさの領域を設けることはコスト的に見合わないため、事実上採用不能である。
また、従来のRAID1のデータ復旧のように、正常なハードディスクからディスク全体又はエラーのあったパーティションに該当するパーティションのデータを読み出して、エラーのあったディスクにコピーする処理の場合、読出エラーが生じると双方のディスクがエラーになってしまい、自動処理による復旧が困難になる。ファイル単位の読出ではハードディスクが読出エラーを生じる可能性は低いが、ディスク全体やパーティションという大きいサイズの読出の場合、読出エラーが生じる可能性は無視できない。
この点について詳しく説明すると、例えば、ハードディスクの1ビットを読み出す際の復旧不能なエラー率をμ、復旧の単位をS[bit]とすると、この復旧処理においてエラーが発生する確率は、S・μとなる。たとえばμが10−13であるとし、復旧の単位Sがハードディスク全体で例えば100[GByte](=100×10×8[bit])とすると、正常なハードディスクのすべてを読み出すときのエラー率は0.08,すなわち8%となる。決して無視できない確率である。
近年ハードディスクの容量は増加の一途をたどっており、数百GByteが当たり前になってきている。またこれに伴い、ハードディスクのパーティションのサイズも大きくなっている。したがって、ディスク全体やパーティションを単位として復旧する方式では、復旧単位のサイズは少ない場合でも10GByte程度、大きい場合には300GByteを越えることが一般的であると考えられる。このように大きい単位を復旧のために連続して読み出せば、正常なハードディスクからの読出でも、上記のように無視できないエラー率で読出エラーが発生する。このように読出エラーが発生した場合には、双方のハードディスクが利用できない状態に陥る。このため、ハードディスクの内容を論理的に比較しながらの手作業での復旧が必要になり、この場合には必ずしも完全復旧が可能である保証はないし、その復旧作業に要する時間も見積もることは難しい。
RAID1は、各種のRAID方式の中でも最も構成が簡単で、ソフトウェアでも実現可能なため、低コストで信頼性の高いハードディスクシステムを提供するためには有望な方式であるが、上述のように従来のRAID1のシステムではハードディスクに部分的な読出エラーが発生した場合に効果的な復旧方法が提供されていなかった。
本発明は、RAID1方式のディスクアレイ装置において、いずれかのハードディスクに部分的な読出エラーが発生した場合の、効果的な復旧方法を提供する。
本発明は、再割当機構を備えた複数のハードディスクと、それらハードディスクに対する読み書き動作を制御するRAID1制御部とを備えたRAID1方式のディスクアレイ装置であって、前記RAID1制御部は、前記ハードディスクを、該ハードディスクのパーティションよりも小さいサイズに設定された復旧単位ごとに領域分割して管理し、前記複数のハードディスクの一つからの読出時に読出エラーが生じた場合、その読出エラーが生じた復旧単位の領域のデータを前記複数のハードディスクのうちの他の一つから読み出し、読み出したデータを読出エラーが生じたハードディスクに書き込むことで冗長構成を復旧する、ことを特徴とするディスクアレイ装置を提供する。
ここで、前記復旧単位の領域は、前記ハードディスクの読み書きの単位であるブロックとすることも好ましい。
また、好適には、前記RAID1制御部は、前記復旧単位の各領域と前記ハードディスクの読み書きの単位であるブロック群との対応関係を登録した対応管理テーブルを備え、読出エラーが生じたブロックが属する復旧単位の領域のブロック群を前記対応管理テーブルから求め、それらブロック群のデータを復旧単位の領域のデータとして読み出し、読出エラーが生じたハードディスクに書き込むようにする。
以下、図面を参照して、本発明を実施するための最良の形態(以下「実施形態」と呼ぶ)について説明する。
本実施形態では、RAID1のディスクアレイ装置において、読出エラー(上述の(b)の障害に該当)の発生時の冗長化復旧を効率化する仕組みを提供する。
RAID1において、記録されているデータのすべてが正常であるとみなす単位を、ディスク全体やパーティションという単位よりも小さく設定し、エラーを検出したときに復旧すべき単位を小さくする。例えばハードディスクの1ビットを読み出す際の復旧不能なエラー率を上述の従来例と同様10−13であるとした場合、復旧の単位を1メガバイト[MByte] とすれば、その復旧単位を読み出す際のエラー発生率は0.0000008、すなわち0.00008%まで下げることができる。十〜数百ギガバイト規模でパーティションやディスク全体を復旧のために読み出す場合と比べた場合、エラー発生率は4〜6桁低くなる。復旧の単位をブロックとすることで、そのサイズを4〜16[KByte] とすれば、エラー発生率をさらに2桁程度低くすることができる。
復旧の単位はユーザ(RAID1システムの運用者)が任意に設定できるようにしてももちろんよいが、ブロックあるいはセクタのようにハードディスク自体の読み書きの単位をその復旧の単位とすれば、更に制御が簡素化できる。
また、本実施形態では、現在のハードディスク装置が持ついくつかの機能を利用している。
例えば、現在のハードディスク装置は、書込時に、ディスクの回転速度やその微分値、ヘッドの位置が、ディスクに対し適切に書込処理が実行可能な範囲内であることを確認する機能を備えている。例えばIDE規格では、このように書込時に回転速度等が一定の範囲内にあることを以て正常に書込ができているものと判定する。この機能により、書き込むべき領域に正しく書込が行われ、かつ書き込んではいけない領域にはみ出て書き込まれることがないようにしている。なお、SCSI規格では、更に、書き込んだデータを即座に読み出し、読み出しエラーが発生しないことにより書き込みの結果を確認するというベリファイ処理が規定されている。ただし、ベリファイ処理は処理コストがかかるので、そのようなエラーが発生する確率も勘案して、IDE規格のハードディスクにはベリファイ処理は実装されていない。
また、ハードディスクに書き込まれるデータはCRC(巡回冗長符号)と呼ばれるエラー訂正符号が付加されたものとなっており、適切に書き込まれていなかった場合でも、わずかな程度のエラーなら訂正可能であるとともに、訂正可能な範囲を超えた場合には読出時にエラーであることが判別できるようになっている。
また、現在のハードディスク装置では、あるブロックが読出エラーになった場合には、そのブロックはメディアエラー(ディスク表面の特定の領域が異常であることによる修復不能なエラー)であると判断され、ディスク上に用意された予備領域上の他のブロックが再割当される。再割当されたブロックは、元のブロックのブロック番号にマッピングされる。したがって、上位システムから見ればそのブロックへの書き込みが許されるが、ハードディスク内部ではそのブロックに対し再割当されたブロックへ書込が行われることとなる。この機能は、再割当(reassign)機構、あるいは交代機構と呼ばれる。
本実施形態では、これら現在のハードディスク装置が一般的に有している機能を利用して、RAID1における読出エラー時の効率的なデータ復旧処理を実現する。この復旧処理について、以下に説明する。
まず図1を参照して、RAID1のシステム構成を説明する。図1において、RAID1のディスクアレイ装置(上位システム10を含めた全体のコンピュータシステムからすれば、これはストレージサブシステムに該当する)は、RAID1制御部20と、ハードディスク30A及びハードディスク30B(以下それぞれ「ハードディスクA」,「ハードディスクB」と呼ぶ)から構成される。このうちRAID1制御部20が、それらハードディスクA,Bに対するデータの読み書きを制御する。パーソナルコンピュータやオペレーティングシステムで動作するストレージ用デバイスドライバよりも上位のプログラム等の上位システム10は、RAID1制御部20に接続され、このRAID1制御部20に対し、単体のハードディスク装置に対するのと同様の読出・書込の要求を送る。上位システム10から要求を受けたRAID1制御部20は、書込要求の場合は要求されたデータをハードディスクA,Bの両方に書き込み、読出要求の場合は要求されたデータをハードディスクA,Bのうちの一方(これはRAID1制御部20にシステム管理者が予め設定しておいてもよいし、RAID1制御部20が自動判定してもよい)から読み出す。
以下、RAID1制御部20の制御動作について説明する。以下の例では、読出エラー発生時の復旧の単位を、ハードディスク自体の読み書きの単位であるブロック(セクタとも言う)とする。このようにブロックを復旧単位とするため、ハードディスクAとBは同一容量で、ブロックのサイズが同一のものとする。
まず書込時の処理では、RAID1制御部20は、上位システム10から書込要求を受け付けると、両方のハードディスクA,Bにそのデータの書込要求を発する。この書込要求に対し、ハードディスクA,Bそれぞれから書込成功又はエラーを報せる応答が返される。ここでハードディスクA,Bの両方からエラーの応答があった場合は、RAID1制御部20は、ストレージサブシステムの停止を上位システム10に通知してから、サブストレージシステムを停止する。ハードディスクA,Bの一方のみからエラーの応答があり他方からは書込成功の通知があった場合は、エラー応答のあったハードディスクをストレージサブシステムから切り離して縮退動作に移行する。そして、縮退動作に移行した旨を報せる通知を上位システム10に対して行う。
以上が書込時の制御であり、これは従来のRAID1の制御と基本的に同様である。次に、読出時のRAID1制御部20の制御動作を、図2を参照して説明する。
この手順では、RAID1制御部20は、上位システム10からの読出要求を待つ(S10)。上位システム10からの読出要求には、読み出すべきブロックの番号の指定が含まれる。このような読出要求を受け取ると、RAID1制御部20は、読出対象に選ばれたハードディスク(図示例ではハードディスクA)から、その要求に指定されたブロックのデータの読出を行う(S12)。この読出でエラーが発生しなければ(S14の判定結果が否定(N))、RAID1制御部20は、読み出したデータを上位システム10に返す(S24)。
一方、S12の読出動作時に、ハードディスクAから読出エラーの通知があると(S14の判定結果が肯定(Y))、RAID1制御部20は、ハードディスクBに対し、ハードディスクAから読み出そうとしたのと同じブロックの読出を要求する(S16)。この要求に対してハードディスクBから正しくデータが読み出せると(S18の判定結果が否定(N))、そのデータをハードディスクAの当該ブロックに対して再書込する(S20)。なお、ハードディスクA内部の制御部は、読出エラーを検知した時点で、その読出エラーの生じたブロックの再割当処理を行う。したがって、S20の再書込では、ハードディスクAに対し、S12,14で読出エラーが検知されたブロックの書込要求を行えば、ハードディスクAではそのブロックにマッピングされた再割当ブロックに対して自動的にデータを書き込まれることになる。この再書込の際、ハードディスクAから書込エラーの通知が無ければ(S22の判定結果が否定(N))、RAID1制御部20は、S16で読み出したデータを上位システム10に返す(S24)。
なお、S16におけるハードディスクBからの読出の際に読出エラーが発生した場合(S18の判定結果がY)、RAID1制御部20は、ストレージサブシステムの停止を上位システム10に通知し(S26)、サブストレージシステムを停止する(S28)。
また、S20におけるハードディスクAの冗長化復旧(再書込)の際に書込エラーが発生した場合、RAID1制御部20は、ハードディスクAをストレージサブシステムから切り離してハードディスクBのみの縮退動作に移行し(S30)、縮退動作に移行した旨を上位システム10に通知する(S32)。
以上、読込時のRAID1制御部20の制御動作の例を説明した。以上の例では、S16でハードディスクBから読み出したデータをすぐには上位システム10に返さず、S18でそのデータをハードディスクAへ再書込して冗長化復旧を行った後で、S24でそのデータを上位システム10に返した。ただし、この順序はあくまで一例である。この逆に、S16でハードディスクBからデータを読み出した段階ですぐに上位システム10にそのデータを返し、その後、そのデータをハードディスクAに再書込するようにしてもシステムとしては成立する。もっともこの場合、タイミングの問題で、ハードディスクAの冗長化復旧が完了する前に上位システム10からの次の要求が来たりすると、再び読出エラーが発生してしまうなどの可能性があるので、このような問題の発生を回避する手順として、図2に示した手順は好ましい。
以上では、読出エラー時の復旧の単位として、ハードディスクの読み書きの単位であるブロックを採用したが、これより大きいサイズを復旧単位に採用することももちろん可能である。復旧単位をハードディスクや一般的なパーティションのサイズから小さいサイズとすれば、上で説明したように、復旧作業時の読出エラー発生率を低下させることができる。また、復旧単位を小さくすれば、復旧時の読出及び再書込の時間が短くなり、復旧作業に要する時間を全体として短縮することができる。復旧処理が完了するまではストレージサブシステムは冗長性を持たないため、この処理時間を低減することは上位システムから見たデータ記録機構としての信頼性を大幅に向上できる。復旧単位を1メガバイトなどのようにハードディスクやパーティションに比して数桁小さいサイズに設定すれば、復旧時の読出エラー発生率や復旧処理に要する時間を大幅に低減することができる。
ハードディスクの読み書きの単位であるブロックを復旧の単位とする前述の例では、RAID1制御部20は、上位システム10から読出要求されたブロックに対して読出エラーがあればそのブロックの復旧を行えばよいので、復旧のために特別なハードディスク領域管理を行う必要はなかった。これに対し、そのようなブロックよりも大きい単位での復旧を実現するには、復旧単位とブロックとの対応付けを管理する、図3に示したような対応管理テーブルをRAID1制御部20に持たせる。対応管理テーブルには、図示のごとく、各復旧単位の番号ごとに、その復旧単位に該当するブロックの番号が登録される。図示例では、連続するブロック群を復旧単位としているので、該当ブロック番号には、先頭と末尾のブロックのブロック番号が示されている。なお、復旧単位内のブロックにエラーが生じた場合でも、それはハードディスク内の制御で再割当がなされるので、この対応管理テーブル自体を修正する必要はない。
このように対応管理テーブルを持つ構成の場合、RAID1制御部20は、ハードディスクから読出エラーの通知を受けると、そのとき読出の対象であるブロックの番号が所属する復旧単位の番号を、図3に例示したような対応管理テーブルから求める。そして、求めた復旧単位に属するブロック群をその対応管理テーブルから求め、それらブロック群のデータをもう一方のハードディスクから読み出し、読出エラーのあったハードディスクに書き込む。以上の制御により、読出エラー時の冗長化復旧が可能になる。
復旧単位のサイズは、RAID1制御部20のパラメータ設定用のプログラム等を介して、システム管理者が設定できるようにすることもできる。この場合、管理者が復旧単位のサイズを例えばバイト数単位、あるいはブロック数単位で指定すると、そのプログラムがそのサイズに応じて各復旧単位の先頭及び末尾のブロック番号を計算し、それらを対応管理テーブルに登録するようにすればよい。
以上に説明したRAID1制御部20は、ハードウエアのRAIDコントローラとして構成することも、RAID制御用のプログラムとして構成することも、あるいはハードウエアとソフトウエアの折衷システムとして構成することもできる。
以上説明したように、本実施形態によれば、RAID1のディスクアレイ装置において、ハードディスクの一部分につき読出エラーが生じたときに、冗長状態への自動復旧を行うことができる。しかも、その自動復旧の単位を従来のRAID1のシステムより大幅に小さくしたので、自動復旧時に正常なハードディスクからの読出エラーが生じる確率を大幅に減らすことができるとともに、自動復旧に要する時間も大幅に短くすることができる。本実施形態の方式は、特にIDEディスクドライブを利用したディスクアレイ装置において最も効果が高い。なぜならばIDEディスクドライブは書き込んだデータのベリファイ処理を実施しないために、読出時にエラーが発生する確率が高いからである。
RAID1のシステム構成を示す図である。 読出時のRAID1制御部の制御動作の例を示すフローチャートである。 復旧単位とハードディスクのブロックとの対応管理テーブルの例を示す図である。
符号の説明
10 上位システム、20 RAID1制御部、30A,30B ハードディスク。

Claims (3)

  1. 再割当機構を備えた複数のハードディスクと、それらハードディスクに対する読み書き動作を制御するRAID1制御部とを備えたRAID1方式のディスクアレイ装置であって、
    前記RAID1制御部は、前記ハードディスクを、該ハードディスクのパーティションよりも小さいサイズに設定された復旧単位ごとに領域分割して管理するとともに前記復旧単位の各領域と前記ハードディスクの読み書きの単位であるブロック群との対応関係を登録した対応管理テーブルを備え、前記複数のハードディスクの一つからの読出時に読出エラーが生じた場合、その読出エラーが生じたブロックが属する復旧単位の領域のブロック群を前記対応管理テーブルから求め、前記複数のハードディスクのうちの他の一つからそれら求めたブロック群のデータを復旧単位の領域のデータとして読み出し、読み出したデータを読出エラーが生じたハードディスクに書き込むことで冗長構成を復旧する、ことを特徴とするディスクアレイ装置。
  2. 再割当機構を備えた複数のハードディスクに対するRAID1方式での読み書き動作を制御するディスクアレイ制御方法であって、
    前記ハードディスクを、該ハードディスクのパーティションよりも小さいサイズに設定された復旧単位ごとに領域分割して管理し、前記復旧単位の各領域と前記ハードディスクの読み書きの単位であるブロック群との対応関係を登録した対応管理テーブルを用意し、
    前記複数のハードディスクの一つからの読出時に読出エラーが生じた場合、その読出エラーが生じたブロックが属する復旧単位の領域のブロック群を前記対応管理テーブルから求め、前記複数のハードディスクのうちの他の一つからそれら求めたブロック群のデータを復旧単位の領域のデータとして読み出し、読み出したデータを読出エラーが生じたハードディスクに書き込むことで冗長構成を復旧する、
    ことを特徴とするディスクアレイ制御方法。
  3. 再割当機構を備えた複数のハードディスクに対するRAID1方式での読み書き動作を制御するディスクアレイ制御装置、としてコンピュータシステムを機能させるためのプログラムであって、該コンピュータシステムに、
    前記ハードディスクを、該ハードディスクのパーティションよりも小さいサイズに設定された復旧単位ごとに領域分割して管理し、前記復旧単位の各領域と前記ハードディスクの読み書きの単位であるブロック群との対応関係を登録した対応管理テーブルを用意するステップと、
    前記複数のハードディスクの一つからの読出時に読出エラーが生じた場合、その読出エラーが生じたブロックが属する復旧単位の領域のブロック群を前記対応管理テーブルから求め、前記複数のハードディスクのうちの他の一つからそれら求めたブロック群のデータを復旧単位の領域のデータとして読み出すステップと、
    読み出したデータを読出エラーが生じたハードディスクに書き込むことで冗長構成を復旧するステップと、
    を実行させるプログラム。
JP2004309218A 2004-10-25 2004-10-25 ディスクアレイ装置 Expired - Fee Related JP4609034B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004309218A JP4609034B2 (ja) 2004-10-25 2004-10-25 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004309218A JP4609034B2 (ja) 2004-10-25 2004-10-25 ディスクアレイ装置

Publications (2)

Publication Number Publication Date
JP2006120042A JP2006120042A (ja) 2006-05-11
JP4609034B2 true JP4609034B2 (ja) 2011-01-12

Family

ID=36537848

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004309218A Expired - Fee Related JP4609034B2 (ja) 2004-10-25 2004-10-25 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JP4609034B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5181795B2 (ja) * 2008-04-08 2013-04-10 日本電気株式会社 Raidシステム、及びエラーセクタの修復方法
CN102708019B (zh) * 2012-04-28 2014-12-03 华为技术有限公司 一种硬盘数据恢复方法、装置及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07134635A (ja) * 1993-11-10 1995-05-23 Nec Eng Ltd ディスクアレイ装置
JPH09269871A (ja) * 1996-03-29 1997-10-14 Mitsubishi Electric Corp ディスクアレイ装置におけるデータ再冗長化方式
JPH1031610A (ja) * 1996-02-16 1998-02-03 Korea Electron Telecommun データベースのデータ回復装置及びその方法
JPH10222315A (ja) * 1997-02-12 1998-08-21 Nec Corp 二重化されたハードディスク装置のエラー復旧方法および装置
JP2002367297A (ja) * 2001-06-13 2002-12-20 Hitachi Ltd 情報記録再生装置
JP2004171755A (ja) * 2002-11-21 2004-06-17 Hitachi Global Storage Technologies Netherlands Bv 動的再マッピングによりデータ記憶媒体の欠陥の成長を許容する方法及び装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07134635A (ja) * 1993-11-10 1995-05-23 Nec Eng Ltd ディスクアレイ装置
JPH1031610A (ja) * 1996-02-16 1998-02-03 Korea Electron Telecommun データベースのデータ回復装置及びその方法
JPH09269871A (ja) * 1996-03-29 1997-10-14 Mitsubishi Electric Corp ディスクアレイ装置におけるデータ再冗長化方式
JPH10222315A (ja) * 1997-02-12 1998-08-21 Nec Corp 二重化されたハードディスク装置のエラー復旧方法および装置
JP2002367297A (ja) * 2001-06-13 2002-12-20 Hitachi Ltd 情報記録再生装置
JP2004171755A (ja) * 2002-11-21 2004-06-17 Hitachi Global Storage Technologies Netherlands Bv 動的再マッピングによりデータ記憶媒体の欠陥の成長を許容する方法及び装置

Also Published As

Publication number Publication date
JP2006120042A (ja) 2006-05-11

Similar Documents

Publication Publication Date Title
US7721143B2 (en) Method for reducing rebuild time on a RAID device
JP4821448B2 (ja) Raidコントローラおよびraid装置
US6766491B2 (en) Parity mirroring between controllers in an active-active controller pair
US7640452B2 (en) Method for reconstructing data in case of two disk drives of RAID failure and system therefor
US7565573B2 (en) Data-duplication control apparatus
US7093157B2 (en) Method and system for autonomic protection against data strip loss
WO2013159503A1 (zh) 一种硬盘数据恢复方法、装置及系统
US7823011B2 (en) Intra-disk coding scheme for data-storage systems
JP2008204041A (ja) ストレージ装置及びデータ配置制御方法
US7302603B2 (en) Host-initiated data reconstruction for improved RAID read operations
JP2010128773A (ja) ディスクアレイ装置、そのディスク管理方法及びそのディスク管理プログラム
US7730370B2 (en) Apparatus and method for disk read checking
JP2000200157A (ja) ディスクアレイ装置およびディスクアレイ装置におけるデ―タ復旧方法
JP2005099995A (ja) 磁気ディスク装置のディスク共有方法及びシステム
JP2006285527A (ja) ストレージ装置およびプログラム。
JP2010026812A (ja) 磁気ディスク装置
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP2010267037A (ja) ディスクアレイ装置
JP4609034B2 (ja) ディスクアレイ装置
JP4143040B2 (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
JP2008234446A (ja) データ整合性チェック方法およびデータ整合性チェックシステム
JP4248164B2 (ja) ディスクアレイのエラー回復方法、ディスクアレイ制御装置及びディスクアレイ装置
JP2005107839A (ja) アレイコントローラ及びディスクアレイ再構築方法
CN108228090B (zh) 硬盘阵列及其重建方法
JP5381519B2 (ja) ディスクへの書き込み位置の誤算出を検出するストレージ制御装置、ストレージシステム、及びアクセス方法。

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100927

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131022

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees