JPH05127839A - エラーの発生したデイスクドライブを含む複数のデイスクドライブの冗長アレイ内でデータを再生する方法および装置 - Google Patents

エラーの発生したデイスクドライブを含む複数のデイスクドライブの冗長アレイ内でデータを再生する方法および装置

Info

Publication number
JPH05127839A
JPH05127839A JP4114910A JP11491092A JPH05127839A JP H05127839 A JPH05127839 A JP H05127839A JP 4114910 A JP4114910 A JP 4114910A JP 11491092 A JP11491092 A JP 11491092A JP H05127839 A JPH05127839 A JP H05127839A
Authority
JP
Japan
Prior art keywords
array
data
reproduction
parity
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4114910A
Other languages
English (en)
Other versions
JPH0642194B2 (ja
Inventor
Spencer W Ng
スペンサー・ワーフング・ヌグ
David W Palmer
デイビツド・ウイリアム・パーマー
Richard S Thompson
リチヤード・スコツト・トンプソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05127839A publication Critical patent/JPH05127839A/ja
Publication of JPH0642194B2 publication Critical patent/JPH0642194B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1092Rebuilding, e.g. when physically replacing a failing disk
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【目的】 複数のディスクドライブから成るアレイにお
いて、障害の発生後、データを再生して、フォールト・
トレラント状態を回復する。 【構成】 アレイの動作状態をモニタし(45,50,
55)、データの再生が必要となるときには(46,5
1,56)、そのときのアレイの動作状態に応じて、3
つの再生方法のうちの1つを選択して、データを再生す
る。可変速度再生方法(47)では、アレイのI/O
(アクセス)動作とインタリーブして再生動作を行うの
に対して、アイドル時間再生方法(52)では、アレイ
のアイドル時間を利用して再生動作を行う。また、日和
見的再生方法(57)では、アクセス中のトラックにお
けるエラーの検出毎に再生動作を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディスクドライブの冗
長アレイに関し、特に、冗長度の低下を起こすエラーの
影響を受けたトラックのデータをスペアトラックまたは
ディスク内に再生することによる、低下した冗長度から
の回復に関する。
【0002】
【従来の技術】Patterson他による文献“A
CASE FOR REDUNDANT ARRAYS
OF INEXPENSIVE DISKS (RA
ID)”, ACM 1988, March 198
8は、複数のデータ記憶ディスクドライブを用いるため
のいくつかの装置を説明している。種々のオペレーショ
ンモードが説明されており,あるモードでは、データ記
憶は、記憶の冗長度を実現するために、いくつかのドラ
イブに分割される。記憶されるべきデータは、アレイ内
の予め定められた数のディスクドライブに部分的に記憶
され、ディスクドライブの少なくとも1つはエラー検出
冗長情報を記憶する。例えば、4つのディスクドライブ
がデータを記憶し、第5のディスクドライブが4つのデ
ィスクドライブに記憶されたデータに基づくパリティを
記憶する。ディスクドライブのこうした冗長アレイは、
ディスクドライブの1つにエラー検出冗長データを記憶
することによって、高いデータ可用性を与えることがで
きる。例えば、4つのデータブロック(4ドライブの各
々につき1データブロック)が、パリティ値のようにエ
ラー検出冗長情報を計算するのに使用される。計算され
たエラー検出冗長情報は、第5のドライブに第5ブロッ
クとして記憶される。すべのブロックは同数のデータバ
イトを有し、同じ相対トラック位置で5つのディスクド
ライブに記憶することができる(必要条件ではない)。
5つのドライブはドライブのパリティグループを形成す
る。もしパリティグループのドライブのどれか1つが、
全体的にまたは部分的に障害を起こしたら、障害ドライ
ブからのデータは既知のエラー訂正技術を用いて再生す
ることができる。データ処理動作のためにアレイ内のド
ライブをアクセスし続けながら、障害ディスクドライブ
からのデータを効率的に再生および置換するのが望まし
い。
【0003】パリティグループのディスクドライブは、
単一の論理ディスクドライブの様に一致して動作する。
このような論理ドライブは、パリティグループのドライ
ブ内に同一に配置されたシリンダおよびトラックからな
る論理シリンダおよびトラックを有している。このよう
なアレイでは、記憶されているデータが、データ記憶ド
ライブの各々にいわゆるストライプモードでインタリー
ブ的に部分記憶される。あるいはまた、パリティグルー
プのディスクドライブおよびそれらのデータは、独立に
アドレス指定が可能であり、いわゆる独立モードで使用
できる。単一パリティアレイ内のディスクドライブの1
つが障害を起こしたときは常に、データをうまく回復で
きても、エラー状態に対するフォールト・トレランスは
失われる。障害を起こしたディスクドライブは、所望の
フォールト・トレラント状態に戻るためには、交換また
は修復され、影響を受けたデータ内容は所望の冗長度を
もたらすように再生されなければならない。ディスクド
ライブのパリティアレイ内の部分的または全体的に障害
を起こしたディスクドライブからのエラーを除去するた
めに、このようにデータおよびその冗長度の再生を実施
する制御手段および方法を提供することが望まれてい
る。
【0004】
【発明が解決しようとする課題】本発明の目的は、ディ
スクドライブのパリティアレイ内で部分的または全体的
に障害を起こしたディスクドライブによるフォールト・
トレラント状態の喪失または低下を検出した後、パリテ
ィグループのディスクドライブ内のデータをフォールト
・トレラント状態に再生することにある。
【0005】本発明の他の目的は、パリティアレイへの
アクセスがデータの記憶および修正のために繰り返され
る際に、相対的非割込み的にフォールト・トレラント状
態へのデータ再生を行うことにある。
【0006】
【課題を解決するための手段】本発明によると、ディス
クドライブの冗長アレイの障害は、情報処理およびデー
タ処理のためにディスクドライブ・アレイを連続使用す
ることができる複数の方法および装置のうち任意のもの
を用いて、エラーを発生したデータを再生することによ
り修復される。このような再生には前記方法および装置
のいずれかまたはすべてを使用することができる。第1
の方法および装置は、ディスクドライブ使用またはパリ
ティグループ内のアクセスにおける、現在すなわち実行
中の速度に対して、検出された逆比の速度で再生をスケ
ジュールする可変速度再生である。スケジュールされた
各再生を終えると、この方法および装置は、もし待ちア
クセスがなければ、連続再生によってアレイのアイドル
時間も好適に利用する。第2の方法および装置は、エラ
ーを発生したデータの予め定められた部分のスケジュー
ルされない再生を開始することにより、予め定められた
アレイ・アイドル時間の間、再生を実施する。第3のす
なわち日和見的方法および装置は、アレイへの通常のア
クセスの際に、データ再生の必要性を検出する。これら
3つの方法および装置はすべて、互いに関連し合って好
適に用いられる。
【0007】上述の方法および装置は、エラーのあるデ
ィスクドライブを交換するスクラッチまたは新しいディ
スクドライブにデータを再生する。再生の目的は、アレ
イの冗長度の回復である。これらの方法および装置は、
部分的に障害を起こしたディスクドライブにも適用さ
れ、エラーを発生したデータが、エラーのあるディスク
ドライブの異なるトラックまたはゾーンで再生される。
後者の再生では、障害を起こしていないディスクドライ
ブ内のデータも、個々のドライブ内の対応するゾーンま
たはトラックに移動させることもできる。
【0008】
【実施例】特に、図面においては、同一の数字は、種々
の図面における同一の部分および構造的特徴を示す。図
1のホストプロセッサ(1つまたは複数)10は、ホス
ト対周辺相互接続部12によって、1以上のコントロー
ラにそれぞれ接続されている。複数のパリティアレイ1
3,14,15は通常のコントローラ対周辺装置接続部
17によって、コントローラ11に接続されている。図
1に示したアレイ13〜15の各々は、5つのディスク
ドライブ20〜24(これらへの限定を意図するもので
はない)を含む。4つのディスクドライブ20〜23は
1つのデータユニットの同じサイズのデータ・ブロック
を記憶する。ブロックサイズはデータユニット毎に変え
ることができる。データユニットは合併ファイル,単一
ファイル,グラフィックデータ等である。第5のディス
クドライブ24は、パリティすなわちエラー検出冗長情
報記憶ドライブである。冗長情報はデータユニットの対
応するデータブロックと同じサイズを有するパリティ・
データブロックである。冗長情報は、例えば、ドライブ
20〜23内に記憶されたデータブロックのデータを用
いて、1つのパリティを含むアルゴリズムに基づいて計
算される。ディスクドライブ20〜24内の任意のデー
タユニットの全データブロックを、すべてのディスクド
ライブの同じ相対トラックに記憶することができる。す
なわち、すべてのデータブロックを例えば、すべてのド
ライブのトラック16に記憶することができる。この記
憶配置はデータ管理を簡単化するが、それは本発明の実
施に関しては重要ではない。
【0009】ディスクドライブ20〜24はパリティグ
ループを形成し、ディスク24はパリティブロックの記
憶専用である。この一般的装置は、RAID3およびR
AID4アーキテクチャとして知られている(前述のP
atterson他、参照)。あるいはまた、単一のド
ライブがパリティドライブとして指定されないように、
パリティグループ内のすべてのディスクドライブにパリ
ティブロックを分散させて記憶してもよい。この後者の
記憶配置は、RAID5アーキテクチャとして知られて
いる。本発明は、これらのどのアーキテクチャにも、ま
た他のアーキテクチャにも等しく適用可能である。
【0010】1以上の任意のディスクドライブ20〜2
3にデータを記憶するとき、新しいパリティ値が計算さ
れ、ディスクドライブP24に記憶される。効率向上の
ために、データをデータドライブに記憶しながら、同時
に、4つのディスクドライブ20〜23すべてにおいて
データを記録し、パリティを計算し、ディスクドライブ
P24上にパリティを記録する。循環するパリティ配置
において、パリティデータは適切なディスクドライブに
記憶される。
【0011】ホストプロセッサ10およびコントローラ
11は両方とも、上述のマシン・オペレーションに関係
する。ホストプロセッサ10とコントローラ11の組合
せは、本実施例において本発明を実施するためにプログ
ラムが設けられ、かつ起動されるコンピュータ手段を有
していることを理解すべきである。このようなプログラ
ミングは図面に、マシン・オペレーション・フローチャ
ートとして示されている。このようなプログラミングは
図1のシステムの別個の部分とするか、または、RO
M,ロード可能ソフトウェア・モジュール等に含ませる
ことができる。
【0012】障害を起こしたディスクドライブと置き換
えられるディスクドライブ上にパリティグループ内のデ
ータを再生するとき、スペアまたは真(true)の置
換えのどちらかが方法の組合せによって実施される。最
初のスケジュールされた再生は、可変速度再生方法によ
り制御され、アイドル時間再生は、パリティアレイの任
意のアイドル時間内に実施され、日和見的再生方法は、
障害を起こしたドライブに代わる置換ドライブへの各ア
クセス時に実施され、非再生データ記憶領域をアクセス
する。この説明は障害ドライブ(セクタの多数の記録不
可能データ記憶トラックまたはクラスタを有するドライ
ブ、アクセスを妨げる障害を起こした機械部分等が、障
害ドライブである)が、既知のディスクドライブおよび
ディスク置換処理を用いて、スクラッチドライブまたは
ディスクと置換されることを想定している。
【0013】本発明の方法を詳述する前に、可変速度再
生方法の原理を図2を参照して述べる。この方法が起動
されると、再生ディスク・アクセス(入出力動作または
I/O)が、I/O動作の現レベルに対して逆に変化す
る速度で命令を受ける、またはスケジュールされる。図
2は再生スケジューリングの速度が如何に確認されるか
を示したものである。このような再生は、後に明らかに
するように、ホストプロセッサ10または他のディスク
ドライブ・アクセスとインタリーブされる。所望の応答
時間Tは管理されるべきパリティグループに対して決定
される。このような応答時間は既知のシステム分析技術
を用いて決定され、または、速度を任意かつ恣意にする
ことができる。5つの曲線30はそれぞれ1〜5のラベ
ルを付けられ、水平座標が示す全I/O速度に対する平
均応答時間(垂直座標)の変化を示す。全I/O速度は
ホストプロセッサ10の動作により決定される。I/O
速度は予め定められた一定の測定時間内で、繰り返しモ
ニタされる。測定されたI/O速度は次に続く測定時間
に対する再生速度を決定する。各測定時間に測定された
速度は、パリティグループの測定時間に対して計算され
た平均I/O速度である。I/O速度がR1より速くな
ると、再生は次に続く測定時間中はスケジュールされな
い。このような測定時間中、アイドルまたは日和見的再
生方法を用いて、再生を行うことができる。1測定時間
に対する再生スケジュール速度は、ガイドとして図2の
チャートを用いてリスト化される。R1とR2の間のI
/O速度が測定されると、1つの再生がスケジュールさ
れる。R3とR2の間のI/O速度が測定されると、2
つの再生がスケジュールされる。R4とR3の間のI/
O速度が測定されると、3つの再生がスケジュールされ
る。R5とR4の間のI/O速度が測定されると、4つ
の再生がスケジュールされ、R5より遅いI/O速度は
5つの再生をスケジュールする結果となる。スケジュー
ルされる再生の最大数は5である。最大値としては任意
の数を用いることができる。この実施例では、最小サイ
ズの再生は1トラックである。図2のチャートにより示
される情報は、スケジュールされた再生を実施するコン
ピュータ手段内のパリティアレイに対して保持される。
【0014】図3はパリティアレイ13〜15の1つか
らデータを読出し、再生判定基準を検出し、データを再
生する図1に示したシステムを準備する処理を示す。通
常の読出し動作が、他のマシン・オペレーションにより
開始されるように、マシン・ステップ35で行われる。
マシン・ステップ36で、コントローラ11が、ディス
クドライブ20〜23のいずれかから読出されたデータ
のエラーを検出する(ディスクドライブが、コントロー
ラまたはホストプロセッサと同様に、エラー検出機構を
有することもできる)。このようなエラーは通常の方法
で訂正が試みられる。マシン判定ステップ37で、コン
トローラ11は個々のディスクドライブ20〜23のエ
ラー冗長度によりエラー訂正が成功したか否か、成功し
たエラー訂正によってフォールト・トレランスが低下し
たか否かを判定する。もしエラー訂正が成功したならば
(後に明らかにするように、ある場合は高品質冗長度が
指定され、他の場合は低い冗長度が指定される)、フォ
ールト・トレラント冗長度が再生の要求に対し低下しな
いとして(マシン・ステップ37で低下が検出されな
い)、マシン・オペレーションは他のオペレーションに
進み、再生動作は指示されない。一方、どのディスクド
ライブも応答障害を含む訂正可能なデータエラーを発生
しなかったならば、フォールト・トレランスの低下が指
示される。パリティディスクP24を用い、このような
データエラーは、ディスクドライブP24からブロック
のパリティ冗長情報を読出すことにより訂正し、他のド
ライブから読出しに成功したデータおよびパリティ冗長
情報から、正しいデータを計算することができる。この
既知のパリティ訂正を達成するために、ディスクドライ
ブP24に記憶されているパリティブロックは、コント
ローラ11に読出される。次に、データはマシン・ステ
ップ39で、既知のパリティ訂正処理を用いて訂正され
る。このような訂正はホストプロセッサ10またはコン
トローラ11で行うことができる。この時点では、読出
されたデータユニットに対する冗長情報が除去されてい
る。次に、マシン・ステップ40で、パリティ訂正ユニ
ット(ホストプロセッサ10またはコントローラ11)
が、パリティ訂正が成功したか否かを判定する。パリテ
ィ訂正が不成功ならば、サブシステム・エラーに通常の
方法でフラグが立てられる。さらに、本発明の範囲外の
回復処理が必要になる。パリティ訂正が成功すると、マ
シン・ステップ41で、冗長度に関連したフォールト・
トレランスの不十分な低下が存在すると判定されれば、
他のマシン・オペレーションが実行される。もしフォー
ルト・トレランスが受容できないと判定されれば(例え
ば、ディスクが故障した場合)、再生が指示される。
【0015】本発明は日々のオペレーションによる不適
当な干渉を受けずに、所望の冗長度を維持することを可
能にする。図4は本発明の一実施例の概念を示す。図4
は、システムにおける再生の必要性の割込み駆動検査の
確立について示している。マシン・ステップ45は、デ
ィスクドライブの各パリティグループ13〜15に対す
るオペレーションのI/O(入出力)速度をモニタおよ
び指示することを示している。図9で明らかになるが、
このような速度モニタおよび指示から、再生の必要性は
マシン・ステップ46で所定回数検出される。このよう
な検出は単に、グローバルな再生フラグであるか、また
は、図8に示したビットマップのどれか任意の項目であ
るかである。もし再生が必要なら、マシン・ステップ4
7で、後述の可変速度再生がスケジュールされる。もし
再生が必要でないなら、他のマシン・オペレーションが
実行される。
【0016】同様に、マシン・ステップ50は、パリテ
ィグループ13〜15のいずれか1つにおけるアイドル
時間をモニタすることを示している。もし、実行待ちの
アクセス要求もフリー・スタンディング・オペレーショ
ンも実行されていないようなアイドル時間が検出された
なら、マシン・ステップ51で再生の必要性を検出す
る。再生の必要性が検出されると、マシン・ステップ5
2で、後述するアイドル時間再生が実施される。もし再
生が必要でないなら、他のマシン・オペレーションが行
われる。
【0017】同様に、マシン・ステップ55でアクセス
障害、または、パリティグループ13〜15のいずれか
1つにおける読出し動作または書込み動作、または、既
知の障害ドライブに対する何らかのアクセスをモニタす
る。このようなエラーが検出されると、再生の必要性が
図3に説明したように指示される。次に、マシン・ステ
ップ56で、再生の必要性が検出される。一方、もし図
3で説明したパリティ訂正が成功したら、再生は行われ
ず、マシン・ステップ56から他のオペレーションへ進
む。もし再生が必要なら、後述するマシン・ステップ5
7の日和見的再生動作が実施される。
【0018】図4の説明は基本的なものであると考える
べきである。実際の実施例では、本発明の原則から逸脱
することなく、かなりの細部において、異ならせること
ができる。複数の再生技術をインタリーブするのは、い
くつかのバリエーションに従う。再生の時期と全範囲の
決定は、所定の設計にかなりの影響を与える。
【0019】図5は、説明した3つのデータ再生技術の
うちの2つから選択する1つの方法を示している。選択
処理は、タイムアウト,時刻,アクセス数,後述する可
変速度再生の再生スケジュール,図8のビットマップが
何らかの再生の必要性を示しているか否かの判定等のよ
うな、複数の判定基準のどれか1つに基づいて、他のマ
シン・オペレーションからパス60へ進む。このような
選択は典型的に、ディスパッチャまたは他の監視プログ
ラム(図示せず)内に存在する。マシン判定ステップす
なわち分岐ステップ61で、評価されるのに必要な再生
の種類が選択される。マシン・ステップ61はソフトウ
ェア・カウンタ62により制御されるプログラム・ルー
プ機能を示す。パス60への処理の進行は、カウンタ6
2を基準状態にリセットし、カウンタ62は判定ステッ
プ61が、図10に詳述したようにマシン・ステップ6
5でアイドル再生を最初に評価するのを可能にする。も
しパリティアレイ13〜15のどれもがアイドルでな
い、またはどんな再生も必要とされていない(図8のビ
ットマップがすべて0)なら、オペレーションはマシン
・ステップ61に戻り、カウンタ62が次の値にインク
リメントされる。この次の値により、判定ステップ61
は後に図9で詳述するように、マシン・ステップ66で
可変速度再生の評価を実施させる。再生走査は図9から
図5に戻り、マシン・ステップ61を再実行し、カウン
タ62をインクリメントする。67が示すように、他の
再生処理(図示せず)も使用できる。また、再生評価を
終えると、マシン・オペレーションは図5の処理に戻
り、カウンタ62の他のインクリメントを行い、マシン
・ステップ61を実行する。処理のプログラム・ループ
走査が終了すると、他のマシン・オペレーションが、6
8に示したように実行される。再生処理または方法を走
査する順序は任意である。図11に示したように、日和
見的再生処理は常に、ディスク・アクセス動作から入
る。複数の再生処理から任意の1つを選ぶために、再生
処理走査のどの方法を採用してもよい。
【0020】図6はディスク装置20〜24のいずれか
におけるディスクの略平面図である。このような複数の
ディスクは通常、個々の装置内で同軸的に同時回転する
ように積み重ねられている。同じ半径方向位置を有する
個々のディスク上のすべてのトラックは、このようなト
ラックのシリンダを構成する。伝統的な固定ブロック・
アーキテクチャを採用すると、各ディスク70は複数の
ディスクセクタ指示・半径方向伸張・機械読取可能ライ
ン71を仮想できる。ライン間の各ディスクセクタは、
データ記憶ユニットとしてアドレス指定可能である。カ
ウントキーデータ(CKD;count−key−da
ta)ディスクでは、1本の半径方向に延びるトラック
・インデックス・ラインが用いられる。各ディスク70
上には多数のアドレス指定可能な円形トラック、また
は、螺旋トラックの渦巻を有している。トラック72は
アレイの部分的再生を必要とするようなエラーを生じて
いるものとする。ディスク70では、エラーを生じたト
ラック72のデータ内容がトラック73に再割当され
る。ある再生では、個々のディスク装置20〜24内の
すべてのトラック72のデータ内容が、それらの個々の
トラック73に同様に再割当されている。あるモードで
は、トラック72を含むトラックのシリンダのデータ内
容を、トラック73を含むトラックのシリンダに再割当
することができる。他のモードでは、1トラックの内容
だけが再割当される。ディスク装置が全体的に交換され
るとき、残りの装置20〜24のすべてからのデータ
が、交換ディスクのためのデータ計算に用いられる。部
分的に使用可能なディスク装置をいつ交換すべきかの判
定は、装置上の使用不可能または不良なトラックの数、
障害を引き起こすエラーの特徴等に基づく。
【0021】図7は可変速度再生方法の一例のデータ構
造を示す。この方法の目的は、サブシステムの性能、す
なわち受け取ったI/O要求に対する応答時間の少なく
とも最小レベルを、再生の期間、維持することにある。
ホストプロセッサ10またはコントローラ11内の3つ
のレジスタすなわちデータ記憶場所80〜82は、個々
のパリティアレイ13〜15において可変速度再生方法
を実施するのに必要な制御情報を記憶する。各レジスタ
80〜82は、同一に構成されるが、判定基準情報を異
ならせて、異なる性能特性またはシステム利用法を有す
るアレイを備えることができる。速度フィールド83は
再生の速度、すなわち毎秒1再生、毎秒2再生、等を示
す数を記憶する。AVG−IOフィールド84は、予め
定められた測定時間内の対応するI/O要求速度によっ
て表すことができる平均I/O応答時間を記憶する。I
/O応答時間すなわち要求速度は、再生速度を計算する
のに用いられる。フィールド85〜88は個々に、特に
制限を設けない種々の再生速度に対するI/O要求速度
T−1〜T−4に対する再生速度を記憶する。パリティ
アレイへのディスク・アクセスの総数は、応答の指示で
ある。アクセス要求の数が増大すると、所望の再生速度
は減少する。閾値T−1〜T−4はアクセス要求速度の
減少数に対応し、より速い再生速度を示す。閾値T−1
は可変速度再生方法により許容されるどんな再生にも至
らない速度以上のアクセス速度を示す。閾値T−2はT
−3より速くT−1より遅いアクセス速度を示し、一定
の要求速度測定時間内に1つの再生アクセス(すなわ
ち、1トラックのデータ再生)を許容する。同様に、閾
値T−3はT−4より速くT−2より遅いアクセス速度
を示し、一定の再生速度測定時間内に2つの再生アクセ
スを許容する。要求速度が減少し続けると、対応する再
生速度の増大が生じる。システムに対する予め定められ
た最大再生速度を確立することができる。可変速度再生
方法の他の実施例においては、平均応答時間は各連続測
定時間中に直接測定することができる。もし測定された
応答時間が所望の応答時間より長ければ、次に続く測定
時間に用いる再生速度は減少する。もし測定応答時間が
所望の応答時間より短かければ次に続く測定時間内に用
いられる再生速度は増大される。あるいは、もしI/O
アクセスキューが存在するなら、再生速度は個々のパリ
ティアレイに対するアクセスキューの長さに反比例する
ように選択される。前述のいずれかの測定技術を、フィ
ールド83および84に記憶された再生速度制御情報を
確立するのに使用することができる。89は、アクセス
またはフリー・スタンディング・アレイ・オペレーショ
ンに反比例する再生速度を判定するのに、付加的判定基
準を用いることを示す。
【0022】どのトラックが再生を必要としているか
は、個々のパリティアレイ13〜15に対するビットマ
ップ95〜97(図8参照)に保持されている。行10
5,106,107…のビット包含スクエア99はそれ
ぞれディスク70(図6参照)の1つの記録表面の論理
トラックの集合を表している。列100,101,10
2…のビット包含スクエア99は、それぞれ論理トラッ
クの論理シリンダを表している。各論理トラックは各装
置20〜24内に1物理トラックを含み、各論理シリン
ダは各装置20〜24に1物理シリンダを含んでいる。
パリティグループ13〜15のいずれかが完全な冗長度
を与えるとき、個々のビットマップ95〜97の全スク
エア99は2進数0を含んでいる。ディスク装置の完全
な再生の一部として、または部分的再生としてであろう
と、再生を必要としている任意のトラックは、個々のビ
ットマップのスクエアすなわちビット位置99内の2進
数1により表される。再生の必要性を確認するためのビ
ットマップ走査は、既知の技術に従う。インデックスす
なわちビットマップへの書込み値(図示せず)は、個々
のビットマップが少なくとも1つの2進数1を含むか、
または2進数0だけを含むか、または複数の2進数1を
含むかを示すために用いられる。
【0023】図9は図7のデータ構造に対する制御情報
を生成することを含む、可変速度再生方法の一例を示
す。図9の説明は、パリティアレイの1つに対するもの
であり、複数のパリティアレイを含ませるためのマシン
・オペレーションの変更をいくつかのアプローチのどれ
か1つにおいて達成することができる。例えば、3つの
アレイ13〜15の1つだけが非0ビットマップを有す
ることができ、非0ビットマップにより示されたアレイ
だけが処理される。もし複数のビットマップが非0なら
ば、3つのアレイの再生における優先度は、最も使用さ
れていないアレイ、システム・オペレーションをうまく
続けるためのアレイの相対的重要性等に基づくことがで
きる。いずれにせよ、図9に示したマシン・オペレーシ
ョンの進行は図4または図5からパス110上へのもの
で、この説明では図5から進行するものとする。マシン
・ステップ111で、測定時間がタイムアウトになった
か否かが判定される。もし測定時間がタイムアウトにな
っていないなら、マシン・ステップ112で、アクセス
タリーが更新される(他の再生速度指示判定基準もまた
更新される)。更新に続いて、マシン判定ステップ11
3で、フィールド83が経過時間の指示に関して検査さ
れる。経過時間は図7の89によって示されるように、
パリティエラーに対する最終再生が完了した時刻から計
算される。設計によると、このような最終再生は、使用
されるいずれかの方法による最終再生、またはアイドル
または可変速度再生方法の最終再生、または可変速度再
生方法によって達成される最終再生である。もし再生の
時間が到達されなかったならば、図5に示した走査処理
に再び進む。もし再生がスケジュールされることになる
と、マシン・ステップ118で再生するべきシリンダお
よびトラックを選択する。シリンダおよびトラック選択
を行うときは、再生されるべきトラックに到達するため
のシーク時間を最小にするのが望ましい。ストライプモ
ード・アレイでは、各パリティアレイ内のドライブのト
ラックアクセス機構(別個には示されていない)が、
(同じ半径方向位置でパリティグループ装置内の全物理
シリンダを有する現論理シリンダにおけるトラックを走
査する)個々の装置20〜24のディスク70上の共通
の半径方向位置を常に有するので、現シリンダ、または
現シリンダに半径方向に最も近いシリンダにおけるトラ
ックが選択される。このようなトラック(1つまたは複
数)は図8のアレイのビットマップの分析によって識別
される。この分析は簡単なのでこれ以上説明しない。
【0024】独立モードで動作するパリティアレイに対
して、同じ一般的アプローチが用いられる。独立モード
の各装置は、異なる半径方向位置を有するトラックおよ
びシリンダを走査する。再生されるべきトラックおよび
シリンダは、最も内側の半径方向位置にアクセス機構を
有するアレイ内の第1の装置と、アレイ内のすべての装
置の最も外側の半径方向位置にアクセス機構を有する第
2の装置との間の平均半径方向位置に位置するシリンダ
である。例えば、もし第1の装置が図6のトラック72
を走査するためのアクセス機構を有し、第2の装置がト
ラック73を走査するためのアクセス機構を有し、パリ
ティアレイ内の他の2つの作動装置が、トラック72と
73との半径方向中間に存在するトラックを走査するた
めに半径方向に配置された個々のアクセス機構を有する
ならば、トラック72と73との半径方向中間に存在す
るシリンダが再生のために検査される。もし中間シリン
ダが再生すべきトラックを有しないならば、隣接シリン
ダが中間シリンダからの連続して増大する半径方向距離
において、連続して検査される。この判定に続いて、中
間シリンダの次の半径方向外側にあるシリンダを検査
し、こうしてもしそのシリンダが再生を要求するトラッ
クを有しないならば、次の半径方向内側のシリンダの検
査等が行われていく。
【0025】マシン・ステップ118でシリンダを選択
した後、マシン・ステップ119で、選択されたシリン
ダにおけるトラック(1つまたは複数)が再生される。
この再生は、アレイの他の装置内の対応する物理トラッ
クからデータを計算し、計算したデータを選択されたト
ラック(1つまたは複数)に記憶する。再生が完了する
と、図8のアレイ・ビットマップの個々のビット位置
(1つまたは複数)は0にリセットされる。次に、マシ
ン・ステップ120で、パリティアレイがアイドルであ
るか、および、再生されるべきトラックがまだ存在する
か否かがチェックされる。アレイがアイドルで、パリテ
ィアレイのトラックがまだ再生を必要としているなら、
マシン・ステップ118および119を、アレイがアイ
ドルでなくなり、すべての再生が完了するまで繰り返
し、他のマシン・オペレーションを実施する。
【0026】マシン・ステップ111が、測定時間が終
了したことを示すときは常に、可変再生速度の計算が行
われる。所望の再生速度を計算する一実施例では、マシ
ン・ステップ125で、パリティアレイに対するアクセ
ス数が平均されて、平均アクセス速度を得る。このよう
な平均は他の変数に影響を与えることなく、測定時間の
変更を可能にする。平均速度はフィールド84に記憶さ
れる。次に、アクセスタリーがマシン・ステップ126
でリセットされ、このようなアクセスタリーは89で示
されるように、レジスタ80〜82に記憶される。マシ
ン・ステップ127で、再生速度が、フィールド85〜
88におけるアクセスタリー値と、フィールド84の値
との比較により決定される。次に、フィールド84の値
より最も小さい値を持つ閾値フィールド85〜88に対
応する再生速度は、新しい再生速度としてフィールド8
3に記憶される。T−1の再生速度が0であることを思
い起こそう。もしキュー長判定基準が用いられるなら、
キュー長(1つまたは複数)が検査され、個々のキュー
長に対応する再生速度が選択される。もちろん、アルゴ
リズム的計算はテーブル・ルックアップに代わって用い
ることができる。このような計算の結果は次の最も低い
タイムスライスまたはユニット値に丸められる。
【0027】図10はアイドル再生方法の一実施例を示
す。この方法へは図4から、または図5からパス129
を経て入る。マシン・ステップ130で、パリティアレ
イがアイドルであるか、およびパリティアレイにおける
トラックが再生を必要としているか否かがチェックされ
る。パリティアレイが現在アイドルでない、あるいはト
ラック再生の必要がないならば、オペレーションはパス
135を経て図5に示した選択方法のような呼び手に戻
る。パリティアレイがアイドルであり、かつ再生が必要
であるとき、マシン・ステップ131でシリンダおよび
そのトラックの1つが再生のために選択される。この選
択は前述の選択方法を用いる。選択および選択されたト
ラックまでのトランスジューサ(図示せず)のシークに
続いて、マシン・ステップ132で、トラック内容を再
生する。次にマシン・ステップ133で、パリティアレ
イが未だアイドルかどうかをチェックし、もしイエスな
ら、さらなる再生が必要でなくなるか、またはパリティ
アレイが使用中になるまで、ステップ131および13
2を繰り返す。その時点で続いて他のマシン・オペレー
ションが行われる。
【0028】図11は日和見的再生方法を示す。トラッ
クアクセス動作がパス139を経て開始される。説明の
ために、次のマシン・ステップ140はアクセスされる
べきトラックからの読出しである。書込み,フォーマッ
ト書込み,検査,消去等のような任意のアクセス動作を
用いることができる。読出し動作であるとすると、マシ
ン・ステップ141で、ハードエラー(訂正不可能)が
発生したか否かを判定する。マシン・ステップ141の
オペレーションに含まれるのは、アクセスされたトラッ
クを含む装置が既に障害を起こしていることが知られ、
その装置に対して再生が行われている、すなわち既に進
行中であることの検出である。もし読出しがハードエラ
ーを引き起こさなかったら、すなわちどんなエラーも検
出されないか、またはエラー訂正が起こらないなら、マ
シン・ステップ142でリードバック・オペレーション
の質をチェックする。訂正されたエラーは繰り返されな
いので、マシン・ステップ142で日和見的再生方法は
呼び出されず、OKであるとして、パス143を経て他
のオペレーションに進むことを選択する。もし、読出し
信号の質と、訂正されたエラーの種類および程度と、シ
ステム要件(アレイにおける冗長度の所望の質)等を評
価することにより判定可能な質的要件が満たされないな
ら、日和見的再生が開始される(ステップ142からN
Oに進む)。マシン・ステップ144で、ハードエラー
を検出するマシン・ステップ141から、またはマシン
・ステップ142から現在アクセス中のトラックの再生
を実施する。再生は上述の再生方法に従って行われる。
マシン・ステップ144でアクセスされたトラックデー
タの再生を完了すると、マシン・ステップ145でパリ
ティアレイがアイドルであるか否かがチェックされる。
もしパリティアレイがアイドルでないならば、他のオペ
レーションが実行される。もしパリティアレイがアイド
ルならば、マシン・ステップ146が次のトラックを再
生する。このような再生はシリンダおよびトラックを選
択し、続いて実際の再生方法を行うことを含んでいる。
マシン・ステップ145および146を、これ以上の再
生が必要でなくなる(ビットマップがすべて0になる)
まで、またはパリティアレイがアクティブになるまで繰
り返す。
【0029】本発明を好適な実施例に関して説明した
が、当業者であれば、本発明の精神および範囲から逸脱
することなく、変形,変更が可能なことは明らかであ
る。
【0030】
【発明の効果】ディスク・ドライブ・アレイにおいて、
障害の発生後も、情報処理のためにアレイを使用しつ
つ、データを再生してフォールト・トレラント状態を回
復することができる。
【図面の簡単な説明】
【図1】本発明による情報処理システムを簡略化して示
した図である。
【図2】図1のディスクドライブ・アレイにおける可変
速度再生の原理を示したグラフである。
【図3】図1のアレイにおけるエラーの検出および再生
のためにシステムの準備を示すマシン・オペレーション
・フローチャートである。
【図4】3つの再生方法および装置のいずれか1つの作
動を示すマシン・オペレーション・フローチャートであ
る。
【図5】再生方法および装置の選択を示す簡略化したマ
シン・オペレーション・フローチャートである。
【図6】本発明を実施する際に用いることができるディ
スク記録表面を示す略図である。
【図7】本発明を実施する際に有用なデータ構造を示す
略図である。
【図8】再生を実施するビットマップ制御を示す図であ
る。
【図9】可変速度方法および装置を用いた再生を示すマ
シン・オペレーション・フローチャートである。
【図10】アレイ・アイドル時間方法および装置を用い
た再生を示すマシン・オペレーション・フローチャート
である。
【図11】日和見的再生方法および装置を用いた再生を
示すマシン・オペレーション・フローチャートである。
【符号の説明】
10 ホストプロセッサ 11 コントローラ 12 ホスト対周辺相互接続部 13,14,15 パリティアレイ 17 コントローラ対周辺装置接続部 20,21,22,23,24 ディスクドライブ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 デイビツド・ウイリアム・パーマー アメリカ合衆国 カリフオルニア州 サン ホセ オマイラ ドライブ 248 (72)発明者 リチヤード・スコツト・トンプソン アメリカ合衆国 カリフオルニア州 サン ホセ デアウエル ウエイ 67

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】エラーの発生したディスクドライブを含む
    複数のディスクドライブの冗長アレイ内でデータを再生
    するマシン実行方法において、 前記複数のディスクドライブの1つにエラーが発生して
    いることを検出および指示するステップと、 前記アレイのマシン・オペレーションの速度を測定およ
    び指示するステップと、 エラーを発生したディスクドライブにより影響を受けた
    データの再生速度であって、前記測定および指示された
    マシン・オペレーションの速度に反比例するように予め
    定められている再生速度を確立するステップと、 前記再生速度で、予め定められたディスクドライブの1
    つにおいてデータを再生し、エラーを含むデータを置換
    するステップと、 を含むことを特徴とする、エラーの発生したディスクド
    ライブを含む複数のディスクドライブの冗長アレイ内で
    データを再生するマシン実行方法。
  2. 【請求項2】前記ディスクドライブのアレイにおいて現
    にアクセスが行われていないことを検出するステップ
    と、 現にアクセスが行われていないことを検出したとき、前
    記エラーを発生したディスクドライブにより影響を受け
    たデータを再生するステップと、をさらに含むことを特
    徴とする、請求項1記載の複数のディスクドライブの冗
    長アレイ内でデータを再生するマシン実行方法。
  3. 【請求項3】ディスクドライブのパリティアレイのフォ
    ールト・トレランスを自動的に維持するマシン実行方法
    において、 前記パリティアレイのフォールト・トレランスの低下を
    検出および指示するステップと、 前記パリティアレイの現情報処理動作を評価および指定
    するステップと、 前記パリティアレイからフォールト・トレランスの低下
    を排除するために、前記パリティアレイに対する複数の
    データ再生方法を確立するステップと、 前記指定されたパリティアレイの現情報処理動作を分析
    し、予め定められた低下レベル以下に、前記現情報処理
    動作の性能を低下させることなく、データ再生を実施す
    る前記複数の再生方法のうちの1つを選択するステップ
    と、を含むことを特徴とする、ディスクドライブのパリ
    ティアレイのフォールト・トレランスを自動的に維持す
    るマシン実行方法。
  4. 【請求項4】前記評価ステップにおいて、情報処理動作
    の速度を判定し、前記情報処理動作の判定された速度に
    対して予め定められた逆比でデータ再生速度を選択する
    ステップと、 パリティアレイ内の予め定められた数のアドレス指定可
    能エラー発生データユニットに関して、前記選択された
    再生速度でデータ再生を実施する可変速度再生方法とし
    て、前記複数の再生方法のうちの1つを確立するステッ
    プと、をさらに含むことを特徴とする、請求項3記載の
    ディスクドライブのパリティアレイのフォールト・トレ
    ランスを自動的に維持するマシン実行方法。
  5. 【請求項5】ディスクドライブのフォールト・トレラン
    ト・パリティアレイにおけるフォールト・トレランスを
    自動的に維持するマシン実行方法において、 パリティアレイがアイドルであることを検出するステッ
    プと、 パリティアレイ・フォールト・トレランスが低下してい
    ることと、データ再生の必要性とを検出するステップ
    と、 データ再生の必要性を識別するステップと、 前記検出されたアイドル時間中に識別された再生の必要
    のあるデータを再生するステップと、を含むことを特徴
    とする、ディスクドライブのフォールト・トレラント・
    パリティアレイにおけるフォールト・トレランスを自動
    的に維持するマシン実行方法。
  6. 【請求項6】ディスクドライブのフォールト・トレラン
    ト・パリティアレイにおけるフォールト・トレランスを
    自動的に維持するマシン実行方法において、 フォールト・トレランスを再確立するために、個々にデ
    ータ再生を必要とする前記パリティアレイの、エラーを
    発生したアドレス指定可能な複数のデータユニットによ
    って、前記パリティアレイのフォールト・トレランスが
    低下したことを指示するステップと、 前記パリティアレイ内のアドレス指定可能なデータユニ
    ットへの、データ領域アクセス動作を実行するステップ
    と、 データ領域アクセスを実行する際、前記データ領域アク
    セスが、データ再生を必要とする、エラーを発生したア
    ドレス指定可能なデータユニットの1つにアクセスする
    ことを検出および指定するステップと、 アクセス中のアドレス指定可能なデータユニットを再生
    するステップと、を含むことを特徴とする、ディスクド
    ライブのフォールト・トレラント・パリティアレイにお
    けるフォールト・トレランスを自動的に維持するマシン
    実行方法。
  7. 【請求項7】ディスク装置の冗長アレイを有する装置に
    おいて、 データ再生を行うことを必要とする1つのディスクドラ
    イブを指示することを含み、冗長アレイのフォールト・
    トレランスの低下を検出および指示する再生必要性評価
    手段と、 前記アレイのマシン・オペレーションの速度を測定およ
    び指示するアクセス速度手段と、 前記評価手段および前記アクセス速度手段に結合され、
    前記フォールト・トレランスの低下から回復させるの
    に、前記アレイに対する再生の予め定められた速度を確
    立および指定するために、前記指示された再生の必要性
    および前記指示されたオペレーション速度に応答する再
    生速度手段と、 複数のデータ再生実施手段を有し、前記再生速度手段お
    よび前記再生必要性評価手段に結合され、前記複数のデ
    ータ再生実施手段の予め定められた1つを用いて前記1
    つのディスクドライブにおけるデータ再生を実施する再
    生手段と、を備えることを特徴とする、ディスク装置の
    冗長アレイを有する装置。
  8. 【請求項8】前記冗長アレイ内のディスクドライブへの
    アクセスを制御し、前記アレイがデータ処理動作のため
    に現在アクセスされていないときを検出および指示する
    制御手段と、前記制御手段,前記再生速度手段,および
    前記再生必要性評価手段に結合された前記再生実施手段
    のうちの第1の再生実施手段であって、再生がスケジュ
    ール可能であることを判定し、当該第1の再生実施手段
    に対して前記冗長アレイへのアクセスを許容するように
    前記制御手段を作動させ、前記予め定められた速度で、
    一連の時間を置いた再生動作を実施するものと、をさら
    に備えることを特徴とする、請求項7記載のディスクド
    ライブの冗長アレイを有する装置。
  9. 【請求項9】前記冗長アレイ内のディスクドライブへの
    アクセスを制御し、前記アレイがデータ処理動作のため
    に現在アクセスされていないときを検出および指示する
    制御手段と、 前記再生実施手段のうちの第2の再生実施手段であっ
    て、前記アレイが現在アクセス中でないことを指示する
    前記制御手段に結合され、アクセス中でないという前記
    指示に応答して、当該第2の再生実施手段に対して前記
    冗長アレイへのアクセスを許容するように前記制御手段
    を作動させ、予め定められたデータ再生を開始するもの
    と、をさらに備えることを特徴とする、請求項7記載の
    ディスクドライブの冗長アレイを有する装置。
  10. 【請求項10】前記冗長アレイ内のディスクドライブへ
    のアクセスを制御し、前記アレイがデータ処理動作のた
    めに現在アクセスされていないときを検出および指示す
    る制御手段と、前記再生必要性評価手段および前記制御
    手段に結合された前記再生実施手段のうちの第3の再生
    実施手段であって、前記再生必要性評価手段により指示
    されたデータ再生を必要とする前記アレイの一定の領域
    に対してアクセスが行われているという指示を受け取
    り、該指示に応答し、前記一定の領域を含む前記冗長ア
    レイの予め定められた領域のデータ再生を実施するもの
    と、を備えることを特徴とする、請求項7記載のディス
    クドライブの冗長アレイを有する装置。
JP4114910A 1991-06-18 1992-05-07 エラーの発生したディスクドライブを含む複数のディスクドライブの冗長アレイ内でデータを再生する方法および装置 Expired - Lifetime JPH0642194B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/717,263 US5278838A (en) 1991-06-18 1991-06-18 Recovery from errors in a redundant array of disk drives
US717263 1991-06-18

Publications (2)

Publication Number Publication Date
JPH05127839A true JPH05127839A (ja) 1993-05-25
JPH0642194B2 JPH0642194B2 (ja) 1994-06-01

Family

ID=24881338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4114910A Expired - Lifetime JPH0642194B2 (ja) 1991-06-18 1992-05-07 エラーの発生したディスクドライブを含む複数のディスクドライブの冗長アレイ内でデータを再生する方法および装置

Country Status (6)

Country Link
US (2) US5278838A (ja)
EP (1) EP0519670A3 (ja)
JP (1) JPH0642194B2 (ja)
KR (1) KR950005222B1 (ja)
BR (1) BR9202158A (ja)
CA (1) CA2066154C (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09288546A (ja) * 1996-04-24 1997-11-04 Nec Corp ディスクアレイ制御装置によるデータ復旧方法
JP2001290746A (ja) * 2000-03-23 2001-10-19 Hewlett Packard Co <Hp> I/o要求に優先順位を与える方法
US6799283B1 (en) 1998-12-04 2004-09-28 Matsushita Electric Industrial Co., Ltd. Disk array device

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2603757B2 (ja) * 1990-11-30 1997-04-23 富士通株式会社 アレ−ディスク装置の制御方法
JP2923702B2 (ja) * 1991-04-01 1999-07-26 株式会社日立製作所 記憶装置及びそのデータ修復方法
US5537566A (en) * 1991-12-17 1996-07-16 Fujitsu Limited Apparatus and method for controlling background processing in disk array device
US5974544A (en) * 1991-12-17 1999-10-26 Dell Usa, L.P. Method and controller for defect tracking in a redundant array
JPH05341918A (ja) * 1992-05-12 1993-12-24 Internatl Business Mach Corp <Ibm> 二重化デイスク記憶装置システムを構成するための接続装置
US5666511A (en) * 1992-10-08 1997-09-09 Fujitsu Limited Deadlock suppressing schemes in a raid system
US5463765A (en) * 1993-03-18 1995-10-31 Hitachi, Ltd. Disk array system, data writing method thereof, and fault recovering method
DE4314491A1 (de) * 1993-05-03 1994-11-10 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Überwachung von aufgezeichneten Daten
GB2278228B (en) * 1993-05-21 1997-01-29 Mitsubishi Electric Corp An arrayed recording apparatus
US7174352B2 (en) 1993-06-03 2007-02-06 Network Appliance, Inc. File system image transfer
US6604118B2 (en) 1998-07-31 2003-08-05 Network Appliance, Inc. File system image transfer
AU682523B2 (en) * 1993-07-01 1997-10-09 Legent Corporation System and method for distributed storage management on networked computer systems
US5392244A (en) * 1993-08-19 1995-02-21 Hewlett-Packard Company Memory systems with data storage redundancy management
JP3172007B2 (ja) * 1993-09-17 2001-06-04 富士通株式会社 ディスク複写処理方式
JP3119978B2 (ja) * 1993-09-22 2000-12-25 株式会社東芝 ファイル記憶装置及びそのファイル管理方法
US5396620A (en) * 1993-12-21 1995-03-07 Storage Technology Corporation Method for writing specific values last into data storage groups containing redundancy
EP1376329A2 (en) * 1994-06-22 2004-01-02 Hewlett-Packard Company, A Delaware Corporation Method of utilizing storage disks of differing capacity in a single storage volume in a hierarchic disk array
US5463776A (en) * 1994-09-22 1995-10-31 Hewlett-Packard Company Storage management system for concurrent generation and fair allocation of disk space among competing requests
US5623595A (en) * 1994-09-26 1997-04-22 Oracle Corporation Method and apparatus for transparent, real time reconstruction of corrupted data in a redundant array data storage system
US5572661A (en) * 1994-10-05 1996-11-05 Hewlett-Packard Company Methods and system for detecting data loss in a hierarchic data storage system
US5615352A (en) * 1994-10-05 1997-03-25 Hewlett-Packard Company Methods for adding storage disks to a hierarchic disk array while maintaining data availability
US5596710A (en) * 1994-10-25 1997-01-21 Hewlett-Packard Company Method for managing roll forward and roll back logs of a transaction object
US5574863A (en) * 1994-10-25 1996-11-12 Hewlett-Packard Company System for using mirrored memory as a robust communication path between dual disk storage controllers
US5664187A (en) * 1994-10-26 1997-09-02 Hewlett-Packard Company Method and system for selecting data for migration in a hierarchic data storage system using frequency distribution tables
US5524204A (en) * 1994-11-03 1996-06-04 International Business Machines Corporation Method and apparatus for dynamically expanding a redundant array of disk drives
US5623598A (en) * 1994-11-22 1997-04-22 Hewlett-Packard Company Method for identifying ways to improve performance in computer data storage systems
US5659704A (en) * 1994-12-02 1997-08-19 Hewlett-Packard Company Methods and system for reserving storage space for data migration in a redundant hierarchic data storage system by dynamically computing maximum storage space for mirror redundancy
DE69523124T2 (de) * 1994-12-15 2002-05-29 Hewlett Packard Co Fehlererkennungssystem für einen gespiegelten Speicher in einer duplizierten Steuerung eines Plattenspeicherungssystems
EP0721162A2 (en) * 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US5568641A (en) * 1995-01-18 1996-10-22 Hewlett-Packard Company Powerfail durable flash EEPROM upgrade
US5553230A (en) * 1995-01-18 1996-09-03 Hewlett-Packard Company Identifying controller pairs in a dual controller disk array
US5644789A (en) * 1995-01-19 1997-07-01 Hewlett-Packard Company System and method for handling I/O requests over an interface bus to a storage disk array
US5548712A (en) * 1995-01-19 1996-08-20 Hewlett-Packard Company Data storage system and method for managing asynchronous attachment and detachment of storage disks
US5553238A (en) * 1995-01-19 1996-09-03 Hewlett-Packard Company Powerfail durable NVRAM testing
US5651133A (en) * 1995-02-01 1997-07-22 Hewlett-Packard Company Methods for avoiding over-commitment of virtual capacity in a redundant hierarchic data storage system
US5666512A (en) * 1995-02-10 1997-09-09 Hewlett-Packard Company Disk array having hot spare resources and methods for using hot spare resources to store user data
US5542065A (en) * 1995-02-10 1996-07-30 Hewlett-Packard Company Methods for using non-contiguously reserved storage space for data migration in a redundant hierarchic data storage system
US5537534A (en) * 1995-02-10 1996-07-16 Hewlett-Packard Company Disk array having redundant storage and methods for incrementally generating redundancy as data is written to the disk array
US5604902A (en) * 1995-02-16 1997-02-18 Hewlett-Packard Company Hole plugging garbage collection for a data storage system
JP3358687B2 (ja) * 1995-03-13 2002-12-24 株式会社日立製作所 ディスクアレイ装置
US5592612A (en) * 1995-04-28 1997-01-07 Birk; Yitzhak Method and apparatus for supplying data streams
US5574855A (en) * 1995-05-15 1996-11-12 Emc Corporation Method and apparatus for testing raid systems
US5649093A (en) * 1995-05-22 1997-07-15 Sun Microsystems, Inc. Server disk error recovery system
US5680539A (en) * 1995-07-11 1997-10-21 Dell Usa, L.P. Disk array system which performs data reconstruction with dynamic load balancing and user-specified disk array bandwidth for reconstruction operation to maintain predictable degradation
JPH0982039A (ja) * 1995-09-18 1997-03-28 Sony Corp 情報記録方法および追記型光ディスク記録方法
US5892775A (en) * 1995-12-27 1999-04-06 Lucent Technologies Inc. Method and apparatus for providing error-tolerant storage of information
US5790773A (en) * 1995-12-29 1998-08-04 Symbios, Inc. Method and apparatus for generating snapshot copies for data backup in a raid subsystem
US5832198A (en) * 1996-03-07 1998-11-03 Philips Electronics North America Corporation Multiple disk drive array with plural parity groups
CA2201679A1 (en) 1996-04-15 1997-10-15 Raju C. Bopardikar Video data storage
GB2312319B (en) 1996-04-15 1998-12-09 Discreet Logic Inc Video storage
US6055577A (en) * 1996-05-06 2000-04-25 Oracle Corporation System for granting bandwidth for real time processes and assigning bandwidth for non-real time processes while being forced to periodically re-arbitrate for new assigned bandwidth
US5764880A (en) * 1996-09-10 1998-06-09 International Business Machines Corporation Method and system for rebuilding log-structured arrays
US5956473A (en) * 1996-11-25 1999-09-21 Macronix International Co., Ltd. Method and system for managing a flash memory mass storage system
US6038665A (en) * 1996-12-03 2000-03-14 Fairbanks Systems Group System and method for backing up computer files over a wide area computer network
US5794254A (en) * 1996-12-03 1998-08-11 Fairbanks Systems Group Incremental computer file backup using a two-step comparison of first two characters in the block and a signature with pre-stored character and signature sets
US5968182A (en) * 1997-05-12 1999-10-19 International Business Machines Corporation Method and means for utilizing device long busy response for resolving detected anomalies at the lowest level in a hierarchical, demand/response storage management subsystem
US6092215A (en) * 1997-09-29 2000-07-18 International Business Machines Corporation System and method for reconstructing data in a storage array system
US6112255A (en) * 1997-11-13 2000-08-29 International Business Machines Corporation Method and means for managing disk drive level logic and buffer modified access paths for enhanced raid array data rebuild and write update operations
US6098114A (en) 1997-11-14 2000-08-01 3Ware Disk array system for processing and tracking the completion of I/O requests
US6219751B1 (en) 1998-04-28 2001-04-17 International Business Machines Corporation Device level coordination of access operations among multiple raid control units
JP2000003255A (ja) * 1998-06-12 2000-01-07 Nec Corp ディスクアレイ装置
US6119244A (en) 1998-08-25 2000-09-12 Network Appliance, Inc. Coordinating persistent status information with multiple file servers
US7308699B1 (en) * 1998-09-15 2007-12-11 Intel Corporation Maintaining access to a video stack after an application crash
JP2000149435A (ja) * 1998-11-12 2000-05-30 Nec Corp 磁気ディスク装置及びこれを用いた映像記録再生装置
JP2001006294A (ja) * 1999-06-17 2001-01-12 Matsushita Electric Ind Co Ltd リアルタイムデータ記録方法および装置
US6467047B1 (en) * 1999-07-30 2002-10-15 Emc Corporation Computer storage system controller incorporating control store memory with primary and secondary data and parity areas
US6516425B1 (en) * 1999-10-29 2003-02-04 Hewlett-Packard Co. Raid rebuild using most vulnerable data redundancy scheme first
JP2001166887A (ja) * 1999-12-08 2001-06-22 Sony Corp データ記録再生装置及びデータ記録再生方法
US7509420B2 (en) * 2000-02-18 2009-03-24 Emc Corporation System and method for intelligent, globally distributed network storage
US7194504B2 (en) * 2000-02-18 2007-03-20 Avamar Technologies, Inc. System and method for representing and maintaining redundant data sets utilizing DNA transmission and transcription techniques
US6704730B2 (en) 2000-02-18 2004-03-09 Avamar Technologies, Inc. Hash file system and method for use in a commonality factoring system
US7062648B2 (en) * 2000-02-18 2006-06-13 Avamar Technologies, Inc. System and method for redundant array network storage
US6826711B2 (en) 2000-02-18 2004-11-30 Avamar Technologies, Inc. System and method for data protection with multidimensional parity
GB0008319D0 (en) * 2000-04-06 2000-05-24 Discreet Logic Inc Image processing
US7386610B1 (en) 2000-09-18 2008-06-10 Hewlett-Packard Development Company, L.P. Internet protocol data mirroring
US6804819B1 (en) 2000-09-18 2004-10-12 Hewlett-Packard Development Company, L.P. Method, system, and computer program product for a data propagation platform and applications of same
US6977927B1 (en) 2000-09-18 2005-12-20 Hewlett-Packard Development Company, L.P. Method and system of allocating storage resources in a storage area network
US6952797B1 (en) 2000-10-25 2005-10-04 Andy Kahn Block-appended checksums
EP1204027A2 (en) * 2000-11-02 2002-05-08 Matsushita Electric Industrial Co., Ltd. On-line reconstruction processing method and on-line reconstruction processing apparatus
US6810398B2 (en) * 2000-11-06 2004-10-26 Avamar Technologies, Inc. System and method for unorchestrated determination of data sequences using sticky byte factoring to determine breakpoints in digital sequences
US6941490B2 (en) * 2000-12-21 2005-09-06 Emc Corporation Dual channel restoration of data between primary and backup servers
US6606690B2 (en) 2001-02-20 2003-08-12 Hewlett-Packard Development Company, L.P. System and method for accessing a storage area network as network attached storage
US6802023B2 (en) 2001-03-15 2004-10-05 Hewlett-Packard Development Company, L.P. Redundant controller data storage system having hot insertion system and method
US6715101B2 (en) 2001-03-15 2004-03-30 Hewlett-Packard Development Company, L.P. Redundant controller data storage system having an on-line controller removal system and method
US6708285B2 (en) 2001-03-15 2004-03-16 Hewlett-Packard Development Company, L.P. Redundant controller data storage system having system and method for handling controller resets
GB2374749B (en) * 2001-04-20 2005-04-06 Discreet Logic Inc Image data processing
US7017107B2 (en) 2001-04-30 2006-03-21 Sun Microsystems, Inc. Storage array employing scrubbing operations at the disk-controller level
US6854071B2 (en) 2001-05-14 2005-02-08 International Business Machines Corporation Method and apparatus for providing write recovery of faulty data in a non-redundant raid system
US6959399B2 (en) * 2001-09-24 2005-10-25 International Business Machines Corporation Selective automated power cycling of faulty disk in intelligent disk array enclosure for error recovery
US6976187B2 (en) * 2001-11-08 2005-12-13 Broadcom Corporation Rebuilding redundant disk arrays using distributed hot spare space
US20030095793A1 (en) * 2001-11-21 2003-05-22 Strothmann James Alan System and method for automatically refreshing data
US6857001B2 (en) * 2002-06-07 2005-02-15 Network Appliance, Inc. Multiple concurrent active file systems
US7024586B2 (en) * 2002-06-24 2006-04-04 Network Appliance, Inc. Using file system information in raid data reconstruction and migration
US7139931B2 (en) * 2002-08-19 2006-11-21 Aristos Logic Corporation Method of controlling the system performance and reliability impact of hard disk drive rebuild
JP3778171B2 (ja) * 2003-02-20 2006-05-24 日本電気株式会社 ディスクアレイ装置
US9489150B2 (en) 2003-08-14 2016-11-08 Dell International L.L.C. System and method for transferring data between different raid data storage types for current data and replay data
CN101566931B (zh) 2003-08-14 2011-05-18 克姆佩棱特科技公司 虚拟磁盘驱动系统和方法
US7428691B2 (en) * 2003-11-12 2008-09-23 Norman Ken Ouchi Data recovery from multiple failed data blocks and storage units
US7185222B2 (en) * 2003-11-14 2007-02-27 International Business Machines Corporation Apparatus, system, and method for maintaining data in a storage array
US7409582B2 (en) * 2004-05-06 2008-08-05 International Business Machines Corporation Low cost raid with seamless disk failure recovery
US8601035B2 (en) 2007-06-22 2013-12-03 Compellent Technologies Data storage space recovery system and method
US20060075281A1 (en) * 2004-09-27 2006-04-06 Kimmel Jeffrey S Use of application-level context information to detect corrupted data in a storage system
JP2006107351A (ja) * 2004-10-08 2006-04-20 Fujitsu Ltd データ移行方法、記憶装置及びプログラム
US7574623B1 (en) 2005-04-29 2009-08-11 Network Appliance, Inc. Method and system for rapidly recovering data from a “sick” disk in a RAID disk group
US7587630B1 (en) 2005-04-29 2009-09-08 Network Appliance, Inc. Method and system for rapidly recovering data from a “dead” disk in a RAID disk group
US7490263B2 (en) * 2006-01-17 2009-02-10 Allen King Apparatus, system, and method for a storage device's enforcing write recovery of erroneous data
US7650352B2 (en) * 2006-03-23 2010-01-19 International Business Machines Corporation System and method for increasing availability of an index
WO2007131190A2 (en) 2006-05-05 2007-11-15 Hybir Inc. Group based complete and incremental computer file backup system, process and apparatus
EP2357552A1 (en) 2006-05-24 2011-08-17 Compellent Technologies System and method for RAID management, reallocation and restriping
US7624300B2 (en) * 2006-12-18 2009-11-24 Emc Corporation Managing storage stability
US8201018B2 (en) * 2007-09-18 2012-06-12 Hewlett-Packard Development Company, L.P. Control of sparing in storage systems
US8060772B2 (en) * 2008-01-04 2011-11-15 International Business Machines Corporation Storage redundant array of independent drives
US20090265510A1 (en) * 2008-04-17 2009-10-22 Dell Products L.P. Systems and Methods for Distributing Hot Spare Disks In Storage Arrays
JP2010009442A (ja) * 2008-06-30 2010-01-14 Fujitsu Ltd ディスクアレイシステム、ディスク制御装置及びその再構築処理方法
US8468292B2 (en) 2009-07-13 2013-06-18 Compellent Technologies Solid state drive data storage system and method
US8745170B2 (en) * 2009-08-27 2014-06-03 Apple Inc. Dynamic file streaming
US9411682B2 (en) * 2010-01-14 2016-08-09 Hewlett Packard Enterprise Development Lp Scrubbing procedure for a data storage system
US20180365105A1 (en) 2014-06-05 2018-12-20 International Business Machines Corporation Establishing an operation execution schedule in a dispersed storage network
US11429486B1 (en) 2010-02-27 2022-08-30 Pure Storage, Inc. Rebuilding data via locally decodable redundancy in a vast storage network
US8458513B2 (en) 2010-07-30 2013-06-04 Hewlett-Packard Development Company, L.P. Efficient failure recovery in a distributed data storage system
US8782339B2 (en) * 2010-10-11 2014-07-15 Open Invention Network, Llc Storage system having cross node data redundancy and method and computer readable medium for same
US8751861B2 (en) 2012-02-08 2014-06-10 Lsi Corporation System and method for improved rebuild in RAID
US9146851B2 (en) 2012-03-26 2015-09-29 Compellent Technologies Single-level cell and multi-level cell hybrid solid state drive
US8892939B2 (en) 2012-11-21 2014-11-18 Hewlett-Packard Development Company, L.P. Optimizing a RAID volume
US9424132B2 (en) * 2013-05-30 2016-08-23 International Business Machines Corporation Adjusting dispersed storage network traffic due to rebuilding
US20150089328A1 (en) * 2013-09-23 2015-03-26 Futurewei Technologies, Inc. Flex Erasure Coding of Controllers of Primary Hard Disk Drives Controller
US9530010B2 (en) * 2013-11-07 2016-12-27 Fujitsu Limited Energy usage data management
US9396068B2 (en) 2014-04-17 2016-07-19 International Business Machines Corporation Adaptive rebuild scheduling scheme
US9793922B2 (en) * 2015-09-25 2017-10-17 HGST Netherlands B.V. Repair-optimal parity code
KR102580123B1 (ko) 2016-05-03 2023-09-20 삼성전자주식회사 Raid 스토리지 장치 및 그것의 관리 방법
KR102611571B1 (ko) 2016-11-09 2023-12-07 삼성전자주식회사 비휘발성 메모리를 포함하는 raid 시스템
US10884861B2 (en) 2018-11-29 2021-01-05 International Business Machines Corporation Write-balanced parity assignment within a cluster
US10866861B1 (en) 2019-08-29 2020-12-15 Micron Technology, Inc. Deferred error-correction parity calculations
US11210183B2 (en) * 2020-01-14 2021-12-28 Western Digital Technologies, Inc. Memory health tracking for differentiated data recovery configurations
US11334434B2 (en) 2020-02-19 2022-05-17 Seagate Technology Llc Multi-level erasure system with cooperative optimization
US11372553B1 (en) 2020-12-31 2022-06-28 Seagate Technology Llc System and method to increase data center availability using rack-to-rack storage link cable
CN114816221A (zh) * 2021-01-22 2022-07-29 伊姆西Ip控股有限责任公司 存储管理方法、设备和计算机程序产品
US11593237B2 (en) 2021-05-28 2023-02-28 International Business Machines Corporation Fast recovery with enhanced raid protection

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4092732A (en) * 1977-05-31 1978-05-30 International Business Machines Corporation System for recovering data stored in failed memory unit
US4855907A (en) * 1985-08-01 1989-08-08 International Business Machines Corporation Method for moving VSAM base clusters while maintaining alternate indices into the cluster
US4761785B1 (en) * 1986-06-12 1996-03-12 Ibm Parity spreading to enhance storage access
US4775978A (en) * 1987-01-12 1988-10-04 Magnetic Peripherals Inc. Data error correction system
CA1296103C (en) * 1987-06-02 1992-02-18 Theodore Jay Goodlander High-speed, high capacity, fault-tolerant, error-correcting storage system
US4870643A (en) * 1987-11-06 1989-09-26 Micropolis Corporation Parallel drive array storage system
US5101492A (en) * 1989-11-03 1992-03-31 Compaq Computer Corporation Data redundancy and recovery protection
US5195100A (en) * 1990-03-02 1993-03-16 Micro Technology, Inc. Non-volatile memory storage of write operation identifier in data sotrage device
US5208813A (en) * 1990-10-23 1993-05-04 Array Technology Corporation On-line reconstruction of a failed redundant array system
US5179704A (en) * 1991-03-13 1993-01-12 Ncr Corporation Method and apparatus for generating disk array interrupt signals

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09288546A (ja) * 1996-04-24 1997-11-04 Nec Corp ディスクアレイ制御装置によるデータ復旧方法
US6799283B1 (en) 1998-12-04 2004-09-28 Matsushita Electric Industrial Co., Ltd. Disk array device
JP2001290746A (ja) * 2000-03-23 2001-10-19 Hewlett Packard Co <Hp> I/o要求に優先順位を与える方法

Also Published As

Publication number Publication date
JPH0642194B2 (ja) 1994-06-01
CA2066154C (en) 1996-01-02
BR9202158A (pt) 1993-02-02
EP0519670A3 (en) 1993-03-03
KR950005222B1 (ko) 1995-05-22
EP0519670A2 (en) 1992-12-23
CA2066154A1 (en) 1992-12-19
USRE36846E (en) 2000-08-29
KR930001044A (ko) 1993-01-16
US5278838A (en) 1994-01-11

Similar Documents

Publication Publication Date Title
JPH05127839A (ja) エラーの発生したデイスクドライブを含む複数のデイスクドライブの冗長アレイ内でデータを再生する方法および装置
US6289484B1 (en) Disk drive employing off-line scan to collect selection-control data for subsequently deciding whether to verify after write
US6223252B1 (en) Hot spare light weight mirror for raid system
US7143305B2 (en) Using redundant spares to reduce storage device array rebuild time
US5566316A (en) Method and apparatus for hierarchical management of data storage elements in an array storage device
JP3201616B2 (ja) ディスク・ドライブ・アレイのデータ再生チャネル
US5088081A (en) Method and apparatus for improved disk access
US5402428A (en) Array disk subsystem
US5588012A (en) Apparatus and method for ensuring data in external storage system
JP2501752B2 (ja) コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法
US7640452B2 (en) Method for reconstructing data in case of two disk drives of RAID failure and system therefor
US6922801B2 (en) Storage media scanner apparatus and method providing media predictive failure analysis and proactive media surface defect management
EP0936534A2 (en) Recording device
TWI258661B (en) Efficient media scan operations for storage systems
JPH0773602A (ja) 光ディスク装置
US6950900B1 (en) Method and apparatus for migrating data having a format of a first type to a format of a second type
JPH08194586A (ja) データ処理方法、システムおよび装置
JPS6363169A (ja) 交代記録方法
US6493160B1 (en) Pseudo raid implementation within a single disk drive
US6941488B2 (en) Retrieval of a single complete copy from multiple stored copies of information
US20100005374A1 (en) Ensuring Data Consistency
JPH06111479A (ja) 情報記録再生装置
JPH02291011A (ja) 記憶装置
JPH03292525A (ja) 集合ディスク装置
US8027120B2 (en) Magnetic tape device and data recording method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090601

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100601

Year of fee payment: 16

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110601

Year of fee payment: 17

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120601

Year of fee payment: 18

EXPY Cancellation because of completion of term