JPH0731579B2 - Dasdアレイの階層を管理する方法および装置 - Google Patents

Dasdアレイの階層を管理する方法および装置

Info

Publication number
JPH0731579B2
JPH0731579B2 JP4132613A JP13261392A JPH0731579B2 JP H0731579 B2 JPH0731579 B2 JP H0731579B2 JP 4132613 A JP4132613 A JP 4132613A JP 13261392 A JP13261392 A JP 13261392A JP H0731579 B2 JPH0731579 B2 JP H0731579B2
Authority
JP
Japan
Prior art keywords
array
logical
dasd
data
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4132613A
Other languages
English (en)
Other versions
JPH0744322A (ja
Inventor
ジャイシャンカー・モーザダス・メノン
レイトン・クリストファー・ウッド、ジュニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0744322A publication Critical patent/JPH0744322A/ja
Publication of JPH0731579B2 publication Critical patent/JPH0731579B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1045Nested RAID, i.e. implementing a RAID scheme in another RAID scheme

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、DASDアレイ記憶サ
ブシステムに関し、特に正常(耐故障)モード、劣化モ
ードおよびレビルト(再構成)・モードにおいて大小の
DASDアレイ読出し/書込みを効率的に処理するため
の方法および装置に関する。
【0002】
【従来の技術】
(RAID3アレイおよび冗長性)RAID3は、デー
タ+パリティがNデータ+PパリティDASDに跨って
同期的に散布されるDASDアレイを示す。即ち、デー
タはセグメント化されて少なくともN+P個のDASD
の1つのアレイに跨ってカラム(列)順に書込み(スト
ライプ)される。これは、Patterson等の「廉
価ディスクの冗長アレイ(RAID)に対するケース
(A Case For RedundantArra
ys Of Inexpensive Disks)」
(レポート第UCB/CSD87/391号、1987
年12月;Computer Science Div
ision,U.of California,Ber
keley)により提示される類型と一致する。
【0003】多数のDASDにまたがるデータのパリテ
ィ・コーディングおよびストライピングおよび単一のD
ASD故障後のデータの再構成については、1978年
5月30日発行のOuchi等の米国特許第4,09
2,732号「故障した記憶装置に記憶されたデータの
復元システム(System for Recover
ing Data Stored in a Fail
ed Memory Unit)」により紹介された。
また、フォーマットされた予約スペアの「ホット・スペ
アリング」による故障DASDの置換については、A.
Park等の「並列の2次記憶システムにおける耐故障
性の提供(Providing Fault Tole
rance in Parallel Seconda
ry Storage Systems)」(Dep
t. Computer Science,Princ
eton U.、レポート第CS−TR−057−86
号、1986年11月7日)により単一パリティ領域に
対して記載されている。同様に、複数パリティ領域の動
的構成および複数領域におけるフォーマット化スペアの
共有については、1990年4月3日発行のDunph
y等の米国特許第4,914,656号「ディスク・ド
ライブ・メモリー(Disk Drive Memor
y)」により教示されている。
【0004】RAID3アレイは、パリティ・コード化
されたセグメント化データのN+P個のDASDに対す
る読出し/書込みを同期的に行うため、データ速度が単
一DASD速度のN倍に増加する。また、論理トラック
・サイズも、単一DASDトラック長さのN倍に増加す
る。PパリティDASDは、例え1つ以上のDASDが
故障しても(劣化モード)、アレイが動作を継続するこ
とを許容する。故障限度は、パリティ・コーディングお
よびその実行時処理、スペア記憶容量、スペアにおいて
逸失データを再構成するのに利用可能な時間、複数の同
時故障の可能性、などの諸特性に基く。多数のアレイで
高々2つのネスト関係にないDASD故障が前提とな
る。
【0005】DASDの数を増加すると、アレイ故障間
の平均時間が減少する。しかし、パリティ・コーディン
グおよびスペアリングの如き冗長性を用いると、システ
ムが残留データから逸失データを再計算し、置換DAS
Dにこのデータを再書込みして再生するので、データの
不可用間平均時間が増加する。
【0006】(単一DASD故障に対するRAID3劣
化モードおよびデータ再構成)P=1である劣化モード
において、パリティDASDが利用できない場合、それ
にも拘わらずデータは一時にNブロックずつN個のデー
タDASDからアクセス可能である。データDASDの
1つが故障したものであれば、同じストライプまたはセ
ットから残りのブロックを論理的に組合わせることによ
り、照会された各ストライプまたは注文されたセグメン
トセットから逸失ブロックを再構成することが必要であ
る。この操作は各アクセス毎に行わねばならないため、
1つのパリティまたはデータ・ブロックの復元が稼働状
態のアレイ・コントローラ内部で行うことができる故に
処理能力は低下しない。このモードで動作中に別の故障
が生じることによる、全アレイ・データの不可用度のリ
スクは受入れ得ない。2つ以上の故障が生じる場合にア
レイ・アクセスを許容する別の方法は、P≧2でデータ
をパリティ・コード化するか、あるいはデータをスペア
または交換DASD上に再構成することである。
【0007】フォーマット化されたスペアDASDが故
障したDASDと交換され、データが再構成されてこの
スペアに再書込みされる(再構成モード)とき、処理能
力はその正常な速度まで戻る。アレイは、劣化モードか
ら正常な(耐故障)モードへ変化すると言われる。逸失
データの再構成およびスペアDASDへの再書込みが予
定ベースまたは便宜的ベースで行われることを知るべき
である。
【0008】同時に2つまでのDASDが故障する場合
は、データの再構成は1991年2月11日出願のBl
aumの係属中の米国特許出願第07/633,596
号「DASDアレイにおける2つまでの使用不能DAS
Dのデータ内容のコード化および再構成のための方法お
よび装置(Method and Means for
Encoding and Rebuilding
Data Contents of Up to Tw
o Unavailable DASDs in an
Array of DASDs)」に開示されたブロ
ック・パリティ・コーディング(IBM参照番号:SA
9−90−055)、あるいは1991年6月21日出
願のBlaumおよびRothの米国特許出願「DAS
Dアレイにおける少数の使用不能DASDの存在時の使
用不能DASDのデータ内容のコーディングおよび再構
成、あるいはエラー状態の1つのDASDの内容を再構
成するための方法および装置(Method and
Means for Coding and Rebu
ilding the Date Contents
of Unavailable DASDs or R
ebuildingthe Contents of
One DASD in Error in the
Presence of Reduced Numbe
r ofUnavailable DASDs in
a DASD Array)」(IBM参照番号:SA
9−91−038)の如きより強力なコード化方法およ
び装置の使用を必要とする。
【0009】(本発明に対する異なる定義によるRAI
D5アレイ)RAID5アレイは、N個のDASDの同
期セットにわたりデータおよびパリティを分散する。P
attersonは、同期DASDセットにおける2つ
以上のDASDにパリティを記録するに過ぎないものと
してRAID5を定義する。
【0010】本発明の目的のためには、RAID5のD
ASDアレイは、アクセスの同時発生およびデータ速度
がインターリーブの深さのトレードオフ関数である一般
的な制御装置によりアクセス可能なDASDアレイとし
て定義される。インターリーブの深さは、更に、アレイ
中の次のDASDに継続する前にDASDに記憶される
論理トラックの連続ブロック数として定義される。
【0011】あるいはまた、RAID5アレイは、選択
可能なインターリーブ深さがストライピングを制御しP
≧0である任意のNデータ+PパリティDASDアレイ
である。
【0012】潤沢な例示は、1990年5月24日出願
のBrady等の係属中の米国特許出願第07/52
8,999号「同調データ転送速度および同時性を持つ
DASDアレイをアクセスする方法および装置(Met
hod and Meansfor Accessin
g DASD Arrays With TunedD
ata Transfer Rate and Con
currency)」(IBM参照番号:SA9−89
−028)において詳細に記述されている。
【0013】最大の同時発生に対しては、Nアレイにお
ける各DASDは論理的に独立したプロセスにより同時
にアクセスされることになる。プロセス当りのデータ速
度は単一のDASDのそれに制限されよう。これは、照
会されるデータが行主体の順に対応DASDに対して書
込まれたことを前提とする。一方、最大データ速度に対
しては、N個全てのDASDが1つのプロセスによりア
クセスされることになる。これと関連して、各論理レコ
ードが列主体の順に書込まれることになる。
【0014】完全を期せば、列主体の順序(時に、列ト
ラック・レイアウトと呼ばれる)は1のインターリーブ
深さを有する。対照的に、行主体の順序(時に、行トラ
ック・レイアウトと呼ばれる)は1つのDASDの物理
トラックにおけるブロック数Kと等しいインターリーブ
深さを呈する。
【0015】(大小の読出しおよび書込み)大量の逐次
データの転送を要求する、記憶サブシステム(DASD
アレイ)に対するCPU要求は、「大きな要求」または
「大きな転送」と呼ばれる。少量のデータに対する要求
は、「小さな要求」または「小さな転送」と呼ばれる。
RAID3アレイは、数値重点の計算などと関連する大
きな要求に対して最も効率的である。対照的に、RAI
D5アレイは、インターリーブ深さ≧2である時のよう
な同時性によるトランザクション処理において見出され
る小さな要求をサポートし得る。また、RAID5は、
DASD当りの作業ロードを均衡化し、増加する処理オ
ーバーヘッドに伴う高い可用度およびDASDの利用を
維持するため、データ、パリティおよびスペア能力の拡
張を可能にする。
【0016】読出し要求は、DASDにおけるアクセス
・アームの位置決め、および通常のバッファに対するア
レイからのデータ複写および時にはパリティの検査を必
要とする。書込み要求、特に書込み更新要求は、幾つか
の操作を必要とする。これらには、古いデータ+パリテ
ィの読出し、古いデータ+新しいデータ+古いパリティ
から新しいパリティの計算、および新しいデータ+新し
いパリティの書戻しを含む。これは、書込み更新毎に少
なくとも2つの読出しおよび2つのアクセスを必要とす
る。
【0017】
【課題を解決するための手段】本発明の目的は、記憶サ
ブシステムに関して大小の読出し/書込みを処理する方
法および装置の提供にある。
【0018】別の目的は、高レベルRAIDアレイの同
時性および低レベルRAIDアレイのデータ速度を提供
する方法および装置の提供にある。
【0019】更に別の目的は、アレイが劣化モードおよ
び再構成モードで作動される時前記方法および装置が最
小限の分散を提供することである。
【0020】本発明の関連する目的は、同時性およびデ
ータ速度および劣化モードおよび再構成モード能力を保
持しながら、異なるインターリーブ深さのアレイが共通
経路を介してアクセスされる方法および装置の提供にあ
る。
【0021】上記の目的は、RAID3のDASDアレ
イのRAID5アレイとして、複数のDASDのサブセ
ットをアクセスするアドレス指定の間接化の少なくとも
1つの層の挿入を用いる実施例により満たされる。この
実施例は、耐故障、劣化または再構成のモードのいずれ
でも使用可能である。
【0022】耐故障モード(正常モード)において、本
方法および装置は、サブシステムを論理デバイスのRA
ID5アレイに構成することを含み、RAID5アレイ
は少なくとも1つのスペア論理デバイスを含み、各論理
デバイスは更にRAID3のDASDアレイを含み、R
AID5論理デバイスに対して列主体の順序で予め定め
たインターリーブ深さにパリティ・コード化およびセグ
メント化された論理レコードを書込み、各論理レコード
をN+Pセグメント化ブロックとして対応するRAID
3アレイのN+P個のDASDに対してアクセスするこ
とを含む。
【0023】あるいは、前記構成ステップは、N+Pア
ドレス指定可能な故障とは独立なDASDストリングの
各々から選択された、ただ1つのDASDから形成され
る論理RAID3アレイの形成を含む。
【0024】故障したDASDを含む(劣化モード)論
理デバイスのアクセスが行われる場合、本方法は、対応
するN+P−1個のDASDからN+P−1ブロックを
同時にアクセスすることを含む。好都合にも、正常モー
ドへ戻るため必要なスペア論理デバイスの再構成および
再書込みは、故障したDASDを含むスペアおよび論理
デバイスのみに及んでいる。
【0025】
【実施例】
(RAID5の行および列のレイアウト)まず図1にお
いて、従来技術によるN個のDASDの同期アレイが示
される。このアレイにおいては、1つのレコードのブロ
ックは、係属中のBrady等の米国特許出願の方法で
パリティ・ブロックを常に含むN番目のDASDを伴っ
て列主体の順序で書込まれる。好都合なことに、データ
速度は、1つのDASDの転送速度のN−1倍増加さ
れ、大きな読出し/書込みが必要な場合に用いることが
できる。換言すれば、論理レコードがN+P個のDAS
Dの同期アレイに一時にN+Pブロック書込まれたなら
ば、データ速度は単一DASD速度のN倍となる。
【0026】先に述べたように、図1において論理DA
SDとも呼ばれるDASDアレイの故障(MTBF)
は、個々の物理DASDのそれより遥かに多い。指摘し
た様に、RAID3アレイは、アレイを構成する個々の
DASDの1つの故障後でも、劣化モードにおいて動作
し続けることができる。これは、故障したDASDにお
けるデータが故障しなかった残りのN−1個のDASD
におけるデータおよびパリティから再現できる故であ
る。
【0027】前記アレイは通常は正常モードで動作す
る。アレイ中の1つのDASDが故障した時、このアレ
イは劣化モードで動作する。故障したDASDがスペア
で置換されると、アレイはデータがスペアに対して完全
に再構成されるまで再構成モードで動作する。
【0028】再構成は、典型的には、アレイに対する他
のユーザ・アクティビティと並行して進行するので、再
構成モードでのアレイの性能は正常又は劣化モードにお
けるよりも悪い。劣化モードにおけるRAID3アレイ
の性能は正常モードにおけるより悪化しないことに注意
されたい。
【0029】次に図2には、1Kバイトのブロックでイ
ンターリーブするブロックを用いるRAID5 DAS
Dアレイが示される。物理トラック当たりK個のブロッ
クでN個のDASDを持つ1つのRAID5アレイの場
合、論理トラックは(N−1)個のブロックがデータ・
ブロックであり、のこりのKブロックがパリティ・ブロ
ックであるNK個のブロックを有する。図2において、
1つの論理トラックが示される。予め定めた数の論理ト
ラックが1つの論理シリンダを構成する。以下に述べる
本発明は、多数のブロック、トラックおよびシリンダの
論理デバイス(時に、論理DASDと呼ばれる)をアド
レス指定してこのアドレスを実際のDASDアレイの記
憶を向かい会う状態でマップする能力に含まれる原理を
利用する。
【0030】再び図2において、論理トラックにおける
データがどのように記憶されるかについて考察しよう。
データの最初のKバイトは、DASD1の最初のブロッ
ク(ブロック1)に完全に記憶され、データの2番目の
KバイトはDASD2の最初のブロック(ブロック2)
に、、、というように記憶される。レコーディングのパ
ターンは、論理トラックの連続する順次ブロックが列内
に記憶されるため、論理アレイの列トラック・レイアウ
トまたは列主体の配列と種々に呼ばれる。パリティ・ブ
ロックは、1つのDASDがパリティ・ブロックを含ま
ないようにDASD上に分散されることに注意された
い。
【0031】次に、データの1Kバイトをアクセスする
には、DASDの1つに対するアクセスを要するのみ
で、他のDASDは他の小さな転送を自由に取扱う。そ
の結果、小さな転送に対して高度の並行化が可能であ
る。同時に、大きな転送時に読出しあるいは書込みされ
るデータが全て並行に読出しまたは書込みができるN個
のDASDに分散されるため、大きな転送において高い
データ速度が達成可能である。
【0032】次に図3には、RAID5のDASDアレ
イに対する別のタイプのトラック・レイアウトが示され
る。前のように、このアレイは、N個のDASD、物理
トラック当たりK個のブロック、また論理トラック当た
りNK個のブロックを有する。しかし、列トラックのレ
イアウトとは異なり、論理トラックの連続ブロックは、
列に沿ってではなく、物理トラックに沿って(行の順
に)記憶される。図3に示される論理トラック(例え
ば、論理トラック1)の場合、全てのパリティはDAS
D Nの物理トラックに記憶される。従って、論理トラ
ック2(図には示さない)の場合は、全てのパリティを
DASD N−1に記憶し、論理トラック3の場合は、
全てのパリティはDASD N−2に記憶し、、、のよ
うに選定する。このため、列トラック・レイアウトのよ
うに、パリティは全てのDASD間に分散され、1つの
パリティDASDは存在しない。
【0033】RAID5アレイの主な短所の1つは、1
つのブロックを更新するために4つのアクセスが必要で
あることである。例えば、図3において、ブロック1の
更新はブロック1およびNから古い値を読出し、古いデ
ータ、古いパリティおよび新しいデータをXORするこ
とにより新しいパリティを計算し、次いで新しいデータ
をブロック1に、また新しいパリティをブロックNに書
込むことを必要とする。1回の更新を完了するため必要
なDASDアクセス数は、RAID5アレイの性能に著
しく影響を及ぼすことがあり得る。
【0034】(本発明がRAID5の制約を回避する方
法)次に図4において、基本的なビルディング・ブロッ
クとしてRAID3 DASDアレイが示される.例え
ば、4×2.5″形態係数のDASDが、望ましくは3
+PのRAID3アレイとして構成された単一の論理デ
バイスとして見えるように一体に物理的にパッケージさ
れる。この論理デバイスはまた、耐故障ドロワーとなる
別個のドロワー(必ずしも必要ではないが)としてパッ
ケージすることもできる。このような論理デバイスに対
する書込みは、書込まれるブロックをストライプさせて
3つの異なるDASDにわたって書込ませ、パリティを
生成させると同時に、パリティDASDである4番目の
DASDに対して書込ませることになる。1つの論理ブ
ロックは、3つの異なるDASDに3つの物理ブロック
として書込まれ、この論理ブロック・サイズは物理ブロ
ック・サイズの3倍に等しくなる。
【0035】再び図4を見ると、RAID3 DASD
アレイのRAID5アレイ構成がセットされている。図
4では、インターリーブ深さ1を有するRAID5アレ
イとして構成される4つの論理デバイスからなるアレイ
階層が示される。この構成においては、単一のブロック
の読出しまたは書込みはアレイにおける1つの論理デバ
イスのみを必要とする。RAID5 DASDアレイと
は異なり、単一のブロック書込みは古いデータの読出
し、古いパリティの読出し、または新しいパリティの書
込みを必要としない。これは、更新操作に必要な1つの
論理デバイスに対する新しいデータの書込みを必要とす
るに過ぎない。
【0036】RAID3DASDアレイのRAID5ア
レイは、RAID3およびRAID5の両アレイの属性
を有する。RAID5アレイと同様に、このアレイ階層
は小さな要求において高い性能を、また大きな要求にお
いて高データ速度を呈する。RAID3アレイと同様
に、このアレイ階層は書込み更新に対して4回の操作を
必要としない。更にまた、劣化モードにおけるその性能
は正常モードにおけるその性能と同じである。
【0037】(RAID3DASDアレイのRAID5
アレイに対する正常モード・アクセス)下記のパラメー
タを持つRAID3アレイのRAID5アレイを想定す
る。即ち、 N=アレイにおけるDASDの数 I=インターリーブ深さ 下記のステップは、RAID3アレイのRAID5アレ
イにおける論理ブロックXをアクセスするため使用され
る方法について述べる。
【0038】(1)BをX/(I*N)として計算 (2)Rを1+モジューロ(X−1)/(I*N)″と
して計算 (3)デバイスDをセル(R/I)として計算 (4)デバイスLBD内の論理ブロックを1+モジュー
ロ(R−I)/I″+B*Iとして計算 (5)論理デバイスDにおける論理ブロックLBDをア
クセス。書込み時は、これは3つの物理ブロックに対す
るデータの書込みおよび4番目の物理ブロックに対する
パリティの書込みを含む。読出し時は、これは3つの物
理ブロックの読出しを含む。
【0039】再び図4において、このアレイでは、I=
1およびN=4である。論理ブロック6のアクセス要求
(即ち、X=6)について考察する。すると、 B=6/4=1、R=2、論理デバイスD=2 デバイスLBD内の論理ブロック=2。従って、論理ブ
ロック6は実際には論理デバイス2における2番目の論
理ブロックである。
【0040】例えば、論理ブロックXで始まるLブロッ
クに対するRAID3アレイのRAID5アレイに対す
る大きなアクセスは下記の如く働くことになる。上記の
ステップを用いて、このアクセスにおけるLブロック毎
に、デバイスDおよびデバイスLBD内の論理ブロック
を計算する。
【0041】(RAID3アレイのRAID5アレイに
対する劣化モード・アクセス・ステップ)アレイの階層
に対する小さなアクセスを行う方法について述べる。こ
れから、大きなアクセスの方法が直ちに明らかになろ
う。
【0042】(1)正常モード中の如く、デバイスDお
よびデバイスLBD内の論理ブロックを計算 (2)下記により、論理ブロックの読出しを実行。即
ち、 (a)指示された論理デバイスDにおける3つの物理デ
ータ・デバイスが全て使用可能ならば、3つのデバイス
から3つの物理ブロックを読出して論理ブロックを戻
す。
【0043】(b)論理デバイスDにおける物理デバイ
スの1つが壊れ、これが3つのデ−タ・デバイスの1つ
であるならば、2つの使用可能な物理データ・ブロック
および使用可能なパリティ・ブロックを読出す。このパ
リティ・ブロックを用いて、逸失データ・ブロックの値
を計算し、これにより論理データ・ブロック全体を生成
する。
【0044】(3)下記により、論理ブロックの書込み
を実行。即ち、 (a)Dにおける4つの全ての物理デバイスが使用可能
ならば、正常モードにおける如く続ける、即ち、論理ブ
ロックを3つに分割し、各3分の1を異なる物理デバイ
スに書込み、3つのXORをパリティ・ブロックに書込
む。
【0045】(b)パリティ物理デバイスが壊れている
ならば、論理ブロックを3つに分割して、各3分の1を
異なる物理デバイスに書込む。
【0046】(c)3つのデータ物理デバイスの1つが
壊れているならば、論理ブロックを3つに分割して、こ
れら3つの内の2つを2つの使用可能なデバイスに書込
み、次いで3つの3分の1のXORをパリティ・デバイ
スに書込む。
【0047】(RAID3アレイのRAID5アレイに
おけるスペアおよび再構成)予備の論理デバイスを用い
て、RAID3アレイのRAID5アレイにおける再構
成を容易にする。論理デバイスにおける物理デバイスが
壊れれば、壊れた論理デバイスからデータが予備の論理
デバイスに対してコピーされる。この修理手順は、デー
タが依然として壊れた論理デバイスに対して読出しまた
は書込みが可能であるため、RAID3またはRAID
5アレイより簡単である。RAID3およびRAID5
アレイでは、再構成手順は、アレイにおける他の全ての
デバイスを読出し、対応ブロックをXORし、次いで結
果として生じるXORを予備デバイスに書込むことから
なる。従って、RAID3およびRAID5アレイにお
いては、再構成手順はアレイにおける全てのデバイスの
余分な働きを必要とする。RAID3アレイのRAID
5アレイでは、再構成手順は壊れたデバイスおよび予備
のデバイスを必要とするのみであり、他の全てのデバイ
スは影響を受けない。
【0048】再び図4において、論理デバイス2におけ
るDASDの1つがちょうど故障したものとすれば、復
元はアルゴリズム的に下記を含む。即ち、 Let N:=1、2、3、、、Nからの論理デバイス
番号 T:=DASD当たりのトラック番号 DO i:=1toN トラックiを論理デバイス2からREAD; トラックiを予備論理デバイスにWRITE; END DO 論理デバイス2に対する全ての照会が予備論理デバイス
に与えられるように経路接続テーブルをCHANGE; 古い論理デバイス2をISOLATE、故障したDAS
Dを交換 (RAID3アレイのRAID5アレイのCKD)ここ
までは、RAID3アレイのRAID5アレイに対する
アクセスされたデータ構造は、固定ブロック範囲におけ
るDASDでフォーマット化されたブロックのみであ
る。しかし、本発明の1つの拡張は、RAID3アレイ
のRAID5アレイの修正を含み、これにおいてDAS
Dが周知のカウント・キー・データ(CKD)規約に従
って変更可能な長さにフォーマット化される。
【0049】次に図7において、1トラックのインター
リーブ深さをもつRAID3アレイのCKD RAID
5アレイが示される。これは、図の最上部にRAID3
CKDアレイ(論理デバイス)1乃至11の行を含む。
論理トラックは、対応論理デバイスの下方の行グループ
として示される。
【0050】各RAID3論理デバイス上のCKDトラ
ックは下記の如く配置される。即ち、 (a)各カウント・フィールドが論理デバイスの3つの
物理データ・デバイス上に複製される。
【0051】(b)各キーおよびデータ・フィールド
は、各3分の1が3つの物理データ・デバイスの1つに
記憶されるように3つに分割される。
【0052】(c)パリティ・トラックは、対応する3
つのデータ・トラックと同数のフィールドを持ち、各フ
ィールドは3つのデータ・トラックからの対応する3つ
のフィールドのXORである。
【0053】再び図7において、CKDトラック1はD
ASD1に記憶され、CKDトラック2はDASD2
に、、、、CKDトラック11はDASD11に、CK
Dトラック12はDASD1に記憶される如くである。
このため、インターリーブ深さは1トラックである。こ
のようなレイアウトでは、12以上のトラックを一緒に
読出す要求は、最大のデータ速度で処理されることにな
る。慎重な読者には、多数トラックのインターリーブ深
さもまた容易に許容され得ることが容易に明らかになろ
う。従って、CKDトラック1および2は、共にDAS
D1にあり得、CKDともに3および4は共にDASD
2にあり得る、、、などである。
【0054】図7に示される如きRAID3アレイのC
KDRAID5アレイは、一般的な場合に対して前に概
要を述べた全ての利点を維持する。これらの利点は即
ち、簡単であること、書込み前には読出しを行わないこ
と、可用度が高いこと、小さな要求における処理能力が
高いこと、小さな要求における帯域幅が高いことであ
る。
【0055】別の実施例においては、RAID3アレイ
のCKDRAID5アレイは1/4トラックの如き1ト
ラックより小さな単位でインターリーブ可能である。即
ち、CKDトラックの1/4がDASD1にあり、次の
1/4がDASD2にある、、、、如くである。これ
は、レコードが論理デバイスの境界に跨るという制約を
受ける。この制約は、インターリーブ深さが全トラック
の倍数に制限されれば生じることはない。
【0056】想起されるように、各DASDトラックの
大きさはアドレス指定および回転位置決め検出目的のた
め多数の等しい長さのセクターに分割される。1980
年6月10日発行のLuiz等の米国特許第4,20
7,609号「多数CPUおよび共有デバイス・アクセ
ス・システムにおける経路に依存しないデバイス予約お
よび再接続のための方法および装置(Method a
nd Means for Path Indepen
dent Device Reservation a
nd Reconnection in a Mult
i−CPU and Shared Device A
ccess System)」に記載されるように、C
PUは他のCPUのアクティビティと独立な「チャンネ
ル」または「チャンネル・プログラム」と呼ばれる、外
部の記憶サブシステムをアクセスするための仮想または
実プロセスを使用し得る。このチャンネル・アクセス
は、外部の記憶サブシステム(DASDアレイ)の特定
のDASD、シリンダ、トラック、トラック・セクター
およびヘッド・アドレスに最終的にマップされるデータ
場所を必要とする。
【0057】本発明において使用される記憶モデルは、
論理トラックを先に述べた如きパターンで論理デバイス
のRAID5アレイに対してマップする。2番目のマッ
ピングは、RAID3レベルのDASDに対して行われ
る。このマッピングにおける調整は、あるチャンネル・
プログラムにおけるセクター番号のオフセットを含む。
このようなオフセットは、与えられたCKDレコードが
存在する特定の論理デバイス番号に容易に変換すること
ができる。
【0058】セクター番号オフセットの使用例として、
ある回転の1/4以下のオフセットを論理デバイス1に
マップし、1回転の1/4から1/2間のオフセットを
論理デバイス2にマップする、、、如き事実について考
察しよう。レコードの読出しは、おそらくはこの論理デ
バイスから開始することになろう。このレコードが次の
論理デバイスに続く即ちこれにかかるならば、読出しは
次の論理デバイスから続く、、などとなろう。これは、
従来のDASD記憶サブシステムにおけるオーバーフロ
ーCKDレコードの処理に似た方法で管理される。
【0059】(拡張)本発明の原理を具体化する5つの
拡張がある。第1および第2の拡張については図5およ
び図6に関して論述し、異なるインターリーブ深さおよ
び仕切られた記憶域のアレイ階層を扱う。第3および第
4の拡張は、図8および図9を含み、同じ電力境界内に
纏まった物理デバイス間に分散された論理デバイスおよ
び故障したDASDの予備に対する再構成を扱う。最後
の拡張は、RAID5DASDアレイのRAID5アレ
イのアレイ階層の概要記述である。
【0060】次に図5を見ると、10個の論理デバイス
即ちRAID3アレイの3つのRAID5(A、B、
C)として構成されたRAID3DASDアレイのサブ
システムが示される。アレイAは、4つの論理デバイス
を含み1のインターリーブ深さである。アレイBは、4
のインターリーブ深さを持つ3つの論理デバイスを有す
る。最後に、アレイCは3つの論理デバイスを持ち、1
0のインターリーブ深さを有する。この記憶サブシステ
ムのユーザは、最初にRAID3アレイの異なるRAI
D5アレイを定義して生成することになる。アレイ生成
時に、ユーザはアレイに含まれる論理デバイスの数およ
びインターリーブ深さを指定し、またこのアレイに対す
る名前を指定することになる。
【0061】異なるRAID3アレイのRAID5の生
成後、コントローラは生成されたアレイ内の論理ブロッ
クの読出し/書込要求を受け入れる。生成された各RA
ID3アレイのRAID5毎に、アレイ・コントローラ
はテーブルにRAID3アレイのRAID5アレイに含
まれる実際の論理デバイス、アレイの名前、およびアレ
イのインターリーブ深さをセーブすることを必要とす
る。このようなテーブルは、安定な不揮発記憶域に維持
されねばならない。
【0062】再び図6において、RAID3アレイのR
AID5が正確にある数のDASDからなるものでない
実施例が示される。即ち、各RAID3アレイはDAS
Dの一部からなっている。一例として、図6には6つの
論理デバイスを持つサブシステムが示される。これらは
下記の如く構成される。即ち、(1)アレイAは、論理
デバイス1乃至6の1/2から構成され、(2)アレイ
Bは、論理デバイス1乃至3の半分から構成され、また
(3)アレイCは、論理デバイス4乃至6の半分から構
成される。
【0063】前のように、RAID3のRAID5アレ
イの各々は、異なるインターリーブ深さを有する。アレ
イ構成時に、ユーザはアレイの名前、インターリーブ深
さ、アレイにおけるデバイス数およびアレイにおける論
理ブロック数を指定する。最後の2つのパラメータは共
に、DASDアレイに含まれる各DASDデバイスの部
分を決定する。
【0064】次に図8において、4つのドロワー(4つ
のクラスター)のDASDアレイを通信可能に接続した
アレイ・コントローラ801が示される。このアレイ
は、異なる物理DASDクラスター、例えば807、8
17、831および841に置かれたDASDから形成
される論理デバイス(例えば、デバイスA)を含む。通
信の結合は、パリティおよびストライピング・ロジック
803、スイッチ805および制御およびデータ・リン
クを含む経路上に生じる。後者は、スイッチ805と物
理クラスター即ちドロワーの各々における各DASDと
の間の破線の結線として示される。
【0065】再び図8において、論理デバイスAはデー
タDASD809、819、833およびパリティDA
SD843を含む。同様に、論理デバイスBは、データ
DASD811、813、821およびパリティDAS
D823を含む。更にまた、論理デバイスCは、データ
DASD815、825、839およびパリティDAS
D849を有し、論理デバイスDはデータDASD83
5、837、845およびパリティDASD847を包
含する。
【0066】論理デバイスAおよびCのDASDは対応
する物理DASDのクラスター807、817、831
および841に分散されることに注意すべきである。し
かし、論理デバイスBのDASDは、クラスター80
7、817にのみ分散され、論理デバイスDのDASD
はクラスター831、841の一部のみを形成する。
【0067】アレイの目的から明らかなように、DAS
Dは、「ドロワー(引出し)」と呼ばれる機械的および
電気的なパッケージ単位で物理的にグループ化即ち纏め
られている。各ドロワーは、それ自体の電源を持ち、ま
たDASDの個々の取外しおよび交換を容易にする種々
の電気的および機械的なプラグ結合部を含む。1つのド
ロワーは、電力の分配、ならびにパッケージおよびサー
ビス境界を規定する。
【0068】1つの論理ブロックが例えば論理デバイス
Aに書込まれる時、第1の3分の1がクラスター807
のDASD809に記録され、2番目の3分の1がクラ
スター817のDASD819に、最後の3分の1がク
ラスター831のDASD833に記録されるように、
ロジック803がこのブロックを区切り、スイッチ80
5が経路を確立する。区切られた3つにおけるパリティ
は、クラスター841におけるDASD843に書込ま
れる。同様に、論理ブロックを論理デバイスB、Cおよ
びDに書込む時、区切りおよびパリティ取得が生じる。
【0069】スペアおよび再構成アクティビティに関し
ては、1つの予備論理デバイスが多数のアレイにおける
冗長性を提供する。物理デバイスの故障は、論理ブロッ
クが壊れた論理デバイスから予備の論理デバイスに複写
されることを要求する。
【0070】次に図9において、予備機として予約され
た論理デバイスを追加した、図8に示したものと似たア
レイ・コントローラおよびDASDアレイの階層構成が
示される。この予備機は、各クラスター907、91
9、929および941における予備のDASD91
7、927、939および951として分散される。
【0071】クラスター907にある論理デバイスAの
DASD909が故障したものとしよう。スペアおよび
再構成アルゴリズムは単に下記の如くである。即ち、
(a)スイッチ905を含む経路上の残りのDASD9
21、931、943から読出し、(b)4番目のセグ
メント・ロジック903を再構成するため、各ブロック
の3つのセグメントを論理的に組合わせ、(c)予備の
デバイスの対応DASD917、927、939、95
1に対して4つのセグメントを書込み、(d)経路ある
いはアドレス・テーブルにおけるデバイスAのアドレス
を予備機のアドレスで置換し、(e)新しい予備デバイ
スの一部として働くようにデバイスAの前にDASD9
21、931および943を交換し、(f)故障したD
ASD909を便宜的に別のDASDで置換して予備デ
バイスの増強を完成し、これによりアレイの階層を正常
動作モードに戻す。
【0072】図9の説明の補完として、デバイスBはD
ASD911、913、923、925から形成され、
デバイスCはDASD915、926、937および9
49を含み、デバイスDはクラスター間に種々に分散さ
れた933、935、945、947を含む。
【0073】最後の拡張は、各論理デバイスがRAID
5DASDアレイであるアレイ階層の形成に関するもの
である。RAID5DASDアレイの1つのRAID5
アレイは、RAID5アレイをストライプすることによ
り本発明の階層に固有の間接関係を利用し、全データ速
度はいずれか1つのアレイから取得し得るものに限定さ
れることがない。
【0074】(まとめ)RAID3DASDアレイのR
AID5アレイは、ビルディング・ブロックとしてRA
ID3アレイを使用し、RAID3アレイに跨ってスト
ライプする。RAID5アレイと同様に、本発明のアレ
イ階層は小さな要求における高い処理能力を、また大き
な要求における高い帯域幅を達成する。RAID5アレ
イとは異なり、本発明においては、書込み更新は古いデ
ータと古いパリティを読出すDASDアクセスを必要と
せず、また新しいパリティを書込むためのDASDアク
セスをも必要としない。従って、RAID5アレイと関
連する4つの書込みの不利益を持つことがない。
【0075】更に、RAID3アレイのRAID5アレ
イの作動は、RAID5アレイより遥かに簡単である。
例えば、同時更新の面におけるパリティ・グループの一
貫性を維持するためRAID5が必要とする如く、パリ
ティ・グループをロックする必要の問題がない。アレイ
中の1つの物理デバイスが壊れた時、劣化モードにおい
て、RAID3アレイのRAID5アレイは性能上何ら
の損失も蒙らず、この点においてRAID3アレイの如
くに挙動する。
【0076】最後に、壊れたデバイスと予備のデバイス
のみを使用しその間の複写を必要とするのみであるた
め、本発明のアレイ階層の再構成はRAID3またはR
AID5アレイのいずれにおける再構成よりも簡単であ
る。従来技術のRAID3アレイまたはRAID5アレ
イにおいては、再構成はアレイ内の他の全てのデバイス
に関わり、複写より更に複雑である。RAID3アレイ
のRAID5アレイの別の利点は、デバイスがホット・
プラグ可能である必要がないことである。壊れた論理デ
バイスからのデータが予備のデバイスに複写された後、
壊れた論理デバイスにおける物理デバイスが全て遮断さ
れ、オフラインで修復できる。
【0077】本発明の上記および他の拡張は、頭書の特
許請求の範囲に記載される如き趣旨および範囲から逸脱
することなく可能である。
【図面の簡単な説明】
【図1】大きい読出し/書込み要求を扱うように調整さ
れた従来技術によるRAID3のDASDアレイを示す
図である。
【図2】論理ブロックが列主体の順序でそれぞれ書込ま
れた従来技術による高レベルのRAIDアレイを示す図
である。
【図3】論理ブロックが行主体の順序でそれぞれ書込ま
れた従来技術による高レベルのRAIDアレイを示す図
である。
【図4】本発明によるRAID3のDASDアレイのR
AID5アレイを示す図である。
【図5】書込まれた論理レコードのブロックの異なるイ
ンターリーブ深さを持つRAID3のDASDアレイの
RAID5の組込みを示す図である。
【図6】多数の断片的アレイの形態でRAID3のDA
SDアレイのRAID5を形成する図5の更なる拡張を
示す図である。
【図7】可変長(CKD)フォーマット化論理レコード
のためのRAID3デバイスのRAID5アレイのアド
レス指定パターンを示す図である。
【図8】同じ物理ドロワーにある物理DASDが共通制
御装置を結合する異なる論理デバイスに構成可能である
ことを示す図である。
【図9】DASDの故障後の物理DASDの再構成、お
よび故障したDASDにあったデータの再構成の結果と
してこれのスペアDASDへの書込みを示す図である。
【符号の説明】
801 アレイ・コントローラ 803 パリティ/ストライプ・ロジック 805 スイッチ 807 物理ドロワー 809、811、813、815、819、821、8
23、825、833、835、837、339、84
3、845、847、849 DASD 901 アレイ・コントローラ 903 パリティ/ストライプ・ロジック 905 スイッチ 907 物理ドロワー 909、911、913、915、917、921、9
23、925、926、927、931、933、93
5、937、939、843、845、847、84
9、951 DASD
フロントページの続き (72)発明者 レイトン・クリストファー・ウッド、ジュ ニア アメリカ合衆国95037、カリフォルニア州 モーン・ヒル、レイクヴュー・ドライブ 17240番地

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数のDASDからデータ・ストリング
    をアクセスする方法において、 (a)各々RAID3 DASDアレイ状にNデータ+
    PパリティDASDを含む論理デバイスのRAID5ア
    レイとして複数のDASDを構成し、 (b)N個のデータ・ブロックのK個の論理レコードに
    それぞれ各データ・ストリングをセグメント化し、各セ
    グメント化されたレコード上でP個のパリティ・ブロッ
    クをコード化し、RAID5アレイの論理デバイス上に
    前記K個の論理レコードを予め定めたインターリーブ深
    さの列主体の順序でアクセスし、 (c)RAID3 DASDアレイから前記順序および
    深さに従って一時にN+P個のブロックでK個のレコー
    ドを転送するステップを含むことを特徴とする方法。
  2. 【請求項2】 各々コントローラを付属するNデータ+
    PパリティDASDを有する複数のRAID3 DAS
    Dアレイから形成される記憶サブシステムに対して、与
    えられたデータ・ストリングを書込む方法において、 (a)共通制御装置を介して各コントローラを通信可能
    に取付けることにより、複数のRAID3 DASDア
    レイをアドレス指定可能な論理デバイスのRAID5ア
    レイに構成し、 (b)前記共通制御装置において各データ・ストリング
    をそれぞれN個のブロックのK個の論理レコードにセグ
    メント化し、各論理レコードをパリティ・コード化して
    これにP個のブロックを付加し、 (c)各々予め定めたインターリーブ深さの列主体の順
    序で、N+PブロックのK個の論理レコードを論理デバ
    イスのRAID5アレイに対して書込んで、各論理レコ
    ードのN+Pブロックが、そのコントローラを含む経路
    を介してアドレス指定された論理デバイスとして動作す
    る対応RAID3アレイのN+P個のDASDに対して
    記録されるようにすることを特徴とする方法。
  3. 【請求項3】 各々が1つのコントローラを取付けるN
    データ+PパリティDASDを有する複数のRAID3
    DASDアレイから形成される記憶サブシステムに与
    えられる、K*(Nデータ+Pパリティ)ブロックから
    形成されたデータ・ストリングの各部の大小のアクセス
    を管理する方法において、 (a)RAID3 DASDアレイの論理デバイスのR
    AID5アレイを形成する間接的関係の少なくとも1つ
    のレベルに複数を構成し、各コントローラを共通制御装
    置に対して通信可能に取付けることにより、前記論理デ
    バイスの少なくとも1つを予備デバイスとして予約し、 (b)前記共通制御装置を含む経路を介して、予め定め
    たインターリーブ深さの列主体の順序で予備デバイス以
    外の論理デバイスをアクセスし、 (c)RAID3アレイにおけるDASDの故障を検出
    し、 (d)前記故障の検出に応答して、故障したDASD以
    外に対して前記論理デバイスをステップ(b)における
    如くアクセスし、 (e)対応するRAID3アレイが故障したDASDを
    含む論理デバイスのN+P個のDASDを再構成して、
    これを予め定めたあるいは便宜的なスケジュールにより
    予備デバイスに対して再書込みを行い、前記再構成およ
    び再書込みが前記予備デバイスおよび故障したDASD
    を有する前記デバイスのみに関わることを特徴とする方
    法。
  4. 【請求項4】 各々が局部コントローラを付属するNデ
    ータ+PパリティのDASDを含むDASDの複数のR
    AID3アレイと、 制御装置および局部コントローラを含む経路を介して、
    前記RAID3アレイ論理デバイス相等物のアドレス指
    定可能なRAID5アレイを形成する複数のサブセット
    を通信可能に取付ける制御装置と、 前記制御装置を含み、K*Nブロックから形成される各
    データ・ストリングに応答して、ストリングをN個のブ
    ロックにセグメント化し、各セグメント上にP個のパリ
    ティ・ブロックをコード化して、対応する論理デバイス
    に対して予め定めたインターリーブ深さの列主体の順序
    でN+P個のブロック・セグメントのK個を書込む手段
    とを設けてなることを特徴とする記憶サブシステム。
  5. 【請求項5】 各々が局部コントローラを付属するNデ
    ータ+PパリティのDASDを有するDASDのRAI
    D3アレイを含む複数の論理デバイスと、 制御装置および局部コントローラを含む経路を介して前
    記論理デバイスのアドレス指定可能なRAID5アレイ
    を形成するように複数のデバイスのサブセットを通信可
    能に取付ける制御装置とを設け、他の複数のデバイスが
    予備デバイスとして予約され、 N*K個のブロックから形成された各データ・ストリン
    グに応答して該ストリングをN個のブロックにセグメン
    ト化し、各セグメント上にP個のパリティ・ブロックを
    コード化し、N+P個のブロック・セグメントのK個を
    予め定めたインターリーブ深さの列主体の順序で対応す
    る論理デバイスに対して書込み、そのコントローラを含
    む経路を介して前記デバイスに対する対応RAID3
    DASDアレイのN+P個のDASDに対して各セグメ
    ントのN+P個のブロックを記録する制御装置を含む第
    1の手段と、 1つの論理デバイスのRAID3 DASDアレイの対
    応するものにおけるDASD故障を検出し、該論理デバ
    イスに対して予め定められた順序および深さで書込ん
    で、故障したDASDに対して規定されたブロック以外
    のブロックを記録する制御装置を含む第2の手段と、 対応するRAID3アレイが故障したDASDを含む論
    理デバイスのN+P個のDASDを予め定めたあるいは
    便宜的なスケジュールで再構成し、これを予備デバイス
    に対して再書込みを行う第3の手段とを設け、該再構成
    および再書込みが、予備デバイスおよび故障したDAS
    Dを有する前記デバイスのみに関わることを特徴とする
    記憶サブシステム。
  6. 【請求項6】 各々がDASDのRAID3アレイから
    形成された複数の論理デバイスと、 前記論理デバイスの第1または第2のRAID5アレイ
    を通信可能に取付ける制御装置と、 第1のRAID5アレイを選択し、1つのデータ・スト
    リングをm個のデータ・ブロックのセグメントにセグメ
    ント化し、各セグメント上にp個のパリティ・ブロック
    をコード化し、第1のインターリーブ深さに列主体の順
    序で第1のアレイの論理デバイスに対してmデータ+p
    パリティ・ブロックの各セグメントを書込む制御装置を
    含む第1の手段と、 前記第2のRAID5アレイを選択し、別のデータ・ス
    トリングをn個のデータ・ブロックにセグメント化し、
    各セグメント上にp個のパリティ・ブロックをコード化
    し、第2のインターリーブ深さに列主体の順序で第2の
    DASDサブセットに対してnデータ+pパリティ・ブ
    ロックの各セグメントを書込む制御装置を含む第2の手
    段とを設け、該第2のRAID5アレイのデバイスの少
    なくとも1つがまた前記第1のRAID5アレイのメン
    バーであることを特徴とする記憶サブシステム。
  7. 【請求項7】 変更可能な長さのカウント・キー・デー
    タ(CKD)フィールド・フォーマット化されたレコー
    ドを、各々コントローラを付属するNデータ+Pパリテ
    ィのDASDを有する複数のRAID3 DASDアレ
    イから形成される記憶サブシステムに対して書込む方法
    において、 (a)共通の制御装置を介してそのコントローラのそれ
    ぞれを通信可能に取付けることにより、前記複数のRA
    ID3 DASDアレイをアドレス指定可能な論理デバ
    イスのRAID5アレイに構成し、 (b)前記共通制御装置において各データ・ストリング
    をそれぞれN個のストライプのK個の論理レコードにセ
    グメント化し、各論理レコードをパリティ・コード化
    し、P個のストリングをこれに加え、 (c)各論理レコードのN+P個のストリングが、その
    コントローラを含む経路を介してアドレス指定された論
    理デバイスとして動作する対応RAID3アレイのN+
    P個のDASDに対して記録されるように、 (1)CKDフォーマット化された可変長のレコードの
    各カウント・フィールドが、行主体の順序で第1のデバ
    イスのN個のDASDに複製され、 (2)CKDフォーマット化された可変長のレコードの
    カウント・フィールドに続くキーおよびデータ・フィー
    ルドがセグメント化され、予め定めた行主体の順序およ
    びインターリーブ深さでアドレス指定された論理デバイ
    スとして働く対応RAID3アレイのN個のDASDに
    わたって記録され、 (3)各パリティ・ブロックPが対応するN個のフィー
    ルドを論理的に組合わせるように、N+P個のストリン
    グのK個の論理レコードをそれぞれ予め定めたインター
    リーブ深さの行主体の順序で、論理デバイスのRAID
    5アレイに対して書込むステップを含むことを特徴とす
    る方法。
JP4132613A 1991-07-03 1992-05-25 Dasdアレイの階層を管理する方法および装置 Expired - Fee Related JPH0731579B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/725,696 US5301297A (en) 1991-07-03 1991-07-03 Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
US725696 1991-07-03

Publications (2)

Publication Number Publication Date
JPH0744322A JPH0744322A (ja) 1995-02-14
JPH0731579B2 true JPH0731579B2 (ja) 1995-04-10

Family

ID=24915608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4132613A Expired - Fee Related JPH0731579B2 (ja) 1991-07-03 1992-05-25 Dasdアレイの階層を管理する方法および装置

Country Status (3)

Country Link
US (1) US5301297A (ja)
EP (1) EP0521630A2 (ja)
JP (1) JPH0731579B2 (ja)

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2603757B2 (ja) * 1990-11-30 1997-04-23 富士通株式会社 アレ−ディスク装置の制御方法
JP2913917B2 (ja) 1991-08-20 1999-06-28 株式会社日立製作所 記憶装置および記憶装置システム
JP2550239B2 (ja) * 1991-09-12 1996-11-06 株式会社日立製作所 外部記憶装置システム
US5974544A (en) * 1991-12-17 1999-10-26 Dell Usa, L.P. Method and controller for defect tracking in a redundant array
JP3160106B2 (ja) * 1991-12-23 2001-04-23 ヒュンダイ エレクトロニクス アメリカ ディスクアレーの区分け方法
US5526507A (en) * 1992-01-06 1996-06-11 Hill; Andrew J. W. Computer memory array control for accessing different memory banks simullaneously
US5745789A (en) * 1992-01-23 1998-04-28 Hitachi, Ltd. Disc system for holding data in a form of a plurality of data blocks dispersed in a plurality of disc units connected by a common data bus
US5418921A (en) * 1992-05-05 1995-05-23 International Business Machines Corporation Method and means for fast writing data to LRU cached based DASD arrays under diverse fault tolerant modes
US5734926A (en) * 1992-07-15 1998-03-31 Advanced Hardware Architectures Direct memory access controller in an integrated circuit
US5488694A (en) * 1992-08-28 1996-01-30 Maspar Computer Company Broadcasting headers to configure physical devices interfacing a data bus with a logical assignment and to effect block data transfers between the configured logical devices
US5857112A (en) * 1992-09-09 1999-01-05 Hashemi; Ebrahim System for achieving enhanced performance and data availability in a unified redundant array of disk drives by using user defined partitioning and level of redundancy
US5581784A (en) * 1992-11-17 1996-12-03 Starlight Networks Method for performing I/O's in a storage system to maintain the continuity of a plurality of video streams
US5459853A (en) * 1992-11-23 1995-10-17 International Business Machines Corporation Efficient variable-block data storage system employing a staggered fixed-block-architecture array
US5519849A (en) * 1992-12-07 1996-05-21 Digital Equipment Corporation Method of reducing the complexity of an I/O request to a RAID-4 or RAID-5 array
US5579474A (en) * 1992-12-28 1996-11-26 Hitachi, Ltd. Disk array system and its control method
US5845329A (en) * 1993-01-29 1998-12-01 Sanyo Electric Co., Ltd. Parallel computer
US6138126A (en) * 1995-05-31 2000-10-24 Network Appliance, Inc. Method for allocating files in a file system integrated with a raid disk sub-system
US5598549A (en) * 1993-06-11 1997-01-28 At&T Global Information Solutions Company Array storage system for returning an I/O complete signal to a virtual I/O daemon that is separated from software array driver and physical device driver
US5510905A (en) * 1993-09-28 1996-04-23 Birk; Yitzhak Video storage server using track-pairing
JP2912802B2 (ja) * 1993-10-14 1999-06-28 富士通株式会社 ディスクアレイ装置の故障対処方法および装置
US5632012A (en) * 1993-11-24 1997-05-20 Storage Technology Corporation Disk scrubbing system
US5600783A (en) * 1993-11-30 1997-02-04 Hitachi, Ltd. Disc array system having disc storage devices dispersed on plural boards and accessible at withdrawal of part of the boards
US5485571A (en) * 1993-12-23 1996-01-16 International Business Machines Corporation Method and apparatus for providing distributed sparing with uniform workload distribution in failures
US5499253A (en) * 1994-01-05 1996-03-12 Digital Equipment Corporation System and method for calculating RAID 6 check codes
US5566316A (en) * 1994-02-10 1996-10-15 Storage Technology Corporation Method and apparatus for hierarchical management of data storage elements in an array storage device
US5463643A (en) * 1994-03-07 1995-10-31 Dell Usa, L.P. Redundant memory channel array configuration with data striping and error correction capabilities
US5732239A (en) * 1994-05-19 1998-03-24 Starlight Networks Method for operating a disk storage system which stores video data so as to maintain the continuity of a plurality of video streams
US5802394A (en) * 1994-06-06 1998-09-01 Starlight Networks, Inc. Method for accessing one or more streams in a video storage system using multiple queues and maintaining continuity thereof
US5546558A (en) * 1994-06-07 1996-08-13 Hewlett-Packard Company Memory system with hierarchic disk array and memory map store for persistent storage of virtual mapping information
EP0689125B1 (en) * 1994-06-22 2004-11-17 Hewlett-Packard Company, A Delaware Corporation Method of utilizing storage disks of differing capacity in a single storage volume in a hierarchic disk array
US5479653A (en) * 1994-07-14 1995-12-26 Dellusa, L.P. Disk array apparatus and method which supports compound raid configurations and spareless hot sparing
US5657439A (en) * 1994-08-23 1997-08-12 International Business Machines Corporation Distributed subsystem sparing
US5524204A (en) * 1994-11-03 1996-06-04 International Business Machines Corporation Method and apparatus for dynamically expanding a redundant array of disk drives
US5488701A (en) * 1994-11-17 1996-01-30 International Business Machines Corporation In log sparing for log structured arrays
US5659704A (en) * 1994-12-02 1997-08-19 Hewlett-Packard Company Methods and system for reserving storage space for data migration in a redundant hierarchic data storage system by dynamically computing maximum storage space for mirror redundancy
JPH08249133A (ja) * 1994-12-15 1996-09-27 Internatl Business Mach Corp <Ibm> ディスク・ドライブ・アレイの故障対策の方法及びシステム
US5613085A (en) * 1994-12-27 1997-03-18 International Business Machines Corporation System for parallel striping of multiple ordered data strings onto a multi-unit DASD array for improved read and write parallelism
US5671439A (en) * 1995-01-10 1997-09-23 Micron Electronics, Inc. Multi-drive virtual mass storage device and method of operating same
US5666512A (en) * 1995-02-10 1997-09-09 Hewlett-Packard Company Disk array having hot spare resources and methods for using hot spare resources to store user data
US5574882A (en) * 1995-03-03 1996-11-12 International Business Machines Corporation System and method for identifying inconsistent parity in an array of storage
US5845319A (en) * 1995-08-23 1998-12-01 Fujitsu Limited Disk array device which separates local and physical disks using striping and operation mode selection
US6098128A (en) 1995-09-18 2000-08-01 Cyberstorage Systems Corporation Universal storage management system
US5933592A (en) * 1995-10-13 1999-08-03 Digital Equipment Corporation Promoting device level error to raidset level error to restore redundacy in a raid array data storage system
US5826001A (en) * 1995-10-13 1998-10-20 Digital Equipment Corporation Reconstructing data blocks in a raid array data storage system having storage device metadata and raid set metadata
US5774643A (en) * 1995-10-13 1998-06-30 Digital Equipment Corporation Enhanced raid write hole protection and recovery
US5862312A (en) * 1995-10-24 1999-01-19 Seachange Technology, Inc. Loosely coupled mass storage computer cluster
US6449730B2 (en) 1995-10-24 2002-09-10 Seachange Technology, Inc. Loosely coupled mass storage computer cluster
JP3776496B2 (ja) * 1996-01-17 2006-05-17 株式会社日立製作所 データ記憶システム
US5727181A (en) * 1996-02-14 1998-03-10 International Business Machines Corporation Array management system with volume transform filter
US5832198A (en) * 1996-03-07 1998-11-03 Philips Electronics North America Corporation Multiple disk drive array with plural parity groups
US5758050A (en) * 1996-03-12 1998-05-26 International Business Machines Corporation Reconfigurable data storage system
US5819310A (en) * 1996-05-24 1998-10-06 Emc Corporation Method and apparatus for reading data from mirrored logical volumes on physical disk drives
US6108812A (en) * 1996-06-20 2000-08-22 Lsi Logic Corporation Target device XOR engine
US5960169A (en) * 1997-02-27 1999-09-28 International Business Machines Corporation Transformational raid for hierarchical storage management system
US5951691A (en) * 1997-05-16 1999-09-14 International Business Machines Corporation Method and system for detection and reconstruction of corrupted data in a data storage subsystem
US5933840A (en) * 1997-05-19 1999-08-03 International Business Machines Corporation Garbage collection in log-structured information storage systems using age threshold selection of segments
US6112255A (en) * 1997-11-13 2000-08-29 International Business Machines Corporation Method and means for managing disk drive level logic and buffer modified access paths for enhanced raid array data rebuild and write update operations
US6175837B1 (en) 1998-06-29 2001-01-16 Sun Microsystems, Inc. Object-relational mapping toll that processes views
US6385618B1 (en) 1997-12-22 2002-05-07 Sun Microsystems, Inc. Integrating both modifications to an object model and modifications to a database into source code by an object-relational mapping tool
US6360223B1 (en) 1997-12-22 2002-03-19 Sun Microsystems, Inc. Rule-based approach to object-relational mapping strategies
US6268850B1 (en) 1997-12-22 2001-07-31 Sun Microsystems, Inc. User interface for the specification of lock groups
US6240413B1 (en) * 1997-12-22 2001-05-29 Sun Microsystems, Inc. Fine-grained consistency mechanism for optimistic concurrency control using lock groups
US6374256B1 (en) 1997-12-22 2002-04-16 Sun Microsystems, Inc. Method and apparatus for creating indexes in a relational database corresponding to classes in an object-oriented application
US6052799A (en) * 1998-05-15 2000-04-18 International Business Machines Corporation System and method for recovering a directory for a log structured array
US6122754A (en) * 1998-05-22 2000-09-19 International Business Machines Corporation Method and system for data recovery using a distributed and scalable data structure
US6173415B1 (en) 1998-05-22 2001-01-09 International Business Machines Corporation System for scalable distributed data structure having scalable availability
US6343343B1 (en) 1998-07-31 2002-01-29 International Business Machines Corporation Disk arrays using non-standard sector sizes
US6272662B1 (en) 1998-08-04 2001-08-07 International Business Machines Corporation Distributed storage system using front-end and back-end locking
US6446237B1 (en) 1998-08-04 2002-09-03 International Business Machines Corporation Updating and reading data and parity blocks in a shared disk system
US6446220B1 (en) 1998-08-04 2002-09-03 International Business Machines Corporation Updating data and parity data with and without read caches
US6332197B1 (en) 1998-08-04 2001-12-18 International Business Machines Corp. System for updating data in a multi-adaptor environment
US6279138B1 (en) 1998-08-04 2001-08-21 International Business Machines Corporation System for changing the parity structure of a raid array
US6128762A (en) * 1998-08-04 2000-10-03 International Business Machines Corporation Updating and reading data and parity blocks in a shared disk system with request forwarding
US6098190A (en) * 1998-08-04 2000-08-01 Hewlett-Packard Co. Method and apparatus for use of a host address to validate accessed data
US6542961B1 (en) * 1998-12-22 2003-04-01 Hitachi, Ltd. Disk storage system including a switch
US6327672B1 (en) 1998-12-31 2001-12-04 Lsi Logic Corporation Multiple drive failure tolerant raid system
JP4294142B2 (ja) 1999-02-02 2009-07-08 株式会社日立製作所 ディスクサブシステム
US6363457B1 (en) 1999-02-08 2002-03-26 International Business Machines Corporation Method and system for non-disruptive addition and deletion of logical devices
JP4325817B2 (ja) 1999-04-05 2009-09-02 株式会社日立製作所 ディスクアレイ装置
US6463503B1 (en) 1999-05-12 2002-10-08 International Business Machines Corporation Method and system for increasing concurrency during staging and destaging in a log structured array
US6842422B1 (en) * 1999-06-15 2005-01-11 Marconi Communications, Inc. Data striping based switching system
US6513093B1 (en) 1999-08-11 2003-01-28 International Business Machines Corporation High reliability, high performance disk array storage system
US6671776B1 (en) 1999-10-28 2003-12-30 Lsi Logic Corporation Method and system for determining and displaying the topology of a storage array network having multiple hosts and computer readable medium for generating the topology
JP2001166887A (ja) * 1999-12-08 2001-06-22 Sony Corp データ記録再生装置及びデータ記録再生方法
US6633962B1 (en) * 2000-03-21 2003-10-14 International Business Machines Corporation Method, system, program, and data structures for restricting host access to a storage space
US6591275B1 (en) 2000-06-02 2003-07-08 Sun Microsystems, Inc. Object-relational mapping for tables without primary keys
US6906999B1 (en) 2000-06-30 2005-06-14 Marconi Intellectual Property (Ringfence), Inc. Receiver decoding algorithm to allow hitless N+1 redundancy in a switch
KR100388498B1 (ko) * 2000-12-30 2003-06-25 한국전자통신연구원 복수 개의 레이드를 구비한 계층적 레이드 시스템
US6857059B2 (en) * 2001-01-11 2005-02-15 Yottayotta, Inc. Storage virtualization system and methods
US6990667B2 (en) 2001-01-29 2006-01-24 Adaptec, Inc. Server-independent object positioning for load balancing drives and servers
US7054927B2 (en) 2001-01-29 2006-05-30 Adaptec, Inc. File system metadata describing server directory information
US20020138559A1 (en) * 2001-01-29 2002-09-26 Ulrich Thomas R. Dynamically distributed file system
US20020161850A1 (en) 2001-01-29 2002-10-31 Ulrich Thomas R. Data path accelerator for storage systems
US20020124137A1 (en) * 2001-01-29 2002-09-05 Ulrich Thomas R. Enhancing disk array performance via variable parity based load balancing
US6990547B2 (en) * 2001-01-29 2006-01-24 Adaptec, Inc. Replacing file system processors by hot swapping
US6862692B2 (en) * 2001-01-29 2005-03-01 Adaptec, Inc. Dynamic redistribution of parity groups
US7219353B2 (en) * 2001-02-27 2007-05-15 Broadcom Corporation Finite state machine with a single process context for a RAID system
US6823450B2 (en) 2001-05-11 2004-11-23 International Business Machines Corporation Mechanism for eliminating need for flash memory in software RAID
US7073115B2 (en) * 2001-12-28 2006-07-04 Network Appliance, Inc. Correcting multiple block data loss in a storage array using a combination of a single diagonal parity group and multiple row parity groups
US7689623B1 (en) * 2002-04-08 2010-03-30 Syncsort Incorporated Method for performing an external (disk-based) sort of a large data file which takes advantage of “presorted” data already present in the input
US7069465B2 (en) * 2002-07-26 2006-06-27 International Business Machines Corporation Method and apparatus for reliable failover involving incomplete raid disk writes in a clustering system
US7152142B1 (en) * 2002-10-25 2006-12-19 Copan Systems, Inc. Method for a workload-adaptive high performance storage system with data protection
US7350101B1 (en) * 2002-12-23 2008-03-25 Storage Technology Corporation Simultaneous writing and reconstruction of a redundant array of independent limited performance storage devices
US7379974B2 (en) * 2003-07-14 2008-05-27 International Business Machines Corporation Multipath data retrieval from redundant array
US7281177B2 (en) * 2003-07-14 2007-10-09 International Business Machines Corporation Autonomic parity exchange
US7533325B2 (en) 2003-07-14 2009-05-12 International Business Machines Corporation Anamorphic codes
US7254754B2 (en) * 2003-07-14 2007-08-07 International Business Machines Corporation Raid 3+3
US7707060B2 (en) * 2003-08-21 2010-04-27 International Business Machines Corporation Automatic collection and dissemination of product usage information
US7191283B2 (en) * 2003-08-21 2007-03-13 International Business Machines Corporation Grouping of storage media based on parameters associated with the storage media
US7484050B2 (en) * 2003-09-08 2009-01-27 Copan Systems Inc. High-density storage systems using hierarchical interconnect
JP4441929B2 (ja) * 2005-01-19 2010-03-31 日本電気株式会社 ディスク装置及びホットスワップ方法
US20070113006A1 (en) * 2005-11-16 2007-05-17 Elliott John C Apparatus and method to configure one or more storage arrays
US7418623B2 (en) 2005-11-16 2008-08-26 International Business Machines Corporation Apparatus and method to reconfigure a storage array
JP4985647B2 (ja) * 2006-09-29 2012-07-25 富士通株式会社 修復プログラム、修復装置および修復方法
US8145941B2 (en) 2006-10-31 2012-03-27 Hewlett-Packard Development Company, L.P. Detection and correction of block-level data corruption in fault-tolerant data-storage systems
US7890795B1 (en) 2008-06-02 2011-02-15 Emc Corporation Auto-adapting cache memory system and memory
JP5286956B2 (ja) * 2008-06-13 2013-09-11 富士通株式会社 制御方法、ディスクアレイ装置
GB2463078B (en) * 2008-09-02 2013-04-17 Extas Global Ltd Distributed storage
US8495417B2 (en) 2009-01-09 2013-07-23 Netapp, Inc. System and method for redundancy-protected aggregates
US8793467B2 (en) 2011-09-30 2014-07-29 Pure Storage, Inc. Variable length encoding in a storage system
US9026729B1 (en) 2011-11-15 2015-05-05 Emc Corporation Data recovery after triple disk failure
US8990495B2 (en) * 2011-11-15 2015-03-24 Emc Corporation Method and system for storing data in raid memory devices
WO2018112074A1 (en) * 2016-12-14 2018-06-21 Ocient Llc System and method for utilizing a designated leader within a database management system
US10691543B2 (en) 2017-11-14 2020-06-23 International Business Machines Corporation Machine learning to enhance redundant array of independent disks rebuilds
TWI656442B (zh) * 2017-11-30 2019-04-11 慧榮科技股份有限公司 用來於一記憶裝置中進行存取控制之方法以及記憶裝置及其控制器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4092732A (en) * 1977-05-31 1978-05-30 International Business Machines Corporation System for recovering data stored in failed memory unit
CA1296103C (en) * 1987-06-02 1992-02-18 Theodore Jay Goodlander High-speed, high capacity, fault-tolerant, error-correcting storage system
JPH0830843B2 (ja) * 1988-05-27 1996-03-27 株式会社ニコン モータドライブカメラ
AU630635B2 (en) * 1988-11-14 1992-11-05 Emc Corporation Arrayed disk drive system and method
US5072378A (en) * 1989-12-18 1991-12-10 Storage Technology Corporation Direct access storage device with independently stored parity
US5263145A (en) * 1990-05-24 1993-11-16 International Business Machines Corporation Method and means for accessing DASD arrays with tuned data transfer rate and concurrency
US5271012A (en) * 1991-02-11 1993-12-14 International Business Machines Corporation Method and means for encoding and rebuilding data contents of up to two unavailable DASDs in an array of DASDs

Also Published As

Publication number Publication date
US5301297A (en) 1994-04-05
EP0521630A2 (en) 1993-01-07
JPH0744322A (ja) 1995-02-14
EP0521630A3 (ja) 1994-02-16

Similar Documents

Publication Publication Date Title
JPH0731579B2 (ja) Dasdアレイの階層を管理する方法および装置
US5166939A (en) Data storage apparatus and method
EP0518603B1 (en) Distributed sparing in DASD arrays
US5303244A (en) Fault tolerant disk drive matrix
US5077736A (en) Disk drive memory
US4989205A (en) Disk drive memory
US4914656A (en) Disk drive memory
EP0485110B1 (en) Logical partitioning of a redundant array storage system
CA2080579C (en) Logical track write scheduling system for a parallel disk drive array data storage subsystem
US8839028B1 (en) Managing data availability in storage systems
US7506187B2 (en) Methods, apparatus and controllers for a raid storage system
EP1376329A2 (en) Method of utilizing storage disks of differing capacity in a single storage volume in a hierarchic disk array
US20030188101A1 (en) Partial mirroring during expansion thereby eliminating the need to track the progress of stripes updated during expansion
CN102164165A (zh) 一种网络存储系统的管理方法及装置
US20050193273A1 (en) Method, apparatus and program storage device that provide virtual space to handle storage device failures in a storage system
US7007193B1 (en) Method and system for reconstructing data serially arranged on a magnetic tape track
JPH06119121A (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees