JPH05158624A - 機能低下モードでの動作時における直接アクセス記憶装置アレイのアクセスを管理するための方法 - Google Patents

機能低下モードでの動作時における直接アクセス記憶装置アレイのアクセスを管理するための方法

Info

Publication number
JPH05158624A
JPH05158624A JP3163040A JP16304091A JPH05158624A JP H05158624 A JPH05158624 A JP H05158624A JP 3163040 A JP3163040 A JP 3163040A JP 16304091 A JP16304091 A JP 16304091A JP H05158624 A JPH05158624 A JP H05158624A
Authority
JP
Japan
Prior art keywords
parity
dasds
dasd
array
parity groups
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3163040A
Other languages
English (en)
Other versions
JPH0727439B2 (ja
Inventor
Richard L Mattson
リチャード・ルイス・マットソン
Spencer Ng
スペンサー・ング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05158624A publication Critical patent/JPH05158624A/ja
Publication of JPH0727439B2 publication Critical patent/JPH0727439B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)
  • Detection And Correction Of Errors (AREA)

Abstract

(57)【要約】 【目的】 直接アクセス記憶装置(DASD)のアレイ
が故障モードで動作する際のアクセス・ローディング量
の増加分を低く抑える。 【構成】 統計的平衡ブロック構造等の、DASD10
9... のアレイの中に複数のパリティ・グループを均一
に分散配置する分散配置法を利用するようにしたこの方
法は、(a)複数のパリティ・グループを形成し、且
つ、形成したそれらパリティ・グループを、平衡ブロッ
ク構造ないしはそれと均等なブロック構造に従って書き
込むステップと、(b)データへの経路のアベイラビリ
ティが(コントローラ101... ないしDASDの故障
によって)失われている場合に、パリティ・グループの
分散配置方式によって決まる最少参照パタンに従って、
アレイ中のその他のDASDにアクセスするステップと
を含んでいる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数台の直接アクセス
記憶装置(direct access storage device:DASD)
から成るアレイを管理するDASDアレイ管理に関する
ものであり、より詳しくは、それら複数台のうちの少な
くとも1台のDASDのアベイラビリティが失われたと
きに、その結果として発生する、そのアレイの中の残り
の構成要素に対するローディング(読取アクセス並びに
書込アクセス)量の増加分を平均化する方法に関するも
のである。
【0002】
【従来の技術】周知の如く、DASDとは、コントロー
ラないしデバイス・アダプタを介してコンピュータ・シ
ステムに接続される、循環式トラック記憶装置である。
1台のコントローラによって、1本の「ストリング」を
成す複数台のDASDを接続することができる。そし
て、その1本のストリングの中の任意のDASDを、互
いに排他的に選択し、アクセスするようにしている。ブ
ラディら(Brady et al.)による、1990年5月24
日付出願の、米国特許出願第07/528999号
(「データ転送速度及び同時性を調節するようにしたD
ASDアレイのアクセスの方法及び手段」 "METHOD AND
MEANS FOR ACCESSING DASD ARRAYS WITH TUNEDDATA TR
ANSFER RATE AND CONCURRENCY" )には、DASD1台
あたりのトラック上のブロック数をK個とし、ブロック
の総個数を(N×K)個とした、データ・ブロック及び
パリティ・ブロックのシーケンシャル・ファイルを、2
次元配列にしたアレイ(一方の次元は空間的次元であり
他方の次元は時間的次元である)の上に配置(マッピン
グ)する方法であって、トラックが1回転する間に、複
数個の対応するコントローラを介してN台のDASDに
同期してアクセスすることによって、そのマッピングを
行なうようにした方法が開示されている。
【0003】『オーウチ特許及びクラーク特許とパリテ
ィ・ブロック』1978年5月30日付で発行された、
オーウチ(Ouchi )の米国特許第4092732号
(「故障した記憶装置内の記憶データを回復するための
システム」"System For Recovering Data Stored In A
Failed Memory Unit")には、同一の論理ファイルに所
属する複数個のデータ・ブロックを、1本のストリング
を形成してはいるが故障に関しては互いに独立している
(N−1)台のDASDに分散配置すると共に、第N番
目のDASDにパリティ・ブロックを記録するようにし
た分散配置法が開示されている。このオーウチ特許で
は、そのパリティ・ブロックを、その他の(N−1)個
のブロックの夫々の内容の間の排他的ORを取ったもの
としている。ある1台のDASDがアクセス不能になっ
た場合には、残りの(N−2)台のアクセス可能なDA
SD上に記憶させてある夫々のブロックと、パリティ・
ブロックとの間の、排他的ORを取ることによって、そ
のアクセス不能DASDの内容を回復することができ
る。また、パリティ・ブロックのアベイラビリティが失
われたときにも、同様にして回復することができるよう
にしている。1988年8月2日付で発行された、クラ
ークら(Clark etal.)の米国特許第4761785号
(「記憶装置へのアクセス機能を強化するパリティ分散
法」"Parity Spreading to Enhance Storage Access"
)は、このオーウチ特許を改良したものである。即
ち、複数個のパリティ・ブロックを複数台のDASDに
対して分散配置して、1台のDASD(オーウチ特許に
おけるパリティ用のDASD)のアベイラビリティが失
われただけで、全てのパリティ・ブロックのアベイラビ
リティが失われてしまうことのないような配置の仕方を
するようにしたものであって、これは特に、機能低下モ
ードで動作する場合を考慮したものである。
【0004】『ブロック間パリティと特徴的なパリティ
符号ブロック』一般的には、各々のデータ・ブロックに
パリティのための追加部分ないしその均等物を付加して
おき、それを用いてブロック間誤りの検出ないし訂正を
行なえるようにしている。種々の効率的なブロック間符
号(ハミング符号、巡回冗長検査符号、リード・ソロモ
ン符号)それ自体については、他の文献において取扱わ
れているとおりである。それらのパリティ符号とは対照
的に、パリティ・ブロックは、オーウチ特許に記載され
ているように、(N−1)個のブロックから成るブロッ
ク・シーケンスのうちの1つないし複数のデータ・ブロ
ックのアベイラビリティが失われた場合に関係したもの
である。そしてその場合に、(N−1)個のブロックか
ら成るブロック・シーケンスを包括するように予め定め
てあるパリティ・ブロックと、アベイラビリティを失っ
ていないその他のブロックとの間の排他的ORを取るこ
とによって、アベイラビリティを失ったデータ・ブロッ
クを再構成することができるようにしたものである。
【0005】『パターソンのDASDアレイ・レベル』
1988年6月1日から3日にかけて開催された ACM S
IGMOD 会議において発表された、パターソンら(Patter
son et al.)による、「低価格ディスク装置の冗長性ア
レイの具体例」なる論文("A Case for Redundant Arra
ys of Inexpensive Disks (RAID)", ACM SIGMOD Confer
ence, Chicago Illinois, June 1-3, 1988)は、データ
のアベイラビリティを増強するための、冗長性データ並
びに複数台のDASDの様々な編成法を論じている。こ
の点に関して、このパターソン論文に記載されているの
は、論理レコードを物理トラックへマッピングし、ま
た、DASDアレイの縦列の上下順位に応じてDASD
アレイにアクセスすることによって、小量アクセス要求
と大量アクセス要求との双方に適切に対処するようにす
るということである。このパターソン論文には更に、旧
データ、新データ、及び旧パリティの間の排他的ORを
取ることによって、新パリティ・ブロックを算出すると
いう方法も説明されている。パターソンの第3レベル、
即ち第3のアレイ・タイプは、N台のDASDに対して
同期して読取り及び書込みを行なうようにしたものであ
る。その構成によれば、(N−1)台のDASDにデー
タを保持させ、更に別の1台のDASDにパリティを保
持させるようにしており、そのパリティは、パリティ保
持用DASD以外の全てのDASD、即ち全てのデータ
用DASDに関するパリティである。これは、換言すれ
ば、グループ全体に対して1台の検査用DASDを備え
るようにしているということである。故障したDASD
の内容を復元するには、オーウチ特許と同じ方法を取っ
ている。パターソンの第4レベルは、小量読取アクセス
並びに小量書込アクセスに関する性能を向上させたもの
である。これを達成するために、複数のブロックをアレ
イの縦列に沿って記憶させるようにしており、その際
に、第1番目のタイム・スロット(DASDの第1セク
タ)においては、第1番ブロックから第N番ブロックま
でを、夫々第1番DASDから第N番DASDまでに記
憶させ、また、第2番目のタイム・スロット(DASD
の第2セクタ)においては、第(N+1)番から第2N
番までのブロックを記憶させるようにし、以下同様に記
憶させて行くことができるようにしている。従って、第
K番目のタイム・スロット(DASDの第Kセクタ)に
おいては、第((K−1)×N+1)番ブロックから第
KN番ブロックまでが対応するDASDに記憶されるこ
とになる。このように縦列トラック構成としたことに加
えて、この第4レベルでは、夫々のDASDに対して個
別にアクセスすることもできるようにしてある。これに
よって、小量転送の際に塞り状態となるDASDの台数
を非常に少なくする一方、大量転送の際には、N台のD
ASDに対して同期してアクセスすることができるよう
にしている。
【0006】『パリティ・グループの定め方』パターソ
ン論文によって、データ・ブロックとパリティ・ブロッ
クとを次のように分散配置することが公知となってい
る。即ちその分散配置の方法は、C個のコントローラ
と、そのコントローラの1個あたりS台のDASDから
成るDASDストリングとから構成したC×Sアレイの
中において、K本(K<C)の異なったストリング中の
K個(K<C)の異なったDASDの、各々の物理エリ
ア(即ち物理領域)によって1つの「パリティ・グルー
プ」を構成するようにし、そしてそれらエリア(即ち領
域)のうちの1つを、その他の(K−1)個のエリア
(即ち領域)に包含されているデータのパリティとする
というものである。このように、1つのパリティ・グル
ープを成す複数個のブロックを、故障に関して互いに独
立しているK台のDASDの間に分散し、即ちK本のス
トリングの間に分散するようにしたことの効果の1つ
は、データ障害間平均時間(mean time between data f
ailure: MTBF)が、個々の物理DASDにおけるデ
ータ障害間平均時間よりも遥かに長くなっているという
ことである。そうなるのは、アレイの中の複数の個々の
ドライブ装置のうちの1つが(或いは1個のコントロー
ラが)故障した後にも、アレイは機能低下モードで動作
を続けることができるからである。更には、故障したD
ASD上のデータを、故障していない残りのK台のDA
SD上のデータ及びパリティに基づいて再生することも
可能である。
【0007】『機能低下モードにおけるアレイのローデ
ィング量及び動作』アレイ・ワーク(アレイの仕事量 :
array work: AW)は、複数台のDASDが実行する読
取要求及び書込要求の回数で表わすことができる。それ
らの要求の分配状態は、データの分散配置状態によって
決まるものである。更にこの、データ(冗長データを含
む)の分散配置状態は、ロード量の平均化の仕方と、回
復処理の仕方と、機能低下モードにおける動作態様とに
よって決まるものである。ちなみに、読取要求ないし書
込要求の各々は、複数回の置換読取動作(R)と置換書
込動作(W)とから構成されるものである。アレイが
「機能低下モード」で動作していると言うとき、それ
は、データへ至る経路中に置かれている構成要素(例え
ばコントローラやDASD等)のアベイラビリティが
(多くの場合、フォールト、障害、ないし割込等によっ
て)失われているにもかかわらず、そのアレイが動作を
継続していることを意味している。従来例によって、デ
ータ・ブロック及びパリティ・ブロックをアレイの複数
台のDASDに(従ってそれらDASDのディスクに)
分散配置するための分散配置法が幾種類か教示されてい
る。しかしながら、それら従来の分散配置法は、所与の
DASDないしコントローラがアベイラビリティを失っ
たときには、その他の((S×C)−1)台のDAS
D、ないしはそれより更に少数のDASDに対するロー
ド量に、著しい不均衡が発生するものであった。この不
均衡の結果として生じることのうちの1つとして、特定
の数台のDASDに対するアクセスの回数が、その他の
DASDに対するアクセスの回数と比較してはるかに多
くなるということがあり、それによって、アレイの構成
要素とデータへの経路との双方における、ローディング
量並びに性能の統計値が変化していた。
【0008】
【発明が解決しようとする課題】本発明の目的は、1台
ないし複数台のDASD上のデータのアベイラビリティ
が失われた場合にも、そのデータを復元してアレイが動
作を続けることができるようにし、しかもその際に、D
ASDの1台あたりのアクセスのロード量の増加分を可
及的に低く抑えることができるようにした、DASDア
レイに対するアクセスを管理するための方法及び手段を
考案することにある。
【0009】
【課題を解決するための手段】本発明は、互いに同一ま
たは互いに異なった大きさの複数のパリティ・グループ
を、アレイの複数の構成要素の間に均一に分散配置する
ものである。更に、それらパリティ・グループの大きさ
を小さく抑えることによって、機能低下モード即ち故障
モードで動作する際の、アレイ中の各DASDに対する
ローディング量の増加分を可及的に低く抑えられること
が判明している。本明細書で使用する「ブロック」とい
う用語には2つの意味がある。第1の意味は、データな
いしパリティの符号化並びに記録を行なうために使用す
る、標準サイズ(例えば4096バイト)の情報タイプ
のことである。第2の意味は、通常は実験の設計等に利
用されている決定論的プロセスを用いてアクセスのロー
ド量を均一化する、複製を含めた複数のパリティ・グル
ープの、組合せ的分散配置法を意味するものである。本
発明は、その好適実施例においては、C個のコントロー
ラと、それらコントローラの1個あたりS台とした複数
台のDASDとから構成したC×SのDASDアレイ
に、複数のパリティ・グループを分散配置及び記録する
際に、統計的平衡インコンプリート・ブロック構造(st
atistically balanced incomplete block design: 統計
的BIBD)を用いて、その分散配置及び記録を近似的
に均一に行なうようにしている。また、この構成を実現
するために、複数台のDASDの各々を、N個の互いに
等しい大きさの領域即ち記録エリアに区分し、そして区
分したそれらN個の領域を、次の割当て方で複数のパリ
ティ・グループに割当てるようにしている。 (1)同一のパリティ・グループに所属する任意の2つ
の領域は、互いに異なったDASD上に配置されるよう
にする。 (2)1台のDASD上のN個の領域の各々は、N個の
互いに異なったパリティ・グループの1つずつに割当て
られるようにする。 (3)2台のDASDから成るDASDペアの各ペアに
ついて、そのペアの双方のDASDの夫々に所属する2
つの領域を共に包含するパリティ・グループの個数が厳
密にM個であるようにする。以上の考慮点を具体的に実
現するための、本発明の方法の効果的な態様としては、
(a)パリティ・グループの1つあたりのエリアの個数
をK個とした複数のパリティ・グループを形成し、且
つ、形成したそれら複数のパリティ・グループを、決定
論的プロセスにより生成した前記アレイ内の、対応する
複数台のDASDに夫々に略々均一に書き込むステップ
と、(b)指定されたDASD上のアドレス可能な情報
への経路のアベイラビリティが失われているときに、そ
れが失われていることに応答して、パリティ・グループ
の分散配置の均一度によって決まる最少参照パタンに従
って、その指定DASD以外の残りの((C×S)−
1)台のDASDにアクセスするステップとを含んでい
るようにした態様がある。この新規な利用法を十分に実
現し得る平衡ブロック構造には、BIBD以外にも、ラ
テン・スクエア(LatinSquare)や、アダマール・マト
リクス(Hadamardmatrix )等がある。更には、各パリ
ティ・グループの大きさ(エリアの個数)をコントロー
ラの個数より小さく抑えておけば、即ちK<Cとしてお
けば、余ったDASD空間を利用することによって、D
ASDの1台あたりのローディング量を更に低減させる
ことができる。ここで、各1台のDASDがAW回のア
クセス要求に接するものとすれば、領域の1個あたりの
要求の量即ちワーク・ロードの量は(AW/N)とな
る。ある1台のDASDが故障、またはその他の原因で
アベイラビリティを失った場合には、その1つの領域の
中のデータを復元するには、その領域が所属しているパ
リティ・グループ内のその他の(K−1)個の領域にア
クセスすれば良い。この場合、その他の((C×S)−
1)台のDASDのうちのどのDASDも、アベイラビ
リティを失ったDASDとの間で共有しているパリティ
・グループの数は、厳密にM個にしてあるため、それら
DASDはいずれも、(M×AW/N)のロードを増加
分のロード量として受け取ることになる。
【0010】
【実施例】本発明は、統計的平衡ブロック構造等の、D
ASDアレイの中に複数のパリティ・グループを均一に
分散配置する分散配置法の、新規な利用法から生まれた
ものである。この新規な利用法は、(a)複数のパリテ
ィ・グループを形成し、且つ、形成したそれらパリティ
・グループを、平衡ブロック構造ないしはそれと均等な
ブロック構造に従って書き込むステップと、(b)デー
タへの経路のアベイラビリティが(制御装置ないしDA
SDの故障によって)失われている場合に、パリティ・
グループの分散配置法によって決まる最少参照パタンに
従って、アレイ中のその他のDASDにアクセスするス
テップとを含むものである。
【0011】ブロック構造を決定するための実験の設計
は、複数のテスト・オブジェクトを徹底的にあらゆる分
け方で複数のサブセット(即ちブロック)に構成した上
で、それらのオブジェクトに対して然るべき実験的方式
を適用するように設計をする。そうすれば、それらオブ
ジェクトのパタンと複製状態とを調べることによって、
その実験的方式に対する様々な応答が、はたして偶然の
結果であるのか、それとも1つないし幾つかの共通ファ
クタによる必然的な結果であるのかを識別することがで
きる。ただし、徹底的にあらゆる分け方をするにして
も、どれ程の規模でどの程度まで徹底的にそれを行ない
得るかは、時間的な余裕、実験の経済性、及び感度によ
って制約される。そのため、実際に多く用いられている
のは、オブジェクトが結果的に均一に分散配置されるよ
うにする、ブロック構造様式である。この種の構造様式
に該当するものとしては、平衡インコンプリート・ブロ
ック構造(Balanced Incomplete BlockDesign: BIB
D)や、ラテン・スクエア、それにアダマール・マトリ
クス等がある。更には、ドーバー出版社(Dover Public
ations)が著作権を持つ、1971年、1988年刊、
ラグハバロ(Raghavarao)による「実験設計における構
造並びに組合せの問題」("Constructions AndCombinat
orial Problems In The Design Of Experiments" )
と、アカデミック・プレス社(Academic Press Inc. )
が著作権を持つ1972年刊、バーマンとフライヤ(Be
rman and Fryer)による「組合せ学入門」(Introducti
on to Combinatorics )も参照されたい。以下の説明
は、BIBDを用いた方法ステップを明らかにするため
のものである。
【0012】『平衡インコンプリート・ブロック構成
(BIBD)とDASDアレイ』v個の「バラエティ」
と呼ばれるオブジェクトから成る集合(セット)におい
て、その集合の中の各々のオブジェクトv(i) をr回に
亙って複製すると、それによって、(v×r)個のオブ
ジェクトから成る集合体が形成される。そして、それら
(v×r)個のオブジェクトを、b個の「ブロック」と
呼ばれる部分集合にして、分散配置する。それらブロッ
クは、その各々が、v個のバラエティのうちのk個のバ
ラエティを包含しているようにし、しかも、1つのブロ
ックが、同一のバラエティを2回以上重複して含むこと
がないようにする。こうした場合、次の式が成り立つこ
とになる。 v×r=b×k (1) 更に、2つのバラエティv(i) 、v(j) から成るバラエ
ティ・ペアの各ペアについて、そのペアを含んでいるブ
ロックの個数が、必ずλ個であるようにする。存在する
バラエティ・ペアの種類の総数は(v×(v−1)/
2)とおりであるから、各ブロックが包含するバラエテ
ィ・ペアは、(v×(v−1)/2)とおりのうちの
(k×(k−1)/2)とおりのペアである。また、あ
る特定の1つのバラエティを含んでいるブロックの個数
は、それがいずれのバラエティであっても、必ずr個で
あるため、特定の1つのバラエティは、(r×(k−
1))とおりのバラエティ・ペアとして現われることに
なる。以上から、次の式が導かれる。 λ×v×(v−1)/2=b×k×(k−1)/2 (2) λ×(v−1)=r×(k−1) (3) 言い換えるならば、上掲の式(1)〜(3)を満足する
ブロックのシステムが(b,v,r,k,λ)BIBD
と呼ばれているものである。このブロックのシステム
は、以下の条件を満たすようにしつつ、v個のバラエテ
ィをb個のブロックに形成した構成であると言える。 (1)各々のブロックが包含するバラエティの個数は、
必ずk個であるようにする。 (2)いずれのバラエティ・ペアについても、そのバラ
エティ・ペアを成している2つのバラエティを共に包含
するブロックの個数は、必ずλ個であるようにする。 (3)各々のバラエティが複製される回数は、必ずr回
であるようにする。 斯かるBIBDに基づいてDASDアレイを構成するこ
とができ、それには次の写像を行なえば良い。 バラエティ → DASD ブロック → パリティ・グループ 従って、アレイの大きさ(C×S)=v、パリティ・グ
ループの個数=b、各パリティ・グループの大きさ(こ
こでは定数とする)K=k、DASDの1台あたりの領
域の個数N=r、そして、 M=λ、とすれば良い。以上のようにして得られるDA
SDアレイは、次の特性を有するものとなる。 (1)各々のパリティ・グループは、K台の互いに異な
ったDASDに関与している。 (2)各々のDASDは、N個のパリティ・グループに
関与している。 (3)任意のDASDペアを成している2台のDASD
が共に関与しているパリティ・グループの個数はM個で
ある。
【0013】『1個のパリティ・グループの複数個の領
域(ブロック)を複数台のDASDに分散配置するため
の従来例に係る分散配置法』図1に関して説明すると、
同図は、高いアベイラビリティを得るための解決法とし
て提唱されているパターソンの方法に従って、1個のパ
リティ・グループの中の複数個のデータ・ブロックを、
アレイ中の複数台の異なったDASDに分散配置するよ
うにした、分散配置法を示したものである。この場合の
アレイは、コントローラ1個あたりの台数をS台とした
複数台のDASD(9、11、13のストリング、1
5、17、19のストリング、21、23、35のスト
リング、及び27、29、31のストリングから成る)
と、C個のコントローラ1、3、5、及び7とから構成
した矩形構造のアレイとなっている。このアレイは、合
計(C×S)台のDASDを含んでいる。K本の異なっ
たストリング中のK台の異なったDASDの、その各D
ASDの1つずつの物理エリア(即ち物理領域)によっ
て1つの「パリティ・グループ」を構成するようにして
おり、しかも、そのパリティ・グループの中では、それ
らエリア(即ち領域)のうちの1つを、その他の(K−
1)個のエリア(即ち領域)の中に含まれているデータ
のパリティとしている。読取要求の処理に関しては、ア
レイをこのように構成することによって、アレイの処理
性能が低下するということはない。しかしながら、書込
要求の処理に関しては、アレイをこのように構成したな
らば、その書込要求の処理のために、複数回の読取アク
セス並びに書込アクセスと演算動作とが必要になる。こ
れについて更に説明すると、書込要求を受けたならば、
先ず最初に、旧データ・ブロック並びに旧パリティ・ブ
ロックの読取りを行なう必要がある。続いて、旧データ
・ブロック、新データ・ブロック、及び旧パリティ・ブ
ロックの間の排他的ORを取ることによって、新パリテ
ィを算出する必要がある。更に続いて、新データブロッ
ク及び新パリティブロックを、該当するデータDASD
並びにパリティDASDのアレイ位置へ書き込まなけれ
ばならない。従って、読取要求を処理するためには、ア
クセスを1回行なえば済むのに対して、書込要求の処理
には4回のアクセスが必要とされている。あるアレイ
が、R回の読取要求並びにW回の書込要求に接する場
合、それらのR回の読取要求とW回の書込要求とがアレ
イのロードへ変換されたならば、DASDへの(R+4
W)回のアクセスというロード量になる。特に、このロ
ード量が(C×S)台のDASDの間に均一に分配され
るものとすれば、各々のDASDに加わるロード量は、
(R+4W)/(C×S)回のアクセスというロード量
になる。
【0014】次に図2に関して説明すると、同図に示し
た分散配置法は、パリティ・グループを形成している複
数個のデータ・ブロックを、DASDアレイの行ベクト
ルに沿って分散配置すると共に、複数のパリティ・グル
ープの夫々のパリティ・ブロックの全てを、1本の列ベ
クトルを形成している複数台のDASD、即ち同一の1
個のコントローラに接続した複数台のDASDの上へマ
ッピングするようにしたものである。このアレイの各パ
リティ・グループは、K個(K<C)のエリアを備えて
いる。それらK個(K<C)のエリアは、図中に
「a」、「b」、等々の文字を記入したエリアであり、
それらのエリアにデータを保持するようにしている。そ
の他のエリアは、図中に、「pa」、「pb」、... 、
「pz」の文字を記入したものであり、それらを使用し
て、その各々に対応したK個(K<C)のデータ・エリ
アから得られたパリティ情報を保持するようにしてい
る。良く知られている如く、この図2に示したように、
全てのパリティ情報を同一のストリング(縦列)の中の
複数台のDASDに保持するようにした場合には、アク
セスの分配は均一にはならない。即ち、パリティ情報用
ストリング中の各DASDが接するアクセスのロード量
は(2W/S)回のアクセスとなるのに対して、その他
のストリング中の各DASDが接するアクセスのロード
量は(R+2W)/(S×(C−1))回のアクセスと
なる。このようにロード量が不均一に分配されると、そ
れによって性能が低下し、望ましくないということが一
般的に認められている。
【0015】次に図3及び図4について説明する。これ
らの図は、複数のパリティ・グループを形成している複
数個のデータ・ブロックをDASDアレイの中に分散配
置する方法であって、いずれか1台のDASDが故障し
た際のデータの復元を容易にした分散配置法を示したも
のである。
【0016】図3においては、アレイのコントローラ1
01、103、105、及び107は、夫々、DASD
のストリング109、111、ストリング115、11
7、ストリング121、123、及びストリング12
7、129に接続してある。このシステムそれ自体は従
来のものであり、目的とするのは、このシステム上にお
けるアクセスのロード量を平均化することであるが、そ
の説明を分かり易くするために、ここでは、パリティ・
エリアを分散配置するC×Sのアレイとしては、4×2
の大きさのアレイを共通して用いるようにした。図3の
4×2のアレイでは、DASD109、115、121
の各々には、「a」と記した、データを包含するための
物理空間を設けてある。一方、DASD127には、
「pa」と記した物理空間を設けてあり、この物理空間
は、「a」と記した3つの物理空間に関するパリティ情
報を保持するために使用する物理空間である。また同様
に、それらDASD109、115、127の各々に
は、「b」と記したデータを包含するための物理空間を
設けると共に、第3番目のDASD121には、「p
b」と記した物理空間を設けてある。この構成では、K
=3であることから、各々のDASDのうちの、1/
(K+1)=25%の部分が、パリティ情報のために使
用されるようになっている。
【0017】以上において、アレイの仕事量(アレイ・
ワーク)AWが、この図3に示したアレイ中の複数の物
理データ領域の間に、均一に分配されるものとすれば、
それら物理データ領域の各々が、(R+W)/(K×S
×C)回の要求に接することになる。パリティ機能が実
行されるため、この仕事量が実アクセスに変換されると
きには、データ領域の各々に対する(R+2W)/(K
×S×C)回の実アクセスと、パリティ領域の各々に対
する、2W/(S×C)回の実アクセスとに変換される
ことになる。従って、各々のDASDが接することにな
る実アクセスの回数は、そのDASDがこのアレイ中の
どの位置に配置されているものであるかにかかわらず、
常に(R+4W)/(S×C)回になる。
【0018】次に図4に関して説明する。アレイ中のあ
る1台のDASDが故障した場合でも、このアレイは機
能し続けることができるが、ただしそのときには、残存
しているデータとパリティとからデータを復元するとい
う作業を行なうことによって機能低下モードで機能する
ことになる。例を挙げて説明すると、例えばDASD1
09が故障した場合には、このDASD109の、領域
「a」の中のデータに対する読取要求に応えるために
は、先ず、DASD115の領域「a」、DASD12
1の領域「a」、及びDASD127の領域「pa」
の、夫々の対応するフィールドを読み取り、その上で、
DASD109の領域「a」にあったデータを復元する
ようにすれば良い。従って、故障したDASDのデータ
領域に対する読取要求があった場合には、その1つの読
取要求が、K=C−1=3回の読取要求に変換されるこ
とになる。一方、DASD109の領域「a」に対する
書込要求に応えるためには、DASD115の領域
「a」並びにDASD121の領域「a」の中の、対応
する夫々のフィールドを読み取り、そして新たなパリテ
ィを構成した上で、その新たなパリティをDASD12
7の領域「pa」に書き込むようにすれば良い。従っ
て、故障したDASDのデータ領域に対する書込要求が
あった場合には、その1つの書込要求が、K−1=C−
2=2回の読取要求に加えて、更に1回の書込要求に変
換されることになる。
【0019】アレイ・ワークAWが、この図4に示した
アレイ中の複数の物理データ領域の間に均一に分配され
るものとすれば、それら物理データ領域の各々は、既述
の如く(R+W)/(S×C×K)回の要求に接するこ
とになる。ここで、DASD109が故障したとして
も、DASD111、117、123、及び129に関
しては、その動作は変わることはない。即ち、これらD
ASD111、117、123、及び129の各々は、
DASD109が故障しても尚変わることなく、(R+
4W)/(S×C)回の実アクセスに接することにな
る。
【0020】その他のDASD115、121、127
に関しては、それらのDASDのデータ領域に対する1
回の読取要求は、そのまま1回の読取要求となる。ま
た、それらDASD115、121、127のうちのい
ずれかの、データ領域「a」、「b」、「c」のうちの
いずれかに対する1回の書込要求は、既に説明したよう
にして、2回の読取要求と2回の書込要求とに変換され
る。一方、それらDASD115、121、127のう
ちのいずれかの、データ領域「d」への書込要求は、1
回だけの書込要求となる。従って、DASD115、1
21、127のうちのいずれか1つに対する(R+W)
/(S×C)回の要求は、k=C−1としたとき、(K
R+(4K−3)W)/(S×C×K)回のアクセスに
変換されることになる。更にこれに加えて、DASD1
09に対する読取要求を受けた場合には、その読取要求
の1回について、DASD115、121、127の各
々に対する夫々1回ずつの読取要求が発生されることに
なり、また、DASD109に対する書込要求を受けた
場合には、その書込要求の1回について、DASD11
5、121、127の各々に対する夫々1回ずつの読取
要求または書込要求が発生されることになる。従って、
それらDASD115、121、127の各々に関して
は、その1台のDASDに対する合計ロード量は、K=
C−1としたとき、(2KR+(5K−3)W)/(S
×C×K)回のアクセスとなる。以上の図4に関する説
明から分かるように、アレイ中の複数台のDASDのう
ちの1台が故障しているときには、そのアレイの全体に
対する合計ロード量は、[R+4W+{((K−1)R
+(K−7)W)/(S×C)}]回のアクセスという
ロード量になる。
【0021】『本発明の方法におけるパリティ・グルー
プの大きさを制限することによる効果』次に図5及び図
6について説明する。これらの図は、1台のDASDが
アベイラビリティを失うことによって発生する、ストリ
ングないしアレイ中のその他のDASDに対するロード
量の不均一状態を図示したものである。この点に関し、
図5は、S=2、C=4、K=2としたアレイにおけ
る、データ領域とパリティ領域とを示している。DAS
D109が故障しているため、このDASD109の領
域「a」の中のデータに対する要求を受けた場合には、
その結果、DASD115の領域「a」と、DASD1
21の領域「pa」とがアクセスされることになる。し
かしながら、この図5の場合には、DASD127への
アクセスは行なわれない。従って、アレイ全体に対する
ロード量は、その分だけ低減されることになる。具体的
には、この図5に示した例では、K=2としているた
め、1台のDASDが故障することによって生じる、ア
レイ全体のロード量の増加分は、(R−5W)/8であ
る。これと比較して、図4に示した、K=3としたアレ
イにおいては、ロード量の増加分は、(2R−4W)/
8になる。Kの値を、K=3からK=2へ変更すること
に伴う不利益としては、DASDの空間のうちのより多
くの部分が、パリティ・データのために割かれてしまう
ということがある。即ち、K=3のときには、各々のD
ASDの4分の1だけがパリティ・データを保持するた
めに使用されるのに対し、K=2としたときには、各々
のDASDの3分の1までが、パリティ・データの保持
に使用されることになる。一般化して表わすならば、各
々のDASDの、1/(K+1)が、パリティ・データ
の保持に使用されることになる。
【0022】次に図6について説明する。同図は、S=
ストリングの長さ、C=コントローラの個数、(R/
W)=読取書込比、及びKの、夫々の値が、機能低下状
態にあるアレイのロード量に対して、どのように影響す
るかを、ストリングの長さSを「2」と「7」、読取書
込比を「1」と「3」、コントローラの個数を「3」か
ら「128」までの間の値、それに、Kの値を「3」か
ら「64」の値として、図示したものである。各々のグ
ラフの縦軸は、正常状態のロード量のアクセス回数に対
する、機能低下状態のロード量のアクセス回数の比を示
すように正規化してある。それらのグラフから分かるよ
うに、従来のアレイにおける標準仕様であるK=Cとし
たときには、正常モード(正常状態)のアクセス回数に
対する機能低下モード(機能低下状態)のアクセス回数
の比は、コントローラの個数の増加関数となっているの
に対し、Kの値を固定したときには、コントローラの個
数を増すにつれて、このアクセス回数比はその増加率が
減少し、或いはそれ自体が減少している。
【0023】『本発明に係る均一分散配置法と該均一分
散配置法のローディング量に対する効果』次に図7〜図
10について説明する。これらの図は、アレイ中の複数
台のDASDの間に複数のパリティ・グループを分散配
置する際に、平衡ブロック構造による分散配置法を用い
ることによって、それら複数台のDASDのうちの1台
のDASD上のデータのアベイラビリティが失われるこ
とにより発生するDASDの1台あたりのロード量の増
加分を可及的に低く抑えるという、本発明の原理を示し
た図である。本発明は、複数のパリティ・グループを複
数台のDASDに割当てる際に、以下のようにして割当
てるようにしたものである。即ち先ず、1)所与の1つ
のパリティ・グループは、いかなるストリング中にも1
度しか現れないようにする。これによって、1個のコン
トローラが故障した場合にも、各パリティ・グループの
メンバのうちで、その故障に影響されてアベイラビリテ
ィを失うメンバは1つだけで済むことになり、その故障
したコントローラのストリングに対するデータ・アクセ
スを、その他のK本のストリングの中にある、パリティ
・グループのその他のK個のメンバに基づいて復元する
ことができるようになる。また、2)複数のパリティ・
グループを複数台のDASD上に配置するに際しては、
ある1本のストリング上の、1台の故障DASDへのア
クセスが発生したならば、その結果、その他の(C−
1)本のストリング上の、その他の(S×(C−1))
台のDASDへの均一に分配されたアクセスが発生する
ように配置する。こうすることによって、ストリングど
うしの間のスキューを排除することができる。また、以
上のようにしたパリティ・グループの配置の仕方の具体
例を図8に示した。更に図8について説明すると、同図
は、K=2、S=2、C=4としたときの夫々のデータ
領域を示したものである。それらデータ領域の特性は次
のとおりである。先ず、全てのDASDが正常に機能し
ているときには、このアレイ中の、S×C台のそれらD
ASDの全てにロード量が均一に分配されている。そし
て、それらのうちのいずれか1台のDASDが故障した
ならば、機能低下時ロードが次のように分配されること
になる。即ち、その故障したDASDが所属しているス
トリングの中の、S−1=1台のDASDについては、
そのアクセスのロード量は変化しない。一方、アレイ中
のその他のS×(C−1)=6台のDASDについて
は、それ以外の残りの機能低下時ロードが、それらのD
ASDの間で均一に分配されることになる。従って、1
台のDASDが故障した際にも、アレイ中のいずれのス
トリングどうしの間にもスキューは発生しないようにな
っている。これを要約して示したのが図9であり、同図
は、K=2、S=2、C=4とし、更にデータ領域を図
示のようにした具体的なアレイについて、それを示した
ものである。これに関する状態については、図10にも
要約して示してあり、図10は、複数のパリティ・グル
ープを複数台のディスク装置に割当てる際に、機能低下
時ロードを分担するS×(C−1)台のディスク装置
に、その機能低下時ロードが均一に分散されるように割
当てをした、任意のアレイにおける状態を示したもので
ある。
【0024】『本発明の方法に係る均一分散配置法の具
体例』以上に説明したマッピング(配置の仕方)の1つ
の具体例としては、以下に示す、b=15、v=10、
r=6、k=4、λ=2としたBIBDを挙げることが
できる。 表1 ブロック A B C D E F G H J K L M N P Q 1 1 1 1 3 2 2 1 2 3 4 1 2 3 4 2 3 4 2 4 4 3 5 6 5 5 8 5 6 7 5 6 7 3 5 6 7 6 7 7 6 9 9 8 8 8 9 10 4 8 9 10 7 8 9 10 10 10 10 9 このマッピングは、DASDの台数が10台、パリティ
・グループの数が15であって、各DASDが6つの領
域を持ち、各パリティ・グループが4つの領域から成る
ようにしたアレイに適用可能なものである。 表2 パリティ・グループの定め方 DASD1 DASD2 DASD3 DASD4 DASD5 ーーーーー ーーーーー ーーーーー ーーーーー ーーーーー | A | | A | | B | | C | | A | | B | | D | | D | | D | | E | | C | | F | | E | | E | | H | | D | | G | | G | | F | | K | | H | | J | | K | | L | | L | | M | | N | | P | | Q | | N | ーーーーー ーーーーー ーーーーー ーーーーー ーーーーー DASD6 DASD7 DASD8 DASD9 DASD10 ーーーーー ーーーーー ーーーーー ーーーーー ーーーーー | B | | C | | A | | B | | C | | F | | G | | E | | F | | G | | H | | H | | J | | K | | L | | J | | J | | M | | M | | M | | L | | K | | P | | N | | N | | P | | Q | | Q | | Q | | P | ーーーーー ーーーーー ーーーーー ーーーーー ーーーーー
【0025】『本発明の方法による均一分散配置の生
成』BIBDを生成するための方法には幾つかの異なっ
た方法がある。それらの方法のうちの1つに、格子構造
とする方法があり、それによれば、次の諸元を持った構
造が得られる。 b=n×(n+1)、v=n×n、r=n+1、k=n、λ=1 簡単な格子構造としては、バラエティの集合を含んだ正
方アレイに基づいたものがある。その具体例を示すなら
ば、3×3=9個のバラエティの集合については、その
正方アレイは次のようになる。 1 2 3 4 5 6 7 8 9 格子構造のうちには、n種類のバラエティをn個のブロ
ックから成る複数のグループに分けて形成した、複数個
のブロックを利用するようにしたものがある。それら複
数のグループのうちの第1のグループは、アレイの各1
行ごとに1個のブロックから形成したグループとする。
第2のグループは、アレイの各1列ごとに1個のブロッ
クから形成したグループとする。その他の(n−1)個
のグループは、n×nの正方アレイの上に、その要素が
文字a、b、c、d、...、nであってそれら各文字が
各1行に1つだけ存在し、且つ、各1列にも1つだけ存
在するようにした複数のアレイを重ね合わせたものとす
る。従って、 a b c a b c c a b b c a b c a c a b これら2つのアレイを使用して、3個のブロックから成
るグループを2つ生成することができ、それらの各ブロ
ックは、1つ1つの文字に対応したバラエティによって
規定されたものとなる。この場合では、左側のアレイの
文字「a」によって、ブロック(1、5、9)が生成さ
れる。こうして得られるブロック構成における夫々のブ
ロックは次の表のようになる。 表3 ブロック A B C D E F G H I J K L 1 4 7 1 2 3 1 2 3 1 2 3 2 5 8 4 5 6 5 6 4 6 4 5 3 6 9 7 8 9 9 7 8 8 9 7
【0026】パリティ・グループの大きさが一定でなく
とも、1台のDASDが故障したときにはワークロード
の分配量が均一になるという条件を満足するようにし
た、パリティ・グループの定め方の具体例としては、次
のものを挙げることができる。 ここで、S=7、N=7、パリティ・グループの大き
さ:3及び4、M=3である。
【0027】『拡張』これから分かるように、パリティ
・グループが割当てられる複数のデータ・エリアのうち
の少なくとも2つのデータ・エリアが互いに等しくな
い、ないしは互いに大きく異なっているアレイであって
も、そのアレイの複数台のDASDへ複数のパリティ・
グループを書き込む際には、それらパリティ・グループ
を平衡分散配置、即ち均一分散配置とすることが可能で
ある。更には、それら複数台のDASDのうちに、未割
当ての記録空間を持つものがあれば、その空間を好適に
利用して、その空間に、再構成したパリティ・グループ
を記憶させるようにしても良く、そうすれば、参照を行
なうたびごとにパリティ・グループの構成要素の間の排
他的ORを取らずとも、そのDASDからの読取りを行
なえば良いようになる。本発明の以上の拡張、並びにそ
の他の拡張は、本発明の概念並びに範囲から逸脱するこ
となく行ない得るものである。
【図面の簡単な説明】
【図1】1つのパリティ・グループを構成している複数
個のデータ・ブロックを、アレイ中の複数台の異なった
DASDに分散配置するようにした、従来例に係る分散
配置法を示した図である。
【図2】パリティ・グループを構成している複数個のデ
ータ・ブロックをDASDアレイの行ベクトルに沿って
分散配置し、しかも全てのパリティ・ブロックを、同一
の1個のコントローラに接続した複数台のDASDから
成る1本の列ベクトルの上に配置するようにした、分散
配置法を示した図である。
【図3】複数のパリティ・グループを形成している複数
個のデータ・ブロックをDASDアレイの中に分散配置
する方法であって、いずれか1台のDASDが故障した
際のデータの復元を容易にした分散配置法を示した図で
ある。
【図4】複数のパリティ・グループを形成している複数
個のデータ・ブロックをDASDアレイの中に分散配置
する方法であって、いずれか1台のDASDが故障した
際のデータの復元を容易にした分散配置法を示した図で
ある。
【図5】1台のDASDのアベイラビリティが失われる
ことによって発生する、そのストリングないしアレイ内
の残りのDASDに対するロード量の不均一状態を図示
した図である。
【図6】S=ストリングの長さ、C=コントローラの個
数、(R/W)=読取書込比、及びKの、夫々の値が、
機能低下状態にあるアレイのロード量に対して、どのよ
うに影響するかを図示したものである。
【図7】1台のDASDのアベイラビリティが失われる
ことによって発生する、そのストリングないしアレイ内
の残りのDASDに対するロード量の不均一状態を図示
した図である。
【図8】アレイ中の複数台のDASDの間に複数のパリ
ティ・グループを分散配置する際に、平衡ブロック構造
による分散配置法を用いることによって、それら複数台
のDASDのうちの1台のDASD上のデータのアベイ
ラビリティが失われることにより発生するDASDの1
台あたりのロード量の増加分を可及的に低く抑えるとい
う、本発明の原理を示した図である。
【図9】アレイ中の複数台のDASDの間に複数のパリ
ティ・グループを分散配置する際に、平衡ブロック構造
による分散配置法を用いることによって、それら複数台
のDASDのうちの1台のDASD上のデータのアベイ
ラビリティが失われることにより発生するDASDの1
台あたりのロード量の増加分を可及的に低く抑えるとい
う、本発明の原理を示した図である。
【図10】アレイ中の複数台のDASDの間に複数のパ
リティ・グループを分散配置する際に、平衡ブロック構
造による分散配置法を用いることによって、それら複数
台のDASDのうちの1台のDASD上のデータのアベ
イラビリティが失われることにより発生するDASDの
1台あたりのロード量の増加分を可及的に低く抑えると
いう、本発明の原理を示した図である。
【符号の説明】
101、103、105、107 コントローラ 109、111、115、117 DASD 121、123、127、129 DASD
───────────────────────────────────────────────────── フロントページの続き (72)発明者 スペンサー・ング アメリカ合衆国95120、カリフォルニア州 サン・ノゼ、ハンプスウッド・ウェイ 974

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 複数個の制御装置と、それら複数個の制
    御装置に接続された複数台の直接アクセス記憶装置(D
    ASD)から成る複数本のストリングとによって構成し
    たアレイの中に、複数のパリティ・グループを均一に分
    散配置する統計的平衡ブロック構造等の均一分散配置法
    を利用して、故障モードでの動作時における前記アレイ
    のアクセス・ローディングの増加分を可及的に低減する
    方法において、 (a)複数のパリティ・グループを形成し、且つ、形成
    したそれらパリティ・グループを、平衡ブロック構造な
    いしはそれと均等なブロック構造に従って前記アレイの
    前記複数台のDASDに書き込むステップと、 (b)制御装置ないしDASDの故障によってアレイ・
    データへの経路のアベイラビリティが失われているとき
    に、それが失われていることに応答して、パリティ・グ
    ループの分散配置法に応じて決まる最少参照パタンに従
    って、前記アレイ中のその他のDASDにアクセスする
    ステップと、を含んでいる方法。
  2. 【請求項2】 ストリングを成すように配列しそのスト
    リング1本あたりの台数をS台とした複数台のDASD
    をC個のコントローラでコンピュータ・システムに接続
    して構成したC×SのDASDアレイであって、前記複
    数台のDASD上にN個のパリティ・グループを設定
    し、それら複数個のパリティ・グループの各々が(K−
    1)個のデータ・エリアに加えて1つのパリティ判定基
    準包含エリアを含んでいるようにした前記DASDアレ
    イの、アクセス方法において、 (a)N個のパリティ・グループを形成して書き込むス
    テップであって、前記複数台のDASDの各々をN個の
    互いに大きさの等しい領域即ち記録エリアに区分し、且
    つ区分したそれら領域を前記N個のパリティ・グループ
    に割当てるようにし、しかもその際に、(1)同一のパ
    リティ・グループに所属する任意の2つの領域は、互い
    に異なったDASD上に配置されるようにし、(2)前
    記複数台のDASDの各々は、そのDASDの複数の領
    域の1つずつが、前記N個の互いに異なったパリティ・
    グループの各々1つずつに割当てられるようにし、且
    つ、(3)任意の2台のDASDから成るDASDペア
    の各ペアについて、そのペアの双方のDASDの夫々に
    所属する2つの領域を共に包含するパリティ・グループ
    の個数が厳密にM個であるようにする、ステップと、 (b)故障したDASD上のアドレス可能情報への経路
    のアベイラビリティが失われているときに、それが失わ
    れていることに応答して、パリティ・グループの分散配
    置の均一度によって決まる最少参照パタンに従って、そ
    の故障DASD以外の残りの((C×S)−1)台のD
    ASDにアクセスするステップと、を含んでいる方法。
  3. 【請求項3】 前記ステップ(a)を実行したときに、
    その結果として前記アレイ中の前記複数台のDASDの
    間に前記複数個のパリティ・グループが近似的に均一に
    分散配置されるようにし、その際の分散配置法を、平衡
    インコンプリート・ブロック構造、ラテン・スクエア、
    及びアダマール・マトリクスのうちから選択するように
    したことを特徴とする請求項2記載の方法。
  4. 【請求項4】 C個のストリング・コントローラと、ス
    トリング1本あたりの台数をS台とした複数台のDAS
    Dとから構成したC×SのDASDアレイであって、K
    <C×SであるK台のDASDにおける対応する物理記
    録エリア上の情報に対するパリティ判定基準(排他的O
    R)を設定し、1個の「パリティ・グループ」を形成す
    るK個の記録エリアを、(K−1)個のデータ・エリア
    に加えて1つのパリティ判定基準エリアによって構成す
    るようにし、アベイラビリティを失ったDASD上の所
    与のパリティ・グループの情報を、その他のK台のDA
    SDから得られる情報の論理的結合(排他的OR結合)
    によって再構成するようにした前記DASDアレイに対
    する、R回の読取アクセス及びW回の書込アクセスの、
    アクセス頻度を平均化する方法において、 (a)パリティ・グループ1つあたりのエリアの個数を
    K個とした複数のパリティ・グループを形成し、且つ、
    形成したそれら複数のパリティ・グループを、決定論的
    プロセスにより生成した前記アレイ内の、対応する複数
    台のDASDに夫々に略々均一に書き込むステップと、 (b)故障したDASD上のアドレス可能情報への経路
    のアベイラビリティが失われているときに、それが失わ
    れていることに応答して、パリティ・グループの分散配
    置の均一度によって決まる最少参照パタンに従って、そ
    の故障DASD以外の残りの((C×S)−1)台のD
    ASDにアクセスするステップと、を含んでいる方法。
  5. 【請求項5】 前記決定論的プロセスを、組合せ生成式
    アンバランスト・ブロック・プロシージャ(combinator
    ially generative unbalanced block procedure )のう
    ちから選択するようにしたことを特徴とする請求項4記
    載の方法。
  6. 【請求項6】 前記複数のパリティ・グループの各々の
    大きさである前記Kを、コントローラの個数Cより小さ
    いものとした(K<C)ことを特徴とする請求項4記載
    の方法。
  7. 【請求項7】 前記複数のパリティ・グループの分散配
    置の均一性を、平衡インコンプリート・ブロック構造、
    ラテン・スクエア、及びアダマール・マトリクスのうち
    から選択するようにしたことを特徴とする請求項4記載
    の方法。
  8. 【請求項8】 前記ステップ(a)が、前記複数のパリ
    ティ・グループを前記複数台のDASDに割当てる割当
    てステップを更に含んでおり、該割当てステップにおけ
    る割当ての仕方が、(1)所与の1つのパリティ・グル
    ープは、いかなるストリングの中にも1度しか現れない
    ようにし、且つ、(2)前記複数のパリティ・グループ
    を前記複数のDASD上に配置するに際しては、ある1
    本のストリング上の1台の故障DASDへのアクセスが
    発生したならば、その結果、その他の(C−1)本のス
    トリング上の、その他の(S×(C−1))台のDAS
    Dへの均一に分配されたアクセスが発生するように配置
    するようにした、割当て方であることを特徴とする請求
    項4記載の方法。
  9. 【請求項9】 1台のコントローラの故障時に、その故
    障に応答して、その他のK本のストリング上の、前記パ
    リティ・グループのその他の(K−1)個のメンバに基
    づいて復元処理を行なうようにしたことを特徴とする請
    求項8記載の方法。
  10. 【請求項10】 前記ステップ(a)に記載の前記複数
    のパリティ・グループのうちの少なくとも2つのパリテ
    ィ・グループの夫々のデータ・エリアの個数が、互いに
    等しくないか、ないしは大きく異なっているようにした
    ことを特徴とする請求項1または4記載の方法。
  11. 【請求項11】 前記アレイ中の前記複数台のDASD
    のうちの少なくとも1台のDASDが、1つのパリティ
    ・グループの専用として割当てられていない記録空間を
    含んでいるようにし、且つ、該記録空間を、スペアリン
    グ・モードで記録される1つまたは複数のパリティ・グ
    ループの全て或いは一部を収容するのに充分な大きさと
    したことを特徴とする請求項1または4記載の方法。
JP3163040A 1990-08-03 1991-07-03 機能低下モードでの動作時における直接アクセス記憶装置アレイのアクセスを管理するための方法 Expired - Fee Related JPH0727439B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/562,188 US5265098A (en) 1990-08-03 1990-08-03 Method and means for managing DASD array accesses when operating in degraded mode
US562188 2000-05-02

Publications (2)

Publication Number Publication Date
JPH05158624A true JPH05158624A (ja) 1993-06-25
JPH0727439B2 JPH0727439B2 (ja) 1995-03-29

Family

ID=24245181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3163040A Expired - Fee Related JPH0727439B2 (ja) 1990-08-03 1991-07-03 機能低下モードでの動作時における直接アクセス記憶装置アレイのアクセスを管理するための方法

Country Status (3)

Country Link
US (1) US5265098A (ja)
EP (1) EP0469924A3 (ja)
JP (1) JPH0727439B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324815A (ja) * 1993-05-13 1994-11-25 Nec Corp ディスクアレイ装置

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5522065A (en) * 1991-08-30 1996-05-28 Compaq Computer Corporation Method for performing write operations in a parity fault tolerant disk array
JP2550239B2 (ja) * 1991-09-12 1996-11-06 株式会社日立製作所 外部記憶装置システム
US5341381A (en) * 1992-01-21 1994-08-23 Tandem Computers, Incorporated Redundant array parity caching system
US5398253A (en) * 1992-03-11 1995-03-14 Emc Corporation Storage unit generation of redundancy information in a redundant storage array system
US5331646A (en) * 1992-05-08 1994-07-19 Compaq Computer Corporation Error correcting code technique for improving reliablility of a disk array
JP3183719B2 (ja) * 1992-08-26 2001-07-09 三菱電機株式会社 アレイ型記録装置
US5388108A (en) * 1992-10-23 1995-02-07 Ncr Corporation Delayed initiation of read-modify-write parity operations in a raid level 5 disk array
US5485571A (en) * 1993-12-23 1996-01-16 International Business Machines Corporation Method and apparatus for providing distributed sparing with uniform workload distribution in failures
US5499253A (en) * 1994-01-05 1996-03-12 Digital Equipment Corporation System and method for calculating RAID 6 check codes
US5537567A (en) * 1994-03-14 1996-07-16 International Business Machines Corporation Parity block configuration in an array of storage devices
US5479653A (en) * 1994-07-14 1995-12-26 Dellusa, L.P. Disk array apparatus and method which supports compound raid configurations and spareless hot sparing
US5559764A (en) * 1994-08-18 1996-09-24 International Business Machines Corporation HMC: A hybrid mirror-and-chained data replication method to support high data availability for disk arrays
US5488701A (en) * 1994-11-17 1996-01-30 International Business Machines Corporation In log sparing for log structured arrays
US5613085A (en) * 1994-12-27 1997-03-18 International Business Machines Corporation System for parallel striping of multiple ordered data strings onto a multi-unit DASD array for improved read and write parallelism
US5657468A (en) * 1995-08-17 1997-08-12 Ambex Technologies, Inc. Method and apparatus for improving performance in a reduntant array of independent disks
US5875456A (en) * 1995-08-17 1999-02-23 Nstor Corporation Storage device array and methods for striping and unstriping data and for adding and removing disks online to/from a raid storage array
US6449730B2 (en) 1995-10-24 2002-09-10 Seachange Technology, Inc. Loosely coupled mass storage computer cluster
US5862312A (en) * 1995-10-24 1999-01-19 Seachange Technology, Inc. Loosely coupled mass storage computer cluster
US5832198A (en) * 1996-03-07 1998-11-03 Philips Electronics North America Corporation Multiple disk drive array with plural parity groups
GB2312319B (en) * 1996-04-15 1998-12-09 Discreet Logic Inc Video storage
CA2201679A1 (en) 1996-04-15 1997-10-15 Raju C. Bopardikar Video data storage
US5819310A (en) * 1996-05-24 1998-10-06 Emc Corporation Method and apparatus for reading data from mirrored logical volumes on physical disk drives
JPH1069358A (ja) * 1996-08-28 1998-03-10 Mitsubishi Electric Corp データ配置装置
US6079028A (en) * 1997-04-23 2000-06-20 Lucent Technologies Inc. Fault tolerant architectures for continuous media servers
US6269417B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Method for determining and displaying the physical slot number of an expansion bus device
US6170028B1 (en) 1997-05-13 2001-01-02 Micron Electronics, Inc. Method for hot swapping a programmable network adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6243838B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6292905B1 (en) 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6338150B1 (en) 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6163853A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method for communicating a software-generated pulse waveform between two servers in a network
US6249885B1 (en) 1997-05-13 2001-06-19 Karl S. Johnson Method for managing environmental conditions of a distributed processor system
US6247079B1 (en) * 1997-05-13 2001-06-12 Micron Electronics, Inc Apparatus for computer implemented hot-swap and hot-add
US5892928A (en) * 1997-05-13 1999-04-06 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a dynamically loaded adapter driver
US6247080B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc. Method for the hot add of devices
US6499073B1 (en) 1997-05-13 2002-12-24 Micron Electronics, Inc. System using programmable processor for selectively enabling or disabling power to adapter in response to respective request signals
US6195717B1 (en) 1997-05-13 2001-02-27 Micron Electronics, Inc. Method of expanding bus loading capacity
US5987554A (en) 1997-05-13 1999-11-16 Micron Electronics, Inc. Method of controlling the transfer of information across an interface between two buses
US6266721B1 (en) 1997-05-13 2001-07-24 Micron Electronics, Inc. System architecture for remote access and control of environmental management
US6173346B1 (en) 1997-05-13 2001-01-09 Micron Electronics, Inc. Method for hot swapping a programmable storage adapter using a programmable processor for selectively enabling or disabling power to adapter slot in response to respective request signals
US6253334B1 (en) * 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6324608B1 (en) 1997-05-13 2001-11-27 Micron Electronics Method for hot swapping of network components
US6363497B1 (en) 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6282673B1 (en) 1997-05-13 2001-08-28 Micron Technology, Inc. Method of recording information system events
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US6145098A (en) 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6179486B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Method for hot add of a mass storage adapter on a system including a dynamically loaded adapter driver
US6249834B1 (en) 1997-05-13 2001-06-19 Micron Technology, Inc. System for expanding PCI bus loading capacity
US6249828B1 (en) 1997-05-13 2001-06-19 Micron Electronics, Inc. Method for the hot swap of a mass storage adapter on a system including a statically loaded adapter driver
US6192434B1 (en) 1997-05-13 2001-02-20 Micron Electronics, Inc System for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6202111B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a statically loaded adapter driver
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6134668A (en) * 1997-05-13 2000-10-17 Micron Electronics, Inc. Method of selective independent powering of portion of computer system through remote interface from remote interface power supply
US6170067B1 (en) 1997-05-13 2001-01-02 Micron Technology, Inc. System for automatically reporting a system failure in a server
US6243773B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Configuration management system for hot adding and hot replacing devices
US6304929B1 (en) 1997-05-13 2001-10-16 Micron Electronics, Inc. Method for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6418492B1 (en) 1997-05-13 2002-07-09 Micron Electronics Method for computer implemented hot-swap and hot-add
US6212585B1 (en) 1997-10-01 2001-04-03 Micron Electronics, Inc. Method of automatically configuring a server after hot add of a device
US6199173B1 (en) 1997-10-01 2001-03-06 Micron Electronics, Inc. Method for mapping environmental resources to memory for program access
US6175490B1 (en) 1997-10-01 2001-01-16 Micron Electronics, Inc. Fault tolerant computer system
US6154835A (en) * 1997-10-01 2000-11-28 Micron Electronics, Inc. Method for automatically configuring and formatting a computer system and installing software
US6263387B1 (en) 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US6035347A (en) * 1997-12-19 2000-03-07 International Business Machines Corporation Secure store implementation on common platform storage subsystem (CPSS) by storing write data in non-volatile buffer
US6430701B1 (en) * 1998-01-27 2002-08-06 Aiwa Co., Ltd. Data recording and reproducing method and apparatus using plurality of data recording and reproducing units, and computer-readable recording medium
US6799224B1 (en) * 1998-03-10 2004-09-28 Quad Research High speed fault tolerant mass storage network information server
US6421746B1 (en) 1998-03-26 2002-07-16 Micron Electronics, Inc. Method of data and interrupt posting for computer devices
US6219751B1 (en) 1998-04-28 2001-04-17 International Business Machines Corporation Device level coordination of access operations among multiple raid control units
US6260155B1 (en) 1998-05-01 2001-07-10 Quad Research Network information server
US6247157B1 (en) 1998-05-13 2001-06-12 Intel Corporation Method of encoding data signals for storage
US6223234B1 (en) 1998-07-17 2001-04-24 Micron Electronics, Inc. Apparatus for the hot swap and add of input/output platforms and devices
US6205503B1 (en) 1998-07-17 2001-03-20 Mallikarjunan Mahalingam Method for the hot swap and add of input/output platforms and devices
US6216251B1 (en) * 1999-04-30 2001-04-10 Motorola Inc On-chip error detection and correction system for an embedded non-volatile memory array and method of operation
US7263476B1 (en) * 2000-06-12 2007-08-28 Quad Research High speed information processing and mass storage system and method, particularly for information and application servers
GB2374749B (en) * 2001-04-20 2005-04-06 Discreet Logic Inc Image data processing
US6954824B2 (en) * 2001-10-15 2005-10-11 International Business Machines Corporation Method, system, and program for determining a configuration of a logical array including a plurality of storage devices
US6976187B2 (en) * 2001-11-08 2005-12-13 Broadcom Corporation Rebuilding redundant disk arrays using distributed hot spare space
US7152142B1 (en) * 2002-10-25 2006-12-19 Copan Systems, Inc. Method for a workload-adaptive high performance storage system with data protection
US7484050B2 (en) * 2003-09-08 2009-01-27 Copan Systems Inc. High-density storage systems using hierarchical interconnect
US7428691B2 (en) * 2003-11-12 2008-09-23 Norman Ken Ouchi Data recovery from multiple failed data blocks and storage units
US7188212B2 (en) * 2004-05-06 2007-03-06 International Business Machines Corporation Method and system for storing data in an array of storage devices with additional and autonomic protection
US7093157B2 (en) * 2004-06-17 2006-08-15 International Business Machines Corporation Method and system for autonomic protection against data strip loss
US8195978B2 (en) * 2008-05-16 2012-06-05 Fusion-IO. Inc. Apparatus, system, and method for detecting and replacing failed data storage
US7890795B1 (en) 2008-06-02 2011-02-15 Emc Corporation Auto-adapting cache memory system and memory
US8281227B2 (en) 2009-05-18 2012-10-02 Fusion-10, Inc. Apparatus, system, and method to increase data integrity in a redundant storage system
US8307258B2 (en) 2009-05-18 2012-11-06 Fusion-10, Inc Apparatus, system, and method for reconfiguring an array to operate with less storage elements
RU2013128346A (ru) * 2013-06-20 2014-12-27 ИЭмСи КОРПОРЕЙШН Кодирование данных для системы хранения данных на основе обобщенных каскадных кодов
US9563509B2 (en) 2014-07-15 2017-02-07 Nimble Storage, Inc. Methods and systems for storing data in a redundant manner on a plurality of storage units of a storage system
CN108255413A (zh) * 2016-12-29 2018-07-06 华为技术有限公司 一种存储系统扩容后数据迁移的方法、存储系统
US20200293202A1 (en) * 2019-03-15 2020-09-17 Super Micro Computer, Inc. Apparatus and method of automatic configuration of storage space
US11209990B2 (en) * 2019-03-15 2021-12-28 Super Micro Computer, Inc. Apparatus and method of allocating data segments in storage regions of group of storage units

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0290254A (ja) * 1988-09-27 1990-03-29 Nec Corp データ入出力システム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3812336A (en) * 1972-12-18 1974-05-21 Ibm Dynamic address translation scheme using orthogonal squares
US4092732A (en) * 1977-05-31 1978-05-30 International Business Machines Corporation System for recovering data stored in failed memory unit
US4761785B1 (en) * 1986-06-12 1996-03-12 Ibm Parity spreading to enhance storage access
US4914656A (en) * 1988-06-28 1990-04-03 Storage Technology Corporation Disk drive memory
US4989205A (en) * 1988-06-28 1991-01-29 Storage Technology Corporation Disk drive memory
US5007053A (en) * 1988-11-30 1991-04-09 International Business Machines Corporation Method and apparatus for checksum address generation in a fail-safe modular memory
US5134619A (en) * 1990-04-06 1992-07-28 Sf2 Corporation Failure-tolerant mass storage system
US5124987A (en) * 1990-04-16 1992-06-23 Storage Technology Corporation Logical track write scheduling system for a parallel disk drive array data storage subsystem

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0290254A (ja) * 1988-09-27 1990-03-29 Nec Corp データ入出力システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06324815A (ja) * 1993-05-13 1994-11-25 Nec Corp ディスクアレイ装置

Also Published As

Publication number Publication date
US5265098A (en) 1993-11-23
EP0469924A3 (en) 1993-01-27
EP0469924A2 (en) 1992-02-05
JPH0727439B2 (ja) 1995-03-29

Similar Documents

Publication Publication Date Title
JPH05158624A (ja) 機能低下モードでの動作時における直接アクセス記憶装置アレイのアクセスを管理するための方法
US8839028B1 (en) Managing data availability in storage systems
US6425052B1 (en) Load balancing configuration for storage arrays employing mirroring and striping
KR940011039B1 (ko) Dasd 배열내에서의 분배 스페어링 방법 및 장치
US5657439A (en) Distributed subsystem sparing
JP2769443B2 (ja) 記憶サブシステム及び関連する装置/方法
US8910030B2 (en) Redistributing parity in a storage system
US5301297A (en) Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
JP5256149B2 (ja) Hdd障害からの高速データ回復
US6502166B1 (en) Method and apparatus for distributing data across multiple disk drives
US5826046A (en) Method and apparatus for polling and selecting any paired device in any drawer
US5303244A (en) Fault tolerant disk drive matrix
US5257362A (en) Method and means for ensuring single pass small read/write access to variable length records stored on selected DASDs in a DASD array
US20080178040A1 (en) Disk failure restoration method and disk array apparatus
JP2000511318A (ja) 階層記憶管理システムのための変換式raid
JPS62293355A (ja) データ保護装置
JPH05197498A (ja) 構成可能な冗長アレイ記憶装置
JPH05505481A (ja) データ記憶装置および方法
US7308532B1 (en) Method for dynamically implementing N+K redundancy in a storage subsystem
US6223323B1 (en) Method for storing parity information in a disk array storage system
US10678470B2 (en) Computer system,control method for physical storage device,and recording medium
JPH0769873B2 (ja) コンピユータのためのメモリ装置及びメモリ構成方法
CN100363900C (zh) Raid-1系统中的备用系统和方法
Ng et al. Maintaining good performance in disk arrays during failure via uniform parity group distribution
US10977130B2 (en) Method, apparatus and computer program product for managing raid storage in data storage systems

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees