JP2702308B2 - ディスク記憶装置 - Google Patents

ディスク記憶装置

Info

Publication number
JP2702308B2
JP2702308B2 JP3103708A JP10370891A JP2702308B2 JP 2702308 B2 JP2702308 B2 JP 2702308B2 JP 3103708 A JP3103708 A JP 3103708A JP 10370891 A JP10370891 A JP 10370891A JP 2702308 B2 JP2702308 B2 JP 2702308B2
Authority
JP
Japan
Prior art keywords
data
dasd
disk
block
drive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3103708A
Other languages
English (en)
Other versions
JPH04228153A (ja
Inventor
ジョン・スチュワート・ベスト
ティモシー・ジョセフ・チャイナー
トーマス・ウイリアム・グラサー
リチャード・グレンバーグ
アヴィジット・ムカジー・ムカジー
ジェリー・リー・ネウバウアー
ジョン・ラルフ・レイデンバッチ
ロバート・エルスウォース・スコップ
ロバート・アレン・スクラントン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH04228153A publication Critical patent/JPH04228153A/ja
Application granted granted Critical
Publication of JP2702308B2 publication Critical patent/JP2702308B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/70Masking faults in memories by using spares or by reconfiguring
    • G11C29/88Masking faults in memories by using spares or by reconfiguring with partially good memories

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Automatic Disk Changers (AREA)
  • Friction Gearing (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】ディスク記憶装置は、コンピュー
タで使用する大量のデータ及びプログラムの情報を記憶
する問題に対する好ましい手法である。ディスク記憶装
置は、30年以上前に登場して以来、より大きな記憶容
量、より短いアクチュエータ・アクセス時間、より短い
回転待ち時間、及び信頼性を高めるためのディスク故障
からの回復を提供するために継続的に改良されてきた。
これは、このような装置の占める空間及び消費電力を減
らしながら達成されてきた。
【0002】
【従来の技術】ディスク記憶装置の性能の向上は、デー
タ処理システムの他の面の改良に追いつけなかった。最
近では、アクセス時間は1/2または1/3に低下し、
データ伝送速度は2倍に向上したが、データ処理装置と
ディスク記憶システムの性能のギャップはますます拡大
してきている。これは、大部分は、機械的構成部分をよ
り高速度で移動させるにはより大きなエネルギー量が必
要であるという物理的法則の存在によるものである。
【0003】ディスク記憶システムの全体的性能は、典
型的なデータ量、たとえば16キロバイト(KB)のデ
ータを取り出すのに必要な時間の量によって特徴づける
ことができる。最近5年間で、この時間は1/3に低下
したが、同じ期間に、システムの半導体部品の性能は1
0倍に向上した。この不均衡は、改善する兆しがなく、
悪化し続けそうである。
【0004】多数の端末にサービスするために通常使用
される中規模データ処理システムに関して性能を見る
と、時間の約60%は記憶サブシステムによって消費さ
れている。通常、1回の各ユーザ・トランザクション
は、約20回のディスク動作を必要とし、各ディスク動
作で約4KBのデータが転送される。このタイプのシス
テムは、端末操作員への応答時間が1−2秒である。こ
の応答時間は、通常にみられる実際の値であるが、通常
の端末動作員にとってこの値は理想的ではない。
【0005】この応答時間は、記憶サブシステムの性能
によって大きく制限され、半導体装置とディスク記憶シ
ステムの間の性能ギャップが拡大し続けるにつれてます
ますそうなる。将来のアプリケーションがますます複雑
になり、より多くのデータの転送が必要となると思われ
るため、この問題の深刻さがさらに増す。ユーザ・トラ
ンザクション当たりのディスク動作回数は、20回から
40回に上昇すると予想され、平均データ転送速度は4
KBから20KBに増加すると思われる。
【0006】データ処理システムが日常のビジネス及び
個人生活のより不可欠な部分になりつつあるため、この
問題はさらに複雑になっている。したがって、ユーザが
修理のために熟練したサービス担当者を1日程度待つこ
とは、もはや便利でもなく、可能でもない。大抵の場
合、システムは、数分あるいはせいぜい1−2時間のう
ちにサービスできるように復旧しなければならない。そ
うしなければ、貴重なビジネスの機会が失われる。これ
は、故障した装置の障害追求及び修理または交換がユー
ザ自身によって行なわれるようになることを意味する。
【0007】ディスク記憶装置の回転待ち時間、サイ
ズ、電力消費量、データ伝送速度、ビット密度、トラッ
ク密度、保守容易性、及び信頼性という設計上の問題に
対する各種の手法がこれまでに用いられてきた。米国特
許第3876978号は、複数の装置をもつ記憶システ
ムを記述している。複数の装置の1つは、パリティ・ビ
ットを記憶するのに利用される。このパリティ・ビット
は、対応するビット位置にある当該の各データ用の装置
に基づくものである。上記特許の記述によれば、この記
憶システムは、1つのカートリッジを使って、他のすべ
てのカートリッジ内の対応するビットの比較から生ずる
パリティ・ビットを表すという、テープ・カートリッジ
・システムに関する。一つのカートリッジが失われた場
合にそのデータを再生するため、すべてのデータ・カー
トリッジからすべてのビットを読み出し、パリティ・カ
ートリッジ内の対応するビットの結果を組み合わせて比
較し、適正なパリティを生ずるようにしてデータを再生
することができる。上記特許で採用された手法は、アク
セス機構が1個しかない場合であるが、多重ディスク・
ドライブ・システムに使用するのに好適である。ディス
ク・ドライブ・システムでは、失われたデータを再生す
るとともに、記憶システムから読み出されたすべてのデ
ータの妥当性のオンライン検査を実行することが望まし
い。上記特許に記述された記憶システムを使用しても、
ディスク記憶システムから読み出されたデータのオンラ
イン検査に関して満足な性能は得られない。
【0008】米国特許第4036659号は、ディスク
・ドライブ・システム用のプログラム式制御装置を示し
ている。複数のディスク・ドライブの間でデータを分散
することについて長々と詳しく記述されているが、超高
速の回転速度で動作する例外的に小さいディスクを使用
することは示唆されていない。
【0009】米国特許第4577240号に記述された
ビデオ記録システムは、別々のアクチュエータを使って
エラー訂正またはディスク・トラブルからの回復の問題
を記録するディスク記憶システムに関する。その代わ
り、他の方法ではエラーを生ずるはずの欠陥を含むトラ
ックは、単純にスキップされる。実際のデータ処理の場
では、こうすると、データ容量が容認できないほど失わ
れるはずである。というのは、単一ビット・エラーが1
トラック全体の損失をもたらすからである。これは、デ
ータ記憶の問題に適用するとき、容認できないトレード
オフである。上記特許はまた、複数のドライブ・スピン
ドルの使用を示唆しておらず、そのかわりに別々のアク
チュエータを使用している。この手法は、故障した装置
の簡単な交換には役立たない。というのは、2つのアク
チュエータ、したがって2つのデータ・グループが関与
するからである。
【0010】1台のディスク記憶システムに複数のスピ
ンドルを使用することは、米国特許第4583133号
で示唆されている。しかし、このシステムでは、一度に
ただ1つのドライブが使用されるだけである。データを
すべての装置の間に同時に配分し記録することができる
との教示はない。ハード・ディスクではなく可撓性媒体
の使用が意図されており、回転速度が可撓性媒体では通
常の低速度ではないとの言及はない。
【0011】米国特許第4724495号の教示は、連
続したビデオ・フィールドをディスク記憶スタックの異
なるゾーン上に記録する、別々の2つのアクチュエータ
を使用したビデオ記録システムを対象とする。別々のス
ピンドルが使用され、データが複数のスピンドル上に同
時に記録されるとの示唆はない。このシステムは、トラ
ック内の欠陥を、そのトラック全体を単にスキップする
ことによって処理する。これは、上記の米国特許第45
77240号に示された手法に類似している。上記特許
は、複数の小型ディスクが、データがすべてのディスク
に並列に分散されている1つのシステム内で組み合わさ
れることを示唆していない。
【0012】このような装置は魅力的な特徴をもつにも
かかわらず、まだ克服されていないいくつかの本質的な
制限がある。たとえば、データが円形トラックに沿って
直列に配列されるため、所望のデータがデータ・トラン
スジューサの下を通過するまで待つ必要がある。単純な
統計的観点からみると、所望のデータがトランスジュー
サに到達するのに必要な平均時間は、ディスクが1/2
回転するのに要する時間である。セクタを1つのトラッ
クから別のトラックへスキューすることによって、この
単純な統計的平均待ち時間をやや改善することが可能で
ある。こうすると、トランスジューサは、トラック・ア
クセス後にこれ以外の方法の場合より多少早くトラック
の読出しを始めることができる。データがトランスジュ
ーサの下にくるまでの待ち時間は、回転待ち時間と呼ば
れる。
【0013】トラックからトラックへのアクセス中にヘ
ッドアーム・アセンブリを機械的に移動させるのに必要
な時間は、より高速のアクチュエータを使用して大幅に
短縮されてきたが、回転待ち時間はほとんど改良されて
いない。これは、ディスク・ドライブの仕様を調べると
容易に理解される。いわゆる「ハード」ドライブ、すな
わち剛体基板を利用した駆動機構は、必ず3600rp
mで回転する。回転待ち時間は、回転速度に反比例する
ので、回転速度を増加させない限り大幅な改良は不可能
である。
【0014】スピンドル駆動モータをスピードアップ
し、それによって回転待ち時間を短縮することは、簡単
なことのように思われるが、より高い回転速度のディス
ク・ドライブがないことから明らかなように、そう簡単
ではない。明白な解決には役立たないが、問題のいくつ
かは明かである。たとえば、ヘッドの空気力学的制御を
行なってヘッドとディスクの間隔を20−63.5mμ
の範囲に維持する、いわゆる「ウィンチェスタ」技術
は、毎秒1.5−2.5mの速度で移動する空気の薄い
膜の存在を利用している。3600rpmで回転する、
直径が約89mm−203mm(3.5−8インチ)以
上のディスクでは、この速度要件は容易に満たされ、空
気力学的パッケージ内に配置されたトランスジューサで
ある「スライダ」を、これらのパラメータを満たして動
作するように設計することができる。
【0015】回転待ち時間は回転速度に直接的に関係
し、回転速度を増加させると回転待ち時間の短縮で直接
の利益が得られることは以前から認識されてきた。それ
にもかかわらず、ほぼすべてのハード・ディスク駆動シ
ステムの回転速度は、3000−3600rpmの範囲
にとどまっている。
【0016】これは、たとえば回転待ち時間を相当に改
善するために回転速度を3倍にして約10,000rp
mにすると、既存のスライダ技術が全く使えなくなるこ
とによって少なくとも部分的に説明される。そのように
すると、増加したディスク速度から生ずる従来とは異な
った空気力学的状況に対処するために、コストのかかる
スライダの再設計が必要となる。
【0017】空気力学の問題は、予測可能であり、十分
な工学的努力によっておそらく解決できるはずである
が、他の問題についてはそうはいかない。適切な事前措
置が講じられていない場合、ヘッドとディスクの偶然の
接触が、装置が寿命に達する前に、故障を生じ得ること
が認識されてきた。ディスクの回転開始及び停止時に、
トランスジューサを、データが保存されない「着陸」ゾ
ーン上方で位置決めする機構を設計することは可能であ
る。こうすると、データが記憶されるディスク表面の摩
耗及び潜在的な損傷の一部分がなくなる。それでもな
お、通常のデータ読出し及び書込み中にトランスジュー
サとディスクの不測の接触が起こる可能性がある。した
がって、トランスジューサを着陸ゾーンに位置決めする
ための特別の機構のコストが経済的に引き合う場合で
も、ディスク表面に何らかの形の保護機構を設けること
が望ましい。通常、この保護は、ディスク上の記録媒体
の表面に塗布される潤滑剤の形をとる。
【0018】適当な潤滑剤の開発は困難であった。必要
な潤滑特性の点から、二三のクラスの潤滑剤を除いてす
べての潤滑剤が除外される。さらに、潤滑剤は、通常の
ビジネス環境または家庭環境で見られる汚染物質と干渉
すると、通常のヘッドとディスクの間の間隔の実質的部
分に取り付く分子、結晶、またはアモルファス構造物を
形成するが、このような物理的構造物を形成する汚染物
質と相互作用してはならない。ヘッドがこのような構造
物と接触すると、「ヘッド・クラッシュ」を起こして、
ディスク表面の損傷及びデータの損失をもたらす可能性
がある。潤滑剤は、潤滑作用及び化学的性質の点から満
足のいくものでなければならないだけでなく、ディスク
表面に付着し、回転によって飛び散らない物理的特性も
もたなければならない。望ましい化学的特性及び潤滑特
性を有するいくつかの潤滑剤は、遠心力の結果ディスク
の周辺へ移行する傾向があることが判明している。この
障害は、長期間使用後に始めて出現するので、満足のい
く性能をもつかどうか潤滑剤を評価し試験するのは困難
である。3,600rpmの回転速度で満足なディスク
寿命をもたらす働きをする潤滑剤であっても、より高い
回転速度で許容できるかどうかを確認するために少くと
も長時間の寿命試験が必要となる。このような試験の結
果、おそらく既存の潤滑剤はずっと高速の回転速度での
使用には満足でないことが示されるはずである。
【0019】したがって、回転速度が3,600rpm
に固定され続けたことは理解できる。というのは、より
高い回転速度から生じる予見できる問題及び予測不可能
な結果が、開発投資の実質的な抑止力になっているから
である。
【0020】より高い回転速度を試みた場合、ドライブ
内で発散される熱が問題になることが予想される。より
高い回転速度でディスクを回転させる場合、必要な電力
量が増加するので、必然的にスピンドル駆動モータがよ
り大型になり、それに伴う電力損が増大する。これは、
電力損の増大がきわめて小さな容積内で生じ、熱の放散
が一層困難になることを認識すれば、小さな問題ではな
い。また風損が増大し、やはり装置内で発生する熱を増
加させることが予想できる。
【0021】占有空間は常に考慮すべき問題なので、よ
り大型のドライブ・モータはより高い回転速度の使用に
対するかなりの抑止力になる。ディスク・ドライブがす
でに使用可能な空間及び電力のかなりの部分を占めてい
る、いわゆるパーソナル・コンピュータの場合には特に
そうである。パーソナル・コンピュータがますます小型
化する傾向のもとでは、既存のディスク・ドライブより
大きな空間を占めるディスク・ドライブは受け入れられ
ない。さらに、より高い回転速度の装置のヒート・シン
クのための空間が余分に必要になると思われる。
【0022】たとえ、回転速度を増加させて回転待ち時
間を改善することができたとしても、このような開発に
は必然的にアクチュエータ・アクセス時間を改善する努
力が必要となり、やはり装置内で消費される電力を増加
させる傾向にある。
【0023】従来技術は、回転待ち時間を改善する努力
とディスク・ドライブに対する他の要件との間に矛盾が
存在するという十分な証拠を示している。回転待ち時間
を改善した装置の電力とサイズが増大することは、装置
をより小型化し、電力消費量を減らし、動作温度をより
低くするという要件と矛盾する。とりわけ、装置の信頼
性を高め価格を下げることが本質的な要件である。
【0024】従来技術ではうまく対処されなかった別の
問題は、欠陥ディスク・ドライブの修理または交換に関
するものである。この作業には、従来、平均的なパーソ
ナル・コンピュータ・ユーザの熟練を超える高度の熟練
が必要であった。ハード・ディスク・ドライブの修理
は、記憶されるデータの性質の故に、精巧度のより低い
フレキシブル・ディスク・ドライブよりもクリティカル
である。通常、ハード・ディスクは、システムで使用さ
れるすべてのアプリケーション・プログラムを格納し、
大量のデータを含むこともある。ハード・ドライブ上の
情報はクリティカルなので、ハード・ディスク上のデー
タをフレキシブル・ディスクまたはテープ型装置上に複
製する、「バックアップ」動作を定期的に実行するのが
習慣となっている。ハード・ディスクが損傷を受けた場
合、またはそれ以外の原因で動作不能になった場合に、
フレキシブル・ディスクまたはテープを使ってデータを
回復することができる。
【0025】ディスク・ドライブは、誤ったデータに関
するエラー訂正が実行できるように設計されているが、
このようなエラー訂正能力は、習慣的にきわめて制限さ
れており、小さな規模のヘッド・クラッシュから生ずる
大きなデータ・ブロックの損失は処理できない。
【0026】バックアップ動作は実行が面倒であり、バ
ックアップが必要なことは、ハード・ディスク・ドライ
ブが故障するまでしばしば無視される。故障したときは
手遅れで、データは回復できない。ディスク・ドライブ
の交換は、しばしば複雑な作業であり、ディスク・ドラ
イブの取り外しと交換の機械的側面、ならびにディスク
をフォーマットし、まだ使用できる情報を再ロードする
ためのソフトウェア知識において、かなりの専門知識が
必要となる。
【0027】従来技術のディスク記憶システムに伴う別
の問題は、ディスク基板に使用される材料に関するもの
である。アルミニウムが、この技術の出現以降ほぼずっ
と選択されてきた材料である。アルミニウムは、軽量、
優れた加工性、及び強度という利点を提供する。以前の
値の磁気媒体の厚さ及びヘッド飛行高さでは、アルミニ
ウム基板は、費用はかかるが通常の機械加工技術を使用
して適切な仕上げにすることができる。しかしながら、
最先端の加工装置を使用しても、アルミニウム基板の表
面仕上げは、ビット密度及びトラック密度を向上させる
のに必要な薄い媒体コーティングに対する許容差を超え
る欠陥を含む。
【0028】エラーのないディスクを提供するには、表
面仕上げが完全でなければならない。ディスクを磁気媒
体でコートしてから、その表面をきわめて微細な表面に
仕上げることができる。こうすると、ヘッド・クラッシ
ュに伴う問題の深刻さは軽減されるが、基板内に微細な
突起またはピットが存在すると、たとえ媒体の表面がほ
ぼ完全であっても、突起領域内でのビット抜け、及びピ
ット領域内でのビット拡散を生ずる。アルミニウム基板
の表面を仕上げるための最先端の技法は、材料の理論的
限界に近づいている。純粋なアルミニウムを使用する
と、不純物、及びアルミニウム合金に良くみられる包有
物を含まないので、良好な仕上げを行なえる可能性が高
くなる。残念ながら、純粋アルミニウムはきわめて軟ら
かく、加工性には乏しいので、得られる表面の品質が制
限される。基板に使用するために他の材料も評価した。
ガラスと半導体用シリコンが使用されてきた。どちらの
材料もアルミニウムよりもずっと良好な表面仕上げを行
なえる可能性がある。セラミック基板も使用できる。し
かしながら、これらの代替物は、アルミニウムよりも脆
い。この特徴のために、これらの材料の広範囲の使用が
妨げられてきた。素人による頻繁な移動に耐えられるよ
うに比較的頑丈にしなければならないパーソナル・コン
ピュータで使用されるタイプのドライブでは特にそうで
あった。さらに、セラミックス、ガラス、及び半導体シ
リコンの機械的強度は、現在の回転速度で動作の衝撃及
び応力に耐えるには十分であるが、回転速度がずっと高
くなったときには疑わしい。
【0029】トランスジューサを所望のトラックの上方
で位置決めするアクチュエータの性能が絶えず改善され
て、アクセス時間がより速くなってきたが、この性能の
向上は主として電力消費量の増加という犠牲を払って達
成された。これは、電源の容量の増大、バッテリ駆動シ
ステムの動作時間の短縮、及びドライブ内で発生する熱
の増加の点で、コンピュータ・システム全体にとって問
題を生ずる。
【0030】高性能ディスク・ドライブを使用する大型
システムの性能は、各アクチュエータからアクセスでき
る膨大な量のデータによって課せられる制約に達するこ
とが判明している。このような各ドライブ上のデータへ
のアクセスは必ずしも逐次的には進まないので、データ
の検査に伴う遅延が避けられない。この制限は、各アク
チュエータの下に置くデータを減らすことによって避け
ることができるが、各アクチュエータ及びそのディスク
・ドライブ・システムの関連部品が高価なので、このよ
うな手法は経済的に実用的でない。言いかえると、高価
なアクチュエータは大量のデータと組み合わせなけれ
ば、それを利用する意味がない。高速アクチュエータで
比較的少量のデータにアクセスするという目標は、これ
まで商業的環境では実現不可能であった。
【0031】さらに、各アクチュエータの下に置くデー
タを減らすことの利点は認識されてきたが、この問題に
対する従来の手法は、追加のアクチュエータの存在によ
り信頼性が失われるという問題があった。
【0032】要約すると、既存の装置より回転待ち時間
を改善し、より小型で、より小さな電力を使用するディ
スク・ドライブ・システムを実現することが望まれる。
この装置は、既存ディスク・ドライブ技術をできるだけ
多く利用して既存の潤滑剤及びスライダ技術を使用でき
るようにするのが理想である。これらの改良は、アクチ
ュエータ性能の向上を伴い、その結果回転待ち時間の短
縮を伴うのが理想である。これらのことをすべて、信頼
性を低下させずに達成しなければならない。このシステ
ムは、顧客が、複雑なツール、平均的なユーザの能力を
越える特別の機械的熟練またはプログラミング能力を使
用せずに、ディスク記憶システムの欠陥部分を交換でき
るようにすることが好ましい。
【0033】
【発明が解決しようとする課題】本発明の目的は、単一
ドライブ・システムよりも信頼性の高い多重ドライブ式
ディスク記憶システムを提供することである。
【0034】本発明の別の目的は、多重ドライブ式ディ
スク記憶システムを電力遮断する必要なく、かつデータ
の損失なく、個々のドライブを接続及び切断できる、多
重ドライブ式ディスク記憶システムを提供することであ
る。
【0035】本発明の別の目的は、4つのドライブをも
ち、そのうちの1つのドライブが故障してもデータの損
失を起こさない、または実質的に性能を損なわない、デ
ィスク記憶システムを提供することである。
【0036】本発明の別の目的は、データの並列検索に
よってデータがより高速で検索できるように、高速、低
コストのアクチュエータを使用して比較的より少量のデ
ータにアクセスすることのできる、ディスク記憶システ
ムを提供することである。
【0037】本発明の別の目的は、アクチュエータ速度
の損失またはシステム信頼性の低下を起こさずに、各ア
クチュエータによってアクセスできるデータの量を減ら
す、ディスク記憶システムを提供することである。
【0038】
【課題を解決するための手段】N個のドライブのうち、
第1ないし第N−1番目のドライブにデータを記憶さ
せ、第N番目のドライブにパリティ情報を記憶させたハ
ード・ディスク記憶システムが提供されるので、1つの
ドライブに故障があったり遮断されたりしてもデータが
失われない。また、例えば、標準的な113mm(5.
25インチ)のディスク・ドライブに通常必要な空間内
にN台、例えば4台のユニットを装着することができ
る。4台のユニットが使用できるので、各ドライブ上
に、情報の各バイトの一部分、ならびに4台のドライブ
のうち任意の3台からデータが再生できるのに十分なエ
ラー訂正情報を割り当て、記憶することができる。こう
して、各アクチュエータの下のデータ量がより少ないと
いう利点が、通常なら複数ドライブの使用から生ずるは
ずのトラブルの頻発なしに、保持される。
【0039】
【実施例】本発明は、従来技術と著しく異なる機能構成
を含む。図1において、ディスク記憶システム1の機能
構成は、アレイ/クラスタ制御装置5、及び複数の記憶
機構アレイ7、8、9を含む。前記の各アレイは、4つ
の分離したディスク・ファイル、たとえば7a、7b、
7c、7dを含むことが好ましい。各アレイ内の別々の
ディスク・ファイルの実際の数は、4より大きくてもよ
いが、前述したようにハーフ・ハイト(82mm)の
5.25インチ・ディスク・ドライブに対する既存のパ
ーソナル・コンピュータ形状因子との幾何的整合性の理
由から4が好ましい数である。本発明の構成では、アレ
イは、直接アクセス記憶装置(DASD)サブシステム
設計である。この設計は、追加の機械的部品をもつより
複雑な設計から通常予想されるものとは違って、データ
の記憶と取出しがより高速かつ高い信頼性で行なわれる
ような方式で、データをシステムの構成要素の間に分散
する。
【0040】データは、データ・バス6によって中央演
算処理装置3に接続されているアレイ/クラスタ制御装
置5の監督下で、ディスク記憶サブシステム1とデータ
処理システム2の間で受け渡しされる。制御装置5は、
データ処理システム2のランダム・アクセス・メモリ4
に記憶したデータの形式を、アレイにデータを記憶する
際に使用する形式に変換する働きをする。制御装置5
は、データのパーセルを3つの単位+パリティ単位にセ
グメント化し、制御線20上の信号によって選択された
アレイのDASD 1、2、3、4上に記憶するため
に、得られた4つの単位を、データ線21a、21b、
21c、21dを介して転送する働きをする。
【0041】図2は、データ形式が、データ処理システ
ム2内で使用される形式から、本発明のディスク記憶シ
ステムの形式に変換される様式を示す。データ処理シス
テム2のランダム・アクセス・メモリ4に記憶されたデ
ータは、通常、各522バイトのパーセル圧縮データ・
ブロック100、101ないし10nに配列される。ア
レイ/クラスタ制御装置5は、図2に示したように動作
して、各データ・ブロックを各174バイトの3つの区
画100−1、100−2、100−3に分割する。区
画100−1、100−2、100−3の各々の第1バ
イトは、バッファ101−1、101−2、101−3
のうち対応する1つに置かれる。これらのバッファか
ら、対応するデータ単位は、逐次、線103−1、10
3−2、103−3を介して対応するバッファ及びエラ
ー訂正コード(ECC)生成機構105−1、105−
2、105−3に同時に供給される。データ・バッファ
101−1、101−2、101−3からの3つのデー
タ単位は、線104−1、104−2、104−3を介
してパリティ生成機構ブロック110に供給され、バッ
ファ及びECC生成機構105−4につながる線103
−4上に適当なパリティ単位を発生する。
【0042】線106−1、106−2、106−3、
106−4上で得られる4つのデータ単位は、単一のデ
ータ・ブロックから最初に読み出され3つの部分+1つ
のパリティ・ビット部分に変換されたデータ・ブロック
を表す。これら4つのデータ単位は、4つのDASD装
置100a、100b、100c、100dの同じ論理
アドレスに記録される。各単位は、異なるディスク・ド
ライブに記録されるが、並列(同時)に記録される。デ
ータ・ブロック100の転送が完了すると、そのデータ
・ブロックの第1の単位100−1はDASD 100
aに記録され、第2の単位100−2はDASD 10
0bに記録され、第3の単位100−3はDASD 1
00cに記録され、データ・ブロック100のパリティ
単位はDASD 100dに記録される。
【0043】記録されるデータは、通常、522バイト
・ブロックで制御装置5に転送される。522バイトの
データ・ブロックの3つの174バイト・データ区画へ
の変換は、そのデータ・ブロックの各区画を論理FIF
Oバッファに読み込むことによって実行することが好ま
しい。このFIFOバッファは、バッファ101−1、
101−2、101−3でよい。
【0044】欠陥のあるまたは動作しないDASD上で
失われたデータを再生する技法が、図3に示されてい
る。この図では、データ区画100−3を含むDASD
100cが、何らかの形で故障して、それに含まれる
データが利用不可能になったと仮定する。これは、図3
で、バッファ及びECC生成機構105−3からデータ
・バッファ101−3につながる線103−3上のXに
よって図示されている。DASDの故障を検出するため
の手段については、後で論じる。DASD読出し障害が
検出されると、システムは図3の配置を取るように再構
成される。図3の配置は、図2のそれと本質的に同じで
あるが、データの流れの方向が逆である。各データ単位
がDASD 100a、100b、及び100dから利
用可能になると、バッファ及びECC生成機構105−
1、105−2、105−4によって、元のデータ形式
に変換される。DASD 100cからのデータ単位は
入手できない。線103−1、103−2、103−4
上の信号が、パリティ・生成機構110に供給され、そ
こで失われたデータ単位が再構築されて、線103−3
aを介してデータ・バッファ101−3に供給される。
線103−3aは、DASD 100cが故障したこと
をシステムが認識した後で、そのシステムによって行な
われた接続を表す。破線103−2a及び103−1a
は、それぞれDASD 100bまたは100cが故障
した場合に行なわれる接続を表す。
【0045】好ましい実施例では、データ区画、パリテ
ィ単位、及びエラー訂正コードを発生するタスク専用の
ハードウェアとソフトウェアの組み合わせを利用する
が、これらの同じ機能を、適当なプログラムの制御下で
動作するマイクロプロセッサ、または完全に専用のハー
ドウェアによって実行することもできる。ほとんどの場
合、最適の構成は、専用ハードウェアならびにソフトウ
ェアを含むものである。具体的な実施例は、データ転送
速度とマイクロプロセッサの速度の関係、代替各手法の
相対的コスト、及びその他の設計上のトレードオフなど
の因子に応じて変わる。
【0046】本発明の好ましい実施例では、522バイ
ト・ブロックを3つの174バイト・データ単位区画に
変換することを企図していることを理解されたい。これ
らの区画は、次に4つの別々のディスク・ドライブにパ
リティ区画とともに並列に記録される。これが最適の配
置であると考えられるが、他の構成を使用してもよい。
たとえば522バイト・ブロックを3つの区画に変換す
る代わりに、各バイトを3つの部分に変換し、または5
22バイトより大きいまたは小さいブロックを使用する
ことも可能である。これらの、またはその他の修正を加
える場合、バッファにも修正を加えるのが適切である。
最適サイズから外れると、バッファとディスク・ドライ
ブの間のデータの転送が最適より悪くなる結果、性能が
低下することがある。他の構成としては、4つより多
い、または少ない数のディスク・ドライブを使用するこ
とがある。ただし、4という最適のドライブ数から外れ
ると、ハーフ・ハイトのフレキシブル・ディスク・ドラ
イブに対する工業標準との物理的整合性の利点が失われ
て、最適な4ドライブ構成よりも信頼性が低下すること
がある。
【0047】図1に戻ると、アレイ/クラスタ制御装置
5は、システム内の各DASDに関する状況情報を維持
するという追加の機能をもつ。この機能は、プログラム
制御下で動作するマイクロプロセッサによって通常の方
法で実行することが好ましい。状況情報は、「DASD
リスト」、「性能低下DASDリスト」、及び「DAS
D再構築リスト」という3つのデータ・セット内に維持
される。DASDリストは、システム内のすべてのDA
SDに関するすべてのバイタル(重要)プロダクト・デ
ータを含み、クラスタ内のDASDの位置、すなわちM
行×N列に編成される。バイタル・プロダクト・データ
とは、元々DASD内に含まれ、アレイ/クラスタ制御
装置5によってそのDASDから取り出される情報であ
る。このような情報は、通常、そのDASDの製造連番
号、技術変更の数または技術変更レベルあるいはその両
方を含む。この情報は、電力投入時及びその他の非常時
に、システム内のすべてのDASDをポーリングするこ
とにより制御装置によって読み出される。この手順によ
って、故障して交換されたドライブに関するバイタル・
プロダクト・データが、新しいDASDを反映するよう
に確実に改訂される。新しいドライブの検出は、単に、
各ドライブから読み出されたバイタル・プロダクト・デ
ータを、システム内に以前に存在した(DASDの最後
のポーリングによって発生された)バイタル・プロダク
ト・データと比較することによって実行できる。あるD
ASDがアレイ/クラスタ制御装置5から出されたポー
リングに応答しない場合、そのDASDに、破壊または
動作不能のフラグが付けられる。変更されたことが検出
されたドライブは、そのドライブに割り振られたデータ
が再構築されるようにフラグ付けされる。故障したDA
SD上に以前に含まれていたデータを再構築するための
手順については、先に言及したが、後でより詳細に説明
する。
【0048】性能低下DASDリストは、DASDが故
障したが、故障した装置を直ちに交換したくないときに
使用する。すでに述べたように、DASDが故障して
も、システムが完全に動作不能になるのではない。すな
わち、故障したDASDに含まれていたデータは、図3
に関して説明したように再生することができる。故障し
たDASDに含まれていたデータの再生は、欠陥装置の
代りに使用される新しいDASD上にそのデータを再書
き込みするために行なうこともでき、また再生されたデ
ータを、あたかも故障したDASDから直接来たかのよ
うに、データ処理システム2が使用することもできる。
エラー回復ルーチン後にあるDASDがバイタル・プロ
ダクト・データ読出しコマンドまたは書込みコマンドを
完了しない場合、そのアレイ内のその特定のDASDに
性能低下のフラグが付けられる。データ処理システム
は、性能が低下した装置に読出しコマンド及び書込みコ
マンドを出したとき、性能低下DASDリストを利用し
て、通常エラー回復ルーチンを阻止することができる。
このような状況では、図3のデータ回復技法によって、
データ処理システムは、転送されたすべてのデータにつ
いてエラー回復機能を実行するという負担を課されず
に、引き続き機能することができる。もちろん、この能
力に対して対価を支払わなければならない。すなわち、
同じアレイ内の別のDASDが故障すると、そのシステ
ムの動作が継続できないという状況が生ずる。故障した
DASDをもつシステムの動作は限られた時間しか続け
ず、故障したDASDをできるだけ早く交換することが
望ましい。
【0049】アレイ/クラスタ制御装置5は、故障した
DASDが動作可能な装置と交換されたことをバイタル
・プロダクト・データから認識すると、故障したDAS
Dを性能低下DASDリストから削除し、新しいDAS
DをDASD再構築リスト上に置く。このDASD再構
築リストは、そのアレイ内の以前に故障した位置に割り
当てられていたデータが再生されることを必要とする個
々のDASDの記録である。DASD再構築リストは、
故障したDASDの識別に加えて、データが復元された
DASD内のセクタの数をも含んでいる。セクタ情報を
含むリストの使用によって、システムは、データをバッ
クグラウンド・モードで再生することができ、それによ
って、中央演算処理装置3による通常コマンドの実行が
可能になり、データ処理システム2の動作に対する影響
を最小にすることができる。
【0050】アレイ/クラスタ制御プログラムの、図4
のデータ流れ図で表される部分では、サブルーチンは、
ブロック40から開始し、システムが電力投入されたこ
とを表す信号、またはシステムがリセットされたことを
表す信号を検出する。これらの信号は、通常、データ処
理システム内で発生され、さまざまな目的に使用され
る。
【0051】ブロック41で、クラスタ内のすべてのD
ASDをリセットし、そのクラスタ内の各アレイ内の個
々のDASDをポーリングする。このポーリングによっ
て、そのクラスタ内の各動作可能DASDからバイタル
・プロダクト情報が読み出される。各DASDは、その
独自の連番号、及び技術変更または技術変更レベルある
いはその両方を示す情報を供給する。さらに、そのDA
SDの個々のセクタに関する情報も提供される。
【0052】クラスタの各アレイ内のすべての位置のポ
ーリングが完了すると、ブロック42でテストを実行し
て、そのクラスタ内のいずれかのDASD位置がそのポ
ーリングに応答しなかったかどうか判定する。あるDA
SD位置がポーリングに応答しないと、エラー状態と解
釈され、プログラムはブロック42aで再試行/エラー
回復手順に分岐する。この手順は、ブロック41で表さ
れるポーリング中に適切に応答しなかったDASDから
バイタル・プロダクト・データを読み出そうと試みる。
ブロック42aの再試行/エラー回復段階で、前に故障
していたDASDからバイタル・プロダクト・データを
読み出すのに成功した場合、ブロック43bでNO分岐
を取って主命令シーケンスに戻る。一方、適切に応答し
ないDASDがまだある場合は、ブロック43bでYE
S経路を取ってプログラムはブロック42cに分岐する
ことができる。ブロック42cで、応答しなかったDA
SDを、それがまだ削除されていない場合、DASD再
構築リストから削除する。さらに、故障したDASD
を、性能低下DASDリストに追加し、その後、主プロ
グラムに戻る。
【0053】利用可能なすべての情報が動作可能DAS
Dから読み出され、故障したDASDが性能低下DAS
Dリストに追加されると、ブロック44で、プログラム
は現バイタル・プロダクト・データを最後の読出しから
得られたデータと比較する。DASDからのバイタル・
プロダクト・データは、アレイ内のDASD位置に従っ
て配列される。好ましい実施例では、各アレイ内に4つ
のDASD、記憶サブシステム内にN個のアレイがあ
る。最後の読出し以降に情報が変更された場合、プログ
ラムはYES経路を取ってブロック45aに分岐し、バ
イタル・プロダクト・データの変更を反映するようにD
ASDリストを更新する。次にプログラムは、ブロック
45bで、故障したDASDをDASD再構築リストに
追加する。さらに、ブロック45cで、再構築リスト上
にあるすべてのDASDを性能低下リストから削除する
ことによって、記憶されたDASD情報を更新する。
【0054】この時点で、ブロック46で示されるよう
にサブルーチンは完了し、プログラムはブロック47
で、サブルーチンが完了し、CPUが記憶サブシステム
にデータを転送し記憶サブシステムからデータを要求す
ることができることを示す、「クラスタ・レディー」信
号を発生する。次にサブルーチンは、ブロック48で、
次の電力投入またはシステム・リセット信号が検出され
るまで、遊休状態に入る。
【0055】第5図には、システムの電源を遮断しない
で欠陥DASDの交換を行なうための技法が示されてい
る。欠陥DASDを交換するためにシステムの電源を遮
断する方が簡単であるが、それが望ましくない場合が多
数ある。たとえば、システムは、欠陥DASDがあって
も、限られた動作をすることができることがあり、電源
を遮断すると、この限られた動作が完全に停止すること
になる。これは、システムがリアル・タイム動作に関係
している適用業務、たとえば制御端末やデータ収集シス
テムではきわめて望ましくない。このような環境では、
たとえ正常のDASD性能が得られなくても限られた時
間動作を継続することがしばしば可能であり、システム
を停止するときわめて深刻な結果が生じる。したがっ
て、たとえ限られた時間低い性能で動作することになっ
ても、システムを停止せずに、システムの故障した構成
要素の修理または交換が可能な技法が強く求められてい
る。
【0056】あるDASDが故障したとき、通常の処置
は、できるだけ早く欠陥装置を交換することである。本
発明によれば、交換は、機械的にもプログラミングの点
からもきわめて簡単に実行できるので、コンピュータ保
守の熟練者の助けを借りずに、操作員の手でその操作を
実行することができる。したがって、訪問サービスを要
請し、保守担当員がコンピュータ設置場所に出かけてく
るのを待つ遅延がない。こうすると、システムを完全能
力に復旧する時間が節約されるだけでなく、訪問サービ
スの経費も節約される。操作員がシステムの電源を遮断
し、欠陥ドライブの物理的交換を実行することも可能か
もしれないが、新しいドライブをオンラインにすること
も必要である。それには、通常のパーソナル・コンピュ
ータ・ユーザの熟練レベルでは容易に生えられないプロ
グラミング能力が必要であった。
【0057】したがって、問題は3つある。欠陥DAS
Dの交換が物理的に簡単でなければならず、DASDを
交換した後でシステムを動作状態に復旧するのにプログ
ラミングの熟練を必要としてはならず、システムは性能
が低下しても欠陥ドライブで動作を継続できなければな
らない。
【0058】システムから電源を遮断しないでDASD
を交換することは「ホット・プラギング」と呼ばれる。
DASDがプラグ接続される各アセンブリは、プラグの
一部分としてインタロック・ワイヤを含む。DASDを
システムから外すとき、ワイヤが接続されている回路は
切断される。システムが外されたDASDからデータを
読み出そうと試みる場合、すでに説明したように、パリ
ティ回路が失われたデータを再構築する。システムが外
されたDASDにデータを書き込もうと試みる場合、シ
ステムはそのDASDに性能低下のフラグを付ける。
【0059】図5を参照するに、操作員がシステムをオ
ープンして、欠陥DASDを外すと、インタロック回路
がオープンされる。動作可能DASDをプラグ接続する
と、インタロック回路が閉じて、割込み信号が発生して
制御装置5に送られる。割込み検出は、データ流れ図の
ブロック50で行われる。次にプログラムは、ブロック
51に進み、特定のDASDクラスタ/アレイ位置に関
するバイタル・プロダクト・データ(VPD)を読み出
す。ブロック52で、プログラムは、割込みを発生した
位置に関するバイタル・プロダクト・データを調べ、そ
れが性能低下DASDリスト上にあったかどうか判定す
る。DASD位置が性能低下リスト上にあった場合、プ
ログラムはYES分岐を取ってブロック52aに進み、
そのDASDを性能低下DASDリストから削除し、そ
れをDASD再構築リストに追加し、ブロック54で主
プログラムに戻る。
【0060】ブロック52で実行されたテストでNOの
結果となった場合は、そのDASD位置が性能低下DA
SDリスト上になかったことを示し、ブロック53に分
岐する。ブロック53で、プログラムは、新しくプラグ
接続されたDASDからバイタル・プロダクト・データ
を読み出し、読み出されたデータをそのDASD位置に
対して以前に存在したバイタル・プロダクト・データと
比較する。バイタル・プロダクト・データが変更されて
いる場合は、新しいDASDがその位置にプラグ接続さ
れたことを示し、YES分岐を取ってブロック53aに
進み、そのDASDをDASD再構築リストに追加し、
その情報をDASDリストに追加し、ブロック54で主
プログラムに戻る。あるいは、ブロック53のテストで
NOの結果となった場合は、バイタル・プロダクト・デ
ータが変更されていないことを示し、プログラムは単に
ブロック54で主プログラムに戻る。
【0061】元のデータを新しいDASD上で再構築す
ることは、図6のデータ流れ図で表されるプログラムに
よって実行される。このプログラムの入口は、ブロック
60で表されるアレイ/クラスタ制御装置5プログラム
内の遊休ループからである。ブロック61で、プログラ
ムはDASD再構築リストに照会して、データを復元し
なければならないDASDがあるかどうかを調べる。こ
のテストは、周期的に、またはアレイ/クラスタ制御装
置5が遊休状態にある期間だけ実行することができる。
ブロック61のテストで再構築を必要とするDASDが
あることが示された場合、YES経路から分岐する。こ
の場合プログラムはブロック62に移り、DASD再構
築リストを読み出す。もちろん、ブロック61のテスト
でNOの結果になった場合は、プログラムは、ブロック
63で、単に遊休状態に戻る。
【0062】ブロック64で、プログラムは、コマンド
割込みを禁止する。これによっては、セクタのブロック
の再構築が読出し/書込み動作によって影響を受けない
ようになる。これは、最も簡単な再構築の方法である
が、他の手法も可能である。たとえば、アレイの残りの
部分への通常アクセスを可能にしながら、再構築される
セクタだけをロードする方法がある。このような割込み
は、再構築プログラムから出た後に再び許可される。
【0063】次にブロック65で、プログラムは、DA
SD再構築リスト上の各DASDに対して所定の数のセ
クタからなるブロックを再構築する。
【0064】ラウンド・ロビン方式でデータ、すなわち
一度にx個のセクタの再構築を実行することによって、
動作に必要なブックキーピングは大幅に単純化される。
さらに、この構築は、システムの全体的動作に最小の影
響しか与えないように実行するのが理想的である。主制
御プログラムが制御を再確認できる前に1つのDASD
全体が再構築される場合、必要な時間の量がシステムの
性能に悪影響を与えることがある。DASD再構築プロ
グラムへの1回のエントリによって再構築できるセクタ
の数に限度をもうけることによって、システムがこの作
業にさく時間の量も同様に制限される。
【0065】ブロック66のテストで、再構築の完了し
たDASDがあるかどうか判定する。これは、再構築さ
れたセクタの数を調べることによって判定される。すべ
てのセクタが再構築されたDASDがある場合、YES
分岐を取ってブロック66aに進み、DASD再構築リ
ストからそのDASDを削除し、ブロック67でプログ
ラムに戻る。あるいは、ブロック66のテストでNOの
結果となった場合は、プログラムはブロック67に直接
進む。ブロック67で、DASD再構築リストに含まれ
る再構築されるセクタの数を更新する。次にブロック6
8で、プログラムは遊休状態に戻る。この状態からブロ
ック61のテストが再び実行できる。
【0066】制御プログラムの、DASDアレイからデ
ータを読み出すための部分が、図7に示されている。ブ
ロック70でサブルーチンに入って、データ処理システ
ム2から読出しコマンドを発行する。ブロック71で、
プログラムは、選択されたアレイ内のすべてのDASD
にトラック・シーク・コマンドを出す。ブロック72
で、プログラムは、選択されたアレイ内のすべてのドラ
イブ上の所望のデータ・セクタの行を読み出す。ブロッ
ク73のテストで、エラー訂正コードの検査から、また
はコマンド・エラーの結果として、エラー指示があるか
どうか判定する。
【0067】ブロック73のテストでNOの結果になっ
た場合、データ中にエラーがないことを指示し、プログ
ラムはブロック74に進み、アレイ内のDASDから読
み出されたデータを組み合わせて、記憶サブシステム1
に記憶するためデータ処理システム2から最初に渡され
た形式でそのデータを置く。
【0068】しかし、ブロック73でYESの結果とな
った場合は、プログラムはブロック73aに分岐し、そ
こでプログラムはエラー信号を分析して、単一セクタ・
エラーが起こったかどうか判定する。そのエラーが単一
セクタに限定された場合、YES経路を取って、プログ
ラムはブロック73bに分岐し、そこでエラーのために
失われたデータをセクタ・パリティ情報を使って回復す
る。次にプログラムは、主プログラムに戻り、DASD
から取り出されたデータを組み合わせて、最初に記憶さ
れていたデータ・ブロックを再生する。
【0069】ブロック73aからNO経路を取って分岐
する場合は、エラーが2つ以上のセクタに広がっている
ことを示し、プログラムはブロック73cに分岐する。
ブロック73Cで、システムは読出し動作を再試行し、
さらにデータ回復動作を実行する。これによってうまく
エラーの大きさを単一セクタに縮小することができた場
合、プログラムはYES経路を取ってブロック73dか
らブロック73bに移る。エラーの大きさが単一セクタ
より大きいままであった場合は、ブロック73dから出
口はNO経路を経由し、ブロック73eで読出し中にハ
ード・エラーがあったと報告する。
【0070】プログラムが、ブロック74への経路を取
って元のデータを再生する場合、プログラムは続いてブ
ロック75に進む。ブロック75で、読出しコマンドを
テストして、読み出さなければならないセクタがまだ残
っているかどうか調べる。読出し動作がまだ完了してい
ない場合、YES経路を取って、プログラムはブロック
72で読出しプログラムに再び入る。読み出さなければ
ならないセクタがもうなくなった場合は、NO経路を取
って、プログラムはブロック76に分岐し、読出し動作
が首尾よく完了したことを指示する。
【0071】図8のデータ流れ図は、システムによって
書込み動作がどのように実行されるかを示す。データ処
理システム2の中央演算処理装置3が、書込みコマンド
をアレイ/クラスタ制御装置5に出す。この書込みコマ
ンドは、メモリ・アドレス、記憶サブシステムに書き込
まれるファイルの名前、及びデータが書き込まれるアレ
イを指定する。
【0072】ブロック80でアレイ/クラスタ制御装置
5がデータ処理システムから書込みコマンドを受け取る
と、プログラムは、ブロック81に進んで、書込みコマ
ンドによって指定されたアレイを、性能低下DASDリ
スト上の性能低下DASDのリストと比較する。書込み
コマンドによって指定されたアレイが性能低下DASD
リスト上にない場合、NO分岐を取ってブロック81a
に進み、指定されたDASDアレイにトラック・シーク
・コマンドを出す。指定されたアレイがこのコマンドを
受け取り、アクチュエータが読出し/書込みヘッドをデ
ィスク上の希望するトラックの上方に移動させる。シー
ク・コマンドを出した後、ブロック81bで、図2に示
されたデータ・ブロック100などのデータ・ブロック
を取り、それを適当な数、たとえば選択された例では3
個の単位(区画)に分割し、その区画に対する新しいパ
リティ区画を生成する。ブロック81bで実行される動
作は、先に図2に関して示し説明した、データ形式の変
換及び関連するバッファ記憶に対応する。この動作は、
システムで使用されるエラー訂正コードに従ったデータ
の変更も含んでいた。
【0073】次にブロック81cで、4つの並列経路を
介して選択されたDASDアレイ内の4つのドライブ
に、変換されたデータを書き込む。これは、図2の信号
線106−1ないし106−4によって示される動作で
ある。データの書込みに続いて、ブロック81dで、記
録されたデータを検査して、書込みエラーがあったかど
うか判定する。これは、DASDから戻された状況コー
ドを調べることによって実行される。トラック・エラー
は、書込み動作の前に検出される。エラーが検出された
場合、プログラムは、YES経路を取ってブロック81
eに分岐し、検出されたエラーの性質に対応するエラー
回復手順を実行する。ブロック81fで、書込みエラー
またはシーク・エラーがあるかどうか第2のテストを実
行する。ここでエラーが検出された場合は、プログラム
は、YES経路を取ってブロック81gに進む ブロッ
ク81gで、ブロック81fで検出されたエラーの追加
分析を実行して、2つ以上のDASDがエラーを発生し
たかどうか判定する。YES分岐を取る場合は、2つ以
上のDASDがエラーを起こしていることを示し、YE
S分岐を取ってブロック81hに進み、ハード書込みエ
ラー、すなわち同じ位置に再書込みをすることによって
訂正されないエラーがあることを指示し、書込み動作が
試みられたDASDアレイを、性能低下DASDリスト
に追加する。
【0074】ブロック81gのテストで単一のDASD
だけがエラー状態にあることが判明した場合、NO経路
を取ってブロック81iに分岐し、故障したDASDを
性能低下DASDリストに追加する。次にプログラム
は、ブロック81jに進み、書込みコマンドと、書き込
まれたセクタの数を比較して、書き込むべきセクタがま
だあるかどうか調べる。セクタがすべて書き込まれてい
る場合、書込みコマンドは完了し、プログラムはNO経
路を取ってブロック82aに進む。ブロック82aで、
書込みコマンドが首尾よく完了し、次のコマンドの実行
のために記憶サブシステムが使用できることを指示す
る。
【0075】すべてのセクタに書き込まれると、システ
ムはYES出力を送って図9のブロック83dに至る。
ブロック81dに戻って、エラーがあるかどうかのテス
トでトラック・シーク・エラーまたは書込みエラーが見
つからなかった場合、プログラムはNO経路を取ってブ
ロック81kに進み、書込みコマンド中に存在していた
セクタの数と、書き込まれたセクタの数を比較し、書き
込むべきセクタがまだあるかどうか判定する。ブロック
81kからYES分岐を取る場合、プログラムは、ブロ
ック81bに戻って、次のデータ・ブロックを取りそれ
を分割してデータ単位及びパリティ単位を形成し、得ら
れたデータを指定されたDASDアレイに書き込む。す
べてのセクタが書き込まれている場合、ブロック81k
のテストはNO分岐を取ってブロック81lに進む。こ
のブロックは、図9のブロック82aと類似のものであ
り、書込みコマンドが首尾よく完了し、次のコマンドの
実行のために記憶サブシステムが使用できることを指示
する。
【0076】次にブロック81に戻って、性能低下DA
SDリストを書込みコマンドによって指定されたアレイ
と比較する。指定されたDASDがそのリスト上にあっ
た場合、プログラムはYES経路を取って、ブロック8
1aと同じ機能を奏するブロック83aに分岐し、プロ
グラムの、データを性能低下モードで書き込む部分に進
む。このモードでは、故障ドライブが性能低下DASD
リスト上にあることは単に無視される、すなわち故障D
ASDは、あたかも正しく機能しているかのように取り
扱われる。もちろん、これは、通常のエラー回復技法で
故障したDASDが十分に補償できると仮定したもので
ある。このことについては、後でさらに説明する。
【0077】ブロック83で、先に説明したブロック8
1bと同様に522バイトの元のデータ・ブロックを各
174バイトの3つの区画に分割する。プログラムは、
ブロック83cに進み、先に説明したブロック81cと
同様に選択されたDASDアレイにデータを書き込む。
ブロック83cの書込み動作は、あたかも欠陥DASD
が実際に適切に機能しているかのように行なわれ、それ
が正しく機能していないことを無視する。
【0078】ブロック83dでテストを実行し、書込み
エラーまたはトラック・シーク・エラーがあったかどう
か判定する。このテストでNOの結果になった場合、プ
ログラムはブロック83kでテストを実行し、まだ書き
込まれずに残っているセクタがあるかどうか判定する。
ブロック83dに戻って、書込みエラーまたはトラック
・シーク・エラーが起こった場合、プログラムはブロッ
ク83eに分岐し、先に説明したブロック81eと同様
にエラー回復手順を実行する。
【0079】次にブロック83fで、エラー回復手順の
結果を検査して、未訂正のエラーがあるかどうか調べ
る。このブロックは、ブロック81fと同じ手順に従
う。すべてのエラーが訂正されている場合、プログラム
は、NO分岐を取ってブロック83kに進み、書込みコ
マンドによって指定されたセクタを書き込まれたセクタ
の数と比較する。書き込むべきセクタがまだある場合、
プログラムは、YES分岐を取って、ブロック83bに
戻る。すべてのセクタが書き込まれている場合、プログ
ラムはNO分岐を取ってブロック82aに進む。ブロッ
ク82aで、書込みコマンドが完了し、別のコマンドを
実行するために記憶サブシステムが使用できることを指
示する。
【0080】ブロック83fのエラー回復手順でブロッ
ク83dで検出されたエラーから回復できなかった場
合、プログラムはYES分岐を取ってブロック83gに
進む。ブロック83gで、ハード書込みエラー、すなわ
ち回復不能なエラーがあることを指示し、そのエラーを
発生したDASDを性能低下DASDリストに追加す
る。次にプログラムは、ブロック81で主プログラムに
戻る。
【0081】図10は、個々のDASD装置のスピンド
ル・モータを制御するためのシステムを示す。すでに説
明したように、DASDは、4つのDASDのアレイに
配置されている。これらのアレイは、任意の数のアレイ
からなるクラスタに組み合わされる。好ましい実施例で
は、各アレイは4台のDASDから構成される。区分さ
れたデータは、一度に4単位ビットずつアレイに書き込
まれる。すなわち、3つの区画の各々から1単位ずつと
それに対応するパリティ単位(ブロック)が、同時に4
枚のディスクに書き込まれる。読出しも並列に実行され
るので、アレイの4枚のディスクすべての回転位置を、
互いに正確な関係に保たなければならない。そうしなか
った場合、システム性能は低下する。すなわち、読出し
動作は、最後のDASDがデータをパスしてしまうまで
待たなければならない。したがって、4台のDASDが
同じ速度で回転し、さらに互いに所定の位置関係を獲得
し、記憶サブシステムの動作中ずっとこの関係を維持す
ることが極めて望ましい。
【0082】この作業の困難さは、1トラック上に記録
されるビットの数、すなわちビット密度を考え、各ディ
スクの位置を1ビット位置の許容差に維持しなければな
らないことを認識すると理解できる。このレベルの正確
さの要件は、各DASDに対して先入れ先出し型の読出
しバッファを設けることによって緩和することができ
る。バッファのサイズは、通常、単一セクタよりわずか
に大きいものを扱えるように設定すると好都合である。
様々なDASDの間の小さなスキューは、データが各バ
ッファから読み出されたときにデータを同期させること
によって補正できる。この手法を用いると、スキューの
問題が解決され、DASDの回転位置の許容差が緩和さ
れるが、その代りに遅延が増加する。これは、データを
使用するとき、最後のディスクがアドレスされたデータ
を読出しヘッドの下にもってくるまで、システムが待た
なければならないためである。通常の状況では、この遅
延は、3600rpmで動作しているDASDで通常見
られる回転待ち時間より小さい程度の大きさである。バ
ッファ誘発性遅延は、ディスクが数ビット位置移動する
のに必要な時間である。実際の遅延は、ディスクが通常
のDASDの約3倍の高速で回転していることによって
さらに短縮される。
【0083】図10で、各DASD 100nは、速度
/位置制御機構90をもつ。これは、図1のアレイ/ク
ラスタ制御装置5内に位置する。各速度/位置制御機構
90は、制御ループ95をもつ。このループは、DAS
Dからのインデックス・パルスの位置を、加算回路91
内のすべての制御機構90に対して確定された基準と比
較する働きをする。通常の場合、基準インデックス・パ
ルスは、アレイ/クラスタ制御装置5内で水晶制御発振
器92によって発生され、記憶サブシステム及び関連デ
ータ処理システムから見てインデックス・パルスの最適
な出現時間を表す。
【0084】インデックス検出器93は、ディスク94
上のインデックス・マークが通過するごとにインデック
ス・パルスを供給する。これは、DASD 100n内
のディスクの速度及び位置の尺度を提供する。インデッ
クス検出器93からのインデックス・パルス及び水晶基
準発振器92からの基準パルスが、加算回路91で比較
され、その結果生じる誤差信号が、制御ループ95に送
られる。好ましい実施例では、ディジタル技術を利用し
て制御ループ95を実施するが、制御ループ95の実際
の実施態様はアナログ、ディジタル、またはハイブリッ
ド技術のいずれでもよい。それが、DASDスピンドル
・ドライブ・モータ97のコイルを励起する、DASD
モータ・ドライブ回路96への信号を発生する働きをす
ると言うだけで十分である。制御ループは、DASD
100nの速度を、水晶基準発振器92によって定義さ
れる速度に正確に合わせ、インデックス・パルスが正確
な時間に丁度インデックス検出器を通過するようにDA
SD 100nのディスクを位置決めすることができ
る。これによって、すべてのDASDの間の位置同期が
実現される。あるDASDのディスク位置が他のDAS
Dのディスク位置よりわずかに後ろにある場合、制御ル
ープ95は、遅れたDASDの速度を、それが正しい速
度で回転していても、適切な位置に達するまでわずかに
加速させる。適切な位置に達した時点で、他のDASD
と適合するように速度を下げ、適切な位置を維持する。
【0085】アレイ/クラスタ制御装置5に使用される
電子回路のより包括的な図が、図11に示されている。
中央演算処理装置との交信は、シリアル・インタフェー
ス6を介して行なわれる。このインタフェースは、アレ
イ/クラスタ制御装置5内にあるシリアル・インタフェ
ース・ドライバ/レシーバ・チップ120につながって
いる。ディジタル制御チップ122は、シリアル・イン
タフェース制御部123を含む。この制御部は、アレイ
/クラスタ制御装置5とデータ処理システム2の間のシ
リアル・インタフェースを制御するためのものである。
シリアル・インタフェース制御部は、データ処理システ
ム2とアレイ/クラスタ制御装置5の間でやり取りされ
るすべてのデータ及び制御信号の適切な同期、緩衝及び
復号を実行する。
【0086】サーボ・デモジュレータ・チップ127
は、読出し線128aからディスク上に書き込まれたア
ナログ・サーボ・データを読み出し、ディスク位置のデ
ィジタル表示をバス127b上に供給する。
【0087】ディジタル制御チップ122はまた、ディ
ジタル信号処理部125を含む。この信号処理部は、サ
ーボ・デモジュレータ・チップ127の第2出力を表す
バス127b上の読出しヘッド位置データに応答する。
バス127a上の信号が処理されると、ボイス・コイル
・ドライバ・チップ130に制御信号が供給される。ド
ライバ・チップ130は、DASDのヘッド・アーム・
アセンブリと連動するアクチュエータのボイス・コイル
型モータのコイル132を励起する。サーボ・デモジュ
レータ・チップ127、ディジタル制御チップ122の
ディジタル信号処理部125、及びボイス・コイル・ド
ライバ・チップ130は、読出し/書込みヘッドをアド
レスされたトラックの上方で位置決めするためにヘッド
・アーム・アセンブリが移動され、データがトラックに
書き込まれトラックから読み出されるのに適切な位置に
維持されるように、ボイス・コイル・ドライバ・コイル
を励起する。
【0088】さらに、サーボ・デモジュレータ・チップ
127は、インデックス検出器の機能を果たし、インデ
ックス信号をバス127bを介してディジタル信号処理
部125に渡す。インデックス信号は、先に図10に関
して説明したように水晶基準発振器で比較され、適切な
駆動信号がスピンドル・モータ・ドライバ・チップ96
に送られる。ドライバ・チップ96から、図10に関し
て説明したように適切な駆動信号が発生され、スピンド
ル駆動モータ・コイル97に送られる。
【0089】ディジタル制御チップ122はさらに、符
号化/復号部126を含む。この部分は、DASDディ
スクから読み出されたデータを復号し、そのデータをD
ASDディスク上に記録させる働きをする。記録される
データは、アナログ波形コンディショナ・チップ124
に渡される。コンディショナ・チップ124は、ディジ
タル波形を取り、それを適当なアナログ波形に変換し
て、マルチプレクサ・チップ128を介して読出し/書
込みヘッド128a、128b、...、128nのう
ちの選択された1つのヘッドに送る。DASDディスク
からデータを読み出すとき、ヘッド128a、128
b、...、128nのうちの1つからアナログ信号が
選択され、マルチプレクサ・チップ128によって増幅
され、アナログ波形及びクロック生成機構チップ124
に渡され、そこで調整されディジタル化される。位相ロ
ック・クロック信号が、読み出されたデータから取り出
され、ディジタル化された読出しデータと共にディジタ
ル制御チップ122の符号化/復号部126に供給され
る。次に符号化/復号部126は、それをディジタル波
形に変換し、ディジタル制御装置チップ122のシリア
ル・インタフェース制御部123へ転送する。
【0090】本発明の電気的態様及びシステム態様につ
いて説明したので、次に図12及び図13、14に移
る。図12は、記憶サブシステム内で使用される1つの
DASDの平面図である。図13、14は、図12に示
したDASDの線XII−XIIに沿って切りとった断
面図である。可能な場合、説明される要素を両方の図に
示し、同じ参照番号で識別する。ベース・プレート15
0とカバー151は、組み合わさって、出来た格納機構
内に位置するDASDの各種構成要素のシールを行な
う。
【0091】公称直径65mmの複数のディスク160
a、160b、160c、160dが、スピンドル・ア
センブリ162上に回転できるように配置され、その一
端はベース・プレート150で、他端はカバー151で
支持されている。スピンドル・アセンブリ162の一部
分として、スピンドル駆動モータ164、及びディスク
160a、160b、160c、160dを適切な位置
に保持するためのスペーサ213とクランプ212が組
み込まれている。スピンドル・アセンブリ162につい
ては、後で図17を参照して詳しく説明する。
【0092】ディスク160a−160dの各表面は、
データを記録するために適当な磁性記録材料でコートさ
れている。図16に示したように、複数の磁気トランス
ジューサ170a及び170a’ないし170d及び1
70d’が、データを読み出し書き込むため、ディスク
160aないし160dの上下のコートされた表面と共
同作用するように位置決めされている。記録ヘッド17
0は、当該のサスペンション・アセンブリ171a及び
171a’ないし171d及び171d’の端部に装着
されている。ヘッド170のサスペンションは、通常の
ジンバル設計に従い、システムの動作中にヘッドをディ
スク表面から約6.5マイクロインチ(0.165ミク
ロン)浮かせることができる。
【0093】再び図12を参照すると、各DASDアセ
ンブリは、DASDへのすべての必要な電力線及び信号
線を担持するコネクタ169を含む。
【0094】図15を参照すると、各ヘッド/サスペン
ション・アセンブリは、コーム・アセンブリ173の対
応するアーム173a−173eに固定されている。コ
ーム・アセンブリ173は、ベアリング・カートリッジ
175の周りを回転するように配置されている。ベアリ
ング・シャフト端部175a及び175bは、ベアリン
グ175を両端支持するように、ベース・プレート15
0及びカバー151を貫通してそれに結合し、カバー1
51をベース・プレート150と係合した状態に保持す
る助けをする。駆動コイル176から構成されるアクチ
ュエータ・コイルは、コーム・アセンブリ173の、ア
ーム173a−173eと対向する端部に装着されてい
る。
【0095】コイル176がいずれかの極性の直流によ
って励起されると、駆動コイル176内の電流が、それ
ぞれカバー151とベース150に固定された永久磁石
アセンブリ177aと177bの磁界と共同作用して、
コーム・アセンブリ173をベアリング175の周りで
回転させ、ヘッド170をディスク160上の所望のト
ラックの上方で位置決めし、データの読出し/書込み中
にそれらのヘッドをトラック上方の正しい位置に維持す
る。磁石アセンブリ177aと177bはそれぞれ1対
の永久磁石177a1と177a2、177b1と17
7b2を含み、各対はそれぞれ軟磁性体177a3と1
77a4のベース部材上に装着されている。これらのベ
ース部材は、駆動コイル176から見た磁気回路を完成
し、磁気アクチュエータの駆動効率を向上する低磁気抵
抗経路を提供する。1対のクラッシュ・ストップ178
a及び178bは、それぞれその中点にエラストマ・ク
ッション178cをもち、コームが許容範囲を超えて移
動するのを防止する働きをする。フレキシブル・ケーブ
ル・アセンブリ179は、磁気ヘッド170及び駆動コ
イル176への必要な接続を行なう。
【0096】図17に示したスピンドル・アセンブリ1
62は、シャフト190を含み、その両端は、ベース・
プレート150及びカバー151中に設けられた対応す
る穴と対合し、シャフトを両端で支持するようにそれら
に結合されている。シャフトを両端で支持することによ
って、いわゆる「タワー」装着に付随する傾斜及び振動
の問題は完全に回避され、完成したアセンブリは振動及
び共鳴がほとんどない。シャフト190に取り付けられ
た1対のベアリング191と192は、ディスク駆動モ
ータの極193を支持し、それを固定されたシャフト1
90の周りで回転させる。
【0097】シャフト190に取り付けられた1組の巻
線194が駆動電流によって励起され、回転磁界を発生
する。この回転磁界は、鋼鉄の極193の内面に装着さ
れた永久磁石200と共同作用して、その極を回転させ
る。鋼鉄のスペーサ201はベアリング192と係合
し、極193の下部を支持する。極193の外面に取り
付けられたアルミニウム・ハブ210は、その外径がデ
ィスク220の内径より小さく、熱膨張の余地を与え
る。ディスク220及びスペーサ213は、シャフト1
90の周りで心合せされ、クランプ212によってハブ
210上で定位置に保持されている。
【0098】図18は、4台のDASD 230a、2
30b、230c、230dが単一のプラグ接続可能な
カード231上にどのように装着されるかを示す。すな
わち、このような各カードは、単一のアレイを構成し、
複数のこのようなカードがクラスタを形成する。このカ
ードは、通常のプリント回路素材から作成され、接触舌
232から個々のDASDに延びるランド(図示せず)
を含む。個々のDASD 230はそれぞれ、プラグ2
35a−235dを介してカードに接続される。
【0099】図19は、DASD 230がどのように
カード231に固定されるかを示す。各DASD位置
は、キーホール・スロット238a、238b、及び第
3のスロット(図示せず)を含む。これらのスロット
は、DASD 230上の対応するショック・マウント
240a並びに第2及び第3のマウント(図示せず)、
それらに関連するプラグ234b1並びに第2及び第3
のプラグ(図示せず)と一列に並ぶ。
【0100】図20は、DASDプラグ及びショック・
マウントの配置をより詳細に示す。DASDはプリント
回路カード231と係合して保持されるが、ショック・
マウントによってカードに関連するショックから機械的
に隔離される。各DASDは、3つのショック・マウン
トを含み、それぞれが真中を通るフェルール・ピン24
2、及びエラストマ・グロメットをベース150に保持
するネジ部分243をもつ。ショック・マウント型グロ
メットは、通常の形状をもち、プリント回路カードの穴
の肩を収容する環状のスロットを周囲に含む。グロメッ
トをカード内の鍵形スロットの大きい部分に差し込むこ
とによって、DASDをカード231上に装着する。次
にDASDを移動させて、グロメット・スロットを鍵形
スロットの狭い部分に押し込む。プラグ234を鍵形ス
ロットの大きい部分に差し込むことによって、DASD
はスロットの狭い部分に保持される。
【0101】いま説明したDASDの機械的装着は、比
較的に簡単であり、使いやすい配置を提供するだけでな
く、DASDとカードの間の多数の電気的接触に関する
要件をも満たす。システムのプラグ接続可能な各構成要
素間の機械的隔離と電気的接触というこの二重の要件
は、従来は一般に、固定されたショック・マウントとプ
ラグ接続可能なケーブルによって満たされてきた。この
手法は、ほとんどのパーソナル・コンピュータ・システ
ムでいわゆるハード・ドライブの装着の際にとられてい
る。この二重要件のため、たとえば機械的装着の完了後
に必要なケーブル接続ができないなど、エラーの機会が
増大する。これは、故障を直すためにコンピュータを部
分的に分解しなければならないことを意味する。さら
に、ケーブルは配線を誤りやすく、システムのコストを
増加させる。
【0102】図20に示すように、DASD 230の
プラグ接続可能なコネクタ169は、ソケット241に
つながるアパーチャと隣接するが、それから離れた位置
にくるように構成されている。DASDを移動させて、
ショック・マウントをキーホール・スロットの狭い部分
に位置決めすると、コネクタ169は、コネクタ169
上のランドがソケット241内の対応する接点と接触す
るように、ソケット241のアパーチャ内に入る。従来
のソケットは、DASDとカード231の間の機械的隔
離をもたらさないので、新規な配置が提供される。コネ
クタ169のランドとカード231上の対応するラン
ド、たとえばランド245及び256との間の電気的接
続は、バネ247及び248によって実施される。挿入
中のソケットの位置決めは、2本のピン260によって
行なわれる。これらのピンは保持用座金260aを含
み、これらの座金は、カード231の過大なサイズの穴
中でピンを浮かせる。これは、DASDコネクタ169
の挿入中の過剰な移動を防止するが、その後係合が外れ
て、DASD 230をカード231から機械的に隔離
する。
【0103】本発明の利点は、交換の前にシステムの電
源を遮断し、交換後にシステムの電力を再度投入する必
要なしに、故障したDASDを取り外し、それを動作可
能な装置と交換できることである。したがって、この動
作モードは、「ホット・プラギング」と呼ばれる。図2
1で、ホット・プラギング機能の機械的態様を図示す
る。各DASDアレイ300は、信号及び電源用の複数
の接触ランドを含むプラグ接触部分302をもつカード
301を備えている。プラグ接触部分302上のランド
は、データ処理システムのフレームに取り付けられたソ
ケット310の対応する接点と共同作用する。DASD
がソケット310で電源にプラグ接続できるように、各
ランド320は電源ランド321及び322よりも物理
的に短くなっている。このため、DASD 300内の
回路及びアレイ/クラスタ制御装置5内の回路がプラグ
接続操作中にスプリアス信号を受け取らないことが保証
される。信号回路と電源回路が混合方式でまたは同時に
接続される場合、それらの回路はスプリアス信号を発生
し、アレイ/クラスタ制御装置に、またはさらに悪くす
るとデータ処理システムにエラーをもたらす。信号接続
が行なわれる前にDASD 300の回路に適切に電力
を供給することによって、スプリアス信号の発生が回避
される。プラグ302上のランドの機械的配置は、電源
ランドが接続されるまで信号ランドへの接触を物理的に
防止する。挿入中、電源接触を行なってから、信号接触
を行なうまでの間の時間遅延により、すべての回路に適
切に電力が供給され、それによってエラー信号の発生が
防止される。
【0104】
【発明の効果】本発明によれば、単一ドライブ・システ
ムよりも信頼性の高い多重ドライブ・ディスク記憶シス
テムが得られる。
【0105】本発明によれば、多重ドライブ・ディスク
記憶システムを電力遮断する必要なく、かつデータの損
失なく、個々のドライブを接続及び切断できる、多重ド
ライブ・ディスク記憶システムが得られる。
【0106】本発明によれば、4つのドライブをもち、
そのうちの1つのドライブが故障してもデータの損失を
起こさない、または実質的に性能を損なわない、ディス
ク記憶システムが得られる。
【0107】本発明によれば、データの並列検索によっ
てデータがより高速で検索できるように、高速、低コス
トのアクチュエータを使用して比較的により少量のデー
タにアクセスすることのできる、ディスク記憶システム
が得られる。
【0108】本発明によれば、アクチュエータ速度の損
失またはシステム信頼性の低下を受けずに、各アクチュ
エータによってアクセスできるデータの量を減らす、デ
ィスク記憶システムが得られる。
【図面の簡単な説明】
【図1】本発明のディスク記憶システムのアーキテクチ
ャを示す機能ブロック図である。
【図2】データの変換、及びデータ処理システムから記
憶サブシステムへのデータの転送を示す機能ブロック図
である。
【図3】ディスク・ドライブが動作不能になった条件下
での記憶サブシステムからデータ処理システムへのデー
タの転送を示す機能ブロック図である。
【図4】システム電源投入及びシステム・リセット中に
アレイ/クラスタ制御装置が利用するプログラムを示す
データ流れ図である。
【図5】制御プログラムの、システムの電源を遮断せず
に欠陥DASDの取外し及び正常DASDの代替使用を
行なう部分を示すデータ流れ図である。
【図6】アレイ/クラスタ・プログラムの、欠陥がある
と判定されたDASDの代りにに新しいDASD上にデ
ータを再構築する部分を示すデータ流れ図である。
【図7】プログラムの、DASDから読み出されたデー
タを取り、パリティ検査し、元のデータを再生する部分
を示すデータ流れ図である。
【図8】プログラムの、データ処理システムからのデー
タをDASDサブシステムに書き込む部分を示す左半分
のデータ流れ図である。
【図9】プログラムの、データ処理システムからのデー
タをDASDサブシステムに書き込む部分を示す右半分
のデータ流れ図である。
【図10】プログラムの、スピンドル駆動モータを制御
するのに使用される部分を示すデータ流れ図である。
【図11】記憶サブシステム制御装置によって利用され
るシステムの電子回路の概略図である。
【図12】記憶サブシステム制御装置で使用されるディ
スク・ドライブの平面図である。
【図13】図12に示したディスク・ドライブの側面図
である。
【図14】図12に示したディスク・ドライブの側面図
である。
【図15】アクチュエータ及びヘッド・アーム・アセン
ブリの展開図である。
【図16】ヘッド・アーム・アセンブリ及びディスクの
両端の部分側面図である。
【図17】ベアリング支持体の中心で切ったスピンドル
駆動モータの側面図である。
【図18】5.25インチのディスク・ドライブの標準
の形状因子の整数分の1に適合し、個々のディスク・ド
ライブを切断及び接続することのできる、カード上に装
着された4台のディスク・ドライブの配置図である。
【図19】個々のDASDがどのようにカード上に装着
されるかを示す図である。
【図20】DASD用のショック・マウント及びソケッ
トの詳細な断面図である。
【図21】個々のクラスタをアレイから外して交換でき
る、プラグ及びガイドの配置を示す図である。
【符号の説明】
1 ディスク記憶システム 2 データ処理システム 3 中央演算処理装置 4 ランダム・アクセス記憶装置(RAM) 5 アレイ/クラスタ制御装置 7 記憶装置アレイ 8 記憶装置アレイ 9 記憶装置アレイ 10 データ処理システム 101 データ・バッチ 105 バッファ及びECC生成機構 110 パリティ生成機構
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ティモシー・ジョセフ・チャイナー アメリカ合衆国ニューヨーク州マホパッ ク、アールデイ ナンバー1 バレッ ト・ヒル・ロード (番地なし) (72)発明者 トーマス・ウイリアム・グラサー アメリカ合衆国ミネソタ州ロチェスタ ー、ボックス183、 ルート8番地 (72)発明者 リチャード・グレンバーグ アメリカ合衆国ミネソタ州ロチェスタ ー、ノーザン・ヒルズ・ドライブ・ノー ス・イースト 748番地 (72)発明者 アヴィジット・ムカジー・ムカジー アメリカ合衆国カリフォルニア州サンノ ゼ、アンジュ・クリーク・サークル 7143番地 (72)発明者 ジェリー・リー・ネウバウアー アメリカ合衆国ミネソタ州ロチェスタ ー、フィフス・アベニュー・サウス・イ ースト 706番地 (72)発明者 ジョン・ラルフ・レイデンバッチ アメリカ合衆国ミネソタ州ロチェスタ ー、フィフス・アベニュー・ノース・ウ エスト 3001番地 (72)発明者 ロバート・エルスウォース・スコップ アメリカ合衆国ミネソタ州ロチェスタ ー、セブンティーンス・アベニュー・ノ ース・ウエスト 2712番地 (72)発明者 ロバート・アレン・スクラントン アメリカ合衆国カリフォルニア州サンノ ゼ、ビュウクレスト・コート 20242番 地 (56)参考文献 特開 昭62−24481(JP,A) 特開 昭55−108915(JP,A) 特公 昭60−5023(JP,B2)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】磁気記録のための複数のトラックを有する
    磁性体コーティングの記録媒体を持つ少なくとも1つの
    ハード・ディスク、前記ディスクを回転させるためのス
    ピンドル駆動手段、データ・ブロックを読出し記録する
    ために前記記録媒体と協働するトランスジューサ手段及
    び前記トランスジューサ手段を前記ディスク上の複数の
    データ・トラックの選択された1本上に位置決めするア
    クチュエータ手段よりなるディスク・ドライブをN個有
    するディスク記憶装置において、 データ・ブロックを第1乃至第N−1番目のドライブに
    分散して記録し、前記データ・ブロックに対するパリテ
    ィ情報を第N番目のドライブに記録する手段と、 前記
    ディスク・ドライブの各ディスクの回転位置間の位相差
    を示すスピンドル速度誤差信号を発生する手段と、 前記誤差信号に応答して、前記N個のディスク・ドライ
    ブの記録媒体に分散して記録された前記データ・ブロッ
    クが同時にアクセスされるように前記ディスク・ドライ
    ブの前記ディスクの回転速度及び相対位置を電子的にロ
    ックする手段と、 を含むことを特徴とするハード・ディスク記憶装置。
  2. 【請求項2】前記N個のディスク・ドライブのいずれか
    1つが前記装置から切断されたこと検出し切断されたデ
    ィスク・ドライブを示す切断信号を発生する切断信号手
    段と、 前記N個のディスク・ドライブの前記切断された1つが
    前記装置に再接続されたことを検出し再接続されたディ
    スク・ドライブを示す再接続信号を発生する接続信号手
    段と、 前記切断信号及び前記再接続信号に応答して接続状態に
    あるN−1個のディスク・ドライブから対応するデータ
    単位及びパリティ情報単位を読み出し、読み出した各単
    位から前記切断されたディスク・ドライブにあったデー
    タ単位またはパリティ情報単位を再生し、再生された単
    位を前記再接続されたディスク・ドライブに記録する再
    生手段と、 を更に含むことを特徴とする請求項1記載のディスク記
    憶装置。
  3. 【請求項3】N=4であることを特徴とする請求項1ま
    たは2記載のハード・ディスク記憶装置。
JP3103708A 1990-03-30 1991-03-14 ディスク記憶装置 Expired - Fee Related JP2702308B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US50221590A 1990-03-30 1990-03-30
US502215 1995-07-13

Publications (2)

Publication Number Publication Date
JPH04228153A JPH04228153A (ja) 1992-08-18
JP2702308B2 true JP2702308B2 (ja) 1998-01-21

Family

ID=23996857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3103708A Expired - Fee Related JP2702308B2 (ja) 1990-03-30 1991-03-14 ディスク記憶装置

Country Status (4)

Country Link
EP (1) EP0450801A2 (ja)
JP (1) JP2702308B2 (ja)
BR (1) BR9101260A (ja)
CA (1) CA2034904C (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2597060B2 (ja) * 1991-12-13 1997-04-02 富士通株式会社 アレイディスク装置
US5537566A (en) * 1991-12-17 1996-07-16 Fujitsu Limited Apparatus and method for controlling background processing in disk array device
US5586250A (en) * 1993-11-12 1996-12-17 Conner Peripherals, Inc. SCSI-coupled module for monitoring and controlling SCSI-coupled raid bank and bank environment
EP0660236B1 (en) * 1993-11-30 1999-06-09 Hitachi, Ltd. Disc array system having disc storage devices dispersed on plural boards and accessible at withdrawal of part of the boards
US5566316A (en) * 1994-02-10 1996-10-15 Storage Technology Corporation Method and apparatus for hierarchical management of data storage elements in an array storage device
US5745771A (en) * 1994-07-08 1998-04-28 Hitachi, Ltd. Disc array device and disc control method
JPH08221220A (ja) * 1995-02-20 1996-08-30 Hitachi Ltd ディスクアレイ装置
JPH11119922A (ja) 1997-10-17 1999-04-30 Fujitsu Ltd データ記憶システム及び冗長データ書き込み制御方法
KR100344890B1 (ko) 1998-02-27 2002-07-20 가부시키가이샤 옵트웨어 광정보 기록장치 및 방법, 광정보 재생장치 및 방법,광정보 기록재생장치 및 광정보 기록매체
GB2341715A (en) * 1998-09-17 2000-03-22 Springtek Limited Magnetic disk redundant array
JP2009252049A (ja) * 2008-04-08 2009-10-29 Ricoh Co Ltd 電子計算機

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55108915A (en) * 1979-02-16 1980-08-21 Fujitsu Ltd Disc pack device
JPS605023A (ja) * 1983-06-22 1985-01-11 Tokuyama Soda Co Ltd 塩化カルシウム水溶液の製造方法
CA1263194A (en) * 1985-05-08 1989-11-21 W. Daniel Hillis Storage system using multiple mechanically-driven storage units
CA1296103C (en) * 1987-06-02 1992-02-18 Theodore Jay Goodlander High-speed, high capacity, fault-tolerant, error-correcting storage system
US4870643A (en) * 1987-11-06 1989-09-26 Micropolis Corporation Parallel drive array storage system
US4933785A (en) * 1988-03-01 1990-06-12 Prairietek Corporation Disk drive apparatus using dynamic loading/unloading
US4914656A (en) * 1988-06-28 1990-04-03 Storage Technology Corporation Disk drive memory
WO1990001737A1 (en) * 1988-08-02 1990-02-22 Cray Research, Inc. Single disk emulation for synchronous disk array

Also Published As

Publication number Publication date
JPH04228153A (ja) 1992-08-18
EP0450801A2 (en) 1991-10-09
BR9101260A (pt) 1991-11-05
CA2034904A1 (en) 1991-10-01
CA2034904C (en) 1995-07-18
EP0450801A3 (ja) 1994-02-16

Similar Documents

Publication Publication Date Title
USH1221H (en) High speed, small diameter disk storage system
EP0505363B1 (en) Multiple actuator disk drive
US7143308B2 (en) Apparatus, system, and method for differential rebuilding of a reactivated offline RAID member disk
JP2702308B2 (ja) ディスク記憶装置
US6950900B1 (en) Method and apparatus for migrating data having a format of a first type to a format of a second type
EP1999554B1 (en) Hard disk storage system
EP0556302A4 (en) Multiple actuator disk drive
US6594724B1 (en) Enhanced DASD with smaller supplementary DASD
US8645622B2 (en) Method to protect data on a disk drive from uncorrectable media errors
US20090168227A1 (en) Distributed track identifier on a hard disk drive
US20020138694A1 (en) Magnetic disc drive, method for recording data, and method for reproducing data
Tanabe et al. Redundant optical storage system using DVD-RAM library
US20070174678A1 (en) Apparatus, system, and method for a storage device's enforcing write recovery of erroneous data
US6310747B1 (en) Method for reducing external signal interference with signals in a computer disk storage system
US7405941B2 (en) Storage array with enhanced RVI suppression
KR100772312B1 (ko) 데이터 기억 방법 및 데이터 기억 장치
JPH06290580A (ja) 集合型ディスク記憶ボード及び集合型ディスク記憶装置
US20020060874A1 (en) Method and apparatus to reduce retry redundancy during read operations
JP2783369B2 (ja) 並列伝送装置に於ける読み込み失敗チャンネルのデータ再生復元方法並びに装置
JPH08221220A (ja) ディスクアレイ装置
KR100242707B1 (ko) 교환기에서 데이터 수록 장치
KR101048997B1 (ko) 디스크 어레이 기록 장치 및 그 기록 제어 방법
CN1164740A (zh) 具有伪写入功能的磁盘机
KR100417229B1 (ko) 하드디스크드라이브의패러티섹터배치방법
JP2003346471A (ja) 車載用記憶装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees