JPH08123628A - ディスクアレイ装置 - Google Patents
ディスクアレイ装置Info
- Publication number
- JPH08123628A JPH08123628A JP6286035A JP28603594A JPH08123628A JP H08123628 A JPH08123628 A JP H08123628A JP 6286035 A JP6286035 A JP 6286035A JP 28603594 A JP28603594 A JP 28603594A JP H08123628 A JPH08123628 A JP H08123628A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage device
- holding storage
- parity
- write
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
憶装置21〜24及びパリティ保持用記憶装置25のう
ち任意の4台に対してアクセスが完了すれば、判定部3
によりこれが判定され、データに欠損があればデータ転
送部4で欠損したデータがパリティにより復元され、結
合されてホスト計算機20に転送される。ライト時に
も、リード時と同様に、任意の4台の記憶装置に対して
アクセスが完了すれば、ライト動作を完了させる。そし
て、障害の発生に対してはその4台の記憶装置に格納さ
れたデータを読み出すことにより他の1台の記憶装置に
格納されるべきデータを再生することによって対応す
る。従って、リード及びライトの双方の場合に、なるべ
く動作の速い記憶装置が使用され、アクセス速度を向上
させることができる。
Description
ィスクアレイにおいて、アクセス時間を短縮するように
したディスクアレイ装置に関するものである。
ライン方式等の計算機アーキテクチャの採用により、コ
ンピュータシステムの各構成要素の性能、信頼性は飛躍
的に向上している。一方、機構デバイスを中心とする二
次記憶装置の性能・信頼性向上は他の構成要素には及ば
ず、コンピュータシステム全体の処理能力のボトルネッ
クとなっている。ところで、二次記憶の性能と信頼性
を、現実的なコストの元に改善するため、RAID(Re
dundant Arrays of Inexpensive Disks )アーキテクチ
ャのディスクアレイが提唱されている。このようなディ
スクアレイは複数の二次記憶装置により構成され、デー
タを複数の装置に分割して保存する。そして、アクセス
を並列に行なうことによりデータ転送を高速化する。一
方、1つの二次記憶装置にパリティを格納し、いずれか
1つの二次記憶装置の障害に対応できるようにしてい
る。
た従来の技術には、次のような課題があった。即ち、二
次記憶装置として一般に採用されているものはハードデ
ィスクドライブであり、アクセスの際は回転待ち時間を
伴なう。例えば、4台の装置を使用する場合は4台分の
回転待ち時間が生じる。この場合、高価なシステムでは
スピンドル同期機能により各ディスクの回転を同期させ
て待ち時間を短縮することができるが、小型で安価な普
及品にはこのようなスピンドル同期機能を持たないもの
が多い。従って、例えば、リード時には4台のデータデ
ィスクの回転待ちのため、単一のハードディスクへのア
クセスに比較して回転待ち時間が増加する。また、ライ
ト時にはデータディスクが4台であるとすると、パリテ
ィディスクにもパリティをライトする必要があるので、
5台のディスクの回転待ちを行なう必要があり、回転待
ち時間が更に増加する。これらの増加時間の割合は、シ
ミュレーションを使った実験等の結果、リード時は約6
0%、ライト時は約66%であることがわかっている。
装置は、上述した課題を解決するため、以下の点を特徴
とするものである。 (1) データリード要求時にデータ保持用記憶装置及びパリ
ティ保持用記憶装置のすべてに対してデータリード要求
を発行するデータリード要求発行部を備える。 当該データリード要求発行部によるデータリード要求
の発行後、データリード動作が最も遅い1台を除いたす
べての記憶装置のデータリード動作が完了した時点で、
まだその動作が完了していない記憶装置がデータ保持用
記憶装置かパリティ保持用記憶装置かを判定する判定部
を備える。 当該判定部の判定結果に応じて、パリティ保持用記憶
装置の動作が遅れている場合は、データ保持用記憶装置
からのデータを合成して転送する一方、データ保持用記
憶装置の動作が遅れている場合は、パリティ保持用記憶
装置からのパリティにより遅れて欠落しているデータを
再生しつつ各データを合成して転送するデータ転送部を
備える。
装置に対応してそれぞれ設けられたデータバッファを備
える。 データライト要求時にデータ保持用記憶装置及びパリ
ティ保持用記憶装置のすべてに対してデータライト要求
を発行するデータライト要求発行部を備える。 当該データライト要求発行部によるデータライト要求
の発行直後、複数のデータ保持用記憶装置及びパリティ
保持用記憶装置に分割されたデータ及びパリティを転送
するとともに、これらをデータバッファにも転送するデ
ータ転送部を備える。 当該データ転送部によるデータ転送後、データライト
動作が最も遅い1台を除いたすべての記憶装置のデータ
ライト動作が完了した時点で、ライト動作が完了した旨
を上位装置に報告するライト報告部を備える。 当該ライト報告部によるデータライトの完了報告後、
既にデータライト動作が完了した記憶装置に対応するデ
ータバッファ中のデータを破棄し、その後残りの1台の
記憶装置もデータライト動作が完了した時はそれに対応
するデータバッファ中のデータも破棄する後処理部を備
える。
の4台に対してアクセスが完了すれば、判定部によりこ
れが判定され、データに欠損があればデータ転送部で欠
損したデータがパリティにより復元され、結合されて転
送される。この結果、データリードに際し、なるべく動
作の速い記憶装置が使用でき、アクセス速度を向上させ
ることができる。
例えば5台の記憶装置のうち任意の4台に対してアクセ
スが完了すれば、その4台の記憶装置に格納されたデー
タを読み出すことにより他の1台の記憶装置に格納され
るべきデータを再生することができる。従って、その時
点でライト動作を完了できる。この結果、データリード
の場合と同様に、なるべく動作の速い記憶装置を使用し
てアクセス速度を向上させることができる。
に説明する。図1は、本発明のディスクアレイ装置の一
実施例のブロック図である。図示の装置は、データリー
ド要求発行部1、データライト要求発行部2、判定部
3、データ転送部4、データバッファ51〜55、ライ
ト報告部6、後処理部7を備えている。データリード要
求発行部1、データライト要求発行部2は、主制御部1
0に設けられている。主制御部10は、ディスクアレイ
装置11の全体を制御する。この主制御部10には、不
揮発性メモリ12が設けられている。
機20からのデータリード要求時にデータ制御部13を
介してデータ保持用記憶装置21〜24及びパリティ保
持用記憶装置25のすべてに対してデータリード要求を
発行する。データライト要求発行部2は、データリード
要求発行部1と同様に、ホスト計算機20からのデータ
ライト要求時にデータ制御部13を介してデータ保持用
記憶装置21〜24及びパリティ保持用記憶装置25の
すべてに対してデータライト要求を発行する判定部3、
データ転送部4、ライト報告部6、後処理部7は、デー
タ制御部13に備えられている。データ制御部13は、
データをRAIDレベル3に合せて処理し、データ保持
用記憶装置21〜24及びパリティ保持用記憶装置25
に対するアクセスを制御する。
よるデータリード要求の発行後、データ保持用記憶装置
21〜24及びパリティ保持用記憶装置25からのデー
タリード動作の完了報告を監視する。そして、動作が最
も遅い1台を除いたすべての記憶装置のデータリード動
作が完了した時点で、まだその動作が完了していない記
憶装置がデータ保持用記憶装置かパリティ保持用記憶装
置かを判定する。即ち、5台の記憶装置からの完了報告
を順次記憶していき、4台までの完了報告があった時点
でまだ完了報告のない記憶装置を検出する。
応じて、パリティ保持用記憶装置25の動作が遅れてい
る場合は、データ保持用記憶装置21〜24からのデー
タを合成して主制御部10を介してホスト計算機20に
転送する。一方、データ保持用記憶装置21〜24のい
ずれかの動作が遅れている場合は、パリティ保持用記憶
装置25からのパリティにより遅れて欠落しているデー
タを再生する。そして、再生したデータを含めた各デー
タを合成してホスト計算機20に転送する。データバッ
ファ51〜55は、不揮発性メモリ等から成り、複数の
データ保持用記憶装置21〜24及びパリティ保持用記
憶装置25に対応してそれぞれ設けられている。これら
のデータバッファ51〜55には、データライト要求発
行部2によるデータライト要求の発行直後、データ転送
部4により複数のデータ保持用記憶装置21〜24及び
パリティ保持用記憶装置25に分割されたデータ及びパ
リティが転送されるとともに、それと同一のデータ及び
パリティが転送される。
データ転送後、データライト動作が最も遅い1台を除い
たすべての記憶装置のデータライト動作が完了した時点
で、ライト動作が完了した旨を上位装置であるホスト計
算機20に報告する。即ち、5台の記憶装置からの完了
報告を順次記憶していき、4台までの完了報告があった
時点でまだ完了報告のない記憶装置を検出する。この検
出時点でホスト計算機20への完了報告を行ない、検出
結果は後処理部7へ渡す。後処理部7は、ライト報告部
6によるデータライトの完了報告後、既にデータライト
動作が完了した記憶装置に対応するデータバッファ51
〜55中のデータを破棄する。そして、その後残りの1
台の記憶装置もデータライト動作が完了した時はそれに
対応するデータバッファ中のデータも破棄する。
ドディスク等から成る二次記憶デバイスであり、データ
をバイト単位に分散して格納する。パリティ保持用記憶
装置25も、データ保持用記憶装置21〜24と同様
に、ハードディスク等から成る二次記憶デバイスであ
り、分割データA〜Dに分散したデータに対するパリテ
ィを格納する。
を説明する。まず、RAIDレベル3のディスクアレイ
装置の一般的な動作を詳細に説明する。図2は、RAI
Dレベル3のディスクアレイ装置のデータ及びパリティ
の分散形式を示した図である。ホスト計算機20からの
データは複数のデータ保持用記憶装置21〜24に、バ
イト単位でd0〜d3、d4〜d7の順に格納される。
これらの記憶装置のバイト単位のデータに対して、デー
タライト時にそのパリティp1、p2が生成されてパリ
ティ保持用記憶装置25に格納される。一般に、RAI
Dレベル3のディスクアレイ装置では、このようにデー
タをバイト単位で複数の記憶装置に分散して格納するた
め、データを高速にリード/ライト可能であり、またパ
リティ保持用記憶装置25を有しているため、複数の記
憶装置のうちの1台が故障してもディスクアレイ装置1
1としてはデータが失われることがなく、高速性と信頼
性が発揮される。
3のディスクアレイ装置のデータライト動作、データリ
ード動作、単一ディスクドライブ、障害時のデータライ
ト動作を説明する。ホスト計算機20からのデータライ
ト要求に対して、主制御部10のデータライト要求発行
部2はデータ保持用記憶装置21〜24及びパリティ保
持用記憶装置25にデータライト要求を発行する。そし
て、これらの記憶装置のデータ受理準備ができた時点で
ホスト計算機20からのライトデータをデータ転送部4
により各記憶装置に転送する。このとき、ライトデータ
はデータ保持用記憶装置21〜24に対し、バイト単位
でインタリーブし、同時にこれらの記憶装置のデータバ
イトに対するパリティバイトを図2中の式に従って生成
し、パリティ保持用記憶装置25に転送する。
を本発明に係る手順で読み出す動作を説明する。図3
は、本発明に係るデータリード手順の説明図である。図
示のa,b,c,d,pは、データ保持用記憶装置21
〜24及びパリティ保持用記憶装置25から得られるデ
ータバイト及びパリティバイトである。ホスト計算機2
0からのデータリード要求に対して、主制御部10のデ
ータリード要求発行部1はデータ保持用記憶装置21〜
24及びパリティ保持用記憶装置25のすべてにデータ
リード要求を発行する。このデータリード要求を受けて
データ保持用記憶装置21〜24及びパリティ保持用記
憶装置25の各ディスクドライブはシーク及びスピンド
ルの位置付けの完了後、データ転送を実行できる状態と
なる。
った、又はシークエラー、セレクタ交代を発生させたデ
ィスクドライブをデータ保持用記憶装置24とする。こ
の場合、図3(a)に示すように、データ保持用記憶装
置21〜23及びパリティ保持用記憶装置25のディス
クドライブの転送準備が整った時点でデータ制御部13
のデータ転送部4はバス上のデータバイトa,b,c,
pの取込みを行なう。そして、データ転送部4内のパリ
ティ生成器は得られたデータバイトa,b,c,pによ
り欠落しているデータバイトdを生成し、データバイト
a,b,c,dを主制御部10を介してリードの要求元
であるホスト計算機20に転送する。このようにして、
スピンドルの位置付けの遅れ、又はシークエラー、セレ
クタ交代等により、動作が最も遅いディスクドライブの
影響を除去することができ、データリード動作を高速化
することができる。
む動作を説明する。図4は、本発明に係るデータの同期
ライト手順の説明図である。図示のa,b,c,d,p
は、データ保持用記憶装置21〜24及びパリティ保持
用記憶装置25に転送されるべきデータバイト及びパリ
ティバイトである。ホスト計算機20からのデータの同
期ライト要求に対して主制御部10のデータライト要求
発行部2はデータ保持用記憶装置21〜24及びパリテ
ィ保持用記憶装置25のすべてのディスクドライブに対
してデータライト要求を発行する。このデータライト要
求を受けて各ディスクドライブはライトデータの取込み
を開始する。そして、データバイトa〜d、パリティバ
イトpを各ディスクドライブに転送すると同時にこれら
のバイトを対応する各データバッファ51〜55にも書
き込む。
バイトpの転送後、各ディスクドライブはシーク、スピ
ンドルの位置付けを経て媒体への書き込みを行ない、デ
ータライトとの完了報告を行なう。この完了報告のタイ
ミングはスピンドルの位置付けの差、又はシークエラ
ー、セクタ交代の影響により各ディスクドライブで差異
がある。このため、例えば、データ保持用記憶装置24
のディスクドライブの完了報告が遅れた場合、ライト報
告部6は残りのデータ保持用記憶装置21〜23及びパ
リティ保持用記憶装置25のディスクドライブから完了
報告を受けた時点でホスト計算機20に対して完了報告
を行なう。
5中のデータは必要なくなるため、破棄、若しくはその
領域を再利用できるようにする。このとき、不揮発性メ
モリ12に完了報告を行なっていないディスクドライブ
の識別子、要求アドレス、データ長、完了報告の無いこ
とを示すフラグを記憶する。その後、後処理部7がディ
スクドライブからの完了報告を受けてバッファのデータ
を破棄、若しくはその領域を再利用できるようにし、か
つ不揮発性メモリ12の内容を無効にする。これによ
り、ホスト計算機20からのライト要求に対する一連の
処理を終える。このようにして、スピンドルの位置付け
の遅れ、又はシークエラー、セレクタ交代等により、動
作が最も遅いディスクドライブの影響を除去することが
でき、データライト動作を高速化することができる。
完了報告後、アクセスの遅れているディスクドライブか
らの完了報告を受ける前にディスクアレイ装置11が電
源断等によりダウンした場合は、データバッファ54中
の書き込みデータが失われる。このため、この後のディ
スクアレイ装置11の電源の立ち上げ後、不揮発性メモ
リ12に残されている情報を元にしてアクセスの遅れて
いるディスクドライブ中の欠落データの回復を行なう。
これは、以下の手順で行なう。
出し、どのディスクドライブのどの部分に欠落データが
存在するかを識別する。そして、欠落データの存在する
ディスクドライブにライト要求を発行し、その他のディ
スクドライブにリード要求を発行する。データの欠落し
ていないディスクドライブからのデータにより、データ
制御部13内のパリティ生成器において図3に示す処理
手順に従って欠落データを回復し、欠落データの存在す
るディスクドライブに転送する。そして、欠落データの
転送を終えて、欠落データの存在したディスクドライブ
からのライトの完了報告を受理した後、不揮発性メモリ
12中の情報を無効化し欠落データの回復処理を終え
る。このようにして、電源断による障害にも対応するこ
とができる。
ものではなく、種々の変形が可能であることはもちろん
である。例えば、二次記憶装置の例としてハードディス
ク装置について説明したが、フロッピディスク装置等で
も同様である。また、データバッファを各二次記憶装置
に対応して設けるように説明したが、物理的には1つの
データバッファを論理的に分割して使用することも可能
である。
アレイ装置によれば、すべてのディスクドライブに対し
てアクセス要求を発行して動作の最も遅い1台を除いた
他のディスクドライブのみのアクセス動作の完了により
上位装置に対する完了報告を行なうようにしたので、リ
ード時及びライト時の双方において、ディスクの回転待
ち等のための待ち時間が減少させることができ、アクセ
ス速度の向上を図ることができる。
ック図である。
タ及びパリティの分散形式の説明図である。
る。
である。
Claims (2)
- 【請求項1】 データリード要求時にデータ保持用記憶
装置及びパリティ保持用記憶装置のすべてに対してデー
タリード要求を発行するデータリード要求発行部と、 当該データリード要求発行部によるデータリード要求の
発行後、データリード動作が最も遅い1台を除いたすべ
ての記憶装置のデータリード動作が完了した時点で、ま
だその動作が完了していない記憶装置がデータ保持用記
憶装置かパリティ保持用記憶装置かを判定する判定部
と、 当該判定部の判定結果に応じて、前記パリティ保持用記
憶装置の動作が遅れている場合は、前記データ保持用記
憶装置からのデータを合成して転送する一方、前記デー
タ保持用記憶装置の動作が遅れている場合は、前記パリ
ティ保持用記憶装置からのパリティにより遅れて欠落し
ているデータを再生しつつ各データを合成して転送する
データ転送部とから成ることを特徴とするディスクアレ
イ装置。 - 【請求項2】 複数のデータ保持用記憶装置及びパリテ
ィ保持用記憶装置に対応してそれぞれ設けられたデータ
バッファと、 データライト要求時にデータ保持用記憶装置及びパリテ
ィ保持用記憶装置のすべてに対してデータライト要求を
発行するデータライト要求発行部と、 当該データライト要求発行部によるデータライト要求の
発行直後、前記複数のデータ保持用記憶装置及びパリテ
ィ保持用記憶装置に分割されたデータ及びパリティを転
送するとともに、これらを前記データバッファにも転送
するデータ転送部と、 当該データ転送部によるデータ転送後、データライト動
作が最も遅い1台を除いたすべての記憶装置のデータラ
イト動作が完了した時点で、ライト動作が完了した旨を
上位装置に報告するライト報告部と、 当該ライト報告部によるデータライトの完了報告後、既
にデータライト動作が完了した記憶装置に対応するデー
タバッファ中のデータを破棄し、その後残りの1台の記
憶装置もデータライト動作が完了した時はそれに対応す
るデータバッファ中のデータも破棄する後処理部とから
成ることを特徴とするディスクアレイ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28603594A JP3615250B2 (ja) | 1994-10-26 | 1994-10-26 | ディスクアレイ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP28603594A JP3615250B2 (ja) | 1994-10-26 | 1994-10-26 | ディスクアレイ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08123628A true JPH08123628A (ja) | 1996-05-17 |
JP3615250B2 JP3615250B2 (ja) | 2005-02-02 |
Family
ID=17699137
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP28603594A Expired - Fee Related JP3615250B2 (ja) | 1994-10-26 | 1994-10-26 | ディスクアレイ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3615250B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643734B2 (en) | 1998-03-10 | 2003-11-04 | Nec Corporation | Control device and control method for a disk array |
JP2012103853A (ja) * | 2010-11-09 | 2012-05-31 | Hitachi Ltd | ディスクアレイ装置のエラー制御方法 |
-
1994
- 1994-10-26 JP JP28603594A patent/JP3615250B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6643734B2 (en) | 1998-03-10 | 2003-11-04 | Nec Corporation | Control device and control method for a disk array |
JP2012103853A (ja) * | 2010-11-09 | 2012-05-31 | Hitachi Ltd | ディスクアレイ装置のエラー制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3615250B2 (ja) | 2005-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5128810A (en) | Single disk emulation interface for an array of synchronous spindle disk drives | |
US5072378A (en) | Direct access storage device with independently stored parity | |
USRE39421E1 (en) | On-the-fly redundancy operation for forming redundant drive data and reconstructing missing data as data transferred between buffer memory and disk drives during write and read operation respectively | |
US7770076B2 (en) | Multi-platter disk drive controller and methods for synchronous redundant data operations | |
JP2674985B2 (ja) | データ読み出し制御方法 | |
WO1997044735A1 (en) | Redundant disc computer having targeted data broadcast | |
JPH08161124A (ja) | 計算機システム | |
US20060059306A1 (en) | Apparatus, system, and method for integrity-assured online raid set expansion | |
JPH10105344A (ja) | データ記録装置システム及びそのデータ書込方法 | |
JPH04288615A (ja) | ディスク回転位置制御を行うキャッシュ付きdasdサブシステム及びその実行方法 | |
JP2004095147A (ja) | ストリーミング方式オーディオ・ビジュアル・データをディスク・ドライブに書き込む為の方法 | |
US5396620A (en) | Method for writing specific values last into data storage groups containing redundancy | |
US20030236943A1 (en) | Method and systems for flyby raid parity generation | |
US20040205269A1 (en) | Method and apparatus for synchronizing data from asynchronous disk drive data transfers | |
US5875458A (en) | Disk storage device | |
JP3615250B2 (ja) | ディスクアレイ装置 | |
JP3845239B2 (ja) | ディスクアレイ装置及びディスクアレイ装置における障害復旧方法 | |
US7975103B2 (en) | Method for optimized data record verification | |
JPS6117274A (ja) | 光デイスク制御装置 | |
JPH11119915A (ja) | ディスクアレイ装置 | |
JP2857289B2 (ja) | ディスクアレイ装置 | |
JP4209108B2 (ja) | 記憶装置の制御方法およびこの方法に用いる記憶装置、ディスクアレイ装置、及びディスクコントローラ | |
JP2868003B1 (ja) | 磁気ディスク装置 | |
JPH0421021A (ja) | 半導体ディスク装置のデータバックアップ方式 | |
JP3175999B2 (ja) | ディスクアレイ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040706 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041029 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081112 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |