JPH07200190A - デイスクアレイ装置 - Google Patents

デイスクアレイ装置

Info

Publication number
JPH07200190A
JPH07200190A JP5355494A JP35549493A JPH07200190A JP H07200190 A JPH07200190 A JP H07200190A JP 5355494 A JP5355494 A JP 5355494A JP 35549493 A JP35549493 A JP 35549493A JP H07200190 A JPH07200190 A JP H07200190A
Authority
JP
Japan
Prior art keywords
disk
data
array
cache memory
failed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5355494A
Other languages
English (en)
Other versions
JP2570614B2 (ja
Inventor
Riichi Takai
利一 高井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5355494A priority Critical patent/JP2570614B2/ja
Publication of JPH07200190A publication Critical patent/JPH07200190A/ja
Application granted granted Critical
Publication of JP2570614B2 publication Critical patent/JP2570614B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】複数のディスクに分散して格納したデータ及び
それらのパリティ情報を保存するディスクアレイにおい
て、1台のディスクが故障した際の読み出し性能低下を
防止する。 【構成】正常時にはディスクドライブ401〜40Nの
それぞれのデータを保持するキャッシュメモリ300
は、ディスクドライブ401〜40Nのいずれかにおい
て故障が検出されると、その故障したディスクドライブ
の内容を保持する仮想ディスクとしても機能する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報処理装置に於いて
用いる磁気ディスクを用いた冗長性を持つディスクアレ
イに関し、特に故障したディスクが存在する場合のデー
タアクセス性能の向上に関する。
【従来の技術】従来情報処理装置において用いられる外
部記憶装置はシステム側の必要によりより大容量の記憶
装置を用いる方向に進んでいたが、この大容量の外部記
憶装置を使用するシステム構成では1つの記憶装置の故
障により大量のデータが一度に喪失してしまう。また、
同一外部記憶装置の別領域に記憶されているデータへの
並列アクセスが出来ないため、システム全体としてのス
ループットが低下してしまう。上記のような単一の大容
量外部記憶装置を用いた場合の弊害をなくすために考え
出された方式がカリフォルニア大学バークレー校コンピ
ュータ科学学科により提唱された“低価格ディスクによ
る冗長アレイ(Redundant Arrays o
f Inexpensive Disk、以下RAID
という)”であり、例えば、「A Case for
Redundant Arraysof Inexpe
nsive Disks (RAID),カリフォルニ
ア大学バークレー校コンピュータ科学学科(EES
C),レポート番号UCB/CSD/87/391」に
記載されている。このRAIDについてはRAID1よ
りRAID5までの5種類の実現方法が提唱されている
が、このうちRAID4及びRAID5として規定され
ている方式ではRAIDアレイに対するデータをブロッ
ク単位で分割し、その分割したデータをアレイを構成す
る各ドライブに分散させて記憶し、そのパリティデータ
を別ドライブに記憶している。このRAID4、5に対
し書き込みを行なう場合、該当データとそれに対応する
パリティデータを一度読みだしてから再書き込みを行な
う必要がある。この為通常の単体ドライブに対するデー
タ書き込みに比べ余分なディスクアクセスが必要とな
る。この読み出し及び再書き込みのために必要となるオ
ーバーヘッドをライトペナルティと呼ぶ。このライトペ
ナルティを少なくするため通常はホストからの書き込み
データがアレイを構成している磁気ディスクへ書き込ま
れる前にキャッシュメモリに一度データを保持し、実際
に磁気ディスクへのデータ書き込みが終了する前にアレ
イとしてホストへ書き込み終了を通知することにより書
き込み時の性能低下を防いでいる。
【0002】また、現在実用化されているディスクアレ
イにおいて1台のドライブが故障した場合、他のドライ
ブのデータより故障したドライブのデータを修復する必
要があるためアレイ全体の性能が低下する。これを防ぐ
ためには故障したドライブに記憶されているはずのデー
タと同等のデータを持つ仮想ドライブを用意する必要が
ある。
【0003】
【発明が解決しようとする課題】上述したようにディス
クアレイでは自己を構成する磁気ディスク装置が故障し
た縮退状態に陥っている場合、故障した磁気ディスク装
置に記憶されているデータを他の磁気ディスク装置より
再構築する必要があるためどうしても通常時に比べ読み
出し速度が低下してしまう。
【0004】本発明はディスクアレイの書き込み性能の
向上のために用意されているライトキャッシュメモリを
故障した磁気ディスク装置とデータ的に同等な仮想ディ
スクとして用いることにより縮退時のデータアクセス性
能の低下を抑えることを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するた
め、本願発明のディスクアレイ装置では、複数のディス
クドライブを有するディスクドライブ群と、これらディ
スクドライブ群への書込みデータに関するエラー修復の
ための情報としてエラー修復情報を生成し、前記ディス
クドライブ群からの読出しデータに関してエラーの発生
をチェックしてエラー修復をするアレイ制御手段と、前
記複数のディスクドライブの1つが故障した場合にはこ
の故障したディスクドライブが格納すべきデータとして
前記アレイ制御手段により修復されたデータを格納する
キャッシュメモリ手段とを有している。
【0006】また、前記キャッシュメモリ手段は前記故
障したディスク以外のディスクが格納するデータをも格
納する。
【0007】
【実施例】次に本願発明のディスクアレイ装置の一実施
例について図面を参照して詳細に説明する。
【0008】図1を参照すると、本願発明の一実施例で
あるディスクアレイ装置は、インタフェース手段100
と、アレイ制御手段200と、キャッシュメモリ300
と、ディスクドライブ群400とを含んでいる。
【0009】インタフェース手段100は、他の装置か
らアクセス要求を受け、また、返答を返す。
【0010】アレイ制御手段200は、ディスクアレイ
装置全体の制御を行なう。すなわち、ディスクドライブ
群400にアクセスすると共に、キャッシュメモリ30
0の管理を行なう。
【0011】キャッシュメモリ300は、ディスクドラ
イブ群400の内容を一時的に格納するディスクキャッ
シュの機能を有し、また、後述するように故障したディ
スクに相当するデータを格納する。
【0012】ディスクドライブ群400は、さらにN台
のディスクドライブ401〜40Nを含んでいる。RA
ID構成をとるディスクアレイの場合、上記N台のディ
スクのうちの1台をパリティデータ保持に使用する。本
実施例においてはディスク40Nをパリティデータ保持
に使用するものとする。
【0013】本願発明のディスクアレイ装置の一実施例
では、通常のRAID構成を持つディスクアレイ装置と
同様に、パリティデータ保持に使用されるディスク40
Nに書き込まれるデータD40Nは、 で表されるものとする。但し、“xor”は排他的論理
和を示し、D40xはそれぞれディスク40xの対応す
るデータを示す。ディスク40Nがこの様に定義された
場合、任意のディスクに保持されているデータは他の
(N−1)台のディスクに保持されているデータの排他
的論理和と等しくなるため、1台のディスクが故障した
場合でも他の(N−1)台のディスクのデータを読み出
しそのデータの排他的論理和を求めればデータ復旧を行
うことが可能となる。通常、ディスクとのデータアクセ
スはセクタと呼ばれるあらかじめ決められたデータサイ
ズを単位として行われるが、RAIDアレイに対しセク
タの大きさ以下の書き込みを行う場合には、複数のディ
スクへの同時アクセスを可能とするために、書き込み時
に全てのディスクのデータを書き換えるのではなく、書
き込みデータの保持を行なうディスク40Aとパリティ
ディスク40Nにのみアクセスを行う必要がある。すな
わち、ディスク40Aに既に書かれているデータをAo
ld,これから書き込まれるデータをAnewとし、パ
リティディスク40Nに書かれていたデータをNold
とした場合、パリティディスクに新たに書き込む必要の
あるデータNnewは他のディスクに書き込まれている
データには関係なく、 であらわすことができることを利用し、パリティディス
ク40Nとディスク40Aに対する読み出しと書き込み
だけで新たなデータの書き込みを終了できる。但し、こ
の処理は単独のディスクに対する書き込みならば1回行
なえば済んでいたディスクアクセスが、ディスクアレイ
では書き込み処理中に、(1)パリティディスク40N
からのNoldの読み出し、(2)データディスク40
AからのAoldの読み出し、(3)パリティディスク
40NへのNnewの書き出し、(4)データディスク
40AへのAnewの書き出し、の4回のアクセスを行
なう必要が生じるため、1回の書き込み終了時間が遅く
なる。以下、これをライトペナルティとよぶ。
【0014】本願発明のディスクアレイ装置の一実施例
では、通常のRAID構成を持つディスクアレイ装置と
同様に、このライトペナルティを短縮するために、一時
的にキャッシュメモリ300に書き込みデータを保持
し、実際にディスク401,402…40Nにデータが
書き込まれていなくともキャッシュメモリ300にデー
タが書き込まれた時点で、インタフェース手段100に
対し終了報告を行う方式を採用する。
【0015】このように構成することにより、任意のデ
ィスク40Xが故障した場合(以下、この故障したディ
スク40Xを故障ディスクという)、通常の単独ディス
クではそのディスク40Xに格納されていたデータを復
旧することは不可能であるが、RAID構成を持つアレ
イでは式(1)より、 と言う関係が成り立つため、他の(N−1)台のディス
クデータの排他的論理和を計算することで、故障ディス
ク40Xのデータを復旧することが可能となる。なお、
このようにディスクの1台が故障し、他のディスクのデ
ータからデータを計算により算出している状態を縮退状
態と呼ぶ。一般に、この縮退状態では通常は40Xのデ
ィスクへのアクセスですむデータ読み出しを行う代わり
に、40Xを除く(N−1)台のディスクへのアクセス
が必要となるため、正常状態よりもアクセス性能が落ち
る。この性能低下を防止するため、本願発明のディスク
アレイ装置の一実施例では、縮退状態においては、キャ
ッシュメモリ300が故障ディスク40Xに相当する内
容を格納することにより、故障ディスク40Xへのアク
セス時に復旧をしないで済むことになる。
【0016】図2(A)を参照すると、本発明の一実施
例のディスクアレイ装置が正常なディスクアレイとして
動作している場合のキャッシュメモリ300のメモリマ
ップにおいて、キャッシュメモリ300は各ディスク5
01,502…50Nに書き込まれるべきデータを一時
的に保持している。インタフェース手段100より転送
された書き込みデータはディスク501,502…50
Nへの書き込み前に各々のディスクに対応させたディス
クキャッシュ301,302…30Nに一度書き込ま
れ、この段階でインタフェース手段100を介して、上
位装置に対し終了報告を行うことにより物理動作が必要
なディスク401,402…40Nへデータを書き込む
場合に比べ、システム全体の書き込み性能の向上を図れ
る。
【0017】図2(B)を参照すると、縮退状態のキャ
ッシュメモリ300のメモリマップにおいて、キャッシ
ュメモリ300は書き込みデータ用のディスクキャッシ
ュ301,302…30Nとしてではなく、故障したデ
ィスク40Xと等価な仮想ディスク700として位置付
けられ、故障ディスク40Xに対するデータ読み出し時
に再構成されたデータを仮想ディスク700に記憶させ
る。つまり、正常時はアレイに書き込まれたデータを保
存し次に書き込まれたデータを読み出す場合にメモリ上
のデータを使用することにより1回のディスクアクセス
を無くしているが、縮退時には故障しているディスク4
0Xのデータを式(3)により再構成した結果を保存す
るために使用することにより故障ディスクデータの読み
出し時にに必要な(N−1)台のディスクへのアクセス
を減らすことを可能とする。この様に一度読み出し処理
が行われた事により再構成された故障ディスク40Xと
等価なデータを仮想ディスク700に蓄積し、同一領域
を再度読み出す場合にはこの蓄積されているデータを読
み出しデータとして使用することにより縮退状態におけ
る読み出し性能の低下を防ぐことが可能となる。この場
合、キャッシュメモリ300の容量はディスク401,
402…40Nと同等以上であることが望ましいが、デ
ィスクより容量が少ない場合でも、通常のキャッシュメ
モリと同様の機能が働き、使用頻度の高いデータを優先
して保持することになるため、仮想ディスク700に記
憶されているデータのヒット率は一定のレベルに保つこ
とが可能である。
【0018】次に本願発明の一実施例のディスクアレイ
装置の動作について説明する。
【0019】図3を参照すると、本願発明の一実施例の
ディスクアレイ装置の縮退時の読出し動作を表す処理の
流れ図である。上位装置からのアクセス要求はインタフ
ェース手段100を介してアレイ制御手段200に渡さ
れ、このアレイ制御手段200で解読される。このアク
セス要求が読み出し要求であれば、アレイ制御手段20
0は図3の流れ図に従って、故障ディスク40Xに対す
るアクセスか否かが判断される(ステップ201)。故
障ディスク40X以外のディスクドライブに対する読み
出し要求であれば、アレイ制御手段200は該当するデ
ィスクドライブから読み出しを行なう(ステップ20
2)。
【0020】故障ディスク40Xに対する読み出し要求
であれば(ステップ201)、当該データがキャッシュ
メモリ300に格納されているか否かが調べられる(ス
テップ203)。当該データがキャッシュメモリ300
に格納されていれば、すなわちキャッシュヒットであれ
ば、当該データがキャッシュメモリ300から読み出さ
れる(ステップ204)。
【0021】故障ディスク40Xに対する読み出し要求
であって、しかも当該データがキャッシュメモリ300
に格納されていなければ(ステップ203)、アレイ制
御手段200はディスクドライブ群400から当該アク
セス要求に対応するパリティ、すなわち式(1)が成立
するD40N、をパリティディスク40Nから読み出す
(ステップ205)。
【0022】続いて、アレイ制御手段200は当該アク
セス要求に係るデータに対応するデータ群、すなわち式
(1)が成立するD401〜D40(N−1)、をディ
スクドライブ群400から読み出す(ステップ20
6)。但し、故障ディスク40Xからはデータを読み出
さない。
【0023】そして、上記パリティD40Nとデータ群
D401〜D40(N−1)とから、式(3)によっ
て、故障ディスク40Xに対応するデータD40Xを復
旧する(ステップ207)。このようにして復旧された
データD40Xは、キャッシュメモリ300に書き込ま
れる(ステップ208)。
【0024】図4を参照すると、本願発明の一実施例の
ディスクアレイ装置の縮退時の書込み動作を表す処理の
流れ図である。上位装置からのアクセス要求が書込み要
求であれば、アレイ制御手段200は図4の流れ図に従
って、ディスクドライブ群400から当該アクセス要求
に対応するパリティ、すなわち式(1)が成立するD4
0N、をパリティディスク40Nから読み出す(ステッ
プ211)。
【0025】続いて、アレイ制御手段200は当該アク
セス要求に係るデータに対応するデータ群、すなわち式
(1)が成立するD401〜D40(N−1)、をディ
スクドライブ群400から読み出す(ステップ21
2)。但し、故障ディスク40Xからはデータを読み出
さない。
【0026】そして、アレイ制御手段200は書込みデ
ータを新たに含めたデータ群D401〜D40(N−
1)から式(1)によってパリティD40Nを生成し
て、このパリティD40Nをパリティディスク40Nに
書き込む(ステップ213)。
【0027】その後、書込みデータが故障ディスク40
Xに対するものであればこの書込みデータはキャッシュ
メモリ300に書き込まれ(ステップ216)、故障デ
ィスク40X以外のディスクドライブに対するものであ
れば当該ディスクドライブに書き込まれる(ステップ2
15)。
【0028】図5及び図6を参照すると、図5はキャッ
シュメモリ300をディスクキャッシュとして用いた場
合のデータ転送ルートを示す図であり、図6は縮退時に
キャッシュメモリ300を仮想ディスク700として使
用した場合のデータ転送ルートを示す図である。
【0029】なお、縮退時にキャッシュメモリ300を
仮想ディスク700として用いた場合、前に示したライ
トペナルティを避ける方法が無くなるためにより書き込
み性能は低下する。この性能低下は、図2(C)にメモ
リマップを示したように縮退時において常にキャッシュ
メモリ300の全容量を仮想ディスク700として確保
するのではなく、故障ディスクと等価なディスクとして
再構成されたデータを保存していない部分をディスクキ
ャッシュとして用いることにより防ぐことが可能とな
る。つまり、キャッシュメモリ300上にライトペナル
ティを防ぐキャッシュとして利用する領域301〜30
Nと仮想ディスク700として利用する領域を双方用意
することにより、仮想ディスク領域700で縮退時の読
み出し性能の低下を、キャッシュ領域301〜30Nで
ライトペナルティの防止を行なうことが可能となる。
【0030】
【発明の効果】以上説明したように、本発明はディスク
アレイにおけるライトペナルティの補完用であるキャッ
シュメモリを、縮退した磁気ディスク装置の仮想ディス
クとして用いることにより、縮退したディスクアレイか
らのデータ読み出し時の性能低下を抑えることを可能と
する効果を有する。
【図面の簡単な説明】
【図1】本発明のディスクアレイ装置の一実施例を表す
ブロック図である。
【図2】本発明の一実施例のキャッシュメモリが格納す
るデータのメモリマップを表す図である。
【図3】本発明のディスクアレイ装置の一実施例の読出
し動作の処理の流れを表す図である。
【図4】本発明のディスクアレイ装置の一実施例の書込
み動作の処理の流れを表す図である。
【図5】本発明のディスクアレイ装置の一実施例におけ
る正常時のデータ転送ルートを表す図である。
【図6】本発明のディスクアレイ装置の一実施例におけ
る故障発生時のデータ転送ルートを表す図である。
【符号の説明】
100 インタフェース手段 200 アレイ制御手段 300 キャッシュメモリ 301〜30N ディスクキャッシュ領域 400 ディスクドライブ群 401〜40N ディスクドライブ 700 仮想メモリ領域

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】複数のディスクドライブを有するディスク
    ドライブ群と、 これらディスクドライブ群への書込みデータに関するエ
    ラー修復のための情報としてエラー修復情報を生成し、
    前記ディスクドライブ群からの読出しデータに関してエ
    ラーの発生をチェックしてエラー修復をするアレイ制御
    手段と、 前記複数のディスクドライブの1つが故障した場合には
    この故障したディスクドライブが格納すべきデータとし
    て前記アレイ制御手段により修復されたデータを格納す
    るキャッシュメモリ手段とを含むことを特徴とするディ
    スクアレイ装置。
  2. 【請求項2】前記キャッシュメモリ手段は前記故障した
    ディスク以外のディスクが格納するデータをも格納する
    ことを特徴とする請求項1に記載のディスクアレイ装
    置。
JP5355494A 1993-12-29 1993-12-29 デイスクアレイ装置 Expired - Fee Related JP2570614B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5355494A JP2570614B2 (ja) 1993-12-29 1993-12-29 デイスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5355494A JP2570614B2 (ja) 1993-12-29 1993-12-29 デイスクアレイ装置

Publications (2)

Publication Number Publication Date
JPH07200190A true JPH07200190A (ja) 1995-08-04
JP2570614B2 JP2570614B2 (ja) 1997-01-08

Family

ID=18444275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5355494A Expired - Fee Related JP2570614B2 (ja) 1993-12-29 1993-12-29 デイスクアレイ装置

Country Status (1)

Country Link
JP (1) JP2570614B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430653B1 (en) 1998-05-01 2002-08-06 Nec Corporation Disk control unit and method for prefetching according to partition information and concatenation information
US6832291B2 (en) 1996-09-16 2004-12-14 Samsung Electronics Co., Ltd. Memory system for improving data input/output performance and method of caching data recovery information
JP2013196481A (ja) * 2012-03-21 2013-09-30 Nec Corp キャッシュ装置、情報処理システム、および、キャッシュ方法
JP2016157257A (ja) * 2015-02-24 2016-09-01 Necプラットフォームズ株式会社 ディスクアレイ装置およびその制御方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6832291B2 (en) 1996-09-16 2004-12-14 Samsung Electronics Co., Ltd. Memory system for improving data input/output performance and method of caching data recovery information
US6430653B1 (en) 1998-05-01 2002-08-06 Nec Corporation Disk control unit and method for prefetching according to partition information and concatenation information
JP2013196481A (ja) * 2012-03-21 2013-09-30 Nec Corp キャッシュ装置、情報処理システム、および、キャッシュ方法
JP2016157257A (ja) * 2015-02-24 2016-09-01 Necプラットフォームズ株式会社 ディスクアレイ装置およびその制御方法

Also Published As

Publication number Publication date
JP2570614B2 (ja) 1997-01-08

Similar Documents

Publication Publication Date Title
US5487160A (en) Concurrent image backup for disk storage system
US5566316A (en) Method and apparatus for hierarchical management of data storage elements in an array storage device
JP2769443B2 (ja) 記憶サブシステム及び関連する装置/方法
JP3164499B2 (ja) ディスクアレイにおけるパリティデータの無矛盾性保持方法
US20090265578A1 (en) Full Stripe Processing for a Redundant Array of Disk Drives
JP3742494B2 (ja) 大容量記憶装置
US5860091A (en) Method and apparatus for efficient management of non-aligned I/O write request in high bandwidth raid applications
JP4754852B2 (ja) ストレージ制御装置および方法
US7228381B2 (en) Storage system using fast storage device for storing redundant data
US6859888B2 (en) Data storage array apparatus storing error information without delay in data access, and method, program recording medium, and program for the same
EP0569313A2 (en) Method and apparatus for operating an array of storage devices
JPH05143471A (ja) 記憶装置の冗長アレイ内の故障記憶装置のオンライン再構成方法
GB2414592A (en) Decreasing failed disk reconstruction time in a RAID data storage system
JP2000207136A (ja) 複数ドライブ故障トレラントraidアルゴリズム
JPH08194586A (ja) データ処理方法、システムおよび装置
US5875460A (en) Disk array subsystem and data generation method therefor
US7240237B2 (en) Method and system for high bandwidth fault tolerance in a storage subsystem
JPH05324579A (ja) 分散ファイルシステム及び記憶装置
KR100463841B1 (ko) 레이드 서브 시스템과 이를 이용한 디스크 에러 모드에서데이터 입출력 및 복구 방법
JP2003316525A (ja) ディスクアレイ制御装置
JP2570614B2 (ja) デイスクアレイ装置
US5659677A (en) Data storage apparatus for disk array
JPH06119125A (ja) ディスクアレイ装置
JP2005166016A (ja) ディスクアレイ装置
JP2004164675A (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19960827

LAPS Cancellation because of no payment of annual fees