JPH11119915A - ディスクアレイ装置 - Google Patents

ディスクアレイ装置

Info

Publication number
JPH11119915A
JPH11119915A JP9288268A JP28826897A JPH11119915A JP H11119915 A JPH11119915 A JP H11119915A JP 9288268 A JP9288268 A JP 9288268A JP 28826897 A JP28826897 A JP 28826897A JP H11119915 A JPH11119915 A JP H11119915A
Authority
JP
Japan
Prior art keywords
data
magnetic disk
disk array
read
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9288268A
Other languages
English (en)
Inventor
Hiroyuki Yasuda
浩之 保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9288268A priority Critical patent/JPH11119915A/ja
Publication of JPH11119915A publication Critical patent/JPH11119915A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 RAID4/5ディスクアレイ装置で、構成
する磁気ディスク装置の1台が故障した場合にも、RA
ID3相当のデータ転送速度が得られるディスクアレイ
装置。 【解決手段】 ホストコンピュータからのリードアクセ
ス要求に対して、各磁気ディスク装置14,15から読
出したデータをデータブロック単位毎に順次データバッ
ファ12に格納し、前記磁気ディスク装置14,15か
らそれぞれ1ブロック分のデータの格納が終了した時点
から、前記データバッファ12から所定の順序で格納し
たデータを読出してホストインターフェース19に転送
すると共に、前記磁気ディスク装置14,15からの並
列的なデータ読出しと前記ホストインターフェース19
へのデータ転送とを同時に行うディスクアレイ制御部1
1を有するディスクアレイ装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数の磁気ディス
ク装置とデータバッファを含むディスクアレイ制御部と
を備えたディスクアレイ装置に関するものである。
【0002】
【従来の技術】ディスクアレイ装置とは、データを数バ
イト単位に分解し、複数のディスク・ドライブに対して
並列にリード/ライトする磁気ディスク装置であり、R
AID(Redundant Arrays of Inexpensive Disk)とも
呼ばれる。この「RAIDアーキテクチャ」は、カリフ
ォルニア大学バークレー校において開発されたもので、
RAIDのレベルにはRAID0〜RAID7等の数レ
ベルがある。
【0003】この「RAIDアーキテクチャ」のうち
で、RAID3、RAID4およびRAID5と呼ばれ
るアーキテクチャを採用したディスクアレイ装置は、冗
長データを持つことによって高い信頼性を得るととも
に、RAID3ディスクアレイ装置では複数の磁気ディ
スク装置から同時にデータを転送することによる高転送
速度を実現しており、また、RAID4/5ディスクア
レイ装置では複数の磁気ディスク装置を並列にアクセス
することによる高スループットを実現している。
【0004】なお、「RAIDアーキテクチャ」につい
の公知文献としては、例えば下記の参考文献1〜4があ
る。 参考文献1:Patterson,David A.,Garth A.Gibson,Rand
y H.Katz, “A Case forRedundant Arrays of Inexpens
ive Disks(RAID) ”,Proceedings ofthe 1988 ACM SIG
MOD Conference on Management of Data, ChicagoIL,Ju
ne 1988,pp 109-116ACM [米]Association for Comput
ing Machinery 計算機協会. 参考文献2:Patterson,David A.,Garth A.Gibson,Rand
y H.Katz, “Introductionto Redundant Arrays of Ine
xpensive Disks(RAID)”,CompCon,February 1989 参考文献3:G.A.Gibson: “Performance ahd Reliabil
ity in Redundant arrays ofInexpensive Disks ”,Co
mpCon,February 1989 参考文献4:“The RAID Book: A Source Book for RAI
D Technology”,The RAIDAdvisory Board,1994
【0005】図7は従来のRAID3のディスクアレイ
装置の構成例を示す図である。図7において、71はデ
ィスクアレイ制御部であり、72〜74は内蔵する磁気
ディスク装置(HDD#1〜#3)、75〜77は、デ
ィスクアレイ制御部71と磁気ディスク装置72〜74
とをそれぞれ接続するディスクインターフェースであ
る。そして、このディスクアレイ装置は、ディスク制御
部71からホストインターフェース78を介してホスト
コンピュータと接続される。このホストコンピュータと
接続する磁気ディスク装置の台数はRAIDアーキテク
チャでは規定されていないが、本明細書では3台での構
成を例として説明する。
【0006】図7は、各HDD72〜74内にRAID
3としてデータを格納する場合のデータ格納例と、ホス
トコンピュータからのデータ読出し要求に対してデータ
を転送する場合のディスクアレイ制御部71上でのデー
タの流れを示したものである。ここで各HDDに格納さ
れるデータは、バイト単位で記載され、図のDn m
データブロック#nの第mバイトであり、Pn m はパ
リティブロック#nの第mバイトであるとする。RAI
D3ディスクアレイ装置では、データブロックとパリテ
ィブロックの大きさは等しく、通常は磁気ディスク装置
のセクタ容量である512バイトである。
【0007】図7のRAID3としてのデータ格納法
は、まず#0ブロック第0バイトD00 をHDD73
の第1行に、#1ブロック第0バイトD1 0 をHDD
74の第1行に格納する共に、この2つのデータブロッ
クより生成されるパリティブロックP0 0 をHDD7
2の第1行に格納する。次に#0ブロック第1バイトD
0 1 をHDD73の第2行に、#1ブロック第1バイ
トD1 1 をHDD74の第2行に格納すると共に、こ
の2つのデータブロックより生成されるパリティブロッ
クP0 1 をHDD72の第2行に格納する。以下同様
である。
【0008】また図7のパリティブロックの各バイト
は、他の磁気ディスク装置上の横方向に同一行のデータ
ブロックの各バイトの排他的論理和(記号はEXORで
示す)となるように保持されている。即ち下記の(1)
式で示される。 Pn m =Dn m EXOR Dn+1 m …(1) この(1)式は次の(2),(3)式と変形することができる。 Dn m =Pn m EXOR Dn+1 m …(2) Dn+1 m =Pn m EXOR Dn m …(3)
【0009】すなわち、データを格納している磁気ディ
スク装置のうちの1台が故障した場合でも、残りの磁気
ディスク装置からその磁気ディスク装置内のデータを復
元することが可能である。図7の例で、HDD73が故
障の場合には(2)式を用い、HDD74が故障の場合
には(3)式を用いてデータの復元ができる。このた
め、ディスクアレイ装置では磁気ディスク装置を単に複
数台並べた場合よりも装置全体としてのデータの信頼性
を非常に高くするとができるのである。
【0010】ディスクアレイ装置は、ホストインターフ
ェースに接続される上位のホストコンピュータからは、
全体があたかも1台の磁気ディスク装置であるかのよう
に機能し、特に、RAID3ディスクアレイ装置では、
接続するN台の磁気ディスク装置のうちの(N−1)台
に対してデータをバイト単位で分散して格納し、1台の
磁気ディスク装置にはパリティブロックのみを格納す
る。そのため、例えばホストコンピュータからデータの
読取り要求を受け取った場合、ディスクアレイ装置は接
続する(N−1)台の磁気ディスク装置全てを同時にア
クセスし、データ転送の過程で図7のようにバイト単位
でデータを並び変えながら転送する。すなわち、1台目
の磁気ディスク装置73からの1バイトのデータをホス
トインタフェースに転送したら、次に2台目の磁気ディ
スク装置74からの1バイトのデータをホストインター
フェースに転送する、というように複数の磁気ディスク
装置から転送されてくるデータを直接、すなわちオン・
ザ・フライ(on the fly)で転送する。
【0011】図8は図7のRAID3ディスクアレイ装
置のデータ転送方法を示す図であり、図においては、横
軸を時間軸とし、太線部をデータ転送期間として示して
いる。一般に、ホストインターフェースのデータ転送速
度はディスクインターフェースでのデータ転送速度に比
べ十分に速いため、RAID3ディスクアレイ装置で
は、図8に示すように、HDD73から読出した#0ブ
ロックのデータD0 と、HDD74から読出した#1ブ
ロックのデータD1 とを同一転送期間内にホストインタ
ーフェイスに転送できる。一般に磁気ディスク装置がN
台の場合、(N−1)台に比例した転送速度を達成する
ことができる。
【0012】また、データブロックを格納する磁気ディ
スク装置のうちの1台が故障した場合でも、故障した磁
気ディスク装置の代りにパリティブロックを格納した磁
気ディスク装置をアクセスし、データ転送を行いなが
ら、パリティデータと残りのデータバイトから故障した
磁気ディスク装置上のデータを1バイト毎にオン・ザ・
フライで復元しつつ転送することができるため、正常時
と同等のデータ転送速度のままで通常の動作を行うこと
が可能である。
【0013】図9は従来のRAID5ディスクアレイ装
置のデータ/パリティブロックの配置例を示す図であ
る。RAID4/5ディスクアレイ装置でのデータブロ
ックは、接続する磁気ディスク装置上のセクタ容量(5
12バイト)の整数倍の大きさ(通常は数キロバイト〜
数十キロバイト)であり、通常は、この大きさはホスト
コンピュータから最も高い頻度でアクセスされる単位に
近い大きさに設定される。図9で、ホストコンピュータ
から見た場合に連続するデータブロックD0 〜D7 は、
実際にはデータブロック単位でそれぞれ異なる磁気ディ
スク装置上に分散して配置されており、さらに冗長デー
タとして、それらのデータブロック全てについて、RA
ID3の場合と同様に同一行のデータブロックのデータ
をバイト単位で排他的論理和演算をすることにより生成
されるパリティブロックが残りの磁気ディスク装置上に
配置される。
【0014】すなわち、磁気ディスク装置N台からなる
ディスクアレイ装置は、連続する(N−1)ブロック毎
に、それぞれのデータブロックとそれらから生成したパ
リティブロックをN台の磁気ディスク装置に分散して配
置するのである。これにより、ホストコンピュータから
の連続する複数のアクセス要求に対して、接続されてい
る複数の磁気ディスク装置を並列にアクセスすることが
可能であり、高いスループットを実現することが可能と
なる。このうち、全てのパリティブロックを1台の磁気
ディスク装置上に格納するディスクアレイ装置をRAI
Dレベル4のディスクアレイ装置と呼ぶ。そして、パリ
ティブロックを図9のように(N−1)ブロック毎にそ
れらのデータブロックから生成されるパリティブロック
を次の磁気ディスク装置に格納することにより、パリテ
ィブロックを全ての磁気ディスク装置に分散して配置す
るものをRAIDレベル5のディスクアレイ装置と呼
ぶ。
【0015】すなわち、図9に示したRAID5のディ
スクアレイ装置においては、パリティブロックは、P0
(データD0 とD1 より生成される)が#1磁気ディス
ク92の第1行に、P1 (データD2 とD3 とより生成
される)が#2磁気ディスク93の第2行に、P2 (デ
ータD4 とD5 とにより生成される)が#3磁気ディス
ク94の第3行に、以下順番に#1〜#3磁気ディスク
92〜94に循環的に格納される。またデータブロック
は、1つのパリティブロックを2つのデータブロックよ
り生成するため、そのパリティブロックと同一行となる
ように2つのデータブロックがそれぞれ格納される。R
AID4とRAID5におけるデータの信頼性について
は、両者とも同等であるが、RAID4ディスクアレイ
装置では1台の磁気ディスク装置がパリティブロックの
みを格納しているため、ホストコンピュータからの読取
り要求に対して最大でN台の磁気ディスク装置を並列に
アクセスできるRAID5ディスクアレイ装置よりスル
ープットで劣る。
【0016】RAID4/5ディスクアレイ装置では、
接続する(N−1)台の磁気ディスク装置から、データ
転送の過程で図7のようにバイト単位でデータを並び換
えながらホストインターフェースに転送する。図10は
図9のRAID5ディスクアレイ装置のデータ転送方法
を示す図であり、図においては、横軸を時間軸として、
太線部をデータ転送期間として示している。なお、RA
ID4/5ディスクアレイ装置では、データ分散の単位
がRAID3と異なってブロック単位であるため、ホス
トインターフェースでの転送速度が速くても同時には1
台の磁気ディスク装置からデータ転送を行うのみである
ため、データ転送速度については1台の磁気ディスク装
置相当となる。
【0017】また、データブロックを格納する磁気ディ
スク装置のうちの1台が故障した場合には、故障した磁
気ディスク装置の代りにパリティブロックを格納した磁
気ディスク装置から読出したパリティデータと残りのデ
ータバイトから故障した磁気ディスク装置上のデータの
復元を行うが、同時には1台の磁気ディスク装置からデ
ータを転送することしかできないために、RAID3の
ようにオン・ザ・フライでデータを復元することができ
ず、ディスクアレイ制御部91上のバッファに一旦デー
タを読込んだ上でなければデータを復元することができ
ないため、正常時の場合よりオーバーヘッドが大きくな
る。
【0018】
【発明が解決しようとする課題】以上説明したように、
RAID4/5のディスクアレイ装置では、内蔵する磁
気ディスク装置を並列にアクセスすることで、高いスル
ープットを得ることができるが、データ転送速度、とく
に1台の磁気ディスク装置が故障した場合の転送速度
が、1台の磁気ディスク装置相当どまりか、それ以下で
あるという問題があった。また、ディスクアレイ装置
は、同一のディスクアレイ制御部で、RAID3とRA
ID4又はRAID5の両方を実現できることが望まし
いのだが、両者は前述のようにデータブロックの配置方
法が大きく異なり、とくに1台の磁気ディスク装置が故
障した場合のディスクアレイ制御部上でのデータの転送
と故障データの復元方法の差異が大きく、これを実現す
るにはそれぞれのRAIDのレベルに応じた両方のハー
ドウェアと制御プログラムを搭載することが必要であ
り、開発が困難、かつコスト高となるという問題もあっ
た。
【0019】
【課題を解決するための手段】本発明に係るディスクア
レイ装置は、複数の磁気ディスク装置と、データの一時
格納を行うデータバッファを含むディスクアレイ制御部
とを備えた構成のRAID4又は5のディスクアレイ装
置において、前記ディスクアレイ制御部は、ホストコン
ピュータからのリードアクセス要求に対して、前記構成
する各磁気ディスク装置から読出したデータをデータブ
ロック単位毎に順次データバッファに格納し、前記各磁
気ディスク装置からそれぞれ1ブロック分のデータの格
納が終了した時点から、前記データバッファから所定の
順序で格納したデータを読出してホストインターフェー
スに転送すると共に、複数の磁気ディスク装置から並列
的にデータ読出しを行う場合には、各磁気ディスク装置
からのデータ読出しと前記ホストインターフェースへの
データ転送とを同時に行うようにしたものである。その
結果、ディスクインターフェースのデータ転送速度に対
して、ホストインターフェースのデータ転送速度とデー
タバッファのスループットが十分に大きければ、大量の
データを転送する場合に前記パイプライン処理により、
ホストコンピュータから見た場合のデータ転送速度をR
AID3の場合と同等に高速化することができる。
【0020】
【発明の実施の形態】
実施形態1 図1は本発明の実施形態1に係るRAID4/5ディス
クアレイ装置の構成例を示す図である。図1において、
11はディスクアレイ装置の制御部であり、12はディ
スクアレイ制御部11内のデータバッファである。13
〜15はディスクアレイ装置が内蔵する磁気ディスク装
置#1〜#3、16〜18はディスクアレイ制御部11
と磁気ディスク装置13〜15を接続するディスクイン
ターフェースである。そしてこのディスクアレイ装置
は、ホストインターフェイス19によってホストコンピ
ュータと接続される。
【0021】図1で、ホストコンピュータから見た場合
に連続するデータブロックDn は、図9の場合と同様
に、実際にはデータブロック単位でそれぞれ異なる磁気
ディスク装置上に分散して配置されており、さらに冗長
データとして、それらのデータブロック全てについて、
同一行のデータブロックのデータをバイト単位で排他的
論理和演算をすることにより生成されるパリティブロッ
クPn が残りの磁気ディスク装置上に配置されている。
図1で、Dn m はデータブロック#nの第mバイトで
あり、Pn m はパリティブロック#nの第mバイトで
ある。ここでは簡単のためブロックの大きさをセクタ容
量と等しく、すなわち512バイトとする。
【0022】このようなデータ配置において、ホストコ
ンピュータからD0 ブロックおよびD1 ブロックの全デ
ータ、すなわち1024バイト分のデータリード要求が
発行された場合、ディスクアレイ制御部11は、磁気デ
ィスク装置14,15からそれぞれD0 ブロック、D1
ブロックの各512バイトずつを読出して、ホストイン
ターフェースに対して、D0 0 、D0 1 、…、D0
511 、D1 0 、D1 1 、…、D1 511 の順に転
送する必要がある。本実施形態1は、図1に示す構成の
RAID4/5のディスクアレイ制御部11において、
ホストコンピュータからのリードアクセス要求に対し
て、内蔵する磁気ディスク装置から読出したデータを、
データブロック単位でデータバッファ12に格納し、各
磁気ディスク装置からそれぞれ1ブロック分のデータを
読込み終わった時点で、データバッファ12から必要な
順序でデータを読出してホストインターフェース19に
転送する。
【0023】図2は図1のRAID4/5ディスクアレ
イ装置のデータ転送方法を示す図である。上記のように
複数の(この例では2つの)磁気ディスク装置から読出
したデータブロックを転送する場合は、図2に示すよう
に磁気ディスク装置14,15からデータバッフア12
へのデータ転送期間と、データバッファ12からホスト
インターフェース19へのデータ転送期間を同一時間帯
とする、即ちパイプライン化して転送するようにしてい
る。なお図2は、説明の簡単化のためにRAID4ディ
スクアレイ装置の場合を例として説明するが、全磁気デ
ィスク装置13,14及び15からデータを読取り、パ
リティデータは読捨てとして、残りのデータをデータバ
ッファ12に格納することで同等の処理を行うことが可
能である。
【0024】以上のように本実施形態1により、ディス
クインターフェース16,17及び18のデータ転送速
度に対して、ホストインターフェース19のデータ転送
速度とデータバッファ12のスループットが十分に大き
ければ、大量のデータを転送する場合には、図2のよう
にデータ転送をパイプライン化することにより、ホスト
コンピュータから見た場合のデータ転送速度をRAID
3と同等な速度、即ち接続する磁気ディスク装置の台数
(N−1)にほぼ比例した転送速度を達成することがで
きる。
【0025】実施形態2 図3は本発明の実施形態2に係るRAID5のデータ/
パリティブロックの配置例を示す図である。実施形態1
において、RAID5ディスクアレイ装置の場合には、
大量のデータを転送するときは、接続する磁気ディスク
装置N台全てからデータは読取るが、読取データの1/
Nは読捨ててデータ転送をする必要があるなど、制御が
RAID4の場合に比べて複雑になる上に、無駄なデー
タ読取を行うために余計な消費電力を費やすことにな
る。そこで本実施形態2では、図3に示すように連続す
る複数行、この図の場合では簡単化のため2行のパリテ
ィブロックを同一の磁気ディスク装置に格納するように
配置したものである。即ち図3の例では、パリティブロ
ックP0 ,P1 を磁気ディスク装置22の第1行と第2
行に格納し、パリティブロックP2 ,P3 を磁気ディス
ク装置23の第3行と第4行に格納している。
【0026】以上のように本実施形態2により、RAI
D5ディスクアレイ装置のデータブロックとパリティブ
ロックの配置を、部分的にはRAID4ディスクアレイ
装置と同じように、複数行のパリティブロックを同じ磁
気ディスク装置に格納することによって、大量データの
データ転送時には、データ転送の制御を容易にし、かつ
消費電力を削減するとともに、少量データの並列転送で
は従来のRAID5ディスクアレイ装置とほぼ同等なス
ループットを実現できる。
【0027】実施形態3 前記実施形態2によるRAID5ディスクアレイ装置に
おいて、リードアクセス要求に対する大量のデータ転送
中も、通常は1台の磁気ディスク装置はアクセスされて
いない状態である。そこで本実施形態3では、この大量
データ転送中に、さらに、ホストコンピュータから磁気
ディスク装置上の少量のデータのリードアクセス要求が
あり、これが、その時点で動作中でない磁気ディスク装
置上に格納されているものだった場合に、これに対する
シークコマンド(磁気ディスク装置において、書込み位
置や読取り位置にヘッドを位置づけさせる命令)をあら
かじめ発行するものである。
【0028】以上のように本実施形態3により、大量デ
ータの転送中に、その時点で動作中でない磁気ディスク
装置から少量データのリードアクセス要求があった場合
に、シークコマンドをあらかじめ発行しておくことによ
り、大量データの転送が終了した後にすぐに少量アクセ
スのデータの転送を開始することが可能となり、スルー
プットを向上させることができる。もちろん、既に実行
中のデータ転送と同時に異なるアクセスのデータ転送を
実行できる場合は、直接リードコマンドを発行して、デ
ータ転送を並列に行うことにより更なるスループットの
向上を実現することができる。
【0029】実施形態4 本実施形態2では、シーケンシャルナな大量データのリ
ードアクセスが続いた場合、パリティブロックを格納す
る磁気ディスク装置が切替わる境界部(例えば、図2に
おいて、磁気ディスク装置22の第2行のパリティブロ
ックP1 より次の行のデータブロックD4 に切り替わる
境界部)において、それまで動作していなかった磁気デ
ィスク装置からのデータブロックの転送を開始する必要
があるため、ここで、その磁気ディスク装置のヘッドの
移動を行う間はデータ転送が中断される。そこで本実施
形態4は、本実施形態2におけるリードアクセス要求に
対する大量データ転送中に、ホストコンピュータから他
のアクセス要求が無い場合に、現在転送中のデータ転送
に続くシーケンシャルなリードアクセス要求が発行され
る場合に備えて、その時点で動作中でない、すなわち現
在転送しているブロック行のパリティブロックを格納し
ている磁気ディスク装置に対して、該当する磁気ディス
ク装置内のそれ以降の行でパリティブロックでなくなる
最初のアドレスへのシークコマンドをあらかじめ発行す
るものである。
【0030】以上のように本実施形態4により、シーケ
ンシャルな大量データのリードアクセスが続いた場合、
パリティブロックを格納する磁気ディスク装置が切替わ
る境界部において、それまで動作していなかった磁気デ
ィスク装置からのデータブロックの転送を開始する場合
に、あらかじめシークコマンドを発行することにより、
既にその磁気ディスク装置のヘッドの移動が終了してい
るため、この境界部でのデータ転送の中断をほとんどな
くすことが可能となる。
【0031】実施形態5 図4は本発明の実施形態5に係るRAID4/5のHD
D1台故障時のデータ転送方法を示す図である。即ち図
4は、本実施形態1,2において、データブロックを格
納した磁気ディスク装置の1台(この例では磁気ディス
ク装置34)が故障している場合の、本実施形態5のリ
ードアクセスの動作を示している。本実施形態5では、
磁気ディスク装置の1台が故障した場合に、読出すべき
データブロックを格納する他の磁気ディスク装置ととも
に、前記データブロックに係るパリティブロックを格納
する磁気ディスク装置を同時にアクセスし、バイト単位
でこれらのデータとパリティとの排他的論理和演算をオ
ン・ザ・フライで行うことで故障した磁気ディスク装置
のデータを復元した上で、これをデータバッファ32の
本来故障した磁気ディスク装置から読出したデータを格
納するはずの領域に格納するようにしたものである。
【0032】以上のように本実施形態5により、1台の
磁気ディスク装置が故障した場合でも、従来のRAID
4/5ディスクアレイ装置のように性能が低下せず、R
AID3ディスクアレイ装置相当のデータ転送速度を維
持することができる。
【0033】実施形態6 図5は本発明の実施形態6に係るディスクアレイ装置の
データ転送方法を示す図である。前記の本実施形態1,
2においては、図2に示すようなパイプライン動作によ
りデータ転送を行っていたが、本実施形態6では、さら
にデータ転送時間を短縮することを可能とするパイプラ
イン動作を示している。
【0034】前記の本実施形態1では、先頭ブロックの
ホストインターフェースへの転送は、各磁気ディスク装
置からの先頭ブロックのデータが全てデータバッファに
格納された後に、単純なパイプライン動作を行うように
したものである。これに対して、本実施形態6では、図
5に示すように、最初の磁気ディスク装置からのデータ
転送方法を変更し、最初にホストインターフェースに転
送すべきデータブロックは、データバッファに格納せず
に、先行して直接ホストインターフェースに転送するよ
うにしたものである。そして以後は通常のパイプライン
動作を行うようにしている。
【0035】以上のように本実施形態6により、最初に
ホストインターフェースに転送すべきデータはデータバ
ッファをバイパスして先行して転送させ、残りのデータ
は本実施形態1,2の場合と同等の速度でデータを転送
できるため、データの転送時間を図2の場合よりも更に
短縮することができ、ホストコンピュータから見た場合
のデータ転送速度を向上させることができる。
【0036】実施形態7 図6は本発明の実施形態7に係るRAID3モードでの
データ転送方法を示す図である。前記図7に示したRA
ID3と図9に示したRAID5とでは、ディスクアレ
イ装置におけるデータの配置法が異なる。そこで図1に
示した本実施形態1のRAID4/5ディスクアレイ装
置において、ディスクアレイ制御部内のデータバッファ
からホストインターフェースに対するデータ転送時の転
送順序を図6のように行うことにより、接続する磁気デ
ィスク装置へのデータ配置をRAID3ディスクアレイ
装置相当(以後、これをRAID3モードと呼ぶ)とし
てホストコンピュータへのデータ転送を行うことができ
る。
【0037】前記実施形態1では、ディスクアレイ制御
部11内のデータバッファ12に格納されたデータは、
データバッファ上でのアドレス順に読出しホストインタ
ーフェースに転送することにより、RAID4ディスク
アレイ装置としてのリードアクセス動作を実現してい
る。これに比較して本実施形態7では、ディスクアレイ
制御部内のデータバッファ61上からの読出し領域を、
1バイト毎に次のデータブロックの領域に切替えながら
図6のような順序で転送することにより、RAID3デ
ィスクアレイ装置としてのリードアクセス動作を実現す
ることができる。
【0038】本実施形態7におけるデータバッフア上か
らの読出し領域をRAID3モードとしてデータ転送を
行う方法は、磁気ディスク装置から読出したデータをデ
ータバッファに格納するまでの処理が正常の場合にも、
また磁気ディスク装置の1台が故障(図4に示した実施
形態5)の場合にも共通に採用できるので、本発明によ
るRAID3/4/5兼用のディスクアレイ装置では、
RAID3モード時と他のモード時で必要な、ハードウ
ェアと制御プログラムの多くが共通化できる。従ってこ
の兼用のディスクアレイ装置の開発は容易となり、兼用
装置のコストを小さくすることができる。
【0039】
【発明の効果】以上のように本発明によれば、複数の磁
気ディスク装置と、データの一時格納を行うデータバッ
ファを含むディスクアレイ制御部とを備えた構成のRA
ID4又は5のディスクアレイ装置において、前記ディ
スクアレイ制御部は、ホストコンピュータからのリード
アクセス要求に対して、前記構成する各磁気ディスク装
置から読出したデータをデータブロック単位毎に順次デ
ータバッファに格納し、前記各磁気ディスク装置からそ
れぞれ1ブロック分のデータの格納が終了した時点か
ら、前記データバッファから所定の順序で格納したデー
タを読出してホストインターフェースに転送すると共
に、複数の磁気ディスク装置から並列的にデータ読出し
を行う場合には、各磁気ディスク装置からのデータ読出
しと前記ホストインターフェースへのデータ転送とを同
時に行うようにしたので、その結果、ディスクインター
フェースのデータ転送速度に対して、ホストインターフ
ェースのデータ転送速度とデータバッファのスループッ
トが十分に大きければ、大量のデータを転送する場合に
前記パイプライン処理により、ホストコンピュータから
見た場合のデータ転送速度をRAID3の場合と同等に
高速化することができる。
【図面の簡単な説明】
【図1】本発明の実施形態1に係るRAID4/5ディ
スクアレイ装置の構成例を示す図である。
【図2】図1のRAID4/5ディスクアレイ装置のデ
ータ転送方法を示す図である。
【図3】本発明の実施形態2に係るRAID5のデータ
/パリティブロックの配置例を示す図である。
【図4】本発明の実施形態5に係るRAID4/5HD
D1台故障時のデータ転送方法を示す図である。
【図5】本発明の実施形態6に係るディスクアレイ装置
のデータ転送方法を示す図である。
【図6】本発明の実施形態7に係るRAID3モードで
のデータ転送方法を示す図である。
【図7】従来のRAID3ディスクアレイ装置の構成例
を示す図である。
【図8】図7のRAID3ディスクアレイ装置のデータ
転送方法を示す図である。
【図9】従来のRAID5ディスクアレイ装置のデータ
/パリティブロックの配置例を示す図である。
【図10】図9のRAID5ディスクアレイ装置のデー
タ転送方法を示す図である。
【符号の説明】
11,21,31 ディスクアレイ制御部 12,32,61 データバッファ 13,22,33 HDD#1 14,23,34 HDD#2 15,24,35 HDD#3 16〜18 ディスクインターフェース 19 ホストインターフェース

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 複数の磁気ディスク装置と、データの一
    時格納を行うデータバッファを含むディスクアレイ制御
    部とを備えた構成のRAID4又は5のディスクアレイ
    装置において、 前記ディスクアレイ制御部は、ホストコンピュータから
    のリードアクセス要求に対して、前記構成する各磁気デ
    ィスク装置から読出したデータをデータブロック単位毎
    に順次データバッファに格納し、前記各磁気ディスク装
    置からそれぞれ1ブロック分のデータの格納が終了した
    時点から、前記データバッファから所定の順序で格納し
    たデータを読出してホストインターフェースに転送する
    と共に、複数の磁気ディスク装置から並列的にデータ読
    出しを行う場合には、各磁気ディスク装置からのデータ
    読出しと前記ホストインターフェースへのデータ転送と
    を同時に行うようにしたことを特徴とするディスクアレ
    イ装置。
  2. 【請求項2】 複数の磁気ディスク装置と、データの一
    時格納を行うデータバッファを含むディスクアレイ制御
    部とを備えた構成のRAID5のディスクアレイ装置に
    おいて、 前記ディスクアレイ制御部は、前記構成する磁気ディス
    ク装置の台数より1つ減算した数のデータブロック毎に
    生成するパリティブロックを予め設定された連続する行
    数だけ同一の磁気ディスク装置に格納するようにその格
    納アドレスを制御し、ホストコンピュータからのリード
    アクセス要求に対して、前記構成する各磁気ディスク装
    置から読出したデータをデータブロック単位毎に順次前
    記データバッファに格納し、前記各磁気ディスク装置か
    らそれぞれ1ブロック分のデータの格納が終了した時点
    から、前記データバッファから所定の順序で格納したデ
    ータを読出してホストインターフェースに転送すると共
    に、複数の磁気ディスク装置から並列的にデータ読出し
    を行う場合には、各磁気ディスク装置からのデータ読出
    しと前記ホストインターフェースへのデータ転送とを同
    時に行うようにしたことを特徴とするディスクアレイ装
    置。
  3. 【請求項3】 前記ディスクアレイ制御部は、ホストコ
    ンピュータからのリードアクセス要求に対する大量のデ
    ータの転送中で、さらにホストコンピュータから磁気デ
    ィスク装置上の少量のデータのリードアクセス要求があ
    り、前記少量のデータがその時点で動作中でない磁気デ
    ィスク装置上に格納されているものである場合に、前記
    少量のデータに対するシークコマンドを予め発行するよ
    うにしたことを特徴とする請求項2記載のディスクアレ
    イ装置。
  4. 【請求項4】 前記ディスクアレイ制御部は、ホストコ
    ンピュータからのリードアクセス要求に対する大量のデ
    ータの転送中で、ホストコンピュータから他のアクセス
    要求が無い場合に、現在転送中のデータ転送に続くシー
    ケンシャルなリードアクセス要求が発行される場合に備
    えて、現在転送しているデータブロックに対応するパリ
    ティブロックを格納している磁気ディスク装置に対し
    て、この装置内の前記対応するパリティブロック以降の
    行でパリティブロックでなくなる最初のアドレスへシー
    クコマンドを予め発行するようにしたことを特徴とする
    請求項2記載のディスクアレイ装置。
  5. 【請求項5】 前記ディスクアレイ制御部は、前記構成
    する磁気ディスク装置のうちの1台が故障し、この故障
    した装置に格納されていたデータを含む領域のデータの
    リード要求を受けた場合に、このリード要求を受けたデ
    ータブロックを格納するその他の磁気ディスク装置と前
    記データブロックに係るパリティブロックを格納する磁
    気ディスク装置を同時にアクセスし、このアクセスで読
    出したバイト単位でのデータとパリティとの排他的論理
    和演算をオン・ザ・フライで行い前記故障した磁気ディ
    スク装置上のデータを復元し、この復元したデータを故
    障が発生しない場合の前記データバッファの本来格納す
    べき領域に格納するようにしたことを特徴とする請求項
    1又は2記載のディスクアレイ装置。
  6. 【請求項6】 前記ディスクアレイ制御部は、ホストコ
    ンピュータからのリードアクセス要求により前記構成す
    る磁気ディスク装置からデータを読出してホストインタ
    ーフェースに転送する際に、最初にホストインターフェ
    ースに転送すべきデータブロックは前記データバッファ
    に格納せずに、先行して直接ホストインターフェースに
    転送するようにしたことを特徴する請求項1又は2記載
    のディスクアレイ装置。
  7. 【請求項7】 複数の磁気ディスク装置と、データの一
    時格納を行うデータバッファを含むディスクアレイ制御
    部とを備え、前記複数の磁気ディスク装置にはRAID
    4又は5によるデータ格納がなされた構成のディスクア
    レイ装置において、 前記ディスクアレイ制御部は、ホストコンピュータから
    のリードアクセス要求に対して、前記構成する磁気ディ
    スク装置から読出したデータをデータブロック単位毎に
    順次前記データバッファに格納し、前記各磁気ディスク
    装置からそれぞれ1ブロック分のデータの格納が終了し
    た時点から前記データバッファから格納データを読出す
    際に、読出し領域をデータの1バイト毎に次のデータブ
    ロックの領域に切替えながら前記データバッファからデ
    ータを読出してホストインターフェースに転送すること
    により、RAID3ディスクアレイ装置としてのリード
    アクセス動作を行うようにしたことを特徴とするディス
    クアレイ装置。
JP9288268A 1997-10-21 1997-10-21 ディスクアレイ装置 Pending JPH11119915A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9288268A JPH11119915A (ja) 1997-10-21 1997-10-21 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9288268A JPH11119915A (ja) 1997-10-21 1997-10-21 ディスクアレイ装置

Publications (1)

Publication Number Publication Date
JPH11119915A true JPH11119915A (ja) 1999-04-30

Family

ID=17727991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9288268A Pending JPH11119915A (ja) 1997-10-21 1997-10-21 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JPH11119915A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6938125B2 (en) * 1990-02-26 2005-08-30 Hitachi, Ltd. Storage system with data prefetch function
JP2008524737A (ja) * 2004-12-21 2008-07-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 光ディスクデータの誤り訂正のための方法及び装置
JP2013196318A (ja) * 2012-03-19 2013-09-30 Fujitsu Ltd ストレージ制御装置、ストレージシステムおよびストレージ制御方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6938125B2 (en) * 1990-02-26 2005-08-30 Hitachi, Ltd. Storage system with data prefetch function
JP2008524737A (ja) * 2004-12-21 2008-07-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 光ディスクデータの誤り訂正のための方法及び装置
JP2013196318A (ja) * 2012-03-19 2013-09-30 Fujitsu Ltd ストレージ制御装置、ストレージシステムおよびストレージ制御方法

Similar Documents

Publication Publication Date Title
US7770076B2 (en) Multi-platter disk drive controller and methods for synchronous redundant data operations
US6502166B1 (en) Method and apparatus for distributing data across multiple disk drives
US7506187B2 (en) Methods, apparatus and controllers for a raid storage system
EP0485110B1 (en) Logical partitioning of a redundant array storage system
US5442752A (en) Data storage method for DASD arrays using striping based on file length
JP2769443B2 (ja) 記憶サブシステム及び関連する装置/方法
US20090276567A1 (en) Compensating for write speed differences between mirroring storage devices by striping
US20050166085A1 (en) System and method for reorganizing data in a raid storage system
JPH05143471A (ja) 記憶装置の冗長アレイ内の故障記憶装置のオンライン再構成方法
JPH09231017A (ja) データ記憶装置
JPH04232557A (ja) Dasd制御方法及び装置
JP2000508456A (ja) 移動されたデータの完全性を維持しながらraidセットにおけるドライブ数の拡張
JPH08194586A (ja) データ処理方法、システムおよび装置
JPH10105344A (ja) データ記録装置システム及びそのデータ書込方法
JP2857288B2 (ja) ディスクアレイ装置
KR100364895B1 (ko) 데이터 액세스 제어 방법 및 시스템
JPH11119915A (ja) ディスクアレイ装置
US5659677A (en) Data storage apparatus for disk array
US7401193B1 (en) System for storing data
WO2000067250A2 (en) Methods and systems for mirrored disk arrays
JP2003108316A (ja) ディスクアレイ装置およびホットスペア制御方法
JP2857289B2 (ja) ディスクアレイ装置
JP3202550B2 (ja) ディスクアレイサブシステム
JPH0744331A (ja) ディスクアレイ装置およびその制御方法
JP3615250B2 (ja) ディスクアレイ装置