WO1993023803A1

WO1993023803A1 - Appareil de commande pour pile de disques

Info

Publication number: WO1993023803A1
Application number: PCT/JP1993/000663
Authority: WO
Inventors: Mitsuhiko Yashiro; Ken Kobata; Suijin Takeda; Sawao Iwatani
Original assignee: Fujitsu Limited
Priority date: 1992-05-21
Filing date: 1993-05-20
Publication date: 1993-11-25
Also published as: US5954822A; US5787460A

Description

明細書

[発明の名称】ディスクアレイ装置

【技術分野】

本発明は、複数のディスク装置を並列的にアクセスしてデ一夕入出力処理を行うディスクアレイ装置に関し、特にディスク装置に格納したデータを更新する時の冗長情報の生成を効率良く行うようしたディスクアレイ装置に関する。

近年、複数のユーザが外部記憶装置、プリンタ等の高価な周辺装置ゃファィル等の資源（resource) を共有して、資源の有効利用化を図るために L A N (Local Area Network) の構築が急速に普及しつつある。このような LANにおいて、資源の共有という点で優れているのがクライアント Zサーバ ·モデルであ

1

る。このクライアント/サーバ ·モデルとは、サービスを要求するクライアント装置とサービスを提供するサーバ装置とを L A N回線により接:続し、クライアント装置とサーバ装露:問で相通信を行うことにより、分散処理システムを実現するものである。クライアントサーバ ·モデルにおける代表的なサーバ装置としては、プリントサーバ装置、ターミナルサーバ装置、及びディスクサーバ装置などがある。これらのサーバ装置の中で、ディスクサーバ装置は、 LAN回線に接続された各クライアント装置に対し大容量の外部記憶装置を提供するノ一ドである。このディスクサーバ装置には、大量のデータ管理やデータ管理の高い信頼性力《要求される。このような要求に対処するためのディスクサーバ装置に接続される大容量の外部記憶装置として、磁気ディスク装置や光磁気ディスク装置等のランダム ·アクセス可 iで書き換え可能なディスク装置を有するディスクアレイ装置力；提供されるようになってきている。このディスクアレイ装置は、アレイ状に配置されたディスク装置に並列的にデータ転送を行うことで、一台のディスク装置の場台と比べて、ディスクの台数倍の高速データ転送が可能になる。また、デ一夕に加えて、パリティデータなどの冗長な情報を付け加えて記録しておくことで、ディスク装置の故障等を原因とするデータエラーの検出と訂正力可能となり、ディスク装置の内容を二重ィ匕して記録する方法と同程度の高信頼性を、二重化より低価格で実現することができる。

【背景技術】従来、カルフォルニア大学バークレイ校のデビット · A 'パターソン（D av i d A. P a t t e r s o n) らは、高速に^ Λのデータを多くのディスクにアクセスし、ディスク故障時におけるデータの冗長性を実現するディスクァレイ装置について、レベル 1からレベル 5までに分類付けを行つて評価した論文を発表している（A i SIGMOD Con rance, Chicago, Illinois, June 1-3, 19 88 P109-P116)o このデビット *.A ·パターソンら力提案したディスクアレイ装置を分類するレベル 1〜5は、 RA ID (Redundant Ar rays o f Inexpens ive D i sks) 1〜5と略称される。 RA I D 1 〜 5を簡単に説明すると次のようになる。

[RA I D 0] 図 1はデータの冗長性をもたないディスクアレイ装置を示したもので、デビット · A ·パターソンらの分類には含まれていない力これを仮に RA ID0と呼ぶ、。 RAI DOのディスクアレイ装置は、データ A〜： [に示すように、ディスクァレイ制御装置 10はホストコンピュータ 18からの入出力要求に基づきデータをディスク装置 32— 1〜 32— 3のそれぞれに分散させているだけであり、ディスク故障時におけるデータの冗長性はない。

[RAID1] RAID 1のディスクアレイ装置は図 2に示すように、ディクス装置 32— 1に格納したデータ A〜Cのコピー A '〜C 'を格納したミラーディスク装置 32— 2を備える。 RA I D 1はディスク装置の利用効率力く低- いが冗長性をもっており、簡単な制御で実現できるため、広く普及している。

[RAID2] RA I D2のディスクアレイ装置はデータをビットやバイト単位でストライビング G9"割）し、それぞれのディスク装置に並列に読み書きを行う。ストライビングしたデータは全てのディスク装置で物理的に同じセクタに記録する。エラー訂正コードとしてはデータから生成したノヽミングコードを使用する。データ用ディスク装置の他にハミングコードを記録するためのディスク装置を持ち、ハミングコ一ドから故障したディスク装置を特定して、デ一夕を復元する。このようにハミングコードによる冗長性を傭えることでディスク装置が故障しても正しいデータを確保できる力^ ディスク装置の利用効率が悪いために^ S化されていない。

[RAID 3] RA ID 3のディスクアレイ装置は、図 3に示す構成をもつ。即ち、図 4に示すように例えばデータ a， b， cをビットまたはセクタ単位にデータ a l〜a 3， b l〜b 3， c 1〜 c 3に分割し、更にデータ a 1〜 a 3力、らパリティ P 1を計算し、データ b l〜b 3からパリティ P2を計算し、デ —タ c l〜c 3カヽらパリティ P 3を計算し、図 3のディスク装置 32— 1〜32 一 4を同時並列的にアクセスして書き込む。 RA I D3では、データの冗長性はパリティにより保持される。また.分割したデー夕の並列処理によりデータの書込み時間は短縮できる。しかし、 1回の書込み又は読出しのアクセスで、全てのディスク装置 32— 1〜32— 4の並列的なシーク動作を必要とする。このため大量のデータを連続して扱う場合には有効であるが、少量のデー夕をランダムにァクセスするトランザクション処理のような場合には、データ Si の高速性が生かせず、効率が低下する。

[RA Iひ 4] RA I D 4のディスクアレイ装置は、図 5に示すように、 1つのデータをセクタ単位に分割して同じディスク装置に書込む。例えばディスク装置 32—1をみると、データ aをセクタデータ a l〜a 4に分割して書き込んでいる。パリティは固定的に決めたディスク装置 32— 4に格納している。ここでデータ a l， b l， c 1からパリティ P 1力《計算され、データ a 2, b 2 , c 2からパリティ Ρ 2力く計算され、データ a 3， b 3, c 3力、らノ、°リティ P 3 力《計算され、データ a 4, b 4, c 4からパリティ P 4力く計算されている。デー夕読出しは、ディスク装置 32— 1〜32— 3に対して並列して読み出しできる。データ a〜bの読出しは、データ aを例にとると、ディスク装置 32—1のセクタ 0〜3をアクセスしてセクタデータ a l〜a 4を順次読出して合成する。デ —夕書込みは、書き込み前のデータとパリティを読み出してから新パリティを計算して書き込むため、 1度の書き込みにについて、合計 4回のアクセスが必要になる。例えば、ディスク装置 32— 1のセクタデータ a 1を更新（書き替え）する場合には、更新場所の旧デ一夕（a l) 。_ld 及び対応するディスク装置 32—

4の旧パリティ（P I) 。_ld を読出し、新データ（S i) n ew と整^ ¾のとれた新パリティ（P I) n ew を求めて書込む動作を、更新のためのデータ書込み以外にも必要とする。また書込みの際に必ずパリティ用のディスク装置 32— 4へのアクセスが起きるため、複数のディスク装置の書き込みを同時に実行できない。例えばディスク装置 3 2— 1のデータ a lの書込みとディスク装置 3 2— 2のデ一夕 b 2の同時書き込みを行なおうとしても、同じディスク装置 3 2— 4'からパリティ P 1 , P 2を読出して計算後に書込む必要があるため、同時に書込みはできない。このように R A I D 4の定義は行われている力メリットが少ないため現在のところ実用化の動きは少ない。

[R A I D 5] RA I D.5のディスクァレイ装置は、パリティ用のディスク装置を固定しないことで、並列の読み書きを可能にしている。即ち、図 6に示すように、セクタごとにパリティの置かれるディスク装置が異なっている。ここでデータ a 1, b 1 , c lからパリティ P I力《計算され、データ a 2 , b 2， d 2からパリティ P 2力計算され、データ a 3， c 3， d 3力、らハ。リティ P 3力《計算され、データ b 4, c 4, d 4からパリティ P 4力計算されている。並列の読み書きは、例えばディスク装置 3 2— 1のセクタ 0のデータ a 1とディスク装置 3 2— 2のセクタ 1のデータ b 2は、パリティ P l， P 2が異なるディスク装置 3 2— 4, 3 2— 3に置かれているため复せず、同時に読み書きができる。尚、書込み時に合計 4回のアクセスを必要とするオーバーへッドは RA I D 4と同じである。このように RA I D 5は、非同期に複数のディスク装置にアクセスしてリード Zライトを実行できるため、少量データをランダムにアクセスするトランザクシヨン処理に向いている。ここで RA I D 3〜RA I D 5に示したようなディスクアレイ装置において、冗長な情報の生成に関連するディスク装置の組合わせをランクと呼ぶことにする。例えぽ、データ記録用の k台のディスク装置と、データに関連した冗長な情報を記録する m台のディスク装置がある場合、 Ck +m) 台のディスク装置をまとめてランクとする。

このような従来の RA I D 4および RA I D 5に相当するディスクアレイ装置にあっては、ランク内のディスク装置に格納しているデータの一部あるいは全部を書き替えて^ ίする場合、更新するデータに関連する冗長な情報も更新する必要がある。この時、新しい冗長情報を得るために、更新前のデータと冗長情報が必要になる。いま冗長情報としてパリティデータを使用したとすると、ディスクアレイ装置のランク内の 1台のディスク装置のデータを更新する時には次の (1) 式から新パリティを計算することができる。旧データ（+) 旧パリティ（+) 新データ =新パリティ（1) 但し、（+) は排他的論理和を示す。

この（1)式から分かるように、データ更新時には、更新データの書き込みの前に、更新前データと冗長情報をそれぞれのディスク装置から読み出しておかなければならない。このため、更新前のデータおよび冗長情報をディスク装置から読出す分だけ通常のディスク装置よりデータ更新の処理に時間力多くかかるという題力くあつた。

したがって本発明の目的は、更新時に取扱う複数のデータの少なくとも 1 つをキャッシュメモリに記憶して冗長情報を生成するために必要なディスクァクセスを効率良く行うようにしたディスクァレイ装置を提供する。

—方、従来のディスクアレイ装置にあっては、データ書込みの途中で何らかの原因によって電源の供袷が途絶えた場合、従来のディスク装置または RA I D 1〜； A I D 3迄のディスクアレイ装置では、電源復旧後に再び同じ書込み作業を始めから行うことができる。しかし、 RA I D4および RA I D5のデイスクアレイ装置では、次の理由により電源復旧後に再び同じ書き込み作業を始めから行うこと力 <許されない。 RA I D 4および R A I D 5のデータ書込み時には、次式に示すように、複数のディスク装置内のデ一夕の排他的論理和を取ってパリティとし、ノ、。リティ用のディスク装置に保持する。

データ a (+) データ b (+) · · · =パリティ P

但し、（+) は排他的論理和記号

データとパリティの格納場所は、 RA I D4では図 5のように特定のディスク装置 32— 1〜32— 4に固定している。これに対し R A I D 5では、図 6 ようにパリティをディスク装置 32— 1〜32— 4に分散させて、パリティ読み書き動作による特定のディスク装置へのアクセスの集中を解消している。これらの RA I D4および RA I D5のデータ読出し時は、ディスク装置 32— 1~3 2— 4内のデ一タカ <書き換えられないので、パリティの整合性は保持される力、書込み時にはパリティもデータに合わせて変更する必要がある。例えばディスク装置 32—1内の 1つの旧データ（a l) 。_ld を新データ（a l) _new に書き換えたとき、パリティ P 1の整合性を取るには（1)式に示した計算を行い、パリティを更新することでディスク装置のデータ全体のパリティの整合性を保つことができる。（1)式から判るように、データ書込み処理では、ディスク装置内の旧データ及び旧パリティを先ず読み出す必要があり、この後に新データの書込みと、新パリティの生成及び書込みを行う。この新データあるいは新パリティの書 δ き込み中に電源が切断されると、実際どこまでデータが正常に書かれているかが認識できなくなり、パリティの整^ ½が失われる。この状態で、電源復旧時に再び同じデータ書き込み処理を行うと、パリティの整^ ¾の取れていないディスク装置から旧データ、旧パリティを読み込むので、整合性の取れていない新パリティを^^して書き込み ¾を終了してしまうという問題があった。

10 従って本発明の目的は、データ書込みの処理中に電源ダウン力起きても、電源復旧後に中断したデータ書込み処理を途中から再開して完了できるようにしたディスクアレイ装置を提供する。

【発明の開示】

まず本発明で用いるディスクアレイは、データを格納する複数台のディス i s ク装置と冗長情報として例えばパリティデータを格納する 1台のディスク装置を備える。ここでデータ格納用のディスク装置とパリティ格納用のディスク装置の組をランクと定義し、また各ディスク装置に所定データ長、例えばセクタ単位、ファイル単位、又はレコード単位にデータを分割して書込むものとする。パリティ格納用のディスク装置は、固定的に決めてもよいし（RA I D— 4) 、セクタ ^{2 0} 位置毎に異ならせるようにしてもよい（RA I D— 5 ) 。アクセス処理部は、上位装置からの更新要求を受けると、新たなデータ、更新前のデ一夕および更新前の冗長情報に基づいて新たな冗長情報を生成すると共に、ディスクァレイに格納 . している更新前のデータおよび冗萇情報を新たなデータおよび冗長情報に更新する。冗長情報としてパリティデータを用いた場合、新たなデータ、更新前のデー 25 タおよび更新前のパリティデータの排他的論理和により新たなパリティデータを

^^する。即ち、次式で求める。

新パリティ-新データ（+) 旧データ（+) 旧パリティさらに本発明は、冗長情報をディスクアレイのディスク装置をァクセスすることなく^^するため、キャッシュメモリを設ける。キヤッシャメモリの記憶データは次の 3つのケースに分かれる。

( 1 ) データのみを記憶

(2 ) 冗長情報のみを記憶

( 3) データと冗長情報の両方を記憶

キャッシュ制御部は、アクセス処理部でディスクアレイを更新する前にキャッシュメモリから更新前のデータ及び又は冗長情報を検索してアクセス処理部に供給して冗長情報を生成させる。またキャッシュ制御部は、キャッシュメモリの検索でデータ及び又は冗長情報力く記憶されていなかったヒットミスの場合には、ァクセス処理部に記憶なしを通知してディスクアレイからの読出しに基づく更新後にデータ及び又は冗長情報をキヤッシュメモリに記憶する。さらに本発明は、予め定めた所定回数だけデータをキヤッシュメモリ上の新たに確保した領域で更新した後にディスクアレイに書き戻す。具体的には、アクセス処理部は、更新回数力所定回数に達するまでは、更新毎に新たな冗長情報を生成することなくキャッシュメモリ上でデータを更新する。更新回数力《所定回数に達した時には、キャッシュメモリ上でデー夕を更新した後に、ディスクアレイから読出した更新前の冗長情報（旧パリティ）およびキュッシュメモリから読出した最新の更新デー夕と更新前のデータ（旧データ）力、ら新たな冗長情報を生成し、ディスクアレイにデータおよび冗長情報を書き戻す。この場合の冗長情報の生成は、パリティデ —夕の生成を例にとると次式のようになる。

新パリティ =旧デ一夕（+) 旧パリティ（+) 最新の更新データ更に、ディクスアレイ内の各ディスク装置及びキャッシュメモリの空き領域にダミーデータ D _{d ummy} およびダミー冗長情報 P _{d ummy} を格納し、アクセス処理部はデータの更新及び削除時に空き領域のダミーデータ及びダミー冗長情報を含めて新たな冗長情報を生成し、且つダミーデータ及びダミー冗長情報についてはディスクアレイから読出さずに予め設定した値を使用する。

このような本発明のディスクアレイ装置によれば、デ一夕の更新処理時に、更新処理以前にアクセスされたデータの一部または全部を記憶しておくキヤッシュメモリを設け、更新処理の際に更新前のデータがキャッシュメモリに記憶されていたならば、キャッシュメモリから読出して使用することで、ディスク装置から読み出す処理が省くことができ、処理時間を短縮することカ^！能となる。またデータと同時に対応する冗長情報もキヤッシュメモりに記憶するれば、更新前の冗長情報もディスク装置から直接読み出す処理を省略すること力く可能となって、一層の処理時間の短縮力可能となる。更に、更新処理時に、更新されたデータ j をすぐディスク装置に書き込まないでキャッシュメモリ上に記憶しておき、そのデータか定回数だけ更新された後にデータ装置に書き戻す処理を行うことで、更新前データと «fの更新データをキヤッシュメモリから読出して新たな冗長情報を生成すること力でき、更新処理毎に更新データと冗長情報のディスク装置に書き込み処理を不要にできる。更にまたディスク装置およびキヤッシュメモリの空き領域にダミ一データを入れ、ダミーデータを含めて同一セグメントのいずれかの更新時に冗長情報の生成を行い、冗長情報を生成するための同一セグメントの空き領域のを不要とする。またダミ一データは決た固定値であることからディスク装置からの読出しを必要とせず、ダミーデータを含めても冗長情報の ^^は簡単にできる。

またデータ書込中に電源ダウンが起きても、電源復旧後に中断したデータ書込み処理を途中から再開して完了できるようにした本発明のディスクアレイ装置は、ディスクアレイ■、データ書込部、パリティ更新部、不揮発性メモリ、及び復旧部を備える。ディスクアレイ機構のデータ書込部は、上位装置から書込処理を命令された際に、指定された任意のディスク装置の書込み位置に格納している旧データを読岀した後に上位装置から¾¾された新デー夕を書込む。パリティ Mif部は、データ書込部によるディスク書込み位置に対応するパリティ用ディスク装置の格納位置から旧パリティを読出し、旧パリティ、旧データおよび新デ一夕に基づいて、具体的には排他的論理和から新パリティを «した後に、旧パリティのディスク格納位置に新パリティを書込む。更に不揮発性メモリが設けられ、不揮発性メモリには、データ書込部およびパリティ更新部の処理段階を示す処理段階データおよび上位装置からされた新データを格納する。復旧部は、電源投入時に、不揮発性メモリの処理段階データを参照し、書込み処理力途中で中断されていた場合には、不揮発性メモリに保持されている新データを用いて復旧処理を行う。ここで、パリティ更新部は、例えば旧デ一夕と旧パリティの排他的論理和から中間パリティを生成する段階を含む。復旧部の処理モードは不揮発性メモリに新デ一夕と処理段階データを格納する場合、次の 2つのモードのいずれかとなる。

[モード 1 ] 新データのディスク装置に対する書込完了前に電源ダウン力く起きていた場合である。このモード 1では、データ書込部により指定されたディスク装置の書込み位置に格納している旧データを読出した後に、不揮発性メモリから読出した新デー夕を書込む処理を行わせる。次に新デー夕の書込み完了後にパリティ更新部によりデータのディスク書込み位置に対応するパリティ用ディスク装置の格納位置から旧パリティを読出し、旧パリティ、旧データおよび新デ一夕に基づいて新パリティを生成した後に、旧パリティのディスク格納位置に新パリティを書込む処理を行わせる。

[モード 2 ] 新パリティのパリティ用ディスク装置に対する書込み完了前に電源ダウンが起きていた場合である。このモード 2の場合は、データ書込部によりデータを書込むディスク装置及びパリティ用ディスク装置以外の他のディスク装置の対応位置の格納データを読出す処理を行わせる。次にパリティ更新部により他のディスク装置の読出データと不揮発性メモリから読出した新データとから新パリティを生成した後に、旧パリティのディスク格納位置に新パリティを書込む処理を行わせる。

また本発明は、不揮発性メモリに、更に中間パリティを格納する。この場合、新データの書込完了から中間パリティの格納完了前に電源ダウンカ <起きたときの回復処理力く新たなモードとして加わる。更に本発明は、不揮発性メモリに新パリティを格納するようにしてもよく、電源ダウン後の復旧は、不揮発性メモリに残っている最後の段階のデータに基づき次の段階からの処理を再開すればよ、。この場合、ディスク装置毎に設けているディスクアダプタにもバックアップ電源を加えておけば、電源ダウン時に旧データ及び旧パリティも保持でき、復旧処理の際の再読出し力不要にできる。このような構成を備えた本発明のディスクァレイ装置によれば、 R A I D 4および R A I D 5に従った構成のディスクアレイ装置で電源ダウン力起きた場合、不揮発性メモリに保持した情報を用いて、書込み処理の途中から処理を再開することで正常に書込み処理を終えることができ、電源回復後に最初からの処理を必要としないため、より高速の復旧処理ができる。また電源ダウンによる復旧処理のために保持するデータの種別は、コスト面力、ら使用可能な不揮 ¾#メモリの容量に応じて選択することができる。

【n®の簡単な説明】

図 1は RA I D 0によるディスクアレイ装置の ¾明図

図 2は RA I D 1によるディスクアレイ装置の説明図

図 3は RA I D 3によるディスクアレイ装置の説明図

図 4は RA I D 3におけるデータ分割の説明図；

図 5は R A I D 4によるディスクァレイ装置の説明図；

1 0 図 6は RA I D 5によるディスクアレイ装置の説明図；

図 7は本発明のハードウエア構成を示した ¾St例構成図；

図 8は図 7のキヤッシュ制御部の実施例構成図； .

図 9は本発明の第 1実施例を示した機能プロック図；

図 1 0は第 1難例のキヤッシュメモリの内容を示した説明図；

図 1 1は第 1実施例のキヤッシュメモリの他の内容を示した説明図；

図 1 2は本発明の全体的な処理動作を示したフローチャート；

図 1 3は第 1実施例のリード処理の詳細を示したフローチャート；

図 1 4は第 1実施例のライト処理の詳細を示したフローチャート；

図 1 5は第 1実施例の他のライト処理の詳細を示したフローチャート；

20 図 1 6は複数回更新したときのディスクアレイの格納状態の変化を示した説明図図 1 7は図 1 5の書戻し処理の詳細を示したフローチャート；

図 1 8は第例のキヤッシュメモリの内容を示した説明図；

図 1 9は第 2実施例のリード処理の詳細を示したフローチャート；

25 図 2 0は第 2¾¾例のライト処理の詳細を示したフローチヤ一ト；

図 2 1は第 2 ^例の他のライト処理の詳細を示したフローチャート；図 2 2は図 2 1の書戻し処理の詳細を示したフローチャート；

図 2 3は本発明の第 3実施例を示した機能プロック図；

図 2 4は第 3¾¾例のキヤッシュメモリの内容を示した説明図；図 2 5は第 3実施例のキャッシュメモリの他の内容を示した説明図；

図 2 6は第 3実施例のライト処理の詳細を示したフローチャート；

図 2 7は第 3実施例の他のライト処理の詳細を示したフローチャート；図 2 8は図 2 7の書戻し処理の詳細を示したフローチャート；

図 2 9は本発明の第 4実施例を示した機能プロック図；

図 3 0は第 4実施例のディスクアレイおけるダミー記憶初期状態を示した説明図図 3 1は第 4実施例のディスクアレイの削除処理を示した説明図；

図 3 2は図 3 1の削除処理後のディスクァレイの状態を示した説明図；図 3 3はディスク Ύレイの削除処理を示した説明図；

図 3 4は図 3 3の削除処理後のディスクァレイの整理状態を示した説明図；図 3 5は第 4実施例のキヤッシュメモリの削除処理を示した機能プロック図；図 3 6は図 3 5によるキャッシュメモリの削除終了状態の機能ブロック図；図 3 7は第 4実施例でランク内の同一セグメン卜の複数データを更新する処理を示した機能ブロック図；

図 3 8は図 3 7の更新処理を終了した状態の機能プロック図；

図 3 9は不揮発性メモリを用いて電源ダウン時の復旧処理を行う本発明の第 1実施例を示した実施例構成図；

図 4 0は図 3 9の処理内容を示した機能プロック図；

図 4 1は図 4 0の実施例の全体的な処理動作を示したフローチャート；図 4 2は図 4 1のデータ読出処理の詳細を示したフローチヤ一ト；

図 4 3は図 4 1のデ一夕書込処理の詳細を示したフローチャート；

図 4 4は図 4 1のパリティ更新処理の詳細を示したフローチャート；図 4 5は図 4 1の復旧処理の詳細を示したフローチャート；

図 4 6は不揮発性メモリを用いて電源ダウン時の復旧処理を行う本発明の第 2実施例の処理内容を示した機能プロック図；

図 4 7は図 4 6の実施例における復旧処理の詳細を示したフローチャート；図 4 8は不揮発性メモリを用いて電源ダウン時の復旧処理を行う本発明の第 3実施例を示した実施例構成図；図 49は図 48の実施例の処理内容を示した機能プロック図；

【発明の実施するための最良の形態】

1. 本発明のハードウェア構成

図 7は本発明によるディスクアレイ装置のハードウエア構成を示した実施例構成図である。図 7において、ディスクァレイ制御装置 10には制御手段として動作する MPU12が設けられ、 MP U12からの内部バス 14に対し、処理プログラムを格納した ROM20、制御記憶等として用いられる RAM22、キャッシュ制御部 24を介して接続したキヤッシュメモリ 26、データ転送バッファ 28が設けられる。また、上位装置としてのホストコンピュータ 18とのやり取りを行うため、ホストイン夕フェース 16力設けられている。ディスクアレイ制御装置 10の配下には、この^ ffi例にあってはランク 48— 1, 48— 2の 2 ランク構成のディスクアレイ 46が設けられている。ディスクアレイ 46の中のランク 48— 1には 5台のディスク装置 32— 1〜32— 5力く設けらランク 48— 2にも同じく 5台のディスク装置 32— 6〜 32—10が設けられる。更に、ランク 48— 1, 48— 2のそれぞれに対し予備機として待機状態にあるデイスク装置 32— 11, 32— 12が設けられる。ランク 48— 1, 48— 2を構成する 5台のディスク装置の内、 4台がデータ記録用に使用され、残り 1台がパリティ記録用にされる。但し、パリティ記録用のディスク装置力《固定され - るのは、図 5に示した RA I D 4のディスクアレイの場合であり、図 6に示した RA I D 5のディスクアレイにあっては、ディスク内への記録単位であるセクタ位置が異なる毎に、ランク内でのパリティの記録位置が変更されるようになる。

ランク 48-1， 48— 2を構成するディスク装置 32— 1〜 32—1 0及び予備のディスク装置 32— 11， 32— 12は、ディスクアレイ制御装置 1ひに設けたデバイスアダプタ 30— 1〜30— 6を介して MPU12の内部バス 14に接続される。デバイスアダプタ 30— 1， 30— 6はランク 48— 1, 48-2の同一位置のディスク装置、例えばデバイスアダプタ 30— 1にあってはディスク装置 32— 1， 32— 6のアクセスを MP ϋΐ 2の制御のもとに実行する。

図 8は図 7のキヤッシュ制御部 24の構成を示す。キヤッシュ制御部 24 は、全体を制御する M P U 6 0、 M P U 6 0の制御で使用する制御記憶 6 2、ノス 1 4との間でデータや M P U 6 0との指示のやり取りを制御するバス制御回路 6 4、キャッシュメモリ 2 6との間でデータの受渡しを行うメモリ制御回路 6 8 、バス制御回路 6 4とメモリ制御回路 6 8の間のデータ受渡しを行うバッファ回路 6 6を備える。ディスクアレイ制御装置 1 0の M P U 1 2から送られた指示は、バス 1 4を経由してバス制御回路 6 4を通り、キャッシュ制御部 2 4の M P U 6 0に渡される。 M P U 6 0は、アクセス対象のメモリアドレスをメモリ制御回路 6 8に指示する。更に M P U 6 0は、メモリ制御回路 6 8、バッファ回路 6 6 、バス制御回路 6 4へデータ転送に間する指示を行う。キャッシュメモリ 2 6カヽらの読出しの場合は、指示されたメモリアドレスの内容力 \ メモリ制御回路 6 8 、バッファ回路 6 6およびバス制御回路 6 4を通してバス 1 4に渡される。キヤッシュメモリ 2 6への書込みの場合、バス 1 4からバス制御回路 6 4に渡されたデータは、バッファ回路 6 6経由でメモリ制御回路 6 8へ渡り、キャッシュメモリ 2 6の指定ァドレスに書込まれる。

2. データのみをキャッシュメモリに言己憶する第 1実施例

図 9は本発明の第 1実施例を示した機能ブロック図であり、この第 1実施例にあっては、ディスクアレイ制御装置 1 0に設けたキヤッシュメモリ 2 6にディスクアレイ 4 6の更新に使用したデータのみを記憶するようにしたことを特徴とする。図 9において、ディスクアレイ制御装置 1 0に設けられたアクセス処理部 3 4は M P U 1 2のプログラム制御により実現され、ホストコンピュータ 1 8からの入出力要求としてのコマンドに基づいてディスクアレイ 4 6に対するアクセス処理を実行する。ここでディスクアレイ 4 6としてディスク装置 3 2— 1〜 3 2 一 5の 5台を取り出して示した 1ランク構成として示している。 1つのランクを構成するディスク装置 3 2— 1〜 3 2— 5は、破線で示すように所定のデータ記録単位、例えばセクタ単位に分けられている。また、ディスク装置 3 2— 1〜3 2— 5のそれぞれには物理 I D力予め設定されており、ホストコンピュータ 1 8 からの論理 I Dをアクセス処理部 3 4に設けたデバイス I D管理テーブルで物理 I Dに変換して、アクセス対象となるディスク装置を指定することができる。即ち、ホストコンピュータ 1 8間のコマンドをアクセス処理部 3 4で军読すると、ディスク I Dとデータァドレスが得られ、ディスク I Dにより特定のディスク装置を指定してデータァドレスに対しホストコンビュータ 1 8からの要求に基づいたリ一ド処理またはラィト処理を実行することになる。ディスクアレイ 4 6のデイスク装置 3 2— 1〜 3 2— 5の各セクタ位置に対する格納データとして、この実施例にあっては R A I D 4において、ノヽ。リティディスクをディスク装置 3 2— 5に固定した場合を例にとっている。例えばディスク装置 3 2— 1〜3 2— 4の各第 1セクタ位置での格納データ D 0 1〜D 0 4の排他的論理和として求めたパリティデータ P 0 1をディスク装置 3 2— 5の同一セク夕位置に格納している。キヤッシュ制御部 2 4には図 8に示した MP U 6 0でのプログラム制御で実現されるヒット判定部 3 6とキャッシュアクセス部 3 8力《設けられる。ヒット判定部 3 6はアクセス処理部 3 4でホストコンピュータ 1 8からのコマンドを解読して得られたディスク I Dとデータァドレスの通知を受け、キヤッシュメモリ 2 6の検索を行う。第 lHife例において、キャッシュメモリ 2 6にはディスクアレイ 4 6の中のデ一タ記録用のディスク装置 3 2— 1〜3 2— 4に対し行つた^ fデー夕のみ力記憶されている。ヒット判定部 3 6はアクセス処理部 3 4からのデバィス I Dとデータ了ドレスに基づいてキヤッシュテーブルを参,照し、キヤッシュテ —ブルで該当するデータのキャッシュ登録を、即ちヒットを判定すると、キヤッシュメモリ 2 6から対応する更新前の旧データを読み出してアクセス処理部 3 4 に供給する。アクセス処理部 3 4はディスクアレイ 4 6の指定されたディスク装置の旧データを新データに更新する前に、キヤッシュメモリ 2 6から読み出した更新前の旧データ、ディスク装置に格納している旧パリティおよび更新する新デ一夕とに基づき、新パリティを生成し、新パリティの後にディスク装置に新データを書き込んで更新すると共に、パリティ用のディスク装置 3 2 - 5の更新セクタと同一位置のセクタに新パリティを書き込んで、パリティの更新を行う。ヒット判定部 3 6でキャッシュテーブルを検索しても対象データの登録が得られなかつたミス判定時には、キャッシュメモリ 2 6から読み出さず、通常通りディスクアレイ 4 6の更新対象となったディスク装置の対応セクタに格納している更新前の旧データとパリティ用のディスク装置 3 2— 5の同一セグメントの更新前の旧パリティを読み出し、更に新データとから新パリティを生成した後、ディスク装置に対するデータとパリティを更新する。

図 1 0は図 9のキャッシュメモリ 2 6の記憶内容の一例を示したもので、記憶ァドレスはディスク I D番号とデータァドレスに対応するセクタ番号で特定することができ、ディスクアレイ 4 6のディスク装置 3 2—1〜3 2— 4と対応関係をもってデータ D O 1 , D 0 2 , D O 3 , · · ·を記憶している。

図 1 1はセクタ位置力変わる毎にパリティデータを記憶するディスク装置力く異なる R A I D 5相当のディスクアレイ 4 6に対応したキヤッシュメモリ 2 6 の記憶内容を示したもので、同じくディスク I D番号とデータアドレスに対応したセクタ番号で記憶領域を特定することができる。ここで斜線により消去したデイスク I D番号とセクタ番号で指定される領域は、パリティデータに対応していること力、ら、第 1実施例のデー夕のみをキヤッシュメモリ 2 6に記憶する場合には除外されている。 .

図 1 2は図 9のディスクアレイ制御装置 1 0における全体的な処理動作を示したフローチャートである。図 1 2において、まずステップ S 1でアクセス処理部 3 4がホストコンピュータ 1 8からのコマンドの受領の有無をチェックしており、コマンドを受領するとステップ S 2に進んでコマンド解読処理を行う。解読したコマンド内容について、ステップ S 3でリードかラィトかを判別し、リ一ドであればステツプ S 4のリード処理に進み、ライトであればステップ S 5のライト処理に進む。ここで、ホストコンピュータ 1 8によるディスクアレイ 4 6に対する入出力要求としては、

①新規データの書込み、

②既存デー夕を書き替える更新、

③既存データの削除、

があり、各入出力要求の内容に応じたステップ S 4のリード処理及びまたはステップ S 5のライト処理力 <実行されることになる。

図 1 3は図 1 2のステップ S 4に示したリ一ド処理の詳細を示したフローチャートである。図 1 3において、まずステップ S 1でアクセス処理部 3 4がホストコマンドの解読結果として得られたディスク I Dとデータァドレスで決まるセクタ番号をキャッシュ制御部 2 4のヒット判定部 3 6に通知する。ヒット判定部 3 6はステップ S 2でキヤッシュ管理テーブルをディスク I Dとセクタ番号に基づいて検索し、キャッシュメモリ 2 6に対するリ一ド対象データの登録の有無を半!!定する。ステップ S 2におけるヒット判定の処理結果、ステップ S 3で対応データの登録がなく、ミスであった場合には、ステップ S 4に進み、ディスク I Dとデータァドレスで指定されるディスク装置のセクタからデータを読み出して、図 2に示したデータ ^^バッファ 2 8に βする。続いてステップ S 5でホストコンピュータ 1 8に^ し、更にキヤッシュメモリ 2 6にリ一ドデータを記憶する。ステップ S 6でキャッシュメモリ 2 6にデータを格納する場合、キヤッシュメモリ 2 6に新しいデータを格納する領域力《足りなければ、不要と思われるデ —夕をキャッシュメモリ 2 6から追い出し、新たに領域を確保して新しいデータを記憶する。このキヤッシュメモリ 2 6の管理としては、最新に使用したデータをキヤッシュテーブルで決まるリストの最後に取り付け、使用していない最も古いデータを追い出す L RU方式を用いればよい。一方、ステップ S 3でキヤッシュ籠テーブルに対応するデータ登録が存在してヒット判定が得られると、ステップ S 3から S 7に進み、対応するデータをキャッシュメモリ 2 6から読み出してデ一タッファ 2 8に^!し、ステップ S 8でホストコンピュータにする。この図 1 3のリード処理にあっては、ディスクアレイからデータを読み出すだけであること力、ら、パリティデータの更新は必要としない。

図 1 4は図 1 2のステップ S 5に示したライト処理の詳細を示したフローチャートである。図 1 4において、まずァグセス処理部 3 4はステップ S 1でホストコマンドの解 fg果として得られたディスク I Dとデータァドレスに対応したセク夕番号をキヤッシュ制御部 2 4のヒット判定部 3 6に通知し、ステップ S 2でヒッ小判定処理が行われる。このヒット判定の結果、ステップ S 3でミスが半 U別されると、キヤッシュメモリ 2 6に更新前の旧データがないことからステツプ S 4に進み、ディスク I Dとデータアドレスに基づいて対応するデータ記録用のディスク装置から更新前の旧データを読み出す。またパリティ記録用のディスク装置の旧データと同一位置のセク夕から更新前の旧パリティデータを読み出して、データバッファ 2 8に^ tする。次にステップ S 5で、アクセス処理部 3 4力ディスク装置から読み出した旧データ D。_{l d} , 旧パリティ P。_{l d}及び新デ —夕 D _{n ew}から新パリティ P _{n ew} を生成する。即ち、前述した（1 ) 式に従って旧データ，旧パリティ及び新データの排他的論理和から新パリティを生成する。次にステップ S 6で新デ一夕と新パリティをそれぞれ対応するディスク装置に書き込んで更新し、ステップ S 7でキャッシュメモリ 2 6に新データを記憶して次のアクセスに備える。一方、ステップ S 3でヒット判定の結果がヒットであった場合にはステップ 8に進み、キャッシュメモリ 2 6から更新前の旧データを読み出し、続いてステップ S 9でパリティ記録用のディスク装置の旧データを格納したセクタと同一位置のセクタから更新前の旧パリティを読み出して、データ転送ノッファ 2 8に転送する。以降の処理はミスヒ、、ノ卜の場合と同様、ステップ S 5 で新パリティを生成し、ステップ S 6で新データと新パリティをそれぞれデイスク装置に書き込み、更にステップ S 7でキヤッシュメモリに更新が済んだ新デー夕を記憶して、次のアクセスに備える。 .

3. 複数回更新後のディスク装置への書戻し処理

図 1 5は図 1 2に示したステップ S 6のライト処理の他の実施例を示したフローチャートであり、このライト処理にあっては、キャッシュ制御部 2 4でヒット判定力《得られたときに、キャッシュメモリ 2 6上で同じ領域のデータを複数回更新した後にディスク装置に書き戻すステップ S 8の処理を設けたことを特徵とする。即ち、図 1 3のライト処理にあっては、データ更新毎にディスク装置に対する新データ及び新パリティの書戻しを行っており、データ更新処理に時間がかかる。これに対し図 1 5の実施例にあっては、.複数回のデータ更新に 1回だけディスク装置に書き戻す処理を行うため、更新処理に要する時間を短縮することができる。ここで、複数回の更新後にディスク装置に書き戻すパリティデータの生成原理を説明すると次のようになる。

図 1 6は説明を簡単にするため、 3台のディスク装置 3 2—：！〜 3 2— 3 を備えたディスクアレイ 4 6を示しており、更新前の状態でディスク装置 3 2— 1にはデータ D 0力格納され、ディスク装置 3 2— 2にはデータ D 1力格納され、更にパリティ用のディスク装置 3 2— 3にはパリティ P 0力格納されている。この状態で、ディスク装置 3 2— 1のデータ D Oに対し新データ D O 1 , D O 2 ， D O 3と 3回、更新の処理を行ったとする。この 1回目から 3回目のディスク装置 32—1に対するデータ更新における新パリティ P1〜P3は、次式に従つて求めることができる。

1回目新データ D01 (+) 旧データ Dl=新パリティ P1 (2) 2回目新データ D02 (+) 旧データ Dl=新パリティ P2 (3) 3回目新データ D03 (+) 旧データ Dl=新パリティ P3 (4) ここで、図 15のステップ. S 8におけるディスク装置に書戻しを行うまでの更新回数を 3回に設定していたとすると、 3回目の更新で得られた新パリティ P3をディスク装置 32— 3に格納し、また最新の更新デ一夕 D03をディスク装置 32—1に格納すればよい。 3回目の更新結果を示す（4)式の旧データ D 1に関しては、更新前の格納状態から

旧データ DO (+) 旧データ Dl=旧パリティ P0 ' (5) の関係がある。この（5)式について、旧データ D1を求めると、

旧データ D1-旧データ DO (+) 旧パリティ P0 (6) となる。従って、（6)式を（4)式に代入すると、 3回目の更新で生成される新ノ、。リティ P 3は

新パリティ P 3=

旧デー夕 D 0 (+) 旧パリティ P 0 (+)最新デ一夕 D 03 (7) で表すこと力できる。

図 15のステップ S 8の処理にあっては、図 16に示す 1回目から 3回目の更新処理をキャッシュメモリ 26上で行い、 3回目の更新が済んだときに（7 ) 式から新ハ。リティ P 3を生成し、最新データ D 03と新パリティ P 3のそれそ' れをディスク装置に書き戻す処理を行う。この（7)式で新パリティ P 3をするためには、更新前の旧データ D 0及び更新前の旧パリティ P 0が得られればよく、それのデータは不要となる。従って本発明にあっては、キャッシュメモリ 26上でデータ DO 1， DO 2， DO 3を順次更新するための領域を新たに確保してデータ更新を行い、 3回目のデータ更新が終了した時点で、既にキヤッシュメモリに記憶されている更新前の〖日データ D 0を更新が済んだ ¾ffのデータ DO 3と共に読み出し、更にディスク装置 32— 3から更新前の旧パリティ P 0 を読み出して、（7)式に従った新パリティ P 3を生成し、新データ D 03及び新パリティ P 3をそれぞれのディスク装置に書き戻すようになる。

図 1 7は図 1 5のステップ S 8の書戻し処理の詳細を示したフローチヤ一トである。図 1 7において、まずステップ S 1で更新回数を設定するカウンタ N を 1つインクリメントする。尚、カウンタ Nは初期状態で N - 0にクリアされている。続いてステップ S 2で 1回目の更新か否かチェックする。 1回目の更新であればステップ S 3で更新デーダの領域をキヤッシュメモリ 2 6上に新たに確保し、ステップ S 4で、新たに確保したキヤッシュメモリ 2 6上の領域で 1回目の新データの更新を行う。次にステップ S 5で、更新回数を示すカウンタ N力設定回数、例えば 3回に達したか否か判定し、 3回未満であればステップ S 6〜S 9 の処理を飛ばして図 1 2のメインルーチンの①にリターンする。ステップ S 5で更新回数を示す力ゥン夕 1^-カ《設定回数に達するとステップ S 6に進み、パリティ用のディスク装置から更新データと同一セグメントの更新前の旧パリティを読み出し、またキヤッシュメモリ 2 6から更新前の旧データと最新の更新済みデータを読み出し、ステップ S 7で（7 ) 式に従って新パリティを生成する。続いてステツプ. S 8で新デー夕と新パリティをそれぞれ対応するディスク装置に書き込んだ後、ステップ S 9でカウンタ Nをリセットし、図 1 5のステップ S 7にリ一夕ンし、書戻しが済んだ最新の更新データをキヤッシュメモリ 2 6に記憶して次のアクセスに備える。

4. 冗長情報のみをキヤッシュメモリに記憶する第 2実施例図 1 8は図 9に示した本発明のディスクアレイ制御装置 1 0のキヤッシュメモリ 2 6に冗長情報としてのパリティデータのみを記憶した場合の記憶内容を示した説明図である。この第 2実施例で使用するキャッシュメモリ 2 6にはディスク I D番号 1〜5の論理和と、セクタ番号で指定される領域にパリティデータ P 0 1 , P 0 2 , P 0 3, · · ·のみを記憶している。このようにキャッシュメモリ 2 6にパリティデータのみを記憶するようにした場合のディスクァレイ制御装置 1 0における全体的な処理動作は、図 1 2のフローチャートと同じになり、リード処理は図 1 9に示すようになり、またライト処理は図 2 0に示すようになる。

図 1 9はキャッシュメモリ 2 6にパリティデータのみを記憶した場合のリ ―ド処理の詳細を示したフ口ーチャ一トであり、ステップ S 1でァクセス処理部 3 4はホストコマンドの解読結果から得られたディスク I Dと、データァドレスを示すセグメント番号を対応するデバイスアダプタを経由してディスク装置に通知する。次いでステップ S 2で、指定したディスク装置からデータを読み出してデータ^!バッファ 2 8にし、.ステップ S 3でホストコンピュータに βして一連の処理を終了する。即ち、キヤッシュメモリ 2 6にパリティデータのみを記憶している場合には、リ一ド処理におけるキヤッシュアクセスは行わない。

図 2 0はパリティデータのみをキヤッシュメモリ 2 6に登録した場合のラィト処理の詳細を示したフローチャートである。図 2 0のライト処理にあっては、ステップ S 1の-ディスク I Dとデータァドレスに対応するセクタ番号の通知を受けて、キャッシュ制御部 2 4のヒット判定部 3 6がステップ S 2でヒット判定を行う。即ち、図 1 8に示すようなキヤッシュメモリ 2 6の登録内容を示すキヤッシュ^ 3テーブルについて、ディスク I Dによる区^ ίはないことから、セクタ番号のみによりキヤッシュ登録の有無を判定する。ステップ S 3でヒットミスであった場合には、第 1実施例と同様、ステップ S 4でディスク装置から更新前の旧データと旧パリティを読み出してデータ転送バッファ 2 8に^ し、ステツプ S 5で前記（1)式に従って新パリティを生成する。次いでステップ S 6で新デ一夕と新パリティをそれぞれ対応するディスク装置に書き込み、更にステツプ S 7で新ハ^&リティをキャッシュメモリ 2 6に新たに記憶する。一方、ステップ S 2 のヒット判定の結果がヒットであった場合にはステップ S 3から S 8に進み、キャッシュメモリ 2 6から対応する旧パリティを読み出し、ステツプ S 9で対応するディスク装置から旧データを読み出してデータ ¾^バッファ 2 8に^ tする。以下同様に、ステップ S 5の新パリティの生成、ステップ S 6の新データと新パリティのそれぞれのディスク装置に対する書込み、更にステツプ S 7の新パリティのキャッシュメモリ 2 6に対する記憶を行う。

図 2 1ほパリティデータのみをキヤッシュメモリ 2 6に記憶する場合のラィト処理の他の実施例を示したフローチャートであり、図 1 5に対しステップ S 8で回のデータ更新後にディスク装置への書込みを行うようにしたことを特徵とする。このステップ S 8のディスク書戻し処理の詳細は図 2 2Έ示すようになる。図 2 2の書戻し処理は図 1 7に示した第 1実施例の場合と基本的に同じである力く、キャッシュメモリ 2 6にパリティデータのみを言己憶していることから、更新回数力設定回数に達した後のステップ S 6でディスク装置から旧データを読み出し、キャッシュメモリから旧パリティと最新の新データを読み出す点力相違している。他の処理は第 1実施例の場合と同じである。

5. データ及び冗長情報の両方をキヤッシュメモリに記憶する第 3 実施例

図 2 3は本発明の第 3実施例の機能ブロック図を示したもので、この第 3 実施例にあってはキヤッシュメモリ 2 6にデータと冗長'隋報としてのパリティデ一夕の両方を記憶するようにしたことを特徴とする。まずキヤッシュメモリ 2 6 はデータ記憶領域 5 0とパリティ記憶領域 5 2に分けられている。

図 2 4はキャッシュメモリ 2 6の記憶内容を示したもので、ディスク I D 番号 1〜4についてはデータ記憶領域 5 0に格納され、ディスク I D番号 5についてはパリティ記憶領域 5 2に記憶される。勿論、図 2 4はパリティ記憶用ディスク装置をディスク装置 3 2— 5に固定した場合である。ここで、キャッシュメモリ 2 6をデータ記憶領域 5 0とパリティ記憶領域 5 2に分けている理由は、第 1実施例についてはデータ記憶領域 5 0のみでよく、また第 2実施例にあってはパリティ記憶領域 5 2のみでよぐ、この第 1実施例及び第 2実施例に対し更パリティ記憶領域 5 2またはデータ記憶領域 5 0を新たに追加するような場合に、領域を分けておくことが便利である。

図 2 5はパリティ記録用のディスク装置がセクタ位置力変化する毎に相違するディスクアレイを対象としたキャッシュメモリ 2 6の記憶内容を示した説明図である。このようにパリティデータがセグメント毎に異なったディスク装置に格納されている場合には、図 2 3に示したキヤッシュメモリ 2 6は特にデータ記憶領域 5 0とパリティ記憶領域 5 2に分けることなく、全体を 1つの領域としてデータ及びパリティデータを記憶すればよい。

図 2 3に示した第 3実施例のディスクアレイ制御装置 1 0の全体的な処理動作及びリ一ド処理の詳細は図 1 2，図 1 3の第 1実施例と同じである、ラィト処理の詳細が図 2 6のフローチャートに示すようになる。図 2 6のライト処理にあっては、ステップ S 3でミスとなった場合にステップ S 7で新データと新パリティの両方をキャッシュメモリ 2 6に記憶する点力、第 1実施例及び第 2実施例と異なる。また、ステップ S 3でヒットとなった場合にはステップ S 8でキヤッシュメモリ 2 6から更新前の旧データと旧パリティの両方を読み出すこと力《でき、このため旧データ及び旧パリティを読み出すためのディスク装置のアクセスは必要なく、データ更新を更に高速で行うことができる。

図 2 7は第 3実施例のライト処理の他の実施例を示したもので、ステップ S 8で複数回のデータ更新後にディスク装置に書き戻すようにしたことを特徴とし、この書戻し処理の詳細は図 2 8のフローチヤ一トに示すようになる。図 2 8 の書戻し処理にあっては、更新回数が設定回数に達したときのステップ S 6において、キヤッシュメモリ 2 6から更新前の旧パリティと旧データ、更に: ftffの更新データを読み出す点が第 1及び第 2実施例と異なる。 .

6. ダミーデータを空き領域に記憶する第 4実施例図 2 9は本発明の第 4実施例の機能プロック図であり、この第 4実施例にあっては、ディスク制御装置 1 0に新たにダミーデータ処理部 4 0を設け、ディスクアレイ 4 6のディスク装置 3 2—1〜3 2— 5及びキャッシュメモリ 2 6の空き領域に D _{d I}^_yで示すダミ一データ及び P _{d um}町で示すダミ一パリティデータを格納するようにしたことを特徵とする。このようにディスク装置 3 2— 1〜 3 2— 5及びキャッシュメモリ 2 6の未使用領域に固定的に定めたダミーデ一ダ及びダミーパリティデータを格納しておくことで、ライト動作時の旧データ及び旧パリティのリ一ド動作をダミーデータ及びダミーパリティデータについては省略すること力できる。

図 3 0は第 4実施例におけるディスク装置 3 2— 1〜3 2— 5の初期状態を示した説明図であり、空き領域となる全てのセクタにダミ一データ及びダミ一ノ、。リティデータを、例えばディスクアレイ装置の工場出荷等の際に予め格納している。尚、図 2 9のディスク装置 3 2— 1 ~ 3 2— 5は、セクタ位置が変わる毎にバリティデータを記憶するディスク装置が異なる R A I D— 5相当の場合を例にとっている。

図 3 1は第 4難例におけるデイスク装置 3 2— 1〜3 2— 5における既存データの削除状態を示したもので、このような削除力く行われた場合にも、図 3 2に示すように削除位置にダミーデータを格納する。勿論、削除位置にダミーデ一夕を格納した場合には、同一セグメントのパリティデータについては新パリティを生成するようになる。

図 3 3は第 4実施例におけるディスク装置 3 2— 1〜3 2— 5の他の削除処理を示したもので、このようなデータ削除を行った場合には、図 3 4に示すように、削除した空き領域を上位に詰めるようにデータを書き替える整理処理を行 V、、下位にまとめて空きセク夕領域を形成してダミ一データ及びダミーパリティデータを格納する。

図 2 9〜図3 4に示すようなダミ一デー夕及びダミーパリティデータに関する処理は、キャッシュメモリ 2 6側についてはダミーデータ及びダミーパリティデータを除く有効なデータ及びパリティデータについ T削除及び整理後の更新を行っておけばよい。

図 3 5は第 4実施例において、ホストコンピュータ 1 8より例えばディスク装置 3 2— 1に格納しているデータ D 1の削除命令を受けたときの処理動作を示している。ホストコンピュータ 1 8よりデータ D 1の削除命令を受けた場合には、まずノ、。リティ生成部 4 2でキャッシュメモリ 2 6に記憶している更新前の旧データ D 1と旧パリティ. P 1を読み出し、データ D 1の削除により新データはダミーデータ _{D d u mm y} となることから、これら 3つの排他的論理和により新パリティ P l _{n ew} を生成する。続いて図 3 6に示すように、ディスク 3 2— 1の旧デー夕 D 1をダミーデータ D _{d ummy} に書き替え、またディスク装置 3 2— 4の旧パリティ P 1を新たに生成した新パリティ P l _{n ew} に書き替え、更にキャッシュメモリ 2 6に記憶しているデータ D 1を削除すると同時に旧パリティ P 1を新パリティ P に更新する。

図 3 7は第 4実施例において、ランク内の同一セグメントにある複数のダミ—データを更新する場合の処理を示した説明図である。図 3 7において、今、データ ¾ϋバッファ 2 8に格納されているデータ D 1をディスク装置 3 2— 1の空き領域に書き込み、またデー夕 D 2をディスク装置 3 2— 2の同一セクタ位置の空き領域に書き込むものとする。この場合には、最終的にデータ D 2の書込みが終了したときのバリティ P 1を賊するため、パリティ生成部 4 2に対しデータ D l, D 2，ダミーデータ 2つ，パリティダミーデータ 1つを入力して、これらの排他的論理和により新パリティ P 1を生成する。続いて図 3 8に示すように、データ D 1をディスク装置 3 2—1に書き込むと共に、データ D 2をディスク装置 3 2— 2に書き込み、更にパリティ生成部 4 2で生成した新パリティ P 1をディスク装置 3 2— 5に書き込むようになる。勿論、図示しないキャッシュメモリ 2 6に対しても、新たにデータ D 1， D 2及びパリティ P 1を記憶して次のァクセスに備えるようになる。尚、上記の各実施例で使用するキヤッシュメモリとしては、何等かの原因による電源ダウンに対処できるようにするため、ノ、ックァップ電源を備えた不揮発性メモリとしてもよい。このようにキャッシュメモリに不揮発性メモリを使用すれば、電源ダウンがあってもキヤッシュデータが消去されず、電源ダウンによりキャッシュメモリを用いたァクス性能力初期状態に低下してしまうこと力防止できる。また、キャッシュメモリ全体を不揮発性メモリとすることはコスト的に高価になることから、例えばキヤッシュメモリの一部を不揮発性メモリとしてもよい。

7. 不揮発性メモリを使用して電源ダウンに対する復旧処理を行う実施例

図 3 9は電源ダウン時の復旧処理の機能を備えた本発明のディスクアレイ装置の例を示す。図 3 9において、ディスクアレイ制御装置 1 0には MP U 1 2力く設けられる。 MP U 1 2の内部バス 1 4に制御プログラムや固定データを格納した ROM2 0、 RAMを用いた揮発性メモリ 2 2、キャッシュ制御部 2 4 を介して設けられたキャッシュメモリ 2 6、データ^!バッファ 2 8、ノックァップ電源 3 6により電源ダウン時にも動作可能な不揮発性メモリ 7 0を接続している。また、ホストインタフェース 1 6が設けられ上位装置として機能するホストコンピュータ 1 8を接続している。一方、ディスクアレイ制御装置 1 0に対しては、この,例にあつては 6台のディスク装置 3 2— 1〜 3 2— 6を設けており、ディスク装置 3 2— 2〜 3 2— 6のそれぞれはデバイスアダプタ 3 0— 1 〜3 0— 6を介して MP U 1 2の内都バス 1 4に接続されている。 6台のディスク装置 3 2— 1〜 3 2— 6の内、 4合がデータ格納用でり、 1台力《パリティ用であり、残りの 1台は予備である。

本発明のディスクアレイ装置にあっては、図 5に示した R A I D 4あるいは図 6に示した R A.I D 5と同じ機能を実現することから、例えばディスク装置 3 2— 6を予備ディスク装置とすると、 R A I D 4の場合にはディスク装置 3 2 一 1〜3 2— 4がデータ格納用に使用され、ディスク装置 3 2— 5がパリティ用に使用される。一方、 R A I D 5.の場合には、ディスク装置 3 2— 1〜3 2— 5 のそれぞれは R A I D 4の場合と同様、 1つのディスク装置に同一のデ一夕単位をまとめて格納する力 <、パリティ用のディスク装置は固定されず、ディスク装置 3 2— 1〜3 2— 5の同一格納位置力変わる毎にパリティ用のディスク装置が所定の順番に従って切り替わる。

図 4 0は図 3 9の第 1実施例における処理内容を示した機能ブロック図である。図 4 0において、ディスクアレイ制御装置 1 0 対するディスク装置はディスク装置 3 2— 1〜3 2— nの n台を例にとっており、今、ディスク装置 3 2— 2力《パリティ用として用いられたものとする。勿論、ディスク装置 3 2— 2 は R A I D 4であれば固定的にパリティ用として定められており、 RA I D 5については、現時点のデータアクセスにおいてパリティ用として位置付けられていることになる。ディスクァレイ制御装置 1 0に設けられたァクセス処理部 3 4は M P U 1 2によるプログラム制御でデータ書込部 7 4，パリティ更新部 7 6及びデータ復旧部 7 8としての機能を実現する。このアクセス処理部 3 4に対しては揮発性メモリ 2 2と不揮発性メモリ 7 0力く接続されている。またディスク装置 3 2— 1〜3 2— n毎に設けたデバイスアダプタ 3 0— 1〜3 0— nのディスク装置との間でやり取りするデータを一時記憶するメモリを内蔵している。

図 4 0の第 1実施例にあっては、不揮発性メモリ 7 0にデータ書込部 7 4及びパリティ更新部 7 6の処理段階を示す処理段階データ 8 0力《格納され、またホストコンピュータ 1 8から Siされた指定されたディスク装置に書き込むための新データ 8 2力く格納される。一方、揮発性メモリ 2 2にはパリティ更新部 7 6の処理で生成される中間パリティ 8 8及び新パリティ 9 0力格納される。更に、デバイスアダプタ 3 0— 1〜3 0— nについては、いまデータ書込みの対象となっている例えばディスク装置 3 2 - 1のデバイスアダプタ 3 0— 1には、ホストコンピュータ 1 8からされた新データ 8 2とパリティ更新のために新データ書込み予定領域から読み出された旧データ 8 4が格納される。また、パリティ用のデイスク装置 3 2— 2のデバ、ィスァダブ夕 3 0— 2にはディスク装置 3 2— 1の新データ書込み予定領域に対応する同一位置から読み出した旧パリティ 8 6とパリティ更新部 7 6で生成された新パリティ 9 0力格納される。ここで、ディスクァレイ制御装置 1 0に使用するメモ-リを全て不揮発性メモリとすることはメモリ容量の増加でコスト的な負担が大きいことから、第 1実施例にあっては処理段階デ一夕 8 0と新データ 8 2の記憶に不揮発性メモリ 7 0を割り当て、それ以外の中曰バリティ 8 8や新パリティ 9 0については揮発性メモリ 2 2を使用している。尚、電源ダウン時にホストコンピュータ 1 8側に新データ 8 2力保持できれば、新データ 8 を揮発性メモリ 2 2に格納するようにしてもよい。

図 4 1は図 4 0のアクセス処理部 3 4における全体的な処理動作を示したフローチャートである。図 4 1において、まずディスクアレイ装置の電源を投入すると、ステップ S 1でイニシャルプログラムルーチン（I P L) に基づく所定のィニシャライズが行わ; ステップ S 2に進んで電源ダウンがぁつたか否かチエックする。通常の口グオフ操作による電-源切断後に口グォンによりパワーオンスタートした場合には電源ダウンなしと判定さステップ S 3に進み、ホストコンピュータ 1 8からのコマンド受領を待つ。ステップ S 3でホストコンビユー - 夕 1 8からのコマンドを受領するとステップ S 4に進んでコマンド解読を行い、ステップ S 5でリードアクセスの要求を判別するとステップ S 8に進んでデータ読出処理を実行する。一方、ライトアクセスの要求を判別するとステップ S 6に進んでデータ書込処理を実行し、続いてステップ S 7でパリティ更新処理を実行する。パワーオンスタートした際に、ステップ S 2で電源ダウンが判別された場合には、ステップ S 9で復旧処理を行ってからステップ S 3以降の通常処理に入る。この図 4 1のフローチャートにおけるステップ S 6のデータ書込処理が図 4 0のアクセス処理部 3 4に設けたデータ書込部 7 4により行われ、またステップ S 7のパリティ更新処理がパリティ更新部 7 6により行われ、更にステップ S 9 の復旧処理がデータ復旧部 7 8により行われることになる。

図 4 2は図 4 1のステップ S 8に示したデータ読出処理の詳細を示したフ口一チャートである。図 4 2において、ホストコンピュータからのリードコマンドを解読すると、データ読出しの対象となったデバイスアダプタを介してディスク装置からデータを読み出し、ステップ S 2でデバイスアダプタに格納した後にステップ S 3でホストコンピュータ 1 8にデータ転送を行う。このときディスク装置側の Θ速度とホストコンピュータ 1 8側の転送速度と力異なっている場合には、図 3 9に示したディスクアレイ制御装置 1 0に設けているデータ転送バッファ 2 8を経由した読出データのホストコンピュータ 1 8に対する転送が行われる。

図 4 3は図 4 1のステップ S 6に示したデータ書込み処理の詳細を示したフローチャートである。図 4 3において、ホストコンピュータ 1 8からのライトコマンドに伴ってディスク装置に書き込む新デー夕力転送されてくることから、ステップ S 1でホストコンピュータ 1 8からの新データ 3 2をメモリ、即ち不揮発性メモリ 7 0に格納する。続いてステップ S 2で新デ一夕 8 2を例えばディスク装置 3 2— 1が書込対象として指定されたとすると、デバイスアダプタ 3 0— 1にして格納する。続いてデバイスアダプタ 3 0— 1からの指示でディスク装置 3 2— 1の新データ書込予定領域の内容を旧データ 8 4として読み取り、デバイスアダプタ 3 0— 1内に格納する。旧データ 8 4の格納力く済むと、ステップ S 5でデバイスアダプタ 3ひ一 1内の新データ 8 2をディスク装置 3 2— 1に転 ― 送し、ステップ S 6で新データ書込予定領域に新データ 8 2を書き込む。

図 4 4は図 4 1のステップ S 7に示したパリティ更新処理の詳細を示したフローチャートである。図 4 4において、まずステップ S 1でパリティ用のディスク装置 3 2— 2のディスク装置 3 2— 1における新データ書込み予定領域と同 —領域の内容を旧パリティ 8 6として読み取り、ステップ S 2で、読み取った旧ノリティ 8 6をデバイスアダプタ 3ひ一 2に格納する。続いてステップ S 3で旧デ一夕 8 4と旧パリティ 8 6から中間パリティ 8 8を作成して揮発性メモリ 2 2 に格納する。次に不揮発性メモリ 7 0の新データ 8 2と揮発性メモリ 2 2の中間ノ、。リティ 8 8を読み出して新パリティ 9 0を作成して、揮発性メモリ 2 2に格納する。ここで、中間パリティ 8 8は旧データ 8 4と旧パリティ 8 6の排他的論理和から作成される。また、新パリティ 9 0は新データ 8 2と中間パリティ 8 8の同じく排他 ½«l和から作成する。ステップ S 4で新パリティ 9 0の作成格納が済むとステップ S 5で揮発性メモリ 2 2の新パリティ 9 0を読み出して、デバイスアダプタ 3 0— 2にして格納する。続いてステップ S 6で新パリティ 9 0 をパリティ用のディスク装置 3 2— 2にし、ステップ S 7で新パリティ 9 0 i をディスク装置 3 2— 2のディスク装置 3 2— 1における新データの書込領域と同じ: I域に書き込んでパリティ更新処理を終了する。ここで、—新パリティ 9 0の «は基本的には新データ 8 2 , 旧データ 8 4及び旧パリティ 8 6の排他的論理和から作成するものであるが、図 3の実施例にあっては中間パリティ 8 8の作成段階を経て新パリティ 9 0を作成している。この中間パリティ 8 8の段階を経由0 した新パリティの作成過程は、図 4 1の場合を含めて次の 3つのケース通りがあ

[ケース 1] 新データ 8 2と旧データ 8 4の排他的論理和をとつて中間ノ、。リティ 8 8をし、揮発性メモリ 2 2に格納する。この揮発性メモリ 2 2への格納が終了すると旧データ 8 4は不要となるので、デバイスアダプタ 3 0— 15 の旧データを格納していたメモリ領域は開放される。次に揮発性メモリ 2 2の中間バリティ 8 8とデバイスアダプタ 3 0— 2の旧パリティ 8 6との排他的論理和をとつて新パリティ 9 0を^^し、不揮髡性メモリ 7 0に格納する。即ち、次式の処理を行う ₀ 一：

新データ（+) 旧データ-中間パリティ

0 中間パリティ（+) 旧パリティ =新パリティ

[ケース 2] 旧データ 8 4と旧パリティ 8 6の排他侖理和をとつて中間パリティ 8 8をし、揮発性メモリ 2 2に格納する。中間パリティ 8 8の揮発性メモリ 2 2に対する格納力《終了すると、デバイスアダプタ 3 0— 1の旧デー夕 8 4及びデバィスアダプタ 3 0— 2の旧パリティ 8 6を格納していたメモリ領S 域が開放される。次に揮発性メモリ 2 2の中間パリティ 8 8と不揮発性メモリ Ί 0の新データ 8 2との排他理和をとつて新パリティ 9 0をし、揮発性メモリ 2 2に格納する。これは図 4 4の実施例の処理であり、次式の処理を行うことになる。

旧データ（+) 旧パリティ-中間パリティ中間パリティ（+) 新データ =新パリティ

[ケース 3 ] デバイスアダプタ 3 0— 2のメモリに格納している旧パリティ 8 6と不揮発性メモリ 7 0の新データ 8 2の排他的論理和をとつて中間パリティ 8 8を生成し、揮発性メモリ 2 2に格納する。中間パリティ 8 8の揮発性メモリ 2 2に対する格納が終了すると旧パリティ 8 6は不要となることから、旧パリティ 8 6力く格納されていたデバイスアダプタ 3 0— 2のメモリ領域は開放される。次に揮発性メモリ 2 2の中間パリティ 8 8とデバイスアダプタ 3 0—1の旧データ 8 4の排他的論理和をとり、新パリティ 9 0を生成して揮発性メモリ 2 2 に格納する。即ち、次式の処理を行う。

旧パリティ（+) 新データ =中間パリティ

中間パリティ（+) 旧データ =新パリティ

更に、中間パリティの生成段階を経由した新パリティの生成はケース 1 〜3に限定されず、デバイスアダプタ 3 0—1における旧データ 8 4の読出格納、及びデバイスアダプタ 3 0— 2における旧パリティ 8 6の読出格納力く速い順にケース 1またはケース 3の処理を選択すればよい。即ち、図 4 1のフローチヤ一卜にあっては、ステップ S 6でデータ書込処理を実行した後にステップ S 7でパリティ更新処理を順番に行うようにしている力実際にはディスク装置 3 2— 1 に対しシーク命令を発行して切り離した後に、パリティ用のディスク装置 3 2— 2にシーク命令を発行して突き離しており、ディスク装置 3 2— 1 , 3 2— 2の内、最初にシーク完了通知を受けた方について旧データまたは旧パリティの読出しを行うことになる。従って、旧データ 8 4を最初に読み出した場合にはケース 1のように新データと旧データから中間パリティを生成し、また旧パリティ 8 6 を最初に読み出した場合にはケース 3のように旧パリティと新データから中間パリティを生成する。そして、中間パリティの生成後にケース 1については旧パリティカ《読み出されたら新パリティを生成し、ケース 3については旧データ力く読み出されたら新パリティを生成すればよい。勿論、新データ，旧データ，旧パリテイカ揃った段階で

新データ（+) 旧データ（+) 旧パリティ =新パリティにより一括して排他的論理和をとつて新パリティを生成し、中間パリティの生成過程を省略するようにしてもよい。

図 4 5は図 4 1のステップ S 9に示した復旧処理の詳細を示したフローチャートである。ここで、図 4 0の第 1¾½例にあっては、不揮発性メモリ 7 0 に電源ダウンの際に保持されるのは処理段階データ 8 0と新データ 8 2のみであり、従って、電源ダウンのタイミングが新デーダ 8 2のディスク装置 3 2— 1に対する書込終了の前後で復旧処理の内容が分かれることになる。図 4 5の復旧処理において、まずステップ S 1で新データの書込終了か否かチェックし、新デー夕の書込みが終了していなければ新データの書込完了以前に電源ダウンが起きていることからステップ S 2以降の処理に進む。即ち、ステップ S 2で不揮発性メモリ了 0に保持されている新データ 8 2を読み出して、デバイスアダプタ 3 0— 1に ¾ して格納し、次のステップ S 3でディスク装置 3 2—1から新データ書込予定領域の内容を旧データ 8 4として読み出し、ステップ S 4でデバィスァダプ夕 3 0— 1に格納する。続いてステップ S 5でデバイスアダプタ 3 0—1内の新データ 8 2をディスク装置 3 2—1に緩し、ステップ S 6でディスク装置 3 2 - 1に対する新データ 8 2の書込みを行う。即ち、新データの書込完了前に電源ダウンが起きた場合には、図 4 3に示したデータ書込処理の内のステップ S 1 を除くステップ S 2〜S 6と同じ処理を回復処理として実行する。このように不揮発性メモリ 7 0に新データ 8 2を保持していたことで、復旧処理の際に改めて - ホストコンピュータ 1 8から新データ 8 2をさせる必要がなく、その分だけ回復処理を高速ィ匕させる o 侖、ステップ S 6で新データ 8 2の書込みが済むとステップ S 7でパリティ Mi?処理を実行する。このパリティ更新処理は図 4 4のフローチャートに示した内容と同じになる。

一方、ステップ S 1で新データの書込終了が判別された場合にはステップ S 8に進み、新パリティの書込終了の有無をチヱックする。ここで、新パリティの書込みが済んでいなかった場合にはステップ S 9以降の処理を行う。まず、既に新データのディスク装置 3 2— 1に対する書込みは完了してい.ることから、ステツブ S 9でハ。リティ用のディスク装置 3 2— 2を除く他のディスク装置 3 2— 3〜 3 2— nから読み出したデータと新データの排他的論理和により新パリティを作成する。即ち、旧パリティを使用せずに新データと他のディスク装置のデータのみから新パリティを生成する。続いてステップ S 1 0で新パリティをデバイスアダプタ 3 0— 2に転送して格納した後、ステップ S I 1でディスク装置 3 2 —2に^ し、ステップ S 1 2で新パリティをディスク装置 3 2— 2に書き込んで一連の回復処理を終了する。更にステップ S 8で新パリティの書込終了力判別された場合には復旧処理は不要であることから、そのままメインルーチンにリターンする。

図 4 6は本発明の復旧処理の第 2実施例の処理内容を示した機能プロック図であり、第 2実施例にあっては、不揮発性メモリ 7 0に処理段階データ 8 0及び新データ 8 2に加えて中間パリティ 8 8も格納するようにしたことを特徴とする。このため、不揮発性メモリ 7 0は中間パリティ 8 8を格納する分だけメモリ容量力増加して、第 1実施例に比べコスト的に高価になる力^ 電源ダウンにより中間パリティ 8 8を保持できるために復旧処理を更に高速化できる。図 4 6の第 2実施例における全体的な制御処理は図 4 1に示した第 1実施例と基本的に同じであり、またデータ書込部 7 4及びパリティ更新部 7 6による処理も中間パリティ 8 8を不揮発性メモリ 7 0に格納する以外は図 4 3及び図 4 4のフローチヤ一トと同じになる。これに対しデータ復旧部 7 8による復旧処理は、新たに不揮発性メモリ 7 0に中間パリティ 8 8を格納したことに伴い、図 4 7のフローチヤ一卜に示すようになる。図 4 7において、電源ダウン力起きたタイミングの判別は . ステップ S 1 , ステップ S 8及び S 1 3のそれぞれで行っており、電源ダウンにより新データの書込終了が済んでいないことがステップ S 1で判別されると、ステツプ S 2〜S 7の処理が行われる。これは図 4 5に示した第 1実施例の場合と同じである。次にステップ S 1で新デ一夕の書込終了が判別された場合には、ステツプ S 8で中間パリティの格納終了の有無力く判別される。中間パリティの格納力'済んでいなかつた場合、即ち新データの書込終了から中間パリティの格納前の間に電源ダウン力 <起きていた場合にはステップ S 9〜S 1 2の処理を行う。この処理は図 4 7の第 1実施例におけるステップ S 9〜S 1 2の処理と同じであり、新データが既に書込み済みであること力、ら、パリティ用のディスク装置を除く他のディスク装置から読み出したデータと新データの排他的論理和をとることで新パリティを作成して、パリティ用のディスク装置に書き込んでいる。更にステツプ S 8で中間パリティの格納終了が判別された場合には、ステップ S 1 3に進んで、新パリティの書込終了の有無をチェックする。ステップ S 1 3で新パリティの書込み力済んでいなかつた場合、即ち中間パリティの格納が済んでから新パリティを書き込む前に電源ダウンが起きた場合には、ステップ S 1 4〜S 1 7の処理を行う。まず、ステップ S 1 4で不揮発性メモリ 7 0に ί ^している新データ 8 2と中間パリティ 8 8の排他的論理和から新パリティを作成して、不揮発性メモリ 7 0に格納する。次にステップ S 1 5で不揮発性メモリ 7 0から新パリティ 9 0を読み出してデバイスアダプタ 3 0—2に転送して格納し、ステップ S 1 5 で新パリティ 9 0をディスク装置 3 2— 2に^ して、ステップ S 1 7で書込みを行う。このように不揮発性メモリ- 7 0に電源ダウンの際に新データ 8 2及び中間パリティ 8 8が保持できていれば、新データ 8 2と中間パリティ 8 8から新パリティ 9 0を^^してパリティ用のディスク装置 3 2— に書き込む処理だけで済み、最初からやり直す場合に比べて復旧処理をより高速化することができる。

図 4 8は本発明による復旧処理の第 3実施例の構成を示し、この実施例にあっては図 4 9の機能ブ□ック図の不揮発性メモリ 7 0に示すように、処理段階データ 8 0 , 新データ 8 2及び中間パリティ 8 8に加えて、更に新パリティ 9ひも保持するようにしたことを特徵とする。更に、ノックアップ電源 3 6からのバックアツプ電源ライン 9 4をデバイスアダプタ 3 0— 1〜 3 0— 6の全てに接続 - し、電源ダウンの際にデバイスアダプタ 3 0— 1〜3 0— 6を動作状態とし、デイスク装置側から読み出した復旧デ一夕 8 4や旧パリティ 8 6の保持、あるいはアクセス処理部 3 4側から^!した新データ 8 2や新パリティ 9 0のができるようにしたことを特徴とする。この図 4 8及び図 4 9に示す第 3実施例によれば、電源ダウンの発生時で処理を中断すると、その直前で得られたデータが不揮発性メモリ 7 0及びデバイスアダプタ 3 0— 1， 3 0— 2にそのまま保持されているため、電源復旧後の復旧処理は電源ダウン力く起きた段階より 1つ前の段階からの処理を再開すればよく、電源ダウンの前後における龍した処理を最小限にした高速の復旧処理を行うことができる。

更に、本発明の他の鶴例としては、図 7の実施例と図の難例を組 ^るようにしてもよい。このためのハードウェア構成は、図 7の例のキヤッシュメモリ 2 6を不揮発性メモリとし、図 3 9の実施例で不揮発性メモリ 7 0 に記憶している処理段階を示すデ一夕を格納すればよい。また M P U 1 2により処理機能は、両者の各実施例の機能を合せて持たせればよい。

尚、上記の実施例はディスク装置として磁気ディスク装置を例にとるものであったが、これ以外に光ディスク装置によるディスクアレイであってもよいことは勿論である。また本発明は、実施例で示された数値による限定は受けない。【産 m±の利用の可能性】

以上説明してきたように本発明によれば、ディスクアレイに対する書込処理の際に、新たな冗長情報を生成するために必要なデータをキヤッシュメモリに格納していくことで、ディスク装置からの読出処理を省くことができ、冗長情報をディスク装置に格納していても書込処理の実行時間を短縮し、より高速の処理を実現することができる。また R A I D 4及び R A I D 相当の構成をもつディスクアレイの書込処理中に電源ダウン力く起きても、電源復旧後に書込処理を途中から再開することで、データの冗長性を維持した書込処理を完結させることができ、ディスクアレイ装置の信頼性をより一層、向上させることができる。更に、不揮発性メモリへのデータ格納による保持で、電源ダウン後の復旧処理を高速化し、より迅速な装置の立ち上げ力可能となる。

Claims

請求の範囲

1. ディスクアレイ装置に於いて、

データ格納用の »：のディスク装置と冗長情報格納用の 1つのディスク装置を備えたディスクアレイと、

上位装置からの更新要求に基づき.、新たなデータ、更新前のデータおよび更新前の冗長情報に基づいて新たな冗長情報を誠してディスクアレイのデータおよび冗長情報を更新するアクセス処理手段と、

前記アクセス処理手段による 1回の更新処理の際に取扱うデータと冗長情報の少なくとも 1つを記憶するキャッシュ記憶手段と、

前記アクセス処理手段でディスクアレイを更新する前に前記キヤッシュ記憶手段から^前のデータを検索して前記ァクセス処理手段に供給して新たな冗長情報をさせるキャッシュ制御手段と、

を備えたことを特徴とする。

2. 請求の範囲 1のディスクアレイ装置に於いて、前記キャッシュ制御手段は、前記キャッシュ記憶手段から検索データが得られなかった場合には、前記アクセス処理手段に記憶なしを通知して更新後のデータを前記キヤッシュ記憶手段に記憶すると共に直ちにディスクアレイに書き込むことを特徴とする。

3. 請求の範囲 1のディスクアレイ装置に於いて、前記アクセス処理手段は、更新したデータと冗長情報の少なくとも 1つを前記キヤッシュ記憶手の新たに確保した領域で更新した後にディスクァレイに書き戻すことを特徴とする o

4. 請求の範囲 1のディスクアレイ装置に於いて、前記アクセス処理手段は、データと冗長情報の少なくとも 1つをキャッシュ記憶手社の新たに確保した領域で複数回!^した後にディスクアレイに書き戻すことを特徵とする。 '

5. 請求の範囲 4のディスクアレイ装置に於いて、前記キャッシュ記憶手段に前記ァクセス処理手段による更新されたデータのみを記憶した場合、前記ァクセス処理手段は、 ¾f回数が所定回数に達するまでは、更新毎に新たな冗長情報を^^することなく前記キヤッシュ記憶手 g±でデータを更新し、更新回数が所定回数に達した時には、キヤッシュ記憶手段上でデータを更新した後にディスクアレイから読出した更新前の冗長情報および前記キュッシュ記憶手段から読出した最新の更新デ一夕と更新前のデ一夕から新たな冗長情報を生成し、前記ディスクアレイにデータおよび冗長情報を書き戻すことを特徴とする。

6. 請求の範囲 4のディスクアレイ装置に於いて、前記キャッシュ記憶手段に前記ァクセス処理手段により更新された冗長情報のみを記憶する場合、前記アクセス処理手段は、更新回数が所定回数に達するまでは、更新毎に新たな冗長情報を生成することなく前記キヤッシュ記憶手段上でデータを更新し、更新回数力く所定回数に達した時には、キヤッシュ記憶手段上でデータを更新した後にディスクアレイから読出した更新前のデ一夕と前記キュッシュ記憶手段から読出した最新の更新データと更新前の冗長情報とから新たな冗長情報を生成し、ディスクァレイにデータおよび冗長情報を書き戻すことを特徴とする。

7. 請求の範囲 4のディスクアレイ装置に於いて、前記キャッシュ記憶手段に前記ァクセス処理手段により更新されたデ一夕及び冗長情報を記憶する場合、前記アクセス処理手段は、更新回数力《所定回数に達するまでは、更新毎に新たな冗長情報を生成することなく前記キヤッシュ記憶手段上でデータを更新し、更新回数が所定回数に達した時には、キヤッシュ記憶手段上でデータを更新した後にキヤッシュ記憶手段から読出した更新前のデータと冗長情報および最新の更新データから新たな冗長情報を生成し、前記ディスクアレイにデータおよび冗長情報を書き戻すことを特徴とする。

8. 請求の範囲 1のディスクアレイ装置に於いて、前記デイクスアレイ内の各ディスク装置及びキヤッシュ記憶手段の空き領域にダミーデータおよびダミ一冗長情報を格納し、前記ァクセス処理手段はデ一夕の更新時及び削除時に空き領域のダミーデータ及びダミー冗長情報を含めて新たな冗長情報を生成し、且つダミーデータ及びダミー冗長情報についてはディスクアレイから読出さずに予め設定した値を使用することを特徴とする。

9. 請求の範囲 1のディスクアレイ装置に於いて、前記冗長情報としてパリティデータを使用し、前記アクセス処理手段は、更新時に、新たなデ一夕、更新前のデータおよび更新前のパリティデータの排他的論理和により新たなパリティデータを^^することを特徴とする。

1 0. ディスクアレイ装置に於いて、

データ格納用の複数のデータ格納用ディスク装置と 1つの冗長情報格納用ディスク装置を備えたディスクアレイと、

上位装置から書込処理を命令された際に、指定されたディスク装置の書込み位置に格納している旧データを読出した後に上位装置から¾¾された新デー夕を書込む書込手段と、

前記書込手段によるディスク書込み位置に対応する冗長情報用ディスク装置の格納位置から旧冗長情報を読出し、前記旧冗長情報、旧データおよび新データに基づいて新冗長情報を賊した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む冗長情報更新手段と、

前記書込手段および冗長情報更新手段の処理段階を示す理段階データおよび上置からされた新データを格納する不揮発性メモリ手段と、

を備えたことを特徴とする。

1 1. 請求の範囲 1 0のディスクアレイ装置に於いて、更に、電源投入時に、前記不揮発性メモリ手段の処理段階データを参照し、書込み処理が途中で中断されていた場合には、前記不揮発性メモリ手段に保持されている新デー夕を用いて復旧処理を行う復旧手段を設けたことを特徴とする。

1 2. 請求の範囲 1 1のディスクアレイ装置に於いて、前記復旧手段は、新データのディスク装置に対する書込完了前に電源ダウンが起きていた場合には、書込手段により指定されたディスク装置の書込み位置に格納している旧データを読出した後に前記不揮発性メモリ手段から読出した新データを書込む処理を行わせ、次に前記冗長情報更新手段により前記書込手段によるディスク書込み位置に対応する冗長情報用ディスク装置の格納位置から旧冗長情報を読出し、旧冗長情報、旧データおよび新データに基づいて新冗長情報を賊した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む処理を行わせることを特徵とする。

1 3. 請求の範囲 1 1のディスクアレイ装置に於いて、前記復旧手段は、新冗長情報の冗長情報用ディスク装置に対する書込み完了前に電源ダウンが起きていた場合には、前記書込手段により新データを書込むディスク装置及び冗長情報用ディスク装置以外の他のディスク装置の対応位置の格納データを読出す処理を行わせ、次に前記冗長情報更新手段により前記他のディスク装置の読出データと不揮発性メモリ手段から読出した新デー夕とから新冗長情報を生成した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む処理を行わせることを特徵とする。

1 4. 請求項 1 0記載のディスクアレイ装置に於いて、前記冗長情報更新手段は、旧冗長情報と旧デー夕から中間冗長情報を生成した後に該中間冗長情報と新データから新冗長情報を生成し、前記不揮発性メモリ手段は、前記処理段階データ及び新データに加えて前記中間冗長情報を格納することを特徴とする。

1 5. 請求項 1 4記載のディスクアレイ装置に於いて、更に、電源投入時に、前記不揮発性メモリ手段の処理段階データを参照し、.書込み処理が途中で中断されていた場合には、前記不揮発性メモリ手段に保持されている新データおよび中間冗長情報を用いて復旧処理を行う復旧手段を設けたことを特徴とする。

1 6. 請求の範囲 1 5のディスクアレイ装置に於いて、前記復旧手段は、新データのディスク装置に対する書込完了前に電源ダウンが起きていた場合には、書込手段により指定されたディスク装置の書込み位置に格納している旧データを読出した後に前記不揮発性メモリ手段から読出した新デ一夕を書込む処理を行■ わせ、次に前記冗長情報更新手段により前記書込手段によるディスク書込み位置に対応する冗長情報用ディスク装置の格納位置から旧冗長情報を読出し、旧冗長情報、旧データおよび新デー夕に基づいて中間冗長情報の生成を経て新冗長情報を生成した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む処理を行わせることを特徴とする。

1 7. 請求の範囲 1 5のディスクアレイ装置に於いて、前記復旧手段は、前記新データの書込完了後で中間冗長情報の不揮発性メモリ手段に対する格納前に電源ダウン力く起きていた場合には、書込手段により新データを書込むディスク装置及び冗長情報用ディスク装置以外の他のディスク装置の対応位置の格納データを読出す処理を行わせ、次に前記冗長情報更新手段により前記他のディスク装置の読出データと不揮発性メモリ手段から読出した新デ一タとから新冗長情報を賊した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む処理を行わせることを特徵とする。

1 8. 請求の範囲 1 5のディスクアレイ装置に於いて、前記復旧手段は、中間冗長情報の格納後で新データの書込み完了前に電源ダゥン力く起きていた場合には、前 Ξ%長情報更新手段により前記不揮発性メモリ手段から新データと中間冗長情報を読出して新冗長情報を生成した後に、前記旧冗長情報のディスク格納位置に新冗長情報を書込む処理を行わせることを特徵とする。

1 9. 請求項 1 0記載のディスクアレイ装置に於いて、前記不揮発性メモリ手段は、前 §己前記処理段階デ一夕及び新データに加え更に新冗長情報を格納することを特徵とする。

2 0. 請求項 1 9記載のディスクアレイ装置に於いて、更に、電源投入時に、前記不揮発性メモリ手段の処理段階データを参照し、.書込み処理力途中で中断されていた場合には、前記不揮発性メモリ手段に保持されている新データおよび新冗長情報を用いて復旧処理を行う復旧手段を設けたことを特徵とする。

2 1. 請求の範囲 1 9のディスクアレイ装置に於いて、更に前記複数のデイスク装置毎に設けたディスクアダプタにバックアツプ電源を供給し、電源ダウン時に旧データ及び旧冗長情報を保持可能としたことを特徴とする。

2 2, 請求の範囲 1 0のディスクアレイ装置に於いて、前記不揮発性メモリ手段はパックアップ電源を備えたことを特徴とする

2 3. 請求の範囲 1ひのディスクアレイ装置に於いて、前記複数のディスク装置のれぞれは、 1つのデータ単位に属する同一データの書込みを受けると共に、予め定めたディスク装置を冗長情報の格納に使用することを特徴とする。

2 4. 請求の範囲 1ひのディスクァレイ装置に於いて、前記複数のディスク装置のそれぞれは、 1つのデータ単位に属する同一データの書込みを受けると共に、データ書込み毎に冗長情報の格納に使用するディスク装置を異ならせることを特徴とする。

2 5. 請求の範囲 1 0のディスクアレイ装置に於いて、前記書込手段と冗長情報更新手段とを^ IJ的に動作させることを特徴とするディスクァレイ装置。

2 6. 請求の範囲 Γ0のディスクアレイ装置に於いて、前記冗長情報としてパリティデータを使用することを特徴とする。

2 7. ディスクアレイ装置に於いて、

データ格納用の複数のディスク装置と冗長情報格納用の 1つのディスク装置を備えたディスクアレイと、

上位装置からの更新要求に基づき、新たなデータ、更新前のデータおよび更新前の冗長情報に基づいて新たな冗長情報を生成してディスクアレイのデータおよび冗長情報を更新するアクセス処理手段と、

前記ァクセス処理手段による 1回の更新処理の際に取扱うデータと冗長情報の少なくとも 1つ及び前記ァクセス更新手段の処理段階を示す処理段階デー夕を記憶する不揮発性のキヤッシュ記憶手段と、

前記アクセス処理手段でディスクアレイを更新する前に前記キヤッシュ記憶手段から更新前のデー夕を検索して前記ァクセス処理手段に供給して新たな冗長情報を生成させるキヤッシュ制御手段と、

を備えたことを特徴とする。

2 8. 請求の範囲 2 7のディスクアレイ装置に於いて、更に、電源投入時に、前記不揮発性のキヤッシュ記憶手段の記憶情報を参照して復旧処理を行う復旧手段を設けたことを特徴とする。