JP2000047832A - ディスクアレイ装置、及びそのデータ制御方法 - Google Patents

ディスクアレイ装置、及びそのデータ制御方法

Info

Publication number
JP2000047832A
JP2000047832A JP10211358A JP21135898A JP2000047832A JP 2000047832 A JP2000047832 A JP 2000047832A JP 10211358 A JP10211358 A JP 10211358A JP 21135898 A JP21135898 A JP 21135898A JP 2000047832 A JP2000047832 A JP 2000047832A
Authority
JP
Japan
Prior art keywords
data
logical
disk storage
disk
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10211358A
Other languages
English (en)
Inventor
Haruo Tomita
治男 冨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP10211358A priority Critical patent/JP2000047832A/ja
Publication of JP2000047832A publication Critical patent/JP2000047832A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

(57)【要約】 【課題】 ディスクアレイの書き込み性能の向上のため
に用意されているバッファメモリ管理に係わり、選択し
た数の論理プロックを書き込みバッファに蓄積するま
で、ディスク記憶装置上のデータの更新を遅延させるデ
ータ更新方式のディスク記憶方式を提供すること。 【解決手段】 選択した数の論理プロックまで不揮発性
メモリ4にデータを格納し、ディスク記憶装置2上のデ
ータの更新を遅延させ、トランザクション中の書込み処
理におけるレイテンシィを向上させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、選択した数の論理
ブロックを書き込みバッファに蓄積するまでディスク記
憶装置上のデータの更新を遅延させるデータ更新方式の
ディスク記憶装置に係わるディスクアレイ装置、及びそ
のデータ制御方法に関する。
【0002】
【従来の技術】例えば米国特許第5,124,987号
や公開日本特許:特開平6−214720号、特開平6
−266510号、特開平9−198195号に開示さ
れているように、アレイ状のディスク記憶装置への高速
な書込み方法として、更新データが記録されていたディ
スク記録装置の旧データ領域を書換える方法ではなく、
更新するべきデータの論理ブロックを蓄積しておきディ
スク記憶装置内の予め用意した空領域に、一括して書き
込むデータの入出力方法が提案されている。
【0003】ディスクアレイ方式では、アレイを構成す
るディスク記憶装置が故障して縮退状態に陥っている場
合、故障したディスク装置に記憶されているデータを他
のディスク装置より再構築する必要があるため、通常時
の読み出し速度よりも劣ってしまう。これを解決する手
法として、日本登録特許第2570614号に修復され
たデータをキャッシュするディスクアレイ方式が開示さ
れている。
【0004】しかし、一般的に読み出し速度を向上する
ためにデータをキャッシュする場合には、読み出し要求
元のファイルシステムやデータベース管理システムのキ
ャッシュよりも大きな容量が必要であり、ディスクアレ
イを制御する制御装置のキャッシュメモリ容量がホスト
コンピュータの主記憶領域に応じて必要となるため高価
になってしまうという問題点がある。
【0005】また、ランダムアクセスにおいては、読み
込みデータをキャッシュメモリへデータ転送する処理時
間によりかえって読み出し速度を劣化する原因にもなっ
てしまう。
【0006】さらに、特願平2−128369に開示さ
れている方法のように、障害発生前から予め交代ブロッ
クを用意する場合には、ディスク記憶装置全体の故障に
は対応できない。
【0007】
【発明が解決しようとする課題】上述したように従来の
ディスクアレイでは、アレイを構成するディスク記憶装
置が故障して縮退状態に陥っている場合、故障したディ
スク装置に記憶されているデータを他のディスク記憶装
置より再構築する必要があるため、通常時の読み出し速
度よりも劣ってしまう。
【0008】また、障害発生前に交代ブロックを用意す
る場合にはディスク記憶装置の要領を効率的に使用する
ことが不可能となるものであった。
【0009】そこで、本発明は上記事情を考慮して成さ
れたもので、上記不具合を解消し、ディスクアレイの書
き込み性能の向上のために用意されているバッファメモ
リ管理に関し、縮退時の入出力処理性能の低下を改善す
ることが可能なディスクアレイ装置、及びそのデータ制
御方法を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、上記目的を達
成するため、本発明のディスクアレイ装置は、ブロック
サイズの正の整数倍(K)である予め決められた単位で
書き込みを行いアレイ状に配置されたN台のディスク記
憶装置と、上記複数のディスク記憶装置へのデータのア
クセスを制御し、上記複数のディスク記憶装置からの読
み出しデータに関してエラーの発生をチェックしてエラ
ーを修正する制御装置と、上記制御装置に対して上記複
数のディスク記憶装置へのアクセスを指示するホストコ
ンピュータとを備え、上記複数のディスク記憶装置は、
並列に動作し、データを格納するデータ領域と上記デー
タに対応する冗長データを格納するパリティ領域とを有
するディスクアレイ装置において、上記ディスク記憶装
置上のデータの位置を示す物理アドレスと上記ホストコ
ンピュータからみたデータのアドレスを示す論理アドレ
スとの対応を示した情報を格納する変換マップ部を設け
た揮発性記憶手段と、(N*(K−1))個の論理ブロ
ックに相当する以上の容量を持ち、上記ホストコンピュ
ータからの更新データを格納する書き込みバッファ部と
この書き込みバッファ部内の空き領域と格納されている
データの論理アドレスの情報を格納するバッファ管理情
報部とを設けた不揮発性記憶手段とを備え、上記制御装
置は、上記書き込みバッファ部に更新データの長さに応
じて上記論理ブロックを格納し、上記書き込みバッファ
部を上記ディスク記憶装置との間で転送されるデータの
キャッシュとして管理し、上記書き込みバッファ部に格
納した上記論理ブロックの更新を上記論理ブロックが
((N−1)*(K−1))個に達するまで遅延し、上
記論理ブロックが((N−1)*(K−1))個に達し
たとき、上記書き込みバッファ部に格納された各論理ブ
ロックに対する論理アドレスからなる論理アドレスタグ
ブロックを生成し、((N−1)*(K−1))個の論
理ブロックに上記論理アドレスタグブロックを加えた
(N−1)*K個の論理ブロックからK個のパリティブ
ロックを生成し、この論理ブロックにパリティブロック
を加えたN*K個の論理ブロックを上記N台のディスク
記憶装置上の更新されるべきデータを保持している領域
とは別の空き領域に書き込み、上記論理ブロックが
((N−1)*(K−1))個に達したとき、上記N台
のディスク記憶装置の1つが故障した場合には、この故
障したディスク記憶装置が格納すべきデータとして修復
したデータを故障していない別のディスク記憶装置の空
き領域に書き込む構成としたことを特徴とする。
【0011】このような構成によれば、トランザクショ
ン中にディスク記憶装置に更新の書込みをせずに、主記
憶装置上の揮発性メモリである書込みバッファに対して
更新を行った時点でトランザクション要求元へは書込み
完了を返却し、時間をおいてその書込みバッファを含む
ライトキャッシュ全体をディスク記憶装置へ書き込むよ
うにする。このことによって、トランザクション中の書
込み処理におけるレイテンシィが向上する。
【0012】また、上記N台のディスク記憶装置からな
るディスクアレイ装置において、故障したディスク記憶
装置位置に対応する上記論理ブロックの書き込み処理に
おいては、上記故障したディスク記憶装置に対応する上
記論理アドレスタグブロック内の論理アドレスにNUL
Lアドレスを設定し、故障したディスク記憶装置には実
際の書き込み動作を行わず、システムで決めた固定値を
書き込んだものとして管理しても良い。この場合、故障
したディスク装置への書き込み情報が、上記論理アドレ
スブロックタグを含むK個の論理ブロックである場合
に、論理アドレスタグブロック書き込み位置を故障した
ディスクから正常なディスクに変更し、N*K個の論理
ブロック単位に、この論理アドレスタグブロック書き込
み位置変更を示す情報を管理しても良い。
【0013】また、N台のディスク装置の1つが故障し
た場合には、新たな更新処理においては、故障したディ
スク記憶装置を書き込み対象ディスクから外し、N−1
台からなるディスクアレイ装置として論理ブロックを蓄
積する書き込みバッファの管理を行い、N台構成のディ
スクアレイ装置としての読み出しデータ修復処理と、N
−1台のディスクアレイ装置としての書き込みと読み出
しの管理を同時サポートするようにしても良い(アドレ
ス変換マップテーブルに、N台からN−1台に縮退動作
を示す情報を付加す)。
【0014】
【発明の実施の形態】以下、本発明の一実施の形態を図
面を参照して説明する。
【0015】図1は本実施形態の構成図である。本発明
のディスクアレイ方式は、制御装置1、ディスク記憶装
置2は、(21、22、23、24)、揮発性メモリ
3、不揮発性メモリ4、メモリバックアップ機構5から
構成される。尚、この実施例では、ディスク記憶装置2
は、4つのディスク記憶装置22〜24からなる。
【0016】ホストコンピュータ10と制御装置1との
インターフェースは、SCSIインターフェースであっ
ても良いし、PCIインターフェースであっても良い。
【0017】尚、本発明に関する記述の全体を通じて、
より詳細に説明するために図1に示す実施形態を中心と
して説明するが、当該技術分野に属する熟練者にとっ
て、それらの詳しい細部の説明がなくても図1から派生
するシステム構成であっても、本発明を実施できること
は明らかである。
【0018】制御装置1は、ディスク記憶装置2にアク
セスすると共に揮発性メモリ3、不揮発性メモリ4の管
理、ディスク記憶装置2の(N−1)台(Nはディスク
記憶装置の台数)のデータからパリティデータを計算し
たり、ディスク記憶装置2の(N−1)台のデータの排
他的論理和を求めるデータ復旧に伴う計算を行う。
【0019】ディスク記憶装置2(21〜24)は、そ
れぞれブロックサイズの正の整数倍(K)であるストラ
イプユニットと呼ぶ、予め決められた単位(そのディス
ク装置の1トラック長とする場合が最良の効果を得られ
る)で書き込みを行う。
【0020】この時、アレイを構成するディスク記憶装
置21〜24の物理的に同じ位置のストライプユニット
は論理的な単位として1つのストライプとして取り扱
い、同じタイミングで書き込みが行われる。
【0021】揮発性メモリ3には、ディスク記憶装置2
のデータの位置を示す物理アドレスとホストコンピュー
タ10からみたデータのアドレスを示す論理アドレスと
の変換を行う変換マップ31が格納されている。
【0022】この変換マップ31について、図2を使用
して説明する。変換マップ31は、図2に示すように、
各論理アドレスに対するブロックが格納されていて、ス
トライプ番号ST#310と、そのストライプ内のブロ
ック番号BLK#311、さらにそのタイムスタンプT
S#312をテーブル形式で保持している。
【0023】タイムスタンプ(カウンター)TS#31
2は、ホストコンピュータ10からの書き込みが実際に
ディスク記憶装置2に書き込まれた時に付加される情報
であり、ディスク記憶装置2内でのデータの書き込み順
を判断するために使用される。
【0024】不揮発性メモリ4には、ディスク記憶装置
2へ書き込むデータをログ構造化して保持する書き込み
バッファ41、書き込みバッファ内の空き領域と保持さ
れている書き込みデータの論理アドレスの情報を保持す
るバッファ管理情報42が格納されている。
【0025】不揮発性メモリ4上に割り付けられる書き
込みバッファ41とバッファ管理情報42の関係を図3
に示す。制御装置1は、PCIインターフェースまたは
SCSIインターフェースで外部接続されるホストコン
ピュータ10から要求された書き込みデータをディスク
装置2に対してすぐには書き込まずに、ブロック単位に
分割して書き込みバッファ41に順番に詰めることで、
ログ形式にして格納してゆく。
【0026】この時、書き込みデータのホストコンピュ
ータ10から見た論理アドレスを、バッファ管理情報4
2の格納したバッファ領域に対応するエントリーに保存
する。
【0027】また、そのエントリーにデータが割り当て
られた事を示すフラグ" F" を設定するよって、このバ
ッファ管理情報42を調べることにより、ホストコンピ
ュータ10から受け取った書き込みデータを格納すべき
次のバッファ領域を決定することができる。
【0028】図3に示した例では、バッファ領域B9ま
で書き込みデータが格納されており、B0、B1、・・
・、B9の論理アドレスがLA134、LA99、・・
・、LA678であることを現している。
【0029】書き込み性能を向上させるためにホストコ
ンピュータ10から要求された書き込みデータをディス
ク記憶装置2への書き込みを待たずに不揮発性メモリ4
上の書き込みバッファ41に配置した時に書き込み完了
の通知を行う。そのため、書き込みバッファ41上に配
置した書き込み要求とバッファ管理情報42を失うこと
はできない。
【0030】そこで、書き込みバッファ41とバッファ
管理情報42は不揮発性メモリ4に配置しなければなら
ない。メモリバックバックアップ機構5は、電源障害等
が発生した場合に不揮発性メモリ4上の書き込みバッフ
ァ41やバッファ管理情報42の内容を保護するための
機構である。
【0031】図4は、本実施形態の読込み処理動作を示
すフローチャートである。
【0032】制御装置1は、ホストコンピュータ10か
らの読み込みデ−タの論理アドレスとデータ長を受取る
と( ステップS1) 、読み込みデータをブロック単位に
分割し( ステップS2) 、論理アドレスをブロック毎の
論理アドレスに修正する( ステップS3) 。
【0033】バッファ管理情報42の有効な各エントリ
を検索することにより、読込みデ−タに対応する論理ブ
ロックが書込バッファ41中に存在するかを調べる( ス
テップS4) 。この判断には、バッファ管理情報42の
エントリ中に分割された書込みデ−タの論理アドレスに
等しい読込みデータが存在するかということを調べれば
良い( ステップS5) 。
【0034】既に書込みバッファに格納されているデー
タに対する読込み処理の場合には(ステップS5のYe
s)、書込みバッファ41の内容を読み込み先に転送す
る(ステップS6)。
【0035】書込みバッファ41内に無い場合には(ス
テップS5のNo)、論理アドレスに対応する物理アド
レスを変換マップ31から求め(ステップS7)、物理
アドレスを使用してディスク記憶装置21〜24からデ
ータを読み出す(ステップS8)。
【0036】次に、データ読み出し時に、ディスク記憶
装置21〜24の中のあるディスク記憶装置に障害が発
生したことによる読み込みエラーを初めて検出したか否
かを検査する(ステップS9)。
【0037】読み込みエラーを初めて検出した場合には
(ステップS9のYes)、障害が発生したディスク記
憶装置の識別番号を揮発性メモリ3上に記録する(ステ
ップS10)。
【0038】読み込みエラーが初めてでない場合には
(ステップS9のNo)、読み込みエラーが記録されて
いるディスク記憶装置と、異なるディスク記憶装置で読
み込みエラーが検出されたか否かを検査し(ステップS
11)、読み込みエラーが記録されているディスク記憶
装置と異なっていた場合には(ステップS11のYe
s)、データの再生が不可能になることからディスク記
憶装置への読み込み操作を中断する(ステップS1
2)。
【0039】読み込みエラーが記録されているディスク
記憶装置と異なるディスク記憶装置で無い場合は(ステ
ップS11のNo)、ステップS13の処理へ移行す
る。
【0040】次に、障害が発生したディスク記憶装置以
外から読み込みデータを再生成するために、変換マップ
31から障害を検出したデータの論理アドレスに対応す
るストライプ番号を求め(ステップS13)、障害が発
生していない(N−1)台のディスク記憶装置の物理ア
ドレスを作成し( ステップS14) 、障害が発生してい
ない(N−1)台のディスク記憶装置2から揮発性メモ
リ3上にデータを読み込む(ステップS15)。
【0041】(N−1)台のディスク記憶装置のどれか
で障害が発生しているか検査し(ステップS16)、障
害を検出した場合には(ステップS16のYes)、読
み込み操作を中断する(ステップS17)。
【0042】障害を検出しない場合には(ステップS1
6のNo)、読み込んだ全てのデータを制御装置1に渡
し障害が発生したデータを再生成し(ステップS1
8)、障害が発生したアドレスに対応する変換マップ3
1の図示しないエントリに再生したデータであるフラ
グ" E" を設定する(ステップS19)。
【0043】次に、読み込むデータのデータ長が論理ブ
ロック長より短い場合か否かチェックする(ステップS
20)、論理ブロック長より短い場合には(ステップS
20のYes)、再生したデータを書き込みバッファ4
1の空領域に転送し(ステップS21)、バッファ管理
情報42を更新し(ステップS22)、書き込みバッフ
ァ41に保存されている他の書き込みデータと一緒に故
障していないディスク装置21〜24に書き込み(ステ
ップS23)、変換マップ31の論理アドレスと物理ア
ドレスの位置関係を更新し(ステップS24)、障害が
発生した論理アドレスの変換マップ31上の図示しない
エントリに設定したフラグ”E”をクリアする。
【0044】読み込むデータサイズが論理ブロック長だ
った場合には(ステップS20のNo)、再生したデー
タを読み込み先に転送する(ステップS25)。
【0045】ホストコンピュータ10からの受け取った
読込みデ−タに対するその論理アドレスの分割したデー
タが有る場合(ステップS26のNo)、上記の処理を
継続することで(ステップS3の処理へ戻る)読込み処
理が実現できる。
【0046】分割したデータが無い場合(ステップS2
6のYes)、処理は終了する。
【0047】図5は、本実施形態の書込み動作を示すフ
ローチャートである。
【0048】制御装置1は、ホストコンピュータ10か
らの書き込みデ−タの論理アドレスとデータ長を受取る
と(ステップT1)、書込みデータを不揮発性メモリ4
上の書込みバッファ41の空領域にブロック単位に分割
し(ステップT2)、論理アドレスはブロック毎のアド
レスに変換する(ステップT3)。
【0049】バッファ管理情報42の有効な各エントリ
を検索することにより、書き込みデ−タに対応する論理
ブロックが書込バッファ41中に存在するかを調べる。
【0050】この判断には、バッファ管理情報42のエ
ントリ中に分割された書込みデ−タの論理アドレスが存
在するか否かということを調べればよい(ステップT
4)。
【0051】既に、書込みバッファ41に格納されてい
るデータに対するデータ更新処理の場合には(ステップ
T4のYes)、書込みバッファ41の空領域に詰めて
格納するのではなく、書込みバッファ41内の旧データ
を更新する( ステップT5)。
【0052】書込みデータの論理アドレスがバッファ管
理情報42のエントリに存在しなかった場合には(ステ
ップT4のNo)、書込みデータをディスク記憶装置2
に書き込むべきか、書き込みデータを書き込みバッファ
41に蓄積すべきかを調べる。その判断は、変換マップ
31の論理アドレスの図示しないエントリを検査するこ
とにより可能である(ステップT6)。
【0053】次に、更新したいデータが障害が発生して
再生されたデータであるか否かを判定する(ステップT
7)。
【0054】更新したいデータが障害が発生して再生さ
れたデータであった場合には(ステップT7のYe
s)、書き込みバッファ41に蓄積したブロック数が故
障したディスクに保存できるブロック数より1少ない数
(((N−2)*K)−1)の場合、書き込みバッファ
41に格納できる。そこで、蓄積したブロック数が
(((N−2)*K)−1)に到達しているか否かを判
定する(ステップT8)。
【0055】蓄積したブロック数が(((N−2)*
K)−1)に到達していない場合(ステップT8のYe
s)には、データを書き込みバッファ41の空領域に詰
めて格納し(ステップT9)、バッファ管理情報42の
エントリに対応する論理アドレスを設定する(ステップ
T10)。その後、ステップT30の処理へ移る。
【0056】蓄積したブロック数が(((N−2)*
K)−1)に到達していた場合には(ステップT8のN
o)、最後の書込みブロックとして、バッファ管理情報
42に格納された各ブロックの論理アドレスと揮発性メ
モリ3上のタイムスタンプTS#312から論理アドレ
スタグブロック61を作成する(ステップT11)。
【0057】図6に示したように、論理アドレスタグブ
ロック61内のアドレスデータとデータブロックとの間
には、1対1の関係があらかじめ設定されており、各デ
ータブロックの論理アドレスが分かるようになってい
る。論理アドレスタグブロック61を書込みバッファ4
1内の配置する位置は、障害の発生しているディスク記
憶装置を避け(この場合、ディスク記憶装置23に障害
が発生しているものとする)、故障したディスク記憶装
置23に対応する論理アドレスタグブロック61内の論
理アドレスをNULLアドレスとしディスク記憶装置2
1、22、24に均等に格納されるように調節し(ステ
ップT12)、ディスク記憶装置21、22、24の空
きストライプ領域を見つけ(ステップT13)、データ
に対応する冗長データであるパリティデータについてパ
リティ無しのストライプデータをディスク記憶装置にま
とめて書き込む(ステップT14)。その後、ステップ
T20の処理へ移る。ステップT14の時の様子を図
7、図8に示す。
【0058】障害が発生していない場合には、書き込み
バッファ41に蓄積した論理ブロック数が1ストライプ
分に1ブロック少い数((N*K)−1)場合に、書き
込みバッファ41に格納できる。書き込みバッファ41
に蓄積した論理ブロック数を調べ(ステップT15)、
蓄積した論理ブロックが1ストライプ分に1ブロック少
い数((N*K)−1)より少い場合には(ステップT
15のYes)、データを書込みバッファ41の空領域
に詰めて格納し(ステップT9)、バッファ管理情報4
2のエントリに対応する論理アドレスを設定する(ステ
ップT10)。その後、ステップT30の処理へ移る。
【0059】書き込みバッファ41に蓄積したブロック
数が1ストライプ分に1ブロック少い数((N*K)−
1)に到達した場合には(ステップT15のNo)、最
後の書込みブロックとして、バッファ管理情報42に格
納された各ブロックの論理アドレスと揮発性メモリ上の
タイムスタンプTS#312から論理アドレスタグブロ
ック61を作成し(ステップT16)、制御装置1によ
って論理アドレスタグブロック61を加えた1ストライ
プ分のデータからストライプユニット毎の排他的論理演
算を行いK個のパリティブロックを生成し(ステップT
17)、ディスク記憶装置21〜24の空きストライプ
領域を見つけ(ステップT18)、パリティ付きのスト
ライプデータをディスク記録装置へまとめて書き込む
(ステップT19)。この時の様子を図8に示す。
【0060】ディスク記憶装置2への書き込みが正常終
了したか検査し(ステップT20)、ディスク記録装置
2から障害により書き込みの失敗を検出した場合には、
即ち正常終了していない場合(ステップT20のN
o)、既に障害が発生しているディスク記録装置が存在
するか検査し(ステップT21)、障害が発生していた
場合には(ステップT21のYes)、書き込み操作を
中止する(ステップT22)。
【0061】初めて、障害を検出した場合には(ステッ
プT21のNo)、障害の発生したディスク記憶装置の
識別番号を揮発性メモリ3上に記録し(ステップT2
3)、パリティ付きのストライプデータをパリティ無し
のデータに変更し(ステップT24)、再度書き込み要
求を行い(ステップT25)、ステップT20の処理に
移る。
【0062】ディスク記憶装置2への書き込みが正常終
了した場合には(ステップT20のYes)、ディスク
装置21〜24へ書込処理が完了した時点で揮発性メモ
リ上にあるタイムスタンプTS#312をインクリメン
ト(カウントアップ)し(ステップT26)、書込みデ
ータの論理アドレスに対応する変換マップ31を更新し
(ステップT27)、障害が発生したアドレスに対応す
る変換マップ31のエントリに再生したデータであるフ
ラグが設定されてるかを調べ(ステップT28)、再生
データであった場合には(ステップT28のYes)、
フラグをクリアする(ステップT29)。その後、ステ
ップT30の処理へ移る。
【0063】再生データで無い場合は(ステップT28
のNo)、ステップT30の処理へ移る。
【0064】これらの処理をホストコンピュータ10か
らの受け取った書込みデ−タに対するその論理アドレス
の分割したデータが無いかどうか判定する(ステップT
30)。分割したデータが無い場合(ステップT30の
No)は、処理を継続することで書込み処理が実現でき
る(ステップT3に戻る)。分割したデータが有る場合
(ステップT30のYes)は、処理は終了する。
【0065】図9に示したように、レベル5のRAID
方式(RAID5)の場合には、各ディスク装置に均等
に入出力が分散するように、論理アドレスタグブロック
およびK個のパリティブロックをディスク記憶装置(m
od N)で巡回的に配置することが望ましい。
【0066】
【発明の効果】以上詳記したように本発明によれば、書
込み先行記録と2次の記憶装置に対する遅延更新とを行
うオンライン・トランザクション処理システムの更新用
ディスク記憶装置として適用可能である。また、トラン
ザクション中にディスク記憶装置に更新の書込みをせず
に、記憶装置上の揮発性メモリである書込みバッファに
対して更新を行っった時点でトランザクション要求元へ
は書込み完了を返却し、時間をおいてその書込みバッフ
ァを含むライトキャッシュ全体をディスク記憶装置へ書
き込むようにする。このことによって、トランザクショ
ン中の書込み処理におけるレイテンシィが向上する。
【0067】さらに本発明によれば、本方式をレベル4
のRAID方式( RAID4方式)およびレベル5のR
AID方式( RAID5方式) に適応した場合には、1
個のストライプ( ディスク数をN、ブロック数をKとす
ると、N*K個の論理ブロック) を一括して更新する事
が可能であるため、パリティ維持のためのディスク読み
出し動作も不要になり、書込み時のオ−バヘッドを減少
させることともに、ディスク装置に障害が発生した場合
の読み込み時のオーバヘッドを減少させることが可能と
なり、本発明の最大の利点が達成される。
【図面の簡単な説明】
【図1】本発明の一実施形態に係わるディスクアレイ方
式の概念的構成を示す図。
【図2】同実施の形態に係わるディスクアレイ方式の変
換マップを示す図。
【図3】同実施の形態に係わり、ディスクアレイ方式の
書き込みバッファとバッファ管理情報を示す図。
【図4】同実施の形態に係わり、読み込み処理を示すフ
ローチャート。
【図5】同実施の形態に係わり、書込み処理を示すフロ
ーチャート。
【図6】同実施の形態に係わり、アレイディスクのディ
スク記憶装置に障害がある場合の論理アドレスタグブロ
ックを示す図。
【図7】同実施の形態に係わり、アレイディスクのディ
スク記憶装置に障害がある場合の再生データを格納する
状態を示す図。
【図8】同実施の形態に係わり、アレイディスクのディ
スク記憶装置に論理アドレスタグブロックを示す図。
【図9】同実施の形態に係わり、論理アドレスタグブロ
ックを分散配置した状態を示す図。
【符号の説明】
1…制御装置 3…揮発性メモリ 4…不揮発性メモリ 5…メモリバックアップ機構 10…ホストコンピュータ 2(21、22、23、24)…ディスク記憶装置

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 ブロックサイズの正の整数倍(K)であ
    る予め決められた単位で書き込みを行いアレイ状に配置
    されたN台のディスク記憶装置と、上記複数のディスク
    記憶装置へのデータのアクセスを制御する制御装置と、
    上記制御装置に対して上記複数のディスク記憶装置への
    アクセスを指示するホストコンピュータとを備え、 上記複数のディスク記憶装置は、並列に動作し、データ
    を格納するデータ領域と上記データに対応する冗長デー
    タを格納するパリティ領域とを有するディスクアレイ装
    置において、 上記ディスク記憶装置上のデータの位置を示す物理アド
    レスと上記ホストコンピュータからみたデータのアドレ
    スを示す論理アドレスとの対応を示した情報を格納する
    変換マップ部を設けた揮発性記憶手段と、 (N*(K−1))個の論理ブロックに相当する以上の
    容量を持ち、上記ホストコンピュータからの更新データ
    を格納する書き込みバッファ部とこの書き込みバッファ
    部内の空き領域と格納されているデータの論理アドレス
    の情報を格納するバッファ管理情報部とを設けた不揮発
    性記憶手段とを備え、 上記制御装置は、 上記書き込みバッファ部に更新データの長さに応じて上
    記論理ブロックを格納し、上記書き込みバッファ部を上
    記ディスク記憶装置との間で転送されるデータのキャッ
    シュとして管理し、 上記書き込みバッファ部に格納した上記論理ブロックの
    更新を上記論理ブロックが((N−1)*(K−1))
    個に達するまで遅延し、上記論理ブロックが((N−
    1)*(K−1))個に達したとき、上記書き込みバッ
    ファ部に格納された各論理ブロックに対する論理アドレ
    スからなる論理アドレスタグブロックを生成し、 ((N−1)*(K−1))個の論理ブロックに上記論
    理アドレスタグブロックを加えた(N−1)*K個の論
    理ブロックからK個のパリティブロックを生成し、この
    論理ブロックにパリティブロックを加えたN*K個の論
    理ブロックを上記N台のディスク記憶装置上の更新され
    るべきデータを保持している領域とは別の空き領域に書
    き込み、 上記論理ブロックが((N−1)*(K−1))個に達
    したとき、上記N台のディスク記憶装置の1つが故障し
    た場合には、この故障したディスク記憶装置が格納すべ
    きデータとして修復したデータを故障していない別のデ
    ィスク記憶装置の空き領域に書き込むことを特徴とする
    ディスクアレイ装置。
  2. 【請求項2】 上記N台のディスク記憶装置からなるデ
    ィスクアレイ装置において、故障したディスク記憶装置
    位置に対応する上記論理ブロックの書き込み処理におい
    ては、 上記故障したディスク記憶装置に対応する上記論理アド
    レスタグブロック内の論理アドレスにNULLアドレス
    を設定し、故障したディスク記憶装置には実際の書き込
    み動作を行わず、固定値を書き込んだものとして管理す
    ることを特徴とする請求項1記載のディスクアレイ装
    置。
  3. 【請求項3】 上記故障ディスク装置が格納すべきデー
    タを、故障していない別のディスク装置から修復する手
    段は、ホストコンピュータのプロセッサを使用すること
    を特徴とする請求項1または2記載のディスクアレイ装
    置。
  4. 【請求項4】 上記故障ディスク装置が格納すべきデー
    タを、故障していない別のディスク装置から修復する手
    段は、制御装置内のプロセッサを使用することを特徴と
    する請求項1または2記載のディスクアレイ装置。
  5. 【請求項5】 上記不揮発性記憶手段は、バッテリー等
    の2次電源でバックアップされていることを特徴とする
    請求項1または2記載のディスクアレイ装置。
  6. 【請求項6】 ブロックサイズの正の整数倍(K)であ
    る予め決められた単位で書き込みを行いアレイ状に配置
    されたN台のディスク記憶装置と、上記複数のディスク
    記憶装置へのデータのアクセスを制御する制御装置と、
    上記制御装置に対して上記複数のディスク記憶装置への
    アクセスを指示するホストコンピュータとを備え、 上記複数のディスク記憶装置は、並列に動作し、データ
    を格納するデータ領域と上記データに対応する冗長デー
    タを格納するパリティ領域とを有するディスクアレイ装
    置のデータ制御方法において、 上記ディスク記憶装置上のデータの位置を示す物理アド
    レスと上記ホストコンピュータからみたデータのアドレ
    スを示す論理アドレスとの対応を示した情報を格納する
    変換マップ部を設けた揮発性記憶手段と、 (N*(K−1))個の論理ブロックに相当する以上の
    容量を持ち、上記ホストコンピュータからの更新データ
    を格納する書き込みバッファ部とこの書き込みバッファ
    部内の空き領域と格納されているデータの論理アドレス
    の情報を格納するバッファ管理情報部とを設けた不揮発
    性記憶手段とを備え、 上記制御装置は、 上記書き込みバッファ部に更新データの長さに応じて上
    記論理ブロックを格納し、上記書き込みバッファ部を上
    記ディスク記憶装置との間で転送されるデータのキャッ
    シュとして管理し、 上記書き込みバッファ部に格納した上記論理ブロックの
    更新を上記論理ブロックが((N−1)*(K−1))
    個に達するまで遅延し、上記論理ブロックが((N−
    1)*(K−1))個に達したとき、上記書き込みバッ
    ファ部に格納された各論理ブロックに対する論理アドレ
    スからなる論理アドレスタグブロックを生成し、 ((N−1)*(K−1))個の論理ブロックに上記論
    理アドレスタグブロックを加えた(N−1)*K個の論
    理ブロックからK個のパリティブロックを生成し、この
    論理ブロックにパリティブロックを加えたN*K個の論
    理ブロックを上記N台のディスク記憶装置上の更新され
    るべきデータを保持している領域とは別の空き領域に書
    き込み、 上記論理ブロックが((N−1)*(K−1))個に達
    したとき、上記N台のディスク記憶装置の1つが故障し
    た場合には、この故障したディスク記憶装置が格納すべ
    きデータとして修復したデータを故障していない別のデ
    ィスク記憶装置の空き領域に書き込むことを特徴とする
    データ制御方法。
  7. 【請求項7】 上記N台のディスク記憶装置からなるデ
    ィスクアレイ装置のデータ制御方法において、故障した
    ディスク記憶装置位置に対応する上記論理ブロックの書
    き込み処理においては、 上記故障したディスク記憶装置に対応する上記論理アド
    レスタグブロック内の論理アドレスにNULLアドレス
    を設定し、故障したディスク記憶装置には実際の書き込
    み動作を行わず、固定値を書き込んだものとして管理す
    ることを特徴とする請求項6記載のデータ制御方法。
  8. 【請求項8】 上記故障ディスク装置が格納すべきデー
    タを、故障していない別のディスク装置から修復する手
    段は、ホストコンピュータのプロセッサを使用すること
    を特徴とする請求項6または7記載のディスクアレイ装
    置。
  9. 【請求項9】 上記故障ディスク装置が格納すべきデー
    タを、故障していない別のディスク装置から修復する手
    段は、制御装置内のプロセッサを使用することを特徴と
    する請求項6または7記載のディスクアレイ装置。
  10. 【請求項10】 上記不揮発性記憶手段は、バッテリー
    等の2次電源でバックアップされていることを特徴とす
    る請求項6または請求項7記載のディスクアレイ装置。
JP10211358A 1998-07-27 1998-07-27 ディスクアレイ装置、及びそのデータ制御方法 Pending JP2000047832A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10211358A JP2000047832A (ja) 1998-07-27 1998-07-27 ディスクアレイ装置、及びそのデータ制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10211358A JP2000047832A (ja) 1998-07-27 1998-07-27 ディスクアレイ装置、及びそのデータ制御方法

Publications (1)

Publication Number Publication Date
JP2000047832A true JP2000047832A (ja) 2000-02-18

Family

ID=16604657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10211358A Pending JP2000047832A (ja) 1998-07-27 1998-07-27 ディスクアレイ装置、及びそのデータ制御方法

Country Status (1)

Country Link
JP (1) JP2000047832A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207572A (ja) * 2001-01-09 2002-07-26 Toshiba Corp ディスク制御システムおよびディスク制御方法
US6895469B2 (en) 2001-11-30 2005-05-17 Kabushiki Kaisha Toshiba Disk array apparatus and parity processing method therein
US6912614B2 (en) 2001-11-30 2005-06-28 Kabushiki Kaisha Toshiba Disk array apparatus and data restoring method used therein
JP2011113232A (ja) * 2009-11-26 2011-06-09 Nec Corp ディスクエンクロージャ及びストレージシステムの制御方法
US8402202B2 (en) 2007-07-31 2013-03-19 Samsung Electronics Co., Ltd. Input/output control method and apparatus optimized for flash memory
CN117785070A (zh) * 2024-02-23 2024-03-29 杭州海康威视数字技术股份有限公司 数据存储控制方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207572A (ja) * 2001-01-09 2002-07-26 Toshiba Corp ディスク制御システムおよびディスク制御方法
US6895469B2 (en) 2001-11-30 2005-05-17 Kabushiki Kaisha Toshiba Disk array apparatus and parity processing method therein
US6912614B2 (en) 2001-11-30 2005-06-28 Kabushiki Kaisha Toshiba Disk array apparatus and data restoring method used therein
US8402202B2 (en) 2007-07-31 2013-03-19 Samsung Electronics Co., Ltd. Input/output control method and apparatus optimized for flash memory
JP2011113232A (ja) * 2009-11-26 2011-06-09 Nec Corp ディスクエンクロージャ及びストレージシステムの制御方法
CN117785070A (zh) * 2024-02-23 2024-03-29 杭州海康威视数字技术股份有限公司 数据存储控制方法及装置
CN117785070B (zh) * 2024-02-23 2024-05-24 杭州海康威视数字技术股份有限公司 数据存储控制方法及装置

Similar Documents

Publication Publication Date Title
JP3177242B2 (ja) データ記憶装置における書込みオペレーション識別子の不揮発性メモリ記憶
US5596709A (en) Method and apparatus for recovering parity protected data
US5488701A (en) In log sparing for log structured arrays
US5404361A (en) Method and apparatus for ensuring data integrity in a dynamically mapped data storage subsystem
US5787460A (en) Disk array apparatus that only calculates new parity after a predetermined number of write requests
JP3283530B2 (ja) ディスク・アレイにおいてパリティ保全性を維持するための妥当性検査システム
JP2654346B2 (ja) ディスク・アレイ・システムおよび記憶方法並びに制御装置
JP4821448B2 (ja) Raidコントローラおよびraid装置
US5457791A (en) Storage system and method of control
US7464322B2 (en) System and method for detecting write errors in a storage device
US6886068B2 (en) Disk array apparatus and data update method for storing tag blocks
US7228381B2 (en) Storage system using fast storage device for storing redundant data
US20090204846A1 (en) Automated Full Stripe Operations in a Redundant Array of Disk Drives
JP3682256B2 (ja) ディスクアレイ装置及び同装置におけるパリティ処理方法
TW201923575A (zh) 運作中磁碟冗餘陣列同位計算
US8041891B2 (en) Method and system for performing RAID level migration
CN112596673B (zh) 具有双重raid数据保护的多活多控存储系统
US20070168706A1 (en) Method for reducing rebuild time on a RAID device
JP2008204041A (ja) ストレージ装置及びデータ配置制御方法
US20110010582A1 (en) Storage system, evacuation processing device and method of controlling evacuation processing device
US6701452B1 (en) Disk array controller having distributed parity generation function
JP2000047832A (ja) ディスクアレイ装置、及びそのデータ制御方法
JP2010026812A (ja) 磁気ディスク装置
JP2005107839A (ja) アレイコントローラ及びディスクアレイ再構築方法
KR19980047273A (ko) 레이드 레벨 5 시스템에서 캐쉬 관리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040929

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071016

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080812

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090106