JP2003167688A - Disk array device and consistency recovering method for logical drive having redundant data - Google Patents

Disk array device and consistency recovering method for logical drive having redundant data

Info

Publication number
JP2003167688A
JP2003167688A JP2001367242A JP2001367242A JP2003167688A JP 2003167688 A JP2003167688 A JP 2003167688A JP 2001367242 A JP2001367242 A JP 2001367242A JP 2001367242 A JP2001367242 A JP 2001367242A JP 2003167688 A JP2003167688 A JP 2003167688A
Authority
JP
Japan
Prior art keywords
data
stripe
area
logical address
write
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001367242A
Other languages
Japanese (ja)
Other versions
JP3590015B2 (en
Inventor
Kuniyasu Shimizu
邦保 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001367242A priority Critical patent/JP3590015B2/en
Publication of JP2003167688A publication Critical patent/JP2003167688A/en
Application granted granted Critical
Publication of JP3590015B2 publication Critical patent/JP3590015B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/104Metadata, i.e. metadata associated with RAID systems with parity

Abstract

<P>PROBLEM TO BE SOLVED: To provide a disk array device and a consistency recovering method for a logical dive having redundant data, which are expected to perform smooth processing after restart by surely avoiding a medium error accompanied with processing interruption in the middle of write with respect to a disk array where the fault tolerance of disks is realized by redundant data. <P>SOLUTION: At restart after write processing interruption, a RAID controller 11 writes a predetermined value in an area (X, Y) registered in a non-volatile memory 12 and generates a corresponding parity in accordance with each data stripe in the same parity group including this data area and writes the parity in a corresponding disk of a disk array 14. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、冗長データにより
ディスクの耐障害性を実現したディスクアレイ装置、お
よび冗長データをもつ論理ドライブの一貫性回復方法に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a disk array device which realizes disk fault tolerance by redundant data, and a method for recovering consistency of a logical drive having redundant data.

【0002】[0002]

【従来の技術】複数の小型ディスクを用いて構成された
ディスクアレイシステムに於いて、冗長データをもつこ
とによりディスクの耐障害性を実現する技術としてRA
ID技術が知られている。
2. Description of the Related Art In a disk array system composed of a plurality of small disks, RA is used as a technology for realizing disk fault tolerance by having redundant data.
ID technology is known.

【0003】このRAID技術を適用したRAIDシス
テム上に於いては、ディスクへの書き込み途中に、停電
などにより、RAIDコントローラが停止した場合、デ
ィスク装置上のデータと冗長データの一貫性が失われる
場合がある。例えばRAIDレベル3またはRAIDレ
ベル5等により冗長データをもたせて耐障害性を実現し
た論理ドライブの場合、ディスクにデータとパリティ
(冗長データ)を書き込んでいる途中で処理が停止する
と、一部のデータの更新を完了したにも拘わらず、パリ
ティが更新されず、ディスクアレイのパリティグループ
でデータとパリティの一貫性が失われる可能性がある。
この状態でシステムを再起動して処理を継続してしまう
と、論理ドライブに属するディスクドライブが故障して
論理ドライブが縮退状態になった場合に、不正なパリテ
ィを用いて故障したディスクドライブ上のデータを復元
してしまうため、誤ったデータを復元してしまうことに
なる。
In a RAID system to which this RAID technology is applied, when the RAID controller is stopped due to a power failure or the like during writing to a disk, the consistency between the data on the disk device and the redundant data is lost. There is. For example, in the case of a logical drive that realizes fault tolerance by providing redundant data with RAID level 3 or RAID level 5, etc., if processing stops while data and parity (redundant data) are being written to the disk, some data will be lost. However, the parity is not updated even though the update of the above is completed, and the data and the parity may be inconsistent in the parity group of the disk array.
If the system is restarted in this state and processing continues, if a disk drive belonging to a logical drive fails and the logical drive is in a degraded state, incorrect parity is used on the failed disk drive. Since the data is restored, the wrong data will be restored.

【0004】ある種のRAIDコントローラでは、論理
ドライブに書き込み処理を実行する際に、不揮発性メモ
リに現在更新中の領域を登録しておき、書き込み処理が
中断した際、次回の再起動時に、更新中であった領域に
関してストライプグループの一貫性の回復処理を行った
後に、通常動作に戻る。この際の際の書き込み処理の中
断に伴う一貫性回復処理技術として特許第307101
7号が知られている。ここでは、書き込み処理が中断し
た場合、次回の再起動時に、更新中であったデータ領域
に該当するデータディスクのデータから冗長データを再
構成するものである。
In a RAID controller of a certain type, an area currently being updated is registered in the nonvolatile memory when the writing process is executed in the logical drive, and when the writing process is interrupted, the area is updated at the next restart. After performing the stripe group consistency recovery process on the former area, the normal operation is resumed. As a consistency recovery processing technique associated with the interruption of the writing process at this time, Japanese Patent No. 307101
No. 7 is known. Here, when the writing process is interrupted, the redundant data is reconstructed from the data of the data disk corresponding to the data area being updated at the time of the next restart.

【0005】この従来技術では、書き込み処理が中断し
た際、その領域は書き込み途中の状態のまま、動作が終
了してしまうことから、再起動時にセクタ不良等のメデ
ィアエラーになる虞がある。即ち、上記した書き込み処
理中断後の再起動時に於いて、書き込み途中の状態のま
まにある領域を含んで書き込み、その後、読み出し要求
があった際、この時点では未だデータとパリティの一貫
性が失われた状態のままであることから、そのI/Oア
クセスが無効(エラー)となり、データの読み書きがで
きない。この際は、一旦、上記した一貫性回復処理によ
って、更新中であったデータ領域に該当するデータディ
スクのデータから冗長データを再構成して一貫性の回復
処理を行い、その後に、要求に従う処理を実行しなけれ
ばならない。
In this prior art, when the writing process is interrupted, the operation ends while the area is still in the middle of writing, so there is a risk of a media error such as a sector defect at the time of restart. That is, at the time of restarting after the above-mentioned write processing is interrupted, data including the area that is still in the state of being written is written, and then when a read request is made, the consistency of data and parity is still lost at this point. Since it remains in the opened state, the I / O access becomes invalid (error) and data cannot be read or written. In this case, once the above-mentioned consistency recovery processing is performed, the redundant data is reconstructed from the data on the data disk corresponding to the data area that was being updated, the consistency recovery processing is performed, and then the processing according to the request. Must be performed.

【0006】従って書き込み処理中断後の再起動時に於
いて、書き込み途中の状態のままにある領域を含む書き
込み要求があった際、その書き込み処理に先立って、一
旦、もとのデータおよび冗長データから新たに冗長デー
タを生成して一貫性回復処理を行なわなければならない
という無駄な処理が介在する。
Therefore, at the time of restarting after the interruption of the writing process, when there is a writing request including an area which is still in the state of being written, prior to the writing process, the original data and the redundant data are temporarily changed. There is a wasteful process of newly generating redundant data and performing a consistency recovery process.

【0007】[0007]

【発明が解決しようとする課題】上述したように従来で
は、書き込み処理が中断した際、その領域は書き込み途
中の状態のまま、動作が終了してしまうことから、書き
込み処理中断後の再起動時に於いてメディアエラーにな
る虞があり、更に、これを回避しようとすると、アクセ
ス要求処理に先立って、更新中であったデータ領域に該
当するデータディスクのデータから冗長データを再構成
する無駄な処理が介在するという問題があった。
As described above, in the prior art, when the writing process is interrupted, the operation ends while the area is still in the middle of writing, so that when the writing process is restarted, the operation is terminated. There is a risk that a media error will occur, and if it is attempted to avoid this, useless processing to reconstruct redundant data from the data of the data disk corresponding to the data area that was being updated prior to access request processing There was a problem of being involved.

【0008】本発明は上記実情に鑑みなされたもので、
冗長データによりディスクの耐障害性を実現したディス
クアレイに於いて、書き込み途中での処理中断に伴うメ
ディアエラーを確実に回避して再起動後に於ける円滑な
処理が期待できるディスクアレイ装置および冗長データ
をもつ論理ドライブの一貫性回復方法を提供することを
目的とする。
The present invention has been made in view of the above circumstances,
In a disk array that achieves disk fault tolerance with redundant data, a disk array device and redundant data that can reliably avoid media errors due to processing interruption during writing and expect smooth processing after restarting An object of the present invention is to provide a consistency recovery method for a logical drive having

【0009】[0009]

【課題を解決するための手段】本発明は、冗長データに
よりディスクの耐障害性を実現したディスクアレイに於
いて、書き込み処理中にその処理が中断した際、再起動
時に於いて、書き込み途中の状態のままにある領域に既
定値、若しくは既存データを用いて一貫性回復のための
強制書き込み(上書き処理)を行うことで、再起動後に
於けるメディアエラー等のアクセス障害を回避したこと
を特徴とする。
SUMMARY OF THE INVENTION The present invention is a disk array in which disk fault tolerance is realized by redundant data, and when the writing process is interrupted during the writing process, the writing process is restarted during the writing process. It is possible to avoid access failure such as media error after reboot by performing forced write (overwrite processing) for consistency recovery using the default value or existing data in the area that remains in the state. And

【0010】また、本発明は、上記した従来の一貫性回
復処理とは異なる方法で、冗長データの一貫性を回復す
ることを特徴とする。
The present invention is also characterized in that the consistency of redundant data is recovered by a method different from the conventional consistency recovery processing described above.

【0011】即ち、本発明は、冗長データによりディス
クの耐障害性を実現したディスクアレイ装置に於いて、
書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで記憶する不
揮発性の記憶手段と、前記書き込み要求に従う書き込み
処理が中断した際に、前記記憶手段に記憶された前記論
理アドレスおよびサイズによって示されるデータストラ
イプの領域に既定値を書き込み、その既定値と、それに
対応する他のデータストライプのデータとから冗長デー
タを再構成して、対応するパリティストライプに書き込
む手段とを具備したことを特徴とする。
That is, the present invention provides a disk array device which realizes disk fault tolerance by redundant data.
Non-volatile storage means for storing at least a logical address and a size when a write request is made until the processing according to the request is completed, and the logic stored in the storage means when the write processing according to the write request is interrupted. A means for writing a default value in the area of the data stripe indicated by the address and size, reconstructing redundant data from the default value and the data of the other corresponding data stripe, and writing the redundant data in the corresponding parity stripe is provided. It is characterized by having done.

【0012】また、本発明は、冗長データによりディス
クの耐障害性を実現したディスクアレイ装置に於いて、
書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで記憶する不
揮発性の記憶手段と、前記書き込み要求に従う書き込み
処理が中断した際に、前記記憶手段に記憶された前記論
理アドレスおよびサイズによって示されるデータストラ
イプのデータ領域に対応するパリティストライプの冗長
データ領域に既定値を書き込み、その既定値と、それに
対応する他のデータストライプのデータとから前記書き
込み処理を中断した領域のデータを再構成して、前記デ
ータストライプの前記データ領域に書き込む手段とを具
備したことを特徴とする。
Also, the present invention provides a disk array device which realizes disk fault tolerance by redundant data,
Non-volatile storage means for storing at least a logical address and a size when a write request is made until the processing according to the request is completed, and the logic stored in the storage means when the write processing according to the write request is interrupted. A default value is written in the redundant data area of the parity stripe corresponding to the data area of the data stripe indicated by the address and size, and the default value and the data of other data stripes corresponding to it are used to write the default value to the area Means for reconstructing data and writing the data in the data area of the data stripe.

【0013】また、本発明は、ストライプグループごと
にもつ冗長データによりディスクの耐障害性を実現した
ディスクアレイ装置に於いて、書き込み要求された時の
少なくとも論理アドレスおよびサイズを当該要求に従う
処理が完了するまで記憶する不揮発性の記憶手段と、前
記書き込み要求に従う書き込み処理が中断した際に、前
記記憶手段に記憶された前記論理アドレスおよびサイズ
によって示されるデータストライプのデータ領域に対応
するパリティストライプの冗長データと、それに対応す
る他のデータストライプのデータとから前記書き込み処
理を中断した領域のデータを復元して、前記データスト
ライプの前記データ領域に書き込む手段とを具備したこ
とを特徴とする。
Further, according to the present invention, in the disk array device which realizes the disk fault tolerance by the redundant data provided for each stripe group, the process of complying with at least the logical address and the size at the time of the write request is completed. And a parity stripe redundancy corresponding to the data area of the data stripe indicated by the logical address and size stored in the storage means when the write processing according to the write request is interrupted. It is characterized by further comprising means for restoring data in an area in which the writing process is interrupted from data and data in another data stripe corresponding thereto and writing the data in the data area of the data stripe.

【0014】[0014]

【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。
BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of the present invention will be described below with reference to the drawings.

【0015】図1は、本発明の実施形態を説明するため
のディスクアレイシステムの構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of a disk array system for explaining an embodiment of the present invention.

【0016】ここでは、ホスト装置10に設けられたR
AIDコントローラ11に、複数のハードディスクドラ
イブ(HDD0,HDD1,HDD2)でなるディスク
アレイ14がRAIDレベル5でSCSIバスを介して
接続されている構成を例に示している。RAIDコント
ローラ11内には、不揮発性メモリ12、およびキャッ
シュ13が設けられている。
Here, R provided in the host device 10
An example is shown in which a disk array 14 including a plurality of hard disk drives (HDD0, HDD1, HDD2) is connected to the AID controller 11 via a SCSI bus at RAID level 5. A non-volatile memory 12 and a cache 13 are provided in the RAID controller 11.

【0017】不揮発性メモリ12には、後述する一貫性
回復処理に於いて参照される、書き込み要求された論理
アドレス範囲(アドレスとサイズ(X,Y))が書き込
み処理完了まで登録される。キャッシュ13には、既存
のシステムと同様に、高速アクセスを実現するために、
ディスクアレイ14より読み出されたデータが一時記憶
される。
In the non-volatile memory 12, the logical address range (address and size (X, Y)) requested to be written, which is referred to in the consistency recovery process described later, is registered until the writing process is completed. In order to realize high-speed access to the cache 13, similar to the existing system,
The data read from the disk array 14 is temporarily stored.

【0018】図2は、上記RAIDコントローラ11に
於いて実行される書き込み処理の動作説明図であり、こ
こでは、論理ドライブのある領域(オフセットX、サイ
ズY)に、書き込み処理が実行される様子を示してい
る。この書き込み処理の際に、そのアクセス範囲を示す
領域(X,Y)が不揮発性メモリ12に登録され、書き
込み完了まで保持される。この不揮発性メモリ12に登
録された領域(X,Y)を用いて、書き込み処理中断後
の再起動時に、後述する一貫性回復処理が実行される。
FIG. 2 is an operation explanatory diagram of the write processing executed in the RAID controller 11. Here, the write processing is executed in an area (offset X, size Y) where the logical drive is located. Is shown. At the time of this writing process, the area (X, Y) indicating the access range is registered in the nonvolatile memory 12 and held until the writing is completed. Using the area (X, Y) registered in the non-volatile memory 12, a consistency recovery process, which will be described later, is executed at the time of restart after the interruption of the write process.

【0019】図3乃至図9は、それぞれ本発明の各実施
形態に於ける一貫性回復処理動作を説明するための動作
説明図およびフローチャートであり、ここでは、説明を
分かり易くするため、1つのパリティグループ(PG)
を2つのデータストライプ(DS)と1つのパリティス
トライプ(PS)で構成し、各実施形態に於いて、それ
ぞれデータストライプ(DS)とパリティストライプ
(PS)とを同一配置で示している。
FIGS. 3 to 9 are operation explanatory views and flowcharts for explaining the consistency recovery processing operation in each embodiment of the present invention, and here, for the sake of simplicity of explanation, one operation is explained. Parity group (PG)
Is composed of two data stripes (DS) and one parity stripe (PS). In each embodiment, the data stripe (DS) and the parity stripe (PS) are shown in the same arrangement.

【0020】このうち、図3および図4は、それぞれ本
発明の第1実施形態による一貫性回復処理動作を説明す
るためのもので、図3は動作説明図、図4は処理手順を
示すフローチャートである。ここでは、書き込み処理中
断後の再起動時に、上記不揮発性メモリ12に登録され
た領域(X,Y)に、既定値(例えば0)を書き込み、
そのデータ領域を含んだデータストライプから、対応す
るパリティを生成し上書きすることによって一貫性回復
を行っている。
Of these, FIGS. 3 and 4 are for explaining the consistency recovery processing operation according to the first embodiment of the present invention. FIG. 3 is an operation explanatory view, and FIG. 4 is a flowchart showing a processing procedure. Is. Here, when restarting after the interruption of the writing process, a default value (for example, 0) is written in the area (X, Y) registered in the nonvolatile memory 12,
Consistency recovery is performed by generating and overwriting the corresponding parity from the data stripe including the data area.

【0021】図5および図6は、それぞれ本発明の第2
実施形態による一貫性回復処理動作を説明するためのも
ので、図5は動作説明図、図6は処理手順を示すフロー
チャートである。ここでは、書き込み処理中断後の再起
動時に、上記不揮発性メモリ12に登録された領域
(X,Y)に対応するパリティ領域に、既定値(例えば
0)を書き込み、このパリティと上記領域(X,Y)以
外の同一ストライプのデータを用いて上記領域(X,
Y)のデータを再構成することによって一貫性回復を行
っている。
FIG. 5 and FIG. 6 respectively show the second aspect of the present invention.
FIG. 5 is an operation explanatory diagram and FIG. 6 is a flowchart showing a processing procedure for explaining the consistency recovery processing operation according to the embodiment. Here, when restarting after the interruption of the writing process, a default value (for example, 0) is written in the parity area corresponding to the area (X, Y) registered in the non-volatile memory 12, and this parity and the area (X , Y) using the same stripe data other than the above area (X,
Consistency recovery is performed by reconstructing the data in Y).

【0022】図7および図8は、それぞれ本発明の第3
実施形態による一貫性回復処理動作を説明するためのも
ので、図7は動作説明図、図8は処理手順を示すフロー
チャートである。ここでは、書き込み処理中断後の再起
動時に、上記不揮発性メモリ12に登録された領域
(X,Y)に、対応するパリティグループの他のストラ
イプから生成したデータを上書きすることによって一貫
性回復を行っている。
FIG. 7 and FIG. 8 respectively show a third embodiment of the present invention.
FIG. 7 is an operation explanatory diagram and FIG. 8 is a flowchart showing a processing procedure for explaining the consistency recovery processing operation according to the embodiment. Here, at the time of restarting after the interruption of the write processing, the consistency recovery is performed by overwriting the area (X, Y) registered in the nonvolatile memory 12 with the data generated from the other stripe of the corresponding parity group. Is going.

【0023】図9は、本発明の第4実施形態による一貫
性回復処理の動作説明図であり、ここでは、書き込み処
理中断後の再起動時に、上記不揮発性メモリ12に登録
された領域(X,Y)が2つのデータストライプにまた
がった場合、各パリティグループ毎に、それぞれ上記不
揮発性メモリ12に登録された領域(X,Y)のデータ
を別個に生成しそれぞれ上書きすることによって一貫性
回復を行っている。
FIG. 9 is a diagram for explaining the operation of the consistency recovery process according to the fourth embodiment of the present invention. Here, at the time of restarting after the interruption of the write process, the area (X , Y) straddles two data stripes, the data in the areas (X, Y) registered in the non-volatile memory 12 is separately generated for each parity group, and the consistency is restored by overwriting the data. It is carried out.

【0024】ここで、上記各図を参照して本発明の実施
形態に於ける動作を説明する。
Now, the operation of the embodiment of the present invention will be described with reference to the drawings.

【0025】ホスト装置10の制御の下にRAIDコン
トローラ11が論理ドライブのある領域(オフセット
X、サイズY)の領域に、書き込み処理を実行する際の
処理手順を以下に示す。
Under the control of the host device 10, the processing procedure when the RAID controller 11 executes the writing process in the area of the logical drive (offset X, size Y) is shown below.

【0026】a.書き込み要求された論理アドレスとサ
イズ(X,Y)を不揮発性メモリ12に登録する。
A. The write-requested logical address and size (X, Y) are registered in the nonvolatile memory 12.

【0027】b.更新するデータに対応するパリティ
(P)を生成する。
B. A parity (P) corresponding to the data to be updated is generated.

【0028】c.データ(D)とパリティ(P)をディ
スクアレイ14のディスクドライブに書き込む。
C. The data (D) and the parity (P) are written in the disk drive of the disk array 14.

【0029】d.書き込み処理が完了したら不揮発性メ
モリ12上の登録(X,Y)を抹消する。
D. When the writing process is completed, the registration (X, Y) on the non-volatile memory 12 is deleted.

【0030】RAID5の論理ドライブでは、データの
更新を行うとともに、対応するパリティデータも更新す
る必要があるため、書き込むべき領域は、データ領域と
パリティ領域である。
In the RAID 5 logical drive, since it is necessary to update the data and the corresponding parity data, the areas to be written are the data area and the parity area.

【0031】ここで、データまたはパリティの書き込み
が完了する前に、例えばRAIDコントローラ11が電
源供給を失って処理が停止したとする。
Here, it is assumed that the RAID controller 11 loses power supply and the processing is stopped before the writing of data or parity is completed.

【0032】この状態では、書き込みを中断したパリテ
ィグループに関して、冗長データの一貫性がとれなくな
っているため、次に、RAIDコントローラ11への電
源供給が再開されたときに、該当するパリティグループ
の一貫性を復元する。
In this state, the redundancy data becomes inconsistent with respect to the parity group for which writing has been interrupted. Therefore, when the power supply to the RAID controller 11 is restarted next, the consistency of the corresponding parity group is resumed. Restore sex.

【0033】即ち、本発明の実施形態に於いては、書き
込み処理中断後の再起動時に於いて、不揮発性メモリ1
2に登録された論理アドレス/サイズ(X,Y)を用い
て、書き込み(上書き)処理を伴う一貫性回復処理を実
行し、この際の書き込み(上書き)処理によって、以後
のアクセス時に於ける、メディアエラーを確実に排除
し、更に再起動後に於ける書き込み処理の際の、既存シ
ステムで行われる無駄な一時的冗長データの一貫性回復
処理を回避している。
In other words, according to the embodiment of the present invention, the nonvolatile memory 1 is used when restarting after the interruption of the writing process.
By using the logical address / size (X, Y) registered in No. 2, the consistency recovery process accompanied by the write (overwrite) process is executed, and the write (overwrite) process at this time causes the subsequent access, It reliably eliminates media errors, and avoids useless temporary redundancy data consistency recovery processing that is performed in existing systems when writing data after a reboot.

【0034】以下に、本発明の各実施形態に於ける一貫
性回復処理動作を図3乃至図9を参照して説明する。
The consistency recovery processing operation in each embodiment of the present invention will be described below with reference to FIGS. 3 to 9.

【0035】(第1の実施形態)先ず、図3および図4
を参照して、本発明の第1の実施形態に於ける一貫性回
復処理動作を説明する。
(First Embodiment) First, FIG. 3 and FIG.
The consistency recovery processing operation in the first embodiment of the present invention will be described with reference to FIG.

【0036】システム起動時に於いて、不揮発性メモリ
12をアクセスし、書き込みが中断したディスクI/O
があるか否かを判断する(図4ステップS11)。書き
込み処理中断後の再起動時に於いては、不揮発性メモリ
12に書き込み処理中断時の領域(X,Y)が登録され
ていることから、書き込みの中断があったことを判定で
きる(図4ステップS11 YES)。
At the time of system startup, the non-volatile memory 12 is accessed and the disk I / O for which writing has been interrupted
It is determined whether there is any (step S11 in FIG. 4). At the time of restarting after the interruption of the writing process, since the area (X, Y) at the time of the interruption of the writing process is registered in the non-volatile memory 12, it is possible to determine that the writing has been interrupted (FIG. 4 step). S11 YES).

【0037】この際は、上記不揮発性メモリ12に登録
された領域(X,Y)が示すデータストライプのデータ
領域に、既定値(例えば0)を書き込む(図4ステップ
S12a)。そして、そのデータ領域の既定値(0)
と、そのデータ領域に対応する同一パリティグループ
(PG)内の各データストライプ(DS)のデータとを
読み出して、対応するパリティ(P)を生成する。その
生成されたパリティ(P)をパリティストライプ(P
S)の対応するパリティ領域に書き込む(図4ステップ
S12b)。この再構成の書き込み処理が完了に伴い不
揮発性メモリ12に登録された領域(X,Y)の値を抹
消する(図4ステップS13)。これによって一貫性回
復処理が終了する。
At this time, a default value (for example, 0) is written in the data area of the data stripe indicated by the area (X, Y) registered in the nonvolatile memory 12 (step S12a in FIG. 4). And the default value (0) of the data area
And the data of each data stripe (DS) in the same parity group (PG) corresponding to the data area are read to generate the corresponding parity (P). The generated parity (P) is set to the parity stripe (P
S) is written in the corresponding parity area (step S12b in FIG. 4). The value of the area (X, Y) registered in the non-volatile memory 12 is erased upon completion of this reconfiguration writing process (step S13 in FIG. 4). This ends the consistency recovery process.

【0038】(第2の実施形態)次に、図5および図6
を参照して、本発明の第2の実施形態に於ける一貫性回
復処理動作を説明する。
(Second Embodiment) Next, FIG. 5 and FIG.
The consistency recovery processing operation in the second embodiment of the present invention will be described with reference to FIG.

【0039】書き込み処理中断後の再起動時に於いて
(図6ステップS21 YES)、上記不揮発性メモリ
12に登録された領域(X,Y)によって示されるデー
タストライプ(D)のデータに対応するパリティストラ
イプのパリティ領域に既定値(例えば0)を書き込む
(図6ステップS22a)。このパリティ領域の既定値
(0)と、これに対応する同一パリティグループ(P
G)内の他のデータストライプ(DS)のデータとを読
み出し、上記データストライプ(D)のデータを再構成
して、データ領域(X,Y)に書き込む(図6ステップ
S22b)。この再構成の書き込み処理が完了に伴い不
揮発性メモリ12に登録された領域(X,Y)の値を抹
消する(図6ステップS23)。これによって一貫性回
復処理が終了する。
At the time of restart after the interruption of the writing process (step S21 YES in FIG. 6), the parity corresponding to the data of the data stripe (D) indicated by the area (X, Y) registered in the nonvolatile memory 12 is written. A default value (for example, 0) is written in the parity area of the stripe (step S22a in FIG. 6). The default value (0) of this parity area and the same parity group (P
The data of the other data stripe (DS) in G) is read, the data of the data stripe (D) is reconstructed, and the data is written in the data area (X, Y) (step S22b in FIG. 6). Upon completion of this reconfiguration writing process, the value of the area (X, Y) registered in the non-volatile memory 12 is deleted (step S23 in FIG. 6). This ends the consistency recovery process.

【0040】(第3の実施形態)次に、図7および図8
を参照して、本発明の第3の実施形態に於ける一貫性回
復処理動作を説明する。
(Third Embodiment) Next, FIG. 7 and FIG.
The consistency recovery processing operation in the third embodiment of the present invention will be described with reference to FIG.

【0041】書き込み処理中断後の再起動時に於いて
(図8ステップS31 YES)、上記不揮発性メモリ
12に登録された領域(X,Y)によって示されるデー
タストパイプのデータに対応する同じパリティグループ
(PG)のパリティストライプのパリティ領域からパリ
ティ、および他のデータストライプのデータ領域からデ
ータを読み出し、データを復元する。その復元されたデ
ータを領域(X,Y)で示すデータストライプのデータ
領域に書き込み復元処理を完了する(図8ステップS3
2)。この再構成の書き込み処理が完了に伴い不揮発性
メモリ12に登録された領域(X,Y)の値を抹消する
(図8ステップS33)。これによって一貫性回復処理
が終了する。
At the time of restarting after the interruption of the writing process (step S31 YES in FIG. 8), the same parity group corresponding to the data of the data storage pipe indicated by the area (X, Y) registered in the nonvolatile memory 12 above. The parity is read from the parity area of the (PG) parity stripe and the data is read from the data area of another data stripe to restore the data. The restored data is written into the data area of the data stripe indicated by the area (X, Y) and the restoration processing is completed (step S3 in FIG. 8).
2). The value of the area (X, Y) registered in the non-volatile memory 12 is erased upon completion of this reconfiguration writing process (step S33 in FIG. 8). This ends the consistency recovery process.

【0042】(第4の実施形態)次に、図9を参照し
て、本発明の第4の実施形態に於ける一貫性回復処理動
作を説明する。
(Fourth Embodiment) Next, the consistency recovery processing operation in the fourth embodiment of the present invention will be described with reference to FIG.

【0043】この図9に示すデータ再構成は、上記不揮
発性メモリ12に登録された領域が複数のデータストラ
イプ(DS)にまたがった場合の一貫性回復処理例を示
している。不揮発性メモリ12に登録された領域(X,
Y)が複数のデータストライプ(ディスクドライブ)に
またがる範囲であるときは、書き込みアクセス範囲をス
トライプ境界で分割し、第3の実施形態の処理と同じ方
法により、ステップ1では、第1のデータストライプ
(DS)に対応するパリティおよびデータから第1のデ
ータ(D)を復元して、領域(X,Y)で指定される一
方のドライブの領域に書き込む。次にステップ2では、
第2のデータストライプ(DS)に対応するパリティお
よびデータからデータ(D)を復元して、領域(X,
Y)で指定される他のドライブの領域に書き込む。こう
して、上記ディスクドライブをまたがる領域(X,Y)
の各書き込みデータを復元する。なお、この第4の実施
形態では第3の実施形態の復元処理を適用したが、上述
した第1、第2の実施形態も同様に適用する事ができ
る。
The data reconstruction shown in FIG. 9 shows an example of the consistency recovery processing when the area registered in the non-volatile memory 12 extends over a plurality of data stripes (DS). The area (X,
When Y) is a range that spans a plurality of data stripes (disk drives), the write access range is divided at stripe boundaries, and in the same method as in the third embodiment, in step 1, the first data stripe The first data (D) is restored from the parity and data corresponding to (DS), and written in the area of one drive designated by the area (X, Y). Then in step 2,
The data (D) is restored from the parity and the data corresponding to the second data stripe (DS), and the area (X,
Write to the area of another drive specified in Y). In this way, the area (X, Y) that straddles the disk drive
Restore each write data of. In addition, although the restoration processing of the third embodiment is applied in the fourth embodiment, the first and second embodiments described above can be applied similarly.

【0044】上記したように、本発明の各実施形態によ
れば、書き込み処理中断後の再起動時に於いて、不揮発
性メモリ12に登録された少なくとも論理アドレス/サ
イズ(X,Y)を用いて、書き込み(上書き)処理を伴
う一貫性回復処理を実行し、この際の書き込み(上書
き)処理によって、以後のアクセス時に於ける、メディ
アエラーを確実に排除し、更に再起動後に於ける書き込
み処理の際の、既存システムで行われる無駄な一時的冗
長データの一貫性回復処理を回避している。これにより
書き込み途中での処理中断に伴うメディアエラーを確実
に回避して再起動後に於ける円滑な処理が期待できる
As described above, according to the embodiments of the present invention, at least the logical address / size (X, Y) registered in the non-volatile memory 12 is used at the time of restart after the interruption of the writing process. , Consistency recovery processing with write (overwrite) processing is executed, and by this write (overwrite) processing, media errors are reliably eliminated during subsequent access, and write processing after restart is performed. In this case, the wasteful recovery process of the temporary redundant data in the existing system is avoided. As a result, it is possible to reliably avoid media errors due to processing interruption during writing and expect smooth processing after restarting.

【0045】[0045]

【発明の効果】以上詳記したように本発明によれば、書
き込み途中での処理中断に伴うメディアエラーを確実に
回避して再起動後に於ける円滑な処理が期待できる。
As described above in detail, according to the present invention, it is possible to surely avoid a media error due to interruption of processing during writing and to expect smooth processing after restarting.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施形態を説明するためのディスクア
レイシステムの構成を示すブロック図。
FIG. 1 is a block diagram showing the configuration of a disk array system for explaining an embodiment of the present invention.

【図2】上記実施形態に於けるRAIDコントローラの
書き込み処理動作を説明する動作説明図。
FIG. 2 is an operation explanatory diagram illustrating a write processing operation of the RAID controller in the above embodiment.

【図3】本発明の第1の実施形態に於ける一貫性回復処
理の動作説明図。
FIG. 3 is an operation explanatory diagram of the consistency recovery processing according to the first embodiment of the present invention.

【図4】本発明の第1の実施形態に於ける一貫性回復処
理の手順を示すフローチャート。
FIG. 4 is a flowchart showing a procedure of consistency recovery processing according to the first embodiment of the present invention.

【図5】本発明の第2の実施形態に於ける一貫性回復処
理の動作説明図。
FIG. 5 is an operation explanatory diagram of the consistency recovery processing according to the second embodiment of the present invention.

【図6】本発明の第2の実施形態に於ける一貫性回復処
理の手順を示すフローチャート。
FIG. 6 is a flowchart showing a procedure of consistency recovery processing according to the second embodiment of the present invention.

【図7】本発明の第3の実施形態に於ける一貫性回復処
理の動作説明図。
FIG. 7 is an operation explanatory diagram of consistency recovery processing according to the third embodiment of the present invention.

【図8】本発明の第3の実施形態に於ける一貫性回復処
理の手順を示すフローチャート。
FIG. 8 is a flowchart showing a procedure of consistency recovery processing according to the third embodiment of the present invention.

【図9】本発明の第4の実施形態に於ける一貫性回復処
理の動作説明図。
FIG. 9 is an operation explanatory diagram of the consistency recovery processing according to the fourth embodiment of the present invention.

【符号の説明】[Explanation of symbols]

10…ホスト装置 11…RAIDコントローラ 12…不揮発性メモリ 13…キャッシュ(キャッシュメモリ) 14…ディスクアレイ PG…パリティグループ DS…データストライプ PS…パリティストライプ 10 ... Host device 11 ... RAID controller 12 ... Nonvolatile memory 13 ... Cache (cache memory) 14 ... Disk array PG ... parity group DS ... Data stripe PS: Parity stripe

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 冗長データによりディスクの耐障害性を
実現したディスクアレイ装置に於いて、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで記憶する不
揮発性の記憶手段と、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプの領域に既定値を
書き込み、その既定値と、それに対応する他のデータス
トライプのデータとから冗長データを再構成して、対応
するパリティストライプに書き込む手段とを具備したこ
とを特徴とするディスクアレイ装置。
1. A non-volatile storage means for storing at least a logical address and a size when a write request is made until the processing according to the request is completed in a disk array device which realizes disk fault tolerance by redundant data. And when the write process according to the write request is interrupted,
A default value is written in the area of the data stripe indicated by the logical address and the size stored in the storage means, and redundant data is reconfigured from the default value and the data of another data stripe corresponding to the default value, and the corresponding And a means for writing to the parity stripe.
【請求項2】 冗長データによりディスクの耐障害性を
実現したディスクアレイ装置に於いて、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで記憶する不
揮発性の記憶手段と、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプのデータ領域に対
応するパリティストライプの冗長データ領域に既定値を
書き込み、その既定値と、それに対応する他のデータス
トライプのデータとから前記書き込み処理を中断した領
域のデータを再構成して、前記データストライプの前記
データ領域に書き込む手段とを具備したことを特徴とす
るディスクアレイ装置。
2. A non-volatile storage means for storing at least a logical address and a size when a write request is made until the processing according to the request is completed in a disk array device which realizes disk fault tolerance by redundant data. And when the write process according to the write request is interrupted,
A default value is written in the redundant data area of the parity stripe corresponding to the data area of the data stripe indicated by the logical address and size stored in the storage means, and the default value and the data of other data stripes corresponding thereto are written. And a means for reconstructing data in an area in which the write processing is interrupted and writing the data in the data area of the data stripe.
【請求項3】 ストライプグループごとにもつ冗長デー
タによりディスクの耐障害性を実現したディスクアレイ
装置に於いて、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで記憶する不
揮発性の記憶手段と、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプのデータ領域に対
応するパリティストライプの冗長データと、それに対応
する他のデータストライプのデータとから前記書き込み
処理を中断した領域のデータを復元して、前記データス
トライプの前記データ領域に書き込む手段とを具備した
ことを特徴とするディスクアレイ装置。
3. In a disk array device that realizes disk fault tolerance by redundant data for each stripe group, at least a logical address and size when a write request is made are stored until the processing according to the request is completed. Non-volatile storage means, when the writing process according to the write request is interrupted,
Data in the area in which the writing process is interrupted from redundant data of the parity stripe corresponding to the data area of the data stripe indicated by the logical address and size stored in the storage means and data of other corresponding data stripes And a unit that restores the data and writes the data in the data area of the data stripe.
【請求項4】 前記論理アドレスおよびサイズによって
示されるデータストライプのデータ領域が複数のデータ
ストライプ領域に跨っている場合、各データストライプ
毎に分けて、前記データまたは前記冗長データの再構成
を行うことを特徴とする請求項1または2または3記載
のディスクアレイ装置。
4. When the data area of the data stripe indicated by the logical address and size extends over a plurality of data stripe areas, the data or the redundant data is reconstructed separately for each data stripe. 4. The disk array device according to claim 1, 2 or 3.
【請求項5】 複数の物理ドライブから構成され、スト
ライプグループごとに冗長データをもつことにより耐障
害機能を実現した論理ドライブの一貫性回復方法に於い
て、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで不揮発性の
記憶手段に記憶させ、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプの領域に既定値を
書き込み、 その既定値と、それに対応する他のデータストライプの
データとから冗長データを再構成して、対応するパリテ
ィストライプに書き込むことを特徴とする論理ドライブ
の一貫性回復方法。
5. A consistency recovery method for a logical drive comprising a plurality of physical drives and having a fault-tolerant function by having redundant data for each stripe group, wherein at least a logical address at the time of a write request and a logical address The size is stored in the nonvolatile storage means until the process according to the request is completed, and when the write process according to the write request is interrupted,
A default value is written in the area of the data stripe indicated by the logical address and size stored in the storage means, and redundant data is reconfigured from the default value and the data of other data stripes corresponding to the default value, and the corresponding Consistency recovery method of logical drive characterized by writing to parity stripe.
【請求項6】 複数の物理ドライブから構成され、スト
ライプグループごとに冗長データをもつことにより耐障
害機能を実現した論理ドライブの一貫性回復方法に於い
て、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで不揮発性の
記憶手段に記憶させ、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプのデータ領域に対
応するパリティストライプの冗長データ領域に既定値を
書き込み、 その既定値と、それに対応する他のデータストライプの
データとから前記書き込み処理を中断した領域のデータ
を再構成して、前記データストライプの前記データ領域
に書き込むことを特徴とする冗長データをもつ論理ドラ
イブの一貫性回復方法。
6. A consistency recovery method for a logical drive comprising a plurality of physical drives and realizing a fault tolerance function by having redundant data for each stripe group, and at least a logical address when a write request is made and The size is stored in the nonvolatile storage means until the process according to the request is completed, and when the write process according to the write request is interrupted,
A default value is written in the redundant data area of the parity stripe corresponding to the data area of the data stripe indicated by the logical address and size stored in the storage means, and the default value and the data of other data stripes corresponding thereto are written. A method of recovering a consistency of a logical drive having redundant data, comprising reconstructing data in an area in which the write processing is interrupted and writing the data in the data area of the data stripe.
【請求項7】 複数の物理ドライブから構成され、スト
ライプグループごとに冗長データをもつことにより耐障
害機能を実現した論理ドライブの一貫性回復方法に於い
て、 書き込み要求された時の少なくとも論理アドレスおよび
サイズを当該要求に従う処理が完了するまで不揮発性の
記憶手段に記憶させ、 前記書き込み要求に従う書き込み処理が中断した際に、
前記記憶手段に記憶された前記論理アドレスおよびサイ
ズによって示されるデータストライプのデータ領域に対
応するパリティストライプの冗長データと、それに対応
する他のデータストライプのデータとから前記書き込み
処理を中断した領域のデータを復元して、前記データス
トライプの前記データ領域に書き込むことを特徴とする
冗長データをもつ論理ドライブの一貫性回復方法。
7. A consistency recovery method of a logical drive comprising a plurality of physical drives and having a fault tolerance function by having redundant data for each stripe group, wherein at least a logical address and a logical address when a write request is made are provided. The size is stored in the nonvolatile storage means until the process according to the request is completed, and when the write process according to the write request is interrupted,
Data in the area in which the writing process is interrupted from redundant data of the parity stripe corresponding to the data area of the data stripe indicated by the logical address and size stored in the storage means and data of other corresponding data stripes Is restored and written in the data area of the data stripe.
【請求項8】 前記論理アドレスおよびサイズによって
示されるデータストライプのデータ領域が複数のデータ
ストライプ領域に跨っている場合、各データストライプ
毎に分けて、前記データまたは前記冗長データの再構成
を行うことを特徴とする請求項5または6または7記載
の一貫性回復方法。
8. When the data area of the data stripe indicated by the logical address and the size extends over a plurality of data stripe areas, the data or the redundant data is reconstructed separately for each data stripe. 8. The consistency recovery method according to claim 5, 6 or 7.
JP2001367242A 2001-11-30 2001-11-30 Disk array device and method of restoring consistency of logical drive having redundant data Expired - Fee Related JP3590015B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001367242A JP3590015B2 (en) 2001-11-30 2001-11-30 Disk array device and method of restoring consistency of logical drive having redundant data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001367242A JP3590015B2 (en) 2001-11-30 2001-11-30 Disk array device and method of restoring consistency of logical drive having redundant data

Publications (2)

Publication Number Publication Date
JP2003167688A true JP2003167688A (en) 2003-06-13
JP3590015B2 JP3590015B2 (en) 2004-11-17

Family

ID=19177020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001367242A Expired - Fee Related JP3590015B2 (en) 2001-11-30 2001-11-30 Disk array device and method of restoring consistency of logical drive having redundant data

Country Status (1)

Country Link
JP (1) JP3590015B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514047A (en) * 2003-06-28 2009-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション Apparatus and method for secure writing to multiplexed redundant storage
US8015435B2 (en) 2008-03-13 2011-09-06 Fujitsu Limited Data writing method
US8225136B2 (en) 2008-06-13 2012-07-17 Fujitsu Limited Control method and storage device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514047A (en) * 2003-06-28 2009-04-02 インターナショナル・ビジネス・マシーンズ・コーポレーション Apparatus and method for secure writing to multiplexed redundant storage
JP4848272B2 (en) * 2003-06-28 2011-12-28 インターナショナル・ビジネス・マシーンズ・コーポレーション Apparatus and method for secure writing to multiplexed redundant storage
US8015435B2 (en) 2008-03-13 2011-09-06 Fujitsu Limited Data writing method
US8225136B2 (en) 2008-06-13 2012-07-17 Fujitsu Limited Control method and storage device

Also Published As

Publication number Publication date
JP3590015B2 (en) 2004-11-17

Similar Documents

Publication Publication Date Title
US6990611B2 (en) Recovering data from arrays of storage devices after certain failures
AU710907B2 (en) Expansion of the number of drives in a raid set while maintaining integrity of migrated data
US7721143B2 (en) Method for reducing rebuild time on a RAID device
US6728898B2 (en) Producing a mirrored copy using incremental-divergence
US7627729B2 (en) Apparatus, system, and method for an improved synchronous mirror swap
US6883112B2 (en) Storage device, backup and fault tolerant redundant method and computer program code of plurality storage devices
US6606683B2 (en) Information recording apparatus and control method thereof
JPH04205519A (en) Writing method of data under restoration
US7620786B2 (en) Storage recovery using a delta log
US20050246576A1 (en) Redundant system utilizing remote disk mirroring technique, and initialization method for remote disk mirroring for in the system
JP2001344076A (en) Disk array device
US20090177916A1 (en) Storage system, controller of storage system, control method of storage system
JP4248164B2 (en) Disk array error recovery method, disk array control device, and disk array device
JP2857288B2 (en) Disk array device
JP2010026812A (en) Magnetic disk device
JP3590015B2 (en) Disk array device and method of restoring consistency of logical drive having redundant data
JP4398596B2 (en) Disk array device
JP5644795B2 (en) Storage device, data recovery method and program
JP2005107675A (en) Disk array controller and method for duplicating disk drive
JPH07306758A (en) Disk array device and its control method
JP3790756B2 (en) Disk array device, disk controller, and method for recovering data failure in disk array
JP5598124B2 (en) DATA RECORDING / REPRODUCING DEVICE, DATA RECORDING METHOD, AND DATA RECORDING PROGRAM
JP2006277042A (en) Array controller, disk array control method, and program
JPH10240620A (en) Computer system and check point image preservation method in the system
JPH07141240A (en) Fault recovery system for doubled media

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040810

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040818

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070827

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080827

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees