JP2009104369A - Disk sub-system - Google Patents

Disk sub-system Download PDF

Info

Publication number
JP2009104369A
JP2009104369A JP2007274963A JP2007274963A JP2009104369A JP 2009104369 A JP2009104369 A JP 2009104369A JP 2007274963 A JP2007274963 A JP 2007274963A JP 2007274963 A JP2007274963 A JP 2007274963A JP 2009104369 A JP2009104369 A JP 2009104369A
Authority
JP
Japan
Prior art keywords
data
disk
disk drive
area
copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007274963A
Other languages
Japanese (ja)
Inventor
Masaru Sugawara
賢 菅原
Gosuke Sato
剛介 佐藤
Takashi Takeuchi
崇 竹内
Katsuaki Muramatsu
克昭 村松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2007274963A priority Critical patent/JP2009104369A/en
Publication of JP2009104369A publication Critical patent/JP2009104369A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To dispense with any spare disk in a conventional RAID configuration, and to prevent data lost by restoring original data even when failure occurs in a plurality of disk drives. <P>SOLUTION: In a plurality of disk drives of RAID configurations, a data region for writing and reading normal data and a spare region for writing and reading data as the alternate of the data region are specified. When the necessity of the copy of the data region of a certain disk drive is generated, the data of the data region of the first disk drive are automatically copied to the spare region of the other disk drive according to the circumstances of the failure of the plurality of disk drives. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、ディスクサブシステムに係り、特にディスクアレイから成るディスクサブシステムにおいてディスクドライブに故障が発生した場合のデータロストの低減に関する。   The present invention relates to a disk subsystem, and more particularly to reduction of data lost when a failure occurs in a disk drive in a disk subsystem comprising a disk array.

RAID構成によるディスクサブシステムは、パリティディスクを備えており、RAID構成下の1台のディスクドライブに故障が発生した場合には、パリティディスクを用いてデータ修復することできる。しかし、複数台のディスクドライブが故障した場合にはエラー修復が出来ないため、データロストが起きる。   A disk subsystem with a RAID configuration includes a parity disk, and when a failure occurs in one disk drive under the RAID configuration, data can be restored using the parity disk. However, if a plurality of disk drives fail, the error cannot be repaired and data loss occurs.

特許文献1(特開2005−122338公報)には、スペアディスクを持つRAID構成のディスクアレイにおいて、ディスクドライブ毎に故障発生の可能性を推測して、故障発生の可能性の高いディスクドライブからスペアディスクにデータを自動的にコピーすることで、多重ディスクの故障によるデータロストを低減する技術が開示されている。
また、レガシーシステムにおいてはシステムが使用するディスクドライブの領域に制限がある場合も珍しくなく、ディスクドライブの記憶容量の増大に応じて未使用領域も増大する傾向にある。
In Patent Document 1 (Japanese Patent Laid-Open No. 2005-122338), in a RAID-structured disk array having spare disks, the possibility of occurrence of a failure is estimated for each disk drive, and a spare from a disk drive having a high possibility of occurrence of failure A technique for reducing data lost due to failure of multiple disks by automatically copying data to the disk is disclosed.
In legacy systems, it is not uncommon for the area of a disk drive used by the system to be limited, and the unused area tends to increase as the storage capacity of the disk drive increases.

特開2005−122338公報JP 2005-122338 A

上記従来技術のような、スペアディスクを持つディスクサブシステムにおいて複数台のディスクドライブに故障が発生した場合でも継続的に稼動させるためには、スペアディスクが必要となるためハードウェアのコストが上がる。またスペアディスクにデータを退避する場合、通常のユーザー業務に影響を及ぼす可能性がある。   In the disk subsystem having the spare disk as in the above-described prior art, in order to continuously operate even when a plurality of disk drives fail, a spare disk is required, so that the hardware cost increases. In addition, when data is saved to a spare disk, normal user operations may be affected.

本発明の目的は、従来のRAID構成におけるスペアディスクを不要とし、RAID構成のディスクドライブに定義したスペア領域にデータをコピーすることで、ディスクドライブに故障が発生した場合に当該コピーデータを用いて元のデータを修復してデータロストを低減することにある。   An object of the present invention is to eliminate the need for a spare disk in a conventional RAID configuration, and to copy data to a spare area defined in a disk drive in a RAID configuration, so that the copy data is used when a failure occurs in the disk drive. The original data is restored to reduce data loss.

本発明によるディスクサブシステムは、RAID構成の複数のディスクドライブと、該ディスクドライブ群にデータを書き込み及び読み出すための制御を行う処理手段と、を有するディスクサブシステムにおいて、
前記複数のディスクドライブに、通常のデータを書き込み及び読み出すデータ領域と、該データ領域の代替としてデータを書き込み及び読み出すスペア領域とを規定し、
複数の該ディスクドライブの状態を管理する管理手段と、該管理手段によるディスクドライブの状態から、あるディスクドライブ(第1ディスクドライブ)の該データ領域のコピーの必要が生じた場合、該第1ディスクドライブの該データ領域のデータを、他のディスクドライブ(第2ディスクドライブ)の該スペア領域に自動的にコピーするコピー実行手段と、を有することを特徴とするディスクサブシステムとして構成される。
A disk subsystem according to the present invention is a disk subsystem having a plurality of disk drives with a RAID configuration and processing means for performing control for writing and reading data to and from the disk drive group.
A data area for writing and reading normal data to the plurality of disk drives, and a spare area for writing and reading data as an alternative to the data area,
A managing means for managing the states of the plurality of disk drives, and when the data area of a certain disk drive (first disk drive) needs to be copied from the state of the disk drives by the managing means, the first disk Copy execution means for automatically copying the data in the data area of the drive to the spare area of another disk drive (second disk drive) is configured as a disk subsystem.

好ましい例では、前記ディスクドライブ群は、ミラー構成の正副の複数のディスクドライブから成り、かつ各ディスクドライブには前記データ領域及びスペア領域が形成され、前記管理手段は、ペア関係にあるディスクドライブの一方が不良な状態(閉塞ディスク)を示す第1のフラグと、ペア関係にあるディスクドライブにおけるデータの更新の必要性を示す第2のフラグと、を管理する管理テーブルをメモリに保持して管理し、前記コピー実行手段は、該管理テーブルを参照して、前記第1ディスクドライブの該データ領域から前記第2ディスクドライブの該スペア領域にデータコピーする。   In a preferred example, the disk drive group includes a plurality of primary and secondary disk drives in a mirror configuration, and the data area and the spare area are formed in each disk drive, and the management means includes a pair of disk drives. A management table for managing the first flag indicating one of the defective states (blocked disk) and the second flag indicating the necessity of updating data in the paired disk drive is held in the memory and managed. The copy execution means refers to the management table and copies data from the data area of the first disk drive to the spare area of the second disk drive.

また、好ましくは、前記コピー実行手段は、前記管理テーブルの前記第1のフラグの値に応じて、電源切断時に一括してデータコピーを行う第1のデータコピーモードか、又は電源切断時ではなく、前記第2のフラグに応じて、前記第1ディスクドライブの該データ領域内のデータをブロック単位に前記第2ディスクドライブの該スペア領域にコピーする第2のデータコピーモードを実施する。   Preferably, the copy execution means is in a first data copy mode in which data copy is performed in a lump when power is turned off, or not when power is turned off, according to the value of the first flag in the management table. In response to the second flag, a second data copy mode is implemented in which data in the data area of the first disk drive is copied to the spare area of the second disk drive in block units.

また、好ましくは、前記スペア領域の容量は、前記データ領域と等しいかそれよりも大きい。   Preferably, the capacity of the spare area is equal to or larger than that of the data area.

本発明によれば、従来のRAID構成におけるスペアディスクを不要とし、RAID構成のディスクドライブの記憶領域をスペア領域として利用してデータコピーしておくことができる。ディスクドライブに故障が発生した場合に、スペア領域にコピーされたデータを使用して元のデータを修復してデータロストを低減することができる。   According to the present invention, a spare disk in a conventional RAID configuration is not required, and data can be copied using a storage area of a disk drive having a RAID configuration as a spare area. When a failure occurs in the disk drive, the data lost can be reduced by restoring the original data using the data copied to the spare area.

以下、図面を参照して、好ましい一実施例について説明する。
図1は、RAID構成のディスクサブシステムの例を示す。
ディスクサブシステム1は、関係する種々のプログラムを実行して、ディスクに対するデータの読み書きに伴うデータ処理を行うCPU3と、メモリ21内に保持されるディスク制御のためのディスク制御コントロールウェア(C/Wと記す)4と、本発明に関係するスペア領域に対するデータのコピー制御を行う自動データコピープログラム5、データキャッシュ6と、不揮発メモリ22内に保持されるディスク稼動状況管理テーブル7、SCSIコントローラ9、及びSCSIバス91を介して接続されるディスクドライブ群8を有して構成される。ディスクサブシステム1はメインバス11を介してホストシステム(以下単にホストという)10に接続される。
A preferred embodiment will be described below with reference to the drawings.
FIG. 1 shows an example of a disk subsystem having a RAID configuration.
The disk subsystem 1 executes various related programs to perform data processing accompanying data reading / writing on the disk, and disk control controlware (C / W) for disk control held in the memory 21. 4), an automatic data copy program 5 for performing data copy control on a spare area related to the present invention, a data cache 6, a disk operation status management table 7 held in the nonvolatile memory 22, a SCSI controller 9, And a disk drive group 8 connected via a SCSI bus 91. The disk subsystem 1 is connected to a host system (hereinafter simply referred to as a host) 10 via a main bus 11.

ディスクドライブ群8は、複数のディスクドライブ100〜105を有するRAID構成を成し、各ディスクドライブはSCSIバス91を介してSCSIコントローラ9に接続される。ここで、ディスクドライブ100と103、101と104、102と105は、それぞれペアにしてミラー構成を成している。   The disk drive group 8 has a RAID configuration including a plurality of disk drives 100 to 105, and each disk drive is connected to the SCSI controller 9 via the SCSI bus 91. Here, the disk drives 100 and 103, 101 and 104, and 102 and 105 are paired to form a mirror configuration.

各ディスクドライブ100〜105の記憶領域は、データ領域A(例えば100A)とスペア領域B(例えば100B)に分割されている。記憶容量はスペア領域≧データ領域の関係である。データ領域Aは、ホスト10の処理データを記憶し、スペア領域Bはデータ領域Aが故障によって使用できない場合、それに代わって処理データを記憶する。   The storage area of each of the disk drives 100 to 105 is divided into a data area A (for example, 100A) and a spare area B (for example, 100B). The storage capacity has a relation of spare area ≧ data area. The data area A stores the processing data of the host 10, and the spare area B stores the processing data instead when the data area A cannot be used due to a failure.

ディスク制御C/W4は、ホスト10の指示により必要に応じてディスクドライブ群8の各ディスクドライブのデータ領域又はスペア領域に記録されたデータを読み又はその領域にデータを書き込む。データキャッシュ6はディスクドライブ群8から読み出されたデータを一時記憶する。ホスト10からのデータ要求に対して、目的のデータがデータキャッシュ6に記憶されている場合にはそこから読み出されてホスト10へ送信される。   The disk control C / W 4 reads or writes data recorded in the data area or spare area of each disk drive of the disk drive group 8 as required by an instruction from the host 10. The data cache 6 temporarily stores data read from the disk drive group 8. In response to a data request from the host 10, if the target data is stored in the data cache 6, it is read out from the data cache 6 and transmitted to the host 10.

図2は、ホスト10からディスクドライブ群8へ起動時の動作の概略を示す。
ステップS1はデータ書き込み処理である。この場合、ディスクドライブ100のデータ領域100Aとディスクドライブ103のデータ領域103Åの双方にデータを書き込む。ステップS2はデータ読み出し処理である。データ読み出しの場合、ディスクドライブ100のデータ領域100Aまたはディスクドライブ103のデータ領域103Aから読み出しする。
FIG. 2 shows an outline of the operation at the time of starting from the host 10 to the disk drive group 8.
Step S1 is a data writing process. In this case, data is written in both the data area 100A of the disk drive 100 and the data area 103Å of the disk drive 103. Step S2 is data read processing. In the case of data reading, data is read from the data area 100A of the disk drive 100 or the data area 103A of the disk drive 103.

ステップS3は、ステップS1と同様に、ディスクドライブ101及びディスクドライブ104のデータ領域への書き込み処理である。ステップS4は、ステップS2と同様に、ディスクドライブ101またはディスクドライブ104のデータ領域からの読み出し処理である。   Step S3 is a writing process to the data areas of the disk drive 101 and the disk drive 104, as in step S1. Step S4 is a read process from the data area of the disk drive 101 or the disk drive 104, as in step S2.

ステップS5はディスクドライブ100のデータ領域100Aをディスクドライブ101のスペア領域101Bにデータコピーする処理である。
ステップS6はステップS5と同様に、ディスクドライブ101のデータ領域101Aをディスクドライブ102のスペア領域102Bにデータコピーする処理である。ステップS7はステップS5と同様に、ディスクドライブ102のデータ領域102Aをディスクドライブ100のスペア領域100Bにデータコピーする処理である。
Step S5 is a process of copying the data area 100A of the disk drive 100 to the spare area 101B of the disk drive 101.
Step S6 is a process of copying data from the data area 101A of the disk drive 101 to the spare area 102B of the disk drive 102, as in step S5. Step S7 is a process of copying data from the data area 102A of the disk drive 102 to the spare area 100B of the disk drive 100, as in step S5.

図3はディスク稼動状況管理テーブル7の例を示す。
ディスク稼動状況管理テーブル7は、ペア数1〜Nの閉塞ディスク管理フラグ300、各ペア単位のデータコピー先ディスクドライブ番号管理テーブル301、データ領域全てのLBA(Logical Block Address)に対する更新必要フラグ302を記憶して管理する。ここで、ディスクのペアは総数N個、各ディスクは総数M個のブロックを有しており、それぞれLBAにより指定されるとする。各ブロックの容量は例えば512バイトである。
FIG. 3 shows an example of the disk operation status management table 7.
The disk operation status management table 7 includes a blocked disk management flag 300 having 1 to N pairs, a data copy destination disk drive number management table 301 for each pair, and an update necessary flag 302 for LBA (Logical Block Address) of all data areas. Remember and manage. Here, it is assumed that there are a total of N disk pairs, and each disk has a total of M blocks, each of which is designated by an LBA. The capacity of each block is, for example, 512 bytes.

閉塞ディスクとは、ペア関係にあるディスクドライブの一方が不良な場合をいう。閉塞ディスク管理フラグ300が“1”の場合は閉塞ディスクが有り、“0”の場合は閉塞ディスクが無いことを意味する。図示の例では、1ペア目とNペア目は“0”なので、閉塞ディスクは無く、両方のディスクとも良好であることを示す。一方、2ペア目と3ペア目は“1”なので、閉塞ディスクが有ることを示す。本実施例で特徴的なことは、ペア関係にあるディスクドライブに閉塞ディスクがある場合、そのペアはいずれ障害発生の可能性が高いと判断して、スペア領域にデータコピーする処理を行う。   A blocked disk refers to a case where one of the paired disk drives is defective. When the blocked disk management flag 300 is “1”, there is a blocked disk, and when it is “0”, there is no blocked disk. In the illustrated example, since the first pair and the Nth pair are “0”, there is no blocked disk, indicating that both disks are good. On the other hand, the second and third pairs are “1”, indicating that there is a blocked disk. What is characteristic in this embodiment is that when a disk drive in a pair relationship has a blocked disk, it is determined that a failure is likely to occur in the pair, and data is copied to the spare area.

また、更新必要フラグ302が“1”の場合は、該当するブロックのデータ更新が必要、“0”の場合はデータ更新が不要、を意味する。
図示の例で、1ペア目のディスクドライブ100と103の管理テーブルは、2ペア目のディスクドライブ101と104のデータ更新フラグを持ち、その2ペア目のディスクペアのブロック番号が1,2,4のブロックの更新が必要であることを示している。同様にして、2ペア目のディスク101と104に対応付けられた3ペア目のディスクドライブ102と105のデータ更新フラグは、ブロック番号が1とkのブロックが更新要である。
Further, when the update necessary flag 302 is “1”, it means that data update of the corresponding block is necessary, and when it is “0”, it means that data update is unnecessary.
In the illustrated example, the management table for the first pair of disk drives 100 and 103 has data update flags for the second pair of disk drives 101 and 104, and the block number of the second pair of disk drives is 1, 2, 4 indicates that the block needs to be updated. Similarly, in the data update flag of the third pair of disk drives 102 and 105 associated with the second pair of disks 101 and 104, the blocks with block numbers 1 and k need to be updated.

図4は通常時における自動データコピープログラム5の実行処理を示す。
ホスト10が待機中か否かを判断して、待機中の時にデータの自動コピーを開始する(ステップS10)。
データの自動コピーが実行されると、ディスク稼動状況管理テーブル7の閉塞ディスク管理フラグ300を参照して、閉塞ディスクが有るか判定する(ステップS11)。判定の結果、閉塞ディスクのペアが有る場合(即ちフラグ300が“1”)、ペアディスクのいずれか一方が不良なので、いずれ障害発生の可能性が高いと判断して、スペア領域へデータコピーを行うことになるが、即、データの自動コピーを実施しない。一方、上記判定の結果、閉塞ディスクペアが無い場合(即ちフラグ300が“0”)には、自動データコピーを実施する。
FIG. 4 shows an execution process of the automatic data copy program 5 in a normal state.
It is determined whether or not the host 10 is on standby, and automatic data copying is started when the host 10 is on standby (step S10).
When automatic data copying is executed, it is determined whether there is a blocked disk by referring to the blocked disk management flag 300 in the disk operation status management table 7 (step S11). As a result of the determination, if there is a pair of blocked disks (that is, flag 300 is “1”), one of the pair disks is defective, so it is determined that a failure is likely to occur and data is copied to the spare area. Do it, but don't immediately copy data automatically. On the other hand, if the result of the determination is that there is no blocked disk pair (that is, the flag 300 is “0”), automatic data copying is performed.

自動データコピーは、ホスト10から対象とするディスクドライブへのアクセス要求がない場合に実施するため、閉塞ディスクペアが有るものはディスクドライブ1台の運転となっており、自動データコピーが全て終了していない状態でそのディスクドライブが故障すると、データロストが起こる。そのため、閉塞ディスクペアがあるものに対しては自動データコピーを一括で実行する。一括で行う自動データコピーは電源切断を契機に実行する(ステップS12)。   Since automatic data copying is performed when there is no access request to the target disk drive from the host 10, one disk drive is operating when there is a blocked disk pair, and all automatic data copying is completed. If the disk drive fails when not in use, data loss occurs. For this reason, automatic data copy is executed in batch for those with a blocked disk pair. Automatic data copying performed in a batch is executed when the power is turned off (step S12).

ステップS11の判断の結果、閉塞ディスクペアが無い場合はディスク稼動状況管理テーブル7に記録されているペア#L(1〜N)単位のデータコピー先ディスクドライブ番号管理テーブル301を参照し、LBA#P(1〜M)の更新必要フラグ302が“1”であるか判定する(ステップS13)。更新必要フラグ302が“1”の場合は更新が必要であるため、該当するディスクドライブペア#Lの正側または副側からデータを読み出す(ステップS14)。
そして、読み出したデータを更新必要なディスクドライブペア#L(ディスク稼動状況管理テーブル7の各ペア単位のデータコピー先ディスクドライブ番号管理テーブル301で示される正側のディスクドライブ)に書き込む(ステップS15)。
If the result of determination in step S11 is that there is no blocked disk pair, refer to the data copy destination disk drive number management table 301 in pairs #L (1 to N) recorded in the disk operation status management table 7, and LBA # It is determined whether the update necessity flag 302 of P (1 to M) is “1” (step S13). If the update necessary flag 302 is “1”, the update is necessary, so the data is read from the primary side or the secondary side of the corresponding disk drive pair #L (step S14).
Then, the read data is written to the disk drive pair #L that needs to be updated (the primary disk drive indicated by the data copy destination disk drive number management table 301 for each pair in the disk operation status management table 7) (step S15). .

この場合、読み出し及び書き込みデータの単位はLBA単位である。読み出し及び書き込みのデータ単位をLBA単位で行うのは、ホスト10からディスクサブシステム1へアクセス要求があった場合、円滑にデータの自動コピーの処理を中断するためであり、ディスクドライブへ書き込む最小の単位をLBA単位とする。   In this case, the unit of read and write data is an LBA unit. The read and write data units are performed in LBA units in order to smoothly interrupt the automatic data copy process when there is an access request from the host 10 to the disk subsystem 1. The unit is LBA unit.

次に、ディスク稼動状況管理テーブル7の更新が正常に完了したLBA#Pの更新必要フラグ302を“1”から“0”にセットする(ステップS16)。これで自動データコピー終了とする。
ステップS13での更新必要フラグ302が“0”の場合には更新の必要がないため、次のLBA#Pにカウントアップする(ステップS17)。そしてカウントアップしたLBA#Pが最終LBA#(M+1)であるか判定する(ステップS18)。最終LBA#(M+1)でない場合には自動データコピーを終了する。一方、最終LBA#(M+1)の場合にはディスク稼動状況管理テーブル7のペア#Lが最終ペア#(N+1)であるか判定する(ステップS19)。その判定の結果、最終ペア#(N+1)の場合には自動データコピーを終了し、最終ペア#(N+1)でない場合にはペア#Lをカウントアップしてから自動データコピーを終了する(ステップS20)。
Next, the update necessary flag 302 of LBA # P for which the update of the disk operation status management table 7 has been normally completed is set from “1” to “0” (step S16). This completes automatic data copying.
If the update necessity flag 302 in step S13 is “0”, no update is necessary, so the count is incremented to the next LBA # P (step S17). Then, it is determined whether the counted up LBA # P is the final LBA # (M + 1) (step S18). If it is not the final LBA # (M + 1), the automatic data copy is terminated. On the other hand, in the case of the final LBA # (M + 1), it is determined whether the pair #L in the disk operation status management table 7 is the final pair # (N + 1) (step S19). As a result of the determination, if the final pair # (N + 1), the automatic data copy is terminated. If not the final pair # (N + 1), the pair #L is counted up and the automatic data copy is terminated (step S20). ).

以上の処理動作を最終ペア#(N+1)と最終LBA#(M+1)まで繰り返し、最終ペア#(N+1)に達したら、再度最初のペア#Lから実行開始する。自動データコピーはホスト10からアクセス要求があった場合は再度ホスト10からアクセス要求がない場合まで中断する。   The above processing operation is repeated until the final pair # (N + 1) and the final LBA # (M + 1). When the final pair # (N + 1) is reached, the execution is started again from the first pair #L. When there is an access request from the host 10, the automatic data copy is interrupted until there is no access request from the host 10 again.

図5は電源切断時における自動データコピープログラム5の実行処理を示す。
この処理は、図4のステップS12における処理として実行される。この場合、自動データコピーを行い、その処理が完全に終了してからシステム電源がオフとなる。
まず、ディスク稼動状況管理テーブル7に記録されているペア#L(1〜N)LBA#P(1〜M)の更新必要フラグ302が“1”であるか判定する(ステップS21)。その結果、更新必要フラグ302が“1”の場合には更新が必要なので、該当ディスクドライブペア#Lの正側の1ブロックからデータを読み出す(ステップS22)。なお、閉塞ディスクドライブがある場合は閉塞ディスクドライブでない方のディスクドライブの1ブロックから読み出す。
FIG. 5 shows an execution process of the automatic data copy program 5 when the power is turned off.
This process is executed as the process in step S12 of FIG. In this case, automatic data copying is performed, and the system power is turned off after the processing is completely completed.
First, it is determined whether the update necessary flag 302 of the pair #L (1-N) LBA # P (1-M) recorded in the disk operation status management table 7 is “1” (step S21). As a result, since the update is necessary when the update necessary flag 302 is “1”, data is read from the primary block of the corresponding disk drive pair #L (step S22). If there is a blocked disk drive, it is read from one block of the disk drive that is not a blocked disk drive.

そして、その読み出したデータを更新が必要なディスクドライブペア#の正側(ディスク稼動状況管理テーブル7の各ペア単位のデータコピー先ディスクドライブ番号管理テーブル301で示す)の1ブロックに書き込む(ステップS23)。なお、閉塞ディスクドライブがある場合には閉塞ディスクドライブでない方のディスクドライブに書き込む。   Then, the read data is written to one block on the primary side of the disk drive pair # that needs to be updated (indicated by the data copy destination disk drive number management table 301 for each pair in the disk operation status management table 7) (step S23). ). If there is a blocked disk drive, it is written to the disk drive that is not a blocked disk drive.

次に、ディスク稼動状況管理テーブル7の更新が正常に完了したLBA#Pの更新必要フラグ302を“1”から“0”にセットする(ステップS24)。更新必要フラグ302が“0”の場合には更新の必要がないため、次のLBA#Pにカウントアップする(ステップS25)。
次に、カウントアップしたLBA#Pが最終LBA#(M+1)であるか判定する(ステップS26)。その結果、最終LBA#(M+1)でない場合には、最終LBA#(M+1)に達するまで繰り返す。
Next, the update necessary flag 302 of LBA # P for which the update of the disk operation status management table 7 has been normally completed is set from “1” to “0” (step S24). When the update necessary flag 302 is “0”, there is no need for updating, so the next LBA #P is counted up (step S25).
Next, it is determined whether the counted up LBA # P is the final LBA # (M + 1) (step S26). If the result is not the final LBA # (M + 1), the process is repeated until the final LBA # (M + 1) is reached.

そして、ディスク稼動状況管理テーブル7のペア#Lが最終ペア#(N+1)であるかを判定する(ステップS27)。その結果、最終ペア#(N+1)の場合には自動データコピーを終了する。一方、最終ペア#(N+1)でない場合には最終ペア#(N+1)に達するまで自動データコピーを繰り返して終了する。
最後に自動データコピーが終了したらシステム電源切断する(ステップS29)。自動データコピーが完了したディスクドライブは閉塞したディスクドライブの代わりとなり、引き続き、RAID構成として使用可能である。
Then, it is determined whether the pair #L in the disk operation status management table 7 is the last pair # (N + 1) (step S27). As a result, in the case of the final pair # (N + 1), the automatic data copy is terminated. On the other hand, if it is not the final pair # (N + 1), the automatic data copy is repeated until the final pair # (N + 1) is reached.
Finally, when the automatic data copy is completed, the system power is turned off (step S29). The disk drive for which automatic data copying has been completed replaces the blocked disk drive, and can continue to be used as a RAID configuration.

本実施例によれば、RAID構成のディスクドライブの記録領域を、スペア領域と定義して有効に利用することができる。また、CPUがディスクドライブの未使用の場合に、データの自動コピーができるので、ユーザーの通常の業務に影響を与えることなくバックアップデータを退避することができる。   According to this embodiment, a recording area of a disk drive having a RAID configuration can be effectively used by defining it as a spare area. In addition, since the data can be automatically copied when the CPU is not using the disk drive, the backup data can be saved without affecting the normal operation of the user.

一実施例におけるディスクサブシステムの構成を示す図。The figure which shows the structure of the disk subsystem in one Example. ホスト2からディスクアレイ11へ起動時の動作を示す図。The figure which shows the operation | movement at the time of starting to the disk array 11 from the host 2. FIG. ディスク稼動状況管理テーブル7の例を示す図。The figure which shows the example of the disk operation condition management table. 一実施例における通常時の動作を示すフローチャート。The flowchart which shows the operation | movement at the normal time in one Example. 一実施例における電源切断時の動作を示すフローチャート。The flowchart which shows the operation | movement at the time of the power-off in one Example.

符号の説明Explanation of symbols

1:ディスクサブシステム 10:ホストシステム 11:メインバス
3:CPU 4:ディスク制御C/W 5:自動データコピープログラム 6:データキャッシュ 7:ディスク稼動状況管理テーブル 8:ディスクドライブ群 9:SCSIコントローラ 91:SCSIバス。
1: Disk subsystem 10: Host system 11: Main bus
3: CPU 4: Disk control C / W 5: Automatic data copy program 6: Data cache 7: Disk operation status management table 8: Disk drive group 9: SCSI controller 91: SCSI bus.

Claims (4)

RAID構成の複数のディスクドライブと、該ディスクドライブ群にデータを書き込み及び読み出すための制御を行う処理手段と、を有するディスクサブシステムにおいて、
前記複数のディスクドライブに、通常のデータを書き込み及び読み出すデータ領域と、該データ領域の代替としてデータを書き込み及び読み出すスペア領域とを規定し、
複数の該ディスクドライブの状態を管理する管理手段と、
該管理手段によるディスクドライブの状態から、あるディスクドライブ(第1ディスクドライブ)の該データ領域のコピーの必要が生じた場合、該第1ディスクドライブの該データ領域のデータを、他のディスクドライブ(第2ディスクドライブ)の該スペア領域に自動的にコピーするコピー実行手段と、を有することを特徴とするディスクサブシステム。
In a disk subsystem having a plurality of disk drives with a RAID configuration and processing means for performing control for writing and reading data to and from the disk drive group,
A data area for writing and reading normal data to the plurality of disk drives, and a spare area for writing and reading data as an alternative to the data area,
Management means for managing the status of the plurality of disk drives;
When it is necessary to copy the data area of a certain disk drive (first disk drive) from the state of the disk drive by the management means, data in the data area of the first disk drive is transferred to another disk drive ( Copy execution means for automatically copying to the spare area of the second disk drive).
前記ディスクドライブ群は、ミラー構成の正副の複数のディスクドライブから成り、かつ各ディスクドライブには前記データ領域及びスペア領域が形成され、
前記管理手段は、ペア関係にあるディスクドライブの一方が不良な状態(閉塞ディスク)を示す第1のフラグと、ペア関係にあるディスクドライブにおけるデータの更新の必要性を示す第2のフラグと、を管理する管理テーブルをメモリに保持して管理し、
前記コピー実行手段は、該管理テーブルを参照して、前記第1ディスクドライブの該データ領域から前記第2ディスクドライブの該スペア領域にデータコピーすることを特徴とする請求項1のディスクサブシステム。
The disk drive group is composed of a plurality of primary and secondary disk drives in a mirror configuration, and the data area and the spare area are formed in each disk drive,
The management means includes a first flag indicating that one of the paired disk drives is defective (blocked disk), a second flag indicating the necessity of updating data in the paired disk drive, Manage the management table to manage
2. The disk subsystem according to claim 1, wherein the copy execution means copies data from the data area of the first disk drive to the spare area of the second disk drive with reference to the management table.
前記コピー実行手段は、前記管理テーブルの前記第1のフラグの値に応じて、電源切断時に一括してデータコピーを行う第1のデータコピーモードか、又は電源切断時ではなく、前記第2のフラグに応じて、前記第1ディスクドライブの該データ領域内のデータをブロック単位に前記第2ディスクドライブの該スペア領域にコピーする第2のデータコピーモードを実施することを特徴とする請求項2のディスクサブシステム。 The copy execution means is in a first data copy mode in which data copy is performed at a time when the power is turned off according to the value of the first flag in the management table, or when the power is turned off. 3. A second data copy mode is implemented in which data in the data area of the first disk drive is copied to the spare area of the second disk drive in block units according to a flag. Disk subsystem. 前記スペア領域の容量は、前記データ領域と等しいかそれよりも大きいことを特徴とする請求項1乃至3のいずれかのディスクサブシステム。 4. The disk subsystem according to claim 1, wherein the spare area has a capacity equal to or larger than that of the data area.
JP2007274963A 2007-10-23 2007-10-23 Disk sub-system Pending JP2009104369A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007274963A JP2009104369A (en) 2007-10-23 2007-10-23 Disk sub-system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007274963A JP2009104369A (en) 2007-10-23 2007-10-23 Disk sub-system

Publications (1)

Publication Number Publication Date
JP2009104369A true JP2009104369A (en) 2009-05-14

Family

ID=40705985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007274963A Pending JP2009104369A (en) 2007-10-23 2007-10-23 Disk sub-system

Country Status (1)

Country Link
JP (1) JP2009104369A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160623A (en) * 2009-01-07 2010-07-22 Nec Corp Disk array controller and redundancy method for disk array
JP2010277240A (en) * 2009-05-27 2010-12-09 Nec Corp Data storage system, and data area management method
CN102902608A (en) * 2011-07-25 2013-01-30 技嘉科技股份有限公司 Method and system of detection and data transfer for disk arrays
JP2013041430A (en) * 2011-08-16 2013-02-28 Konica Minolta Business Technologies Inc Image forming apparatus and control method of image forming apparatus
EP2541390A3 (en) * 2011-06-29 2014-01-22 Giga-Byte Technology Co., Ltd. Method and system of detecting redundant array of independent disks and transferring data

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010160623A (en) * 2009-01-07 2010-07-22 Nec Corp Disk array controller and redundancy method for disk array
JP2010277240A (en) * 2009-05-27 2010-12-09 Nec Corp Data storage system, and data area management method
EP2541390A3 (en) * 2011-06-29 2014-01-22 Giga-Byte Technology Co., Ltd. Method and system of detecting redundant array of independent disks and transferring data
CN102902608A (en) * 2011-07-25 2013-01-30 技嘉科技股份有限公司 Method and system of detection and data transfer for disk arrays
JP2013041430A (en) * 2011-08-16 2013-02-28 Konica Minolta Business Technologies Inc Image forming apparatus and control method of image forming apparatus
US8643888B2 (en) 2011-08-16 2014-02-04 Konica Minolta Business Technologies, Inc. Image forming apparatus and method for controlling the same

Similar Documents

Publication Publication Date Title
US6766491B2 (en) Parity mirroring between controllers in an active-active controller pair
JP6064608B2 (en) Storage device, backup program, and backup method
JP4041473B2 (en) Autonomous power loss recovery for multi-cluster storage subsystems
JPH11272427A (en) Method for saving data and outside storage device
JP2004021811A (en) Disk controller using nonvolatile memory
JP2006301714A (en) Array controller, information processor including this array controller, and disk array control method
US20150378858A1 (en) Storage system and memory device fault recovery method
JP2008269142A (en) Disk array device
US8271968B2 (en) System and method for transparent hard disk drive update
US20100205482A1 (en) Mirroring controller, storage device, and mirroring control method
US20050033933A1 (en) Systems and methods for modifying disk drive firmware in a raid storage system
JP2009104369A (en) Disk sub-system
JP2005099995A (en) Disk sharing method and system of magnetic disk unit
JP2004213470A (en) Disk array device, and data writing method for disk array device
JP2006260141A (en) Control method for storage system, storage system, storage control device, control program for storage system, and information processing system
JP2010536112A (en) Data storage method, apparatus and system for recovery of interrupted writes
JP2007058873A (en) Device control device using nonvolatile memory
JPH07306758A (en) Disk array device and its control method
US8667218B2 (en) Storage apparatus comprising RAID groups of RAID 1 series and control method of writing to RAID group of RAID 1 series
JP2007323377A (en) Recording apparatus, method for writing management data and method for repairing management data
JP4704463B2 (en) Storage control device, storage control program, and storage control method
JP4952605B2 (en) Disk array device, data switchback method, and data switchback program
JP2005316697A (en) Disk array system and method for data backup
JP2023002309A (en) Storage system and data management method
JPH1031563A (en) Storage device