JP4952605B2 - Disk array device, data switchback method, and data switchback program - Google Patents
Disk array device, data switchback method, and data switchback program Download PDFInfo
- Publication number
- JP4952605B2 JP4952605B2 JP2008028217A JP2008028217A JP4952605B2 JP 4952605 B2 JP4952605 B2 JP 4952605B2 JP 2008028217 A JP2008028217 A JP 2008028217A JP 2008028217 A JP2008028217 A JP 2008028217A JP 4952605 B2 JP4952605 B2 JP 4952605B2
- Authority
- JP
- Japan
- Prior art keywords
- disk
- data
- spare
- failed
- enclosure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明はRAIDによって構成されるディスクアレイ装置に関し、特に該ディスクアレイ装置でデータが復元された後の処理に関する。 The present invention relates to a disk array device configured by RAID, and more particularly to processing after data is restored in the disk array device.
磁気ディスク装置、もしくは光ディスク装置などのような不揮発媒体によって構成されるディスクアレイ装置では、RAIDを構成し、ユーザのデータを格納する複数のデータディスクの他に、データディスクが故障した場合に代替として使用されるスペアディスクが実装されていることが普通である。 In a disk array device composed of a nonvolatile medium such as a magnetic disk device or an optical disk device, in addition to a plurality of data disks that configure RAID and store user data, as an alternative when a data disk fails Usually, a spare disk to be used is mounted.
そして、ディスクアレイ装置の多くは、データディスクおよびスペアディスクを含む複数のディスク装置の物理的な集合体である複数のディスクエンクロージャを有する。ディスクエンクロージャ単位で、ディスク装置への電力の供給、もしくは冷却装置の動作などが制御される。その場合、複数のデータディスクが複数のディスクエンクロージャを跨ぐようにRAIDを構成するようにすれば、可用性を高め、さらにディスクエンクロージャ単位で電力供給や冷却装置などを制御することにより、省エネルギー効果を得ることもできる。 Many disk array apparatuses have a plurality of disk enclosures that are physical aggregates of a plurality of disk apparatuses including data disks and spare disks. The supply of power to the disk device or the operation of the cooling device is controlled for each disk enclosure. In such a case, if a RAID is configured so that a plurality of data disks straddle a plurality of disk enclosures, the availability is improved, and further, an energy saving effect is obtained by controlling power supply and cooling devices in units of disk enclosures. You can also.
また、データディスクが故障し、スペアディスクに故障したデータディスクのデータが復元されると、このスペアディスクは故障したデータディスクの機能を引き継ぎ、RAIDの構成に含まれる。故障したデータディスクが撤去され、その代わりに新たなディスク装置が設置されると、交換設置された新たなディスク装置はスペアディスクとなる。 When the data disk fails and the data of the failed data disk is restored, the spare disk takes over the function of the failed data disk and is included in the RAID configuration. When the failed data disk is removed and a new disk device is installed instead, the new disk device replaced and replaced becomes a spare disk.
そのとき、新たなディスク装置に対して、データが復元されてデータディスクとして動作しているスペアディスクから記録データをコピーし、コピー元のディスクを元のスペアディスクに戻し、新たなディスク装置を元のデータディスクとして機能させる場合がある。これをデータの切り戻しという。ディスクアレイ装置は、データが復元された際にこのデータの切り戻しを行うか行わないかを設定可能であることが普通である。データの切り戻しを行う設定を「データ切り戻しモード」、データの切り戻しを行わない設定を「データ切り戻しなしモード」という。 At that time, the recorded data is copied from the spare disk that is operating as a data disk after the data is restored to the new disk device, the copy source disk is returned to the original spare disk, and the new disk device is restored. May function as a data disk. This is called data switchback. In general, the disk array device can set whether or not to switch back this data when the data is restored. The setting for performing data switching back is referred to as “data switching back mode”, and the setting for not performing data switching back is referred to as “no data switching back mode”.
なお、ディスクアレイ装置に関連する技術として、次に示す特許文献がある。特許文献1には、残容量の多いディスクからRAIDグループを設定して残容量の偏りを少なくするという技術が開示されている。特許文献2には、データ復元時間を短縮する技術が開示されている。 The following patent literatures are available as technologies related to the disk array device. Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique of setting a RAID group from a disk having a large remaining capacity to reduce the remaining capacity unevenness. Patent Document 2 discloses a technique for reducing the data restoration time.
特許文献3には、RAID装置で複数の同一論理ボリュームを異なる物理ディスクユニットに配置するという技術が開示されている。特許文献4には、ディスクアレイで故障ディスク装置のデータを予備ディスク装置に復元し、故障ディスク装置が交換されたら交換後のディスク装置に予備ディスク装置のデータを復元するという技術が開示されている。
ディスクアレイ装置がデータ切り戻しモードである場合、スペアディスクの位置は固定されているが、データディスクの故障が発生するたびにディスク装置1台分のデータが丸ごとコピーされ、大量のデータ伝送が発生することになる。そのため、ディスク装置を接続するI/Oに過大な影響を及ぼす危険性がある。 When the disk array device is in data switchback mode, the position of the spare disk is fixed, but every time a data disk failure occurs, the entire data for one disk device is copied, resulting in a large amount of data transmission Will do. For this reason, there is a risk of excessively affecting the I / O connecting the disk device.
一方、ディスクアレイ装置がデータ切り戻しなしモードである場合、そのようなコピーに伴う大量のデータ伝送は発生しないので、I/Oへの過大な影響はない。しかしながら、このモードでは、故障したデータディスクが交換されると、そこに交換設置された新たなディスク装置がそのままスペアディスクとなるので、データディスクの故障が発生するたびにスペアディスクの位置が変わることになる。 On the other hand, when the disk array device is in the no data switchback mode, a large amount of data transmission associated with such copying does not occur, so there is no excessive influence on I / O. However, in this mode, when a failed data disk is replaced, the new disk device replaced and installed there becomes a spare disk as it is, so that the position of the spare disk changes each time a data disk failure occurs. become.
そのため、前述のように複数のデータディスクが複数のディスクエンクロージャを跨ぐようにRAIDを構成している場合には、データディスクの故障でスペアディスクの位置が変わることにより、複数のデータディスクが同一のディスクエンクロージャに含まれてしまう場合がありうる。これでは、たとえば該ディスクエンクロージャの電源系統などのトラブルにより、同一のディスクエンクロージャに含まれる複数のデータディスクが同時に故障するというような危険性もあることになる。従って、可用性が低下することになる。 Therefore, when a RAID is configured such that a plurality of data disks straddle a plurality of disk enclosures as described above, the position of the spare disk changes due to a failure of the data disk, so that the plurality of data disks are the same. It may be included in the disk enclosure. In this case, for example, there is a risk that a plurality of data disks included in the same disk enclosure fail simultaneously due to a trouble such as a power supply system of the disk enclosure. Therefore, availability is reduced.
一方、前述の各特許文献の中で、特許文献4には前述のデータの切り戻しを行う技術が開示されている。しかしながら、データの切り戻しを行うことによって発生する上述の問題を解決する構成は記載されていない。特許文献1〜3にも、もちろんその問題を解決する構成は記載されていない。
On the other hand, among the above-mentioned patent documents,
本発明の目的は、データディスクの故障が発生した際にI/Oに過大な影響を及ぼさず、かつ可用性の低下を抑制することのできるディスクアレイ装置、データ切り戻し方法およびデータ切り戻しプログラムを提供することにある。 An object of the present invention is to provide a disk array device, a data switchback method, and a data switchback program that do not exert an excessive influence on I / O when a data disk failure occurs and can suppress a decrease in availability. It is to provide.
上記目的を達成するため、本発明に係るディスクアレイ装置は、RAIDを構成する複数のデータディスクを含むディスクアレイ装置であって、データディスクを複数含まないように収容する複数のディスクエンクロージャと、通常時はスペアディスクであり、データディスクのうちいずれかが故障した際に故障したデータディスクに記録されていたデータが復元されて故障したデータディスクの機能を引き継ぐ第1のディスクと、故障したデータディスクが交換されてスペアディスクとして設置される第2のディスクと、故障したデータディスクに記録されていたデータを第1のディスク上に復元する制御部とを備え、この制御部が、故障したデータディスクが第2のディスクに交換されたことを確認する機能と、故障したデータディスクが第2のディスクに交換されたことを確認した後で第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれているか否かを判断する機能と、第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれていれば第1のディスク上に復元されたデータを第2のディスクに複写制御する機能とを備えることを特徴とする。 In order to achieve the above object, a disk array device according to the present invention is a disk array device including a plurality of data disks constituting a RAID, and usually includes a plurality of disk enclosures that contain a plurality of data disks. A spare disk, and when one of the data disks fails, the data recorded on the failed data disk is restored, and the first disk takes over the function of the failed data disk, and the failed data disk Is replaced with a second disk installed as a spare disk, and a controller that restores the data recorded on the failed data disk onto the first disk. To confirm that the disk has been replaced with the second disk and the failed data disk A function of determining whether one of the first disk and the data disk is included in the same disk enclosure after confirming that the second disk has been replaced with the second disk, and the first disk and data If any one of the disks is included in the same disk enclosure, a function of copying data restored on the first disk to the second disk is provided .
上記目的を達成するため、本発明に係るデータ切り戻し方法は、RAIDを構成する複数のデータディスクと、データディスクを複数含まないように収容する複数のディスクエンクロージャと、通常時はスペアディスクである第1のディスクとを有するディスクアレイ装置にあって、データの切り戻しを行う方法であって、データディスクのうちいずれかが故障した際に故障したデータディスクに記録されていたデータを第1のディスクに復元して故障したデータディスクの機能を引き継ぐデータ復元工程と、故障したデータディスクが第2のディスクに交換されたことを確認してこの第2のディスクをスペアディスクとするスペアディスク設置工程と、第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれているか否かを判断する判断工程と、判断工程で第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれていると判断されれば、第1のディスクに復元されたデータを第2のディスクに複写するデータ複写工程と
を有することを特徴とする。
In order to achieve the above object, a data switch-back method according to the present invention includes a plurality of data disks constituting a RAID, a plurality of disk enclosures accommodated so as not to include a plurality of data disks, and normally a spare disk. A disk array apparatus having a first disk, and a method for switching back data, wherein data recorded on a failed data disk when one of the data disks fails A data restoration process that restores the disk and takes over the function of the failed data disk, and a spare disk installation process that confirms that the failed data disk has been replaced with the second disk and uses the second disk as a spare disk And either the first disk or the data disk is in the same disk enclosure A determination step for determining whether or not the first disk and the data disk are included in the same disk enclosure in the determination step, the disk is restored to the first disk. And a data copying step of copying the data to the second disk.
上記目的を達成するため、本発明に係るデータ切り戻しプログラムは、RAIDを構成する複数のデータディスクと、データディスクを複数含まないように収容する複数のディスクエンクロージャと、通常時はスペアディスクである第1のディスクとを有するディスクアレイ装置を制御するコンピュータに、データディスクのうちいずれかが故障した際に故障したデータディスクに記録されていたデータを第1のディスクに復元して故障したデータディスクの機能を引き継ぐデータ復元処理と、故障したデータディスクが第2のディスクに交換されたことを確認してこの第2のディスクをスペアディスクとするスペアディスク設置処理と、第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれているか否かを判断する判断処理と、判断処理で第1のディスクとデータディスクのうちのいずれかが同一のディスクエンクロージャに含まれていると判断されれば、第1のディスクに復元されたデータを第2のディスクに複写するデータ複写処理とを実行させることを特徴とする。
In order to achieve the above object, a data switch-back program according to the present invention is a plurality of data disks constituting a RAID, a plurality of disk enclosures accommodated so as not to include a plurality of data disks, and normally a spare disk. A computer that controls a disk array device having a first disk restores the data recorded on the failed data disk to the first disk when one of the data disks fails, and the failed data disk Data restoration process that takes over the functions of the above, a spare disk installation process that uses the second disk as a spare disk after confirming that the failed data disk has been replaced with the second disk, and the first disk and the data disk Are included in the same disk enclosure? If it is determined in the determination process and the determination process that one of the first disk and the data disk is included in the same disk enclosure, the data restored to the first disk is stored in the first disk. And a data copying process for copying to the second disk.
本発明は、複数のデータディスクが同一のディスクエンクロージャに含まれているか否かを判断し、可用性を保ちつつ必要以上の大量のデータ伝送を発生させない。これによって、データディスクの故障が発生した際にI/Oに過大な影響を及ぼさず、かつ可用性の低下を抑制することのできるという、従来にない優れたディスクアレイ装置、データ切り戻し方法およびデータ切り戻しプログラムを提供することができる。 The present invention determines whether or not a plurality of data disks are included in the same disk enclosure, and does not cause an unnecessarily large amount of data transmission while maintaining availability. As a result, an unprecedented superior disk array device, data switching method, and data that do not have an excessive impact on I / O when a data disk failure occurs and can suppress a decrease in availability can be suppressed. A switchback program can be provided.
図1は、本発明の実施の形態に係るディスクアレイ10の構成を示す機能ブロック図である。ディスクアレイ10は、I/O受付部11、制御部12、バッファ13、管理テーブル16、および複数のディスクエンクロージャ14を含む。各々のディスクエンクロージャ14は、それぞれ複数の物理ドライブ15を含む。
FIG. 1 is a functional block diagram showing a configuration of a
ディスクアレイ10は、ホストコンピュータ20に接続され、ホストコンピュータ20からの読み出し命令(read)、書き込み命令(write)、および停止命令などのI/O要求によりデータの読み書きを行う。その際、ディスクアレイ10とホストコンピュータ20との間の接続は、ファイバチャネル(FC)、Ultra SCSIなど、任意のインターフェイスを適用することができる。
The
I/O受付部11は、ホストコンピュータ20からのI/O要求を受け付け、該I/O要求に基づく各ディスクエンクロージャ14へのデータの読み書きなどの動作を制御部12に実行させ、実行した結果(I/O結果)をホストコンピュータ20に返却する。バッファ13は、未処理のI/O要求およびI/O結果を保持する。また、制御部12は、物理ドライブ15の中に故障したものの有無を検出し、故障を検出した場合には後述のデータ復元の動作を行う。
The I / O accepting unit 11 accepts an I / O request from the
ディスクアレイ10の中で、複数の物理ドライブ15がRAID1もしくはRAID5などを形成する。その場合の各々の物理ドライブ15は、それぞれ別々のディスクエンクロージャ14に含まれる。
In the
制御部12は、各々の物理ドライブ15によって構成されるRAID構成を、管理テーブル16に保存する。このRAID構成には、RAIDを構成する各々の物理ドライブ15がどのディスクエンクロージャ14に含まれているかについての情報が含まれる。また、該RAID構成がデータ切り戻しモードであるか否かについての情報も、RAID構成に含まれる。
The
RAIDの規格に基づいて行われるデータ復元の動作、および本発明のデータ切り戻しの動作が行われた場合、RAID構成が変更されることになるが、この場合には制御部12が管理テーブル16に保存されたデータを書き換える。
When the data restoration operation performed based on the RAID standard and the data switchback operation of the present invention are performed, the RAID configuration is changed. In this case, the
図2は、図1のディスクアレイ10で、データディスクが故障した際に制御部12が行うデータ復元の動作を示すフローチャートである。制御部12をコンピュータによって制御されるものとすれば、図2のフローチャートを該コンピュータによって実行されるプログラムとして構成することができる。
FIG. 2 is a flowchart showing the data restoration operation performed by the
動作を開始し、制御部12がデータディスクの故障を検出すると(ステップS101)、まず制御部12は管理テーブル16のRAID構成を参照して、故障したデータディスクに対応するスペアディスクの存在の有無を検出する(ステップS102)。スペアディスクが存在しない場合はそのまま終了し、データ復元の動作は行われない。スペアディスクが存在する場合はステップS103に進む。
When the operation is started and the
ステップS102でスペアディスクが存在する場合、制御部12は、故障していない他のデータディスクに記憶されているデータによって、故障したデータディスクのデータをスペアディスク上に復元する(ステップS103)。この動作は、RAIDの規格に基づいて行われる。そして制御部12は、管理テーブル16を参照して、該RAID構成がデータ切り戻しモードであるか否かについて判断する(ステップS104)。データ切り戻しモードであればステップS106に進み、制御部12がデータ切り戻しを実行する。
If there is a spare disk in step S102, the
ステップS104でデータ切り戻しモードでない場合、制御部12は、スペアディスク上にデータを復元した結果、1つのディスクエンクロージャに同一のRAIDに含まれる複数のデータディスクが存在する状態になっているか否かを判断する(ステップS105)。複数のデータディスクが存在するディスクエンクロージャが存在しなければ、そのまま終了する。
If the data switching mode is not set in step S104, the
複数のデータディスクが存在するディスクエンクロージャが存在すればステップS106に進み、故障したデータディスクが交換されてスペアディスクとして復旧したことを確認した上で、制御部12がデータ切り戻しを実行する。ここでいうデータ切り戻しとは、コピー元のデータディスクの記録データをコピー先のスペアディスクにコピーし、該スペアディスクをデータディスク、該データディスクをスペアディスクに各々変更する処理である。ステップS106のデータ切り戻しが終了したら、図2のフローチャートに示す処理は終了する。
If there is a disk enclosure containing a plurality of data disks, the process proceeds to step S106, and after confirming that the failed data disk has been replaced and restored as a spare disk, the
以後、図2で示したデータ復元処理の第1〜第4の実例について説明する。以後の例に示す全てのデータディスクおよびスペアディスクは、図1の物理ドライブ15である。同ように、以後の例に示す全てのディスクエンクロージャは、図1のディスクエンクロージャ14である。図1のI/O受付部11、制御部12、バッファ13、管理テーブル16、およびホストコンピュータ20については、以後の例では記載を省略している。
Hereinafter, first to fourth examples of the data restoration process shown in FIG. 2 will be described. All data disks and spare disks shown in the following examples are the
各々のディスクエンクロージャ14をDE0、DE1、DE2…の記号で呼ぶ。また、各々のディスクエンクロージャに含まれる物理ドライブ15を、該物理ドライブ15がデータディスクとスペアディスクのいずれとして動作しているかに応じて、単にデータディスクもしくはスペアディスクという。該物理ドライブ15がデータディスクとして動作している場合はD0、D1、D2…の記号で呼び、該物理ドライブ15がスペアディスクとして動作している場合はS0、S1、S2…の記号で呼ぶ。
Each
従って、同一の物理ドライブ15が、動作状態に応じてデータディスクであることもあれば、スペアディスクであることもある。また、それに応じて「D0」「D1」「S0」などの記号も変更されていく。このため、たとえば記号「D0」のデータディスクが記号「S0」のスペアディスクに変更された場合、「データディスク201(D0)がスペアディスク201(S0)となる」などのように表記する。このように、そのディスクがデータディスクであってもスペアディスクであっても、同一の装置には同一の参照番号を付す。
Therefore, the same
図3は、図2で示したデータ復元処理の第1の実例を示す概念図である。図3(A)に示すように、ディスクアレイ10の中で、データディスク201(D0)はディスクエンクロージャ211(DE0)、データディスク202(D1)はディスクエンクロージャ212(DE1)に実装されている。各々別のディスクエンクロージャに実装されているデータディスク201(D0)とデータディスク202(D1)とがRAID1を構成する。またスペアディスク203(S0)はディスクエンクロージャ212(DE1)に実装されている。
FIG. 3 is a conceptual diagram showing a first example of the data restoration processing shown in FIG. As shown in FIG. 3A, in the
今、この中でデータディスク201(D0)が故障したものとする。この場合、図3(B)に示すように、データディスク202(D1)に記憶されているデータによって、故障したデータディスク201(D0)のデータがスペアディスク203(S0)上に復元される。そして、制御部12からの警報に基づいて、保守員が故障したデータディスク201(D0)を新しい物理ディスク204と交換して設置する。
Now, it is assumed that the data disk 201 (D0) has failed. In this case, as shown in FIG. 3B, the data of the failed data disk 201 (D0) is restored on the spare disk 203 (S0) by the data stored in the data disk 202 (D1). Then, based on the alarm from the
図3(C)に示すように、ディスクエンクロージャ212(DE1)上でデータを復元されたスペアディスク203(S0)が、データディスク203(D0)として動作する。そして、ディスクエンクロージャ211(DE0)上に交換された新しい物理ディスク204は、スペアディスク204(S0)として動作する。しかし、この状態ではデータディスク203(D0)とデータディスク202(D1)は同じディスクエンクロージャ212(DE1)に実装されていることになる。
As shown in FIG. 3C, the spare disk 203 (S0) whose data has been restored on the disk enclosure 212 (DE1) operates as the data disk 203 (D0). Then, the new
この場合、制御部12はディスクエンクロージャ212(DE1)上のデータディスク203(D0)の記録データを、ディスクエンクロージャ211(DE0)上のスペアディスク204(S0)に切り戻す。これによって、図3(D)に示すように、データを切り戻されたスペアディスク204(S0)が新たにデータディスク204(D0)となり、データディスク203(D0)はスペアディスク203(S0)となる。これで、RAID1を構成する各データディスクは元通り各々別のディスクエンクロージャに実装されている状態となる。
In this case, the
図4は、図2で示したデータ復元処理の第2の実例を示す概念図である。図4(A)に示すように、ディスクアレイ10の中で、データディスク221(D0)はディスクエンクロージャ231(DE0)、データディスク222(D1)はディスクエンクロージャ232(DE1)に実装されている。各々別のディスクエンクロージャに実装されているデータディスク221(D0)とデータディスク222(D1)とがRAID1を構成する。またスペアディスク223(S0)はディスクエンクロージャ233(DE2)に実装されている。
FIG. 4 is a conceptual diagram showing a second example of the data restoration processing shown in FIG. As shown in FIG. 4A, in the
今、この中でデータディスク221(D0)が故障したものとする。この場合、図4(B)に示すように、データディスク222(D1)に記憶されているデータによって、故障したデータディスク221(D0)のデータがスペアディスク223(S0)上に復元される。そして、制御部12からの警報に基づいて、保守員が故障したデータディスク221(D0)を新しい物理ディスク224と交換して設置する。
Now, it is assumed that the data disk 221 (D0) has failed. In this case, as shown in FIG. 4B, the data of the failed data disk 221 (D0) is restored on the spare disk 223 (S0) by the data stored in the data disk 222 (D1). Then, based on the alarm from the
図4(C)に示すように、ディスクエンクロージャ233(DE2)上でデータを復元されたスペアディスク223(S0)が、データディスク223(D0)として動作する。そして、ディスクエンクロージャ231(DE0)上に交換された新しい物理ディスク224は、スペアディスク224(S0)として動作する。
As shown in FIG. 4C, the spare disk 223 (S0) whose data has been restored on the disk enclosure 233 (DE2) operates as the data disk 223 (D0). Then, the new
この状態ではデータディスク223(D0)はディスクエンクロージャ233(DE2)に、データディスク222(D1)はディスクエンクロージャ232(DE1)に実装され、この両者が各々別のディスクエンクロージャに実装されていることになるので、管理テーブル16に記録されたRAID構成がデータ切り戻しモードでない限りはデータの切り戻しは行われない。 In this state, the data disk 223 (D0) is mounted on the disk enclosure 233 (DE2), and the data disk 222 (D1) is mounted on the disk enclosure 232 (DE1), both of which are mounted on different disk enclosures. Therefore, unless the RAID configuration recorded in the management table 16 is in the data switchback mode, data switchback is not performed.
図5〜6は、図2で示したデータ復元処理の第3の実例を示す概念図である。図5(A)に示すように、ディスクアレイ10の中で、データディスク241(D0)はディスクエンクロージャ251(DE0)、データディスク242(D1)はディスクエンクロージャ252(DE1)、データディスク243(D2)はディスクエンクロージャ253(DE2)、データディスク244(D3)はディスクエンクロージャ254(DE3)、データディスク245(D4)はディスクエンクロージャ255(DE4)に各々実装されている。各ディスクエンクロージャに跨って実装されているデータディスク241(D0)〜245(D4)がRAID5を構成する。またスペアディスク246(S0)はディスクエンクロージャ255(DE4)に実装されている。
5 to 6 are conceptual diagrams showing a third example of the data restoration processing shown in FIG. As shown in FIG. 5A, in the
今、この中でデータディスク244(D3)が故障したものとする。この場合、図5(B)に示すように、データディスク244(D3)を除くデータディスク241(D0)〜245(D4)に記憶されているデータによって、故障したデータディスク244(D3)のデータがスペアディスク246(S0)上に復元される。そして、制御部12からの警報に基づいて、保守員が故障したデータディスク244(D3)を新しい物理ディスク247と交換して設置する。
Now, it is assumed that the data disk 244 (D3) has failed. In this case, as shown in FIG. 5B, the data stored in the data disks 241 (D0) to 245 (D4) except for the data disk 244 (D3) is used to store the data on the failed data disk 244 (D3). Is restored on the spare disk 246 (S0). Then, based on the alarm from the
図6(C)に示すように、ディスクエンクロージャ255(DE4)上でデータを復元されたスペアディスク246(S0)が、データディスク246(D3)として動作する。そして、ディスクエンクロージャ254(DE3)上に交換された新しい物理ディスク247は、スペアディスク247(S0)として動作する。しかし、この状態ではデータディスク245(D4)とデータディスク246(D3)は同じディスクエンクロージャ255(DE4)に実装されていることになる。
As shown in FIG. 6C, the spare disk 246 (S0) whose data has been restored on the disk enclosure 255 (DE4) operates as the data disk 246 (D3). Then, the new
この場合、制御部12はディスクエンクロージャ255(DE4)上のデータディスク246(D3)の記録データを、ディスクエンクロージャ254(DE3)上のスペアディスク247(S0)に切り戻す。これによって、図5(D)に示すように、データを切り戻されたスペアディスク247(S0)が新たにデータディスク247(D3)となり、データディスク246(D3)はスペアディスク246(S0)となる。これで、RAID5を構成する各データディスクは元通りディスクエンクロージャに跨って実装されている状態となる。
In this case, the
図7〜8は、図2で示したデータ復元処理の第4の実例を示す概念図である。図7(A)に示すように、ディスクアレイ10の中で、データディスク261(D0)はディスクエンクロージャ271(DE0)、データディスク262(D1)はディスクエンクロージャ272(DE1)、データディスク263(D2)はディスクエンクロージャ273(DE2)、データディスク264(D3)はディスクエンクロージャ274(DE3)、データディスク265(D4)はディスクエンクロージャ275(DE4)に各々実装されている。各ディスクエンクロージャに跨って実装されているデータディスク261(D0)〜265(D4)がRAID5を構成する。またスペアディスク266(S0)はディスクエンクロージャ276(DE5)に実装されている。
7 to 8 are conceptual diagrams showing a fourth example of the data restoration processing shown in FIG. As shown in FIG. 7A, in the
今、この中でデータディスク264(D3)が故障したものとする。この場合、図7(B)に示すように、データディスク264(D3)を除くデータディスク261(D0)〜265(D4)に記憶されているデータによって、故障したデータディスク264(D3)のデータがスペアディスク266(S0)上に復元される。そして、制御部12からの警報に基づいて、保守員が故障したデータディスク264(D3)を新しい物理ディスク267と交換して設置する。
Now, it is assumed that the data disk 264 (D3) has failed. In this case, as shown in FIG. 7 (B), the data stored in the data disks 261 (D0) to 265 (D4) except for the data disk 264 (D3) is stored in the data of the failed data disk 264 (D3). Is restored on the spare disk 266 (S0). Then, based on the alarm from the
図8(C)に示すように、ディスクエンクロージャ276(DE5)上でデータを復元されたスペアディスク266(S0)が、データディスク266(D3)として動作する。そして、ディスクエンクロージャ274(DE3)上に交換された新しい物理ディスク267は、スペアディスク267(S0)として動作する。
As shown in FIG. 8C, the spare disk 266 (S0) whose data has been restored on the disk enclosure 276 (DE5) operates as the data disk 266 (D3). Then, the new
この状態ではRAID5を構成するデータディスク261(D0)〜263(D2)および265(D4)と266(D3)が、各々別のディスクエンクロージャに実装されていることになるので、RAID構成がデータ切り戻しモードでない限りはデータの切り戻しは行われない。
In this state, the data disks 261 (D0) to 263 (D2) and 265 (D4) and 266 (D3) constituting the
以上で示したように、本実施の形態に係るディスクアレイ10は、データ切り戻しモードに設定されていない限りは、複数のデータディスクが同一のディスクエンクロージャに含まれているか否かを判断し、含まれている場合に限ってデータの切り戻しを行うように構成されている。従って、複数のデータディスクが同一のディスクエンクロージャに含まれることに伴う可用性の低下を抑制することができる。
As described above, the
かつ、複数のデータディスクが同一のディスクエンクロージャに含まれていない場合は可用性の低下が生じないと考えることができるので、データの切り戻しを行わない。これによって、必要以上の大量のデータ伝送を発生させないので、I/Oへの過大な影響を抑制することもできる。 In addition, when a plurality of data disks are not included in the same disk enclosure, it can be considered that there is no reduction in availability, and therefore data is not switched back. As a result, an unnecessarily large amount of data transmission is not generated, so that an excessive influence on I / O can be suppressed.
なお、RAIDには、RAID1、RAID3、RAID4、RAID5、RAID6、RAID10、RAID30、RAID50、トリプルミラー、DPなどのようなRAIDタイプがあるが、どのRAIDタイプにおいても本実施の形態で説明した処理を適用することが可能である。また、ディスクエンクロージャおよび物理ディスクの台数が多くなっても、本実施の形態で説明した処理を適用することが可能である。 RAID includes RAID types such as RAID1, RAID3, RAID4, RAID5, RAID6, RAID10, RAID30, RAID50, triple mirror, DP, etc. The processing described in this embodiment is applicable to any RAID type. It is possible to apply. Further, even if the number of disk enclosures and physical disks increases, the processing described in this embodiment can be applied.
これまで本発明について図面に示した特定の実施の形態をもって説明してきたが、本発明は図面に示した実施の形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができることは言うまでもないことである。 Although the present invention has been described with the specific embodiments shown in the drawings, the present invention is not limited to the embodiments shown in the drawings, and is known so far as long as the effects of the present invention are achieved. It goes without saying that any configuration can be adopted.
RAIDを構成する複数のデータディスクを含むディスクアレイ装置において利用可能である。 The present invention can be used in a disk array apparatus including a plurality of data disks constituting a RAID.
10 ディスクアレイ
11 I/O受付部
12 制御部
13 バッファ
14 ディスクエンクロージャ
15 物理ドライブ
16 管理テーブル
20 ホストコンピュータ
DESCRIPTION OF
Claims (10)
前記データディスクを複数含まないように収容する複数のディスクエンクロージャと、
通常時はスペアディスクであり、前記データディスクのうちいずれかが故障した際に前記故障したデータディスクに記録されていたデータが復元されて前記故障したデータディスクの機能を引き継ぐ第1のディスクと、
前記故障したデータディスクが交換されてスペアディスクとして設置される第2のディスクと、
前記故障したデータディスクに記録されていた前記データを前記第1のディスク上に復元する制御部とを備え、
この制御部が、
前記故障したデータディスクが前記第2のディスクに交換されたことを確認する機能と、
前記故障したデータディスクが前記第2のディスクに交換されたことを確認した後で前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれているか否かを判断する機能と、
前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれていれば前記第1のディスク上に復元されたデータを前記第2のディスクに複写制御する機能とを備えることを特徴とするディスクアレイ装置。 A disk array device including a plurality of data disks constituting a RAID,
A plurality of disk enclosures for accommodating a plurality of the data disks; and
A first disk that is normally a spare disk and takes over the function of the failed data disk by restoring the data recorded on the failed data disk when any of the data disks fails;
A second disk in which the failed data disk is replaced and installed as a spare disk;
And a control unit for restoring the data recorded in the failed data disk on the first disk,
This control unit
A function to confirm that the failed data disk has been replaced with the second disk;
After confirming that the failed data disk has been replaced with the second disk, it is determined whether one of the first disk and the data disk is included in the same disk enclosure. Function to
A function of controlling copying of data restored on the first disk to the second disk if either of the first disk and the data disk is included in the same disk enclosure; the disk array apparatus, characterized in that it comprises.
前記RAIDがデータ切り戻しモードであれば、前記第1のディスクと前記データディスクのうちのいずれもが同一の前記ディスクエンクロージャに含まれていなくても、前記制御部が前記第1のディスクに復元されたデータを前記第2のディスクに複写することを特徴とする、請求項3に記載のディスクアレイ装置。 The management table includes information about whether the RAID is in a data switchback mode, and
When the RAID is in the data switchback mode, the control unit restores the first disk even if neither the first disk nor the data disk is included in the same disk enclosure. 4. The disk array device according to claim 3, wherein the copied data is copied to the second disk.
前記データディスクのうちいずれかが故障した際に前記故障したデータディスクに記録されていたデータを前記第1のディスクに復元して前記故障したデータディスクの機能を引き継ぐデータ復元工程と、
前記故障したデータディスクが第2のディスクに交換されたことを確認してこの第2のディスクをスペアディスクとするスペアディスク設置工程と、
前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれているか否かを判断する判断工程と、
前記判断工程で前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれていると判断されれば、前記第1のディスクに復元されたデータを前記第2のディスクに複写するデータ複写工程と
を有することを特徴とするデータ切り戻し方法。 A disk array device having a plurality of data disks constituting a RAID, a plurality of disk enclosures for accommodating a plurality of data disks, and a first disk that is normally a spare disk, A method for performing switchback,
A data restoration step of restoring the data recorded on the failed data disk to the first disk when any of the data disks fails, and taking over the function of the failed data disk;
A spare disk installation step of confirming that the failed data disk has been replaced with a second disk and using the second disk as a spare disk;
A determination step of determining whether one of the first disk and the data disk is included in the same disk enclosure;
If it is determined in the determination step that any one of the first disk and the data disk is included in the same disk enclosure, the data restored to the first disk is stored in the second disk. And a data copy method for copying to a disk.
前記RAIDがデータ切り戻しモードであれば、前記データ複写工程が、前記第1のディスクと前記データディスクのうちのいずれもが同一の前記ディスクエンクロージャに含まれていなくても、前記第1のディスクに復元されたデータを前記第2のディスクに複写することを特徴とする、請求項7に記載のデータ切り戻し方法。 The determining step includes the step of confirming whether the RAID is in a data switchback mode;
If the RAID is in the data switchback mode, the data copying step is performed even if the first disk and the data disk are not included in the same disk enclosure. 8. The data switchback method according to claim 7, wherein the data restored in step (b) is copied to the second disk.
前記データディスクのうちいずれかが故障した際に前記故障したデータディスクに記録されていたデータを前記第1のディスクに復元して前記故障したデータディスクの機能を引き継ぐデータ復元処理と、
前記故障したデータディスクが第2のディスクに交換されたことを確認してこの第2のディスクをスペアディスクとするスペアディスク設置処理と、
前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれているか否かを判断する判断処理と、
前記判断処理で前記第1のディスクと前記データディスクのうちのいずれかが同一の前記ディスクエンクロージャに含まれていると判断されれば、前記第1のディスクに復元されたデータを前記第2のディスクに複写するデータ複写処理と
を実行させることを特徴とするデータ切り戻しプログラム。 A computer that controls a disk array device having a plurality of data disks constituting a RAID, a plurality of disk enclosures that contain the data disks so as not to include a plurality of data disks, and a first disk that is normally a spare disk,
A data restoration process that restores the data recorded on the failed data disk to the first disk and takes over the function of the failed data disk when any of the data disks fails;
A spare disk installation process for confirming that the failed data disk has been replaced with a second disk and using the second disk as a spare disk;
Determination processing for determining whether one of the first disk and the data disk is included in the same disk enclosure;
If it is determined in the determination process that one of the first disk and the data disk is included in the same disk enclosure, the data restored to the first disk is stored in the second disk. A data switch-back program for executing a data copy process for copying to a disk.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008028217A JP4952605B2 (en) | 2008-02-07 | 2008-02-07 | Disk array device, data switchback method, and data switchback program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008028217A JP4952605B2 (en) | 2008-02-07 | 2008-02-07 | Disk array device, data switchback method, and data switchback program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009187406A JP2009187406A (en) | 2009-08-20 |
JP4952605B2 true JP4952605B2 (en) | 2012-06-13 |
Family
ID=41070557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008028217A Expired - Fee Related JP4952605B2 (en) | 2008-02-07 | 2008-02-07 | Disk array device, data switchback method, and data switchback program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4952605B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6212934B2 (en) * | 2013-05-07 | 2017-10-18 | 富士通株式会社 | Storage system, information processing apparatus control program, and storage system control method |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003323787A (en) * | 2002-04-30 | 2003-11-14 | Hitachi Ltd | Method and system for backing-up power source of disk array device |
JP2007087039A (en) * | 2005-09-21 | 2007-04-05 | Hitachi Ltd | Disk array system and control method |
JP4786312B2 (en) * | 2005-11-22 | 2011-10-05 | 株式会社日立製作所 | Storage controller and error information management method for storage controller |
-
2008
- 2008-02-07 JP JP2008028217A patent/JP4952605B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009187406A (en) | 2009-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4704759B2 (en) | Data management apparatus and method for flash memory | |
US7587631B2 (en) | RAID controller, RAID system and control method for RAID controller | |
JP4041473B2 (en) | Autonomous power loss recovery for multi-cluster storage subsystems | |
US9940201B2 (en) | Disk array having mirror configuration and rebuilding method therefor | |
JP2005293363A (en) | Disk array controller and information processing device | |
JP2014137711A (en) | Storage device, backup program and backup method | |
US20100115310A1 (en) | Disk array apparatus | |
JP2013041430A (en) | Image forming apparatus and control method of image forming apparatus | |
US20090177916A1 (en) | Storage system, controller of storage system, control method of storage system | |
JP2009104369A (en) | Disk sub-system | |
JP2005099995A (en) | Disk sharing method and system of magnetic disk unit | |
JP4951493B2 (en) | Disk array device | |
JP2007280111A (en) | Storage system and performance tuning method thereof | |
JP4952605B2 (en) | Disk array device, data switchback method, and data switchback program | |
JP2006285527A (en) | Storage device and program | |
JPH1195933A (en) | Disk array system | |
JP4398596B2 (en) | Disk array device | |
JP2009110303A (en) | Disk management method, disk management apparatus and storage system | |
JP2005107675A (en) | Disk array controller and method for duplicating disk drive | |
JP2005284643A (en) | Disk array controller, method for controlling this controller, and control program | |
JP2007323377A (en) | Recording apparatus, method for writing management data and method for repairing management data | |
JP5691227B2 (en) | Storage apparatus and control method thereof | |
JP2007128551A (en) | Storage area network system | |
JP4641528B2 (en) | Data writing program and data writing method | |
JP3794322B2 (en) | Data copy system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110627 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4952605 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |