WO2014111979A1 - ディスクアレイ制御装置およびディスクアレイ装置 - Google Patents

ディスクアレイ制御装置およびディスクアレイ装置 Download PDF

Info

Publication number
WO2014111979A1
WO2014111979A1 PCT/JP2013/004782 JP2013004782W WO2014111979A1 WO 2014111979 A1 WO2014111979 A1 WO 2014111979A1 JP 2013004782 W JP2013004782 W JP 2013004782W WO 2014111979 A1 WO2014111979 A1 WO 2014111979A1
Authority
WO
WIPO (PCT)
Prior art keywords
disk
sector
access
disk device
disk array
Prior art date
Application number
PCT/JP2013/004782
Other languages
English (en)
French (fr)
Inventor
真由美 鳴川
Original Assignee
株式会社 東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 東芝 filed Critical 株式会社 東芝
Publication of WO2014111979A1 publication Critical patent/WO2014111979A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems

Definitions

  • Embodiments described herein relate generally to a disk array control device and a disk array device.
  • RAID Redundant Arrays of Inexpensive Disks or Redundant Arrays of Independent Disks
  • RAID 5 is a system in which data and horizontal parity as error correction code data are distributed and recorded in a plurality of hard disk drives, and the redundancy can be improved.
  • the problem to be solved by the present invention is that a defective sector is generated in a horizontal sector of a plurality of disk devices in a disk array system in which data and horizontal parity are distributed and recorded on the plurality of disk devices constituting the disk array. It is an object of the present invention to provide a disk array control device and a disk array device that can recover data even in such a case.
  • the disk array control apparatus is a disk array control apparatus that performs access control to a disk array including a plurality of disk apparatuses including a spare disk apparatus and an operation disk apparatus according to RAID5.
  • This disk array device includes a restoration copy unit that restores data of a bad sector and copies the restored data to a spare disk device when a bad sector occurs in an operational disk device used in RAID5.
  • the disk array device further includes an access conversion unit that converts an access to the bad sector into an access to the sector of the spare disk device to which the restored data is copied when there is an access request to the bad sector.
  • FIG. 1 shows a schematic configuration of a disk array device connected to a host CPU in an embodiment.
  • FIG. 2 is a block diagram illustrating a functional configuration of a control circuit of the RAID controller according to the embodiment.
  • FIG. 3 is a flowchart for explaining operations unique to the RAID controller according to the embodiment.
  • FIG. 4 is a flowchart for explaining operations unique to the RAID controller according to the embodiment.
  • FIG. 5 is a diagram for explaining an operation example in the disk array device according to the embodiment.
  • FIG. 6 is a diagram for explaining an operation example in the disk array device according to the embodiment.
  • FIG. 7 is a diagram for explaining an operation example in the disk array device according to the embodiment.
  • FIG. 8 is a diagram for explaining an operation example in the disk array device of one embodiment.
  • FIG. 9 shows a state of data recording in a conventional disk array apparatus based on RAID 5 using four disk apparatuses.
  • FIG. 10 shows a state of data recording in a conventional disk array device based on RAID 5 using four disk devices, and shows an example in which two defective sectors are generated.
  • FIG. 1 shows a schematic configuration of a disk array device 1 of this embodiment connected to a host CPU 2.
  • the disk array device 1 includes a disk array composed of disk devices 14A and 14B composed of a plurality of HDDs (Hard Disk Disk Drive) and the like, and a RAID controller 10.
  • the RAID controller 10 controls the disk array and controls access to the disk array.
  • the disk array is connected to the host CPU 2 via the RAID controller 10.
  • the RAID controller 10 is a controller that controls the disk array, and includes a division / multiplexing circuit (MPX) 11, a matrix circuit (X-SW) 12, and a control circuit 13.
  • MPX division / multiplexing circuit
  • X-SW matrix circuit
  • a division / multiplexing circuit (MPX) 11 and five disk devices 14A and 14B are connected to a matrix circuit (X-SW) 12.
  • one of the five disk devices is the spare disk device 14B, and the remaining four disk devices are the operational disk devices 14A.
  • the four operational disk devices 14A constitute a RAID 5 disk array.
  • five disk devices 14A and 14B are used as the disk array.
  • the number of disk devices is not limited to this, and the number of spare disk devices 14B is not limited to one.
  • a disk device used in RAID 5 is referred to as an active disk device 14A
  • a spare disk device is referred to as a spare disk device 14B.
  • the input data from the host side is distributed and recorded on three of the four operational disk devices 14A.
  • the division / multiplexing circuit 11 divides input data from the host side (here, the host CPU 2) into three to generate three data, and also generates horizontal parity (error correction code data) for these three data. Then, the three data and the horizontal parity are output to the four operation disk devices 14A via the matrix circuit 12.
  • the division / multiplexing circuit 11 receives three data excluding the horizontal parity from the four operational disk devices 14A through the matrix circuit 12, multiplexes the three data, and hosts the multiplexed data. Output to the side.
  • the matrix circuit 12 switches the connection among the four operational disk devices 14A, the spare disk device 14B, and the division / multiplexing circuit 11.
  • the control circuit 13 is constituted by a programmed processor, and controls the division / multiplexing circuit 11 and the matrix circuit 12 in response to a request from the host CPU 2.
  • the control circuit 13 normally performs access control based on RAID5.
  • the control circuit 13 includes a restoration copy unit 13A, a notification unit 13B, and an access conversion unit 13C.
  • the control circuit 13 performs the following control specific to the present embodiment by the restoration copy unit 13A, the notification unit 13B, and the access conversion unit 13C.
  • the restoration copy unit 13A restores the data of the corresponding bad sector and copies the restored data to the spare disk device 14B.
  • a defective sector can be specified by detecting a read error or a write error.
  • the notification unit 13B When a bad sector occurs in any of the operational disk devices 14A, the notification unit 13B notifies the host CPU 2 of the occurrence of a bad sector. At that time, in order to identify the defective sector, the notification unit 13B determines the disk No. of the operational disk device 14A in which the defective sector has occurred. (Hereinafter, the disk device number is referred to as disk number) and the sector number of the bad sector. Is sent to the host CPU 2.
  • the disk number is used as address information for specifying the position of the sector on the disk devices 14A and 14B. And sector No. Is used. Actually, the address information is the cylinder number. , Head no. Including.
  • the host CPU 2 determines the disk number of the operation disk device 14A in which the bad sector has occurred. And the sector number of the bad sector. Address information including the disk number of the spare disk device 14B. And the sector number of the sector where the restored data is copied. Is written to the conversion table 13D.
  • the conversion table 13D will be described later.
  • the sector of the spare disk device 14B to which the restored data is copied is, for example, a sector number to be described later from an unused sector. They are selected in order.
  • the access conversion unit 13C accesses the bad sector to the sector of the spare disk device 14B to which the restored data has been copied. Convert to access. Specifically, the access conversion unit 13C switches the internal connection of the matrix circuit 12 based on a conversion table 13D described later so that the sector of the spare disk device 14B to which the restored data is copied is accessed.
  • FIG. 9 shows a state of data recording in a conventional disk array device based on RAID 5 using four disk devices.
  • File 1 data a, b, c and File 2 data d, e, f, g, h, i are distributed and recorded in four disk devices.
  • Disc No. 0 to disk No. Three data and one horizontal parity are distributed and recorded in the same sector (sector No. 0, sector No. 1 or sector No. 2) of each of the three disk devices.
  • Pabc is the horizontal parity of data a, b, and c
  • Pdef is the horizontal parity of data d, e, and f
  • Pghi is the horizontal parity of data g, h, and i.
  • disc No. 0 to disk No. 3 are referred to as disk 0 to disk 3, respectively.
  • sector No. 0 to sector No. 2 sectors are denoted as sector 0 to sector 2, respectively.
  • each data and horizontal parity are recorded as shown in FIG. 9, so even if one disk device in this disk array device fails (or one defective sector occurs in the horizontal direction).
  • data cannot be restored even if horizontal parity is used. causes a fatal failure.
  • 3 and 4 are flowcharts for explaining operations unique to the RAID controller 10 in the present embodiment.
  • the restoration copy unit 13A of the RAID controller 10 uses the corresponding data in the horizontal direction of the other operational disk devices 14A (corresponding to Among the data, if the restored data is copied to the spare disk device 14B, the defective sector data is restored (using the copied data), and the restored data is copied to the spare disk device 14B. (Step S102).
  • the notification unit 13B of the RAID controller 10 notifies the host CPU 2 that a bad sector has occurred in any of the operational disk devices 14A (step S103). At that time, in order to identify the defective sector, the notification unit 13B determines the disk No. of the operational disk device 14A in which the defective sector has occurred. And the sector number of the bad sector. Information including If no defective sector is generated (No in step S101), the special processing as described above is not performed. The above-described series of processing is performed when the occurrence of a defective sector is detected.
  • step S201 If there is a request for access to a bad sector from the host CPU 2 (Yes in step S201), the control circuit of the RAID controller 10 copies the data obtained by restoring the data of the bad sector to access this bad sector. The access is converted to access to the sector of the reserved disk device 14B (step S202). If the access request is not an access request to a bad sector (No in step S201), normal access control for the operational disk device 14A is performed (step S203).
  • the corresponding data in the horizontal direction of the other operational disk device 14A is stored.
  • To restore the data of the bad sector using the corresponding data if the restored data is copied to the spare disk device 14B, use the copied data). Play as data.
  • the disk array device 1 of this embodiment describes an example of operation in the disk array device 1 of this embodiment.
  • the disk No. 0 to disk No. 4 disk devices are referred to as disk 0 to disk 4, respectively.
  • sector no. 0 to sector No. The two sectors are referred to as sector 0 to sector 2, respectively.
  • step S103 when a bad sector occurs in one operational disk device (for example, disk 1) used in RAID 5, in step S103, for example, the sector of disk 1 that has become a bad sector.
  • the horizontal parity Pghi of 2 is restored using the data of g, h, and i, and the restored horizontal parity Pghi is copied to sector 0 of the spare disk device (here, disk 4) (see FIG. 6).
  • the host CPU 2 writes the data, the original address, and the post-migration address in the conversion table 13D of FIG.
  • this access is made by the access conversion unit 13C based on the conversion table 13D illustrated in FIG. Converted to access.
  • the restored horizontal parity Pghi is converted to access to the sector 0 of the disk 4 to which the disk 4 is copied. .
  • the disk array can be operated continuously.
  • the RAID controller 10 notifies the host CPU 2 that a bad sector has occurred or that a disk device has failed or failed.
  • the host CPU 2 notifies a user such as an administrator through a display or a speaker (not shown) that a bad sector has occurred or a failure or failure of the disk device has occurred. Encourage exchange.
  • the user replaces the corresponding disk device with a new disk device.
  • the spare disk device 14B has a capacity capable of reproducing all the contents recorded in the failed operational disk device 14A, the entire contents of the failed operational disk device 14A are stored. Restoration is performed, and all restored contents are copied to the spare disk device 14B. After the copy is completed, this spare disk device 14B is used as an operational disk device. Then, a RAID 5 system using the spare disk device 14B and another operational disk device 14A is reconstructed. Further, as described above, in response to the occurrence of a bad sector or the failure of the disk device 14A, the occurrence of a bad sector or the failure of the disk device 14A is notified to the host CPU 2, and these are notified to the user by the host CPU 2.
  • the new disk device 14B When the failed operational disk device 14A is replaced with a new disk device in response to this notification, the new disk device is operated as the spare disk device 14B. At this time, the data recorded in the original spare disk device 14B used as the operation disk device and restored from the bad sector data of the other non-replaced operation disk device 14A is converted into the conversion illustrated in FIG. A transition is made to the new spare disk device 14B so as to correspond to the correspondence relationship in the table 13D. Further, since the information in the conversion table 13D illustrated in FIG. 7 related to the defective sector of the failed disk device 14A that has been replaced does not correspond to the new operational disk device 14A after replacement, the information in the conversion table 13D related thereto is Deleted. When the data is transferred, the correspondence relationship between the defective sector and the corresponding sector of the spare disk device 14B may be newly constructed, and the conversion table 13D indicating this correspondence relationship may be created. Note that writing and deletion to the conversion table 13D are performed by the host CPU 12.
  • the spare disk device 14B does not have a capacity capable of restoring all the contents recorded in the failed operation disk device 14A, the contents of the failed operation disk device 14A are restored, and the restored contents are returned according to the above notification. Copy to a new disk device prepared by the user. After the copying is completed, this new disk device is used as a new operation disk device 14A, and the RAID5 system is reconstructed together with the other operation disk devices 14A. The current spare disk device 14B is operated as it is as the spare disk device 14B.
  • the failed operational disk device 14A is replaced with a new disk device 14 in this way, the data relating to the defective sector of the replaced failed disk device 14A remaining in the spare disk device 14B and FIG. Since the corresponding information in the conversion table 13D illustrated in (1) does not correspond to the new operational disk device 14A after replacement, they are deleted.
  • the spare disk device 14B has a lower failure rate than the operational disk device 14A used as a RAID 5 disk array.
  • the previously generated defective sector data (for example, “e” in FIG. 8) is restored, and the restored data is restored.
  • the data (for example, FIG. 8: “e”) copied to the spare disk device 14B is used to generate the next bad sector data (for example, FIG. 8: “d”) can be played back, restored, or copied (FIG. 8). That is, in this embodiment, even if two or more defective sectors occur in the same horizontal direction, the data of these defective sectors can be reproduced, restored, and copied if they are not simultaneous.
  • the host CPU 2 When a defective sector is detected and a restoration copy is made, the host CPU 2 is notified of the occurrence of the defective sector, and further prompts the user to replace the defective operational disk device 14A. Therefore, according to the disk array control device and the disk array device of this embodiment, it is possible to suppress a fatal influence on the operation.
  • Disk array device 2 Host CPU DESCRIPTION OF SYMBOLS 10 RAID controller 11 Division

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

 実施形態のディスクアレイ制御装置は、RAID5による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行う。このディスクアレイ制御装置は、RAID5で現用するディスク装置に不良セクタが発生した場合、不良セクタのデータを復元し、復元されたデータを予備ディスク装置にコピーする復元コピー部を備える。また、ディスクアレイ制御装置は、不良セクタに対するアクセス要求があった場合、予備ディスク装置に不良セクタのデータの復元コピーがなされた予備ディスク装置の対応セクタへのアクセスに変換するアクセス変換部と、を備える。

Description

ディスクアレイ制御装置およびディスクアレイ装置 関連出願の引用
 本出願は、2013年1月16日に出願した先行する日本国特許出願第2013-005741号による優先権の利益に基礎をおき、かつ、その利益を求めており、その内容全体が引用によりここに包含される。
 本発明の実施形態は、ディスクアレイ制御装置およびディスクアレイ装置に関する。
 従来より、RAID(Redundant Arrays of Inexpensive DisksもしくはRedundant Arrays of Independent Disksの略)と呼ばれる、複数台の、ハードディスクドライブ等のディスク装置を仮想的な1台の記憶装置として使用する技術がある。RAIDにはいくつかの種類があり、RAID5は、複数のハードディスクドライブに、データと、誤り訂正符号データとしての水平パリティとを分散させて記録する方式であり、冗長性を向上させることができる。
日本国特許出願公報平5-35413号公報
 RAID5で動作するディスクアレイ装置において、1台のディスク装置に障害が発生した場合、残りのディスク装置のデータと水平パリティを元に障害データを回復させることができる。しかし、2台以上のディスク装置に障害が発生した場合には回復が不可能になる、という問題があった。
 本発明が解決しようとする課題は、ディスクアレイを構成する複数のディスク装置にデータと水平パリティとを分散させて記録するディスクアレイシステムにおいて、複数のディスク装置の水平方向のセクタに不良セクタが発生した場合でも、データを回復させることができるディスクアレイ制御装置およびディスクアレイ装置を提供することである。
 実施形態のディスクアレイ制御装置は、RAID5による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行うディスクアレイ制御装置である。
 このディスクアレイ装置は、RAID5で使用される運用ディスク装置に不良セクタが発生した場合、不良セクタのデータを復元し、復元されたデータを予備ディスク装置へコピーする復元コピー部を備える。
 また、ディスクアレイ装置は、不良セクタに対するアクセス要求があった場合、不良セクタに対するアクセスを、復元されたデータがコピーされた予備ディスク装置のセクタへのアクセスに変換するアクセス変換部と、を備える。
図1は、一実施形態における、ホストCPUに接続されたディスクアレイ装置の概略構成を示す。 図2は、一実施形態のRAIDコントローラの制御回路の機能構成を示すブロック図である。 図3は、一実施形態のRAIDコントローラに特有の動作を説明するフローチャートである。 図4は、一実施形態のRAIDコントローラに特有の動作を説明するフローチャートである。 図5は、一実施形態のディスクアレイ装置における運用例を説明するための図である。 図6は、一実施形態のディスクアレイ装置における運用例を説明するための図である。 図7は、一実施形態のディスクアレイ装置における運用例を説明するための図である。 図8は、一実施形態のディスクアレイ装置における運用例を説明するための図である。 図9は、4台のディスク装置を使用したRAID5による従来のディスクアレイ装置におけるデータ記録の様子を示す。 図10は、4台のディスク装置を使用したRAID5による従来のディスクアレイ装置におけるデータ記録の様子を示し、2個の不良セクタが発生した例を示す。
 以下、実施例を説明する。
 図1は、ホストCPU2に接続された、本実施形態のディスクアレイ装置1の概略構成を示す。ディスクアレイ装置1は、複数のHDD(Hard Disk Drive)等からなるディスク装置14A、14Bからなるディスクアレイと、RAIDコントローラ10とを備える。RAIDコントローラ10は、ディスクアレイを制御し、またディスクアレイへのアクセス制御を行う。ディスクアレイはRAIDコントローラ10を介してホストCPU2接続される。
 RAIDコントローラ10はディスクアレイの制御を行うコントローラであり、分割・多重化回路(MPX)11と、マトリクス回路(X-SW)12と、制御回路13とを有する。分割・多重化回路(MPX)11と5台のディスク装置14A,14Bとがマトリクス回路(X-SW)12へ接続されている。
 本実施形態において、5台のディスク装置のうち1台のディスク装置は予備ディスク装置14Bであり、残りの4台のディスク装置は運用ディスク装置14Aである。4台の運用ディスク装置14AはRAID5によるディスクアレイを構成する。なお、本実施形態では、ディスクアレイとして5台のディスク装置14A,14Bを用いる。しかし、ディスク装置の台数はこれに限られるものではなく、予備ディスク装置14Bの台数も1台に限られるものではない。また、以下の説明においては、RAID5で使用されるディスク装置を運用ディスク装置14Aと記し、また予備ディスク装置を予備ディスク装置14Bと記す。
 本実施例では、ホスト側からの入力データを4台の運用ディスク装置14Aのうちの3台に分散して記録する。分割・多重化回路11は、ホスト側(ここではホストCPU2)からの入力データを3つに分割して3つのデータを生成し、またこれら3つのデータに対する水平パリティ(誤り訂正符号データ)を生成し、そして3つのデータと水平パリティとをマトリクス回路12を介して4台の運用ディスク装置14Aへ出力する。また分割・多重化回路11は、4台の運用ディスク装置14Aからの、水平パリティを除く3つのデータを、マトリクス回路12を介して受取り、3つのデータを多重化し、多重化されたデータをホスト側へ出力する。
 マトリクス回路12は、4台の運用ディスク装置14Aと、予備ディスク装置14Bと、分割・多重化回路11との間の接続を切り替える。
 制御回路13は、プログラムされたプロセッサにより構成され、ホストCPU2からの要求に応じて分割・多重化回路11およびマトリクス回路12を制御する。制御回路13は、通常時は、RAID5に準拠したアクセス制御を行う。図2に示されるように、制御回路13は復元コピー部13A、通知部13B、およびアクセス変換部13Cを有する。いずれかの運用ディスク装置14Aに不良セクタが発生した場合には、制御回路13は、復元コピー部13A、通知部13B、およびアクセス変換部13Cにより、本実施形態に特有の下記の制御を行う。
 いずれかの運用ディスク装置14Aの、あるセクタが不良セクタとなった場合に、復元コピー部13Aは、該当不良セクタのデータを復元し、復元されたデータを予備ディスク装置14Bへコピーする。なお、読み出しエラーや書き込みエラーを検知することにより、不良セクタを特定することができる。
 いずれかの運用ディスク装置14Aに不良セクタが発生した場合、通知部13Bは、ホストCPU2へ不良セクタの発生を通知する。その際、不良セクタを特定するため、通知部13Bは、不良セクタが発生した運用ディスク装置14AのディスクNo.(以下、ディスク装置のNo.をディスクNo.と記す)および不良セクタのセクタNo.を含むアドレス情報をホストCPU2へ通知する。なお、ここでは、説明を簡単にするため、ディスク装置14A、14B上のセクタの位置を特定するためのアドレス情報としてディスクNo.およびセクタNo.を用いる。なお、実際には、アドレス情報は、シリンダNo.、ヘッドNo.も含む。
 復元されたデータの予備ディスク装置14Bへのコピーが完了すると、ホストCPU2は、不良セクタが発生した運用ディスク装置14AのディスクNo.および不良セクタのセクタNo.を含むアドレス情報と、予備ディスク装置14BのディスクNo.および復元されたデータがコピーされたセクタのセクタNo.を含むアドレス情報を、変換テーブル13Dに書き込む。なお、変換テーブル13Dは後述される。復元されたデータがコピーされる予備ディスク装置14Bのセクタは、使われていないセクタから、例えば、後述するセクタNo.順に選定される。
 ホストCPU2から運用ディスク装置14Aの不良セクタへのアクセス要求があった場合に、アクセス変換部13Cは、不良セクタへのアクセスを、復元されたデータがコピーされた、予備ディスク装置14Bのセクタへのアクセスに変換する。具体的には、復元されたデータがコピーされた、予備ディスク装置14Bのセクタがアクセスされるように、アクセス変換部13Cは、後述の変換テーブル13Dを基にマトリクス回路12の内部接続を切り替える。
 次に、参考のため、RAID5による従来のディスクアレイ装置について、図9、図10を用いて説明する。
 図9は、4台のディスク装置を使用したRAID5による従来のディスクアレイ装置におけるデータ記録の様子を示す。図9に示されるように、File1のデータa,b,cと、File2のデータd,e,f,g,h,iが、4台のディスク装置に分散されて記録されている。ディスクNo.0~ディスクNo.3の各ディスク装置の同一セクタ(セクタNo.0、セクタNo.1またはセクタNo.2)に、3つのデータと1つの水平パリティが分散されて記録されている。なお、図9において、Pabcは、データa,b,cの水平パリティであり、Pdefは、データd,e,fの水平パリティであり、Pghiは、データg,h,iの水平パリティである(後述する他図においても同様である)。また、以下では、ディスクNo.0~ディスクNo.3の各ディスク装置をそれぞれ、ディスク0~ディスク3と記す。同様にセクタNo.0~セクタNo.2の各セクタをそれぞれセクタ0~セクタ2と記す。
 RAID5では、図9に示すように各データと水平パリティが記録されるので、このディスクアレイ装置の中の1台のディスク装置が故障しても(あるいは水平方向に不良セクタが1つ発生しても)、水平パリティを用いて、読み取れなくなったデータを復元(あるいは再生)することが可能である。しかし、2台以上のディスク装置が故障した場合は(あるいは図10に示すように水平方向において2個以上の不良セクタが発生した場合は)、水平パリティを用いてもデータを復元できず、システムに致命的な障害が発生する。
 ここで、説明を本実施形態のディスクアレイ装置1に戻す。図3、図4は、本実施形態における、RAIDコントローラ10に特有の動作を説明するフローチャートである。
 いずれかの運用ディスク装置14Aに不良セクタが発生した場合(ステップS101でYes)、RAIDコントローラ10の復元コピー部13Aにより、他の運用ディスク装置14Aの水平方向における対応するデータを用いて(対応するデータのうち、復元されたデータが予備ディスク装置14Bにコピーされているものがあれば、コピーされたデータも用いて)不良セクタのデータを復元し、復元されたデータを予備ディスク装置14Bにコピーする(ステップS102)。
 次いで、RAIDコントローラ10の通知部13Bは、ホストCPU2にいずれかの運用ディスク装置14Aに不良セクタが発生したことを通知する(ステップS103)。その際、不良セクタを特定するため、通知部13Bは、不良セクタが発生した運用ディスク装置14AのディスクNo.および不良セクタのセクタNo.を含む情報を通知する。なお、不良セクタの発生がない場合は(ステップS101でNo)、上記のような特別な処理は行われない。以上の一連の処理を、不良セクタの発生が検出された時点に行う。
 また、ホストCPU2から不良セクタへのアクセス要求があった場合(ステップS201でYes)、RAIDコントローラ10の制御回路は、この不良セクタへのアクセスを、その不良セクタのデータが復元されたデータがコピーされた予備ディスク装置14Bのセクタへのアクセスに変換する(ステップS202)。アクセス要求が不良セクタへのアクセス要求でない場合は(ステップS201でNo)、運用ディスク装置14Aに対する通常のアクセス制御を行う(ステップS203)。
 なお、不良セクタのデータの復元コピーを開始する前あるいは不良セクタのデータの復元コピーを完了する前に、不良セクタに対する読み出しがあった場合、他の運用ディスク装置14Aの水平方向における対応するデータを用いて(対応するデータのうち復元されたデータが予備ディスク装置14Bにコピーされているものがあれば、コピーされたデータも用いて)不良セクタのデータを復元し、復元されたデータを不良セクタのデータとして再生する。
 次に、本実施形態のディスクアレイ装置1の具体的な運用例を説明する。図5~図8は、本実施形態のディスクアレイ装置1における運用例を説明する。なお、以下では、図中のディスクNo.0~ディスクNo.4のディスク装置をそれぞれディスク0~ディスク4と記す。同様に、セクタNo.0~セクタNo.2のセクタをそれぞれセクタ0~セクタ2と記す。
 図1のディスクアレイ装置1において、RAID5で使用する1台の運用ディスク装置(例えば、ディスク1)に不良セクタが発生した場合、前述のステップS103にて、例えば不良セクタになったディスク1のセクタ2の水平パリティPghiは、g、h、iのデータを用いて復元され、復元された水平パリティPghiは予備ディスク装置(ここではディスク4)のセクタ0にコピーされる(図6を参照)。またホストCPU2により、図7の変換テーブル13Dに、データ、元アドレス、移行後のアドレスが書き込まれる。そして、ホストCPU2から不良セクタへのアクセス要求があった場合には、アクセス変換部13Cにより、図7に例示した変換テーブル13Dに基づき、このアクセスは、不良セクタの対応する予備ディスク装置14Bのセクタへのアクセスに変換される。例えば、上記の不良セクタとなったディスク1のセクタ2の水平パリティPghiへのアクセス要求があった場合、復元された水平パリティPghiがコピーされているディスク4のセクタ0へのアクセスに変換される。このようにして、ディスクアレイを継続して運用することができる。
 また、このとき、RAIDコントローラ10はホストCPU2に対して、不良セクタが発生したこと、あるいはディスク装置の故障ないし障害が発生したことを通知する。この通知に応じて、ホストCPU2は、図示しないディスプレイやスピーカを通じて管理者等のユーザに、不良セクタが発生したこと、あるいはディスク装置の故障ないし障害が発生したことを通知し、該当のディスク装置の交換を促す。これに応じて、ユーザが、該当のディスク装置を新しいディスク装置に交換することとなる。
 また、1台の運用ディスク装置14Aそのものが故障した場合、故障した運用ディスク装置14Aに記録された内容をすべて再現できる容量が予備ディスク装置14Bにあれば、故障した運用ディスク装置14Aの全内容を復元し、復元した全内容を予備ディスク装置14Bにコピーする。コピー完了後、この予備ディスク装置14Bを運用ディスク装置として用いる。そして予備ディスク装置14Bと他の運用ディスク装置14Aを用いたRAID5のシステムを再構築する。また、前述のように不良セクタの発生やディスク装置14Aの故障に応じて、不良セクタの発生やディスク装置14Aの故障がホストCPU2へ通知され、それらがホストCPU2によりユーザへ通知される。この通知に応じて故障した運用ディスク装置14Aが新しいディスク装置と交換されると、新しいディスク装置を予備ディスク装置14Bとして運用する。その際、運用ディスク装置として使用される元の予備ディスク装置14Bに記録されている、交換されていない他の運用ディスク装置14Aの不良セクタのデータが復元されたデータを、図7に例示した変換テーブル13Dの対応関係と対応するように、新しい予備ディスク装置14Bへ移行させる。また、交換された故障したディスク装置14Aの不良セクタに関連する、図7に例示した変換テーブル13Dの情報は、交換後の新しい運用ディスク装置14Aと対応しないので、それに関する変換テーブル13Dの情報は削除される。なお、上記データの移行の際、不良セクタと、予備ディスク装置14Bの対応セクタとの対応関係をあらためて構築し、この対応関係を示す変換テーブル13Dを作成してもよい。なお、変換テーブル13Dへの書込み、削除は、ホストCPU12によって行われる。
 一方、予備ディスク装置14Bに故障した運用ディスク装置14Aに記録された内容をすべて復元できる容量がない場合、故障した運用ディスク装置14Aの内容を復元し、復元された内容を前述の通知に応じてユーザにより用意された新しいディスク装置へコピーする。コピーの完了後、この新しいディスク装置を新たな運用ディスク装置14Aとして他の運用ディスク装置14AとともにRAID5のシステムを再構築する。現行の予備ディスク装置14Bを、そのまま予備ディスク装置14Bとして運用する。このようにして故障した運用ディスク装置14Aが新たしいディスク装置14と交換されると、予備ディスク装置14Bに残っている、交換された故障したディスク装置14Aの不良セクタに関連したデータ、及び図7に例示した変換テーブル13Dの対応する情報は、交換後の新たしい運用ディスク装置14Aと対応しないので、それらは削除される。
 なお、予備ディスク装置14Bは、RAID5のディスクアレイとして使用される運用ディスク装置14Aよりも故障率が低いものであることが望ましい。
 以上説明したとおり、本実施形態では、2個以上の不良セクタの発生が同時でなければ、先に発生した不良セクタのデータ(例えば、図8:“e”)は復元され、復元されたデータが予備ディスク装置14Bに先にコピーされるので、この予備ディスク装置14Bにコピーされたデータ(例えば、図8:“e”)を利用して、次に発生した不良セクタのデータ(例えば、図8:“d”)を再生、復元、または、コピーすることができる(図8)。すなわち、本実施形態では、同じ水平方向において2個以上不良セクタが発生しても、それが同時でなければ、これらの不良セクタのデータを、再生しおよび復元しコピーすることが可能となる。また、不良セクタが検出され復元コピーがなされる際、ホストCPU2へ不良セクタの発生を通知し、さらに不具合のある運用ディスク装置14Aの交換をユーザへ促す。したがって、本実施形態のディスクアレイ制御装置およびディスクアレイ装置によれば、運用への致命的な影響を抑えることができる。
 以上、本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
 1 ディスクアレイ装置
 2 ホストCPU
 10 RAIDコントローラ
 11 分割・多重化回路
 12 マトリクス回路
 13 制御回路
 13A 復元コピー部
 13B 通知部
 13C アクセス変換部
 13D 変換テーブル
 14A ディスク装置(運用)
 14B ディスク装置(予備)

Claims (6)

  1.  RAID5による、予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイへのアクセス制御を行うディスクアレイ制御装置であって、
     RAID5で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタのデータを復元し、復元されたデータを前記予備ディスク装置のセクタへコピーする復元コピー部と、
     前記不良セクタに対するアクセス要求があった場合、前記不良セクタに対するアクセスを、前記復元されたデータがコピーされた前記予備ディスク装置の前記セクタへのアクセスに変換するアクセス変換部と、
     を備える、ディスクアレイ制御装置。
  2.  RAID5で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタの発生をホスト側へ通知する通知部を備える、請求項1に記載のディスクアレイ制御装置。
  3.  さらに、前記不良セクタが発生した運用ディスク装置及び前記不良セクタの情報を含むアドレス情報と、前記予備ディスク装置および前記復元されたデータがコピーされた前記セクタの情報を含むアドレス情報とが書き込まれる変換テーブルを備え、
     前記アクセス変換部は、前記変換テーブルに基づいて前記不良セクタに対するアクセスを、前記予備ディスク装置の前記セクタへのアクセスに変換する、
     請求項1に記載のディスクアレイ制御装置。
  4.  前記アクセス変換部が前記変換テーブルを備える請求項3に記載のディスクアレイ制御装置。
  5.  予備ディスク装置と運用ディスク装置を含む複数台のディスク装置からなるディスクアレイと、RAID5による、前記ディスクアレイへのアクセス制御を行うディスクアレイ制御装置と、を備えるディスクアレイ装置であって、
     前記ディスクアレイ制御装置は、RAID5で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタのデータを復元し、復元されたデータを前記予備ディスク装置のセクタへコピーする復元コピー部と、
     前記不良セクタに対するアクセス要求が発生した場合、前記不良セクタに対するアクセスを、前記復元されたデータがコピーされた前記予備ディスク装置の前記セクタへのアクセスに変換するアクセス変換部と、
     を備える、ディスクアレイ装置。
  6.  RAID5で使用される前記運用ディスク装置に不良セクタが発生した場合、前記不良セクタの発生をホスト側へ通知する通知部を備える、請求項3に記載のディスクアレイ装置。
PCT/JP2013/004782 2013-01-16 2013-08-07 ディスクアレイ制御装置およびディスクアレイ装置 WO2014111979A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013005741A JP5586712B2 (ja) 2013-01-16 2013-01-16 ディスクアレイ制御装置およびディスクアレイ装置
JP2013-005741 2013-01-16

Publications (1)

Publication Number Publication Date
WO2014111979A1 true WO2014111979A1 (ja) 2014-07-24

Family

ID=51209111

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/004782 WO2014111979A1 (ja) 2013-01-16 2013-08-07 ディスクアレイ制御装置およびディスクアレイ装置

Country Status (2)

Country Link
JP (1) JP5586712B2 (ja)
WO (1) WO2014111979A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017128951A1 (en) * 2016-01-27 2017-08-03 Huawei Technologies Co., Ltd. Data protection for cold storage system
WO2018064928A1 (en) * 2016-10-04 2018-04-12 Huawei Technologies Co., Ltd. Data protection for a cold storage system
US20240061741A1 (en) * 2020-12-26 2024-02-22 Intel Corporation Adaptive error correction to improve system memory reliability, availability, and serviceability (ras)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104407815A (zh) * 2014-11-25 2015-03-11 浪潮电子信息产业股份有限公司 一种raid5磁盘阵列中坏扇区处理的方法和装置
WO2018142622A1 (ja) * 2017-02-06 2018-08-09 株式会社日立製作所 計算機

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03192573A (ja) * 1989-12-21 1991-08-22 Fujitsu Ltd 磁気ディスク装置
JP2006285527A (ja) * 2005-03-31 2006-10-19 Toshiba Corp ストレージ装置およびプログラム。
JP2008052547A (ja) * 2006-08-25 2008-03-06 Hitachi Ltd 記憶制御装置及び記憶制御装置の障害回復方法
WO2009130848A1 (ja) * 2008-04-25 2009-10-29 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005099995A (ja) * 2003-09-24 2005-04-14 Fujitsu Ltd 磁気ディスク装置のディスク共有方法及びシステム
ITPD20070241A1 (it) * 2007-07-16 2009-01-17 Silmar Spa Dispositivo di chiusura per catene di articoli ornamentali
JP2009026240A (ja) * 2007-07-23 2009-02-05 Hitachi Ltd 記憶制御システムおよび記憶制御方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03192573A (ja) * 1989-12-21 1991-08-22 Fujitsu Ltd 磁気ディスク装置
JP2006285527A (ja) * 2005-03-31 2006-10-19 Toshiba Corp ストレージ装置およびプログラム。
JP2008052547A (ja) * 2006-08-25 2008-03-06 Hitachi Ltd 記憶制御装置及び記憶制御装置の障害回復方法
WO2009130848A1 (ja) * 2008-04-25 2009-10-29 株式会社日立製作所 ストレージシステム及びストレージシステムの制御方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017128951A1 (en) * 2016-01-27 2017-08-03 Huawei Technologies Co., Ltd. Data protection for cold storage system
US9952927B2 (en) 2016-01-27 2018-04-24 Futurewei Technologies, Inc. Data protection for cold storage system
WO2018064928A1 (en) * 2016-10-04 2018-04-12 Huawei Technologies Co., Ltd. Data protection for a cold storage system
US10152378B2 (en) 2016-10-04 2018-12-11 Futurewei Technologies, Inc. Data protection for a cold storage system
US20240061741A1 (en) * 2020-12-26 2024-02-22 Intel Corporation Adaptive error correction to improve system memory reliability, availability, and serviceability (ras)

Also Published As

Publication number Publication date
JP5586712B2 (ja) 2014-09-10
JP2014137702A (ja) 2014-07-28

Similar Documents

Publication Publication Date Title
JP5391993B2 (ja) ディスクアレイ装置
JP5285610B2 (ja) グローバルホットスペアディスクが存在するときに、故障したドライブを復元、及びコピーバックする最適化された方法
CN100368976C (zh) 盘阵列设备和数据备份方法
JP5285611B2 (ja) グローバルホットスペアディスクが存在するときに、切断されたドライブを復元、及びコピーバックする最適化された方法
JP4441929B2 (ja) ディスク装置及びホットスワップ方法
JP2006252126A (ja) ディスクアレイ装置及びその再構築方法
WO2012051931A1 (zh) 廉价磁盘冗余阵列重构方法,装置及系统
US9740440B2 (en) Separating a hybrid asymmetric mix of a RAID 1 mirror and a parity-based RAID array
WO2014111979A1 (ja) ディスクアレイ制御装置およびディスクアレイ装置
JP2005099995A (ja) 磁気ディスク装置のディスク共有方法及びシステム
JP2006285527A (ja) ストレージ装置およびプログラム。
JP2010026812A (ja) 磁気ディスク装置
JP2006079219A (ja) ディスクアレイ制御装置およびディスクアレイ制御方法
JP2010267037A (ja) ディスクアレイ装置
JP2009151681A (ja) ディスクアレイ装置
JP2008217395A (ja) ディスクアレイ装置
JPWO2013038618A1 (ja) 情報記憶媒体ライブラリアレイ装置、情報記録方法及び情報記録プログラム
JP4143040B2 (ja) ディスクアレイ制御装置、同装置に適用されるデータ欠損検出時の処理方法及びプログラム
JP2006260376A (ja) ストレージ装置およびメディアエラー回復方法
JP2005107675A (ja) ディスクアレイコントローラ及びディスクドライブの複製方法
JP2007128183A (ja) ストレージシステム
JP2005166016A (ja) ディスクアレイ装置
JP6957845B2 (ja) ストレージ制御装置及びストレージ装置
JP5519573B2 (ja) 映像処理装置、映像処理方法、および、映像処理プログラム
JP2005107676A (ja) アレイコントローラ及びディスクアレイ再構築方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13871944

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13871944

Country of ref document: EP

Kind code of ref document: A1