JP2006268286A - Disk array device - Google Patents

Disk array device Download PDF

Info

Publication number
JP2006268286A
JP2006268286A JP2005083808A JP2005083808A JP2006268286A JP 2006268286 A JP2006268286 A JP 2006268286A JP 2005083808 A JP2005083808 A JP 2005083808A JP 2005083808 A JP2005083808 A JP 2005083808A JP 2006268286 A JP2006268286 A JP 2006268286A
Authority
JP
Japan
Prior art keywords
data
physical
disk
block
physical disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005083808A
Other languages
Japanese (ja)
Inventor
Tsutomu Ishizaki
勉 石崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005083808A priority Critical patent/JP2006268286A/en
Publication of JP2006268286A publication Critical patent/JP2006268286A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a disk array device capable of suppressing increase of time used for data restoration and increase of the number of physical disks, providing large capacity, improving reliability, increasing recording speed, reducing costs, and reducing size. <P>SOLUTION: Each of physical disks 11-16 is divided into three areas which are an A block 11A-16B, a B block 11B-16B, and a C block 11C-16C with storage areas that are respectively the same storage capacity. The A blocks 11A-16A are set in relationships comprising sets with the B blocks 11B-16B of different physical disks 11-16 with the same capacity, and the C blocks 11C-16C of physical disks 11-16 that are different to the other two physical disks. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、ディスクアレイ装置に関し、特に、大容量かつ信頼性の向上、記録速度の高速化、低コスト化、小型化を図ることができるディスクアレイ装置に関する。   The present invention relates to a disk array apparatus, and more particularly to a disk array apparatus that can achieve a large capacity and improved reliability, a high recording speed, a low cost, and a small size.

近年、企業のみならず一般家庭にもコンピュータが導入され、IT(Information technology)への依存度が増している。これに伴い、コンピュータシステムで取り扱う電子データの重要性はますます増大しており、当該電子データを記憶するコンピュータシステムにおける記憶装置の役割はますます大きくなってきている。このため、記憶装置の高性能化、大容量化はもとより、特に、高信頼性化の要求が高まる一方である。   In recent years, computers have been introduced not only to companies but also to general households, and the degree of dependence on IT (Information technology) has increased. Accordingly, the importance of electronic data handled by computer systems is increasing, and the role of storage devices in computer systems that store such electronic data is increasing. For this reason, the demand for higher reliability is increasing as well as higher performance and capacity of storage devices.

そして、記憶容量の大容量化が進む中で、電子データの信頼性を保つためには、大記憶容量のディスクの障害に備えて、ディスクに記憶された電子データを予備ディスクなどに複写することが従来より行われている。しかしながら、かかる方法では、ディスク(メインディスク)の障害を修復させた後に、予備ディスクに退避させた電子データをメインディスクに再度複写する必要がある。この複写に費やす時間は、ディスクの記憶容量に比例するため、記憶容量の大容量化の下では、かかる時間が増大するという問題が生じる。   In order to maintain the reliability of electronic data as the storage capacity increases, the electronic data stored on the disk should be copied to a spare disk in preparation for failure of the disk with the large storage capacity. Has been performed conventionally. However, in such a method, it is necessary to copy the electronic data saved in the spare disk to the main disk again after repairing the failure of the disk (main disk). Since the time spent for copying is proportional to the storage capacity of the disk, there arises a problem that the time required increases as the storage capacity increases.

これに対して、データの冗長性を維持しつつ、ディスクに対するデータ読み書き速度の向上を図るために、現在のハードディスクの多くは複数のディスクから構成され、かつ、それぞれのディスクにデータを分割して記憶するという手法(いわゆるRAID:Redundant Arrays of Inexpensive Disks))が採られている。そして、このような多重ハードディスクにおける障害対策技術、すなわち、データの冗長性を確保するための技術が、従来より研究されている。   In contrast, in order to improve data read / write speed while maintaining data redundancy, most current hard disks are composed of multiple disks, and data is divided into each disk. A method of storing (so-called RAID: Redundant Arrays of Inexpensive Disks) is employed. A failure countermeasure technique for such multiple hard disks, that is, a technique for ensuring data redundancy has been studied.

次に、従来のディスクアレイ装置について、図面を参照して説明する。   Next, a conventional disk array device will be described with reference to the drawings.

図5は、特許文献1に記載の技術を示す概略構成ブロック図である。   FIG. 5 is a schematic block diagram showing the technique described in Patent Document 1. As shown in FIG.

図5を参照すると、ディスクアレイ装置200は、上位装置300からの指令を受けて、RAIDコントローラ250による制御にて、RAID方式によるデータの記録が行われているものである。具体的には、図5は、RAID5方式を示すものであり、この方式は、書き込みデータを物理ディスクの台数分に分割し、かつ分割したデータに対応させてパリティデータをそれぞれ生成し、分割された書き込みデータとパリティデータを1組として、6台の物理ディスク210〜215にそれぞれ記録する方式を採っている。但し、これら6台の物理ディスクには、それぞれ対となる別の物理ディスク220〜225が備えられている。すなわち2台が1対のディスクを構成している。この1対のディスクは図5において仮想線にて囲まれた2台の物理ディスクであり、例えば符号210と220で示すディスクがこれらに相当する。そして、一方の各物理ディスク210〜215のデータエリアに記録した書き込みデータDA1〜DA6を、対となる他の物理ディスク220〜225にコピーする。従って分割した書き込みデータ及びパリティデータである各データDA1〜DA6と同じ内容のミラーデータDA1’〜DA6’が、対となる別の物理ディスクに記録されることとなる。   Referring to FIG. 5, the disk array device 200 receives data from the host device 300 and records data by the RAID system under the control of the RAID controller 250. Specifically, FIG. 5 shows a RAID 5 system. In this system, write data is divided into the number of physical disks, and parity data is generated in correspondence with the divided data. The write data and the parity data as a set are recorded on the six physical disks 210 to 215, respectively. However, these six physical disks are provided with separate physical disks 220 to 225 which form pairs. That is, the two units constitute a pair of disks. The pair of disks are two physical disks surrounded by a virtual line in FIG. 5, for example, disks denoted by reference numerals 210 and 220 correspond to these. Then, the write data DA1 to DA6 recorded in the data area of one of the physical disks 210 to 215 is copied to the other physical disks 220 to 225 that form a pair. Therefore, the mirror data DA1 'to DA6' having the same contents as the data DA1 to DA6, which are the divided write data and parity data, are recorded on another physical disk as a pair.

図6は、特許文献2に記載の技術を示す概略構成ブロック図である。   FIG. 6 is a schematic block diagram showing the technique described in Patent Document 2. As shown in FIG.

図6を参照すると、これもRAID5方式を使用しており、上位装置500からの指令によりデータを記録する際に、RAIDコントローラ450にて、図示された6台の物理ディスクの台数分に分割し、かつ分割したデータに対応させてパリティデータをそれぞれ生成し、分割された書き込みデータとパリティデータを1組として、6台の物理ディスクDA1〜DA6(410)に記録する構成である。ディスクアレイ装置400は、冗長ディスクの方式を用いたものであり、図示するように、データ用ディスクドライブ410に対して、列方向用冗長ディスクドライブ420と行方向用冗長ディスクドライブ430とを備えている。そして、分割されたデータとパリティデータとが格納されるデータ用ディスクドライブ410の行、列方向それぞれのパリティを生成して、列方向用冗長ディスクドライブ420と行方向用冗長ディスクドライブ430とに格納しておくことにより、データ用ディスクドライブ410のうち、複数台の物理ディスクが故障した場合に、より確実にデータの復旧を図る。   Referring to FIG. 6, this also uses the RAID5 system, and when data is recorded by a command from the host device 500, the RAID controller 450 divides the data into the number of the six physical disks shown. In addition, parity data is generated in correspondence with the divided data, and the divided write data and parity data are recorded as a set on six physical disks DA1 to DA6 (410). The disk array device 400 uses a redundant disk system, and includes a column-direction redundant disk drive 420 and a row-direction redundant disk drive 430 with respect to the data disk drive 410 as shown in the figure. Yes. Then, parity in the row and column directions of the data disk drive 410 in which the divided data and parity data are stored is generated and stored in the column direction redundant disk drive 420 and the row direction redundant disk drive 430. By doing so, when a plurality of physical disks out of the data disk drive 410 fail, the data can be restored more reliably.

特開平7ー129331号公報JP-A-7-129331 特開2000ー148409号公報JP 2000-148409 A

上述の特許文献1記載の技術は、物理ディスク台数の増加により、ディスク装置にかかるコストが増大し、また、物理ディスクが占有するスペースも増大し、ディスクアレイ装置自体の小型化を図ることはできないという課題がある。   The technique described in Patent Document 1 described above increases the cost of the disk device due to the increase in the number of physical disks, and also increases the space occupied by the physical disk, and the disk array device itself cannot be reduced in size. There is a problem.

また、物理ディスク2台故が故障した場合、例えば、図5において1対(2台)の物理ディスク210、220に障害が生じると縮退となり、非冗長状態でのデータ復旧処理を行わなければならないという課題がある。   Further, when two physical disks fail, for example, when a failure occurs in a pair (two) of physical disks 210 and 220 in FIG. 5, degeneration occurs, and data recovery processing in a non-redundant state must be performed. There is a problem.

特許文献2記載の技術は、特許文献1と同様に、物理ディスクの台数が多いため、ディスクに費やされるコストの増加という問題や、収納スペースの増大に伴い小型化を図ることができないという課題がある。   Since the technology described in Patent Document 2 has a large number of physical disks, as in Patent Document 1, there is a problem of an increase in the cost spent on the disks and a problem that the size cannot be reduced with an increase in storage space. is there.

また、物理ディスクが1台故障した場合には、物理ディスクに記憶させたデータに相当するデータを冗長ディスクに一旦複写し、その後、交換したディスクに冗長ディスクから複写することで再構築が完了するため、冗長ディスクを使用する方式では非冗長状態が存在するという課題がある。   When one physical disk fails, the data corresponding to the data stored in the physical disk is temporarily copied to the redundant disk, and then the replacement is completed from the redundant disk to complete the reconstruction. Therefore, there is a problem that a non-redundant state exists in the method using a redundant disk.

従って、データ復旧に費やされる時間の増加や、物理ディスク数の増加を抑制することができるディスクアレイ装置が望まれている。   Therefore, a disk array device that can suppress an increase in time spent for data recovery and an increase in the number of physical disks is desired.

本発明の目的は、上記課題を解決し、大容量かつ信頼性の向上、記録速度の高速化、さらには低コスト化、小型化を図ることができるディスクアレイ装置を提供することにある。   SUMMARY OF THE INVENTION An object of the present invention is to provide a disk array device that solves the above-described problems and can achieve a large capacity and improved reliability, a high recording speed, a low cost, and a small size.

本発明のディスクアレイ装置は、複数の物理ディスクと、上位装置からの指令に基づいて物理ディスクの記憶領域に対してデータの読み書きを行う制御部とを有し、各物理ディスクは、記憶領域がそれぞれ同一記憶容量となる3つの領域の第1ブロック、第2ブロック、第3ブロックに分割され、第1ブロックは、同容量である別の物理ディスクの第2ブロックと、2つの物理ディスクとは別の第3ブロックとがセットとなる関係に設定されていることを特徴とする。   The disk array device of the present invention has a plurality of physical disks and a control unit that reads / writes data from / to the storage area of the physical disk based on a command from the host apparatus, and each physical disk has a storage area. Each of the three areas having the same storage capacity is divided into a first block, a second block, and a third block. The first block is a second block of another physical disk having the same capacity and two physical disks. Another third block is set in a set relation.

セットとなる関係は、一の物理ディスクの分割された一の記憶領域と他の物理ディスクの分割された一の記憶領域と他の物理ディスクとは異なる物理ディスクの分割された一の記憶領域との間に設定されるとともに、一の物理ディスクの分割された他の一記憶領域と他の物理ディスクの他の一記憶領域と他の物理ディスクとは別の物理ディスクの分割された一の記憶領域との間に設定され、一の物理ディスクの他の記憶領域と他の物理ディスクの分割された他の一記憶領域と別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定されていることを特徴とする。   The set relationship is as follows: one storage area divided from one physical disk, one storage area divided from another physical disk, and one storage area divided from a physical disk different from the other physical disk One storage area of one physical disk and another storage area of another physical disk and one storage area of another physical disk that is different from the other physical disk. Another storage area that is set between the other physical disk and another physical disk that is divided between another physical disk and another physical disk that is divided between the other physical disks. It is characterized by being set between the area.

制御部は、セットとなる記憶領域を対応させるための対応関係データを保有し、対応関係データに基づいて、セットとなる関係の記憶領域に同一データを保持する管理機能を有することを特徴とする。   The control unit has correspondence data for associating storage areas to be set, and has a management function for holding the same data in the storage areas of the relation to be set based on the correspondence relation data .

セットとなる記憶領域は、データを書き込む領域として設定され、制御部は、記憶領域をデータ書込領域として特定するための書込領域特定データを保有し、上位装置からの指令に応じた書き込みデータを書込領域特定データに基づいて、記憶領域に書き込まれたデータと同一のデータを、記憶領域とセットとなる他の記憶領域にコピーする機能を有することを特徴とする。   The storage area to be set is set as an area for writing data, and the control unit has write area specifying data for specifying the storage area as the data writing area, and write data according to a command from the host device. Based on the write area specifying data, the same data as the data written in the storage area is copied to another storage area that is a set with the storage area.

制御部は、対応関係データに基づいてセットとなる記憶領域のいずれか1つから書き込みデータを読み出す機能を有することを特徴とする。   The control unit has a function of reading the write data from any one of the storage areas to be set based on the correspondence data.

制御部は、物理ディスクの交換を認識する交換認識機能を有すると共に、物理ディスクの交換を認識して、セットとなる関係にある他の物理ディスクの記憶領域のデータを交換された物理ディスクの記憶領域にコピーする機能を有することを特徴とする。   The control unit has a replacement recognition function for recognizing the replacement of the physical disk, recognizes the replacement of the physical disk, and stores the data in the storage area of the other physical disk that is in a set relationship. It has a function of copying to an area.

本発明のディスクアレイ装置は、物理ディスクが故障した場合に、物理ディスク内のデータが他の物理ディスクにコピーされているため、冗長状態を維持した状態で物理ディスク交換が可能であり、危険な非冗長期間を伴わず、データの信頼性が増す。従って、従来技術におけるディスク装置では、大容量の物理ディスクが障害により縮退した場合、冗長ディスク(ホットスペア等)への複写が完了するまでは非冗長状態となり、この危険な時間は物理ディスクの容量に比例することとなるが、これに対して本発明では、非常に優れた効果を有する。   In the disk array device of the present invention, when a physical disk fails, the data in the physical disk is copied to another physical disk. Therefore, the physical disk can be replaced while maintaining the redundant state, which is dangerous. Data reliability is increased without a non-redundant period. Therefore, in the conventional disk device, when a large-capacity physical disk is degraded due to a failure, it becomes a non-redundant state until copying to a redundant disk (hot spare, etc.) is completed. In contrast to this, the present invention has a very excellent effect.

また、上述したような冗長性を有しており、かつ、信頼性の高いディスクアレイ装置であるにもかかわらず、不要な物理ディスク台数の増加を抑制し、低コスト化且つ小型な装置を実現できる。従って、データ記録用として使用する物理ディスク台数の多い構成であればあるほど、多重障害に対する耐故障性能を向上させることが可能であり、かつ、低コスト化を図ることができるという優れた効果を有する。   In addition, despite the above-described redundancy and high reliability, the increase in the number of unnecessary physical disks is suppressed, and a low-cost and compact device is realized. it can. Therefore, as the number of physical disks used for data recording increases, the fault tolerance performance against multiple failures can be improved and the cost can be reduced. .

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。   Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.

図1において、ディスクアレイ装置1は上位装置30に接続され、上位装置30からの指令に基づいてデータの読み書きを行うディスクアレイ装置1であって、複数の物理ディスク11〜16にて構成されるディスクドライブ10と、物理ディスク11〜16に対してデータの読み書きの制御を行う制御部20(RAIDコントローラ)とを備えている。すなわち、前記制御部20は後述するように、セットとなる記憶領域を対応させるための前記対応関係データを保有し、前記対応関係データに基づいて、前記セットとなる関係の記憶領域に同一データを保持する管理機能を有している。   In FIG. 1, a disk array device 1 is a disk array device 1 that is connected to a host device 30 and reads / writes data based on a command from the host device 30, and is composed of a plurality of physical disks 11-16. A disk drive 10 and a control unit 20 (RAID controller) that controls reading and writing of data with respect to the physical disks 11 to 16 are provided. That is, as will be described later, the control unit 20 has the correspondence data for associating the storage areas to be set, and based on the correspondence data, the same data is stored in the storage areas of the relation to be set. It has a management function to hold.

ディスクドライブ10内には、図1においては6台の物理ディスク11〜16が格納されている。そして、それぞれの物理ディスク11〜16は、データの記憶領域が同一の記憶容量となる3つの領域に分割されてあらかじめ設定されている。ここでは、各物理ディスク11〜16の分割領域をブロックと呼び、3つの領域をそれぞれAブロック、Bブロック、Cブロックと呼ぶ。そして、分割されたAブロック、Bブロック及びCブロックは同一の容量に設定されている。すなわち各物理ディスク11〜16は、データの記憶領域が1/3の記憶領域を持つ分割領域11Aと11Bと11C、12Aと12Bと12C、13Aと13Bと13C、14Aと14Bと14C、15Aと15Bと15C、16Aと16Bと16Cに分割されている。   In the disk drive 10, six physical disks 11 to 16 are stored in FIG. Each of the physical disks 11 to 16 is set in advance by dividing the data storage area into three areas having the same storage capacity. Here, the divided areas of the physical disks 11 to 16 are called blocks, and the three areas are called A block, B block, and C block, respectively. The divided A block, B block, and C block are set to the same capacity. That is, each of the physical disks 11 to 16 has divided areas 11A and 11B and 11C, 12A and 12B and 12C, 13A and 13B and 13C, 14A and 14B and 14C, and 15A having a data storage area of 1/3. It is divided into 15B and 15C, and 16A, 16B and 16C.

さらに本発明において、一の物理ディスクの分割された記憶領域は、他の物理ディスクの分割された記憶領域と、前記他の物理ディスクとは異なる別の物理ディスクの分割された記憶領域とセットをなす関係に設定されている。前記セットをなす関係の例を説明すると、前記セットをなす関係は後述の図3(a)及び図3(b)に示すように、前記一の物理ディスクの分割された記憶領域と、前記他の物理ディスクの分割された一の記憶領域と、前記他の物理ディスクとは別の物理ディスクの分割領域との間に設定されるとともに、前記一の物理ディスクの分割された他の記憶領域と、前記他の物理ディスクの分割された他の記憶領域と、前記他の物理ディスクとは別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定され、さらに前記一の物理ディスクの分割された残りの記憶領域は前記のどの物理ディスクとは別の物理ディスクの分割された一の記憶領域と前記のどの物理ディスクとは別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定される。   Further, in the present invention, the divided storage area of one physical disk includes a set of a divided storage area of another physical disk and a divided storage area of another physical disk different from the other physical disk. The relationship is established. An example of the relationship forming the set will be described. The relationship forming the set is as shown in FIGS. 3A and 3B described later, and the divided storage area of the one physical disk and the other Set between a divided storage area of the physical disk and a divided area of a physical disk different from the other physical disk, and another divided storage area of the one physical disk , Set between another storage area of the other physical disk and one storage area of another physical disk that is different from the physical disk different from the other physical disk, and The remaining storage area of the one physical disk is further separated from the one storage area of the physical disk different from any of the physical disks and the physical disk different from any of the physical disks. Physical display It is set between the divided first storage regions.

上記例に、前記一の物理ディスクの分割された一の記憶領域と前記他の物理ディスクの分割された一の記憶領域と前記他の物理ディスクとは別の物理ディスクの分割された一の記憶領域との間に設定されるセットをなす関係について説明する。   In the above example, one divided storage area of the one physical disk, one divided storage area of the other physical disk, and one divided storage of a physical disk different from the other physical disk A description will be given of the relationship that forms a set with the area.

この場合、同一内容のデータが記録されるセットをなすいずれか一つの分割領域は、一の物理ディスクのAブロックに設定され、セットをなす他の二つの分割領域は、前記一の物理ディスクとは異なる他の物理ディスクのBブロックと、前記他の物理ディスクとは別の物理ディスクのCブロックに設定される。また、前記別の物理ディスクのAブロックは、前記Cブロックを記憶領域にもつ物理ディスクのBブロックと、前記別の物理ディスクとは異なるさらに別の物理ディスクのCブロックとセットをなすように設定されている。   In this case, any one divided area forming a set in which data of the same content is recorded is set to the A block of one physical disk, and the other two divided areas forming the set are the same as the one physical disk. Are set to B blocks of different physical disks and C blocks of physical disks different from the other physical disks. In addition, the A block of the other physical disk is set to form a set with a B block of a physical disk having the C block as a storage area and a C block of another physical disk different from the other physical disk. Has been.

さらに、図1を参照して具体的に説明する。符号12で示す物理ディスクについて説明すると、同一内容のデータが記憶されるセットをなす分割領域は、一の物理ディスク12のAブロック(12A)と他の物理ディスク13のBブロック(13B)と前記他の物理ディスクとは別の物理ディスク14のCブロック(14C)とにそれぞれ設定される。したがって、物理ディスク12のAブロック(12A)と物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)とはセットをなすこととなり、これらのAブロック(12A)とBブロック(13B)とCブロック(14C)とに同一内容のデータが書き込まれる。また、物理ディスク13のAブロック(13A)と他の物理ディスク14のBブロック(14B)と前記他の物理ディスクとは別の物理ディスク15のCブロック(15C)とは、同一内容のデータが書き込まれるセットをなす分割領域として設定される。同様に図2に示すように、物理ディスク14、15、16、11のAブロック14A、15A、16A、11Aと物理ディスク15、16、11、12のBブロック15B、16B、11B、12Bと物理ディスク16、11、12、13のCブロック16C、11C、12C、13Cとは、同一の内容のデータが書き込まれるセットとなる分割領域として設定される。なお、セットとなるAブロック、BブロックおよびCブロックの関係を矢印Y1〜Y6で示している。   Furthermore, it demonstrates concretely with reference to FIG. The physical disk denoted by reference numeral 12 will be described. The divided areas forming a set in which data of the same contents are stored are the A block (12A) of one physical disk 12, the B block (13B) of another physical disk 13, and the above-described divided areas. It is set in the C block (14C) of the physical disk 14 different from the other physical disks. Accordingly, the A block (12A) of the physical disk 12, the B block (13B) of the physical disk 13, and the C block (14C) of the physical disk 14 form a set, and these A block (12A) and B block ( 13B) and C block (14C) are written with the same contents. Also, the A block (13A) of the physical disk 13, the B block (14B) of the other physical disk 14, and the C block (15C) of the physical disk 15 different from the other physical disks have the same data. It is set as a divided area forming a set to be written. Similarly, as shown in FIG. 2, physical blocks 14, 15, 16, and 11 A blocks 14A, 15A, 16A, and 11A and physical disks 15, 16, 11, and 12 B blocks 15B, 16B, 11B, and 12B and physical The C blocks 16C, 11C, 12C, and 13C of the disks 16, 11, 12, and 13 are set as divided areas that are sets in which data having the same contents are written. In addition, the relationship between the A block, B block, and C block to be set is indicated by arrows Y1 to Y6.

次に、本発明を実施するための最良の形態の動作について図面を参照して説明する。   Next, the operation of the best mode for carrying out the present invention will be described with reference to the drawings.

上述したセットとなる分割領域として設定されたAブロック、Bブロック、Cブロックとの対応関係を示すセットとなる分割領域同士の対応関係データは、制御部であるRAIDコントローラ20内の記憶領域(不揮発メモリ等)に記憶されている。RAIDコントローラ20は、対応関係データに基づいて、一の物理ディスク11〜16のAブロックと他の物理ディスク12、13、14、15、16、11のBブロックと、前記他の物理ディスクとは別の物理ディスク13、14、15、16、11、12のCブロックとに同一データを保持する管理機能を実行する。   Correspondence data between the divided areas constituting the set indicating the corresponding relation with the A block, B block, and C block set as the divided areas constituting the set described above is a storage area (non-volatile) in the RAID controller 20 as the control unit. Memory). The RAID controller 20 determines the A block of one physical disk 11 to 16, the B block of other physical disks 12, 13, 14, 15, 16, and 11, and the other physical disk based on the correspondence data. A management function for holding the same data in the C blocks of other physical disks 13, 14, 15, 16, 11, 12 is executed.

ここで制御部であるRAIDコントローラ20には、RAID構築の管理を行うRAIDコントロール部21と、物理ディスクへのアクセスを管理するディスクドライバ22と、コピーを実行するミラー制御部23とが構築されている。そして、特に、このミラー制御部23には、上記のRAIDコントローラ20内に記憶されている対応関係データに基づいて、セットとなる物理ディスク11〜16の分割領域(A、B、Cブロック)に対してそれぞれ同一データを書き込む機能、すなわち、ミラーリング実行機能が備えられている。   Here, the RAID controller 20 as a control unit includes a RAID control unit 21 that manages RAID construction, a disk driver 22 that manages access to a physical disk, and a mirror control unit 23 that performs copying. Yes. In particular, the mirror control unit 23 stores the divided areas (A, B, and C blocks) of the physical disks 11 to 16 as a set based on the correspondence data stored in the RAID controller 20. On the other hand, a function for writing the same data, that is, a mirroring execution function is provided.

なお、RAID方式のうち、特にRAID1及びRAID5の方式について説明する。RAID1方式は2台の物理ディスクに対して同一データを書き込み一方の物理ディスクの障害発生に対処してデータを保護する方式である。RAID5方式は書き込みデータを複数に分割し、かつ分割した書き込みデータに対応させてパリティデータをそれぞれ生成し、複数の物理ディスクに分散して記憶する方式である。   Of the RAID systems, the RAID 1 and RAID 5 systems will be described in particular. The RAID 1 method is a method for protecting the data by writing the same data to two physical disks and dealing with the occurrence of a failure in one physical disk. The RAID5 method is a method in which write data is divided into a plurality of pieces, parity data is generated corresponding to the divided write data, and is distributed and stored in a plurality of physical disks.

本発明のディスクアレイ装置において、セットとなる分割領域のうちいずれか一つがデータ書込用領域として設定される。例えば、物理ディスク12の分割領域12A、物理ディスク13の分割領域13B、及び物理ディスク14の分割領域14Cがセットとなっている場合に、その内一つの分割領域12Aがデータ書込用領域として設定される。そしてかかる1セットの分割領域において、分割領域12Aがデータ書込用領域である旨を表す書込領域特定データが、RAIDコントローラ20内の記憶領域に記録される。書込領域特定データは、例えばディスクドライバ22内のメモリに記憶されている。それぞれセットとなる他の分割領域についても同様である。   In the disk array device of the present invention, any one of the divided areas to be set is set as a data writing area. For example, when the divided area 12A of the physical disk 12, the divided area 13B of the physical disk 13, and the divided area 14C of the physical disk 14 are set, one of the divided areas 12A is set as the data writing area. Is done. In such a set of divided areas, write area specifying data indicating that the divided area 12A is a data writing area is recorded in a storage area in the RAID controller 20. The write area specifying data is stored in a memory in the disk driver 22, for example. The same applies to the other divided areas that form a set.

そして、これに伴い、RAIDコントローラ20、例えば、ディスクドライバ22は、上記書込領域特定データに基づいて、データ書込用領域に上位装置30からの指令に応じて書き込みデータを書き込む機能を有している。そして、上述したミラーリング実行機能にて、セットとなる分割領域の対応関係を表した対応関係データに基づいて、当該データ書込用領域内のデータと同一データを当該領域とセットとなる分割領域に書き込まれる。このようにセットとなるいずれかの物理ディスクに対してデータを書き込むことにより、この書き込まれたデータは前記ミラーリング機能により他の2台の物理ディスクにコピーされるため、データの書き込みはセットとなるいずれか一台の物理ディスクにのみ行えばよく、データの冗長性を維持しつつ、データ書き込みの高速化を図ることができる。   Accordingly, the RAID controller 20, for example, the disk driver 22 has a function of writing write data to the data write area in accordance with a command from the host device 30 based on the write area specifying data. ing. Based on the correspondence data representing the correspondence of the divided areas to be set by the mirroring execution function described above, the same data as the data in the data writing area is divided into the divided areas to be set with the area. Written. By writing data to one of the physical disks that make a set in this way, the written data is copied to the other two physical disks by the mirroring function, so the data write becomes a set. Only one of the physical disks needs to be performed, and data writing speed can be increased while maintaining data redundancy.

次に、ミラーリング機能の動作について、図2を参照して詳細に説明する。   Next, the operation of the mirroring function will be described in detail with reference to FIG.

図2は、図1に開示したディスクドライブを示したものである。図2における各物理ディスク11〜16の各ブロック11A、11B、11C等には、それぞれDA1、DA2、DA3等が書き込まれている。そして、例えば、物理ディスク12は、その記憶領域が上述したように同容量のAブロック(12A)とBブロック(12B)とCブロック(12C)とに領域分割されており、Aブロック(12A)は物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)とセットとなっている。(矢印Y2、Y2’参照)。また物理ディスク12のBブロック(12B)は物理ディスク13のCブロック(13C)と物理ディスク11のAブロック(11A)とセットとなっている。(矢印Y1、Y1’参照)。そして物理ディスク12のCブロック(12C)は物理ディスク16のAブロック(16A)と物理ディスク11のBブロック(11B)とセットとなっている。(矢印Y6、Y6’参照)。そしてディスクドライバ22から物理ディスク12のAブロック(12A)にコマンドが発行された場合、ミラー制御部23が該当Aブロック(12A)とセットとなっている物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)に対してコピーを実行する。これにより物理ディスク12のAブロック(12A)に書き込まれているデータDA2が、物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)にコピーされることになる(DA2’、DA2’’)。   FIG. 2 shows the disk drive disclosed in FIG. DA1, DA2, DA3, etc. are written in each block 11A, 11B, 11C, etc. of each physical disk 11-16 in FIG. For example, the storage area of the physical disk 12 is divided into an A block (12A), a B block (12B), and a C block (12C) having the same capacity as described above, and the A block (12A). Is a set of the B block (13B) of the physical disk 13 and the C block (14C) of the physical disk 14. (See arrows Y2, Y2 '). The B block (12B) of the physical disk 12 is a set of the C block (13C) of the physical disk 13 and the A block (11A) of the physical disk 11. (See arrows Y1, Y1 '). The C block (12C) of the physical disk 12 is a set of the A block (16A) of the physical disk 16 and the B block (11B) of the physical disk 11. (See arrows Y6, Y6 '). When a command is issued from the disk driver 22 to the A block (12A) of the physical disk 12, the mirror control unit 23 and the B block (13B) of the physical disk 13 that is paired with the corresponding A block (12A) Copying is performed on the C block (14C) of the disk 14. As a result, the data DA2 written in the A block (12A) of the physical disk 12 is copied to the B block (13B) of the physical disk 13 and the C block (14C) of the physical disk 14 (DA2 ′, DA2 '').

また、ミラー制御部23は、他のブロックに対しても同様に作動する。すなわち、ディスクドライブ10がN台の物理ディスクで構成されている場合、N台目の物理ディスク(図2では符号16で示すディスク)のAブロック(16A)は、一台目の物理ディスク11のBブロック(11B)及び二台目の物理ディスク12のCブロック(12C)とセットとなっており、N台目の物理ディスク16のBブロック(16B)は、N―1台目の物理ディスク15のAブロック(15A)及び一台目の物理ディスク11のCブロック(11C)とセットとなっており、N台目の物理ディスク16のCブロック(16C)は、N−2台目の物理ディスク14のAブロック(14A)及びN−1台目の物理ディスク15のBブロック(15B)とセットとなっている。このようにして、各ブロック同士はセットとなる(矢印Y1〜Y6、Y1‘〜Y6’参照)。   The mirror controller 23 operates in the same manner for other blocks. That is, when the disk drive 10 is composed of N physical disks, the A block (16A) of the Nth physical disk (the disk indicated by reference numeral 16 in FIG. 2) is the same as that of the first physical disk 11. The B block (11B) and the C block (12C) of the second physical disk 12 are set, and the B block (16B) of the Nth physical disk 16 is the N-1th physical disk 15 The A block (15A) and the C block (11C) of the first physical disk 11 are set, and the C block (16C) of the Nth physical disk 16 is the N-2th physical disk. It is a set with 14 A blocks (14A) and B block (15B) of the (N-1) th physical disk 15. In this way, each block becomes a set (see arrows Y1 to Y6, Y1 'to Y6').

そして、ディスクドライバ22から各Aブロック(11A、12A、13A、14A、15A、16A)にコマンドが発行された場合、ミラー制御部23は、あらかじめ記憶している対応関係データに基づいて各Aブロック(11A、12A、13A、14A、15A、16A)とセットとなる各Bブロック(12B、13B、14B、15B、16B、11B)と各Cブロック(13C、14C、15C、16C、11C、12C)を認識し、各Aブロックのデータ(DA1、DA2、DA3、DA4、DA5、DA6)をセットとなる各Bブロックにコピーするミラーリング処理を実行する。前記ミラーリング処理により、前記Aブロックのデータに対応して、各Bブロックにコピーされたデータに、符号DA1’、DA2’、DA3’、DA4’、DA5’、DA6’を、各Cブロックに書き込まれたデータに、符号DA1’’、DA2’’、DA3’’、DA4’’、DA5’’、DA6’’を付して示している。   When a command is issued from the disk driver 22 to each A block (11A, 12A, 13A, 14A, 15A, 16A), the mirror control unit 23 determines each A block based on the correspondence data stored in advance. (11A, 12A, 13A, 14A, 15A, 16A) and each B block (12B, 13B, 14B, 15B, 16B, 11B) and each C block (13C, 14C, 15C, 16C, 11C, 12C) And a mirroring process for copying the data of each A block (DA1, DA2, DA3, DA4, DA5, DA6) to each B block to be set is executed. By the mirroring process, the codes DA1 ′, DA2 ′, DA3 ′, DA4 ′, DA5 ′, DA6 ′ are written to each C block corresponding to the data of the A block. The data DA1 ″, DA2 ″, DA3 ″, DA4 ″, DA5 ″, DA6 ″ are added to the data.

このように、本発明では、ディスクアレイ装置における、物理ディスク単体のディスク(記憶容量)を同容量の3ブロックに領域分割し、それぞれAブロック、Bブロック、Cブロックとし、Aブロックは同容量である前記他の物理ディスクのBブロックと前記他の物理ディスクとは別の物理ディスクのCブロックとセットをなし、Aブロックにデータを書き込み、Aブロックに書き込まれたデータをBブロック及びCブロックにコピーする。このため、物理ディスクに突発的な障害が生じた場合でも、物理ディスクを領域分割して自動的にデータを異なる物理ディスクに三重化していることにより、予備ディスクを用いることなく耐故障性能の向上を図ることができる。このとき、不必要な予備ディスクを用いていないため、物理ディスクの台数の増加を抑制することができ、装置の低コスト化、小型化を図ることができる。特に、分割領域をすべて同一容量にすることにより、すべてのデータが確実にコピーされることになり、データの信頼性が増す。   As described above, in the present invention, the disk (storage capacity) of a single physical disk in the disk array apparatus is divided into three blocks having the same capacity, and each of these blocks is designated as A block, B block, and C block. The B block of the other physical disk and the C block of a physical disk different from the other physical disk are set, the data is written to the A block, and the data written to the A block is changed to the B block and the C block. make a copy. For this reason, even if a sudden failure occurs in a physical disk, the fault tolerance performance can be improved without using a spare disk by dividing the physical disk into areas and automatically tripleting the data to different physical disks. Can be planned. At this time, since an unnecessary spare disk is not used, an increase in the number of physical disks can be suppressed, and the cost and size of the apparatus can be reduced. In particular, by making all the divided areas have the same capacity, all data is surely copied, and the reliability of the data is increased.

さらには、RAIDコントローラ20は、物理ディスクが交換されたことを認識する交換認識機能を有している。例えば、ディスクドライバ22が各物理ディスク11〜16の稼働状況を常に監視し、障害時には縮退すると共に、取り外された後に新たなディスクが装着されたことを認識する。そして、これに伴い、上記ミラー制御部23は、対応関係データに基づいて交換された物理ディスクの分割領域に対してセットとなる分割領域を認識し、当該分割領域に記憶されているデータと同一のデータを交換された物理ディスクの分割領域に書き込む機能を有する。これにより、物理ディスクが故障した際には、当該ディスクを交換することにより、交換された分割領域にデータがコピーされる。その後、RAIDコントロール部21は、データ復旧処理機能に基づいて、故障した物理ディスクから他の物理ディスクにコピーしたデータと、正常な物理ディスクに書き込まれたデータとから、故障した物理ディスクに代えて交換する新たな物理ディスクに書き込むために必要なデータを復旧させる。   Furthermore, the RAID controller 20 has a replacement recognition function for recognizing that a physical disk has been replaced. For example, the disk driver 22 constantly monitors the operating status of each of the physical disks 11 to 16 and degenerates when a failure occurs, and recognizes that a new disk has been mounted after being removed. Along with this, the mirror control unit 23 recognizes a divided area that is a set for the divided area of the physical disk that has been exchanged based on the correspondence data, and is the same as the data stored in the divided area. Has the function of writing the data in the divided area of the exchanged physical disk. Thereby, when a physical disk fails, the data is copied to the replaced divided area by replacing the disk. Thereafter, the RAID control unit 21 replaces the failed physical disk with the data copied from the failed physical disk to another physical disk and the data written to the normal physical disk based on the data recovery processing function. Restore the data needed to write to the new physical disk to be replaced.

また、本ディスクアレイ装置1の、上記RAIDコントローラ20、特に、RAIDコントロール部21及びディスクドライバ22は、データ読み出し時には、物理ディスク11〜16から対応関係データに基づいてセットとなる3ブロックのうちのいずれかからデータを読み出す機能を有する。例えば、各物理ディスク11〜16のAブロック(11A等)のみから、上位装置30からの指令にて、当該ブロックに記録されているデータDA1等を読み出す。これにより、上述したように冗長性を維持し、物理ディスクの不要な増加を抑制しつつ、読み出し時にはセットとなるディスクのうちいずれかにアクセスすればよいため、アクセス時間の短縮化を図ることができる。   Further, the RAID controller 20, particularly the RAID control unit 21 and the disk driver 22 of the present disk array device 1, among the three blocks that are set based on the correspondence data from the physical disks 11 to 16 when reading data. It has a function of reading data from either. For example, the data DA1 and the like recorded in the block are read from only the A block (11A and the like) of each physical disk 11 to 16 in response to a command from the host device 30. As a result, as described above, redundancy can be maintained and an unnecessary increase in physical disks can be suppressed, and any one of the disks in the set can be accessed at the time of reading, so that the access time can be shortened. it can.

次に、本発明の具体的な実施例について、図3、図4を参照して説明する。   Next, specific examples of the present invention will be described with reference to FIGS.

以上の説明ではRAIDを適用しない場合について説明したが、図3(a)は、本発明のディスクアレイ装置1をRAID1レベル相当のRAID装置に適用した一例を示すものである。   Although the case where RAID is not applied has been described in the above description, FIG. 3A shows an example in which the disk array device 1 of the present invention is applied to a RAID device equivalent to the RAID 1 level.

この図に示すディスクドライブ100は、6台の物理ディスク101〜106にて構成されており、各物理ディスクの記憶領域は、同一容量の3つの記憶領域に分割されている。そして、上述したように、相互に物理ディスクが異なることを前提として、各分割領域は他の分割領域とセットとなっている。例えば、物理ディスク101のAブロック(101A)と物理ディスク102のBブロック(102B)と物理ディスク103のCブロック(103C)とがセットとなっている(図中の矢印参照)。他の分割領域も同様である。このような構成において、まず、物理ディスク101の分割領域101Aに記憶されたDA1が、RAID1の作用により、物理ディスク102の分割領域102AにデータDA1’として記憶される。また、分割領域101Aとセットとなる物理ディスク102の分割領域102Bと物理ディスク103の分割領域103Cにも、上述したミラーリング機能の作用により、それぞれデータDA1’、データDA1’’が記憶される。さらに、上記のRAID1の作用により物理ディスク102の分割領域102Aに記憶されたデータDA1’も、当該分割領域102Aとセットとなる物理ディスク領域103B、104Cに上記ミラーリング機能にて複写される(データDA1’’、データDA1’’’)。これにより、物理ディスクの台数の不必要な増加を抑制しつつ、ディスクの耐故障性能の向上を図ることができる。   The disk drive 100 shown in this figure is composed of six physical disks 101 to 106, and the storage area of each physical disk is divided into three storage areas of the same capacity. As described above, on the assumption that the physical disks are different from each other, each divided area is a set with other divided areas. For example, the A block (101A) of the physical disk 101, the B block (102B) of the physical disk 102, and the C block (103C) of the physical disk 103 are set (see arrows in the figure). The same applies to other divided regions. In such a configuration, first, DA1 stored in the divided area 101A of the physical disk 101 is stored as data DA1 'in the divided area 102A of the physical disk 102 by the action of RAID1. Data DA1 'and data DA1 "are also stored in the divided area 102B of the physical disk 102 and the divided area 103C of the physical disk 103, which are paired with the divided area 101A, due to the above-described mirroring function. Further, the data DA1 ′ stored in the divided area 102A of the physical disk 102 by the action of the RAID1 is also copied to the physical disk areas 103B and 104C paired with the divided area 102A by the mirroring function (data DA1 '', Data DA1 '' '). As a result, it is possible to improve the fault tolerance performance of the disk while suppressing an unnecessary increase in the number of physical disks.

次に本発明のディスクアレイ装置をRAID5レベル相当のRAID装置に適用した場合の一例を図3(b)に示して説明する。この図に示す例においては、図3(a)の場合と同様に、ディスクドライブ100に6台の物理ディスク101〜106が備えられており、それぞれが3つの領域に分割されている(領域101A、101B、101C等)。   Next, an example in which the disk array device of the present invention is applied to a RAID device equivalent to RAID 5 level will be described with reference to FIG. In the example shown in this figure, as in the case of FIG. 3A, the disk drive 100 is provided with six physical disks 101 to 106, each of which is divided into three areas (area 101A). , 101B, 101C, etc.).

RAID5では、図示しない上位装置からの指令にて書き込まれる書き込み用データとそのデータに対応させて生成されたパリティデータが各データエリアに分散され、記憶されている。そして、これらAブロック(101A、102A、103A、104A、105A、106A)とセットとなる前記他の物理ディスクのBブロック(102B、103B、104B、105B、106B、101B)、前記他の物理ディスクとは別の物理ディスクのCブロック(103C、104C、105C、106C、101C、102C)にコピーされることとなる(DA1’〜DA6’、DA1’’〜DA6’’)。この対応関係は、図2に示したものとほぼ同様である。   In RAID5, write data written by a command from a host device (not shown) and parity data generated corresponding to the data are distributed and stored in each data area. The B block (102B, 103B, 104B, 105B, 106B, 101B) of the other physical disk that is combined with these A blocks (101A, 102A, 103A, 104A, 105A, 106A), the other physical disk and Are copied to C blocks (103C, 104C, 105C, 106C, 101C, 102C) of another physical disk (DA1 ′ to DA6 ′, DA1 ″ to DA6 ″). This correspondence is almost the same as that shown in FIG.

そして、RAID5に適用した場合に、複数の物理ディスクが故障したときの復旧動作を、図4を参照して説明する。まず、図4(a)に示す状態は、2台の物理ディスク102、103が故障した場合である。この場合、障害を起こした2台の物理ディスク102、103を正常な2台の物理ディスクと交換する。物理ディスク102、103が交換されるとRAIDコントローラ20は、2台の新規な物理ディスク102、103を認識する。   The recovery operation when a plurality of physical disks fail when applied to RAID 5 will be described with reference to FIG. First, the state shown in FIG. 4A is a case where two physical disks 102 and 103 have failed. In this case, the two failed physical disks 102 and 103 are replaced with two normal physical disks. When the physical disks 102 and 103 are replaced, the RAID controller 20 recognizes two new physical disks 102 and 103.

次にRAIDコントローラ20は、物理ディスク101のAブロックからデータDA1およびBブロックからデータDA6‘を、物理ディスク104のBブロックからデータDA3’およびCブロックからデータDA2’’を読み出し、データDA1のコピーを新規物理ディスク102のBブロックと新規物理ディスク103のCブロックにそれぞれデータDA1’、データDA1’’として書き込む(矢印YA1)。さらにデータDA6’のコピーを新規物理ディスク102のCブロックにデータDA6’’として書き込み(矢印YA6)、データDA3’のコピーを新規物理ディスク103のAブロックにデータDA3として書き込み(矢印YA3)、データDA2’のコピーを新規物理ディスク102のAブロックと新規物理ディスク103のBブロックにそれぞれデータDA2、データDA2’として書き込む(矢印YA2)。以上の処理を経て再構築が完了する。   Next, the RAID controller 20 reads data DA1 and data DA6 ′ from the block A of the physical disk 101, data DA6 ′ from the block B of the physical disk 104, data DA2 ″ from the block C, and copies the data DA1. Are written as data DA1 ′ and data DA1 ″ to the B block of the new physical disk 102 and the C block of the new physical disk 103, respectively (arrow YA1). Further, a copy of the data DA6 ′ is written to the C block of the new physical disk 102 as data DA6 ″ (arrow YA6), and a copy of the data DA3 ′ is written to the A block of the new physical disk 103 as data DA3 (arrow YA3). A copy of DA2 ′ is written as data DA2 and data DA2 ′ in the A block of the new physical disk 102 and the B block of the new physical disk 103, respectively (arrow YA2). The reconstruction is completed through the above processing.

また、図4(b)に示すように、3台の物理ディスク102、103、104が故障した場合、障害を起こした3台の物理ディスク102、103、104を正常な3台の物理ディスクに交換する。物理ディスク102、103、104が交換されると、RAIDコントローラ20は3台の新規な物理ディスク102、103、104を認識する。   Further, as shown in FIG. 4B, when three physical disks 102, 103, and 104 fail, the three failed physical disks 102, 103, and 104 become normal three physical disks. Exchange. When the physical disks 102, 103, and 104 are exchanged, the RAID controller 20 recognizes three new physical disks 102, 103, and 104.

次にRAIDコントローラ20は、物理ディスク101のAブロックからデータDA1を読み出し、物理ディスク105のCブロックからデータDA3’’を読み出し、物理ディスク106のAブロック、Bブロック、CブロックからそれぞれDA6、DA5’、DA4’’を読み出す。そしてRAIDコントローラ20は読み出した複数のデータDA1、DA3’’、 DA6、DA5’、DA4’’から、複数のデータ及びパリティデータに基づいて、消失したDA2を再構築する。このデータを構築する方式は、RAID5におけるデータ再構築に用いられる汎用のものであり、その詳細は省略する。   Next, the RAID controller 20 reads data DA1 from the A block of the physical disk 101, reads data DA3 '' from the C block of the physical disk 105, and DA6, DA5 from the A block, B block, and C block of the physical disk 106, respectively. ', DA4' 'is read. Then, the RAID controller 20 reconstructs the lost DA2 based on the plurality of data and the parity data from the plurality of read data DA1, DA3 ″, DA6, DA5 ′, DA4 ″. This method of constructing data is a general-purpose method used for data reconstruction in RAID 5, and details thereof are omitted.

次にRAIDコントローラ20は、再構築したデータDA2を新規な物理ディスク102のAブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク102のAブロックに書き込んだDA2を新規な物理ディスク103のBブロックおよび新規な物理ディスク104のCブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク101のAブロックに書き込まれているデータDA1を、新規な物理ディスク102のBブロックおよび新規な物理ディスク103のCブロックにそれぞれコピーする(矢印YB1)。さらにRAIDコントローラ20は物理ディスク101のBブロックに書き込まれているデータDA6’を新規な物理ディスク102のCブロックにコピーする(矢印YB6)。さらにRAIDコントローラ20は物理ディスク105のCブロックに書き込まれているDA3’’を新規な物理ディスク103のAブロックおよび新規な物理ディスク104のBブロックにコピーする(矢印YB3)。さらにRAIDコントローラ20は物理ディスク105のBブロックに書き込まれているDA4’を新規な物理ディスク104のAブロックにコピーする(矢印YB4)。以上の処置を経て、障害を起こした物理ディスク102、103、104に記憶させておくべきデータを復旧させる。   Next, the RAID controller 20 writes the reconstructed data DA2 to the A block of the new physical disk 102. Further, the RAID controller 20 writes DA2 written to the A block of the physical disk 102 to the B block of the new physical disk 103 and the C block of the new physical disk 104. Further, the RAID controller 20 copies the data DA1 written in the A block of the physical disk 101 to the B block of the new physical disk 102 and the C block of the new physical disk 103 (arrow YB1). Further, the RAID controller 20 copies the data DA6 'written in the B block of the physical disk 101 to the C block of the new physical disk 102 (arrow YB6). Further, the RAID controller 20 copies DA3 ″ written in the C block of the physical disk 105 to the A block of the new physical disk 103 and the B block of the new physical disk 104 (arrow YB3). Further, the RAID controller 20 copies DA4 'written in the B block of the physical disk 105 to the A block of the new physical disk 104 (arrow YB4). Through the above processing, the data to be stored in the failed physical disks 102, 103, 104 is recovered.

また、図4(c)に示すように、4台の物理ディスク102、103、104、106が故障した場合、障害を起こした4台の物理ディスク102、103、104、106を正常な4台の物理ディスクに交換する。物理ディスク102、103、104、106が交換されると、RAIDコントローラ20は4台の新規な物理ディスク102、103、104、106を認識する。   Further, as shown in FIG. 4C, when four physical disks 102, 103, 104, and 106 fail, the four failed physical disks 102, 103, 104, and 106 are normal. Replace with a physical disk. When the physical disks 102, 103, 104, 106 are replaced, the RAID controller 20 recognizes four new physical disks 102, 103, 104, 106.

次にRAIDコントローラ20は物理ディスク101のAブロックとBブロックからそれぞれデータDA1とDA6’を読み出し、物理ディスク105のAブロック、Bブロック、CブロックからそれぞれDA5、DA4’、DA3’’を読み出す。そしてRAIDコントローラ20は読み出した複数のデータDA1、DA6’、 DA5、DA4’、DA3’’から、複数のデータ及びパリティデータに基づいて、消失したDA2を再構築する。このデータを構築する方式は、RAID5におけるデータ再構築に用いられる汎用のものであり、その詳細は省略する。   Next, the RAID controller 20 reads data DA1 and DA6 'from the A block and B block of the physical disk 101, and reads DA5, DA4' and DA3 "from the A block, B block and C block of the physical disk 105, respectively. Then, the RAID controller 20 reconstructs the lost DA2 based on the plurality of data and parity data from the plurality of read data DA1, DA6 ', DA5, DA4', DA3 ". This method of constructing data is a general-purpose method used for data reconstruction in RAID 5, and details thereof are omitted.

次にRAIDコントローラ20は、再構築したデータDA2を新規な物理ディスク102のAブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク102のAブロックに書き込んだDA2を新規な物理ディスク103のBブロックおよび新規な物理ディスク104のCブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク101のAブロックに書き込まれているデータDA1を、新規な物理ディスク102のBブロックおよび新規な物理ディスク103のCブロックにそれぞれコピーする(矢印YC1)。さらにRAIDコントローラ20は物理ディスク101のBブロックに書き込まれているデータDA6’を新規な物理ディスク102のCブロックおよび新規な物理ディスク106のAブロックにそれぞれコピーする(矢印YC6)。さらにRAIDコントローラ20は物理ディスク105のCブロックに書き込まれているデータDA3’’を新規な物理ディスク103のAブロックおよび新規な物理ディスク104のBブロックにコピーする(矢印YC3)。さらにRAIDコントローラ20は物理ディスク105のBブロックに書き込まれているDA4’を新規な物理ディスク104のAブロックおよび新規な物理ディスク106のCブロックにそれぞれコピーする(矢印YC4)。さらにRAIDコントローラ20は物理ディスク105のAブロックに書き込まれているDA5を新規な物理ディスク106のBブロックにコピーする(矢印YC5)。以上の処置を経て、障害を起こした物理ディスク102、103、104、106に記憶させておくべきデータを復旧させる。   Next, the RAID controller 20 writes the reconstructed data DA2 to the A block of the new physical disk 102. Further, the RAID controller 20 writes DA2 written to the A block of the physical disk 102 to the B block of the new physical disk 103 and the C block of the new physical disk 104. Further, the RAID controller 20 copies the data DA1 written in the A block of the physical disk 101 to the B block of the new physical disk 102 and the C block of the new physical disk 103 (arrow YC1). Further, the RAID controller 20 copies the data DA6 'written in the B block of the physical disk 101 to the C block of the new physical disk 102 and the A block of the new physical disk 106 (arrow YC6). Further, the RAID controller 20 copies the data DA3 ″ written in the C block of the physical disk 105 to the A block of the new physical disk 103 and the B block of the new physical disk 104 (arrow YC3). Further, the RAID controller 20 copies DA4 'written in the B block of the physical disk 105 to the A block of the new physical disk 104 and the C block of the new physical disk 106 (arrow YC4). Further, the RAID controller 20 copies DA5 written in the A block of the physical disk 105 to the B block of the new physical disk 106 (arrow YC5). Through the above processing, the data to be stored in the failed physical disks 102, 103, 104, 106 is recovered.

このように、本発明に係るディスクアレイ装置1は、多くのディスクが故障した場合であっても、データ冗長率が高く、かつ、ディスク台数の増加を抑制し、小型化、低コスト化を図ることができる。例えば、上述した特許文献1に記載したミラー/RAID組合せ方式の従来例におけるディスクアレイ装置と比較する。まず、本願の物理ディスク1台当たりの容量をXとすると、特許文献1のものは、図5に示すように、1台当たりの容量は1/3となり、HDD全体の記憶容量は同じになる。例えば物理ディスクが2台故障した場合を比較する。本願は6台構成中2台故障しても、データが三重化されているため、100%縮退することなく運用を継続でき、冗長状態で復旧処理を実行できる。一方、従来例の場合は、6組12台の構成で2台故障した場合、1組2台故障した場合に縮退するため、約9%の確率で縮退状態のまま復旧処理をおこなわなければならない。そして、故障していない場合においては、全体のデータ実使用容量が同一であるにも関わらず、物理ディスク台数が半分で済むため、物理ディスクにかかるコストを抑えることが可能である。さらに、台数が多い構成になればなるほど、物理ディスクを収納するスペースが半分で済むため、冗長ディスクの筐体が半分となりコストを抑えることが可能である。   As described above, the disk array device 1 according to the present invention has a high data redundancy rate and suppresses an increase in the number of disks even when many disks have failed, thereby achieving downsizing and cost reduction. be able to. For example, it is compared with the disk array device in the conventional example of the mirror / RAID combination method described in Patent Document 1 described above. First, assuming that the capacity per physical disk of the present application is X, as shown in FIG. 5, the capacity per one physical disk is 1/3, and the storage capacity of the entire HDD is the same. . For example, a case where two physical disks have failed is compared. In the present application, even if 2 out of 6 units fail, since the data is tripled, the operation can be continued without degeneration by 100%, and the recovery process can be executed in a redundant state. On the other hand, in the case of the conventional example, when two units fail in the configuration of 6 sets and 12 units, the setback occurs when two sets fail, so the recovery process must be performed with a probability of about 9% while maintaining the reduced state. . If there is no failure, the number of physical disks can be halved despite the fact that the entire actual data use capacity is the same, so the cost of the physical disks can be reduced. Furthermore, as the number of configurations increases, the space for storing the physical disk is halved, so that the redundant disk housing is halved and the cost can be reduced.

また、上述した特許文献2に記載した冗長ディスク方式の従来例におけるディスクアレイ装置と本発明におけるディスクアレイ装置とを比較する。本発明における1台当たりの物理ディスクの記憶容量をXとし、仮に、特許文献2の物理ディスクの1台当たりの記憶容量を1/3とする。この条件下において、本発明における記憶全容量は、物理ディスク6台の場合に6Xとなる。従来技術における記憶全容量は物理ディスク11台の場合にデータ用と冗長用との合計で(11/3)Xと小さくなる。ここで、物理ディスクのコストは、例えば、(容量Xのもの:容量1/3・Xのもの)=(36:17)であるとすると、全体のディスクコストは216:187となる。しかし、台数の構成が大きくなればなるほど従来技術の冗長ディスク台数も多く、搭載する筐体数も多くなる。容量XのHDD:搭載する筐体(HDD15台搭載用)=4:5とすると、(容量Xのもの:容量1/3・Xのもの:搭載する筐体)=(36:17:40)となる。HDD台数を上記の倍の構成の場合で考えた場合、本発明で使用する容量XのHDD12台、筐体1台、従来技術の冗長ディスク方式の場合容量1/3・XのHDD24台、搭載する筐体2台となりコストは、472:488となり、逆転する。すなわち、構成が大きくなればなるほど本発明の方がコストを抑制することができる。   Further, the disk array device in the conventional example of the redundant disk system described in Patent Document 2 described above and the disk array device in the present invention will be compared. The storage capacity per physical disk in the present invention is X, and the storage capacity per physical disk of Patent Document 2 is assumed to be 1/3. Under this condition, the total storage capacity in the present invention is 6X in the case of six physical disks. The total storage capacity in the prior art is reduced to (11/3) X in total for data and redundancy when there are 11 physical disks. Here, if the physical disk cost is, for example, (capacity X: capacity 1/3 · X) = (36:17), the total disk cost is 216: 187. However, the larger the configuration of the number, the greater the number of redundant disks in the prior art and the greater the number of housings to be mounted. Capacity X HDD: Housing to be mounted (for mounting 15 HDDs) = 4: 5 (Capacity X: Capacity 1/3 · X: Mounting chassis) = (36:17:40) It becomes. When the number of HDDs is doubled as described above, 12 HDDs with a capacity X used in the present invention, one chassis, and 24 HDDs with a capacity of 1/3 · X in the case of the redundant disk system of the prior art, mounted The cost is 472: 488, which is reversed. That is, the larger the configuration, the lower the cost of the present invention.

以上のように、本発明では、一台の物理ディスクが複数のデータを共有することにより、一台の物理ディスク内に記録されているデータは、分割領域毎にそれぞれ異なる物理ディスク上に形成された分割領域にコピーされて記憶されることとなるため、物理ディスクが複数台故障したとしても、容易にデータの復旧を図ることができ、データの冗長性を維持することができる。また、物理ディスクの台数の増加を抑制することができ、装置の低コスト化、小型化を図ることができる。特に、分割領域全て同一容量にすることにより、全てのデータが確実にコピーされることになり、データの信頼性が増す。   As described above, in the present invention, one physical disk shares a plurality of data, so that data recorded in one physical disk is formed on different physical disks for each divided area. Therefore, even if a plurality of physical disks fail, data can be easily recovered and data redundancy can be maintained. In addition, an increase in the number of physical disks can be suppressed, and the cost and size of the apparatus can be reduced. In particular, by making all the divided areas have the same capacity, all the data is surely copied, and the reliability of the data is increased.

なお、上述した実施形態では、RAID1とRAID5とに適用した場合について説明したが、これ以外にもRAID0、2、3、4の方式がある。   In the above-described embodiment, the case where the present invention is applied to RAID 1 and RAID 5 has been described. However, there are RAID 0, 2, 3, and 4 schemes in addition to this.

RAID0方式は、データをブロック単位に分割し、複数の物理ディスクに渡って分散してデータを記録する(ストライピング)方式である。RAID2方式は、データの誤りを検出・訂正するために、主記憶装置などで使用されるECC(Error Correction Code:「ハミングコード」、「エラー訂正コード」とも呼ばれる)を使用し、データはビットまたはバイト単位に分割し、データ専用の複数の物理ディスクに記憶する方式である。RAID3方式は、データをブロック単位、ビットまたはバイト単位に分割し、データ専用の複数の物理ディスクへ同時に書き込み、パリティは分割されたデータから生成され、パリティ専用の物理ディスクに書き込まれ、常に全ての物理ディスクに並行してアクセスし、データを一括して転送する方式である。RAID4方式は、RAID0のストライピングに、パリティ専用の物理ディスクを追加してデータを再生成する機能を持たせたものであり、データはブロック単位に分割し、データ用物理ディスクヘ記録され、パリティは1台のパリティ専用の物理ディスクに記録される方式である。これらのRAID方式にも本発明を同様に適用することができる。   The RAID 0 method is a method (striping) in which data is divided into block units and distributed over a plurality of physical disks to record the data (striping). The RAID 2 system uses ECC (Error Correction Code: also called “Haming code” or “error correction code”) used in a main storage device or the like to detect and correct data errors. In this method, data is divided into bytes and stored on a plurality of physical disks dedicated to data. The RAID3 method divides data into block units, bits or bytes, and writes simultaneously to a plurality of physical disks dedicated to data. Parity is generated from the divided data and written to the physical disk dedicated to parity. This is a method of accessing a physical disk in parallel and transferring data in a batch. The RAID4 method is a striping of RAID0 and has a function of regenerating data by adding a physical disk dedicated to parity. The data is divided into block units and recorded on the data physical disk, and the parity is 1 Is recorded on a physical disk dedicated to parity. The present invention can be similarly applied to these RAID systems.

本発明のディスクアレイ装置の概略構成ブロック図である。1 is a schematic block diagram of a disk array device of the present invention. 図1中のディスクドライブの概略構成ブロック図である。It is a schematic block diagram of the disk drive in FIG. 図3(a)は、RAID1レベル相当のRAID装置に適用した一例を示す図、図3(b)は、RAID5レベル相当のRAID装置に適用した一例を示す図である。FIG. 3A is a diagram illustrating an example applied to a RAID device corresponding to a RAID 1 level, and FIG. 3B is a diagram illustrating an example applied to a RAID device corresponding to a RAID 5 level. 図4(a)は、RAID5を適用しととき、2台の物理ディスクが故障したときの復旧動作を説明するための図、図4(b)は、3台の物理ディスクが故障したときの復旧動作を説明するための図、図4(c)は、4台の物理ディスクが故障したときの復旧動作を説明するための図である。4A is a diagram for explaining a recovery operation when two physical disks fail when RAID 5 is applied, and FIG. 4B is a diagram when three physical disks fail. FIG. 4C is a diagram for explaining the restoration operation, and FIG. 4C is a diagram for explaining the restoration operation when four physical disks fail. 従来技術を示す概略構成ブロック図である。It is a schematic block diagram which shows a prior art. 従来技術を示す概略構成ブロック図である。It is a schematic block diagram which shows a prior art.

符号の説明Explanation of symbols

1、200、400 ディスクアレイ装置
10、100 ディスクドライブ
11〜16 物理ディスク
101〜106 物理ディスク
20、250、450 RAIDコントローラ
21 RAIDコントロール部
22 ディスクドライバ
23 ミラー制御部
30、300、500 上位装置
410 データ用ディスクドライブ
420 列方向用冗長ディスクドライブ
430 行方向用冗長ディスクドライブ
1, 200, 400 Disk array device 10, 100 Disk drive 11-16 Physical disk 101-106 Physical disk 20, 250, 450 RAID controller 21 RAID control unit 22 Disk driver 23 Mirror control unit 30, 300, 500 Host device 410 Data Disk drive 420 Redundant disk drive for row direction 430 Redundant disk drive for row direction

Claims (6)

複数の物理ディスクと、上位装置からの指令に基づいて前記物理ディスクの記憶領域に対してデータの読み書きを行う制御部とを有し、各前記物理ディスクは、記憶領域がそれぞれ同一記憶容量となる3つの領域の第1ブロック、第2ブロック、第3ブロックに分割され、第1ブロックは、同容量である別の前記物理ディスクの第2ブロックと、2つの前記物理ディスクとは別の第3ブロックとがセットとなる関係に設定されていることを特徴とするディスクアレイ装置。 A plurality of physical disks and a control unit that reads / writes data from / to the storage area of the physical disk based on a command from a higher-level device, and each of the physical disks has the same storage capacity The three blocks are divided into a first block, a second block, and a third block. The first block is a second block of another physical disk having the same capacity, and a third block different from the two physical disks. A disk array device characterized in that a block is set in a set relation. 前記セットとなる関係は、前記一の物理ディスクの分割された一の記憶領域と前記他の物理ディスクの分割された一の記憶領域と前記他の物理ディスクとは異なる物理ディスクの分割された一の記憶領域との間に設定されるとともに、前記一の物理ディスクの分割された他の一記憶領域と前記他の物理ディスクの他の一記憶領域と前記他の物理ディスクとは別の物理ディスクの分割された一の記憶領域との間に設定され、前記一の物理ディスクの他の記憶領域と前記他の物理ディスクの分割された他の一記憶領域と前記別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定されていることを特徴とする請求項1記載のディスクアレイ装置。 The set relation is as follows: one divided storage area of the one physical disk, one divided storage area of the other physical disk, and one divided physical disk different from the other physical disk. The other physical storage area, the other physical storage area divided from the one physical disk, the other storage area of the other physical disk, and the physical disk different from the other physical disk. The other storage area of the one physical disk, the other divided storage area of the other physical disk, and the other physical disk are further separated from each other. 2. The disk array device according to claim 1, wherein the disk array device is set between one of the divided storage areas of the physical disk. 前記制御部は、前記セットとなる記憶領域を対応させるための対応関係データを保有し、前記対応関係データに基づいて、前記セットとなる関係の記憶領域に同一データを保持する管理機能を有することを特徴とする請求項1記載のディスクアレイ装置。 The control unit has correspondence data for associating the storage areas to be the set with each other, and has a management function for holding the same data in the storage areas to be the set based on the correspondence relation data. The disk array device according to claim 1. 前記セットとなる記憶領域は、データを書き込む領域として設定され、前記制御部は、前記記憶領域をデータ書込領域として特定するための書込領域特定データを保有し、上位装置からの指令に応じた書き込みデータを前記書込領域特定データに基づいて、前記記憶領域に書き込まれたデータと同一のデータを、前記記憶領域とセットとなる他の記憶領域にコピーする機能を有することを特徴とする請求項1記載のディスクアレイ装置。 The storage area to be set is set as an area for writing data, and the control unit has write area specifying data for specifying the storage area as a data writing area, and responds to a command from a host device. A function of copying the same data as the data written in the storage area to another storage area set as the storage area based on the write area specifying data. The disk array device according to claim 1. 前記制御部は、前記対応関係データに基づいて前記セットとなる記憶領域のいずれか1つから書き込みデータを読み出す機能を有することを特徴とする請求項3記載のディスクアレイ装置。 The disk array device according to claim 3, wherein the control unit has a function of reading write data from any one of the storage areas to be set based on the correspondence data. 前記制御部は、前記物理ディスクの交換を認識する交換認識機能を有すると共に、前記物理ディスクの交換を認識して、前記セットとなる関係にある他の前記物理ディスクの記憶領域のデータを交換された前記物理ディスクの記憶領域にコピーする機能を有することを特徴とする請求項1記載のディスクアレイ装置。
The control unit has an exchange recognition function for recognizing the exchange of the physical disk, recognizes the exchange of the physical disk, and exchanges data in storage areas of other physical disks in the set relation. 2. The disk array device according to claim 1, further comprising a function of copying to a storage area of the physical disk.
JP2005083808A 2005-03-23 2005-03-23 Disk array device Withdrawn JP2006268286A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005083808A JP2006268286A (en) 2005-03-23 2005-03-23 Disk array device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005083808A JP2006268286A (en) 2005-03-23 2005-03-23 Disk array device

Publications (1)

Publication Number Publication Date
JP2006268286A true JP2006268286A (en) 2006-10-05

Family

ID=37204223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005083808A Withdrawn JP2006268286A (en) 2005-03-23 2005-03-23 Disk array device

Country Status (1)

Country Link
JP (1) JP2006268286A (en)

Similar Documents

Publication Publication Date Title
US7984325B2 (en) Storage control device, data recovery device, and storage system
CA2532766C (en) Data storage array
JP3742494B2 (en) Mass storage device
US7529970B2 (en) System and method for improving the performance of operations requiring parity reads in a storage array system
US7464322B2 (en) System and method for detecting write errors in a storage device
US20060190683A1 (en) Disk array apparatus and backup method of data
JP2010015195A (en) Storage controller and storage control method
US7062673B2 (en) System and method for sparing in RAID-1 system
TW202026874A (en) Method and apparatus for performing dynamic recovery management regarding redundant array of independent disks and storage system operating according to the method
JP2005099995A (en) Disk sharing method and system of magnetic disk unit
JP2010026812A (en) Magnetic disk device
JP2008217395A (en) Disk array device
JP2005166016A (en) Disk array device
JPH09218754A (en) Data storage system
JP2006268286A (en) Disk array device
JP3991947B2 (en) Disk array device having two types of parity and a plurality of data recovery methods
JP2007128183A (en) Storage system
JP2570614B2 (en) Disk array device
JP2778268B2 (en) Recording medium control device
JPH0744331A (en) Disk array device and its control method
GB2402803A (en) Arrangement and method for detection of write errors in a storage system
JP4609034B2 (en) Disk array device
JP4780331B2 (en) Disk array system
JPH0816327A (en) Disk array device
JP2013205853A (en) Flash memory disk device, data storage control method and program in flash memory disk device

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080603