JP2006268286A - Disk array device - Google Patents
Disk array device Download PDFInfo
- Publication number
- JP2006268286A JP2006268286A JP2005083808A JP2005083808A JP2006268286A JP 2006268286 A JP2006268286 A JP 2006268286A JP 2005083808 A JP2005083808 A JP 2005083808A JP 2005083808 A JP2005083808 A JP 2005083808A JP 2006268286 A JP2006268286 A JP 2006268286A
- Authority
- JP
- Japan
- Prior art keywords
- data
- physical
- disk
- block
- physical disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
Description
本発明は、ディスクアレイ装置に関し、特に、大容量かつ信頼性の向上、記録速度の高速化、低コスト化、小型化を図ることができるディスクアレイ装置に関する。 The present invention relates to a disk array apparatus, and more particularly to a disk array apparatus that can achieve a large capacity and improved reliability, a high recording speed, a low cost, and a small size.
近年、企業のみならず一般家庭にもコンピュータが導入され、IT(Information technology)への依存度が増している。これに伴い、コンピュータシステムで取り扱う電子データの重要性はますます増大しており、当該電子データを記憶するコンピュータシステムにおける記憶装置の役割はますます大きくなってきている。このため、記憶装置の高性能化、大容量化はもとより、特に、高信頼性化の要求が高まる一方である。 In recent years, computers have been introduced not only to companies but also to general households, and the degree of dependence on IT (Information technology) has increased. Accordingly, the importance of electronic data handled by computer systems is increasing, and the role of storage devices in computer systems that store such electronic data is increasing. For this reason, the demand for higher reliability is increasing as well as higher performance and capacity of storage devices.
そして、記憶容量の大容量化が進む中で、電子データの信頼性を保つためには、大記憶容量のディスクの障害に備えて、ディスクに記憶された電子データを予備ディスクなどに複写することが従来より行われている。しかしながら、かかる方法では、ディスク(メインディスク)の障害を修復させた後に、予備ディスクに退避させた電子データをメインディスクに再度複写する必要がある。この複写に費やす時間は、ディスクの記憶容量に比例するため、記憶容量の大容量化の下では、かかる時間が増大するという問題が生じる。 In order to maintain the reliability of electronic data as the storage capacity increases, the electronic data stored on the disk should be copied to a spare disk in preparation for failure of the disk with the large storage capacity. Has been performed conventionally. However, in such a method, it is necessary to copy the electronic data saved in the spare disk to the main disk again after repairing the failure of the disk (main disk). Since the time spent for copying is proportional to the storage capacity of the disk, there arises a problem that the time required increases as the storage capacity increases.
これに対して、データの冗長性を維持しつつ、ディスクに対するデータ読み書き速度の向上を図るために、現在のハードディスクの多くは複数のディスクから構成され、かつ、それぞれのディスクにデータを分割して記憶するという手法(いわゆるRAID:Redundant Arrays of Inexpensive Disks))が採られている。そして、このような多重ハードディスクにおける障害対策技術、すなわち、データの冗長性を確保するための技術が、従来より研究されている。 In contrast, in order to improve data read / write speed while maintaining data redundancy, most current hard disks are composed of multiple disks, and data is divided into each disk. A method of storing (so-called RAID: Redundant Arrays of Inexpensive Disks) is employed. A failure countermeasure technique for such multiple hard disks, that is, a technique for ensuring data redundancy has been studied.
次に、従来のディスクアレイ装置について、図面を参照して説明する。 Next, a conventional disk array device will be described with reference to the drawings.
図5は、特許文献1に記載の技術を示す概略構成ブロック図である。
FIG. 5 is a schematic block diagram showing the technique described in
図5を参照すると、ディスクアレイ装置200は、上位装置300からの指令を受けて、RAIDコントローラ250による制御にて、RAID方式によるデータの記録が行われているものである。具体的には、図5は、RAID5方式を示すものであり、この方式は、書き込みデータを物理ディスクの台数分に分割し、かつ分割したデータに対応させてパリティデータをそれぞれ生成し、分割された書き込みデータとパリティデータを1組として、6台の物理ディスク210〜215にそれぞれ記録する方式を採っている。但し、これら6台の物理ディスクには、それぞれ対となる別の物理ディスク220〜225が備えられている。すなわち2台が1対のディスクを構成している。この1対のディスクは図5において仮想線にて囲まれた2台の物理ディスクであり、例えば符号210と220で示すディスクがこれらに相当する。そして、一方の各物理ディスク210〜215のデータエリアに記録した書き込みデータDA1〜DA6を、対となる他の物理ディスク220〜225にコピーする。従って分割した書き込みデータ及びパリティデータである各データDA1〜DA6と同じ内容のミラーデータDA1’〜DA6’が、対となる別の物理ディスクに記録されることとなる。
Referring to FIG. 5, the
図6は、特許文献2に記載の技術を示す概略構成ブロック図である。 FIG. 6 is a schematic block diagram showing the technique described in Patent Document 2. As shown in FIG.
図6を参照すると、これもRAID5方式を使用しており、上位装置500からの指令によりデータを記録する際に、RAIDコントローラ450にて、図示された6台の物理ディスクの台数分に分割し、かつ分割したデータに対応させてパリティデータをそれぞれ生成し、分割された書き込みデータとパリティデータを1組として、6台の物理ディスクDA1〜DA6(410)に記録する構成である。ディスクアレイ装置400は、冗長ディスクの方式を用いたものであり、図示するように、データ用ディスクドライブ410に対して、列方向用冗長ディスクドライブ420と行方向用冗長ディスクドライブ430とを備えている。そして、分割されたデータとパリティデータとが格納されるデータ用ディスクドライブ410の行、列方向それぞれのパリティを生成して、列方向用冗長ディスクドライブ420と行方向用冗長ディスクドライブ430とに格納しておくことにより、データ用ディスクドライブ410のうち、複数台の物理ディスクが故障した場合に、より確実にデータの復旧を図る。
Referring to FIG. 6, this also uses the RAID5 system, and when data is recorded by a command from the
上述の特許文献1記載の技術は、物理ディスク台数の増加により、ディスク装置にかかるコストが増大し、また、物理ディスクが占有するスペースも増大し、ディスクアレイ装置自体の小型化を図ることはできないという課題がある。
The technique described in
また、物理ディスク2台故が故障した場合、例えば、図5において1対(2台)の物理ディスク210、220に障害が生じると縮退となり、非冗長状態でのデータ復旧処理を行わなければならないという課題がある。
Further, when two physical disks fail, for example, when a failure occurs in a pair (two) of
特許文献2記載の技術は、特許文献1と同様に、物理ディスクの台数が多いため、ディスクに費やされるコストの増加という問題や、収納スペースの増大に伴い小型化を図ることができないという課題がある。
Since the technology described in Patent Document 2 has a large number of physical disks, as in
また、物理ディスクが1台故障した場合には、物理ディスクに記憶させたデータに相当するデータを冗長ディスクに一旦複写し、その後、交換したディスクに冗長ディスクから複写することで再構築が完了するため、冗長ディスクを使用する方式では非冗長状態が存在するという課題がある。 When one physical disk fails, the data corresponding to the data stored in the physical disk is temporarily copied to the redundant disk, and then the replacement is completed from the redundant disk to complete the reconstruction. Therefore, there is a problem that a non-redundant state exists in the method using a redundant disk.
従って、データ復旧に費やされる時間の増加や、物理ディスク数の増加を抑制することができるディスクアレイ装置が望まれている。 Therefore, a disk array device that can suppress an increase in time spent for data recovery and an increase in the number of physical disks is desired.
本発明の目的は、上記課題を解決し、大容量かつ信頼性の向上、記録速度の高速化、さらには低コスト化、小型化を図ることができるディスクアレイ装置を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a disk array device that solves the above-described problems and can achieve a large capacity and improved reliability, a high recording speed, a low cost, and a small size.
本発明のディスクアレイ装置は、複数の物理ディスクと、上位装置からの指令に基づいて物理ディスクの記憶領域に対してデータの読み書きを行う制御部とを有し、各物理ディスクは、記憶領域がそれぞれ同一記憶容量となる3つの領域の第1ブロック、第2ブロック、第3ブロックに分割され、第1ブロックは、同容量である別の物理ディスクの第2ブロックと、2つの物理ディスクとは別の第3ブロックとがセットとなる関係に設定されていることを特徴とする。 The disk array device of the present invention has a plurality of physical disks and a control unit that reads / writes data from / to the storage area of the physical disk based on a command from the host apparatus, and each physical disk has a storage area. Each of the three areas having the same storage capacity is divided into a first block, a second block, and a third block. The first block is a second block of another physical disk having the same capacity and two physical disks. Another third block is set in a set relation.
セットとなる関係は、一の物理ディスクの分割された一の記憶領域と他の物理ディスクの分割された一の記憶領域と他の物理ディスクとは異なる物理ディスクの分割された一の記憶領域との間に設定されるとともに、一の物理ディスクの分割された他の一記憶領域と他の物理ディスクの他の一記憶領域と他の物理ディスクとは別の物理ディスクの分割された一の記憶領域との間に設定され、一の物理ディスクの他の記憶領域と他の物理ディスクの分割された他の一記憶領域と別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定されていることを特徴とする。 The set relationship is as follows: one storage area divided from one physical disk, one storage area divided from another physical disk, and one storage area divided from a physical disk different from the other physical disk One storage area of one physical disk and another storage area of another physical disk and one storage area of another physical disk that is different from the other physical disk. Another storage area that is set between the other physical disk and another physical disk that is divided between another physical disk and another physical disk that is divided between the other physical disks. It is characterized by being set between the area.
制御部は、セットとなる記憶領域を対応させるための対応関係データを保有し、対応関係データに基づいて、セットとなる関係の記憶領域に同一データを保持する管理機能を有することを特徴とする。 The control unit has correspondence data for associating storage areas to be set, and has a management function for holding the same data in the storage areas of the relation to be set based on the correspondence relation data .
セットとなる記憶領域は、データを書き込む領域として設定され、制御部は、記憶領域をデータ書込領域として特定するための書込領域特定データを保有し、上位装置からの指令に応じた書き込みデータを書込領域特定データに基づいて、記憶領域に書き込まれたデータと同一のデータを、記憶領域とセットとなる他の記憶領域にコピーする機能を有することを特徴とする。 The storage area to be set is set as an area for writing data, and the control unit has write area specifying data for specifying the storage area as the data writing area, and write data according to a command from the host device. Based on the write area specifying data, the same data as the data written in the storage area is copied to another storage area that is a set with the storage area.
制御部は、対応関係データに基づいてセットとなる記憶領域のいずれか1つから書き込みデータを読み出す機能を有することを特徴とする。 The control unit has a function of reading the write data from any one of the storage areas to be set based on the correspondence data.
制御部は、物理ディスクの交換を認識する交換認識機能を有すると共に、物理ディスクの交換を認識して、セットとなる関係にある他の物理ディスクの記憶領域のデータを交換された物理ディスクの記憶領域にコピーする機能を有することを特徴とする。 The control unit has a replacement recognition function for recognizing the replacement of the physical disk, recognizes the replacement of the physical disk, and stores the data in the storage area of the other physical disk that is in a set relationship. It has a function of copying to an area.
本発明のディスクアレイ装置は、物理ディスクが故障した場合に、物理ディスク内のデータが他の物理ディスクにコピーされているため、冗長状態を維持した状態で物理ディスク交換が可能であり、危険な非冗長期間を伴わず、データの信頼性が増す。従って、従来技術におけるディスク装置では、大容量の物理ディスクが障害により縮退した場合、冗長ディスク(ホットスペア等)への複写が完了するまでは非冗長状態となり、この危険な時間は物理ディスクの容量に比例することとなるが、これに対して本発明では、非常に優れた効果を有する。 In the disk array device of the present invention, when a physical disk fails, the data in the physical disk is copied to another physical disk. Therefore, the physical disk can be replaced while maintaining the redundant state, which is dangerous. Data reliability is increased without a non-redundant period. Therefore, in the conventional disk device, when a large-capacity physical disk is degraded due to a failure, it becomes a non-redundant state until copying to a redundant disk (hot spare, etc.) is completed. In contrast to this, the present invention has a very excellent effect.
また、上述したような冗長性を有しており、かつ、信頼性の高いディスクアレイ装置であるにもかかわらず、不要な物理ディスク台数の増加を抑制し、低コスト化且つ小型な装置を実現できる。従って、データ記録用として使用する物理ディスク台数の多い構成であればあるほど、多重障害に対する耐故障性能を向上させることが可能であり、かつ、低コスト化を図ることができるという優れた効果を有する。 In addition, despite the above-described redundancy and high reliability, the increase in the number of unnecessary physical disks is suppressed, and a low-cost and compact device is realized. it can. Therefore, as the number of physical disks used for data recording increases, the fault tolerance performance against multiple failures can be improved and the cost can be reduced. .
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
図1において、ディスクアレイ装置1は上位装置30に接続され、上位装置30からの指令に基づいてデータの読み書きを行うディスクアレイ装置1であって、複数の物理ディスク11〜16にて構成されるディスクドライブ10と、物理ディスク11〜16に対してデータの読み書きの制御を行う制御部20(RAIDコントローラ)とを備えている。すなわち、前記制御部20は後述するように、セットとなる記憶領域を対応させるための前記対応関係データを保有し、前記対応関係データに基づいて、前記セットとなる関係の記憶領域に同一データを保持する管理機能を有している。
In FIG. 1, a
ディスクドライブ10内には、図1においては6台の物理ディスク11〜16が格納されている。そして、それぞれの物理ディスク11〜16は、データの記憶領域が同一の記憶容量となる3つの領域に分割されてあらかじめ設定されている。ここでは、各物理ディスク11〜16の分割領域をブロックと呼び、3つの領域をそれぞれAブロック、Bブロック、Cブロックと呼ぶ。そして、分割されたAブロック、Bブロック及びCブロックは同一の容量に設定されている。すなわち各物理ディスク11〜16は、データの記憶領域が1/3の記憶領域を持つ分割領域11Aと11Bと11C、12Aと12Bと12C、13Aと13Bと13C、14Aと14Bと14C、15Aと15Bと15C、16Aと16Bと16Cに分割されている。
In the
さらに本発明において、一の物理ディスクの分割された記憶領域は、他の物理ディスクの分割された記憶領域と、前記他の物理ディスクとは異なる別の物理ディスクの分割された記憶領域とセットをなす関係に設定されている。前記セットをなす関係の例を説明すると、前記セットをなす関係は後述の図3(a)及び図3(b)に示すように、前記一の物理ディスクの分割された記憶領域と、前記他の物理ディスクの分割された一の記憶領域と、前記他の物理ディスクとは別の物理ディスクの分割領域との間に設定されるとともに、前記一の物理ディスクの分割された他の記憶領域と、前記他の物理ディスクの分割された他の記憶領域と、前記他の物理ディスクとは別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定され、さらに前記一の物理ディスクの分割された残りの記憶領域は前記のどの物理ディスクとは別の物理ディスクの分割された一の記憶領域と前記のどの物理ディスクとは別の物理ディスクとはさらに別の物理ディスクの分割された一の記憶領域との間に設定される。 Further, in the present invention, the divided storage area of one physical disk includes a set of a divided storage area of another physical disk and a divided storage area of another physical disk different from the other physical disk. The relationship is established. An example of the relationship forming the set will be described. The relationship forming the set is as shown in FIGS. 3A and 3B described later, and the divided storage area of the one physical disk and the other Set between a divided storage area of the physical disk and a divided area of a physical disk different from the other physical disk, and another divided storage area of the one physical disk , Set between another storage area of the other physical disk and one storage area of another physical disk that is different from the physical disk different from the other physical disk, and The remaining storage area of the one physical disk is further separated from the one storage area of the physical disk different from any of the physical disks and the physical disk different from any of the physical disks. Physical display It is set between the divided first storage regions.
上記例に、前記一の物理ディスクの分割された一の記憶領域と前記他の物理ディスクの分割された一の記憶領域と前記他の物理ディスクとは別の物理ディスクの分割された一の記憶領域との間に設定されるセットをなす関係について説明する。 In the above example, one divided storage area of the one physical disk, one divided storage area of the other physical disk, and one divided storage of a physical disk different from the other physical disk A description will be given of the relationship that forms a set with the area.
この場合、同一内容のデータが記録されるセットをなすいずれか一つの分割領域は、一の物理ディスクのAブロックに設定され、セットをなす他の二つの分割領域は、前記一の物理ディスクとは異なる他の物理ディスクのBブロックと、前記他の物理ディスクとは別の物理ディスクのCブロックに設定される。また、前記別の物理ディスクのAブロックは、前記Cブロックを記憶領域にもつ物理ディスクのBブロックと、前記別の物理ディスクとは異なるさらに別の物理ディスクのCブロックとセットをなすように設定されている。 In this case, any one divided area forming a set in which data of the same content is recorded is set to the A block of one physical disk, and the other two divided areas forming the set are the same as the one physical disk. Are set to B blocks of different physical disks and C blocks of physical disks different from the other physical disks. In addition, the A block of the other physical disk is set to form a set with a B block of a physical disk having the C block as a storage area and a C block of another physical disk different from the other physical disk. Has been.
さらに、図1を参照して具体的に説明する。符号12で示す物理ディスクについて説明すると、同一内容のデータが記憶されるセットをなす分割領域は、一の物理ディスク12のAブロック(12A)と他の物理ディスク13のBブロック(13B)と前記他の物理ディスクとは別の物理ディスク14のCブロック(14C)とにそれぞれ設定される。したがって、物理ディスク12のAブロック(12A)と物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)とはセットをなすこととなり、これらのAブロック(12A)とBブロック(13B)とCブロック(14C)とに同一内容のデータが書き込まれる。また、物理ディスク13のAブロック(13A)と他の物理ディスク14のBブロック(14B)と前記他の物理ディスクとは別の物理ディスク15のCブロック(15C)とは、同一内容のデータが書き込まれるセットをなす分割領域として設定される。同様に図2に示すように、物理ディスク14、15、16、11のAブロック14A、15A、16A、11Aと物理ディスク15、16、11、12のBブロック15B、16B、11B、12Bと物理ディスク16、11、12、13のCブロック16C、11C、12C、13Cとは、同一の内容のデータが書き込まれるセットとなる分割領域として設定される。なお、セットとなるAブロック、BブロックおよびCブロックの関係を矢印Y1〜Y6で示している。
Furthermore, it demonstrates concretely with reference to FIG. The physical disk denoted by
次に、本発明を実施するための最良の形態の動作について図面を参照して説明する。 Next, the operation of the best mode for carrying out the present invention will be described with reference to the drawings.
上述したセットとなる分割領域として設定されたAブロック、Bブロック、Cブロックとの対応関係を示すセットとなる分割領域同士の対応関係データは、制御部であるRAIDコントローラ20内の記憶領域(不揮発メモリ等)に記憶されている。RAIDコントローラ20は、対応関係データに基づいて、一の物理ディスク11〜16のAブロックと他の物理ディスク12、13、14、15、16、11のBブロックと、前記他の物理ディスクとは別の物理ディスク13、14、15、16、11、12のCブロックとに同一データを保持する管理機能を実行する。
Correspondence data between the divided areas constituting the set indicating the corresponding relation with the A block, B block, and C block set as the divided areas constituting the set described above is a storage area (non-volatile) in the
ここで制御部であるRAIDコントローラ20には、RAID構築の管理を行うRAIDコントロール部21と、物理ディスクへのアクセスを管理するディスクドライバ22と、コピーを実行するミラー制御部23とが構築されている。そして、特に、このミラー制御部23には、上記のRAIDコントローラ20内に記憶されている対応関係データに基づいて、セットとなる物理ディスク11〜16の分割領域(A、B、Cブロック)に対してそれぞれ同一データを書き込む機能、すなわち、ミラーリング実行機能が備えられている。
Here, the
なお、RAID方式のうち、特にRAID1及びRAID5の方式について説明する。RAID1方式は2台の物理ディスクに対して同一データを書き込み一方の物理ディスクの障害発生に対処してデータを保護する方式である。RAID5方式は書き込みデータを複数に分割し、かつ分割した書き込みデータに対応させてパリティデータをそれぞれ生成し、複数の物理ディスクに分散して記憶する方式である。
Of the RAID systems, the
本発明のディスクアレイ装置において、セットとなる分割領域のうちいずれか一つがデータ書込用領域として設定される。例えば、物理ディスク12の分割領域12A、物理ディスク13の分割領域13B、及び物理ディスク14の分割領域14Cがセットとなっている場合に、その内一つの分割領域12Aがデータ書込用領域として設定される。そしてかかる1セットの分割領域において、分割領域12Aがデータ書込用領域である旨を表す書込領域特定データが、RAIDコントローラ20内の記憶領域に記録される。書込領域特定データは、例えばディスクドライバ22内のメモリに記憶されている。それぞれセットとなる他の分割領域についても同様である。
In the disk array device of the present invention, any one of the divided areas to be set is set as a data writing area. For example, when the divided
そして、これに伴い、RAIDコントローラ20、例えば、ディスクドライバ22は、上記書込領域特定データに基づいて、データ書込用領域に上位装置30からの指令に応じて書き込みデータを書き込む機能を有している。そして、上述したミラーリング実行機能にて、セットとなる分割領域の対応関係を表した対応関係データに基づいて、当該データ書込用領域内のデータと同一データを当該領域とセットとなる分割領域に書き込まれる。このようにセットとなるいずれかの物理ディスクに対してデータを書き込むことにより、この書き込まれたデータは前記ミラーリング機能により他の2台の物理ディスクにコピーされるため、データの書き込みはセットとなるいずれか一台の物理ディスクにのみ行えばよく、データの冗長性を維持しつつ、データ書き込みの高速化を図ることができる。
Accordingly, the
次に、ミラーリング機能の動作について、図2を参照して詳細に説明する。 Next, the operation of the mirroring function will be described in detail with reference to FIG.
図2は、図1に開示したディスクドライブを示したものである。図2における各物理ディスク11〜16の各ブロック11A、11B、11C等には、それぞれDA1、DA2、DA3等が書き込まれている。そして、例えば、物理ディスク12は、その記憶領域が上述したように同容量のAブロック(12A)とBブロック(12B)とCブロック(12C)とに領域分割されており、Aブロック(12A)は物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)とセットとなっている。(矢印Y2、Y2’参照)。また物理ディスク12のBブロック(12B)は物理ディスク13のCブロック(13C)と物理ディスク11のAブロック(11A)とセットとなっている。(矢印Y1、Y1’参照)。そして物理ディスク12のCブロック(12C)は物理ディスク16のAブロック(16A)と物理ディスク11のBブロック(11B)とセットとなっている。(矢印Y6、Y6’参照)。そしてディスクドライバ22から物理ディスク12のAブロック(12A)にコマンドが発行された場合、ミラー制御部23が該当Aブロック(12A)とセットとなっている物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)に対してコピーを実行する。これにより物理ディスク12のAブロック(12A)に書き込まれているデータDA2が、物理ディスク13のBブロック(13B)と物理ディスク14のCブロック(14C)にコピーされることになる(DA2’、DA2’’)。
FIG. 2 shows the disk drive disclosed in FIG. DA1, DA2, DA3, etc. are written in each
また、ミラー制御部23は、他のブロックに対しても同様に作動する。すなわち、ディスクドライブ10がN台の物理ディスクで構成されている場合、N台目の物理ディスク(図2では符号16で示すディスク)のAブロック(16A)は、一台目の物理ディスク11のBブロック(11B)及び二台目の物理ディスク12のCブロック(12C)とセットとなっており、N台目の物理ディスク16のBブロック(16B)は、N―1台目の物理ディスク15のAブロック(15A)及び一台目の物理ディスク11のCブロック(11C)とセットとなっており、N台目の物理ディスク16のCブロック(16C)は、N−2台目の物理ディスク14のAブロック(14A)及びN−1台目の物理ディスク15のBブロック(15B)とセットとなっている。このようにして、各ブロック同士はセットとなる(矢印Y1〜Y6、Y1‘〜Y6’参照)。
The
そして、ディスクドライバ22から各Aブロック(11A、12A、13A、14A、15A、16A)にコマンドが発行された場合、ミラー制御部23は、あらかじめ記憶している対応関係データに基づいて各Aブロック(11A、12A、13A、14A、15A、16A)とセットとなる各Bブロック(12B、13B、14B、15B、16B、11B)と各Cブロック(13C、14C、15C、16C、11C、12C)を認識し、各Aブロックのデータ(DA1、DA2、DA3、DA4、DA5、DA6)をセットとなる各Bブロックにコピーするミラーリング処理を実行する。前記ミラーリング処理により、前記Aブロックのデータに対応して、各Bブロックにコピーされたデータに、符号DA1’、DA2’、DA3’、DA4’、DA5’、DA6’を、各Cブロックに書き込まれたデータに、符号DA1’’、DA2’’、DA3’’、DA4’’、DA5’’、DA6’’を付して示している。
When a command is issued from the
このように、本発明では、ディスクアレイ装置における、物理ディスク単体のディスク(記憶容量)を同容量の3ブロックに領域分割し、それぞれAブロック、Bブロック、Cブロックとし、Aブロックは同容量である前記他の物理ディスクのBブロックと前記他の物理ディスクとは別の物理ディスクのCブロックとセットをなし、Aブロックにデータを書き込み、Aブロックに書き込まれたデータをBブロック及びCブロックにコピーする。このため、物理ディスクに突発的な障害が生じた場合でも、物理ディスクを領域分割して自動的にデータを異なる物理ディスクに三重化していることにより、予備ディスクを用いることなく耐故障性能の向上を図ることができる。このとき、不必要な予備ディスクを用いていないため、物理ディスクの台数の増加を抑制することができ、装置の低コスト化、小型化を図ることができる。特に、分割領域をすべて同一容量にすることにより、すべてのデータが確実にコピーされることになり、データの信頼性が増す。 As described above, in the present invention, the disk (storage capacity) of a single physical disk in the disk array apparatus is divided into three blocks having the same capacity, and each of these blocks is designated as A block, B block, and C block. The B block of the other physical disk and the C block of a physical disk different from the other physical disk are set, the data is written to the A block, and the data written to the A block is changed to the B block and the C block. make a copy. For this reason, even if a sudden failure occurs in a physical disk, the fault tolerance performance can be improved without using a spare disk by dividing the physical disk into areas and automatically tripleting the data to different physical disks. Can be planned. At this time, since an unnecessary spare disk is not used, an increase in the number of physical disks can be suppressed, and the cost and size of the apparatus can be reduced. In particular, by making all the divided areas have the same capacity, all data is surely copied, and the reliability of the data is increased.
さらには、RAIDコントローラ20は、物理ディスクが交換されたことを認識する交換認識機能を有している。例えば、ディスクドライバ22が各物理ディスク11〜16の稼働状況を常に監視し、障害時には縮退すると共に、取り外された後に新たなディスクが装着されたことを認識する。そして、これに伴い、上記ミラー制御部23は、対応関係データに基づいて交換された物理ディスクの分割領域に対してセットとなる分割領域を認識し、当該分割領域に記憶されているデータと同一のデータを交換された物理ディスクの分割領域に書き込む機能を有する。これにより、物理ディスクが故障した際には、当該ディスクを交換することにより、交換された分割領域にデータがコピーされる。その後、RAIDコントロール部21は、データ復旧処理機能に基づいて、故障した物理ディスクから他の物理ディスクにコピーしたデータと、正常な物理ディスクに書き込まれたデータとから、故障した物理ディスクに代えて交換する新たな物理ディスクに書き込むために必要なデータを復旧させる。
Furthermore, the
また、本ディスクアレイ装置1の、上記RAIDコントローラ20、特に、RAIDコントロール部21及びディスクドライバ22は、データ読み出し時には、物理ディスク11〜16から対応関係データに基づいてセットとなる3ブロックのうちのいずれかからデータを読み出す機能を有する。例えば、各物理ディスク11〜16のAブロック(11A等)のみから、上位装置30からの指令にて、当該ブロックに記録されているデータDA1等を読み出す。これにより、上述したように冗長性を維持し、物理ディスクの不要な増加を抑制しつつ、読み出し時にはセットとなるディスクのうちいずれかにアクセスすればよいため、アクセス時間の短縮化を図ることができる。
Further, the
次に、本発明の具体的な実施例について、図3、図4を参照して説明する。 Next, specific examples of the present invention will be described with reference to FIGS.
以上の説明ではRAIDを適用しない場合について説明したが、図3(a)は、本発明のディスクアレイ装置1をRAID1レベル相当のRAID装置に適用した一例を示すものである。
Although the case where RAID is not applied has been described in the above description, FIG. 3A shows an example in which the
この図に示すディスクドライブ100は、6台の物理ディスク101〜106にて構成されており、各物理ディスクの記憶領域は、同一容量の3つの記憶領域に分割されている。そして、上述したように、相互に物理ディスクが異なることを前提として、各分割領域は他の分割領域とセットとなっている。例えば、物理ディスク101のAブロック(101A)と物理ディスク102のBブロック(102B)と物理ディスク103のCブロック(103C)とがセットとなっている(図中の矢印参照)。他の分割領域も同様である。このような構成において、まず、物理ディスク101の分割領域101Aに記憶されたDA1が、RAID1の作用により、物理ディスク102の分割領域102AにデータDA1’として記憶される。また、分割領域101Aとセットとなる物理ディスク102の分割領域102Bと物理ディスク103の分割領域103Cにも、上述したミラーリング機能の作用により、それぞれデータDA1’、データDA1’’が記憶される。さらに、上記のRAID1の作用により物理ディスク102の分割領域102Aに記憶されたデータDA1’も、当該分割領域102Aとセットとなる物理ディスク領域103B、104Cに上記ミラーリング機能にて複写される(データDA1’’、データDA1’’’)。これにより、物理ディスクの台数の不必要な増加を抑制しつつ、ディスクの耐故障性能の向上を図ることができる。
The
次に本発明のディスクアレイ装置をRAID5レベル相当のRAID装置に適用した場合の一例を図3(b)に示して説明する。この図に示す例においては、図3(a)の場合と同様に、ディスクドライブ100に6台の物理ディスク101〜106が備えられており、それぞれが3つの領域に分割されている(領域101A、101B、101C等)。
Next, an example in which the disk array device of the present invention is applied to a RAID device equivalent to RAID 5 level will be described with reference to FIG. In the example shown in this figure, as in the case of FIG. 3A, the
RAID5では、図示しない上位装置からの指令にて書き込まれる書き込み用データとそのデータに対応させて生成されたパリティデータが各データエリアに分散され、記憶されている。そして、これらAブロック(101A、102A、103A、104A、105A、106A)とセットとなる前記他の物理ディスクのBブロック(102B、103B、104B、105B、106B、101B)、前記他の物理ディスクとは別の物理ディスクのCブロック(103C、104C、105C、106C、101C、102C)にコピーされることとなる(DA1’〜DA6’、DA1’’〜DA6’’)。この対応関係は、図2に示したものとほぼ同様である。 In RAID5, write data written by a command from a host device (not shown) and parity data generated corresponding to the data are distributed and stored in each data area. The B block (102B, 103B, 104B, 105B, 106B, 101B) of the other physical disk that is combined with these A blocks (101A, 102A, 103A, 104A, 105A, 106A), the other physical disk and Are copied to C blocks (103C, 104C, 105C, 106C, 101C, 102C) of another physical disk (DA1 ′ to DA6 ′, DA1 ″ to DA6 ″). This correspondence is almost the same as that shown in FIG.
そして、RAID5に適用した場合に、複数の物理ディスクが故障したときの復旧動作を、図4を参照して説明する。まず、図4(a)に示す状態は、2台の物理ディスク102、103が故障した場合である。この場合、障害を起こした2台の物理ディスク102、103を正常な2台の物理ディスクと交換する。物理ディスク102、103が交換されるとRAIDコントローラ20は、2台の新規な物理ディスク102、103を認識する。
The recovery operation when a plurality of physical disks fail when applied to RAID 5 will be described with reference to FIG. First, the state shown in FIG. 4A is a case where two
次にRAIDコントローラ20は、物理ディスク101のAブロックからデータDA1およびBブロックからデータDA6‘を、物理ディスク104のBブロックからデータDA3’およびCブロックからデータDA2’’を読み出し、データDA1のコピーを新規物理ディスク102のBブロックと新規物理ディスク103のCブロックにそれぞれデータDA1’、データDA1’’として書き込む(矢印YA1)。さらにデータDA6’のコピーを新規物理ディスク102のCブロックにデータDA6’’として書き込み(矢印YA6)、データDA3’のコピーを新規物理ディスク103のAブロックにデータDA3として書き込み(矢印YA3)、データDA2’のコピーを新規物理ディスク102のAブロックと新規物理ディスク103のBブロックにそれぞれデータDA2、データDA2’として書き込む(矢印YA2)。以上の処理を経て再構築が完了する。
Next, the
また、図4(b)に示すように、3台の物理ディスク102、103、104が故障した場合、障害を起こした3台の物理ディスク102、103、104を正常な3台の物理ディスクに交換する。物理ディスク102、103、104が交換されると、RAIDコントローラ20は3台の新規な物理ディスク102、103、104を認識する。
Further, as shown in FIG. 4B, when three
次にRAIDコントローラ20は、物理ディスク101のAブロックからデータDA1を読み出し、物理ディスク105のCブロックからデータDA3’’を読み出し、物理ディスク106のAブロック、Bブロック、CブロックからそれぞれDA6、DA5’、DA4’’を読み出す。そしてRAIDコントローラ20は読み出した複数のデータDA1、DA3’’、 DA6、DA5’、DA4’’から、複数のデータ及びパリティデータに基づいて、消失したDA2を再構築する。このデータを構築する方式は、RAID5におけるデータ再構築に用いられる汎用のものであり、その詳細は省略する。
Next, the
次にRAIDコントローラ20は、再構築したデータDA2を新規な物理ディスク102のAブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク102のAブロックに書き込んだDA2を新規な物理ディスク103のBブロックおよび新規な物理ディスク104のCブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク101のAブロックに書き込まれているデータDA1を、新規な物理ディスク102のBブロックおよび新規な物理ディスク103のCブロックにそれぞれコピーする(矢印YB1)。さらにRAIDコントローラ20は物理ディスク101のBブロックに書き込まれているデータDA6’を新規な物理ディスク102のCブロックにコピーする(矢印YB6)。さらにRAIDコントローラ20は物理ディスク105のCブロックに書き込まれているDA3’’を新規な物理ディスク103のAブロックおよび新規な物理ディスク104のBブロックにコピーする(矢印YB3)。さらにRAIDコントローラ20は物理ディスク105のBブロックに書き込まれているDA4’を新規な物理ディスク104のAブロックにコピーする(矢印YB4)。以上の処置を経て、障害を起こした物理ディスク102、103、104に記憶させておくべきデータを復旧させる。
Next, the
また、図4(c)に示すように、4台の物理ディスク102、103、104、106が故障した場合、障害を起こした4台の物理ディスク102、103、104、106を正常な4台の物理ディスクに交換する。物理ディスク102、103、104、106が交換されると、RAIDコントローラ20は4台の新規な物理ディスク102、103、104、106を認識する。
Further, as shown in FIG. 4C, when four
次にRAIDコントローラ20は物理ディスク101のAブロックとBブロックからそれぞれデータDA1とDA6’を読み出し、物理ディスク105のAブロック、Bブロック、CブロックからそれぞれDA5、DA4’、DA3’’を読み出す。そしてRAIDコントローラ20は読み出した複数のデータDA1、DA6’、 DA5、DA4’、DA3’’から、複数のデータ及びパリティデータに基づいて、消失したDA2を再構築する。このデータを構築する方式は、RAID5におけるデータ再構築に用いられる汎用のものであり、その詳細は省略する。
Next, the
次にRAIDコントローラ20は、再構築したデータDA2を新規な物理ディスク102のAブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク102のAブロックに書き込んだDA2を新規な物理ディスク103のBブロックおよび新規な物理ディスク104のCブロックに書き込む。さらにRAIDコントローラ20は、物理ディスク101のAブロックに書き込まれているデータDA1を、新規な物理ディスク102のBブロックおよび新規な物理ディスク103のCブロックにそれぞれコピーする(矢印YC1)。さらにRAIDコントローラ20は物理ディスク101のBブロックに書き込まれているデータDA6’を新規な物理ディスク102のCブロックおよび新規な物理ディスク106のAブロックにそれぞれコピーする(矢印YC6)。さらにRAIDコントローラ20は物理ディスク105のCブロックに書き込まれているデータDA3’’を新規な物理ディスク103のAブロックおよび新規な物理ディスク104のBブロックにコピーする(矢印YC3)。さらにRAIDコントローラ20は物理ディスク105のBブロックに書き込まれているDA4’を新規な物理ディスク104のAブロックおよび新規な物理ディスク106のCブロックにそれぞれコピーする(矢印YC4)。さらにRAIDコントローラ20は物理ディスク105のAブロックに書き込まれているDA5を新規な物理ディスク106のBブロックにコピーする(矢印YC5)。以上の処置を経て、障害を起こした物理ディスク102、103、104、106に記憶させておくべきデータを復旧させる。
Next, the
このように、本発明に係るディスクアレイ装置1は、多くのディスクが故障した場合であっても、データ冗長率が高く、かつ、ディスク台数の増加を抑制し、小型化、低コスト化を図ることができる。例えば、上述した特許文献1に記載したミラー/RAID組合せ方式の従来例におけるディスクアレイ装置と比較する。まず、本願の物理ディスク1台当たりの容量をXとすると、特許文献1のものは、図5に示すように、1台当たりの容量は1/3となり、HDD全体の記憶容量は同じになる。例えば物理ディスクが2台故障した場合を比較する。本願は6台構成中2台故障しても、データが三重化されているため、100%縮退することなく運用を継続でき、冗長状態で復旧処理を実行できる。一方、従来例の場合は、6組12台の構成で2台故障した場合、1組2台故障した場合に縮退するため、約9%の確率で縮退状態のまま復旧処理をおこなわなければならない。そして、故障していない場合においては、全体のデータ実使用容量が同一であるにも関わらず、物理ディスク台数が半分で済むため、物理ディスクにかかるコストを抑えることが可能である。さらに、台数が多い構成になればなるほど、物理ディスクを収納するスペースが半分で済むため、冗長ディスクの筐体が半分となりコストを抑えることが可能である。
As described above, the
また、上述した特許文献2に記載した冗長ディスク方式の従来例におけるディスクアレイ装置と本発明におけるディスクアレイ装置とを比較する。本発明における1台当たりの物理ディスクの記憶容量をXとし、仮に、特許文献2の物理ディスクの1台当たりの記憶容量を1/3とする。この条件下において、本発明における記憶全容量は、物理ディスク6台の場合に6Xとなる。従来技術における記憶全容量は物理ディスク11台の場合にデータ用と冗長用との合計で(11/3)Xと小さくなる。ここで、物理ディスクのコストは、例えば、(容量Xのもの:容量1/3・Xのもの)=(36:17)であるとすると、全体のディスクコストは216:187となる。しかし、台数の構成が大きくなればなるほど従来技術の冗長ディスク台数も多く、搭載する筐体数も多くなる。容量XのHDD:搭載する筐体(HDD15台搭載用)=4:5とすると、(容量Xのもの:容量1/3・Xのもの:搭載する筐体)=(36:17:40)となる。HDD台数を上記の倍の構成の場合で考えた場合、本発明で使用する容量XのHDD12台、筐体1台、従来技術の冗長ディスク方式の場合容量1/3・XのHDD24台、搭載する筐体2台となりコストは、472:488となり、逆転する。すなわち、構成が大きくなればなるほど本発明の方がコストを抑制することができる。
Further, the disk array device in the conventional example of the redundant disk system described in Patent Document 2 described above and the disk array device in the present invention will be compared. The storage capacity per physical disk in the present invention is X, and the storage capacity per physical disk of Patent Document 2 is assumed to be 1/3. Under this condition, the total storage capacity in the present invention is 6X in the case of six physical disks. The total storage capacity in the prior art is reduced to (11/3) X in total for data and redundancy when there are 11 physical disks. Here, if the physical disk cost is, for example, (capacity X:
以上のように、本発明では、一台の物理ディスクが複数のデータを共有することにより、一台の物理ディスク内に記録されているデータは、分割領域毎にそれぞれ異なる物理ディスク上に形成された分割領域にコピーされて記憶されることとなるため、物理ディスクが複数台故障したとしても、容易にデータの復旧を図ることができ、データの冗長性を維持することができる。また、物理ディスクの台数の増加を抑制することができ、装置の低コスト化、小型化を図ることができる。特に、分割領域全て同一容量にすることにより、全てのデータが確実にコピーされることになり、データの信頼性が増す。 As described above, in the present invention, one physical disk shares a plurality of data, so that data recorded in one physical disk is formed on different physical disks for each divided area. Therefore, even if a plurality of physical disks fail, data can be easily recovered and data redundancy can be maintained. In addition, an increase in the number of physical disks can be suppressed, and the cost and size of the apparatus can be reduced. In particular, by making all the divided areas have the same capacity, all the data is surely copied, and the reliability of the data is increased.
なお、上述した実施形態では、RAID1とRAID5とに適用した場合について説明したが、これ以外にもRAID0、2、3、4の方式がある。
In the above-described embodiment, the case where the present invention is applied to
RAID0方式は、データをブロック単位に分割し、複数の物理ディスクに渡って分散してデータを記録する(ストライピング)方式である。RAID2方式は、データの誤りを検出・訂正するために、主記憶装置などで使用されるECC(Error Correction Code:「ハミングコード」、「エラー訂正コード」とも呼ばれる)を使用し、データはビットまたはバイト単位に分割し、データ専用の複数の物理ディスクに記憶する方式である。RAID3方式は、データをブロック単位、ビットまたはバイト単位に分割し、データ専用の複数の物理ディスクへ同時に書き込み、パリティは分割されたデータから生成され、パリティ専用の物理ディスクに書き込まれ、常に全ての物理ディスクに並行してアクセスし、データを一括して転送する方式である。RAID4方式は、RAID0のストライピングに、パリティ専用の物理ディスクを追加してデータを再生成する機能を持たせたものであり、データはブロック単位に分割し、データ用物理ディスクヘ記録され、パリティは1台のパリティ専用の物理ディスクに記録される方式である。これらのRAID方式にも本発明を同様に適用することができる。 The RAID 0 method is a method (striping) in which data is divided into block units and distributed over a plurality of physical disks to record the data (striping). The RAID 2 system uses ECC (Error Correction Code: also called “Haming code” or “error correction code”) used in a main storage device or the like to detect and correct data errors. In this method, data is divided into bytes and stored on a plurality of physical disks dedicated to data. The RAID3 method divides data into block units, bits or bytes, and writes simultaneously to a plurality of physical disks dedicated to data. Parity is generated from the divided data and written to the physical disk dedicated to parity. This is a method of accessing a physical disk in parallel and transferring data in a batch. The RAID4 method is a striping of RAID0 and has a function of regenerating data by adding a physical disk dedicated to parity. The data is divided into block units and recorded on the data physical disk, and the parity is 1 Is recorded on a physical disk dedicated to parity. The present invention can be similarly applied to these RAID systems.
1、200、400 ディスクアレイ装置
10、100 ディスクドライブ
11〜16 物理ディスク
101〜106 物理ディスク
20、250、450 RAIDコントローラ
21 RAIDコントロール部
22 ディスクドライバ
23 ミラー制御部
30、300、500 上位装置
410 データ用ディスクドライブ
420 列方向用冗長ディスクドライブ
430 行方向用冗長ディスクドライブ
1, 200, 400
Claims (6)
The control unit has an exchange recognition function for recognizing the exchange of the physical disk, recognizes the exchange of the physical disk, and exchanges data in storage areas of other physical disks in the set relation. 2. The disk array device according to claim 1, further comprising a function of copying to a storage area of the physical disk.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005083808A JP2006268286A (en) | 2005-03-23 | 2005-03-23 | Disk array device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005083808A JP2006268286A (en) | 2005-03-23 | 2005-03-23 | Disk array device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006268286A true JP2006268286A (en) | 2006-10-05 |
Family
ID=37204223
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005083808A Withdrawn JP2006268286A (en) | 2005-03-23 | 2005-03-23 | Disk array device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006268286A (en) |
-
2005
- 2005-03-23 JP JP2005083808A patent/JP2006268286A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7984325B2 (en) | Storage control device, data recovery device, and storage system | |
CA2532766C (en) | Data storage array | |
JP3742494B2 (en) | Mass storage device | |
US7529970B2 (en) | System and method for improving the performance of operations requiring parity reads in a storage array system | |
US7464322B2 (en) | System and method for detecting write errors in a storage device | |
CN100368976C (en) | Disk array apparatus and backup method of data | |
JP2010015195A (en) | Storage controller and storage control method | |
CN111400084B (en) | Method and apparatus for dynamic recovery management for fault tolerant disk arrays | |
US7062673B2 (en) | System and method for sparing in RAID-1 system | |
JP2005099995A (en) | Disk sharing method and system for magnetic disk device | |
JP2010026812A (en) | Magnetic disk device | |
JP2008217395A (en) | Disk array device | |
JP2005166016A (en) | Disk array device | |
JP2006268286A (en) | Disk array device | |
JP3991947B2 (en) | Disk array device having two types of parity and a plurality of data recovery methods | |
JP2570614B2 (en) | Disk array device | |
JP2778268B2 (en) | Recording medium control device | |
JP2013205853A (en) | Flash memory disk device, data storage control method and program in flash memory disk device | |
JPH0744331A (en) | Disk array device and its control method | |
GB2402803A (en) | Arrangement and method for detection of write errors in a storage system | |
JP4609034B2 (en) | Disk array device | |
JP2019121279A (en) | Disk array controller, storage device, restoration method of storage device and restoration program of disk array controller | |
JP4780331B2 (en) | Disk array system | |
JP2007128183A (en) | Storage system | |
JP2010257254A (en) | Magnetic disk device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080603 |