JP3177997B2 - Storage system - Google Patents

Storage system

Info

Publication number
JP3177997B2
JP3177997B2 JP08654091A JP8654091A JP3177997B2 JP 3177997 B2 JP3177997 B2 JP 3177997B2 JP 08654091 A JP08654091 A JP 08654091A JP 8654091 A JP8654091 A JP 8654091A JP 3177997 B2 JP3177997 B2 JP 3177997B2
Authority
JP
Japan
Prior art keywords
drive
data
drives
ecc
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08654091A
Other languages
Japanese (ja)
Other versions
JPH04318640A (en
Inventor
弘治 荒井
孝夫 佐藤
弘行 北嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP08654091A priority Critical patent/JP3177997B2/en
Publication of JPH04318640A publication Critical patent/JPH04318640A/en
Application granted granted Critical
Publication of JP3177997B2 publication Critical patent/JP3177997B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Detection And Correction Of Errors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、複数の記憶装置からな
るシステムにおいて、記憶装置に障害が発生した場合の
効率的なデータ回復方法に係わり、特にデータを複数の
記憶装置に分割して記憶するディスクアレイシステムな
どの場合に有効に適用できる障害回復方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an efficient data recovery method when a failure occurs in a storage device in a system including a plurality of storage devices, and in particular, stores data by dividing the data into the plurality of storage devices. The present invention relates to a failure recovery method that can be applied effectively in the case of a disk array system or the like.

【0002】[0002]

【従来の技術】複数の記憶装置からなるシステムにおい
て、複数の記憶装置にデータを分割して記憶する場合に
は、分割して記憶することによりデータの信頼性が低下
していた。
2. Description of the Related Art In a system including a plurality of storage devices, when data is divided and stored in a plurality of storage devices, the reliability of data is reduced by dividing and storing the data.

【0003】従来方式では、信頼性の低下を防止するた
めに全記憶装置を対象範囲とする障害回復用の冗長デー
タ(ECCデータ)を付加し、全記憶装置のうちいずれ
かに障害が発生した場合には、上記のECCデータによ
り、該記憶装置のデータを回復していた。
In the conventional system, redundant data (ECC data) for failure recovery covering all storage devices is added in order to prevent a decrease in reliability, and a failure occurs in any one of the storage devices. In such a case, the data in the storage device is recovered by the ECC data.

【0004】[0004]

【発明が解決しようとする課題】上記従来技術では、シ
ステムの記憶容量増加などによる記憶装置数の増加に伴
うデータ信頼性の低下に対抗して障害回復機能の強化の
ために、同時に回復できる障害状態の記憶装置数を示す
ECCデータの冗長度を増加した。このため、システム
の拡張に伴いECCデータの生成方法が複雑になりEC
Cデータ生成の負荷が増大し、また、ECCデータの障
害回復対象となる記憶装置が増加し、障害回復処理でア
クセスするデータ量が増大するなど障害回復の負荷が増
大していた。つまり従来方法では、システムとしての拡
張性が悪く、特に各パスに複数の記憶装置を接続する場
合では、多重に障害が発生するとパス性能がボトルネッ
クになり、システム性能が低下するという問題があっ
た。
In the above-mentioned prior art, a failure which can be recovered at the same time in order to enhance a failure recovery function against a decrease in data reliability due to an increase in the number of storage devices due to an increase in the storage capacity of the system. The redundancy of ECC data indicating the number of storage devices in the state has been increased. For this reason, the method of generating ECC data becomes complicated with the expansion of the system, and the EC
The load of C data generation has increased, the number of storage devices to be subjected to ECC data failure recovery has increased, and the amount of data accessed in the failure recovery processing has increased, thus increasing the load of failure recovery. In other words, in the conventional method, the expandability of the system is poor. In particular, when a plurality of storage devices are connected to each path, if multiple failures occur, the path performance becomes a bottleneck and the system performance is degraded. Was.

【0005】本発明の目的は、上記問題点の解決を図
り、複数の記憶装置を用いてデータを複数の記憶装置に
分割して記憶するシステムでの障害回復制御の高性能化
とシステム拡張性の向上を図ることである。
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-mentioned problems, and to improve the performance and expandability of failure recovery control in a system in which data is divided into a plurality of storage devices using a plurality of storage devices and stored. Is to improve.

【0006】本発明のもう一つの目的は、上記システム
の記憶装置の障害に対する障害回復処理に伴う記憶装置
およびパスに対するアクセス負荷の負荷分散の実現を図
ることである。
Another object of the present invention is to achieve load distribution of an access load to a storage device and a path associated with a failure recovery process for a failure of a storage device in the above system.

【0007】[0007]

【課題を解決するための手段】複数の記憶装置と該記憶
装置を制御する制御装置及び制御装置と各記憶装置の間
をつなぐパスからなり、複数の記憶装置にまたがってデ
ータを記憶するシステムにおいて、複数の記憶装置にま
たがって記憶するデータ集合から障害回復用のECCデ
ータを作成する手段と、上記ECCデータを別の記憶装
置に記憶し、該ECCデータと対応するデータ集合をE
CCグループとしてまとめて管理する手段と、ECCグ
ループを一括してアクセスする手段と、上記ECCグル
ープを互いに排他的な記憶装置またはパスの部分集合に
対応して複数個設定する手段と、一部の記憶装置のデー
タが障害などにより一時的または恒久的にアクセス不可
能になった場合に、該データが属するECCグループの
残りのデータを入力する手段と、入力したデータから上
記データを回復する手段により、障害回復処理の高性能
化を図ることができる。
SUMMARY OF THE INVENTION In a system for storing data across a plurality of storage devices, the storage system includes a plurality of storage devices, a control device for controlling the storage devices, and a path connecting the control device and each storage device. Means for generating ECC data for failure recovery from a data set stored over a plurality of storage devices, storing the ECC data in another storage device, and storing a data set corresponding to the ECC data in an E storage device.
Means for collectively managing as a CC group, means for collectively accessing ECC groups, means for setting a plurality of ECC groups corresponding to mutually exclusive storage devices or subsets of paths, When the data in the storage device becomes temporarily or permanently inaccessible due to a failure or the like, means for inputting the remaining data of the ECC group to which the data belongs, and means for recovering the data from the input data Thus, the performance of the failure recovery process can be improved.

【0008】また、上記システムにおいて、ECCグル
ープの設定を基準データ量毎に変更する手段により、障
害回復処理に伴う記憶装置やパスのアクセス負荷の負荷
分散を図ることができる。
Further, in the above system, the means for changing the setting of the ECC group for each reference data amount makes it possible to distribute the load of the access load of the storage device and the path accompanying the failure recovery processing.

【0009】[0009]

【作用】任意の記憶装置に発生した障害に伴う障害回復
処理では、回復対象のデータを含むECCグループを用
いて、障害状態の記憶装置を除く残りの記憶装置のデー
タから障害状態の記憶装置のデータを回復する。ECC
グループを互いに排他的な記憶装置またはパスの部分集
合に対して設定することにより、それぞれのECCグルー
プが担当するデータ量を制限しECCデータの量を少な
く設定でき、システムの記憶容量の拡大により記憶装置
数が増加しても、増加した記憶装置群を部分集合として
新たなECCグループを設定することにより、障害回復
処理に伴ってアクセスするデータ量を一定に保てるた
め、障害回復処理の負荷を増加させずに障害回復処理の
高性能化が達成できる。
In a failure recovery process associated with a failure that has occurred in an arbitrary storage device, an ECC group including data to be recovered is used to recover the storage device in the failed state from the data in the remaining storage devices excluding the failed storage device. Recover data. ECC
By setting a group for a mutually exclusive storage device or a subset of paths, the amount of data handled by each ECC group can be limited and the amount of ECC data can be reduced, and storage can be performed by increasing the storage capacity of the system. Even if the number of devices increases, a new ECC group is set as a subset of the increased storage device group, so that the amount of data to be accessed in accordance with the failure recovery processing can be kept constant, thereby increasing the load of the failure recovery processing. Without doing so, higher performance of the failure recovery processing can be achieved.

【0010】また、あらかじめECCグループの設定を
基準データ量毎に変更して設定することにより、特定の
記憶装置またはパスに固定的にECCグループを設定す
る方法に比較して、障害回復処理に伴ってアクセスする
データの総量は同じで、アクセスする記憶装置数または
パス数を増加できるため、障害回復処理に伴う記憶装置
1個またはパス1本あたりのアクセスデータ量が減少
し、記憶装置及びパスに対するアクセス負荷の負荷分散
を実現することができる。
In addition, by changing the setting of the ECC group in advance for each reference data amount and setting the ECC group in advance, the ECC group can be fixedly set to a specific storage device or path, and the ECC group can be set in accordance with the failure recovery processing. Since the total amount of data to be accessed is the same and the number of storage devices or paths to be accessed can be increased, the amount of access data per storage device or one path associated with the failure recovery processing decreases, and The load distribution of the access load can be realized.

【0011】[0011]

【実施例】以下、本発明の実施例を図面に基づいて詳細
に説明する。
Embodiments of the present invention will be described below in detail with reference to the drawings.

【0012】図3は、本実施例のシステム構成を示す。
記憶装置として磁気ディスク装置(以下、ドライブと言
う)を用い、並列動作可能な8個のドライブ101〜10
8と1個の予備ドライブ109及び該ドライブ群101
〜109を制御するディスク制御装置301と各ドライ
ブ101〜109とディスク装置301間をつなぎ全ド
ライブ101〜109が同時に動作可能なパス302か
らなる。このシステム構成ではドライブとパスが一対一
対応のため、ドライブを選択することとパスを選択する
ことは同じ意味である。データは上記8個のドライブ1
01〜108中の6ドライブに分割して記録し、残りの
2ドライブにはECCデータを記録する。図3では、E
CCグループ310はドライブB102,C103,D
104にデータ集合311を記録し、ドライブA101
にECCデータ312を記録し、ECCグループ320
はドライブF106,G107,H108にデータ集合
313を記録し、ドライブE105にECCデータ31
4を記録した場合を示している。なお、図3では本質的
でない複雑さを避けるために、予備ドライブを1個で表
示しているが、システムとして要求される信頼性を高め
るために、予備ドライブの個数を増加することは容易で
ある。
FIG. 3 shows a system configuration of this embodiment.
Eight drives 101 to 10 operable in parallel using a magnetic disk device (hereinafter referred to as a drive) as a storage device
8 and one spare drive 109 and the drive group 101
And a path 302 that connects the drives 101 to 109 to the disk device 301 and controls all the drives 101 to 109 at the same time. In this system configuration, since a drive and a path correspond one-to-one, selecting a drive and selecting a path have the same meaning. The data is the above 8 drives 1
Recording is performed by dividing the data into six drives 01 to 108, and ECC data is recorded in the remaining two drives. In FIG. 3, E
The CC group 310 includes drives B102, C103, and D
104, the data set 311 is recorded, and the drive A 101
ECC data 312 is recorded in the ECC group 320
Records the data set 313 in the drives F106, G107, and H108, and stores the ECC data 31 in the drive E105.
4 is recorded. Although FIG. 3 shows only one spare drive in order to avoid unnecessary complexity, it is easy to increase the number of spare drives in order to increase the reliability required for the system. is there.

【0013】図1は各ドライブの記憶領域を摸式化した
ものであり、縦の列101〜109がドライブを示し、
横の行131〜135が各ドライブのトラックを示す。
ドライブA101とドライブH108がドライブ序列番
号上で連続すると定義し、ECCグループをドライブ序
列番号で連続する4個のドライブに設定し、トラックを
基準データ量として各ドライブに対する設定を変更し、
1ドライブずつスライドして設定した場合を示す。例え
ば、トラック131のECCグループ111はドライブ
A101,B102,C103,D104に設定し、次
のトラック132では1ドライブ分スライドさせて、E
CCグループ113をドライブH108,A101,B10
2,C103に設定する。
FIG. 1 is a schematic diagram of a storage area of each drive, and vertical columns 101 to 109 show drives.
The horizontal rows 131 to 135 show the tracks of each drive.
It is defined that the drive A101 and the drive H108 are continuous on the drive sequence number, the ECC group is set to four drives continuous by the drive sequence number, and the setting for each drive is changed using the track as the reference data amount.
The case where the setting is performed by sliding one drive at a time is shown. For example, the ECC group 111 of the track 131 is set to the drives A101, B102, C103, and D104, and the next track 132 is slid by one drive, and
Drive CC group 113 to drive H108, A101, B10
2, set to C103.

【0014】図2は各ドライブの記憶領域を摸式化した
ものであり、図1と同じ形式である。ECCグループを
特定の4ドライブに固定的に設定した場合を示し、EC
Cグループ211をドライブA101,B102,C1
03,D104に設定し、ECCグループ212をドラ
イブE105,F106,G107,H108に設定し
たことを示す。
FIG. 2 schematically shows the storage area of each drive, and has the same format as that of FIG. This shows a case where the ECC group is fixedly set to a specific four drives.
Drives A101, B102, C1
03, D104, indicating that the ECC group 212 has been set to the drives E105, F106, G107, and H108.

【0015】図4は各ドライブの記憶領域を摸式化した
ものであり、図1と同じ形式である。ECCグループの
設定をトラック単位に変更し、変更の際のECCグルー
プの設定に必要な4個のドライブの選択において、各ド
ライブをランダムに選択するなど、各ドライブの組合せ
をできるだけ均等に実現するように選択した場合を示
す。例えば、トラック131のECCグループ411は
ドライブA101,B102,C103,D104に設定
し、トラック132のECCグループ413はドライブ
A101,D104,E105,F106に設定する。
FIG. 4 schematically shows the storage area of each drive, and has the same format as that of FIG. The setting of the ECC group is changed in track units, and in selecting four drives necessary for setting the ECC group at the time of the change, the combination of the drives is realized as uniformly as possible, such as selecting each drive at random. Shows the case where it is selected. For example, the ECC group 411 of the track 131 is set to the drives A101, B102, C103, and D104, and the ECC group 413 of the track 132 is set to the drives A101, D104, E105, and F106.

【0016】図5はECCグループを用いた障害回復処
理における、ドライブとディスク制御装置間でのデータ
及びECCデータの移動状況を示す。各データおよびE
CCデータは矢印に従った移動を行う。
FIG. 5 shows the movement of data and ECC data between a drive and a disk controller in a failure recovery process using an ECC group. Each data and E
The CC data moves according to the arrow.

【0017】図6はECCグループを用いた障害回復方
法のフローチャートを示す。
FIG. 6 shows a flowchart of a failure recovery method using an ECC group.

【0018】図7は各ドライブパスに2台のドライブを
接続した場合のシステム構成を示す。ドライブ101〜
109と対応するドライブ701〜709は、パス30
2を共有し、各ドライブはそれぞれ独立に動作できる
が、同時に同じパスを使用することはできない。
FIG. 7 shows a system configuration when two drives are connected to each drive path. Drive 101-
The drives 701 to 709 corresponding to the path 109
2 and each drive can operate independently, but cannot use the same path at the same time.

【0019】次に、図5,6を用いて、ドライブD10
4に障害が発生した場合のECCグループを用いた障害
回復処理について述べる。
Next, referring to FIGS.
4 describes a failure recovery process using an ECC group when a failure occurs.

【0020】ドライブ障害検出720はドライブからの
レスポンス情報の分析や状態監視機能などによりディス
ク制御装置301が行う。以下では、ドライブD104
にドライブ障害を検出したことを仮定する。ドライブ障
害を検出したディスク制御装置301はドライブD10
4のデータを回復するために障害回復処理700を起動
する。障害回復処理700では、予備ドライブチェック
701で予備ドライブJ109が使用可能状態かどうか
調べる。その結果により条件判定702において、予備
ドライブが使用可能状態でなければ707、障害回復処
理を終了し、使用可能状態であれば708、障害回復処
理を続行する。次にECCグループ入力703で、EC
Cグループ310からドライブD104を除くドライブ
A101,B102,C103のデータ312,60
1,602をディスク制御装置301に入力する。ディス
ク制御装置301に入力した該データ集合からデータ回
復704によりドライブD104のデータ603を回復
する。次に回復データ出力705で予備ドライブJ10
9にデータ603を出力する。続く条件判定706にお
いて、ドライブD104の全データを回復したかどうか
を判定し、回復するべきデータが残っている場合には7
09、ECCグループ入力703,データ回復704,
回復データ出力705を繰り返す。回復するべきデータ
が残っていない場合には710、障害回復処理を終了す
る。以上の処理により、ドライブD104のデータを予備ド
ライブJ109に回復することができ、ドライブD10
4の代わりにドライブJ109をアクセスすることによ
り、ドライブD104に障害が発生する前と同様に処理
を行うことができる。
The drive failure detection 720 is performed by the disk control device 301 by analyzing response information from the drive and monitoring the status. In the following, the drive D104
Assume that a drive failure has been detected. The disk control device 301 that has detected the drive failure is the drive D10.
In order to recover the data of No. 4, the failure recovery processing 700 is started. In the failure recovery processing 700, it is checked in the spare drive check 701 whether the spare drive J109 is available. As a result, in the condition determination 702, if the spare drive is not in the usable state, the failure recovery processing is terminated 707, and if the spare drive is in the usable state, the failure recovery processing is continued 708. Next, in the ECC group input 703, the EC
Data 312, 60 of drives A 101, B 102, C 103 excluding drive D 104 from C group 310
1, 602 are input to the disk control device 301. The data 603 of the drive D 104 is recovered by the data recovery 704 from the data set input to the disk control device 301. Next, at the recovery data output 705, the spare drive J10
9 to output data 603. In the subsequent condition determination 706, it is determined whether or not all the data in the drive D104 has been recovered.
09, ECC group input 703, data recovery 704,
The recovery data output 705 is repeated. If there is no data to be recovered, 710, the failure recovery processing ends. By the above processing, the data of the drive D104 can be recovered to the spare drive J109, and the drive D10 can be recovered.
By accessing the drive J109 instead of 4, it is possible to perform the same processing as before the failure occurred in the drive D104.

【0021】障害発生時には、ECCグループの設定の
差異にかかわらず、上記の障害回復処理を行うことによ
り、データの回復を図ることができる。
When a failure occurs, data recovery can be achieved by performing the above-described failure recovery processing regardless of the difference in the setting of the ECC group.

【0022】次に図2を用いて、ECCグループを特定
のドライブに固定的に設定した場合の障害回復方法の実
施例について詳細に述べる。
Next, an embodiment of a failure recovery method when an ECC group is fixedly set to a specific drive will be described in detail with reference to FIG.

【0023】4個のドライブの同一アドレスのトラック
群にECCグループを固定的に設定し、3トラックのデ
ータと対応する1トラックのECCデータを記憶する。
ドライブ101〜108は8個あるので、同一アドレス
を持つトラック群から2個のECCグループ211,2
12を設定できる。
An ECC group is fixedly set in a track group of the same address of the four drives, and ECC data of one track corresponding to data of three tracks is stored.
Since there are eight drives 101 to 108, two ECC groups 211 and
12 can be set.

【0024】ドライブD104に障害を仮定し、障害回
復処理について述べる。ドライブD104の一部または
全部のトラックがアクセス不可になると、ECCグルー
プ211を用いてドライブD104のデータを回復す
る。まず、トラック131の回復ではドライブA10
1,B102,C103のトラック131を入力し、ド
ライブD104のトラック131を回復し、予備ドライ
ブであるドライブJ109のトラック131に記憶する。
同様にドライブD104のトラック132の回復はドラ
イブA101,B102,C103のトラック132を
入力して行う。以下、各障害トラックについて毎回同一
のドライブA101,B102,C103からECCグ
ループの残りを入力し同様の処理を行うことにより、ド
ライブD104のデータを回復することができる。
Assuming that a failure has occurred in the drive D104, the failure recovery processing will be described. When some or all tracks of the drive D104 become inaccessible, the data of the drive D104 is recovered using the ECC group 211. First, in the recovery of the track 131, the drive A10
Tracks 131, B102 and C103 are input, and the track 131 of the drive D104 is recovered and stored in the track 131 of the drive J109 which is a spare drive.
Similarly, the recovery of the track 132 of the drive D104 is performed by inputting the track 132 of the drives A101, B102, and C103. Thereafter, the data of the drive D104 can be recovered by inputting the rest of the ECC group from the same drive A101, B102, and C103 for each failed track and performing the same processing.

【0025】本実施例によれば、障害回復処理に伴って
アクセスするドライブはドライブA101,B102,
C103の合計3個のドライブであり、他のドライブE1
05,F106,G107,H108には影響が無い。こ
のように、ECCグループを固定的に設定する方式は、
障害回復処理に伴ってアクセスするドライブの範囲を限
定し、他の領域のドライブは通常どおり動作できるとい
う利点がある。反面アクセスが集中するため、複数の障
害が同時に発生した場合には障害回復時間が長くなると
いう問題点がある。
According to the present embodiment, the drives to be accessed in accordance with the failure recovery processing are the drives A101, B102,
C103 is a total of three drives, and the other drive E1
05, F106, G107 and H108 have no effect. As described above, the method of fixedly setting the ECC group is as follows.
There is an advantage that the range of drives to be accessed in accordance with the failure recovery processing is limited, and drives in other areas can operate normally. On the other hand, since access is concentrated, if a plurality of faults occur simultaneously, there is a problem that the fault recovery time becomes longer.

【0026】次に、図1の場合の障害回復方法の実施例
について詳細に述べる。
Next, an embodiment of the failure recovery method in the case of FIG. 1 will be described in detail.

【0027】図1では、ドライブ序列番号が連続する4
ドライブの同一アドレスのトラック群を1個のECCグ
ループとして設定し、3トラックのデータと対応する1
トラックのECCデータを記憶する。ドライブ101〜
108は8個あるので、同一アドレスを持つトラックか
ら2個のECCグループを設定できる。さらにトラック
単位でECCグループの設定を1ドライブ分スライドさ
せる。
In FIG. 1, four consecutive drive sequence numbers are used.
A group of tracks at the same address of the drive is set as one ECC group, and one track corresponding to data of three tracks is set.
The ECC data of the track is stored. Drive 101-
Since there are eight 108s, two ECC groups can be set from tracks having the same address. Further, the setting of the ECC group is slid by one drive for each track.

【0028】ドライブD104に障害を仮定し、障害回
復処理について述べる。ドライブD104の一部または
全部のトラックがアクセス不可になると、ECCグルー
プを用いてドライブD104のデータを回復する。例え
ば、ドライブD104のトラック131の回復ではEC
Cグループ111を用いる。ドライブA101,B10
2,C103からトラック131を入力し、ドライブD
104のトラック131を回復し、予備ドライブである
ドライブJ109のトラック131に記憶する。同様に
ドライブD104のトラック132の回復はECCグル
ープ114を用いる。ドライブE105,F106,G
107からトラック132を入力し、同様の処理を行
う。以下、トラック133の回復はECCグループ11
6を用いて、ドライブC103,E105,F106に
アクセスし、トラック134の回復はECCグループ1
18を用いて、ドライブB102,C103,E105
にアクセスし、トラック135の回復はECCグループ
109を用いて、ドライブA101,B102,C10
3にアクセスし、同様の処理を行うことにより、ドライ
ブD104の全データを回復することができる。
Assuming that a failure has occurred in the drive D104, the failure recovery processing will be described. When some or all tracks of the drive D104 become inaccessible, the data of the drive D104 is recovered using the ECC group. For example, in recovery of the track 131 of the drive D104, EC
The C group 111 is used. Drive A101, B10
2, input the track 131 from C103 and drive D
The track 131 of 104 is recovered and stored in the track 131 of the drive J109 which is a spare drive. Similarly, the recovery of the track 132 of the drive D 104 uses the ECC group 114. Drive E105, F106, G
A track 132 is input from 107 and the same processing is performed. Hereinafter, the recovery of track 133 is ECC group 11
6, the drive C103, E105, and F106 are accessed, and the recovery of the track 134 is performed in the ECC group 1
18, the drive B102, C103, E105
, And the tracks 135 are recovered by using the ECC group 109 and the drives A101, B102, and C10.
3 and perform the same processing, all data in the drive D104 can be recovered.

【0029】本実施例によれば、図1のECCグループ
の設定では、障害処理に伴ってアクセスするドライブは
合計6個のドライブであり、図2のように固定的にEC
Cグループを設定する方法のアクセスドライブ数である
3個に比べて2倍のドライブにアクセスすることができ
る。しかも、アクセスするデータの総量は同じであるた
めドライブA101,B102,C103及び各ドライ
ブへのパス302の負荷の負荷分散を実現できる。
According to this embodiment, in the setting of the ECC group in FIG. 1, a total of six drives are accessed in accordance with the failure processing, and as shown in FIG.
It is possible to access twice as many drives as compared to three, which is the number of access drives in the method of setting the C group. Moreover, since the total amount of data to be accessed is the same, load distribution of the loads on the drives A101, B102, C103 and the path 302 to each drive can be realized.

【0030】以下、図4の場合の障害回復方法の実施例
について詳細に述べる。
Hereinafter, an embodiment of the failure recovery method in the case of FIG. 4 will be described in detail.

【0031】図4では、8個のドライブ101〜108
に対して、同一アドレスのトラックの中から4個を選択
するすべての組合せを平等に選択し、ECCグループと
して設定する。例えば、ECCグループ411はドライ
ブA101,B102,C103,D104のトラック13
1の集合であり、ECCグループ413はドライブA1
01,D104,E105,F106のトラック132
の集合である。
In FIG. 4, eight drives 101-108
, All combinations for selecting four tracks from the same address are equally selected and set as an ECC group. For example, the ECC group 411 includes the tracks 13 of the drives A101, B102, C103, and D104.
1 and the ECC group 413 is the drive A1
Track 132 of 01, D104, E105, F106
Is a set of

【0032】ドライブD104に障害を仮定し、障害回
復処理について述べる。ドライブD104の一部または
全部のトラックがアクセス不可になると、ECCグルー
プを用いてドライブD104のデータを回復する。トラ
ック131の回復ではECCグループ411を用いる。ド
ライブA101,B102,C103からトラック13
1を入力し、ドライブD104のトラック131を回復
し、予備ドライブであるドライブJ109のトラック1
31に記憶する。以下、トラック132については、E
CCグループ413を用いて、ドライブA101,E1
05,F106にアクセスし、トラック133について
は、ECCグループ416を用いて、ドライブB10
2,G107,H108にアクセスし、トラック134
については、ECCグループ418を用いて、ドライブ
B102,E105,F106にアクセスし、トラック
135については、ECCグループ419を用いて、ド
ライブA101,G107,H108にアクセスし、同
様の処理を行うことにより、ドライブD104のデータ
を回復することができる。
Assuming that a failure has occurred in the drive D104, the failure recovery processing will be described. When some or all tracks of the drive D104 become inaccessible, the data of the drive D104 is recovered using the ECC group. The recovery of the track 131 uses the ECC group 411. Tracks 13 from drives A101, B102, C103
1, the track 131 of the drive D104 is recovered, and the track 1 of the drive J109, which is a spare drive, is recovered.
31. Hereinafter, regarding the track 132, E
Using the CC group 413, the drives A101, E1
05 and F106, and for the track 133, using the ECC group 416, the drive B10
2, G107 and H108, and access the track 134
Is accessed by using the ECC group 418 to the drives B102, E105, and F106, and the track 135 is accessed by using the ECC group 419 to access the drives A101, G107, and H108, and the same processing is performed. The data in the drive D104 can be recovered.

【0033】本実施例によれば、障害処理に伴ってアク
セスするドライブは、ドライブD104を除くすべてのドラ
イブ、つまり合計7個のドライブである。図2のECC
グループを固定的に設定する方式の3個に比べて2倍以
上のドライブにアクセスし、図1の方式よりもアクセス
ドライブ数を増すことができる。また、アクセスするデ
ータの総量は同じであるため、ドライブA101,B1
02,C103及び各ドライブへのパス302の負荷の
負荷分散を実現できる。反面、各ECCグループの記憶
領域が断片化するため、領域管理が複雑になるという問
題点がある。
According to this embodiment, the drives to be accessed in response to the failure processing are all the drives except the drive D104, that is, a total of seven drives. The ECC of FIG.
More than twice the number of drives can be accessed as compared with the three methods in which the group is fixedly set, and the number of access drives can be increased as compared with the method of FIG. Since the total amount of data to be accessed is the same, the drives A101 and B1
02, C103 and the load of the path 302 to each drive can be distributed. On the other hand, since the storage area of each ECC group is fragmented, there is a problem that area management becomes complicated.

【0034】上記の3つの実施例では、ECCグループ
の設定を変更する基準データ量をトラックで行う場合を
述べたが、セクタやシリンダを基準データ量として採用
することは容易である。また、ビットやバイトを基準デ
ータ量として採用するには、上記実施例の様に磁気ディ
スク装置を記憶装置として利用する場合には効率が悪
く、バイトあるいはビット単位でアクセスする記憶装置
でシステムを構成することが望ましい。
In the above three embodiments, the case where the reference data amount for changing the setting of the ECC group is performed by the track has been described. However, it is easy to adopt a sector or a cylinder as the reference data amount. In addition, when bits or bytes are used as the reference data amount, the efficiency is low when the magnetic disk device is used as a storage device as in the above-described embodiment, and the system is configured by a storage device accessed in units of bytes or bits. It is desirable to do.

【0035】上記の実施例では、各パスにドライブを1
個接続したシステムであるが、次に図7に基づいて各パ
スに複数のドライブを接続したシステムの実施例につい
て述べる。図7では、各パスに2個のドライブを接続
し、ドライブ101〜108とドライブ801〜808
とでは、ECCグループの設定を1パス分ずらしてい
る。このため、ドライブD104とドライブP804に
同時に障害が発生した場合には、ドライブD104の障
害回復に伴うアクセスはパス831,832,833で行
い、ドライブP804の障害回復に伴うアクセスはパス
835,836,837で行う。
In the above embodiment, one drive is assigned to each path.
Next, an embodiment of a system in which a plurality of drives are connected to each path will be described with reference to FIG. In FIG. 7, two drives are connected to each path, and drives 101 to 108 and drives 801 to 808 are connected.
And, the setting of the ECC group is shifted by one pass. Therefore, when a failure occurs in the drive D104 and the drive P804 at the same time, access for recovery from the failure of the drive D104 is performed by the paths 831, 833, and 833, and access for recovery of the failure of the drive P804 is to the paths 835, 826. 837.

【0036】本実施例によれば、同一パスに複数ドライ
ブを接続するシステムの場合に、ECCグループをパス
について一定量ずらして設定することにより、同時に複
数のドライブに障害が発生した場合のパスに対する負荷
を分散することができる。
According to this embodiment, in the case of a system in which a plurality of drives are connected to the same path, the ECC group is set to be shifted by a fixed amount with respect to the path, so that a path in the case where a failure occurs in a plurality of drives at the same time is avoided. Load can be distributed.

【0037】[0037]

【発明の効果】以上詳細に述べたごとく、本発明によれ
ば、複数の磁気ディスク装置などの記憶装置からなり、
データを複数の記憶装置にまたがって記憶し、記憶装置
に障害発生時には障害状態の記憶装置を除く残りの記憶
装置のデータから障害回復処理を行う、システムにおい
て、互いに排他的な記憶装置の部分集合に対してECC
グループを設定することにより、システムの記憶容量の
拡大などにより記憶装置数が増加しても、障害回復処理
の負荷の増加を防止できる。
As described above in detail, according to the present invention, a storage device such as a plurality of magnetic disk devices is provided.
A set of mutually exclusive storage devices in a system that stores data across multiple storage devices and performs a failure recovery process from the data of the remaining storage devices except for the failed storage device when a failure occurs in the storage device Against ECC
By setting the group, even if the number of storage devices increases due to an increase in the storage capacity of the system, it is possible to prevent an increase in the load of the failure recovery processing.

【0038】また、本発明によれば、上記システムにお
ける障害回復処理において、ECCグループの設定を基
準データ量毎に記憶装置またはパスについて変更して設
定することにより、障害回復処理に必要なのアクセスを
より多くの記憶装置及びパスに対して行うことができる
ようになるので、負荷分散を図れる。
Further, according to the present invention, in the failure recovery processing in the above-described system, the access required for the failure recovery processing is achieved by changing the setting of the ECC group for the storage device or the path for each reference data amount and setting it. Since the operation can be performed for more storage devices and paths, the load can be distributed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】ECCグループをトラック単位で1ドライブづ
つずらして設定した構成を示す。
FIG. 1 shows a configuration in which an ECC group is set by shifting one drive at a time in track units.

【図2】ECCグループを特定の4ドライブに固定的に
設定した構成を示す。
FIG. 2 shows a configuration in which an ECC group is fixedly set to specific four drives.

【図3】実施例のシステム構成を示す。FIG. 3 shows a system configuration of an embodiment.

【図4】ECCグループを、8個のドライブの中から4
個のドライブを均等に選択して設定した場合の構成を示
す。
FIG. 4 shows an ECC group of 4 out of 8 drives.
1 shows a configuration in a case where drives are equally selected and set.

【図5】図3と同様のシステム構成において、ドライブ
障害に対して、障害回復を行う場合のデータの動きを示
す。
FIG. 5 shows data movement in the case of performing recovery from a drive failure in a system configuration similar to that of FIG. 3;

【図6】障害回復処理のフローチャート。FIG. 6 is a flowchart of a failure recovery process.

【図7】同一パスに複数記憶装置をつないだ場合のシス
テム構成図。
FIG. 7 is a system configuration diagram when a plurality of storage devices are connected to the same path.

【符号の説明】[Explanation of symbols]

101〜108…磁気ディスクドライブ、109…予備
ドライブ、111〜120…ECCグループ、131〜
135…トラック、211,212…ECCグループ、
301…ディスク制御装置、302…パス、311,3
13…データ集合、312,314…ECCデータ、3
10,320…ECCグループ、411〜420…ECC
グループ、601,602,603…データ、700…
障害回復処理、701…予備ドライブチェックステッ
プ、702…予備ドライブチェック判定ステップ、70
3…ECCグループ入力ステップ、704…データ回復
ステップ、705…回復データ出力ステップ、706…
回復終了判定ステップ、707…予備ドライブ不足の場
合の処理ルート、708…予備ドライブがある場合の処
理ルート、709…未回復データがある場合の処理ルー
ト、710…未回復データが無い場合の処理ルート、7
20…ドライブ障害検出ステップ、801〜809…ド
ライブ、811,813…データ集合、812,814
…ECCデータ、810,820…ECCグループ、8
31〜839…パス。
101 to 108: magnetic disk drive, 109: spare drive, 111 to 120: ECC group, 131 to
135 ... truck, 211, 212 ... ECC group,
301: Disk control device, 302: Path, 311, 3
13: Data set, 312, 314: ECC data, 3
10,320: ECC group, 411-420: ECC
Group, 601, 602, 603 ... data, 700 ...
Failure recovery processing, 701: spare drive check step, 702: spare drive check determination step, 70
3 ECC group input step 704 Data recovery step 705 Recovery data output step 706
Recovery end determination step, 707: processing route when there is insufficient spare drive, 708: processing route when there is a spare drive, 709: processing route when there is unrecovered data, 710 ... processing route when there is no unrecovered data , 7
20: drive failure detection step, 801 to 809: drive, 811, 813 ... data set, 812, 814
... ECC data, 810,820 ... ECC group, 8
31-839 ... pass.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 北嶋 弘行 神奈川県川崎市麻生区王禅寺1099番地 株式会社 日立製作所 システム開発研 究所内 (56)参考文献 特開 平2−157953(JP,A) 特開 昭62−293355(JP,A) 特開 平2−194457(JP,A) 特開 平2−291011(JP,A) 特開 平2−176822(JP,A) 特表 平3−505935(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 12/16 G06F 11/10 G06F 3/06 ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Hiroyuki Kitajima 1099 Ozenji Temple, Aso-ku, Kawasaki-shi, Kanagawa Prefecture Hitachi, Ltd. System Development Laboratory (56) References JP-A-2-157953 (JP, A) JP-A-62-293355 (JP, A) JP-A-2-194457 (JP, A) JP-A-2-291011 (JP, A) JP-A-2-176822 (JP, A) JP-A-3-505935 (JP) , A) (58) Field surveyed (Int.Cl. 7 , DB name) G06F 12/16 G06F 11/10 G06F 3/06

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 それぞれ異なる記憶装置に存在する複数
の記憶領域で一つのグループが形成され、該一つのグル
ープ内の少なくとも一つの記憶領域に、該一つのグルー
プ内の他の記憶領域のいずれかに保持されるデータの喪
失時に、喪失されたデータを再現するためのパリティデ
ータを格納する記憶装置システムにおいて、 第一の記憶装置の第一の記憶領域が属するグループ内の
複数の記憶領域の少なくとも一つが前記第一の記憶装置
の第二の記憶領域が属するグループ内の記憶領域を含ま
ない第二の記憶装置に設けられることを特徴とする記憶
装置システム。
1. A group is formed by a plurality of storage areas existing in different storage devices, and at least one storage area in the one group includes one of the other storage areas in the one group. In a storage device system for storing parity data for reproducing lost data when data stored in the storage device is lost, at least one of a plurality of storage regions in a group to which the first storage region of the first storage device belongs. A storage system, wherein one is provided in a second storage device that does not include a storage region in a group to which a second storage region of the first storage device belongs.
JP08654091A 1991-04-18 1991-04-18 Storage system Expired - Fee Related JP3177997B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08654091A JP3177997B2 (en) 1991-04-18 1991-04-18 Storage system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08654091A JP3177997B2 (en) 1991-04-18 1991-04-18 Storage system

Publications (2)

Publication Number Publication Date
JPH04318640A JPH04318640A (en) 1992-11-10
JP3177997B2 true JP3177997B2 (en) 2001-06-18

Family

ID=13889836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08654091A Expired - Fee Related JP3177997B2 (en) 1991-04-18 1991-04-18 Storage system

Country Status (1)

Country Link
JP (1) JP3177997B2 (en)

Also Published As

Publication number Publication date
JPH04318640A (en) 1992-11-10

Similar Documents

Publication Publication Date Title
JP3742494B2 (en) Mass storage device
EP0936534A2 (en) Recording device
US7694171B2 (en) Raid5 error recovery logic
JPH05181611A (en) Recorder and access system
JP4441929B2 (en) Disk device and hot swap method
JP2000207136A (en) Multi-drive fault-tolerance raid algorithm
US7076607B2 (en) System, method, and apparatus for storing segmented data and corresponding parity data
US20030163757A1 (en) RAID subsystem and data input/output and recovery method in disk error mode
US7487294B2 (en) RAID systems and setup methods thereof
JPH07261945A (en) Disk array device and disk array dividing method
JP3177997B2 (en) Storage system
US20010052051A1 (en) Method of controlling data access and system thereof
JPH08286844A (en) Parity generation control method and disk controller
JP3288071B2 (en) Information conversion processing device and information transfer control method
JPH06266508A (en) Disk array control method
JP3991947B2 (en) Disk array device having two types of parity and a plurality of data recovery methods
JP3584665B2 (en) Library storage device using portable media
JPH07146760A (en) Disk array device
JPH07200190A (en) Disk array device
JPH07160434A (en) Array type storage device system
JPH06282385A (en) Storage controller and information processing system provided with this controller
JPH0816327A (en) Disk array device
JP2000149384A (en) Disk array device
JPH0290254A (en) Data input/output system
JP3006296B2 (en) Array type storage device mounting method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees