JP3412665B2 - Disk array device and control method therefor - Google Patents

Disk array device and control method therefor

Info

Publication number
JP3412665B2
JP3412665B2 JP14325696A JP14325696A JP3412665B2 JP 3412665 B2 JP3412665 B2 JP 3412665B2 JP 14325696 A JP14325696 A JP 14325696A JP 14325696 A JP14325696 A JP 14325696A JP 3412665 B2 JP3412665 B2 JP 3412665B2
Authority
JP
Japan
Prior art keywords
data
file
disk drive
disk
restored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14325696A
Other languages
Japanese (ja)
Other versions
JPH09325866A (en
Inventor
誠 水上
康暁 田中
茂太郎 岩津
伸芳 井沢
啓章 白水
隆 河野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP14325696A priority Critical patent/JP3412665B2/en
Publication of JPH09325866A publication Critical patent/JPH09325866A/en
Application granted granted Critical
Publication of JP3412665B2 publication Critical patent/JP3412665B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、故障したディスク
ドライブのデータ復元中に生じるアクセス性能の低下を
最小限に抑えることができるディスクアレイ装置及びそ
の制御方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a disk array device and its control method capable of minimizing a decrease in access performance that occurs during data restoration of a failed disk drive.

【0002】[0002]

【従来の技術】ディスクアレイ装置2は、図1に示すよ
うに複数のディスクドライブ4A、4B、4C、4Dを
有する。図1はディスクアレイ装置2の基本構成を示
す。各ディスクドライブ4A、4B、4C、4Dは、内
部バス5を介して接続されたディスクアレイコントロー
ラ3にて制御される。また、このディスクアレイコント
ローラ3は、外部バス6を介してホストコンピュータ1
に接続されており、このホストコンピュータ1からのリ
ード/ライト命令に応じて各ディスクドライブ4A、4
B、4C、4Dにアクセスがなされる。
2. Description of the Related Art A disk array device 2 has a plurality of disk drives 4A, 4B, 4C and 4D as shown in FIG. FIG. 1 shows the basic configuration of the disk array device 2. The disk drives 4A, 4B, 4C and 4D are controlled by the disk array controller 3 connected via the internal bus 5. The disk array controller 3 is also connected to the host computer 1 via the external bus 6.
Connected to each of the disk drives 4A, 4A in response to a read / write command from the host computer 1.
B, 4C, and 4D are accessed.

【0003】ディスクドライブ4A等は、通常、正常に
機能しているか、異常状態が検出されたか等の情報を内
部データとして保管している。この保管情報はホストコ
ンピュータ1にてチェックされ、ディスクドライブ4A
等の異常検出等が行われる。具体的には、ホストコンピ
ュータ1がデータの読み書きの際にディスクドライブ4
A等からリード/ライトエラー(R/Wエラー)を受取
ると、ディスクドライブ4A等の保管情報をチェック
し、症状に応じて読み書きのリトライをしたり、ディス
クドライブ4A等の故障を判断したりする。
The disk drive 4A or the like normally stores information such as whether it is functioning normally or an abnormal state is detected as internal data. This storage information is checked by the host computer 1 and the disk drive 4A
Etc. are detected. Specifically, when the host computer 1 reads and writes data, the disk drive 4
When a read / write error (R / W error) is received from A or the like, the storage information of the disk drive 4A or the like is checked, read / write is retried according to the symptom, or the failure of the disk drive 4A or the like is determined. .

【0004】ディスクドライブ4A等の故障によるデー
タエラーを検出するには、従来より、パリティディスク
を設ける手法が採用されている。このパリティディスク
を設ける手法は、例えば、各ディスクドライブ4A等の
同一物理セクタに書き込まれた同一バイトの各データを
排他的論理和演算にて処理し、この演算結果に基づいて
パリティデータを生成してデータとともに記録しておく
ものである。
To detect a data error due to a failure of the disk drive 4A or the like, a method of providing a parity disk has been conventionally used. The method of providing this parity disk is, for example, processing each data of the same byte written in the same physical sector of each disk drive 4A etc. by exclusive OR operation and generating parity data based on this operation result. It is recorded together with the data.

【0005】しかし、この種の方法ではディスクドライ
ブ4A等が故障した際にデータの復元を行うことは不可
能である。そこで、従来のディスクアレイ装置2のディ
スクアレイコントローラ3には、ディスクドライブ4A
等が故障すると、交換された新規のディスクドライブ4
A等の上に、故障したディスクドライブ4Aのデータを
パリティデータを用いて復元する処理機能が備えられて
いる。
However, with this type of method, it is impossible to restore data when the disk drive 4A or the like fails. Therefore, the disk array controller 3 of the conventional disk array device 2 includes a disk drive 4A
New disk drive 4 that has been replaced
A processing function of restoring the data of the failed disk drive 4A using the parity data is provided on A and the like.

【0006】このデータ復元処理機能は、新規のディス
ク4Aに対して通常先頭のセクタから順番に実行され、
かつバックグランド処理で実行される。かかるバックグ
ランド処理で復元されたセクタは、ホストコンピュータ
1からのリード/ライト命令に対して全く影響を与えな
い。即ち、通常の高速なリード/ライト処理が可能であ
る。
This data restoration processing function is normally executed in order from the first sector on the new disk 4A,
And it is executed as a background process. The sector restored by such background processing does not affect the read / write command from the host computer 1 at all. That is, normal high-speed read / write processing is possible.

【0007】[0007]

【発明が解決しようとする課題】ところで、前記したデ
ィスクアレイ装置のデータ復元処理機能によれば、デー
タの復元処理を実行している最中に、ホストコンピュー
タからリード/ライト命令を受けると、復元されていな
いセクタに関してはフォアグランド処理でデータの復元
処理が行われる。よって、ホストコンピュータから見た
アクセス性能が著しく低下するという問題がある。
By the way, according to the above-mentioned data restoration processing function of the disk array device, when a read / write command is received from the host computer while the data restoration processing is being executed, the restoration is performed. Data restoration processing is performed in the foreground processing for the unsectors. Therefore, there is a problem that the access performance as seen from the host computer is significantly reduced.

【0008】すなわち、データのライト命令の場合には
新規のディスクドライブの復元されていないセクタにデ
ータを書き込み、このデータに基づいてパリティデータ
を更新するため、ほぼ通常のアクセス性能が維持される
が、ライト命令よりも遥かに実行確率が高いリード命令
の場合には所望のセクタを新規のディスクドライブに復
元した後に該セクタからデータを読み出すため、復元さ
れていないデータのリード命令は、アクセス性能を著し
く低下させるという問題が生じる。
That is, in the case of a data write command, the data is written in the unrestored sector of the new disk drive, and the parity data is updated based on this data, so that almost normal access performance is maintained. In the case of a read command, which has a much higher execution probability than a write command, the desired sector is restored to the new disk drive and then the data is read from that sector. The problem of significantly lowering occurs.

【0009】ここにおいて本発明の解決すべき主要な目
的は、次の通りである。本発明の第1の目的は、故障し
たディスクドライブのデータ復元中に起こるアクセス性
能の低下を最小限に抑えることができるディスクアレイ
装置及びその制御方法を提供せんとするものである。
The main objects to be solved by the present invention are as follows. It is a first object of the present invention to provide a disk array device and a control method therefor capable of minimizing a decrease in access performance that occurs during data restoration of a failed disk drive.

【0010】本発明の第2の目的は、アクセス直後のフ
ァイルが再アクセスされる確率が極めて高い、ビデオ・
オン・デマンドを始めとするマルチメディアサービスシ
ステムにおいて、ディスクドライブの故障の影響を最小
限にすることができるディスクアレイ装置及びその制御
方法を提供せんとするものである。
A second object of the present invention is that a file immediately after being accessed has a very high probability of being re-accessed.
It is an object of the present invention to provide a disk array device and a control method thereof that can minimize the influence of a disk drive failure in a multimedia service system including on-demand.

【0011】本発明のその他の目的は、明細書、図面、
特に特許請求の範囲の各請求項の記載から自ずと明らか
となろう。
Other objects of the present invention include the specification, drawings,
Especially, it will be apparent from the description of each claim.

【0012】[0012]

【課題を解決するための手段】前記した課題の解決は、
本発明が次に列挙する新規な特徴的構成手段及び手法を
採用することにより前記目的を達成する。
[Means for Solving the Problems] To solve the above-mentioned problems,
The present invention achieves the above object by adopting the novel characteristic construction means and techniques listed below.

【0013】すなわち、本発明装置の第1の特徴は、デ
ータを記録する複数のディスクドライブと、当該ディス
クドライブに内部バスを介して接続されたディスクアレ
イコントローラとを有するディスクアレイ装置におい
て、前記ディスクアレイコントローラは、前記ディスク
ドライブにデータを記憶する際、当該データを所定のデ
ータ長に分割するとともに、当該分割したデータ群に対
して冗長データを生成する冗長データ生成機能部と、前
記ディスクドライブの故障にて再生できなくなった分割
データを冗長データを参照して復元するデータ復元機能
部と、複数の前記ディスクドライブに記録されているフ
ァイルのアクセス確率を記録しておくアクセス確率テー
ブルと、復元すべきファイルに対してフラグをセットす
る修復テーブルと、を有し、データを書き込む場合には
前記冗長データ生成機能部において、所定長の分割デー
タと当該分割したデータに対して生成した冗長データと
を生成して、該データ群を複数の前記ディスクドライブ
に分散して記録するとともに、記録したファイルの前記
修復テーブルにおけるフラグがリセットされている場合
はデータの読み書きを実施し、複数の前記ディスクドラ
イブに記録されているファイルにアクセスがある度に前
記アクセス確率テーブルに該当ファイルのアクセス確率
を記録し、前記ディスクドライブの異常状態が検出さ
れ、これに応じて故障した当該ディスクドライブが切り
替えられた場合には、復元すべきファイルに対して前記
修復テーブルにおけるフラグをセットするとともに、前
記データ復元機能部においてファイルの復元処理を行
い、当該ファイルの復元したデータを新規のディスクド
ライブに記録して、復元したファイルの前記修復テーブ
ルにおけるフラグをリセットするバックグランド処理を
行い、当該バックグランド処理中にファイルのリード命
令を受けると、当該ファイルの前記修復テーブルにおけ
るフラグがセットされており、かつ前記アクセス確率テ
ーブルに記録された当該ファイルのアクセス確率が所定
のしきい値以上の場合には前記データ復元機能部におい
て当該ファイルの復元処理を行い、当該ファイルの復元
したデータを新規のディスクドライブに記録して当該フ
ァイルの前記修復テーブルにおけるフラグをリセットす
る一方、当該ファイルの前記修復テーブルにおけるフラ
グがセットされており、かつ前記アクセス確率テーブル
に記録されたアクセス確率が所定のしきい値未満の場合
には前記データ復元機能部において当該ファイルの復元
処理を行い、当該ファイルの復元したデータを新規のデ
ィスクドライブに記録せずに、リード処理を実施する、
ように構成されているディスクアレイ装置にある。
That is, the first feature of the device of the present invention is a disk array device having a plurality of disk drives for recording data and a disk array controller connected to the disk drives via an internal bus. When storing data in the disk drive, the array controller divides the data into a predetermined data length, and a redundant data generation function unit that generates redundant data for the divided data group, and the disk drive. A data restoration function unit that restores divided data that cannot be played back due to a failure by referring to redundant data, an access probability table that records the access probabilities of files recorded in multiple disk drives, and a restoration A repair table that sets a flag for files that should be, When writing data, the redundant data generation function unit generates divided data of a predetermined length and redundant data generated for the divided data, and the data group is stored in the plurality of disk drives. In addition to recording in a distributed manner, when the flag in the recovery table of the recorded file is reset, data is read and written, and the access probability is calculated every time a file recorded in a plurality of the disk drives is accessed. When the access probability of the corresponding file is recorded in the table and the abnormal state of the disk drive is detected and the failed disk drive is switched accordingly, the flag in the restoration table is set for the file to be restored. And set the file in the data restoration function section. The original process is performed, the restored data of the file is recorded in a new disk drive, the background process of resetting the flag in the restoration table of the restored file is performed, and the file read command is issued during the background process. When the file is received, if the flag in the restoration table of the file is set and the access probability of the file recorded in the access probability table is equal to or more than a predetermined threshold value, the file is restored in the data restoration function unit. Is performed, the restored data of the file is recorded in a new disk drive and the flag in the restoration table of the file is reset, while the flag in the restoration table of the file is set, and Record in access probability table When the accessed access probability is less than a predetermined threshold value, the data restoration function unit restores the file, and the read processing is performed without recording the restored data of the file in a new disk drive. To do
The disk array device is configured as described above.

【0014】本発明装置の第2の特徴は、前記本発明装
置の第1の特徴における前記ディスクアレイコントロー
ラにて分割するデータ長が、ビット、バイト又はワード
単位であるディスクアレイ装置にある。
A second feature of the device of the present invention resides in a disk array device in which the data length divided by the disk array controller in the first feature of the device of the present invention is a bit, byte or word unit.

【0015】本発明装置の第3の特徴は、前記本発明装
置の第1又は第2の特徴における前記ディスクドライブ
に、故障の際に交換して使用する予備用ディスクドライ
ブが備えられたディスクアレイ装置にある。
A third feature of the device of the present invention is that the disk drive in the first or second feature of the device of the present invention is provided with a spare disk drive to be replaced when a failure occurs. On the device.

【0016】本発明装置の第4の特徴は、前記本発明装
置の第1、第2又は第3の特徴における前記ディスクド
ライブが、当該ディスクドライブの異常状態をコンピュ
ータがデータの読み書きの際に検出するための情報を内
部データとして保管するディスクアレイ装置にある。
A fourth feature of the device of the present invention is that the disk drive in the first, second or third feature of the device of the present invention detects an abnormal state of the disk drive when the computer reads or writes data. The disk array device stores information for doing so as internal data.

【0017】本発明装置の第5の特徴は、前記本発明装
置の第1、第2、第3又は第4の特徴における前記ディ
スクドライブが、ビデオ・オン・デマンド等のマルチメ
ディアサービスを提供するホストコンピュータの外部記
憶装置であるディスクアレイ装置にある。
A fifth feature of the device of the present invention is that the disk drive in the first, second, third or fourth feature of the device of the present invention provides a multimedia service such as video on demand. The disk array device is an external storage device of the host computer.

【0018】本発明方法の第1の特徴は、複数のディス
クドライブの制御を内部バスを介して接続されたディス
クアレイコントローラにて行うに当たり、データを書き
込む場合には所定長の分割データと冗長データとを生成
して、該データ群を複数のディスクドライブに分散して
記録するとともに、記録したファイルのフラグがリセッ
トされている場合はデータの読み書きを実施し、複数の
前記ディスクドライブに記録されているファイルにアク
セスがある度に当該ファイルのアクセス確率を記録し、
ディスクドライブの異常状態が検出され、これに応じて
故障したディスクドライブが切り替えられた場合には、
復元すべきファイルに対して前記フラグをセットすると
ともに、当該ファイルの復元処理を行い、当該ファイル
の復元したデータを新規のディスクドライブに記録し
て、復元した当該ファイルの前記フラグをリセットする
バックグランド処理を行い、当該バックグランド処理中
にファイルのリード命令を受けると、当該ファイルが未
修復であり、かつアクセス確率が所定のしきい値以上の
場合には当該ファイルの復元処理を行い、当該ファイル
の復元したデータを新規のディスクドライブに記録して
当該ファイルの前記フラグをリセットする一方、当該フ
ァイルが未修復であり、かつアクセス確率が所定のしき
い値未満の場合には当該ファイルの復元処理を行い、当
該ファイルの復元したデータを新規のディスクドライブ
に記録せずに、リード処理を実施するディスクアレイ装
置の制御方法にある。
The first feature of the method of the present invention is that when data is written when controlling a plurality of disk drives by a disk array controller connected via an internal bus, divided data of a predetermined length and redundant data are written. Is generated, the data group is distributed and recorded in a plurality of disk drives, and if the flag of the recorded file is reset, the data is read and written, and the data is recorded in the plurality of disk drives. Each time a file is accessed, the access probability of that file is recorded,
If an abnormal condition of a disk drive is detected and the failed disk drive is switched accordingly,
A background that sets the flag for the file to be restored, restores the file, records the restored data of the file in a new disk drive, and resets the flag of the restored file. When a file read command is received during the background process, if the file is unrepaired and the access probability is equal to or higher than a predetermined threshold, the file is restored and the file is restored. The restored data is recorded in a new disk drive and the flag of the file is reset, while the file is unrestored and the access probability is less than a predetermined threshold, the restoration process of the file is performed. The recorded data of the file is not recorded on the new disk drive, and The control method for a disk array apparatus for carrying out the process.

【0019】本発明方法の第2の特徴は、前記本発明方
法の第1の特徴における前記アクセス確率が、単位時間
当りのファイルのアクセス回数からもしくは、ファイル
をアクセスした後の経過時間から求めてなるディスクア
レイ装置の制御方法にある。
A second feature of the method of the present invention is that the access probability in the first feature of the method of the present invention is obtained from the number of file accesses per unit time or from the elapsed time after the file is accessed. Another method of controlling a disk array device is described below.

【0020】本発明方法の第3の特徴は、前記本発明方
法の第2の特徴における前記ファイルのアクセス確率の
しきい値が、 ファイルが復元されるまでの平均待ち時間当たりのアクセス回数 =2(Kw−1)/{TR(KE−1)}、 ただし、Kw=書き込みを行うデータ修復を伴うデータリード時間/ 全てのディスクドライブが正常な場合のデータリード時間、 KE=書き込みを行わないデータ修復を伴うデータリード時間/ 全てのディスクドライブが正常な場合のデータリード時間、 TR=新規のディスクドライブの修復に要する時間、 で求めてなるディスクアレイ装置の制御方法にある。
The third feature of the method of the present invention is that the threshold value of the access probability of the file in the second feature of the method of the present invention is the number of accesses per average waiting time until the file is restored = 2. (Kw-1) / {TR (KE-1)}, where Kw = data read time with data recovery for writing / data read time when all disk drives are normal, KE = data for no writing Data read time accompanied by repair / data read time when all disk drives are normal, TR = time required for repair of new disk drive.

【0021】本発明方法の第4の特徴は、前記本発明方
法の第1、第2又は第3の特徴における前記ディスクア
レイコントローラにて分割するデータ長が、ビット、バ
イト又はワード単位であるディスクアレイ装置の制御方
法にある。
A fourth feature of the method of the present invention is that the data length divided by the disk array controller in the first, second or third feature of the method of the present invention is a bit, byte or word unit. It is in the control method of the array device.

【0022】本発明方法の第5の特徴は、前記本発明方
法の第1、第2、第3又は第4の特徴における前記ディ
スクドライブには、故障の際に交換して使用する予備用
ディスクドライブが備えられているディスクアレイ装置
の制御方法にある。
A fifth feature of the method of the present invention is that the disk drive in the first, second, third or fourth feature of the method of the present invention is a spare disk to be replaced when a failure occurs. A method of controlling a disk array device provided with a drive.

【0023】本発明方法の第6の特徴は、前記本発明方
法の第1、第2、第3、第4又は第5の特徴における前
記ディスクドライブが、当該ディスクドライブの異常状
態をコンピュータがデータの読み書きの際に検出するた
めの情報を内部データとして保管するディスクアレイ装
置の制御方法にある。
A sixth feature of the method of the present invention is that the disk drive according to the first, second, third, fourth or fifth feature of the method of the present invention uses a computer to record an abnormal state of the disk drive. In the method of controlling a disk array device, information for detecting when reading and writing is stored as internal data.

【0024】本発明方法の第7の特徴は、前記本発明方
法の第1、第2、第3、第4、第5又は第6の特徴にお
ける前記ディスクドライブが、ビデオ・オン・デマンド
等のマルチメディアサービスを提供するホストコンピュ
ータの外部記憶装置であるディスクアレイ装置の制御方
法にある。
A seventh characteristic of the method of the present invention is that the disk drive in the first, second, third, fourth, fifth or sixth characteristic of the method of the present invention is a video-on-demand type or the like. A method of controlling a disk array device, which is an external storage device of a host computer that provides multimedia services.

【0025】[0025]

【発明の実施の形態】以下、添付図面を参照して本発明
の実施の形態を、その装置例及び方法例に基づいて説明
する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to its apparatus and method examples with reference to the accompanying drawings.

【0026】(装置例) 図1は本装置例のディスクアレイ装置2の基本構成を示
し、図2は通常時のデータのリード/ライト処理の流れ
を示し、図3は故障時のデータのリード/ライト処理の
流れを示す。
(Device Example) FIG. 1 shows a basic configuration of a disk array device 2 of this device example, FIG. 2 shows a flow of normal data read / write processing, and FIG. 3 shows data read at the time of failure. / Shows the flow of write processing.

【0027】ディスクアレイ装置2は、従来の技術の欄
にて説明した通り、複数のディスクドライブ4A、4
B、4C、4Dを有する。各ディスクドライブ4A、4
B、4C、4Dは、内部バス5を介して接続されたディ
スクアレイコントローラ3にて制御される。また、この
ディスクアレイコントローラ3は、外部バス6を介して
ホストコンピュータ1に接続されており、このホストコ
ンピュータ1からのリード/ライト命令に応じて各ディ
スクドライブ4A、4B、4C、4Dにアクセスがなさ
れる。
The disk array device 2 has a plurality of disk drives 4A and 4A, as described in the section of the prior art.
B, 4C, 4D. Each disk drive 4A, 4
B, 4C and 4D are controlled by the disk array controller 3 connected via the internal bus 5. The disk array controller 3 is connected to the host computer 1 via an external bus 6, and can access the disk drives 4A, 4B, 4C, 4D in response to a read / write command from the host computer 1. Done.

【0028】本装置例のディスクアレイ装置2では、ホ
ストコンピュータ1がディスクアレイコントローラ3に
対してデータのライト命令を出すと、ディスクアレイコ
ントローラ3はホストコンピュータ1から転送されたデ
ータを、例えば図2に示すように3つに分割するととも
に、当該分割データに対して、例えば偶数パリティデー
タを生成し、計4つの分割データを生成する。このよう
にして生成されたデータは4つのディスクドライブ4
A、4B、4C、4Dに分割されて記録される。
In the disk array device 2 of this device example, when the host computer 1 issues a data write command to the disk array controller 3, the disk array controller 3 stores the data transferred from the host computer 1, for example, in FIG. As shown in (3), while dividing into three, for example, even parity data is generated, and a total of four divided data is generated. The data thus generated is stored in four disk drives 4
The data is divided into A, 4B, 4C, and 4D and recorded.

【0029】また、記録されたデータをリード処理する
場合には、通常パリティデータを除く3つの分割データ
を3つのディスクドライブ4A、4B、4Cから読み出
し、これを結合してホストコンピュータ1に転送する。
例えば、ここで1つのディスクドライブ4Cが故障する
と、図3に示すように故障していない3つのディスクド
ライブ4A、4B、4Dからパリティデータおよび分割
されたデータを読み出し、該データに対して偶数パリテ
ィ演算を行ってディスクドライブ4Cの故障にて再生で
きなくなった分割データを復元し、復元されたデータを
新規のディスクドライブ(図を省略)に書き込むととも
に、書き込んだデータを再び読み出してホストコンピュ
ータ1に転送する。
When the recorded data is read, the three divided data except the normal parity data are read from the three disk drives 4A, 4B and 4C, combined, and transferred to the host computer 1. .
For example, if one disk drive 4C fails here, the parity data and the divided data are read from the three disk drives 4A, 4B, and 4D that have not failed as shown in FIG. The divided data that cannot be played back due to the failure of the disk drive 4C is calculated, the restored data is written to a new disk drive (not shown), and the written data is read again to the host computer 1. Forward.

【0030】なお、パリティデータを記録しているディ
スクドライブ4Dが故障した場合には、同様にパリティ
データの復元処理が行なわれるが、通常の手順でデータ
の読み出しが可能なので、ホストコンピュータ1から見
たアクセス性能の低下は生じない。
If the disk drive 4D recording the parity data fails, the parity data is restored in the same manner. However, since the data can be read out by the normal procedure, the host computer 1 can see it. Access performance does not deteriorate.

【0031】図4は本装置例のディスクアレイ装置2に
おけるディスクアレイコントローラ3の構成を示す。デ
ィスクアレイコントローラ3は、ホストコンピュータ1
から転送されたデータを分割するとともに、パリティデ
ータを生成する冗長データ生成機能部31、故障したデ
ィスクドライブ4A〜4Dを検出するとともにパリティ
演算を行ってディスクドライブ4A、4B、4C、4D
の故障にて再生できなくなった分割データを復元するデ
ータ復元機能部32、ディスクアレイ装置2に記録され
ているファイルのアクセス確率を記録するアクセス確率
テーブル33、該ファイルがディスクアレイコントロー
ラ3にて復元されたか否かを示す修復テーブル34、デ
ィスクドライブ4A、4B、4C、4Dをアクセスする
ための内部バスインタフェース36、及びホストコンピ
ュータ1と接続するための外部バスインタフェース35
を有し、データを書き込む場合には冗長データ生成機能
部において、所定長の分割データとこの分割したデータ
に対して生成した冗長データとを生成して、当該データ
群を複数の前記ディスクドライブに分散して記録すると
ともに、記録したファイルの修復テーブルにおけるフラ
グがリセットされている場合はデータの読み書きを実施
し、複数の前記ディスクドライブに記録されているファ
イルにアクセスがある度にアクセス確率テーブルに該当
ファイルのアクセス確率を記録し、ディスクドライブの
異常状態が検出され、これに応じて故障したディスクド
ライブが切り替えられた場合には、復元すべきファイル
に対して修復テーブルにおけるフラグをセットするとと
もに、データ復元機能部においてファイルの復元処理を
行い、当該ファイルの復元したデータを新規のディスク
ドライブに記録して、復元したファイルの修復テーブル
におけるフラグをリセットするバックグランド処理を行
い、バックグランド処理中にファイルのリード命令を受
けると、当該ファイルの修復テーブルにおけるフラグが
セットされており、かつアクセス確率テーブルに記録さ
れた当該ファイルのアクセス確率が所定のしきい値以上
の場合にはデータ復元機能部において当該ファイルの復
元処理を行い、当該ファイルの復元したデータを新規の
ディスクドライブに記録して当該ファイルの修復テーブ
ルにおけるフラグをリセットする一方、当該ファイルの
修復テーブルにおけるフラグがセットされており、かつ
アクセス確率テーブルに記録されたアクセス確率が所定
のしきい値未満の場合にはデータ復元機能部において当
該ファイルの復元処理を行い、当該ファイルの復元した
データを新規のディスクドライブに記録せずに、リード
処理を実施するように構成されている。
FIG. 4 shows the configuration of the disk array controller 3 in the disk array device 2 of this device example. The disk array controller 3 is the host computer 1
The redundant data generation function unit 31 that splits the data transferred from the disk drive and generates the parity data, detects the failed disk drives 4A to 4D, and performs the parity operation to perform the disk drives 4A, 4B, 4C, and 4D.
Data recovery function unit 32 for recovering the divided data that cannot be reproduced due to the failure of the above, an access probability table 33 for recording the access probability of the file recorded in the disk array device 2, and the file is recovered by the disk array controller 3. The recovery table 34 indicating whether or not the disk drive has been executed, the internal bus interface 36 for accessing the disk drives 4A, 4B, 4C, 4D, and the external bus interface 35 for connecting to the host computer 1.
When writing data, the redundant data generation function unit generates divided data of a predetermined length and redundant data generated for the divided data, and the data group is stored in the plurality of disk drives. In addition to recording in a distributed manner, if the flag in the recovery table of the recorded file is reset, the data is read and written, and the access probability table is written each time a file recorded in multiple disk drives is accessed. When the access probability of the corresponding file is recorded and an abnormal state of the disk drive is detected, and the failed disk drive is switched accordingly, a flag in the recovery table is set for the file to be restored, and The data restoration function section restores the file and The restored data of is recorded in a new disk drive, the background process of resetting the flag in the restoration table of the restored file is performed, and when a file read command is received during the background processing, the restoration table of the file If the flag is set and the access probability of the file recorded in the access probability table is greater than or equal to the predetermined threshold value, the data restoration function unit restores the file and restores the restored data of the file. On the new disk drive to reset the flag in the repair table for the file, while the flag in the repair table for the file is set, and the access probability recorded in the access probability table is the predetermined threshold value. Data recovery if less than And restore processing of the file in function unit, the restored data of the file without recording the new disk drive, and is configured to perform a read process.

【0032】ディスクアレイコントローラ3内の冗長デ
ータ生成機能部31とデータ復元機能部32は、ディス
クドライブ4A、4B、4C、4Dが故障していない通
常の状態では、図2に示した処理の流れに従ってデータ
の記録再生を行う。そして、ディスクドライブ4A、4
B、4C、4Dのうち1台が故障すると、故障したディ
スクドライブ4Cの代りに接続されたディスクドライ
ブ、若しくは予め起動されていたホットスタンバイ・デ
ィスクドライブに障害の発生したディスクドライブ4C
と同等のデータを復元する。
The redundant data generation function unit 31 and the data restoration function unit 32 in the disk array controller 3 are in the normal state where the disk drives 4A, 4B, 4C, and 4D have not failed, and the process flow shown in FIG. The data is recorded and reproduced in accordance with. And the disk drives 4A, 4
If one of the B, 4C, and 4D fails, the disk drive connected in place of the failed disk drive 4C, or the disk drive 4C in which the hot standby disk drive that was previously activated has failed
Restore data equivalent to.

【0033】(第1方法例) 次に前記装置例を用いて実行した本発明の方法例につい
て説明する。図5は第1方法例のディスクアレイ装置2
の制御方法におけるデータ復元処理の手順のフローチャ
ートを示す。
(First Method Example) Next, an example method of the present invention executed by using the above apparatus example will be described. FIG. 5 shows the disk array device 2 of the first method example.
6 is a flowchart of a procedure of data restoration processing in the control method of FIG.

【0034】先ず、ディスクドライブ4Cの故障が検出
され、これに応じて故障したディスクドライブ4Cが人
手で交換され、又はホットスタンバイ・ディスクドライ
ブに切り替えられたか否かが判断される(ST1)。故
障したディスクドライブ4Cが切り替えられた場合に
は、ディスクアレイコントローラ3は復元すべきディス
クドライブ4Cを特定し(ST2)、修復テーブル34
に登録されているすべてのファイルのフラグをセットす
る(ST3)。なお、フラグがセットされたファイルは
復元されていないことを示しており、復元された段階で
始めてリセットされる。
First, the failure of the disk drive 4C is detected, and it is determined whether the failed disk drive 4C is manually replaced or switched to the hot standby disk drive (ST1). When the failed disk drive 4C is switched, the disk array controller 3 identifies the disk drive 4C to be restored (ST2) and restore table 34.
Flags of all files registered in are set (ST3). It should be noted that the file in which the flag is set indicates that the file has not been restored, and will be reset only when restored.

【0035】次に、ディスクアレイコントローラ3は、
アクセス確率テーブル33を参照し(ST4)、復元す
べきファイルから最もアクセス確率の高いファイルを抽
出する(ST5)。続いて、データ復元機能部32を用
いて該ファイルの再生ができなくなった分割データの復
元処理を実行し、復元された分割データを新規のディス
クドライブに記録する(ST6)。
Next, the disk array controller 3
The access probability table 33 is referred to (ST4), and the file with the highest access probability is extracted from the files to be restored (ST5). Subsequently, the data restoration function unit 32 is used to execute the restoration processing of the divided data in which the file cannot be reproduced, and the restored divided data is recorded in a new disk drive (ST6).

【0036】そして、最後にファイルの復元処理が完了
すると、ディスクアレイコントローラ3は修復テーブル
34の該当するファイルのフラグをリセットする(ST
7)。このようにして復元され修復テーブル34のフラ
グがリセットされたファイルは、その後のアクセスに対
して図2に示す通常のリード/ライト処理が行なわれ
る。
Then, when the file restoration process is finally completed, the disk array controller 3 resets the flag of the corresponding file in the restoration table 34 (ST.
7). The file thus restored and the flag of the repair table 34 is reset is subjected to the normal read / write processing shown in FIG. 2 for subsequent access.

【0037】さらに、復元すべきファイルが有ると判断
されると(ST8)、ST4〜ST7の処理が再び行わ
れる。すなわち、ディスクアレイコントローラ3は、引
き続き修復テーブル34内でフラグがセットされたファ
イルの中から最もアクセス確率の高いファイルを抽出
し、復元処理を行い、復元すべきファイルが無くなった
時点でファイルの復元処理を終了する。これらの処理は
全てバックグランド処理で実行される。
Further, when it is determined that there is a file to be restored (ST8), the processes of ST4 to ST7 are performed again. That is, the disk array controller 3 continues to extract the file with the highest access probability from the files in which the flag is set in the repair table 34, performs the restoration process, and restores the file when there are no files to be restored. The process ends. All of these processes are executed in the background process.

【0038】一方、故障したディスクドライブ4Cが交
換されていないと判断されると(ST1)、復元された
分割データは保存されないので、ディスクアレイコント
ローラ3は単に復元された分割データと再生可能な分割
データを結合して、ホストコンピュータ1に転送する。
なお、アクセス確率の算出法は、例えば単位時間当たり
のファイルのアクセス回数もしくは、ファイルをアクセ
スした後の経過時間から求める等の種々の方法が考えら
れるが、システムの特性に合せて選択すると良い。
On the other hand, when it is determined that the failed disk drive 4C has not been replaced (ST1), the restored divided data is not saved, so the disk array controller 3 simply restores the restored divided data and the reproducible divided data. The data is combined and transferred to the host computer 1.
Various methods can be considered for calculating the access probability, for example, the number of times a file is accessed per unit time or the elapsed time after the file is accessed can be used, but it is preferable to select it according to the characteristics of the system.

【0039】続いて、ファイルの復元をバックグランド
で処理中に、ホストコンピュータ1からリード命令があ
った場合の処理手順について説明する。図6は第1方法
例のディスクアレイ装置2の制御方法におけるファイル
復元中のリード手順を示し、図7は同制御方法における
ファイル復元中のライト手順を示す。
Next, the processing procedure when there is a read command from the host computer 1 while the file restoration is being processed in the background will be described. FIG. 6 shows a read procedure during file restoration in the control method of the disk array device 2 of the first method example, and FIG. 7 shows a write procedure during file restoration in the control method.

【0040】ファイルの復元をバックグランドで処理中
に、ホストコンピュータ1からリード命令があった場合
には、ディスクアレイコントローラ3は図6に示すよう
に、修復テーブル34を参照して所望のファイルが復元
されているか否かを確認する(ST10)。このように
所望のファイルが復元されているか否かを判断した後、
所望のファイルが復元されている場合は図2に示すよう
に所望のファイルのリードを行う(ST13)。
When a read command is issued from the host computer 1 while the file restoration is being processed in the background, the disk array controller 3 refers to the restoration table 34 as shown in FIG. It is confirmed whether the data has been restored (ST10). After deciding whether the desired file has been restored in this way,
If the desired file is restored, the desired file is read as shown in FIG. 2 (ST13).

【0041】一方、所望のファイルが復元されていない
場合はフォアグランドで所望のファイルの復元処理を行
い(ST11)、復元されたファイルの修復テーブル3
4のフラグをリセットして所望のファイルのリードを行
う(ST12、ST13)。したがって、データ復元機
能部32がディスクドライブ4Cの故障にて読めなくな
ったデータを復元し、該データを新規のディスクドライ
ブに書き込んでから通常のリード処理を実行する。
On the other hand, if the desired file is not restored, the desired file is restored in the foreground (ST11), and the restoration table 3 for the restored file is executed.
The flag of No. 4 is reset and the desired file is read (ST12, ST13). Therefore, the data restoration function unit 32 restores the unreadable data due to the failure of the disk drive 4C, writes the data in a new disk drive, and then executes the normal read processing.

【0042】ファイルの復元処理中に、ホストコンピュ
ータ1からライト命令があった場合には、図7に示すよ
うに新規のディスクドライブに通常通りデータを書き込
む(ST20)とともに書き込まれたファイルの修復テ
ーブル34のフラグをリセットする(ST21)。
When a write command is issued from the host computer 1 during the file restoration process, as shown in FIG. 7, data is normally written in a new disk drive (ST20) and the written file restoration table is written. The flag of 34 is reset (ST21).

【0043】このようにしてディスクアレイコントロー
ラ3は、アクセス確率の高い順番にファイルを復元し、
復元したファイルについては直ちに通常のアクセスが行
なわれるように制御する。またファイルを復元している
最中にホストコンピュータ1がファイルのリード/ライ
ト命令を出すと、該ファイルの復元処理を行ってからフ
ァイルを読み込んだり、該ファイルを書き込んだりして
から、直ちに通常のアクセスが可能なように修復テーブ
ル34のフラグをリセットする。その結果、ディスクア
レイ装置2がディスクドライブ4Cのデータの復旧処理
を行っている場合でも、アクセス性能が低下する確率は
極めて低くなる。
In this way, the disk array controller 3 restores the files in descending order of access probability,
Control the restored files so that normal access is immediately performed. If the host computer 1 issues a file read / write command during file restoration, the file is restored and then the file is read, or the file is immediately written, and then the normal operation is immediately resumed. The flag of the repair table 34 is reset so that it can be accessed. As a result, even when the disk array device 2 is performing the data recovery process of the disk drive 4C, the probability that the access performance will be lowered becomes extremely low.

【0044】(第2方法例) 次に本発明の第2方法例について説明する。図8は第2
方法例のディスクアレイ装置2の制御方法におけるデー
タ復元処理の手順のフローチャートを示す。
(Second Method Example) Next, a second method example of the present invention will be described. FIG. 8 is the second
9 shows a flowchart of a procedure of data restoration processing in the control method of the disk array device 2 of the method example.

【0045】本方法例では、先ず、第1方法例と同様に
故障したディスクドライブ4Cが人手で交換され、又は
ホットスタンバイ・ディスクドライブに切り替えられた
か否かが判断される(ST1' )。
In this example of the method, first, similarly to the example of the first method, it is judged whether or not the failed disk drive 4C has been manually replaced or switched to the hot standby disk drive (ST1 ').

【0046】故障したディスクドライブ4Cが切り替え
られた場合には、ディスクアレイコントローラ3は復元
すべきディスクドライブ4Cを特定し(ST2' )、修
復テーブル34に登録されているすべてのファイルのフ
ラグをセットする(ST3')。なお、フラグがセット
されたファイルは、第1方法例と同様に復元されていな
いことを示しており、復元された段階で始めてリセット
される。
When the failed disk drive 4C is switched, the disk array controller 3 identifies the disk drive 4C to be restored (ST2 ') and sets the flags of all the files registered in the restoration table 34. Yes (ST3 '). It should be noted that the file in which the flag is set indicates that the file has not been restored as in the case of the first method example, and the file is reset only when restored.

【0047】次にディスクアレイコントローラ3は、例
えばランダムに、或はアクセス確率テーブル33を参照
してアクセス確率が高い順番に復元すべきファイルを抽
出し(ST4' )、データ復元機能部32を用いて該フ
ァイルの再生ができなくなった分割データの復元処理を
実行し(ST5' )、復元された分割データを新規のデ
ィスクドライブ4Cに書き込む(ST6' )。
Next, the disk array controller 3 extracts the files to be restored, for example, randomly or referring to the access probability table 33 in the order of high access probability (ST4 '), and uses the data restoration function unit 32. Then, the restoration processing of the divided data which cannot be played back is executed (ST5 '), and the restored divided data is written in the new disk drive 4C (ST6').

【0048】最後にファイルの復元処理が完了すると、
ディスクアレイコントローラ3は修復テーブル34の該
当するファイルのフラグをリセットする(ST7' )。
このようにして復元され、修復テーブル34のフラグが
リセットされたファイルは、その後のアクセスに対して
図2に示す通常のリード/ライト処理が行なわれる。
Finally, when the file restoration process is completed,
The disk array controller 3 resets the flag of the corresponding file in the restoration table 34 (ST7 ').
The file thus restored and the flag of the repair table 34 is reset is subjected to the normal read / write processing shown in FIG. 2 for subsequent access.

【0049】また、復元すべきファイルが有ると判断さ
れると(ST8' )、ST4' 〜ST7' の処理が再び
行われる。すなわち、ディスクアレイコントローラ3
は、引き続き修復テーブル34内でフラグがセットされ
たファイルの中から復元すべきファイルを適宜抽出し、
同様にして復元処理を行い、復元すべきファイルが無く
なった時点でファイルの復元処理を終了する。
When it is determined that there is a file to be restored (ST8 '), the processes of ST4' to ST7 'are performed again. That is, the disk array controller 3
Continues to extract files to be restored from the files whose flags are set in the repair table 34 as appropriate,
Similarly, the restoration process is performed, and when there are no more files to be restored, the file restoration process ends.

【0050】これらの処理は全てバックグランド処理で
実行される。なお、アクセス確率の算出法は、前記した
第1方法例と同様にシステムの特性に合せて選択すると
良い。
All of these processes are executed in the background process. It should be noted that the method of calculating the access probability may be selected according to the characteristics of the system as in the case of the first method example described above.

【0051】続いて、ファイルの復元処理中に、ホスト
コンピュータ1からリード/ライト命令(R/W命令)
があった場合の処理手順について説明する。図9は第2
方法例のディスクアレイ装置2の制御方法におけるファ
イル復元中のリード・ライト手順のフローチャートを示
す。
Then, during the file restoration process, a read / write command (R / W command) is issued from the host computer 1.
A processing procedure when there is such a case will be described. FIG. 9 is the second
9 is a flowchart of a read / write procedure during file restoration in the control method of the disk array device 2 of the method example.

【0052】ファイルの復元をバックグランドで処理中
に、ホストコンピュータ1からリード/ライト命令(R
/W命令)が有るか否かが判断され(ST9' )、R/
W命令があった場合には、ディスクアレイコントローラ
3は図9に示すように、修復テーブル34を参照して所
望のファイルが復元されているか否かを確認する(ST
10' 、ST11' )。
While the file restoration is being processed in the background, the read / write command (R
/ W command) is determined (ST9 '), and R /
When there is a W command, the disk array controller 3 refers to the restoration table 34 as shown in FIG. 9 and confirms whether or not the desired file is restored (ST.
10 ', ST11').

【0053】復元されている場合には図2に示す通常の
リード/ライト処理を実行し(ST12' )、復元され
ていない場合にはさらにリード命令か否か判断される
(ST13' )。リード命令の場合は、さらにアクセス
確率テーブルを参照し(ST14' )、該ファイルのア
クセス確率が予め定められたしきい値以上であるか否か
判断される(ST15' )。
If it has been restored, the normal read / write processing shown in FIG. 2 is executed (ST12 '), and if it has not been restored, it is further judged whether or not it is a read instruction (ST13'). In the case of a read command, the access probability table is further referred to (ST14 '), and it is determined whether the access probability of the file is equal to or more than a predetermined threshold value (ST15').

【0054】予め定められたしきい値以上である場合に
は、フォアグランド処理でファイルの復元処理を実行し
(ST16' )、復元したファイルのデータを新規のデ
ィスクドライブに書き込む(ST17' )とともに、復
元したファイルの修復テーブル34のフラグをリセット
し(ST18' )、通常のファイルの読み出し処理を実
行する(ST19' )。
If it is equal to or greater than the predetermined threshold value, the file restoration process is executed in the foreground process (ST16 '), and the restored file data is written to a new disk drive (ST17'). Then, the flag of the restoration table 34 of the restored file is reset (ST18 ') and the normal file reading process is executed (ST19').

【0055】一方、ファイルのアクセス確率が予め定め
られたしきい値未満である場合には、ファイルの復元処
理を実行し(ST20' )、ファイルの読み出し処理を
実行する(ST21' )。
On the other hand, when the access probability of the file is less than the predetermined threshold value, the file restoring process is executed (ST20 ') and the file reading process is executed (ST21').

【0056】すなわち、復元したファイルのデータを新
規のディスクドライブに書き込まず、かつ復元したファ
イルの修復テーブル34のフラグをリセットせずに、復
元したファイルをホストコンピュータ1に転送する。こ
の場合、復元されたデータが記録されないため、該ファ
イルが再アクセスされた場合には、再び同じファイルの
復元処理を行う必要がある。
That is, the restored file is transferred to the host computer 1 without writing the data of the restored file to a new disk drive and without resetting the flag of the restoration table 34 of the restored file. In this case, since the restored data is not recorded, when the file is accessed again, it is necessary to restore the same file again.

【0057】ST13' にてファイルの復元処理中に、
ホストコンピュータ1からライト命令があったと判断さ
れた場合には、新規のディスクドライブに通常通りデー
タを書き込む(ST22' )とともに、書き込まれたフ
ァイルの修復テーブル34のフラグをリセットする(S
T23' )。
During the file restoration process at ST13 ',
When it is determined that the write command is issued from the host computer 1, the data is written to the new disk drive as usual (ST22 ') and the flag of the written file recovery table 34 is reset (S).
T23 ').

【0058】このようにディスクアレイコントローラ3
は、リードされたファイルのアクセス確率に応じて該フ
ァイルの復元データを記録するか否かを決定し、アクセ
ス確率の高いファイルに関しては復元データを記録し、
再アクセス時のリード時間の増加を防止する。
In this way, the disk array controller 3
Determines whether to record the restoration data of the read file according to the access probability of the file, and records the restoration data for a file with a high access probability,
Prevents an increase in read time during re-access.

【0059】またアクセス確率の低いファイルに関して
は復元データを記録せず、バックグランド処理に委ねる
ことにより相対的にリード時間の増加を抑圧する。した
がって、ディスクアレイ装置2がデータの復旧処理を行
っている場合でも、アクセス性能が低下する割合は極め
て低くなる。
Further, regarding the file having a low access probability, the restored data is not recorded and the background processing is entrusted to relatively suppress the increase of the read time. Therefore, even when the disk array device 2 is performing a data recovery process, the rate of deterioration in access performance is extremely low.

【0060】次に本方法例のディスクアレイ装置2の制
御方法において、フォアグランド処理でデータの書込み
を行う場合のアクセス時間とバックグランド処理でデー
タの書込みを行う場合のアクセス時間について説明す
る。
Next, in the control method of the disk array device 2 of this method example, the access time when writing data in the foreground process and the access time when writing data in the background process will be described.

【0061】(フォアグランド処理でデータの書込みを
行う場合) 図10は本装置例のディスクアレイ装置2を使用してフ
ォアグランド処理でデータの書込みを行う場合のアクセ
ス時間を示す。新規のディスクドライブの修復処理を行
っている最中にファイルがリードされ、該ファイルの復
元したデータを新規のディスクドライブに書き込む場合
には、ファイルのリード時間は図10に示すようにな
る。
(When Data is Written by Foreground Processing) FIG. 10 shows an access time when data is written by foreground processing using the disk array device 2 of this device example. When the file is read during the restoration process of the new disk drive and the restored data of the file is written to the new disk drive, the file read time is as shown in FIG.

【0062】ここで、復元したデータの書き込みを行う
初回のデータリード時間の増加の割合をKwとする。ま
た、ファイルがランダムに復元されるため、ファイルが
修復されるまでの平均待ち時間が新規のディスクドライ
ブの修復に要する時間TRの1/2とし、この間に所望
のファイルがN回アクセスされると仮定すれば、復元し
たデータを新規のディスクドライブに書き込んだファイ
ルの平均リード時間は、ディスクドライブが正常な状態
でのリード時間の{Kw+(N−1)}/N倍となる。
Here, the increase rate of the first data read time for writing the restored data is Kw. Further, since the files are randomly restored, the average waiting time until the files are repaired is 1/2 of the time TR required to repair a new disk drive, and if a desired file is accessed N times during this time. Assuming that the average read time of the file in which the restored data is written in the new disk drive is {Kw + (N-1)} / N times the read time in the normal state of the disk drive.

【0063】(バックグランド処理でデータの書込みを
行う場合) 図11は本装置例のディスクアレイ装置2を使用してバ
ックグランド処理でデータの書込みを行う場合のアクセ
ス時間を示す。新規のディスクドライブの修復処理を行
っている最中にファイルがリードされ、該ファイルの復
元したデータを新規のディスクドライブにフォアグラン
ド処理で書き込まない場合には、ファイルのリード時間
は図11に示すようになる。
(When Data is Written by Background Processing) FIG. 11 shows the access time when data is written by the background processing using the disk array device 2 of this device example. When the file is read during the restoration process of the new disk drive and the restored data of the file is not written to the new disk drive by the foreground process, the file read time is shown in FIG. Like

【0064】復元したデータの書き込みをフォアグラン
ド処理で行わないため毎回行なわれるデータの復元処理
によるリード時間の増加の割合をKEとすれば、平均リ
ード時間はディスクドライブが正常な状態でのリード時
間のKE倍となる。よって、アクセス確率のしきい値
は、上記の2つの平均リード時間が等しくなる条件か
ら、下記の次式の様に表される。
Since the writing of the restored data is not performed in the foreground processing, if the rate of increase in the read time due to the data restoration processing performed every time is KE, the average read time is the read time in the normal state of the disk drive. KE times that of. Therefore, the threshold value of the access probability is expressed by the following expression below under the condition that the above two average read times are equal.

【0065】 アクセス確率のしきい値=平均リード時間が等しくなるNの値/ ファイルが修復されるまでの平均待ち時間 =2(Kw−1)/{TR(KE−1)}[0065]   Access probability threshold = value of N at which average read times are equal /                           Average waiting time for files to be repaired                         = 2 (Kw-1) / {TR (KE-1)}

【0066】具体的に、図10、図11に示すようにK
w=2.0、KE=1.3とすれば、アクセス確率のし
きい値は2/(0.3TR)となる。新規のディスクド
ライブが修復されるまでに少なくとも7回以上、即ちフ
ァイルが修復されるまでの平均待ち時間内に少なくとも
3.5回以上リードされると予想されるファイルに対し
ては復元データを書き込み、新規のディスクドライブが
修復されるまでのリード回数が7回未満、即ちファイル
が修復されるまでの平均待ち時間内のファイルのリード
回数が多くても3.5回未満と予想されるファイルに関
しては復元データの書き込みを行わない様にすれば、フ
ァイルを復元処理している間のアクセス性能の低下を最
小化することができる。
Specifically, as shown in FIGS. 10 and 11, K
If w = 2.0 and KE = 1.3, the threshold value of the access probability is 2 / (0.3TR). Write the restored data to a file that is expected to be read at least 7 times before the new disk drive is repaired, ie at least 3.5 times within the average wait time before the file is repaired For files that are expected to be read less than 7 times before a new disk drive is repaired, ie less than 3.5 reads at most within the average wait time before a file is repaired By not writing the restoration data, it is possible to minimize the deterioration of the access performance during the restoration processing of the file.

【0067】以上本発明の代表的な装置例及び方法例に
ついて説明したが、本発明は必ずしも前記装置例の手段
及び前記方法例の手法だけに限定されるものではない。
本発明の目的を達成し、後述する効果を有する範囲内に
おいて適宜変更して実施することができるものである。
Although representative apparatus examples and method examples of the present invention have been described above, the present invention is not necessarily limited to the means of the apparatus examples and the method of the method examples.
The present invention can be appropriately modified and implemented within a range in which the object of the present invention is achieved and the effects described later are obtained.

【0068】[0068]

【発明の効果】以上説明したように本発明によれば、故
障したディスクドライブのデータ復元を、ファイルのア
クセス確率に基づいて効率的に行うので、データ復元中
に起こり易いアクセス性能の低下を最小限に抑えること
ができるという効果を奏する。
As described above, according to the present invention, the data recovery of a failed disk drive is efficiently performed based on the access probability of a file, so that the deterioration of the access performance which tends to occur during the data recovery is minimized. The effect is that it can be suppressed to the limit.

【0069】特に、アクセス直後のファイルが再アクセ
スされる確率が極めて高い、ビデオ・オン・デマンドを
始めとするマルチメディアサービスシステムにおいて、
ディスクドライブの故障の影響を最小限にするのに好適
である。
In particular, in a multimedia service system such as video-on-demand where the probability that a file immediately after access is re-accessed is extremely high,
It is suitable for minimizing the effect of disk drive failure.

【図面の簡単な説明】[Brief description of drawings]

【図1】ディスクアレイ装置の基本構成を示すブロック
図である。
FIG. 1 is a block diagram showing a basic configuration of a disk array device.

【図2】本発明の装置例のディスクアレイ装置による通
常時のデータのリード/ライト処理の流れを示した説明
図である。
FIG. 2 is an explanatory diagram showing a flow of normal data read / write processing by the disk array device of the device example of the present invention.

【図3】同上の装置によるディスクドライブ故障時のデ
ータのリード/ライト処理の流れを示した説明図であ
る。
FIG. 3 is an explanatory diagram showing a flow of data read / write processing when a disk drive fails in the same apparatus.

【図4】本装置例のディスクアレイ装置2におけるディ
スクアレイコントローラ3の構成を示したブロック図で
ある。
FIG. 4 is a block diagram showing a configuration of a disk array controller 3 in a disk array device 2 of this device example.

【図5】第1方法例のディスクアレイ装置の制御方法に
おけるデータ復元処理の手順を示した流れ図である。
FIG. 5 is a flowchart showing a procedure of data restoration processing in the control method of the disk array device of the first method example.

【図6】同上の制御方法におけるファイル復元中のリー
ド手順を示した流れ図である。
FIG. 6 is a flowchart showing a read procedure during file restoration in the above control method.

【図7】同上の制御方法におけるファイル復元中のライ
ト手順を示した流れ図である。
FIG. 7 is a flowchart showing a write procedure during file restoration in the above control method.

【図8】第2方法例のディスクアレイ装置の制御方法に
おけるデータ復元処理の手順を示した流れ図である。
FIG. 8 is a flowchart showing a procedure of data restoration processing in the control method of the disk array device of the second method example.

【図9】同上の制御方法におけるファイル復元中のリー
ド・ライト手順を示した流れ図である。
FIG. 9 is a flowchart showing a read / write procedure during file restoration in the control method of the above.

【図10】本装置例のディスクアレイ装置を使用してフ
ォアグランド処理でデータの書込みを行う場合のアクセ
ス時間を示したグラフである。
FIG. 10 is a graph showing the access time when data is written in the foreground process using the disk array device of this device example.

【図11】同上の装置を使用してバックグランド処理で
データの書込みを行う場合のアクセス時間を示したグラ
フである。
FIG. 11 is a graph showing an access time when data is written in the background process using the same device.

【符号の説明】[Explanation of symbols]

1…ホストコンピュータ 2…ディスクアレイ装置 3…ディスクアレイコントローラ 4A、4B、4C、4D…ディスクドライブ 5…内部バス 6…外部バス 31…冗長データ生成機能部 32…データ復元機能部 33…アクセス確率テーブル 34…修復テーブル 35…外部バスインタフェース 36…内部バスインタフェース 1 ... Host computer 2 ... Disk array device 3 ... Disk array controller 4A, 4B, 4C, 4D ... Disk drive 5 ... Internal bus 6 ... External bus 31 ... Redundant data generation function unit 32 ... Data recovery function section 33 ... Access probability table 34 ... Restoration table 35 ... External bus interface 36 ... Internal bus interface

───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩津 茂太郎 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (72)発明者 井沢 伸芳 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (72)発明者 白水 啓章 神奈川県横浜市中区不老町2丁目9番1 号 エヌ・ティ・ティ・インテリジェン トテクノロジ株式会社内 (72)発明者 河野 隆 神奈川県横浜市中区不老町2丁目9番1 号 エヌ・ティ・ティ・インテリジェン トテクノロジ株式会社内 (56)参考文献 特開 平5−314674(JP,A) 特開 平6−208488(JP,A) 特開 平8−137627(JP,A) 特開 平6−266508(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 3/06 - 3/08 G06F 12/00 - 12/12 G11B 20/10 - 20/16 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Shigetaro Iwazu 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Nihon Telegraph and Telephone Corporation (72) Innovator Nobuyoshi Izawa 3-19, Nishishinjuku, Shinjuku-ku, Tokyo No. 2 Nihon Telegraph and Telephone Corporation (72) Inventor Keisho Shiramizu 2-9-1, Furo-cho, Naka-ku, Yokohama-shi, Kanagawa NTT Intelligent Technology Corporation (72) Inventor Kono Takashi 2-9-1, Furomachi, Naka-ku, Yokohama-shi, Kanagawa Prefecture NTT Intelligent Technology Co., Ltd. (56) Reference JP-A-5-314674 (JP, A) JP-A-6-208488 (JP, A) JP-A-8-137627 (JP, A) JP-A-6-266508 (JP, A) (58) Fields investigated (Int.Cl. 7 , DB name) G06F 3 / 06-3 / 08 G06F 12/00- 12/12 G11B 20/10-20/16

Claims (12)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】データを記録する複数のディスクドライブ
と、当該ディスクドライブに内部バスを介して接続され
たディスクアレイコントローラとを有するディスクアレ
イ装置において、 前記ディスクアレイコントローラは、 前記ディスクドライブにデータを記憶する際、当該デー
タを所定のデータ長に分割するとともに、当該分割した
データ群に対して冗長データを生成する冗長データ生成
機能部と、 前記ディスクドライブの故障にて再生できなくなった分
割データを冗長データを参照して復元するデータ復元機
能部と、 複数の前記ディスクドライブに記録されているファイル
のアクセス確率を記録しておくアクセス確率テーブル
と、 復元すべきファイルに対してフラグをセットする修復テ
ーブルと、を有し、 データを書き込む場合には前記冗長データ生成機能部に
おいて、所定長の分割データと当該分割したデータに対
して生成した冗長データとを生成して、該データ群を複
数の前記ディスクドライブに分散して記録するととも
に、 記録したファイルの前記修復テーブルにおけるフラグが
リセットされている場合はデータの読み書きを実施し、 複数の前記ディスクドライブに記録されているファイル
にアクセスがある度に前記アクセス確率テーブルに該当
ファイルのアクセス確率を記録し、 前記ディスクドライブの異常状態が検出され、これに応
じて故障した当該ディスクドライブが切り替えられた場
合には、復元すべきファイルに対して前記修復テーブル
におけるフラグをセットするとともに、 前記データ復元機能部においてファイルの復元処理を行
い、当該ファイルの復元したデータを新規のディスクド
ライブに記録して、復元したファイルの前記修復テーブ
ルにおけるフラグをリセットするバックグランド処理を
行い、 当該バックグランド処理中にファイルのリード命令を受
けると、 当該ファイルの前記修復テーブルにおけるフラグがセッ
トされており、かつ前記アクセス確率テーブルに記録さ
れた当該ファイルのアクセス確率が所定のしきい値以上
の場合には前記データ復元機能部において当該ファイル
の復元処理を行い、当該ファイルの復元したデータを新
規のディスクドライブに記録して当該ファイルの前記修
復テーブルにおけるフラグをリセットする一方、 当該ファイルの前記修復テーブルにおけるフラグがセッ
トされており、かつ前記アクセス確率テーブルに記録さ
れたアクセス確率が所定のしきい値未満の場合には前記
データ復元機能部において当該ファイルの復元処理を行
い、当該ファイルの復元したデータを新規のディスクド
ライブに記録せずに、リード処理を実施する、ように構
成されている、 ことを特徴とするディスクアレイ装置。
1. A disk array device having a plurality of disk drives for recording data and a disk array controller connected to the disk drives via an internal bus, wherein the disk array controller stores data in the disk drives. When storing, the data is divided into a predetermined data length, and a redundant data generation function unit that generates redundant data for the divided data group and divided data that cannot be reproduced due to a failure of the disk drive. A data restoration function unit that refers to and restores redundant data, an access probability table that records the access probabilities of files recorded on multiple disk drives, and a repair that sets a flag for the files to be restored If you have a table and The redundant data generation function unit generates divided data of a predetermined length and redundant data generated for the divided data, records the data group in a distributed manner in the plurality of disk drives, and records it. When the flag of the file in the restoration table is reset, data is read and written, and the access probability of the corresponding file is recorded in the access probability table each time a file recorded in a plurality of the disk drives is accessed. Then, when an abnormal state of the disk drive is detected and the failed disk drive is switched accordingly, the flag in the restoration table is set for the file to be restored, and the data restoration function is set. Part of the file is restored and the file The original data is recorded in a new disk drive, the background process of resetting the flag in the restoration table of the restored file is performed, and if a file read command is received during the background process, the restoration of the file is performed. If the flag in the table is set and the access probability of the file recorded in the access probability table is equal to or greater than a predetermined threshold value, the data restoration function unit restores the file, The restored data of is recorded in a new disk drive to reset the flag in the restoration table of the file, while the flag in the restoration table of the file is set and the access recorded in the access probability table. Probability is predetermined When it is less than the threshold value, the data restoration function unit restores the file, and the read process is performed without recording the restored data of the file in a new disk drive. A disk array device characterized by the above.
【請求項2】前記ディスクアレイコントローラにて分割
するデータ長は、 ビット、バイト又はワード単位である、 ことを特徴とする請求項1に記載のディスクアレイ装
置。
2. The disk array device according to claim 1, wherein the data length divided by the disk array controller is in units of bits, bytes or words.
【請求項3】前記ディスクドライブには、 故障の際に交換して使用する予備用ディスクドライブが
備えられている、 ことを特徴とする請求項1又は2に記載のディスクアレ
イ装置。
3. The disk array device according to claim 1, wherein the disk drive is equipped with a spare disk drive that is used in the case of a failure.
【請求項4】前記ディスクドライブは、 当該ディスクドライブの異常状態をコンピュータがデー
タの読み書きの際に検出するための情報を内部データと
して保管する、 ことを特徴とする請求項1、2又は3に記載のディスク
アレイ装置。
4. The disk drive stores, as internal data, information for a computer to detect an abnormal state of the disk drive when reading or writing data, according to claim 1, 2 or 3. The described disk array device.
【請求項5】前記ディスクドライブは、 ビデオ・オン・デマンド等のマルチメディアサービスを
提供するホストコンピュータの外部記憶装置である、 ことを特徴とする請求項1、2、3又は4に記載のディ
スクアレイ装置。
5. The disk according to claim 1, 2, 3 or 4, wherein the disk drive is an external storage device of a host computer that provides a multimedia service such as video on demand. Array device.
【請求項6】複数のディスクドライブの制御を内部バス
を介して接続されたディスクアレイコントローラにて行
うに当たり、 データを書き込む場合には所定長の分割データと冗長デ
ータとを生成して、該データ群を複数のディスクドライ
ブに分散して記録するとともに、記録したファイルのフ
ラグがリセットされている場合はデータの読み書きを実
施し、複数の前記ディスクドライブに記録されているフ
ァイルにアクセスがある度に当該ファイルのアクセス確
率を記録し、 ディスクドライブの異常状態が検出され、これに応じて
故障したディスクドライブが切り替えられた場合には、
復元すべきファイルに対して前記フラグをセットすると
ともに、当該ファイルの復元処理を行い、当該ファイル
の復元したデータを新規のディスクドライブに記録し
て、復元した当該ファイルの前記フラグをリセットする
バックグランド処理を行い、 当該バックグランド処理中にファイルのリード命令を受
けると、当該ファイルが未修復であり、かつアクセス確
率が所定のしきい値以上の場合には当該ファイルの復元
処理を行い、当該ファイルの復元したデータを新規のデ
ィスクドライブに記録して当該ファイルの前記フラグを
リセットする一方、 当該ファイルが未修復であり、かつアクセス確率が所定
のしきい値未満の場合には当該ファイルの復元処理を行
い、当該ファイルの復元したデータを新規のディスクド
ライブに記録せずに、リード処理を実施する、 ことを特徴とするディスクアレイ装置の制御方法。
6. A disk array controller connected via an internal bus for controlling a plurality of disk drives, when writing data, generates divided data of a predetermined length and redundant data, and writes the data. The group is distributed and recorded on multiple disk drives, and if the recorded file flag is reset, data is read and written, and each time a file recorded on multiple disk drives is accessed. When the access probability of the file is recorded and an abnormal state of the disk drive is detected, and the failed disk drive is switched accordingly,
A background that sets the flag for the file to be restored, restores the file, records the restored data of the file in a new disk drive, and resets the flag of the restored file. When a file read command is received during the background process, if the file is unrepaired and the access probability is equal to or higher than a predetermined threshold, the file is restored and the file is restored. If the file is unrepaired and the access probability is less than the specified threshold while the restored data of the above is recorded in the new disk drive and the flag of the file is reset, the restoration process of the file is performed. The recorded data of the file is recorded on the new disk drive, and Carrying out de-processing method for controlling a disk array apparatus, characterized in that.
【請求項7】前記アクセス確率は、 単位時間当りのファイルのアクセス回数からもしくは、 ファイルをアクセスした後の経過時間から求める、 ことを特徴とする請求項6に記載のディスクアレイ装置
の制御方法。
7. The method of controlling a disk array device according to claim 6, wherein the access probability is obtained from the number of times the file is accessed per unit time or from the elapsed time after the file is accessed.
【請求項8】前記ファイルのアクセス確率のしきい値
は、 ファイルが復元されるまでの平均待ち時間当たりのアクセス回数 =2(Kw−1)/{TR(KE−1)}、 ただし、Kw=書き込みを行うデータ修復を伴うデータリード時間/ 全てのディスクドライブが正常な場合のデータリード時間、 KE=書き込みを行わないデータ修復を伴うデータリード時間/ 全てのディスクドライブが正常な場合のデータリード時間、 TR=新規のディスクドライブの修復に要する時間、 で求める、 ことを特徴とする請求項7に記載のディスクアレイ装置
の制御方法。
8. The threshold value of the access probability of the file is the number of accesses per average waiting time until the file is restored = 2 (Kw-1) / {TR (KE-1)}, where Kw = Data read time with data recovery with writing / Data read time when all disk drives are normal, KE = Data read time with data recovery without writing / Data read with all disk drives normal The method of controlling a disk array device according to claim 7, wherein TR is a time required for repairing a new disk drive.
【請求項9】前記ディスクアレイコントローラにて分割
するデータ長は、 ビット、バイト又はワード単位である、 ことを特徴とする請求項6、7又は8に記載のディスク
アレイ装置の制御方法。
9. The method for controlling a disk array device according to claim 6, wherein the data length divided by the disk array controller is in units of bits, bytes or words.
【請求項10】前記ディスクドライブには、 故障の際に交換して使用する予備用ディスクドライブが
備えられている、 ことを特徴とする請求項6、7、8又は9に記載のディ
スクアレイ装置の制御方法。
10. The disk array device according to claim 6, 7, 8 or 9, wherein the disk drive is provided with a spare disk drive to be replaced and used when a failure occurs. Control method.
【請求項11】前記ディスクドライブは、 当該ディスクドライブの異常状態をコンピュータがデー
タの読み書きの際に検出するための情報を内部データと
して保管する、 ことを特徴とする請求項6、7、8、9又は10に記載
のディスクアレイ装置の制御方法。
11. The disk drive stores information for detecting an abnormal state of the disk drive when a computer reads and writes data as internal data. 11. The method for controlling a disk array device according to 9 or 10.
【請求項12】前記ディスクドライブは、 ビデオ・オン・デマンド等のマルチメディアサービスを
提供するホストコンピュータの外部記憶装置である、 ことを特徴とする請求項6、7、8、9、10又は11
に記載のディスクアレイ装置の制御方法。
12. The disk drive is an external storage device of a host computer that provides a multimedia service such as video on demand, and the disk drive is an external storage device.
7. A method for controlling a disk array device according to.
JP14325696A 1996-06-05 1996-06-05 Disk array device and control method therefor Expired - Fee Related JP3412665B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14325696A JP3412665B2 (en) 1996-06-05 1996-06-05 Disk array device and control method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14325696A JP3412665B2 (en) 1996-06-05 1996-06-05 Disk array device and control method therefor

Publications (2)

Publication Number Publication Date
JPH09325866A JPH09325866A (en) 1997-12-16
JP3412665B2 true JP3412665B2 (en) 2003-06-03

Family

ID=15334525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14325696A Expired - Fee Related JP3412665B2 (en) 1996-06-05 1996-06-05 Disk array device and control method therefor

Country Status (1)

Country Link
JP (1) JP3412665B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008228243A (en) * 2007-03-16 2008-09-25 Nippon Telegr & Teleph Corp <Ntt> Picture reproducer and rebuild processing method

Also Published As

Publication number Publication date
JPH09325866A (en) 1997-12-16

Similar Documents

Publication Publication Date Title
US7284019B2 (en) Apparatus, system, and method for differential backup using snapshot on-write data
US6859888B2 (en) Data storage array apparatus storing error information without delay in data access, and method, program recording medium, and program for the same
US7152184B2 (en) Storage device, backup method and computer program code of this storage device
US7143308B2 (en) Apparatus, system, and method for differential rebuilding of a reactivated offline RAID member disk
US6067635A (en) Preservation of data integrity in a raid storage device
US6397347B1 (en) Disk array apparatus capable of dealing with an abnormality occurring in one of disk units without delaying operation of the apparatus
JP3348417B2 (en) Data recovery method in storage system
JP3752203B2 (en) Method and system for migrating data in RAID logical drive migration
US20060117216A1 (en) Program, storage control method, and storage system
JP3230645B2 (en) Data processing method, system and device
US6832291B2 (en) Memory system for improving data input/output performance and method of caching data recovery information
GB2414592A (en) Decreasing failed disk reconstruction time in a RAID data storage system
US20050177765A1 (en) Storage sub-system having expanded data read
US20040133741A1 (en) Disk array apparatus and data writing method used in the disk array apparatus
JP2001142650A (en) Method and device for controlling array disk
JP3412665B2 (en) Disk array device and control method therefor
JP5365236B2 (en) Storage system
JP3288724B2 (en) Method of tracking incomplete writes in a disk array, and disk storage system performing such a method
JP3845239B2 (en) Disk array device and failure recovery method in disk array device
JPH10254634A (en) Storage device and restoration means for storage device
US7337270B2 (en) Apparatus, system, and method for servicing a data storage device using work-in-process (WIP) maps
JP2002123372A (en) Disk array device with cache memory, its error- controlling method and recording medium with its control program recorded thereon
JP3015631B2 (en) Disk failure automatic recovery processing method
JP3139545B2 (en) Duplex recording / reproducing apparatus, method for solving the problem and medium recording the program for solving the problem
JP2023133864A (en) Storage apparatus and rebuild control method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090328

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100328

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110328

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120328

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130328

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees