JP4817783B2 - RAID system and rebuild / copyback processing method thereof - Google Patents

RAID system and rebuild / copyback processing method thereof Download PDF

Info

Publication number
JP4817783B2
JP4817783B2 JP2005286926A JP2005286926A JP4817783B2 JP 4817783 B2 JP4817783 B2 JP 4817783B2 JP 2005286926 A JP2005286926 A JP 2005286926A JP 2005286926 A JP2005286926 A JP 2005286926A JP 4817783 B2 JP4817783 B2 JP 4817783B2
Authority
JP
Japan
Prior art keywords
request
rebuild
processing
normal
raid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005286926A
Other languages
Japanese (ja)
Other versions
JP2007094994A (en
Inventor
秀治郎 大黒谷
実希夫 伊藤
和彦 池内
信哉 望月
秀夫 ▲高▼橋
與志仁 紺田
靖丈 佐藤
弘昭 越智
司 牧野
典秀 久保田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005286926A priority Critical patent/JP4817783B2/en
Priority to US11/361,583 priority patent/US7631218B2/en
Priority to CNB2006100547574A priority patent/CN100432914C/en
Priority to KR1020060022703A priority patent/KR100793531B1/en
Publication of JP2007094994A publication Critical patent/JP2007094994A/en
Application granted granted Critical
Publication of JP4817783B2 publication Critical patent/JP4817783B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B43WRITING OR DRAWING IMPLEMENTS; BUREAU ACCESSORIES
    • B43LARTICLES FOR WRITING OR DRAWING UPON; WRITING OR DRAWING AIDS; ACCESSORIES FOR WRITING OR DRAWING
    • B43L1/00Repeatedly-usable boards or tablets for writing or drawing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D5/00Sheets united without binding to form pads or blocks
    • B42D5/003Note-pads
    • B42D5/005Supports for note-pads
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D5/00Sheets united without binding to form pads or blocks
    • B42D5/04Calendar blocks
    • B42D5/047Calendar blocks in which the calendar sheet or sheets are combined with other articles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B43WRITING OR DRAWING IMPLEMENTS; BUREAU ACCESSORIES
    • B43LARTICLES FOR WRITING OR DRAWING UPON; WRITING OR DRAWING AIDS; ACCESSORIES FOR WRITING OR DRAWING
    • B43L21/00Blackboard or slate cleaning devices
    • B43L21/04Wiper holders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F15/00Boards, hoardings, pillars, or like structures for notices, placards, posters, or the like
    • G09F15/0006Boards, hoardings, pillars, or like structures for notices, placards, posters, or the like planar structures comprising one or more panels
    • G09F15/0012Boards, hoardings, pillars, or like structures for notices, placards, posters, or the like planar structures comprising one or more panels frames therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1059Parity-single bit-RAID5, i.e. RAID 5 implementations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A RAID system access a physical disk according to a host I/O request, and perform Rebuild/Copy back processing, for implementing high-speed Rebuild/Copy back processing without interrupting the processing of a normal I/O. When one disk device out of a plurality of disk devices constituting the RAID configuration fails, the processing size for one time of Rebuild/Copy back to reconstruct the RAID is changed according to the presence of a normal I/O managed in RAID control. When a normal I/O is present, Rebuild/Copy back can be executed without interrupting the processing of the normal I/O, and in a static state where a normal I/O is absent, a processing size larger than the size in that state can be specified so as to implement Rebuild/Copy back processing at high-speed.

Description

本発明は、複数のディスク装置に、データを冗長性を持って、格納するRAIDシステムにおいて、一部のディスク装置の障害時に、他のディスク装置からのデータで冗長構成を再構築するリビルド及びコピーバックするRAIDシステム及びそのリビルド/コピーバック処理方法に関し、特に、ホストI/Oを受け付けながら、リビルド及びコピーバックするRAIDシステム及びそのリビルド/コピーバック処理方法に関する。   The present invention relates to a RAID system that stores data in a plurality of disk devices with redundancy, and rebuilds and copies that rebuild a redundant configuration with data from other disk devices when some disk devices fail More particularly, the present invention relates to a RAID system that performs rebuilding and copyback while receiving host I / O, and a rebuilding / copyback processing method thereof.

近年、様々なデータが電子化され、コンピュータ上で扱われるのに従い、データの処理を実行するホストコンピュータとは独立して、大量のデータを効率よく、高い信頼性で格納することのできるデータストレージ装置(外部記憶装置)の重要性が増加している。   In recent years, as various data has been digitized and handled on computers, data storage that can store large amounts of data efficiently and with high reliability, independent of the host computer that executes data processing The importance of devices (external storage devices) is increasing.

このデータストレージ装置として、大量のディスクデバイス(例えば、磁気ディスク装置や光ディスク装置)と、これら大量のディスクデバイスを制御するディスクコントローラとから構成されるディスクアレイ装置が利用されている。このディスクアレイ装置は、RAID構成を採用することにより、データの冗長化を実現し、信頼性を向上している。   As this data storage device, a disk array device composed of a large number of disk devices (for example, a magnetic disk device and an optical disk device) and a disk controller that controls these large number of disk devices is used. This disk array device employs a RAID configuration to realize data redundancy and improve reliability.

このようなディスクアレイ装置において、RAIDグループを構成するディスクデバイスが、故障して冗長性を失った場合に、冗長性回復が必要となる。図8は、かかる冗長性回復のためのRAID5のリビルド機能の説明図である。活性保守を行なうため、RAID5を構成する4台のディスクデバイス#0,#1,#2,#3に、予備ディスクデバイスHS(Hot Spare Disk)を設ける。   In such a disk array device, when a disk device constituting a RAID group fails and loses redundancy, redundancy recovery is required. FIG. 8 is an explanatory diagram of a rebuild function of RAID 5 for such redundancy recovery. In order to perform active maintenance, spare disk devices HS (Hot Spare Disk) are provided in the four disk devices # 0, # 1, # 2, and # 3 constituting RAID5.

このディスクデバイス群160は、一対のディスクコントローラ110,120に接続されている。各ディスクコントローラ110,120は、ディスクデバイス群160とのインタフェース制御するディスクアダプタ140と、制御ユニット120と、ホスト(図示せず)とのインタフェース制御するチャネルアダプタ100とを有する。   The disk device group 160 is connected to a pair of disk controllers 110 and 120. Each of the disk controllers 110 and 120 includes a disk adapter 140 that controls an interface with the disk device group 160, a control unit 120, and a channel adapter 100 that controls an interface with a host (not shown).

ここで、RAID5を構成する4台のディスクデバイスの内、ディスクデバイス#0が故障した場合には、この故障ディスクデバイス#0以外のディスクデバイス#1、#2、#3のデータを、ディスクアダプタ140を介し、制御ユニット120のキャッシュメモリ(図示せず)に読み出し、これらのXOR演算を行い、冗長データを作成する。   Here, when the disk device # 0 fails among the four disk devices constituting the RAID 5, the data of the disk devices # 1, # 2, and # 3 other than the failed disk device # 0 are transferred to the disk adapter. The data is read into a cache memory (not shown) of the control unit 120 via 140, and these XOR operations are performed to create redundant data.

そして、ディスクアダプタ140を介し、作成した冗長データを、予備ディスクデバイスHSに書き込み、冗長性を回復する。これをRebuild機能という。   Then, the created redundant data is written to the spare disk device HS via the disk adapter 140 to restore redundancy. This is called the Rebuild function.

一方、図9は、コピーバック機能の説明図である。図8のRebuildが完了した状態から、故障したディスクデバイス#0が、新しいディスクデバイスNewと交換された場合に、コピーバック処理を行なう。即ち、予備ディスクデバイスHSに書かれた冗長データを,本来のディスクデバイスNewに書き戻す処理である。   On the other hand, FIG. 9 is an explanatory diagram of the copyback function. When the failed disk device # 0 is replaced with a new disk device New from the state where Rebuild is completed in FIG. 8, copy back processing is performed. In other words, this is a process of writing the redundant data written in the spare disk device HS back to the original disk device New.

このようなRebuild/Copyback処理を、ホストからのI/O要求を処理しながら、実行することが、望ましく、これらの要求数のバランスをとる方法が提案されている(例えば、特許文献1)。
特開2004−295860号公報(図14)
It is desirable to execute such Rebuild / Copyback processing while processing I / O requests from the host, and a method for balancing the number of requests has been proposed (for example, Patent Document 1).
Japanese Patent Laying-Open No. 2004-295860 (FIG. 14)

このように、ホストからのI/O要求を処理しつつ、Rebuile/Copyback処理するには、ディスクデバイス1台分の処理を一度に行うことは出来ない。このため、1回の処理サイズを固定して、その固定された処理サイズについて、正常なディスクデバイスからデータをリードして、書き込み先ディスクデバイスへライトする動作を、ディスクデバイスのデータ量分の回数を実行していた。   As described above, in order to perform Rebuild / Copyback processing while processing an I / O request from the host, processing for one disk device cannot be performed at a time. For this reason, the number of times of the disk device data amount is determined by fixing the processing size of one time, and reading the data from the normal disk device and writing the data to the write destination disk device for the fixed processing size. Was running.

例えば、Rebuildでは、正常ディスクデバイスからデータをリードして、RAID1(ミラーリング)以外は冗長データを作成して、予備ディスクデバイスHSや新規ディスクデバイスNewへライトするという動作を行い、Copybackでは、予備ディスクHSからデータをリードして、新規ディスクデバイスNewへライトするという動作を行う。   For example, in Rebuild, data is read from a normal disk device, redundant data other than RAID1 (mirroring) is created and written to a spare disk device HS or a new disk device New, and in Copyback, a spare disk is created. Data is read from the HS and written to the new disk device New.

従来は、これらの動作について、一回一回の処理サイズが固定で決められており、そのRAIDグループの負荷状態によって変動しなかった。そのため、通常I/O(ホストからのアクセス)が有る場合で、即ち、ある程度の負荷が有る状態で、通常I/Oによるディスクアクセスと、Rebuild/Copybackのディスクアクセスとのバランスをとるように調整しているシステムでは、逆に、通常I/Oが無い場合での,Rebuild/Copybackの処理では、ディスクデバイスの性能が、十分に引き出せないでいた。   Conventionally, for these operations, the processing size for each operation is fixed and does not vary depending on the load state of the RAID group. Therefore, when there is normal I / O (access from the host), that is, in a state where there is some load, adjustment is made to balance disk access by normal I / O and disk access by Rebuild / Copyback. On the other hand, in the system, the performance of the disk device cannot be sufficiently brought out by the Rebuild / Copyback process when there is no normal I / O.

このため、通常I/Oが無い場合に、常識的に考えられるディスクデバイスの性能と比較して、Rebuild/Copybackの完了までの時間が長くなる。近年、ディスクデバイスの格納容量が増大しているため、Rebuild/Copybackの完了までの時間短縮が課題となっている。   For this reason, when there is no normal I / O, the time until completion of Rebuild / Copyback becomes longer compared to the performance of a disk device that is commonly considered. In recent years, since the storage capacity of disk devices has increased, it has become a problem to shorten the time required to complete Rebuild / Copyback.

従って、本発明の目的は、ホストI/O要求を処理しつつ、リビルド/コピーバックをバランス処理する際に、リビルド/コピーバック処理の性能を向上するためのRAIDシステム及びそのリビルド/コピーバック処理方法を提供することにある。   Therefore, an object of the present invention is to provide a RAID system for improving the performance of rebuild / copyback processing and rebuild / copyback processing thereof when balancing rebuild / copyback while processing host I / O requests. It is to provide a method.

又、本発明の他の目的は、ホストI/O要求を処理しつつ、リビルド/コピーバックをバランス処理する際に、リビルド/コピーバックの完了時間を短縮するためのRAIDシステム及びそのリビルド/コピーバック処理方法を提供することにある。   Another object of the present invention is to provide a RAID system and its rebuild / copy for shortening the rebuild / copyback completion time when balancing rebuild / copyback while processing host I / O requests. It is to provide a back processing method.

更に、本発明の他の目的は、リビルド/コピーバックの完了時間を短縮しつつ、ホストI/O要求を処理しつつ、リビルド/コピーバックをバランス処理するためのRAIDシステム及びそのリビルド/コピーバック処理方法を提供することにある。   Furthermore, another object of the present invention is to provide a RAID system for balancing rebuild / copyback while processing host I / O requests while shortening the completion time of rebuild / copyback, and its rebuild / copyback. It is to provide a processing method.

この目的の達成のため、本発明は、ホストから依頼されたI/O要求に応じて、接続されたディスク装置をアクセスし、I/O要求を実行するRAIDシステムにおいて、RAIDを構成する複数の前記ディスク装置と、前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するコントローラとを有し、前記コントローラは、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とを、優先度を付け、所定の比で、実行するRAID制御モジュールと、前記リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求を発行するリビルド/コピーバックモジュールとを有し、前記RAID制御モジュールは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間以内に来ないかを判定し、前記リビルド/コピーバックモジュールは、前記リビルド/コピーバック要求の処理完了に応じて、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間以内に到来しない場合には、前記通常I/O要求が所定時間以内に到来した場合より、大きく設定して、前記リビルド/コピーバックの1回の要求を、前記RAID制御モジュールに発行する。 In order to achieve this object, the present invention accesses a connected disk device in response to an I / O request requested from a host and executes a plurality of I / O requests in a RAID system. When the disk device and one of the plurality of disk devices fail, the operation of reading the data of the disk device other than the failed disk device and writing the data to the spare disk device or the new disk device is divided into multiple times. The controller executes a rebuild or copyback process for reconstructing the RAID configuration, and the controller gives priority to the normal I / O request and the one request for the rebuild / copyback. Depending on the RAID control module to be executed at a predetermined ratio and the completion of the rebuild / copyback request processing, A rebuild / copyback module that issues a next rebuild / copyback request with reference to a progress table that manages the progress of the rebuild / copyback process, and the RAID control module is configured to send a normal I / O request The processing completion time is recorded every time processing of the normal I / O request is completed, and the processing completion time is compared with the current time to determine whether the normal I / O request comes within a predetermined time. The rebuild / copy back module inquires the determination result to the RAID control module in response to the completion of the rebuild / copy back request processing , and sets the request processing size for one rebuild or copy back processing as a normal I / O. If the request does not arrive within a predetermined time, set a larger value than when the normal I / O request arrives within a predetermined time. Once the request of rebuild / copy back, issued to the RAID control module.

又、本発明のRAIDシステムのリビルド/コピーバック処理方法は、RAIDを構成する複数の前記ディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するステップと、RAID制御モジュールにより、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、前記ホストからのI/O要求を含む通常I/O要求が所定時間以内に来ないかを判定するステップと、RAID制御モジュールにより、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とを、優先度に応じて、所定比で、実行するステップとを有し、前記リビルド/コピーバック処理の実行ステップは、リビルド/コピーバックモジュールにより、リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求の生成を開始するステップと、前記リビルド/コピーバックモジュールが、前記リビルド/コピーバック要求の処理完了に応じて、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間以内に到来しない場合には、前記通常I/O要求が所定時間以内に到来した場合より、大きく設定して、前記リビルド/コピーバックの1回の要求を、前記RAID制御モジュールに発行するステップとを有する。 The RAID system rebuild / copyback processing method according to the present invention reads the data of a disk device other than the failed disk device when one of the plurality of disk devices constituting the RAID fails, and a spare disk device. Or, the operation of writing data to the new disk device is executed in multiple steps, the rebuild or copyback process for rebuilding the RAID configuration is executed, and the normal I / O request processing is completed by the RAID control module The time is recorded every time processing of the normal I / O request is completed, the processing completion time is compared with the current time, and the normal I / O request including the I / O request from the host is within a predetermined time. A step of determining whether or not to come, and a single request for the normal I / O request and the rebuild / copyback by the RAID control module Are executed at a predetermined ratio in accordance with the priority, and the execution step of the rebuild / copy back process is performed by the rebuild / copy back module according to the completion of the rebuild / copy back request process. A step of starting generation of the next rebuild / copyback request with reference to a progress table managing the progress status of the rebuild / copyback processing, and the rebuild / copyback module processing the rebuild / copyback request Upon completion, the RAID control module is inquired about the determination result, and the request processing size of the rebuild or copyback process is set to one time when the normal I / O request does not arrive within a predetermined time. / O request is set larger than when it arrives within a predetermined time, and the rebuild / copy Once it requests for click, and a step of issuing to the RAID control module.

更に、本発明では、好ましくは、前記コントローラは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定する。   In the present invention, it is preferable that the controller records the processing completion time of the normal I / O request every time processing of the normal I / O request is completed, and compares the processing completion time with the current time. Then, it is determined whether a normal I / O request has arrived for a predetermined time.

更に、本発明では、好ましくは、前記コントローラは、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するとともに、前記リビルド/コピーバック要求の処理完了に応じて、次のリビルド/コピーバック要求を発行する。   In the present invention, it is preferable that the controller balances and executes the normal I / O request and one request of the rebuild / copyback and completes the processing of the rebuild / copyback request. In response, the next rebuild / copy back request is issued.

更に、本発明では、好ましくは、前記コントローラは、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを有し、前記進捗テーブルに従い、リビルド又はコピーバック処理の1回の要求を作成し、且つ前記進捗テーブルを更新する。   In the present invention, it is preferable that the controller has a progress table for managing a progress status of the rebuild / copy back process, and creates a request for a rebuild or copy back process according to the progress table, The progress table is updated.

更に、本発明では、好ましくは、前記コントローラは、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するRAID制御モジュールと、前記リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求を発行するリビルド/コピーバックモジュールとを有する。   In the present invention, it is preferable that the controller balances the normal I / O request and the one request for rebuild / copyback and executes the RAID control module and the rebuild / copyback request. A rebuild / copyback module that issues a next rebuild / copyback request with reference to a progress table that manages the progress of the rebuild / copyback process in response to the completion of the process.

更に、本発明では、好ましくは、前記RAID制御モジュールは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定し、前記リビルド/コピーバックモジュールは、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定して、前記リビルド/コピーバック要求を発行する。   In the present invention, it is preferable that the RAID control module records the processing completion time of the normal I / O request every time the processing of the normal I / O request is completed, and compares the processing completion time with the current time. Then, it is determined whether a normal I / O request has arrived for a predetermined time, and the rebuild / copy back module inquires of the determination result to the RAID control module, and the request processing size of one time of the rebuild or copy back processing Is set larger than when the normal I / O request arrives for a predetermined time, and the rebuild / copy back request is issued.

更に、本発明では、好ましくは、前記コントローラは、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合の処理サイズの倍数に設定した。   Furthermore, in the present invention, it is preferable that the controller sets the request processing size for one rebuild or copyback process when the normal I / O request does not arrive for a predetermined time. It is set to a multiple of the processing size when the time arrives.

更に、本発明では、好ましくは、前記コントローラは、前記ホストとのインタフェース制御を行う第1のインタフェース回路と、前記複数のディスク装置とのインタフェース制御を行う第2のインタフェース回路と、前記第1のインタフェース回路と前記第2のインタフェース回路に接続され、前記通常I/O処理と、前記リビルド又はコピーバック処理を実行する制御ユニットとを有し、前記制御ユニットは、前記ホストからのI/O要求を含む通常I/O要求が所定時間来ないかを判定し、複数回に別けて実行するリビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定した。   In the present invention, it is preferable that the controller includes a first interface circuit that performs interface control with the host, a second interface circuit that performs interface control with the plurality of disk devices, and the first interface circuit. An interface circuit connected to the second interface circuit, and having the normal I / O processing and the control unit for executing the rebuild or copyback processing, the control unit receiving an I / O request from the host When a normal I / O request does not arrive for a predetermined time, it is determined whether or not a normal I / O request including the number of times does not arrive for a predetermined time. Is set larger than when the normal I / O request arrives for a predetermined time.

更に、本発明では、好ましくは、前記コントローラは、前記RAIDを構成する前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド処理を実行した後、前記予備ディスク装置のデータをリードし、前記故障したディスク装置の代わりに設けられた新ディスク装置にデータをライトする動作を複数回に別けて実行して、コピーバック処理を実行する。   Further, in the present invention, it is preferable that the controller reads data of a disk device other than the failed disk device when one of the plurality of disk devices constituting the RAID fails, and sends data to the spare disk device. After executing the rebuild process to reconstruct the RAID configuration by performing the operation of writing the data in multiple times, the data of the spare disk device is read, and the new disk provided in place of the failed disk device The operation of writing data to the apparatus is executed in a plurality of times, and copy back processing is executed.

更に、本発明では、好ましくは、前記制御ユニットは、前記ディスク装置のデータの一部を格納するキャッシュメモリを有し、前記ホストからのI/O要求の内、前記キャッシュメモリを利用できないI/O要求を、前記通常I/Oとして、要求する。   In the present invention, it is preferable that the control unit has a cache memory for storing a part of the data of the disk device, and the I / O request from the host cannot use the cache memory. An O request is requested as the normal I / O.

本発明では、リビルド/コピーバックの1回の処理サイズを、RAID制御が管理する通常I/Oの有無に応じて、変更するため、通常I/Oがある場合には、通常I/Oの処理の阻害にならず、リビルド/コピーバックを実行でき、通常I/Oが無い静的な状態では、それよりも大きい処理サイズを指定して、リビルド/コピーバック処理を高速に実現できる。又、通常I/Oとリビルド/コピーバック要求とを所定比で実行するRAID制御モジュールと、リビルド/コピーバック処理モジュールに分け、RAID制御モジュールで、通常I/Oの有無を判定するため、少ない負荷で且つ正確に通常I/Oの有無を判定できる。且つリビルド/コピーバック処理モジュールが、通常I/Oがある場合でも、1回のリビルド/コピーバック要求をRAID制御モジュールに発行するため、通常I/O有りでも、所定比でリビルド/コピーバック要求を実行でき、ホストI/Oが途切れることが少ない使用環境でも、ホストI/O要求の遅延を最小限にして、リビルド/コピーバック処理の所定時間までに、リビルド/コピーバック処理を完了できる。 In the present invention, the processing size of one rebuild / copyback process is changed according to the presence / absence of normal I / O managed by RAID control. Rebuild / copyback can be executed without hindering the processing, and in a static state where there is no normal I / O, a larger processing size can be specified and the rebuild / copyback processing can be realized at high speed. In addition, the RAID control module that executes normal I / O and rebuild / copy back request at a predetermined ratio and the rebuild / copy back processing module are divided into a few , and the RAID control module determines the presence or absence of normal I / O. Ru can determine and accurately whether the normal I / O load. In addition, even if the rebuild / copyback processing module has normal I / O, a rebuild / copyback request is issued to the RAID control module once , so even if there is normal I / O , rebuild / copyback request at a specified ratio. Even in an environment where the host I / O is less likely to be interrupted, the rebuild / copy back process can be completed by a predetermined time of the rebuild / copy back process with a minimum delay of the host I / O request .

以下、本発明の実施の形態を、ディスクアレイ装置(RAIDシステム)、スレッド構成、リビルド/コピーバック処理、他の実施の形態の順で説明する。   Hereinafter, embodiments of the present invention will be described in the order of a disk array device (RAID system), thread configuration, rebuild / copy back processing, and other embodiments.

**ディスクアレイ装置**
図1は、本発明の一実施の形態のディスクアレイ装置の構成図、図2は、図1のコントロールモジュールの構成図である。
** Disk array device **
FIG. 1 is a configuration diagram of a disk array device according to an embodiment of the present invention, and FIG. 2 is a configuration diagram of a control module of FIG.

図1は、2台のコントロールモジュールを持つ小規模なディスクアレイ装置を例に示すが、4台の中規模のディスクアレイ装置、8台の大規模のディスクアレイ装置も同様である。   FIG. 1 shows an example of a small-scale disk array device having two control modules, but the same applies to four medium-scale disk array devices and eight large-scale disk array devices.

図1に示すように、ディスクアレイ装置は、データを保持する複数のディスクデバイスを搭載する複数のディスクエンクロージャ2−0〜2−3と、図示しないホストコンピュータ(データ処理装置)と、複数のディスクエンクロージャ2−0〜2−3との間に、配置された複数(ここでは2つ)の制御モジュール4−0〜4−1とを有する。   As shown in FIG. 1, the disk array device includes a plurality of disk enclosures 2-0 to 2-3 on which a plurality of disk devices for holding data are mounted, a host computer (data processing device) (not shown), and a plurality of disks. Between the enclosures 2-0 to 2-3, there are a plurality (two in this case) of control modules 4-0 to 4-1.

制御モジュール4−0〜4−1のそれぞれは、コントローラ40と、チャネルアダプタ(第1インターフェース部;図中CAと表記)41と、ディスクアダプタ(第2インターフェース部;図中DAと表記)42a,42bと、DMA(Direct Memory Access)エンジン(通信部;図中DMAと表記)43とを有する。   Each of the control modules 4-0 to 4-1 includes a controller 40, a channel adapter (first interface unit; denoted as CA in the figure) 41, a disk adapter (second interface part; denoted as DA in the figure) 42a, 42 b and a DMA (Direct Memory Access) engine (communication unit; denoted as DMA in the drawing) 43.

図1及び図2により、制御モジュール4−0〜4−1を説明する。コントローラ40は、ホストコンピュータからの処理要求(リード要求もしくはライト要求)に基づいて、リード/ライト処理を行なうものであり、メモリ40bと制御部40aとを備える。   The control modules 4-0 to 4-1 will be described with reference to FIGS. The controller 40 performs read / write processing based on a processing request (read request or write request) from the host computer, and includes a memory 40b and a control unit 40a.

メモリ40bは、ディスクエンクロージャ2−0〜2−3の複数のディスクに保持されたデータの一部を保持する、所謂、複数のディスクに対するキャッシュの役割を果たすキャッシュ領域と、その他のワーク領域とを有する。   The memory 40b includes a cache area that holds a part of data held in a plurality of disks in the disk enclosures 2-0 to 2-3, that is, a so-called cache area that serves as a cache for the plurality of disks, and another work area. Have.

制御部40aは、メモリ40b,チャネルアダプタ41、デバイスアダプタ42、DMA43の制御を行う。このため、1つ又は複数(図では、2つ)のCPU400,410と、メモリコントローラ420とを有する。メモリコントローラ420は、メモリのリード/ライトを制御し、且つパスの切り替えを行う。   The control unit 40a controls the memory 40b, the channel adapter 41, the device adapter 42, and the DMA 43. For this reason, one or a plurality (two in the figure) of CPUs 400 and 410 and a memory controller 420 are provided. The memory controller 420 controls reading / writing of the memory and switches the path.

メモリコントローラ420は、メモリバス434を介しメモリ40bと接続し、CPUバス430,432を介しCPU400,410と接続し、更に、メモリコントローラ420は、4レーンの高速シリアルバス(例えば、PCI−Express)440,442を介しディスクアダプタ42a,42bに接続する。   The memory controller 420 is connected to the memory 40b via the memory bus 434, and is connected to the CPUs 400 and 410 via the CPU buses 430 and 432. Further, the memory controller 420 is a 4-lane high-speed serial bus (for example, PCI-Express). The disk adapters 42a and 42b are connected via the 440 and 442, respectively.

同様に、メモリコントローラ420は、4レーンの高速シリアルバス(例えば、PCI−Express)443,444,445,446を介しチャネルアダプタ41(ここでは、4つのチャネルアダプタ41a,41b、41c,41d)に接続し、4レーンの高速シリアルバス(例えば、PCI−Express)447,448を介しDMA43(ここでは、2つのDMA43−a,43−b)に接続する。   Similarly, the memory controller 420 is connected to the channel adapter 41 (here, four channel adapters 41a, 41b, 41c, and 41d) via a four-lane high-speed serial bus (for example, PCI-Express) 443, 444, 445, and 446. Connected to DMA 43 (here, two DMAs 43-a and 43-b) via a high-speed serial bus (for example, PCI-Express) 447 and 448 of four lanes.

このPCI−Expess等の高速シリアルバスは、パケットで通信し、且つシリアルバスを複数レーン設けることにより、信号線本線を減らしても、遅延の少ない、速い応答速度で、所謂、低レンテンシで通信することができる。   This high-speed serial bus such as PCI-Express communicates with packets, and by providing a plurality of lanes for the serial bus, even if the number of signal lines is reduced, communication is performed with low delay and high response speed with so-called low latency. be able to.

チャネルアダプタ41a〜41dは、ホストコンピュータに対するインターフェースであり、チャネルアダプタ41a〜41dは、それぞれ異なるホストコンピュータと接続される。また、チャネルアダプタ41a〜41dは、それぞれ対応するホストコンピュータのインターフェース部に、バス、例えば、ファイバチャネル(Fiber Channel)やEthernet(登録商標)によって接続されることが好ましく、この場合、バスとしては、光ファイバや同軸ケーブルが用いられる。   The channel adapters 41a to 41d are interfaces to the host computer, and the channel adapters 41a to 41d are connected to different host computers. Each of the channel adapters 41a to 41d is preferably connected to an interface unit of a corresponding host computer by a bus, for example, Fiber Channel or Ethernet (registered trademark). In this case, as the bus, An optical fiber or a coaxial cable is used.

さらに、これらチャネルアダプタ41a〜41dそれぞれは、各制御モジュール4−0〜4−1の一部として構成されている。このチャネルアダプタ41a〜41bが、対応するホストコンピュータと制御モジュール4−0〜4−3とのインターフェース部として、複数のプロトコルをサポートする。   Further, each of these channel adapters 41a to 41d is configured as a part of each control module 4-0 to 4-1. The channel adapters 41a to 41b support a plurality of protocols as an interface unit between the corresponding host computer and the control modules 4-0 to 4-3.

ここでは、対応するホストコンピュータによって実装すべきプロトコルが同一ではないため、各チャネルアダプタ41a〜41dを必要に応じて容易に交換できるように、制御モジュール4−0〜4−1の主要ユニットであるコントローラ40とは、別のプリント基板に実装されている。   Here, since the protocols to be implemented by the corresponding host computers are not the same, they are the main units of the control modules 4-0 to 4-1 so that the channel adapters 41a to 41d can be easily replaced as necessary. The controller 40 is mounted on a separate printed circuit board.

例えば、チャネルアダプタ41a〜41dがサポートすべきホストコンピュータとの間のプロトコルとしては、上述のように、ファイバチャネルや、Ethernet(登録商標)に対応するiSCSI(Internet Small Computer System Interface)等がある。   For example, as described above, the protocol between the host computers to be supported by the channel adapters 41a to 41d includes Fiber Channel, iSCSI (Internet Small Computer System Interface) corresponding to Ethernet (registered trademark), and the like.

更に、各チャネルアダプタ41a〜41dは、前述のように、PCI−Expressバスのように,LSI(Large Scale Integration)やプリント基板の間を接続するために設計されたバスによって、コントローラ40と直接結合されている。これにより、各チャネルアダプタ41a〜41dとコントローラ40と間に要求される高いスループットを実現することができる。   Further, as described above, each of the channel adapters 41a to 41d is directly coupled to the controller 40 by a bus designed for connecting between an LSI (Large Scale Integration) and a printed circuit board, such as a PCI-Express bus. Has been. Thereby, the high throughput requested | required between each channel adapter 41a-41d and the controller 40 is realizable.

ディスクアダプタ42a,42bは、ディスクエンクロージャ2−0〜2−3の各ディスクドライブに対するインターフェースであり、ディスクエンクロージャ2−0〜2−3に接続され,ここでは、4つのFC(Fiber Channel)ポートを有する。   The disk adapters 42a and 42b are interfaces to the respective disk drives of the disk enclosures 2-0 to 2-3, and are connected to the disk enclosures 2-0 to 2-3. Here, four FC (Fiber Channel) ports are connected. Have.

又、各ディスクアダプタ42a、42bは、前述のように、PCI−Expressバスのように,LSI(Large Scale Integration)やプリント基板の間を接続するために設計されたバスによって、コントローラ40と直接結合されている。これにより、各ディスクアダプタ42a、42bとコントローラ40と間に要求される高いスループットを実現することができる。   Further, as described above, each of the disk adapters 42a and 42b is directly coupled to the controller 40 by a bus designed to connect between an LSI (Large Scale Integration) and a printed circuit board, such as a PCI-Express bus. Has been. As a result, a high throughput required between the disk adapters 42a and 42b and the controller 40 can be realized.

図1に示すように、ディスクエンクロージャ2−0〜2−3の各々は、各々2つのポートを有する複数台(例えば、15台)のディスクドライブ200を搭載する。そして、ディスクエンクロージャ2−0〜2−3内では、2つのポートからの一対のFCケーブルにより、各ディスクドライブ200の各ポートが、2つのポートに接続される。   As shown in FIG. 1, each of the disk enclosures 2-0 to 2-3 has a plurality of (for example, 15) disk drives 200 each having two ports. In the disk enclosures 2-0 to 2-3, each port of each disk drive 200 is connected to two ports by a pair of FC cables from the two ports.

この2つのポートは、各制御モジュール4−0〜4−1のディスクアダプタ42a,42bそれぞれを、すべてのディスクエンクロージャ2−0〜2−3に接続する。即ち、各制御モジュール4−0〜4−1のディスクアダプタ42aは、ディスクエンクロージャ2−0〜2−3に接続される。又、同様に、各制御モジュール4−0〜4−1のディスクアダプタ42bは、ディスクエンクロージャ2−0〜2−3に接続される。   These two ports connect the disk adapters 42a and 42b of the respective control modules 4-0 to 4-1 to all the disk enclosures 2-0 to 2-3. That is, the disk adapter 42a of each control module 4-0 to 4-1 is connected to the disk enclosures 2-0 to 2-3. Similarly, the disk adapters 42b of the control modules 4-0 to 4-1 are connected to the disk enclosures 2-0 to 2-3.

このような構成により、各制御モジュール4−0〜4−1が、いずれのディスクアダプタ42a,42bを通じて、且ついずれのパスを通じても、すべてのディスクエンクロージャ(ディスクドライブ)2−0〜2−3にアクセスできる。   With such a configuration, the control modules 4-0 to 4-1 are connected to all the disk enclosures (disk drives) 2-0 to 2-3 through any of the disk adapters 42a and 42b and through any path. Accessible.

なお、各ディスクアダプタ42a,42bと対応するディスクエンクロージャ2−0〜2−3との間は、例えば、ファイバチャネルによって接続され、この場合には、モジュールが異なるため、光ケーブルで接続される。   The disk adapters 42a and 42b and the corresponding disk enclosures 2-0 to 2-3 are connected by, for example, fiber channels. In this case, since the modules are different, they are connected by optical cables.

図1に示すように、DMAエンジン43は、各制御モジュール4−0〜4−1と相互に通信を行うものであり、他の制御モジュール間との通信とデータ転送処理を担当する。各制御モジュール4−0〜4−1のDMAエンジン43のそれぞれは、制御モジュール4−0〜4−1の一部として構成されており、制御モジュール4−0〜4−1の主要ユニットであるコントローラ40の基板上に実装される。そして、前述の高速シリアルバスによって、コントローラ40と直接結合されるとともに、他の制御モジュール4−0〜4−1のDMAエンジン43と互いに通信する。   As shown in FIG. 1, the DMA engine 43 communicates with the control modules 4-0 to 4-1, and is responsible for communication and data transfer processing between other control modules. Each of the DMA engines 43 of the control modules 4-0 to 4-1 is configured as a part of the control modules 4-0 to 4-1, and is a main unit of the control modules 4-0 to 4-1. It is mounted on the substrate of the controller 40. Then, it is directly coupled to the controller 40 by the above-described high-speed serial bus and communicates with the DMA engines 43 of the other control modules 4-0 to 4-1.

このような構成により、各制御モジュール4−0〜4−1のDMAエンジン43のそれぞれは、自身に接続されたコントローラ40と他の制御モジュール4−0〜4−1のコントローラ40との間で、ホストコンピュータからのアクセス要求等に応じて生じる通信やデータ転送処理(例えば、ミラーリング処理)を実行する。   With such a configuration, each of the DMA engines 43 of the control modules 4-0 to 4-1 can be connected between the controller 40 connected thereto and the controllers 40 of the other control modules 4-0 to 4-1. Communication or data transfer processing (for example, mirroring processing) that occurs in response to an access request from the host computer is executed.

また、図2に示すように、各制御モジュール4−0〜4−7のDMAエンジン43が複数(ここでは2つ)のDMAエンジン43−a,43−bで構成され、これら2つのDMAエンジン43−a,43−bの各々は、図2に示したように、例えば、PCI−Expressバスによって、コントローラ40に接続されている。即ち、各制御モジュール4−0〜4−1間(つまり、各制御モジュール4−0〜4−1のコントローラ40間)の通信やデータ転送(DMA)処理では、データ転送量が多く、通信制御にかかる時間を短くすることが望ましく、高いスループットと同時に低いレイテンシ(速い応答速度)が要求される。このため、図1、図2に示すように、各制御モジュール4−0〜4−1のDMAエンジン43は、高いスループットと低いレイテンシとの両方の要求を満たすべく設計された、高速シリアル伝送を利用したバス(PCI-ExpressやRapid-IO)によって、接続される。   As shown in FIG. 2, the DMA engines 43 of the control modules 4-0 to 4-7 are composed of a plurality of (here, two) DMA engines 43-a and 43-b, and these two DMA engines. As shown in FIG. 2, each of 43-a and 43-b is connected to the controller 40 by, for example, a PCI-Express bus. That is, in communication and data transfer (DMA) processing between the control modules 4-0 to 4-1 (that is, between the controllers 40 of the control modules 4-0 to 4-1), the amount of data transfer is large and communication control is performed. It is desirable to shorten the time required for the processing, and high latency and low latency (fast response speed) are required. For this reason, as shown in FIGS. 1 and 2, the DMA engine 43 of each control module 4-0 to 4-1 performs high-speed serial transmission designed to satisfy both requirements of high throughput and low latency. Connected by the used bus (PCI-Express or Rapid-IO).

これらPCI-ExpressやRapid-IOは、2.5Gbpsの高速シリアル伝送を利用したものであり、これらのバスインターフェースには、LVDS(Low Voltage Differential Signaling)という小振幅差動インタフェースが採用される。   These PCI-Express and Rapid-IO use high-speed serial transmission of 2.5 Gbps, and a low-amplitude differential interface called LVDS (Low Voltage Differential Signaling) is adopted for these bus interfaces.

**スレッド構成**
次に、CPU400(410)が実行するソフトウェアのプログラムモジュール(スレッドという)を説明する。図3は、CPU400(410)が実行するソフトウェアのスレッドの構成図、図4は、その部分詳細図である。図3に示すように、ソフトウェアモジュールは、カーネル/スケジューラ600と、IO制御モジュール602と、CM間通信ドライバ604、CPU間通信ドライバ606と、システム制御モジュール608と、ネットワークドライバ610とを有する。
** Thread configuration **
Next, software program modules (referred to as threads) executed by the CPU 400 (410) will be described. FIG. 3 is a configuration diagram of software threads executed by the CPU 400 (410), and FIG. 4 is a partial detail view thereof. As shown in FIG. 3, the software module includes a kernel / scheduler 600, an IO control module 602, an inter-CM communication driver 604, an inter-CPU communication driver 606, a system control module 608, and a network driver 610.

カーネル/スケジューラ600は、MS−DOS(登録商標)等のオペレーテイングシステムである。IO制御モジュール602は、CM−CAドライバ620と、ベーシックモジュール640と、CM−DAドライバ630と有する。CM−CAドライバ620は、CA(チャネルアダプタ)41をドライブするドライバである。   The kernel / scheduler 600 is an operating system such as MS-DOS (registered trademark). The IO control module 602 includes a CM-CA driver 620, a basic module 640, and a CM-DA driver 630. The CM-CA driver 620 is a driver that drives a CA (channel adapter) 41.

ベーシックモジュール630は、資源管理を行うリソーススレッド(リソース制御モジュール)646、コピー処理を行うコピースレッド(コピー制御モジュール)646、メモリ40bのキャッシュメモリの制御を行うキャッシュスレッド(キャッシュメモリ制御モジュール)648を有するフロントエンドと、RAID構成制御を行うRAIDスレッド(RAID制御モジュール)632、OVSMスレッド(OVSM制御モジュール)634とを有するバックエンドとからなる。   The basic module 630 includes a resource thread (resource control module) 646 that performs resource management, a copy thread (copy control module) 646 that performs copy processing, and a cache thread (cache memory control module) 648 that controls the cache memory of the memory 40b. And a back end having a RAID thread (RAID control module) 632 for performing RAID configuration control and an OVSM thread (OVSM control module) 634.

OVSMスレッド634は、後述するリビルド/コピーバック処理を行う。メインテナンスエージェント612は、OVSMスレッド634への各種の通知を行う。CM−DAドライバ630は、DA(ディスクアダプタ)42をドライブするドライバである。CM間通信ドライバ604は、他のCMと、CPU間通信ドライバ606は、他のCPU410と通信を行う。   The OVSM thread 634 performs a rebuild / copy back process to be described later. The maintenance agent 612 makes various notifications to the OVSM thread 634. The CM-DA driver 630 is a driver that drives a DA (disk adapter) 42. The inter-CM communication driver 604 communicates with other CMs, and the inter-CPU communication driver 606 communicates with other CPUs 410.

システム制御モジュール608は、構成管理モジュール652とを有する。構成管理モジュール652は、サービスコントローラ46からの、ネットワークドライバ610を介する指定に応じて、構成定義のためのRLU(Raid Logical Unit)テーブルを含む構成定義テーブルを、メモリ40bに作成する。尚、サービスコントローラ46は、図1では、図示されておらず、各CMに共通である。   The system control module 608 has a configuration management module 652. The configuration management module 652 creates a configuration definition table including an RLU (Raid Logical Unit) table for configuration definition in the memory 40b in accordance with designation from the service controller 46 via the network driver 610. The service controller 46 is not shown in FIG. 1 and is common to each CM.

又、DA42に接続されたディスクエンクロージャ2−0〜2−3内に設けられたディスクドライブ200は、システムディスク200−1とユーザディスク200−2に分けられ、システムディスク200−1に、構成定義テーブルも格納される。   The disk drive 200 provided in the disk enclosures 2-0 to 2-3 connected to the DA 42 is divided into a system disk 200-1 and a user disk 200-2. A table is also stored.

リソースモジュール642、RAIDモジュール632が、構成定義テーブルを参照して、ホストからのLUN(論理ユニット番号)を、物理ディスクのPLBA(物理ブロックアドレス)に変換し、物理ディスク200をアクセスする。   The resource module 642 and the RAID module 632 refer to the configuration definition table, convert a LUN (logical unit number) from the host into a PLBA (physical block address) of the physical disk, and access the physical disk 200.

図4に示すように、OVSMスレッド634は、Rebuild/Copybackの進捗の管理を行うRebuild/Copybackモジュール634−1を有する。Rebuild/Copybackモジュール634−1は、Rebuild/Copybackの一回一回の処理を、後述するRAID制御モジュール632に依頼し、その応答を得て、Rebuild/Copybackの進捗を記録する。   As illustrated in FIG. 4, the OVSM thread 634 includes a Rebuild / Copyback module 634-1 that manages the progress of Rebuild / Copyback. The Rebuild / Copyback module 634-1 requests the RAID control module 632, which will be described later, to process the Rebuild / Copyback once, obtains a response, and records the progress of the Rebuild / Copyback.

これに対し、RAID制御モジュール632は、データを一時待避するバッファ(以降では、Data Bufferと記述する)を獲得して、ディスクデバイスに対して、リードやライトを指示する。特に、Rebuild/Copybackでは、ディスクデバイスからリードし、Data Bufferへ格納し、Data Bufferの内容を、ディスクデバイスへライトする処理を担当する。   On the other hand, the RAID control module 632 acquires a buffer for temporarily saving data (hereinafter referred to as “Data Buffer”), and instructs the disk device to read or write. In particular, Rebuild / Copyback is in charge of processing to read from the disk device, store it in the Data Buffer, and write the contents of the Data Buffer to the disk device.

このRAID制御モジュール632は、最後の通常I/Oが完了した時刻を記録する通常I/O完了時刻記録部632−1と、通常I/O完了時刻記録部632−1の時刻と、現在の時刻とを比較して、例えば、5secの差があるかどうかを判定する通常I/O有無判定モジュール632−2とを有する。   The RAID control module 632 includes a normal I / O completion time recording unit 632-1 that records the time at which the last normal I / O is completed, a time of the normal I / O completion time recording unit 632-1, and the current For example, a normal I / O presence / absence determination module 632-2 that compares the time and determines whether there is a difference of 5 seconds, for example.

又、OVSMモジュール634は、RAID制御モジュール632へRebuild/Copyback実処理を依頼するRebuild/Copybackモジュール634−2,634−3と、実処理依頼時に、通常I/O有無判定モジュール632−2の判定結果を呼び出し、その結果により、1回の実処理の処理サイズを変更する処理サイズ変更モジュール634−4とを有する。   The OVSM module 634 also includes the Rebuild / Copyback modules 634-2 and 634-3 that request the Rebuild / Copyback actual processing to the RAID control module 632, and the normal I / O presence / absence determination module 632-2 at the time of actual processing request. A processing size change module 634-4 that calls the result and changes the processing size of one actual processing according to the result is provided.

このRebuild/Copybackモジュール634−1は、メモリ40bに設けられた開始LBAを格納する進捗テーブル410と、処理サイズのデフォルト値を格納するデフォルト格納部414を参照し、1回の実処理サイズを決定し、実処理を依頼する。   The Rebuild / Copyback module 634-1 determines a single actual processing size by referring to the progress table 410 storing the start LBA provided in the memory 40b and the default storage unit 414 storing the default value of the processing size. And request actual processing.

このような構成により、OVSMモジュール634は、Rebuild/Copybackの実処理を、RAID制御モジュール632に依頼する度に、OVSMモジュール634は、RAID制御モジュール632に対して、通常I/Oの有無(通常I/O無しになってから5sec以上が,経過しているかどうか)について確認を行い、その結果を受けて、OVSMモジュール634は、RAID制御モジュール632へ渡すRebuild/Copyback実処理のパラメータ(1回の処理サイズ)等を変更する。   With such a configuration, each time the OVSM module 634 requests the RAID control module 632 to execute the actual processing of Rebuild / Copyback, the OVSM module 634 makes a normal I / O presence / absence to the RAID control module 632 (normally The OVSM module 634 receives the result and confirms whether the Rebuild / Copyback actual processing parameters to be passed to the RAID control module 632 (once) Change the processing size).

ここで、通常I/Oの有無の判定として、5sec以上としたのは、I/Oの有るタイミングと無いタイミングが交互に繰り返されているような場合に、誤認を防ぐためである。つまり、まばらに、通常I/Oが来ている状態だと、偶然に、Rebuild/Copybackのタイミングで、通常I/Oが無いように見えても、Rebuild/Copybackを開始してすぐに、通常I/Oが発生する可能性がある。このようなケースは、通常I/O有りの状態に分類し、通常I/Oを待たせないという意味である。   Here, the determination of the presence / absence of normal I / O is set to 5 sec or more in order to prevent misidentification when the timing with and without I / O is repeated alternately. In other words, if sparsely normal I / O is coming, even if it appears that there is no normal I / O at the timing of Rebuild / Copyback, it will be normal immediately after starting Rebuild / Copyback. I / O may occur. Such a case means that the normal I / O is present and the normal I / O is not kept waiting.

**リビルド/コピーバック処理**
図5は、本発明の一実施の形態のリビルド/コピーバック処理フロー図、図6は、そのタイムチャート図、図7は、その動作説明図である。
** Rebuild / Copyback process **
FIG. 5 is a flowchart of rebuild / copyback processing according to the embodiment of the present invention, FIG. 6 is a time chart thereof, and FIG. 7 is an operation explanatory diagram thereof.

以下、図6及び図7を参照して、図5のリビルド/コピーバック処理を説明する。   The rebuild / copy back process of FIG. 5 will be described below with reference to FIGS.

(S10)先ず、OVSMモジュール634は、リビルド/コピーバックの開始に当り、RAID制御モジュール632から完了応答があることを確認する。   (S10) First, the OVSM module 634 confirms that there is a completion response from the RAID control module 632 at the start of rebuild / copyback.

(S12)次に、OVSMモジュール634のリビルド/コピーバックモジュール634−1は、メモリ40bのリビルド/コピーバック進捗テーブル410の開始RLBAを参照する。図7に示すように、リビルド/コピーバック処理の対象が、RAID構成でのLBA(Logical Block Address)000〜nnnとすると、開始RLBAには、次のリビルド/コピーバック処理の対象データの開始RLBAが、記録されている。   (S12) Next, the rebuild / copy back module 634-1 of the OVSM module 634 refers to the start RLBA in the rebuild / copy back progress table 410 of the memory 40b. As shown in FIG. 7, when the target of the rebuild / copy back process is LBA (Logical Block Address) 000 to nnn in the RAID configuration, the start RLBA includes the start RLBA of the target data of the next rebuild / copy back process. Is recorded.

(S14)リビルド/コピーバックモジュール634−1は、進捗テーブル410の開始RLBAから、対象とする全RLU(Raid Logical Unit)の処理が完了したかを判定する。リビルド/コピーバックモジュール634−1は、全RLUの処理を完了したと判定すると、終了する。   (S14) The rebuild / copy back module 634-1 determines from the start RLBA of the progress table 410 whether processing of all target RLUs (Raid Logical Units) has been completed. When the rebuild / copy back module 634-1 determines that all the RLUs have been processed, the rebuild / copy back module 634-1 ends.

(S16)逆に、リビルド/コピーバックモジュール634−1は、全RLUの処理を完了していないと判定すると、RAID制御モジュール632に、通常I/Oの有無を問い合わせる。図4で説明したように、RAID制御モジュール632は、通常I/O無しになってから5sec以上が,経過しているかどうかを判定している。   (S16) Conversely, if the rebuild / copy back module 634-1 determines that the processing of all the RLUs has not been completed, the rebuild / copy back module 634-1 inquires of the RAID control module 632 about the presence of normal I / O. As described with reference to FIG. 4, the RAID control module 632 determines whether or not 5 seconds or more have elapsed since the normal I / O was absent.

(S18)リビルド/コピーバックモジュール634−1は、RAID制御モジュール632からの応答から、通常I/Oの有無を確認し、通常I/Oが有る場合には、図6のコピーバック1に示すように、1回の処理サイズを、メモリ40bのデフォルト値に設定する。一方、通常I/Oが無い場合には、図6のコピーバック2に示すように、1回の処理サイズを、メモリ40bのデフォルト値の2倍に設定する。   (S18) The rebuild / copy back module 634-1 confirms the presence / absence of normal I / O from the response from the RAID control module 632, and if there is normal I / O, it is shown as copy back 1 in FIG. As described above, the one-time processing size is set to the default value of the memory 40b. On the other hand, when there is no normal I / O, as shown in copy back 2 of FIG.

(S20)そして、リビルド/コピーバックモジュール634−1は、RAID制御モジュール632に、開始RLBAと設定した処理サイズを有する実処理を要求する。更に、リビルド/コピーバックモジュール634−1は、開始RLBAに処理サイズを加えて、次の開始RLBAを計算し、進捗テーブル410を計算した開始RLBAに更新する。そして、ステップS10に戻る。   (S20) Then, the rebuild / copy back module 634-1 requests the RAID control module 632 for actual processing having the processing size set as the start RLBA. Further, the rebuild / copy back module 634-1 adds the processing size to the start RLBA, calculates the next start RLBA, and updates the progress table 410 to the calculated start RLBA. Then, the process returns to step S10.

このように、通常I/O有りの状態(以降、動的と記述する)と、無しの状態(以降、静的と記述する)とで、静的の場合では、一回の処理サイズを大きくする。一回のサイズが大きければ、Rebuild/Copyback処理は、早くなるが、代わりに通常I/Oへの影響が大きくなる。   In this way, in the case of static with the state with normal I / O (hereinafter referred to as “dynamic”) and the state with no I / O (hereinafter referred to as “static”), the processing size for one time is increased. To do. If the size of one time is large, the Rebuild / Copyback process becomes faster, but the influence on the normal I / O becomes larger instead.

このため、動的の場合では、通常I/Oの処理の阻害にならない処理サイズを指定し、静的では、それよりも大きい処理サイズ(例えば、物理ディスクドライブの1トラック以上のサイズであることが、ディスク性能的に望ましい)を指定する。このサイズの指定方法は、OVSM634からRAID制御632へのRebuild/Copyback実処理要求時のパラメータを変更するだけで良い。   For this reason, in the dynamic case, a processing size that does not interfere with normal I / O processing is specified, and in the static case, a larger processing size (for example, a size of one track or more of a physical disk drive) Is desirable in terms of disk performance). In order to specify this size, it is only necessary to change the parameter when the Rebuild / Copyback actual processing request is sent from the OVSM 634 to the RAID control 632.

尚、図3のホストからのアクセス処理を説明すると、CA41が、ホストからのリード要求を受けると、CA41は、CM−CAドライバ620を介し、リソースモジュール642に通知し、リソースモジュール642は、このリード要求を受け付ける。   3, when the CA 41 receives a read request from the host, the CA 41 notifies the resource module 642 via the CM-CA driver 620, and the resource module 642 Accept a read request.

リソースモジュール642は、キャッシュモジュール648に、キャッシュヒットか否かの判定を依頼する。キャッシュモジュール648は、対象とするホストLUNのLBA(OLBA)のデータが、メモリ40bのキャッシュ領域に存在するかを調べ、存在すれば(ヒット)、メモリ40bのOLBA(ホスト論理ブロックアドレス)のデータを読み出し、CM−CAドライバ620を介しCA41からホストにデータを転送する。   The resource module 642 requests the cache module 648 to determine whether or not there is a cache hit. The cache module 648 checks whether the LBA (OLBA) data of the target host LUN exists in the cache area of the memory 40b, and if it exists (hit), the OLBA (host logical block address) data of the memory 40b. And the data is transferred from the CA 41 to the host via the CM-CA driver 620.

一方、キャッシュモジュール648は、対象とするホストLUNのLBA(OLBA)のデータが、メモリ40bのキャッシュ領域に存在しない(ミスヒット)と判定すると、バックエンドのRAID制御モジュール632に、物理ディスクからのデータリード要求を行う。RAIDモジュール632は、周知のように、処理要求されたホストLUNのLBA(OLBA)を、RAIDグループのLBA(RLBA)に変換する。   On the other hand, if the cache module 648 determines that the LBA (OLBA) data of the target host LUN does not exist in the cache area of the memory 40b (mis-hit), the cache module 648 sends the back-end RAID control module 632 from the physical disk. Make a data read request. As is well known, the RAID module 632 converts the LBA (OLBA) of the requested host LUN into the LBA (RLBA) of the RAID group.

次に、RAID制御モジュール632は、RAIDグループのLBA(RLBA)を、仮想ディスクのLBA(DLBA)に変換する。次に、RAIDモジュール632は、処理要求された仮想ディスクのLBA(DLBA)を、物理ディスクのLBA(PLBA)に変換する。この処理は、RAID構成(例えば、RAID1,RAID5)により異なる。   Next, the RAID control module 632 converts the LBA (RLBA) of the RAID group into the LBA (DLBA) of the virtual disk. Next, the RAID module 632 converts the LBA (DLBA) of the virtual disk requested to be processed into the LBA (PLBA) of the physical disk. This process differs depending on the RAID configuration (for example, RAID 1 and RAID 5).

次に、RAIDモジュール632は、処理要求された物理ディスクのLBA(PLBA)から、ディスクエンクロージャRAID、スロットを求め、物理ディスク200のLBA(PLBA)にリード要求を行う。即ち、CM−DAドライバ630を介し対応するDA42に当該物理ディスクのリード要求を発し、BRT5−0を介し当該物理ディスクをアクセスする。   Next, the RAID module 632 obtains a disk enclosure RAID and slot from the LBA (PLBA) of the physical disk requested to be processed, and makes a read request to the LBA (PLBA) of the physical disk 200. That is, a read request for the physical disk is issued to the corresponding DA 42 via the CM-DA driver 630, and the physical disk is accessed via the BRT 5-0.

物理ディスクからデータが読み出され、キャッシュモジュール648が、DA42を介しメモリ40bのキャッシュ領域に格納し、リードが完了すると、リソースモジュール642は、CM−CAドライバ620を介しCA41からホストにこのリードデータを転送して、終了する。   When data is read from the physical disk, the cache module 648 stores it in the cache area of the memory 40b via the DA 42, and when the read is completed, the resource module 642 sends this read data from the CA 41 to the host via the CM-CA driver 620. To exit.

尚、ホストからのライト処理は、一旦、ライトデータをメモリ40bのキャッシュ領域に格納した後、内部のライトバックスケジュールに従い、該当物理ディスクにライトバックする。このライトバック時も同様に、ミスヒット以降の処理は、構成定義テーブルを使用したアドレス変換処理を行う。   In the write process from the host, the write data is temporarily stored in the cache area of the memory 40b and then written back to the physical disk according to the internal write-back schedule. Similarly, at the time of this write back, the address conversion processing using the configuration definition table is performed for the processing after the miss hit.

又、RAID制御モジュール632は、受け付けたホストI/O、ライトバック等の内部I/O等の通常I/Oと、受け付けたリビルド/コピーバック要求とを、所定のI/O比で優先度を付け、優先順に、下位層のCM−DAモジュール630に要求する。   Also, the RAID control module 632 gives priority to the received host I / O, normal I / O such as internal I / O such as write back, and the received rebuild / copy back request at a predetermined I / O ratio. And request to the CM-DA module 630 of the lower layer in order of priority.

このようにして、リビルド/コピーバックの1回の処理サイズを、RAID制御が管理する通常I/Oの有無に応じて、変更するため、通常I/Oがある場合には、通常I/Oの処理の阻害にならず、リビルド/コピーバックを実行でき、静的な状態では、それよりも大きい処理サイズを指定して、リビルド/コピーバック処理を高速に実現できる。   In this way, the processing size of one rebuild / copyback process is changed according to the presence / absence of normal I / O managed by RAID control. Therefore, when there is normal I / O, normal I / O is present. Therefore, rebuild / copyback processing can be executed, and in a static state, a larger processing size can be specified, and rebuild / copyback processing can be realized at high speed.

又、RAID制御モジュール632は、最後の通常I/Oが完了した時刻を記録し、この時刻と、現在の時刻とを比較して、例えば、5secの差があるかどうかを判定する通常I/O有無判定処理を行うため、リビルド/コピーバックモジュール634−1は、問い合わせにより、容易に、処理サイズを変更して、リビルド/コピーバック処理を進行できる。   The RAID control module 632 records the time when the last normal I / O is completed, compares this time with the current time, and determines whether there is a difference of 5 seconds, for example. Since the O presence / absence determination process is performed, the rebuild / copy back module 634-1 can easily change the process size and proceed with the rebuild / copy back process by an inquiry.

**他の実施の形態**
前述した実施の形態では、図1のような構成のディスクアレイ装置で説明したが、これ以外の構成のディスクアレイ装置に適用できる。又、物理ディスクは、磁気ディスク、光ディスク、光磁気ディスク、各種のストレージデバイスを適用できる。
** Other embodiments **
In the embodiment described above, the disk array device having the configuration as shown in FIG. 1 has been described, but the present invention can be applied to a disk array device having a configuration other than this. As the physical disk, a magnetic disk, an optical disk, a magneto-optical disk, and various storage devices can be applied.

更に、通常I/Oの有無の監視時間を5秒としたが、他の監視時間であっても良く、I/O有無の判定を、OVSMモジュールで実行することもできる。又、処理サイズの変更を、デフォルト値の2倍としたが、1.5倍等他の倍数を利用でき、且つ通常I/Oの有無により、処理サイズを別々に設けても良い。   Furthermore, although the monitoring time for the presence / absence of normal I / O is set to 5 seconds, other monitoring time may be used, and the determination of the presence / absence of I / O can also be executed by the OVSM module. In addition, although the processing size is changed to twice the default value, other multiples such as 1.5 times can be used, and the processing size may be provided separately depending on whether or not normal I / O is present.

以上、本発明を実施の形態により説明したが、本発明の趣旨の範囲内において、本発明は、種々の変形が可能であり、本発明の範囲からこれらを排除するものではない。   As mentioned above, although this invention was demonstrated by embodiment, in the range of the meaning of this invention, this invention can be variously deformed, These are not excluded from the scope of the present invention.

(付記1)ホストから依頼されたI/O要求に応じて、接続されたディスク装置をアクセスし、I/O要求を実行するRAIDシステムにおいて、RAIDを構成する複数の前記ディスク装置と、前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するコントローラとを有し、前記コントローラは、前記ホストからのI/O要求を含む通常I/O要求が所定時間来ないかを判定し、複数回に別けて実行するリビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定したことを特徴とするRAIDシステム。   (Supplementary Note 1) In a RAID system that accesses a connected disk device in response to an I / O request requested from a host and executes the I / O request, a plurality of the disk devices constituting a RAID, and the plurality of disk devices When one of the disk devices fails, the data of the disk device other than the failed disk device is read, and the operation of writing the data to the spare disk device or the new disk device is executed in multiple times to create a RAID configuration. And a controller for executing a rebuild or copyback process for reconstructing the I / O, and the controller determines whether or not a normal I / O request including an I / O request from the host comes for a predetermined time, and The request processing size of one rebuild or copyback process executed separately is set to the above when a normal I / O request does not arrive for a predetermined time. RAID system, characterized in that the normally I / O requests than arriving predetermined period was increased.

(付記2)前記コントローラは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定することを特徴とする付記1のRAIDシステム。   (Supplementary Note 2) The controller records the processing completion time of the normal I / O request every time the processing of the normal I / O request is completed, compares the processing completion time with the current time, and performs normal I / O The RAID system according to appendix 1, wherein it is determined whether the request does not come for a predetermined time.

(付記3)前記コントローラは、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するとともに、前記リビルド/コピーバック要求の処理完了に応じて、次のリビルド/コピーバック要求を発行することを特徴とする付記1のRAIDシステム。   (Supplementary Note 3) The controller balances and executes the normal I / O request and the one request of the rebuild / copyback, and performs the following in response to the completion of the processing of the rebuild / copyback request. The RAID system according to appendix 1, wherein a rebuild / copy back request is issued.

(付記4)前記コントローラは、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを有し、前記進捗テーブルに従い、リビルド又はコピーバック処理の1回の要求を作成し、且つ前記進捗テーブルを更新することを特徴とする付記1のRAIDシステム。   (Supplementary Note 4) The controller has a progress table for managing the progress status of the rebuild / copyback process, creates one request for rebuild or copyback process according to the progress table, and stores the progress table. The RAID system according to Appendix 1, wherein the RAID system is updated.

(付記5)前記コントローラは、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するRAID制御モジュールと、前記リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求を発行するリビルド/コピーバックモジュールとを有することを特徴とする付記3のRAIDシステム。   (Supplementary Note 5) The controller balances the normal I / O request and the rebuild / copy back request once, and executes the RAID control module to be executed and the completion of the rebuild / copy back request processing. The RAID system according to appendix 3, further comprising: a rebuild / copyback module that issues a next rebuild / copyback request with reference to a progress table that manages a progress status of the rebuild / copyback processing.

(付記6)前記RAID制御モジュールは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定し、前記リビルド/コピーバックモジュールは、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定して、前記リビルド/コピーバック要求を発行することを特徴とする付記5のRAIDシステム。   (Supplementary Note 6) The RAID control module records the processing completion time of the normal I / O request every time the processing of the normal I / O request is completed, compares the processing completion time with the current time, The rebuild / copy back module inquires of the RAID control module about the determination result, and determines the request processing size for one rebuild or copy back process as a normal I / O. The RAID system according to appendix 5, wherein when the O request does not arrive for a predetermined time, the rebuild / copy back request is issued with a larger setting than when the normal I / O request has arrived for the predetermined time.

(付記7)前記コントローラは、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合の処理サイズの倍数に設定したことを特徴とする付記1のRAIDシステム。   (Supplementary note 7) The controller sets the request processing size of the rebuild or copyback process for one time when the normal I / O request does not arrive for a predetermined time and the normal I / O request arrives for a predetermined time. The RAID system according to Supplementary Note 1, wherein the RAID system is set to a multiple of the processing size.

(付記8)前記コントローラは、前記ホストとのインタフェース制御を行う第1のインタフェース回路と、前記複数のディスク装置とのインタフェース制御を行う第2のインタフェース回路と、前記第1のインタフェース回路と前記第2のインタフェース回路に接続され、前記通常I/O処理と、前記リビルド又はコピーバック処理を実行する制御ユニットとを有し、前記制御ユニットは、前記ホストからのI/O要求を含む通常I/O要求が所定時間来ないかを判定し、複数回に別けて実行するリビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定したことを特徴とする付記1のRAIDシステム。   (Supplementary Note 8) The controller includes a first interface circuit that performs interface control with the host, a second interface circuit that performs interface control with the plurality of disk devices, the first interface circuit, and the first interface circuit. The normal I / O process and the control unit that executes the rebuild or copyback process, and the control unit includes a normal I / O request including an I / O request from the host. It is determined whether the O request does not arrive for a predetermined time, and the request processing size of one rebuild or copyback process executed separately for a plurality of times is set as the normal I / O request when the normal I / O request does not arrive for the predetermined time. The RAID system according to appendix 1, wherein the / O request is set larger than when the predetermined time has arrived.

(付記9)前記コントローラは、前記RAIDを構成する前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド処理を実行した後、前記予備ディスク装置のデータをリードし、前記故障したディスク装置の代わりに設けられた新ディスク装置にデータをライトする動作を複数回に別けて実行して、コピーバック処理を実行することを特徴とする付記1のRAIDシステム。   (Supplementary Note 9) When one of the plurality of disk devices constituting the RAID fails, the controller reads data from disk devices other than the failed disk device and writes data to the spare disk device. After executing the rebuild process to reconstruct the RAID configuration by executing multiple times, read the data of the spare disk device and write the data to the new disk device provided in place of the failed disk device The RAID system according to appendix 1, wherein the copy back processing is executed by performing the operation to be performed a plurality of times.

(付記10)前記制御ユニットは、前記ディスク装置のデータの一部を格納するキャッシュメモリを有し、前記ホストからのI/O要求の内、前記キャッシュメモリを利用できないI/O要求を、前記通常I/Oとして、要求することを特徴とする付記5のRAIDシステム。   (Supplementary Note 10) The control unit includes a cache memory for storing a part of the data of the disk device, and among the I / O requests from the host, the I / O requests that cannot use the cache memory are The RAID system according to appendix 5, characterized in that it is requested as normal I / O.

(付記11)ホストから依頼されたI/O要求に応じて、接続されたディスク装置をアクセスし、I/O要求を実行するRAIDシステムのリビルド/コピーバック処理方法において、RAIDを構成する複数の前記ディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するステップと、前記ホストからのI/O要求を含む通常I/O要求が所定時間来ないかを判定するステップと、複数回に別けて実行するリビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定するステップとを有することを特徴とするRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 11) In a rebuild / copyback processing method of a RAID system in which a connected disk device is accessed and an I / O request is executed in response to an I / O request requested from a host, a plurality of components constituting a RAID When one of the disk devices fails, the data of the disk device other than the failed disk device is read, and the operation of writing the data to the spare disk device or the new disk device is executed in multiple times, and the RAID configuration Executing a rebuild or copyback process for reconfiguring, a step for determining whether a normal I / O request including an I / O request from the host does not arrive for a predetermined time, and a rebuild performed separately for a plurality of times Alternatively, if the normal I / O request does not arrive for a predetermined time, the normal I / O request processing size for one copy back process is set. Than if the determined arrives predetermined time, rebuild / copy back processing method of the RAID system, characterized by a step of larger.

(付記12)前記判定ステップは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 12) In the determination step, the process completion time of the normal I / O request is recorded every time the process of the normal I / O request is completed, and the process completion time is compared with the current time to calculate the normal I / O request. The rebuild / copyback processing method for a RAID system according to appendix 11, characterized by comprising a step of determining whether or not the O request has come for a predetermined time.

(付記13)前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するステップを更に有し、前記リビルド/コピーバック処理の実行ステップは、前記リビルド/コピーバック要求の処理完了に応じて、次のリビルド/コピーバック要求を発行するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 13) The method further includes a step of balancing and executing the normal I / O request and the one request of rebuild / copy back, and the execution step of the rebuild / copy back process includes the rebuild / copy back The rebuild / copyback processing method for a RAID system according to appendix 11, further comprising a step of issuing a next rebuild / copyback request in response to completion of processing of the back request.

(付記14)前記リビルド/コピーバック処理の実行ステップは、前記リビルド/コピーバックの進捗状況を管理する進捗テーブルを参照して、リビルド又はコピーバック処理の1回の要求を作成するステップと、前記進捗テーブルを更新するステップを有することを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Additional remark 14) The execution step of the rebuild / copy back process refers to a progress table that manages the progress status of the rebuild / copy back, and creates a single request for the rebuild or copy back process; The rebuild / copyback processing method for a RAID system according to appendix 11, further comprising a step of updating the progress table.

(付記15)RAID制御モジュールにより、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とをバランスして、実行するステップを更に有し、前記処理ステップは、前記リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求を前記RAID制御モジュールに発行するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 15) The RAID control module further includes a step of balancing and executing the normal I / O request and the one request of rebuild / copy back, and the processing step includes the rebuild / copy back. The method includes a step of issuing a next rebuild / copy back request to the RAID control module with reference to a progress table for managing a progress status of the rebuild / copy back processing in response to completion of processing of the request. The rebuild / copyback processing method of the RAID system according to appendix 11.

(付記16)前記判定ステップは、前記RAID制御モジュールにより、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間来ないかを判定するステップからなり、前記リビルド/コピーバック要求発行ステップは、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定して、前記リビルド/コピーバック要求を発行するステップからなることを特徴とする付記15のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 16) In the determination step, the RAID control module records the process completion time of the normal I / O request every time the process of the normal I / O request is completed, and compares the process completion time with the current time. The rebuild / copyback request issuance step inquires of the RAID control module about the determination result and determines whether the rebuild / copyback process is one of the rebuild or copyback processes. A step of issuing the rebuild / copyback request by setting the request processing size of the number of times larger than when the normal I / O request arrives for a predetermined time if the normal I / O request does not arrive for a predetermined time The rebuild / copyback processing method for a RAID system according to appendix 15, characterized by comprising:

(付記17)前記設定ステップは、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合の処理サイズの倍数に設定するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 17) In the setting step, when the normal I / O request does not arrive for a predetermined time if the normal I / O request does not arrive for a predetermined time, The rebuild / copyback processing method for a RAID system according to appendix 11, characterized by comprising a step of setting a multiple of the processing size.

(付記18)前記判定ステップは、前記ホストとのインタフェース制御を行う第1のインタフェース回路と、前記複数のディスク装置とのインタフェース制御を行う第2のインタフェース回路とに接続され、前記通常I/O処理と、前記リビルド又はコピーバック処理を実行する制御ユニットにより、前記ホストからのI/O要求を含む通常I/O要求が所定時間来ないかを判定するステップからなり、前記設定ステップは、前記制御ユニットにより、複数回に別けて実行するリビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間到来しない場合には、前記通常I/O要求が所定時間到来した場合より、大きく設定するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 18) The determination step is connected to a first interface circuit that performs interface control with the host and a second interface circuit that performs interface control with the plurality of disk devices, and the normal I / O Processing and a step of determining whether a normal I / O request including an I / O request from the host does not arrive for a predetermined time by the control unit that executes the rebuild or copyback processing, and the setting step includes If the normal I / O request does not arrive for a predetermined time, the normal I / O request has arrived for a predetermined time when the normal I / O request does not arrive for a predetermined time for the rebuild or copyback process executed separately by the control unit. The rebuild / copy back of the RAID system according to appendix 11, characterized by comprising a step of setting larger than the case. Processing method.

(付記19)前記リビルド/コピーバック処理を実行するステップは、前記RAIDを構成する前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド処理ステップと、前記リビルド処理を実行した後、前記予備ディスク装置のデータをリードし、前記故障したディスク装置の代わりに設けられた新ディスク装置にデータをライトする動作を複数回に別けて実行して、コピーバック処理を実行するステップからなることを特徴とする付記11のRAIDシステムのリビルド/コピーバック処理方法。   (Supplementary Note 19) The step of executing the rebuild / copy back process reads data of a disk device other than the failed disk device when one of the plurality of disk devices constituting the RAID fails, A rebuild process step for rebuilding a RAID configuration by performing an operation of writing data to the apparatus in a plurality of times, and after executing the rebuild process, the data of the spare disk device is read and the failed disk The rebuild / copyback of the RAID system according to appendix 11, characterized by comprising a step of executing a copyback process by performing an operation of writing data to a new disk device provided instead of the device in a plurality of times Processing method.

(付記20)前記ホストからのI/O要求の内、前記ディスク装置のデータの一部を格納するキャッシュメモリを利用できないI/O要求を、前記通常I/Oとして、要求するステップを更に有することを特徴とする付記15のRAIDシステムのリビルド/コピーバック処理方法。   (Additional remark 20) It further has the step which requests | requires the I / O request which cannot use the cache memory which stores a part of data of the said disk unit among the I / O request from the said host as said normal I / O. The rebuild / copy back processing method of the RAID system according to appendix 15, wherein

以上、説明したように、リビルド/コピーバックの1回の処理サイズを、RAID制御が管理する通常I/Oの有無に応じて、変更するため、通常I/Oがある場合には、通常I/Oの処理の阻害にならず、リビルド/コピーバックを実行でき、通常I/Oが無い静的な状態では、それよりも大きい処理サイズを指定して、リビルド/コピーバック処理を高速に実現できる。又、通常I/Oとリビルド/コピーバック要求とを所定比で実行するRAID制御モジュールと、リビルド/コピーバック処理モジュールに分け、RAID制御モジュールで、通常I/Oの有無を判定するため、少ない負荷で且つ正確に通常I/Oの有無を判定できる。且つリビルド/コピーバック処理モジュールが、通常I/Oがある場合でも、1回のリビルド/コピーバック要求をRAID制御モジュールに発行するため、通常I/O有りでも、所定比でリビルド/コピーバック要求を実行でき、ホストI/Oが途切れることが少ない使用環境でも、ホストI/O要求の遅延を最小限にして、リビルド/コピーバック処理の所定時間までに、リビルド/コピーバック処理を完了できる。 As described above, the processing size for one rebuild / copyback process is changed according to the presence / absence of normal I / O managed by RAID control. Rebuild / copyback can be executed without hindering / O processing, and in a static state where there is no normal I / O, a larger processing size can be specified to achieve rebuild / copyback processing at high speed. it can. In addition, the RAID control module that executes normal I / O and rebuild / copy back request at a predetermined ratio and the rebuild / copy back processing module are divided into a few, and the RAID control module determines the presence or absence of normal I / O. The presence / absence of normal I / O can be accurately determined by load. In addition, even if the rebuild / copy back processing module has normal I / O, a rebuild / copy back request is issued to the RAID control module once, so even if there is normal I / O, a rebuild / copy back request is made at a predetermined ratio. Even in an environment where the host I / O is less likely to be interrupted, the rebuild / copy back process can be completed by a predetermined time of the rebuild / copy back process with a minimum delay of the host I / O request.

本発明の一実施の形態のディスクアレイ装置の構成図である。It is a block diagram of the disk array apparatus of one embodiment of this invention. 図1の制御モジュールの構成図である。It is a block diagram of the control module of FIG. 図1及び図2の制御モジュールのファームウェアの機能ブロック図である。FIG. 3 is a functional block diagram of firmware of the control module in FIGS. 1 and 2. 図3のファームウェアの詳細構成図である。FIG. 4 is a detailed configuration diagram of the firmware in FIG. 3. 本発明の一実施の形態のリビルド/コピーバック処理フロー図である。It is a rebuild / copy back process flowchart of one embodiment of this invention. 図5の処理のタイムチャート図である。It is a time chart figure of the processing of FIG. 図5の処理の動作説明図である。It is operation | movement explanatory drawing of the process of FIG. 従来のリビルド処理の説明図である。It is explanatory drawing of the conventional rebuild process. 従来のコピーバック処理の説明図である。It is explanatory drawing of the conventional copyback process.

符号の説明Explanation of symbols

4−0〜4−1 制御モジュール
40 制御ユニット
41 チャネルアダプタ
42a,42b デバイスアダプタ
400、410 CPU
40b メモリ
200 ディスクデバイス
632 RAID制御モジュール
634−1 リビルド/コピーバックモジュール
2−0〜2−3 デバイスエンクロージャー
4-0 to 4-1 Control module 40 Control unit 41 Channel adapter 42a, 42b Device adapter 400, 410 CPU
40b Memory 200 Disk device 632 RAID control module 634-1 Rebuild / copy back module 2-0 to 2-3 Device enclosure

Claims (5)

ホストから依頼されたI/O要求に応じて、接続されたディスク装置をアクセスし、I/O要求を実行するRAIDシステムにおいて、
RAIDを構成する複数の前記ディスク装置と、
前記複数のディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するコントローラとを有し、
前記コントローラは、
前記通常I/O要求と前記リビルド/コピーバックの1回の要求とを、優先度を付け、所定の比で、実行するRAID制御モジュールと、
前記リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求を発行するリビルド/コピーバックモジュールとを有し、
前記RAID制御モジュールは、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、通常I/O要求が所定時間以内に来ないかを判定し、
前記リビルド/コピーバックモジュールは、前記リビルド/コピーバック要求の処理完了に応じて、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間以内に到来しない場合には、前記通常I/O要求が所定時間以内に到来した場合より、大きく設定して、前記リビルド/コピーバックの1回の要求を、前記RAID制御モジュールに発行する
ことを特徴とするRAIDシステム。
In a RAID system that accesses a connected disk device and executes an I / O request in response to an I / O request requested by a host,
A plurality of the disk devices constituting a RAID;
When one of the plurality of disk devices fails, the data of the disk device other than the failed disk device is read, and the operation of writing the data to the spare disk device or the new disk device is executed in multiple times, A controller that executes rebuild or copyback processing for reconstructing the RAID configuration,
The controller is
A RAID control module that prioritizes the normal I / O request and the rebuild / copyback request once and executes the request at a predetermined ratio;
A rebuild / copyback module that issues a next rebuild / copyback request with reference to a progress table that manages the progress of the rebuild / copyback processing in response to the completion of the rebuild / copyback request processing. And
The RAID control module records the processing completion time of the normal I / O request every time processing of the normal I / O request is completed, and compares the processing completion time with the current time to determine whether the normal I / O request is Determine if it will come within the specified time,
The rebuild / copy back module inquires the determination result to the RAID control module in response to the completion of the rebuild / copy back request processing , and sets the request processing size of the rebuild or copy back processing once to the normal I / If the O request does not arrive within a predetermined time, from when the normal I / O request has arrived within a predetermined period of time, is set larger, once the request of the rebuild / copy back, the RAID control module A RAID system characterized by being issued to.
前記コントローラは、前記ディスク装置のデータの一部を格納するキャッシュメモリを有し、
ホストからのI/O要求の内、前記キャッシュメモリを利用できないI/O要求を、前記通常I/O要求として、前記RAID制御モジュールに要求する
ことを特徴とする請求項1のRAIDシステム。
The controller has a cache memory for storing a part of the data of the disk device,
2. The RAID system according to claim 1, wherein an I / O request that cannot use the cache memory is requested from the host to the RAID control module as the normal I / O request.
前記リビルド/コピーバックモジュールは、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間以内に到来しない場合には、前記通常I/O要求が所定時間以内に到来した場合の処理サイズの倍数に設定する
ことを特徴とする請求項1のRAIDシステム。
The rebuild / copy back module sets the request processing size for one rebuild or copy back process within a predetermined time when the normal I / O request does not arrive within a predetermined time. The RAID system according to claim 1, wherein the RAID system is set to a multiple of the processing size when it arrives.
コントローラが、ホストから依頼されたI/O要求に応じて、接続されたディスク装置をアクセスし、I/O要求を実行するRAIDシステムのリビルド/コピーバック処理方法において、
RAIDを構成する複数の前記ディスク装置の1つが故障した場合に、故障したディスク装置以外のディスク装置のデータをリードし、予備ディスク装置又は新ディスク装置にデータをライトする動作を複数回に別けて実行して、RAID構成を再構築するリビルド又はコピーバック処理を実行するステップと、
RAID制御モジュールにより、通常I/O要求の処理完了時刻を、前記通常I/O要求の処理完了毎に記録し、前記処理完了時刻と現在時刻とを比較して、前記ホストからのI/O要求を含む通常I/O要求が所定時間以内に来ないかを判定するステップと、
RAID制御モジュールにより、前記通常I/O要求と前記リビルド/コピーバックの1回の要求とを、優先度に応じて、所定比で、実行するステップとを有し、
前記リビルド/コピーバック処理の実行ステップは、
リビルド/コピーバックモジュールにより、リビルド/コピーバック要求の処理完了に応じて、前記リビルド/コピーバック処理の進捗状況を管理する進捗テーブルを参照して、次のリビルド/コピーバック要求の生成を開始するステップと、
前記リビルド/コピーバックモジュールが、前記リビルド/コピーバック要求の処理完了に応じて、前記RAID制御モジュールに前記判定結果を問い合わせ、前記リビルド又はコピーバック処理の1回の要求処理サイズを、通常I/O要求が所定時間以内に到来しない場合には、前記通常I/O要求が所定時間以内に到来した場合より、大きく設定して、前記リビルド/コピーバックの1回の要求を、前記RAID制御モジュールに発行するステップとを有する
ことを特徴とするRAIDシステムのリビルド/コピーバック処理方法。
In a rebuild / copyback processing method of a RAID system in which a controller accesses a connected disk device in response to an I / O request requested from a host and executes the I / O request.
When one of the plurality of disk devices constituting the RAID fails, the operation of reading the data of the disk device other than the failed disk device and writing the data to the spare disk device or the new disk device is divided into multiple times. Performing a rebuild or copyback process to reconstruct the RAID configuration; and
The RAID control module records the processing completion time of the normal I / O request every time the processing of the normal I / O request is completed, compares the processing completion time with the current time, and receives the I / O from the host. Determining whether a normal I / O request including the request does not come within a predetermined time;
A step of executing the normal I / O request and the one rebuild / copy back request at a predetermined ratio according to priority by a RAID control module;
The execution step of the rebuild / copyback process includes:
When the rebuild / copy back request is completed, the rebuild / copy back module refers to the progress table that manages the progress of the rebuild / copy back process and starts generating the next rebuild / copy back request. Steps,
The rebuild / copy back module inquires the determination result to the RAID control module upon completion of processing of the rebuild / copy back request , and sets the request processing size of one time of the rebuild or copy back processing to the normal I / If the O request does not arrive within a predetermined time, from when the normal I / O request has arrived within a predetermined period of time, is set larger, once the request of the rebuild / copy back, the RAID control module A rebuild / copyback processing method for a RAID system.
前記コントローラが、ホストからのI/O要求の内、前記ディスク装置のデータの一部を格納するキャッシュメモリを利用できないI/O要求を、前記通常I/O要求として、前記RAID制御モジュールに要求するステップを更に有する
ことを特徴とする請求項4のRAIDシステムのリビルド/コピーバック処理方法。
The controller requests, as the normal I / O request, the RAID control module for an I / O request that cannot use the cache memory for storing a part of the data of the disk device among the I / O requests from the host. The RAID system rebuild / copyback processing method according to claim 4, further comprising: a step of:
JP2005286926A 2005-09-30 2005-09-30 RAID system and rebuild / copyback processing method thereof Expired - Fee Related JP4817783B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2005286926A JP4817783B2 (en) 2005-09-30 2005-09-30 RAID system and rebuild / copyback processing method thereof
US11/361,583 US7631218B2 (en) 2005-09-30 2006-02-23 RAID system and Rebuild/Copy back processing method thereof
CNB2006100547574A CN100432914C (en) 2005-09-30 2006-03-10 RAID system and rebuild/copy back processing method thereof
KR1020060022703A KR100793531B1 (en) 2005-09-30 2006-03-10 Raid system and rebuild/copy back processing method therof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005286926A JP4817783B2 (en) 2005-09-30 2005-09-30 RAID system and rebuild / copyback processing method thereof

Publications (2)

Publication Number Publication Date
JP2007094994A JP2007094994A (en) 2007-04-12
JP4817783B2 true JP4817783B2 (en) 2011-11-16

Family

ID=37949488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005286926A Expired - Fee Related JP4817783B2 (en) 2005-09-30 2005-09-30 RAID system and rebuild / copyback processing method thereof

Country Status (4)

Country Link
US (1) US7631218B2 (en)
JP (1) JP4817783B2 (en)
KR (1) KR100793531B1 (en)
CN (1) CN100432914C (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378093B2 (en) 2013-04-25 2016-06-28 Globalfoundries Inc. Controlling data storage in an array of storage devices

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4815825B2 (en) * 2005-03-10 2011-11-16 日本電気株式会社 Disk array device and method for reconstructing the same
US9384818B2 (en) 2005-04-21 2016-07-05 Violin Memory Memory power management
US8200887B2 (en) 2007-03-29 2012-06-12 Violin Memory, Inc. Memory management system and method
US20070290444A1 (en) * 2005-12-14 2007-12-20 Moses Daniel J Blackjack game with side bet wager
US8819363B2 (en) 2008-02-12 2014-08-26 Fujitsu Limited Data copying method
US20090204775A1 (en) * 2008-02-12 2009-08-13 Fujitsu Limited Data copying method
JP2010009442A (en) * 2008-06-30 2010-01-14 Fujitsu Ltd Disk array system, disk controller, and its reconstruction processing method
US8006128B2 (en) * 2008-07-31 2011-08-23 Datadirect Networks, Inc. Prioritized rebuilding of a storage device
JP2010033481A (en) * 2008-07-31 2010-02-12 Fujitsu Ltd Virtualized switch and computer system
JP5409159B2 (en) 2009-07-23 2014-02-05 キヤノン株式会社 Information processing apparatus, information processing apparatus control method, and program
JP2011070395A (en) * 2009-09-25 2011-04-07 Canon Inc Memory controller, memory control method and program
CN101770413B (en) * 2010-01-07 2013-03-20 杭州华三通信技术有限公司 Method and equipment for rebuilding redundant disk array
JP2012018481A (en) * 2010-07-06 2012-01-26 Fujitsu Ltd Disk array apparatus and method for controlling disk array
JP5640572B2 (en) 2010-09-01 2014-12-17 富士通株式会社 Information processing apparatus, information processing program, and copy processing method
US20120110244A1 (en) * 2010-11-02 2012-05-03 Micron Technology, Inc. Copyback operations
JP5807458B2 (en) * 2011-08-31 2015-11-10 富士通株式会社 Storage system, storage control device, and storage control method
JP5744244B2 (en) * 2011-10-19 2015-07-08 株式会社日立製作所 Storage system
CN102520880B (en) * 2011-12-01 2014-11-05 浪潮电子信息产业股份有限公司 System raid management module design method
JP2013164820A (en) * 2012-02-13 2013-08-22 Fujitsu Ltd Evaluation support method, evaluation support program, and evaluation support apparatus
JP2014096072A (en) 2012-11-09 2014-05-22 International Business Maschines Corporation Disk array having mirror configuration and rebuild method of the same
CN103902232B (en) * 2012-12-28 2018-11-09 联想(北京)有限公司 A kind of method and device of the data of write-in
JP6171616B2 (en) * 2013-06-24 2017-08-02 富士通株式会社 Storage control device and storage control program
US9323630B2 (en) 2013-09-16 2016-04-26 HGST Netherlands B.V. Enhanced data recovery from data storage devices
JP5734469B2 (en) * 2014-01-15 2015-06-17 キヤノン株式会社 MEMORY CONTROL DEVICE, MEMORY CONTROL METHOD, AND PROGRAM
JP6233279B2 (en) * 2014-11-07 2017-11-22 コニカミノルタ株式会社 Image forming apparatus, control program for image forming apparatus, and controller
CN104461791B (en) * 2014-11-28 2017-02-01 华为技术有限公司 Information processing method and device
JP6299617B2 (en) 2015-01-27 2018-03-28 コニカミノルタ株式会社 Image forming apparatus, image forming apparatus control program, controller, and controller control program
JP6228347B2 (en) 2015-02-25 2017-11-08 株式会社日立製作所 Storage apparatus and storage device
CN105117172B (en) * 2015-08-31 2019-04-02 深圳神州数码云科数据技术有限公司 A kind of disk array history falls the store method of disk record
KR102631351B1 (en) 2016-10-07 2024-01-31 삼성전자주식회사 Storage device capable of performing peer-to-peer communication and data storage system including the same
KR20180045220A (en) 2016-10-25 2018-05-04 삼성전자주식회사 Data storage system for implementing data rebuild operation with reduced read request
CN107577551A (en) * 2017-09-06 2018-01-12 郑州云海信息技术有限公司 A kind of solid state disk write fail processing method and system
CN107705388A (en) * 2017-09-13 2018-02-16 陕西千山航空电子有限责任公司 A kind of protection logger based on RapidIO buses
CN110704248B (en) * 2019-09-04 2023-01-10 苏州浪潮智能科技有限公司 Disk array reconstruction method and device with adjustable speed and electronic equipment
CN111880962B (en) * 2020-07-24 2022-06-10 北京浪潮数据技术有限公司 RAID reconstruction speed control method, system and device

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US695096A (en) * 1901-08-19 1902-03-11 Jacques P Faivre Broiler.
US5274799A (en) * 1991-01-04 1993-12-28 Array Technology Corporation Storage device array architecture with copyback cache
US5802264A (en) * 1991-11-15 1998-09-01 Fujitsu Limited Background data reconstruction in a storage device array system
US5537566A (en) 1991-12-17 1996-07-16 Fujitsu Limited Apparatus and method for controlling background processing in disk array device
JP2548475B2 (en) * 1991-12-17 1996-10-30 富士通株式会社 Method of controlling data restoration amount of array disk device
JPH06250795A (en) 1993-02-24 1994-09-09 Hitachi Ltd Disk array system
US5455934A (en) * 1993-03-23 1995-10-03 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
US5446855A (en) * 1994-02-07 1995-08-29 Buslogic, Inc. System and method for disk array data transfer
US5708796A (en) * 1994-11-18 1998-01-13 Lucent Technologies Inc. Method of retrieving continuous and non-continuous media data from a file system
CA2201691C (en) * 1996-04-15 2001-07-17 Raju C. Bopardikar Data storage
US6185368B1 (en) * 1996-07-29 2001-02-06 Sony Corporation Redundant disk array with real-time lost data reconstruction
JP3552471B2 (en) * 1996-07-29 2004-08-11 ソニー株式会社 Data recording / reproducing apparatus and method
JPH11102261A (en) 1997-09-25 1999-04-13 Mitsubishi Electric Corp Storage control system
KR100250476B1 (en) 1997-12-23 2000-04-01 정선종 Method of fast system reconfiguration in raid level 5 system
US6336193B1 (en) * 1998-08-21 2002-01-01 International Business Machines Corporation Input/output recovery method which is based upon an error rate and a current state of the computer environment
JP4294142B2 (en) * 1999-02-02 2009-07-08 株式会社日立製作所 Disk subsystem
US6321345B1 (en) * 1999-03-01 2001-11-20 Seachange Systems, Inc. Slow response in redundant arrays of inexpensive disks
JP2000276305A (en) 1999-03-23 2000-10-06 Nec Corp Disk array device
KR100306477B1 (en) * 1999-10-26 2001-11-02 서평원 Structure of SCSI Related Tasks in the RDC and Operating Method Thereof
US6233967B1 (en) * 1999-12-03 2001-05-22 American Standard International Inc. Refrigeration chiller oil recovery employing high pressure oil as eductor motive fluid
JP3734662B2 (en) * 2000-02-16 2006-01-11 太陽誘電株式会社 Multilayer ceramic capacitor and manufacturing method thereof
US6647514B1 (en) * 2000-03-23 2003-11-11 Hewlett-Packard Development Company, L.P. Host I/O performance and availability of a storage array during rebuild by prioritizing I/O request
JP3453376B2 (en) * 2000-11-02 2003-10-06 松下電器産業株式会社 Mediation method, mediation device
US6886108B2 (en) * 2001-04-30 2005-04-26 Sun Microsystems, Inc. Threshold adjustment following forced failure of storage device
US6785788B1 (en) * 2001-07-03 2004-08-31 Unisys Corporation System and method for implementing an enhanced raid disk storage system
JP4972845B2 (en) * 2001-09-27 2012-07-11 富士通株式会社 Storage system
US6820172B2 (en) * 2002-03-25 2004-11-16 International Business Machines Corporation Method, system, and program for processing input/output (I/O) requests to a storage space having a plurality of storage devices
US7024586B2 (en) * 2002-06-24 2006-04-04 Network Appliance, Inc. Using file system information in raid data reconstruction and migration
JP4322068B2 (en) 2003-03-07 2009-08-26 富士通株式会社 Storage system and disk load balance control method thereof
GB2400935B (en) 2003-04-26 2006-02-15 Ibm Configuring memory for a raid storage system
US7143305B2 (en) * 2003-06-25 2006-11-28 International Business Machines Corporation Using redundant spares to reduce storage device array rebuild time
JP2005099995A (en) * 2003-09-24 2005-04-14 Fujitsu Ltd Disk sharing method and system of magnetic disk unit
KR100505178B1 (en) * 2003-09-24 2005-08-03 매크로임팩트 주식회사 Method and apparatus for selective address translation according to the state of a shared logical volume
US7313721B2 (en) * 2004-06-21 2007-12-25 Dot Hill Systems Corporation Apparatus and method for performing a preemptive reconstruct of a fault-tolerant RAID array

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378093B2 (en) 2013-04-25 2016-06-28 Globalfoundries Inc. Controlling data storage in an array of storage devices

Also Published As

Publication number Publication date
CN100432914C (en) 2008-11-12
KR100793531B1 (en) 2008-01-14
KR20070037289A (en) 2007-04-04
US7631218B2 (en) 2009-12-08
CN1940849A (en) 2007-04-04
US20070088976A1 (en) 2007-04-19
JP2007094994A (en) 2007-04-12

Similar Documents

Publication Publication Date Title
JP4817783B2 (en) RAID system and rebuild / copyback processing method thereof
JP4472617B2 (en) RAID system, RAID controller and rebuild / copy back processing method thereof
JP6074056B2 (en) Computer system and data control method
US7093043B2 (en) Data array having redundancy messaging between array controllers over the host bus
US6957303B2 (en) System and managing method for cluster-type storage
JP4413184B2 (en) Data storage system and data storage control device
US11157376B2 (en) Transfer track format information for tracks in cache at a primary storage system to a secondary storage system to which tracks are mirrored to use after a failover or failback
JP7135162B2 (en) Information processing system, storage system and data transfer method
JP2006244123A (en) Data storage system and data storage control device
JP4401305B2 (en) Configuration definition setting method of disk array device and disk array device
JP2007122476A (en) Data storage system, data storage controller, and write failure diagnosis method for its disk
US20110282963A1 (en) Storage device and method of controlling storage device
JP2009053946A (en) Block device controller with duplex controller configuration
US7426658B2 (en) Data storage system and log data equalization control method for storage control apparatus
US20120017057A1 (en) Data copying device, method for copying data and data storage device
JP6825263B2 (en) Storage controller and storage system
JP3793544B2 (en) Disk array device and control method thereof
JP3250859B2 (en) Disk array device, computer system and data storage device
JP2004164171A (en) Path redundancy device and method
JP2012194867A (en) Storage device and control device
JP4452697B2 (en) Disk array controller
JP4571963B2 (en) Disk array controller
JP2003263278A (en) Disk array control apparatus
JP2005215722A (en) Disk array device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091013

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100527

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100610

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20100702

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110830

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140909

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4817783

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees