JP2009059280A - Storage control system - Google Patents
Storage control system Download PDFInfo
- Publication number
- JP2009059280A JP2009059280A JP2007227711A JP2007227711A JP2009059280A JP 2009059280 A JP2009059280 A JP 2009059280A JP 2007227711 A JP2007227711 A JP 2007227711A JP 2007227711 A JP2007227711 A JP 2007227711A JP 2009059280 A JP2009059280 A JP 2009059280A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage
- storage devices
- client
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、各種データを蓄積する複数のストレージデバイスからなり、RAID機能によって耐障害性を向上したストレージ装置に関し、特にリアルタイムアプリケーション実行時における耐障害性を向上したストレージ制御方式に関する。 The present invention relates to a storage apparatus that includes a plurality of storage devices that accumulate various data and has improved fault tolerance through a RAID function, and more particularly to a storage control method that has improved fault tolerance during execution of a real-time application.
アプリケーションやデータが急速に増大するにしたがって、データ蓄積するストレージデバイスの容量も益々大きくなってきた。このような状況下で、ストレージデバイスに障害が発生すると、失われたデータの損失も大きいが、業務の中断、復旧作業のコストも甚大なものとなる。RAID(Redundant Arrays Independent Disks)技術による耐障害性の向上は、こうしたストレージデバイスの障害によるシステムのダウンを回避する方式の一つとして提案されている。 As applications and data have increased rapidly, the capacity of storage devices for storing data has increased. Under such circumstances, when a failure occurs in the storage device, the loss of lost data is large, but the cost of business interruption and recovery work is also significant. Improvement of fault tolerance by RAID (Redundant Arrays Independent Disks) technology has been proposed as one of methods for avoiding system down due to such a storage device failure.
複数のストレージデバイスからなり、RAID機能を有する従来技術として特許文献1に記載されたものがある。特許文献1に記載されたストレージ装置は、複数のストレージデバイスの一つにCRCエラー又はパリティエラーが発生した場合に当該エラーが発生したストレージデバイスを切り離して系の切り替えを行い、残りのストレージデバイスのパリティ情報からエラーが発生したストレージデバイスのデータの復元を行うようにしたものである。
There is one described in
従来のストレージ装置は、CRCエラー又はパリティエラーの発生を契機としてRAID機能でデータ復元するものである。しかし、このようなエラーが発生するには至らない障害がストレージデバイスに発生した場合、例えば、データが破壊されるまでには至っていないが、磁気情報の弱化によりデータを読み出すために数回のシークを必要とするような障害が発生した場合、必要とされるデータレートが得られず、リアルタイム性が重要とされる高ビットレート映像アプリケーションなどのリアルタイムアプリケーションではデータ転送が間に合わず、映像遅延、フレーム落ち、デコードチップのハングアップなどが発生し、正常な映像上映が継続できないという問題があった。 A conventional storage apparatus restores data using a RAID function when a CRC error or a parity error occurs. However, when a failure that does not lead to such an error occurs in the storage device, for example, the data has not been destroyed, but several seeks are required to read the data due to weakening of magnetic information. If a failure that requires a high-speed video occurs, the required data rate cannot be obtained, and real-time applications such as high bit-rate video applications where real-time performance is important will not be able to transfer data in time. There was a problem that normal video screening could not be continued due to falling down and decoding chip hanging.
本発明は、上記のような従来の問題点に鑑みてなされたものであり、データが破壊されるまでには至っていない障害発生を検知することにより、リアルタイム性が要求されるアプリケーションに対してもRAID機能で継続してアプリケーションが実行可能なストレージ方式を提供することを目的としている。 The present invention has been made in view of the above-described conventional problems, and can detect an occurrence of a failure that has not led to destruction of data, thereby enabling an application that requires real-time performance. An object of the present invention is to provide a storage system in which an application can be continuously executed by a RAID function.
本発明におけるストレージ制御方式は、データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスが蓄積するデータの読み出しを要求するクライアント、このクライアントの上記読み出し要求に基づき、上記複数のストレージデバイスから順次データを読み出して上記クライアントへ送出するストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ読み出し処理速度を監視し、規定された読み出し処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によって上記クライアントへデータを送出するように構成したものである。 The storage control method according to the present invention comprises a plurality of storage devices that store data, and has a RAID function, a client that requests reading of data stored in the plurality of storage devices, and the read request of the client. A storage control unit that sequentially reads data from the plurality of storage devices and sends the data to the client, the storage device control unit monitoring a data read processing speed of each of the plurality of storage devices, and a prescribed read processing speed When a storage device that falls below is detected, the storage device is disconnected and data is sent to the client by the RAID function of another storage device.
また、本発明におけるストレージ制御方式は、データを蓄積する複数のストレージデバイスからなり、RAID機能を有するストレージ装置、上記複数のストレージデバイスへ蓄積するデータの書き込みを要求するクライアント、このクライアントの上記書き込み要求に基づき、上記複数のストレージデバイスへ順次データを書き込むストレージ制御部を備え、該ストレージデバイス制御部は上記複数のストレージデバイス各々のデータ書き込み処理速度を監視し、規定された書き込み処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離すように構成したものである。 The storage control method according to the present invention comprises a plurality of storage devices that store data, and has a RAID function, a client that requests writing of data to be stored in the plurality of storage devices, and the write request of this client. A storage controller that sequentially writes data to the plurality of storage devices, the storage device controller monitoring the data write processing speed of each of the plurality of storage devices, and a storage that falls below the prescribed write processing speed When a device is detected, the storage device is configured to be disconnected.
本発明によれば、複数のストレージデバイス各々のデータ読み出し処理速度を監視し、規定された読み出し処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離し、他のストレージデバイスによるRAID機能によってクライアントへデータを送出するようにしたので、リアルタイム性が要求されるアプリケーションに対してもRAID機能で継続してアプリケーションを実行することができる効果がある。 According to the present invention, the data read processing speed of each of a plurality of storage devices is monitored, and when a storage device that has fallen below the specified read processing speed is detected, the storage device is disconnected, and a RAID function by another storage device is used. Since data is transmitted to the client, there is an effect that the application can be continuously executed by the RAID function even for an application that requires real-time performance.
また、本発明によれば、複数のストレージデバイス各々のデータ書き込み処理速度を監視し、規定された書き込み処理速度を下回ったストレージデバイスを検知した場合、当該ストレージデバイスを切り離すようにしたので、リアルタイム処理が必要なアプリケーションにおいて高速のデータ書き込みができる効果がある。 In addition, according to the present invention, the data writing processing speed of each of the plurality of storage devices is monitored, and when a storage device that falls below the prescribed writing processing speed is detected, the storage device is disconnected. This has the effect of enabling high-speed data writing in applications that require high speed.
実施の形態1.
以下、本発明の実施の形態1を図について説明する。図1は本発明の実施の形態1に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。図において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。101〜105は上記ストレージデバイス1〜5に各々対応して設けられたデータバッファであり、ストレージデバイス1〜5から読み出されるデータを一次蓄積する。201はストレージデバイス1〜5およびデータバッファ101〜105を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
次に、この実施の形態1に係るストレージ制御方式の動作について説明する。ストレージデバイス101〜105には画像データ等が蓄積されており、クライアント301はストレージデバイス101〜105に蓄積された画像データを読み出して、例えば映像装置によってリアルタイムに画像表示させるように構成される。
Next, the operation of the storage control method according to the first embodiment will be described. Image data and the like are stored in the
即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。前出のデータ読み込みコマンドにしたがって該当するストレージデバイス1〜5から読み出されたデータはデータバッファ101〜105に蓄積される。データバッファ101〜105に一次蓄積されたデータはアプリケーションが要求する読み出し応答速度で順次クライアント301に読み出され、アプリケーションが実行される。ストレージ制御部201はデータバッファ101〜105を監視するとともに、前出のデータ読み出しコマンドに対するストレージデバイス1〜5の読み出し応答速度が、データバッファ101〜105からクライアント301への読み出し速度を下回ることがないように管理する。
That is, the
以下、障害発生時におけるリカバリー手順を図2にしたがって説明する。いま、図1における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データバッファ102からクライアント301への読み出し速度を下回るようになると一次蓄積しているデータ残量が減少して行くことになる。ストレージ制御部201はデータバッファ101〜105のデータ残量を監視しており(ST11、ST12)、データバッファ102の前出しのデータ残量が規定の残量を下回るとデータバッファ102に対応したストレージデバイス2に障害が発生したものと判断し、ストレージデバイス2の切り離し処理を実行する(ST13)。
Hereinafter, the recovery procedure when a failure occurs will be described with reference to FIG. Now, assume that a failure such as weakening of magnetic information occurs in the
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST14)、図1の下図のようにアプリケーションの実行を継続する(ST15)。
The
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
For example, if the storage device has a function conforming to
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
In addition, by combining RAID1 and RAID5 or RAID6, the system is switched by RAID1 when a failure occurs, then the
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。 As described above, in an application that requires real-time processing, the storage device can be disconnected and data can be recovered so that the processing is not affected.
実施の形態2.
以下、本発明の実施の形態2を図について説明する。図3は本発明の実施の形態2に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態2のストレージ制御方式は各ストレージデバイス1〜5からの読み出しが同期している実施の形態である。即ち、1読み出し単位ごとに各ストレージデバイス1〜5から必要なデータ読み出しが全て完了するまで、次のデータ読み出しを行わない方式を採用した実施の形態である。
The second embodiment of the present invention will be described below with reference to the drawings. FIG. 3 is a block diagram showing the storage control method according to the second embodiment of the present invention, where the upper diagram shows the state at the time of failure occurrence and the lower diagram shows the state at the time of failure recovery. The storage control method according to the second embodiment is an embodiment in which reading from the
図において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。101〜105は上記ストレージデバイス1〜5に各々対応して設けられたデータバッファであり、ストレージデバイス1〜5から読み出されるデータを一次蓄積する。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数を計数するカウンタ、201は上記ストレージデバイス1〜5、データバッファ101〜105及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
In the figure,
次に、この実施の形態2に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。このとき、各ストレージデバイス1〜5からの読み出しは同期しているので、1読み出し単位ごとに各ストレージデバイス1〜5から必要なデータ読み出しが全て完了すると、次の読み出し単位の読み出しが実行されることになる。
Next, the operation of the storage control method according to the second embodiment will be described. That is, the
前出のデータ読み込みコマンドにしたがってストレージデバイス1〜5から読み出されたデータはデータバッファ101〜105に蓄積される。データバッファ101〜105に一次蓄積されたデータはアプリケーションが要求する読み出し応答速度で順次クライアント301に読み出され、アプリケーションが実行される。ストレージ制御部201はデータバッファ101〜105の何れかを監視するとともに、前出のデータ読み出しコマンドに対するストレージデバイス1〜5の読み出し応答速度が、データバッファ101〜105からクライアント301への読み出し速度を下回ることがないように管理する。
Data read from the
また、カウンタ401〜405は対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数をカウントするものであり、具体的には読み出しコマンド発行時にスタートし、読み出し完了の応答が帰ったときにリセットを行う計数手段を有し、ある計数値のときにNOT回路を組み合わせ、計数手段の出力とAND出力が出るように回路を組み、その出力の回数をカウントするように構成したものである。
The
以下、障害発生時におけるリカバリー手順を図4にしたがって説明する。いま、図3における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データバッファ102からクライアント301への読み出し速度を下回るようになると一次蓄積しているデータ残量が減少して行くことになる。さらに、各ストレージデバイス1〜5の読み出しは同期しているので、他のストレージデバイス1、3〜5はストレージデバイス2の読み出し完了を待って次の読み出し単位を読み出すことになるので、データバッファ101、103〜105のデータ残量も減少して行く。
Hereinafter, the recovery procedure when a failure occurs will be described with reference to FIG. Now, as shown in the upper diagram of FIG. 3, it is assumed that a failure such as weakening of magnetic information occurs in the
ストレージ制御部201はデータバッファ101〜105の何れかのデータ残量を監視しており(ST21、ST22)、何れかのデータバッファの前出しデータ残量が規定の残量を下回ると何れかのストレージデバイス1〜5に障害が発生したものと判断する。そして、各カウンタ401〜405の計数値を参照して計数値が最大のもの、例えば、時間平均で一番計数値の大きいカウンタに対応したストレージデバイスを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、それに対応したストレージデバイス2が異常と判断し、ストレージデバイス2の切り離し処理を実行する(ST23)。
The
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST24)、図3の下図のようにアプリケーションの実行を継続する(ST25)。
The
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
For example, if the storage device has a function conforming to
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
In addition, by combining RAID1 and RAID5 or RAID6, the system is switched by RAID1 when a failure occurs, then the disconnected
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。 As described above, in an application that requires real-time processing, the storage device can be disconnected and data can be recovered so that the processing is not affected.
なお、上記実施の形態2では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
In the second embodiment, one
また、上記実施の形態2では、データバッファ101〜105に一次蓄積されているデータ残量が規定の残量を下回ったときに、カウンタ401〜405の計数値を参照して障害が発生しているストレージデバイスを判断するものとしているが、ストレージ制御部201が所定のタイミングでカウンタ401〜405の計数値を参照し、障害が発生しているストレージデバイスを判断するようにしてもよい。この場合、ストレージ制御部201がカウンタ401〜405の計数値を参照するタイミングは、ストレージ制御部201が何らかの異常の兆候を検知したときに行う。
In the second embodiment, when the remaining amount of data temporarily stored in the data buffers 101 to 105 falls below a prescribed remaining amount, a failure occurs with reference to the count values of the
さらに、ストレージ制御部201が常時カウンタ401〜405の計数値を監視するものとし、計数値が規定値を超えたもの、あるいは所定の時間平均で計数値の最大のカウンタ401〜405に対応したストレージデバイス1〜5を障害が発生しているストレージデバイスと判断するようにしてもよい。
Further, it is assumed that the
実施の形態3.
以下、本発明の実施の形態3を図について説明する。図5は本発明の実施の形態3に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態3に係るストレージ制御方式はデータバッファを介在しないデータ読み込みを行うストレージ制御方式である。
Hereinafter, a third embodiment of the present invention will be described with reference to the drawings. FIG. 5 is a block diagram showing a storage control system according to the third embodiment of the present invention. The upper diagram shows a state when a failure occurs, and the lower diagram shows a state when the failure is recovered. The storage control method according to the third embodiment is a storage control method for reading data without interposing a data buffer.
図5において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の読み出しコマンドに対する応答処理時間が規定の時間を上回った回数を計数するカウンタ、201はストレージデバイス1〜5及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してリードコマンドを送信し、ストレージデバイス101〜105に蓄積されたデータの読み出しを要求するクライアントである。
In FIG. 5,
次に、この実施の形態3に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してリードコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してリードコマンドが指定するデータが格納されたストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データバッファ101〜105へのデータ読み込みを指示する。
Next, the operation of the storage control method according to the third embodiment will be described. That is, the
データ読み出しコマンドにしたがってストレージデバイス1〜5から読み出されたデータは順次クライアント301に読み出され、アプリケーションが実行される。
The data read from the
以下、障害発生時におけるリカバリー手順を説明する。いま、図5における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを読み出すために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで読み出し応答速度が低下し、データの読み出し量が低下する。
Hereinafter, a recovery procedure when a failure occurs will be described. Now, as shown in the upper diagram of FIG. 5, it is assumed that a failure such as weakening of magnetic information occurs in the
ストレージ制御部201はストレージデバイス1〜5からの例えばLBA(Logical Block Addressing)数などに代表される読み出し処理済サイズと経過時間(単位時間当たりのタイマー処理としてもよい)から読み出し処理速度を算出し、その処理速度が規定された処理速度を下回ったストレージデバイス2を異常と判断する。以下、具体的にストレージデバイス1〜5の障害を検知する手順を図6に従って説明すると、ストレージ制御部201はデータ読み込みコマンドに対する応答時間が規定された時間を上回った回数が計数されるカウンタ401〜405を参照し、ストレージデバイス1〜5のうち、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数が、例えば、時間平均で最大のものを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、対応するストレージデバイス2を切り離す(ST31)。
The
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスからデータを読み出すことによりリカバリーを行い(ST32)、図5の下図のようにアプリケーションの実行を継続する(ST33)。
The
また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に記録されたデータのパリティー情報から切り離したストレージデバイス2に蓄積していたデータを復元することによりリカバリーを行い、アプリケーションの実行を継続する。
For example, if the storage device has a function conforming to
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
In addition, by combining RAID1 and RAID5 or RAID6, the system is switched by RAID1 when a failure occurs, then the disconnected
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。 As described above, in an application that requires real-time processing, the storage device can be disconnected and data can be recovered so that the processing is not affected.
なお、上記実施の形態3では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ読み込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
In the third embodiment, one
実施の形態4.
以下、本発明の実施の形態4を図について説明する。図7は本発明の実施の形態4に係るストレージ制御方式を示すブロック図であり、上図が障害発生時の状態であり、下図が障害復旧時の状態を示す。この実施の形態4に係るストレージ制御方式はストレージデバイスへの書き込み時におけるストレージ制御方式である。
図7において、1〜5は画像データ等のファイルを蓄積するストレージデバイスであり、RAID機能を構築するストレージデバイスである。401〜405は上記ストレージデバイス101〜105に各々対応して設けられ、対応するストレージデバイス101〜105の書き込みコマンドに対する応答処理時間が規定の時間を上回った回数をカウントするカウンタ、201はストレージデバイス1〜5及びカウンタ401〜405を制御するストレージ制御部、301はストレージ制御部201に対してライトコマンドを送信し、ストレージデバイス101〜105にデータの書き込みを要求するクライアントである。
In FIG. 7,
次に、この実施の形態4に係るストレージ制御方式の動作について説明する。即ち、クライアント301はストレージ制御部201に対してライトコマンドを発行し、それにしたがってストレージ制御部201はストレージデバイス1〜5に対してライトコマンドが指定するストレージデバイス1〜5に対して、例えばUDMA(Ultra Direct Memory Access)等のコマンドを発行し、データ書き込みを指示する。ストレージデバイス101〜105はRAID機能を構築するストレージ装置であるので、複数のストレージデバイス101〜105に対してRAID処理を行い、分散書き込みがなされる。
Next, the operation of the storage control method according to the fourth embodiment will be described. That is, the
以下、障害発生時におけるリカバリー手順を説明する。いま、図7における上図のようにストレージデバイス2に磁気情報の弱化等の障害が発生し、データを書き込むために数回のシークを必要とする事態が発生したとする。ストレージデバイス2は数回のシークを繰り返すことで書き込み応答速度が低下する。
Hereinafter, a recovery procedure when a failure occurs will be described. Now, as shown in the upper diagram of FIG. 7, it is assumed that a failure such as weakening of magnetic information occurs in the
ストレージ制御部201はストレージデバイス1〜5からの例えばLBA(Logical Block Addressing)数などに代表される書き込み処理済サイズと経過時間(単位時間当たりのタイマー処理としてもよい)から書き込み処理速度を算出し、その処理速度が規定された処理速度を下回ったストレージデバイス2を異常と判断する。即ち、ストレージ制御部201はデータ書き込みコマンドに対する応答時間が規定された時間を上回った回数が計数されるカウンタ401〜405を参照し、ストレージデバイス1〜5のうち、データ書き込みコマンドに対する応答時間が規定された時間を上回った回数が、例えば、時間平均で最大のものを一番多く遅延が発生した異常のあるストレージデバイスと判断する。ここでは、ストレージデバイス2に障害が発生しているので、カウンタ402の計数値が最大であり、対応するストレージデバイス2を切り離す。
The
ストレージデバイス1〜5はRAID機能を具備しており、ストレージ制御部201はストレージデバイス2の切り離し処理後、例えば、RAID1に準じた機能が存在するストレージ装置であれば他方の系のストレージデバイスに書き込みを続ける。また、例えばRAID5又は6に準じた機能が存在するストレージ装置であれば、残りのストレージデバイス1、3〜5に対してパリティ演算を行いつつ、切り離したストレージデバイス2に書き込みを行わず書き込みを続ける。
The
また、RAID1とRAID5又はRAID6とを組み合わせることにより、障害発生時にRAID1による系切り替えを行い、その後切り離されたストレージデバイス2の交換を実施し、RAID5又はRAID6による復旧機能で復旧を実施する等の運用も可能である。
In addition, by combining RAID1 and RAID5 or RAID6, the system is switched by RAID1 when a failure occurs, then the disconnected
以上により、リアルタイム処理が必要なアプリケーションにおいて、処理に影響がないようにストレージデバイスを切り離し、データのリカバリーが実施可能となる。 As described above, in an application that requires real-time processing, the storage device can be disconnected and data can be recovered so that the processing is not affected.
なお、上記実施の形態4では、各ストレージデバイス1〜5に各々対応して1つのカウンタ401〜405を設けているが、データ書き込みコマンドに対する応答時間が規定された時間を上回った回数がカウントされるカウンタをストレージデバイス1〜5ごとに複数持つ構成とし、各々短い規定の応答時間以上に応答時間がかかった回数を計数するカウンタと、長い規定の応答時間以上に応答時間がかかった回数を計数するカウンタとを設けた構成としてもよい。この場合、まず、長い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断するが、全てのカウンタの計数値が同じであったときに、短い応答時間のカウンタの計数値を比較して障害が発生しているストレージデバイス1〜5を判断することができ、さらに精度をあげて障害が発生しているストレージデバイス1〜5を判断することができる。
In the fourth embodiment, one
さらに、上記各実施の形態ではストレージデバイス1〜5を5台具備した形態を示しているが、これに限るものではない。
Furthermore, in each of the above-described embodiments, a configuration in which five
本発明は、RAID機能を有したストレージ装置であり、特にリアルタイム性が要求されるアプリケーションを実行するシステムに適用される。 The present invention is a storage apparatus having a RAID function, and is particularly applied to a system that executes an application that requires real-time performance.
1〜5 ストレージデバイス 101〜105 データバッファ 201 ストレージ制御部 301 クライアント 401〜405 カウンタ
1 to 5
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007227711A JP2009059280A (en) | 2007-09-03 | 2007-09-03 | Storage control system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007227711A JP2009059280A (en) | 2007-09-03 | 2007-09-03 | Storage control system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009059280A true JP2009059280A (en) | 2009-03-19 |
Family
ID=40554930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007227711A Pending JP2009059280A (en) | 2007-09-03 | 2007-09-03 | Storage control system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009059280A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224954A (en) * | 2009-03-24 | 2010-10-07 | Toshiba Corp | Storage device and logical disk management method |
JP2017010196A (en) * | 2015-06-19 | 2017-01-12 | 富士通株式会社 | Storage control device, storage control program, and storage control method |
CN112084060A (en) * | 2019-06-15 | 2020-12-15 | 国际商业机器公司 | Reducing data loss events in RAID arrays of different RAID levels |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651918A (en) * | 1992-08-03 | 1994-02-25 | Fujitsu Ltd | Semiconductor disk device |
JP2000148710A (en) * | 1998-11-05 | 2000-05-30 | Victor Co Of Japan Ltd | Dynamic image server system |
JP2002149500A (en) * | 2000-11-08 | 2002-05-24 | Matsushita Electric Ind Co Ltd | Hard disk device |
JP2004252692A (en) * | 2003-02-20 | 2004-09-09 | Nec Corp | Disk array device |
-
2007
- 2007-09-03 JP JP2007227711A patent/JP2009059280A/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0651918A (en) * | 1992-08-03 | 1994-02-25 | Fujitsu Ltd | Semiconductor disk device |
JP2000148710A (en) * | 1998-11-05 | 2000-05-30 | Victor Co Of Japan Ltd | Dynamic image server system |
JP2002149500A (en) * | 2000-11-08 | 2002-05-24 | Matsushita Electric Ind Co Ltd | Hard disk device |
JP2004252692A (en) * | 2003-02-20 | 2004-09-09 | Nec Corp | Disk array device |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010224954A (en) * | 2009-03-24 | 2010-10-07 | Toshiba Corp | Storage device and logical disk management method |
JP2017010196A (en) * | 2015-06-19 | 2017-01-12 | 富士通株式会社 | Storage control device, storage control program, and storage control method |
CN112084060A (en) * | 2019-06-15 | 2020-12-15 | 国际商业机器公司 | Reducing data loss events in RAID arrays of different RAID levels |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101689420B1 (en) | Apparatus, system, and method for power reduction management in a storage device | |
US8037362B2 (en) | Storage system that finds occurrence of power source failure | |
JP4651797B2 (en) | Backup system and duplication device | |
JP5958020B2 (en) | Storage system | |
US20080189466A1 (en) | Storage system and control method thereof | |
CN1300696C (en) | Memory controller and data storage method | |
JP2004038290A (en) | Information processing system and disk control method for use in same system | |
JP2011170589A (en) | Storage control device, storage device, and storage control method | |
EP1191431A2 (en) | Data storage array apparatus and method of operation | |
JP2009059280A (en) | Storage control system | |
TW201423582A (en) | SAS expanders switching system and method | |
JP6540202B2 (en) | INFORMATION PROCESSING SYSTEM, CONTROL DEVICE, AND CONTROL PROGRAM | |
JP4775843B2 (en) | Storage system and storage control method | |
JP2006031332A (en) | Disk array control program, method and device | |
JP2022017216A (en) | Storage system with disaster recovery function and its operation method | |
JPH1195933A (en) | Disk array system | |
JP2005122763A (en) | Storage device | |
KR101420286B1 (en) | Semiconductor storage device based cache manager and the manufacturing method thereof | |
US9798473B2 (en) | Storage volume device and method for increasing write speed for data streams while providing data protection | |
JP2007334764A (en) | Nas system and information processing method of nas system | |
JP2012174037A (en) | Disk array device and control method thereof | |
JPH08286844A (en) | Parity generation control method and disk controller | |
US20150074451A1 (en) | Memory system | |
JP2006318105A (en) | Monitoring system | |
WO2014108943A1 (en) | Disk array controller and server |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100910 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100921 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110308 |