JP5874175B2 - ディスクアレイ装置及びその制御方法 - Google Patents

ディスクアレイ装置及びその制御方法 Download PDF

Info

Publication number
JP5874175B2
JP5874175B2 JP2011048206A JP2011048206A JP5874175B2 JP 5874175 B2 JP5874175 B2 JP 5874175B2 JP 2011048206 A JP2011048206 A JP 2011048206A JP 2011048206 A JP2011048206 A JP 2011048206A JP 5874175 B2 JP5874175 B2 JP 5874175B2
Authority
JP
Japan
Prior art keywords
disk
control unit
sector
physical disk
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011048206A
Other languages
English (en)
Other versions
JP2012185670A (ja
Inventor
澤村 明寛
明寛 澤村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2011048206A priority Critical patent/JP5874175B2/ja
Publication of JP2012185670A publication Critical patent/JP2012185670A/ja
Application granted granted Critical
Publication of JP5874175B2 publication Critical patent/JP5874175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、冗長の物理ディスクを有することにより可用性を高めるRAID構成のディスクアレイ装置及びその制御方法に関する。
従来、冗長の物理ディスクによりボリュームを構成し、可用性を高めるRAID(Redundant Arrays of Independent Disks)構成のストレージ装置において、冗長の物理ディスクに障害が発生した場合、当該冗長の物理ディスクが冗長構成でなくなるデグレード状態となる。
一方、特許文献1には、物理ディスクのストライプ列によるRAIDグループの中により小さな単位の仮想的な複数個の論理区画単位により仮閉塞領域を設定し、上位からの命令受領から応答までの監視時間が所定時間を超えた場合に障害が発生したと判断し、該障害が発生した仮閉塞領域を仮閉塞するディスクアレイ装置が開示されている。
特開2005−276135号公報
デグレード状態から障害の発生した物理ディスクの交換によりボリュームを再構築するときに、障害が発生していない物理ディスクの潜在エラーが顕在化することがある。この場合、RAIDの冗長性が失われているため、ボリュームの再構築を継続できなくなり、結局、ボリューム内のデータが失われるという問題がある。かかる問題に対しては、特許文献1のように、障害が発生した仮閉塞領域を仮閉塞することで対応することが考えられる。
しかしながら、物理ディスクの障害には、物理ディスクのディスクプラッタ面の微小な欠損により部分的にアクセスができなくなるケースがあるところ、特許文献1のディスクアレイ装置は、いずれかの物理ディスクで障害が発生した後に障害管理のテーブルを参照して、他の物理ディスクからのデータ修復を行う構成であるため、実際に障害のあるディスクプラッタ面へのアクセスが発生し、ディスクプラッタ面の障害が拡散するおそれがある。
本発明は以上の点を考慮してなされたものであり、信頼性を向上させ得るディスクアレイ装置及びその制御方法を提案するものである。
かかる課題を解決するために本発明は、複数の物理ディスクにより構成されるボリュームに対して読書きするディスクアレイ装置であって、過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルと、前記テーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックし、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行う制御部とを備えることを特徴とする。
また、本発明は、複数の物理ディスクにより構成されるボリュームに対して読書きするディスクアレイ装置の制御方法であって、制御部が、過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックする第1のステップと、前記制御部が、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行う第2のステップとを備えることを特徴とする。
従って、エラーが物理ディスクのディスクプラッタ面上の欠陥によるものであった場合、この欠陥を含むセクタに繰り返し読書きすることによって欠陥が拡散するのを未然かつ有効に防止し、ストレージシステム全体の可用性を高めることができる。
具体的に、本発明は、コントローラ部5内に、論理ボリュームを構成する各ディスクの書き込み及び読み出しのエラーをセクタ単位に(リソース量を考慮して複数セクタとしても良い)管理するエラー履歴管理テーブル24を備える。
コントローラ部5は、論理ボリュームへのアクセス時には論理ボリュームを構成する冗長の物理ディスク装置7にアクセスするが、アクセス前に、エラー履歴管理テーブル24を参照し、アクセスしようとしている物理ディスク装置7のセクタにエラーの履歴があった場合、当該物理ディスク装置7のセクタのみアクセスを行わない。一方、コントローラ部5は、エラーの履歴がエラー履歴管理テーブル24に登録されていない場合、該当する物理ディスク装置7にアクセスを行うが、いずれかの物理ディスク装置7でエラーが発生した場合、そのディスクID及びエラーが発生したセクタ番号をエラー履歴管理テーブル24に登録する。
本発明によれば、信頼性を向上させ得るディスクアレイ装置及びその制御方法を実現することができる。
ストレージシステムのハードウェア構成を示すブロック図の一例である。 ストレージシステムの機能的構成を示すブロック図の一例である。 エラー履歴管理テーブルの説明に供する概念図の一例である。 データ書き込み処理手順を示すフローチャートの一例である。 データ書き込み処理手順を示すフローチャートの一例である。 データ読み出し処理手順を示すフローチャートの一例である。 データ読み出し処理手順を示すフローチャートの一例である。 他実施形態のエラー履歴管理テーブルの説明に供する概念図の一例である。
以下、本発明の一実施の形態を、図面を参照して詳細に説明する。なお、これにより本発明が限定されるものではない。
図1は、本実施の形態によるストレージシステム1のハードウェア構成の一例を示している。ストレージシステム1は、複数のホスト計算機2がネックワーク3を介してディスクアレイ装置4に接続されることにより構成されている。
ホスト計算機2は、例えば、CPU(Central Processing Unit)やメモリ等の情報処理資源、情報入力装置、情報出力装置を備えたコンピュータ装置である。ホスト計算機2は、例えば、書き込み要求をディスクアレイ装置4に送信して、対応するデータをディスクアレイ装置4に書き込む。また、ホスト計算機2は、例えば、読み出し要求をディスクアレイ装置4に送信し、対応するデータをディスクアレイ装置4から読み出す。
ネットワーク3は、例えば、LAN(Local Area Network)、SAN(Storage Area Network)、インターネット、専用回線、公衆回線等を場合に応じて適宜用いることができる。
ディスクアレイ装置4は、例えば、コントローラ部5及び記憶部6により構成されている。ディスクアレイ装置4は、コントローラ部5を最低1つ備えている。コントローラ部5は、当該ディスクアレイ装置4全体を制御する。記憶部6は、ホスト計算機2から受信したデータを格納する複数の物理ディスク装置7により構成されている。
コントローラ部5は、ホストインタフェース11、CPU12、メモリ13及びディスクインタフェース14により構成されている。ホストインタフェース11は、ホスト計算機2とネットワーク3を介して接続され、ホスト計算機2から受信した各種要求やデータの送受信を制御する。ホストインタフェース11は、ネットワーク3の種類に応じた種々のインタフェースを用いることができる。
CPU12は、コントローラ部5ごとに1つ備えられる。CPU12は、コントローラ部5全体を制御し、ホストインタフェース11から受信した各種要求を解釈して、各構成要素に指示を送信する。また、CPU12は、物理ディスク装置7に対してRAID(Redundant Arrays of Independent Disks)制御を行うことにより、ディスクアレイ装置4の信頼性、可用性及び性能を向上させる。この場合、CPU12は、1又は複数の物理ディスク装置7により提供される物理的な記憶領域(RAIDグループ)上に、1又は複数の論理ボリュームを設定する。そして、データは、この論理ボリューム内に所定の大きさのブロック単位で記憶される。
メモリ13は、ホスト計算機2から受信したデータを一時的に保持する。メモリ13は、コントローラ部5内部で使用する各種プログラムや、各種テーブルを保持する。ディスクインタフェース14は、記憶部6の物理ディスク装置7と接続され、ホスト計算機2から受信したデータの送受信を制御する。ディスクインタフェース14は、ファイバチャネル、SAS(Serial Attached SCSI)、SATA(Serial ATA)等の種類に応じた種々のインタフェースを用いることができる。
図2は、本実施形態のストレージシステム1の機能的構成の一例を示している。
コントローラ部5は、例えば、ホストインタフェース制御部21、RAID制御部22、複数のディスクR/W制御部23及びエラー履歴管理テーブル24により構成されている。ホストインタフェース制御部21は、ホストインタフェース11が対応して処理を行う。
RAID制御部22は、CPU12が対応して処理を行う。RAID制御部22は、ホストインタフェース制御部21から受信した論理ボリュームへの書き込み要求及び書き込み対象のデータに対し、冗長データを生成し、論理ボリュームのセクタ番号を、当該論理ボリュームを構成する各物理ディスク装置7のディスクID及びそれぞれの物理ディスク装置7上のセクタ番号に変換し、書き込み対象のデータ及び冗長データを、論理ボリュームを構成する各物理ディスク装置7に書き込む。
ただし、RAID制御部22は、物理ディスク装置7への書き込みにあたっては、エラー履歴管理テーブル24を検索し、書き込みを行おうとする物理ディスク装置7のセクタ番号のエラー履歴を確認し、エラー履歴の存在する物理ディスク装置7のセクタ番号に対しては実際の書き込み動作を行わない。また、RAID制御部22は、エラー履歴がなく書き込み動作を行った物理ディスク装置7のセクタ番号に対し、書き込み時にエラーが報告された場合、その物理ディスク装置7のディスク番号及びセクタ番号をエラー履歴管理テーブル24に追加登録する。
一方、RAID制御部22は、ホストインタフェース制御部21から受信した論理ボリュームへの読み出し要求に対し、論理ボリュームのセクタ番号を論理ボリュームを構成する物理ディスク装置7のディスクIDとそれぞれの物理ディスク装置7上のセクタ番号に変換し、論理ボリュームを構成する各物理ディスク装置7から読み出し対象のデータ及び冗長データを読み出す。RAID制御部22は、読み出し対象のデータ及び冗長データの検算を行い、データの誤りが検出された場合、データを修復したうえで読み出し対象のデータをホストインタフェース制御部21経由でホスト計算機2に返却する。
ただし、RAID制御部22は、物理ディスク装置7からの読み出しにあたっては、エラー履歴管理テーブル24を検索し、読み出しを行おうとする物理ディスク装置7のセクタ番号のエラー履歴を確認し、エラー履歴の存在する物理ディスク装置7のセクタ番号に対しては実際の読み出し動作を行わない。
複数のディスクR/W制御部23は、ディスクインタフェース14が対応して処理を行う。ディスクR/W制御部23は、書き込み要求又は読み出し要求に基づくディスクR/W指示により、対応する物理ディスク装置7に対する書き込み又は読み出し動作を行う。ディスクR/W制御部23は、書き込み又は読み出し動作時にエラーが発生した場合、その物理ディスク装置7のディスク番号とセクタ番号をエラー履歴管理テーブル24に追加登録する。
図3は、エラー履歴管理テーブル24の一例を示した図である。エラー履歴管理テーブル24は、過去の物理ディスク装置7に対するアクセスの失敗の履歴を記録及び管理するテーブルである。エラー履歴管理テーブル24は、エントリ番号、ディスクID、セクタ番号を対応付けて格納する。ディスクIDは、書き込み又は読み出し時にエラーが発生した物理ディスクの装置7のIDである。セクタ番号は、書き込み又は読み出し時にエラーが発生した物理ディスク装置7のセクタの番号である。
次に、本実施形態のストレージシステム1の動作について詳細に説明する。
図4及び図5は、本実施形態のストレージシステム1のデータ書き込み処理を示すフローチャートである。
RAID制御部22は、ホストインタフェース制御部21から、論理ボリュームへの書き込み要求及び書き込み対象のデータを受信すると、当該書き込み対象のデータの冗長データを生成する(ステップS1)。続いて、RAID制御部22は、書き込み対象のデータ及び冗長データについて、論理ボリュームを構成する物理ディスク装置7への分割、マッピングを行う(ステップS2)。
続いて、RAID制御部22は、エラー履歴管理テーブル4を検索し、分割・マッピングした分割データの書き込みを行う物理ディスク装置7のセクタにエラー履歴が存在するか否かをチェックする(ステップS3)。
そして、RAID制御部22は、物理ディスク装置7のセクタにエラー履歴が存在する場合(ステップS3:YES)、対応する物理ディスク装置7のセクタへの分割データの書き込みを行わない(ステップS4)。すなわち、RAID制御部22は、エラー履歴に該当するセクタへの書き込みとなる分割データについて、それぞれ対応する複数のディスクR/W制御部23への送信を行わない。そして、RAID制御部22は、その後、データ書き込み処理を終了する。
これに対して、RAID制御部22は、物理ディスク装置7のセクタにエラー履歴が存在しない場合(ステップS3:NO)、分割データをそれぞれ対応する複数のディスクR/W制御部23に送信する(ステップS5)。
続いて、ディスクR/W制御部23は、RAID制御部22から、ディスクR/W指示及び分割データを受信し、当該分割データをそれぞれ対応する物理ディスク装置7のセクタに書き込む(ステップS6)。
続いて、ディスクR/W制御部23は、書き込み時に物理ディスク装置7にエラーが発生したか否かをチェックする(ステップS7)。そして、ディスクR/W制御部23は、書き込み時に物理ディスク装置7にエラーが発生していない場合(ステップS7:NO)、ステップS9に進む。これに対して、ディスクR/W制御部23は、書き込み時に物理ディスク装置7にエラーが発生した場合(ステップS7:YES)、当該物理ディスク装置7のディスクID及びセクタ番号をエラー履歴管理テーブル24に追加登録する(ステップS8)。
続いて、ディスクR/W制御部23は、RAID制御部22に対し、書き込み完了報告により、書き込みが成功したか否かを報告する(ステップS9)。
続いて、RAID制御部22は、各ディスクR/W制御部23から受信した書き込み完了報告を取りまとめ、ステップS4において物理ディスク装置7のセクタへの書き込みを行わなかった分割データについても書き込み失敗として、書き込み失敗した分割データの数が1つ以下であるか否かをチェックする(ステップS10)。
そして、RAID制御部22は、書き込み失敗した分割データの数が1つ以下でない場合(ステップS10:NO)、ホスト計算機2に対し、書き込みの異常終了通知をホストインタフェース制御部21を経由して送信し(ステップS11)、その後、データ書き込み処理を終了する。
これに対して、RAID制御部22は、書き込み失敗した分割データの数が1つ以下である場合(ステップS10:YES)、ホスト計算機2に対し、書き込みの正常終了通知をホストインタフェース制御部21を経由して送信し(ステップS12)、その後、データ書き込み処理を終了する。
図6及び図7は、本実施形態のストレージシステム1のデータ読み出し処理を示すフローチャートである。
RAID制御部22は、ホストインタフェース制御部21から、論理ボリュームからの読み出し要求を受信すると、読み出し要求について、読み出しアドレス及び読み出し対象のデータの容量に基づいて、論理ボリュームを構成する物理ディスク装置7への分割、マッピングを行い、読み出し対象のデータ及び冗長データの分割データの分割読み出し要求を生成する(ステップS21)。
続いて、RAID制御部22は、エラー履歴管理テーブル4を検索し、分割データが書き込まれている物理ディスク装置7のセクタに、エラー履歴が存在するか否かをチェックする(ステップS22)。
そして、RAID制御部22は、分割データが書き込まれている物理ディスク装置7のセクタに、エラー履歴が存在する場合(ステップS22:YES)、エラー履歴に該当するセクタからの分割データの読み出しを行わない(ステップS23)。すなわち、RAID制御部22は、エラー履歴に該当するセクタからの読み出しとなる分割読み出し要求について、それぞれ対応する複数のディスクR/W制御部23への送信を行わない。そして、RAID制御部22は、その後、データ読み出し処理を終了する。
これに対して、RAID制御部22は、分割データが書き込まれている物理ディスク装置7のセクタに、エラー履歴が存在しない場合(ステップS22:NO)、生成した分割読み出し要求をそれぞれ対応する複数のディスクR/W制御部23に送信する(ステップS24)。
続いて、ディスクR/W制御部23は、RAID制御部22から、分割読み出し要求を受信し、当該分割読み出し要求に基づいて、それぞれ対応する物理ディスク装置7のセクタから分割データを読み出す(ステップS25)。
続いて、ディスクR/W制御部23は、読み出し時に物理ディスク装置7にエラーが発生したか否かをチェックする(ステップS26)。そして、ディスクR/W制御部23は、読み出し時に物理ディスク装置7にエラーが発生していない場合(ステップS26:NO)、ステップS28に進む。これに対して、ディスクR/W制御部23は、読み出し時に物理ディスク装置7にエラーが発生した場合(ステップS26:YES)、当該物理ディスク装置7のディスクID及びセクタ番号をエラー履歴管理テーブル24に追加登録する(ステップS27)。
続いて、ディスクR/W制御部23は、RAID制御部22に対し、読み出し完了報告により、読み出しが成功したか否かを報告する(ステップS28)。
続いて、RAID制御部22は、各ディスクR/W制御部23から受信した読み出し完了報告を取りまとめ、ステップS23において物理ディスク装置7のセクタからの分割データの読み出しを行わなかった分割データについても読み出し失敗として、読み出し失敗した分割データの数が1つ以下であるか否かをチェックする(ステップS29)。
そして、RAID制御部22は、読み出し失敗した分割データの数が1つ以下でない場合(ステップS29:NO)、ホスト計算機2に対し、読み出しの異常終了通知をホストインタフェース制御部21を経由して送信し(ステップS30)、その後、データ読み出し処理を終了する。
これに対して、RAID制御部22は、読み出し失敗した分割データの数が1つ以下である場合(ステップS29:YES)、各ディスクR/W制御部23から受信した分割データを取りまとめ、当該分割データに基づいて生成した読み出し対象のデータ及び冗長データの検算を行い、当該読み出し対象のデータ及び冗長データが一致するか否かをチェックする(ステップS31)。
そして、RAID制御部22は、読み出し対象のデータ及び冗長データが一致しない場合(ステップS31:NO)、ホスト計算機2に対し、読み出しの異常終了通知をホストインタフェース制御部21を経由して送信し(ステップS32)、その後、データ読み出し処理を終了する。
これに対して、RAID制御部22は、読み出し対象のデータ及び冗長データが一致する場合(ステップS31:YES)、ホスト計算機2に対し、読み出しの正常終了通知及び読み出し対象のデータをホストインタフェース制御部21を経由して送信し(ステップS33)、その後、データ読み出し処理を終了する。
なお、RAID制御部22は、障害発生履歴のある物理ディスク装置7を交換する際には、交換元の物理ディスク装置7を含めて全物理ディスク装置7のデータを読み出し、冗長データとの照合を行いながら、交換元の物理ディスク装置7のデータを交換先の物理ディスク装置7にコピーする。ただし、RAID制御部22は、交換元の物理ディスク装置7のエラー領域のデータは読み出すことができないため、他の物理ディスク装置7のデータより正しいデータを生成して交換先の物理ディスク装置7に書き込む。
この場合、RAID制御部22は、交換元ディスク以外のディスクのデータがエラーになっても、交換元ディスクのデータを交換先ディスクに書き込み、このとき発生したエラーもエラー履歴管理テーブル24に登録する。最後に、RAID制御部22は、交換元の物理ディスク装置7に関するエラー履歴をエラー履歴管理テーブル24から削除して、交換元の物理ディスク装置7を取り除き、交換先の物理ディスク装置7をボリュームのメンバーとして組み込む。
以上のように、本実施形態においては、RAID制御部22は、過去にエラーが発生した履歴のある物理ディスク装置7のセクタ位置について、アクセス(書き込み、読み出し)を行わない。これにより、エラーが物理ディスク装置7のディスクプラッタ面上の欠陥によるものであった場合、この欠陥を含むセクタに繰り返しアクセスすることによって欠陥が拡散するのを未然かつ有効に防止し、ストレージシステム1全体の可用性を高めることができる。
そして、上記の説明のごとく、本実施形態においては、RAID制御部22は、アクセス時にエラーが発生した物理ディスク装置7を即閉塞するのではなく、個別のアドレス領域ごとに実際にアクセスを行うか否かを判断しているので、単一の物理ディスク装置7のアクセスエラー後においても可用性の高いストレージシステム1を構成することができる。
(他実施形態)
本発明の他実施形態として、基本的構成は上記の通りであるが、エラー履歴管理テーブル24についてさらに工夫している。図3は、他実施形態のエラー履歴管理テーブル24の一例を示した図である。他実施形態のエラー履歴管理テーブル24は、例えば、セクタ番号は有効なエントリ数が多く所定数のビットを省略しても検索が可能であるため、セクタ番号の下位8ビットを省略し、連続する256セクタを1つのグループとして扱う。これにより、エラー履歴管理テーブル24の容量を削減することができるため、エラー履歴管理テーブル24のメモリ13の使用領域を一段と削減することができる。
図8の他実施形態のエラー履歴管理テーブル24を採用する場合、RAID制御部22は、当該エラー履歴管理テーブル24を参照するが、アクセスしようとしているセクタ番号のうち下位8ビットを省略し、エラー履歴管理テーブル24内のエラー履歴を検索する。
また、ディスクR/W制御部23は、アクセス時に物理ディスク装置7にエラーが発生した場合、他実施形態のエラー履歴管理テーブル24にディスクID及びセクタ番号を登録するが、この際にセクタ番号の下位8ビットを省略して登録する。なお、エラー履歴管理テーブル24内で管理するセクタ番号のうち、何ビットを省略するのかは任意である。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)複数の物理ディスクにより構成されるボリュームに対して読書きするディスクアレイ装置であって、過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルと、前記テーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックし、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行う制御部とを備えることを特徴とするディスクアレイ装置である。
(付記2)前記ボリュームは、複数の前記物理ディスクによりRAID構成されており、前記制御部は、前記エラーが発生した履歴のある物理ディスクのセクタが存在する場合、当該セクタを有する物理ディスク以外の物理ディスクを用いて読書きを行うことを特徴とする付記1に記載のディスクアレイ装置である。
(付記3)複数の物理ディスクにより構成されるボリュームに対して読書きするディスクアレイ装置の制御方法であって、制御部が、過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックする第1のステップと、前記制御部が、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行う第2のステップとを備えることを特徴とするディスクアレイ装置の制御方法である。
本発明は、冗長の物理ディスクを有することにより可用性を高めるRAID構成のディスクアレイ装置に適用することができる。
1……ストレージシステム、2……ホスト計算機2、3……ネットワーク、4……ディスクアレイ装置、5……コントローラ部、6……記憶部、7……物理ディスク装置、11……ホストインタフェース、12……CPU、13……メモリ、14……ディスクインタフェース、21……ホストインタフェース制御部、22……RAID制御部、23……ディスクR/W制御部、24……エラー履歴管理テーブル

Claims (3)

  1. 複数の物理ディスクによりRAID構成されるボリュームに対して読書きするディスクアレイ装置であって、
    過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルと、
    前記テーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックし、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行い、エラー履歴が存在する場合、当該物理ディスクのセクタへの読書きを行わないように制御する制御部と
    を備え、
    前記制御部は、書き込みを行わなかったセクタの数と、書き込みを行ったがエラーとなったセクタの数との合計が1以下である場合に、書き込みが正常終了したと判断することを特徴とするディスクアレイ装置。
  2. 前記制御部は、
    前記エラーが発生した履歴のある物理ディスクのセクタが存在する場合、当該セクタを有する物理ディスク以外の物理ディスクを用いて読書きを行う
    ことを特徴とする請求項1に記載のディスクアレイ装置。
  3. 複数の物理ディスクによりRAID構成されるボリュームに対して読書きするディスクアレイ装置の制御方法であって、
    制御部が、過去にエラーが発生した履歴のある物理ディスクのセクタについてのディスク番号及びセクタ番号を格納するテーブルを参照し、アクセス対象の前記物理ディスクのセクタにエラー履歴が存在するか否かをチェックする第1のステップと、
    前記制御部が、エラー履歴が存在しない場合、当該物理ディスクのセクタへの読書きを行い、エラー履歴が存在する場合、当該物理ディスクのセクタへの読書きを行わないように制御する第2のステップと、
    前記制御部が、書き込みを行わなかったセクタの数と、書き込みを行ったがエラーとなったセクタの数との合計が1以下である場合に、書き込みが正常終了したと判断する第3のステップと、
    を備えることを特徴とするディスクアレイ装置の制御方法。
JP2011048206A 2011-03-04 2011-03-04 ディスクアレイ装置及びその制御方法 Active JP5874175B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011048206A JP5874175B2 (ja) 2011-03-04 2011-03-04 ディスクアレイ装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011048206A JP5874175B2 (ja) 2011-03-04 2011-03-04 ディスクアレイ装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2012185670A JP2012185670A (ja) 2012-09-27
JP5874175B2 true JP5874175B2 (ja) 2016-03-02

Family

ID=47015712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011048206A Active JP5874175B2 (ja) 2011-03-04 2011-03-04 ディスクアレイ装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP5874175B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03192573A (ja) * 1989-12-21 1991-08-22 Fujitsu Ltd 磁気ディスク装置
JPH1145498A (ja) * 1997-07-30 1999-02-16 Sony Corp データ処理装置及び方法
JP5181795B2 (ja) * 2008-04-08 2013-04-10 日本電気株式会社 Raidシステム、及びエラーセクタの修復方法

Also Published As

Publication number Publication date
JP2012185670A (ja) 2012-09-27

Similar Documents

Publication Publication Date Title
US8589724B2 (en) Rapid rebuild of a data set
US8392752B2 (en) Selective recovery and aggregation technique for two storage apparatuses of a raid
US7574623B1 (en) Method and system for rapidly recovering data from a “sick” disk in a RAID disk group
US8839030B2 (en) Methods and structure for resuming background tasks in a clustered storage environment
US9269376B1 (en) Efficient burst data verify in shingled data storage drives
US7590884B2 (en) Storage system, storage control device, and storage control method detecting read error response and performing retry read access to determine whether response includes an error or is valid
US8904244B2 (en) Heuristic approach for faster consistency check in a redundant storage system
US20090271659A1 (en) Raid rebuild using file system and block list
US20140325262A1 (en) Controlling data storage in an array of storage devices
US7587630B1 (en) Method and system for rapidly recovering data from a “dead” disk in a RAID disk group
US20130047028A1 (en) Storage system, storage control device, and storage control method
WO2013159503A1 (zh) 一种硬盘数据恢复方法、装置及系统
US20060236149A1 (en) System and method for rebuilding a storage disk
JP2007334593A (ja) Raidコントローラおよびraid装置
JP2010033287A (ja) ストレージサブシステム及びこれを用いたデータ検証方法
US6789165B2 (en) Data storage array method and system
CN102164165B (zh) 一种网络存储系统的管理方法及装置
JP4491330B2 (ja) ディスクアレイ装置とそのデータのリカバリ方法およびデータリカバリプログラム
US8782465B1 (en) Managing drive problems in data storage systems by tracking overall retry time
US10210062B2 (en) Data storage system comprising an array of drives
JP2005309818A (ja) ストレージ装置、そのデータ読出方法、及びそのデータ読出プログラム
US8433949B2 (en) Disk array apparatus and physical disk restoration method
US20090100302A1 (en) Apparatus and method for disk read checking
US7529776B2 (en) Multiple copy track stage recovery in a data storage system
US7174476B2 (en) Methods and structure for improved fault tolerance during initialization of a RAID logical unit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160104

R150 Certificate of patent or registration of utility model

Ref document number: 5874175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150