JP5760585B2 - ストレージシステムおよび異常発生箇所判定方法 - Google Patents
ストレージシステムおよび異常発生箇所判定方法 Download PDFInfo
- Publication number
- JP5760585B2 JP5760585B2 JP2011072572A JP2011072572A JP5760585B2 JP 5760585 B2 JP5760585 B2 JP 5760585B2 JP 2011072572 A JP2011072572 A JP 2011072572A JP 2011072572 A JP2011072572 A JP 2011072572A JP 5760585 B2 JP5760585 B2 JP 5760585B2
- Authority
- JP
- Japan
- Prior art keywords
- error
- transmission path
- access
- redundancy
- determination unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
さらに、上記目的を達成するために、複数の記憶装置と、複数の記憶装置のそれぞれに複数の共通伝送路を通じてアクセス可能な制御装置とを備えたストレージシステムが提供される。このストレージシステムにおいて、制御装置は、伝送路冗長性判定部と、エラー履歴判定部と、異常発生箇所判定部とを有する。伝送路冗長性判定部は、上記の複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、上記の複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する。エラー履歴判定部は、エラーが発生したとき、上記の複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時にエラーが発生したかを判定する。異常発生箇所判定部は、データ冗長性判定部によって共通伝送路に冗長性がないと判定されたとき、アクセスに使用した共通伝送路を異常発生箇所でないと判定するとともに、エラー履歴判定部による判定結果に基づいて、アクセス先の記憶装置が異常発生箇所かを判定する。
〔第1の実施の形態〕
図1は、第1の実施の形態に係るストレージシステムの構成例を示す図である。
図2は、第2の実施の形態に係るストレージシステムの構成例を示す図である。なお、図2では、図1と同様の構成要素には同じ符号を付して示す。
図4は、第3の実施の形態に係るストレージシステムのシステム構成例を示す図である。
IOC305は、SASインタフェース処理を実行する回路である。CM300aのIOC305には、CM300aに設けられたSASエクスパンダ307と、CM300bに設けられたSASエクスパンダ307の両方に接続されている。CM300aのSASエクスパンダ307は、DE200のSASエクスパンダ210に接続されている。一方、CM300bのSASエクスパンダ307は、DE200のSASエクスパンダ220に接続されている。
デバイス管理テーブル310は、DE200との間の伝送路上のデバイスおよびDE200内の各HDDについての状態を示す情報を保持するテーブルである。デバイス管理テーブル310には、デバイスを識別する「デバイス名」に対応付けて、「ステータス」および「エラー点数」が登録される。
RAID管理テーブル320は、RAIDに関する情報を保持するテーブルである。RAID管理テーブル320には、RAIDグループを識別する「RAIDグループ番号」に対応付けて、「RAIDレベル」、「使用ディスク」、「ステータス」および「論理ボリューム情報」が登録される。
「使用ディスク」には、DE200内のHDDのうち、RAIDグループで使用されるHDDを識別する情報が登録される。「使用ディスク」には、通常、1つのRAIDグループに対して複数のHDDが登録される。
ディスクビットマップ330は、CM300aからの過去のアクセス処理の際に、アクセスに対する応答を基に異常発生箇所を特定できないようなリカバードエラーが発生していたか否かを、アクセス先のHDDごと、かつ、アクセスに使用した伝送路ごとに保持する情報である。以下、アクセスに対する応答を基に異常発生箇所を特定できないエラーを、「非疑箇所不明のエラー」と呼ぶ。
CM300aは、アクセス制御部341、異常発生箇所判定部342および切り離し制御部343を備える。アクセス制御部341、異常発生箇所判定部342および切り離し制御部343の処理は、例えば、CM300aのCPU301が所定のプログラムを実行することで実現される。
異常発生箇所判定部342の加点処理部351は、異常が発生したHDDに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。
加点処理部351は、異常が発生したSASエクスパンダに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。
加点処理部351は、アクセス先のHDDと、アクセスに使用した伝送路上のすべてのSASエクスパンダに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。
図11では、例として、CM300aからDE200のHDD230aにアクセスしたときに、再現性のある非疑箇所不明のエラーが発生した状態を示す。CM300aの加点処理部351(図10参照)は、エラーの原因となった異常の発生箇所が、アクセス先のHDD230aなのか、アクセスに使用した伝送路P0上のSASエクスパンダ(CM300aのSASエクスパンダ307またはDE200のSASエクスパンダ210)なのかを、判定できない。そこで、CM300aの加点処理部351は、HDD230a、CM300aのSASエクスパンダ307およびDE200のSASエクスパンダ210のそれぞれに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。これにより、HDDまたはSASエクスパンダでの故障発生を見過ごす事態を防止できる。
<ケース4:HDD異常によってリカバードエラーが発生した場合>
異常発生箇所判定部342の加点処理部351は、データ冗長性判定部352による、データに冗長性があるかの判定結果に応じて、加点を行うかを決定する。データに冗長性がある場合、加点処理部351は、アクセス先のHDDに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。一方、データに冗長性がない場合、加点処理部351は、「エラー点数」の加点を行わない。
図12では、例として、CM300aは、HDD230a〜230cによって1つのRAIDグループ「RLU#00」を構成し、これらのHDD230a〜230cを用いてデータを冗長化して記録しているものとする。また、「RLU#00」のRAIDレベルは、RAID1,4,5のいずれかであるとする。そして、CM300aからDE200のHDD230aにアクセスしたときに、HDD230aの異常に基づくリカバードエラーが発生したとする。
CM300aの加点処理部351は、伝送路冗長性判定部353による、伝送路に冗長性があるかの判定結果に応じて、加点を行うかを決定する。伝送路に冗長性がある場合、加点処理部351は、異常が発生したSASエクスパンダに対応する、デバイス管理テーブル310内の「エラー点数」に加点する。一方、伝送路に冗長性がない場合、加点処理部351は、「エラー点数」の加点を行わない。
図13では、例として、CM300aからDE200のHDD230aにアクセスしたときに、伝送路上のデバイスの異常によってリカバードエラーが発生した状態を示す。このとき、伝送路に冗長性がある、すなわち、伝送路P0,P1の両方とも切り離されていない場合には、CM300aの加点処理部351(図10参照)は、異常が発生したSASエクスパンダ(CM300aのSASエクスパンダ307またDE200のSASエクスパンダ210)に対応する、デバイス管理テーブル310の「エラー点数」を加点する。
CM300aの加点処理部351は、データ冗長性判定部352、伝送路冗長性判定部353および副判定部354のそれぞれの判定結果に基づいて、加点する対象のデバイスや、デバイスに加点するか否かを決定する。
図14では、例として、CM300aは、HDD230a〜230cによって1つのRAIDグループ「RLU#00」を構成しているが、HDD230cが切り離されているために、「RLU#00」においてデータに冗長性がない状態を示す。また、CM300aとDE200との間の伝送路には冗長性があるものとする。
図15では、例として、CM300aは、HDD230a〜230cによって1つのRAIDグループ「RLU#00」を構成し、HDD230a〜230cを用いてデータが冗長化されるように制御している。しかし、伝送路P1が切り離されているために、CM300aとDE200との間の伝送路には冗長性がないものとする。
[ステップS13]ステップS12でのリトライにより再度エラーが発生した場合(すなわち、再現性のあるエラーが発生した場合。S13:No)、ステップS14の処理が実行される。一方、ステップS12でアクセスに成功した場合(すなわち、ステップS11で発生したエラーがリカバードエラーであった場合。S13:Yes)、ステップS19の処理が実行される。
[ステップS16]加点処理部351は、異常発生箇所が、ステップS11,S12でのアクセスに用いた伝送路上のデバイスであるかを判定する。加点処理部351は、例えば、ステップS11またはステップS12で、アクセス制御部341が伝送路上のSASエクスパンダからセンス情報を受信した場合、あるいは、アクセス制御部341によるアクセスに対して一定時間以内に応答がなかった場合に、異常発生箇所が伝送路上のデバイスであると判定する。加点処理部351は、異常発生箇所が伝送路上のデバイスであると判定した場合(S16:Yes)、ステップS17の処理を実行する一方、異常発生箇所が伝送路上のデバイスでないと判定した場合(S16:No)、ステップS18の処理を実行する。
[ステップS22]加点処理部351は、ステップS16と同様の処理手順で、異常発生箇所が伝送路上のデバイスであるかを判定する。加点処理部351は、異常発生箇所が伝送路上のデバイスであると判定した場合(S22:Yes)、ステップS23の処理を実行する一方、異常発生箇所が伝送路上のデバイスでないと判定した場合(S22:No)、ステップS25の処理を実行する。
なお、上記の図16,図17の処理において、CM300aの加点処理部351は、「エラー点数」の加点を行ったとき、加点したデバイスを識別する情報を他方のCM300bにも通知して、CM300aが保持するデバイス管理テーブル310とCM300bが保持するデバイス管理テーブル310とを同期させるようにしてもよい。
[ステップS51]CM300aの切り離し制御部343は、デバイス管理テーブル310の「エラー点数」に対して加点が行われたことを検知すると、ステップS52以降の処理を実行する。なお、切り離し制御部343は、例えば、加点処理部351から、「エラー点数」を更新したことの通知を受けたときに、ステップS52以降の処理を実行するようにしてもよい。
以上説明した第3の実施の形態によれば、リカバードエラーが発生した場合に、できる限りシステムの運用を継続できる。これとともに、非疑箇所不明のリカバードエラーが発生したときの異常発生箇所の判定精度が向上し、故障していないデバイスが誤って切り離される事態の発生確率を低減できる。
(付記1) 複数の記憶装置と、前記複数の記憶装置のそれぞれに共通伝送路を通じてアクセスするとともに、前記複数の記憶装置に記録するデータが異なる記憶装置に冗長化されるように前記複数の記憶装置を管理する制御装置とを備えたストレージシステムにおいて、
前記制御装置は、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、アクセス対象のデータに冗長性があるかを判定するデータ冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記データ冗長性判定部によってアクセス対象のデータに冗長性がないと判定されたとき、アクセス先の記憶装置を異常発生箇所でないと判定するとともに、前記エラー履歴判定部による判定結果に基づいて、前記共通伝送路が異常発生箇所かを判定する異常発生箇所判定部と、
を有することを特徴とするストレージシステム。
前記異常発生箇所判定部は、前記データ冗長性判定部によってアクセス対象のデータに冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表において前記共通伝送路に加点し、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表においてアクセス対象の記憶装置および前記共通伝送路のいずれにも加点しない、
ことを特徴とする付記1記載のストレージシステム。
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいてアクセス先の記憶装置であると特定された場合、前記エラー点数表において前記共通伝送路に加点せずに、前記データ冗長性判定部の判定結果に基づいて、前記エラー点数表においてアクセス先の記憶装置に加点するかを決定し、
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できない場合、前記エラー点数表においてアクセス先の記憶装置および前記共通伝送路のそれぞれに加点するかを、前記データ冗長性判定部および前記エラー履歴判定部の判定結果に基づいて決定する、
ことを特徴とする付記3記載のストレージシステム。
前記エラー点数表は、前記複数の記憶装置のそれぞれおよび前記複数の共通伝送路のそれぞれについて、エラーの発生に応じて点数を個別に保持し、
前記制御装置は、前記エラーが発生したとき、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する伝送路冗長性判定部をさらに有し、
前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できず、かつ、前記データ冗長性判定部によってアクセス対象のデータに冗長性がないと判定され、かつ、前記伝送路冗長性判定部によって共通伝送路に冗長性がないと判定された場合、前記エラー点数表においてアクセス先の記憶装置および前記共通伝送路のいずれにも加点しない、
ことを特徴とする付記4記載のストレージシステム。
前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できず、かつ、前記伝送路冗長性判定部によって共通伝送路に冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表においてアクセス先の記憶装置に加点し、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表においてアクセスに使用した共通伝送路およびアクセス対象の記憶装置のいずれにも加点しないことを特徴とする付記5記載のストレージシステム。
前記制御装置は、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する伝送路冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記データ冗長性判定部によって共通伝送路に冗長性がないと判定されたとき、アクセスに使用した共通伝送路を異常発生箇所でないと判定するとともに、前記エラー履歴判定部による判定結果に基づいて、アクセス先の記憶装置が異常発生箇所かを判定する異常発生箇所判定部と、
を有することを特徴とするストレージシステム。
前記異常発生箇所判定部は、前記伝送路冗長性判定部によって共通伝送路に冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表においてアクセス先の記憶装置に加点し、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表においてアクセスに使用した共通伝送路およびアクセス対象の記憶装置のいずれにも加点しない、
ことを特徴とする付記7記載のストレージシステム。
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいてアクセスに使用した共通伝送路であると特定された場合、前記エラー点数表においてアクセス先の記憶装置に加点せずに、前記伝送路冗長性判定部の判定結果に基づいて、前記エラー点数表においてアクセスに使用した共通伝送路に加点するかを決定し、
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できない場合、前記エラー点数表においてアクセスに使用した共通伝送路およびアクセス先の記憶装置のそれぞれに加点するかを、前記伝送路冗長性判定部および前記エラー履歴判定部の判定結果に基づいて決定する、
ことを特徴とする付記9記載のストレージシステム。
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、アクセス対象のデータに冗長性があるかを判定するデータ冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記データ冗長性判定部によってアクセス対象のデータに冗長性がないと判定されたとき、アクセス先の記憶装置を異常発生箇所でないと判定するとともに、前記エラー履歴判定部による判定結果に基づいて、前記共通伝送路が異常発生箇所かを判定する異常発生箇所判定部と、
を有することを特徴とする制御装置。
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する伝送路冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記データ冗長性判定部によって共通伝送路に冗長性がないと判定されたとき、アクセスに使用した共通伝送路を異常発生箇所でないと判定するとともに、前記エラー履歴判定部による判定結果に基づいて、アクセス先の記憶装置が異常発生箇所かを判定する異常発生箇所判定部と、
を有することを特徴とする制御装置。
前記制御装置が、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、アクセス対象のデータに冗長性があるかを判定し、
アクセス対象のデータに冗長性がないと判定した場合、アクセス先の記憶装置を異常発生箇所でないと判定するとともに、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する過去のアクセス時に前記エラーが発生したかを判定し、その判定結果に基づいて前記共通伝送路が異常発生箇所かを判定する、
ことを特徴とする異常発生箇所判定方法。
前記複数の記憶装置のそれぞれおよび前記共通伝送路について、エラーの発生に応じた点数を個別に保持するエラー点数表を参照し、前記エラー点数表において点数が所定のしきい値に達した記憶装置または共通伝送路を使用不許可にする処理をさらに実行し、
前記エラーが発生して、アクセス対象のデータに冗長性がないと判定したとき、前記過去のアクセス時に前記エラーが発生したと判定した場合には、前記エラー点数表において前記共通伝送路に加点し、前記過去のアクセス時に前記エラーが発生していないと判定した場合には、前記エラー点数表においてアクセス対象の記憶装置および前記共通伝送路のいずれにも加点しない、
ことを特徴とする付記13記載の異常発生箇所判定方法。
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいてアクセス先の記憶装置であると特定された場合、前記エラー点数表において前記共通伝送路に加点せずに、アクセス対象のデータに冗長性があるかの判定結果に基づいて、前記エラー点数表においてアクセス先の記憶装置に加点するかを決定し、
前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できない場合、前記エラー点数表においてアクセス先の記憶装置および前記共通伝送路のそれぞれに加点するかを、アクセス対象のデータに冗長性があるかの判定結果と、前記過去のアクセス時に前記エラーが発生したかの判定結果とに基づいて決定する、
ことを特徴とする付記15記載の異常発生箇所判定方法。
前記エラー点数表は、前記複数の記憶装置のそれぞれおよび前記複数の共通伝送路のそれぞれについて、エラーの発生に応じて点数を個別に保持し、
前記制御装置は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できず、かつ、アクセス対象のデータに冗長性がないと判定し、かつ、前記複数の記憶装置と接続する共通伝送路に冗長性がないと判定した場合、前記エラー点数表においてアクセス先の記憶装置および前記共通伝送路のいずれにも加点しない、
ことを特徴とする付記16記載の異常発生箇所判定方法。
前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生していない場合には、前記エラー点数表においてアクセス先の記憶装置に加点し、
前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生していた場合には、前記エラー点数表においてアクセスに使用した共通伝送路およびアクセス対象の記憶装置のいずれにも加点しない、
ことを特徴とする付記17記載の異常発生箇所判定方法。
前記制御装置が、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定し、
共通伝送路に冗長性がないと判定した場合、アクセスに使用した共通伝送路を異常発生箇所でないと判定するとともに、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定し、その判定結果に基づいて、アクセス先の記憶装置が異常発生箇所かを判定する、
ことを特徴とする異常発生箇所判定方法。
前記複数の記憶装置のそれぞれおよび前記複数の共通伝送路について、エラーの発生に応じた点数を個別に保持するエラー点数表を参照し、前記エラー点数表において点数が所定のしきい値に達した記憶装置または共通伝送路を使用不許可にする処理をさらに実行し、
前記エラーが発生して、共通伝送路に冗長性がないと判定したとき、前記過去のアクセス時に前記エラーが発生していないと判定した場合には、前記エラー点数表においてアクセス先の記憶装置に加点し、前記過去のアクセス時に前記エラーが発生していたと判定した場合には、前記エラー点数表においてアクセスに使用した共通伝送路およびアクセス対象の記憶装置のいずれにも加点しない、
ことを特徴とする付記19記載の異常発生箇所判定方法。
10a,10b 制御装置
11 データ冗長性判定部
12a,12b エラー履歴判定部
13a,13b 異常発生箇所判定部
14a,14b 切り離し制御部
15a,15b エラー履歴テーブル
16a,16b エラー点数表
17 伝送路冗長性判定部
21,22 記憶装置
30〜32 共通伝送路
Claims (12)
- 複数の記憶装置と、前記複数の記憶装置のそれぞれに共通伝送路を通じてアクセスするとともに、前記複数の記憶装置に記録するデータが異なる記憶装置に冗長化されるように前記複数の記憶装置を管理する制御装置とを備えたストレージシステムにおいて、
前記制御装置は、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、アクセス対象のデータに冗長性があるかを判定するデータ冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記エラーの発生時に前記データ冗長性判定部によって前記アクセス対象のデータに冗長性がないと判定されたとき、前記アクセス先の記憶装置を異常発生箇所でないと判定するとともに、前記エラー履歴判定部によって過去に前記エラーが発生したと判定された場合には、前記共通伝送路を異常発生箇所と判定する異常発生箇所判定部と、
を有することを特徴とするストレージシステム。 - 前記制御装置は、前記複数の記憶装置のそれぞれおよび前記共通伝送路について、前記エラーの発生に応じた点数を個別に保持するエラー点数表を参照し、前記エラー点数表において点数が所定のしきい値に達した記憶装置または前記共通伝送路を使用不許可にする切り離し制御部をさらに有し、
前記異常発生箇所判定部は、前記データ冗長性判定部によって前記アクセス対象のデータに冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表において前記共通伝送路に加点し、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表において前記アクセス先の記憶装置および前記共通伝送路のいずれにも加点しない、
ことを特徴とする請求項1記載のストレージシステム。 - 前記異常発生箇所判定部は、前記データ冗長性判定部によって前記アクセス対象のデータに冗長性があると判定された場合に、前記エラー点数表において前記アクセス先の記憶装置および前記共通伝送路の両方に加点することを特徴とする請求項2記載のストレージシステム。
- 前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて前記アクセス先の記憶装置であると特定された場合、前記エラー点数表において前記共通伝送路に加点せずに、前記データ冗長性判定部の判定結果に基づいて、前記エラー点数表において前記アクセス先の記憶装置に加点するかを決定することを特徴とする請求項3記載のストレージシステム。
- 前記制御装置は、前記複数の記憶装置に対して複数の共通伝送路を通じてアクセスし、
前記エラー点数表は、前記複数の記憶装置のそれぞれおよび前記複数の共通伝送路のそれぞれについて、前記エラーの発生に応じて点数を個別に保持し、
前記制御装置は、前記エラーが発生したとき、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する伝送路冗長性判定部をさらに有し、
前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できず、かつ、前記データ冗長性判定部によって前記アクセス対象のデータに冗長性がないと判定され、かつ、前記伝送路冗長性判定部によって前記接続する共通伝送路に冗長性がないと判定された場合、前記エラー点数表において前記アクセス先の記憶装置および前記複数の共通伝送路のいずれにも加点しない、
ことを特徴とする請求項4記載のストレージシステム。 - 前記エラー履歴判定部は、前記エラーが発生したとき、前記複数の記憶装置のうち前記アクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定し、
前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて特定できず、かつ、前記伝送路冗長性判定部によって前記接続する共通伝送路に冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表において前記アクセス先の記憶装置に加点し、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表において前記複数の共通伝送路のうちアクセスに使用した共通伝送路および前記アクセス先の記憶装置のいずれにも加点しないことを特徴とする請求項5記載のストレージシステム。 - 複数の記憶装置と、前記複数の記憶装置のそれぞれに複数の共通伝送路を通じてアクセス可能な制御装置とを備えたストレージシステムにおいて、
前記制御装置は、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定する伝送路冗長性判定部と、
前記エラーが発生したとき、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定するエラー履歴判定部と、
前記エラーの発生時に前記伝送路冗長性判定部によって前記接続する共通伝送路に冗長性がないと判定されたとき、前記複数の共通伝送路のうちアクセスに使用した使用共通伝送路を異常発生箇所でないと判定するとともに、前記エラー履歴判定部によって過去に前記エラーが発生していないと判定された場合には、前記アクセス先の記憶装置を異常発生箇所と判定する異常発生箇所判定部と、
を有することを特徴とするストレージシステム。 - 前記制御装置は、前記複数の記憶装置のそれぞれおよび前記複数の共通伝送路について、前記エラーの発生に応じた点数を個別に保持するエラー点数表を参照し、前記エラー点数表において点数が所定のしきい値に達した記憶装置または共通伝送路を使用不許可にする切り離し制御部をさらに有し、
前記異常発生箇所判定部は、前記伝送路冗長性判定部によって前記接続する共通伝送路に冗長性がないと判定されたとき、前記エラー履歴判定部により過去に前記エラーが発生していないと判定された場合には、前記エラー点数表において前記アクセス先の記憶装置に加点し、前記エラー履歴判定部により過去に前記エラーが発生したと判定された場合には、前記エラー点数表において前記使用共通伝送路および前記アクセス先の記憶装置のいずれにも加点しない、
ことを特徴とする請求項7記載のストレージシステム。 - 前記異常発生箇所判定部は、前記伝送路冗長性判定部によって前記接続する共通伝送路に冗長性があると判定された場合に、前記エラー点数表において前記使用共通伝送路および前記アクセス先の記憶装置の両方に加点することを特徴とする請求項8記載のストレージシステム。
- 前記異常発生箇所判定部は、前記エラーの発生箇所が、記憶装置へのアクセスに対する応答に基づいて前記使用共通伝送路であると特定された場合、前記エラー点数表において前記アクセス先の記憶装置に加点せずに、前記伝送路冗長性判定部の判定結果に基づいて、前記エラー点数表において前記使用共通伝送路に加点するかを決定することを特徴とする請求項9記載のストレージシステム。
- 複数の記憶装置のそれぞれに共通伝送路を通じてアクセスするとともに、前記複数の記憶装置に記録するデータが異なる記憶装置に冗長化されるように前記複数の記憶装置を管理する制御装置における異常発生箇所判定方法であって、
前記制御装置が、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、アクセス対象のデータに冗長性があるかを判定し、
前記アクセス対象のデータに冗長性がないと判定した場合、前記複数の記憶装置のうちアクセス先の記憶装置を異常発生箇所でないと判定するとともに、前記複数の記憶装置のうち前記アクセス先の記憶装置以外の記憶装置に対する過去のアクセス時に前記エラーが発生したかを判定し、前記エラーが発生したと判定した場合には、前記共通伝送路を異常発生箇所と判定する、
ことを特徴とする異常発生箇所判定方法。 - 複数の記憶装置のそれぞれに複数の共通伝送路を通じてアクセス可能な制御装置における異常発生箇所判定方法であって、
前記制御装置が、
前記複数の記憶装置のうちの1つにアクセスしたときにエラーが発生した場合、前記複数の記憶装置と接続する共通伝送路に冗長性があるかを判定し、
前記接続する共通伝送路に冗長性がないと判定した場合、前記複数の共通伝送路のうちアクセスに使用した共通伝送路を異常発生箇所でないと判定するとともに、前記複数の記憶装置のうちアクセス先の記憶装置以外の記憶装置に対する同じ共通伝送路を通じた過去のアクセス時に前記エラーが発生したかを判定し、前記エラーが発生していないと判定した場合には、前記アクセス先の記憶装置を異常発生箇所と判定する、
ことを特徴とする異常発生箇所判定方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072572A JP5760585B2 (ja) | 2011-03-29 | 2011-03-29 | ストレージシステムおよび異常発生箇所判定方法 |
US13/371,510 US8874972B2 (en) | 2011-03-29 | 2012-02-13 | Storage system and method for determining anomaly-occurring portion |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072572A JP5760585B2 (ja) | 2011-03-29 | 2011-03-29 | ストレージシステムおよび異常発生箇所判定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012208625A JP2012208625A (ja) | 2012-10-25 |
JP5760585B2 true JP5760585B2 (ja) | 2015-08-12 |
Family
ID=46928948
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011072572A Active JP5760585B2 (ja) | 2011-03-29 | 2011-03-29 | ストレージシステムおよび異常発生箇所判定方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8874972B2 (ja) |
JP (1) | JP5760585B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016212512A (ja) | 2015-04-30 | 2016-12-15 | 富士通株式会社 | ストレージシステム、制御装置および制御プログラム |
US11363049B1 (en) | 2021-03-25 | 2022-06-14 | Bank Of America Corporation | Information security system and method for anomaly detection in data transmission |
US11586356B1 (en) * | 2021-09-27 | 2023-02-21 | Dell Products L.P. | Multi-path layer configured for detection and mitigation of link performance issues in a storage area network |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6073218A (en) * | 1996-12-23 | 2000-06-06 | Lsi Logic Corp. | Methods and apparatus for coordinating shared multiple raid controller access to common storage devices |
JPH11296311A (ja) * | 1998-04-08 | 1999-10-29 | Hitachi Ltd | 記憶装置の耐故障制御方式 |
JP3139548B2 (ja) | 1998-10-22 | 2001-03-05 | 日本電気株式会社 | エラーリトライ方法、エラーリトライシステム及びその記録媒体 |
JP2004227449A (ja) * | 2003-01-27 | 2004-08-12 | Hitachi Ltd | ディスクアレイ装置における障害の診断装置 |
US7237141B2 (en) * | 2003-06-19 | 2007-06-26 | Lsi Corporation | Method for recovering data from a redundant storage object |
JP4230953B2 (ja) * | 2004-03-31 | 2009-02-25 | 株式会社ケンウッド | ベースバンド信号生成装置、ベースバンド信号生成方法及びプログラム |
JP2007206766A (ja) * | 2006-01-31 | 2007-08-16 | Fujitsu Ltd | データストレージシステム、データストレージ制御装置及びその障害箇所診断方法。 |
JP5244332B2 (ja) * | 2006-10-30 | 2013-07-24 | 株式会社日立製作所 | 情報システム、データ転送方法及びデータ保護方法 |
JP4542163B2 (ja) * | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
US7962781B2 (en) * | 2008-06-17 | 2011-06-14 | Fujitsu Limited | Control method for information storage apparatus, information storage apparatus and computer readable information recording medium |
JP5252574B2 (ja) * | 2009-04-21 | 2013-07-31 | Necシステムテクノロジー株式会社 | ディスクアレイ制御装置及び方法並びにプログラム |
-
2011
- 2011-03-29 JP JP2011072572A patent/JP5760585B2/ja active Active
-
2012
- 2012-02-13 US US13/371,510 patent/US8874972B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012208625A (ja) | 2012-10-25 |
US20120254673A1 (en) | 2012-10-04 |
US8874972B2 (en) | 2014-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9047219B2 (en) | Storage system, storage control device, and storage control method | |
JP4884885B2 (ja) | 記憶制御装置及び記憶制御装置の障害回復方法 | |
US7558915B2 (en) | System and method for updating the firmware of a device in a storage network | |
US8484413B2 (en) | Recording medium storing control program for decentralized data, storage management program, control node, and disk node | |
US9081697B2 (en) | Storage control apparatus and storage control method | |
JP5545108B2 (ja) | ストレージシステム、制御装置および制御方法 | |
JP2005326935A (ja) | 仮想化ストレージを備える計算機システムの管理サーバおよび障害回避復旧方法 | |
US7216210B2 (en) | Data I/O system using a plurality of mirror volumes | |
JP2016057795A (ja) | ストレージ制御装置,ストレージシステム及びストレージ制御プログラム | |
JP2008299481A (ja) | ストレージシステム及び複数拠点間でのデータコピー方法 | |
JP5825123B2 (ja) | 制御装置、制御システムおよび制御方法 | |
JP2017091456A (ja) | 制御装置、制御プログラムおよび制御方法 | |
JP2013117922A (ja) | ディスクシステム、データ保持装置、及びディスクデバイス | |
US7886186B2 (en) | Storage system and management method for the same | |
JP2010282324A (ja) | ストレージ制御装置、ストレージシステムおよびストレージ制御方法 | |
JP5760585B2 (ja) | ストレージシステムおよび異常発生箇所判定方法 | |
JP2005122453A (ja) | ストレージ装置のディスクコントローラ制御方式およびストレージ装置 | |
US20070234107A1 (en) | Dynamic storage data protection | |
US20190342197A1 (en) | Communicating health status when a management console is unavailable | |
US20090177916A1 (en) | Storage system, controller of storage system, control method of storage system | |
US7529776B2 (en) | Multiple copy track stage recovery in a data storage system | |
JP2007048017A (ja) | ストレージシステム及び記憶制御方法 | |
US20150046601A1 (en) | Network system, maintenance work management method, processing apparatus, and non-transitory computer-readable recording medium recording program | |
US10409663B2 (en) | Storage system and control apparatus | |
JP4080629B2 (ja) | アクセス制御装置及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140819 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150512 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150525 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5760585 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |