JP5573118B2 - ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 - Google Patents
ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 Download PDFInfo
- Publication number
- JP5573118B2 JP5573118B2 JP2009262661A JP2009262661A JP5573118B2 JP 5573118 B2 JP5573118 B2 JP 5573118B2 JP 2009262661 A JP2009262661 A JP 2009262661A JP 2009262661 A JP2009262661 A JP 2009262661A JP 5573118 B2 JP5573118 B2 JP 5573118B2
- Authority
- JP
- Japan
- Prior art keywords
- cable
- disk device
- failure diagnosis
- disk
- error count
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
複数のケーブルのうちいずれかのケーブルで異常が発生した場合、ケーブル異常の原因である可能性が高い被疑レーンを特定する故障診断を行うことを特徴とする。
001 ディスクアレイコントローラ
002 SAS JBOD
003 SAS JBOD
004 SAS JBOD
111 ディスクアレイ装置の診断システム
10 SASコントローラチップ
11 SASコントローラチップ
20、30、40、21、31、41 SAS EXPANDER
22、32、42 SES
2−0〜2−N HDD
3−0〜3−N HDD
4−0〜4ーN HDD
100、200、300 SASケーブル
101、201、301 SASケーブル
1 ディスクアレイ装置の診断システム
2 ディスクアレイコントローラ
21 コントローラチップ
2−3 ケーブル
3 ディスク装置
31 入出力部
32 制御部
33 記憶部
34〜37 HDD
3−4 ケーブル
4 ディスク装置
41 入出力部
42 制御部
43 記憶部
44〜47 HDD
4−5 ケーブル
5 ディスク装置
51 入出力部
52 制御部
53 記憶部
54〜57 HDD
11 ディスクアレイ装置の診断システム
2−1、2−2 ディスクアレイコントローラ
2−11、2−21 コントローラチップ
3−1 ディスク装置
3−11 入出力部
3−12 制御部
3−13〜3−16 HDD
3−2 ディスク装置
3−21 入出力部
3−22 制御部
3−23〜3−26 HDD
4−1 ディスク装置
4−11 入出力部
4−12 制御部
4−13〜4−16 HDD
4−2 ディスク装置
4−21 入出力部
4−22 制御部
4−23〜4−26 HDD
5−1 ディスク装置
5−11 入出力部
5−12 制御部
5−13〜5−16 HDD
5−2 ディスク装置
5−21 入出力部
5−22 制御部
5−23〜4−26 HDD
6〜11 ケーブル
200、300 RAIDコントローラ
400〜900 DE
Claims (51)
- ディスクアレイ装置の故障診断システムにおいて、
リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と、
複数の前記ケーブルと、
を備え、
前記複数のケーブルのうちいずれかのケーブルで異常が発生した場合、前記異常が発生した異常ケーブルを挟むディスク装置は、ケーブル異常の原因である可能性が高い被疑レーンを特定するための故障診断として、
前記異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して順番にデータ転送を行うことにより前記故障診断を行い、
さらに、
前記異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行うことにより前記故障診断を行うことを特徴とするディスクアレイ装置の故障診断システム。 - 前記ケーブルのうち異常が発生している可能性が高い被疑ケーブルを特定し、当該被疑ケーブルを挟む前記ディスク装置に対して故障診断指示を行う制御回路を備え、
前記被疑ケーブルを挟む前記ディスク装置は、前記故障診断指示を受け取ると、特定された前記被疑ケーブルについて前記故障診断を開始することを特徴とする請求項1記載のディスクアレイ装置の故障診断システム。 - データ転送先の前記ディスク装置は、データ転送元の前記ディスク装置および前記制御回路に診断結果を通知することを特徴とする請求項2記載のディスクアレイ装置の故障診断システム。
- 前記故障診断において前記被疑レーンが特定された場合、当該被疑レーンを挟むディスク装置は、当該被疑レーンを切り離すことを特徴とする請求項2または3に記載のディスクアレイ装置の故障診断システム。
- 前記ディスク装置は、複数の記憶ユニットを含み、
前記制御回路は、前記記憶ユニット毎のエラーカウント値および当該エラーカウント値の閾値が格納された記憶手段を含み、
前記制御回路は、前記記憶ユニットへのアクセスエラーが発生したとき、当該記憶ユニットに対応するエラーカウント値を加算し、その加算値が、前記記憶手段に記憶された前記閾値を超えたか否かを判断することにより前記被疑ケーブルを特定することを特徴とする請求項2ないし4のいずれかに記載のディスクアレイ装置の故障診断システム。 - 前記制御回路は、前記アクセスエラーのうちインタフェース系のエラーのみを前記エラーカウント値としてカウントすることを特徴とする請求項5記載のディスクアレイ装置の故障診断システム。
- 前記アクセスエラーを発生した記憶ユニットのエラーカウント値が閾値を超えたとき、前記制御回路は、当該記憶ユニットが属するディスク装置と同一のディスク装置内の他の記憶ユニットの前記エラーカウント値が前記閾値を超えているか否かを判断し、前記他の記憶ユニットの前記エラーカウント値が前記閾値を超えていたとき、自ディスク装置と接続され、かつ、当該自ディスク装置と前記制御回路との間のケーブルを前記被疑ケーブルと特定することを特徴とする請求項5または6記載のディスクアレイ装置の故障診断システム。
- 前記同一のディスク装置において、前記エラーカウント値が前記閾値を超えている前記他の記憶ユニットが所定数以上だったとき、前記制御回路は、自ディスク装置と接続され、
かつ、当該自ディスク装置と前記制御回路との間のケーブルを前記被疑ケーブルと特定することを特徴とする請求項7記載のディスクアレイ装置の故障診断システム。 - 前記制御回路は、前記同一のディスク装置において、エラーカウント値が閾値を超えている前記他の記憶ユニットが全く存在しないとき、前記アクセスエラーを発生した記憶ユニット自身の故障と判断することを特徴とする請求項7または8記載のディスクアレイ装置の故障診断システム。
- 所定の間隔で前記ディスク装置に対して入出力コマンドを出力する制御回路を備え、
前記ディスク装置は、制御手段と、前記入出力コマンドを受け取るべき所定の間隔を示す時間情報とエラーカウント値と当該エラーカウント値の閾値とが格納された記憶手段とを備え、
前記ディスク装置の前記制御手段は、前記制御回路から予め定められた前記所定の間隔で前記入出力コマンドを受け取らないとき、前記エラーカウント値を加算して前記閾値を超えたか否かを判断し、当該閾値を超えた場合に前記故障診断を開始することを特徴とする請求項1記載のディスクアレイ装置の故障診断システム。 - 前記ディスク装置の前記制御手段は、前記エラーカウント値が前記閾値を超えていたときに、前記ディスク装置と前記制御回路との間に接続されているディスク装置である前段のディスク装置から診断結果を受け取り、前記前段のディスク装置の前記エラーカウント値が前記閾値を超えていない場合に、自ディスク装置と前記前段のディスク装置とを接続しているケーブルを前記被疑ケーブルと特定することを特徴とする請求項10記載のディスクアレイ装置の故障診断システム。
- 前記ディスク装置の前記制御手段は、自ディスク装置に最も近い前記前段のディスク装置から前記診断結果を受け取ることを特徴とする請求項11記載のディスクアレイ装置の故障診断システム。
- 前記前段のディスク装置の前記エラーカウント値が前記閾値を超えていた場合に、前記前段のディスク装置において前記故障診断が行われることを特徴とする請求項11または12記載のディスクアレイ装置の故障診断システム。
- リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と、複数の前記ケーブルとを備えたディスクアレイ装置の故障診断方法において、
前記複数のケーブルのうちいずれかのケーブルで異常が発生した場合、ケーブル異常の原因である可能性が高い被疑レーンを特定する故障診断を行う故障診断ステップを有し、
前記故障診断ステップにおいて、前記異常が発生した異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して順番にデータ転送を行うことにより前記故障診断が行われ、
さらに、
前記故障診断ステップにおいて、前記異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行うことにより前記故障診断が行われることを特徴とするディスクアレイ装置の故障診断方法。 - 前記ディスクアレイ装置は、さらに制御回路を備え、
前記故障診断ステップは、
前記制御回路が、異常が発生している可能性が高い被疑ケーブルを特定する第1被疑ケーブル特定ステップと、
前記制御回路が、当該被疑ケーブルを挟む前記ディスク装置に対して故障診断指示を行う故障診断指示ステップと、
前記被疑ケーブルを挟む前記ディスク装置が、前記故障診断指示を受け取ると、特定された前記被疑ケーブルについて前記故障診断を開始する第1故障診断開始ステップと、
を有することを特徴とする請求項14記載のディスクアレイ装置の故障診断方法。 - データ転送先の前記ディスク装置が、データ転送元の前記ディスク装置および前記制御回路に診断結果を通知する通知ステップを有することを特徴とする請求項15記載のディスクアレイ装置の故障診断方法。
- 前記故障診断ステップは、
前記被疑レーンが特定された場合、当該被疑レーンを切り離す切り離しステップを有することを特徴とする請求項15または16記載のディスクアレイ装置の故障診断方法。 - 前記ディスク装置は複数の記憶ユニットを含み、
前記第1被疑ケーブル特定ステップは、
前記記憶ユニット毎のエラーカウント値および当該エラーカウント値の閾値を前記制御回路の記憶手段に格納する第1格納ステップと、
前記制御回路が、前記記憶ユニットへのアクセスエラーが発生したとき、当該記憶ユニットに対応するエラーカウント値を加算する第1加算ステップと、
前記加算されたエラーカウント値が前記記憶手段に記憶された前記閾値を超えたか否かを判断する第1判断ステップと、
を備えることを特徴とする請求項15ないし17のいずれかに記載のディスクアレイ装置の故障診断方法。 - 前記第1格納ステップおよび前記第1加算ステップにおいて、
前記アクセスエラーのうちインタフェース系のエラーのみをカウントすることを特徴とする請求項18記載のディスクアレイ装置の故障診断方法。 - 前記第1被疑ケーブル特定ステップは、
前記第1判断ステップにおいて、前記加算されたエラーカウント値が前記閾値を超えたとき、当該記憶ユニットが属するディスク装置と同一のディスク装置内の他の記憶ユニットのエラーカウント値が閾値を超えているか否かを判断する第2判断ステップと、
前記他の記憶ユニットのエラーカウント値が閾値を超えていたとき、自ディスク装置と接続され、かつ、当該自ディスク装置と前記制御回路との間のケーブルを前記被疑ケーブルと特定する第1特定ステップと、
を有することを特徴とする請求項18または19記載のディスクアレイ装置の故障診断方法。 - 前記第1特定ステップにおいて、
前記同一のディスク装置において、前記エラーカウント値が前記閾値を超えている前記他の記憶ユニットが所定数以上だったとき、自ディスク装置と接続され、かつ、当該自ディスク装置と前記制御回路との間のケーブルを被疑ケーブルと特定することを特徴とする請求項20記載のディスクアレイ装置の故障診断方法。 - 前記第1被疑ケーブル特定ステップは、
前記第2判断ステップにおいて、前記同一のディスク装置の中でエラーカウント値が閾値を超えている他の記憶ユニットが全く存在しないとき、前記アクセスエラーを発生した記憶ユニット自身の故障と判断する第3判断ステップを有することを特徴とする請求項20または21記載のディスクアレイ装置の故障診断方法。 - 前記ディスクアレイ装置は、さらに制御回路を備え、
前記故障診断ステップは
前記制御回路が、所定の間隔で前記ディスク装置に対して入出力コマンドを出力するコマンド送信ステップと、
前記ディスク装置が、異常が発生している可能性が高い被疑ケーブルを特定する第2被疑ケーブル特定ステップと、
を有し、
前記第2被疑ケーブル特定ステップは、
前記入出力コマンドを受け取るべき所定の間隔を示す時間情報とエラーカウント値と当該エラーカウント値の閾値とを前記ディスク装置の記憶手段に格納する第2格納ステップと、
前記制御回路から前記所定の間隔で入出力コマンドを受け取らないとき、前記エラーカウント値を加算する第2加算ステップと、
前記加算されたエラーカウントが前記閾値を超えたか否かを判断し、前記閾値を超えた場合に前記故障診断を開始する第2故障診断開始ステップと、
を有することを特徴とする請求項14記載のディスクアレイ装置の故障診断方法。 - 前記第2被疑ケーブル特定ステップは、
前記ディスク装置が、前記エラーカウントの閾値を超えていた場合に、当該ディスク装置と前記制御回路との間に接続されているディスク装置である前段のディスク装置から診断結果を受け取る受取ステップと、
前記前段のディスクアレイ装置の前記エラーカウント値が前記閾値を超えていない場合に、自ディスク装置と前記前段のディスク装置とを接続しているケーブルを前記被疑ケーブルと特定する第2特定ステップと、
を有することを特徴とする請求項23記載のディスクアレイ装置の故障診断方法。 - 前記受取ステップにおいて、
前記ディスク装置が、自ディスク装置に最も近い前記前段のディスク装置から前記診断結果を受け取ることを特徴とする請求項24記載のディスクアレイ装置の故障診断方法。 - 前記第2被疑ケーブル特定ステップにおいて、前記前段のディスクアレイ装置の前記エラーカウント値が前記閾値を超えていたとき、前記前段のディスク装置において前記受取ステップおよび前記第2特定ステップを繰り返すことを特徴とする請求項24または25記載のディスクアレイ装置の故障診断方法。
- リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と、複数の前記ケーブルとを備えたディスクアレイ装置におけるディスク装置において、
前記複数のケーブルのうちいずれかのケーブルで異常が発生した場合、ケーブル異常の原因である可能性が高い被疑レーンを特定する故障診断を行う場合、
前記ディスク装置が異常ケーブルを挟む他のディスク装置と、前記異常ケーブルの各レーンに対して順番にデータ転送を行うことにより前記故障診断を行い、
さらに、
前記ディスク装置が異常ケーブルを挟む前記他のディスク装置と、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行うことにより前記故障診断を行うことを特徴とするディスク装置。 - 前記ディスクアレイ装置は、異常が発生している可能性が高い被疑ケーブルを特定して当該被疑ケーブルを挟む前記ディスク装置に対して故障診断指示を行う制御回路を備えており、
前記制御回路から前記故障診断指示を受け取ると、特定された前記被疑ケーブルについて前記故障診断を開始することを特徴とする請求項27記載のディスク装置。 - 前記制御回路に診断結果を通知することを特徴とする請求項28記載のディスク装置。
- 前記故障診断において前記被疑レーンが特定されたとき、当該被疑レーンを切り離すことを特徴とする請求項28または29のいずれかに記載のディスク装置。
- 制御手段と、
前記制御回路から入出力コマンドを受け取るべき所定の間隔を示す時間情報とエラーカウント値と当該エラーカウント値の閾値とが格納された記憶手段と、
を備え、
前記制御手段は、前記ディスクアレイコントローラから予め定められた前記所定の間隔で前記入出力コマンドを受け取らないとき、前記エラーカウント値を加算して前記閾値を超えたか否かを判断し、当該閾値を超えた場合に前記故障診断を開始することを特徴とする請求項28ないし30のいずれかに記載のディスク装置。 - 前記制御手段は、前記エラーカウント値が前記閾値を超えていたときに、前記ディスク装置と前記制御回路との間に接続されているディスク装置である前段のディスク装置から診断結果を受け取り、前記前段のディスク装置の前記エラーカウントが前記閾値を超えていない場合に、自ディスク装置と前記前段のディスク装置とを接続しているケーブルを前記被疑ケーブルと特定することを特徴とする請求項31記載のディスク装置。
- 前記制御手段は、自ディスク装置に最も近い前記前段のディスク装置から診断結果を受け取ることを特徴とする請求項32記載のディスク装置。
- リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と複数の前記ケーブルとを備えたディスクアレイ装置におけるディスク装置の故障診断方法において、
前記複数のケーブルのうちいずれかのケーブルで異常が発生した場合、ケーブル異常の原因である可能性が高い被疑レーンを特定する故障診断を行う故障診断ステップを有し、
前記故障診断ステップにおいて、前記異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して順番にデータ転送を行い、
さらに、
前記前記故障診断ステップにおいて、前記異常ケーブルを挟むディスク装置が、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行うことにより前記故障診断を行うことを特徴とするディスク装置の故障診断方法。 - 前記故障診断ステップは
所定の間隔で、前記ディスク装置に接続された制御回路から入出力コマンドを受け取るコマンド受信ステップと、
異常が発生している可能性が高い被疑ケーブルを特定する被疑ケーブル特定ステップと、
を有し、
前記被疑ケーブル特定ステップは、
前記入出力コマンドを受け取るべき所定の間隔を示す時間情報とエラーカウント値と当該エラーカウント値の閾値とを前記ディスク装置の記憶手段に格納する第2格納ステップと、
前記制御回路から前記所定の間隔で入出力コマンドを受け取らないとき、前記エラーカウント値を加算する第2加算ステップと、
前記加算されたエラーカウント値が前記記憶手段に記憶された前記閾値を超えたか否かを判断し、前記閾値を超えた場合に前記故障診断を開始する故障診断開始ステップと、
を有することを特徴とする請求項34記載のディスク装置の故障診断方法。 - 前記被疑ケーブル特定ステップは、
前記ディスク装置が、前記エラーカウントの閾値を超えていた場合に、当該ディスク装置と前記制御回路との間に接続されているディスク装置である前段のディスク装置から診断結果を受け取る受取ステップと、
前記前段のディスクアレイ装置の前記エラーカウントが前記閾値を超えていない場合に、
自ディスク装置と前記前段のディスク装置とを接続しているケーブルを前記被疑ケーブルと特定する特定ステップと、
を有することを特徴とする請求項35記載のディスク装置の故障診断方法。 - 前記受取ステップにおいて、
前記ディスク装置が、自ディスク装置に最も近い前記前段のディスク装置から前記診断結果を受け取ることを特徴とする請求項36記載のディスク装置の故障診断方法。 - リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と複数の前記ケーブルとを備えたディスクアレイ装置におけるディスクアレイコントローラにおいて、
異常が発生している可能性が高い被疑ケーブルを特定する故障診断として、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を行わせ、
さらに、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行わせることを特徴とするディスクアレイコントローラ。 - 前記ディスク装置に備えられた複数の記憶ユニットのそれぞれに対応づけられたエラーカウント値および当該エラーカウント値の閾値が格納される記憶手段と、
前記記憶ユニットへのアクセスエラーが発生したとき、当該記憶ユニットに対応するエラーカウント値を加算して前記閾値を超えたか否かを判断することにより前記被疑ケーブルを特定する制御手段と、
を備えることを特徴とする請求項38記載のディスクアレイコントローラ。 - 前記制御手段は、前記アクセスエラーのうちインタフェース系のエラーのみをカウントすることを特徴とする請求項39記載のディスクアレイコントローラ。
- 前記アクセスエラーを発生した記憶ユニットのエラーカウント値が閾値を超えたとき、前記制御手段は、当該記憶ユニットが属するディスク装置と同一のディスク装置内の他の記憶ユニットの前記エラーカウント値が前記閾値を超えているか否かを判断し、前記他の記憶ユニットの前記エラーカウント値が前記閾値を超えていたとき、当該ディスク装置と接続され、かつ、当該ディスク装置と自ディスクアレイコントローラとの間のケーブルを前記被疑ケーブルと特定することを特徴とする請求項39または40記載のディスクアレイコントローラ。
- 前記同一のディスク装置において、前記エラーカウント値が前記閾値を超えている前記他の記憶ユニットが所定数以上だったとき、前記制御手段は、当該ディスク装置と接続され、かつ、当該ディスク装置と自ディスクアレイコントローラとの間のケーブルを前記被疑ケーブルと特定することを特徴とする請求項41記載のディスクアレイコントローラ。
- 前記制御手段は、前記同一のディスク装置において、エラーカウント値が閾値を超えている前記他の記憶ユニットが全く存在しないとき、前記アクセスエラーを発生した記憶ユニット自身の故障と判断することを特徴とする請求項41または42記載のディスクアレイコントローラ。
- リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と前記複数のケーブルとを備えたディスクアレイ装置におけるディスクアレイコントローラにおいて、
所定の間隔で前記ディスク装置に対して入出力コマンドを送信して、
異常が発生している可能性が高い被疑ケーブルを特定する故障診断として、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を行わせ、
さらに、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行わせることを特徴とするディスクアレイコントローラ。 - リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置と複数の前記ケーブルとを備えたディスクアレイ装置におけるディスクアレイコントローラの故障診断方法において、
異常が発生している可能性が高い被疑ケーブルを特定する故障診断を行う故障診断ステップを有し、
前記故障診断ステップにおいて、前記異常が発生した異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を行わせることにより前記故障診断を行い、
さらに、
前記故障診断ステップにおいて、前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行わせることにより前記故障診断を行うことを特徴とするディスクアレイコントローラの故障診断方法。 - 前記故障診断ステップは、
前記ディスク装置に備えられた複数の記憶ユニットのそれぞれに対応づけられたエラーカウント値および当該エラーカウント値の閾値を記憶手段に格納する格納ステップと、
前記記憶ユニットへのアクセスエラーが発生したとき、当該記憶ユニットに対応するエラーカウント値を加算して前記閾値を超えたか否かを判断することにより前記被疑ケーブルを特定する被疑ケーブル特定ステップと、
を有することを特徴とする請求項45記載のディスクアレイコントローラの故障診断方法。 - コンピュータに、
複数の前記コンピュータを接続し、かつ、リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置を接続する複数のレーンから構成されるケーブルにおいて異常が発生したとき、ケーブル異常の原因である可能性が高い被疑レーンを特定する故障診断を行う故障診断ステップとして、
前記異常が発生した異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を実行させ、
さらに、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を実行させることを特徴とするディスク装置の故障診断プログラム。 - 前記故障診断ステップは、
所定の間隔で、自コンピュータに接続された制御回路から入出力コマンドを受け取るコマンド受信ステップと、
異常が発生している可能性が高い被疑ケーブルを特定する被疑ケーブル特定ステップと、
を有し、
前記被疑ケーブル特定ステップは、
前記入出力コマンドを受け取るべき所定の間隔を示す時間情報とエラーカウント値と当該エラーカウント値の閾値とを自コンピュータの記憶手段に格納する第2格納ステップと、
前記制御回路から前記所定の間隔で入出力コマンドを受け取らないとき、前記エラーカウント値を加算する第2加算ステップと、
前記加算されたエラーカウント値が前記閾値を超えたか否かを判断し、前記閾値を超えた場合に前記故障診断を開始する故障診断開始ステップと、
を有することを特徴とする請求項47に記載のディスク装置の故障診断プログラム。 - コンピュータに、
リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数の前記ケーブルにより接続された複数のディスク装置を接続する複数のケーブルのうち、異常が発生している可能性が高い被疑ケーブルを特定する故障診断を行う故障診断ステップとして、
前記異常が発生した異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を実行させ、
さらに、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を実行させることを特徴とするディスクアレイコントローラの故障診断プログラム。 - 前記故障診断ステップは、
前記ディスク装置に含まれる複数の記憶ユニットのそれぞれに対応づけられたエラーカウント値および当該エラーカウント値の閾値を記憶手段に格納する格納ステップと、
前記記憶ユニットへのアクセスエラーが発生したとき、当該記憶ユニットに対応するエラーカウント値を加算して前記閾値を超えたか否かを判断することにより前記被疑ケーブルを特定する被疑ケーブル特定ステップと、
を有することを特徴とする請求項49記載のディスクアレイコントローラの故障診断プログラム。 - コンピュータに、
リソースを監視する制御部と、リソースの監視に関する情報を格納する記憶部と、記憶ユニットである複数のHDDと、複数のレーンを含むケーブルに接続する入出力部とを備え、複数のレーンを含むケーブルにより接続された複数のディスク装置に対して、
所定の間隔で入出力コマンドを送信する送信ステップを実行させ、
異常が発生している可能性が高い被疑ケーブルを特定する故障診断として、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して順番にデータ転送を行わせ、
さらに、
前記異常ケーブルを挟むディスク装置に、前記異常ケーブルの各レーンに対して、交互に双方向のデータ転送を行わせることを特徴とするディスクアレイコントローラの故障診断プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009262661A JP5573118B2 (ja) | 2009-11-18 | 2009-11-18 | ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009262661A JP5573118B2 (ja) | 2009-11-18 | 2009-11-18 | ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011108006A JP2011108006A (ja) | 2011-06-02 |
JP5573118B2 true JP5573118B2 (ja) | 2014-08-20 |
Family
ID=44231398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009262661A Active JP5573118B2 (ja) | 2009-11-18 | 2009-11-18 | ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5573118B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6036073B2 (ja) | 2012-09-19 | 2016-11-30 | 富士通株式会社 | 送信ユニット、診断方法及び診断プログラム |
WO2015059804A1 (ja) * | 2013-10-24 | 2015-04-30 | 株式会社日立製作所 | ストレージシステムおよびその制御方法 |
CN112463045B (zh) * | 2020-11-23 | 2023-01-10 | 苏州浪潮智能科技有限公司 | 磁盘冗余阵列多样性批量控制方法、装置、设备、产品 |
CN117785074A (zh) * | 2024-02-28 | 2024-03-29 | 济南浪潮数据技术有限公司 | 一种输入输出超时处理的方法、装置、服务器及介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11296311A (ja) * | 1998-04-08 | 1999-10-29 | Hitachi Ltd | 記憶装置の耐故障制御方式 |
JP2001306262A (ja) * | 2000-04-26 | 2001-11-02 | Hitachi Ltd | 情報処理システムの制御方法および情報処理システム |
JP4465905B2 (ja) * | 2001-04-16 | 2010-05-26 | 株式会社デンソー | 電子制御装置 |
JP4322659B2 (ja) * | 2003-12-19 | 2009-09-02 | エヌイーシーコンピュータテクノ株式会社 | シリアル伝送制御装置、コンピュータシステム、および、シリアル伝送制御方法 |
JP2005251078A (ja) * | 2004-03-08 | 2005-09-15 | Hitachi Ltd | 情報処理装置、及び情報処理装置の制御方法 |
JP4558519B2 (ja) * | 2005-01-18 | 2010-10-06 | 富士通株式会社 | 情報処理装置およびシステムバス制御方法 |
JP2006285519A (ja) * | 2005-03-31 | 2006-10-19 | Hitachi Global Storage Technologies Netherlands Bv | データ転送システムの障害診断方法、データ転送システム及びデータ記憶装置 |
JP2007094996A (ja) * | 2005-09-30 | 2007-04-12 | Fujitsu Ltd | データストレージシステム、データストレージ制御装置及びその障害箇所診断方法 |
JP5068023B2 (ja) * | 2006-03-29 | 2012-11-07 | 株式会社日立製作所 | 計算機システム及び論理パス切替方法 |
JP5151500B2 (ja) * | 2008-01-18 | 2013-02-27 | 日本電気株式会社 | コンピュータシステム、障害処理方法および障害処理プログラム |
JP5127491B2 (ja) * | 2008-02-08 | 2013-01-23 | 株式会社日立製作所 | ストレージサブシステム及びこれの制御方法 |
JP4542163B2 (ja) * | 2008-02-27 | 2010-09-08 | 富士通株式会社 | ディスクアレイ装置、ディスクアレイ制御方法及びディスクアレイ制御装置 |
JP2009211322A (ja) * | 2008-03-03 | 2009-09-17 | Nec Corp | 管理制御装置、データ記憶システム、障害処理方法、及び障害処理プログラム |
-
2009
- 2009-11-18 JP JP2009262661A patent/JP5573118B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011108006A (ja) | 2011-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8402189B2 (en) | Information processing apparatus and data transfer method | |
US7356638B2 (en) | Using out-of-band signaling to provide communication between storage controllers in a computer storage system | |
CN100495355C (zh) | 从磁盘阵列中隔离驱动器以用于诊断操作的系统和方法 | |
EP1881407A2 (en) | Storage control system, control method for storage control system, port selector, and controller | |
US20070113006A1 (en) | Apparatus and method to configure one or more storage arrays | |
CN107870832B (zh) | 基于多维度健康诊断方法的多路径存储设备 | |
US20120233399A1 (en) | Storage apparatus and method of controlling the same | |
KR101200998B1 (ko) | 멀티 pci 버스 스위칭을 갖는 하이브리드 raid 컨트롤러 | |
WO2011132922A2 (ko) | 반도체 저장장치를 위한 알에이아이디 제어기 및 그 제공 방법 | |
US7506200B2 (en) | Apparatus and method to reconfigure a storage array disposed in a data storage system | |
JP5573118B2 (ja) | ディスクアレイ装置の故障診断システム、故障診断方法、故障診断プログラムおよびディスク装置 | |
US9575855B2 (en) | Storage apparatus and failure location identifying method | |
US11068337B2 (en) | Data processing apparatus that disconnects control circuit from error detection circuit and diagnosis method | |
US20080010494A1 (en) | Raid control device and failure monitoring method | |
JP2016046702A (ja) | 通信システム,異常制御装置および異常制御方法 | |
WO2013027997A2 (en) | Network-capable raid controller for a semiconductor storage device | |
WO2012018217A2 (en) | Raid controller having multi pci bus switching | |
JP2015084144A (ja) | ストレージ制御装置、ストレージ装置、及びストレージ制御プログラム | |
US20140019646A1 (en) | Service Channel For Connecting A Host Computer To Peripheral Devices | |
JP2018005826A (ja) | 制御装置、及びストレージ装置 | |
US10409663B2 (en) | Storage system and control apparatus | |
WO2011024221A1 (en) | Remote copy system | |
US8874972B2 (en) | Storage system and method for determining anomaly-occurring portion | |
WO2012177056A2 (en) | Two-way raid controller with programmable host interface for a semiconductor storage device | |
WO2012169825A2 (en) | Two-way raid controller for a semiconductor storage device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110706 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131016 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140603 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140616 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5573118 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |