JP2912802B2 - ディスクアレイ装置の故障対処方法および装置 - Google Patents

ディスクアレイ装置の故障対処方法および装置

Info

Publication number
JP2912802B2
JP2912802B2 JP5256217A JP25621793A JP2912802B2 JP 2912802 B2 JP2912802 B2 JP 2912802B2 JP 5256217 A JP5256217 A JP 5256217A JP 25621793 A JP25621793 A JP 25621793A JP 2912802 B2 JP2912802 B2 JP 2912802B2
Authority
JP
Japan
Prior art keywords
disk
spare
disk device
spare disk
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5256217A
Other languages
English (en)
Other versions
JPH07110743A (ja
Inventor
浩文 森田
圭一 依光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP5256217A priority Critical patent/JP2912802B2/ja
Publication of JPH07110743A publication Critical patent/JPH07110743A/ja
Priority to US08/690,595 priority patent/US5872906A/en
Application granted granted Critical
Publication of JP2912802B2 publication Critical patent/JP2912802B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のディスク装置を
並列的にアクセスしてデータの読み書きを行うディスク
アレイ装置に関し、特に、ディスク故障時に予備ディス
ク装置を割当て代替させるディスクアレイ装置の故障対
処方法および装置に関する。ディスクアレイ装置は、単
体の物理デバイスとして処理されていたディスク装置を
複数台並列に組み合わせ同時動作させることで、高性能
或いは高信頼性を達成する。
【0002】冗長用ディスク装置を設けることでディス
ク故障時のデータ修復を可能とするためには、故障ディ
スク装置の代替先となる予備用ディスク装置の割当てが
重要であり、且つディスクアレイの性能低下を引き起こ
さないような適切な予備ディスク装置の割当が要求され
る。
【0003】
【従来の技術】図14は従来のディスクアレイ装置の概
略を示し、ホストコンピュータ10に対する入出力サブ
システムとして、コントローラ12の配下にディスクア
レイ28が接続される。ディスクアレイ28に設けられ
た複数のディスク装置30−00〜30−35は、ポー
トP0〜P5とランクR0〜R3で物理的な位置が特定
される。ポートP0〜P5はコントローラ12からの並
列的な入出力が行われるデバイスインタフェースであ
る。ランクRO〜R3はポートP0〜P5に接続された
複数のディスク装置のポート方向の並び段数をいう。
【0004】ディスクアレイ28に設けた複数のディス
ク装置30−00〜30−35は、データを格納するデ
ータ用ディスク装置、冗長データとしてのパリティデー
タを格納するディスク装置、予備として待機するディス
ク装置で構成される。例えばポートP0〜P5に設けた
各ランクR0〜R3の5台のディスク装置30−00〜
30−04、30−10〜30−14,30−20〜3
0−24,30−30〜30−34の各々で1つのパリ
ティグループを構成する。
【0005】例えばランクR0のパリティグループ56
を例にとると、RAID3の動作形態では、ディスク装
置30−00〜30−03の4台がデータ用となり、デ
ィスク装置30−04がパリティ用となる。またRAI
D5の動作形態では、セクタごとにパリティ用ディスク
装置の位置が変化する。データ及びパリティ用のディス
ク装置に対しては、例えばランクR0〜R3ごとに1台
ずつ予備用のディスク装置30−05,30−15,3
0−25,30−35が割当てられている。
【0006】ここでディスクアレイ装置における予備デ
ィスク装置の割当方法には、基本的に次の4つの方法が
考えらられる。 I )予備ディスク装置をランク毎に持つ方法; II)予備ディスク装置を複数ランクで共有する方法; III )予備ディスク装置の位置を固定とする方法; IV)予備ディスク装置の位置を動的とする方法; 図15のフローチャートは、予備ディスク装置をランク
ごとに割当てた場合のエラーリカバリ処理を示す。例え
ば図14のランクR0のディスク装置30−02で故障
が発生したとすると、ステップS1で同一ランクR0に
固定的に定めている予備用ディスク装置30−05を選
択する。
【0007】続いてステップS2で予備用ディスク装置
30−05が使用可能か否かチェックし、使用可能であ
ればステップS3で故障発生ディスク30−02のデー
タをコンストラクションという手法で修復し、選択され
た予備用ディスク装置30−05に格納する。すなわ
ち、故障ディスク装置30−02と同一パリティグルー
プ内の他の正常なディスク装置30−00,30−0
1,30−03,30−04より故障デバイスのデータ
を復元し、予備のディスク装置30−05へ書き込む。
【0008】データ修復が済むとステップS4で予備用
ディスク装置30−05を故障ディスク装置30−02
の代替先として通常動作モードに移行する。この間に故
障したディスク装置30−02を交換修理して復旧す
る。復旧後の処理は予備ディスク装置の位置を固定とす
る方法と動的とする方法で異なる。予備ディスク装置の
位置を固定とする方法では、代替先となってる予備用デ
ィスク装置30−05のデータを復旧したディスク装置
30−02に再び移し替え、ディスク装置30−05を
再び予備用する。
【0009】予備ディスク装置の位置を動的にする方法
では、データ修復の済んだ予備ディクス装置30−05
がパリティグループ内の構成要素となり、故障ディスク
装置30−02の修理交換が済んで復旧すると予備用デ
ィスク装置となり、再度データを移し替える必要はな
い。一方、ステップS2において選択された予備ディス
ク装置30−05も故障を起して使用できなかった場合
には、ステップS5に進んで縮退モードに移行し、エラ
ー終了に至る。
【0010】図16のフローチャートは予備のディスク
装置を複数ランクで共用させた場合、すなわち複数の予
備用ディスク装置をグループ化して共用する場合のエラ
ーリカバリ処理を示す。この場合、例えば図14のディ
スク装置30−02が故障したとすると、まずステップ
S1で故障ディスク装置30−02のランクR0に割当
てられた予備用ディスク装置30−05を選択する。
【0011】しかし、予備用ディスク装置30−05が
故障あるいは他のディスク装置の代替先として既に使用
されている場合はステップS2で使用不可が判別され、
ステップS5で他のランクに予備ディスク装置の残りが
あることを確認し、ステップS6で次のランクR1の予
備用ディスク装置30−15を選択する。このように使
用可能な予備ディスク装置が得られるまでランクに拘束
されることなく選択でき、予備用ディスク装置を選択で
きずに縮退モードに移行してエラー終了となる可能性を
低め、信頼性を向上できる。
【0012】尚、予備用ディスク装置の位置を固定にし
た場合は、故障ディスク装置の復旧後のデータの移し替
えが必要となり、予備用ディスク装置の位置を動的にし
た場合は、故障ディスク装置の復旧後のデータの移し替
えが不要になる。このような従来の予備用ディスク装置
の代替方法を比較すると、図15のランクごとに予備用
ディスク装置を固定した方法は、制御が簡単になるが、
同一ランクの故障が2台になると代替処理ができず、使
用不可になる可能性が高い。
【0013】これに対し図16の予備用ディスク位置を
固定せずにグループ化して共用する方法では、制御は複
雑になるが、予備用ディスク装置が存在する限り代替処
理ができ、使用不可になる可能性が低い。更に、予備用
ディスク装置の位置を固定する方法では、故障修復後の
データ移し替えが必要であるため、データ移し替えの必
要のない予備用ディスク装置の位置を固定とした方法の
方が望ましい。
【0014】その結果、予備用ディスク装置を複数ラン
クで共用し、且つ予備用ディスク装置の位置を固定しな
い方法が最も望ましい代替処理方法といえる。
【0015】
【発明が解決しようとする課題】しかしながら、予備用
ディスク装置を複数ランクで共用し、且つ予備用ディス
ク装置の位置を固定しない方法にあっては、故障ディス
ク装置の代替先としてランダムに予備ディスク装置を選
択すると、同一パリティグループに属する正常なディス
ク装置が割当られているポートに存在する予備用ディス
ク装置を故障ディスク装置の代替先として選択し、1つ
のポートに同じパリティグループに属する2台のディス
ク装置が割当てられてしまう可能性がある。
【0016】例えばRAID3として知られた上位装置
から転送された論理ブロックデータを、所定バイト数単
位にストライピングし、パリティグループ毎にパリティ
データを計算して複数のディスク装置に並列的に分散し
て格納する方法では、同一ポートに故障代替処理によっ
て同じパリティグループに属する2台のディスク装置が
存在すると、同一ポートでは1台のディスク装置にしか
アクセスできないため、アクセス要求に対し2回ずつの
異なるディスク装置に対する逐次的なアクセスを必要と
し、オーバーヘッドが増加して処理性能が著しく低下す
る問題があった。
【0017】この点はRAID5として知られた上位装
置から転送されたブロックデータを、ディスク装置のセ
クタ単位(通常512バイト単位)にストライピング
し、パリティ位置をアクセス毎に変化させて格納するよ
うにした方法においても、同様な問題を生ずる。更に、
同一ポートに同じパリティグループに属する複数のディ
クス装置が割当てられる予備用ディスク装置の代替処理
が行われて処理性能が低下していても、この状態をオペ
レータ又は保守要員が認識できないという問題もあっ
た。
【0018】本発明の目的は、故障発生時の予備用ディ
スク装置による代替先の選択を最適化してデータ修復後
の性能低下を防止するようにしたディスクアレイ装置の
故障対処方法および装置を提供する。
【0019】
【課題を解決するための手段】図1は本発明の原理説明
図であり、装置構成を例にとっており、図1(A)の第
1発明と、図1(B)の第2発明から成る。 [第1発明]まず本発明のディスクアレイ装置は、並列
配置された複数のポートP0〜P5の各々に多段接続さ
れて複数のランクR0〜R3を構成する複数のディスク
装置を備える。
【0020】これらのディスク装置は、データを格納す
るデータ用ディスク装置、所定の冗長グループ単位にデ
ータを収納する複数のデータ用ディスク装置、複数のデ
ータ格納用ディスク装置で構成する冗長グループごとに
冗長データを格納する複数の冗長用ディスク装置、およ
び予備として待機中の予備用ディスク装置に分類され
る。
【0021】このようなディスクアレイ装置につき第1
発明にあっては、データ用ディスク装置または冗長用デ
ィスク装置の故障時に、故障ディスク装置の属する冗長
グループ以外のポートに接続された予備用ディスク装置
を代替先として選択する予備ディスク選択手段52を備
える。例えばディスク装置30−20〜30−24の5
台で1つのパリティグループ58を形成しており、その
中のディスク装置30−22で故障が起きた場合、故障
ディスク装置30−22の属するパリティグループ58
に属するポートP0〜P4以外のポートP5に接続され
た予備用ディスク装置30−05を代替先として選択す
る。
【0022】更に、予備ディスク選択手段52で選択さ
れた予備ディスク装置30−05に故障ディスク装置3
0−22のデータを修復するデータ修復手段56を備え
る。ここで予備ディスク選択手段52は、故障ディスク
装置の属する冗長グループ以外のポートに接続された予
備用ディスク装置が存在しなかった場合は、故障ディス
ク装置の属する冗長グループに含まれるポートに接続さ
れた予備用ディスク装置を代替先として選択する。
【0023】この場合、故障ディスク装置の属する冗長
グループに含まれるポートに接続された予備用ディスク
装置が複数存在したら、統計情報の参照で求めたアクセ
ス回数が最も少いポートの予備ディスク装置を代替先と
して選択する。また予備ディスク選択手段52は、デバ
イス番号をインデックスとして予備用か否かを示す予備
識別子、ポート番号およびランク番号を格納したデバイ
ス管理テーブル54を参照して代替先の予備ディスク装
置を選択する。
【0024】更に、前記予備ディスク選択手段52で、
故障ディスク装置の属する冗長グループ以外のポートに
接続された予備用ディスク装置を代替先として選択でき
なかった場合に、性能低下を外部に出力表示させる出力
表示手段15を設ける。 [第2発明]ポートおよびランクで構成されたディスク
アレイ装置につき第2発明は、初期設定時に、各ランク
ごとに異なるポート位置のディスク装置を最優先順位の
予備用ディスク装置として割当て、更に、下位の順位に
他のランクに割当てた予備用ディスク装置を割当てる予
備ディスク割当手段60を有する。
【0025】データ用ディスク装置または冗長用ディス
ク装置の故障時には、予備ディスク選択手段62が予備
ディスク割当手段60の割当順位に基づいて予備用ディ
スク装置を代替先として選択する。予備ディスク選択手
段62で予備ディスク装置が選択されると、データ修復
手段56が故障ディスク装置のデータ又は冗長ディスク
情報を修復する。
【0026】さらに、予備ディスク選択手段62は、予
備ディスク割当手段60の割当順位に基づいて下位の優
先順位をもつ予備ディスク装置を選択した場合、選択し
た予備ディスク装置と同じランクに属する全てのディス
ク装置のデータチェック数、シークエラー回数等の障害
発生情報の統計値を参照し、この統計値が予め定めた閾
値を越えていた場合は、更に下位の優先順位で割当られ
る予備ディスク装置を選択する。
【0027】
【作用】まず第1発明にあっては、故障ディスク装置が
属するパリティグループ以外のポートに存在する予備用
ディスク装置を最優先に代替先として選択してデータ修
復処理を行うことで、データ修復後に同じパリティグル
ープに含まれる2台以上のディスク装置が同一ポートに
割当てられてしまうことを確実に防止でき、故障代替に
よる性能低下を確実に防止できる。
【0028】また故障ディスク装置が属するパリティグ
ループ以外のポートに存在する予備用ディスク装置を代
替先として選択できなかった場合には、故障ディスク装
置が属するパリティグループ内のポートに接続している
予備用ディスク装置を選択する。この場合、複数の予備
用ディスク装置が選択可能なときは、統計情報を基にア
クセス回数の少ないポート上の予備用ディスク装置を選
択する。
【0029】このため、同一ポート上に同じパリティグ
ループのディスク装置が2台割当られる状態となって
も、アクセス回数の少ないポートであることから、他の
パリティグループのアクセスにより妨げられることが少
なく、性能低下を必要最低限に抑えることができる。更
に、同一ポート上に同じパリティグループに属する複数
台のディスク装置が割当られたことを出力表示すること
で、オペレータ又は保守要員がシステムの性能が低下し
ていることを即座に認識し、必要な保守に取り掛かるこ
とができ、システムの迅速な性能回復が期待できる。
【0030】第2発明にあっては、初期設定でランクご
とに異なるポート位置に予備用ディスク装置を割当て、
且つ故障ディスク装置と同じランクに属する予備用ディ
スク装置を最優先に代替先として割当てていることで、
同じパリティグループに属する複数台のディスク装置を
同一ポートのディスク装置に割当ててしまうことを確実
に防止し、故障代替処理による性能低下を確実に防止で
きる。
【0031】また他のランクの予備用ディスク装置を予
め定めた下位の優先順位に従って選択する場合にも、選
択された予備ディスク装置の属するランクに属するディ
スク装置の障害状態を統計情報からチェックし、障害発
生の可能性が高いと判断した場合には、このランクの予
備用ディスク装置を代替先として選択せずに次の順位の
ランクでの選択を行う。
【0032】この他のランクの予備用ディスク装置を選
択する場合に障害発生状態を考慮することで、故障発生
時に優先順位の最も高い自分のランクの予備用ディスク
装置が他のランクの故障代替処理で使用不可となる事態
を抑制し、他のランクの状態にあまり影響されない最適
な故障代替処理ができる。
【0033】
【実施例】
1.システムのハードウェア構成 図2は本発明の故障対処方法が適用されるディスクアレ
イ装置を用いた入出力サブシステムのハードウェア構成
を示す。ホストコンピュータ10には少なくとも2つの
チャネル装置14−1,14−1が設けられ、チャネル
インタフェース16を介して2台のコントローラ12−
1,12−2を接続している。チャネルインタフェース
16としてはSCSIを使用している。勿論、MBCイ
ンタフェース(ブロック・マルチプレクサ・チャネルイ
ンタフェース)を使用してもよい。
【0034】コントローラ12−1,12−2は入出力
制御手段としての機能を有し、デバイス側の共用バス1
8−1,18−2をブリッジ回路部20で接続して相互
に情報およびデータをやり取りできるようにしている。
また共用バス18−1,18−2のそれぞれにはサブコ
ントローラ22−1,22−2が設けられ、コントロー
ラ12−1,12−2の処理機能を分散させて負荷の低
減を図っている。
【0035】共用バス18−1,18−2にはアダプタ
24−1〜24−6,26−1〜26−6のそれぞれを
介して、ディスクアレイ28に設けている24台のディ
スク装置30−00〜30−34が接続される。ディス
クアレイ28はコントローラ12−1,12−2より並
列的にアクセスを受ける6つのポートP0〜P5で並列
ディスク群を構成し、この並列ディスク群をランクR0
〜R3で示す4ランク分設けている。
【0036】具体的には、ランクR0はポートP0〜P
5に対応した6台のディスク装置30−00〜30−0
5で構成され、ランクR1はポートP0〜P5に対応し
たディスク装置30−1〜30−15で構成され、ラン
クR2はポートP0〜P5に対応したディスク装置30
−20〜30−25で構成され、更にランクR3はポー
トP0〜P5に対応したディスク装置30−30〜30
−35で構成される。
【0037】このようなディスクアレイ28を構成する
ディスク装置の位置は、ランクRとポートPの番号で決
まるアドレス(R,P)で定義される。例えば磁気ディ
スク装置30−00は(R0,P0)で表わすことがで
きる。図3は図2のコントローラ12−1側のハードウ
ェア構成を示す。コントローラ12−1内にはCPU3
2が設けられ、CPU32内の内部バス44にROM3
4、DRAM36、SCSI回路部40とのやり取りを
行う上位インタフェース部38、共用バス18−1側と
のやり取りを行うバスインタフェース部42が設けられ
る。
【0038】更にキャッシュ制御部46とキャッシュメ
モリ48を設け、ディスクキャッシュ機構を実現してい
る。ここで、コントローラ12−1に設けたCPU32
がホストコンピュータ10からアクセス要求を受けたと
きのディスクアレイ28に対する制御は、ホストコンピ
ュータからの指示によりRAID0,RAID1,RA
ID3またはRAID5として知られたいずれかの動作
モードで行われる。
【0039】ここで、このRAIDモードについて簡単
に説明すると次のようになる。従来、カリフォルニア大
学バークレイ校のデビット・A・パターソン(David A.
Patterson)等はディスクアレイを分類するレベルとし
てRAID1〜5を提案している( ACM SIGMOD Confer
ence, Chicago, Illinois, June 1-3, 1988 )。RAI
D0はデータの冗長性をもたないディスクアレイ装置で
あり、デビット・A・パターソン等の分類に含まれては
いないが、これを通常、RAID0と呼んでいる。
【0040】RAID1は2台のディスク装置を1組と
して同一データを書き込むミラーディスク装置であり、
ディスク装置の利用効率が低いが冗長性をもっており、
簡単な制御でできるために広く普及している。RAID
2はデータをビットやバイト単位でストライピングし、
それぞれのディスク装置に並列に書込みを行う。ストラ
イピングしたデータは全てのディスク装置で物理的に同
じセクタに記録する。
【0041】データ用ディスク装置の他にハミングコー
ドを記録するためのディスク装置をもち、ハミングコー
ドから故障したディスク装置を特定してデータを復元す
る。現在のところ、実用化されていない。RAID3は
データをビットまたはバイト単位にストライピングして
パリティを計算し、ディスク装置に対しデータおよびパ
リティを並列的に書き込む。
【0042】RAID3は大量のデータを連続して扱う
場合には有効であるが、少量のデータをランダムにアク
セスするトランザクション処理のような場合にはデータ
転送の高速性が活かせず、効率が低下する。RAID4
は1つのデータをセクタ単位にストライピングして同じ
ディスク装置に書き込む。パリティデータは固定的に決
めたディスク装置に格納する。データ書込みは書込前の
旧データと旧パリティを読み出してから新パリティを計
算して書き込む。
【0043】このため、1回の書込みについて合計4回
のディスクアクセスが必要となる。また書込みの際に必
ずパリティ用のディスク装置へのアクセスが起きるた
め、複数のディスク装置の書込みを同時に実行できな
い。RAID4は定義されているがメリットが少ないた
め、現在のところ、実用化の動きは少ない。RAID5
はパリティ用のディスク装置を固定しないことで並列的
なリード,ライトを可能にしている。即ち、セクタごと
にパリティデータの置かれるディスク装置が異なってい
る。パリティデータが置かれるディスク装置が重複しな
ければ、異なるディスク装置にセクタデータを並列的に
書き込むことができる。
【0044】このようにRAID5は非同期に複数のデ
ィスク装置にアクセスしてリードまたはライトを実行で
きるため、少量データをランダムにアクセスするトラン
ザクション処理に向いている。 2.第1発明による故障代替処理 図4は第1発明による故障代替処理の処理機能を示した
説明図である。説明を簡単にするため、図2のハードウ
ェア構成におけるコントローラ12−1側を代表して示
している。
【0045】コントローラ12−1にはディスクアレイ
制御部50,予備ディスク選択部52,デバイス管理テ
ーブル54,データ修復部56が設けられる。更にコン
トローラ12−1の外部には、オペレータおよび保守要
員に対し出力表示を行う表示装置15を設けている。デ
ィスクアレイ28は6つのポートP0〜P5と4つのラ
ンクR0〜R3をもつ24台のディスク装置30−00
〜30−35で構成された場合を例にとっている。この
内、斜線で示すディスク装置30−05,30−14の
2台が予備用として割り当てられている。
【0046】更に一例として、ランクR2に属する5台
のディスク装置30−20〜30−24でRAID3ま
たはRAID5のパリティグループを構成した場合を例
にとっている。コントローラ12−1に設けられたデバ
イス管理テーブル54には、ディスクアレイ28のディ
スク装置ごとに図5に示す管理情報が格納されている。
このデバイス管理情報は図2に示したアダプタ24−1
〜24−6との対応関係を示すデバイスコントローラI
D70、予備ディスクか否かを示す予備識別子72、自
分の所属するランクのランク番号74、および自分の位
置するポート番号76で構成される。
【0047】デバイスコントローラIDはアダプタ24
−1〜24−6に対応して00〜05が使用される。ま
た予備識別子72は予備機の場合に1、予備機でない場
合に0がセットされる。更にランク番号74はランクR
0〜R4を示す0〜4が使用される。更にポート番号7
6はポートP0〜P5を示す0〜5が使用される。図6
は図3に示したディスクアレイ28におけるディスク装
置の状態を示したデバイス管理テーブル54の一例を示
し、ランクR3までを示している。
【0048】例えばデバイス番号00となるランクR0
に属する先頭のディスク装置30−00を見ると、デバ
イス管理情報は「0000」となっている。先頭の
「0」はデバイスコントローラID70であり、0番で
あることから、図2のアダプタ24−1を示している。
2番目の「0」は予備識別子72であり、0であること
から予備用には割り当てられておらず、通常のデータ用
またはパリティ用のディスク装置であることを示してい
る。
【0049】3番目の「0」はランク番号74であり、
R0であることを示している。4番目の「0」はポート
番号76であり、ポートP0であることを示している。
ここで図3のディスクアレイ28における予備用ディス
ク装置はディスク装置30−05,30−14の2台で
あることから、図6のデバイス番号05におけるデバイ
ス管理情報は「5105」となっており、2番目が
「1」であることから予備用ディスク装置であることを
示している。
【0050】同様に、デバイス番号22のディスク装置
30−14についても、デバイス番号14によるデバイ
ス管理情報は「4114」となり、2番目が「1」であ
ることから予備用ディスク装置であることを示してい
る。再び図3を参照するに、コントローラ12−1に設
けられた予備ディスク選択部52はホストコンピュータ
10からのアクセス要求に基づいて、アクセス対象とな
ったディスクアレイ28の中の任意のディスク装置に対
するセットアップ処理を行った際に、ディスク装置から
ハードエラーなどの復旧不可能なデバイスエラーの通知
を受けると、故障ディスク装置の代替先となる予備ディ
スク装置を選択して、データ修復部56により故障ディ
スク装置のデータを選択した予備ディスク装置に修復す
るための処理を行わせる。
【0051】予備ディスク選択部52による第1発明に
おける予備ディスクの選択ルールは、故障ディスクの属
するパリティグループ以外のポートに存在する予備ディ
スクを選択するというものである。例えば、ディスクア
レイ28のランクR2に位置するパリティグループ58
の中のディスク装置30−22が故障したとする。この
場合、予備ディスク選択部52は故障ディスク装置30
−22が属するパリティグループ58のポートP0〜P
4以外のポート、即ちポートP4のポートP5を選択
し、このパリティグループ以外のポートP5に接続され
ている予備用ディスク装置30−05を代替先として選
択する。
【0052】次に予備ディスク選択部52は、もしパリ
ティグループ以外のポートに使用可能な予備用ディスク
装置が存在しなかった場合には、故障ディスク装置のパ
リティグループ内のポート上に存在する予備用ディスク
装置を選択する。パリティグループ内のポートから予備
用ディスク装置を選択する場合、複数の予備用選択装置
が選択可能な場合にはディスクアレイ制御部50におい
て統計情報としてロギングしている各ポートごとのアク
セス回数を参照し、最もアクセス回数の少ないポートの
予備用ディスク装置を代替先として選択する。
【0053】図7は図3に示したコントローラ12−1
の全体的な処理動作を示したフローチャートである。ま
ずステップS1でホストコンピュータ10からのアクセ
ス要求を判別しており、アクセス要求を受けるとステッ
プS2に進み、アクセス情報から解析したディスクアレ
イ28のアクセス対象となるディスク装置に対するセッ
トアップ処理を実行する。
【0054】このセットアップ処理に対し、もしディス
ク装置側に復旧不可能なハードウェアエラーなどの故障
があるとコントローラ12−1に対しエラー通知を行う
ことから、ステップS3でデバイスエラーを判別し、ス
テップS5に示すエラーリカバリ処理に進む。勿論、デ
バイスエラーがなければステップS4の通常処理に進
み、ホストコンピュータ10からのアクセス要求に基づ
くリード処理またはライト処理を実行する。
【0055】図8のフローチャートは図7のエラーリカ
バリ処理の詳細を示す。このエラーリカバリ処理にあっ
ては、まずステップS1でデバイス管理テーブル54を
参照し、故障ディスク装置の属するパリティグループ以
外のポートに予備用ディスク装置が存在するか否かチェ
ックする。例えばディスクアレイ28のパリティグルー
プ58のディスク装置30−22に対するセットアップ
処理でデバイスエラーが判別されていた場合には、図6
のデバイス管理テーブル54を参照し、デバイス番号2
2番が故障ディスク装置であり、故障ディスク装置を含
むパリティグループ58にはデバイス番号20〜24の
ディスク装置30−20〜30−24が含まれており、
このデバイス管理情報からポートP0〜P4がパリティ
グループ以外のポートであることが判る。
【0056】このためパリティグループ以外のポートは
残りのポートP5となり、ポートP5に接続された予備
用ディスク装置はデバイス番号05のディスク装置30
−05が存在することが判る。このようにパリティグル
ープ以外のポートに存在する予備ディスクがあれば、こ
れを故障ディスク装置の代替先として選択してステップ
S2に進み、故障ディスク装置のデータを選択された予
備用ディスク装置に修復する処理を実行する。
【0057】このデータ修復処理は、故障ディスクを除
くパリティグループに存在する他の正常なディスク装置
から並列的にデータを読み出し、故障ディスク装置のデ
ータを復元して、選択された予備用ディスク装置に書き
込むようになる。ステップS2で予備用ディスク装置に
対するデータ修復処理が済むと、ステップS3でデバイ
ス管理テーブル54の更新を行う。例えば図6のデバイ
ス番号05を代替先の予備用ディスク装置として選択し
てデータ修復を行った場合には、そのデバイス管理情報
「5105」を「5005」に変更する。
【0058】続いてステップS4で通常モードに移行す
る。この通常モードへの以降に際しては、代替先として
パリティグループに含まれることとなった予備用ディス
ク装置のデバイス番号を、パリティグループを構成する
故障ディスク装置のデバイス番号と入れ替えて、データ
修復後のパリティグループの構成ディスク装置にセット
する。
【0059】一方、ステップS1でパリティグループ以
外のポートに予備用ディスク装置がなかった場合には、
ステップS5で性能低下コードを表示装置15に出力し
て表示させ、オペレータあるいは保守要員により処理性
能が低下した動作状態にあることを認識可能とする。続
いてステップS6でパリティグループ内のポートに予備
用ディスク装置があるか否か、デバイス管理テーブル5
4を参照してチェックする。パリティグループ内のポー
トに予備用ディスク装置があればステップS7に進み、
予備用ディスク装置は複数台あるか否かチェックする。
【0060】1台しかなければ、この予備用ディスク装
置を代替先として選択し、ステップS2のデータ修復処
理に進む。予備用ディスク装置が複数台存在した場合に
はステップS8に進み、各予備用ディスク装置が位置す
るポートについてディスクアレイ制御部50側で統計情
報として記録しているアクセス回数を参照し、アクセス
回数が最小となるポートの予備用ディスク装置を選択し
てステップS2のデータ修復処理に進む。
【0061】更にステップS6でパリティグループ内の
ポートにも予備用ディスク装置がなかった場合には故障
ディスク装置の代替処理はできないことから、ステップ
S9で縮退動作モードへ移行し、実質的にパリティグル
ープとしてのアクセス処理は不可能であることから故障
ディスク装置を含むパリティグループに対するアクセス
を禁止し、それ以外の有効なパリティグループのみに対
するアクセスを許容する、機能が縮小した動作モードと
する。
【0062】勿論、故障ディスク装置を含むパリティグ
ループの機能が停止したことを表示装置15に出力表示
し、オペレータあるいは保守要員による対応処理を促
す。図9は図8のステップS1でパリティグループ以外
のポートに予備用ディスク装置が存在しない場合のディ
スクアレイ28の状態を示している。この場合にはラン
クR2に属するディスク装置30−20〜30−24で
構成されるパリティグループ56の中のディスク装置3
0−22の故障時に、斜線部で示す予備用ディスク装置
30−04,30−10がパリティグループ56以外の
ポートP1,P5に位置していた場合である。この図9
の状態におけるデバイス管理テーブル54を図10に示
す。即ち、デバイス番号04の予備用ディスク装置30
−4のデバイス管理情報は「4104」で、2番目が
「1」であることから予備用の割当てを示しており、同
じくデバイス番号10のディスク装置30−10もデバ
イス管理情報は「0110」で、2番目が「1」である
ことから予備用の割当てを示している。
【0063】この図9に示すような状態にあっては、故
障ディスク装置30−22の属するパリティグループ5
8以外のポートP5には予備用ディスク装置は存在しな
いため、パリティグループ58内のポートP0〜P4に
存在する予備用ディスク装置を代替先として選択する。
この場合にはポートP0とP4に1台ずつ、合計2台の
予備用ディスク装置30−04,30−10が存在す
る。そこで、ポートP0に接続されているディスク装置
30−00,30−10,30−20,30−30につ
いての統計情報としてコントローラ側で記録しているア
クセス回数の合計値を求める。
【0064】同様に、ポートP4に接続しているディス
ク装置30−04,30−14,30−24,30−3
4についてのアクセス回数の合計値を求める。そしてア
クセス回数の合計値の少ない方のポート、例えばポート
P0の予備用ディスク装置30−10を代替先として選
択し、故障ディスク装置30−22のデータを修復す
る。
【0065】このような予備用ディスク装置30−10
の選択によるデータ修復で、データ修復後のパリティグ
ループはディスク装置30−10,30−20,30−
21,30−23,30−24の5台で構成される。こ
のためポートP0には同じパリティグループに属する2
台のディスク装置30−10,30−20が存在するこ
とになる。
【0066】この状態でRAID3によってアクセスす
る場合、あるいはRAID5でディスク装置30−1
0,30−20を同時にアクセスする場合にあっては、
ポートP0より2回に分けてディスク装置30−10,
30−20をアクセスする必要があり、その分だけ処理
性能が低下する。しかしながら、代替先として選択され
た予備用ディスク装置30−10はアクセス回数の最も
少ないポートP0側を選んでいるため、他のパリティグ
ループによるアクセス、即ちディスク装置30−00,
30−30によるアクセスがもともと少ないことから、
これに妨げられずに処理性能の低下を必要最小限に抑え
ることができる。
【0067】尚、パリティグループ内のポートから予備
用ディスク装置を選択する場合、エラーディスク装置3
0−22と同一ポートP2に存在する予備用ディスク装
置が選択できた場合には、データ修復後は異なるランク
に跨ってパリティグループが構成されるだけであり、処
理性能の低下は基本的には起きない。但し、パリティグ
ループが異なるランクに亘って形成されることで、ホス
トコンピュータからの論理デバイス番号によるパリティ
グループの指定に対し、物理デバイスへの変換が多少、
複雑になる。 3.第2発明の処理機能 図11は第2発明の処理機能を示した説明図であり、図
2のハードウェア構成におけるコントローラ12−1側
を取り出して示している。
【0068】コントローラ12−1にはディスクアレイ
制御部50,予備ディスク割当テーブル60,予備ディ
スク選択部62およびデータ修復部56が設けられる。
ディスクアレイ28は図3の第1発明の場合と同様、6
つのポートP0〜P5と4つのランクR0〜R3で構成
された24台のディスク装置30−00〜30−35で
構成される。
【0069】予備ディスク割当テーブル60は初期設定
の段階でディスクアレイ28のランクR0〜R3に1台
ずつ、予備用ディスク装置を割り当て、且つランクごと
に予備用ディスク装置の位置が異なるように割り当てて
いる。例えば、ランクR0にはポートP5に予備用ディ
スク装置30−05が割り当てられ、ランクR1は次の
ポートP4に予備用ディスク装置30−14が割り当て
られ、ランクR2についてはポートP3に予備用ディス
ク装置30−23が割り当てられ、更にランクR3につ
いてはポートP2に予備用ディスク装置30−32が割
り当てられている。
【0070】このようなランクごとに位置が異なる予備
用ディスク装置の割当てに対し、残りのディスク装置に
ついて、ディスクアレイ制御部50は論理デバイスグル
ープ60−0〜60−7を設定している。例えば、ラン
クR0のポートP0〜P4の5台のディスク装置30−
00〜30−04で形成した論理デバイスグループ60
−0は、RAID3またはRAID5で動作される。
【0071】またランクR1に形成された論理デバイス
グループ60−1,60−2については、2台のディス
ク装置を有することからRAID1のミラーディスクと
して動作される。更にランクR2の論理グループ60−
4の3台のディスク装置30−20〜30−22につい
ては、パリティディスクをもたないRAID0の動作モ
ードによる並列アクセスに使用される。
【0072】他の論理グループ60−5〜60−7につ
いても必要に応じて適宜のRAIDの動作形態を設定で
きる。またランクR3に示す論理デバイスグループ60
−6,60−7を組み合わせることでRAID3または
RAID5の動作を行ってもよい。図12は図11の予
備ディスク割当テーブル60の具体的な構成を示した説
明図である。
【0073】予備ディスク割当テーブル60はディスク
アレイ28について設定した論理デバイスグループの論
理デバイス番号0〜7をインデックスとしてランク情報
を格納する。ランク情報に続いては、予備用ディスク装
置としての選択順位を優先順位0,1,2,3として定
めている。まずランクR0を示すランク番号0の論理デ
バイスグループ60−0の論理デバイス番号0を見る
と、同じランクに属するディスク装置30−05のデバ
イス番号05が最優先順位0に格納されている。この点
は他の論理デバイス1〜7についても自己のランクに設
けた予備用ディスク装置を最優先順位0に設定してい
る。
【0074】下位の優先順位1〜3については、例えば
ランクR0の論理デバイスグループ60−0については
ランクR1,R2,R3の順番に各ランクの予備用ディ
スク装置30−14,30−23,30−32のデバイ
ス番号を登録している。コントローラ12−1に設けた
予備ディスク選択部62はセットアップ処理によりディ
スク装置の故障を判別すると、故障ディスク装置の属す
る論理デバイスグループのデバイスIDにより予備ディ
スク割当テーブル60を参照し、優先順位0の予備用デ
ィスク装置を選択し、データ修復部56による故障ディ
スク装置からのデータ修復を行う。
【0075】一方、最優先順位0の予備用ディスク装置
が故障あるいは他のランクによる故障代替先の選択で使
用できなかった場合には、優先順位1位の他のランクに
存在する予備用ディスク装置を選択する。この他のラン
クに存在する予備用ディスク装置の選択に際しては、そ
のランクに属している全てのディスク装置についてのデ
ータチェック回数および修復回数などの障害情報の統計
値を参照し、予め定めた閾値を越えていた場合には故障
発生の可能性の高いランクであることから、このランク
の予備用ディスク装置を選択せず、次の下位の優先順位
のランクの予備用ディスク装置の選択に移行する処理を
行う。
【0076】図13のフローチャートは図11の第2発
明におけるエラーリカバリ処理の詳細を示したフローチ
ャートである。図7に示したホストコンピュータ10か
らのアクセス要求に対するセットアップ処理を通じてデ
ィスク装置の故障を判別すると、図13のエラーリカバ
リ処理に進み、まずステップS1で予備ディスク割当テ
ーブル60を参照し、故障ディスクの属するランクにお
ける最優先順位0の予備用ディスク装置を選択する。
【0077】選択した予備用ディスク装置がステップS
2で使用可能であればステップS3に進み、故障ディス
ク装置のデータを選択した予備用装置に修復し、ステッ
プS4で通常の動作モードに移行する。ステップS2で
最優先順位0の予備用ディスク装置が使用できなかった
場合にはステップS5に進み、次の優先順位1の他のラ
ンクに属する予備用ディスク装置を選択する。
【0078】この他のランクに属する予備用ディスク装
置がステップS6で使用可能であった場合にはステップ
S7に進み、選択した予備用ディスク装置の属するラン
クの全てのディスク装置におけるデータチェック回数、
シークエラー回数などの障害統計値の合計値を所定の閾
値と比較する。統計値が閾値未満であれば選択した予備
用ディスク装置を代替先として決め、ステップS3に進
み、故障ディスク装置のデータ修復を行う。
【0079】しかしながら、障害統計値が閾値を越えて
いた場合には、そのランクにおける将来的なディスク故
障の発生度合が高いことから、予備用ディスク装置を選
択せずにステップS8に進み、未選択の予備用ディスク
装置の有無をチェックし、未選択の予備用ディスク装置
が残っていれば、ステップS5で次の優先順位2の予備
用ディスク装置を選択し、同様な障害統計値に基づく判
定を繰り返す。
【0080】ステップS5〜S8の処理の繰返しで、結
果的に予備用ディスク装置の選択ができなかった場合に
はステップS9に進み、故障ディスク装置を含む論理グ
ループアドレスのRAIDモードでの動作はできないこ
とから、RAID0,RAID3およびRAID5につ
いては、それ以降の動作を禁止し、またRAID1につ
いてはRAID0の動作モードのみを許容する縮退動作
モードに移行する。
【0081】尚、図11に示した第2発明にあっては、
予備ディスク装置の位置を固定する動作モードとした場
合には、故障ディスク装置の修理交換による復旧後に代
替先となった予備用ディスク装置のデータを復旧したデ
ィスク装置に移し替えて、再び予備用ディスク装置とし
て待機状態にすればよい。また予備用ディスク装置の位
置を動的にした場合には、システムの立上り時に、図1
1に示したランクごとに異なったポート位置に予備ディ
スク装置が割り当てられるので、システムの運用が進ん
で故障ディスクに対する代替処理が繰り返されると予備
用ディスク装置はランダムな位置に存在することにな
る。
【0082】そこで、例えば処理負荷の少ない夜間の時
間帯などにオペレータあるいは保守要員が予備ディスク
装置の割当てに対する初期化処理を要求することで、図
11に示す初期状態に戻すことができる。さらに、上記
の実施例は6ポート,4ランク構成のディスクアレイを
例にとるものであったが、ポート数およびランク数は必
要に応じて適宜に定めることができる。
【0083】またディスクアレイに割り当てる予備用デ
ィスク装置の台数も、第2発明にあっては2台とした場
合を例にとっているが、2台以上の任意の台数を割り当
ててもよい。また第2発明にあっては、予備用ディスク
装置として各ランクごとに1台となる合計4台の割当て
を例にとっているが、信頼性を更に向上する必要がある
場合にはランク当たり2台以上設けてもよい。勿論、予
備用ディスク装置は待機用であることから、必要最小限
の台数とすることが望ましい。更に本発明は上記の実施
例に示した数値による限定は受けない。
【0084】
【発明の効果】以上説明してきたように第1発明にあっ
ては、故障ディスク装置のパリティグループ以外のポー
トの予備用ディスク装置を用いてデータ修復を行うこと
で、故障代替処理に伴う性能低下を最低限に抑えること
ができる。また故障ディスク装置のパリティグループ内
のポートの予備用ディスク装置を、やむを得ず代替先と
して選択する場合にも、アクセス回数の最も少ないポー
トの予備用ディスク装置を選択することで、同一ポート
に同じパリティグループの2台以上のディスク装置が位
置しても性能低下を必要最低限に抑えることができる。
【0085】更に、故障代替処理によりパリティグルー
プの2台以上のディスク装置が同一ポートに存在して性
能低下が生じた状態を外部に出力表示することで、オペ
レータまたは保守要員は処理性能の低下を直ちに認識
し、適切な保守対策をとることができ、システム処理性
能の迅速な回復が期待できる。一方、第2発明にあって
は、ランクごとに異なるポート位置に最優先順位をもつ
予備用ディスク装置を割り当てたことで、他のランクの
ディスク故障にあまり影響されることなく、処理性能を
低下させることのない最適な予備用ディスク装置の選択
による代替処理ができる。
【0086】また他のランクの予備用ディスク装置を選
択せざるを得ない場合にも、選択しようとするランクに
設けているディスク装置の障害情報の統計値を参照し、
もし障害情報の統計値が大きかった場合には、そのラン
クで故障が発生して予備用ディスク装置を使用する可能
性が高いことから、障害発生の可能性の高いランクの予
備用ディスク装置は選択せずに別の障害発生の可能性の
少ないランクの予備用ディスク装置を選択するようにな
り、耐故障性の優れたディスクアレイ装置を構築するこ
とができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明が適用されるディスクアレイ装置のハー
ドウェア構成を示した実施例構成図
【図3】図2のコントローラのハードウェア構成を示し
た実施例構成図
【図4】第1発明の機能を示した説明図
【図5】デバイス管理テーブルの管理情報のフォーマッ
ト構成を示した説明図
【図6】図3のデバイス管理テーブルの説明図
【図7】第1発明の全体処理を示したフローチャート
【図8】図2のエラーリカバリ処理を示したフローチャ
ート
【図9】図3のディスクアレイの他の予備用ディスク装
置の配置状態を示した説明図
【図10】図9に対応したデバイス管理テーブルの説明
【図11】第2発明の機能を示した説明図
【図12】第2発明で用いる割当て優先順位を定めた予
備ディスク割当テーブルの説明図
【図13】図11のエラーリカバリ処理を示したフロー
チャート
【図14】従来装置の概略構成を示した説明図
【図15】予備ディスクをランクに固定する従来のエラ
ーリカバリ方法のフローチャート
【図16】予備ディスクを複数ランクで共用する従来の
エラーリカバリ方法のフローチャート
【符号の説明】
10:ホストコンピュータ 12,12−1,12−2:コントローラ 14−1,14−2:チャネル装置 15:表示装置 16:チャネルインタフェース(SCSI) 18−1,18−2:共用バス 20:ブリッジ回路 22−1,22−2:サブコントローラ 24−1〜24−6,26−1〜26−6:アダプタ 28:ディスクアレイ 30−00〜30−35:ディスク装置 32:CPU 34:ROM 36:DRAM 38:上位インタフェース部 40:SCSI回路部 42:バスインタフェース部 44:内部バス 46:キャッシュ制御部 48:キャッシュメモリ 50:ディスクアレイ制御部 52,62:予備ディスク選択部 54:デバイス管理テーブル 56:データ修復部 58:パリティグループ 60:予備ディスク割当テーブル
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 3/06

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】並列的にアクセス可能な複数ポート(P0
    〜P5)にディスク装置を接続して1つのランクを構成
    し、該ランクを複数ランク(R0〜R3)設けたディス
    クアレイ装置の障害対処方法に於いて、 ポート(P0〜P5)とランク(R0〜R3)で定義さ
    れる位置にアレイ状に配置されたディスク装置の故障時
    に、故障ディスク装置の属する冗長グループ以外のポー
    トに接続された予備用ディスク装置を代替先として選択
    する予備ディスク選択過程と、 前記予備ディスク選択過程で選択された予備ディスク装
    置に前記故障ディスク装置のデータを修復するデータ修
    復過程と、を備えたことを特徴とするディスクアレイ装
    置の故障対処方法。
  2. 【請求項2】請求項1記載のディスクアレイ装置の障害
    対処方法に於いて、 前記予備ディスク選択過程は、前記故障ディスク装置の
    属する冗長グループ以外のポートに接続された予備用デ
    ィスク装置が存在しなかった場合、前記故障ディスク装
    置の属する冗長グループに含まれるポートに接続された
    予備用ディスク装置を代替先として選択することを特徴
    とするディスクアレイ装置の障害対処方法。
  3. 【請求項3】請求項2記載のディスクアレイ装置の障害
    対処方法に於いて、 前記予備ディスク選択過程は、前記故障ディスク装置の
    属する冗長グループに含まれるポートに接続された予備
    用ディスク装置が複数存在する場合、統計情報の参照で
    求めたアクセス回数が最も少いポートの予備ディスク装
    置を代替先として選択することを特徴とするディスクア
    レイ装置の故障対処方法。
  4. 【請求項4】請求項1乃至3記載のディスクアレイ装置
    の故障対処方法に於いて、 前記予備ディスク選択過程は、デバイス番号をインデッ
    クスとして予備用か否かを示す予備識別子、ポート番号
    およびランク番号を格納したデバイス管理テーブル(5
    4)を参照して代替先の予備ディスク装置を選択するこ
    とを特徴とするディスクアレイ装置の故障対処方法。
  5. 【請求項5】請求項1記載のディスクアレイ装置の故障
    対処方法に於いて、 更に、前記予備ディスク選択過程で、故障ディスク装置
    の属する冗長グループ以外のポートに接続された予備用
    ディスク装置を代替先として選択できなかった場合に、
    性能低下を外部に出力表示させる表示過程を設けたこと
    を特徴とするディスクアレイ装置の故障対処方法。
  6. 【請求項6】ディスクアレイ装置に於いて、 並列配置された複数のポート(P0〜P5)の各々に多
    段接続されて複数のランク(R0〜R3)を構成し、所
    定の冗長グループ単位にデータを収納する複数のデータ
    用ディスク装置と、 複数のデータ格納用ディスク装置で構成する冗長グルー
    プごとに冗長データを格納する複数の冗長用ディスク装
    置と、 予備として待機する1又は複数の予備用ディスク装置
    と、 前記データ用ディスク装置または冗長用ディスク装置の
    故障時に、故障ディスク装置の属する冗長グループ以外
    のポートに接続された予備用ディスク装置を代替先とし
    て選択する予備ディスク選択手段(52)と、 前記予備ディスク選択手段で選択された予備ディスク装
    置に前記故障ディスク装置のデータを修復するデータ修
    復手段(56)と、を備えたことを特徴とするディスク
    アレイ装置。
  7. 【請求項7】請求項6記載のディスクアレイ装置に於い
    て、前記予備ディスク選択手段(52)は、前記故障デ
    ィスク装置の属する冗長グループ以外のポートに接続さ
    れた予備用ディスク装置が存在しなかった場合、前記故
    障ディスク装置の属する冗長グループに含まれるポート
    に接続された予備用ディスク装置を代替先として選択す
    ることを特徴とするディスクアレイ装置。
  8. 【請求項8】請求項6記載のディスクアレイ装置に於い
    て、 前記予備ディスク選択手段(52)は、前記故障ディス
    ク装置の属する冗長グループに含まれるポートに接続さ
    れた予備用ディスク装置が複数存在する場合、統計情報
    の参照で求めたアクセス回数が最も少い予備ディスク装
    置を代替先として選択することを特徴とするディスクア
    レイ装置。
  9. 【請求項9】請求項6乃至8記載のディスクアレイ装置
    に於いて、 前記予備ディスク選択手段(52)は、デバイス番号を
    インデックスとして予備用か否かを示す予備識別子、ポ
    ート番号およびランク番号を格納したデバイス管理テー
    ブル(54)を参照して代替先の予備ディスク装置を選
    択することを特徴とするディスクアレイ装置。
  10. 【請求項10】請求項6記載のディスクアレイ装置に於
    いて、 更に、前記予備ディスク選択手段(52)で、故障ディ
    スク装置の属する冗長グループ以外のポートに接続され
    た予備用ディスク装置を代替先として選択できなかった
    場合に、性能低下を外部に出力表示させる出力表示手段
    (15)を設けたことを特徴とするディスクアレイ装
    置。
  11. 【請求項11】ディスクアレイ装置の故障対処方法に於
    いて、 初期設定時に、ポート(P0〜P5)とランク(R0〜
    R3)で定義される位置にアレイ状に配置された複数の
    ディスク装置の内、各ランクごとに異なるポート位置の
    ディスク装置を最優先順位の予備用ディスク装置として
    割当て、更に、下位の優先順位に他のランクに割当てた
    予備用ディスク装置を割当てる予備ディスク割当過程
    と、 前記ディスク装置の故障時に、前記予備ディスク割当過
    程の割当順位に基づいて予備用ディスク装置を代替先と
    して選択する予備ディスク選択過程と、 前記予備ディスク選択手段で選択された予備ディスク装
    置に前記故障ディスク装置のデータを修復するデータ修
    復過程と、を備えたことを特徴とするディスクアレイ装
    置の故障対処方法。
  12. 【請求項12】請求項11記載のディスクアレイ装置の
    故障対処方法に於いて、 前記予備ディスク選択過程は、前記予備ディスク割当過
    程の割当順位に基づいて下位の優先順位をもつ予備ディ
    スク装置を選択した場合、該選択した予備ディスク装置
    と同じランクに属する全てのディスク装置の障害発生情
    報の統計値を参照し、該統計値が予め定めた閾値を越え
    ていた場合は、更に下位の優先順位で割当られる予備デ
    ィスク装置を選択することを特徴とするディスクアレイ
    装置の故障対処方法。
  13. 【請求項13】ディスクアレイ装置に於いて、 並列配置された複数のポート(P0〜P5)の各々に多
    段接続されて複数のランク(R0〜R3)を構成し、所
    定の冗長グループ単位にデータを収納する複数のデータ
    用ディスク装置と、 複数のデータ格納用ディスク装置で構成する冗長グルー
    プごとに冗長データを格納する複数の冗長用ディスク装
    置と、 初期設定時に、各ランクごとに異なるポート位置のディ
    スク装置を最優先順位の予備用ディスク装置として割当
    て、更に、下位の優先順位に他のランクに割当てた予備
    用ディスク装置を割当てる予備ディスク割当手段(6
    0)と、 前記データ用ディスク装置または冗長用ディスク装置の
    故障時に、前記予備ディスク割当手段(60)の割当順
    位に基づいて予備用ディスク装置を代替先として選択す
    る予備ディスク選択手段(62)と、 前記予備ディスク選択手段(62)で選択された予備デ
    ィスク装置に前記故障ディスク装置のデータを修復する
    データ修復手段(56)と、を備えたことを特徴とする
    ディスクアレイ装置。
  14. 【請求項14】請求項13記載のディスクアレイ装置に
    於いて、 前記予備ディスク選択手段(62)は、前記予備ディス
    ク割当手段(60)の割当順位に基づいて下位の優先順
    位をもつ予備ディスク装置を選択した場合、該選択した
    予備ディスク装置と同じランクに属する全てのディスク
    装置の障害発生情報の統計値を参照し、該統計値が予め
    定めた閾値を越えていた場合は、更に下位の優先順位で
    割当られる予備ディスク装置を選択することを特徴とす
    るディスクアレイ装置。
JP5256217A 1993-10-14 1993-10-14 ディスクアレイ装置の故障対処方法および装置 Expired - Fee Related JP2912802B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP5256217A JP2912802B2 (ja) 1993-10-14 1993-10-14 ディスクアレイ装置の故障対処方法および装置
US08/690,595 US5872906A (en) 1993-10-14 1996-07-31 Method and apparatus for taking countermeasure for failure of disk array

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5256217A JP2912802B2 (ja) 1993-10-14 1993-10-14 ディスクアレイ装置の故障対処方法および装置

Publications (2)

Publication Number Publication Date
JPH07110743A JPH07110743A (ja) 1995-04-25
JP2912802B2 true JP2912802B2 (ja) 1999-06-28

Family

ID=17289564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5256217A Expired - Fee Related JP2912802B2 (ja) 1993-10-14 1993-10-14 ディスクアレイ装置の故障対処方法および装置

Country Status (2)

Country Link
US (1) US5872906A (ja)
JP (1) JP2912802B2 (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4044160B2 (ja) * 1995-08-23 2008-02-06 富士通株式会社 ディスクアレイ装置
WO1997011426A1 (en) 1995-09-18 1997-03-27 Cyberstorage Systems, Inc. Universal storage management system
KR100275900B1 (ko) * 1996-09-21 2000-12-15 윤종용 알에이아이디 서브시스템에 있어서 분할패러티 예비 디스크 구현방법
JPH10198526A (ja) * 1997-01-14 1998-07-31 Fujitsu Ltd Raid装置及びそのアクセス制御方法
US6122754A (en) * 1998-05-22 2000-09-19 International Business Machines Corporation Method and system for data recovery using a distributed and scalable data structure
US6810491B1 (en) * 2000-10-12 2004-10-26 Hitachi America, Ltd. Method and apparatus for the takeover of primary volume in multiple volume mirroring
US6732290B1 (en) * 2000-11-22 2004-05-04 Mti Technology Corporation Recovery system for raid write
US6820212B2 (en) 2001-02-20 2004-11-16 Digi-Data Corporation RAID system having channel capacity unaffected by any single component failure
US7159080B1 (en) * 2001-12-20 2007-01-02 Network Appliance, Inc. System and method for storing storage operating system data in switch ports
US7296068B1 (en) 2001-12-21 2007-11-13 Network Appliance, Inc. System and method for transfering volume ownership in net-worked storage
US7146522B1 (en) * 2001-12-21 2006-12-05 Network Appliance, Inc. System and method for allocating spare disks in networked storage
US7650412B2 (en) 2001-12-21 2010-01-19 Netapp, Inc. Systems and method of implementing disk ownership in networked storage
US6892276B2 (en) * 2002-11-26 2005-05-10 Lsi Logic Corporation Increased data availability in raid arrays using smart drives
JP3879702B2 (ja) * 2003-05-14 2007-02-14 船井電機株式会社 ディスク記録装置
WO2005003951A1 (ja) * 2003-07-02 2005-01-13 Satoshi Yamatake データベースシステム
JP2005071196A (ja) * 2003-08-27 2005-03-17 Hitachi Ltd ディスクアレイ装置、及びその障害情報の制御方法
GB2416912B8 (en) * 2003-12-16 2007-04-12 Hitachi Ltd Disk array system and interface converter
JP4317436B2 (ja) * 2003-12-16 2009-08-19 株式会社日立製作所 ディスクアレイシステム及びインターフェイス変換装置
JP4634049B2 (ja) * 2004-02-04 2011-02-16 株式会社日立製作所 ディスクアレイ装置における異常通知制御
JP2005301442A (ja) * 2004-04-07 2005-10-27 Hitachi Ltd ストレージ装置
EP1825372A2 (en) * 2004-11-05 2007-08-29 Data Robotics Incorporated Dynamically expandable and contractible fault-tolerant storage system permitting variously sized storage devices and method
JP4441929B2 (ja) * 2005-01-19 2010-03-31 日本電気株式会社 ディスク装置及びホットスワップ方法
US7418623B2 (en) * 2005-11-16 2008-08-26 International Business Machines Corporation Apparatus and method to reconfigure a storage array
JP2007206931A (ja) * 2006-02-01 2007-08-16 Hitachi Ltd 記憶システム、データ処理方法並びにストレージ装置
FR2883392B1 (fr) * 2006-04-13 2007-11-30 Hitachi Ltd Systeme de reseau de disques et convertisseur d'interfaces
JP2008040687A (ja) * 2006-08-03 2008-02-21 Fujitsu Ltd データ復元制御装置
JP5080140B2 (ja) * 2007-06-13 2012-11-21 株式会社日立製作所 I/oデバイス切り替え方法
US8006128B2 (en) * 2008-07-31 2011-08-23 Datadirect Networks, Inc. Prioritized rebuilding of a storage device
CN101923496A (zh) * 2010-07-30 2010-12-22 华中科技大学 一种raid的数据并行重构方法
US8959389B2 (en) * 2011-11-23 2015-02-17 International Business Machines Corporation Use of a virtual drive as a hot spare for a raid group
JP6007329B2 (ja) * 2013-07-17 2016-10-12 株式会社日立製作所 ストレージコントローラ、ストレージ装置、ストレージシステム
JP6201674B2 (ja) 2013-11-20 2017-09-27 富士通株式会社 ストレージ制御装置,プログラム及び制御方法
US9395926B2 (en) * 2013-12-24 2016-07-19 Hitachi, Ltd. Storage system and management computer
CN114721585A (zh) * 2021-01-06 2022-07-08 伊姆西Ip控股有限责任公司 存储管理方法、设备和计算机程序产品

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2702278B2 (ja) * 1990-11-22 1998-01-21 株式会社日立製作所 ディスクドライブ装置
US5303244A (en) * 1991-03-01 1994-04-12 Teradata Fault tolerant disk drive matrix
JP2895644B2 (ja) * 1991-03-07 1999-05-24 富士通株式会社 アレイディスク装置
JPH05340619A (ja) * 1991-04-16 1993-12-21 Mitsubishi Juko Reinetsu Kizai Kk 二元冷凍装置における低元側冷媒系統
US5258984A (en) * 1991-06-13 1993-11-02 International Business Machines Corporation Method and means for distributed sparing in DASD arrays
US5301297A (en) * 1991-07-03 1994-04-05 Ibm Corp. (International Business Machines Corp.) Method and means for managing RAID 5 DASD arrays having RAID DASD arrays as logical devices thereof
JP2880000B2 (ja) * 1991-07-25 1999-04-05 三菱電機株式会社 アレイ型ディスク駆動機構システム
US5367669A (en) * 1993-03-23 1994-11-22 Eclipse Technologies, Inc. Fault tolerant hard disk array controller

Also Published As

Publication number Publication date
US5872906A (en) 1999-02-16
JPH07110743A (ja) 1995-04-25

Similar Documents

Publication Publication Date Title
JP2912802B2 (ja) ディスクアレイ装置の故障対処方法および装置
US5566316A (en) Method and apparatus for hierarchical management of data storage elements in an array storage device
US5611069A (en) Disk array apparatus which predicts errors using mirror disks that can be accessed in parallel
US5479611A (en) Disk array apparatus
US8839028B1 (en) Managing data availability in storage systems
US7437508B2 (en) Method and system for storing data in an array of storage devices with additional and autonomic protection
JP3742494B2 (ja) 大容量記憶装置
US5790773A (en) Method and apparatus for generating snapshot copies for data backup in a raid subsystem
US5315602A (en) Optimized stripe detection for redundant arrays of disk drives
US5608891A (en) Recording system having a redundant array of storage devices and having read and write circuits with memory buffers
US6647460B2 (en) Storage device with I/O counter for partial data reallocation
US6243827B1 (en) Multiple-channel failure detection in raid systems
EP0936534A2 (en) Recording device
AU1417097A (en) A method and apparatus for management of faulty data in a redundant array of inexpensive disks (RAID) system
KR20090073099A (ko) 전역 핫 스패어 디스크를 이용한 고장난 드라이브의 재구성및 카피백 방법
JP3681766B2 (ja) ディスクアレイ装置
US8402213B2 (en) Data redundancy using two distributed mirror sets
US20050193273A1 (en) Method, apparatus and program storage device that provide virtual space to handle storage device failures in a storage system
JPH09269871A (ja) ディスクアレイ装置におけるデータ再冗長化方式
US7130973B1 (en) Method and apparatus to restore data redundancy and utilize spare storage spaces
JP2005099995A (ja) 磁気ディスク装置のディスク共有方法及びシステム
JP2857288B2 (ja) ディスクアレイ装置
JP3155836B2 (ja) ディスクアレイ装置
JP2005166016A (ja) ディスクアレイ装置
JP2570614B2 (ja) デイスクアレイ装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080409

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090409

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090409

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100409

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110409

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110409

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees