JP2005275813A - ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体 - Google Patents

ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP2005275813A
JP2005275813A JP2004088102A JP2004088102A JP2005275813A JP 2005275813 A JP2005275813 A JP 2005275813A JP 2004088102 A JP2004088102 A JP 2004088102A JP 2004088102 A JP2004088102 A JP 2004088102A JP 2005275813 A JP2005275813 A JP 2005275813A
Authority
JP
Japan
Prior art keywords
disk
disk device
redundancy
failure
disk array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004088102A
Other languages
English (en)
Inventor
智行 ▲高▼田
Satoyuki Takada
Noriyuki Suzuki
範之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004088102A priority Critical patent/JP2005275813A/ja
Publication of JP2005275813A publication Critical patent/JP2005275813A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 複数のディスク装置から構成されるディスクアレイにおいて、ディスクアレイを構成するディスク装置の少なくともひとつに障害が発生し、データの冗長性が消失したときに、多重障害の発生を防止し、データを強固に保護することが可能であり、かつ使い勝手のよい、コストパフォーマンスに優れたディスクアレイシステムを提供する。
【解決手段】 アレイコントローラ160は、ディスクアレイ180を構成する複数のディスク装置181〜184のうち、障害発生の少なくとも1つのディスク装置が検出され、ディスクアレイ180がデータの冗長性を消失したと判定された場合、ディスク装置181〜184の全てを停止した後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理のみを実行する。
【選択図】 図1

Description

本発明は、複数のディスク装置からなるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステム、その制御方法、プログラムおよび記憶媒体に関する。
近年、パーソナルコンピュータ等の情報処理機器の高性能化、通信インフラの高速化に伴い、高品位動画、静止画、音声等を含む大容量マルチメディアデータを個人や比較的小規模なグループで扱う機会が増大しており、それらを蓄積、管理する高速、大容量で信頼性が高く、さらに使い勝手とコストパフォーマンスに優れたストレージ装置が求められている。
高速、大容量でかつ信頼性が高いストレージを実現する技術のひとつとしてD.Pattersonなどにより提案されたRAIDが知られている(例えば非特許文献1を参照)。
このRAIDでは、例えば、ディスクアレイ装置において、データからパリティデータを生成し、複数のディスク装置にデータとパリティデータを分散して格納することにより、記憶容量を比較的有効に利用しながら耐障害性を向上させる方法がレベル3(RAID3)、レベル4(RAID4)、またはレベル5(RAID5)として定義されている。
一般に、実質的に1台のパリティディスクを有するディスクアレイ装置においては、ディスクアレイを構成する複数のディスク装置の内、1台のディスク装置に障害が発生したとしても、パリティ演算により他の正常なディスク装置のデータから障害が発生したディスク装置のデータを回復することができる。しかし、複数のディスク装置に障害が発生した場合、いわゆる多重障害の場合には、データを回復することはできず、ディスクアレイ装置に記憶されていたデータは消失することになる。
そこで、市販のディスクアレイ装置においては、予備ディスク装置が設けられ、ディスク装置に障害が発生した際には、新たなディスク装置の障害により冗長性が失われる前に、予備ディスクに障害の発生したディスク装置のデータを回復し、冗長性を確保することが広く行われている。
また、予備ディスク装置を設けることなく、多重障害に対する耐性を向上するディスクアレイ装置も提案されている(例えば特許文献1および2を参照)。このディスク装置によれば、ディスク装置に障害が発生した際に、障害の発生したディスク装置のデータを他の正常なディスク装置のデータから回復し、回復したデータから新たなパリティデータを生成し、回復したデータと新たなパリティデータを正常な複数のディスク装置の空き領域に分散して格納することにより、予備ディスク装置を設けることなく冗長性が確保され、多重障害に対する耐性が向上される。
特開平6−230903号公報 特開平8−190461号公報 D.Patterson et al. A Case for Redundant Arrays ofInexpensive Disks (RAID), inACM,SIGMOD Conference, Chicago, IL, June 1988
しかし、予備ディスク装置を備えることは、装置の大型化とコストの増大を招くため、個人や比較的小規模なグループにおいてニーズが高く、コストパフォーマンスに優れた比較的小規模なストレージ装置に対しては、好適なものとはいえない。
また、上記の提案されたディスク装置においては、正常なディスク装置が4台以上設けられており、かつそれらのディスク装置に十分な空き領域がある場合には有効であるが、正常なディスク装置が3台以下となる場合、または正常なディスク装置に十分な空き領域がない場合に、新たなディスク装置の障害が発生したときには、冗長性を確保することができないので、冗長性が失われた状態での運転、いわゆる縮退運転を行うか、または装置を停止する必要がある。
そこで、本発明は、複数のディスク装置から構成されるディスクアレイにおいて、ディスクアレイを構成するディスク装置の少なくともひとつに障害が発生し、データの冗長性が消失したときに、多重障害の発生を防止し、データを強固に保護することが可能であり、かつ使い勝手が良い、コストパフォーマンスに優れたディスクアレイシステムを提供することを目的とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムであって、上位装置からの要求に応じた処理を実行する処理手段と、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定手段と、前記ディスク装置のそれぞれを停止させるディスク装置停止手段とを備え、前記ディスク装置障害検出手段により前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理手段は、前記ディスク装置停止手段により他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムであって、上位装置からの要求に応じた処理を実行する処理手段と、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスク装置障害検出手段による検出結果を保持する不揮発性の保持手段と、前記保持手段に保持されている前記ディスク装置障害検出手段による検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定手段と、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定手段と、前記ディスク装置のそれぞれを停止させるディスク装置停止手段とを備え、システム起動時に、前記障害発生判定手段により障害が発生したディスク装置があると判定され、かつ前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理手段は、前記ディスク装置停止手段により他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムの制御方法であって、前記ディスクアレイの各ディスク装置の障害発生を検出する工程と、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定工程と、前記ディスク装置障害検出工程で前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定工程で前記ディスクアレイがデータの冗長性を消失したと判定された場合、他のディスク装置を停止させるディスク装置停止工程と、前記他のディスク装置が停止された後に、前記障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行する特定処理実行工程とを有することを特徴とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイにおける各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスク装置障害検出手段による検出結果を保持する不揮発性の保持手段とを備え、前記ディスクアレイにデータを、冗長性を持たせて記憶するディスクアレイシステムの制御方法であって、システム起動時に、前記保持手段に保持されている前記検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定工程と、前記障害発生判定工程により障害が発生したディスク装置があると判定された場合、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定工程と、前記冗長性判定工程により前記ディスクアレイがデータの冗長性を消失した状態にあると判定された場合、他のディスク装置のそれぞれを停止させるディスク装置停止工程と、前記ディスク装置停止工程で前記他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行する特定処理実行工程とを有することを特徴とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムを制御するスためのプログラムであって、上位装置からの要求に応じた処理を実行する処理モジュールと、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出モジュールと、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定モジュールと、前記ディスク装置のそれぞれを停止させるディスク装置停止モジュールとを有し、前記ディスク装置障害検出モジュールにより前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定モジュールにより前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理モジュールは、前記ディスク装置停止モジュールにより他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とする。
本発明は、上記目的を達成するため、複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムを制御するためのプログラムであって、上位装置からの要求に応じた処理を実行する処理モジュールと、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出モジュールと、前記ディスク装置障害検出モジュールによる検出結果を不揮発性の保持手段に保持される保持モジュールと、前記保持手段に保持されている前記ディスク装置障害検出モジュールによる検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定モジュールと、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定モジュールと、前記ディスク装置のそれぞれを停止させるディスク装置停止モジュールとを有し、システム起動時に、前記障害発生判定モジュールにより障害が発生したディスク装置があると判定され、かつ前記冗長性判定モジュールにより前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理モジュールは、前記ディスク装置停止モジュールにより他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とする。
本発明は、上記目的を達成するため、上記プログラムをコンピュータ読み取り可能に格納したことを特徴とする記憶媒体を提供する。
本発明によれば、複数のディスク装置から構成されるディスクアレイにおいて、ディスクアレイを構成するディスク装置の少なくともひとつに障害が発生し、データの冗長性が消失したときに、多重障害の発生を防止し、データを強固に保護することが可能であり、かつ使い勝手のよい、コストパフォーマンスに優れたディスクアレイシステムを提供することできる。
以下、本発明の実施の形態について図面を参照しながら説明する。
図1は本発明の一実施の形態に係るディスクアレイシステムが搭載される情報処理装置の構成を示すブロック図である。
ディスクアレイシステムが搭載される情報処理装置は、図1に示すように、本体装置100、表示装置120、入力装置140、アレイコントローラ160、およびディスクアレイ180を備える。
本体装置100は、接続されるデバイスの制御を行う、パーソナルコンピュータまたはサーバを構成するCPU101とその周辺チップセット、またはそれらを実装したマザーボードである。本体装置100は、具体的には、CPU101、ROM102、RAM103、ブリッジ部104、表示装置インターフェース部(以下、表示装置I/F部という)105、入力装置インターフェース部(以下、入力装置I/F部という)106、および記憶装置インターフェース部(以下、記憶装置I/F部という)107を有する。CPU101は、プログラムを実行することによりデータの処理や接続されるデバイスの制御を行うプロセッサである。ROM102は、CPU101により実行されるプログラムや各種パラメータなどを記憶する不揮発性メモリである。RAM103は、CPU101によるプログラム実行時に使用されるパラメータなどを一時的に記憶する揮発性メモリである。
ブリッジ部104、表示装置I/F部105、入力装置I/F部106および記憶装置I/F部107は、それぞれに接続されるデバイス間の信号の変換や接続を行うインターフェース手段である。ブリッジ部104は、CPU101、ROM102およびRAM103が接続されたCPU内部バスと、表示装置I/F部105、入力装置I/F部106および記憶装置I/F部107との接続を行う。表示装置I/F部105は、ブリッジ部104と表示装置120の接続を行う。入力装置I/F部106は、ブリッジ部104と入力装置140の接続を行う。記憶装置I/F部107は、ブリッジ部104とアレイコントローラ160の接続を行う。
表示装置120は本体装置100から出力された画像データを表示する、例えばCRT、液晶パネルなどから構成されるディスプレイである。
入力装置140は、ユーザにより入力されたデータを本体装置100に出力する、例えばキーボード、マウスなどから構成される。
アレイコントローラ160は、本体装置100に、配下に接続される複数のディスク装置181〜184からなるディスクアレイ180を一つの論理ディスクとして認識させるインターフェースを提供する。そして、アレイコントローラ160は、本体装置100からディスクアレイ180への書き込み要求を受信すると、書き込みデータをディスク装置181〜184の構成に基づいて再構成し、個々のディスク装置181〜184に書き込む。また、アレイコントローラ160は、本体装置100からディスクアレイ180からの読み出し要求を受信すると、個々のディスク装置181〜184からデータを読み出し、ディスク装置181〜184の構成に基づき再構成し、本体装置100に送信する。
アレイコントローラ160は、MPU161、ROM162、RAM163、フラッシュメモリ172、キャッシュメモリ164、パリティ演算部165、本体装置インターフェース部(以下、本体装置I/F部という)166、ディスク装置インターフェース部(以下、ディスク装置I/F部という)167〜170、スイッチ部171およびタイマ173を有する。
MPU161は、プログラムを実行することによりデータの処理や接続されるデバイスの制御を行うプロセッサである。ROM162は、MPU161により実行されるプログラムや各種パラメータなどを記憶する不揮発性メモリである。RAM163は、MPU161によるプログラム実行時に使用されるパラメータなどを一時的に記憶する揮発性メモリである。フラッシュメモリ172は、MPU161によるプログラム実行時に使用されるパラメータを書き換え可能に記憶する不揮発性メモリである。キャッシュメモリ164は、アレイコントローラ160からまたはアレイコントローラ160への入出力データを一時的に記憶するバッファ手段である。
パリティ演算部165は、アレイコントローラ160からまたはアレイコントローラ160への入出力データのパリティ演算を行う。本体装置I/F部166は、スイッチ部171と本体装置100の接続を行う。ディスク装置I/F部167〜170は、スイッチ部171とディスク装置181〜184の接続を行う。本体装置I/F部166およびディスク装置I/F部167〜170は、それぞれに接続されるデバイス間の信号の変換や接続を行うインターフェース手段である。スイッチ部171は、MPU161の指示に基づき、本体装置I/F部166、キャッシュメモリ164およびパリティ演算部165とディスク装置I/F部167〜170との間でのデータのスイッチングを行う。
タイマ173は、MPU161の指示に基づいて計時を開始し、予め設定された所定時間が経過すると、その旨をMPU161に通知する計時手段である。
アレイコントローラ160は、例えばプロセッサ組み込みLSIとその周辺ICまたはそれらを実装した拡張ボードから構成される。また、それらがマザーボード上に実装される構成のものでもよい。
ディスクアレイ180は、複数のディスク装置181〜184からなる。各ディスク装置181〜184は、アレイコントローラ160から送出されたデータを格納する。各ディスク装置181〜184は、例えば、ハードディスクドライブから構成される。
本実施の形態におけるディスクアレイシステムは、冗長性を有する任意のRAIDレベル、例えば、RAID1(ミラーリング)、RAID2、RAID3、RAID4、RAID5、RAID10、またはRAID50などの基準に従って構成される。
本実施の形態においては、一般的なディスクアレイ180に対する読み出し/書き込み動作に関する詳細な説明は省略し、ディスクアレイ180を構成するディスク装置181〜184のうち、少なくとも1台のディスク装置に障害が発生したときの動作について図2および図3を参照しながら説明する。ここでは、一例として、ディスク装置184に障害が発生したものとして説明する。図2および図3はディスクアレイシステムが動作中にディスク装置184に障害が発生したことを検出したときのアレイコントローラ160の動作手順を示すフローチャートである。この図2および図3に示す手順は、アレイコントローラ160のROM162またはフラッシュメモリ172に格納されているプログラムに従ってMPU161により実行されるものである。
アレイコントローラ160は、ステップS201において、ディスク装置の障害検出を行う。このディスク装置の障害検出は、ディスク装置へのデータ読み出し要求に対し正常にデータが読み出されるまでの応答時間もしくはリトライ回数、またはSMART情報の参照など、公知の方法により行われる。ここでは、ディスク装置184に障害が発生したことが検出されたとする。
次いで、アレイコントローラ160は、ステップS202において、障害が発生したディスク装置があれば、そのIDなどを障害情報としてフラッシュメモリ172に記憶する。そして、アレイコントローラ160は、ステップS203において、フラッシュメモリ172に記憶された障害情報を参照して、ディスクアレイ180に冗長性が確保されているか否かを判定する。例えば、RAID3、RAID4、またはRAID5を実施可能なように3台のディスク装置から構成されるディスクアレイにおいては、1台のディスク装置に障害が発生した場合、冗長性が消失したものと判定される。また、例えば、RAID1を実施可能なように2台のディスク装置から構成されるディスクアレイにおいては、そのうち1台のディスク装置に障害が発生した場合、冗長性が消失したものと判定される。
上記ステップS203において冗長性が確保されていると判定された場合、アレイコントローラ160は、ステップS221において、本体装置100に障害情報(ここでは、ディスク装置184)を通知し、本処理を終了する。この障害情報を受けた本体装置100は、障害が発生したディスク装置(ここではディスク装置184)を正常なディスク装置185に交換し、障害発生のディスク装置184のデータを正常なディスク装置185に回復するすなわちリビルドを行うようにユーザに指示するメッセージを、表示装置120に出力する。なお、当然ではあるが、障害発生のディスク装置が検出されない場合は、障害情報の本体装置100への通知は行われない。
上記ステップS203において冗長性が消失したと判定された場合、アレイコントローラ160は、ステップS204において、タイマ173を起動する。また、アレイコントローラ160は、本体装置100に対して、障害情報を通知し、本体装置100の終了処理を行うように要求する。これを受けて本体装置100は、ディスク装置184に障害が発生したことによりディスクアレイ180の冗長性が消失し、ディスクアレイ180に記憶したデータが消失する危険性があるため、速やかに現在作業中のデータを保存するなどの終了処理を行った後、障害ディスク装置184を正常なディスク装置185に交換し、リビルドを行うようにユーザに指示するメッセージを表示装置120に出力する。さらに、ユーザによる終了処理が所定時間内に行われないことを想定して、ディスクアレイ180に記憶されたデータの安全確保のために、ディスクアレイ180を構成するディスク装置181〜184を停止することをユーザに通知するメッセージが表示装置120に出力される。
次いで、アレイコントローラ160は、ステップS205およびステップS206において、本体装置100から本体装置100の終了処理の完了を示す終了処理完了通知を受領するのを待つために、所定時間待機する。所定時間内に本体装置100から本体装置100の終了処理完了通知を受領した場合、アレイコントローラ160は、ステップS207において、キャッシュ・フラッシュなどのアレイコントローラ160の終了処理を行い、ディスクアレイ180を構成する各ディスク装置181〜184を停止する。また、所定時間内に本体装置100から本体装置100の終了処理完了通知を受領せずに、所定時間が経過した場合、アレイコントローラ160は、同様に、ステップS207において、キャッシュ・フラッシュなどのアレイコントローラ160の終了処理を行い、ディスクアレイ180を構成する各ディスク装置181〜184を停止する。このディスク装置181〜184の停止に伴いアレイコントローラ160は、本体装置100からディスクアレイ180へのアクセスを許可しない。
次いで、図3に示すように、アレイコントローラ160は、ステップS208において、本体装置100からリビルド処理開始命令を受領するのを待つ。この待ち受け期間は、ユーザが障害ディスク装置184を新しいディスク装置185に交換し、入力装置140を介して本体装置100にリビルド処理開始を指示するのを待つ期間であり、このユーザ指示により本体装置100からリビルド処理開始命令が発行される。そして、本体装置100からのリビルド処理開始命令を受領すると、アレイコントローラ160は、ステップS209において、新しいディスク装置185を起動し、その固有情報の取得を試行する。
次いで、アレイコントローラ160は、ステップ210において、新しいディスク装置185が正常でかつディスクアレイ180を構成するのに適当な容量を有するものであるか否かを判定する。ここで、新しいディスク装置185が正常でありかつ適当な容量を有するものである場合、アレイコントローラ160は、各ディスク装置181〜183を起動し、リビルド処理を開始する。そして、アレイコントローラ160は、ステップS212において、リビルド処理が正常に終了したか否かを判定する。
上記ステップS212においてリビルド処理が正常に終了したと判定された場合、アレイコントローラ160は、ステップS213において、本体装置100にリビルド処理が正常に終了したことを通知し、本体装置100からディスクアレイ180へのアクセスを許可し、本処理を終了する。この通知を受けた本体装置100は、リビルド処理が正常に終了したことをユーザに通知するために、その旨を示すメッセージを表示装置120に出力する。
上記ステップS210において新しいディスク装置185が正常でないまたは適当な容量を有するものでないと判定された場合、または上記ステップS212においてリビルド処理が正常に終了しなかったと判定された場合、アレイコントローラ160は、ステップS241において、本体装置100にリビルド処理が異常終了したことを通知し、上記ステップS208に戻る。このリビルド処理異常終了通知を受けた本体装置100は、リビルド処理が異常終了したので、各ディスク装置181〜183,185の状態を確認し、再度、リビルド処理を行うようにユーザに指示するためのメッセージを表示装置120に出力する。
次に、ディスクアレイシステムの起動時の動作について図4を参照しながら説明する。図4はディスクアレイシステムの起動時のアレイコントローラ160の動作手順を示すフローチャートである。この図4に示す手順は、アレイコントローラ160のROM162またはフラッシュメモリ172に格納されているプログラムに従ってMPU161により実行されるものである。
ディスクアレイシステムを起動する際には、本体装置100からリセット信号がアレイコントローラ160に送出される。アレイコントローラ160は、図4に示すように、ステップS301において、本体装置100からのリセット信号を検出して起動し、続くステップS302において、フラッシュメモリ172に記憶された各ディスク装置181〜184の障害情報を取得する。
次いで、アレイコントローラ160は、ステップS303において、各ディスク装置181〜184の中に、障害が発生しているディスク装置があるか否かを判定する。ここで、障害発生のディスク装置がない場合、アレイコントローラ160は、ステップS321において、各ディスク装置181〜184を起動し、本処理を終了する。
これに対し、上記ステップS303において障害発生のディスク装置があると判定された場合(ここでは障害発生のディスク装置をディスク装置184とする)、アレイコントローラ160は、ステップS304において、ディスクアレイ180に冗長性が確保されているか否かを判定する。ここで、冗長性が確保されていると判定された場合、アレイコントローラ160は、ステップS341において、本体装置100に障害情報(ディスク装置184のIDなど)を通知する。この通知を受けた本体装置100は、ディスク装置184に障害が発生していることを認識し、障害発生のディスク装置184を正常なディスク装置に交換し、障害発生のディスク装置184のデータを正常なディスク装置に回復する、すなわちリビルドを行うようにユーザに指示するメッセージを表示装置120に出力する。そして、アレイコントローラ160は、ステップS342において、各ディスク装置181〜183を起動し、本処理を終了する。
上記ステップS304において冗長性がないと判定された場合、アレイコントローラ160は、ステップS305において、本体装置100に障害情報を通知する。この通知を受けた本体装置100は、ディスク装置184に障害が発生したことによってディスクアレイ180の冗長性が消失し、ディスクアレイ180に記憶したデータが消失する危険性があると判断し、障害発生のディスク装置184を正常なディスク装置に交換し、リビルドを行うようにユーザに指示するメッセージを表示装置120に出力する。
このステップS305以降の手順は、前述したディスクアレイシステムの動作中にディスク装置181〜184に障害が発生したときのアレイコントローラ160の動作手順における同一符号の手順と同様であるので、その説明は省略する。
このように、本実施の形態によれば、ディスクアレイ180を構成する複数のディスク装置181〜184のうち、障害発生の少なくとも1つのディスク装置が検出され、ディスクアレイ180がデータの冗長性を消失したと判定された場合、ディスク装置181〜184の全てが停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理のみが実行されるので、ディスクアレイ180におけるディスク装置の少なくとも1つに障害が発生し、データの冗長性が消失したときに、多重障害の発生を防止し、データを強固に保護することが可能であり、かつ使い勝手のよい、コストパフォーマンスに優れたディスクアレイシステムを提供することできる。
また、ディスク装置181〜184の障害情報をアレイコントローラ160のフラッシュメモリ172に記憶し、起動時にフラッシュメモリ172からディスク装置181〜184の障害情報を取得することにより、冗長性が消失した状態でディスク装置181〜184が起動されることを未然に防止することができる。
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることはいうまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
また、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードを、ネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることはいうまでもない。
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることはうまでもない。
本発明の一実施の形態に係るディスクアレイシステムが搭載される情報処理装置の構成を示すブロック図である。 ディスクアレイシステムが動作中にディスク装置184に障害が発生したことを検出したときのアレイコントローラ160の動作手順を示すフローチャートである。 ディスクアレイシステムが動作中にディスク装置184に障害が発生したことを検出したときのアレイコントローラ160の動作手順を示すフローチャートである。 ディスクアレイシステムの起動時のアレイコントローラ160の動作手順を示すフローチャートである。
符号の説明
100 本体装置
160 アレイコントローラ
161 MPU
162 ROM
163 RAM
164 キャッシュメモリ
165 パリティ演算部
166 本体装置インターフェース部
167〜170 ディスク装置インターフェース部
171 スイッチ部
172 フラッシュメモリ
173 タイマ
180 ディスクアレイ
181〜184 ディスク装置

Claims (14)

  1. 複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムであって、
    上位装置からの要求に応じた処理を実行する処理手段と、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定手段と、前記ディスク装置のそれぞれを停止させるディスク装置停止手段とを備え、
    前記ディスク装置障害検出手段により、前記複数のディスク装置に障害が発生したディスク装置が検出され、前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理手段は、前記ディスク装置停止手段により他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とするディスクアレイシステム。
  2. 時間の計時をする時計手段を備え、
    前記ディスク装置障害検出手段により障害が発生したディスク装置が検出され、前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記計時手段が起動され、該時計手段により所定時間が計時された後に、前記ディスク装置停止手段は、他のディスク装置の全てを停止することを特徴とする請求項1記載のディスクアレイシステム。
  3. 前記上位装置に対して終了処理要求を行う終了処理要求手段を備え、
    前記ディスク装置障害検出手段により障害が発生したディスク装置が検出され、前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記終了処理要求手段により前記上位装置に対して終了処理要求が行われ、前記上位装置から前記終了処理要求に対応する終了処理の完了通知を受け取ると、前記ディスク装置停止手段は、他のディスク装置を停止することを特徴とする請求項1記載のディスクアレイシステム。
  4. 前記ディスク装置障害検出手段により障害が発生したディスク装置が検出され、前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理手段による終了処理を実行した後に、前記ディスク装置停止手段は、他のディスク装置を停止させることを特徴とする請求項1記載のディスクアレイシステム。
  5. 複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムであって、
    上位装置からの要求に応じた処理を実行する処理手段と、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスク装置障害検出手段による検出結果を保持する不揮発性の保持手段と、前記保持手段に保持されている前記ディスク装置障害検出手段による検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定手段と、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定手段と、前記ディスク装置のそれぞれを停止させるディスク装置停止手段とを備え、
    システム起動時に、前記障害発生判定手段により障害が発生したディスク装置があると判定され、かつ前記冗長性判定手段により前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理手段は、前記ディスク装置停止手段により他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とするディスクアレイシステム。
  6. 複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムの制御方法であって、
    前記ディスクアレイの各ディスク装置の障害発生を検出する工程と、
    前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定工程と、
    前記ディスク装置障害検出工程で前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定工程で前記ディスクアレイがデータの冗長性を消失したと判定された場合、他のディスク装置を停止させるディスク装置停止工程と、
    前記他のディスク装置が停止された後に、前記障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行する特定処理実行工程と
    を有することを特徴とするディスクアレイシステムの制御方法。
  7. 前記ディスク装置障害検出工程で前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定工程で前記ディスクアレイがデータの冗長性を消失したと判定された場合、時計手段を起動する工程を有し、
    前記ディスク装置停止工程では、前記時計手段により所定時間が計時された後に、他のディスク装置を停止することを特徴とする請求項6記載のディスクアレイシステムの制御方法。
  8. 前記ディスク装置障害検出工程で前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定工程で前記ディスクアレイがデータの冗長性を消失したと判定された場合、上位装置に対して終了処理要求を行う終了処理要求工程を有し、
    前記ディスク装置停止工程では、前記上位装置から前記終了処理要求に対応する終了処理の完了通知を受け取ると、他のディスク装置を停止させることを特徴とする請求項6記載のディスクアレイシステムの制御方法。
  9. 前記ディスク装置障害検出工程で前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定工程で前記ディスクアレイがデータの冗長性を消失したと判定された場合、終了処理要を実行する終了処理工程を有し、
    前記ディスク装置停止工程では、前記終了処理工程での終了処理の実行後に、他のディスク装置を停止させることを特徴とする請求項6記載のディスクアレイシステム。
  10. 複数のディスク装置から構成されるディスクアレイにおける各ディスク装置の障害発生を検出するディスク装置障害検出手段と、前記ディスク装置障害検出手段による検出結果を保持する不揮発性の保持手段とを備え、前記ディスクアレイにデータを、冗長性を持たせて記憶するディスクアレイシステムの制御方法であって、
    システム起動時に、前記保持手段に保持されている前記検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定工程と、
    前記障害発生判定工程により障害が発生したディスク装置があると判定された場合、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定工程と、
    前記冗長性判定工程により前記ディスクアレイがデータの冗長性を消失した状態にあると判定された場合、他のディスク装置のそれぞれを停止させるディスク装置停止工程と、
    前記ディスク装置停止工程で前記他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行する特定処理実行工程と
    を有することを特徴とするディスクアレイシステムの制御方法。
  11. 複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムを制御するスためのプログラムであって、
    上位装置からの要求に応じた処理を実行する処理モジュールと、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出モジュールと、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定モジュールと、前記ディスク装置のそれぞれを停止させるディスク装置停止モジュールとを有し、
    前記ディスク装置障害検出モジュールにより前記複数のディスク装置のうち、障害が発生したディスク装置が検出され、前記冗長性判定モジュールにより前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理モジュールは、前記ディスク装置停止モジュールにより他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とするプログラム。
  12. 複数のディスク装置から構成されるディスクアレイに、データに冗長性を持たせて記憶するディスクアレイシステムを制御するためのプログラムであって、
    上位装置からの要求に応じた処理を実行する処理モジュールと、前記ディスクアレイの各ディスク装置の障害発生を検出するディスク装置障害検出モジュールと、前記ディスク装置障害検出モジュールによる検出結果を不揮発性の保持手段に保持される保持モジュールと、前記保持手段に保持されている前記ディスク装置障害検出モジュールによる検出結果に基づいて障害が発生したディスク装置があるか否かを判定する障害発生判定モジュールと、前記ディスクアレイがデータの冗長性を消失した状態にあるか否かを判定する冗長性判定モジュールと、前記ディスク装置のそれぞれを停止させるディスク装置停止モジュールとを有し、
    システム起動時に、前記障害発生判定モジュールにより障害が発生したディスク装置があると判定され、かつ前記冗長性判定モジュールにより前記ディスクアレイがデータの冗長性を消失したと判定された場合、前記処理モジュールは、前記ディスク装置停止モジュールにより他のディスク装置が停止された後に、障害発生のディスク装置のデータの回復に関する要求に応じた処理を実行することを特徴とするプログラム。
  13. 請求項11記載のプログラムをコンピュータ読み取り可能に格納したことを特徴とする記憶媒体。
  14. 請求項12記載のプログラムをコンピュータ読み取り可能に格納したことを特徴とする記憶媒体。
JP2004088102A 2004-03-24 2004-03-24 ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体 Withdrawn JP2005275813A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004088102A JP2005275813A (ja) 2004-03-24 2004-03-24 ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004088102A JP2005275813A (ja) 2004-03-24 2004-03-24 ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体

Publications (1)

Publication Number Publication Date
JP2005275813A true JP2005275813A (ja) 2005-10-06

Family

ID=35175428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004088102A Withdrawn JP2005275813A (ja) 2004-03-24 2004-03-24 ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP2005275813A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010072966A (ja) * 2008-09-18 2010-04-02 Toshiba Corp 情報処理装置および再構築処理および修復処理の制御方法
CN111737063A (zh) * 2020-05-20 2020-10-02 山东鲸鲨信息技术有限公司 双控脑裂的磁盘锁仲裁方法、装置、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010072966A (ja) * 2008-09-18 2010-04-02 Toshiba Corp 情報処理装置および再構築処理および修復処理の制御方法
CN111737063A (zh) * 2020-05-20 2020-10-02 山东鲸鲨信息技术有限公司 双控脑裂的磁盘锁仲裁方法、装置、设备及介质
CN111737063B (zh) * 2020-05-20 2023-11-14 山东鲸鲨信息技术有限公司 双控脑裂的磁盘锁仲裁方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
JP4723290B2 (ja) ディスクアレイ装置及びその制御方法
JP4346659B2 (ja) 情報処理装置、バックアップ記憶装置、および情報処理方法
US7380055B2 (en) Apparatus and method in a cached raid controller utilizing a solid state backup device for improving data availability time
JP2004038290A (ja) 情報処理システムおよび同システムで用いられるディスク制御方法
JP2007058419A (ja) Pld上のメモリ内の情報に従って構築される論理回路を備えたストレージシステム
JP2002358210A (ja) コントローラリセットを処理する方法、及びコントローラリセットを処理するシステム及び方法を有する冗長コントローラデータ格納システム
JPH09297664A (ja) 記憶システムにおけるデータ回復方法及び記憶システムを操作する方法並びにこれら方法を実現するためのデータ記憶媒体
JP4324088B2 (ja) データ複製制御装置
JP6455132B2 (ja) 情報処理装置,処理方法及びプログラム
US6944758B2 (en) Backup method for interface BIOS by making backup copy of interface BIOS in system BIOS and executing backup interface BIOS in system BIOS if error occurs
JP2006301714A (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP2008269142A (ja) ディスクアレイ装置
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
US7457990B2 (en) Information processing apparatus and information processing recovery method
US7260680B2 (en) Storage apparatus having microprocessor redundancy for recovery from soft errors
JP6540202B2 (ja) 情報処理システム、制御装置および制御プログラム
US7779293B2 (en) Technology to control input/output device bridges
JP2005275813A (ja) ディスクアレイシステム、その制御方法、プログラムおよび記憶媒体
JP2005122763A (ja) 記憶装置
JP2002229742A (ja) アクセス切替制御装置、および、アクセス切替制御方法
US8683146B2 (en) Storage apparatus and controlling method of storage apparatus
KR101469059B1 (ko) 내고장성 향상 시스템 및 그 구동 방법
JPWO2008090620A1 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
JP6398727B2 (ja) 制御装置,ストレージ装置及び制御プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060418

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605