JP4456060B2 - Raid制御装置、raid制御プログラム、raid制御方法 - Google Patents

Raid制御装置、raid制御プログラム、raid制御方法 Download PDF

Info

Publication number
JP4456060B2
JP4456060B2 JP2005360213A JP2005360213A JP4456060B2 JP 4456060 B2 JP4456060 B2 JP 4456060B2 JP 2005360213 A JP2005360213 A JP 2005360213A JP 2005360213 A JP2005360213 A JP 2005360213A JP 4456060 B2 JP4456060 B2 JP 4456060B2
Authority
JP
Japan
Prior art keywords
raid
control
disk
control device
raid control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005360213A
Other languages
English (en)
Other versions
JP2007164495A (ja
Inventor
友幸 金山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005360213A priority Critical patent/JP4456060B2/ja
Priority to US11/376,180 priority patent/US7523347B2/en
Publication of JP2007164495A publication Critical patent/JP2007164495A/ja
Application granted granted Critical
Publication of JP4456060B2 publication Critical patent/JP4456060B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、RAID(Redundant Arrays of Inexpensive Disks)装置における障害発生時のリカバリを行うRAID制御装置、RAID制御プログラム、RAID制御方法に関するものである。
図4は、従来のRAID装置の構成の一例を示すブロック図である。このRAID装置は、RAID制御装置111a,111b、ディスク21a,21b,21c,21d,21eを備える。RAID制御装置111a,111bがディスク21a,21b,21c,21d,21eの制御を行うことにより、ディスク21a,21b,21c,21d,21eはRAID5のRAIDグループを構成する。
このようなRAID装置において、RAIDグループを構成しているディスクのうち2本以上のディスクがエラーを起こしてしまった場合(Multi Dead/Multi Unmount状態)、RAIDの冗長構成が壊れてしまうことから、RAID装置がデータを復旧させることができない。
RAID装置がMulti Dead/Multi Unmount状態に陥ってしまった場合の、従来の一般的なMulti Dead/Multi Unmount復旧方法について説明する。図5は、従来のMulti Dead/Multi Unmount復旧方法において復旧させるディスクの順番の一例を示す表である。この表は、ディスクの番号、ディスクにエラーが発生した順番、ディスクを復旧させる順番、個々のディスクの復旧手段を示している。このMulti Dead/Multi Unmount復旧方法は、RAIDグループ内で最後にエラーが発生したディスクから順番にシステムに強制的に組み込んでいき、最初にエラーが発生したディスクを最後に交換して、そのディスクをRebuildによって復旧させる。
このMulti Dead/Multi Unmount復旧方法によれば、RAID装置は、ディスクへの書き込み処理等が停止する直前の状態に復旧することが可能である。
なお、本発明の関連ある従来技術として、例えば、下記に示す特許文献1が知られている。この障害検出システムにおいて、第1のコントローラは、自身が管理するメモリにアクセスを行うときは第2のコントローラが管理するメモリにもアクセスを要求する。要求に対する許可が帰って来なければ、第2のコントローラに障害が発生したと見なす。
特開平8−249130号公報
しかしながら、上述した従来のMulti Dead/Multi Unmount復旧方法は、RAID制御装置障害に起因しないMulti Dead/Multi Unmount状態(例えば、FC(Fibre Channel)ループ上の障害に起因したMulti Dead/Multi Unmount状態)に対してだけ有効である。
RAID制御装置障害に起因するMulti Dead/Multi Unmount状態の場合、従来のMulti Dead/Multi Unmount復旧方法によりRAID構成の復旧は可能だが、復旧させたとたんに再び同様の障害に陥ってしまう可能性が高い。従って、システムの復旧に多大な時間を要するだけでなく、復旧作業中にデータ化けやデータロストに至る可能性が高くなる。
ここで、RAID制御装置障害に起因するMulti Dead/Multi Unmount状態とは、例えば、ディスクのマウント制御を行っているデバイスやRAID制御装置部分の信号配線で障害が発生することにより、システムからディスクが見えなくなってしまう場合である。この場合、ディスクおよびRAID制御装置の両方においてエラーを示すLEDを点灯させ、ユーザに通知することは可能であるが、ユーザはRAID制御装置障害に起因するものかどうかの判断ができない。
本発明は上述した問題点を解決するためになされたものであり、RAID制御装置の障害に起因してディスクエラーが発生した場合であっても、自動的に復旧を行うRAID制御装置、RAID制御プログラム、RAID制御方法を提供することを目的とする。
上述した課題を解決するため、本発明は、RAID装置を制御するRAID制御装置であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置において、ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断部と、前記診断部が前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御部とを備えたものである。
また、本発明に係るRAID制御装置において、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記RAID装置の自動復旧を行う復旧部を更に備えることを特徴とするものである。
また、本発明に係るRAID制御装置において、前記復旧部は、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のRAID制御装置であると特定することを特徴とするものである。
また、本発明は、RAID装置の制御をRAID制御装置のコンピュータに実行させるRAID制御プログラムであって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID制御装置を制御することができるRAID装置のRAID制御プログラムにおいて、ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップとをコンピュータに実行させるものである。
また、本発明は、RAID装置の制御を行うRAID制御装置におけるRAID制御方法であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置のRAID制御方法において、ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップとを実行するものである。
本発明によれば、RAID制御装置の障害に起因してディスクエラーが発生した場合であっても、自動的に復旧を行うことができる。
以下、本発明の実施の形態について図面を参照しつつ説明する。
まず、本実施の形態に係るRAID制御装置を用いたRAID装置の構成について説明する。
図1は、本実施の形態に係るRAID装置の構成の一例を示すブロック図である。図1において、図4と同一符号は図4に示された対象と同一又は相当物を示しており、ここでの説明を省略する。図4と比較すると図1は、RAID制御装置111a,111bの代わりに本実施の形態に係るRAID制御装置であるRAID制御装置11a,11bを備える。RAID制御装置11a,11bがディスク21a,21b,21c,21d,21eの制御を行うことにより、ディスク21a,21b,21c,21d,21eはRAID5のRAIDグループを構成する。
次に、RAID制御装置11aの動作について説明する。
図2は、本実施の形態に係るRAID制御装置の動作の一例を示すブロック図である。RAID制御装置11aが、ディスク21a,21b,21c,21d,21eのうち1本について1本目のディスクエラーを検出すると(S11)、RAID制御装置11aは、もう一つのRAID制御装置11bの診断を行い、RAID制御装置11bに異常があるか否かの判断を行う(S12)。ここでRAID制御装置11aが診断において採取した情報は、RAID制御装置11aのキャッシュのような読み出し可能なメモリ等に格納しておき、Multi Dead/Multi Unmount状態から復旧する場合等に参照することができる。
もう一つのRAID制御装置11bに異常がない場合(S12,N)、RAID制御装置11aは、ディスクエラーの原因がRAID制御装置以外にあると判断する(S21)。
もし、2本目のディスクエラーが発生した場合(S22,N)、図5の例に示したような従来のMulti Dead/Multi Unmount復旧方法を実行する(S24)。ここでは、ディスクの強制組み込みと交換によるRebuildが行われ、その結果、RAID装置が運用可能となり、このフローを終了する。
一方、もう一つのRAID制御装置11bに異常がある場合(S12,Y)、RAID制御装置11aは、もう一つのRAID制御装置11bをRAID装置から切り離し(S13)、その後、所定の時間内に2本目のディスクエラーが発生したか否かの判断を行う(S14)。
RAID制御装置11bの切り離し後、所定の時間内に2本目のディスクエラーが発生しなかった場合(S14,N)、RAID制御装置11aは、ディスクエラーの原因がもう一つのRAID制御装置11bにあり、ディスク自体は異常がないと判断し(S31)、エラーが発生したディスクをRAID装置に組み込み直し(S32)、RAIDグループの自動復旧を実行する(S33)。その結果、ディスクの交換を行うことなく、RAID装置が自動的に運用可能となり、このフローを終了する。
一方、RAID制御装置11bの切り離し後、所定の時間内に2本目のディスクエラーが発生した場合(S14,Y)、RAID制御装置11aは、ディスクエラーの原因がRAID制御装置11a自身にあると判断し(S15)、RAID制御装置11bを再びRAID装置に組み込み(S16)、RAID制御装置11a自身をRAID装置から切り離し(S17)、このフローを終了する。
上述した処理S17において、RAID制御装置11aは自己を切り離すとしたが、処理S16により組み込まれたRAID制御装置11bがRAID制御装置11aを切り離すように動作しても良い。
このフローにおいては、RAID制御装置11aの動作について説明したが、RAID制御装置11bも同様の動作を行う。
上述した動作により、1本目のディスクエラーが発生した時点で、2つのRAID制御装置が互いの診断を行い、ディスクエラーの原因となったRAID制御装置を切り離した場合、Multi Dead/Multi Unmount状態を防ぐことができる。また、RAID制御装置の異常により診断の結果が正しく得られず、正常なRAID制御装置を切り離してしまった場合でも、自動的にRAID制御装置を再び切り替えることにより原因を特定できると共に、更なる障害の発生を防ぐことができる。
次に、一旦RAID装置から切り離され、再び組み込まれた場合のRAID制御装置11bの動作について説明する。
図3は、本実施の形態に係る他のRAID制御装置の動作の一例を示すブロック図である。RAID制御装置11aがRAID装置から切り離された後、RAID制御装置11bは、所定の時間内に3本目のディスクエラーが発生したか否かの判断を行う(S41)。
RAID制御装置11aの切り離し後、所定の時間内に3本目のディスクエラーが発生しなかった場合(S41,N)、RAID制御装置11bは、ディスクエラーの原因がもう一つのRAID制御装置11aにあり、ディスク自体は異常がないと判断し(S42)、エラーが発生したディスクをRAIDグループに組み込み直し(S43)、RAIDグループの自動復旧を実行する(S44)。その結果、ディスクの交換などの人手による作業を行うことなく、RAID装置が運用可能となり、このフローを終了する。ここで、RAID制御装置11bは、処理S12やその他のプロセスで採取された情報を用いて自動復旧におけるディスクの復旧順序を決定する。
一方、RAID制御装置11aの切り離し後、所定の時間内に3本目のディスクエラーが発生した場合(S41,Y)、RAID制御装置11bは、ディスクエラーの原因がRAID制御装置以外にあると判断し(S51)、従来のMulti Dead/Multi Unmount復旧方法を実行する(S52)。ここでは、ディスクの強制組み込みと交換によるRebuildが行われ、その結果、RAID装置が運用可能となり、このフローを終了する。
このフローにおいては、RAID制御装置11bの動作について説明したが、RAID制御装置11aも同様の動作を行う。
また、Multi Dead/Multi Unmount状態に至った原因となるコンポーネントを特定できると共に、原因がRAID制御装置であったとしてもRAID装置を自動で迅速に復旧させることができる。
更に、RAID制御装置を構成するコンピュータにおいて上述した各ステップを実行させるプログラムを、RAID制御プログラムとして提供することができる。上述したプログラムは、コンピュータにより読取り可能な記録媒体に記憶させることによって、RAID制御装置を構成するコンピュータに実行させることが可能となる。ここで、上記コンピュータにより読取り可能な記録媒体としては、ROMやRAM等のコンピュータに内部実装される内部記憶装置、CD−ROMやフレキシブルディスク、DVDディスク、光磁気ディスク、ICカード等の可搬型記憶媒体や、コンピュータプログラムを保持するデータベース、或いは、他のコンピュータ並びにそのデータベースや、更に回線上の伝送媒体をも含むものである。
なお、診断部と制御部と復旧部は、実施の形態におけるRAID制御装置に対応する。また、診断ステップは、実施の形態の図2における処理S12に対応する。また、復旧ステップは、実施の形態の図2と図3における処理S23,S24,S32,S33,S43,S44,S52に対応する。また、制御ステップは、実施の形態の図2と図3における診断ステップと制御ステップ以外の処理に対応する。
(付記1) RAID装置を制御するRAID制御装置であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置において、
ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断部と、
前記診断部が前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御部と
を備えるRAID制御装置。
(付記2) 付記1に記載のRAID制御装置において、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記RAID装置の自動復旧を行う復旧部を更に備えることを特徴とするRAID制御装置。
(付記3) 付記2に記載のRAID制御装置において、
前記復旧部は、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のRAID制御装置であると特定することを特徴とするRAID制御装置。
(付記4) 付記2または付記3に記載のRAID制御装置において、
前記復旧部は、前記診断部が前記他のRAID制御装置に異常がないと判断した場合、前記RAID装置の復旧を支援することを特徴とするRAID制御装置。
(付記5) 付記2乃至付記4のいずれかに記載のRAID制御装置において、
前記復旧部は、前記他のRAID制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中の所定の時間内にディスクエラーが検出された場合、前記RAID装置の復旧を支援することを特徴とするRAID制御装置。
(付記6) 付記2乃至付記5のいずれかに記載のRAID制御装置において、
前記復旧部は、前記診断部や前記復旧部による診断の結果に基づいて前記自動復旧を行うことを特徴とするRAID制御装置。
(付記7) RAID装置の制御をRAID制御装置のコンピュータに実行させるRAID制御プログラムであって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID制御装置を制御することができるRAID装置のRAID制御プログラムにおいて、
ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップと
をコンピュータに実行させるRAID制御プログラム。
(付記8) 付記7に記載のRAID制御プログラムにおいて、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記RAID装置の自動復旧を行う復旧ステップを更にコンピュータに実行させることを特徴とするRAID制御プログラム。
(付記9) 付記8に記載のRAID制御プログラムにおいて、
前記復旧ステップは、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のRAID制御装置であると特定することを特徴とするRAID制御プログラム。
(付記10) 付記8または付記9に記載のRAID制御プログラムにおいて、
前記復旧ステップは、前記診断ステップが前記他のRAID制御装置に異常がないと判断した場合、前記RAID装置の復旧を支援することを特徴とするRAID制御プログラム。
(付記11) 付記8乃至付記10のいずれかに記載のRAID制御プログラムにおいて、
前記復旧ステップは、前記他のRAID制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中にディスクエラーが検出された場合、前記RAID装置の復旧を支援することを特徴とするRAID制御プログラム。
(付記12) 付記8乃至付記11のいずれかに記載のRAID制御プログラムにおいて、
前記復旧ステップは、前記診断ステップや前記復旧ステップによる診断の結果に基づいて前記自動復旧を行うことを特徴とするRAID制御プログラム。
(付記13) RAID装置の制御を行うRAID制御装置におけるRAID制御方法であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置のRAID制御方法において、
ディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、
前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行うとともに、該単独制御中にディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップと
を実行するRAID制御方法。
(付記14) 付記13に記載のRAID制御方法において、
自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、ディスクエラーが発生したディスクを使用可能な状態とし、前記RAID装置の自動復旧を行う復旧ステップを更にコンピュータに実行させることを特徴とするRAID制御方法。
(付記15) 付記14に記載のRAID制御方法において、
前記復旧ステップは、自己の単独制御が開始されてから所定の時間内にディスクエラーが検出されなかった場合、前記ディスクエラーの原因が前記他のRAID制御装置であると特定することを特徴とするRAID制御方法。
(付記16) 付記14または付記15に記載のRAID制御方法において、
前記復旧ステップは、前記診断ステップが前記他のRAID制御装置に異常がないと判断した場合、前記RAID装置の復旧を支援することを特徴とするRAID制御方法。
(付記17) 付記14乃至付記16のいずれかに記載のRAID制御方法において、
前記復旧ステップは、前記他のRAID制御装置による単独制御の状態から、自己の単独制御の状態に切り替えられた場合において、該自己の単独制御中にディスクエラーが検出された場合、前記RAID装置の復旧を支援することを特徴とするRAID制御方法。
(付記18) 付記14乃至付記17のいずれかに記載のRAID制御方法において、
前記復旧ステップは、前記診断ステップによる診断の結果に基づいて前記自動復旧を行うことを特徴とするRAID制御方法。
本実施の形態に係るRAID装置の構成の一例を示すブロック図である。 本実施の形態に係るRAID制御装置の動作の一例を示すブロック図である。 本実施の形態に係る他のRAID制御装置の動作の一例を示すブロック図である。 従来のRAID装置の構成の一例を示すブロック図である。 従来のMulti Dead/Multi Unmount復旧方法において復旧させるディスクの順番の一例を示す表である。
符号の説明
11a,11b RAID制御装置、21a,21b,21c,21d,21e ディスク。

Claims (5)

  1. 複数のディスクを有するRAID装置を制御するRAID制御装置であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置において、
    前記RAID装置が有する複数のディスクのうち、第1ディスクのディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断部と、
    前記診断部が前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行、該単独制御中に前記第1ディスクとは異なる第2ディスクのディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御部と
    を備えるRAID制御装置。
  2. 請求項1に記載のRAID制御装置において、
    自己の単独制御が開始されてから所定の時間内に前記第2ディスクのディスクエラーが検出されなかった場合、前記第1ディスクを使用可能な状態とし、前記RAID装置の自動復旧を行う復旧部を更に備えることを特徴とするRAID制御装置。
  3. 請求項2に記載のRAID制御装置において、
    前記復旧部は、自己の単独制御が開始されてから所定の時間内に前記第2ディスクのディスクエラーが検出されなかった場合、前記第1ディスクのディスクエラーの原因が前記他のRAID制御装置であると特定することを特徴とするRAID制御装置。
  4. 複数のディスクを有するRAID装置の制御をRAID制御装置のコンピュータに実行させるRAID制御プログラムであって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID制御装置を制御することができるRAID装置のRAID制御プログラムにおいて、
    前記RAID装置が有する複数のディスクのうち、第1ディスクのディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、
    前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行、該単独制御中に前記第1ディスクとは異なる第2ディスクのディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップと
    をコンピュータに実行させるRAID制御プログラム。
  5. 複数のディスクを有するRAID装置の制御を行うRAID制御装置におけるRAID制御方法であって、当該RAID制御装置と異なる他のRAID制御装置と協働して少なくとも一つのRAID装置を制御することができるRAID制御装置のRAID制御方法において、
    前記RAID装置が有する複数のディスクのうち、第1ディスクのディスクエラーが検出された場合、前記他のRAID制御装置の診断を行う診断ステップと、
    前記診断ステップが前記他のRAID制御装置に異常があると判断した場合、前記他のRAID制御装置との協働による制御を停止し、単独による前記RAID装置の制御である単独制御を行、該単独制御中に前記第1ディスクとは異なる第2ディスクのディスクエラーが検出された場合、前記他のRAID制御装置による前記RAID装置の単独制御に切り替える制御ステップと
    を実行するRAID制御方法。
JP2005360213A 2005-12-14 2005-12-14 Raid制御装置、raid制御プログラム、raid制御方法 Expired - Fee Related JP4456060B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005360213A JP4456060B2 (ja) 2005-12-14 2005-12-14 Raid制御装置、raid制御プログラム、raid制御方法
US11/376,180 US7523347B2 (en) 2005-12-14 2006-03-16 RAID control apparatus, and RAID control program and RAID control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005360213A JP4456060B2 (ja) 2005-12-14 2005-12-14 Raid制御装置、raid制御プログラム、raid制御方法

Publications (2)

Publication Number Publication Date
JP2007164495A JP2007164495A (ja) 2007-06-28
JP4456060B2 true JP4456060B2 (ja) 2010-04-28

Family

ID=38247311

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005360213A Expired - Fee Related JP4456060B2 (ja) 2005-12-14 2005-12-14 Raid制御装置、raid制御プログラム、raid制御方法

Country Status (2)

Country Link
US (1) US7523347B2 (ja)
JP (1) JP4456060B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8006128B2 (en) * 2008-07-31 2011-08-23 Datadirect Networks, Inc. Prioritized rebuilding of a storage device
US8468609B2 (en) * 2009-08-27 2013-06-18 Cleversafe, Inc. Authenticating use of a dispersed storage network
GB2504956A (en) 2012-08-14 2014-02-19 Ibm Management of RAID error recovery procedures and configuration

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5367669A (en) * 1993-03-23 1994-11-22 Eclipse Technologies, Inc. Fault tolerant hard disk array controller
DE69523124T2 (de) 1994-12-15 2002-05-29 Hewlett Packard Co Fehlererkennungssystem für einen gespiegelten Speicher in einer duplizierten Steuerung eines Plattenspeicherungssystems
EP0721162A2 (en) 1995-01-06 1996-07-10 Hewlett-Packard Company Mirrored memory dual controller disk storage system
US6931576B2 (en) * 2002-01-07 2005-08-16 Sun Microsystems, Inc. Data integrity device providing heightened error protection in a data processing system
US7281160B2 (en) * 2003-02-10 2007-10-09 Netezza Corporation Rapid regeneration of failed disk sector in a distributed database system
US7213102B2 (en) * 2003-06-26 2007-05-01 International Business Machines Corporation Apparatus method and system for alternate control of a RAID array
US7209981B1 (en) * 2004-01-09 2007-04-24 Z Microsystems, Inc. System and method for switching data storage devices and multiple processors
US7356638B2 (en) * 2005-10-12 2008-04-08 International Business Machines Corporation Using out-of-band signaling to provide communication between storage controllers in a computer storage system

Also Published As

Publication number Publication date
US20070174674A1 (en) 2007-07-26
JP2007164495A (ja) 2007-06-28
US7523347B2 (en) 2009-04-21

Similar Documents

Publication Publication Date Title
US8762772B2 (en) Method for a plurality of RAID systems and data storage system thereof
US7529965B2 (en) Program, storage control method, and storage system
JP2008186296A (ja) ストレージシステム、ストレージ装置、ファームウェアの活性交換方法、ファームウェアの活性交換プログラム
JPH11338648A (ja) ディスクアレイ装置、そのエラ―制御方法、ならびにその制御プログラムを記録した記録媒体
JP2011086214A (ja) ディスクアレイ装置
JP2002108573A (ja) ディスクアレイ装置、そのエラー制御方法、ならびにその制御プログラムを記録した記録媒体
US8015434B2 (en) Management apparatus, storage system, and storage apparatus management method
JP2006301714A (ja) アレイコントローラ、当該アレイコントローラを含む情報処理装置及びディスクアレイ制御方法
JP4456060B2 (ja) Raid制御装置、raid制御プログラム、raid制御方法
CN103049407B (zh) 数据存储方法、装置及系统
JP2007241837A (ja) ディスクアレイ制御装置および故障診断方法
JP2009217408A (ja) データ格納装置のデータ復旧方法及びその装置並びにディスクアレイシステムのデータ復旧方法及びその装置
US7457990B2 (en) Information processing apparatus and information processing recovery method
JP2006277724A (ja) 処理装置及びその障害復旧方法と障害回復方法
JP2009252001A (ja) Raidシステム、及びエラーセクタの修復方法
CN101828189A (zh) 用于中断写入恢复的数据存储方法、设备和系统
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
JPH10275060A (ja) アレイディスク制御装置
JP2013125428A (ja) 管理システム、管理装置および電子機器の管理方法
JP2007334770A (ja) Raid装置、そのモジュール、ディスク組込み可否判定方法、及びプログラム
JP4294568B2 (ja) ディスクアレイ装置及びその制御方法
JP2830840B2 (ja) ディスクアレイ修復処理方式及び方法
JP2005157462A (ja) 系切り替え方法及び情報処理システム
JP2005055963A (ja) ボリューム制御方法、この方法を実行するプログラム、及びストレージ装置
JP2007004296A (ja) 監視装置、監視方法および情報処理装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100204

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4456060

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140212

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees