JP2014123258A - ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム - Google Patents

ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム Download PDF

Info

Publication number
JP2014123258A
JP2014123258A JP2012279204A JP2012279204A JP2014123258A JP 2014123258 A JP2014123258 A JP 2014123258A JP 2012279204 A JP2012279204 A JP 2012279204A JP 2012279204 A JP2012279204 A JP 2012279204A JP 2014123258 A JP2014123258 A JP 2014123258A
Authority
JP
Japan
Prior art keywords
information
disk
storage unit
rebuild
array system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012279204A
Other languages
English (en)
Other versions
JP5913078B2 (ja
Inventor
Yasuhiko Asakura
安彦 朝倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012279204A priority Critical patent/JP5913078B2/ja
Publication of JP2014123258A publication Critical patent/JP2014123258A/ja
Application granted granted Critical
Publication of JP5913078B2 publication Critical patent/JP5913078B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】ディスクアレイシステムのリビルド開始前の障害に対しても、適切にリビルドを実行させること。
【解決手段】ディスクアレイシステム1は、障害が発生したディスクドライブ23がホットスワップされたことを検出するディスク制御部22と、ディスク制御部22の検出結果である、ホットスワップされたディスクドライブ23の情報が、HS情報として記憶されるHS情報記憶部24と、HS情報記憶部24内のHS情報のバックアップ先であるHSバックアップ記憶部13と、HS情報記憶部24内のHS情報が消失したときに、HSバックアップ記憶部13内のHS情報を、HS情報記憶部24へと復旧するプロセッサ部11と、を有する。
【選択図】図1

Description

本発明は、ディスクアレイシステム、データ復旧方法、および、データ復旧プログラムに関する。
制御コントローラと複数のディスクドライブを搭載したディスクアレイシステムにおいて、データの高速化、大容量化、信頼性向上を図る技術としてRAID(Redundant Arrays of Independent Disks)が採用されている。RAIDモデルの中で特に信頼性を追及したRAID6は、ディスクドライブを複数(N台)必要とし、制御コントローラは、データに加えて、ダブルパリティ(エラー訂正情報の2重化)を生成して、N台のディスクドライブに分割して書き込むことで冗長性を持たせている。2台のディスクドライブに障害が発生した状態でも、継続稼動可能であり、かつ、残りの(N−2)台のデータとパリティをもとに、欠損したデータを生成することが可能である。
RAID6に代表されるディスクアレイシステムにおいて、あるディスクドライブに障害が発生した場合には、作業員は、その障害が発生したディスクドライブ(障害ドライブ)を、新規のスペアディスクドライブ(新規ドライブ)に交換する。その後、ディスクアレイシステムは、障害が発生していない残りのディスクドライブのデータから、新規ドライブのデータを復元(リビルド)する。
このリビルド処理中に突発的に瞬時電源低下あるいは電源断に至る障害が発生したことにより、リビルド進捗状況に関するデータが消失すると、復電してもリビルドを中断したアドレスが把握できないため、リビルドをやり直す作業が必要であった。
そこで、特許文献1に記載されている技術によれば、リビルド処理中に電源断となった後に電源が再投入された場合、データを再構築するリビルド処理を行う制御部は、リビルド処理の進捗情報に基づいて、最後に書き込んだ再構築されたデータのアドレスからライトキャッシュの容量相当分前のアドレスを算出し、算出したアドレスからリビルド処理を再開することが可能であり、リビルド処理中の突発的な障害にも対応することができる。
また、特許文献2に記載されている技術によれば、リビルド処理が異常終了した後の電源再起動時に、書き込み領域情報によって示される書き込み途中領域に対応する全データセットを対象にデータ及び冗長データの整合性を修復するための処理を行うことにより、当該データセットに含まれているデータとパリティデータとの不整合がもたらすデータ消失を防止できる。さらに、書き込み領域情報の内容は、2重化されたディスク制御装置間で、一致化される。
特開2012−14638号公報 特開2005−78430号公報
図8は、ディスクアレイシステムを構成するディスクごと(正確には、ディスクをディスクアレイシステムに指す箇所であるスロットごと)の状態を示す状態遷移図である。
ディスクの状態は、正常状態→HS待ち状態→リビルド可能状態→リビルド中状態→正常状態…の順に遷移する。
正常状態は、ディスクへのアクセスが正常に行える状態であり、この正常状態からディスクへの障害が発生すると、HS(Hot Swap)待ち状態へと遷移する。なお、HS(Hot Swap)とは、ディスクアレイシステムの電源投入中に行われる、障害ドライブから新規ドライブへの交換作業である。
HS待ち状態は、障害ドライブがスロットに刺さっていることで、ディスクアクセスが正常に行えない状態であり、このHS待ち状態から作業員によるHSの作業により新規ドライブへの交換が行われると、リビルド可能状態へと遷移する。
リビルド可能状態は、新規ドライブがスロットに刺さっていることで、ディスクアクセスがハードウェア的には正常に行えるものの、新規ドライブへのリビルドが開始されていないため、データアクセスが行えない状態である。このリビルド可能状態からリビルド開始によりリビルド処理が起動されると、リビルド中状態へと遷移する。
リビルド中状態は、新規ドライブへのリビルドが実行中であり、まだリビルドが完了していない状態である。このリビルド中状態からリビルドが完了すると、新規ドライブへのデータが復旧し、正常状態へと遷移する。
前記した特許文献1,2などの各先行技術では、リビルドの進捗状況(書き込み領域)を保存しておき、新規ドライブのリビルド中状態において新たに障害が発生したときに、既に途中まで実行している進捗状況をもとに、リビルドを途中から再開することができる。
しかし、リビルド中状態の進捗状況を管理するだけでは、リビルド開始前のHS待ち状態に行われるHS作業の進捗状況が、新たな障害により消失した場合に対処できていない。つまり、ディスクのスロットごとに、そのスロットの障害ドライブが新規ドライブへとホットスワップされたか否かを示す情報(以下、HS(Hot Swap)情報)が、新たな障害により消失する可能性もある。
もし、HS情報の消失により、実際にはホットスワップが行われたにもかかわらず、ホットスワップ未実行であると誤判断される場合、リビルド可能状態になっているにもかかわらず、新規ドライブへのリビルドが開始されない。その結果、リビルドの復旧待ち時間が長期化してしまい、ディスクアレイシステムのユーザに不便を強いてしまう。
一方、HS情報の消失により、実際にはホットスワップが行われていないにもかかわらず、ホットスワップ実行済であると誤判断される場合、リビルド可能状態になっていないにもかかわらず、障害ドライブへのリビルドが開始されてしまう。その結果、障害ドライブが交換されずに引き続き利用されてしまい、ディスクアレイシステムの信頼性が低下してしまう。
そこで、本発明は、ディスクアレイシステムのリビルド開始前の障害に対しても、適切にリビルドを実行させることを、主な目的とする。
前記課題を解決するために、本発明のディスクアレイシステムは、
複数のディスクドライブのうちの障害が発生したディスクドライブが別のディスクドライブへとホットスワップされたことを検出するディスク制御部と、
前記ディスク制御部の検出結果である、前記ホットスワップされたディスクドライブの情報が、HS情報として記憶されるHS情報記憶部と、
前記HS情報記憶部内のHS情報が示す前記ディスクドライブに対して、前記複数のディスクドライブのうちの障害が発生していないディスクドライブのデータをもとに、前記ディスクドライブ内に格納するデータをリビルドするリビルド制御部と、
前記HS情報記憶部内のHS情報のバックアップ先であるHSバックアップ記憶部と、
前記HS情報記憶部内のHS情報が消失したときに、前記HSバックアップ記憶部内のHS情報を、前記HS情報記憶部へと復旧するプロセッサ部と、を有することを特徴とする。
その他の手段は、後記する。
本発明によれば、ディスクアレイシステムのリビルド開始前の障害に対しても、適切にリビルドを実行させることができる。
本発明の一実施形態に関するディスクアレイシステムの第1例を示す構成図である。 本発明の一実施形態に関するディスクの正常化処理の第1例を示すフローチャートである。 本発明の一実施形態に関するディスクの正常化処理の第2例を示すフローチャートである。 本発明の一実施形態に関するディスクの正常化処理の第3例を示すフローチャートである。 本発明の一実施形態に関するホスト制御装置の処理を示すフローチャートである。 本発明の一実施形態に関するディスクアレイシステムの第2例を示す構成図である。 本発明の一実施形態に関するディスクアレイシステムの第3例を示す構成図である。 本発明の一実施形態に関するディスクごとの状態を示す状態遷移図である。
以下、本発明の一実施形態を、図面を参照して詳細に説明する。
図1は、ディスクアレイシステムの第1例を示す構成図である。ディスクアレイシステム1は、ホスト制御装置10と、ディスクアレイ装置20とがインターフェース30で接続されて構成される。ホスト制御装置10は、ホストとして動作し、ディスクアレイ装置20のデバイス制御を司る。インターフェース30は、eSATA(external Serial Advanced Technology Attachment)やSAS(Serial Attached Small Computer System Interface)などが使用される。
ホスト制御装置10は、プロセッサ部11と、ホストディスクアレイ制御部12と、HSバックアップ記憶部13とを含めて構成される。
プロセッサ部11は、中央演算処理装置であり、図示しないFLASH ROM(Read Only Memory)などの不揮発性メモリによる記憶部に格納されたプログラムを実行することで、ホスト制御装置10とディスクアレイ装置20の両方に対して命令を決定し、実行する。
ホストディスクアレイ制御部12は、プロセッサ部11から受信するライト要求に従ってHSバックアップ記憶部13からデータを受信し、インターフェース30を介してディスクアレイ装置20へデータを送信するためのデータ形式変換とデータ送信を行う。
ホストディスクアレイ制御部12は、プロセッサ部11から受信するリード要求に従ってディスクアレイ装置20からインターフェース30を介してデータを受信し、HSバックアップ記憶部13へデータを送信するためのデータ形式変換とデータ送信を行う。
HSバックアップ記憶部13は、プロセッサ部11の命令に従って、ディスクアレイ装置20から読み出されたHS情報のバックアップを記憶する。なお、HS情報とは、前記したように、ディスクのスロットごとに、そのスロットの障害ドライブが新規ドライブへとホットスワップされたか否かを示す情報であり、例えば、ホットスワップのイベントが発生したスロットのリストとして構成される。または、ディスクごとに現時点でスロットに刺さっているディスクのシリアル番号の集合を保持しておき、そのシリアル番号の集合が過去のものから変化したときに、その変化分(差分)をHS情報としてもよい。
ディスクアレイ装置20は、ディスクアレイホスト制御部21、ディスク制御部22、ディスクドライブ23、HS情報記憶部24、リビルド制御部25、および、リビルド進捗記憶部26を含めて構成される。
ディスクアレイホスト制御部21は、インターフェース30を介してホスト制御装置10から受信するライトデータをディスク制御部22に送信するためのデータ形式変換とデータ送信を行う。
ディスクアレイホスト制御部21は、ディスク制御部22から受信するリードデータをインターフェース30を介してホスト制御装置10に送信するためのデータ形式変換とデータ送信を行う。
ディスク制御部22は、複数の(図1では、6台を例示)ディスクドライブ23に対して、RAID6などのRAIDモデルを構築する。なお、本実施形態では、RAID6を使用したディスクアレイシステムを例示するが、他のRAIDを使用してもよい。
例えば、RAID6では、2台のディスクドライブ23が同時期に故障してもリビルド可能なので、HS情報は最大2台分となるが、RAID5では、1台のディスクドライブ23が故障したときにリビルド可能なので、HS情報は最大1台分となる。
さらに、3台以上のディスクドライブ23が同時期に故障したときに、それらを残りのディスクドライブ23からリビルド可能なディスクアレイシステムに対して、HS情報としてディスクドライブ23の台数分を管理することにより、本実施形態を適用してもよい。
複数のディスクドライブ23には、フラッシュドライブ、SAS(Serial Attached SCSI)ディスク、SATA(Serial Advanced Technology Attachment)ディスクなどが使用され、ディスク制御部22にて冗長化されたデータを記憶する。
なお、ディスクアレイ装置20は、各ディスクドライブ23に記憶するデータ内容として、例えば、ディスクアレイ装置20に接続された監視カメラ(図示省略)からの監視映像データを格納する。
ディスク制御部22は、ディスクアレイホスト制御部21から受信したライトデータにパリティ(エラー訂正情報)を付加することで冗長性を持たせたデータを生成し、ディスクドライブ23に分割して書き込む。ディスク制御部22は、ディスクドライブ23からリードデータを読み込んで、ディスクアレイホスト制御部21へ送信する。
ディスク制御部22は、各ディスクドライブ23を監視するとともに、障害が発生したディスクドライブ23に対してホットスワップが行われた場合には、そのホットスワップされたディスクドライブ情報を、HS情報としてHS情報記憶部24に書き込み、リビルド制御部25へ送信する。
ここで、HS情報記憶部24内のHS情報(オリジナル)と、HSバックアップ記憶部13内のHS情報(バックアップ)とは、データ同期(データの同一化)がなされる。
ディスク制御部22は、ホスト制御装置10からHS情報のリード要求(バックアップ待避要求)があった場合には、HS情報記憶部24からHS情報を読み込み、ディスクアレイホスト制御部21へ送信する。
ディスク制御部22は、ホスト制御装置10からHS情報のライト要求(バックアップ復元要求)があった場合には、ディスクアレイホスト制御部21からHS情報を読み込み、HS情報記憶部24に書き込む。
リビルド制御部25は、ディスク制御部22からホットスワップしたディスクドライブ情報を受信した場合、リビルドを開始するとともに、リビルドを開始した情報をディスク制御部22に送信し、そのリビルド進捗状況をリビルド進捗記憶部26に管理する。なお、リビルド制御部25は、ディスク制御部22に含まれる構成であってもよい。
以上説明したディスクアレイシステム1の各記憶部として、HS情報記憶部24は、揮発性メモリにて構成され、HSバックアップ記憶部13は、不揮発性メモリにより構成され、リビルド進捗記憶部26は、不揮発性メモリやHDD(Hard disk drive)などのディスクドライブによって構成される。
なお、不揮発性メモリやHDDは、電源遮断によってもデータ内容が消失しないが、揮発性メモリは、電源遮断によってもデータ内容が消失してしまう。しかし、HS情報は、揮発性メモリ(HS情報記憶部24)だけでなく、不揮発性メモリ(HSバックアップ記憶部13)にも記憶されているため、電源遮断によってもデータ内容が消失しない。
図2〜図4は、それぞれ2台のディスク(#1,#2)に障害が発生したときに、それらのリビルド処理中に、さらに電源障害が発生した場合を示すフローチャートである。
図2は、ディスクの正常化処理の第1例を示すフローチャートである。
S121として、ディスク制御部22は、ディスクドライブ23に障害が発生していない場合は、HS情報は存在しないので、HS情報記憶部24にHS情報を書き込まなくてもよい。
S111として、ホスト制御装置10は、HS情報記憶部24の内容を、HSバックアップ記憶部13へとバックアップする。なお、S121ではHS情報が無いので、S111でもHSバックアップ記憶部13にバックアップするHS情報は、存在しない。
なお、ディスクアレイ装置20からホスト制御装置10へのHS情報のバックアップ処理(S111など)は、プロセッサ部11が、ホストディスクアレイ制御部12に対し、ポーリングにて定期的にHS情報のリード要求を出し、ディスク制御部22がそのリード要求への応答としてHS情報記憶部24内のHS情報をHSバックアップ記憶部13に書き込ませることにより、実現される。
また、HS情報のバックアップ処理(S111など)において、前回のHSバックアップ記憶部13内のHS情報と、今回のHS情報記憶部24内のHS情報とが一致する場合(つまり、HS情報への更新が行われなかった場合)、今回のHSバックアップ記憶部13へのHS情報の書き出し処理を省略してもよい。
S131として、ディスクドライブ23#1に、ディスク障害が発生し、続けて、S141として、ディスクドライブ23#2に、ディスク障害が発生したとする。これらのディスク障害は、ディスクアレイシステム1の異常検出手段(図示省略)により検知され、ディスクアレイシステム1の異常通知手段(図示省略)により、作業員に通知される。
S132として、ディスクドライブ23#1は、異常通知を受けて現場に駆けつけた作業員によって、手動でHS(ホットスワップ)される。
S122として、ディスク制御部22は、S132でホットスワップされたディスクドライブ23#1を検出し、その検出結果(HS情報=#1)をHS情報記憶部24に書き込む。
S112として、ホスト制御装置10は、S122で書き込まれた「HS情報=#1」を、S111と同様に、HSバックアップ記憶部13へとバックアップする。
S133として、リビルド制御部25は、S122のHS情報=#1を受け(図8では、HS作業により、リビルド可能状態になったことを受け)、ディスクドライブ23#1に対して、リビルドを開始する。このリビルド開始に伴い、リビルド制御部25は、そのリビルドの進捗をリビルド進捗記憶部26へ書き込み続けるとともに、ディスクドライブ23#1のリビルドが開始された情報をディスク制御部22に送信する。
S123として、ディスク制御部22は、S133のリビルドが開始された情報を受け、「HS情報=#1」をHS情報記憶部24から消去する。
S113として、ホスト制御装置10は、S123で書き込まれた「HS情報=(なし)」を、S111と同様に、HSバックアップ記憶部13へとバックアップする。
S142として、ディスクドライブ23#2は、異常通知を受けて現場に駆けつけた作業員によって、S132のディスクドライブ23#1と同様に、手動でHS(ホットスワップ)される。
S124として、ディスク制御部22は、S122のディスクドライブ23#1と同様に、検出結果(HS情報=#2)をHS情報記憶部24に書き込む。
S114として、ホスト制御装置10は、ホスト制御装置10は、S112の「HS情報=#1」と同様に、S124で書き込まれた「HS情報=#2」を、HSバックアップ記憶部13へとバックアップする。
ここで、落雷など不可抗力の要因により、電源断または瞬時の電源低下などの電源障害が、ディスクアレイシステム1のそれぞれの各構成要素に発生する(S115,S125,S134,S143)。
S115として、ホスト制御装置10内のHSバックアップ記憶部13では、電源障害にもかかわらず、不揮発性メモリ内のデータ(HS情報=#2)は消失しなくて済む。
S125として、ディスク制御部22内のHS情報記憶部24では、電源障害によって、揮発性メモリ内のデータ(HS情報=#2)が消失してしまう。
S134として、電源障害によって、ディスクドライブ23#1のリビルドは中断してしまう。しかし、ディスクドライブ23#1のリビルド進捗情報(S133で開始された後の最新のデータ書き込み位置など)は、不揮発性メモリ内(リビルド進捗記憶部26)なので、消失しなくて済む。
S143として、ディスクドライブ23#2は、図8のリビルド可能状態であり、まだリビルドは開始していない。
そして、S116において、ディスクアレイシステム1の電源が復旧する。
S135として、リビルド制御部25は、リビルド進捗記憶部26内のディスクドライブ23#1のリビルド進捗情報を参照して、S134で中断してしまったディスクドライブ23#1のリビルドを途中から再開し、完了させる。
S126として、ディスク制御部22は、HS情報記憶部24内の「HS情報=(なし)」を、HSバックアップ記憶部13へとバックアップする。
S117として、ホスト制御装置10は、S126で通知された「HS情報=(なし)」と、S114で前回格納したHSバックアップ記憶部13内の「HS情報=#2」との不一致により、HS情報をHSバックアップ記憶部13からHS情報記憶部24へと復旧する契機であると判断する。
S118として、ホスト制御装置10は、HSバックアップ記憶部13内の「HS情報=#2」を、ディスクアレイ装置20に通知して復旧させる。
S127として、ディスク制御部22は、S117で通知された「HS情報=#2」を、HS情報記憶部24内に書き出す(復旧する)。
S144として、リビルド制御部25は、S133と同様に、S127のHS情報=#2を受け、ディスクドライブ23#2に対して、リビルドを開始し、終了させる。
図3は、ディスクの正常化処理の第2例を示すフローチャートである。図2の第1例と比較すると、ディスクドライブ23#2へのディスク障害(S141)の発生時期が、図2(S132の前)よりも図3(S133の後)のほうが、遅くなっている。一方、S141以外の各処理は、図2も図3も同じである。
図4は、ディスクの正常化処理の第3例を示すフローチャートである。図2の第1例と比較すると、図2では、ディスクドライブ23#2へのホットスワップ関連の各処理(S142→S124→S114)が、ディスクドライブ23#1へのリビルド開始(S133)後に行われていたのに対し、図4では、ディスクドライブ23#2へのホットスワップ関連の各処理(S142b→S124b→S114b)が、ディスクドライブ23#1へのリビルド開始(S133)前に行われている点が異なる。
なお、S142とS142b、S124とS124b、S114とS114bは、それぞれ同じ処理であるが、対象とするデータに若干の違いがある。その違いとは、図2のHS情報では、「HS情報=(なし)」の状態からディスクドライブ23#2の「HS情報=#2」を追加していたのに対し、図4のHS情報では、「HS情報=#1」の状態からディスクドライブ23#2の「HS情報=#2」を追加した結果、同時に2つのHS情報(#1と#2)が存在する点である。
図5は、ホスト制御装置の処理を示すフローチャートである。
S201として、プロセッサ部11は、ディスクアレイ装置20に送信したリード要求への応答として、ディスクアレイ装置20からHS情報記憶部24内のHS情報を受信する(図2では、S111,S112,S113,S114,S117に該当)。
S202として、プロセッサ部11は、自身のホスト制御装置10内のHSバックアップ記憶部13からHS情報を読み込む。
S203として、プロセッサ部11は、S201,S202でそれぞれ取得した両HS情報が一致するか否かを判定する。S203でYesなら処理をS201に戻し、NoならS204へ進む。
S204として、プロセッサ部11は、HS情報に付されたタイムスタンプなどを参照して、S201のHS情報がHSバックアップ記憶部13のHS情報から更新されたデータであるか否かを判定する。S204でYesならS205へ進み、NoならS206へ進む。
S205として、プロセッサ部11は、S201のHS情報を自身のホスト制御装置10内のHSバックアップ記憶部13に書き出す(図2では、S112,S113,S114に該当)。そして、処理をS201に戻す。
S206として、プロセッサ部11は、HSバックアップ記憶部13内のHS情報を、HS情報記憶部24内に書き戻す(復旧させる)ためのライト要求を、ディスクアレイ装置20に送信する(図2では、S118に該当)。
図6は、ディスクアレイシステムの第2例を示す構成図である。HS情報のバックアップを管理するための機構として、図1ではHSバックアップ記憶部13を用いたが、図6ではその代わりに外部ストレージ制御部13aと外部ストレージ13bとを備える。
外部ストレージ制御部13aは、ホストディスクアレイ制御部12から要求に応じて外部ストレージ13bに対してHS情報の読み込みと書き込みとを行う。外部ストレージ制御部13aは、プロセッサ部11に内蔵される構成であってもよい。
外部ストレージ13bは、USB(Universal Serial Bus)フラッシュメモリなどの脱着可能な記憶媒体によって構成され、HS情報を記憶する。
図7は、ディスクアレイシステムの第3例を示す構成図である。図7では、図1のホスト制御装置10に加えて、ネットワーク制御部16およびファームウェア記憶部17を設けた構成を示している。
ネットワーク制御部16は、ネットワーク40に接続され、情報端末41の要求に応じてデータをネットワーク40から受信し、ファームウェア記憶部17へデータを送信するための形式変換と送信を行う。
ファームウェア記憶部17は、FLASH ROMなどの不揮発性メモリにより構成され、プロセッサ部11が実行するためのプログラム(ファームウェア)が格納されている。
ネットワーク40は、PC(Personal Computer)や携帯電話等の機器同士を接続する回線、即ちインターネットやLAN(Local Area Network)などである。
情報端末41は、PC(Personal Computer)や携帯電話等であり、ネットワーク40と接続して、ホスト制御装置10に対してデータを送信するアプリケーションなどにより実現される機能を備えている。
これにより、情報端末41からネットワーク40を介してホスト制御装置10に遠隔からアクセスし、図2〜図5に示した各処理を実行するためのプログラム(ファームウェア)をファームウェア記憶部17に更新することができる。この遠隔更新により、作業員がユーザの設置環境まで足を運ぶ必要が無くなることで時間とコストを削減できる。
以上説明した本実施形態では、ホスト制御装置10とディスクアレイ装置20から構成され、複数台のディスクドライブ23をリビルドするディスクアレイシステム1を示した。ディスクアレイシステム1のリビルド中の電源障害によって、図8のHS待ち状態かリビルド可能状態かを特定できるHS情報が消失しても、ホスト制御装置10からHS情報が復旧される。これにより、ディスクアレイシステム1のリビルド開始前の障害に対しても、適切にリビルドを実行させることができる。
なお、図1などのディスクアレイシステム1は、HSバックアップ記憶部13と、HS情報記憶部24とを別々の装置に収容している。これにより、既存の設置されているディスクアレイ装置20を変更することなく、後付け(外付け)で接続されるホスト制御装置10の導入で耐障害性を向上させることができる。
さらに、図1などのディスクアレイシステム1は、その構成要素全体の電源障害(全電源喪失)を前提として(図2のS115,S125,S134,S143など)、その復旧方法を提案している。一方、無停電電源装置(UPS)を使用すれば、機器に対して瞬時電源低下あるいは停電を起こらないようにすることが可能であるが、コストが掛かることに加えて、UPSに蓄積された電力であるため供給時間が限られてしまう。しかし、本実施形態では、UPSを用いなくても済むため(もちろん、図1のディスクアレイシステム1に対してUPSを併用してもよい)、UPSに起因するこれらの問題を回避できる。
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVD(Digital Versatile Disc)などの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
1 ディスクアレイシステム
10 ホスト制御装置
11 プロセッサ部
12 ホストディスクアレイ制御部
13 HSバックアップ記憶部
13a 外部ストレージ制御部
13b 外部ストレージ
16 ネットワーク制御部
17 ファームウェア記憶部
20 ディスクアレイ装置
21 ディスクアレイホスト制御部
22 ディスク制御部
23 ディスクドライブ
24 HS情報記憶部
25 リビルド制御部
26 リビルド進捗記憶部
30 インターフェース
40 ネットワーク
41 情報端末

Claims (8)

  1. 複数のディスクドライブのうちの障害が発生したディスクドライブが別のディスクドライブへとホットスワップされたことを検出するディスク制御部と、
    前記ディスク制御部の検出結果である、前記ホットスワップされたディスクドライブの情報が、HS(Hot Swap)情報として記憶されるHS情報記憶部と、
    前記HS情報記憶部内のHS情報が示す前記ディスクドライブに対して、前記複数のディスクドライブのうちの障害が発生していないディスクドライブのデータをもとに、前記ディスクドライブ内に格納するデータをリビルドするリビルド制御部と、
    前記HS情報記憶部内のHS情報のバックアップ先であるHSバックアップ記憶部と、
    前記HS情報記憶部内のHS情報が消失したときに、前記HSバックアップ記憶部内のHS情報を、前記HS情報記憶部へと復旧するプロセッサ部と、を有することを特徴とする
    ディスクアレイシステム。
  2. 前記ディスクアレイシステムは、さらに、前記ディスクドライブに対するリビルド処理の進捗状況が記憶されるリビルド進捗記憶部を有しており、
    前記リビルド制御部は、前記リビルド処理が中断されたときに、前記リビルド進捗記憶部から読み取ったリビルド処理の進捗状況をもとに、前記中断されたリビルド処理を再開することを特徴とする
    請求項1に記載のディスクアレイシステム。
  3. 前記HS情報記憶部は、揮発性メモリにより構成され、
    前記HSバックアップ記憶部は、不揮発性メモリにより構成されることを特徴とする
    請求項1または請求項2に記載のディスクアレイシステム。
  4. 前記HSバックアップ記憶部は、前記プロセッサ部を収容する装置に脱着可能な記憶媒体として構成されることを特徴とする
    請求項1または請求項2に記載のディスクアレイシステム。
  5. 前記プロセッサ部は、前記HS情報をバックアップする処理、および、そのバックアップを復旧する処理を実行するためのプログラムを読み込むこととし、そのプログラムは、前記プロセッサ部を収容する装置と接続される情報端末から更新されることを特徴とする
    請求項1または請求項2に記載のディスクアレイシステム。
  6. 前記ディスク制御部は、前記リビルド制御部によるリビルド対象のデータとして、監視カメラにより撮影される監視映像データを、前記複数のディスクドライブに対して格納することを特徴とする
    請求項1または請求項2に記載のディスクアレイシステム。
  7. ディスクアレイシステムは、ディスク制御部と、HS(Hot Swap)情報記憶部と、リビルド制御部と、HSバックアップ記憶部と、プロセッサ部と、を有しており、
    前記ディスク制御部は、複数のディスクドライブのうちの障害が発生したディスクドライブが別のディスクドライブへとホットスワップされたことを検出し、
    前記HS情報記憶部には、前記ディスク制御部の検出結果である、前記ホットスワップされたディスクドライブの情報が、HS情報として記憶され、
    前記リビルド制御部は、前記HS情報記憶部内のHS情報が示す前記ディスクドライブに対して、前記複数のディスクドライブのうちの障害が発生していないディスクドライブのデータをもとに、前記ディスクドライブ内に格納するデータをリビルドし、
    前記HSバックアップ記憶部には、前記HS情報記憶部内のHS情報のバックアップが記憶され、
    前記プロセッサ部は、前記HS情報記憶部内のHS情報が消失したときに、前記HSバックアップ記憶部内のHS情報を、前記HS情報記憶部へと復旧することを特徴とする
    データ復旧方法。
  8. 請求項7に記載のディスクアレイシステムに、請求項7に記載のデータ復旧方法を実行させるためのデータ復旧プログラム。
JP2012279204A 2012-12-21 2012-12-21 ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム Expired - Fee Related JP5913078B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012279204A JP5913078B2 (ja) 2012-12-21 2012-12-21 ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012279204A JP5913078B2 (ja) 2012-12-21 2012-12-21 ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム

Publications (2)

Publication Number Publication Date
JP2014123258A true JP2014123258A (ja) 2014-07-03
JP5913078B2 JP5913078B2 (ja) 2016-04-27

Family

ID=51403684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012279204A Expired - Fee Related JP5913078B2 (ja) 2012-12-21 2012-12-21 ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム

Country Status (1)

Country Link
JP (1) JP5913078B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200100814A (ko) 2018-01-25 2020-08-26 가부시끼가이샤 도시바 Raid 장치
CN116701274A (zh) * 2023-07-26 2023-09-05 武汉能钠智能装备技术股份有限公司 一种热插拔硬盘数据传输系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210331A (ja) * 1994-01-13 1995-08-11 Fuji Xerox Co Ltd ディスクアレイ装置
JPH11184643A (ja) * 1997-12-22 1999-07-09 Nec Corp ディスクアレイ装置の管理方法及びプログラムを記録した機械読み取り可能な記録媒体
JPH11184644A (ja) * 1997-12-22 1999-07-09 Nec Corp ライブラリ型ディスクアレイ装置の障害復旧方法
JP2005174178A (ja) * 2003-12-15 2005-06-30 Hitachi Ltd ディスクアレイ装置及びディスクアレイ装置の保守方法
JP2012014638A (ja) * 2010-07-05 2012-01-19 Nec Corp ストレージ装置及びストレージ装置のリビルド処理方法
JP2012252532A (ja) * 2011-06-03 2012-12-20 Hitachi-Lg Data Storage Inc データ復元制御方法及び記録装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07210331A (ja) * 1994-01-13 1995-08-11 Fuji Xerox Co Ltd ディスクアレイ装置
JPH11184643A (ja) * 1997-12-22 1999-07-09 Nec Corp ディスクアレイ装置の管理方法及びプログラムを記録した機械読み取り可能な記録媒体
JPH11184644A (ja) * 1997-12-22 1999-07-09 Nec Corp ライブラリ型ディスクアレイ装置の障害復旧方法
JP2005174178A (ja) * 2003-12-15 2005-06-30 Hitachi Ltd ディスクアレイ装置及びディスクアレイ装置の保守方法
JP2012014638A (ja) * 2010-07-05 2012-01-19 Nec Corp ストレージ装置及びストレージ装置のリビルド処理方法
JP2012252532A (ja) * 2011-06-03 2012-12-20 Hitachi-Lg Data Storage Inc データ復元制御方法及び記録装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200100814A (ko) 2018-01-25 2020-08-26 가부시끼가이샤 도시바 Raid 장치
CN116701274A (zh) * 2023-07-26 2023-09-05 武汉能钠智能装备技术股份有限公司 一种热插拔硬盘数据传输系统及方法
CN116701274B (zh) * 2023-07-26 2023-11-17 武汉能钠智能装备技术股份有限公司 一种热插拔硬盘数据传输系统及方法

Also Published As

Publication number Publication date
JP5913078B2 (ja) 2016-04-27

Similar Documents

Publication Publication Date Title
US10346253B2 (en) Threshold based incremental flashcopy backup of a raid protected array
US9600375B2 (en) Synchronized flashcopy backup restore of a RAID protected array
JP5768587B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US7409582B2 (en) Low cost raid with seamless disk failure recovery
US9189311B2 (en) Rebuilding a storage array
US20140089730A1 (en) Storage control device and method for controlling storages
US20130339784A1 (en) Error recovery in redundant storage systems
JP5721344B2 (ja) システム、システムの制御方法、及び、プログラム
EP2425344B1 (en) Method and system for system recovery using change tracking
WO2014132373A1 (ja) ストレージシステム及び記憶デバイス障害回復方法
WO2015058542A1 (zh) 独立冗余磁盘阵列的重构方法及装置
JP2011170589A (ja) ストレージ制御装置、ストレージ装置およびストレージ制御方法
EP2912555B1 (en) Hard drive backup
US10216595B2 (en) Information processing apparatus, control method for the information processing apparatus, and recording medium
CN116414616A (zh) 一种固态硬盘ssd故障恢复方法、ssd及系统
JP5913078B2 (ja) ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム
JP6124644B2 (ja) 情報処理装置および情報処理システム
JP2016212506A (ja) 情報処理システム、制御装置および制御プログラム
JP2008181425A (ja) 記憶装置、記憶装置の制御方法、及び記憶装置の制御プログラム
JP5817296B2 (ja) 制御装置、制御方法およびストレージ装置
JP5644795B2 (ja) ストレージ装置、データ復旧方法およびプログラム
JP4947062B2 (ja) 記憶装置、記録復旧方法、記録復旧プログラム
JP5773446B2 (ja) 記憶装置、冗長性回復方法、およびプログラム
JP2017041110A (ja) マルチコンピュータシステム,管理装置および管理プログラム
JP2015060346A (ja) ディスクアレイ装置、ディスクアレイ装置の冗長化方法およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20140718

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160401

R150 Certificate of patent or registration of utility model

Ref document number: 5913078

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees