JP3845239B2 - Disk array device and failure recovery method in disk array device - Google Patents
Disk array device and failure recovery method in disk array device Download PDFInfo
- Publication number
- JP3845239B2 JP3845239B2 JP36316399A JP36316399A JP3845239B2 JP 3845239 B2 JP3845239 B2 JP 3845239B2 JP 36316399 A JP36316399 A JP 36316399A JP 36316399 A JP36316399 A JP 36316399A JP 3845239 B2 JP3845239 B2 JP 3845239B2
- Authority
- JP
- Japan
- Prior art keywords
- disk
- data
- logical
- priority
- physical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【0001】
【発明の属する技術分野】
本発明はディスクアレイ装置に関し、特にディスクアレイ装置における障害復旧方法に関する。
【0002】
【従来の技術】
ディスクアレイ装置は、物理ディスクである大容量ハードディスクドライブ(HDD)の搭載により、数十TB(テラバイト)を有する規模になってきている。従来装置からの移行性を重視して、従来と同じ容量の論理ディスクを提供している。これは、複数の物理ディスクから構成される1つのアレイランクを論理的に複数に分割する技術で実現されている。
【0003】
【発明が解決しようとする課題】
このようなディスクアレイ装置において、物理ディスクであるハードディスクドライブの故障が発生した場合、アレイランク内で故障したハードディスクドライブに関わる全論理ディスクが障害状態になり、復旧完了時までの長時間に渡り、上位からのアクセスに対して性能低下が発生したり、信頼性が低下してしまうという問題がある。
【0004】
さらに、最近のディスクアレイ装置は、大容量HDDを搭載しており、障害発生から復旧完了までの時間が長くなっており、今後もHDDの大容量化が行われるため、ますます復旧完了までの時間が長くなる傾向にある。
【0005】
図7は、従来のディスクアレイ装置のブロック図である。ホスト1とディスクアレイ装置902は、上位I/F3で接続されている。ホスト1からのREAD/WRITEアクセス指令は、上位I/F制御部201で受信され、認識される。論理ディスクアクセス制御部202は、上位I/F制御部201からの指示により、READ/WRTIEアクセス対象の論理ディスク,アドレス,転送長を認識し、アレイ制御部203に対して指示を行う。
【0006】
アレイ制御部203は、論理ディスクアクセス制御部202からの指示(アクセスの種類,アドレス,転送長)により、READ/WRITEアクセス対象の論理ディスクを格納する物理ディスク205を制御するため、HDD制御部204に指示を行う。
【0007】
HDD制御部204は、アレイ制御部203からの指示により、物理ディスク205を制御する。
【0008】
物理ディスク205でデータ転送の準備が完了後、READまたはWRITEのデータ転送処理を行う。データ転送中、HDD制御部204は、データ転送の終了を監視する。
【0009】
データ転送終了後、HDD制御部204は、アレイ制御部203を経由して、論理ディスクアクセス制御部202にデータ転送終了を報告する。
【0010】
論理ディスクアクセス制御部202は、データ転送終了を受信した後、上位I/F制御部201に対して、データ転送終了を報告する。
【0011】
上位I/F制御部201は、データ転送終了を受信して、ホスト1に対してREAD/WRITEアクセスの終了を報告する。
【0012】
以上の動作により、一連のI/O動作(READ/WRITEアクセス)が行われる。
【0013】
このようなディスクアレイ装置は、HDDが障害した時、HDDに記憶している複数の論理ディスクに影響を与える。
【0014】
例として、論理ディスク“A”,“B”,“C”,“D”が、図2のように配置されている場合を考える。この場合において、論理ディスク”A”は、A1〜A3より成り、論理ディスク”B”は、B1〜B3より成り、論理ディスク”C”は、C1〜C3より成り、論理ディスク”D”は、D1〜D3より成る。HDD#1、HDD#2、HDD#3、HDD#4は物理ディスクであり、HDD#1はA1、B2、C3より成り、HDD#2はA2、B3、D1より成り、HDD#3はA3、C1、D2より成り、HDD#4はB1、C2、D3より成る。HDD#2で障害が発生した時、論理ディスク“A”のデータであるA2,論理ディスク“B”のデータであるB3,論理ディスク“D”のデータであるD4が障害となり、論理ディスク“A”,“B”,“D”が影響を受ける(図3参照)。
【0015】
障害復旧は、障害が発生していないHDDを読み出して、データを復元した後、予め用意されたスペアHDDまたは交換されたHDDに書き戻す。しかしながら、HDDの全データが書き戻されるまでの間、たとえ一部の論理ディスクに関わるデータが復旧完了していたとしても、復旧完了とはならず、HDD全データが復旧した時に、復旧完了となる。
【0016】
この結果、長時間に渡り、複数の論理ディスクが、性能低下や信頼性低下の影響を受けるという問題がある。
【0017】
図8は、図3の構成において、復旧開始から復旧完了までの経過を書いた図であり、データA2が復旧しても、データB3,D1が復旧完了するまで、復旧処理が完了しないことを示している。
【0018】
本発明は、全ての論理ディスクが復旧が完了する前に特定の論理ディスクを上位からアクセスすることが可能なディスクアレイ装置及びその方法を提供することを目的とする。
【0019】
【課題を解決するための手段】
本発明によるディスクアレイ装置は、物理ディスクに障害が発生したことを検出する手段と、障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクに係る全てのデータを読み出す第1の読出手段と、前記第1の読出手段により読み出されたデータから前記優先論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第1の復旧手段と、前記第1の復旧手段により復旧された前記データを一時的に格納する第1の記憶手段と、障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクでない論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクでない論理ディスクに係る全てのデータを読み出す第2の読出手段と、前記第2の読出し手段により読み出されたデータから前記優先論理ディスクでない論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第2の復旧手段と、前記第1の記憶手段に一時的に格納されたデータ及び前記第2の復旧手段により復旧されたデータを格納する第2の記憶手段と、を備えることを特徴とする。
【0020】
また、本発明によるディスクアレイ装置は、上記のディスクアレイ装置において、ホストより指定された論理ディスクの識別子を記憶する第2の記憶手段を備え、前記読み出し手段は前記第2の記憶手段に記憶されている識別子を有する論理ディスクを前記優先論理ディスクとすることを特徴とする。
【0021】
更に、本発明によるディスクアレイ装置は、上記のディスクアレイ装置において、前記優先論理ディスクへのアクセスがホストからあったときに、前記優先論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクと前記第1の記憶手段にアクセスするアクセス手段を更に備えることを特徴とする。
【0022】
更に、本発明によるディスクアレイ装置は、上記のディスクアレイ装置において、前記第1の記憶手段は不揮発性の半導体メモリであることを特徴とする。
【0023】
本発明によるディスクアレイ装置における障害復旧方法は、物理ディスクに障害が発生したことを検出するステップと、障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクに係る全てのデータを読み出す第1の読出ステップと、前記第1の読出ステップにより読み出されたデータから前記優先論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第1の復旧ステップと、前記第1の復旧ステップにより復旧された前記データを第1の記憶手段に一時的に格納する第1の記憶ステップと、障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクでない論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクでない論理ディスクに係る全てのデータを読み出す第2の読出ステップと、前記第2の読出しステップにより読み出されたデータから前記優先論理ディスクでない論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第2の復旧ステップと、前記第1の記憶手段に一時的に格納されたデータ及び前記第2の復旧ステップにより復旧されたデータを第2の記憶手段に格納する第2の記憶ステップと、を有することを特徴とする。
【0024】
また、本発明によるディスクアレイ装置における障害復旧方法は、上記のディスクアレイ装置における障害復旧方法において、ホストより指定された論理ディスクの識別子を記憶する第2の記憶ステップを備え、前記第1の読み出しステップでは前記第2の記憶ステップで記憶された識別子を有する論理ディスクを前記優先論理ディスクとすることを特徴とする。
【0025】
更に、本発明によるディスクアレイ装置における障害復旧方法は、上記のディスクアレイ装置における障害復旧方法において、前記優先論理ディスクへのアクセスがホストからあったときに、前記優先論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクと前記第1の記憶手段にアクセスするアクセスステップを更に有することを特徴とする。
【0026】
【発明の実施の形態】
本発明は、大容量の物理ディスクを使用し、一つのアレイランク内に複数の論理ディスクを有するディスクアレイ装置において、不揮発性の半導体メモリを用意し、物理ディスクに障害が発生した場合、上位装置から予め設定された論理ディスク値を参照して、この論理ディスク値で示される論理ディスクで障害により失ったデータを優先的に不揮発性の半導体メモリに復旧させる。
【0027】
これにより、障害が発生した物理ディスク全領域の復旧が完了するまでの長時間を待たずに、特定の論理ディスクを優先的に復旧でき、性能低下及び信頼性低下の時間を短くすることができる。
【0028】
図1は、本発明の一実施形態として、ブロック図を示している。
【0029】
本実施形態のディスクアレイ装置2は、ホスト1と上位I/F3で接続されている。
【0030】
本実施形態のディスクアレイ装置2は、上位I/F制御部201,論理ディスクアクセス制御部202,アレイ制御部203,HDD制御部204,物理ディスク205,優先復旧ディスク指示部206,復旧制御部207,HDD障害検出部208,優先ディスクメモリ部209から構成されている。
【0031】
上位I/F制御部201は、上位装置であるホスト1との転送を制御する。論理ディスクアクセス制御部202は、上位I/F制御部201からの指示により、論理ディスクのアクセスを制御する。アレイ制御部203は、論理ディスクアクセス制御部202からの指示(アクセスの種類,アドレス,転送長)により、アクセス対象の論理ディスクを格納する物理ディスク205の制御を行うよう、HDD制御部204に指示を行う。
【0032】
HDD制御部204は、アレイ制御部203からの指示により、物理ディスク205を制御する。
【0033】
物理ディスク205は、ディスクにデータを記憶し、HDD制御部204により制御される。優先復旧ディスク指示部206は、上位I/F制御部201を経由して、ホスト1から予め転送される復旧時の優先論理ディスクの値を格納する。
【0034】
復旧制御部207は、HDD障害検出部208からの指示により、優先復旧ディスク指示部206に格納されている値を参照して、アレイ制御部203を制御して、障害が発生したHDDの内容を復旧させる。
【0035】
HDD障害検出部208は、物理ディスク205で障害が発生したことをHDD制御部204からの指示で認識する。
【0036】
優先ディスクメモリ部209は、不揮発性の半導体メモリであり、HDD障害復旧時に、優先復旧ディスク指示部206で格納している値の論理ディスクのデータを復旧するために使用するメモリである。
【0037】
次に、本実施形態の動作について説明する。
【0038】
はじめに、ホスト1から本ディスクアレイ装置2に対して、論理ディスク“A”へのREADアクセスが発生した場合について、図1,図2を参照して説明する。
【0039】
本ディスクアレイ装置2は、READアクセスまたはWRITEアクセス前に、優先復旧の論理ディスクの値が、予めホスト1から転送され、優先復旧ディスク指示部206に設定される。
【0040】
優先復旧ディスクの値を設定する動作は、優先復旧ディスクの値として“A”を優先復旧ディスク指示部206に設定する場合を例として説明する。
【0041】
まずホスト1からディスクアレイ装置2に対して、優先復旧ディスク設定の指令を発行する。転送された指令は、上位I/F制御部201で受信され、指令の認識が行われる。上位I/F制御部201は、優先復旧ディスク設定の指令と認識し、ホスト1に対して設定するディスク値の転送を要求する。ホスト1から設定する優先復旧ディスク値“A”が転送され、上位I/F制御部201経由で、優先復旧ディスク指示部206に転送される。
【0042】
優先復旧ディスク指示部206は、優先復旧ディスク値“A”を受信し、格納する。
【0043】
このような動作により、優先復旧ディスク値“A”の設定が行われる。
【0044】
優先復旧ディスク値“A”の設定後、ホスト1から論理ディスク“A”へのREADアクセス指令が発行される。
【0045】
READアクセス指令は、上位I/F制御部201で受信され、READ指令の認識が行われる。
【0046】
READ指令認識後、上位I/F制御部201は、論理ディスクアクセス制御部202に対して、論理ディスクのREADを指示する。
【0047】
論理ディスクアクセス制御部202は、上位I/F制御部201からの指示により、READアクセス対象の論理ディスク“A”とアドレス,転送長を認識し、アレイ制御部203に対して指示を行う。アレイ制御部203は、READアクセス対象の論理ディスク“A”を認識し、HDD制御部204に対して、アクセス対象の物理ディスクHDD#1,2,3にアドレス,転送長を指示する。
【0048】
HDD制御部204は、アレイ制御部203からの指示により、アクセス対象の物理ディスクHDD#1,2,3をREADする。
【0049】
物理ディスクHDD#1,2,3でデータ転送の準備が完了後、データであるA1,A2,A3のデータ転送処理を行う。アレイ制御部203は、転送されたデータA1,A2,A3を結合させ、論理ディスクアクセス制御部202に論理ディスクAのデータを転送する。
【0050】
論理ディスクアクセス制御部202は、アレイ制御部203から転送されたデータを上位I/F制御部201を経由して、ホスト1に転送する。
【0051】
物理ディスクHDD#1,2,3からのデータ転送が終了すると、HDD制御部204は、アレイ制御部203を経由して、論理ディスクアクセス制御部202にデータ転送終了を報告する。
【0052】
論理ディスクアクセス制御部202は、データ転送終了を受信した後、上位I/F制御部201に対して、データ転送終了を報告する。
【0053】
上位I/F制御部201は、データ転送終了を受信して、ホスト1に対してREADアクセスの終了を報告する。以上の動作により、論理ディスク“A”のREADアクセスが行われる。
【0054】
一方、ホスト1から本ディスクアレイ装置2に対して、論理ディスク“B”のWRITEアクセスが発生した場合について説明する。
【0055】
WRITEアクセス指令は、上位I/F制御部201で受信され、WRITE指令の認識が行われる。WRITE指令認識後、上位I/F制御部201は、論理ディスクアクセス制御部202に対して、論理ディスク“B”のWRITEを指示する。
【0056】
論理ディスクアクセス制御部202は、上位I/F制御部201からの指示により、WRITEアクセス対象の論理ディスク“B”とアドレス,転送長を認識し、アレイ制御部203に対して指示を行う。アレイ制御部203は、WRITEアクセス対象の論理ディスク“B”を認識し、HDD制御部204に対して、アクセス対象の物理ディスクHDD#4,1,2のアドレス,転送長を指示する。
【0057】
物理ディスクHDD#4,1,2でデータ転送の準備が完了後、上位I/F制御部201,論理ディスクアクセス制御部202を経由して、ホスト1からデータを受信する。アレイ制御部203は、受信したデータを分割し、物理ディスクHDD#4,1,2に対して、データであるB1,B2,B3のWRITEを行う。
【0058】
データのWRITE終了後、HDD制御部204は、アレイ制御部203を経由して、論理ディスクアクセス制御部202にデータ転送終了を報告する。
【0059】
論理ディスクアクセス制御部202は、データ転送終了を受信した後、上位I/F制御部201に対して、データ転送終了を報告する。
【0060】
上位I/F制御部201は、データ転送終了を受信して、ホスト1に対して、論理ディスク“B”のWRITEアクセスの終了を報告する。
【0061】
以上の動作により、論理ディスク“B”のWRITEアクセスが行われる。
【0062】
物理ディスク205の中で、図3で示されるように、HDD#2が障害した場合の復旧動作を図1及び図4を参照して説明する。
【0063】
HDD制御部204は、物理ディスク205の中で、HDD#2に障害が発生したことを認識し、HDD障害検出部208に指示する。HDD障害検出部208は、HDD制御部204からの指示により、物理ディスクHDD#2に障害が発生したことを検出する。物理ディスクHDD#2の障害を検出したHDD障害検出部208は、HDDの復旧を行う復旧制御部207に対して、復旧の指示を行う。
【0064】
復旧制御部207は、優先復旧ディスク指示部206に設定されている値(論理ディスク“A”が設定されていると仮定する。)を参照し、障害した論理ディスクの中で、優先して復旧処理する論理ディスク“A”を認識する。復旧制御部207は、アレイ制御部203に対して、優先して復旧する論理ディスク“A”を指定して、優先ディスクメモリ部209に障害で失われたデータA2を復旧するよう指示する。アレイ制御部203は、HDD制御部204に対して、物理ディスクHDD#1,3をアクセスして、データであるA1,A3をREADするよう指示する。READされたデータA1,A3を基に、アレイ制御部203は、障害で失ったデータA2を復元し、優先ディスクメモリ部209の不揮発性の半導体メモリにデータをWRITEしていく。アレイ制御部203は、優先ディスクメモリ部209に、データA2を復元した後から、図5のように優先ディスクメモリ部209を使用した論理ディスク“A”のアクセスを行う。ホスト1から論理ディスク“A”に対して、アクセスがあった場合、アレイ制御部203は、HDD制御部204を経由して、物理ディスクHDD#1,3にあるデータA1,A3及び優先ディスクメモリ部209にあるデータA2をアクセスするよう制御する。
【0065】
以上のような動作により、優先復旧で指定された論理ディスクは、優先ディスクメモリ部209の不揮発性の半導体メモリを使用して、優先的に復旧することができ、図6で示されるようにデータ復旧までの時間は、論理ディスク“B”,“C”の復旧完了まで待つ必要がなくなる。
【0066】
続いて、予めスペアのHDDが搭載されている場合、あるいは障害HDDが正常なHDDに交換された場合は、優先復旧が指定されていない論理ディスクの復旧が行われる(図5参照)。
【0067】
復旧制御部207は、優先復旧ディスク指示部206に設定されている値(論理ディスク“A”を設定)以外の論理ディスク“B”,“D”を復旧するようアレイ制御部203を制御する。
【0068】
アレイ制御部203は、HDD制御部204に対して、障害のHDD#2以外のHDDであるHDD#1,3,4をアクセスして、データであるB1,B2及びD2,D3をREADするよう指示する。READされたデータB1,B2及びD2,D3を基に、アレイ制御部203において、障害で失ったデータB3,D1を復元し、スペアのHDDまたは交換されたHDDにデータをWRITEしていく。アレイ制御部203は、スペアのHDDまたは交換されたHDDにデータB3,D1を復元した後から、通常通りHDD#2を使用した論理ディスク“B”,“D”のアクセスを行う。以上のようにして、論理ディスク“B”,“D”の復旧が行われる。
【0069】
また、優先ディスクメモリ部209に記憶しているデータA2は、論理ディスク“A”のアクセスが低負荷な時に、オペレータの指示により、HDD#2に対してWRITEを行い、その後、通常通り、HDD#2を使用したアクセスが可能となる。
【0070】
【発明の効果】
第一の効果は、ディスクアレイ装置において、アレイランクを構成する物理ディスクに障害が発生した場合、優先度の高い論理ディスクを優先して、復旧させることができることである。
【0071】
これにより、優先度の高い論理ディスクの復旧までの時間を最短にすることができ、性能低下や信頼性低下の時間を短くできるという効果を有する。
【0072】
特に、性能低下が許されない、あるいは重要なデータが存在する場合は、大きな効果を発揮する。
【0073】
その理由は、障害ディスクにある複数の論理ディスクのデータの中で、優先度の高い論理ディスクに関わるデータは、不揮発性の半導体メモリである優先ディスクメモリ部に優先的に復旧させるためである。その他の論理ディスクのデータは、通常通りの復旧処理を行う。
【図面の簡単な説明】
【図1】本発明の実施形態によるディスクアレイ装置の構成とそれに接続されるホストを示すブロック図である。
【図2】アレイランクの構成例を示す図である。
【図3】図2のアレイランクの構成において、HDD#2に障害が発生した様子を示す図である。
【図4】本発明の実施形態による図2のアレイランクの構成において、HDD#2に障害が発生し、不揮発性の半導体メモリに復旧データA2が書き込まれた様子を示す図である。
【図5】本発明の実施形態による優先論理ディスク以外の論理ディスクの復旧の動作を説明するための図である。
【図6】本発明による復旧開始から優先度の高い論理ディスクの復旧が完了するまで、及び、その後に他の論理ディスクが復旧するまでの様子を示すタイミング図である。
【図7】従来例によるディスクアレイ装置の構成とそれに接続されるホストを示すブロック図である。
【図8】従来例による復旧開始から復旧完了までの様子を示すタイミング図である。
【符号の説明】
1 ホスト
2 ディスクアレイ装置
3 上位I/F
201 上位I/F制御部
202 論理ディスクアクセス制御部
203 アレイ制御部
204 HDD制御部
205 物理ディスク
206 優先復旧ディスク指示部
207 復旧制御部
209 HDD障害検出部
209 優先ディスクメモリ部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a disk array device, and more particularly to a failure recovery method in a disk array device.
[0002]
[Prior art]
The disk array device has a scale of several tens of TB (terabytes) due to the mounting of a large-capacity hard disk drive (HDD) that is a physical disk. Emphasizing transferability from conventional devices, logical disks having the same capacity as conventional ones are provided. This is realized by a technique that logically divides one array rank composed of a plurality of physical disks into a plurality.
[0003]
[Problems to be solved by the invention]
In such a disk array device, when a failure of a hard disk drive that is a physical disk occurs, all the logical disks related to the failed hard disk drive in the array rank are in a failure state, and for a long time until the completion of recovery, There is a problem that the performance is lowered or the reliability is lowered with respect to the access from the upper level.
[0004]
In addition, recent disk array devices are equipped with large-capacity HDDs, and it takes a long time to complete recovery after a failure occurs. Since the capacity of HDDs will continue to increase in the future, the time until recovery will continue to increase. Time tends to be longer.
[0005]
FIG. 7 is a block diagram of a conventional disk array device. The
[0006]
The
[0007]
The
[0008]
After preparation for data transfer is completed on the
[0009]
After completing the data transfer, the
[0010]
After receiving the data transfer end, the logical disk
[0011]
The host I /
[0012]
With the above operation, a series of I / O operations (READ / WRITE access) are performed.
[0013]
Such a disk array device affects a plurality of logical disks stored in the HDD when the HDD fails.
[0014]
As an example, consider a case where logical disks “A”, “B”, “C”, and “D” are arranged as shown in FIG. In this case, the logical disk “A” is composed of A1 to A3, the logical disk “B” is composed of B1 to B3, the logical disk “C” is composed of C1 to C3, and the logical disk “D” is It consists of D1 to D3.
[0015]
In the failure recovery, an HDD in which no failure has occurred is read and restored, and then written back to a spare HDD prepared in advance or a replaced HDD. However, until all the data on the HDD is written back, even if the data related to some of the logical disks has been recovered, the recovery is not completed. Become.
[0016]
As a result, there is a problem that a plurality of logical disks are affected by performance degradation and reliability degradation for a long time.
[0017]
FIG. 8 is a diagram in which the process from the start of recovery to the completion of recovery is written in the configuration of FIG. 3. Even if the data A2 is recovered, the recovery process is not completed until the data B3 and D1 are recovered. Show.
[0018]
An object of the present invention is to provide a disk array apparatus and method for accessing a specific logical disk from the host before all logical disks have been restored.
[0019]
[Means for Solving the Problems]
The disk array device according to the present invention includes means for detecting that a physical disk has failed and a physical disk assigned to a priority logical disk among logical disks to which the failed physical disk is assigned. A first reading unit that reads all data related to the priority logical disk from a physical disk of which no failure has occurred, and data of the priority logical disk from the data read by the first reading unit First recovery means for recovering all data stored in the physical disk in which the failure occurred, and first storage means for temporarily storing the data recovered by the first recovery means; , the logical disk is not a priority logical disk of the logical disk that the failed physical disk is allocated A second reading unit that reads all data related to a logical disk that is not the priority logical disk from a physical disk that has not failed among the allocated physical disks, and is read by the second reading unit. Second recovery means for recovering all data stored in the failed physical disk from among the data of the logical disk that is not the preferred logical disk from the stored data, and temporarily stored in the first storage means And a second storage means for storing the stored data and the data restored by the second restoration means .
[0020]
The disk array device according to the present invention further comprises second storage means for storing an identifier of a logical disk designated by the host in the above disk array device, and the reading means is stored in the second storage means. The logical disk having the identifier is used as the priority logical disk.
[0021]
Furthermore, in the disk array device according to the present invention, in the above disk array device, when the priority logical disk is accessed from the host, a failure occurs in the physical disks allocated to the priority logical disk. It further comprises access means for accessing a physical disk that has not been accessed and the first storage means.
[0022]
Furthermore, the disk array device according to the present invention is characterized in that, in the above disk array device, the first storage means is a nonvolatile semiconductor memory.
[0023]
A failure recovery method in a disk array device according to the present invention includes a step of detecting that a failure has occurred in a physical disk, and a logical disk assigned to the priority logical disk among the logical disks to which the physical disk in which the failure has occurred is assigned. a first reading step of reading all the data relating the physical disks in said priority logical disk failure of the physical disk is not generated there, the priority logical disk from data read by said first reading step one o'clock and first recovery step to recover all data failure of the data has been stored in the physical disk has occurred, the data that has been restored by the first restoration step in a first storage means a first storing step of storing manner, with the failed physical disk is allocated A second reading step of reading all data related to the logical disk that is not the priority logical disk from the physical disks that have not failed among the physical disks that are assigned to the logical disks that are not the priority logical disks And a second recovery step for recovering all data stored in the physical disk in which a failure has occurred among the data of the logical disk that is not the priority logical disk from the data read in the second read step. And a second storage step for storing in the second storage means the data temporarily stored in the first storage means and the data recovered by the second recovery step. To do.
[0024]
Furthermore, error recovery method in a disk array device according to the invention, in the error recovery method in the disk array device, a second storage step of storing the identifier of the logical disk specified by the host, the first read In the step, the logical disk having the identifier stored in the second storage step is set as the priority logical disk.
[0025]
Further, the failure recovery method in the disk array device according to the present invention is the above-described failure recovery method in the disk array device, wherein the physical allocated to the priority logical disk when the priority logical disk is accessed from the host. It further has an access step of accessing a physical disk in which no failure has occurred among the disks and the first storage means.
[0026]
DETAILED DESCRIPTION OF THE INVENTION
The present invention provides a non-volatile semiconductor memory in a disk array device that uses a large-capacity physical disk and has a plurality of logical disks in one array rank. Referring to a preset logical disk value, data lost due to a failure in the logical disk indicated by the logical disk value is preferentially restored to the nonvolatile semiconductor memory.
[0027]
As a result, a specific logical disk can be preferentially restored without waiting for a long time until the recovery of the entire area of the failed physical disk is completed, and the performance degradation and reliability degradation time can be shortened. .
[0028]
FIG. 1 shows a block diagram as an embodiment of the present invention.
[0029]
The
[0030]
The
[0031]
The host I /
[0032]
The
[0033]
The
[0034]
In response to an instruction from the HDD failure detection unit 208, the
[0035]
The HDD failure detection unit 208 recognizes that a failure has occurred in the
[0036]
The priority
[0037]
Next, the operation of this embodiment will be described.
[0038]
First, a case where READ access from the
[0039]
In this
[0040]
The operation for setting the value of the priority recovery disk will be described as an example where “A” is set in the priority recovery
[0041]
First, the
[0042]
The priority recovery
[0043]
With this operation, the priority recovery disk value “A” is set.
[0044]
After setting the priority recovery disk value “A”, the
[0045]
The READ access command is received by the host I /
[0046]
After recognizing the READ command, the upper I /
[0047]
The logical disk
[0048]
The
[0049]
After the physical
[0050]
The logical disk
[0051]
When the data transfer from the physical
[0052]
After receiving the data transfer end, the logical disk
[0053]
The host I /
[0054]
On the other hand, a case where a WRITE access of the logical disk “B” occurs from the
[0055]
The WRITE access command is received by the host I /
[0056]
The logical disk
[0057]
After the physical
[0058]
After the WRITE of data is completed, the
[0059]
After receiving the data transfer end, the logical disk
[0060]
The host I /
[0061]
With the above operation, the WRITE access of the logical disk “B” is performed.
[0062]
With reference to FIGS. 1 and 4, the recovery operation when the
[0063]
The
[0064]
The
[0065]
Through the operation as described above, the logical disk designated by the priority recovery can be recovered preferentially using the non-volatile semiconductor memory of the priority
[0066]
Subsequently, when a spare HDD is installed in advance, or when a failed HDD is replaced with a normal HDD, a logical disk for which priority recovery is not designated is restored (see FIG. 5).
[0067]
The
[0068]
The
[0069]
Further, the data A2 stored in the priority
[0070]
【The invention's effect】
The first effect is that in a disk array device, when a failure occurs in a physical disk constituting an array rank, a logical disk having a high priority can be preferentially restored.
[0071]
As a result, it is possible to minimize the time until recovery of a logical disk having a high priority, and to shorten the time for performance degradation and reliability degradation.
[0072]
In particular, when the performance degradation is not allowed or important data exists, a great effect is exhibited.
[0073]
The reason is that data related to a logical disk having a high priority among the data of a plurality of logical disks in the failed disk is preferentially restored to the priority disk memory unit which is a nonvolatile semiconductor memory. The other logical disk data is restored as usual.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a disk array device according to an embodiment of the present invention and a host connected thereto.
FIG. 2 is a diagram illustrating a configuration example of an array rank.
3 is a diagram showing a state in which a failure has occurred in
4 is a diagram illustrating a state in which a failure has occurred in
FIG. 5 is a diagram for explaining the recovery operation of logical disks other than the priority logical disk according to the embodiment of the present invention;
FIG. 6 is a timing chart showing a state from the start of recovery according to the present invention until recovery of a logical disk with a high priority is completed, and after that, another logical disk is recovered.
FIG. 7 is a block diagram showing a configuration of a conventional disk array device and a host connected thereto.
FIG. 8 is a timing chart showing a state from the start of recovery to the completion of recovery according to a conventional example.
[Explanation of symbols]
1
201 Host I /
Claims (6)
物理ディスク障害時に優先して復旧させる優先論理ディスクの識別子を保持する優先情報記憶手段と、
障害が発生した前記物理ディスクにデータが割り当てられている論理ディスクについて、障害が発生していない物理ディスクに格納されている当該論理ディスクに係るデータを読み出す読出手段と、
この読出手段により読み出されたデータから障害が発生した物理ディスクに格納されていた当該論理ディスクのデータを復旧する復旧手段と、
前記復旧手段により復旧された前記データを格納するための第1及び第2の記憶手段と、を有し、
前記復旧手段は、データ復旧時に前記優先情報記憶手段に保持される識別子に対応する優先論理ディスクのデータを優先的に復旧して前記第1の記憶手段に格納し、その後、他の論理ディスクのデータを順次復旧して前記第2の記憶手段に格納し、
前記第1の記憶手段において前記優先論理ディスクのデータ復旧が完了すると、前記第2の記憶手段における他の論理ディスクのデータ復旧完了を待つことなく、上位装置からの前記優先論理ディスクへのアクセスを可能にすることを特徴とするディスクアレイ装置。Means for detecting that a physical disk has failed;
Priority information storage means for holding an identifier of a priority logical disk that is preferentially restored in the event of a physical disk failure;
Reading means for reading out data related to the logical disk stored in the physical disk in which no failure has occurred with respect to the logical disk in which data is allocated to the physical disk in which the failure has occurred;
Recovery means for recovering data of the logical disk stored in the failed physical disk from the data read by the reading means;
First and second storage means for storing the data restored by the restoration means,
The recovery means preferentially recovers the data of the priority logical disk corresponding to the identifier held in the priority information storage means at the time of data recovery, stores the data in the first storage means, and then stores the other logical disk The data is sequentially recovered and stored in the second storage means,
When the data recovery of the priority logical disk is completed in the first storage means, access to the priority logical disk from the host device without waiting for the data recovery completion of other logical disks in the second storage means A disk array device characterized by being made possible .
障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクに係る全てのデータを読み出す第1の読出ステップと、
前記第1の読出ステップにより読み出されたデータから前記優先論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第1の復旧ステップと、
前記第1の復旧ステップにより復旧された前記データを第1の記憶手段に一時的に格納する第1の記憶ステップと、
障害が発生した前記物理ディスクが割り当てられている論理ディスクのうちの優先論理ディスクでない論理ディスクに割り当てられている物理ディスクのうちの障害が発生していない物理ディスクから前記優先論理ディスクでない論理ディスクに係る全てのデータを読み出す第2の読出ステップと、
前記第2の読出しステップにより読み出されたデータから前記優先論理ディスクでない論理ディスクのデータのうちの障害が発生した前記物理ディスクに格納されていた全てのデータを復旧する第2の復旧ステップと、
前記第2の復旧ステップにより復旧されたデータを第2の記憶手段に格納する第2の記憶ステップと、
前記第1の記憶手段に一時的に格納されたデータを前記第2の記憶手段に格納する第3の記憶ステップと、
を有することを特徴とするディスクアレイ装置における障害復旧方法。Detecting that a physical disk has failed;
Read all the data related to the priority logical disk from the physical disks that have not failed among the physical disks that are assigned to the priority logical disk of the logical disks to which the failed physical disk is assigned A first reading step;
A first recovery step of recovering all data stored in the physical disk in which a failure has occurred among the data of the priority logical disk from the data read in the first reading step;
A first storage step of temporarily storing the data recovered by the first recovery step in a first storage means;
From the physical disk assigned to the logical disk that is not the preferred logical disk among the logical disks to which the failed physical disk is assigned, to the logical disk that is not the preferred logical disk. A second reading step for reading all such data;
A second recovery step of recovering all data stored in the physical disk in which a failure has occurred among the data of the logical disk that is not the priority logical disk from the data read in the second reading step;
A second storage step of storing the data recovered in the second recovery step in a second storage means;
A third storage step of storing data temporarily stored in the first storage means in the second storage means;
A failure recovery method for a disk array device, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36316399A JP3845239B2 (en) | 1999-12-21 | 1999-12-21 | Disk array device and failure recovery method in disk array device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36316399A JP3845239B2 (en) | 1999-12-21 | 1999-12-21 | Disk array device and failure recovery method in disk array device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001175423A JP2001175423A (en) | 2001-06-29 |
JP3845239B2 true JP3845239B2 (en) | 2006-11-15 |
Family
ID=18478653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36316399A Expired - Fee Related JP3845239B2 (en) | 1999-12-21 | 1999-12-21 | Disk array device and failure recovery method in disk array device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3845239B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046658A (en) | 2002-07-15 | 2004-02-12 | Hitachi Ltd | Data transfer method |
JP2005149436A (en) | 2003-11-20 | 2005-06-09 | Hitachi Ltd | Storage apparatus, control method for storage apparatus, job scheduling processing method, troubleshooting method and their program |
WO2009157086A1 (en) * | 2008-06-27 | 2009-12-30 | 富士通株式会社 | Raid device, and its control device and control method |
WO2013051062A1 (en) | 2011-10-05 | 2013-04-11 | Hitachi, Ltd. | Storage system and storage method |
WO2015011825A1 (en) * | 2013-07-26 | 2015-01-29 | 株式会社日立製作所 | Storage system and control method for storage system |
-
1999
- 1999-12-21 JP JP36316399A patent/JP3845239B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001175423A (en) | 2001-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5758054A (en) | Non-volatile memory storage of write operation identifier in data storage device | |
US6859888B2 (en) | Data storage array apparatus storing error information without delay in data access, and method, program recording medium, and program for the same | |
US5590298A (en) | Method of restoring and updating records in a disk cache system during disk drive idle time using start and end addresses | |
US20060015769A1 (en) | Program, method and apparatus for disk array control | |
JP3845239B2 (en) | Disk array device and failure recovery method in disk array device | |
US20040133741A1 (en) | Disk array apparatus and data writing method used in the disk array apparatus | |
JPH1195933A (en) | Disk array system | |
JP5193822B2 (en) | Write-once memory device | |
JPH0877074A (en) | Storage device system using flash memory | |
JP2001142650A (en) | Method and device for controlling array disk | |
US7657719B2 (en) | Controller for a copy operation between a host computer and hard disks, a control method thereof, and a recording medium storing a program for executing the control method | |
WO2010011217A1 (en) | Data storage method, apparatus and system for interrupted write recovery | |
JP2000137584A (en) | Controller for external storage device, method for substituting defective block and storage medium storing defective block substitution control program | |
JPH06242888A (en) | Disk array device, computer system, and data storage device | |
JP3573599B2 (en) | Data recovery method for disk array | |
JP2002215336A (en) | Memory control method, and memory sub-system | |
JP3335969B2 (en) | Magnetic disk drive | |
JP3615250B2 (en) | Disk array device | |
JPH0962461A (en) | Automatic data restoring method for disk array device | |
JP3597550B2 (en) | Disk array device | |
JPH08137627A (en) | Disk array device | |
JP2868003B1 (en) | Magnetic disk drive | |
JP3597766B2 (en) | Disk array device control method | |
JPH09274542A (en) | Disk array device | |
JP2954078B2 (en) | Data maintenance method and apparatus for disk array system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050311 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060818 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090825 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100825 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110825 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110825 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120825 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |