JP2004213441A - Disk array apparatus - Google Patents

Disk array apparatus Download PDF

Info

Publication number
JP2004213441A
JP2004213441A JP2003000849A JP2003000849A JP2004213441A JP 2004213441 A JP2004213441 A JP 2004213441A JP 2003000849 A JP2003000849 A JP 2003000849A JP 2003000849 A JP2003000849 A JP 2003000849A JP 2004213441 A JP2004213441 A JP 2004213441A
Authority
JP
Japan
Prior art keywords
array
configuration
rank
failure
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003000849A
Other languages
Japanese (ja)
Other versions
JP4158525B2 (en
Inventor
Kazutoshi Motoo
和敏 本尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003000849A priority Critical patent/JP4158525B2/en
Publication of JP2004213441A publication Critical patent/JP2004213441A/en
Application granted granted Critical
Publication of JP4158525B2 publication Critical patent/JP4158525B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a disk array apparatus in which the danger of the recurrence of a fault is reduced by performing fault restoration while considering the product classification of an HDD (hard disk drive) causing the fault, the contents of the fault and the constitution of an array rank. <P>SOLUTION: A fault history management part 108 manages fault history including the product classification of HDDs in which faults arise and the contents of the faults. When a faulty HDD occurs in an HDD group 104, an array rank changing part 106 determines whether the possibility of the recurrence of a fault having the same fault contents as the produced fault in an HDD of the same product classification of the HDD causing the fault is high or not. When determining the high possibility of the recurrence, the constitution of an array rank using the HDD of the same product classification as the HDD causing the fault as a constitutional element is changed to constitution whose reliability is higher than that of present constitution. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、複数の物理ディスクを有するディスクアレイ装置に関し、特に、ディスクアレイ装置の信頼性を向上させる技術に関する。
【0002】
【従来の技術】
ディスクアレイ装置は、物理ディスクであるハードディスクドライブ(HDD)の大容量化により、数十TB(テラバイト)を有する規模になってきている。現在、一台のハードディスクの記憶容量は100GB(ギガバイト)を越えるレベルに達しており、今後もますます大容量化が図られると考えられる。これに伴い、ディスクアレイ装置も大容量になると思われる。
【0003】
ところで、ディスクアレイ装置の特徴の1つとして、アレイランクを構成する複数のHDDの内の1台に障害が発生した場合、アレイランク内の他の正常なHDDを使用してデータアクセスを継続できる点が挙げられる。
【0004】
この点について、図11及び図12を参照して説明する。今、アレイランクが、図11に示すように4台のHDD01〜04によって構成されているとする。また、データDが3つのデータD1〜D3に3分割されてHDD01〜03に格納され、データD1〜D3の冗長データであるパリティPがHDD04に格納されているとする。このような構成を有するアレイランクにおいて、図12に示すように、HDD03に障害が発生したとする。
【0005】
HDD03に障害が発生した後、その障害が復旧する前に、ホストコンピュータからHDD03に格納されているデータD3に対するリード指令が出力された場合は、アレイランク内の正常なHDD01,02,04からデータD1,D2及びパリティPを読み出し、それに基づいてデータD3を復元し、ホストコンピュータに転送する。
【0006】
また、障害復旧前にホストコンピュータからHDD03に対してライト指令が出力された場合には、新たなパリティP’を生成し、それをHDD04に書き込む。また、ホストコンピュータから正常なHDD(例えば、HDD01とする)に対するライト指令が出力された場合には、新たなデータD1’をHDD01に書き込むと共に、新たなパリティP’を生成し、HDD04に書き込む。
【0007】
以上のように、ディスクアレイ装置においては、アレイランクを構成する複数のHDDの内の1つに障害が発生しても、他の正常なHDDを使用してデータアクセスを継続することができる。
【0008】
また、障害の発生したHDD03が交換された場合、或いは予めスペアHDDが用意されている場合には、障害復旧処理が行われる。障害復旧処理では、正常なHDD01,02,04に格納されているデータD1,D2及びパリティPに基づいてデータD3を復元し、復元したデータD3をスペアHDD或いは交換されたHDDに書き戻す。
【0009】
上記した障害復旧処理は、従来一般的に行われているものであるが、これ以外にも、複数のドライブに構成される記憶領域を複数のボリュームに分割し、障害発生時には、アクセス頻度の高いボリュームから優先的に、障害ドライブに格納されているデータをスペアドライブに復旧するようにした技術や(例えば、特許文献1参照)、HDDに障害が発生した時、複数の論理ディスクの内の優先論理ディスクについては、障害の発生したHDDに格納されているデータを不揮発性の半導体メモリ上に復元するようにした技術(例えば、特許文献2参照)も知られている。
【0010】
上述した従来の技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他のHDD上に復元する技術であり、アレイランクの構成を変更するものではない。なお、アレイランクの構成を変更する技術としては、ライトデータ量に応じてRAIDクラスを変更する技術(例えば、特許文献3参照)や、ユーザがデータ保持部に保持されているアレイ構成情報を変更すると、ディスクインタフェース変更部がディスクインタフェース接続部に対して、アレイ制御部の配線とディスク装置群の配線との接続状態を、変更後のアレイ構成情報に応じたものにすることを指示する技術(例えば、特許文献4参照)が知られているが、復旧処理に関連するものではない。
【0011】
【特許文献1】
特開平11−24850号公報
【特許文献2】
特開2001−175423号公報
【特許文献3】
特開平6−187249号公報
【特許文献4】
特開2000−298557号公報
【0012】
【発明が解決しようとする課題】
上述したように、従来、一般的に行われている障害復旧処理や、特許文献1,2に記載されている技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他の物理ディスク上に復元するだけであり、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮していないため、障害復旧後に再び障害が発生する可能性が高いという問題がある。
【0013】
そこで、本発明の目的は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害復旧を行うことにより、障害が再発する危険性を少なくすることにある。
【0014】
【課題を解決するための手段】
本発明にかかる第1のディスクアレイ装置は、上記目的を達成するため、
複数の物理ディスクを有するディスクアレイ装置において、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する手段を備えたことを特徴とする。
【0015】
より具体的には、本発明にかかる第2のディスクアレイ装置は、
複数の物理ディスクを有するディスクアレイ装置において、
障害の発生した物理ディスクの製品種別と前記障害の障害内容とを含む障害履歴を管理する障害履歴管理部と、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更するアレイランク変更部を備えたことを特徴とする。
【0016】
また、本発明にかかる第3のディスクアレイ装置は、第2のディスクアレイ装置において、
現時点のアレイランク構成をどのように変更するのかを示す変更ポリシー情報が格納された変更ポリシー情報記憶部を備え、且つ、
前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている変更ポリシー情報とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有することを特徴とする。
【0017】
また、本発明にかかる第4のディスクアレイ装置は、第3のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、信頼性の異なるアレイランクの構成が複数格納されており、
前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とする。
【0018】
また、本発明にかかる第5のディスクアレイ装置は、第4のディスクアレイ装置において、
スペアの物理ディスクを複数備え、且つ、
前記アレイランク変更部が、前記スペアの物理ディスクを用いて、前記構成変更対象にしているアレイランクよりも1ランク信頼性の高いアレイランクを構成し、前記構成変更対象にしているアレイランクの構成要素中の正常な物理ディスクをスペアの物理ディスクに変更する構成を有することを特徴とする。
【0019】
また、本発明にかかる第6のディスクアレイ装置は、第5のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とする。
【0020】
また、本発明にかかる第7のディスクアレイ装置は、第6のディスクアレイ装置において、
アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とする。
【0021】
また、本発明にかかる第8のディスクアレイ装置は、第2〜第7の何れか1つのディスクアレイ装置において、
ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とする。
【0022】
また、本発明にかかる第9のディスクアレイ装置は、第3〜第7記載の何れか1つのディスクアレイ装置において、
ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を変更する変更ポリシー変更/参照部を備えたことを特徴とする。
【0023】
【作用】
ディスクアレイ装置を構成している複数の物理ディスクの内の何れかに障害が発生したとき、例えば、障害履歴などに基づいて、上記発生した障害と同一障害内容の障害が、上記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定する。そして、再発する可能性が高いと判定した場合は、上記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する。現時点の構成よりも信頼性の高い構成としては、例えば、RAIDクラスが同一で、物理ディスク数が1台少ない構成を採用することができる。このように、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するようにしているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0024】
【発明の実施の形態】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0025】
図1は本発明の一実施例のブロック図であり、ディスクアレイ装置1と、ホストコンピュータ2と、両者を接続する上位I/F(上位インタフェース)3とから構成されている。
【0026】
ディスクアレイ装置1は、上位I/F制御部101と、アレイ制御部102と、HDD(ハードディスクドライブ)制御部103と、HDD群104と、変更ポリシー情報記憶部105と、アレイランク変更部106と、HDD状態情報記憶部107と、障害履歴管理部108と、障害履歴情報記憶部109と、アレイランク構成情報記憶部110とから構成されている。
【0027】
HDD群104は、15台のHDD01〜15から構成されており、各HDD01〜15にはそれぞれHDD番号「01」〜「15」が付与されている。また、HDD01〜05により、アレイランク番号「01」のアレイランクが構成され、HDD06〜10によりアレイ番号「02」のアレイランクが構成されている。アレイランク番号「01」,「02」のアレイランクは共にRAIDクラスが「RAID−5」のアレイランクであり、アレイランク番号「01」のアレイランクには、アドレス「A0」〜「A1」が割り当てられ、アレイランク番号「02」のアレイランクには、「アドレス(A1+1)」〜「A2」が割り当てられている。また、HDD11〜15は、スペアのHDDとなっている。
【0028】
アレイランク構成情報記憶部110には、HDD群104内に存在する各アレイランクの構成を示す情報や、各アレイランクに割り当てられているアドレスや、スペアのHDDを示す情報が格納されている。
【0029】
図2にアレイランク構成情報記憶部110の内容例を示す。同図に示すように、アレイランク構成情報記憶部110には、アレイランク番号と、RAIDクラスと、HDD構成と、構成要素とするHDDのHDD番号と、アドレスとが格納される。図2の例は、アレイランク番号「01」,「02」のアレイランクは、それぞれHDD番号「01」〜「05」,「06」〜「10」のHDD01〜05,06〜10によって構成され、RAIDクラスが共に「RAID−5」で、HDD構成が共に「4D+1P」で、割り当てられているアドレスがそれぞれ「A0」〜「A1」,「(A1+1)」〜「A2」であることを示している。更に、この例は、HDD番号「11」〜「15」のHDD11〜15は、スペアのHDDであることを示している。
【0030】
HDD状態情報記憶部107には、各HDD01〜15の製品種別や、各HDD01〜15の現在の状態を示す情報(「NORMAL」か「ABNORMAL」)や、障害内容が格納される。
【0031】
図3にHDD状態情報記憶部107の内容例を示す。同図に示すように、HDD状態情報記憶部107には、HDD番号と、ベンダーと、製品名と、バージョンと、現在の状態と、障害内容とが格納される。この例では、ベンダー,製品名及びバージョンによりHDDの製品種別を表すようにしている。また、図3の例は、HDD01〜05,11〜13がベンダー「NNN」,製品名「AAA」,バージョン「1.10」の製品で、HDD06〜10,14,15がベンダー「HHH」,製品名「BBB」,バージョン「2.00」の製品であることを示している。更に、図3の例は、HDD01〜15の内、HDD10にのみ障害内容「タイムアウト」の障害(ABNORMAL)が発生し、他のHDDは正常(NORMAL)であることを示している。
【0032】
障害履歴情報記憶部109には、HDD群104において発生した障害の履歴を示す情報が格納される。
【0033】
図4に障害履歴情報記憶部109の内容例を示す。同図に示すように、障害履歴情報記憶部109には、履歴番号と、ベンダーと、製品名と、バージョンと、障害内容とが格納される。図4の例は、ベンダー「NNN」,製品名「AAA」,バージョン「1.10」のHDDにおいて、「エラー訂正不可能なデータエラー」が過去に1回発生し、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」のHDDにおいて「タイムアウト」が過去に2回発生していることを示している。
【0034】
変更ポリシー情報記憶部105には、アレイランクの構成を変更する際のポリシーが格納されている。
【0035】
図5に変更ポリシー情報記憶部105の内容例を示す。同図に示すように、変更ポリシー情報記憶部105には、フェーズ番号と、RAIDクラスと、HDD構成とが格納される。RAIDクラスとHDD構成とによって、アレイランクの構成が特定されており、フェーズ番号が若いものほど信頼性の高い構成になっている。フェーズ番号「01」のアレイランク構成は、2台のHDDに同一データを格納したミラー構成である。フェーズ番号「02」〜「04」のアレイランク構成は共にRAIDクラス「RAID−5」のアレイランク構成であるが、構成要素であるHDDの台数はフェーズ番号が1つ増える毎に1台増えている。即ち、フェーズ番号が若いものほど、信頼性の高い構成となっている。これらの情報は、ホストコンピュータ2から上位I/F3,上位I/F制御部101を介して変更ポリシー情報記憶部105に格納される。
【0036】
上位I/F制御部101は、上位I/F3を介してホストコンピュータ2との間でデータ等をやり取りする機能を有する。
【0037】
アレイ制御部102は、上位I/F制御部101を介してホストコンピュータ2から送られてくるリード指令やライト指令に従ってHDD制御部103を制御することにより、HDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。
【0038】
HDD制御部103は、アレイ制御部102の制御に従ってHDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。更に、HDD制御部103は、障害の発生したHDDを検出する機能や、障害の発生したHDDを検出した時、HDD状態情報記憶部107中の上記HDDの現在状態を「ABNORMAL」に変更すると共に障害内容を書き込む機能を有する。
【0039】
障害履歴情報管理部108は、HDD状態情報記憶部107を監視しており、現在の状態がABNORMALに変更されたHDDが発生した時、そのHDDのベンダー,製品名,バージョン及び障害内容を障害履歴情報記憶部109に追加登録する機能や、追加登録完了後にアレイランク変更部106に対して起動指示を出力する機能を有する。
【0040】
アレイランク変更部106は、障害履歴管理部108から起動指示が入力されると、障害履歴情報記憶部109の記憶内容に基づいて今回発生した障害と同一内容の障害が、今回障害の発生したHDDと同一製品種別のHDDにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判断した場合、変更ポリシー情報記憶部105の内容に基づいて上記製品種別のHDDを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する機能を有する。なお、構成の変更方法については、後で詳細に説明する。
【0041】
【実施例の動作の説明】
次に、本実施例の動作について詳細に説明する。
【0042】
先ず、リード時の動作について説明する。
【0043】
ホストコンピュータ2は、データのリード時、リード指令(アドレス,種別,サイズを含む)を出力する。このリード指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102に送られる。
【0044】
アレイ制御部102は、リード指令を受け取ると、アレイランク構成情報記憶部110に格納されている各アレイランクに割り当てられているアドレスに基づいて、最初にリードするデータが格納されているアクセス対象HDDを求める(図6、ステップS62)。
【0045】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「NORMAL」であるか否かを調べる(ステップS63)。
【0046】
そして、「NORMAL」である場合、即ちアクセス対象HDDが正常である場合(ステップS63がYES)は、HDD制御部103を制御してアクセス対象HDDからデータをリードし、ホストコンピュータ2へ転送する(ステップS64,S65)。
【0047】
これに対して、「ABNORMAL」である場合、即ちアクセス対象HDDに障害が発生している場合(ステップS63がNO)は、HDD制御部103を制御してアクセス対象HDDと同一アレイランク内の他の正常なHDDに格納されているデータをリードし、それらに基づいてアクセス対象HDDに格納されているデータを復元する(ステップS66,S67)。その後、復元したデータをホストコンピュータ2へ転送する。以上の処理をリード指令によって指令された全てのデータをリードするまで(ステップS61がYESとなるまで)繰り返し行う。
【0048】
次に、ライト時の動作について説明する。
【0049】
ホストコンピュータ2は、データライト時、ライト指令(アドレス,種別,サイズを含む)を出力する。このライト指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102へ送られる。
【0050】
アレイ制御部102は、ライト指令を受け取ると、アレイランク構成情報記憶部110に格納されている情報に基づいて、最初にデータをライトするアクセス対象HDDを求める(図7,ステップS72)。
【0051】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS73)。
【0052】
そして、アクセス対象HDDの内の少なくとも1つの現在の状態が「ABNORMAL」である場合(ステップS73がYES)は、ホストコンピュータ2から送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP’を生成し、新たなパリティP’を該当するHDDに書き込むと共に、他の正常なHDDに対して該当するデータをライトする(ステップS75)。
【0053】
これに対して、アクセス対象HDDの現在の状態が全て「NORMAL」である場合は(ステップS73がNO)、HDD状態情報記憶部107を参照し、パリティが格納されているHDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS74)。
【0054】
そして、パリティの格納されているHDDの現在の状態が「ABNORMAL」である場合(ステップS74がYES)は、HDD制御部103を制御し、アクセス対象HDDにホストコンピュータ2から送られてくるデータを書き込む(ステップS76)。
【0055】
これに対して、パリティの格納されているHDDの現在の状態が「NORMAL」である場合(ステップS74がNO)は、ホストコンピュータから送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP’を生成する(ステップS77)。その後、ステップS77で生成した新たなパリティP’を該当するHDDに書き込むと共に、ホストコンピュータ2から送られてきたライトデータをアクセス対象HDDに書き込む(ステップS78)。以上の処理を、ライト指令によって指令されたデータを全て書き込むまで(ステップS71がYESとなるまで)、繰り返し行う。
【0056】
次に、アレイランクの構成変更時の動作について説明する。
【0057】
今、例えば、HDD番号「10」のHDD10に障害が発生したとする。HDD制御部103は、HDD10に障害が発生したことを検出すると、HDD状態情報記憶部107に格納されているHDD10の現在の状態を「NORMAL」から「ABNORMAL」に変更すると共に、障害内容(例えば、「タイムアウト」とする)を書き込む。この処理により、HDD状態情報記憶部107の内容は、図3に示すものとなる。
【0058】
障害履歴管理部108は、HDD状態情報記憶部107を監視しており、HDD番号「10」に対応する現在の状態が「ABNORMAL」になったことを検出すると、HDD番号「10」に対応するベンダー「HHH」,製品名「BBB」,バージョン「2.00」及び障害内容「タイムアウト」を障害履歴情報記憶部109に追加登録する。今、例えば、上記処理により、障害履歴情報記憶部109に履歴番号「00003」の履歴情報が追加登録され、障害履歴情報記憶部109の内容が図4に示すものになったとする。その後、障害履歴管理部108は、アレイランク変更部106に対して起動指示を出力する。
【0059】
アレイランク変更部106は、障害履歴管理部108から起動指示が加えられると、障害履歴情報記憶部109に格納されている障害履歴情報の内の、最も履歴番号が大きい障害履歴情報を参照し、障害の発生したHDD10の製品種別及び障害内容を認識する(図8,ステップS81)。この例の場合、アレイランク変更部106は、履歴番号「00003」の障害履歴情報を参照し、障害の発生したHDD10の製品種別が、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」であることを認識すると共に、障害内容が「タイムアウト」であることを認識する。
【0060】
その後、アレイランク変更部106は、今回発生した障害(タイムアウト)と同一障害内容の障害が、今回障害の発生したHDD10と同一製品種別のHDDにおいて再発する可能性が高いか否かを判定する(ステップS82)。この判断は、例えば、次のようにして行う。先ず、障害履歴情報記憶部109を検索し、履歴番号が最も大きい障害履歴情報(この例では、履歴番号「00003」の障害履歴情報)と同一の製品種別および障害内容を含んでいる障害履歴情報の数を求める。その後、上記求めた障害履歴情報の数と予め定められている所定数とを比較する。そして、予め定められている所定数の方が小さい場合には、再発する可能性が高いと判定し、そうでない場合は再発する可能性が低いと判定する。
【0061】
そして、再発の可能性が低いと判定した場合(ステップS82がNO)は、アレイランク変更部106は、その処理を終了する。
【0062】
これに対して、再発の可能性が高いと判定した場合(ステップS82がYES)は、HDD状態情報記憶部107を参照し、障害の発生したHDD10と同一の製品種別のHDDのHDD番号を取得する(ステップS83)。この例の場合、HDD10と同一製品種別のHDDのHDD番号として「06」〜「09」,「14」,「15」が取得される。
【0063】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、障害の発生したHDD10及びHDD10と同一製品種別のHDD06〜09,14,15の内の何れかを構成要素にしているアレイランクのRAIDクラス及びHDD構成を取得する(ステップS84)。今、例えば、アレイランク構成情報記憶部110の内容が図2に示すものであるとすると、アレイランク番号「02」に対応して登録されているRAIDクラス「RAID−5」及びHDD構成「4D+1P」を取得することになる。
【0064】
更に、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、スペアのHDDのHDD番号を取得する(ステップS85)。この例の場合、スペアのHDD番号として「11」〜「15」を取得することになる。
【0065】
その後、アレイランク変更部106は、変更ポリシー情報記憶部105を参照し、ステップS84で取得したRAIDクラス及びHDD構成によって特定されるアレイランクの構成よりも、1ランク信頼性の高いアレイランクの構成を示すRAIDクラス及びHDD構成を取得する(ステップS86)。この処理を詳しく説明すると、次のようになる。先ず、変更ポリシー情報記憶部105を検索し、ステップS84で取得したRAIDクラス「RAID−5」,HDD構成「4D+1P」によって特定されるアレイランク構成が格納されているエントリを求める。この例の場合、フェーズ番号「04」のエントリが求められる。その後、上記フェーズ番号「04」よりも1つフェーズ番号が少ないフェーズ番号「03」のエントリに格納されているRAIDクラス「RAID−5」,HDD構成「3D+1P」を取得する。以上がステップS86で行う処理の詳細である。
【0066】
その後、アレイランク変更部106は、ステップS85でHDD番号を取得したスペアのHDD11〜15の内の、ステップS86で取得したHDD構成「3D+1P」によって示される台数分(4台)のHDDを使用して、アレイランクの構成を変更する(ステップS87)。
【0067】
このステップS87の処理を詳しく説明すると、次のようになる。先ず、スペアのHDD11〜15の中から、構成変更に使用するHDDを選択する。その際、障害の発生したHDDとは製品種別の異なるHDDを優先的に選択するようにする。今、例えば、構成変更に使用するHDDとしてHDD番号が「11」〜「14」のHDDを選択したとする。その後、アレイランク変更部106は、障害の発生したHDD10に格納されていたデータを、他の正常なHDD06〜09に格納されているデータに基づいて復元しながら、HDD06〜10を構成要素としているアレイランクに格納されていたデータをHDD11〜14を構成要素とするアレイランクに書き込む。その際、パリティを生成し、書き込む処理も行う。以上がステップS87で行う処理の詳細である。ここで、HDD数の少ないアレイランク構成に変更すると、構成変更前のアレイランクに格納されているデータ量によっては、データが溢れてしまい、構成変更後のアレイランクに全データを格納できなくなってしまう場合がある。このようなことを防ぐためには、例えば、各アレイランクに格納するデータ量を、フェーズ番号「01」のアレイランクに格納可能なデータ量に制限すれば良い。このようにするためには、例えば、各フェーズ番号のアレイランクに割り当てるアドレスのサイズを同一値とし、且つ、その値をフェーズ番号「01」のアレイランクが格納可能なデータ量に応じたものにすれば良い。
【0068】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110に格納されている、今回構成変更を行ったアレイランク番号「02」のアレイランクの構成情報を変更する(ステップS88)。この例の場合、アレイランク番号が「02」のアレイランクの構成情報は、図9に示すように、RAIDクラス「RAID−5」,HDD構成「3D+1P」,構成要素「11」,「12」,「13」,「14」に変更される。アドレスは、元のままである。
【0069】
なお、上述した実施例においては、HDDに障害が発生した場合、アレイランク変更部106が直ちに図8の流れ図に示す処理を開始するようにしたが、通常のI/O動作に悪影響を与えないようにするために、比較的負荷の軽いときに、図8に示す処理を実行するようにしても良い。また、上述した実施例においては、HDDの製品種別をベンダー,製品名およびバージョンにより表すようにしたが、これに限られるものではない。
【0070】
【発明の他の実施例】
次に、本発明の他の実施例について説明する。本実施例は、障害履歴情報記憶部に格納されている障害履歴情報をコンソールから参照可能にすると共に、コンソールから障害履歴情報記憶部の障害履歴情報を変更可能にしたことを特徴とする。
【0071】
図10は本発明の他の実施例のブロック図であり、図1に示した実施例との相違点は、ディスクアレイ装置1の代わりにディスクアレイ装置1aを備えている点およびコンソール4が追加されている点である。
【0072】
ディスクアレイ装置1aは、変更ポリシー変更/参照部111および履歴情報変更/参照部112を備えている点が図1に示したディスクアレイ装置1と相違している。
【0073】
変更ポリシー変更/参照部111は、ユーザがコンソール4を用いて入力する変更ポリシー変更要求に従って変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する機能や、ユーザがコンソール4を用いて入力する変更ポリシー参照要求に従って変更ポリシー情報記憶部105から変更ポリシーを読み出し、それをコンソール4の表示部(図示せず)に表示する機能を有する。
【0074】
履歴情報変更/参照部112は、ユーザがコンソール4を用いて入力する履歴情報変更要求に従って障害履歴情報記憶部109に格納されている障害履歴情報を変更する機能や、ユーザがコンソール4を用いて入力する履歴情報参照要求に従って障害履歴情報記憶部109から障害履歴情報を読み出し、コンソール4の表示部に表示する機能を有する。
【0075】
次に本実施例の動作について説明する。尚、変更ポリシー変更/参照部111及び履歴情報変更/参照部112以外の動作は図1に示した実施例と同じであるので、ここでは変更ポリシー変更/参照部111及び履歴情報変更/参照部112の動作についてのみ説明する。
【0076】
ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を参照したい場合、コンソール4を用いて変更ポリシー参照要求を入力する。変更ポリシー変更/参照部111は、変更ポリシー参照要求が入力されると、変更ポリシー情報記憶部105から変更ポリシー情報を読み出し、コンソール4の表示部に表示する。
【0077】
また、ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する場合には、変更後の変更ポリシー情報を含んだ変更ポリシー変更要求をコンソール4から入力する。変更ポリシー変更/参照手段111は、変更ポリシー変更要求が入力されると、それに含まれている変更ポリシー情報で変更ポリシー情報記憶部105の内容を置き換える。
【0078】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を参照したい場合、履歴参照要求をコンソール4から入力する。履歴情報変更/参照部112は、履歴参照要求が入力されると、障害履歴情報記憶部109から障害履歴情報を読み出し、それをコンソール4の表示部に表示する。
【0079】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を変更したい場合には、変更後の履歴情報を含んだ履歴設定要求をコンソール4から入力する。履歴情報変更/参照手段112は、履歴設定要求が入力されると、それに含まれている障害履歴情報で障害履歴情報記憶部109の内容を置き換える。
【0080】
このように、本実施例では、障害履歴情報を外部にあるコンソールから参照したり、変更できるので、例えば、稼働中のディスクアレイ装置内の障害履歴情報記憶部109に格納されている障害履歴情報を収集し、収集した障害履歴情報を、例えば、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置の障害履歴情報記憶部109に格納するといったことが可能になる。このようにすることにより、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置において、より適切な時期にアレイランクの構成変更が行えるようになる。また、変更ポリシー情報の変更/参照も可能となっているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。
【0081】
【発明の効果】
以上説明したように、本発明のディスクアレイ装置は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するアレイランク変更部を備えているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0082】
また、アレイランク変更部により障害を復旧した後は、アレイランクの信頼性が障害復旧前よりも高くなるので、それ以後に1つの物理ディスクに障害が発生したとしても、更に別の物理ディスクに障害が発生し、アレイランク内のデータが失われてしまうといった最悪の事態が発生する危険性を極めて少なくすることができる。
【0083】
また、本発明のディスクアレイ装置は、履歴情報変更/参照部を備えているので、或るディスクアレイ装置の障害履歴情報を他のディスクアレイ装置に設定することが可能になる。その結果、上記他のディスクアレイ装置において、より適切な時期にアレイランクの構成を変更することが可能になる。
【0084】
また、本発明のディスクアレイ装置は、変更ポリシー変更/参照部を備えているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】アレイランク構成情報記憶部110の内容例を示す図である。
【図3】HDD状態情報記憶部107の内容例を示す図である。
【図4】障害履歴情報記憶部109の内容例を示す図である。
【図5】変更ポリシー情報記憶部105の内容例を示す図である。
【図6】リード時の処理例を示す流れ図である。
【図7】ライト時の処理例を示す流れ図である。
【図8】アレイランク変更部106の処理例を示す流れ図である。
【図9】アレイランクの構成を変更した後のアレイランク構成情報記憶部110の内容例を示す図である。
【図10】本発明の他の実施例のブロック図である。
【図11】アレイランクの構成例を示した図である。
【図12】HDDに障害が発生したときの、リードアクセス,ライトアクセスを説明するための図である。
【符号の説明】
1,1a…ディスクアレイ装置
101…上位I/F制御部
102…アレイ制御部
103…HDD制御部
104…HDD群
105…変更ポリシー情報記憶部
106…アレイランク変更部
107…HDD状態情報記憶部
108…障害履歴管理部
109…障害履歴情報記憶部
110…アレイランク構成情報記憶部
111…変更ポリシー変更/参照部
112…履歴情報変更/参照部
2…ホストコンピュータ
3…上位I/F
4…コンソール
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a disk array device having a plurality of physical disks, and more particularly, to a technique for improving the reliability of a disk array device.
[0002]
[Prior art]
The disk array device has a scale of several tens of TB (terabyte) due to an increase in capacity of a hard disk drive (HDD) as a physical disk. At present, the storage capacity of one hard disk has reached a level exceeding 100 GB (gigabyte), and it is expected that the capacity will be further increased in the future. With this, the capacity of the disk array device is expected to increase.
[0003]
Incidentally, as one of the features of the disk array device, when one of the plurality of HDDs constituting the array rank fails, data access can be continued using another normal HDD in the array rank. Points.
[0004]
This point will be described with reference to FIGS. Now, it is assumed that the array rank is constituted by four HDDs 01 to 04 as shown in FIG. It is also assumed that data D is divided into three pieces of data D1 to D3 and stored in HDDs 01 to 03, and parity P which is redundant data of data D1 to D3 is stored in HDD 04. In the array rank having such a configuration, it is assumed that a failure has occurred in the HDD 03 as shown in FIG.
[0005]
If a read command for the data D3 stored in the HDD 03 is output from the host computer after the occurrence of the failure in the HDD 03 and before the recovery from the failure, the data is output from the normal HDDs 01, 02, and 04 in the array rank. D1 and D2 and the parity P are read, and the data D3 is restored based on the data and transferred to the host computer.
[0006]
If a write command is output from the host computer to the HDD 03 before recovery from the failure, a new parity P ′ is generated and written to the HDD 04. When a write command for a normal HDD (for example, HDD01) is output from the host computer, new data D1 'is written to HDD01, and a new parity P' is generated and written to HDD04.
[0007]
As described above, in the disk array device, even if a failure occurs in one of the plurality of HDDs constituting the array rank, data access can be continued using another normal HDD.
[0008]
Further, when the failed HDD 03 is replaced or a spare HDD is prepared in advance, a failure recovery process is performed. In the failure recovery processing, the data D3 is restored based on the data D1, D2 and the parity P stored in the normal HDDs 01, 02, 04, and the restored data D3 is written back to the spare HDD or the replaced HDD.
[0009]
Although the above-described failure recovery processing is generally performed in the past, in addition to this, the storage area configured by a plurality of drives is divided into a plurality of volumes, and when a failure occurs, the frequency of access is high. A technique that preferentially recovers data stored in a failed drive from a volume to a spare drive (for example, see Patent Document 1), and when a failure occurs in an HDD, priority is given to a plurality of logical disks. With respect to a logical disk, a technique for restoring data stored in a failed HDD in a nonvolatile semiconductor memory is also known (for example, see Patent Document 2).
[0010]
The conventional technique described above is a technique for restoring data stored in a failed HDD to another HDD such as a spare HDD, and does not change the configuration of the array rank. As a technique for changing the configuration of the array rank, a technique for changing the RAID class according to the write data amount (for example, see Patent Document 3), or a technique for changing the array configuration information held in the data holding unit by the user. Then, the disk interface changing unit instructs the disk interface connecting unit to change the connection state between the wiring of the array control unit and the wiring of the disk device group according to the changed array configuration information ( For example, Patent Literature 4) is known, but is not related to recovery processing.
[0011]
[Patent Document 1]
JP-A-11-24850
[Patent Document 2]
JP 2001-175423 A
[Patent Document 3]
JP-A-6-187249
[Patent Document 4]
JP 2000-298557 A
[0012]
[Problems to be solved by the invention]
As described above, the failure recovery processing generally performed conventionally and the techniques described in Patent Literatures 1 and 2 transfer data stored in a failed HDD to another HDD such as a spare HDD. It is said that there is a high possibility that a failure will occur again after recovery from a failure because the product type of the failed physical disk, the details of the failure, and the configuration of the array rank are not taken into account. There's a problem.
[0013]
Therefore, an object of the present invention is to reduce the risk of a reoccurrence of a failure by performing a failure recovery in consideration of the product type of the failed physical disk, the details of the failure, and the configuration of the array rank. .
[0014]
[Means for Solving the Problems]
A first disk array device according to the present invention achieves the above object,
In a disk array device having a plurality of physical disks,
When a failure occurs in any of the plurality of physical disks, there is a high possibility that a failure having the same failure content as the failed failure will recur on a physical disk of the same product type as the failed physical disk. If it is determined that there is a high possibility of reoccurrence, the configuration of the array rank that includes a physical disk of the same product type as the physical disk in which the failure has occurred is more reliable than the current configuration. A means for changing the configuration to a highly operable one.
[0015]
More specifically, the second disk array device according to the present invention comprises:
In a disk array device having a plurality of physical disks,
A failure history management unit that manages a failure history including the product type of the failed physical disk and the failure content of the failure,
When a failure occurs in any of the plurality of physical disks, based on the failure history managed by the failure history management unit, a failure having the same failure content as the failed failure has occurred. It is determined whether the physical disk of the same product type as the physical disk is likely to recur, and if it is determined that there is a high possibility of recurring, the physical disk of the same product type as the failed physical disk is determined. An array rank changing unit for changing the configuration of the array rank as a component to a configuration more reliable than the current configuration is provided.
[0016]
Further, a third disk array device according to the present invention, in the second disk array device,
A change policy information storage unit that stores change policy information indicating how to change the current array rank configuration; and
The array rank changing unit, based on the current configuration of the array rank being the configuration change target and the change policy information stored in the change policy information storage unit, the array rank change target of the array change It has a feature of changing the configuration.
[0017]
A fourth disk array device according to the present invention is the third disk array device,
The change policy information storage unit stores a plurality of array rank configurations having different reliability.
The array rank changing unit sets the configuration of the array rank that is the configuration change target to be more than the current configuration of the array rank that is the configuration target among the configurations stored in the change policy information storage unit. It is characterized by having a configuration for changing to a configuration having one rank reliability.
[0018]
A fifth disk array device according to the present invention is the fourth disk array device,
A plurality of spare physical disks, and
The array rank changing unit uses the spare physical disk to configure an array rank that is one rank higher in reliability than the array rank to be changed, and configures the array rank to be changed. The present invention is characterized in that a normal physical disk in an element is changed to a spare physical disk.
[0019]
A sixth disk array device according to the present invention is the fifth disk array device,
In the change policy information storage unit, a configuration in which the RAID class is the same and the number of physical disks as constituent elements is one less is stored as a configuration having one rank reliability higher than that of a certain array rank. It is characterized by the following.
[0020]
A seventh disk array device according to the present invention is the sixth disk array device,
An array rank configuration information storage unit in which information indicating a physical disk configuring the array rank and a RAID class is stored for each array rank,
The array rank changing unit may change the array rank configuration by rewriting the contents of the array rank configuration information storage unit.
[0021]
Further, an eighth disk array device according to the present invention, in any one of the second to seventh disk array devices,
The failure history information managed by the failure history management unit is displayed on a display unit in response to a history reference request input by a user, and the failure history management unit is displayed in response to a history change request input by the user. A history information change / reference unit for changing the managed failure history information is provided.
[0022]
A ninth disk array device according to the present invention is the disk array device according to any one of the third to seventh aspects,
A change policy information stored in the change policy information storage unit is displayed on a display unit in response to a change policy reference request input by a user, and the change policy is displayed in response to a change policy change request input by a user. A change policy change / reference unit for changing the change policy information stored in the information storage unit is provided.
[0023]
[Action]
When a failure occurs in any of a plurality of physical disks constituting the disk array device, for example, based on a failure history, a failure having the same failure content as the failure has occurred. It is determined whether the physical disk of the same product type as the physical disk has a high possibility of recurrence. If it is determined that the possibility of recurrence is high, the configuration of the array rank, which includes a physical disk of the same product type as that of the failed physical disk, is changed to a configuration more reliable than the current configuration. change. As a configuration more reliable than the current configuration, for example, a configuration in which the RAID class is the same and the number of physical disks is one less can be adopted. In this way, since the failure is recovered in consideration of the product type of the failed physical disk, the details of the failure, and the configuration of the array rank, the risk of the failure recurring after the failure recovery is reduced. Can be.
[0024]
BEST MODE FOR CARRYING OUT THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0025]
FIG. 1 is a block diagram of one embodiment of the present invention, which comprises a disk array device 1, a host computer 2, and an upper I / F (upper interface) 3 for connecting the two.
[0026]
The disk array device 1 includes a higher-level I / F controller 101, an array controller 102, an HDD (hard disk drive) controller 103, an HDD group 104, a change policy information storage unit 105, an array rank change unit 106, , An HDD status information storage unit 107, a failure history management unit 108, a failure history information storage unit 109, and an array rank configuration information storage unit 110.
[0027]
The HDD group 104 is composed of 15 HDDs 01 to 15, and HDD numbers “01” to “15” are assigned to the HDDs 01 to 15, respectively. The HDDs 01 to 05 constitute an array rank of the array rank number “01”, and the HDDs 06 to 10 constitute an array rank of the array number “02”. The array ranks of the array rank numbers “01” and “02” are both array ranks of the RAID class “RAID-5”, and the addresses “A0” to “A1” are array ranks of the array rank number “01”. “Address (A1 + 1)” to “A2” are assigned to the array rank having the assigned array rank number “02”. The HDDs 11 to 15 are spare HDDs.
[0028]
The array rank configuration information storage unit 110 stores information indicating the configuration of each array rank existing in the HDD group 104, addresses assigned to each array rank, and information indicating a spare HDD.
[0029]
FIG. 2 shows an example of the contents of the array rank configuration information storage unit 110. As shown in the figure, the array rank configuration information storage unit 110 stores an array rank number, a RAID class, an HDD configuration, an HDD number of an HDD as a component, and an address. In the example of FIG. 2, the array ranks of array rank numbers “01” and “02” are configured by HDDs 01 to 05 and 06 to 10 of HDD numbers “01” to “05” and “06” to “10”, respectively. , The RAID class is “RAID-5”, the HDD configuration is “4D + 1P”, and the assigned addresses are “A0” to “A1” and “(A1 + 1)” to “A2”, respectively. ing. Further, this example indicates that the HDDs 11 to 15 with the HDD numbers “11” to “15” are spare HDDs.
[0030]
The HDD status information storage unit 107 stores the product type of each of the HDDs 01 to 15, information indicating the current status of each of the HDDs 01 to 15 (“NORMAL” or “ABNORMAL”), and details of the failure.
[0031]
FIG. 3 shows an example of the contents of the HDD status information storage unit 107. As shown in the figure, the HDD status information storage unit 107 stores an HDD number, a vendor, a product name, a version, a current status, and details of a failure. In this example, the product type of the HDD is represented by the vendor, product name, and version. In the example of FIG. 3, HDDs 01 to 05 and 11 to 13 are products of vendor “NNN”, product name “AAA”, and version “1.10”, and HDDs 06 to 10, 14, and 15 are vendors “HHH”, This indicates that the product has the product name “BBB” and the version “2.00”. Further, the example in FIG. 3 shows that a failure (ABNORMAL) having the failure content “timeout” occurs only in the HDD 10 among the HDDs 01 to 15, and the other HDDs are normal (NORMAL).
[0032]
The failure history information storage unit 109 stores information indicating the history of failures that have occurred in the HDD group 104.
[0033]
FIG. 4 shows an example of the contents of the failure history information storage unit 109. As shown in the figure, the failure history information storage unit 109 stores a history number, a vendor, a product name, a version, and details of a failure. In the example of FIG. 4, in the HDD of the vendor “NNN”, the product name “AAA”, and the version “1.10”, an “error-correctable data error” occurs once in the past, and the vendor “HHH” and the product This indicates that “timeout” has occurred twice in the past in the HDD with the name “BBB” and version “2.00”.
[0034]
The change policy information storage unit 105 stores a policy for changing the configuration of the array rank.
[0035]
FIG. 5 shows an example of the contents of the change policy information storage unit 105. As shown in the drawing, the change policy information storage unit 105 stores a phase number, a RAID class, and an HDD configuration. The configuration of the array rank is specified by the RAID class and the HDD configuration, and the smaller the phase number, the higher the reliability. The array rank configuration of the phase number “01” is a mirror configuration in which the same data is stored in two HDDs. The array rank configurations of the phase numbers “02” to “04” are all array rank configurations of the RAID class “RAID-5”, but the number of HDDs as constituent elements increases by one each time the phase number increases by one. I have. In other words, the smaller the phase number, the higher the reliability. These pieces of information are stored in the change policy information storage unit 105 from the host computer 2 via the upper I / F 3 and the upper I / F control unit 101.
[0036]
The upper I / F controller 101 has a function of exchanging data and the like with the host computer 2 via the upper I / F 3.
[0037]
The array control unit 102 controls the HDD control unit 103 according to a read command or a write command sent from the host computer 2 via the higher-level I / F control unit 101, so that data from the corresponding HDD in the HDD group 104 is And a function to write data.
[0038]
The HDD control unit 103 has a function of reading data from or writing data to a corresponding HDD in the HDD group 104 under the control of the array control unit 102. Further, the HDD control unit 103 changes the current state of the HDD in the HDD state information storage unit 107 to “ABNORMAL” while detecting the function of detecting the failed HDD and detecting the failed HDD. It has a function to write the details of the failure.
[0039]
The failure history information management unit 108 monitors the HDD status information storage unit 107, and when an HDD whose current state is changed to ABNORMAL occurs, the failure history information management unit 108 stores the HDD vendor, product name, version, and failure content in the failure history. It has a function of additionally registering information in the information storage unit 109 and a function of outputting a start instruction to the array rank changing unit 106 after the completion of additional registration.
[0040]
When a start instruction is input from the failure history management unit 108, the array rank change unit 106 replaces the failure with the same content as the failure that has occurred this time based on the storage content of the failure history information storage unit 109 with the HDD in which the failure has occurred this time. It is determined whether there is a high possibility of reoccurrence in an HDD of the same product type as above. Has a function of changing the configuration of the array rank to a configuration that is more reliable than the current configuration. The method of changing the configuration will be described later in detail.
[0041]
Description of operation of the embodiment
Next, the operation of this embodiment will be described in detail.
[0042]
First, the operation at the time of reading will be described.
[0043]
When reading data, the host computer 2 outputs a read command (including an address, a type, and a size). This read command is sent to the array controller 102 via the upper I / F 3 and the upper I / F controller 101.
[0044]
Upon receiving the read command, the array control unit 102, based on the address assigned to each array rank stored in the array rank configuration information storage unit 110, stores the HDD to be accessed in which the data to be read first is stored. (FIG. 6, step S62).
[0045]
Thereafter, the array control unit 102 refers to the HDD status information storage unit 107 and checks whether or not the current status of the access target HDD is “NORMAL” (Step S63).
[0046]
If it is "NORMAL", that is, if the HDD to be accessed is normal (YES in step S63), the HDD controller 103 is controlled to read data from the HDD to be accessed and transfer it to the host computer 2 ( Steps S64 and S65).
[0047]
On the other hand, if the status is “ABNORMAL”, that is, if a failure has occurred in the HDD to be accessed (NO in step S63), the HDD control unit 103 is controlled to control other HDDs within the same array rank as the HDD to be accessed. Then, the data stored in the normal HDD is read, and the data stored in the HDD to be accessed is restored based on the data (steps S66 and S67). After that, the restored data is transferred to the host computer 2. The above process is repeated until all data specified by the read command is read (until step S61 becomes YES).
[0048]
Next, the operation at the time of writing will be described.
[0049]
When writing data, the host computer 2 outputs a write command (including an address, a type, and a size). This write command is sent to the array controller 102 via the upper I / F 3 and the upper I / F controller 101.
[0050]
Upon receiving the write command, the array control unit 102 obtains an access target HDD to which data is first written based on the information stored in the array rank configuration information storage unit 110 (FIG. 7, step S72).
[0051]
Thereafter, the array control unit 102 refers to the HDD status information storage unit 107 and checks whether the current status of the access target HDD is “ABNORMAL” (step S73).
[0052]
If at least one of the current HDDs to be accessed is “ABNORMAL” (YES in step S 73), the write data sent from the host computer 2 and the HDD control unit 103 are controlled. A new parity P 'is generated from the read parity P, the new parity P' is written to the corresponding HDD, and the corresponding data is written to another normal HDD (step S75).
[0053]
On the other hand, if all the current states of the HDDs to be accessed are “NORMAL” (NO in step S73), the current state of the HDD storing the parity is referred to the HDD state information storage unit 107. It is checked whether it is "ABNORMAL" (step S74).
[0054]
If the current state of the HDD in which the parity is stored is “ABNORMAL” (YES in step S74), the HDD control unit 103 is controlled to transmit the data sent from the host computer 2 to the HDD to be accessed. Write (step S76).
[0055]
On the other hand, when the current state of the HDD in which the parity is stored is “NORMAL” (NO in step S74), the write data sent from the host computer and the HDD control unit 103 are controlled. A new parity P 'is generated from the parity P read by (1) (step S77). Thereafter, the new parity P ′ generated in step S77 is written to the corresponding HDD, and the write data sent from the host computer 2 is written to the access target HDD (step S78). The above processing is repeatedly performed until all the data instructed by the write command is written (until step S71 becomes YES).
[0056]
Next, the operation when the configuration of the array rank is changed will be described.
[0057]
Now, for example, it is assumed that a failure has occurred in the HDD 10 having the HDD number “10”. When detecting that a failure has occurred in the HDD 10, the HDD control unit 103 changes the current state of the HDD 10 stored in the HDD state information storage unit 107 from “NORMAL” to “ABNORMAL” and describes the failure (for example, , “Time out”). By this processing, the contents of the HDD status information storage unit 107 are as shown in FIG.
[0058]
The failure history management unit 108 monitors the HDD status information storage unit 107. When detecting that the current status corresponding to the HDD number “10” has become “ABNORMAL”, the failure history management unit 108 corresponds to the HDD number “10”. The vendor “HHH”, the product name “BBB”, the version “2.00”, and the failure content “timeout” are additionally registered in the failure history information storage unit 109. Now, for example, it is assumed that the history information of the history number “00003” is additionally registered in the failure history information storage unit 109 by the above processing, and the contents of the failure history information storage unit 109 are as shown in FIG. After that, the failure history management unit 108 outputs a start instruction to the array rank change unit 106.
[0059]
When a start instruction is added from the failure history management unit 108, the array rank changing unit 106 refers to the failure history information having the largest history number among the failure history information stored in the failure history information storage unit 109, The product type of the failed HDD 10 and the content of the failure are recognized (step S81 in FIG. 8). In this example, the array rank changing unit 106 refers to the failure history information of the history number “00003”, and the product type of the HDD 10 in which the failure has occurred is the vendor “HHH”, the product name “BBB”, and the version “2. 00 "as well as that the failure content is" timeout ".
[0060]
Thereafter, the array rank changing unit 106 determines whether or not a failure having the same failure content as the failure (timeout) that has occurred this time is highly likely to recur in an HDD of the same product type as the HDD 10 in which the failure has occurred this time ( Step S82). This determination is made, for example, as follows. First, the failure history information storage unit 109 is searched, and failure history information that includes the same product type and failure content as the failure history information with the largest history number (in this example, failure history information with the history number “00003”) Find the number of. Thereafter, the number of the obtained failure history information is compared with a predetermined number. If the predetermined number is smaller, it is determined that the possibility of recurrence is high, and if not, it is determined that the possibility of recurrence is low.
[0061]
If it is determined that the possibility of recurrence is low (NO in step S82), the array rank changing unit 106 ends the processing.
[0062]
On the other hand, when it is determined that the possibility of recurrence is high (YES in step S82), the HDD number of the HDD of the same product type as the failed HDD 10 is acquired by referring to the HDD status information storage unit 107. (Step S83). In this example, “06” to “09”, “14”, and “15” are acquired as the HDD numbers of the HDDs of the same product type as the HDD 10.
[0063]
Thereafter, the array rank changing unit 106 refers to the array rank configuration information storage unit 110 and configures any one of the failed HDD 10 and the HDDs 06 to 09, 14, and 15 of the same product type as the HDD 10 as constituent elements. The RAID class and the HDD configuration of the array rank are acquired (step S84). Now, for example, assuming that the contents of the array rank configuration information storage unit 110 are as shown in FIG. 2, the RAID class “RAID-5” and the HDD configuration “4D + 1P” registered corresponding to the array rank number “02”. "Will be obtained.
[0064]
Further, the array rank changing unit 106 acquires the HDD number of the spare HDD by referring to the array rank configuration information storage unit 110 (Step S85). In this example, “11” to “15” are acquired as spare HDD numbers.
[0065]
Thereafter, the array rank changing unit 106 refers to the change policy information storage unit 105, and configures the array rank configuration that is one rank more reliable than the configuration of the array rank specified by the RAID class and the HDD configuration acquired in step S84. Is acquired (step S86). This processing will be described in detail below. First, the change policy information storage unit 105 is searched to find an entry in which the array rank configuration specified by the RAID class “RAID-5” and the HDD configuration “4D + 1P” acquired in step S84 is stored. In the case of this example, the entry of the phase number “04” is obtained. Thereafter, the RAID class “RAID-5” and the HDD configuration “3D + 1P” stored in the entry of the phase number “03” having one less phase number than the phase number “04” are acquired. The above is the details of the processing performed in step S86.
[0066]
After that, the array rank changing unit 106 uses the HDDs (four) of the number indicated by the HDD configuration “3D + 1P” obtained in step S86 among the spare HDDs 11 to 15 whose HDD numbers have been obtained in step S85. Then, the configuration of the array rank is changed (step S87).
[0067]
The processing in step S87 will be described in detail below. First, an HDD used for the configuration change is selected from the spare HDDs 11 to 15. At this time, an HDD having a different product type from the failed HDD is preferentially selected. Now, for example, it is assumed that HDDs with HDD numbers “11” to “14” are selected as HDDs used for configuration change. Thereafter, the array rank changing unit 106 uses the HDDs 06 to 10 as components while restoring the data stored in the failed HDD 10 based on the data stored in the other normal HDDs 06 to 09. The data stored in the array rank is written to the array rank having the HDDs 11 to 14 as constituent elements. At this time, a process of generating and writing parity is also performed. The above is the details of the processing performed in step S87. Here, when the configuration is changed to an array rank configuration with a small number of HDDs, data overflows depending on the amount of data stored in the array rank before the configuration change, and all data cannot be stored in the array rank after the configuration change. May be lost. In order to prevent such a situation, for example, the amount of data stored in each array rank may be limited to the amount of data that can be stored in the array rank having the phase number “01”. In order to do this, for example, the size of the address assigned to the array rank of each phase number is set to the same value, and the value is set according to the amount of data that can be stored in the array rank of the phase number “01”. Just do it.
[0068]
Thereafter, the array rank changing unit 106 changes the configuration information of the array rank of the array rank number “02” whose configuration was changed this time, stored in the array rank configuration information storage unit 110 (step S88). In the case of this example, as shown in FIG. 9, the configuration information of the array rank having the array rank number “02” includes the RAID class “RAID-5”, the HDD configuration “3D + 1P”, and the components “11” and “12”. , “13”, and “14”. The address remains unchanged.
[0069]
In the above-described embodiment, when a failure occurs in the HDD, the array rank changing unit 106 immediately starts the processing shown in the flowchart of FIG. 8, but does not adversely affect the normal I / O operation. For this purpose, the processing shown in FIG. 8 may be executed when the load is relatively light. Further, in the above-described embodiment, the product type of the HDD is represented by the vendor, the product name, and the version. However, the present invention is not limited to this.
[0070]
Another Embodiment of the Invention
Next, another embodiment of the present invention will be described. This embodiment is characterized in that the failure history information stored in the failure history information storage unit can be referenced from the console, and the failure history information in the failure history information storage unit can be changed from the console.
[0071]
FIG. 10 is a block diagram of another embodiment of the present invention, which differs from the embodiment shown in FIG. 1 in that a disk array device 1a is provided instead of the disk array device 1 and a console 4 is added. That is the point.
[0072]
The disk array device 1a is different from the disk array device 1 shown in FIG. 1 in that a change policy change / reference unit 111 and a history information change / reference unit 112 are provided.
[0073]
The change policy change / reference unit 111 has a function of changing the change policy information stored in the change policy information storage unit 105 in accordance with a change policy change request input by the user using the console 4, or the user using the console 4. It has a function of reading a change policy from the change policy information storage unit 105 in accordance with the input change policy reference request and displaying the read change policy on a display unit (not shown) of the console 4.
[0074]
The history information change / reference unit 112 has a function of changing the failure history information stored in the failure history information storage unit 109 in accordance with a history information change request input by the user using the console 4, or the user using the console 4. It has a function of reading out fault history information from the fault history information storage unit 109 in accordance with the input history information reference request and displaying it on the display unit of the console 4.
[0075]
Next, the operation of this embodiment will be described. Since the operations other than the change policy change / reference unit 111 and the history information change / reference unit 112 are the same as those in the embodiment shown in FIG. 1, here, the change policy change / reference unit 111 and the history information change / reference unit are used. Only the operation of 112 will be described.
[0076]
When the user wants to refer to the change policy information stored in the change policy information storage unit 105, he inputs a change policy reference request using the console 4. When the change policy reference request is input, the change policy change / reference unit 111 reads the change policy information from the change policy information storage unit 105 and displays it on the display unit of the console 4.
[0077]
When changing the change policy information stored in the change policy information storage unit 105, the user inputs a change policy change request including the changed change policy information from the console 4. When a change policy change request is input, the change policy change / reference unit 111 replaces the contents of the change policy information storage unit 105 with the change policy information included therein.
[0078]
When the user wants to refer to the failure history information stored in the failure history information storage unit 109, the user inputs a history reference request from the console 4. When the history reference request is input, the history information change / reference unit 112 reads the failure history information from the failure history information storage unit 109 and displays it on the display unit of the console 4.
[0079]
When the user wants to change the failure history information stored in the failure history information storage unit 109, the user inputs a history setting request including the changed history information from the console 4. When a history setting request is input, the history information change / reference unit 112 replaces the contents of the failure history information storage unit 109 with the failure history information included therein.
[0080]
As described above, in the present embodiment, the failure history information can be referred to or changed from an external console. For example, the failure history information stored in the failure history information storage unit 109 in the operating disk array device can be used. , And store the collected fault history information in the fault history information storage unit 109 of another disk array device such as the disk array device whose use is to be started. By doing so, the configuration of the array rank can be changed at a more appropriate time in another disk array device such as the disk array device whose use is to be started. Further, since the change policy information can be changed / referenced, it can be easily checked whether or not the change policy information is suitable for the usage environment of the disk array device, and the change policy information can be read from the disk array device. It can be easily changed to one that matches the usage environment.
[0081]
【The invention's effect】
As described above, the disk array device of the present invention is provided with the array rank changing unit that recovers the failure in consideration of the product type of the failed physical disk, the content of the failure, and the array rank configuration. Thus, it is possible to reduce the risk that the failure will recur after the recovery from the failure.
[0082]
Also, after the failure is recovered by the array rank changing unit, the reliability of the array rank becomes higher than before the recovery from the failure. Therefore, even if a failure occurs on one physical disk after that, the failure is transferred to another physical disk. The risk of a worst-case situation in which a failure occurs and data in the array rank is lost can be extremely reduced.
[0083]
Further, since the disk array device of the present invention includes the history information change / reference unit, it is possible to set the failure history information of a certain disk array device in another disk array device. As a result, in the other disk array device, it is possible to change the configuration of the array rank at a more appropriate time.
[0084]
Further, since the disk array device of the present invention includes the change policy change / reference unit, it is possible to easily check whether the change policy information is suitable for the usage environment of the disk array device, and to change the change policy information. The information can be easily changed to one suitable for the use environment of the disk array device. .
[Brief description of the drawings]
FIG. 1 is a block diagram of one embodiment of the present invention.
FIG. 2 is a diagram showing an example of the contents of an array rank configuration information storage unit 110;
FIG. 3 is a diagram showing an example of the contents of an HDD status information storage unit 107;
FIG. 4 is a diagram illustrating an example of contents of a failure history information storage unit 109;
FIG. 5 is a diagram illustrating an example of contents of a change policy information storage unit 105;
FIG. 6 is a flowchart showing a processing example at the time of reading.
FIG. 7 is a flowchart illustrating an example of a write process;
FIG. 8 is a flowchart showing a processing example of an array rank changing unit 106;
FIG. 9 is a diagram showing an example of the contents of an array rank configuration information storage unit 110 after the configuration of the array rank has been changed.
FIG. 10 is a block diagram of another embodiment of the present invention.
FIG. 11 is a diagram showing a configuration example of an array rank.
FIG. 12 is a diagram for explaining read access and write access when a failure occurs in an HDD.
[Explanation of symbols]
1, 1a: Disk array device
101: Upper I / F control unit
102: Array control unit
103 ... HDD control unit
104: HDD group
105: Change policy information storage unit
106: Array rank changing unit
107: HDD status information storage unit
108: Failure history management unit
109: Failure history information storage unit
110: Array rank configuration information storage unit
111: Change policy change / reference section
112: History information change / reference section
2. Host computer
3 High-order I / F
4. Console

Claims (9)

複数の物理ディスクを有するディスクアレイ装置において、前記複数の物理ディスクの内の何れかに障害が発生したとき、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する手段を備えたことを特徴とするディスクアレイ装置。In a disk array device having a plurality of physical disks, when a failure occurs in any of the plurality of physical disks, a failure having the same failure content as the failed failure is the same product as the failed physical disk. It is determined whether there is a high possibility of reoccurrence in the physical disk of the type, and if it is determined that there is a high possibility of reoccurrence, an array including a physical disk of the same product type as the physical disk in which the failure has occurred is an element. A disk array device comprising means for changing a rank configuration to a configuration that is more reliable than the current configuration. 複数の物理ディスクを有するディスクアレイ装置において、障害の発生した物理ディスクの製品種別と前記障害の障害内容とを含む障害履歴を管理する障害履歴管理部と、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更するアレイランク変更部を備えたことを特徴とするディスクアレイ装置。
In a disk array device having a plurality of physical disks, a failure history management unit that manages a failure history including a product type of the failed physical disk and the failure content of the failure,
When a failure occurs in any of the plurality of physical disks, based on the failure history managed by the failure history management unit, a failure having the same failure content as the failed failure has occurred. It is determined whether the physical disk of the same product type as the physical disk is likely to recur, and if it is determined that there is a high possibility of recurring, the physical disk of the same product type as the failed physical disk is determined. What is claimed is: 1. A disk array device comprising: an array rank changing unit configured to change a configuration of an array rank as a constituent element to a configuration more reliable than a current configuration.
請求項2記載のディスクアレイ装置において、
現時点のアレイランク構成をどのように変更するのかを示す変更ポリシー情報が格納された変更ポリシー情報記憶部を備え、且つ、
前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている変更ポリシー情報とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有することを特徴とするディスクアレイ装置。
The disk array device according to claim 2,
A change policy information storage unit that stores change policy information indicating how to change the current array rank configuration; and
The array rank changing unit, based on the current configuration of the array rank being the configuration change target and the change policy information stored in the change policy information storage unit, the array rank change target of the array change A disk array device having a configuration for changing the configuration.
請求項3記載のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、信頼性の異なるアレイランクの構成が複数格納されており、
前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とするディスクアレイ装置。
The disk array device according to claim 3,
The change policy information storage unit stores a plurality of array rank configurations having different reliability.
The array rank changing unit sets the configuration of the array rank that is the configuration change target to be more than the current configuration of the array rank that is the configuration target among the configurations stored in the change policy information storage unit. A disk array device having a configuration for changing to a configuration having one rank higher reliability.
請求項4記載のディスクアレイ装置において、
スペアの物理ディスクを複数備え、且つ、
前記アレイランク変更部が、前記スペアの物理ディスクを用いて、前記構成変更対象にしているアレイランクよりも1ランク信頼性の高いアレイランクを構成し、前記構成変更対象にしているアレイランクの構成要素中の正常な物理ディスクをスペアの物理ディスクに変更する構成を有することを特徴とするディスクアレイ装置。
The disk array device according to claim 4,
A plurality of spare physical disks, and
The array rank changing unit uses the spare physical disk to configure an array rank that is one rank higher in reliability than the array rank to be changed, and configures the array rank to be changed. A disk array device having a configuration in which a normal physical disk in an element is changed to a spare physical disk.
請求項5記載のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とするディスクアレイ装置。
The disk array device according to claim 5,
In the change policy information storage unit, a configuration in which the RAID class is the same and the number of physical disks as constituent elements is one less is stored as a configuration having one rank reliability higher than that of a certain array rank. A disk array device characterized by the above-mentioned.
請求項6記載のディスクアレイ装置において、
アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とするディスクアレイ装置。
The disk array device according to claim 6,
An array rank configuration information storage unit in which information indicating a physical disk configuring the array rank and a RAID class is stored for each array rank,
A disk array device, wherein the array rank changing unit changes the array rank configuration by rewriting the contents of the array rank configuration information storage unit.
請求項2乃至7記載の何れか1つのディスクアレイ装置において、
ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とするディスクアレイ装置。
The disk array device according to any one of claims 2 to 7,
The failure history information managed by the failure history management unit is displayed on a display unit in response to a history reference request input by a user, and the failure history management unit is displayed in response to a history change request input by the user. A disk array device comprising a history information change / reference unit for changing managed failure history information.
請求項3乃至7記載の何れか1つのディスクアレイ装置において、
ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を変更する変更ポリシー変更/参照部を備えたことを特徴とするディスクアレイ装置。
The disk array device according to any one of claims 3 to 7,
A change policy information stored in the change policy information storage unit is displayed on a display unit in response to a change policy reference request input by a user, and the change policy is displayed in response to a change policy change request input by a user. A disk array device comprising a change policy change / reference unit for changing change policy information stored in an information storage unit.
JP2003000849A 2003-01-07 2003-01-07 Disk array device Expired - Fee Related JP4158525B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003000849A JP4158525B2 (en) 2003-01-07 2003-01-07 Disk array device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003000849A JP4158525B2 (en) 2003-01-07 2003-01-07 Disk array device

Publications (2)

Publication Number Publication Date
JP2004213441A true JP2004213441A (en) 2004-07-29
JP4158525B2 JP4158525B2 (en) 2008-10-01

Family

ID=32819020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003000849A Expired - Fee Related JP4158525B2 (en) 2003-01-07 2003-01-07 Disk array device

Country Status (1)

Country Link
JP (1) JP4158525B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7500136B2 (en) 2006-06-05 2009-03-03 International Business Machines Corporation Replacing member disks of disk arrays with spare disks
JP2012014531A (en) * 2010-07-01 2012-01-19 Fujitsu Ltd Storage device, controller of storage device and control method for storage device
US8914577B2 (en) 2009-02-12 2014-12-16 Fujitsu Limited Disk array control apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7500136B2 (en) 2006-06-05 2009-03-03 International Business Machines Corporation Replacing member disks of disk arrays with spare disks
US8914577B2 (en) 2009-02-12 2014-12-16 Fujitsu Limited Disk array control apparatus
JP2012014531A (en) * 2010-07-01 2012-01-19 Fujitsu Ltd Storage device, controller of storage device and control method for storage device

Also Published As

Publication number Publication date
JP4158525B2 (en) 2008-10-01

Similar Documents

Publication Publication Date Title
CN106933708B (en) Method and device for facilitating storage system recovery and storage system
US8171379B2 (en) Methods, systems and media for data recovery using global parity for multiple independent RAID levels
JP4901316B2 (en) Storage system and storage control device
US6892276B2 (en) Increased data availability in raid arrays using smart drives
US10324810B2 (en) Method and apparatus for redundant array of independent disks with raid metadata and sub-raid metadata stored using different raid algorithms
US7093069B2 (en) Integration of a RAID controller with a disk drive module
US20050229033A1 (en) Disk array controller and information processing apparatus
US20080172571A1 (en) Method and system for providing backup storage capacity in disk array systems
US9081697B2 (en) Storage control apparatus and storage control method
EP3244315B1 (en) Method and apparatus for performing data recovery in redundant storage system
JP4324088B2 (en) Data replication control device
JP2004038290A (en) Information processing system and disk control method for use in same system
JP2010072979A (en) Storage controller and data erasing method for storage device
WO2019097360A1 (en) Machine learning to enhance redundant array of independent disks rebuilds
US20070294476A1 (en) Method For Representing Foreign RAID Configurations
JP4454299B2 (en) Disk array device and maintenance method of disk array device
WO2013080299A1 (en) Data management device, data copy method, and program
US9280431B2 (en) Prioritizing backups on a disk level within enterprise storage
US7457990B2 (en) Information processing apparatus and information processing recovery method
US20030163757A1 (en) RAID subsystem and data input/output and recovery method in disk error mode
JP4158525B2 (en) Disk array device
US20190354433A1 (en) Parity log with by-pass
US11055190B1 (en) System and method for facilitating storage system operation with global mapping to provide maintenance without a service interrupt
US8356230B2 (en) Apparatus to manage data stability and methods of storing and recovering data
CN114968630A (en) Failed die management method for improving storage device availability

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070919

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070920

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080707

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130725

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees