JP2004213441A - Disk array apparatus - Google Patents
Disk array apparatus Download PDFInfo
- Publication number
- JP2004213441A JP2004213441A JP2003000849A JP2003000849A JP2004213441A JP 2004213441 A JP2004213441 A JP 2004213441A JP 2003000849 A JP2003000849 A JP 2003000849A JP 2003000849 A JP2003000849 A JP 2003000849A JP 2004213441 A JP2004213441 A JP 2004213441A
- Authority
- JP
- Japan
- Prior art keywords
- array
- configuration
- rank
- failure
- disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、複数の物理ディスクを有するディスクアレイ装置に関し、特に、ディスクアレイ装置の信頼性を向上させる技術に関する。
【0002】
【従来の技術】
ディスクアレイ装置は、物理ディスクであるハードディスクドライブ(HDD)の大容量化により、数十TB(テラバイト)を有する規模になってきている。現在、一台のハードディスクの記憶容量は100GB(ギガバイト)を越えるレベルに達しており、今後もますます大容量化が図られると考えられる。これに伴い、ディスクアレイ装置も大容量になると思われる。
【0003】
ところで、ディスクアレイ装置の特徴の1つとして、アレイランクを構成する複数のHDDの内の1台に障害が発生した場合、アレイランク内の他の正常なHDDを使用してデータアクセスを継続できる点が挙げられる。
【0004】
この点について、図11及び図12を参照して説明する。今、アレイランクが、図11に示すように4台のHDD01〜04によって構成されているとする。また、データDが3つのデータD1〜D3に3分割されてHDD01〜03に格納され、データD1〜D3の冗長データであるパリティPがHDD04に格納されているとする。このような構成を有するアレイランクにおいて、図12に示すように、HDD03に障害が発生したとする。
【0005】
HDD03に障害が発生した後、その障害が復旧する前に、ホストコンピュータからHDD03に格納されているデータD3に対するリード指令が出力された場合は、アレイランク内の正常なHDD01,02,04からデータD1,D2及びパリティPを読み出し、それに基づいてデータD3を復元し、ホストコンピュータに転送する。
【0006】
また、障害復旧前にホストコンピュータからHDD03に対してライト指令が出力された場合には、新たなパリティP’を生成し、それをHDD04に書き込む。また、ホストコンピュータから正常なHDD(例えば、HDD01とする)に対するライト指令が出力された場合には、新たなデータD1’をHDD01に書き込むと共に、新たなパリティP’を生成し、HDD04に書き込む。
【0007】
以上のように、ディスクアレイ装置においては、アレイランクを構成する複数のHDDの内の1つに障害が発生しても、他の正常なHDDを使用してデータアクセスを継続することができる。
【0008】
また、障害の発生したHDD03が交換された場合、或いは予めスペアHDDが用意されている場合には、障害復旧処理が行われる。障害復旧処理では、正常なHDD01,02,04に格納されているデータD1,D2及びパリティPに基づいてデータD3を復元し、復元したデータD3をスペアHDD或いは交換されたHDDに書き戻す。
【0009】
上記した障害復旧処理は、従来一般的に行われているものであるが、これ以外にも、複数のドライブに構成される記憶領域を複数のボリュームに分割し、障害発生時には、アクセス頻度の高いボリュームから優先的に、障害ドライブに格納されているデータをスペアドライブに復旧するようにした技術や(例えば、特許文献1参照)、HDDに障害が発生した時、複数の論理ディスクの内の優先論理ディスクについては、障害の発生したHDDに格納されているデータを不揮発性の半導体メモリ上に復元するようにした技術(例えば、特許文献2参照)も知られている。
【0010】
上述した従来の技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他のHDD上に復元する技術であり、アレイランクの構成を変更するものではない。なお、アレイランクの構成を変更する技術としては、ライトデータ量に応じてRAIDクラスを変更する技術(例えば、特許文献3参照)や、ユーザがデータ保持部に保持されているアレイ構成情報を変更すると、ディスクインタフェース変更部がディスクインタフェース接続部に対して、アレイ制御部の配線とディスク装置群の配線との接続状態を、変更後のアレイ構成情報に応じたものにすることを指示する技術(例えば、特許文献4参照)が知られているが、復旧処理に関連するものではない。
【0011】
【特許文献1】
特開平11−24850号公報
【特許文献2】
特開2001−175423号公報
【特許文献3】
特開平6−187249号公報
【特許文献4】
特開2000−298557号公報
【0012】
【発明が解決しようとする課題】
上述したように、従来、一般的に行われている障害復旧処理や、特許文献1,2に記載されている技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他の物理ディスク上に復元するだけであり、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮していないため、障害復旧後に再び障害が発生する可能性が高いという問題がある。
【0013】
そこで、本発明の目的は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害復旧を行うことにより、障害が再発する危険性を少なくすることにある。
【0014】
【課題を解決するための手段】
本発明にかかる第1のディスクアレイ装置は、上記目的を達成するため、
複数の物理ディスクを有するディスクアレイ装置において、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する手段を備えたことを特徴とする。
【0015】
より具体的には、本発明にかかる第2のディスクアレイ装置は、
複数の物理ディスクを有するディスクアレイ装置において、
障害の発生した物理ディスクの製品種別と前記障害の障害内容とを含む障害履歴を管理する障害履歴管理部と、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更するアレイランク変更部を備えたことを特徴とする。
【0016】
また、本発明にかかる第3のディスクアレイ装置は、第2のディスクアレイ装置において、
現時点のアレイランク構成をどのように変更するのかを示す変更ポリシー情報が格納された変更ポリシー情報記憶部を備え、且つ、
前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている変更ポリシー情報とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有することを特徴とする。
【0017】
また、本発明にかかる第4のディスクアレイ装置は、第3のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、信頼性の異なるアレイランクの構成が複数格納されており、
前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とする。
【0018】
また、本発明にかかる第5のディスクアレイ装置は、第4のディスクアレイ装置において、
スペアの物理ディスクを複数備え、且つ、
前記アレイランク変更部が、前記スペアの物理ディスクを用いて、前記構成変更対象にしているアレイランクよりも1ランク信頼性の高いアレイランクを構成し、前記構成変更対象にしているアレイランクの構成要素中の正常な物理ディスクをスペアの物理ディスクに変更する構成を有することを特徴とする。
【0019】
また、本発明にかかる第6のディスクアレイ装置は、第5のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とする。
【0020】
また、本発明にかかる第7のディスクアレイ装置は、第6のディスクアレイ装置において、
アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とする。
【0021】
また、本発明にかかる第8のディスクアレイ装置は、第2〜第7の何れか1つのディスクアレイ装置において、
ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とする。
【0022】
また、本発明にかかる第9のディスクアレイ装置は、第3〜第7記載の何れか1つのディスクアレイ装置において、
ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を変更する変更ポリシー変更/参照部を備えたことを特徴とする。
【0023】
【作用】
ディスクアレイ装置を構成している複数の物理ディスクの内の何れかに障害が発生したとき、例えば、障害履歴などに基づいて、上記発生した障害と同一障害内容の障害が、上記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定する。そして、再発する可能性が高いと判定した場合は、上記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する。現時点の構成よりも信頼性の高い構成としては、例えば、RAIDクラスが同一で、物理ディスク数が1台少ない構成を採用することができる。このように、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するようにしているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0024】
【発明の実施の形態】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0025】
図1は本発明の一実施例のブロック図であり、ディスクアレイ装置1と、ホストコンピュータ2と、両者を接続する上位I/F(上位インタフェース)3とから構成されている。
【0026】
ディスクアレイ装置1は、上位I/F制御部101と、アレイ制御部102と、HDD(ハードディスクドライブ)制御部103と、HDD群104と、変更ポリシー情報記憶部105と、アレイランク変更部106と、HDD状態情報記憶部107と、障害履歴管理部108と、障害履歴情報記憶部109と、アレイランク構成情報記憶部110とから構成されている。
【0027】
HDD群104は、15台のHDD01〜15から構成されており、各HDD01〜15にはそれぞれHDD番号「01」〜「15」が付与されている。また、HDD01〜05により、アレイランク番号「01」のアレイランクが構成され、HDD06〜10によりアレイ番号「02」のアレイランクが構成されている。アレイランク番号「01」,「02」のアレイランクは共にRAIDクラスが「RAID−5」のアレイランクであり、アレイランク番号「01」のアレイランクには、アドレス「A0」〜「A1」が割り当てられ、アレイランク番号「02」のアレイランクには、「アドレス(A1+1)」〜「A2」が割り当てられている。また、HDD11〜15は、スペアのHDDとなっている。
【0028】
アレイランク構成情報記憶部110には、HDD群104内に存在する各アレイランクの構成を示す情報や、各アレイランクに割り当てられているアドレスや、スペアのHDDを示す情報が格納されている。
【0029】
図2にアレイランク構成情報記憶部110の内容例を示す。同図に示すように、アレイランク構成情報記憶部110には、アレイランク番号と、RAIDクラスと、HDD構成と、構成要素とするHDDのHDD番号と、アドレスとが格納される。図2の例は、アレイランク番号「01」,「02」のアレイランクは、それぞれHDD番号「01」〜「05」,「06」〜「10」のHDD01〜05,06〜10によって構成され、RAIDクラスが共に「RAID−5」で、HDD構成が共に「4D+1P」で、割り当てられているアドレスがそれぞれ「A0」〜「A1」,「(A1+1)」〜「A2」であることを示している。更に、この例は、HDD番号「11」〜「15」のHDD11〜15は、スペアのHDDであることを示している。
【0030】
HDD状態情報記憶部107には、各HDD01〜15の製品種別や、各HDD01〜15の現在の状態を示す情報(「NORMAL」か「ABNORMAL」)や、障害内容が格納される。
【0031】
図3にHDD状態情報記憶部107の内容例を示す。同図に示すように、HDD状態情報記憶部107には、HDD番号と、ベンダーと、製品名と、バージョンと、現在の状態と、障害内容とが格納される。この例では、ベンダー,製品名及びバージョンによりHDDの製品種別を表すようにしている。また、図3の例は、HDD01〜05,11〜13がベンダー「NNN」,製品名「AAA」,バージョン「1.10」の製品で、HDD06〜10,14,15がベンダー「HHH」,製品名「BBB」,バージョン「2.00」の製品であることを示している。更に、図3の例は、HDD01〜15の内、HDD10にのみ障害内容「タイムアウト」の障害(ABNORMAL)が発生し、他のHDDは正常(NORMAL)であることを示している。
【0032】
障害履歴情報記憶部109には、HDD群104において発生した障害の履歴を示す情報が格納される。
【0033】
図4に障害履歴情報記憶部109の内容例を示す。同図に示すように、障害履歴情報記憶部109には、履歴番号と、ベンダーと、製品名と、バージョンと、障害内容とが格納される。図4の例は、ベンダー「NNN」,製品名「AAA」,バージョン「1.10」のHDDにおいて、「エラー訂正不可能なデータエラー」が過去に1回発生し、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」のHDDにおいて「タイムアウト」が過去に2回発生していることを示している。
【0034】
変更ポリシー情報記憶部105には、アレイランクの構成を変更する際のポリシーが格納されている。
【0035】
図5に変更ポリシー情報記憶部105の内容例を示す。同図に示すように、変更ポリシー情報記憶部105には、フェーズ番号と、RAIDクラスと、HDD構成とが格納される。RAIDクラスとHDD構成とによって、アレイランクの構成が特定されており、フェーズ番号が若いものほど信頼性の高い構成になっている。フェーズ番号「01」のアレイランク構成は、2台のHDDに同一データを格納したミラー構成である。フェーズ番号「02」〜「04」のアレイランク構成は共にRAIDクラス「RAID−5」のアレイランク構成であるが、構成要素であるHDDの台数はフェーズ番号が1つ増える毎に1台増えている。即ち、フェーズ番号が若いものほど、信頼性の高い構成となっている。これらの情報は、ホストコンピュータ2から上位I/F3,上位I/F制御部101を介して変更ポリシー情報記憶部105に格納される。
【0036】
上位I/F制御部101は、上位I/F3を介してホストコンピュータ2との間でデータ等をやり取りする機能を有する。
【0037】
アレイ制御部102は、上位I/F制御部101を介してホストコンピュータ2から送られてくるリード指令やライト指令に従ってHDD制御部103を制御することにより、HDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。
【0038】
HDD制御部103は、アレイ制御部102の制御に従ってHDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。更に、HDD制御部103は、障害の発生したHDDを検出する機能や、障害の発生したHDDを検出した時、HDD状態情報記憶部107中の上記HDDの現在状態を「ABNORMAL」に変更すると共に障害内容を書き込む機能を有する。
【0039】
障害履歴情報管理部108は、HDD状態情報記憶部107を監視しており、現在の状態がABNORMALに変更されたHDDが発生した時、そのHDDのベンダー,製品名,バージョン及び障害内容を障害履歴情報記憶部109に追加登録する機能や、追加登録完了後にアレイランク変更部106に対して起動指示を出力する機能を有する。
【0040】
アレイランク変更部106は、障害履歴管理部108から起動指示が入力されると、障害履歴情報記憶部109の記憶内容に基づいて今回発生した障害と同一内容の障害が、今回障害の発生したHDDと同一製品種別のHDDにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判断した場合、変更ポリシー情報記憶部105の内容に基づいて上記製品種別のHDDを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する機能を有する。なお、構成の変更方法については、後で詳細に説明する。
【0041】
【実施例の動作の説明】
次に、本実施例の動作について詳細に説明する。
【0042】
先ず、リード時の動作について説明する。
【0043】
ホストコンピュータ2は、データのリード時、リード指令(アドレス,種別,サイズを含む)を出力する。このリード指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102に送られる。
【0044】
アレイ制御部102は、リード指令を受け取ると、アレイランク構成情報記憶部110に格納されている各アレイランクに割り当てられているアドレスに基づいて、最初にリードするデータが格納されているアクセス対象HDDを求める(図6、ステップS62)。
【0045】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「NORMAL」であるか否かを調べる(ステップS63)。
【0046】
そして、「NORMAL」である場合、即ちアクセス対象HDDが正常である場合(ステップS63がYES)は、HDD制御部103を制御してアクセス対象HDDからデータをリードし、ホストコンピュータ2へ転送する(ステップS64,S65)。
【0047】
これに対して、「ABNORMAL」である場合、即ちアクセス対象HDDに障害が発生している場合(ステップS63がNO)は、HDD制御部103を制御してアクセス対象HDDと同一アレイランク内の他の正常なHDDに格納されているデータをリードし、それらに基づいてアクセス対象HDDに格納されているデータを復元する(ステップS66,S67)。その後、復元したデータをホストコンピュータ2へ転送する。以上の処理をリード指令によって指令された全てのデータをリードするまで(ステップS61がYESとなるまで)繰り返し行う。
【0048】
次に、ライト時の動作について説明する。
【0049】
ホストコンピュータ2は、データライト時、ライト指令(アドレス,種別,サイズを含む)を出力する。このライト指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102へ送られる。
【0050】
アレイ制御部102は、ライト指令を受け取ると、アレイランク構成情報記憶部110に格納されている情報に基づいて、最初にデータをライトするアクセス対象HDDを求める(図7,ステップS72)。
【0051】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS73)。
【0052】
そして、アクセス対象HDDの内の少なくとも1つの現在の状態が「ABNORMAL」である場合(ステップS73がYES)は、ホストコンピュータ2から送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP’を生成し、新たなパリティP’を該当するHDDに書き込むと共に、他の正常なHDDに対して該当するデータをライトする(ステップS75)。
【0053】
これに対して、アクセス対象HDDの現在の状態が全て「NORMAL」である場合は(ステップS73がNO)、HDD状態情報記憶部107を参照し、パリティが格納されているHDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS74)。
【0054】
そして、パリティの格納されているHDDの現在の状態が「ABNORMAL」である場合(ステップS74がYES)は、HDD制御部103を制御し、アクセス対象HDDにホストコンピュータ2から送られてくるデータを書き込む(ステップS76)。
【0055】
これに対して、パリティの格納されているHDDの現在の状態が「NORMAL」である場合(ステップS74がNO)は、ホストコンピュータから送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP’を生成する(ステップS77)。その後、ステップS77で生成した新たなパリティP’を該当するHDDに書き込むと共に、ホストコンピュータ2から送られてきたライトデータをアクセス対象HDDに書き込む(ステップS78)。以上の処理を、ライト指令によって指令されたデータを全て書き込むまで(ステップS71がYESとなるまで)、繰り返し行う。
【0056】
次に、アレイランクの構成変更時の動作について説明する。
【0057】
今、例えば、HDD番号「10」のHDD10に障害が発生したとする。HDD制御部103は、HDD10に障害が発生したことを検出すると、HDD状態情報記憶部107に格納されているHDD10の現在の状態を「NORMAL」から「ABNORMAL」に変更すると共に、障害内容(例えば、「タイムアウト」とする)を書き込む。この処理により、HDD状態情報記憶部107の内容は、図3に示すものとなる。
【0058】
障害履歴管理部108は、HDD状態情報記憶部107を監視しており、HDD番号「10」に対応する現在の状態が「ABNORMAL」になったことを検出すると、HDD番号「10」に対応するベンダー「HHH」,製品名「BBB」,バージョン「2.00」及び障害内容「タイムアウト」を障害履歴情報記憶部109に追加登録する。今、例えば、上記処理により、障害履歴情報記憶部109に履歴番号「00003」の履歴情報が追加登録され、障害履歴情報記憶部109の内容が図4に示すものになったとする。その後、障害履歴管理部108は、アレイランク変更部106に対して起動指示を出力する。
【0059】
アレイランク変更部106は、障害履歴管理部108から起動指示が加えられると、障害履歴情報記憶部109に格納されている障害履歴情報の内の、最も履歴番号が大きい障害履歴情報を参照し、障害の発生したHDD10の製品種別及び障害内容を認識する(図8,ステップS81)。この例の場合、アレイランク変更部106は、履歴番号「00003」の障害履歴情報を参照し、障害の発生したHDD10の製品種別が、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」であることを認識すると共に、障害内容が「タイムアウト」であることを認識する。
【0060】
その後、アレイランク変更部106は、今回発生した障害(タイムアウト)と同一障害内容の障害が、今回障害の発生したHDD10と同一製品種別のHDDにおいて再発する可能性が高いか否かを判定する(ステップS82)。この判断は、例えば、次のようにして行う。先ず、障害履歴情報記憶部109を検索し、履歴番号が最も大きい障害履歴情報(この例では、履歴番号「00003」の障害履歴情報)と同一の製品種別および障害内容を含んでいる障害履歴情報の数を求める。その後、上記求めた障害履歴情報の数と予め定められている所定数とを比較する。そして、予め定められている所定数の方が小さい場合には、再発する可能性が高いと判定し、そうでない場合は再発する可能性が低いと判定する。
【0061】
そして、再発の可能性が低いと判定した場合(ステップS82がNO)は、アレイランク変更部106は、その処理を終了する。
【0062】
これに対して、再発の可能性が高いと判定した場合(ステップS82がYES)は、HDD状態情報記憶部107を参照し、障害の発生したHDD10と同一の製品種別のHDDのHDD番号を取得する(ステップS83)。この例の場合、HDD10と同一製品種別のHDDのHDD番号として「06」〜「09」,「14」,「15」が取得される。
【0063】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、障害の発生したHDD10及びHDD10と同一製品種別のHDD06〜09,14,15の内の何れかを構成要素にしているアレイランクのRAIDクラス及びHDD構成を取得する(ステップS84)。今、例えば、アレイランク構成情報記憶部110の内容が図2に示すものであるとすると、アレイランク番号「02」に対応して登録されているRAIDクラス「RAID−5」及びHDD構成「4D+1P」を取得することになる。
【0064】
更に、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、スペアのHDDのHDD番号を取得する(ステップS85)。この例の場合、スペアのHDD番号として「11」〜「15」を取得することになる。
【0065】
その後、アレイランク変更部106は、変更ポリシー情報記憶部105を参照し、ステップS84で取得したRAIDクラス及びHDD構成によって特定されるアレイランクの構成よりも、1ランク信頼性の高いアレイランクの構成を示すRAIDクラス及びHDD構成を取得する(ステップS86)。この処理を詳しく説明すると、次のようになる。先ず、変更ポリシー情報記憶部105を検索し、ステップS84で取得したRAIDクラス「RAID−5」,HDD構成「4D+1P」によって特定されるアレイランク構成が格納されているエントリを求める。この例の場合、フェーズ番号「04」のエントリが求められる。その後、上記フェーズ番号「04」よりも1つフェーズ番号が少ないフェーズ番号「03」のエントリに格納されているRAIDクラス「RAID−5」,HDD構成「3D+1P」を取得する。以上がステップS86で行う処理の詳細である。
【0066】
その後、アレイランク変更部106は、ステップS85でHDD番号を取得したスペアのHDD11〜15の内の、ステップS86で取得したHDD構成「3D+1P」によって示される台数分(4台)のHDDを使用して、アレイランクの構成を変更する(ステップS87)。
【0067】
このステップS87の処理を詳しく説明すると、次のようになる。先ず、スペアのHDD11〜15の中から、構成変更に使用するHDDを選択する。その際、障害の発生したHDDとは製品種別の異なるHDDを優先的に選択するようにする。今、例えば、構成変更に使用するHDDとしてHDD番号が「11」〜「14」のHDDを選択したとする。その後、アレイランク変更部106は、障害の発生したHDD10に格納されていたデータを、他の正常なHDD06〜09に格納されているデータに基づいて復元しながら、HDD06〜10を構成要素としているアレイランクに格納されていたデータをHDD11〜14を構成要素とするアレイランクに書き込む。その際、パリティを生成し、書き込む処理も行う。以上がステップS87で行う処理の詳細である。ここで、HDD数の少ないアレイランク構成に変更すると、構成変更前のアレイランクに格納されているデータ量によっては、データが溢れてしまい、構成変更後のアレイランクに全データを格納できなくなってしまう場合がある。このようなことを防ぐためには、例えば、各アレイランクに格納するデータ量を、フェーズ番号「01」のアレイランクに格納可能なデータ量に制限すれば良い。このようにするためには、例えば、各フェーズ番号のアレイランクに割り当てるアドレスのサイズを同一値とし、且つ、その値をフェーズ番号「01」のアレイランクが格納可能なデータ量に応じたものにすれば良い。
【0068】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110に格納されている、今回構成変更を行ったアレイランク番号「02」のアレイランクの構成情報を変更する(ステップS88)。この例の場合、アレイランク番号が「02」のアレイランクの構成情報は、図9に示すように、RAIDクラス「RAID−5」,HDD構成「3D+1P」,構成要素「11」,「12」,「13」,「14」に変更される。アドレスは、元のままである。
【0069】
なお、上述した実施例においては、HDDに障害が発生した場合、アレイランク変更部106が直ちに図8の流れ図に示す処理を開始するようにしたが、通常のI/O動作に悪影響を与えないようにするために、比較的負荷の軽いときに、図8に示す処理を実行するようにしても良い。また、上述した実施例においては、HDDの製品種別をベンダー,製品名およびバージョンにより表すようにしたが、これに限られるものではない。
【0070】
【発明の他の実施例】
次に、本発明の他の実施例について説明する。本実施例は、障害履歴情報記憶部に格納されている障害履歴情報をコンソールから参照可能にすると共に、コンソールから障害履歴情報記憶部の障害履歴情報を変更可能にしたことを特徴とする。
【0071】
図10は本発明の他の実施例のブロック図であり、図1に示した実施例との相違点は、ディスクアレイ装置1の代わりにディスクアレイ装置1aを備えている点およびコンソール4が追加されている点である。
【0072】
ディスクアレイ装置1aは、変更ポリシー変更/参照部111および履歴情報変更/参照部112を備えている点が図1に示したディスクアレイ装置1と相違している。
【0073】
変更ポリシー変更/参照部111は、ユーザがコンソール4を用いて入力する変更ポリシー変更要求に従って変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する機能や、ユーザがコンソール4を用いて入力する変更ポリシー参照要求に従って変更ポリシー情報記憶部105から変更ポリシーを読み出し、それをコンソール4の表示部(図示せず)に表示する機能を有する。
【0074】
履歴情報変更/参照部112は、ユーザがコンソール4を用いて入力する履歴情報変更要求に従って障害履歴情報記憶部109に格納されている障害履歴情報を変更する機能や、ユーザがコンソール4を用いて入力する履歴情報参照要求に従って障害履歴情報記憶部109から障害履歴情報を読み出し、コンソール4の表示部に表示する機能を有する。
【0075】
次に本実施例の動作について説明する。尚、変更ポリシー変更/参照部111及び履歴情報変更/参照部112以外の動作は図1に示した実施例と同じであるので、ここでは変更ポリシー変更/参照部111及び履歴情報変更/参照部112の動作についてのみ説明する。
【0076】
ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を参照したい場合、コンソール4を用いて変更ポリシー参照要求を入力する。変更ポリシー変更/参照部111は、変更ポリシー参照要求が入力されると、変更ポリシー情報記憶部105から変更ポリシー情報を読み出し、コンソール4の表示部に表示する。
【0077】
また、ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する場合には、変更後の変更ポリシー情報を含んだ変更ポリシー変更要求をコンソール4から入力する。変更ポリシー変更/参照手段111は、変更ポリシー変更要求が入力されると、それに含まれている変更ポリシー情報で変更ポリシー情報記憶部105の内容を置き換える。
【0078】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を参照したい場合、履歴参照要求をコンソール4から入力する。履歴情報変更/参照部112は、履歴参照要求が入力されると、障害履歴情報記憶部109から障害履歴情報を読み出し、それをコンソール4の表示部に表示する。
【0079】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を変更したい場合には、変更後の履歴情報を含んだ履歴設定要求をコンソール4から入力する。履歴情報変更/参照手段112は、履歴設定要求が入力されると、それに含まれている障害履歴情報で障害履歴情報記憶部109の内容を置き換える。
【0080】
このように、本実施例では、障害履歴情報を外部にあるコンソールから参照したり、変更できるので、例えば、稼働中のディスクアレイ装置内の障害履歴情報記憶部109に格納されている障害履歴情報を収集し、収集した障害履歴情報を、例えば、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置の障害履歴情報記憶部109に格納するといったことが可能になる。このようにすることにより、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置において、より適切な時期にアレイランクの構成変更が行えるようになる。また、変更ポリシー情報の変更/参照も可能となっているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。
【0081】
【発明の効果】
以上説明したように、本発明のディスクアレイ装置は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するアレイランク変更部を備えているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0082】
また、アレイランク変更部により障害を復旧した後は、アレイランクの信頼性が障害復旧前よりも高くなるので、それ以後に1つの物理ディスクに障害が発生したとしても、更に別の物理ディスクに障害が発生し、アレイランク内のデータが失われてしまうといった最悪の事態が発生する危険性を極めて少なくすることができる。
【0083】
また、本発明のディスクアレイ装置は、履歴情報変更/参照部を備えているので、或るディスクアレイ装置の障害履歴情報を他のディスクアレイ装置に設定することが可能になる。その結果、上記他のディスクアレイ装置において、より適切な時期にアレイランクの構成を変更することが可能になる。
【0084】
また、本発明のディスクアレイ装置は、変更ポリシー変更/参照部を備えているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】アレイランク構成情報記憶部110の内容例を示す図である。
【図3】HDD状態情報記憶部107の内容例を示す図である。
【図4】障害履歴情報記憶部109の内容例を示す図である。
【図5】変更ポリシー情報記憶部105の内容例を示す図である。
【図6】リード時の処理例を示す流れ図である。
【図7】ライト時の処理例を示す流れ図である。
【図8】アレイランク変更部106の処理例を示す流れ図である。
【図9】アレイランクの構成を変更した後のアレイランク構成情報記憶部110の内容例を示す図である。
【図10】本発明の他の実施例のブロック図である。
【図11】アレイランクの構成例を示した図である。
【図12】HDDに障害が発生したときの、リードアクセス,ライトアクセスを説明するための図である。
【符号の説明】
1,1a…ディスクアレイ装置
101…上位I/F制御部
102…アレイ制御部
103…HDD制御部
104…HDD群
105…変更ポリシー情報記憶部
106…アレイランク変更部
107…HDD状態情報記憶部
108…障害履歴管理部
109…障害履歴情報記憶部
110…アレイランク構成情報記憶部
111…変更ポリシー変更/参照部
112…履歴情報変更/参照部
2…ホストコンピュータ
3…上位I/F
4…コンソール[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a disk array device having a plurality of physical disks, and more particularly, to a technique for improving the reliability of a disk array device.
[0002]
[Prior art]
The disk array device has a scale of several tens of TB (terabyte) due to an increase in capacity of a hard disk drive (HDD) as a physical disk. At present, the storage capacity of one hard disk has reached a level exceeding 100 GB (gigabyte), and it is expected that the capacity will be further increased in the future. With this, the capacity of the disk array device is expected to increase.
[0003]
Incidentally, as one of the features of the disk array device, when one of the plurality of HDDs constituting the array rank fails, data access can be continued using another normal HDD in the array rank. Points.
[0004]
This point will be described with reference to FIGS. Now, it is assumed that the array rank is constituted by four
[0005]
If a read command for the data D3 stored in the
[0006]
If a write command is output from the host computer to the
[0007]
As described above, in the disk array device, even if a failure occurs in one of the plurality of HDDs constituting the array rank, data access can be continued using another normal HDD.
[0008]
Further, when the failed
[0009]
Although the above-described failure recovery processing is generally performed in the past, in addition to this, the storage area configured by a plurality of drives is divided into a plurality of volumes, and when a failure occurs, the frequency of access is high. A technique that preferentially recovers data stored in a failed drive from a volume to a spare drive (for example, see Patent Document 1), and when a failure occurs in an HDD, priority is given to a plurality of logical disks. With respect to a logical disk, a technique for restoring data stored in a failed HDD in a nonvolatile semiconductor memory is also known (for example, see Patent Document 2).
[0010]
The conventional technique described above is a technique for restoring data stored in a failed HDD to another HDD such as a spare HDD, and does not change the configuration of the array rank. As a technique for changing the configuration of the array rank, a technique for changing the RAID class according to the write data amount (for example, see Patent Document 3), or a technique for changing the array configuration information held in the data holding unit by the user. Then, the disk interface changing unit instructs the disk interface connecting unit to change the connection state between the wiring of the array control unit and the wiring of the disk device group according to the changed array configuration information ( For example, Patent Literature 4) is known, but is not related to recovery processing.
[0011]
[Patent Document 1]
JP-A-11-24850
[Patent Document 2]
JP 2001-175423 A
[Patent Document 3]
JP-A-6-187249
[Patent Document 4]
JP 2000-298557 A
[0012]
[Problems to be solved by the invention]
As described above, the failure recovery processing generally performed conventionally and the techniques described in
[0013]
Therefore, an object of the present invention is to reduce the risk of a reoccurrence of a failure by performing a failure recovery in consideration of the product type of the failed physical disk, the details of the failure, and the configuration of the array rank. .
[0014]
[Means for Solving the Problems]
A first disk array device according to the present invention achieves the above object,
In a disk array device having a plurality of physical disks,
When a failure occurs in any of the plurality of physical disks, there is a high possibility that a failure having the same failure content as the failed failure will recur on a physical disk of the same product type as the failed physical disk. If it is determined that there is a high possibility of reoccurrence, the configuration of the array rank that includes a physical disk of the same product type as the physical disk in which the failure has occurred is more reliable than the current configuration. A means for changing the configuration to a highly operable one.
[0015]
More specifically, the second disk array device according to the present invention comprises:
In a disk array device having a plurality of physical disks,
A failure history management unit that manages a failure history including the product type of the failed physical disk and the failure content of the failure,
When a failure occurs in any of the plurality of physical disks, based on the failure history managed by the failure history management unit, a failure having the same failure content as the failed failure has occurred. It is determined whether the physical disk of the same product type as the physical disk is likely to recur, and if it is determined that there is a high possibility of recurring, the physical disk of the same product type as the failed physical disk is determined. An array rank changing unit for changing the configuration of the array rank as a component to a configuration more reliable than the current configuration is provided.
[0016]
Further, a third disk array device according to the present invention, in the second disk array device,
A change policy information storage unit that stores change policy information indicating how to change the current array rank configuration; and
The array rank changing unit, based on the current configuration of the array rank being the configuration change target and the change policy information stored in the change policy information storage unit, the array rank change target of the array change It has a feature of changing the configuration.
[0017]
A fourth disk array device according to the present invention is the third disk array device,
The change policy information storage unit stores a plurality of array rank configurations having different reliability.
The array rank changing unit sets the configuration of the array rank that is the configuration change target to be more than the current configuration of the array rank that is the configuration target among the configurations stored in the change policy information storage unit. It is characterized by having a configuration for changing to a configuration having one rank reliability.
[0018]
A fifth disk array device according to the present invention is the fourth disk array device,
A plurality of spare physical disks, and
The array rank changing unit uses the spare physical disk to configure an array rank that is one rank higher in reliability than the array rank to be changed, and configures the array rank to be changed. The present invention is characterized in that a normal physical disk in an element is changed to a spare physical disk.
[0019]
A sixth disk array device according to the present invention is the fifth disk array device,
In the change policy information storage unit, a configuration in which the RAID class is the same and the number of physical disks as constituent elements is one less is stored as a configuration having one rank reliability higher than that of a certain array rank. It is characterized by the following.
[0020]
A seventh disk array device according to the present invention is the sixth disk array device,
An array rank configuration information storage unit in which information indicating a physical disk configuring the array rank and a RAID class is stored for each array rank,
The array rank changing unit may change the array rank configuration by rewriting the contents of the array rank configuration information storage unit.
[0021]
Further, an eighth disk array device according to the present invention, in any one of the second to seventh disk array devices,
The failure history information managed by the failure history management unit is displayed on a display unit in response to a history reference request input by a user, and the failure history management unit is displayed in response to a history change request input by the user. A history information change / reference unit for changing the managed failure history information is provided.
[0022]
A ninth disk array device according to the present invention is the disk array device according to any one of the third to seventh aspects,
A change policy information stored in the change policy information storage unit is displayed on a display unit in response to a change policy reference request input by a user, and the change policy is displayed in response to a change policy change request input by a user. A change policy change / reference unit for changing the change policy information stored in the information storage unit is provided.
[0023]
[Action]
When a failure occurs in any of a plurality of physical disks constituting the disk array device, for example, based on a failure history, a failure having the same failure content as the failure has occurred. It is determined whether the physical disk of the same product type as the physical disk has a high possibility of recurrence. If it is determined that the possibility of recurrence is high, the configuration of the array rank, which includes a physical disk of the same product type as that of the failed physical disk, is changed to a configuration more reliable than the current configuration. change. As a configuration more reliable than the current configuration, for example, a configuration in which the RAID class is the same and the number of physical disks is one less can be adopted. In this way, since the failure is recovered in consideration of the product type of the failed physical disk, the details of the failure, and the configuration of the array rank, the risk of the failure recurring after the failure recovery is reduced. Can be.
[0024]
BEST MODE FOR CARRYING OUT THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0025]
FIG. 1 is a block diagram of one embodiment of the present invention, which comprises a
[0026]
The
[0027]
The
[0028]
The array rank configuration
[0029]
FIG. 2 shows an example of the contents of the array rank configuration
[0030]
The HDD status
[0031]
FIG. 3 shows an example of the contents of the HDD status
[0032]
The failure history
[0033]
FIG. 4 shows an example of the contents of the failure history
[0034]
The change policy information storage unit 105 stores a policy for changing the configuration of the array rank.
[0035]
FIG. 5 shows an example of the contents of the change policy information storage unit 105. As shown in the drawing, the change policy information storage unit 105 stores a phase number, a RAID class, and an HDD configuration. The configuration of the array rank is specified by the RAID class and the HDD configuration, and the smaller the phase number, the higher the reliability. The array rank configuration of the phase number “01” is a mirror configuration in which the same data is stored in two HDDs. The array rank configurations of the phase numbers “02” to “04” are all array rank configurations of the RAID class “RAID-5”, but the number of HDDs as constituent elements increases by one each time the phase number increases by one. I have. In other words, the smaller the phase number, the higher the reliability. These pieces of information are stored in the change policy information storage unit 105 from the
[0036]
The upper I /
[0037]
The
[0038]
The
[0039]
The failure history
[0040]
When a start instruction is input from the failure
[0041]
Description of operation of the embodiment
Next, the operation of this embodiment will be described in detail.
[0042]
First, the operation at the time of reading will be described.
[0043]
When reading data, the
[0044]
Upon receiving the read command, the
[0045]
Thereafter, the
[0046]
If it is "NORMAL", that is, if the HDD to be accessed is normal (YES in step S63), the
[0047]
On the other hand, if the status is “ABNORMAL”, that is, if a failure has occurred in the HDD to be accessed (NO in step S63), the
[0048]
Next, the operation at the time of writing will be described.
[0049]
When writing data, the
[0050]
Upon receiving the write command, the
[0051]
Thereafter, the
[0052]
If at least one of the current HDDs to be accessed is “ABNORMAL” (YES in step S 73), the write data sent from the
[0053]
On the other hand, if all the current states of the HDDs to be accessed are “NORMAL” (NO in step S73), the current state of the HDD storing the parity is referred to the HDD state
[0054]
If the current state of the HDD in which the parity is stored is “ABNORMAL” (YES in step S74), the
[0055]
On the other hand, when the current state of the HDD in which the parity is stored is “NORMAL” (NO in step S74), the write data sent from the host computer and the
[0056]
Next, the operation when the configuration of the array rank is changed will be described.
[0057]
Now, for example, it is assumed that a failure has occurred in the
[0058]
The failure
[0059]
When a start instruction is added from the failure
[0060]
Thereafter, the array rank changing unit 106 determines whether or not a failure having the same failure content as the failure (timeout) that has occurred this time is highly likely to recur in an HDD of the same product type as the
[0061]
If it is determined that the possibility of recurrence is low (NO in step S82), the array rank changing unit 106 ends the processing.
[0062]
On the other hand, when it is determined that the possibility of recurrence is high (YES in step S82), the HDD number of the HDD of the same product type as the failed
[0063]
Thereafter, the array rank changing unit 106 refers to the array rank configuration
[0064]
Further, the array rank changing unit 106 acquires the HDD number of the spare HDD by referring to the array rank configuration information storage unit 110 (Step S85). In this example, “11” to “15” are acquired as spare HDD numbers.
[0065]
Thereafter, the array rank changing unit 106 refers to the change policy information storage unit 105, and configures the array rank configuration that is one rank more reliable than the configuration of the array rank specified by the RAID class and the HDD configuration acquired in step S84. Is acquired (step S86). This processing will be described in detail below. First, the change policy information storage unit 105 is searched to find an entry in which the array rank configuration specified by the RAID class “RAID-5” and the HDD configuration “4D + 1P” acquired in step S84 is stored. In the case of this example, the entry of the phase number “04” is obtained. Thereafter, the RAID class “RAID-5” and the HDD configuration “3D + 1P” stored in the entry of the phase number “03” having one less phase number than the phase number “04” are acquired. The above is the details of the processing performed in step S86.
[0066]
After that, the array rank changing unit 106 uses the HDDs (four) of the number indicated by the HDD configuration “3D + 1P” obtained in step S86 among the
[0067]
The processing in step S87 will be described in detail below. First, an HDD used for the configuration change is selected from the
[0068]
Thereafter, the array rank changing unit 106 changes the configuration information of the array rank of the array rank number “02” whose configuration was changed this time, stored in the array rank configuration information storage unit 110 (step S88). In the case of this example, as shown in FIG. 9, the configuration information of the array rank having the array rank number “02” includes the RAID class “RAID-5”, the HDD configuration “3D + 1P”, and the components “11” and “12”. , “13”, and “14”. The address remains unchanged.
[0069]
In the above-described embodiment, when a failure occurs in the HDD, the array rank changing unit 106 immediately starts the processing shown in the flowchart of FIG. 8, but does not adversely affect the normal I / O operation. For this purpose, the processing shown in FIG. 8 may be executed when the load is relatively light. Further, in the above-described embodiment, the product type of the HDD is represented by the vendor, the product name, and the version. However, the present invention is not limited to this.
[0070]
Another Embodiment of the Invention
Next, another embodiment of the present invention will be described. This embodiment is characterized in that the failure history information stored in the failure history information storage unit can be referenced from the console, and the failure history information in the failure history information storage unit can be changed from the console.
[0071]
FIG. 10 is a block diagram of another embodiment of the present invention, which differs from the embodiment shown in FIG. 1 in that a disk array device 1a is provided instead of the
[0072]
The disk array device 1a is different from the
[0073]
The change policy change / reference unit 111 has a function of changing the change policy information stored in the change policy information storage unit 105 in accordance with a change policy change request input by the user using the console 4, or the user using the console 4. It has a function of reading a change policy from the change policy information storage unit 105 in accordance with the input change policy reference request and displaying the read change policy on a display unit (not shown) of the console 4.
[0074]
The history information change / reference unit 112 has a function of changing the failure history information stored in the failure history
[0075]
Next, the operation of this embodiment will be described. Since the operations other than the change policy change / reference unit 111 and the history information change / reference unit 112 are the same as those in the embodiment shown in FIG. 1, here, the change policy change / reference unit 111 and the history information change / reference unit are used. Only the operation of 112 will be described.
[0076]
When the user wants to refer to the change policy information stored in the change policy information storage unit 105, he inputs a change policy reference request using the console 4. When the change policy reference request is input, the change policy change / reference unit 111 reads the change policy information from the change policy information storage unit 105 and displays it on the display unit of the console 4.
[0077]
When changing the change policy information stored in the change policy information storage unit 105, the user inputs a change policy change request including the changed change policy information from the console 4. When a change policy change request is input, the change policy change / reference unit 111 replaces the contents of the change policy information storage unit 105 with the change policy information included therein.
[0078]
When the user wants to refer to the failure history information stored in the failure history
[0079]
When the user wants to change the failure history information stored in the failure history
[0080]
As described above, in the present embodiment, the failure history information can be referred to or changed from an external console. For example, the failure history information stored in the failure history
[0081]
【The invention's effect】
As described above, the disk array device of the present invention is provided with the array rank changing unit that recovers the failure in consideration of the product type of the failed physical disk, the content of the failure, and the array rank configuration. Thus, it is possible to reduce the risk that the failure will recur after the recovery from the failure.
[0082]
Also, after the failure is recovered by the array rank changing unit, the reliability of the array rank becomes higher than before the recovery from the failure. Therefore, even if a failure occurs on one physical disk after that, the failure is transferred to another physical disk. The risk of a worst-case situation in which a failure occurs and data in the array rank is lost can be extremely reduced.
[0083]
Further, since the disk array device of the present invention includes the history information change / reference unit, it is possible to set the failure history information of a certain disk array device in another disk array device. As a result, in the other disk array device, it is possible to change the configuration of the array rank at a more appropriate time.
[0084]
Further, since the disk array device of the present invention includes the change policy change / reference unit, it is possible to easily check whether the change policy information is suitable for the usage environment of the disk array device, and to change the change policy information. The information can be easily changed to one suitable for the use environment of the disk array device. .
[Brief description of the drawings]
FIG. 1 is a block diagram of one embodiment of the present invention.
FIG. 2 is a diagram showing an example of the contents of an array rank configuration
FIG. 3 is a diagram showing an example of the contents of an HDD status
FIG. 4 is a diagram illustrating an example of contents of a failure history
FIG. 5 is a diagram illustrating an example of contents of a change policy information storage unit 105;
FIG. 6 is a flowchart showing a processing example at the time of reading.
FIG. 7 is a flowchart illustrating an example of a write process;
FIG. 8 is a flowchart showing a processing example of an array rank changing unit 106;
FIG. 9 is a diagram showing an example of the contents of an array rank configuration
FIG. 10 is a block diagram of another embodiment of the present invention.
FIG. 11 is a diagram showing a configuration example of an array rank.
FIG. 12 is a diagram for explaining read access and write access when a failure occurs in an HDD.
[Explanation of symbols]
1, 1a: Disk array device
101: Upper I / F control unit
102: Array control unit
103 ... HDD control unit
104: HDD group
105: Change policy information storage unit
106: Array rank changing unit
107: HDD status information storage unit
108: Failure history management unit
109: Failure history information storage unit
110: Array rank configuration information storage unit
111: Change policy change / reference section
112: History information change / reference section
2. Host computer
3 High-order I / F
4. Console
Claims (9)
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更するアレイランク変更部を備えたことを特徴とするディスクアレイ装置。In a disk array device having a plurality of physical disks, a failure history management unit that manages a failure history including a product type of the failed physical disk and the failure content of the failure,
When a failure occurs in any of the plurality of physical disks, based on the failure history managed by the failure history management unit, a failure having the same failure content as the failed failure has occurred. It is determined whether the physical disk of the same product type as the physical disk is likely to recur, and if it is determined that there is a high possibility of recurring, the physical disk of the same product type as the failed physical disk is determined. What is claimed is: 1. A disk array device comprising: an array rank changing unit configured to change a configuration of an array rank as a constituent element to a configuration more reliable than a current configuration.
現時点のアレイランク構成をどのように変更するのかを示す変更ポリシー情報が格納された変更ポリシー情報記憶部を備え、且つ、
前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている変更ポリシー情報とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有することを特徴とするディスクアレイ装置。The disk array device according to claim 2,
A change policy information storage unit that stores change policy information indicating how to change the current array rank configuration; and
The array rank changing unit, based on the current configuration of the array rank being the configuration change target and the change policy information stored in the change policy information storage unit, the array rank change target of the array change A disk array device having a configuration for changing the configuration.
前記変更ポリシー情報記憶部には、信頼性の異なるアレイランクの構成が複数格納されており、
前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とするディスクアレイ装置。The disk array device according to claim 3,
The change policy information storage unit stores a plurality of array rank configurations having different reliability.
The array rank changing unit sets the configuration of the array rank that is the configuration change target to be more than the current configuration of the array rank that is the configuration target among the configurations stored in the change policy information storage unit. A disk array device having a configuration for changing to a configuration having one rank higher reliability.
スペアの物理ディスクを複数備え、且つ、
前記アレイランク変更部が、前記スペアの物理ディスクを用いて、前記構成変更対象にしているアレイランクよりも1ランク信頼性の高いアレイランクを構成し、前記構成変更対象にしているアレイランクの構成要素中の正常な物理ディスクをスペアの物理ディスクに変更する構成を有することを特徴とするディスクアレイ装置。The disk array device according to claim 4,
A plurality of spare physical disks, and
The array rank changing unit uses the spare physical disk to configure an array rank that is one rank higher in reliability than the array rank to be changed, and configures the array rank to be changed. A disk array device having a configuration in which a normal physical disk in an element is changed to a spare physical disk.
前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とするディスクアレイ装置。The disk array device according to claim 5,
In the change policy information storage unit, a configuration in which the RAID class is the same and the number of physical disks as constituent elements is one less is stored as a configuration having one rank reliability higher than that of a certain array rank. A disk array device characterized by the above-mentioned.
アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とするディスクアレイ装置。The disk array device according to claim 6,
An array rank configuration information storage unit in which information indicating a physical disk configuring the array rank and a RAID class is stored for each array rank,
A disk array device, wherein the array rank changing unit changes the array rank configuration by rewriting the contents of the array rank configuration information storage unit.
ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とするディスクアレイ装置。The disk array device according to any one of claims 2 to 7,
The failure history information managed by the failure history management unit is displayed on a display unit in response to a history reference request input by a user, and the failure history management unit is displayed in response to a history change request input by the user. A disk array device comprising a history information change / reference unit for changing managed failure history information.
ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を変更する変更ポリシー変更/参照部を備えたことを特徴とするディスクアレイ装置。The disk array device according to any one of claims 3 to 7,
A change policy information stored in the change policy information storage unit is displayed on a display unit in response to a change policy reference request input by a user, and the change policy is displayed in response to a change policy change request input by a user. A disk array device comprising a change policy change / reference unit for changing change policy information stored in an information storage unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003000849A JP4158525B2 (en) | 2003-01-07 | 2003-01-07 | Disk array device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003000849A JP4158525B2 (en) | 2003-01-07 | 2003-01-07 | Disk array device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004213441A true JP2004213441A (en) | 2004-07-29 |
JP4158525B2 JP4158525B2 (en) | 2008-10-01 |
Family
ID=32819020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003000849A Expired - Fee Related JP4158525B2 (en) | 2003-01-07 | 2003-01-07 | Disk array device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4158525B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7500136B2 (en) | 2006-06-05 | 2009-03-03 | International Business Machines Corporation | Replacing member disks of disk arrays with spare disks |
JP2012014531A (en) * | 2010-07-01 | 2012-01-19 | Fujitsu Ltd | Storage device, controller of storage device and control method for storage device |
US8914577B2 (en) | 2009-02-12 | 2014-12-16 | Fujitsu Limited | Disk array control apparatus |
-
2003
- 2003-01-07 JP JP2003000849A patent/JP4158525B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7500136B2 (en) | 2006-06-05 | 2009-03-03 | International Business Machines Corporation | Replacing member disks of disk arrays with spare disks |
US8914577B2 (en) | 2009-02-12 | 2014-12-16 | Fujitsu Limited | Disk array control apparatus |
JP2012014531A (en) * | 2010-07-01 | 2012-01-19 | Fujitsu Ltd | Storage device, controller of storage device and control method for storage device |
Also Published As
Publication number | Publication date |
---|---|
JP4158525B2 (en) | 2008-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106933708B (en) | Method and device for facilitating storage system recovery and storage system | |
US8171379B2 (en) | Methods, systems and media for data recovery using global parity for multiple independent RAID levels | |
JP4901316B2 (en) | Storage system and storage control device | |
US6892276B2 (en) | Increased data availability in raid arrays using smart drives | |
US10324810B2 (en) | Method and apparatus for redundant array of independent disks with raid metadata and sub-raid metadata stored using different raid algorithms | |
US7093069B2 (en) | Integration of a RAID controller with a disk drive module | |
US20050229033A1 (en) | Disk array controller and information processing apparatus | |
US20080172571A1 (en) | Method and system for providing backup storage capacity in disk array systems | |
US9081697B2 (en) | Storage control apparatus and storage control method | |
EP3244315B1 (en) | Method and apparatus for performing data recovery in redundant storage system | |
JP4324088B2 (en) | Data replication control device | |
JP2004038290A (en) | Information processing system and disk control method for use in same system | |
JP2010072979A (en) | Storage controller and data erasing method for storage device | |
WO2019097360A1 (en) | Machine learning to enhance redundant array of independent disks rebuilds | |
US20070294476A1 (en) | Method For Representing Foreign RAID Configurations | |
JP4454299B2 (en) | Disk array device and maintenance method of disk array device | |
WO2013080299A1 (en) | Data management device, data copy method, and program | |
US9280431B2 (en) | Prioritizing backups on a disk level within enterprise storage | |
US7457990B2 (en) | Information processing apparatus and information processing recovery method | |
US20030163757A1 (en) | RAID subsystem and data input/output and recovery method in disk error mode | |
JP4158525B2 (en) | Disk array device | |
US20190354433A1 (en) | Parity log with by-pass | |
US11055190B1 (en) | System and method for facilitating storage system operation with global mapping to provide maintenance without a service interrupt | |
US8356230B2 (en) | Apparatus to manage data stability and methods of storing and recovering data | |
CN114968630A (en) | Failed die management method for improving storage device availability |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061201 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070821 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070919 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070919 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20070920 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080415 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080430 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080624 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080707 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110725 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130725 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |