JP4158525B2 - ディスクアレイ装置 - Google Patents

ディスクアレイ装置 Download PDF

Info

Publication number
JP4158525B2
JP4158525B2 JP2003000849A JP2003000849A JP4158525B2 JP 4158525 B2 JP4158525 B2 JP 4158525B2 JP 2003000849 A JP2003000849 A JP 2003000849A JP 2003000849 A JP2003000849 A JP 2003000849A JP 4158525 B2 JP4158525 B2 JP 4158525B2
Authority
JP
Japan
Prior art keywords
configuration
array
rank
change
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003000849A
Other languages
English (en)
Other versions
JP2004213441A (ja
Inventor
和敏 本尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003000849A priority Critical patent/JP4158525B2/ja
Publication of JP2004213441A publication Critical patent/JP2004213441A/ja
Application granted granted Critical
Publication of JP4158525B2 publication Critical patent/JP4158525B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、複数の物理ディスクを有するディスクアレイ装置に関し、特に、ディスクアレイ装置の信頼性を向上させる技術に関する。
【0002】
【従来の技術】
ディスクアレイ装置は、物理ディスクであるハードディスクドライブ(HDD)の大容量化により、数十TB(テラバイト)を有する規模になってきている。現在、一台のハードディスクの記憶容量は100GB(ギガバイト)を越えるレベルに達しており、今後もますます大容量化が図られると考えられる。これに伴い、ディスクアレイ装置も大容量になると思われる。
【0003】
ところで、ディスクアレイ装置の特徴の1つとして、アレイランクを構成する複数のHDDの内の1台に障害が発生した場合、アレイランク内の他の正常なHDDを使用してデータアクセスを継続できる点が挙げられる。
【0004】
この点について、図11及び図12を参照して説明する。今、アレイランクが、図11に示すように4台のHDD01〜04によって構成されているとする。また、データDが3つのデータD1〜D3に3分割されてHDD01〜03に格納され、データD1〜D3の冗長データであるパリティPがHDD04に格納されているとする。このような構成を有するアレイランクにおいて、図12に示すように、HDD03に障害が発生したとする。
【0005】
HDD03に障害が発生した後、その障害が復旧する前に、ホストコンピュータからHDD03に格納されているデータD3に対するリード指令が出力された場合は、アレイランク内の正常なHDD01,02,04からデータD1,D2及びパリティPを読み出し、それに基づいてデータD3を復元し、ホストコンピュータに転送する。
【0006】
また、障害復旧前にホストコンピュータからHDD03に対してライト指令が出力された場合には、新たなパリティP'を生成し、それをHDD04に書き込む。また、ホストコンピュータから正常なHDD(例えば、HDD01とする)に対するライト指令が出力された場合には、新たなデータD1'をHDD01に書き込むと共に、新たなパリティP'を生成し、HDD04に書き込む。
【0007】
以上のように、ディスクアレイ装置においては、アレイランクを構成する複数のHDDの内の1つに障害が発生しても、他の正常なHDDを使用してデータアクセスを継続することができる。
【0008】
また、障害の発生したHDD03が交換された場合、或いは予めスペアHDDが用意されている場合には、障害復旧処理が行われる。障害復旧処理では、正常なHDD01,02,04に格納されているデータD1,D2及びパリティPに基づいてデータD3を復元し、復元したデータD3をスペアHDD或いは交換されたHDDに書き戻す。
【0009】
上記した障害復旧処理は、従来一般的に行われているものであるが、これ以外にも、複数のドライブに構成される記憶領域を複数のボリュームに分割し、障害発生時には、アクセス頻度の高いボリュームから優先的に、障害ドライブに格納されているデータをスペアドライブに復旧するようにした技術や(例えば、特許文献1参照)、HDDに障害が発生した時、複数の論理ディスクの内の優先論理ディスクについては、障害の発生したHDDに格納されているデータを不揮発性の半導体メモリ上に復元するようにした技術(例えば、特許文献2参照)も知られている。
【0010】
上述した従来の技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他のHDD上に復元する技術であり、アレイランクの構成を変更するものではない。なお、アレイランクの構成を変更する技術としては、ライトデータ量に応じてRAIDクラスを変更する技術(例えば、特許文献3参照)や、ユーザがデータ保持部に保持されているアレイ構成情報を変更すると、ディスクインタフェース変更部がディスクインタフェース接続部に対して、アレイ制御部の配線とディスク装置群の配線との接続状態を、変更後のアレイ構成情報に応じたものにすることを指示する技術(例えば、特許文献4参照)が知られているが、復旧処理に関連するものではない。
【0011】
【特許文献1】
特開平11−24850号公報
【特許文献2】
特開2001−175423号公報
【特許文献3】
特開平6−187249号公報
【特許文献4】
特開2000−298557号公報
【0012】
【発明が解決しようとする課題】
上述したように、従来、一般的に行われている障害復旧処理や、特許文献1,2に記載されている技術は、障害の発生したHDDに格納されていたデータを、スペアHDD等の他の物理ディスク上に復元するだけであり、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮していないため、障害復旧後に再び障害が発生する可能性が高いという問題がある。
【0013】
そこで、本発明の目的は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害復旧を行うことにより、障害が再発する危険性を少なくすることにある。
【0014】
【課題を解決するための手段】
本発明にかかる第1のディスクアレイ装置は、上記目的を達成するため、
複数の物理ディスクを有するディスクアレイ装置において、
障害の発生した物理ディスクの製品種別と前記障害の障害内容とを含む障害履歴を管理する障害履歴管理部と、
複数のスペア用の物理ディスクと、
前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害が発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、前記スペア用の物理ディスクを使用して、現時点の構成よりも信頼性の高い構成に変更すると共に、構成変更前のアレイランクのデータを構成変更後のアレイランクに書き込むアレイランク変更部を備えたことを特徴とする。
【0016】
また、本発明にかかる第のディスクアレイ装置は、第のディスクアレイ装置において、
現時点のアレイランク構成をどのように変更するのかを示す変更ポリシー情報が格納された変更ポリシー情報記憶部を備え、且つ、
前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている変更ポリシー情報とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有することを特徴とする。
【0017】
また、本発明にかかる第のディスクアレイ装置は、第のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、信頼性の異なるアレイランクの構成が複数格納されており、
前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とする。
【0019】
また、本発明にかかる第のディスクアレイ装置は、第のディスクアレイ装置において、
前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とする。
【0020】
また、本発明にかかる第のディスクアレイ装置は、第のディスクアレイ装置において、
アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とする。
【0021】
また、本発明にかかる第のディスクアレイ装置は、第〜第の何れか1つのディスクアレイ装置において、
ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とする。
【0022】
また、本発明にかかる第のディスクアレイ装置は、第〜第記載の何れか1つのディスクアレイ装置において、
ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている変更ポリシー情報を変更する変更ポリシー変更/参照部を備えたことを特徴とする。
【0023】
【作用】
ディスクアレイ装置を構成している複数の物理ディスクの内の何れかに障害が発生したとき、例えば、障害履歴などに基づいて、上記発生した障害と同一障害内容の障害が、上記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定する。そして、再発する可能性が高いと判定した場合は、上記障害の発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する。現時点の構成よりも信頼性の高い構成としては、例えば、RAIDクラスが同一で、物理ディスク数が1台少ない構成を採用することができる。このように、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するようにしているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0024】
【発明の実施の形態】
次に本発明の実施の形態について図面を参照して詳細に説明する。
【0025】
図1は本発明の一実施例のブロック図であり、ディスクアレイ装置1と、ホストコンピュータ2と、両者を接続する上位I/F(上位インタフェース)3とから構成されている。
【0026】
ディスクアレイ装置1は、上位I/F制御部101と、アレイ制御部102と、HDD(ハードディスクドライブ)制御部103と、HDD群104と、変更ポリシー情報記憶部105と、アレイランク変更部106と、HDD状態情報記憶部107と、障害履歴管理部108と、障害履歴情報記憶部109と、アレイランク構成情報記憶部110とから構成されている。
【0027】
HDD群104は、15台のHDD01〜15から構成されており、各HDD01〜15にはそれぞれHDD番号「01」〜「15」が付与されている。また、HDD01〜05により、アレイランク番号「01」のアレイランクが構成され、HDD06〜10によりアレイ番号「02」のアレイランクが構成されている。アレイランク番号「01」,「02」のアレイランクは共にRAIDクラスが「RAID−5」のアレイランクであり、アレイランク番号「01」のアレイランクには、アドレス「A0」〜「A1」が割り当てられ、アレイランク番号「02」のアレイランクには、「アドレス(A1+1)」〜「A2」が割り当てられている。また、HDD11〜15は、スペアのHDDとなっている。
【0028】
アレイランク構成情報記憶部110には、HDD群104内に存在する各アレイランクの構成を示す情報や、各アレイランクに割り当てられているアドレスや、スペアのHDDを示す情報が格納されている。
【0029】
図2にアレイランク構成情報記憶部110の内容例を示す。同図に示すように、アレイランク構成情報記憶部110には、アレイランク番号と、RAIDクラスと、HDD構成と、構成要素とするHDDのHDD番号と、アドレスとが格納される。図2の例は、アレイランク番号「01」,「02」のアレイランクは、それぞれHDD番号「01」〜「05」,「06」〜「10」のHDD01〜05,06〜10によって構成され、RAIDクラスが共に「RAID−5」で、HDD構成が共に「4D+1P」で、割り当てられているアドレスがそれぞれ「A0」〜「A1」,「(A1+1)」〜「A2」であることを示している。更に、この例は、HDD番号「11」〜「15」のHDD11〜15は、スペアのHDDであることを示している。
【0030】
HDD状態情報記憶部107には、各HDD01〜15の製品種別や、各HDD01〜15の現在の状態を示す情報(「NORMAL」か「ABNORMAL」)や、障害内容が格納される。
【0031】
図3にHDD状態情報記憶部107の内容例を示す。同図に示すように、HDD状態情報記憶部107には、HDD番号と、ベンダーと、製品名と、バージョンと、現在の状態と、障害内容とが格納される。この例では、ベンダー,製品名及びバージョンによりHDDの製品種別を表すようにしている。また、図3の例は、HDD01〜05,11〜13がベンダー「NNN」,製品名「AAA」,バージョン「1.10」の製品で、HDD06〜10,14,15がベンダー「HHH」,製品名「BBB」,バージョン「2.00」の製品であることを示している。更に、図3の例は、HDD01〜15の内、HDD10にのみ障害内容「タイムアウト」の障害(ABNORMAL)が発生し、他のHDDは正常(NORMAL)であることを示している。
【0032】
障害履歴情報記憶部109には、HDD群104において発生した障害の履歴を示す情報が格納される。
【0033】
図4に障害履歴情報記憶部109の内容例を示す。同図に示すように、障害履歴情報記憶部109には、履歴番号と、ベンダーと、製品名と、バージョンと、障害内容とが格納される。図4の例は、ベンダー「NNN」,製品名「AAA」,バージョン「1.10」のHDDにおいて、「エラー訂正不可能なデータエラー」が過去に1回発生し、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」のHDDにおいて「タイムアウト」が過去に2回発生していることを示している。
【0034】
変更ポリシー情報記憶部105には、アレイランクの構成を変更する際のポリシーが格納されている。
【0035】
図5に変更ポリシー情報記憶部105の内容例を示す。同図に示すように、変更ポリシー情報記憶部105には、フェーズ番号と、RAIDクラスと、HDD構成とが格納される。RAIDクラスとHDD構成とによって、アレイランクの構成が特定されており、フェーズ番号が若いものほど信頼性の高い構成になっている。フェーズ番号「01」のアレイランク構成は、2台のHDDに同一データを格納したミラー構成である。フェーズ番号「02」〜「04」のアレイランク構成は共にRAIDクラス「RAID−5」のアレイランク構成であるが、構成要素であるHDDの台数はフェーズ番号が1つ増える毎に1台増えている。即ち、フェーズ番号が若いものほど、信頼性の高い構成となっている。これらの情報は、ホストコンピュータ2から上位I/F3,上位I/F制御部101を介して変更ポリシー情報記憶部105に格納される。
【0036】
上位I/F制御部101は、上位I/F3を介してホストコンピュータ2との間でデータ等をやり取りする機能を有する。
【0037】
アレイ制御部102は、上位I/F制御部101を介してホストコンピュータ2から送られてくるリード指令やライト指令に従ってHDD制御部103を制御することにより、HDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。
【0038】
HDD制御部103は、アレイ制御部102の制御に従ってHDD群104中の該当するHDDからデータを読み出したり、データを書き込む機能を有する。更に、HDD制御部103は、障害の発生したHDDを検出する機能や、障害の発生したHDDを検出した時、HDD状態情報記憶部107中の上記HDDの現在状態を「ABNORMAL」に変更すると共に障害内容を書き込む機能を有する。
【0039】
障害履歴情報管理部108は、HDD状態情報記憶部107を監視しており、現在の状態がABNORMALに変更されたHDDが発生した時、そのHDDのベンダー,製品名,バージョン及び障害内容を障害履歴情報記憶部109に追加登録する機能や、追加登録完了後にアレイランク変更部106に対して起動指示を出力する機能を有する。
【0040】
アレイランク変更部106は、障害履歴管理部108から起動指示が入力されると、障害履歴情報記憶部109の記憶内容に基づいて今回発生した障害と同一内容の障害が、今回障害の発生したHDDと同一製品種別のHDDにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判断した場合、変更ポリシー情報記憶部105の内容に基づいて上記製品種別のHDDを構成要素としているアレイランクの構成を、現時点の構成よりも信頼性の高い構成に変更する機能を有する。なお、構成の変更方法については、後で詳細に説明する。
【0041】
【実施例の動作の説明】
次に、本実施例の動作について詳細に説明する。
【0042】
先ず、リード時の動作について説明する。
【0043】
ホストコンピュータ2は、データのリード時、リード指令(アドレス,種別,サイズを含む)を出力する。このリード指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102に送られる。
【0044】
アレイ制御部102は、リード指令を受け取ると、アレイランク構成情報記憶部110に格納されている各アレイランクに割り当てられているアドレスに基づいて、最初にリードするデータが格納されているアクセス対象HDDを求める(図6、ステップS62)。
【0045】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「NORMAL」であるか否かを調べる(ステップS63)。
【0046】
そして、「NORMAL」である場合、即ちアクセス対象HDDが正常である場合(ステップS63がYES)は、HDD制御部103を制御してアクセス対象HDDからデータをリードし、ホストコンピュータ2へ転送する(ステップS64,S65)。
【0047】
これに対して、「ABNORMAL」である場合、即ちアクセス対象HDDに障害が発生している場合(ステップS63がNO)は、HDD制御部103を制御してアクセス対象HDDと同一アレイランク内の他の正常なHDDに格納されているデータをリードし、それらに基づいてアクセス対象HDDに格納されているデータを復元する(ステップS66,S67)。その後、復元したデータをホストコンピュータ2へ転送する。以上の処理をリード指令によって指令された全てのデータをリードするまで(ステップS61がYESとなるまで)繰り返し行う。
【0048】
次に、ライト時の動作について説明する。
【0049】
ホストコンピュータ2は、データライト時、ライト指令(アドレス,種別,サイズを含む)を出力する。このライト指令は、上位I/F3,上位I/F制御部101を介してアレイ制御部102へ送られる。
【0050】
アレイ制御部102は、ライト指令を受け取ると、アレイランク構成情報記憶部110に格納されている情報に基づいて、最初にデータをライトするアクセス対象HDDを求める(図7,ステップS72)。
【0051】
その後、アレイ制御部102は、HDD状態情報記憶部107を参照し、アクセス対象HDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS73)。
【0052】
そして、アクセス対象HDDの内の少なくとも1つの現在の状態が「ABNORMAL」である場合(ステップS73がYES)は、ホストコンピュータ2から送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP'を生成し、新たなパリティP'を該当するHDDに書き込むと共に、他の正常なHDDに対して該当するデータをライトする(ステップS75)。
【0053】
これに対して、アクセス対象HDDの現在の状態が全て「NORMAL」である場合は(ステップS73がNO)、HDD状態情報記憶部107を参照し、パリティが格納されているHDDの現在の状態が「ABNORMAL」であるか否かを調べる(ステップS74)。
【0054】
そして、パリティの格納されているHDDの現在の状態が「ABNORMAL」である場合(ステップS74がYES)は、HDD制御部103を制御し、アクセス対象HDDにホストコンピュータ2から送られてくるデータを書き込む(ステップS76)。
【0055】
これに対して、パリティの格納されているHDDの現在の状態が「NORMAL」である場合(ステップS74がNO)は、ホストコンピュータから送られてくるライトデータと、HDD制御部103を制御することにより読み込んだパリティPとから新たなパリティP'を生成する(ステップS77)。その後、ステップS77で生成した新たなパリティP'を該当するHDDに書き込むと共に、ホストコンピュータ2から送られてきたライトデータをアクセス対象HDDに書き込む(ステップS78)。以上の処理を、ライト指令によって指令されたデータを全て書き込むまで(ステップS71がYESとなるまで)、繰り返し行う。
【0056】
次に、アレイランクの構成変更時の動作について説明する。
【0057】
今、例えば、HDD番号「10」のHDD10に障害が発生したとする。HDD制御部103は、HDD10に障害が発生したことを検出すると、HDD状態情報記憶部107に格納されているHDD10の現在の状態を「NORMAL」から「ABNORMAL」に変更すると共に、障害内容(例えば、「タイムアウト」とする)を書き込む。この処理により、HDD状態情報記憶部107の内容は、図3に示すものとなる。
【0058】
障害履歴管理部108は、HDD状態情報記憶部107を監視しており、HDD番号「10」に対応する現在の状態が「ABNORMAL」になったことを検出すると、HDD番号「10」に対応するベンダー「HHH」,製品名「BBB」,バージョン「2.00」及び障害内容「タイムアウト」を障害履歴情報記憶部109に追加登録する。今、例えば、上記処理により、障害履歴情報記憶部109に履歴番号「00003」の履歴情報が追加登録され、障害履歴情報記憶部109の内容が図4に示すものになったとする。その後、障害履歴管理部108は、アレイランク変更部106に対して起動指示を出力する。
【0059】
アレイランク変更部106は、障害履歴管理部108から起動指示が加えられると、障害履歴情報記憶部109に格納されている障害履歴情報の内の、最も履歴番号が大きい障害履歴情報を参照し、障害の発生したHDD10の製品種別及び障害内容を認識する(図8,ステップS81)。この例の場合、アレイランク変更部106は、履歴番号「00003」の障害履歴情報を参照し、障害の発生したHDD10の製品種別が、ベンダー「HHH」,製品名「BBB」,バージョン「2.00」であることを認識すると共に、障害内容が「タイムアウト」であることを認識する。
【0060】
その後、アレイランク変更部106は、今回発生した障害(タイムアウト)と同一障害内容の障害が、今回障害の発生したHDD10と同一製品種別のHDDにおいて再発する可能性が高いか否かを判定する(ステップS82)。この判断は、例えば、次のようにして行う。先ず、障害履歴情報記憶部109を検索し、履歴番号が最も大きい障害履歴情報(この例では、履歴番号「00003」の障害履歴情報)と同一の製品種別および障害内容を含んでいる障害履歴情報の数を求める。その後、上記求めた障害履歴情報の数と予め定められている所定数とを比較する。そして、予め定められている所定数の方が小さい場合には、再発する可能性が高いと判定し、そうでない場合は再発する可能性が低いと判定する。
【0061】
そして、再発の可能性が低いと判定した場合(ステップS82がNO)は、アレイランク変更部106は、その処理を終了する。
【0062】
これに対して、再発の可能性が高いと判定した場合(ステップS82がYES)は、HDD状態情報記憶部107を参照し、障害の発生したHDD10と同一の製品種別のHDDのHDD番号を取得する(ステップS83)。この例の場合、HDD10と同一製品種別のHDDのHDD番号として「06」〜「09」,「14」,「15」が取得される。
【0063】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、障害の発生したHDD10及びHDD10と同一製品種別のHDD06〜09,14,15の内の何れかを構成要素にしているアレイランクのRAIDクラス及びHDD構成を取得する(ステップS84)。今、例えば、アレイランク構成情報記憶部110の内容が図2に示すものであるとすると、アレイランク番号「02」に対応して登録されているRAIDクラス「RAID−5」及びHDD構成「4D+1P」を取得することになる。
【0064】
更に、アレイランク変更部106は、アレイランク構成情報記憶部110を参照し、スペアのHDDのHDD番号を取得する(ステップS85)。この例の場合、スペアのHDD番号として「11」〜「15」を取得することになる。
【0065】
その後、アレイランク変更部106は、変更ポリシー情報記憶部105を参照し、ステップS84で取得したRAIDクラス及びHDD構成によって特定されるアレイランクの構成よりも、1ランク信頼性の高いアレイランクの構成を示すRAIDクラス及びHDD構成を取得する(ステップS86)。この処理を詳しく説明すると、次のようになる。先ず、変更ポリシー情報記憶部105を検索し、ステップS84で取得したRAIDクラス「RAID−5」,HDD構成「4D+1P」によって特定されるアレイランク構成が格納されているエントリを求める。この例の場合、フェーズ番号「04」のエントリが求められる。その後、上記フェーズ番号「04」よりも1つフェーズ番号が少ないフェーズ番号「03」のエントリに格納されているRAIDクラス「RAID−5」,HDD構成「3D+1P」を取得する。以上がステップS86で行う処理の詳細である。
【0066】
その後、アレイランク変更部106は、ステップS85でHDD番号を取得したスペアのHDD11〜15の内の、ステップS86で取得したHDD構成「3D+1P」によって示される台数分(4台)のHDDを使用して、アレイランクの構成を変更する(ステップS87)。
【0067】
このステップS87の処理を詳しく説明すると、次のようになる。先ず、スペアのHDD11〜15の中から、構成変更に使用するHDDを選択する。その際、障害の発生したHDDとは製品種別の異なるHDDを優先的に選択するようにする。今、例えば、構成変更に使用するHDDとしてHDD番号が「11」〜「14」のHDDを選択したとする。その後、アレイランク変更部106は、障害の発生したHDD10に格納されていたデータを、他の正常なHDD06〜09に格納されているデータに基づいて復元しながら、HDD06〜10を構成要素としているアレイランクに格納されていたデータをHDD11〜14を構成要素とするアレイランクに書き込む。その際、パリティを生成し、書き込む処理も行う。以上がステップS87で行う処理の詳細である。ここで、HDD数の少ないアレイランク構成に変更すると、構成変更前のアレイランクに格納されているデータ量によっては、データが溢れてしまい、構成変更後のアレイランクに全データを格納できなくなってしまう場合がある。このようなことを防ぐためには、例えば、各アレイランクに格納するデータ量を、フェーズ番号「01」のアレイランクに格納可能なデータ量に制限すれば良い。このようにするためには、例えば、各フェーズ番号のアレイランクに割り当てるアドレスのサイズを同一値とし、且つ、その値をフェーズ番号「01」のアレイランクが格納可能なデータ量に応じたものにすれば良い。
【0068】
その後、アレイランク変更部106は、アレイランク構成情報記憶部110に格納されている、今回構成変更を行ったアレイランク番号「02」のアレイランクの構成情報を変更する(ステップS88)。この例の場合、アレイランク番号が「02」のアレイランクの構成情報は、図9に示すように、RAIDクラス「RAID−5」,HDD構成「3D+1P」,構成要素「11」,「12」,「13」,「14」に変更される。アドレスは、元のままである。
【0069】
なお、上述した実施例においては、HDDに障害が発生した場合、アレイランク変更部106が直ちに図8の流れ図に示す処理を開始するようにしたが、通常のI/O動作に悪影響を与えないようにするために、比較的負荷の軽いときに、図8に示す処理を実行するようにしても良い。また、上述した実施例においては、HDDの製品種別をベンダー,製品名およびバージョンにより表すようにしたが、これに限られるものではない。
【0070】
【発明の他の実施例】
次に、本発明の他の実施例について説明する。本実施例は、障害履歴情報記憶部に格納されている障害履歴情報をコンソールから参照可能にすると共に、コンソールから障害履歴情報記憶部の障害履歴情報を変更可能にしたことを特徴とする。
【0071】
図10は本発明の他の実施例のブロック図であり、図1に示した実施例との相違点は、ディスクアレイ装置1の代わりにディスクアレイ装置1aを備えている点およびコンソール4が追加されている点である。
【0072】
ディスクアレイ装置1aは、変更ポリシー変更/参照部111および履歴情報変更/参照部112を備えている点が図1に示したディスクアレイ装置1と相違している。
【0073】
変更ポリシー変更/参照部111は、ユーザがコンソール4を用いて入力する変更ポリシー変更要求に従って変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する機能や、ユーザがコンソール4を用いて入力する変更ポリシー参照要求に従って変更ポリシー情報記憶部105から変更ポリシーを読み出し、それをコンソール4の表示部(図示せず)に表示する機能を有する。
【0074】
履歴情報変更/参照部112は、ユーザがコンソール4を用いて入力する履歴情報変更要求に従って障害履歴情報記憶部109に格納されている障害履歴情報を変更する機能や、ユーザがコンソール4を用いて入力する履歴情報参照要求に従って障害履歴情報記憶部109から障害履歴情報を読み出し、コンソール4の表示部に表示する機能を有する。
【0075】
次に本実施例の動作について説明する。尚、変更ポリシー変更/参照部111及び履歴情報変更/参照部112以外の動作は図1に示した実施例と同じであるので、ここでは変更ポリシー変更/参照部111及び履歴情報変更/参照部112の動作についてのみ説明する。
【0076】
ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を参照したい場合、コンソール4を用いて変更ポリシー参照要求を入力する。変更ポリシー変更/参照部111は、変更ポリシー参照要求が入力されると、変更ポリシー情報記憶部105から変更ポリシー情報を読み出し、コンソール4の表示部に表示する。
【0077】
また、ユーザは、変更ポリシー情報記憶部105に格納されている変更ポリシー情報を変更する場合には、変更後の変更ポリシー情報を含んだ変更ポリシー変更要求をコンソール4から入力する。変更ポリシー変更/参照手段111は、変更ポリシー変更要求が入力されると、それに含まれている変更ポリシー情報で変更ポリシー情報記憶部105の内容を置き換える。
【0078】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を参照したい場合、履歴参照要求をコンソール4から入力する。履歴情報変更/参照部112は、履歴参照要求が入力されると、障害履歴情報記憶部109から障害履歴情報を読み出し、それをコンソール4の表示部に表示する。
【0079】
また、ユーザは、障害履歴情報記憶部109に格納されている障害履歴情報を変更したい場合には、変更後の履歴情報を含んだ履歴設定要求をコンソール4から入力する。履歴情報変更/参照手段112は、履歴設定要求が入力されると、それに含まれている障害履歴情報で障害履歴情報記憶部109の内容を置き換える。
【0080】
このように、本実施例では、障害履歴情報を外部にあるコンソールから参照したり、変更できるので、例えば、稼働中のディスクアレイ装置内の障害履歴情報記憶部109に格納されている障害履歴情報を収集し、収集した障害履歴情報を、例えば、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置の障害履歴情報記憶部109に格納するといったことが可能になる。このようにすることにより、使用を開始しようとしているディスクアレイ装置等の他のディスクアレイ装置において、より適切な時期にアレイランクの構成変更が行えるようになる。また、変更ポリシー情報の変更/参照も可能となっているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。
【0081】
【発明の効果】
以上説明したように、本発明のディスクアレイ装置は、障害の発生した物理ディスクの製品種別や、障害内容や、アレイランクの構成を考慮して障害を復旧するアレイランク変更部を備えているので、障害復旧後に障害が再発する危険性を少なくすることができる。
【0082】
また、アレイランク変更部により障害を復旧した後は、アレイランクの信頼性が障害復旧前よりも高くなるので、それ以後に1つの物理ディスクに障害が発生したとしても、更に別の物理ディスクに障害が発生し、アレイランク内のデータが失われてしまうといった最悪の事態が発生する危険性を極めて少なくすることができる。
【0083】
また、本発明のディスクアレイ装置は、履歴情報変更/参照部を備えているので、或るディスクアレイ装置の障害履歴情報を他のディスクアレイ装置に設定することが可能になる。その結果、上記他のディスクアレイ装置において、より適切な時期にアレイランクの構成を変更することが可能になる。
【0084】
また、本発明のディスクアレイ装置は、変更ポリシー変更/参照部を備えているので、変更ポリシー情報がディスクアレイ装置の利用環境に合っているか否かを容易にチェックすることができると共に、変更ポリシー情報をディスクアレイ装置の利用環境に合ったものに容易に変更することができる。。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】アレイランク構成情報記憶部110の内容例を示す図である。
【図3】HDD状態情報記憶部107の内容例を示す図である。
【図4】障害履歴情報記憶部109の内容例を示す図である。
【図5】変更ポリシー情報記憶部105の内容例を示す図である。
【図6】リード時の処理例を示す流れ図である。
【図7】ライト時の処理例を示す流れ図である。
【図8】アレイランク変更部106の処理例を示す流れ図である。
【図9】アレイランクの構成を変更した後のアレイランク構成情報記憶部110の内容例を示す図である。
【図10】本発明の他の実施例のブロック図である。
【図11】アレイランクの構成例を示した図である。
【図12】HDDに障害が発生したときの、リードアクセス,ライトアクセスを説明するための図である。
【符号の説明】
1,1a…ディスクアレイ装置
101…上位I/F制御部
102…アレイ制御部
103…HDD制御部
104…HDD群
105…変更ポリシー情報記憶部
106…アレイランク変更部
107…HDD状態情報記憶部
108…障害履歴管理部
109…障害履歴情報記憶部
110…アレイランク構成情報記憶部
111…変更ポリシー変更/参照部
112…履歴情報変更/参照部
2…ホストコンピュータ
3…上位I/F
4…コンソール

Claims (5)

  1. 複数の物理ディスクを有するディスクアレイ装置において、
    障害の発生した物理ディスクの製品種別と前記障害の障害内容とを含む障害履歴を管理する障害履歴管理部と、
    複数のスペア用の物理ディスクと、
    前記複数の物理ディスクの内の何れかに障害が発生したとき、前記障害履歴管理部で管理されている障害履歴に基づいて、前記発生した障害と同一障害内容の障害が、前記障害の発生した物理ディスクと同一製品種別の物理ディスクにおいて再発する可能性が高いか否かを判定し、再発する可能性が高いと判定した場合は、前記障害が発生した物理ディスクと同一製品種別の物理ディスクを構成要素としているアレイランクの構成を、前記スペア用の物理ディスクを使用して、現時点の構成よりも信頼性の高い構成に変更すると共に、構成変更前のアレイランクのデータを構成変更後のアレイランクに書き込むアレイランク変更部とを備え、
    前記ディスクアレイ装置において構成可能な信頼性の異なるアレイランクの構成が複数格納されている変更ポリシー情報記憶部を備え、且つ、
    前記アレイランク変更部が、構成変更対象にしているアレイランクの現時点の構成と、前記変更ポリシー情報記憶部に格納されている前記信頼性の異なるアレイランクの構成とに基づいて、前記構成変更対象にしているアレイランクの構成を変更する構成を有し、
    前記信頼性の異なるアレイランクの構成は、物理ディスク構成と当該物理ディスク構成に対応するRAIDクラスとを含み、
    前記アレイランク変更部が、構成変更対象にしているアレイランクの構成を、前記変更ポリシー情報記憶部に格納されている各構成の内の、前記構成対象にしているアレイランクの現時点の構成よりも1ランク信頼性が高い構成に変更する構成を有することを特徴とするディスクアレイ装置。
  2. 請求項1記載のディスクアレイ装置において、
    前記変更ポリシー情報記憶部には、或るアレイランクの構成よりも1ランク信頼性が高い構成として、RAIDクラスが同一で、構成要素とする物理ディスクの台数が1台少ない構成が格納されていることを特徴とするディスクアレイ装置。
  3. 請求項2記載のディスクアレイ装置において、
    アレイランク毎に、そのアレイランクを構成する物理ディスクを示す情報及びRAIDクラスが格納されたアレイランク構成情報記憶部を備え、
    前記アレイランク変更部が、前記アレイランク構成情報記憶部の内容を書き換えることによりアレイランクの構成を変更する構成を有することを特徴とするディスクアレイ装置。
  4. 請求項1乃至3の何れか1項に記載のディスクアレイ装置において、 ユーザによって入力される履歴参照要求に応答して前記障害履歴管理部で管理されている障害履歴情報を表示部に表示し、ユーザによって入力される履歴変更要求に応答して前記障害履歴管理部が管理している障害履歴情報を変更する履歴情報変更/参照部を備えたことを特徴とするディスクアレイ装置。
  5. 請求項1乃至3の何れか1項に記載のディスクアレイ装置において、 ユーザによって入力される変更ポリシー参照要求に応答して前記変更ポリシー情報記憶部に格納されている前記信頼性の異なるアレイランクの構成を表示部に表示し、ユーザによって入力される変更ポリシー変更要求に応答して前記変更ポリシー情報記憶部に格納されている前記信頼性の異なるアレイランクの構成を変更する変更ポリシー変更/参照部を備えたことを特徴とするディスクアレイ装置。
JP2003000849A 2003-01-07 2003-01-07 ディスクアレイ装置 Expired - Fee Related JP4158525B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003000849A JP4158525B2 (ja) 2003-01-07 2003-01-07 ディスクアレイ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003000849A JP4158525B2 (ja) 2003-01-07 2003-01-07 ディスクアレイ装置

Publications (2)

Publication Number Publication Date
JP2004213441A JP2004213441A (ja) 2004-07-29
JP4158525B2 true JP4158525B2 (ja) 2008-10-01

Family

ID=32819020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003000849A Expired - Fee Related JP4158525B2 (ja) 2003-01-07 2003-01-07 ディスクアレイ装置

Country Status (1)

Country Link
JP (1) JP4158525B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7500136B2 (en) 2006-06-05 2009-03-03 International Business Machines Corporation Replacing member disks of disk arrays with spare disks
JP4842334B2 (ja) 2009-02-12 2011-12-21 富士通株式会社 ディスクアレイ制御装置
JP5663981B2 (ja) * 2010-07-01 2015-02-04 富士通株式会社 ストレージ装置、ストレージ装置のコントローラおよびストレージ装置の制御方法

Also Published As

Publication number Publication date
JP2004213441A (ja) 2004-07-29

Similar Documents

Publication Publication Date Title
JP4901316B2 (ja) ストレージシステム及び記憶制御装置
US7574623B1 (en) Method and system for rapidly recovering data from a “sick” disk in a RAID disk group
US6892276B2 (en) Increased data availability in raid arrays using smart drives
US7975171B2 (en) Automated file recovery based on subsystem error detection results
EP3244315B1 (en) Method and apparatus for performing data recovery in redundant storage system
US20050229033A1 (en) Disk array controller and information processing apparatus
US9081697B2 (en) Storage control apparatus and storage control method
JP4324088B2 (ja) データ複製制御装置
US8275959B2 (en) Failover control of dual controllers in a redundant data storage system
JP2004038290A (ja) 情報処理システムおよび同システムで用いられるディスク制御方法
US20080082525A1 (en) File storage system, file storing method and file searching method therein
JP2007334593A (ja) Raidコントローラおよびraid装置
JP2006139478A (ja) ディスクアレイシステム
US20190354452A1 (en) Parity log with delta bitmap
JP4454299B2 (ja) ディスクアレイ装置及びディスクアレイ装置の保守方法
US20100275066A1 (en) Identifying a storage device as faulty for a first storage volume without identifying the storage device as faulty for a second storage volume
WO2013080299A1 (ja) データ管理装置、データコピー方法、およびプログラム
US9280431B2 (en) Prioritizing backups on a disk level within enterprise storage
JP4158525B2 (ja) ディスクアレイ装置
US20030163757A1 (en) RAID subsystem and data input/output and recovery method in disk error mode
US10664346B2 (en) Parity log with by-pass
US11055190B1 (en) System and method for facilitating storage system operation with global mapping to provide maintenance without a service interrupt
US8356230B2 (en) Apparatus to manage data stability and methods of storing and recovering data
CN114968630A (zh) 提高存储设备可用性的故障管芯管理方法
JP6318769B2 (ja) ストレージ制御装置、制御プログラム、および制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061201

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070919

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20070920

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20071024

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080415

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080430

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080707

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120725

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130725

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees