JP5032620B2 - ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法 - Google Patents

ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法 Download PDF

Info

Publication number
JP5032620B2
JP5032620B2 JP2010059796A JP2010059796A JP5032620B2 JP 5032620 B2 JP5032620 B2 JP 5032620B2 JP 2010059796 A JP2010059796 A JP 2010059796A JP 2010059796 A JP2010059796 A JP 2010059796A JP 5032620 B2 JP5032620 B2 JP 5032620B2
Authority
JP
Japan
Prior art keywords
logical
extent
physical
array
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010059796A
Other languages
English (en)
Other versions
JP2011192202A (ja
Inventor
和総 友永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2010059796A priority Critical patent/JP5032620B2/ja
Publication of JP2011192202A publication Critical patent/JP2011192202A/ja
Application granted granted Critical
Publication of JP5032620B2 publication Critical patent/JP5032620B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明の一態様は、第1及び第2のアレイがそれぞれ有する物理領域を複数の物理エクステントに分割して管理し、前記複数の物理エクステントのうちの1つ以上の第1の物理エクステントを第1の論理ディスクの1つ以上の第1の論理エクステントに割り当て、前記複数の物理エクステントのうちの1つ以上の第2の物理エクステントを、前記1つ以上の第1の論理ディスクのデータがコピーされるべき、第2の論理ディスクの1つ以上の第2の論理エクステントに割り当てるディスクアレイ装置に係り、特に論理エクステントへの物理エクステントの再割り当てにより論理ディスクを再構成するディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法に関する。
一般に、ディスクアレイ装置は、1つ以上のディスク装置、例えば複数のハードディスクドライブ(HDD:Hard Disk Drive)と、これらのHDDと接続されたアレイコントローラとを備えている。アレイコントローラは、一般に知られる例えばRAID(Redundant Arrays of Inexpensive DisksまたはRedundant Arrays of Independent Disks)の手法により複数のHDDを管理する。つまり、アレイコントローラは、ホスト装置(ホスト計算機)からのデータ読み出し/書き込み要求に対し、接続された複数のHDDを並列に動かしてデータの読み出し/書き込みを分散して実行することでアクセスの高速化を図ると共に、冗長構成によって信頼性の向上を図っている。
ディスクアレイ装置は、上記した複数のHDD(または1つ以上のHDD)の記憶領域が連続した1つの領域として定義されるアレイ(ディスクアレイ)を含む。また、ディスクアレイ装置は、ホスト装置から認識される論理ディスク(論理ボリューム)を有する。論理ディスクは、その領域(論理アドレス空間)にアレイ内の記憶領域(物理領域)が割り当てられることにより構成される。
このようなディスクアレイ装置では、ホスト装置がアクセスを行う論理ディスクと、その論理ディスクを構成する物理領域を提供するアレイとの対応関係は固定的である。したがって、システムによっては、実際に論理ディスクとして使用されていない領域の割合が高くなり、無駄が大きい場合がある。
そこで、例えばディスクアレイ装置に含まれるアレイの全領域(物理領域)をエクステント(物理エクステント)という一定サイズに区分して管理し、論理ディスクへのライトアクセスが発生した場合に当該ライトアクセスの対象となる領域に割り当てる物理エクステントを実際に確保するという仮想論理ディスク方式が提案されている。
つまり、ディスクアレイ装置では、当該ディスクアレイ装置に含まれるアレイの全領域が分割された全物理エクステントのうちの1つ以上の物理エクステントを組み合わせることによって、ホスト装置から認識される論理ディスクが構成される。
このようなディスクアレイ装置は、ホスト装置からアクセス(認識)される論理ディスクと当該論理ディスクの領域に割り当てられる物理エクステントとの対応関係を管理し、論理ディスクの構築後にホスト装置から書込み要求を受信する都度、当該論理ディスク内の対応する領域に割り当てる物理エクステントを確保するという仮想論理ボリューム機能を備える。
ところで、ディスクアレイ装置では、ホスト装置から認識される論理ディスクの領域に割り当てられる物理エクステントの配置(物理的な配置)は固定的である。この場合、論理ディスク内のブロックアドレスとそれに対応するアレイやHDDのブロックアドレスは基本的に変化することはない。
一方で、ディスクアレイ装置の運用を開始すると、論理ディスクへのアクセス負荷(I/O負荷)が当初計画と異なるといった事態が生じることがある。このような場合、ディスクアレイ装置では、論理ディスク内のアレイやHDDにてボトルネックやホットスポット(HDDのある領域へのアクセス負荷の集中)が発生しても、論理ディスクとアレイやHDDとの対応が固定的であるため、これを解消することは容易ではない。この場合、例えばデータをテープなどにバックアップし、論理ディスクを改めて作り直し、テープからリストアするなどの作業が必要となる。
また、最近では複数のホスト装置にてディスクアレイ装置を共有する場合も多い。このような場合、ディスクアレイ装置と接続されるホスト装置の数の増加などによりアクセス負荷が変化し、ボトルネックやホットスポットが発生することも考えられる。
そこで、例えば論理ディスクの領域の物理的な配置を仮想的に管理する技術が開示されている(例えば、特許文献1を参照)。この特許文献1に記載の技術によれば、例えば同一アレイ内でアクセス負荷が高い領域同士が近接するようにスライスの再配置が行われる。これにより、アクセス負荷が高い領域へのアクセス時におけるシーク時間が短縮され、アクセス性能を向上させることができる。
また、物理ボリュームのアクセス頻度に応じて論理ボリュームを再構成する技術が開示されている(例えば、特許文献2を参照)。
また、論理ディスクを構成する物理ディスクのI/O競合頻度を検出し、論理ディスクの中でアクセス頻度が高い物理ディスク上の物理エクステントを他の物理ディスクへ再配置する技術が開示されている(例えば、特許文献3を参照)。
また、再配置を行う際に、データの入れ替えのための媒介領域に対してコピーを行う必要があるため、例えば論理ディスク全体について実行するには多大な時間を必要とし、データを入れ替えのための媒介領域を確保する必要がある。これらを考慮して、論理ディスクのコピーを作成する際に、コピー先となる論理ディスクに対するアクセス性能を最適化することが可能なディスクアレイ装置及び物理配置最適化方法を提供する技術が提案されている(例えば、特許文献4を参照)。
特開2006−24024号公報 特開2004−272324号公報 特許第3427763号公報 特開2009−217700号公報
上記特許文献4に記載の従来技術によれば、物理配置最適化に関し、コピー先となる論理ディスクに対応する物理ディスクの領域(物理領域)のみにてアクセス性能を最適化することが可能となる。しかし、この従来技術では、コピー元論理ディスクを含めた物理領域全体としてのアクセス性能の最適化を実現すること、つまりコピー元の論理ディスクとコピー先の論理ディスクとに対応する物理領域の範囲内で、当該両論理ディスクの物理配置、特にコピー元論理ディスクの物理配置を最適化することは難しい。
そこで本発明は、コピー元の論理ディスクとコピー先の論理ディスクとに対応する物理領域の範囲内で、特にコピー元論理ディスクの物理配置の最適化を実現することを、解決すべき課題とする。
本発明の1つの態様によれば、ディスクアレイ装置が提供される。このディスクアレイ装置は、第1及び第2のアレイと、ホスト装置と接続されたアレイコントローラであって、前記第1及び第2のアレイがそれぞれ有する物理領域を複数の物理エクステントに区分して管理し、前記複数の物理エクステントのうちの1つ以上の第1の物理エクステントをそれぞれ第1の論理ディスクの1つ以上の第1の論理エクステントに割り当て、前記複数の物理エクステントのうちの1つ以上の第2の物理エクステントを、前記1つ以上の第1の論理エクステントのデータがコピーされるべき、第2の論理ディスクの1つ以上の第2の論理エクステントに割り当てるアレイコントローラとを具備する。前記アレイコントローラは、前記1つ以上の第1の論理エクステントから前記1つ以上の第2の論理エクステントに順次データをコピーすることによって、前記第1の論理ディスクから前記第2の論理ディスクへのデータコピーを実行して、前記第2の論理ディスクを前記第1の論理ディスクに同期化させるデータコピー手段と、前記データコピーが開始されてから前記第1及び第2の論理ディスクが論理的に切り離されてスプリット状態に遷移するまでの間、前記第1の論理ディスク内のコピーが完了した範囲に対する前記ホスト装置からのライトアクセスを、前記第1及び第2の論理ディスクに対して並行して実行するミラーライト手段と、前記データコピーが開始されてから前記第1及び第2の論理ディスクが前記スプリット状態に遷移するまでの間に、前記1つ以上の第1の論理エクステント及び前記1つ以上の第2の論理エクステントの中から既にコピー完了状態にあるコピー元の第1の論理エクステント及びコピー先の第2の論理エクステントの組を検出し、前記組内の前記第1の論理エクステント及び前記第2の論理エクステントにそれぞれ割り当てられている物理エクステントを相互に入れ替える物理エクステント再割当を、所定の条件に基づいて実行する物理エクステント再割当手段とを備える。
本発明によれば、第1の論理ディスクから第2の論理ディスクへのデータコピーが開始されてから前記第1及び第2の論理ディスクがスプリット状態に遷移するまでの間に、既にコピー完了状態にあるコピー元の第1の論理エクステント及びコピー先の第2の論理エクステントの組を検出し、検出された組内の第1及び第2の論理エクステントにそれぞれ割り当てられている物理エクステントを相互に入れ替える物理エクステント再割当を、所定の条件に基づいて実行することにより、新たにデータの移動またはコピーを行うことなく、第1及び第2の論理ディスクに対応する物理領域全体のアクセス性能(アクセスの効率またはアクセスの信頼性)の最適化、特に当該物理領域の範囲内でのコピー元論理ディスクの物理配置の最適化を実現することが可能となる。
本発明の一実施形態に係るディスクアレイ装置を備えたストレージシステムの構成を示す示すブロック図。 2つの論理ディスクと2つのアレイの物理領域との関係の一例を示す図。 同実施形態で適用される、マスタ論理ディスクを管理するためのマスタ論理ディスク管理テーブルの一例を示す図。 同実施形態で適用される、サブ論理ディスクを管理するためのサブ論理ディスク管理テーブルの一例を示す図。 同実施形態で適用されるコピー管理テーブルの一例を示す図。 同実施形態における、マスタ論理ディスクからサブ論理ディスクへのデータコピーを説明するための図。 同実施形態における物理エクステント再割当の第1の例を説明するための、物理エクステント再割当前の2つの論理ディスクと2つのアレイの物理領域との関係の一例を示す図。 上記第1の例を説明するための、物理エクステント再割当後の2つの論理ディスクと2つのアレイの物理領域との関係の一例を示す図。 同実施形態における物理エクステント再割当の第2の例を説明するための、物理エクステント再割当前の2つの論理ディスクと2つのアレイの物理領域との関係の一例を示す図。 上記第2の例を説明するための、物理エクステント再割当後の2つの論理ディスクと2つのアレイの物理領域との関係の一例を示す図。
以下、本発明の実施の形態につき図面を参照して説明する。
図1は本発明の一実施形態に係るディスクアレイ装置を備えたストレージシステムの構成を示すブロック図である。
図1に示すストレージシステムは、ディスクアレイ装置1及びホスト装置2から構成される。ディスクアレイ装置1及びホスト装置2は、例えばネットワークを介して接続されている。ホスト装置2は、ディスクアレイ装置1を例えば自身の外部記憶装置として利用する。ホスト装置2は、後述するホストインタフェースIF1を介してディスクアレイ装置1との間のデータ転送を含むデータ通信を行う。つまりホスト装置2は、ディスクアレイ装置1に対してリードアクセスやライトアクセスを行う。
ディスクアレイ装置1は、アレイコントローラ10及びアレイ部20から構成される。アレイ部20は、1つ以上(つまり1つまたは複数)のディスク装置(ストレージデバイス)、例えばn個の磁気ディスクドライブ(HDD)21-1(#1)〜21-n(#n)を備えている。HDD21-1〜21-nの一部または全部は、1つ以上のアレイ、例えば複数のアレイを構成するのに用いられる。複数のアレイの各々は、HDD21-1〜21-nのうちの1つ以上のHDDの記憶領域の一部または全部が連続した1つの領域として定義される。本実施形態では、HDD21-1〜21-nの一部または全部により、少なくとも後述するアレイ210X及び210Y(図2、図6乃至図10参照)が構成されているものとする。
図2は、論理ディスク(LDISK)200A及び200Bとアレイ210X及び210Yの物理領域との関係の一例を示す。
アレイ(第1のアレイ)210Xの物理領域は、物理エクステント番号がそれぞれ0,1,p,q,rである物理エクステントPEX0,PEX1,PEXp,PEXq,PEXrを含む、一定サイズの複数の物理エクステントに分割して管理される。アレイ(第2のアレイ)210Yの物理領域は、物理エクステント番号がそれぞれ0,1,s,t,uである物理エクステントPEY0,PEY1,PEYs,PEYt,PEYuを含む、一定サイズの複数の物理エクステントに分割して管理される。
論理ディスク(第1の論理ディスク)200Aは、論理エクステント番号がそれぞれ0,1,2である論理エクステントLEA0,LEA1,LEA2を含む、一定サイズの複数の論理エクステント(第1の論理エクステント)に分割して管理される。論理ディスク(第2の論理ディスク)200Bは、論理エクステント番号がそれぞれ0,1,2である論理エクステントLEB0,LEB1,LEB2を含む、一定サイズの複数の論理エクステント(第2の論理エクステント)に分割して管理される。一般に論理エクステントと物理エクステントとは同一サイズである。
論理ディスク200A及び200B内の論理エクステントには、必要に応じてアレイ210X及び210Y内の物理エクステント(第1の物理エクステント及び第2の物理エクステント)が割り当てられる。例えば、ホスト装置2からのライト要求で指定された論理エクステントに物理エクステントが未割り当ての場合、当該指定された論理エクステントに、他の論理エクステントに未割り当ての物理エクステントが割り当てられる。
図2において、例えば論理ディスク200A内の論理エクステントLEA0,LEA1,LEA2には、それぞれ矢印220-0,220-1,220-2で示されるように、アレイ210X内の物理エクステントPEXp,PEXq,PEXrが割り当てられている。一方、例えば論理ディスク200B内の論理エクステントLEB0,LEB1,LEB2には、それぞれ矢印221-0,221-1,221-2で示されるように、アレイ210Y内の物理エクステントPEYs,PEYt,PEYuが割り当てられている。
また、アレイ210X内の物理エクステントPEXp,PEXq,PEXrには、ホスト装置2からの、論理ディスク200A内の論理エクステントLEA0,LEA1,LEA2へのデータD0,D1,D2のライトの要求に応じて、それぞれ当該データD0,D1,D2がライトされている。物理エクステントPEXp,PEXq,PEXrに、それぞれデータD0,D1,D2がライトされることは、論理的には、論理エクステントLEA0,LEA1,LEA2に、それぞれデータD0,D1,D2がライトされることと等価である。
本実施形態において、論理ディスク200Bは、論理ディスク200Aの複製として用いられるものとする。この場合、論理ディスク200Aをマスタ論理ディスク(正論理ディスク)と呼び、論理ディスク200Bをサブ論理ディスク(副論理ディスク)と呼ぶ。論理ディスク200Bを、論理ディスク200Aの複製として用いるためには、論理ディスク200Aに格納されているデータを論理ディスク200Bにコピーする必要がある。
本実施形態において、コピーの状態は、コピー中状態、同期状態及びスプリット状態の3つである。コピー中状態とは、論理ディスク200Aからデータを読み出し、この読み出されたデータを論理ディスク200Bに書き込むコピー処理が実行されている状態を指す。同期状態とは、コピー処理が完了している状態、つまり論理ディスク200A及び論理ディスク200Bがミラー(複製)関係にある状態を指す。スプリット状態とは、同期状態にあった論理ディスク200A及び論理ディスク200Bが論理的に切り離されている状態、つまりミラー関係が解除されている状態を指す。
再び図1を参照すると、アレイコントローラ10は、HDD21-1〜21-nへのアクセスを制御すると共に、ホスト装置2との間のデータ送受信を行う。アレイコントローラ10は、ホストインタフェースIF1、ディスクインタフェースIF2及び主制御部100から構成される。
ホストインタフェースIF1は、ホスト装置2との間の、データ入出力処理を含むインタフェース処理を担当する。ディスクインタフェースIF2は、HDD21-1〜21-nとの間の、データ入出力処理を含むインタフェース処理を担当する。主制御部100は、アレイコントローラ10の中枢をなし、例えばRAIDの手法によりHDD21-1〜21-nを管理する。より詳細に述べるならば、主制御部100は、ホスト装置2からのリード/ライト要求に応じて、HDD21-1〜21-nの一部または全部を並列に動かしてデータの読み出し/書き込みを分散して実行する。
主制御部100は、アレイ構成部101、論理ディスク構成部102、管理テーブル記憶部103、データコピー部104、ミラーライト部105、アクセス頻度取得部106、アレイ負荷算出部107、アレイ冗長性管理部108、HDDエラー検出部109、アレイ性能管理部110及び物理エクステント再割当部111を備えている。
アレイ構成部101は、HDD21-1〜21-nのうちの1つ以上のHDDの記憶領域の一部または全部が連続した1つの領域として定義され、複数の物理エクステントから構成されるアレイを構築する。ここでは、少なくとも、図2に示されるアレイ210X及び210Yが構築されるものとする。アレイ210X及び210Yは、例えばRAID構成のアレイであるものとする。
論理ディスク構成部102は、例えば、ホスト装置2からの指示に応じて、複数の論理エクステントから構成される論理ディスクを構築する。ここでは、少なくとも、図2に示される論理ディスク200A及び200Bが構築されるものとする。管理テーブル記憶部103は、各種の管理テーブルを記憶するのに用いられる。管理テーブル記憶部103に格納される管理テーブルの具体例については後述する。
データコピー部104は、例えば、ホスト装置2からの指示に応じて、指定された複数の論理ディスクを同期状態、つまりミラー状態(複製関係)として運用するために、当該複数の論理ディスクのうちのマスタ論理ディスクからデータを読み出して、この読み出されたデータを他のサブ論理ディスクに書き込むコピー処理を実行する。このコピー処理は、論理エクステント単位で行われる。このコピー処理の物理的な動作は、次のように行われる。まず、マスタ論理ディスク内のコピー元論理エクステントに割り当てられたアレイ内の物理エクステントからデータが読み出される。この読み出されたデータが、サブ論理ディスク内のコピー先論理エクステントに割り当てられたアレイ内の物理エクステントに書き込まれる。
ミラーライト部105は、マスタ論理ディスクからサブ論理ディスクへのデータのコピーが開始されてから、マスタ論理ディスク及びサブ論理ディスクがスプリット状態に遷移するまでの期間、動作する。ミラーライト部105は、この期間、マスタ論理ディスク内のコピーが完了した範囲に対するホスト装置2からのライト要求に応じて、要求されたデータをマスタ論理ディスク及びサブ論理ディスクの双方に並行して書き込むためのミラーライトを実行する。
アクセス頻度取得部106は、アレイ構成部101によって構築されているアレイ、例えば図2に示されるアレイ210X及び210Y内の複数の物理エクステントの各々に対するホスト装置2からのアクセス頻度を示す統計情報を取得する。この統計情報はアクセス頻度テーブル(図示せず)に保持される。このアクセス頻度テーブルは、管理テーブル記憶部103に格納される。
アレイ負荷算出部107は、アクセス頻度テーブルに保持されているアレイ210X及び210Y内の複数の物理エクステントの各々に対するアクセス頻度に応じて、アレイ210X及び210Yの負荷を算出する。
アレイ冗長性管理部108は、アレイ構成部101によって構築されているアレイの冗長性を、アレイ冗長性テーブル(図示せず)により管理する。このアレイ冗長性テーブルは、管理テーブル記憶部103に格納される。
HDDエラー検出部109は、HDD21-1〜21-nで発生するエラーを検出する。HDD21-1〜21-nのエラーの状態は、HDD状態テーブル(図示せず)に保持される。このHDD状態テーブルは、管理テーブル記憶部103に格納される。
アレイ性能管理部110は、アレイ構成部101によって構築されているアレイの性能をアレイ性能テーブル(図示せず)により管理する。このアレイ性能テーブルは、管理テーブル記憶部103に格納される。
物理エクステント再割当部111は、例えば、データコピー部104による論理ディスク200Aから論理ディスク200Bへのデータコピーが開始されてから、論理ディスク200A及び200Bの組がスプリット状態に遷移するまでの間、動作する。この状態において物理エクステント再割当部111は、既にコピー完了状態にあるコピー元の論理エクステント(第1の論理エクステント)LEAi(iは0,1,2,…のいずれか)及びコピー先の論理エクステント(第2の論理エクステント)LEBiの組を検出する。
ここで、論理エクステントLEAiには、アレイ210X内の物理エクステントPEXjが割り当てられ、論理エクステントLEBiには、アレイ210Y内の物理エクステントPEYkが割り当てられているものとする。この場合、物理エクステント再割当部111は、論理エクステントLEAiに割り当てられる物理エクステントを、物理エクステントPEXjから物理エクステントPEYkに切り替え、論理エクステントLEBiに割り当てられる物理エクステントを、物理エクステントPEYkから物理エクステントPEXjに切り替えるための物理エクステント再割当を、所定の条件に基づいて実行する。この所定の条件については後述する。
図3は、論理ディスク200Aのようなマスタ論理ディスクを管理するためのマスタ論理ディスク管理テーブル121の一例を示す。マスタ論理ディスク管理テーブル121は、図1に示される管理テーブル記憶部103に格納される。マスタ論理ディスク管理テーブル121の各エントリは、論理ディスク番号(LDISK番号)フィールド、論理エクステント番号フィールド、コピー完了フラグフィールド、アレイ番号フィールド及び物理エクステント番号フィールドの組から構成される。
LDISK番号フィールドは、管理対象となる論理ディスク(マスタ論理ディスク)を識別するための識別情報であるLDISK番号を保持するのに用いられる。本実施形態では、論理ディスク200AにはLDISK番号0が割り当てられ、論理ディスク200BにはLDISK番号1が割り当てられているものとする。
論理エクステント番号フィールドは、対応するLDISK番号フィールドに保持されたLDISK番号の示す論理ディスク内の論理エクステントの論理エクステント番号を保持するのに用いられる。
コピー完了フラグフィールドは、対応する論理エクステント番号フィールドに保持された論理エクステント番号の示す論理エクステントからサブ論理ディスク内の論理エクステントへのデータコピーが完了しているかを示すコピー完了フラグを保持するのに用いられる。本実施形態において、コピー完了フラグは“1”(セット状態)でコピー完了を、“0”(リセット状態)でコピー未完了を示す。
物理エクステント番号フィールド及びアレイ番号フィールドは、それぞれ、対応する論理エクステント番号フィールドに保持された論理エクステント番号の示す論理エクステントに割り当てられている物理エクステントの物理エクステント番号及び当該物理エクステントを含むアレイを識別するためのアレイ番号を保持するのに用いられる。本実施形態において、アレイ210Xにはアレイ番号0が割り当てられ、アレイ210Yにはアレイ番号1が割り当てられているものとする。
図4は、論理ディスク200Bのようなサブ論理ディスクを管理するためのサブ論理ディスク管理テーブル122の一例を示す。サブ論理ディスク管理テーブル122は、図1に示される管理テーブル記憶部103に格納される。サブ論理ディスク管理テーブル122の各エントリは、LDISK番号フィールド、論理エクステント番号フィールド、アレイ番号フィールド及び物理エクステント番号フィールドの組から構成される。
LDISK番号フィールド及び論理エクステント番号フィールドは、それぞれ、管理対象となる論理ディスク(サブ論理ディスク)のLDISK番号及び当該論理ディスク内の論理エクステントの論理エクステント番号を保持するのに用いられる。物理エクステント番号フィールド及びアレイ番号フィールドは、それぞれ、対応する論理エクステント番号フィールドに保持された論理エクステント番号の示す論理エクステントに割り当てられている物理エクステントの物理エクステント番号及び当該物理エクステントを含むアレイのアレイ番号を保持するのに用いられる。
図5は、データコピー部104によるデータコピーの管理等に用いられるコピー管理テーブル123の一例を示す。コピー管理テーブル123は、図1に示される管理テーブル記憶部103に格納される。コピー管理テーブル123の各エントリは、マスタLDISK番号フィールド、サブLDISK番号フィールド及びコピー状態フィールドの組から構成される。
マスタLDISK番号フィールド及びサブLDISK番号フィールドは、それぞれ、マスタ論理ディスクのLDISK番号及び当該マスタ論理ディスクの複製として用いられるサブ論理ディスクのLDISK番号を保持するのに用いられる。コピー状態フィールドは、対応するマスタLDISK番号フィールド及びサブLDISK番号フィールドの示すマスタ論理ディスク及びサブ論理ディスクの状態が、コピー中状態、同期状態またはスプリット状態のいずれの状態にあるかを示すのに用いられる。
次に、図1のストレージシステムにおけるディスクアレイ装置1の動作について、図2に示される論理ディスク(マスタ論理ディスク)200Aから論理ディスク(サブ論理ディスク)200Bへのデータコピーを例に、図6を参照して説明する。このデータコピーは、LDISK番号がそれぞれ0及び1の論理ディスク200A及び200Bの組がスプリット状態にあるときに、ホスト装置2からディスクアレイ装置1のアレイコントローラ10に対して、当該論理ディスク200A及び200Bの組を同期状態に設定するための同期要求が与えられることにより、次のように実行される。
今、アレイコントローラ10内の主制御部100に含まれているデータコピー部104が、ホスト装置2からの同期要求をホストインタフェースIF1を介して受け取ったものとする。するとデータコピー部104は、同期要求で指定された論理ディスク200A及び200Bの組のコピー状態を、スプリット状態からコピー中状態に切り替える。この切り替えは、図5に示されるコピー管理テーブル123に反映される。
次にデータコピー部104は、図3に示されるマスタ論理ディスク管理テーブル121及び図4に示されるサブ論理ディスク管理テーブル122に基づいて、図6に示されるように、論理ディスク200Aから論理ディスク200Bへのデータのコピー60を実行する。このコピー60は、例えば、論理ディスク200A及び200B内の論理エクステント番号が0の論理エクステントから順に、論理エクステント単位に行われる。
以下、コピー60の詳細を説明する。まずLDISK番号が0の論理ディスク200A内の、論理エクステント番号が0の論理エクステントLEA0から、LDISK番号が1の論理ディスク200B内の、論理エクステント番号が0の論理エクステントLEB0に、データをコピーするものとする。この場合、データコピー部104は、マスタ論理ディスク管理テーブル121及びサブ論理ディスク管理テーブル122を参照して、論理エクステント番号が0の論理エクステントLEA0及びLEB0にそれぞれ割り当てられた、アレイ210X内の物理エクステントPEXp及びアレイ210Y内の物理エクステントPEYsを特定する。物理エクステントPEXpには、図6に示すようにデータD0が格納されている。
次に、データコピー部104は図6に示すように、アレイ210X内の物理エクステントPEXpからデータD0を読み出し、この読み出されたデータD0をアレイ210Y内の物理エクステントPEYsに書き込むコピー61を実行する。このコピー61により、論理的には、論理ディスク200A内の論理エクステントLEA0から論理ディスク200B内の論理エクステントLEB0にデータD0がコピーされることになる。
データコピー部104は、コピー61を実行し終えると、マスタ論理ディスク管理テーブル121内の、LDISK番号が0で論理エクステント番号が0のエントリのコピー完了フラグを“0”から“1”に更新する。
以下、同様にして、データコピー部104は図6に示すように、アレイ210X内の物理エクステントPEXqからデータD1を読み出し、この読み出されたデータD1をアレイ210Y内の物理エクステントPEYtに書き込むコピー62を実行する。このコピー62により、論理的には、論理ディスク200A内の論理エクステントLEA1から論理ディスク200B内の論理エクステントLEB1にデータD1がコピーされることになる。
データコピー部104は、コピー62を実行し終えると、マスタ論理ディスク管理テーブル121内の、LDISK番号が0で論理エクステント番号が1のエントリのコピー完了フラグを“0”から“1”に更新する。図3は、このときのマスタ論理ディスク管理テーブル121の状態を示す。
ここで、ホスト装置2からは、論理ディスク200A及び200Bのうちの論理ディスク200A(つまりマスタ論理ディスク200A)へのアクセス要求のみが発行され、論理ディスク200B(つまりサブ論理ディスク200B)へのアクセス要求は発行されない。ミラーライト部105は、ホスト装置2からアクセス要求が、論理ディスク200A内のコピーが完了した範囲に対するライト要求の場合、要求されたデータを、要求された論理ディスク200A内の範囲に対応する論理エクステントだけでなく、その論理エクステントに対応する論理ディスク200B内の論理エクステントにも書き込む。
次に、図1のストレージシステムにおけるディスクアレイ装置1の動作について、物理エクステント再割当を例に、図7乃至図10を参照して説明する。
[物理エクステント再割当の第1の例]
まず、物理エクステント再割当の第1の例について、図7及び図8を参照して説明する。図7には、マスタ論理ディスクとして論理ディスク200A及び200Cが示され、論理ディスク200A及び200Cにそれぞれ対応するサブ論理ディスクとして論理ディスク200B及び200Dが示されている。
図7において、論理ディスク200A及び200B内の論理エクステント番号が0の論理エクステントLEA0及びLEB0には、それぞれ矢印70A及び70Bに示されるように、アレイ210X内の物理エクステント番号がpの物理エクステントPEXp及びアレイ210Y内の物理エクステント番号がsの物理エクステントPEYsが割り当てられている。物理エクステントPEXp及びPEYsには、いずれもデータD0が格納されている。このように、物理エクステントPEXp及びPEYsは、物理エクステントPEXpから物理エクステントPEYsへのデータD0のコピー、つまり論理エクステントLEA0から論理エクステントLEB0へのデータD0のコピーにより、データ一致状態(コピー完了状態)にある。
また図7において、論理ディスク200C及び200D内の論理エクステント番号がaの論理エクステントLECa及びLEDaには、それぞれ矢印70C及び70Dに示されるように、アレイ210X内の物理エクステント番号がvの物理エクステントPEXv及びアレイ210Y内の物理エクステント番号がwの物理エクステントPEYwが割り当てられている。物理エクステントPEXv及びPEYwには、いずれもデータDaが格納されている。このように、物理エクステントPEXv及びPEYwは、物理エクステントPEXvから物理エクステントPEYwへのデータDaのコピー、つまり論理エクステントLECaから論理エクステントLEDaへのデータDaのコピーにより、データ一致状態(コピー完了状態)にある。
ここで、アレイ210X内の物理エクステント、例えば物理エクステントPEXp及びPEXv以外の物理エクステントに対するアクセスの頻度が高いために、当該アレイ210Xの負荷が高いものとする。これに対し、アレイ210Y内の物理エクステント、例えば物理エクステントPEYs及びPEYw以外の物理エクステントに対するアクセスの頻度が低いために、当該アレイ210Yの負荷がアレイ210Xに比べて相対的に低いものとする。つまりアレイ210Xの負荷がアレイ210Yに比べて高いものとする。
アレイ210X及び210Yの負荷は、アレイ210X及び210Y内の物理エクステントの各々に対するホスト装置2からのアクセス頻度を示す統計情報に基づいて、アレイ負荷算出部107によって算出される。この統計情報はアクセス頻度取得部106によって取得されて、アクセス頻度テーブルに保持される。アクセス頻度テーブルは管理テーブル記憶部103に格納される。
アレイ210Xの負荷がアレイ210Yに比べて高い場合、物理エクステント再割当部111は物理エクステント再割当のための所定の条件が成立していると判断する。即ち物理エクステント再割当部111は、データ一致状態(コピー完了状態)にある物理エクステントPEXp及びPEYsのうち、論理ディスク200A内の論理エクステントLEA0に割り当てられている物理エクステントPEXpが属するアレイ210Xの負荷が、論理ディスク200B内の論理エクステントLEB0に割り当てられている物理エクステントPEYsが属するアレイ210Yの負荷よりも高い場合、上記所定の条件が成立していると判断する。
すると、物理エクステント再割当部111は、論理ディスク200A内の論理エクステントLEA0に割り当てられる物理エクステントを、図7に示されるアレイ210X内の物理エクステントPEXpから、図7において論理ディスク200B内の論理エクステントLEB0に割り当てられている(アレイ210Xよりも負荷が低い)アレイ210Y内の物理エクステントPEYsに、図8において矢印80Aで示されるように切り替える。これと並行して物理エクステント再割当部111は、論理ディスク200B内の論理エクステントLEB0に割り当てられる物理エクステントを、図7に示されアレイ210Y内の物理エクステントPEYsから、図7において論理ディスク200A内の論理エクステントLEA0に割り当てられている(アレイ210Yよりも負荷が高い)アレイ210X内の物理エクステントPEXpに、図8において矢印80Bで示されるように切り替える。
このように物理エクステント再割当部111は、論理ディスク200A内の論理エクステントLEA0に割り当てられる物理エクステント、及び論理ディスク200B内の論理エクステントLEB0に割り当てられる物理エクステントを、それぞれ、物理エクステントPEXpから物理エクステントPEYsへ、及び物理エクステントPEYsから物理エクステントPEXpへのように、相互に入れ替える。つまり物理エクステント再割当部111は、アレイ210X内の物理エクステントPEXpが割り当てられる論理ディスクを、図7に示される論理ディスク200Aから、図8に示されるように論理ディスク200Bに変更し、且つアレイ210Y内の物理エクステントPEYsが割り当てられる論理ディスクを、図7に示される論理ディスク200Bから、図8に示されるように論理ディスク200Aに変更する。ここで、データの移動またはコピーが発生しないことに注意されるべきである。
同様に物理エクステント再割当部111は、論理ディスク200C内の論理エクステントLECaに割り当てられる物理エクステントを、図7に示されるアレイ210X内の物理エクステントPEXvから、図7において論理ディスク200D内の論理エクステントLEDaに割り当てられている(アレイ210Xよりも負荷が低い)アレイ210Y内の物理エクステントPEYwに、図8において矢印80Cで示されるように切り替える。これと並行して物理エクステント再割当部111は、論理ディスク200D内の論理エクステントLEDaに割り当てられる物理エクステントを、図7に示されアレイ210Y内の物理エクステントPEYwから、図7において論理ディスク200C内の論理エクステントLECaに割り当てられている(アレイ210Yよりも負荷が高い)アレイ210X内の物理エクステントPEXvに、図8において矢印80Dで示されるように切り替える。
このように、物理エクステント再割当部111は、論理ディスク200C内の論理エクステントLECaに割り当てられる物理エクステント、及び論理ディスク200D内の論理エクステントLEDaに割り当てられる物理エクステントを、それぞれ、物理エクステントPEXvから物理エクステントPEYwへ、及び物理エクステントPEYwから物理エクステントPEXvへのように、相互に入れ替える。つまり物理エクステント再割当部111は、アレイ210X内の物理エクステントPEXvが割り当てられる論理ディスクを、図7に示される論理ディスク200Cから、図8に示されるように論理ディスク200Dに変更し、且つアレイ210Y内の物理エクステントPEYwが割り当てられる論理ディスクを、図7に示される論理ディスク200Dから、図8に示されるように論理ディスク200Cに変更する。ここで、データの移動またはコピーが発生しないことに注意されるべきである。
その後、システム運用上の要求などにより、論理ディスク200A及び200Bの組と論理ディスク200C及び200Dの組が、それぞれ同期状態からスプリット状態に遷移したものとする。上記2つの組の論理ディスクのうち、マスタ論理ディスクである論理ディスク200A及び200Cへのホスト装置2からのアクセスは、スプリット状態に遷移した後も継続される。これに対して、サブ論理ディスクである論理ディスク200B及び200Dは、バックアップボリュームとして、当該論理ディスク200B及び200Dへのホスト装置2からのアクセスは発生しない。つまりスプリット状態においてホスト装置2からのアクセスは、論理ディスク200A及び200Bと論理ディスク200C及び200Dのうち、論理ディスク200A及び200Cに対してのみ実行される。
このとき論理ディスク200A及び200Bと論理ディスク200C及び200Dは、物理エクステント再割当部111による上述の物理エクステント再割当により、図7に示す状態から図8に示す状態に再構成されている。この状態で、ホスト装置2から論理ディスク200Aまたは200Cへのアクセスが発生すると、アレイ210X及び210Yへのアクセスが、図7に示す再構成前よりも、より均等に実行されて、アレイ210X及び210Yの負荷が均衡化され、アレイ210X及び210Y全体の稼働率が向上する。これにより論理ディスク200A及び200Cへのアクセス性能も向上する。即ち、物理エクステント再割当の第1の例によれば、ホスト装置2からのアクセスが継続する論理ディスク200A及び200Cの物理配置を、論理ディスク200A及び200Bと論理ディスク200C及び200Dとを合わせた範囲内でアクセス性能が最適となるように、再構成することができる。しかも、この再構成を行うのに、データの移動またはコピーを必要としない。
[物理エクステント再割当の第2の例]
次に、物理エクステント再割当の第2の例について、図9及び図10を参照して説明する。図9及び図10において、それぞれ図7及び図8と等価な部分には、同一符号を付してある。
図9には、図7と同様に、マスタ論理ディスクとして論理ディスク200A及び200Cが示され、論理ディスク200A及び200Cにそれぞれ対応するサブ論理ディスクとして論理ディスク200B及び200Dが示されている。また図9には、アレイとして、アレイ210X及び210Yが示されている。図9において、論理ディスク200A及び200Bの組と論理ディスク200C及び200Dの組における論理エクステントへの物理エクステントの割り当ては、図7と同様である。
図9に示されるアレイ210X及び210Yは、いずれも同一のRAIDレベルのRAID、例えばRAID5で構成されているものとする。ここでは、アレイ210Xを構成するHDDの少なくとも1台が故障している(使用不可の状態にある)ものとする。つまりアレイ210Xは、RAID構成に関して冗長性(RAID冗長性)が失われた、いわゆる縮退状態にあるものとする。一方、アレイ210Yを構成するHDDは全て正常に動作しており、アレイ210Yは、RAID構成に関して冗長性が保たれた冗長状態にあるものとする。
このように、図9の例では、アレイ210X及び210Yの間で冗長性に関して差があり、アレイ210Yの方が冗長性が高いものとする。アレイ210X及び210Yの冗長性は、管理テーブル記憶部103に格納されるアレイ冗長性テーブルを用いて、アレイ冗長性管理部108によって管理される。つまり、アレイ冗長性テーブルには、アレイ構成部101によって構築されている、アレイ210X及び210Yを含む全てのアレイについて、それぞれの冗長性を示す情報が保持されている。
アレイ210Xの冗長性がアレイ210Yに比べて低い場合、物理エクステント再割当部111は物理エクステント再割当のための所定の条件が成立していると判断する。即ち物理エクステント再割当部111は、データ一致状態(コピー完了状態)にある物理エクステントPEXp及びPEYsのうち、論理ディスク200A内の論理エクステントLEA0に割り当てられている物理エクステントPEXpが属するアレイ210Xの冗長性が、論理ディスク200B内の論理エクステントLEB0に割り当てられている物理エクステントPEYsが属するアレイ210Yの冗長性よりも低い場合、上記所定の条件が成立していると判断する。
すると、物理エクステント再割当部111は、上記第1の例のようなアレイ210Xの負荷がアレイ210Yよりも高い場合と同様に、物理エクステント再割当を行う。即ち物理エクステント再割当部111は、論理ディスク200A内の論理エクステントLEA0に割り当てられる物理エクステントを、図9に示されるアレイ210X内の物理エクステントPEXpから、図9において論理ディスク200B内の論理エクステントLEB0に割り当てられている(アレイ210Xよりも冗長性が高い)アレイ210Y内の物理エクステントPEYsに、図10において矢印80Aで示されるように切り替える。これと並行して物理エクステント再割当部111は、論理ディスク200B内の論理エクステントLEB0に割り当てられる物理エクステントを、図9に示されアレイ210Y内の物理エクステントPEYsから、図9において論理ディスク200A内の論理エクステントLEA0に割り当てられている(アレイ210Yよりも冗長性が低い)アレイ210X内の物理エクステントPEXpに、図10において矢印80Bで示されるように切り替える。
このように、物理エクステント再割当部111は、アレイ210X内の物理エクステントPEXpが割り当てられる論理ディスクを、図9に示される論理ディスク200Aから、図10に示されるように論理ディスク200Bに変更し、且つアレイ210Y内の物理エクステントPEYsが割り当てられる論理ディスクを、図9に示される論理ディスク200Bから、図10に示されるように論理ディスク200Aに変更する。ここで、データの移動またはコピーが発生しないことに注意されるべきである。
同様に物理エクステント再割当部111は、論理ディスク200C内の論理エクステントLECaに割り当てられる物理エクステントを、図9に示されるアレイ210X内の物理エクステントPEXvから、図9において論理ディスク200D内の論理エクステントLEDaに割り当てられている(アレイ210Xよりも冗長性が高い)アレイ210Y内の物理エクステントPEYwに、図10において矢印80Cで示されるように切り替える。これと並行して物理エクステント再割当部111は、論理ディスク200D内の論理エクステントLEDaに割り当てられる物理エクステントを、図9に示されアレイ210Y内の物理エクステントPEYwから、図9において論理ディスク200C内の論理エクステントLECaに割り当てられている(アレイ210Yよりも冗長性が低い)アレイ210X内の物理エクステントPEXvに、図10において矢印80Dで示されるように切り替える。
このように、物理エクステント再割当部111は、アレイ210X内の物理エクステントPEXvが割り当てられる論理ディスクを、図9に示される論理ディスク200Cから、図10に示されるように論理ディスク200Dに変更し、且つアレイ210Y内の物理エクステントPEYwが割り当てられる論理ディスクを、図9に示される論理ディスク200Dから、図10に示されるように論理ディスク200Cに変更する。ここで、データの移動またはコピーが発生しないことに注意されるべきである。
その後、システム運用上の要求などにより、論理ディスク200A及び200Bの組と論理ディスク200C及び200Dの組が、それぞれ同期状態からスプリット状態に遷移したものとする。上記2つの組の論理ディスクのうち、マスタ論理ディスクである論理ディスク200A及び200Cへのホスト装置2からのアクセスは、スプリット状態に遷移した後も継続される。これに対して、サブ論理ディスクである論理ディスク200B及び200Dへのホスト装置2からのアクセスは発生しない。
このとき論理ディスク200A及び200Bと論理ディスク200C及び200Dは、物理エクステント再割当部111による上述の物理エクステント再割当により、図9に示す状態から図10に示す状態に再構成されている。この状態で、ホスト装置2から論理ディスク200Aまたは200Cへのアクセスが発生すると、アレイ210Xに比べて冗長性が高いアレイ210Yへのアクセスが、図9に示す再構成前よりも増加する。よって、物理エクステント再割当の第2の例によれば、ホスト装置2からのアクセスが継続される論理ディスク200A及び200Cにおけるオリジナルデータの信頼性を高めることができる。しかも、図9に示す再構成を行うのに、データの移動またはコピーを必要としない。
上述の第2の例では、アレイ210XがRAID構成の縮退状態にあり、アレイ210YがRAID構成に関して冗長状態にある場合に、アレイ210Yの冗長性がアレイ210Xよりも高いとしている。しかし、例えばアレイ210X及び210Yの一方、例えばアレイ210XのRAID構成の初期化が未完了である場合にも、アレイ210Yの冗長性がアレイ210Xよりも高いとしても構わない。また、アレイ210X及び210YがRAID構成に関して共に冗長状態にあっても、アレイ210X及び210Yが適用するRAIDレベルの違いにより、アレイ210Yの冗長度がアレイ210Xよりも高いならば、アレイ210Yの冗長性がアレイ210Xよりも高いとしても構わない。
[物理エクステント再割当の第3の例]
次に、物理エクステント再割当の第3の例について説明する。
第3の例の特徴は、上記アレイ210X及び210Yのうち、例えばアレイ210Xを構成するHDDの少なくとも1つでエラーが発生している場合に、物理エクステント再割当部111が、物理エクステント再割当のための上記所定の条件が成立していると判断する点にある。このような場合、物理エクステント再割当部111は、上述の第1または第2の例と同様に、図8または図10に示すような物理エクステント再割当を行う。
即ち物理エクステント再割当部111は、アレイ210X及び210Yのうち、エラーが発生しているHDDの記憶領域の一部または全部を含むアレイ210Xへのアクセスをできるだけ避けるように、ホスト装置2からのアクセスが継続される論理ディスク200A及び200Cを再構成する。これにより、論理ディスク200A及び200Cにおけるオリジナルデータの信頼性を高めることができる。
なお、アレイ部20内のHDD21-1〜21-nで発生するエラー、例えばメディアエラーは、HDDエラー検出部109による例えばパトロールによって検出される。また、HDD21-1〜21-nは、一般にSMART(Self-Monitoring Analysis and Reporting Technology)と呼ばれる周知の自己監視・分析・報告機能を有している。そこで、HDDエラー検出部109は、このHDD21-1〜21-nの持つSMART機能を利用することにより、当該HDD21-1〜21-nが取得した自身のエラー状態を示す情報(例えば、近い将来故障が発生する可能性があるかなどの情報)を当該HDD21-1〜21-nから取得することもできる。
[物理エクステント再割当の第4の例]
次に、物理エクステント再割当の第4の例について説明する。
上記実施形態においてアレイ210X及び210Yは、HDD21-1〜21-nの一部または全部により構成されている。しかし、アレイ210X及び210Yの一方が、例えばSSD(Solid State Drive)のような、HDD21-1〜21-nよりも高性能なストレージデバイスにより構成された高性能アレイであってもよい。ここで、アレイ210Yがアレイ210Xよりも高性能なアレイであるものとする。なお、アレイ210Yがアレイ210Xを構成するHDDよりも高性能なHDDで構成されている場合にも、アレイ210Yはアレイ210Xよりも高性能となる。また、アレイ210X及び210Yの適用するRAID構成(RAIDレベル)の違いや、アレイ210X及び210Yを構成するHDDの数の違いなどによっても、アレイ210Yがアレイ210Xよりも高性能となることがある。
アレイ構成部101によって構築された、アレイ210X及び210Yを含む複数のアレイの性能は、管理テーブル記憶部103に格納されるアレイ性能テーブルを用いて、アレイ性能管理部110によって管理される。
第4の例において、物理エクステント再割当部111は、上記アレイ210X及び210Yのうち、例えばアレイ210Yがアレイ210Xと比較してより高性能アレイである場合、物理エクステント再割当のための上記所定の条件が成立していると判断する。このような場合、物理エクステント再割当部111は、上述の第1、第2または第3の例と同様に、図8または図10に示すような物理エクステント再割当を行う。
即ち物理エクステント再割当部111は、アレイ210Xよりも相対的に性能が高いアレイ210Y内の物理エクステントを用いて、ホスト装置2からのアクセスが継続される論理ディスク200A及び200Cを再構成する。これにより、ホスト装置2からの論理ディスク200Aまたは200Cへのアクセス要求に対して、アレイ210X及び210Yのうち、性能が高いアレイ210Yへのアクセス頻度を増やして、論理ディスク200A及び200Cの性能を高めることができる。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
1…ディスクアレイ装置、2…ホスト装置、10…アレイコントローラ、20…アレイ部、20-1〜20-n…HDD、100…主制御部、101…アレイ構成部、102…論理ディスク構成部、103…管理テーブル記憶部、104…データコピー部、105…ミラーライト部、106…アクセス頻度取得部、107…アレイ負荷算出部、108…アレイ冗長性管理部、109…HDDエラー検出部、110…アレイ性能管理部、111…物理エクステント再割当部、121…マスタ論理ディスク管理テーブル、122…サブ論理ディスク管理テーブル、123…コピー管理テーブル、200A,200C…論理ディスク(第1の論理ディスク)、200B,200D…論理ディスク(第2の論理ディスク)、210X…アレイ(第1のアレイ)、210Y…アレイ(第2のアレイ)、LEA0,LEA1,LEA2,LECa…論理エクステント(第1の論理エクステント)、LEB0,LEB1,LEB2,LEDa…論理エクステント(第2の論理エクステント)、PEXp,PEXq,PEXr,PEXv…物理エクステント(第1の物理エクステント)、PEYs,PEYt,PEYu,PEYw…物理エクステント(第2の物理エクステント)。

Claims (3)

  1. 第1及び第2のアレイと、
    ホスト装置と接続されたアレイコントローラであって、前記第1及び第2のアレイがそれぞれ有する物理領域を複数の物理エクステントに区分して管理し、前記複数の物理エクステントのうちの複数の第1の物理エクステントをそれぞれ第1の論理ディスクの複数の第1の論理エクステントに割り当て、前記複数の物理エクステントのうちの複数の第2の物理エクステントを、前記複数の第1の論理エクステントのデータがコピーされるべき、第2の論理ディスクの複数の第2の論理エクステントにそれぞれ割り当てるアレイコントローラとを具備し、
    前記アレイコントローラは、
    前記複数の第1の論理エクステントから前記複数の第2の論理エクステントに順次データをコピーすることによって、前記第1の論理ディスクから前記第2の論理ディスクへのデータコピーを実行して、前記第2の論理ディスクを前記第1の論理ディスクに同期化させるデータコピー手段と、
    前記データコピーが開始されてから前記第1及び第2の論理ディスクが論理的に切り離されてスプリット状態に遷移するまでの間、前記第1の論理ディスク内のコピーが完了した範囲に対する前記ホスト装置からのライトアクセスを、前記第1及び第2の論理ディスクに対して並行して実行するミラーライト手段と、
    前記第1及び第2のアレイ内の前記複数の物理エクステントの各々に対する前記ホスト装置からのアクセス頻度を示す統計情報を格納する統計情報格納手段と、
    前記統計情報格納手段に格納されている統計情報に基づいて前記第1及び前記第2のアレイの負荷を算出するアレイ負荷算出手段と、
    前記データコピーが開始されてから前記第1及び第2の論理ディスクが前記スプリット状態に遷移するまでの間に、前記複数の第1の論理エクステント及び前記複数の第2の論理エクステントの中から既にコピー完了状態にあるコピー元の第1の論理エクステント及びコピー先の第2の論理エクステントの組を検出し、前記組内の前記第1の論理エクステントに割り当てられている前記第1の物理エクステントが前記第1及び第2のアレイのうちの一方のアレイに属し、前記組内の前記第2の論理エクステントに割り当てられている前記第2の物理エクステントが前記第1及び第2のアレイのうちの他方のアレイに属し、前記一方のアレイの負荷が前記他方のアレイの負荷よりも高い場合に、前記組内の前記第1の論理エクステント及び前記第2の論理エクステントにそれぞれ割り当てられている物理エクステントを相互に入れ替える物理エクステント再割当を実行する物理エクステント再割当手段とを備える
    ことを特徴とするディスクアレイ装置。
  2. 前記第1の論理ディスクへの前記ホスト装置からのアクセスは、前記スプリット状態に遷移した後も継続することを特徴とする請求項1記載のディスクアレイ装置。
  3. 第1及び第2のアレイと統計情報格納手段とを備え、ホスト装置と接続されたディスクアレイ装置であって、前記第1及び第2のアレイがそれぞれ有する物理領域を複数の物理エクステントに区分して管理し、前記複数の物理エクステントのうちの複数の第1の物理エクステントをそれぞれ第1の論理ディスクの複数の第1の論理エクステントに割り当て、前記複数の物理エクステントのうちの複数の第2の物理エクステントを、前記複数の第1の論理エクステントのデータがコピーされるべき、第2の論理ディスクの複数の第2の論理エクステントにそれぞれ割り当てるディスクアレイ装置に適用される論理ディスク再構成方法において、
    前記複数の第1の論理エクステントから前記複数の第2の論理エクステントに順次データをコピーすることによって、前記第1の論理ディスクから前記第2の論理ディスクへのデータコピーを実行して、前記第2の論理ディスクを前記第1の論理ディスクに同期化させるステップと、
    前記データコピーが開始されてから前記第1及び第2の論理ディスクが論理的に切り離されてスプリット状態に遷移するまでの間、前記第1の論理ディスク内のコピーが完了した範囲に対する前記ホスト装置からのライトアクセスを、前記第1及び第2の論理ディスクに対して並行して実行するステップと、
    前記統計情報格納手段に格納されている前記第1及び第2のアレイ内の前記複数の物理エクステントの各々に対する前記ホスト装置からのアクセス頻度を示す統計情報に基づいて前記第1及び前記第2のアレイの負荷を算出するステップと、
    前記データコピーが開始されてから前記第1及び第2の論理ディスクが前記スプリット状態に遷移するまでの間に、前記複数以上の第1の論理エクステント及び前記複数の第2の論理エクステントの中から既にコピー完了状態にあるコピー元の第1の論理エクステント及びコピー先の第2の論理エクステントの組を検出するステップと、
    前記組内の前記第1の論理エクステントに割り当てられている前記第1の物理エクステントが前記第1及び第2のアレイのうちの一方のアレイに属し、前記組内の前記第2の論理エクステントに割り当てられている前記第2の物理エクステントが前記第1及び第2のアレイのうちの他方のアレイに属し、前記一方のアレイの負荷が前記他方のアレイの負荷よりも高い場合に、前記組内の前記第1の論理エクステント及び前記第2の論理エクステントにそれぞれ割り当てられている物理エクステントを相互に入れ替える物理エクステント再割当を実行するステップと
    を具備することを特徴とする論理ディスク再構成方法。
JP2010059796A 2010-03-16 2010-03-16 ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法 Active JP5032620B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010059796A JP5032620B2 (ja) 2010-03-16 2010-03-16 ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010059796A JP5032620B2 (ja) 2010-03-16 2010-03-16 ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法

Publications (2)

Publication Number Publication Date
JP2011192202A JP2011192202A (ja) 2011-09-29
JP5032620B2 true JP5032620B2 (ja) 2012-09-26

Family

ID=44797010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010059796A Active JP5032620B2 (ja) 2010-03-16 2010-03-16 ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法

Country Status (1)

Country Link
JP (1) JP5032620B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101947504B1 (ko) 2017-07-06 2019-02-13 주식회사 티맥스데이터 데이터 파일의 익스텐트 할당 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0756691A (ja) * 1993-08-12 1995-03-03 Toshiba Corp ストライピングディスクのデータブロック自動再配置機能を持つ情報処理装置
JP3580355B2 (ja) * 1999-07-29 2004-10-20 日本電気株式会社 情報処理システムおよびデータコピー方法
JP2006024024A (ja) * 2004-07-08 2006-01-26 Toshiba Corp 論理ディスク管理方法及び装置
JP4261532B2 (ja) * 2005-09-13 2009-04-30 株式会社東芝 論理ディスク管理方法及び仮想化装置
JP5036158B2 (ja) * 2005-10-05 2012-09-26 株式会社日立製作所 情報処理システム及び情報処理システムの制御方法
JP4804218B2 (ja) * 2006-05-11 2011-11-02 株式会社日立製作所 記憶媒体への書き込み回数を管理する計算機システム及びその制御方法
JP2008090372A (ja) * 2006-09-29 2008-04-17 Hitachi Ltd ストレージ装置及び負荷分散方法
JP5352115B2 (ja) * 2008-04-25 2013-11-27 株式会社日立製作所 ストレージシステム及びその監視条件変更方法

Also Published As

Publication number Publication date
JP2011192202A (ja) 2011-09-29

Similar Documents

Publication Publication Date Title
JP6233086B2 (ja) ストレージ制御装置,ストレージシステム及び制御プログラム
TWI414992B (zh) 遠端非同步資料卷複製的方法及其裝置
US6598174B1 (en) Method and apparatus for storage unit replacement in non-redundant array
US7971013B2 (en) Compensating for write speed differences between mirroring storage devices by striping
US9213490B2 (en) Computer system and data migration method
US8839030B2 (en) Methods and structure for resuming background tasks in a clustered storage environment
US7340640B1 (en) System and method for recoverable mirroring in a storage environment employing asymmetric distributed block virtualization
JP4958739B2 (ja) 障害の発生した記憶装置に記憶されているデータを修復するストレージシステム
US7478221B1 (en) System and method for using consistent virtual addresses to communicate in cooperative multi-layer virtualization environments
US20020156987A1 (en) Storage virtualization and storage management to provide higher level storage services
JP2006024024A (ja) 論理ディスク管理方法及び装置
US8914577B2 (en) Disk array control apparatus
JP4261532B2 (ja) 論理ディスク管理方法及び仮想化装置
CN113360082A (zh) 存储系统及其控制方法
JP2008250458A (ja) ストレージシステム及びストレージシステムの管理方法
US7496724B2 (en) Load balancing in a mirrored storage system
US20160371136A1 (en) Storage system
CN113342258A (zh) 用以进行全快闪存储器阵列伺服器的数据存取管理的方法与设备
JP5032620B2 (ja) ディスクアレイ装置及び同ディスクアレイ装置に適用される論理ディスク再構成方法
CN116204137A (zh) 基于dpu的分布式存储系统、控制方法、装置及设备
JP3597349B2 (ja) 記憶サブシステムおよびその障害回復方法
JP2006260376A (ja) ストレージ装置およびメディアエラー回復方法
US10846012B2 (en) Storage system for minimizing required storage capacity during remote volume replication pair duplication
WO2017085792A1 (ja) ストレージシステム、及びストレージシステムの制御方法
WO2017026070A1 (ja) ストレージシステム及びストレージ管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120605

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120628

R150 Certificate of patent or registration of utility model

Ref document number: 5032620

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350