JP3950720B2 - ディスクアレイサブシステム - Google Patents
ディスクアレイサブシステム Download PDFInfo
- Publication number
- JP3950720B2 JP3950720B2 JP2002074847A JP2002074847A JP3950720B2 JP 3950720 B2 JP3950720 B2 JP 3950720B2 JP 2002074847 A JP2002074847 A JP 2002074847A JP 2002074847 A JP2002074847 A JP 2002074847A JP 3950720 B2 JP3950720 B2 JP 3950720B2
- Authority
- JP
- Japan
- Prior art keywords
- ecc
- data
- ecc group
- groups
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0631—Configuration or reconfiguration of storage systems by allocating resources to storage systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2206/00—Indexing scheme related to dedicated interfaces for computers
- G06F2206/10—Indexing scheme related to storage interfaces for computers, indexing schema related to group G06F3/06
- G06F2206/1012—Load balancing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
【発明の属する技術分野】
本発明は、コンピュータシステムに使用される記憶装置の一つであるディスクアレイサブシステムに係り、特にディスクドライブのアクセス頻度をモニターし、ディスクドライブの負荷により論理ボリュームの再配置を行うディスクアレイサブシステムに関する。
【0002】
【従来の技術】
記憶装置の信頼性を高める為、ディスクアレイ技術が用いられている。これはデービット エイ パターソンらが、ユニバーシティー・オブ・カリフォルニアレポート 第UCB/CSD/87・391号(1987年12月号)のなかで提唱している方法であるが、複数のディスクドライブをグループ化し(以下、ECCグループと称する)、冗長度を付加し、ディスクドライブの障害時に障害を回復可能としたものである。
【0003】
パターソンらによれば、ディスクアレイは信頼性のレベルにより次の6つのレベルに分類される。レベル0は複数のディスクドライブにデータを分散配置したもので、障害データを回復する為の冗長データを有しないものである。レベル1はミラーリングとも呼ばれるが、1つのディスクドライブの完全な複製のディスクドライブを有し、片方のディスクドライブで障害発生時に、複製のディスクドライブで処理を行えるようにしたものである。レベル2は冗長データにハミングコードを用いたもので、冗長データとユーザーデータを複数のディスクにまたがって配置する。
【0004】
レベル3は、ユーザーデータをビットまたはバイト単位に分割し、分割したデータを複数のディスクドライブに平行に書きこみ又は読み出しを行うものである。また冗長データを記録するディスクドライブは固定的に割り当てられる。また、各ディスクドライブの回転を同期させ、各ドライブからのリード又はライトを並列に行うものである。レベル4は、データをブロック単位に分割し、ECCグループに対して読み出し、書き込みを行う。レベル3と同様に冗長データを記録するディスクドライブは固定的に割り当てられる。またレベル3とは異なりディスクドライブの回転同期は行わない。レベル5は、レベル4と同様にデータをブロック単位に分割し、ECCグループに対して読み出し、書き込みを行う。レベル4と異なるのは、冗長データを記録するディスクドライブは固定的に割り当てられず、全てのディスクドライブに跨って冗長データを記録する。
【0005】
上記のレベル0からレベル5の中で一般的に使用されているのは、レベル1、及びレベル5である。レベル5ではデータ格納するディスクドライブの数をnとすると、n+1台のディスクドライブに跨ってデータを格納する。一般にnを大きくすれば、動作するディスクドライブの数が増えるので性能は向上するが、ECCグループ内のディスクドライブに障害が発生し、そのECCグループが使用できなくなる確率も高くなるので、nを大きくすると、信頼性が低下してしまう。
【0006】
【発明が解決しようとする課題】
本発明が解決しようとする課題は、信頼性を低下させることなく、ECCグループの性能を向上させることである。すなわち、レベル5の場合は、データを格納するディスクドライブの数nを大きくして性能を向上することが可能であるが、逆に信頼性も低下してしまう。
【0007】
この解決策として、特開平06−161837号公報に開示されている方法は、レベル5のECCグループ2個を連結させ、データを2個のECCグループに交互に配置する方法である。この方法の場合、データを格納するディスクドライブ数と、冗長データを格納するディスクドライブ数の比は変らないので、性能も向上し信頼性も低下しない。
【0008】
しかしながら、結合させるECCグループの組み合わせによっては、却って性能を低下させてしまうことが有る。例えば、ECCグループの容量が同一で、ECCグループに属する論理デバイス数が同一でも、各ECCグループのIO負荷は、上位装置の使用方法によるから、IO負荷の高いECCグループ同士を組み合わせてしまうと、性能を低下させてしまう可能性がある。また、定常的にはIO負荷が低いECCグループでも、24時間のIOを受け付けていると、ある特定の時間において一時的に負荷が高くなる場合もあり、一時的に負荷の高くなる時間帯の同じ物を組み合わせてしまうと、性能が低下する可能性がある。
【0009】
本発明の目的は、各ECCグループの使用頻度(IO負荷)をモニターし、2個以上の適切なECCグループを連結することによって、ECCグループの信頼性を低下させることなく性能向上を図ることにある。
【0010】
【課題を解決するための手段】
前記課題を解決するために、本発明は主として次のような構成を採用する。
複数の磁気ディスクドライブから構成されるECCグループを複数設け、前記複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置を設けたディスクアレイサブシステムであって、
前記ディスク制御装置は、前記複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行うディスクアレイサブシステム。
【0011】
【発明の実施の形態】
本発明の第1の実施形態に係るディスクアレイサブシステムについて、図1〜図9を参照しながら以下詳細に説明する。図1は、本発明の第1の実施形態に係るディスクアレイサブシステムに関する情報処理システムの概略図である。図1の中央処理装置10とディスク制御装置20はチャネルパス60で接続されており、ディスク制御装置20は、ホストアダプタ100と、ディスクアダプタ30と、キャッシュメモリ110と、共有メモリ140と、から成っている。ホストアダプタ100は1つ以上のマイクロプロセッサを有しておりHOSTとのI/Fを担当する。ディスクアダプタ30はドライブからのリード/ライトを行う。キャッシュメモリ110は、HOSTからの要求により発生する、リード/ライトデータを一時的に格納しておく為のメモリである。共有メモリ140は、全てのマイクロプロセッサ参照可能なメモリである。
【0012】
ディスクアダプタ30は、1つ以上のマイクロプロセッサ32と、冗長データ生成器130と、ドライブコントローラ50と、を有している。マイクロプロセッサ32のプログラムは、冗長データ生成器130を制御する冗長データ生成器制御手段34と、ドライブコントローラ50を用いてディスクドライブ300に対してリード/ライトを行う為のドライブコントローラ制御手段36と、HOSTからのリード/ライト要求に対して要求データが格納されているドライブを算出するマッピング演算手段39と、を有している。
【0013】
図2は、ホストの論理トラックと磁気ディスクのマッピングを示す図であり、ホストからの入出力データのドライブへの配置を表している。まず、磁気ディスクにおいて第1列目の一番右側に冗長データP000を配置し、第2列以降はその前列の冗長データの位置より1つ左側になるようにして、前列の冗長データ格納位置が一番左の場合は一番右側になるように冗長データP001〜を配置する。ホストの論理トラックD000〜D015は、冗長データのすぐ右側から、但し冗長データが最も右にある時には、一番左側から順にマッピングする。各列の冗長データは、各列の3つの論理トラックの値の排他的論理和を格納する。各列の論理トラックの1つに障害が発生した場合には、その列内の残りのデータと冗長データの排他的論理和で障害データを回復できる。
【0014】
図3は本実施形態に関する情報処理システムの全体構成を示す図である。図1のチャネルパス60は、260−1〜260−8に、図1のホストアダプタ100はホストアダプタ231−1,231−2に、図1のディスクアダプタ30はディスクアダプタ233−1〜233−4に、図1のキャッシュメモリ110は、キャッシュメモリ232−1〜232−2に、図1の共有メモリ140は、共有メモリ234−1〜234−2にそれぞれ対応している。
【0015】
図1ではECCグループは1つであったが、図3においては複数のECCグループを有する。各ECCグループを構成するディスクドライブは、(242−1〜242−4)、(242−5〜242−8)、(242−9〜242−12)、(242−13〜242−16)、(242−17〜242−20)、(242−21〜242−24)、(242−25〜242−28)、(242−29〜242−32)である。ディスクドライブボックス241−2に関しても同様である。
【0016】
このような構成を持つディスク制御装置20において、本発明の第1の実施形態は次の通りである。まず初めに、保守端末250より選択の基準を示すパラメータを設定する必要がある。図4にはドライブ群に配置されている論理ボリュームの再配置を行う際のパラメータを格納するテーブルを示す。パラメータは、図4のパラメータテーブル150に示す様に、結合を行うECCグループ数を示す対象ECCグループ数と、幾つのECCグループを結合させるかを示す結合数と、ECCグループのIO負荷をモニタリングする際、どの位の時間間隔でデータ要素をまとめるかを示すサンプリング周期(サンプリングを継続しているまとめの時間単位であり、例えば、図5にあるように10秒の期間)と、モニタリングする期間を示すサンプリング時間(例えば24時間というようなモニタリング期間)と、モニタリング開始時刻を示す開始時刻とがあり、保守端末によりユーザーが設定する。例えば、4つのディスクドライブからなる一のECCグループを他のECCグループ(単数)と結合させ、この結合ECCグループを3つ構成する場合に、結合数は2であり、対象ECCグループ数は3である。
【0017】
設定された値は、サービスプロセッサ235を介して共有メモリ上にあるパラメータテーブル150に格納される。その際、開始時刻として、現在時刻も同テーブルに設定する。このパラメータ設定はデフォルト値として、予め規定値を持つことにより、全てのパラメータを入力しなくとも良い。またホストIOの処理を受けながらも設定可能である。
【0018】
次に、パラメータ設定が完了した後の処理を図7で説明する。ホストからリード要求或いはライト要求が発行され、ステップ1000でホストアダプタ100から、ディスクアダプタに対しホスト要求が送信される。次にステップ1100でホスト要求がリードの場合はステップ1200に進み、ライトの場合はステップ1500に進む、リードの場合、リード対象のドライブを決定する。例えば図2でD002に対してリード要求が発行された場合、右から2番目のドライブを選択する。これはマッピング演算手段39により行われる。
【0019】
次に、ステップ1300に進み選択したドライブからデータをリードし、キャッシュメモリに格納する。次にステップ1400に進み、モニター情報の設定を行う。モニター情報の設定の動作は後述する。
【0020】
次に、ホストからの要求がライトの場合の流れを示す。ライトの場合、更新データに対応するパリティデータを、次の3つから作成する必要がある。すなわち、更新データをドライブにライトする前の旧データと旧パリティと、更新データの3つである。まずステップ1500で、旧データと旧パリティをリードするドライブを決定する。これはマッピング演算手段39により行われる。例えば、図2でD002に対するライトの場合、旧データをリードのため右から2番目のドライブを、旧パリティリードのため一番右のドライブを選択する。次にステップ1600に進み、旧データと旧パリティをリードしキャッシュメモリに格納する。
【0021】
次に、ステップ1700に進みモニター情報を設定する。この時、2回のリード(旧データと旧パリティのリード)を実行しているので、2回分のカウントを行う。次にステップ1800に進み、更新データと旧データと旧パリティから、冗長データ生成器を用いて新パリティを生成し、キャッシュメモリに格納する。次にステップ1900に進み、更新データと新パリティをドライブにライトする。ライトするドライブは旧データと旧パリティをリードしたドライブと同一である。次にステップ2000に進みモニター情報を格納する。この時2回のライトが行われているので2回分のカウントを行う。なお、ステップ1700はステップ2000の処理にまとめても良い。
【0022】
次に、モニタデータの設定処理を図8を用いて示す。この処理はモニターテーブル160に、各ECCグループの各時刻におけるIO頻度を設定することを目的としている。なお、処理に先立ち、モニターテーブル160の各要素は0クリアされているものとする。
【0023】
図8の処理の流れを以下に示す。まず初めにステップ3000で、サンプリング期間が満了しているかチェックする。パラメータテーブル150に、予め開始時刻とサンプリング時間が設定されているので、開始時刻とサンプリング時間の和をサンプリング期間の満了時刻として、現在時刻がこれを超えているかで判断する。満了していない場合は、ステップ3100に進み、リード/ライト対象のECCグループの番号を求める。各ECCグループに予め1から始まる番号を順に付けておき、どのECCグループに対するリード/ライトなのかをここでは求める。
【0024】
次に、ステップ3200に進み、経過時間を算出し、モニター情報を格納するテーブル位置を決定する。例えば2番目のECCグループに対するリード/ライトで、モニターの開始時刻と現在時刻の差が15秒の場合、2行目の2列目(+10秒の位置)とする。次にステップ3300に進み、決定したテーブル位置のカウントをアップする。この時、ドライブが動作した回数の分だけカウントアップする。例えば、ホストからライトが1回発行された場合、ドライブは4回処理を行うので、結果的にカウントは+4される。また、ドライブが動作した回数をカウントする替りに、リード/ライトの際にドライブが処理した時間を加算する方法でも良い。ここで、図5に示すように10秒毎のサンプリング周期でデータを取れば、IO負荷の経過時間(10秒)毎の分布特性を求めることができ、この特性をグラフ表示してECCグループNo毎の使用頻度を観測することができる。
【0025】
次に、結合するECCグループを選択する処理の流れを説明する。ステップ3000でサンプリング期間を満了している時、ステップ3500に進み、モニターテーブル160に採取された、ECCグループ毎のカウントの平均値を計算する。次にステップ3600に進み平均値が最大のECCグループを1つ選択する。次にステップ3700に進み、選択したECCグループと残りのECCグループの組み合わせで、平均値が最小となる組み合わせを自動的に選択する。
【0026】
結合させるECCグループの数はパラメータテーブルの結合数に指定されている数のECCグループを結合させる。たとえば、結合数に2が設定されている場合は先に決定した、平均が最大なECCグループとペアになるもう一つのECCグループを決定する。より単純にはステップ3500で平均値を求めた中で、平均値がもっとも小さい物を選択する。選択した2個のECCグループのECCグループ番号を、図6の連結指示テーブル170に格納する。連結指示テーブル170は、連結を行う数だけ結合対象のECCグループ番号を格納する。今、1組の結合対象のECCグループが決定したら、1行目に、それぞれのECCグループ番号を格納する。結合数が3(結合数が3ということは結合させるECCグループが3つということである)以上の場合でも同様に、結合の対象となるECCグループの番号を全て連結指示テーブルに格納する。
【0027】
次にステップ3900へ進み、決定した連結する組み合わせの数が、パラメータテーブル150に格納されている対象ECCグループ数分より少ない場合は、ステップ3500に戻り、上記の処理を繰り返す。ただし、一度選択したECCグループは選択対象外とする。決定した連結する組み合わせが対象ECCグループ数に達したときは、ステップ3900へ進む。ステップ3900では、連結指示テーブル170に設定したECCグループの組みを連結する処理を開始する。一度開始すると、連結が完了するまではHOSTからのリード/ライト要求とは独立に実行する。また、連結処理が開始した後は、ステップ3000以降のステップは不要な為処理をスキップする様にする。
【0028】
次に、ECCグループを連結する際の処理を図9を用いて示す。まず、図9の(1)は、ECCグループ1とECCグループ2の最初の状態である。ECCグループ1には、ユーザデータであるD000からD014と、パリティのP000からP004が4台のドライブに跨って格納されている。同様にECCグループ2には、ユーザデータであるd000からd014と、パリティのp000からp004が格納されている。
【0029】
今、ECCグループ1とECCグループ2が連結の対象として選択された場合、連結の方法はECCグループ1とECCグループ2の偶数行目を入れ替える方法とする。入れ替えを実施している行数を示すため、再配置ポインタを設け管理する。まず初めは、再配置ポインタは1であり、1行目は入れ替え対象外なのでスキップする。
【0030】
次に、再配置ポインタを1加算し、2行目に移り、2行目は偶数なので入れ替え対象とする。入れ替えはつぎの様にする。まず、ECCグループ1とECCグループ2の2行目の値を全てキャッシュメモリにリードし、ECCグループ1の2行目の値をECCグループ2の2行目、ECCグループ2の2行目をECCグループ1の2行目にライトする(図9の(2)参照)。以下同様に、偶数行目のみを入れ替えの対象とし、全部の行に対してこれを繰り返すことにより、連結が完了する。このように、ECCグループ1とECCグループ2のユーザデータ(論理ボリューム)を入れ替えて、即ち再配置して連結することによって、IOの使用頻度を全体として平均化する。
【0031】
ここで、連結を実施しているECCグループにホストからリード/ライト要求が発行された場合、再配置ポインタより下の場合は、再配置が未だ行われていないので、再配置前のマッピング論理で、リード/ライト対象のドライブを決定する。再配置ポインタより上の場合は、それが奇数行目であれば、入れ替わっていないので、再配置前のマッピング論理で、リード/ライト対象のドライブを決定する。偶数行目の場合は、ECCグループ1と2が逆転しているので、それぞれ反対側のECCグループのドライブをリード/ライト対象とする。ホストアクセス対象が、再配置ポインタと同じ位置の場合は、ECCグループ1、2の値が未だ確定していないため、再配置ポインタが1進むまでウエイトする。以上の様にしてHOST(ホスト)からのリード/ライト要求を処理しながら、即ち、上位処理装置からの処理を継続しながら、再配置処理を継続可能である。
【0032】
また、本発明の第2の実施形態は、第1の実施形態において連結を実施したECCグループを連結前の状態に分割するものである。これは次の様に行われる。第1の実施形態と同様にECCグループ毎のモニタデータを取得する。そして、サンプリング期間を満了した後、各モニタデータの平均値を求める。連結しているECCグループの中で、平均値が予め設定されている閾値より大きい場合、連結の効果が薄いとして連結状態を解除して、連結前のECCグループの状態に戻す。
【0033】
この処理は第1の実施形態と同様に、各ECCグループの偶数行目のデータをキャッシュメモリにリードして、それをお互いに反対のECCグループの同じ位置に書き込む。第1の実施形態と同様にデータの入れ替え中の行をポインタで示し、ポインタの前後でマッピング方法を変えることにより、HOSTからのリード/ライトを継続したまま、分割を実施できる。なお、モニタデータの平均値を求める替わりにモニタデータの中の最大値を求め、最大値が閾値以上の場合に分割対象と判断しても良い。また平均値の場合でも最大値の場合でも、予め設定されている閾値の替わりに、保守端末250より閾値を入力しても良い。
【0034】
さらに、本発明の第3の実施形態は、第1の実施形態において連結を実施したECCグループの片方を別なECCグループに変更するものである。これは次の様に行われる。第1の実施形態と同様にECCグループ毎のモニタデータを取得する。そして、サンプリング期間を満了した後、各モニタデータの平均値を求め、連結しているECCグループの中で、連結をしていない別なECCグループとの組み合わせでさらに平均値が低下する組み合わせを検索する。
【0035】
さらに、平均が低下する組み合わせが検出できた場合は、ペアの入れ替えを行う。入れ替えは、次の様にして行う。例えば、ECCグループ1とECCグループ2が結合されている状態から、ECCグループ2を外しECCグループ1とECCグループ3を連結する場合、ECCグループ1、2、3の2行目のデータ及びパリティをキャッシュメモリにリードして、ECCグループ1のデータ及びパリティを、ECCグループ2の同じ位置にライトし、ECCグループ2のデータ及びパリティを、ECCグループ3の同じ位置にライトし、ECCグループ3のデータ及びパリティを、ECCグループ1の同じ位置にライトする。これを全ての偶数行目について行うと、ECCグループ1とECCグループ3が連結され、ECCグループ2が連結されていない状態になる。この入れ替えの場合も、第1の実施形態の場合と同様に入れ替えを行っている行を再配置ポインタで示し、ポインタの前後でマッピング方法を変え、HOSTからのリード/ライト処理を行いながら、入れ替えを行うことが可能である。
【0036】
さらに、本発明の第4の実施形態は、第1の実施形態でモニタデータを取得した後、保守端末250の画面にモニタデータテーブルの値を表示させ、ユーザーが値を確認し、どのECCグループを結合するかを保守端末250から入力する。入力したデータは連結指示テーブルに格納され、第1の実施形態と同様にして連結が実施される。例えば、図5に示したような使用頻度の時間的経過にしたがったグラフ表示を観察して、特定の時間帯において使用頻度の最小のECCグループと最大のECCグループとを手動で結合する場合が考えられる。
【0037】
【発明の効果】
ECCグループの使用頻度(IO負荷)をモニターし、ECCグループを連結する場合に、性能的に最も効果的な組み合わせを決定することが出来る。
【図面の簡単な説明】
【図1】本発明の実施形態に係るディスクアレイサブシステムに関する情報処理システムの概略図である。
【図2】ホストの論理トラックと磁気ディスクのマッピングを示す図である。
【図3】本実施形態に関する情報処理システムの全体構成を示す図である。
【図4】ドライブ群に配置されている論理ボリュームの再配置を行う際のパラメータを格納するテーブルである。
【図5】連結前のECCグループ毎のモニタデータを格納するテーブルである。
【図6】連結対象のECCグループを表すテーブルである。
【図7】ホストからのリード/ライトに伴う処理の流れを示す図である。
【図8】モニター情報を取得する際の処理の流れを示す図である。
【図9】連結をする前後のECCグループへのデータの配置を示す図である。
【符号の説明】
10 HOST(ホスト)
20 ディスク制御装置
30 ディスクアダプタ
32 マイクロプロセッサ
34 パリティ生成器制御手段
36 ドライブコントローラ制御手段
39 マッピング演算手段
50 ドライブコントローラ
60 チャネルパス
70 ドライブパス
110 キャッシュメモリ
130 冗長データ生成器
140 共有メモリ
150 パラメータテーブル
160 モニターテーブル
170 連結指示テーブル
231−1〜231−2 ホストアダプタ
232−1〜232−2 キャッシュメモリ
233−1〜233−4 ディスクアダプタ
234−1〜234−2 共有メモリ
235 サービスプロセッサ
236 制御部内部通信バス
237−1〜237−2 データ転送バス
240 記憶制御部
241−1〜241−2 ディスクドライブボックス
242−1〜242−64 ディスクドライブ
250 保守端末
270−1〜270−8 ドライブパス
260−1〜260−8 チャネルパス
300 ディスクドライブ
Claims (3)
- 複数の磁気ディスクドライブから構成されるECCグループを複数設け、前記複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置を設けたディスクアレイサブシステムであって、
前記ディスク制御装置は、前記複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行う
ことを特徴とするディスクアレイサブシステム。 - 請求項1において、
前記ECCグループ毎の前記平均値の表示データに基づいて連結対象のECCグループを手動で選択することを特徴とするディスクアレイサブシステム。 - 複数の磁気ディスクドライブから構成される複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置であって、
複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行う
ことを特徴とするディスク制御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002074847A JP3950720B2 (ja) | 2002-03-18 | 2002-03-18 | ディスクアレイサブシステム |
US10/368,405 US6970973B2 (en) | 2002-03-18 | 2003-02-20 | Disk array system having an extended load balancing function |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002074847A JP3950720B2 (ja) | 2002-03-18 | 2002-03-18 | ディスクアレイサブシステム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003271317A JP2003271317A (ja) | 2003-09-26 |
JP2003271317A5 JP2003271317A5 (ja) | 2005-08-18 |
JP3950720B2 true JP3950720B2 (ja) | 2007-08-01 |
Family
ID=28035330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002074847A Expired - Lifetime JP3950720B2 (ja) | 2002-03-18 | 2002-03-18 | ディスクアレイサブシステム |
Country Status (2)
Country | Link |
---|---|
US (1) | US6970973B2 (ja) |
JP (1) | JP3950720B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7472246B2 (en) * | 2003-04-30 | 2008-12-30 | International Business Machines Corporation | Method and system for automated memory reallocating and optimization between logical partitions |
US7325062B2 (en) * | 2003-04-30 | 2008-01-29 | International Business Machines Corporation | Method and system for automated adapter reallocation and optimization between logical partitions |
US7478393B2 (en) * | 2003-04-30 | 2009-01-13 | International Business Machines Corporation | Method for marketing to instant messaging service users |
US7644228B2 (en) | 2005-06-03 | 2010-01-05 | Seagate Technology Llc | Distributed storage system with global replication |
US7984258B2 (en) * | 2005-06-03 | 2011-07-19 | Seagate Technology Llc | Distributed storage system with global sparing |
JP4327130B2 (ja) * | 2005-06-24 | 2009-09-09 | 富士通株式会社 | ディスクアレイアクセス動的制御装置、及び方法 |
JP2007122531A (ja) * | 2005-10-31 | 2007-05-17 | Hitachi Ltd | 負荷分散システム及び方法 |
JP2008033412A (ja) * | 2006-07-26 | 2008-02-14 | Hitachi Ltd | 計算機システムの性能管理方法、管理計算機、及びストレージ装置 |
US7991972B2 (en) * | 2007-12-06 | 2011-08-02 | International Business Machines Corporation | Determining whether to use a full volume or repository for a logical copy backup space |
US8122117B2 (en) * | 2009-05-28 | 2012-02-21 | Microsoft Corporation | Determining an imbalance among computer-component usage |
JP6318173B2 (ja) * | 2013-09-24 | 2018-04-25 | 華為技術有限公司Huawei Technologies Co.,Ltd. | データマイグレーション方法、データマイグレーション装置及びストレージデバイス |
US10394484B2 (en) * | 2016-02-26 | 2019-08-27 | Hitachi, Ltd. | Storage system |
US20180032580A1 (en) * | 2016-07-26 | 2018-02-01 | Samsung Electronics Co., Ltd. | Accelerating rocksdb multi-instance performance by introducing random initiation for compaction |
JP6942163B2 (ja) * | 2019-08-06 | 2021-09-29 | 株式会社日立製作所 | ドライブボックス、ストレージシステム及びデータ転送方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5592612A (en) | 1995-04-28 | 1997-01-07 | Birk; Yitzhak | Method and apparatus for supplying data streams |
JP3686457B2 (ja) * | 1995-08-31 | 2005-08-24 | 株式会社日立製作所 | ディスクアレイサブシステム |
US6061761A (en) * | 1997-10-06 | 2000-05-09 | Emc Corporation | Method for exchanging logical volumes in a disk array storage device in response to statistical analyses and preliminary testing |
US6711649B1 (en) * | 1997-10-06 | 2004-03-23 | Emc Corporation | Load balancing on disk array storage device |
US6145028A (en) | 1997-12-11 | 2000-11-07 | Ncr Corporation | Enhanced multi-pathing to an array of storage devices |
US6266740B1 (en) | 1998-07-31 | 2001-07-24 | Emc Corporation | Device sequencing and placement protection using a digital signature |
US6405284B1 (en) | 1998-10-23 | 2002-06-11 | Oracle Corporation | Distributing data across multiple data storage devices in a data storage system |
EP1046280A1 (en) * | 1998-10-30 | 2000-10-25 | Koninklijke Philips Electronics N.V. | Storage system |
US6553387B1 (en) | 1999-11-29 | 2003-04-22 | Microsoft Corporation | Logical volume configuration data management determines whether to expose the logical volume on-line, off-line request based on comparison of volume epoch numbers on each extents of the volume identifiers |
US6526478B1 (en) * | 2000-02-02 | 2003-02-25 | Lsi Logic Corporation | Raid LUN creation using proportional disk mapping |
US6708265B1 (en) | 2000-06-27 | 2004-03-16 | Emc Corporation | Method and apparatus for moving accesses to logical entities from one storage element to another storage element in a computer storage system |
US20020138559A1 (en) | 2001-01-29 | 2002-09-26 | Ulrich Thomas R. | Dynamically distributed file system |
-
2002
- 2002-03-18 JP JP2002074847A patent/JP3950720B2/ja not_active Expired - Lifetime
-
2003
- 2003-02-20 US US10/368,405 patent/US6970973B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US20030177310A1 (en) | 2003-09-18 |
US6970973B2 (en) | 2005-11-29 |
JP2003271317A (ja) | 2003-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3950720B2 (ja) | ディスクアレイサブシステム | |
JP2912802B2 (ja) | ディスクアレイ装置の故障対処方法および装置 | |
US8839028B1 (en) | Managing data availability in storage systems | |
JP5391993B2 (ja) | ディスクアレイ装置 | |
JP3078972B2 (ja) | ディスクアレイ装置 | |
JP4767139B2 (ja) | ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法 | |
JP2501752B2 (ja) | コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法 | |
KR100985444B1 (ko) | 데이터 저장 서브시스템 및 데이터 갱신 방법 | |
US5479611A (en) | Disk array apparatus | |
JP5887757B2 (ja) | ストレージシステム、ストレージ制御装置およびストレージ制御方法 | |
US7069382B2 (en) | Method of RAID 5 write hole prevention | |
US6675318B1 (en) | Two-dimensional storage array with prompt parity in one dimension and delayed parity in a second dimension | |
EP0501818A1 (en) | Fault tolerant data storage apparatus including computer disk drives | |
CN101652752B (zh) | 用于独立磁盘冗余阵列(raid)系统的文件服务器 | |
US7743308B2 (en) | Method and system for wire-speed parity generation and data rebuild in RAID systems | |
EP0519670A2 (en) | Apparatus for maintaining fault tolerance in a disk drive array | |
EP0517857A4 (ja) | ||
JP5776436B2 (ja) | ストレージシステム、ストレージ制御装置およびストレージ制御方法 | |
JP6273970B2 (ja) | ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法 | |
JP2010267037A (ja) | ディスクアレイ装置 | |
JP5360666B2 (ja) | 複数のディスクアレイのi/o動作を実行する方法及びシステム | |
US20130019122A1 (en) | Storage device and alternative storage medium selection method | |
JPH06119126A (ja) | ディスクアレイ装置 | |
JP2004185477A (ja) | 光記憶媒体アレイ装置およびデータ転送方法 | |
JPH06119125A (ja) | ディスクアレイ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050204 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20060922 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20061012 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070417 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070423 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3950720 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110427 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120427 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130427 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140427 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |