JP3950720B2 - ディスクアレイサブシステム - Google Patents

ディスクアレイサブシステム Download PDF

Info

Publication number
JP3950720B2
JP3950720B2 JP2002074847A JP2002074847A JP3950720B2 JP 3950720 B2 JP3950720 B2 JP 3950720B2 JP 2002074847 A JP2002074847 A JP 2002074847A JP 2002074847 A JP2002074847 A JP 2002074847A JP 3950720 B2 JP3950720 B2 JP 3950720B2
Authority
JP
Japan
Prior art keywords
ecc
data
ecc group
groups
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002074847A
Other languages
English (en)
Other versions
JP2003271317A5 (ja
JP2003271317A (ja
Inventor
栄寿 葛城
幹夫 福岡
孝夫 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002074847A priority Critical patent/JP3950720B2/ja
Priority to US10/368,405 priority patent/US6970973B2/en
Publication of JP2003271317A publication Critical patent/JP2003271317A/ja
Publication of JP2003271317A5 publication Critical patent/JP2003271317A5/ja
Application granted granted Critical
Publication of JP3950720B2 publication Critical patent/JP3950720B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2206/00Indexing scheme related to dedicated interfaces for computers
    • G06F2206/10Indexing scheme related to storage interfaces for computers, indexing schema related to group G06F3/06
    • G06F2206/1012Load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、コンピュータシステムに使用される記憶装置の一つであるディスクアレイサブシステムに係り、特にディスクドライブのアクセス頻度をモニターし、ディスクドライブの負荷により論理ボリュームの再配置を行うディスクアレイサブシステムに関する。
【0002】
【従来の技術】
記憶装置の信頼性を高める為、ディスクアレイ技術が用いられている。これはデービット エイ パターソンらが、ユニバーシティー・オブ・カリフォルニアレポート 第UCB/CSD/87・391号(1987年12月号)のなかで提唱している方法であるが、複数のディスクドライブをグループ化し(以下、ECCグループと称する)、冗長度を付加し、ディスクドライブの障害時に障害を回復可能としたものである。
【0003】
パターソンらによれば、ディスクアレイは信頼性のレベルにより次の6つのレベルに分類される。レベル0は複数のディスクドライブにデータを分散配置したもので、障害データを回復する為の冗長データを有しないものである。レベル1はミラーリングとも呼ばれるが、1つのディスクドライブの完全な複製のディスクドライブを有し、片方のディスクドライブで障害発生時に、複製のディスクドライブで処理を行えるようにしたものである。レベル2は冗長データにハミングコードを用いたもので、冗長データとユーザーデータを複数のディスクにまたがって配置する。
【0004】
レベル3は、ユーザーデータをビットまたはバイト単位に分割し、分割したデータを複数のディスクドライブに平行に書きこみ又は読み出しを行うものである。また冗長データを記録するディスクドライブは固定的に割り当てられる。また、各ディスクドライブの回転を同期させ、各ドライブからのリード又はライトを並列に行うものである。レベル4は、データをブロック単位に分割し、ECCグループに対して読み出し、書き込みを行う。レベル3と同様に冗長データを記録するディスクドライブは固定的に割り当てられる。またレベル3とは異なりディスクドライブの回転同期は行わない。レベル5は、レベル4と同様にデータをブロック単位に分割し、ECCグループに対して読み出し、書き込みを行う。レベル4と異なるのは、冗長データを記録するディスクドライブは固定的に割り当てられず、全てのディスクドライブに跨って冗長データを記録する。
【0005】
上記のレベル0からレベル5の中で一般的に使用されているのは、レベル1、及びレベル5である。レベル5ではデータ格納するディスクドライブの数をnとすると、n+1台のディスクドライブに跨ってデータを格納する。一般にnを大きくすれば、動作するディスクドライブの数が増えるので性能は向上するが、ECCグループ内のディスクドライブに障害が発生し、そのECCグループが使用できなくなる確率も高くなるので、nを大きくすると、信頼性が低下してしまう。
【0006】
【発明が解決しようとする課題】
本発明が解決しようとする課題は、信頼性を低下させることなく、ECCグループの性能を向上させることである。すなわち、レベル5の場合は、データを格納するディスクドライブの数nを大きくして性能を向上することが可能であるが、逆に信頼性も低下してしまう。
【0007】
この解決策として、特開平06−161837号公報に開示されている方法は、レベル5のECCグループ2個を連結させ、データを2個のECCグループに交互に配置する方法である。この方法の場合、データを格納するディスクドライブ数と、冗長データを格納するディスクドライブ数の比は変らないので、性能も向上し信頼性も低下しない。
【0008】
しかしながら、結合させるECCグループの組み合わせによっては、却って性能を低下させてしまうことが有る。例えば、ECCグループの容量が同一で、ECCグループに属する論理デバイス数が同一でも、各ECCグループのIO負荷は、上位装置の使用方法によるから、IO負荷の高いECCグループ同士を組み合わせてしまうと、性能を低下させてしまう可能性がある。また、定常的にはIO負荷が低いECCグループでも、24時間のIOを受け付けていると、ある特定の時間において一時的に負荷が高くなる場合もあり、一時的に負荷の高くなる時間帯の同じ物を組み合わせてしまうと、性能が低下する可能性がある。
【0009】
本発明の目的は、各ECCグループの使用頻度(IO負荷)をモニターし、2個以上の適切なECCグループを連結することによって、ECCグループの信頼性を低下させることなく性能向上を図ることにある。
【0010】
【課題を解決するための手段】
前記課題を解決するために、本発明は主として次のような構成を採用する。
複数の磁気ディスクドライブから構成されるECCグループを複数設け、前記複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置を設けたディスクアレイサブシステムであって、
前記ディスク制御装置は、前記複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行うディスクアレイサブシステム。
【0011】
【発明の実施の形態】
本発明の第1の実施形態に係るディスクアレイサブシステムについて、図1〜図9を参照しながら以下詳細に説明する。図1は、本発明の第1の実施形態に係るディスクアレイサブシステムに関する情報処理システムの概略図である。図1の中央処理装置10とディスク制御装置20はチャネルパス60で接続されており、ディスク制御装置20は、ホストアダプタ100と、ディスクアダプタ30と、キャッシュメモリ110と、共有メモリ140と、から成っている。ホストアダプタ100は1つ以上のマイクロプロセッサを有しておりHOSTとのI/Fを担当する。ディスクアダプタ30はドライブからのリード/ライトを行う。キャッシュメモリ110は、HOSTからの要求により発生する、リード/ライトデータを一時的に格納しておく為のメモリである。共有メモリ140は、全てのマイクロプロセッサ参照可能なメモリである。
【0012】
ディスクアダプタ30は、1つ以上のマイクロプロセッサ32と、冗長データ生成器130と、ドライブコントローラ50と、を有している。マイクロプロセッサ32のプログラムは、冗長データ生成器130を制御する冗長データ生成器制御手段34と、ドライブコントローラ50を用いてディスクドライブ300に対してリード/ライトを行う為のドライブコントローラ制御手段36と、HOSTからのリード/ライト要求に対して要求データが格納されているドライブを算出するマッピング演算手段39と、を有している。
【0013】
図2は、ホストの論理トラックと磁気ディスクのマッピングを示す図であり、ホストからの入出力データのドライブへの配置を表している。まず、磁気ディスクにおいて第1列目の一番右側に冗長データP000を配置し、第2列以降はその前列の冗長データの位置より1つ左側になるようにして、前列の冗長データ格納位置が一番左の場合は一番右側になるように冗長データP001〜を配置する。ホストの論理トラックD000〜D015は、冗長データのすぐ右側から、但し冗長データが最も右にある時には、一番左側から順にマッピングする。各列の冗長データは、各列の3つの論理トラックの値の排他的論理和を格納する。各列の論理トラックの1つに障害が発生した場合には、その列内の残りのデータと冗長データの排他的論理和で障害データを回復できる。
【0014】
図3は本実施形態に関する情報処理システムの全体構成を示す図である。図1のチャネルパス60は、260−1〜260−8に、図1のホストアダプタ100はホストアダプタ231−1,231−2に、図1のディスクアダプタ30はディスクアダプタ233−1〜233−4に、図1のキャッシュメモリ110は、キャッシュメモリ232−1〜232−2に、図1の共有メモリ140は、共有メモリ234−1〜234−2にそれぞれ対応している。
【0015】
図1ではECCグループは1つであったが、図3においては複数のECCグループを有する。各ECCグループを構成するディスクドライブは、(242−1〜242−4)、(242−5〜242−8)、(242−9〜242−12)、(242−13〜242−16)、(242−17〜242−20)、(242−21〜242−24)、(242−25〜242−28)、(242−29〜242−32)である。ディスクドライブボックス241−2に関しても同様である。
【0016】
このような構成を持つディスク制御装置20において、本発明の第1の実施形態は次の通りである。まず初めに、保守端末250より選択の基準を示すパラメータを設定する必要がある。図4にはドライブ群に配置されている論理ボリュームの再配置を行う際のパラメータを格納するテーブルを示す。パラメータは、図4のパラメータテーブル150に示す様に、結合を行うECCグループ数を示す対象ECCグループ数と、幾つのECCグループを結合させるかを示す結合数と、ECCグループのIO負荷をモニタリングする際、どの位の時間間隔でデータ要素をまとめるかを示すサンプリング周期(サンプリングを継続しているまとめの時間単位であり、例えば、図5にあるように10秒の期間)と、モニタリングする期間を示すサンプリング時間(例えば24時間というようなモニタリング期間)と、モニタリング開始時刻を示す開始時刻とがあり、保守端末によりユーザーが設定する。例えば、4つのディスクドライブからなる一のECCグループを他のECCグループ(単数)と結合させ、この結合ECCグループを3つ構成する場合に、結合数は2であり、対象ECCグループ数は3である。
【0017】
設定された値は、サービスプロセッサ235を介して共有メモリ上にあるパラメータテーブル150に格納される。その際、開始時刻として、現在時刻も同テーブルに設定する。このパラメータ設定はデフォルト値として、予め規定値を持つことにより、全てのパラメータを入力しなくとも良い。またホストIOの処理を受けながらも設定可能である。
【0018】
次に、パラメータ設定が完了した後の処理を図7で説明する。ホストからリード要求或いはライト要求が発行され、ステップ1000でホストアダプタ100から、ディスクアダプタに対しホスト要求が送信される。次にステップ1100でホスト要求がリードの場合はステップ1200に進み、ライトの場合はステップ1500に進む、リードの場合、リード対象のドライブを決定する。例えば図2でD002に対してリード要求が発行された場合、右から2番目のドライブを選択する。これはマッピング演算手段39により行われる。
【0019】
次に、ステップ1300に進み選択したドライブからデータをリードし、キャッシュメモリに格納する。次にステップ1400に進み、モニター情報の設定を行う。モニター情報の設定の動作は後述する。
【0020】
次に、ホストからの要求がライトの場合の流れを示す。ライトの場合、更新データに対応するパリティデータを、次の3つから作成する必要がある。すなわち、更新データをドライブにライトする前の旧データと旧パリティと、更新データの3つである。まずステップ1500で、旧データと旧パリティをリードするドライブを決定する。これはマッピング演算手段39により行われる。例えば、図2でD002に対するライトの場合、旧データをリードのため右から2番目のドライブを、旧パリティリードのため一番右のドライブを選択する。次にステップ1600に進み、旧データと旧パリティをリードしキャッシュメモリに格納する。
【0021】
次に、ステップ1700に進みモニター情報を設定する。この時、2回のリード(旧データと旧パリティのリード)を実行しているので、2回分のカウントを行う。次にステップ1800に進み、更新データと旧データと旧パリティから、冗長データ生成器を用いて新パリティを生成し、キャッシュメモリに格納する。次にステップ1900に進み、更新データと新パリティをドライブにライトする。ライトするドライブは旧データと旧パリティをリードしたドライブと同一である。次にステップ2000に進みモニター情報を格納する。この時2回のライトが行われているので2回分のカウントを行う。なお、ステップ1700はステップ2000の処理にまとめても良い。
【0022】
次に、モニタデータの設定処理を図8を用いて示す。この処理はモニターテーブル160に、各ECCグループの各時刻におけるIO頻度を設定することを目的としている。なお、処理に先立ち、モニターテーブル160の各要素は0クリアされているものとする。
【0023】
図8の処理の流れを以下に示す。まず初めにステップ3000で、サンプリング期間が満了しているかチェックする。パラメータテーブル150に、予め開始時刻とサンプリング時間が設定されているので、開始時刻とサンプリング時間の和をサンプリング期間の満了時刻として、現在時刻がこれを超えているかで判断する。満了していない場合は、ステップ3100に進み、リード/ライト対象のECCグループの番号を求める。各ECCグループに予め1から始まる番号を順に付けておき、どのECCグループに対するリード/ライトなのかをここでは求める。
【0024】
次に、ステップ3200に進み、経過時間を算出し、モニター情報を格納するテーブル位置を決定する。例えば2番目のECCグループに対するリード/ライトで、モニターの開始時刻と現在時刻の差が15秒の場合、2行目の2列目(+10秒の位置)とする。次にステップ3300に進み、決定したテーブル位置のカウントをアップする。この時、ドライブが動作した回数の分だけカウントアップする。例えば、ホストからライトが1回発行された場合、ドライブは4回処理を行うので、結果的にカウントは+4される。また、ドライブが動作した回数をカウントする替りに、リード/ライトの際にドライブが処理した時間を加算する方法でも良い。ここで、図5に示すように10秒毎のサンプリング周期でデータを取れば、IO負荷の経過時間(10秒)毎の分布特性を求めることができ、この特性をグラフ表示してECCグループNo毎の使用頻度を観測することができる。
【0025】
次に、結合するECCグループを選択する処理の流れを説明する。ステップ3000でサンプリング期間を満了している時、ステップ3500に進み、モニターテーブル160に採取された、ECCグループ毎のカウントの平均値を計算する。次にステップ3600に進み平均値が最大のECCグループを1つ選択する。次にステップ3700に進み、選択したECCグループと残りのECCグループの組み合わせで、平均値が最小となる組み合わせを自動的に選択する。
【0026】
結合させるECCグループの数はパラメータテーブルの結合数に指定されている数のECCグループを結合させる。たとえば、結合数に2が設定されている場合は先に決定した、平均が最大なECCグループとペアになるもう一つのECCグループを決定する。より単純にはステップ3500で平均値を求めた中で、平均値がもっとも小さい物を選択する。選択した2個のECCグループのECCグループ番号を、図6の連結指示テーブル170に格納する。連結指示テーブル170は、連結を行う数だけ結合対象のECCグループ番号を格納する。今、1組の結合対象のECCグループが決定したら、1行目に、それぞれのECCグループ番号を格納する。結合数が3(結合数が3ということは結合させるECCグループが3つということである)以上の場合でも同様に、結合の対象となるECCグループの番号を全て連結指示テーブルに格納する。
【0027】
次にステップ3900へ進み、決定した連結する組み合わせの数が、パラメータテーブル150に格納されている対象ECCグループ数分より少ない場合は、ステップ3500に戻り、上記の処理を繰り返す。ただし、一度選択したECCグループは選択対象外とする。決定した連結する組み合わせが対象ECCグループ数に達したときは、ステップ3900へ進む。ステップ3900では、連結指示テーブル170に設定したECCグループの組みを連結する処理を開始する。一度開始すると、連結が完了するまではHOSTからのリード/ライト要求とは独立に実行する。また、連結処理が開始した後は、ステップ3000以降のステップは不要な為処理をスキップする様にする。
【0028】
次に、ECCグループを連結する際の処理を図9を用いて示す。まず、図9の(1)は、ECCグループ1とECCグループ2の最初の状態である。ECCグループ1には、ユーザデータであるD000からD014と、パリティのP000からP004が4台のドライブに跨って格納されている。同様にECCグループ2には、ユーザデータであるd000からd014と、パリティのp000からp004が格納されている。
【0029】
今、ECCグループ1とECCグループ2が連結の対象として選択された場合、連結の方法はECCグループ1とECCグループ2の偶数行目を入れ替える方法とする。入れ替えを実施している行数を示すため、再配置ポインタを設け管理する。まず初めは、再配置ポインタは1であり、1行目は入れ替え対象外なのでスキップする。
【0030】
次に、再配置ポインタを1加算し、2行目に移り、2行目は偶数なので入れ替え対象とする。入れ替えはつぎの様にする。まず、ECCグループ1とECCグループ2の2行目の値を全てキャッシュメモリにリードし、ECCグループ1の2行目の値をECCグループ2の2行目、ECCグループ2の2行目をECCグループ1の2行目にライトする(図9の(2)参照)。以下同様に、偶数行目のみを入れ替えの対象とし、全部の行に対してこれを繰り返すことにより、連結が完了する。このように、ECCグループ1とECCグループ2のユーザデータ(論理ボリューム)を入れ替えて、即ち再配置して連結することによって、IOの使用頻度を全体として平均化する。
【0031】
ここで、連結を実施しているECCグループにホストからリード/ライト要求が発行された場合、再配置ポインタより下の場合は、再配置が未だ行われていないので、再配置前のマッピング論理で、リード/ライト対象のドライブを決定する。再配置ポインタより上の場合は、それが奇数行目であれば、入れ替わっていないので、再配置前のマッピング論理で、リード/ライト対象のドライブを決定する。偶数行目の場合は、ECCグループ1と2が逆転しているので、それぞれ反対側のECCグループのドライブをリード/ライト対象とする。ホストアクセス対象が、再配置ポインタと同じ位置の場合は、ECCグループ1、2の値が未だ確定していないため、再配置ポインタが1進むまでウエイトする。以上の様にしてHOST(ホスト)からのリード/ライト要求を処理しながら、即ち、上位処理装置からの処理を継続しながら、再配置処理を継続可能である。
【0032】
また、本発明の第2の実施形態は、第1の実施形態において連結を実施したECCグループを連結前の状態に分割するものである。これは次の様に行われる。第1の実施形態と同様にECCグループ毎のモニタデータを取得する。そして、サンプリング期間を満了した後、各モニタデータの平均値を求める。連結しているECCグループの中で、平均値が予め設定されている閾値より大きい場合、連結の効果が薄いとして連結状態を解除して、連結前のECCグループの状態に戻す。
【0033】
この処理は第1の実施形態と同様に、各ECCグループの偶数行目のデータをキャッシュメモリにリードして、それをお互いに反対のECCグループの同じ位置に書き込む。第1の実施形態と同様にデータの入れ替え中の行をポインタで示し、ポインタの前後でマッピング方法を変えることにより、HOSTからのリード/ライトを継続したまま、分割を実施できる。なお、モニタデータの平均値を求める替わりにモニタデータの中の最大値を求め、最大値が閾値以上の場合に分割対象と判断しても良い。また平均値の場合でも最大値の場合でも、予め設定されている閾値の替わりに、保守端末250より閾値を入力しても良い。
【0034】
さらに、本発明の第3の実施形態は、第1の実施形態において連結を実施したECCグループの片方を別なECCグループに変更するものである。これは次の様に行われる。第1の実施形態と同様にECCグループ毎のモニタデータを取得する。そして、サンプリング期間を満了した後、各モニタデータの平均値を求め、連結しているECCグループの中で、連結をしていない別なECCグループとの組み合わせでさらに平均値が低下する組み合わせを検索する。
【0035】
さらに、平均が低下する組み合わせが検出できた場合は、ペアの入れ替えを行う。入れ替えは、次の様にして行う。例えば、ECCグループ1とECCグループ2が結合されている状態から、ECCグループ2を外しECCグループ1とECCグループ3を連結する場合、ECCグループ1、2、3の2行目のデータ及びパリティをキャッシュメモリにリードして、ECCグループ1のデータ及びパリティを、ECCグループ2の同じ位置にライトし、ECCグループ2のデータ及びパリティを、ECCグループ3の同じ位置にライトし、ECCグループ3のデータ及びパリティを、ECCグループ1の同じ位置にライトする。これを全ての偶数行目について行うと、ECCグループ1とECCグループ3が連結され、ECCグループ2が連結されていない状態になる。この入れ替えの場合も、第1の実施形態の場合と同様に入れ替えを行っている行を再配置ポインタで示し、ポインタの前後でマッピング方法を変え、HOSTからのリード/ライト処理を行いながら、入れ替えを行うことが可能である。
【0036】
さらに、本発明の第4の実施形態は、第1の実施形態でモニタデータを取得した後、保守端末250の画面にモニタデータテーブルの値を表示させ、ユーザーが値を確認し、どのECCグループを結合するかを保守端末250から入力する。入力したデータは連結指示テーブルに格納され、第1の実施形態と同様にして連結が実施される。例えば、図5に示したような使用頻度の時間的経過にしたがったグラフ表示を観察して、特定の時間帯において使用頻度の最小のECCグループと最大のECCグループとを手動で結合する場合が考えられる。
【0037】
【発明の効果】
ECCグループの使用頻度(IO負荷)をモニターし、ECCグループを連結する場合に、性能的に最も効果的な組み合わせを決定することが出来る。
【図面の簡単な説明】
【図1】本発明の実施形態に係るディスクアレイサブシステムに関する情報処理システムの概略図である。
【図2】ホストの論理トラックと磁気ディスクのマッピングを示す図である。
【図3】本実施形態に関する情報処理システムの全体構成を示す図である。
【図4】ドライブ群に配置されている論理ボリュームの再配置を行う際のパラメータを格納するテーブルである。
【図5】連結前のECCグループ毎のモニタデータを格納するテーブルである。
【図6】連結対象のECCグループを表すテーブルである。
【図7】ホストからのリード/ライトに伴う処理の流れを示す図である。
【図8】モニター情報を取得する際の処理の流れを示す図である。
【図9】連結をする前後のECCグループへのデータの配置を示す図である。
【符号の説明】
10 HOST(ホスト)
20 ディスク制御装置
30 ディスクアダプタ
32 マイクロプロセッサ
34 パリティ生成器制御手段
36 ドライブコントローラ制御手段
39 マッピング演算手段
50 ドライブコントローラ
60 チャネルパス
70 ドライブパス
110 キャッシュメモリ
130 冗長データ生成器
140 共有メモリ
150 パラメータテーブル
160 モニターテーブル
170 連結指示テーブル
231−1〜231−2 ホストアダプタ
232−1〜232−2 キャッシュメモリ
233−1〜233−4 ディスクアダプタ
234−1〜234−2 共有メモリ
235 サービスプロセッサ
236 制御部内部通信バス
237−1〜237−2 データ転送バス
240 記憶制御部
241−1〜241−2 ディスクドライブボックス
242−1〜242−64 ディスクドライブ
250 保守端末
270−1〜270−8 ドライブパス
260−1〜260−8 チャネルパス
300 ディスクドライブ

Claims (3)

  1. 複数の磁気ディスクドライブから構成されるECCグループを複数設け、前記複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置を設けたディスクアレイサブシステムであって、
    前記ディスク制御装置は、前記複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
    前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
    前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
    前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
    前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行う
    ことを特徴とするディスクアレイサブシステム。
  2. 請求項1において、
    前記ECCグループ毎の前記平均値の表示データに基づいて連結対象のECCグループを手動で選択することを特徴とするディスクアレイサブシステム。
  3. 複数の磁気ディスクドライブから構成される複数のECCグループと上位装置とのデータ転送を制御するディスク制御装置であって、
    複数のECCグループ毎に所定のサンプリング期間に亘って所定のサンプリング周期でドライブの動作回数をカウントし、前記ECCグループ毎の前記カウントの平均値を算出し、
    前記ECCグループ毎の前記平均値に基づいて組み合わせる連結対象のECCグループを特定し、
    前記連結対象として特定したECCグループ間で、組み合わせ前における各ECCグループの所定行目のデータを入れ替えて再配置しECCグループを連結し、
    前記データのECCグループ間での入れ替えに際して、前記入れ替えを実施する行を表す再配置ポインタを設け、前記再配置ポインタの行位置管理に基づいて、前記上位装置からのリード/ライト要求の処理を継続しながら、前記連結対象のECCグループ間でのデータ再配置の処理を継続可能とし、
    前記サンプリング期間の満了後に再度ECCグループ毎の前記平均値を求め、前記求めた平均値に基づいて前記連結している片方のECCグループを別のECCグループに変更することで連結対象のECCグループの入れ替えを行う
    ことを特徴とするディスク制御装置。
JP2002074847A 2002-03-18 2002-03-18 ディスクアレイサブシステム Expired - Lifetime JP3950720B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002074847A JP3950720B2 (ja) 2002-03-18 2002-03-18 ディスクアレイサブシステム
US10/368,405 US6970973B2 (en) 2002-03-18 2003-02-20 Disk array system having an extended load balancing function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002074847A JP3950720B2 (ja) 2002-03-18 2002-03-18 ディスクアレイサブシステム

Publications (3)

Publication Number Publication Date
JP2003271317A JP2003271317A (ja) 2003-09-26
JP2003271317A5 JP2003271317A5 (ja) 2005-08-18
JP3950720B2 true JP3950720B2 (ja) 2007-08-01

Family

ID=28035330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002074847A Expired - Lifetime JP3950720B2 (ja) 2002-03-18 2002-03-18 ディスクアレイサブシステム

Country Status (2)

Country Link
US (1) US6970973B2 (ja)
JP (1) JP3950720B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7472246B2 (en) * 2003-04-30 2008-12-30 International Business Machines Corporation Method and system for automated memory reallocating and optimization between logical partitions
US7325062B2 (en) * 2003-04-30 2008-01-29 International Business Machines Corporation Method and system for automated adapter reallocation and optimization between logical partitions
US7478393B2 (en) * 2003-04-30 2009-01-13 International Business Machines Corporation Method for marketing to instant messaging service users
US7644228B2 (en) 2005-06-03 2010-01-05 Seagate Technology Llc Distributed storage system with global replication
US7984258B2 (en) * 2005-06-03 2011-07-19 Seagate Technology Llc Distributed storage system with global sparing
JP4327130B2 (ja) * 2005-06-24 2009-09-09 富士通株式会社 ディスクアレイアクセス動的制御装置、及び方法
JP2007122531A (ja) * 2005-10-31 2007-05-17 Hitachi Ltd 負荷分散システム及び方法
JP2008033412A (ja) * 2006-07-26 2008-02-14 Hitachi Ltd 計算機システムの性能管理方法、管理計算機、及びストレージ装置
US7991972B2 (en) * 2007-12-06 2011-08-02 International Business Machines Corporation Determining whether to use a full volume or repository for a logical copy backup space
US8122117B2 (en) * 2009-05-28 2012-02-21 Microsoft Corporation Determining an imbalance among computer-component usage
JP6318173B2 (ja) * 2013-09-24 2018-04-25 華為技術有限公司Huawei Technologies Co.,Ltd. データマイグレーション方法、データマイグレーション装置及びストレージデバイス
US10394484B2 (en) * 2016-02-26 2019-08-27 Hitachi, Ltd. Storage system
US20180032580A1 (en) * 2016-07-26 2018-02-01 Samsung Electronics Co., Ltd. Accelerating rocksdb multi-instance performance by introducing random initiation for compaction
JP6942163B2 (ja) * 2019-08-06 2021-09-29 株式会社日立製作所 ドライブボックス、ストレージシステム及びデータ転送方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592612A (en) 1995-04-28 1997-01-07 Birk; Yitzhak Method and apparatus for supplying data streams
JP3686457B2 (ja) * 1995-08-31 2005-08-24 株式会社日立製作所 ディスクアレイサブシステム
US6061761A (en) * 1997-10-06 2000-05-09 Emc Corporation Method for exchanging logical volumes in a disk array storage device in response to statistical analyses and preliminary testing
US6711649B1 (en) * 1997-10-06 2004-03-23 Emc Corporation Load balancing on disk array storage device
US6145028A (en) 1997-12-11 2000-11-07 Ncr Corporation Enhanced multi-pathing to an array of storage devices
US6266740B1 (en) 1998-07-31 2001-07-24 Emc Corporation Device sequencing and placement protection using a digital signature
US6405284B1 (en) 1998-10-23 2002-06-11 Oracle Corporation Distributing data across multiple data storage devices in a data storage system
EP1046280A1 (en) * 1998-10-30 2000-10-25 Koninklijke Philips Electronics N.V. Storage system
US6553387B1 (en) 1999-11-29 2003-04-22 Microsoft Corporation Logical volume configuration data management determines whether to expose the logical volume on-line, off-line request based on comparison of volume epoch numbers on each extents of the volume identifiers
US6526478B1 (en) * 2000-02-02 2003-02-25 Lsi Logic Corporation Raid LUN creation using proportional disk mapping
US6708265B1 (en) 2000-06-27 2004-03-16 Emc Corporation Method and apparatus for moving accesses to logical entities from one storage element to another storage element in a computer storage system
US20020138559A1 (en) 2001-01-29 2002-09-26 Ulrich Thomas R. Dynamically distributed file system

Also Published As

Publication number Publication date
US20030177310A1 (en) 2003-09-18
US6970973B2 (en) 2005-11-29
JP2003271317A (ja) 2003-09-26

Similar Documents

Publication Publication Date Title
JP3950720B2 (ja) ディスクアレイサブシステム
JP2912802B2 (ja) ディスクアレイ装置の故障対処方法および装置
US8839028B1 (en) Managing data availability in storage systems
JP5391993B2 (ja) ディスクアレイ装置
JP3078972B2 (ja) ディスクアレイ装置
JP4767139B2 (ja) ストレージ管理プログラム、ストレージ管理装置、およびストレージ管理方法
JP2501752B2 (ja) コンピユ―タ・システムのストレ―ジ装置及びデ―タのストア方法
KR100985444B1 (ko) 데이터 저장 서브시스템 및 데이터 갱신 방법
US5479611A (en) Disk array apparatus
JP5887757B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US7069382B2 (en) Method of RAID 5 write hole prevention
US6675318B1 (en) Two-dimensional storage array with prompt parity in one dimension and delayed parity in a second dimension
EP0501818A1 (en) Fault tolerant data storage apparatus including computer disk drives
CN101652752B (zh) 用于独立磁盘冗余阵列(raid)系统的文件服务器
US7743308B2 (en) Method and system for wire-speed parity generation and data rebuild in RAID systems
EP0519670A2 (en) Apparatus for maintaining fault tolerance in a disk drive array
EP0517857A4 (ja)
JP5776436B2 (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
JP6273970B2 (ja) ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法
JP2010267037A (ja) ディスクアレイ装置
JP5360666B2 (ja) 複数のディスクアレイのi/o動作を実行する方法及びシステム
US20130019122A1 (en) Storage device and alternative storage medium selection method
JPH06119126A (ja) ディスクアレイ装置
JP2004185477A (ja) 光記憶媒体アレイ装置およびデータ転送方法
JPH06119125A (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050204

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20060922

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20061012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061114

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070423

R150 Certificate of patent or registration of utility model

Ref document number: 3950720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term