JP2011186544A - ディスクアレイ装置及びその制御方法 - Google Patents

ディスクアレイ装置及びその制御方法 Download PDF

Info

Publication number
JP2011186544A
JP2011186544A JP2010048219A JP2010048219A JP2011186544A JP 2011186544 A JP2011186544 A JP 2011186544A JP 2010048219 A JP2010048219 A JP 2010048219A JP 2010048219 A JP2010048219 A JP 2010048219A JP 2011186544 A JP2011186544 A JP 2011186544A
Authority
JP
Japan
Prior art keywords
data
storage
storages
child
tier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010048219A
Other languages
English (en)
Other versions
JP5429692B2 (ja
Inventor
Ayako Sakuma
彩子 佐久間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010048219A priority Critical patent/JP5429692B2/ja
Publication of JP2011186544A publication Critical patent/JP2011186544A/ja
Application granted granted Critical
Publication of JP5429692B2 publication Critical patent/JP5429692B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】本発明は、信頼性を維持させつつ、データを蓄積させるスペースを増大させ得るディスクアレイ装置を提案する。
【解決手段】ホスト装置から送信されるデータを冗長化してストレージに書き込むディスクアレイ装置であって、前記データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、前記ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの数の情報に基づいて、同一のデータを保持するストレージの数の情報を算出する第1の算出部と、前記第1の算出部により算出された前記同一のデータを保持するストレージの数の前記ストレージに、前記データの書込み指示を行う書込み指示部を備えることを特徴とする。
【選択図】図1

Description

本発明は、複数のストレージに同一情報を保持させるディスクアレイ装置及びその制御方法に関する。
情報技術の発展に伴い、ハードディスクドライブ等により構成されるストレージに蓄積されるデータ量は急激に増加している。特に、半永久的に保存するようなデータに関しては、データは増加する一方である。一方、ストレージの障害による大量のデータ消失は多大な損失を生じるため、障害対策としてデータの冗長化は、多くのディスクアレイ装置で採用されている。
従来のディスクアレイ装置におけるデータの冗長化には、主に次の2種類がある。すなわち、(1)全てのストレージに、同一データを保持させることによりデータを冗長化する方法、及び(2)一部のストレージにのみ同一データを保持させ、データに対しそれを保持するストレージを対応付けるための管理サーバを仲介させることによりデータを冗長化する方法である。
また、データを冗長化するディスクアレイ装置として、例えば、ストレージ、又はストレージのグループが属するストレージクラス毎に要求多重度を設定し、要求多重度に基づいてデータの冗長化を行うディスクアレイ装置が開示されている(例えば、特許文献1参照)。なお、ストレージクラスとは、データ、又はデータを格納する領域(ディレクトリ等)に対する入出力応答目標時間(ホストアクセス目標時間)やバックアップの有無等のストレージ属性のリストである。
特開2007−241334号公報
(1)の方法は、ストレージにおける耐障害性が高く、サーバがどのストレージからもデータを得ることができるため、データ読み込み時のアクセスを分散することができるという利点がある。しかしながら、(1)の方法は、ストレージの数が増加するほど、データの書き込みに時間がかかる共に、全てのデータを冗長化するのでストレージのディスク使用量が大きくなることから、全体的なパフォーマンスが悪くなるという問題がある。
また、(2)の方法は、データの冗長化を一部のストレージに制限することにより、(1)の方法に比べて、データの書き込みに要する時間やストレージのディスク使用量を節約することができるという利点がある。しかしながら、(2)の方法は、アクセスが一時的に集中した場合に、サーバとストレージを仲介する管理サーバの負荷が急激に高まることや、管理サーバに障害が発生した場合にストレージにアクセスすることができなくなることから、管理サーバに対して障害対策を講じる必要が生じ、コストがかかるという問題がある。
さらに、特許文献1のディスクアレイ装置は、ホストアクセス目標時間やバックアップの有無等により要求多重度を設定してデータの冗長化を行っているが、このような要求多重度ではデータを冗長化するのに適切なストレージの台数を算出することができないおそれがある。データを冗長化するのに適切なストレージの台数以上にデータを保持することは、ストレージの負荷を増大させ、障害発生率を高める原因となるだけでなく、新たなデータを蓄積させるスペースを浪費するおそれがある。
本発明は以上の点を考慮してなされたものであり、信頼性を維持させつつ、データを蓄積させるスペースを増大させ得るディスクアレイ装置及びその制御方法を提案するものである。
かかる課題を解決するために本発明は、ホスト装置から送信されるデータを冗長化してストレージに書き込むディスクアレイ装置であって、前記データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、前記ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの数の情報に基づいて、同一のデータを保持するストレージの数の情報を算出する第1の算出部と、前記第1の算出部により算出された前記同一のデータを保持するストレージの数の前記ストレージに、前記データの書込み指示を行う書込み指示部を備えることを特徴とする。
また、本発明は、ホスト装置から送信されるデータを冗長化してストレージに書き込むディスクアレイ装置の制御方法であって、第1の算出部が、前記データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、前記ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの数の情報に基づいて、同一のデータを保持するストレージの数の情報を算出する第1のステップと、書込み指示部が、前記第1の算出部により算出された前記同一のデータを保持するストレージの数の前記ストレージに、前記データの書込み指示を行う第2のステップとを備えることを特徴とする。
従って、同一のデータを保持させるストレージの数を制限しつつも、データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの数の情報に関する要件を満たすディスクアレイ装置及びその制御方法を構築することができる。
本発明によれば、信頼性を維持させつつ、データを蓄積させるスペースを増大させ得るディスクアレイ装置及びその制御方法を実現することができる。
ストレージシステムのハードウェア構成を示すブロック図の一例である。 コントローラ部5の機能的構成を示すブロック図の一例である。 同一データ保持ツリー構造作成処理手順を示すフローチャートの一例である。 同一データ保持ツリー構造を説明するための概念図の一例である。 データ書込み処理手順を示すフローチャートの一例である。 データ読出し処理手順を示すフローチャートの一例である。 他実施形態のディスクアレイ装置の構成を示すブロック図の一例である。 他実施形態のストレージシステムの構成を示すブロック図の一例である。
以下、本発明の一実施の形態を、図面を参照して詳細に説明する。なお、これにより本発明が限定されるものではない。
図1は、本実施の形態によるストレージシステム1のハードウェア構成の一例を示している。ストレージシステム1は、複数のホスト装置2がネックワーク3を介してディスクアレイ装置4に接続されることにより構成されている。
ホスト装置2は、例えば、CPU(Central Processing Unit)やメモリ等の情報処理資源、情報入力装置、情報出力装置(図示せず)を備えたコンピュータ装置であり、例えば、パーソナルコンピュータ等として構成される。ネットワーク3は、例えば、LAN(Local Area Network)、SAN(Storage Area Network)、インターネット、専用回線、公衆回線等を場合に応じて適宜用いることができる。なお、ネットワーク3及びディスクアレイ装置4間には、サーバ装置を設けるようにしても良い。この場合、ホスト装置2は、ネットワーク3及びサーバ装置を仲介してディスクアレイ装置4にアクセスすることができる。
ディスクアレイ装置4は、例えば、コントローラ部5及び記憶部6により構成されている。ディスクアレイ装置4は、コントローラ部5を最低1つ備えている。コントローラ部5は、当該ディスクアレイ装置4全体を制御する。記憶部6は、ホスト装置2から送信されるデータを格納する複数のディスク装置7から構成されている。
コントローラ部5は、ホストインタフェース11、CPU12、メモリ13及びディスクインタフェース14により構成されている。ホストインタフェース11は、ホスト装置2とネットワーク3を介して接続され、ホスト装置2から送信される各種要求やデータの送受信を制御する。ホストインタフェース11は、ネットワーク3の種類に応じた種々のインタフェースを用いることができる。
CPU12は、コントローラ部5ごとに1つ備えられる。CPU12は、コントローラ部5全体を制御し、ホストインタフェース11から送信されるコマンドを解釈して、各構成要素に指示を送信する。メモリ13は、ホスト装置2から受信したデータを一時的に格納する。また、メモリ13は、コントローラ部5内部で使用する各種プログラムや、各種テーブルを格納する。
ディスクインタフェース14は、記憶部6のディスク装置7と接続され、ホスト装置2から送信されるデータの送受信を制御する。ディスクインタフェース14は、ファイバチャネル、SAS(Serial Attached SCSI)、SATA(Serial ATA)等の種類に応じた種々のインタフェースを用いることができる。
図2は、本実施の形態によるコントローラ部5の機能的構成の一例を示している。コントローラ部5は、例えば、ストレージアクセス手段21(書込み指示部)、ストレージ認識手段22(第1の算出部)、ストレージ決定手段23(第1の算出部)、データ複製方法決定手段24(第2の算出部)、ツリー構造作成手段25(ツリー構造作成部)及びツリー構造設定情報記憶部26により構成されている。ストレージ決定手段23は、ユーザ要件設定手段31、システム要件設定手段32、最大アクセス回数算出手段33及び限界値算出手段34により構成されている。
ストレージアクセス手段21、ストレージ認識手段22、ストレージ決定手段23、データ複製方法決定手段24、ツリー構造作成手段25は、主にCPU12がメモリ13に格納されるプログラムを実行し、各ハードウェアを制御することによって実現することができる。また、ツリー構造設定情報記憶部26は、メモリ13やディスク装置7を用いて実現することができる。
ストレージアクセス手段21は、読書き要求に基づいて、ディスク装置7(ストレージ)にアクセスし、例えば、ホスト装置2から送信されるデータをストレージに書き込む一方、当該ストレージに格納されているデータを読み出してホスト装置2に送信する。
ストレージ認識手段22は、ストレージアクセス手段21を介して正常稼働状態にあるストレージの台数及び当該ストレージのストレージIDを認識する。ストレージ認識手段22は、認識した正常稼働状態にあるストレージの台数情報及びストレージIDをストレージ決定手段23、データ複製方法決定手段24、及びツリー構造作成手段25に送信する。ストレージ認識手段22は、一定時間ごとにストレージの台数及びストレージIDの認識を行うため、正常稼働状態にあるストレージの台数及びストレージIDの変化を検出することができる。
ストレージ決定手段23のユーザ要件設定手段31は、ユーザの入力に基づいて、ホスト装置2がデータ読出し要求を送信したときに、ホスト装置2がレスポンスタイムとして許容することができる最大の時間の情報であるレスポンス許容時間情報、及びデータの読み出しに成功する確率(100%未満)の情報である読出し成功確率情報を要件として設定する。
ストレージ決定手段23のシステム要件設定手段32は、ユーザの入力に基づいて、ストレージに対して1回のアクセスに要する時間の情報であるアクセス時間情報を要件として設定する。当該アクセス時間情報は、ストレージシステム1の構築時に測定される既知の値である。
ストレージ決定手段23の最大アクセス回数算出手段33は、ユーザ要件設定手段31により設定されたレスポンス許容時間情報、及びシステム要件設定手段32により設定されたアクセス時間情報に基づいて、1回のデータデータ読出しコマンドの間に、ストレージにアクセスすることができる最大の回数の情報である最大アクセス回数情報を算出する。
すなわち、レスポンス許容時間(s)をt、アクセス時間(s)をkとすると、最大アクセス回数(回)であるmは、以下の計算式により算出される。
Figure 2011186544
ストレージ決定手段23の限界値算出手段34は、上記読出し成功確率情報、最大アクセス回数算出手段33により算出された最大アクセス回数情報、及び正常稼働状態にあるストレージの台数情報に基づいて、同一のデータを保持するのに適切なストレージの台数の情報である同一データ保持ストレージ台数情報を算出する。
すなわち、読出し成功確率をP、最大アクセス回数(回)をm、正常稼働状態にあるストレージの台数をNとすると、同一データ保持ストレージ台数であるIは、以下の計算式を満たす最小の整数として算出される。
Figure 2011186544
また、限界値算出手段34は、算出したストレージ台数情報をデータ複製方法決定手段24に送信する。
データ複製方法決定手段24は、ユーザの入力により予め設定された、同一データ保持ツリー構造(後述)の分岐数情報、正常稼働状態にあるストレージの台数情報に基づいて、分岐した子ストレージ(後述)のうちデータを保持する子ストレージの数の情報、同一データ保持ツリー構造の階層数、同一データ保持ツリー構造の最終階層部分の要素数の情報を算出する。
すなわち、正常稼働状態にあるストレージの台数をN、同一データ保持ツリー構造の分岐数をbとすると、分岐した子ストレージのうちデータを保持する子ストレージの数であるa、同一データ保持ツリー構造の階層数であるp、同一データ保持ツリー構造の最終階層部分の要素数であるqは、以下の計算式を満たす整数として算出される。但し、aは、b>aとなる整数である。
Figure 2011186544
すなわち、データ複製方法決定手段24は、1台のストレージに接続される子ストレージの数を、ツリー構造の第1階層から最終階層までの数で順にべき乗し、それぞれべき乗した数の総和に、最終階層部分のストレージの台数を加えた台数が、正常稼働状態にあるストレージの台数となるように、最終階層の数、最終階層のストレージの台数を算出する。
また、データ複製方法決定手段24は、限界値算出手段34により算出された同一データ保持ストレージ台数情報に基づいて、分岐した子ストレージのうちデータを保持する子ストレージの数の情報、同一データ保持ツリー構造の階層数のうちデータを保持する子ストレージが存在する階層の数の情報、同一データ保持ツリー構造の最終階層部分の要素数のうちデータを保持する要素数の情報を算出する。
すなわち、同一データ保持ストレージ台数をIとすると、分岐した子ストレージのうちデータを保持する子ストレージの数a、同一データ保持ツリー構造の階層数pのうちデータを保持する子ストレージが存在する階層の数であるr、同一データ保持ツリー構造の最終階層部分の要素数qのうちデータを保持する要素数sは、以下の計算式を満たす整数として算出される。
Figure 2011186544
すなわち、データ複製方法決定手段24は、子ストレージのうちデータを保持する子ストレージの数を、第1階層から最終階層のうちデータを保持する子ストレージが存在する階層までの数で順にべき乗し、それぞれべき乗した数の総和に、最終階層のストレージのうちデータを保持する子ストレージの数を加えた数が、同一のデータを保持するストレージの数となるように、データを保持する子ストレージの数、最終階層のうちデータを保持する子ストレージが存在する階層、及び最終階層のストレージのうちデータを保持する子ストレージの数を算出する。
そして、データ複製方法決定手段24は、b及び算出されたa、p、q、r、sをツリー構造設定情報記憶部26に記憶する。a、b、p、q、r、sは、同一データ保持ツリー構造を作成するために必要な情報(以下、ツリー構造設定情報と呼ぶ)である。
ツリー構造作成手段25は、データ書込み時において、選択ストレージ(後述)又は子ストレージ(後述)から選択ストレージのストレージIDを受信すると、同一データ保持ツリー構造を作成する。
ここで、ツリー構造作成手段25の同一データ保持ツリー構造作成処理について、図3のフローチャートを参照して説明する。ツリー構造作成手段25は、選択ストレージ又は子ストレージから選択ストレージIDを受信すると(ステップSP1)、ツリー構造設定情報記憶部26に記憶されているツリー構造設定情報を読み出す(ステップSP2)。
続いて、ツリー構造作成手段25は、ツリー構造設定情報記憶部26から読み出したツリー構造設定情報、又は子ストレージから受信したツリー構造設定情報に基づいて、ツリー構造を決定する(ステップSP3)。続いて、ツリー構造作成手段25は、受信した選択ストレージIDに基づいて、疑似乱数を発生させる(ステップSP4)。
続いて、ツリー構造作成手段25は、選択ストレージのストレージIDを頂点として決定したツリー構造にマッピングすると共に、発生させた疑似乱数に基づいて、ストレージ認識手段22から受信した正常稼働状態にあるストレージのストレージIDをマッピングすることにより、同一データ保持ツリー構造を作成し(ステップSP5)、同一データ保持ツリー構造作成処理を終了する(ステップSP6)。
同一データ保持ツリー構造は、選択ストレージのストレージIDを頂点とし、当該ストレージIDから一意に決定する木構造を、擬似乱数を用いて作成される。同一データ保持ツリー構造は、選択ストレージID及び当該選択ストレージIDに基づく疑似乱数によって作成されるため、一意に決定される。同一データ保持ツリー構造は、ツリー構造設定情報が変更されるため、それに伴って作成し直される。
図4は、同一データ保持ツリー構造の分岐数であるbが「3」、分岐した子ストレージのうちデータを保持する子ストレージの数であるaが「2」であるときの同一データ保持ツリー構造の一例を示している。同一データ保持ツリー構造では、親ストレージに対する子ストレージの数が一定であることから、1台のストレージにかかる複製における負荷を分散させることができる。
次に、データ書込み処理について、図5のフローチャートを参照して説明する。
ストレージアクセス手段21は、ホスト装置2から書込み要求を受信すると、ランダムに所定のストレージ(以下、選択ストレージと呼ぶ)を選択し、当該選択ストレージに書込みコマンド及びデータを送信する(ステップSP11)。
選択ストレージは、書込みコマンド及びデータを受信すると、書込みコマンドに基づいて、データを自己の記憶領域に書き込むと共に、自己のストレージID(以下、選択ストレージIDと呼ぶ)をツリー構造作成手段25に送信する(ステップSP12)。
ツリー構造作成手段25は、選択ストレージから選択ストレージIDを受信すると、上述した同一データ保持ツリー構造作成処理を実行して、同一データ保持ツリー構造を作成し、当該同一データ保持ツリー構造、及びツリー構造設定情報記憶部26から読み出したツリー構造設定情報を選択ストレージに返信する(ステップSP13)。
選択ストレージは、データの書込みを終了すると、ストレージアクセス手段21に書込み終了コマンドを送信する(ステップSP14)。また、選択ストレージは、ツリー構造作成手段25から受信した同一データ保持ツリー構造を参照し、同一データ保持ツリー構造における自己の位置を確認した上で、自己と接続されている下層のストレージ(以下、子ストレージと呼ぶ)のうちデータを複製する子ストレージに、書込みコマンド、データ、選択ストレージID、及びツリー構造作成手段25から受信したツリー構造設定情報を送信する(ステップSP15)。
データを複製する子ストレージは、書込みコマンド、データ、選択ストレージID、及びツリー構造設定情報を受信すると、書込みコマンドに基づいて、データを自己の記憶領域に書き込むと共に、当該選択ストレージID及びツリー構造設定情報をツリー構造作成手段25に送信する(ステップSP16)。
ツリー構造作成手段25は、子ストレージから選択ストレージID及びツリー構造設定情報を受信すると、上述した同一データ保持ツリー構造作成処理を実行して、同一データ保持ツリー構造を作成し、当該同一データ保持ツリー構造を、子ストレージに返信する(ステップSP17)。
子ストレージは、ツリー構造作成手段25から受信した同一データ保持ツリー構造を参照して、自己と接続されている下層のストレージ(以下、同様に子ストレージと呼ぶ)が存在するか否かをチェックする(ステップSP18)。
そして、子ストレージは、さらなる子ストレージが存在する場合(ステップSP18:YES)には、ステップSP15に戻り、この後、ステップSP15−SP18の処理を繰り返す。これに対して、子ストレージは、さらなる子ストレージが存在しない場合(ステップSP18:NO)には、データ書込み処理を終了する(ステップSP19)。
次に、データ読出し処理について、図6のフローチャートを参照して説明する。
ストレージアクセス手段21は、ホスト装置2から読出し要求を受信すると、ストレージ決定手段23の最大アクセス回数算出手段33から最大アクセス回数情報を読み出す(ステップSP21)。
続いて、ストレージアクセス手段21は、ストレージのうち今まで選択されていないストレージをランダムに選択し、当該選択されたストレージに読出しコマンドを送信する(ステップSP22)。
選択されたストレージは、読出しコマンドを受信すると、読出しコマンドに基づいて、対応するデータが自己の記憶領域に存在するか否かをチェックする(ステップSP23)。そして、選択されたストレージは、対応するデータが自己の記憶領域に存在しない場合(ステップSP23:NO)には、対応するデータが存在しない旨をストレージアクセス手段21に送信する(ステップSP24)。
ストレージアクセス手段21は、対応するデータが存在しない旨を受信すると、ストレージとのアクセス数が、最大アクセス回数算出手段33から受信した最大アクセス回数情報の最大アクセス回数を超えたか否かをチェックする(ステップSP25)。
そして、ストレージアクセス手段21は、ストレージとのアクセス数が最大アクセス回数を超えていない場合(ステップSP25:NO)には、ステップSP22に戻り、この後、ステップSP22−SP25の処理を繰り返す。
これに対して、ストレージアクセス手段21は、ストレージとのアクセス数が最大アクセス回数を超えた場合(ステップSP25:YES)には、読出しコマンドに対応するデータが存在しない旨を対応するホスト装置2に送信し(ステップSP26)、データ読出し処理を終了する(ステップSP29)。
一方、選択されたストレージは、対応するデータが自己の記憶領域に存在する場合(ステップSP23:YES)には、当該対応するデータをトレージアクセス手段21に送信する(ステップSP27)。そして、ストレージアクセス手段21は、選択されたストレージから受信した読出しコマンドに対応するデータを、対応するホスト装置2に送信して(ステップSP27)、データ読出し処理を終了する(ステップSP28)。
なお、読出しコマンドに対応するデータが存在しない旨を対応するホスト装置2に送信する場合には、実際にストレージに対応するデータが存在しないのか、記憶領域に対応するデータが存在しているストレージアクセスすることができなかったのかを区別することができない。しかしながら、上述のような事象が発生する確率は、ユーザ要件設定手段31により読出し成功確率情報の読出し成功確率を満たす範囲にとどまるため、ユーザ環境に対する影響が極めて少ない。
このようにして、コントローラ部5は、ストレージ決定手段23が、データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの台数の情報を算出し、ストレージアクセス手段21が、同一のデータを保持するのに適切なストレージの台数のストレージに、データを書き込む。
従って、同一のデータを保持させるストレージの台数を制限しつつも、データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの台数の情報に関する要件を満たすコントローラ部5を構築することができる。
すなわち、コントローラ部5は、ストレージの冗長構造を保ちながらも、ストレージの記憶領域の使用量を抑えることができる。また、コントローラ部5は、ストレージの冗長構造を、レスポンス許容時間情報及び読出し成功確率情報を満たす限界値を用いて最適化することができる。
さらに、コントローラ部5は、ストレージ間でのデータ複製過程において、同一データ保持ツリー構造を利用することにより、データ複製処理における負荷を一定の値以下に分散することができる。この場合、コントローラ部5は、1台1台データの複製を行う場合に比して、複製処理の効率を上げることができる。
さらに、コントローラ部5は、レスポンス許容時間情報及び読出し成功確率情報に変更があった場合にも、変更が所定の範囲内であれば、ディスクアレイ装置の装置構成を変更することなく、複製するストレージの台数を変更することによって対応することができる。
なお、本発明は、図7に示すように、ストレージにアクセスするコントローラ部5が複数台存在し、当該コントローラ部5の負荷を調整するロードバランサ(LB)41によって、ホスト装置2から送信される各種要求の負荷分散が行われるディスクアレイ装置においても適用することができる。
また、本発明は、図8に示すように、インターネットに接続されたLAN内部に、本実施形態のディスクアレイ装置4、又はロードバランサ41によって負荷分散が行われるディスクアレイ装置を複数構築することができる。本発明は、上述のようにディスクアレイ装置を複数構築することにより、ユーザがインターネットを介して、電子化され、半永久的に保存される書籍やニュースのアーカイブなどにアクセスするストレージシステムに有効となる。
さらに、本発明は、CPU12が、ディスク装置7に対して、RAID(Redundant Arrays of Independent Disks)制御を行うことにより、ディスクアレイ装置4の信頼性、可用性及び性能を向上させる。この場合、CPU12は、ディスク装置7をRAID方式で運用する。CPU12は、1又は複数のディスク装置7により提供される物理的な記憶領域(RAIDグループ)上に、1又は複数の論理的なボリュームを設定する。そして、データは、このボリューム内に所定の大きさのブロック単位で記憶される。
本発明は、複数のストレージに同一のデータを保持させる、冗長構造のディスクアレイ装置に適用することができる。
1……ストレージシステム、2……ホスト装置、3……ネットワーク、4……ディスクアレイ装置、5……コントローラ部、6……記憶部、7……ディスク装置、11……ホストインタフェース、12……CPU、13……メモリ、14……ディスクインタフェース、21……ストレージアクセス手段、22……ストレージ認識手段、23……ストレージ決定手段、24……データ複製方法決定手段、25……ツリー構造作成手段、26……ツリー構造設定情報記憶部、31……ユーザ要件設定手段、32……システム要件設定手段、33……最大アクセス回数算出手段、34……限界値算出手段、41……ロードバランサ

Claims (5)

  1. ホスト装置から送信されるデータを冗長化してストレージに書き込むディスクアレイ装置であって、
    前記データの読み出しに成功する確率、1回のデータ読出し要求の間に、前記ストレージにアクセスすることができる最大の回数、及び正常稼働状態にあるストレージの数に基づいて、同一のデータを保持するストレージの数を算出する第1の算出部と、
    前記第1の算出部により算出された前記同一のデータを保持するストレージの数の前記ストレージに、前記データの書込み指示を行う書込み指示部
    を備えることを特徴とするディスクアレイ装置。
  2. 正常稼働状態にあるストレージの数をN、1台の前記ストレージに接続される子ストレージの数をb、ツリー構造の第1階層から最終階層までの数をp、前記最終階層のストレージの数をqとして、
    Figure 2011186544
    を満たすと共に、
    前記同一のデータを保持するストレージの数をI、前記子ストレージのうち前記データを保持する子ストレージの数をa、前記第1階層から前記最終階層のうち前記データを保持する子ストレージが存在する階層までの数をr、前記最終階層のストレージのうち前記データを保持する子ストレージの数をsとして、
    Figure 2011186544
    を満たすように、ツリー構造の第1階層から最終階層までの数p、前記最終階層のストレージの数を加えた数q、前記子ストレージのうち前記データを保持する子ストレージの数a、前記第1階層から前記最終階層のうち前記データを保持する子ストレージが存在する階層までの数r、前記最終階層のストレージのうち前記データを保持する子ストレージの数sを算出する第2の算出部と、
    1台の前記ストレージに接続される子ストレージの数b、ツリー構造の第1階層から最終階層までの数p、前記最終階層のストレージの数を加えた数q、前記子ストレージのうち前記データを保持する子ストレージの数a、前記第1階層から前記最終階層のうち前記データを保持する子ストレージが存在する階層までの数r、前記最終階層のストレージのうち前記データを保持する子ストレージの数sに基づいて、所定のストレージを頂点とし、前記同一のデータを保持するストレージにかかる負荷を分散させるようなツリー構造となる同一データ保持ツリー構造を作成するツリー構造作成部
    を備え、
    前記書込み部指示部は、
    前記同一データ保持ツリー構造を参照して、前記所定のストレージに、前記データ及び前記データの書込みコマンドを送信し、
    前記所定のストレージは、
    前記書込みコマンドに基づいて、前記データを書き込むと共に、前記同一データ保持ツリー構造を参照して、前記所定のストレージに接続されている子ストレージのうち前記データを保持する子ストレージに前記データ及び前記データの書込みコマンドを送信する
    ことを特徴とする請求項1に記載のディスクアレイ装置。
  3. 前記ツリー構造作成部は、
    前記所定のストレージのストレージIDに基づいて疑似乱数を発生させることにより、
    当該所定のストレージによって作成される前記同一データ保持ツリー構造を一意に決定する
    ことを特徴とする請求項2に記載のディスクアレイ装置。
  4. 前記第1の算出部は、
    前記ホスト装置がレスポンスタイムとして許容することができる最大の時間の情報、及び前記ストレージに対して1回のアクセスに要する時間の情報に基づいて、前記ストレージにアクセスすることができる最大の回数の情報を算出する
    ことを特徴とする請求項1に記載のディスクアレイ装置。
  5. ホスト装置から送信されるデータを冗長化してストレージに書き込むディスクアレイ装置の制御方法であって、
    第1の算出部が、前記データの読み出しに成功する確率の情報、1回のデータ読出し要求の間に、前記ストレージにアクセスすることができる最大の回数の情報、及び正常稼働状態にあるストレージの数の情報に基づいて、同一のデータを保持するストレージの数の情報を算出する第1のステップと、
    書込み指示部が、前記第1の算出部により算出された前記同一のデータを保持するストレージの数の前記ストレージに、前記データの書込み指示を行う第2のステップと
    を備えることを特徴とするディスクアレイ装置の制御方法。
JP2010048219A 2010-03-04 2010-03-04 ディスクアレイ装置及びその制御方法 Expired - Fee Related JP5429692B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010048219A JP5429692B2 (ja) 2010-03-04 2010-03-04 ディスクアレイ装置及びその制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010048219A JP5429692B2 (ja) 2010-03-04 2010-03-04 ディスクアレイ装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2011186544A true JP2011186544A (ja) 2011-09-22
JP5429692B2 JP5429692B2 (ja) 2014-02-26

Family

ID=44792763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010048219A Expired - Fee Related JP5429692B2 (ja) 2010-03-04 2010-03-04 ディスクアレイ装置及びその制御方法

Country Status (1)

Country Link
JP (1) JP5429692B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309818A (ja) * 2004-04-22 2005-11-04 Hitachi Ltd ストレージ装置、そのデータ読出方法、及びそのデータ読出プログラム
JP2007193886A (ja) * 2006-01-18 2007-08-02 Fujitsu Ltd ディスク装置、データ書込み制御方法およびコマンド制御方法
JP2008234060A (ja) * 2007-03-16 2008-10-02 Hitachi Ltd 情報処理システム及びデータ格納装置決定方法並びに管理装置
JP2009015724A (ja) * 2007-07-06 2009-01-22 Hitachi Ltd 記憶システム及び消費電力削減方法並びに情報処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005309818A (ja) * 2004-04-22 2005-11-04 Hitachi Ltd ストレージ装置、そのデータ読出方法、及びそのデータ読出プログラム
JP2007193886A (ja) * 2006-01-18 2007-08-02 Fujitsu Ltd ディスク装置、データ書込み制御方法およびコマンド制御方法
JP2008234060A (ja) * 2007-03-16 2008-10-02 Hitachi Ltd 情報処理システム及びデータ格納装置決定方法並びに管理装置
JP2009015724A (ja) * 2007-07-06 2009-01-22 Hitachi Ltd 記憶システム及び消費電力削減方法並びに情報処理装置

Also Published As

Publication number Publication date
JP5429692B2 (ja) 2014-02-26

Similar Documents

Publication Publication Date Title
US8839030B2 (en) Methods and structure for resuming background tasks in a clustered storage environment
US7133982B2 (en) Method, system, and article of manufacture for consistent copying of storage volumes
US8370302B2 (en) Method and apparatus for block based volume backup
US9703504B2 (en) Storage system, recording medium storing data rebalancing program, and data rebalancing method
US8095753B1 (en) System and method for adding a disk to a cluster as a shared resource
US8996758B2 (en) Non-disruptive configuration of a virtualization controller in a data storage system
US9785573B2 (en) Systems and methods for storage of data in a virtual storage device
US20080270727A1 (en) Data transfer in cluster storage systems
US20170228156A1 (en) Raid set initialization
CN109725830B (zh) 管理独立磁盘冗余阵列的方法、设备和存储介质
US11151056B2 (en) Efficient virtualization layer structure for a data storage system
US20160292036A1 (en) Raid 10 Reads Optimized for Solid State Drives
CN101482838A (zh) 基于写时拷贝的数据写入方法及设备
US10261710B2 (en) Volume integrity in a shared-resource environment
US10657062B2 (en) Distributed storage system and distributed storage control method wherein data stored in cache matrix, that is to be stored in said distributed storage, is tracked by columns and rows
US11003554B2 (en) RAID schema for providing metadata protection in a data storage system
KR20160081851A (ko) 분산 계산 가능한 스토리지 그룹을 구비하는 컴퓨팅 시스템 및 그것의 동작 방법
CN112379825A (zh) 基于数据特征分池的分布式数据存储方法及装置
JP5429692B2 (ja) ディスクアレイ装置及びその制御方法
US20130159765A1 (en) Storage subsystem and method for recovering data in storage subsystem
US20180307427A1 (en) Storage control apparatus and storage control method
US9977613B2 (en) Systems and methods for zone page allocation for shingled media recording disks
US11157198B2 (en) Generating merge-friendly sequential IO patterns in shared logger page descriptor tiers
US20140040349A1 (en) Server computer, server computer system, and server computer control method
WO2018235132A1 (en) DISTRIBUTED STORAGE SYSTEM

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131111

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131124

LAPS Cancellation because of no payment of annual fees