JP2007328727A - 分散ファイル管理方法及び情報処理装置 - Google Patents

分散ファイル管理方法及び情報処理装置 Download PDF

Info

Publication number
JP2007328727A
JP2007328727A JP2006161407A JP2006161407A JP2007328727A JP 2007328727 A JP2007328727 A JP 2007328727A JP 2006161407 A JP2006161407 A JP 2006161407A JP 2006161407 A JP2006161407 A JP 2006161407A JP 2007328727 A JP2007328727 A JP 2007328727A
Authority
JP
Japan
Prior art keywords
file
subfile
read
mirror
name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006161407A
Other languages
English (en)
Inventor
Akiyuki Matsuoka
昭幸 松岡
Hidetomo Sanpei
英智 三瓶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2006161407A priority Critical patent/JP2007328727A/ja
Publication of JP2007328727A publication Critical patent/JP2007328727A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のディスク装置にファイルを分散して管理するファイルシステムにおいて記憶デバイスを増やすことなくファイルの可用性を高めることができるようにする。
【解決手段】情報処理装置は、CPUとメモリとを備え、複数の記憶デバイスにアクセス可能である。情報処理装置は、ファイルを複数のサブファイルに分割し、複数のサブファイルを、複数の記憶デバイスに分散させて記憶し、複数の記憶デバイスに記憶されている複数のサブファイルについて、それぞれが記憶されている記憶デバイスとは異なる記憶デバイスに、それぞれの複製を記憶する。
【選択図】図1

Description

本発明は、分散ファイル管理方法及び情報処理装置に関する。
情報処理システムにおいて、1つのファイルを複数のディスク装置に分散させて管理するファイルシステムが用いられている(例えば、特許文献1や特許文献2参照)。このようなファイルシステムは、ストライピングファイルシステムとも呼ばれる。ストライピングファイルシステムでは、ファイルへのアクセス時に複数のディスク装置に並列的にアクセスすることで、ファイルに対する入出力処理の効率化を図っている。
しかしながら、ストライピングファイルシステムでは、1つのアクセスに起因して複数のディスク装置を同時に動作させるため、稼動部分が増加し、システム全体としての故障率が高まることが知られている。このような問題に対応すべく、ストライピングファイルシステムにおいてファイルの保全性を高める仕組みが提案されている。例えば、特許文献3では、分散ファイルシステムにおいて、プライマリとバックアップを一対にした仮想ディスク装置を用いてミラーリングを行い、プライマリに障害が発生した場合には、バックアップを替わりに使用することで、ファイルの保全性を高めている。
特開2001−229062号公報 特開2002−182953号公報 特開平11−316654号公報
しかしながら、特許文献3に記載のシステムのように、複数のディスク装置のそれぞれについてプライマリとバックアップとを準備する冗長構成をとると、ディスク装置の増設にはコストがかかり、ディスク装置の数が倍増することでメンテナンスに手間もかかる。
本発明は、このような背景を鑑みてなされたものであり、複数の記憶デバイスにファイルを分散して管理するファイルシステムにおいて記憶デバイスを増やすことなくファイルの保全性を高めることのできる、分散ファイル管理方法及び情報処理装置を提供することを目的とする。
上記課題を解決するための本発明の主たる発明は、CPUとメモリとを備え、複数の記憶デバイスにアクセス可能な情報処理装置によるファイルの管理方法であって、ファイルを複数のサブファイルに分割し、前記複数のサブファイルを、前記複数の記憶デバイスに分散させて記憶し、前記複数の記憶デバイスに記憶されている前記複数のサブファイルについて、それぞれが記憶されている前記記憶デバイスとは異なる前記記憶デバイスに、それぞれの複製を記憶することとする。
本発明によれば、分散ファイルシステムにおいて記憶デバイスを増やすことなくファイルの保全性を高めることのできる分散ファイル管理方法及び情報処理装置を提供することができる。
==システム構成==
図1は、本実施形態に係る情報処理システムの全体構成を示す図である。同図に示すように、本実施形態の情報処理システムは、計算ノード10と、I/Oノード20とを含んで構成される。計算ノード10及びI/Oノード20は、LAN(Local Area Network)40で互いに通信可能に接続される。
計算ノード10は、情報処理サービスを提供する、例えばワークステーションやパーソナルコンピュータなどのコンピュータである。本実施形態の情報処理システムでは、複数の計算ノード10による情報処理が並列的に行われるいわゆるクラスタ処理が行われる。
I/Oノード20(本発明の情報処理装置に該当する。)は、ファイルに対する入出力処理を行う、例えばワークステーションやパーソナルコンピュータなどのコンピュータである。I/Oノード20は、計算ノード10からファイル名指定のデータ入出力要求(以下、ファイル入出力要求という。)を受信し、受信したファイル入出力要求に応じて、ファイルに対するデータの入出力処理を行う。本実施形態の、I/Oノード20は、各I/Oノード20に接続されているディスク装置30(本発明の記憶デバイスに該当する。)にファイルを分散して管理するファイルシステム(ストライピングファイルシステムと呼ばれる。)を提供する。本実施形態のストライピングファイルシステムでは、ひとつのファイルは複数の部分(以下、サブファイルという。)に分割され、サブファイルが複数のディスク装置30に分散して格納される。そして、本実施形態の情報処理システムでは、ひとつのファイルに対するファイル入出力要求に応じて、複数のI/Oノード20が並列的にデータ入出力処理を行うことで、データ入出力処理を効率的に行っている。
I/Oノード20には、計算ノード10からファイル入出力要求を受信するI/Oノード20(以下、マスタノードともいう。)と、マスタノードに対してディスク装置30の記憶領域を提供するI/Oノード20(以下、サブノードともいう。)とがある。マスタノードに接続されているディスク装置30には、ファイル310の構成を定義する情報(ファイル情報という。)を格納するファイル(以下、マスタファイル311という。)が記憶され、サブノードに接続されているディスク装置30には、ファイル310を構成するサブファイル312が格納される。
==計算ノード==
図2は、計算ノード10のハードウェア構成を示す図である。同図に示すように、計算ノード10は、CPU101、メモリ102、記憶装置103、通信インタフェース104を備えている。記憶装置103は、データやプログラムを記憶する、例えばハードディスクドライブやCD−ROMドライブ、フラッシュメモリなどである。記憶装置103には、OSプログラム111、クラスタプログラム112、アプリケーションプログラム113、ディスク状態管理テーブル114が記憶されている。CPU101は、記憶装置103に記憶されているOSプログラム111や、クラスタプログラム112、アプリケーションプログラム113をメモリ102に読み出して実行することにより、後述する各種の機能を提供する。ディスク状態管理テーブル114の詳細については後述する。通信インタフェース104は、LAN40に接続するためのインタフェースであり、例えば、イーサネット(登録商標)に接続するためのアダプタや、公衆電話回線に接続するためのモデムである。
図3は、計算ノード10の機能ブロック図である。同図に示すように、計算ノード10は、情報処理部121、ファイル入出力要求送信部122、ファイル受信部123、ミラー要求送信部124を備えている。
情報処理部121は、CPU101が記憶装置103に記憶されているアプリケーションプログラム113を実行することにより実現される、計算ノード10が提供する情報処理サービスを実現する。
ファイル入出力要求送信部122は、ファイル入出力要求をI/Oノード20に送信する。ファイル受信部123は、ファイル入出力要求に応じたI/Oノード20からの応答を受信する。ファイル受信部123は、例えば、ファイルの読み出し要求に対してI/Oノード20から応答されるファイルを受信したり、ファイルへの書き込み要求に応じたI/Oノード20からの終了ステータスを受信したりする。ファイル受信部123が、I/Oノード20からエラーを受信した場合には、入出力がエラーになったディスク装置30に障害が発生した旨を示す情報を、後述のディスク状態管理テーブル114に格納する。
ミラー要求送信部124は、ファイルを二重化するように指示するコマンド(以下、ミラー要求という。)をI/Oノード20に送信する。ミラー要求には二重化の対象となるファイルを示すファイル名が設定される。
なお、ファイル入出力要求送信部122、ファイル受信部123、及びミラー要求送信部124は、CPU101が記憶装置103に記憶されているOSプログラム111をメモリ102に読み出して実行することにより実現されるオペレーティングシステムにより提供される機能である。
==I/Oノード==
図4は、I/Oノード20のハードウェア構成を示す図である。同図に示すように、I/Oノード20は、CPU201、メモリ202、記憶装置203、通信インタフェース204、I/Oインタフェース205を備えている。記憶装置203は、プログラムやデータを記憶する、例えばハードディスクドライブやCD−ROMドライブ、フラッシュメモリなどである。記憶装置203には、OSプログラム211やディスク状態管理テーブル212が記憶されている。CPU201は記憶装置203に記憶されている、OSプログラム211をメモリ202に読み出して実行することにより、後述の各種の機能を実現する。ディスク状態管理テーブル212についての詳細は後述する。通信インタフェース204は、LAN40に接続するためのインタフェースであり、例えば、イーサネット(登録商標)に接続するためのアダプタや、公衆電話回線に接続するためのモデムである。I/Oインタフェース205は、ディスク装置30と接続するためのインタフェースであり、例えば、SCSI(Small Computer System Interface)、アダプタ、ファイバチャネルアダプタなどのHBA(Host Bus Adapter)である。
図5は、I/Oノード20の機能ブロック図である。同図に示すように、I/Oノード20は、マウント処理部221、ミラー要求受信部222、ミラー処理部223、ファイル入出力要求受信部224、データ入出力処理部225、ファイル送信部226、障害検知部227、ディスク状態管理テーブル212を備えている。
マウント処理部221は、マスタノードにおいて、他のサブノードに接続されているディスク装置30の記憶領域を、マスタノードにおいて利用可能とするための処理(以下、マウント処理という。)を行う。なお、マウント処理部221が行うマウント処理は、一般的にマウントあるいはドライブの割り当てとして知られている処理である。
マウント処理部221がマウントするディスク装置を特定する情報は、マスタノードに接続されるディスク装置30に記憶されている構成定義ファイル313に含まれている。構成定義ファイル313の構成を図6に示す。同図に示すように、構成定義ファイル313には、ファイル310を分散する先となるディスク装置30がマウントされるパス(マウントポイントと呼ばれる。)を示す情報が含まれる。図6の例では、「/blk1」〜「/blk2」にサブノードのディスク装置30がマウントされることを示している。また、構成定義ファイル313に格納されている情報より、サブファイルを格納する記憶領域数(以下、分割数という。)が決定される。図6の例では、分割数は「2」である。
図7は、マスタファイル311の内容例を示す図である。同図に示すように、マスタファイル311に格納されるファイル情報には、ファイル名331、ファイルサイズ332、サブファイル数333、サブファイル開始位置334、ミラーフラグ335、ミラーサブファイル開始位置336が含まれている。
ファイルサイズ332は、ファイル名331が示すファイル310全体のサイズである。サブファイル数333は、ファイル310を分割したサブファイル312の数である。なお、ファイル名331に代えて、ファイル310のinode番号やvnode番号を採用してもよい。
サブファイル開始位置334(本発明の第1のデバイス情報に該当する。)は、サブファイル312が格納されるディスク装置30を特定するための情報である。本実施形態では、n台のディスク装置30が「/blk1」〜「/blkn」にマウントされている場合に、サブファイル数333をm、サブファイル開始位置334をsとすると、「/blki」(i=s,s+1,...,s+m)にマウントされているディスク装置30にサブファイル312が格納される。なお、i>nとなる場合にはi=i−sとする。また、本実施形態では、簡単のため、サブファイル312のファイル名は、ファイル310のファイル名331と同じであるものとする。すなわち、分割数が2である「file1」というファイル310は、「/blk1/file1」と、「/blk2/file1」とに分割されて格納されるものとする。
ミラーフラグ335は、ファイル名331が示すファイル310が二重化されているかどうかを示す情報である。本実施形態の情報処理システムでは、二重化されているファイル310と、されていないファイル310とが混在しており、後述するように、システムの利用者は、任意にファイル単位で二重化を開始することができるようになっている。なお、ファイル310の二重化処理の詳細については後述する。
ミラーサブファイル開始位置336(本発明の第2のデバイス情報に該当する。)は、ファイル310が二重化されている場合に、サブファイル312の複製(以下、ミラーサブファイルという。本発明の複製ファイルに該当する。)を格納するディスク装置30を特定する情報である。なお、ミラーサブファイル開始位置336は、サブファイル開始位置334と同様にしてディスク装置30を特定するものとする。
==ファイルの分散管理==
本実施形態では、ファイル310はサブファイル312単位ではなく、ブロック単位でディスク装置30に書き込まれる。図8は、本実施形態の情報処理システムにおいて、ファイル310が複数のディスク装置30に分散管理される様子を示す図である。本実施形態では、I/Oノード20は、ファイル310をディスク装置30に書き込む際、ファイル310をブロック単位のデータ(以下、ファイルブロックという。)に分割し、各ファイルブロックを、複数のディスク装置30に、ラウンドロビン方式で順番に書き込んでいく。図8の例では、ファイル310は、FB0〜FB15の16個のファイルブロックに分割され、分割されたファイルブロックは、「/blk1」にマウントされている上側のディスク装置30が管理するサブファイル312と、「/blk2」にマウントされている下側のディスク装置30が管理するサブファイル312とに順番に書き込まれるが、サブファイル開始位置334が「1」である場合、最初のファイルブロック「FB0」が書き込まれる先は「/blk1」となる。上記のようにファイルブロックをサブファイル312に書き込むことで、「/blk1」に記憶されているサブファイル312には、偶数番目のファイルブロック(FB0、FB2、・・・FB14)が格納され、「/blk2」に記憶されているサブファイル312には、奇数番目のファイルブロック(FB1、FB3、・・・FB15)が書き込まれる。
==障害検知処理==
図9は、ディスク状態管理テーブル212の構成を示す図である。図9に示すように、ディスク状態管理テーブル212は、ディスク名261毎に障害フラグ262を記憶している。ディスク名261は、ディスク装置30を示す情報であり、本実施形態では、ディスク装置30がマウントされるマウントポイントのパスである。各I/Oノード20は、I/Oインタフェース205を介して接続されているディスク装置30(以下、ローカルディスクともいう。)、及びマウントした他のI/Oノード20に接続されているディスク装置30(以下、リモートディスクともいう。)のそれぞれについて、障害フラグ262をディスク状態管理テーブル212に管理するものとする。なお、図9の例では、「/」は、ローカルディスクを示し、「/blk1」及び「/blk2」はリモートディスクを示す。障害フラグ262に「×」が設定されている場合、ディスク名261が示すディスク装置30に障害が発生していることを示す。なお、計算ノード10が備えるディスク状態管理テーブル114も、I/Oノード20が備える図9のディスク状態管理テーブル212と同様の構成である。
障害検知部227は、マウントされているディスク装置30に障害が発生したことを検知する。本実施形態では、障害検知部227は、I/Oインタフェース205を介して接続されているディスク装置30(以下、ローカルディスクという。)に対して定期的に書き込みを行い、その書き込みが成功するかどうかに応じてディスク装置30の障害を検知する。障害検知部227は、ローカルディスクに障害が発生したことを検知すると、ディスク状態管理テーブル212のローカルディスクに対応する障害フラグ262を「×」にする。
また、ディスク状態管理テーブル212の障害フラグ262は、ディスク装置30に対するデータの入出力に失敗した場合にも「×」が設定される。
なお、本実施形態では、計算ノード10のディスク状態管理テーブル114や、各I/Oノード20のディスク状態管理テーブル212は、各ノードにおいて独自に管理されるものとする。したがって、各I/Oノード20では、ローカルディスクに障害が発生したかどうかはディスク状態管理テーブル212に管理されるが、リモートディスクについては、実際にアクセスしたときに、障害が発生しているかどうかが判定され、アクセスに失敗すると、障害フラグ262が更新される。ディスク状態管理テーブル212の状態例を図10に示す。図10の例では、サブノード(サブ1)に接続されているディスク装置30に障害が発生した場合、サブノード(サブ1)のディスク状態管理テーブル212には、ディスク装置30に障害が発生した旨を示す障害フラグ262が管理されるが、計算ノード10のディスク状態管理テーブル114やマスタノードのディスク状態管理テーブル212には、サブノード(サブ1)に接続されているディスク装置30に障害が発生したことは伝搬していない。しかし、計算ノード10がマスタノードにファイル入出力要求を送信し、「/blk1」に格納されているサブファイル312に対する入出力ができなかったときに、マスタノードのディスク状態管理テーブル212の「/blk1」に対応する障害フラグ262が「×」に設定され、マスタノードからエラーが応答されて、計算ノード10でも「/blk1」に対応する障害フラグが「×」に設定される。
==二重化処理==
ミラー要求受信部222は、計算ノード10から送信されるミラー要求を受信する。ミラー処理部223は、ミラー要求に応じてファイルの二重化を行う。ミラー処理部223によるファイルの二重化処理の流れを図11に示す。
ミラー処理部223は、マスタファイル311から、ミラー要求に設定されているファイル名に対応するファイル情報を読み出し(S501)、読み出したファイル情報のミラーフラグ335が「×」であれば(S502:YES)、ファイル情報のミラーフラグ335に「○」を設定し(S503)、ファイル情報のサブファイル開始位置334をs、サブファイル数333をnとする(S504)。ミラー処理部223は、s+1がnよりも大きい場合(S505:YES)、ミラーサブファイル開始位置336に1を設定し(S506)、そうでなければ、s+1をミラーサブファイル開始位置336に設定する(S507)。
次にミラー処理部223は、sがn以下である間、以下の処理を行う。
ミラー処理部223は、sに1を加算した値をdとし(S508)、dがnより大きければ(S509:YES)、dからnを減算する(S510)。ミラー処理部223は、「/blk」と、sと、「/」と、ファイル情報のファイル名331とを連結してコピー元のサブファイル312のサブファイル名を決定し(S511)、「/blk」と、dと、「/」と、ファイル情報のファイル名331と、複製であることを示す「.1」とを連結してコピー先となるサブファイル312のサブファイル名を決定する(S512)。ミラー処理部223は、決定したコピー元のサブファイル名が示すサブファイル312を、コピー先のサブファイル名のファイルにコピーする(S513)。
ミラー処理部223は、sをインクリメントし(S514)、sがnを超えた場合(S515:YES)には、sを1にする(S516)。
上述した二重化処理を行った後の状態の一例を図12に示す。図12では、「file1」に対応する「/blk1/file1」及び「/blk2/file2」のサブファイル312がディスク装置30に記憶されていた場合に、上記の二重化処理により、「/blk1/file1」のサブファイル312は、「/blk2/file1.1」のミラーサブファイル314にコピーされ、「/blk2/file1」のサブファイル312は、「/blk1/file1.1」のミラーサブファイル314にコピーされたことを示している。
このように、ミラー処理部223は、利用者からのミラー要求に応じて、指定されたファイル名に対応するサブファイル312について、各サブファイル312が格納されているディスク装置30とは異なるディスク装置30に、各サブファイル312の複製を格納する。したがって、ディスク装置30のひとつに障害が発生したとしても、上記の二重化処理を行った後であれば、障害が発生したディスク装置30に格納されているサブファイル312は、他のディスク装置30にも複製がコピーされていることになる。よって、ディスク装置30の障害に対して、ファイルの保全性が高まる。
また、本実施形態の情報処理システムでは、計算ノード10からのミラー要求がなければファイル310の二重化は行わない。後述するように、ファイル310の二重化を行うと、二重化していない場合に比べて、ファイル310に対するデータの書き込みは倍の回数行われる。したがって、例えば、重要度の高いデータについては二重化を行い、重要度がそれ程高くないデータについては、二重化を行わずに処理効率をできるだけ下げないようにして、情報処理システム全体の効率を調整するようにすることもできる。
==データ入出力処理==
ファイル入出力要求受信部224は、計算ノード10から送信されるファイル入出力要求を受信する。データ入出力処理部225は、ファイル入出力要求に応じてファイル310に対するデータの入出力処理を行う。ファイル送信部226は、ファイル入出力要求が、ファイル310のオープンを指示するオープン要求や、ファイル310へのデータの書き込みを指示するファイル書き込み要求であった場合には処理結果を計算ノード10に送信する。また、ファイル送信部226は、ファイル入出力要求が、ファイル310からデータを読み出すことを指示するファイル読み出し要求であった場合には、ディスク装置30から読み出したデータを計算ノード10に送信する。
以下、データ入出力処理部225によるデータの入出力処理の詳細について説明する。
==オープン処理==
まず、データ入出力処理部225は、オープン要求を受信した場合、オープン要求に設定されているファイル名に対応するサブファイル312を全てオープンする。また、二重化されている場合には、対応するミラーサブファイル314もオープンする。図13にファイルのオープン処理の流れを示す。また、図14は、図13の処理でオープンしたサブファイル312やミラーサブファイル314のファイル記述子を記憶するためのファイル管理テーブル400の構成を示す図である。同図に示すように、ファイル管理テーブル400は、サブファイル名401、サブファイル312のvnode402、サブファイル記述子403、ミラーサブファイル名404、ミラーサブファイル314のvnode、ミラーサブファイル記述子406、ミラーフラグ407を対応付けて記憶している。サブファイル記述子403は、サブファイル312をオープンしたときに割り当てられるファイル記述子であり、ミラーサブファイル記述子406は、ミラーサブファイル314をオープンしたときに割り当てられるファイル記述子である。なお、ファイル管理テーブル400は、図13のオープン時に作成され、ファイルのクローズ時に破棄される。
データ入出力処理部225は、マスタファイル311から、オープン要求に設定されているファイル名に対応するファイル情報を読み出す(S601)。データ入出力処理部225は、ファイル情報に含まれるサブファイル開始位置334をsとし(S602)、ファイル情報のミラーサブファイル開始位置336をmとする(S603)。データ入出力処理部225は、ファイル情報に含まれるサブファイル数333の回数、以下の処理を行う。
データ入出力処理部225は、サブファイル既述子を「0」し(S604)、ミラーサブファイル既述子を「0」にする(S605)。データ入出力処理部225は、「/blk」にsを連結した文字列をディスク名とし(S606)、ディスク名に「/」とファイル名とを連結した文字列をサブファイル名401とする(S607)。データ入出力処理部225は、ディスク状態管理テーブル212から、ディスク名に対応する障害フラグ262を読み出す(S608)。障害フラグ262が「×」でなければ(S609:YES)、データ入出力処理部225は、サブファイル名401が示すサブファイル312をオープンし、オープンしたファイルのファイル記述子をサブファイル記述子403とする(S610)。ファイルのオープン処理でエラーが発生した場合(S611:YES)には、ディスク状態管理テーブル212のディスク名に対応する障害フラグ262を「×」に変更する(S612)。
データ入出力処理部225は、ファイル情報のミラーフラグ335が「○」であれば(S613:YES)、「/blk」にmを連結した文字列をミラーディスク名とし(S614)、ミラーディスク名に「/」とファイル名とを連結した文字列をミラーサブファイル名404とする(S615)。データ入出力処理部225は、ディスク状態管理テーブル212から、ミラーディスク名に対応する障害フラグ262を読み出す(S616)。障害フラグ262が「×」でなければ(S617:YES)、データ入出力処理部225は、ミラーサブファイル名404が示すミラーサブファイル314をオープンし、オープンしたファイルのファイル記述子をミラーサブファイル記述子406とする(S618)。ファイルのオープン処理でエラーが発生した場合(S619:YES)は、ディスク状態管理テーブル212のミラーディスク名に対応する障害フラグ262を「×」に変更する(S620)。
データ入出力処理部225は、sをインクリメントし(S621)、sがファイル情報のサブファイル数333を超えた場合は(S622:YES)、sを1にする(S623)。データ入出力処理部225は、mをインクリメントし(S624)、mがファイル情報のサブファイル数333を超えた場合には(S625:YES)、mを1にする(S626)。
ここでサブファイル記述子403及びミラーサブファイル記述子406のいずれも0以下であった場合は(S627:NO)、ファイル送信部226は、ファイル310のオープンに失敗した旨を示すメッセージを計算ノード10に送信する(S628)。
一方、サブファイル記述子403及びミラーサブファイル記述子406の何れかが0より大きい数であった場合(S627:YES)、サブファイル名401、サブファイル312のvnode、サブファイル記述子403、ミラーサブファイル名404、ミラーサブファイル314のvnode、ミラーサブファイル記述子406、及びミラーフラグ335を対応付けて、ファイル管理テーブル400に追加する(S629)。
以上の処理を、サブファイル数分だけ繰り返すことで、ファイル入出力要求に指定されたファイル名に対応する全てのサブファイル312がオープンされるとともに、サブファイル312の複製であるミラーサブファイル314も全てオープンされる。また、サブファイル312及びミラーサブファイル314にアクセスするためのファイル記述子がファイル管理テーブル400に登録される。上記の処理以降、データ入出力処理部225は、ファイル管理テーブル400に登録されている各ファイル記述子を用いて、サブファイル312やミラーサブファイル314にアクセスすることができる。
==書き込み処理==
図15は、ファイル書き込み要求に応じてデータ入出力処理部225による行われる、ファイル310へのデータ書き込み処理の流れを示す図である。
データ入出力処理部225は、マスタファイル311から、データ書き込み要求に設定されているファイル名に対応するファイル情報を読み出し(S701)、図16に示すファイル管理テーブル400に設定されているファイル記述子のチェック処理を行う。
データ入出力処理部225は、ファイル管理テーブル400に含まれている全てのサブファイル記述子403が0より大きい場合(S721:YES)、ファイル管理テーブル400に含まれている、「○」のミラーフラグ407に対応するミラーサブファイル記述子406が全て0より大きければ(S722:YES)、ディスク状態管理テーブル212から、「×」の障害フラグ262に対応するディスク名261(以下、障害ディスク名という。)を検索する(S723)。ディスク状態管理テーブル212に上記の障害ディスク名が含まれていない場合(S724:YES)、データ入出力処理部225は、ステータスを「正常」とする(S725)。
一方、ディスク状態管理テーブル212に障害ディスク名が含まれている場合(S724:NO)には、データ入出力処理部225は、ファイル管理テーブル400から、障害ディスク名を含むサブファイル名401又はミラーサブファイル名404を検索する(S726)。データ入出力処理部225は、障害ディスク名を含むサブファイル名401又はミラーサブファイル名404がファイル管理テーブル400に存在しない場合(S727:NO)は、(S725)に進み、ステータスを「正常」とする。
障害ディスク名を含むサブファイル名401又はミラーサブファイル名404がファイル管理テーブル400に含まれている場合(S727:YES)、データ入出力処理部225は、障害ディスク名を含むサブファイル名401が示すサブファイル312をクローズし(S728)、クローズしたサブファイル312に対応するファイル管理テーブル400のサブファイル記述子403にエラー値(本実施形態では、エラー値は0未満の数とする。)を設定する(S729)。また、データ入出力処理部225は、障害ディスク名を含むミラーサブファイル名404が示すミラーサブファイル314をクローズし(S730)、クローズしたミラーサブファイル314に対応するファイル管理テーブル400のミラーサブファイル記述子406にエラー値を設定する(S731)。データ入出力処理部225は、ステータスに「異常」を設定する(S732)。
上記の図16の処理により、ファイル書き込み要求に設定されていたファイル名に対応する全てのサブファイル312が正常にオープンされており、二重化が行われている場合には全てのサブファイル312に対応するミラーサブファイル314も正常にオープンされているときに、ステータスに「正常」が設定され、正常にオープンされていないサブファイル312やミラーサブファイル314がある場合、ステータスには「異常」が設定される。
ここで、ステータスが「正常」でなければ(S703:NO)、ファイル送信部226は、エラーが発生した旨を示すメッセージを計算ノード10に送信する(S704)。
ステータスが「正常」である場合(S703:YES)、データ入出力処理部225は、ファイル書き込み要求に設定されている書き込みデータをブロック単位に分割し、各ファイルブロックについて以下の処理を行う。
データ入出力処理部225は、ファイル管理テーブル400から順番にラウンドロビン方式で、サブファイル記述子403、ミラーサブファイル記述子406、及びミラーフラグ407を読み出す(S705)。データ入出力処理部225は、読み出したサブファイル記述子403を用いてサブファイル312に対するファイルブロックの書き込み処理を行う(S706)。ファイルブロックの書き込み処理に失敗した場合(S707:YES)、データ入出力処理部225は、ファイル管理テーブル400のサブファイル記述子403をエラー値に変更する(S708)。
次に、データ入出力処理部225は、上記の読み出したミラーフラグ407が「○」である場合(S709:YES)、ミラーサブファイル記述子406を用いてミラーサブファイル314に対するファイルブロックの書き込み処理を行う(S710)。ファイルブロックの書き込み処理に失敗した場合(S711:YES)、データ入出力処理部225は、ファイル管理テーブル400のミラーサブファイル記述子406をエラー値に変更する(S712)。
ここで、データ入出力処理部225は、再度図16に示すファイル記述子のチェック処理を行い(S713)、ステータスが「正常」でない場合には(S714:NO)、(S704)に進み、ファイル送信部226は、エラーが発生した旨を示すメッセージを計算ノード10に送信する。ステータスが「正常」であれば(S714:YES)、データ入出力処理部225は、次のファイルブロックについて、(S705)からの処理を行う。
以上の処理を各ファイルブロックについて行うことで、データ入出力処理部225は、ファイル書き込み要求に応じて、指定されたファイル名に対応するサブファイル312にデータを書き込むとともに、ファイル310が二重化されている場合には、対応するミラーサブファイル314にもデータが書き込まれる。本実施形態では、ミラーサブファイル314は、対応するサブファイル312とは異なるディスク装置30に格納されることになるので、二重化されているファイル310については、ディスク装置30のひとつに障害が発生した場合でも、他のディスク装置30に格納されたミラーサブファイル314を利用することが可能となる。よって、情報処理システムで管理されるファイルの保全性を向上し、システム全体の可用性を向上することができる。
==読み出し処理==
図17は、ファイル読み出し要求に応じてデータ入出力処理部225により行われる、ファイル310の読み出し処理の流れを示す図である。
データ入出力処理部225は、マスタファイル311から、データ読み出し要求に設定されているファイル名に対応するファイル情報を読み出し(S801)、ディスク状態管理テーブル212から、「×」の障害フラグ262に対応する障害ディスク名を検索する(S802)。障害ディスク名があれば(S803:YES)、データ入出力処理部225は、ファイル管理テーブル400から、障害ディスク名を含むサブファイル名401又はミラーサブファイル名404を検索する(S804)。障害ディスク名を含むサブファイル名401又はミラーサブファイル名404がある場合(S805:YES)、データ入出力処理部225は、障害ディスク名を含むサブファイル名401が示すサブファイル312をクローズし(S806)、クローズしたサブファイル312に対応するファイル管理テーブル400のサブファイル記述子403をエラー値に変更する(S807)。また、データ入出力処理部225は、障害ディスク名を含むミラーサブファイル名404が示すミラーサブファイル314をクローズし(S808)、クローズしたミラーサブファイル314に対応するファイル管理テーブル400のミラーサブファイル記述子406をエラー値に変更する(S809)。
次にデータ入出力処理部225は、ファイル管理テーブル400から、サブファイル312が正常にオープンされていないことを示す0以下のサブファイル記述子403と、ミラーサブファイル314が正常にオープンされていないことを示す0以下のミラーサブファイル記述子406とを含む行を検索する(S810)。上記の行がある場合には(S811:YES)、ファイル送信部226は、ファイルの読み出しができない旨のエラーを示すメッセージを計算ノード10に送信する(S812)。
一方、上記のような行がない場合(S811:NO)、データ入出力処理部225は、読み出しデータ変数をクリアし(S813)、読み出しファイルサイズ変数を0に設定して(S814)、読み出しファイルサイズが、ファイル情報のファイルサイズ332を超えない間、以下の処理を行う。
データ入出力処理部225は、サブファイル記述子403又はミラーサブファイル記述子406のうち、0より大きい値である何れかを読み出しファイル記述子として選択し(S815)、選択した読み出しファイル記述子を用いて、サブファイル312又はミラーサブファイル314から1つ分のファイルブロックを読み出す(S816)。ここでエラーが発生した場合(S817:YES)には、データ入出力処理部225は、ファイル管理テーブル400の、上記(S815)で選択したサブファイル記述子403又はミラーサブファイル記述子406をエラー値に変更し(S818)、ディスク状態管理テーブル212に含まれるディスク名261のうち、読み出しにエラーが発生したサブファイル記述子403又はミラーサブファイル記述子406に対応するサブファイル名401又はミラーサブファイル名404に含まれるものを特定し、特定したディスク名261に対応する障害フラグ262に「×」を設定し(S819)、再度(S802)からの処理をやり直す。
一方、読み出しファイル記述子を用いたファイルブロックの読み出しに成功した場合は(S817:NO)、読み出したファイルブロックを読み出しデータに追加し(S820)、ファイルサイズにファイルブロックのサイズを加算する(S821)。
上記の処理を繰り返して、ファイル入出力要求に指定されたファイル名に対応するサブファイル312又はミラーサブファイル314からのデータを全て読み出すと、ファイル送信部226は、ファイル入出力要求に対する応答として、上記の読み出しデータを計算ノード10に送信する(S821)。
このように、本実施形態のI/Oノード20では、二重化されたファイルについては、サブファイル312又はミラーサブファイル314の何れか一方にアクセスできれば、ファイルブロックを読み出すことができる。本実施形態の情報処理システムでは、サブファイル312とミラーサブファイル314とは異なるディスク装置30に格納されているので、あるディスク装置30に障害が発生し、そのディスク装置30が記憶しているサブファイル312にアクセスできなくなったとしても、障害が発生したディスク装置30とは異なるディスク装置30に記憶されているミラーサブファイル314からデータを読み出すことができる。つまり、ディスク装置30に障害が発生しても、データの入出力処理を継続することが可能となる。したがって、情報処理システム全体の可用性を高めることができる。
また、本実施形態の情報処理システムでは、複数のディスク装置30に対して分散してファイル310を管理するので、ファイル310に対するデータ入出力を、複数のI/Oノード20で並列的に行うことができる。したがって、データ入出力処理の処理効率を高めることができる。その一方で、ディスク装置30に障害が発生した場合にも、障害の発生していない他のディスク装置30からデータの読み出しを継続することができるので、ファイル310に対するアクセスを効率化しつつ、情報処理システムの可用性を高めることができる。
また、本実施形態の情報処理システムでは、ファイル毎に二重化を行うかどうかを設定することができるので、例えば、重要度の高いファイル310については、上述したような二重化を行うことで、ディスク装置30に障害が発生した場合でも、他のディスク装置30に記憶されているミラーサブファイル314を利用することでファイル310の完全性を保つことを可能としつつ、重要度のそれ程高くないファイル310については二重化を行わないことで、ファイル310に対する書き込み処理を効率的に行うようにすることもできる。このように、本実施形態の情報処理システムでは、二重化を行うかどうかを柔軟に設定することができるので、情報処理システムの用途に応じて、ファイル310の完全性や保全性、システムの可用性や高速性のバランスを考慮した設定を行うことが可能となる。
なお、本実施形態のI/Oノード20は、二重化を解除することを指示するコマンド(以下、ミラー解除要求という。)を受信するミラー解除要求受信部と、ミラー解除要求に応じて、ファイル310の二重化を解除するミラー解除処理部とを備えるようにしてもよい。この場合、ミラー解除処理部は、ミラー解除要求に設定されているファイル名に対応するファイル情報のミラーフラグ335が「○」である場合には、ミラーサブファイル開始位置336により特定されるディスク装置30のそれぞれから、「/blk/」+ファイル名331+「.1」が示すファイルを削除し、ミラーフラグ335を「×」に設定する。これにより、それ以降のファイル310への書き込み時には、サブファイル312にのみ書き込みが行われるようになる。
また、本実施形態では、二重化はサブファイル312についてのみ行われるものとしたが、マスタファイル311についての二重化を行うようにしてもよい。この場合、ミラー処理部223は、マスタファイル311が記憶されているローカルディスクとは異なるリモートディスクにマスタファイル311をコピーすることができる。これにより、ローカルディスクに障害が発生した場合にも、ファイル310の完全性を保つことができる。
また、本実施形態では、計算ノード10及びI/Oノード20のそれぞれが、独立してディスク状態管理テーブル114及び212を管理するものとしたが、各ノード間で同期をとるようにしてもよい。
また、マスタノードのみがディスク状態管理テーブル212を管理し、計算ノード10やサブノードがディスク状態管理テーブル114及び212を管理しないようにしてもよい。
また、本実施形態の情報処理システムでは、簡単のため、I/Oノード20は3台であるものとしたが、任意の複数の台数の構成としてもよいし、計算ノード10についても、1つ以上の任意の台数の構成としてもよい。
また、本実施形態の情報処理システムでは、計算ノード10とI/Oノード20とが分離している構成としたが、複数の計算ノード10が直接ディスク装置30と接続されるような構成としてもよい。
以上、本実施形態について説明したが、上記実施形態は本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物も含まれる。
本実施形態に係る情報処理システムの全体構成を示す図である。 計算ノード10のハードウェア構成を示す図である。 計算ノード10の機能ブロック図である。 I/Oノード20のハードウェア構成を示す図である。 I/Oノード20の機能ブロック図である。 構成定義ファイル313の構成を示す図である。 マスタファイル311の内容例を示す図である。 ファイル310が複数のディスク装置30に分散管理される様子を示す図である。 ディスク状態管理テーブル212の構成を示す図である。 ディスク状態管理テーブル212の状態を説明する図である。 ミラー処理部223によるファイルの二重化処理の流れを示す図である。 二重化処理を行った後の状態を説明する図である。 ファイルのオープン処理の流れを示す図である。 ファイル管理テーブル400の構成を示す図である。 ファイル310へのデータ書き込み処理の流れを示す図である。 ファイル管理テーブル400に設定されているファイル記述子のチェック処理の流れを示す図である。 ファイル310の読み出し処理の流れを示す図である。
符号の説明
10 計算ノード 20 I/Oノード
30 ディスク装置 40 LAN
101 CPU 102 メモリ
103 記憶装置 104 通信インタフェース
111 OSプログラム 112 クラスタプログラム
113 アプリケーションプログラム 114 ディスク状態管理テーブル
121 情報処理部 122 ファイル入出力要求送信部
123 ファイル受信部 124 ミラー要求送信部
201 CPU 202 メモリ
203 記憶装置 204 通信インタフェース
205 I/Oインタフェース 211 OSプログラム
212 ディスク状態管理テーブル 221 マウント処理部
222 ミラー要求受信部 223 ミラー処理部
224 ファイル入出力要求受信部 225 データ入出力処理部
226 ファイル送信部 227 障害検知部
311 マスタファイル 312 サブファイル
313 構成定義ファイル 314 ミラーサブファイル
331 ファイル名 332 ファイルサイズ
333 サブファイル数 334 サブファイル開始位置
335 ミラーフラグ 336 ミラーサブファイル開始位置
400 ファイル管理テーブル 401 サブファイル名
402 vnode 403 サブファイル記述子
404 ミラーサブファイル名 405 vnode
406 ミラーサブファイル記述子 407 ミラーフラグ

Claims (6)

  1. CPUとメモリとを備え、複数の記憶デバイスにアクセス可能な情報処理装置によるファイルの管理方法であって、
    ファイルを複数のサブファイルに分割し、
    前記複数のサブファイルを、前記複数の記憶デバイスに分散させて記憶し、
    前記複数の記憶デバイスに記憶されている前記複数のサブファイルについて、それぞれが記憶されている前記記憶デバイスとは異なる前記記憶デバイスに、それぞれの複製を記憶すること、
    を特徴とするファイル管理方法。
  2. 請求項1に記載のファイル管理方法であって、
    前記情報処理装置は、
    前記ファイルの複製を作成するように指示するミラー要求に応じて、前記サブファイルの複製を記憶すること、
    を特徴とする分散ファイル管理方法。
  3. 請求項1に記載の分散ファイル管理方法であって、
    前記情報処理装置は、
    前記ファイルを示すファイル名に対応付けて、前記サブファイルが格納されている前記記憶デバイスを特定する第1のデバイス情報と、前記サブファイルの複製である複製ファイルが作成されているかどうかを示すミラーフラグと、前記複製ファイルが作成されている場合に、前記複製ファイルが格納されている前記記憶デバイスを特定する第2のデバイス情報と、を前記メモリに記憶し、
    前記ファイル名と、前記ファイルに書き込むための書き込みデータと、を含む書き込み要求を受け付け、
    前記書き込み要求に含まれる前記ファイル名に対応する前記第1のデバイス情報を前記メモリから読み出し、読み出した前記第1のデバイス情報により特定される前記記憶デバイスに格納されている前記サブファイルに前記書き込みデータを書き込み、
    前記ファイル名に対応する前記ミラーフラグを前記メモリから読み出し、読み出した前記ミラーフラグに応じて、前記複製ファイルが作成されているかどうかを判断し、
    前記複製ファイルが作成されている場合、前記ファイル名に対応する前記第2のデバイス情報を前記メモリから読み出し、読み出した前記第2のデバイス情報により特定される前記記憶デバイスに格納されている前記複製ファイルに前記書き込みデータを書き込むこと、
    を特徴とする分散ファイル管理方法。
  4. 請求項3に記載の分散ファイル管理方法であって、
    前記情報処理装置は、
    前記ファイル名を含む読み出し要求を受け付け、
    前記読み出し要求に含まれる前記ファイル名に対応する前記第1のデバイス情報を前記メモリから読み出し、読み出した前記第1のデバイス情報により特定される前記記憶デバイスから前記サブファイルのデータを読み出せるかどうかを判断し、
    記憶デバイスから前記サブファイルを読み出せない場合、前記ファイル名に対応する前記ミラーフラグを前記メモリから読み出し、読み出した前記ミラーフラグにより、前記複製ファイルが作成されているかどうかを判断し、
    前記複製ファイルが作成されている場合、前記ファイル名に対応する前記第2のデバイス情報を前記メモリから読み出し、読み出した前記第2のデバイス情報により特定される前記記憶デバイスから前記複製ファイルのデータを読み出すこと、
    を特徴とする分散ファイル管理方法。
  5. 請求項3に記載の分散ファイル管理方法であって、
    前記情報処理装置は、
    前記ファイルの複製を削除するように指示するミラー解除要求を受け付け、
    前記ミラー解除要求に応じて、前記ファイルを示す前記ファイル名に対応する前記第2のデバイス情報を前記メモリから読み出し、読み出した前記第2のデバイス情報により特定される前記記憶デバイスから、前記複製ファイルを削除し、前記複製ファイルが作成されていない旨を示す前記ミラーフラグを、前記ファイル名に対応付けて前記メモリに記憶すること、
    を特徴とする分散ファイル管理方法。
  6. 複数の記憶デバイスにアクセス可能に接続され、
    CPUと、メモリと、
    ファイルを複数のサブファイルに分割するファイル分割処理部と、
    分割した前記サブファイルを、前記複数の記憶デバイスに分散させて記憶する分散ファイル管理部と、
    前記記憶デバイスに記憶されている前記サブファイルについて、それぞれが記憶されている前記記憶デバイスとは異なる前記記憶デバイスに、それぞれの複製を記憶するファイル複製処理部と、
    を備えることを特徴とする情報処理装置。


JP2006161407A 2006-06-09 2006-06-09 分散ファイル管理方法及び情報処理装置 Pending JP2007328727A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006161407A JP2007328727A (ja) 2006-06-09 2006-06-09 分散ファイル管理方法及び情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006161407A JP2007328727A (ja) 2006-06-09 2006-06-09 分散ファイル管理方法及び情報処理装置

Publications (1)

Publication Number Publication Date
JP2007328727A true JP2007328727A (ja) 2007-12-20

Family

ID=38929126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006161407A Pending JP2007328727A (ja) 2006-06-09 2006-06-09 分散ファイル管理方法及び情報処理装置

Country Status (1)

Country Link
JP (1) JP2007328727A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120013475A (ko) * 2010-08-05 2012-02-15 에스케이 텔레콤주식회사 분산 파일 시스템에서 url정보를 이용한 데이터 관리 장치 및 그 방법
JP2013025742A (ja) * 2011-07-26 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> 分散ファイル管理装置、分散ファイル管理方法及びプログラム
JP2013527524A (ja) * 2010-04-14 2013-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 動的なブロック・サイズ粒度を使用して、計算クラスタ内の異なるタイプのアプリケーションについてファイル・システムを最適化する方法、システム及びコンピュータ・プログラム
WO2015056352A1 (ja) * 2013-10-18 2015-04-23 株式会社日立製作所 ファイル管理方法
JPWO2013145222A1 (ja) * 2012-03-29 2015-08-03 富士通株式会社 情報処理装置およびデータ保存処理プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013527524A (ja) * 2010-04-14 2013-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 動的なブロック・サイズ粒度を使用して、計算クラスタ内の異なるタイプのアプリケーションについてファイル・システムを最適化する方法、システム及びコンピュータ・プログラム
US9021229B2 (en) 2010-04-14 2015-04-28 International Business Machines Corporation Optimizing a file system for different types of applications in a compute cluster using dynamic block size granularity
KR20120013475A (ko) * 2010-08-05 2012-02-15 에스케이 텔레콤주식회사 분산 파일 시스템에서 url정보를 이용한 데이터 관리 장치 및 그 방법
KR101666064B1 (ko) 2010-08-05 2016-10-13 에스케이텔레콤 주식회사 분산 파일 시스템에서 url정보를 이용한 데이터 관리 장치 및 그 방법
JP2013025742A (ja) * 2011-07-26 2013-02-04 Nippon Telegr & Teleph Corp <Ntt> 分散ファイル管理装置、分散ファイル管理方法及びプログラム
JPWO2013145222A1 (ja) * 2012-03-29 2015-08-03 富士通株式会社 情報処理装置およびデータ保存処理プログラム
WO2015056352A1 (ja) * 2013-10-18 2015-04-23 株式会社日立製作所 ファイル管理方法

Similar Documents

Publication Publication Date Title
US9734225B2 (en) User initiated replication in a synchronized object replication system
US7778960B1 (en) Background movement of data between nodes in a storage cluster
US8010485B1 (en) Background movement of data between nodes in a storage cluster
CN102652423B (zh) 用于集群选择和协作复制的方法和系统
JP4412989B2 (ja) 複数の記憶システムを有するデータ処理システム
US9524220B1 (en) Memory optimization for configuration elasticity in cloud environments
WO2015068239A1 (ja) 計算機システムおよびデータ制御方法
US20150261678A1 (en) Managing sequentiality of tracks for asynchronous pprc tracks on secondary
US20140122816A1 (en) Switching between mirrored volumes
JP2003263352A (ja) Ipネットワーク上の遠隔データファシリティ
US20170070575A1 (en) Method and an apparatus, and related computer-program products, for managing access request to one or more file systems
US7650476B2 (en) System, method and computer program product for generating a consistent point in time copy of data
JP2010079588A (ja) 仮想ボリュームを有する記憶制御装置
JP2007328727A (ja) 分散ファイル管理方法及び情報処理装置
JP2015052844A (ja) コピー制御装置,コピー制御方法及びコピー制御プログラム
US7496724B2 (en) Load balancing in a mirrored storage system
US20210103400A1 (en) Storage system and data migration method
JP2005234860A (ja) バージョン管理システム、バージョン管理サーバ装置、及び記憶デバイス制御装置
JP4997784B2 (ja) データ記憶システム、データ記憶方法、データ記憶プログラム
JP2006079463A (ja) 時系列データ記録用バッファ管理方法、装置、システムおよびプログラム
JP6337982B1 (ja) ストレージシステム
US20180181316A1 (en) Apparatus and method to store de-duplicated data into storage devices while suppressing latency and communication load
CN114489517A (zh) 一种离线加速迁移方法、系统、设备及存储介质
KR100472207B1 (ko) 다중 레이드 제어기를 통한 데이터 분산 공유 레이드 제어시스템
WO2016088372A1 (ja) アクセス装置、マイグレーション装置、分散ストレージシステム、アクセス方法及びコンピュータ読み取り可能記録媒体