JP6291977B2 - 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置 - Google Patents

分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置 Download PDF

Info

Publication number
JP6291977B2
JP6291977B2 JP2014073413A JP2014073413A JP6291977B2 JP 6291977 B2 JP6291977 B2 JP 6291977B2 JP 2014073413 A JP2014073413 A JP 2014073413A JP 2014073413 A JP2014073413 A JP 2014073413A JP 6291977 B2 JP6291977 B2 JP 6291977B2
Authority
JP
Japan
Prior art keywords
file
file system
backup
stored
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014073413A
Other languages
English (en)
Other versions
JP2015194973A (ja
Inventor
明芳 遠藤
明芳 遠藤
和田 浩
浩 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2014073413A priority Critical patent/JP6291977B2/ja
Publication of JP2015194973A publication Critical patent/JP2015194973A/ja
Application granted granted Critical
Publication of JP6291977B2 publication Critical patent/JP6291977B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置に関する。
近年、サーバ等の情報処理装置が扱うデータ量の増大に伴い、ネットワークに接続された複数のノードにデータを分散し、各ノードにてデータを記憶する分散ファイルシステムの重要性が増大している。分散ファイルシステム又は分散NAS(Network Attached Storage)においては、例えば、図13に図示するように、多数のNASやNASに類するネットワークストレージを分散ノード62−1〜62−3としてネットワーク上に分散配置する。
図13に示す分散ファイルシステムにおいて、クライアント60からの分散ノード62-1〜62-3へのアクセス要求を処理するのがファイルシステム統合装置61である。ファイルシステム統合装置61は、クライアント60やバックアップ装置63のインターフェイスとなるファイルアクセス部300と、ファイルを各分散ノード62−1〜62−3に分散して格納する分散格納部301と、を含む。分散ファイルシステムでは、ファイルを記憶するノードを分散して配置することで、ファイル(データ)の記憶に係る処理を並列して実行可能とすると共に、必要に応じて冗長性を付与することで、システム全体の容量、性能及び信頼性の向上を図っている。
ここで、分散ファイルシステムに限らず、凡そファイルを記憶するシステムでは、記憶ファイルのバックアップが重要となる。しかし、分散ファイルシステムにおけるファイルのバックアップに関しては、取り扱うデータ量が膨大であることもあり、典型的なバックアップ手法が確立していない状況にある。
特許文献1において、複数のファイルサーバにあるファイルを一元的に管理するインデックスサーバを設置し、インデックスサーバがファイルの複製先、移動先を決定するシステムが開示されている。
特許文献2において、分散ファイルシステムの全体を複製(リプリケーション)しつつ、複製するファイルを一部に限定するファイルシステムが開示されている。
特開2010−218335号公報 特開2004−252957号公報
なお、上記先行技術文献の各開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明者らによってなされたものである。
ファイルステムの典型的なバックアップ処理は以下のとおり実行される。第1に、ファイルシステム全体をスキャンし、バックアップの対象となるファイルに関するリストを作成する。その際、ファイルのパス名や更新時刻を確認するために、メタデータを参照することが多い。なお、メタデータは、ファイルの管理データであり、ファイルの更新日時、アクセス権限、サイズ等に関する情報(属性値)を含む。第2に、バックアップの対象ファイルの実データをファイルシステムから取得する。なお、実データとは、ファイルの内容そのものである。第3に、取得した実データをストレージ装置に格納する。
上記のバックアップ処理を、分散ファイルシステムにて実行すると以下の問題が生じる可能性がある。
分散ファイルシステムでは、ファイルが各分散ノードに分散されて格納されているため、分散された単位ごとに、データを格納している分散ノードを特定する処理や、読み込み対象の分散ノードを切り替える処理が必要となる。このような処理は、各分散ノードと接続を開始する、接続を終了するといったオーバーヘッドを生じさせる。つまり、メタデータ及び実データいずれのデータを読み込む場合であっても、分散ファイルシステム特有のオーバーヘッドが生じる。
加えて、データの総量が同じであったとしても、実データにアクセスする際に、個々のファイルサイズが小さいほど、オーバーヘッドが大きくなる。多数のファイルを読み込むために、分散ノードを切り替え、データを取得する処理がより多く発生するためである。
上記の問題を解決するために、例えば、特許文献1が開示するような手法(データの一元管理)を用いることが考えられる。具体的には、図14に示すように、ファイルシステム統合装置64のメタデータ管理部402からアクセス可能なメタデータ記憶装置65を設け、当該記憶装置にてメタデータを一元管理(集中管理)することが考えられる。このような手法は、ファイルシステム全体のある瞬間のイメージであるスナップショットの確定、静止点定義には有効な技術であり、主にNAS仮想化装置等にて用いられている。
しかしながら、メタデータを集中管理することは、メタデータ記憶装置65が分散ファイルシステムにおける単一障害点(SPF;Single Point of Failure)となるだけでなく、性能上のボトルネックとなり得る。さらに、上記の手法は実データに対するアクセス性能の向上に寄与しない。
以上のように、分散ファイルシステムにおいては、ファイルを分散して格納することにより生じるバックアップ処理時のオーバーヘッドの発生、即ち、分散ファイルシステムの性能低下が問題となる。
本発明は、バックアップ処理時の性能向上に寄与する分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置を提供することを目的とする。
本発明の第1の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、を含み、前記制御装置は、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、前記管理装置は、前記転送されたファイルのメタデータを記憶する第1の記憶部と、前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、を備える、分散ファイルシステムが提供される。
本発明の第2の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、を含む、バックアップファイル取得方法が提供される。
なお、本方法は、制御装置と管理装置という、特定の機械に結びつけられている。
本発明の第3の視点によれば、ファイルを記憶する複数のノードに対するアクセスを制御すると共に、前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する、制御装置が提供される。
本発明の第4の視点によれば、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、を備える、管理装置が提供される。
本発明の各視点によれば、バックアップ処理時の性能向上に寄与する分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置が、提供される。
一実施形態の概要を説明するための図である。 第1の実施形態に係る分散ファイルシステムの構成の一例を示す図である。 クライアントからファイル書き込み要求があった場合の動作の一例を示すシーケンス図である。 分散ファイルシステムのスナップショット生成に係る動作の一例を示すシーケンス図である。 ファイルシステム統合装置のスナップショット取得処理に係る動作の一例を示すフローチャートである。 分散ファイルシステムのバックアップファイルの決定に係る動作の一例を示すシーケンス図である。 分散ファイルシステムの実データのバックアップに係る動作の一例を示すシーケンス図である。 複製ファイルシステム管理装置のバックアップファイル送信要求を処理する際の動作の一例を示すフローチャートである。 分散ファイルシステムの構成の一例を示す図である。 分散ファイルシステムの構成の一例を示す図である。 バックアップ方式の一例を説明するための図である。 第2の実施形態に係る分散ファイルシステムの構成の一例を示す図である。 分散ファイルシステムの構成の一例を示す図である。 分散ファイルシステムの構成の一例を示す図である。
初めに、図1を用いて一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。
上述のように、バックアップ処理時の性能向上に寄与する分散ファイルシステムが望まれる。
そこで、一例として図1に示す分散ファイルシステムを提供する。分散ファイルシステムは、ファイルを記憶する複数のノードに対するアクセスを制御する制御装置100と、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置101と、を含む。制御装置100は、複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、格納しようとするファイルを管理装置に転送する転送部102を備える。管理装置101は、転送されたファイルのメタデータを記憶する第1の記憶部103と、転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部104と、バックアップ装置から、ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、第1の記憶部103が記憶するメタデータを取得してバックアップ装置に送信し、バックアップ装置から、ノードが記憶するファイルの実データの送信要求を受けた場合には、第2の記憶部104が記憶する実データ及びバックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、バックアップ装置に送信する、ファイルアクセス部105と、を備える。
管理装置101は、制御装置100から転送されてくるファイルを用いて、複数の分散ノードからなる分散ファイルシステムの複製を内部に構築し、バックアップ装置からの各種要求を、内部に構築した仮想的なファイルシステムの複製を用いて処理する。また、管理装置101は、ファイルシステムの複製を構築する際に、基本的には全ファイルのメタデータを記憶するが、実データに関しては所定の条件(例えば、ファイルサイズが閾値以下)を満たす実データを記憶する。従って、管理装置101は、バックアップ装置からメタデータの取得や内部に記憶した実データの送信要求を受けた場合には、分散ノードからなる分散ファイルシステム本体にアクセスせずに、ファイルシステムの複製にアクセスすることで、対処できる。その結果、分散ファイルシステムのバックアップを行う際のオーバーヘッドが減少し、バックアップ処理時の性能向上が達成できる。
以下に具体的な実施の形態について、図面を参照してさらに詳しく説明する。
[第1の実施形態]
第1の実施形態について、図面を用いてより詳細に説明する。
図2は、第1の実施形態に係る分散ファイルシステムの構成の一例を示す図である。分散ファイルシステムは、クライアント1と、ファイルシステム統合装置2と、複数の分散ノード3−1〜3−n(nは正の整数、以下同じ)と、バックアップ装置4と、複製ファイルシステム管理装置5と、を含んで構成される。図2に示す分散ファイルシステムに含まれる各装置は、ネットワークを介して相互に接続されている。なお、以下の説明において、分散ノード3−1〜3−nを区別する特段の理由がない場合には、単に「分散ノード3」と表記する。
クライアント1は、分散ファイルシステムを利用するユーザが、業務等で使用するコンピュータ等である。クライアント1から、ファイルシステム統合装置2に対して、ファイルの書き込み要求や読み出し要求がなされる。
ファイルシステム統合装置2は、クライアント1からのアクセス要求を処理する装置である。具体的には、ファイルシステム統合装置2は、ファイルを記憶する分散ノード3に対するアクセスを制御する装置である。ファイルシステム統合装置2は、上述の制御装置100に相当する。
ファイルシステム統合装置2は、分散ノード3に対するファイルの書き込みや更新要求を行う際には、同等の要求を複製ファイルシステム管理装置5にも行う。さらに、ファイルシステム統合装置2は、分散ノード3、複製ファイルシステム管理装置5に対して、任意のタイミングにてスナップショットを取得させる機能を有する。
分散ノード3は、ファイルシステム統合装置2から書き込まれるファイルを記憶する装置である。なお、分散ノード3は、ファイルシステム統合装置2からの通知に応じて、特定のタイミングにおけるスナップショットを取得する機能を有する。
バックアップ装置4は、実際にバックアップデータを記憶する媒体(例えば、テープ装置、アーカイブ装置等)を備え、分散ファイルシステムのバックアップを管理、実施するソフトウェアがインストールされたコンピュータ等が該当する。
複製ファイルシステム管理装置5は、バックアップ装置4からの各種要求を処理する装置である。複製ファイルシステム管理装置5は、バックアップ装置4からの要求に応えるため、分散ファイルシステム全体が記憶するファイルのメタデータの複製と、分散ノード3が記憶するファイルのうち、所定の条件を満たすファイルに関する実データの複製と、を少なくとも記憶する。複製ファイルシステム管理装置5は、上述の管理装置101に相当する。
図2を参照すると、ファイルシステム統合装置2は、ファイルアクセス部10と、分散格納部11と、ファイル転送部12と、スナップショット制御部13と、を含んで構成される。なお、ファイルアクセス部10等の各部は、ファイルシステム統合装置2に搭載されたコンピュータに、そのハードウェアを用いて、後に詳述する処理を実行させるコンピュータプログラムにより実現することもできる。
ファイルアクセス部10は、クライアント1とのインターフェイスを提供する手段である。ファイルアクセス部10は、クライアント1からのアクセス要求に従い、分散格納部11やファイル転送部12に、クライアント1から取得したファイルを引き渡し、ファイル書き込み要求、ファイル更新要求を発する。
分散格納部11は、ファイルアクセス部10からのファイル書き込み要求に応じて、分散ノード3にファイルを格納する手段である。具体的には、分散格納部11は、分散ノード3に対し、ファイルデータ又はその各断片の書き込み要求を送信する。分散格納部11は、予め定められた分散ファイルシステムの分散格納規則に基づき、書き込み要求を送信する分散ノード3を定める。
なお、ファイルシステム統合装置2が、分散ノード3が記憶するファイルを読み出す際には、図示しない読み出し手段を用いる。
ファイル転送部12は、分散格納部11が、分散ノード3−1〜3−nのうち少なくとも1以上の分散ノード3にファイルを格納する際に、当該格納しようとするファイルを複製ファイルシステム管理装置5に転送する手段である。即ち、ファイル転送部12は、分散格納部11が分散ノード3に対して行うのと同等のファイル書き込み要求を、複製ファイルシステム管理装置5に対して行うと共に、当該ファイルが格納される(格納される予定の)分散ノード3を特定するノード番号等を複製ファイルシステム管理装置5に送信する。
スナップショット制御部13は、分散ノード3、複製ファイルシステム管理装置5に対して、任意のタイミングにてスナップショットを取得させる手段である。スナップショット制御部13は、後述するスナップショット取得指示を受信した時点を境にファイルの世代を管理する機能を有する。
分散ノード3は、データ記憶部20と、メタデータ記憶部21と、を含んで構成される。データ記憶部20は、ファイルの実データを記憶する手段である。メタデータ記憶部21は、ファイルのメタデータを記憶する手段である。
複製ファイルシステム管理装置5は、ファイルアクセス部30と、スナップショット部31と、複製ファイルシステム部32と、を含んで構成される。なお、ファイルアクセス部30等の各部は、複製ファイルシステム管理装置5に搭載されたコンピュータに、そのハードウェアを用いて、後に詳述する処理を実行させるコンピュータプログラムにより実現することもできる。
ファイルアクセス部30とスナップショット部31は共に、バックアップ装置4に対するインターフェイスとして機能する。具体的には、ファイルアクセス部30は、バックアップ装置4からのデータ送信要求を処理する手段である。
スナップショット部31は、バックアップ装置4からのスナップショット生成に係る要求を処理する手段である。
複製ファイルシステム部32は、分散ファイルシステムが記憶する全ファイルのメタデータの複製と、分散ファイルシステムが記憶する一部のファイルに関する実データの複製と、残りの実データを記憶する分散ノードを特定するための情報と、を管理する手段である。つまり、複製ファイルシステム管理装置5は、その内部に分散ノード3からなる分散ファイルシステム本体の複製を有することにより、ファイルシステム本体に対する仮想的なファイルシステムを構築し、管理する。
複製ファイルシステム管理装置5にて、分散ファイルシステムが対象とする全ファイルの実データを記憶することが考えられる。しかし、複製ファイルシステム管理装置5にて、分散ファイルシステム全体が記憶する全データを記憶しようとすると、分散ファイルシステム自身の容量と同じ容量(同じ容量の記憶媒体)が必要となる。そこで、第1の実施形態に係る複製ファイルシステム管理装置5では、所定の条件を満たすファイルを複製ファイルシステム管理装置5に記憶し、当該条件を満たさないファイルは分散ノード3での記憶に留める。
所定の条件には、例えば、ファイルのサイズを条件とすることができる。より具体的には、サイズの大きいファイルは分散ノード3に記憶し、サイズの小さいファイルは複製ファイルシステム管理装置5にも記憶するという条件である。実際には、予め閾値を設定し、当該閾値により複製ファイルシステム管理装置5に実データを記憶するか否かを定める。本実施形態では、サイズが閾値以下のファイルを複製ファイルシステム管理装置5に記憶(複製)するものとして、説明する。ただし、所定の条件をファイルのサイズに限定する趣旨ではない。例えば、ファイルの種別(例えば、テキストファイルやバイナリファイル)等を所定の条件としてもよい。
複製ファイルシステム部32は、間接データ記憶部201と、間接データ参照部202と、転送実データ記憶部203と、実データ参照部204と、転送メタデータ記憶部205と、を含んで構成される。
間接データ記憶部201は、分散ファイルシステムを構成する複数の分散ノード3のなかから、ファイルが格納された分散ノード3を特定するために必要な情報(以下、間接データと表記する)を記憶する。なお、ファイルが格納される分散ノード3を特定するための間接データは、分散ファイルシステムのデータ格納方式に応じて適宜、選択される情報である。例えば、間接データ記憶部201は、ファイルの識別子と当該ファイルを記憶する分散ノード3のノード番号をペアとするような情報を記憶する。
間接データ参照部202は、間接データ記憶部201が記憶する情報に基づき、分散ノード3に格納されたファイルにアクセスする手段である。
転送実データ記憶部203は、ファイルシステム統合装置2から転送されてくるファイルのうち、所定の条件を満たすファイルの実データを記憶する。本実施形態では、上述のように、サイズが閾値以下のファイルが、転送実データ記憶部203に記憶される。
実データ参照部204は、転送実データ記憶部203が記憶するファイルにアクセスするための手段である。
転送メタデータ記憶部205は、ファイルシステム統合装置2から転送されてくる全ファイルのメタデータを記憶する。メタデータは、実データと比較すれば、そのサイズは極めて小さく、分散ノード3に記憶される全データのメタデータを記憶したとしても記憶に必要な容量は限定的である。
次に、分散ファイルシステムの動作について説明する。分散ファイルシステムの動作に関する説明は、分散ノード3へのファイルの書き込み、分散ノード3からのバックアップの実施等、機能ごとに行う。
<クライアント1からのファイル書き込み要求への対応>
図3は、クライアント1からファイル書き込み要求があった場合の動作の一例を示すシーケンス図である。
ステップS101において、クライアント1は、ファイルシステム統合装置2に対し、ファイル書き込み要求を送信する。
ステップS102において、ファイルシステム統合装置2の分散格納部11は、当該要求に応じて、分散ノード3に対し、ファイルデータ又はその各断片の格納要求を行う。
その際、ファイルシステム統合装置2のファイル転送部12は、分散ノード3に格納しようとするファイルを複製ファイルシステム管理装置5に転送する(ステップS103)。つまり、ファイル転送部12は、分散格納部11が行うのと同等のファイル書き込み要求を、複製ファイルシステム管理装置5に行う。
なお、図3において、ステップS102の後にステップS103を実行するように記載しているが、処理の実行順を限定する趣旨ではなく、これらの実行順が逆でもよいし、並列に(同時に)に実行されてもよい。
ステップS104において、分散ノード3は、受信した書き込み要求に基づき、データ記憶部20に実データを、メタデータ記憶部21に対応するメタデータを、それぞれ格納する。
ステップS105において、複製ファイルシステム部32は、ファイル転送部12から受信したファイル書き込み要求に対し、受信したファイルのメタデータを、転送メタデータ記憶部205に格納する。
ステップS106において、複製ファイルシステム部32は、転送ファイルのサイズが閾値より大きいか否かを判定し、判定結果に基づいて、間接データ記憶部201へのデータ格納、又は、転送実データ記憶部203への実データの格納のいずれかを行う(ステップS107、S108)。
転送ファイルのファイルサイズが閾値よりも大きい場合には、複製ファイルシステム部32は、当該ファイルが格納される分散ノード3を特定するための情報(間接データ)を間接データ記憶部201に格納する(ステップS107)。
一方、ファイルサイズが閾値以下である場合には、複製ファイルシステム部32は、当該所定の条件を満たす実データを、転送実データ記憶部203に格納する。
なお、図3を参照して説明した動作は、クライアント1からのファイル書き込み要求に応じたものである。クライアント1からファイル更新要求があった場合も、図3に準ずる動作を行う。
ただし、その場合には、分散ノード3には既に対象とするファイルは存在するため、ステップS104における分散ノード3の動作は「ファイルの更新」となる。また、当該更新ファイルのメタデータも複製ファイルシステム管理装置5に存在するため、ステップS105における当該装置の動作は「メタデータの更新」となる。
一方、更新ファイルのサイズは変更になることがあって、更新ファイルが所定の条件を満たすか否かは定かではない。そこで、複製ファイルシステム管理装置5は、更新ファイルに対し、ステップS106〜S108に係る動作を再び実行する。
<スナップショットの取得>
バックアップ装置4は、分散ファイルシステムの管理者等により予め定められたスケジュールに従って、分散ファイルシステムのバックアップを実施する。バックアップの実施に先立って、バックアップ装置4は、スナップショットの生成指示を複製ファイルシステム管理装置5に対して行う。
図4は、分散ファイルシステムのスナップショット生成に係る動作の一例を示すシーケンス図である。
ステップS201において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、スナップショット生成指示を送信する。
ステップS202において、スナップショット部31は、ファイルシステム統合装置2に対して、スナップショット取得(採取)の指示を行う。
ステップS203において、ファイルシステム統合装置2は、スナップショット取得に係る処理を実行する。
図5は、ファイルシステム統合装置2のスナップショット取得処理に係る動作の一例を示すフローチャートである。図5を参照しつつ、ファイルシステム統合装置2によるスナップショット取得に係る動作を説明する。
初めに、スナップショット制御部13は、スナップショット取得指示を受け付けた時点を境としてファイルの世代を管理する(ステップS301)。具体的には、スナップショット制御部13は、スナップショット取得指示を受領した時点で、世代Aを完了し、その後世代Bが開始されることを認識する。
スナップショット制御部13は、スナップショット取得指示の受信以降、分散ノード3や複製ファイルシステム管理装置5に送信しようとするファイルに世代Bを意味するタグを付与する(ステップS302)。なお、スナップショット取得指示の受信以前のファイル書き込み、ファイル更新要求時に送信されたファイルには、世代Aのタグが付与されている。
次に、スナップショット制御部13は、ファイル転送部12に、世代Bのタグが付与されたファイルに関する書き込み、更新要求を、複製ファイルシステム管理装置5に送信するのを中断させる(ステップS303)。世代Bのタグが付与されたファイルの送信を中断することで、世代Aのタグが付与されたファイルに対する書き込み処理、更新処理が複製ファイルシステム管理装置5にて完了するのを待機する(ステップS304)。
次に、スナップショット制御部13は、複製ファイルシステム管理装置5に対して、スナップショットの取得を指示する(ステップS305)。スナップショット取得指示を受け取った複製ファイルシステム管理装置5は、転送実データ記憶部203及び転送メタデータ記憶部205のスナップショットを取得する。
その後、スナップショット制御部13は、複製ファイルシステム管理装置5からスナップショット取得完了に関する応答を受信する(ステップS306)。なお、当該応答を受信した後は、ファイル転送部12は、世代Bのタグが付与されたファイルの書き込み、更新要求を複製ファイルシステム管理装置5に送信できるようになる。
スナップショット制御部13は、ステップS303〜S306の動作と並行して、分散ノード3に対するスナップショット取得に係る処理を行う(ステップS307)。つまり、スナップショット制御部13は、ステップS303〜S306と同様の処理を、分散ノード3に対して行う。
具体的には、スナップショット制御部13は、分散格納部11に、世代Bのタグが付与されたファイルに関する書き込み、更新要求を、各分散ノード3に送信するのを中断させる。スナップショット制御部13は、世代Bのタグが付与されたファイルの転送を中断することで、世代Aのタグが付与されたファイルに対する書き込み処理、更新処理が各分散ノード3にて完了するのを待機する。
その後、スナップショット制御部13は、世代Aのタグが付与されたファイルの書き込み、更新要求に係る処理が完了した分散ノード3に対して、スナップショットの取得を指示する。スナップショット取得指示を受け取った分散ノード3は、データ記憶部20及びメタデータ記憶部21のスナップショットを取得する。
その後、スナップショット制御部13は、スナップショット取得完了に関する応答を分散ノード3から受信する。また、スナップショット取得完了に関する応答を受信した後は、分散格納部11は、当該応答を送信してきた分散ノード3に対し、世代Bのタグが付与されたファイルの書き込み、更新要求を送信する。
このように、スナップショット制御部13は、複製ファイルシステム管理装置5に転送されたファイルのうち、古い世代のファイルに関する処理が完了したことを確認し、その後、複製ファイルシステム管理装置5に対して、スナップショット取得指示を行う。スナップショット制御部13は、分散ノード3に対しても、同様のスナップショット取得指示を行う。
図4における説明に戻ると、複製ファイルシステム管理装置5及び分散ノード3からスナップショット取得完了に関する応答を受信したファイルシステム統合装置2は、スナップショット取得完了通知を複製ファイルシステム管理装置5に対して送信する(ステップS204)。
当該通知を受信した複製ファイルシステム管理装置5は、バックアップ装置4に対して、スナップショットの生成が完了した旨を通知する(ステップS205)。
<バックアップ対象の決定>
スナップショットの作成が正常に終了すると、バックアップ装置4はバックアップするファイルを決定する。
図6は、分散ファイルシステムのバックアップファイルの決定に係る動作の一例を示すシーケンス図である。
ステップS401において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、分散ファイルシステムにて記憶されているファイルの属性情報を含む一覧を要求する。
ステップS402において、複製ファイルシステム管理装置5のファイルアクセス部30は、複製ファイルシステム部32に、当該情報要求の処理を依頼する。複製ファイルシステム部32は、転送メタデータ記憶部205から各ファイルの属性情報(例えば、当該ファイルの更新日時等)を取得し、取得した情報をファイルアクセス部30に返信する。
ファイルアクセス部30は、受信したファイルの属性情報(一覧情報)を、バックアップ装置4に返信する。つまり、ファイルアクセス部30は、複製ファイルシステム部32の転送メタデータ記憶部205が記憶するメタデータを取得し、バックアップ装置4に応答する。
バックアップ装置4は、取得したファイルの属性情報に基づき、バックアップするファイルを決定する(ステップS403)。例えば、バックアップ装置4は、前回バックアップを実施した時点以降に、更新されたファイルをバックアップの対象とする。
<実データのバックアップ>
次に、バックアップ装置4は、バックアップファイルの実データに関する送信要求を、複製ファイルシステム管理装置5に対して行う。
図7は、分散ファイルシステムの実データのバックアップに係る動作の一例を示すシーケンス図である。
ステップS501において、バックアップ装置4は、複製ファイルシステム管理装置5に対して、バックアップファイルに係る実データの送信を要求する。当該要求を受けた、複製ファイルシステム管理装置5のファイルアクセス部30は、当該送信要求の処理を複製ファイルシステム部32に依頼する(ステップS502)。
図8は、複製ファイルシステム管理装置5のバックアップファイル送信要求を処理する際の動作の一例を示すフローチャートである。図8を参照しつつ、複製ファイルシステム管理装置5によるバックアップファイル送信要求を処理する動作を説明する。
ステップS601において、複製ファイルシステム部32は、要求されたバックアップファイルが所定の条件を満たすか否かを判定する。具体的には、複製ファイルシステム部32は、要求されたバックファイルのファイルサイズが予め定めた閾値以下であるか否かを判定する。
要求されたバックファイルのファイルサイズが予め定めた閾値より大きい場合(ステップS601、No分岐)には、複製ファイルシステム部32は、間接データ参照部202を動作させる。具体的には、ステップS602において、間接データ参照部202は、間接データ記憶部201が記憶する情報に基づいて、要求されたファイルを記憶している分散ノード3を特定し、当該分散ノード3に対して直近のスナップショット世代におけるファイルの実データの送信要求を行う。
ステップS603において、間接データ参照部202は、分散ノード3から取得した実データを、ファイルアクセス部30に応答する。
一方、要求されたバックファイルのファイルサイズが予め定めた閾値以下の場合(ステップS601、Yes分岐)には、複製ファイルシステム部32は、実データ参照部204を動作させる。具体的には、ステップS604において、実データ参照部204は、転送実データ記憶部203が記憶する直近のスナップショット世代におけるファイルの実データを、ファイルアクセス部30に応答する。
ステップS605において、ファイルアクセス部30は、間接データ参照部202又は実データ参照部204から取得した実データを、バックアップ装置4に送信する。
このように、ファイルアクセス部30は、バックアップ装置4から、バックアップファイルの実データの送信に係る要求を受けた場合には、所定の条件に基づき、分散ノード3が記憶する実データ又は転送実データ記憶部203が記憶する実データのいずれかを、バックアップ装置4に送信する。
図7に戻ると、ステップS503において、バックアップ装置4は、受信した実データのバックアップを行う。
なお、第1の実施形態では、ファイルシステム統合装置2は、クライアント1から受信した全てのファイル書き込み要求に関し、当該ファイルを複製ファイルシステム管理装置5に転送する形態について説明した。しかし、全てのファイルを複製ファイルシステム管理装置5に転送することに限定する趣旨ではない。例えば、分散ノード3に格納されるファイルであってもバックアップする必要がないファイル等であれば、複製ファイルシステム管理装置5に転送する必要はない。
さらに、第1の実施形態では、複製ファイルシステム管理装置5の転送メタデータ記憶部205は、転送されてきた全てのファイルのメタデータを記憶する形態について説明した。しかし、転送メタデータ記憶部205にて、全ファイルのメタデータを記憶することに限定する趣旨ではない。例えば、バックアップの対象とならないことが予め判明しているファイルであれば、転送されてきたファイルのメタデータを記憶する必要はない。
以上のように、第1の実施形態に係る分散ファイルシステムでは、メタデータやサイズの小さいファイルを単一のノード(複製ファイルシステム管理装置5)に集約している。そのため、これらの情報を取得する際に、分散ノード3へのアクセスを要しない。その結果、分散ファイルシステムのバックアップを行う際のオーバーヘッドが減少し、バックアップ処理時の性能向上(例えば、バックアップの高速化)が達成できる。
また、必ずしも分散ファイルシステムに限ることではないが、バックアップの負荷が、分散ファイルシステムを使用する業務の性能に影響を与えることがある。このような影響を避けるための技術として、システムの冗長性を利用して、業務とバックアップの負荷を分離する技術が存在する。
例えば、図9に示すように、各分散ノード3a、3c、3eの複製を行い、分散ノード3b、3d、3fを生成する。ファイルシステム統合装置2aは、分散ノードに対して通常のアクセス(実線にて図示するアクセス)を行う場合には、複製元の分散ノードにアクセスする。一方、ファイルシステム統合装置2aは、分散ノードからバックアップデータを読み出すアクセス(点線にて図示するアクセス)を行う場合には、複製された分散ノードにアクセスする。
あるいは、図10に示すように、分散ノード3g〜3iに含まれるデータ記憶部20bのそれぞれに同じファイルAを格納し、通常のアクセスとバックアップ用のアクセスを分離することが考えられる。具体的には、バックアップ用のアクセスと通常のアクセスのトラフィックを分離し、通常業務とバックアップでは、別ノードがデータ要求に応答するようにファイルシステム統合装置2bの処理をディスパッチすることも考えられる。
このように、システムの冗長性を利用して、分散ノードにおける負荷の競合を避けることで、バックアップの負荷による業務への影響を緩和することができる。しかし、このような方法であっても、ファイルシステム統合装置2a、2bにおける負荷の競合は解消されない。
一方、第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が、独立した転送メタデータ記憶部205と、ファイルアクセス部30を備えているため、バックアップ時のアクセスを完全に分離しつつ、バックアップ対象のファイルのリスト化や属性値を参照するなどの処理を、内蔵するメタデータを用いて行うことができる。つまり、ファイルシステム統合装置2や分散ノード3からなる分散ファイルシステム本体とは独立して、バックアップ装置4の要求に対応できるので、バックアップ時の業務への影響を軽減できる。
また、類似領域であるブロックレベルストレージでは、業務との競合の問題に対応するため、図11に示すように、ブロックストレージ制御部50の制御下にあるデータ記憶部51全体を、別のブロックストレージ制御部50aの制御下にあるデータ記憶部51aに複製することが考えられる。この場合、バックアップ装置4cからのアクセスを完全に分離し、通常業務とバックアップの負荷が分離できる。しかし、このような対応では、機器全体を2セット(又はそれ以上)用意する必要があり、経済的ではない。
一方、第1の実施形態に係る分散ファイルシステムでは、機器全体を複製せず、且つ、バックアップと通常業務の分離を実現できている。
また、特許文献2が開示するように、複製するファイルを一部のファイルに限定すれば、複製側で必要とされる容量、機材が抑制できる。しかし、特許文献2が開示する技術では、特定の基準により予めバックアップ対象を絞ることができない場合には適用できない。
一方、第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が所定の条件に基づき、ファイルの複製を絞り込み、絞り込みから漏れたファイルに関しては分散ノード3から取得するため、バックアップの対象に対する限定は存在しない。
さらに、バックアップのデータはファイルシステムとして矛盾のないものである必要があるが、複数のノードから構成される分散ファイルシステムでは、全体として矛盾のないデータをバックアップするのが困難である。また、バックアップを、より意味のあるものとするため、バックアップ処理中は記憶データの内容が変化しないよう固定する必要がある。より具体的には、ファイルAはバックアップされているが、ファイルAより前に分散ファイルシステムに格納されたファイルBがバックアップされていないといった状況は避ける必要がある。
そのため、ファイルシステム全体のある瞬間のイメージであるスナップショットを取得し、そのスナップショットのデータをバックアップの対象とする。しかし、分散ファイルシステムは複数のノードから構成されるため、ノード間で共通の瞬間(タイミング)を定義できず、スナップショットの取得が困難である。
第1の実施形態に係る分散ファイルシステムでは、複製ファイルシステム管理装置5が集中型NASの構成を採用しているため、「分散ファイルシステムが複製された仮想ファイルシステム側でのスナップショット取得時点」として静止点を定義できるので、分散ファイルシステムとしての静止点にてバックアップが可能となる。
また、複製ファイルシステム管理装置5から分散ノード3へのアクセスを可能とすることで、分散ファイルシステムが記憶の対象とする全ファイルに関する実データを複製ファイルシステム管理装置5に記憶する必要がない。そのため、分散ファイルシステムの複製を集中型NASに取得するための高性能・高信頼性・大容量のNASを必要としない。
[第2の実施形態]
続いて、第2の実施形態について図面を参照して詳細に説明する。
図12は、第2の実施形態に係る分散ファイルシステムの構成の一例を示す図である。図12において図2と同一構成要素には、同一の符号を付し、その説明を省略する。
図12に示すファイルシステム統合装置2cは、更新情報蓄積部14を備える点が、第1の実施形態に係るファイルシステム統合装置2と異なる。また、複製ファイルシステム管理装置5aは、ファイル更新履歴記憶部206を備える点が、第1の実施形態に係る複製ファイルシステム管理装置5と異なる。さらに、複製ファイルシステム管理装置5aでは、間接データ記憶部201が存在しない。
図12に示す更新情報蓄積部14は、複製ファイルシステム管理装置5aに転送されるファイルのバッファとして機能する。
ここで、クライアント1からのファイル書き込み、更新要求に対して、ファイル転送部12が、複製ファイルシステム管理装置5aにファイルを転送し、その応答を確認後、クライアント1に応答を返却する方法では、クライアント1への応答性能が悪化する可能性がある。そこで、第2の実施形態では、ファイルシステム統合装置2cの内部に複製ファイルシステム管理装置5aに転送するファイルのバッファを設け、複製ファイルシステム管理装置5aでの複製を非同期にて実行するようにしている。
更新情報蓄積部14のバッファサイズは、構成機器の性能や想定するクライアント1からのアクセス頻度に応じて決定されるが、バッファサイズを可変とすることも考えられる。更新情報蓄積部14のバッファが一杯になった場合には、複製ファイルシステム管理装置5aへの書き込みを同期モードに移行するか、管理者に通報して対処を促す、等の対応を実施する。
第2の実施形態では、間接データ記憶部201を削除している。これは、以下の2つのケースを想定したものである。
分散ファイルシステムでは、各ファイル(又はファイルの断片)の格納位置を決定する方法は、2つの種類に大別できる。第1の方法は、各ファイルのファイル名等の属性から一意にデータを格納するノードが定まる方式である。第2の方法は、既存のファイル属性等からはデータを格納するノードが一意に定まらない方式である。以降の説明では、第1の方法を決定的方式、第2の方法を非決定的方式と表記する。
第1の実施形態にて説明した分散ファイルシステムでは、非決定的方式を想定したものである。そのため、個々のファイルを格納する分散ノード3に関するノード情報を間接データ記憶部201に保存しておく必要がある。
決定的方式を採用する場合には、ファイル名等、通常のメタデータとして保存されている属性データから必要なデータが格納されている分散ノード3を計算できる。そのため、決定的方式を採用する場合には、間接データ記憶部201は不要となる。これが、第1のケースである。決定的方式を採用する場合には、間接データ参照部202は、転送メタデータ記憶部205が記憶している属性データから、当該実データが記憶されている分散ノード3を特定し、当該分散ノードから実データを取得することになる。
一方、非決定的方式を採用する場合であっても、多少の性能劣化を容認すれば、間接データ参照部202が、クライアント1と同様の方法にて、ファイルシステム統合装置2cを経由して実データを取得することが可能である。ファイルシステム統合装置2cを経由して実データを取得することで、間接データ記憶部201に分散ノード3に関する情報を保存し、分散ファイルシステム本体と矛盾しないように維持するといった複雑な制御が不必要となる。これが、第2のケースである。
第2のケースの場合、間接データ参照部202は、ファイルシステム統合装置2cに対し、該当ファイルの実データを要求し、ファイルシステム統合装置2cからデータを取得する。
ここで、バックアップ装置4の機能を一部、複製ファイルシステム管理装置5aにて実現することが考えられる。例えば、バックアップ装置4がバックアップの対象を決定するのではなく、複製ファイルシステム管理装置5aが前回のバックアップ時からの差分ファイルの実体をバックアップ装置4に提供する形態も考えられる。このような形態での差分バックアップ時には、メタデータを全てチェックし、バックアップ対象ファイルを選別する必要がある。即ち、第1の実施形態にて図2を用いて説明したような構成では、転送メタデータ記憶部205が記憶するメタデータを一通りチェックする必要がある。
しかし、複製ファイルシステム管理装置5aは、ファイル更新履歴記憶部206に、ファイルシステム統合装置2cから転送されてくるファイルの更新履歴を記憶しておくことで、転送メタデータ記憶部205をチェックすることなく、前回のバックアップ取得時点以後、更新のあったファイル等を効率良く選別してバックアップ対象を決定できる。
以上のように、第2の実施形態に係る分散ファイルシステムでは、更新情報蓄積部14を用いることにより、クライアント1への応答性能を向上させるとともに、複製ファイルシステム管理装置5aの一時的な停止や応答遅延に対する耐性を付加できる。また、複製ファイルシステム管理装置5aでは、ファイル更新履歴記憶部206にファイルの更新履歴を記憶することで、バックアップすべき差分ファイルを容易に特定できるようになり、バックアップ性能がより向上する。
第1及び第2の実施形態にて説明した分散ファイルシステムは、通常業務への影響(性能低下、業務の一時停止)を可能な限り抑制しつつ、効率的にバックアップを取りたい環境下にて運用するのが好適である。
なお、第1及び第2の実施形態にて説明した分散ファイルシステムの構成及び動作は例示であって、種々の変形が可能である。例えば、複製ファイルシステム管理装置5の全機能又は一部の機能が、ファイルシステム統合装置2に組み込まれていてもよい。一例として、図3に示すステップS106の判断処理をファイル転送部12に組み込み、所定の条件が満たされない場合には、ファイルシステム統合装置2から複製ファイルシステム管理装置5への該当ファイルの転送を省略することが考えられる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
[付記1]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含み、
前記制御装置は、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、
前記管理装置は、
前記転送されたファイルのメタデータを記憶する第1の記憶部と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、分散ファイルシステム。
[付記2]
前記管理装置は、
前記複数のノードのうち、前記転送されたファイルに対応するファイルを記憶するノードを特定する情報を記憶する第3の記憶部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たす場合には、前記第2の記憶部が記憶する実データを参照し、前記ファイルアクセス部に応答する第1の参照部と、
前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たさない場合には、前記第3の記憶部を参照して前記バックアップ装置から送信要求を受けたファイルを記憶するノードから実データを取得し、前記ファイルアクセス部に出力する第2の参照部と、
をさらに備える、付記1の分散ファイルシステム。
[付記3]
前記管理装置は、前記バックアップ装置からスナップショット生成指示を受けると、スナップショット取得指示を前記制御装置に送信し、
前記制御装置は、
前記送信されたスナップショット取得指示を受信した時点を境にファイルの世代を管理するスナップショット制御部を備え、
前記スナップショット制御部は、
前記管理装置に転送されたファイルのうち、古い世代のファイルに関する前記管理装置の処理が完了した後に、前記管理装置に対して、前記第1及び第2の記憶部のスナップショット取得の指示を行い、
前記ノードが古い世代のファイルに関する処理が完了した後に、古い世代のファイルの記憶が完了したノードに対して、スナップショットの取得の指示を行い、
前記管理装置及び前記ノードから、スナップショットの取得が完了した応答を得た後に、前記管理装置にスナップショットの取得が完了したことを通知する、付記2の分散ファイルシステム。
[付記4]
前記転送部は、前記スナップショット制御部が前記管理装置から、スナップショットの取得が完了した応答を得た後に、前記管理装置に新しい世代のファイルを転送する、付記3の分散ファイルシステム。
[付記5]
前記制御装置は、
前記管理装置に転送するファイルを一時的に蓄積する蓄積部をさらに備える、付記1乃至4のいずれか一に記載の分散ファイルシステム。
[付記6]
前記管理装置は、
前記制御装置から転送されてくるファイルの更新履歴を記憶する第4の記憶部をさらに備える付記1乃至5のいずれか一に記載の分散ファイルシステム。
[付記7]
前記所定の条件には、前記転送されたファイルのサイズに関する条件が少なくとも含まれる、付記1乃至6のいずれか一に記載の分散ファイルシステム。
[付記8]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、
前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、
前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、
前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、
を含む、バックアップファイル取得方法。
[付記9]
ファイルを記憶する複数のノードに対するアクセスを制御すると共に、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する、制御装置。
[付記10]
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、
前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
を備える、管理装置。
[付記11]
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置を制御するコンピュータに実行させるプログラムであって、
前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを、バックアップ装置からの要求を処理する際に要する情報を管理する管理装置に転送する処理を実行させるプログラム。
[付記12]
バックアップ装置からの要求を処理する際に要する情報を管理する管理装置を制御するコンピュータに実行させるプログラムであって、
ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを第1の記憶部に記憶する処理と、
前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に記憶する処理と、
前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する処理と、
前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する処理と、
を実行させるプログラム。
なお、付記11及び付記12のプログラムは、コンピュータが読み取り可能な記憶媒体に記録することができる。記憶媒体は、半導体メモリ、ハードディスク、磁気記録媒体、光記録媒体等の非トランジェント(non-transient)なものとすることができる。
付記8〜付記12の各形態は、付記1と同様に、付記2〜付記7の形態に展開することができる。
なお、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。
1、60 クライアント
2、2a〜2c、61、64 ファイルシステム統合装置
3、3-1〜3-n、3a〜3i、62-1〜62-6 分散ノード
4、4a〜4c、63、64 バックアップ装置
5、5a 複製ファイルシステム管理装置
10、10a、10b、30、300、400 ファイルアクセス部
11、11a、11b、301、401 分散格納部
12 ファイル転送部
13 スナップショット制御部
14 更新情報蓄積部
20、20a、20b、51、51a、302 データ記憶部
21、21a、21b、303 メタデータ記憶部
31 スナップショット部
32、32a 複製ファイルシステム部
50、50a ブロックストレージ制御部
52 ファイル転送部
65 メタデータ記憶装置
100 制御装置
101 管理装置
102 転送部
103 第1の記憶部
104 第2の記憶部
105 ファイルアクセス部
201 間接データ記憶部
202 間接データ参照部
203 転送実データ記憶部
204 実データ参照部
205 転送メタデータ記憶部
206 ファイル更新履歴記憶部
402 メタデータ管理部

Claims (9)

  1. ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
    バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
    を含み、
    前記制御装置は、
    前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する転送部を備え、
    前記管理装置は、
    前記転送されたファイルのメタデータを記憶する第1の記憶部と、
    前記転送されたファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
    前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
    を備える、分散ファイルシステム。
  2. 前記管理装置は、
    前記複数のノードのうち、前記転送されたファイルに対応するファイルを記憶するノードを特定する情報を記憶する第3の記憶部と、
    前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たす場合には、前記第2の記憶部が記憶する実データを参照し、前記ファイルアクセス部に応答する第1の参照部と、
    前記バックアップ装置から送信要求を受けたファイルの実データが前記所定の条件を満たさない場合には、前記第3の記憶部を参照して前記バックアップ装置から送信要求を受けたファイルを記憶するノードから実データを取得し、前記ファイルアクセス部に出力する第2の参照部と、
    をさらに備える、請求項1の分散ファイルシステム。
  3. 前記管理装置は、前記バックアップ装置からスナップショット生成指示を受けると、スナップショット取得指示を前記制御装置に送信し、
    前記制御装置は、
    前記送信されたスナップショット取得指示を受信した時点を境にファイルの世代を管理するスナップショット制御部を備え、
    前記スナップショット制御部は、
    前記管理装置に転送されたファイルのうち、古い世代のファイルに関する前記管理装置の処理が完了した後に、前記管理装置に対して、前記第1及び第2の記憶部のスナップショット取得の指示を行い、
    前記ノードが古い世代のファイルに関する処理が完了した後に、古い世代のファイルの記憶が完了したノードに対して、スナップショットの取得の指示を行い、
    前記管理装置及び前記ノードから、スナップショットの取得が完了した応答を得た後に、前記管理装置にスナップショットの取得が完了したことを通知する、請求項2の分散ファイルシステム。
  4. 前記転送部は、前記スナップショット制御部が前記管理装置から、スナップショットの取得が完了した応答を得た後に、前記管理装置に新しい世代のファイルを転送する、請求項3の分散ファイルシステム。
  5. 前記制御装置は、
    前記管理装置に転送するファイルを一時的に蓄積する蓄積部をさらに備える、請求項1乃至4のいずれか一項に記載の分散ファイルシステム。
  6. 前記管理装置は、
    前記制御装置から転送されてくるファイルの更新履歴を記憶する第4の記憶部をさらに備える請求項1乃至5のいずれか一項に記載の分散ファイルシステム。
  7. 前記所定の条件には、前記転送されたファイルのサイズに関する条件が少なくとも含まれる、請求項1乃至6のいずれか一項に記載の分散ファイルシステム。
  8. ファイルを記憶する複数のノードに対するアクセスを制御する制御装置と、
    バックアップ装置からの要求を処理する際に要する情報を管理する管理装置と、
    を含んで構成される分散ファイルシステムのバックアップファイル取得方法であって、
    前記複数のノードのうち少なくとも1以上のノードにファイルを格納する際に、前記格納しようとするファイルを前記管理装置に転送する工程と、
    前記転送されたファイルのメタデータを第1の記憶部に格納する工程と、
    前記転送されたファイルの実データのうち、所定の条件を満たす実データを第2の記憶部に格納する工程と、
    前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信する工程と、
    前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する工程と、
    を含む、バックアップファイル取得方法。
  9. バックアップ装置からの要求を処理する際に要する情報を管理する管理装置であって、
    ファイルを記憶する複数のノードに対するアクセスを制御する制御装置から転送されるファイルのメタデータを記憶する第1の記憶部と、
    前記制御装置から転送されるファイルの実データのうち、所定の条件を満たす実データを記憶する第2の記憶部と、
    前記バックアップ装置から、前記ノードが記憶するファイルに関するメタデータの送信要求を受けた場合には、前記第1の記憶部が記憶するメタデータを取得して前記バックアップ装置に送信し、前記バックアップ装置から、前記ノードが記憶するファイルの実データの送信要求を受けた場合には、前記第2の記憶部が記憶する実データ及び前記バックアップ装置から送信要求を受けたファイルを記憶するノードが記憶する実データのいずれかを、前記バックアップ装置に送信する、ファイルアクセス部と、
    を備える、管理装置。
JP2014073413A 2014-03-31 2014-03-31 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置 Active JP6291977B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014073413A JP6291977B2 (ja) 2014-03-31 2014-03-31 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014073413A JP6291977B2 (ja) 2014-03-31 2014-03-31 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置

Publications (2)

Publication Number Publication Date
JP2015194973A JP2015194973A (ja) 2015-11-05
JP6291977B2 true JP6291977B2 (ja) 2018-03-14

Family

ID=54433898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014073413A Active JP6291977B2 (ja) 2014-03-31 2014-03-31 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置

Country Status (1)

Country Link
JP (1) JP6291977B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113625938A (zh) * 2020-05-06 2021-11-09 华为技术有限公司 一种元数据存储方法及其设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004252957A (ja) * 2003-01-30 2004-09-09 Hitachi Ltd 分散ファイルシステムのファイルレプリケーション方法及び装置
JP4581518B2 (ja) * 2003-12-19 2010-11-17 株式会社日立製作所 スナップショット取得方法
JP4550541B2 (ja) * 2004-10-06 2010-09-22 株式会社日立製作所 ストレージシステム
JP2008117342A (ja) * 2006-11-08 2008-05-22 Hitachi Ltd ストレージシステムおよびリモートコピーを制御するためのコントローラ
US8082230B1 (en) * 2006-12-22 2011-12-20 Symantec Operating Corporation System and method for mounting a file system on multiple host computers

Also Published As

Publication number Publication date
JP2015194973A (ja) 2015-11-05

Similar Documents

Publication Publication Date Title
US10956286B2 (en) Deduplication replication in a distributed deduplication data storage system
US9906598B1 (en) Distributed data storage controller
US11016696B2 (en) Redundant distributed data storage system
US8918392B1 (en) Data storage mapping and management
US11314444B1 (en) Environment-sensitive distributed data management
US8930364B1 (en) Intelligent data integration
WO2011027775A1 (ja) 分散ストレージシステム、分散ストレージ方法および分散ストレージ用プログラムとストレージノード
US20140188957A1 (en) Hierarchical storage system and file management method
WO2012140957A1 (ja) 情報記憶システム及びそのデータ複製方法
CN108604164A (zh) 用于存储区域网络协议存储的同步复制
US11321005B2 (en) Data backup system, relay site storage, data backup method, and control program for relay site storage
CN106528338A (zh) 一种远程数据复制方法、存储设备及存储系统
JP6291977B2 (ja) 分散ファイルシステム、バックアップファイル取得方法、制御装置及び管理装置
US9582384B2 (en) Method and system for data replication
KR20150010242A (ko) 비대칭 파일 시스템의 데이터 복제 방법
KR101748913B1 (ko) 분산 저장 환경에서 게이트웨이를 선택하기 위한 클러스터 관리 방법 및 데이터 저장 시스템
JP2013161383A (ja) 情報処理装置、情報処理方法、プログラム及び情報処理システム
KR101694308B1 (ko) 데이터 서버의 계층화를 이용한 데이터 복제 장치 및 방법
JP2016134133A (ja) ストレージシステム
US9952805B2 (en) Storage system and data write method using a logical volume to either store data successfully onto a first memory or send a failure response to a server computer if the storage attempt fails
WO2016170619A1 (ja) 計算機システム
WO2017037878A1 (ja) ストレージシステム及び検証方法
JP2017173979A (ja) データ管理装置、方法、及びプログラム
JP2017068729A (ja) ファイル記憶装置、情報処理方法、プログラム、ファイル記憶システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180129

R150 Certificate of patent or registration of utility model

Ref document number: 6291977

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150