JP2010238038A - 分散ファイルシステム及び分散ファイル格納方法 - Google Patents

分散ファイルシステム及び分散ファイル格納方法 Download PDF

Info

Publication number
JP2010238038A
JP2010238038A JP2009086334A JP2009086334A JP2010238038A JP 2010238038 A JP2010238038 A JP 2010238038A JP 2009086334 A JP2009086334 A JP 2009086334A JP 2009086334 A JP2009086334 A JP 2009086334A JP 2010238038 A JP2010238038 A JP 2010238038A
Authority
JP
Japan
Prior art keywords
chunk
data
file
unit
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009086334A
Other languages
English (en)
Other versions
JP5470974B2 (ja
Inventor
Sumiaki Sakae
純明 榮
Kinichi Sugimoto
欽一 杉本
Yasuo Itabashi
康雄 板橋
Masumi Ichien
真澄 一圓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009086334A priority Critical patent/JP5470974B2/ja
Publication of JP2010238038A publication Critical patent/JP2010238038A/ja
Application granted granted Critical
Publication of JP5470974B2 publication Critical patent/JP5470974B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】チャンクに分割されたファイルを効率良く読み出すことを可能にする。
【解決手段】ストレージノードは、前記データ塊の再配置の依頼を受けたときに、インデックス情報が、どのストレージノードに格納されているのかをメタサーバ装置に問い合わせるデータ再配置処理依頼受付部を有し、メタサーバ装置はマッピング情報を格納するメタデータ格納部と、マッピング情報に基づきインデックス情報を格納するストレージノードをデータ再配置処理依頼受付部に通知するメタデータ管理部とを有し、ストレージノードはインデックス情報を格納するストレージノードからインデックス情報を取得するコンテンツインデックス送受信部と、インデックス情報に基づきデータ塊の配置位置の計算するデータ塊配置位置計算部と、計算された配置位置に基づき、他のストレージノードとデータ塊の交換により再配置を行うデータ塊送受信部も有する。
【選択図】図7

Description

本発明は、ファイルをチャンクに分割し、分散して格納する分散ファイルシステム及び分散ファイル格納に方法に関する。
ファイルをチャンクに分割して格納する方法を用いる分散ファイルシステムがある。チャンクとはファイルを任意のサイズで分割した際の断片のことを指す。このような分散ファイルシステムをチャンク分割型分散ファイルシステムと呼ぶことにする。例えば、非特許文献1、2、3には、このチャンク分割型分散ファイルシステムの一例が記載されている。図1に示すように、このチャンク分割型分散ファイルシステムは、クライアント装置と、メタサーバ装置とストレージ装置とから構成されている。
チャンクのサイズの決め方としてはいろいろ考えられる。例えば、固定長である場合や、ファイルごとに指定される場合、または、何らかのルールに基づき計算される場合などが考えられる。以下では、ファイルが分割されなかった場合も、1チャンクに分割されたと表現することにする。
図1に示した構成を有するチャンク分割型分散ファイルシステムは、例えば、次のように動作する。クライアント装置がファイルの書き込みを行う場合、まず、クライアント装置は、メタサーバ装置を用いてファイルを開き、次に、開かれたファイルの識別子と、必要に応じて、書き込みを開始する位置(例えば、UNIX(登録商標)での書き込み、pwrite)と書き込まれるファイルのサイズをメタサーバ装置に通知する。
メタサーバ装置は、書き込まれるファイルを格納する領域がストレージ装置中にまだ確保済みでない場合には、システムに特有のルールなどに基づき、書き込まれるデータを複数のチャンクに分割し、それぞれに識別子を割り当てる。メタサーバ装置は、このチャンクそれぞれを格納するストレージ装置を決定し、ストレージ装置上の領域を確保し、このチャンクそれぞれのチャンクサイズとチャンク識別子と格納されるストレージノードのID、それぞれのストレージノードのIDが記述されたリストをクライアント装置に返す。このチャンクそれぞれのチャンクサイズとチャンク識別子と格納されるストレージノードのID、それぞれのストレージノードのIDが記述されたリストをマッピング情報と呼ぶことにする。マッピング情報は、メタサーバ装置上のメタデータとして記録される。メタサーバ装置は、書き込まれるファイルを格納する領域が確保済みである場合は、この格納先についての情報をクライアント装置に返す。
クライアント装置は、メタサーバ装置から返されたマッピング情報に基づき、ファイルをチャンクに分割し、これらのチャンクを格納すべきストレージノードに直接格納することでファイルの書き込みを完了する。
クライアントがファイルの読み出しを行う場合、まず、クライアント装置は、メタサーバ装置を用いてファイルを開き、次に開かれたファイルの識別子と、必要に応じて、読み出しを開始する位置(例えば、UNIXでの読み込み、pread)と読み出されるファイルのサイズをメタサーバ装置に通知する。メタサーバ装置は、メタデータを検索し、検索されたメタデータに基づき、読み出されるファイルに対応するチャンクを特定し、このチャンクにアクセスするのに必要なマッピング情報をクライアント装置に返す。クライアントはメタサーバから返されたマッピング情報を基づき、ストレージノードに対して直接チャンクの取得を行い、ファイルの読み出しを完了する。
このようなチャンク分割型分散ファイルシステムでは、チャンクのサイズはファイルの論理的な構成を考慮に入れずに決定されているため、以下の例のように、ファイルのアクセスが特徴的なパターンを持つような場合、特に、読み出しアクセスの際に非効率となる場合がある。以下に読み出しアクセスが非効率となってしまう例を示す。
ビデオを符号化する方式には、性能の異なるデバイスに対応するためや、多視点映像を実現するために、複数の解像度それぞれに対応するデータや、複数のストリームを合わせて、一つのファイルに格納するようなものがある。例えば、現在規格化が進められているH.264/MVC (Multi-view Video Coding)などがある。図2は、このような多視点映像のビデオのファイルフォーマット例と、このファイルのチャンク分割型分散ファイルシステムへの格納例を示した図である。
画面イメージは、複数のカメラで撮影された複数の視点からなる映像であり、ここでは視点が視点1から視点9まであるとする。この例では複数のカメラをグリッド上に並べて結果的に連続的な高解像度の画像を構成しているが、視点間は連続している必要はないし、視点の数にも前提は置かない。
各視点の映像は、例えば、ファイルに一定時間分のデータごとに視点順に並べられ、格納される。時間t=0における視点1〜視点9の映像が格納され、その後ろに、時間t=1における各視点の映像が格納され、その後ろに・・・、という具合である。ここで、ある時間tにおける視点vの映像に対応するデータを「データ塊(t、v)」と表現することにする。また、ファイル中の適切な場所に、例えば、最後の部分にデータ塊(t、v)に対するインデックス情報が格納されているとする。インデックス情報には、例えば、表1に示すように、各時刻での各視点データのサイズや、書き込まれている位置を示すオフセットなどが記述されている。
Figure 2010238038
ユーザは、映像を視聴する際、視聴したい領域を指定することで多視点映像のうちの任意の視聴領域の映像を視聴する。ユーザが指定する視聴領域は一般的に複数の視点にまたがる。例えば、図2に示すように、視点1、2、4、5にまたがる視聴領域をユーザが指定したとする。この視聴領域の再生には、視点1、2、4、5に対するデータが必要となる。したがって、再生の際には、図3に示すように、視点1、2、4、5を不連続にアクセスすることになる。
次に、このようなファイルをチャンク分割型分散ファイルシステムに格納する方法の一例を説明する。チャンク分割型分散ファイルシステムは、クライアント装置300、メタサーバ装置400、ストレージノード群500により構成される。ストレージノード群500は、例えば、N台のストレージノード510、520、・・・、5N0ストレージノードに含まれるM台のストレージ装置511、512、・・・、5NMにより構成されている。コンテンツファイル100は一定サイズのチャンク101、102、・・・に分割され、ストレージ装置511、512、・・・、5NMに格納される。このとき、チャンク分割型分散ファイルシステムはコンテンツファイルの論理的な構成に関して関知せずにチャンク分割を行うため、例えば、図4に示すように、データ塊がチャンクに分断される可能性がある。
そこで、効率良く読み出しを行うためには、ファイルの論理的な構成に適合したチャンクになるように、データ塊の再配置を行うと良い。
例えば、特許文献1には、複数のディスクストレージに格納されたデータを、予定されている処理に適したデータ配置になるように、事前にデータの再配置を行う方法が開示されている。
特開2008−225686号公報
Sanjay Ghemawat, Howard Gobioff, Shun-Tak Leung, "The Google File System", Proceedings of the 19th ACM Symposium on Operating Systems Principles, 2003, pp. 29-43. Peter J. Braam et al., "Lustre Technical Project Summary", Cluster File Systems, Inc. July 2001. D. Nagle, et al. "The Panasas ActiveScale Storage Cluster: Delivering Scalable High Bandwidth Storage", In Proceedings of SC2004, November 2004, Pittsburgh, Pennsylvania.
しかしながら、特許文献1に開示された方法では、チャンクについては考慮がされていない。そのため、データ塊の分断も、データ塊の再配置についても考慮がされていない。
そこで本発明は、上記問題点に鑑みてなされたもので、チャンクに分割されたファイルを効率良く読み出すことが可能な分散ファイルシステム及び分散ファイル格納方法を提供することを目的とする。
上記課題を解決するため、本発明における分散ファイルシステムは、メタサーバ装置と複数のストレージノードが接続されており、複数のデータ塊により構成されるチャンクを格納する分散ファイルシステムであって、前記複数のストレージノードそれぞれは、前記データ塊の再配置の依頼を受けたときに、前記データ塊が、どのようなデータであり、どの前記ストレージノードに格納されているかが記述されたインデックス情報が、どの前記ストレージノードに格納されているのかを前記メタサーバ装置に問い合わせるデータ再配置処理依頼受付部を有し、前記メタサーバ装置は、前記インデックス情報を格納している前記ストレージノードを記述したマッピング情報を格納するメタデータ格納部と、前記データ再配置処理依頼受付部により前記インデックス情報がどの前記ストレージノードに格納されているのかを問い合わされたときに、前記メタデータ格納部に格納された前記マッピング情報に基づき、前記インデックス情報を格納している前記ストレージノードを前記データ再配置処理依頼受付部に通知するメタデータ管理部と、を有し、前記複数のストレージノードそれぞれは、前記データ再配置処理依頼受付部が前記メタデータ管理部により前記インデックス情報を格納している前記ストレージノードを通知されたとき、前記データ再配置処理依頼受付部からの依頼により、前記インデックス情報が格納されている前記ストレージノードから前記インデックス情報を取得するコンテンツインデックス送受信部と、前記コンテンツインデックス送受信部により前記インデックス情報を取得したときに、前記データ再配置処理依頼受付部からの依頼により、前記インデックス情報に基づき、前記データ塊の配置位置の計算を行うデータ塊配置位置計算部と、前記データ塊配置位置計算部により前記データ塊の配置位置の計算されたときに、前記データ塊配置位置からの依頼により、前記データ塊配置位置計算部により計算された前記データ塊の配置位置に基づき、他の前記ストレージノードとの前記データ塊の交換をし、前記データ塊の再配置を行うデータ塊送受信部も有することを特徴とする。
また、本発明における分散ファイル格納方法は、複数のストレージノードそれぞれによる、前記データ塊の再配置の依頼を受けたときに、前記データ塊が、どのようなデータであり、どの前記ストレージノードに格納されているかが記述されたインデックス情報が、どの前記ストレージノードに格納されているのかを前記メタサーバに問い合わせるデータ再配置処理依頼受付ステップを有し、メタサーバ装置による、前記インデックス情報を格納している前記ストレージノードを記述したマッピング情報を格納するメタデータ格納ステップと、前記データ再配置処理依頼受付ステップにより前記インデックス情報がどの前記ストレージノードに格納されているのかを問い合わされたときに、前記メタデータ格納ステップに格納された前記マッピング情報に基づき、前記インデックス情報を格納している前記ストレージノードを前記データ再配置処理依頼受付ステップに通知するメタデータ管理ステップと、を有し、前記複数のストレージノードそれぞれよる、前記データ再配置処理依頼受付ステップが前記メタデータ管理ステップにより前記インデックス情報を格納している前記ストレージノードを通知されたとき、前記データ再配置処理依頼受付ステップからの依頼により、前記インデックス情報が格納されている前記ストレージノードから前記インデックス情報を取得するコンテンツインデックス送受信ステップと、前記コンテンツインデックス送受信ステップにより前記インデックス情報を取得したときに、前記データ再配置処理依頼受付ステップからの依頼により、前記インデックス情報に基づき、前記データ塊の配置位置の計算を行うデータ塊配置位置計算ステップと、前記データ塊配置位置計算ステップにより前記データ塊の配置位置の計算されたときに、前記データ塊配置位置からの依頼により、前記データ塊配置位置計算ステップにより計算された前記データ塊の配置位置に基づき、他の前記ストレージノードとの前記データ塊の交換をし、前記データ塊の再配置を行うデータ塊送受信ステップも有することを特徴とする。
本発明により、チャンクに分割されたファイルを効率良く読み出すことが可能になる。
チャンク分割型分散ファイルシステムの構成の一例を示す図である。 多視点映像を含んだファイルの一例を示す図である。 多視点映像を含んだファイルに対するアクセスの方法の一例を示す図である。 多視点映像を含んだファイルに対するチャンク分割の方法の一例を示す図である。 本発明の実施形態に係る分散ファイルシステムの構成の一例を示す図である。 本発明の実施形態に係る分散ファイルシステムにおける処理動作の一例を示す図である。 本発明の実施形態に係る分散ファイルシステムにおける処理動作の一例を示す図である。 本発明の実施形態に係る分散ファイルシステムにおける処理動作の一例を示す図である。 本発明の実施形態に係る分散ファイルシステムにおける再配置の方法の一例を示す図である。
次に、本発明を実施するための形態について図面を参照して詳細に説明する。
図5は、本発明の実施形態に係る分散ファイルシステムの構成の一例を示す図である。データの再配置を行うデータ再配置処理装置100と、ファイルを構成するチャンクを格納する複数のストレージノード200と、ファイルアクセスを行う複数のクライアント装置300と、ファイルの配置情報などのメタデータを保持するメタサーバ装置400とから構成される。
データ再配置処理装置100は、データ再配置処理依頼部102、未処理コンテンツ管理情報格納部101により構成される。未処理コンテンツ管理情報格納部101は。図3に示すように、情報103を保持する。
ストレージノード200は、データ再配置処理依頼受付部201、データ塊配置位置計算部202、データ塊送受信部203、チャンク管理部204、コンテンツインデックス送受信部205、チャンク格納部206により構成される。
クライアント装置300は、ファイルアクセス部301、メタデータアクセス部302、チャンクアクセス部302により構成される。メタサーバ装置400は、メタデータ管理部401、メタデータ格納部402により構成される。
ファイルの書き込みの際に、本発明の実施形態に係る分散ファイルシステムを構成する各装置において行われる処理動作の一例を、図5を参照しながら説明する。クライアント装置300のファイルアクセス部301は、ユーザプログラムなどからファイルの書き込みの要求を受け取る。クライアント装置300は、メタデータアクセス部302を用いて、メタサーバ装置400からファイルを格納するストレージノードのIDやチャンク識別子などからなるマッピング情報を取得し、そのマッピング情報に基づき、チャンクアクセス部303を通じてファイルをチャンクに分割し、ストレージノード200に格納することでファイルの書き込みを行う。クライアント装置300は、ファイルの書き込み完了後、メタサーバに書き込みが完了したことを通知する。
このとき、メタサーバ装置400のメタデータ管理部401は、クライアント300からのファイルの書き込み要求を受け取る。メタサーバ装置400は、書き込まれるファイルを格納する領域が確保済みの場合は、メタデータ管理部401により、書き込まれるファイルのオフセット、サイズなどに基づき、メタデータ格納部402から、このファイルを構成するチャンクの識別子やこのチャンクを保持しているストレージノードのIDなどのマッピング情報を取得し、クライアント装置300に送信する。メタサーバ装置400は、書き込まれるファイルを格納する領域が確保済みでない場合は、つまり、書き込みが既存データ領域の上書きではなく、新規ファイルや追記の場合は、所定のルールに基づき、ファイルを分割し格納するための格納領域を各ストレージノードに確保し、それぞれの格納領域に保持される予定のチャンクに識別子を割り当てる。そして、これらのチャンクの識別子と格納されるストレージノードのIDなどからなるマッピング情報をクライアント装置300に送信する。
メタサーバ装置400は、クライアント装置300からファイルの書き込みの完了の通知を受けると、メタデータ管理部401によりマッピング情報をメタデータ格納部402に記録されるとともに、データ再配置処理装置100の未処理コンテンツ管理情報格納部101にこのファイルのIDと、このファイルのインデックス情報200の格納位置を記録する。ここで、インデックス情報の位置の取得方法はいろいろ考えられる。例えば、(1)ユーザが何らかのインターフェースを通じてインデックスの位置を明示的に指定する方法や、(2)分散ストレージシステムが格納されるコンテンツのフォーマット情報に関する知識をあらかじめ保持しており、この知識に基づき、インデックスの位置を判断する方法や、(3)読み出しアクセス時のアクセスパターンからインデックス情報の位置を推論する方法などが考えられる。
ストレージノード200のチャンク管理部204は、クライアント装置300から送信されてくるチャンクをチャンク格納部206に格納し、格納の完了メッセージをクライアント300に送信する。
データ再配置の際に、本発明の実施形態に係る分散ファイルシステムを構成する各装置において行われる処理動作の一例を、図5を参照しながら説明する。データ再配置処理装置100は、データ再配置処理依頼部102により、定期的に未処理コンテンツ管理情報格納部からデータの再配置が完了していないファイルを取得し、ストレージノード200に対してデータの再配置を指示する。この際、データ再配置処理装置100は、再配置対象のファイルのIDと、このファイルのインデックス情報の位置をパラメータとして、ストレージノード200に送信する。ストレージノード200からデータの再配置の完了の通知を受け取ると、このファイルに関する情報を未処理コンテンツ管理情報格納部から取り除く。
ストレージノード200のデータ再配置処理依頼受付部201は、データ再配置処理装置100から取得したデータの再配置の対象であるファイルのIDとインデックス情報の位置情報に基づき、メタサーバ装置400を利用し、インデックス情報を保持するストレージノード200を検索する。各ストレージノード200のデータ再配置処理依頼受付部201は、コンテンツインデックス送受信部205を用いて、インデックス情報を保持しているストレージノード200から、このインデックス情報を取得する。次に、データ再配置処理依頼受付部201は、取得したインデックス情報に基づき、データ塊配置位置計算部202を用いて、データ塊の配置位置を計算する。その結果に基づき、データ再配置処理依頼受付部201は、データ塊送受信部204を用いて、データ塊の再配置を行う。再配置の完了後、データ再配置処理依頼受付部201は、メタサーバ装置400に新たなマッピング情報を送信し、データ再配置処理装置100に対してデータの再配置の完了の通知を送信する。
メタサーバ装置400のメタデータ管理部401は、ストレージノード200から送信されたマッピング情報をメタデータ格納402に格納する。
ファイルの読み出しの際に、本発明の実施形態に係る分散ファイルシステムを構成する各装置における処理動作の一例を、図5を参照しながら説明する。クライアント装置300のファイルアクセス部301はユーザプログラムなどからファイルの読み出しの要求を受け取り、メタデータアクセス部302を用いて、メタサーバ装置400より、このファイルを構成するチャンクの識別子やこのチャンクの格納されたストレージノードのIDなどのマッピング情報を取得し、このマッピング情報に基づき、チャンクアクセス部303を通じて、ストレージノード200からファイルを構成するチャンクを取得することでファイルの読み出しを行う。
メタサーバ400のメタデータ管理部401は、クライアント300からのファイルの読み出し要求を受け取り、読み出されるファイルのオフセット、サイズなどに基づき、メタデータ格納部402からファイルを構成するチャンクの識別子やこのチャンクを保持するストレージノードのIDなどからなるマップング情報を取得し、このマッピング情報をクライアント装置300に送信する。
ストレージノード200のチャンク管理部204は、クライアント装置300からのチャンクの要求に対し、チャンク格納部206から要求されたチャンクを取得し、クライアント装置300に送信する。
図6は、ファイルの書き込みの際に、本発明の実施形態に係る分散ファイルシステムにおいて行われる処理動作の一例を示す図である。まず、ファイルシステムインターフェースなどを通して、ユーザプログラムなどからファイルの書き込みの要求をクライアント装置300のファイルアクセス部301が受ける(S101)。ファイルアクセス部301は、メタデータアクセス部302に対し、このファイルのマッピング情報の問い合わせを依頼する(S102)。次に、メタデータアクセス部401は、メタサーバ装置400のメタデータ管理部401にマッピング情報の問い合わせを行う(S103)。次に、メタデータ管理部401は問い合わせを受けたマッピング情報をメタデータ格納部402より検索する(S104)。問い合わせを受けたマッピング情報が見つかった場合、メタデータ管理部401は、クライアント装置300のメタデータアクセス部301に対し、マッピング情報を応答する(S105)。新規のファイル作成、追記アクセスなどの場合は、書き込まれるファイルに対するマッピング情報はまだメタデータ格納部402には存在しない。このとき、所定のルールに基づき、ファイルを分割し格納するための格納領域を各ストレージノード200に確保し、それぞれの格納領域に保持される予定のチャンクに識別子を割り当てる。そして、これらのチャンクの識別子と格納されるストレージノード200のIDなどからなるマッピング情報をクライアントメタデータアクセス部302に対し応答する(S105)。マッピング情報は、ファイルの書き込み完了の通知を受け取った(S104)ときに、メタデータ格納部402に格納される。
ファイルアクセス部301は、ファイルのマッピング情報を取得(S106)し、チャンクアクセス部302にファイルの書き込みの依頼を行う(S107)。チャンクアクセス部301は、取得したマッピング情報に基づき、ファイルをチャンクに分割し(S108)、ストレージノード200のチャンク管理部204に対し、書き込み対象のファイル範囲を構成するチャンクをすべて格納するまでチャンクの書き込みを繰り返す(S109、S110、S111)。
ファイルアクセス部301は、ファイルの書き込み完了を通知されると(S112)、メタデータアクセス部302を通して、メタサーバ装置400のメタデータ管理部401にファイルの書き込み完了の通知を行う(S113、S114)。次に、メタデータ管理部401は、ステップS105において、チャンクなどの新規割り当てを行っている場合には、マッピング情報をメタデータ格納部402に記録するとともに、データ配置処理装置100の未処理コンテンツ管理情報格納部101に、この書き込まれたファイルのIDと、このファイルのインデックス情報の格納位置を記録する(S115、S117、S118)。最後に、ファイルアクセス部301は。ユーザプログラムなどにファイルの書き込み結果を通知する(S119)。
このようにすることにより、書き込みの際に、書き込み効率が悪くなるようなことがない。
図7は、データの再配置の際に、本発明の実施形態に係る分散ファイルシステムにおいて行われる処理動作の一例を示す図である。データ再配置処理装置100は、データ再配置が未完了であるファイルを取得すると(S201)、ストレージノード200のデータ再配置処理依頼受付部201に対し、データの再配置を指示する(S202)。次に、データ再配置処理依頼受付部201は、メタサーバ装置400のメタデータ管理部401に、再配置対象ファイルのインデックス情報を保持するストレージノード200を問い合わせる(S203)。メタデータ管理部401は、メタデータ格納部402から、問い合わされたインデックス情報を持つストレージノードを検索し(S204)、データ再配置処理依頼受付部201に応答する(S205)。インデックス情報を保持するストレージノードの情報を得たデータ再配置処理依頼受付部201は、コンテンツインデックス送受信部205に、このインデックス情報の取得を依頼する(S206)。コンテンツインデックス送受信部205は、このインデックス情報を保持しているストレージノードのコンテンツインデックス送受信部205からインデックス情報を取得する(S207、S208)。例えば、図5の点線が示すように、インデックス情報を保持しているストレージノードのコンテンツインデックス送受信部から、他のストレージノードのコンテンツインデックス送受信部に、インデックス情報が送信される。
次に、インデックス情報を取得したデータ再配置処理依頼受付部201は、データ塊配置位置計算部202にデータの再配置の依頼を行う(S209)。データ塊配置位置計算部209は、インデックス情報に基づき、データ塊の配置位置の計算を行い(S110)、データ塊送受信部203を利用し、他のストレージノードとデータ塊の交換を行う(S211、S212、S213)。例えば、図5の鎖線が示すように、各ストレージノードのデータ塊送受信部の間でデータ塊を送受信することにより、データ塊の交換を行う。
データ再配置処理依頼受付部201は、データの再配置の完了(S114)後、メタサーバ装置400のメタデータ管理部401を用いて、再配置の結果に基づき、マッピング情報の更新を行う(S115、S116、S117、(S118))。最後に、データ再配置処理装置100は、この再配置が行われたファイルに関する情報を未処理コンテンツ管理情報格納部から取り除く(S119)。この再配置の処理動作は、ファイルの書き込みの後に、適当なタイミングで行われるようにすると良い。
図8は、ファイルの読み出しの際に、本発明の実施形態に係る分散ファイルシステムにおいて行われる処理動作の一例を示す図である。まず、ファイルシステムインターフェースなどを通して、ユーザプログラムなどからファイルの読み出しの要求をファイルアクセス部301が受ける(S301)。ファイルアクセス部301は、メタデータアクセス部302に対し、読み出し要求を受けたファイルのマッピング情報の問い合わせを依頼する(S302)。次に、メタデータアクセス部302は、メタサーバ装置400のメタデータ管理部401にマッピング情報の問い合わせを行う(S303)。次に、メタデータ管理部401は、問い合わせを受けたマッピング情報をメタデータ格納部401より検索し(S304)、問い合わせを受けたマッピング情報が見つかった際に、メタデータアクセス部302に対しマッピング情報を応答する(S305)。
ファイルアクセス部301は、読み出し要求を受けたファイルのマッピング情報を取得し(S306)、チャンクアクセス部303にファイルの読み出しの依頼を行う(S307)。チャンクアクセス部303は、取得したマッピング情報に基づき、ファイルをチャンクに分割し(S308)、ストレージノード200のチャンク管理部204に対して、読み出し対象のファイル範囲を構成するチャンクをすべて取得するまでストレージノード200からのチャンクの読み出しを繰り返す(S309、S310、S311、(S312))。最後に、ファイルアクセス部301は、ユーザプログラムなどにファイルの読み出し結果を通知する(S313)。
図9は、本発明の実施形態に係る分散ファイルシステムにおいて使用されるデータ塊配置位置計算の方針の一例を示す図である。例えば、図2に示した多視点映像コンテンツの場合、図7に示すように、コンテンツのインデックス情報に基づき、視点ごとのデータ塊がインターリーブする形でチャンク内に格納されている。これを、視点ごとにチャンク内にまとめる。また、さらに、同時にアクセスされる可能性のあるチャンク(時刻の同じもの)が同一ストレージノードに格納されないように配置計算を行う。こうすることでさらにアクセス速度が上がる。具体的な計算方法に関しては、ターゲットアプリケーションやファイルやコンテンツごとに別途定める必要があり、いろいろと方法は考えられる。このようにすることにより、ファイルの論理的な構成に基づいて、再配置することができる。そして、このように再配置することにより、ファイルの読み出しの際に、シーケンシャルなアクセスにより読み出しを行うことができるようになる。
また、このようにすることにより、ファイルの読み出しの際に、不連続なアクセスが減り、ファイルの先読み機能を効率的に機能させることができるようになる。また、バッファリングの機能を利用することができるようになる。
また、このように再配置しておくことで、不要なストレージノードへのアクセスを抑制することができ、システム全体でのレスポンスを上げることができる。
また、チャンクに分割するときに、データ塊が分断されることがなくなるように、再配置を行えば、データ塊の分断を防げる。
また、ファイルのデータ塊群のうち、同時にアクセスする可能性のあるもの(例えば、上述した、視聴領域に含まれる複数の視点映像)を別々のストレージノードに配置することで、ファイルの読み出しの効率を上げることができる。
本発明は、複数のクライアント装置、複数のストレージノードから構成される分散ファイルシステムにおいて、ファイルの構成を考慮にいれたデータ配置をする用途に適用できる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範囲な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更が可能である。
また、本発明における分散ファイルシステムは、前記ストレージノードそれぞれの前記データ再配置処理依頼受付部は、前記データ塊送受信部による前記データ塊の再配置が完了した通知を前記データ塊配置位置計算部から受けたときに、前記メタサーバ装置の前記メタデータ管理部に前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を依頼し、前記メタサーバ装置のメタデータ部は、前記データ再配置処理依頼受付部に依頼により、前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を行うようにしても良い。
また、本発明における分散ファイルシステムは、データ再配置処理装置も接続されており、前記データ再配置処理装置は、前記データ塊の再配置が行われていないファイルについての情報を格納する未処理コンテンツ管理情報格納部と、前記未処理コンテンツ管理情報格納部から、前記データ塊の再配置のおこなわれていない前記ファイルの情報を取得したときに、前記データ塊の再配置のおこなわれていない前記ファイルに対する前記データ塊の再配置を前記ストレージノードそれぞれの前記データ再配置処理依頼受付部に依頼するデータ再配置処理依頼部と、を有し、前記ストレージノードそれぞれの前記データ再配置処理依頼受付部は、前記データ塊送受信部による前記データ塊の再配置が完了した通知を前記データ塊配置位置計算部から受けたときに、前記データ配置処理装置の前記データ配置処理依頼部に前記データ塊の再配置が完了の通知し、前記データ再配置処理装置の前記データ再配置依頼部は、前記データ再配置処理依頼受付部から前記データ塊の再配置の完了の通知を受けたときに、前記未処理コンテンツ管理情報格納部から前記データ塊の再配置の完了した前記ファイルについての情報を削除するようにしても良い。
また、本発明における分散ファイルシステムは、クライアント装置も接続されており、前記マップング情報は、前記ファイルを構成する前記チャンクの識別情報と、前記各チャンクが、どの前記ストレージノードに格納されているのか、どれくらいのサイズであるのかも記述されており、前記クライアント装置は、前記ファイルの書き込みの依頼を受けるファイルアクセス部と 前記ファイルアクセス部が前記ファイルの書き込みの依頼を受けたときに、前記ファイルアクセス部からの依頼により、前記メタサーバ装置の前記メタデータ部に前記マッピングデータ情報を問い合わせるメタデータアクセス部と、を有し、前記メタサーバ装置の前記メタデータ管理部は、前記メタデータアクセス部により前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納部に格納された前記マッピング情報を前記クライアント装置に通知し、前記クライアント装置は、前記メタデータ管理部により前記マッピング情報が通知されたときに、前記ファイルアクセス部からの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの書き込みを依頼するチャンクアクセス部も有し、前記ストレージノードそれぞれは、前記チャンクの格納されたチャンク格納部と、前記チャンクアクセス部から前記チャンクの書き込みの依頼を受けたときに、前記チャンクを前記格納部に格納するチャンク管理部も有し、前記ストレージノードそれぞれの前記チャンク管理部は、前記チャンクの書き込みを完了したときに、前記クライアント装置の前記ファイルアクセス部に前記チャンクの書き込みの完了を通知し、前記クライアント装置の前記ファイルアクセス部は、前記チャンク管理部から前記チャンクの書き込みの完了の通知を受けたときに、前記メタデータアクセス部に前記チャンクの書き込みの完了を通知し、前記クライアント装置の前記メタデータアクセス部は、前記ファイルアクセス部から前記チャンクの書き込みの完了の通知を受けたときに、前記メタサーバ装置の前記メタデータ部に前記チャンクの書き込みの完了を通知し、前記メタサーバ装置の前記メタデータ部は、前記メタデータアクセス部から前記チャンクの書き込みの完了の通知を受けたときに、前記チャンクの書き込みの完了した前記ファイルを前記データ塊の再配置の完了していないファイルとして前記未処理コンテンツ管理情報格納部に登録するようにしても良い。
また、本発明における分散ファイルシステムは、前記クライアント装置の前記ファイルアクセス部は、前記ファイルの読み出しの依頼も受け、前記クライアント装置の前記メタデータアクセス部は、前記ファイルの読み出しの依頼を受けたときに、前記ファイルアクセス部からの依頼により、前記メタサーバ装置の前記メタデータ部に前記マッピングデータ情報を問い合わせ、前記メタサーバ装置の前記メタデータ管理部は、前記メタデータアクセス部により前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納部に格納された前記マッピング情報を前記クライアント装置に通知し、前記クライアント装置の前記チャンクアクセス部は、前記メタデータ管理部により前記マッピング情報が通知されたときに、前記ファイルアクセス部からの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの読み出しを依頼し、前記ストレージノードそれぞれの前記チャンク管理部は、前記チャンクアクセス部から前記チャンクの読み出しの依頼を受けたときに、前記チャンクを前記格納部から読み出すようにしても良い。
また、本発明における分散ファイル格納方法は、前記ストレージノードそれぞれによる前記データ再配置処理依頼受付ステップにより、前記データ塊送受信ステップによる前記データ塊の再配置が完了した通知を前記データ塊配置位置計算ステップから受けたときに、前記メタサーバ装置の前記メタデータ管理ステップに前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を依頼し、前記メタサーバ装置によるメタデータステップは、前記データ再配置処理依頼受付ステップに依頼により、前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を行うようにしても良い。
また、本発明における分散ファイル格納方法は、データ再配置処理装置による、前記データ塊の再配置が行われていないファイルについての情報を格納する未処理コンテンツ管理情報格納ステップと、前記未処理コンテンツ管理情報格納ステップから、前記データ塊の再配置のおこなわれていない前記ファイルの情報を取得したときに、前記データ塊の再配置のおこなわれていない前記ファイルに対する前記データ塊の再配置を前記ストレージノードそれぞれの前記データ再配置処理依頼受付ステップに依頼するデータ再配置処理依頼ステップと、を有し、前記ストレージノードそれぞれによる前記データ再配置処理依頼受付ステップにより、前記データ塊送受信ステップによる前記データ塊の再配置が完了した通知を前記データ塊配置位置計算ステップから受けたときに、前記データ配置処理装置の前記データ配置処理依頼ステップに前記データ塊の再配置が完了の通知し、前記データ再配置処理装置による前記データ再配置依頼ステップにより、前記データ再配置処理依頼受付ステップから前記データ塊の再配置の完了の通知を受けたときに、前記未処理コンテンツ管理情報格納ステップから前記データ塊の再配置の完了した前記ファイルについての情報を削除するようにしても良い。
また、本発明における分散ファイル格納方法は、前記マップング情報は、前記ファイルを構成する前記チャンクの識別情報と、前記各チャンクが、どの前記ストレージノードに格納されているのか、どれくらいのサイズであるのかも記述されており、クライアント装置による、前記ファイルの書き込みの依頼を受けるファイルアクセスステップと、前記ファイルアクセスステップが前記ファイルの書き込みの依頼を受けたときに、前記ファイルアクセスステップからの依頼により、前記メタサーバ装置による前記メタデータステップに前記マッピングデータ情報を問い合わせるメタデータアクセスステップと、を有し、前記メタサーバ装置による前記メタデータ管理ステップにより、前記メタデータアクセスステップにより前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納ステップに格納された前記マッピング情報を前記クライアント装置に通知し、前記クライアント装置による、前記メタデータ管理ステップにより前記マッピング情報が通知されたときに、前記ファイルアクセスステップからの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの書き込みを依頼するチャンクアクセスステップも有し、前記ストレージノードそれぞれによる、前記チャンクの格納されたチャンク格納ステップと、前記チャンクアクセスステップから前記チャンクの書き込みの依頼を受けたときに、前記チャンクを前記格納ステップに格納するチャンク管理ステップも有し、前記ストレージノードそれぞれによる前記チャンク管理ステップにより、前記チャンクの書き込みを完了したときに、前記クライアント装置による前記ファイルアクセスステップに前記チャンクの書き込みの完了を通知し、前記クライアント装置による前記ファイルアクセスステップにより、前記チャンク管理ステップから前記チャンクの書き込みの完了の通知を受けたときに、前記メタデータアクセスステップに前記チャンクの書き込みの完了を通知し、前記クライアント装置による前記メタデータアクセスステップにより、前記ファイルアクセスステップから前記チャンクの書き込みの完了の通知を受けたときに、前記メタサーバ装置による前記メタデータステップに前記チャンクの書き込みの完了を通知し、前記メタサーバ装置による前記メタデータステップは、前記メタデータアクセスステップから前記チャンクの書き込みの完了の通知を受けたときに、前記チャンクの書き込みの完了した前記ファイルを前記データ塊の再配置の完了していないファイルとして前記未処理コンテンツ管理情報格納ステップに登録するようにしても良い。
また、本発明における分散ファイル格納方法は、前記クライアント装置による前記ファイルアクセスステップにより、前記ファイルの読み出しの依頼も受け、前記クライアント装置による前記メタデータアクセスステップは、前記ファイルの読み出しの依頼を受けたときに、前記ファイルアクセスステップからの依頼により、前記メタサーバ装置による前記メタデータステップに前記マッピングデータ情報を問い合わせ、前記メタサーバ装置による前記メタデータ管理ステップは、前記メタデータアクセスステップにより前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納ステップに格納された前記マッピング情報を前記クライアント装置に通知し、前記クライアント装置の前記チャンクアクセスステップは、前記メタデータ管理ステップにより前記マッピング情報が通知されたときに、前記ファイルアクセスステップからの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの読み出しを依頼し、前記ストレージノードそれぞれによる前記チャンク管理ステップは、前記チャンクアクセスステップから前記チャンクの読み出しの依頼を受けたときに、前記チャンクを前記格納ステップから読み出すようにしても良い。
100 データ再配置処理装置
101 データ再配置処理依頼部
102 未処理コンテンツ管理情報格納部
200 ストレージノード
201 データ再配置処理依頼受付部
202 データ塊配置位置計算部
203 データ塊送受信部
204 チャンク管理部
205 コンテンツインデックス送受信部
206 チャンク格納部
300 クライアント装置
301 ファイルアクセス部
302 メタデータアクセス部
303 チャンクアクセス部
400 メタサーバ部
401 メタデータ管理部
402 メタデータ格納部

Claims (10)

  1. メタサーバ装置と複数のストレージノードが接続されており、複数のデータ塊により構成されるチャンクを格納する分散ファイルシステムであって、
    前記複数のストレージノードそれぞれは、前記データ塊の再配置の依頼を受けたときに、前記データ塊が、どのようなデータであり、どの前記ストレージノードに格納されているかが記述されたインデックス情報が、どの前記ストレージノードに格納されているのかを前記メタサーバ装置に問い合わせるデータ再配置処理依頼受付部を有し、
    前記メタサーバ装置は、前記インデックス情報を格納している前記ストレージノードを記述したマッピング情報を格納するメタデータ格納部と、
    前記データ再配置処理依頼受付部により前記インデックス情報がどの前記ストレージノードに格納されているのかを問い合わされたときに、前記メタデータ格納部に格納された前記マッピング情報に基づき、前記インデックス情報を格納している前記ストレージノードを前記データ再配置処理依頼受付部に通知するメタデータ管理部と、を有し、
    前記複数のストレージノードそれぞれは、前記データ再配置処理依頼受付部が前記メタデータ管理部により前記インデックス情報を格納している前記ストレージノードを通知されたとき、前記データ再配置処理依頼受付部からの依頼により、前記インデックス情報が格納されている前記ストレージノードから前記インデックス情報を取得するコンテンツインデックス送受信部と、
    前記コンテンツインデックス送受信部により前記インデックス情報を取得したときに、前記データ再配置処理依頼受付部からの依頼により、前記インデックス情報に基づき、前記データ塊の配置位置の計算を行うデータ塊配置位置計算部と、
    前記データ塊配置位置計算部により前記データ塊の配置位置の計算されたときに、前記データ塊配置位置からの依頼により、前記データ塊配置位置計算部により計算された前記データ塊の配置位置に基づき、他の前記ストレージノードと前記データ塊の交換をし、前記データ塊の再配置を行うデータ塊送受信部も有することを特徴とする分散ファイルシステム。
  2. 前記ストレージノードそれぞれの前記データ再配置処理依頼受付部は、前記データ塊送受信部による前記データ塊の再配置が完了した通知を前記データ塊配置位置計算部から受けたときに、前記メタサーバ装置の前記メタデータ管理部に前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を依頼し、
    前記メタサーバ装置のメタデータ部は、前記データ再配置処理依頼受付部に依頼により、前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を行うことを特徴とする請求項1に記載の分散ファイルシステム。
  3. データ再配置処理装置も接続されており、
    前記データ再配置処理装置は、前記データ塊の再配置が行われていないファイルについての情報を格納する未処理コンテンツ管理情報格納部と、
    前記未処理コンテンツ管理情報格納部から、前記データ塊の再配置のおこなわれていない前記ファイルの情報を取得したときに、前記データ塊の再配置のおこなわれていない前記ファイルに対する前記データ塊の再配置を前記ストレージノードそれぞれの前記データ再配置処理依頼受付部に依頼するデータ再配置処理依頼部と、を有し、
    前記ストレージノードそれぞれの前記データ再配置処理依頼受付部は、前記データ塊送受信部による前記データ塊の再配置が完了した通知を前記データ塊配置位置計算部から受けたときに、前記データ配置処理装置の前記データ配置処理依頼部に前記データ塊の再配置が完了の通知し、
    前記データ再配置処理装置の前記データ再配置依頼部は、前記データ再配置処理依頼受付部から前記データ塊の再配置の完了の通知を受けたときに、前記未処理コンテンツ管理情報格納部から前記データ塊の再配置の完了した前記ファイルについての情報を削除することを特徴とする請求項1または2に記載の分散ファイルシステム。
  4. クライアント装置も接続されており、
    前記マップング情報は、前記ファイルを構成する前記チャンクの識別情報と、前記各チャンクが、どの前記ストレージノードに格納されているのか、どれくらいのサイズであるのかも記述されており、
    前記クライアント装置は、前記ファイルの書き込みの依頼を受けるファイルアクセス部と、
    前記ファイルアクセス部が前記ファイルの書き込みの依頼を受けたときに、前記ファイルアクセス部からの依頼により、前記メタサーバ装置の前記メタデータ部に前記マッピングデータ情報を問い合わせるメタデータアクセス部と、を有し、
    前記メタサーバ装置の前記メタデータ管理部は、前記メタデータアクセス部により前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納部に格納された前記マッピング情報を前記クライアント装置に通知し、
    前記クライアント装置は、前記メタデータ管理部により前記マッピング情報が通知されたときに、前記ファイルアクセス部からの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの書き込みを依頼するチャンクアクセス部も有し、
    前記ストレージノードそれぞれは、前記チャンクの格納されたチャンク格納部と、
    前記チャンクアクセス部から前記チャンクの書き込みの依頼を受けたときに、前記チャンクを前記格納部に格納するチャンク管理部も有し、
    前記ストレージノードそれぞれの前記チャンク管理部は、前記チャンクの書き込みを完了したときに、前記クライアント装置の前記ファイルアクセス部に前記チャンクの書き込みの完了を通知し、
    前記クライアント装置の前記ファイルアクセス部は、前記チャンク管理部から前記チャンクの書き込みの完了の通知を受けたときに、前記メタデータアクセス部に前記チャンクの書き込みの完了を通知し、
    前記クライアント装置の前記メタデータアクセス部は、前記ファイルアクセス部から前記チャンクの書き込みの完了の通知を受けたときに、前記メタサーバ装置の前記メタデータ部に前記チャンクの書き込みの完了を通知し、
    前記メタサーバ装置の前記メタデータ部は、前記メタデータアクセス部から前記チャンクの書き込みの完了の通知を受けたときに、前記チャンクの書き込みの完了した前記ファイルを前記データ塊の再配置の完了していないファイルとして前記未処理コンテンツ管理情報格納部に登録することを特徴とする請求項1から3のいずれか1項に記載の分散ファイルシステム。
  5. 前記クライアント装置の前記ファイルアクセス部は、前記ファイルの読み出しの依頼も受け、
    前記クライアント装置の前記メタデータアクセス部は、前記ファイルの読み出しの依頼を受けたときに、前記ファイルアクセス部からの依頼により、前記メタサーバ装置の前記メタデータ部に前記マッピングデータ情報を問い合わせ、
    前記メタサーバ装置の前記メタデータ管理部は、前記メタデータアクセス部により前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納部に格納された前記マッピング情報を前記クライアント装置に通知し、
    前記クライアント装置の前記チャンクアクセス部は、前記メタデータ管理部により前記マッピング情報が通知されたときに、前記ファイルアクセス部からの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの読み出しを依頼し、
    前記ストレージノードそれぞれの前記チャンク管理部は、前記チャンクアクセス部から前記チャンクの読み出しの依頼を受けたときに、前記チャンクを前記格納部から読み出すことを特徴とする請求項1から4のいずれか1項に記載の分散ファイルシステム。
  6. 複数のストレージノードそれぞれによる、前記データ塊の再配置の依頼を受けたときに、前記データ塊が、どのようなデータであり、どの前記ストレージノードに格納されているかが記述されたインデックス情報が、どの前記ストレージノードに格納されているのかを前記メタサーバ装置に問い合わせるデータ再配置処理依頼受付ステップを有し、
    メタサーバ装置による、前記インデックス情報を格納している前記ストレージノードを記述したマッピング情報を格納するメタデータ格納ステップと、
    前記データ再配置処理依頼受付ステップにより前記インデックス情報がどの前記ストレージノードに格納されているのかを問い合わされたときに、前記メタデータ格納ステップに格納された前記マッピング情報に基づき、前記インデックス情報を格納している前記ストレージノードを前記データ再配置処理依頼受付ステップに通知するメタデータ管理ステップと、を有し、
    前記複数のストレージノードそれぞれよる、前記データ再配置処理依頼受付ステップが前記メタデータ管理ステップにより前記インデックス情報を格納している前記ストレージノードを通知されたとき、前記データ再配置処理依頼受付ステップからの依頼により、前記インデックス情報が格納されている前記ストレージノードから前記インデックス情報を取得するコンテンツインデックス送受信ステップと、
    前記コンテンツインデックス送受信ステップにより前記インデックス情報を取得したときに、前記データ再配置処理依頼受付ステップからの依頼により、前記インデックス情報に基づき、前記データ塊の配置位置の計算を行うデータ塊配置位置計算ステップと、
    前記データ塊配置位置計算ステップにより前記データ塊の配置位置の計算されたときに、前記データ塊配置位置からの依頼により、前記データ塊配置位置計算ステップにより計算された前記データ塊の配置位置に基づき、他の前記ストレージノードと前記データ塊の交換をし、前記データ塊の再配置を行うデータ塊送受信ステップも有することを特徴とする分散ファイル格納方法。
  7. 前記ストレージノードそれぞれによる前記データ再配置処理依頼受付ステップにより、前記データ塊送受信ステップによる前記データ塊の再配置が完了した通知を前記データ塊配置位置計算ステップから受けたときに、前記メタサーバ装置の前記メタデータ管理ステップに前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を依頼し、
    前記メタサーバ装置によるメタデータステップは、前記データ再配置処理依頼受付ステップに依頼により、前記データ塊の再配置の結果に基づき、前記マッピング情報の更新を行うことを特徴とする請求項6に記載の分散ファイル格納方法。
  8. データ再配置処理装置による、前記データ塊の再配置が行われていないファイルについての情報を格納する未処理コンテンツ管理情報格納ステップと、
    前記未処理コンテンツ管理情報格納ステップから、前記データ塊の再配置のおこなわれていない前記ファイルの情報を取得したときに、前記データ塊の再配置のおこなわれていない前記ファイルに対する前記データ塊の再配置を前記ストレージノードそれぞれの前記データ再配置処理依頼受付ステップに依頼するデータ再配置処理依頼ステップと、を有し、
    前記ストレージノードそれぞれによる前記データ再配置処理依頼受付ステップにより、前記データ塊送受信ステップによる前記データ塊の再配置が完了した通知を前記データ塊配置位置計算ステップから受けたときに、前記データ配置処理装置の前記データ配置処理依頼ステップに前記データ塊の再配置が完了の通知し、
    前記データ再配置処理装置による前記データ再配置依頼ステップにより、前記データ再配置処理依頼受付ステップから前記データ塊の再配置の完了の通知を受けたときに、前記未処理コンテンツ管理情報格納ステップから前記データ塊の再配置の完了した前記ファイルについての情報を削除することを特徴とする請求項6または7に記載の分散ファイル格納方法。
  9. 前記マップング情報は、前記ファイルを構成する前記チャンクの識別情報と、前記各チャンクが、どの前記ストレージノードに格納されているのか、どれくらいのサイズであるのかも記述されており、
    クライアント装置による、前記ファイルの書き込みの依頼を受けるファイルアクセスステップと、
    前記ファイルアクセスステップが前記ファイルの書き込みの依頼を受けたときに、前記ファイルアクセスステップからの依頼により、前記メタサーバ装置による前記メタデータステップに前記マッピングデータ情報を問い合わせるメタデータアクセスステップと、を有し、
    前記メタサーバ装置による前記メタデータ管理ステップにより、前記メタデータアクセスステップにより前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納ステップに格納された前記マッピング情報を前記クライアント装置に通知し、
    前記クライアント装置による、前記メタデータ管理ステップにより前記マッピング情報が通知されたときに、前記ファイルアクセスステップからの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの書き込みを依頼するチャンクアクセスステップも有し、
    前記ストレージノードそれぞれによる、前記チャンクの格納されたチャンク格納ステップと、
    前記チャンクアクセスステップから前記チャンクの書き込みの依頼を受けたときに、前記チャンクを前記格納ステップに格納するチャンク管理ステップも有し、
    前記ストレージノードそれぞれによる前記チャンク管理ステップにより、前記チャンクの書き込みを完了したときに、前記クライアント装置による前記ファイルアクセスステップに前記チャンクの書き込みの完了を通知し、
    前記クライアント装置による前記ファイルアクセスステップにより、前記チャンク管理ステップから前記チャンクの書き込みの完了の通知を受けたときに、前記メタデータアクセスステップに前記チャンクの書き込みの完了を通知し、
    前記クライアント装置による前記メタデータアクセスステップにより、前記ファイルアクセスステップから前記チャンクの書き込みの完了の通知を受けたときに、前記メタサーバ装置による前記メタデータステップに前記チャンクの書き込みの完了を通知し、
    前記メタサーバ装置による前記メタデータステップは、前記メタデータアクセスステップから前記チャンクの書き込みの完了の通知を受けたときに、前記チャンクの書き込みの完了した前記ファイルを前記データ塊の再配置の完了していないファイルとして前記未処理コンテンツ管理情報格納ステップに登録することを特徴とする請求項6から8のいずれか1項に記載の分散ファイル格納方法。
  10. 前記クライアント装置による前記ファイルアクセスステップにより、前記ファイルの読み出しの依頼も受け、
    前記クライアント装置による前記メタデータアクセスステップは、前記ファイルの読み出しの依頼を受けたときに、前記ファイルアクセスステップからの依頼により、前記メタサーバ装置による前記メタデータステップに前記マッピングデータ情報を問い合わせ、
    前記メタサーバ装置による前記メタデータ管理ステップは、前記メタデータアクセスステップにより前記マッピング情報の問い合わせを受けたときに、前記メタデータ格納ステップに格納された前記マッピング情報を前記クライアント装置に通知し、
    前記クライアント装置の前記チャンクアクセスステップは、前記メタデータ管理ステップにより前記マッピング情報が通知されたときに、前記ファイルアクセスステップからの依頼により、前記マッピング情報に基づき、前記ファイルを前記チャンクに分割し、前記各ストレージノードに前記チャンクの読み出しを依頼し、
    前記ストレージノードそれぞれによる前記チャンク管理ステップは、前記チャンクアクセスステップから前記チャンクの読み出しの依頼を受けたときに、前記チャンクを前記格納ステップから読み出すことを特徴とする請求項6から9のいずれか1項に記載の分散ファイル格納方法。
JP2009086334A 2009-03-31 2009-03-31 分散ファイルシステム及び分散ファイル格納方法 Active JP5470974B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009086334A JP5470974B2 (ja) 2009-03-31 2009-03-31 分散ファイルシステム及び分散ファイル格納方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009086334A JP5470974B2 (ja) 2009-03-31 2009-03-31 分散ファイルシステム及び分散ファイル格納方法

Publications (2)

Publication Number Publication Date
JP2010238038A true JP2010238038A (ja) 2010-10-21
JP5470974B2 JP5470974B2 (ja) 2014-04-16

Family

ID=43092285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009086334A Active JP5470974B2 (ja) 2009-03-31 2009-03-31 分散ファイルシステム及び分散ファイル格納方法

Country Status (1)

Country Link
JP (1) JP5470974B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101341441B1 (ko) * 2011-11-04 2013-12-13 방한민 멀티미디어 콘텐츠 분할 및 분산 방법
JP2015069215A (ja) * 2013-09-26 2015-04-13 富士通株式会社 情報処理装置,情報処理システム,制御プログラム及び制御方法
WO2016054498A1 (en) * 2014-10-03 2016-04-07 Zettaset, Inc. Securing a distributed file system
US9891992B2 (en) 2013-03-21 2018-02-13 Nec Corporation Information processing apparatus, information processing method, storage system and non-transitory computer readable storage media
CN110647562A (zh) * 2019-09-29 2020-01-03 中国联合网络通信集团有限公司 一种数据查询方法和装置、电子设备、存储介质
JP2021039575A (ja) * 2019-09-04 2021-03-11 富士通株式会社 ストレージ制御装置,分散ストレージシステムおよびストレージ制御プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148634A (ja) * 1998-11-10 2000-05-30 Victor Co Of Japan Ltd 動画像サーバシステム
JP2004102450A (ja) * 2002-09-05 2004-04-02 Toshiba Corp サーバ装置、車載用電子機器、及びコンテンツ処理方法
JP2008225686A (ja) * 2007-03-09 2008-09-25 Nec Corp 分散型データ処理プラットフォームにおけるデータ配置管理装置と方法、システム及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148634A (ja) * 1998-11-10 2000-05-30 Victor Co Of Japan Ltd 動画像サーバシステム
JP2004102450A (ja) * 2002-09-05 2004-04-02 Toshiba Corp サーバ装置、車載用電子機器、及びコンテンツ処理方法
JP2008225686A (ja) * 2007-03-09 2008-09-25 Nec Corp 分散型データ処理プラットフォームにおけるデータ配置管理装置と方法、システム及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一圓 真澄: "大規模配信向けクラスタストレージへのチャンク分割分散格納手法の実装と評価", 電子情報通信学会技術研究報告 VOL.108 NO.180, vol. 第108巻,第180号, JPN6013028136, 29 July 2008 (2008-07-29), JP, pages 37 - 42, ISSN: 0002716746 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101341441B1 (ko) * 2011-11-04 2013-12-13 방한민 멀티미디어 콘텐츠 분할 및 분산 방법
US9891992B2 (en) 2013-03-21 2018-02-13 Nec Corporation Information processing apparatus, information processing method, storage system and non-transitory computer readable storage media
JP2015069215A (ja) * 2013-09-26 2015-04-13 富士通株式会社 情報処理装置,情報処理システム,制御プログラム及び制御方法
WO2016054498A1 (en) * 2014-10-03 2016-04-07 Zettaset, Inc. Securing a distributed file system
JP2021039575A (ja) * 2019-09-04 2021-03-11 富士通株式会社 ストレージ制御装置,分散ストレージシステムおよびストレージ制御プログラム
JP7310462B2 (ja) 2019-09-04 2023-07-19 富士通株式会社 ストレージ制御装置,分散ストレージシステムおよびストレージ制御プログラム
CN110647562A (zh) * 2019-09-29 2020-01-03 中国联合网络通信集团有限公司 一种数据查询方法和装置、电子设备、存储介质
CN110647562B (zh) * 2019-09-29 2022-04-26 中国联合网络通信集团有限公司 一种数据查询方法和装置、电子设备、存储介质

Also Published As

Publication number Publication date
JP5470974B2 (ja) 2014-04-16

Similar Documents

Publication Publication Date Title
JP5470974B2 (ja) 分散ファイルシステム及び分散ファイル格納方法
ES2586907T3 (es) Procedimiento de extracción previa de datos, nodo y sistema para sistema de memoria de tabla hash distribuida (DHT)
CN105933376B (zh) 一种数据操作方法,服务器及存储系统
JP4265245B2 (ja) 計算機システム
JP2020038623A (ja) データを記憶するための方法、装置及びシステム
CN107888657A (zh) 低延迟分布式存储系统
US20050172080A1 (en) Cache device, cache data management method, and computer program
CN107179878B (zh) 基于应用优化的数据存储的方法和装置
US20150356125A1 (en) Method for data placement based on a file level operation
RU2595764C2 (ru) Способ и устройство обработки сообщений
CN106502806B (zh) 一种总线协议命令处理装置及相关方法
JP2008204206A (ja) データ分散格納システム及びデータ分散方法、それに用いる装置並びにそのプログラム
CN102541990A (zh) 利用虚拟分区的数据库重新分布方法和系统
CN102307234A (zh) 基于移动终端的资源检索方法
US8447825B2 (en) File sharing system and file sharing method
CN105635196A (zh) 一种获取文件数据的方法、系统和应用服务器
CN109120885B (zh) 视频数据获取方法及装置
KR100977159B1 (ko) 데이터 서버 주소의 변경과 디스크 이동에 투명한 파일메타데이터 관리 방법 및 시스템
US20180107404A1 (en) Garbage collection system and process
CN105320676A (zh) 一种客户数据查询服务方法及装置
US10311026B2 (en) Compressed data layout for optimizing data transactions
WO2016090985A1 (zh) 缓存的读取、读取处理方法及装置
JP2011048679A (ja) ストレージシステム、管理方法及びプログラム
WO2009088007A1 (ja) コンテンツ管理装置、コンテンツ管理システム、コンテンツ管理方法およびプログラム
JP2009259265A (ja) 分散ファイル管理システム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20110920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140120

R150 Certificate of patent or registration of utility model

Ref document number: 5470974

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150