JP5966404B2 - 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム - Google Patents

分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム Download PDF

Info

Publication number
JP5966404B2
JP5966404B2 JP2012029403A JP2012029403A JP5966404B2 JP 5966404 B2 JP5966404 B2 JP 5966404B2 JP 2012029403 A JP2012029403 A JP 2012029403A JP 2012029403 A JP2012029403 A JP 2012029403A JP 5966404 B2 JP5966404 B2 JP 5966404B2
Authority
JP
Japan
Prior art keywords
file
metadata
data file
access
metadata file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012029403A
Other languages
English (en)
Other versions
JP2013167942A (ja
Inventor
将史 生田
将史 生田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012029403A priority Critical patent/JP5966404B2/ja
Publication of JP2013167942A publication Critical patent/JP2013167942A/ja
Application granted granted Critical
Publication of JP5966404B2 publication Critical patent/JP5966404B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願発明は、分散ファイルシステムを持つコンピュータシステムで、ファイルへのアクセス性能を向上させるための分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラムに関する。
高速な科学技術計算性能が要求されるHPC(High Performance Computing)の領域では高並列化の技術が発達し、最近では実行するプログラムの並列数が数千から数万に達することも珍しくなくなってきている。プログラムの並列数が増すに従い使用するファイル数も増加するため、ファイルの取り扱いが困難になる。このため、並列I/O処理機能であるMPI−IOを使用し、複数のプロセスが、1つのファイルにおける他のプロセスと重ならないブロックに対して同時にアクセスするような方式も出てきている。
このような高並列コンピュータシステムでは、プログラムの並列数が増加すればするほど1つのファイルへアクセスするプログラムの数が増加する。このため、そのファイルを格納したサーバの処理負荷が増大してシステム全体のボトルネックとなり、システム性能が低下する原因の一つとなっている。
このようなシステム性能の低下を回避するための技術として、特許文献1には、論理ファイルを複数ディスク装置に分割して保存することで、並行して複数ディスク装置のファイルブロックにアクセスできるようにしたストライピングファイル機構による論理ファイルの分散管理方法に関するものが公開されている。ここで公開されている技術は、ファイル読み出し時のディスク装置へ並列での読み出しの効率化を図り、大容量ファイルの読み出し時間を短縮化するための方法である。
また、特許文献2には、仮想ファイルサーバが設定された複数の装置によって構成されるクラスタ内で仮想ファイルサーバを動的に移動させることにより、仮想ファイルサーバ単位の負荷分散を行い、特定のファイルサーバへの負荷の集中を回避するシステムが公開されている。
特開2002-182953 特開2005-267327
上記のような分散ファイルシステムを持つコンピュータシステムにおいては、ファイルへのアクセス時にファイルの存在場所等の情報を入手する必要があるため、まずファイルのメタ情報を格納したメタデータファイルへアクセスすることになる。高並列コンピュータシステムでは、このメタデータファイルへのアクセスが集中することによるメタデータファイルを格納したサーバの処理負荷が増大することがあるが、前述の特許文献1や特許文献2に記載された技術は、このメタデータファイルを格納したサーバの負荷を軽減するものではない。したがって、高並列化コンピュータシステムにおいては、メタデータファイルへのアクセスの集中がボトルネックとなり、システムの性能低下が生じる恐れがあるという問題がある。
本願発明の目的は、これらの問題点を解決した分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラムを提供することである。
本願発明の一実施形態の分散ファイルアクセス装置は、1つのデータファイルのメタ情報を格納したメタデータファイルを、複数に分割して格納する複数のメタデータファイル格納手段と、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とをハッシュ関数に入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定するメタデータファイル格納領域決定手段と、前記メタデータファイル格納領域決定手段が決定した前記メタデータファイル格納手段へアクセスするメタデータファイルアクセス手段と、を備える。
本願発明の一実施形態の分散ファイルアクセス方法は、1つのデータファイルのメタ情報を格納したメタデータファイルを、複数に分割して複数の記憶域に格納し、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とをハッシュ関数に入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記記憶域の識別情報を一意に決定し、決定した前記識別情報が示す前記記憶域へアクセスする。
本願発明の一実施形態の分散ファイルアクセスプログラムは、1つのデータファイルのメタ情報を格納したメタデータファイルを、複数に分割して複数の記憶域に格納するメタデータファイル格納処理と、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とをハッシュ関数に入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記記憶域の識別情報を一意に決定するメタデータファイル格納領域決定処理と、前記メタデータファイル格納領域決定処理が決定した前記記憶域へアクセスするメタデータファイルアクセス処理と、をコンピュータに実行させる。
本願発明は、メタデータファイルへのアクセスにおいて負荷分散を実現する。
本願発明の第1の実施形態の構成を示すブロック図である。 本願発明の第1の実施形態の動作を示すフローチャートである。 本願発明の第1の実施形態におけるメタデータの分散格納の構成例である。 本願発明の第1の実施形態におけるプロセス実行部からのファイルアクセス命令の構成例である。 本願発明の第1の実施形態におけるメタデータファイルの構成例である。 本願発明の第2の実施形態の構成を示すブロック図である。 本願発明の第2の実施形態におけるハッシュ関数設定情報の構成例である。 本願発明の第3の実施形態の構成を示すブロック図である。 本願発明の第3の実施形態におけるメタデータの分散格納の構成例である。
本願発明の第一の実施の形態について図面を参照して詳細に説明する。
図1は本願発明の第一の実施形態の構成を示すブロック図である。
本実施形態の分散ファイルアクセスシステムは、8個のプロセス実行部10−0乃至10−7と、4個のデータファイル格納部11−0乃至11−3と、3個のメタデータファイル格納部12−0乃至12−2と、メタデータファイルアクセス部13と、メタデータファイル格納領域決定部14と、データファイルアクセス部15とを包含している。
プロセス実行部10−0乃至10−7は並列化されたプロセスを実行している。プロセスがファイルアクセスを行う場合、ファイルアクセス命令を発行してメタデータファイルアクセス部13へ送付する。
各プロセスが、データファイル100「/dir_1/file_A」にアクセスするときのメタデータの分散格納の構成例を図3に示す。プロセス実行部10−0乃至10−7が実行しているプロセス0乃至プロセス7は、それぞれデータファイル100における他のプロセスとは重ならない2Gバイトの領域(ブロック0乃至ブロック7)をアクセスする。例えば、プロセス0はブロック0(0乃至2Gバイト領域)、プロセス1はブロック1(2乃至4Gバイト領域)、プロセス7はブロック7(14乃至16Gバイト領域)をアクセスする。
各プロセスが発行するファイルアクセス命令110の構成例を図4に示す。例えばプロセス実行部10−2におけるプロセス2が発行するデータファイル100へのリードアクセス命令の場合、Read/Write区分はRead、データファイル名称は/dir_1/file_A、開始オフセットは4Gバイト以上6Gバイト未満の値、アクセスサイズは0バイト以上2Gバイト以下の値となる。
データファイル格納部11−0乃至11−3は、データファイル100を分割して格納しており、それぞれのシステム管理上の名称はSS0乃至SS3である。
メタデータファイル格納部12−0乃至12−2は、データファイル100のメタデータを記録したメタデータファイルを分割して格納しており、それぞれのシステム管理上の名称はMDS0乃至MDS3である。
メタデータファイルの構成例を図5に示す。メタデータファイルは、メタデータファイル属性情報部120とメタデータファイル対応表部130を包含している。メタデータファイル属性情報部120は、データファイル100の属性情報を記録したものであり、データファイル名称、アクセス権、所有者、サイズ、メタデータブロックサイズを包含している。メタデータファイル属性情報部120の格納データは、ライトアクセスのファイルアクセス命令110が発行されたときに、メタデータファイル格納部12−0乃至12−2により、ファイルアクセス命令110が包含する情報やシステム情報に基づいて書き込まれたものである。
メタデータファイル対応表部130は、データファイル100の格納先の情報を記録したものである。メタデータファイル対応表部130の格納データは、ライトアクセスのファイルアクセス命令110が発行されたときに、メタデータファイル格納部12−0乃至12−2により、ファイルアクセス命令110が包含するデータファイル名称、開始オフセット、アクセスサイズの情報を基にして書き込まれたものである。
本実施形態の分散ファイルアクセスシステムは、メタデータファイル対応表部130をメタデータファイル格納部12−0乃至12−2に分散格納する。メタデータファイル属性情報部120については分散格納を行わずに、メタデータファイル対応表部130の先頭部分のデータを格納するメタデータファイル格納部に格納する。
図5に示すとおり、本実施形態では、メタデータファイル格納部12−0乃至12−2は、データファイル100を536870912バイト(512Mバイト)単位のブロックに分割し、各ブロックをデータファイル格納部11−0(SS0)乃至11−3(SS3)にラウンドロビンで順番に格納している。尚、これは一例であり、メタデータファイル格納部12−0乃至12−2は、データファイル100を他のサイズのブロックで分割する場合もあれば、分割しない場合もある。
メタデータファイル格納部12−0乃至12−2は、各ブロックのシステム管理上の実ファイル名を、データファイル100の名称と、上述した512Mバイトブロックの開始オフセットと終了オフセットを基に、一意になるように付与している。例えば最初の512Mバイトブロックの場合は、dir_1_file_A:0_536870911となる。
図3、図5に示すとおり、メタデータファイル格納部12−0(MDS0)乃至12−2(MDS2)は、データファイル100のメタデータファイルを、データファイル100の3Gバイト領域単位に対応したメタデータに分割して分散格納している。例えば、メタデータファイル格納部12−1(MDS1)は、データファイル100の0乃至3G−1バイト領域に対応するメタデータを格納する。メタデータファイル格納部12−2(MDS2)は、データファイル100の3G乃至6G−1バイト領域に対応するメタデータを格納する。
メタデータファイルアクセス部13は、プロセス実行部10−0乃至10−7から受信した、ファイルアクセス命令110におけるデータファイル名称と開始オフセットとアクセスサイズの情報を、メタデータファイル格納領域決定部14に送付する。
メタデータファイル格納領域決定部14は、データファイル名称と開始オフセットとアクセスサイズの情報を基に、ハッシュ関数140を用いて、データファイル100のメタデータを格納したメタデータファイル格納部を決定する。ハッシュ関数140の具体例MDSnum(x,b)を以下に示す。
MDSnum(x,b)=(floor(x/3GB)+ascii(b)) mod 3

このハッシュ関数において、xはデータファイル100における位置を示すオフセット、bはデータファイル100の名称、floor(z)はz以下の最大の整数を出力する関数、ascii(b)は文字列bの各文字のアスキーコードの和を出力する関数である。データファイル100「/dir_1/file_A」へのアクセスの場合、ascii(/dir_1/file_A)の値は1138となる。ハッシュ関数140がfloor(x/3GB)を使用するのは、データファイル100の3Gバイト領域単位でメタデータを分割して、メタデータファイル格納部12−0乃至12−2を割り当てるためである。ハッシュ関数140がmod 3を使用するのは、メタデータファイル格納部12−0乃至12−2の数が3個であるためである。
例えば、プロセス実行部10−1が実行しているプロセス1が、データファイル100における開始オフセット2Gバイトから2Gバイトサイズの領域へのファイルアクセス命令110を発行した場合、メタデータファイル格納領域決定部14は、MDSnum(2GB,/dir_1/file_A)=1、MDSnum(3GB,/dir_1/file_A)=2、MDSnum(4G−1B,/dir_1/file_A)=2を算出する。その結果、メタデータファイル格納領域決定部14は、メタデータファイルアクセス部13に対して、「/dir_1/file_Aのオフセット2Gバイト乃至3G−1バイトの領域に対するメタデータファイル格納部はMDS1」であることと、「/dir_1/file_Aのオフセット3Gバイト乃至4G−1バイトの領域に対するメタデータファイル格納部はMDS2」であることを通知する。
前記の例で、MDSnum(3GB,/dir_1/file_A)=2を算出するのは、データファイル100の3Gバイト領域単位でメタデータを分割して、メタデータファイル格納部12−0乃至12−2を割り当てるためである。すなわち、3Gバイト境界を境に格納先のメタデータファイル格納部12−0乃至12−2が変わるからである。メタデータファイル格納領域決定部14は、データファイル100のアクセス領域の開始オフセットと終了オフセットの間に3Gバイト境界が存在する場合は、境界部分についてハッシュ関数140の値を算出する。
メタデータファイルアクセス部13は、メタデータ格納領域決定部14から受信したメタデータファイル格納先の情報に従い、メタデータファイル格納部12−0乃至12−2の何れかにアクセスする。プロセス実行部10−1のプロセス1が、データファイル100における開始オフセット2Gバイトから2Gバイトサイズの領域へのファイルアクセス命令110を発行した場合の例では、メタデータファイルアクセス部13は、上述の通りメタデータファイル格納部12−1(MDS1)、12−2(MDS2)へアクセスする。
メタデータファイルアクセス部13は、図5におけるメタデータファイル対応表部130に記載のとおり、メタデータファイル格納部12−1(MDS1)から、データファイル100のオフセット2Gバイト乃至3G−1バイトの領域のデータの格納先がデータファイル格納部11−0(SS0)と11−1(SS1)(512Mバイトブロック単位で分割格納)であることを、その実ファイル名とともに読み出す。続いてメタデータファイルアクセス部13は、メタデータファイル格納部12−2(MDS2)から、データファイル100のオフセット3Gバイト乃至4G−1バイトの領域のデータの格納先がデータファイル格納部11−2(SS2)と11−3(SS3)(512Mバイトブロック単位で分割格納)であることを、その実ファイル名とともに読み出す。メタデータファイルアクセス部13は、読み出したデータファイル格納先と実ファイル名の情報を、データファイルアクセス部15へ送付する。
データファイルアクセス部15は、メタデータファイルアクセス部13から受信したテータファイル格納先と実ファイル名の情報に基づき、データファイル格納部11−0乃至11−3へアクセスする。
次に図2のフローチャートを参照して、本実施形態の動作について詳細に説明する。
プロセス実行部10−0乃至10−7が実行しているプロセスは、データファイル100へのファイルアクセス命令110を発行し、メタデータファイルアクセス部13へ送付する(S101)。
メタデータファイルアクセス部13は、ファイルアクセス命令110をメタデータファイル格納領域決定部14へ送付する(S102)。
メタデータファイル格納領域決定部14は、ファイルアクセス命令110におけるデータファイル名称と開始オフセットとアクセスサイズの情報から、ハッシュ関数140を使用してデータファイル100に対応するメタデータファイルの格納先となるメタデータファイル格納部を決定し、メタデータファイル格納先の情報をメタデータファイルアクセス部13へ送付する(S103)。
メタデータファイルアクセス部13は、受信したメタデータファイル格納先の情報が示す何れかのメタデータファイル格納部12−n(n=0乃至2の何れか)に、ファイルアクセス命令110を送付する(S104)。
ファイルアクセス命令110がWriteリクエストである場合(S105でYes)、メタデータファイル格納部12−nは、ファイルアクセス命令110の情報から、データファイル110のメタデータを作成し、メタデータファイル属性情報部120とメタデータファイル対応表部130に、メタデータを書き込む(S106)。
メタデータファイル格納部12−nは、作成したデータファイル110のメタデータをメタデータファイルアクセス部13へ送付する(S107)。
ファイルアクセス命令110がWriteリクエストでない場合(S105でNo)、ファイルアクセス命令110はReadリクエストであり、メタデータファイル格納部12−nは、メタデータファイル対応表部130から、ファイルアクセス命令110が包含する情報から決定するレコードに格納されたメタデータを読み込む(S108)。
メタデータファイル格納部12−nは、読み込んだデータファイル110のメタデータを、メタデータファイルアクセス部13へ送付する(S109)。
メタデータファイルアクセス部13は、データファイル110のメタデータを、データファイルアクセス部15へ送付する(S110)。
データファイルアクセス部15は、データファイル110のメタデータが示す何れかのデータファイル格納部11−0乃至11−3に対して、データファイル110のメタデータが示す実ファイル名でアクセスする(S111)。
本実施形態には、データファイルのメタデータを格納したメタデータファイルを分散配置させることで、メタデータファイルを格納したある特定のサーバへの負荷の集中を回避する効果がある。なぜなら、メタデータファイル格納領域決定部14が、プロセス実行部10−0〜10−7で実行されるプロセスが発行する、データファイル100へのファイルアクセス命令110におけるデータファイル名称とオフセット情報を基に、ハッシュ関数140を用いて、データファイル100のメタデータファイルを分散配置させるからである。
メタデータファイルの分散配置により、複数のメタデータファイル格納サーバに負荷を分散させることで、メタデータ格納ファイルサーバの処理のボトルネックによるシステム性能の低下を回避することが可能となる。
また本実施形態は、1つのデータファイルにおけるブロック領域単位に対応したメタデータを分散配置しているため、1つのデータファイルについてブロック領域単位でデータを並列処理するような大きな配列変数の演算を行うHPC領域のアプリケーションにおいて、大きな効果がある。
<第二の実施形態>
次に、本願発明の第二の実施形態について図面を参照して詳細に説明する。
図6は本願発明の第二の実施形態の構成を示すブロック図である。
本実施形態は、第一の実施形態の構成に加えて、ハッシュ関数数式設定部141とハッシュ関数設定情報格納部16とを備えている。ハッシュ関数数式設定部141とハッシュ関数設定情報格納部16を除く各構成要素の機能は第一の実施形態と同様である。
ハッシュ関数数式設定入力部141は、メタデータファイルアクセス部13から受信した、ファイルアクセス命令110におけるデータファイル名称を、ハッシュ関数設定情報格納部16に送付する。
ハッシュ関数設定情報格納部16は、ハッシュ関数設定情報160を格納している。ハッシュ関数設定情報160の構成例を図7に示す。ハッシュ関数設定情報160はデータファイル100とハッシュ関数140との対応関係を格納している。例えば、データファイル100が「/dir_1/file_A」の場合は、メタデータファイル格納領域決定部140は、ハッシュ関数として、

MDSnum(x,b)=(floor(x/3GB)+ascii(b)) mod 3

を使用し、データファイル100が「/dir_1/file_B」の場合は、メタデータファイル格納領域決定部140は、ハッシュ関数として、

MDSnum(x,b)=(floor(x/6GB)+ascii(b)) mod 3

を使用することを示している。
ハッシュ関数設定情報160は、実行するアプリケーションのデータファイルへのアクセスの特性を熟知した担当者が設定する。
ハッシュ関数設定情報格納部16は、ハッシュ関数数式設定入力部141から受信したデータファイル名称と、データファイル名称が一致するレコードをハッシュ関数設定情報160から読み出して、読み出したレコードにおけるハッシュ関数数式の情報をハッシュ関数数式設定入力部141へ送付する。
ハッシュ関数数式設定入力部141は、受信したハッシュ関数数式をハッシュ関数140に設定する。
本実施形態には、メタデータファイルの分散配置を決定するハッシュ関数の数式をデータファイルにより可変としたことで、データファイル毎にメタデータファイルの分散配置の仕方を変更できる効果がある。なぜなら、ハッシュ関数数式設定部141が、アクセスするデータファイルに対応したハッシュ関数の数式をハッシュ関数設定情格納部16から取得し、その数式をメタデータファイル格納領域決定部14で使用するハッシュ関数140として設定するからである。
メタデータファイルの分散配置の仕方をデータファイルにより可変とすることで、実行するプログラムのデータファイルへのアクセスの仕方の特徴をふまえたメタデータファイルの分散配置の仕方を設定し、チューニングを行うことが可能となる。
<第三の実施形態>
次に、本願発明の第三の実施形態について図面を参照して詳細に説明する。
図8は本願発明の第三の実施形態の構成を示すブロック図である。
本実施形態の分散ファイルアクセス装置は、複数、例えば3個のメタデータファイル格納部22−0乃至22−2と、メタデータファイルアクセス部23と、メタデータファイル格納領域決定部24とを包含している。
メタデータファイル格納部22−0乃至22−2は、データファイル200のメタデータを記録したメタデータファイルを分割して格納しており、それぞれのシステム管理上の名称はMDS0乃至MDS2である。
メタデータファイル格納領域決定部24は、データファイル200へのアクセス命令におけるデータファイル200の識別情報とアクセスアドレスの情報を基に、ハッシュ関数240を用いて、データファイル200のメタデータが格納されたメタデータファイル格納部22−0(MDS0)乃至22−2(MDS2)の何れかを一意に決定する。
データファイル200へのアクセス命令の構成は、第一の実施例と同様、図4に示すとおりである。したがって、データファイル200の識別情報としてファイルアクセス命令110におけるデータファイル名称を使用し、前記のアクセスアドレスの情報として、ファイルアクセス命令110における開始オフセットとアクセスサイズを使用する。
メタデータファイルアクセス部23は、メタデータファイル格納領域決定部24が決定したメタデータファイル格納部22−0(MDS0)乃至22−2(MDS2)の何れかに格納されたメタデータファイルにアクセスする。
本実施形態におけるデータファイル200のメタデータの分散格納の構成例を図9に示す。本実施形態では、メタデータファイル格納部22−0乃至22−2が、第一の実施形態の様にデータファイル100のブロック領域単位に対応するメタデータを格納するのではなく、データファイル200のアドレス単位に対応するメタデータを格納する。
本実施形態には、第一の実施形態と同様に、データファイルのメタデータを格納したメタデータファイルを分散配置させることで、メタデータファイルを格納したある特定のサーバへの負荷の集中を回避する効果がある。
また本実施形態は、1つデータファイルにおけるアドレス単位に対応したメタデータを分散配置しているため、1つのデータファイル内のデータを不規則に同時に参照して処理するような一般的なアプリケーションにおいて効果がある。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されたものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
10−0乃至10−7 プロセス実行部
11−0乃至11−3 データファイル格納部
12−0乃至12−2 メタデータファイル格納部
13 メタデータファイルアクセス部
14 メタデータファイル格納領域決定部
140 ハッシュ関数
15 データファイルアクセス部
100 データファイル
110 ファイルアクセス命令
120 メタデータファイル属性情報部
130 メタデータファイル対応表部
141 ハッシュ関数数式設定部
16 ハッシュ関数設定情報格納部
160 ハッシュ関数設定情報
22−0乃至22−2 メタデータファイル格納部
23 メタデータファイルアクセス部
24 メタデータファイル格納領域決定部
240 ハッシュ関数
200 データファイル

Claims (7)

  1. 1つのデータファイルのメタ情報を格納したメタデータファイルを、複数に分割して格納する複数のメタデータファイル格納手段と、
    前記データファイルの識別情報と、ハッシュ関数の数式との対応情報を格納する、ハッシュ関数設定情報格納手段と、
    前記対応情報を構成するレコードの中から、前記データファイルの識別情報が、前記データファイルへのアクセス命令における当該データファイルの識別情報と一致するレコードを参照して、当該レコードに格納された前記ハッシュ関数の数式に対して、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とを入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定するメタデータファイル格納領域決定手段と、
    前記メタデータファイル格納領域決定手段が決定した前記メタデータファイル格納手段へアクセスするメタデータファイルアクセス手段と、
    を備える分散ファイルアクセス装置。
  2. 前記メタデータファイル格納手段は、1つの前記データファイルを構成する複数のブロック領域単位で、前記ブロック領域に対応する前記メタデータファイルを格納し、
    前記メタデータファイル格納領域決定手段は、前記アクセス命令において指定された当該データファイルにおける前記アクセスアドレスを、前記ブロック領域単位で、当該データファイルの識別情報とともに前記ハッシュ関数に入力して、当該ブロック領域に対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定する
    請求項1の分散ファイルアクセス装置。
  3. 請求項1または2に記載の分散ファイルアクセス装置と、
    前記データファイルへのアクセス命令を発行して前記データファイルへアクセスするプロセス実行装置と、
    前記データファイルを格納するデータファイル格納装置と、
    を包含する分散ファイルアクセスシステム。
  4. 1つのデータファイルのメタ情報を格納したメタデータファイル、複数に分割して複数のメタデータファイル格納手段に格納され
    前記データファイルの識別情報と、ハッシュ関数の数式との対応情報が、ハッシュ関数設定情報格納手段に格納され、
    前記対応情報を構成するレコードの中から、前記データファイルの識別情報が、前記データファイルへのアクセス命令における当該データファイルの識別情報と一致するレコードを参照して、当該レコードに格納された前記ハッシュ関数の数式に対して、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とを入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定し、
    決定した前記メタデータファイル格納手段へアクセスする
    分散ファイルアクセス方法。
  5. 前記メタデータファイル格納手段には、1つの前記データファイルを構成する複数のブロック領域単位で、前記ブロック領域に対応する前記メタデータファイル格納され
    前記アクセス命令において指定された当該データファイルにおける前記アクセスアドレ
    スを、前記ブロック領域単位で、当該データファイルの識別情報とともに前記ハッシュ関
    数に入力して、当該ブロック領域に対応する前記メタデータファイルが格納された前記メ
    タデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定する
    請求項の分散ファイルアクセス方法
  6. 1つのデータファイルのメタ情報を格納したメタデータファイルを、複数に分割して格納する複数のメタデータファイル格納手段と
    前記データファイルの識別情報と、ハッシュ関数の数式との対応情報を格納する、ハッシュ関数設定情報格納手段と、
    にアクセス可能なコンピュータに、
    前記対応情報を構成するレコードの中から、前記データファイルの識別情報が、前記データファイルへのアクセス命令における当該データファイルの識別情報と一致するレコードを参照して、当該レコードに格納された前記ハッシュ関数の数式に対して、前記データファイルへのアクセス命令において指定された当該データファイルの識別情報と、当該データファイルにおけるアクセスアドレスの情報とを入力し、前記ハッシュ関数の出力値から、当該データファイルの当該アクセスアドレスに対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定するメタデータファイル格納領域決定処理と、
    前記メタデータファイル格納領域決定処理が決定した前記メタデータファイル格納手段へアクセスするメタデータファイルアクセス処理と、
    を実行させる分散ファイルアクセスプログラム。
  7. 前記メタデータファイル格納手段には、1つの前記データファイルを構成する複数のブロック領域単位で、前記ブロック領域に対応する前記メタデータファイル格納され
    前記メタデータファイル格納領域決定処理は、前記アクセス命令において指定された当該データファイルにおける前記アクセスアドレスを、前記ブロック領域単位で、当該データファイルの識別情報とともに前記ハッシュ関数に入力して、当該ブロック領域に対応する前記メタデータファイルを格納する前記メタデータファイル格納手段の識別情報を一意に決定する
    請求項の分散ファイルアクセスプログラム。
JP2012029403A 2012-02-14 2012-02-14 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム Expired - Fee Related JP5966404B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012029403A JP5966404B2 (ja) 2012-02-14 2012-02-14 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012029403A JP5966404B2 (ja) 2012-02-14 2012-02-14 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム

Publications (2)

Publication Number Publication Date
JP2013167942A JP2013167942A (ja) 2013-08-29
JP5966404B2 true JP5966404B2 (ja) 2016-08-10

Family

ID=49178310

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012029403A Expired - Fee Related JP5966404B2 (ja) 2012-02-14 2012-02-14 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム

Country Status (1)

Country Link
JP (1) JP5966404B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101689257B1 (ko) * 2013-11-19 2016-12-23 한국전자통신연구원 메타데이터 관리장치 및 이의 메타데이터 관리방법
US10776325B2 (en) * 2013-11-26 2020-09-15 Ab Initio Technology Llc Parallel access to data in a distributed file system
US10223361B2 (en) * 2017-01-18 2019-03-05 Netapp, Inc. Methods and systems for restoring a data container archived at an object-based storage
JP7360040B2 (ja) * 2020-01-23 2023-10-12 富士通株式会社 情報処理システム、情報処理装置およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07175698A (ja) * 1993-12-17 1995-07-14 Fujitsu Ltd ファイルシステム

Also Published As

Publication number Publication date
JP2013167942A (ja) 2013-08-29

Similar Documents

Publication Publication Date Title
KR101502896B1 (ko) 맵 리듀스를 이용한 분산 메모리 클러스터 제어 장치 및 방법
US8782324B1 (en) Techniques for managing placement of extents based on a history of active extents
JP5902323B2 (ja) コンテンツ派生データのメモリ内配置方法および装置
US20150347311A1 (en) Storage hierarchical management system
US8954658B1 (en) Method of LUN management in a solid state disk array
US20150169230A1 (en) Method of lun management in a solid state disk array
JP5439236B2 (ja) 計算機システムおよびアプリケーションプログラムの実行方法
JP4837759B2 (ja) データベース処理方法、データベース処理システム及びデータベースサーバ
US9535844B1 (en) Prioritization for cache systems
US20140181455A1 (en) Category based space allocation for multiple storage devices
US9658774B2 (en) Storage system and storage control method
US20080168069A1 (en) Method and apparatus for storing and accessing data records on solid state disks
WO2015145636A1 (ja) ストレージシステム
JP6196383B2 (ja) 階層化ストレージシステム
JP5966404B2 (ja) 分散ファイルアクセス装置、分散ファイルアクセスシステム、分散ファイルアクセス方法、及び、分散ファイルアクセスプログラム
JP2012168781A (ja) 分散型データストアシステム及び分散型データストアシステムにおけるレコード管理方法
US11789622B2 (en) Method, device and computer program product for storage management
US20190018857A1 (en) Defragmenting files having file blocks in multiple point-in-time copies
WO2015189988A1 (ja) ファイル再配置ポリシーを出力する管理サーバ、及びストレージシステム
US8918621B1 (en) Block address isolation for file systems
US8468303B2 (en) Method and apparatus to allocate area to virtual volume based on object access type
US8504764B2 (en) Method and apparatus to manage object-based tiers
US9870152B2 (en) Management system and management method for managing data units constituting schemas of a database
WO2014103386A1 (ja) 情報処理装置、分散データベースシステム、およびバックアップ方法
US20180329756A1 (en) Distributed processing system, distributed processing method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160114

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160607

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160620

R150 Certificate of patent or registration of utility model

Ref document number: 5966404

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees