JP5943430B2 - 分散記憶システムおよび分散記憶方法 - Google Patents
分散記憶システムおよび分散記憶方法 Download PDFInfo
- Publication number
- JP5943430B2 JP5943430B2 JP2013504500A JP2013504500A JP5943430B2 JP 5943430 B2 JP5943430 B2 JP 5943430B2 JP 2013504500 A JP2013504500 A JP 2013504500A JP 2013504500 A JP2013504500 A JP 2013504500A JP 5943430 B2 JP5943430 B2 JP 5943430B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- node
- data storage
- coordinates
- storage nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
- G06F16/1824—Distributed file systems implemented using Network-attached Storage [NAS] architecture
- G06F16/1827—Management specifically adapted to NAS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/067—Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[関連出願についての記載]
本発明は、日本国特許出願:特願2011−058340号(2011年3月16日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、分散記憶システムおよび分散記憶方法に関し、特に、処理対象である多数のデータを多数のノードを用いて記憶する分散記憶システムおよび分散記憶方法に関する。
本発明は、日本国特許出願:特願2011−058340号(2011年3月16日出願)の優先権主張に基づくものであり、同出願の全記載内容は引用をもって本書に組み込み記載されているものとする。
本発明は、分散記憶システムおよび分散記憶方法に関し、特に、処理対象である多数のデータを多数のノードを用いて記憶する分散記憶システムおよび分散記憶方法に関する。
分散記憶システムにおいては、処理対象であるデータ(以下、「オブジェクトデータ」という。)を、複数の記憶ノードに分散した状態で大量に記憶する。ここで、記憶ノードとは、オブジェクトデータを記憶するストレージ等の装置をいう。
分散記憶システムにおいては、多数の記憶ノードがオブジェクトデータを記憶する。この際、記憶ノードとその記憶ノードが記憶しているオブジェクトデータの対応を管理する方法が問題となる。これまでに、少数の固定された管理ノードによって、記憶ノードとその記憶ノードが記憶しているオブジェクトデータの対応を管理する手法が提案されている。しかし、このような手法によると、管理ノードがボトルネックとなりやすく、スケーラビリティに乏しい等の問題がある。これらの問題を克服するために、多数の管理ノードで対応を管理するシステムが提案されている。かかるシステムによると、オブジェクトデータを記憶する記憶ノードを制御するための処理が1台もしくは少数台の固定的な管理ノードに集中することはないため、より効率的に多数の記憶ノードにデータを分散記憶することができる。
集中的に制御を行う固定的な管理ノードを持たないシステムの場合、オブジェクトデータを記憶した記憶ノードをテーブルに記録して管理することは困難となる。オブジェクトデータを記憶した記憶ノードを記録したテーブルは、オブジェクトデータの数が増えるに従って非常に大きなテーブルとなり、大きなテーブルを多数の管理ノードで同期して管理することは困難となるからである。
そこで、オブジェクトデータを記憶する記憶ノードをアルゴリズムによって判断する手法が提案されている。オブジェクトデータの識別子などのデータの情報を元に、アルゴリズムによってオブジェクトデータを記憶する記憶ノードを決定することにより、大きなテーブルを多数の管理ノードで同期する必要がなくなり、多数のオブジェクトデータを取り扱うことができる。
特願2010−184109号(以下「特許文献1」という。)、非特許文献1および非特許文献2は、上述のとおり、システム全体を集中的に制御する固定的な管理ノードを用いることなく、アルゴリズムによって、オブジェクトデータを多数の記憶ノードに記憶する手法を提案している。
図8は、本発明に関連する分散記憶システムのシステム構成を例示する図である。図8に示す分散記憶システム100は、上述した固定的な管理ノードを用いない分散記憶システムを例示している。
分散記憶システム100は、複数の記憶ノード101とクライアントノード110を備えている。記憶ノード101は、クライアントノード110の読み込み命令を受けて、その記憶ノード101が記憶しているオブジェクトデータを読み出す命令を実行し、命令を出したクライアントノード110へオブジェクトデータを返すとともに、クライアントノード110の書き込み命令を受けて、クライアントノード110から送出されたオブジェクトデータの書き込み命令を実行し、オブジェクトデータを記憶する。
ここで、図8に示した分散記憶システム100において、一例として、データ識別子000001を持つオブジェクトデータを読み込む処理を実行する場合について説明する。この処理では、予め各記憶ノード101にユニークな番号を割り振っておく。ここで、すべてのクライアントノード110は、すべての記憶ノード101の情報と記憶ノード101に振られた番号を記憶する記憶テーブル111を持つものとする。図9は、記憶テーブル111を一例として示す。
処理が始まると、まず、クライアントノード110は、データ識別子000001をシード(乱数の種)として、記憶テーブル111に記憶している記憶ノード101に振られたすべての番号を等しい確率で発生する疑似乱数を生成する。疑似乱数を生成するアルゴリズムとして、同一のシードであれば同一の乱数列を生成するようなアルゴリズムを使用する。記憶ノード101に振られた番号と同一の疑似乱数が生成されるまで、疑似乱数の生成を繰り返す。記憶ノード101に振られた番号と同一の疑似乱数が生成された場合には、その疑似乱数に対応する番号を割り振られた記憶ノード101にアクセス命令を送出する。次に、疑似乱数に対応する番号を割り振られた記憶ノード101は、受け付けたアクセス命令を実行し、オブジェクトデータを得る。最後に、記憶ノード101は、オブジェクトデータをクライアントノード110へ送り、読み込み処理が完了する。
分散記憶システム100では、オブジェクトデータは記憶ノード101にほぼ均等に分散する。また、分散記憶システム100に対して記憶ノード101を追加した場合、または、分散記憶システム100から記憶ノード101を削減した場合には、最小限のオブジェクトデータの移動により、ほぼ均等な分散を維持することができる。
このように、上述した手法によると、システム全体を集中的に制御する固定的な特定ノードを用いることなく、アルゴリズムによって、オブジェクトデータを多数の記憶ノード101に記憶することができる。すなわち、上述したシステム構成によれば、多数の記憶ノード101で均等に分散してオブジェクトデータを記憶することができる。また、上述したシステム構成によれば、記憶ノード101の台数が変化した場合においても、柔軟に対処することができる。
David Karger,Eric Lehman,Tom Leighton,Matthew Levine,Daniel Lewin,Rina Panigrahy,"Consistent hashing and random trees: distributed caching protocols for relieving hot spots on the World Wide Web,"1997.
Sage A. Weil,Scott A. Brandt,Ethan L. Miller,Carlos Maltzahn,"CRUSH:Contorolled,Scalable,Decentralized Placement of Replicated Data,"2006.
上記の特許文献および非特許文献の各開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明者によってなされたものである。
特許文献1、非特許文献1および非特許文献2に記載された手法では、個々のオブジェクトデータを分類することなく記憶ノードに記憶している。このとき、記憶ノード上で特定の性質を持つオブジェクトデータを処理する場合には、多数の記憶ノードからその記憶ノードへオブジェクトデータを集める必要がある。記憶ノードの台数が多くなるに従って、特定のノードへオブジェクトデータを収集するための処理が膨大となる。
したがって、オブジェクトデータの性質に基づいてオブジェクトデータを記憶する記憶ノードを決定することにより、同一または類似の性質を有するオブジェクトデータを少数の記憶ノードに偏らせて記憶することを実現し、複数の記憶ノードを集中的に管理および制御する特定ノードを用いない分散処理環境において、各記憶ノードにほぼ均等にオブジェクトを分散させつつ、特定の性質を持つオブジェクトデータを処理する際に処理をするオブジェクトデータを持つ記憶ノードを限定できるようにすることが望まれる。
特に、複数のデータ記憶ノードにオブジェクトデータを均一に分散して格納するとともに、オブジェクトデータの特徴に応じてオブジェクトデータを一部のデータ記憶ノードに偏在させることが課題となる。本発明の目的は、かかる課題を解決する分散記憶システムおよび分散記憶方法を提供することにある。
本発明の第1の視点に係る分散記憶システムは、
複数のオブジェクトデータを分散して記憶する複数のデータ記憶ノードを備え、
前記複数のオブジェクトデータは、それぞれ、データ座標によって特徴付けられるとともにデータ識別子によって一意に識別され、
前記複数のデータ記憶ノードは、それぞれ、前記データ座標と同一の空間におけるノード座標を割り当てられ、
前記複数のオブジェクトデータは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択した後、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに、それぞれ記憶される。
複数のオブジェクトデータを分散して記憶する複数のデータ記憶ノードを備え、
前記複数のオブジェクトデータは、それぞれ、データ座標によって特徴付けられるとともにデータ識別子によって一意に識別され、
前記複数のデータ記憶ノードは、それぞれ、前記データ座標と同一の空間におけるノード座標を割り当てられ、
前記複数のオブジェクトデータは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択した後、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに、それぞれ記憶される。
本発明の第2の視点に係る分散記憶方法は、
データ座標によって特徴付けられるとともにデータ識別子によって一意に識別される複数のオブジェクトデータを分散して記憶する分散記憶方法であって、
前記データ座標と同一の空間におけるノード座標を複数のデータ記憶ノードのそれぞれに割り当てる工程と、
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを、前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程と、
前記複数の第1のデータ記憶ノードの中から前記複数のオブジェクトデータのそれぞれを識別するデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを記憶させる工程と、を含む。
データ座標によって特徴付けられるとともにデータ識別子によって一意に識別される複数のオブジェクトデータを分散して記憶する分散記憶方法であって、
前記データ座標と同一の空間におけるノード座標を複数のデータ記憶ノードのそれぞれに割り当てる工程と、
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを、前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程と、
前記複数の第1のデータ記憶ノードの中から前記複数のオブジェクトデータのそれぞれを識別するデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを記憶させる工程と、を含む。
本発明に係る分散記憶システムおよび分散記憶方法によると、複数のデータ記憶ノードにオブジェクトデータを均一に分散して格納するとともに、オブジェクトデータの特徴に応じて、オブジェクトデータを一部のデータ記憶ノードに偏在させることができる。
はじめに、本発明の概要について説明する。なお、この概要に付記する図面参照符号は、専ら理解を助けるための例示であり、本発明を図示の態様に限定することを意図するものではない。
図1を参照すると、分散記憶システム(70)は、複数のオブジェクトデータを分散して記憶する複数のデータ記憶ノード(71a〜71c)を備えている。なお、図1には、一例として3つのデータ記憶ノード(71a〜71c)を示したが、データ記憶ノードの個数は図示の態様に限定されない。
複数のオブジェクトデータは、それぞれ、データ座標によって特徴付けられるとともにデータ識別子によって一意に識別される。また、複数のデータ記憶ノード(71a〜71c)は、それぞれ、データ座標と同一の空間におけるノード座標を割り当てられている。さらに、オブジェクトデータは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして複数選択した後(例えば、71a、71b)、複数の第1のデータ記憶ノード(71a、71b)の中からオブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノード(例えば、71a)に記憶される。
ここで、複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、複数のデータ記憶ノード(71a〜71c)のそれぞれに割り当てられたノード座標は、複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標としてもよい。
また、オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして複数選択するようにしてもよい。さらに、オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして選択するようにしてもよい。
また、オブジェクトデータを識別するデータ識別子をシードとして生成した複数の擬似乱数を複数の第1のデータ記憶ノード(例えば、71a、71b)のそれぞれに割り当てるとともに、該オブジェクトデータのデータ座標と複数の第1のデータ記憶ノード(71a、71b)のそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを複数の第1のデータ記憶ノード(71a、71b)の中から抽出し、抽出したデータ記憶ノード(例えば、71a)を該オブジェクトデータを格納すべきデータ記憶ノードとして決定するようにしてもよい。ここで、ウェイトは、複数のオブジェクトデータのそれぞれを特徴付けるデータ座標と、複数のデータ記憶ノード(71a〜71c)のそれぞれに割り当てられたノード座標との距離が短くなるに従って増大することが好ましい。
また、複数のデータ記憶ノード(71a〜71c)は、それぞれ、複数のオブジェクトデータを特徴付けるデータ座標の分布に応じてノード座標が割り当てられていることが好ましい。例えば、データ座標の分布密度が高い領域に対して、高い確率でノード座標を割り当てるようにしてもよい。
図1を参照すると、分散記憶システム(70)は、複数のデータ記憶ノード(71a〜71c)にオブジェクトデータを書き込むとともに、複数のデータ記憶ノード(71a〜71c)に記憶されたオブジェクトデータを読み出すクライアントノード(72)をさらに備えていてもよい。クライアントノード(72)は、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして複数選択するとともに(例えば、71a、71b)、複数の第1のデータ記憶ノード(71a、71b)の中から該オブジェクトデータのデータ識別子に基づいて決定したデータ記憶ノード(例えば、71a)に、該オブジェクトデータを書き込むことが好ましい。
また、クライアントノード(72)は、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして複数選択するとともに(例えば、71a、71b)、選択した複数の第1のデータ記憶ノード(71a、72b)に対して該オブジェクトデータの読み出し命令を送出するか、または、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを複数のデータ記憶ノード(71a〜71c)の中から第1のデータ記憶ノードとして複数選択するとともに(例えば、71a、71b)、複数の第1のデータ記憶ノード(71a、71b)の中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノード(例えば、71a)に対して、該オブジェクトデータの読み出し命令を送出することが好ましい。
本発明に係る分散記憶システムによると、複数ノードを集中的に管理および制御する特定ノードを用いない分散処理環境において、オブジェクトデータをそれぞれの性質に基づいて分散しつつ、各ノードにほぼ均等に分散して記憶することができ、また、オブジェクトデータのデータ識別子と該オブジェクトデータのデータの性質を表す複数の数値化された指標(データ座標)から該オブジェクトデータを記憶するノードを特定することができ、さらに、オブジェクトデータのデータの性質を表す複数の数値化された指標(データ座標)から該オブジェクトデータを記憶するノードを一部のノードに限定することができる。
なお、本発明において、下記の形態が可能である。
[形態1]
上記第1の視点に係る分散記憶システムのとおりである。
[形態2]
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であってもよい。
[形態3]
オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するようにしてもよい。
[形態4]
オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択するようにしてもよい。
[形態5]
オブジェクトデータを識別するデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てるとともに、該オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出し、抽出したデータ記憶ノードを該オブジェクトデータを格納すべきデータ記憶ノードとして決定するようにしてもよい。
[形態6]
前記ウェイトは、前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標と、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離が短くなるに従って増大するようにしてもよい。
[形態7]
前記複数のデータ記憶ノードは、それぞれ、前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じてノード座標が割り当てられていてもよい。
[形態8]
分散記憶システムは、前記複数のデータ記憶ノードにオブジェクトデータを書き込むとともに、前記複数のデータ記憶ノードに記憶されたオブジェクトデータを読み出すクライアントノードをさらに備えていてもよい。
[形態9]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータのデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを書き込むようにしてもよい。
[形態10]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、選択した複数の第1のデータ記憶ノードに対して該オブジェクトデータの読み出し命令を送出するようにしてもよい。
[形態11]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに対して、該オブジェクトデータの読み出し命令を送出するようにしてもよい。
[形態12]
上記第2の視点に係る分散記憶方法のとおりである。
[形態13]
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であってもよい。
[形態14]
分散記憶方法は、オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程を含んでいてもよい。
[形態15]
分散記憶方法は、オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択する工程を含んでいてもよい。
[形態16]
分散記憶方法は、オブジェクトデータのデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てる工程と、
前記オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出する工程と、
抽出したデータ記憶ノードを、前記オブジェクトデータを格納すべきデータ記憶ノードとして決定する工程と、を含んでいてもよい。
[形態17]
分散記憶方法は、前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じて、前記複数のデータ記憶ノードのそれぞれにノード座標を割り当てる工程を含んでいてもよい。
[形態1]
上記第1の視点に係る分散記憶システムのとおりである。
[形態2]
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であってもよい。
[形態3]
オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するようにしてもよい。
[形態4]
オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択するようにしてもよい。
[形態5]
オブジェクトデータを識別するデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てるとともに、該オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出し、抽出したデータ記憶ノードを該オブジェクトデータを格納すべきデータ記憶ノードとして決定するようにしてもよい。
[形態6]
前記ウェイトは、前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標と、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離が短くなるに従って増大するようにしてもよい。
[形態7]
前記複数のデータ記憶ノードは、それぞれ、前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じてノード座標が割り当てられていてもよい。
[形態8]
分散記憶システムは、前記複数のデータ記憶ノードにオブジェクトデータを書き込むとともに、前記複数のデータ記憶ノードに記憶されたオブジェクトデータを読み出すクライアントノードをさらに備えていてもよい。
[形態9]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータのデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを書き込むようにしてもよい。
[形態10]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、選択した複数の第1のデータ記憶ノードに対して該オブジェクトデータの読み出し命令を送出するようにしてもよい。
[形態11]
前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに対して、該オブジェクトデータの読み出し命令を送出するようにしてもよい。
[形態12]
上記第2の視点に係る分散記憶方法のとおりである。
[形態13]
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であってもよい。
[形態14]
分散記憶方法は、オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程を含んでいてもよい。
[形態15]
分散記憶方法は、オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択する工程を含んでいてもよい。
[形態16]
分散記憶方法は、オブジェクトデータのデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てる工程と、
前記オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出する工程と、
抽出したデータ記憶ノードを、前記オブジェクトデータを格納すべきデータ記憶ノードとして決定する工程と、を含んでいてもよい。
[形態17]
分散記憶方法は、前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じて、前記複数のデータ記憶ノードのそれぞれにノード座標を割り当てる工程を含んでいてもよい。
<実施形態1>
第1の実施形態に係る分散記憶システムについて、図面を参照して説明する。図2は、本実施形態に係る分散記憶システム40の構成を概略的に示すブロック図である。図2は(a)、(b)の2つの図を含む。図3は、本実施形態に係る分散記憶システム40のうち、各ノードの内部構成を示すブロック図である。図4は、本実施形態に係る分散記憶システム40のうち各ノードの詳細を示すブロック図である。
第1の実施形態に係る分散記憶システムについて、図面を参照して説明する。図2は、本実施形態に係る分散記憶システム40の構成を概略的に示すブロック図である。図2は(a)、(b)の2つの図を含む。図3は、本実施形態に係る分散記憶システム40のうち、各ノードの内部構成を示すブロック図である。図4は、本実施形態に係る分散記憶システム40のうち各ノードの詳細を示すブロック図である。
図2ないし図4に示す分散記憶システム40は、複数のデータを分散記憶するシステムである。分散記憶システム40は、データ記憶ノード30にほぼ均等にデータを記憶するとともに、データの性質を表す複数の数値化された指標に応じて偏らせて、データ記憶ノード30にデータを記憶する。
本実施形態においても、上述の背景技術と同様に、処理対象であるデータを、「オブジェクトデータ」と呼ぶ。オブジェクトデータは、例えば、数値データ、所定の処理(プロセス、機能、アルゴリズム)が記述されたソフトウェアプログラム(コンピュータプログラム)等であってもよい。
図2(a)を参照すると、分散記憶システム40は、複数のクライアントノード10、複数のメタデータ記憶ノード20、および、複数のデータ記憶ノード30を備えている。本実施形態に係るクライアントノード10、メタデータ記憶ノード20およびデータ記憶ノード30は、互いに通信可能に接続されている。
次に、クライアントノード10、メタデータ記憶ノード20およびデータ記憶ノード30について説明する。
図2(a)を参照すると、クライアントノード10は、アクセスするオブジェクトデータのデータ識別子から、該データ識別子に対応するメタデータを記憶するメタデータ記憶ノード20を判定する。そして、該メタデータ記憶ノード20へデータ識別子とアクセス命令を送出する。
メタデータ記憶ノード20は、クライアントノード10から送出されたデータ識別子とアクセス命令を受信する。次に、メタデータ記憶ノード20は、該データ識別子と該データ識別子に対応するメタデータを元に、所定のルール(後述)に基づいてオブジェクトデータを持っているデータ記憶ノード30を選択する。次に、メタデータ記憶ノード20は、選択したデータ記憶ノード30へデータ識別子とアクセス命令を送出する。「メタデータ」は、オブジェクトデータの特徴を複数の指標で評価して数値化したデータを含む。すなわち、本実施形態において、データ識別子とメタデータとは必ずしも一致しない。
データ記憶ノード30は、メタデータ記憶ノード20から送出されたデータ識別子とアクセス命令を受信する。次に、データ記憶ノード30は、該データ識別子に対応するオブジェクトデータ、データ識別子とメタデータをクライアントノード10に返す。
また、別のアクセス方法として、以下のアクセス方法を用いてもよい。
図2(b)を参照すると、クライアントノード10は、メタデータと対応するオブジェクトデータを持っている可能性があるデータ記憶ノード30をルールに基づいて選択し、選択したデータ記憶ノード30へメタデータとアクセス命令を送出する。このとき、複数のデータ記憶ノード30が選択され得る。
データ記憶ノード30は、クライアントノード10から送出されたメタデータとアクセス命令を受信し、該メタデータに対応するオブジェクトデータ、データ識別子およびメタデータをクライアントノード10に返す。このとき、データ記憶ノード30は、メタデータに対応するオブジェクトデータを保持していない場合、または、メタデータに対応するオブジェクトデータを複数保持している場合があり得る。
本実施形態では、説明の便宜上、分散記憶システム40が、図2(a)のように3種類のノードを備えている場合について説明する。ただし、本発明は図2ないし図4に例示する構成に限定されるものではなく、例えば、仮想マシン環境において、これらのノードの全部または一部の機能を実現してもよい。なお、分散記憶システム40を実現するためのハードウェア構成の具体例については、図7を参照して後述する。
I.データを読み込む場合
分散記憶システム40において、データを読み込む場合の動作の詳細について、図面を参照して説明する。
分散記憶システム40において、データを読み込む場合の動作の詳細について、図面を参照して説明する。
「クライアントノード10」
図4を参照すると、クライアントノード10は、メタデータ記憶ノード判定部11、データ識別子送信部12、ノード情報記憶部13、データ記憶ノード判定部14、メタデータ送信部15、および、データ受信部16を備えている。
図4を参照すると、クライアントノード10は、メタデータ記憶ノード判定部11、データ識別子送信部12、ノード情報記憶部13、データ記憶ノード判定部14、メタデータ送信部15、および、データ受信部16を備えている。
まず、図2(a)に示すように、クライアントノード10がデータ識別子を用いてオブジェクトデータを得る場合について説明する。メタデータ記憶ノード判定部11は、オブジェクトデータのデータ識別子と、ノード情報記憶部13が記憶しているメタデータ記憶ノード20のノード番号から、データ識別子に対応するデータ識別子とメタデータとの組み合わせを記憶しているメタデータ記憶ノード20を判定する。次に、データ識別子送信部12は、該メタデータ記憶ノード20へデータ識別子とアクセス命令を送信する。該データ識別子に対応するデータ識別子とメタデータとの組み合わせを記憶するメタデータ記憶ノード20を、メタデータ記憶ノード判定部11が判定する方法として、さまざまな方法を採用することができる。例えば、特許文献1、非特許文献1または非特許文献2に記載された方法を採用することができる。
次に、クライアントノード10がメタデータからオブジェクトデータを得る場合について説明する。データ記憶ノード判定部14は、メタデータに含まれるデータ座標と、ノード情報記憶部13が記憶しているノード座標から、後述のアルゴリズムBを用いて、オブジェクトデータを記憶している可能性があるデータ記憶ノード30を判定する。次に、メタデータ送信部15は、該データ記憶ノード30へメタデータとアクセス命令を送出する。ノード座標の座標軸として、データ座標の座標軸と同一のものが用いられる。ノード座標が持つ座標データの指定方法については、後述する。
データ受信部16は、データ記憶ノード30から送出されたオブジェクトデータ、データ識別子、メタデータを受信する。
「メタデータ記憶ノード20」
図4を参照すると、メタデータ記憶ノード20は、データ識別子受信部21、メタデータ記憶部22、メタデータ判定部23、ノード情報記憶部24、ノード判定部25、および、データ識別子送信部26を備えている。
図4を参照すると、メタデータ記憶ノード20は、データ識別子受信部21、メタデータ記憶部22、メタデータ判定部23、ノード情報記憶部24、ノード判定部25、および、データ識別子送信部26を備えている。
データ識別子受信部21は、クライアントノード10から送出されたデータ識別子とアクセス命令を受信する。メタデータ記憶部22は、該データ識別子に対応するメタデータを記憶している。
メタデータ判定部23は、データ識別子に対応するメタデータをメタデータ記憶部22から受信して、ノード判定部25へ送出する。メタデータは、メタデータに対応するオブジェクトデータを様々な評価軸で評価した結果を数値化したデータ座標を含む。オブジェクトデータを評価する評価軸として、個々のシステムに依存して、様々な評価軸が用いられる。ここでは、用いるべき評価軸を特に限定しない。
ノード判定部25は、受信したデータ識別子に対応するメタデータと、ノード情報記憶部24が記憶しているノード情報から、受信したデータ識別子の送信先のデータ記憶ノード30を、後述のアルゴリズムAに基づいて選択する。ノード情報は、データ記憶ノード30のノード座標、ノード番号およびノードアクセス情報を含む。ノード番号は、各データ記憶ノードに固有の番号である。
次に、データ識別子送信部26は、選択したデータ記憶ノード30へデータ識別子とアクセス命令を送出する。
「データ記憶ノード30」
図4を参照すると、データ記憶ノード30は、データ識別子受信部31、データ記憶部32、データ判定部33、データ送信部34、メタデータ受信部35、および、メタデータ判定部36を備えている。
図4を参照すると、データ記憶ノード30は、データ識別子受信部31、データ記憶部32、データ判定部33、データ送信部34、メタデータ受信部35、および、メタデータ判定部36を備えている。
データ識別子受信部31は、メタデータ記憶ノード20からデータ識別子とアクセス命令を受信する。データ記憶部32は、受信したデータ識別子に対応するオブジェクトデータ、データ識別子およびメタデータを記憶している。
データ判定部33は、受信したデータ識別子に対応するオブジェクトデータおよびメタデータを、データ記憶部32から取得する。
次に、データ送信部34は、オブジェクトデータ、データ識別子およびメタデータをクライアントノード10へ送出する。
また、メタデータ受信部35は、クライアントノード10からメタデータを受信する。この場合、メタデータ判定部36は、受信したメタデータに対応するオブジェクトデータおよびデータ識別子をデータ記憶部32から取得する。このとき、データ記憶部32は、受信したメタデータに対応するオブジェクトデータおよびデータ識別子を記憶していない場合、または、複数記憶している場合がある。次に、データ送信部34は、オブジェクトデータ、データ識別子およびメタデータをクライアントノード10へ送出する。ここでは、クライアントノード10へオブジェクトデータ、データ識別子およびメタデータを送出するものとしたが、クライアントノード10へ返す情報としては、これらに制限されない。
「アルゴリズムA」
図5は、アルゴリズムAのフローチャートである。
図5は、アルゴリズムAのフローチャートである。
オブジェクトデータのデータ座標とデータ記憶ノード30のノード座標を「空間」に展開した場合のオブジェクトデータとデータ記憶ノード30の距離を計算し、オブジェクトデータから距離が近い順に「予め決められたルール」でデータ記憶ノード30を選択する(ステップS1)。
「空間」として、一例として、評価軸を直交する軸とする多次元ユークリッド空間を用いることができる。また、「予め決められたルール」として、選択するデータ記憶ノード30の数を限定するルール、距離を限定するルール、選択するデータ記憶ノード30の数と距離両方を限定するルール等の様々なルールを採用することができる。また、ルールに合ったデータ記憶ノード30を選択する際、オブジェクトデータとすべてのデータ記憶ノード30の距離を計算する代わりに、距離を計算するデータ記憶ノード30を限定する方法を用いることもできる。
次に、距離からウェイトを計算する(ステップS2)。距離が近いほど、ウェイトは大きくなる。距離からウェイトを計算する方法として、一例として、距離の逆数をウェイトとする方法を用いることができる。
次に、オブジェクトデータのデータ識別子をシードとして乱数を生成し、ステップS1で選択したデータ記憶ノード30へ割り当てる(ステップS3)。乱数を生成する方法として、シードが同一であれば同一の乱数を発生する疑似乱数生成方法を用いる。ここでは、N番目に発生した乱数を、Nのノード番号を持つデータ記憶ノード30に割り当てる。
次に、データ記憶ノード30に割り当てた乱数に、各データ記憶ノード30のウェイトを掛けて、ウェイト調整後乱数を求める(ステップS4)。
次に、ウェイト調整後乱数の中で最も大きなウェイト調整後乱数を探し、最も大きなウェイト調整後乱数を持つデータ記憶ノード30を選択する(ステップS5)。
アルゴリズムAによると、ウェイトに応じた偏りを持たせた上で、オブジェクトデータを記憶するデータ記憶ノード30を選択できる。すなわち、データ座標が近いオブジェクトデータは、ノード座標が同一または近い限られたデータ記憶ノード30に記憶される。また、同一のオブジェクトデータのデータ識別子およびデータ座標と、データ記憶ノード30のノード座標およびノード番号とが与えられた場合には、つねに、同一のデータ記憶ノード30が選択される。さらに、データ記憶ノード30を追加または削除した場合に、データ記憶ノード30の選択が変更されるオブジェクトデータの数を最小限に抑えることができる。
「アルゴリズムB」
アルゴリズムBは、アルゴリズムAのステップS1と同様である。メタデータに含まれるデータ座標とデータ記憶ノード30のノード座標を「空間」に展開したときのメタデータとデータ記憶ノード30の距離を計算し、メタデータから近い順に「予め決められたルール」でデータ記憶ノード30を選択する。
アルゴリズムBは、アルゴリズムAのステップS1と同様である。メタデータに含まれるデータ座標とデータ記憶ノード30のノード座標を「空間」に展開したときのメタデータとデータ記憶ノード30の距離を計算し、メタデータから近い順に「予め決められたルール」でデータ記憶ノード30を選択する。
「空間」として、一例として、評価軸を直交する軸とする多次元ユークリッド空間を用いることができる。また、「予め決められたルール」として、選択するデータ記憶ノード30の数を限定するルール、距離を限定するルール、選択するデータ記憶ノード30の数と距離両方を限定するルール等の様々なルールを採用することができる。また、ルールにあったデータ記憶ノード30を選択する際、メタデータとすべてのデータ記憶ノード30の距離を計算する代わりに、計算が必要なデータ記憶ノード30を限定する方法を用いることもできる。
「データ記憶ノード30のノード座標の決定方法」
データ記憶ノード30のノード座標は、任意に設定し得る。しかし、オブジェクトデータのデータ座標と、データ記憶ノード30のノード座標を空間に展開した場合に、より多くのオブジェクトデータが存在する空間の近くにより多くのデータ記憶ノード30が存在するときに、各データ記憶ノード30が記憶するオブジェクトデータの数がより均等になる。
データ記憶ノード30のノード座標は、任意に設定し得る。しかし、オブジェクトデータのデータ座標と、データ記憶ノード30のノード座標を空間に展開した場合に、より多くのオブジェクトデータが存在する空間の近くにより多くのデータ記憶ノード30が存在するときに、各データ記憶ノード30が記憶するオブジェクトデータの数がより均等になる。
より多くのオブジェクトデータが存在する空間の近くにより多くのデータ記憶ノード30を配置する方法として、様々な方法を採用することができる。例えば、予めオブジェクトデータが存在するようになる可能性が高い空間の近くに多くのデータ記憶ノード30を配置するようにノード座標を調整するようにしてもよい。また、記憶しているオブジェクトデータの数が少ないデータ記憶ノード30の空間上の位置をより多くのオブジェクトデータが存在する空間上の位置の近くに移動するために、データ記憶ノード30のノード座標を変更するようにしてもよい。さらに、データ記憶ノード30を追加する際、オブジェクトデータが多く存在する空間上の位置の近くにデータ記憶ノード30を追加するようにしてもよい。
II.データを書き込む場合
分散記憶システム40において、データを書き込む場合の動作の詳細について、図面を参照して説明する。
分散記憶システム40において、データを書き込む場合の動作の詳細について、図面を参照して説明する。
「クライアントノード10」
クライアントノード10がデータ識別子およびメタデータを用いてオブジェクトデータを書き込む場合には、メタデータ記憶ノード判定部11は、データ識別子とノード情報記憶部13が記憶しているメタデータ記憶ノード20のノード番号から、該データ識別子に対応するメタデータを記憶することになるメタデータ記憶ノード20を判定する。次に、データ識別子送信部12は、該メタデータ記憶ノード20へオブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を送出する。
クライアントノード10がデータ識別子およびメタデータを用いてオブジェクトデータを書き込む場合には、メタデータ記憶ノード判定部11は、データ識別子とノード情報記憶部13が記憶しているメタデータ記憶ノード20のノード番号から、該データ識別子に対応するメタデータを記憶することになるメタデータ記憶ノード20を判定する。次に、データ識別子送信部12は、該メタデータ記憶ノード20へオブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を送出する。
「メタデータ記憶ノード20」
データ識別子受信部21は、クライアントノード10からオブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を受信する。次に、データ識別子とメタデータをメタデータ記憶部22に記憶する。また、データ識別子とメタデータをノード判定部25へ送出する。ノード判定部25は、データ識別子、メタデータとノード情報記憶部24により記憶しているノード情報から、アルゴリズムAに基づいて、データ識別子、メタデータおよびアクセス命令の送信先のデータ記憶ノード30を選択する。次に、データ識別子送信部26は、選択したデータ記憶ノード30へ、オブジェクトデータ、データ識別子、メタデータおよびアクセス命令を送出する。
データ識別子受信部21は、クライアントノード10からオブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を受信する。次に、データ識別子とメタデータをメタデータ記憶部22に記憶する。また、データ識別子とメタデータをノード判定部25へ送出する。ノード判定部25は、データ識別子、メタデータとノード情報記憶部24により記憶しているノード情報から、アルゴリズムAに基づいて、データ識別子、メタデータおよびアクセス命令の送信先のデータ記憶ノード30を選択する。次に、データ識別子送信部26は、選択したデータ記憶ノード30へ、オブジェクトデータ、データ識別子、メタデータおよびアクセス命令を送出する。
「データ記憶ノード30」
データ識別子受信部31は、オブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を受信する。次に、データ記憶部32は、オブジェクトデータ、データ識別子およびメタデータを記憶する。
データ識別子受信部31は、オブジェクトデータ、データ識別子、メタデータ、および、アクセス命令を受信する。次に、データ記憶部32は、オブジェクトデータ、データ識別子およびメタデータを記憶する。
本実施形態に係る分散記憶システム40によると、任意に設定した評価軸による評価が近いオブジェクトデータを同一または限定したデータ記憶ノード30に記憶することができる。すなわち、オブジェクトデータのデータ座標、データ記憶ノード30のノード座標から、オブジェクトデータを記憶するデータ記憶ノード30を限定することができる。また、オブジェクトデータのメタデータを記憶するメタデータ記憶ノード20を、データ識別子とデータ記憶ノード30のノード番号から特定することができる。さらに、オブジェクトデータを記憶しているデータ記憶ノード30を、データ識別子、オブジェクトデータのデータ座標、データ記憶ノード30のノード座標およびノード番号から特定することができる。すなわち、オブジェクトデータのデータ識別子から、効率よくオブジェクトデータを記憶するデータ記憶ノード30を特定することができる。
また、ノード座標を調整することにより、オブジェクトデータをデータ記憶ノード30にほぼ均等に分布させることもできる。したがって、本実施形態によると、複数ノードを集中的に管理および制御する特定ノードを用いない分散処理環境において、識別子を元にしたデータへの直接アクセスおよびデータの評価による範囲指定による範囲アクセスのいずれも効率よく実現することができ、データの性質に応じてデータを一部のノードに偏らせつつ、すべてのノードにほぼ均等にデータを分散させることができる。
なお、本実施形態では、説明の便宜上、クライアントノード10によるメタデータ記憶ノード20の選択、および、選択されたメタデータ記憶ノード20によるデータ記憶ノード30の選択において、いずれの場合にも1つのノードを選択するものとした。しかし、選択するノードの数は1つに制限されない。例えば、メタデータ記憶ノード20またはデータ記憶ノード30がミラー構成を採用する場合には、上述の分散記憶システム40において、ミラー構成を採る複数のノードを選択するようにしてもよい。この場合には、選択されたミラー構成を採る複数のノードのうちのいずれのノードが今回の動作時点におけるプライマリーノードであるかを判断するための情報を、ノード間において共有するようにすればよい。
<実施形態2>
第1の実施形態の変形例として、第2の実施形態に係る分散記憶システムについて、図面を参照して説明する。
第1の実施形態の変形例として、第2の実施形態に係る分散記憶システムについて、図面を参照して説明する。
図6は、本実施形態に係る分散記憶システム60の構成を示すブロック図である。図6を参照すると、分散記憶システム60は、複数のデータ記憶ノード50を備えている。データ記憶ノード50は、データ識別子受信部51、データ判定部52、データ記憶部53、データ送信部54、メタデータ受信部55、および、メタデータ判定部56を備えている。
データ記憶ノード50は、データ識別子受信部51を介して、クライアントノード(非図示)またはデータ記憶ノード50からデータ識別子を持ったアクセス命令を受け取ると、以下の動作を行う。
データ識別子に対応するオブジェクトデータとメタデータを持つ場合には、データ判定部52は、データ識別子に対応するオブジェクトデータとメタデータをデータ記憶部53から読み込み、データ送信部54を介して、オブジェクトデータ、データ識別子およびメタデータを、アクセス命令を出したクライアントノード(非図示)へ返す。
データ識別子に対応するメタデータを持つ場合には、データ判定部52は、データ識別子に対応するメタデータをデータ記憶部53から読み込み、該データ識別子と該メタデータに対応するオブジェクトデータを持つデータ記憶ノード50を判定し、データ送信部54を介して、データ識別子およびアクセス命令を該データ記憶ノード50へ転送する。データ判定部52は、該データ識別子と該メタデータに対応するオブジェクトデータを持つデータ記憶ノード50を判定する際、第1の実施形態におけるノード判定部25が用いるアルゴリズムAを使用する。
一方、データ識別子に対応するメタデータを持っていない場合には、データ判定部52は、データ識別子に対応するメタデータを持つデータ記憶ノード50を判定し、データ送信部54を介して、データ識別子およびアクセス命令を該データ記憶ノード50へ転送する。データ判定部52は、該データ識別子に対応するメタデータを持つデータ記憶ノード50を判定する際、第1の実施形態におけるメタデータ記憶ノード判定部11で用いた処理と同様に、多様な処理を採用することができる。
データ記憶ノード50は、メタデータ受信部55を介して、クライアントノード(非図示)からメタデータのみを持ったアクセス命令を受け取ると、以下の動作を行う。
メタデータ判定部56は、クライアントノード(非図示)から受信したメタデータに対応するオブジェクトデータを持つ可能性があるデータ記憶ノード50を選択し、選択したデータ記憶ノード50へメタデータおよびアクセス命令を送出する。メタデータ判定部56は、オブジェクトデータを持つ可能性があるデータ記憶ノード50を選択する際、アルゴリズムBを用いる。このとき、複数のデータ記憶ノード50が選択され得る。
データ記憶ノード50は、メタデータ受信部55を介して、他のデータ記憶ノード50からメタデータのみを持ったアクセス命令を受け取ると、以下の動作を行う。
メタデータ判定部56は、データ記憶部53から受信したメタデータに対応するオブジェクトデータとデータ識別子を読み込み、データ送信部54を介して、オブジェクトデータ、データ識別子およびメタデータを、アクセス命令を送ったクライアントノード(非図示)へ返す。また、データ記憶ノード50は、メタデータに対応するオブジェクトデータを記憶していない場合には、クライアントノード(非図示)へ、オブジェクトデータを持っていないことを返すようにしてもよいし、何らの情報も返さないようにしてもよい。さらに、データ記憶ノード50がメタデータに対応するオブジェクトデータを複数記憶している場合には、クライアントノード(非図示)へ複数のオブジェクトデータを返す。
本実施形態に係る分散記憶システム60によると、任意に設定した評価軸による評価が近いオブジェクトデータを同一または限定したデータ記憶ノード50に記憶することができる。すなわち、オブジェクトデータのデータ座標、データ記憶ノード50のノード座標から、オブジェクトデータを記憶するデータ記憶ノード50を限定することができる。また、オブジェクトデータのメタデータを記憶するデータ記憶ノード50を、データ識別子から特定することができる。さらに、オブジェクトデータを記憶しているデータ記憶ノード50を、オブジェクトデータのデータ識別子およびデータ座標、ならびに、データ記憶ノード50のノード座標およびノード番号から特定することができる。すなわち、オブジェクトデータのデータ識別子から、効率よくオブジェクトデータを記憶するデータ記憶ノード50を特定することができる。
また、ノード座標を調整することにより、オブジェクトデータのデータ記憶ノード50への分布を均等に近づけることができる。したがって、本実施形態によると、複数ノードを集中的に管理および制御する特定ノードを用いない分散処理環境において、データの識別子を元にしたデータへの直接アクセスおよびデータの評価による範囲指定による範囲アクセスのいずれも効率よく実現することができ、データの性質に応じてデータを一部のノードに偏らせつつ、すべてのノードにほぼ均等にデータを分散させることができる。
第1の実施形態に係る分散記憶システム40を、具体的な実施例に即して説明する。本実施例では、分散記憶システム40を、多数の人名を身長および体重情報を元に分散して記憶する場合に適用する。
本実施例に係る分散記憶システム40は、クライアントノード10からアクセスする分散記憶システムである。多数の人を対象として、人名をオブジェクトデータとして記憶する。また、データ識別子として人の管理番号を使用し、メタデータのデータ座標として、身長および体重をそれぞれ評価した数値を使用する。メタデータ記憶ノード20は、データ識別子を元に分散してデータ識別子およびメタデータを記憶する。また、データ記憶ノード30は、メタデータを元に偏よらせつつ、オブジェクトデータ、データ識別子およびメタデータを分散記憶する。
まず、人の管理番号を元に、人名を得る方法について説明する。
クライアントノード10のメタデータ記憶ノード判定部11は、アクセスする人の管理番号に対応する身長および体重をそれぞれ評価した数値の組み合わせを記憶しているメタデータ記憶ノード20を判定する。次に、データ識別子送信部12は、該メタデータ記憶ノード20へ人の管理番号とアクセス命令を送出する。
メタデータ記憶ノード20のデータ識別子受信部21は、人の管理番号およびアクセス命令を受信する。次に、メタデータ判定部23は、メタデータ記憶部22に記録されている人の管理番号と身長および体重をそれぞれ評価した数値の組み合わせから、受信した人の管理番号に対応する、身長および体重をそれぞれ評価した数値の組み合わせを取得する。次に、ノード判定部25は、人の管理番号、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、ノード情報記憶部24に記録されているノード座標およびノード番号から、人名を記憶しているデータ記憶ノード30を判定する。次に、データ識別子送信部26は、人名を記憶していると判定されたデータ記憶ノード30へ管理番号およびアクセス命令を送出する。
データ記憶ノード30のデータ識別子受信部31は、管理番号を受信する。次に、データ判定部33は、受信した管理番号に対応する、データ記憶部32で記憶している管理番号、身長および体重をそれぞれ評価した数値との組み合わせ、ならびに、人名を取得する。次に、データ送信部34は、管理番号、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、人名をクライアントへ送信する。
次に、身長および体重をそれぞれ評価した数値の組み合わせを元に、人名を取得する方法について説明する。
クライアントノード10のデータ記憶ノード判定部14は、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、ノード情報記憶部13が記憶しているノード座標から、該身長および体重をそれぞれ評価した数値の組み合わせに対応する人名を保存しているデータ記憶ノード30の候補を取得する。次に、メタデータ送信部15は、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、アクセス命令を該データ記憶ノード30へ送出する。
データ記憶ノード30のメタデータ受信部35は、身長および体重をそれぞれ評価した数値の組み合わせとアクセス命令を受信する。次に、メタデータ判定部36は、受信した身長および体重をそれぞれ評価した数値の組み合わせに対応する、データ記憶部32に記録された管理番号、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、人名を取得する。次に、データ送信部34は、管理番号、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、人名をクライアントへ送信する。
本実施例において、クライアントノード10は、アクセスしたい人の管理番号を用いることにより、該管理番号に対応する身長および体重をそれぞれ評価した数値の組み合わせを記憶していているメタデータ記憶ノード20へダイレクトにアクセスすることができる。また、メタデータ記憶ノード20は、アクセスしたい人の管理番号、ならびに、該管理番号に対応する身長および体重をそれぞれ評価した数値の組み合わせを用いることにより該管理番号に対応する人名を記憶しているデータ記憶ノード30へダイレクトにアクセスすることができる。さらに、クライアントノード10は、アクセスしたい身長および体重をそれぞれ評価した数値の組み合わせを用いることにより、該身長および体重をそれぞれ評価した数値の組み合わせに対応する管理番号と人名を記憶している可能性があるデータ記憶ノード30を限定することができ、該データ記憶ノード30へダイレクトにアクセスすることができる。
また、ノード座標を適切に調整することにより、各データ記憶ノード30が記憶する管理番号、身長および体重をそれぞれ評価した数値の組み合わせ、ならびに、人名の個数の分布を均等に近づけることができる。
(ハードウェア構成例)
第1の実施形態に係る分散記憶システム40、および、第2の実施形態に係る分散記憶システム60の各部は、ソフトウェアプログラムのモジュールとして実現し得る。図7を参照して、この場合におけるハードウェア構成について説明する。
第1の実施形態に係る分散記憶システム40、および、第2の実施形態に係る分散記憶システム60の各部は、ソフトウェアプログラムのモジュールとして実現し得る。図7を参照して、この場合におけるハードウェア構成について説明する。
図7は、分散記憶システム40、60、または、分散記憶システムを構成するノードを実現するハードウェアの構成を一例として示すブロック図である。すなわち、図7は、図2、図3および図4に示した分散記憶システム40、または、図6に示した分散記憶システム60の全部または一部のノードを実現するコンピュータの構成を示す。図7に示すハードウェア構成により、分散記憶システム40および分散記憶システム60の各部の機能を実現し得る。
図7を参照すると、ハードウェアは、CPU(Central Processing Unit)91、ROM(Read Only Memory)92、RAM(Random Access Memory)93、ハードディスクドライブ(HDD:Hard Disk Drive)94、および、外部装置との通信インタフェース(I/F:Interface)95を備え、これらはバス(通信線)96を介して接続されている。ここで、図7に示したハードウェアがデータ記憶ノード(ストレージ)30の場合には、HDD94自体が上述の実施形態および実施例におけるデータ記憶ノード30として機能するようにしてもよい。
また、上述の実施形態および実施例は、ブロック図(図2ないし図4)またはフローチャート(図5)の機能を実現可能なコンピュータプログラムを図7のハードウェアに供給した後、そのコンピュータプログラムを当該ハードウェアのCPU91に読み出して実行することによって達成するようにしてもよい。このとき、供給されたコンピュータプログラムは、読み書き可能なRAM93またはHDD94等の記憶デバイスに格納するようにしてもよい。
また、上記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法として、CD−ROM等の各種記録媒体を介して当該装置内にインストールする方法を採用してもよい。また、インターネット等の通信回線を介して外部よりダウンロードする方法を採用してもよい。さらに、このような場合には、本発明は、コンピュータプログラムのコード自体、または、これを記録した記憶媒体として提供することもできる。
また、上述の実施形態および実施例では、オブジェクトデータの分散配置に関して、本発明を適応する場合について説明した。しかし、オブジェクトデータのみならず、プログラム等のアルゴリズムの分散実行、または、物理的な実体を持つオブジェクトの分散配置などにも、本発明を適用することができる。
本発明によると、複数ノードを集中的に管理および制御する特定ノードを用いない分散記憶環境において、分散記憶を効率よく実現することができる。本発明に係る分散記憶システムは、複数のデータ記憶ノードを備える。このシステムにおいて、前記データ記憶ノードは、接続されている前記複数のデータ記憶ノードの接続情報と、オブジェクトデータの識別子とメタデータに基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、選択した特定のデータ記憶ノードに該オブジェクトデータを記憶する。このとき、該オブジェクトデータのメタデータを元に、前記複数のデータ記憶ノードの中から該オブジェクトデータを記憶する可能性があるデータ記憶ノードを限定することができる。
また、本発明に係る分散記憶システムは、クライアントノードと、該クライアントノードに接続された複数のデータ記憶ノードとを備えた分散記憶システムである。
ここで、前記クライアントノードは、データ記憶ノードに、オブジェクトデータの識別子または該オブジェクトデータのデータの性質を表す複数の数値化された指標(メタデータ)を持つアクセス命令を送信する手段を有し、
前記データ記憶ノードは、該アクセス命令が持つ、オブジェクトデータの識別子と、該オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
該アクセス命令が持つ、オブジェクトデータの識別子と、接続されている前記複数のデータ記憶ノードの接続情報に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
該アクセス命令が持つ、オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から限定したデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
前記データ記憶ノードが記憶するオブジェクトデータを読み込み、前記クライアントノードに送信する手段と、を有し、
前記データ記憶ノードが記憶するオブジェクトデータを変更することができ、
前記データ記憶ノードに設定された前記複数の数値化された指標を予め調整するもしくは変更することにより、前記データ記憶ノードが記憶するオブジェクトデータを変更するようにしてもよい。
前記データ記憶ノードは、該アクセス命令が持つ、オブジェクトデータの識別子と、該オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
該アクセス命令が持つ、オブジェクトデータの識別子と、接続されている前記複数のデータ記憶ノードの接続情報に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
該アクセス命令が持つ、オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から限定したデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
前記データ記憶ノードが記憶するオブジェクトデータを読み込み、前記クライアントノードに送信する手段と、を有し、
前記データ記憶ノードが記憶するオブジェクトデータを変更することができ、
前記データ記憶ノードに設定された前記複数の数値化された指標を予め調整するもしくは変更することにより、前記データ記憶ノードが記憶するオブジェクトデータを変更するようにしてもよい。
また、前記クライアントノードは、オブジェクトデータの識別子と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択する手段と、
該データ記憶ノードに、オブジェクトデータの識別子を持つアクセス命令を送信する手段と、
オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から限定したデータ記憶ノードを選択する手段と、
該データ記憶ノードに、オブジェクトデータの識別子を持つアクセス命令を送信する手段と、を有し、
前記データ記憶ノードは、該アクセス命令が持つ、オブジェクトデータの識別子と、それに対応するデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
前記データ記憶ノードが記憶するオブジェクトデータを読み込み、前記クライアントノードに送信する手段と、を有し、
データ記憶ノードが記憶するオブジェクトデータを変更することができ、
前記データ記憶ノードに設定された前記複数の数値化された指標を予め調整または変更することにより、前記データ記憶ノードが記憶するオブジェクトデータを変更するようにしてもよい。
該データ記憶ノードに、オブジェクトデータの識別子を持つアクセス命令を送信する手段と、
オブジェクトデータのデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から限定したデータ記憶ノードを選択する手段と、
該データ記憶ノードに、オブジェクトデータの識別子を持つアクセス命令を送信する手段と、を有し、
前記データ記憶ノードは、該アクセス命令が持つ、オブジェクトデータの識別子と、それに対応するデータの性質を表す複数の数値化された指標と、接続されている前記複数のデータ記憶ノードの接続情報と、該データ記憶ノードに設定された前記複数の数値化された指標に基づいて、前記複数のデータ記憶ノードの中から特定のデータ記憶ノードを選択し、該データ記憶ノードに前記アクセス命令を転送する手段と、
前記データ記憶ノードが記憶するオブジェクトデータを読み込み、前記クライアントノードに送信する手段と、を有し、
データ記憶ノードが記憶するオブジェクトデータを変更することができ、
前記データ記憶ノードに設定された前記複数の数値化された指標を予め調整または変更することにより、前記データ記憶ノードが記憶するオブジェクトデータを変更するようにしてもよい。
また、上記の各構成の分散記憶システムに対応する分散処理方法によっても、本発明の効果を奏することができる。さらに、上記の各構成を有する分散記憶システム、並びに対応する装置を、コンピュータによって実現するコンピュータプログラム、および、そのコンピュータプログラムが格納されているコンピュータ読み取り可能な記憶媒体によっても、本発明の効果を奏することができる。
本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素の多様な組み合わせないし選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
なお、上記実施形態の一部又は全部は、以下の付記として記載することができるものであるが、これらに限定されるものではない。
(付記1)複数のデータ記憶ノードを備える分散記憶システムであって、
複数の指標によって特徴付けられるオブジェクトデータがあり、
前記オブジェクトデータの識別子と複数の前記データ記憶ノードの固有の番号などの識別子と重み付け情報から一意に前記オブジェクトデータを記憶する前記データ記憶ノードを決定するアルゴリズムがあるとき、
前記オブジェクトデータの各指標の値と前記データ記憶ノードの情報から前記データ記憶ノードの重み付けを算出し、
前記オブジェクトデータの識別子と前記データ記憶ノードの識別子と前記データ記憶ノードの重み付けから、前記アルゴリズムを用いて一意に前記オブジェクトデータの前記データ記憶ノードを決定することを特徴とする分散記憶システム。
複数の指標によって特徴付けられるオブジェクトデータがあり、
前記オブジェクトデータの識別子と複数の前記データ記憶ノードの固有の番号などの識別子と重み付け情報から一意に前記オブジェクトデータを記憶する前記データ記憶ノードを決定するアルゴリズムがあるとき、
前記オブジェクトデータの各指標の値と前記データ記憶ノードの情報から前記データ記憶ノードの重み付けを算出し、
前記オブジェクトデータの識別子と前記データ記憶ノードの識別子と前記データ記憶ノードの重み付けから、前記アルゴリズムを用いて一意に前記オブジェクトデータの前記データ記憶ノードを決定することを特徴とする分散記憶システム。
(付記2)前記アルゴリズムは、前記オブジェクトデータの各指標の値と前記データ記憶ノードの情報から選択する可能性がある前記データ記憶ノードを限定することを特徴とする、付記1に記載の分散記憶システム。
(付記3)前記データ記憶ノードの情報は、前記オブジェクトデータの各指標と1対1で対応する数値であることを特徴とする、付記1または2に記載の分散記憶システム。
(付記4)前記データ記憶ノードの情報は、前記オブジェクトデータの各指標の数値の分布に応じて変化することを特徴とする、付記3に記載の分散記憶システム。
(付記5)前記データ記憶ノードの重み付けは、前記オブジェクトデータの各指標および前記オブジェクトデータの各指標と1対1で対応する前記データ記憶ノードの情報を座標軸とする空間上に、前記オブジェクトデータの各指標の値および前記データ記憶ノードのオブジェクトデータの各指標と1対1で対応する値を空間上の位置として、前記オブジェクトデータおよび前記データ記憶ノードを配置したときの、前記オブジェクトデータと前記データ記憶ノードとの空間的な距離であることを特徴とする、付記3または4に記載の分散記憶システム。
(付記6)前記オブジェクトデータの各指標および前記オブジェクトデータの各指標と1対1で対応するデータ記憶ノードの情報を座標軸とする空間は、座標軸が直交するユークリッド空間であることを特徴とする、付記5に記載の分散記憶システム。
(付記7)前記アルゴリズムは、
重み付けと固有の番号を有するデータ記憶ノードと、識別子を有するオブジェクトデータとがある場合に、
前記オブジェクトデータの識別子をシードとする疑似乱数発生関数によって疑似乱数を発生し、
前記データ記憶ノードの固有の番号と同じ順番に発生した前記乱数を前記データ記憶ノードの乱数とし、
前記データ記憶ノードの乱数に前記重み付けを掛けた値を前記データ記憶ノードの重み付き乱数とし、
前記データ記憶ノードの重み付き乱数が最も大きい前記データ記憶ノードを、前記オブジェクトデータを記憶するノードとすることを特徴とする、付記1ないし6のいずれか1に記載の分散記憶システム。
重み付けと固有の番号を有するデータ記憶ノードと、識別子を有するオブジェクトデータとがある場合に、
前記オブジェクトデータの識別子をシードとする疑似乱数発生関数によって疑似乱数を発生し、
前記データ記憶ノードの固有の番号と同じ順番に発生した前記乱数を前記データ記憶ノードの乱数とし、
前記データ記憶ノードの乱数に前記重み付けを掛けた値を前記データ記憶ノードの重み付き乱数とし、
前記データ記憶ノードの重み付き乱数が最も大きい前記データ記憶ノードを、前記オブジェクトデータを記憶するノードとすることを特徴とする、付記1ないし6のいずれか1に記載の分散記憶システム。
(付記8)複数のアルゴリズム実行手段を備える分散実行システムであって、
複数の指標によって特徴付けられるアルゴリズムがあり、
前記アルゴリズムの識別子と複数の前記アルゴリズム実行手段の固有の番号などの識別子と重み付け情報から一意に前記アルゴリズムを実行する前記アルゴリズム実行手段を決定する実行手段決定アルゴリズムがあるとき、
前記アルゴリズムの各指標の値と前記アルゴリズム実行手段の情報から前記アルゴリズム実行手段の重み付けを算出し、
前記アルゴリズムの識別子と前記アルゴリズム実行手段の識別子と前記アルゴリズム実行手段の重み付けから前記実行手段決定アルゴリズムを用い一意に前記アルゴリズムを実行する前記アルゴリズム実行手段を決定する、ことを特徴とするアルゴリズム実行手段決定方法。
複数の指標によって特徴付けられるアルゴリズムがあり、
前記アルゴリズムの識別子と複数の前記アルゴリズム実行手段の固有の番号などの識別子と重み付け情報から一意に前記アルゴリズムを実行する前記アルゴリズム実行手段を決定する実行手段決定アルゴリズムがあるとき、
前記アルゴリズムの各指標の値と前記アルゴリズム実行手段の情報から前記アルゴリズム実行手段の重み付けを算出し、
前記アルゴリズムの識別子と前記アルゴリズム実行手段の識別子と前記アルゴリズム実行手段の重み付けから前記実行手段決定アルゴリズムを用い一意に前記アルゴリズムを実行する前記アルゴリズム実行手段を決定する、ことを特徴とするアルゴリズム実行手段決定方法。
(付記9)複数の物理的な実体を持つデータ記憶ノードを備える分散保管システムであって、
複数の指標によって特徴付けられる物理的な実体を持つオブジェクトがあり、
前記物理的な実体を持つオブジェクトの識別子と複数の物理的な実体を持つデータ記憶ノードの固有の番号などの識別子と重み付け情報から一意に前記物理的な実体を持つオブジェクトを保管する前記物理的な実体を持つデータ記憶ノードを決定するアルゴリズムがあるとき、
前記物理的な実体を持つオブジェクトの各指標の値と前記物理的な実体を持つデータ記憶ノードの情報から前記物理的な実体を持つデータ記憶ノードの重み付けを算出し、
前記物理的な実体を持つオブジェクトの識別子と前記物理的な実体を持つデータ記憶ノードの識別子と前記物理的な実体を持つデータ記憶ノードの重み付けから前記アルゴリズムを用い一意に前記物理的な実体を持つオブジェクトの前記物理的な実体を持つデータ記憶ノードを決定することを特徴とする、物理的な実体を持つデータ記憶ノード決定方法。
複数の指標によって特徴付けられる物理的な実体を持つオブジェクトがあり、
前記物理的な実体を持つオブジェクトの識別子と複数の物理的な実体を持つデータ記憶ノードの固有の番号などの識別子と重み付け情報から一意に前記物理的な実体を持つオブジェクトを保管する前記物理的な実体を持つデータ記憶ノードを決定するアルゴリズムがあるとき、
前記物理的な実体を持つオブジェクトの各指標の値と前記物理的な実体を持つデータ記憶ノードの情報から前記物理的な実体を持つデータ記憶ノードの重み付けを算出し、
前記物理的な実体を持つオブジェクトの識別子と前記物理的な実体を持つデータ記憶ノードの識別子と前記物理的な実体を持つデータ記憶ノードの重み付けから前記アルゴリズムを用い一意に前記物理的な実体を持つオブジェクトの前記物理的な実体を持つデータ記憶ノードを決定することを特徴とする、物理的な実体を持つデータ記憶ノード決定方法。
10 クライアントノード
11 メタデータ記憶ノード判定部
12 データ識別子送信部
13 ノード情報記憶部
14 データ記憶ノード判定部
15 メタデータ送信部
16 データ受信部
20 メタデータ記憶ノード
21 データ識別子受信部
22 メタデータ記憶部
23 メタデータ判定部
24 ノード情報記憶部
25 ノード判定部
26 データ識別子送信部
30 データ記憶ノード
31 データ識別子受信部
32 データ記憶部
33 データ判定部
34 データ送信部
35 メタデータ受信部
36 メタデータ判定部
40 分散記憶システム
50 データ記憶ノード
51 データ識別子受信部
52 データ判定部
53 データ記憶部
54 データ送信部
55 メタデータ受信部
56 メタデータ判定部
60 分散記憶システム
70 分散記憶システム
71a〜71c データ記憶ノード
72 クライアントノード
90 ノード
91 CPU(Central Processing Unit)
92 ROM(Read Only Memory)
93 RAM(Random Access Memory)
94 ハードディスクドライブ(HDD:Hard Disk Drive)
95 通信インタフェース(I/F:Interface)
96 バス
100 分散記憶システム
101 記憶ノード
110 クライアントノード
111 記憶テーブル
11 メタデータ記憶ノード判定部
12 データ識別子送信部
13 ノード情報記憶部
14 データ記憶ノード判定部
15 メタデータ送信部
16 データ受信部
20 メタデータ記憶ノード
21 データ識別子受信部
22 メタデータ記憶部
23 メタデータ判定部
24 ノード情報記憶部
25 ノード判定部
26 データ識別子送信部
30 データ記憶ノード
31 データ識別子受信部
32 データ記憶部
33 データ判定部
34 データ送信部
35 メタデータ受信部
36 メタデータ判定部
40 分散記憶システム
50 データ記憶ノード
51 データ識別子受信部
52 データ判定部
53 データ記憶部
54 データ送信部
55 メタデータ受信部
56 メタデータ判定部
60 分散記憶システム
70 分散記憶システム
71a〜71c データ記憶ノード
72 クライアントノード
90 ノード
91 CPU(Central Processing Unit)
92 ROM(Read Only Memory)
93 RAM(Random Access Memory)
94 ハードディスクドライブ(HDD:Hard Disk Drive)
95 通信インタフェース(I/F:Interface)
96 バス
100 分散記憶システム
101 記憶ノード
110 クライアントノード
111 記憶テーブル
Claims (17)
- 複数のオブジェクトデータを分散して記憶する複数のデータ記憶ノードを備え、
前記複数のオブジェクトデータは、それぞれ、データ座標によって特徴付けられるとともにデータ識別子によって一意に識別され、
前記複数のデータ記憶ノードは、それぞれ、前記データ座標と同一の空間におけるノード座標を割り当てられ、
前記複数のオブジェクトデータは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択した後、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに、それぞれ記憶されることを特徴とする分散記憶システム。 - 前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であることを特徴とする、請求項1に記載の分散記憶システム。
- オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択することを特徴とする、請求項1または2に記載の分散記憶システム。
- オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択することを特徴とする、請求項1ないし3のいずれか1項に記載の分散記憶システム。
- オブジェクトデータを識別するデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てるとともに、該オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出し、抽出したデータ記憶ノードを該オブジェクトデータを格納すべきデータ記憶ノードとして決定することを特徴とする、請求項1ないし4のいずれか1項に記載の分散記憶システム。
- 前記ウェイトは、前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標と、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離が短くなるに従って増大することを特徴とする、請求項5に記載の分散記憶システム。
- 前記複数のデータ記憶ノードは、それぞれ、前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じてノード座標が割り当てられていることを特徴とする、請求項1ないし6のいずれか1項に記載の分散記憶システム。
- 前記複数のデータ記憶ノードにオブジェクトデータを書き込むとともに、前記複数のデータ記憶ノードに記憶されたオブジェクトデータを読み出すクライアントノードをさらに備えていることを特徴とする、請求項1ないし7のいずれか1項に記載の分散記憶システム。
- 前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータのデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを書き込むことを特徴とする、請求項8に記載の分散記憶システム。
- 前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、選択した複数の第1のデータ記憶ノードに対して該オブジェクトデータの読み出し命令を送出することを特徴とする、請求項8または9に記載の分散記憶システム。
- 前記クライアントノードは、オブジェクトデータを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択するとともに、該複数の第1のデータ記憶ノードの中から該オブジェクトデータを識別するデータ識別子に基づいて決定したデータ記憶ノードに対して、該オブジェクトデータの読み出し命令を送出することを特徴とする、請求項8または9に記載の分散記憶システム。
- データ座標によって特徴付けられるとともにデータ識別子によって一意に識別される複数のオブジェクトデータを分散して記憶する分散記憶方法であって、
前記データ座標と同一の空間におけるノード座標を複数のデータ記憶ノードのそれぞれに割り当てる工程と、
前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標からの距離が相対的に短いノード座標を割り当てられたデータ記憶ノードを、前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程と、
前記複数の第1のデータ記憶ノードの中から前記複数のオブジェクトデータのそれぞれを識別するデータ識別子に基づいて決定したデータ記憶ノードに、該オブジェクトデータを記憶させる工程と、を含むことを特徴とする分散記憶方法。 - 前記複数のオブジェクトデータのそれぞれを特徴付けるデータ座標、および、前記複数のデータ記憶ノードのそれぞれに割り当てられたノード座標は、前記複数のオブジェクトデータを定量的に評価する複数の評価軸を座標軸とするユークリッド空間における座標であることを特徴とする、請求項12に記載の分散記憶方法。
- オブジェクトデータからの距離が所定の距離以内のノード座標を割り当てられたデータ記憶ノードを前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして複数選択する工程を含むことを特徴とする、請求項12または13に記載の分散記憶方法。
- オブジェクトデータからの距離が短いノード座標を割り当てられたデータ記憶ノードを該距離の短いものから順に所定の数だけ前記複数のデータ記憶ノードの中から第1のデータ記憶ノードとして選択する工程を含むことを特徴とする、請求項12ないし14のいずれか1項に記載の分散記憶方法。
- オブジェクトデータのデータ識別子をシードとして生成した複数の擬似乱数を前記複数の第1のデータ記憶ノードのそれぞれに割り当てる工程と、
前記オブジェクトデータのデータ座標と前記複数の第1のデータ記憶ノードのそれぞれに割り当てられたノード座標との距離に応じて算出されたウェイトに、割り当てられた擬似乱数を掛け合わせた値が最大のデータ記憶ノードを前記複数の第1のデータ記憶ノードの中から抽出する工程と、
抽出したデータ記憶ノードを、前記オブジェクトデータを格納すべきデータ記憶ノードとして決定する工程と、を含むことを特徴とする、請求項12ないし15のいずれか1項に記載の分散記憶方法。 - 前記複数のオブジェクトデータを特徴付けるデータ座標の分布に応じて、前記複数のデータ記憶ノードのそれぞれにノード座標を割り当てる工程を含むことを特徴とする、請求項12ないし16のいずれか1項に記載の分散記憶方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011058340 | 2011-03-16 | ||
JP2011058340 | 2011-03-16 | ||
PCT/JP2011/063842 WO2012124178A1 (ja) | 2011-03-16 | 2011-06-16 | 分散記憶システムおよび分散記憶方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012124178A1 JPWO2012124178A1 (ja) | 2014-07-17 |
JP5943430B2 true JP5943430B2 (ja) | 2016-07-05 |
Family
ID=46830282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013504500A Active JP5943430B2 (ja) | 2011-03-16 | 2011-06-16 | 分散記憶システムおよび分散記憶方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9317221B2 (ja) |
JP (1) | JP5943430B2 (ja) |
WO (1) | WO2012124178A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108528215A (zh) * | 2017-03-03 | 2018-09-14 | 现代自动车株式会社 | 车辆以及车辆的控制方法 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11868498B1 (en) * | 2009-04-20 | 2024-01-09 | Pure Storage, Inc. | Storage integrity processing in a storage network |
JP5681558B2 (ja) * | 2011-05-10 | 2015-03-11 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | データの保存を制御する装置及び方法 |
WO2013132779A1 (ja) * | 2012-03-09 | 2013-09-12 | 日本電気株式会社 | オブジェクト配置装置及び方法、コンピュータ・プログラム |
US9454573B1 (en) | 2013-02-25 | 2016-09-27 | Emc Corporation | Parallel processing database system with a shared metadata store |
US9361480B2 (en) * | 2014-03-26 | 2016-06-07 | Alcatel Lucent | Anonymization of streaming data |
JP6508208B2 (ja) * | 2014-07-11 | 2019-05-08 | 日本電気株式会社 | 配置装置、配置方法及び配置プログラム |
US11188665B2 (en) | 2015-02-27 | 2021-11-30 | Pure Storage, Inc. | Using internal sensors to detect adverse interference and take defensive actions |
US10275185B2 (en) * | 2015-02-27 | 2019-04-30 | International Business Machines Corporation | Fail-in-place supported via decentralized or Distributed Agreement Protocol (DAP) |
WO2018235132A1 (en) * | 2017-06-19 | 2018-12-27 | Hitachi, Ltd. | DISTRIBUTED STORAGE SYSTEM |
US10067719B1 (en) * | 2017-08-30 | 2018-09-04 | Xanadu Big Data, Llc | Methods and systems for storing and accessing data in a distributed data storage system |
WO2019130926A1 (ja) * | 2017-12-25 | 2019-07-04 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
US10942909B2 (en) * | 2018-09-25 | 2021-03-09 | Salesforce.Com, Inc. | Efficient production and consumption for data changes in a database under high concurrency |
US11451627B2 (en) * | 2020-04-03 | 2022-09-20 | Open Text Holdings, Inc. | System and method for content management with intelligent data store access across distributed stores |
CN115629717B (zh) * | 2022-12-08 | 2023-03-21 | 四川汉唐云分布式存储技术有限公司 | 一种基于分布式存储的负载均衡方法和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092198A (ja) * | 2000-09-20 | 2002-03-29 | Casio Comput Co Ltd | 地域情報提供装置、及び記憶媒体 |
JP2005235171A (ja) * | 2003-12-09 | 2005-09-02 | Emc Corp | 時間的に近接して記憶システムに書き込まれたデータユニットを示すコンテンツアドレスの生成方法およびその装置 |
JP2006350470A (ja) * | 2005-06-13 | 2006-12-28 | National Institute Of Advanced Industrial & Technology | データ管理装置および方法 |
JP2007293619A (ja) * | 2006-04-25 | 2007-11-08 | Canon Software Inc | サーバ装置および情報共有システムおよびプログラムおよび記録媒体 |
WO2007145069A1 (ja) * | 2006-06-15 | 2007-12-21 | Sony Corporation | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6438705B1 (en) * | 1999-01-29 | 2002-08-20 | International Business Machines Corporation | Method and apparatus for building and managing multi-clustered computer systems |
US6438562B1 (en) * | 1999-08-24 | 2002-08-20 | Oracle Corporation | Parallel index maintenance |
US6990080B2 (en) * | 2000-08-07 | 2006-01-24 | Microsoft Corporation | Distributed topology control for wireless multi-hop sensor networks |
US8100940B2 (en) | 2002-09-30 | 2012-01-24 | Quill Medical, Inc. | Barb configurations for barbed sutures |
US7953858B2 (en) * | 2003-01-17 | 2011-05-31 | Hewlett-Packard Development Company, L.P. | Method and apparatus for mapping peers to an overlay network |
GB0328888D0 (en) * | 2003-12-12 | 2004-01-14 | British Telecomm | Distributed computer system |
US7418454B2 (en) * | 2004-04-16 | 2008-08-26 | Microsoft Corporation | Data overlay, self-organized metadata overlay, and application level multicasting |
US7778183B2 (en) * | 2006-03-31 | 2010-08-17 | International Business Machines Corporation | Data replica selector |
US7752311B2 (en) * | 2007-03-02 | 2010-07-06 | Cisco Technology, Inc. | Gracefully changing a node in a distributed computing network |
JP5136649B2 (ja) * | 2008-09-29 | 2013-02-06 | 日本電気株式会社 | 距離メトリック推定システム、座標算出ノード、距離メトリック推定方法及びプログラム |
US8595233B2 (en) * | 2009-04-27 | 2013-11-26 | Panasonic Corporation | Data processing apparatus, data processing method, program, and integrated circuit |
-
2011
- 2011-06-16 WO PCT/JP2011/063842 patent/WO2012124178A1/ja active Application Filing
- 2011-06-16 US US14/005,435 patent/US9317221B2/en active Active
- 2011-06-16 JP JP2013504500A patent/JP5943430B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002092198A (ja) * | 2000-09-20 | 2002-03-29 | Casio Comput Co Ltd | 地域情報提供装置、及び記憶媒体 |
JP2005235171A (ja) * | 2003-12-09 | 2005-09-02 | Emc Corp | 時間的に近接して記憶システムに書き込まれたデータユニットを示すコンテンツアドレスの生成方法およびその装置 |
JP2006350470A (ja) * | 2005-06-13 | 2006-12-28 | National Institute Of Advanced Industrial & Technology | データ管理装置および方法 |
JP2007293619A (ja) * | 2006-04-25 | 2007-11-08 | Canon Software Inc | サーバ装置および情報共有システムおよびプログラムおよび記録媒体 |
WO2007145069A1 (ja) * | 2006-06-15 | 2007-12-21 | Sony Corporation | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108528215A (zh) * | 2017-03-03 | 2018-09-14 | 现代自动车株式会社 | 车辆以及车辆的控制方法 |
Also Published As
Publication number | Publication date |
---|---|
US9317221B2 (en) | 2016-04-19 |
WO2012124178A1 (ja) | 2012-09-20 |
JPWO2012124178A1 (ja) | 2014-07-17 |
US20140019683A1 (en) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5943430B2 (ja) | 分散記憶システムおよび分散記憶方法 | |
US8676951B2 (en) | Traffic reduction method for distributed key-value store | |
JP6301318B2 (ja) | 分散ストレージシステムのためのキャッシュ処理方法、ノード及びコンピュータ可読媒体 | |
JP6259465B2 (ja) | システム、データベースクエリを実行するための方法及びコンピュータに読み取り可能な記録媒体 | |
JP6492123B2 (ja) | 分散キャッシングおよびキャッシュ分析 | |
US10235047B2 (en) | Memory management method, apparatus, and system | |
US20090187588A1 (en) | Distributed indexing of file content | |
JP5375972B2 (ja) | 分散ファイルシステム、そのデータ選択方法およびプログラム | |
CN109597903A (zh) | 图像文件处理装置和方法、文件存储系统及存储介质 | |
CN110457307B (zh) | 元数据管理系统、用户集群创建方法、装置、设备和介质 | |
US10057348B2 (en) | Storage fabric address based data block retrieval | |
CN110381136B (zh) | 一种数据读取方法、终端、服务器及存储介质 | |
Zhong et al. | A dynamic replica management strategy based on data grid | |
CN106940712A (zh) | 序列生成方法与设备 | |
JP4962483B2 (ja) | 情報処理装置 | |
JP2008225686A (ja) | 分散型データ処理プラットフォームにおけるデータ配置管理装置と方法、システム及びプログラム | |
George et al. | Hadoop mapreduce for tactical clouds | |
WO2013132779A1 (ja) | オブジェクト配置装置及び方法、コンピュータ・プログラム | |
JP2007293433A (ja) | 文書管理システム | |
KR101512647B1 (ko) | 질의처리엔진을 선택하는 방법 | |
RU2656739C1 (ru) | Способ и система хранения данных | |
KR101792189B1 (ko) | 빅 데이터 처리 장치 및 방법 | |
KR100785774B1 (ko) | 객체 기반 파일 입출력 시스템 및 방법 | |
JP6020014B2 (ja) | 分散データストア管理装置、分散並列処理実行装置、分散並列処理システム、分散データストア管理方法、分散並列処理実行方法、および、コンピュータ・プログラム | |
Kanbargi et al. | Cache utilization for enhancing analyzation of big-data & increasing the performance of hadoop |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160519 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5943430 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |