JP4624314B2 - データ管理装置 - Google Patents

データ管理装置 Download PDF

Info

Publication number
JP4624314B2
JP4624314B2 JP2006181215A JP2006181215A JP4624314B2 JP 4624314 B2 JP4624314 B2 JP 4624314B2 JP 2006181215 A JP2006181215 A JP 2006181215A JP 2006181215 A JP2006181215 A JP 2006181215A JP 4624314 B2 JP4624314 B2 JP 4624314B2
Authority
JP
Japan
Prior art keywords
data management
management device
identifier
message
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006181215A
Other languages
English (en)
Other versions
JP2008011331A (ja
Inventor
亮 縣
金子  豊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Japan Broadcasting Corp
Original Assignee
KDDI Corp
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp, Japan Broadcasting Corp filed Critical KDDI Corp
Priority to JP2006181215A priority Critical patent/JP4624314B2/ja
Publication of JP2008011331A publication Critical patent/JP2008011331A/ja
Application granted granted Critical
Publication of JP4624314B2 publication Critical patent/JP4624314B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、コンピュータネットワーク上に分散するデータを複数のデータ管理装置で管理するデータ管理システムを構成するデータ管理装置に関する。
特定のサーバによらず、継続的あるいは一時的にネットワークに接続した計算機群によって構成される分散型のデータ管理システムがある。このシステムを利用して、例えばユーザ側ではデータの名前は分かっているが、そのデータのネットワーク上の存在場所が分からない場合に、そのデータを所持している計算機の情報を、ユーザからの要求に応じてユーザに通知するというデータの名前解決サービスを提供することができる。このようなサービスを提供可能な分散型のデータ管理システムとして、米国MIT大学のThe Chord Projectによるシステム(Chordシステム)が良く知られている(非特許文献1参照)。
Chordシステムでは、システムを構成する各データ管理装置には、当該データ管理装置のIPアドレス(またはIPアドレスとポート番号の組)からハッシュ関数SHA-1(Secure Hash Algorithm 1)(非特許文献2参照)で計算されたハッシュ値が、識別子として付与される。また、ネットワーク上のデータにも、互いにユニークな識別子が付与されるとしている。ここで、データ管理装置およびデータに付与される各々の識別子は、循環する論理上の識別子空間を構成する(図12参照)。以下、この識別子空間の大きさ(識別子空間を構成する識別子数の最大値)を2mとする。
データの管理は、識別子空間上で当該データの識別子から正の方向(図12中の矢印Aの方向)に見て、次に現れる識別子を持つデータ管理装置が担当するものとしている。一例として、p台のデータ管理装置でq個のデータを管理するシステムでのデータ管理を説明する。データ管理装置の識別子を ID(s1),ID(s2),・・・,ID(sp)、データの識別子を ID(d1),ID(d2),・・・,ID(dq)とすると、識別子ID(s1)を持つデータ管理装置は、ID(sp) < x ≦ 2m-1および0 ≦ x ≦ ID(s1)の範囲の識別子を有するデータを管理する。また、識別子ID(s2)を持つデータ管理装置は、ID(s1) < x ≦ ID(s2)の範囲の識別子を有するデータを管理する。このように、各データ管理装置の管理範囲を示す識別子の数値範囲はデータ管理装置毎に異なっており、各数値範囲が重ならないようになっている。
上記のように、Chordシステムではネットワーク上のデータを多数のデータ管理装置が分担して管理している。各データ管理装置が自身の担当外のデータに対する名前解決等の処理を行うためには、他のデータ管理装置と通信(メッセージの送受信)を行う必要がある。この要求を満たすため、各データ管理装置は他のデータ管理装置のIPアドレスおよびポート番号の組を経路表として持つ。各データ管理装置は、メッセージを送信する際に、経路表を参照してメッセージの送信先を決定する。
経路表には、識別子空間上で自身の識別子から正の方向(図12中の矢印Aの方向)に見て最初に現れる識別子を持つデータ管理装置の情報がSUCCESSORとして含まれている。同様に、識別子空間上で自身の識別子から負の方向(図12中の矢印Bの方向)に見て最初に現れる識別子を持つデータ管理装置の情報がPREDECESSORとして経路表に含まれている。
経路表にはこれ以外に、識別子空間上で自身の識別子から見て正の方向に現れるm台のデータ管理装置の情報がSUCCESSOR LIST又はFinger Tableとして格納されている。SUCCESSOR Listは、識別子空間上で自身の識別子から正の方向に見て最初に現れるm台のデータ管理装置のリストである。これに対して、Finger Tableは、自身の識別子をXとしたときに、Xを基準にして一定の法則に従った距離を隔てて識別子空間上に並ぶ識別子を自身の担当範囲に含むm台(0≦i<m)のデータ管理装置のリストである。
Finger Tableを用いた場合、システムを構成するデータ管理装置の数をNとすると、任意のデータ管理装置に対して最大log2(N) 回の転送回数(Path Length)でメッセージを到達させることができる。つまり、システム内のデータ管理装置数(N)が2倍になっても、メッセージ転送回数は1回程度の増加で済むため、SUCCESSOR LISTと比較して効率的である。このため、経路表として、SUCCESSOR/PREDECESSORの情報を格納するエントリとFinger Tableの組合せが一般的に用いられる。
図13は従来のFinger Tableの生成手順を示している。以下、従来のFinger Tableの生成方法を説明する。以下では、識別子空間の大きさを2160とする。また、経路表において、SUCCESSORの情報を格納するエントリの設定が既に終了しているものとする。まず、変数iを初期化し(変数iに0を代入し)(ステップS400)、次式に従ってIDiを算出する(ステップS401)。ただし、Xは自身のデータ管理装置の識別子であり、PmodQは、PをQで割ったときの余りを示す。
IDi=(X+2i)mod2160 ・・・(1)
続いて、自身が管理対象とする識別子空間上の数値範囲内に上記のIDiを含むデータ管理装置Nを探索する(ステップS402)。見つかったデータ管理装置Nの情報はFinger Tableのi番目のエントリの情報として保存される(ステップS403)。続いて、変数iの値がチェックされる(ステップS404)。変数iの値が159であった場合にはFinger Tableの生成が終了し、159でなかった場合には、変数iの値に1が加算され(ステップS405)、処理が再度ステップS401に戻る。
ステップS402では、より具体的には、以下のようにしてデータ管理装置Nの探索が行われる。まず、SUCCESSORに対してメッセージを送信し、IDiを管理範囲内に持つデータ管理装置Nの探索を依頼する。依頼を受けたSUCCESSORは、IDiが自身の管理範囲内である場合には、自身の情報をメッセージに格納して返信する。
また、IDiが自身の管理範囲内でない場合には、SUCCESSORは、経路表の内容に基づいて、メッセージの転送先となるデータ管理装置を決定し、そのデータ管理装置にメッセージを転送する。具体的には、経路表に含まれるデータ管理装置の中から、IDiから負の方向(図12中の矢印Bの方向)に見て最も近い識別子を持つデータ管理装置を、メッセージの転送先として選択する。以上の処理を繰り返すことにより、最終的には、IDiを管理範囲内に持つデータ管理装置にメッセージが到達し、当該データ管理装置からメッセージが返信される。以上のようにして、データ管理装置Nの情報を取得することができる。
I. Stoica,et. al.,"Chord: A Scalable Peer-to-peer Lookup Protocol for Internet Applications",Proceedings of the 2001 ACM SIGCOMM Conference,2001 FIPS 180-1,"Secure Hash Standard",U.S. Department of Commerce/NIST,National Technical Information Service,Springfield,VA,Apr. (1995)
従来のデータ管理システムでは、上記の方法によってFinger Tableを生成した結果、経路表内のFinger Tableの上位のエントリに同じデータ管理装置が重複して多数登録されてしまうという現象が発生していた。例えば、識別子空間の大きさを2160とし、その識別子空間上に100万(106)台のデータ管理装置が配置されている場合に、識別子空間上で隣接するデータ管理装置間の距離の平均は1.46×1042となる。ここで、2k>1.46×1042を満たす最小の整数kを求めると、k=141となる。つまり、Finger Tableに用意されている160個のエントリのうち、上位142個のエントリがSUCCESSORの情報で占められることになる。
このため、識別子空間の大きさに比べて、Finger Tableに実質的に登録されるデータ管理装置の数が少なくなる。すると、経路表に基づいたメッセージの転送が非効率的となり、メッセージの伝送距離が長くなる可能性がある。これにより、従来のデータ管理システムでは、メッセージの伝送遅延に起因する各種処理(名前解決など)の遅延が発生したり、多数のルータを経由することによりメッセージが消失したりする可能性が高くなるという問題があった。
本発明は、上述した問題点に鑑みてなされたものであって、各種処理の遅延やメッセージの消失を低減することができるデータ管理装置を提供することを目的とする。
本発明は、上記の課題を解決するためになされたもので、コンピュータネットワーク上に分散するデータを複数のデータ管理装置で管理するデータ管理システムを構成し、互いに異なる識別子の付与された前記複数のデータ管理装置が配置された識別子空間における所定範囲に対応したデータを管理するデータ管理装置において、所定の演算式に基づいて算出した演算値を管理対象の前記所定範囲に含むデータ管理装置の前記識別子を含む経路情報を生成する経路情報生成手段と、前記経路情報生成手段によって生成された前記経路情報を記憶する記憶手段と、他のデータ管理装置とメッセージの送受信を行う通信手段と、前記通信手段によって、他のデータ管理装置から受信された前記メッセージがさらに他のデータ管理装置へ転送される場合に、前記記憶手段によって記憶されている前記経路情報に基づいて前記メッセージの転送先を決定する転送先決定手段とを備え、前記識別子空間を構成する前記識別子の最大個数がNm(N,mは2以上の自然数)である場合に、前記所定の演算式はIDi=(X+K×Ni)modNmなる式で表され、前記IDiは前記演算値であり、前記Xは自身のデータ管理装置の前記識別子であり、前記iは変数であり、前記Kは、前記iに応じて変化する係数であり、前記経路情報生成手段は、前記所定の演算式に基づいて、前記iを0と前記mの間で順次変化させながら前記演算値を算出することを特徴とするデータ管理装置である。
また、本発明のデータ管理装置において、前記Kは、[数1]なる式で表され、前記Lは、自身のデータ管理装置の識別子と、前記識別子空間上で自身のデータ管理装置に隣接するデータ管理装置の識別子との距離であることを特徴とする。
Figure 0004624314
また、本発明のデータ管理装置において、異なる前記iを前記所定の演算式に代入して算出された異なる前記演算値が同一のデータ管理装置の管理対象の前記所定範囲に含まれる場合に、前記通信手段は、前記同一のデータ管理装置と異なるデータ管理装置を探索するための探索メッセージを生成して他のデータ管理装置へ送信し、前記探索メッセージに対する返答メッセージを他のデータ管理装置から受信し、前記経路情報生成手段は、前記返答メッセージの内容に基づいて前記経路情報を生成することを特徴とする。
本発明によれば、経路情報に含まれるデータ管理装置の識別子の種類数が従来よりも増加するようなKを設定することによって、メッセージの転送がより効率的に行われるようになる。これによって、各種処理の遅延やメッセージの消失を低減することができるという効果が得られる。
以下、図面を参照し、本発明の実施形態を説明する。図1は、本発明の一実施形態による分散型のデータ管理システムの構成を示している。図1において、複数のデータ管理装置1が、通信ネットワーク300を介して互いに通信を行うことが可能なように接続されている。データ管理装置1はコンピュータであり、データの加工や演算を行う処理装置、データを保存するための記憶装置、ユーザがコンピュータへの指示を入力するための入力装置、および処理結果を出力する出力装置等のハードウェアと、コンピュータを制御する手順や命令をまとめたソフトウェア(プログラム)とが協働して動作することによって、所望の機能が実現される。
データ管理装置1において、通信処理部10(本発明の通信手段に対応)は、他のデータ管理装置1との通信を制御し、各種メッセージの送信や受信を行う。処理部11(本発明の経路情報生成手段、転送先決定手段に対応)は、データ管理に係る様々な処理を実行する。経路表記憶部12(本発明の記憶手段に対応)は経路表を記憶し、データ管理表記憶部13はデータ管理表を記憶する。経路表記憶部12とデータ管理表記憶部13は異なる記録媒体で構成されていてもよいし、同一の記録媒体内の異なる記録領域で構成されていてもよい。
次に、経路表記憶部12に格納される経路表の内容を説明する。図2は経路表の一例を示している。経路表には、他のデータ管理装置1との通信に必要な情報(例えばIPアドレスおよびポート番号)が含まれている。経路表は、SUCCESSORおよびPREDECESSORの情報が格納されているエントリ200,201と、Finger Tableと呼ばれるエントリ202とから成る。
SUCCESSORを管理するためのエントリ200には、SUCCESSORとなる他のデータ管理装置1の識別子(装置識別子)とそのデータ管理装置1のIPアドレスおよびポート番号とが格納されている。PREDECESSORを管理するためのエントリ201には、PREDECESSORとなる他のデータ管理装置1の識別子(装置識別子)とそのデータ管理装置1のIPアドレスおよびポート番号とが格納されている。Finger Tableと呼ばれるエントリ202には、m台分(m≧0)のデータ管理装置1の識別子(装置識別子)とそれらのデータ管理装置1のIPアドレスおよびポート番号とが格納されている。
次に、データ管理表記憶部13に格納されるデータ管理表の内容を説明する。各データ管理装置1は、自身が管理対象とする識別子空間上の数値範囲を認識しており、その数値範囲に含まれる識別子の付与されたデータの情報をデータ管理表として持つ。データ管理表は、データ毎のエントリにより構成されている。各エントリは、当該データの識別子、当該データが保存されているネットワーク装置のIPアドレス、およびポート番号の組合せにより構成されている(図3参照)。
次に、データ管理装置1間で送受信されるメッセージの内容を説明する。図4はメッセージの一例を示している。宛先IPアドレスフィールド400、宛先ポート番号フィールド401には、それぞれメッセージの宛先であるデータ管理装置1のIPアドレス、ポート番号が記録されている。送信元IPアドレスフィールド402、送信元ポート番号フィールド403には、それぞれメッセージの送信元であるデータ管理装置1のIPアドレス、ポート番号が記録されている。
処理対象識別子フィールド404には、処理対象となる識別子(名前解決を依頼するデータの識別子等)が記録されている。メッセージ内容フィールド405には、メッセージの内容(名前解決の依頼やデータ管理装置の探索依頼等)が記録されている。発信元IPアドレスフィールド406、発信元ポート番号フィールド407には、それぞれメッセージを作成し、最初に発信したデータ管理装置1のIPアドレス、ポート番号が記録されている。
メッセージを最初に発信するデータ管理装置1は、送信元IPアドレスフィールド402と発信元IPアドレスフィールド406、送信元ポート番号フィールド403と発信元ポート番号フィールド407にそれぞれ自身の情報を記録する。また、他のデータ管理装置1から受信したメッセージを転送するデータ管理装置1は、送信元IPアドレスフィールド402と送信元ポート番号フィールド403を自身の情報に書き換えると共に、宛先IPアドレスフィールド400と宛先ポート番号フィールド401を転送先のデータ管理装置1の情報に書き換えてメッセージを送信する。
次に、経路表記憶部12に格納される経路表の生成方法を説明する。処理部11は、自身のデータ管理装置1がデータ管理システムに初めて参加する際に経路表を生成し、経路表記憶部12に格納する。以下では、識別子空間の大きさ(識別子空間を構成する識別子数の最大値)を2160とする。また、経路表において、SUCCESSORの情報を格納するエントリ(図2のエントリ200)の設定が既に終了しているものとする。
以下、図5を参照し、経路表内のFinger Tableの生成方法を説明する。処理部11は変数iを初期化し(変数iに0を代入し)(ステップS100)、次式に従ってIDiを算出する(ステップS101)。ただし、Xは自身のデータ管理装置の識別子であり、PmodQは、PをQで割ったときの余りを示す。また、Lは、自身のデータ管理装置1の識別子と、識別子空間上で自身のデータ管理装置1の識別子から正の方向に見て次に現れるデータ管理装置1(SUCCESSOR)の識別子との、識別子空間における距離(識別子の差)である。
Figure 0004624314
続いて、処理部11は、自身のデータ管理装置1が管理対象とする識別子空間上の数値範囲内に上記のIDiを含むデータ管理装置Nを探索する(ステップS102)。この処理の詳細は図13のステップS402と同様である。処理部11は、見つかったデータ管理装置Nの情報をFinger Tableのi番目のエントリに格納する(ステップS103)。続いて、処理部11は変数iの値をチェックする(ステップS104)。変数iの値が159であった場合にはFinger Tableの生成が終了し、159でなかった場合には、処理部11は変数iの値に1を加算し(ステップS105)、再度ステップS101の処理を実行する。
上記の[数2]で示される式を整理すると、以下のようになる。
IDi=(X+K×2i)mod2160 ・・・(2)
また、係数Kは次式で表される。
Figure 0004624314
従来の(1)式と本実施形態の(2)式を比較すると、iの値に応じて変化する係数Kの有無が両者の相違点である。(2)式では、i=0のときIDi=X+Lとなり、これはSUCCESSORの識別子と同一である。また、(2)式でも(1)式と同様に、iが増加するに従って、IDiが指数関数的に増加する。
(1)式と(2)式の違いは、生成される経路表に以下のように反映される。図6は経路表の様子を模式的に示している。識別子空間上の矢印の根元は、経路表を生成するデータ管理装置の位置を示しており、矢印の先端は、(1)式または(2)式に従って順次算出したIDiの位置を示している。図6(a)は、(1)式を用いた従来の方法で生成された経路表の様子を模式的に示している。図6のデータ管理装置Bが生成した経路表内のFinger Tableの大部分は、前述したように、SUCCESSORとなるデータ管理装置Cの情報で占められてしまう。
一方、図6(b)は、(2)式を用いた本実施形態の方法で生成された経路表の様子を模式的に示している。経路表内のFinger Tableの最初のエントリには、SUCCESSORとなるデータ管理装置Cの情報が格納されるが、他のエントリには、それ以外のデータ管理装置の情報が格納される。
(2)式に含まれる係数Kとして、(2)式の算出結果が、i=0のときに自身のデータ管理装置1の識別子の値より大きく自身のデータ管理装置1のSUCCESSORの識別子の値以下の値となり、i=1のときに自身のデータ管理装置1のSUCCESSORの識別子の値より大きな値となるような係数を用いることが望ましい。本実施形態では、その一例として、[数3]で表される係数Kを用いている。
これによって、経路表の大部分が特定のデータ管理装置1の識別子で占められる状況が発生する可能性が低減し、経路表に含まれるデータ管理装置1の識別子の種類数が従来よりも増加するので、メッセージの転送がより効率的に行われるようになる。その結果、メッセージの伝送距離がより短くなるので、メッセージの伝送遅延に起因する各種処理の遅延やメッセージ消失の可能性を低減することができる。
また、(2)式も、iの増加に応じてIDiが指数関数的に増加するという(1)式と同様の特徴を有している。したがって、システム内のデータ管理装置数(N)が2倍になっても、メッセージ転送回数が1回程度の増加で済むという従来の特徴を維持したまま、各種処理の遅延やメッセージ消失の可能性を低減することができる。
図7は、図5に示す処理の一部を変形した処理の手順を示している。以下、図6を参照し、Finger Tableの他の生成方法を説明する。処理部11は変数iを初期化し(変数iに0を代入し)(ステップS200)、前述した[数2]に従ってIDiを算出する(ステップS201)。
続いて、処理部11は、自身のデータ管理装置1が管理対象とする識別子空間上の数値範囲内にIDiを含むデータ管理装置Nを探索する(ステップS202)。続いて、処理部11は変数iの値をチェックする(ステップS203)。変数iの値が0であった場合には、処理はステップS205へ進み、変数iの値が0でなかった場合には、処理はステップS204へ進む。
変数iの値が0でなかった場合には、処理部11は、経路表記憶部12から経路表を読み出して参照し、ステップS202で見つかったデータ管理装置Nの情報が経路表に存在するか否かを判定する(ステップS204)。
ステップS202で見つかったデータ管理装置Nの情報が経路表に存在しなかった場合、処理部11はデータ管理装置Nの情報を経路表のi番目のエントリに格納する(ステップS205)。続いて、処理部11は変数iの値をチェックする(ステップS206)。変数iの値が159であった場合には経路表の生成が終了し、159でなかった場合には、処理部11は変数iの値に1を加算し(ステップS207)、再度ステップS201の処理を実行する。
一方、ステップS202で見つかったデータ管理装置Nの情報が経路表に存在した場合、処理部11は、データ管理装置NのSUCCESSORを探索するためのメッセージ(本発明の探索メッセージに対応)を生成し、通信処理部10を介してメッセージをデータ管理装置Nへ送信する。このメッセージの処理対象識別子フィールドにはデータ管理装置Nの識別子が格納されており、メッセージ内容フィールドには、SUCCESSORの探索依頼を示す情報が格納されている。
メッセージを受信したデータ管理装置Nの処理部11は、メッセージ内容に基づいて経路表記憶部12から経路表を読み出して参照し、SUCCESSORの情報が格納されているエントリから情報を抽出し、その情報を含むメッセージ(本発明の返答メッセージに対応)を生成する。処理部11は、通信処理部10を介してメッセージを返信する。経路表を生成するデータ管理装置1の処理部11はこのメッセージを受信し、メッセージに含まれるデータ管理装置NのSUCCESSORを新たにデータ管理装置Nに設定し(ステップS208)、再度ステップS204の処理を実行する。
上記のように、図7に示した処理では、異なるiを(2)式に代入して算出した異なる識別子の値が、同一のデータ管理装置1が管理対象とする識別子空間上の数値範囲に含まれる場合に、同一のデータ管理装置1と異なるデータ管理装置1を探索するための探索メッセージを生成する。そして、探索メッセージを他のデータ管理装置1へ送信し、探索メッセージに対する返答メッセージの内容に基づいてFinger Tableを生成する。
これによって、同一のデータ管理装置1の情報がFinger Tableの複数のエントリにわたって格納されることを防止し、図5に示した処理によってFinger Tableを生成した場合よりも、Finger Tableに格納されるデータ管理装置1の種類数をより増加させることができる。したがって、メッセージの伝送遅延に起因する各種処理の遅延やメッセージ消失の可能性をより低減することができる。
次に、図8を参照し、他のデータ管理装置1からメッセージを受信した場合のデータ管理装置1の動作を説明する。通信処理部10は、メッセージの宛先IPアドレスおよび宛先ポート番号が自身を指すメッセージのみ受信し、処理部11へメッセージを出力する(ステップS300 )。処理部11はメッセージ内の処理対象識別子を確認し、その処理対象識別子が、自身の担当する範囲内の識別子であるか否かを判定する(ステップS301)。
処理対象識別子が、自身の担当する範囲内の識別子でなかった場合、処理部11は経路表記憶部12から経路表を読み出し(ステップS302)、経路表内のデータ管理装置1の識別子と処理対象識別子を比較して、メッセージの転送先となるデータ管理装置1を決定する(ステップS303)。続いて、処理部11はメッセージの宛先IPアドレスおよび宛先ポート番号を転送先のデータ管理装置1のIPアドレスおよびポート番号に書き換えると共に、送信元IPアドレスおよび送信元ポート番号を自身のIPアドレスおよびポート番号に書き換え、通信処理部10を介してメッセージを転送する(ステップS304)。メッセージの転送先となるデータ管理装置1は1台でも複数台でもよい。
一方、ステップS301での判定の結果、処理対象識別子が、自身の担当する範囲内の識別子であった場合、処理部11はメッセージ内のメッセージ内容を参照し、メッセージ内容に応じた名前解決等の処理を行う(ステップS305)。
上記のステップS303において、メッセージの転送先となるデータ管理装置1は、具体的には以下のようにして決定される。処理対象識別子が識別子空間上で自身の識別子とSUCCESSORの識別子の間に位置する場合(すなわち識別子空間上で自身の識別子から正の方向に見て、処理対象識別子、SUCCESSORの識別子の順に識別子が並んでいる場合)、メッセージの転送先としてSUCCESSORが選択される。また、処理対象識別子が識別子空間上で自身の識別子とSUCCESSORの識別子の間に位置しない場合、経路表内の識別子のうち、識別子空間上で処理対象識別子から負の方向に見て最も近い識別子の付与されたデータ管理装置1がメッセージの転送先として選択される。
次に、従来の経路表の生成方法と本実施形態の経路表の生成方法を比較する。経路表の生成方法の違いによる効果を評価するため、数値シミュレーションを行った。まず、本数値シミュレーションで想定するネットワークであるインターネットのトポロジーを説明する。インターネットは、自律システム(AS:Autonomous System)と呼ばれる複数のネットワークより構成されている。自律システムとは、共通の経路情報を共有し、1 つの管理実体のもとに存在するネットワーク(例えば、特定のインターネットサービスプロバイダが管理するネットワークなど)である。
自律システム自体もひとつのネットワークであり、複数のルータで構成される。図9は、複数の自律システムにより構成されるインターネットのネットワークトポロジーを模式的に示している。このようなネットワークトポロジーを構築するための数学的モデルとして、Transit-Stubモデル(E. W. Zegura,K. L. Calvert,S. Bhattacharjee,“How to Model an Internetwork”,IEEE Infocom,vol. 2,pp594-602,San Francisco,CA,1996)がある。本数値シミュレーションでは、想定する物理ネットワークとしてTransit-Stubモデルを使用し、2400台のルータで構成されるネットワークを生成した。
続いて、この物理ネットワーク上に1024台のデータ管理装置(Chordノード)をランダムに配置し、オーバーレイネットワークを構築した。各データ管理装置に付与する識別子のビット長は160bitとした。この状態で、ランダムに2台のデータ管理装置を選択し、一方から送信されたメッセージが他方に到達するまでのデータ管理装置間転送回数(Chordノード間転送回数 = Path Length)、および物理ネットワークにおけるルータホップ数を、数値シミュレーションにより評価した。
本数値シミュレーションでは、従来のChord方式(図13に示した処理手順に従って経路表を生成する方式)と本実施形態による方式のそれぞれについて宛先データ管理装置をランダムに指定し、メッセージの送信を1000回試行した。それぞれの試行についてデータ管理装置間転送回数(Path Length)とルータホップ数の関係を図10に示す。図10(a)は、図5に示した処理手順に従って経路表を生成した場合(本実施形態の方法Aとする)のシミュレーション結果であり、図10(b)は、図7に示した処理手順に従って経路表を生成した場合(本実施形態の方法Bとする)のシミュレーション結果である。また、図10に示したデータをまとめた結果を図11に示す。
本実施形態による経路表生成方法を用いると、従来の経路表生成方法と比べて、経路表に登録されるデータ管理装置の識別子の種類数が増加することが分かる。また、宛先データ管理装置にメッセージが到達するまでに行われるメッセージの転送回数が減少していることも分かる。つまり、本実施形態によれば、メッセージの転送が効率的に行われるようになることが分かる。メッセージの転送が効率的に行われるようになると、宛先データ管理装置にメッセージが到達するまでに経由するルータの数(ルータホップ数)が減少するが、それもシミュレーション結果に現れている。したがって、本実施形態によれば、メッセージの伝送遅延に起因する各種処理の遅延やメッセージの消失を低減することができる。
また、本実施形態の方法AとBを比較すると、方法Bを用いる方が、方法Aを用いるよりも、経路表に登録されるデータ管理装置の識別子の種類数が増加することが分かる。その結果、メッセージの転送回数およびルータホップ数が共に減少している。つまり、方法Bを用いると、各種処理の遅延やメッセージの消失を低減する効果がより大きくなる。
以上、図面を参照して本発明の実施形態について詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
本発明の一実施形態によるデータ管理システムの構成を示すブロック図である。 本発明の一実施形態における経路表の内容を示す参考図である。 本発明の一実施形態におけるデータ管理表の内容を示す参考図である。 本発明の一実施形態におけるメッセージの構造を示す参考図である。 本発明の一実施形態における経路表の生成手順を示すフローチャートである。 本発明の一実施形態による経路表の生成方法と従来の経路表の生成方法のそれぞれによって生成される経路表の様子を示す参考図である。 本発明の一実施形態における経路表の生成手順を示すフローチャートである。 本発明の一実施形態によるデータ管理装置のメッセージ受信時の動作の手順を示すフローチャートである。 本発明の一実施形態における数値シミュレーションで想定するネットワークのトポロジーを示す参考図である。 本発明の一実施形態における数値シミュレーションの結果を示す参考図である。 本発明の一実施形態における数値シミュレーションの結果を示す参考図である。 循環する識別子空間における識別子の配置の様子を示す参考図である。 従来の経路表の生成手順を示すフローチャートである。
符号の説明
1・・・データ管理装置、10・・・通信処理部、11・・・処理部、12・・・経路表記憶部、13・・・データ管理表記憶部、300・・・通信ネットワーク

Claims (2)

  1. コンピュータネットワーク上に分散するデータを複数のデータ管理装置で管理するデータ管理システムを構成し、互いに異なる識別子の付与された前記複数のデータ管理装置が配置された識別子空間における所定範囲に対応したデータを管理するデータ管理装置において、
    所定の演算式に基づいて算出した演算値を管理対象の前記所定範囲に含むデータ管理装置の前記識別子を含む経路情報を生成する経路情報生成手段と、
    前記経路情報生成手段によって生成された前記経路情報を記憶する記憶手段と、
    他のデータ管理装置とメッセージの送受信を行う通信手段と、
    前記通信手段によって、他のデータ管理装置から受信された前記メッセージがさらに他のデータ管理装置へ転送される場合に、前記記憶手段によって記憶されている前記経路情報に基づいて前記メッセージの転送先を決定する転送先決定手段とを備え、
    前記識別子空間を構成する前記識別子の最大個数がNm(N,mは2以上の自然数)である場合に、前記所定の演算式はIDi=(X+K×Ni)modNmなる式で表され、前記IDiは前記演算値であり、前記Xは自身のデータ管理装置の前記識別子であり、前記iは変数であり、前記Kは、前記iに応じて変化する係数であり、
    前記Kは、
    Figure 0004624314
    なる式で表され、前記Lは、自身のデータ管理装置の識別子と、前記識別子空間上で自身のデータ管理装置に隣接するデータ管理装置の識別子との距離であり、
    前記経路情報生成手段は、前記所定の演算式に基づいて、前記iを0と前記mの間で順次変化させながら前記演算値を算出する
    ことを特徴とするデータ管理装置。
  2. 異なる前記iを前記所定の演算式に代入して算出された異なる前記演算値が同一のデータ管理装置の管理対象の前記所定範囲に含まれる場合に、前記通信手段は、前記同一のデータ管理装置と異なるデータ管理装置を探索するための探索メッセージを生成して他のデータ管理装置へ送信し、前記探索メッセージに対する返答メッセージを他のデータ管理装置から受信し、
    前記経路情報生成手段は、前記返答メッセージの内容に基づいて前記経路情報を生成する
    ことを特徴とする請求項1に記載のデータ管理装置。
JP2006181215A 2006-06-30 2006-06-30 データ管理装置 Expired - Fee Related JP4624314B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006181215A JP4624314B2 (ja) 2006-06-30 2006-06-30 データ管理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006181215A JP4624314B2 (ja) 2006-06-30 2006-06-30 データ管理装置

Publications (2)

Publication Number Publication Date
JP2008011331A JP2008011331A (ja) 2008-01-17
JP4624314B2 true JP4624314B2 (ja) 2011-02-02

Family

ID=39069103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006181215A Expired - Fee Related JP4624314B2 (ja) 2006-06-30 2006-06-30 データ管理装置

Country Status (1)

Country Link
JP (1) JP4624314B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354364A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 分散型データ処理/管理装置及びその方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005354364A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 分散型データ処理/管理装置及びその方法

Also Published As

Publication number Publication date
JP2008011331A (ja) 2008-01-17

Similar Documents

Publication Publication Date Title
JP5607252B2 (ja) 処理方法、代理処理エージェント、dhtクライアントノードのルーティングテーブルを埋めるシステムおよび方法、ルータ、ならびにdhtクライアントノード
US8190630B2 (en) Data search device, data search system, data search method and data search program
JP5048134B2 (ja) パケットルーティングの方法、システム、装置、及びバックアップリソースを選択する方法、システム
US7773609B2 (en) Overlay network system which constructs and maintains an overlay network
US20070233832A1 (en) Method of distributed hash table node ID collision detection
CN101202746B (zh) 节点标识符生成方法及负载均衡方法及装置
JP2005323346A (ja) ピアツーピアネットワークにおけるルーティング
JP2009508410A (ja) マルチデスティネーション・ルーティングを利用したピアツーピア・オーバーレイ通信の並列実行
CN108337170B (zh) 分布式资源查找方法和系统
Gupta et al. Efficient and adaptive epidemic-style protocols for reliable and scalable multicast
EP2491698A1 (en) Method and arrangement for locating services in a peer-to-peer network
US8619631B2 (en) Information communication system, information communication method, node device included in information communication system and recording medium recording information processing program
JP2012123544A (ja) 負荷分散装置及びプログラム
RU2454008C2 (ru) Основанная на пригодности маршрутизация
KR101081147B1 (ko) 동일한 레이블과 매칭하는 다중 노드를 식별하는 컴퓨터네트워크
JP2008269141A (ja) オーバレイ検索装置、オーバレイ検索システム、オーバレイ検索方法およびオーバレイ検索用プログラム
JP4624314B2 (ja) データ管理装置
JP4633680B2 (ja) データ管理装置
JP6485811B2 (ja) ノード装置および経路表管理方法
Gao et al. Routing in large-scale dynamic networks: a bloom filter-based dual-layer scheme
JP2009218728A (ja) 情報転送装置、情報転送方法およびプログラム
JP2006221457A (ja) Pure型P2P通信におけるレプリケーション制御を行うサーバントとそのレプリケーション制御方法およびプログラム
KABRE et al. Comparative study of can, pastry, kademlia and chord dhts
JP6036302B2 (ja) 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
JP2009134341A (ja) ピア検索方法および通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101026

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees