JP4445451B2 - リソース検索方法及びリソース検索システム - Google Patents

リソース検索方法及びリソース検索システム Download PDF

Info

Publication number
JP4445451B2
JP4445451B2 JP2005300214A JP2005300214A JP4445451B2 JP 4445451 B2 JP4445451 B2 JP 4445451B2 JP 2005300214 A JP2005300214 A JP 2005300214A JP 2005300214 A JP2005300214 A JP 2005300214A JP 4445451 B2 JP4445451 B2 JP 4445451B2
Authority
JP
Japan
Prior art keywords
resource
query
peer
semantic vector
index information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005300214A
Other languages
English (en)
Other versions
JP2007109062A (ja
Inventor
庸次 山登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005300214A priority Critical patent/JP4445451B2/ja
Publication of JP2007109062A publication Critical patent/JP2007109062A/ja
Application granted granted Critical
Publication of JP4445451B2 publication Critical patent/JP4445451B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、ネットワーク上のリソースをユーザがP2Pの手法によって検索する際に、トラフィックを抑えつつネットワーク内で効率的にクエリを転送するための方法及びシステムに関する。
近年、IT技術の進歩により、数多くのリソース(ウェブ(web)サービス、ウェブページ、ネットワークデバイスなど)がネットワークを介してアクセス可能となっている。ユーザがネットワーク上のリソースを利用するためには、ユーザが所望とするリソースがどこに存在するかを検索する技術が必要となる。従来は、リソースの検索のために、リソースの内容や所在などを集中して管理するサーバをネットワークに設け、ユーザは、このサーバに対してアクセスし所望のリソースの所在を検索するようにしていた。しかしながら、ネットワーク、特にインターネット上のリソース数は膨大であり、また、リソースの追加や削除、変更が極めて頻繁に行われることから、サーバとして極めて大掛かりなものを必要とする。そこで、サーバを用いることによる耐障害性の低下を防ぎ、サーバコストを低減し、また、不要な管理を排除することを目的として、P2P(ピア・ツー・ピア)の手法を用いた検索技術が発展してきている。P2P検索技術では、ネットワークに参加するピアと呼ばれるノード同士が、集中管理用のサーバを設けることなく、クエリ(質問語;query)を相互に転送し合い、クエリに合致するピアが検索結果を質問元に返すことで、検索が実施される。
典型的なP2P検索技術であるグヌーテラ(Gnutella)では、ネットワーク内においてフラッディング(Flooding)を用いてクエリを転送するため、キーワードにはマッチするが適切でないリソースの大量発見したり(クエリに対する低適合率)、あるいはネットワークにおけるトラフィックが爆発的に増大するという問題がある。また、P2Pネットワークでは、ウイルスなどの悪質リソースも多く存在する。
そこで、ユーザが所望するリソースと意味的に近いリソース群のみにクエリを伝播させるとともに、同じピアへの複数回のクエリ転送を遮断でき、かつ、悪質なリソースを発見しないようなP2P検索技術が望まれている。
複数のテキストを対象とするテキストベース検索において、検索指示語に対して意味的に近い文書を検索する方法として、ベクトル空間法(非特許文献1)がある。また、P2Pネットワークにおいて効率的にクエリを転送することが可能な技術に、CAN(Content-Addressable Network)(非特許文献2)がある。
松尾 比呂志、内野 一,"意味属性に基づくテキストデータべ−ス検索方式"、情報処理学会論文誌、第32巻、第9号、1172−1179頁(1991) Sylvia Ratnasamy, Paul Francis, Mary Handley, Richard Karp and Scott Shenker, "A Scalable Content-Addressable Network," SIGCOMM '01, pp. 161-172 (August 27-31, 2001, San Diego, California, USA)
上述したように、インターネットなどのネットワーク上に存在するリソースを検索するための技術として、P2P検索技術に基づくとともに、ネットワーク内においてユーザが所望するリソースと意味的に近いリソース群のみにクエリを伝播させるとともに、同じピアへの複数回のクエリ転送を遮断でき、かつ、悪質なリソースを発見しないような技術が求められている。
本発明の目的は、上記の課題を解決し、意味的に近いリソース群のみに効率的クエリを伝播する、新たなリソース検索方法を提供することにある。
本発明の別の目的は、上記の課題を解決し、意味的に近いリソース群のみに効率的クエリを伝播する、新たなリソース検索システムを提供することにある。
本発明のリソース検索方法は、ネットワーク上に存在するリソースの中から、P2P検索によってユーザが所望するリソースを検索するリソース検索方法であって、ネットワークにおいて、各リソースの内容が、長さが可変の意味ベクトルにより意味ベクトル空間によって表現され、各リソースのインデックス情報、そのリソースの意味ベクトル空間内での位置にマッピングされておりネットワーク上のピアが、意味ベクトル空間を部分空間に分割して部分空間ごとにその部分空間に含まれるインデックス情報を分散管理し、ユーザが所望するリソースを検索する場合に、ユーザに対応するピアであるユーザピアが、検索対象のリソースに対応したクエリ意味ベクトルを含むクエリを生成してクエリをネットワークに送信し、ネットワークに含まれる各ピアが、ネットワーク内において意味ベクトル空間内でクエリ意味ベクトルによって表わされる方向にクエリを転送し、意味ベクトル空間内で目的とする位置に対するピアにクエリが到達した場合に、そのピアが、意味ベクトル空間内でクエリ意味ベクトルに近い意味を有するリソースのインデックス情報を有するピアにクエリをフラッディングで転送し、クエリをフラッディングで転送されたピアは、クエリにヒットするリソースのインデックス情報を、ユーザのピアに直接転送する。
本発明のリソース検索システムは、ネットワーク上に存在するリソースの中から、P2P検索によってユーザが所望するリソースを検索するリソース検索システムであって、P2Pネットワークと、P2Pネットワークに参加するピアと、を有し、各リソースの内容が、長さが可変の意味ベクトルにより意味ベクトル空間によって表現され、各リソースのインデックス情報がそのリソースの意味ベクトル空間内での位置にマッピングされ、意味ベクトル空間は部分空間に分割され、部分空間ごとにその部分空間に含まれるインデックス情報がピアによって分散管理され、ユーザが所望するリソースを検索する場合には、ユーザに対応するピアであるユーザピアが、検索対象のリソースに対応したクエリ意味ベクトルを含むクエリを生成してクエリをネットワークに送信し、ネットワークに含まれる各ピアは、ネットワーク内において意味ベクトル空間内でクエリ意味ベクトルによって表わされる方向にクエリを転送し、意味ベクトル空間内で目的とする位置に対するピアにクエリが到達した場合に、そのピアは、意味ベクトル空間内でクエリ意味ベクトルに近い意味を有するリソースのインデックス情報を有するピアにクエリをフラッディングで転送し、クエリをフラッディングで転送されたピアは、クエリにヒットするリソースのインデックス情報を、ユーザピアに直接転送する。
本発明において、クエリがフラッディングで転送される範囲は、例えば、リソースの意味ベクトルとクエリ意味ベクトルとの内積が所定の値を超える範囲を検索範囲として、その検索範囲内とすることができる。
また本発明においては、検索の品質の向上を図り、また、悪意のあるリソースを排除することを目的として、リソースのインデックス情報が転送されたユーザピアが、そのインデックス情報を用いて、対応するリソースを保持するリソース保持ピアからそのリソースを取得し、取得したリソースの満足度を評価してその満足度をそのリソース保持ピアに送信し、リソース保持ピアが、満足度に基づいて、リソースの意味ベクトルの更新を行うようにしてもよい。
リソースの意味ベクトル(リソース意味ベクトルR)は、その更新後のものをR’とし、クエリ意味ベクトルをQとし、満足度をSとし、満足度Sの単調増加関数でありかつ絶対値が1以下の関数g(S)とh(S)とを用いて、例えば、
R’={R+g(S)(|R|Q−R)}(|R|+h(S))/|R|
を満たすように更新される。
本発明では、テキストの検索に用いられるベクトル空間法を拡張して非テキストのリソースを検索できるようにし、さらにCANの手法を適用することにより、P2P検索において意味的に近いリソース群のみに効率的にクエリを転送することが可能になる、という効果が得られる。これにより発見したリソースのクエリに対する高い適合率と、ネットワークにおけるトラフィックの削減を実現する。また、リソース意味ベクトルRの更新を行うことによって、ウイルスなどの悪質なリソースは検索の際に発見されないようになるため、ユーザは適切なリソースのみ発見することができるようになる。
次に、本発明の好ましい実施の形態について、図面を参照して説明する。
図1は、本発明が適用されるネットワークの構成の一例を示している。
インターネットなどの物理ネットワーク50上にP2Pネットワーク51が構成されており、P2Pネットワーク51に対して多数のピア52が参加している。ピア52は、それぞれが、リソース保持ピアとしてリソースを保持することができるものである。また、ピア52は、後述の説明から明らかなように、それぞれ、リソースのインデックス情報を保持するインデックス保持ピアとして機能できるものである。なお、本実施形態では、リソースとそのリソースのインデックス情報とが同じピアに保持されるとは限らない。むしろ、後述するようにP2Pネットワークに対して意味ベクトル空間がマッピングされており、リソースのインデックス情報は、そのインデックス情報に対応したリソースに対応するリソース意味ベクトルRに対応して、Rの値に応じたピアに格納されるものである。ここでインデックス情報とは、リソースの内容を端的に示すための情報と、そのリソースがどのピアに格納されているかを示す情報(エンドポイント情報)である。本実施形態では、リソースの内容を端的に示すための情報として、リソース名が使用される。 次に、本発明に基づくリソース検索方法の前提となる、ベクトル空間法について説明する。
テキスト検索に用いられるベクトル空間法では、文書の内容を、文書内の単語を基にして、長さを1に正規化した意味ベクトルで表わし、ベクトルの距離で文書の類似性を判定する。意味ベクトルにおいて、ベクトル軸は単語の意味属性に対応し、各成分の値は対応する意味属性の文書に対する重みを表わしている。すなわち、検索対象の文書がベクトル空間にマッピングされているため、検索したいと所望する文書の意味ベクトル周辺を重点的に探すことで、効率的な検索を行うことができる。
このようなベクトル空間法を、リソースのP2P検索に適用する際の課題として、以下の3点が挙げられる:
(a)検索対象が非文書であるリソースであるため、検索対象からはベクトル成分の抽出を行えない;
(a’)テキスト検索の典型的な分野である新聞記事検索の場合などとは異なり、P2Pネットワーク内には、ウイルスなどの悪質リソースが蔓延している;
(b)P2Pネットワークにおいては各ピアが多くの計算資源や記憶資源を持つことは期待できないため、各ピアにインデックス情報を大量に保持させることはできない。
本実施形態では、テキスト検索のためのベクトル空間法を以下のように拡張することによって、これらの課題を解決した:
(A)リソースのファイル名及びユーザの評価値を用いてベクトル成分を定める;
(A’)リソースの質を表わすためにベクトル長さを1に正規化しない。さらに、ベクトル長さもユーザ評価値を用いて変更できるようにする;
(B)上述したCANを参考にして、P2Pネットワーク51に参加する各ピア52によって、ベクトル空間を分散して管理する。
まず、上述の(A)と(A’)に関連して、意味ベクトル成分の学習について説明する。
通常のテキスト検索であれば、例えばhtml(hypertext markup language)文書中の単語頻度から意味ベクトル成分の抽出が可能である。しかしながら、本実施形態の場合、検索対象が、文書ではなくリソースであるため、リソース中の単語頻度から意味ベクトル成分を抽出する、といった手法を用いることができない。一般に、P2Pリソース共有では、リソースの名前は複数のキーワードからなっている。また、リソースに対するメタデータの付与に手間がかかるため、リソースの名前を構成するキーワード以外のメタデータは
、リソースに付与されていないのが一般的である。そのため、リソースの意味ベクトルを決めるためには、これらのキーワードしか使うことができない。
そこで本実施形態では、意味ベクトルを構成する各成分のうち値が非零な成分を決めるため、リソース名から得られる単語意味属性を用い、また、ベクトル成分値にユーザ群の評価により変動する評価値を用い、評価によりベクトル成分値の学習を行うことにした。
まず、ベクトル成分の値が0でない成分を決める。リソースのファイル名から複数の単語を抜き出し、その単語を日本語意味属性(N種)にマッピングすることで(例:単語が「同僚」、「メンバ」、「座員」ならば、意味属性は「同士」にマッピングされる)、0でない成分が決まる。なお、日本語の単語意味属性は、例えば3000種で、全体で12段のツリーである。しかしP2Pネットワークでのクエリ転送の実用性の観点から考えた場合、ベクトル次元数は20程度とすることが好ましく、ツリー4段目(21種)程度の高いレベルの意味属性を用いることが推奨される。
次に、意味ベクトルにおけるベクトル成分値について説明する。ベクトル成分は[0,1](すなわち0以上1以下の値)とし、初回登録時には、成分が非零な軸の数をnとして、非零な成分の値は全て1/n0.5とする。ベクトル成分値を固定したままではリソースの内容を十分表わしているとはいえないため、本実施形態では、ベクトル成分は、ユーザがリソースを発見した際に評価する満足度S[0,1]により、更新(アップデート)される。
本実施形態では、リソースごとにリソース意味ベクトルRを定義するとともに、リソースを検索したいユーザ(すなわちリソースに対応付けられたコンテンツを欲するユーザ)のクエリも意味ベクトル(クエリ意味ベクトルQ)として表わす。P2Pネットワークにおいてリソース意味ベクトルRは、対応するリソースを提供するピアに保持される。そして後述するように、意味ベクトルRと意味ベクトルQとの合致度に基づいて、リソースを検索する。またこのようにして検索され取得されたリソースについてのユーザの満足度Sに基づいて、先に述べたように、リソース意味ベクトルRが更新される。クエリ意味ベクトルQの長さ(ベクトルとしての絶対値)は1に固定する。
以下、図2を用いて、リソース意味ベクトルRの更新手法を説明する。
まず、第1のステップとして、ユーザは、その欲するコンテンツを表わすクエリ意味ベクトルQを用いて、Q・R>Rsを満たす範囲を検索し、リソースのインデックス情報を取得する。言い換えれば、Q・R>Rsを満たすリソース意味ベクトルRを検索して、対応するリソースのインデックス情報を取得する。ここで、Rsは検索範囲の広さを示す(スカラー)量で、リソース・シュヴァルツシルト半径と呼ぶことにする。また、「・」は、ベクトルの内積を表わしている。
次に、第2のステップとして、ユーザは、取得したインデックス情報を用いて対応するリソースを取得または利用し、取得または利用したリソースに対する満足度Sを評価して、そのリソースを提供したピア(リソース提供ピア)に満足度Sを送信する。
その後、第3のステップとして、評価をリソース提供ピアは、満足度Sに応じて、リソース意味ベクトルRを、
{R+g(S)(|R|Q−R)}(|R|+h(S))/|R|
に更新する。
ここで、g(S)とh(S)は、ユーザの満足度Sの単調増加関数であり、かつ、絶対値が1以下の関数である。Sが低いときは、g(S)、h(S)は負であり、Sが高いときは正である。図2に示した例は、意味ベクトル空間が3次元ベクトル空間であるとして、満足度Sが高かった場合にベクトルRがベクトルQに近づく形で更新されることを示している。
本実施形態では、このようなユーザ評価に基づくリソース意味ベクトルの更新を繰り返すことによって、リソースはユーザ群の評価を学習することになり、そのリソースに適したリソース意味ベクトルRが自動的に浮かび上がってくることになる。また、ウイルスのような悪質なリソースはいつも悪い評価を受けるため、上の式に従い、対応するリソース意味ベクトルの長さがだんだんと短くなる。そのため、いずれ、リソース意味ベクトルの長さがRsよりも小さくなり、いかなる場合にもR・Q<Rsとなって、そのような悪質なリソースは検索されないようになる。
次に、本発明のもう1つの特徴である、CANトポロジの利用について説明する。
非特許文献2に開示されるCANは、リソース名に対してハッシュ関数を適用し、その結果を高次元ハッシュ空間にマッピングし、さらにその空間をP2Pネットワークのピアで分割して、リソースインデックスを管理する方法である。すなわち、高次元ハッシュ空間を複数の部分空間に分割し、各部分空間ごとにその部分空間を管理するピアを設定し、そのようなピアにクエリを転送する方法である。本実施形態では、リソース名に対してハッシュ関数を適用する代わりに上述したようにリソース意味ベクトルを生成し、また、リソースはハッシュ空間ではなく意味ベクトル空間にマッピングされるが、その分割管理及びクエリルーティングの方法は、CANでの方法をそのまま用いる。
そこで、意味ベクトル空間と、意味ベクトル空間の分散管理法について説明する。
上述したようにリソースは、N次元の意味ベクトルRで表現される。意味ベクトルRの各成分の値は、そのリソースがどれだけその成分の意味を含んでいるかを示す量である。例えば、もし、意味ベクトルの軸が、「数学」、「国語」、「理科」、「社会」の4つの軸だとすると、このとき意味ベクトルは4次元ベクトルということになるが、「整数論」というリソースは「数学」の要素しか持たないため、意味ベクトルは(1,0,0,0)で表わされる。一方、「経済学」というリソースは、「数学」と「社会」の両方の要素を持つため、意味ベクトルは、(0.71,0,0,0.71)のように、2つの軸の重ね合わせで表現できる。このように、一般に、リソースはN次元の意味ベクトルで表現できる。
各リソースの意味ベクトルがマッピングされたN次元空間を意味ベクトル空間と呼ぶ。
図3は意味ベクトル空間を示している。ここでは説明のため、N=2すなわち意味ベクトル空間が2次元空間であるものとする。リソースA〜Cが、意味ベクトル空間上にマッピングされている。
このような意味ベクトル空間は、各ピアによって分割管理されている。P2Pネットワークに参加する各ピアの性能(処理能力)は、一般に、サーバよりも劣っているから、意味ベクトル空間の全体をひとつのピアで管理することは困難である。そこで、P2Pネットワークに参加する複数のピアによって(場合によってはネットワークに参加する全てのピアによって)、意味ベクトル空間を分散管理する。
図4は、図3に示した意味ベクトル空間を16個のピアa〜pによって管理する例を示している。意味ベクトル空間を等分割して、各ピアで管理している。具体的には、リソースAのインデックス情報はピアfに、リソースBのインデックス情報はピアlに、リソースCのインデックス情報はピアmに、登録されている。なお、リソース自体は、そのリソースのインデックス情報を登録しているピアとは別のピアに保持されていてもよい。P2Pネットワークでは、参加するピアごとに性能が異なる場合もあるので、性能の高いピアにはより大きな空間を管理させ、性能の低いピアは小さな空間を管理させるようにしてもよい。
また、P2Pネットワークでは、ピアは、サーバのように常時起動し稼動する存在ではなく、離脱したり新たに加わったりすることが考えられる。図5は、ピアの増減があった場合に、各ピアが管理する空間を変更することを説明している。例えば、図4に示すように意味ベクトル空間が分割されてピアa〜fによって分散管理されているときに、ピアfがネットワークから離脱する場合を考える。ピアfは、ネットワークから離脱する前に、自分の管理する空間に登録されたインデックス情報をピアeに渡し、これにより、ピアeは、ピアfが管理していた分の管理空間も合わせて管理する。また、ピアqが新たに加わる場合は、ピアmは、自分の管理空間の半分をピアqに任せてその範囲のインデックス情報をピアqに渡している。
図6は、CANトポロジを用いて、クエリをルーチングしフラッディングすることを説明する図である。
最初に、検索条件が記述された検索クエリがユーザのピアにより生成される。クエリには、そのクエリに固有の番号が付与されるものとする。このクエリは、上述のようにクエリ意味ベクトルQとして表わされるものであり、図6において破線の矢印で示されるように、意味ベクトル空間上のQ方向にマルチホップで転送される。マルチホップでの転送の過程でクエリを受信したピアは、そのピア自身が持つリソースインデックス情報とクエリとをマッチングさせて検索を行うことはなく、単に意味ベクトル空間内でQの方向に向け、隣接のピアにクエリを転送することだけしか行わない。このようにして、検索クエリは、Qを管理するピアまで到達する。
Qを管理するピアまで到達したら、次に、Qを管理するピアは、Qに意味的に近いインデックス情報R(リソース意味ベクトルR)を持つインデックス保持ピアに対し、図6において実線の矢印で示すように、そのクエリをフラッディングで転送する。フラッディングの対象となるエリア(意味ベクトル空間内における部分空間)は、ユーザが指定する検索範囲の広さ(リソース・シュヴァルツシルト半径)Rsをもちいて、Q・R>Rsとなるエリアである。この段階では、フラッディングによりクエリを受け取ったインデックス保持ピアは、自身の持つインデックス情報とクエリが合致するかをチェックする。もちろん、Qを管理するピア自身も、自身が持つインデックス情報とクエリとが合致するかをチェックする。
このようなCANトポロジの利用により、意味ベクトル空間の分割管理及びクエリのルーティング、フラッディングがスムーズにできる。特に、クエリのフラッディングのルールを以下のように定める:
(1)Qを管理するピアは、クエリを全ての隣接ピアに転送する。このピアをフラッディング元ピアと呼ぶ;
(2)各ピアは、意味ベクトル空間におけるi軸方向の隣接ピアからクエリを受け取ったピアは、そのクエリを、1,…,i−1軸の各軸に沿って両方向の隣接ピアにクエリを転送し、また、i軸方向に関しては、クエリを受け取った方向とは逆の方向にクエリを転送する;
(3)各ピアは、クエリを受け取るたびにそのクエリの番号をキャッシュし、既にキャッシュされている番号のクエリを再度受け取った場合には、それ以上、フラッディング転送を行わない;
(4)各ピアは、受け取ったクエリに記述された意味ベクトルQと、自分が管理するリソースの意味ベクトルRから、Q・R>Rsの条件を満たすかどうかを計算し、この条件が満たされなくなったら、クエリをそれ以上転送しない。
このようなクエリのフラッディングに際してこのようなルールを採用することによって、同じピアへの複数回のクエリ転送を防ぐことができ、トラフィックの削減を行うことができる
次に、以上説明したベクトル空間法の拡張とCANトポロジの使用とを利用した、本実施形態におけるリソース検索の手順について、図7を用いて説明する。
まず、図7中の番号1で示すように、各ピアは、意味ベクトルRで表わされるその管理するリソースのインデックス情報を、意味ベクトル空間上のRの位置に登録する。ここでインデックス情報には有効期限が設定されており、期限が切れたインデックス情報は、意味ベクトル空間から削除される。
次に、番号2で示すように、ユーザは、その欲するコンテンツに対応するリソースの詳細な条件、ユーザの使用するピアのネットワークアドレス、クエリ番号、及びクエリ意味ベクトルQが記述されたクエリを、ユーザのピアからネットワークに送信する。その結果、上述したCANによるクエリルーティングによって、クエリはQ方向にマルチホップで転送される。
転送の結果、目的とする位置にクエリが届くと、番号3で示すように、Qと近い意味のリソースのインデックスを保持するインデックス保持ピアに、クエリがフラッディングで転送される。クエリがフラッディングで転送される範囲(検索範囲)は、上述したように、リソースのインデックス情報に対応するリソース意味ベクトルRがQ・R>Rsを満たす範囲である。
クエリをフラッディングしたことにより、番号4に「応答」として示すように、検索範囲内で、クエリに記述された詳細条件(キーワードの部分一致など)に合致するリソースのインデックス情報が発見され、そのインデックス情報がユーザのピアに直接転送される。
インデックス情報が転送されたユーザは、番号5で示すように、取得したインデックス情報を用いて、リソースを保持するピア(リソース保持ピア)にアクセスし、対応するリソースを使用または取得する。
リソースの使用または取得ののち、番号6に「評価」として示すように、ユーザはそのリソースの満足度Sを判定して満足度Sをリソース保持ピアに転送する。
満足度Sを転送されたリソース保持ピアは、番号7で示すように、そのリソースに対応するリソース意味ベクトルRを更新し、ベクトル空間に登録しなおす。図7に示す例では満足度Sが負であったので、意味ベクトル空間内においてQに対して更新前の位置から遠ざかる方向にインデックス情報が更新されることになる。
本発明のリソース検索方法が適用されるネットワークの構成の一例を示す図である。 リソース意味ベクトルの更新手法を説明する図である。 インデックス情報の分割管理を説明する図であって、意味ベクトル空間を示す図である。 インデックス情報の分割管理を説明する図であって、意味ベクトル空間を等分割して管理する例を示す図である。 インデックス情報の分割管理を説明する図であって、ピアの増減があった場合に各ピアの管理する空間が変更されることの例を示す図である。 CANトポロジーを利用したクエリのルーティングとフラッディングとを説明する図である。 本発明に基づくリソース検索方法の手順を説明する図である。
符号の説明
50 物理ネットワーク
51 P2Pネットワーク
52 ピア

Claims (8)

  1. ネットワーク上に存在するリソースの中から、P2P検索によってユーザが所望するリソースを検索するリソース検索方法であって、
    各リソースの内容が、長さが可変の意味ベクトルにより意味ベクトル空間によって表現され、前記各リソースのインデックス情報、当該リソースの前記意味ベクトル空間内での位置にマッピングされており
    前記ネットワーク上のピアが、前記意味ベクトル空間を部分空間に分割して部分空間ごとに当該部分空間に含まれる前記インデックス情報を分散管理し、
    前記ユーザが所望するリソースを検索する場合に、前記ユーザに対応するピアであるユーザピアが、検索対象のリソースに対応したクエリ意味ベクトルを含むクエリを生成して前記クエリを前記ネットワークに送信し、前記ネットワークに含まれる各ピアが、前記ネットワーク内において前記意味ベクトル空間内で前記クエリ意味ベクトルによって表わされる方向に前記クエリを転送し、
    前記意味ベクトル空間内で目的とする位置に対するピアに前記クエリが到達した場合に、当該ピアが、前記意味ベクトル空間内で前記クエリ意味ベクトルに近い意味を有するリソースのインデックス情報を有するピアに前記クエリをフラッディングで転送し、
    前記クエリをフラッディングで転送されたピア、クエリにヒットするリソースのインデックス情報を、前記ユーザのピアに直接転送する、
    リソース検索方法。
  2. 前記リソースの意味ベクトルと前記クエリ意味ベクトルとの内積が所定の値を超える範囲を検索範囲として、前記検索範囲内にのみ前記クエリがフラッディングで転送される、請求項1に記載のリソース検索方法。
  3. 前記リソースのインデックス情報が転送された前記ユーザのピアは、
    当該インデックス情報を用いてリソース保持ピアから対応するリソースを取得し、
    前記取得したリソースの満足度を評価して当該満足度を前記リソース保持ピアに送信し、
    前記リソース保持ピアは前記満足度に基づいて、前記リソースの意味ベクトルの更新を行う、
    請求項1または2に記載のリソース検索方法。
  4. 前記リソースの意味ベクトルをRとし、更新後の前記リソースの意味ベクトルをR’とし、前記クエリ意味ベクトルをQとし、前記満足度をSとして、
    前記リソースの意味ベクトルRは、前記満足度Sの単調増加関数でありかつ絶対値が1以下の関数g(S)とh(S)とを用いて、
    R’={R+g(S)(|R|Q−R)}(|R|+h(S))/|R|
    を満たすように更新される、請求項に記載のリソース検索方法。
  5. ネットワーク上に存在するリソースの中から、P2P検索によってユーザが所望するリソースを検索するリソース検索システムであって、
    P2Pネットワークと、
    前記P2Pネットワークに参加するピアと、
    を有し、
    前記各リソースの内容が、長さが可変の意味ベクトルにより意味ベクトル空間によって表現され、前記各リソースのインデックス情報が、当該リソースの前記意味ベクトル空間内での位置にマッピングされ、前記意味ベクトル空間は部分空間に分割され、部分空間ごとに当該部分空間に含まれる前記インデックス情報が前記ピアによって分散管理され、
    前記ユーザが所望するリソースを検索する場合には、前記ユーザに対応するピアであるユーザピアが、検索対象のリソースに対応したクエリ意味ベクトルを含むクエリを生成して前記クエリを前記ネットワークに送信し、
    前記ネットワークに含まれる各ピアは、前記ネットワーク内において前記意味ベクトル空間内で前記クエリ意味ベクトルによって表わされる方向に前記クエリを転送し、
    前記意味ベクトル空間内で目的とする位置に対するピアに前記クエリが到達した場合に、当該ピアは、前記意味ベクトル空間内で前記クエリ意味ベクトルに近い意味を有するリソースのインデックス情報を有するピアに前記クエリをフラッディングで転送し、
    前記クエリをフラッディングで転送されたピアは、クエリにヒットするリソースのインデックス情報を、前記ユーザピアに直接転送する、
    リソース検索システム。
  6. 前記リソースの意味ベクトルと前記クエリ意味ベクトルとの内積が所定の値を超える範囲を検索範囲として、前記検索範囲内にのみ前記クエリがフラッディングで転送される、請求項5に記載のリソース検索システム。
  7. 前記リソースのインデックス情報が転送された前記ユーザピアは、当該インデックス情報を用いて、対応するリソースを保持するリソース保持ピアから当該リソースを取得し、前記取得したリソースの満足度を評価して当該満足度を前記リソース保持ピアに送信し、
    前記リソース保持ピアは前記満足度に基づいて、前記リソースの意味ベクトルの更新を行う、
    請求項5または6に記載のリソース検索システム。
  8. 前記リソースの意味ベクトルをRとし、更新後の前記リソースの意味ベクトルをR’とし、前記クエリ意味ベクトルをQとし、前記満足度をSとして、
    前記リソース保持ピアは、前記満足度Sの単調増加関数でありかつ絶対値が1以下の関数g(S)とh(S)とを用いて、
    R’={R+g(S)(|R|Q−R)}(|R|+h(S))/|R|
    を満たすように前記リソースの意味ベクトルの更新を実行する、請求項7に記載のリソース検索システム。

JP2005300214A 2005-10-14 2005-10-14 リソース検索方法及びリソース検索システム Expired - Fee Related JP4445451B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005300214A JP4445451B2 (ja) 2005-10-14 2005-10-14 リソース検索方法及びリソース検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005300214A JP4445451B2 (ja) 2005-10-14 2005-10-14 リソース検索方法及びリソース検索システム

Publications (2)

Publication Number Publication Date
JP2007109062A JP2007109062A (ja) 2007-04-26
JP4445451B2 true JP4445451B2 (ja) 2010-04-07

Family

ID=38034881

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005300214A Expired - Fee Related JP4445451B2 (ja) 2005-10-14 2005-10-14 リソース検索方法及びリソース検索システム

Country Status (1)

Country Link
JP (1) JP4445451B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100913441B1 (ko) * 2007-08-20 2009-09-03 한국과학기술원 자원의 시맨틱 공간 매핑을 이용한 시맨틱 자원 검색 방법
JP5336403B2 (ja) * 2010-02-24 2013-11-06 富士通株式会社 ノード装置およびコンピュータプログラム
CN106550015A (zh) * 2016-10-12 2017-03-29 中国农业大学 一种对等网络下的节点文件传输方法、索引服务器及系统

Also Published As

Publication number Publication date
JP2007109062A (ja) 2007-04-26

Similar Documents

Publication Publication Date Title
Tang et al. Peersearch: Efficient information retrieval in peer-to-peer networks
Kanakia et al. A scalable hybrid research paper recommender system for microsoft academic
US20040181607A1 (en) Method and apparatus for providing information in a peer-to-peer network
Li Grid resource discovery based on semantically linked virtual organizations
Parreira et al. p2pDating: Real life inspired semantic overlay networks for web search
Chan et al. Fuzzy interest forwarding
Klampanos et al. An architecture for information retrieval over semi-collaborating peer-to-peer networks
Bender et al. The MINERVA project: Database selection in the context of P2P search
US7043470B2 (en) Method and apparatus for improving querying
JP4445451B2 (ja) リソース検索方法及びリソース検索システム
Nejdl et al. Top-k query evaluation for schema-based peer-to-peer networks
Skobeltsyn et al. Query-driven indexing for scalable peer-to-peer text retrieval
Joseph P2P metadata search layers
Mastorakis et al. Experimentation with fuzzy interest forwarding in named data networking
Tun et al. Optimizing resource discovery technique in the P2P grid systems
JP4494901B2 (ja) リソース検索方法およびリソース検索システム
Wong et al. Approximate matching for peer-to-peer overlays with cubit
Fujita Similarity search in interplanetary file system with the aid of locality sensitive hash
Klampanos et al. Searching in peer-to-peer networks
Yamato P2P contents searching method using evaluation of semantic vectors
Eberhardt et al. Why Google isn’t the future. Really not
Yu et al. SNet: skip graph based semantic web services discovery
Ma et al. Concept index for document retrieval with peer-to-peer network
Himali et al. Sas: Semantics aware search in p2p networks
Joung et al. On character-based index schemes for complex wildcard search in peer-to-peer networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100115

R150 Certificate of patent or registration of utility model

Ref document number: 4445451

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees