JP4494901B2 - リソース検索方法およびリソース検索システム - Google Patents

リソース検索方法およびリソース検索システム Download PDF

Info

Publication number
JP4494901B2
JP4494901B2 JP2004230961A JP2004230961A JP4494901B2 JP 4494901 B2 JP4494901 B2 JP 4494901B2 JP 2004230961 A JP2004230961 A JP 2004230961A JP 2004230961 A JP2004230961 A JP 2004230961A JP 4494901 B2 JP4494901 B2 JP 4494901B2
Authority
JP
Japan
Prior art keywords
resource
peer
query
semantic vector
holding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004230961A
Other languages
English (en)
Other versions
JP2006048511A (ja
Inventor
庸次 山登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004230961A priority Critical patent/JP4494901B2/ja
Publication of JP2006048511A publication Critical patent/JP2006048511A/ja
Application granted granted Critical
Publication of JP4494901B2 publication Critical patent/JP4494901B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ネットワーク上のリソースを、ユーザがP2P(Peer to Peer)的に検索するリソース検索方法およびリソース検索システムに関するものである。
近年、IT(Information Technology)技術の進歩により、Web Services、Webページ、デバイス、コンテンツ等の数多くのリソースがネットワークを介してアクセス可能となっており、そのようなリソースを検索する方法が数多く開発されている。その中でも、耐障害性やサーバコストの低減、不要な管理の削除などを目的として、P2P的検索技術の開発が進んでいる。
典型的なP2P検索技術であるGnutellaは、Floodingでクエリを転送するため、キーワードはマッチするが内容が適切ではないという適合率の低いリソースの大量発見やトラフィック爆発という問題がある。このため、ユーザが所望するリソースと意味的に近いリソース群のみへクエリを伝播することや、クエリを同じピアへ複数回転送するのを遮断することなどが可能なP2P検索技術が望まれている。
従来より、意味的に近い文章を検索する方法としては、ベクトル空間法が提案されている(例えば、非特許文献1参照。)。
このベクトル空間法は、単語の意味属性を示す座標軸からベクトル空間を構成し、文章をその文章内の単語を元にして各意味属性に対して重み付けした値をその成分とする意味ベクトルで表し、そのベクトル空間内におけるベクトル間の距離で複数の文章の類似性を判定するものである。検索対象の文章がその意味属性に応じてベクトル空間にマッピングされているので、ベクトル空間法では、所望する文章の意味ベクトル周辺を重点的に探すことにより、効率的な検索が可能となる。
また、クエリを同じピアへ繰り返し転送せず、効率的なクエリの転送が可能な技術としては、P2P技術であるCANが提案されている(例えば、非特許文献2参照。)。
なお、出願人は、本明細書に記載した先行技術文献情報で特定される先行技術文献以外には、本発明に関連する先行技術文献を出願時までに発見するには至らなかった。
松尾他、意味属性に基づくテキストデータベース検索方式、情報論Vol.32、No.9、1991年 S.Ratnasamy、A Scalable Content-Addressable Network、SIGCOMM 2001
しかしながら、上述したようなベクトル空間法をP2Pによるリソース検索に適用しようとすると、次のような課題が発生する。
上述したように検索対象となるリソースは、Web Services、Webページ、デバイス、コンテンツ等から構成されるため、Webページ以外は、通常のベクトル空間法で行われる文章からベクトル成分を抽出することができない。一般的には、これらのリソースからベクトル成分を抽出することは困難であることから、検索に用いられる意味ベクトルを生成することができない。
また、P2P検索では、ピアの性能はサーバに劣るため、リソースのリソース名やエンドポイント情報などのインデックス情報を多く持つことができない。このため、各ピアが保持するインデックス情報は制限される。
その結果、従来では、単純にベクトル空間法をP2P検索に適用することができなかったため、効果的にリソース検索をすることができなかった。
そこで、本発明は、上述したような課題を解決するためになされたものであり、効果的にリソースを検索することができるリソース検索方法を提供することを目的とする。
上述したような課題を解決するために、本発明にかかるリソース検索方法は、リソースを保持しているリソース保持ピアが、極座標で表された各リソースの内容を表現したリソース意味ベクトルがマッピングされた空間からなり、この空間の部分が割り当てられた各ピアが空間の部分に射影されるリソース意味ベクトルに対応するリソースのインデックス情報を記憶することによりネットワーク上の複数のピアにより分散管理される意味ベクトル空間上に、リソースのインデックス情報を、当該リソースのリソース意味ベクトルを意味ベクトル空間上に射影することにより導出される意味ベクトル空間上の位置に対応する意味ベクトル空間の部分を管理するピアに記憶させる第1のステップと、リソースの取得を所望する第1のピアが、所望するリソースの詳細情報および所望するリソースを表すキーワードを意味属性にマッピングしてベクトル成分が非零な軸およびその成分を決定することにより得られるクエリ意味ベクトルを含むクエリを、取得を所望するリソースのリソース意味ベクトルを意味ベクトル空間上に射影することによって定まる方向の第2のピアに転送する第2のステップと、第2のピアが、意味ベクトル空間をピアで分割する際に各ピアが保持する隣接するピアのエンドポイント情報を参照して、クエリをこのクエリに含まれるクエリ意味ベクトルを意味ベクトル空間上に射影することによって定まる方向に隣接する第3のピアに転送する第3のステップと、この第3のステップでクエリが転送された第3のピアが、この第3のピアに割り当てられた意味ベクトル空間の部分に、クエリに含まれるクエリ意味ベクトルを意味ベクトル空間上に射影することによって定まる位置が含まれる場合、クエリをフラッディングで第4のピアに転送する第4のステップと、フラッディングで転送されたクエリを受信した第4のピアのうち、クエリに含まれた詳細情報に対応するリソースのインデックス情報を有するピアが、インデックス情報を第1のピアに送信する第5のステップとを有することを特徴とするものである。ここで、リソースの意味ベクトルは、リソースのファイル名やユーザによるリソースの満足度評価に基づいて表現される。
上記リソース検索方法において、第1のピアが、第4のピアから受信したインデックス情報を参照してリソース保持ピアからリソースを取得する第6のステップと、第1のピアが、取得したリソースにどの程度満足したかを表す満足値をリソース保持ピアに送信する第7のステップと、リソース保持ピアが、満足値に基づいてリソースのリソース意味ベクトルを更新する第8のステップとをさらに有するようにしてもよい。
上記リソース検索方法において、第8のステップは、クエリに含まれるクエリ意味ベクトルからリソースのリソース意味ベクトルを引いた差分ベクトルに満足値に基づく値を乗じた増加分ベクトルに基づいて、リソースのリソース意味ベクトルを更新するようにしてもよい。
上記リソース検索方法において、第8のステップは、リソース保持ピアにより、満足値が正の値の場合はリソースの評価を表す評価値を加算し、満足値が負の値の場合は評価値を減算する第9のステップと、評価値が所定の閾値以下になると、リソース保持ピアによりリソースを削除する第10のステップとをさらに有するようにしてもよい。
上記リソース検索方法において、第2のステップは、クエリ意味ベクトルの指定が困難な場合に、第1のピアが、クエリを伝播させる範囲を示す値を付与したクエリを隣接ピアにフラッディングで転送する第11のステップを備え、この第11のステップで転送されたクエリを受信した隣接ピアのうち、クエリに含まれた詳細情報に対応するリソースのインデックス情報を有するピアが、第1のピアにインデックス情報を送信する第12のステップと、この第12のステップでインデックス情報を送信したピアが、クエリを伝播させる範囲を示す値を付与したクエリを隣接ピアにフラッディングで転送する第13のステップと、この第13のステップで転送されたクエリを受信した隣接ピアのうち、クエリに含まれた詳細情報に対応するリソースのインデックス情報を有するピアが、第1のピアにインデックス情報を送信する第14のステップとをさらに有するようにしてもよい。
クエリを伝播させる範囲を示す値、すなわちTTL(Time To Live)により制御されるクエリの伝播範囲は、適宜自由に設定することができる。
また、本発明にかかるリソース検索システムは、座標で表された各リソースの内容を表現したリソース意味ベクトルがマッピングされた空間からなり、この空間の部分が割り当てられた各ピアが空間の部分に射影されるリソース意味ベクトルに対応するリソースのインデックス情報を記憶することによりネットワーク上の複数のピアにより分散管理される意味ベクトル空間に基づいて、リソース保持ピアにより保持されているリソースを検索するリソース検索システムであって、リソース保持ピアは、リソースを保持するリソース保持手段と、意味ベクトル空間上に、リソースのインデックス情報を、当該リソースのリソース意味ベクトルを意味ベクトル空間上に射影することにより導出される意味ベクトル空間上の位置に対応する意味ベクトル空間の部分を管理するピアに記憶させるインデックス登録手段とを有し、リソースの取得を所望するユーザピアは、リソースの詳細情報および所望するリソースを表すキーワードを意味属性にマッピングしてベクトル成分が非零な軸およびその成分を決定することにより得られるクエリ意味ベクトルを含むクエリを取得を所望するリソースのリソース意味ベクトルを意味ベクトル空間上に射影することによって定まる方向のインデックス保持ピアに送信するクエリ送信手段を有し、インデックス保持ピアは、意味ベクトル空間上の自身が対応する位置に関連づけられたインデックス情報を保持するインデックス保持手段と、ユーザピアまたは隣接するインデックス保持ピアから受信したクエリを、意味ベクトル空間をピアで分割する際に各ピアが保持する隣接するピアのエンドポイント情報を参照して、このクエリに含まれるクエリ意味ベクトルを意味ベクトル空間上に射影することによって定まる方向に隣接するピアに転送する第1のクエリ転送手段と、隣接ピアから受信したクエリに含まれるクエリ意味ベクトルを意味ベクトル空間上に射影することによって定まる位置が、意味ベクトル空間上の自身が対応する位置の場合、クエリをフラッディングで隣接ピアに転送する第2のクエリ転送手段と、フラッディングで転送されたクエリを受信し、このクエリに含まれた詳細情報に対応するリソースのインデックス情報を有する場合、インデックス情報をユーザピアに送信するインデックス送信手段とを有することを特徴とする。
上記リソース検索システムにおいて、ユーザピアは、インデックス保持ピアから受信したインデックス情報を参照してリソース保持ピアからリソースを取得するリソース取得手段と、リソース保持ピアから取得したリソースにどの程度満足したかを表す満足値をリソース保持ピアに送信する評価手段とをさらに備え、リソース保持ピアのインデックス登録手段は、満足値に基づいてリソースのリソース意味ベクトルを更新するようにしてもよい。
上記リソース検索システムにおいて、リソース保持ピアのインデックス登録手段は、クエリに含まれるクエリ意味ベクトルからリソースのリソース意味ベクトルを引いた差分ベクトルに満足値に基づく値を乗じた増加分ベクトルに基づいて、リソースのリソース意味ベクトルを更新するようにしてもよい。
上記リソース検索システムにおいて、リソース保持ピアのインデックス登録手段は、満足値が正の値の場合はリソースの評価を表す評価値を加算し、満足値が負の値の場合は評価値を減算し、評価値が所定の閾値以下になると、リソース保持ピアによりリソースを削除するようにしてもよい。
上記リソース検索システムにおいて、インデックス保持ピアの第2のクエリ転送手段は、クエリ意味ベクトルの指定が困難な場合、クエリをフラッディングで転送する際、当該クエリに伝播させる範囲を示す値を付与するようにしてもよい。
本発明によれば、リソース意味ベクトルをリソースの内容を表現した意味ベクトルに基づいて生成することにより、適切な意味ベクトルを生成できるので、効果的なリソース検索が可能となる。
また、本発明によれば、クエリがクエリ意味ベクトルによって定まる方向に転送され、このクエリが転送された第3のピアによりクエリがフラッディングで転送され、フラッディングで転送された第4のピアのうち、クエリに含まれた詳細情報に対応するリソースのインデックス情報を有するピアによりインデックス情報が第1のピアに送信される。これにより、P2P検索において、欲するリソースに近いリソースのインデックス情報を保持するピアを中心に検索することができるため、効果的なリソース検索ができる。
また、本発明によれば、ベクトル空間を各ピアで分散して管理することにより、多数のインデックス情報に基づいてリソースの検索が可能となる。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本実施の形態にかかるリソース検索システムの構成を示す模式図、図2は、ネットワークに接続されてピアとして動作する端末の構成を示す模式図である。
図1に示すように、本実施の形態にかかるリソース検索システムは、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等のP2P検索が可能なネットワーク1と、このネットワークに接続された複数の端末2とから構成される。
ネットワーク1に接続された複数の端末2は、リソース検索を行う際、クエリを送信するユーザピア3、クエリを転送またはインデックス情報を送信するインデックス保持ピア4およびリソースを保持しているリソース保持ピア5の何れかとしてそれぞれ機能する。したがって、端末2は、リソース検索の内容に応じて、ユーザピア3として機能したり、インデックス保持ピア4またはリソース保持ピア5として機能したりする。
図2に端末2がユーザピア3、インデックス保持ピア4、およびリソース保持ピア5として作用するために必要な機能を各種ピア毎に表した機能ブロック図を示す。
図2に示すように、端末2は、ユーザピア3、インデックス保持ピア4およびリソース保持ピア5として作用するための必要な各機能と、空間管理部21とを有する。
空間管理部21は、後述する意味ベクトル空間を記憶し、他のピアと協働して意味ベクトル空間を分散管理する。
ここで、意味ベクトル空間および意味ベクトル空間の分散管理について説明する。
リソースは、N次元の意味ベクトルで表現される。意味ベクトルの各軸の成分の値は、そのリソースがどれだけ軸の意味を含んでいるかを示す。
例えば、意味ベクトルの軸が「数学」、「国語」、「理科」、「社会」の4つの軸を有する場合について考える。このとき、「整数論」というリソースは、「数学」の要素しか有しないので、その意味ベクトルは(1,0,0,0)で表される。また、「経済学」というリソースは、「数学」と「社会」の要素を有するため、意味ベクトルは(0.71,0,0,0.71)のように2つの軸の重ね合わせで表現される。
このように、一般にリソースはN次元の意味ベクトルで表現される。意味ベクトルの長さが1に規格化されている場合、リソース同士の意味ベクトルの内積がリソースの意味の近さと表す。
後述するが、本実施の形態では、意味ベクトルは長さが1に規格化されるため、N次元の意味ベクトルを極座標で表示するとN−1の自由度しかないので、N−1次元の空間上にマッピングすることができる。このように、極座標で表された各リソースの意味ベクトルがマッピングされたN−1次元の空間を、意味ベクトル空間と言う。
図3は、意味ベクトル空間を説明する図である。
図3に示す意味ベクトル空間は、Nが3である。したがって、意味ベクトル空間は2次元で表現される。このような意味ベクトル空間において、リソースA,B,Cのインデックス情報がマッピングされている。
図4は、図3に示す意味ベクトル空間の分割管理を説明する図である。
各ピアの性能は、サーバよりも低いため、全空間を一つのピアが管理するのは困難である。したがって、意味ベクトル空間は、ネットワークに参加する全てのピアで分散管理する。図4に示す意味ベクトル空間は、図3に示す意味ベクトル空間を16個のピアで管理する例を示しており、空間を等分割して各ピアで管理している。具体的には、リソースAのインデックス情報はピアfに、リソースBのインデックス情報はピアlに、リソースCのインデックス情報はピアmに、登録される。
なお、ピア毎に性能は異なる場合があるので、性能の高いピアはより大きな空間を管理し、性能の低いピアは小さな空間を管理するようにしてもよい。
図5は、ピアの増減が生じたときの意味ベクトル空間の分割管理を説明する図である。
ピアは、サーバのように常時起動しているとは限らず、ネットワークから離脱したり、ネットワークに新たに加入する場合がある。このような場合の動作について説明する。
例えば、ピアfが離脱する場合、ピアfは、離脱する前に自分の管理する空間に登録されたインデックス情報をピアeに渡し、ピアeがピアfの分の管理空間も併せて管理する。また、ピアqが新たに加入する場合、ピアmは、自分の管理空間の半分をピアqに任せる。この任せた範囲にインデックス情報が含まれる場合、ピアmは、そのインデックス情報をピアqに渡す。
このようにすることにより、本実施の形態では、ピアの増減があった場合でも、意味ベクトル空間の分割管理が可能となる。
このようなN−1次元の空間の分散管理の方法は、非特許文献2に記載されたCANを参考にしている。
端末2がユーザピア3として機能する場合、ユーザピア3は、クエリ送信部31と、インデックス受信部32と、リソース取得部33と、評価部34とを少なくとも有する。
クエリ送信部31は、ユーザの操作入力に基づいて、ユーザが所望するリソースのインデックス情報を要求する旨のクエリをネットワーク1に送信する。このクエリには、リソースのキーワードなどリソースの詳細に関する詳細情報と、ユーザピア3のネットワーク1上の位置を示すエンドポイント情報と、所望するリソースの意味ベクトルであるクエリ意味ベクトルとが少なくとも含まれる。このクエリ意味ベクトルの詳細については、後述する。
インデックス受信部32は、インデックス保持ピア4からユーザが所望するリソースのインデックス情報を受信する。
リソース取得部33は、受信したインデックス情報に基づいてリソース保持ピア5にアクセスし、リソースを取得する。
評価部34は、ユーザの操作入力に基づいて、リソースの満足度に関する満足値をリソース保持ピア5に送信する。
端末2がインデックス保持ピア4として機能する場合、インデックス保持ピア4は、クエリ転送部41と、インデックス保持部42と、インデックス送信部43とを少なくとも有する。
クエリ転送部41は、クエリを受信すると、空間管理部21において管理されている意味ベクトル空間を参照して、クエリ意味ベクトルを意味ベクトル空間上に射影することによって定まる方向に隣接するピアに、受信したクエリを転送する。また、クエリ転送部41は、受信したクエリにより指定された意味ベクトル空間上の位置に対応する場合、受信したクエリを隣接するピアにFloodingにより転送する。
インデックス保持部42は、意味ベクトル空間上で割り当てられた自身の位置に任意のリソースのインデックス情報が対応付けられている場合、そのインデックス情報を記憶する。このインデックス情報には、任意のリソースのリソース名や任意のリソースのネットワーク1上の位置を示すエンドポイント情報が含まれる。
インデックス送信部43は、受信したクエリの詳細情報が、自身が保持しているインデックス情報に適合する場合、このインデックス情報をユーザピア3に送信する。
端末2がリソース保持ピア5として機能する場合、リソース保持ピア5は、リソース保持部51と、インデックス登録部52とを少なくとも有する。
リソース保持部51は、リソースを保持しており、ユーザピア3の要求に応じて、ユーザピア3にリソースを提供する。
インデックス登録部52は、自身が保持しているリソースのインデックス情報を、そのリソースの意味ベクトル(以下、リソース意味ベクトルという)に基づいて意味ベクトル空間に関連づける。また、インデックス登録部52は、ユーザピア3から受信した満足値に基づいて自身のリソースの評価値を更新し、また満足値に基づいてリソース意味ベクトルを更新し、更新したリソース意味ベクトルに基づいてインデックス情報を意味ベクトル空間に再び関連づける。
例えば、ユーザピア3から受信した満足値が正の値の場合、インデックス登録部52は、評価値を増やす。一方、満足度が負の場合、評価値を減ずる。また、評価値が任意の閾値を下回ると、インデックス情報またはリソースを削除する。
なお、満足値は、1以下の絶対値で表される。
このようなユーザピア3、インデックス保持ピア4およびリソース保持ピア5の何れかとして機能する端末2は、CPU等の演算装置、メモリ、HDD等の記憶装置、他の端末2と各種情報の送受を行うI/F装置、キーボード、マウス等の入力装置、CRT(Cathode Ray Tube)、LCD(Liquid Crystal Display)、FED(Field Emission Display)または有機EL(Electro Luminescence)等の表示装置などを備えたコンピュータと、このコンピュータにインストールされたプログラムとからそれぞれ構成されており、上記ハードウェア装置がプログラムによって制御されることによって、すなわちハードウェア資源とソフトウェアが協働することによって、上述したユーザピア3、インデックス保持ピア4およびリソース保持ピア5の各機能部を実現する。
次に、クエリ意味ベクトルについて説明する。
クエリ意味ベクトルは、例えば、ユーザにより入力された2つのキーワードを日本語意味属性にマッピングしてベクトル成分が非零な軸を決定し、その成分として両方とも1/(21/2)として決定するようにしてもよい。ベクトル長は常に1とする。なお、ベクトル成分については、乗じる任意の値を適宜自由に設定することができる。
次に、リソース意味ベクトルについて説明する。
本実施の形態にかかるリソース検索システムでは、検索対象がリソースであるため、ベクトル空間法を適用する際に、ベクトル成分が0ではない非零な軸、並びにその成分にhtml文章中の単語および単語頻度を使うことができない。このため、本実施の形態では、「ベクトル成分が非零な軸」にリソース名から得られる単語の意味属性、「ベクトル成分」にユーザピア3の評価により変動する値を用いる。ベクトル成分が非零の軸およびベクトル成分の決定方法は、以下の通りである。
まず、ベクトル成分が非零の軸を決定するには、リソース名から単語を抜き出し、その単語を日本語意味属性(N種)にマッピングすることにより、軸を決定する。例えば、リソース名の単語が「同僚」、「メンバ」、「座員」の場合、意味属性は「同士」となる。
なお、日本語の単語意味属性は3000種で、全体で12段のツリーで表現できる。しかし、P2P的クエリ転送の実用を考慮すると、ベクトル次元数は20以下でないと現実的ではない。したがって、ツリー4段目(21種)程度の高いレベルの意味属性を用いるのが望ましい。
ベクトル成分を決定するには、ベクトル成分を[0,1]とし、初回登録時には成分が非零な軸の成分を全て1/(n1/2)とする。ただし、nは成分が非零な軸数、ベクトル長さは常に1とする。これにより、ベクトル長さが正規化されるため、意味ベクトルを極座標表示すると、自由度がN−1の角度空間で表現することが可能となる。
このようなベクトル成分は、ユーザがリソースを取得した際に送信する満足値[−1,1]により更新され、再登録される。
次に、リソース意味ベクトルの更新動作について説明する。図6は、リソース意味ベクトルの更新動作を説明する模式図である。なお、この図6は、満足値が負の値をとる場合を表している。
リソース意味ベクトルをR、クエリ意味ベクトルをQ、満足値をaと定義すると、Rの更新するアップデートベクトルΔRは、a(Q−R)で示される。ユーザピア3から受信した満足値による更新後のリソース意味ベクトルは、(R+ΔR)/|R+ΔR|となる。なお、ΔRの非零成分の軸の中にRの零成分の軸がある場合は、その軸の成分はアップデートせず、零のままにする。
これにより、ユーザによる評価が繰り返されると、リソースはユーザピア3の評価を学習し、自身に最適なRが自動的に導出される。
なお、ウィルスなどの常に負の満足値のリソースは存在する。この場合、ユーザピア3から受信する満足値は負の値をとり、評価値が任意の閾値以下になると、リソース保持ピア5は、そのリソースのインデックス情報またはリソースを削除するようにしてもよい。
次に、CANトポロジについて、説明する。
CANは、リソースのファイル名をハッシュ関数にかけ、高次元ハッシュ空間にマッピングして、その空間を全ピアで分割して、リソースインデックスを管理する方法である。本実施の形態では、リソースはハッシュ空間ではなく、意味ベクトル空間にマッピングされるが、その分割管理およびクエリルーティングの方法は、CANトポロジを適用する。ここで、意味ベクトル空間は、正確には自由度がN−1の角度空間であり、R,Qベクトルの角度空間への射影をそれぞれRang,Qangベクトルとする。
図7は、Floodingを説明する図である。
インデックスの検索時は、意味ベクトル空間において、ユーザのQangベクトルに対応するピアを中心として、隣接するピア、すなわち意味的に近いリソース群にクエリをFloodingする。例えば、図7に示す複数のピアで分割された意味ベクトル空間において、ピアCを中心とした場合、このピアCから隣接するピアにクエリがFloodingされる。なお、図4における矢印は、クエリが転送される方向を示す。
このようなCANトポロジの利用により、分割管理および同じピアへの複数回クエリ転送の遮断がスムーズに実現できる。
なお、CANトポロジについては、非特許文献2に詳述されている。
次に、図8を参照して、本実施の形態にかかるリソース検索システムの動作について説明する。図8は、本実施の形態にかかるリソース検索システムの動作を説明する模式図である。
まず、予めリソース保持ピア5は、保持しているリソースのリソース意味ベクトルを意味ベクトル空間に射影し、導出されたRangベクトルに対応する意味ベクトル空間上の位置に、保持しているリソースのインデックス情報の関連づけを行う(ステップS1)。リソース意味ベクトルは、ユーザピア3により評価されて再び関連づけられたものでも、初めて関連づけるものでもよい。
図8に示す意味ベクトル空間は、ネットワーク1に接続された全ての端末2、すなわち全てのユーザピア3、インデックス保持ピア4およびリソース保持ピア5で分割されている。この意味ベクトル空間において、隣接するピアは、意味的に近いリソースのインデックス情報を保持しているピアであると言える。このような意味ベクトル空間は、各ピアで分散して管理されている。
このような意味ベクトル空間上において、インデックス情報が関連づけられた位置に対応するインデックス保持ピア4は、そのインデックス情報を保持している。
なお、インデックス保持ピア4は、インデックス情報に有効期限を設け、期限が切れるとインデックス情報を削除するようにしてもよい。
また、インデックス保持ピア4は、インデックス情報を保持していなくてもよい。この場合、インデックス保持ピア4は、主にクエリの転送動作を行う。
次に、ユーザが任意のリソースの取得を所望する場合、ユーザピア3は、ユーザの操作入力に基づいてクエリを送信する(ステップS2)。
クエリには、リソースの詳細条件、クエリ意味ベクトルおよびユーザピア3のエンドポイント情報が含まれる。送信されたクエリは、ネットワーク1において、Qangベクトルの方向に転送される。具体的には、ユーザピア3は、クエリ意味ベクトルを意味ベクトル空間に射影してQangベクトルを生成し、このQangベクトルの方向に隣接するインデックス保持ピア4にクエリを送信する。クエリを受信したインデックス保持ピア4は、Qangベクトルの方向にピアを順次転送する。これにより、クエリは、Qangベクトルが指定する位置に対応するピアまで転送される。
クエリがQangベクトルが指定する位置に対応するインデックス保持ピア4に到達すると、このピアを中心としてクエリをFloodingする(ステップS3)。すなわち、ユーザピア3が送信したクエリ意味ベクトルと近い意味のインデックス保持ピア4にクエリをFloodingする。
クエリに含まれる詳細情報に適合するリソースのインデックス情報を有するリソース保持ピア5にクエリが到達すると、このリソース保持ピア5は、リソースのインデックス情報をユーザピア3に送信する(ステップS4)。
クエリに記述された詳細情報には、ユーザが所望するリソースのキーワード等が含まれており、例えば、そのキーワードとリソース名とが部分一致すると、リソース保持ピア5は、そのクエリの送信元のユーザピア3にインデックス情報を送信する。
インデックス情報を受信すると、ユーザピア3は、そのインデックス情報に基づいてリソース保持ピア5にアクセスし、リソースを取得する(ステップS5)。インデックス情報には、リソースのリソース名やリソース保持ピア5のネットワーク1上の位置を示すエンドポイント情報等が含まれている。このようなインデックス情報に基づいて、ユーザピア3は、リソース保持ピア5にアクセスする。
リソースを取得すると、ユーザピア3は、ユーザの操作入力に基づいて、取得したリソースの満足度に関する満足値をリソースのリソース保持ピア5に送信する(ステップS6)。
満足値を受信すると、リソース保持ピア5は、リソース意味ベクトルを更新し、このリソース意味ベクトルを意味ベクトル空間へ射影し、生成されたRangベクトルに基づいてインデックス情報を再度関連づける(ステップS7)。
なお、図5では、負の満足値の場合のインデックス情報の関連づけを表している。
このように、本実施の形態によれば、リソース意味ベクトルをリソース名およびユーザ満足値に基づいて生成することにより、適切なリソース意味ベクトルを生成できるので、効果的なリソース検索が可能となる。
また、本実施の形態によれば、クエリがクエリ意味ベクトルによって定まる方向に転送され、このクエリが転送されたインデックス保持ピア4によりクエリがフラッディングで転送され、フラッディングで転送されたピアのうち、クエリに含まれた詳細情報に対応するリソースのインデックス情報を有するインデックス保持ピア4によりインデックス情報がユーザピア3に送信される。これにより、P2P検索において、欲するリソースに近いリソースのインデックス情報を保持するピアを中心に検索することができるため、効果的なリソース検索ができる。
さらに、本実施の形態によれば、ベクトル空間を各ピアで分散して管理することにより、多数のインデックス情報に基づいてリソースの検索が可能となる。
図9は、2段階のFlooding法を説明する図である。図9において、大円は、第1段階のFloodingを示し、複数ある小円は、第2段階のFloodingを示す。
ステップS2において、クエリ意味ベクトルの指定が困難な場合、ユーザピア3は、隣接するリソース保持ピア5に中程度(例えば、〜3ピア)伝播するTTL(Time To Live)値を付与したクエリをFloodingする(図の大円に対応)。これにより、クエリの詳細情報に適合するインデックス情報を有するリソース保持ピア5が検出されると、このリソース保持ピア5は、インデックス情報をユーザピア3に送信する。また、このリソース保持ピア5は、このピアを中心として、隣接するリソース保持ピア5に中程度(例えば、〜3ピア)伝播するTTL値を付与したクエリをFloodingする(図の小円に対応)。これにより、クエリの詳細情報に適合するインデックス情報を有するリソース保持ピア5がさらに検出されると、このリソース保持ピア5は、インデックス情報をユーザピア3に送信する。
このような2段階のFlooding法を用いることにより、本実施の形態では、所望するリソースをより効果的に検索することが可能となる。
なお、2段階のFlooding法において、TTL値は適宜自由に設定することができる。
リソース検索システムの構成を示す模式図である。 各ピアの構成を示す模式図である。 意味ベクトル空間を説明する図である。 図3に示す意味ベクトル空間の分割管理を説明する図である。 ピアの増減が生じたときの意味ベクトル空間の分割管理を説明する図である。 リソース意味ベクトルの更新動作を説明する模式図である。 Floodingを説明する図である。 リソース検索システムの動作を説明する模式図である。 2段階のFlooding法を説明する図である。
符号の説明
1…ネットワーク、2…端末、3…ユーザピア、4…インデックス保持ピア、5…リソース保持ピア、21…空間管理部、31…クエリ送信部、32…インデックス受信部、33…リソース取得部、34…評価部、41…クエリ転送部、42…インデックス保持部、43…インデックス送信部、51…リソース保持部、52…インデックス登録部。

Claims (10)

  1. リソースを保持しているリソース保持ピアが、極座標で表された各リソースの内容を表現したリソース意味ベクトルがマッピングされた空間からなり、この空間の部分が割り当てられた各ピアが前記空間の部分に射影されるリソース意味ベクトルに対応するリソースのインデックス情報を記憶することによりネットワーク上の複数のピアにより分散管理される意味ベクトル空間上に、前記リソースのインデックス情報を、当該リソースのリソース意味ベクトルを前記意味ベクトル空間上に射影することにより導出される前記意味ベクトル空間上の位置に対応する意味ベクトル空間の部分を管理するピアに記憶させる第1のステップと、
    リソースの取得を所望する第1のピアが、所望するリソースの詳細情報および所望するリソースを表すキーワードを意味属性にマッピングしてベクトル成分が非零な軸およびその成分を決定することにより得られるクエリ意味ベクトルを含むクエリを、取得を所望するリソースのリソース意味ベクトルを前記意味ベクトル空間上に射影することによって定まる方向に隣接する第2のピアに転送する第2のステップと、
    前記第2のピアが、前記意味ベクトル空間をピアで分割する際に各ピアが保持する隣接するピアのエンドポイント情報を参照して、前記エンドポイント情報を参照して前記クエリをこのクエリに含まれる前記クエリ意味ベクトルを前記意味ベクトル空間上に射影することによって定まる方向に隣接する第3のピアに転送する第3のステップと、
    この第3のステップで前記クエリが転送された第3のピアが、この第3のピアに割り当てられた前記意味ベクトル空間の部分に、前記クエリに含まれるクエリ意味ベクトルを前記意味ベクトル空間上に射影することによって定まる位置が含まれる場合、前記クエリをフラッディングで第4のピアに転送する第4のステップと、
    フラッディングで転送された前記クエリを受信した前記第4のピアのうち、前記クエリに含まれた前記詳細情報に対応するリソースのインデックス情報を有するピアが、前記インデックス情報を前記第1のピアに送信する第5のステップと
    を有することを特徴とするリソース検索方法。
  2. 前記第1のピアが、前記第4のピアから受信した前記インデックス情報を参照して前記リソース保持ピアから前記リソースを取得する第6のステップと、
    前記第1のピアが、取得した前記リソースにどの程度満足したかを表す満足値を前記リソース保持ピアに送信する第7のステップと、
    前記リソース保持ピアが、前記満足値に基づいて前記リソースのリソース意味ベクトルを更新する第8のステップと
    をさらに有することを特徴とする請求項1記載のリソース検索方法。
  3. 前記第8のステップは、
    前記クエリに含まれるクエリ意味ベクトルから前記リソースのリソース意味ベクトルを引いた差分ベクトルに前記満足値に基づく値を乗じた増加分ベクトルに基づいて、前記リソースのリソース意味ベクトルを更新する
    ことを特徴とする請求項2記載のリソース検索方法。
  4. 前記第8のステップは、
    前記リソース保持ピアにより、前記満足値が正の値の場合はリソースの評価を表す評価値を加算し、前記満足値が負の値の場合は前記評価値を減算する第9のステップと、
    前記評価値が所定の閾値以下になると、前記リソース保持ピアにより前記リソースを削除する第10のステップと
    をさらに有することを特徴とする請求項3記載のリソース検索方法。
  5. 前記第2のステップは、
    前記クエリ意味ベクトルの指定が困難な場合に、前記第1のピアが、前記クエリを伝播させる範囲を示す値を付与した前記クエリを隣接ピアにフラッディングで転送する第11のステップを備え、
    この第11のステップで転送された前記クエリを受信した前記隣接ピアのうち、クエリに含まれた前記詳細情報に対応するリソースのインデックス情報を有するピアが、前記第1のピアに前記インデックス情報を送信する第12のステップと、
    この第12のステップで前記インデックス情報を送信したピアが、前記クエリを伝播させる範囲を示す値を付与した前記クエリを隣接ピアにフラッディングで転送する第13のステップと、
    この第13のステップで転送された前記クエリを受信した前記隣接ピアのうち、前記クエリに含まれた前記詳細情報に対応するリソースのインデックス情報を有するピアが、前記第1のピアに前記インデックス情報を送信する第14のステップと
    をさらに有することを特徴とする請求項1乃至4の何れか1項に記載のリソース検索方法。
  6. 座標で表された各リソースの内容を表現したリソース意味ベクトルがマッピングされた空間からなり、この空間の部分が割り当てられた各ピアが前記空間の部分に射影されるリソース意味ベクトルに対応するリソースのインデックス情報を記憶することによりネットワーク上の複数のピアにより分散管理される意味ベクトル空間に基づいて、リソース保持ピアにより保持されているリソースを検索するリソース検索システムであって、
    前記リソース保持ピアは、
    前記リソースを保持するリソース保持手段と、
    前記意味ベクトル空間上に、前記リソースのインデックス情報を、当該リソースのリソース意味ベクトルを前記意味ベクトル空間上に射影することにより導出される前記意味ベクトル空間上の位置に対応する意味ベクトル空間の部分を管理するピアに記憶させるインデックス登録手段と
    を有し、
    リソースの取得を所望するユーザピアは、
    前記リソースの詳細情報および所望するリソースを表すキーワードを意味属性にマッピングしてベクトル成分が非零な軸およびその成分を決定することにより得られるクエリ意味ベクトルを含むクエリを取得を所望するリソースのリソース意味ベクトルを前記意味ベクトル空間上に射影することによって定まる方向のインデックス保持ピアに送信するクエリ送信手段
    を有し、
    前記インデックス保持ピアは、
    前記意味ベクトル空間上の自身が対応する位置に関連づけられたインデックス情報を保持するインデックス保持手段と、
    前記ユーザピアまたは隣接する前記インデックス保持ピアから受信した前記クエリを、前記意味ベクトル空間をピアで分割する際に各ピアが保持する隣接するピアのエンドポイント情報を参照して、このクエリに含まれる前記クエリ意味ベクトルを前記意味ベクトル空間上に射影することによって定まる方向に隣接するピアに転送する第1のクエリ転送手段と、
    隣接ピアから受信した前記クエリに含まれる前記クエリ意味ベクトルを前記意味ベクトル空間上に射影することによって定まる位置が、前記意味ベクトル空間上の自身が対応する位置の場合、前記クエリをフラッディングで隣接ピアに転送する第2のクエリ転送手段と、
    フラッディングで転送された前記クエリを受信し、このクエリに含まれた前記詳細情報に対応するリソースのインデックス情報を有する場合、前記インデックス情報を前記ユーザピアに送信するインデックス送信手段と
    を有する
    ことを特徴とするリソース検索システム。
  7. 前記ユーザピアは、
    前記インデックス保持ピアから受信した前記インデックス情報を参照して前記リソース保持ピアから前記リソースを取得するリソース取得手段と、
    前記リソース保持ピアから取得した前記リソースにどの程度満足したかを表す満足値を前記リソース保持ピアに送信する評価手段と
    をさらに備え、
    前記リソース保持ピアの前記インデックス登録手段は、
    前記満足値に基づいて前記リソースのリソース意味ベクトルを更新する
    ことを特徴とする請求項6記載のリソース検索システム。
  8. 前記リソース保持ピアの前記インデックス登録手段は、
    前記クエリに含まれるクエリ意味ベクトルから前記リソースのリソース意味ベクトルを引いた差分ベクトルに前記満足値に基づく値を乗じた増加分ベクトルに基づいて、前記リソースのリソース意味ベクトルを更新する
    ことを特徴とする請求項7記載のリソース検索システム。
  9. 前記リソース保持ピアの前記インデックス登録手段は、
    前記満足値が正の値の場合はリソースの評価を表す評価値を加算し、前記満足値が負の値の場合は前記評価値を減算し、前記評価値が所定の閾値以下になると前記リソースを削除する
    ことを特徴とする請求項8記載のリソース検索システム。
  10. 前記インデックス保持ピアの前記第2のクエリ転送手段は、
    前記クエリ意味ベクトルの指定が困難な場合、前記クエリをフラッディングで転送する際、当該クエリに伝播させる範囲を示す値を付与する
    ことを特徴とする請求項6乃至9の何れか1項に記載のリソース検索システム。
JP2004230961A 2004-08-06 2004-08-06 リソース検索方法およびリソース検索システム Expired - Fee Related JP4494901B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004230961A JP4494901B2 (ja) 2004-08-06 2004-08-06 リソース検索方法およびリソース検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004230961A JP4494901B2 (ja) 2004-08-06 2004-08-06 リソース検索方法およびリソース検索システム

Publications (2)

Publication Number Publication Date
JP2006048511A JP2006048511A (ja) 2006-02-16
JP4494901B2 true JP4494901B2 (ja) 2010-06-30

Family

ID=36026981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004230961A Expired - Fee Related JP4494901B2 (ja) 2004-08-06 2004-08-06 リソース検索方法およびリソース検索システム

Country Status (1)

Country Link
JP (1) JP4494901B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4908040B2 (ja) * 2006-03-31 2012-04-04 Kddi株式会社 情報検索方法
US7849069B2 (en) * 2006-06-21 2010-12-07 International Business Machines Corporation Method and system for federated resource discovery service in distributed systems
KR100885296B1 (ko) 2006-12-08 2009-02-23 한국전자통신연구원 판매콘텐츠를 이용한 인터넷 판매 방법 및 이를 위한 장치
KR101351076B1 (ko) * 2012-01-31 2014-01-16 더블유니버스 주식회사 태그 기반 소셜 유니버셜 네트워크 구축 시스템 및 그 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004038811A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004038811A (ja) * 2002-07-05 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 文献検索方法、文献検索装置、文献検索プログラム並びにそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
JP2006048511A (ja) 2006-02-16

Similar Documents

Publication Publication Date Title
Tang et al. Peersearch: Efficient information retrieval in peer-to-peer networks
US9336227B2 (en) Selective synchronization in a hierarchical folder structure
US7664742B2 (en) Index data structure for a peer-to-peer network
JP4671332B2 (ja) ユーザ識別情報を変換するファイルサーバ
US8423581B2 (en) Proxy support for special subtree entries in a directory information tree using attribute rules
US8990211B1 (en) Managing information about entities using observations
US9659023B2 (en) Maintaining and using a cache of child-to-parent mappings in a content-addressable storage system
KR20030047856A (ko) 데이터 처리 시스템, 데이터 처리 방법, 정보 처리 디바이스, 및 컴퓨터 판독가능 기록 매체
CN109471838B (zh) 目录文档的操作方法、装置、电子设备、可读存储介质
US8706732B1 (en) Managing information about entities using clusters of received observations
WO2013046667A1 (ja) 情報システム、その管理方法およびプログラム、データ処理方法およびプログラム、ならびに、データ構造
CN102891872A (zh) 一种对等网络中数据存储和查询的方法及系统
JP2012252705A (ja) 階層的な名前構造に基づいたネットワークにおけるコンテンツ要請者及びコンテンツ回答者の通信方法及び装置
JP4494901B2 (ja) リソース検索方法およびリソース検索システム
JP2007109237A (ja) データ検索システム、方法およびプログラム
JP2005063374A (ja) データ管理方法、データ管理装置、およびそのためのプログラムならびに記録媒体。
US8489675B2 (en) Configurable offline data store
JP4445451B2 (ja) リソース検索方法及びリソース検索システム
JP2007328736A (ja) リソース検索システム
Antonopoulos et al. Efficient resource discovery in grids and P2P networks
Lv et al. pservice: Peer-to-peer based web services discovery and matching
JP2020095434A (ja) 通信装置、通信方法、および通信プログラム
JP2005234762A (ja) リソース検索装置及び方法、ならびに、コンピュータプログラム
JPH08241329A (ja) 情報リソースのトポロジーの検索方法
Yamato P2P contents searching method using evaluation of semantic vectors

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090602

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091222

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100408

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees