JP2006107515A - ピアツーピア情報交換における意味相互運用性のための自己組織化方法 - Google Patents

ピアツーピア情報交換における意味相互運用性のための自己組織化方法 Download PDF

Info

Publication number
JP2006107515A
JP2006107515A JP2005292756A JP2005292756A JP2006107515A JP 2006107515 A JP2006107515 A JP 2006107515A JP 2005292756 A JP2005292756 A JP 2005292756A JP 2005292756 A JP2005292756 A JP 2005292756A JP 2006107515 A JP2006107515 A JP 2006107515A
Authority
JP
Japan
Prior art keywords
information
agent
category
information system
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005292756A
Other languages
English (en)
Other versions
JP4852288B2 (ja
Inventor
Luc Steels
スティールス、ルック
Peter Hanape
ハナペ、ペーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony France SA
Original Assignee
Sony France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony France SA filed Critical Sony France SA
Publication of JP2006107515A publication Critical patent/JP2006107515A/ja
Application granted granted Critical
Publication of JP4852288B2 publication Critical patent/JP4852288B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】 ピアツーピア情報システムネットワークにおける情報交換において、各ピアに関連するエージェントによって用いられる通信システムの意味相互運用性の問題を解決する。
【解決手段】 ここでは、普遍的に定義された概念的なスキーマに、予め定義された普遍的なオントロジーを強制するのではなく、これに代えて、各エージェントが基礎付けられた範疇及びこれらの範疇のためのラベルのレパートリを開発し、他のエージェントと、これらの使用及び意味を折衝する自然言語に似たメカニズムを用いる。したがって、この通信システム及びセマンティクスは、予め定義されているのではなく、創発的であり、適応性を有する。
【選択図】 図4

Description

本発明は、ピアツーピアネットワークにおける情報交換の分野に関する。詳しくは、本発明は、ピアツーピアネットワークにおいて情報を交換するピアの間での意味相互運用性を促進する方法及びシステムに関連する。
情報システムは、データのコレクション及び場合によっては、何らかの概念スキーマに基づいて構造化されたメタデータの集合を含む。この明細書では、「メタデータ」という用語を広義に使用し、この用語の意味には、情報の出所に関するデータ、例えば、作者、アーチスト、作成日時、ジャンル、作成国等が含まれ、これらは、多くの場合、事前情報がなくては判定できない。更に、メタデータには、関連するコンテンツ自体を記述するデータ(予備的な知識がなくても判定することができる。)も含まれ、このようなデータとしては、例えば、以下のようなデータがある。
・楽曲に関しては、その楽曲のテンポ、ピッチ、パーカッション性(percussivity)等を記述するメタデータがある。
・映画については、その映画が主として屋内で撮影されているか、野外で撮影されているか、都市の光景を含んでいるか、自然な景観を含んでいるか等を記述するメタデータがある。
・文書については、そのキーワード(統計的解析によって判定できる)等を記述するメタデータがある。
・画像については、色ヒストグラム、画像が合成画像であるか写真であるかを示す情報、オブジェクトに由来するデータ、画像における形状検出/認識等を記述するメタデータがある。
この他にもコンテンツの種類に応じて様々なメタデータがある。
データ及びメタデータは、いずれも、いつでも新たなデータを追加し、又は削除できるという意味で、無制限(open-ended)であると言える。システムは、外部ソースから新たなメタデータにアクセスでき、例えば、ウェブサービス等として利用可能な信号処理アルゴリズムによってテンポを算出できる。
ユーザインタラクション性を実現するために、情報システムにより、ユーザは、通常、ユーザ自身が命名した範疇に基づいて、概念階層的に(taxonomically)にデータを構造化でき、これによりユーザは、これらの名称の用いてアイテムを検索することができる。情報システムの典型的な具体例を以下に示す。
・ブックマークフォルダ内に組織化されたユーザの「お気に入り」のウェブページ。この場合、データは、ウェブページに対応するURLからなり、概念階層は、ユーザがウェブページを検索するためにブラウズできる命名されたフォルダの階層である。概念階層(taxonomy)は、ユーザによるウェブページの範疇化を暗示的に定義している。
・一連の命名された階層的なプレーリストとして構成されている、ユーザによって維持される一組の音楽ファイル。
・ユーザの特定の興味に基づいて組織化された一組の画像。例えば、病理に沿って組織化された一連の医療画像、又は時代、ジャンル及び画家に沿って構成された一連の絵画。
・特定の研究テーマに沿って構成された一組の科学論文。
情報システムのオーナとも呼ばれる人間のユーザは、情報システムにデータを追加し、概念階層の形式でデータを構造化し、概念階層のノードに名称を与えることによって自らの情報システムを制御する。なお、これらの概念階層によって暗示されるユーザによる範疇化は、他のユーザ又は情報システムがアクセスできない個人の認知過程に基づいている。例えば、ユーザは、ユーザが好きな全ての曲を1つのフォルダに入れ、好きではない他の曲を別のフォルダに入れると決めることができる。この範疇化判断は、完全に主観的であり、マシンがこれを自動化又はエミュレートすることはできない。
ユーザによって作成及び維持された概念階層を、ここでは「オーナ概念階層」と呼ぶ。この概念階層で用いられる名称(単語又はフレーズであってもよい。)は、オーナ名である。概念階層は、範疇化の特定の手法(オーナによる直感的なレベルでしか知ることができない場合もある。)を含意し、これを、ユーザオントロジーと呼ぶ(図1参照)。ユーザオントロジーは、概念階層内で暗示的に含意されているが、これ以外の手法で知ることはできない。また、図1は、情報システムがある特定の概念的スキーマに基づいて組織化されたメタデータを用いる状況を示している。
ピアツーピア情報システムは、このような情報システムのコレクションからなる。各情報システムは、異なるユーザによって所有及び維持され、他の情報システムから独立して機能すると仮定される。通常、各情報システムは、ユーザが所有するコンピュータシステムに含まれ、ユーザは、コンピュータシステムにおいて実行されるアプリケーションソフトウェア(例えば、情報システムのデータ集合をブラウズするためのアプリケーションソフトウェア)に関連するインタフェースを用いて情報システムとインタラクトできる。
ピアツーピア情報システムの定義の特徴は、各ピア間で、中央サーバを介する必要なく、直接情報交換が可能であるという点である。ピアツーピア情報システムの具体例としては、例えば、現在、多くの人々によって既に用いられているナップスター(Napster)又はグヌーテラ(Gnutella)等のピアツーピア音楽ファイル共有システムがある。映画又はゲームソフトのための同様の共有ネットワークも普及している。科学的データ又は教材の分野でも、ピアツーピア共有システムのネットワークが広まりつつある。
ピアツーピア情報システムにおいては、1つの情報システムのオーナは、追加的データを得るために、他の情報システムに対して直接クエリを発する。クエリを発するピアの情報システムは、クライアントと呼ばれ、情報を提供する情報システムは、サーバと呼ばれる。具体例を以下に示す。
・ウェブユーザが、興味がある可能性があるウェブページを見つけるために、他のユーザのブックマークフォルダを問い合わせる。
・ユーザが、ユーザにとって、興味がある可能性がある楽曲を見つけるために他のユーザのプレーリストを問い合わせる。
・ユーザが、ユーザ自身の興味に関連する画像を見つけるために他のユーザの画像データベースを問い合わせる。
・研究中の研究題目の1つに関連する論文を探しているユーザが、他のユーザによって保存されている論文の組を問い合わせる。
ピアツーピア情報システムでは、如何なるノードもクライアント又はサーバとして動作することができる。なお、ユーザは、各オーナが自らのデータを組織化した概念階層を介して通信する。
ピアの間の情報交換は、サーバにデータを要求するためのクエリを発するクライアントの具体例に制限されない。ユーザは、(例えば、データを他のユーザに提供することを前提として)他のピアに対して、ユーザ自身の情報システムのデータを公表する告知を発してもよい。この場合も、ユーザは、告知を定式化する際に、ユーザ自身の概念階層を使用する。
ピアツーピア情報交換には、2つの主要な問題がある。第1の問題は、一方のピア(クライアント)の概念階層で用いられるデータ及び名称が、他のピア(サーバ)によって用いられるデータ及び名称とは通常異なり、したがって、クライアントのオーナは、クエリをどのように定式化するかがわからず、また、サーバのオーナ又はサーバ自体は、クエリがその(サーバの)概念階層に基づいて定式化されていなければ、どのように応答していいかがわからないという問題である。これは、現在動作しているピアツーピアシステムのユーザにとって、現実的な問題である。例えば、音楽ファイル共有ネットワークにおいて、ユーザは、データのタイトルやフォルダ及びサブフォルダに与えられた名称の意味を推測しなくてはならない。
第2の問題は、特に、メタデータがそれ自体無制限の場合、各情報システムにおいて、データ及びメタデータを保存するために用いられる概念的なスキーマは、互いに大きく異なる可能性があるという問題である。例えば、異なる言語の使用等の単純な不一致も問題となり得る。例えば、クライアントがメタデータ「country(Belgium)」を有し、サーバがメタデータ「pays(Belgique)」を有している場合もある。意味的な知識がなければ、情報システムは、これらの2つのメタデータをどのように互いにマッピングするかを知ることができず、したがって、クライアントは、自らのメタデータを用いて、サーバへのクエリを定式化することができない。
これらの問題は、いずれも、所謂「意味相互運用性(semantic interoperability)」問題の具体例である。
意味相互運用性の1つの解決策は、標準化である。すなわち、ピアツーピアネットワークの異なるユーザが、同じ概念階層を用いてデータを構造化すること及びデータ及びメタデータのために同じ概念的なスキーマを用いることを予め同意すればよい。これにより、概念階層のオーナ名は、ピア間の共有された通信プロトコルとして機能できる。例えば、全てのユーザが、データの組織化のためにヤフー(Yahoo)の概念階層を用い、ヤフーによって用いられている名称(他言語への翻訳を行ってもよい。)を採用することに同意すればよい。
しかしながら、このような標準化方式は、音楽ファイル共有、医療画像又は科学論文等の絶えず変化する分野における真の無制限(オープンエンド)のピアツーピアネットワークにおいては、良好に機能しない。これらの分野では、新たなトピック及び新たな種類のデータが次々と登場し、スタイルは、移行し、ユーザの興味は、様々に分岐する。また、旧式のシステムをピアツーピアネットワークに参加させる必要がある場合もある。静的なオントロジーによってこれらの全てを一度に捕捉することは困難である。
これに代えて、各ピアがそれ自身のローカルな概念階層及びそれ自身の概念的スキーマを有し、これらを包括的なオントロジー及び概念的スキーマに翻訳し、ピア間の中間言語としてこれらを用いてクエリ及び情報交換を行うこともできる。この翻訳は、できるだけ多くの概念階層の名称のセマンティクスの定義に基づいて行うことができる。例えば、ユーザが自らの音楽ファイルシステムに、ビートルズの曲のサブフォルダを有する場合、暗示された範疇のセマンティクスは、メタデータ「performed-by(TheBeatles)」を介したクエリに翻訳される。そして、このクエリは、(例えば、仲介処理による翻訳の後に)ピアのメタデータを介したクエリに用いることができる。
これは、現在、ウェブ情報システムに関して、セマンティックウェブ(Semantic Web)(「"The Semantic Web" by T. Berners-Lee and J. Hendler, Scientific American, May 2001」参照)が提唱している方式であり、より一般には、例えば、CYC又はWordnet(「"CYC, Wordnet and EDR - critiques and responses - discussion" by D. Lenat et al, Comm.of the ACM 38 (11), Nov.1995, pp. 45-48 at http://www.acm.org/pubs/articles/journals/cacm/1995-38-11/p24-lenat/p45-lenat.pdf」参照)が提唱する「普遍的な」オントロジー("universal" ontologies)によって開発されている方式である。共通のオントロジー、これらのオントロジーを定義するためのサポートシステム、ローカルなスキーマをグローバルなスキーマにマッピングするための手法、情報検索でオントロジーを用いるメカニズム、すなわち、データに範疇をマッピングするためのメカニズムの開発には、多大な労力が払われている。しかしながら、これらの手法には、以下のように、幾つかの大きな短所があるという懐疑的な意見も多い。
・普遍的なオントロジーに依存するセマンティックウェブは、単に、意味相互運用性の問題を他のレベルに転嫁しているだけである。このレベルでは、結局、普遍的なオントロジーに基づく規格化が必要になる。現在、情報システムが用いられているは、人間の活動のあらゆる分野で、規格に関する世界的な合意が得られ、これを強要できるようになることは、想像し難い。限定された分野においてさえも、相互接続された包括的な世界が絶えず拡張しているため、これは困難である。
・人間の活動及びこれらのために構築される情報システムは、オープンシステムである。これらは、固定的に決定することはできず、常に新たなニーズに適合させなければならない。
・ピアツーピア情報システムは、分散型システムである。このシステムには、中央制御局はなく、したがって、集中的な制御は不可能である。
・多くの情報システムが既に存在しており、これらをピアツーピアネットワークに参加させることができる手法を見出さなくてはならない。
本発明者らは、意味相互運用性を実現する新たな手法を開発し、これにより、情報システムは、コンポーネントによって拡張され、ピアは、データ世界及び人間のユーザの世界とのインタラクションにおいて、自らの通信プロトコルを開発及び折衝できる。これにより、エージェントは、それぞれがローカルで解釈できる中間言語を自律的に作成する。この合意は、人間の自然言語と同様に、創発的であり、適応型であり、ローカルなものである。
本発明で用いる手法は、ロボット対ロボット及びロボット対人間の通信のための言語ゲームに関する近年の研究に由来する技術(国際公開公報WO98/26368参照)を採用したSASI(意味相互運用性への自己組織化方式:Self-organisation Approach to Semantic Inter-operability)に基づくものであるが、本発明の目的に適用可能にするために、これらの技術を拡張及び変更している。
本発明では、意味相互運用性は、世界と、情報システムと、人間のユーザとの間の協調の問題とみなされる。ここでは、特定の種類の「記号論的力学(semiotic dynamic)」を定義し、ピアツーピア通信で用いられるラベルと、エージェントがこれらのラベルを解釈するために用いる範疇の両方をピアツーピア情報交換の副次的効果として、整合させる。情報交換で用いられるラベル及びラベルの意味は、創発的であり、各ピアにおいてメタデータのために用いられる概念的なスキーマは、ローカルであり(他のピアによって用いられているスキーマから独立しており)、拡張可能である。
エージェントのインタラクションを介して、一種の中間言語が出現する。この中間言語は、固定されず、ピアのグループ間で、ローカルに特化することができる。各エージェントのオントロジーを定義する範疇は、純粋に、ローカルなメタデータに関して定義され、したがって、これらは一定ではない。
本発明は、ピアツーピアネットワークを介して情報を交換できる他の情報システムとの意味相互運用性を実現する、特許請求の範囲に開示する情報システムを提供する。
更に、本発明は、このような情報システムで用いられる情報交換方法を提供する。
更に、本発明は、特許請求の範囲に開示する、意味相互運用性を成長させるクライアントモード又はサーバモードで動作可能な情報システムを備えるピアツーピア情報交換ネットワークを提供する。
更に、本発明は、特許請求の範囲に開示する、情報システムの間で情報を交換するピアツーピアネットワークにおける情報交換の管理方法を提供する。
本発明の更なる特徴及び利点は、図面を参照した以下の好適な実施形態の説明により明らかとなる。
まず、本発明の好適な実施形態に基づくSASI方式の基礎となるメカニズムについて、図2及び3を参照して説明する。
本発明の好適な実施形態では、ピアツーピア情報交換で用いられる情報システムに、情報エージェント(information agent:IA)と呼ばれる更なるコンポーネントを設ける。このエージェントは、ピア間のインタラクションを調整する役割を果たす。情報エージェントは、多くの場合、ソフトウェアによって実現される。情報エージェントをどのように実現するかの詳細は、本発明の理解には関係せず、エージェントによって実行される機能に関する以下の説明に基づき、当業者は、様々な手法で情報エージェントを実現できる。したがって、この点に関する詳細は、ここでは説明しない。
まず、幾つかの形式的な定義について説明する。
定義:
本発明の好適な実施形態では、3つのタプルからなるピア情報システムPIを利用する。
PI=<IS,O,IA>
・IS=<D,MD,L,M>は、データDの集合、メタデータMDの集合、名称Lの集合、及び列挙(enumeration)によってDの下位集合に名称をマッピングする概念階層M:L→ρ(D)からなる情報システムである(ρ(D)は、Dのベキ集合であり、すなわち、Dの全ての下位集合の集合である)。情報システムは、同じデータについて複数の概念階層を維持することもできる。名称及び概念階層は、情報システムのユーザオントロジーを暗示的に定義する。
・Oは、データを追加又は削除し、データを概念階層Mに組織化するという意味で情報システムを管理する(人間の)オーナを表す。オーナは、自らの情報システムに利用可能なメタデータへのアクセス又はこれに関する知識を必ずしも有していなくてもよい。
・IA=<L’,M’>は、ラベルL’の集合及びラベルL’をDの下位集合にマッピングする他の概念階層M’:L’→ρ(D)を定義する情報エージェントである。情報エージェントの概念階層は、列挙によっては定義されず、(後述するように)範疇の集合に基づいて定義される。
ピアツーピア情報ネットワークNは、ピア情報システムの集合:N={PI,・・・,PI}からなる。ここで、情報システムPI(クライアントとも呼ばれる)のオーナOが、他のユーザOが所有する他のピア情報システムPI(サーバ)から、クエリによって情報を得ようとしたとする。クエリを定式化する場合、人間のユーザは、自らがデータに課したローカルの概念階層Mを使用する。ピア間の通信は、それらの情報エージェントによって用いられるラベルL’に関して行われる。
ここで検討するピアツーピア情報ネットワークは、完全に無制限(オープンエンド)なものとする。すなわち、PIのオーナは、新たなデータ、新たなメタデータ、新たなラベル又はMの変更をいつでも、導入できる。新たなピア情報システムを追加し、又はトータルのネットワークから削除することができ、どのピアが、他のどのピアと通信できるかに関する制約は、全くない。
理想的な状況では、N内の全てのPIについて、L=L’,M=M’が真であり、換言すれば、情報エージェントは、オーナがセットアップしたものと同じラベル及び同じマッピングを用い、ネットワーク内の全てのピア情報システム(N内の全てのPI)が同じL及びMを用いる。
∀ i,j PI,PI∈P→L=L且つM=M
これらの条件が実際に成立していれば、ピアツーピア情報交換は、容易に実現できる。クライアントは、クライアントが問い合わせている種類のデータの集合をDとし、(l,D)∈Mとして、ラベルl∈Lを送信することによってクエリを発行する。サーバは、自らのマッピングMを自らのデータ集合に適用した結果得られたデータにより応答する。ラベルlを有するクエリは、サーバsからDの下位集合に等しい応答Rを呼び出す。すなわち、(l,R)∈Mとして、R={d,・・・,dk+p}⊂Dである。ここでは、オーナ及びエージェントの概念階層が同じであり、したがって、情報エージェントは、その役割を果たす必要がない。
例えば、クライアントが、「創発的セマンティクス(emergent semantics)」に関する論文の集合p,・・・pを有している場合、すなわち、M(’emergent−semantics’)={p,・・・,p}である場合、同じトピックに関する更なる論文を得るために、クライアントは、サーバとして機能する他のピアに、ラベル「emergent−semantics」を送信する。例えば、M(’emergent−semantics’)={q,・・・,q}の場合、各qは、応答として送信するための候補となる。
現実世界では、ネットワーク(N)内のピア情報システム(PI)のオーナは、多くの場合、互いに異なる名称L及びマッピングMを使用する(また、通常、それらの情報システムは、それぞれ異なるスキーマに基づいて組織化されたメタデータを用いる)。この結果、クライアントPIによって用いられる名称及びマッピングは、サーバPIによって用いられる名称及びマッピングとは、必ずしも同じにはならない。本発明の好適な実施形態では、情報エージェントによって用いられるラベル及びマッピングは、それらのオーナによって用いられる名称及びマッピングと必ずしも同じではない。換言すれば、所定のPI∈Nについて、L≠L’、M≠M’の可能性がある。
本発明の好適な実施形態では、情報エージェントによって、通信に用いられるラベルについての折衝を行うと同時に、これらのラベルに関連する範疇のセマンティクスを調整する。換言すれば、全ての情報エージェントのラベルL’は、各エージェントが自らのマッピングM’を用いて情報システムのローカルデータ集合へのマッピングを行う「共有言語」になる。なお、これは、概念階層が基礎付けられた範疇、すなわち、データを下位集合にフィルタリングするためにメタデータに適用できる範疇を用いて実現されるという意味において、情報エージェントが人間のユーザと同様の認識的な能力を有することを意味する。なお、情報エージェントは、人間のユーザと全く同じではなく、任意にメタデータを利用しなくてはならない。
サーバによる所定の応答がクライアントのオーナに関連しているとみなされる場合、通信は、成功する。実際には、システムは、常に流動的であるので、共有は、常に部分的になる。更に、ピアのサブネットワーク内で多くの「サブ言語」が現れることを予想しなければならない。各サブ言語は、ピアのサブネットワークの興味を反映する。幾つかのアプリケーションでは、これらのサブネットワークは、「委託された共同体(trusted communities)」(情報システムのオーナが選択してもよい)に対応してもよい。
例えば、クライアント情報システムのオーナがサーバに要求する要素の種類の良い実例であると考えられるデータ要素の集合G∈Dを特定することによって、オーナが、クエリを開始したとする。オーナは、完全に自らの制御の下にあるオーナ概念階層のラベルを用いることによって又は他の手法を用いてユーザの情報システムのデータ集合の実例の下位集合を明示的に指定することによって、これを実行することができる。
例えば、オーナの情報システムが(例えば、インターネットを介して)音楽ファイルを交換できるピアツーピアネットワークに接続可能な、音楽ブラウザソフトウェアをロードしたパーソナルコンピュータである場合、オーナは、ポインティングデバイス(キーボード、マウス等)を用いて選択された実例を特定し、オーナが音楽ブラウザアプリケーションで定義したプレーリストを選択することができる。アプリケーションがどのように実現されているかの詳細に応じて、オーナがプレーリストを選択すると、類似する曲の検索が、ピアツーピアネットワーク上に送出され、又は検索を送出するために、オーナによる他の明示的な操作を要求してもよい。本発明では、ユーザの情報システムとインタラクトするためにオーナが用いることができるアプリケーションソフトウェア、インタフェース及びデバイスの詳細は、オーナが(必要であれば、ユーザ自身の概念階層に基づいて)ピアツーピアネットワークを介して、検索又は交換のためにどのデータを選択しているかを示すことができる限り、如何なるものであってもよい。
とは区別される他のデータ要素(反例(counter-examples))からなる特定のコンテキストK∈D内において、オーナのクエリは、定式化できると仮定される。最も一般的な状況では、K=D\Gである。
サーバは、データ要素の集合R⊂Dによって応答し、クライアントのオーナは、ユーザが関連していると考えるF⊆Rのデータ要素を示すことによってフィードバックを行い、これにより、反例又は否定的実例B=R\Fを算出することができる。そして、クライアントのオーナの希望に応じて、「良い」データFがクライアントのデータ集合に追加される。如何なるデータ要素も関連していない場合、又はサーバが如何なるデータも提供できない場合、通信は失敗し、情報エージェントは、本発明の好適な実施形態に基づき、後に詳細に説明するように、リペア動作を実行する。
システムの総合的な性能は、サーバからクライアントへの応答が成功した回数によって測定することができる。なお、クライアントのオーナは、対象となるアイテムの選択、要求を満たしたサーバからアイテムが受信されたか否かの判断、あるアイテムを保存するか否か、及びユーザ自身のオントロジーに基づいて、アイテムをどこに保存するかに関する決定の全てにおいて、極めて重要な役割を担う。人間のユーザの役割は、本発明にとって重要であり、これは、情報交換について、オーナが直接の影響を有さない創発的言語(emergent language)方式を利用した従来の提案とは大きく異なる点である。
情報エージェントがデータを構造化するために用いる概念階層M’を実現するために、エージェントがアクセスできるデータ又はメタデータについて機能する範疇Cの集合を各情報エージェントが維持すると仮定する。例えば、科学的論文は、アクセス可能なメタデータとして、著者、キーワード、発行媒体及び要約を有することができ、音楽ファイルは、関連するメタデータとして、作曲者、演奏者、録音日時等を有することができる。
エージェントの範疇の集合は、通常、情報システムのスタートアップ時には、すなわち、情報エージェントが他の情報システムと通信する前には、空集合である。情報エージェントは、互いに通信しながら、自らの範疇の集合を確立する。範疇は、データ要素がその範疇に属すか否かを決定する関数として演算可能化される。エージェントによって用いられる範疇の集合は、無制限であり、時間に依存し、異なるエージェントの範疇は、必ずしも同じである必要はない。
各エージェントは、コンテキスト(例えば、反例の集合)から、トピック(例えば、ユーザによって選択された実例の集合)を差別化しようとすることによって範疇を確立する。エージェントは、コンテキストからトピックを区別できる特徴又は特徴の集合を見つけようとする。例えば、特徴(<ジャンル(ロックンロール)>)のように、特徴は、多くの場合、属性(例えば、メタデータの特定のアイテム、例えば、保存された音楽ファイルの「ジャンル」)と、値(例えば、「ロックンロール」)とからなる。特徴又は特徴の集合は、トピックをコンテキストから区別できる場合、「弁別的である」。
トピック及びコンテキストデータを処理し、コンテキストとトピックとを区別する「範疇」(特徴又は特徴の集合)を決定する幾つかのよく知られた手法がある。本発明の好適な実施形態では、情報エージェントは、それらの範疇を決定するために、如何なる周知の技術を用いてもよい。
情報エージェントは、データ自体及び利用可能なメタデータのいずれか又は全てを用いて、範疇を決定することができる。メタデータは、予め存在していてもよく(例えば、関連データをロードするのと同時に情報システムにロードしてもよく、情報システムがアクセス可能なカタログ又はサーバ上に保存されていてもよい)、又は関連データの解析によって(情報システム内又はシステムと通信するデバイス内で)自動的に判定してもよい。
各情報エージェントは、エージェントラベルL’から範疇Cの集合への双方向マッピングWを維持する。また、このマッピングは、エージェントの辞書又はレキシコンとも呼ばれる。範疇及びラベルの間の各関係は、所定の強度γ⊆[0.0,1.0]を有し、これは、情報エージェントが過去にこの関係を用いて到達した成功を反映している(後により正確に定義する)。(符号化において)同じ範疇について2つ以上のラベルがある場合、又は(復号においての)同じラベルについて2つ以上の範疇がある場合、エージェントは、最も強い強度を有する関係を用いるとよい。
これらの考察は、以下のような、充実された定義の集合に反映される。
時間tにおけるピア情報システムaは、以下のように定義される。
PIa,t=<ISa,t,O,IAa,t
ここで、
・ISa,t=<Da,t,MDa,t,La,t,Ma,t>は、データDの集合、メタデータMDの集合、名称Lの集合、拡張された定義によってDの下位集合に名称をマッピングするマッピングM:L→P(D)からなる情報システムである。
・Oは、情報システムの(人間の)オーナである。
・IAa,t=<L’a,t,Ca,t,M’a,t,Wa,t>は、ラベルL’の集合、範疇の集合C:P(MD)→P(D)及びW=C×L’×[0.0,1.0]を有する情報エージェントである。この範疇は、概念階層M’を実現する。
時間tにおけるピアツーピア情報ネットワークは、いつでも要素を追加又は削除できる集合:N={PIa1,t,・・・PIan,t}として定義される。
この設計の最終的な目的は、情報交換における成功を最適化することである。本発明の好適な実施形態は、情報エージェントaが範疇集合Cを開発及び使用し、他のエージェントと協働して、これをラベルL’の集合に関連付けるためのメソッドを定義する。実際の解決策は、次のような幾つかの更なる制約条件を満たさなければならない。(1)クライアントは、サーバの内部状態にアクセスできず、これを変更することもできない。(2)ピアの間のインタラクションは、純粋にローカルである。(3)各ピアがいつでも変化できるという意味において、ピアは自律的である。(4)ピアは、分散され、包括的な同期はなく、ピアは、平行して動作できる。(5)人間のオーナは、情報エージェントの内部状態を調べる必要がなく、また、これを変更することができない。
図3に、この明細書の残りの部分で詳細に説明する処理にかかわる異なるエンティティ、情報アイテム及びマッピングを要約して示す。図3において、Lは、情報エージェントのレキシコンを示す。
静的なシステム(Static System)
説明を明瞭にするために、まず、「静的な」システムのために情報エージェントが用いるプロトコルの詳細を示す。すなわち、ここでは、情報エージェントがピアツーピア情報交換を実現するために必要な範疇及び交換ラベルを有することを仮定する。次に、システムを「動的な」システム(すなわち、情報エージェントが適応的にそれらの範疇及びラベルを定義するシステム)にするための必要な拡張を考慮して、説明を続ける。
図4に、静的なシステムで用いられるプロトコルを示す。これは、クライアントがサーバにクエリを発する特定のピアツーピアトランザクションの間に生じる処理を示している。
なお、ピア間のトランザクションを示すために用いる各図においては、左側は、クライアント側の動作を示し、右側は、サーバ側の動作を示す。これらの図の中央には、クライアントとサーバとの間で交換されるアイテムを示している。
なお、図4に示す「静的システム」のトランザクションでは、クライアントのオーナは、自ら、初期のターゲット集合G及びコンテキストKを選択し、応答Rのどの下位集合が関連しているかを判定し、及びユーザ自身の情報システムの部分としてこれを保存するべきであるかを決定する。
図4に示すインタラクションを実現するためには、範疇化(クライアントステップ2)、フィルタリング(サーバステップ2)、符号化(クライアントステップ3)、復号(サーバステップ1)といった4つの機能の定義が必要である。
本発明は、例えば、科学論文、お勧めのウェブサイト、映画、画像、音楽等に関連するクエリ(又はオファー)を始めとするピア間での異なる種類の情報交換に適用可能である。特定のクエリに関する包括的なコンテキストは、例えば、クライアントとサーバの間の以前のインタラクションに基づいて、ピアツーピアネットワーク(例えば、音楽ファイル交換専用のネットワークであってもよい)自体の性質に基づいて等、暗示的に判定してもよく、或いは、例えば、クエリの統語構造に基づいて明示的に判定してもよい。
クライアントのクエリの特定のコンテキストKは、先のインタラクションによって暗示的に判定してもよく、可能なオブジェクトの総合的な集合:K=Dに等しいデフォルトとしてもよい。同様にサーバがKを処理するコンテキストは、先のインタラクションによって暗示的に判定してもよく、サーバのデータ要素の総合的な集合:K=Dに等しいデフォルトとしてもよい。また、クライアントは、ターゲット集合(良い実例:good examples)と共にコンテキストを特定するデータ(悪い実例:bad examples)を送信してもよい。コンテキスト判定のためのメソッドは、特定のアプリケーション及びユーザの情報システムとユーザのインタラクションの履歴に依存する。
なお、クライアントがサーバに実例及び/又は反例を送る場合、如何なる周知の手法で実例/反例を送信してもよい。例えば、オンラインカタログにおいて、実例/反例を特定するコードを送信してもよく、実例/反例に対応するMP3ファイルを送信する等してもよい。
範疇化及びフィルタリング
ピアツーピア情報交換の自己組織化では、各情報エージェントがデータの集合Gのメンバを他の集合Kから区別することができる必要がある。データ集合は、いつでも変化できるので、この区別に用いられる範疇の集合も、これに応じて適応化する必要がある。
実例のターゲット集合をGとし、Gの要素と区別する必要があるコンテキストをKとする。更に、c∈Cを、データ要素dが与えられると、cによって定義される範疇にdが属するか否かに基づいて1又は0を返す関数として定義する。cが真となる集合S内の要素のパーセンテージφ(S,c)は、以下のように表される。
Figure 2006107515
所定のG及びKについて、範疇cの弁別的な成功discは、以下のように定義することができる。
disc(G,K,c)=φ(G,c)−φ(K,c
範疇c∈Ca,tは、以下のように、弁別的な成功に基づいて降順に並べ替えることができる。
[<c,p>,・・・,<c,p>]
ここで、c∈C且つp=disc(T,G,c)且つp,pi+1→p≧pi+1である。
明らかに、cがKの要素からGの要素を良く区別する程、disc(G,K,c)が大きくなり、したがって、上のシーケンスの第1の要素は、最も弁別的な範疇に対応する。したがって、所定の範疇の集合Cについて、コンテキストKから選択されたトピックGを分類する関数は、以下のように表すことができる。
categorize(C,G,K)=first([<c,p>,・・・,(c,p>])
複数の範疇c,・・・,cが最大の弁別的能力を有する場合、すなわち、p=・・・=p且つp,・・・,p>pの場合、情報エージェントは、更なる発見的手法を用いてGのための範疇を選択してもよい。例えば、情報エージェントは、他のエージェントとの先の交換において用いて、最も成功した範疇を選択しても良い。(例えば、閾値レベルθdiscに比べて)最も良い範疇cの弁別能力が不十分である場合(すなわち、p<θdiscである場合)、エージェントは、既存の範疇を再利用することに優先して、新たな範疇の作成を試みる。
範疇は、どの要素がそれを満たすかを選択するためのフィルタとして用いることができる。
filter(D,c)={d|d∈D且つc(d)=1}
1つの情報エージェントの範疇は、他のエージェントの範疇とは、完全に異なることがあり、エージェントにとって完全にローカルなものであると仮定される。情報システムのオーナは、情報エージェントの範疇を直接見ることはできず、情報エージェントの範疇は、実際、オーナがデータに課した概念階層とは大きく異なることもある。エージェントによって用いられている名称を人間のオーナが変更できないようにシステムを設計することが望ましい。これは、中間言語の成長に有害である可能性がある人間の干渉を避け、更に、中間言語を(使用不能になるように)操作しようとするハッカーによる悪意の侵入の危険を避けるためにも重要である。
範疇は、如何なる種類のデータ、メタデータ又は範疇を算出するために利用可能な追加的リソースを利用してもよい。また、範疇は、0又は1を返すのではなく、よりファジーであってもよく、フィルタ関数において、更に低い閾値を用いてもよい。当業者は、範疇化器を実現するための、及び新たな範疇を構築するための多くの異なる手法を想到できる。本発明は、範疇化器を実現し又は新たな範疇を構築するための特定の手法には制限されない。
また、単一の範疇に代えて、(範疇の数を最小化し、メタデータとして必要な属性の数を低減する)複合的な範疇を用いることを想到することも容易である。
符号化及び復号
次の問題は、エージェントが範疇をラベル:W=C×L’×[0.0,1.0]に関連付けることができると仮定して、ピアツーピア交換のために用いるラベルをエージェントがどのように符号化し、復号するかという問題である。
範疇cを表現する必要があると仮定すると、エージェントは、以下のように、cとラベルlとの間の関係の強度γに基づいて、可能なラベルのリストを順序集合として構築することができる。
labels(c,W)=[<l,γ>,・・・,<l,γ>]
ここで、<c,l,γ>∈W且つγ≧γi+1である。
符号化されたラベルは、この順序集合の第1のエントリである。
code(c,W)=first(labels(c,W))
逆に、ラベルlが与えられたとすると、情報エージェントは、以下のように、lと範疇cとの間の関係の強度γに基づいて、可能な範疇のリストを順序集合として構築することができる。
cat(l,W)=([<c,γ>,・・・,<c,γ>])
ここで、<c,l,γ>∈W且つγ≧γi+1である。
復号された範疇は、この順序集合の第1のエントリである:
decode(l,W)=first(cat(l,W))
この処理は、範疇の結合(すなわち、集合)の符号化又は復号に容易に拡張することができる。
レキシコンWは、範疇の集合を単語に関連付けることができる。符号化では、弁別から生じた範疇の集合をカバーする最小数の単語を検索し、復号では、各単語に関連している最小数の範疇を再構築する必要がある。
動的なシステム(Dynamic System)
以下、クライアント及びサーバエージェントが、通信における失敗に対処するために、及び将来の成功率を高めるようにそれらの内部状態を適応化するためにそれらのインベントリ(inventories)(L’,W,C)を変更するメカニズムについて説明する。
本発明の好適な実施形態において実現される1つの主要な発想は、人間のコミュニケーションにおいて対象を指す場合と同様に、情報交換における失敗を修正する手法としてデータ要素の実例を用いるという点である。
サーバが特定のラベルを知らない場合、クライアントは、クライアントのクエリに対応する実例(及び、反例)をサーバに示すことができる。クライアント及びサーバによって交換される実例及び反例の数は、特に制限されない。より多くの実例/反例が提供される程、意図する範疇の性質に関するより正確な指示が得られることは明らかである。但し、実例/反例の数を増やすと、クライアントとサーバとの間の通信が占める帯域幅が広くなり、処理時間も長くなる。本発明の好適な実施形態では、送信に望ましい数より、利用可能な実例/反例の数が多い場合、これらの利用可能な実例/反例から、実際に送信する実例/反例を選択する。この選択では、実例データだけではなく、反例データも選択することが望ましい。
サーバは、クエリに応答してサーバが送信したデータがクエリに関連しており、したがって、そのラベル及び範疇をクライアントのラベル及び範疇に揃えることができるか否かに関するフィードバックを得る。
ここで、以下のように、考慮する必要がある5種類の状況がある。
・インタラクション成功:この場合、エージェントが用いる範疇及び規則の補強(re-enforcement)(ラベル/範疇の関係の意味で)をトリガするべきである。
・クライアント側での失敗:この場合、新たな範疇及びこの範疇のための新たなラベルの作成をトリガするべきである。
・サーバ側での失敗:この場合、サーバ又はクライアントによる新たなラベルの採用及び可能性として新たな範疇の作成をトリガするべきである。
・部分的な成功:これは、サーバがラベルを復号できたが、サーバによって返された結果は、クライアントのオーナにとって、部分的に無関係だとみなされた場合である。
インタラクション成功
インタラクションが完全に成功した場合、クライアントによって特定された「関連集合」Fは、空集合ではなく、Rに等しく、換言すれば、クライアントは、良い実例だけを受け取り、この事実をサーバに知らせる。これは、クライアントによって用いられた、catと命名されたラベルlが、サーバによるこのラベル(cat)の解釈及びユーザの意図の両方に互換性があったことを意味する。この場合、クライアント及びサーバの両方が、それぞれ、ラベルから範疇へのマッピングを更新し、これにより、範疇cat及び範疇catのためのラベルlの使用が将来的に補強される。これは、使用されたラベルと使用された範疇との間で、量Δincにより関係性(結合の「強度」)を高め、競合する関係を低めることによって実現される。競合する関係とは、同じ範疇について他のラベルを用いる関係又は過去に他の範疇を同じラベルに関連付けた関係であり、同じ範疇について他のラベルを用いる関係は、Δn−inhによって弱められ、過去に他の範疇を同じラベルに関連付けた関係は、Δo−inhによって弱められる。定式化すれば、以下のようになる。
1.クライアント更新ClientUpdate(Wc,t ,l,cat)は、以下のように定義される。
Figure 2006107515
2.サーバ更新ServerUpdate(Ws,t ,l,cat)は、以下のように定義される。
Figure 2006107515
そして、Δo−inh<0且つΔn−inh<0である場合、これを側方抑制(lateral inhibition)と呼ぶ。
クライアント側での失敗
次に、クライアントがKからGを区別する範疇を有していない(クライアントステップ2が失敗する)状況について検討する。この場合、クライアントは、以下の2つのステップを実行する。
・クライアントが、Kの要素からGの要素を区別する新たな範疇catを構築する。
・クライアントは、新たなラベルσ(十分長いアルファベットのランダムな文字列)を作成し、強度の初期値をγinitとして、σとcatとの間の新たな関係によって、Wを拡張する。
これ以降、クライアント及びサーバの間のインタラクションは、σを新たなラベルとして送信して、これまでと同様に継続することができる。
ここで、他のエージェントが、このランダムな文字列を他の範疇のために既に用いている場合に重要な問題が生じる。この問題(1つのラベルが異なる意味を有する同音異義問題と呼ばれる)は、本発明の好適な実施形態に基づくシステムのダイナミクスによって対処されるが、分散型の手法でシンボルを生成しても、一意的なシンボルを保証する、例えば、リーチ(Leach)他による「UUID URNネームスペース(A UUID URN Namespace)(The Internet Engineering Task Force, Internet drafts, http://www.ietf.org/internet-drafts/draft-mealling-uuid-urn-03.txt)」に開示されている「ユニバーサル固有識別子(universally unique identifiers:UUID)」等の技術を用いることによって、この問題を最小化することができる。
サーバ側での失敗
次に、サーバがWにおいて定義されているラベルlを有さず、このラベルがクライアントによって送信された(サーバステップ1が失敗する)状況について検討する。この場合に、本発明の好適な実施形態に基づいて実行される処理を図5に示す。
この場合、サーバは、クライアントに失敗を知らせる。そして、サーバは、クライアントが探しているものの実例としてG(及び可能であればK)を受け取り、以下のようなステップを実行する。
・サーバIAは、範疇catによってコンテキストKから区別できる範疇として、Gを範疇化する。これに失敗した場合、サーバIAは、新たな範疇(更にcatと呼ぶ。)を作成し、範疇レパートリにこれを追加する。
・サーバIAは、cat及びラベルlの関係及び初期強度γinitを用いてWを拡張する。
そして、サーバは、これまでと同様の処理を継続する。
部分的な成功
部分的な成功とは、クライアントのクエリに対するサーバの応答が、サーバ(のオーナ)によって、一部無関係であるとみなされた場合を意味する。得点(すなわち、サーバの応答の「適切さ」の度合いの尺度)は、単に、オーナが適切であるとみなした要素のパーセンテージによって算出できる。失敗とは、この「適切さ」の得点が、ある閾値レベルθfailを下回ったことを意味する。
この問題には、次のような2つの原因がある。(1)クライアントによって送信されたラベルに関連している範疇が、サーバによって同じラベルに関連付けられている範疇とは異なる。又は(2)クライアントによって用いられている範疇が、ユーザが意図する区別を反映する程精密ではない。ケース(1)とケース(2)とを区別するために、クライアントエージェントは、クエリを定式化するために用いられた範疇が適切であったか否かすなわち、catは、K∪BからG∪Fを区別する良好な弁別的記述であるか否かを確認できる。この確認の結果が否定的である場合、これは、catがクライアントのオーナの意志を良好に反映していないことを意味し、すなわち、ケース(2)を適用できる。
ケース(1)に対処するためには、クライアント及びサーバは、(将来における交換が可能又は有益になるように)それぞれの範疇及びラベルを調整する必要がある。この場合、クライアント側及びサーバ側の両方からの動作が必要である。まず、以下のように、失敗した通信においてクライアント及びサーバが用いたラベルの強度を低減する。
・クライアントIAがcatと、Wのlとの間の関係の強度を減数Δdecにより低減する。これにより、この関係が将来、この特定のラベルで符号化される可能性が低減される。
・サーバIAがcatと、Wのlとの間の関係の強度を減数Δdecにより低減する。これにより、lが将来、この関係によって復号される可能性が低減される。
ケース(2)の場合、クライアント(詳しくは、クライアントの情報エージェント)は、まず、受け取ったデータの関連性に関するオーナの評価に基づいて、これまで使用した範疇より優れた、最良の範疇を見出すことを試みる必要がある。これは、IAがK∪B(悪い実例)からG∪F(良い実例)を区別する弁別的範疇を見出さなくてはならないことを意味する。
そして、Gの代わりにG:∪F及びKの代わりにK:∪Bを用いて、ケース(2)(クライアント側での失敗)と同様のインタラクションが行われ、クライアントは、新たな範疇及びこの範疇に関連する新たなラベルを作成する。この新たなラベルは、場合によっては、興味G∪Fのオブジェクトの他の実例と共に、サーバに送信される。これにより、サーバは、この範疇の自らのバージョンを構築することができ、したがって、ラベルのセマンティクスを構築することができる。そして、サーバは、応答として、新たな実例をクライアントに送ることができる。
クライアントが第1のトランザクションで用いたものより優れた最良の範疇を見出せなかった場合、クライアントIAは、対象となるオブジェクトG∪F及びK∪Bの実例及び反例を送ることができ、これによりサーバは、弁別的範疇を見出すこと及びこの範疇とラベルlとの間で関係性を追加することによって、既に送信されているラベルlの正しい意味を理解しようとする。このケースは、先に説明したケース(3)(サーバ側での失敗)と同じである。
パラメータ
以下、エージェントの適応型メカニズムにおいて、あるメインパラメータによって取ることができる値の具体例を示す。ここに列挙する値は、システムの大規模な検査において、適切な性能をもたらすと経験的に判明した値である。ここでは、各情報エージェントが、できる限り(すなわち、特定の範疇のためのレキシコン内で使用可能な「最良の」単語を用いて)クエリに応じようとするものであるとの仮定に基づいて、良好なシステム性能が実現された。
パラメータ値の具体例:
・γinitは、新たな関係をエージェントのレキシコンLに入力する初期の強度である。γinit=0.5。
・Δincは、成功した場合に用いられた関係におけるγの増分である。Δinc=0.1。
・Δn−inhは、成功した場合における、同じ名称(且つ異なる範疇)を有する関係の変化(減分)である。Δn−inh=−0.2。
・Δo−inhは、成功した場合における同じ範疇(且つ異なる名称)にリンクされた関係の変化(減分)である。Δo−inh=−0.1。
・Δdecは、失敗の場合に用いられた関係の変化(減分)である。Δdec=−0.1。
・θdiscは、範疇化において用いられた閾値である。θdisc=0.5。
・θfailは、交換の失敗(サーバによって提供された結果が不十分)を知らせるために用いられる閾値である。θfail=0.5。
これらのパラメータの正確な値には、ある程度の余裕を設けてもよい。これらの全てを0(γinitを許容する)としてもよいが、この場合、それまでにエージェントによって作成された全てのラベルは、エージェントの全ての母集団に伝播し、これを収束させることはできない。これらのパラメータをゼロにしない場合、Δinc>0、Δn−inh<0、Δo−inh<0とすることは明らかである。また、Δdec<0にしなければ、成功しなかった関係の強度が高くなるので、Δdec<0とする必要がある。
「同義性(synonymy)」とは、同じ範疇が異なるエージェント(又は、同じエージェントの場合すらある。)について異なるラベルを有することを意味し、分散型システムでは、異なるエージェントが異なるラベルを作成するために、この状況は自然に生じる。システムのダイナミクスにより、使用と成功との間のフィードバックループのために、同義語がシステムから次第に減っていくことが保証される。ラベルが特定の範疇の命名に成功する程、そのラベルをその範疇にリンクする強度が強くなり、将来の通信で同じラベルが用いられる可能性が高まる。側方抑制(Δn−inh≠0)がこれを保証する。
「同音異義性(homonymy)」は、同じラベルが異なる範疇に関連付けられることを意味する。これは、次のような2つの状況で生じる。(1)エージェントが、あるラベルについて、偶然同じ新たな文字列を構築した。又は(2)サーバエージェントが、クライアントによって用いられた範疇とは異なる範疇を推測したが、これにも関わらず、交換が成功した。発明者らによる実験により、本発明の好適な実施形態に基づくプロトコルによって生成された記号論的力学(semiotic dynamics)は、特に、Δo−inh<0の場合に、同音異義性を処理するのに十分であることが明らかとなった。なお、先に述べたように、ケース(1)は、UUID技術等、一意的なラベルを仮想的に保証する方式を用いることによって回避することができる。
本発明の好適な実施形態では、ラベルと範疇との間の関係性の強度を低減する幅は、ラベルと範疇との間の関係性の強度を増加させる幅と等しくするか、これより大きくする。
図6において、「採用」は、全てのモデルパラメータがゼロであり、全ての可能なラベルが伝播される(全てのエージェントが他のエージェントによって用いられている全てのラベルを知ったときに極限に達する。)ことを意味し、「補強」は、Δincが正である(この場合0.1である)ことを示し、「側方抑制」は、Δn−inh及びΔo−inhが負である(この場合、それぞれ−0.2及び−0.1である)ことを示し、「減衰」は、Δdecが負である(この場合、−0.1である)ことを示す。減衰は、最適より僅かに劣る結果を生じるように見えるが、同音異義性に対処するために必要である。
本発明の好適な実施形態として示す情報交換方法により、ピアツーピアネットワーク内のピアの情報エージェントは、互いに揃えられた、意味的に基礎付けられた範疇及びラベルを作成することができる。ピアの範疇/ラベルは、徐々に収束すると考えられる。但し、ピアの間の交換の全てのシーケンスが最適解に収束するわけではく、ネットワークは、「極小(local minimum)」で行き詰まることもある。本発明の好適な実施形態で用いられる側方抑制処理は、この状況を回避するためのものである。
以下、本発明の具体的な応用例の実例を説明する。第1の実例は、音楽ファイルの共有に関連し、第2の実例は、ドキュメント交換に関連し、第3の実例は、製品情報の共有に関連する。これらの応用例は、本発明が現実的にどのように作用し、この方式が如何に汎用性を有するかを詳細に示している。実際に、ここで提案するメカニズムは、如何なるピアツーピア情報交換システムにも用いることができる。
具体的応用例1:音楽ファイルの共有
この実例は、ピア間で音楽(曲)を交換するピアツーピアネットワークに関係する。ここでは、第1、第2、第3の情報システム間で行われるインタラクションについて検討する。第1の情報システムは、第1のユーザであるオーナ0に属し、情報エージェントであるエージェント0を有する。第2及び第3の情報システムは、それぞれ第2のユーザであるオーナ1及び第3のユーザであるオーナ2に属し、それぞれ情報エージェントであるエージェント1及び情報エージェントであるエージェント2を有する。以下、これらの3つの情報システムの間の一連の4つのクエリについて説明する。
本発明の好適な実施形態では、ピアに関連する異なる情報システムが、それぞれ異なる概念的スキーマに基づいて組織化されたメタデータを使用する場合であっても、ピア間で情報を交換することができる。但し、説明を簡潔にするために、3つの情報システムの全てが音楽ファイルを保存し(又は音楽ファイルにアクセスでき)、これらが、音楽ファイルを記述する同じ種類のメタデータを使用する(このメタデータは、全ての情報システムついて、同じ概念的スキーマに基づいて組織化されている。)と仮定する。この実例では、メタデータは、以下の概念的スキーマに基づいて組織化される。
・アーチスト:アーチスト名(ビートルズ、ローリングストーンズ、ディープパープル、マドンナ、マイケルジャクソン又はエルビスプレスリー)
・ジャンル:曲のジャンル(ロックンロール、ロック又はポップス)
・テンポ:曲のテンポ(遅い、中間又は速い)
以下の表1は、この実例における3個の情報システムに亘って用いられるデータ及び関連するメタデータの概要を示している。
Figure 2006107515
3つの情報システムの各オーナは、それぞれのデータ(曲)を、曲タイトルのリストを含むプレーリストに組織化する。情報システムには、音楽ファイル自体を保存しても良く、これに代えて、情報システムは、単に、音楽ファイルにアクセスすることによって、例えば、再生するように選択されると、情報システムのオーナがダウンロードにより、記録媒体から読み出すことにより、又はネットワークを介してアクセスすることによって、曲を特定するための何らかの目印のみを保存してもよい。
以下の表2、表3及び表4は、それぞれ、交換処理が行われる前の、オーナ0、オーナ1及びオーナ2のプレーリストを示している。
Figure 2006107515
Figure 2006107515
Figure 2006107515
なお、表2〜表4に示すように、オーナのプレーリストは、異なる曲についてのメタデータを示していない。音楽ブラウザアプリケーション又はこれに類するアプリケーションのユーザには、メタデータが表示されないことが多い。但し、ユーザにメタデータを表示するか否かにかかわらず、このメタデータは、情報システム内で入手可能であり(又は、例えば、オーディオフィンガプリンティングによって、曲のMP3バージョンをオンラインサービスに送信し、このオンラインサービスからこの曲のメタデータを受け取ること等によって、メタデータにアクセスでき)、情報エージェントは、このメタデータを使用することができる。
これらのピア間のインタラクションの開始時には、いずれのエージェントも、如何なるラベル又は範疇も定義していない。
クエリ1:範疇作成及び通信成功の具体例
オーナ1が、自らの「ビートルズ」プレーリストのために、オーナ0から更なる曲を得ようとする第1のインタラクションについて検討する。実際には、オーナ0は、何らかのインタフェース、例えば、音楽ブラウザプログラムのグラフィカルユーザインタフェースによって、情報システムとインタラクトすることによって、このプレーリストに更なる曲を得たいとの希望を表現する。オーナ0は、新たな曲が得られるであろうピアを明示的に特定してもよく、特定しなくてもよい。
オーナ0が、「ビートルズ」プレーリストのために更なる曲を得たいことを示すと、第1の情報システムに関連するエージェント(エージェント0)は、類似する曲の検索を行う。オーナ0は、プレーリスト「ストーンズ」を選択していないので、この要求のコンテキストは、「ストーンズ」ではなく「ビートルズ」を希望するということである。この結果、オーナ0のエージェントは、この要求を「ストーンズの曲ではなく、更なるビートルズの曲を見つける」と解釈する。この要求のための実例として用いられる曲は、「Across The Universe」、「Blackbird」、「Eleanor Rigby」、「Helter Skelter」、「I Feel Fine」、「Norwegian Wood」及び「You Know My Name」である。
また、この要求のための反例として用いられる曲は、「Let's Spend the Night Together」及び「Ruby Tuesday」である。
オーナ0の要求を実現するために、システムによって実行されるステップは、以下の通りである。
ステップ1:エージェント0−範疇化
エージェント0が、オーナ0による選択に合致する範疇を見出そうとする。エージェント0は、範疇を有していないので、このステップは、失敗する。
ステップ2:エージェント0−範疇作成
エージェント0は、新たな範疇、範疇0を導入する。オーナ0の選択について説明するために、範疇0は、特徴アーチスト(ビートルズ)によって定義される。すなわち、この特徴は、属性(アーチスト)及び値(ビートルズ)からなるタプルであるとみなすことができる。エージェント0がこの範疇において、他の曲を検索しようとする場合、エージェント0は、他の情報システムと通信する際にこの範疇を指示するための単語又はラベルを必要とする。エージェント0は、ラベル「fafafa」を導入し、0.5のデフォルトの強度でこのラベルを範疇0に割り当てる。これは、以下のように表現することもできる。
(範疇0<アーチスト(ビートルズ)>,「fafafa」,0.5)
エージェント0は、ラベル「fafafa」を用いて、オーナ0の検索要求を符号化する。
この特定のラベル「fafafa」の選択には、如何なる特定の技術的根拠もなく、これは、単に、所定の集合(又は「アルファベット」)から選択された文字のシーケンスである。但し、幾つかのアプリケーションでは、上述したユニバーサル固有識別子(UUID)からラベルを導出することが有益である場合もある。UUIDからラベルを得る場合、これらのラベルの殆どは、集中的な調整を行わなくても一意的であることが保証され、このため、これは同音異義語の出現頻度を低減できる。
ステップ3:エージェント0−クエリ
エージェント0は、ピアツーピアネットワークを介して、エージェント1にコンタクトし、ラベル「fafafa」に適合する曲を要求する。「fafafa」を送信するための通信の詳細な性質及び統語構造は、例えば、P2Pネットワークの特徴に適合するように、必要に応じて適応化することができる。
ステップ4:エージェント1−復号
エージェント1は、そのレキシコンにラベルを有しておらず、したがって、エージェント1は、受信したラベル「fafafa」に範疇を割り当てることができない(エージェント1は、「fafafa」を復号することができない)。エージェント1は、エージェント0に失敗信号を送信する。
ステップ5:エージェント0−送信
ここで、エージェント0は、オーナ0の選択に対応する実例及び反例のリストをエージェント1に送る。これは、「fafafa」が、エージェント0によってどのように用いられているかを示す。
サーバは、例えば、あるカタログ(例えば、オンラインカタログ)内で曲を特定する曲IDコードを通信することによって、何らかの一般的に知られた規則に基づいて曲のタイトルを特定することによって、曲に対応するMP3ファイルを送信することによって等、周知の如何なる手法で実例及び反例を「特定」してもよい。サーバに対して実例及び反例を特定するためにどのような方式を用いた場合であっても、サーバの情報エージェント(ここでは、エージェント1)は、自らの概念的スキーマに基づいて、これらの実例/反例のためのメタデータを検索し又は検索しようとする(メタデータは、例えば、オンラインサービスの助けを借りる等、周知の如何なる手法を用いて検索してもよい)。
ステップ6:エージェント1−範疇作成
エージェント1は、実例及び反例の集合を処理し、実例について記述し、及び反例から実例を区別する弁別的特徴(又は特徴の集合)を見つけようとする。この具体例では、エージェント1は、弁別的特徴、すなわちアーチスト(ビートルズ)を見つける。エージェント1は、ここでは、範疇1と呼ぶ、この弁別的特徴に対応する新たな範疇を作成し、0.5のデフォルトの強度でラベル「fafafa」を範疇1に割り当てる。
(範疇1(<アーチスト(ビートルズ)>),「fafafa」,0.5)
なお、実際には、エージェント1は、エージェント0によって用いられた概念スキーマとは異なる概念的スキーマに基づいて組織化されたメタデータを用いてもよい。したがって、エージェント1が反例から実例を区別する弁別的特徴の集合を見つけた場合でも、この弁別的特徴の集合は、反例から同じ実例を区別するためにエージェント0によって用いられた弁別的特徴の集合とは異なることも多い。換言すれば、エージェント0及びエージェント1がこれらの範疇によって同じ実例の集合を記述することを試みる場合であっても、エージェント1の範疇1に対応する弁別的特徴の集合は、エージェント0の範疇0に対応する弁別的特徴の集合とは異なることがある。
ステップ7:エージェント0−クエリ
エージェント0は、再び、ラベル「fafafa」に適合する曲について、エージェント1に問い合わせる。この要求は、明示的に行ってもよく、エージェント0がエージェント1に実例及び反例の集合を送信したという事実に基づいて、暗示的に行ってもよい。
ステップ8:エージェント1−復号
エージェント1は、ラベル「fafafa」に割り当てられている範疇のリストをチェックし、この場合、(この時点では)リストは、範疇1のみを含む。換言すればリストは、(範疇1(<アーチスト(ビートルズ)>),「fafafa」,0.5)である。
ステップ9:エージェント1−フィルタリング
エージェント1は、第2の情報システムによって、特徴アーチスト(ビートルズ)によって記述された曲を選択するために適する関数として範疇1を演算可能にする。換言すれば、エージェント1は、範疇1を用いて、関連するデータ集合をフィルタリングする。これにより得られる曲は、「And I Love Her」、「I'm Down」及び「Twist and Shout」である。
ステップ10:エージェント1−提供
エージェント1は、ステップ9の結果として得られたデータをエージェント0に送信する。多くの場合、送信されるデータは、検索された曲を一意的に特定する何らかのデータであり、このデータは、例えば、(タイトルが一意的であれば)曲のタイトル、あるカタログ又はデータベースにおける曲のID(例えば、http://www.muscibrainz.orgにおいてアクセス可能なMusicBrainzデータベースにおけるID)又は曲ファイル自体であってもよい。
ステップ11:エージェント0−選択
エージェント0は、エージェント1から受信した応答をオーナ0に知らせる。通常、オーナ0には、(第2の情報システムから)エージェント1によって提供された曲のリストが表示される。オーナ0のクエリに対応して提供されたデータは、オーナ0の希望を満たしている場合もあれば、満たしていない場合もある。そこで、本発明の好適な実施形態では、エージェント0は、オーナ0から、クエリの結果の評価を引き出す。エージェント0は、検索結果の評価を明示的に要求してもよく、又は(ユーザのクエリへの応答を示す情報がオーナ0に提示された事実に基づいて)検索結果の評価を暗示的に要求してもよい。
この具体例では、エージェント1によって提供された全ての結果がオーナ0の検索要求に適合し、したがって、全てが「正」の結果であるとみなされる。これらの「良い」結果は、いずれもオーナ0のデータベースに存在せず、したがって、オーナ0は、ユーザのデータベースにこれらを追加することを選択し、すなわち、オーナ0の「ビートルズ」プレーリストが更新される。
ステップ12:エージェント0−クライアント更新
クエリは、成功し、結果の100%がオーナ0によって選択された。この結果、エージェント0は、ラベル「fafafa」と範疇0との間の関係性の強度を0.1によってインクリメントする。これにより、エージェント0は、範疇0に関する以下のデータを保有する(又は、これにアクセスできる)ことになった。
(範疇0(<アーチスト(ビートルズ)>),「fafafa」,0.6)
ステップ13:エージェント0−フィードバック
本発明の好適な実施形態では、エージェント0は、オーナ0に提供された結果が、どの程度満足できるものであったかを示すフィードバックをエージェント1に提供する。このフィードバックは、如何なる形式で行ってもよい。なお、本発明の好適な実施形態では、このフィードバックは、提供された曲のどれが「良かったか」(すなわち、オーナ0を満足させたか)及び提供された曲のどれが「悪かったか」(すなわち、ユーザの検索基準を満たしていないとオーナ0がみなしたか)をエージェント1に対して示す形式で行われる。この具体例では、エージェント0は、提供された曲の全てが「良かったこと」を示すフィードバックを送信する。オーナ0が、どの検索結果が満足できるものであったかを第1の情報システムに示すための如何なる入力も行わなければ、このフィードバックを提供できないことは明らかである。
ステップ14:エージェント1−サーバ更新
第1及び第2の情報システムの間の交換が完全に成功したことを示すフィードバックをサーバが受け取ると、エージェント1は、ラベル「fafafa」と範疇1との間の関係性の強度を0.1インクリメントする。これにより、エージェント1は、範疇1に関する以下のデータを保有する(又は、これにアクセスできる)ことになった。
(範疇1(<アーチスト(ビートルズ)>),「fafafa」,0.6)
クエリ1の結果、第1及び第2の情報システムは、変化した。具体的には、第1の情報システムのデータベース及びプレーリストは、変化した。またエージェント0と、エージェント1の辞書が確立された。以下の表5は、オーナ0のクエリ1の結果のプレーリストを示している。表6及び表7は、それぞれ、クエリ1の結果のエージェント0及びエージェント1の辞書を示している。
Figure 2006107515
Figure 2006107515
Figure 2006107515
クエリ2:クライアントにおける失敗の具体例
第2のインタラクションでは、オーナ1は、更なる「60年代」の曲をオーナ0に要求する。オーナ1は、自らの「60年代」プレーリストを選択し、自らの情報エージェント(エージェント1)に対して、類似する曲を検索するよう求める。エージェント1は、この要求を、「70年代及び80年代ではなく、更なる60年代の曲を見つける」と解釈する。
このクエリのための実例として用いられる曲は、「And I Love Her」、「I'm Down」、「Paint It Black」及び「Twist and Shout」である。
また、このクエリのための反例として用いられる曲は、「Let's Spend the Night Together」、「Smoke on the Water」、「Billie Jean」及び「Borderline」である。
システムによって実行されるステップは、以下の通りである。
ステップ1:エージェント1−範疇化
エージェント1が、オーナ1による選択に合致する範疇を見出そうとする。範疇1(<アーチスト(ビートルズ)>)の適合得点は、0.75であり、これは、閾値である0.5を上回る。このため、エージェント1は、オーナ1の曲の選択を記述するために、範疇1を選択する。
ステップ2:エージェント1−符号化
エージェント1に関する限り、範疇1は、1つのラベル「fafafa」のみに割り当てられる。このため、エージェント1は、「fafafa」を用いて、エージェント1がオーナ1の検索要求に適合するとみなす範疇を符号化する。
ステップ3:エージェント1−クエリ
エージェント1は、エージェント0にコンタクトし、ラベル「fafafa」に適合する曲を要求する。
ステップ4:エージェント0−復号
エージェント0に関する限り、ラベル「fafafa」は、1つの範疇、範疇0(<アーチスト(ビートルズ)>)だけに割り当てられる。したがって、エージェント0は、このクエリについて、範疇0を使用する。
ステップ5:エージェント0−フィルタリング
エージェント0は、第1の情報システムによって、特徴アーチスト(ビートルズ)によって記述された曲を選択するために適する関数として範疇0を演算可能にする。換言すれば、エージェント0は、範疇0<アーチスト(ビートルズ)>を用いて、オーナ0のデータをフィルタリングする。これにより得られる曲は、「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Helter Skelter」、「I Feel Fine」、「Norwegian Wood」、「You Know My Name」、「And I Love Her」、「I'm Down」及び「Twist and Shout」である。
ステップ6:エージェント0−提供
エージェント0は、ステップ5の結果として得られたデータをエージェント1に送信する。
ステップ7:エージェント1−選択
エージェント1は、エージェント0から受信した応答をオーナ1に知らせ、オーナ1は、提供された曲のどれが「良いか」(すなわち、自らの個人的な検索基準を満たしているか)を選択する。この具体例では、オーナ1は、「I Feel Fine」、「And I Love Her」、「I'm Down」及び「Twist and Shout」を選択する。この結果、「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Helter Skelter」、「Norwegian Wood」及び「You Know My Name」は、オーナ1の要求(「60年代」)に対する適切な結果ではないとみなされることになる。
サーバによって供給された曲のうち、「I Feel Fine」のみがクライアントにとって新しい(すなわち、クライアントのデータ集合に含まれていなかった)曲である。この場合、オーナ1は、「I Feel Fine」をデータベースに加えるよう選択し、「60年代」プレーリストにこのタイトルを含ませる。
ステップ8:エージェント1−(クライアントにおける失敗)
オーナ1によって決定された「良い」結果のパーセンテージは、40%である。この得点は、所定の閾値(ここでは50%)を下回っているので、クライアントとサーバの間の通信は、失敗したとみなされる。エージェント1は、エージェント1がオーナ1の要求を誤解したためにこの失敗が生じたのか、エージェント0がエージェント1のクエリを誤って復号したためにこの失敗が生じたのかを判定することを試みる。エージェント1は、以下のようにして、この判定を行う。
エージェント1は、オーナ1の要求に関連する「良い」実例の2つの集合及び反例の2つの集合情報を有している。これらの実例/反例の1番目の集合は、オーナ1の初期の要求に由来し、2番目の集合は、サーバから受け取った結果に対するオーナ1の選択に由来する。エージェント1は、利用可能な実例及び反例の全てを用いて、これまで用いた範疇より、オーナ1の要求に良好に適合する既存の範疇又は新たな範疇を自らが有しているか否かを検査する。
実例(「And I Love Her」、「I'm Down」、「Paint It Black」、「I Feel Fine」及び「Twist and Shout」)及び反例(「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Helter Skelter」、「Norwegian Wood」、「You Know My name」、「Let's Spend the Night Together」、「Smoke on the Water」、「Billie Jean」及び「Borderline」)に基づき、エージェント1は、自らが先に用いた範疇(範疇1)に関連する弁別的特徴の集合は、反例から実例を区別するための最良の特徴の集合ではなかったことを見出す。換言すれば、エージェント1は、オーナ1の要求を誤解していた。
ステップ9:エージェント1−範疇作成
エージェント1は、訂正処理を行い、弁別的特徴ジャンル(ロックンロール)を定義した新たな範疇である範疇2を導入し、この範疇2を0.5のデフォルトの強度で新たなラベル「fefafa」に割り当てる。すなわち、範疇2は、(範疇2(<ジャンル(ロックンロール)>),「fefafa」,0.5)となる。
ステップ10:エージェント1−送信
エージェント1は、実例及び反例の両方の集合(すなわち、G∪F及びK∪B)と共に、新たなラベル「fefafa」をエージェント0に送信する。これにより、エージェント0には、コミュニケーションの失敗があったことが暗示的に知らされる。これに代えて又はこれに加えて、エージェント1は、コミュニケーションの失敗が生じたことを示す明示的な信号をエージェント0に送信してもよい。実例の及び反例の集合の両方をエージェント0に提供することによって、エージェント0は、以後の範疇化ステップ(後述するステップ12)に利用可能な最大限の情報を得る。
ステップ11:エージェント0−範疇化
そして、エージェント0は、実例及び反例の集合を受け取り、これらの実例及び反例の集合に適合する既存の範疇を見つけようとする。既存の範疇である範疇0(<アーチスト(ビートルズ)>)を実例及び反例の集合に適用すると、「潜在的な弁別」の得点は、0.2となる。これは、所定の閾値レベルである0.5を下回る。したがって、エージェント0は、より良好に反例から実例を区別する新たな範疇を導入する必要がある。
ステップ12:エージェント0−範疇作成
実例及び反例を処理することによってエージェント0は、反例から実例を十分に区別する弁別的特徴(ジャンル(ロックンロール))があることを見出す。エージェント0は、対応する新たな範疇である範疇3を作成し、最も新しく受信したラベル「fefafa」(実例及び反例を指定する。)にこれを割り当てる。関係性の強度の値は、初期値である0.5となる。したがって、(範疇3(<ジャンル(ロックンロール)>),「fefafa」,0.5)となる。
クエリ2の結果、第1及び第2の情報システムは、再び変化した。具体的には、第2の情報システムのデータベース及びプレーリストが変化した。またエージェント0及びエージェント1の辞書が成長した。以下の表8は、クエリ2の結果のオーナ1の「60年代」プレーリストを示している。表9及び表10は、それぞれ、クエリ2の結果のエージェント0及びエージェント1の辞書を示している。
Figure 2006107515
Figure 2006107515
Figure 2006107515
クエリ3−範疇作成及びクライアントにおける失敗の具体例
第3のインタラクションでは、オーナ2は、更なる「パーティ用音楽」をオーナ0に求める。オーナ2は、ユーザのプレーリスト「パーティ用音楽」を選択し、自らのエージェント(エージェント2)に類似する曲を検索させる。オーナ2は、1つのプレーリストしか有していないので、この要求に関する反例は存在しない。実例として用いられる曲の集合は、「I'm Down」及び「Twist an Shout」である。
この要求に応じるためにシステムによって実行されるステップは、以下の通りである。
ステップ1:エージェント2−範疇化
エージェント2は、オーナ2の選択に適合する範疇を見つけようとする。エージェント2は、まだ、如何なる範疇も有していないのでこのステップは失敗する。
ステップ2:エージェント2−範疇作成
エージェント2は、オーナ2の選択を記述する新たな範疇である範疇4を導入する。範疇4は、特徴アーチスト(ビートルズ)によって定義される。エージェント2は、ラベル「fifafa」を導入し、0.5のデフォルトの強度でこれを範疇4に割り当て、(範疇4(<アーチスト(ビートルズ)>),「fifafa」,0.5)を生成する。
ステップ3:エージェント2−クエリ
エージェント2は、記述「fifafa」に適合する曲をエージェント0に問い合わせる(すなわち、エージェント2は、クエリ「fifafa」をエージェント0に送る)。
ステップ4:エージェント0−復号
エージェント0は、レキシコン内にラベル「fifafa」を有していない。したがって、エージェント0は、エージェント2に失敗を知らせる。
なお、本発明は、失敗をエージェントの間で通知する手法を限定するものではない。また、失敗の種類を明示的に示す異なる種類の失敗信号を用いてもよく或いは、特定の失敗信号が生成されたコンテキストから失敗の性質を推論してもよい。
ステップ5:エージェント2−送信
エージェント2は、「fifafa」がどのように用いられているかを示す実例(及び適切であれば反例)のリストをエージェント0に送る。
ステップ6:エージェント0−範疇化
エージェント0は、実例及び反例の集合に適合する(既存の又は新たな)範疇を見つけようとする。エージェント0は、既存の範疇である範疇0(<アーチスト(ビートルズ)>)の「弁別」の得点が閾値0.5を上回る1.0であることを見出す。
ステップ7:エージェント0−ラベル結合
エージェント0は、デフォルトの強度0.5で範疇0(<アーチスト(ビートルズ)>)にラベル「fifafa」を割り当てる。したがって、エージェント0は、現在、範疇0に割り当てられた2つのラベル、すなわち「fafafa」及び「fifafa」を有する。
ステップ8:エージェント2−クエリ
エージェント2は、再び、記述「fifafa」に適合する曲についてエージェント0に問い合わせる。ここでも、この要求は、明示的に行ってもよく、エージェント2が実例/反例のリストをエージェント0に送信した事実から推論してもよい。
ステップ9:エージェント0−復号
エージェント0に関する限り、1つの範疇(範疇0)すなわち、範疇0(<アーチスト(ビートルズ)>)のみがラベル「fifafa」に割り当てられる。
ステップ10:エージェント0−フィルタリング
エージェント0は、データ集合をフィルタリングするために範疇0を用いる。これにより得られる曲は、「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Helter Skelter」、「I Feel Fine」、「Norwegian Wood」、「You Know My Name」、「And I Love her」、「I'm Down」及び「Twist and Shout」である。
ステップ11:エージェント0−提供
エージェント0は、ステップ10によって得られたデータをエージェント2に送信する。
ステップ12:エージェント2−選択
エージェント2は、オーナ2に対し、エージェント0から受け取った結果を評価するよう求める。オーナ2は、正の結果として、「I Feel Fine」、「Helter Skelter」、「I'm Down」及び「Twist and Shout」を選択する。他の曲(「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Norwegian Wood」、「You Know My Name」及び「And I Love Her」)は、良い結果として選択されない。
受け取った「良い」結果のうち、「I Feel Fine」及び「Helter Skelter」は、オーナ2のデータ集合内にない。これらの2つの曲は、オーナ2のデータベースに追加され、オーナ2の「パーティ用音楽」プレーリストは、追加された曲のタイトルを含むように更新される。
ステップ13:エージェント2−クライアントにおける失敗
オーナ2によって決定された良い結果のパーセンテージは、40%である。この得点は、閾値50%を下回り、これは、コミュニケーションの失敗を意味する。
エージェント2は、自らがオーナ2の要求を誤解したか、又はエージェント0が要求を誤って復号したかを検査する。クエリ2のステップ8におけるエージェント1と同様に、エージェント2は、良い実例の2つの集合及び反例の2つの集合情報を有している。エージェント2は、全ての利用可能な実例及び反例を用いて、これまでに用いた範疇より、オーナ2の要求に良好に適合する既存の範疇又は新たな範疇があるか否かを確認する。
実例(「I Feel Fine」、「I'm Down」、「Helter Skelter」及び「Twist and Shout」)と、反例(「Across the Universe」、「Blackbird」、「Eleanor Rigby」、「Norwegian Wood」、「You Know My Name」及び「And I Love Her」)とに基づき、エージェント2は、自らが先に用いた範疇(範疇4)に関連する弁別的特徴の集合は、反例から実例を区別するための最良の特徴の集合ではなかったことを見出す。換言すれば、エージェント2は、オーナ2の要求を誤解していた。
エージェント2は、訂正処理を行い、弁別的特徴テンポ(速い)を定義した新たな範疇である、範疇5を導入し、この範疇5を0.5のデフォルトの強度で新たなラベル「fofafa」に割り当てる。すなわち、範疇5は、(範疇5(<テンポ(Fastl)>),「fofafa」,0.5)となる。
ステップ14:エージェント2−送信
エージェント2は、実例及び反例のリストと共に、ラベル「fofafa」をエージェント0に送信する。
ステップ15:エージェント0−範疇化
エージェント0は、実例及び反例の集合に適合する範疇を見つけようとする。範疇0(<アーチスト(ビートルズ)>)の得点は、閾値0.5を下回る0.0である。範疇3(<ジャンル(ロックンロール)>)の得点は、閾値を上回る0.58である。
ステップ16:エージェント0−ラベル結合
エージェント0は、ラベル「fofafa」を範疇3に割り当てる。すなわち、(範疇3(<ジャンル(ロックンロール)>),「fofafa」,0.5)である。
この具体例では、クエリ3は、上述したステップ16の実行により終了する。換言すれば、エージェント2が新たなラベル(「fofafa」)及び実例をエージェント0に提供した後に、エージェント0は、自らの範疇の1つに新たなラベルを割り当てる。
なお、システムの詳細な実現例に応じて、この時点で、ラベル「fofafa」を用いた第2の検索が有効に実行されるように、エージェント0とエージェント2との間のインタラクションを拡張してもよい。より包括的に言えば、システムの実現例によっては、初期のクエリ応答の間に、又は同じユーザクエリの処理における後の交換で、新たなラベル及び/又は範疇が作成されたか否かに応じて、クライアントとサーバとの間で任意の数のステップにより、インタラクションを拡張してもよい。このような拡張トランザクションにおいても、以下の原始関数が用いられる。
・query(label):クライアントが、特定のラベルを用いてクエリを実行するようサーバに要求する。
・results(label,dataset):サーバが、クライアントによって送られたラベルを用いた、クエリに対するサーバの結果であるdata(”dataset”)の集合をクライアントに返す。
・transmit(label,examples,counter−examples):クライアントが、ラベルがどのように用いられているかを示すために、実例及び反例の集合をサーバに送信する。
・serverupdate((label,{failure or success}):クライアントが、サーバによって提供された結果に対するユーザの評価に応じて、失敗又は成功をサーバに示す。
上の4つの原始関数を用いて、拡張されたクエリをどのように生成するかは、当業者にとって明らかであり、したがって、この点については詳細には説明しない。
クエリ3の結果、第1及び第3の情報システムが変化した。具体的には、第2の情報システムのデータベース及びプレーリストが変化した。また、エージェント0及びエージェント2の辞書が成長した。以下の表11は、クエリ3の結果のオーナ2のプレーリストを示している。表12及び表13は、それぞれ、クエリ3の結果のエージェント0及びエージェント2の辞書を示している。
Figure 2006107515
Figure 2006107515
Figure 2006107515
これまでの説明では、3つの情報システムのデータ集合が変化する原因は、ピアツーピア交換だけであった。しかしながら、異なる情報システムのオーナは、自らの情報システムを自由に変更できる(如何なるデータを保存するか、及びそのデータを記述するためにどのような概念階層を用いるかを変更でき、例えば、プレーリストを変更してもよい。)
例えば、クエリ3の後に(且つクエリ4の前に)、第1及び第3の情報システムのオーナは、それらの情報システムに変更を加えたとする。具体的には、以下のような変更が加えられたとする。
オーナ0が曲「Love Me Tender」、「Don't Be Cruel」及び「Suspicious Minds」を含む「エルビス」と呼ばれる新たなプレーリストを作成する。
オーナ2が、自らのプレーリスト「パーティ用音楽」に2つの新たな曲「Billie Jean」及び「Borderline」を追加する。
これらの変更が加えられた後のオーナ0及びオーナ2のプレーリストを表14及び表15に示す。
Figure 2006107515
Figure 2006107515
クエリ4−サーバにおける失敗の具体例
第4のインタラクションでは、オーナ2が、更なる「パーティ用音楽」をオーナ0に求める。オーナ2は、プレーリスト「パーティ用音楽」を選択し、自らのエージェント(エージェント2)に対し、類似する曲を検索するよう求める。オーナ2は、1つのプレーリストしか有していないので、ここでも、この要求のための反例は存在しない。
実例として用いられる曲の集合は、「I'm Down」、「Twist and Shout」、「I Feel Fine」、「Helter Skelter」、「Borderline」及び「Billie Jean」である。
この要求に応じるためにシステムによって実行されるステップは、以下の通りである。
ステップ1:エージェント2−範疇化
エージェント2は、オーナ2の選択に適合する範疇を見つけようとする。範疇5(<テンポ(速い)>)は、全ての実例をカバーし、1.0の得点を生成する。
ステップ2:エージェント2−符号化
エージェント2に関する限り、範疇5は、0.5の強度で1つのラベル「fofafa」のみに割り当てられる。
ステップ3:エージェント2−クエリ
エージェント2は、「fofafa」によって記述された範疇の曲を要求するために、ラベル「fofafa」をエージェント0に送信する。
ステップ4:エージェント0−復号
エージェント0は、範疇3(<ジャンル(ロックンロール)>)として「fofafa」を復号する。
ステップ5:エージェント0−フィルタリング
エージェント0は、データ集合をフィルタリングするために範疇3を用いる。これにより得られる曲は、「I Feel Fine」、「And I Love Her」、「I'm Down」、「Twist and Shout」、「Love Me Tender」、「Don't Be Cruel」及び「Suspicious Minds」である。
ステップ6:エージェント0−提供
エージェント0は、上のステップ5で得られた結果をエージェント0に送信する。
ステップ7:エージェント2−選択
エージェント2は、サーバから受け取った結果を評価することをオーナ2に求める。オーナ2は、正の結果として、「I Feel Fine」、「I'm Down」及び「Twist and Shout」を選択する。他の曲(「And I Love her」、「Love Me Tender」、「Don't Be Cruel」及び「Suspicious Minds」)は、良い結果として選択されない。
正の検索結果の全ては、既に、オーナ2のデータベースにある曲に対応しており、したがって、データベースには、新たな曲は追加されない。但し、エージェント2とエージェント0とにとって、それらの範疇/ラベルの整合性を高める目的で、通信を継続することは有益である。
ステップ8:エージェント2−サーバにおける失敗
オーナ2によって判断された良い結果のパーセンテージは、42%である。この値は、閾値50%を下回り、これは、コミュニケーションの失敗を示す。エージェント0及びエージェント2の両方は、「fofafa」と、それぞれ範疇3及び範疇5との間の関係性の強度を0.1減少させる。
エージェント2は、自らがオーナ2の要求を誤解したか、或いは、エージェント0がクエリを誤って復号したかを検査する。エージェント2は、良い実例の2つの集合及び反例の2つの集合を結合する。全ての実例のリストは、「I Feel Fine」、「I'm Down」、「Twist and Shout」、「Helter Skelter」、「Borderline」及び「Billie Jean」である。全ての反例のリストは、「And I Love Her」、「Love Me Tender」、「Don't Be Cruel」及び「Suspicious Minds」である。エージェント2は、利用可能な実例及び反例の全てを用いて、これまで用いた範疇より、オーナ2の要求に良好に適合する既存の範疇又は新たな範疇が存在するか否かを検査する。ここで、エージェント2は、既に用いている範疇(すなわち、範疇5<テンポ(速い))により1.0の得点が得られることを見出す。このため、エージェント2は、オーナ2の要求を誤解していないとの結論を得る。したがって、この場合、エージェント0が復号を誤ったと推定する。
ステップ9:エージェント2−送信
エージェント2は、実例及び反例のリストをエージェント0に送信することによって、「fofafa」が何を意味するかをエージェント0に示す。
ステップ10:エージェント0−範疇化
エージェント0は、エージェント2から受け取った実例及び反例の集合に適合する既存の範疇を見つけようとする。範疇0(<アーチスト(ビートルズ)>)は、0.42の得点を生成し、範疇3(<ジャンル(ロックンロール)>)は、0.0の得点を生成し、これらはいずれも、閾値である0.5を下回る。
ステップ11:エージェント0−範疇作成
エージェント0は、反例から例を十分に区別する新たな範疇を作成する。この新たな範疇は、範疇6(<テンポ(速い)>)である。エージェント0は、デフォルトの強度0.5でラベル「fofafa」を範疇6に割り当てる。
この第4のクエリに関する処理が終わると、第1及び第3の情報システムの辞書は、再び変化する。クエリ4の結果のエージェント0及びエージェント2の辞書をそれぞれ表16及び表17に示す。
Figure 2006107515
Figure 2006107515
上述した一連の4つのクエリに関する処理が終了すると、3つの情報システムは、それぞれのレキシコンを確立し、これを用いて、他の情報システムと情報を交換できるようになる。なお、エージェントの間の通信の初期の段階では、同音異義語(例えば、2つの異なる範疇であるジャンル(ロックンロール)及びテンポ(速い)のために用いられる「fofafa」)、及び同義語(例えば、ジャンル(ロックンロール)のための「fefafa」、「fofafa」)の存在により、問題が生じることがある。これらの情報システムの間のインタラクションの数が増えるに従い、ラベルと範疇の意味の間の整合性が高まる。
具体的応用例2:ドキュメントの交換
ワールドワイドウェブ上で利用可能なドキュメントの数が増加している。例えば、科学の分野では、現在、多くの研究者が自らのウェブサイトを運営し、自らの論文をps(ポストスクリプト)フォーマット又はpdf(アドビ・アクロバット:Adobe Acrobat)フォーマットで公表している。これらのデータは交換される。また特定の主題を専門とするサイトも、個々の制作者によって公開されている。学術雑誌は、通常、購読予約(subscription)を介してのみアクセス可能なウェブサイトを有する(但し、大学図書館は、大学全体の購読予約の方式を採用している場合も多い)。また、ウェブを介してのみ利用可能な電子ジャーナルの数も増加している。更に、論文の発行を追跡する幾つかのサイトもある(例えば、Citeseer、http://citeseer.ist.psu.edu/)。
この明細書に開示する技術は、この種の分野に好適に応用することができる。無制限なデータの集合(ドキュメント自体)が存在し、及びメタデータが存在するが、これらは、多くの場合、サイト固有の形式を有する。例えば、ジャーナル又は引用サイト(citation site)は、少なくとも、作者、発行日、キーワード、要約等の情報を含む。通常、作者又は対象のサイトは、データを組織化し、又は更なるキーワードを提供するが、これらの組織化の手法は、他のサイトの手法とは大きく異なる(例えば、異なる発行者は、それぞれのコレクションのために、異なる組織化法及びメタデータを用いている)。サイトは、多くの場合、特に、ソースサイトが一時的なものであり、論文が消されてしまうこともあるので、ソースとは異なる形式で論文のコピーを保存する。このため、ユーザは、他者にとってのサーバとなることができる。例えば、Citeseerは、それ自身の論文のバージョンを異なるフォーマットでキャッシングし、データを得たパスに関する情報を提供する(これは、論文を最初に公開したサイトではない場合もある)。
この分野に本発明を適用する場合、これらの各サイトは、ピアツーピアネットワークにおけるピアとみなすことができ、各サイトに属する情報エージェント間で中間言語が形成される。なお、包括的で普遍的な中間言語の存在は期待されず、科学の特定の分野(例えば、マシンビジョン、ナノエレクトロニクス等)に固有の、特定の副次的な中間言語がエージェント間に出現すると考えられる。これらの中間言語は、データを交換するユーザの実際のニーズ及びその分野の意味構造に応じて適応化される。
なお、重要な点は、各ユーザが範疇の構造をサポートするために、データを組織化し、又は十分なメタデータを有しているという点である。範疇化器がこれらのメタデータにどのようにアクセスするかに関する特定のインプリメンテーションは、各ピアにローカルの問題である。ピアが使用できるメタデータは、情報検索の様々な標準的な手法を用いて得ることができる。
具体的応用例3:製品情報の共有
共有される情報は、ウェブコンテンツに制限されず、例えば、一般的な製品情報等の他の分野にも拡張できる。産業界におけるRFID規格(無線ICタグ:Radio Frequency Identification)の採用により、消費者及び企業は、あらゆる製品に関する情報を得ることができる。RFIDは、適切なリーダによって読み取ることができるデジタル信号を放つ小さな電子ラベルである。電子製品コード(Electronic Product Code:EPC)は、インターネットドメイン名を決定する際のドメインネームシステムと同様に、一意的な識別をあらゆる製品に提供する命名法によって、RFID規格を補足する。自動IDは、物理的マークアップ言語(Physical Markup Language:PML)を用いて、EPCをマシンにより読取可能な製品の物理的プロパティの記述に変換することによりデータベースを提供することによってEPCを更に拡張する("PML Core Specification 1.0", Christian Floerkemeier, Dipan Anarkat, Ted Osinski, Mark Harrison, Auto-ID Center, University of St.Gallen, Insititute of Technology Management, http://www.autoidlabs.org.uk/whitepapers/STG-AUTOID-WH005.pdf)。自動IDプロジェクトは、メタデータを製品の物理的性質に制限している。但し、今後は、食品の成分、電気製品の安全度等、製品に関するより多くのメタデータが利用可能になることが予想される、
人々は、製品のリストを日々取り扱い、閲覧している。例えば、消費者は、買物リストに商品を列挙し、雑誌は、注目の新製品を毎週選択し、シェフは、材料のリストによってレシピを発行し、小売業者は、そのカタログを発行し、消費者団体は、独自の基準に基づいて、商品を格付けする。製品/商品及び消費者の両方が電子機器を備えるようになり、人々の間での製品情報の交換は、一時的な分散型の環境で行われるようになった。例えば、ショッピングセンターでは、これらの情報システム間の相互運用性が実現でき、このような状況にも本発明は好適に適用できる。
本発明を用いて、新たなアプリケーションを導入できる。例えば、買物客は、複数の商品を選択し、他の買物客に、類似するアイテムのリストを尋ねる。同様の興味を有するユーザ間には、徐々に中間言語が発達し、これが情報交換に有効になる。この場合も、包括的で普遍的な中間言語は確立されず、特定の共同体で利用可能なニーズ、興味及びメタデータに順応した多くのローカル言語が生じる。
以上、本発明の好適な実施形態の詳細な特徴を用いて本発明を説明したが、本発明は、上述の実施形態の特殊性に制限されないことは当業者にとって明らかである。更に、上述した好適な実施形態は、特許請求の範囲で定義される本発明の範囲から逸脱することなく、様々に修正し及び適応化することができる。
例えば、上述したピア間のクエリ応答トランザクションでは、サーバは、クライアントの要求に適合すると考えられる全てのデータをクライアントに送信している。しかしながら、この場合、1つのデータアイテムのみを返信してもよく、より包括的には、サーバがクライアントの問合わせに適合すると考えるデータの完全な集合より少ない数のデータアイテムを返信してもよい。
更に、上述した具体的応用例では、クライアントのオーナがクエリに対する応答を受け取った場合、オーナは、クエリに関連している結果(存在すれば)を選択し、自らの情報システムに選択した項目を加えるか否かを決定することができる。実際には、オーナは、オーナ側で更なる操作を行うことなく、選択された結果を自動的にオーナの情報システムに追加することを好む場合もあり、このような構成としてもよい。
更に、(一方がクライアントとして機能し、他方がサーバとして機能する)2つの情報システムの間の一対一の交換に関して本発明の好適な実施形態を説明したが、実際には、クライアントは、特定のアドレスを指定することなく、ピアツーピアネットワークに同報通信的にメッセージを送出してもよい。換言すれば本発明は、クライアントがネットワーク内の実質的に全てのメンバに(又は、例えば、委託されたピアの共同体等の予め定義された下位集合に)クエリを送出する場合も包含する。クライアント(及び/又はネットワーク内の制御要素)は、周知のアルゴリズムを用いて、現在のクエリの以後の処理において、どのピア(又は複数のピア)をサーバとみなすかを決定してもよい。また、本発明は、第1の情報システムが特定のサーバに対してクエリを発する場合も包含することは明らかである。
更に、ピアツーピアネットワークにおける情報システム間の情報交換において意味相互運用性を促進する上述した技術は、1つの情報システムのオーナが他の情報システムに対しデータの要求(クエリ)を行う場合を想定している。しかしながら、これらの技術は、例えば、1人の情報システムのオーナが他の情報システムのオーナに対し、自らの情報システムに保有するデータに関する告知(オファー)を行う等の他の状況に容易に適応化することができる。
利用可能なデータの「告知」にかかわる情報交換では、告知を受け取った情報システムのオーナは、告知を行った情報システムにデータを要求することによって、告知に応じることができる。この場合、情報システムのオーナが告知を受け取り、データを要求でき、告知を行った情報システムによって提供された結果に対して選択を行うことができる。したがって、この場合、「告知側」がサーバであり、告知を受け取る情報システムがクライアントである。ピア間における「告知」型のトランザクションでは、上述と同様の符号化、復号、範疇化及びフィルタリング処理を用いることができる。
上述した好適な実施形態では、最初に、クライアントからサーバにラベルを含むクエリを発し、ラベルによって指定された範疇の実例は、後に送信しているが、初期のクエリの送信において、ラベルに実例及び/又は反例データを含ませてもよい(但し、これは、クライアント及びサーバが、いずれも使用されているラベルを既に理解している場合には、非効率な処理である)。
従来の情報システムにおけるデータの構造化及びオーナが定義した概念階層を示す図である。 本発明の好適な実施形態の情報システムに関連するエージェントの概念階層を示す図である。 本発明の好適な実施形態に基づくピアツーピア交換に関する異なる情報アイテム及びマッピングを示す図である。 第1のピアツーピア交換を説明する図である。 第2のピアツーピア交換を説明する図である。 異なるパラメータが情報システム間の共通のレキシコンの成長にどのように影響するかを示すグラフ図である。

Claims (17)

  1. データアイテムの第1のコレクションにアクセスするアクセス手段と、
    上記情報システムのユーザが、上記第1のコレクションのデータアイテムである1つ以上の実例の集合を参照情報として、上記データアイテムのクラスを特定して、リモートの情報システムから検索することを望んだデータアイテムのクラスを特定できるようにする検索要求手段と、
    上記検索要求手段に応答し、ユーザの要求をリモートの情報システムに送信するための、検索が求められるデータアイテムの範疇を指定するラベルを含む初期のクエリを準備する情報エージェントであって、ユーザによって特定された上記実例の集合に範疇を自動的に割り当てる分類器を備え、該初期のクエリに、該割り当てられた範疇に対応するラベルを含ませる情報エージェントと、
    上記情報エージェントによって準備された初期のクエリを出力する出力手段と、
    上記出力手段によるクエリの出力に対応して、リモートの情報システムによって検索されたデータアイテムを特定する情報を受け取る入力手段と、
    第1のユーザに対し、上記リモートの情報システムによって検索されたデータアイテムを特定する上記情報を表示する表示手段と、
    上記第1のユーザが、上記クエリに対応して上記リモートの情報システムによって検索されたデータアイテムから選択を行うことができる選択手段とを備え、
    上記情報エージェントは、範疇と、ラベルと、該ラベル及び範疇の間の関係性に関する情報とを維持し、上記割り当てられた範疇に最も強い関係性を有するラベルを上記初期のクエリに含め、
    上記情報エージェントは、上記選択手段に応答し、上記ユーザの選択に基づいて、上記ラベル及び範疇の間の関係性の強度を変更することを特徴とする情報システム。
  2. 上記情報エージェントは、
    上記検索されたデータアイテムから上記ユーザによって選択されたデータアイテムの数が、所定の閾値より多いか少ないかを判定し、
    上記選択されたデータアイテムの数が所定の閾値より多い場合、他のラベルと割り当てられた範疇との間の関係性の強度に対して、初期のクエリで用いられたラベルと割り当てられた範疇との間の関係性の強度を高めることを特徴とする請求項1記載の情報システム。
  3. 上記情報エージェントは、
    上記検索されたデータアイテムから上記ユーザによって選択されたデータアイテムの数が、所定の閾値より多いか少ないかを判定し、
    上記選択されたデータアイテムの数が所定の閾値より少ない場合、初期のクエリで用いられたラベルと割り当てられた範疇との間の関係性の強度を低めることを特徴とする請求項1又は2記載の情報システム。
  4. ユーザが、上記第1のコレクションのデータアイテムに適用可能なデータ構造を定義できるようにし、該データ構造のノードは、ユーザ概念階層に基づいてラベルが付される構造化手段を備え、
    上記検索要求手段は、上記情報システムのユーザが、上記ユーザ概念階層を参照して、上記検索を求められたデータアイテムのクラスを特定できるようにすることを特徴とする請求項1乃至3いずれか1項記載の情報システム。
  5. 上記情報エージェントによって維持されるリスト内の各範疇は、弁別的特徴の集合によって定義され、上記分類器は、上記ユーザによって特定された実例の集合の特徴と、上記情報エージェントによって維持されるリスト内の範疇の弁別的特徴集合とを比較することにより、上記ユーザが特定したデータアイテムの集合を割り当てる範疇を決定することを特徴とする請求項1乃至4いずれか1項記載の情報システム。
  6. 上記選択手段に応答し、上記ユーザの選択を特定する信号をリモートの情報システムに出力するフィードバック手段を備える請求項1乃至5いずれか1項記載の情報システム。
  7. 上記情報エージェントは、上記リモートの情報システムによって上記クエリに対応するデータアイテムが検索できなかったことをリモートの情報システムから受け取った情報が示している場合、又はユーザが上記選択手段を操作して選択した検索されたデータアイテムの数が所定の閾値より少ない場合に、上記ユーザが特定した実例の集合を特定するデータをリモートの情報システムに出力することを特徴とする請求項1乃至6いずれか1項記載の情報システム。
  8. 上記情報エージェントは、
    上記検索されたデータアイテムから上記ユーザによって選択されたデータアイテムの数が、所定の閾値より多いか少ないかを判定し、
    上記選択された数が閾値を下回る場合、上記分類器は、上記検索要求手段に特定された上記実例の集合及び上記リモートの情報システムによって検索されたデータアイテムからユーザによって選択されたデータアイテムに適用可能な改訂された範疇を決定し、
    上記改訂された範疇が上記初期のクエリにおいてラベルが付された割り当てられた範疇とは異なる場合、上記改訂された範疇に対する最も強い関係性を有するラベルである改訂されたラベルを含む上記初期のクエリへの補足情報を準備し、リモートの情報システムに出力することを特徴とする請求項1乃至7いずれか1項記載の情報システム。
  9. データアイテムの第2のコレクションにアクセスするアクセス手段と、
    リモートの情報システムから、ラベルを含み、上記第2のコレクションからデータアイテムの検索を要求する初期のクエリを受け取る入力手段と、
    上記受信した初期のクエリを処理し、上記ラベルに基づいて、上記第2のコレクションからの検索のためのデータアイテムの初期の範疇を判定する復号手段を有し、上記判定された初期の範疇に属する上記第2のコレクション内のデータアイテムを特定する初期応答を準備する情報エージェントと、
    上記初期応答を上記リモートの情報システムに出力する出力手段とを備え、
    上記情報エージェントは、範疇と、ラベルと、該ラベル及び範疇の間の関係性に関する情報とを維持し、上記復号手段は、上記初期のクエリによって受け取ったラベルに最も強い関係性を有する範疇を選択することによって検索のための上記データアイテムの初期の範疇を判定し、
    上記情報エージェントは、上記リモートの情報システムから受信した、上記リモートの情報システムのユーザによる、上記初期応答で特定されたデータアイテムからの選択を示すフィードバックに応答し、上記ラベルと範疇との間の関係性の強度を変更することを特徴とする情報システム。
  10. 上記情報エージェントは、上記リモートの情報システムから受信したフィードバックにおいて、上記検索されたデータアイテムから上記ユーザによって選択されたデータアイテムの数が、所定の閾値より多いか少ないかを判定し、
    上記選択されたデータアイテムの数が所定の閾値より多い場合、上記ラベルと他の範疇との間の関係性の強度に対して、上記受信した初期のクエリにおけるラベルと上記復号手段によって判定された初期の範疇との間の関係性の強度を高めることを特徴とする請求項9記載の情報システム。
  11. 上記情報エージェントは、上記リモートの情報システムから受信したフィードバックにおいて、上記検索されたデータアイテムから上記ユーザによって選択されたデータアイテムの数が、所定の閾値より高いか低いかを判定し、
    上記選択されたデータアイテムの数が所定の閾値より少ない場合、上記受信した初期のクエリにおけるラベルと上記復号手段によって判定された初期の範疇との間の関係性の強度を低めることを特徴とする請求項9又は10記載の情報システム。
  12. 上記情報エージェントによって維持されるリスト内の各範疇は、弁別的特徴の集合によって定義され、上記情報エージェントは、上記データアイテムの特徴と、上記判定された初期の範疇の弁別的特徴の集合とを比較することによって、上記第2のコレクションにおいて、検索のためのデータアイテムを特定することを特徴とする請求項9乃至11いずれか1項記載の情報システム。
  13. 上記情報エージェントによって維持されるリスト内の各範疇は、弁別的特徴の集合によって定義され、
    上記情報エージェントは、上記リモートの情報システムから受け取った、検索が望まれるデータアイテムのクラスの実例を構成するデータアイテムの集合を特定する実例データを解析することによって、検索のためのデータアイテムの優位の範疇を特定する分類器を備え、該分類器は、上記実例データアイテムの特徴と、上記情報エージェントによって維持されているリスト内の範疇の弁別的特徴集合とを比較することによって、検索のための優位の範疇を特定することを特徴とする請求項9乃至12いずれか1項記載の情報システム。
  14. 上記分類器は、上記情報エージェントによって維持されているリスト内の範疇の特徴の集合のいずれも、実例であるデータアイテムに関して弁別的でない場合、上記実例であるデータアイテムの弁別的特徴の集合を判定し、該弁別的特徴の集合に対応する新たな範疇を作成することを特徴とする請求項13記載の情報システム。
  15. クライアントモード又はサーバモードで動作可能な複数のピアである情報システムを含むピアツーピア情報交換ネットワークにおいて、各情報システムは、上記クライアントモードでは、請求項1乃至8いずれか1項記載の情報システムとして動作し、上記サーバモードでは、請求項9乃至14いずれか1項記載の情報システムとして動作するピアツーピア情報交換ネットワーク。
  16. データアイテムの第1のコレクションにアクセスするアクセス手段と、
    上記情報システムのユーザが、上記第1のコレクションのデータアイテムである1つ以上の実例の集合を参照情報として、上記データアイテムのクラスを特定して、リモートの情報システムから検索することを望んだデータアイテムのクラスを特定できるようにする特定手段と、
    上記特定手段に応答し、リモートの情報システムに送信するためのデータアイテムの範疇を指定するラベルを含む初期のメッセージを準備する情報エージェントであって、ユーザによって特定された上記実例の集合に範疇を自動的に割り当てる分類器を備え、上記初期のメッセージに、該割り当てられた範疇に対応するラベルを含ませる情報エージェントと、
    上記情報エージェントによって準備された初期のメッセージを出力する出力手段と、
    リモートの情報システムから、上記第1のデータコレクションにおける、上記初期のメッセージに含まれている上記ラベルによって示されている範疇に該当するデータアイテムの識別のための要求を受信する入力手段とを備え、
    上記情報エージェントは、上記リモートの情報システムへの上記実例の集合を特定し、
    上記情報エージェントは、範疇と、ラベルと、該ラベル及び範疇の間の関係性に関する情報とを維持し、上記割り当てられた範疇に最も強い関係性を有するラベルを上記初期のメッセージに含め、
    上記情報エージェントは、上記リモートの情報システムから受信した、上記リモートの情報システムのユーザによる、上記データアイテムの集合からの選択を示すフィードバックに応答し、上記ラベルと範疇との間の関係性の強度を変更することを特徴とする情報システム。
  17. データアイテムのコレクションと、ユーザがリモートピアから検索するためのデータアイテムのクラスを指示するための手段と、ユーザがリモートピアによって検索されたデータアイテムに対する選択を行う手段とを有し、クライアントモード又はサーバモードで動作可能な複数のピア情報システムを含むピアツーピアネットワークにおける情報交換の管理方法において、
    上記各ピア情報システムに範疇と、ラベルと、該ラベル及び範疇の間の関係性に関する情報とを維持する情報エージェントを提供するステップを有し、
    上記クライアントモードにおいてクエリを定式化する場合、上記情報エージェントは、ユーザが希望するデータアイテムのクラスを表す実例データを解析してクエリのためのクライアント側の範疇を判定し、リモートピアに出力する該クエリに、上記判定されたクライアント側の範疇に最も強い関係性を有するラベルを含め、
    上記サーバモードにおいてクエリに応じる場合、上記情報エージェントは、該クエリによって受信したラベルを復号し、検索のためのデータアイテムの範疇として、該受信したラベルに最も強い関係性を有するサーバ側の範疇を判定し、
    上記情報エージェントは、リモートのピアが検索したデータアイテムに対するユーザの選択に基づいて、上記関係性に関する情報内のラベルと範疇との間の関係性の強度を変更する情報交換の管理方法。
JP2005292756A 2004-10-05 2005-10-05 ピアツーピア情報交換における意味相互運用性のための自己組織化方法 Active JP4852288B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04292363.1 2004-10-05
EP04292363.1A EP1645974B1 (en) 2004-10-05 2004-10-05 Self-organisation approach to semantic interoperability in peer-to-peer information exchange

Publications (2)

Publication Number Publication Date
JP2006107515A true JP2006107515A (ja) 2006-04-20
JP4852288B2 JP4852288B2 (ja) 2012-01-11

Family

ID=34931433

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005292756A Active JP4852288B2 (ja) 2004-10-05 2005-10-05 ピアツーピア情報交換における意味相互運用性のための自己組織化方法

Country Status (4)

Country Link
US (1) US7707147B2 (ja)
EP (1) EP1645974B1 (ja)
JP (1) JP4852288B2 (ja)
CN (1) CN1767541B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007029348A1 (ja) * 2005-09-06 2007-03-15 Community Engine Inc. データ抽出システム、端末装置、端末装置のプログラム、サーバ装置、及び、サーバ装置のプログラム
US7822745B2 (en) * 2006-05-31 2010-10-26 Yahoo! Inc. Keyword set and target audience profile generalization techniques
US20080154906A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation Selecting information for ad hoc exchange
US8204856B2 (en) 2007-03-15 2012-06-19 Google Inc. Database replication
ES2386202T3 (es) 2007-04-17 2012-08-13 Vodafone Holding Gmbh Método y unidad central de proceso para administrar conexiones punto a punto
US8626951B2 (en) * 2007-04-23 2014-01-07 4Dk Technologies, Inc. Interoperability of network applications in a communications environment
CN100535904C (zh) * 2007-08-11 2009-09-02 腾讯科技(深圳)有限公司 检索在线广告资源的方法和装置
US20100100546A1 (en) * 2008-02-08 2010-04-22 Steven Forrest Kohler Context-aware semantic virtual community for communication, information and knowledge management
US20100106704A1 (en) * 2008-10-29 2010-04-29 Yahoo! Inc. Cross-lingual query classification
US8583682B2 (en) * 2008-12-30 2013-11-12 Microsoft Corporation Peer-to-peer web search using tagged resources
WO2010138972A2 (en) 2009-05-29 2010-12-02 Abacast, Inc. Selective access of multi-rate data from a server and/or peer
US8930959B2 (en) 2011-05-13 2015-01-06 Orions Digital Systems, Inc. Generating event definitions based on spatial and relational relationships
CN102231151B (zh) * 2011-05-19 2016-06-22 安徽农业大学 一种农业领域本体自适应学习建模方法
CN102739804A (zh) * 2012-07-12 2012-10-17 白玉琪 基于设备自定义的设备互操作方法
CN104079326B (zh) * 2013-03-25 2017-08-04 华为终端有限公司 一种设备识别方法及相关设备
US10223637B1 (en) 2013-05-30 2019-03-05 Google Llc Predicting accuracy of submitted data
US10146865B2 (en) * 2013-10-04 2018-12-04 Orions Digital Systems, Inc. Tagonomy—a system and method of semantic web tagging
EP3602323A1 (en) * 2017-03-28 2020-02-05 Open Text SA ULC Integration services systems, methods and computer program products for ecm-independent etl tools
US11954605B2 (en) * 2020-09-25 2024-04-09 Sap Se Systems and methods for intelligent labeling of instance data clusters based on knowledge graph

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000508805A (ja) * 1996-12-11 2000-07-11 ソニー株式会社 オブジェクトを特徴付ける特性を抽出する方法及び装置並びにそれらの使用法
US6556983B1 (en) * 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
JP2003141163A (ja) * 2001-11-05 2003-05-16 Nippon Telegr & Teleph Corp <Ntt> 情報蓄積・検索装置及び方法、情報蓄積・検索プログラムならびにそのプログラムを記録した記録媒体
JP2004157826A (ja) * 2002-11-07 2004-06-03 Dainippon Printing Co Ltd ピアツーピア型文書共有ネットワークシステム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852823A (en) * 1996-10-16 1998-12-22 Microsoft Image classification and retrieval system using a query-by-example paradigm
US6751600B1 (en) * 2000-05-30 2004-06-15 Commerce One Operations, Inc. Method for automatic categorization of items
US6598042B1 (en) * 2000-09-29 2003-07-22 International Business Machines Corporation System and method for query by category
JP4276168B2 (ja) * 2002-05-10 2009-06-10 マイクロソフト コーポレーション 資源についての並行、分散ネットワークの協調
US7769881B2 (en) * 2003-01-24 2010-08-03 Hitachi, Ltd. Method and apparatus for peer-to peer access

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000508805A (ja) * 1996-12-11 2000-07-11 ソニー株式会社 オブジェクトを特徴付ける特性を抽出する方法及び装置並びにそれらの使用法
US6556983B1 (en) * 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
JP2003141163A (ja) * 2001-11-05 2003-05-16 Nippon Telegr & Teleph Corp <Ntt> 情報蓄積・検索装置及び方法、情報蓄積・検索プログラムならびにそのプログラムを記録した記録媒体
JP2004157826A (ja) * 2002-11-07 2004-06-03 Dainippon Printing Co Ltd ピアツーピア型文書共有ネットワークシステム

Also Published As

Publication number Publication date
EP1645974A1 (en) 2006-04-12
CN1767541B (zh) 2012-03-21
EP1645974B1 (en) 2014-01-01
US20060074906A1 (en) 2006-04-06
US7707147B2 (en) 2010-04-27
JP4852288B2 (ja) 2012-01-11
CN1767541A (zh) 2006-05-03

Similar Documents

Publication Publication Date Title
JP4852288B2 (ja) ピアツーピア情報交換における意味相互運用性のための自己組織化方法
Bizer et al. Linked data-the story so far
Guha et al. Semantic search
Bouadjenek et al. Social networks and information retrieval, how are they converging? A survey, a taxonomy and an analysis of social information retrieval approaches and platforms
US8200667B2 (en) Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile
US9262535B2 (en) Systems and methods for semantic overlay for a searchable space
Peis et al. Semantic recommender systems. analysis of the state of the topic
US8688673B2 (en) System for communication and collaboration
Abdel-Hafez et al. A survey of user modelling in social media websites
Baeza-Yates Information retrieval in the web: beyond current search engines
US20110060717A1 (en) Systems and methods for improving web site user experience
US20110179020A1 (en) Scalable topical aggregation of data feeds
US20070011155A1 (en) System for communication and collaboration
US20080147633A1 (en) Bringing users specific relevance to data searches
Kumar World towards advance web mining: A review
Rossetto et al. VideoGraph–towards using knowledge graphs for interactive video retrieval
Bhatia et al. Information retrieval and machine learning: supporting technologies for web mining research and practice
US20150363477A1 (en) Methods and apparatus for information organization and exchange
Bouadjenek et al. Personalized social query expansion using social annotations
Obidallah et al. A survey on web service discovery approaches
Steels et al. Interoperability through emergent semantics a semiotic dynamics approach
Wen Development of personalized online systems for web search, recommendations, and e-commerce
EP1929410A1 (en) System for communication and collaboration
Yang et al. Retaining knowledge for document management: Category‐tree integration by exploiting category relationships and hierarchical structures
Kalou et al. Combining the best of both worlds: A semantic web book mashup as a Linked Data service over CMS infrastructure

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080410

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080411

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081003

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110708

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110713

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110812

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111024

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4852288

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141028

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250