JPH11514764A

JPH11514764A - 所望のオブジェクトのカスタム化された電子識別のためのシステム

Info

Publication number: JPH11514764A
Application number: JP9517635A
Authority: JP
Inventors: エス．エム．ハーツ，フレデリック; エム．アイスナー，ジェイソン; エム．スミス，ジョナサン; エル．サルツバーグ，スティーブン
Original assignee: エス．エム．ハーツ，フレデリック
Priority date: 1995-10-31
Filing date: 1996-10-29
Publication date: 1999-12-14
Also published as: WO1997016796A1; AU7674996A; MX9803418A; EP0941515A1

Abstract

(57)【要約】本発明は、電子媒体環境における、ニュース記事などの所望のオブジェクトのカスタム化電子識別に関し、具体的には、例えば、各単語の、すべての記事において使用される全体的な度数と比較した、ある記事で現れる度数に基づいて、電子媒体における各ターゲットオブジェクトに対する「ターゲットプロファイル」と、様々なタイプのターゲットオブジェクトに対するユーザの関心のレベルを記述する、各ユーザに対する「ターゲットプロファイル関心サマリ」との両方を自動的に構築するシステムに関する。次いでシステムは、ターゲットプロファイルをユーザのターゲットプロファイル関心サマリと比較して評価して、各ユーザにとって最も関心のありそうなターゲットオブジエクトの、ユーザ別にカスタム化されたランクで順序付けされたリストを生成し、その結果ユーザは、電子媒体上でプロファイルされる過多のターゲットオブジェクトからこのシステムによって自動的に選択された、これらの関連性のある可能性のあるターゲットオブジェクトから選択を行い得る。ユーザのターゲットプロファイル関心サマリは、通信ネットワークによって相互接続される多くのユーザから構成される大規模なシステムにおいて、情報の配信を効率的に編成するために使用され得る。さらに、暗号化ベースの仮名代理サーバが提供され、ユーザのターゲットプロファイル関心サマリのプライバシーを、第三者がこのサマリにアクセスする能力、およびユーザを識別あるいはユーザに接触する能力に対する制御をユーザに与えることによって、確保する。

Description

【発明の詳細な説明】所望のオブジェクトのカスタム化された電子識別のためのシステム関連出願へのクロスリファレンス本特許出願は、1994年11月28日出願の「SYSTEM AND METHOD FOR SCHEDULING B ROARDCAST OF AND ACCESS TO VIDEO PROGRAMS AND OTHER DATA USING CUSTOMERP ROFILES」と題された米国特許出願シリアル番号第08/346,425号の一部継続出願である。上記出願は、本願と同一の譲受人に譲受されるものである。発明の分野本発明は、電子媒体環境における、ニュース記事などの所望のオブジェクトのカスタム化された電子識別に関する。具体的には、本発明は、例えば各単語についてのすべての記事中での全体の使用頻度に対する１つの記事での使用頻度などに基づいて、電子媒体において各ターゲットオブジェクトに関する「ターゲットプロファイル」を自動的に構成するとともに、様々な種類のターゲットオブジェクトについてのユーザの関心度を記述する、各ユーザに関する「ターゲットプロファイル関心サマリー」を自動的に構成するシステムに関する。このシステムはさらに、ユーザのターゲットプロファイル関心サマリーに対してターゲットプロファイルを評価し、ユーザカスタム化されたランク順で、各ユーザが最も関心を持ちそうなターゲットオブジェクトのリストを生成する。そのため、ユーザは、電子媒体上でプロファイルされる（profile）過剰な数のターゲットオブジェクトからこのシステムが自動的に選択したこれらの関連がある可能性のあるターゲットオブジェクトから選択できるようになる。ユーザのターゲットプロファイル関心サマリーを用いて、通信ネットワークによって相互接続される多くのユーザからなる大規模なシステムにおいて情報の分配を効率的に組織することができる。さらに、ユーザのターゲットプロファイル関心サマリーのプライバシーを確保するために、第三者がこのサマリーにアクセスする能力およびユーザを識別するあるいはユーザと連絡をとる能力の制御をユーザに与えることによって、暗号に基づく代理（proxy）サーバが提供される。問題点ユーザが、情報の検索に過剰な時間およびエネルギーを費やす必要なく、関連および関心のある情報にアクセスすることができるようになることが、電子媒体の分野の問題点である。オンライン情報源などの電子媒体は、典型的には「記事（article）」の形態で大量の情報をユーザに提供する。記事の各々は、特定のトピックに関する出版物の品目あるいは文書を含む。電子媒体における困難な点は、ユーザに利用可能な情報量が圧倒的に多く、オンラインで接続されている記事保管（repository）システムは、ユーザが関心を持つ記事だけに十分に簡単にアクセスできるようにする態様では組織されていない。ユーザは、関連する記事を簡単に識別できないため、その記事へのアクセスができないか、あるいは、相当量の時間およびエネルギーを費やしてすべての記事をすみからすみまで検索している、というのが現状である。さらに、ユーザがすみからすみまで検索をしたとしても、現在の情報検索技術では、必ずしも最も関連のある記事だけを正確に抽出できるとは限らず、情報検索技術の機能上の制限のため、少ししか関連のない記事も示されてしまう。既存のシステムでは、記事あるいはその他のターゲットオブジェクトの固有の品質を自動的に評価して、ユーザが関心を持つ可能性があるとして識別された多数の記事あるいはターゲットオブジェクトを区別するシステムはない。従って、情報取り出し（retrieval）の分野では、ユーザが過剰な量の情報の中をナビゲートする（navigate）ことを可能にするシステムが長年必要とされてきている。インターネットなどの通信ネットワークの商業化に伴い、利用可能な情報はますます増大している。ユーザ独自の好みおよび関心に合わせた情報配送プロセスの商業化は、この問題点の究極の解決策である。しかし、今日までに提案されている技術は、ユーザの関心に表面上のレベルでしか取り組んでいないものであるか、あるいは、ユーザが必要以上の時間およびエネルギーを消費することと引き換えに、さらなる深さおよび情報を与えるものである。多くの研究者達は、従来の方法がこの点で欠けていることについては同意しているが、今日までに、これらの問題点に全体論的に取り組むことに成功し、ユーザの好みおよび関心を完全に把握してそれを反映させることができるシステムを提供した者はいない。このことは、インターネット上で利用可能なオンラインサービスなどの実際の商業に関して特に当てはまることである。かなりあるいは完全に受動的で、控えめで、ユーザに対する要求がなく、なおかつ、ユーザの好みおよび関心を把握してそれを忠実に表す精確で包括的な能力を有する情報取り出しシステムが必要とされている。現在の情報取り出しシステムでは、ユーザが、煩わしいインターフェースを介して所望の情報取り出し動作を特定しなければならない。ユーザは、情報を能動的に取り出すか、あるいはユーザに送られてくる情報を受動的に受け取ることによって、コンピュータネットワーク上で情報を受け取り得る。情報取り出しシステムのユーザが過剰な情報量の問題に直面しているように、個人あるいは組織からの不要な電子メールの標的とされたユーザも同じ問題に直面している。理想的なシステムがあるとすれば、それは、電子メールで受信したメッセージのうちで最も関連のあるメッセージだけを自動的に抽出し、且つ、ネットワーク上で他人に自由に入手可能であってはならないユーザの好みの秘密性を保護することによって、一方的に送りつけられる広告からユーザを守るシステムであろう。出版物情報取り出しの分野の研究者達は、ユーザが、大きな一組の記事から関心のある記事を選択することを可能にする効率的で正確な方法を見つけるために相当な努力をささげてきた。最も広く用いられている情報取り出し方法は、キーワード整合に基づく方法である。即ち、ユーザが、所望の記事だけに見られると考える一組のキーワードを特定すると、情報取り出しコンピュータが、それらのキーワードを含む記事をすべて取り出すという方法である。このような方法は高速ではあるが、信頼性がないことは明らかである。なぜなら、ユーザが正しいキーワードを思いついてるとは限らず、あるいは、そのキーワードが必要でない記事の中で関連のない文脈または予期していない文脈で用いられている場合もあるからである。その結果、情報取り出しコンピュータは、ユーザが必要としていない記事を数多く取り出してしまう。キーワードの論理的組合せと、ワイルドカード検索パラメータの使用とは、キーワード検索の精度を向上する助けとはなるが、検索結果が不正確であるという問題点を完全に解決するものではない。 1960年代から、情報取り出しのための別のアプローチが開発され始めた。この別のアプローチでは、ユーザに記事が示され、その記事にユーザが望む情報が含まれているかどうかがユーザに質問されるか、あるいは、その記事に含まれている情報が、ユーザが望む情報にどのくらい近いかを数量化するよう求められる。各記事は、記事に使用される単語のリストを含むプロファイルによって、あるいは、より進んだシステムでは、記事中の単語の使用頻度の表を含むプロファイルによって記述される。記事間の類似性の測定はそれらの記事のプロファイル間の距離であるため、記事プロファイル間の測定された類似性を用いて、記事取り出しを行うことができる。例えば、ある主題に関する情報を検索しているユーザは、所望の情報の短い説明を書き込むことができる。情報取り出しコンピュータは、リクエストについての記事プロファイルを生成し、その後、このリクエストについて生成されたプロファイルと類似したプロファイルを有する記事を取り出す。その後、記事に含まれる情報がどれだけ所望の情報に近いかについて、取り出された記事をユーザが能動的にあるいは受動的に評価する「関連性フィードバック」を用いて、これらのリクエストを精製する（refine）ことができる。その後、情報取り出しコンピュータは、この関連性フィードバック情報を用いてリクエストプロファイルを精製する。このプロセスは、ユーザが十分な記事を見つけるかあるいは検索をやめたくなるまで繰り返される。多くの研究者達が、ユーザが最も関心を持つ記事を選択する方法について考察してきた。CHi-95 ProceedingsでPatti Maesらにより「Social Information fil tering：algorithms for automating'word of mouth'」と題された論文が発表されており、この論文には、音楽の選択を薦めるRingo情報取り出しシステムが記載されている。Ringoシステムは、ユーザからの能動的フィードバックを必要とする。即ち、ユーザは、各音楽の選択についてどの程度好きかあるいは嫌いかを手動で示さなければならない。Ringoシステムは、音楽の選択についてのユーザによる評点の完全なリストを維持し、どの選択が多数の人々によって好まれたかを見いだすことにより推薦を行う。しかし、Ringoシステムは、データベースの構造化された記述などの、音楽についての利用可能な記述、あるいは、音楽批評に含まれるテキストなどの利用可能な無料のテキストを利用していない。Proc . 9th IEEE Conf．on AI for ApplicationsでShethおよびMaesにより発表された「Evolving agents for personalized information filtering」と題された論文では、エージェントを用いて情報のフィルタリングを行うことが記載されており、このエージェントは、遺伝的アルゴリズムを用いて、Usenetニュース記事を分類するようにしている。このシステムでは、ユーザは、ニュースのカテゴリーを規定しなければならず、ユーザは、選択された記事についての意見を能動的に示す。彼らのシステムでは、キーワードのリストを用いて記事の組を表し、ユーザの関心の記録は、遺伝的アルゴリズムを用いて更新される。他の多くの研究者グループが、記事をブラウズ（browsing）するための、記事クラスタの自動生成およびラベル付けについて考察してきた。Xerox Parcのグループが、15 Ann．Int'l SIGIR '92、ACM 318-329（Cuttingら、1992年）で「Sca tter/gather：a cluster-based approach to browsing large article collecti ons」と題された論文を発表している。このグループは、情報取り出し検索を行う方法を開発し、彼らはこの方法を「分散／収集（scatter/gather）」と呼んでいる。この方法では、記事のコレクションを、少数のクラスタに「分散（scatte r）」し、その後、ユーザが、クラスタの短いサマリーに基づいて、分散されたクラスタから１つ以上のクラスタを選択する。次に、選択されたクラスタを「集め（gather）」てサブコレクションにする。その後、このプロセスが繰り返される。このプロセスを一回繰り返すごとに、より焦点を絞った小さいコレクションが生成されると予想される。クラスタの「サマリー」は、クラスタ中に最も頻繁に現れる単語と、クラスタの中心に最も近い記事のタイトルとを選ぶことによって生成される。しかし、ユーザからのフィードバックは収集あるいは格納されないため、経時的な性能の向上は得られない。 Apple's Advanced Technology Groupは、「記事のパイル（pile）」の概念に基づいたインタフェースを開発した。このインタフェースは、Mander、R．G．Sa lomonおよびY．Wongにより1992年にCHI '92 Conf．Proc．627-634で発表された「A 'plle' metaphor for supporting casual organization of information in Human factors in computer systems」と題された論文に記載されている。「Co ntent awareness in a file system interface：implementing the 'pile' meta phor for organizing information」と題された別の論文が、Rose E．D.らによって16 Ann．Int'l SIGIR '93、ACM 260-269に発表されている。Appleインタフェースは、単語の使用頻度を用いて、記事を自動的にファイルする。この自動的ファイルは、ファイルしている記事に最も類似したパイルを選ぶことによって行う。このシステムは、記事をクラスタ化してサブパイルにし、最も大きいＴＦ／ＩＤＦ（ここで、ＴＦは用語（単語）の使用頻度であり、ＩＤＦは逆文書頻度（ inverse document frequency）である）を有する単語を選ぶことによってインデックス付けのためのキーワードを決定し、決定したキーワードを用いてパイルにラベルを付ける機能を果たす。多くの特許が情報取り出し方法について取り組んではいるが、いずれの特許も、ユーザがどの記事にアクセスするかについての受動的なモニタリングに基づいた、ユーザの関心の記録は開発していない。これらの特許に記載されたいずれのシステムも、多くのコンピュータに分配された記事を高速で取り出すことを可能にするコンピュータアーキテクチャを与えるものではない。また、これらの特許に記載されたいずれのシステムも、このような記事取り出し／整合方法を商業目的に用いる場合の問題点、あるいは、ユーザを共通の関心と整合させる場合またはユーザの関心の記録を開発する場合の問題点には取り組んでいない。Changらに発行された米国特許第5,321,833号は、ユーザが情報取り出しの問い合わせ（q uery）に用いる用語を選択し、異なる用語の相対的重み付けを特定する方法を教示している。Changのシステムは、その後、多数の重み付け基準レベルを計算する。Landauerらに発行された米国特許番号第5,301,109号は、異なる単語間の相関を表す「潜在的ベクトル」（ＳＶＤベクトルまたはＰＣＡベクトル）を構成することによって多数の言語の記事を取り出す方法を教示している。Grahamらに発行された米国特許番号第5,331,554号は、問い合わせを判断ツリーのノードと比較することによりマニュアルの一部分を取り出す方法を開示している。米国特許番号第5,331,556号は、形態学的品詞情報を得るための技術であって、同じ単語の異なる形態（例えば、「article」と「articles」）の類似性を利用する技術に取り組んでいる。従って、現在の所、ユーザが、過剰な時間およびエネルギーを費やす必要なく、ユーザに関連および関心のある情報にアクセスすることを可能にする、電子媒体環境で動作可能な情報取り出し／配送システムはない。解決策電子媒体環境における所望のオブジェクトのカスタム化された電子識別のためのシステムであって、ユーザが、過剰な時間およびエネルギーを費やす必要なくユーザに関連および関心のあるターゲットオブジェクトにアクセスすることを可能にするシステムによって、上記問題点は解決されるとともに、当該技術分野の技術的進歩が達成される。ターゲットオブジェクトのプロファイルは、電子媒体上に格納され、データ通信ネットワークを介してアクセス可能である。多くの応用では、ターゲットオブジェクトは本質的に情報を提供するものであるため、ターゲットオブジェクト自体が電子媒体上に格納され得、データ通信ネットワークを介してアクセス可能であり得る。本明細書での説明のために、関連のある用語の定義を以下に挙げる。（a.）ユーザによるアクセスのために利用可能なオブジェクトであって、本質的に物理的あるいは電気的なものであり得るオブジェクトを、「ターゲットオブジェクト」と呼ぶ；（b.）そのターゲットオブジェクトの属性を示すデジタル的に表されたプロファイルを、「ターゲットプロファイル」と呼ぶ；（c.）ターゲットオブジェクトを探しているユーザを、「ユーザ」と呼ぶ；（d.）年齢、郵便番号などの、そのユーザの属性を保持するプロファイルを、「ユーザプロファイル」と呼ぶ；（e.）ユーザが好きなおよび／または嫌いなターゲットオブジェクトのデジタルプロファイルの要約（summary）を、そのユーザの「ターゲットプロファイル関心サマリー」と呼ぶ；（f.）属性のコレクションからなるプロファイルであって、例えば、ユーザがこの属性コレクションと類似したプロファイルを有するターゲットオブジェクトを好むようなプロファイルを、「検索プロファイル」と呼び、文脈によっては「問い合わせ」あるいは「問い合わせプロファイル」と呼ぶこともある；（g.）一組の検索プロファイルを含むターゲットプロファイル関心サマリーの特定の実施形態を、ユーザの「検索プロファイルセット」と呼ぶ；（ h.）類似したプロファイルを有するターゲットオブジェクトのコレクションを、「クラスタ」と呼ぶ；（i.）クラスタ中のすべてのターゲットオブジェクトの属性の平均をとることによって形成される集合プロファイルを、「クラスタプロファイル」と呼ぶ；（J.）クラスタ中のすべてのターゲットオブジェクトのプロファイルの統計的分散を計算することによって決定される実数を、「クラスタ分散」と呼ぶ；（k.）クラスタ中の任意の２つのターゲットオブジェクトのプロファイル間の最大距離を計算することによって決定される実数を、「クラスタ直径」と呼ぶ。本発明の所望のオブジェクトの電子識別のためのシステムは、例えば各単語についてのすべての記事中での全体の使用頻度に対する１つの記事での使用頻度などに基づいて、電子媒体において各ターゲットオブジェクトに関する「ターゲットプロファイル」を自動的に構成するとともに、様々な種類のターゲットオブジェクトについてのユーザの関心度を記述する、各ユーザに関する「ターゲットプロファイル関心サマリー」を自動的に構成する。このシステムはさらに、ユーザのターゲットプロファイル関心サマリーに対してターゲットプロファイルを評価し、ユーザカスタム化されたランク順で、各ユーザが最も関心を持ちそうなターゲットオブジェクトのリストを生成する。そのため、ユーザは、電子媒体上で利用可能な過剰な数のターゲットオブジェクトからこのシステムが自動的に選択したこれらの関連がある可能性のあるターゲットオブジェクトから選択できるようになる。人々は多様な関心を有しているため、一人のユーザのターゲットプロファイル関心サマリーは、関心を持っている多数の分野を示さなければならない。これは、例えば、各々の検索プロファイルがユーザが関心を持っている分野のうちの１つを識別する一組の個々の検索プロファイルによって、このターゲットプロファイルを構成することなどの方法で行われる。各ユーザには、ユーザのターゲットプロファイル関心サマリーによって記述されるようなユーザの関心と最も密接に整合するプロファイルを有するターゲットオブジェクトが与えられる。ユーザのターゲットプロファイル関心サマリーは、各ユーザの関心の変化を反映するために、常に自動的に更新される。さらに、ターゲットオブジェクトは、互いの類似性に基づいて、例えば、ターゲットオブジェクトが出版物である場合にはそれらの記事のトピックの類似性に基づいて、クラスタにグループ分けされ得るとともに、ターゲットオブジェクトの各クラスタについて自動的にメニューが生成され得、ユーザが、すべてのクラスタの中をナビゲートして、関心のあるターゲットオブジェクトの場所を手動で特定することを可能にする。機密性およびプライバシーの理由で、特定のユーザが、ユーザのターゲットプロファイル関心サマリーに記録された関心のすべては公開したくないと考える場合もある。これらの関心がユーザの購買パターンによって決定される場合は特にそうである。ユーザは、ユーザの政治的行為、宗教的行為、財政的行為、あるいは購買行為に関する情報など、ターゲットプロファイル関心サマリーのすべてあるいはその一部を秘密にしておきたいと考える場合もある。実際に、購買行為に関する機密性は、多くの州の法律で定められたユーザの権利である。従って、ユーザのターゲットプロファイル関心サマリーのデータを、ユーザの承諾を得ずに、ユーザの希望に反して公開されてしまうことがないようにすることが必要である。それと同時に、ターゲットオブジェクトのプロバイダおよび消費者がともにターゲットオブジェクトとユーザとの整合によって得られる利益を望んでいる場合には、この整合を行う関連のサーバが、ユーザのターゲットプロファイル関心サマリーにアクセスできるようにしなければならない。本明細書で開示するシステムは、情報プロバイダとユーザとの間の仲介役を果たす代理サーバを用いることによって、このプライバシーの問題に対する解決策を与えるものである。代理サーバは、暗号技術を用いることによって、ユーザの真のアイデンティティと仮名とを区別する。代理サーバはまた、ユーザのターゲットプロファイル関心サマリーおよび／またはユーザプロファイルへのアクセスをユーザ自身が制御することを可能にする。例えば、業者および広告業者がこのような情報の提供を望んでいる場合、ユーザは、おそらく現金あるいはその他の報酬と引き換えにこの情報を提供することなどが可能となる。業者は、これらのプロファイルを購入して、特定のユーザを広告の標的にし得る。あるいは、業者は、該当する個々のユーザを識別するための十分な情報を含んでいない部分的なユーザプロファイルを購入し、その結果得られた特定のユーザプロファイルのデータベースで標準的な種類の人口統計学的分析および市場調査を行い得る。本発明の好適な実施形態では、所望のオブジェクトのカスタム化された電子識別のためのシステムは、ユーザの関心およびターゲットオブジェクトの特性を記述するプロファイル情報を自動的に計算し、使用し、更新することによって、ユーザとターゲットオブジェクトとを正確に効率よく整合するための基本的な方法論を用いている。ターゲットオブジェクトは、出版物、購入可能な品目などが可能であり、自分以外の人であってもよい。ターゲットオブジェクトの特性は、電子媒体上で、（デジタル）データとして格納されおよび／または表されおよび／または示される。ターゲットオブジェクトの例としては、関心を引く可能性のある新聞記事、見たい映画、購入したい品目、受信したい電子メール、あるいは、やりとりをしたい自分以外の人、などが可能であるが、これらに限定されるわけではない。これらのすべての場合、好適な実施形態における情報配送プロセスは、ターゲットオブジェクトに関するプロファイルと、ユーザ（あるいは類似したユーザ）が過去にポジティブフィードバックを与えたことのあるターゲットオブジェクトのプロファイルとの間の類似性の決定に基づいて行われる。ターゲットオブジェクトを記述する個々のデータおよびターゲットオブジェクトのプロファイルを構成する個々のデータを、本明細書では、ターゲットオブジェクトの「属性」と呼ぶ。属性は、例えば以下の４つのものを含み得るが、これに限定されるわけではない。（１）長いテキスト（新聞記事、映画批評、製品説明書、あるいは広告）；（２）短いテキスト（映画監督の名前、広告を設置した町の名前、記事が書かれた言語の名称）；（３）数値測定（製品価格、映画に与えられた評点、書籍の読書レベル）；（４）他の種類のオブジェクトとの関連（映画の出演俳優リスト、文書を読んだ人のリスト）。これらの属性はいずれも、ターゲットオブジェクトの人気（アクセスされた頻度）あるいはユーザの満足度（受けた苦情件数）などといった、ターゲットオブジェクトの質と相関し得るが、中でも、数値属性が特にターゲットオブジェクトの質と相関し得る。所望のオブジェクトのカスタム化された電子識別のためのシステムの好適な実施形態は、電子媒体環境で動作し、これらのターゲットオブジェクトにアクセスする。これらのターゲットオブジェクトは、例えば、ニュース、電子メール、その他の出版文書、あるいは製品説明書などである。このシステムは、最も広い構成の場合、３つの概念的モジュールを含む。これらの概念的モジュールは、多くの実現システムに分配される別個のエンティティであってもよく、あるいは、これらの概念的モジュールは、組み合わされて、より小さい、物理的エンティティのサブセットにされる。本明細書に開示されるこのシステムの特定の実施形態は、ターゲットオブジェクトの様々な記述属性に基づいて、電子媒体において各ターゲットオブジェクトに関する「ターゲットプロファイル」を自動的に構成する第１のモジュールの使用を示している。第２のモジュールは、ユーザからの関心フィードバックを用いて、各ユーザに関する「ターゲットプロファイル関心サマリー」を、例えば複数の検索プロファイルからなる「検索プロファイルセット」などの形態で構成する。検索プロファイルはそれぞれ、ユーザの関心が高い１つのトピックに対応する。システムは、様々なターゲットオブジェクトにおける各ユーザの関心を評価して、各ユーザに対して、そのユーザが最も関心を持ちそうなターゲットオブジェクトのカスタム化されたランク順のリストを生成するプロファイル処理モジュールをさらに含む。ここで、ユーザの関心の評価は、例えばこれらのターゲットオブジェクトのターゲットプロファイルを、ユーザの検索プロファイルセットの検索プロファイルと比較することなどによって、ユーザのターゲットプロファイル関心サマリーを参照することによって行われる。各ユーザのターゲットプロファイル関心サマリーは、ユーザの関心の変化を反映するために、常に自動的に更新される。ターゲットオブジェクトには様々な種類のものがあり得る。一体の枠組（unif ied framework）で、幾つかの異なる種類のターゲットオブジェクトを一度に配送および／またはクラスタ化する１つのシステムを用いることが有利である場合もある。例えば、ある特定の小説に強い関心を示すユーザが、おそらく同様の種類の、ある特定の映画にも関心を示す場合もある。幾つかのターゲットオブジェクトが小説であり他のターゲットオブジェクトが映画であるシステムは、そのような相関関係を発見することができ、その相関関係を活用して、例えばクラスタ化などの目的で、特定の小説を特定の映画とともにグループ分けするか、あるいは、それらの小説に関心を示したユーザにそれらの映画を推薦する。同様に、ある特定のワールドワイドウェブサイトに関心を示すユーザがある特定の製品にも関心を示す場合、システムは、それらの製品をそれらのサイトと整合することができ、それにより、それらの製品の業者に、例えば業者自身のサイトへのハイパーテキストリンクなどの形態で、ユーザが関心を示したサイトに広告を載せるよう勧めることができる。ターゲットオブジェクトを記述するプロファイルとユーザの関心を記述するプロファイルとの類似性を測る能力は、２つの基本的な方法、即ち、フィルタリングおよびブラウズで適用することができる。フィルタリングは、多数のターゲットオブジェクトが電子媒体空間で記述される場合に有用である。これらのターゲットオブジェクトは、例えば、記事のわずかな部分しか読む時間のないユーザが受け取るあるいは受け取る可能性のある記事であってもよい。例えば、ＡＰ通信社のすべての項目、多数のニュースグループに送られたすべての項目、一組の新聞のすべての広告、あるいは、一方的に送りつけられるたすべての電子メールを受け取る可能性もあるが、そのような多くの記事を読む時間がある人あるいは読みたいと考える人はほとんどいない。所望のオブジェクトのカスタム化された電子識別のためのシステムのフィルタリングシステムは、ユーザが読みたいと思う可能性のある記事のセットを自動的に選択する。このフィルタリングシステムの精度は、ユーザがどの記事を読むかに注目することによって、および、ユーザが各記事を読む深さの測定値を生成することによって、経時的に向上する。その後、この情報を用いて、ユーザのターゲットプロファイル関心サマリーが更新される。ブラウズは、記事などの多数のターゲットオブジェクトの小さいサブセットを選択する別の方法を提供する。記事は、ユーザが、１つのグループから、より大きくより一般的なグループ、より小さくより具体的なグループ、あるいはより密接に関連するグループに移動することによって、能動的に記事のグループをナビゲートすることができるように編成される。個々の記事はそれぞれ、その記事自体だけからなる１要素のグループを形成する。そのため、ユーザは、より大きいグループの場合と同様、個々の記事におよび個々の記事からナビゲートすることができる。所望のオブジェクトのカスタム化された電子識別のためのシステムが用いるこれらの方法により、記事をクラスタにグループ分けすること、およびクラスタをグループ分けあるいは合併してもっと大きなクラスタにすることが可能となる。これらのクラスタ階層は、メニュー作成（menuing）およびナビゲーションシステムのための基礎となり、多数の記事の高速検索を可能にする。これと同じクラスタ化技術は、電子媒体上でプロファイルできるいかなる種類のターゲットオブジェクトにも適用可能である。記事取り出しのためのプロファイルの開発および利用というテーマにおいては多くの変形があり、オンラインニュースクリッピングサービスの基本的な実現は、本発明の好適な実施形態を表している。本明細書ではこの基本システムの変形を開示しており、この変形としては、電子メールをフィルタリングするシステム、より複雑な記述を有し得る、購入可能な品目などのターゲットオブジェクトの取り出しのための拡張、多数のターゲットオブジェクトをブラウズし検索するためのメニュー作成システムを自動的に形成し変更するシステム、および共通の関心を持つ人々の仮想コミュニティを構成するシステム、などがある。これらのインテリジェントフィルタおよびブラウザは、真に受動的なインテリジェントシステムインタフェースを提供するために必要である。直観的ブラウズおよびフィルタリングを可能にするユーザインタフェースは、ユーザとターゲットオブジェクトとの間の類似点（affinity）を決定するためのインテリジェントシステムを示す初めてのものである。詳細な包括的ターゲットプロファイルおよび特定ユーザ用ターゲットプロファイル関心サマリーにより、システムが、ユーザによる情報へのアクセスに関する特定の問い合わせの応答経路付け（responsive routing）を与えることが可能となる。このようにして生成された情報マップと、ユーザのターゲットプロファイル関心サマリーを適用してユーザの情報消費パターンの予測することとにより、データ通信ネットワークのトラフィックフローを最少にする時間に、データ通信ネットワーク上の場所にデータを予めキャッシュすることが可能となる。これにより、ユーザに所望の情報が効率よく与えられる。それとともに／あるいは、ユーザの関心に関連するターゲットオブジェクト（あるいは、そのセグメント）だけを格納することにより貴重な記憶空間が節約される。図面の簡単な説明図１は、本発明の所望のオブジェクトのカスタム化された電子識別のためのシステムをユーザサーバシステムの一部分として実現することができる電子媒体システムの典型的なアーキテクチャのブロック図である。図２は、所望のオブジェクトのカスタム化された電子識別のためのシステムの一実施形態のブロック図である。図３および図４は、典型的なネットワークツリーを示す。図５は、記事プロファイルおよび関連する階層メニューシステムを自動的に生成する方法を説明するためのフロー図である。図６から図９は、メニュー生成プロセスの例を示す。図１０は、ユーザのために記事をスクリーニングする際に、所望のオブジェクトのカスタム化された電子識別のためのシステムが行う動作ステップを説明するためのフロー図である。図１１は、階層クラスタツリーの例を示す。図１２は、選択されたターゲットオブジェクトに対して特定のユーザが関心を持つ可能性を決定するプロセスを説明するためのフロー図である。図１３Ａおよび図１３Ｂは、自動クラスタ化プロセスを説明するためのフロー図である。図１４は、仮名（pseudonymous）サーバの使用を説明するためのフロー図である。図１５は、ユーザ問い合わせに応答して情報にアクセスするためのシステムの使用を説明するためのフロー図である。図１６は、ユーザ問い合わせに応答して情報にアクセスするためのシステムが分配されたネットワークの実現である場合の、そのシステムの使用を説明するためのフロー図である。詳細な説明類似性の測定この章では、２つのターゲットオブジェクトの間の類似性、具体的には、２つのターゲットオブジェクトの各々について自動的に生成されるターゲットプロファイルの間の類似性を自動的に測定する一般的な手順を説明する。この類似性決定プロセスは、様々な状況でターゲットオブジェクトに適用可能である。比較されるターゲットオブジェクトとしては、例えば、テキスト文書、人間、映画、あるいはミューチュアル・ファンド（mutual funds）などがあるが、これに限定されるわけではない。ターゲットオブジェクトを記述するターゲットプロファイルが、コンピュータシステムと関連するデータ記憶媒体上のデータ通信ネットワークの１つ以上の場所に格納されると仮定する。計算された類似性の測定値は、人間のユーザが大規模なコンピュータシステムを用いて所望のターゲットオブジェクトの場所を特定することを可能にする機能を果たす別のプロセスへの入力としての役割を果たす。これらの別のプロセスは、様々なターゲットオブジェクトに対する人間のユーザの関心を評価するか、あるいはそうでなければ、複数のターゲットオブジェクトをクラスタ化して、論理的に一貫したグループに分ける。これらの別のプロセスによって用いられる方法は、原則的には、１台のコンピュータあるいはコンピュータネットワーク上で実現され得る。これらの方法は、一緒にあるいは別個に、様々な種類のデータベースシステムおよび情報取り出しシステムの土台を形成する。ターゲットオブジェクトおよび属性古典的な情報取り出し（ＩＲ）技術では、ユーザは教養のある人間であり、該当するターゲットオブジェクトは、コンピュータネットワークを介してユーザと相互接続されたデータ記憶装置に格納されたテキスト文書である。即ち、ターゲットオブジェクトはすべてテキストからなり、従って、コンピュータネットワーク内のデータ記憶装置にデジタル形式で格納される。しかし、現在の情報取り出し技術では解決できない取り出しについての関連する問題点をもたらす他のターゲットオブジェクトドメインもある。この他のターゲットオブジェクトドメイン（domain）を以下に示す。（a.）ユーザが映画ファンであり、ターゲットオブジェクトがビデオテープで入手可能な映画である。（b.）ユーザが消費者であり、ターゲットオブジェクトが販売されている中古車である。（c.）ユーザが消費者であり、ターゲットオブジェクトが広告で販売されている製品である。（d.）ユーザが投資家であり、ターゲットオブジェクトが公開取引されている株、ミューチュアル・ファンドおよび／または不動産である。（e.）ユーザが学生であり、ターゲットオブジェクトが開講されるクラスである。（f.）ユーザが活動家であり、ターゲットオブジェクトが問題となる可能性のある議会法案である。（g.）ユーザがダイレクトメール業者であり、ターゲットオブジェクトが可能性のある顧客である。（h.）ユーザがネットサーファーであり、ターゲットオブジェクトがワールドワイドウェブで利用可能なページ、サーバ、あるいはニュースグループである。（i.）ユーザが博愛主義者であり、ターゲットオブジェクトが慈善事業である。（j.）ユーザが病人であり、ターゲットオブジェクトが医療専門家である。（k.）ユーザが被雇用者であり、ターゲットオブジェクトが可能性のある雇用者である。（l.）ユーザが雇用者であり、ターゲットオブジェクトが可能性のある被雇用者である。（m.）ユーザが困惑した重役であり、ターゲットオブジェクトがユーザのアドレスに送られた電子メールメッセージである。（n.）ユーザが友人を探している人であり、ターゲットオブジェクトが可能性のある話し相手である。（o.）ユーザが専門家を探している人であり、ターゲットオブジェクトが文書取り出しシステムのユーザであって、取り出しの習慣があることが知られているユーザである。（p.）ユーザがソーシャルワーカーであり、ターゲットオブジェクトが特別な訪問を必要としている家族である。（q.）ユーザが腫瘍学者であり、ターゲットオブジェクトが乳房Ｘ線の撮影が望ましい女性である。（r.）ユーザが自動車保険会社であり、ターゲットオブジェクトが可能性のある顧客である。上記の場合すべて、ユーザは、例えばユーザが最も借りたい、購入したい、調べたい、会いたい、読みたい、乳房Ｘ線写真を渡したい、保険に入りたい、などと考えるターゲットオブジェクトなどのターゲットオブジェクトの何らかの小さいサブセットの場所を特定したいと考える。この作業は、ユーザが最も興味のあるターゲットオブジェクトを識別する助けとなる。ここで、ターゲットオブジェクトに対するユーザの関心は、他のオブジェクトではなくそのオブジェクトの場所を特定したいというユーザの相対的願望の数値測定値であるとして定義される。この問題点の大部分が、上述の情報取り出しの問題点を解決する一般的なアプローチの動機付けとなる。多くのターゲットオブジェクトが所望のオブジェクトのカスタム化された電子識別のためのシステムに既知であると仮定する。具体的には、このシステムが各ターゲットオブジェクトに関する幾つかの情報を格納している（あるいは、この情報を再構成する能力を有する）と仮定する。これらの情報を「属性」と呼ぶ。これらの情報は、まとめて、ターゲットオブジェクトのプロファイル、即ち「ターゲットプロファイル」を形成すると言われる。例えば、所望のオブジェクトのカスタム化された電子識別のためのシステムが活性化されて、関心のある映画を識別すると、このシステムは、例えば以下に示す属性などの属性の値に注目する。（a.）映画の題名（b.）監督名（c.）Motion Picture Association of America（ＭＰＡＡ）による、映画が児童に適切であるかどうかについての評点（０＝Ｇ、１＝ＰＧ、...）（d.）公開日（e.）特定の評論家がつけた星の数（f.）第２の評論家がつけた星の数（g.）第３の評論家がつけた星の数（h.）第３の評論家による論評の全文（i.）以前にこの映画を借りたことがある顧客の数（J.）俳優のリスト各々の映画は、これらの属性について異なる一組の値を有する。この例では、便宜上、３種類の属性を示している。属性ｃ〜ｇは、データベース記録に見られ得る種類の数値属性である。これらの属性を用いて、ユーザが関心のあるターゲットオブジェクト（映画）を識別する助けにできることは明らかである。例えば、ユーザは、多くの親の指導が望ましい（ＰＧ）映画および多くの１９７０年代製作の映画を以前に借りているかもしれない。この一般化は有用である。即ち、これらの属性（ＭＰＡＡの評点が１、公開日が１９７５年など）のうちの１つあるいは両方の属性について値が数値的に類似している新しい映画は、ユーザが既に好んでいる映画と類似しており従っておそらく関心を持つであろうと判断される。属性ａ〜ｂおよびｈは、テキスト属性である。これらの属性も、ユーザが所望の映画の場所を特定する助けにするために重要である。例えば、おそらくユーザは、論評の文章（属性ｈ）に「追跡（chase）」、「爆発（explosion）」、「爆発（explosions）」、「英雄（hero）」、「魅了する（gripping）」および「すばらしい（superb）」などの単語が含まれている映画に対して過去に関心を示している。ここでも、この一般化は、関心のある新しい映画を識別する際に有用である。属性ｉは、関連（associative）属性である。この属性は、このドメインのターゲットオブジェクト間の関連、即ち映画間の関連と、完全に異なる種類の補助的ターゲットオブジェクト間の関連、即ち人間間の関連とを記録する。特定の映画を借りたいというユーザの願望をよく表すのは、ユーザが類似した属性値を有する他の映画を以前に借りたことであり、これは、属性ａ〜ｈに当てはまるように、属性ｉにも当てはまることである。例えば、ユーザが顧客Ｃ₁₇および顧客Ｃ₁₉₀が借りた映画を好んだことが多ければ、そのユーザは、属性ｉについて類似した値を有する他の映画を好み得る。属性ｊは、ターゲットオブジェクトと俳優との間の関連を記録する関連属性の別の例である。尚、プロファイルが構成されると、デジタル署名（signature）を用いて、これらの属性のいずれも認証させることができる。例えば、ターゲットオブジェクトには、ＭＰＡＡからのデジタル形式で示された注釈（note）を付けてもよく、この注釈は、ターゲットオブジェクトの名前を示し、属性ｃについてのその認証値を示している。これらの３種類の属性は共通である。即ち、数値属性、テキスト属性、および関連属性である。ターゲットオブジェクトが文書（あるいは、より一般的には、テキストセグメント化法によって抽出された、文書中の一貫した部分）である古典的な情報取り出しシステムの問題点では、システムは、類似性を測定するとき、１つのテキスト属性、即ちターゲットオブジェクトの全文しか考慮しない場合がある。しかし、より精巧なシステムであれば、以下に示すような数値属性および関連属性を含むより長いターゲットプロファイルを考慮するであろう。（a.）文書の全文（テキスト）（b.）題名（テキスト）（c.）著者（テキスト）（d.）文書が書かれた言語（テキスト）（e.）作成日（数値）（f.）最終更新日（数値）（g.）単語の長さ（数値）（h.）読書レベル（数値）（i.）第三者の編集者が評価した文書の質（数値）（j.）この文書を取り出したその他の読者のリスト（関連）ドメインの別の例として、ユーザが広告業者であり、ターゲットオブジェクトが可能性のある顧客である場合を考える。この場合、システムは、ターゲットオブジェクト（可能性のある顧客）の各々について以下に示す属性を格納し得る。（a.）郵便番号の上２桁（テキスト）（b.）郵便番号の上３桁（テキスト）（c.）郵便番号の５桁全部（テキスト）（d.）広告業者の最も近い物理的店舗から居住地までの距離（数値）（e.）家族の年収（数値）（f.）子供の数（数値）（g.）この可能性のある顧客が以前に購入した品目のリスト（関連）；この可能性のある顧客のクライアントコンピュータに格納されたファイル名のリスト（関連）；この可能性のある顧客が借りた映画のリスト（関連）；この可能性のある顧客の投資目録中の投資のリスト（関連）；この可能性のある顧客が取り出した文書のリスト（関連）；ロールシャッハ（Rorschach）インクブロットテストの書面解答（テキスト）；自己イメージについての２０問の多項選択式問題に対するこの顧客の解答（２０個のテキスト属性）。通常通り、ここでの概念も、類似した消費者が類似した製品を購入するということである。尚、ここでは、消費者を特徴付けるために、消費者の消費パターンから文学の好みや心理的特性にわたる多様な種類の情報を用いており、このことは、本発明の所望のオブジェクトのカスタム化された電子識別のためのシステムの柔軟性および能力を示している。その他のドメインでも、多様な種類の情報を属性として用いることができ（健康、経済、心理学、および趣味に関する質問を用いて、デートサービスへの応募者をプロファイルする場合などであって、これは、実際に、本発明のシステムで可能なドメインである）、広告業者ドメインは、単なる一例にすぎない。ドメインの最後の例として、ユーザが株式投資家であり、ターゲットオブジェクトが公開取引されている企業であるドメインについて考える。この場合、各企業を特徴付けるために、多数の属性を用いることができる。この属性としては以下に示すものがあるが、これに限定されるわけではない。（a.）事業の種類（テキスト）（b.）企業任務陳述書（テキスト）（c.）過去１０年間の各年の従業員数（１０個の別個の数値属性）（d.）過去１０年間の各年の従業員数の増加パーセンテージ（e.）現在の株価のパーセンテージとしての、過去４０四半期の各期に出された配当支払（f.）過去４０四半期の各期の株価の増加パーセンテージ、株主のリスト（関連）（g.）金融関係の刊行物に書かれた、企業についての最近の記事の複合テキスト（テキスト）尚、ドメインによっては、そのドメインに関連のある幾つかの他の属性に注目するに値するドメインもある。文書およびその他のある特定のドメインの場合、各ターゲットオブジェクトのソース（例えば、参照した雑誌の記事vs．ＵＰＩ通信社の記事vs．Usenetのニュースグループの通知（posting）vs．質問／解答リストからの質問／解答対vs．タブロイド新聞の記事vs．...）を知ることが有用である。このソースは、１つの用語からなるテキスト属性として表され得る。ハイパーテキスト文書の重要な関連属性は、ハイパーテキスト文書がリンクしている文書のリスト、およびハイパーテキスト文書にリンクしている文書のリストである。類似した引用を有する文書は、前者の属性について類似しており、同じ場所で引用されている文書は後者の属性について類似している。オプションとして、いかなる文書もその文書自体にリンクしているという取り決め（convention）を採用してもよい。ターゲットオブジェクトを取り出すかどうかをユーザが選択できるシステムでは特に、ターゲットオブジェクトの人気（あるいは、取り出し件数（circulation））は、そのオブジェクトを取り出したユーザの数を特定する数値属性として有効に測定することができる。人気の１つの種類も示す関係のある測定可能な数値属性は、例えば、ターゲットオブジェクトが、コンピュータ掲示板あるいはニュースグループなどの電子コミュニティに通知されたメッセージであるドメインでは、ターゲットオブジェクトに対する応答の数であり、ターゲットオブジェクトが、ワールドワイドウェブ上あるいはそれと同様のシステム上のインターリンクされた（interlinked）ハイパーテキスト文書であるドメインでは、ターゲットオブジェクトに通じるリンクの数、などである。ターゲットオブジェクトはまた、様々なグループからの明示された数値的評価（別の種類の数値属性）を受け得る。このグループとしては、例えば、映画が児童にどれだけ適切であるかを評価する上述のMotion Picture Association of America（ＭＰＡＡ）、あるいは医療研究論文の正確さおよび新しさについて評価し得るAmerican Medical Association、あるいはほとんどすべての事柄についての評価を要求され得るユーザ（すべてのユーザまたは選ばれた一組の専門家）の無作為の調査サンプルなどがある。数値属性も生成するその他の特定の種類の評価は、機械的に行われ得る。例えば、テキストを読む際の困難度は、単語数および文の長さをカウントする標準的な手順によって評価することができ、テキストの俗悪さは、テキストに含まれる俗悪な単語の数（例えば）として定義することができ、テキストについての専門家の意見は、その著者が本発明を用いて以前に取り出して読んだ類似のテキストの数をカウントし、おそらくこのカウント値を、評論家からの賛同の評点が高いテキストに限定することによって大まかに評価することができる。最後に、ある特定のテキスト属性を機械的に合成して、例えば、映画のサウンドトラックに音声認識技術を適用することによって、あるいはクローズドキャプションサブタイトル（closed-caption subtitles）に光学的文字認識技術を適用することによって、映画の台本を再構成することが可能である。複合属性の分解テキスト属性および関連属性は、大きく複雑なデータであるが、情報取り出しの目的のために、より小さくより単純な数値属性に分解することができる。このことは、属性のいかなる集合も、数値属性の（通常はより大きい）集合と置き換えることができることを意味し、従って、いかなるプロファイルも、これらの数値属性の値を示す数のベクトルとして表すことができることを意味する。特に、映画論評の全文などのテキスト属性は、そのテキスト中の「ツチブタ（aardvark ）」、「裏帆に（aback）」、「そろばん（abacus）」などから「醸造学（zymur gy）」にわたるの単語の存在および重要性を示すためのスコアを表す数値属性のコレクションと置き換えることができる。テキスト中の単語のスコアは、多くの方法で定義され得る。最も単純な定義は、スコアを、テキスト中の単語の割合とすることであり、この割合は、テキスト中にその単語が発生する回数を計算し、得られた数を、テキスト中の総単語数で割ることによって計算される。この種類のスコアはしばしば単語の「用語頻度（term frequency）」（ＴＦ）と呼ばれる。オプションとして、用語頻度の定義を、テキストの異なる部分を不等に重み付けするように変更してもよい。例えば、テキストの題名中の単語がテキストの内容あるいはトピックの特に重要なインジケータであるという発見的仮定を反映するために、テキストの題名に単語が発生すると、３倍、あるいはより一般的にはｋ倍の発生回数として（まるで題名がテキスト内でｋ回繰り返されているかのように）カウントされ得る。しかし、文書全体のテキストなどの非常に長いテキスト属性の場合、単語のスコアは、典型的には、単語の用語頻度だけではなく、用語頻度に単語の「グローバル頻度（global frequency）」の否定対数（negated logarithm）を掛けた値であるとしても定義される。単語の非情報提供性（uninformativeness）を効果的に測定する単語のグローバル頻度は、０から１の間の分数であり、これは、該当するテキスト属性がこの単語を含むすべてのターゲットオブジェクトの一部分（fraction）であるとして定義される。この調整されたスコアは、当該技術分野では、しばしばＴＦ／ＩＤＦ（「用語頻度×逆文書頻度」）として知られている。このようにして単語のグローバル頻度を考慮した場合、通常の非情報提供性の単語は、その単語がテキスト中に出てくる頻度に関わらず、比較的ゼロに近いスコアを有する。従って、それらの単語の割合は、オブジェクトのターゲットプロファイルにはほとんど影響を与えない。単語のスコアを計算する別の方法としては、意味インデックス付け（semantic indexing）、あるいは確率的モデルなどがある。テキストを、そのテキストの成分単語に分ける代わりに、テキストを重複する二連語（隣接する２単語の連続）、あるいは、より一般的にはｎ連語に分けることも可能である。これらのｎ連語には、個々の単語と同じ方法でスコアが付けられ得る。別の可能性は、ｎ連字を用いることである。例えば、この文は、「fore 」、「or ex」、「r exa」、「exam」、「examp」などから始まる重複する５連字の連続を含む。この文は、文の中の可能な５連字（「aaaaa」、「aaaab」、.. ．「zzzzz」）の各々のスコアによって、精確ではないが有用に特徴付けされ得る。概念的には、５連字の場合であれば、テキスト属性は、少なくとも26⁵＝11, 881,376個の数値属性に分解されるであろう。言うまでもなく、所定のターゲットオブジェクトの場合、ほとんどの５連字がこのターゲットオブジェクトの属性に現れないため、これらの数値属性のほとんどは０の値を有する。これらのゼロの値は、どこにも格納する必要はない。デジタル記憶の目的のために、テキストに実際に現れる一組の５連字を、各５連字のゼロでないスコアとともに格納することによって、テキスト属性の値を特徴付けることも可能である。この組に含まれないすべての５連字がゼロのスコアを有すると仮定できる。テキスト属性の分解は、長いテキストであると予想される値を有する属性に限定されるわけではない。１つの用語からなる単純なテキスト属性も、全く同じ方法で、数値属性のコレクションに置き換えることができる。ここでも、ターゲットオブジェクトが映画である場合を考える。テキスト属性である「監督名」属性は、その属性で「Federico-Fellini」、「Woody-Allen」、「Terence-Davies」などについてのスコアを与える数値属性と置き換えることができる。これらの１つの用語からなるテキスト属性の場合、単語のスコアは通常、テキスト中のその単語の割合であるとして定義され、グローバル頻度は考慮されない。尚、これらの条件下では、スコアのうちの１つは１であるが、その他のスコアは０であり、この０のスコアについては格納する必要はない。例えば、Daviesが実際に映画を監督したのであれば、スコアが１であるのは「Terence-Davies」である。なぜなら、「Terenc e-Davies」は、「監督名」属性のテキスト値において単語の１００％を構成しているからである。テキスト属性を、文字列値「Terence-Davies」を有するとみなすだけでは、何も得られないと思われるかもしれない。しかし、すべての非数値属性を分解して数値属性のコレクションにするという策は、異なるオブジェクトの属性値を平均するおよび／または序数でランク付けする（ordinally ranked）必要がある以下に説明するクラスタ化法および判断ツリー法に有用であることがわかる。このような方法で平均するあるいはランク付けすることができるのは、数値属性だけである。テキスト属性が多数の成分用語（文字あるいはｎ連語）に分解され得るのと同様に、関連属性も、多数の成分関連に分解され得る。例えば、ターゲットオブジェクトが映画であるドメインであれば、映画をプロファイルする際に用いられる典型的な関連属性は、その映画を借りた顧客のリストであろう。このリストは、映画と、システムが知っている顧客の各々との間の「関連スコア」を与える数値属性のコレクションと置き換えることができる。例えば、１６５番目のそのような数値属性は、映画と顧客＃１６５との間の関連スコアである。ここで、関連スコアは、顧客＃１６５が以前にその映画を借りたことがあれば１であり、借りたことがなければ０であると定義される。より細かく精製を行う場合、この関連スコアは、関連性フィードバック（以下に説明する）によって決定される、その顧客＃１６５がその映画に示したおそらくゼロである関心度として定義される。別の例として、ターゲットオブジェクトが会社であるドメインであれば、会社の主要株主を示す関連属性は、関連スコアのコレクションに分解されるであろう。この場合、各関連スコアは、何らかの特定の個人あるいは企業体が所有する会社のパーセンテージを示す（おそらくゼロ）であろう。非常に長いテキスト属性を分解する際に用いる用語スコアの場合と同様に、各関連スコアは、オプションとして、乗算係数（multiplicative factor）によって調整してもよい。例えば、映画と顧客＃１６５との間の関連スコアに、顧客＃１６５の「グローバル頻度」の否定対数、即ち、顧客＃１６５が借りたことのあるすべての映画の一部分（fraction）を掛けてもよい。テキスト属性を分解する際に用いる用語スコアの場合と同様に、関連属性の特定の値を分解するときに見られる関連スコアのほとんどはゼロであり、ターゲットオブジェクトがゼロでない関連スコアを有する補助的オブジェクトだけのリストを、それらの補助的オブジェクトのそれぞれの関連スコアとともに格納することによって、上述の態様と全く同じ態様で、記憶量の同様の節約が得られる。類似性測度（measures）２つのターゲットオブジェクトが類似しているとはどういう意味であろうか？具体的には、類似性の程度はどのようにして測定するべきであろうか？これには多くのアプローチが可能であり、ターゲットオブジェクトプロファイルの組について計算することができる合理的な計量（metric）を用いることができ、この場合、ターゲットオブジェクトは、この計量に従ったそれらのプロファイル間の距離が小さければ類似していると考えられる。このように、以下に示す、ターゲットオブジェクトの類似性測定システムの好適な実施形態は、多くの変形を有する。まず、属性が数値属性であるか、関連性属性であるか、あるいはテキスト属性であるか応じて、所定の属性の２つの値の間の距離を定義する。属性が数値属性であれば、この属性の２つの値の間の距離は、これらの２つの値の差の絶対値である。（その他の定義も可能である。例えば、消費者の関心の場合、＄５０００と＄５０２０とは非常に類似しているが、＄３と＄２３は類似していないことを認識するために、価格ｐ１と価格ｐ２の間の距離は、|(p1-p2)|/(max(p1,p2)+1) で定義され得る。）属性が関連属性であれば、その属性の値Ｖは、上述のように、該当するターゲットオブジェクトと様々な補助的オブジェクトとの間の関連スコアを表す実数のコレクションに分解され得る。したがって、Ｖは、オブジェクトと補助的オブジェクト１、２、３などとの間のそれぞれの関連スコアを表す成分Ｖ₁、Ｖ₂、Ｖ₃などを有するベクトルとみなされ得る。その後、角度距離測度であるarccos(ＶＵ^t／((Ｖｖ^t)⁽ＵＵ^t))^1/2)を用いて、関連属性の２つのベクトル値ＶとＵとの間の距離が計算される。（尚、この式の内積は、ＸＹ^t＝Ｘ₁Ｙ₁ ＋Ｘ₂Ｙ₂＋Ｘ₃Ｙ₃＋...という形を有し、効率的な計算のために、スコアＸ_iおよびスコアＹ_iのいずれかがゼロであれば、この和からＸ_iＹ_iの形の項は省略され得る。）最後に、属性がテキスト属性であれば、その属性の値Ｖは、上述のように、テキスト中の様々なｎ連語あるいはｎ連字のスコアを表す実数のコレクションに分解され得る。その後、この場合も、この値Ｖはベクトルとみなされ得る。さらに、２つの値の間の距離は、この場合も、角度距離測度によって定義される。その代わりに、ダイス測度（dice measure）などの、その他の２ベクトル間類似性計量を用いてもよい。明らかな別の計量であるユークリッド（Euclidean）距離ではうまくいかない事がある。即ち、類似したテキストでも、これらのテキストに用いられている内容語が実質的に重複していないことも多いため、ＴＦ／ＩＤＦスコアを用いて非内容語の影響を低減すると仮定すると、実際に遭遇するテキストはすべて互いに実質的に直交している。テキスト属性ベクトルの２つの単語のスコアは相関し得る。例えば、「Kennedy」と「JFK」とは同じ文書に現れることが多い。従って、テキスト中の用語のスコアを計算する幾らか前に、類似した単語同士をグループに分ける同義語辞書を用いてテキストに変更を加えるほうがよい場合もある。このようなオプションとしての前変更を行う効果は、関係のある単語を用いる２つのテキストを、まるで実際に同じ単語を用いているかのように、類似しているとして測定することである。１つの技術は、記事に実際に見られる単語の組に、記事に出てくる単語と同時に発生しやすい一組の同義語あるいはその他の単語を加えることである。これにより、「Kennedy」は、「JFK」に言及するすべての記事に加えられ得る。あるいは、記事に見られる単語のすべてを同義語に置き換えることもできる。これにより、「JFK」が現れる場合はいつでも、「JFK」は「Kennedy」あるいは「John F．Kennedy」に置き換えられ得る。いずれの場合も、Kennedyに関する文書およびJFKに関する文書は類似していると判断されることになる。同義語辞書は、文書全体としてのトピックに敏感であり得る。例えば、「crane（ツル；クレーン）」は、鳥について言及している文書と建築について言及している文書とでは、異なる同義語を有する可能性が高いことが認識され得る。これに関連する技術は、各単語を、その形態学的語幹に置き換えることである。これにより、「staple」、「stapler」および「staples」はすべて、「staple」に置き換えられる。通常の機能語（「a」、「and」、「th e」...）は、テキストのトピックに関係なく、これらのテキストの計算された類似性に影響を及ぼし得るため、典型的には、テキスト中の用語のスコアを計算する前にテキストから取り除かれる。同義語を認識するためのより一般的なアプローチは、テキスト属性ベクトルＶとＵとの間の距離の測度を修正したもの、即ち、arccos(ＡＶ(ＡＵ)^t／((ＡＶ(ＡＶ)^tＡＵ(ＡＵ^t))^1/2)を用いることである。ここで、行列Ａは、システムが知っているすべてのターゲットオブジェクトについて、テキスト属性のベクトル値を集め、その結果得られたコレクションに特異値分解を適用することによって決定される、次元を低くする線形変換（あるいは、その近似）である。関連属性のベクトル値にも、これと同じアプローチを適用することができる。上述の定義により、２つのターゲットオブジェクトが、ある１つの属性に関してどれぐらい近いかを判断することが可能となる。この場合、この１つの属性は、数値属性であっても、関連属性であっても、あるいはテキスト属性であってもよい。その後、多属性プロファイルＰ_xおよびＰ_yすべてに関する２つのターゲットオブジェクトＸおよびＹの間の距離は、ｄ（Ｘ，Ｙ）あるいはｄ（Ｐ_x，Ｐ_y）で示され、以下のように定義される。 (((属性ａに関する距離)(属性ａの重み))^k＋((属性ｂに関する距離)(属性ｂの重み))^k＋((属性ｃに関する距離)(属性ｃの重み))^k＋...)^k ここで、ｋは、一定の正の実数であって典型的には２であり、重みは、様々な属性の相対的な重要性を示す負でない実数である。例えば、ターゲットオブジェクトが消費財である場合、「色」属性の重みは比較的非常に小さく、価格は、類似性の判断の際には考慮されない。茶色のマッサージクッションを好むユーザは、同じクッションの青色にも等しい関心を示すと予測され、その逆も同様である。一方、「色」属性の重みが比較的大きい場合、ユーザは、そのユーザが過去に好んだことのある色の製品に主に関心を示すと予測される。即ち、茶色のマッサージクッションと青色のマッサージクッションとは、同じ種類のターゲットオブジェクトではないが、その他の属性では類似している。さらに一方ですばらしい経験をしても、それ自体で、他方に対する大きな関心を引き起こすわけではない。ターゲットオブジェクトは様々な種類のものであってもよく、異なる種類のターゲットオブジェクトを比較することができる１つのシステムを用いることが有利である場合もある。例えば、幾つかのターゲットオブジェクトが小説であり、他のターゲットオブジェクトが映画であるシステムでは、これらのターゲットオブジェクトのプロファイルが、類似したユーザがこれらのターゲットオブジェクトを好むことを示すと（関連属性）、小説と映画とが類似していると判断することが望ましい。しかし、映画のターゲットプロファイルで特定されるある属性が小説のターゲットプロファイルでは定義されていないこと、およびその逆に注目することが重要である。即ち、小説は「出演者リスト」関連属性を有しておらず、映画は「読書レベル」数値属性を有していない。一般に、ターゲットオブジェクトが異なる種類に属するシステムは、幾分か異なる属性の組が規定されている２つのターゲットオブジェクトの類似性を測定しなければならない場合もある。この場合、上で定義した距離計量ｄ（＊，＊）に対する拡張（extension）が必要である。ある応用では、そのような比較を行うとき、２つのターゲットオブジェクトのいずれについても定義されていない属性については単に無視することで十分である。これにより、例えば小説および映画が共通に有している属性だけを考慮することなどによって、小説クラスタを、最も類似している映画クラスタと整合することが可能となる。しかし、この方法では（例えば）小説と映画との比較は可能になるが、小説と映画とを組合せた空間についての適切な計量を規定していないため、すべてのターゲットオブジェクトからなる組にクラスタ化を適用することはできない。クラスタ化あるいはその他の目的のために必要であれば、任意の２つのターゲットオブジェクト（同じ種類であるか異なる種類であるかに関わらず）の比較を可能にする計量を以下のように定義することができる。ａが属性であれば、Ｍａｘ（ａ）を、属性ａの２つの値の間の距離の上限とする。尚、属性ａが関連属性またはテキスト属性であれば、この距離は、逆余弦によって決定される角度であり、そのため、Ｍａｘ（ａ）は１８０度に選択され得る。属性ａが数値属性であれば、システム設計者によって、十分に大きい数が選択されなければならない。属性ａの２つの値がともに定義されている場合は、これらの２つの値の間の距離は、以前に説明したように与えられる。２つの定義されていない値の間の距離はゼロであるとされる。最後に、定義された値と定義されていない値との間の距離は常に、Ｍａｘ（ａ）／２であるとされる。これにより、２つのターゲットオブジェクトの両方について属性ａが定義された値を有していない場合でも、これらのターゲットオブジェクトが属性ａに関してどれだけ近いかを判断することが可能となる。その後、多属性プロファイルのすべてに関する２つのターゲットオブジェクトの間の距離ｄ（＊，＊）は、これらの個々の属性の距離に関して、以前に述べたのと全く同じように与えられる。そのようなシステムの１つの属性がターゲットオブジェクトの種類（「映画」、「小説」など）を特定すると仮定し、異なる種類のターゲットオブジェクトは、それらのターゲットオブジェクトがどんな属性を共通に有していても、非常に異なるものであると考えられると仮定する。類似性測定の利用売り手と買い手との整合類似性測定の単純な応用は、中古車あるいはその他の中古品、手工芸品、あるは雇用などの小規模市場において売り手と買い手とを整合するためのシステムである。売り手は、売りたい商品（ターゲットオブジェクト）のプロファイルを提示し、買い手は、購入したい商品（ターゲットオブジェクト）のプロファイルを提示する。関係者は、これらのプロファイルをいつでも提示あるいは回収することができる。所望のオブジェクトのカスタム化された電子識別のためのシステムは、売り手が提示したプロファイルと買い手が提示したプロファイルとの間の類似性を計算し、２つのプロファイルが密接に整合していれば（即ち、類似性が閾値を上回っていれば）、それに対応する売り手および買い手に、互いのアイデンティティが通知される。ユーザに応答が殺到しないようにするために、各ユーザが受け取る通知の数を例えば１日１０通などの一定数に制限することが望ましい場合もある。フィルタリング：関連性フィードバックフィルタリングシステムは、多くのターゲットオブジェクトを検索し、各ターゲットオブジェクトに対する所定のユーザの関心を評価して、ユーザが最も関心を持つターゲットオブジェクトを識別することができる装置である。フィルタリングシステムは、関連性フィードバックを用いて、このフィルタリングシステムが持っているユーザの関心についての知識を精製する。フィルタリングシステムが、あるターゲットオブジェクトをユーザが興味を示す可能性があるとして識別すると、ユーザ（オンラインユーザの場合）は、そのターゲットオブジェクトに実際に関心があるかどうかについてのフィードバックを与える。そのようなフィードバックは、要約された形態で、ユーザフィードバック情報のデータベースの一部分として長期間格納され、能動的にあるいは受動的に与えられ得る。能動的フィードバックでは、ユーザは、自分の関心を、例えば−２（非常に嫌悪感を感じる）から０（特に関心なし）を介して１０（非常に関心あり）の尺度で明示する。受動的フィードバックでは、システムは、ユーザの行動からユーザの関心を推断する。例えば、ターゲットオブジェクトがテキスト文書であれば、システムは、ユーザがどの文書を読みたいあるいは読みたくないとして選んだかをモニタし、さらに、ユーザがその文書を読むのに費やした時間をモニタする。受動的フィードバックによって文書に対する関心を評価するための典型的な方式は、このドメインでは、０から１０の尺度であり、例えば以下のような方式が可能である。＋２２頁目を見た場合＋２全頁を見た場合＋２３０秒を越える時間その文書を見た場合＋２１分を越える時間その文書を見た場合＋２その文書を見るのに費やした分数が、頁数の半分の値を越える場合ターゲットオブジェクトが電子メールメッセージであれば、特に長いあるいは特に速い返信の場合には、関心ポイントを加えることも可能である。ターゲットオブジェクトが購入可能な物品であれば、ユーザが実際に購入するターゲットオブジェクトに対しては、関心ポイントを加え、大量あるいは高価な購入の場合にはさらなるポイントを加えることが可能である。いずれのドメインでも、ユーザは最もユーザの関心を引くオブジェクトに最初にアクセスするため、ユーザが期間中の早い時期にアクセスするターゲットオブジェクトに対して、さらなるポイントを加えることが可能である。その他の可能な受動的フィードバック源には、ユーザがターゲットオブジェクトあるいはターゲットオブジェクトの説明を見ている間のユーザの瞳孔が開いた程度の電子的測定などがある。能動的フィードバックと受動的フィードバックとを組み合わせることも可能である。１つのオプションは、これらの２つの評点の重み付け平均である。別のオプションは、デフォルトで受動的フィードバックを用いるが、ユーザが、受動的フィードバックスコアを調べ且つそのスコアに能動的に変更を加えることができるようにすることである。上述の筋書きでは、例えば、ユーザが関係のない業務に従事している間、興味のない記事が長時間表示装置に表示されたままとなる場合がある。この場合、受動的フィードバックスコアはその後不適切に高くなり、ユーザは、継続する前にそれを訂正したいと考え得る。本発明の好適な実施形態では、ユーザのスクリーン上のスライドバーあるいはインジケータ針などの視覚的インジケータを用いて、ユーザが見ているターゲットオブジェクトについてシステムが評価した受動的フィードバックスコアを継続的に表示させることができる。この場合、この受動的フィードバックスコアは、ユーザが、このターゲットオブジェクトに関する異なるスコアを反映させるためにマウスの操作あるいはその他の手段によってインジケータを手動で調節しない限り継続して表示させることができ、その後、インジケータは、ユーザが選択した能動的フィードバックスコアを表示し、システムは、受動的フィードバックスコアの代わりに、この能動的フィードバックスコアを用いる。その変形では、ユーザは、ユーザがターゲットオブジェクトを見終わった直後に初めてインジケータを見るあるいは調節することができる。ユーザのフィードバックは、どのように計算されるかにかかわらず、そのユーザのターゲットプロファイル関心サマリーの一部分として長期間格納される。フィルタリング：類似性によるトピックに対する関心の判断関連性フィードバックは、ある特定のターゲットオブジェクト、即ち、ユーザが実際に（能動的にあるいは受動的に）評価する機会を持ったことがあるターゲットオブジェクトに対するユーザの関心を判断するだけのものである。ユーザがまだ見たことのないターゲットオブジェクトに関しては、フィルタリングシステムは、ユーザの関心を評価しなければならない。この評価作業が、フィルタリングの問題点の核心であり、類似性測定が重要な理由である。具体的には、フィルタリングシステムの好適な実施形態は、関心のある可能性があるニュース記事を周期的にユーザに与えるニュースクリッピングサービスである。ユーザは、与えられた記事に関する能動的および／または受動的フィードバックをシステムに与える。しかし、システムは、データベースに追加されたばかりの新しい記事、あるいはシステムがユーザに与えるためには選ばなかった古い記事などの、ユーザに与えたことのない記事については、ユーザからのフィードバック情報を持っていない。同様に、ターゲットオブジェクトが将来の恋愛相手であるデートサービスドメインでは、システムは、過去の恋人に関するフィードバックを受け取るだけで、将来の新しい恋愛についてのフィードバックは受け取らない。図１２のフロー図に示すように、特定のユーザについて、特定のターゲットオブジェクトに対して関心を持つ可能性の評価を、自動的に計算することができる。ユーザＵが所定のターゲットオブジェクトＸに対して持つ関心は、２つの量の和、即ち、Ｘの固有の「量」であるｑ（Ｕ，Ｘ）とＵなどのユーザがＸなどのターゲットオブジェクトに対して持つ「トピックについての関心」ｆ（Ｕ，Ｘ）との和であると仮定される。いずれのターゲットオブジェクトＸについても、固有の量の測度ｑ（Ｕ，Ｘ）は、ステップ１２０１〜ステップ１２０３で、そのターゲットオブジェクトＸの数値属性から直接容易に評価される。計算プロセスはステップ１２０１で始まり、ここで、ターゲットオブジェクトＸのある指定された数値属性が具体的に選択され、これらの属性はその本質的にユーザの関心に肯定的にあるいは否定的に相関していなければならない。そのような属性は、「品質属性」と呼ばれ、その値が大きいほど（あるいは、場合によっては小さいほど）ユーザがその属性を見いだすことに興味を持っていると予想される、という規範的特性を有する。ターゲットオブジェクトＸの品質属性としては、ユーザ一般の中でのターゲットオブジェクトＸの人気、特定の評論家が所定のターゲットオブジェクトＸに与えた評点、ターゲットオブジェクトＸができてからの年数（執筆されてからの時間−−古くささ（outdatedness）としても知られている）、ターゲットオブジェクトＸに使用されている俗悪な単語の数、ターゲットオブジェクトＸの価格、およびターゲットオブジェクトＸを販売している会社がユーザの好きな慈善事業に寄付した金額などがあるが、これらに限定されるわけではない。ステップ１２０２で、選択された属性の各々に、その属性に高い値を有するターゲットオブジェクトに対するユーザＵの好みの強さを示す正あるいは負の重みを掛ける。この重みは、選択されたユーザについての品質属性の重みを格納するデータファイルから取り出さなければならない。ステップ１２０３で、識別された、重み付けされた選択属性の、重み付けされた和を計算し、固有の品質測度ｑ（Ｕ，Ｘ）を決定する。ステップ１２０４で、要約された、重み付けされた関連性フィードバックデータが取り出され、ここで、幾つかの関連性フィードバックポイントが、その他の関連性フィードバックポイントよりも重く重み付けされ、例えば検索プロファイル集合を用いることなどによって、格納された関連性データをある程度要約することができる。ターゲットオブジェクトＸに対するユーザＵの関心を判断する際のより困難な部分は、ステップ１２０５で、ＵなどのユーザがＸなどのターゲットオブジェクトに対して一般に持っている、トピックについての関心を示すｆ（Ｕ，Ｘ）の値を見つけるあるいは計算することである。ユーザの関心を判断する方法は、以下の発見的方法に頼るものである。即ち、ＸおよびＹが類似したターゲットオブジェクトであり（類似した属性を有し）、ＵおよびＶが類似したユーザである（類似した属性を有する）とき、トピック関心ｆ（Ｕ，Ｘ）は、トピック関心ｆ（Ｖ，Ｙ）の値と類似した値を有すると予測される。この発見は効果的な方法をもたらす。なぜなら、トピック関心関数ｆ（＊，＊）の評価値は、その関数に対するある引数については実際に知られているからである。具体的には、ユーザＶがターゲットオブジェクトＹについて関連性フィードバックの評点ｒ（Ｖ，Ｙ）を与えていれば、評点が、ターゲットオブジェクトＹに対するユーザＶの真の関心を示している限り、ｒ（Ｖ，Ｙ）＝ｑ（Ｖ，Ｙ）＋ｆ（Ｖ，Ｙ）となり、ｆ（Ｖ，Ｙ）を、ｒ（Ｖ，Ｙ）−ｑ（Ｖ，Ｙ）として評価することができる。従って、すべてのポイントでトピック関心を評価するという問題は、ｆ（Ｖ，Ｙ）をｒ（Ｖ，Ｙ）−ｑ（Ｖ，Ｙ）とするフィードバック評価などのように、トピック関心のこれらの評価値に選択されたポイントで補間を行うという問題となる。この補間は、任意の標準的なスムージング技術で達成することができ、トピック関心関数ｆ（＊，＊）の値の既知のポイント評価値を入力として用い、全体のトピック関心関数ｆ（＊，＊）を近似する関数を出力として決定する。スムージングアルゴリズムの入力としては、トピック関心関数ｆ（＊，＊）のすべてのポイント評価値に等しい重みを与えなくてもよい。受動的関連性フィードバックは能動的関連性フィードバックよりも信頼性が低いため、受動的関連性フィードバックから作られたポイント評価値には、能動的関連性フィードバックから作られたポイント評価値よりも少なく重み付けするか、あるいは、受動的関連性フィードバックから作られたポイント評価値を全く用いないようにしなければならない。ほとんどのドメインでは、ユーザの関心は時間とともに変化し得るため、より最近のフィードバックから得られるトピック関心の評価値にも、より大きく重み付けをしなければならない。ユーザの関心は気分によっても変わり得るため、現在の期間から得られるトピック関心の評価値には、現在の期間の継続中はより大きく重み付けしなければならず、ほぼ現在の時刻あるいはほぼ現在の日に作られたトピック関心の過去の評価値には、より大きく重み付けしなければならない。最後に、ユーザが、ターゲットプロファイルによって与えられるおそらくわずかな情報から、長期間関心を持っているターゲットオブジェクト（投資、恋愛相手、ペンフレンド、雇用者、被雇用者、供給者、サービス提供者）の場所を特定しようと試みているドメインでは、ユーザは通常、ターゲットオブジェクトについての信頼性のある即時のフィードバックを与える立場にはないが、信頼性のあるフィードバックを後日与えることはできる。ユーザＶがターゲットオブジェクトＹを用いてより多くの経験をしたことがあれば、トピック関心ｆ（Ｖ，Ｙ）の評価値には、より大きく重み付けしなければならない。実際には、有用な方策は、システムが、そのようなターゲットオブジェクトについての長期間のフィードバックを監視することである。例えば、ターゲットプロファイルＹが１９９０年に作成され、１９９０年に入手可能となり１９９０年にユーザＶが購入した特定の投資を記述していれば、システムは、１９９０年、１９９１年、１９９２年、１９９３年、１９９４年、１９９５年などに、ユーザＶからの関連性フィードバックを求め、これらの関連性フィードバックを、ターゲットオブジェクトＹに対するユーザＶの真の関心をこの順により強く表すものとして扱う。従って、現在のプロファイルが１９９０年に得られたもとの投資プロファイルＹに似ている新しい投資に対してユーザＶが示しそうな関心を表すものとして扱う。特に、１９９４年および１９９５年に、ユーザＶが、ターゲットプロファイルＹによって記述された１９９０年の投資購入に対して十分に納得していれば、システムは、１９９４年、１９９５年およびそれ以降の年に、別の投資がターゲットオブジェクトＹと同様のプロファイルを有するとき、その投資を推薦する可能性が高い。その投資も、４年あるいは５年後に満足がいく結果となるであろうからである。このシステムは、このような推薦をユーザＶだけではなく、投資目録およびその他の属性がユーザＶのものと類似しているユーザにも行う。この場合、ユーザＶが与える関連性フィードバックは、能動的（フィードバック＝投資家Ｖが与える満足度の評点）であってもあるいは受動的（フィードバック＝例えば、投資を購入してからの、投資の平均年間収益とダウジョーンズ指標のポートフォリオの平均年間収益との差）であってもよい。スムージング技術を効果的に適用するためには、任意のユーザＵ、Ｖおよび任意のターゲットオブジェクトＸ、Ｙについて、（Ｕ，Ｘ）と（Ｖ，Ｙ）との間の類似性距離の定義を有していなければならない。２つのターゲットオブジェクトＸ、Ｙの属性が与えられたときに、これらのターゲットオブジェクト間の距離ｄ（Ｘ，Ｙ）を定義する方法については上で既に見てきた。（Ｕ，Ｘ）などの対を、ターゲットＸのすべての属性およびユーザＵのすべての属性を有する拡張されたオブジェクトであるとみなすことができる。そうすれば、（Ｕ，Ｘ）と（Ｖ，Ｙ）との間の距離を全く同じ方法で計算することができる。このアプローチでは、例えば、年齢（数値）、社会保険番号（テキスト）、および以前に取り出した文書のリスト（関連）など、ユーザＵ、ユーザＶ、およびその他のすべてのユーザ自身の属性のうちの幾つかがシステムに格納されていなければならない。「類似したユーザ」の概念を決定するのはこれらの属性である。従って、ターゲットオブジェクトのプロファイル（「ターゲットプロファイル」と呼ぶ）とともにユーザのプロファイル（「ユーザプロファイル」と呼ぶ）を生成することが望ましい。ユーザをプロファイルするために用いられる幾つかの属性は、ターゲットオブジェクトをプロファイルするために用いられる属性に関連し得る。例えば、関連属性を用いて、Ｘなどのターゲットオブジェクトを、様々なユーザがそのターゲットオブジェクトに示した関心によって特徴付け、それと同時に、Ｕなどのユーザを、そのユーザが様々なターゲットオブジェクトに示した関心によって特徴付けることが可能である。さらに、ユーザプロファイルは、例えば、人間を特徴付ける際に有用な属性であればどの属性でも用いることができる。ターゲットオブジェクトが可能性のある顧客である上述の例示的なドメインで示唆した属性などである。尚、ユーザＵの関心は、ユーザＵが新しいユーザであっても、あるいはフィードバックを与えたことのないオフラインユーザであっても、評価することができる。なぜなら、Ｕの属性と類似した属性を有するユーザの関連性フィードバックを考慮するからである。フィルタリングシステムの幾つかの用途では、トピック関心を評価する場合、別の「トピック関心なしという推定」（あるいは「ゼロへのバイアス（bias）」）を作るのが適切である。そのような推定の有用性を理解してもらうために、ここでは、システムは、ターゲットオブジェクトＸのトピックがユーザＵにとって興味のあるものであるかどうかを判断しなければならないが、ユーザＵなどのユーザは、ターゲットオブジェクトに対してターゲットオブジェクトＸの場合のように遠隔からもフィードバックを与えたことがないとする。トピック関心なしという推定は、この推定が事実であれば、ユーザＵなどのユーザはそのようなターゲットオブジェクトに対して興味を持っていないだけであり、従って、これらのターゲットオブジェクトを探し出さず、これらのターゲットオブジェクトと対話もしない、ということを示す。この推定を行うと、システムは、トピック関心ｆ（Ｕ，Ｘ）を非常に低いと評価しなければならない。形式上、この例は、（Ｕ，Ｘ）が、フィードバックが利用可能なすべてのポイント（Ｖ，Ｙ）からはるかに離れた値であるという特徴を有する。そのような場合、値が分かっている周りの離れたすべてのポイントでのトピック関心関数ｆ（＊，＊）の値が大きくても、上述のようなトピック関心ｆ（Ｕ，Ｘ）はゼロに近いと推定される。スムージング技術を用いる場合、上述のようなトピック関心なしという推定が適切である場合には、スムージング技術に対する入力を操作することによって、この推定を導入することができる。トピック関心関数ｆ（＊，＊）の観察値を入力として用いることに加えて、多次元空間に分布したポイント（Ｖ，Ｙ）の格子についてトピック関心ｆ（Ｖ，Ｙ）＝０の形の偽の観察（fake observations）も導入することが巧みな技法である。これらの偽の観察には、スムージングアルゴリズムへの入力として、比較的小さい重みを与えなければならない。これらの偽の観察の重み付けが大きいほど、関心なしという推定はより強くなる。以下に、関心なしという推定を有する評価技術の別の単純な例を示す。ｇを、例えばｇ（ｘ）＝ｅ^xあるいはｇ（ｘ）＝ｍｉｎ（１，ｘ^-k）などの、負でない実数から負でない実数に減少する関数とする。ここでｋ＞１である。以下のｇで重み付けされた平均でトピック関心ｆ（Ｕ，Ｘ）を評価する。ここでは、合計（summation）は、ユーザＶがターゲットオブジェクトＹについてフィードバックｒ（Ｖ，Ｙ）を与えたすべての対（Ｖ，Ｙ）、即ち、関連性フィードバックｒ（Ｖ，Ｙ）が定義されるすべての対（Ｖ，Ｙ）についてのものである。尚、この技術を用いた場合も従来のスムージング技術を用いた場合も、トピック関心ｆ（Ｕ，Ｘ）の評価は必ずしもｒ（Ｕ，Ｘ）−ｑ（Ｕ，Ｘ）に等しいとは限らない。ｒ（Ｕ，Ｘ）が定義される場合であってもである。フィルタリング：重みおよび残余フィードバック上述の方法では、フィルタリングシステムが、（Ｕ，Ｘ）と（Ｖ，Ｙ）との間の距離などの、（ユーザ、ターゲットオブジェクト）対の間の距離を測定しなければならない。従って、２つの多属性プロファイルの間の距離を測定するための以前に説明した手段が与えられると、この方法では、重みを、（ユーザ、ターゲットオブジェクト）対のプロファイルに用いられる各属性に関連させなければならない。即ち、ユーザあるいは目的オブジェクトをプロファイルするために用いられる各属性に関連させなければならない。これらの重みは、類似性あるいは違いを確立する際に、従って、トピック関心を、ある（ユーザ、ターゲットオブジェクト）対から別の対にどのように一般化されるかを決定する際に、属性の相対的重要性を特定する。別の重みは、ターゲットオブジェクトのどの属性が品質関数ｑに寄与するか、およびどのくらい寄与するかを決定する。フィルタリングシステムが、各ユーザについてそれぞれ異なる１組の重みを格納することが可能であり、しばしばそれが望ましい。例えば、２つ星の映画は、４つ星の映画とはかなり違うトピックおよびスタイルを持つと考えるユーザは、類似性距離測度ｄ（＊，＊）の目的のために、「星の数」に高い重みを付けたいと考える。これは、２つ星の映画に対して関心があるからといって、必ずしも、星の数以外で類似している４つ星の映画に対しても関心があるとは限らないこと、あるいはその逆を意味している。ユーザが評論家の意見にも同意し、実際に４つ星の映画の方を好んでいれば、ユーザは、品質関数ｑの決定の際に、「星の数」に大きい正の重みを割り当てたいと考える。同様に、俗悪さを嫌うユーザは、品質関数ｑの決定の際に、「俗悪スコア」属性に、大きい負の重みを割り当てたいと考える。しかし、「俗悪スコア」属性は、２つの映画のトピックの類似性を決定する際に、必ずしも大きい重みを持つわけではない。（両方の種類の）属性の重みは、システム管理者あるいは個人のユーザによって、一時的にあるいは永久的に設定あるいは調整され得る。しかし、フィルタリングシステムが関連性フィードバックに基づいて自動的に属性の重みを学習することがしばしば望ましい。ユーザＵについての最適な属性の重みは、ユーザＵの関心の最も正確な予測を可能にする重みである。即ち、これらの属性の重みによって定義される距離測度および品質関数を用いて、ターゲットオブジェクトＸに対するユーザＵの関心、即ちｑ（Ｕ，Ｘ）＋ｆ（Ｕ，Ｘ）を、上述の技術によって正確に評価することができる。従って、ユーザＵについての特定の一組の属性の重みの有効性は、システムがユーザＵの既知の関心をどれだけ十分に予測するかを見ることによってはかることができる。形式上、ユーザＵが、ターゲットオブジェクトＸ₁，Ｘ₂，Ｘ₃，...，Ｘ_nについて以前に与えたフィードバックを有し、フィードバック評点がｒ（Ｕ，Ｘ₁），ｒ（Ｕ，Ｘ₂），ｒ（Ｕ，Ｘ₃），...，ｒ（Ｕ，Ｘ_n）であるとする。その他のユーザおよびその他のターゲットオブジェクトについてのフィードバック評点ｒ（＊，＊）の値も分かっていてもよい。システムは、以下に示す手順を用いて、システムがユーザＵについて現在格納している属性の重みの組の有効性をはかり得る。（i）１≦Ｉ≦ｎのそれぞれについて、評価技術を用いて、フィードバック評点ｒの既知のすべての値からｑ（Ｕ，Ｘ₁）＋ｆ（Ｕ，Ｘ_i）を評価する。この評価値をａ_iと呼ぶ。（ii）ステップ（i）を繰り返すが、今回は、距離ｄ（Ｘ_i ，Ｘ_j）が一定の閾値未満となるようなすべてのｊについてのフィードバック評点ｒ（Ｕ，Ｘ_j）を入力として用いずに、１≦ｉ≦ｎのそれぞれについて、評価値を生成する。即ち、フィードバック評点ｒの他の値だけから、ｑ（Ｕ，Ｘ_i）＋ｆ（Ｕ，Ｘ_i）の各々を評価する。特に、ｒ（Ｕ，Ｘ_i）自体は用いない。この評価値をｂ_iと呼ぶ。本明細書において、差ａ_i−ｂ_iを、「ターゲットオブジェクトＸ_iについてのユーザＵの残余フィードバックｒ_res（Ｕ，Ｘ_i）」と呼ぶ。（iii）ユーザＵの誤り測度（ａ₁−ｂ₁）²＋（ａ₂−ｂ₂）²＋（ａ₃−ｂ₃）²＋.. .＋（ａ_n−ｂ_n）²を計算する。最急降下法あるいはその他の数値最適化法を用いて、この誤り測度が（局所）最小値に達するようにＵの属性の重みを調整してもよい。このアプローチは、評価に用いるスムージング技術が、ポイント評価値ｒ（Ｖ，Ｙ）−ｑ（Ｖ，Ｙ）が入力として与えられたときにｆ（Ｖ，Ｙ）の値がこのポイント評価値による強い影響を受けるようなものである場合に最良に作用する傾向がある。その他、１つの入力フィードバック評点ｒ（Ｕ，Ｘ_i）が有っても無くても、ステップ（i）〜（ii）でａ_iおよびｂ_iはあまり異なる値にはならないであろう。この学習技術のわずかな変形では、すべてのユーザについての属性の重みの１つのグローバルセット（global set）を調節する。この調節は、特定のユーザの誤り測度ではなく、すべてのユーザの総誤り測度を最小にするようにこれらの重みを調節することによって行われる。これらのグローバル重みは、まだフィードバックを与えたことのない新しいユーザについてのデフォルト初期設定として用いられる。その後、最急降下法を用いて、このユーザの個々の重みを経時的に調整することができる。ユーザＵについての誤り測度を最小にするように属性の重みが選択された場合でも、誤り測度は一般に依然として正の値であある。これは、すべてのターゲットオブジェクトについてのユーザＵからの残余フィードバックが０に減少していないことを意味する。ターゲットオブジェクトＸについてのユーザＵからの高い残余フィードバックが、プロファイルが予期せず十分に与えられたターゲットオブジェクトＸをユーザＵが気に入ったことを示すことに注目することが有用である。即ち、ターゲットオブジェクトに与えられたプロファイルがスムージングモデルよりも優れていれば、同様のプロファイルを有するターゲットオブジェクトについてのユーザＵの意見から予測することが可能であろう。同様に、低い値の残余フィードバックは、ユーザＵが、予想したよりターゲットオブジェクトＸを気に入らなかったことを示す。定義によれば、この説明されない好みあるいは嫌悪は、トピックの類似性の結果とはなり得ないため、ターゲットオブジェクトＸの固有の品質を表すものとみなさなければならない。これは、ターゲットオブジェクトＸについての有用な品質属性は、そのターゲットオブジェクトについてのユーザからの残余フィードバックｒ_res（Ｖ，Ｘ）の平均量であって、そのターゲットオブジェクトについての関連性フィードバックを与えたことのあるすべてのユーザＶについて平均をとった値である、ということに従うものである。この概念の変形では、残余フィードバックをすべてのユーザについて無差別には平均をとって新しい属性を形成するのではなく、残余フィードバックをスムージングして、ユーザ間の類似性を考慮する。品質測度ｑ（Ｕ，Ｘ）がユーザＵに依存するとともに、ターゲットオブジェクトＸにも依存することを思い出されたい。そのため、所与のターゲットオブジェクトＸは、異なるユーザによって、異なる品質を有するとして認識され得る。この変形では、上述のように、ｑ（Ｕ，Ｘ）は、Ｘだけに依存する様々な品質属性の重み付け合計として計算されるが、その後、別の項が加えられる。即ち、ｒ_res（Ｖ，Ｘ）の既知の値にスムージングアルゴリズムを適用することによって見いだされるｒ_res（Ｖ，Ｘ）の評価値が加えられる。ここでは、Ｖの範囲は、ターゲットオブジェクトＸについて関連性フィードバックを与えたことがあるすべてのユーザであり、スムージングアルゴリズムは、そのようなユーザＶの各々からユーザＵまでの距離ｄ（Ｕ，Ｖ）に敏感である。クラスタ化のための類似性計算の利用上では、任意のターゲットオブジェクト対間の距離を定義する方法を開示した。この距離測度があれば、ｋ平均（k-means）などの標準的なクラスタ化アルゴリズムを適用して、類似したターゲットオブジェクトが同一クラスタにグループ分けされるようにターゲットオブジェクトを多数のクラスタにグループ分けすることは簡単である。結果として得られたクラスタを用いて、「売り手と買い手との整合」の章で説明した応用における売り手と買い手との整合の効率を高めることができることは明らかである。すべての購入プロファイルをすべての販売プロファイルと比較する必要はなく、同一クラスタに現れるほど十分に類似している購入プロファイルと販売プロファイルとを比較するだけでよい。以下に説明するように、クラスタ化手順の結果は、フィルタリングをより効率的にするために用いられ、さらに、問い合わせおよびブラウズの作業において用いられる。ｋ平均クラスタ化法は、当業者によく知られた方法である。簡単に言うと、ｋ平均クラスタ化法では、ポイント（この場合は、数値座標が上述のような属性の数値分解によって与えられるターゲットプロファイル）のグループを見つけて、ポイントおよび中心が配置されるクラスタのポイント、およびクラスタの中心の距離を最小にする。これは、各ポイントを、最も近い中心を有するクラスタに割り当て、一旦ポイントが割り当てられると、このクラスタに配置されるポイント（ターゲットオブジェクト）の座標の平均をとることによって各クラスタの（新しい）中心を計算する、というプロセスを交互におこなうことによって行われる。オブジェクトが２つ以上のクラスタに属することが可能となる「ソフト（soft ）」あるいは「ファジー（fuzzy）」ｋ平均クラスタ法などのその他のクラスタ化法を用いることも可能である。これは、ｋ平均の問題点と同様のクラスタ化の問題点となり得るが、現在、最適化される基準は少し異なっており、以下の通りである。ここで、Ｃはクラスタ番号の範囲をとり、ｉはターゲットオブジェクトの範囲をとり、ｘ_iはターゲットオブジェクト番号ｉのプロファイルに対応する数値ベク号Ｃのターゲットオブジェクトのターゲットプロファイルに対応するすべての数値ベクトルの平均であり、ｄ（＊，＊）は、２つのターゲットオブジェクトの間の距離を測定するために用いられる計量であり、ｉ_iCは０と１との間の値であって、ターゲットオブジェクト番号ｉがクラスタ番号Ｃにどれだけ関連しているかを示し、ここでｉは、各々のｉについてSUM SUB C I SUB iC＝１である特性を有するインジケータ行列である。ｋ平均クラスタ化の場合、ｉ_iCは０あるいは１である。システムは、これらの基本的な種類のクラスタ化のいずれを用いてもよい。１）関連に基づくクラスタ化：プロファイルが関連属性だけを含み、従って、距離が完全に関連によって定義される。この種類のクラスタ化は、一般に、（a ）ターゲットオブジェクトを好むユーザの類似性に基づいて、ターゲットオブジェクトをクラスタ化するか、あるいは（b）ユーザが好むターゲットオブジェクトの類似性に基づいて、ユーザをクラスタ化する。このアプローチでは、システムは、ターゲットオブジェクトとユーザとの間の対話履歴以外の、ターゲットオブジェクトあるいはユーザに関する情報しか必要としない。２）内容に基づくクラスタ化：プロファイルが非関連属性だけを含む。この種類のクラスタ化は、（a）非関連属性（単語の頻度など）の類似性に基づいてターゲットオブジェクトをクラスタ化するか、あるいは（b）非関連属性（人口統計学およびサイコグラフ法（psychographics））の類似性に基づいてユーザをクラスタ化する。このアプローチでは、システムは、ユーザの情報アクセス履歴パターンに関する情報を記録する必要はなく、ユーザおよび／またはターゲットオブジェクトの固有の特性についての情報を必要とする。３）均一ハイブリッド法：プロファイルが、関連属性および非関連属性をともに含み得る。この方法は、(１)(a)および(２)(a)あるいは(１)(b)および(２)(b) を組み合わせたものである。２つのプロファイルＰ_XとＰ_Yとの間の距離ｄ（Ｐ_X ，Ｐ_Y）は、上で説明した一般的な類似性測定法によって計算され得る。４）連続ハイブリッド法：まず、ｋ平均手順を適用して(１)(a)を行い、どのユーザがその記事を読んだかに基づいて、クラスタによって記事にラベルを付ける。その後、単語の頻度を用いて上述の方法(２)のプロセス(a)を行う管理（sup ervised）クラスタ化（最大可能性弁別法）を用いる。これは、誰が何を読んだかについての知識を用いて、単語の頻度に基づいたクラスタ化をよりよく行うよう試みるものである。上述の方法(１)(b)と(２)(b)とを同様に組み合わせてもよい。ターゲットオブジェクトの階層クラスタ化はしばしば有用である。階層クラスタ化は、図８に示すように、ターゲットオブジェクトを、ほぼ類似したオブジェクトからなる２つの大きいクラスタに分け、これらのクラスタの各々を、２つ以上のより小さいクラスタに分け、ターゲットオブジェクトのコレクションがすべて、各々が１つのオブジェクトからなる「クラスタ」に分けられるまで、これらのより小さいクラスタの各々をさらに小さいクラスタに分けるツリーを生成する。この図では、ノードｄは、特定のターゲットオブジェクトｄを示すか、あるいは、それと等価には、このターゲットオブジェクトからなる１要素のクラスタを示す。ターゲットオブジェクトｄは、クラスタ（ａ，ｂ，ｄ）の要素であり、このクラスタは、クラスタ（ａ，ｂ，ｃ，ｄ，ｅ，ｆ）の部分集合であり、この部分集合は、すべてのターゲットオブジェクトの部分集合である。図８に示すツリーは、図７に幾何学的に示しているターゲットオブジェクトのようなターゲットオブジェクトの集合から生成される。図６において、各文字はターゲットオブジェクトを表し、軸ｘ１およびｘ２は、ターゲットオブジェクトが異なる、多くの数値属性のうちの２つを表す。そのようなクラスタツリーは、人間の判断を用いて、類似したオブジェクトのクラスタおよびサブクラスタを形成しすることにより、手で作成され得るか、あるいは、２つの標準的な方法、即ち、トップダウンあるいはボトムアップのいずれかを用いて自動的に作成され得る。トップダウン階層クラスタ化では、図７のすべてのターゲットオブジェクトからなる集合は、クラスタ（ａ，ｂ，ｃ，ｄ，ｅ，ｆ）および（ｇ，ｈ，ｉ，ｊ，ｋ）に分けられる。その後、クラスタ化アルゴリズムが、再び各クラスタのターゲットオブジェクトに適用され、クラスタ（ｇ，ｈ，ｉ，ｊ，ｋ）がクラスタ（ｇ，ｋ）および（ｈ，ｉ，ｊ）に細分される、などにより、図８に示すツリーに到達する。ボトムアップ階層クラスタ化では、図７のすべてのターゲットオブジェクトからなる集合は、多数の小さいクラスタ、即ち、（ａ，ｂ）、ｄ、（ｃ，ｆ）、ｅ、（ｇ，ｋ）、（ｈ，ｉ）およびｊに分けられる。その後、これらのクラスタ自体が、それらのクラスタプロファイルに従って、より大きいクラスタ（ａ，ｂ，ｄ）、（ｃ，ｅ，ｆ）、（ｇ，ｋ）および（ｈ，ｉ，ｊ）にグループ分けされる。これらのより大きいクラスタ自体が、（ａ，ｂ，ｃ，ｄ，ｅ，ｆ）および（ｇ，ｋ，ｈ，ｉ，ｊ）に分けれられ、これが、すべてのターゲットオブジェクトが一緒のグループに分けられるまで行われて、図８のツリーとなる。尚、ボトムアップクラスタ化を行うには、クラスタ化アルゴリズムを一組の既存のクラスタに適用することができなければならない。これには、２つのクラスタ間の距離の概念が必要である。上で開示した、ターゲットオブジェクト間の距離を測定する方法は、クラスタがターゲットオブジェクトと同じ方法でプロファイルされていれば、直接適用することができる。クラスタのプロファイルがクラスタ中のすべてのターゲットオブジェクトのターゲットプロファイルの平均であるという取り決め（conventi on）を採用するだけでよい。即ち、所定の属性についてのクラスタの値を決定し、クラスタ中のすべてのターゲットオブジェクトについてのその属性の平均値をとるだけでよい。この平均値を十分に定義するためには、すべての属性が数値属性でなければならず、従って、通常通り、上述のように、各テキスト属性あるいは各関連属性を、数値属性（スコア）への分解に置き換えることが必要である。例えば、１つのWoody Allenの映画のターゲットプロファイルは、「監督名」フィールドにおいて、「Woddy Allen」にはスコア１を割り当て、「Federico-Fell ini」および「Terence-Davies」にはスコア０を割り当てる。Allenが監督した２０個の映画とFelliniが監督した５つの映画からなるクラスタは、スコア０．８、０．２、および０でプロファイルされる。これは、例えば、０．８が２０個の１と５個の０との平均であるからである。ターゲットオブジェクトの検索ターゲットプロファイルＰを有するターゲットオブジェクトが与えられると、またあるいは、検索プロファイルＰが与えられると、ターゲットオブジェクトの階層クラスタツリーによって、システムが、Ｐに類似のターゲットプロファイルを有するターゲットオブジェクトを効率的に検索することが可能となる。そのようなターゲットプロファイルの検索においては、自動的にツリー中をナビゲーションすることが必要なだけである。所望のオブジェクトのカスタム化された電子識別システムは、最大の、最上位クラスタを考慮することで始まり、プロファイルがターゲットプロファイルＰに最も類似しているクラスタを選択する。ほぼ同じ場合には、複数のクラスタが選択され得る。次に、システムは、選択されたクラスタのサブクラスタを全て考慮し、今度は、プロファイルがターゲットプロファイルＰに最も近い１つまたは複数のサブクラスタを選択する。この精製プロセスは、あるステップに関して選択されたクラスタが十分に小さくなるまで反復され、それらは、ターゲットプロファイルＰに最も類似したプロファイルを有するターゲットオブジェクトの所望のクラスタである。従って、階層クラスタツリーはどれでも、ターゲットオブジェクトを識別するための判断ツリーとして機能する。疑似コード形態では、このプロセスは、以下（および図１３Ａおよび図１３Ｂのフロー図形態）の通りである：１．ステップ１３Ａ００において、識別されたターゲットオブジェクトのリストを、空リストへと初期化する。２．ステップ１３Ａ０１において、現ツリーＴが、全オブジェクトの階層クラスタツリーとなるように初期化し、ステップ１３Ａ０２において、図１３Ｂに詳述されるプロセスを用いて、Ｐに類似のターゲットオブジェクトを求めて現クラスタツリーをスキャンする。３．ステップ１３Ｂ００において、変数Ｉが、１に設定され、ツリーＴのルートの各子サブツリーＴｉに対して取り出される。４．ステップ１３Ｂ０２において、ｄ（Ｐ，ｐ_i）、すなわちＰとｐ_iとの類似距離を計算する。５．ステップ１３Ｂ０３において、ｄ（Ｐ，ｐ_i）＜ｔ（しきい値）であれば、２つのオプションの一方に分岐する。６．ステップ１３Ｂ０４において、ツリーＴｉが、ターゲットオブジェクトを１つだけ含んでいれば、ステップ１３Ｂ０５において、該ターゲットオブジェクトを、識別されたターゲットオブジェクトのリストに加え、ステップ１３Ｂ０７に進む。７．ステップ１３Ｂ０４において、ツリーＴｉが、複数のターゲットオブジェクトを含んでいれば、図１３Ｂのプロセスのステップを再帰的に起動させることによって、Ｐに類似のターゲットオブジェクトのためにｉ番目の子サブツリーをスキャンし、次に、ツリーＴｉにおいてＰに類似のプロファイルを有するターゲットオブジェクトを検索するために、ツリーＴｉへの再帰の期間に制限されたＴと共に、ステップ３（図１３Ａにおけるステップ１３Ａ０１）に再帰する。この疑似コードのステップ５においては、より小さなしきい値が、例えばしきい値を疑似関数、またはクラスタ分散またはクラスタｐ_iのクラスタ直径の他の関数にすることによって、典型的にはツリーの下位において用いられる。本明細書中の「ブラウジングシステムのネットワークコンテクスト」というタイトルのセクションに説明されるように、クラスタツリーが複数のサーバに分散されると、このプロセスは、以下のような分散された様式で実行され得る。ステップ３〜７が、階層クラスタツリーＴのルートノードを格納するサーバによって実行され、ステップ７におけるサブクラスタツリーＴ_iへの再帰は、ツリーＴ_iのルートノードを格納するサーバへの検索リクエストの送信に関与し、このサーバは、このリクエストを受け取った際に、再帰的ステップを実行する。ステップ１〜２は、検索を開始するプロセッサによって実行され、ステップ６を実行するサーバは、ターゲットオブジェクトを識別するメッセージを、この開始プロセッサに送らなければならず、このプロセッサは、メッセージをリストに加える。下位のクラスタが、クラスタ化によってすでに形成されたと仮定すると、プロファイルが、あるターゲットプロファイルＰに最も類似する下位クラスタを識別するための代替の検索方法が存在する。標準バックプロパゲーションニューラルネットは、そのような方法の一つである。これは、ターゲットオブジェクトの属性を入力として受け取り、出力として、適切な下位クラスタを識別するために使用され得る固有のパターンを生成するように訓練されるべきである。最大限の正確さのためには、互いに類似する下位クラスタ（クラスタツリーにおいて共に近接している）は、類似の識別パターンを与えられるべきである。別のアプローチには、適切なクラスタを識別できるまで、ターゲットプロファイルＰの属性を１度に１つずつ考慮する標準判断ツリーがある。プロファイルが大きければ、このアプローチは、全ての属性を考慮するよりも、より高速であり得る。検索のハイブリッドアプローチは、上記のような距離測定を使用し、それによって、プロファイルがターゲットプロファイルＰに類似する中間サイズのクラスタに到達するまで、階層クラスタツリーの２、３の最上位がナビゲーションされ、その後、該中間クラスタの下位サブクラスタの検索を専門とする判断ツリーを用いて継続される。これらの検索技術の使用の１つは、ユーザの検索プロファイルセットからある検索ファイルに一致するターゲットオブジェクトを検索することである。この形態の検索は、新聞の切り抜きサービス、アクティブナビゲーション、および以下に記載される仮想コミュニティサービスアプリケーションにおいて、繰り返し使用される。別の使用は、新しいターゲットオブジェクトを素早くクラスタツリーに加えることである。新しいターゲットオブジェクトに類似の現存するクラスタは、迅速に見つけだされ、新しいターゲットオブジェクトが、このクラスタに加えられ得る。オブジェクトが、クラスタの中心からある特定のしきい値距離を越えると、新しいクラスタを開始することが望ましい。このインクリメンタルクラスタ化スキームの幾つかの変形が使用され得、高度な統計パッケージにおいて利用可能なサブルーチンの変形を使用して構築され得る。様々な方法が、使用されるアーキテクチャに応じて、クラスタツリーに加えられなければならない新しいターゲットオブジェクトを見つけだすのに使用され得ることに注目されたい。ある方法においては、中央コンピュータで実行される「ウェブクローラ」プログラムが、新しいターゲットオブジェクトを探して、周期的に全てのサーバをスキャンし、これらのオブジェクトのターゲットプロファイルを計算し、上記の方法によって階層クラスタツリーにそれらを加える。別の方法においては、新しいターゲットオブジェクトがサーバのいずれかに加えられると、該サーバにおけるソフトウェア「エージェント」は、ターゲットプロファイルを計算し、上記の方法によって階層クラスタツリーにそれを加える。高速プロファイリングあるドメインにおいては、ターゲットオブジェクトの完全なプロファイルを自動的に構築することが常に容易とは限らない。例えば、ターゲットオブジェクトが、壁紙パターンである場合には、「ジャンル」（「アールデコ」、「チルドレンズ」（Children's）、「ラスティック」（Rustic）等の単一のテキスト用語）等の属性は、人間に相談する以外には決定が困難な判断および意見の問題であり得る。より有意には、各壁紙パターンが、様々な人間のユーザ（消費者）からの該パターンに対するポジティブまたはネガティブな関連性フィードバックを記録する関連属性を有する場合には、新しく導入されるパターンの全ての関連スコアが、最初は０であり、その結果、他のどのパターンが新しいパターンに類似であるかが、それらを気に入ったユーザに対して最初は不明である。実際、この関連属性が高度に重みづけられると、中程度から高度に関心を持つユーザが、関連性フィードバックを提供することが必要とされるが、関連性フィードバックが、中程度から高度に関心を持つユーザを識別するために必要であるという悪循環が原因で、関連性フィードバック情報の初期の欠如を矯正することが困難であり得る。しかし、幸運なことに、人間に相談する方法を含むがそれには限定されない異例の方法によって、新しいターゲットオブジェクトの特定の属性を決定することが、原則的にはしばしば可能である。例えば、システムは、原則的には、有名な人間の専門家の組から一人以上のランダムに選択された個人に相談することによって、壁紙パターンのジャンルを決定し得るが、新しい壁紙パターンと特定のユーザとの間の数値の関連スコアを決定するためには、原則的には、そのユーザにパターンを見せ、関連性フィードバックを得ることができる。しかし、そのようなリクエストが人に不便をかけるので、文書を分類する目的上、最も重要なものだけを除いて、全ての困難な属性をこの方法で決定しないことが重要である。「高速プロファイリング」は、決定することが最も重要な数値的属性を選択する方法である（全ての属性が、関連スコアまたは用語スコア等の数値的属性に分解され得ることを思い出されよ）。第１に、すでに完成した、またはほぼ完成したプロファイルを有する現存のターゲットオブジェクトのセットが、ｋ平均アルゴリズムを用いてクラスタ化される。次に、結果として生じたクラスタの各々が、固有の識別番号を割り当てられ、クラスタ化されたターゲットオブジェクトの各々が、クラスタの識別番号で標識化される。次に、標準的な方法により、あらゆるターゲットオブジェクトのクラスタ番号をかなりの正確さで決定し得る単一の判断ツリーの構築が、１度１つずつターゲットオブジェクトの属性を考慮することによって可能となる。新しいターゲットオブジェクトのために必要であれば決定され得る属性のみが、この判断ツリーの構築に使用される。新しいターゲットオブジェクトをプロファイルするためには、判断ツリーが、ルートから所望なだけ遠くに下に向かってトラバースされる。判断ツリーのルートは、ターゲットオブジェクトのある属性を考慮する。この属性の値がまだわからなければ、その属性に適切な方法によって決定される。例えば、その属性が、ユーザ＃４５８９に対するターゲットオブジェクトの関連スコアであれば、関連性フィードバック（この属性の値として使用される）が、ユーザ＃４５８９から求められる。これは、おそらくは、ユーザがどのように考えているかを調べるために、ユーザの注目に対して、システムが推奨するオブジェクトセットに、おそらく関心のないターゲットオブジェクトを加える計略によって求められる。一旦ルート属性が決定されると、高速プロファイリング方法は、判断ツリーを１レベル下降し、ルート属性の決定された値に応じてルートの判断サブツリーの１つを選ぶ。この選ばれたサブツリーのルートは、ターゲットオブジェクトの別の属性を考慮し、その値は、適切な方法によって同様に決定される。このプロセスは、利用可能などのような方法でも用いて、所望な数の属性を決定するために繰り返され得る。しかし、このプロセスは、多すぎる数の属性を決定する負担を避けるために、少数の属性の後に通常停止される。高速プロファイリング方法が、ターゲットオブジェクトのプロファイルだけでなく、あらゆる種類のプロファイルにおいて重要な属性を識別するために使用され得ることが注目されるべきである。特に、類似点によってトピック的関心を決定するための開示された方法が、ユーザ並びにターゲットオブジェクトが、プロファイルを有することを必要とすることを思いだされよ。新しいターゲットオブジェクトと同様に、新しいユーザが、高速プロファイリングプロセスによってプロファイルされ得る、または部分的にプロファイルされ得る。例えば、ユーザプロファイルが、ユーザの関連性フィードバックをシステム中の全てのターゲットオブジェクトに記録する関連属性を含む場合には、高速プロファイリングプロシージャが、ユーザのフィードバックを少数の有意なターゲットオブジェクト上で求め、おそらくはオンラインの照会、電話調査、または他の手段によって新しいユーザの少数の他の重要な属性を決定することによっても、新しいユーザの関心の大まかな特徴付けを急速に形成し得る。一旦新しいユーザがこの方法で部分的にプロファイルされると、上に開示された方法は、新しいユーザの関心が、類似のプロファイルを有する他のユーザの公知の関心に似ていることを予想する。変形例では、各ユーザのユーザプロファイルが、人口統計的特徴などの長期属性のセット、および答えがユーザの気分を反映する質問に対するユーザのテキストまたは多項選択式の回答などの、ユーザの一時的な要望および感情状態を識別する助けとなる短期属性のセットに細分される。ユーザの長期属性のサブセットは、長期属性の高速プロファイリングツリーの使用によって、ユーザが初めにシステムに登録した時に決定される。さらに、ユーザがシステムにログオンするたびに、短期属性に関する質問をする別個の高速プロファイリングツリーの使用によって、ユーザの短期属性のサブセットが追加的に決定される。市場調査高速プロファイリングに類似の技術は、市場調査（または投票者調査）において関心のあることである。ターゲットオブジェクトが消費者だと仮定すると、各ターゲットプロファイルにおけるある特定の属性は、そのターゲットプロファイルによって示される消費者が、製品Ｘを購入したかどうかを示す。消費者のプロファイルにおける他の属性を考慮することによって、消費者が、この属性に対してどのような値を有するかを決定しようと試みる判断ツリーが構築され得る。この判断ツリーは、さらなるユーザが、製品Ｘを購入しそうであるかどうかを決定するためにトラバースされ得る。より一般的には、判断ツリーの２、３の最上位レベルが、大量販売またはダイレクトメールキャンペーンを企画している広告主にとって価値のある、製品Ｘの消費者の最も有意な特徴に関する情報を提供する。代替的に、同様の情報が、判断ツリーに頼ることなく、１度に１つずつ属性を考慮し、製品Ｘの消費者が、製品Ｘの非消費者とは有意に異なる属性を識別することによって、消費者プロファイルの集まりから抽出され得る。これらの技術は、特定の製品の消費者を特徴づけるために機能し、これらの技術は、調査された個人のあるセットから、特定の候補者を支持する、特定の意見を持つ、特定の人口統計グループに属する、またはある別の顕著な属性のセットを有する個人を特徴づけることを目的とする投票者調査または他の調査研究にも同様にうまく適用され得る。研究者は、個人の識別情報が取り除かれた、分析済みまたは分析されていないユーザプロファイルのバッチを購入することを望むかもしれない。あらゆる統計的データベースの場合と同様に、統計的結論が引き出され得、属性間の関係が、当該分野には周知の知識発見技術を用いて解明され得る。支援アーキテクチャ以下のセクションは、本特許に記載される方法を実行するための好適なコンピュータおよびネットワークアーキテクチャを説明する。電子媒体システムアーキテクチャ図１は、ブロック図の形態で、当該分野で公知の電子媒体システムのアーキテクチャ全体を形成し、ここでは、本発明の所望のオブジェクトのカスタム化電子識別システムが、電子媒体システムを介して利用可能なターゲットオブジェクトへのユーザカスタム化アクセスを提供するために使用され得る。特に、電子媒体システムは、複数のユーザと多数の情報サーバとを相互接続するデータ通信設備を備える。ユーザは、典型的には、パーソナルコンピュータ（端末）Ｔ₁〜Ｔ_nが、モデムおよび周知の様式で確立された電話接続などのデータ通信リンクを介して、通信ネットワークＮに接続される個人である。ユーザ情報アクセスソフトウェアは、ユーザのパーソナルコンピュータに常駐しており、データ相互接続サービスに情報サーバＩ₁〜Ｉ_mから選択されたサーバを供給する複数のネットワークベンダＶ₁〜Ｖ_k（America Online、Prodigy、CompuServe、他の有限会社あるいは大学）の１つを用いて、データ通信リンクおよび通信ネットワークＮ上で通信するように機能する。ユーザ情報アクセスソフトウェアの使用によって、ユーザは、情報サーバＩ₁〜Ｉ_mと対話し得、それによって、情報サーバ装置の一部である大容量記憶システムＳＳ_mに常駐するデータへのアクセスがリクエストされ、得られる。新しいデータが、パーソナルコンピュータＴ₁〜Ｔ_nを介して、および大容量記憶システムＳＳ₁〜ＳＳ_mに商用データを蓄積させる商用情報サービスによって、このシステムｙユーザに入力される。各ユーザ端末Ｔ₁〜Ｔ_nおよび情報サーバＩ₁〜Ｉ_mは、電話番号、またはある特定のユーザ端末Ｔ₁〜Ｔ_nと選択された情報サーバＩ₁〜Ｉ_mとの間にデータ通信リンクが確立されることを可能とするネットワークＮ上のＩＰアドレスを有する。ユーザの電子メールアドレスもまた、username＠aol.comまたはusername＠netcom.comなどの業界標準フォーマットで、ユーザおよびユーザのネットワークベンダＶ₁〜Ｖ_kを固有に識別する。ネットワークベンダＶ₁〜Ｖ_kは、加入者（選択されたユーザ）にアクセスパスワード（これによってユーザは、情報サーバＩ₁〜Ｉ_mにアクセスし得る）を提供する。加入者は、典型的には月々の加入料金および使用に基づく料金を含む料金表に基づいて、アクセスサービスに対して、ネットワークベンダＶ₁〜Ｖ_kに支払いをする。このシステムの困難な点は、世界中に位置する多数の情報サーバＩ₁ 〜Ｉ_mが存在し、それぞれが、異なるフォーマット、内容、およびトピックの情報セットへのアクセスを、典型的には特定の情報サーバＩ₁〜Ｉ_mに固有のカタログシステムを介して提供することである。情報は、個々の「ファイル」（ファイルは、オーディオデータ、映像データ、グラフィックデータ、テキストデータ、構造化データベースデータ、およびそれらの組み合わせを含有し得る）から構成される。本特許の用語では、各ターゲットオブジェクトが、固有のファイルに関連づけられ、本質的に情報的で、デジタル形式で表され得るターゲットオブジェクトに関しては、ファイルは、ターゲットオブジェクトの情報内容を直接記憶し、購入可能な品物などの、電子的に記憶されないターゲットオブジェクトに関しては、ファイルは、ターゲットオブジェクトの識別説明を含有する。テキストファイルとして電子的に記憶されるターゲットオブジェクトは、市販の新聞記事、出版文書、手紙、ユーザが作成した文書、物理的オブジェクトの説明、またはこれらの種類のデータの組み合わせを含み得る。情報を含むファイルの編成および同じタイプの概念のファイルに含まれるデータのネーティブフォーマットは、情報サーバＩ₁〜Ｉ_mによって異なり得る。従って、ユーザは、所望の情報を含むファイルを捜し出すことが困難であり得る。その理由は、情報サーバカタログ化によって、ユーザがそれらのファイルを捜し出すことが可能とはなり得ないファイルに、情報が含まれているかもしれないからである。さらに、全ての情報サーバＩ₁〜Ｉ_mによって提供される存在およびサービスを規定する標準カタログは存在しない。従って、ユーザは、情報への簡単なアクセスは有さず、このシステム上で生成され蓄積された過剰な情報からユーザに関連し得る情報のセグメントを抜粋するために多大な時間と労力を費やさなければならない。たとえユーザが必要な資源をこのタスクに捧げたとしても、現存の情報を取り出すプロセスは、ユーザが所望の情報を得ることを確実にする正確さおよび効率に欠けている。この電子媒体システムの構成体内で、所望のオブジェクトのカスタム化電子識別システムの３つのモジュールが、たとえ様々なモジュールが、電子媒体システム上、および／または電子媒体システム内の異なるベンダによって実行されていても、配信形態で実行され得る。例えば、情報サーバＩ₁〜Ｉ_mが、ターゲットプロファイル生成モジュールを含有し得る一方で、ネットワークベンダＶ₁〜Ｖ_kは、ユーザプロファイル生成モジュール、ターゲットプロファイル関心サマリ生成モジュール、および／またはプロファイル処理モジュールを実行し得る。モジュール自体は、多数のノードがネットワークＮ中に存在し、各ノードが特定の地理的地域のユーザ集団に仕える状態で、配信形態で実行され得る。これらのノードの全体性が、特定のモジュールの機能性を構成する。モジュールおよびそれらの機能の様々な他のパーティションが可能であり、本明細書中に提供される例は、例示的な実施例を表し、請求の範囲に記載されている発明の範囲を限定する意図はない。仮名の作成およびユーザのターゲットプロファイル関心サマリの更新（以下に記載されるような）のために、ベンダＶ₁ 〜Ｖ_kは、進行中の仮名アクセスのための機構および本明細書中に記載される方法によるプロファイル構築を提供する、ある数の代理サーバで増大され得る。少なくとも１つの信頼のある妥当性検査サーバが、システム中の仮名の作成を管理するために適所に存在しなければならない。所望のオブジェクトのカスタム化電子識別システムの重要な特徴は、その応答性である。その理由は、このシステムの所期の使用が、対話式モードにあるからである。システムのユーティリティは、ユーザの数と共に増加し、それによって、ユーザとターゲットオブジェクトとの間のあり得る消費者／製品関係の数が増加する。大きなユーザグループに応対するシステムは、対話式の性能を維持しなければならず、ターゲットオブジェクトおよびユーザをプロファイルおよびクラスタ化するための開示の方法が、次に、ユーザのターゲットプロファイル関心サマリに基づいて、仮想コミュニティのメンバーの間で、データ通信ネットワークを通したデータの配布を最適化するために使用され得る。ネットワーク要素およびシステムの特徴図１に図示されるようなデータ通信ネットワークＮによって相互接続される様々なプロセッサは、図２に図示されるように、２つの種類に分けられ、グループ化される（すなわち、クライアントおよびサーバ）。クライアントＣ１〜Ｃｎは、データ通信リンクを介して様々な時点でサーバＳ１〜Ｓ５に接続される個々のユーザのコンピュータシステムである。各クライアントＣｉは、典型的には、単一のサーバＳｊに関連するが、これらの関連性は、経時変化し得る。クライアントＣ１〜Ｃｎは、ユーザにインターフェースし、且つサーバに対してファイルを作成し、サーバからファイルを取り出す。クライアントＣ１〜Ｃｎは、典型的には、一人のユーザに応対し、多くの位置のどこででもデータ通信ネットワークＮに接続され得る、ラップトップコンピュータ等の可動システムであり得るので、連続的にオンラインにいるとは限らない。クライアントはまた、ユーザが自分自身をパスワードまたはスマートカードを用いて識別させる、多くのユーザにカスタム化された情報へのアクセス並びにターゲット広告を提供するコンピュータおよびキオスク等の様々な他のコンピュータであり得る。サーバＳｉは、連続的にオンラインと仮定され、ローカルクライアントＣ１〜Ｃｎによるアクセスのために、データ通信ネットワークＮ上の様々なソースからファイルを集め、遠隔地のクライアントによるアクセスのために、ローカルクライアントＣ１〜Ｃｎからファイルを集めるように機能するコンピュータシステムである。サーバＳｉは、磁気ディスクデータ記憶媒体等の永続的記憶装置を備え、データ通信リンクを介して他のサーバに相互接続される。データ通信リンクは、任意のトポロジーおよびアーキテクチャを有し得、本明細書中では、簡易化の目的で、二地点間リンク、あるいは、より正確には、仮想二地点間リンクとして記載される。サーバＳ１〜Ｓ５は、図１のネットワークベンダＶ１〜Ｖｋ並びに情報サーバＩ₁〜Ｉ_mを含み、これらの２種類のモジュールによって行われる機能が、単一のサーバＳｉにおいて、より大きな範囲あるいはより小さな範囲にマージされ、データ通信ネットワークＮの多数のサーバに配布され得る。本発明の好適な実施形態の説明を始める前に、多数の用語を定義する。図３は、ブロック図の形態で、複数のサーバＡ〜Ｄ（各サーバは、少なくとも１つの他のサーバと相互接続され、典型的には、複数のクライアントｐ〜ｓにも相互接続される）に関する任意に選択されたネットワークトポロジーの表示である。サーバＡ〜Ｄは、二地点間データ通信リンクの集まりによって相互接続され、サーバＡは、クライアントｒに接続され、サーバＢは、クライアントｐ〜ｑに接続され、サーバＤは、クライアントｓに接続される。サーバは、暗号化された、または暗号化されていないメッセージをサーバ間で送信し、メッセージは、典型的には、ある特定のファイルに記憶された文字および／またはグラフィック情報を含み、このファイルのタイプおよび起源、メッセージを受けることになっているサーバの名前、およびファイルの内容が送信されている目的を説明するデータも含有する。あるメッセージは、どのようなファイルとも関連しないが、制御的理由で、例えば、ファイルの送信をリクエストする、または新しいファイルの可用性を公表するために、あるサーバによって別のサーバへと送られる。メッセージは、サーバＡが、サーバＣまたはサーバＢおよびＣのどちらかのリレーノードを介して、メッセージをサーバＤに送信する場合と同様に、あるサーバから別のサーバへと転送され得る。一般的には、ネットワーク中に複数のパス（各バスは、ネットワークＮがトラフィックルーティングを最適化することを可能とするための性能能力およびコストによって特徴づけられる）を有することが望ましい。代理サーバおよび仮名トランザクションターゲットプロファイル関心サマリを用いる方法が、ターゲットオブジェクトプロバイダおよびユーザの両方に多くの利点を与える一方で、システムが、自由に使用され、且つプライバシーの侵害を懸念することなくユーザによって阻止されずに使用されるためには、ユーザおよびプロバイダの両方にとって、解決されなければならない重要なプライバシーの問題が存在する。ユーザが、全部ではないとしても、ユーザプロファイルおよびターゲットプロファイル関心サマリにおけるユーザ特異的情報のいくつかが機密性を維持し、特定のタイプのトランザクションに関連する特定の状況下において、および購入および明示された関心に関する異なるレベルの機密性に対する個人の願望に従ってのみ開示されることを望む傾向がある。しかし、ユーザトランザクションおよびプロファイルサマリ情報の完全なプライバシーおよび非アクセス可能性によって、所望のオブジェクトのカスタム化電子識別システムの実行が妨げられ、ユーザ特異的情報のシステムの使用を通して得られる利点の多くを、ユーザから奪う。多くの場合、完全および全面的なプライバシーが、あるトランザクションに対する全てのパーティによって望まれるわけではない。例えば、買い手は、彼または彼女の関心に関連する製品を記載する特定のメールに対してのみターゲットにされることを望むかもしれず、売り手は、売り手が提供する商品およびサービスに関心があると予想されたユーザをターゲットにすることを望むかもしれない。実際、本明細書中に記載される技術の有用性は、多くのユーザおよび多くのターゲットオブジェクトに関するデータを集め、比較するシステムの能力次第で決まる。ユーザ検索プロファイルまたはターゲットプロファイル関心サマリの完全なユーザ仮名性と完全な公の開示との間の妥協が、仮名である。仮名は、サービスプロバイダがユーザと通信し、経時的にユーザの好みに関するレコードを集めて蓄積することを可能とし、同時に、ユーザの現実のアイデンティティに関して無知でいることによって、ユーザが、自分達の購入または好みを秘密にしておくことが可能である人為現象である。仮名システムの第２の、同様に重要な必要条件は、ある特定の仮名によって表されるユーザが特定の属性を有することを保証するために使用されるデジタルクリデンシャルを提供することである。これらのクリデンシャルは、所望のオブジェクトのカスタム化電子識別システムを用いて行われた活動およびトランザクションの結果に基づいて、あるいは現システムのネットワークＮ上で行われた他の活動およびトランザクションに基づいて、またネットワークＮの外のユーザの活動に基づいて認可され得る。例えば、サービスプロバイダは、ユーザとの取引きに同意する前に、購入者が、彼／彼女の銀行預金に十分な資金を持つという証明（これは、ネットワーク上にはおそらくないかもしれない）を必要とし得る。従って、ユーザは、サービスプロバイダに、銀行からの資金の証明（クリデンシャル）を提供しなければならないが、それでもサービスプロバイダにはユーザの現実のアイデンティティを明らかにしてはいない。本方法は、上記の問題を、「A secure and privacy-protecting protocol for transmitting personal information between organizations」というタイトルの論文においてD．ChaumおよびJ．H．Evertseによって教示される仮名認可およびクリデンシャル転送方法を、ネットワークＮ中に分散された１つ以上の代理サーバセットの実現と組み合わせることによって解決する。各代理サーバ（例えば図２におけるＳ２）は、クライアントおよびネットワーク中の他のサーバＳ５と、直接または「Untraceable Electronic Mail、Return Addresses、and Digital Pseudonyms」というタイトルのD．Chaumによる論文（Communications of the A CMの24巻、No．2、1981年2月出版）に詳述されるような仮名混合パスを通して通信するサーバである。ネットワークＮ中のサーバはどれでも、他の機能に加えて代理サーバとして機能するように構成され得る。各代理サーバは、あるユーザの組にサービスを提供し、この組は、該代理サーバの「ユーザベース」と呼ばれる。ある代理サーバは、そのユーザベースにおける各ユーザＵに対して３種類のサービスを以下のように提供する：１．代理サーバの第１の機能は、ユーザＵと、情報サーバ（代理サーバ自体を含み得る）および／または他のユーザ等の他のエンティティとの間の通信を双方向的に送信することである。具体的には、Ｓが、ユーザＵのクライアントプロセッサに直接関連するサーバを表すとすると、サーバＳおよびユーザＵのアイデンティティを隠す仮名混合パス（この場合、代理サーバは、安全な仮名によってのみユーザＵを知っている）を通して、そうでなければ、従来の仮想二地点間接続（この場合、代理サーバは、サーバＳにおけるユーザＵのアドレスによってユーザＵを知っており、このアドレスは、ユーザＵにとって安全ではない仮名とみなされ得る）を通して、代理サーバは、サーバＳ（および従ってユーザＵ）と通信する。２．代理サーバの第２の機能は、ユーザＵに関連するユーザ特異的情報を記録することである。このユーザ特異的情報は、ユーザＵに関するユーザプロファイルおよびターゲットプロファイル関心サマリ、並びに以下に説明されるような、ユーザＵによって指定されるアクセス制御命令のリスト、およびユーザＵの現実のアイデンティティを知ることなくユーザＵにメッセージを送るために使用され得る、ユーザＵによって提供される１回限りの返信アドレスのセットを含む。このユーザ特異的情報の全てが、代理サーバ上の、ユーザＵの仮名（安全または非安全にかかわらず）によって鍵をかけられるデータベースに記憶される。３．代理サーバの第３の機能は、ユーザＵにアドレスされた応答不要の通信のための選択的転送エージェントとして機能することである。代理サーバは、ユーザＵによって指定されたアクセス制御命令に基づいて、そのような通信のいくつかをユーザＵに転送し、その他の通信を拒絶する。組み合わせられた本方法によって、あるユーザが、彼または彼女が仮名のままでいることを望む全てのトランザクションにおいて１つの仮名を使用する、あるいは異なるタイプのトランザクションに対して異なる仮名を使用することが可能となる。後者の場合、各サービスプロバイダは、ユーザの異なる仮名の下でそのユーザと取り引きするかもしれない。より一般的には、サービスプロバイダの連合（これらのプロバイダは全て、ユーザを同じジャンルのターゲットオブジェクトに適合させる）が、共通の仮名を使用してユーザと取り引きすることに同意し得、それによって、その仮名に関連するターゲットプロファイル関心サマリが、該ジャンルのターゲットオブジェクトに対して完成する。異なるサービスプロバイダの連合と取り引きするために、ユーザが、数個の仮名を用いると、ユーザは、各仮名に奉仕する代理サーバを自由に選択し得、これらの代理サーバは、同一あるいは異なっていてもよい。サービスプロバイダの観点から、本システムは、あるサービスのユーザが、使用されたサービスに対して合法的な権利を有し、同一のプロバイダと通信するために複数の仮名を使用しているユーザがいないことを保証し得る点で、安全を提供する。仮名のこの固有性は、ある個人のために集められたトランザクション情報が、あるサービスプロバイダまたはサービスプロバイダの連合に対して、１人のユーザの活動の完全かつ一貫した状況を表さなければならず、そうでなければ、ユーザのターゲットプロファイル関心サマリおよびユーザプロファイルが、ユーザの関心を、他のパーティに対して可能な限り完全かつ正確に表すことができないので、この応用の目的上重要である。サービスプロバイダは、以前に同意されたサービスの約定に違反するユーザからの防衛手段を有していなければならない。例えば、ある仮名を使用するユーザが、サービス約定に違反する活動に従事する場合には、サービスプロバイダは、ユーザに対して、ユーザサービスを拒否する、およびユーザが詐欺行為を働きたくなり得る他のパーティとのトランザクションからユーザをブラックリストに載せる等の行動を起こすことが可能であるべきである。この種の状況は、ユーザが、違法行為のためにサービスプロバイダを雇う、またはサービスプロバイダに対する支払いを不履行する場合に生じ得る。本明細書中に援用される、「Security without identification: Transaction systems to make Big-Brother obsolet e」というタイトルの論文（Communications of the ACMに発表、28(10)、1985年 10月、1030〜1044頁）の方法は、この種の行為に対して、レゾリューションクリデンシャル（これらは、ユーザと、情報プロバイダおよびネットワークベンダエンティティとの間で同意されたサービス約定（例えば、与えられたサービスに対する定期的な支払い、民事処理など）に一致した行為次第で決定される、個人に周期的に提供されるクリデンシャルである）の使用によって保護を実施するための手段を提供する。ユーザの安全のために、レゾリューションクリデンシャルの発行者が、このレゾリューションクリデンシャルをユーザに認可することを拒否すると、この拒否は、決定を下す第３者に訴えられ得る。代理サーバに保存されたユーザプロファイルおよびターゲットプロファイル関心サマリの完全性が重要である。売り手が、このようなユーザ特異的情報に依存して、販売促進的提供または他の物を特定の種類のユーザに届け、他のユーザには届けない場合には、ユーザ特異的情報は、正確でなければならず、どのようにも不正変更されていてはならない。同様に、ユーザは、他のパーティが、ユーザのユーザプロファイルおよびターゲットプロファイル関心サマリを不正に変更しないことを確実にすることを望むかもしれない。なぜなら、そのような変更が、ユーザに最も適切なターゲットオブジェクトを適合させるシステムの能力を低下させ得るからである。これは、ユーザによって代理サーバに送られる制御メッセージにデジタル署名を付けることを、ユーザに提供することによって行われる。各仮名は、公開暗号鍵および秘密暗号鍵と組にされ、秘密鍵は、その仮名を持っているユーザのみに知られており、ユーザが、ある仮名で、制御メッセージを代理サーバに送ると、代理サーバは、仮名の公開鍵を用いて、そのメッセージが、仮名の秘密鍵を知るものによってデジタル署名されたことを検証する。これによって、他のパーティが、ユーザのふりをすることが防止される。本出願に開示されるように、本アプローチは、米国特許第5,245,656号に教示されるようなネットワーク加入者のためのプライバシー保護の仮名の従来技術（この特許は、サービスプロバイダとユーザとの間の仲介者として機能するネーム翻訳プログラムステーションを提供する）に対する向上を提供する。しかし、米国特許第5,245,656号は、エンドユーザＵとサービスプロバイダとの間で送信される情報が、二重に暗号化されることを提供するが、ユーザＵとサービスプロバイダとの間に関係が存在するという事実を、ネーム翻訳プログラムは知っており、例えば、サービスプロバイダが、ユーザＵの仲間（peer）によって許容可能であると判断されない内容の規定を専門とする場合には、この事実は、ユーザＵと譲歩を行うために使用され得る。米国特許第5,245,656号の方法は、本出願に提供されるような、仮名のユーザプロファイル情報の便利な更新方法も省略しており、また本出願に提供されるような、証明書発行エージェントからの、仮名の固有で、証明書を発行された登録の保証を提供せず、プロファイル情報および以下に説明されるような条件付きアクセスに基づく、ユーザへのアクセス制御手段を提供しない。Loebらによって記載される方法もまた、特定のターゲットオブジェクト（例えば、購読料金を支払った場合のみに利用可能であることを意図したターゲットオブジェクト、または若いユーザには利用不可能であることを意図したターゲットオブジェクト等）にアクセスするユーザの権利を認証するために使用され得るような、クリデンシャルに対する規定を全く記載していない。代理サーバの説明ユーザのユーザプロファイルおよびターゲットプロファイル関心サマリにおける情報のいくつか、あるいは全てが、ユーザの現実のアイデンティティとは分離したままでいることを、ユーザが確実にし得るためには、ユーザは、図２のデータ通信ネットワークＮ上で利用可能な多数の代理サーバのいずれか１つ（例えばサーバＳ２）を、仲介者として利用する。代理サーバは、ユーザの現実のアイデンティティを、データ通信ネットワークＮ上の他のパーティから隠すように機能する。代理サーバは、単一のネットワークベンダおよび情報サーバ、またはその連合のどちらかに対して、あるユーザを代理する。代理サーバ（例えばＳ２）は、ＣＰＵ、主メモリ、二次ディスク記憶装置およびネットワーク通信機能を有し、特定の仮名Ｐに関連するターゲットプロファイル関心サマリおよびアクセス制御命令を取り出すデータベース機能を有するサーバコンピュータであり、これは、特定のユーザＵを代理し、コマンド、ターゲットオブジェクト、およびあるクライアント（例えばＣ３）のユーザと、ネットワークベンダＶ１〜Ｖｋおよび情報サーバＩ１〜Ｉｍ等の他のネットワークエンティティとの間の課金情報の双方向ルーティングを行う。各代理サーバは、仮名データベースＤにおける各割り当てられた仮名に関連する暗号化されたターゲットプロファイル関心サマリを維持する。実際のユーザ特異的情報および関連の仮名は、代理サーバ上で局所的に格納される必要はないが、代替的に、配信様式で格納され得、二地点間接続を介して代理サーバから遠隔的にアドレシング可能であり得る。代理サーバは、２種類の双方向接続、すなわち「Untraceable Electronic Mai l、Return Addresses、and Digital Pseudonyms」（Communications of the ACM 、24巻、No．2、1981年2月）というタイトルの論文においてD．Chaumによって教示されるような二地点間接続および混合パスによる仮名接続を支持する。代理サーバと情報サーバとの間の通常の接続（例えば、図２における代理サーバＳ２と情報サーバS４との間の接続）は、本出願の「電子媒体システムアーキテクチャ」のセクションに説明されるように、ネットワークＮによって提供される二地点間接続プロトコルによって達成される。通常のタイプの二地点間接続は、例えばＳ２とＳ４との間で使用され得る。なぜなら、ユーザと仮名との分離は、クライアントＣ３と、ユーザによって使用される仮名が利用可能である代理サーバＳ２との間でのみ生じる必要があるからである。Ｓ４のような情報プロバイダが、代理サーバＳ２のある仮名Ｐと通信することを知っても、ユーザＵの現実のアイデンティティは危険にさらされない。ユーザと代理サーバＳ２との間の双方向接続は、通常の二地点間接続でもよいが、ユーザが望むならば、代わりに、「Untraceabl e Electronic Mail、Return Addresses、and Digital Pseudonyms」（Communica tions of the ACM、24巻、No．2、1981年2月）というタイトルの論文にD．Chaum によって教示されるような匿名混合プロトコルを一貫して使用することになるものの、匿名および安全にされ得る。この混合プロシージャにより、「ミックス」と呼ばれる転送および復帰ルーティングサーバのセットを用いて、ブラインド戻りアドレスを有するパーティ間で、トレース不可能で安全な仮名メールが提供される。Chaumの論文に教示されるような混合ルーティングプロトコルは、代理サーバＳ２と共に使用され、それによって、ユーザＵ以外のユーザ、情報プロバイダＩ１〜Ｉｍ，ベンダＶ１〜Ｖｋ、および継続的に代理サーバのユーザベースのユーザと通信する他の代理サーバによって用いられ得る、永続的に安全な仮名の登録が提供される。この混合パスプロトコルによって提供される安全が、与えられ、仮名を有する者の現実のアイデンティティを突き止めようと試みる悪意のあるパーティによって使用され得るトラフィック分析攻撃（traffic analysis att ack）および他の公知の分析形態に対して抵抗性を持つ。プロトコルを破るには、多数のパーティが、悪意を持って共謀する、または暗号を妥協して解決する必要がある。さらに、ユーザが、メッセージ中に戻りパス定義を入れ、それによって、情報サーバＳ４がリクエストされた情報をユーザのクライアントプロセッサＣ３に戻し得る、この方法に対する拡張が教示される。我々は、この特徴を新規な様式で利用し、それによって、ユーザの下でのアクセスおよび到達可能性（re achability）制御および代理サーバ制御が提供される。固有の仮名の検証および割り当て「A secure and privacy-protecting protocol for transmitting personal i nformation between organizations」というタイトルのD．ChaumおよびJ．H．Ev ertseによる刊行物に記載されるような、Chaumの仮名およびクリデンシャル発行システムは、我々のシステムにおいてコンポーネントとして使用するための望ましい属性を幾つか有する。このシステムは、個人が、異なる組織（銀行およびサービスプロバイダの連合など）に対して異なる仮名を使用することを可能とする。ある仮名を提示された組織は、その個人に関する情報として、仮名自体と、その仮名の下で以前に行われたトランザクションの記録のみを有する。さらに、組織が喜んで認証する仮名に関する事実を示すクリデンシャルが、ある特定の仮名に認可され、同一のユーザが使用する他の仮名に譲渡され得る。例えば、ユーザは、異なる組織（または組織の分離した組）に対して異なる仮名を使用し得るが、やはり、１つの仮名の下で１つの組織によって認可されたクリデンシャルを提示する。それは、別の仮名の下で別の組織と、２つの仮名が同一のユーザに対応することを明らかにすることなく取り引きするためである。クリデンシャルは、仮名を有する者の年齢、財政的地位、および法的地位等に関する保証を提供するために認可され得る。例えば、「法上の成人」（"legal adult"）を示すクリデンシャルが、該当するユーザに関して知られている情報に基づいて、その特定の発行機関によって、仮名に発行され得る。次に、クリデンシャルが、別の分離した組織に対して該ユーザを表す別の仮名に譲渡（transfer）されると、その他の仮名に対してこのクリデンシャルを提示することが、法上の成人の証拠としてみなされ得、これは、サービスの契約条件を満たし得る。クリデンシャル発行組織は、ユーザの人口統計的プロファイルまたはターゲットプロファイル関心サマリに関する特定の事実を、例えば、「この仮名を有する者が、博識である、あるいは中高年者で大企業に勤めている」ことを主張するクリデンシャルを認可することによって認証し得る。このクリデンシャルを別のエンティティに提示することによって、ユーザは、ユーザの個人データを該エンティティに明らかにすることなく、例えば割り引きに対する有資格を証明し得る。さらに、Chaumによって教示される方法は、１つを越える仮名を使用して、ある組織または組織の連合と通信し得る個人がいないこと；クリデンシャルが、ユーザによって実行可能に偽造され得ないこと；およびクリデンシャルが、あるユーザの仮名から異なるユーザの仮名に譲渡され得ないことの保証を提供する。最後に、この方法は、クリデンシャルの失効を提供し、延長されたサービス約定に従って行動しない個人に対して「黒星」("black mark")の発行を提供する。これは、Chaumの著作に記載されるように、レゾリューションクリデンシャルメカニズムを用いて行われ、ここでは、レゾリューションが、良好な信用状態にある仮名に対して組織によって周期的に発行される。ユーザが、このレゾリューションクリデンシャルを、特定の組織または組織の連合によって発行されなければ、このユーザは、彼が他の組織に対して使用する他の仮名に譲渡されるようにクリデンシャルを利用可能にすることはできない。従って、ユーザは、これらの他の組織に対して、彼が、他の取り引きにおいてサービス約定に従って行動したことを納得させることはできない。このような場合には、組織は、レゾリューションクリデンシャルのこの欠如を使って、ユーザが、他の取り引きにおいて良好な信用状態にいないことを推測し得る。あるアプローチにおいては、組織（または他のユーザ）が、ユーザとのトランザクション（または交流）の経験に基づいて、履歴書における推薦状と同様に作用し得る、品質に関連したクリデンシャルリストを発行し得る。このようなクリデンシャルが、複数の組織から発行されれば、それらの評価が平均される。代替のバリエーションにおいては、組織が、顧客などのユーザからクリデンシャルを発行され得、これは、他の未来のユーザに対して、様々な判定基準に基づいて後続のユーザによって予期され得るサービスの質を示すために使用され得る。我々の方法では、仮名は、２つのフィールドから構成されるデータレコードである。第１のフィールドは、仮名が登録される代理サーバのアドレスを指定する。第２のフィールドは、特定のユーザに関連する固有のビット列（例えば、あるランダムな二進数）を含み、クリデンシャルは、この数字で計算された公開鍵デジタル署名の形態をとり、数字自体は、図２に図示され、「A secure and priva cy-protecting protocol for transmitting personal information between org anizations」というタイトルのD．ChaumおよびJ．H．Evertseによる論文において、一般的形態で詳述されるような仮名管理サーバＺによって発行される。ある仮名を持っているユーザに情報を送ることが可能であり、これは、この情報を、その仮名を指定し、仮名の第１のフィールドに指名される代理サーバにアドレスされる制御メッセージに包むことによって行われる。代理サーバは、制御メッセージを受け取ると、この情報をユーザに転送し得る。ユーザが、全てのトランザクションに対して単一の仮名を使用し得るが、より一般的なケースでは、ユーザは、数個の仮名のセットを有し、各仮名は、単一のプロバイダまたはサービスプロバイダの連合との彼または彼女の交流において、ユーザを表す。仮名セットの各仮名は、関連するサービスプロバイダの異なる連合とのトランザクションに指定され、１つのプロバイダまたはプロバイダの連合に使用された仮名は、プロバイダの他の分離した連合に使用された仮名に関連されることはできない。ある連合とのユーザの全トランザクションは、同一の仮名の下で行われるという事実によって関連され得、従って、ユーザプロファイルおよびターゲットプロファイル関心サマリの形態で、該連合によって提供される１つまたは複数のサービスに関するユーザの関心の統一された実態を定義するために組み合わせられ得る。仮名の使用が有用であり得る他の状況が存在し、本明細書は、請求の範囲に記載されている発明の範囲を限定する意図は決してなく、例えば、上記の高速プロファイリングツリーが、ユーザがデリケートであるとみなすユーザに関する情報（例えば、保険会社、医学専門家、家族カウンセラー、デートサービス等のエンティティに関心のある情報）を仮名で獲得するために使用され得る。詳細なプロトコル我々のシステムにおいては、ユーザＵが対話する組織は、ネットワークＮ上のサーバＳ１〜Ｓｎである。しかし、各サーバに直接対応するのではなく、ユーザは、ユーザ自身のクライアントのローカルサーバと、情報プロバイダまたはネットワークベンダとの間の仲介者として、代理サーバ（例えばＳ２）を使用し得る。「Untraceable Electronic Mail、Return Addresses、and Digital Pseudonym s」というタイトルの論文（Communications of the ACMの24巻、No．2、1981年2 月出版）において、D．Chaumによって記載されるような混合パスにより、Ｃ３等のクライアントと、Ｓ２等の代理サーバとの間の追跡不可能性および安全性が得られる。Ｓ（Ｍ，Ｋ）が、「A method for obtaining digital signatures and public-key cryptosystems」というタイトルのRives、R．L.、Shamir、A.および Adleman、L.による論文（Comm．ACM 21、2月2日、120〜126頁に出版）に詳述されるような、鍵Ｋを用いたモジュラ累乗（modular exponentiation）による、メッセージＭのデジタル署名を表すと仮定する。一旦ユーザが、仮名Ｐを、サーバＺに申請し、サーバＺの秘密鍵ＳＫ_Zを用いて署名された、署名入り仮名が認可されると、以下のプロトコルが生じ、代理サーバＳ２のデータベースＤにおいてユーザＵのエントリが確立される。１．ユーザは、仮名の認証性および固有性を示すために、Ｚによって署名された仮名を、ここで代理サーバＳ２に送る。ユーザは、認可された仮名と共に使用するためのＰＫ_P，ＳＫ_P鍵ペアも作成し、ここでは、秘密鍵が、仮名に関連づけられ、ＰＫ_Pは、仮名に関連する公開鍵である。ユーザは、署名入り仮名Ｓ（Ｐ，ＳＫ_Z）を、Ｐによってインデックスを付けられる新しいデータベースエントリを作成するリクエストおよび公開鍵ＰＫ_P と共に、代理サーバＳ２に送ることによって、代理サーバＳ２に仮名Ｐを確立するためのリクエストを形成する。それは、メッセージを包み、仮名の返信用エンベロープヘッダと共に、仮名混合パスを通して代理サーバＳ２に送信する。２．代理サーバＳ２は、データベース作成エントリリクエストおよび関連の認定済みの仮名メッセージを受け取る。代理サーバＳ２は、リクエストされた仮名Ｐが、サーバＺによって署名されることを確実にするためにチェックをし、もしそうであれば、リクエストを認可し、仮名に対してデータベースエントリを作成し、そしてユーザの公開鍵ＰＫ_Pを格納し、それによって将来、ユーザＵのみが、仮名Ｐを用いてリクエストをすることが可能であることが確実となる。３．ユーザのデータベースエントリの構造は、仮名Ｐに対する関連の公開鍵と共に、本明細書中に詳述されるようなユーザプロファイル、本明細書中に詳述されるようなターゲットプロファイル関心サマリ、および以下に詳述されるようなアクセス制御基準のブール組み合わせから構成される。４．仮名Ｐのデータベースエントリが確立された後はいつでも、ユーザＵが、第３者によって提供される、該仮名に対するクリデンシャル（このクリデンシャルは、該仮名に関してある主張をする）を代理サーバＳ２に提供し得る。代理サーバは、それらのクリデンシャルを検証し、これらのクリデンシャルによって必要とされるような、ユーザプロファイルに対する適切な改変（例えば、ユーザの新しい人口統計的ステータスを成人として記録する）を行い得る。代理サーバは、これらのクリデンシャルを格納することもでき、その結果、ユーザに代わって、サービスプロバイダにこれらのクリデンシャルを提示し得る。ユーザＵが、プロバイダの新規および分離した連合に対して使用するための新しい仮名を必要とする度に、同一または異なる代理サーバによって上記の工程が繰り返され得る。実際には、Ｚによって行われる仮名作成プロセスのランダムな性質により、ある仮名がすでに割り当てられているかもしれない確率は非常に小さい。この非常にありそうもない事象が生じる場合には、代理サーバＳ２は、作成された仮名がすでに割り当てられていることを示し、新しい仮名が作成されることを依頼する署名入りメッセージでユーザに返答し得る。情報サーバの仮名制御一旦代理サーバＳ２が認証され、ユーザ仮名を登録すると、ユーザは、図２のサーバＳ４によって例示されるようなサービスプロバイダ等の他のネットワークエンティティと対話する際に、代理サーバＳ２のサービスの使用を開始し得、情報サービスプロバイダノードがネットワークに接続される。ユーザは、ユーザがネットワークＮ上で代理サーバＳ２に後で送信する、デジタル形式で符号化されたリクエストを生成することによって、代理サーバＳ２を制御する。代理サーバが、本出願に記載されるサービス（例えば、ブラウジング、照会、および以下に説明されるナビゲーション機能）のいずれにも使用され得るので、これらのリクエストの性質およびフォーマットは異なる。一般的なシナリオでは、ユーザが、仮名Ｐの下で、特定の情報プロバイダまたはアドレスＡのユーザと通信することを望む（ここでは、Ｐは、ユーザに割り当てられた仮名であり、Ａは、Ｓ４等のサーバの公開ネットワークアドレス、またはＳ４等の代理サーバに登録された別の仮名である）。（このシナリオの最も一般的なバージョンは、アドレスＡが、情報プロバイダのアドレスであり、ユーザは、情報プロバイダに関心のあるターゲットオブジェクトを送るようにリクエストしている。）ユーザは、アドレスＡにメッセージを送り、応答をユーザに転送し返すように代理サーバＳ２にリクエストするリクエストＲを、代理サーバＳ２に対して生成しなければならない。それによって、ユーザは、他のパーティ（アドレスＡが公開ネットワークアドレスである場合には非仮名パーティ、またはアドレスＡが、例えば仮名で動作することを好む会社または別のユーザが持つ仮名である場合には仮名パーティ）と通信し得る。別のシナリオにおいては、ユーザによって成される代理サーバＳ２へのリクエストＲが、異なる内容を有し得る。例えば、リクエストＲは、代理サーバＳ２に、本明細書中に後に説明される方法を用いて最も都合のよいサーバから、多くのサーバにマルチキャストされた特定の情報片を取り出し、この情報をユーザに送るように命令し得る。逆に、以下に説明されるように、リクエストＲは、代理サーバＳ２に、多くのサーバに対して、ユーザによって提供される新しいターゲットオブジェクトに関連するファイルをマルチキャストするように命令し得る。ユーザが、以下に説明される新聞の切り抜きサービスの加入者であれば、リクエストＲは、代理サーバＳ２に、新聞の切り抜きサービスがユーザの注目のために代理サーバＳ２に送った全てのターゲットオブジェクトをユーザに転送するように命令し得る。ユーザが、以下に説明されるアクティブナビゲーションサービスを使用していると、リクエストＲは、代理サーバＳ２に、階層クラスタツリーから特定のクラスタを選択し、そのサブクラスタのメニューをユーザに提供する、あるいは、ユーザのターゲットプロファイル関心サマリの代理サーバＳ２のレコードに一時的に影響を及ぼす照会を起動させるように命令し得る。ユーザが、以下に説明されるような仮想コミュニティのメンバーであれば、リクエストＲは、代理サーバＳ２に、仮想コミュニティに送られた全てのメッセージをユーザに転送することを命令し得る。リクエストＲの内容とは無関係に、クライアントＣ３のユーザは、ユーザのローカルサーバＳ１への接続を開始し、サーバＳ１に、リクエストＲを安全な混合パスに沿って代理サーバＳ２に送るように命令し、以下の一連の動作を開始し得る。１．ユーザのクライアントプロセッサＣ３は、署名入りメッセージＳ（Ｒ，ＳＫ_P）を作成し、これは、ユーザの仮名Ｐおよび（リクエストＲが応答を必要とする場合には）安全な一回限りの返信エンベロープセットとペアにされ、メッセージＭを形成する。これは、出力パスのための多重にエンベロープされたルートを用いて、メッセージＭを保護する。エンベロープされたルートは、Ｓ１と代理サーバＳ２との間の安全な通信を提供する。メッセージＭは、最も深くネスティングされたメッセージにエンベロープされ、従って、万一メッセージが盗聴者に傍受されたとしても、復元することが困難である。２．メッセージＭは、クライアントＣ３によって、ローカルサーバＳ１に送られ、次に、データ通信ネットワークＮによって、サーバＳ１から、出力エンベロープセットに指図されるようなミックスのセットを通して経路指定され、選択された代理サーバＳ２に到着する。３．代理サーバＳ２は、受け取ったメッセージＭを、リクエストメッセージＲ、仮名Ｐ，および（含まれていれば）返信用パスのためのエンベロープセットへと分離する。代理サーバＳ２は、仮名Ｐを使用して、代理サーバＳ２のデータベースの該当するレコードを索引して取り出し、このレコードは、代理サーバＳ２の局所記憶装置、またはネットワークＮを介して代理サーバＳ２にアクセス可能な他の分散した記憶媒体に格納される。このレコードは、公開鍵ＰＫ_P、ユーザ特異的情報、および仮名Ｐに関連するクリデンシャルを含む。代理サーバＳ２は、リクエストメッセージＲの署名されたバージョンＳ（Ｒ，ＳＫ_P）が有効であることをチェックするために公開鍵ＰＫ_Pを使う。４．リクエストメッセージＲの署名が有効であると仮定すると、代理サーバＳ２は、リクエストＲに従って行動する。例えば、上記の一般的なシナリオにおいて、リクエストメッセージＲは、埋め込まれたメッセージＭ１、およびメッセージＭ１が送られるべきアドレスＡを含み、この場合には、代理サーバＳ２は、アドレスＡにおいて指定されたサーバ（例えばサーバＳ４）にメッセージＭ１を送る。通信は、データ通信ネットワークＮによって提供される通常の二地点間接続上で、署名され、任意に暗号化されたメッセージを使用することによって行われる。埋め込まれたメッセージＭ１に従って行動するために必要であれば、サーバＳ４は、代理サーバＳ２からのユーザ特異的情報およびクリデンシャルのリリースを交渉するために、やはり通常の二地点間接続上で、署名され任意に暗号化されたさらなるメッセージを代理サーバＳ２と交換し得る、または交換させられ得る。特に、サーバＳ４は、ユーザが、リクエストされた情報に権利がある場合、例えば、ユーザが、特定の情報サービスに対して良好な信用状態にある加入者であり、ユーザが、成人向けの物を合法的に受け取るのに十分な年齢であり、ユーザが特定の割引を（ユーザの仮名に発行された特別割引クリデンシャルを用いて）提供された場合には、サーバＳ２にクリデンシャルを提供することを要求し得る。５．代理サーバＳ２は、メッセージをサーバＳ４に送り、サーバＳ４は、ユーザに送られるべきメッセージＭ１に対して応答Ｍ２を作成し、次に、通常のネットワーク二地点間接続を用いて、サーバＳ４は、応答Ｍ２を代理サーバＳ２に送信する。６．代理サーバＳ２は、応答Ｍ２を受け取ると、元のメッセージＭにおいてユーザによって代理サーバＳ２に以前に送信された返信エンベロープセットに埋め込まれた応答Ｍ２を含む返信メッセージＭｒを作成する。代理サーバＳ２は、返信メッセージＭｒを、この返信エンベロープセットによって指定された仮名混合パスに沿って送信し、その結果、応答Ｍ２がユーザのクライアントプロセッサＣ３のユーザに届く。７．応答Ｍ２は、情報サーバＳ４に対する電子的支払いのリクエストを含み得る。次に、ユーザは、メッセージＭ１に関して上に説明されたのと同じ手段によって送信されたメッセージＭ３を用いて応答し得、このメッセージＭ３は、ある形態の仮名の支払いを同封する。あるいは、代理サーバが、そのような支払いに自動的に応答し得、この支払いは、このユーザのために代理サーバによって維持されるアカウントから引き落とされる。８．情報サーバＳ４からユーザへの応答メッセージＭ２、または代理サーバＳ２からユーザへ送られる後続のメッセージが、ユーザのリクエストに関連する、および／またはユーザがターゲットにされた広告物を含有し得る。典型的には、ユーザが、ターゲットオブジェクトＸを取り出したところだとすると、（ａ）代理サーバＳ２または情報サーバＳ４が、ターゲットオブジェクトＸに「関連」する重み付けられた広告のセットを決定し、（ｂ）このセットのサブセットがランダムに選ばれ（ここでは、ある広告に付けられた重みが、それがサブセットに含まれる確率に比例する）、および（ｃ）代理サーバＳ２は、このサブセットから、ユーザが最も関心のありそうな広告をだけを選択する。代理サーバＳ２が、ターゲットオブジェクトＸに関連する広告のセットを決定するバリエーションにおいては、典型的には、このセットは、代理サーバの所有者が宣伝のために支払いをうけた全ての広告を含み、そのターゲットプロファイルは、ターゲットオブジェクトＸのターゲットプロファイルのしきい値類似距離内にある。代理サーバＳ４が、ターゲットオブジェクトＸに関連する広告のセットを決定するバリエーションにおいては、広告主は、典型的には、このセットに広告を入れる権利を購入する。どちらの場合も、広告の重みは、広告主が支払いを認める額によって決定される。ステップ（ｃ）に続いて、代理サーバＳ２は、選択された広告物を取り出し、それを、ユーザのクライアントプロセッサＣ３に送信し、そこでは、受け取られてから指定の時間内に、ユーザのクライアントプロセッサＣ３で実行される信用のあるプロセスを用いて、その広告物がユーザに表示される。代理サーバＳ２が、広告を送信すると、代理サーバＳ２は、広告が、特定の予想された水準の関心を持つユーザに送信されたことを示すメッセージを広告主に送る。メッセージは、ターゲットオブジェクトＸのアイデンティティも示し得る。代わりに、広告主は、電子的支払いを代理サーバＳ２に送信し得、代理サーバＳ２は、自らサービス料金を保持し、サービス料金を情報サーバＳ４に任意に転送し、差額をユーザに転送する、あるいは差額を用いて、代理サーバにおけるユーザの口座に入金する。９．応答Ｍ２が、ターゲットオブジェクトを含むまたは識別すると、ユーザがこのオブジェクトに関して提供する受動および／または能動的関連性フィードバックが、ユーザのクライアントプロセッサＣ３のプロセスによって作表される。独自の秘密鍵ＳＫ_C3を用いてクライアントプロセッサＣ３によってデジタル署名されるこのような関連性フィードバック情報のサマリは、安全な混合パスを通して、代理サーバＳ２に周期的に送信され、その結果、サマリメッセージの署名が、対応する公開鍵ＰＫ_C3（統合性を有することが保証される全ての作表プロセスに利用可能である）を用いて認証され得るならば、サーバＳ２に常駐する検索プロファイル作成モジュール２０２が、仮名Ｐに関連する適切なターゲットプロファイル関心サマリを更新する。消費者が、特定の情報サーバとの財政的関係に、両者がその関係の約定に同意していることに基づいて入ると、前のセクションに詳述されたように、ある特定の仮名が、そのあるプロバイダに対する消費者のために拡張され得る。そのような関係に入ると、消費者およびサービスプロバイダは、ある約定に同意する。しかし、ユーザが、この関係の約定に違反すると、サービスプロバイダは、プロバイダがユーザと取り引きを行っている仮名に対して、サービスの提供を断り得る。さらに、サービスプロバイダは、その仮名に対してレゾリューションクリデンシャルの提供を拒否する遡及権を有し、その仮名を有する者が良好な信用状態に戻るまで、そうすることを選び得る。ターゲットオブジェクトの先取りある状況においては、ユーザは、１つまたは複数の情報サーバに格納された多くのファイルに順にアクセスすることをリクエストし得る。この行為は、World Wide Web等のハイパーテキストシステムをナビゲートする、または以下に説明されるターゲットオブジェクトブラウジングシステムを使用する時に一般的である。一般的に、ユーザは、特定のターゲットオブジェクトまたはターゲットオブジェクトのメニューへのアクセスをリクエストし、一旦該当するファイルが、ユーザのクライアントプロセッサに送信されると、ユーザはその内容を見て、別の同様のリクエストをし、以下同様である。各リクエストを満たすためには、取り出しおよび伝送遅延のために、何秒もかかり得る。しかし、リクエストのシーケンスが予測可能である点で、ユーザがリクエストする前でさえ、適切なファイルを取り出すまたは取り出し始めることによって、所望のオブジェクトのカスタム化電子識別システムが、各リクエストにより速く応答し得る。この早期の取り出しは、「ファイルの先取り」と呼ばれる。局所的に格納されたデータの先取りは、数十年間、ＣＰＵキャッシュおよび二次記憶装置（ディスク）を含むメモリ階層において重点的に研究されてきた。この分野のリーダーは、データベースおよびＣＰＵキャッシュの両方において、広範なトレースを用いた様々なスキームおよび分析機会を発見したA．J．Smith of Berkeleyである。彼の結論は、順次アクセスが、例えばデータの順次読み出しにおいて生じている妥当な可能性が存在した一般的なスキームが、唯一本当に成功したということである。メモリ階層における様々な待ち時間同士の差が、１９８０年代後半および１９９０年代前半に変化した際に、J．M．Smithおよび他の人々が、局所的に格納されたデータおよびネットワークデータ両方の先取りのさらなる機会を発見した。特に、Blahaによる研究におけるパターンのより深い分析により、先取りに使用され得る深いパターン分析のためにエキスパートシステムを使用する可能性が示された。J．M．Smithによる研究は、いくらかの履歴データが存在した記憶階層の参照を予想するために参照履歴ツリーを使用することを提唱した。Touchによる最近の研究およびBerkeleyの研究は、World-Wide Web 上のデータケース（ここでは、大型のイメージおよび長い待ち時間が、先取りに対する特別な動機を提供する）に取り組み、Touchの技術は、大きなバンド幅によって、ＷＥＢページに埋め込まれたＨＴＭＬ記憶参照を用いて、ある推測が可能となる時に先に送る（pre-send）ことであり、Berkeleyの研究は、ＨＴＭＬデータのセマンティクスを専門とするJ．M．Smithの参照履歴に類似した技術を用いる。先取りの成功は、ユーザの次の１つまたは複数の動作を予測するシステムの能力に左右される。所望のオブジェクトのカスタム化電子識別システムの状況においては、ユーザプロファイルの類似性に従って、ユーザをグループへとクラスタすることが可能である。次に、未来のユーザの行動を予測するために、過去のユーザの行動に関する集約統計を集めて利用する周知の先取り方法のいずれかが、ユーザの各クラスタに関する別個の統計セットを集めて利用するために実行され得る。このように、システムは、実質的に異なる関心を有するユーザ間で一般化されることなく、各ユーザから類似のユーザへのアクセスパターン統計を一般化する。システムはさらに、全てのユーザの集約行動を表す類似の統計セットを集め、利用し得る。システムが、ある特定のユーザが何をするかに関する予測を確信を持って行うことができない場合には（そのユーザのユーザクラスタに関する関連の統計が、ほんの小量のデータから得られることが理由で）、システムは、代わりに、より大量のデータから得られる全ユーザの集約統計に基づいて、予測を行い得る。具体的にするために、我々は、先取りシステムのある特定の具体化（これらの洞察を両方使用し、各潜在的先取りの予想されるコストおよび利点の正確な測定によって先取りの判断を行うシステム）を以下に説明する。先取りは、コストと利点とのトレードオフを示す。ｔを先取りファイルが、局所記憶装置に保持される（別の先取りファイルの余地を作るために消去される前の）おおよその時間（分）を表すとする。システムが、ターゲットオブジェクトＸに対応するファイルを先取りすることを選ぶと、ユーザは、ユーザがその後すぐにターゲットオブジェクトＸを明白にリクエストするという条件で、超過料金なしの高速の応答から利益を得る。しかし、ユーザが、先取りからｔ分以内にターゲットオブジェクトＸをリクエストしなければ、先取りの価値はなく、そのコストは、（直接的または非直接的に）ユーザが負わなければならない追加的コストである。従って、第１のシナリオは、無料で利点を提供するが、第２のシナリオは、利点なしでコストを招く。システムは、ユーザがとにかくアクセスするファイルのみを先取りすることによって第１のシナリオを支持しようとする。ユーザの望みに応じて、保守的（システムは、ユーザが明白にリクエストする可能性が非常に高いファイル（および取り出すのが比較的安価なファイル）のみを先取りすることによって、コストを制御する）、またはより積極的（システムは、ユーザが明白にリクエストをする可能性がただ中程度であるファイルも先取りし、それによって総コストおよび（より小さな程度に）ユーザに対する総利点を共に増加させる）に先取りし得る。本明細書中に記載されるシステムでは、ユーザＵのための先取りが、ユーザの代理サーバＳによって達成される。代理サーバＳが、ユーザがリクエストしたファイルＦを情報サーバから取り出すと、代理サーバＳは、以下に説明されるように、このファイルＦの身元およびユーザの特徴を使用して、ユーザがすぐにアクセスしそうな別のファイルＧ１．．．Ｇｋのグループを識別する。ファイルＦに対するユーザのリクエストは、ファイルＧ１．．．Ｇｋを「トリガ」すると言われる。代理サーバＳは、これらのトリガされたファイルＧｉの各々を以下のように先取りする：１．ファイルＧｉがすでに局所的に格納されていなければ（例えば、前の先取りが原因で）、代理サーバＳは、ファイルＧｉを適切な情報サーバから取り出し、それを局所的に格納する。２．代理サーバＳは、ファイルＧｉの局所コピーを、先取りされたばかりとしてタイムスタンプし、その結果、ファイルＧｉは、削除される前に最低約ｔ分の間、局所記憶装置に保持される。ユーザＵ（または原則として、代理サーバＳに登録した他のユーザはだれでも）が、先取りされたが、まだ削除されていないファイルを取りだすように代理サーバＳにリクエストすると、代理サーバＳは、別のサーバからではなく、局所記憶装置からファイルを取り出し得る。上記のステップ１〜２のバリエーションにおいては、代理サーバＳは、幾分異なるように、ファイルＧｉを先取りし、その結果、先取りされたファイルが、サーバＳではなくユーザのクライアントプロセッサｑに格納される。１．代理サーバＳが、過去のｔ分間に、ファイルＧｉを先取りしていなければ、ファイルＧｉを取り出し、それを、ユーザＵのクライアントプロセッサｑに送信する。２．ステップ１において送信されたメッセージを受け取ると、クライアントｑは、現在格納されていなければ、ファイルＧｉの局所コピーを格納する。３．代理サーバＳは、クライアントｑが、ファイルＧｉの局所コピーをタイムスタンプするべきことを、クライアントｑに通知し、もしあれば、この通知は、ステップ１で送信されたメッセージと組み合わせられ得る。４．ステップ３において送信されたメッセージを受け取ると、クライアントｑは、先取りされたばかりとして、ファイルＧｉの局所コピーにタイムスタンプし、その結果、ファイルＧｉは、削除される前に、最低約ｔ分間の間、局所記憶装置に保持される。クライアントｑが、ファイルＧｉを局所記憶装置に保持する期間中に、クライアントｑは、ファイルＧｉに対するいかなるリクエスト（ユーザＵによる、あるいは、原則的には、クライアントｑの他のいかなるユーザによる）に即座に、かつ代理サーバＳの援助なしに応答し得る。代理サーバＳにとって困難な仕事は、代理サーバＳが、リクエストに応じてファイルＦを取り出す度に、ファイルＦに対するリクエストによってトリガされ、即座に先取りされるべきファイルＧ１．．．Ｇｋを識別することである。代理サーバＳは、コスト−利点の分析を用いて、ユーザが決定したコストの倍数を利点が上回る先取りをそれぞれ行い、ユーザは、積極的先取りに関しては、乗数を低く設定し、あるいは、保守的な先取りに関しては、乗数を高く設定し得る。これらの先取りは、同時に行われ得る。ファイルＧｉを即座に先取りする利点は、Ｇｉが、あるとすれば後に取り出されるべく（後に行われる先取り、またはユーザのリクエストによって）そのままにしておかれる状況と比較して、そのような先取りによって省ける予想の秒数であると定義される。即座にファイルＧｉを先取りするコストは、例えば、サーバＳおよびファイルＧｉのネットワークの位置、および情報プロバイダの料金によって決定されるような、代理サーバＳがファイルＧｉを取り出すための予想されるコストに、現在まだ先取りされていない場合に、代理サーバＳが、ファイルＧｉをｔ分以内に取り出さなければならない（後の先取りあるいはユーザの明白なリクエストを満たすため）確率を１から引いたものを掛けたものであると定義される。上記のコストおよび利点の定義は、いくつかの魅力的な属性を有する。例えば、ユーザが、（例えば）ファイルＦ１またはファイルＦ２を、ファイルＦの後に取り出し、前者の場合のみファイルＧ１をその後取り出す傾向にあるとすると、システムは、一般的には、ファイルＦを取り出した後すぐにＧ１を先取りせず、その理由は、ユーザがファイルＦ２を取り出す可能性が高いという場合には、先取りのコストが高く、代わりに、ユーザがファイルＦ１を取り出す可能性が高いという場合は、先取りの利点が低いからである（なぜなら、ユーザがＦ１を選ぶまで待ち、その後になってのみＧ１を先取りすることによって、同じ時間、またはほぼ同じ時間をシステムが省くことができるからである）。代理サーバＳは、以下の規律を忠実に守ることによって、必要なコストおよび利点を評価し得る：１．代理サーバＳは、ユーザベースにおいて、ユーザプロファイルに従ってクラスタ化されたユーザの分離したクラスタのセットを維持する。２．代理サーバＳは、初期には空のセットＰＦＴの「先取りトリプル」＜Ｃ，Ｆ，Ｇ＞を維持する（ＦおよびＧはファイルであり、Ｃは、ユーザのクラスタまたは代理サーバＳのユーザベースにおける全てのユーザのセットを識別する）。セットＰＦＴにおける各先取りトリプルは、該トリプルに特異的な数個の記憶された値と関連づけられる。先取りトリプルおよびその関連の値は、３および４のルールに従って維持される。３．代理サーバＳのユーザベースにおけるユーザＵが、ファイルＧに対するリクエストＲ２、またはファイルＧをトリガするリクエストＲ２を行い、次に、代理サーバＳが、以下の動作を行う：ａ．Ｃを、ユーザＵを含むユーザクラスタとし、そして次にまたＣを、全ユーザのセットとする。ｂ．ファイル（例えばファイルＦ）に対するリクエストＲ０はどれでも、厳密にリクエストＲ２の前のｔ分間に、ユーザＵによって行われる。ｃ．トリプル＜Ｃ，Ｆ，Ｇ＞が、現在、セットＰＦＴのメンバーでなければ、０のカウント、０のトリガカウント、０のターゲットカウント、０の総利点、および値が現在の日付および時刻であるタイムスタンプを有するセットＰＦＴに加えられる。ｄ．トリプル＜Ｃ，Ｆ，Ｇ＞のカウントは、１つずつ増える。ｅ．ファイルＧが、厳密にリクエストＲ０とＲ２との間にユーザＵが行ったリクエストによってトリガされていない、または明白に取り出されていない場合には、トリプル＜Ｃ，Ｆ，Ｇ＞のターゲットカウントは、１つずつ増える。ｆ．リクエストＲ２が、ファイルＧに対するリクエストであれば、トリプル＜Ｃ，Ｆ，Ｇ＞の総利点は、リクエストＲ０とリクエストＲ２との間の経過時間分、あるいは、ファイルＧを取り出すための予想時間分（どちらか少ない方）だけ増加する。ｇ．リクエストＲ２が、ファイルＧに対するリクエストであり、Ｇが、厳密にリクエストＲ０とＲ２との間にユーザＵが行った１つ以上のリクエストによってトリガされた、または明白に取り出された場合（Ｒ１は、最も早い時期のそのようなリクエストを表す）には、トリプル＜Ｃ，Ｆ，Ｇ＞の総利点は、リクエストＲ１とリクエストＲ２との間の経過時間分、あるいは、ファイルＧを取り出すための予想時間分（どちらか少ない方）だけ減少する。４．ユーザＵが、ファイルＦをリクエストすると、トリガカウントは、トリプルがフォーム＜Ｃ，Ｆ，Ｇ＞を有するように、セットＰＦＴに現在ある各トリプルに対して１つずつインクリメントされる（ユーザＵは、セットまたはＣによって識別されたクラスタにいる）。５．トリプル＜Ｃ，Ｆ，Ｇ＞の「年齢」は、そのタイムスタンプと、現在の日付および時間との間の経過した日数であると定義される。トリプル＜Ｃ，Ｆ，Ｇ＞の年齢が、固定された一定の日数を越え、且つトリプルのカウントの固定された一定の倍数も越えると、トリプルは、セットＰＦＴから削除され得る。従って、代理サーバＳは、以下のように、どのファイルＧが、あるユーザＵからのあるファイルＦに対するリクエストによってトリガされるべきかを高速に決定し得る：１．Ｃ０を、ユーザＵを含むユーザクラスタとし、Ｃ１を、全ユーザのセットとする。２．サーバＳは、＜Ｃ０，Ｆ，Ｇ＞が、固定のしきい値を越えるカウントを持つセットＰＦＴに現れるように、全トリプル＜Ｃ０，Ｆ，Ｇ＞のリストＬを構築する。３．サーバＳは、＜Ｃ０，Ｆ，Ｇ＞が、リストＬに現れず、＜Ｃ１，Ｆ，Ｇ＞が、別の固定のしきい値を越えるカウントを持つセットＰＦＴに現れるように、リストＬに全トリプル＜Ｃ１，Ｆ，Ｇ＞を加える。４．各トリプル＜Ｃ，Ｆ，Ｇ＞は、リストＬにある。５．サーバＳは、＜Ｃ，Ｆ，Ｇ＞のトリガカウントによって＜Ｃ，Ｆ，Ｇ＞のターゲットカウントの商を１から引いたものを掛けて、ファイルＧをトリガするコストが、ファイルＧｉを取り出す予想コストかを計算する。６．サーバＳは、＜Ｃ，Ｆ，Ｇ＞のカウントによって除算して、ファイルＧをトリガする利点が、＜Ｃ，Ｆ，Ｇ＞の総利点かを計算する。７．最後に、先に説明されたように、代理サーバＳは、計算されたコストおよび利点を使用し、ファイルＧがトリガされるべきか否かを決定する。説明されたばかりの先取りに対するアプローチは、全データ記憶装置および代理サーバＳによる先取りの決定に関する操作が、代理サーバＳで局所的に取り扱われるという利点を有する。しかし、この「ユーザを基準とした」アプローチは、代理サーバ間の重複した格納および労力、並びに各個々の代理サーバにおける不完全なデータの原因となる。すなわち、ファイルＦの次にどのファイルが頻繁に取り出されるかを示す情報が、多数の代理サーバにわたって系統だてられずに分散される。代替の、「ファイルを基準とした」アプローチは、そのような情報を全て、ファイルＦ自体を用いて格納することである。その差は以下の通りである。ユーザを基準としたアプローチにおいては、サーバＳのセットＰＦＴにおける先取りトリプル＜Ｃ，Ｆ，Ｇ＞は、ネットワーク上のあらゆるファイルＦおよびあらゆるファイルＧに言及し得るが、サーバＳのユーザベースのサブセットであるクラスタＣに限定される。対照的に、ファイルを基準としたアプローチでは、サーバＳのセットＰＦＴの先取りトリプル＜Ｃ，Ｆ，Ｇ＞は、ネットワーク上のあらゆるユーザクラスタＣおよびあらゆるファイルＧを言及し得るが、サーバＳに格納されるファイルＦに限定される。（ファイルを基準としたアプローチでは、ユーザのクラスタ化がネットワーク全体にわたり、ユーザクラスタは、異なる代理サーバからのユーザを含み得ることに注目されたい。）代理サーバＳ２が、ユーザＵのためにファイルＦを取り出すリクエストをサーバＳに送ると、サーバＳ２は、このメッセージにおいて、ユーザＵのユーザクラスタＣ０、並びにコスト−利点分析に使用されるユーザが決定した乗数のユーザＵの値を示す。サーバＳは、＜Ｃ０，Ｆ，Ｇ＞および＜Ｃ１，Ｆ，Ｇ＞（Ｃ１は、ネットワークのいたる所にいる全ユーザのセット）の形態のセットＰＦＴにおける全てのトリプルと共に、この情報を用いて、どのファイルＧ１．．．Ｇｋが、ファイルＦに対するリクエストによってトリガされるかを（ユーザを基準としたアプローチと全く同様に）決定する。サーバＳが、ファイルＦを代理サーバＳ２に送り返すと、サーバＳは、ファイルＧ１．．．Ｇｋのこのリストも送り、その結果、代理サーバＳ２は、ファイルＧ１．．．Ｇｋの先取りに着手し得る。ファイルを基準としたアプローチは、追加のデータ送信を必要とする。ユーザを基準としたアプローチの下では、サーバＳが、サーバＳを代理サーバとして使用するユーザによって、それぞれのｔ分以内に成されたリクエストＲ０とＲ２との要求されたあらゆるペアに対して、上記のステップ３ｃ〜３ｇを実行しなければならないことを思い出されよ。ファイルと基準としたアプローチの下では、サーバＳは、ネットワーク上のいかなるユーザによって、それぞれのｔ分以内に成されたリクエストＲ０とＲ２との要求されたあらゆるペアに対して（例えば、Ｒ０がサーバＳに格納されたファイルをリクエストする）、上記のステップ３ｃ〜３ｇを実行しなければならない。従って、ユーザがリクエストＲ２を行うと、前のｔ分間（ここでは変数ｔがサーバＳに依存し得る）に、ユーザがサーバＳに格納されたファイルに対するリクエストＲ０を行ったというリクエストＲ２の通知を、ユーザの代理サーバは、全サーバＳに送らなければならない。この通知は、即座に送られる必要はなく、一般的には、各代理サーバにとって、そのような通知をバッファに蓄え（buffer up）、適切なサーバに、グループで周期的に送ることがより効率的である。ユーザおよびユーザ特異的情報のアクセスおよび到達可能性制御ユーザの現実のアイデンティティが、安全な混合パスの使用によって保護されるが、仮名は、完全なプライバシーを保証しない。特に、広告主は、原則的には、ユーザ特異的データを使用して、望まれていない勧誘をユーザに集中させることができる。この問題に対する一般的な解決は、代理サーバＳ２が、ユーザベースにおける各ユーザの代わりに代理人として機能し、ユーザおよびユーザのプライベートなデータへのアクセスを、ユーザによって設定された基準に従ってのみ許可することである。代理サーバＳ２は、２つの方法でアクセスを限定し得る。１．代理サーバＳ２は、第３者によるアクセスを、ユーザ特異的情報のサーバＳ２の仮名データベースに限定し得る。広告主のような第３者が、仮名Ｐのユーザ特異的情報のリリースをリクエストするメッセージをサーバＳ２に送ると、サーバＳ２は、メッセージが、アクセス者がこの情報に権利があることを証明するのに十分なアクセス者に対するクリデンシャルを含んでいなければ、リクエストを認めることを拒絶する。仮名Ｐに関連するユーザは、いつでも、仮名Ｐに関連する情報の指定されたサブセットをリリースするための十分な根拠となる、代理サーバＳ２がその時以降に考慮するべきクリデンシャルまたはクリデンシャルのブール組み合わせを指定する署名入り制御メッセージを、代理サーバＳ２に送ってもよい。代理サーバＳ２は、仮名Ｐのためのデータベースレコードと共に、これらのアクセス基準を格納する。例えば、ユーザは、代理サーバＳ２が、選択された情報プロバイダ、慈善組織（すなわち、登録された慈善事業団体にのみ発行される政府発行のクリデンシャルを提供し得る組織）、およびユーザＵの購入習慣を研究する権利に対してユーザＵに支払いをした市場調査専門家にのみ購入情報をリリースすることを望み得る。２．代理サーバＳ２は、ユーザに電子メッセージを送る第３者の能力を制限し得る。広告主などの第３者が、情報を仮名Ｐのユーザに転送するように代理サーバＳ２にリクエストするメッセージを代理サーバＳ２に送ることによって、情報（例えば、話す、または書くリアルタイムの意志の疎通に入るためのテキストメッセージまたはリクエスト）を、仮名Ｐに送ろうとすると、上記のように、ユーザが、情報をユーザに送ることを望む第３者に課すことを選んだ条件を満たすのに十分な、アクセス者に対するクリデンシャルをメッセージが含んでいなければ、代理サーバＳ２は、リクエストを認めることを拒絶する。メッセージが十分なクリデンシャルを含んでいれば、代理サーバＳ２は、仮名Ｐのデータベースレコードから、一回限りの仮名の返信アドレスエンベロープを取り出し、このエンベロープを用いて、指定された情報を含むメッセージを、安全な混合パスに沿って、仮名Ｐのユーザへと送る。使用されているエンベロープが、仮名Ｐのために保存された唯一のエンベロープである場合、あるいは、より一般的には、そのようなエンベロープの供給が少なければ、代理サーバＳ２は、このメッセージを送る前に、メッセージに表示を加え、この表示は、ユーザのローカルサーバに、将来使用するために、追加のエンベロープを、代理サーバＳ２に送るべきであることを示す。より一般的なバリエーションにおいては、ユーザは、代理サーバＳ２に、第３者によるリクエストの認可に対して、単に、必要とされるクリデンシャルのブール組み合わせだけではなく、より複雑な条件を課すように命令し得る。ユーザは、以下を含み得る（しかし、それらに限定されることはない）単純な条件のブール組み合わせをどれでも課し得る：（ａ．）アクセス者（第３者）は、ある特定のパーティである。（ｂ．）アクセス者は、ある特定のクリデンシャルを提供した。（ｃ．）リクエストを満たすことは、ユーザのユーザプロファイルに関するある事実を、アクセス者に開示することに関与する。（ｄ．）リクエストを満たすことは、ユーザのターゲットプロファイル関心サマリを、アクセス者に開示することに関与する。（ｅ．）リクエストを満たすことは、統計的サマリデータを、アクセス者に開示することに関与し、このデータは、代理サーバのユーザベースにおける少なくともｎの他のユーザのユーザプロファイルおよびターゲットプロファイル関心サマリと共に、ユーザのユーザプロファイルまたはターゲットプロファイル関心サマリから計算される。（ｆ．）リクエストの内容は、ユーザにターゲットオブジェクトを送ることであり、このターゲットオブジェクトは、ある特定の属性（例えば、高度な読書レベル、低い俗悪性、または認証されたＭＰＡＡからのＰＧ（Parental Guidance ）評価）を有する。（ｇ．）リクエストの内容は、ユーザにターゲットオブジェクトを送ることであり、このターゲットオブジェクトは、ある特定の秘密鍵（例えば、承認された文書を認証するために米国製薬協会（National Pharmaceutical Association）によって使用される秘密鍵）でデジタル署名される。（ｈ．）リクエストの内容は、ユーザにターゲットオブジェクトを送ることであり、ターゲットプロファイルは、プロファイル認証機関によってデジタル署名されており、ターゲットプロファイルが、全ての属性が認証された、それが描写しようとするターゲットオブジェクトの真の正確なプロファイルであることを保証する。（ｉ．）リクエストの内容は、ユーザにターゲットオブジェクトを送ることであり、このターゲットオブジェクトのターゲットプロファイルは、ユーザによって指定された特定の検索プロファイルの指定された距離内にある。（ｊ．）リクエストの内容は、ユーザにターゲットオブジェクトを送ることであり、代理サーバＳ２は、ユーザの格納されたターゲットプロファイル関心サマリを使用することによって、ターゲットオブジェクトにおけるユーザの見込みの高い関心が、指定のしきい値を上回ることを評価する。（ｋ．）アクセス者は、リクエストの履行と引き換えに、ユーザに対して特定の支払いをする意志を示す。ユーザのアクセス制御条件を作成し維持するために必要とされるステップは、以下の通りである：１．ユーザは、リクエストに適用される述語（predicate）のブール組み合わせを作り、生じた複雑な述語は、ユーザが代理サーバＳ２に認めてほしいリクエストに適用された場合に、真であるはずであり、そうでなければ偽であるはずである。２．複雑な述語は、ＳＫ_Pを用いて署名され、ユーザのクライアントプロセッサＣ３から代理サーバＳ２へと、ユーザの仮名Ｐも含むパケットに入れられた混合パスを通して送信される。３．代理サーバＳ２は、パケットを受け取り、ＰＫ_Pを用いて信頼性を検証し、指定されたアクセス制御命令を、仮名Ｐのデータベースレコードの一部として、パケットに格納する。代理サーバＳ２は、以下のようにアクセス制御を実施する：１．第３者（アクセス者）は、ネットワークＮによって提供される通常の二地点間接続を使用して、リクエストを代理サーバＳ２に送信する。このリクエストは、仮名Ｐ１．．．Ｐｎのセットに関連するターゲットプロファイル関心サマリにアクセスする、または仮名Ｐ１．．．Ｐｎのセットに関連するユーザプロファイルにアクセスする、またはメッセージを仮名Ｐ１．．．Ｐｎに関連するユーザに転送することであり得る。アクセス者は、仮名Ｐ１．．．Ｐｎを明白に指定し得る、またはＰ１．．．Ｐｎが、指定された条件を満たす、代理サーバＳ２に登録された全ての仮名のセットとなるように選ばれることを要求し得る。２．代理サーバＳ２は、各仮名Ｐｉ（１≦Ｉ≦ｎ）のデータベースレコードを索引し、Ｐｉに関連するユーザによって提供されるアクセス条件を取り出し、送信されたリクエストが、Ｐｉを満足させるかどうか、およびどのように満足させるかを決定する。条件が満たされると、Ｓ２は、ステップ３ａ〜３ｃに進む。３ａ．リクエストが満たされ得る場合には（しかし、料金を支払うときのみ）、代理サーバＳ２は、支払いリクエストを、アクセス者に送信し、アクセス者が、支払いを代理サーバＳ２に送るのを待つ。代理サーバＳ２は、サービス料金を保持し、支払いの差額を、仮名Ｐｉに関連するユーザに、このユーザが提供した匿名返信用パケットを介して転送する。３ｂ．リクエストが満たされ得る場合には（しかし、クリデンシャルを提供するときのみ）、代理サーバＳ２は、クリデンシャルリクエストをアクセス者に送信し、アクセス者が、代理サーバＳ２にクリデンシャルを送るのを待つ。３ｃ．代理サーバＳ２は、リクエストに応じて、ユーザ特異的情報をアクセス者に開示する、ユーザと直接通信するための一回限りのエンベロープのセットをアクセス者に提供する、またはメッセージをユーザに転送することによってリクエストを満たす。４．代理サーバＳ２は、任意にメッセージをアクセス者に送り、Ｐ１．．．Ｐｎに関する拒絶されたリクエストの各々がなぜ拒絶されたのかを示す、および／または幾つのリクエストが満たされたかを示す。５．アクセス者からのパスどれでもによって送られたターゲットオブジェクトどれでもに対して、ユーザＵだれでもによって提供された能動的および／または受動的関連性フィードバックが、ユーザＵのクライアントプロセッサＣ３に常駐する上記の作表プロセスによって作表される。上記のように、このような情報のサマリが、代理サーバＳ２に周期的に転送され、それによって、代理サーバＳ２が、ユーザのターゲットプロファイル関心サマリおよびユーザプロファイルを更新することが可能となる。アクセス制御基準が、懇請された、および懇請されていない送信に適用され得る。すなわち、代理サーバは、ユーザがリクエストし得る不適切または誤って示されたターゲットオブジェクトからユーザを保護するために使用され得る。ユーザが、情報サーバからターゲットオブジェクトをリクエストするが、ターゲットオブジェクトが、アクセス制御基準を満たさないことが判明すると、代理サーバは、情報サーバがターゲットオブジェクトをユーザに送信する、またはそのような送信に対してユーザに請求することを許可しない。例えば、プロファイルが、不正変更されたターゲットオブジェクトを監視するためには、ユーザは、ターゲットプロファイルの正確さを、プロファイル認証機関からのデジタル署名により証明することをプロバイダに要求するアクセス制御基準を指定し得る。別の例として、子どものユーザの親は、代理サーバに、公認の児童保護組織によってデジタル署名されたターゲットオブジェクトのみがユーザに送信され得ることを命令し得る。従って、代理サーバは、成人のクリデンシャルを与えられていないユーザにポルノ映像を喜んで提供する悪い情報サーバからでさえ、ユーザが、ポルノ映像を取り出すことを許可しない。マルチキャストツリーを用いた情報の配信図３に示されたネットワークＮの図的表現は、データ通信リンクの少なくとも１つが、図４に図示されるように排除され得るが、それでも、ネットワークＮが、全てのサーバＡ〜Ｄの間でメッセージを通信することが可能である。排除とは、リンクの物理的切断ではなく、リンクがネットワークの論理的設計において使用されないことを意味する。全ての重複するデータ通信リンクが排除される時に生じるグラフは、「ツリー」または「連結非巡回グラフ」（connected acyclic graph）と呼ばれる。メッセージが、他のサーバを介してあるサーバによって送信され得、その後、異なる発信データ通信リンクを使って送信したサーバに返されるグラフは、「サイクル」と呼ばれる。従って、ツリーは、端（リンク）がグラフ「ノード」（サーバ）のセットを連結する非巡回グラフである。ツリーは、相互接続されたサーバの組における選択されたサーバに、データファイルをどれでも効率的に放送するために使用され得る。ツリー構造は、通信ネットワークにおいて魅力的である。その理由は、多くの情報配信が、本質的にマルチキャストである、すなわち、単一のソースで利用可能な１個の情報が、情報がアクセスされ得る非常に多数の地点に配信されなければならないからである。この技術は、広く公知であり、例えば、「ＦＡＸツリー」は、政治的組織において慣用であり、マルチキャストツリーは、インターネットでのマルチ媒体データの配布に広く使用される。例えば、「Scalable Feedbac k Control for Multicast Video Distribution in the Internet」（Jean-Chrys ostome Bolot、Thierry Turletti & Ian Wakeman、Computer Communication Rev iew、Vol．24、#4、1994年10月、Proceedings of SIGCOMM '94、58〜67頁）または「An Architecture For Wide-Area Multicast Routing」(Stephen Deering、D eborah Estrin、Dino Farinacci、Van Jacobson、Ching-Gung Liu & Liming Wei 、Computer Communication Riview、Vol．24、#4、1994年10月、Proceedings of SIGCOMM '94、126〜135頁)を参照。ネットワークの図式表現上に重ねられ得る多くの可能なツリーが存在するが、ネットワークの性質（例えば、データをリンク上で通信するコスト）およびその使用（例えば、特定のノードが、より頻繁な通信を示し得る）の両方によって、マルチキャストツリーとしての使用のために、別のものよりも良いという１つのツリーの選択が成され得る。実際のネットワーク設計における最も難しい問題の１つは、「良好な」マルチキャストツリーの構築、すなわち、低コスト（不必要にリンクをトラバースしないデータによる）および良好な性能（必要とされる場所の近くに頻繁にいるデータによる）を示すツリー選択である。マルチキャストツリーの構築マルチキャストツリーを構築するためのアルゴリズムは、Deeringらのインターネットマルチキャストツリーの場合のように、臨機応変である（これは、クライアントがサービスをリクエストする際に、現存のツリーに彼らを認可することによってクライアントを加える）、あるいは、最小コストスパンツリーの構築による。スパンツリー（グラフの全てのノードを連結、または「スパン」するツリーとして定義される）をイーサネットブリッジのセット上に生成するための配布アルゴリズムは、Radia Perlmanによって開発された（「Interconnections: Bri dges and Routers」、Radia Perlman、Addison-Wesley、1992年）。グラフの最小コストスパンツリーの作成は、グラフの弧（通信ネットワークの通信リンクに対応する）に関するコストモデルを有することに依存する。イーサネットブリッジの場合には、デフォルトのコスト（パスコストのより複雑なコストモデルは、 Perlmanの72〜73頁に議論されている）は、ルートまでの単純な距離測定として計算される。従って、スパンツリーは、最初に固有のルートを選び、次にルートからの距離に基づいてスパンツリーを構築することによって、ルートに対するコストを最小限に抑える。このアルゴリズムでは、ルートは、「コンフィギュレーションメッセージ」に含まれる数字のＩＤに依存して選ばれ、最小の数値のＩＤを有するサーバが、ルートとして選ばれる。一般的に、複数の問題がこのアルゴリズムに存在する。第１に、ＩＤを使用する方法が、ツリーおいて相互接続されるノードに対して最良のルートを選択するとは限らない。第２に、コストモデルが過度に単純化されている。まず最初に、どのように前述の類似性ベースの方法を使用して、ターゲットオブジェクトのグループに最も関心のあるサーバ（ここではそのグループの「コアサーバ」と呼ぶ）を選択するかを示す。次に、ファイルをこれらのコアサーバに同報通信するために使用され得るルート（root）のないマルチキャストツリーをどのように構築するかを示す。最後に、ターゲットオブジェクトに対応するファイルがどのようにクライアントのイニシアティブでマルチキャストツリーを介して実際に同報通信されるか、およびこれらのファイルが、クライアントが要求する際、後でコアサーバからどのように取り出されるかを示す。ファイルを分配するコアサーバの選択は、ファイルを取り出す可能性のあるユーザのセット（すなわち、対応するターゲットオブジェクトに関心のある可能性のあるユーザのセット）に依存するので、コアサーバの別個のセットおよび従って別個のマルチキャストツリーがターゲットオブジェクトの各トピック別グループに使用され得る。以下の説明を通して、サーバはメッセージが移動し得る任意の経路を介して互いに通信し得る。各マルチキャストツリーの目標は、対応するトピックのターゲットオブジェクトに対応するファイルのマルチキャスト分配を最適化することである。この問題は、米国特許第4,706,080号においてSincoskie によって、および１９８８年１月にIEEE Networkの16〜24ページにおいて公開されたW．D．SincoskieおよびC．J．Cottonによる“Extended Bridge Algorithms for Large Networks”というタイトルの刊行物によって開示されるような、相互接続されたノードの完全なセットのための多数のつながったツリー（spanning t ree）の選択とは完全に異なるということに留意されたい。この開示におけるツリーは、システムにおけるノードの選択された下位セットを相互接続するように意図的に設計され、この下位セットが比較的小さい程度まで功を奏する。マルチキャストツリー構築手順同種のターゲットオブジェクトのセットのためのトピック別マルチキャストツリーのセットは、以下の如くいつでも構築または再構築され得る。ターゲットオブジェクトのセットは、前述の方法を用いて、例えば、Ｃ１．．．Ｃｐを、ターゲットオブジェクトのセットのk-平均クラスタ化の結果、またはこれらのターゲットオブジェクトの階層クラスタツリーからの低レベルのクラスタのカバリングセット（covering set）の結果となるように選択することによって、一定の数のトピック別クラスタＣ１．．．Ｃｐにグループ化される。次いでマルチキャストツリーＭＴ（ｃ）がＣ１．．．Ｃｐにおける各クラスタＣから、以下の手順によって構築される。１．代理サーバＳ１．．．Ｓｎのセットおよび主体別クラスタＣが与えられる場合。すべての代理サーバＳ１．．．Ｓｎを含む汎用マルチキャストツリーＭＴ_full は周知の方法によってあらかじめ構築されていたと仮定する。２．各対＜Ｓｉ，Ｃ＞は重みｗ（Ｓｉ，Ｃ）と関連付けられ、これは後にクラスタＣからのターゲットオブジェクトにアクセスする代理サーバＳｉのユーザベースにおけるユーザの期待数と共にそれぞれ変化する（covary）よう意図される。この重みは、そのすべてがここに記載する類似性測定値計算を使用する、いくつかの方法のうちの任意の方法で代理サーバＳｉによって計算される。１つの変形は以下のステップを使用する。（ａ）代理サーバＳｉがクラスタＣからターゲットオブジェクトＴをランダムに選択する。（ｂ）関連するユーザＵを有する、そのローカルデータベースにおける各仮名に対して、代理サーバＳｉはユーザＵの格納ユーザプロファイルおよびターゲットプロファイル関心サマリ（target profile interest summary）に前述の技術を適用して、ユーザＵが選択されたターゲットオブジェクトＴに対して有する関心ｗ（Ｕ，Ｔ）を推定する。代理サーバＳｉのユーザベースがターゲットオブジェクトＴに対して有する集合関心ｗ（Ｓｉ，Ｔ）は、これらの関心値ｗ（Ｕ，Ｔ）の合計であると定義される。あるいは、ｗ（Ｓｉ，Ｔ）は、ユーザベースにおけるすべてのＵについての値ｓ（ｗ（Ｕ，Ｔ））の合計であると定義され得る。ここで、ｓ（^*）は小さなアーギュメントについては０に近く、大きなアーギュメントについては定数ｐ_ma _x に近いシグモイド関数（sigmoidal function）である。従って、ｓ（ｗ（Ｕ，Ｔ））はユーザＵがターゲットオブジェクトＴにアクセスする確率を推定し、この確率は任意の他のユーザがターゲットオブジェクトＴにアクセスする確率から独立していると仮定される。ある変形においては、ｗ（Ｓｉ，Ｔ）はＳｉのユーザベースから少なくとも１人のユーザがターゲットオブジェクトＴにアクセスする確率を推定させられる。このときｗ（Ｓｉ，Ｔ）は、値ｗ（Ｕ，Ｔ）のまたは１マイナス量（１−ｓ（ｗ（Ｕ，Ｔ）））のユーザＵについての積の最大値として定義され得る。（ｃ）代理サーバＳｉはクラスタＣからランダムに選択されたいくつかのターゲットオブジェクトＴについてステップ（ａ）〜（ｂ）を繰り返し、それによってステップ（ｂ）で計算されたｗ（Ｓｉ，Ｔ）のいくつかの値を平均して、所望の量ｗ（Ｓｉ，Ｃ）を決定する。この量はクラスタＣのターゲットオブジェクトに対して代理サーバＳｉのユーザベースが有する期待集合関心を表す。ターゲットプロファイル関心サマリが検索プロファイルセットとして具現化される別の変形においては、以下の手順を踏んでｗ（Ｓｉ，Ｃ）が計算される。（ａ）代理サーバＳｉのユーザベースにおける任意のユーザのローカル格納検索プロファイルセットにおける各検索プロファイルＰ_sについて、代理サーバＳｉは検索プロファイルとクラスタＣのクラスタプロファイルＰ_cとの間の距離ｄ（Ｐｓ，Ｐｃ）を計算する。（ｂ）ｗ（Ｓｉ，Ｃ）はすべてのこのような検索プロファイルＰ_sにわたっての（−ｄ（Ｐ_s，Ｐ_c）／ｒ）の最大値となるように選択される。ここでｒはクラスタＣのクラスタ直径のアフィン関数として計算される。このアフィン関数の傾きおよび／または切片は、ターゲットオブジェクトの提供者が性能の向上を望むサーバＳｉに対してより小さくなる（これによってｗ（Ｓｉ，Ｃ）を増加させる）ように選択され、これは、代理サーバＳｉのユーザベースにおけるユーザが向上された性能に対してプレミアムを支払う場合、またはＳｉにおける性能が、そうしなければネットワーク接続が遅いために許容不可能なほど低い場合に当てはまり得る。別の変形においては、代理サーバＳｉは改変され、代理サーバＳｉのユーザベースの各ユーザに対してターゲットプロファイル関心サマリを保守するだけでなく、ユーザベース全体に対して１つの集合ターゲットプロファイル関心サマリをも保守する。この集合ターゲットプロファイル関心サマリは、関連性フィードバックから通常の方法で決定されるが、この場合、ターゲットオブジェクトに関する関連性フィードバックは、ユーザベースにおけるユーザがターゲットオブジェクトを新しかったときに取り出した度数であると考えられる。ユーザが代理サーバＳｉに対する要求によってターゲットオブジェクトを取り出すときは必ず、代理サーバＳｉのための集合ターゲットプロファイル関心サマリは更新される。この変形において、ｗ（Ｓｉ，Ｃ）は次のステップによって推定される。（ａ）代理サーバＳｉがクラスタＣからターゲットオブジェクトＴをランダムに選択する。（ｂ）代理サーバＳｉは格納集合ターゲットプロファイル関心サマリに前述の技術を適用して、集合されたユーザベースが、選択されたターゲットオブジェクトＴが新しかったときにその選択されたターゲットオブジェクトＴに対して有した集合関心ｗ（Ｓｉ，Ｔ）を推定する。これは、ユーザベースの少なくとも１メンバーがＴに類似する新しいターゲットオブジェクトを取り出す可能性の推定値として解釈され得る。（ｃ）代理サーバＳｉはクラスタＣからランダムに選択されたいくつかのターゲットオブジェクトＴについてステップ（ａ）〜（ｂ）を繰り返し、それによってステップ（ｂ）で計算されたｗ（Ｓｉ，Ｔ）のいくつかの値を平均して、所望の量ｗ（Ｓｉ，Ｃ）を決定する。この量はクラスタＣのターゲットオブジェクトに対して代理サーバＳｉのユーザベースが有する期待集合関心を表す。３．Ｓ１．．．Ｓｎの中からの、ｗ（Ｓｉ，Ｃ）の最大の重みを有するサーバＳｉはクラスタＣのための指定「コアサーバ」である。固定された数のコアサーバの選択が所望される１つの変形においては、ｗ（Ｓｉ，Ｃ）の最大値を有するサーバＳｉが選択される。別の変形においては、各サーバＳｉに対するｗ（Ｓｉ，Ｃ）の値が一定の閾値ｗ_minと比較され、ｗ（Ｓｉ，Ｃ）がｗ_minと等しいかまたはｗ_minを超えるようなサーバＳｉがコアサーバとして選択される。クラスタＣ１．．．Ｃｐが多い場合にしばしば起こることであるが、クラスタＣがターゲットオブジェクトの狭くかつ特殊なセットを表す場合は、少数のコアサーバクラスタＣのみを選択し、これによって以下のステップ４〜５における計算効率において有意な利点を得るのが通常は適切である。４．頂点がクラスタＣの指定コアサーバである完全なグラフＧ（Ｃ）を作成する。コアサーバの各対について、それらのコアサーバ間で最も安価な経路に沿ってメッセージを送信するコストが推定され、それらのコアサーバを接続する辺（ edge）の重みがこのコストであるとみなされる。コストは、平均送信料金、平均送信遅延および最悪または最悪に近い送信遅延の適切な関数として決定される。５．マルチキャストツリーＭＴ（Ｃ）は、標準の方法によってＧ（Ｃ）に対する最小のつながったツリー（または、最小に近いつながったツリー）となるよう計算され、ここで２つのコアサーバ間の辺の重みは、これらの２つのコアサーバの間でメッセージを送信するコストであるとみなされる。ＭＴ（Ｃ）はすべての代理サーバＳ１．．．Ｓｎを頂点として含まず、クラスタＣのためのコアサーバのみを含むことに留意されたい。６．クラスタＣのクラスタプロファイル、クラスタＣのコアサーバおよびこれらのコアサーバ上に構築されたマルチキャストツリーＭＴ（Ｃ）の接続形態を記述するメッセージＭが形成される。メッセージＭは汎用マルチキャストツリーＭＴ_fullによってすべての代理サーバＳ１．．．Ｓｎに同報通信される。各代理サーバＳｉは、メッセージＭを受け取ると、以下のようにクラスタＣのクラスタプロファイルを抜き出し、それをメッセージＭから決定したその他の一定の情報と共にローカル記憶装置に格納する。代理サーバＳｉがメッセージＭにおいてクラスタＣのコアサーバとして指名される場合、代理サーバＳｉは、グラフＭＴ（Ｃ）においてＳｉからの経路距離がｄより小さいあるいはｄに等しいすべてのコアサーバによって誘導されるＭＴ（Ｃ）の下位ツリーを抜き出して格納する。ここで、ｄは定数である正の整数（通常１から３）である。メッセージＭが代理サーバＳｉをＭＴ（Ｃ）のコアサーバとして指名しない場合、代理サーバＳｉは、仮想二地点間リンク上で代理サーバＳｉが安価に接触し得る１つ以上の近傍のコアサーバのリストを抜き出して格納する。図３のネットワークにおいて、本発明のシステムに適用されるツリーの使用を例示するために、クライアントｒが電子新聞などのネットワーク用オンライン情報を提供すると仮定する以下の簡単な例を考慮されたい。この情報は、クライアントｒによって、いくつかのファイルを含むあらかじめ配列された形に構成され得、いくつかのファイルのそれぞれは異なるターゲットオブジェクトと関連付けられる。電子新聞の場合、ファイルは株価、天気予報、社説などのテキスト表現を含み得る。システムはこれらのファイルに関連するターゲットオブジェクトに対する可能性のある需要を決定して、相互接続されたクライアントｐ−ｓおよび代理サーバＡ−ＤのネットワークＮを介してファイルの分配を最適化する。クラスタＣが航空宇宙産業に関するテキスト記事から構成されると仮定されたい。さらに、クライアントｐおよびｒにおけるユーザのための代理サーバＡおよびＢにおいて格納されるターゲットプロファイル関心サマリが、これらのユーザがこのような記事に強い関心を持っているということを示すと仮定されたい。このとき、代理サーバＡおよびＢがマルチキャストツリーＭＴ（Ｃ）のコアサーバとして選択される。次いでマルチキャストツリーＭＴ（Ｃ）が、ＡとＢとの間の最も安価な仮想二地点間リンク（コストによって、直接経路Ａ−Ｂまたは間接経路Ａ− Ｃ−Ｂ）を表す辺によって接続されるコアサーバＡおよびＢから構成されるよう計算される。マルチキャストツリーへのグローバル要求いずれの代理サーバＳにも送信され得るメッセージの１つのタイプは、「グローバル要求メッセージ」と呼ばれる。このようなメッセージＭは埋め込み要求ＲのマルチキャストツリーＭＴ（Ｃ）におけるすべてのコアサーバへの同報通信をトリガする。メッセージＭには、メッセージＭがグローバル要求メッセージであることを示すフィールドが含まれるのと同様、要求Ｒの内容およびクラスタＣの同一性が含まれる。さらに、メッセージＭは後述する一定の状況下以外は無指定であるフィールドＳ_lastを含み、この一定の状況下ではフィールドＳ_lastは特定のコアサーバを指名する。グローバル要求メッセージＭは代理サーバＳに登録されたユーザによって代理サーバＳに送信され得、この送信は、仮名を用いた混合経路に沿って起こり得るか、または別の代理サーバから代理サーバＳに、仮想二地点間接続に沿って送信され得る。代理サーバＳは、グローバル要求メッセージとしてマークされたメッセージＭを受け取ると、以下のように動作する。１．代理サーバＳがトピックＣのコアサーバでない場合、代理サーバＳはトピックＣの近傍のコアサーバのローカル格納リストを取り出し、このリストから近傍のコアサーバＳ’を選択し、メッセージＭのコピーを仮想二地点間接続上でコアサーバＳ’に送信する。この送信が失敗した場合、代理サーバＳはリストのその他のコアサーバについて手順を繰り返す。２．代理サーバＳがトピックＣのコアサーバである場合、代理サーバＳは次のステップを実行する。（ａ）メッセージＭに埋め込まれている要求Ｒに基づいて動作する。（ｂ）Ｓ_currをＳ（Ｃ）となるように設定する。ＭＴ（Ｃ）のローカル格納下位ツリーを取り出し、それからこの下位ツリーにおいてＳ_currに直接リンクされるすべてのコアサーバのリストＬを抜き出す。（ｄ）メッセージＭがＳ_lastの値を指定し、Ｓ_lastがリストＬに現れる場合、リストＬからＳ_last、を除去する。リストＬはこのステップの前は空であり得る、またはこのステップの結果空になり得るということに留意されたい。（ｅ）リストＬの各サーバＳｉについて、サーバＳからサーバＳｉに仮想二地点間接続上でメッセージＭのコピーを送信する。ここで、メッセージＭのコピーのＳ_lastフィールドはＳ_currに変更されている。Ｓｉがいかなる仮想二地点間接続によっても適当な時間内に到達され得ない（例えば、サーバＳｉが故障している）場合、上記ステップ（ｃ）に再帰し、再帰の持続時間中はＳ_origはＳ_currに連結され、Ｓ_currはＳ｛＼ｓｕｂＩ｝に連結される。ステップ１におけるサーバＳ’またはステップ２（ｅ）におけるサーバＳｉは、グローバル要求メッセージＭのコピーを受け取ると、全く同じステップに従って動作する。その結果、いくつかのコアサーバが到達し得ないのでない限り、すべてのコアサーバは最終的にはグローバル要求メッセージＭのコピーを受け取り、埋め込み要求Ｒに基づいて動作する。たとえあるコアサーバが到達不可能であっても、ｄ＞１である限り、ほとんどの状況ではステップ（ｅ）によってその他のコアサーバに対する同報通信が確実に続けられ得る。ｄの値がより高い場合は、到達不可能なコアサーバに対する付加的な保護手段が提供される。マルチキャステイングファイル所望のオブジェクトのカスタム化電子情報のためのシステムは、以下のステップを実行して、システムに新しいターゲットオブジェクトを導入する。これらのステップは、エンティティＥによって開始され、エンティティＥは、図３に示すように、ユーザがクライアントプロセッサｑにおいてキーボードを介して入力するコマンド、またはクライアントあるいはサーバプロセッサｑに常駐する自動ソフトウェアプロセスであり得る。１．プロセッサｑは署名された（signed）要求Ｒを形成し、署名された要求Ｒは受信者に、受信者のローカル記憶装置にファイルＦのコピーを格納するよう要求する。ファイルＦは、クライアントｑによってクライアントｑにおける記憶装置で保守されるか、またはクライアントｑがネットワーク上でアクセスできる記憶装置で保守され、前述のように、ターゲットオブジェクトの情報内容または識別記述を含む。要求Ｒはまた、エンティティＥが接触され得るアドレス（おそらくある代理サーバＤにおける仮名のアドレス）を含み、受信者に、ファイルＦがこのアドレスのエンティティによって保守されるという事実を格納するよう要求する。２．プロセッサｑはメッセージＭ１に要求Ｒを埋め込み、前述のようにエンティティＥの代理サーバＤに仮名を用いて送信する。メッセージＭ１は代理サーバＤに適切なマルチキャストツリーに沿って要求Ｒを同報通信するように命令する。３．メッセージＭ１を受け取ると、代理サーバＤは二重に埋め込まれたファイルＦを調べ、対応するターゲットオブジェクトのターゲットプロファイルＰを計算する。代理サーバＤはターゲットプロファイルＰを前述のトピック別クラスタＣ１．．．Ｃｐのクラスタプロファイルのそれぞれと比較し、ＣｋをプロファイルＰに対して最小の類似性距離を有するクラスタとなるよう選択する。４．代理サーバＤはそれ自身にグローバル要求メッセージＭを送り、それ自身に要求Ｒをトピック別マルチキャストツリーＭＴ（Ｃｋ）に沿って同報通信するよう命令する。５．代理サーバＤは仮名を用いる通信を介してエンティティＥに、ファイルＦがクラスタＣｋのトピック別マルチキャストツリーに沿ってマルチキャストされたことを通知する。サーバＤおよびその他のサーバがグローバル要求メッセージに基づいて動作するために従う手順の結果として、ステップ４は最終的に、トピックＣｋのすべてのコアサーバに要求Ｒに基づいて動作させ、従って、ファイルＦのローカルコピーを格納させる。コアサーバＳｉは、そのローカル記憶装置にファイルＦのための空間をあけるために、有用性の低いファイルを削除しなければならない場合がある。削除すべきファイルを選択する方法にはいくつかある。当該分野で周知の１つの選択肢は、Ｓｉによる最も以前にアクセスされたファイルの削除の選択である。別の変形においては、Ｓｉはアクセスするユーザがほとんどいないと確信するファイルを削除する。この変形においては、サーバＳｉがファイルＦのコピーを格納するたびに、サーバＳｉはまた重みｗ（Ｓｉ，Ｃ_F）を計算して格納する。ここで、Ｃ_FはファイルＦに関連する１つのターゲットオブジェクトから構成されるクラスタである。次いでサーバＳｉは、ファイルを削除しなければならないとき、重みｗ（Ｓｉ，Ｃ_F）の最も低いファイルＦを削除することを選択する。ファイルは古くなるにつれてアクセスされる頻度が下がるという事実を反映させるため、サーバＳｉは定期的に、そのとき格納している各ファイルＦについて、格納されたｗ（Ｓｉ，Ｃ_F）の値に減衰因数（例えば０．９５）を乗じる。あるいは、減衰因数を使用する代わりに、サーバＳｉは格納する各ファイルＦについて、集合関心ｗ（Ｓｉ，Ｃ_F）を定期的に再計算し得る。集合関心は経時変化する。これは前述のように、ターゲットオブジェクトが典型的には、システムがユーザの関心を推定する際考慮する年齢属性を有するからである。エンティティＥは、例えば、更新されたバージョンをマルチキャストしたところであるなどの理由により、後でファイルＦをネットワークから除去することを望む場合は、デジタル方式で署名されたグローバル要求メッセージを代理サーバＤに仮名を用いて送信し、マルチキャストツリーＭＴ（Ｃｋ）のすべての代理サーバに格納している可能性のあるファイルＦのいずれのローカルコピーをも削除するよう要求する。マルチキャストツリーへの照会グローバル要求メッセージに加えて、いずれの代理サーバＳにも送信され得る別のタイプのメッセージは「照会メッセージ」と呼ばれる。代理サーバに送信されると、照会メッセージによって応答はメッセージの発信者に送られる。この応答は、所定のマルチキャストツリーＭＴ（Ｃ）におけるサーバのいずれかが回答できる場合、所定の照会Ｑに対する回答を含み、そうでない場合は回答は入手できないことを示す。照会およびクラスタＣは照会メッセージにおいて指名される。さらに、照会メッセージは、後述する一定の状況下以外は無指定であるフィールドＳ_lastを含み、この一定の状況下ではフィールドＳ_lastは特定のコアサーバを指名する。代理サーバＳは、照会メッセージとしてマークされたメッセージＭを受け取ると、以下のように動作する。１．代理サーバＳは、Ａ_rをサーバＳにメッセージＭを送信したクライアントまたはサーバのための返信アドレスと設定する。Ａ_rはネットワークアドレスか仮名アドレスかのどちらかであり得る。２．代理サーバＳがクラスタＣのコアサーバでない場合、代理サーバＳはトピックＣの近傍のコアサーバのローカル格納リストを取り出し、このリストから近傍のコアサーバＳ’を選択し、位置指定メッセージＭのコピーを仮想二地点間接続上でコアサーバＳ’に送信する。この送信が失敗した場合、代理サーバＳはリストのその他のコアサーバについて手順を繰り返す。応答を受け取ると、代理サーバＳはこの応答をアドレスＡ_rに転送する。３．代理サーバＳがクラスタＣのコアサーバであり、ローカル格納情報を用いて照会Ｑに回答することができる場合、代理サーバＳは回答を含む「肯定の」応答をＡ_rに送信する。４．代理サーバＳがトピックＣのコアサーバであるが、ローカル格納情報を用いて照会Ｑに回答することができない場合、代理サーバＳは以下のステップを実行することによって平行深さ優先検索（parallel depth-first search）を実行する。（ａ）Ｌを空リストとなるよう設定する。（ｂ）ＭＴ（Ｃ）のローカル格納下位ツリーを取り出す。この下位ツリーにおいてＳ_currに直接リンクされる、Ｓ_last（指定される場合）以外の各サーバＳｉについて、順序対（Ｓｉ，Ｓ）をリストＬに追加する。（ｃ）Ｌが空である場合、「否定の」応答をアドレスＡ_rに送信し、サーバＳは照会Ｑに対する回答を見つけ得ないことを告げ、ステップ４の実行を終了させる。そうでなければステップ（ｄ）に進む。（ｄ）リストＬから１つ以上のサーバの対（Ａｉ，Ｂｉ）のリストＬ１を選択する。リストＬ１の各サーバの対（Ａｉ，Ｂｉ）について、Ｓ_lastフィールドがＢｉを指定するように改変されたメッセージＭのコピーである位置指定メッセージＭ（Ａｉ，Ｂｉ）を形成し、このメッセージＭ（Ａｉ，Ｂｉ）を仮想二地点間接続上でサーバＡｉに送信する。（ｅ）ステップ（ｄ）で送られたメッセージに対する（Ｓによって）受け取られた各応答について、以下のように動作する。（I）位置指定メッセージＭ（Ａｉ，Ｂｉ）に対して「肯定の」応答が届いた場合、この応答をＡ_rに転送し、直ちにステップ４を終了させる。（ii）位置指定メッセージＭ（Ａｉ，Ｂｉ）に対して「否定の」応答が届いた場合、リストＬ１から対（Ａｉ，Ｂｉ）を除去する。（iii ）メッセージＭ（Ａｉ，Ｂｉ）が首尾良くＡｉに配信され得なかった場合、リストＬ１から対（Ａｉ，Ｂｉ）を除去し、ＭＴ（Ｃ）のローカル格納下位ツリーにおいてＡｉに直接リンクされるＢｉ以外の各Ｃｉについて、リストＬ１に対（Ｃｉ，Ａｉ）を追加する。（ｆ）一旦Ｌ１がメッセージＭ（Ａｉ，Ｂｉ）が送られたいかなる対（Ａｉ，Ｂｉ）をももはや含まなくなれば、または一定の時間が経過した後、ステップ（ｃ）に戻る。マルチキャストツリーからファイルを取り出すネットワークにおけるプロセッサｑは、所定のターゲットオブジェクトに関連するファイルを取り出すことを望む場合、以下のステップを実行する。これらのステップはエンティティＥによって開始され、エンティティＥは、図３に示すように、ユーザがクライアントｑにおいてキーボードを介して入力するコマンド、またはクライアントあるいはサーバプロセッサｑに常駐する自動ソフトウェアプロセスであり得る。１．プロセッサｑは、受信側（クラスタＣのコアサーバ）が以前マルチキャストツリーＭＴ（Ｃ）にマルチキャストされたファイルＦを依然として格納するかどうかを尋ねる照会Ｑを形成する。もしそうである場合は、受信側サーバはそれ自身のサーバ名で応答すべきである。プロセッサｑはファイルＦの名前およびクラスタＣの同一性を既に知っていなければならないということに留意されたい。典型的には、この情報は、エンティティＥに、後述するニュースクリッピングサービスまたはブラウジングシステムなどの、ファイルをユーザに対して（名前，マルチキャストされたトピック）の対によって識別しなければならないサービスによって提供される。２．プロセッサｑは、照会ＱをマルチキャストツリーＭＴ（Ｃ）に提出する照会メッセージＭを形成する。３．プロセッサｑは前述のように、メッセージＭをユーザの代理サーバＤに仮名を用いて送信する。４．プロセッサｑはメッセージＭに対する応答Ｍ２を受け取る。５．応答Ｍ２が「肯定」である場合、すなわち、応答Ｍ２が依然としてファイルＦを格納しているサーバＳを指名する場合、プロセッサｑはユーザの代理サーバＤにサーバＳからファイルＦを取り出すよう仮名を用いて命令する。サーバＳが、照会に回答してからファイルＦを削除してしまったため取り出しが失敗した場合、クライアントｑはステップ１に戻る。６．応答Ｍ２が「否定」の場合、すなわち、応答Ｍ２がＭＴ（Ｃ）には依然としてファイルＦを格納しているサーバがないことを示す場合、プロセッサｑは受信側にファイルＦを保守するエンティティのアドレスＡを尋ねる照会Ｑを形成する。このエンティティは通常、ファイルＦのコピーを無期限に保守する。ＭＴ（Ｃ）におけるすべてのコアサーバは通常、たとえ空間の理由によりファイルＦを削除しても、この情報を（保守エンティティによって削除するよう命令されない限り）保持する。従って、プロセッサｑはアドレスＡを提供する応答を受け取るべきであり、これに基づいてプロセッサｑはユーザの代理サーバＤにアドレスＡからファイルＦを取り出すよう仮名を用いて命令する。ファイルＦの複数のバージョンがデータ通信ネットワークＮ全体にわたってローカルサーバに存在するが、同じファイルの代替バージョンとしてマークされないときは、システムの、Ｆに類似するファイルを（ターゲットオブジェクトとして扱い、上記の「ターゲットオブジェクトを検索する」で開示する方法を適用することによって）迅速に見つける能力により、すべての代替バージョンを、たとえ遠隔に格納されていても、発見することが可能になる。これらの関連データファイルはその後、任意の方法により一致され得る。簡単な例として、データファイルのすべてのバージョンは最新の日付またはバージョン番号を有するバージョンで置き換えられる。別の例では、各バージョンは、その他のバージョンへの参照またはポインタで、自動的に注釈を付けられる。ニュースクリッピングサービス本発明の所望のオブジェクトのカスタム化電子識別システムを、図１の電子媒体システムにおいて使用して、ユーザがどの記事を読むことを選択するかにのみ基づいて、ユーザの関心に適合するニュース記事を選択（フィルタリング）することを学習する自動ニュースクリッピングサービスを実施し得る。所望のオブジェクトのカスタム化電子識別システムは、記事に含まれる単語の発生の相対度数に基づいて、電子媒体システムに入る各記事についてターゲットプロファイルを生成する。所望のオブジェクトのカスタム化電子識別システムはまた、ユーザがアクセスした記事のターゲットプロファイルおよびこれらの記事についてユーザが提供した関連性フィードバックの関数として、各ユーザについて検索プロファイルセットを生成する。新しい記事が、情報サーバＩ₁−Ｉ_mの大容量記憶システムＳＳ₁−ＳＳ_mでの記憶のために受け取られるとき、所望のオブジェクトのカスタム化電子識別システムはそれらのターゲットプロファイルを生成する。生成されたターゲットプロファイルはその後、ユーザの検索プロファイルセットにおける検索プロファイルと比較され、ターゲットプロファイルがユーザの検索プロファイルセットにおける最も近い検索プロファイルに最も近い（最も類似する）新しい記事が、そのユーザに対して読む可能性のために識別される。記事をユーザに提供するコンピュータプログラムは、ユーザがどのくらい読むか（データのスクリーンの数および読むのに費やされた分数）をモニタリングし、ユーザの検索プロファイルセットの検索プロファイルを、ユーザが読むことをより好みそうなものにより良く適合するように調整する。このシステムが使用する方法の詳細を、図５においてフローチャートの形で開示する。この方法によると、ユーザ特定の検索プロファイルセットの計算、２つのプロファイル間の類似性の測定、およびユーザが読むものに基づくユーザの検索プロファイルセット（または、より一般的にはターゲットプロファイル関心サマリ）の更新の特定の方法を選択する必要がある。ここで開示する例は、使用され得る多くの可能な実施の例であり、システムの範囲を限定するものと解釈されるべきではない。ユーザの検索プロファイルセットを初期化するニュースクリッピングサービスはターゲットプロファイル関心サマリを検索プロファイルセットとして例示し、その結果関心の高い検索プロファイルのセットが各ユーザに対して格納される。所定のユーザに関連する検索プロファイルは経時変化する。検索プロファイルを含むいずれの用途においてもそうであるように、検索プロファイルは、以下の好適な方法を含む任意の数の手順によって、新しいユーザに対して初期決定（または、既存のユーザによって明確に変更）され得る。（１）ユーザに、キーワードおよび／または数値属性を与えることによって、直接検索プロファイルを指定するよう要求する。（２）ユーザが自分の関心を表すと指示するターゲットオブジェクトまたはターゲットクラスタのプロファイルのコピーを使用する。（３）ユーザに人口統計学的に類似する人々の検索プロファイルセットからコピーされたまたはその他の方法で決定された検索プロファイルの標準セットを使用する。記事ソースから新しい記事を取り出す記事は広範なソースからオンラインで入手可能である。好適な実施形態においては、ＡＰまたはロイターニュースワイヤなどのニュースソースによって供給されるような時事ニュースが使用される。これらのニュース記事は、情報サーバＳ₄ の大容量記憶システムＳＳ₄にロードされることによって電子媒体システムに入力される。所望のオブジェクトのカスタム化電子識別システムの記事プロファイルモジュール２０１は、情報サーバＳ₄に常駐し得、図５のフローチャートに示すステップに従って動作する。図５のフローチャートにおいて、各記事がステップ５０１において情報サーバＳ₄によって受け取られると、ステップ５０２において記事プロファイルモジュール２０１がその記事に対するターゲットプロファイルを生成し、ターゲットプロファイルを、後に記事をユーザに選択的に配信する際使用するために、記事指標付けメモリ（典型的には大容量記憶システムＳＳ₄の一部）に格納する。この方法は、電子ニュースグループおよび電子掲示板からの読むべき記事の選択に等しく有用であり、電子メール（「ｅ−メール」）のスクリーニングおよび編成用のシステムの一部として使用し得る。記事プロファイルを計算する前述のように、ターゲットプロファイルが新しい記事のそれぞれについて計算される。ターゲットプロファイルの最も重要な属性は、記事のテキスト全体を表すテキスト属性である。このテキスト属性は、前述の如く、数のベクトルとして表され、この数は、好適な実施形態においては、その他の比較可能な記事に対する、この記事における単語発生相対度数（ＴＦ／ＩＤＦスコア）を含む。サーバはＴＦ／ＩＤＦスコアを計算するために、記事における各単語の発生度数をカウントしなければならない。これらのニュース記事は次いで、ステップ５０３において階層クラスタツリーで階層的にクラスタ化され、これはどのニュース記事がユーザの関心に最も近いかを決定するための決定ツリーとして機能する。結果として得られるクラスタは、ツリーの最上部がすべてのターゲットオブジェクトを含み、ツリーの下方のブランチが、ターゲットオブジェクトのセットの、ターゲットオブジェクトの連続的に小さくなる下位クラスタへの分割を表すツリーとして見られ得る。各クラスタはクラスタプロファイルを有し、この結果ツリーの各ノードにおいて、そのノードをルートとする下位ツリーに格納されるすべてのターゲットオブジェクトの平均ターゲットプロファイル（重心）が格納される。ターゲットプロファイルのこの平均は、前述のように、数値属性のベクトルとして、ターゲットプロファイルの表現について計算される。現在の記事のターゲットプロファイルをユーザの検索プロファイルと比較するユーザがこの装置を使用して関心のあるニュース記事を取り出すプロセスを、図１１においてフローチャートの形で示す。ステップ１１０１において、ユーザは自分のクライアントプロセッサＣ₁を介してデータ通信ネットワークＮにログインし、ニュース読み取りプログラムを起動する。これは、ユーザが代理サーバＳ₂に対して前述のように仮名データ通信接続を確立することによって達成され、これはデータ通信ネットワークＮへのフロントエンドアクセスを提供する。代理サーバＳ₂は承認された仮名およびそれに対応する公開鍵のリストを保守し、アクセスおよび課金制御を提供する。ユーザは代理サーバＳ₂のローカルデータ記憶媒体に格納された検索プロファイルセットを有する。ユーザがステップ１１０２において「ニュース」へのアクセスを要求するとき、代理サーバＳ₂に常駐するプロファイル適合モジュール２０３はユーザの検索プロファイルセットからの各検索プロファイルｐ_kを逐次的に考慮して、どのニュース記事がユーザにとって最も関心が高そうかを決定する。ニュース記事は前のステップで階層クラスタツリーに自動的にクラスタ化されており、その結果、決定は各ユーザに対して迅速に行われ得る。階層クラスタツリーは、どの記事のターゲットプロファイルが検索プロファイルｐ_kに最も類似するかを決定するための決定ツリーとして機能する（serve）。関連する記事の検索はツリーの最上部で開始し、ツリーの各レベルにおいて、ｐ_kに最も近いクラスタプロファイルを有するブランチまたは複数のブランチが選択される。このプロセスはツリーのリーフに到達するまで再帰的に実行され、「ターゲットオブジェクトを検索する」のセクションで前述するように、ユーザにとって関心のある個別の記事が識別される。このプロセスの変形は、多くのユーザが類似した関心を有するという事実を利用する。各ユーザの各検索プロファイルについて別個に上記プロセスのステップ５〜９を実行するよりも、類似する検索プロファイルの各グループについてこれらのステップを一度だけ実行し、それにより多くのユーザのニーズを一度に満たすことによって付加効率を達成することができる。この変形においては、システムは大人数のユーザの検索プロファイルセットにおけるすべての検索プロファイルを非階層的にクラスタ化することによって開始する。クラスタプロファイルｐ_k を有する、検索プロファイルの各クラスタｋについて、システムは「ターゲットオブジェクトを検索する」のセクションで記載する方法を使用して、ｐ_kに類似するターゲットプロファイルを有する記事を見つける。次いで、見つけられた記事のそれぞれは、検索プロファイルのクラスタｋにおいて表現される検索プロファイルを有する各ユーザにとって関心のあるものとして識別される。上記の変形は、検索プロファイルのクラスタを記事の類似するクラスタと適合させようと試みることに注目されたい。これは対称的な問題であるので、以下のより一般的な変形が示すように、代わりに対称的な解決を与えられ得る。適合プロセスが開始する前のある点において、考慮されるべきニュース記事はすべて「ターゲットプロファイルクラスタツリー」と名付けられる階層ツリーにクラスタ化され、考慮されるべきすべてのユーザの検索プロファイルは「検索プロファイルクラスタツリー」と名付けられる第２の階層ツリーにクラスタ化される。以下のステップは、任意のターゲットプロファイルクラスタツリーからの個別のターゲットプロファイルと任意の検索プロファイルクラスタツリーからの個別の検索プロファイルとの間のすべての適合を見つけるために有用である。１．検索プロファイルクラスタツリーのルートの各子下位ツリーＳに対して（または、検索プロファイルクラスタツリーが１つの検索プロファイルしか含まない場合は、検索プロファイルクラスタツリー全体をＳとする）、２．クラスタプロファイルＰ_S を下位ツリーＳのすべての検索プロファイルの平均となるよう計算する。３．ターゲットプロファイルクラスタツリーのルートの各下位クラスタ（子下位ツリー）Ｔに対して（または、ターゲットプロファイルクラスタツリーが１つのターゲットプロファイルしか含まない場合は、ターゲットプロファイルクラスタツリー全体をＴとする）、４．クラスタプロファイルＰ_Tを下位ツリーＴのすべてのターゲットプロファイルの平均となるよう計算する。５．Ｐ_SとＰ_Tとの間の距離ｄ（Ｐ_S，Ｐ_T）を計算する。６．ｄ（Ｐ_S，Ｐ_T）＜ｔ、閾値である場合、７．Ｓが１つの検索プロファイルしか含まず、Ｔが１つのターゲットプロファイルしか含まない場合、その検索プロファイルとそのターゲットプロファイルとの間の適合を宣言し、８．そうでない場合、ステップ１に再帰して、ツリーＳの検索プロファイルとツリーＴのターゲットプロファイルとの間のすべての適合を発見する。ステップ６で用いられる閾値は、典型的にはＳおよびＴのクラスタ変数（またはクラスタ直径）の大きい方のアフィン関数またはその他の関数である。検索プロファイルとターゲットプロファイルとの間に適合が宣言されると必ず、ターゲットプロファイルに寄与したターゲットオブジェクトが、検索プロファイルに寄与したユーザにとって関心のあるものとして識別される。このプロセスは、考慮されるべきユーザのセットまたは考慮されるべきターゲットオブジェクトのセットが非常に小さいときでさえ適用され得るということに注目されたい。ユーザが１人である場合は、プロセスは１人のユーザにとって関心のある記事を識別するために与えられる方法に縮小する。ターゲットオブジェクトが１つである場合は、プロセスはそのターゲットオブジェクトが関心のあるものであるユーザを識別するための方法を構成する。記事リストをユーザに提示する一旦選択されたユーザまたはユーザのグループに対するプロファイル相関ステップが完了したら、ステップ１１０４において、プロファイル処理モジュール２０３は各ユーザに提示するための識別された記事のリストを格納する。ユーザの要求に基づき、プロファイル処理システム２０３は生成された関連する記事のリストを取り出して、この選択された記事のタイトルのリストをユーザに提示する。ユーザは次いで、ステップ１１０５において、任意の記事を閲覧するために選択し得る。（タイトルが入手できない場合、各記事の最初の文（複数の文）が使用され得る。）記事タイトルのリストは、記事のターゲットプロファイルの、ユーザの検索プロファイルセットにおける最も類似する検索プロファイルに対する類似性の度合いに応じて分類される。結果として得られる分類されたリストは、ユーザが自分のクライアントプロセッサＣ₁にいる場合は、ユーザクライアントプロセッサＣ₁にリアルタイムで送信されるか、またはユーザのクライアントプロセッサＣ₁に常駐するユーザのメイルボックスに送信され得るか、あるいはユーザが後で取り出せるようにサーバＳ₂内に格納される。送信のその他の方法は、印刷されたリストのファクシミリ送信またはテキスト−音声変換システムによる電話送信を含む。次いでユーザは、コンピュータ、ファクシミリまたは電話によって要求を送信して、ユーザが閲覧を希望する識別された記事があれば、どれかを指示し得る。ユーザは依然として、ユーザがアクセスを承認された任意の情報サーバＳ₄のすべての記事にアクセスし得るが、生成されたリストの下の方にある記事は、ユーザの検索プロファイルセットによって決定されるように、ユーザの関心からかけ離れている。サーバＳ₂はローカルデータ記憶媒体からまたは情報サーバＳ₄から記事を取り出し、記事をユーザのクライアントプロセッサＣ₁に１回に１スクリーンずつ提示する。ユーザはいつでも別の記事を読むために選択し得るまたはプロセスを終了し得る。どの記事が読まれるかをモニタリングするステップ１１０７において、ユーザの検索プロファイルセット生成器２０２は、ユーザがどの記事を読むかをモニタリングし、テキストの何ページがユーザによって閲覧されるか、記事の閲覧にどのくらいの時間が費やされるか、および記事の全ページが閲覧されたかを追跡する。この情報は組み合わされて、ユーザの記事に対する関心の深さを測定し得、前述のように、受動関連性フィードバックスコアを生み出し得る。正確な詳細は検索されている記事の長さおよび性質によるが、典型的な式は、記事の魅力の測定＝０．２（２ページ目がアクセスされる場合）＋０．２（全ページがアクセスされる場合）＋０．２（記事に３０秒を超える時間が費やされた場合）＋０．２（記事に１分を超える時間が費やされた場合）＋０．２（記事に費やされた分数がページ数の半分を上回る場合）であり得る。次いで計算された記事の魅力の測定は、ユーザの検索プロファイルセットを調整し、これによりユーザの動的に変化する関心をより正確に反映するための重み付け関数として使用され得る。ユーザプロファイルを更新するユーザの生成された検索プロファイルセットの更新は、同時係属中の米国特許出願シリアルナンバー08/346,425に記載される方法を用いて、ステップ１１０８において実行され得る。記事が読まれるとき、サーバＳ₂はセットにおける各検索プロファイルを、計算された記事の魅力の測定が高い近傍の記事のターゲットプロファイルの方向に若干移動させる。ユーザの検索プロファイルセットから属性ｕ_ikを有する検索プロファイルが、そして属性ｄ_jk（今のところ正しいと仮定する）を有する入手可能なＪの記事のセットが与えられると（ここでＩはユーザの指標であり、ｊは記事の指標であり、ｋは属性の指標である）、ユーザＩはＰの別個の記事のセットを選んで、選択された記事ｊについてｄ（ｕ_I，ｂ_j）の合計を最小限に抑えることが予測される。ユーザの所望の属性Ｕ_ikおよび記事の属性ｄ_jkは、ＴＦ／ＩＤＦなどの単語度数、ならびにおそらくは記事のソース、リーディングレベル、および長さなどのその他の属性のいずれかの形であり、一方ｄ（ｕ_I，ｄ_j）は前述の類似性測定を用いるこれら２つの属性ベクトル（プロファイル）の間の距離である。ユーザが予測とは異なるＰの記事のセットを選ぶ場合、ユーザ検索プロファイルセット生成モジュールは、ユーザが選択した記事をより正確に予測するために、ｕおよび／またはｄの調整を試みるべきである。具体的には、ｕ_Iおよび／またはｄ_jは、ユーザＩが記事ｊを選択しないと予測されたのに実際は記事ｊを選択した場合には、類似性を向上させるために、そしてユーザＩが記事ｊを選択すると予測されたのに選択しなかった場合には、おそらく類似性を減少させるためにも、移動されるべきである。好適な方法は、ユーザＩは記事ｊを選択しないという誤った予測のそれぞれについて、ｕ_ik’＝ｕ_ik− ｅ（ｕ_ik ｄ_jk）の式を用いて、ｕを移動する方法である。ここで、ｕ_Iは、ターゲットプロファイルに最も近いユーザＩの検索プロファイルセットからの検索プロファイルとなるよう選択される。ｅが正である場合、この調整は、アルゴリズムが閲覧者が選択した記事の予測に失敗した場合について、ｕ_Iをｄ_jに近付けることによって、ユーザＩの検索プロファイルセットとユーザＩが実際に選択する記事のターゲットプロファイルとの間の適合を向上させる。ｅの大きさは、検索プロファイルを実質的に変更するためにいくつの例示的記事を見なければならないかを決定する。ｅが大きすぎる場合、アルゴリズムは不安定になるが、ｅが十分に小さい場合、アルゴリズムはｕをその正しい値にする。概して、ｅは記事の魅力の測定に比例すべきである。例えば、ｅは、ユーザＩが記事ｊを読むのに長時間を費やす場合に比較的高くあるべきである。理論的には、上記の式はまた、アルゴリズムがユーザが読まなかった記事を予測した場合に、この場合はｅを負にすることによって、適合を減少させるために使用し得る。しかし、その場合、ｕが正しい方向に移動する保証はない。また、ユーザＩの属性の重みｗ_Iは、類似するアルゴリズム、ｗ_ik’＝（ｗ_ik−ｅ｜ｕ_ik−ｄ_j _k ｜）／Σ_k（ｗ_ik−ｅ｜ｕ_ik−ｄ_jk｜）を使用することによって、移動され得る。これは、単語度数を他の属性と組み合わせている場合に特に重要である。前述と同様、これはｅが正である場合、アルゴリズムがユーザが読んだ記事の予測に失敗した場合について、今度はユーザのターゲットプロファイルｕ_Iが記事のプロファイルｄ_jと異なる特性の重みを減少させることによって、適合を向上させる。再び、ｅの大きさは、最初に信じられていたものを置き換えるためにいくつの例示的記事を見なければならないかを決定する。ｕを調整する手順とは異なり、アルゴリズムがユーザが読まなかった記事を予測した場合について、ｅが負である場合、上記のアルゴリズムが適合を減少させるという事実もまた使用される。式の分母は、改変された重みｗ_I’を合計が１になるように再正規化することによって、重みが時間と共にゼロまで縮小することを防止する。ｕおよびｗはどちらもアクセスされた記事のそれぞれについて調整され得る。ｅが本来必要とされるように小さいとき、アルゴリズムの２つの部分の間にはコンフリクトはない。選択されたユーザの検索プロファイルセットは、ステップ１１０８において更新される。フィルタリング技術の更なる用途ニュースクリッピングサービスは、ニュース記事（または広告および購入可能物のクーポン）をオンライン上のユーザだけでなくオフラインのユーザにも配信し得る。オフラインユーザは関連性フィードバックを提供する方法を持ち得ないが、オフラインユーザＵのユーザプロファイルは、オンラインユーザのプロファイルと類似し得る。これは、例えば、ユーザＵはこれらの他のユーザに人口統計学的に類似し、従って、特定のターゲットオブジェクトに対するユーザＵの関心のレベルは、前述の一般関心推定方法によって推定し得るからである。１つの用途においては、ニュースクリッピングサービスは、ユーザＵにとって関心のあるものと予測されるニュース記事（それぞれ、広告およびクーポン）のセットを選択し、これによって印刷およびその他の方法によってユーザＵに物理的に送られ得るカスタム化新聞（それぞれ、広告／クーポン回状）の内容を決定する。概して、ユーザＵに送付される印刷された文書に含まれるターゲットオブジェクトは、ユーザのグループＧの間で最高の中央値の予測された関心を有するものであり、ここでグループＧは、１人のオフラインユーザＵか、ユーザＵに人口統計学的に類似するオフラインユーザのセットか、または同じ地域、従って同じ新聞配達ルート上にいるオフラインユーザのセットかのいずれかから構成される。変形においては、ユーザグループＧはいくつかの下位グループＧ１．．．Ｇｋにクラスタ化される。平均ユーザプロファイルＰｉが各下位グループＧｉから作成される。各記事Ｔおよび各ユーザプロファイルＰｉについて、ユーザプロファイルＰｉを有する仮定ユーザのＴに対する関心が予測され、グループＧにとっての記事Ｔの関心は、これらのｋ（人）の仮定ユーザのうちの任意のユーザの記事Ｔに対する最大の関心とされる。最後に、ユーザグループＧに対するカスタム化新聞が、グループＧにとって最も関心の大きい記事から構成される。ニュースクリッピングサービスのフィルタリング技術は、１つのソースによって提供されるニュース記事に限定されず、任意の数のソースから収集された記事またはターゲットオブジェクトに拡張し得る。例えば、関心のある新しいニュース記事を識別するよりも、この技術は、関心のある新しいまたは更新されたワールドワイドウェブのページを識別し得る。個別のユーザがメッセージをすべての関心のあるユーザに同報通信することを所望する、「同報通信クリッピング」と名付けられる第２の用途においては、ニュース記事のプールが同報通信されるメッセージのプールに置き換えられ、これらのメッセージはそれらに最も関心のある同報通信クリッピングサービス加入者に送られる。第３の用途においては、システムは現在進行中で、かつ公用と指定される、ネットワーク上のリアルタイムで話されるまたは書かれる討論のすべての写本をスキャンし、ニュースクリッピング技術を用いてユーザが参加に関心を持ち得る討論を迅速に識別したり、または進行中の討論への参加に関心を持ち得るユーザを迅速に識別して通知する。第４の用途においては、この方法は、従来のデータベース検索（例えば、所定の地域における、200,000ドル未満で売られるすべての家、Marcia Clarkに関するすべての１９９４年のニュース記事、またはすべてのイタリア語の映画の検索）によって発見された多くのターゲットオブジェクトをフィルタリングし、関心の順序にランク付けする後のプロセスとして使用される。第５の用途においては、この方法は、ハイパーテキスト文書におけるリンクを、ユーザのその文書または各リンクに関連するその他のオブジェクトに対する関心を推定することによってフィルタリングおよびランク付けするために使用される。第６の用途においては、企業または個人であり得る支払いをする広告者は、ニュースクリッピングサービスにおけるニュース記事に代わる広告またはその他のメッセージのソースである。商品を購入する消費者は、その商品の広告について肯定的な関連性フィードバックを提供したとみなされ、明らかに特定の広告のために（例えば、その広告から切り取られたクーポンを使用することによって）商品を購入する消費者は、その広告に関して特に高い関連性フィードバックを提供したとみなされる。このようなフィードバックは、消費者のクライアントプロセッサ（消費者が購入を電子的に行っている場合）、小売業者、または消費者が購入物の支払いに使用する（売り主の施設における）クレジットカード読み取り器によって、代理サーバに通信され得る。このような関連性フィードバックのデータベースが与えられると、次いで開示される技術を使用して、広告をそれに最も関心のあるユーザと適合させる。ユーザのために選択された広告は、電子メール、ユーザのスクリーン上における自動表示、または消費者が購入物の支払いを行っている小売施設におけるプリンタでの印刷を含むいくつかの手段の任意の１つによって、そのユーザに提示される。関心を識別するために使用される閾距離を特定の広告について増加して、システムに、広告者が支払う意志のある額に応じて、より多くのユーザにその広告を提示させ得る。本システムの能力の更なる使用法は、ユーザの投資ポートフォリオの管理である。ユーザに記事を推薦する代わりに、システムは投資であるターゲットオブジエクトを推薦する。上で株式市場投資の例で示したように、多くの異なる属性を共に使用して各投資をプロファイルし得る。ユーザの過去の投資行動がユーザの検索プロファイルセットまたはターゲットプロファイル関心サマリにおいて特徴付けられ、この情報を使用してユーザを過去の投資と性質が類似する株の機会（ターゲットオブジェクト）と適合させる。前述の迅速なプロファイル方法を使用して、新しいユーザのために好みのおおざっぱなセットを決定し得る。本システムで使用される品質属性は、その投資によって過去に支払われた配当金の変動の測定値、投資収入の定期的な流れに依存する保守的な投資家にとっては著しく負の重みを有する品質属性などの負に重み付けされた属性を含み得る。さらに、ユーザは、システムが株価をモニタリングして自動的に一定の行動を取り得る（例えば、一定の株の動きの特徴が合えば、購入または売却注文をする、またはユーザに通知をｅ−メールあるいはページングする）ように、フィルタパラメータを設定し得る。従って、システムは、選択された株が所定の価格に達したら、直ちにユーザに通知し得、ユーザは株式市場の活動をモニタリングする必要はない。ユーザの投資は、（その他の属性と共に使用される）「投資のタイプ」属性によって部分的にプロファイルされ得る。この属性は、債券、投資信託、成長株、収益株などを区別し、これによってユーザのポートフォリオを投資タイプによって区分分けする。次いで各投資タイプは投資機会を識別するために管理され得、ユーザは各タイプについて投資資本の所望の率を識別し得る。ｅ−メールフィルタ前述のニュースクリッピングサービスに加えて、所望のオブジェクトのカスタム化電子識別システムは、類似するが若干異なる様式で、ｅ＼＿メール環境において機能する。ニュースクリッピングサービスは、ニュースクリッピングサービスが選択して取り出さなければ加入者に到達しないであろう情報を選択し、取り出す。しかし同時に、多数のｅ−メールメッセージが実際、人間または自動プログラムによって生成されて送られ、ユーザに届く。これらのユーザは受け取られたメッセージを自動的に処理するｅ−メールフィルタを必要とする。必要な処理は、各メッセージに対して取るべき行動（メッセージのファイリング、優先度の高いメッセージの受信のユーザへの通知、メッセージに対する自動的応答を含むが、これに限定はされない）の決定を含む。ｅ−メールフィルタシステムは、ユーザの側に、学習および使用するために大きすぎる投資を要求するものであってはならず、ユーザはシステムが自動的に取る行動の適切性を信頼しなければならない。同じフィルタは、自動的にまたはユーザの要求に基づいて、音声認識または光学文字認識の周知の技術を使用して、電子的に格納されるテキストに変換された音声メールメッセージまたはファクシミリメッセージに適用され得る。フィルタリングの問題は以下のように定義され得る、すなわち、メッセージ処理関数ＭＰＦ（^*）は受け取られたメッセージ（文書）から行動の１つ以上のセットにマップする。非常に特殊であり得る行動は、ユーザｒによって事前に定義されるか、またはカスタム化され得る。各行動Ａは適切性関数Ｆ_A（^*，^*）を有し、これによりＦ_A（Ｕ，Ｄ）は、ユーザＵがメッセージＤを受け取るときに、ユーザＵに代わって行動Ａを選択することの適切性を表す実数を返す。例えば、Ｄが信頼できるソースから来るものであり、至急とマーク付けられている場合、そのメッセージを破棄することはユーザにとって大きな損害であり、適切性は低く、このためＦ_discard（Ｕ，Ｄ）は小さい一方、メッセージの受信にユーザの注意を引くことは非常に適切であり、このためＦ_alert（Ｕ，Ｄ）は大きい。決定された適切性関数を与えられると、関数ＭＰＦ（Ｄ）が使用され、適切な行動または複数の行動が自動的に選択される。例として、以下の行動のセットが有用であり得る。１．ユーザにメッセージの受信を至急通知する。２．メッセージを、ユーザが後で読むために待ち行列に挿入する。３．メッセージを、ユーザが後で読むために待ち行列に挿入し、ユーザに応答を提案する。４．メッセージを、ユーザが後で読むために待ち行列に挿入し、ユーザにそのメッセージを個人Ｒに転送することを提案する。５．メッセージを要約し、要約を待ち行列に挿入する。６．メッセージをユーザの秘書に転送する。７．メッセージをディレクトリＸにファイルする。８．メッセージをディレクトリＹにファイルする。９．メッセージを削除する（すなわち、メッセージを無視し、セーブしない）。１０．送信者に本題に関する更なるメッセージは不要であることを通知する。上記のサンプルリストの行動８および９は、ユーザにとって望ましくないメッセージ、または望ましくないソース（例えば、厄介なセールスマン）から受け取られるメッセージを、不要なメッセージを削除することによって、および／またはこの種のメッセージは読まれないことを示す応答を送ることによって、フィルタリングして除外するよう設計されていることに注目されたい。適切性関数は、特定の文書のターゲットプロファイルが与えられると、各行動の実行の適切性を記述するよう適応されなければならず、次いで適切性関数に対してある意味で最適であるメッセージ処理関数ＭＰＦが発見され得る。ＭＰＦの１つの妥当な選択は、適切性の最も高い行動を常に選択し、複数の行動が非常に適切であり、かつまた互いに矛盾しない場合は、１つを超える行動を選択する。例えば、メッセージに自動的に応答し、かつまた同じメッセージをディレクトリＸにファイルし、この結果ＭＰＦ（Ｄ）の値は、＼｛応答，ディレクトリＸにファイル＼｝というセットである。見慣れないタイプのメッセージに関してそうあるべきであるが、最も適切な行動さえ、適切性がユーザが指定した閾値を下回る場合は、システムはＭＰＦによって選択される行動（複数の行動）の確認をユーザに求める。さらに、ＭＰＦが、ある行動をほぼ同じくらい適切である別の行動に優先させて選択する場合、システムはまた、ユーザに確認を求める。例えば、メールは、ユーザに見せることがほぼ同じくらい適切であれば、削除されるべきではない。適切性関数を人手によって書くことは可能であるが、必要な時間およびユーザの専門知識の欠如により、この解決法は非実用的である。前述の自動ユーザプロファイリングシステムを使用した本システムの自動訓練が好適である。受け取られた文書はそれぞれ、プロファイルが、文書の全テキスト（ＴＦ／ＩＤＦスコアとして表される）、文書の送信者、送られた日付、文書の長さ、この送信者から最後に受け取られた文書の日付、キーワード、その他のアドレスのリストなどの属性を含むターゲットオブジェクトとしてみなされる。プロファイルされたターゲットオブジェタトに関する関心関数を、関連性フィードバックとターゲットオブジェクト間ならびにユーザ間で測定された類似性とを併用して推定する方法は前述した。ｅ−メールフィルタのコンテクストにおいては、タスクはいくつかの適切性関数Ｆ_A（^*，^*）を、１つの行動につき１つ推定することである。これは、先に使用されたトピック別関心関数ｆ（^*，^*）を推定する方法と全く同じ方法で取り扱われる。この場合の関連性フィードバックは、時間をかけて観察されたユーザの行動によって提供される。すなわち、ユーザＵが、自由にまたはシステムによって推薦された行動を選択あるいは確認することによって、文書Ｄについて行動Ａを選択するときは必ず、特に、ユーザが文書Ｄを見た後直ちにこの行動Ａを取る場合は、文書Ｄについての行動Ａの適切性は高いことを意味すると解釈される。適切性がないという推定（関心がないという先の推定に対応する）は、行動Ａがある文書について、ユーザまたは類似するユーザがこの文書または類似する文書に対して行動Ａを取ったことがない限り、不適切であると考えられるように使用される。具体的には、類似する文書が見られたことがない場合、どの行動も特に適切であるとは見なされず、ｅ−メールフィルタはユーザに、適切な行動を指定するように、あるいはｅ−メールフィルタによって選択された行動が適切なものであることを確認するように要求する。このように、ｅ−メールフィルタは、一定の属性または属性の組み合わせを有するｅ−メールメッセージに対して特定の行動を取るよう学習する。例えば、（２１２）領域コードに源を発するJohn Doeからのメッセージは、システムを促して、コピーを所定のファックス番号にファックス送信によって転送させ得るか、あるいはメッセージをユーザのクライアントプロセッサのディレクトリＸにファイルさせ得る。ある変形では、ユーザからのこの形態のアクティブな要求、例えば、John Doeからのメッセージはいずれも、追って通知があるまで所望のファックス番号に転送するという要求が可能である。このアクティブなユーザ入力は、自然言語または特定のコマンドが特定の属性および属性の組み合わせに関連付けられる形式ベースのインタフェースの使用を必要とする。更新の通知アーキテクチャの非常に重要かつ新規な特徴は、ユーザの検索プロファイルセットまたはターゲットプロファイル関心サマリによって決定されるように、ユーザに関連する新しいあるいは更新されたターゲットオブジェクトを識別する能力である。（「更新されたターゲットオブジェクト」は、文書の修正されたバージョンおよび購入可能な商品の新モデルを含む。）システムは、ｅ−メールメッセージまたはファクシミリ送信などの電子的な通知によって、これらの関連ターゲットオブジェクトをユーザに通知し得る。システムがｅ−メールメッセージを送る変形においては、ユーザのｅ−メールフィルタは、例えば、通知を直ちにユーザの目に留めさせることによって、または通知に指名されるターゲットオブジェクトを購入する電子要求を自動的に提出することによって、その通知に適切に応答し得る。後者の応答の簡単な例は、ｅ−メールフィルタによる、名目のまたはゼロの料金でのオンライン文書の取り出し、または中古商品あるいは競売可能物などの限られた量の購入可能物の購入要求である。アクティブナビゲーション（ブラウジング）クラスタツリーのナピゲーションによるブラウジング階層クラスタツリーはターゲットオブジェクトの収集物に有用な構成を与える。ツリーは、そのツリー内のすべてのターゲットオブジェクトのブラウジングを希望するユーザにとって直接役に立つ。このようなユーザは、はっきりと特定した目標を持ってあるいは持たないで収集物を探索し得る。ツリーはターゲットオブジェクトを一貫したクラスタに分割するので、ユーザが関心のあるターゲットオブジェクトを見つけ得る効率的な方法が提供される。ユーザはまず、メニューから最も高いレベルの（最大の）クラスタのうちの１つを選択し、このクラスタの下位クラスタをリストするメニューが提示され、これに基づいてユーザはこれらの下位クラスタの１つを選択し得る。システムはより大きなクラスタと共に格納された適切なポインタによって下位クラスタを見つけ、ユーザが別のメニューからその下位クラスタの１つを選択することを許す。このプロセスは、ユーザがツリーのリーフに来るまで繰り返され、これにより実際のターゲットオブジェクトの詳細がもたらされる。階層ツリーにより、大きなセットからの１つのターゲットオブジェクトの迅速な選択が可能になる。それぞれ１０項目（下位クラスタ）からなるメニューからの１０メニューの選択においては、１０¹⁰＝１０，０００，０００，０００（１００億）項目に到達し得る。好適な実施形態においては、ユーザはコンピュータスクリーンまたは端末スクリーン上でメニューを閲覧し、キーボードまたはマウスを使用してそれらから選択を行う。しかし、ユーザはまた、メニューを読む音声合成器を用いて、そしてユーザが電話のプッシュホン式のキーパッドにより下位クラスタを選択して、電話上で選択を行い得る。別の変形においては、ユーザはサーバへの２つの接続、すなわち電話音声接続およびファックス接続を同時に保守する。サーバはファックスによってユーザに連続的にメニューを送り、一方、ユーザは電話のプッシュホン式のキーパッドにより選択を行う。ユーザプロファイルが一般的に、ユーザの各ターゲットオブジェクトに対する関心の度合いを示す連想属性を含むのと全く同様に、ユーザプロファイルを、階層クラスタツリー内の各クラスタに対するユーザの関心の度合いを示す付加的連想属性で増強することが有用である。この関心の度合いは、ユーザが選択した下位クラスタまたはターゲットオブジェクトの合計数の割合として表される、所定のクラスタまたはその下位クラスタに関連するメニューからユーザが選択した下位クラスタまたはターゲットオブジェクトの数として数値的に推定され得る。この連想属性は、下位クラスタあるいはターゲットオブジェクトが複数のクラスタで現れることを可能にする「ソフト」または「ファジー」クラスタ化を用いて階層ツリーが構築された場合に、特に貴重である。ターゲット文書が「スポーツ」および「ユーモア」クラスタの双方に現れ、ユーザがそれを「ユーモア」クラスタに関連するメニューから選択する場合、システムはユーザと「ユーモア」クラスタとの間の連想を増加させるが、ユーザと「スポーツ」クラスタとの間の連想は増加させない。クラスタのラベル付けクラスタツリーをナビゲートしているユーザはメニューからいくつかの下位クラスタのうちの１つを選択することが繰り返し期待されるので、これらの下位クラスタは、その内容を人間であるユーザに示すように（ステップ５０３において）有用にラベル付けされなければならない。ラベルには各下位クラスタに関するいくらかの基本的な情報（例えば、その下位クラスタが含むターゲットオブジェクトの数（おそらくは１つのみ）および最近追加または更新されたターゲットオブジェクトの数）を含ませるのが明快である。しかし、クラスタの内容を示す付加的情報を表示することもまた必要である。この内容記述情報は、特に大きなまたは頻繁にアクセスされるクラスタについては、人間によって提供され得るが、自動的にもまた生成され得る。基本的な自動技術は、少数の高く重み付けられた属性のそれぞれに対して、クラスタの「特性値」を表示するだけである。数値属性の場合は、これは、その属性に対するクラスタの平均値を意味すると解釈し得る。従って、「封切りの年」という属性が、ユーザがどの映画を好むかの予測において高く重み付けられる場合、各クラスタのラベルの一部として封切りの平均年を表示するのが有用である。従って、ユーザは、あるクラスタが１９６２年頃に封切られた映画から構成され、一方別のクラスタは１９８２年頃の映画から構成されるということがわかる。「映画のタイトル」または「文書のタイトル」などの短いテキスト属性については、システムは、プロファイルがクラスタのプロファイル（クラスタのすべてのメンバの平均プロファイル）に最も類似するクラスタメンバ（ターゲットオブジェクト）の属性値（例えば、クラスタにおける最も典型的な映画のタイトル）を表示し得る。より長いテキスト属性については、クラスタのメンバの用語の平均ＴＦ／ＩＤＦスコアが、すべてのターゲットオブジェクトの用語の平均ＴＦ／ＩＤＦスコアを超える量が最大である用語を、絶対用語でまたはそうでなければ全ターゲットオブジェクトの用語のＴＦ／ＩＤＦスコアの標準偏差の小数部として選択するのが有用な技術である。選択された用語は、それらの形態論的語幹で置き換えられ、重複を排除し（従って、“slept” と“sleeping”の両方が選択された場合、それらは１つの用語“sleep”で置き換えられる）、近い類義語または同位置語（collocates）を任意に排除する（従って、“nurse”と“medical”の両方が選択された場合、それらは両方とも、“ nurse”、“medical”、“medicine”または“hospital”などの１つの用語で置き換えられ得る）。結果として得られる用語のセットは、ラベルの一部として表示される。最後に、自由に再配信できる小さな写真またはその他のグラフィック画像が、ラベル付けのためにクラスタ内のターゲットオブジェクトのいくつかと関連付けられる場合、システムはラベルの一部として、関連するターゲットオブジェクトがクラスタプロファイルに最も類似するターゲットプロファイルを有する画像のまたは複数の画像を表示し得る。ユーザのナビゲーションパターンは、ラベルの質に関する何らかの有用なフィードバックを提供し得る。具体的には、ユーザが特定のクラスタの探索をしばしば選択するが、素早く後戻りして異なるクラスタを試す場合、これは第１のクラスタのラベルが誤解を招くものであるという信号であり得る。その他の用語および属性が、第１のクラスタのための「次に最良である」代替ラベルを提供し得る限り、このような「次に最良である」ラベルは自動的に誤解を招くラベルと置き換えられ得る。さらに、いずれのユーザも自分の都合に合わせてローカルにクラスタを再ラベル付けし得る。ユーザによって提供されるクラスタラベルは、概してそのユーザにのみ可視であるが、これらのラベルを、ターゲットオブジェクトの「ユーザラベル」テキスト属性によって、広域使用することが可能である。この属性は、所定のターゲットオブジェクトについて、そのターゲットオブジェクトを含む任意のクラスタに任意のユーザによって提供されるすべてのラベルの連結であると定義される。この属性は類似性判断に影響を与える。例えば、ユーザによって「スポーツニュース」とラベル付けされることが多いクラスタのターゲット記事を、ユーザによって「国際ニュース」とラベル付けされることが多い、その他の点では類似していないクラスタの記事に若干類似するとシステムに見なさせ得る。これはまさに、各クラスタプロファイルの「ユーザラベル」属性は「ニュース」という用語に強く関連付けられているからである。「ユーザラベル」属性はまた、その他のテキスト属性と全く同様に、ラベルの自動生成において使用され、その結果、ユーザが生成したクラスタのラベルがしばしば「スポーツ」を含む場合、「スポーツ」という用語は自動的に生成されるラベルにも含まれ得る。メニューはラベル付けされたオプションの単純なリストとして表示される必要はない。メニューを、異なるメニューオプションの互いの関係をより詳しく示す形で表示または印刷することが可能である。従って、ある変形においては、メニューオプションは二次元でまたは三次元の遠近法によった図で視覚的にレイアウトされる。各オプションはテキストまたはグラフィックラベルとして表示または印刷される。オプションが表示または印刷される物理座標は以下の順序のステップによって生成される。（１）各オプションについて、それが表すクラスタのクラスタプロファイルを構築する、（２）各クラスタプロファイルから、前述のように数値ベクトルへの分解を構築する、（３）特異値分解（ＳＶＤ）を適用して、これらの数値ベクトルが最も大きく差別化される２つまたは３つの直交線形軸（orthogonal linear axes）のセットを決定する、そして（４）各オプションの座標を、この軸に沿ったそのオプションの数値ベクトルの投影された座標とする。ステップ（３）は、例えば６つの軸のセットを決定して、これによりステップ（４）がオプションを六次元空間でレイアウトするように変形され得る。この場合、ユーザは、原点を通る任意の平面への六次元のレイアウトの幾何学的投影を観察し得、またオプションの異なる構成を見るためにこの観察平面を回転させ得る。これは関連するクラスタのプロファイルの異なる属性に関する類似性を強調する。視覚表現において、クラスタラベルの大きさは対応するクラスタに含まれるオブジェクトの数に応じて変更され得る。更なる変更においては、親メニューからの全オプションは、すぐ前で説明したように、ある数の次元で表示されるが、現在のメニューに対応するオプションは、現在のメニュー上のオプションのより顕著な下位表示によって置き換えられる。任意に、この複合表示の規模は経時的に徐々に増加され得、これにより現在のメニュー上のオプションの表示に当てられるスクリーンの面積が増加され、ユーザが親クラスタを注視していて、現在のクラスタおよびその下位クラスタを「ズームイン（zooming in）」しているという視覚的印象が与えられる。更なるナビゲーション階層クラスタツリーは、複数のクラスタ選択が各ノードから分岐するように、または同じラベル付けされたクラスタが階層に順序付けられた複数のノードのための１つのブランチ（single branches）の形態で提示されるように構成され得るということが理解されるべきである。１つの変形においては、ユーザは、システムにクラスタプロファイルが現在選択されるクラスタのクラスタプロファイルと類似するクラスタの検索を要求することによって、隣接するクラスタの間の横方向のナビゲーションをも実行することができる。このタイプのナビゲーションが個別のオブジェクト（リーフの端部）のレベルで実行される場合、自動ハイパーリンクがナビゲーションが起こる際に形成され得る。これは最も近い隣接クラスタ化ナビゲーションが実行され得る１つの方法である。例えば、ターゲットオブジェクトがワールドワイドウェブのホームページである領域においては、このようなページの収集物は横方向にリンクされて、「仮想モール（virtual mall）」を形成し得る。前述の自動メニューシステムを使用する最も単純な方法は、ユーザがツリーの最上部でブラウジングを開始し、より特殊な下位クラスタへと移動することである。しかし、ある変形においては、ユーザは任意に、テキストおよび／またはその他の属性から構成される照会を提供し、この照会からシステムは、ここに記載する様式でプロファイルを構築し、任意にテキスト属性を、数値属性に分解する前に、ここに記載するように変更する。照会プロファイルは、その属性がユーザによって、非常に頻繁には一度だけの使用のために、明確に指定されるということを除いて、ユーザの検索プロファイルセットの検索プロファイルに類似し、検索プロファイルとは異なり、照会プロファイルは変化する関心を反映するように自動的に更新されない。テキスト記事の領域における典型的な照会は、「記事のテキスト」の属性の値として「ガリレオとメディチ家との間の関係について教えよ」を、そして「リーディングの困難さ」の属性の値として８（すなわち、８番目のグレードレベル）を有し得る。システムは前述の「ターゲットオブジェクトを検索する」のセクションの方法を用いて、照会プロファイルに類似するプロファイルを有する１つ以上のクラスタの小さなセットを自動的に見つけ、例えば、それらが含む記事はおおよそ８番目のグレードレベルで書かれており、ガリレオおよびメディチ家に言及する傾向にある。ユーザはこれらのクラスタの任意のクラスタでブラウジングを開始し得、それから下位クラスタ、上位クラスタおよびその他の近傍のクラスタへと移動し得る。特別な何かを探しているユーザにとっては、最大のクラスタで開始してより小さな下位クラスタを繰り返し選択するのは、探しているものの簡単な説明を書き、次いで、最初に推薦されたオブジェクトが正確には所望されるものではない場合に近傍のクラスタに移動するよりも概して効率が悪い。情報取り出しシステムにおいては、照会を文書と適合させることは通例であるが、照会が既に回答された質問に適合される興味深い変形が可能である。関連する領域は、質問が頻繁に回答されるカスタマーサービスセンター、電子ニュースグループ、またはベタービジネスビュロー（Better Business Bureau）である。新しい質問一回答の対のそれぞれは、質問を提供された回答と共に指定するテキスト属性と共に、ターゲットオブジェクトとして将来の参照のために記録される。文書タイトルに関して先に説明したように、このテキスト属性がＴＦ／ＩＤＦスコアに分解されるときは、質問は回答より重く重み付けされるべきである。従って、この属性の値としての「ガリレオとメディチ家との間の関係について教えよ」を指定する照会は、類似する質問とその回答のクラスタを見つける。ある変形においては、各質問一回答の対は、２つの別個のテキスト属性、すなわち質問に対して１つ、そして回答に対して１つでプロファイルされ得る。このとき照会は、質問属性のみを、または完璧さのために、質問属性および（より低く重み付けられた）回答属性の両方を「ガリレオとメディチ家との間の関係について教えよ」のテキストとして指定することによって、クラスタを見つけ得る。前述のフィルタリング技術はまた、ユーザのターゲットオブジェクト間のナビゲーションを助け得る。システムがユーザにターゲットオブジェクトのクラスタＣの下位クラスタのメニューを提示するとき、システムは同時にクラスタＣにおいて最も関心があるターゲットオブジェクトの付加的メニューを提示し得、その結果、ユーザは下位クラスタへのアクセスまたはターゲットオブジェクトの１つへの直接的なアクセスの選択を有する。この付加的メニューがｎ（個）のターゲットオブジェクトをリストする場合、昇順の１からｎの間の（１およびｎを含む）各Ｉについて、この付加的メニューでＩ番目に最も顕著なＴｏｐ（Ｃ，ｉ）と示される選択肢は、Ｔｏｐ（Ｃ，１）、Ｔｏｐ（Ｃ，２）、．．．Ｔｏｐ（Ｃ，Ｉ−１）のすべてから閾距離ｔよりも遠い、クラスタＣ内のすべてのターゲットオブジェクトを考慮し、そしてユーザの関心が最も高いと推定されるものを選択することによって発見される。閾距離ｔが０である場合、この手順から得られるメニューは、単純にクラスタＣ内のｎ（個）の最も関心があるオブジェクトを表示するが、閾距離を増加させて、表示されるターゲットオブジェクトのより多くの種類を達成し得る。概して、閾距離ｔはクラスタＣのクラスタ変数あるいはクラスタ直径のアフィン関数またはその他の関数となるよう選択される。新規な特徴として、ユーザＵは別のユーザＶ（例えば、著名な知識人または有名なスーパーモデル）を「装い」得る。ユーザＵがユーザＶを装っている限り、フィルタリング技術は、ユーザＵの好みによってではなく、むしろユーザＶの好みによって記事を推薦する。ユーザＵがユーザＶのユーザ特定データへのアクセスを有する限り（例えば、ユーザＶが財務上の考慮のためにこれらのデータをユーザＵに貸したという理由により）、ユーザＵはユーザＵの代理サーバＳに、一時的にユーザＶのユーザプロファイルおよびターゲットプロファイル関心サマリをユーザＵのユーザプロファイルおよびターゲットプロファイル関心サマリの代わりに用いるよう命令することによって、ユーザＶを装い得る。ある変形においては、ユーザＵは平均ユーザプロファイルおよびユーザのグループＧの複合ターゲットプロファイル関心サマリへのアクセスを有する。代理サーバＳにこれらをユーザＵのユーザ特定データの代わりに用いるよう命令することにより、ユーザＵはグループＧの典型的なメンバーを装い得、これは社会学的、政治学的、または市場調査のためにグループの好みを調べる際に有用である。より一般的には、ユーザＵは、代理サーバＳにユーザＵのユーザ特定データをユーザＵのユーザ特定データおよびユーザＶならびにグループＧのユーザ特定データの重み付けされた平均で一時的に置き換えるよう命令することによって、別のユーザＶまたはグループＧを「部分的に装い」得る。メニュー編成階層クラスタツリーの接続形態はそのツリーを構築する技術によって固定されるが、ユーザのナビゲーション用にユーザに提示される階層メニューはクラスタツリーと正確に同型である必要はない。メニューは典型的には人手によってまたは自動的に再編成された、クラスタツリーを若干改変したバージョンであり、これによりユーザは、ユーザにとって最も関心があるクラスタに容易にアクセスできる。メニューをユーザ特定の方法で自動的に再編成するために、システムはまず、ユーザにとって関心のある既存のクラスタを識別しようと自動的に試みる。システムはあるクラスタを関心があると識別し得るが、これは、ユーザがしばしばそのクラスタのターゲットオブジェクトにアクセスするから、またはより高度な変形においては、ここに開示する関連性フィードバックから関心を推定する方法を用いて、ユーザがクラスタのプロファイルに高い関心を有すると予測されるからである。次いで、いくつかの技術を使用して、関心があるクラスタをより容易にアクセス可能にし得る。システムはユーザの要求に基づき、またはいつでも、最も関心があるクラスタあるいは現在のクラスタの最も関心がある下位クラスタの特別なリストを表示し得、これによってユーザはこれらのクラスタのうちの１つをそのラベルに基づいて選択し得、それに直接ジャンプし得る。概して、システムがこのようにして関心があるクラスタのリストを構築するときは、リストのＩ番目に最も顕著なＴｏｐ（Ｉ）と示される選択肢は、Ｔｏｐ（１）、Ｔｏｐ（２）、．．．Ｔｏｐ（Ｉ−１）のすべてから閾距離ｔよりも遠い、すべての適切なクラスタＣを考慮し、そしてユーザの関心が最も高いと推定されるものを選択することによって発見される。ここで、閾距離ｔは任意に、後者のクラスタのプロファイルの、計算されたクラスタ変数またはクラスタ直径に依存する。階層メニューツリーを再編成するいくつかの技術がまた有用である。まず、メニューは、最も関心がある下位クラスタ選択肢が最も早くメニューに現れるように、または視覚的に関心があるとマークされるように再編成され得る。例えば、それらのラベルは、特別な色または書体で表示されるか、あるいは関心のおそらくのレベルを示す数字またはグラフィック画像と共に表示される。第２に、関心があるクラスタはツリーのより高いところにあるメニューに、すなわち、ツリーのルートのより近くに移動され得、これによりユーザがツリーのルートでブラウジングを開始する場合、それらへのアクセスはより簡単になる。第３に、関心のないクラスタはツリーのより低いところにあるメニューに移動され、より高いところに移動されている関心があるクラスタのための空間が作られ得る。第４に、（積極的な嫌悪を表す）特に低い関心スコアを有するクラスタは、単にメニューから抑制され得る。従って、子供を持つユーザはｑの決定に際し「俗悪」という属性に著しい負の重みを割り当て得、これにより俗悪なクラスタおよび文書は全く入手できなくなる。関心があるクラスタおよびそれらにおける文書がツリーの最上部に向かって移動するにつれて、特定のユーザによってより効率的にナビゲートされ得るカスタム化ツリーが発生する。メニューが選択されて、これにより各メニュー項目がほぼ均等な確率で選択される場合、ユーザが行わなければならない選択の期待数は最小限に抑えられる。例えば、ユーザが、プロファイルが図８におけるクラスタ（ａ，ｂ，ｄ）のクラスタプロファイルに類似するターゲットオブジェクトに頻繁にアクセスする場合、図９におけるメニューは図１０に示す構造を示すように改変され得る。関連性フィードバックからユーザの関心を推定する、ここに開示する一般的な技術を使用して関心があるクラスタを識別する変形においては、ユーザＵは「一時的関連性フィードバック」を提供して、自分の通常の関心に追加される一時的な関心を示すことができる。これは前述のように、照会、すなわちそのときのユーザの関心にぴったりと適合するテキストおよびその他の属性のセットを入力することによって行われる。この照会は「アクティブ」になり、２つの方法のうちのどちらかでシステムの関心の決定に影響を与える。１つのアプローチにおいては、アクティブな照会はあたかも任意のその他のターゲットオブジェクトであるかのように扱われ、照会であることによって、特に高い関心を示す関連性フィードバックを受け取ったと解釈される。代替のアプローチにおいては、ターゲットプロファイルがアクティブな照会のプロファイルに類似するターゲットオブジェクトＸは、ｑ（Ｕ，Ｘ）がターゲットオブジェクトＸの照会プロファイルに対する類似性と共に増加する項によって増分されるという点において、単により高い質ｑ（Ｕ，Ｘ）を有すると考えられる。どちらの方法も通常の関心推定値に影響を与える、すなわちユーザＵの通常の関心に適合する（かつ高品質ｑ（^*）を有する）クラスタは依然として関心のあるものと見なされ、プロファイルがアクティブな照会に類似するクラスタは特に高い関心を有すると判断される。照会およびユーザの通常の関心の両方に類似するクラスタはすべてのうちで最も関心が高い。ユーザはブラウジングの間の任意のときにアクティブな照会を改変または非活動化し得る。さらに、ユーザがブラウジング中に特に関心のあるターゲットオブジェクトまたはクラスタＸを発見する場合、ユーザは元の（おそらくは漠然とした）照会プロファイルを、ターゲットオブジェクトまたはクラスタＸのターゲットプロファイルで置き換えまたは増強し得、これによって元の照会を拡大またはより正確にして、Ｘに類似するオブジェクトに対する特別な関心を示す。例えば、ユーザが文書をブラウジングしていて、“Lloyd's”という単語を含む最初の照会を指定し、これによってシステムが“Lloyd's”という単語を含む文書がより関心が高いと予測し、前述のようにこのような文書またはこのような文書のクラスタをリストするという点にまで、それらをより簡単にアクセスできるようにすると仮定する。具体的には、“Lloyd's of London”という句を含む保険に関する一定の記事がより簡単にアクセスできるようにされ、“Lloyd's father” のような句を含むウェールズの小説の一定の断片もまたより簡単にアクセスできるようにされる。ユーザはこの照会がアクティブである間ブラウジングし、Lloy d's of Londonのその他の英国の保険会社との関係を説明する有用な記事に当たる。照会をこの記事の全テキストで置き換えるまたは増強することにより、ユーザはシステムの注意をこの記事に類似するその他の文書（例えば、ウェールズの民話よりもむしろ英国の保険会社に関する文書）に向けさせ得る。照会が使用されるシステムにおいては、ターゲットオブジェクトと、そのターゲットオブジェクトを見つけるために使用される照会において用いられる用語がどんなものであれ、その用語との間の連想を記録する連想属性をターゲットプロファイルに含めることが有用である。ターゲットオブジェクトＸの特定の照会用語Ｔとの連想スコアは、用語Ｔを含む照会がアクティブであった間になされたターゲットオブジェクトＸのアクセスだけについて平均され、すべての照会における用語Ｔの広域度数（global frequency）の否定対数（negated logarithm）を掛けられた、ターゲットオブジェクトＸに関する平均関連性フィードバックであると定義される。この連想属性の効果は、２つの文書の測定された類似性を、それらが同じ用語を含む照会に対する良好な応答である場合に増加させることである。更なる妙策を使用して、照会に対する応答の正確さを向上し得る。すなわち、ターゲットオブジェクトＸの質ｑ（Ｕ，Ｘ）の決定に使用される合算には、ターゲットオブジェクトＸとアクティブな照会における用語があればその用語のそれぞれとの間の連想スコアの合計に比例する項が含まれ、これによりアクティブな照会における用語と密接に関連するターゲットオブジェクトがより高い質、従ってユーザにとってより高い関心を有すると決定される。システムの、階層クラスタツリーの自動再編成を補足するために、ユーザは適宜ツリーを手で再編成する能力を与えられ得る。いずれの変更も任意にユーザのローカル記憶装置にセーブされ、これにより変更は将来のセッションにおけるツリーの提示に影響を与える。例えば、ユーザはメニューオプションをその他のメニューに移動またはコピーすることを選択し得、これによりそれ以後は、有用なクラスタが、ツリーのルートメニューから、またはその他の容易にアクセスされるあるいはトピック的に適切なメニューから直接選択され得る。別の例においては、ユーザは特定のメニューＭにリストされるクラスタＣ₁，_c.，．．．Ｃ_kを選択し得、メニュー上でそれらをクラスタＣ₁，_c.，．．．Ｃ_kからのすべてのターゲットオブジェクトを含む１つの集合クラスタＭ’で置き換えてこれらのクラスタをメニューから除去することを選択し得る。この場合、新しいクラスタＭ’のすぐ下の下位クラスタはクラスタＣ₁，_c.，．．．Ｃ_k自体とされるか、またはそうでなければ、「分散−収集」方法に類似する変形においては、クラスタＣ₁，Ｃ₂，．．．Ｃ_kのすべての下位クラスタのセットを、これらの下位セットのクラスタプロファイルの類似性に従ってクラスタ化することによって自動的に計算される。電子モール１つの用途においては、前述のブラウジング技術はターゲットオブジェクトが購入可能な商品である領域に適用され得る。買い物客がインターネットまたはその他の電子媒体上で購入する商品を探すとき、典型的には、消費者が探しているアイテムを見つける手助けとなる様式で、何千または何万の商品を表示する必要がある。現行の慣習は、類似するアイテムがひとまとめにされる手細工で作られるメニューおよび下位メニューの使用である。前述の自動化されたクラスタ化およびブラウジング方法を使用してアイテムをより効果的にグループ化して提示することが可能である。購入可能アイテムは複数の異なる基準を使用して階層的にクラスタ化され得る。購入可能アイテムのための有用な属性は、テキスト記述および（入手可能な場合は）事前に定義された範疇ラベル、アイテムの単価、ならびにこのアイテムを過去に購入したユーザをリストする連想属性を含むが、これに限定されない。このアイテムと同じ買い物「旅行」で他にどのアイテムがしばしば購入されるかを示す連想属性もまた有用である。同じ旅行でしばしば購入されるアイテムはこの属性に付いては類似すると判断され、従ってひとまとめにされる傾向にある。小売業者は、特定の顧客に人気がある可能性のあるアイテムの性質および相対数量の両方を予測する目的で、類似技術を利用することに関心があり得る。この予測は、集合購入記録を、ターゲットオブジェクトの収集物が推薦される検索プロファイルセットとして使用することによって行われ得る。各ターゲットオブジェクトアイテムの（相対的な）在庫数量を示す推定顧客需要は、（在庫がある）別のターゲットオブジェクトアイテムと比較されたそのアイテムのクラスタ変数を測定することによって決定される。前述のように、購入可能なターゲットオブジェクトの階層的なクラスタ化は、階層メニューシステムをもたらし、階層メニューシステムにおいては、各メニューに現れるターゲットオブジェクトまたはターゲットオブジェクトのクラスタは、名前あるいはアイコンによってラベル付けされ得、そして類似するアイテムが互いに物理的に近くにまたは図形で表される同じ「棚」の上に表示される、二次元または三次元のメニューで表示され得る。前述のように、このグループ化は特定のアイテムのレベル（例えば、標準サイズのIvory石鹸または大きなBreckシャンプー）およびアイテムのクラスのレベル（例えば、石鹸およびシャンプー）の両方で起こる。ユーザがアイテムのクラスを（例えば、その上でクリックすることによって）選択すると、より具体的なレベルの詳細が表示される。各アイテムを１つのグループに現れるように限定することは必要でも望ましくもない。オブジェクトが複数の範疇にある場合に顧客がそれを見つける可能性が高くなる。アートワーク、広告および無料サンプルなどの購入不可能なオブジェクトもまた、表示される購入可能オブジェクトが関連するユーザと実質的に同じユーザに関連する（好まれる）場合、購入可能ブジェクトの表示に付加され得る。ブラウジングシステムのネットワークコンテクストターゲットオブジェクトに関連するファイルは、典型的には、多くの異なるサーバＳ１−ＳｏおよびクライアントＣ１−Ｃｎに分散する。各ファイルは、スキャニング、キーボート入力、ｅ−メール、ＦＴＰ送信、別のコンピュータプログラムの制御下の別のファイルからの自動合成を含むが、これに限定されないいくつかの方法のうちの任意の方法で、あるサーバまたはクライアントにおけるデータ記憶媒体に入力されている。ユーザが効率的にターゲットオブジェクトを見つけることを可能にするシステムは、１つの集中化された機械にその階層クラスタツリーを格納し得るが、階層クラスタツリーの記憶がネットワークの多くの機械に分散された場合の方が、より高い効率が達成され得る。１メンバのクラスタ（ターゲットオブジェクト）を含む各クラスタＣは、ファイルＦによってデジタル方式で表され、これはトピック別マルチキャストツリーＭＴ（Ｃ１）にマルチキャストされる。ここで、クラスタＣ１は、クラスタＣ自体かクラスタＣのある上位クラスタかのどちらかである。このように、ファイルＦは複数のサーバに冗長性のために格納される。クラスタＣを表すファイルＦは、少なくとも以下のデータを含む。１．クラスタＣのクラスタプロファイル、またはこのクラスタプロファイルを再構築するに足りるデータ。２．クラスタＣに含まれるターゲットオブジェクトの数。３．「クラスタのラベル付け」セクションで前述するような、クラスタＣの人間が読み取り可能なラベル。４．クラスタが下位クラスタに分割される場合、下位クラスタを表すファイルに対するポインタのリスト。各ポインタは、第１にファイルの、第２にそのファイルが格納されるマルチキャストツリーまたは特定のサーバの指名を含む順序付けられた対である。５．クラスタが１つのターゲットオブジェクトから構成される場合、そのターゲットオブジェクトに対応するファイルに対するポインタ。クライアントの機械がマルチキャストツリーＭＴ（Ｃ１）からファイルＦを取り出し得るプロセスは、「マルチキャストツリーからファイルを取り出す」のセクションで前述した。クライアントは、一旦ファイルＦを取り出したら、このクラスタに関係する更なるタスク（例えば、下位クラスタのラベル付けされたメニューの表示）を実行し得る。このクラスタからユーザはクライアントが次に取り出す下位クラスタを選択し得る。この分散形実行の利点は３つの面を持つ。第１に、はるかに多くの検索およびデータの取り出しが同時に実行され得るので、システムはより大きなクラスタサイズおよびより多くのターゲットオブジェクトに合わせて調整（scaled）され得る。第２に、システムは、たとえシステムの一部分が一時的に利用不可能であっても、部分的な適合が達成され得るという点において、フォールトトレラントである。ここで、本発明の設計に固有の冗長性による頑強性に注目することが重要である。データはツリーのサイトで複製され、その結果、たとえサーバがダウンしても、データはどこか他のところで見つけられ得る。分散階層クラスタツリーは分散形式で、すなわち、多くのプロセッサを関与させて形成され得る。実際、ほとんどの用途において、分散階層クラスタツリーはときどき再形成されるべきである。これはユーザがターゲットオブジェクトと対話するにつれて、ターゲットオブジェクトのターゲットプロファイルにおける連想属性は、これらの対話を反映させるために変化するためである。従って、システムの類似性測定は、類似性を判断する際、これらの対話を考慮し得、これにより、より明瞭なクラスタツリーの構築が可能になる。重要な技術は、前述のような分散形式のそれぞれファイルＦ１．．．Ｆｎで表されるｎ（個）のはずされた（disjoint）クラスタツリーを、これらのツリーのすべてからのターゲットオブジェクトをすべて含む複合型クラスタツリーに併合する以下の手順である。ファイルＦ１．．．Ｆｎは、クラスタラベルが表現に含まれていないということを除いては、前述している。以下のステップは、サーバＳ１によって、別のサーバＳ０からの要求メッセージに応答して実行される。この要求メッセージは、ファイルＦ１．．．Ｆｎに対するポインタを含む。１．ファイルＦ１．．．Ｆｎを取り出す。２．ＬおよびＭを空リストにする。３．Ｆ１．．．Ｆｎの各ファイルＦｉについて、４．ファイルＦｉが下位クラスタファイルに対するポインタを含む場合、これらのポインタをリストＬに追加する。５．ファイルＦｉが１つのターゲットオブジェクトを表す場合、ファイルＦｉに対するポインタをリストＬに追加する。６．リストＬの各ポインタＸについて、ポインタＰが指すファイルを取り出し、このファイルが格納するクラスタプロファイルＰ（Ｘ）を抜き出す。７．クラスタ化アルゴリズムを適用して、リストＬのポインタＸを、それぞれのクラスタプロファイルＰ（Ｘ）間の距離に従ってグループ化する。８．（空でない）結果として得られるポインタのグループＣのそれぞれについて、９．Ｃがポインタを１つしか含まない場合、このポインタをリストＭに追加する。１０．そうでなければ、ＣがＦ１．．．ＦｎのファイルＦｉの１つと全く同じ下位クラスタポインタを含む場合、ファイルＦｉに対するポインタをリストＭに追加する。１１．そうでなければ、１２．例えばグループＣのポインタのうちの１つをランダムに選択し、それが指すサーバを選択することによって、ネットワーク上の任意のサーバＳ２を選択する。１３．グループＣの下位クラスタポインタを含むサーバＳ２に要求メッセージを送り、サーバＳ２に対応する下位クラスタツリーを併合するよう要求する。１４．サーバＳ２から、併合されたツリーを表すファイルＧに対するポインタを含む応答を受け取る。このポインタをリストＭに追加する。１５．Ｆ１．．．Ｆｎの各ファイルＦｉについて、１６．リストＭがファイルＦｉに対するポインタを含まない場合、Ｆｉを格納するサーバまたは複数のサーバに、ファイルＦｉを削除するよう命令するメッセージを送る。１７．下位クラスタポインタが厳密にリストＭの下位クラスタポインタである新しいクラスタを表すファイルＦを作成して格納する。１８．サーバＳ０に応答メッセージを送る。この応答メッセージは、ファイルＦに対するポインタを含み、ファイルＦが併合されたクラスタツリーを表すことを示す。上記の手順およびネットワークのすべての代理サーバを含むマルチキャストツリーＭＴ fullの助けを借りて、ターゲットオブジェクトの特定の領域のための分散階層クラスタツリーが、以下のように多くのローカル階層クラスタツリーを併合することによって構築される。１．１つのサーバＳ（好適には、良好な連結性を有するもの）がツリーから選ばれる。２．サーバＳは、ＭＴ_fullの各代理サーバ（すなわち、ネットワークの各代理サーバ）に、そのクライアントに対してクラスタツリー用のファイルを要求させるグローバル要求メッセージを、サーバＳ自身に送る。３．各代理サーバのクライアントは、保守するいずれのファイルをも代理サーバに送信する。このファイルは、クラスタツリーに追加されるべき適切な領域からのターゲットオブジェクトを示す。４．サーバＳは、受信されたら受信サーバＳ１に次の動作を取らせる要求Ｒ１を形成する。（ａ）Ｓ１のユーザベースにおけるユーザによって保守される、サーバＳ１に格納されるすべてのファイルの階層クラスタツリーを構築する。これらのファイルは適切な領域からのターゲットオブジェクトに対応する。このクラスタツリーは、典型的にはＳ１にその全体が格納されるが、原則として、分散形式で格納され得る。（ｂ）サーバＳ１が要求Ｒを伝播したサーバがすべて、クラスタツリーに対するポインタを含む受信応答メッセージを送るまで待つ。（ｃ）ステップ５（ａ）において形成されたクラスタツリーと、ステップ５（ｂ）において提供されたクラスタツリーとの併合を、前述の如く任意のサーバ（例えばＳ１自身）にこのような併合を要求するメッセージを送ることによって行う。（ｄ）（ｃ）で送られたメッセージに対する、併合されたクラスタツリーを表すファイルに対するポインタを含む応答を受け取ると、この応答を要求Ｒ１の送信者に、これがＳ１自身でない限り、転送する。５．サーバＳは、ＭＴ_fullの全サーバを、埋め込まれた要求Ｒ１に基づいて動作させるグローバル要求メッセージをサーバＳ自身に送る。６．サーバＳは５（ｃ）で送ったメッセージに対する応答を受け取る。この応答は、完成された階層クラスタツリーを表すファイルＦに対するポインタを含む。サーバＳはファイルＦを、ＭＴ_fullの全代理サーバにマルチキャストする。一旦前述のように階層クラスタツリーが形成されると、サーバＳはクラスタツリーを介して更なるメッセージを送り、マルチキャストツリーＭＴ（Ｃ）が十分に大きなクラスタＣのために形成されるように、および各ファイルＦがツリーＭＴ（Ｃ）にマルチキャストされるように手配し得る。ここでＣはファイルＦを含む最小のクラスタである。ユーザを仮想コミュニティと適合させる仮想コミュニティコンピュータユーザは、（インターネットリレーチャット(IRC)のように）タイプされるか、（インターネット電話のように）話されるかまたはテレビ会議で行われ得る、コンピュータ掲示板上の討論、ニュースグループ、郵送先名簿、およびコンピュータネットワーク上のリアルタイムのチャットセッションのために、頻繁に他のユーザに加わる。ここではこれらのフォーラムを「仮想コミュニティ」と呼ぶ。現在の慣習では、各仮想コミュニティは特定のトピックを有し、ユーザは関心のあるコミュニティを、口伝えで、あるいはコミュニティ（典型的には何百または何千）の長いリストを調べることによって発見する。次いでユーザは自分自身で、選択された仮想コミュニティに投函された、すなわちそれらのコミュニティのメンバーに対して公に入手可能にされたものの中から、何千というメッセージのどれに関心があるかを決めなければならない。所望する場合は、ユーザはまた、更なるメッセージを書いて、自分が選択した仮想コミュニティに投函し得る。何千というインターネット掲示板（ニュースグループとも呼ばれる）ならびに無数の更なるインターネット郵送先名簿および私設掲示板サービス（BB S's）の存在は、電子コミュニティのメンバーが、想像できる主題のほぼどんなものにも関するアイデアを討論するためのフォーラムに非常に強い関心があることを示している。現在、仮想コミュニティの形成はでたらめな形で行われ、通常、あるトピックが討論に値すると決める一個人によって開始される。インターネット上には、ニュースグループが形成されるべきかを決定するための投票のプロトコルがあるが、このプロトコルに従わない（接頭辞“alt.”で始まる）ニュースグループの大きな階層が存在する。ここに記載する所望のオブジェクトのカスタム化電子識別システムは、もちろん掲示板用のブラウザとして機能し得、ここではターゲットオブジェクトは掲示板または掲示板の下位トピックとされ、各ターゲットプロファイルはある掲示板に貼られた文書のクラスタのためのクラスタプロファイルである。従って、ユーザは、ブラウジングおよび照会を含む前述のすべてのナビゲーション技術によって、関心のある掲示板を見つけ得る。しかし、この方法は既存の仮想コミュニティを見つけるためにしか有用でない。人々は様々な且つ変化する複雑な関心を有するので、共通の関心を有する人々のグループを自動的に見つけて、仮想コミュニティを形成することが望ましい。後述する仮想コミュニティサービス（ＶＣＳ）は、共通の関心を有するネットワークのユーザを捜し出し、それらのユーザのために動的に掲示板または電子郵送先名簿を作成し、ｅ−メールによってユーザを互いに電子的に紹介する、ネットワークベースのエージェントである。一旦仮想コミュニティがＶＣＳによって形成されると、続いて前述のその他のブラウジングおよびフィルタリング技術を使用して、ユーザが特定の仮想コミュニティ（先在するものであれ、ＶＣＳによって自動的に生成されたものであれ）を見つけるのを助け得るということに注目することは有用である。同様に、所定の仮想コミュニティに送られたメッセージは、そのコミュニティに参加したユーザにとって関心および緊急性において異なり得るので、これらのブラウジングおよびフィルタリング技術（例えば、ｅ−メールフィルタ）をまた使用して、至急のメッセージにユーザの注意を引き、そして関心のないメッセージをスクリーニングして除外し得る。仮想コミュニティサービスの機能は、小さな企業のオフィスネットワークからワールドワイドウェブまたはインターネットに至るまでいかなるネットワークにおいても実行し得る一般的な機能である。手順の４つの主要ステップは以下の通りである。１．既存の仮想コミュニティへの投函をスキャンする。２．共通の関心を有するユーザのグループを識別する。３．必要であれば新しい仮想コミュニティを形成して、ユーザを仮想コミュニティと適合させる。４．引き続き既存の仮想コミュニティに更なるユーザを入会させる。より一般的には、ユーザは仮想コミュニティにメッセージを仮名を用いて投函し得、異なる仮想コミュニティに異なる仮名さえ用い得る。（仮名を用いた混合経路を使用しない投函は、通常通り、安全でない仮名、すなわちユーザの真のネットワークアドレスを使用する投函と見なされ得る。）従って、上述のステップは、より一般的には以下の通り表現され得る。１．既存の仮想コミュニティへの仮名を用いた投函をスキャンする。２．関連するユーザが共通の関心を有する仮名のグループを識別する。３．必要であれば新しい仮想コミュニティを形成して、仮名を用いるユーザを仮想コミュニティと適合させる。４．引き続き既存の仮想コミュニティに更なる仮名を用いるユーザを入会させる。これらのステップはそれぞれ後述のように実行され得る。スキャニング上述の技術を使用して、仮想コミュニティサービスは、所定のネットワーク上のすべてのニュースグループおよび電子郵送先名簿に投函されたすべてのメッセージを絶えずスキャンし、発見された各メッセージに対してターゲットプロファイルを構築する。ネットワークは、インターネット、またはアメリカ・オンライン（America Online）、プロディジー（Prodigy）あるいはコンピュサーブ（Com puServe）によって保守される掲示板のセットまたは１つの組織（例えば、大企業、法律事務所または大学）にローカルであり得る掲示板のより小さなセットであり得る。スキャニング動作は、仮想コミュニティサービスによって作成された掲示板および郵送先名簿に限定される必要はなく、仮想コミュニティサービスに先行するコミュニティ、または仮想コミュニティサービスシステム外の手段によって別の方法で作成されるコミュニティの活動を、これらのコミュニティが公用であるか、でなければ許可を与えるという条件で、スキャンするためにもまた使用し得る。各メッセージのターゲットプロファイルは、メッセージのタイトルおよび本文を指定するテキスト属性を含む。書かれたメッセージよりも話されたメッセージの場合、後者の属性は音声認識システムを使用して、音響音声データから計算され得る。ターゲットプロファイルはまた、メッセージの作者（複数の作者）および指定受信者（複数の指定受信者）をリストする連想属性を含み、受信者は個人および／または仮想コミュニティ全体であり得る。この属性が高く重み付けられる場合、システムは、同じセットの人々の間のメッセージを、そのメッセージのいくつかが非常に短いときに起こり得るように、たとえそのメッセージのトピックの類似性が内容から明らかでなくても、類似するまたは関連するものと見なす傾向がある。別の重要な属性は、以前のメッセージから引用された素材から構成されるメッセージの断片、および文書の特徴付けに概して有用な属性（例えば、メッセージの日付、長さ、およびリーディングレベル）を含む。仮想コミュニティの識別次に、仮想コミュニティサービスは共通の関心を有する仮名を用いるユーザのグループを識別しようと試みる。これらのグループは、ここでは「プレコミュニティ」と呼ぶが、仮名のセットとして表される。仮想コミュニティサービスは、プレコミュニティを識別すると必ず、続いて後述のように、このプレコミュニティにおけるユーザを互いに接触させようと試みる。各プレコミュニティは、メッセージ、仮名を用いるユーザ、検索プロファイルまたはターゲットオブジェクトのクラスタによって「決定」されると言われる。プレコミュニティを決定する通常の方法においては、仮想コミュニティサービスは、上記のステップでスキャンされそしてプロファイルされたメッセージを、それらのメッセージの計算されたターゲットプロファイルの類似性に基づいてクラスタ化し、従ってユーザ間の共通する関心を示す討論のスレッド（thread）を自動的に発見する。当然、１つの仮想コミュニティにおける討論は共通の関心を示す傾向にある。しかし、この方法は、掲示板および電子郵送先名簿を含むあらゆる利用可能な仮想コミュニティからのテキストをすべて使用する。実際、あるトピックについての討論の開始またはあるトピックについての討論への参加を希望するユーザは、そのトピックに関する「フィーラー（feeler）メッセージ」をフィーラーメッセージに指定された特別郵送先名簿に送り得る。前述のスキャニング手順の結果、フィーラーメッセージは、この特別郵送先名簿、トピック別郵送先名簿またはトピック別掲示板に送付された任意の同様にプロファイルされたメッセージと自動的にグループ化される。クラスタ化ステップは「ソフトクラスタ化」を用い、「ソフトクラスタ化」においては、メッセージは複数のクラスタに、従って複数の仮想コミュニティに属し得る。仮想コミュニティサービスによって発見され、かつ十分なサイズである（例えば、１０〜２０の異なるメッセージ）メッセージのクラスタのそれぞれは、メンバーがクラスタにおけるメッセージの仮名を用いる作者および受信者であるプレコミュニティを決定する。より正確には、プレコミュニティは、クラスタにおけるメッセージが送られ、受け取られた、様々な仮名から構成される。上記のスキャニングステップを必要としない、プレコミュニティを決定する代替方法は以下を含む。１．プレコミュニティは、単に類似するトピックについて既にメッセージを書いたあるいは受け取った個人だけでなく、任意の種類の類似する関心を有するユーザをひとまとめにすることによって生成され得る。各仮名に関連するユーザプロファイルが、例えば、ユーザが好む文書またはウェブサイトを示す連想属性を介してユーザの関心を示す場合は、仮名はその仮名に関連するユーザプロファイルの類似性に基づいてクラスタ化され得、結果として得られる仮名のクラスタはそれぞれ、クラスタにおける仮名を含むプレコミュニティを決定する。２．各仮名が、前述のニュースクリッピングサービスへの参加を介して形成される関連検索プロファイルセットを有する場合、すべての仮名を用いるユーザのすべての検索プロファイルは類似性に基づいてクラスタ化され得、検索プロファイルの各クラスタは、メンバーが、その検索プロファイルセットからクラスタにおける検索プロファイルが引き出される仮名であるプレコミュニティを決定する。このようなグループの人々は同じトピックについて読んでいた（または、より一般的には、類似するターゲットオブジェクトにアクセスしていた）ので、おそらく関心を共有する。３．ユーザがニュースクリッピングサービスまたはターゲットオブジェクトのための任意のその他のフィルタリングまたはブラウジングシステムに参加する場合は、個別のユーザは、そのシステムに知られる１つ以上のターゲットオブジェクトの特定のクラスタについて討論するために、仮想コミュニティの形成を仮名を用いて要求し得る。このターゲットオブジェクトのクラスタは、そのクラスタに対して最も関心を示すと決定されたユーザ（例えば、クラスタプロファイルに類似する検索プロファイルを有するユーザ）の仮名、および仮想コミュニティの形成を要求したユーザの仮名から構成されるプレコミュニティを決定する。ユーザをコミュニテイと適合させる仮想コミュニティサービスは、一旦プレコミュニティＭを決定するメッセージ、ユーザ、検索プロファイルまたはターゲットオブジェクトのクラスタＣを識別したら、このプレコミュニティのメンバーが共通の仮想コミュニティＶに参加する機会を有するように手配しようと試みる。多くの場合、既存の仮想コミュニティＶがプレコミュニティＭのニーズに適合し得る。仮想コミュニティサービスはまずこのような既存のコミュニティＶを発見しようと試みる。クラスタＣがメッセージのクラスタである場合、Ｖは、クラスタＣのクラスタプロファイルが仮想コミュニティＶに最近投函されたメッセージのセットの平均プロファイルの閾距離内であるような任意の既存の仮想コミュニティであるよう選択され得る。クラスタＣがユーザのクラスタである場合、Ｖは、クラスタＣのクラスタプロファイルが仮想コミュニティＶのアクティブなメンバーの平均ユーザプロファイルの閾距離内であるような任意の既存の仮想コミュニティであるよう選択され得る。クラスタＣが検索プロファイルのクラスタである場合、Ｖは、クラスタＣのクラスタプロファイルが仮想コミュニティＶのアクティブなメンバーの全検索プロファイルのクラスタ化の結果得られる最大のクラスタのクラスタプロファイルの閾距離内であるような任意の既存の仮想コミュニティであるよう選択され得る。そして、クラスタＣが別個のブラウジングまたはフィルタリングシステムから選択された１つ以上のターゲットオブジェクトのクラスタである場合、Ｖは、その別のシステムにおけるクラスタプロファイルがクラスタＣのクラスタプロファイルの閾距離内にあるクラスタから同様に開始された、任意の既存の仮想コミュニティであるよう選択され得る。それぞれの場合において使用される閾距離は、任意に平均値が比較されているプロファイルセットのクラスタ変数またはクラスタ直径に依存する。どの既存の仮想コミュニティＶもこれらの条件に合わず、またプレコミュニティＭのすべてのユーザを新メンバーとして受け入れようとしない場合は、仮想コミュニティサービスは新しい仮想コミュニティＶを形成しようと試みる。仮想コミュニティＶが既存のコミュニティであるか新しく形成されたコミュニティであるかにかかわらず、仮想コミュニティサービスは、関連するユーザＵが既に仮想コミュニティＶに（仮名Ｐを使って）属しておらず、かつ以前に仮想コミュニティＶへの参加の要求を拒絶していない、プレコミュニティＭにおける各仮名Ｐにｅ−メールメッセージを送る。ｅ−メールメッセージはユーザＵに仮想コミュニティＶの存在を知らせ、所望の場合ユーザＵが仮想コミュニティＶに参加するために従い得る命令を提供する。これらの命令は、仮想コミュニティＶが既存のコミュニティであるか新しいコミュニティであるかによって変わる。メッセージは仮名Ｐに付与される信用証明書（credential）を含み、この信用証明書は、ユーザＵが実際に参加を勧められたという証拠として、仮想コミュニティＶに参加する際にユーザＵによって提示されなければならない。ユーザＵが異なる仮名Ｑを使って仮想コミュニティＶに参加することを希望する場合は、ユーザＵはまず、前述のように、仮名Ｐから仮名Ｑに信用証明書を移し得る。ｅ−メールメッセージは、例えば最近コミュニティに送られたメッセージのタイトルのリスト、または（ある場合は）コミュニティによって提供される綱領（charter）あるいは紹介メッセージ、またはプレコミュニティＭを識別するために使用されたメッセージ、ユーザプロファイル、検索プロファイルあるいはターゲットオブジェクトのクラスタの内容を識別する、前述の方法によって生成されたラベルを含めることによって、コミュニティの共通の関心の指示をさらに提供する。仮想コミュニティサービスが新しいコミュニティＶを形成しなければならない場合、新しいコミュニティのメンバーが互いに通信できるようにするために、いくつかの方法が使用可能である。プレコミュニティＭが大きい場合、例えば５０を上回るユーザを含む場合、仮想コミュニティサービスは、典型的には、後述のようにマルチキャストツリーを確立するか、あるいは広域配信掲示板を、新しい掲示板に名前を割り当てて確立する。プレコミュニティＭが、例えば２〜５０という、より少ないメンバーを有する場合は、仮想コミュニティサービスは、典型的には、後述のようにマルチキャストツリーを確立するか、あるいはｅ−メール郵送先名簿を確立する。新しい仮想コミュニティＶがメッセージのクラスタによって決定された場合、仮想コミュニティサービスはこれらのメッセージを仮想コミュニティＶの全メンバーに配信することによって討論を開始する。掲示板および郵送先名簿に加えて、形成され得る、そして仮想コミュニティが集まり得る代替のフォーラムは、コンピュータネットワーク上のリアルタイムにタイプされるまたは話される会話（または従事（engagement）あるいはビデオゲームを含む分散形マルチユーザ用途）および物理的な会合を含み、これらはいずれも、仮想コミュニティサービスがプレコミュニティＭの全メンバーから会合時間の希望を要求し、適切な会合時間をこれらの個人に通知する、部分的に自動化されたプロセスによって予定され得る。入会の継続新しい仮想コミュニティの形成後でさえも、仮想コミュニティサービスは、ターゲットプロファイルがそのコミュニティのクラスタプロファイル（平均メッセージプロファイル）に類似する新しいメッセージを探して、その他の仮想コミュニティをスキャンし続ける。このようなメッセージはいずれもコピーがその新しい仮想コミュニティに送られ、これらのメッセージの仮名を用いる作者およびこのようなメッセージを読むことに高い関心を示すユーザは、仮想コミュニティサービスによって、（上記のプレコミュニティメンバーのためと同様）そのコミュニティへの参加を希望し得ることを知らされる。次いでこのようなユーザはそれぞれ、コミュニティに参加するか否かを決定し得る。インターネットリレーチャット（IRC）の場合は、リアルタイムダイアログにおけるメッセージのターゲットプロファイルがユーザのそれと類似している（または類似するようになる）と、ＶＣＳはまた、このようなユーザに至急のｅ−メールメッセージを送り得、これによってユーザは、所望であれば、ダイアログが現れると直ちに自動的に通知され得る。これらの能力を用いて、仮想コミュニティサービスは任意のローカルまたは広域エリアネットワークにおける新しい仮想コミュニティの自動的形成、およびネットワーク上の、仮想コミュニティサービスによって作成されたものではないものを含むすべての仮想コミュニティの保守を提供する。仮想コミュニティサービスの基礎をなす中核となる技術は、ユーザが関心を共有するという点において「類似する」記事を発見し得る検索およびクラスタ化の仕組みを創成することである。これはまさに上記に記載したことである。仮想コミュニティサービスは、本当に関心のないコミュニティに関する通知でユーザを攻撃するのではないということが確実に理解されなければならない。非常に小さいネットワーク上では、人間は「輪の中に（in the loop）」存在し得、提案された仮想コミュニティをスキャンし、おそらくはそれらに名前を付けさえする。しかし、より大きなネットワーク上では、仮想コミュニティサービスは、多数の仮想コミュニティを発見する可能性があるので、完全に自動的な様式で動作しなければならない。仮想コミュニティにメッセージを配信する一旦仮想コミュニティが識別されたら、仮想コミュニティサービスが郵送先名簿を作成し、これによって仮想コミュニティの任意のメンバーがその他のすべてのメンバーにｅ−メールを配信し得ることは明瞭である。配信の別の方法は、従来のネットワーク掲示板またはニュースグループを使用してメッセージをネットワークの全サーバに配信し、ここでそれらのメッセージは仮想コミュニティのいずれのメンバーによってもアクセスされ得るというものである。しかし、これらの単純な方法は、メッセージを仮想コミュニティに搬送するためのマルチキャストツリーの構築を最適化することから生じるコストおよび性能の利点を考慮しない。ニュースグループとは異なり、マルチキャストツリーはメッセージをサーバの選択されたセットにしか配信せず、そしてｅ−メール郵送先名簿とは異なり、マルチキャストツリーはサーバの選択されたセットへのメッセージの配信を効率的に行う。以下の４つの手順を使用して、別個のマルチキャストツリーＭＴ（Ｖ）が各仮想コミュニティＶに対して保守される。１．このマルチキャストツリーを構築または再構築するために、仮想コミュニティＶのコアサーバは、仮想コミュニティＶの少なくとも１人の仮名を用いるメンバーをサーブする代理サーバとされる。次いでマルチキャストツリーＭＴ（Ｖ）が上記の「マルチキャストツリー構築手順」のセクションのステップ４〜６によって確立される。２．新しいユーザが既存の仮想コミュニティである仮想コミュニティＶに参加するとき、ユーザはユーザの代理サーバＳにメッセージを送る。ユーザの代理サーバＳが既にＶのコアサーバでない場合は、代理サーバＳはコアサーバとして指定され、以下のようにマルチキャストツリーＭＴ（Ｖ）に追加される。マルチキャストツリーＭＴ（Ｖ）が最後に再構築されてからｋを超えるサーバが追加されている場合（ここでｋは既にツリーにあるコアサーバの数の関数である）、ツリー全体が単に上記の「マルチキャストツリー構築手順」のセクションのステップ４〜６によって再構築される。そうでない場合は、サーバＳはＶに対して近傍のコアサーバのローカル格納リストを取り出し、サーバＳ１を選択する。サーバＳは制御メッセージをＳ１に送り、マルチキャストツリーＭＴ（Ｖ）への追加を希望することを示す。このメッセージを受け取ると、サーバＳ１はＭＴ（Ｖ）のローカル格納下位ツリーＧ１を取り出し、Ｓ１自体以外のすべての次数１の頂点を除去することによって新しいグラフＧをＧ１から形成する。サーバＳ１はグラフＧをサーバＳに送信し、サーバＳはそれをＭＴ（Ｖ）のローカル格納下位ツリーとして格納する。最後に、サーバＳは、それ自身およびグラフＧの頂点であるサーバのすべてにメッセージを送り、これらのサーバに、Ｓを頂点として追加し、Ｓ１とＳとの間に辺を追加することによってＭＴ（Ｖ）のこれらのサーバのローカル格納下位ツリーを改変するよう命令する。３．クライアントｑのユーザがメッセージＦを仮想コミュニティＶに送ることを希望するときは、クライアントｑはメッセージＦを要求Ｒに埋め込み、受信者にメッセージＦを、仮想コミュニティＶのメンバーによるアクセスのために、限られた時間の間、ローカルに格納するように命令する。要求Ｒは、そのユーザが仮想コミュニティＶのメンバーであるか、あるいはそうでなければ仮想コミュニティＶにメッセージを投函する資格がある（例えば、仮想コミュニティＶまたはその他の仮想コミュニティのメンバーによって「黒星を付けられて」いない）ことを証明する信用証明書を含む。次いでクライアントｑは、前述のようにユーザの代理サーバに送信されるグローバル要求メッセージによって、マルチキャストツリーＭＴ（Ｖ）の全コアサーバに要求Ｒを同報通信する。コアサーバは、含まれる信用証明書を確認し得る限り、要求Ｒを満たす。４．仮想コミュニティＶに送られた特定のメッセージを取り出すために、クライアントｑのユーザＵは「マルチキャストツリーからファイルを取り出す」のセクションで前述したステップを開始する。ユーザＵが特定のメッセージを取り出すことを希望せず、むしろ仮想コミュニティＶに送られたすべての新しいメッセージを取り出すことを希望する場合、ユーザＵは、（Ｖのコアサーバである）代理サーバに、一定の日付の後にＭＴ（Ｖ）にマルチキャストされたメッセージをすべてユーザＵに送るように仮名を用いて命令する。どちらの場合もユーザＵは、ユーザＵが仮想コミュニティＶのメンバーであるか、そうでなければ仮想コミュニティＶのメッセージにアクセスする資格があることを証明する信用証明書を提供しなければならない。要旨ユーザにとって関心のある記事を自動的に選択する方法が提示された。方法は、ユーザによって読まれる記事における単語の発生の相対度数などのような属性に基づいて、ユーザのための検索プロファイルのセットを生成し、これらの検索プロファイルを使用して、関心のある将来の記事を効率的に識別する。方法は、受動的モニタリング（ユーザは記事を明確に評価する必要はない）、１ユーザ当たりの複数の検索プロファイル（複数のトピックに対する関心を反映する）、およびデータから自動的に決定される検索プロファイルの要素の使用（特に、単語度数および購入可能アイテムの記述に基づくＴＦ／ＩＤＦ測定）によって特徴付けられる。自動的にメニューを生成して、ユーザが関心のあるトピックに関する記事を見つけ、そして取り出すことを可能にする方法もまた提示された。この方法は、単語発生の相対度数によって測定されるような類似性に基づいて記事をクラスタ化する。クラスタは、記事のタイトルか記事から抜き出されたキーワードかのどちらかでラベル付けされる。方法は、多くの機械に分散する記事の大きなセットに適用され得る。上記の方法を、記事から、プロファイルが生成され得るターゲットオブジェクトの任意のクラス（ニュース記事、参考または仕事の（work）記事、電子メール、商品またはサービスの記述、人々（その人々が読む記事、人口統計学的データ、または購入する商品に基づく）、そして電子掲示板（投函される記事に基づく）を含む）に拡張する方法がさらに示された。関心によって人々をグループ化できることの特定の結果は、共通の関心を持つ人々の仮想コミュニティを形成し得、これにより共通の関心を持つ人々は電子メールを介して互いに通信し得るということである。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＡＭ，ＡＵ，ＢＲ，ＢＹ，ＣＡ，ＣＮ，ＥＥ，ＩＬ，ＩＳ，ＪＰ，ＫＰ，ＫＲ，ＫＺ，ＬＶ，ＭＮ，ＭＸ，ＮＺ，ＲＵ，ＳＧ，ＴＭ，ＴＲ，ＵＡ，ＵＺ，ＶＮ (72)発明者スミス，ジョナサンエム. アメリカ合衆国ニュージャージー 08540−4165，プリンストン，プリンストン−キングストンロード 771 (72)発明者サルツバーグ，スティーブンエル. アメリカ合衆国メリーランド 21210, ボルチモア，ウィックフォードロード 4409 【要約の続き】て相互接続される多くのユーザから構成される大規模なシステムにおいて、情報の配信を効率的に編成するために使用され得る。さらに、暗号化ベースの仮名代理サーバが提供され、ユーザのターゲットプロファイル関心サマリのプライバシーを、第三者がこのサマリにアクセスする能力、およびユーザを識別あるいはユーザに接触する能力に対する制御をユーザに与えることによって、確保する。

Claims

【特許請求の範囲】１．ユーザに、電子記憶媒体を介してアクセス可能な複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの選択されたものへのアクセスを提供する方法であって、該ユーザが、ユーザ端末およびデータ通信接続を介して、該電子記憶媒体を含むターゲットサーバシステムに接続され、該電子記憶媒体に格納されたターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットについてターゲットプロファイルを自動的に生成するステップであって、該ターゲットプロファイルのそれぞれが、該ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうち関連するものの内容から生成されるステップと、ユーザ端末におけるユーザについて少なくとも１つのユーザターゲットプロファイル関心サマリを自動的に生成するステップであって、該ユーザターゲットプロファイル関心サマリのそれぞれが、該ユーザによってアクセスされる該ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのいくつかから生成されるステップと、ユーザによる、該ターゲットプロファイルを介する、該電子記憶媒体上に格納される該複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットへのアクセスを可能にするステップと、を包含する方法。２．前記アクセスを可能にするステップが、識別されたユーザに対して生成される前記ユーザターゲットプロファイル関心サマリを、前記生成されたターゲットプロファイルと相関させて、前記電子記憶媒体上に格納される前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうち該識別されたユーザに対して関心のある可能性のあるものを識別するステップを包含する、請求項１に記載の方法。３．前記アクセスを可能にするステップが、前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの前記識別されたもののうちの少なくとも１つを、前記識別されたユーザに、該ユーザが該複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの該識別されたもののうちの該少なくとも１つを要求する前に送信するステップをさらに包含する、請求項２に記載の方法。４．前記アクセスを可能にするステップが、前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの前記識別されたもののうちの少なくとも１つを識別するリストを、前記識別されたユーザに送信するステップと、前記電子記憶媒体上に格納される該複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの該識別されたものを、前記ターゲットサーバシステムから、前記電子通信接続を介して該ターゲットサーバシステムよりも前記ユーザ端末により近くに位置する指定されたサーバに送信するステップと、をさらに包含する、請求項２に記載の方法。５．前記アクセスを提供するステップが、前記識別されたユーザが前記ユーザ端末の１つを起動して前記リスト上の前記選択されたアイテムを識別することに応答して、該識別されたユーザの該選択されたアイテムの選択を示すデータを、該１つのユーザ端末から、前記指定されたサーバに、前記データ通信接続の１つを介して送信するステップを包含する、請求項４に記載の方法。６．前記アクセスを提供するステップが、前記１つのユーザ端末からの前記データの受信に応答して、前記指定されたサーバから、前記選択されたアイテムによって識別されるターゲットオブジェクトを取り出すステップと、該取り出されたターゲットオブジェクトを、前記識別されたユーザに対する表示のために、該１つのユーザ端末に送信するステップとをさらに包含する、請求項５に記載の方法。７．前記自動的にターゲットプロファイルを生成するステップが、前記ユーザを、前記電子媒体上に格納される前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの少なくとも１つの下位セットに導く階層メニューを自動的に生成するステップであって、該階層メニューを自動的に生成するステップが、該下位セットにおけるすべてのターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットを、該ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの内容の類似性の経験による測定に基づいて、ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの複数のクラスタに分類するステップと、該複数のクラスタのそれぞれに分類されたターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの共通の内容を識別する階層メニュを生成して、前記識別されたユーザが、該電子記憶媒体上に格納される該複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうち該識別されたユーザに対して関心のある可能性のあるものを識別することを可能にするステップとを包含する、請求項１に記載の方法。８．前記分類するステップが、前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットを、該ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの内容の類似性の前記経験による測定に基づいて、少なくとも２つのクラスタに分割するステップと、該少なくとも２つのクラスタを、該ターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットの内容の類似性の該経験による測定に基づいて、少なくとも２つの下位クラスタに再分割するステップと、識別されたクラスタの多レベル階層を形成するために、該再分割するステップを繰り返すステップとを包含する、請求項７に記載の方法。９．前記階層メニューを生成するステップが、前記クラスタに分類された前記複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの該クラスタの中心に最も近いもののうちの少なくとも１つのターゲットオブジェクトを選択するステップと、該複数のターゲットオブジェクトおよびターゲットオブジェクトの特徴のセットのうちの該クラスタに分類されたもののターゲット内容を示すクラスタプロファイルを定義（ascribe）するステップであって、該クラスタプロファイルが、該選択された少なくとも１つのターゲットオブジェクトのタイトル、および最も高い相対度数を有する該選択された少なくとも１つのターゲットオブジェクトクラスタのターゲットプロファイルに含まれる単語のセットのうちの少なくとも１つの要素を含むステップとを包含する、請求項７に記載の方法。