JP2007149057A - 個人化検索のためのシステム及び方法 - Google Patents

個人化検索のためのシステム及び方法 Download PDF

Info

Publication number
JP2007149057A
JP2007149057A JP2006150629A JP2006150629A JP2007149057A JP 2007149057 A JP2007149057 A JP 2007149057A JP 2006150629 A JP2006150629 A JP 2006150629A JP 2006150629 A JP2006150629 A JP 2006150629A JP 2007149057 A JP2007149057 A JP 2007149057A
Authority
JP
Japan
Prior art keywords
user
history
information
documents
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006150629A
Other languages
English (en)
Other versions
JP5214115B2 (ja
JP5214115B6 (ja
Inventor
Ed H Chi
エイチ チー エド
Fabio Gasparetti
ガスパレッティ ファビオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Palo Alto Research Center Inc
Original Assignee
Palo Alto Research Center Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36655036&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2007149057(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Palo Alto Research Center Inc filed Critical Palo Alto Research Center Inc
Publication of JP2007149057A publication Critical patent/JP2007149057A/ja
Publication of JP5214115B2 publication Critical patent/JP5214115B2/ja
Application granted granted Critical
Publication of JP5214115B6 publication Critical patent/JP5214115B6/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】個人化検索のためのシステム及び方法を提供すること。
【解決手段】個人化検索の結果をユーザに提供する技術が提示される。随意的にプロジェクト又はタスクに分類されたユーザ履歴が決定される。キーワード、概念、又はユーザ履歴ドキュメント内の他のユーザ及び/又はタスク特有記述子を識別することによって、ユーザについてのプロファイルが決定される。ユーザの履歴に基づいた近接区域及び調整可能なクローリング・パラメータが決定される。調整可能なクローリング・パラメータは、ユーザ履歴内のドキュメントにリンクされたどのドキュメントが近接区域内に含まれるかを定める。ユーザ・クエリが決定され、このユーザ・クエリを用いて、近接区域内のドキュメントの組を検索する。次に、結果は、ユーザ・プロファイル情報に基づいてランク付けされる。ランク付けされた結果は、随意的にユーザに表示される。
【選択図】図7

Description

本発明は、情報の検索(retrieval)に関する。
検索エンジンは、ウェブ、イントラネット、ファイル・サーバ、及び他の動的な情報リポジトリにわたって利用可能な、絶えず変化する大量のリソースの表示を提供する。従来の個人化検索システムは、ユーザ・プロファイルに基づいて検索結果を個人化することによって、前にアクセスした情報の検索を容易にする。
したがって、「Stuff I’ve Seen:A System for Personal Information Retrieval and Re−use」、第26回Annual International ACM SIGIR Conference、7月28日−8月1日、2003年において、Dumais他によって説明されたシステム、及び、Googleのディスクトップ検索システムは、ウェブ及びファイル検索機能を、前にアクセスした情報の検索を助ける単一のシステムに統合するものである。有用ではあるものの、これらのシステムは、ユーザの現在の情報検索目的に関連する、新しい、まだ見ていない情報の発見に焦点を置くものではない。
本出願は、2005年4月29日に出願された米国特許仮出願番号第60/676,462号の利益を主張するものであり、この特許の開示の全体が、引用によりここに組み入れられる。
本発明は、ARDA NIMD契約番号#A904−03−C−0404号のもとで、米国政府の支援により行われたものである。米国政府は、本発明における一定の権利を所有することができる。
したがって、個人化検索のためのシステム及び方法が有用である。
本発明によるシステム及び方法は、個人化検索の結果を決定するものである。随意的にプロジェクト又はタスクに分類されたユーザ履歴が決定される。キーワード、概念、又はユーザ履歴ドキュメント内の他のユーザ記述子を識別することによって、ユーザについてのプロファイルが決定される。ユーザの履歴に基づいた近接区域が決定される。調整可能なクローリング・パラメータに基づいて、近接区域が決定される。調整可能なクローリング・パラメータは、ユーザ履歴にリンクされたどのドキュメントが近接区域内に含まれるかを定める。ユーザ・クエリが決定され、このユーザ・クエリを用いて、近接区域を検索する。近接区域にわたる検索結果は、ユーザ・プロファイル情報に基づいてランク付けされ、随意的にユーザに表示される。
図1は、本発明による、個人化検索のための例示的な第1のシステム100の概要である。個人化検索のためのシステムは、通信リンク99を介して、通信可能なパーソナル・コンピュータ300、及び、ドキュメント1000〜1002へのアクセスを提供する情報リポジトリ200に接続される。
通信可能なパーソナル・コンピュータ300のユーザが、ドキュメント1000〜1002についてのクエリを開始する。検索履歴が検索される。検索履歴は、インターネット・ブラウザ、ドキュメントのアクセスを仲介するプロクシ・サーバ、ライブラリ・マネージャ、及び/又は、周知の又は後に開発される任意のユーザ情報検索トランザクション源から検索される。ユーザ履歴に基づいて、ドキュメントの近接区域が決定される。近接区域は、前にアクセスされたドキュメントのあるしきい値リンク距離内でリンクされたドキュメントを含む。種々の実施形態において、しきい値リンク距離は、2のデフォルト値に設定される。しきい値リンク距離は、ユーザによって又はプログラム制御のもとで随意的に制御可能である。前にアクセスされたドキュメントのしきい値リンク距離内にある情報リポジトリが、近接区域に加えられる。近接区域内のドキュメントは、ユーザが検索したドキュメントに局所的に関連する可能性が高いドキュメントを反映する。しかしながら、近接区域内のドキュメントは、ユーザがまだ見ていないものである。ユーザ履歴内のドキュメントに基づいて、ユーザ・プロファイルが決定される。ユーザ・プロファイルは、前の情報検索タスクに関連するキーワードの記述である。
個人化検索のためのシステム100が、ユーザ・クエリを適用し、ユーザと関連付けられた近隣地域内のドキュメントを検索する。検索結果は、ユーザ・プロファイルに基づいてランク付けされる。ランク付けされた検索結果は、通信リンク99を介して、通信可能なパーソナル・コンピュータ300のユーザに戻される。種々の実施形態において、ユーザ履歴が変わるにつれて、ユーザの近接区域が動的に調整される。
図2は、本発明による、個人化検索のための例示的な第2のシステム101の概要である。個人化検索のためのシステム101は、通信可能なパーソナル・コンピュータ301内に組み込まれている。通信可能なパーソナル・コンピュータ301は、通信リンク99を介して、ドキュメント1000〜1002へのアクセスを提供する情報リポジトリ200に接続される。
種々の実施形態において、個人化検索のための第2のシステム301は、ソフトウェア・ルーチン、ハードウェア回路、又は第2の通信可能なパーソナル・コンピュータ301内の他の装置として実装される。個人化検索のための第2のシステム301は、ドキュメントの更新されたユーザ履歴、及び/又は、ユーザがアクセスした他の情報を維持する。個人化検索のための第2のシステム101は、通信可能なパーソナル・コンピュータ301内に組み込まれるので、この個人化検索のための第2のシステム101は、eメール、ブラウザ履歴、ファイル・アクセス履歴等を含む、一連の多数のユーザ履歴源にアクセスできる。クローリング・パラメータが、ユーザによって入力されるか、又は格納部から検索される。一実施形態において、しきい値リンク距離が、ユーザによって入力される。他の実施形態においては、しきい値リンク距離の値が、メモリ又は格納装置から検索される。クローリング・パラメータ及び/又はしきい値リンク距離は、ユーザの近接区域のサイズを定めるものである。ユーザ履歴のドキュメントのしきい値リンク距離内にある、まだ見られていないドキュメントが、近接区域に加えられる。ユーザ・プロファイルが、ユーザ履歴内のドキュメントに基づいて決定される。ユーザ・プロファイルは、ユーザ履歴トランザクションを説明するものである。
ユーザ・クエリが、近接区域内のドキュメントに適用される。検索結果は、ユーザの前の検索履歴に局所的に関連するが、現在のユーザ・クエリの条件によってさらに焦点が絞られたドキュメントを反映する。他の種々の実施形態においては、ユーザの近接区域の外部にあるドキュメントを含むように、クエリ検索が拡張される。例えば、検索を行うために、第1のユーザが、第2のユーザの近接区域及び/又はユーザ・プロファイルを選択することができる。さらに他の実施形態においては、和集合、共通集合、及び個人化検索を行うための他の種々の演算子を用いて、多数のユーザ・プロファイル及び/又は近接区域が組み合わされる。ユーザ・プロファイルに基づいたランク付け関数が、検索結果に適用される。このように、ユーザの関心と密接に一致する近接区域内のドキュメントが、より高くランク付けされる。幾つかの実施形態においては、タグ又は他のマーカーが、随意的に新しく識別されたドキュメントに加えられる。ユーザが関心をもつ明示的な用語、情報の手掛かり等に基づいて、ランク付けをさらに調整することができる。ランク付けされた近隣検索の結果は、通信リンク99を介して、第2の通信可能なパーソナル・コンピュータ301のユーザに戻される。
図3は、本発明による、個人化検索の例示的な方法のフローチャートである。プロセスはステップS1000で始まり、直ちにステップS2000に続く。
ステップS2000において、ユーザについての履歴が決定される。ユーザ履歴は、そのユーザ履歴の前の情報アクセス・トランザクションを反映する。ユーザがアクセスしたuniform resource locator(URL)を示すように、ウェブ・ブラウザの履歴ファイルを構成することができる。ユーザ・ブラウザの履歴は、ユーザ履歴のブラウザ、組織のウェブ・ポータル、ウェブ・プロクシ・サーバ、ライブラリ・アクセス・マネージャ、ウェブ・サーバのアクセス・ログ、及び/又は、履歴のユーザ・トランザクションの周知の又は後に開発される任意の源から直接検索される。種々の実施形態においては、ユーザ履歴情報は、タスク、プロジェクト等によってさらに分類される。タスクによるユーザ履歴の分類により、タスクを完了するのに用いられるリソースを識別する方法が提供される。タスク、プロジェクト、及び/又は、他の属性に基づいたユーザ履歴の分類により、グループ及び組織の境界にわたる情報を共有する、及び/又は、再使用するための柔軟な機構も提供される。次に、制御はステップS3000に続く。
ステップS3000において、ユーザ・プロファイルが決定される。ユーザ・プロファイルは、ユーザ履歴に基づいている。ユーザ履歴内のドキュメントに、ワード・ステミング及びストップワードの除去が行われる。分類された情報の検索タスク及び/又はユーザ履歴について記述するキーワードを全体として識別するために、任意のしきい値化が適用される。一実施形態において、ユーザ・プロファイルをキーワードのサブセットに制限することによって、ユーザ・プロファイルを格納するのに必要とされるメモリが低減される。ユーザ・プロファイル・キーワードに基づいて、ユーザ・プロファイル・ベクトル又は他の表示が決定される。ユーザ・プロファイル・ベクトルは、ユーザの関心をコンパクトに表示するものである。次に、制御はステップS4000に続く。
ステップS4000において、近接区域が決定される。近接区域は、ユーザ履歴に基づいている。近接区域は、ユーザが既にアクセスしたドキュメントのしきい値リンク距離内にある、リンクされているが、まだ見られていないドキュメントを反映する。ユーザが既にアクセスしたドキュメントへのリンクは、ユーザの関心に局所的に関連付けられている可能性が高いドキュメントを示す。ユーザ履歴は、world wide webドキュメントに関連したトランザクション、デジタル・ライブラリ内のアクセス・ドキュメント、ftp、http等を介する検索ドキュメント、インターネット・ポータルを通した検索ドキュメント、及び/又は、履歴のユーザ・トランザクションの周知の又は後に開発される任意の源からの検索ドキュメントを含む。次に、制御はステップS5000に続く。
ステップS5000において、ユーザ・クエリが決定される。ユーザ・クエリは、ユーザの特定の情報ニーズの記述である。ユーザ・クエリは、随意的に、関連用語及び/又は関連付けられた用語に拡張され、概念上の記述等に抽象化される。次に、制御はステップS6000に続く。
ステップS6000において、クエリを用いて、ユーザと関連付けられた近接区域が検索される。近接区域は、ユーザはまだ見ていないが、前にアクセスしたドキュメントのしきい値リンク距離内にあるため、関心あるものである可能性が高いドキュメントを反映する。個人化検索結果において、ユーザ・クエリと一致する近接区域内のドキュメントが戻される。次に、制御はステップS7000に続く。
ステップS7000において、ユーザ・プロファイルに基づいて、個人化検索結果がランク付けされる。検索結果のプロファイル・ランク付けは、前に行われたタスクに対して特有の関連性をもつ情報を、ユーザの個人化検索結果の上に配置する。他の実施形態においては、近接区域内のドキュメントの位置及び/又は他の種々の属性及び特徴を用いて、検索結果をさらにランク付けする。次に、制御はステップS8000に続く。制御はステップS9000に続き、プロセスが終了する。
図4は、本発明による、近接区域を決定する例示的な方法の拡張したフローチャートである。プロセスはステップS4000で始まり、直ちにステップS4100に続く。
ステップS4100において、クローリング・パラメータ(crawling parameters)が決定される。クローリング・パラメータは、これらに限られるものではないが、近接するドキュメントを識別する方法、及び、近接するドキュメントが、アクセスされたドキュメントから幾つのリンクだけ離れているかを含む。横型探索環境において、2の値は、良好なしきい値リンク距離をもたらす。したがって、アクセスされたドキュメントの2リンク以内にある、リンクされたドキュメントが、近接区域内に含まれる。本発明の実施において、PageRankリンク・ランク付け関数、バックリンク・ランク付け関数、横型探索、及び/又は、周知の又は後に開発される任意のリンク・ランク付け及び/又は順序付け戦略のようなクローリング・パラメータを用いることもできる。
幾つかの実施形態において、ドキュメントの閉集合(closed set)が定められる。ドキュメントが組又はコレクションに付加されるとき、閉集合内のドキュメントがリンクされるか又は相互接続される。他の実施形態においては、ドキュメント間の相互接続は知られていない。したがって、クローラー又は他の検索機構を用いて、現在のドキュメントにリンクされたworld wide web内の文書を決定する。たどるリンクの数が、近接区域を定める。さらに、横型探索、PageRank、バックリンク、及び他の種々のグラフ探索戦略を用いて、近接区域内のドキュメントを決定することもできる。次に、制御はステップS4200に続く。
ステップS4200において、ユーザ履歴が決定される。ユーザ履歴は、ユーザが前に見たドキュメントの記録を提供する。ユーザのブラウザ、ウェブ・プロクシ・アクセス・ログ、ライブラリ・アクセス・マネージャ、又は他の履歴のユーザ・トランザクション情報の源から、ユーザ履歴情報が検索される。一実施形態において、ユーザ履歴は、一連のuniform resource locatorすなわちURLである。URLは、情報検索タスクを行う際にユーザがアクセスする特定のドキュメントを示す。したがって、URLは、タスクについての情報要求を満たした方法の記録を反映する。ユーザ履歴情報を決定した後、制御はステップS4300に続く。
ステップS4300において、近接区域内のドキュメントの組が、随意的に初期化又は更新される。つまり、ユーザが個人化検索のためのシステムに最初にアクセスしたとき、近接区域が、随意的に空集合に初期化される。しかしながら、ユーザが個人化検索のためのシステムにアクセスすると、近接区域情報が、随意的にメモリ内に保存又は格納される。次のセッションにおいて、新しいユーザ履歴トランザクションが識別される。新しいユーザ履歴トランザクションを用いて、ユーザと関連付けられた近接区域を更新する。近接区域が初期化又は更新された後、制御はステップS4400に続く。
ステップS4400において、第1のドキュメントが、ユーザ履歴から選択される。次に、制御はステップS4500に続く。
ステップS4500において、現在のドキュメントを開始点として用いて、ドキュメントを近接区域に付加する。したがって、world wide webのようなドキュメントの開集合が特定された場合、任意のクローラーを用いて、特定のクローリング・パラメータに基づいて、リンクされているが、まだ見られていないドキュメントを付加する。クローリング・パラメータは、しきい値リンク距離、あるタイプのリンク・クローリング戦略等を含む。ドキュメントの閉集合が特定された場合、任意のクローリングを必要としない。現在のドキュメントのしきい値リンク距離内にある、リンクされていず、まだ見られていないドキュメントが、近接区域内のドキュメントの組に付加される。次に、制御はステップS4600に続く。
ステップS4600において、ユーザ履歴内に付加的なドキュメントがあるかどうかについての判断がなされる。ユーザ履歴内に付加的なドキュメントがあると判断された場合、制御はステップS4700に続く。ステップS4700において、現在のドキュメントを検討対象から除外する。一実施形態において、現在のドキュメントは、ユーザ履歴ドキュメントのワーキング・セット又は議題から除外される。他の実施形態においては、現在の履歴ドキュメントをさらなる検討対象から除外したことを示すために、フラッグが設定される。次に、制御はステップS4800に続く。
ステップS4700において、現在のドキュメントが、ユーザ履歴内の次のドキュメントに設定される。次に、制御はステップS4500に直接飛ぶ。ステップS4600において、付加的なドキュメントがユーザ履歴内に残らなくなるまで、ステップS4500〜S4700が繰り返される。付加的なドキュメントがユーザ履歴内に残っていないとき、制御はステップS4900に続く。プロセスは戻り、直ちに図3のステップS5000に続く。
図5は、本発明による、ユーザ・プロファイルを決定する例示的な方法のフローチャートである。プロセスはステップS3000で始まり、直ちにステップS3100に続く。
ステップS3100において、ユーザ・トランザクションの履歴が決定される。ユーザ履歴は、前の情報検索タスクの際にユーザがアクセスしたドキュメントを反映する。前にアクセスされたユーザ履歴情報が、ユーザの情報検索動作のモデルを提供する。種々の実施形態において、ユーザ履歴がさらに分類され、個々のタスク、プロジェクト等と関連付けられる。結果として得られるタスク特有のユーザ履歴は、ユーザのタスクに関係するドキュメント及び/又は他の情報要素を反映する。本発明の範囲から逸脱することなく、ユーザ履歴を何らかの程度の粒度に分類することができる。次に、制御はステップS3200に続く。
ステップS3200において、ユーザ履歴内のドキュメントについて、ストップワードが取り除かれ、ワード・ステミングが行われ、他の正規化関数が実行される。次に、制御はステップS3300に続く。
ステップS3300において、ドキュメントからキーワードが抽出される。例えば、ユーザ履歴ドキュメント内の語を分析し、実行される情報検索タスクの記述的キーワードを判断する。次に、制御はステップS3400に続く。
ステップS3400において、キーワード又は用語に基づいて、ユーザ・プロファイルが決定される。一実施形態において、式:
Figure 2007149057
に基づいて、キーワードviを重み付けすることによって、ユーザ・プロファイル・ベクトルが決定される。
ここで、
Figure 2007149057
であり、ここで、dは、ユーザ履歴ドキュメントHistoryの組内の現在のドキュメントである。用語dft+lは、ユーザ履歴ドキュメントd内の用語t+lの頻度を反映し、用語|History|は、ユーザ履歴の長さを反映する。用語idftは、ユーザ履歴ドキュメント内の用語tの逆頻度であり、lengthdは、ドキュメントの長さである。結果として得られる重み付けされたキーワードを用いて、ユーザ・プロファイル・ベクトルを形成する。ユーザ・プロファイルは、ユーザ履歴内に現れる高頻度の概念を含むことができる。しかしながら、本発明から逸脱することなく、他のユーザ・プロファイル表示を用いることもできる。次に、制御はステップS3500に続く。
任意のステップS3500において、しきい値に基づいて、ユーザ・プロファイル内のキーワードが決定される。例えば、一実施形態においては、1000ベスト又はNベストの組のキーワードが選択される。次に、制御はステップS3600に続く。制御は戻り、直ちに図3のステップS4000に続く。
図6は、本発明による、近接区域を検索する例示的な方法のフローチャートである。プロセスはステップS6000で始まり、直ちにステップS6100に続く。
ステップS6100において、クエリが決定される。クエリは、クエリ用語、キーワードのリスト、自然言語の一部等から構成されるベクトルとすることができる。クエリは、ユーザの特定の情報ニーズを反映する。クエリは、1組の用語、テキストの段落からの用語、自然言語の質問等からの用語として作成される。随意的に、クエリ用語は、シソーラス、WorldNet参照、及び/又は他の種々の方法を用いて拡張される。任意の関連性又は他のしきい値を用いて、拡張されたクエリ用語のサブセットを選択する。次に、制御はステップS6200に続く。
ステップS6200において、ユーザ及び/又はタスクと関連付けられた近接区域が決定される。一実施形態において、前にコンパイルされた近接区域が、格納装置から検索される。他の実施形態において、近接区域が、各セッションについてのユーザ履歴から動的に決定される。次に、制御はステップS6300に続く。
ステップS6300において、近接区域内のドキュメントが、現在のドキュメントとして選択される。制御は、現在のドキュメントについてのドキュメント・ベクトルを決定するステップS6400に続く。制御はステップS6500に続く。
ステップS6500において、近接区域内の現在のドキュメントとクエリ・ベクトルとの間の近接マッチング・スコアが決定される。一実施形態において、近接マッチング・スコアは、式:
Figure 2007149057
に基づいて決定される。
ここで、Qはクエリであり、Dはドキュメントであり、|Q∩D|は、クエリQとドキュメントDとの間の共通の用語の数を反映し、|Q|は、クエリ内の用語及び上の式(1)で計算されたユーザ・プロファイルから用語boostt=viの数を反映する。ユーザ・プロファイル内の用語の重要性を用いて、近接スコアを形成する。本発明の実施において、クエリと近接ドキュメントとの間の類似性を示す他の近接スコア関数を用いることもできる。次に、制御はステップS6600に続く。
ステップS6600において、検索すべき付加的なドキュメントがあるかどうかについての判断がなされる。近接区域内に付加的なドキュメントがある場合、制御はステップS6700に続く。近接区域内の次のドキュメントが、現在のドキュメントとして選択される。次に、制御は直ちにステップS6400に飛ぶ。ステップS6600において、検索すべき付加的なドキュメントがないと判断されるまで、ステップS6400〜S6700が繰り返される。検索すべき付加的なドキュメントが残っていないとき、制御はステップS6800に続く。次に、制御は戻り、近接スコアを用いてユーザへの表示のために近接区域内のドキュメントをランク付けすることができる、図3のステップS7000に直ちに飛ぶ。
図7は、本発明による、例示的な個人化検索のためのシステム100である。個人化検索のためのシステム100は、各々が入力/出力回路10に接続され、通信リンク99を介して、通信可能なパーソナル・コンピュータ300及びドキュメント1000〜1002へのアクセスを提供する情報リポジトリ200に接続される、プロセッサ15、メモリ20、ユーザ履歴決定回路25、プロファイル決定回路30、しきい値リンク値格納部35、近接区域決定回路40、検索回路45、ランク付け回路50、及び任意の表示回路55から構成される。
通信可能なパーソナル・コンピュータ300のユーザは、情報リポジトリ200内のドキュメント1000〜1002に対してクエリをサブミットする。クエリは、通信リンク99により、個人化検索のためのシステム100に送られる。個人化検索のためのシステム100は、情報リポジトリ200へのアクセスを仲介する。個人化検索のためのシステム100は、入力/出力回路10を作動させ、クエリを検索する。プロセッサ15は、クエリ又は他の識別子を開始するユーザに基づいて、ユーザを決定する。第1のユーザは、ユーザ・プロファイル、及び/又は、異なるユーザ、ユーザのグループ、組織等と関連付けられた近接区域を用いて検索することを望む。関連したユーザは、検索の開始者とは異なるユーザとすることができる。さらに、ユーザは、ユーザのグループ等とすることができる。ユーザ・ログイン・シーケンス、インターネット・プロトコル(IP)アドレス、及び種々のユーザ識別方法を用いることができる。
ユーザ履歴を要求及び/又は決定するために、プロセッサ15によってユーザ識別子が用いられる。ユーザ履歴は、情報リポジトリから検索され、ユーザによって入力され、及び/又は動的に決定され、次にメモリ20に格納される。ユーザ履歴情報は、情報リポジトリ内のユーザの経路と関連付けられたuniform resource locator(URL)で示すことができる。
プロセッサ15は、しきい値リンク距離値格納部35から、しきい値リンク距離を検索する。次に、プロセッサ15は、近接区域決定回路40を作動させ、ユーザが前にアクセスしたドキュメントのしきい値リンク距離内にある情報リポジトリ200内のドキュメントを決定する。一実施形態において、近接区域決定回路40は、近接区域のドキュメントの組を空集合に初期化する。次に、ユーザ履歴のコピーが検索される。第1のドキュメントは、ユーザ履歴のコピーから選択される。選択されたドキュメントのしきい値リンク距離内のリンクされたドキュメントの各々が、近接区域内のドキュメントの組に付加される。次に、選択されたドキュメントが、ユーザ履歴のコピーから取り除かれる。次に、第2のドキュメントが、ユーザ履歴の修正されたコピーから選択され、ユーザ履歴のコピー内にドキュメントが残らなくなるまでプロセスが繰り返される。ユーザがアクセスした新しいドキュメントの各々について、プロセスが繰り返される。しかしながら、他の実施形態において、ユーザ履歴情報の処理は、付加的なドキュメントをユーザ履歴に付加したときにバッチ上で行われ、ユーザ及び/又はプログラム制御のもとで、この近接区域ドキュメントのインクリメンタルな決定により、計算リソースの負担が減少される。
プロセッサ15は、検索回路45を作動させ、クエリと一致する近接区域内のドキュメントを検索する。前にアクセスされたドキュメントにリンクされているため、近接区域内のドキュメントは、ユーザの関心と密接に関連している可能性が高い、まだ見られていないドキュメントを反映する。
プロセッサ15は、ユーザ・プロファイル決定回路30を作動させ、ユーザ履歴に基づいてユーザ・プロファイルを決定する。ユーザ・プロファイルは、情報検索タスクの際にアクセスされた前のドキュメントの記述を反映する。
次に、プロセッサ15は、ランク付け回路50を作動させ、ユーザ・プロファイルに基づいて、個人化検索の結果をランク付けする。一実施形態において、近接区域及び/又は種々の他のインジケータを有するドキュメントの位置に基づいて、検索結果のランク付けがさらに調整される。次に、任意の表示回路55が作動され、ユーザについての個人化検索結果の表示をフォーマットする。次に、検索結果は、通信リンク99上で送られ、通信可能なパーソナル・コンピュータ300上で表示される。
図8は、本発明による、情報リポジトリ内のドキュメントの視覚化である。情報リポジトリのドキュメントが、ノード1 401〜ノード11 411として視覚化される。ドキュメントの組内のユーザ履歴又は経路が、ノード1 401〜ノード5 405間の矢印で示される。例えば、ユーザが、ノード5 405で示されるドキュメントに最初にアクセスし、続いて、ノード1 401〜ノード4 404で示されるドキュメントにアクセスした。ユーザは、ノード6 406〜ノード11 411で示されるドキュメントにアクセスしなかった。種々の実施形態において、個人化検索のためのシステムは、ユーザが前にアクセスしたドキュメントのしきい値リンク距離内のドキュメントを検索する。他の実施形態においては、ドキュメントがライブラリに付加されたとき、ドキュメント間のリンクが定められる。したがって、これらの閉環境においては、事前フェッチ又はクローリングは必要とされない。ノード6 406〜ノード11 411は、ドキュメント間の対応するリンクを表すノード1 401〜ノード5 405にリンクされる。ノード6 406〜ノード11 411で表されるドキュメントは、ノード1 401〜ノード5 405で表されるユーザ履歴内のドキュメントと局所的に関連する可能性が高い。
図9は、本発明による、ユーザ履歴ドキュメントから、あるしきい値リンク距離以上離れたドキュメントの例示的な第1の視覚化である。ノード10 410は、ユーザ履歴ノード1 401〜ノード5 405から2リンク以上離れたノードを反映する。つまり、リンクされたノード10 410は、ユーザがアクセスしたノードからしきい値リンク距離以上離れており、よって、近接区域の一部ではない。
図10は、本発明による、ユーザ履歴ドキュメントのしきい値リンク距離内にあるドキュメントの例示的な視覚化である。ノード6 406〜ノード9 409及び11 411は、ユーザ履歴ノード1 401〜ノード5 405の2リンク内にあるドキュメントを反映する。例えば、ノード6 406は、ユーザが前にアクセスしたノード1 401から1リンク離れている。ノード7 407は、ノード2 402から1リンク内にあり、ノード3 403から2リンク内にある。したがって、ノード7 407及びノード8 408は、近接区域に付加される。ノード9 409及びノード11 411は、それぞれノード1 401及びノード2 402から2リンク内にある。したがって、ノード1 401及びノード2 402は、しきい値リンク距離内にあり、これらも近接区域に付加される。ノード10 410は、ユーザ履歴ドキュメントから3リンク離れているので、近接区域に含まれない。
図11は、本発明による、個人化検索のためのシステムの形成の概要である。ユーザを説明するトランザクション情報の種々の源から、ユーザ履歴情報700が検索される。ユーザ履歴情報700は、ブラウザ履歴、ローカル・ファイル・システム内のアクセス・パターン、eメール情報、及び/又は、過去のユーザ情報検索トランザクションの識別に有用な他の何らかの情報を含むことができる。
ユーザ履歴情報700が変換され、ユーザ・プロファイル情報710を形成する。幾つかの実施形態においては、ストップワードを除去し、ワード・ステミングを行うことによって、ユーザ・プロファイル情報710が決定される。結果として得られるキーワードが、ユーザ履歴のコンパクトな記述を提供する。ユーザ・プロファイルの末尾が、随意的に初期設定数のキーワードに切り捨てられる。種々の実施形態において、ユーザ・プロファイル・ベクトルが形成される。次に、ユーザ・プロファイル・ベクトルは、ユーザ・プロファイル情報710として格納される。
近接区域情報720を決定するために、ユーザ履歴情報700も用いられる。ユーザ履歴情報720内のドキュメント、ノード又は情報要素の各々が調べられる。近接区域を形成するために、ユーザ履歴ドキュメント、ノード、又は情報要素の所定のしきい値リンク距離内にリンクされたドキュメント、ノード、又は他の情報要素が検索される。近接区域内のドキュメントは、前にアクセスされたドキュメントにリンクされており、ユーザの前の情報検索のタスクの1つに局所的に関連している可能性が高い。しかしながら、近接区域のドキュメントは、ユーザがまだ見ていない情報を反映するものである。したがって、これらの局所的に関連しているが、まだ見られていないドキュメントは、ユーザにとって有用である可能性が高い。
検索エンジン・モデル730は、ユーザのために個人化することができるカスタマイズ可能な検索エンジン・モデルを反映する。一実施形態においては、http://incubator.apache.org/nutch/about.htmlで説明される、Douglas Cuttingの「Nutch」オープン・ソース・ウェブ検索エンジンが、カスタマイズ可能なエンジン・モデルとして用いられる。しかしながら、他の検索エンジンを用いることもできる。
ユーザ・プロファイル情報710、近接区域情報720、及びカスタマイズ可能な検索エンジン・モデル730が組み合わされて、ユーザのための個人化検索のためのシステム740を形成する。個人化検索のためのシステム740は、ユーザの前の情報アクセス・パターンについて既に知られている個人情報、及び、ユーザ・プロファイル情報710を利用し、現在の情報検索タスクに関連する可能性が高い情報を選択及び/又は示唆することができる。
図12は、本発明による、個人化検索のためのシステム740を用いる例示的なクエリの概要である。ユーザが、識別されるか又は決定される。識別されたユーザに基づいて、近接区域情報720及びユーザ・プロファイル情報710が決定される。ユーザ・プロファイル情報710を用いて、検索エンジン・モデル730が個人化される。個人化された検索エンジンは、近接区域内のドキュメントを検索し、クエリ情報740との一致を探す。検索結果は、ユーザ・プロファイル情報710に基づいてランク付けされ、個人化された検索結果760を提供する。検索されたコレクションは、前のユーザ・トランザクションにリンクされたドキュメントの近接区域であるので、個人化された検索結果760は、ユーザの関心に基づいたものと局所的に関連する可能性が高いドキュメントを反映する。ユーザ・プロファイル情報は、ユーザの情報検索タスクに役立つ可能性が最も高いドキュメントにユーザの注意を集中させるようにランク付けを行う。プロジェクト及びタスクによってユーザ・プロファイルを分類し、特定のプロジェクト又はタスクへの関連性に基づいて検索結果をさらにランク付けすることが可能になる。
図13は、本発明による、ユーザ・プロファイルを格納するための例示的なデータ構造1200である。ユーザ・プロファイルを格納するための例示的なデータ構造1200は、プロジェクト識別子部分1210、記述部分1220、及び用語部分1230から構成される。
第1行は、プロジェクト識別子部分1210内に値「0001」を含む。この値は、タスク又はサブタスクを、ユーザ履歴から抽出されたタスク特有のキーワードと関連付けるために用いられる。ユーザ履歴は、特定の情報検索目的と関連付けられた多数のタスク又はサブタスクに分けることができる。一実施形態において、ユーザは、各検索セッションの始めに、プロジェクト識別子を入力する。ユーザ履歴は、タスクの完了時にアクセスされたドキュメントから構成され、このドキュメントは、次にラベル付けされ、又はプロジェクト識別子と関連付けられる。プロジェクト識別子は、タスクと関連した新しい情報を再び見つける及び/又は発見するのに有用である。さらに他の実施形態において、プロジェクトが識別したユーザ履歴は、タスクを実行するために特定のユーザが相談する情報リソースについての知識を共有するのに有用である。このことは、病気、退職等のためにユーザが利用できないときに有用である。
記述部分1220は、ユーザが実行しようと試みるタスクの性質を理解するのに有用な値「SEC 10K届出規則」を含む。ユーザが「証券取引委員会への10K届出規則」についての情報を検索したときに、ユーザ履歴が作成された。ユーザは、米国証券取引委員会に届け出る10Kを準備する前に規則の変更を検索する会社役員とすることができる。新しい役員が任命されたとき、前任者のユーザ履歴が利用可能であり、組織の知識の再使用が可能になる。記述部分1220の値は、種々のプロジェクトにわたって検索を行う際に有用である。
用語部分1230は、値「証券取引委員会の報告要件」を含む。この値は、ユーザ履歴内のドキュメントを記述する抽出されたキーワードを示す。プロジェクト特有のユーザ履歴内のドキュメントを分析することによって、用語部分1230内の値を得ることができる。ストップワードを除去し、ステミングを行い、1組のキーワードを形成する。1000ベスト又はNベスト・キーワードが識別され、用いられ、ユーザ履歴を記述するユーザ・プロファイル又はプロジェクト特有のユーザ・プロファイルを形成する。
第2行は、値「0002」、「5/1/2005 M1 再検討」、「パキスタン/イラン関係」を含む。これは、第2行が、2005年5月1日のM1検討会議についてのプロジェクト「0002」と関連付けられていることを示す。プロジェクト0002に関係するユーザ履歴内のドキュメントが検索され、分析される。プロジェクト0002のユーザ履歴から検索されたドキュメントを記述するように、キーワード「パキスタン/イラン関係」が決定される。
第3行は、値「0003」、「4/22/2005 生物兵器報告」、「KEN ALIBEK 生物兵器 ロシア」を含む。これらの値は、プロジェクト3が、2005年4月22日生物兵器報告として述べられること、及び、ユーザ・プロファイルの用語が、KEN、ALIBECK、生物兵器、ロシアを含むことを示す。
最後の行は、値「0099」、「コンピュータ機器」、「購入 コンピュータ CELERON SEMPRON」を含み、プロジェクト4を、コンピュータ機器に関連した情報検索タスクとして説明する。ユーザ・プロファイル用語又はキーワードは、語「購入」、「コンピュータ」、「Celeron」、及び「Sempron」は、プロジェクト4と関連付けされたユーザ履歴内のドキュメントを高度に記述している。
図14は、本発明による、ユーザ履歴の関連付けを格納するための例示的なデータ構造900である。ユーザ履歴の関連付けを格納するための例示的なデータ構造900は、ユーザ識別子部分910及び位置情報部分920から構成される。
第1行のエントリは、ユーザ識別子部分910内に値「1345」を含む。ユーザ識別子の値は、個人化検索のためのシステム内のユーザを固有に識別する。ユーザ識別子の値は、個人化検索のためのシステム内の局所的な固有値、eメール・アドレス等のようなグローバルな固有ユーザ識別子である。
位置情報部分920内の「PROXY://SQUID_SERVER.XYZ.ORG」値は、ユーザについてのユーザ履歴情報の第1の源の位置を反映する。ユーザ履歴情報の源は、ユーザが相談する異なる情報源のトランザクション・ログを反映する。別の実施形態において、位置情報部分920内の値は、媒体/プロトコル記述子部分、サーバ部分、及び任意のファイル位置部分に分けられる。媒体/プロトコル記述子部分の値「PROXY」は、ユーザ履歴情報がプロクシ・サーバであることを示す。位置情報部分920のサーバ部分の「SQUID_SERVER.XYZ.ORG」値は、特定のサーバ、サブディレクトリの名前、及び/又は、ユーザ履歴情報にアクセスするために必要な何らかのユーザID及びパスワードを示す。
第2行は、値「1345」、「PORTAL://SOFTSWITCH.XYZ.ORG」を含む。これらの値は、ユーザ「1345」と関連付けられたユーザ履歴情報の第2の源を反映する。この場合は、ユーザの電話情報である。電話情報は、ユーザ履歴に組み込むことができる種々の情報を反映する。一実施形態において、電話は、タスクの完了時に有用な音声情報の源を反映する。音声情報は、自動音声認識等を用いて動的に転記される。
第3行は、値「1345」、「EMAIL://MAIL.XYZ.ORG」を含む。eメール・サーバ「MAIL.XYZ.ORG」内に含まれる情報は、ユーザ履歴情報の第3の源として働く。eメール・メッセージ内に埋め込まれたuniform resource locatorすなわちURL情報は、ユーザが実行した情報検索タスクに関係する可能性が高い情報を反映する。同様に、送信されたメール内のURLも、ユーザの仕事に関係する有用な情報源である。ユーザ履歴のeメールは、ユーザ履歴情報の付加的な源として加えられる。
最後の行は、値「9823」、「PROXY://SQUID1.YZA.ORG」を含む。world wide webドキュメント内のユーザ・アクセス・パターンの履歴は、組織「YZA」についてのSQUID1ウェブ・プロクシ・サーバに格納される。ウェブ・プロクシのユーザ履歴情報は、個人化検索のためのシステムによって検索され、ユーザ・プロファイルを形成するために用いられる。
図15は、本発明による、タスク・プロファイルを格納するための例示的なデータ構造800である。このタスク・プロファイルを格納するための例示的なデータ構造800は、ユーザ識別子部分810及びプロファイル部分820から構成される。
第1行のエントリは、ユーザ識別子部分810内に値「1345」を含む。ユーザ識別子の値は、個人化検索のためのシステム内のユーザを固有に識別する。ユーザ識別子の値は、個人化検索のためのシステム内の局所的な固有値、eメール・アドレス等のようなグローバルな固有ユーザ識別子である。
プロファイル部分820は、値FTP://GROUP1.XYZ.ORG/USERS/1345/.USER_PROFILEを含む。この値は、ユーザ・プロファイルが、「XYZ.ORG」ドメイン内のサーバ「GROUP1」上に位置することを示す。情報は、サブディレクトリ「/USERS/1345」内に格納されたファイル「.USER_PROFILE」内に含まれ、FTPプロトコルを介してアクセス可能である。本発明の実施においては、種々のタイプの情報リポジトリ又は格納装置を用いて、ユーザ・プロファイル情報を格納することができる。
第2行は、値「1345」、FTP://GROUP1.XYZ.ORG/USERS/1345/.PROJECT0001を含む。これらの値は、ユーザ1345及びプロジェクト0001と関連付けられたユーザ・プロファイルを反映する。プロジェクト特有のユーザ・プロファイルが、特定のプロジェクトと関連付けられたユーザ履歴情報を選択することによって作成される。特定のプロジェクトを実行する際にユーザにアクセスされるドキュメントが検索され、プロジェクト特有のユーザ・プロファイルが決定される。プロジェクト0001は、「SEC 10K届出規則」として説明され、プロジェクト特有のユーザ・プロファイルのキーワード「証券取引委員会の報告要件」で表される。これらのキーワードは、「SEC 10K届出規則」プロジェクトを実行する際にユーザ・プロファイルによって検索されたドキュメントを表す。
第3行は、値「1345」、FTP://GROUP1.XYZ.ORG/USERS/1345/.PROJECT0002を含む。これらの値は、ユーザ1345及びプロジェクト0002と関連付けられたプロジェクト特有のユーザ・プロファイルを反映する。プロジェクトID0002と関連付けられたプロジェクトは、「5/1/2005 M1 再検討」として説明される。プロジェクト特有のユーザ・プロファイルは、関連した情報検索タスクに用いられるドキュメントを説明する。ユーザ・プロファイルは、ftpサーバ、通常のファイル共有等を介して適切に承認された他の担当者がアクセスすることもできる。
最後の行は、値「9823」、FTP://GROUP2.ABC.ORG/USERS/9823/.USER_PROFILEを含む。これらの値は、「ABC.ORG」のグループ2のユーザ9823についての一般的なユーザ・プロファイルを反映する。ユーザ・プロファイルは、グループ内の適切に承認された担当者がアクセスすることもでき、及び/又は、組織の境界を超える適切に承認された担当者がアクセスすることもできる。このように、情報の共有が促進される。
図16は、本発明による、蓄積されたユーザ・プロファイル及び近接区域の使用を示す表である。ユーザ・プロファイルは、ユーザについての個人化検索に有用である。特に、ユーザ・プロファイル情報は、ユーザ・プロファイルが既に見た情報を再び見つける際、及び/又は、再び見る際に有用である。他のものと共有されている場合は、第1のユーザのユーザ・プロファイルは、他のユーザと共有する知識に有用である。
ユーザは、そのユーザ・プロファイルを近接区域内のドキュメントと組み合わせ、まだ見ていない新しい情報を発見することができる。新しい情報は、ユーザが前にアクセスした情報のあるしきい値リンク距離内にあるため、局所的に関連している可能性が高い。ユーザ・プロファイル情報及びユーザ・クエリと組み合わせられたとき、ユーザの情報検索タスクに関係するドキュメントが識別される。
協働的環境においては、第2のユーザが第1のユーザのユーザ・プロファイル及び近接区域を使用し、新しい情報を発見することができる。さらに他の実施形態において、第1のユーザ、第2のユーザ、及び、幾つもの他のユーザのユーザ・プロファイルが、それぞれの近接区域及び/又は他のユーザの近接区域と組み合わせられ、協働的な個人化検索を提供する。
図17は、本発明による、リンクされたドキュメントの組の一部の視覚化である。中央のドキュメント1100は、ユーザが前にアクセスしたドキュメントを反映する。題目の局所性のため、周囲の頁は、前にアクセスされたユーザ履歴ドキュメントに関連付けられている可能性が高い。アクセスされたドキュメントのクローリング又はしきい値リンク距離内のドキュメントが、近接区域内に含まれる。近接区域は、前にアクセスされたが、ユーザがまだ見ていないドキュメントにリンクされたドキュメントの組から構成される。第1のドキュメント1101及び第2のドキュメント1102はそれぞれ、アクセスされたドキュメント1100から1リンクだけ離れている。第3のドキュメント1103及び第4のドキュメント1104はそれぞれ、アクセスされたドキュメント1100から2リンクだけ離れている。第1、第2、第3、及び第4のドキュメントは、2のしきい値リンク距離値によって定められる近接区域内に含まれる。近接区域内のドキュメントを検索するために、クエリが用いられる。次に、ユーザ・プロファイルを用いて、結果を順序付け又はランク付けする。
個人化検索のためのシステム100の種々の実施形態において、上に概説された回路10〜55は、適切にプログラムされた汎用コンピュータの部分として実装することができる。代替的に、上に概説された個人化検索のためのシステム100の10〜55は、ASIC内の物理的に別個のハードウェア回路として、又はFPGA、PDL、PLAを用いて、或いは別個の論理要素又は別個の回路要素を用いて、実装することができる。上に概説された個人化検索のためのシステム100の各々が取る特定の形態は、設計上の選択であり、当業者には明らかで予測可能なものである。
さらに、個人化検索のためのシステム100、及び/又は上述した種々の回路の各々は、それぞれソフトウェア・ルーチン、マネージャ、又はプログラムされた汎用コンピュータ、特定用途向けコンピュータ、マイクロプロセッサ等上で実行するオブジェクトとして実装することができる。この場合、個人化検索のためのシステム100、及び/又は上述した種々の回路の各々は、それぞれ、通信ネットワーク内に埋め込まれた1つ又はそれ以上のルーチンとして、サーバ等に常駐するリソースとして、実装することができる。個人化検索のためのシステム100、及び上述した種々の回路はまた、個人化検索のためのシステム100を、ウェブ・サーバ又はクライエント装置のハードウェア及びソフトウェア・システムのようなソフトウェア及び/又はハードウェア・システムに物理的に組み込むことによって、実装することもできる。
本発明による他の種々の例示的な実施形態において、用語がリンクされたドキュメントが、テキスト、音声、映像ドキュメント、オブジェクト、及び/又は、他の静的又は動的にリンクされた情報品目を含むことが明らかであろう。種々の方法で個人化検索を従来の検索と組み合わせることができる。クエリについての個人化検索により、world wide webにわたる検索を、1つ又はそれ以上の近接区域にわたる検索と組み合わせることが可能である。近接区域から新しく発見された結果は、ドキュメントのより大きい非近接コレクションからの非近接検索結果内に又はこれに隣接して表示することができる。
図7に示されるように、メモリ20は、変更可能なメモリ、揮発性メモリ又は不揮発性メモリ、或いは変更不能なメモリすなわち固定メモリの任意の適切な組み合わせを用いて実装することができる。
図1、図2及び図7に示される通信リンク99は、装置を接続し、通信を助けるために使用可能な周知の又は後に開発される、任意の接続システム又は構造とすることができる。
上述されたような本発明の例示的な実施形態は、制限のためではなく、例証となるように意図される。
本発明の一態様による、個人化検索のための例示的な第1のシステム100の概要である。 本発明の一態様による、個人化検索のための例示的な第2のシステム101の概要である。 本発明の一態様による、個人化検索のための例示的な方法のフローチャートである。 本発明の一態様による、近接区域を決定する例示的な方法の拡張したフローチャートである。 本発明の一態様による、ユーザ・プロファイルを決定する例示的な方法のフローチャートである。 本発明の一態様による、近接区域を決定する例示的な方法のフローチャートである。 本発明の一態様による、個人化検索のための例示的なシステムである。 本発明の一態様による、情報リポジトリ内のドキュメントの視覚化である。 本発明の一態様による、ユーザ履歴ドキュメントから、1しきい値リンク距離以上離れたドキュメントの例示的な第1の視覚化である。 本発明の一態様による、ユーザ履歴ドキュメントの1しきい値リンク距離内のドキュメントの例示的な視覚化である。 本発明の一態様による、個人化検索のためのシステムの形成の概要である。 本発明の一態様による、個人化検索のためのシステムを用いる例示的なクエリの概要である。 本発明の一態様による、ユーザ・プロファイルを格納するための例示的なデータ構造である。 本発明の一態様による、ユーザ履歴の関連付けを格納するための例示的なデータ構造である。 本発明の一態様による、タスク・プロファイルを格納するための例示的なデータ構造である。 本発明の一態様による、蓄積されたユーザ・プロファイル及び近接区域情報の使用を示す表である。 本発明の一態様による、リンクされたドキュメントの組の一部の視覚化である。
符号の説明
15:プロセッサ
20:メモリ
25、30、35、40、45、50、55:回路
99:通信リンク
100、101:システム
200:情報リポジトリ
300、301:通信可能なパーソナル・コンピュータ

Claims (5)

  1. 個人化検索(personalized search)の方法であって、
    クエリを決定し、
    ユーザを決定し、
    リンクされた情報要素の情報リポジトリ内でアクセス・パターンのユーザ履歴を決定し、
    前記ユーザ履歴に基づいてユーザ・プロファイルを決定し、
    前記ユーザ履歴に基づいて近接区域(proximal neighborhood)を決定し、
    前記クエリ、前記ユーザ・プロファイル、及び前記近接区域に基づいて個人化検索結果を決定する、
    ステップを含むことを特徴とする方法。
  2. 第1のユーザ及び少なくとも1人の他のユーザについて、ユーザ履歴、ユーザ・プロファイル、及び近接区域が決定され、前記ユーザ履歴、前記ユーザ・プロファイル、及び前記近接区域の少なくとも1つが組み合わせられることを特徴とする請求項1に記載の方法。
  3. 第1のユーザ履歴が第1のユーザと関連付けられ、第2のユーザ履歴が第2のユーザと関連付けられ、前記第1のユーザ履歴が前記第2のユーザによって使用されることを特徴とする請求項1に記載の方法。
  4. 個人化検索のためのシステムであって、
    メモリと、
    ユーザ・クエリを受け取る入力/出力回路と、
    関係するユーザを決定するプロセッサと、
    リンクされた情報要素のリポジトリ内で前記ユーザ履歴を決定するユーザ履歴決定回路と、
    前記ユーザ履歴内の前記リンクされた情報要素を記述するユーザ・プロファイルを決定するプロファイル決定回路と、
    少なくとも或るしきい値距離メトリック内でユーザ履歴情報要素にリンクされた前記リポジトリから、まだ見られていない情報要素の近接区域を決定する近接区域決定回路と、
    前記クエリについての前記近接区域内の前記情報要素を検索する検索回路と、
    前記ユーザ・プロファイルに基づいて前記検索結果をランク付け(ranking)するランク付け回路と、
    を備えることを特徴とするシステム。
  5. コンピュータ読み取り可能記憶媒体であって、当該コンピュータ読み取り可能記憶媒体上に具現されたコンピュータ読み取り可能コードを含んでおり、前記コンピュータ読み取り可能コードが、
    クエリを決定し、
    ユーザを決定し、
    リンクされた情報要素の情報リポジトリ内でアクセス・パターンのユーザ履歴を決定し、
    前記ユーザ履歴に基づいてユーザ・プロファイルを決定し、
    前記ユーザ履歴に基づいて近接区域を決定し、
    前記クエリ、前記ユーザ・プロファイル、及び前記近接区域に基づいて個人化検索結果を決定する、
    ステップを含む個人化検索を提供するように、コンピュータをプログラムするのに使用可能であることを特徴とするコンピュータ読み取り可能記憶媒体。
JP2006150629A 2005-04-29 2006-04-28 個人化検索のためのシステム及び方法 Expired - Fee Related JP5214115B6 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US67646205P 2005-04-29 2005-04-29
US60/676,462 2005-04-29
US11/200,557 US8606781B2 (en) 2005-04-29 2005-08-09 Systems and methods for personalized search
US11/200,557 2005-08-09

Publications (3)

Publication Number Publication Date
JP2007149057A true JP2007149057A (ja) 2007-06-14
JP5214115B2 JP5214115B2 (ja) 2013-06-19
JP5214115B6 JP5214115B6 (ja) 2013-08-07

Family

ID=

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104597A (ja) * 2007-10-23 2009-05-14 Fuji Xerox Co Ltd 共同検索システムおよびそれをコンピュータにより実現するためのコンピュータプログラム
WO2010041517A1 (ja) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
KR101485593B1 (ko) 2008-04-02 2015-01-22 주식회사 인텔렉추얼애드 검색결과 처리 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124309A (ja) * 1992-10-14 1994-05-06 Hitachi Ltd 情報サービスシステムおよび放送受信システム
JP2002140362A (ja) * 2000-10-31 2002-05-17 Toshiba Corp 移動体向け情報提供システムおよび情報提供方法
JP2002342360A (ja) * 2001-05-18 2002-11-29 Sharp Corp 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
JP2004054023A (ja) * 2002-07-22 2004-02-19 Sony Corp 情報処理装置および方法、情報処理システム、記録媒体、並びにプログラム
JP2005505070A (ja) * 2001-09-28 2005-02-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 他人のプロフィールを用いた、個人用推薦装置のデータベース

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06124309A (ja) * 1992-10-14 1994-05-06 Hitachi Ltd 情報サービスシステムおよび放送受信システム
JP2002140362A (ja) * 2000-10-31 2002-05-17 Toshiba Corp 移動体向け情報提供システムおよび情報提供方法
JP2002342360A (ja) * 2001-05-18 2002-11-29 Sharp Corp 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体
JP2005505070A (ja) * 2001-09-28 2005-02-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 他人のプロフィールを用いた、個人用推薦装置のデータベース
JP2004054023A (ja) * 2002-07-22 2004-02-19 Sony Corp 情報処理装置および方法、情報処理システム、記録媒体、並びにプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009104597A (ja) * 2007-10-23 2009-05-14 Fuji Xerox Co Ltd 共同検索システムおよびそれをコンピュータにより実現するためのコンピュータプログラム
KR101485593B1 (ko) 2008-04-02 2015-01-22 주식회사 인텔렉추얼애드 검색결과 처리 방법
WO2010041517A1 (ja) * 2008-10-08 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
JP5325229B2 (ja) * 2008-10-08 2013-10-23 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報収集装置、検索エンジン、情報収集方法およびプログラム
US8676782B2 (en) 2008-10-08 2014-03-18 International Business Machines Corporation Information collection apparatus, search engine, information collection method, and program

Also Published As

Publication number Publication date
US8606781B2 (en) 2013-12-10
EP1717720A1 (en) 2006-11-02
US20060248059A1 (en) 2006-11-02
JP5214115B2 (ja) 2013-06-19

Similar Documents

Publication Publication Date Title
US8606781B2 (en) Systems and methods for personalized search
RU2382400C2 (ru) Построение и применение веб-каталогов для фокусированного поиска
US8521764B2 (en) Query rewriting with entity detection
JP4647623B2 (ja) ユニバーサル・サーチエンジンのインターフェイス
US8799280B2 (en) Personalized navigation using a search engine
US8756210B1 (en) Aggregating context data for programmable search engines
CN101283353B (zh) 通过分析标签找到相关文档的系统和方法
JP5268073B2 (ja) ブックマークおよびランク付け
EP1574974A2 (en) User intent discovery
US9077775B2 (en) Identifying social profiles in a social network having relevance to a first file
US20070038603A1 (en) Sharing context data across programmable search engines
US8977630B1 (en) Personalizing search results
JP2009508267A (ja) ブログ文書のランク付け
US20130144860A1 (en) System and Method for Automatically Identifying Classified Websites
JP2010033197A (ja) 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム
US9081774B2 (en) Identifying and ranking web pages of the world wide web based on relationships identified by authors
JPWO2009084363A1 (ja) アクセス対象情報検索装置
JP2005056371A (ja) Web検索情報の管理方法、管理システム、コンピュータソフトウェアプログラム
JP5214115B6 (ja) 個人化検索のためのシステム及び方法
CN113127596A (zh) 一种全文检索方法、系统、电子设备及存储介质
US8595225B1 (en) Systems and methods for correlating document topicality and popularity
JP2020102035A (ja) 情報処理装置及びプログラム
Pandey Optimising online marketing resources: SEO strategy
JP3933617B2 (ja) 共有情報検索方法、共有情報検索プログラム、および情報共有システム
JP2022145108A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110516

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110816

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110819

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111017

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111114

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120625

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121024

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121205

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5214115

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees