JP2007149057A - 個人化検索のためのシステム及び方法 - Google Patents
個人化検索のためのシステム及び方法 Download PDFInfo
- Publication number
- JP2007149057A JP2007149057A JP2006150629A JP2006150629A JP2007149057A JP 2007149057 A JP2007149057 A JP 2007149057A JP 2006150629 A JP2006150629 A JP 2006150629A JP 2006150629 A JP2006150629 A JP 2006150629A JP 2007149057 A JP2007149057 A JP 2007149057A
- Authority
- JP
- Japan
- Prior art keywords
- user
- history
- information
- documents
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】個人化検索の結果をユーザに提供する技術が提示される。随意的にプロジェクト又はタスクに分類されたユーザ履歴が決定される。キーワード、概念、又はユーザ履歴ドキュメント内の他のユーザ及び/又はタスク特有記述子を識別することによって、ユーザについてのプロファイルが決定される。ユーザの履歴に基づいた近接区域及び調整可能なクローリング・パラメータが決定される。調整可能なクローリング・パラメータは、ユーザ履歴内のドキュメントにリンクされたどのドキュメントが近接区域内に含まれるかを定める。ユーザ・クエリが決定され、このユーザ・クエリを用いて、近接区域内のドキュメントの組を検索する。次に、結果は、ユーザ・プロファイル情報に基づいてランク付けされる。ランク付けされた結果は、随意的にユーザに表示される。
【選択図】図7
Description
本発明は、ARDA NIMD契約番号#A904−03−C−0404号のもとで、米国政府の支援により行われたものである。米国政府は、本発明における一定の権利を所有することができる。
本発明によるシステム及び方法は、個人化検索の結果を決定するものである。随意的にプロジェクト又はタスクに分類されたユーザ履歴が決定される。キーワード、概念、又はユーザ履歴ドキュメント内の他のユーザ記述子を識別することによって、ユーザについてのプロファイルが決定される。ユーザの履歴に基づいた近接区域が決定される。調整可能なクローリング・パラメータに基づいて、近接区域が決定される。調整可能なクローリング・パラメータは、ユーザ履歴にリンクされたどのドキュメントが近接区域内に含まれるかを定める。ユーザ・クエリが決定され、このユーザ・クエリを用いて、近接区域を検索する。近接区域にわたる検索結果は、ユーザ・プロファイル情報に基づいてランク付けされ、随意的にユーザに表示される。
に基づいて、キーワードviを重み付けすることによって、ユーザ・プロファイル・ベクトルが決定される。
ここで、
であり、ここで、dは、ユーザ履歴ドキュメントHistoryの組内の現在のドキュメントである。用語dft+lは、ユーザ履歴ドキュメントd内の用語t+lの頻度を反映し、用語|History|は、ユーザ履歴の長さを反映する。用語idftは、ユーザ履歴ドキュメント内の用語tの逆頻度であり、lengthdは、ドキュメントの長さである。結果として得られる重み付けされたキーワードを用いて、ユーザ・プロファイル・ベクトルを形成する。ユーザ・プロファイルは、ユーザ履歴内に現れる高頻度の概念を含むことができる。しかしながら、本発明から逸脱することなく、他のユーザ・プロファイル表示を用いることもできる。次に、制御はステップS3500に続く。
に基づいて決定される。
ここで、Qはクエリであり、Dはドキュメントであり、|Q∩D|は、クエリQとドキュメントDとの間の共通の用語の数を反映し、|Q|は、クエリ内の用語及び上の式(1)で計算されたユーザ・プロファイルから用語boostt=viの数を反映する。ユーザ・プロファイル内の用語の重要性を用いて、近接スコアを形成する。本発明の実施において、クエリと近接ドキュメントとの間の類似性を示す他の近接スコア関数を用いることもできる。次に、制御はステップS6600に続く。
ユーザ履歴を要求及び/又は決定するために、プロセッサ15によってユーザ識別子が用いられる。ユーザ履歴は、情報リポジトリから検索され、ユーザによって入力され、及び/又は動的に決定され、次にメモリ20に格納される。ユーザ履歴情報は、情報リポジトリ内のユーザの経路と関連付けられたuniform resource locator(URL)で示すことができる。
プロセッサ15は、ユーザ・プロファイル決定回路30を作動させ、ユーザ履歴に基づいてユーザ・プロファイルを決定する。ユーザ・プロファイルは、情報検索タスクの際にアクセスされた前のドキュメントの記述を反映する。
ユーザ履歴情報700が変換され、ユーザ・プロファイル情報710を形成する。幾つかの実施形態においては、ストップワードを除去し、ワード・ステミングを行うことによって、ユーザ・プロファイル情報710が決定される。結果として得られるキーワードが、ユーザ履歴のコンパクトな記述を提供する。ユーザ・プロファイルの末尾が、随意的に初期設定数のキーワードに切り捨てられる。種々の実施形態において、ユーザ・プロファイル・ベクトルが形成される。次に、ユーザ・プロファイル・ベクトルは、ユーザ・プロファイル情報710として格納される。
ユーザ・プロファイル情報710、近接区域情報720、及びカスタマイズ可能な検索エンジン・モデル730が組み合わされて、ユーザのための個人化検索のためのシステム740を形成する。個人化検索のためのシステム740は、ユーザの前の情報アクセス・パターンについて既に知られている個人情報、及び、ユーザ・プロファイル情報710を利用し、現在の情報検索タスクに関連する可能性が高い情報を選択及び/又は示唆することができる。
最後の行は、値「0099」、「コンピュータ機器」、「購入 コンピュータ CELERON SEMPRON」を含み、プロジェクト4を、コンピュータ機器に関連した情報検索タスクとして説明する。ユーザ・プロファイル用語又はキーワードは、語「購入」、「コンピュータ」、「Celeron」、及び「Sempron」は、プロジェクト4と関連付けされたユーザ履歴内のドキュメントを高度に記述している。
第1行のエントリは、ユーザ識別子部分910内に値「1345」を含む。ユーザ識別子の値は、個人化検索のためのシステム内のユーザを固有に識別する。ユーザ識別子の値は、個人化検索のためのシステム内の局所的な固有値、eメール・アドレス等のようなグローバルな固有ユーザ識別子である。
図1、図2及び図7に示される通信リンク99は、装置を接続し、通信を助けるために使用可能な周知の又は後に開発される、任意の接続システム又は構造とすることができる。
上述されたような本発明の例示的な実施形態は、制限のためではなく、例証となるように意図される。
20:メモリ
25、30、35、40、45、50、55:回路
99:通信リンク
100、101:システム
200:情報リポジトリ
300、301:通信可能なパーソナル・コンピュータ
Claims (5)
- 個人化検索(personalized search)の方法であって、
クエリを決定し、
ユーザを決定し、
リンクされた情報要素の情報リポジトリ内でアクセス・パターンのユーザ履歴を決定し、
前記ユーザ履歴に基づいてユーザ・プロファイルを決定し、
前記ユーザ履歴に基づいて近接区域(proximal neighborhood)を決定し、
前記クエリ、前記ユーザ・プロファイル、及び前記近接区域に基づいて個人化検索結果を決定する、
ステップを含むことを特徴とする方法。 - 第1のユーザ及び少なくとも1人の他のユーザについて、ユーザ履歴、ユーザ・プロファイル、及び近接区域が決定され、前記ユーザ履歴、前記ユーザ・プロファイル、及び前記近接区域の少なくとも1つが組み合わせられることを特徴とする請求項1に記載の方法。
- 第1のユーザ履歴が第1のユーザと関連付けられ、第2のユーザ履歴が第2のユーザと関連付けられ、前記第1のユーザ履歴が前記第2のユーザによって使用されることを特徴とする請求項1に記載の方法。
- 個人化検索のためのシステムであって、
メモリと、
ユーザ・クエリを受け取る入力/出力回路と、
関係するユーザを決定するプロセッサと、
リンクされた情報要素のリポジトリ内で前記ユーザ履歴を決定するユーザ履歴決定回路と、
前記ユーザ履歴内の前記リンクされた情報要素を記述するユーザ・プロファイルを決定するプロファイル決定回路と、
少なくとも或るしきい値距離メトリック内でユーザ履歴情報要素にリンクされた前記リポジトリから、まだ見られていない情報要素の近接区域を決定する近接区域決定回路と、
前記クエリについての前記近接区域内の前記情報要素を検索する検索回路と、
前記ユーザ・プロファイルに基づいて前記検索結果をランク付け(ranking)するランク付け回路と、
を備えることを特徴とするシステム。 - コンピュータ読み取り可能記憶媒体であって、当該コンピュータ読み取り可能記憶媒体上に具現されたコンピュータ読み取り可能コードを含んでおり、前記コンピュータ読み取り可能コードが、
クエリを決定し、
ユーザを決定し、
リンクされた情報要素の情報リポジトリ内でアクセス・パターンのユーザ履歴を決定し、
前記ユーザ履歴に基づいてユーザ・プロファイルを決定し、
前記ユーザ履歴に基づいて近接区域を決定し、
前記クエリ、前記ユーザ・プロファイル、及び前記近接区域に基づいて個人化検索結果を決定する、
ステップを含む個人化検索を提供するように、コンピュータをプログラムするのに使用可能であることを特徴とするコンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67646205P | 2005-04-29 | 2005-04-29 | |
US60/676,462 | 2005-04-29 | ||
US11/200,557 US8606781B2 (en) | 2005-04-29 | 2005-08-09 | Systems and methods for personalized search |
US11/200,557 | 2005-08-09 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2007149057A true JP2007149057A (ja) | 2007-06-14 |
JP5214115B2 JP5214115B2 (ja) | 2013-06-19 |
JP5214115B6 JP5214115B6 (ja) | 2013-08-07 |
Family
ID=
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009104597A (ja) * | 2007-10-23 | 2009-05-14 | Fuji Xerox Co Ltd | 共同検索システムおよびそれをコンピュータにより実現するためのコンピュータプログラム |
WO2010041517A1 (ja) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報収集装置、検索エンジン、情報収集方法およびプログラム |
KR101485593B1 (ko) | 2008-04-02 | 2015-01-22 | 주식회사 인텔렉추얼애드 | 검색결과 처리 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124309A (ja) * | 1992-10-14 | 1994-05-06 | Hitachi Ltd | 情報サービスシステムおよび放送受信システム |
JP2002140362A (ja) * | 2000-10-31 | 2002-05-17 | Toshiba Corp | 移動体向け情報提供システムおよび情報提供方法 |
JP2002342360A (ja) * | 2001-05-18 | 2002-11-29 | Sharp Corp | 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 |
JP2004054023A (ja) * | 2002-07-22 | 2004-02-19 | Sony Corp | 情報処理装置および方法、情報処理システム、記録媒体、並びにプログラム |
JP2005505070A (ja) * | 2001-09-28 | 2005-02-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 他人のプロフィールを用いた、個人用推薦装置のデータベース |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124309A (ja) * | 1992-10-14 | 1994-05-06 | Hitachi Ltd | 情報サービスシステムおよび放送受信システム |
JP2002140362A (ja) * | 2000-10-31 | 2002-05-17 | Toshiba Corp | 移動体向け情報提供システムおよび情報提供方法 |
JP2002342360A (ja) * | 2001-05-18 | 2002-11-29 | Sharp Corp | 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 |
JP2005505070A (ja) * | 2001-09-28 | 2005-02-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 他人のプロフィールを用いた、個人用推薦装置のデータベース |
JP2004054023A (ja) * | 2002-07-22 | 2004-02-19 | Sony Corp | 情報処理装置および方法、情報処理システム、記録媒体、並びにプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009104597A (ja) * | 2007-10-23 | 2009-05-14 | Fuji Xerox Co Ltd | 共同検索システムおよびそれをコンピュータにより実現するためのコンピュータプログラム |
KR101485593B1 (ko) | 2008-04-02 | 2015-01-22 | 주식회사 인텔렉추얼애드 | 검색결과 처리 방법 |
WO2010041517A1 (ja) * | 2008-10-08 | 2010-04-15 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報収集装置、検索エンジン、情報収集方法およびプログラム |
JP5325229B2 (ja) * | 2008-10-08 | 2013-10-23 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報収集装置、検索エンジン、情報収集方法およびプログラム |
US8676782B2 (en) | 2008-10-08 | 2014-03-18 | International Business Machines Corporation | Information collection apparatus, search engine, information collection method, and program |
Also Published As
Publication number | Publication date |
---|---|
US8606781B2 (en) | 2013-12-10 |
EP1717720A1 (en) | 2006-11-02 |
US20060248059A1 (en) | 2006-11-02 |
JP5214115B2 (ja) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8606781B2 (en) | Systems and methods for personalized search | |
RU2382400C2 (ru) | Построение и применение веб-каталогов для фокусированного поиска | |
US8521764B2 (en) | Query rewriting with entity detection | |
JP4647623B2 (ja) | ユニバーサル・サーチエンジンのインターフェイス | |
US8799280B2 (en) | Personalized navigation using a search engine | |
US8756210B1 (en) | Aggregating context data for programmable search engines | |
CN101283353B (zh) | 通过分析标签找到相关文档的系统和方法 | |
JP5268073B2 (ja) | ブックマークおよびランク付け | |
EP1574974A2 (en) | User intent discovery | |
US9077775B2 (en) | Identifying social profiles in a social network having relevance to a first file | |
US20070038603A1 (en) | Sharing context data across programmable search engines | |
US8977630B1 (en) | Personalizing search results | |
JP2009508267A (ja) | ブログ文書のランク付け | |
US20130144860A1 (en) | System and Method for Automatically Identifying Classified Websites | |
JP2010033197A (ja) | 公開された検索エンジンを用いた検索装置、検索方法及び検索プログラム | |
US9081774B2 (en) | Identifying and ranking web pages of the world wide web based on relationships identified by authors | |
JPWO2009084363A1 (ja) | アクセス対象情報検索装置 | |
JP2005056371A (ja) | Web検索情報の管理方法、管理システム、コンピュータソフトウェアプログラム | |
JP5214115B6 (ja) | 個人化検索のためのシステム及び方法 | |
CN113127596A (zh) | 一种全文检索方法、系统、电子设备及存储介质 | |
US8595225B1 (en) | Systems and methods for correlating document topicality and popularity | |
JP2020102035A (ja) | 情報処理装置及びプログラム | |
Pandey | Optimising online marketing resources: SEO strategy | |
JP3933617B2 (ja) | 共有情報検索方法、共有情報検索プログラム、および情報共有システム | |
JP2022145108A (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110516 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110816 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110819 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111017 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111020 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111114 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121024 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121205 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20121211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5214115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |