JP2007515721A - ドキュメント拡張方法 - Google Patents
ドキュメント拡張方法 Download PDFInfo
- Publication number
- JP2007515721A JP2007515721A JP2006544437A JP2006544437A JP2007515721A JP 2007515721 A JP2007515721 A JP 2007515721A JP 2006544437 A JP2006544437 A JP 2006544437A JP 2006544437 A JP2006544437 A JP 2006544437A JP 2007515721 A JP2007515721 A JP 2007515721A
- Authority
- JP
- Japan
- Prior art keywords
- query
- document
- index
- user
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/319—Inverted lists
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 検索システムは、ドキュメントの索引内容を検索する検索エンジンと、少なくとも幾つかのユーザ・クエリを用いて索引を拡張するための索引拡張機能部とを含む。索引は、索引付けされるべきドキュメント中と、前記ドキュメントを見出すために用いられたユーザ・クエリ中とに見出される用語の一覧表、及び、少なくとも、それら用語がドキュメント中及びユーザ・クエリ中にどれほど頻繁に出現するかを含んだ一覧表を含むことができる。
【選択図】図2
Description
Claims (19)
- ドキュメントの索引内容を検索するための検索エンジンと、前記索引を少なくとも幾つかのユーザ・クエリを用いて拡張するための索引拡張機能部とを含む検索システム。
- 前記索引拡張機能部が、クエリを前記検索エンジンによって検索されたドキュメントに関連付けるためのクエリ・プロセッサを含む、請求項1に記載のシステム。
- 前記クエリ・プロセッサが、前記検索されたドキュメントのどれを前記クエリに関連付けるかを決定する手段と、どのクエリを前記された検索ドキュメントに関連付けるかを決定する手段を含む、請求項2に記載のシステム。
- 前記関連付けられるクエリが、セッション中で用いられたクエリの一部からなる、請求項3に記載のシステム。
- 前記関連付けられるクエリが、セッションの最初のクエリからなる、請求項3に記載のシステム。
- 決定され検索された前記ドキュメントが、前記ユーザによって選択されたドキュメントを含む、請求項3に記載のシステム。
- 決定され検索された前記ドキュメントが、クエリの結果として前記ユーザによりブラウズされたドキュメントを含む、請求項3に記載のシステム。
- 前記決定され検索された前記ドキュメントが、クエリから生成された上位ランクのドキュメントを含む、請求項3に記載のシステム。
- 前記ユーザ・クエリが、選択されたドキュメントの言語とは異なる言語によるものである、請求項2に記載のシステム。
- 前記索引拡張機能部が、ドキュメントに関連付けられたクエリをランク付けするためのクエリ・ランカーを含む、請求項1に記載のシステム。
- 前記クエリ・ランカーが、使用頻度によって前記クエリをランク付けする手段を含む、請求項10に記載のシステム。
- 前記クエリ・ランカーが、使用時間によって前記クエリをランク付けする手段を含む、請求項10に記載のシステム。
- 前記索引拡張機能部が、前記ランク付けされたクエリの少なくとも幾つかを用いて、前記索引を拡張するための索引更新プログラムを含む、請求項10に記載のシステム。
- 前記索引更新プログラムが、低位にランクされたクエリを除外する手段を有する、請求項13に記載のシステム。
- ユーザ・クエリを送出する検索クライアントと、ドキュメントの索引内容を検索する検索エンジンとを含む検索システムであって、前記索引が、少なくとも元のテキストと、少なくとも前記元のテキストについて何かを記述するクエリとを指示する、システム。
- 前記索引が、索引付けされるべきドキュメント中と、少なくとも、前記ドキュメントを見出すために用いられたユーザ・クエリ中とに見出される用語の一覧表、及び、少なくとも、前記ドキュメント及びユーザ・クエリ中にそれら用語が出現する頻度を含んだ一覧表を含む、請求項15に記載のシステム。
- 前記ユーザ・クエリが、選択されたドキュメントを見出すためのセッション中で用いられたクエリの一部からなる、請求項16に記載のシステム。
- 少なくとも幾つかのユーザ・クエリを用いてドキュメントの索引を拡張する方法であって、検索エンジンによって検索されたドキュメントのどれをクエリに関連付けるかを決定するステップと、どのクエリを前記検索されたドキュメントに関連付けるかを決定するステップとを含む、方法。
- 少なくとも幾つかのユーザ・クエリを用いてドキュメントの索引を拡張するためのプログラムであって、該プログラムが、検索エンジンによって検索されたドキュメントのどれをクエリに関連付けるかを決定するステップと、どのクエリを前記検索されたドキュメントに関連付けるかを決定するステップをコンピュータに実行させるプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/743,158 US20050138007A1 (en) | 2003-12-22 | 2003-12-22 | Document enhancement method |
PCT/EP2004/053494 WO2005062204A1 (en) | 2003-12-22 | 2004-12-15 | Enhancing a search index based on the relevance of results to a user query |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007515721A true JP2007515721A (ja) | 2007-06-14 |
Family
ID=34678584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006544437A Pending JP2007515721A (ja) | 2003-12-22 | 2004-12-15 | ドキュメント拡張方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050138007A1 (ja) |
EP (1) | EP1700242A1 (ja) |
JP (1) | JP2007515721A (ja) |
CN (1) | CN1898667A (ja) |
WO (1) | WO2005062204A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016189215A (ja) * | 2016-07-05 | 2016-11-04 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7502773B1 (en) * | 2003-12-31 | 2009-03-10 | Microsoft Corporation | System and method facilitating page indexing employing reference information |
US7769579B2 (en) | 2005-05-31 | 2010-08-03 | Google Inc. | Learning facts from semi-structured text |
US9275052B2 (en) | 2005-01-19 | 2016-03-01 | Amazon Technologies, Inc. | Providing annotations of a digital work |
US9208229B2 (en) * | 2005-03-31 | 2015-12-08 | Google Inc. | Anchor text summarization for corroboration |
US8352449B1 (en) | 2006-03-29 | 2013-01-08 | Amazon Technologies, Inc. | Reader device content indexing |
US8725565B1 (en) | 2006-09-29 | 2014-05-13 | Amazon Technologies, Inc. | Expedited acquisition of a digital item following a sample presentation of the item |
US9672533B1 (en) | 2006-09-29 | 2017-06-06 | Amazon Technologies, Inc. | Acquisition of an item based on a catalog presentation of items |
US8122026B1 (en) | 2006-10-20 | 2012-02-21 | Google Inc. | Finding and disambiguating references to entities on web pages |
US7865817B2 (en) | 2006-12-29 | 2011-01-04 | Amazon Technologies, Inc. | Invariant referencing in digital works |
US7751807B2 (en) | 2007-02-12 | 2010-07-06 | Oomble, Inc. | Method and system for a hosted mobile management service architecture |
US8024400B2 (en) | 2007-09-26 | 2011-09-20 | Oomble, Inc. | Method and system for transferring content from the web to mobile devices |
US8347202B1 (en) | 2007-03-14 | 2013-01-01 | Google Inc. | Determining geographic locations for place names in a fact repository |
US7716224B2 (en) * | 2007-03-29 | 2010-05-11 | Amazon Technologies, Inc. | Search and indexing on a user device |
US9665529B1 (en) | 2007-03-29 | 2017-05-30 | Amazon Technologies, Inc. | Relative progress and event indicators |
US8990215B1 (en) | 2007-05-21 | 2015-03-24 | Amazon Technologies, Inc. | Obtaining and verifying search indices |
US8423889B1 (en) | 2008-06-05 | 2013-04-16 | Amazon Technologies, Inc. | Device specific presentation control for electronic book reader devices |
CN101685444B (zh) * | 2008-09-27 | 2012-05-30 | 国际商业机器公司 | 用于实现元数据搜索的系统和方法 |
US9087032B1 (en) | 2009-01-26 | 2015-07-21 | Amazon Technologies, Inc. | Aggregation of highlights |
US8378979B2 (en) | 2009-01-27 | 2013-02-19 | Amazon Technologies, Inc. | Electronic device with haptic feedback |
US8832584B1 (en) | 2009-03-31 | 2014-09-09 | Amazon Technologies, Inc. | Questions on highlighted passages |
US8692763B1 (en) | 2009-09-28 | 2014-04-08 | John T. Kim | Last screen rendering for electronic book reader |
CN101840420B (zh) * | 2010-04-02 | 2011-12-28 | 清华大学 | 搜索辅助系统与搜索辅助方法 |
CN101807213B (zh) * | 2010-05-11 | 2011-08-31 | 天津大学 | 一种网页的垂直搜索方法 |
US9495322B1 (en) | 2010-09-21 | 2016-11-15 | Amazon Technologies, Inc. | Cover display |
US20130086083A1 (en) * | 2011-09-30 | 2013-04-04 | Microsoft Corporation | Transferring ranking signals from equivalent pages |
US9158741B1 (en) | 2011-10-28 | 2015-10-13 | Amazon Technologies, Inc. | Indicators for navigating digital works |
US8965899B1 (en) * | 2011-12-30 | 2015-02-24 | Emc Corporation | Progressive indexing for improved ad-hoc query performance |
US11238076B2 (en) | 2020-04-19 | 2022-02-01 | International Business Machines Corporation | Document enrichment with conversation texts, for enhanced information retrieval |
CN112783918A (zh) * | 2021-03-15 | 2021-05-11 | 北京百度网讯科技有限公司 | 搜索方法、搜索装置、电子设备、存储介质和程序产品 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507794A (ja) * | 1998-03-16 | 2002-03-12 | エヌビーシーアイ・ニュ−ジーランド・エルエルシー | 改良されたサーチエンジン |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5685003A (en) * | 1992-12-23 | 1997-11-04 | Microsoft Corporation | Method and system for automatically indexing data in a document using a fresh index table |
US5920854A (en) * | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
US6182068B1 (en) * | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods |
US6078916A (en) * | 1997-08-01 | 2000-06-20 | Culliss; Gary | Method for organizing information |
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6701307B2 (en) * | 1998-10-28 | 2004-03-02 | Microsoft Corporation | Method and apparatus of expanding web searching capabilities |
US6338056B1 (en) * | 1998-12-14 | 2002-01-08 | International Business Machines Corporation | Relational database extender that supports user-defined index types and user-defined search |
US6389412B1 (en) * | 1998-12-31 | 2002-05-14 | Intel Corporation | Method and system for constructing integrated metadata |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
US6999957B1 (en) * | 2000-01-11 | 2006-02-14 | The Relegence Corporation | System and method for real-time searching |
US6571239B1 (en) * | 2000-01-31 | 2003-05-27 | International Business Machines Corporation | Modifying a key-word listing based on user response |
AU2001251736A1 (en) * | 2000-03-27 | 2001-10-08 | Documentum, Inc | Method and apparatus for generating metadata for a document |
US6658406B1 (en) * | 2000-03-29 | 2003-12-02 | Microsoft Corporation | Method for selecting terms from vocabularies in a category-based system |
US6665655B1 (en) * | 2000-04-14 | 2003-12-16 | Rightnow Technologies, Inc. | Implicit rating of retrieved information in an information search system |
US8706747B2 (en) * | 2000-07-06 | 2014-04-22 | Google Inc. | Systems and methods for searching using queries written in a different character-set and/or language from the target pages |
US7171349B1 (en) * | 2000-08-11 | 2007-01-30 | Attensity Corporation | Relational text index creation and searching |
US6785688B2 (en) * | 2000-11-21 | 2004-08-31 | America Online, Inc. | Internet streaming media workflow architecture |
US20020091671A1 (en) * | 2000-11-23 | 2002-07-11 | Andreas Prokoph | Method and system for data retrieval in large collections of data |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US7007074B2 (en) * | 2001-09-10 | 2006-02-28 | Yahoo! Inc. | Targeted advertisements using time-dependent key search terms |
US7031009B2 (en) * | 2001-12-26 | 2006-04-18 | Xerox Corporation | Use of e-mail for capture of document metadata |
CA2369912C (en) * | 2002-01-31 | 2012-02-07 | Comtext Systems Inc. | Computerized information search and indexing method, software and device |
US7260570B2 (en) * | 2002-02-01 | 2007-08-21 | International Business Machines Corporation | Retrieving matching documents by queries in any national language |
US7324990B2 (en) * | 2002-02-07 | 2008-01-29 | The Relegence Corporation | Real time relevancy determination system and a method for calculating relevancy of real time information |
US20040098378A1 (en) * | 2002-11-19 | 2004-05-20 | Gur Kimchi | Distributed client server index update system and method |
CN1292371C (zh) * | 2003-04-11 | 2006-12-27 | 国际商业机器公司 | 倒排索引存储方法、倒排索引机制以及在线更新的方法 |
US7308464B2 (en) * | 2003-07-23 | 2007-12-11 | America Online, Inc. | Method and system for rule based indexing of multiple data structures |
US7254580B1 (en) * | 2003-07-31 | 2007-08-07 | Google Inc. | System and method for selectively searching partitions of a database |
-
2003
- 2003-12-22 US US10/743,158 patent/US20050138007A1/en not_active Abandoned
-
2004
- 2004-12-15 JP JP2006544437A patent/JP2007515721A/ja active Pending
- 2004-12-15 WO PCT/EP2004/053494 patent/WO2005062204A1/en active Application Filing
- 2004-12-15 EP EP04816342A patent/EP1700242A1/en not_active Ceased
- 2004-12-15 CN CNA2004800383643A patent/CN1898667A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002507794A (ja) * | 1998-03-16 | 2002-03-12 | エヌビーシーアイ・ニュ−ジーランド・エルエルシー | 改良されたサーチエンジン |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016189215A (ja) * | 2016-07-05 | 2016-11-04 | ヤフー株式会社 | 抽出装置、抽出方法および抽出プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN1898667A (zh) | 2007-01-17 |
WO2005062204A1 (en) | 2005-07-07 |
EP1700242A1 (en) | 2006-09-13 |
US20050138007A1 (en) | 2005-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007515721A (ja) | ドキュメント拡張方法 | |
JP5114380B2 (ja) | 検索結果の関連性の再ランク付けおよびその増強 | |
JP5296147B2 (ja) | 地理的関連性に従う文書のインデックス付け | |
JP4638439B2 (ja) | ウェブ検索の個人化 | |
JP4991289B2 (ja) | 予め定義されたサーチ問合せからサーチ結果へのアクセスを与えるurlで補足されるサーチエンジン | |
US10423668B2 (en) | System, method, and user interface for organization and searching information | |
US7020679B2 (en) | Two-level internet search service system | |
US7840547B1 (en) | Methods and systems for efficient query rewriting | |
US20070192293A1 (en) | Method for presenting search results | |
US20060248078A1 (en) | Search engine with suggestion tool and method of using same | |
CN107092615A (zh) | 来自文档的查询建议 | |
AU2005202020A1 (en) | Method and system for indexing and searching databases | |
WO2006124287A2 (en) | Importance ranking for a hierarchical collection of objects | |
JP4769822B2 (ja) | ページグループを用いた情報検索サービス提供サーバー、方法及びシステム | |
JP2009516252A (ja) | テキストの表現を取得する方法 | |
JP2004078446A (ja) | キーワード抽出装置、抽出方法、文書検索装置、検索方法、文書分類装置及び分類方法並びにプログラム | |
JP3898016B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
Wheeldon et al. | DbSurfer: A search and navigation tool for relational databases | |
US8745035B1 (en) | Multistage pipeline for feeding joined tables to a search system | |
Brinkley et al. | Information retrieval from the Internet: an evaluation of the tools | |
Jacsó | Clustering search results. Part I: web‐wide search engines | |
KR20050004274A (ko) | 검색엔진과, 검색시스템, 검색시스템에서의 데이터베이스작성방법 및, 기억매체 | |
AU2004269436A1 (en) | Method, device and software for querying and presenting search results | |
Colahan | Guitar Music in Collections: A New Web-based Index Is Launched | |
Chen et al. | Real-time adaptive feature and document learning for Web search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071015 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100406 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100630 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101124 |