JP2006107433A - 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 - Google Patents
検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 Download PDFInfo
- Publication number
- JP2006107433A JP2006107433A JP2005175173A JP2005175173A JP2006107433A JP 2006107433 A JP2006107433 A JP 2006107433A JP 2005175173 A JP2005175173 A JP 2005175173A JP 2005175173 A JP2005175173 A JP 2005175173A JP 2006107433 A JP2006107433 A JP 2006107433A
- Authority
- JP
- Japan
- Prior art keywords
- anchor
- anchor text
- documents
- text
- wtf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 ネットワーク上の検索クエリの検索結果が用語としてアンカーテキストを組込むスコアリング関数によりランク付けされる。アンカーテキストのターゲット文書が、ターゲット文書のランク付けにおいてアンカーテキストの用語の使用を反映するようにスコアリング関数が調整される。最初に、アンカーテキストに関連したプロパティがネットワークのクロール中収集される。文書の逆リストおよびアンカーテキストの用語を含む別々のインデックスを生成する。その後、インデックスがクエリに応答して照会され文書スコアを計算する。その後、スコアを使用して文書をランク付けしてクエリの結果を作成する。
【選択図】 図2
Description
図1において、本発明を実施する例示的システムのひとつはコンピューティングデバイス100などのコンピューティングデバイスを含む。コンピューティングデバイス100はクライアント、サーバ、モバイル機器、または他のコンピューティングデバイスのいずれかとして構成される。非常に基本的な構成では、コンピューティングデバイス100は少なくともひとつの処理ユニット102およびシステムメモリ104を含むのが典型的である。コンピューティングデバイスの厳密な構成およびタイプに依って、システムメモリ104は(RAMなどの)揮発性、(ROM、フラッシュメモリ、他などの)不揮発性、または2つのある種の組合せのいずれかである。システムメモリ104はオペレーティングシステム105、1または複数のアプリケーション106を含むのが典型的であり、かつプログラムデータ107を含んでもよい。一実施形態においては、アプリケーション106は本発明の機能を実施する検索ランク付けアプリケーション120を含む。この基本的構成を破線108内の構成要素により図1に示す。
本発明の実施形態は検索エンジンに用いるランク付け機能に関する。検索エンジンの品質をランク付け機能により割り当てられたランクによる文書の妥当性により典型的に判定する。アンカーテキストはHTML(<Ahref=http://example>Example Web</A>)のアンカータグ内のテキストとして定義される。アンカーテキストはターゲットURL(ユニフォームリソースロケータ)の短い高品質記述をしばしば含み、かつ所与の文書を指すアンカータグのコンテントをその文書用のランク付け機能に組込むことはランク付け機能にとって利点である。
図5に本発明による文書ランク付けにアンカーテキストを含むようにアンカーテキストを取扱う例示的プロセスの論理フロー図を示す。プロセス500は文書のコーパスへのアクセスを提供するブロック502で開始する。処理はブロック504に続く。
Σ[wtf(k1+1)/{k1((1−b)+b(wdl/avwdl))
+(wtf)}]×log(N/n)
(1)
ここで、用語は次のように定義される。wtfは、すべてのプロパティ全体にわたる重みにより乗算された所与の用語の用語頻度の総和の重み付け用語頻度、wdlは重み付け文書長、avwdlは平均重み付け文書長、Nはネットワーク上の文書の数、nはすべてのクエリ用語全体にわたって積算された、所与のクエリ用語を含む文書の数、k1およびbは定数である。これらの専門用語および上記方程式は米国特許出願番号第10/804,326号に詳細に記載されている。
Σ[(wtf+wtfAnchor)(k1+1)/{k1((1−b)+b(wdl/avwdl))+(wtf+wtfAnchor)}]×log(N/n)
(2)
となる。
B={(1−b)+b(wdl/avwdl)} (3)
と定義される。
Σ[(wtf/B)(k1+1)/{k1+(wtf/B)}]×log(N/n)
(4)
Σ[(wtf/B+wtfAnchor/BAnchor)(k1+1)/{k1+(wtf/B+wtfAnchor/BAnchor)}]×log(N/n) (5)
となる。
220 パイプライン
230 文書インターフェース
240 クライアントインターフェース
250 アンカーテキストプラグイン
260 インデックス付けグプラグイン
270 アンカーテキストテーブル
310 メインインデックス
320 アンカーテキストインデックス
Claims (26)
- 検索結果をランク付けするコンピュータ実施方法であって、
ネットワークからのアンカーテキストプロパティを記録することであって、前記アンカーテキストプロパティは前記ネットワーク上のソース文書およびターゲット文書に対応すること、
各ターゲット文書を前記アンカーテキストに含まれた用語に関連付けるアンカーテキストインデックスを生成することであって、前記アンカーテキストインデックスはコンテンツインデックスとは別であること、
前記アンカーテキストインデックスにアクセスして、前記インデックスにおける特定ターゲット文書のアンカーテキストに関連付けられた量を判定すること、および
前記アンカーテキスト量を使用して検索結果を生成する文書をランク付けするために使用されるスコアリング関数を調整することを備えたことを特徴とする方法。 - アンカーテキストプロパティを記録することは、記録された文書およびリンク情報から前記ネットワークの表現を生成することをさらに備えたことを特徴とする請求項1に記載のコンピュータ実施方法。
- ネットワークの表現を使用してアンカーテキストプロパティを有するテーブルをポピュレートすることをさらに備えたことを特徴とする請求項2に記載のコンピュータ実施方法。
- 前記アンカーテキストプロパティはソース識別子、ターゲット識別子、アンカーテキスト、およびリンク識別子のうちの少なくとも1つを含むことを特徴とする請求項1に記載のコンピュータ実施方法。
- 少なくとも重み付けアンカーテキスト用語頻度(wtfAnchor)およびアンカーテキスト長正規化成分BAnchorに従って判定されるスコアリング関数(スコア)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項1に記載のコンピュータ実施方法。
- アンカーテキスト長正規化成分(BAnchor)はアンカーテキスト重み付け文書長(wdl)、平均重み付け文書長(avwdl)に対応することを特徴とする請求項5に記載のコンピュータ実施方法。
- 少なくとも重み付け用語頻度(wtf)、重み付けアンカーテキスト用語頻度(wtfAnchor)、長さ正規化成分、アンカーテキスト長正規化成分(BAnchor)、平均重み付け文書長(avwdl)、前記ネットワークの文書の数(N)、クエリ用語を含む文書の数(n)、および定数(k1)に従って判定されるスコアリング関数(score)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項1に記載のコンピュータ実施方法。
- 前記スコアリング関数(score)は、
score=Σ[{(wtf/B+wtfAnchor/BAnchor)(k1+1)}/{k1+(wtf/B+wtfAnchor/BAnchor)}]×log(N/n)
により与えられることを特徴とする請求項7に記載のコンピュータ実施方法。 - 前記BAnchorは前記アンカーテキストインデックスからBAnchorの成分を取り、かつ前記コンテンツインデックスからBの成分を取ることによりBとは異なることを特徴とする請求項8に記載のコンピュータ実施方法。
- 前記BAnchorによりもたらされる前記長さ正規化の強度はBAnchorに関連した異なる定数値を選択することにより調整されることを特徴とする請求項8に記載のコンピュータ実施方法。
- コンピュータ実行可能命令を実行するように構成された、コンピューティングデバイスに含まれる検索エンジンであって、前記コンピュータ実行可能命令は、
ネットワークをクロールして前記ネットワーク上の文書を発見すること、
ネットワークからのアンカーテキストプロパティを記録することであって、前記アンカーテキストプロパティは前記ネットワーク上のソース文書およびターゲット文書に対応すること、
各ターゲット文書を前記アンカーテキストに含まれた用語に関連付けるアンカーテキストインデックスを生成することであって、前記アンカーテキストインデックスはコンテンツインデックスとは別であること、
前記アンカーテキストインデックスにアクセスして、前記インデックスにおける特定ターゲット文書のアンカーテキストに関連付けられた量を判定すること、および
前記アンカーテキスト量を使用して検索結果を生成する文書をランク付けするために使用されるスコアリング関数を調整することを備えた検索エンジンを備えたことを特徴とする検索結果のランク付けシステム。 - アンカーテキストプロパティを記録することは、記録された文書およびリンク情報から前記ネットワークの表現を生成することをさらに備えたことを特徴とする請求項11に記載のシステム。
- 前記ネットワークの表現を使用して前記アンカーテキストプロパティを有するテーブルをポピュレートすることをさらに備えたことを特徴とする請求項12に記載のシステム。
- 少なくとも重み付けアンカーテキスト用語頻度(wtfAnchor)およびアンカーテキスト長正規化成分BAnchorに従って判定されるスコアリング関数(score)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項11に記載のシステム。
- 少なくとも重み付け用語頻度(wtf)、重み付けアンカーテキスト用語頻度(wtfAnchor)、長さ正規化成分、アンカーテキスト長正規化成分(BAnchor)、平均重み付け文書長(avwdl)、前記ネットワークの文書の数(N)、クエリ用語を含む文書の数(n)、および定数k1に従って判定されるスコアリング関数(score)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項11に記載のシステム。
- 前記スコアリング関数(score)は、
score=Σ[{(wtf/B+wtfAnchor/BAnchor)(k1+1)}/{k1+(wtf/B+wtfAnchor/BAnchor)}]×log(N/n)
により与えられることを特徴とする請求項15に記載のシステム。 - 前記BAnchorは前記アンカーテキストインデックスからBAnchorの成分を取り、かつ前記コンテンツインデックスからBの成分を取ることによりBとは異なることを特徴とする請求項16に記載のシステム。
- 前記BAnchorによりもたらされる前記長さ正規化の強度はBAnchorに関連した異なる定数値を選択することにより調整されることを特徴とする請求項16に記載のシステム。
- 検索結果をランク付けするコンピュータ実行可能命令を含むコンピュータ可読媒体であって、前記命令は、
文書およびネットワーク上の文書用リンク情報を格納すること、
記録された文書およびリンク情報からネットワークの表現を生成すること、
アンカーテキストプロパティをネットワークの表現から記録することであって、前記アンカーテキストプロパティはアンカーテキストに関連したソース文書およびターゲット文書に対する参照を含むテーブルをポピュレートするために使用されること、
各ターゲット文書を前記アンカーテキストに含まれた用語に関連付けるアンカーテキストインデックスを生成することであって、前記アンカーテキストインデックスはコンテンツインデックスとは別であること、
前記アンカーテキストインデックスにアクセスして、前記インデックスにおける特定ターゲット文書のアンカーテキストに関連付けられた量を判定すること、および
前記アンカーテキスト量を使用して検索結果を生成する文書をランク付けするために使用されるスコアリング関数を調整することを備えたことを特徴とするコンピュータ可読媒体。 - 前記アンカーテキストプロパティはソース識別子、ターゲット識別子、アンカーテキスト、およびリンク識別子のうちの少なくとも1つを備えたことを特徴とする請求項19に記載のコンピュータ可読媒体。
- 少なくとも重み付けアンカーテキスト用語頻度(wtfAnchor)およびアンカーテキスト長正規化成分BAnchorに従って判定されるスコアリング関数(score)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項19に記載のコンピュータ可読媒体。
- 前記アンカーテキスト長正規化成分BAnchorはアンカーテキスト重み付け文書長(wdl)、平均重み付け文書長(avwdl)に対応することを特徴とする請求項21に記載のコンピュータ可読媒体。
- 少なくとも重み付け用語頻度(wtf)、重み付けアンカーテキスト用語頻度(wtfAnchor)、長さ正規化成分、アンカーテキスト長正規化成分(BAnchor)、平均重み付け文書長(avwdl)、前記ネットワークの文書の数(N)、クエリ用語を含む文書の数(n)、および定数k1に従って判定されるスコアリング関数(score)に従って文書をランク付けすることをさらに備えたことを特徴とする請求項19に記載のコンピュータ可読媒体。
- 前記スコアリング関数(score)は
score=Σ[{(wtf/B+wtfAnchor/BAnchor)(k1+1)}/{k1+(wtf/B+wtfAnchor/BAnchor)}]×log(N/n)
により与えられることを特徴とする請求項23に記載のコンピュータ可読媒体。 - 前記BAnchorは前記アンカーテキストインデックスからBAnchorの成分を取り、かつ前記コンテンツインデックスからBの成分を取ることによりBとは異なることを特徴とする請求項24に記載のコンピュータ可読媒体。
- 前記BAnchorによりもたらされる前記長さ正規化の強度はBAnchorに関連した異なる定数値を選択することにより調整されることを特徴とする請求項24に記載のコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/955,462 US7739277B2 (en) | 2004-09-30 | 2004-09-30 | System and method for incorporating anchor text into ranking search results |
US10/955,462 | 2004-09-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006107433A true JP2006107433A (ja) | 2006-04-20 |
JP4763354B2 JP4763354B2 (ja) | 2011-08-31 |
Family
ID=35478739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005175173A Expired - Fee Related JP4763354B2 (ja) | 2004-09-30 | 2005-06-15 | 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7739277B2 (ja) |
EP (1) | EP1643383B1 (ja) |
JP (1) | JP4763354B2 (ja) |
KR (1) | KR101076894B1 (ja) |
CN (1) | CN1755678B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009151749A (ja) * | 2007-09-25 | 2009-07-09 | Nec (China) Co Ltd | ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム |
JP2013206388A (ja) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム |
Families Citing this family (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7606793B2 (en) | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US20060161543A1 (en) * | 2005-01-19 | 2006-07-20 | Tiny Engine, Inc. | Systems and methods for providing search results based on linguistic analysis |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7711732B2 (en) * | 2006-04-21 | 2010-05-04 | Yahoo! Inc. | Determining related terms based on link annotations of documents belonging to search result sets |
CN103235776B (zh) | 2006-05-10 | 2017-09-26 | 谷歌公司 | 呈现搜索结果信息 |
EP1862916A1 (en) * | 2006-06-01 | 2007-12-05 | Microsoft Corporation | Indexing Documents for Information Retrieval based on additional feedback fields |
US8555182B2 (en) | 2006-06-07 | 2013-10-08 | Microsoft Corporation | Interface for managing search term importance relationships |
US7624104B2 (en) * | 2006-06-22 | 2009-11-24 | Yahoo! Inc. | User-sensitive pagerank |
CN100456296C (zh) * | 2006-06-28 | 2009-01-28 | 腾讯科技(深圳)有限公司 | 一种多媒体文件搜索引擎的排序方法 |
US8595245B2 (en) * | 2006-07-26 | 2013-11-26 | Xerox Corporation | Reference resolution for text enrichment and normalization in mining mixed data |
US7562073B2 (en) * | 2006-08-02 | 2009-07-14 | Sap Ag | Business object search using multi-join indexes and extended join indexes |
US8458207B2 (en) * | 2006-09-15 | 2013-06-04 | Microsoft Corporation | Using anchor text to provide context |
US7672943B2 (en) * | 2006-10-26 | 2010-03-02 | Microsoft Corporation | Calculating a downloading priority for the uniform resource locator in response to the domain density score, the anchor text score, the URL string score, the category need score, and the link proximity score for targeted web crawling |
US7788253B2 (en) | 2006-12-28 | 2010-08-31 | International Business Machines Corporation | Global anchor text processing |
US7657507B2 (en) * | 2007-03-02 | 2010-02-02 | Microsoft Corporation | Pseudo-anchor text extraction for vertical search |
KR100871470B1 (ko) * | 2007-04-12 | 2008-12-03 | 주식회사 케이티프리텔 | 색인 데이터를 구축하기 위한 검색 시스템 및 이를 위한 방법 |
US7853603B2 (en) * | 2007-05-23 | 2010-12-14 | Microsoft Corporation | User-defined relevance ranking for search |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US7840569B2 (en) * | 2007-10-18 | 2010-11-23 | Microsoft Corporation | Enterprise relevancy ranking using a neural network |
US7958136B1 (en) * | 2008-03-18 | 2011-06-07 | Google Inc. | Systems and methods for identifying similar documents |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US9342607B2 (en) * | 2009-06-19 | 2016-05-17 | International Business Machines Corporation | Dynamic inference graph |
US10007705B2 (en) | 2010-10-30 | 2018-06-26 | International Business Machines Corporation | Display of boosted slashtag results |
US10726083B2 (en) | 2010-10-30 | 2020-07-28 | International Business Machines Corporation | Search query transformations |
CN102023989B (zh) * | 2009-09-23 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 一种信息检索方法及其系统 |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US20120036122A1 (en) * | 2010-08-06 | 2012-02-09 | Yahoo! Inc. | Contextual indexing of search results |
CN103339597B (zh) | 2010-10-30 | 2017-02-15 | 国际商业机器公司 | 转换搜索引擎查询 |
CN102567326B (zh) * | 2010-12-14 | 2014-09-03 | 中国移动通信集团湖南有限公司 | 一种信息搜索、及信息搜索排序装置和方法 |
CN102567417A (zh) * | 2010-12-31 | 2012-07-11 | 百度在线网络技术(北京)有限公司 | 一种用于确定超链接的锚文本可信度的分析设备和方法 |
US8463799B2 (en) * | 2011-06-29 | 2013-06-11 | International Business Machines Corporation | System and method for consolidating search engine results |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
CN103309894B (zh) * | 2012-03-15 | 2016-04-27 | 阿里巴巴集团控股有限公司 | 基于用户属性的搜索实现方法及系统 |
US20130253910A1 (en) * | 2012-03-23 | 2013-09-26 | Sententia, LLC | Systems and Methods for Analyzing Digital Communications |
US9348846B2 (en) | 2012-07-02 | 2016-05-24 | Google Inc. | User-navigable resource representations |
CN103106278A (zh) * | 2013-02-18 | 2013-05-15 | 人民搜索网络股份公司 | 权重值的获取方法及装置 |
US9607038B2 (en) * | 2013-03-15 | 2017-03-28 | International Business Machines Corporation | Determining linkage metadata of content of a target document to source documents |
US11392568B2 (en) | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US11281639B2 (en) | 2015-06-23 | 2022-03-22 | Microsoft Technology Licensing, Llc | Match fix-up to remove matching documents |
US10242071B2 (en) | 2015-06-23 | 2019-03-26 | Microsoft Technology Licensing, Llc | Preliminary ranker for scoring matching documents |
US10467215B2 (en) | 2015-06-23 | 2019-11-05 | Microsoft Technology Licensing, Llc | Matching documents using a bit vector search index |
US10733164B2 (en) | 2015-06-23 | 2020-08-04 | Microsoft Technology Licensing, Llc | Updating a bit vector search index |
US10229143B2 (en) | 2015-06-23 | 2019-03-12 | Microsoft Technology Licensing, Llc | Storage and retrieval of data from a bit vector search index |
US10565198B2 (en) | 2015-06-23 | 2020-02-18 | Microsoft Technology Licensing, Llc | Bit vector search index using shards |
US10552465B2 (en) * | 2016-02-18 | 2020-02-04 | Microsoft Technology Licensing, Llc | Generating text snippets using universal concept graph |
US11115279B2 (en) * | 2018-12-07 | 2021-09-07 | Hewlett Packard Enterprise Development Lp | Client server model for multiple document editor |
US11455312B1 (en) | 2019-11-20 | 2022-09-27 | Sabre Glbl Inc. | Data query system with improved response time |
CN112183087B (zh) * | 2020-09-27 | 2024-05-28 | 武汉华工安鼎信息技术有限责任公司 | 一种敏感文本识别的系统和方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5920859A (en) * | 1997-02-05 | 1999-07-06 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
JP2001265774A (ja) * | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
Family Cites Families (183)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222236A (en) | 1988-04-29 | 1993-06-22 | Overdrive Systems, Inc. | Multiple integrated document assembly data processing system |
US5257577A (en) * | 1991-04-01 | 1993-11-02 | Clark Melvin D | Apparatus for assist in recycling of refuse |
US6202058B1 (en) | 1994-04-25 | 2001-03-13 | Apple Computer, Inc. | System for ranking the relevance of information objects accessed by computer users |
US5606609A (en) | 1994-09-19 | 1997-02-25 | Scientific-Atlanta | Electronic document verification system and method |
US5594660A (en) | 1994-09-30 | 1997-01-14 | Cirrus Logic, Inc. | Programmable audio-video synchronization method and apparatus for multimedia systems |
US5642502A (en) | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
US5933851A (en) | 1995-09-29 | 1999-08-03 | Sony Corporation | Time-stamp and hash-based file modification monitor with multi-user notification and method thereof |
US5974455A (en) | 1995-12-13 | 1999-10-26 | Digital Equipment Corporation | System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table |
US6314420B1 (en) | 1996-04-04 | 2001-11-06 | Lycos, Inc. | Collaborative/adaptive search engine |
JP3113814B2 (ja) | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
US5745890A (en) | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Sequential searching of a database index using constraints on word-location pairs |
US5920854A (en) | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
CN1107291C (zh) | 1996-10-02 | 2003-04-30 | 日本电信电话株式会社 | 分层结构的图形显示方法及装置 |
US6285999B1 (en) * | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
US5960383A (en) | 1997-02-25 | 1999-09-28 | Digital Equipment Corporation | Extraction of key sections from texts using automatic indexing techniques |
US5848404A (en) | 1997-03-24 | 1998-12-08 | International Business Machines Corporation | Fast query search in large dimension database |
US6256675B1 (en) | 1997-05-06 | 2001-07-03 | At&T Corp. | System and method for allocating requests for objects and managing replicas of objects on a network |
US6012053A (en) | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
JPH1125119A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | ハイパーテキスト閲覧システム |
JPH1125104A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | 情報処理装置および方法 |
US5983216A (en) | 1997-09-12 | 1999-11-09 | Infoseek Corporation | Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections |
US6182113B1 (en) | 1997-09-16 | 2001-01-30 | International Business Machines Corporation | Dynamic multiplexing of hyperlinks and bookmarks |
US6070191A (en) | 1997-10-17 | 2000-05-30 | Lucent Technologies Inc. | Data distribution techniques for load-balanced fault-tolerant web access |
US6351467B1 (en) | 1997-10-27 | 2002-02-26 | Hughes Electronics Corporation | System and method for multicasting multimedia content |
US6128701A (en) | 1997-10-28 | 2000-10-03 | Cache Flow, Inc. | Adaptive and predictive cache refresh policy |
US6594682B2 (en) | 1997-10-28 | 2003-07-15 | Microsoft Corporation | Client-side system for scheduling delivery of web content and locally managing the web content |
US5987457A (en) | 1997-11-25 | 1999-11-16 | Acceleration Software International Corporation | Query refinement method for searching documents |
US6473752B1 (en) | 1997-12-04 | 2002-10-29 | Micron Technology, Inc. | Method and system for locating documents based on previously accessed documents |
US6389436B1 (en) | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6145003A (en) | 1997-12-17 | 2000-11-07 | Microsoft Corporation | Method of web crawling utilizing address mapping |
US6151624A (en) | 1998-02-03 | 2000-11-21 | Realnames Corporation | Navigating network resources based on metadata |
KR100285265B1 (ko) | 1998-02-25 | 2001-04-02 | 윤덕용 | 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조 |
US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6125361A (en) * | 1998-04-10 | 2000-09-26 | International Business Machines Corporation | Feature diffusion across hyperlinks |
US6151595A (en) | 1998-04-17 | 2000-11-21 | Xerox Corporation | Methods for interactive visualization of spreading activation using time tubes and disk trees |
US6240407B1 (en) | 1998-04-29 | 2001-05-29 | International Business Machines Corp. | Method and apparatus for creating an index in a database system |
US6098064A (en) | 1998-05-22 | 2000-08-01 | Xerox Corporation | Prefetching and caching documents according to probability ranked need S list |
US6285367B1 (en) | 1998-05-26 | 2001-09-04 | International Business Machines Corporation | Method and apparatus for displaying and navigating a graph |
US6182085B1 (en) | 1998-05-28 | 2001-01-30 | International Business Machines Corporation | Collaborative team crawling:Large scale information gathering over the internet |
US6208988B1 (en) | 1998-06-01 | 2001-03-27 | Bigchalk.Com, Inc. | Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes |
JP2002517860A (ja) | 1998-06-08 | 2002-06-18 | ケイシーエスエル インク. | データベースから関連情報を検索する方法およびシステム |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6216123B1 (en) | 1998-06-24 | 2001-04-10 | Novell, Inc. | Method and system for rapid retrieval in a full text indexing system |
US6638314B1 (en) | 1998-06-26 | 2003-10-28 | Microsoft Corporation | Method of web crawling utilizing crawl numbers |
JP4638984B2 (ja) | 1998-08-26 | 2011-02-23 | フラクタル エッジ リミテッド | データファイルをマッピングするための方法および装置 |
US6549897B1 (en) | 1998-10-09 | 2003-04-15 | Microsoft Corporation | Method and system for calculating phrase-document importance |
US6360215B1 (en) | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
US6385602B1 (en) | 1998-11-03 | 2002-05-07 | E-Centives, Inc. | Presentation of search results using dynamic categorization |
US20030069873A1 (en) | 1998-11-18 | 2003-04-10 | Kevin L. Fox | Multiple engine information retrieval and visualization system |
US6628304B2 (en) | 1998-12-09 | 2003-09-30 | Cisco Technology, Inc. | Method and apparatus providing a graphical user interface for representing and navigating hierarchical networks |
US6167369A (en) | 1998-12-23 | 2000-12-26 | Xerox Company | Automatic language identification using both N-gram and word information |
US6922699B2 (en) * | 1999-01-26 | 2005-07-26 | Xerox Corporation | System and method for quantitatively representing data objects in vector space |
US6418433B1 (en) | 1999-01-28 | 2002-07-09 | International Business Machines Corporation | System and method for focussed web crawling |
US6862710B1 (en) | 1999-03-23 | 2005-03-01 | Insightful Corporation | Internet navigation using soft hyperlinks |
US6510406B1 (en) | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6763496B1 (en) | 1999-03-31 | 2004-07-13 | Microsoft Corporation | Method for promoting contextual information to display pages containing hyperlinks |
US6304864B1 (en) | 1999-04-20 | 2001-10-16 | Textwise Llc | System for retrieving multimedia information from the internet using multiple evolving intelligent agents |
US6327590B1 (en) | 1999-05-05 | 2001-12-04 | Xerox Corporation | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis |
US7835943B2 (en) | 1999-05-28 | 2010-11-16 | Yahoo! Inc. | System and method for providing place and price protection in a search result list generated by a computer network search engine |
US6990628B1 (en) | 1999-06-14 | 2006-01-24 | Yahoo! Inc. | Method and apparatus for measuring similarity among electronic documents |
US7072888B1 (en) | 1999-06-16 | 2006-07-04 | Triogo, Inc. | Process for improving search engine efficiency using feedback |
US6973490B1 (en) | 1999-06-23 | 2005-12-06 | Savvis Communications Corp. | Method and system for object-level web performance and analysis |
US6547829B1 (en) | 1999-06-30 | 2003-04-15 | Microsoft Corporation | Method and system for detecting duplicate documents in web crawls |
US7181438B1 (en) * | 1999-07-21 | 2007-02-20 | Alberti Anemometer, Llc | Database access system |
US6598047B1 (en) | 1999-07-26 | 2003-07-22 | David W. Russell | Method and system for searching text |
US6442606B1 (en) | 1999-08-12 | 2002-08-27 | Inktomi Corporation | Method and apparatus for identifying spoof documents |
US6636853B1 (en) | 1999-08-30 | 2003-10-21 | Morphism, Llc | Method and apparatus for representing and navigating search results |
AU1039301A (en) | 1999-10-29 | 2001-05-08 | British Telecommunications Public Limited Company | Method and apparatus for processing queries |
US6263364B1 (en) | 1999-11-02 | 2001-07-17 | Alta Vista Company | Web crawler system using plurality of parallel priority level queues having distinct associated download priority levels for prioritizing document downloading and maintaining document freshness |
US6351755B1 (en) | 1999-11-02 | 2002-02-26 | Alta Vista Company | System and method for associating an extensible set of data with documents downloaded by a web crawler |
US6418452B1 (en) | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service directory for efficient web crawling |
US6418453B1 (en) | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service for efficient web crawling |
US6539376B1 (en) | 1999-11-15 | 2003-03-25 | International Business Machines Corporation | System and method for the automatic mining of new relationships |
US7016540B1 (en) | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
US6886129B1 (en) | 1999-11-24 | 2005-04-26 | International Business Machines Corporation | Method and system for trawling the World-wide Web to identify implicitly-defined communities of web pages |
US6546388B1 (en) | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6883135B1 (en) | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
US7240067B2 (en) | 2000-02-08 | 2007-07-03 | Sybase, Inc. | System and methodology for extraction and aggregation of data from dynamic content |
US6931397B1 (en) | 2000-02-11 | 2005-08-16 | International Business Machines Corporation | System and method for automatic generation of dynamic search abstracts contain metadata by crawler |
US6910029B1 (en) | 2000-02-22 | 2005-06-21 | International Business Machines Corporation | System for weighted indexing of hierarchical documents |
US6516312B1 (en) | 2000-04-04 | 2003-02-04 | International Business Machine Corporation | System and method for dynamically associating keywords with domain-specific search engine queries |
US6633867B1 (en) | 2000-04-05 | 2003-10-14 | International Business Machines Corporation | System and method for providing a session query within the context of a dynamic search result set |
US6549896B1 (en) | 2000-04-07 | 2003-04-15 | Nec Usa, Inc. | System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling |
US6718365B1 (en) | 2000-04-13 | 2004-04-06 | International Business Machines Corporation | Method, system, and program for ordering search results using an importance weighting |
US6772160B2 (en) | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
US6741986B2 (en) | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
DE10029644B4 (de) | 2000-06-16 | 2008-02-07 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
JP3573688B2 (ja) | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US6601075B1 (en) | 2000-07-27 | 2003-07-29 | International Business Machines Corporation | System and method of ranking and retrieving documents based on authority scores of schemas and documents |
US6633868B1 (en) | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
US7080073B1 (en) | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US6959326B1 (en) | 2000-08-24 | 2005-10-25 | International Business Machines Corporation | Method, system, and program for gathering indexable metadata on content at a data repository |
US20030217052A1 (en) | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
JP3472540B2 (ja) | 2000-09-11 | 2003-12-02 | 日本電信電話株式会社 | サーバ選択装置、サーバ選択方法、及びサーバ選択プログラムを記録した記録媒体 |
US6598051B1 (en) | 2000-09-19 | 2003-07-22 | Altavista Company | Web page connectivity server |
US6560600B1 (en) | 2000-10-25 | 2003-05-06 | Alta Vista Company | Method and apparatus for ranking Web page search results |
US7200606B2 (en) | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6622140B1 (en) * | 2000-11-15 | 2003-09-16 | Justsystem Corporation | Method and apparatus for analyzing affect and emotion in text |
JP2002157271A (ja) | 2000-11-20 | 2002-05-31 | Yozan Inc | ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法 |
US20020103920A1 (en) | 2000-11-21 | 2002-08-01 | Berkun Ken Alan | Interpretive stream metadata extraction |
US8402068B2 (en) | 2000-12-07 | 2013-03-19 | Half.Com, Inc. | System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network |
US20020078045A1 (en) | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
US6778997B2 (en) | 2001-01-05 | 2004-08-17 | International Business Machines Corporation | XML: finding authoritative pages for mining communities based on page structure criteria |
US7356530B2 (en) * | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US6766316B2 (en) | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US20020103798A1 (en) | 2001-02-01 | 2002-08-01 | Abrol Mani S. | Adaptive document ranking method based on user behavior |
US20020107886A1 (en) | 2001-02-07 | 2002-08-08 | Gentner Donald R. | Method and apparatus for automatic document electronic versioning system |
US7571177B2 (en) | 2001-02-08 | 2009-08-04 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US20040003028A1 (en) | 2002-05-08 | 2004-01-01 | David Emmett | Automatic display of web content to smaller display devices: improved summarization and navigation |
US7269545B2 (en) | 2001-03-30 | 2007-09-11 | Nec Laboratories America, Inc. | Method for retrieving answers from an information retrieval system |
US20020169770A1 (en) | 2001-04-27 | 2002-11-14 | Kim Brian Seong-Gon | Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents |
US7188106B2 (en) * | 2001-05-01 | 2007-03-06 | International Business Machines Corporation | System and method for aggregating ranking results from various sources to improve the results of web searching |
US6738764B2 (en) | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
WO2002091154A2 (en) | 2001-05-10 | 2002-11-14 | Changingworlds Limited | Intelligent internet website with hierarchical menu |
US7519529B1 (en) | 2001-06-29 | 2009-04-14 | Microsoft Corporation | System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service |
US7039234B2 (en) | 2001-07-19 | 2006-05-02 | Microsoft Corporation | Electronic ink as a software object |
US6928425B2 (en) | 2001-08-13 | 2005-08-09 | Xerox Corporation | System for propagating enrichment between documents |
US7076483B2 (en) | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US6766422B2 (en) | 2001-09-27 | 2004-07-20 | Siemens Information And Communication Networks, Inc. | Method and system for web caching based on predictive usage |
US6944609B2 (en) | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
US7428695B2 (en) | 2001-10-22 | 2008-09-23 | Hewlett-Packard Development Company, L.P. | System for automatic generation of arbitrarily indexed hyperlinked text |
US6763362B2 (en) | 2001-11-30 | 2004-07-13 | Micron Technology, Inc. | Method and system for updating a search engine |
JP3871201B2 (ja) | 2002-01-29 | 2007-01-24 | ソニー株式会社 | コンテンツ提供取得システム |
US6829606B2 (en) | 2002-02-14 | 2004-12-07 | Infoglide Software Corporation | Similarity search engine for use with relational databases |
JP4021681B2 (ja) | 2002-02-22 | 2007-12-12 | 日本電信電話株式会社 | ページレイティング/フィルタリング方法および装置とページレイティング/フィルタリングプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体 |
US6934714B2 (en) | 2002-03-04 | 2005-08-23 | Intelesis Engineering, Inc. | Method and system for identification and maintenance of families of data records |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US20040006559A1 (en) | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
CA2489236C (en) | 2002-06-12 | 2014-01-14 | Jena Jordahl | Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view |
CA2395905A1 (en) | 2002-07-26 | 2004-01-26 | Teraxion Inc. | Multi-grating tunable chromatic dispersion compensator |
US7152059B2 (en) | 2002-08-30 | 2006-12-19 | Emergency24, Inc. | System and method for predicting additional search results of a computerized database search user based on an initial search query |
US7013458B2 (en) | 2002-09-09 | 2006-03-14 | Sun Microsystems, Inc. | Method and apparatus for associating metadata attributes with program elements |
US6886010B2 (en) * | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7231379B2 (en) | 2002-11-19 | 2007-06-12 | Noema, Inc. | Navigation in a hierarchical structured transaction processing system |
US7386527B2 (en) | 2002-12-06 | 2008-06-10 | Kofax, Inc. | Effective multi-class support vector machine classification |
US7020648B2 (en) | 2002-12-14 | 2006-03-28 | International Business Machines Corporation | System and method for identifying and utilizing a secondary index to access a database using a management system without an internal catalogue of online metadata |
US20040148278A1 (en) | 2003-01-22 | 2004-07-29 | Amir Milo | System and method for providing content warehouse |
US20040181515A1 (en) * | 2003-03-13 | 2004-09-16 | International Business Machines Corporation | Group administration of universal resource identifiers with members identified in search result |
US6947930B2 (en) | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7216123B2 (en) | 2003-03-28 | 2007-05-08 | Board Of Trustees Of The Leland Stanford Junior University | Methods for ranking nodes in large directed graphs |
US7028029B2 (en) * | 2003-03-28 | 2006-04-11 | Google Inc. | Adaptive computation of ranking |
US7451130B2 (en) * | 2003-06-16 | 2008-11-11 | Google Inc. | System and method for providing preferred country biasing of search results |
US7451129B2 (en) | 2003-03-31 | 2008-11-11 | Google Inc. | System and method for providing preferred language ordering of search results |
US7051023B2 (en) * | 2003-04-04 | 2006-05-23 | Yahoo! Inc. | Systems and methods for generating concept units from search queries |
US7197497B2 (en) * | 2003-04-25 | 2007-03-27 | Overture Services, Inc. | Method and apparatus for machine learning a document relevance function |
US7308643B1 (en) | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
US20050060186A1 (en) | 2003-08-28 | 2005-03-17 | Blowers Paul A. | Prioritized presentation of medical device events |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US20050071328A1 (en) * | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US7552109B2 (en) | 2003-10-15 | 2009-06-23 | International Business Machines Corporation | System, method, and service for collaborative focused crawling of documents on a network |
US20050086192A1 (en) | 2003-10-16 | 2005-04-21 | Hitach, Ltd. | Method and apparatus for improving the integration between a search engine and one or more file servers |
US7231399B1 (en) | 2003-11-14 | 2007-06-12 | Google Inc. | Ranking documents based on large data sets |
US20060047649A1 (en) | 2003-12-29 | 2006-03-02 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US20050160107A1 (en) * | 2003-12-29 | 2005-07-21 | Ping Liang | Advanced search, file system, and intelligent assistant agent |
US7483891B2 (en) * | 2004-01-09 | 2009-01-27 | Yahoo, Inc. | Content presentation and management system associating base content and relevant additional content |
US7392278B2 (en) | 2004-01-23 | 2008-06-24 | Microsoft Corporation | Building and using subwebs for focused search |
US7499913B2 (en) * | 2004-01-26 | 2009-03-03 | International Business Machines Corporation | Method for handling anchor text |
US7310632B2 (en) | 2004-02-12 | 2007-12-18 | Microsoft Corporation | Decision-theoretic web-crawling and predicting web-page change |
US7281002B2 (en) | 2004-03-01 | 2007-10-09 | International Business Machine Corporation | Organizing related search results |
US7584221B2 (en) | 2004-03-18 | 2009-09-01 | Microsoft Corporation | Field weighting in text searching |
US7343374B2 (en) | 2004-03-29 | 2008-03-11 | Yahoo! Inc. | Computation of page authority weights using personalized bookmarks |
US7693825B2 (en) | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US20050251499A1 (en) | 2004-05-04 | 2005-11-10 | Zezhen Huang | Method and system for searching documents using readers valuation |
US7257577B2 (en) | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
US7260573B1 (en) | 2004-05-17 | 2007-08-21 | Google Inc. | Personalizing anchor text scores in a search engine |
US20050283473A1 (en) | 2004-06-17 | 2005-12-22 | Armand Rousso | Apparatus, method and system of artificial intelligence for data searching applications |
US7363296B1 (en) * | 2004-07-01 | 2008-04-22 | Microsoft Corporation | Generating a subindex with relevant attributes to improve querying |
US7428530B2 (en) | 2004-07-01 | 2008-09-23 | Microsoft Corporation | Dispersing search engine results by using page category information |
US20060036598A1 (en) | 2004-08-09 | 2006-02-16 | Jie Wu | Computerized method for ranking linked information items in distributed sources |
US7333963B2 (en) | 2004-10-07 | 2008-02-19 | Bernard Widrow | Cognitive memory and auto-associative neural network based search engine for computer and network located images and photographs |
CN101601032A (zh) | 2005-01-18 | 2009-12-09 | 雅虎公司 | 结合万维网搜索技术和万维网内容的被赞助搜索条目的匹配和排名 |
US7689615B2 (en) | 2005-02-25 | 2010-03-30 | Microsoft Corporation | Ranking results using multiple nested ranking |
US7574436B2 (en) | 2005-03-10 | 2009-08-11 | Yahoo! Inc. | Reranking and increasing the relevance of the results of Internet searches |
US20060206460A1 (en) | 2005-03-14 | 2006-09-14 | Sanjay Gadkari | Biasing search results |
KR101374651B1 (ko) | 2005-03-18 | 2014-03-17 | 써치 엔진 테크놀로지스, 엘엘씨 | 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진 |
US20060282455A1 (en) | 2005-06-13 | 2006-12-14 | It Interactive Services Inc. | System and method for ranking web content |
US7627564B2 (en) | 2005-06-21 | 2009-12-01 | Microsoft Corporation | High scale adaptive search systems and methods |
US7599917B2 (en) | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7716226B2 (en) | 2005-09-27 | 2010-05-11 | Patentratings, Llc | Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects |
US20070150473A1 (en) | 2005-12-22 | 2007-06-28 | Microsoft Corporation | Search By Document Type And Relevance |
US7685091B2 (en) | 2006-02-14 | 2010-03-23 | Accenture Global Services Gmbh | System and method for online information analysis |
-
2004
- 2004-09-30 US US10/955,462 patent/US7739277B2/en not_active Expired - Fee Related
-
2005
- 2005-06-09 EP EP05105048A patent/EP1643383B1/en not_active Not-in-force
- 2005-06-15 JP JP2005175173A patent/JP4763354B2/ja not_active Expired - Fee Related
- 2005-06-30 KR KR1020050058224A patent/KR101076894B1/ko not_active IP Right Cessation
- 2005-07-25 CN CN2005100882135A patent/CN1755678B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5920859A (en) * | 1997-02-05 | 1999-07-06 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
JP2001265774A (ja) * | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム |
JP2003067419A (ja) * | 2001-08-24 | 2003-03-07 | Toshiba Corp | 情報検索方法および情報検索システム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009151749A (ja) * | 2007-09-25 | 2009-07-09 | Nec (China) Co Ltd | ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム |
JP2013206388A (ja) * | 2012-03-29 | 2013-10-07 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US7739277B2 (en) | 2010-06-15 |
KR101076894B1 (ko) | 2011-10-25 |
CN1755678A (zh) | 2006-04-05 |
JP4763354B2 (ja) | 2011-08-31 |
US20060074871A1 (en) | 2006-04-06 |
CN1755678B (zh) | 2010-08-25 |
EP1643383A1 (en) | 2006-04-05 |
KR20060049708A (ko) | 2006-05-19 |
EP1643383B1 (en) | 2013-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4763354B2 (ja) | 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 | |
US7827181B2 (en) | Click distance determination | |
US7792833B2 (en) | Ranking search results using language types | |
KR101311050B1 (ko) | 문서 사용 통계치를 사용한 랭킹 함수 | |
US7761448B2 (en) | System and method for ranking search results using click distance | |
US20060200460A1 (en) | System and method for ranking search results using file types | |
JP6006267B2 (ja) | 索引キーを使用して検索を絞込むシステムおよび方法 | |
US7779001B2 (en) | Web page ranking with hierarchical considerations | |
EP1643388A1 (en) | System and method for incremental indexing of network documents using batch transfers | |
JP2006048686A (ja) | フレーズに基づく文書説明の生成方法 | |
JP2006048684A (ja) | 情報検索システムにおけるフレーズに基づく検索方法 | |
JP2006048683A (ja) | 情報検索システムにおけるフレーズ識別方法 | |
JP4220483B2 (ja) | 情報収集システム、情報収集方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110609 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |