JP4763354B2 - 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 - Google Patents
検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 Download PDFInfo
- Publication number
- JP4763354B2 JP4763354B2 JP2005175173A JP2005175173A JP4763354B2 JP 4763354 B2 JP4763354 B2 JP 4763354B2 JP 2005175173 A JP2005175173 A JP 2005175173A JP 2005175173 A JP2005175173 A JP 2005175173A JP 4763354 B2 JP4763354 B2 JP 4763354B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- anchor
- documents
- anchor text
- wtf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1において、本発明を実施する例示的システムのひとつはコンピューティングデバイス100などのコンピューティングデバイスを含む。コンピューティングデバイス100はクライアント、サーバ、モバイル機器、または他のコンピューティングデバイスのいずれかとして構成される。非常に基本的な構成では、コンピューティングデバイス100は少なくともひとつの処理ユニット102およびシステムメモリ104を含むのが典型的である。コンピューティングデバイスの厳密な構成およびタイプに依って、システムメモリ104は(RAMなどの)揮発性、(ROM、フラッシュメモリ、他などの)不揮発性、または2つのある種の組合せのいずれかである。システムメモリ104はオペレーティングシステム105、1または複数のアプリケーション106を含むのが典型的であり、かつプログラムデータ107を含んでもよい。一実施形態においては、アプリケーション106は本発明の機能を実施する検索ランク付けアプリケーション120を含む。この基本的構成を破線108内の構成要素により図1に示す。
本発明の実施形態は検索エンジンに用いるランク付け機能に関する。検索エンジンの品質をランク付け機能により割り当てられたランクによる文書の妥当性により典型的に判定する。アンカーテキストはHTML(<Ahref=http://example>Example Web</A>)のアンカータグ内のテキストとして定義される。アンカーテキストはターゲットURL(ユニフォームリソースロケータ)の短い高品質記述をしばしば含み、かつ所与の文書を指すアンカータグのコンテントをその文書用のランク付け機能に組込むことはランク付け機能にとって利点である。
図5に本発明による文書ランク付けにアンカーテキストを含むようにアンカーテキストを取扱う例示的プロセスの論理フロー図を示す。プロセス500は文書のコーパスへのアクセスを提供するブロック502で開始する。処理はブロック504に続く。
Σ[wtf(k1+1)/{k1((1−b)+b(wdl/avwdl))
+(wtf)}]×log(N/n)
(1)
ここで、用語は次のように定義される。wtfは、すべてのプロパティ全体にわたる重みにより乗算された所与の用語の用語頻度の総和の重み付け用語頻度、wdlは重み付け文書長、avwdlは平均重み付け文書長、Nはネットワーク上の文書の数、nはすべてのクエリ用語全体にわたって積算された、所与のクエリ用語を含む文書の数、k1およびbは定数である。これらの専門用語および上記方程式は米国特許出願番号第10/804,326号に詳細に記載されている。
Σ[(wtf+wtfAnchor)(k1+1)/{k1((1−b)+b(wdl/avwdl))+(wtf+wtfAnchor)}]×log(N/n)
(2)
となる。
B={(1−b)+b(wdl/avwdl)} (3)
と定義される。
Σ[(wtf/B)(k1+1)/{k1+(wtf/B)}]×log(N/n)
(4)
Σ[(wtf/B+wtfAnchor/BAnchor)(k1+1)/{k1+(wtf/B+wtfAnchor/BAnchor)}]×log(N/n) (5)
となる。
220 パイプライン
230 文書インターフェース
240 クライアントインターフェース
250 アンカーテキストプラグイン
260 インデックス付けグプラグイン
270 アンカーテキストテーブル
310 メインインデックス
320 アンカーテキストインデックス
Claims (18)
- 検索結果のランク付けを表現するコンピュータが実施する方法であって、
プロセッサが、複数の文書にインデックスを提供するステップであって、前記インデックスは、前記文書のそれぞれに含まれる1以上の用語の頻度を前記文書のそれぞれに関連付けるメインインデックスと、前記文書のそれぞれを参照するソース文書内のアンカーテキストに含まれる1以上の用語のアンカーテキスト頻度を前記文書のそれぞれに関連付けるアンカーテキストインデックスとを含む、ステップと、
プロセッサが、少なくとも1つのクエリ用語を含むクエリを受信するステップと、
プロセッサが、前記少なくとも1つのクエリ用語を含む1以上の前記文書を識別する前記クエリの結果を得るために前記インデックスに前記クエリを適用するステップと、
プロセッサが、前記クエリの前記結果に含まれる1以上の文書のそれぞれにスコアを生成するためにスコアリング関数を適用するステップであって、前記スコアリング関数(スコア)は、
score=Σ[(wtf+wtf Anchor )(k 1 +1)/{k 1 ((1−b)+b(wdl/avwdl))+(wtf+wtf Anchor )}]×log(N/n)、及び、
score=Σ[{(wtf/B+wtf Anchor /B Anchor )(k 1 +1)}/{k 1 +(wtf/B+wtf Anchor /B Anchor )}]×log(N/n)
のうちのいずれか1つにより与えられ、
ここで、
wtfは、所与のクエリ用語が前記文書に含まれる頻度に重み付けを適用した重み付け用語頻度であり、
wtf Anchor は、所与のクエリ用語が前記文書を参照しているアンカーテキストに含まれる頻度に重み付けを適用した重み付け用語頻度であり、
k1およびbは、定数であり、
wdlは、スコアリングされる前記文書の長さに重み付けを適用した重み付け文書長であり、
avwdlは、スコアリングされる全ての文書の平均重み付け文書長であり、
Nは、ネットワーク上の文書の数であり、
nは、所与のクエリ用語が少なくとも1つ出現した文書の数である、ステップと、
プロセッサがユーザに表示される前記クエリのランク付けされた結果の出力を生成するステップと
を含むことを特徴とするコンピュータが実施する方法。 - プロセッサが、前記文書に含まれる前記1以上の用語の頻度を決定するために前記複数の文書のそれぞれを処理することにより、前記インデックスを構築するステップをさらに含む請求項1に記載のコンピュータが実施する方法。
- プロセッサが、それぞれ別の文書を参照する1以上のアンカーテキスト入力を識別するために、前記複数の文書のそれぞれを処理することにより前記インデックスを構築するステップをさらに含む請求項2に記載のコンピュータが実施する方法。
- プロセッサが、アンカーテキストテーブルを生成するステップであって、前記テーブルの項目は、前記アンカーテキスト入力を含む前記文書のそれぞれについて作成され、前記アンカーテキスト入力を含む前記文書を示すソース識別子、前記アンカーテキスト入力が参照するターゲット文書を示すターゲット識別子、及び、前記アンカーテキスト入力の内容に含まれる1以上の用語、のうち1以上を含むことができる、ステップをさらに含む請求項3に記載のコンピュータが実施する方法。
- プロセッサが、前記文書のそれぞれについて、前記文書に含まれる1以上の用語の頻度を収集することにより、および、前記文書が前記ターゲット識別子の前記ターゲット文書としてリストされている前記アンカーテーブルの項目のそれぞれについて、前記アンカーテキスト入力の内容にリストされている用語の頻度を収集することによりインデックスを生成するステップをさらに含む請求項4に記載のコンピュータが実施する方法。
- 重み付けアンカーテキスト用語頻度(wtf Anchor )、および、重み付け文書長(wdl)と、平均重み付け文書長(avwdl)から引き出されるアンカーテキスト長正規化成分B Anchor を含む用語に基づいて判定されるスコアリング関数(スコア)に従って文書をランク付けするステップをさらに含むことを特徴とする請求項1に記載のコンピュータが実施する方法。
- 前記文書がアンカーテキストデータと関係付けられていないとき、前記スコアリング関数(スコア)は、
score=Σ[wtf(k 1 +1)/{k 1 ((1−b)+b(wdl/avwdl))+(wtf)}]×log(N/n)
により得られることを特徴とする請求項1に記載のコンピュータが実施する方法。 - 前記B Anchor によりもたらされる前記長さ正規化の強度はB Anchor に関連した異なる定数値を選択することにより調整されることを特徴とする請求項1に記載のコンピュータが実施する方法。
- コンピュータシステム上で実行可能な命令を記録するコンピュータ可読記録媒体であって、前記命令は、
プロセッサが、ネットワーク上の複数の文書のそれぞれの内容を評価するステップであって、
プロセッサが、前記文書内に含まれる用語の頻度を記録するステップと、
プロセッサが、別の文書を参照するそれぞれのアンカーテキスト入力のためのアンカーテキストテーブル内に項目を作成するステップとを含むステップと、
プロセッサが、インデックスを編集するステップであって、
プロセッサが、前記文書に含まれる1以上の用語の頻度を前記文書のそれぞれに関連付けるメインインデックスを生成するステップと、
プロセッサが、前記文書を参照するアンカーテキストテーブル内のアンカーテキスト入力にリストされた用語の頻度を前記文書のそれぞれに関連付けるアンカーテキストインデックスを生成するステップとを含むステップと、
プロセッサが、少なくとも1つのクエリ用語を含むクエリを受信するステップと、
プロセッサが、前記少なくとも1つのクエリ用語を含む1以上の前記文書を識別する前記クエリの結果を得るために前記インデックスに前記クエリを適用するステップと、
プロセッサが、前記クエリの前記結果に含まれる1以上の文書のそれぞれにスコアを生成するためにスコアリング関数を適用するステップであって、前記スコアリング関数(スコア)は、
score=Σ[(wtf+wtf Anchor )(k 1 +1)/{k 1 ((1−b)+b(wdl/avwdl))+(wtf+wtf Anchor )}]×log(N/n)、及び、
score=Σ[{(wtf/B+wtf Anchor /B Anchor )(k 1 +1)}/{k 1 +(wtf/B+wtf Anchor /B Anchor )}]×log(N/n)
のうちのいずれか1つにより与えられ、
ここで、
wtfは、所与のクエリ用語が前記文書に含まれる頻度に重み付けを適用した重み付け用語頻度であり、
wtf Anchor は、所与のクエリ用語が前記文書を参照しているアンカーテキストに含まれる頻度に重み付けを適用した重み付け用語頻度であり、
k1およびbは、定数であり、
wdlは、スコアリングされる前記文書の長さに重み付けを適用した重み付け文書長であり、
avwdlは、スコアリングされる全ての文書の平均重み付け文書長であり、
Nは、ネットワーク上の文書の数であり、
nは、所与のクエリ用語が少なくとも1つ出現した文書の数である、ステップと、
プロセッサがユーザに表示される前記クエリのランク付けされた結果の出力を生成するステップと
を含むことを特徴とするコンピュータ可読記録媒体。 - 前記文書のそれぞれのためにアンカーテキストテーブルの項目を生成するステップは、
プロセッサが、前記アンカーテキスト入力を含む前記文書を示すソース識別子を記録するステップと
プロセッサが、前記アンカーテキスト入力が参照するターゲット文書を示すターゲット識別子を記録するステップと、
前記アンカーテキスト入力の内容に含まれる1以上の用語を記録するステップと
を含むことを特徴とする請求項9に記載のコンピュータ可読記録媒体。 - 前記文書がアンカーテキストデータと関係付けられていないとき、前記スコアリング関数(スコア)は、
score=Σ[wtf(k 1 +1)/{k 1 ((1−b)+b(wdl/avwdl))+(wtf)}]×log(N/n)
により得られることを特徴とする請求項9に記載のコンピュータ可読記録媒体。 - 前記B Anchor によりもたらされる前記長さ正規化の強度はB Anchor に関連した異なる定数値を選択することにより調整されることを特徴とする請求項9に記載のコンピュータ可読記録媒体。
- プロセッサが前記クエリのランク付けされた結果の出力をユーザに表示させるステップをさらに含む請求項9に記載のコンピュータ可読記録媒体。
- 検索エンジンシステムであって、
複数の文書のためのインデックスであって、
前記文書のそれぞれに含まれる1以上の用語の頻度を前記文書のそれぞれに関連付けるメインインデックスと、
前記文書のそれぞれを参照するソース文書内のアンカーテキストに含まれる1以上の用語のアンカーテキスト頻度を前記文書のそれぞれに関連付けるアンカーテキストインデックスとを含む、インデックスと、
ランク付けシステムであって、
少なくとも1つのクエリ用語を含むクエリを受信し、前記少なくとも1つのクエリ用語を含む1以上の前記文書を識別するために前記インデックスに前記クエリを適用するように構成されたクエリインターフェースと、
前記クエリの前記結果に含まれる1以上の文書のそれぞれにスコアを生成するためにスコアリング関数であって、前記スコアリング関数(スコア)は、
score=Σ[{(wtf/B+wtf Anchor /B Anchor )(k 1 +1)}/{k 1 +(wtf/B+wtf Anchor /B Anchor )}]×log(N/n)
により与えられ、
ここで、
wtfは、所与のクエリ用語が前記文書に含まれる頻度に重み付けを適用した重み付け用語頻度であり、
wtf Anchor は、所与のクエリ用語が前記文書を参照しているアンカーテキストに含まれる頻度に重み付けを適用した重み付け用語頻度であり、
k1は、定数であり、
wdlは、スコアリングされる前記文書の長さに重み付けを適用した重み付け文書長であり、
avwdlは、スコアリングされる全ての文書の平均重み付け文書長であり、
Bは、B={(1−b)+b(wdl/avwdl)}(bは定数)で定義される文書長正規化成分であり、
B Anchor は、B={(1−b)+b(wdl/avwdl)}(bは定数)で定義されるアンカーテキスト長正規化成分であり、
Nは、ネットワーク上の文書の数であり、
nは、所与のクエリ用語が少なくとも1つ出現した文書の数である、
スコアリング関数とを備え、
前記クエリの前記結果に含まれる前記文書のそれぞれについて生成されたスコアに基づいて前記クエリの前記結果をランク付けするように構成されるランク付けシステムと
を備えることを特徴とするシステム。 - 前記文書に含まれる前記1以上の用語の頻度を決定するために前記複数の文書のそれぞれを処理することにより、前記メインインデックスを構築するように構成されたクローラをさらに備えることを特徴とする請求項14に記載のシステム。
- 前記クローラが、それぞれ別の文書を参照する1以上のアンカーテキスト入力を識別するために、前記複数の文書のそれぞれを処理することにより前記アンカーテキストインデックスを構築するようにさらに構成されることを特徴とする請求項15に記載のシステム。
- 前記クローラが、アンカーテキストテーブルを生成するようにさらに構成され、前記テーブルの項目は、前記アンカーテキスト入力を含む前記文書のそれぞれについて作成され、前記アンカーテキスト入力を含む前記文書を示すソース識別子、前記アンカーテキスト入力が参照するターゲット文書を示すターゲット識別子、及び、前記アンカーテキスト入力の内容に含まれる1以上の用語、のうち1以上を含むことができることを特徴とする請求項16に記載のシステム。
- 前記クローラが、前記文書のそれぞれについて、前記文書に含まれる1以上の用語の頻度を収集し、前記文書が前記ターゲット識別子の前記ターゲット文書としてリストされている前記アンカーテーブルの項目のそれぞれについて、前記アンカーテキスト入力の内容にリストされている用語の頻度を収集することによりインデックスを生成するようにさらに構成されることを特徴とする請求項17に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/955,462 US7739277B2 (en) | 2004-09-30 | 2004-09-30 | System and method for incorporating anchor text into ranking search results |
US10/955,462 | 2004-09-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006107433A JP2006107433A (ja) | 2006-04-20 |
JP4763354B2 true JP4763354B2 (ja) | 2011-08-31 |
Family
ID=35478739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005175173A Expired - Fee Related JP4763354B2 (ja) | 2004-09-30 | 2005-06-15 | 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7739277B2 (ja) |
EP (1) | EP1643383B1 (ja) |
JP (1) | JP4763354B2 (ja) |
KR (1) | KR101076894B1 (ja) |
CN (1) | CN1755678B (ja) |
Families Citing this family (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7606793B2 (en) | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US20060161543A1 (en) * | 2005-01-19 | 2006-07-20 | Tiny Engine, Inc. | Systems and methods for providing search results based on linguistic analysis |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7711732B2 (en) * | 2006-04-21 | 2010-05-04 | Yahoo! Inc. | Determining related terms based on link annotations of documents belonging to search result sets |
US9256676B2 (en) | 2006-05-10 | 2016-02-09 | Google Inc. | Presenting search result information |
EP1862916A1 (en) * | 2006-06-01 | 2007-12-05 | Microsoft Corporation | Indexing Documents for Information Retrieval based on additional feedback fields |
US8555182B2 (en) | 2006-06-07 | 2013-10-08 | Microsoft Corporation | Interface for managing search term importance relationships |
US7624104B2 (en) * | 2006-06-22 | 2009-11-24 | Yahoo! Inc. | User-sensitive pagerank |
CN100456296C (zh) * | 2006-06-28 | 2009-01-28 | 腾讯科技(深圳)有限公司 | 一种多媒体文件搜索引擎的排序方法 |
US8595245B2 (en) * | 2006-07-26 | 2013-11-26 | Xerox Corporation | Reference resolution for text enrichment and normalization in mining mixed data |
US7562073B2 (en) * | 2006-08-02 | 2009-07-14 | Sap Ag | Business object search using multi-join indexes and extended join indexes |
US8458207B2 (en) * | 2006-09-15 | 2013-06-04 | Microsoft Corporation | Using anchor text to provide context |
US7672943B2 (en) * | 2006-10-26 | 2010-03-02 | Microsoft Corporation | Calculating a downloading priority for the uniform resource locator in response to the domain density score, the anchor text score, the URL string score, the category need score, and the link proximity score for targeted web crawling |
US7788253B2 (en) | 2006-12-28 | 2010-08-31 | International Business Machines Corporation | Global anchor text processing |
US7657507B2 (en) | 2007-03-02 | 2010-02-02 | Microsoft Corporation | Pseudo-anchor text extraction for vertical search |
KR100871470B1 (ko) * | 2007-04-12 | 2008-12-03 | 주식회사 케이티프리텔 | 색인 데이터를 구축하기 위한 검색 시스템 및 이를 위한 방법 |
US7853603B2 (en) * | 2007-05-23 | 2010-12-14 | Microsoft Corporation | User-defined relevance ranking for search |
CN101399818B (zh) * | 2007-09-25 | 2012-08-29 | 日电(中国)有限公司 | 基于导航路径信息的主题相关网页过滤方法和系统 |
US7840569B2 (en) * | 2007-10-18 | 2010-11-23 | Microsoft Corporation | Enterprise relevancy ranking using a neural network |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US7958136B1 (en) * | 2008-03-18 | 2011-06-07 | Google Inc. | Systems and methods for identifying similar documents |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US9342607B2 (en) * | 2009-06-19 | 2016-05-17 | International Business Machines Corporation | Dynamic inference graph |
US10007705B2 (en) | 2010-10-30 | 2018-06-26 | International Business Machines Corporation | Display of boosted slashtag results |
US10726083B2 (en) | 2010-10-30 | 2020-07-28 | International Business Machines Corporation | Search query transformations |
CN102023989B (zh) * | 2009-09-23 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 一种信息检索方法及其系统 |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US20120036122A1 (en) * | 2010-08-06 | 2012-02-09 | Yahoo! Inc. | Contextual indexing of search results |
RU2013124949A (ru) | 2010-10-30 | 2014-12-10 | БЛЕККО, Инк. | Динамическое отображение результатов поиска |
CN102567326B (zh) * | 2010-12-14 | 2014-09-03 | 中国移动通信集团湖南有限公司 | 一种信息搜索、及信息搜索排序装置和方法 |
CN102567417A (zh) * | 2010-12-31 | 2012-07-11 | 百度在线网络技术(北京)有限公司 | 一种用于确定超链接的锚文本可信度的分析设备和方法 |
US8463799B2 (en) * | 2011-06-29 | 2013-06-11 | International Business Machines Corporation | System and method for consolidating search engine results |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
CN103309894B (zh) * | 2012-03-15 | 2016-04-27 | 阿里巴巴集团控股有限公司 | 基于用户属性的搜索实现方法及系统 |
WO2013142852A1 (en) * | 2012-03-23 | 2013-09-26 | Sententia, LLC | Method and systems for text enhancement |
JP5870815B2 (ja) * | 2012-03-29 | 2016-03-01 | 大日本印刷株式会社 | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム |
US9348846B2 (en) | 2012-07-02 | 2016-05-24 | Google Inc. | User-navigable resource representations |
CN103106278A (zh) * | 2013-02-18 | 2013-05-15 | 人民搜索网络股份公司 | 权重值的获取方法及装置 |
US9607038B2 (en) * | 2013-03-15 | 2017-03-28 | International Business Machines Corporation | Determining linkage metadata of content of a target document to source documents |
US11392568B2 (en) | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US11281639B2 (en) | 2015-06-23 | 2022-03-22 | Microsoft Technology Licensing, Llc | Match fix-up to remove matching documents |
US10229143B2 (en) | 2015-06-23 | 2019-03-12 | Microsoft Technology Licensing, Llc | Storage and retrieval of data from a bit vector search index |
US10467215B2 (en) | 2015-06-23 | 2019-11-05 | Microsoft Technology Licensing, Llc | Matching documents using a bit vector search index |
US10733164B2 (en) | 2015-06-23 | 2020-08-04 | Microsoft Technology Licensing, Llc | Updating a bit vector search index |
US10565198B2 (en) | 2015-06-23 | 2020-02-18 | Microsoft Technology Licensing, Llc | Bit vector search index using shards |
US10242071B2 (en) | 2015-06-23 | 2019-03-26 | Microsoft Technology Licensing, Llc | Preliminary ranker for scoring matching documents |
US10552465B2 (en) * | 2016-02-18 | 2020-02-04 | Microsoft Technology Licensing, Llc | Generating text snippets using universal concept graph |
US11115279B2 (en) * | 2018-12-07 | 2021-09-07 | Hewlett Packard Enterprise Development Lp | Client server model for multiple document editor |
US11455312B1 (en) | 2019-11-20 | 2022-09-27 | Sabre Glbl Inc. | Data query system with improved response time |
CN112183087B (zh) * | 2020-09-27 | 2024-05-28 | 武汉华工安鼎信息技术有限责任公司 | 一种敏感文本识别的系统和方法 |
Family Cites Families (186)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5222236A (en) * | 1988-04-29 | 1993-06-22 | Overdrive Systems, Inc. | Multiple integrated document assembly data processing system |
US5257577A (en) * | 1991-04-01 | 1993-11-02 | Clark Melvin D | Apparatus for assist in recycling of refuse |
US6202058B1 (en) * | 1994-04-25 | 2001-03-13 | Apple Computer, Inc. | System for ranking the relevance of information objects accessed by computer users |
US5606609A (en) * | 1994-09-19 | 1997-02-25 | Scientific-Atlanta | Electronic document verification system and method |
US5594660A (en) * | 1994-09-30 | 1997-01-14 | Cirrus Logic, Inc. | Programmable audio-video synchronization method and apparatus for multimedia systems |
US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
US5933851A (en) | 1995-09-29 | 1999-08-03 | Sony Corporation | Time-stamp and hash-based file modification monitor with multi-user notification and method thereof |
US5974455A (en) * | 1995-12-13 | 1999-10-26 | Digital Equipment Corporation | System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table |
US6314420B1 (en) | 1996-04-04 | 2001-11-06 | Lycos, Inc. | Collaborative/adaptive search engine |
JP3113814B2 (ja) * | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
US5920859A (en) * | 1997-02-05 | 1999-07-06 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
US5745890A (en) | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Sequential searching of a database index using constraints on word-location pairs |
US5920854A (en) * | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
US6222559B1 (en) | 1996-10-02 | 2001-04-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for display of hierarchical structures |
US6285999B1 (en) * | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
US5960383A (en) | 1997-02-25 | 1999-09-28 | Digital Equipment Corporation | Extraction of key sections from texts using automatic indexing techniques |
US5848404A (en) | 1997-03-24 | 1998-12-08 | International Business Machines Corporation | Fast query search in large dimension database |
US6256675B1 (en) | 1997-05-06 | 2001-07-03 | At&T Corp. | System and method for allocating requests for objects and managing replicas of objects on a network |
US6012053A (en) * | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
JPH1125104A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | 情報処理装置および方法 |
JPH1125119A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | ハイパーテキスト閲覧システム |
US5983216A (en) | 1997-09-12 | 1999-11-09 | Infoseek Corporation | Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections |
US6182113B1 (en) | 1997-09-16 | 2001-01-30 | International Business Machines Corporation | Dynamic multiplexing of hyperlinks and bookmarks |
US6070191A (en) * | 1997-10-17 | 2000-05-30 | Lucent Technologies Inc. | Data distribution techniques for load-balanced fault-tolerant web access |
US6351467B1 (en) * | 1997-10-27 | 2002-02-26 | Hughes Electronics Corporation | System and method for multicasting multimedia content |
US6128701A (en) | 1997-10-28 | 2000-10-03 | Cache Flow, Inc. | Adaptive and predictive cache refresh policy |
US6594682B2 (en) * | 1997-10-28 | 2003-07-15 | Microsoft Corporation | Client-side system for scheduling delivery of web content and locally managing the web content |
US5987457A (en) | 1997-11-25 | 1999-11-16 | Acceleration Software International Corporation | Query refinement method for searching documents |
US6473752B1 (en) | 1997-12-04 | 2002-10-29 | Micron Technology, Inc. | Method and system for locating documents based on previously accessed documents |
US6389436B1 (en) | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6145003A (en) | 1997-12-17 | 2000-11-07 | Microsoft Corporation | Method of web crawling utilizing address mapping |
US6151624A (en) | 1998-02-03 | 2000-11-21 | Realnames Corporation | Navigating network resources based on metadata |
KR100285265B1 (ko) | 1998-02-25 | 2001-04-02 | 윤덕용 | 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조 |
US6185558B1 (en) * | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US6125361A (en) * | 1998-04-10 | 2000-09-26 | International Business Machines Corporation | Feature diffusion across hyperlinks |
US6151595A (en) | 1998-04-17 | 2000-11-21 | Xerox Corporation | Methods for interactive visualization of spreading activation using time tubes and disk trees |
US6240407B1 (en) * | 1998-04-29 | 2001-05-29 | International Business Machines Corp. | Method and apparatus for creating an index in a database system |
US6098064A (en) | 1998-05-22 | 2000-08-01 | Xerox Corporation | Prefetching and caching documents according to probability ranked need S list |
US6285367B1 (en) | 1998-05-26 | 2001-09-04 | International Business Machines Corporation | Method and apparatus for displaying and navigating a graph |
US6182085B1 (en) * | 1998-05-28 | 2001-01-30 | International Business Machines Corporation | Collaborative team crawling:Large scale information gathering over the internet |
US6208988B1 (en) * | 1998-06-01 | 2001-03-27 | Bigchalk.Com, Inc. | Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes |
DE69916272D1 (de) * | 1998-06-08 | 2004-05-13 | Kcsl Inc | Methode und verfahren um relevante dokumente in einer datenbank zu finden |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6216123B1 (en) * | 1998-06-24 | 2001-04-10 | Novell, Inc. | Method and system for rapid retrieval in a full text indexing system |
US6638314B1 (en) | 1998-06-26 | 2003-10-28 | Microsoft Corporation | Method of web crawling utilizing crawl numbers |
EP1105819B1 (en) | 1998-08-26 | 2008-03-19 | Fractal Edge Limited | Methods and devices for mapping data files |
US6549897B1 (en) * | 1998-10-09 | 2003-04-15 | Microsoft Corporation | Method and system for calculating phrase-document importance |
US6385602B1 (en) * | 1998-11-03 | 2002-05-07 | E-Centives, Inc. | Presentation of search results using dynamic categorization |
US6360215B1 (en) * | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
US6574632B2 (en) * | 1998-11-18 | 2003-06-03 | Harris Corporation | Multiple engine information retrieval and visualization system |
US6628304B2 (en) | 1998-12-09 | 2003-09-30 | Cisco Technology, Inc. | Method and apparatus providing a graphical user interface for representing and navigating hierarchical networks |
US6167369A (en) | 1998-12-23 | 2000-12-26 | Xerox Company | Automatic language identification using both N-gram and word information |
US6922699B2 (en) * | 1999-01-26 | 2005-07-26 | Xerox Corporation | System and method for quantitatively representing data objects in vector space |
US6418433B1 (en) * | 1999-01-28 | 2002-07-09 | International Business Machines Corporation | System and method for focussed web crawling |
US6862710B1 (en) | 1999-03-23 | 2005-03-01 | Insightful Corporation | Internet navigation using soft hyperlinks |
US6510406B1 (en) | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6763496B1 (en) | 1999-03-31 | 2004-07-13 | Microsoft Corporation | Method for promoting contextual information to display pages containing hyperlinks |
US6304864B1 (en) | 1999-04-20 | 2001-10-16 | Textwise Llc | System for retrieving multimedia information from the internet using multiple evolving intelligent agents |
US6327590B1 (en) | 1999-05-05 | 2001-12-04 | Xerox Corporation | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis |
US7835943B2 (en) | 1999-05-28 | 2010-11-16 | Yahoo! Inc. | System and method for providing place and price protection in a search result list generated by a computer network search engine |
US6990628B1 (en) * | 1999-06-14 | 2006-01-24 | Yahoo! Inc. | Method and apparatus for measuring similarity among electronic documents |
US7072888B1 (en) * | 1999-06-16 | 2006-07-04 | Triogo, Inc. | Process for improving search engine efficiency using feedback |
US6973490B1 (en) | 1999-06-23 | 2005-12-06 | Savvis Communications Corp. | Method and system for object-level web performance and analysis |
US6547829B1 (en) * | 1999-06-30 | 2003-04-15 | Microsoft Corporation | Method and system for detecting duplicate documents in web crawls |
US7181438B1 (en) * | 1999-07-21 | 2007-02-20 | Alberti Anemometer, Llc | Database access system |
US6598047B1 (en) * | 1999-07-26 | 2003-07-22 | David W. Russell | Method and system for searching text |
US6442606B1 (en) | 1999-08-12 | 2002-08-27 | Inktomi Corporation | Method and apparatus for identifying spoof documents |
US6636853B1 (en) | 1999-08-30 | 2003-10-21 | Morphism, Llc | Method and apparatus for representing and navigating search results |
EP1226521A1 (en) | 1999-10-29 | 2002-07-31 | BRITISH TELECOMMUNICATIONS public limited company | Method and apparatus for processing queries |
US6351755B1 (en) * | 1999-11-02 | 2002-02-26 | Alta Vista Company | System and method for associating an extensible set of data with documents downloaded by a web crawler |
US6263364B1 (en) * | 1999-11-02 | 2001-07-17 | Alta Vista Company | Web crawler system using plurality of parallel priority level queues having distinct associated download priority levels for prioritizing document downloading and maintaining document freshness |
US6418452B1 (en) * | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service directory for efficient web crawling |
US6418453B1 (en) * | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service for efficient web crawling |
US6539376B1 (en) * | 1999-11-15 | 2003-03-25 | International Business Machines Corporation | System and method for the automatic mining of new relationships |
US7016540B1 (en) * | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
US6886129B1 (en) | 1999-11-24 | 2005-04-26 | International Business Machines Corporation | Method and system for trawling the World-wide Web to identify implicitly-defined communities of web pages |
US6546388B1 (en) * | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6883135B1 (en) * | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
US7240067B2 (en) | 2000-02-08 | 2007-07-03 | Sybase, Inc. | System and methodology for extraction and aggregation of data from dynamic content |
US6931397B1 (en) | 2000-02-11 | 2005-08-16 | International Business Machines Corporation | System and method for automatic generation of dynamic search abstracts contain metadata by crawler |
US6910029B1 (en) * | 2000-02-22 | 2005-06-21 | International Business Machines Corporation | System for weighted indexing of hierarchical documents |
JP2001265774A (ja) * | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム |
US6516312B1 (en) * | 2000-04-04 | 2003-02-04 | International Business Machine Corporation | System and method for dynamically associating keywords with domain-specific search engine queries |
US6633867B1 (en) | 2000-04-05 | 2003-10-14 | International Business Machines Corporation | System and method for providing a session query within the context of a dynamic search result set |
US6549896B1 (en) * | 2000-04-07 | 2003-04-15 | Nec Usa, Inc. | System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling |
US6718365B1 (en) * | 2000-04-13 | 2004-04-06 | International Business Machines Corporation | Method, system, and program for ordering search results using an importance weighting |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US6772160B2 (en) * | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
DE10029644B4 (de) | 2000-06-16 | 2008-02-07 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
JP3573688B2 (ja) | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US6601075B1 (en) * | 2000-07-27 | 2003-07-29 | International Business Machines Corporation | System and method of ranking and retrieving documents based on authority scores of schemas and documents |
US6633868B1 (en) | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
US7080073B1 (en) * | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
US6959326B1 (en) | 2000-08-24 | 2005-10-25 | International Business Machines Corporation | Method, system, and program for gathering indexable metadata on content at a data repository |
US20030217052A1 (en) | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
JP3472540B2 (ja) | 2000-09-11 | 2003-12-02 | 日本電信電話株式会社 | サーバ選択装置、サーバ選択方法、及びサーバ選択プログラムを記録した記録媒体 |
US6598051B1 (en) * | 2000-09-19 | 2003-07-22 | Altavista Company | Web page connectivity server |
US6560600B1 (en) * | 2000-10-25 | 2003-05-06 | Alta Vista Company | Method and apparatus for ranking Web page search results |
US7200606B2 (en) * | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6622140B1 (en) * | 2000-11-15 | 2003-09-16 | Justsystem Corporation | Method and apparatus for analyzing affect and emotion in text |
JP2002157271A (ja) * | 2000-11-20 | 2002-05-31 | Yozan Inc | ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法 |
US6785688B2 (en) | 2000-11-21 | 2004-08-31 | America Online, Inc. | Internet streaming media workflow architecture |
US8402068B2 (en) | 2000-12-07 | 2013-03-19 | Half.Com, Inc. | System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network |
US20020078045A1 (en) * | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
US6778997B2 (en) | 2001-01-05 | 2004-08-17 | International Business Machines Corporation | XML: finding authoritative pages for mining communities based on page structure criteria |
US7356530B2 (en) | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US6766316B2 (en) * | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US20020103798A1 (en) | 2001-02-01 | 2002-08-01 | Abrol Mani S. | Adaptive document ranking method based on user behavior |
US20020107886A1 (en) | 2001-02-07 | 2002-08-08 | Gentner Donald R. | Method and apparatus for automatic document electronic versioning system |
WO2002063493A1 (en) * | 2001-02-08 | 2002-08-15 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US20040003028A1 (en) * | 2002-05-08 | 2004-01-01 | David Emmett | Automatic display of web content to smaller display devices: improved summarization and navigation |
US7269545B2 (en) | 2001-03-30 | 2007-09-11 | Nec Laboratories America, Inc. | Method for retrieving answers from an information retrieval system |
US20020169770A1 (en) | 2001-04-27 | 2002-11-14 | Kim Brian Seong-Gon | Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents |
US7188106B2 (en) * | 2001-05-01 | 2007-03-06 | International Business Machines Corporation | System and method for aggregating ranking results from various sources to improve the results of web searching |
US6738764B2 (en) * | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
CA2445925C (en) * | 2001-05-10 | 2010-01-05 | Changingworlds Limited | Intelligent internet website with hierarchical menu |
US7519529B1 (en) * | 2001-06-29 | 2009-04-14 | Microsoft Corporation | System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service |
US7039234B2 (en) * | 2001-07-19 | 2006-05-02 | Microsoft Corporation | Electronic ink as a software object |
US6928425B2 (en) * | 2001-08-13 | 2005-08-09 | Xerox Corporation | System for propagating enrichment between documents |
JP3895955B2 (ja) * | 2001-08-24 | 2007-03-22 | 株式会社東芝 | 情報検索方法および情報検索システム |
US7076483B2 (en) * | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US6766422B2 (en) * | 2001-09-27 | 2004-07-20 | Siemens Information And Communication Networks, Inc. | Method and system for web caching based on predictive usage |
US6944609B2 (en) | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
US7428695B2 (en) | 2001-10-22 | 2008-09-23 | Hewlett-Packard Development Company, L.P. | System for automatic generation of arbitrarily indexed hyperlinked text |
US6763362B2 (en) * | 2001-11-30 | 2004-07-13 | Micron Technology, Inc. | Method and system for updating a search engine |
JP3871201B2 (ja) | 2002-01-29 | 2007-01-24 | ソニー株式会社 | コンテンツ提供取得システム |
US6829606B2 (en) | 2002-02-14 | 2004-12-07 | Infoglide Software Corporation | Similarity search engine for use with relational databases |
JP4021681B2 (ja) | 2002-02-22 | 2007-12-12 | 日本電信電話株式会社 | ページレイティング/フィルタリング方法および装置とページレイティング/フィルタリングプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体 |
US6934714B2 (en) | 2002-03-04 | 2005-08-23 | Intelesis Engineering, Inc. | Method and system for identification and maintenance of families of data records |
US7693830B2 (en) * | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
US20040006559A1 (en) * | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
EP1552501A4 (en) | 2002-06-12 | 2009-07-01 | Jena Jordahl | TOOLS FOR STORAGE, EXTRACTION, HANDLING AND VISUALIZATION OF DATA, PROVIDING MULTIPLE VIEWPOINTS OF HIERARCHICAL PERCEIVES |
CA2395905A1 (en) * | 2002-07-26 | 2004-01-26 | Teraxion Inc. | Multi-grating tunable chromatic dispersion compensator |
US7152059B2 (en) | 2002-08-30 | 2006-12-19 | Emergency24, Inc. | System and method for predicting additional search results of a computerized database search user based on an initial search query |
US7013458B2 (en) * | 2002-09-09 | 2006-03-14 | Sun Microsystems, Inc. | Method and apparatus for associating metadata attributes with program elements |
US6886010B2 (en) * | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7231379B2 (en) * | 2002-11-19 | 2007-06-12 | Noema, Inc. | Navigation in a hierarchical structured transaction processing system |
US7386527B2 (en) * | 2002-12-06 | 2008-06-10 | Kofax, Inc. | Effective multi-class support vector machine classification |
US7020648B2 (en) * | 2002-12-14 | 2006-03-28 | International Business Machines Corporation | System and method for identifying and utilizing a secondary index to access a database using a management system without an internal catalogue of online metadata |
US20040148278A1 (en) * | 2003-01-22 | 2004-07-29 | Amir Milo | System and method for providing content warehouse |
US20040181515A1 (en) * | 2003-03-13 | 2004-09-16 | International Business Machines Corporation | Group administration of universal resource identifiers with members identified in search result |
US6947930B2 (en) | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
US7028029B2 (en) * | 2003-03-28 | 2006-04-11 | Google Inc. | Adaptive computation of ranking |
US7216123B2 (en) * | 2003-03-28 | 2007-05-08 | Board Of Trustees Of The Leland Stanford Junior University | Methods for ranking nodes in large directed graphs |
US7451130B2 (en) * | 2003-06-16 | 2008-11-11 | Google Inc. | System and method for providing preferred country biasing of search results |
US7451129B2 (en) | 2003-03-31 | 2008-11-11 | Google Inc. | System and method for providing preferred language ordering of search results |
US7051023B2 (en) * | 2003-04-04 | 2006-05-23 | Yahoo! Inc. | Systems and methods for generating concept units from search queries |
US7197497B2 (en) * | 2003-04-25 | 2007-03-27 | Overture Services, Inc. | Method and apparatus for machine learning a document relevance function |
US7308643B1 (en) | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
US20050060186A1 (en) * | 2003-08-28 | 2005-03-17 | Blowers Paul A. | Prioritized presentation of medical device events |
US7505964B2 (en) * | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7346839B2 (en) * | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7693827B2 (en) * | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US20050071328A1 (en) * | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
US7552109B2 (en) * | 2003-10-15 | 2009-06-23 | International Business Machines Corporation | System, method, and service for collaborative focused crawling of documents on a network |
US20050086192A1 (en) * | 2003-10-16 | 2005-04-21 | Hitach, Ltd. | Method and apparatus for improving the integration between a search engine and one or more file servers |
US7231399B1 (en) * | 2003-11-14 | 2007-06-12 | Google Inc. | Ranking documents based on large data sets |
US20060047649A1 (en) * | 2003-12-29 | 2006-03-02 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US20050160107A1 (en) * | 2003-12-29 | 2005-07-21 | Ping Liang | Advanced search, file system, and intelligent assistant agent |
US7483891B2 (en) * | 2004-01-09 | 2009-01-27 | Yahoo, Inc. | Content presentation and management system associating base content and relevant additional content |
US7392278B2 (en) | 2004-01-23 | 2008-06-24 | Microsoft Corporation | Building and using subwebs for focused search |
US7499913B2 (en) * | 2004-01-26 | 2009-03-03 | International Business Machines Corporation | Method for handling anchor text |
US7310632B2 (en) | 2004-02-12 | 2007-12-18 | Microsoft Corporation | Decision-theoretic web-crawling and predicting web-page change |
US7281002B2 (en) | 2004-03-01 | 2007-10-09 | International Business Machine Corporation | Organizing related search results |
US7584221B2 (en) | 2004-03-18 | 2009-09-01 | Microsoft Corporation | Field weighting in text searching |
US7343374B2 (en) | 2004-03-29 | 2008-03-11 | Yahoo! Inc. | Computation of page authority weights using personalized bookmarks |
US7693825B2 (en) | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US20050251499A1 (en) | 2004-05-04 | 2005-11-10 | Zezhen Huang | Method and system for searching documents using readers valuation |
US7257577B2 (en) | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
US7260573B1 (en) | 2004-05-17 | 2007-08-21 | Google Inc. | Personalizing anchor text scores in a search engine |
US20050283473A1 (en) | 2004-06-17 | 2005-12-22 | Armand Rousso | Apparatus, method and system of artificial intelligence for data searching applications |
US7428530B2 (en) | 2004-07-01 | 2008-09-23 | Microsoft Corporation | Dispersing search engine results by using page category information |
US7363296B1 (en) * | 2004-07-01 | 2008-04-22 | Microsoft Corporation | Generating a subindex with relevant attributes to improve querying |
US20060036598A1 (en) * | 2004-08-09 | 2006-02-16 | Jie Wu | Computerized method for ranking linked information items in distributed sources |
WO2006042142A2 (en) | 2004-10-07 | 2006-04-20 | Bernard Widrow | Cognitive memory and auto-associative neural network based pattern recognition and searching |
EP1839124A4 (en) * | 2005-01-18 | 2009-12-30 | Yahoo Inc | COMPARISON AND CLASSIFICATION OF SPONSORED SEARCH LISTS WITH WEB SEARCH TECHNOLOGY AND WEB CONTENT |
US7689615B2 (en) | 2005-02-25 | 2010-03-30 | Microsoft Corporation | Ranking results using multiple nested ranking |
US7574436B2 (en) | 2005-03-10 | 2009-08-11 | Yahoo! Inc. | Reranking and increasing the relevance of the results of Internet searches |
US20060206460A1 (en) | 2005-03-14 | 2006-09-14 | Sanjay Gadkari | Biasing search results |
US8185523B2 (en) * | 2005-03-18 | 2012-05-22 | Search Engine Technologies, Llc | Search engine that applies feedback from users to improve search results |
US20060282455A1 (en) | 2005-06-13 | 2006-12-14 | It Interactive Services Inc. | System and method for ranking web content |
US7627564B2 (en) | 2005-06-21 | 2009-12-01 | Microsoft Corporation | High scale adaptive search systems and methods |
US7599917B2 (en) * | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7716226B2 (en) * | 2005-09-27 | 2010-05-11 | Patentratings, Llc | Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects |
US20070150473A1 (en) * | 2005-12-22 | 2007-06-28 | Microsoft Corporation | Search By Document Type And Relevance |
US7685091B2 (en) | 2006-02-14 | 2010-03-23 | Accenture Global Services Gmbh | System and method for online information analysis |
-
2004
- 2004-09-30 US US10/955,462 patent/US7739277B2/en not_active Expired - Fee Related
-
2005
- 2005-06-09 EP EP05105048A patent/EP1643383B1/en not_active Not-in-force
- 2005-06-15 JP JP2005175173A patent/JP4763354B2/ja not_active Expired - Fee Related
- 2005-06-30 KR KR1020050058224A patent/KR101076894B1/ko not_active IP Right Cessation
- 2005-07-25 CN CN2005100882135A patent/CN1755678B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR101076894B1 (ko) | 2011-10-25 |
US20060074871A1 (en) | 2006-04-06 |
CN1755678A (zh) | 2006-04-05 |
CN1755678B (zh) | 2010-08-25 |
JP2006107433A (ja) | 2006-04-20 |
EP1643383B1 (en) | 2013-01-23 |
KR20060049708A (ko) | 2006-05-19 |
EP1643383A1 (en) | 2006-04-05 |
US7739277B2 (en) | 2010-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4763354B2 (ja) | 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 | |
US7827181B2 (en) | Click distance determination | |
US7792833B2 (en) | Ranking search results using language types | |
US7761448B2 (en) | System and method for ranking search results using click distance | |
US20060200460A1 (en) | System and method for ranking search results using file types | |
US7779001B2 (en) | Web page ranking with hierarchical considerations | |
KR101311050B1 (ko) | 문서 사용 통계치를 사용한 랭킹 함수 | |
JP6006267B2 (ja) | 索引キーを使用して検索を絞込むシステムおよび方法 | |
US8725732B1 (en) | Classifying text into hierarchical categories | |
EP1643388A1 (en) | System and method for incremental indexing of network documents using batch transfers | |
EP2329411A2 (en) | Document length as a static relevance feature for ranking search results | |
US20100169324A1 (en) | Ranking documents with social tags | |
JP2003186912A (ja) | Webページ検索の適合度計算方法とその装置、Webページ検索の検索結果表示方法とその装置、並びにそれらの方法の実行プログラムとそれらの方法の実行プログラムを記録した記録媒体 | |
JP4220483B2 (ja) | 情報収集システム、情報収集方法及びプログラム | |
Saoud et al. | Exploiting social annotations to generate resource descriptions in a distributed environment: Cooperative multi-agent simulation on query-based sampling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110609 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |