JP2016181306A - 索引キーを使用して検索を絞込むシステムおよび方法 - Google Patents
索引キーを使用して検索を絞込むシステムおよび方法 Download PDFInfo
- Publication number
- JP2016181306A JP2016181306A JP2016142393A JP2016142393A JP2016181306A JP 2016181306 A JP2016181306 A JP 2016181306A JP 2016142393 A JP2016142393 A JP 2016142393A JP 2016142393 A JP2016142393 A JP 2016142393A JP 2016181306 A JP2016181306 A JP 2016181306A
- Authority
- JP
- Japan
- Prior art keywords
- range
- index
- document
- search
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9032—Query formulation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
【課題】索引キーと文書の対応付けではなく索引キーと検索範囲を対応づけることで、無駄な検索を防ぎ、検索時間の短縮を図る。【解決手段】1組の索引キーは、索引検索システムに含まれており、検索の対象である文書の内容ではなく、検索の範囲に関連付けられている。これらの範囲関連の索引キー、または範囲キーによって、検索の範囲を選択することができ、検索が結果を得るためにふるいにかける必要がある文書の数が低減する。さらに、こうした複合検索範囲に基づいて検索の再ハッシュを無くすために複合検索範囲の索引が提供されるように、複合範囲が認識され、格納される。【選択図】図2
Description
ネットワークおよびファイルシステム間で内容を検索する場合、多くの形式で検索が提供されてきたが、通常は、検索エンジンを変形して提供されるものである。検索エンジンは、指定されたキーワードについて文書を検索し、キーワードが見つかった文書のリストを返すプログラムである。
一般に、検索エンジンは、スパイダを発送してできるだけ多くの文書を取得してくることによって動作する。このようにして取得した文書は、インデクサと呼ばれる別のプログラムによって読み取られ、各文書に含まれる単語に基づいて索引(index)が作成される。索引とは、一意のレコードをそれぞれ識別するキーまたはキーワードのリストである。索引によって、特定のレコードを見つけ、レコードを索引フィールドでより速くソートすることができるようになる。検索エンジンは、理想的にはクライアントまたはユーザによるクエリごとに意味のある結果のみが返されるように、その索引を作成するアルゴリズムを使用する。
こうしたクエリでは、一貫してキーワードまたは索引キーが使用される傾向にある。ユーザが検索クエリを長いテキスト文字列として入力しようと、ブール演算子の連結として入力しようと、検索エンジンは、キーワードに一致する文書に対応して入力されたキーワードについて、すべてのレコードを検査する。次いで、ブール演算子の制約を満たす、または長いテキスト文字列に対応するレコードのサブセットが戻される。これらのレコードの検査は、時間がかかり、費用がかかる操作となる可能性がある。さらに、クライアントは、特定のキーワードを含む文書の全レコード検索を望まない場合がある。
本発明の実施態様は、単にキーワードを提供するのではなく、検索の範囲を定義する範囲キーと呼ばれる索引キーのクラスを提供することによって上記の制限を解消するシステムおよび方法に関連する。範囲キーが検索クエリに入力されると、範囲キーは、検索される索引レコードの範囲を限定する。例えば、範囲キーは、検索結果を、.mpgファイルなど何らかのファイルタイプに限定することによって検索の範囲を限定することができる。別の範囲キーは、URL(ユニフォームリソースロケータ)に従って検索の範囲を限定することができ、したがってそのURL下の文書のみが検索される。さらに別の範囲キーは、検索の範囲を、ユーザのコンピュータまたは他のネットワーク接続されたコンピュータ上の特定のデータベースに限定することができる。したがって本発明は、ユーザが特定のクラスの索引キーを使用して検索の範囲を限定することができるようにすることによって検索の時間および費用を大幅に低減することにより、上記の問題を解決する。
本発明の別の態様によれば、複合範囲も認識され、格納される。この追加の索引パーティションは、基本的な範囲の組合せである範囲定義を含む。これらの複合範囲に対応する文書はすでに解決されており、これらの複合範囲を参照すると、より迅速な検索が可能となる。
次に、本明細書の一部を形成し、一例として本発明を実施する特定の実施形態例を示す添付の図面を参照して本発明について以下でより十分説明する。しかし、本発明は、異なる多くの形態で具体化することができ、本明細書に記載した実施形態に限定されるものと解釈されないものとする。むしろ、これらの実施形態は、この開示が完全で欠落がなく、本発明の範囲を当業者に十分伝えるように提供される。特に、本発明は、方法または装置として具体化することができる。したがって、本発明は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、またはソフトウェアおよびハードウェアの態様を組み合わせた実施形態の形態をとることができる。したがって、以下の詳細な説明を限定の意味で理解すべきではない。
動作環境例
図1を参照すると、本発明を実施する1つのシステム例は、コンピューティング装置100などのコンピューティング装置を含んでいる。コンピューティング装置100は、クライアント、サーバ、モバイル装置、または他の任意のコンピューティング装置として構成することができる。極めて基本的な構成では、コンピューティング装置100は一般に、少なくとも1つの処理ユニット102およびシステムメモリ104を含む。コンピューティング装置の正確な構成および種類に応じて、システムメモリ104は、揮発性(RAMなど)、不揮発性(ROM、フラッシュメモリなど)、またはこれら2つの何らかの組合せとすることができる。システムメモリ104は、一般にオペレーティングシステム105、1つまたは複数のアプリケーション106を含んでおり、またプログラムデータ107を含んでいてもよい。一実施形態において、アプリケーション106は、本発明の機能を実施する検索絞込みアプリケーション120を含む。この基本的な構成は、図1の点線108内の構成要素によって示している。
図1を参照すると、本発明を実施する1つのシステム例は、コンピューティング装置100などのコンピューティング装置を含んでいる。コンピューティング装置100は、クライアント、サーバ、モバイル装置、または他の任意のコンピューティング装置として構成することができる。極めて基本的な構成では、コンピューティング装置100は一般に、少なくとも1つの処理ユニット102およびシステムメモリ104を含む。コンピューティング装置の正確な構成および種類に応じて、システムメモリ104は、揮発性(RAMなど)、不揮発性(ROM、フラッシュメモリなど)、またはこれら2つの何らかの組合せとすることができる。システムメモリ104は、一般にオペレーティングシステム105、1つまたは複数のアプリケーション106を含んでおり、またプログラムデータ107を含んでいてもよい。一実施形態において、アプリケーション106は、本発明の機能を実施する検索絞込みアプリケーション120を含む。この基本的な構成は、図1の点線108内の構成要素によって示している。
コンピューティング装置100は、追加の特徴および機能を有していてもよい。例えば、コンピューティング装置100は、磁気ディスク、光ディスク、テープなどの追加のデータ記憶装置(取外式および/または固定式)を含むこともできる。こうした別の記憶装置を、図1に、取外式記憶装置109および固定式記憶装置110で示している。コンピュータ記憶媒体には、コンピュータ読取可能命令、データ構造、プログラムモジュール、他のデータなど、情報を記憶するための任意の方法または技術で実施される揮発性および不揮発性の取外式および固定式媒体などがある。システムメモリ104、取外式記憶装置109、および固定式記憶装置110は、すべてコンピュータ記憶装置媒体の例である。コンピュータ記憶媒体には、それだけには限定されないが、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CD−ROM、デジタル多用途ディスク(DVD)または他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、または所望の情報の格納に使用でき、コンピューティング装置100からアクセスできる他の任意の媒体などがある。こうした任意のコンピュータ記憶媒体は、装置100の一部とすることができる。コンピューティング装置100は、キーボード、マウス、ペン、音声入力装置、タッチ入力装置などの入力装置112を有することもできる。ディスプレイ、スピーカ、プリンタなどの出力装置114を含むこともできる。
コンピューティング装置100は、装置が例えばネットワークを介して他のコンピューティング装置118と通信できるようにする通信接続116も含む。通信接続116は、通信媒体の一例である。通信媒体は一般に、コンピュータ読取可能命令、データ構造、プログラムモジュール、または他のデータによって搬送波または他の移送機構などの変調されたデータ信号に組み込まれる。これには任意の情報配送媒体がある。「変調されたデータ信号」という用語は、信号に情報を符号化するように1つまたは複数のその特性が設定または変更された信号を意味する。通信媒体には、それだけには限定されないが一例として、有線ネットワーク、直接配線された接続などの有線媒体、および音響、RF、赤外線、その他の無線媒体などの無線媒体がある。コンピュータ読取可能な媒体という用語は、本明細書で使用する場合、記憶媒体および通信媒体の両方を含む。
検索を絞込むための実施形態例
次の説明および特許請求の範囲を通じて、「文書」という用語は、ネットワーク文書、ファイル、フォルダ、Webページ、および他のリソースなど、ネットワークの検索クエリまたはクロールの結果として返される任意の考え得るリソースを指す。「索引キー」という用語は、索引の検索クエリまたは作成で1組の文書を標的にするために使用される検索に関連付けられている任意のキーワードまたはキーを指す。「範囲キー」という用語は、検索が開始される前に検索される文書の数が低減されるように、検索の範囲を絞るために使用することができる任意の索引キーを指す。検索の範囲は、ファイルタイプなどの属性、何らかのデータベースまたはURLなどの場所に従って、または検索される文書の数を低減する他の基準によって絞ることができる。
次の説明および特許請求の範囲を通じて、「文書」という用語は、ネットワーク文書、ファイル、フォルダ、Webページ、および他のリソースなど、ネットワークの検索クエリまたはクロールの結果として返される任意の考え得るリソースを指す。「索引キー」という用語は、索引の検索クエリまたは作成で1組の文書を標的にするために使用される検索に関連付けられている任意のキーワードまたはキーを指す。「範囲キー」という用語は、検索が開始される前に検索される文書の数が低減されるように、検索の範囲を絞るために使用することができる任意の索引キーを指す。検索の範囲は、ファイルタイプなどの属性、何らかのデータベースまたはURLなどの場所に従って、または検索される文書の数を低減する他の基準によって絞ることができる。
本発明の実施形態は、索引内の各項目の範囲を範囲キーで表し、適切な範囲キーを別の制限としてクエリに追加することによって絞込まれた(scoped)すべてのクエリのクエリ効率を上げることに関連する。この方法は、文書のプロパティ(URLまたは他のメタデータなど)に基づいてユーザキーワードに一致する文書ごとに範囲条件を再計算する方法とは対照的に提供される。ほとんどの範囲は、すべてクロールされた1組の項目の細い1片を表すため、絞込まれたクエリの効率は、その1片の細さより少ないが、それに関連する倍数だけ向上する。一例において、ポータル(すなわち検索を含む多数のサービスを提供するWebサイト)の管理者は、ポータルのユーザが機能上の仕様に特に興味があると決定することができる。したがって、他の文書内のこうした無用の単語をふるいにかけることなく、キーワードについてこれらの仕様を検索するだけの検索機構を提供することができるという点で有利となる。管理インターフェースを介して、管理者は、rule:profile=”spec”を有する範囲を定義することができる。またはこの範囲は、基本的な範囲としてすでに定義されていてもよい。管理者は、基本的な範囲を使用して、rule:profile="spec" AND filetype="Text" AND author!="John Doe"を有する複合範囲を定義することができる。この範囲にクライアントのユーザインターフェースのわかりやすい名前を提供し、この範囲がどのサイトから入手可能であるかを指定した後、範囲は、クライアントのドロップダウン範囲リストに表示される。この範囲選択は、そのプロパティ値を含む文書のみをクエリ結果として返す。このように管理者によって定義された範囲は、作成された範囲と呼ぶこともできる。
さらに、いくつかのデフォルトの範囲選択を使用することができる。一般のクライアントに、単に絞込まれていないクエリを示す「すべての内容」を検索する選択肢を示すことができる。「このサイト」の範囲選択は、現在のサイトおよびそのサブサイトのすべての文書を検索する。特定のサブセットに含まれる文書の範囲を指定するだけというよりむしろ、いくつかの結果を除外する範囲を生成することもできる。例えば、範囲定義は、テキスト(.txt)文書を除くすべての文書タイプについての検索に対応することができる
。特定のWebサイトURLに関連付けられているものを除いて、ネットワークにおけるすべての文書の検索に対応することができる別の範囲定義を考えることもできる。範囲選択の数は、デフォルトであろうと、作成されたものであろうと、その他の場合であろうと、本明細書に記載したものに限定されない。
。特定のWebサイトURLに関連付けられているものを除いて、ネットワークにおけるすべての文書の検索に対応することができる別の範囲定義を考えることもできる。範囲選択の数は、デフォルトであろうと、作成されたものであろうと、その他の場合であろうと、本明細書に記載したものに限定されない。
別の実施形態においては、クライアントに、検索要求に直接範囲キーを入力する選択肢が与えられる場合もある。クライアントによって使いやすい名前が範囲キーに与えられ、検索要求にその名前を入力すると、関連する範囲によって検索が限定される。
図2は、本発明による索引キーを使用して検索を絞込む(scoping)システム例の機能ブロック図を示している。システム200は、索引210、パイプライン220、文書インターフェース230、クライアントインターフェース240、範囲プラグイン250、索引作成プラグイン260、範囲の記述270、および管理インターフェース280を含む。
索引210は、内容キー(すなわちキーワード)および範囲キーの別々の索引を含むように構成される。索引210の構成のより詳細な説明については、図3の説明で後述する。これらの索引のレコードは、クライアントのクエリに結果を提供するのに使用される。一実施形態において、索引210は、索引レコードの記憶域をまとめて提供する複数のデータベースに対応する。
パイプライン220は、索引作成のために文書または文書のレコードを取得する収集機構の表現例である。パイプライン220は、データに対応するレコードが索引210に入力される前に様々なプラグイン(範囲プラグイン250など)によるデータのフィルタリングを可能にする。
文書インターフェース230は、複数のデータベースおよびネットワーク場所を介して文書を取り出すためのプロトコル、ネットワークアクセスポイント、およびデータベースアクセスポイントを提供する。例えば、文書インターフェース230は、インターネットへのアクセスを提供するとともに、ローカルサーバのデータベースへのアクセスおよび現在のコンピューティング装置上のデータベースへのアクセスを提供することができる。他の実施形態は、本発明の意図または範囲から逸脱することなく、様々なプロトコルを使用して他の文書位置にアクセスすることができる。
クライアントインターフェース240は、検索を定義し、開始するためのクライアントによるアクセスを提供する。検索は、キーワードおよび/または範囲キーに従って定義することができる。検索クエリを処理する方法例については、以下、図7を参照して詳しく説明する。
範囲プラグイン250は、いくつかの収集パイプラインプラグインのうちの1つである。範囲プラグイン250は、範囲キー(すなわち範囲索引内で索引付けされる項目)として再度発行されるプロパティ値を識別する。範囲(例えばファイルタイプ、URLなど)に対して興味のあるプロパティとして識別されたプロパティは、文書インターフェース230を介して提供された文書がクロールされる間に範囲プラグイン250によって集められる。これらのプロパティは、範囲プラグイン250によってパイプライン220に再度発行されて、索引210に含まれる。これらのプロパティは、これらのプロパティに従ってクライアントに範囲選択を提供する管理者または他の操作者(entity)によっても使用可能である。
索引作成プラグイン260は、パイプライン220に接続された別のプラグインである
。索引作成プラグインは、索引210を生成し、パーティションし、更新する機構を提供する。索引210を生成する方法例については、以下の図5の説明でより詳しく説明する。索引210を更新する方法例については、以下の図6の説明でより詳しく説明する。一実施形態において、索引作成プラグイン260は、キーワードを一時的にキャッシュし、これらの結果が索引210にフラッシュされる前にクロールされた文書から生成されたキーを絞込む単語リストを提供する。索引210のレコードは、これらの単語リストに含まれるクロール結果からのデータで埋められる。
。索引作成プラグインは、索引210を生成し、パーティションし、更新する機構を提供する。索引210を生成する方法例については、以下の図5の説明でより詳しく説明する。索引210を更新する方法例については、以下の図6の説明でより詳しく説明する。一実施形態において、索引作成プラグイン260は、キーワードを一時的にキャッシュし、これらの結果が索引210にフラッシュされる前にクロールされた文書から生成されたキーを絞込む単語リストを提供する。索引210のレコードは、これらの単語リストに含まれるクロール結果からのデータで埋められる。
範囲の記述270は、範囲についての情報を格納するテーブルを提供する。例えば、範囲の記述270は、範囲、範囲のルール、可視性、および範囲関連のプロパティ、および検索クエリで使用するために生成された範囲選択に対応する他の属性など、管理情報および内部情報を含み得る。範囲の記述270は、範囲プラグイン250を介して範囲選択を生成するプロパティを受信する。範囲の記述270は、索引210内の範囲索引の生成および構成のために、索引作成プラグイン260によってもアクセスされる。索引210も、複合範囲別索引の生成および更新のために、範囲の記述270にアクセスする(以下の図3および図4を参照)。また、範囲の記述270は、クライアントが検索クエリに含めるための範囲、または検索に適用するための範囲選択を選択できるように、クライアントインターフェース240でもアクセスされる。
管理インターフェース280も、管理者または他の制御機構(例えば自動プログラム)が、範囲プラグイン250によって提供されたプロパティを取得し、検索クエリを使用するための範囲選択を作成することができるように、範囲の記述270にアクセスする。管理インターフェース280は、(例えばインターネットログインアクセスを介して)範囲選択の作成、および範囲の記述の操作を可能にする任意のフォーマットに従って提供され得る。
機能ブロック間の一方向および双方向の通信のシステム200を示しているが、こうした通信タイプの任意のものを、本発明の意図および範囲から逸脱することなく、別のタイプに変更することができる(例えばすべての通信は、一方向通信ではなく双方向を必要とする受信通知メッセージを有し得る)。
図3は、本発明による索引の構造例の機能ブロック図を示している。索引300は、内容別索引(contentindex)(.ci)310、基本的範囲別索引(basic scopes index)(.bsi)320、および複合範囲別索引(compoundscopes index)(.csi)330を含む。
内容別索引310は、検索クエリで使用されるキーワードおよび他の索引キーに対応する文書を列挙する逆引き索引(invertedindex)で構成されるレコードを含む。しかし、範囲キーは、基本的範囲別索引320に流用される。
基本的範囲別索引320は、基本的な範囲に対応する文書のレコードを含む。基本的な範囲は、一般に、文書の単一の範囲関連プロパティに対応する範囲選択を指す。例えば、サイトhttp:/lwww.example.comでクロールされた文書の数字IDは、プロパティ(サイト)および値(「example.com」)を包含するように範囲プラグイン250によって構成された範囲キーの文書リストに記録される。
複合範囲別索引330は、基本的範囲別索引320の基本的な範囲の組合せから生成された範囲を含む。例えば、1つの複合範囲は、特定のURLにも関連する特定のファイルタイプの文書のレコードを含むことができる。
図4は、本発明による複合範囲を管理するためのブロック図例を示している。ブロック図400は、基本的範囲別索引410、元の複合範囲別索引420、および新しい複合範囲別索引430を含む。
基本的範囲別索引が追加の基本的な範囲で更新されると(以下の図6参照)、複合範囲別索引も更新されなければならない。元の複合範囲別索引420の位置線422は、新しい複合範囲が含まれるべき位置を示している。元の複合範囲別索引420のコピーが作成されて、新しい複合範囲別索引430が生成される。元の複合範囲別索引420のコピーは、新しい複合範囲が含まれるべき位置に到達するまで作成される。次いで新しい複合範囲432は、新しい複合範囲別索引430に書き込まれる。新しい複合範囲432が含まれた後、引き続き元の複合範囲別索引420のコピーが続行する。新しい複合範囲432に続く複合範囲434は、新しい複合範囲432の包含を補うオフセットだけ相殺して元の複合範囲別索引420からコピーされる。
図5は、本発明による索引を生成するプロセス例の論理フローチャートを示している。プロセス500は、ブロック502で開始し、アクセスが文書のコーパスに提供される。処理はブロック504に進む。
ブロック504で、文書のコーパスがクロールされて、存在する文書、およびこうした文書に関連付けられているプロパティ(ファイルタイプなど)を決定する。次いで文書ごとの識別子またはID、およびその関連のプロパティがクロールの結果として転送される。処理はブロック506に進む。
ブロック506で、範囲に関連する文書に関連付けられているプロパティが範囲プラグインによって取得される。範囲プラグインは、プロパティから範囲定義を作成する。範囲定義は、クライアントがその範囲に従って検索を限定することができる範囲選択を作成するために管理者が使用することができる。処理はブロック508に進む。
ブロック508で、取得されたプロパティから作成された範囲定義は、クロールの結果の間に範囲キーとして発行される。これらの範囲キーは、文書の内容よりむしろ検索の範囲を対象としながら、クロールから生成されたキーワードおよび他の索引キーと同じように動作する。範囲キーの生成のために取得されたプロパティの一部は、文書タイプ、文書のURL、文書の作成者、および他のプロパティを含む。範囲キーは、範囲キーのタイプの識別子(ID)、および特定の範囲キーを識別するテキスト文字列を含むように生成される。例えば、範囲キー関連のURLのIDが237である場合、http://www.example.com内の文書に対応する範囲キーは「[237]http://www.example.com」となる。この範囲キーは、パイプライン内に発行され、実質的に索引内の文書に関連付けられる。範囲キーが発行されると、処理はブロック510に進む。
ブロック510で、範囲キー、キーワード、およびすべての文書内で見つけられた他の蓄積されたプロパティが索引に送込まれる(flushed)。この送込みによって、キーおよびプロパティがディスクに書き込まれる。送込みの間、範囲キーは、分けられ、基本的範囲別索引に送信され、残りのデータは内容別索引に送信される。処理はブロック512に進む。
ブロック512で、複合範囲別索引が索引内に生成される。一実施形態において、索引について開始されたコンパイルプロセスに応答して複合範囲別索引が生成される。複合範囲別索引の生成に使用される1つのプロセス例については、以下の図6の説明で説明する。一実施形態において、複合範囲は、クライアントからのクエリによって定義される。別の実施形態において、索引がインスタンス化される前に管理者によって複合範囲のリストが生成される。複合範囲別索引が生成されると、処理はブロック514に進み、プロセス500が終了する。
一実施形態においては、クロールが開始されると基本的範囲別索引はデータで埋められるが、複合範囲別索引は、クロールが完了し、基本的範囲別索引が完全に構築されるまで埋められない。複合範囲別索引の構築を待つことで、基本的範囲別索引へのクエリを低減することによってオーバーヘッドが低減する。
図6は、本発明による索引をコンパイルするプロセス例の論理フローチャートを示している。プロセス600は、ブロック602で開始し、コンパイルプロセスが開始する。一実施形態において、プロセス600は、任意の既存の複合範囲を更新するために、ある時間間隔(例えば15分ごと)で非同期的に開始される。別の実施形態において、図5のプロセス500がブロック512に入ると、プロセス600が開始されて、新しく生成された基本的範囲別索引から複合範囲別索引が生成される。さらに別の実施形態において、プロセス600は、この索引への別の送込みに応答して開始される。プロセス600が開始すると、処理は決定ブロック604に進む。
決定ブロック604で、複合範囲別索引内の各範囲に対応する変更レコードは、現在の複合範囲が変わったことを示しているかどうかの決定が行われる。一実施形態において、初めて複合範囲別索引を生成するには、同様のプロセスを使用し、そのデフォルトの設定は、すべての範囲が変わったということを前提とする。したがって、新しい複合範囲別索引の生成、および複合範囲別索引の更新は、同じコンパイルプロセスによって処理される。複合範囲が変わると、処理はブロック606に進む。
ブロック606で、コンパイルプロセスは、ユーザクエリに類似のクエリを実行し、クエリプロセスが複合範囲別索引内の範囲に対応する文書のリストを更新することができるようにする。次いで文書のリストは、複合範囲別索引が(前のバージョンが存在するときは)その前のバージョンからコピーされると、複合範囲別索引に追加される。処理は決定ブロック610に進む。
あるいは、変更レコードが特定の範囲は変わっていないことを示す場合、処理はブロック608に進む。ブロック608で、範囲は変わっていないため、複合範囲別索引の前のバージョンの範囲に対応する文書IDのリストがそっくりそのままコピーされる。処理は決定ブロック610に進む。
決定ブロック610で、コンパイルプロセス中により多くの複合範囲を新しい複合範囲別索引にコピーする必要があるかどうかの決定が行われる。より多くの複合範囲をコピーすべき場合、処理は決定ブロック610に戻って、複合範囲が変わったかどうかの決定が行われる。しかし、より多くの複合範囲を新しい複合範囲別索引に転送する必要がない場合、処理はブロック612に進み、処理600が終了する。
文書のコーパスに対する更新は、いつでも行うことができる。文書のコーパスの文書IDは、メモリ内単語リスト、または複数の単語リストで連続的に更新される。単語リストを埋めることは、クライアントにより開始された検索、コーパスが再度クロールされるようにするリフレッシュ動作(action)、または文書のコーパス間での変更の発見をもたらす他の様々な操作のいずれかから生じる。文書が変更される(追加、削除、変更など)と、変更された文書の文書IDは、次いで、変更の種類とともにメモリ内単語リストに転送される。更新された文書IDを含む単語リストは、次いで索引に送込まれる。文書への変更によって、内容別索引への更新が行われるとともに、基本的範囲別索引も更新される。変更を発見した漸進的なクロールが完了し、基本的範囲別索引が更新されると、ネ
ットワーク上の文書への変更を反映するように複合範囲別索引も更新される。プロセス600は、更新が検索される文書のコーパス間での新しい文書であるか、コーパスからの文書の削除であるか、文書の範囲に影響を与える文書への変更であるかに関係なく、複合範囲別索引での更新を反映するために使用される。複雑なプロセスを非同期に稼働させることによって、ネットワーク上の文書への変更を反映するために複合範囲別索引が頻繁に更新される。
ットワーク上の文書への変更を反映するように複合範囲別索引も更新される。プロセス600は、更新が検索される文書のコーパス間での新しい文書であるか、コーパスからの文書の削除であるか、文書の範囲に影響を与える文書への変更であるかに関係なく、複合範囲別索引での更新を反映するために使用される。複雑なプロセスを非同期に稼働させることによって、ネットワーク上の文書への変更を反映するために複合範囲別索引が頻繁に更新される。
図7は、本発明によるクエリを処理するプロセス例の論理フローチャートを示している。プロセス700は、ブロック702で開始し、索引がインスタンス化され、クライアントからクエリを受け付ける用意ができている。処理は決定ブロック704に進む。
決定ブロック704で、検索クエリがクライアントによって開始されたかどうかの決定が行われる。クライアントは、クエリを開始するユーザ、または検索を要求しているプログラムに対応している。検索が開始されていない場合、検索クエリが開始されるのを待っている間、処理はブロック704に戻る。しかし、検索クエリが開始すると、処理は決定ブロック706に進む。
決定ブロック706で、範囲キーが検索要求に使用されたかどうかの決定が行われる。範囲キーが存在しない場合、処理はブロック716に進む。しかし、範囲キーが検索要求に存在する場合、処理は決定ブロック708に進む。
決定ブロック708で、範囲キーのインスタンスが複合範囲の一部であるかどうかの決定が行われる。範囲キーが複合範囲の一部として使用されていない場合、処理は決定ブロック712に進む。しかし、範囲キーが複合範囲の一部である場合、処理はブロック710に進む。
ブロック710で、検索クエリに含まれる複合範囲に対応するとして、その文書IDによって識別される文書について、複合範囲別索引(.csi)が調べられる。次いで、検索の完了まで、これらの文書に対応する文書IDが戻されて、検索結果に追加される。処理は決定ブロック712に進む。
決定ブロック712で、範囲キーのインスタンスが複合範囲の一部であるかどうかの決定が行われる。範囲キーが基本的な範囲に対応していない場合、処理はブロック716に進む。しかし、範囲キーが基本的な範囲に対応している場合、処理はブロック714に進む。
ブロック714で、検索クエリに含まれる範囲キーに対応するとして、その文書IDによって識別される文書について基本的範囲別索引(.bsi)が調べられる。次いで、検索の完了まで、これらの文書に対応する文書IDが戻されて、検索結果に追加される。処理は決定ブロック716に進む。
決定ブロック716で、文書の内容に関連するキーワードまたは他の索引キーが検索要求に含まれているかどうかの決定が行われる。キーワードが検索要求に含まれていない場合、処理は決定ブロック720に進む。しかし、キーワードが検索要求に含まれている場合、処理はブロック718に移動する。
ブロック708で、検索クエリに含まれるキーワードに対応するとして、その文書IDによって識別される文書について内容別索引(.ci)が調べられる。一実施形態において、内容別索引をキーワードについて検索するとき、検索は、基本的範囲別索引および/または複合範囲別索引に従って予め定義されている範囲に限定される。次いで、検索の完
成まで、これらの文書に対応する文書IDが戻されて、検索結果に追加される。処理は決定ブロック710に進む。
成まで、これらの文書に対応する文書IDが戻されて、検索結果に追加される。処理は決定ブロック710に進む。
ブロック720で、異なる索引パーティションで重複する文書の文書IDの集まりがクエリ結果として返される。例えば、文書IDは、基本的範囲別索引の範囲に対応し、特定のキーワードを含む可能性もある。検索結果がこの特定の範囲によって限定され、キーワードを含んでいる場合、文書IDは、索引パーティション間で重複することになる。これらの重複するIDは、検索の結果を表す。結果に含まれる各文書へのポインタは、次いで検索要求に応答してクライアントに提供することができる。一般に、文書が特定の範囲を有するかどうかを確認するために、文書プロパティを調べる代わりに、索引間の重複する文書を決定するのがかなり迅速である。一般に文書プロパティが無作為にデータベース内にある場合、索引は、キー(範囲キーまたはキーワード)に従ってディスク上にクラスタ化される。したがって本発明は、範囲を検索クエリに適用することができる速度が大幅に向上し、およびより容易となる。結果が提供されると、処理はブロック722に移動して、処理700は終了する。
一実施形態において、操作ブロック708〜718で提供されたプロセスステップは、順次的なものではない。代わりに、基本的範囲別索引、または複合範囲別索引、または内容別索引は、通常のキー、およびクエリの範囲キーに基づいて調べられ、それらが調べられる順序は、キーに対応する文書IDのソート順によって決まる。さらに、検索クエリには複数の範囲、つまり複合範囲および基本的な範囲がある場合があるため、操作ブロック708〜718で提供された処理ステップを複数回繰り返す必要がある場合がある。
別の実施形態において、新しい複合範囲が要求によって作成される場合、複合範囲別索引は、各検索要求の後に新しい複合範囲で更新される。複合範囲別索引は、上記の図4の説明で提供された方法に従って更新される。
さらに別の実施形態において、検索要求の絞込まれた部分は、クライアントによってなされた検索選択である。検索選択は、提供された範囲のリストに従って予め選択された結果の範囲に対応する。範囲のこのリストは、範囲定義に従って管理者によって生成することができる。
上記の仕様、例、およびデータにより、製造する際の完全な説明および本発明の構成の使用が提供されている。本発明の多くの実施形態は、本発明の意図および範囲から逸脱することなく作成することができるので、本発明は特許請求の範囲にある。
100 コンピューティング装置
102 処理ユニット
104 システムメモリ
105 オペレーティングシステム
106 アプリケーション
107 プログラムデータ
109 取外式記憶装置
110 固定式記憶装置
112 入力装置
114 出力装置
116 通信接続
118 他のコンピューティング装置
120 検索絞込み
102 処理ユニット
104 システムメモリ
105 オペレーティングシステム
106 アプリケーション
107 プログラムデータ
109 取外式記憶装置
110 固定式記憶装置
112 入力装置
114 出力装置
116 通信接続
118 他のコンピューティング装置
120 検索絞込み
Claims (14)
- クエリに基づいて、ネットワーク内に格納される複数の文書の検索を行うためのコンピュータにより実行される方法であって、
コンピュータが、前記文書に関連するプロパティを識別するステップと、
コンピュータが、前記識別されたプロパティに従って範囲関連索引キーを生成するステップと、
コンピュータが、前記文書の内容に従って内容関連検索キーを生成するステップと、
コンピュータが、索引を生成するステップであって、前記索引は、前記内容関連索引キーに対応する第1のパーティション、および前記範囲関連索引キーに対応する第2のパーティションを含む、ステップと、
を含むことを特徴とする方法。 - 前記索引は、別の検索範囲が前記範囲関連索引キーの組合せによって定義されるように、前記組合せに従って構成された追加の文書レコードを含む第3のパーティションをさらに含むことを特徴とする請求項1に記載の方法。
- 前記範囲関連索引キーの組合せは、ブールの組合せに対応することを特徴とする請求項2記載の方法。
- 前記索引は、別の検索範囲が前記範囲関連索引キーの組合せによって定義されるように、前記組合せに従って構成された追加の文書レコードを含むパーティションを含むことを特徴とする請求項1に記載の方法。
- 前記パーティションは、前記パーティションをコピーして新しいパーティションを作成するとともに、前記文書レコードを範囲関連索引キーの新しい組合せに対応する前記新しいパーティションに挿入することによって、前記新しい組合せが作成されたときに更新されることを特徴とする請求項4に記載の方法。
- 追加の文書が前記プロパティに関連付けられると追加の文書レコードが前記索引の前記範囲関連索引キーに関連付けられるように、クエリの対象となる前記文書間の変更によって前記索引への更新が行われ、前記変更は、前記文書間に挿入された新しい文書、削除される前記文書間の文書、および前記文書間の文書への変更のうちの少なくとも1つに対応することを特徴とする請求項1に記載の方法。
- クライアント生成クエリに範囲を提供するため、範囲選択がクライアントによって選択可能であるように、前記範囲関連索引キーに従って前記範囲選択を生成するステップをさらに備えたことを特徴とする請求項1に記載の方法。
- 前記文書の追加の検索範囲に関連付けられている追加のプロパティから追加の範囲関連索引キーを手動で生成し、処理するインターフェースを提供するステップをさらに備えたことを特徴とする請求項1に記載の方法。
- 文書のクエリのための検索範囲を設定するシステムであって、
前記文書の範囲に関連付けられている前記文書に関するプロパティを識別し、前記識別されたプロパティに従って範囲関連索引キーを生成し、前記文書の内容に従って内容関連検索キーを生成する手段と、
索引を生成する手段と、
を含み、
前記索引は、前記内容関連索引キーに対応する第1のパーティション、および前記範囲
関連索引キーに対応する第2のパーティションを含むことを特徴とするシステム。 - 前記索引は、別の検索範囲が前記範囲関連索引キーの組合せによって定義されるように、前記組合せに従って構成された追加の文書レコードを含む第3のパーティションをさらに含むことを特徴とする請求項9に記載のシステム。
- 前記索引は、追加の文書が範囲関連索引キーに関連付けられると追加の文書レコードが前記索引内の前記範囲関連索引キーに関連付けられるように、前記追加の文書がクエリの対象である前記文書間に挿入されると更新されるようにさらに構成されることを特徴とする請求項9に記載のシステム。
- 前記文書の追加の検索範囲に関連付けられている追加のプロパティから追加の範囲関連索引キーを手動で生成し処理するインターフェースをさらに備えたことを特徴とする請求項9に記載のシステム。
- コンピュータに請求項1〜8のいずれか1項に記載の方法を実行させるためのプログラム。
- コンピュータに請求項1〜8のいずれか1項に記載の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/951,123 US7606793B2 (en) | 2004-09-27 | 2004-09-27 | System and method for scoping searches using index keys |
US10/951,123 | 2004-09-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014157742A Division JP6006267B2 (ja) | 2004-09-27 | 2014-08-01 | 索引キーを使用して検索を絞込むシステムおよび方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016181306A true JP2016181306A (ja) | 2016-10-13 |
Family
ID=34940142
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005175174A Active JP5323300B2 (ja) | 2004-09-27 | 2005-06-15 | 索引キーを使用して検索を絞込むシステムおよび方法 |
JP2011266249A Pending JP2012069152A (ja) | 2004-09-27 | 2011-12-05 | 索引キーを使用して検索を絞込む方法および記録媒体 |
JP2014157742A Active JP6006267B2 (ja) | 2004-09-27 | 2014-08-01 | 索引キーを使用して検索を絞込むシステムおよび方法 |
JP2016142393A Pending JP2016181306A (ja) | 2004-09-27 | 2016-07-20 | 索引キーを使用して検索を絞込むシステムおよび方法 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005175174A Active JP5323300B2 (ja) | 2004-09-27 | 2005-06-15 | 索引キーを使用して検索を絞込むシステムおよび方法 |
JP2011266249A Pending JP2012069152A (ja) | 2004-09-27 | 2011-12-05 | 索引キーを使用して検索を絞込む方法および記録媒体 |
JP2014157742A Active JP6006267B2 (ja) | 2004-09-27 | 2014-08-01 | 索引キーを使用して検索を絞込むシステムおよび方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US7606793B2 (ja) |
EP (1) | EP1659505A1 (ja) |
JP (4) | JP5323300B2 (ja) |
KR (1) | KR100981857B1 (ja) |
CN (1) | CN1755677B (ja) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7606793B2 (en) | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US20070061298A1 (en) * | 2005-09-14 | 2007-03-15 | Wilson Jeff K | Method and apparatus for adding a search filter for web pages based on page type |
EP1862916A1 (en) * | 2006-06-01 | 2007-12-05 | Microsoft Corporation | Indexing Documents for Information Retrieval based on additional feedback fields |
US20080082578A1 (en) * | 2006-09-29 | 2008-04-03 | Andrew Hogue | Displaying search results on a one or two dimensional graph |
EP1909193A1 (en) * | 2006-10-03 | 2008-04-09 | INuron BVBA | Proximity based query scoping for information searches |
US7647353B2 (en) * | 2006-11-14 | 2010-01-12 | Google Inc. | Event searching |
US9098603B2 (en) * | 2007-06-10 | 2015-08-04 | Apple Inc. | Index partitioning and scope checking |
US20090083214A1 (en) * | 2007-09-21 | 2009-03-26 | Microsoft Corporation | Keyword search over heavy-tailed data and multi-keyword queries |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US8280886B2 (en) * | 2008-02-13 | 2012-10-02 | Fujitsu Limited | Determining candidate terms related to terms of a query |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
KR101667232B1 (ko) * | 2010-04-12 | 2016-10-19 | 삼성전자주식회사 | 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법 |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US10073927B2 (en) | 2010-11-16 | 2018-09-11 | Microsoft Technology Licensing, Llc | Registration for system level search user interface |
US10346479B2 (en) * | 2010-11-16 | 2019-07-09 | Microsoft Technology Licensing, Llc | Facilitating interaction with system level search user interface |
KR20140045930A (ko) | 2011-03-29 | 2014-04-17 | 썬 케미칼 비.브이. | 폴리우레탄을 포함하는2-코트 차단시스템 |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
CN102682068A (zh) * | 2012-03-01 | 2012-09-19 | 沈文策 | 一种搜索用户名的方法及系统 |
US9141908B1 (en) * | 2012-06-29 | 2015-09-22 | Emc Corporation | Dynamic information assembly for designated purpose based on suitability reasoning over metadata |
US9984110B2 (en) | 2014-08-21 | 2018-05-29 | Dropbox, Inc. | Multi-user search system with methodology for personalized search query autocomplete |
CN105374356B (zh) * | 2014-08-29 | 2019-07-30 | 株式会社理光 | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 |
US9384226B1 (en) | 2015-01-30 | 2016-07-05 | Dropbox, Inc. | Personal content item searching system and method |
US9183303B1 (en) | 2015-01-30 | 2015-11-10 | Dropbox, Inc. | Personal content item searching system and method |
US10229143B2 (en) * | 2015-06-23 | 2019-03-12 | Microsoft Technology Licensing, Llc | Storage and retrieval of data from a bit vector search index |
US11281639B2 (en) | 2015-06-23 | 2022-03-22 | Microsoft Technology Licensing, Llc | Match fix-up to remove matching documents |
US10242071B2 (en) | 2015-06-23 | 2019-03-26 | Microsoft Technology Licensing, Llc | Preliminary ranker for scoring matching documents |
US11392568B2 (en) | 2015-06-23 | 2022-07-19 | Microsoft Technology Licensing, Llc | Reducing matching documents for a search query |
US10274983B2 (en) | 2015-10-27 | 2019-04-30 | Yardi Systems, Inc. | Extended business name categorization apparatus and method |
US10275708B2 (en) | 2015-10-27 | 2019-04-30 | Yardi Systems, Inc. | Criteria enhancement technique for business name categorization |
US10268965B2 (en) | 2015-10-27 | 2019-04-23 | Yardi Systems, Inc. | Dictionary enhancement technique for business name categorization |
US10275841B2 (en) | 2015-10-27 | 2019-04-30 | Yardi Systems, Inc. | Apparatus and method for efficient business name categorization |
CN108090064B (zh) * | 2016-11-21 | 2021-10-08 | 腾讯科技(深圳)有限公司 | 一种数据查询方法、装置、数据存储服务器及系统 |
RU2655121C1 (ru) * | 2017-01-25 | 2018-05-23 | Федеральное государственное бюджетное образовательное учреждение высшего образования "Южно-Уральский государственный медицинский университет" Министерства здравоохранения Российской Федерации (ФГБОУ ВО ЮУГМУ Минздрава России) | Способ оценки воспалительного процесса в тканях пародонта |
CN107391535B (zh) * | 2017-04-20 | 2021-01-12 | 创新先进技术有限公司 | 在文档应用中搜索文档的方法及装置 |
CN107122466A (zh) * | 2017-04-28 | 2017-09-01 | 福建中金在线信息科技有限公司 | 一种网络文章查询方法及系统 |
WO2019093837A1 (ko) * | 2017-11-10 | 2019-05-16 | 양병철 | 검색결과 프로세스 통합 올인원 검색 서비스 제공 방법 |
CN108062368B (zh) * | 2017-12-08 | 2021-05-07 | 北京百度网讯科技有限公司 | 全量数据翻译方法、装置、服务器及存储介质 |
WO2020080931A1 (en) * | 2018-10-15 | 2020-04-23 | Mimos Berhad | Management of data for content based data locality search |
CN109522389B (zh) * | 2018-11-07 | 2020-09-01 | 中国联合网络通信集团有限公司 | 文档推送方法、装置和存储介质 |
CN115168690B (zh) * | 2022-09-06 | 2022-12-27 | 深圳市明源云科技有限公司 | 基于浏览器插件的资料查询方法、装置、电子设备及介质 |
US11860914B1 (en) * | 2023-02-27 | 2024-01-02 | Casetext, Inc. | Natural language database generation and query system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024015A (ja) * | 2000-07-11 | 2002-01-25 | Misawa Van Corp | クライアントサーバシステム構築方法 |
WO2003009180A2 (en) * | 2001-07-19 | 2003-01-30 | Computer Associates Think, Inc | Method and system for reorganizing a tablespace in a database |
JP2004192657A (ja) * | 2004-02-09 | 2004-07-08 | Nec Corp | 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体 |
Family Cites Families (374)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4819156A (en) | 1986-06-13 | 1989-04-04 | International Business Machines Corporation | Database index journaling for enhanced recovery |
US5226161A (en) | 1987-08-21 | 1993-07-06 | Wang Laboratories, Inc. | Integration of data between typed data structures by mutual direct invocation between data managers corresponding to data types |
US5369778A (en) | 1987-08-21 | 1994-11-29 | Wang Laboratories, Inc. | Data processor that customizes program behavior by using a resource retrieval capability |
US5222236A (en) | 1988-04-29 | 1993-06-22 | Overdrive Systems, Inc. | Multiple integrated document assembly data processing system |
US5321833A (en) | 1990-08-29 | 1994-06-14 | Gte Laboratories Incorporated | Adaptive ranking system for information retrieval |
US5257577A (en) | 1991-04-01 | 1993-11-02 | Clark Melvin D | Apparatus for assist in recycling of refuse |
WO1994012944A1 (en) | 1992-11-23 | 1994-06-09 | Paragon Concepts, Inc. | Computer filing system with user selected categories to provide file access |
US6202058B1 (en) | 1994-04-25 | 2001-03-13 | Apple Computer, Inc. | System for ranking the relevance of information objects accessed by computer users |
US6038310A (en) * | 1994-08-01 | 2000-03-14 | British Telecommunications Public Limited Company | Service node for a telephony network |
US5606609A (en) | 1994-09-19 | 1997-02-25 | Scientific-Atlanta | Electronic document verification system and method |
US5594660A (en) | 1994-09-30 | 1997-01-14 | Cirrus Logic, Inc. | Programmable audio-video synchronization method and apparatus for multimedia systems |
US5642502A (en) | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
US5729730A (en) | 1995-03-28 | 1998-03-17 | Dex Information Systems, Inc. | Method and apparatus for improved information storage and retrieval system |
US5826269A (en) | 1995-06-21 | 1998-10-20 | Microsoft Corporation | Electronic mail interface for a network server |
US5933851A (en) | 1995-09-29 | 1999-08-03 | Sony Corporation | Time-stamp and hash-based file modification monitor with multi-user notification and method thereof |
US5974455A (en) | 1995-12-13 | 1999-10-26 | Digital Equipment Corporation | System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table |
JPH09204442A (ja) * | 1996-01-24 | 1997-08-05 | Dainippon Screen Mfg Co Ltd | ドキュメントデータ検索システム |
US5855020A (en) | 1996-02-21 | 1998-12-29 | Infoseek Corporation | Web scan process |
US6314420B1 (en) | 1996-04-04 | 2001-11-06 | Lycos, Inc. | Collaborative/adaptive search engine |
JP3113814B2 (ja) | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
US5905866A (en) | 1996-04-30 | 1999-05-18 | A.I. Soft Corporation | Data-update monitoring in communications network |
US5828999A (en) | 1996-05-06 | 1998-10-27 | Apple Computer, Inc. | Method and system for deriving a large-span semantic language model for large-vocabulary recognition systems |
JP3653333B2 (ja) * | 1996-05-13 | 2005-05-25 | 株式会社日立製作所 | データベース管理方法およびシステム |
US5920859A (en) | 1997-02-05 | 1999-07-06 | Idd Enterprises, L.P. | Hypertext document retrieval system and method |
US6038610A (en) | 1996-07-17 | 2000-03-14 | Microsoft Corporation | Storage of sitemaps at server sites for holding information regarding content |
EP0822502A1 (en) | 1996-07-31 | 1998-02-04 | BRITISH TELECOMMUNICATIONS public limited company | Data access system |
US5745890A (en) | 1996-08-09 | 1998-04-28 | Digital Equipment Corporation | Sequential searching of a database index using constraints on word-location pairs |
US5765150A (en) | 1996-08-09 | 1998-06-09 | Digital Equipment Corporation | Method for statistically projecting the ranking of information |
US5920854A (en) | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
JP4025379B2 (ja) | 1996-09-17 | 2007-12-19 | 株式会社ニューズウオッチ | 検索システム |
US5870739A (en) | 1996-09-20 | 1999-02-09 | Novell, Inc. | Hybrid query apparatus and method |
US5870740A (en) | 1996-09-30 | 1999-02-09 | Apple Computer, Inc. | System and method for improving the ranking of information retrieval results for short queries |
US5893116A (en) | 1996-09-30 | 1999-04-06 | Novell, Inc. | Accessing network resources using network resource replicator and captured login script for use when the computer is disconnected from the network |
US6222559B1 (en) | 1996-10-02 | 2001-04-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for display of hierarchical structures |
GB2331166B (en) | 1997-11-06 | 2002-09-11 | Ibm | Database search engine |
US5966126A (en) | 1996-12-23 | 1999-10-12 | Szabo; Andrew J. | Graphic user interface for database system |
US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database |
US6415319B1 (en) | 1997-02-07 | 2002-07-02 | Sun Microsystems, Inc. | Intelligent network browser using incremental conceptual indexer |
US5960383A (en) | 1997-02-25 | 1999-09-28 | Digital Equipment Corporation | Extraction of key sections from texts using automatic indexing techniques |
JPH10240757A (ja) | 1997-02-27 | 1998-09-11 | Hitachi Ltd | 協調分散検索システム |
US5890147A (en) | 1997-03-07 | 1999-03-30 | Microsoft Corporation | Scope testing of documents in a search engine using document to folder mapping |
US5848404A (en) | 1997-03-24 | 1998-12-08 | International Business Machines Corporation | Fast query search in large dimension database |
US6272507B1 (en) | 1997-04-09 | 2001-08-07 | Xerox Corporation | System for ranking search results from a collection of documents using spreading activation techniques |
US6256675B1 (en) | 1997-05-06 | 2001-07-03 | At&T Corp. | System and method for allocating requests for objects and managing replicas of objects on a network |
AUPO710597A0 (en) | 1997-06-02 | 1997-06-26 | Knowledge Horizons Pty. Ltd. | Methods and systems for knowledge management |
US6029164A (en) | 1997-06-16 | 2000-02-22 | Digital Equipment Corporation | Method and apparatus for organizing and accessing electronic mail messages using labels and full text and label indexing |
US6012053A (en) | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
JPH1125119A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | ハイパーテキスト閲覧システム |
JPH1125104A (ja) | 1997-06-30 | 1999-01-29 | Canon Inc | 情報処理装置および方法 |
US5933822A (en) | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision |
JPH1145243A (ja) | 1997-07-25 | 1999-02-16 | Just Syst Corp | 索引作成支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US5983216A (en) | 1997-09-12 | 1999-11-09 | Infoseek Corporation | Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections |
US6182113B1 (en) | 1997-09-16 | 2001-01-30 | International Business Machines Corporation | Dynamic multiplexing of hyperlinks and bookmarks |
US5956722A (en) | 1997-09-23 | 1999-09-21 | At&T Corp. | Method for effective indexing of partially dynamic documents |
US6999959B1 (en) | 1997-10-10 | 2006-02-14 | Nec Laboratories America, Inc. | Meta search engine |
US6026398A (en) | 1997-10-16 | 2000-02-15 | Imarket, Incorporated | System and methods for searching and matching databases |
US6070191A (en) | 1997-10-17 | 2000-05-30 | Lucent Technologies Inc. | Data distribution techniques for load-balanced fault-tolerant web access |
US6351467B1 (en) | 1997-10-27 | 2002-02-26 | Hughes Electronics Corporation | System and method for multicasting multimedia content |
US6594682B2 (en) | 1997-10-28 | 2003-07-15 | Microsoft Corporation | Client-side system for scheduling delivery of web content and locally managing the web content |
US6128701A (en) | 1997-10-28 | 2000-10-03 | Cache Flow, Inc. | Adaptive and predictive cache refresh policy |
US5991756A (en) | 1997-11-03 | 1999-11-23 | Yahoo, Inc. | Information retrieval from hierarchical compound documents |
KR19990044893A (ko) * | 1997-11-19 | 1999-06-25 | 포만 제프리 엘 | 데이터 처리 동작을 특정하는 방법 및 장치 |
US5943670A (en) | 1997-11-21 | 1999-08-24 | International Business Machines Corporation | System and method for categorizing objects in combined categories |
US5987457A (en) | 1997-11-25 | 1999-11-16 | Acceleration Software International Corporation | Query refinement method for searching documents |
US6473752B1 (en) | 1997-12-04 | 2002-10-29 | Micron Technology, Inc. | Method and system for locating documents based on previously accessed documents |
US6389436B1 (en) | 1997-12-15 | 2002-05-14 | International Business Machines Corporation | Enhanced hypertext categorization using hyperlinks |
US6145003A (en) | 1997-12-17 | 2000-11-07 | Microsoft Corporation | Method of web crawling utilizing address mapping |
US7010532B1 (en) | 1997-12-31 | 2006-03-07 | International Business Machines Corporation | Low overhead methods and apparatus for shared access storage devices |
US6151624A (en) | 1998-02-03 | 2000-11-21 | Realnames Corporation | Navigating network resources based on metadata |
JP3998794B2 (ja) | 1998-02-18 | 2007-10-31 | 株式会社野村総合研究所 | ブラウジングクライアントサーバーシステム |
KR100285265B1 (ko) | 1998-02-25 | 2001-04-02 | 윤덕용 | 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조 |
US6185558B1 (en) | 1998-03-03 | 2001-02-06 | Amazon.Com, Inc. | Identifying the items most relevant to a current query based on items selected in connection with similar queries |
US5913210A (en) | 1998-03-27 | 1999-06-15 | Call; Charles G. | Methods and apparatus for disseminating product information via the internet |
US6125361A (en) | 1998-04-10 | 2000-09-26 | International Business Machines Corporation | Feature diffusion across hyperlinks |
US6151595A (en) | 1998-04-17 | 2000-11-21 | Xerox Corporation | Methods for interactive visualization of spreading activation using time tubes and disk trees |
US6167402A (en) | 1998-04-27 | 2000-12-26 | Sun Microsystems, Inc. | High performance message store |
US6240407B1 (en) | 1998-04-29 | 2001-05-29 | International Business Machines Corp. | Method and apparatus for creating an index in a database system |
US6314421B1 (en) | 1998-05-12 | 2001-11-06 | David M. Sharnoff | Method and apparatus for indexing documents for message filtering |
JPH11328191A (ja) | 1998-05-13 | 1999-11-30 | Nec Corp | Wwwロボット検索システム |
US6098064A (en) | 1998-05-22 | 2000-08-01 | Xerox Corporation | Prefetching and caching documents according to probability ranked need S list |
US6285367B1 (en) | 1998-05-26 | 2001-09-04 | International Business Machines Corporation | Method and apparatus for displaying and navigating a graph |
US6182085B1 (en) | 1998-05-28 | 2001-01-30 | International Business Machines Corporation | Collaborative team crawling:Large scale information gathering over the internet |
US6208988B1 (en) | 1998-06-01 | 2001-03-27 | Bigchalk.Com, Inc. | Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes |
ATE263988T1 (de) | 1998-06-08 | 2004-04-15 | Kcsl Inc | Methode und verfahren um relevante dokumente in einer datenbank zu finden |
US6006225A (en) | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
JP3665480B2 (ja) | 1998-06-24 | 2005-06-29 | 富士通株式会社 | 文書整理装置および方法 |
US6216123B1 (en) | 1998-06-24 | 2001-04-10 | Novell, Inc. | Method and system for rapid retrieval in a full text indexing system |
US6638314B1 (en) | 1998-06-26 | 2003-10-28 | Microsoft Corporation | Method of web crawling utilizing crawl numbers |
US6424966B1 (en) | 1998-06-30 | 2002-07-23 | Microsoft Corporation | Synchronizing crawler with notification source |
US6199081B1 (en) * | 1998-06-30 | 2001-03-06 | Microsoft Corporation | Automatic tagging of documents and exclusion by content |
EP1105819B1 (en) | 1998-08-26 | 2008-03-19 | Fractal Edge Limited | Methods and devices for mapping data files |
US6324551B1 (en) * | 1998-08-31 | 2001-11-27 | Xerox Corporation | Self-contained document management based on document properties |
RU2138076C1 (ru) | 1998-09-14 | 1999-09-20 | Закрытое акционерное общество "МедиаЛингва" | Система поиска информации в компьютерной сети |
US6115709A (en) | 1998-09-18 | 2000-09-05 | Tacit Knowledge Systems, Inc. | Method and system for constructing a knowledge profile of a user having unrestricted and restricted access portions according to respective levels of confidence of content of the portions |
US6549897B1 (en) | 1998-10-09 | 2003-04-15 | Microsoft Corporation | Method and system for calculating phrase-document importance |
US6360215B1 (en) * | 1998-11-03 | 2002-03-19 | Inktomi Corporation | Method and apparatus for retrieving documents based on information other than document content |
US6385602B1 (en) | 1998-11-03 | 2002-05-07 | E-Centives, Inc. | Presentation of search results using dynamic categorization |
US20030069873A1 (en) | 1998-11-18 | 2003-04-10 | Kevin L. Fox | Multiple engine information retrieval and visualization system |
US6628304B2 (en) | 1998-12-09 | 2003-09-30 | Cisco Technology, Inc. | Method and apparatus providing a graphical user interface for representing and navigating hierarchical networks |
US6167369A (en) | 1998-12-23 | 2000-12-26 | Xerox Company | Automatic language identification using both N-gram and word information |
JP2000194713A (ja) | 1998-12-25 | 2000-07-14 | Nippon Telegr & Teleph Corp <Ntt> | 文字列検索方法及び装置及び文字列検索プログラムを格納した記憶媒体 |
US6922699B2 (en) | 1999-01-26 | 2005-07-26 | Xerox Corporation | System and method for quantitatively representing data objects in vector space |
US6418433B1 (en) | 1999-01-28 | 2002-07-09 | International Business Machines Corporation | System and method for focussed web crawling |
JP3347088B2 (ja) | 1999-02-12 | 2002-11-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 関連情報検索方法およびシステム |
US6862710B1 (en) | 1999-03-23 | 2005-03-01 | Insightful Corporation | Internet navigation using soft hyperlinks |
US6510406B1 (en) | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
US6763496B1 (en) | 1999-03-31 | 2004-07-13 | Microsoft Corporation | Method for promoting contextual information to display pages containing hyperlinks |
US6304864B1 (en) | 1999-04-20 | 2001-10-16 | Textwise Llc | System for retrieving multimedia information from the internet using multiple evolving intelligent agents |
US6336117B1 (en) | 1999-04-30 | 2002-01-01 | International Business Machines Corporation | Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine |
US6327590B1 (en) | 1999-05-05 | 2001-12-04 | Xerox Corporation | System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis |
US7835943B2 (en) | 1999-05-28 | 2010-11-16 | Yahoo! Inc. | System and method for providing place and price protection in a search result list generated by a computer network search engine |
US6990628B1 (en) | 1999-06-14 | 2006-01-24 | Yahoo! Inc. | Method and apparatus for measuring similarity among electronic documents |
US7072888B1 (en) | 1999-06-16 | 2006-07-04 | Triogo, Inc. | Process for improving search engine efficiency using feedback |
US6973490B1 (en) | 1999-06-23 | 2005-12-06 | Savvis Communications Corp. | Method and system for object-level web performance and analysis |
US6631369B1 (en) | 1999-06-30 | 2003-10-07 | Microsoft Corporation | Method and system for incremental web crawling |
US6547829B1 (en) | 1999-06-30 | 2003-04-15 | Microsoft Corporation | Method and system for detecting duplicate documents in web crawls |
US6873982B1 (en) | 1999-07-16 | 2005-03-29 | International Business Machines Corporation | Ordering of database search results based on user feedback |
US6557036B1 (en) | 1999-07-20 | 2003-04-29 | Sun Microsystems, Inc. | Methods and apparatus for site wide monitoring of electronic mail systems |
US7181438B1 (en) | 1999-07-21 | 2007-02-20 | Alberti Anemometer, Llc | Database access system |
US6598047B1 (en) | 1999-07-26 | 2003-07-22 | David W. Russell | Method and system for searching text |
CA2279119C (en) | 1999-07-29 | 2004-10-19 | Ibm Canada Limited-Ibm Canada Limitee | Heuristic-based conditional data indexing |
JP3931496B2 (ja) | 1999-08-11 | 2007-06-13 | 富士ゼロックス株式会社 | ハイパーテキスト解析装置 |
US6442606B1 (en) | 1999-08-12 | 2002-08-27 | Inktomi Corporation | Method and apparatus for identifying spoof documents |
US6636853B1 (en) | 1999-08-30 | 2003-10-21 | Morphism, Llc | Method and apparatus for representing and navigating search results |
US6381597B1 (en) | 1999-10-07 | 2002-04-30 | U-Know Software Corporation | Electronic shopping agent which is capable of operating with vendor sites which have disparate formats |
US7346604B1 (en) | 1999-10-15 | 2008-03-18 | Hewlett-Packard Development Company, L.P. | Method for ranking hypertext search results by analysis of hyperlinks from expert documents and keyword scope |
US6687698B1 (en) | 1999-10-18 | 2004-02-03 | Fisher Rosemount Systems, Inc. | Accessing and updating a configuration database from distributed physical locations within a process control system |
JP3772606B2 (ja) | 1999-10-19 | 2006-05-10 | 株式会社日立製作所 | 電子文書管理方法及びシステム並びに記録媒体 |
AU1039301A (en) | 1999-10-29 | 2001-05-08 | British Telecommunications Public Limited Company | Method and apparatus for processing queries |
US6263364B1 (en) | 1999-11-02 | 2001-07-17 | Alta Vista Company | Web crawler system using plurality of parallel priority level queues having distinct associated download priority levels for prioritizing document downloading and maintaining document freshness |
US6351755B1 (en) | 1999-11-02 | 2002-02-26 | Alta Vista Company | System and method for associating an extensible set of data with documents downloaded by a web crawler |
US6418452B1 (en) | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service directory for efficient web crawling |
US6418453B1 (en) | 1999-11-03 | 2002-07-09 | International Business Machines Corporation | Network repository service for efficient web crawling |
US6539376B1 (en) | 1999-11-15 | 2003-03-25 | International Business Machines Corporation | System and method for the automatic mining of new relationships |
US7016540B1 (en) | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
US6886129B1 (en) | 1999-11-24 | 2005-04-26 | International Business Machines Corporation | Method and system for trawling the World-wide Web to identify implicitly-defined communities of web pages |
US6772141B1 (en) * | 1999-12-14 | 2004-08-03 | Novell, Inc. | Method and apparatus for organizing and using indexes utilizing a search decision table |
US6546388B1 (en) | 2000-01-14 | 2003-04-08 | International Business Machines Corporation | Metadata search results ranking system |
US6883135B1 (en) | 2000-01-28 | 2005-04-19 | Microsoft Corporation | Proxy server using a statistical model |
US7240067B2 (en) | 2000-02-08 | 2007-07-03 | Sybase, Inc. | System and methodology for extraction and aggregation of data from dynamic content |
US6931397B1 (en) | 2000-02-11 | 2005-08-16 | International Business Machines Corporation | System and method for automatic generation of dynamic search abstracts contain metadata by crawler |
US6910029B1 (en) | 2000-02-22 | 2005-06-21 | International Business Machines Corporation | System for weighted indexing of hierarchical documents |
JP2001265774A (ja) | 2000-03-16 | 2001-09-28 | Nippon Telegr & Teleph Corp <Ntt> | 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム |
US6516312B1 (en) | 2000-04-04 | 2003-02-04 | International Business Machine Corporation | System and method for dynamically associating keywords with domain-specific search engine queries |
US6633867B1 (en) | 2000-04-05 | 2003-10-14 | International Business Machines Corporation | System and method for providing a session query within the context of a dynamic search result set |
US6549896B1 (en) | 2000-04-07 | 2003-04-15 | Nec Usa, Inc. | System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling |
US6718365B1 (en) | 2000-04-13 | 2004-04-06 | International Business Machines Corporation | Method, system, and program for ordering search results using an importance weighting |
US6859800B1 (en) | 2000-04-26 | 2005-02-22 | Global Information Research And Technologies Llc | System for fulfilling an information need |
US6741986B2 (en) | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
US6772160B2 (en) | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
DE10029644B4 (de) | 2000-06-16 | 2008-02-07 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
JP3573688B2 (ja) | 2000-06-28 | 2004-10-06 | 松下電器産業株式会社 | 類似文書検索装置及び関連キーワード抽出装置 |
US6678692B1 (en) | 2000-07-10 | 2004-01-13 | Northrop Grumman Corporation | Hierarchy statistical analysis system and method |
US6601075B1 (en) | 2000-07-27 | 2003-07-29 | International Business Machines Corporation | System and method of ranking and retrieving documents based on authority scores of schemas and documents |
US6633868B1 (en) | 2000-07-28 | 2003-10-14 | Shermann Loyall Min | System and method for context-based document retrieval |
US6598040B1 (en) * | 2000-08-14 | 2003-07-22 | International Business Machines Corporation | Method and system for processing electronic search expressions |
US7080073B1 (en) | 2000-08-18 | 2006-07-18 | Firstrain, Inc. | Method and apparatus for focused crawling |
KR100378240B1 (ko) | 2000-08-23 | 2003-03-29 | 학교법인 통진학원 | 엔트로피와 사용자 프로파일을 적용한 문서순위 조정방법 |
US20030217052A1 (en) | 2000-08-24 | 2003-11-20 | Celebros Ltd. | Search engine method and apparatus |
US6959326B1 (en) | 2000-08-24 | 2005-10-25 | International Business Machines Corporation | Method, system, and program for gathering indexable metadata on content at a data repository |
EP1323112A4 (en) | 2000-08-25 | 2006-08-02 | Jonas Ulenas | METHOD AND APPARATUS FOR OBTAINING PREFERENCES OF CONSUMER PRODUCTS BY SELECTING AND EVALUATING PRODUCTS |
JP3472540B2 (ja) | 2000-09-11 | 2003-12-02 | 日本電信電話株式会社 | サーバ選択装置、サーバ選択方法、及びサーバ選択プログラムを記録した記録媒体 |
NO313399B1 (no) | 2000-09-14 | 2002-09-23 | Fast Search & Transfer Asa | Fremgangsmate til soking og analyse av informasjon i datanettverk |
US6598051B1 (en) | 2000-09-19 | 2003-07-22 | Altavista Company | Web page connectivity server |
US6560600B1 (en) | 2000-10-25 | 2003-05-06 | Alta Vista Company | Method and apparatus for ranking Web page search results |
JP3525885B2 (ja) | 2000-10-25 | 2004-05-10 | 日本電信電話株式会社 | 多角的検索サービス方法およびそのプログラムを記録した記録媒体 |
JP2002140365A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Electric Corp | データ検索方法 |
US7200606B2 (en) | 2000-11-07 | 2007-04-03 | The Regents Of The University Of California | Method and system for selecting documents by measuring document quality |
US6622140B1 (en) | 2000-11-15 | 2003-09-16 | Justsystem Corporation | Method and apparatus for analyzing affect and emotion in text |
JP2002157271A (ja) | 2000-11-20 | 2002-05-31 | Yozan Inc | ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法 |
US7925967B2 (en) | 2000-11-21 | 2011-04-12 | Aol Inc. | Metadata quality improvement |
US8402068B2 (en) | 2000-12-07 | 2013-03-19 | Half.Com, Inc. | System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network |
US20020078045A1 (en) | 2000-12-14 | 2002-06-20 | Rabindranath Dutta | System, method, and program for ranking search results using user category weighting |
US6898592B2 (en) | 2000-12-27 | 2005-05-24 | Microsoft Corporation | Scoping queries in a search engine |
JP2002202992A (ja) | 2000-12-28 | 2002-07-19 | Speed System:Kk | ホームページ検索システム |
US6778997B2 (en) | 2001-01-05 | 2004-08-17 | International Business Machines Corporation | XML: finding authoritative pages for mining communities based on page structure criteria |
US7356530B2 (en) | 2001-01-10 | 2008-04-08 | Looksmart, Ltd. | Systems and methods of retrieving relevant information |
US6766316B2 (en) | 2001-01-18 | 2004-07-20 | Science Applications International Corporation | Method and system of ranking and clustering for document indexing and retrieval |
US6526440B1 (en) | 2001-01-30 | 2003-02-25 | Google, Inc. | Ranking search results by reranking the results based on local inter-connectivity |
US20020103798A1 (en) | 2001-02-01 | 2002-08-01 | Abrol Mani S. | Adaptive document ranking method based on user behavior |
US20020107886A1 (en) | 2001-02-07 | 2002-08-08 | Gentner Donald R. | Method and apparatus for automatic document electronic versioning system |
WO2002063493A1 (en) | 2001-02-08 | 2002-08-15 | 2028, Inc. | Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication |
US20040003028A1 (en) | 2002-05-08 | 2004-01-01 | David Emmett | Automatic display of web content to smaller display devices: improved summarization and navigation |
JP2002245089A (ja) | 2001-02-19 | 2002-08-30 | Hitachi Eng Co Ltd | ウェブページ検索システム、二次情報収集装置、インターフェース装置 |
US7627596B2 (en) | 2001-02-22 | 2009-12-01 | International Business Machines Corporation | Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries |
US8001118B2 (en) | 2001-03-02 | 2011-08-16 | Google Inc. | Methods and apparatus for employing usage statistics in document retrieval |
US7269545B2 (en) | 2001-03-30 | 2007-09-11 | Nec Laboratories America, Inc. | Method for retrieving answers from an information retrieval system |
US20020169770A1 (en) | 2001-04-27 | 2002-11-14 | Kim Brian Seong-Gon | Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents |
US7188106B2 (en) | 2001-05-01 | 2007-03-06 | International Business Machines Corporation | System and method for aggregating ranking results from various sources to improve the results of web searching |
US20020165860A1 (en) | 2001-05-07 | 2002-11-07 | Nec Research Insititute, Inc. | Selective retrieval metasearch engine |
US6738764B2 (en) | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
IES20020336A2 (en) | 2001-05-10 | 2002-11-13 | Changing Worlds Ltd | Intelligent internet website with hierarchical menu |
US6865295B2 (en) | 2001-05-11 | 2005-03-08 | Koninklijke Philips Electronics N.V. | Palette-based histogram matching with recursive histogram vector generation |
US6782383B2 (en) | 2001-06-18 | 2004-08-24 | Siebel Systems, Inc. | System and method to implement a persistent and dismissible search center frame |
US6947920B2 (en) | 2001-06-20 | 2005-09-20 | Oracle International Corporation | Method and system for response time optimization of data query rankings and retrieval |
US7519529B1 (en) | 2001-06-29 | 2009-04-14 | Microsoft Corporation | System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service |
US7039234B2 (en) | 2001-07-19 | 2006-05-02 | Microsoft Corporation | Electronic ink as a software object |
US6868411B2 (en) | 2001-08-13 | 2005-03-15 | Xerox Corporation | Fuzzy text categorizer |
US6928425B2 (en) | 2001-08-13 | 2005-08-09 | Xerox Corporation | System for propagating enrichment between documents |
KR100509276B1 (ko) | 2001-08-20 | 2005-08-22 | 엔에이치엔(주) | 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치 |
JP3895955B2 (ja) | 2001-08-24 | 2007-03-22 | 株式会社東芝 | 情報検索方法および情報検索システム |
US7076483B2 (en) | 2001-08-27 | 2006-07-11 | Xyleme Sa | Ranking nodes in a graph |
US20030046389A1 (en) | 2001-09-04 | 2003-03-06 | Thieme Laura M. | Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility |
US6970863B2 (en) | 2001-09-18 | 2005-11-29 | International Business Machines Corporation | Front-end weight factor search criteria |
US6766422B2 (en) | 2001-09-27 | 2004-07-20 | Siemens Information And Communication Networks, Inc. | Method and system for web caching based on predictive usage |
US6944609B2 (en) | 2001-10-18 | 2005-09-13 | Lycos, Inc. | Search results using editor feedback |
US7428695B2 (en) | 2001-10-22 | 2008-09-23 | Hewlett-Packard Development Company, L.P. | System for automatic generation of arbitrarily indexed hyperlinked text |
JP2003208434A (ja) | 2001-11-07 | 2003-07-25 | Nec Corp | 情報検索システム及びそれに用いる情報検索方法 |
US20030101183A1 (en) * | 2001-11-26 | 2003-05-29 | Navin Kabra | Information retrieval index allowing updating while in use |
US6763362B2 (en) | 2001-11-30 | 2004-07-13 | Micron Technology, Inc. | Method and system for updating a search engine |
US7565367B2 (en) | 2002-01-15 | 2009-07-21 | Iac Search & Media, Inc. | Enhanced popularity ranking |
JP3871201B2 (ja) | 2002-01-29 | 2007-01-24 | ソニー株式会社 | コンテンツ提供取得システム |
US6829606B2 (en) | 2002-02-14 | 2004-12-07 | Infoglide Software Corporation | Similarity search engine for use with relational databases |
JP4021681B2 (ja) | 2002-02-22 | 2007-12-12 | 日本電信電話株式会社 | ページレイティング/フィルタリング方法および装置とページレイティング/フィルタリングプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体 |
US20060004732A1 (en) | 2002-02-26 | 2006-01-05 | Odom Paul S | Search engine methods and systems for generating relevant search results and advertisements |
US6934714B2 (en) | 2002-03-04 | 2005-08-23 | Intelesis Engineering, Inc. | Method and system for identification and maintenance of families of data records |
US7693830B2 (en) | 2005-08-10 | 2010-04-06 | Google Inc. | Programmable search engine |
KR100490748B1 (ko) | 2002-04-11 | 2005-05-24 | 한국전자통신연구원 | 유,알,엘 포함관계에 기반한 유사도 재계산을 통한효과적인 홈페이지 검색 방법 |
US7039631B1 (en) | 2002-05-24 | 2006-05-02 | Microsoft Corporation | System and method for providing search results with configurable scoring formula |
RU2273879C2 (ru) | 2002-05-28 | 2006-04-10 | Владимир Владимирович Насыпный | Способ синтеза самообучающейся системы извлечения знаний из текстовых документов для поисковых систем |
US20040006559A1 (en) | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
WO2003107321A1 (en) | 2002-06-12 | 2003-12-24 | Jena Jordahl | Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view |
JP3922693B2 (ja) | 2002-06-17 | 2007-05-30 | Necシステムテクノロジー株式会社 | インターネット情報検索システム |
JP2004054588A (ja) | 2002-07-19 | 2004-02-19 | Just Syst Corp | 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム |
CA2395905A1 (en) | 2002-07-26 | 2004-01-26 | Teraxion Inc. | Multi-grating tunable chromatic dispersion compensator |
US7599911B2 (en) | 2002-08-05 | 2009-10-06 | Yahoo! Inc. | Method and apparatus for search ranking using human input and automated ranking |
US7152059B2 (en) | 2002-08-30 | 2006-12-19 | Emergency24, Inc. | System and method for predicting additional search results of a computerized database search user based on an initial search query |
US7013458B2 (en) | 2002-09-09 | 2006-03-14 | Sun Microsystems, Inc. | Method and apparatus for associating metadata attributes with program elements |
JP2004164555A (ja) | 2002-09-17 | 2004-06-10 | Fuji Xerox Co Ltd | 検索装置および方法ならびにそのインデクス構築装置および方法 |
US20040064442A1 (en) | 2002-09-27 | 2004-04-01 | Popovitch Steven Gregory | Incremental search engine |
US6886010B2 (en) | 2002-09-30 | 2005-04-26 | The United States Of America As Represented By The Secretary Of The Navy | Method for data and text mining and literature-based discovery |
US7085755B2 (en) | 2002-11-07 | 2006-08-01 | Thomson Global Resources Ag | Electronic document repository management and access system |
US7231379B2 (en) | 2002-11-19 | 2007-06-12 | Noema, Inc. | Navigation in a hierarchical structured transaction processing system |
US7386527B2 (en) | 2002-12-06 | 2008-06-10 | Kofax, Inc. | Effective multi-class support vector machine classification |
US7020648B2 (en) | 2002-12-14 | 2006-03-28 | International Business Machines Corporation | System and method for identifying and utilizing a secondary index to access a database using a management system without an internal catalogue of online metadata |
US7734565B2 (en) | 2003-01-18 | 2010-06-08 | Yahoo! Inc. | Query string matching method and apparatus |
US20040148278A1 (en) | 2003-01-22 | 2004-07-29 | Amir Milo | System and method for providing content warehouse |
RU2236699C1 (ru) | 2003-02-25 | 2004-09-20 | Открытое акционерное общество "Телепортал. Ру" | Способ поиска и выборки информации с повышенной релевантностью |
JP4299022B2 (ja) | 2003-02-28 | 2009-07-22 | トヨタ自動車株式会社 | コンテンツ検索用インデックス生成装置 |
US20040181515A1 (en) | 2003-03-13 | 2004-09-16 | International Business Machines Corporation | Group administration of universal resource identifiers with members identified in search result |
US6947930B2 (en) | 2003-03-21 | 2005-09-20 | Overture Services, Inc. | Systems and methods for interactive search query refinement |
DE60315947T2 (de) | 2003-03-27 | 2008-05-21 | Sony Deutschland Gmbh | Verfahren zur Sprachmodellierung |
US7216123B2 (en) | 2003-03-28 | 2007-05-08 | Board Of Trustees Of The Leland Stanford Junior University | Methods for ranking nodes in large directed graphs |
US7028029B2 (en) | 2003-03-28 | 2006-04-11 | Google Inc. | Adaptive computation of ranking |
US7451130B2 (en) | 2003-06-16 | 2008-11-11 | Google Inc. | System and method for providing preferred country biasing of search results |
US7451129B2 (en) | 2003-03-31 | 2008-11-11 | Google Inc. | System and method for providing preferred language ordering of search results |
US7051023B2 (en) | 2003-04-04 | 2006-05-23 | Yahoo! Inc. | Systems and methods for generating concept units from search queries |
US7197497B2 (en) | 2003-04-25 | 2007-03-27 | Overture Services, Inc. | Method and apparatus for machine learning a document relevance function |
US7283997B1 (en) | 2003-05-14 | 2007-10-16 | Apple Inc. | System and method for ranking the relevance of documents retrieved by a query |
US7502779B2 (en) * | 2003-06-05 | 2009-03-10 | International Business Machines Corporation | Semantics-based searching for information in a distributed data processing system |
US8239380B2 (en) | 2003-06-20 | 2012-08-07 | Microsoft Corporation | Systems and methods to tune a general-purpose search engine for a search entry point |
US7228301B2 (en) | 2003-06-27 | 2007-06-05 | Microsoft Corporation | Method for normalizing document metadata to improve search results using an alias relationship directory service |
US7630963B2 (en) * | 2003-06-30 | 2009-12-08 | Microsoft Corporation | Fast ranked full-text searching |
US7308643B1 (en) | 2003-07-03 | 2007-12-11 | Google Inc. | Anchor tag indexing in a web crawler system |
KR100543255B1 (ko) | 2003-08-19 | 2006-01-20 | 문영섭 | 용접부 절삭가공장치 |
US20050060186A1 (en) | 2003-08-28 | 2005-03-17 | Blowers Paul A. | Prioritized presentation of medical device events |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7454417B2 (en) | 2003-09-12 | 2008-11-18 | Google Inc. | Methods and systems for improving a search ranking using population information |
US8589373B2 (en) | 2003-09-14 | 2013-11-19 | Yaron Mayer | System and method for improved searching on the internet or similar networks and especially improved MetaNews and/or improved automatically generated newspapers |
US20050071328A1 (en) | 2003-09-30 | 2005-03-31 | Lawrence Stephen R. | Personalization of web search |
US7693827B2 (en) | 2003-09-30 | 2010-04-06 | Google Inc. | Personalization of placed content ordering in search results |
US7346839B2 (en) | 2003-09-30 | 2008-03-18 | Google Inc. | Information retrieval based on historical data |
US7552109B2 (en) | 2003-10-15 | 2009-06-23 | International Business Machines Corporation | System, method, and service for collaborative focused crawling of documents on a network |
US20050086192A1 (en) | 2003-10-16 | 2005-04-21 | Hitach, Ltd. | Method and apparatus for improving the integration between a search engine and one or more file servers |
US7346208B2 (en) | 2003-10-25 | 2008-03-18 | Hewlett-Packard Development Company, L.P. | Image artifact reduction using a neural network |
US7231399B1 (en) | 2003-11-14 | 2007-06-12 | Google Inc. | Ranking documents based on large data sets |
US7181447B2 (en) | 2003-12-08 | 2007-02-20 | Iac Search And Media, Inc. | Methods and systems for conceptually organizing and presenting information |
CN100495392C (zh) | 2003-12-29 | 2009-06-03 | 西安迪戈科技有限责任公司 | 一种智能搜索方法 |
US20060047649A1 (en) | 2003-12-29 | 2006-03-02 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US7685104B2 (en) * | 2004-01-08 | 2010-03-23 | International Business Machines Corporation | Dynamic bitmap processing, identification and reusability |
US7483891B2 (en) | 2004-01-09 | 2009-01-27 | Yahoo, Inc. | Content presentation and management system associating base content and relevant additional content |
US7392278B2 (en) | 2004-01-23 | 2008-06-24 | Microsoft Corporation | Building and using subwebs for focused search |
US7499913B2 (en) | 2004-01-26 | 2009-03-03 | International Business Machines Corporation | Method for handling anchor text |
US7310632B2 (en) | 2004-02-12 | 2007-12-18 | Microsoft Corporation | Decision-theoretic web-crawling and predicting web-page change |
US7281002B2 (en) | 2004-03-01 | 2007-10-09 | International Business Machine Corporation | Organizing related search results |
US9104689B2 (en) | 2004-03-17 | 2015-08-11 | International Business Machines Corporation | Method for synchronizing documents for disconnected operation |
US7584221B2 (en) | 2004-03-18 | 2009-09-01 | Microsoft Corporation | Field weighting in text searching |
JP2005277445A (ja) * | 2004-03-22 | 2005-10-06 | Fuji Xerox Co Ltd | 会議映像処理装置、会議映像処理方法およびプログラム |
US7343374B2 (en) | 2004-03-29 | 2008-03-11 | Yahoo! Inc. | Computation of page authority weights using personalized bookmarks |
US7580568B1 (en) | 2004-03-31 | 2009-08-25 | Google Inc. | Methods and systems for identifying an image as a representative image for an article |
US7693825B2 (en) | 2004-03-31 | 2010-04-06 | Google Inc. | Systems and methods for ranking implicit search results |
US20050251499A1 (en) | 2004-05-04 | 2005-11-10 | Zezhen Huang | Method and system for searching documents using readers valuation |
US7257577B2 (en) | 2004-05-07 | 2007-08-14 | International Business Machines Corporation | System, method and service for ranking search results using a modular scoring system |
US7136851B2 (en) * | 2004-05-14 | 2006-11-14 | Microsoft Corporation | Method and system for indexing and searching databases |
US7260573B1 (en) | 2004-05-17 | 2007-08-21 | Google Inc. | Personalizing anchor text scores in a search engine |
US20050283473A1 (en) | 2004-06-17 | 2005-12-22 | Armand Rousso | Apparatus, method and system of artificial intelligence for data searching applications |
US7716225B1 (en) | 2004-06-17 | 2010-05-11 | Google Inc. | Ranking documents based on user behavior and/or feature data |
US7730012B2 (en) | 2004-06-25 | 2010-06-01 | Apple Inc. | Methods and systems for managing data |
US8131674B2 (en) | 2004-06-25 | 2012-03-06 | Apple Inc. | Methods and systems for managing data |
US7363296B1 (en) | 2004-07-01 | 2008-04-22 | Microsoft Corporation | Generating a subindex with relevant attributes to improve querying |
US7428530B2 (en) | 2004-07-01 | 2008-09-23 | Microsoft Corporation | Dispersing search engine results by using page category information |
US7395260B2 (en) | 2004-08-04 | 2008-07-01 | International Business Machines Corporation | Method for providing graphical representations of search results in multiple related histograms |
US7634461B2 (en) | 2004-08-04 | 2009-12-15 | International Business Machines Corporation | System and method for enhancing keyword relevance by user's interest on the search result documents |
US20060036598A1 (en) | 2004-08-09 | 2006-02-16 | Jie Wu | Computerized method for ranking linked information items in distributed sources |
US20060047643A1 (en) | 2004-08-31 | 2006-03-02 | Chirag Chaman | Method and system for a personalized search engine |
KR20070101217A (ko) | 2004-09-16 | 2007-10-16 | 텔레노어 아사 | 개인 웹에서의 문서의 검색, 항행, 및 순위 부여를 위한방법, 시스템, 컴퓨터 프로그램 제품 |
WO2006036781A2 (en) | 2004-09-22 | 2006-04-06 | Perfect Market Technologies, Inc. | Search engine using user intent |
US7606793B2 (en) | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US7761448B2 (en) | 2004-09-30 | 2010-07-20 | Microsoft Corporation | System and method for ranking search results using click distance |
US7739277B2 (en) | 2004-09-30 | 2010-06-15 | Microsoft Corporation | System and method for incorporating anchor text into ranking search results |
US7827181B2 (en) | 2004-09-30 | 2010-11-02 | Microsoft Corporation | Click distance determination |
US7644107B2 (en) | 2004-09-30 | 2010-01-05 | Microsoft Corporation | System and method for batched indexing of network documents |
US20060074883A1 (en) | 2004-10-05 | 2006-04-06 | Microsoft Corporation | Systems, methods, and interfaces for providing personalized search and information access |
US20060074781A1 (en) | 2004-10-06 | 2006-04-06 | Leano Hector V | System for facilitating turnkey real estate investment in Mexico |
US7333963B2 (en) | 2004-10-07 | 2008-02-19 | Bernard Widrow | Cognitive memory and auto-associative neural network based search engine for computer and network located images and photographs |
US7533092B2 (en) | 2004-10-28 | 2009-05-12 | Yahoo! Inc. | Link-based spam detection |
US7716198B2 (en) | 2004-12-21 | 2010-05-11 | Microsoft Corporation | Ranking search results using feature extraction |
KR100932318B1 (ko) | 2005-01-18 | 2009-12-16 | 야후! 인크. | 웹 검색 기술 및 웹 컨텐트와 결합된 후원 검색 목록의매칭 및 랭킹 |
US20060173828A1 (en) | 2005-02-01 | 2006-08-03 | Outland Research, Llc | Methods and apparatus for using personal background data to improve the organization of documents retrieved in response to a search query |
US7689615B2 (en) | 2005-02-25 | 2010-03-30 | Microsoft Corporation | Ranking results using multiple nested ranking |
US20060200460A1 (en) | 2005-03-03 | 2006-09-07 | Microsoft Corporation | System and method for ranking search results using file types |
US7792833B2 (en) | 2005-03-03 | 2010-09-07 | Microsoft Corporation | Ranking search results using language types |
US7574436B2 (en) | 2005-03-10 | 2009-08-11 | Yahoo! Inc. | Reranking and increasing the relevance of the results of Internet searches |
US20060206460A1 (en) | 2005-03-14 | 2006-09-14 | Sanjay Gadkari | Biasing search results |
US8095487B2 (en) | 2005-03-16 | 2012-01-10 | Yahoo! Inc. | System and method for biasing search results based on topic familiarity |
KR101532715B1 (ko) | 2005-03-18 | 2015-07-02 | 써치 엔진 테크놀로지스, 엘엘씨 | 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진 |
US7870147B2 (en) | 2005-03-29 | 2011-01-11 | Google Inc. | Query revision using known highly-ranked queries |
US7693829B1 (en) | 2005-04-25 | 2010-04-06 | Google Inc. | Search engine with fill-the-blanks capability |
US7401073B2 (en) | 2005-04-28 | 2008-07-15 | International Business Machines Corporation | Term-statistics modification for category-based search |
KR100672277B1 (ko) | 2005-05-09 | 2007-01-24 | 엔에이치엔(주) | 개인화 검색 방법 및 검색 서버 |
US7933917B2 (en) | 2005-05-06 | 2011-04-26 | Nhn Corporation | Personalized search method and system for enabling the method |
US7451124B2 (en) | 2005-05-12 | 2008-11-11 | Xerox Corporation | Method of analyzing documents |
US7962462B1 (en) | 2005-05-31 | 2011-06-14 | Google Inc. | Deriving and using document and site quality signals from search query streams |
CA2544324A1 (en) | 2005-06-10 | 2006-12-10 | Unicru, Inc. | Employee selection via adaptive assessment |
US20060282455A1 (en) | 2005-06-13 | 2006-12-14 | It Interactive Services Inc. | System and method for ranking web content |
US7627564B2 (en) | 2005-06-21 | 2009-12-01 | Microsoft Corporation | High scale adaptive search systems and methods |
US7599917B2 (en) | 2005-08-15 | 2009-10-06 | Microsoft Corporation | Ranking search results using biased click distance |
US7653617B2 (en) | 2005-08-29 | 2010-01-26 | Google Inc. | Mobile sitemaps |
US7499919B2 (en) | 2005-09-21 | 2009-03-03 | Microsoft Corporation | Ranking functions using document usage statistics |
US7716226B2 (en) | 2005-09-27 | 2010-05-11 | Patentratings, Llc | Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects |
US7689531B1 (en) | 2005-09-28 | 2010-03-30 | Trend Micro Incorporated | Automatic charset detection using support vector machines with charset grouping |
US20070085716A1 (en) | 2005-09-30 | 2007-04-19 | International Business Machines Corporation | System and method for detecting matches of small edit distance |
US7873624B2 (en) | 2005-10-21 | 2011-01-18 | Microsoft Corporation | Question answering over structured content on the web |
US20070150473A1 (en) | 2005-12-22 | 2007-06-28 | Microsoft Corporation | Search By Document Type And Relevance |
US7814099B2 (en) | 2006-01-31 | 2010-10-12 | Louis S. Wang | Method for ranking and sorting electronic documents in a search result list based on relevance |
US7689559B2 (en) | 2006-02-08 | 2010-03-30 | Telenor Asa | Document similarity scoring and ranking method, device and computer program product |
US7685091B2 (en) | 2006-02-14 | 2010-03-23 | Accenture Global Services Gmbh | System and method for online information analysis |
US7752198B2 (en) | 2006-04-24 | 2010-07-06 | Telenor Asa | Method and device for efficiently ranking documents in a similarity graph |
US20070260597A1 (en) | 2006-05-02 | 2007-11-08 | Mark Cramer | Dynamic search engine results employing user behavior |
EP1862916A1 (en) | 2006-06-01 | 2007-12-05 | Microsoft Corporation | Indexing Documents for Information Retrieval based on additional feedback fields |
US20080005068A1 (en) | 2006-06-28 | 2008-01-03 | Microsoft Corporation | Context-based search, retrieval, and awareness |
US20080016053A1 (en) | 2006-07-14 | 2008-01-17 | Bea Systems, Inc. | Administration Console to Select Rank Factors |
US8595245B2 (en) | 2006-07-26 | 2013-11-26 | Xerox Corporation | Reference resolution for text enrichment and normalization in mining mixed data |
US7720830B2 (en) | 2006-07-31 | 2010-05-18 | Microsoft Corporation | Hierarchical conditional random fields for web extraction |
KR100818553B1 (ko) | 2006-08-22 | 2008-04-01 | 에스케이커뮤니케이션즈 주식회사 | 문서랭킹 부여방법 및 이를 수행할 수 있는 프로그램이수록된 컴퓨터로 읽을 수 있는 기록 매체 |
US20080140641A1 (en) | 2006-12-07 | 2008-06-12 | Yahoo! Inc. | Knowledge and interests based search term ranking for search results validation |
US7792883B2 (en) | 2006-12-11 | 2010-09-07 | Google Inc. | Viewport-relative scoring for location search queries |
JP4839195B2 (ja) | 2006-12-12 | 2011-12-21 | 日本電信電話株式会社 | Xml文書の適合度の算出方法およびそのプログラムと、情報処理装置 |
US7685084B2 (en) | 2007-02-09 | 2010-03-23 | Yahoo! Inc. | Term expansion using associative matching of labeled term pairs |
US7996392B2 (en) | 2007-06-27 | 2011-08-09 | Oracle International Corporation | Changing ranking algorithms based on customer settings |
US20090006358A1 (en) | 2007-06-27 | 2009-01-01 | Microsoft Corporation | Search results |
US8122032B2 (en) | 2007-07-20 | 2012-02-21 | Google Inc. | Identifying and linking similar passages in a digital text corpus |
US8201081B2 (en) | 2007-09-07 | 2012-06-12 | Google Inc. | Systems and methods for processing inoperative document links |
US9348912B2 (en) | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
US20090106221A1 (en) | 2007-10-18 | 2009-04-23 | Microsoft Corporation | Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features |
US7840569B2 (en) | 2007-10-18 | 2010-11-23 | Microsoft Corporation | Enterprise relevancy ranking using a neural network |
WO2009072174A1 (ja) | 2007-12-03 | 2009-06-11 | Pioneer Corporation | 情報検索装置、情報検索方法及び検索処理プログラム |
US7707229B2 (en) | 2007-12-12 | 2010-04-27 | Yahoo! Inc. | Unsupervised detection of web pages corresponding to a similarity class |
JP2009146248A (ja) | 2007-12-17 | 2009-07-02 | Fujifilm Corp | コンテンツ提示システム及びプログラム |
US20090164929A1 (en) | 2007-12-20 | 2009-06-25 | Microsoft Corporation | Customizing Search Results |
JP2009204442A (ja) | 2008-02-28 | 2009-09-10 | Athlete Fa Kk | 粒状物質の計量装置 |
US8412702B2 (en) | 2008-03-12 | 2013-04-02 | Yahoo! Inc. | System, method, and/or apparatus for reordering search results |
US7974974B2 (en) | 2008-03-20 | 2011-07-05 | Microsoft Corporation | Techniques to perform relative ranking for search results |
JP5328212B2 (ja) | 2008-04-10 | 2013-10-30 | 株式会社エヌ・ティ・ティ・ドコモ | レコメンド情報評価装置およびレコメンド情報評価方法 |
US8812493B2 (en) | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
CN101359331B (zh) | 2008-05-04 | 2014-03-19 | 索意互动(北京)信息技术有限公司 | 对搜索结果重新排序的方法和系统 |
US20090307209A1 (en) | 2008-06-10 | 2009-12-10 | David Carmel | Term-statistics modification for category-based search |
US8326829B2 (en) | 2008-10-17 | 2012-12-04 | Centurylink Intellectual Property Llc | System and method for displaying publication dates for search results |
US8224847B2 (en) | 2009-10-29 | 2012-07-17 | Microsoft Corporation | Relevant individual searching using managed property and ranking features |
US8527507B2 (en) | 2009-12-04 | 2013-09-03 | Microsoft Corporation | Custom ranking model schema |
US8422786B2 (en) | 2010-03-26 | 2013-04-16 | International Business Machines Corporation | Analyzing documents using stored templates |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8370331B2 (en) | 2010-07-02 | 2013-02-05 | Business Objects Software Limited | Dynamic visualization of search results on a graphical user interface |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
-
2004
- 2004-09-27 US US10/951,123 patent/US7606793B2/en active Active
-
2005
- 2005-06-10 EP EP05105107A patent/EP1659505A1/en not_active Ceased
- 2005-06-15 JP JP2005175174A patent/JP5323300B2/ja active Active
- 2005-06-30 KR KR1020050057859A patent/KR100981857B1/ko active IP Right Grant
- 2005-07-25 CN CN2005100882120A patent/CN1755677B/zh active Active
-
2009
- 2009-09-29 US US12/569,028 patent/US8843486B2/en active Active
-
2011
- 2011-12-05 JP JP2011266249A patent/JP2012069152A/ja active Pending
-
2014
- 2014-08-01 JP JP2014157742A patent/JP6006267B2/ja active Active
-
2016
- 2016-07-20 JP JP2016142393A patent/JP2016181306A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002024015A (ja) * | 2000-07-11 | 2002-01-25 | Misawa Van Corp | クライアントサーバシステム構築方法 |
WO2003009180A2 (en) * | 2001-07-19 | 2003-01-30 | Computer Associates Think, Inc | Method and system for reorganizing a tablespace in a database |
JP2004192657A (ja) * | 2004-02-09 | 2004-07-08 | Nec Corp | 情報検索システム、情報検索方法および情報検索用プログラムを記録した記録媒体 |
Non-Patent Citations (1)
Title |
---|
CHRISTIAN GROSS: "これがSite Serverだ Intergrating The Microsoft Index Server with Active Server Pages", MICROSOFT INTERACTIVE DEVELOPER 1997JULY NO.2, JPN6017042373, 18 July 1997 (1997-07-18), JP, pages 75−90ページ * |
Also Published As
Publication number | Publication date |
---|---|
CN1755677B (zh) | 2010-05-12 |
JP2014222538A (ja) | 2014-11-27 |
US8843486B2 (en) | 2014-09-23 |
JP2012069152A (ja) | 2012-04-05 |
KR100981857B1 (ko) | 2010-09-13 |
JP2006092515A (ja) | 2006-04-06 |
CN1755677A (zh) | 2006-04-05 |
EP1659505A1 (en) | 2006-05-24 |
JP5323300B2 (ja) | 2013-10-23 |
KR20060049239A (ko) | 2006-05-18 |
US20100017403A1 (en) | 2010-01-21 |
US20060074865A1 (en) | 2006-04-06 |
US7606793B2 (en) | 2009-10-20 |
JP6006267B2 (ja) | 2016-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6006267B2 (ja) | 索引キーを使用して検索を絞込むシステムおよび方法 | |
US7644107B2 (en) | System and method for batched indexing of network documents | |
US10210256B2 (en) | Anchor tag indexing in a web crawler system | |
US7788253B2 (en) | Global anchor text processing | |
US7827181B2 (en) | Click distance determination | |
JP4763354B2 (ja) | 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法 | |
US6952730B1 (en) | System and method for efficient filtering of data set addresses in a web crawler | |
JP4406609B2 (ja) | 単一のインターフェイスからのデータの多重階層を管理するための手法 | |
US9600501B1 (en) | Transmitting and receiving data between databases with different database processing capabilities | |
US20120330909A1 (en) | System and Method for Storing Data Streams in a Distributed Environment | |
CN108255972A (zh) | 一种全文检索方法及系统 | |
CN110889023A (zh) | 一种elasticsearch的分布式多功能搜索引擎 | |
US9594784B2 (en) | Push-model based index deletion | |
US7836108B1 (en) | Clustering by previous representative | |
US8661069B1 (en) | Predictive-based clustering with representative redirect targets | |
US7627547B2 (en) | Processing path-based database operations | |
US20080177701A1 (en) | System and method for searching a volume of files | |
Hughes et al. | A metadata search engine for digital language archives | |
JP2007249551A (ja) | 情報管理方法、プログラム、情報管理装置 | |
JP2007249552A (ja) | 情報管理方法、情報管理システム、プログラム及び情報管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160817 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20180612 |