JPH11110415A - 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 - Google Patents
情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体Info
- Publication number
- JPH11110415A JPH11110415A JP10140773A JP14077398A JPH11110415A JP H11110415 A JPH11110415 A JP H11110415A JP 10140773 A JP10140773 A JP 10140773A JP 14077398 A JP14077398 A JP 14077398A JP H11110415 A JPH11110415 A JP H11110415A
- Authority
- JP
- Japan
- Prior art keywords
- sub
- document
- documents
- query
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
能にすること。 【解決手段】 一組の文書に基づいて一組の副文書が設
定される(S102)。一組の副文書を対象として作用
するクエリーが処理され、各副文書に対してスコアを生
成する(S104)。各副文書のスコアは対応する副文
書のクエリーに対する関連性を示すものである。スコア
が検討され(S106)、最適な副文書が検索される
(S108)。最適な副文書はクエリーに対して最も高
い関連性を示すスコアを有している。ユーザの選択によ
り次に最適な副文書が検索される。副文書はスコア順で
ユーザに示される。また、最適なスコアの副文書を含ん
だ文書が表示され、その副文書の位置に自動的にスクロ
ールされる。ユーザの入力に基づいて文書は次に最適な
副文書の位置に自動的にスクロールされる。次に最適な
副文書が別の文書に含まれている場合は、その文書が自
動的にロードされる。
Description
り詳細には、ユーザのクエリー(query )に適合する副
文書(サブドキュメント:subdocument )を用いて情報
を検索する新規な方法および装置に関する。
ピュータ・システムによってアクセス可能な大量の情報
が存在している今日、多くの情報検索システムは高度な
検索ツールを提供している。ある検索ツールは、ユーザ
に一組の目標文書上で動作するクエリーを条件として指
定することを可能にする。多くの場合、ユーザは一つま
たは複数の検索ターム(term)をAND,ORおよびN
OTのような論理演算子と組み合わせることによってク
エリーを構築する。そして、そのクエリーは、クエリー
を処理し、通常データベース上に蓄積されている一組の
目標文書上でクエリーを機能させるサーチエンジンと通
常呼ばれる検索プロセスに送られる。
と呼ばれ、クエリーを満足する全文書がサーチエンジン
によって特定されてユーザに提示される。多数の文書が
クエリーを満足する場合、一般に追加的タームがクエリ
ーに追加され、扱いやすい数になるようにヒットした文
書の数を減らす処理が行われる。そして、ユーザは、検
索されて読み出されるべき一つまたは複数の特定された
文書を選択する。
と、ユーザは、検索クエリーにおいて指定された情報の
場所を見つけるために文書を再検討することになる。多
数の文書が選択された場合または選択された1以上の文
書が大きい場合、それらの文書中のヒット個所を見つけ
るのはやっかいな作業となる場合がある。この問題を解
決するために、ある情報検索システムは、クエリーを再
実行して選択された文書中のヒット個所を含む部分を見
つけるためのローカル・サーチ・ユーティリティ(loca
l search utility)を提供している。
ル・サーチ・ユーティリティは、選択された文書につい
て余分な検索を要求するものである。したがって、情報
を自動的に検索する必要性および文書レベルで情報を検
索することについての先行技術に基づく制約に鑑み、自
動的に情報を検索するための代替的手法の開発が強く望
まれている。
て、文書の特定の部分を容易に検索可能にすることを目
的とする。
索する手法について以下に説明する。最初に、一組の文
書に基づいて一組の副文書が設定される。つぎに、一組
の副文書を対象として作用するクエリーが処理され、各
副文書に関するスコアが生成される。各副文書に関する
スコアは、対応する副文書のクエリーとの関連性を示す
ものである。スコアが検討され、副文書およびクエリー
間の最も高い関連性を示すスコアを有する副文書が検索
される。
応じて、副文書およびクエリー間でつぎに高い関連性を
示すスコアを有する副文書が検索される。それらの副文
書は、スコアに応じた順序でユーザに提示され得る。
エリー間の最も高い関連性を示すスコアを有する副文書
を含む文書が表示され、副文書の位置に自動的にスクロ
ールされる。ユーザの入力に基づいて、文書は、副文書
のスコアに基づいて他の副文書に自動的にスクロールさ
れる。それらの副文書のいずれかが別の文書内に含まれ
ている場合、その文書が自動的にロードされる。
項1の情報検索方法は、一組の文書から情報を検索する
ための情報検索方法において、a)一組の文書に基づい
て、各副文書が一組の文書中の一文書全体より小さい部
分に相当するように一組の副文書を決定する工程と、
b)一組の副文書を対象として作用するクエリーを処理
し、各副文書に対するスコアを生成して、各スコアによ
り対応する副文書のクエリーに対する関連性を表現する
工程と、c)各副文書のスコアに基づいて1以上の副文
書を検索する工程と、を含むものである。
1に記載の情報検索方法において、各副文書のスコアに
基づいて1以上の副文書を検索する工程が、第1の副文
書およびクエリー間の関連性が他の副文書およびクエリ
ー間の関連性より高いことを示す対応スコアを有する第
1の副文書を検索する工程を含むものである。
2に記載の情報検索方法において、さらに、第2の副文
書およびクエリー間の関連性が第1の副文書およびクエ
リー間の関連性より低いこと,ならびに第2の副文書お
よびクエリー間の関連性が他の副文書およびクエリー間
の関連性より高いことの両方を示す対応スコアを有する
第2の副文書を検索する工程を含むものである。
組の文書から情報を検索するコンピュータ・システムか
らなる情報検索システムにおいて、a)メモリと、b)
メモリに接続された1以上のプロセッサと、を備え、メ
モリが一組のコンピュータ命令を記憶し、一組のコンピ
ュータ命令が、1以上のプロセッサによって実行された
場合に、i)一組の文書に基づいて、各副文書が一組の
文書における一文書の少なくとも一部分に相当するよう
に一組の副文書を決定する工程と、ii)一組の副文書
を対象として作用するクエリーを処理し、各副文書に対
するスコアを生成して、各スコアにより対応する副文書
のクエリーに対する関連性を表現する工程と、iii)
各副文書のスコアに基づいて1以上の副文書を検索する
工程と、を1以上のプロセッサに実行させるものであ
る。
求項4に記載の情報検索システムにおいて、各副文書の
スコアに基づいて1以上の副文書を検索する工程を実行
するためのコンピュータ命令が、第1の副文書およびク
エリー間の関連性が他の副文書およびクエリー間の関連
性より高いことを示す対応スコアを有する第1の副文書
を検索する工程を実行するためのコンピュータ命令を含
むものである。
求項4に記載の情報検索システムにおいて、一組のコン
ピュータ命令が、さらに、第2の副文書およびクエリー
間の関連性が第1の副文書およびクエリー間の関連性よ
り低いこと,ならびに第2の副文書およびクエリー間の
関連性が他の副文書およびクエリー間の関連性より高い
ことの両方を示す対応スコアを有する第2の副文書を検
索する工程を実行するためのコンピュータ命令を含むも
のである。
索するための命令を記録したコンピュータ読み取り可能
な記録媒体は、一組の文書から情報を検索するための複
数の一連の命令を記録したコンピュータ読み取り可能な
記録媒体であって、複数の一連の命令は、1以上のプロ
セッサによって実行された場合に、a)一組の文書に基
づいて、各副文書が一組の文書中の一文書全体より小さ
い部分に相当するように一組の副文書を決定する工程
と、b)一組の副文書を対象として作用するクエリーを
処理し、各副文書に対するスコアを生成して、各スコア
により対応する副文書のクエリーに対する関連性を表現
する工程と、c)各副文書のスコアに基づいて1以上の
副文書を検索する工程と、を1以上のプロセッサに実行
させる一連の命令を含むものである。
索するための命令を記録したコンピュータ読み取り可能
な記録媒体は、請求項7に記載の一組の文書から情報を
検索するための命令を記録したコンピュータ読み取り可
能な記録媒体において、各副文書のスコアに基づいて1
以上の副文書を検索する工程が、第1の副文書およびク
エリー間の関連性が他の副文書およびクエリー間の関連
性より高いことを示す対応スコアを有する第1の副文書
を検索する工程を含むものである。
検索するための命令を記録したコンピュータ読み取り可
能な記録媒体は、請求項8に記載の一組の文書から情報
を検索するための命令を記録したコンピュータ読み取り
可能な記録媒体において、コンピュータ読み取り可能な
記録媒体が、さらに、第2の副文書およびクエリー間の
関連性が第1の副文書およびクエリー間の関連性より低
いこと,ならびに第2の副文書およびクエリー間の関連
性が他の副文書およびクエリー間の関連性より高いこと
の両方を示す対応スコアを有する第2の副文書を検索す
る工程を実行するための命令を含むものである。
報検索方法,情報検索システムおよび一組の文書から情
報を検索するための命令を記録したコンピュータ読み取
り可能な記録媒体の実施の形態について、添付の図面を
参照しつつ詳細に説明する。なお、ここでは、限定のた
めではなく例示のために本発明の実施の形態を図で示す
ことにし、これらの図において同一の構成要素には同一
の符号を付することにする。
おいては、本発明を完全に理解できるように具体的な詳
細について述べることにする。しかしながら、本発明が
これら特定詳細事項なしでも実施できることは明白であ
ろう。他の例は、不必要に発明を曖昧にすることを避け
るため、良く知られた構造および装置をブロック図の形
式で示すことにする。
副文書を対象として作用し、クエリーとどの程度関連し
ているかに基づいて各副文書にスコアをつけるクエリー
を処理するステップを含んでいる。各副文書は、ある文
書の少なくとも一部分を示すものである。
示されている。ステップS100においてスタートした
後、ステップS102において、照会される一組の文書
内の各文書について一組の副文書が決定される。つぎ
に、ステップS104において、一組の副文書に作用し
て各副文書にスコアをつけるクエリーが処理される。す
なわち、クエリーを処理することにより、クエリーを一
組の副文書に作用させ、各副文書にスコア付けを行う処
理が実行される。各副文書のスコアは、クエリーに対す
る副文書の関連性を示すものである。
てのスコアが調査される。ステップS108において、
「ベスト」スコアを有している副文書が検索される。
「ベスト」スコアを決定することは、クエリーが処理さ
れるコンテクスト(文脈:context )に依存するもので
ある。例えば、ある状況では、クエリーに対して最も関
連性の高い副文書を検索することが望ましいであろう。
一方、別の状況では、クエリーに対して最も関連性の低
い副文書を特定することが望ましい場合もある。
法について、図2〜図5を参照しつつより詳細に説明す
る。図2は、三つの文書202,204および206を
含む一組の文書200を示している。本発明の一実施の
形態によれば、ある文書は1以上の文字列またはより複
雑な言語要素を構成するために用いられる他の記号を含
むテキスト・ファイルである。例えば、文字列は、ワー
ド(word),フレーズ(phrase),センテンス(senten
ce)およびパラグラフ(paragraph )を構成し得る。文
書に含まれる言語要素は、いずれの特定の言語に関連し
た言語要素または形式に限定されることはない。
定される。ここで、各副文書はある文書の少なくともあ
る部分に相当するものである。例えば、テキストに基づ
く文書の文脈中において、副文書は、一文字(single c
haracter),いくつかのワード,センテンスまたは文書
全体に相当するものである。一組の副文書が複数の副文
書を含む場合、複数の副文書は、対応する文書の異なる
部分に相当し、かつ、いくつかの共通の情報に相当し得
る。加えて、副文書の境界の位置が、センテンスまたは
パラグラフの終わりのような文書属性の境界に対応して
いる必要はない。
文書208は文書202に基づいて決定され、副文書2
10,212,214,216,218および220を
含んでいる。図に示されているように、副文書212
は、副文書210と共通したいくつかの文書情報を含
み、また、副文書214と共通した他の文書情報を含ん
でいる。しかしながら、副文書212は、副文書210
および副文書214のいずれにも含まれていない情報を
含んでいる。
処理 前述したように、照会される一組の文書中の各文書に対
して一組の副文書が決定されると、クエリーが処理され
て、一組の副文書上でクエリーが機能するようになる。
すなわち、各副文書にスコア付けするため、クエリーが
一組の副文書を対象として作用する。クエリーが一組の
副文書上で機能すると、各副文書に対してスコアが生成
される。本発明の一実施の形態によれば、各副文書のス
コアは、クエリーに対する副文書の関連性を示すもので
ある。クエリーに基づいて目標文書にスコアリングする
いずれの周知の方法においても適用し得る。
に、図2の副文書210〜220は、それぞれ副文書2
08に対するクエリーの処理に基づいて生成された対応
するスコアと共に示されている。図3に示す表におい
て、より高いスコアは、対応する副文書のクエリーに対
する関連性がより高いという見込みを示すものである。
しかしながら、他のスコアリング方法を用いることも可
能である。
する副文書が検索される。前述したように、「ベスト」
スコアは、副文書およびクエリー間の関連性が最も高い
という見込みを示すものである。しかしながら、「ベス
ト」スコアは、特定の要求に基づいて、副文書およびク
エリー間の最も低い関連性を示す場合もある。例えば、
クエリーに対して比較的低い関連性を有する副文書を続
くクエリーの処理における考慮対象から排除できるよう
にするため、クエリーに対して比較的低い関連性を有す
る副文書を特定することが好ましいこともある。図3に
示すように、副文書218は0.47のスコアを有して
おり、0.91のスコアを有する副文書220よりクエ
リーに対する関連性が低いことを示している。0.75
のような予め設定された閾値より低いスコアを有するそ
れらの副文書は、考慮の対象から除外され得る。これに
より、副文書218および214が除外される。
を検討した後、ベストスコアを有する副文書が検索さ
れ、ユーザ・インターフェイスにおいてユーザに対して
表示される。図3に示した具体的なスコアにおいて、副
文書212が最も高いスコアを有している。したがっ
て、図4に示すように、副文書212が検索され、ユー
ザ・インターフェイス400上に表示される。
スコアを有する副文書が表示された後、ユーザはユーザ
・インターフェイス400を操作することにより、つぎ
のベストスコアを有する副文書を検索させ、表示させる
ことができる。例えば、ユーザ・インターフェイス「ボ
タン」をクリックまたは選択することにより、0.93
というつぎに高いスコアを有する副文書216が検索さ
れ、ユーザ・インターフェイス400上に表示される。
ば、複数の副文書は、それらのスコアに基づく順序でユ
ーザ・インターフェイス上に表示される。図5に示すよ
うに、0.98のスコアを有する副文書212がユーザ
・インターフェイス400の先頭近くで表示され、つぎ
に0.93のスコアを有する副文書216が表示され、
最後に0.91のスコアを有する副文書220が表示さ
れる。
ば、最も適切な副文書を含む文書が表示され、そして最
も適切な副文書の位置にスクロールされて最適な副文書
を表示する。図6に示すように、文書202はユーザ・
インターフェイス400上に表示されてスクロールされ
るため、副文書212がユーザ・インターフェイス40
0の上部(top )に現れることになる。加えて、ユーザ
の入力に応じて、文書202が自動的にスクロールさ
れ、つぎに最適な副文書がユーザ・インターフェイス4
00の上部に表示される。この例において、ユーザがつ
ぎに適切な副文書を要求する場合、文書202がスクロ
ールされ、副文書216がユーザ・インターフェイス4
00の上部に配置される。この機能は、ユーザに対し各
副文書のスコアに基づいて一組の副文書をたどって行く
ことを可能にする。これに代え、副文書を他の順序で表
示することもできる。例えば、前述したように、最低の
スコアを有する副文書、即ち最も関連性の低い副文書を
含む文書が表示される。そして、ユーザはスコアの昇順
に副文書をたどって行くことができる。
の)副文書が必ずしも一つの文書に含められる必要はな
い。それどころか、つぎに適切な副文書が他の文書に含
まれる場合であっても、ユーザの選択により(他の文書
に含まれる)つぎに適切な副文書が自動的に表示される
ことになる。例えば、図6に示したように、副文書21
2は最も高いスコアを有し、文書202内に含まれてい
る。ユーザは、この例において0.93のスコアを有す
る副文書216であるつぎに適切な副文書を見ることを
選択することができる。副文書216が他の文書に含ま
れている場合、その文書が自動的に表示されてスクロー
ルされ、その結果、副文書216がユーザ・インターフ
ェイス400の上部に表示されることになる。
ついて本発明の実施の形態を説明したが、本発明はま
た、複数の文書の部分に相当する副文書にも適用するこ
とができる。例えば、ある副文書が第1の文書の終わり
の部分と第2文書の冒頭の部分に相当することもある。
・システム(情報検索システム)500のブロック構成
図である。コンピュータ・システム500は、バス50
2または情報通信のための他の通信メカニズムと、情報
を処理するためにバス502に接続されたプロセッサ5
04と、を備えている。また、コンピュータ・システム
500は、情報およびプロセッサ504によって実行さ
れる命令を記憶できるようにバス502に接続されたラ
ンダム・アクセス・メモリ(RAM)または他の動的記
憶装置(dynamic storage device)のような主記憶装置
506を備えている。
04によって実行される命令の実行中に、一時的な変数
または他の中間的な情報を記憶するためにも使用し得
る。さらに、コンピュータ・システム500は、静的情
報およびプロセッサ504に対する命令を記憶するため
にバス502に接続されたリード・オンリー・メモリ
(ROM)508または他の静的記憶装置(static sto
rage device )を備えている。また、磁気ディスクまた
は光ディスクのような記憶装置510が設けられてお
り、バス502に接続されて情報および命令を記憶す
る。
2を介してブラウン管(CRT)のようなディスプレイ
512に接続され、コンピュータ・ユーザに対して情報
を表示する。英数字および他のキーを含む入力装置51
4はバス502に接続され、情報およびコマンドの選択
をプロセッサ504に伝える。他の種類のユーザ入力装
置として、マウス,トラックボールまたはカーソル方向
キーのようなカーソル・コントロール(カーソル制御装
置)516があり、指示情報およびコマンドの選択をプ
ロセッサ504に伝え、ディスプレイ512上における
カーソルの移動を制御する。この入力装置は、一般に、
二つの軸、即ち第1の軸(例えばx)および第2の軸
(例えばy)において2自由度を有し、平面上で位置を
指定することを可能にしている。
を使用し、副文書を用いて情報を検索することに関する
ものである。本発明の一実施の形態によれば、副文書を
用いた情報検索は、主記憶装置506に記憶された一連
の命令を実行するプロセッサ504に応じて、コンピュ
ータ・システム500によって提供される。このような
命令は、記憶装置510のような他のコンピュータ読み
取り可能な媒体から主記憶装置506に読み込むことが
できる。しかしながら、コンピューター読み取り可能な
媒体は、記憶装置510のような装置に限定されるもの
ではない。例えば、コンピューター読み取り可能な媒体
には、フロッピー・ディスク,フレキシブル・ディス
ク,ハード・ディスク,磁気テープ,もしくは他のあら
ゆる磁気媒体,CD−ROM,他のあらゆる光学媒体,
RAM,PROM,EPROM、FLASH−EPRO
M,他のいずれのメモリ・チップもしくはカートリッ
ジ、またはコンピュータが読み取り可能なあらゆる媒体
が含まれる。
を実行することは、プロセッサ504が前述した処理ス
テップを実行することである。他の実施の形態において
は、ソフトウエアの命令に代え、またはその命令と組み
合わせてハードワイヤード回路を使用することによって
本発明を実現することもできる。したがって、本発明の
実施の形態は、ハードウエア回路およびソフトウエアに
よるどのような特定の組合せにも限定されるものではな
い。
バス502に接続された通信インターフェイス518を
備えている。通信インターフェイス518は、ローカル
・ネット・ワーク522に接続されたネットワーク・リ
ンク520に接続し、双方向データ通信を提供する。例
えば、通信インターフェイス518として総合ディジタ
ル通信網(ISDN)カードまたはモデム等を用いるこ
とができ、対応する種類の電話線に対するデータ通信接
続を提供する。
18としてローカル・エリア・ネットワーク(LAN)
カードを用いることができ、互換性のあるLANに対す
るデータ通信接続を提供する。また、無線リンクでも実
現することができる。このようないずれのインプリメン
テーションにおいても、通信インターフェイス518
は、種々の情報を表すディジタル・データ・ストリーム
を伝送する電気的,電磁気的または光学的信号を送受信
する。
1以上のネットワークを介して他のデータ装置とデータ
通信を行う。例えば、ネットワーク・リンク520は、
ローカル・ネットワーク522を介してホスト・コンピ
ュータ524またはインターネット・サービス・プロバ
イダ(ISP)526によって操作されるデータ装置に
対する接続を提供し得る。
に「インターネット」528と呼ばれる世界的なパケッ
ト・データ通信網を介して、データ通信サービスを提供
する。ローカル・ネットワーク522およびインターネ
ット528は、両方ともディジタル・データ・ストリー
ムを伝送する電気的,電磁気的または光学的信号を利用
する。ディジタル・データをコンピュータ・システム5
00におよびコンピュータ・システム500から搬送す
る様々なネットワークを介した信号ならびにネットワー
ク・リンク520上および通信インターフェイス518
を介した信号は、情報を搬送する搬送波の典型的な形式
である。
ワーク,ネットワーク・リンク520および通信インタ
ーフェイス518を介して、プログラム・コードを含む
メッセージを送信すると共に、データを受信することが
できる。インターネットの例において、サーバ530
は、インターネット528,ISP526,ローカル・
ネットワーク522および通信インターフェイス518
を介し、アプリケーション・プログラムのために要求さ
れたコードを送信するかもしれない。本発明によれば、
このようなダウンロードされたアプリケーションは、こ
こで説明された副文書を利用した情報検索を提供する。
サ504によって処理され、かつ/または記憶装置51
0もしくは他の不揮発性記憶装置内に後の実行に備えて
記憶される。このように、コンピュータ・システム50
0は、搬送波の形でアプリケーション・コードを得るこ
とができる。
いくつかの利点を提供する。副文書を使用することは、
全文書を検索する代わりに、副文書のスコアに基づいて
文書の特定の部分(副文書)を検索することを可能にす
る。そして、ユーザは、副文書のスコアに基づいて各副
文書をたどって行くことができる。これに代え、一定の
検索基準を満たすスコアを有する副文書を含む文書が表
示され、自動的にスクロールされて最も適切な副文書が
表示されるようにすることができる。そして、ユーザ
は、ユーザ・インターフェイスに対して要求を出すこと
により、つぎの副文書に進んで操作することができる。
これによってユーザは、クエリーが処理される1以上の
文書の最も関連性の高いある部分(副文書)を迅速に見
ることができる。
てその特定の実施の形態に関連して説明した。しかしな
がら、本発明の幅広い精神および範囲から逸脱すること
なく、本発明について様々な修正および変更が可能であ
ることは明白であろう。したがって、本明細書および図
面は、限定的なものではなく例示のためのものであると
みなされるべきである。
方法,情報検索システムおよび一組の文書から情報を検
索するための命令を記録したコンピュータ読み取り可能
な記録媒体によれば、副文書を使用することにより、全
文書を検索する代わりに、副文書のスコアに基づいて文
書の特定の部分(副文書)を検索することができる。そ
の結果、ユーザは、副文書のスコアに基づいて各副文書
をたどって行くことができる。また、一定の検索基準を
満たすスコアを有する副文書を含む文書が表示され、自
動的にスクロールされて最も適切な副文書が表示される
ようにすることができる。その結果、ユーザは、ユーザ
・インターフェイスに対して要求を出すことにより、つ
ぎの副文書に進んで操作することができる。このよう
に、本発明によれば、ユーザは、クエリーが処理される
1以上の文書の最も関連性の高いある部分(副文書)を
迅速に見ることができる。
報検索方法を示すフロー・チャートである。
文書および一組の文書を示す説明図である。
した一組の副文書と関連する一組のスコアを示す説明図
である。
文書からの一つの副文書を検索する処理を示す説明図で
ある。
文書から1以上の副文書を検索する処理を示す説明図で
ある。
副文書から1以上の副文書を検索する処理を示す説明図
である。
ータ・システムのブロック構成図である。
文書 400 ユーザ・インターフェイス 500 コンピュータ・システム 502 バス 504 プロセッサ 506 主記憶装置 508 ROM 510 記憶装置 512 ディスプレイ 514 入力装置 516 カーソル・コントロール 518 通信インターフェイス 520 ネットワーク・リンク 522 ローカル・ネットワーク 524 ホスト・コンピュータ 526 インターネット・サービス・プロバイダ(IS
P) 528 インターネット 530 サーバ
Claims (9)
- 【請求項1】 一組の文書から情報を検索するための情
報検索方法において、 一組の文書に基づいて、各副文書が一組の文書中の一文
書全体より小さい部分に相当するように一組の副文書を
決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
各副文書に対するスコアを生成して、各スコアにより対
応する副文書のクエリーに対する関連性を表現する工程
と、 各副文書のスコアに基づいて1以上の副文書を検索する
工程と、 を含むことを特徴とする情報検索方法。 - 【請求項2】 各副文書のスコアに基づいて1以上の副
文書を検索する工程は、第1の副文書およびクエリー間
の関連性が他の副文書およびクエリー間の関連性より高
いことを示す対応スコアを有する第1の副文書を検索す
る工程を含むことを特徴とする請求項1に記載の情報検
索方法。 - 【請求項3】 さらに、第2の副文書およびクエリー間
の関連性が第1の副文書およびクエリー間の関連性より
低いこと,ならびに第2の副文書およびクエリー間の関
連性が他の副文書およびクエリー間の関連性より高いこ
との両方を示す対応スコアを有する第2の副文書を検索
する工程を含むことを特徴とする請求項2に記載の情報
検索方法。 - 【請求項4】 一組の文書から情報を検索するコンピュ
ータ・システムからなる情報検索システムにおいて、 メモリと、 メモリに接続された1以上のプロセッサと、 を備え、 メモリは一組のコンピュータ命令を記憶し、一組のコン
ピュータ命令は、1以上のプロセッサによって実行され
た場合に、 一組の文書に基づいて、各副文書が一組の文書における
一文書の少なくとも一部分に相当するように一組の副文
書を決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
各副文書に対するスコアを生成して、各スコアにより対
応する副文書のクエリーに対する関連性を表現する工程
と、 各副文書のスコアに基づいて1以上の副文書を検索する
工程と、 を1以上のプロセッサに実行させることを特徴とする情
報検索システム。 - 【請求項5】 各副文書のスコアに基づいて1以上の副
文書を検索する工程を実行するためのコンピュータ命令
は、第1の副文書およびクエリー間の関連性が他の副文
書およびクエリー間の関連性より高いことを示す対応ス
コアを有する第1の副文書を検索する工程を実行するた
めのコンピュータ命令を含むことを特徴とする請求項4
に記載の情報検索システム。 - 【請求項6】 一組のコンピュータ命令は、さらに、第
2の副文書およびクエリー間の関連性が第1の副文書お
よびクエリー間の関連性より低いこと,ならびに第2の
副文書およびクエリー間の関連性が他の副文書およびク
エリー間の関連性より高いことの両方を示す対応スコア
を有する第2の副文書を検索する工程を実行するための
コンピュータ命令を含むことを特徴とする請求項4に記
載の情報検索システム。 - 【請求項7】 一組の文書から情報を検索するための複
数の一連の命令を記録したコンピュータ読み取り可能な
記録媒体であって、複数の一連の命令は、1以上のプロ
セッサによって実行された場合に、 一組の文書に基づいて、各副文書が一組の文書中の一文
書全体より小さい部分に相当するように一組の副文書を
決定する工程と、 一組の副文書を対象として作用するクエリーを処理し、
各副文書に対するスコアを生成して、各スコアにより対
応する副文書のクエリーに対する関連性を表現する工程
と、 各副文書のスコアに基づいて1以上の副文書を検索する
工程と、 を1以上のプロセッサに実行させる一連の命令を含むこ
とを特徴とする一組の文書から情報を検索するための命
令を記録したコンピュータ読み取り可能な記録媒体。 - 【請求項8】 各副文書のスコアに基づいて1以上の副
文書を検索する工程は、第1の副文書およびクエリー間
の関連性が他の副文書およびクエリー間の関連性より高
いことを示す対応スコアを有する第1の副文書を検索す
る工程を含むことを特徴とする請求項7に記載の一組の
文書から情報を検索するための命令を記録したコンピュ
ータ読み取り可能な記録媒体。 - 【請求項9】 コンピュータ読み取り可能な記録媒体
は、さらに、第2の副文書およびクエリー間の関連性が
第1の副文書およびクエリー間の関連性より低いこと,
ならびに第2の副文書およびクエリー間の関連性が他の
副文書およびクエリー間の関連性より高いことの両方を
示す対応スコアを有する第2の副文書を検索する工程を
実行するための命令を含むことを特徴とする請求項8に
記載の一組の文書から情報を検索するための命令を記録
したコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/900641 | 1997-07-25 | ||
US08/900,641 US5999925A (en) | 1997-07-25 | 1997-07-25 | Information retrieval based on use of sub-documents |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH11110415A true JPH11110415A (ja) | 1999-04-23 |
Family
ID=25412859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10140773A Pending JPH11110415A (ja) | 1997-07-25 | 1998-05-22 | 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 |
Country Status (2)
Country | Link |
---|---|
US (3) | US5999925A (ja) |
JP (1) | JPH11110415A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1210675A4 (en) * | 1999-05-20 | 2005-03-23 | Evres Ltd | INFORMATION MANAGEMENT, REPEATING AND DISPLAY SYSTEM AND RELATED METHOD |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3597370B2 (ja) * | 1998-03-10 | 2004-12-08 | 富士通株式会社 | 文書処理装置および記録媒体 |
WO1999057654A1 (fr) * | 1998-05-06 | 1999-11-11 | Matsushita Electric Industrial Co., Ltd. | Procede et systeme d'emission/reception de donnees numeriques |
US6366658B1 (en) | 1998-05-07 | 2002-04-02 | Mci Communications Corporation | Telecommunications architecture for call center services using advanced interactive voice responsive service node |
JP4034037B2 (ja) * | 1998-09-10 | 2008-01-16 | 富士通株式会社 | 書面審議装置および書面審議システム、並びにコンピュータを書面審議装置として動作させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US7013300B1 (en) | 1999-08-03 | 2006-03-14 | Taylor David C | Locating, filtering, matching macro-context from indexed database for searching context where micro-context relevant to textual input by user |
US7219073B1 (en) * | 1999-08-03 | 2007-05-15 | Brandnamestores.Com | Method for extracting information utilizing a user-context-based search engine |
US6775665B1 (en) * | 1999-09-30 | 2004-08-10 | Ricoh Co., Ltd. | System for treating saved queries as searchable documents in a document management system |
US6651058B1 (en) * | 1999-11-15 | 2003-11-18 | International Business Machines Corporation | System and method of automatic discovery of terms in a document that are relevant to a given target topic |
US8321496B2 (en) * | 1999-12-13 | 2012-11-27 | Half.Com, Inc. | User evaluation of content on distributed communication network |
US7356604B1 (en) * | 2000-04-18 | 2008-04-08 | Claritech Corporation | Method and apparatus for comparing scores in a vector space retrieval process |
US7139977B1 (en) * | 2001-01-24 | 2006-11-21 | Oracle International Corporation | System and method for producing a virtual online book |
US20040003028A1 (en) * | 2002-05-08 | 2004-01-01 | David Emmett | Automatic display of web content to smaller display devices: improved summarization and navigation |
US6738764B2 (en) * | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results |
EP1276061A1 (en) * | 2001-07-09 | 2003-01-15 | Accenture | Computer based system and method of determining a satisfaction index of a text |
US7426509B2 (en) * | 2002-11-15 | 2008-09-16 | Justsystems Evans Research, Inc. | Method and apparatus for document filtering using ensemble filters |
US7356187B2 (en) * | 2004-04-12 | 2008-04-08 | Clairvoyance Corporation | Method and apparatus for adjusting the model threshold of a support vector machine for text classification and filtering |
WO2005103950A1 (en) * | 2004-04-20 | 2005-11-03 | Newsouth Innovations Pty Limited | A method and apparatus for indexing documents |
US8799107B1 (en) * | 2004-09-30 | 2014-08-05 | Google Inc. | Systems and methods for scoring documents |
US20060149710A1 (en) | 2004-12-30 | 2006-07-06 | Ross Koningstein | Associating features with entities, such as categories of web page documents, and/or weighting such features |
US8027876B2 (en) | 2005-08-08 | 2011-09-27 | Yoogli, Inc. | Online advertising valuation apparatus and method |
US8429167B2 (en) * | 2005-08-08 | 2013-04-23 | Google Inc. | User-context-based search engine |
US20070112898A1 (en) * | 2005-11-15 | 2007-05-17 | Clairvoyance Corporation | Methods and apparatus for probe-based clustering |
US7902542B2 (en) * | 2006-06-14 | 2011-03-08 | 3M Innovative Properties Company | Adapted LED device with re-emitting semiconductor construction |
US20080222513A1 (en) * | 2007-03-07 | 2008-09-11 | Altep, Inc. | Method and System for Rules-Based Tag Management in a Document Review System |
US20080222141A1 (en) * | 2007-03-07 | 2008-09-11 | Altep, Inc. | Method and System for Document Searching |
US7895197B2 (en) | 2007-04-30 | 2011-02-22 | Sap Ag | Hierarchical metadata generator for retrieval systems |
US7937663B2 (en) * | 2007-06-29 | 2011-05-03 | Microsoft Corporation | Integrated collaborative user interface for a document editor program |
US20090287668A1 (en) * | 2008-05-16 | 2009-11-19 | Justsystems Evans Research, Inc. | Methods and apparatus for interactive document clustering |
US9081831B2 (en) * | 2012-03-30 | 2015-07-14 | Google Inc. | Methods and systems for presenting document-specific snippets |
US20140075299A1 (en) * | 2012-09-13 | 2014-03-13 | Google Inc. | Systems and methods for generating extraction models |
US9607038B2 (en) * | 2013-03-15 | 2017-03-28 | International Business Machines Corporation | Determining linkage metadata of content of a target document to source documents |
EP3217811A4 (en) | 2014-11-10 | 2018-06-13 | Smithfield Foods Inc. | Mehtod and system for processing ready-to-eat bacon with pan fried bacon characteristics |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2790466B2 (ja) * | 1988-10-18 | 1998-08-27 | 株式会社日立製作所 | 文字列検索方法及び装置 |
US5325298A (en) * | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems |
US5559940A (en) * | 1990-12-14 | 1996-09-24 | Hutson; William H. | Method and system for real-time information analysis of textual material |
US5293552A (en) * | 1991-04-08 | 1994-03-08 | U.S. Philips Corporation | Method for storing bibliometric information on items from a finite source of text, and in particular document postings for use in a full-text document retrieval system |
US5267156A (en) * | 1991-12-05 | 1993-11-30 | International Business Machines Corporation | Method for constructing a knowledge base, knowledge base system, machine translation method and system therefor |
US5325296A (en) * | 1992-12-18 | 1994-06-28 | General Electric Company | Step size in complete data scanning path for three dimensional computerized tomography |
US5331556A (en) * | 1993-06-28 | 1994-07-19 | General Electric Company | Method for natural language data processing using morphological and part-of-speech information |
US5384703A (en) * | 1993-07-02 | 1995-01-24 | Xerox Corporation | Method and apparatus for summarizing documents according to theme |
DE69424902T2 (de) * | 1993-08-20 | 2000-11-09 | Canon Kk | Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche |
US5692176A (en) * | 1993-11-22 | 1997-11-25 | Reed Elsevier Inc. | Associative text search and retrieval system |
US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
US5724571A (en) * | 1995-07-07 | 1998-03-03 | Sun Microsystems, Inc. | Method and apparatus for generating query responses in a computer-based document retrieval system |
US6026388A (en) * | 1995-08-16 | 2000-02-15 | Textwise, Llc | User interface and other enhancements for natural language information retrieval system and method |
US5675788A (en) * | 1995-09-15 | 1997-10-07 | Infonautics Corp. | Method and apparatus for generating a composite document on a selected topic from a plurality of information sources |
-
1997
- 1997-07-25 US US08/900,641 patent/US5999925A/en not_active Expired - Fee Related
-
1998
- 1998-05-22 JP JP10140773A patent/JPH11110415A/ja active Pending
-
1999
- 1999-09-03 US US09/390,245 patent/US6115706A/en not_active Expired - Fee Related
-
2000
- 2000-08-25 US US09/645,954 patent/US6377947B1/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1210675A4 (en) * | 1999-05-20 | 2005-03-23 | Evres Ltd | INFORMATION MANAGEMENT, REPEATING AND DISPLAY SYSTEM AND RELATED METHOD |
Also Published As
Publication number | Publication date |
---|---|
US6115706A (en) | 2000-09-05 |
US5999925A (en) | 1999-12-07 |
US6377947B1 (en) | 2002-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH11110415A (ja) | 情報検索方法,情報検索システムおよび一組の文書から情報を検索するための命令を記録したコンピュータ読み取り可能な記録媒体 | |
US7096218B2 (en) | Search refinement graphical user interface | |
US8825694B2 (en) | Mobile device retrieval and navigation | |
US6832350B1 (en) | Organizing and categorizing hypertext document bookmarks by mutual affinity based on predetermined affinity criteria | |
JP5237335B2 (ja) | 対話形サーチクエリー改良のためのシステム及び方法 | |
KR100672277B1 (ko) | 개인화 검색 방법 및 검색 서버 | |
US20040215612A1 (en) | Semi-boolean arrangement, method, and system for specifying and selecting data objects to be retrieved from a collection | |
US20020059297A1 (en) | Search formulation user interface | |
JPH11102376A (ja) | 検索照会に関係のあるデータベースから抽出されたテキストを自動表示する方法および装置 | |
US20050044065A1 (en) | Method and apparatus for enabling national language support of a database engine | |
US7089233B2 (en) | Method and system for searching for web content | |
US20040249632A1 (en) | Method and system for natural language recognition command interface and data management | |
JP2008198237A (ja) | 構造化文書管理システム | |
JPH11272683A (ja) | 検察処理装置および記憶媒体 | |
JP3767763B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4091586B2 (ja) | 構造化文書管理システム、索引構築方法及びプログラム | |
JP4000332B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3415214B2 (ja) | 文書検索装置 | |
JP2006163645A (ja) | 情報検索方法、情報検索装置、情報検索プログラム及びコンピュータで読み取り可能な記録媒体並びに記録した機器 | |
JP3195183B2 (ja) | 情報検索方法及びその装置 | |
JP2001344246A (ja) | 用語集データベース作成方法および電子文書検索方法 | |
JP2007025831A (ja) | コンテンツ検索装置及びその方法 | |
JP2002099573A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 | |
JPH08249356A (ja) | データベース検索システム | |
JPH10254892A (ja) | 文書検索・利用方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080430 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080724 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080729 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081104 |