JP4138048B2 - 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP4138048B2
JP4138048B2 JP19961397A JP19961397A JP4138048B2 JP 4138048 B2 JP4138048 B2 JP 4138048B2 JP 19961397 A JP19961397 A JP 19961397A JP 19961397 A JP19961397 A JP 19961397A JP 4138048 B2 JP4138048 B2 JP 4138048B2
Authority
JP
Japan
Prior art keywords
document
search
displayed
screen
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19961397A
Other languages
English (en)
Other versions
JPH1145253A (ja
Inventor
和宣 浮川
初子 浮川
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP19961397A priority Critical patent/JP4138048B2/ja
Publication of JPH1145253A publication Critical patent/JPH1145253A/ja
Application granted granted Critical
Publication of JP4138048B2 publication Critical patent/JP4138048B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、ワードプロセッサ等で編集中の文書の任意の範囲を指定し、指定した範囲をクエリー(Query)として検索処理を実行できるようにし、編集中の文書に関連する情報を検索する場合等における検索処理の利便性の向上を図ると共に、検索処理によって得た文書を効率良く画面表示することができるようにした情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0002】
【従来の技術】
コンピュータの発達に伴って、紙を媒体として記録され、また保存されていた文書についても、電子化された情報として取り扱うことが一般的となり、大量の電子化された文書がデータベースに蓄積されることとなっている。
【0003】
ところで、大量の電子化された文書が蓄積されていくに従って、大量の文書の中から所望の文書を容易に探し出すことができる検索技術が重要となってくる。特に、誰もがコンピュータを用いて作業を行う今日にあっては、特殊な手法を用いることなく、コンピュータの初心者であっても簡単に所望の文書を検索できるような検索システムを構築することが重要なポイントとなる。
【0004】
検索の容易化を図るための1つの手法として、人間が通常用いる自然言語を用いてクエリー(Query)と呼ばれる検索文を入力することができるようにする技術を挙げることができる。この技術は、近年の自然言語処理技術の発達に伴って、多くの検索システムに取り入れられつつある。
【0005】
【発明が解決しようとする課題】
しかしながら、従来の検索システムによれば、自然言語でクエリーを入力できるようにして入力作業の容易化を図ることができるが、ワードプロセッサ等で編集を行っている文書に関連する情報を検索して参照したいような場合にあっては、検索ソフトを別に起動させた後、クエリーを入力して検索処理を行う必要があるため、このような状況での検索処理の利便性に欠けるという問題点があった。
【0006】
また、検索結果は、通常、検索条件に該当する文書のリストを表示することによって画面表示されるため、検索によって得た文書を閲覧する場合には、文書の形式に対応したアプリケーションプログラムをいちいち起動させる処理を行って、表示しなければならないという問題点があった。
【0007】
本発明は上記に鑑みてなされたものであって、ワードプロセッサ等で編集中の文書の任意の範囲を指定し、指定した範囲をクエリーとして検索処理を実行できるようにして、編集中の文書に関連する情報を検索する場合等における検索処理の利便性の向上を図ることを目的とする。
【0008】
また、本発明は上記に鑑みてなされたものであって、検索処理によって得た文書を効率良く画面表示することができるようにすることを目的とする。
【0009】
さらに、本発明は上記に鑑みてなされたものであって、ユーザに検索という意識を持たせることなく、検索処理の実行および検索結果の表示を可能にすることを目的とする。
【0010】
【課題を解決するための手段】
上記目的を達成するため、の情報検索装置は、任意の情報を検索するための検索条件に基づいて、該当する情報の検索処理を行う情報検索装置において、画面表示されている文書の任意の範囲を指定する範囲指定手段と、前記範囲指定手段で指定された範囲の文字列の構造を解析する解析手段と、前記解析手段による解析結果に基づいて、前記指定された範囲の文字列を用いて前記検索条件を生成する検索条件生成手段と、前記検索条件生成手段で生成された検索条件を入力し、入力した検索条件に基づいて検索処理を行い、検索結果から文書リストを生成する文書リスト生成手段と、前記文書リスト生成手段で生成した文書リストのランキングに基づいて、上位のランキングの文書から順に、該当する文書の作成時に使用したアプリケーションプログラムを起動させて画面表示する表示制御手段と、を備えたものである。
【0011】
また、の情報検索装置は、上記の情報検索装置において、さらに、前記表示制御手段で表示中の文書を文書リスト中における上位のランキングまたは/および下位のランキングの文書に切り替える指定を行う切替指定手段を備え、前記表示制御手段が、前記切替指定手段で文書を切り替える指定があった場合に、該当する文書に切り替えて画面表示するものである。
【0012】
さらに、のコンピュータ読み取り可能な記録媒体は、上記の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したものである。
【0013】
【発明の実施の形態】
以下、本発明の情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体の一実施の形態について、添付の図面を参照しつつ詳細に説明する。
【0014】
図1は、本実施の形態の情報検索装置のシステム構成図である。図1に示す情報検索装置は、所望の文書を検索するための検索条件を出力する複数のクライアント100と、文書DB(データベース)101から転置ファイル102を生成すると共に、ベクトル空間検索を行うことができる検索エンジン(例えば、CLARITECH社のCLARIT等)を備え、クライアント100から検索条件を入力し、入力した検索条件に基づいて、転置ファイル102を用いて該当する文書を検索する検索サーバ103と、上記クライアント100や検索サーバ103等を接続するネットワーク104と、から構成されている。
【0015】
図1において、文書DB101は、クライアント100等で作成された複数の文書(情報)を格納したものであり、格納される文書は、ワープロ文書や、SGML,HTML等の構造化文書等、いかなる種類の文書であっても良い。本実施の形態においては、この文書DB101中の文書を検索対象とするが、検索対象を文書DB101中の文書に限定するものではない。
【0016】
転置ファイル102は、文書DB101中の複数の文書と、これら複数の文書それぞれから後述する方法で抽出した複数の索引語との関係を規定し、ある索引語が各文書それぞれにおいてどの程度重要な語彙であるかをベクター表現を用いて示したものであって、この索引語を用いて該当する文書を検索することができるようにしたものである。
【0017】
具体的には、1つの文書を予め複数のセンテンスからなるサブドキュメント単位に区切り、サブドキュメントから上記索引語となる名詞句を抽出して、抽出した名詞句それぞれについて、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いて各サブドキュメントをベクター表現する。そして、変換したサブドキュメントのベクター表現に基づいて、文書のベクター表現を生成する。転置ファイル102は、このようにしてベクター表現された文書DB101中の文書を格納するものである。
【0018】
なお、各索引語には、対応する文書中の重要度に応じた重み付けを行うことができる。また、文書のベクター表現については、実際の検索を行う際に、サブドキュメントのベクター表現に基づいて生成することにしても良い。
【0019】
クライアント100および検索サーバ103は、パーソナルコンピュータやワークステーション等によって構成される。図2は、クライアント100の処理を示す概略ブロック図である。クライアント100は、ワードプロセッサ,表計算ソフト等のアプリケーションプログラムで編集作業中の文書において、任意の範囲を指定し、指定した範囲の文字列をクエリー200として検索の開始を指定するマウス等の入力装置207と、クエリー200を入力し、入力したクエリー200について、品詞情報等を格納した辞書202および各単語の係り受け等を解析するための文法辞書203を用いて形態素解析,構文解析等の解析処理を行い、上記転置ファイル102の索引語に対応する名詞句からなる検索条件206を生成し、生成した検索条件206を検索サーバ103に出力する自然言語処理モジュール201を備えている。
【0020】
また、図3は、検索サーバ103の処理を示す概略ブロック図である。検索サーバ103は、文書DB101中の文書を転置ファイル102に登録する処理と、ベクトル空間検索を利用した検索処理とを行うものである。
【0021】
この検索サーバ103は、文書DB101から文書を入力し、文書のフォーマットの認識処理や、品詞情報等を格納した辞書301および各単語の係り受け等を解析するための文法辞書302を用いて形態素解析,構文解析,名詞句抽出等の解析処理を行い、上述したサブドキュメント毎の名詞句リストを含むドキュメント・セット303を生成する自然言語処理モジュール300と、自然言語処理モジュール300で生成したドキュメント・セット303を入力し、入力したドキュメント・セット303中の各サブドキュメントをベクター表現に変換すると共に、サブドキュメントのベクター表現に基づいて、文書のベクター表現を生成して転置ファイル102に登録するデータベース・ビルド・コンポーネント304と、クライアント100から検索条件206を入力し、入力した検索条件206を構成する各名詞句について、クエリー200中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた統計情報を用いて検索条件206をベクター表現に変換したクエリー・ドキュメント306を生成するクエリー・ビルド・コンポーネント305と、クエリー・ビルド・コンポーネント305で生成したクエリー・ドキュメント306を入力し、転置ファイル102中の各文書のベクトルとクエリー・ドキュメント306のベクトルとを比較して、クエリー・ドキュメント306との類似度に応じたスコアを各文書に付与し、所定の閾値を超えるスコアが付与された文書リスト308を検索結果として出力する検索エンジン307と、を備えている。
【0022】
なお、図1においては、文書DB101および転置ファイル102をネットワーク104に単独に接続した構成を示したが、これらを検索サーバ103に直接接続する構成としても良い。また、図1においては、本実施の形態の情報検索装置をネットワーク104を介したシステムで構成するように示したが、図2に示したクライアント100の処理を図3に示した検索サーバ103の自然言語処理モジュール300に行わせるように構成することにより、1台のコンピュータで本実施の形態の情報検索装置を構成することができる。
【0023】
次に、上述した構成を備えた情報検索装置の動作について、(1)転置ファイルの生成処理,(2)文書検索処理の順で詳細に説明する。
【0024】
(1)転置ファイルの生成処理
図4は、転置ファイルの生成処理を示すフローチャートである。検索サーバ103は、クライアント100等によって作成された新たな文書が文書DB101に登録された場合(S401)、この文書を入力して転置ファイル102に登録するための処理を開始する(S402)。
【0025】
検索サーバ103において、自然言語処理モジュール300は、ステップS402で入力した文書を解析する処理を行う(S403)。具体的には、入力した文書がワープロ文書,HTML等の構造化文書等、いかなるフォーマットの文書であるかを判定する処理を行う。その後、辞書301および文法辞書302を用いて形態素解析,係り受け等の構文解析を行い、文書を複数のサブドキュメントに区分すると共に、区分したサブドキュメントから名詞句を抽出する等の処理を行う。
【0026】
そして、自然言語処理モジュール300は、ステップS403における処理の結果に基づいて、サブドキュメント毎に名詞句リストを生成し、生成した名詞句リストを含むドキュメント・セット303を生成する(S404)。
【0027】
その後、データベース・ビルド・コンポーネント304は、自然言語処理モジュール300で生成したドキュメント・セット303を入力し、文書のベクター表現を転置ファイル102に登録する処理を行う(S405)。
【0028】
具体的には、ドキュメント・セット303中のサブドキュメントの各名詞句を転置ファイル102の索引語として、サブドキュメント中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた名詞句毎の統計情報を用いてサブドキュメントをベクター表現に変換する。この処理をドキュメント・セット303中の全てのサブドキュメントについて行い、変換したサブドキュメントのベクター表現に基づいて、文書のベクター表現を生成して転置ファイル102に登録する。
【0029】
(2)文書検索処理
続いて、文書検索処理について説明する。図5は、文書検索処理を示すフローチャートである。ユーザは、現在ワードプロセッサ等で編集中の文書(画面表示されている文書)において、クライアント100の入力装置207を用いて任意の範囲を指定し(S501)、指定した範囲の文字列をクエリー200とする検索処理の実行を指定する(S502)。
【0030】
図6(a)は、ステップS501において、クエリー200とする範囲の指定を行った様子を、図6(b)は、検索処理の実行を指定する様子をそれぞれ示す説明図である。図6(a)に示すように、ユーザは、入力装置207としてのマウス等を用いて、文書600中の任意の範囲601を指定する。クエリー200となる範囲601を指定する際には、図6に示すように段落を単位としたもの以外に、全文書,ページ全体,エンベット,オブジェクト,編集中の文書に関連づけられた文書,URL等、いかなる範囲のものを指定しても良い。また、範囲601は、1つだけではなく、複数箇所を指定することができる。複数範囲が指定された場合には、指定された複数の範囲を1つのクエリー200として扱うことになる。さらに、クエリー200となる範囲601を指定する際に、ユーザは、検索結果に反映して欲しい重要な事項が記述された範囲601に正の重み付けを行うための指定を行うことができ、また、検索結果に反映して欲しくない不必要な事項が記述された範囲601に負の重み付けを行うための指定を行うことができる。
【0031】
そして、ユーザは、図6(b)に示すように、入力装置207であるマウスの右ボタンをクリックしてメニュー602を開き、「検索」を選択することによって検索処理の実行を指定する。ここでは、図6(b)に示すようにメニュー602を開いて検索処理の実行を指定することにしたが、検索処理の実行を指定するためのアイコンを用意しておくことにしても良い(後に説明する図8参照)。
【0032】
図5に戻り、ステップS502で検索処理の実行が指定されると、自然言語処理モジュール201は、指定された範囲601の文字列をクエリー200として入力し、入力したクエリー200の解析処理を行う(S503)。具体的には、辞書202および文法辞書203を用いて形態素解析,係り受け等の構文解析処理を行う。
【0033】
続いて、自然言語処理モジュール201は、ステップS503における解析結果に基づいて、クエリー200から検索条件を生成する(S504)。すなわち、自然言語モジュール201は、指定された範囲601の文字列から、転置ファイル102中の索引語に対応する名詞句を抽出し、名詞句からなる検索条件206を生成する。
【0034】
上述したようにしてクエリー200から検索条件206が生成され、生成された検索条件206は、クライアント100から検索サーバ103に出力される。また、上述したように、選択した範囲601に重みの指定がなされた場合には、その重み指定情報についても、検索サーバ103に出力される。
【0035】
その後、検索サーバ103のクエリー・ビルド・コンポーネント305は、クライアント100から検索条件206を入力し、入力した検索条件206を構成する各名詞句について、クエリー200中の出現頻度,文書DB101全体における分布等の統計情報を求め、求めた統計情報を用いて検索条件206をベクター表現に変換したクエリー・ドキュメント306を生成する(S505)。なお、重み付けの指定がなされている場合には、該当する名詞句に正の重みまたは負の重みを付加して上記クエリー・ドキュメント306を生成する。
【0036】
検索エンジン307は、クエリー・ビルド・コンポーネント305で生成したクエリー・ドキュメント306を入力し、転置ファイル102中の各文書のベクトルとクエリー・ドキュメント306のベクトルを比較して、クエリー・ドキュメント306との類似度に応じたスコアを各文書に付与する(S506)。
【0037】
なお、類似度に応じたスコアは、各文書とクエリー・ドキュメント306との類似度を余弦距離に基づいて表現したものであり、スコアが大きい文書がよりクエリー・ドキュメント306と類似していることを表している。また、ユーザによって指定された重みは、この検索処理で利用され、スコアの値に反映されることになる。
【0038】
そして、検索エンジン307は、予め設定されたスコアの閾値に基づいて、閾値を超えるスコアが付与された文書を選択し、選択した文書に基づいて、文書リスト308を生成して、検索結果として出力する(S507)。
【0039】
図7は、文書リスト308の一例を示す説明図である。図7に示すように、文書リスト308には、クエリー・ドキュメント306との類似度に応じたスコアのランキング,文書名およびいかなるアプリケーションプログラムで作成されたかを示す文書の種類が表示されている。
【0040】
クライアント100は、検索エンジン307から文書リスト308を入力し、入力した文書リスト308に基づいて、上位のランキングの文書から順に、該当する文書の作成時に使用したアプリケーションプログラムを起動させて画面表示する(S508)。
【0041】
図8は、検索された文書をアプリケーションプログラムを起動させて表示した様子を示す説明図である。図8において、800は、フローティングボタンを示し、このフローティングボタン800には、次の文書を表示するための次文書ボタン801,前の文書を表示するための前文書ボタン802および前述した検索処理の実行を指定するための検索実行ボタン803が設けられている。
【0042】
検索エンジン103から出力された文書リスト308は、ユーザがクエリー200として指定した範囲の文字列に最も類似した文書から順に並べたものであるため、次文書ボタン801をマウス等でクリックすると、現在表示されている文書の次に類似度の高い文書を表示することができる。一方、前文書ボタン802をマウス等でクリックすると、現在表示されている文書より類似度の高い文書を表示することができる。すなわち、次文書ボタン801または前文書ボタン802をクリックすることにより、アプリケーションプログラムのウィンドウが切り替わり、またはアプリケーションプログラム自体が他のアプリケーションプログラムに切り替わり、次の文書または前の文書を表示することができる。
【0043】
なお、図7に示す文書リスト308中に例えば同一のワードプロセッサを用いて作成された文書が複数存在する場合、文書の数だけそのワードプロセッサを起動させるのではなく、そのワードプロセッサが文書の数に応じたウィンドウを開いて、複数の文書を画面表示することにしても良い。
【0044】
また、図8に示すフローティングボタン800を表示した状態で文書中の任意の範囲を指定し、検索実行ボタン803をクリックすることにより、上述した検索処理,アプリケーションプログラムによる文書の表示処理が自動的に実行される。その結果、ユーザに検索を意識させることなく、検索処理の実行および検索結果の表示が可能となり、あたかも文書間に仮想的なリンクが形成されているような状態を作り出すことができる。
【0045】
また、本実施の形態では、クライアント100が検索結果である文書リスト308を入力した場合に、自動的にアプリケーションプログラムを起動させて文書を画面表示することとしたが、文書リスト308をポップアップで画面表示し、ユーザが所望の文書を選択することにより、該当するアプリケーションプログラムが起動して、選択された文書を画面表示することにしても良い。
【0046】
このように、本実施の形態の情報検索装置によれば、編集中の文書600の任意の範囲601を指定し、指定した範囲601をクエリー200として検索処理を行うことができるため、検索ソフトを起動させ、クエリー200を新たに入力するという手間を省くことができ、検索処理の利便性の向上を図ることができる。また、編集作業中の文書600に関連する事項を検索して参照したい場合に、文書中の該当する範囲を指定し、検索処理の実行を指定するだけで、容易に参照文献を得ることができる。さらに、画面表示されている文書600を直接クエリー200として用いることができるため、検索のための操作を直感的にかつ容易に行うことができる。
【0047】
また、文書600中の任意の範囲601を指定することによって検索処理を実行でき、得られた検索結果に基づいて、上位のランキングの文書から順に、該当する文書の作成時に使用したアプリケーションプログラムを起動させて画面表示するため、ユーザに検索を意識させることなく、検索処理の実行および検索結果の表示が可能となり、あたかも文書間に仮想的なリンクが形成されているような状態を作り出すことができる。
【0048】
なお、図5を用いて説明したようにして検索した結果をさらなる検索対象とし、文書600中の任意の範囲を指定して、検索結果の絞り込みを行うことができる。
【0049】
また、マウス等で文書600をドラッグしながらクエリー200となる範囲601を増加させつつ検索処理を行うこともできる。すなわち、検索結果を参照しつつ、クエリー200を変化させ、変更されたクエリー200に対する検索結果をリアルタイムで得ることができるように構成することもできる。
【0050】
また、本実施の形態においては、ベクトル空間法による検索を例にとって説明したが、クエリー200を解析した結果を用いて、ANDやORで検索条件206を表現することにより、ブーリアン検索も行うことができる。
【0051】
また、上述した本実施の形態の情報検索装置で得た検索結果である文書リスト308において、ユーザが検索結果としてふさわしいと思う文書やふさわしくないと思う文書については、その結果を検索サーバ103にフィードバックすることができる。すなわち、ユーザは、検索結果としてふさわしいと思う文書に対して、正の重み、例えば「+」を指定することができ、検索結果としてふさわしくないと思う文書に対して負の重み、例えば「−」を指定することができる。その結果、入力した重みが正の指定である場合には、転置ファイル102中の該当する文書の重みが強化され、入力した重みが負の指定である場合には、文書の重みが弱められる。
【0052】
さらに、本実施の形態で説明した情報検索装置は、予め用意されたプログラムをコンピュータやワークステーションで実行することによって実現される。このプログラムは、ハードディスク,フロッピーディスク,CD−ROM,MO,DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、このプログラムは、上記記録媒体を介して、またはネットワークを介して配布することができる。
【0053】
【発明の効果】
以上説明したように、本発明の情報検索装置によれば、画面表示されている文書の任意の範囲を指定する範囲指定手段と、範囲指定手段で指定された範囲の文字列の構造を解析する解析手段と、解析手段による解析結果に基づいて、指定された範囲の文字列を用いて検索条件を生成する検索条件生成手段と、検索条件生成手段で生成された検索条件を入力し、入力した検索条件に基づいて検索処理を行い、検索結果から文書リストを生成する文書リスト生成手段と、文書リスト生成手段で生成した文書リストのランキングに基づいて、上位のランキングの文書から順に、該当する文書の作成時に使用したアプリケーションプログラムを起動させて画面表示する表示制御手段と、を備えたため、ワードプロセッサ等で編集中の文書の任意の範囲を指定し、指定した範囲をクエリーとして検索処理を実行できるようにして、編集中の文書に関連する情報を検索する場合等における検索処理の利便性の向上を図ることができると共に、検索処理によって得た文書を効率良く画面表示することができる。その結果、ユーザに検索を意識させることなく、検索処理の実行および検索結果の表示が可能となり、あたかも文書間に仮想的なリンクが形成されているような状態を作り出すことができる。
【0054】
また、本発明の情報検索装置によれば、上記の情報検索装置において、さらに、表示制御手段で表示中の文書を文書リスト中における上位のランキングまたは/および下位のランキングの文書に切り替える指定を行う切替指定手段を備え、表示制御手段は、切替指定手段で文書を切り替える指定があった場合に、該当する文書に切り替えて画面表示するため、検索結果の表示の切り替えを容易に行うことができる。
【0055】
さらに、本発明のコンピュータ読み取り可能な記録媒体によれば、上記の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したため、記録したプログラムをコンピュータに実行させることにより、ワードプロセッサ等で編集中の文書の任意の範囲を指定し、指定した範囲をクエリーとして検索処理を実行できるようにして、編集中の文書に関連する情報を検索する場合等における検索処理の利便性の向上を図ることができると共に、検索処理によって得た文書を効率良く画面表示することができる情報検索装置を得ることができる。
【図面の簡単な説明】
【図1】本実施の形態の情報検索装置のシステム構成図である。
【図2】図1に示したクライアントの処理を示す概略ブロック図である。
【図3】図1に示した検索サーバの処理を示す概略ブロック図である。
【図4】本実施の形態の情報検索装置において、転置ファイルの生成処理を示すフローチャートである。
【図5】本実施の形態の情報検索装置において、文書検索処理を示すフローチャートである。
【図6】本実施の形態の情報検索装置において、(a)は、クエリーとする範囲の指定を行った様子を、(b)は、検索処理の実行を指定する様子をそれぞれ示す説明図である。
【図7】本実施の形態の情報検索装置において、検索結果として出力される文書リストの一例を示す説明図である。
【図8】本実施の形態の情報検索装置において、検索された文書をアプリケーションプログラムを起動させて表示した様子を示す説明図である。
【符号の説明】
100 クライアント
101 文書DB
102 転置ファイル
103 検索サーバ
104 ネットワーク
200 クエリー
201,300 自然言語処理モジュール
202,301 辞書
203,302 文法辞書
206 検索条件
207 入力装置
303 ドキュメント・セット
304 データベース・ビルド・コンポーネント
305 クエリー・ビルド・コンポーネント
306 クエリー・ドキュメント
307 検索エンジン
308 文書リスト
600 文書
601 範囲
602 メニュー
800 フローティングボタン
801 次文書ボタン
802 前文書ボタン
803 検索実行ボタン

Claims (2)

  1. 任意の情報を検索するための検索条件をベクター表現に変換したクエリードキュメントに基づいて、ベクトル空間法を用いて該当する情報の検索処理を行う検索手段を備えた情報検索装置において、
    新たな文書が文書データベースに登録された場合に、前記新たな文書のベクター表現を生成して登録する転置ファイル手段と、
    画面表示されている文書の任意の範囲の指定および検索処理の実行指示を受け付ける入力手段と、
    前記入力手段で指定された範囲の文字列の構造を解析する解析手段と、
    前記解析手段による解析結果に基づいて、前記指定された範囲の文字列を用いて前記検索条件を生成する検索条件生成手段と、
    前記検索条件生成手段で生成された検索条件を入力し、入力した検索条件をベクター表現に変換したクエリードキュメントと前記転置ファイル手段によって登録されたベクター表現との類似度が閾値を超える文書に前記類似度に応じたスコアのランキングを付した文書リストを生成する文書リスト生成手段と、
    前記文書リスト生成手段で生成した文書リストのランキングに基づいて、類似度の高い上位のランキングの文書を当該文書の作成時に使用したアプリケーションプログラムを起動させて画面表示するとともに、画面表示された文書と同一画面内に当該文書の次の文書または前の文書を表示するための第1の操作ボタンおよび新たな検索処理の実行を指示するための第2の操作ボタンを画面表示する表示制御手段と、
    前記第1の操作ボタンの押下によって、前記表示制御手段で表示中の文書を文書リスト中における類似度の高い上位のランキングまたは類似度の低い下位のランキングの文書に切り替える指定を受け付ける切替指定手段と、
    を備え、
    前記入力手段は、前記表示制御手段によって新たに表示された文書の任意の範囲の指定および前記第2の操作ボタンの押下による新たな検索処理の実行指示を受け付け、
    前記表示制御手段は、
    前記入力手段によって新たに表示された文書の任意の範囲の指定および新たな検索処理の実行指示があった場合は、当該指定された範囲の文字列に基づいて、前記解析手段、前記検索条件生成手段、及び、前記文書リスト生成手段によって新たに文書リストを生成し、当該新たに生成された文書リストのランキングに基づいて、類似度の高い上位のランキングの文書を当該文書の作成時に使用したアプリケーションプログラムを起動させて画面表示するとともに、
    前記切替指定手段によって文書を切り替える指定があった場合は、該当する文書を当該文書の作成時に使用したアプリケーションプログラムを起動させて画面表示することを特徴とする情報検索装置。
  2. 前記請求項1に記載の情報検索装置の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP19961397A 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP4138048B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19961397A JP4138048B2 (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19961397A JP4138048B2 (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JPH1145253A JPH1145253A (ja) 1999-02-16
JP4138048B2 true JP4138048B2 (ja) 2008-08-20

Family

ID=16410777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19961397A Expired - Fee Related JP4138048B2 (ja) 1997-07-25 1997-07-25 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP4138048B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1826614B (zh) * 2003-05-20 2011-06-15 日本胜利株式会社 电子化服务指南显示控制方法和装置
JP5332128B2 (ja) * 2007-03-30 2013-11-06 富士通株式会社 情報検索装置、情報検索方法およびそのプログラム
US9015140B2 (en) * 2010-12-30 2015-04-21 Yahoo! Inc. System and method for providing contextual actions on a search results page

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314954A (ja) * 1995-05-16 1996-11-29 Canon Inc 情報処理方法及び装置
JP2749790B2 (ja) * 1995-03-28 1998-05-13 株式会社エイ・ティ・アール音声翻訳通信研究所 並列テキスト検索システム
JPH09101969A (ja) * 1995-10-06 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 適合フィードバックを用いた全文検索方法および装置
JP3186960B2 (ja) * 1995-11-30 2001-07-11 松下電器産業株式会社 情報検索方法およびその装置
JP3606401B2 (ja) * 1995-11-30 2005-01-05 富士通株式会社 文書検索装置および方法

Also Published As

Publication number Publication date
JPH1145253A (ja) 1999-02-16

Similar Documents

Publication Publication Date Title
US6381593B1 (en) Document information management system
US7958128B2 (en) Query-independent entity importance in books
JP3691844B2 (ja) 文書処理方法
JP5744873B2 (ja) トラステッドクエリのシステムおよび方法
JP6176017B2 (ja) 検索装置、検索方法、およびプログラム
US20020083045A1 (en) Information retrieval processing apparatus and method, and recording medium recording information retrieval processing program
JP2006510968A (ja) テキスト及び画像の意味解釈のためのグラフィカル・フィードバック
JP4065346B2 (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3767763B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JPH11296537A (ja) 情報検索システム、情報提供装置、情報検索端末装置、情報検索方法および記憶媒体
JP4499179B1 (ja) 端末装置
JPH1145252A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4138048B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145257A (ja) Web文書の検索支援装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003108584A (ja) 情報検索システム及びプログラム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3851712B2 (ja) 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145269A (ja) 文書管理支援システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145255A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP4384736B2 (ja) 画像検索装置およびその装置の各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1145254A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100885527B1 (ko) 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법
JP4497337B2 (ja) 概念検索装置およびコンピュータプログラムを記録した記録媒体
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070925

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees