JPH04281566A - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JPH04281566A JPH04281566A JP3069323A JP6932391A JPH04281566A JP H04281566 A JPH04281566 A JP H04281566A JP 3069323 A JP3069323 A JP 3069323A JP 6932391 A JP6932391 A JP 6932391A JP H04281566 A JPH04281566 A JP H04281566A
- Authority
- JP
- Japan
- Prior art keywords
- document
- candidate
- data
- keyword
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013500 data storage Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 claims description 12
- 239000012536 storage buffer Substances 0.000 abstract description 38
- 230000014509 gene expression Effects 0.000 abstract description 8
- 239000000872 buffer Substances 0.000 description 18
- 238000000034 method Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
[発明の目的]
【0001】
【産業上の利用分野】本発明は、文書データベースの中
からユーザの目的とする文書を効率よく検索することが
可能な文書検索装置に関する。
からユーザの目的とする文書を効率よく検索することが
可能な文書検索装置に関する。
【0002】
【従来の技術】大型コンピュータあるいはワークステー
ションを用いた文書検索システムが実用化されている。
ションを用いた文書検索システムが実用化されている。
【0003】このような文書検索装置において文書の検
索を行なう場合には、まずユーザはキーワードを入力す
る。その後、装置側が入力されたキーワードを、本文中
に含んでいるか、あるいは検索キーとしてヘッダ部分に
含んでいる文書をデータベースの中から捜し出し、その
検索結果をユーザに与える。
索を行なう場合には、まずユーザはキーワードを入力す
る。その後、装置側が入力されたキーワードを、本文中
に含んでいるか、あるいは検索キーとしてヘッダ部分に
含んでいる文書をデータベースの中から捜し出し、その
検索結果をユーザに与える。
【0004】ところで、条件を満たす文書が複数個見つ
かった場合には、ユーザはさらにこのうなかから必要な
ものを選び出す必要がある。そのため、装置側は、捜し
出された各文書のタイトルおよび各文書に付属する文書
情報あるいはアブストラクトなどの文書内容リストを文
書番号とともに列挙表示し、ユーザはここに付加されて
いる文書内容を参照して、各文書が目的にあったものか
否かの判断を行なってから文書本体を閲覧している。
かった場合には、ユーザはさらにこのうなかから必要な
ものを選び出す必要がある。そのため、装置側は、捜し
出された各文書のタイトルおよび各文書に付属する文書
情報あるいはアブストラクトなどの文書内容リストを文
書番号とともに列挙表示し、ユーザはここに付加されて
いる文書内容を参照して、各文書が目的にあったものか
否かの判断を行なってから文書本体を閲覧している。
【0005】
【発明が解決しようとする課題】上記したように、従来
の検索装置においては、候補文書が複数ある場合に、装
置側が与えた文書内容リストなどを参照して、ユーザが
必要なものを選択するという形態が採られているが、文
書内容リストが文書の内容を的確に表現しているケース
が少なく、また、ユーザの必要とする記述が本文中に存
在してもそれが文書のタイトルあるいはヘッダ情報に表
されていないケースもあった。特に、候補文書数が増え
た場合には、目的とする文書を検索するまでに要するユ
ーザの負担は大きかった。また、文書内容リスト中に詳
しく各文書の内容を表現すると、文書内容リストの表示
量自体が大きくなり、表示画面の表示領域に収まらず、
ユーザは画面のスクロールなどを頻繁に行なわなければ
ならないといった操作上の不具合も生じていた。
の検索装置においては、候補文書が複数ある場合に、装
置側が与えた文書内容リストなどを参照して、ユーザが
必要なものを選択するという形態が採られているが、文
書内容リストが文書の内容を的確に表現しているケース
が少なく、また、ユーザの必要とする記述が本文中に存
在してもそれが文書のタイトルあるいはヘッダ情報に表
されていないケースもあった。特に、候補文書数が増え
た場合には、目的とする文書を検索するまでに要するユ
ーザの負担は大きかった。また、文書内容リスト中に詳
しく各文書の内容を表現すると、文書内容リストの表示
量自体が大きくなり、表示画面の表示領域に収まらず、
ユーザは画面のスクロールなどを頻繁に行なわなければ
ならないといった操作上の不具合も生じていた。
【0006】本発明は、上記事情に鑑みてなされたもの
で、文書内容リスト中に各文書の内容を的確に、かつ最
少限の記述量で表現できる文書検索装置を提供すること
を目的とする。
で、文書内容リスト中に各文書の内容を的確に、かつ最
少限の記述量で表現できる文書検索装置を提供すること
を目的とする。
【0007】[発明の構成]
【0008】
【課題を解決するための手段】本発明は、上記目的を達
成するために、テキスト・データや図表データなどから
なる文書データを格納する文書データ格納手段と、この
文書データ格納手段に格納されている文書データを検索
するキーワードを入力するキーワード入力手段と、この
キーワード入力手段から入力されたキーワードを含む文
書を上記文書データ格納手段の中から検索するキーワー
ドサーチ手段とを備えた文書検索装置において、上記各
文書データごとに上記キーワードサーチ手段によって抽
出された上記キーワードを含む候補文とこの候補文に含
まれるキーワード数を格納する格納手段と、この格納手
段に格納されている上記キーワード数を参照し最大のキ
ーワード数を含む候補文をを候補文書リストの要素とし
て表示する候補文書一覧表示手段と、この候補文書一覧
表示手段で表示された文書一覧における上記要素の一つ
を指定する文書選択手段と、この文書選択手段で指定さ
れた文書に対応する文書データの内容を表示する文書表
示手段とを具備したことを特徴とする。
成するために、テキスト・データや図表データなどから
なる文書データを格納する文書データ格納手段と、この
文書データ格納手段に格納されている文書データを検索
するキーワードを入力するキーワード入力手段と、この
キーワード入力手段から入力されたキーワードを含む文
書を上記文書データ格納手段の中から検索するキーワー
ドサーチ手段とを備えた文書検索装置において、上記各
文書データごとに上記キーワードサーチ手段によって抽
出された上記キーワードを含む候補文とこの候補文に含
まれるキーワード数を格納する格納手段と、この格納手
段に格納されている上記キーワード数を参照し最大のキ
ーワード数を含む候補文をを候補文書リストの要素とし
て表示する候補文書一覧表示手段と、この候補文書一覧
表示手段で表示された文書一覧における上記要素の一つ
を指定する文書選択手段と、この文書選択手段で指定さ
れた文書に対応する文書データの内容を表示する文書表
示手段とを具備したことを特徴とする。
【0009】
【作用】本発明は上記のように構成したので、キーワー
ドを用いることにことによって得られた複数の候補文書
データの中から目的とするものを選ぶ場合に、候補文書
リストの要素としてキーワードをテキスト中の周囲の語
と対応づけて表示することにより、文書中でのそのキー
ワードの現われ方が明示表現され、文書全体の内容が目
的に合致したものかどうかの判断が的確に行なわれると
ともに、表示画面上での占有面積が小さくなる。
ドを用いることにことによって得られた複数の候補文書
データの中から目的とするものを選ぶ場合に、候補文書
リストの要素としてキーワードをテキスト中の周囲の語
と対応づけて表示することにより、文書中でのそのキー
ワードの現われ方が明示表現され、文書全体の内容が目
的に合致したものかどうかの判断が的確に行なわれると
ともに、表示画面上での占有面積が小さくなる。
【0010】
【実施例】以下、図面を参照して本発明の実施例を説明
する。
する。
【0011】図1は、本発明の一実施例の文書検索装置
の構成を示すブロック図である。
の構成を示すブロック図である。
【0012】同図に示すように、文書検索装置は、入力
装置1 、表示装置2 、文書データ格納装置3 、制
御装置4 、およびメモリ5から構成される。
装置1 、表示装置2 、文書データ格納装置3 、制
御装置4 、およびメモリ5から構成される。
【0013】入力装置1 は、文字コード・制御コマン
ド・位置情報などを入力する装置で、例えばキーボード
1aとマウス1bおよびこれらを制御する装置で構成さ
れる。
ド・位置情報などを入力する装置で、例えばキーボード
1aとマウス1bおよびこれらを制御する装置で構成さ
れる。
【0014】表示装置2 は、ユーザに入力を行なわせ
るためのプロンプトメッセージ、入力された文字列、あ
るいは検索の後に得られた文書データなどの表示を行な
うものであり、例えばVRAMと、このVRAMに格納
されたビット情報をドット列として表示するためのディ
スプレイからなっている。
るためのプロンプトメッセージ、入力された文字列、あ
るいは検索の後に得られた文書データなどの表示を行な
うものであり、例えばVRAMと、このVRAMに格納
されたビット情報をドット列として表示するためのディ
スプレイからなっている。
【0015】文書データ格納装置3 は、各文書データ
を格納するためのものであり、例えばハードディスク装
置などからなる。この文書格納装置3 における文書デ
ータの格納形式を図2に示す。1個の文書データは、文
書中のテキスト情報のみを含むテキストデータ部3aと
イメージデータ、フォーマット情報などを含む非テキス
トデータ部3bからなり、文書データ格納装置3 には
このような形式の文書データが複数個格納されている。 すなわち、複数の文書データ31,32,…,3n は
、それぞれテキストデータ部31a,32a,…,3n
aと非テキストデータ部31b,32b,…,3nbか
らなる形式で文書データ格納装置3 に格納されている
。
を格納するためのものであり、例えばハードディスク装
置などからなる。この文書格納装置3 における文書デ
ータの格納形式を図2に示す。1個の文書データは、文
書中のテキスト情報のみを含むテキストデータ部3aと
イメージデータ、フォーマット情報などを含む非テキス
トデータ部3bからなり、文書データ格納装置3 には
このような形式の文書データが複数個格納されている。 すなわち、複数の文書データ31,32,…,3n は
、それぞれテキストデータ部31a,32a,…,3n
aと非テキストデータ部31b,32b,…,3nbか
らなる形式で文書データ格納装置3 に格納されている
。
【0016】制御装置4 は、例えばCPUなどからな
るもので、入力装置1 、表示装置2 、文書データ格
納装置3 、およびメモリ5とバスにより接続されてお
り、各装置の制御、装置間のデータの転送などの制御や
処理を行なうものである。
るもので、入力装置1 、表示装置2 、文書データ格
納装置3 、およびメモリ5とバスにより接続されてお
り、各装置の制御、装置間のデータの転送などの制御や
処理を行なうものである。
【0017】メモリ5 は、例えばダイナミックRAM
からなり、図3に示すように、制御装置4 が各種制御
や処理を実行するためのプログラムを格納するプログラ
ム部5aと、処理の際に必要なデータをバッファするバ
ッファ部5bとからなっている。さらに、プログラム部
5aは、メイン処理部5c、初期化部5d、キーワード
入力部5e、キーワードサーチ部5f、候補文書一覧表
示部5g、文書選択部5h、および文書表示部5iのモ
ジュールに分割され、また、データバッファ部5bは、
キーワード格納バッファ5j、キーワードサーチ用バッ
ファ5k、候補文書格納バッファ5l、候補文書数格納
バッファ5m、候補文格納バッファ5n、および表示文
格納バッファ5pから構成される。以下、プログラム部
5aとバッファ部5bの各部の機能について説明する。
からなり、図3に示すように、制御装置4 が各種制御
や処理を実行するためのプログラムを格納するプログラ
ム部5aと、処理の際に必要なデータをバッファするバ
ッファ部5bとからなっている。さらに、プログラム部
5aは、メイン処理部5c、初期化部5d、キーワード
入力部5e、キーワードサーチ部5f、候補文書一覧表
示部5g、文書選択部5h、および文書表示部5iのモ
ジュールに分割され、また、データバッファ部5bは、
キーワード格納バッファ5j、キーワードサーチ用バッ
ファ5k、候補文書格納バッファ5l、候補文書数格納
バッファ5m、候補文格納バッファ5n、および表示文
格納バッファ5pから構成される。以下、プログラム部
5aとバッファ部5bの各部の機能について説明する。
【0018】メイン処理部5cは、装置全体の処理の制
御を司どるものであり、プログラムの分岐、初期化部5
d以下の各モジュールの呼び出し(起動)などを行ない
、また、初期化部5dは、各ハードウェア装置の初期設
定およびデータバッファ部5bを構成する各バッファの
内容の初期化を行なう。
御を司どるものであり、プログラムの分岐、初期化部5
d以下の各モジュールの呼び出し(起動)などを行ない
、また、初期化部5dは、各ハードウェア装置の初期設
定およびデータバッファ部5bを構成する各バッファの
内容の初期化を行なう。
【0019】キーワード入力部5eは、入力装置1 の
キーボード1aを介してユーザに検索の際にキーとなる
キーワードである文字列を入力させ、これをキーワード
格納バッファ5jに格納する。
キーボード1aを介してユーザに検索の際にキーとなる
キーワードである文字列を入力させ、これをキーワード
格納バッファ5jに格納する。
【0020】キーワードサーチ部5fは、文書データ格
納装置3 に格納されている文書データを格納されてい
る順序で読み出してキーワードサーチ用バッファ5kに
格納し、キーワード格納バッファ5iに格納されている
文字列を含む文書データをキーワードサーチ用バッファ
5k上で捜しだす。この検索の結果、得られる複数の文
書データを候補文書データとして候補文書格納バッファ
5lに格納する。
納装置3 に格納されている文書データを格納されてい
る順序で読み出してキーワードサーチ用バッファ5kに
格納し、キーワード格納バッファ5iに格納されている
文字列を含む文書データをキーワードサーチ用バッファ
5k上で捜しだす。この検索の結果、得られる複数の文
書データを候補文書データとして候補文書格納バッファ
5lに格納する。
【0021】候補文書一覧表示部5gは、候補文書格納
バッファ5lに格納されている各候補文書データの内容
を表わす表現(以下、文書内容表現と称す)を表示装置
2 の表示画面上に列挙表示する。すなわち、文書内容
表現は、候補文書一覧の要素として表示画面上に列挙表
示される。
バッファ5lに格納されている各候補文書データの内容
を表わす表現(以下、文書内容表現と称す)を表示装置
2 の表示画面上に列挙表示する。すなわち、文書内容
表現は、候補文書一覧の要素として表示画面上に列挙表
示される。
【0022】文書選択部5hは、すでに候補文書一覧表
示部5gによって列挙表示されている文書内容表現のい
ずれか一つをユーザに選択させる。
示部5gによって列挙表示されている文書内容表現のい
ずれか一つをユーザに選択させる。
【0023】文書表示部5iは、文書選択部5hによっ
て選択された文書内容表現に対応する文書データを候補
文書格納バッファ5lより読み出し、テキスト・図表な
どを表示装置2 の表示画面上に表示する。
て選択された文書内容表現に対応する文書データを候補
文書格納バッファ5lより読み出し、テキスト・図表な
どを表示装置2 の表示画面上に表示する。
【0024】候補文書数格納バッファ5mは、候補文書
格納バッファ5lに含まれる文書データ数を格納するバ
ッファである。
格納バッファ5lに含まれる文書データ数を格納するバ
ッファである。
【0025】さらに、候補文格納バッファ5nは、表示
対象の候補となる文データおよびこの文データに含まれ
るキーワード数を格納するバッファでおり、また、表示
文格納バッファ5pは、候補文書一覧の要素として表示
する文データを格納するバッファである。
対象の候補となる文データおよびこの文データに含まれ
るキーワード数を格納するバッファでおり、また、表示
文格納バッファ5pは、候補文書一覧の要素として表示
する文データを格納するバッファである。
【0026】次に、上記構成の文書検索装置の具体的な
処理動作について、図4の処理の流れを示すフローチャ
ートを参照し説明する。
処理動作について、図4の処理の流れを示すフローチャ
ートを参照し説明する。
【0027】処理全体の制御はメイン処理部5cが司ど
っており、メイン処理部5cはまず初期化部5dを起動
する。 起動された初期化部5dはバッファ部5bのキーワード
格納バッファ5j、キーワードサーチ用バッファ5kお
よび候補文書格納バッファ5lの初期化、候補文書数格
納バッファ5mの内容のクリア、入力装置1 と表示装
置2 の初期設定などを行なう。さらに、コマンド入力
のために必要な各種のアイコンの表示も行なう。(ステ
ップS1)。
っており、メイン処理部5cはまず初期化部5dを起動
する。 起動された初期化部5dはバッファ部5bのキーワード
格納バッファ5j、キーワードサーチ用バッファ5kお
よび候補文書格納バッファ5lの初期化、候補文書数格
納バッファ5mの内容のクリア、入力装置1 と表示装
置2 の初期設定などを行なう。さらに、コマンド入力
のために必要な各種のアイコンの表示も行なう。(ステ
ップS1)。
【0028】続いて、メイン処理部5cはキーワード入
力部5eを起動する。起動されたキーワード入力部5e
はユーザに入力装置1 のキーボード1aを介してコー
ド列からなるキーワードを一般に複数個入力させる。入
力されたコード列に対して、カナ漢字変換などの処理を
施し、得られた文字列をキーワード格納バッファ5jに
格納する。キーワードが入力されキーワード格納バッフ
ァ5jに格納された後、処理はステップS3に移行する
。(ステップS2)。
力部5eを起動する。起動されたキーワード入力部5e
はユーザに入力装置1 のキーボード1aを介してコー
ド列からなるキーワードを一般に複数個入力させる。入
力されたコード列に対して、カナ漢字変換などの処理を
施し、得られた文字列をキーワード格納バッファ5jに
格納する。キーワードが入力されキーワード格納バッフ
ァ5jに格納された後、処理はステップS3に移行する
。(ステップS2)。
【0029】ステップS3ではキーワードサーチ部5f
が起動される。起動されたキーワードサーチ部5fは、
文書データ格納装置3 に格納されている文書データを
格納されている順序、例えば最初に文書データ31を読
み出し、キーワードサーチ用バッファ5kに格納する。 さらに、キーワードサーチ部5fは、キーワードサーチ
用バッファ5kに格納されいる文書データ31のテキス
トデータ部31a を参照し、この中にキーワード格納
バッファ5jに格納されている複数のキーワードのいず
れかの文字列と同一の文字列が含まれているか否かを調
べる。含まれている場合には、キーワードサーチ用バッ
ファ5kに格納されいる文書データ31全体を候補文書
格納バッファ5lに候補文書として格納し、候補文書数
格納バッファ5mの内容を“1”増加させる。続いて、
キーワードサーチ部5fは、文書データ32から文書デ
ータ3nまでの文書データに対して上記した一連の処理
を順次実行する。すなわち、文書データ格納装置3 に
格納されている全ての文書データに対して上記処理を実
行する。(ステップS3)。
が起動される。起動されたキーワードサーチ部5fは、
文書データ格納装置3 に格納されている文書データを
格納されている順序、例えば最初に文書データ31を読
み出し、キーワードサーチ用バッファ5kに格納する。 さらに、キーワードサーチ部5fは、キーワードサーチ
用バッファ5kに格納されいる文書データ31のテキス
トデータ部31a を参照し、この中にキーワード格納
バッファ5jに格納されている複数のキーワードのいず
れかの文字列と同一の文字列が含まれているか否かを調
べる。含まれている場合には、キーワードサーチ用バッ
ファ5kに格納されいる文書データ31全体を候補文書
格納バッファ5lに候補文書として格納し、候補文書数
格納バッファ5mの内容を“1”増加させる。続いて、
キーワードサーチ部5fは、文書データ32から文書デ
ータ3nまでの文書データに対して上記した一連の処理
を順次実行する。すなわち、文書データ格納装置3 に
格納されている全ての文書データに対して上記処理を実
行する。(ステップS3)。
【0030】上記ステップS3における処理が終了する
と、候補文書格納バッファ5lの内容が参照され、ステ
ップS2で入力されたキーワードをそのテキストデータ
に含む文書データが存在するか否か、すなわち、候補文
書が存在するか否かが調べられる。条件が満たされなか
った(候補文書が存在しない)場合には処理はステップ
S5に、また、条件が満たされた(候補文書が存在する
)場合には処理はステップS6にそれぞれ移行する。(
ステップS4)。
と、候補文書格納バッファ5lの内容が参照され、ステ
ップS2で入力されたキーワードをそのテキストデータ
に含む文書データが存在するか否か、すなわち、候補文
書が存在するか否かが調べられる。条件が満たされなか
った(候補文書が存在しない)場合には処理はステップ
S5に、また、条件が満たされた(候補文書が存在する
)場合には処理はステップS6にそれぞれ移行する。(
ステップS4)。
【0031】ステップS5においては、該当する文書が
見つからなかった旨を示すメッセージを表示装置2 の
表示画面上に表示した後、処理をステップS2に戻して
ユーザに新たなキーワードを入力させ、上記処理を繰り
返す。
見つからなかった旨を示すメッセージを表示装置2 の
表示画面上に表示した後、処理をステップS2に戻して
ユーザに新たなキーワードを入力させ、上記処理を繰り
返す。
【0032】ステップS6においては、候補文書一覧表
示部5gが起動され、候補文書一覧表示部5gは候補文
書格納バッファ5lに格納されている各文書データのテ
キストデータ部の内容を参照して、文書ごとに候補文書
一覧の要素としてその文書内容表現を表示する。文書内
容表現は文字列から構成されており、各文書内容表現は
後の処理のために表示装置2 の画面上の矩形領域の内
部に格納し、この矩形の輪郭を表示する。このステップ
S6は、ステップS61 〜S64 の4ステップから
なっており、以下、ステップS6における処理について
詳述する。
示部5gが起動され、候補文書一覧表示部5gは候補文
書格納バッファ5lに格納されている各文書データのテ
キストデータ部の内容を参照して、文書ごとに候補文書
一覧の要素としてその文書内容表現を表示する。文書内
容表現は文字列から構成されており、各文書内容表現は
後の処理のために表示装置2 の画面上の矩形領域の内
部に格納し、この矩形の輪郭を表示する。このステップ
S6は、ステップS61 〜S64 の4ステップから
なっており、以下、ステップS6における処理について
詳述する。
【0033】まず、候補文書格納バッファ5lに格納さ
れている文書データのテキストデータ部の内容を参照し
て、キーワード格納バッファ5iに格納されている文字
列からなる複数のキーワードのいずれかを含む箇所を抽
出して候補文格納バッファ5nに格納する。この候補文
格納バッファ5nは、図5に示すように、文字列格納部
5na とキーワード数格納部5nb とから構成され
る。抽出されたキーワードを含む各候補文は文字列格納
部5na に格納される。抽出される単位は文、つまり
テキストデータ中で句点(「。」)で区切られる単位で
ある。候補文を文字列格納部5na に格納すると同時
に、各候補文における該当するキーワードを含む部分の
個数がカウントされ、そのカウント値がキーワード数格
納部5nb に格納される。 このとき、各候補文において、同一のキーワードを含む
部分は“1”としてカウントされる。すなわち、各候補
文に含まれるキーワードの種類がカウントされることに
なる。ここで、図6に示す原テキストデータ10から、
「ワークステーション」と「データベース」の2語をキ
ーワードとして、候補文とキーワード数を抽出した例を
図7に示す。(ステップS61 )。
れている文書データのテキストデータ部の内容を参照し
て、キーワード格納バッファ5iに格納されている文字
列からなる複数のキーワードのいずれかを含む箇所を抽
出して候補文格納バッファ5nに格納する。この候補文
格納バッファ5nは、図5に示すように、文字列格納部
5na とキーワード数格納部5nb とから構成され
る。抽出されたキーワードを含む各候補文は文字列格納
部5na に格納される。抽出される単位は文、つまり
テキストデータ中で句点(「。」)で区切られる単位で
ある。候補文を文字列格納部5na に格納すると同時
に、各候補文における該当するキーワードを含む部分の
個数がカウントされ、そのカウント値がキーワード数格
納部5nb に格納される。 このとき、各候補文において、同一のキーワードを含む
部分は“1”としてカウントされる。すなわち、各候補
文に含まれるキーワードの種類がカウントされることに
なる。ここで、図6に示す原テキストデータ10から、
「ワークステーション」と「データベース」の2語をキ
ーワードとして、候補文とキーワード数を抽出した例を
図7に示す。(ステップS61 )。
【0034】続いて、候補文格納バッファ5nのキーワ
ード数格納部5nb の内容が参照され、カウント数が
最大のものに対応する文字列格納部5na の内容が表
示文格納バッファ5pに格納される。図7に示す例にお
いては、キーワード数格納部5nb のカウント数が最
大の文、例えば、図8に示す文11が表示文格納バッフ
ァ5pに文書内容表現として格納される。なお、カウン
ト数が最大なものが複数箇所存在する場合には、その候
補文書データにおいて最初に出現する候補文の内容が表
示文格納バッファ5pに格納される。(ステップS62
)。
ード数格納部5nb の内容が参照され、カウント数が
最大のものに対応する文字列格納部5na の内容が表
示文格納バッファ5pに格納される。図7に示す例にお
いては、キーワード数格納部5nb のカウント数が最
大の文、例えば、図8に示す文11が表示文格納バッフ
ァ5pに文書内容表現として格納される。なお、カウン
ト数が最大なものが複数箇所存在する場合には、その候
補文書データにおいて最初に出現する候補文の内容が表
示文格納バッファ5pに格納される。(ステップS62
)。
【0035】さらに、表示格納バッファ5pの内容が表
示装置2 の画面上の矩形領域の内部に候補文書の文書
内容表現として表示され、この矩形の輪郭が表示される
。 (ステップS63 、ステップS64 )。
示装置2 の画面上の矩形領域の内部に候補文書の文書
内容表現として表示され、この矩形の輪郭が表示される
。 (ステップS63 、ステップS64 )。
【0036】上記したように、候補文書一覧表示部5g
が起動されると、ステップS61 〜ステップS64
の処理を候補文書格納バッファ5lに格納されている全
ての文書データに対して各文書データごとに実行する。 画面上において、各文書に対応する文書内容表現を表示
する順序は、候補文書文書格納バッファ5lに格納され
ている順序に従って行なわれる。このようにして表示装
置2 の画面上に表示された候補文書の一覧12の例を
図9に示す。
が起動されると、ステップS61 〜ステップS64
の処理を候補文書格納バッファ5lに格納されている全
ての文書データに対して各文書データごとに実行する。 画面上において、各文書に対応する文書内容表現を表示
する順序は、候補文書文書格納バッファ5lに格納され
ている順序に従って行なわれる。このようにして表示装
置2 の画面上に表示された候補文書の一覧12の例を
図9に示す。
【0037】ステップS6における候補文書一覧の表示
の処理が終了すると、文書選択部5hが起動される。文
書選択部5hが起動されると、入力装置1 のマウス1
bを介してユーザによる表示装置2 の画面上の位置入
力が行なわれる。ここで、ユーザによって指定された位
置が、ステップS1で表示されたアイコンと同様の終了
コマンドを表すアイコンの内部であれば、一連の検索処
理が終了する。 (ステップS7、ステップS8)。
の処理が終了すると、文書選択部5hが起動される。文
書選択部5hが起動されると、入力装置1 のマウス1
bを介してユーザによる表示装置2 の画面上の位置入
力が行なわれる。ここで、ユーザによって指定された位
置が、ステップS1で表示されたアイコンと同様の終了
コマンドを表すアイコンの内部であれば、一連の検索処
理が終了する。 (ステップS7、ステップS8)。
【0038】また、ユーザによって指定された位置が、
図9に示す文書内容表現を含む画面上の矩形領域の内部
であれば、その矩形が画面上で何番目のものかが調べら
れ、対応する文書データが候補文書格納バッファ5lか
ら読み出されるとともに文書表示部5iが起動される。 文書表示部5iが起動されると、読み出された文書デー
タを構成するテキストデータおよびイメージデータなど
が画面上に表示される。文書データの表示処理が終わる
と、制御はステップS7に戻り、新たな文書データを表
示すべく、候補文書一覧に表示されている文書の選択が
再度行なわれる。なお、ユーザによって指定された位置
が、文書内容表現を含む画面上の矩形領域の外側である
場合には、ユーザに正しい位置を指定させるために、ス
テップS7に戻り、再度位置入力が行なわれる。(ステ
ップS9、ステップS10 )。
図9に示す文書内容表現を含む画面上の矩形領域の内部
であれば、その矩形が画面上で何番目のものかが調べら
れ、対応する文書データが候補文書格納バッファ5lか
ら読み出されるとともに文書表示部5iが起動される。 文書表示部5iが起動されると、読み出された文書デー
タを構成するテキストデータおよびイメージデータなど
が画面上に表示される。文書データの表示処理が終わる
と、制御はステップS7に戻り、新たな文書データを表
示すべく、候補文書一覧に表示されている文書の選択が
再度行なわれる。なお、ユーザによって指定された位置
が、文書内容表現を含む画面上の矩形領域の外側である
場合には、ユーザに正しい位置を指定させるために、ス
テップS7に戻り、再度位置入力が行なわれる。(ステ
ップS9、ステップS10 )。
【0039】なお、上記実施例では候補文を複数のキー
ワードにより抽出するようにとしたが、これに限ること
はなく、単一のキーワードであってもよい。この場合に
は、各候補文に含まれるキーワードの種類をカウントせ
ずに、各候補文に含まれるキーワード数を単純にカウン
トし、キーワード数が最大の候補文格納バッファ5nの
内容を表示文格納バッファ5pに格納するようにすれば
よい。
ワードにより抽出するようにとしたが、これに限ること
はなく、単一のキーワードであってもよい。この場合に
は、各候補文に含まれるキーワードの種類をカウントせ
ずに、各候補文に含まれるキーワード数を単純にカウン
トし、キーワード数が最大の候補文格納バッファ5nの
内容を表示文格納バッファ5pに格納するようにすれば
よい。
【0040】また、本発明は上記実施例に限定されるも
のではなく、本発明の要旨を逸脱しない範囲で種々変形
可能であることは勿論である。
のではなく、本発明の要旨を逸脱しない範囲で種々変形
可能であることは勿論である。
【0041】
【発明の効果】以上詳述したように、本発明の文書検索
装置によれば、キーワードを用いて検索して得た候補文
書の一覧表の要素として、テキスト中の指定されたキー
ワードを含む箇所を列挙表示することにより、候補とし
て与えられた文書が目的とするものかどうかの判定を瞬
時にかつ正確に行なうことができ、その結果、文書デー
タベース中から目的とするものを検索する際に要するユ
ーザの労力を著しく削減することが可能になるなどその
実用的効果は多大である。
装置によれば、キーワードを用いて検索して得た候補文
書の一覧表の要素として、テキスト中の指定されたキー
ワードを含む箇所を列挙表示することにより、候補とし
て与えられた文書が目的とするものかどうかの判定を瞬
時にかつ正確に行なうことができ、その結果、文書デー
タベース中から目的とするものを検索する際に要するユ
ーザの労力を著しく削減することが可能になるなどその
実用的効果は多大である。
【0042】また、候補文書の一覧表の要素として、テ
キスト中のキーワードを含む文を表示することにより、
表示画面上の占有面積を小さくなるので、画面のスクロ
ール操作などの回数を減少でき、操作性が向上される。
キスト中のキーワードを含む文を表示することにより、
表示画面上の占有面積を小さくなるので、画面のスクロ
ール操作などの回数を減少でき、操作性が向上される。
【図1】本発明の一実施例の文書検索装置の構成を示す
ブロック図である。
ブロック図である。
【図2】文書データ格納装置内における文書データの格
納形式を示した図である。
納形式を示した図である。
【図3】メモリ装置内部の構成を示した図である。
【図4】処理の流れの概略を示したフローチャートであ
る。
る。
【図5】候補文格納バッファの構成を示した図である。
【図6】原テキストデータの例を示す図である。
【図7】抽出された候補文とキーワード数の例を示す図
である。
である。
【図8】表示文格納バッファの内容の一例を示す図であ
る。
る。
【図9】文書ごとに文書内容表現が表示されている例を
示す図である。
示す図である。
1 …入力装置(キーワード入力手段)3 …文書デー
タ格納装置(文書データ格納手段)5f…キーワードサ
ーチ部(キーワードサーチ手段)5g…候補文書一覧表
示部(文書一覧表示手段)5h…文書選択部(文書選択
手段) 5i…文書表示部(文書表示手段)
タ格納装置(文書データ格納手段)5f…キーワードサ
ーチ部(キーワードサーチ手段)5g…候補文書一覧表
示部(文書一覧表示手段)5h…文書選択部(文書選択
手段) 5i…文書表示部(文書表示手段)
Claims (1)
- 【請求項1】 テキスト・データや図表データなどか
らなる文書データを格納する文書データ格納手段と、こ
の文書データ格納手段に格納されている文書データを検
索するキーワードを入力するキーワード入力手段と、こ
のキーワード入力手段から入力されたキーワードを含む
文書を上記文書データ格納手段の中から検索するキーワ
ードサーチ手段とを備えた文書検索装置において、上記
各文書データごとに上記キーワードサーチ手段によって
抽出された上記キーワードを含む候補文とこの候補文に
含まれるキーワード数を格納する格納手段と、この格納
手段に格納されている上記キーワード数を参照し最大の
キーワード数を含む候補文をを候補文書リストの要素と
して表示する候補文書一覧表示手段と、この候補文書一
覧表示手段で表示された文書一覧における上記要素の一
つを指定する文書選択手段と、この文書選択手段で指定
された文書に対応する文書データの内容を表示する文書
表示手段とを具備したことを特徴とする文書検索装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3069323A JP2937521B2 (ja) | 1991-03-08 | 1991-03-08 | 文書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3069323A JP2937521B2 (ja) | 1991-03-08 | 1991-03-08 | 文書検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04281566A true JPH04281566A (ja) | 1992-10-07 |
JP2937521B2 JP2937521B2 (ja) | 1999-08-23 |
Family
ID=13399230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3069323A Expired - Lifetime JP2937521B2 (ja) | 1991-03-08 | 1991-03-08 | 文書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2937521B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0715573A (ja) * | 1993-06-25 | 1995-01-17 | Sony Corp | 端末装置 |
JPH07129605A (ja) * | 1993-09-13 | 1995-05-19 | Toshiba Corp | 文書検索装置 |
JPH07160727A (ja) * | 1993-12-06 | 1995-06-23 | Fujitsu Ltd | 電子マニュアルの表示方法 |
JPH08255172A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 文書検索システム |
JPH09167164A (ja) * | 1995-12-14 | 1997-06-24 | Toshiba Corp | 情報フィルタリング方法および情報フィルタリング装置 |
JPH10207891A (ja) * | 1997-01-17 | 1998-08-07 | Fujitsu Ltd | 文書要約装置およびその方法 |
JPH10222520A (ja) * | 1997-01-31 | 1998-08-21 | Toshiba Corp | 電子化文書処理装置 |
JPH10340271A (ja) * | 1997-06-09 | 1998-12-22 | Fuji Xerox Co Ltd | 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体 |
WO2005041068A1 (ja) * | 2003-10-24 | 2005-05-06 | Toshiba Solutions Corporation | 質問応答型文書検索のためのシステム及び方法 |
JP2009037605A (ja) * | 2007-07-12 | 2009-02-19 | Oki Data Corp | 文書検索装置及び画像形成装置、文書検索システム |
-
1991
- 1991-03-08 JP JP3069323A patent/JP2937521B2/ja not_active Expired - Lifetime
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0715573A (ja) * | 1993-06-25 | 1995-01-17 | Sony Corp | 端末装置 |
JPH07129605A (ja) * | 1993-09-13 | 1995-05-19 | Toshiba Corp | 文書検索装置 |
JPH07160727A (ja) * | 1993-12-06 | 1995-06-23 | Fujitsu Ltd | 電子マニュアルの表示方法 |
JPH08255172A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 文書検索システム |
JPH09167164A (ja) * | 1995-12-14 | 1997-06-24 | Toshiba Corp | 情報フィルタリング方法および情報フィルタリング装置 |
JPH10207891A (ja) * | 1997-01-17 | 1998-08-07 | Fujitsu Ltd | 文書要約装置およびその方法 |
JPH10222520A (ja) * | 1997-01-31 | 1998-08-21 | Toshiba Corp | 電子化文書処理装置 |
JPH10340271A (ja) * | 1997-06-09 | 1998-12-22 | Fuji Xerox Co Ltd | 文書抄録作成装置及び文書抄録作成プログラムを記録した記憶媒体 |
WO2005041068A1 (ja) * | 2003-10-24 | 2005-05-06 | Toshiba Solutions Corporation | 質問応答型文書検索のためのシステム及び方法 |
US7587420B2 (en) | 2003-10-24 | 2009-09-08 | Kabushiki Kaisha Toshiba | System and method for question answering document retrieval |
JP2009037605A (ja) * | 2007-07-12 | 2009-02-19 | Oki Data Corp | 文書検索装置及び画像形成装置、文書検索システム |
US8429154B2 (en) | 2007-07-12 | 2013-04-23 | Oki Data Corporation | Document search device, imaging forming apparatus, and document search system |
Also Published As
Publication number | Publication date |
---|---|
JP2937521B2 (ja) | 1999-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5982365A (en) | System and methods for interactively generating and testing help systems | |
JPH10333799A (ja) | ウィンドウディスプレイに複数のダイアログボックスを表示するためのシステム及び方法 | |
JPH08272830A (ja) | 順序付けデータセットメンバアクセス方法、順序付けデータセットアクセス再帰的方法及び順序付けデータセットメンバアクセス装置 | |
JP2937520B2 (ja) | 文書検索装置 | |
JP2937521B2 (ja) | 文書検索装置 | |
JP3056810B2 (ja) | 文書検索方法および装置 | |
JP2001092850A (ja) | 情報検索用端末装置及び情報検索用端末装置にける情報表示・入出力方法 | |
JPH06195386A (ja) | データ検索装置 | |
JPH06208584A (ja) | 文書検索装置 | |
JPH08137892A (ja) | 文書検索方法及び文書検索装置 | |
JP2831837B2 (ja) | 文書検索装置 | |
JPS5814688B2 (ja) | 同音異義語順次表示を行なう漢字まじり文入力装置 | |
JP3498635B2 (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
JPH05257980A (ja) | 文書検索装置 | |
JPH05181912A (ja) | 文書検索装置 | |
JPS63262750A (ja) | デ−タ入力方式 | |
JPH0535798A (ja) | データベース検索装置 | |
JPH0765014A (ja) | 文書検索装置 | |
JPH08153112A (ja) | 文書作成装置及び文書作成方法 | |
JPH03210668A (ja) | 階層形式をもつ電子化マニユアルの処理装置 | |
JP2527287B2 (ja) | 文章処理装置 | |
JPH0326422B2 (ja) | ||
JPH01259451A (ja) | 電子メール内容表示装置 | |
JPH0385670A (ja) | 二段階表示方式文書処理装置 | |
JPH08314919A (ja) | 学習機能付き文書処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090611 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100611 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110611 Year of fee payment: 12 |