JP2831837B2 - 文書検索装置 - Google Patents
文書検索装置Info
- Publication number
- JP2831837B2 JP2831837B2 JP2295452A JP29545290A JP2831837B2 JP 2831837 B2 JP2831837 B2 JP 2831837B2 JP 2295452 A JP2295452 A JP 2295452A JP 29545290 A JP29545290 A JP 29545290A JP 2831837 B2 JP2831837 B2 JP 2831837B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- keyword
- search
- document data
- search information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
る文書を効率よく検索することが可能な文書検索装置に
関する。
いた文書検索システムが実用化されている。
行なう際、ユーザがキーワードを入力し、文書検索装置
側は入力されたキーワードを含む文書をデータベースの
中から検索しその文書全体を表示していた。
は、装置側は、文書全体を表示せず、該当する文書に対
するタイトルおよび文書情報あるいはアブストラクトな
どを文書番号とともに検索情報として一覧列挙表示して
いた。そしてユーザは、この検索情報を元に、目的とす
る文書がどれかを判断していた。
ある場合には、装置側が検索情報としてタイトルおよび
文書情報あるいはアブストラクトを表示していた。しか
し、ユーザがその表示された検索情報だけでは、その文
書が目的とするものか否かを判断できない場合があっ
た。また検索情報自体の表示が多くなり、一画面に収ま
らない場合、ユーザは画面のスクロールなどを頻繁に行
なわねばならなくなるといった不具合が生じる事もあっ
た。
たもので、検索情報中に各文書の内容を的確に、かつ最
小限の表示量で表示できる文書検索装置を提供すること
を目的とする。
おいて、複数の文書データを記憶した文書データ記憶部
から、ユーザにより指定されたキーワードに従って、キ
ーワードを含む文書データを検索し、検索情報として文
書データ中のキーワードを含む部分的なテキストデータ
を表示するようにしたことを特徴としている。また上記
検索情報中のキーワードを特定のシンボルに置換するこ
とで、より短い表現で表示するようにしたことを特徴と
している。
を含む部分的なテキストデータを表示することにより、
文書中におけるキーワードの表われ方をより明確に表現
することができる。これにより文書全体の内容が目的に
あったものかどうかの判断を適確にできるようになる。
ボルに置き換えて表示することにより、表示画面上での
占有面積を少なくすることができ、画面のスクロール等
の操作を減じることができる。
する。
ック図である。
ド、位置情報などを入力する装置であり、例えばキーボ
ードとマウスおよびこれらを制御する装置とから構成さ
れたものである。表示装置14はユーザに入力を行なわせ
るためのプロンプトメッセージ,入力された文字列、お
よび検索の後に得られた文書の表示などを行うものであ
り、例えばVRAMと、このVRAMに格納されたビット列とし
て表示するためのディスプレイとからなっている。文書
データ記憶部である文書データ格納装置16は各文書デー
タを格納するためのものであり、例えばハードディスク
装置などからなっている。制御装置20は例えばCPUなど
からなるものであり、上記各装置12〜16とバスにより接
続されており、各装置の制御、装置間のデータ転送の制
御などを行なうものである。
ラムを格納するためのプログラム部である。
キーワード入力部36、キーワードサーチ部38、検索情報
表示部40、文書選択部42、文書表示部44、のモジュール
に分割される。
り、以下に示す各バッファを構成しているデータバッフ
ァ部である。
ワードサーチバッファ54、候補文書格納バッファ56、候
補文書格納バッファ58、検束情報格納バッファ60から構
成されている。
の実行、34〜44の各モジュールの呼び出しなどを行な
う。
タバッファ部52〜60の内容の初期化を行なう。
索の際にキーとなるキーワード文字列を入力させ、これ
をキーワード格納バッファ52に格納する。
格納バッファ52に格納されている文字列を含む文書デー
タを、文書データ格納装置16中から探し出し、該当する
文書データを後の文書表示部44の表示候補となる候補文
書として候補文書格納バッファ56に蓄積していく。表示
手段である検索情報表示部40は候補文書格納バッファ56
に格納されている各文書データの内容を表わした検索情
報を作成して検索情報格納バッファ60へ蓄積した後、表
示装置14の表示画面上に、列挙表示する。
検索情報の内いずれか一つをユーザに選択させる。
データを候補文書格納用バッファ56より読み出し、表示
装置14の表示画面上に表示する。
ついて説明する。
ある。
装置12,14の初期化、データバッファ部50の52〜60の各
バッファの初期設定、及びコマンド入力のための各種ア
イコンの表示を行なう。
たキーワードを入力する。入力は入力装置12のキーボー
ドを介して行なわれ、入力された文字列に対して、カナ
漢字変換などの処理を施し、得られた文字列をキーワー
ド格納バッファ52に格納する。
タ格納装置16に格納されている文書データを、格納され
ている順に読み出し、キーワードサーチバッファ54に一
次的に格納する。
例を第3図に示す。一つの文書データ200は、文書中の
テキスト情報のみを含むテキストデータ部202とイメー
ジデータ,フォーマット情報などを含む非テキストデー
タ部204からなっている。文書データ格納装置16の中に
は、この様な形式の文書データが複数個格納されている
(第3図では、文書データ1〜文書データn)。
ァ54に格納されている一つの文書データのテキストデー
タ部202を参照して、この中に、キーワード格納、バッ
ファ52に格納されている文字列と同じ文字列が含まれて
いるかどうかを検索する。含まれている場合は、キーワ
ードサーチバッファ54に一時的に格納されている文書デ
ータ全体を候補文書格納バッファ56に蓄積し、候補文書
数格納バッファ58の内容を1増加する。また含まれてい
ない場合は、次の文書データを文書データ格納装置16か
ら読み込みキーワードサーチバッファ54へ格納する。
装置16中の全文書データについて処理し、次のステップ
S4を実行する。
照し、ステップS3で検索した、キーワードをそのテキス
トデータ部中に含むものがあったか否かを調べる。もし
在ればステップS6へ、無ければステップS5へ移行する。
のメッセージを表示装置14上に表示した後、処理をステ
ップS2へ戻し、再びユーザにキーワードを入力させる。
バッファ56に蓄積されている各文書データのテキストデ
ータ部の内容を参照して、文書ごとにその検索情報を作
成し、検索情報格納バッファ60へ蓄積していく。この様
な検索情報を候補文書格納バッファ56に格納されている
全文書データに対して実行する。その後、各々得られた
検索情報格納バッファ60の内容を表示装置14の表示画面
上に、列挙する。
いて、キーワードは「ワークステーション」とする。ま
ず、(a)は文書データ格納装置16にある文書データ
(原テキストという)を示している。(b)は原テキス
トからキーワード「ワークステーション」を含む文、つ
まりテキストデータ中で句点「。」で区切られた単位で
抽出した検索情報の例を示している。なお、一つの文書
データのテキストデータ部に上記条件を満たすテキスト
箇所が複数個存在した場合には、最初に出現したものを
採用することとする。(c)は検索情報を段落単位で抽
出した例を示している。ステップS6での処理の後、文書
選択部42を起動してステップS7を実行する。
を介してユーザに検索情報をポイントさせる。ここでユ
ーザによって処理の終了が指定された場合(ステップS
8)、処理を終了し、ステップ1へ復帰する。た検索情
報が選択された場合(ステップS10)、その検索情報が
何番目の情報かを調べ、対応する文書データを候補文書
格納用バッファ56から読み出し、文書表示部44を起動
し、該当する文書データのテキストデータ部および非テ
キストデータ部を画面上に表示する。
り、再度検索情報を表示してステップS7〜S10を繰り返
す。
ーワードを含む部分的なテキストデータを表示し、文書
中におけるキーワードの表われ方をより明確に表現する
ことができる。そして文書全体の内容が目的にあったも
のかどうかの判断を適確にできるようになる。
成を示すブロック図である。同図において、18は活用語
辞書、46は活用語サーチ部、62は活用語格納バッファで
ある。活用語辞書18は例えばJIS第1、第2水準に含ま
れる単語で、その語形が変化するいわゆる活用語(語幹
と活用形からなる)や活用語としてユーザが付加したも
のからなる辞書であり、ハードディスク装置や光ディス
ク装置などからなっている。活用語サーチ部46は、ユー
ザが入力したキーワードが活用語か非かを活用語辞書18
から検索し、活用語である場合は、その活用形を含めた
保持列を生成し、活用語格納バッファ62へ格納する。活
用語格納バッファ62は検索すべき活用語を格納しておく
バッファであり、キーワード同様文書データ格納装置16
を検索するキーとなる。なお、同図における他の参照符
号は第1図におけるものと同様である。
する。同図のステップ3において、キーワードサーチ部
38が文書データ格納装置16中の文書データをキーワード
サーチバッファ54に格納して、検索を終えた後、活用語
サーチ部46に制御が渡される。
か否かを活用語辞書18から検索し、活用語であった場合
は、その活用形を生成して活用語格納バッファ62に格納
する。例えば入力されたキーワードが「打つ」の場合を
考える。この時、活用語サーチ部46は活用語辞書18を
「打つ」をキーとして検索する。ここで活用語辞書の中
に図6に示すように活用形がある。活用語サーチ部46は
活用形が4段活用であることを検知し、その活用形「打
た」,「打ち」,「打つ」,「打て」を生成し、活用語
格納バッファ60に格納する。その後この活用語格納バッ
ファ62に格納された活用語をキーとしてキーワードサー
チバッファ54cの文書データを検索する。該当する文書
データがあった場合は、前記実施例のキーワード部38と
同様に該文書を候補格納文書格納バッファ56に蓄積し、
該文書データに対応する検索情報を作成し、検索情報格
納バッファ60に蓄積する。そして候補文書数格納バッフ
ァ58の内容を1増加させる。また検索文書データ中に活
用語が含まれていない場合は、キーワードサーチ部38へ
復帰する。活用語サーチ部46では前記処理を前記実施例
のキーワードサーチ部38と同様に、文書データ格納装置
16中の全文書データについて処理し、次のステップS4以
降を前記実施例と同様に実行する。
す。(a)は文書データ格納装置1にある原テキストを
示している。(b)は原テキストから活用語「打た」,
「打ち」,「打つ」,「打て」のいずれかを含む文、つ
まりテキストデータ中で句点「。」で区切られた単位で
抽出した検索情報の例を示している。
ーワードを含む部分的なテキストデータを適確に検索で
きるようになる。
60に格納されている検索情報の内、キーワードに対する
文字列を、特定のシンボル、例えば記号「★」で置き換
える。ここでの検索情報格納バッファ60の変化を第8図
(a)〜(d)に示す。第8図(a)は、第4図(b)
を示しており、第8図(b)は、キーワード「ワークス
テーション」に対応する文字列を、特定のシンボル、
「★」で置き換えた例を示している。また、第8図
(c)は、第4図(c)を示しており、また第8図
(d)は、キーワード「ワークステーション」に対応す
る文字列を、特定のシンボル「★」で置き換えた例を示
している。
する文字列を、記号「★」で置き換えて一覧列挙表示し
た検索情報の表示例を示している。
ドを、より短い特定のシンボルに置き換えて表示するこ
とにより、表示画面上での占有面積を少なくすることが
でき、画面のスクロール等の操作を減じることができ
る。
ワードを、より短い特定のシンボルに置き換えて表示す
ることができ、これにより表示画面上での占有面積を少
なくし、画面のスクロール等の操作を減じることができ
る。
く、その要旨を逸脱しない範囲で種々変形して実施可能
である。
する。
キストデータを表示することにより、文書中におけるキ
ーワードの表われ方をより明確に表現することができ
る。これにより文書全体の内容が目的にあったものかど
うかの判断を適確にできるようになる。
ンボルに置き換えて表示することにより、表示画面上で
の占有面積を少なくすることができ、画面のスクロール
等の操作を減じることができる。
納装置16、20……制御装置、30……メモリ、32……メイ
ン処理部、34……初期化部、36……キーワード入力部、
38……キーワードサーチ部、40……検索情報表示部、42
……文書選択部、44……文書表示部、50……内部記憶装
置、52……キーワード格納バッファ、54……キーワード
サーチバッファ、56……候補文書格納バッファ、58……
候補文書数格納バッファ、60……検索情報格納バッフ
ァ。
Claims (3)
- 【請求項1】複数の文書データを記憶した文書データ記
憶部と、 指定されたキーワードに従って前記文書データ記憶部か
ら上記キーワードを含む文書データを検索する検索手段
と、 検索された文書データを前記キーワードを中心として簡
潔化表現して表示する表示手段とを具備したことを特徴
とする文書検索装置。 - 【請求項2】文書データのキーワードを中心とする簡潔
化表現は、検索された文書データ中のキーワードを含む
部分的なテキストデータを抽出して行なわれることを特
徴とする請求項1に記載の文書検索装置。 - 【請求項3】文書データのキーワードを中心とする簡潔
化表現は、前記キーワードを特定のシンボルに置換して
行なわれることを特徴とする請求項1に記載の文書検索
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2295452A JP2831837B2 (ja) | 1990-11-02 | 1990-11-02 | 文書検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2295452A JP2831837B2 (ja) | 1990-11-02 | 1990-11-02 | 文書検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04169971A JPH04169971A (ja) | 1992-06-17 |
JP2831837B2 true JP2831837B2 (ja) | 1998-12-02 |
Family
ID=17820773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2295452A Expired - Lifetime JP2831837B2 (ja) | 1990-11-02 | 1990-11-02 | 文書検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2831837B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3270351B2 (ja) * | 1997-01-31 | 2002-04-02 | 株式会社東芝 | 電子化文書処理装置 |
CN103577510A (zh) * | 2012-07-23 | 2014-02-12 | 阿里巴巴集团控股有限公司 | 搜索结果数据的展现方法,搜索服务器及移动终端 |
-
1990
- 1990-11-02 JP JP2295452A patent/JP2831837B2/ja not_active Expired - Lifetime
Non-Patent Citations (1)
Title |
---|
加藤外6名「全文検索用テキストサーチマシンの開発」、電子情報通信学会技術研究報告(DE89−38),Vol.89,No.335,p.17−24 |
Also Published As
Publication number | Publication date |
---|---|
JPH04169971A (ja) | 1992-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2546766B1 (en) | Dynamic search box for web browser | |
JP2937520B2 (ja) | 文書検索装置 | |
JP2937519B2 (ja) | 文書検索装置 | |
JPH08161349A (ja) | 文字列検索装置 | |
JP2010257392A (ja) | 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体 | |
JPH04281566A (ja) | 文書検索装置 | |
JP2000331012A (ja) | 電子化文書検索方法 | |
JP2831837B2 (ja) | 文書検索装置 | |
JP3071703B2 (ja) | 表作成装置およびその方法 | |
JP2010146061A (ja) | 例文表示装置、例文表示方法および例文表示プログラム | |
JP5541014B2 (ja) | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム | |
EP0679999B1 (en) | A method and apparatus for storage and retrieval of data | |
JP3056810B2 (ja) | 文書検索方法および装置 | |
JP2939841B2 (ja) | データベース検索装置 | |
JP2881891B2 (ja) | 階層形式をもつ電子化マニユアルの処理装置 | |
JP2004334690A (ja) | 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体 | |
JP3498635B2 (ja) | 情報検索方法及びその装置並びにコンピュータ可読記録媒体 | |
JP2000322442A (ja) | データベース検索装置およびデータベース検索プログラム記憶媒体 | |
JP3592284B2 (ja) | 日本語入力システム、そのプログラム、及び携帯情報端末 | |
JP2002007468A (ja) | 類似文書検索装置、類似文書検索方法及び記録媒体 | |
JPH08115336A (ja) | マルチメディア処理装置 | |
JPH0991304A (ja) | 情報検索方法、情報検索システム及び情報検索用記憶媒体 | |
JP2000148747A (ja) | 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置 | |
JP2001067375A (ja) | 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体 | |
JPS63262750A (ja) | デ−タ入力方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070925 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080925 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080925 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090925 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090925 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100925 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100925 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110925 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110925 Year of fee payment: 13 |