JP2831837B2 - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JP2831837B2
JP2831837B2 JP2295452A JP29545290A JP2831837B2 JP 2831837 B2 JP2831837 B2 JP 2831837B2 JP 2295452 A JP2295452 A JP 2295452A JP 29545290 A JP29545290 A JP 29545290A JP 2831837 B2 JP2831837 B2 JP 2831837B2
Authority
JP
Japan
Prior art keywords
document
keyword
search
document data
search information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2295452A
Other languages
English (en)
Other versions
JPH04169971A (ja
Inventor
康雄 田野崎
和雄 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP2295452A priority Critical patent/JP2831837B2/ja
Publication of JPH04169971A publication Critical patent/JPH04169971A/ja
Application granted granted Critical
Publication of JP2831837B2 publication Critical patent/JP2831837B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は文書データベースの中からユーザの目的とす
る文書を効率よく検索することが可能な文書検索装置に
関する。
(従来の技術) 近時、大型コンピュータやワークステーション等を用
いた文書検索システムが実用化されている。
この種の文書検索システムでは、一般に文書の検索を
行なう際、ユーザがキーワードを入力し、文書検索装置
側は入力されたキーワードを含む文書をデータベースの
中から検索しその文書全体を表示していた。
しかし、条件を満たす文書が複数個見つかった場合に
は、装置側は、文書全体を表示せず、該当する文書に対
するタイトルおよび文書情報あるいはアブストラクトな
どを文書番号とともに検索情報として一覧列挙表示して
いた。そしてユーザは、この検索情報を元に、目的とす
る文書がどれかを判断していた。
(発明が解決しようとする課題) 上述したように検索の結果、条件を満たす文書が複数
ある場合には、装置側が検索情報としてタイトルおよび
文書情報あるいはアブストラクトを表示していた。しか
し、ユーザがその表示された検索情報だけでは、その文
書が目的とするものか否かを判断できない場合があっ
た。また検索情報自体の表示が多くなり、一画面に収ま
らない場合、ユーザは画面のスクロールなどを頻繁に行
なわねばならなくなるといった不具合が生じる事もあっ
た。
本発明は以上のような不具合を解決するためになされ
たもので、検索情報中に各文書の内容を的確に、かつ最
小限の表示量で表示できる文書検索装置を提供すること
を目的とする。
[発明の構成] (課題を解決するための手段) 本発明は上記課題を解決するために、文書検索装置に
おいて、複数の文書データを記憶した文書データ記憶部
から、ユーザにより指定されたキーワードに従って、キ
ーワードを含む文書データを検索し、検索情報として文
書データ中のキーワードを含む部分的なテキストデータ
を表示するようにしたことを特徴としている。また上記
検索情報中のキーワードを特定のシンボルに置換するこ
とで、より短い表現で表示するようにしたことを特徴と
している。
(作用) 従って、本発明によれば、文書データ中のキーワード
を含む部分的なテキストデータを表示することにより、
文書中におけるキーワードの表われ方をより明確に表現
することができる。これにより文書全体の内容が目的に
あったものかどうかの判断を適確にできるようになる。
また検索情報中のキーワードを、より短い特定のシン
ボルに置き換えて表示することにより、表示画面上での
占有面積を少なくすることができ、画面のスクロール等
の操作を減じることができる。
(実施例) 以下、本発明の一実施例について図面を参照して説明
する。
第1図は本発明の文書検索装置の一実施例を示すブロ
ック図である。
同図において入力装置12は、文字コード,制御コマン
ド、位置情報などを入力する装置であり、例えばキーボ
ードとマウスおよびこれらを制御する装置とから構成さ
れたものである。表示装置14はユーザに入力を行なわせ
るためのプロンプトメッセージ,入力された文字列、お
よび検索の後に得られた文書の表示などを行うものであ
り、例えばVRAMと、このVRAMに格納されたビット列とし
て表示するためのディスプレイとからなっている。文書
データ記憶部である文書データ格納装置16は各文書デー
タを格納するためのものであり、例えばハードディスク
装置などからなっている。制御装置20は例えばCPUなど
からなるものであり、上記各装置12〜16とバスにより接
続されており、各装置の制御、装置間のデータ転送の制
御などを行なうものである。
メモリ30は例えばダイナミックRAMからなり、プログ
ラムを格納するためのプログラム部である。
プログラム部は更に、メイン処理部32、初期化部34、
キーワード入力部36、キーワードサーチ部38、検索情報
表示部40、文書選択部42、文書表示部44、のモジュール
に分割される。
内部記憶装置50は例えばダイナミックRAM等からな
り、以下に示す各バッファを構成しているデータバッフ
ァ部である。
データバッファ部はキーワード格納バッファ52、キー
ワードサーチバッファ54、候補文書格納バッファ56、候
補文書格納バッファ58、検束情報格納バッファ60から構
成されている。
メイン処理部32は処理全体の制御を司り、プログラム
の実行、34〜44の各モジュールの呼び出しなどを行な
う。
初期化部34は各ハードウエア装置の初期化およびデー
タバッファ部52〜60の内容の初期化を行なう。
キーワード入力部36は入力装置12を介してユーザに検
索の際にキーとなるキーワード文字列を入力させ、これ
をキーワード格納バッファ52に格納する。
検索手段であるキーワードサーチ部38は、キーワード
格納バッファ52に格納されている文字列を含む文書デー
タを、文書データ格納装置16中から探し出し、該当する
文書データを後の文書表示部44の表示候補となる候補文
書として候補文書格納バッファ56に蓄積していく。表示
手段である検索情報表示部40は候補文書格納バッファ56
に格納されている各文書データの内容を表わした検索情
報を作成して検索情報格納バッファ60へ蓄積した後、表
示装置14の表示画面上に、列挙表示する。
文書選択部42は、検索情報表示部40で列挙表示された
検索情報の内いずれか一つをユーザに選択させる。
文書表示部44は、選択された検索情報に対応する文書
データを候補文書格納用バッファ56より読み出し、表示
装置14の表示画面上に表示する。
以上の各構成要素を用いて、以下では具体的な処理に
ついて説明する。
第2図は上記実施例の処理の流れを示したフロー図で
ある。
まずステップS1において、初期化部34がハードウエア
装置12,14の初期化、データバッファ部50の52〜60の各
バッファの初期設定、及びコマンド入力のための各種ア
イコンの表示を行なう。
次でステップS2で、キーワード入力部36が、指定され
たキーワードを入力する。入力は入力装置12のキーボー
ドを介して行なわれ、入力された文字列に対して、カナ
漢字変換などの処理を施し、得られた文字列をキーワー
ド格納バッファ52に格納する。
次にステップS3で、キーワードサーチ部38が文書デー
タ格納装置16に格納されている文書データを、格納され
ている順に読み出し、キーワードサーチバッファ54に一
次的に格納する。
文書データ格納装置16での文書データの格納形式の一
例を第3図に示す。一つの文書データ200は、文書中の
テキスト情報のみを含むテキストデータ部202とイメー
ジデータ,フォーマット情報などを含む非テキストデー
タ部204からなっている。文書データ格納装置16の中に
は、この様な形式の文書データが複数個格納されている
(第3図では、文書データ1〜文書データn)。
キーワードサーチ部38では、キーワードサーチバッフ
ァ54に格納されている一つの文書データのテキストデー
タ部202を参照して、この中に、キーワード格納、バッ
ファ52に格納されている文字列と同じ文字列が含まれて
いるかどうかを検索する。含まれている場合は、キーワ
ードサーチバッファ54に一時的に格納されている文書デ
ータ全体を候補文書格納バッファ56に蓄積し、候補文書
数格納バッファ58の内容を1増加する。また含まれてい
ない場合は、次の文書データを文書データ格納装置16か
ら読み込みキーワードサーチバッファ54へ格納する。
キーワードサーチ部38では前記処理を文書データ格納
装置16中の全文書データについて処理し、次のステップ
S4を実行する。
ステップS4では候補文書数格納バッファ58の内容を参
照し、ステップS3で検索した、キーワードをそのテキス
トデータ部中に含むものがあったか否かを調べる。もし
在ればステップS6へ、無ければステップS5へ移行する。
ステップS5では、該当する文書が見つからなかった旨
のメッセージを表示装置14上に表示した後、処理をステ
ップS2へ戻し、再びユーザにキーワードを入力させる。
ステップS6では、検索情報表示部40が、候補文書格納
バッファ56に蓄積されている各文書データのテキストデ
ータ部の内容を参照して、文書ごとにその検索情報を作
成し、検索情報格納バッファ60へ蓄積していく。この様
な検索情報を候補文書格納バッファ56に格納されている
全文書データに対して実行する。その後、各々得られた
検索情報格納バッファ60の内容を表示装置14の表示画面
上に、列挙する。
検索情報の例を第4図(a)〜(c)示す。同図にお
いて、キーワードは「ワークステーション」とする。ま
ず、(a)は文書データ格納装置16にある文書データ
(原テキストという)を示している。(b)は原テキス
トからキーワード「ワークステーション」を含む文、つ
まりテキストデータ中で句点「。」で区切られた単位で
抽出した検索情報の例を示している。なお、一つの文書
データのテキストデータ部に上記条件を満たすテキスト
箇所が複数個存在した場合には、最初に出現したものを
採用することとする。(c)は検索情報を段落単位で抽
出した例を示している。ステップS6での処理の後、文書
選択部42を起動してステップS7を実行する。
ステップS7で、文書選択部42は、入力装置12のマウス
を介してユーザに検索情報をポイントさせる。ここでユ
ーザによって処理の終了が指定された場合(ステップS
8)、処理を終了し、ステップ1へ復帰する。た検索情
報が選択された場合(ステップS10)、その検索情報が
何番目の情報かを調べ、対応する文書データを候補文書
格納用バッファ56から読み出し、文書表示部44を起動
し、該当する文書データのテキストデータ部および非テ
キストデータ部を画面上に表示する。
ステップS10での処理の後、制御はステップS7に戻
り、再度検索情報を表示してステップS7〜S10を繰り返
す。
以上のように動作することにより、文書データ中のキ
ーワードを含む部分的なテキストデータを表示し、文書
中におけるキーワードの表われ方をより明確に表現する
ことができる。そして文書全体の内容が目的にあったも
のかどうかの判断を適確にできるようになる。
次に他の実施例を以下に示す。第5図は本実施例の構
成を示すブロック図である。同図において、18は活用語
辞書、46は活用語サーチ部、62は活用語格納バッファで
ある。活用語辞書18は例えばJIS第1、第2水準に含ま
れる単語で、その語形が変化するいわゆる活用語(語幹
と活用形からなる)や活用語としてユーザが付加したも
のからなる辞書であり、ハードディスク装置や光ディス
ク装置などからなっている。活用語サーチ部46は、ユー
ザが入力したキーワードが活用語か非かを活用語辞書18
から検索し、活用語である場合は、その活用形を含めた
保持列を生成し、活用語格納バッファ62へ格納する。活
用語格納バッファ62は検索すべき活用語を格納しておく
バッファであり、キーワード同様文書データ格納装置16
を検索するキーとなる。なお、同図における他の参照符
号は第1図におけるものと同様である。
ここでの処理の流れを第2図のフロー図を使って説明
する。同図のステップ3において、キーワードサーチ部
38が文書データ格納装置16中の文書データをキーワード
サーチバッファ54に格納して、検索を終えた後、活用語
サーチ部46に制御が渡される。
活用語サーチ部46は、指定されたキーワードが活用語
か否かを活用語辞書18から検索し、活用語であった場合
は、その活用形を生成して活用語格納バッファ62に格納
する。例えば入力されたキーワードが「打つ」の場合を
考える。この時、活用語サーチ部46は活用語辞書18を
「打つ」をキーとして検索する。ここで活用語辞書の中
に図6に示すように活用形がある。活用語サーチ部46は
活用形が4段活用であることを検知し、その活用形「打
た」,「打ち」,「打つ」,「打て」を生成し、活用語
格納バッファ60に格納する。その後この活用語格納バッ
ファ62に格納された活用語をキーとしてキーワードサー
チバッファ54cの文書データを検索する。該当する文書
データがあった場合は、前記実施例のキーワード部38と
同様に該文書を候補格納文書格納バッファ56に蓄積し、
該文書データに対応する検索情報を作成し、検索情報格
納バッファ60に蓄積する。そして候補文書数格納バッフ
ァ58の内容を1増加させる。また検索文書データ中に活
用語が含まれていない場合は、キーワードサーチ部38へ
復帰する。活用語サーチ部46では前記処理を前記実施例
のキーワードサーチ部38と同様に、文書データ格納装置
16中の全文書データについて処理し、次のステップS4以
降を前記実施例と同様に実行する。
ここで、検索情報の例を第7図(a),(b)に示
す。(a)は文書データ格納装置1にある原テキストを
示している。(b)は原テキストから活用語「打た」,
「打ち」,「打つ」,「打て」のいずれかを含む文、つ
まりテキストデータ中で句点「。」で区切られた単位で
抽出した検索情報の例を示している。
以上のように動作することにより、文書データ中のキ
ーワードを含む部分的なテキストデータを適確に検索で
きるようになる。
また本発明の他の実施例を以下に示す。
第2図のステップS6において、検索情報格納バッファ
60に格納されている検索情報の内、キーワードに対する
文字列を、特定のシンボル、例えば記号「★」で置き換
える。ここでの検索情報格納バッファ60の変化を第8図
(a)〜(d)に示す。第8図(a)は、第4図(b)
を示しており、第8図(b)は、キーワード「ワークス
テーション」に対応する文字列を、特定のシンボル、
「★」で置き換えた例を示している。また、第8図
(c)は、第4図(c)を示しており、また第8図
(d)は、キーワード「ワークステーション」に対応す
る文字列を、特定のシンボル「★」で置き換えた例を示
している。
第9図は、キーワード「ワークステーション」に対応
する文字列を、記号「★」で置き換えて一覧列挙表示し
た検索情報の表示例を示している。
この様に、本実施例によれば、検索情報中のキーワー
ドを、より短い特定のシンボルに置き換えて表示するこ
とにより、表示画面上での占有面積を少なくすることが
でき、画面のスクロール等の操作を減じることができ
る。
以上のように動作することにより、検索情報中のキー
ワードを、より短い特定のシンボルに置き換えて表示す
ることができ、これにより表示画面上での占有面積を少
なくし、画面のスクロール等の操作を減じることができ
る。
なお、本発明は上記実施例に限定されるものではな
く、その要旨を逸脱しない範囲で種々変形して実施可能
である。
[発明の効果] 以上説明したように本発明によれば、種々の効果を奏
する。
例えば、文書データ中のキーワードを含む部分的なテ
キストデータを表示することにより、文書中におけるキ
ーワードの表われ方をより明確に表現することができ
る。これにより文書全体の内容が目的にあったものかど
うかの判断を適確にできるようになる。
また、検索情報中のキーワードを、より短い特定のシ
ンボルに置き換えて表示することにより、表示画面上で
の占有面積を少なくすることができ、画面のスクロール
等の操作を減じることができる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、 第2図は処理の流れを示すフロー図、 第3図は文書データの格納形式を示す図、 第4図は検索情報の例を示す図、 第5図は本発明の他の実施例の構成を示すブロック図、 第6図は活用語辞書の格納形式を示す図、 第7図は検索情報の例を示す図、 第8図は検索情報の例を示す図、 第9図は検索情報の表示例を示す図である。 12……入力装置、14……表示装置、16……文書データ格
納装置16、20……制御装置、30……メモリ、32……メイ
ン処理部、34……初期化部、36……キーワード入力部、
38……キーワードサーチ部、40……検索情報表示部、42
……文書選択部、44……文書表示部、50……内部記憶装
置、52……キーワード格納バッファ、54……キーワード
サーチバッファ、56……候補文書格納バッファ、58……
候補文書数格納バッファ、60……検索情報格納バッフ
ァ。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−248160(JP,A) 実開 昭64−43457(JP,U) 加藤外6名「全文検索用テキストサー チマシンの開発」、電子情報通信学会技 術研究報告(DE89−38),Vol. 89,No.335,p.17−24 (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 JICST科学技術文献ファイル

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】複数の文書データを記憶した文書データ記
    憶部と、 指定されたキーワードに従って前記文書データ記憶部か
    ら上記キーワードを含む文書データを検索する検索手段
    と、 検索された文書データを前記キーワードを中心として簡
    潔化表現して表示する表示手段とを具備したことを特徴
    とする文書検索装置。
  2. 【請求項2】文書データのキーワードを中心とする簡潔
    化表現は、検索された文書データ中のキーワードを含む
    部分的なテキストデータを抽出して行なわれることを特
    徴とする請求項1に記載の文書検索装置。
  3. 【請求項3】文書データのキーワードを中心とする簡潔
    化表現は、前記キーワードを特定のシンボルに置換して
    行なわれることを特徴とする請求項1に記載の文書検索
    装置。
JP2295452A 1990-11-02 1990-11-02 文書検索装置 Expired - Lifetime JP2831837B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2295452A JP2831837B2 (ja) 1990-11-02 1990-11-02 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2295452A JP2831837B2 (ja) 1990-11-02 1990-11-02 文書検索装置

Publications (2)

Publication Number Publication Date
JPH04169971A JPH04169971A (ja) 1992-06-17
JP2831837B2 true JP2831837B2 (ja) 1998-12-02

Family

ID=17820773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2295452A Expired - Lifetime JP2831837B2 (ja) 1990-11-02 1990-11-02 文書検索装置

Country Status (1)

Country Link
JP (1) JP2831837B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3270351B2 (ja) * 1997-01-31 2002-04-02 株式会社東芝 電子化文書処理装置
CN103577510A (zh) * 2012-07-23 2014-02-12 阿里巴巴集团控股有限公司 搜索结果数据的展现方法,搜索服务器及移动终端

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
加藤外6名「全文検索用テキストサーチマシンの開発」、電子情報通信学会技術研究報告(DE89−38),Vol.89,No.335,p.17−24

Also Published As

Publication number Publication date
JPH04169971A (ja) 1992-06-17

Similar Documents

Publication Publication Date Title
EP2546766B1 (en) Dynamic search box for web browser
JP2937520B2 (ja) 文書検索装置
JP2937519B2 (ja) 文書検索装置
JPH08161349A (ja) 文字列検索装置
JP2010257392A (ja) 文字入力装置、文字入力方法、コンピュータ読取可能なプログラムおよび記録媒体
JP2937521B2 (ja) 文書検索装置
JP2000331012A (ja) 電子化文書検索方法
JP2831837B2 (ja) 文書検索装置
JP3071703B2 (ja) 表作成装置およびその方法
JP2010146061A (ja) 例文表示装置、例文表示方法および例文表示プログラム
EP0679999B1 (en) A method and apparatus for storage and retrieval of data
JP3056810B2 (ja) 文書検索方法および装置
JP2939841B2 (ja) データベース検索装置
JP2881891B2 (ja) 階層形式をもつ電子化マニユアルの処理装置
JP2004334690A (ja) 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP3592284B2 (ja) 日本語入力システム、そのプログラム、及び携帯情報端末
JP2002007468A (ja) 類似文書検索装置、類似文書検索方法及び記録媒体
JPH08115336A (ja) マルチメディア処理装置
JPH0991304A (ja) 情報検索方法、情報検索システム及び情報検索用記憶媒体
JP2000148747A (ja) 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置
JP2001067375A (ja) 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体
JPS63262750A (ja) デ−タ入力方式
JPH08235191A (ja) 文書検索方法及び文書検索装置
JP2002099558A (ja) 情報検索システム、情報検索方法、及び、記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070925

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100925

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100925

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110925

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110925

Year of fee payment: 13