JPH0612454A - 文書検索方法及び装置 - Google Patents

文書検索方法及び装置

Info

Publication number
JPH0612454A
JPH0612454A JP4168965A JP16896592A JPH0612454A JP H0612454 A JPH0612454 A JP H0612454A JP 4168965 A JP4168965 A JP 4168965A JP 16896592 A JP16896592 A JP 16896592A JP H0612454 A JPH0612454 A JP H0612454A
Authority
JP
Japan
Prior art keywords
document data
document
search
retrieval
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4168965A
Other languages
English (en)
Inventor
Shiro Ito
史朗 伊藤
Takanari Ueda
隆也 上田
Minoru Fujita
稔 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP4168965A priority Critical patent/JPH0612454A/ja
Publication of JPH0612454A publication Critical patent/JPH0612454A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 検索された文書データの内容をわかりやすく
表示すると共に、検索された文書データが複数存在する
時にも、それらを分かりやすく表示できる文書検索方法
及び装置を提供することを目的とする。 【構成】 複数の文書データを記憶している文書ファイ
ルより所望の文書データを検索する文書検索装置であっ
て、検索対象の文書データを特定する検索語を入力して
記憶しておき、その記憶されている検索語に基づいて文
書ファイルより、その検索語を含む文書データを検索す
る。こうして検索された文書データを表す表題文章及び
/或いは前記検索語の前後の文章を、前記文書データよ
り抽出し、これら抽出された文章を表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の文書データを記
憶している文書ファイルより所望の文書データを検索す
る文書検索方法及び装置に関するものである。
【0002】
【従来の技術】複数の文書データを記憶している文書フ
ァイルの中から所望の文書データを検索して読出す文書
検索装置がある。このような文書検索装置では、検索が
指示された文書データの検索が終了すると、その検索さ
れた文書の表題文を表示してオペレータ(検索者)に表
示していた。このため、検索された文書データの内容が
分からないため、それが所望の文書データであるかどう
かも判別できないという問題があった。
【0003】
【発明が解決しようとする課題】このような問題を解決
するために、その検索された文書データの全文を表示し
てオペレータに示すことも考えられるが、これでは複数
の文書データが検索された時には、それらの文書データ
の内容を簡単に確認することができなくなくなる。
【0004】本発明は上記従来例に鑑みてなされたもの
で、検索された文書データの内容をわかりやすく表示す
ると共に、検索された文書データが複数存在する時に
も、それらを分かりやすく表示できる文書検索方法及び
装置を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に本発明の文書検索装置は以下のような構成を備える。
即ち、複数の文書データを記憶している文書ファイルよ
り所望の文書データを検索する文書検索装置であって、
検索対象の文書データを特定する検索語を入力して記憶
する記憶手段と、前記検索語に基づいて文書ファイルよ
り、前記検索語を含む文書データを検索する検索処理手
段と、前記検索処理手段により検索された文書データを
表す表題文章及び/或いは前記検索語の前後の文章を、
前記文書データより抽出する抽出手段と、前記抽出手段
によって抽出された文章を表示する表示手段とを有す
る。
【0006】上記目的を達成するために本発明の文書検
索方法は以下のような工程を備える。即ち、複数の文書
データを記憶している文書ファイルより所望の文書デー
タを検索する文書検索方法であって、検索対象の文書デ
ータを特定する検索語を入力する工程と、その入力され
た検索語に基づいて文書ファイルより、前記検索語を含
む文書データを検索する工程と、検索された文書データ
を表す表題文章及び/或いは前記検索語の前後の文章を
前記抽出された文書データより抽出する工程と、その抽
出された文章を表示する工程とを有する。
【0007】
【作用】以上の構成により、オペレータにより検索語が
指示されると、その検索語を含む文書データを検索す
る。こうして文書データが検索されると、その文書デー
タの表題文及び/或いはその検索語の前後の文章を表示
するようにしたので、オペレータにその検索された文書
データの内容をわかりやすく表示できる。
【0008】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0009】図1は本発明の一実施例の文書検索装置の
機能構成を示す機能ブロック図である。
【0010】同図において、1は検索対象文書保持部
で、検索対象となる複数の文書を記憶している。2は検
索語保持部で、オペレータにより検索したい語として入
力された検索語を記憶している。この検索語に従って、
検索対象文書保持部1に保持されている文書データが検
索される。3は検索処理部で、検索対象文書保持部1に
記憶されている複数の検索対象文書から、検索語保持部
2に保持されている検索語を検索する。4は検索結果保
持部で、検索処理部3によって検索された結果を記憶し
ている。5は表題文抽出部で、検索対象文書保持部1に
記憶されている検索対象文書と、検索結果保持部4に記
憶されている検索された対象文書データとから、検索さ
れた文書データの表題文を抽出する。6は主要文抽出部
で、検索対象文書保持部1に記憶されている検索対象文
書と、検索結果保持部4に記憶されている検索された対
象文書データとから、検索された文書データの主要文を
抽出する。7は検索結果組合せ保持部で、表題文抽出部
5によって抽出された表題文と主要文抽出部6によって
抽出された主要文とを対応付けて記憶している。
【0011】図2は本実施例の文書検索装置の概略構成
を示すブロック図である。
【0012】図2において、21は制御メモリであり、
図3のフローチャートで示された制御手順に従った制御
プログラムや各種データを記憶している。22は制御メ
モリ21に保持されている制御手順に従って各種判断や
演算などを行なう中央処理装置(CPU)である。23
はRAM等で構成されたワークメモリであり、前述した
検索語を記憶している検索語保持部IB,検索された結
果を記憶する検索結果保持部MB,検索された文書デー
タの表題文と主要文とを対応付けて記憶する検索結果組
合せ保持部OB等のワークエリアを有している。24は
ディスク装置であり、検索対象となる複数の文書データ
を記憶しており、図1の検索対象文書保持部DBに対応
している。25は表示部で、検索結果やオペレータへの
各種メッセージ等を表示するのに使用される。26はキ
ーボードで、オペレータにより操作されて前述した検索
指示入力や、オペレータが検索したい検索語等が入力さ
れる。27は前述した各部を接続するためのシステムバ
スである。
【0013】次に、図3に示すフローチャートを参照し
て本実施例の文書検索装置の動作を説明する。
【0014】まず、オペレータがキーボード26より検
索したい語を入力して検索語保持部IBに、その検索語
が記憶されるまでステップS1が繰り返される。こうし
て検索語が検索語保持部IBに記憶されるとステップS
2に進み、ハードディスク装置24に検索対象文書が残
っているか否かを調べ、検索対象文書がある場合はステ
ップS3に進むが、検索対象文書がない場合は全ての処
理を終了する。
【0015】ステップS3では、ハードディスク装置2
4に記憶されている検索対象となる文書データから1つ
の文書データを読出してステップS4に進み、その読出
された文書データが、検索語保持部IBに記憶されてい
る検索語を含んでいるかどうかを検索する。その検索の
結果、検索語が含まれているときは、その文書データの
IDと、その文書データ中における検索語の出現位置
を、その検索結果として検索結果保持部MBに記憶す
る。
【0016】例えば、検索語保持部IBに図4に示すよ
うな検索語“再販制度”が記憶されている時は、ハード
ディスク装置24に保持されている検索対象文書の中の
図5のような文書に対して検索処理を行うと、図6に示
すような検索結果が検索結果保持部MBに記憶される。
図5は、その文書データのIDが“007”であること
を示しており、図6ではその文書データのID“00
7”と、その文書データにおける検索語“再販制度”の
出現位置“52”が示されている。
【0017】ステップS5では、検索結果保持部MBに
記憶されている検索結果に基づき、文書データが検索さ
れたかどうかを判定し、検索された場合はステップS6
に進む。ステップS6では、検索結果保持部MBに保持
されている検索結果を用いてハードディスク装置24に
保持されている検索対象文書の中から検索された文書デ
ータを取り出し、その先頭から最初の改行コードまでを
表題文として抽出する。この抽出された表題文は、検索
結果組み合わせ保持部OBに記憶される。
【0018】次にステップS7に進み、この検索結果保
持部MBに保持されている検索結果を用いて、ハードデ
ィスク装置24に記憶されている検索対象の文書の中か
ら検索された文書データを取り出し、検索結果保持部M
Bに記憶されている検索結果を用いて検索語の出現する
位置を取り出し、その前後の句読点の間を主要文として
抽出する。こうして、ステップS6で検索結果組合せ保
持部OBに記憶されている表題文と組み合わせて、検索
結果組合せ保持部OBに記憶する。そして、ステップS
2の先頭に戻る。
【0019】図7は、このようにして抽出されて検索結
果組合せ保持部OBに記憶された表題文と主要文とが組
合わされて表示された一例を示す図で、表題文として図
6の文書データの先頭より最初の改行までの文書「独占
禁止法適用除外見直し」が表示され、その下に主要文と
して「再販制度は廃止も含めて見直す。」が表示されて
いる。
【0020】このように本実施例によれば、検索された
文書データを容易に確認することができ、検索結果とし
て表示される文書の量が少ないので、複数の文書データ
が抽出された場合も表示して確認することができる。
【0021】尚、前述の実施例では、表題を文書データ
の先頭から最初の改行コードまでとする場合について説
明したが、本実施例はこれに限定されるものでなく、文
書データの形式に応じて他の部分を用いてもよい。
【0022】また、上記実施例では、主要文を文書中に
出現した検索語の前後の句読点の間の文章としたが、本
発明はこれに限定されるものではなく、例えば検索語の
前後の一定長の文章部分であっても良い。
【0023】また前述の実施例では、検索結果保持部M
Bに記憶される検索結果を、文書データのIDと検索語
の出現位置としたが、本発明はこれに限定されるもので
なく、文書データの全文と原作語の出現位置などに基づ
いて、他の検索結果を記憶するようにしても良い。
【0024】また更に、上記実施例では、検索語保持部
IBに保持される検索語が1つの場合について説明した
が、これに限定されるものでなく、複数の検索語が指定
された場合にも適用できることはもちろんである。
【0025】また上記実施例では、検索処理部3におい
て検索対象文書に検索語が出現するか否かを検索する場
合について説明したが、これに限定されるものでなく、
更に検索語の出現回数などの条件が加わっても良い。
【0026】また前述の実施例では、検索処理部3で文
書を単位として検索処理を行なう場合について説明した
が、これに限定されるものでなく、ディスク装置のブロ
ックを単位とするなど他の単位であってもよい。
【0027】また、上記実施例では、検索対象文書保持
部1をハードディスク装置24で実現し、検索語保持部
IBと検索結果保持部MBと検索結果組合せ保持部OB
をメモリで実現した場合について説明したが、これらに
限定されるものでなく、光磁気ディスク装置など他の記
憶デバイス内に設けても良い。
【0028】尚、本発明は複数の機器から構成されるシ
ステムに適用しても、1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或は装置に、本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できることは言うまでもない。
【0029】以上説明したように本実施例にれば、検索
者に提示するための検索結果として、文書の表題文だけ
ではなく文書の主要文も用意するようにしたので、検索
者に文書の内容をわかりやすく提示でき、かつ複数の検
索結果を簡単に提示できるような形の検索結果を用意す
ることができるという効果が得られる。
【0030】
【発明の効果】以上説明したように本発明によれば、検
索された文書データの内容をわかりやすく表示すると共
に、検索された文書データが複数存在する時にも、それ
らを分かりやすく表示できる効果がある。
【図面の簡単な説明】
【図1】本実施例の文書検索装置の機能構成を示す機能
ブロック図である。
【図2】本実施例の文書検索装置の概略構成を示すブロ
ック図である。
【図3】本実施例の文書検索装置における検索処理の手
順を示すフローチャートである。
【図4】本実施例における検索語保持部に記憶された検
索語の一例を示す図である。
【図5】検索対象となる文書データの内容の一例を示す
図である。
【図6】検索された結果を記憶している保持部の内容の
一例を説明した図である。
【図7】本実施例の検索結果組合せ保持部に記憶された
内容の一例を説明した図である。
【符号の説明】
1 検索対象文書保持部 2 検索語保持部 3 検索処理部 4 検索結果保持部 5 表題文抽出部 6 主要文抽出部 7 検索結果組合せ保持部 21 制御メモリ 22 中央処理装置(CPU) 23 メモリ 24 ハードディスク装置 25 表示部 26 キーボード 27 バス

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 複数の文書データを記憶している文書フ
    ァイルより所望の文書データを検索する文書検索装置で
    あって、 検索対象の文書データを特定する検索語を入力して記憶
    する記憶手段と、 前記検索語に基づいて文書ファイルより、前記検索語を
    含む文書データを検索する検索処理手段と、 前記検索処理手段により検索された文書データを表す表
    題文章及び/或いは前記検索語の前後の文章を、前記文
    書データより抽出する抽出手段と、 前記抽出手段によって抽出された文章を表示する表示手
    段と、 を有することを特徴とする文書検索装置。
  2. 【請求項2】 複数の文書データを記憶している文書フ
    ァイルより所望の文書データを検索する文書検索方法で
    あって、 検索対象の文書データを特定する検索語を入力する工程
    と、 その入力された検索語に基づいて文書ファイルより、前
    記検索語を含む文書データを検索する工程と、 検索された文書データを表す表題文章及び/或いは前記
    検索語の前後の文章を前記抽出された文書データより抽
    出する工程と、 その抽出された文章を表示する工程と、 を有することを特徴とする文書検索方法。
JP4168965A 1992-06-26 1992-06-26 文書検索方法及び装置 Pending JPH0612454A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4168965A JPH0612454A (ja) 1992-06-26 1992-06-26 文書検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4168965A JPH0612454A (ja) 1992-06-26 1992-06-26 文書検索方法及び装置

Publications (1)

Publication Number Publication Date
JPH0612454A true JPH0612454A (ja) 1994-01-21

Family

ID=15877855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4168965A Pending JPH0612454A (ja) 1992-06-26 1992-06-26 文書検索方法及び装置

Country Status (1)

Country Link
JP (1) JPH0612454A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167164A (ja) * 1995-12-14 1997-06-24 Toshiba Corp 情報フィルタリング方法および情報フィルタリング装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09167164A (ja) * 1995-12-14 1997-06-24 Toshiba Corp 情報フィルタリング方法および情報フィルタリング装置

Similar Documents

Publication Publication Date Title
US5523945A (en) Related information presentation method in document processing system
JP2937519B2 (ja) 文書検索装置
JPH05324719A (ja) 文書検索システム
JPH0612454A (ja) 文書検索方法及び装置
JP3489331B2 (ja) 情報選択音声出力装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JPS6118074A (ja) プレ・エデイツト方式
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPS61262924A (ja) 電子フアイル装置
JPH0750486B2 (ja) キ−ワ−ド抽出装置
JPH08314950A (ja) テキストの検索方法及び装置
JPH02108157A (ja) 情報検索方法
JPH07182370A (ja) テキスト検索装置
JPH022458A (ja) 類似文書検索装置
JP3294966B2 (ja) 機械翻訳装置
JPH05250370A (ja) 文書検索装置
JP2003022276A (ja) 文書検索装置及び文書検索方法
JP2004005103A (ja) 類似文書検索装置および類似文書検索方法
JPH05165889A (ja) 文書検索装置
JPH02113368A (ja) 情報検索方法
JPH08153112A (ja) 文書作成装置及び文書作成方法
JPH08329107A (ja) 文書作成装置及び文書作成方法
JPS61265662A (ja) 文書処理装置
JPH0685169B2 (ja) 文書処理方式
JPH07249034A (ja) 文字列抽出処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000918