JPH0245876A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH0245876A
JPH0245876A JP63197412A JP19741288A JPH0245876A JP H0245876 A JPH0245876 A JP H0245876A JP 63197412 A JP63197412 A JP 63197412A JP 19741288 A JP19741288 A JP 19741288A JP H0245876 A JPH0245876 A JP H0245876A
Authority
JP
Japan
Prior art keywords
document
search
keyword
keywords
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63197412A
Other languages
English (en)
Inventor
Masahiro Kawai
眞宏 河合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63197412A priority Critical patent/JPH0245876A/ja
Publication of JPH0245876A publication Critical patent/JPH0245876A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明はテキストや画像などからなる文書を検索する文
書検索装置に関する。
従来の技術 従来の文書検索装置の構成図を第3図に示す。
この装置は、検索キーワード入力部1、文書記憶部2、
文書検索部3、文書出力部4、文書検索部3を起動する
検索指示部5を備え、検索キーワードを入力して検索を
指示すると、検索キーワードを有する文書を文書記憶部
2内の文書中から検索する。
発明が解決しようとする課題 従来の文書検索装置においては、文書検索を指示する際
、どのような文書を検索するがを指定するために複数の
検索キーワードを指定する必要があった。そのため、検
索キーワードの指定時にはキーワードの入力、選択など
の多くの操作が必要であった。
本発明は、従来の文書検索装置が有していた前記の課題
に鑑み、日本語文章中から抽出したキーワードを検索キ
ーワードとして用いることにより、文書検索の際の検索
条件設定に関わる操作を大幅に効率化し、さらに、検索
時にキーワードを意識させない文書検索装置を提供する
ことを目的とするものである。
さらに、本発明の別の目的は、キーワードを抽出する範
囲を任意に指定することにより、オペレータの要求に応
じた適切な文書を検索することを可能とする文書検索装
置を提供することである。
さらに、本発明の別の目的は、抽出された多数のキーワ
ード中から真に必要なキーワードのみを選択することを
可能とし、それらを検索条件として文書を検索する文書
検索装置を提供することである。
課題を解決するための手段 本発明は、前記の目的を達成するために、キーワードを
抽出する範囲を指定するキーワード抽出範囲指定部と、
指定された範囲内の日本語文章中からその内容を示すキ
ーワードを抽出するキーワード抽出部と、抽出されたキ
ーワードを記憶するキーワード記憶部と、検索条件を記
憶する検索条件記憶部と、文書と当該文書に付随するキ
ーと対応づけて多数記憶している文書記憶部と、検索条
件を満足する文書を文書記憶部から検索する文書検索部
と、検索文書を出力する文書出力部を具備した文書検索
装置を構成する。
また、本発明は、キーワード抽出範囲が文書単位である
ことを特徴とする文書検索装置を構成する。
また、本発明は、キーワード抽出範囲が文書中の任意の
文字列であることを特徴とする文書検索装置を構成する
さらに、キーワード抽出部の出力のうち必要なキーワー
ドを選択するキーワード選択部をも具備した文書検索装
置を構成する。
作用 本発明は前記した構成により、指定された範囲内の日本
語文章中からそのキーワードを抽出し、抽出されたキー
ワードを検索キーワードとして文書を検索する。
また、指定された範囲内の日本語文章中からそのキーワ
ードを抽出した後それらの中から必要に応じて選択し、
選択されたキーワードを検索キーワードとして文書を検
索する。
実施例 第1の実施例 第1図は、本発明の一実施例における文書検索装置のブ
ロック図を示すものである。
第1図において、12はキーワード抽出範囲指定部で、
後述するキーワード抽出部11によってキーワード抽出
処理の対象となる日本語文章列の範囲を指定するための
ものである。これは通常、マウス、タブレットなどのボ
インティング装置やカーソル装置などが用いられる。本
実施例では、表示文書中の文章内を文字単位で指定する
ことができるものとする。11はキーワード抽出部で、
キーワード抽出範囲指定部12により指定された範囲内
の日本語文章列からその内容を表わす重要語であるキー
ワードを抽出する。13はキーワード記憶部で、キーワ
ード抽出部12の出力である多数のキーワードを記憶す
る。14は検索条件記憶部で、キーワード記憶部13の
内容である複数個のキーワードを用いて検索条件を作成
し、記憶する。ここで検索条件は複数個のキーワードお
よび論理和や論理積などのキーワード間の論理関係構造
であるとする。16は文書記憶部で、複数個のキーワー
ドと文書とを対応づけて多数記憶している。15は文書
検索部で、検索条件記憶部14、に記憶されている検索
条件に該当するキーワードを付随して持つ文書を文書記
憶部16の中から検索し、該当する文書が存在すればそ
の文書を指定する情報を出力する。上記文書指定情報と
しては、当該文書が記憶されている文書記憶内の領域の
先頭アドレスが用いられる。ここで、文書検索部14は
検索条件に対して複数の文書を検索する場合には複数の
文書指定情報を出力する。また、該当する文書がなけれ
ば文書検索部15はその旨の情報を出力する。17は文
書出力部で、文書検索部15の出力である文書指定情報
で指定される文書を表示する。これは例えばデイスプレ
ィ装置や映像装置やプリンタ装置などが用いられる。ま
た文書検索部15が「該当文書熱し」の旨の情報を出力
した場合には、当該検索条件に該当する文書が文書記憶
部16中で検索できなかった旨の表示を行う。
上述のように構成された本発明の文書検索装置の動作を
以下に説明する。
検索動作 (1)オペレータは表示中の文書内のある特定の範囲た
とえば文書の概要を記述した段落に関連する文書を検索
したいと漠然と思ったとする。漠然という意味は、オペ
レータがその文書の分野に十分詳しくないために、どの
ような検索キーワードを用いて文書検索を行えばよいか
が明確でないとうことである。
(2)そこで、オペレータはキーワード抽出範囲指定部
12を用いて前記の文書の概要を記述した段落を構成す
る文章列を指定する。ここでは、キーワード抽出範囲は
文章中の字句単位に指定できる。
(3)キーワード抽出部11は、指定された文章中から
その内容を表わす重要語であるキーワードを抽出する。
そのようなキーワードは一般に複数個あるが、それらす
べてを抽出する。
(4)キーワード記憶部13は、キーワード抽出部12
の出力である複数のキーワードを記憶する。
(5)検索条件記憶部14は、キーワード記憶部13の
内容を用いて検索条件を作成し、記憶する。
ここで検索条件とは、いくつかの検索キーワードを論理
和で結合したものであるとする。
(6)文書検索部16は検索条件記憶部14に記憶され
ている内容を検索条件とみなしそれを溝たす文書を文書
記憶部16の中から検索する。文書記憶部16内に該当
する文書が存在すればその文書を指定する情報として、
文書記憶部16内の領域の先頭アドレスADHを出力す
る。ここで、ひとつの検索条件に対して複数の上記文書
指定情報ADRが出力されるものであってよい。また、
該当する文書がなければ文書検索部15はその旨の情報
Noを出力する。
(7)文書出力部17は文書検索部15から送出された
情報の内容にしたがい次の処理を行なう。
会情報の内容がADHの場合: これによって指定される文書を文書記憶部16から取り
出してこれを一時的に 記憶するかあるいは視覚情報などの他の状態に変換した
後を表示する。
・情報の内容がNOの場合: 当該検索条件に該当する文書が文書記憶部16中で検索
できなかった旨の表示を 行う。
(検索動作おわり) 上述のように本実施例においては、指定された範囲内の
文章列からキーワードを抽出し、得られたキーワードか
ら検索条件を作成し、その検索条件で文書を検索するこ
とができるため、検索条件を設定するための操作手数が
大幅に効率化できる。
さらに、オペレータはキーワードをまったく意識する必
要がないため、マンマシンインタフェイスが大幅に改善
される。さらに、本実施例の構成は、従来の文書検索装
置にキーワード抽出部を付加することにより実現できる
ため、従来の文書検索装置との整合性がよい。
なお、本実施例では、文書検索部は実検索条件に対して
複数の文書を検索した場合には複数の文書指定情報を出
力するものとしたが、複数の文書の中の特定の文書指定
情報だけを出力するものであってもよい。なお、本実施
例では、検索された文書の文書指定情報として当該文書
が記憶されている文書記憶群内の領域の先頭アドレスと
したが、文書の識別子などの文書を一意に識別する他の
情報を用いてもよい。なお、本実施例では、検索条件を
複数個のキーワードおよび論理和や論理積などのキーワ
ード間の論理関係構造としたが、その他の情報を含んで
もよい。
第2の実施例 第2図は、本発明の別の一実施例における文書検索装置
のブロック図を示すものである。
第2図において、22はキーワード抽出範囲指定部で、
後述するキーワード抽出部21によってキーワード抽出
処理の対象となる日本語文章列の範囲を指定するための
ものである。これは通常、マウス、タブレットなどのポ
インティング装置やカーソル装置などが用いられる。2
1はキーワード抽出部で、キーワード抽出範囲指定部2
2により指定された範囲内の日本語文章列からその内容
を表わす重要語であるキーワードを抽出する。23はキ
ーワード記憶部で、キーワード抽出部22の出力である
多数のキーワードを記憶する。24はキーワード選択部
で、キーワード記憶部23に記憶すれているキーワード
から真に必要なキーワードを選択する。選択するかどう
かはオペレータにより指示される。25は検索条件記憶
部で、キーワード選択部24の出力である複数個のキー
ワードを記憶し、さらにそれら用いて検索条件を作成し
、記憶する。ここで検索条件は複数個のキーワードおよ
び論理和や論理積などのキーワード間の論理関係構造で
あるとする。27は文書記憶部で、複数個のキーワード
と文書とを対応づけて多数記憶している。26は文書検
索部で、検索条件記憶部25に記憶されている検索条件
に該当するキーワードを付随して持つ文書を文書記憶部
27の中から検索し、該当する文書が存在すればその文
書を指定する情報を出力する。上記文書指定情報として
は、当該文書が記憶されている文書記憶内の領域の先頭
アドレスが用いられる。ここで、文書検索部25は検索
条件に対して複数の文書を検索する場合には複数の文書
指定情報を出力する。
また、該当する文書がなければ文書検索部26はその旨
の情報を出力する。28は文書出力部で、文書検索部2
6の出力である文書指定情報で指定される文書を表示す
る。これは例えばティスプレィ装置や映像装置やプリン
タ装置などが用いられる。また文書検索部26が「該当
文書無し」の旨の情報を出力した場合には、当該検索条
件に該当する文書が文書記憶部27中で検索できなかっ
た旨の表示を行う。
上述のように構成された本発明の文書検索装置の動作を
以下に説明する。
検索動作 (1)オペレータはある文書に関連する文書を検索した
いと漠然と思ったとする。漠然という意味は、オペレー
タがその文書の分野に十分詳しくないために、どのよう
な検索キーワードを用いて文書検索を行えばよいかが明
確でないとうことである。
(2)そこで、オペレータはキーワード抽出範囲指定部
22を用いて文書全体を指定する。ここでは、キーワー
ド抽出範囲は文書単位で指定できるものとする。例えば
、オペレータは、文書名−覧から該当文書を選択する。
(3)キーワード抽出部21は、指定された文書内のす
べての文章からその内容を表わす重要語であるキーワー
ドを抽出する。そのようなキーワードは一般に複数個あ
るが、それらすべてを抽出する。
(4)キーワード記憶部23は、キーワード抽出部22
の出力である複数のキーワードを記憶する。
(5)キーワード選択部24は、キーワード記憶部23
中の多数のキーワードの中から必要なものをオペレータ
により選択可能とする。
(6)検索条件記憶部25は、キーワード選択部24で
選択されたキーワードを記憶するとともに、それらを使
って検索条件を作成し、記憶する。ここで検索条件とは
、いくつかの検索キーワードを論理和で結合したもので
あるとする。
(7)文書検索部27は検索条件記憶部25に記憶され
ている内容を検索条件とみなしそれを満たす文書を文書
記憶部27の中から検索する。文書記憶部27内に該当
する文書が存在すればその文書を指定する情報として、
文書記憶部27内の領域の先頭アドレスADRを出力す
る。ここで、ひとつの検索条件に対して複数の上記文書
指定情報ADRが出力されるものであってよい。また、
該当する文書がなければ文書検索部26はその旨の情報
Noを出力する。
(8)文書出力部28は文書検索部26がら送出された
情報の内容にしたがい次の処理を行なう。
・情報の内容がADRの場合: これによって指定される文書を文書記憶部27から取り
出してこれを一時的に 記憶するかあるいは視覚情報などの他の状態に変換した
後を表示する。
・情報の内容がNoの場合: 当該検索条件に該当する文書が文書記憶部27中で検索
できなかった旨の表示を 行う。
(検索動作おわり) 上述のように本実施例においては、指定された範囲内の
文章列からキーワードを抽出し、得られたキーワードか
ら検索条件を作成し、その検索条件で文書を検索するこ
とができるため、検索条件を設定するための操作手数が
大幅に効率化できる。
さらに、キーワード抽出部によって得られたキーワード
から真に必要なものだけを選択することが可能であるた
め、オペレータが必要とするキーワードのみを用いて精
度の良い文書検索が可能であるとともに、キーワード抽
出部により得られるキーワードの信顆性が低い場合にお
いてもオペレータによる検索キーワードの補正が可能と
なる。さらに、本実施例の構成は、従来の文書検索装置
にキーワード抽出部を付加することにより実現できるた
め、従来の文書検索装置との整合性がよい。
なお、本実施例では、文書検索部は実検索条件に対して
複数の文書を検索した場合には複数の文書指定情報を出
力するものとしたが、複数の文書の中の特定の文書指定
情報だけを出力するものであってもよい。なお、本実施
例では、検索された文書の文書指定情報として当該文書
が記憶されている文書記憶群内の領域の先頭アドレスと
したが、文書の識別子などの文書を一意に識別する他の
情報を用いてもよい。なお、本実施例では、検索条件を
複数個のキーワードおよび論理和や論理積などのキーワ
ード間の論理関係構造としたが、その他の情報を含んで
もよい。
発明の効果 本発明の文書検索装置においては、指定された範囲内の
文章列からキーワードを抽出し、得られたキーワードか
ら検索条件を作成し、その検索条件で文書を検索するこ
とができるため、検索条件を設定するための操作手数が
大幅に効率化できる。
さらに、本実施例の構成は、従来の文書検索装置にキー
ワード抽出部を付加することにより実現できるため、従
来の文書検索装置との整合性がよい。
また、オペレータはキーワードをまったく意識する必要
がないため、マンマシンインタフェイスが大幅に改善さ
れる。
また、キーワード抽出部によって得られたキーワードか
ら真に必要なものだけを選択することが可能であるため
、オペレータが必要とするキーワードのみを用いて精度
の良い文書検索が可能であるとともに、キーワード抽出
部により得られるキーワードの信顆性が低い場合におい
てもオペレータによる検索キーワードの補正が可能とな
る。これらにより、その実用的効果は大きい
【図面の簡単な説明】
第1図は本発明の一実施例の文書検索装置のブロック図
、第2図は本発明の別の一実施例の文書検索装置のブロ
ック図、第3図は従来の文書検索装置のブロック図であ
る。 11・・・キーワード抽出部、12・・・キーワード抽
出範囲指定部、14・・・検索条件記憶部、15・・・
文書検索部、16・・・文書記憶部、17・・・文書出
力部、21・・・キーワード抽出部、22・・・キーワ
ード抽出範囲指定部、24・・・検索キー選択部、25
拳・・検索条件記憶部、26・・φ文書検索部、27拳
・・文書記憶部、28・・・文書出力部。

Claims (4)

    【特許請求の範囲】
  1. (1)キーワードを抽出する範囲を指定するキーワード
    抽出範囲指定部と、指定された範囲内の日本語文章中か
    らその内容を示すキーワードを抽出するキーワード抽出
    部と、抽出されたキーワードを記憶するキーワード記憶
    部と、検索条件を記憶する検索条件記憶部と、文書と当
    該文書に付随するキーワードとを対応づけて多数記憶し
    ている文書記憶部と、検索条件を満足する文書を文書記
    憶部から検索する文書検索部と、検索文書を出力する文
    書出力部を具備し、指定された範囲内から抽出したキー
    ワードを有する文書を検索することを特徴とする文書検
    索装置。
  2. (2)キーワード抽出範囲が文書単位であることを特徴
    とする特許請求の範囲第1項の文書検索装置。
  3. (3)キーワード抽出範囲が文書中の任意の文字列であ
    ることを特徴とする特許請求の範囲第1項の文書検索装
    置。
  4. (4)キーワード抽出部の出力のうち必要なキーワード
    を選択するキーワード選択部を具備し、抽出されたキー
    ワードのうち必要なキーワードのみを検索キーワードと
    することを特徴とする特許請求の範囲第1項の文書検索
    装置。
JP63197412A 1988-08-08 1988-08-08 文書検索装置 Pending JPH0245876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63197412A JPH0245876A (ja) 1988-08-08 1988-08-08 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63197412A JPH0245876A (ja) 1988-08-08 1988-08-08 文書検索装置

Publications (1)

Publication Number Publication Date
JPH0245876A true JPH0245876A (ja) 1990-02-15

Family

ID=16374085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63197412A Pending JPH0245876A (ja) 1988-08-08 1988-08-08 文書検索装置

Country Status (1)

Country Link
JP (1) JPH0245876A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263516A (ja) * 1995-03-28 1996-10-11 Canon Inc 情報検索方法及びその装置
JPH10171818A (ja) * 1996-12-05 1998-06-26 Casio Comput Co Ltd 通信制御装置及び記憶媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08263516A (ja) * 1995-03-28 1996-10-11 Canon Inc 情報検索方法及びその装置
JPH10171818A (ja) * 1996-12-05 1998-06-26 Casio Comput Co Ltd 通信制御装置及び記憶媒体

Similar Documents

Publication Publication Date Title
KR100489913B1 (ko) 문서표시시스템및전자사전
US5761666A (en) Document retrieval system
JP3134204B2 (ja) 情報検索用端末装置及び情報検索用端末装置における情報表示・入出力方法
JP2000148748A (ja) 仮名漢字変換及び画像検索表示システム
US5899989A (en) On-demand interface device
JPH08161339A (ja) 文字列変換装置
JPH07192020A (ja) 文書情報検索装置
JPH0395673A (ja) 文章間リンク設定方法およびその装置
JPH08171569A (ja) 文書検索装置
JPH10293765A (ja) 対訳例文検索装置
JPH0581326A (ja) データベース検索装置
JPH0245876A (ja) 文書検索装置
JPS6378228A (ja) 情報検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP3222193B2 (ja) 情報検索装置
JP3714723B2 (ja) 文書表示システム
JPH05181912A (ja) 文書検索装置
JP3056810B2 (ja) 文書検索方法および装置
JPH08147289A (ja) かな漢字変換システム及びかな漢字変換方法
JPH0793345A (ja) 文書検索装置
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP4034503B2 (ja) 文書検索システムおよび文書検索方法
JPH07210565A (ja) 情報検索方法及び装置
JP2786211B2 (ja) 機械翻訳装置における後編集装置
JPH08153112A (ja) 文書作成装置及び文書作成方法