JPH09259146A - 文書検索装置及びその方法 - Google Patents

文書検索装置及びその方法

Info

Publication number
JPH09259146A
JPH09259146A JP8072336A JP7233696A JPH09259146A JP H09259146 A JPH09259146 A JP H09259146A JP 8072336 A JP8072336 A JP 8072336A JP 7233696 A JP7233696 A JP 7233696A JP H09259146 A JPH09259146 A JP H09259146A
Authority
JP
Japan
Prior art keywords
keyword
document
search
reduced
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8072336A
Other languages
English (en)
Other versions
JP3787384B2 (ja
Inventor
Takayoshi Odate
貴義 大館
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP07233696A priority Critical patent/JP3787384B2/ja
Publication of JPH09259146A publication Critical patent/JPH09259146A/ja
Application granted granted Critical
Publication of JP3787384B2 publication Critical patent/JP3787384B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】検索のために指示したキーワードが完全に一致
しなくても、もっともらしい検索結果を得ることが可能
な文書検索装置及びその方法を提供する。 【解決手段】キーワード辞書108には文書検索に用い
る複数のキーワードが登録される。縮小キーワード生成
部16は、キーワード辞書108に登録されているキー
ワードと、該キーワードより派生した縮小キーワードと
を対応づけて縮小キーワードインデックスに登録する。
キーワード登録部13は、文書とキーワード辞書108
より選択されたキーワードとを対応づけるキーワードイ
ンデックスを生成する。縮小キーワード検索部18は、
入力された検索用のキーワードより検索用の縮小キーワ
ードを派生し、派生した縮小キーワードから派生元とし
て対応付けられているキーワードを縮小キーワードイン
デックスから獲得し、獲得されたキーワードを用いてキ
ーワードインデックスを検索して文書検索を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文書を登録し、キー
ワードを指示することにより文書を検索する文書検索装
置及びその方法に関するものである。
【0002】
【従来の技術】従来、文書検索装置では文書登録時に検
索するためのキーワードを同時に登録しておく必要があ
った。また、登録文書に対して構文解析を行ったり、キ
ーワード辞書とのマッチングを行ったりして、キーワー
ドを登録文書の中から抽出する方法も提案されており、
キーワード登録する作業を軽減する装置も存在する。ま
た、検索時に指示されたキーワードから想定される同義
語や類義語を含めた検索が可能な文書検索装置も提案さ
れている。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の文書検索装置では、検索時に指定するキーワードは
文書登録時に登録したキーワードを正確に指示する必要
があり、キーワードが一致しないと検索できないという
問題があった。同義語、類義語を含めて検索する装置に
おいても、関連語で検索ができるようにはなるものの、
キーワードが一致しなければ検索できないという問題は
残されていた。
【0004】本発明は上記問題に鑑みなされたもので、
検索のために指示したキーワードが完全に一致しなくて
も、もっともらしい検索結果を得ることが可能な文書検
索装置及びその方法を提供することを目的とする。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めの本発明の文書検索装置は以下の構成を備えるもので
ある。即ち、文書検索に用いる複数のキーワードが登録
されたキーワード辞書と、前記キーワード辞書に登録さ
れているキーワードと、該キーワードより派生した、よ
り少ない字数の縮小キーワードとを対応づけて登録した
第1リストと、複数の文書と前記キーワード辞書より選
択されたキーワードとを対応づけて登録した第2リスト
と、入力された検索用のキーワードより検索用の縮小キ
ーワードを派生する派生手段と、前記検索用の縮小キー
ワードから派生元として対応付けられているキーワード
を前記第1リストから獲得し、獲得されたキーワードを
用いて前記第2リストを検索して文書検索を行う検索手
段とを備える。
【0006】また、好ましくは、前記キーワード辞書に
登録されているキーワードから、該キーワードより少な
い字数の縮小キーワードを派生させ、該キーワードに対
応づけて登録することにより前記第1リストを生成する
第1生成手段を更に備える。
【0007】また、好ましくは、前記キーワード辞書に
新たなキーワードが登録された場合に、前記第1生成手
段を起動する起動手段を更に備える。
【0008】また、好ましくは、登録すべき文書の文字
列と前記キーワード辞書に基づいて該登録すべき文書の
キーワードを抽出し、該登録すべき文書を該抽出された
キーワードに対応づけて登録することにより前記第2リ
ストを生成する第2生成手段を更に備える。
【0009】また、好ましくは、前記第1リストに登録
される縮小キーワードは、全て同じ文字数であり、2文
字以上の長さを有する。
【0010】また、好ましくは、前記検索手段において
複数の縮小キーワードを用いて行われた検索の結果に基
づいて、各文書のキーワードの前記検索用キーワードに
対する一致度数を算出する算出手段を更に備える。
【0011】また、好ましくは、前記算出手段は、前記
検索手段で用いられた縮小キーワードの数と、縮小キー
ワードに基づいて獲得された派生元のキーワードによっ
て検索された回数との割合を一致度数として求める。こ
とを特徴とする請求項6に記載の文書検索装置。
【0012】また、好ましくは、前記検索手段によって
検索された文書を前記算出手段で算出された一致度数と
ともに表示する表示手段を更に備える。
【0013】
【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な一実施形態を説明する。
【0014】図1は本実施形態における電子ファイリン
グシステムの機能構成を表すブロック図である。図1に
おいて、1は電子ファイリングシステムの全体を示す。
本実施形態の電子ファイリングシステム1は、文書登録
部11、文書記憶部12、キーワード登録部13、キー
ワード記憶部14、キーワード検索部15、縮小キーワ
ード生成部16、縮小キーワード記憶部17、縮小キー
ワード検索部18、一致度数算出部19とから概略構成
されている。
【0015】文書登録部11は、紙やフロッピーディス
クなどから文書を読み込み、文書記憶部12に文書デー
タを格納する。文書記憶部12は、文書登録部11によ
って読み込まれた文書データを格納する。
【0016】キーワード登録部13は文書記憶部12に
記憶された文書データを検索するために、その文書デー
タに対応したキーワードをキーワード辞書108とのマ
ッチングにより抽出し、キーワード記憶部14に登録す
る。キーワード記憶部14は、文書記憶部12に記憶さ
れた文書とキーワード登録部13によって登録されたキ
ーワードとの対応関係を記憶する。
【0017】キーワード検索部15は、ユーザによって
指定されたキーワードに基づいてキーワード記憶部14
に記憶されているキーワードを指示し、文書記憶部12
に記憶されている文書を検索する。以上の11〜15の
機能構成によれば、一般的な完全一致検索が実現され
る。
【0018】縮小キーワード生成部16は、あらかじめ
キーワード辞書1018中のキーワードをより短い縮小
キーワードに分解して、縮小キーワード記憶部17へ記
憶する。縮小キーワード記憶部17は、縮小キーワード
生成部16によって生成された縮小キーワードを記憶す
る。なお、縮小キーワード記憶部17において、記憶さ
れている縮小キーワードは、キーワード辞書108内の
当該キーワードの派生元のキーワードと関連付けされて
いる。詳しくは、後述する。
【0019】縮小キーワード検索部18は、ユーザによ
って検索時に指示されたキーワードを縮小キーワードに
分解し、縮小キーワード記憶部17を参照して派生元と
なるキーワードをキーワード辞書108から求め、さら
に、求めたキーワードを用いて、キーワード記憶部14
から関連の深い文書を検索する。
【0020】一致度数算出部19は、縮小キーワード検
索部18によって求められた検索結果から、検索要求に
どの程度合致しているかを示す値を算出する。従って、
ユーザは、一致度数算出部19によって算出された度数
を参照することにより、適切な文書を選択できる。以上
のように、16〜19で示される機能構成により、曖昧
検索を実現することが可能となる。
【0021】以上のような構成の電子ファイリングシス
テム1によれば、通常使われるキーワード検索部15に
よって該当する文書が検索できない場合は、縮小キーワ
ード検索部18によってキーワードが完全に一致しなく
ても文書を検索することができるようになる。以下、図
面を参照して本実施形態の電子ファイリングシステムの
構成、動作を更に具体的に説明する。
【0022】図2は本実施形態による文書検索装置の構
成を示すブロック図である。図2において、101はC
PU(マイクロプロセッサ)である。このCPU101
は、文書の登録、キーワードの登録、縮小キーワードに
よる文書検索などを行うため、即ち上記の各機能構成を
実現するため、バス102を介して、当該バス102に
接続された各構成要素を制御するものである。なお、バ
ス102は、アドレスバス、コントロールバス、および
データバスからなる共通バスである。即ち、このバス1
02を利用して、バス102に接続された各機器相互間
のアドレス信号、制御信号、および各種データの転送が
行われることになる。
【0023】103は入力装置であり、キーボードやマ
ウスなどから構成され、電子ファイリングシステムの文
書の登録、検索作業に係る動作を指示するための選択機
能を持ったスイッチが設けられている。104はスキャ
ナであり、紙の形態の文書を読み込み、画像データとし
て本装置に取り込むことができる。なお、本実施形態で
は、読み込まれた画像データから文字を抽出するOCR
機能を備えており、画像データより抽出、認識された文
字を文字コードに変換して保管することも可能である。
【0024】105はROM、即ち読み出し専用メモリ
である。このROM105には、あらかじめCPU10
1の制御手順を記憶させてあり、これにより、文書の登
録、キーワードの登録、縮小キーワードの生成、検索な
どの本実施形態に係わる各種処理を行うことができる。
106はRAM(ランダムアクセスメモリ)であり、文
書の登録、キーワードの登録、縮小キーワードの生成、
検索結果の集計、表示データの作成などの各種処理をC
PU101が実行するためのワークメモリ、各構成要素
の制御のための一時記憶として用いられる。
【0025】107は外部記憶装置であり、電源を切っ
ても記憶内容が消滅しない二次記憶を提供する。外部記
憶装置107は、文書記憶部12が検索のための文書を
記憶するための記憶領域、キーワード記憶部14がキー
ワードを登録する記憶領域、縮小キーワード記憶部17
が縮小キーワードを登録する記憶領域等の各主記憶領域
を提供する。
【0026】108はキーワード辞書であり、文書検索
に用いられる各種キーワードが登録されている。キーワ
ード辞書108は、縮小キーワード生成部によって予め
縮小キーワードを生成しておいたり、登録された文書か
ら検索に必要な単語をキーワードとして抽出するために
利用される。
【0027】109は表示制御部であり、RAM106
内の表示データを表示器110に表示するための制御を
行う。110は、陰極線管や液晶などで構成される表示
器である。111はキャラクタジェネレータであり、文
書データ中の文字コードに基づいて該当する文字イメー
ジを生成し、RAM106中に表示データとして格納す
る。
【0028】図3はキーワード記憶部14によって記憶
される文書検索のためのキーワードインデックスのデー
タ構成を示す図である。14aはキーワードインデック
スであり、登録文書の文書番号と、登録文書に登録され
たキーワードとの関係を記憶する。例えば、文書番号A
AAの登録文書は、「あさ」というキーワードと対応付
けられている。キーワードインデックス14aにおける
このようなキーワード登録文書との対応づけは、キーワ
ード登録部13によって行われる。即ち、キーワード登
録部13は、文書登録時にキーワード辞書108とのマ
ッチングによってキーワードを抽出し、キーワードイン
デックス14aに登録し、同時に当該登録文書の文書番
号を対応づけて登録する。なお、キーワードインデック
ス14aにキーワードが既に存在する場合は、文書番号
の領域に文書番号のみが追加される。
【0029】図4はキーワード辞書108のデータ構成
例を表す図である。各キーワードには、ユニークなキー
番号が登録されている。このキー番号は、後述する縮小
キーワードの生成時において、各縮小キーワードの派生
元のキーワードを特定するために用いられる、図5は縮
小キーワード記憶部17によって生成される縮小キーワ
ードインデックス17aのデータ構成例を示す図であ
る。本実施形態の縮小キーワードインデックス17aに
は、予め、キーワード辞書108の各キーワードを2文
字ごとに区切った縮小キーワードと、キーワード辞書1
08のキーワード(即ち縮小キーワードの派生元のキー
ワード)との関係を示すキー番号が登録されている。な
お、縮小キーワードはキーワード辞書108中のキーワ
ードを固定長の文字数に分解することにより容易に生成
することができる。
【0030】図6は、本実施形態による縮小キーワード
を用いた曖昧検索処理を説明する図である。同図では、
ユーザより指定された指示検索キーワード61を検索縮
小キーワード62に分解し、縮小キーワード記憶部17
の縮小キーワードインデックス17aとキーワード辞書
108、およびキーワード記憶部14のキーワードイン
デックス14aを参照して該当文書の一覧を生成する過
程が示されている。
【0031】指示検索キーワード61は検索時に入力さ
れたキーワードであり、本例では、「あさり」が指示さ
れた場合が示されている。指示検索キーワード61より
2文字ずつを抽出し、検索縮小キーワードを生成する。
ここでは、「あさり」より抽出される2文字によって検
索縮小キーワードが生成され、「あさ」,「さり」の2
つの検索縮小キーワード62を得ることができる。
【0032】この検索縮小キーワード62を検索キーと
して縮小キーワードインデックス17a(図5)を検索
する。この結果、検索縮小キーワード「あさ」からは対
応するキーワード辞書108中のキーワードのキー番
号、「1」と「2」が得られる。そして、キーワード辞
書108(図4の108a)を参照することにより、キ
ー番号1,2に対応するキーワードとして「あさ」と
「あさり」が得られる。さらに、この2つのキーワード
により図1のキーワード記憶部14で登録されたキーワ
ードインデックス14aを検索して、文書番号AAAお
よびBBBの登録文書が該当することがわかる。この結
果、検索結果を格納する検索結果リスト63には、図6
の63aで示すような検索結果が格納される。
【0033】同様にして検索縮小キーワード「さり」に
対応するキー番号としては、「2」と「3」が得られ、
キーワード辞書108を参照することで、「あさり」と
「くさり」がキーワードとして得られる。これらのキー
ワードを用いてキーワードインデックス14aを検索す
ることで、文書番号BBBおよびCCCを得ることがで
きる。以上の検索処理により、検索結果リスト63とし
て63bで示すようなリストが作成される。
【0034】検索結果リスト63には、検索縮小キーワ
ードによって検索された文書番号と該当した回数が記録
されている。図6では、文書番号BBBの登録文書が、
「あさ」と「さり」の両方の縮小キーワードで検索され
たので、該当回数が2回となっている。また、上記例に
おいて、文書番号AAAは検索縮小キーワード「あさ」
に、文書番号CCCは検索縮小キーワード「さり」に該
当したので、検索縮小キーワードに該当した回数は各1
回となっている。
【0035】図7は検索結果リスト71の該当回数か
ら、一致度数を求めた結果を示す図である。図7におい
て、一致度数は指示された検索キーワードを検索縮小キ
ーワードに分解して検索に使用した数に対し、実際に検
索して該当した回数の割合を求めることにより、最大を
1とする一致度数を求めることができる。計算式で示す
と以下のようになる。即ち、 一致度数 = 該当回数 / 検索縮小キーワードの数 …(1) である。ここで、検索縮小キーワードの数は 検索縮小キーワードの数 = 検索キーワードの長さ − (縮小キーワードの長さ −1) …(2) で表される。
【0036】図8は、本実施形態の電子ファイリングシ
ステムにおいて完全一致検索を実行した場合に表示器に
表示される結果の配置例を示す図である。図8におい
て、81は文書登録を指示する登録ボタン、82は検索
を指示する検索ボタン、83は完全一致で検索の実行を
すべく検索モードの設定を指示する完全一致ボタン、8
4は縮小キーワードによる曖昧検索の実行をすべく検索
モードの設定を指示する曖昧ボタンである。また、85
は検索結果を表示する領域を示している。
【0037】各ボタンの選択または指示は、入力装置1
03としてのキーボードに配置されたキーの操作、或は
マウスの操作によって行われる。検索結果の表示は、図
7に示した検索結果リスト71の内容に、検索された登
録文書の登録日、コメントなどの文書情報を付加して表
示される。図8では完全一致検索の結果であるので、一
致度数=1の文書だけが表示されている。
【0038】図9は本実施形態の電子ファイリングシス
テムにおいて曖昧検索を実行した場合に表示器に表示さ
れる結果の配置例を示す図である。即ち、検索縮小キー
ワードによる検索結果として、検索キーワードの一部が
一致した文書も表示される場合の表示例である。本例で
は、検索結果として文書AAA,BBB,CCCが一致
度数の大きい順にソートされて表示されている。
【0039】以上説明した本実施形態の電子ファイリン
グシステムの動作について、図10、図11のフローチ
ャートを参照して更に説明する。
【0040】図10は、縮小キーワードインデックス1
7aの生成手順を表すフローチャートである。本フロー
チャートは、縮小キーワードインデックス17aが未作
成の状態にある場合、或はキーワード辞書108に新た
なキーワードが登録されたり、不要なキーワードが削除
された場合に起動される。
【0041】図10において、ステップS101では初
期設定を行う。次に、ステップS102において、キー
ワード辞書108より、縮小キーワードが未登録のキー
ワードを抽出して、縮小キーワードを生成する。縮小キ
ーワードの生成は、上述のようにキーワードから2文字
を順次取り出して縮小キーワードとする。なお、縮小キ
ーワードの文字数は2文字に限らない。ステップS10
3では、得られた縮小キーワードを、その派生元である
キーワードのキー番号とともに登録する。ステップS1
04では、キーワード辞書108にまだ縮小キーワード
の生成処理を行っていないキーワードが有るか否かを判
定する。未処理のキーワードがあればステップS102
へ戻り、未処理のキーワードについて縮小キーワードの
生成、登録を行う。
【0042】以上のような処理によって、縮小キーワー
ドインデックス17aが生成される。
【0043】図11は、本実施形態による文書ファイリ
ングシステムの文書登録および文書検索の手順を示すフ
ローチャートである。ステップS1では初期設定が行わ
れる。次に、ステップS2において、指示された処理内
容を判定する。ここで処理内容の指示は、図8、図9で
示した登録ボタン81、検索ボタン82を操作すること
で行われる。
【0044】登録ボタン81が指示されると、ステップ
S3へ進み、登録すべき文書を読み込む。ここで、文書
は、外部記憶装置107より読み出して得られた文書デ
ータでも良いし、スキャナ104を動作させて原稿画像
を読み取って得られた文書データでもよい。次に、ステ
ップS4は、キーワード登録部13がキーワード辞書1
08を参照して、ステップS3で取り込んだ文書データ
に対応するキーワードを獲得する。次にステップS5に
おいて、当該文書データを登録文書として外部記憶装置
107に格納し、文書番号を付与して登録する。続い
て、ステップS6においてキーワードの登録を行う。即
ち、ステップS5で付与された文書番号とステップS4
で獲得されたキーワードを用いて、キーワードインデッ
クス14aへの登録が行われる。
【0045】以上のようにして、登録ボタン81を操作
することにより、当該電子ファイリングシステムへの文
書の登録が行われる。
【0046】一方、ステップS2において検索ボタン8
2が指示されると、ステップS7へ進み、入力された検
索キーワードが獲得される。ステップS8では、完全一
致検索か曖昧検索のいずれが指示されたかを判断する。
そして、完全一致ボタン83が指示された場合はステッ
プS9へ、曖昧ボタン84が指示された場合はステップ
S14へそれぞれ進む。
【0047】ステップS9では、キーワード検索部15
による完全一致検索が行われる。即ち、入力されたキー
ワードでキーワードインデックス14aを検索し、入力
されたキーワードに対応付けられて登録されている文書
番号を獲得する。そして、獲得された文書番号を、図6
で示したような検索結果リスト63に登録する。ここ
で、当該検索が完全一致検索であるので、一致度数には
1.0が記録される(ステップS11)。
【0048】一方、曖昧検索が指示された場合は、ステ
ップS14において、ステップS7で獲得した検索キー
ワードから検索縮小キーワード62を生成する(図6参
照)。次に、ステップS15において、縮小キーワード
検索部18による検索を行う。ここでは、図6で説明し
たように、検索縮小キーワードを用いて縮小キーワー
ドインデックス17aを検索し、縮小キーワードの派
生元であるキーワードのキー番号を取得し、得られた
キー番号のキーワードをキーワード辞書108より獲得
し、獲得されたキーワードでキーワードインデックス
14aを検索して該当する文書番号を獲得する。
【0049】ステップS16では、ステップS15の検
索結果に基づいて検索結果リスト63(図6)を生成す
る。そして、ステップS17において、上記式(1)、
(2)を用いて各登録文書の一致度を算出し、これを検
索結果リストの一致度数として記録する。
【0050】ステップS12では、上記ステップS11
或はステップS17で最終的に得られる検索結果リスト
に基づいて表示用のリストを生成する。即ち、検索結果
リストの挙げられた各文書について、登録日時や、ファ
イルサイズ等の付属情報を獲得して、リストに記録す
る。ステップS13では、表示リスト内の各文書の順序
を、ファイル名順や日付順でソートし、これをRAM1
06の表示用データに格納する。
【0051】以上のようにして、完全一致検索或は曖昧
検索のうちの所望の検索モードで文書検索を行うことが
可能となり、図8、図9で示すような検索結果表示を行
うことができる。
【0052】以上説明したように本実施形態によれば、
予め、キーワード辞書中のキーワードから縮小キーワー
ドを生成、登録しておき、これを文書検索に用いること
で、文書検索時に指示する検索キーワードと登録文書に
登録されているキーワードが完全に一致しなくても検索
の実行が可能な曖昧検索を可能とし、もっともらしい検
索結果を得ることができるという効果がある。
【0053】また、図5の縮小キーワードインデックス
において、キーワード辞書においてキーワード毎に割り
当てられたキー番号を用いて縮小キーワードの派生元の
キーワードを登録してあるので、キーワードインデック
スのメモリ容量が節約される。
【0054】なお、本発明は、複数の機器(例えばホス
トコンピュータ,インタフェイス機器,リーダ,プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機,ファクシミリ装置
など)に適用してもよい。
【0055】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0056】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0057】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク,ハードディス
ク,光ディスク,光磁気ディスク,CD−ROM,CD
−R,磁気テープ,不揮発性のメモリカード,ROMな
どを用いることができる。
【0058】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0059】さらに、記憶媒体から読出されたプログラ
ムコードが、コンピュータに挿入された機能拡張ボード
やコンピュータに接続された機能拡張ユニットに備わる
メモリに書込まれた後、そのプログラムコードの指示に
基づき、その機能拡張ボードや機能拡張ユニットに備わ
るCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0060】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図12のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。
【0061】すなわち、少なくとも「派生処理モジュー
ル」および「検索処理モジュール」のプログラムコード
を記憶媒体に格納すればよい。
【0062】なお、上記モジュールは、文書検索に用い
る複数のキーワードが登録されたキーワード辞書108
と、前記キーワード辞書に登録されているキーワードと
該キーワードより派生した、より少ない字数の縮小キー
ワードとを対応づけて登録した縮小キーワードインデッ
クス17aと、複数の文書とキーワード辞書108より
選択されたキーワードとを対応づけて登録したキーワー
ドインデックス14aとを有する文書検索装置におい
て、上記実施形態の制御を実現するためのプログラム構
成である。
【0063】ここで、派生処理は、入力された検索用の
キーワードより検索用の縮小キーワードを派生する処理
を行う。また、検索処理は、派生処理で得られた検索用
の縮小キーワードから派生元として対応付けられている
キーワードを縮小キーワードインデックスより獲得し、
獲得されたキーワードを用いてキーワードインデックス
を検索して文書検索を行う処理である。
【0064】なお、上記実施形態で説明したような、キ
ーワードインデックス14aを生成する処理プログラム
や、縮小キーワードインデックス17aを生成する処理
プログラム等を含ませてもよいことはいうまでもない。
【0065】
【発明の効果】以上説明したように本発明によれば、検
索のために指示したキーワードが完全に一致しなくて
も、もっともらしい検索結果を得ることが可能となる。
【0066】また、本発明の他の構成によれば、キーワ
ード辞書に登録されているキーワードから、該キーワー
ドより少ない字数の縮小キーワードを派生させ、該キー
ワードに対応づけて登録することが可能となる。このた
め、例えば、キーワード辞書に新たなキーワードを登録
した場合や、全く新しいキーワード辞書を採用しようと
した場合に、自動的に縮小キーワードを派生し、登録す
ることが可能となり、運用が容易となる。
【0067】また、本発明の他の構成によれば、キーワ
ード辞書に新たなキーワードが登録された場合に、当該
キーワードより派生する縮小キーワードの登録処理が起
動されるので、操作性が向上する。
【0068】また、本発明の他の構成によれば、キーワ
ード辞書を参照して登録すべき文書に含まれるキーワー
ドを抽出し、該登録すべき文書を該抽出されたキーワー
ドに対応づけて登録する手段を設けたので、予め縮小キ
ーワードが登録されているキーワード辞書に基づいたキ
ーワードで文書登録を行うことが容易にでき、装置の運
用がより容易となる。
【0069】また、本発明の他の構成によれば、登録さ
れる縮小キーワードは、全て同じ文字数であり、2文字
以上の長さを有する。縮小キーワードの文字数を等しく
したので、検索のために入力されたキーワードより検索
用の縮小キーワードを生成したり、縮小キーワードを登
録したりする構成が簡素化される。
【0070】また、本発明の他の構成によれば、複数の
縮小キーワードを用いて行った検索結果に基づいて、検
索された各文書のキーワードの前記検索用キーワードに
対する一致度数が算出される。このため、使用者は、一
致度数を参照することにより、検索された複数の文書か
ら所望の文書をより容易に見つけることができるように
なる。
【0071】
【図面の簡単な説明】
【図1】本実施形態における電子ファイリングシステム
の機能構成を表すブロック図である。
【図2】本実施形態による文書検索装置の構成を示すブ
ロック図である。
【図3】キーワード記憶部14によって記憶される文書
検索のためのキーワードインデックスのデータ構成を示
す図である。
【図4】キーワード辞書のデータ構成例を表す図であ
る。
【図5】縮小キーワード記憶部によって生成される縮小
キーワードインデックスのデータ構成例を示す図であ
る。
【図6】本実施形態による縮小キーワードを用いた曖昧
検索処理を説明する図である。
【図7】検索結果リスト71の該当回数から、一致度数
を求めた結果を示す図である。
【図8】本実施形態の電子ファイリングシステムにおい
て完全一致検索を実行した場合に表示器に表示される結
果の配置例を示す図である。
【図9】本実施形態の電子ファイリングシステムにおい
て曖昧検索を実行した場合に表示器に表示される結果の
配置例を示す図である。
【図10】縮小キーワードインデックスの生成手順を表
すフローチャートである。
【図11】本実施形態による文書ファイリングシステム
の文書登録および文書検索の手順を示すフローチャート
である。
【図12】本発明に係るプログラムの構造的特徴を示す
図である。
【符号の説明】
11 文書登録部 12 文書記憶部 13 キーワード登録部 14 キーワード記憶部 15 キーワード検索部 16 縮小キーワード生成部 17 縮小キーワード記憶部 18 縮小キーワード検索部 19 一致度数算出部

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 文書検索に用いる複数のキーワードが登
    録されたキーワード辞書と、 前記キーワード辞書に登録されているキーワードと、該
    キーワードより派生した、より少ない字数の縮小キーワ
    ードとを対応づけて登録した第1リストと、 複数の文書と前記キーワード辞書より選択されたキーワ
    ードとを対応づけて登録した第2リストと、 入力された検索用のキーワードより検索用の縮小キーワ
    ードを派生する派生手段と、 前記検索用の縮小キーワードから派生元として対応付け
    られているキーワードを前記第1リストから獲得し、獲
    得されたキーワードを用いて前記第2リストを検索して
    文書検索を行う検索手段とを備えることを特徴とする文
    書検索装置。
  2. 【請求項2】 前記キーワード辞書に登録されているキ
    ーワードから、該キーワードより少ない字数の縮小キー
    ワードを派生させ、該キーワードに対応づけて登録する
    ことにより前記第1リストを生成する第1生成手段を更
    に備える、 ことを特徴とする請求項1に記載の文書検索装置。
  3. 【請求項3】 前記キーワード辞書に新たなキーワード
    が登録された場合に、前記第1生成手段を起動する起動
    手段を更に備えることを特徴とする請求項2に記載の文
    書検索装置。
  4. 【請求項4】 登録すべき文書の文字列と前記キーワー
    ド辞書に基づいて該登録すべき文書のキーワードを抽出
    し、該登録すべき文書を該抽出されたキーワードに対応
    づけて登録することにより前記第2リストを生成する第
    2生成手段を更に備えることを特徴とする請求項1に記
    載の文書検索装置。
  5. 【請求項5】 前記第1リストに登録される縮小キーワ
    ードは、全て同じ文字数であり、2文字以上の長さを有
    することを特徴とする請求項1乃至4のいずれかに記載
    の文書検索装置。
  6. 【請求項6】 前記検索手段において複数の縮小キーワ
    ードを用いて行われた検索の結果に基づいて、各文書の
    キーワードの前記検索用キーワードに対する一致度数を
    算出する算出手段を更に備えることを特徴とする請求項
    1に記載の文書検索装置。
  7. 【請求項7】 前記算出手段は、前記検索手段で用いら
    れた縮小キーワードの数と、縮小キーワードに基づいて
    獲得された派生元のキーワードによって検索された回数
    との割合を一致度数として求めることを特徴とする請求
    項6に記載の文書検索装置。
  8. 【請求項8】 前記検索手段によって検索された文書を
    前記算出手段で算出された一致度数とともに表示する表
    示手段を更に備えることを特徴とする請求項6又は7に
    記載の文書検索装置。
  9. 【請求項9】 文書検索に用いる複数のキーワードが登
    録されたキーワード辞書と、 前記キーワード辞書に登録されているキーワードと、該
    キーワードより派生した、より少ない字数の縮小キーワ
    ードとを対応づけて登録した第1リストと、 複数の文書と前記キーワード辞書より選択されたキーワ
    ードとを対応づけて登録した第2リストとを有する文書
    検索装置における文書検索方法であって、 入力された検索用のキーワードより検索用の縮小キーワ
    ードを派生する派生工程と、 前記検索用の縮小キーワードから派生元として対応付け
    られているキーワードを前記第1リストから獲得し、獲
    得されたキーワードを用いて前記第2リストを検索して
    文書検索を行う検索工程とを備えることを特徴とする文
    書検索方法。
  10. 【請求項10】 前記キーワード辞書に登録されている
    キーワードから、該キーワードより少ない字数の縮小キ
    ーワードを派生させ、該キーワードに対応づけて登録す
    ることにより前記第1リストを生成する第1生成工程を
    更に備える、 ことを特徴とする請求項9に記載の文書検索方法。
  11. 【請求項11】 前記キーワード辞書に新たなキーワー
    ドが登録された場合に、前記第1生成工程を起動する起
    動工程を更に備えることを特徴とする請求項10に記載
    の文書検索方法。
  12. 【請求項12】 登録すべき文書の文字列と前記キーワ
    ード辞書に基づいて該登録すべき文書のキーワードを抽
    出し、該登録すべき文書を該抽出されたキーワードに対
    応づけて登録することにより前記第2リストを生成する
    第2生成工程を更に備えることを特徴とする請求項9に
    記載の文書検索方法。
  13. 【請求項13】 前記第1リストに登録される縮小キー
    ワードは、全て同じ文字数であり、2文字以上の長さを
    有することを特徴とする請求項9乃至12のいずれかに
    記載の文書検索方法。
  14. 【請求項14】 前記検索工程において複数の縮小キー
    ワードを用いて行われた検索の結果に基づいて、各文書
    のキーワードの前記検索用キーワードに対する一致度数
    を算出する算出工程を更に備えることを特徴とする請求
    項9に記載の文書検索方法。
  15. 【請求項15】 前記算出工程は、前記検索工程で用い
    られた縮小キーワードの数と、縮小キーワードに基づい
    て獲得された派生元のキーワードによって検索された回
    数との割合を一致度数として求めることを特徴とする請
    求項14に記載の文書検索方法。
  16. 【請求項16】 前記検索工程によって検索された文書
    を前記算出工程で算出された一致度数とともに表示する
    表示工程を更に備えることを特徴とする請求項14又は
    15に記載の文書検索方法。
  17. 【請求項17】 文書検索に用いる複数のキーワードが
    登録されたキーワード辞書と、前記キーワード辞書に登
    録されているキーワードと、該キーワードより派生し
    た、より少ない字数の縮小キーワードとを対応づけて登
    録した第1リストと、複数の文書と前記キーワード辞書
    より選択されたキーワードとを対応づけて登録した第2
    リストとを有する文書検索装置における文書検索方法の
    プログラムコードが格納されたコンピュータ可読メモリ
    であって、 入力された検索用のキーワードより検索用の縮小キーワ
    ードを派生する派生工程のコードと、 前記検索用の縮小キーワードから派生元として対応付け
    られているキーワードを前記第1リストから獲得し、獲
    得されたキーワードを用いて前記第2リストを検索して
    文書検索を行う検索工程のコードとを特徴とするコンピ
    ュータ可読メモリ。
JP07233696A 1996-03-27 1996-03-27 文書検索装置及びその方法 Expired - Fee Related JP3787384B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07233696A JP3787384B2 (ja) 1996-03-27 1996-03-27 文書検索装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07233696A JP3787384B2 (ja) 1996-03-27 1996-03-27 文書検索装置及びその方法

Publications (2)

Publication Number Publication Date
JPH09259146A true JPH09259146A (ja) 1997-10-03
JP3787384B2 JP3787384B2 (ja) 2006-06-21

Family

ID=13486358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07233696A Expired - Fee Related JP3787384B2 (ja) 1996-03-27 1996-03-27 文書検索装置及びその方法

Country Status (1)

Country Link
JP (1) JP3787384B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
JP2007206868A (ja) * 2006-01-31 2007-08-16 Ai Giken:Kk 情報検索方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
JP2007206868A (ja) * 2006-01-31 2007-08-16 Ai Giken:Kk 情報検索方式

Also Published As

Publication number Publication date
JP3787384B2 (ja) 2006-06-21

Similar Documents

Publication Publication Date Title
JP4054428B2 (ja) 画像検索装置及びその方法、コンピュータ可読メモリ
JPH10289240A (ja) 画像処理装置及びその制御方法
JP3787384B2 (ja) 文書検索装置及びその方法
JP3727995B2 (ja) 文書処理方法及び装置
JP2004334341A (ja) 文書検索装置、文書検索方法及び記録媒体
JPH10289241A (ja) 画像処理装置及びその制御方法
JPH09282328A (ja) 文書画像処理装置及びその方法
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP2002108887A (ja) 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体
JP3902825B2 (ja) 文書検索システムおよび方法
US6625606B1 (en) System and method for filing/searching data having a full-text function and media for recording the method
JPH09269952A (ja) 文書検索装置及びその方法
JPH06223113A (ja) 電子ファイリング装置
JP2006004050A (ja) 画像処理装置、画像読み取り装置およびプログラム
JPH08263512A (ja) 文書検索装置
JPH10171964A (ja) 電子ファイリング装置及び電子ファイリング方法
JPH10171841A (ja) 文書情報管理装置及び文書情報管理方法
JPS62109127A (ja) 表示画面の出力制御方式
JPH10177641A (ja) 文書ファイリング装置
JP2000315211A (ja) 文書管理システムおよび文書管理方法
JP2002175317A (ja) 情報検索方法及び装置並びに記憶媒体
JPH09330323A (ja) 情報処理方法及びその装置と前記方法を実施するプログラムを記憶したコンピュータにより読取り可能な記憶媒体
JP2001160052A (ja) 文書管理システムおよびその文書管理方法ならびに記録媒体
JP2000348055A (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2004178180A (ja) 全文検索情報の登録及び検索方式

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060327

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100331

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100331

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110331

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120331

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130331

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130331

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140331

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees