JPH09269952A - Document retrieval device/method - Google Patents

Document retrieval device/method

Info

Publication number
JPH09269952A
JPH09269952A JP8081345A JP8134596A JPH09269952A JP H09269952 A JPH09269952 A JP H09269952A JP 8081345 A JP8081345 A JP 8081345A JP 8134596 A JP8134596 A JP 8134596A JP H09269952 A JPH09269952 A JP H09269952A
Authority
JP
Japan
Prior art keywords
keyword
document
search
reduced
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8081345A
Other languages
Japanese (ja)
Inventor
Tadashi Kimura
正 木村
Hirotaka Shiiyama
弘隆 椎山
Satoru Yashiro
哲 八代
Kenichi Kazumi
健一 数見
Takayoshi Odate
貴義 大館
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP8081345A priority Critical patent/JPH09269952A/en
Publication of JPH09269952A publication Critical patent/JPH09269952A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain a plausible retrieval result even if keywords indicated for retrieval are not completely matched and to easily recognize a document whose matching degree is high. SOLUTION: The device has a reduced keyword storage part 17 storing the keywords registered in a word dictionary and a small number of reduced keywords derived from the keywords by making them correspond each other and a keyword storage part 14 storing the plural documents and the keywords selected from the word dictionary by making them correspond. In such a case, the reduced keyword for retrieval is generated from an inputted keyword for retrieval and the keyword which is made to correspond to the reduced keyword for retrieval is acquired from the reduced keyword storage part 17. The keyword storage part 14 is retrieved by using the acquired keyword and the document is retrieved. Then, the matching degree of the reduced keywords of the respective documents against the keyword for retrieval is calculated based on the result of retrieval.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は文書を登録し、キー
ワードを指示して文書を検索する文書検索装置及びその
方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document search apparatus and method for registering a document and pointing a keyword to search the document.

【0002】[0002]

【従来の技術】従来、この種の文書ファイリング装置で
は文書を登録する時に検索するためのキーワードをあら
かじめ登録しておく必要があった。また、キーワードを
登録文書の中から構文解析や単語辞書とのマッチングに
より文書中から抽出する方法も提案され、あらかじめキ
ーワード登録する作業が軽減されている装置も存在す
る。また、検索指示されたキーワードから想定される同
義語、類義語を含めて検索ができる文書ファイリング装
置も提案されている。
2. Description of the Related Art Conventionally, in this type of document filing apparatus, it was necessary to previously register a keyword for searching when registering a document. In addition, a method of extracting a keyword from the document by syntax analysis or matching with a word dictionary from the registered document has been proposed, and there is an apparatus in which the work of registering the keyword in advance is reduced. Further, a document filing apparatus has also been proposed that can perform a search including synonyms and synonyms assumed from a keyword instructed to search.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、これら
の従来装置では、検索するためのキーワードは文書登録
時に登録したキーワードを正確に指示する必要があり、
キーワードが一致しないと検索できないという不都合が
あった。同義語、類義語を含めて検索する装置において
も、関連語で検索できるようになったがキーワードが一
致しなければ検索できないという問題が残されていた。
However, in these conventional apparatuses, it is necessary to accurately indicate the keyword registered at the time of document registration as the keyword for searching.
There was the inconvenience that the keyword could not be searched unless it matched. Even in a device that searches for synonyms and synonyms, the related words can be searched, but the problem remains that the keywords cannot be searched unless they match.

【0004】本発明の目的は、上述の点に鑑み、検索時
に完全に一致しない場合であってももっともらしい検索
結果を得られる文書検索装置及びその方法を提供するこ
とにある。
In view of the above points, an object of the present invention is to provide a document search device and method for obtaining a plausible search result even if the search results do not match completely.

【0005】[0005]

【課題を解決するための手段】上記課題を解決するため
に、本発明は、文書検索に用いる複数のキーワードが登
録された単語辞書と、前記単語辞書に登録されているキ
ーワードと、該キーワードより派生した、より少ない文
字数の縮小キーワードとを対応づけて登録した第1リス
トと、複数の文書と前記単語辞書により選択されたキー
ワードとを対応づけて登録した第2リストと、入力され
た検索用のキーワードより検索用の縮小キーワードを生
成する生成手段と、前記検索用の縮小キーワードから派
生元として対応づけられているキーワードを前記第1リ
ストから獲得し、獲得されたキーワードを用いて前記第
2リストを検索して文書検索を行う検索手段と、前記検
索手段において複数の縮小キーワードを用いて行われた
検索の結果に基づいて、各文書のキーワードの前記検索
用キーワードに対する一致度数を算出する算出手段とを
備えることを特徴とする文書検索装置を提供する。
In order to solve the above problems, the present invention provides a word dictionary in which a plurality of keywords used for document retrieval are registered, a keyword registered in the word dictionary, and The first list in which the derived reduced keywords having a smaller number of characters are registered in association with each other, the second list in which a plurality of documents and the keywords selected by the word dictionary are registered in association with each other, and the input search Generating means for generating a reduced keyword for search from the keyword, and a keyword associated with the reduced keyword for search as a derivation source from the first list, and using the obtained keyword, the second keyword A search means for searching the list to perform a document search, and a search means based on the result of the search performed by the search means using a plurality of reduced keywords Te, provides a document search apparatus characterized by comprising calculating means for calculating a coincidence degree for the search keyword of the keyword in each document.

【0006】また、上記課題を解決するために、本発明
は、文書検索に用いる複数のキーワードが登録された単
語辞書と、前記単語辞書に登録されているキーワード
と、該キーワードより派生した、より少ない文字数の縮
小キーワードとを対応づけて登録した第1リストと、複
数の文書と前記単語辞書より選択されたキーワードとを
対応づけて登録した第2リストとを有する文書検索装置
における文書検索方法であって、入力された検索用のキ
ーワードより検索用の縮小キーワードを生成する生成工
程と、前記検索用の縮小キーワードから派生元として対
応づけられているキーワードを前記第1リストから獲得
し、獲得されたキーワードを用いて前記第2リストを検
索して文書検索を行う検索工程と、前記検索工程におい
て複数の縮小キーワードを用いて行われた検索の結果に
基づいて、各文書のキーワードの前記検索用キーワード
に対する一致度数を算出する算出工程とを備えることを
特徴とする文書検索方法を提供する。
In order to solve the above problems, the present invention provides a word dictionary in which a plurality of keywords used for document retrieval are registered, a keyword registered in the word dictionary, and a keyword derived from the keyword. A document search method in a document search device having a first list in which a reduced keyword having a small number of characters is associated and registered, and a second list in which a plurality of documents and keywords selected from the word dictionary are associated and registered. Then, a generating step of generating a reduced keyword for search from the inputted keyword for search and a keyword associated as a derivation source from the reduced keyword for search are acquired from the first list, and acquired. A search step for searching the second list by using the keywords, and a plurality of reduction keywords in the search step. Based on the research results conducted with de, it provides a document search method characterized by and a calculating step of calculating the matching degree for said search keyword of the keyword in each document.

【0007】[0007]

【発明の実施の形態】以下、図面を参照して本発明の好
適な一実施形態を説明する。
BEST MODE FOR CARRYING OUT THE INVENTION A preferred embodiment of the present invention will be described below with reference to the drawings.

【0008】図1は実施形態における電子ファイリング
システムの機能構成を表すブロック図である。図1にお
いて、符号1は文書ファイリング装置である。この文書
ファイリング装置1は、文書登録部11、文書記憶部1
2、キーワード登録部13、キーワード記憶部14、キ
ーワード検索部15、縮小キーワード生成部16、縮小
キーワード記憶部17、縮小キーワード検索部18、一
致度数算出部19とから概略構成されている。
FIG. 1 is a block diagram showing a functional configuration of the electronic filing system in the embodiment. In FIG. 1, reference numeral 1 is a document filing device. The document filing device 1 includes a document registration unit 11 and a document storage unit 1.
2, a keyword registration section 13, a keyword storage section 14, a keyword search section 15, a reduced keyword generation section 16, a reduced keyword storage section 17, a reduced keyword search section 18, and a matching frequency calculation section 19.

【0009】文書登録部11は紙やFDなどの記憶媒体
から文書を読み込み、文書記憶部12に格納する登録部
である。
The document registration unit 11 is a registration unit for reading a document from a storage medium such as paper or FD and storing it in the document storage unit 12.

【0010】文書記憶部12は文書登録部11により読
み込まれた文書を格納する記憶部である。
The document storage unit 12 is a storage unit for storing the document read by the document registration unit 11.

【0011】キーワード登録部13は文書記憶部12に
格納された文書にキーワードを割り当てて、検索を可能
にするキーワードを登録する手段である。
The keyword registration unit 13 is means for assigning a keyword to a document stored in the document storage unit 12 and registering a keyword that enables a search.

【0012】キーワード記憶部14は文書記憶部12に
格納された文書とキーワード登録部13によって与えら
れたキーワードとの対応関係を記憶する手段である。
The keyword storage unit 14 is means for storing the correspondence relationship between the document stored in the document storage unit 12 and the keyword given by the keyword registration unit 13.

【0013】キーワード検索部15はキーワード記憶部
14に格納されているキーワードを指示して、文書記憶
部12に格納されている文書を探し出す検索部である。
The keyword search section 15 is a search section for designating a keyword stored in the keyword storage section 14 to search for a document stored in the document storage section 12.

【0014】縮小キーワード生成部16はキーワード登
録部13によって与えられたキーワードをより短いキー
ワードに分解する手段である。生成される縮小キーワー
ドの数は与えられたキーワードの長さから、生成する縮
小キーワードの長さを引き、さらに1を加えた数とな
る。
The reduced keyword generation unit 16 is a means for decomposing the keywords given by the keyword registration unit 13 into shorter keywords. The number of reduced keywords to be generated is the number obtained by subtracting the length of the reduced keyword to be generated from the length of the given keyword and further adding 1.

【0015】縮小キーワード記憶部17は縮小キーワー
ド生成部16によって生成された縮小キーワードを記憶
する手段である。縮小キーワードは検索キーワード記憶
部14のキーワード関連づけされている。
The reduced keyword storage unit 17 is a means for storing the reduced keyword generated by the reduced keyword generation unit 16. The reduced keyword is associated with the keyword in the search keyword storage unit 14.

【0016】縮小キーワード検索部18は検索指示され
たキーワードを検索キーワードに分解して、縮小キーワ
ード記憶部17を使って検索キーワード記憶部14との
関連から関連の深い文書を検索する手段である。
The reduced keyword retrieving unit 18 is a means for decomposing a retrieval-instructed keyword into a retrieval keyword, and using the reduced keyword storage unit 17, retrieving a document having a close relationship with the retrieval keyword storage unit 14.

【0017】一致度数算出部19は縮小キーワード検索
部18によって求められた検索結果から、検索要求に近
い文書をその割合を示す値によって提示する手段であ
る。
The coincidence frequency calculation unit 19 is means for presenting a document close to the search request from the search result obtained by the reduced keyword search unit 18 by a value indicating the ratio thereof.

【0018】このような構成の文書ファイレング装置1
によって、通常使われるキーワード検索部15によって
該当する文書が検索できない場合は縮小キーワード検索
部18によってキーワードが完全に一致しない文書を含
めて検索することができる。
The document filing apparatus 1 having such a configuration
Thus, when the corresponding document cannot be searched by the normally used keyword search unit 15, the reduced keyword search unit 18 can search by including the documents whose keywords do not completely match.

【0019】以下、図面を参照て本実施形態の電子ファ
イリングシステムの構成、動作を更に具体的に説明す
る。
The configuration and operation of the electronic filing system of this embodiment will be described more specifically below with reference to the drawings.

【0020】図2は実施形態による文書検索装置の構成
を示すブロック図である。図2中の符号101はマイク
ロプロセッサである。このマイクロプロセッサCPUは
文書の登録、キーワード登録、縮小キーワードによる文
書検索などを行うため、バス102を介してバス102
に接続された各構成要素を制御するものである。バス1
02はアドレスバス、コントロールバス、およびデータ
バスからなる共通バスである。このバス102を利用し
て、バス102に接続された各機器相互間のアドレス信
号、制御信号および各種データの転送がおこなわれる。
FIG. 2 is a block diagram showing the configuration of the document search apparatus according to the embodiment. Reference numeral 101 in FIG. 2 is a microprocessor. The microprocessor CPU registers the document, registers the keyword, retrieves the document by the reduced keyword, and the like, and therefore, the bus 102 via the bus 102.
It controls each component connected to. Bus 1
A common bus 02 is composed of an address bus, a control bus, and a data bus. Using the bus 102, address signals, control signals, and various data are transferred between the devices connected to the bus 102.

【0021】103はキーボードやマウスなどから構成
され、文書ファイリング装置の文書の登録、検索作業に
かかわる動作を指示するための選択機能を持ったSWが
設けられている。
Reference numeral 103 is composed of a keyboard, a mouse, etc., and is provided with a SW having a selection function for instructing operations related to document registration and search operations of the document filing apparatus.

【0022】104は紙の形態の文書を読み込むための
装置で画像として本装置に読み込むことができる。読み
込まれた画像から文字を抽出するOCR機能を備えて、
文字に直して保管することも可能である。
Reference numeral 104 denotes a device for reading a document in the form of paper, which can be read as an image in the present device. Equipped with an OCR function to extract characters from the read image,
It is also possible to convert it into letters and store it.

【0023】105はROM(読みだし専用メモリ)で
ある。このROM105には、あらかじめマイクロプロ
セッサCPU101の制御手順を記憶させておき、これ
により、文書の登録、キーワード登録、縮小キーワード
生成、検索などの本実施例にかかわる処理を行うことが
できる。
Reference numeral 105 is a ROM (read-only memory). The ROM 105 stores the control procedure of the microprocessor CPU 101 in advance, and by doing this, it is possible to perform the processes related to the present embodiment such as document registration, keyword registration, reduced keyword generation, and search.

【0024】RAM106は文書の登録、キーワード登
録、縮小キーワードの生成、検索結果の集計、表示デー
タの作成などのためのワークメモリ、各構成要素のため
の制御のための一時記憶として用いられる。
The RAM 106 is used as a work memory for registering documents, registering keywords, generating reduced keywords, totaling search results, creating display data, etc., and temporary storage for controlling each component.

【0025】107は電源をきっても消えない外部記憶
装置である。文書の登録、検索のための文書記憶手段、
キーワード記憶手段、縮小キーワード記憶手段として利
用される。
An external storage device 107 does not disappear even when the power is turned off. Document storage means for registering and searching documents,
It is used as a keyword storage unit and a reduced keyword storage unit.

【0026】108はキャラクタジェネレータであり、
表示すべき文字パターンを生成するために使われる。
Reference numeral 108 is a character generator,
Used to generate the character pattern to display.

【0027】109は単語辞書であり、登録された文書
から検索に必要な単語をキーワードとして抽出したり、
キーワードを登録する時に単語辞書と照合することによ
って適切なキーワードかどうかを判断するために利用さ
れる。
Reference numeral 109 is a word dictionary for extracting words necessary for retrieval from registered documents as keywords,
When a keyword is registered, it is used to determine whether it is an appropriate keyword by matching it with a word dictionary.

【0028】111は表示制御手段でRAM106の表
示データを表示器110に表示するための制御をおこな
う。
Reference numeral 111 is a display control means for controlling the display data of the RAM 106 on the display 110.

【0029】110は陰極線管や液晶などで構成される
表示器である。
Reference numeral 110 denotes a display device composed of a cathode ray tube, a liquid crystal or the like.

【0030】図3は、キーボード記憶部14によって記
憶される文書検索のためのキーワードインデックスのデ
ータ構成を示す図である。
FIG. 3 is a diagram showing the data structure of a keyword index for document retrieval stored in the keyboard storage unit 14.

【0031】14aは文書検索のために使われるインデ
ックスである。登録された文書と、文書に付与されたキ
ーワード、キーワードの通し番号との番号と関係を記憶
する。文書登録時にキーワードが登録されると14aに
キーワードとして登録され、同時に対応する文書番号と
キーワードを識別するためのユニークなキー番号が登録
される。キーワードが既に存在する場合は文書番号の領
域に文書番号のみが追加登録される。キー番号はキーワ
ード記憶部14のなかでは重複のない番号が割り当てら
れ、後述する縮小キーワード生成時に対応する検索キー
ワードを特定するために使われる。
Reference numeral 14a is an index used for document retrieval. The relationship between the registered document, the keyword assigned to the document, and the serial number of the keyword is stored. When a keyword is registered at the time of document registration, it is registered as a keyword in 14a, and at the same time, a corresponding document number and a unique key number for identifying the keyword are registered. If the keyword already exists, only the document number is additionally registered in the document number area. A unique number is assigned to the key number in the keyword storage unit 14 and is used to specify a corresponding search keyword when generating a reduced keyword to be described later.

【0032】図4は、17aは縮小キーワード記憶部の
構成例を示すインデックスである。本実施形態において
は、キーワード登録時にキーワードを2文字ごとに区切
った縮小キーワードとキーワードにつけられたキー番号
との関係を記憶している。縮小キーワードはキーワード
を固定長の文字数に分解することによって生成すること
ができる。
In FIG. 4, reference numeral 17a is an index indicating a configuration example of the reduced keyword storage unit. In the present embodiment, at the time of keyword registration, the relationship between the reduced keyword obtained by dividing the keyword into two characters and the key number attached to the keyword is stored. The reduced keyword can be generated by decomposing the keyword into a fixed number of characters.

【0033】図5は本実施形態によるあいまい検索時に
検索キーワードを検索縮小キーワードに分解し、縮小キ
ーワード記憶部とキーワード記憶部を参照して該当文書
の一覧を生成する過程を示す図である。
FIG. 5 is a diagram showing a process of decomposing a search keyword into a search reduced keyword at the time of fuzzy search according to the present embodiment and referring to the reduced keyword storage unit and the keyword storage unit to generate a list of relevant documents.

【0034】51は検索時に入力された検索キーワード
である。実施例では「あかい」が指示された場合を示し
ている。「あかい」は2文字ごとに検索縮小キーワード
が生成され、「あか」、「かい」の2つの検索縮小キー
ワードを52に得ることができる。この、52から、図
4の縮小キーワードインデックス17aを参照して検索
縮小キーワード「あか」からは対応する検索キーワード
のキー番号として1と2が得られ、図3の検索キーワー
ドインデックスを参照して文書番号「AAA」および
「BBB」が該当することがわかる。同様にして「か
い」に対応する検索キーワードのキー番号として2と3
が得られ、文書番号「BBB」および「CCC」を得る
ことができた。
Reference numeral 51 is a search keyword input at the time of search. In the embodiment, the case where "red" is designated is shown. A search reduction keyword is generated for every two characters of “red”, and two search reduction keywords of “red” and “kai” can be obtained in 52. From this 52, 1 and 2 are obtained as the key numbers of the corresponding search keywords from the search reduction keyword “red” with reference to the reduction keyword index 17a in FIG. 4, and with reference to the search keyword index in FIG. It can be seen that the numbers "AAA" and "BBB" correspond. Similarly, the key numbers of the search keywords corresponding to "kai" are 2 and 3
And the document numbers “BBB” and “CCC” could be obtained.

【0035】以上の検索処理により、検索結果リストと
して図5に示す53aが作成される。53bには検索縮
小キーワードによって検索された文書番号と検索結果と
して該当した回数が記録されている。本実施例では検索
縮小キーワードに該当した検索結果文書として「BB
B」が2回、「AAA」および「CCC」が各1回を得
ることができたことを示している。
By the above search processing, 53a shown in FIG. 5 is created as a search result list. In 53b, the document number searched by the search reduction keyword and the number of hits as a search result are recorded. In this embodiment, the search result document corresponding to the search reduction keyword is “BB
"B" shows that it was able to get twice and "AAA" and "CCC" got once each.

【0036】図6は検索結果リスト61の検索結果の値
として得た該当回数から、一致度数を求めた結果を図示
している。図6において、一致度数は指示された検索キ
ーワードを検索縮小キーワードに分解して検索に使用さ
れた数のうち実際に検索された回数の割合を求めること
により、最大を1とする一致度数を求めることができ
る。計算式で示すと以下のようになる。本実施例では3
文字の検索キーワードから2文字の縮小キーワードを生
成するために、検索縮小キーワードは2個生成される。
FIG. 6 shows the result of finding the matching frequency from the number of hits obtained as the value of the search result in the search result list 61. In FIG. 6, the matching frequency is obtained by decomposing the designated search keyword into search reduced keywords and calculating the ratio of the number of times actually searched out of the number used in the search to obtain the matching frequency with the maximum being 1. be able to. The calculation formula is as follows. In this embodiment, 3
Two search reduced keywords are generated in order to generate a reduced keyword of two characters from a search keyword of a character.

【0037】ANS=HITS÷KEYS ANS:一致度数(1.0〜0.0の範囲) HITS:検索縮小キーワードによる検索で該当した回
数 KEYS:検索キーワードの長さ−検索縮小キーワード
の長さ+1
ANS = HITS / KEYS ANS: coincidence frequency (range of 1.0 to 0.0) HITS: number of times corresponding to search by the search reduced keyword KEYS: length of search keyword-length of search reduced keyword + 1

【0038】図7は完全一致検索を実行したときに結果
が表示器に表示される内容の配置例を示している。図7
において、71は文書登録を指示するボタン、72は検
索を開始するボタン、73は完全一致で検索を実行を指
示するボタン、74は縮小キーワードによるあいまい検
索の実行を指示するボタン、110は検索結果を表示す
る領域を示している。各ボタンの選択または指示は入力
装置103に配置されたマウスまたはキーによって行わ
れる。
FIG. 7 shows an arrangement example of the contents displayed on the display when the exact match search is executed. Figure 7
In 71, 71 is a button for instructing document registration, 72 is a button for starting a search, 73 is a button for instructing to execute a search with an exact match, 74 is a button for instructing to execute a fuzzy search using a reduced keyword, and 110 is a search result Shows an area for displaying. Selection or instruction of each button is performed by a mouse or a key arranged on the input device 103.

【0039】検索結果の表示は図6に示す検索結果リス
ト61の内容に文書の登録日、コメントなど文書情報を
付加して表示される。図7では完全一致の結果として一
致度数=1の文書だけが表示されている例を示してい
る。
The search result is displayed by adding document information such as the document registration date and comment to the contents of the search result list 61 shown in FIG. FIG. 7 shows an example in which only documents with a matching frequency of 1 are displayed as a result of complete matching.

【0040】図8はあいまい検索を指示して、検索縮小
キーワードによる検索結果として、検索縮小キーワード
の一部が一致した文書も表示される場合の表示例であ
る。
FIG. 8 shows a display example when a fuzzy search is instructed and a document in which a part of the search reduced keyword is also displayed as the search result by the search reduced keyword.

【0041】検索結果として文書「AAA」、「BB
B」、「CCC」が一致度数の大きい順にソートされて
表示されている。
As the search results, the documents "AAA", "BB"
“B” and “CCC” are sorted and displayed in descending order of matching frequency.

【0042】図9は本実施形態による文書ファイリング
システムの文書登録及び文書検索の手順を示すフローチ
ャートである。図9において、ステップS1では電源投
入されると、入力装置103、スキャナ104、外部記
憶装置107、表示制御111、RAM106などが初
期設定され、文書の登録、検索が可能となる。
FIG. 9 is a flowchart showing the procedure of document registration and document search in the document filing system according to this embodiment. In FIG. 9, when the power is turned on in step S1, the input device 103, the scanner 104, the external storage device 107, the display control 111, the RAM 106, etc. are initialized, and the documents can be registered and searched.

【0043】次に、ステップS2では画面上に作業を選
択するために各種指示ボタンが表示され、キーボードま
たはマウスなどにより文書の登録または検索が選択でき
る。
Next, in step S2, various instruction buttons are displayed on the screen for selecting a work, and registration or retrieval of a document can be selected by a keyboard or a mouse.

【0044】文書登録を行うための選択ボタン71が選
択されると、文書登録に関する一連の作業がステップS
3から開始される。
When the selection button 71 for registering a document is selected, a series of work related to document registration is performed in step S.
It starts from 3.

【0045】ステップS3では文書の読み込みが行わ
れ、スキャナ104から文書が読み込まれRAM106
に一時的に記憶される。
In step S3, the document is read, the document is read from the scanner 104, and the RAM 106 is read.
Is stored temporarily.

【0046】次のステップS4では、文書を検索するた
めにつけるキーワードを入力する。入力された文字列は
作業メモリの検索キーワード51に記憶される。
In the next step S4, a keyword to be used for searching the document is input. The input character string is stored in the search keyword 51 of the working memory.

【0047】更に、ステップS5ではステップS4で入
力されたキーワードを2文字の長さの文字列を1文字ず
つずらした縮小キーワードを生成する。生成された縮小
キーワードは作業メモリの検索縮小キーワード52に記
憶される。
Further, in step S5, a reduced keyword is generated by shifting the character string having a length of 2 characters by one character from the keyword input in step S4. The generated reduction keyword is stored in the search reduction keyword 52 in the working memory.

【0048】次のステップS6では文書を外部記憶装置
に格納するために文書番号を生成する。文書番号は登録
した順番や登録日により、英数字の組み合わせで自動的
に重複しない名前が与えられるものとする。文書番号が
決定したら、RAM106に一時的に記憶されている文
書を外部記憶装置107に格納する。
In the next step S6, a document number is generated to store the document in the external storage device. The document number shall be automatically given a unique name with a combination of alphanumeric characters depending on the order of registration and the date of registration. When the document number is determined, the document temporarily stored in the RAM 106 is stored in the external storage device 107.

【0049】次のステップS7では縮小キーワード51
とキーワードインデックス14aを比較し、同じキーワ
ードがあるかどうかを調べ、同じキーワードが既に存在
するときはキーワードインデックス14aの文書番号の
領域にステップS6に生成された文書番号を追加格納す
る。同じキーワードが存在しない場合はキーワードに新
規にキー番号を与え、キーワード、キー番号、文書番号
の新しいレコードをキーワードインデックス14aに追
加する。キー番号は新機にキーワードが追加されたとき
に順番に+1された番号が割り当てられるものとする。
In the next step S7, the reduced keyword 51
And the keyword index 14a are compared, and it is checked whether or not the same keyword is present. If the same keyword already exists, the document number generated in step S6 is additionally stored in the document number area of the keyword index 14a. If the same keyword does not exist, a new key number is given to the keyword and a new record of the keyword, the key number, and the document number is added to the keyword index 14a. It is assumed that the key numbers are assigned in order when the keywords are added to the new machine.

【0050】次に、ステップS8では縮小キーワードの
登録が行われる。既にステップS5で生成された縮小キ
ーワードにステップS7で得られたキーワードに対する
キー番号を対応させ、検索縮小キーワードインデックス
17aに登録する。
Next, in step S8, the reduced keyword is registered. The reduced keyword already generated in step S5 is associated with the key number corresponding to the keyword obtained in step S7 and registered in the search reduced keyword index 17a.

【0051】以上のステップS3からステップS8によ
り、図3のように登録された文書とキーワードとの関係
を記憶するキーワードインデックス14a、および図4
に示すように縮小キーワードとキーワードの関係を記憶
する縮小キーワードインデックス17aが作成され、文
書の登録と検索のための情報が蓄積される。
By the above steps S3 to S8, the keyword index 14a for storing the relationship between the document registered as shown in FIG. 3 and the keyword, and FIG.
As shown in (1), the reduced keyword index 17a for storing the relation between the reduced keywords and the keywords is created, and the information for registering and searching the document is accumulated.

【0052】次に、ステップS2に戻り、検索指示ボタ
ン72が選択された場合はステップS9に移り、検索す
るためのキーワードを入力する。入力された文字列は検
索キーワード51に記憶される。
Next, returning to step S2, if the search instruction button 72 is selected, the process proceeds to step S9 to input a keyword for searching. The input character string is stored in the search keyword 51.

【0053】次のステップS10では検索モードの選択
をおこなう。完全一致検索モード73が選択されたとき
にはステップS11以降の処理が実行される。ステップ
S11では検索キーワード51に記憶された文字列に一
致する文書を図3に示すキーワードインデックス14a
を参照して検索する。検索結果は次のステップS12で
図5および図6に示す検査リスト53aのように検索結
果の一覧表が作成される。本実施例では完全一致検索す
る検索結果リスト53a中の一致回数を示す検索結果は
すべて1回がセットされる。
In the next step S10, the search mode is selected. When the exact match search mode 73 is selected, the processing from step S11 is executed. In step S11, the document matching the character string stored in the search keyword 51 is searched for in the keyword index 14a shown in FIG.
Search by referring to. In the next step S12, a list of search results is created as in the inspection list 53a shown in FIGS. 5 and 6. In the present embodiment, all the search results indicating the number of matches in the search result list 53a for the exact match search are set to once.

【0054】次のステップS13では完全一致検索によ
る一致度数はすべて1にセットするものとし、検索結果
リスト53aの一致度数の領域のすべて1をセットす
る。
In the next step S13, it is assumed that all the matching frequencies by the exact matching search are set to 1, and all 1 are set in the matching frequency region of the search result list 53a.

【0055】以上のステップS11からステップS13
により完全一致検索結果は検索結果リスト53aに作成
され、ステップS14により、検索結果の表示リスト1
10に検索結果文書および一致度数が転送される。更
に、検索結果文書の詳細文書情報として文書登録日やコ
メントが表示情報として追加される。
The above steps S11 to S13
Thus, the exact match search result is created in the search result list 53a, and in step S14, the search result display list 1
The search result document and the matching frequency are transferred to 10. Further, a document registration date and a comment are added as display information as detailed document information of the search result document.

【0056】次のステップS15では表示用リスト11
0のソートを行う。本実施例ではソートは第1キーとし
て一致度数、第2キーとして検索文書番号をもとに実行
されるもととする。完全一致検索の場合は一致度数は全
て同じなので、検索文書番号の順にならべかえられる。
In the next step S15, the display list 11 is displayed.
Sort 0. In this embodiment, it is assumed that sorting is performed based on the matching frequency as the first key and the search document number as the second key. In the case of a perfect match search, the matching frequencies are all the same, so they can be sorted in the order of search document numbers.

【0057】図7は完全一致検索の結果の表示例を示し
ている。
FIG. 7 shows a display example of the result of the exact match search.

【0058】次に、ステップS2からステップS9で完
全一致検索と同様の操作により、検索キーワードを指定
し、ステップS10であいまい検索指示ボタン74が選
択された場合を例に縮小キーボードを利用したあいまい
検索の実行例を説明する。
Next, in steps S2 to S9, a search keyword is designated by the same operation as the exact match search, and the fuzzy search using the reduced keyboard is used as an example when the fuzzy search instruction button 74 is selected in step S10. An execution example of will be described.

【0059】ステップS16では検索キーワード51に
記憶されている文字列を1文字ずつずらした2文字の検
索縮小キーワード52が作成される。
In step S16, a two-character search reduced keyword 52 is created by shifting the character string stored in the search keyword 51 by one character.

【0060】次のステップS17では縮小検索キーワー
ド52を使って、図4に示す縮小キーワードインデック
ス17aを参照して検索が行われる。まず、最初に検索
縮小キーワード52の「あか」で検索が行われ、図7の
縮小キーワードインデックス52からキー番号として1
および2を得ることができ、さらにキーワードインデッ
クス14aを参照して、キー番号1および2を含む文書
が文書番号「AAA」および「BBB」であることがわ
かる。この検索結果は検索結果リスト53aにセットさ
れ、検索結果の回数を示す検索結果にはぞれぞれ1がセ
ットされる。
In the next step S17, a search is performed using the reduced search keyword 52 with reference to the reduced keyword index 17a shown in FIG. First, a search is first performed with the search reduction keyword 52 “red”, and the reduction keyword index 52 of FIG.
And 2 can be obtained, and by referring to the keyword index 14a, it can be seen that the documents including the key numbers 1 and 2 are the document numbers “AAA” and “BBB”. This search result is set in the search result list 53a, and 1 is set in each of the search results indicating the number of times of the search result.

【0061】次に、検索縮小キーワード52の2番目の
文字列「かい」て検索が行われる。検索は縮小キーワー
ドインデックス17a、キーワードインデックス14a
の順に参照され、検索結果は検査結果リスト53aに追
加される。検索結果として、文書番号「BBB」および
「CCC」を得ることができる。
Next, a search is performed using the second character string "KAI" of the search reduction keyword 52. Search is reduced keyword index 17a, keyword index 14a
Are referred to in this order, and the search result is added to the inspection result list 53a. As the search result, the document numbers “BBB” and “CCC” can be obtained.

【0062】次のステップS18では検査結果リスト5
3bの整理をおこなう。
In the next step S18, the inspection result list 5
Organize 3b.

【0063】図5に示すように、検索結果文書が重複し
ているものを集めて、検索結果の値を更新する。本実施
例によれば文書番号「BBB」が2回検索されているの
で、値が2に設定され、重複している他の行は削除され
る。検索結果文書の重複チェックは検索結果文書番号で
ソートすることによって、次のレコードの文書番号を比
較することによって容易に判断することができる。
As shown in FIG. 5, the duplicated search result documents are collected and the value of the search result is updated. According to the present embodiment, the document number “BBB” is searched twice, so the value is set to 2 and the other duplicate lines are deleted. The duplication check of the search result documents can be easily judged by sorting the search result document numbers and comparing the document numbers of the next records.

【0064】次のステップS19では一致度数の算出が
行われる。一致度数は検索縮小キーワード数で検索結果
の回数をわった値とする。検索縮小キーワードの数は既
に記述したように検索キーワードの長さから縮小キーワ
ードの長さを引き、その結果に1を加えて求めることが
できる。本実施例では3文字の検索キーワードを2文字
の縮小キーワードで処理しているので、検索縮小キーワ
ードの数は2となる。検索結果による一致度数は検索結
果文書「AAA」は1回のなので0.5,検索結果文書
「BBB」は2回のなので1、検索結果文書「CCC」
は1回のなので0.5がそれぞれセットされる。図6は
ステップS19の実行結果による検索結果リスト53a
である。
In the next step S19, the coincidence frequency is calculated. The matching frequency is a value obtained by dividing the number of search results by the number of search reduced keywords. As described above, the number of search reduced keywords can be obtained by subtracting the length of the reduced keyword from the length of the search keyword and adding 1 to the result. In this embodiment, since the 3-character search keyword is processed by the 2-character reduced keyword, the number of search reduced keywords is 2. The matching frequency according to the search result is 0.5 because the search result document “AAA” is once, and is 1 because the search result document “BBB” is twice, and the search result document “CCC”.
Is set once, so 0.5 is set for each. FIG. 6 shows a search result list 53a based on the execution result of step S19.
It is.

【0065】次に、ステップS14により、検査結果リ
スト53aの内容が表示用リスト110にセットされ
る。ここでは完全一致検索のときと同様に検索結果文書
の詳細情報として文書登録日やコメントなどが表示用リ
ストに追加される。
Next, in step S14, the contents of the inspection result list 53a are set in the display list 110. Here, as in the case of the exact match search, the document registration date, the comment, and the like are added to the display list as detailed information of the search result document.

【0066】更に、次のステップS15では一致度数と
検索結果文書番号をキーとしてソートが行われる。特
に、あいまい検索においては一致度数を第1キーとする
ことにより、検索キーワード51に近い文書が先頭に表
示されているので、利用者は容易に所望の文書かどうか
を判断することができる。
Further, in the next step S15, sorting is performed using the coincidence frequency and the search result document number as keys. In particular, in the fuzzy search, by using the matching frequency as the first key, the document close to the search keyword 51 is displayed at the top, so that the user can easily determine whether or not the document is a desired document.

【0067】このように、文書登録時に文書を検索する
ためのキーワードを指示すると同時に縮小キーワードも
同時に生成することにより、登録したキーワードを忘れ
た場合でもキーワードの一部が一致していなければ該当
する文書を検索することができるようになった。
As described above, when a keyword for retrieving a document is designated at the time of document registration, a reduced keyword is also generated at the same time, so that even if the registered keyword is forgotten, if some of the keywords do not match, it is applicable. You can now search for documents.

【0068】以上説明したように、本実施例では登録文
書に対応する縮小キーワードを文書を登録時に縮小キー
ワード記憶手段に登録するようにしたが、キーワード記
憶手段に格納されている完全一致検索のためのキーワー
ドを必要に応じて縮小キーワードに変換し、縮小キーワ
ード記憶手段に縮小キーワードインデックス52を作成
することも可能である。
As described above, in the present embodiment, the reduced keyword corresponding to the registered document is registered in the reduced keyword storage means at the time of registering the document. However, for the exact match search stored in the keyword storage means. It is also possible to convert the keyword of (1) into a reduced keyword as necessary and create the reduced keyword index 52 in the reduced keyword storage means.

【0069】また、上記実施例において、縮小キーワー
ド記憶手段を1種類のみ使用した場合を提示したが、日
本語と英語などが混在する場合には英単語用の縮小キー
ワードを日本語とはことなる長さに設定した縮小キーワ
ード記憶手段を併用することにより、複数言語対応のあ
いまい検索装置を実現することもできる。
In the above embodiment, the case where only one type of reduced keyword storage means is used is presented, but when Japanese and English are mixed, the reduced keyword for English words is different from Japanese. By using the reduced keyword storage means set to the length together, it is possible to realize a fuzzy search device compatible with a plurality of languages.

【0070】縮小キーワードを2文字の例を用いて説明
したが、これに限られるものではない。
Although the reduced keyword has been described by using the example of two characters, it is not limited to this.

【0071】[0071]

【発明の効果】以上説明したように、本発明によれば登
録されたキーワードに完全に一致しない場合でも縮小キ
ーワードにより所望の文書が検索できるようになった。
また、2文字以上の縮小キーワードにより文字列の連続
制を含めたあいまい検索が可能となった。また、検索結
果に一致度数を付加することにより、容易に所望の文字
であるかどうかを判断出来るようになった。
As described above, according to the present invention, a desired document can be searched with a reduced keyword even when the registered keyword does not completely match.
In addition, a fuzzy search that includes a continuous string of characters has become possible by using a reduced keyword of two or more characters. Further, by adding the matching frequency to the search result, it is possible to easily determine whether or not the character is a desired character.

【図面の簡単な説明】[Brief description of drawings]

【図1】本実施形態における電子ファイリングシステム
の機能構成を表すブロック図である。
FIG. 1 is a block diagram showing a functional configuration of an electronic filing system according to this embodiment.

【図2】本実施形態により文書検索装置の構成を示すブ
ロック図である。
FIG. 2 is a block diagram showing a configuration of a document search device according to the present embodiment.

【図3】キーワード記憶部14によって記憶される文書
検索のためのキーワードインデックスのデータ構成を示
す図である。
FIG. 3 is a diagram showing a data structure of a keyword index for document search stored in a keyword storage unit 14.

【図4】本発明の文書検索装置の登録文書を検索するた
めのキーワード記憶部に関連づけされた縮小キーワード
記憶部の構成例を示す図である。
FIG. 4 is a diagram showing a configuration example of a reduced keyword storage unit associated with a keyword storage unit for searching a registered document of the document search device of the present invention.

【図5】あいまい検索実行時に、検索キーワードが検索
のための縮小キーワードに展開されて、検索結果として
縮小キーワード検索による検索回数を記録した検索リス
トを作成するまでの流れを図示している。
FIG. 5 illustrates a flow of expanding a search keyword into a reduced keyword for a search and creating a search list recording the number of times of search by the reduced keyword search as a search result at the time of executing a fuzzy search.

【図6】検索結果による検索回数と縮小キーワードの数
から一致度数をもとめた検索リストの結果を図示してい
る。
FIG. 6 illustrates a result of a search list in which the matching frequency is obtained from the number of searches based on the search result and the number of reduced keywords.

【図7】本実施形態による完全一致検索による検索結果
の表示、および検察実行を指示する各種指示ボタンを図
示している。
FIG. 7 illustrates various search buttons for displaying a search result by an exact match search and executing a prosecution according to the present embodiment.

【図8】本実施形態によるあいまい検索による検索結果
の表示、一致度数と文書番号によるソート結果を表示し
ている図である。
FIG. 8 is a diagram showing a display of search results by fuzzy search according to the present embodiment, and a display of sort results by the matching frequency and the document number.

【図9】本実施形態における文書ファイリングシステム
の文書登録および文書検索の手順を示すフローチャート
である。
FIG. 9 is a flowchart showing a procedure of document registration and document search of the document filing system according to the present embodiment.

【符号の説明】[Explanation of symbols]

1 文書ファイリング装置 14a キーワード・インデックス 17a 縮小キーワードインデックス 51 検索キーワード 52 検索縮小キーワード 53a 検索結果リスト 71 登録指示ボタン 72 検索指示ボタン 73 完全一致検索モード指示ボタン 74 あいまい検索モード指示ボタン 101 マイクロプロセッサ 102 共通バス 103 キーボードおよびマウス 104 スキャナ 105 ROM(読み出し専用メモリ) 106 RAM(ランダムアクセスメモリ) 107 DISK(外部記憶装置) 108 CG(キャラクタジェネレータ) 109 単語辞書 110 表示器 110 検索結果の表示用リスト 111 表示制御装置 1 Document Filing Device 14a Keyword Index 17a Reduced Keyword Index 51 Search Keyword 52 Search Reduced Keyword 53a Search Result List 71 Registration Instruction Button 72 Search Instruction Button 73 Perfect Match Search Mode Instruction Button 74 Ambiguous Search Mode Instruction Button 101 Microprocessor 102 Common Bus 103 Keyboard and Mouse 104 Scanner 105 ROM (Read Only Memory) 106 RAM (Random Access Memory) 107 DISK (External Storage Device) 108 CG (Character Generator) 109 Word Dictionary 110 Display 110 List for Displaying Search Results 111 Display Control Device

フロントページの続き (72)発明者 数見 健一 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 大館 貴義 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内Front Page Continuation (72) Inventor Kenichi Kazumi 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Takayoshi Odate 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. Within

Claims (14)

【特許請求の範囲】[Claims] 【請求項1】 文書検索に用いる複数のキーワードが登
録された単語辞書と、 前記単語辞書に登録されているキーワードと、該キーワ
ードより派生した、より少ない文字数の縮小キーワード
とを対応づけて登録した第1リストと、 複数の文書と前記単語辞書により選択されたキーワード
とを対応づけて登録した第2リストと、 入力された検索用のキーワードより検索用の縮小キーワ
ードを生成する生成手段と、 前記検索用の縮小キーワードから派生元として対応づけ
られているキーワードを前記第1リストから獲得し、獲
得されたキーワードを用いて前記第2リストを検索して
文書検索を行う検索手段と、 前記検索手段において複数の縮小キーワードを用いて行
われた検索の結果に基づいて、各文書のキーワードの前
記検索用キーワードに対する一致度数を算出する算出手
段と、を備えることを特徴とする文書検索装置。
1. A word dictionary in which a plurality of keywords used for document retrieval are registered, a keyword registered in the word dictionary, and a reduced keyword derived from the keyword and having a reduced number of characters are registered in association with each other. A first list; a second list in which a plurality of documents and keywords selected by the word dictionary are registered in association with each other; generating means for generating a reduced keyword for search from the input keyword for search; Searching means for acquiring a keyword associated with the reduced keyword for searching as a derivation source from the first list, searching the second list using the acquired keyword to perform document search, and the searching means Based on the results of the search performed using multiple reduced keywords in Further comprising calculating means for calculating a matching degree of the document retrieval system according to claim.
【請求項2】 前記算出手段は、前記検索手段で用いら
れた縮小キーワードの数と、縮小キーワードに基づいて
獲得された派生元のキーワードによって検索された回数
との割合を一致度数として求めることを特徴とする請求
項1に記載の文書検索装置。
2. The calculating means obtains a ratio of the number of reduced keywords used in the search means and the number of times of retrieval by a derivation source keyword acquired based on the reduced keywords as a coincidence frequency. The document search device according to claim 1, wherein the document search device is a document search device.
【請求項3】 前記検索手段によって検索された文書を
前記算出手段で算出された一致度数とともに表示する表
示手段をさらに備えることを特徴とする請求項1又は2
に記載の文書検索装置。
3. A display unit for displaying the document retrieved by the retrieval unit together with the matching frequency calculated by the calculation unit.
Document retrieval device described in.
【請求項4】 前記単語辞書に登録されているキーワー
ドから、該キーワードより少ない字数の縮小キーワード
を派生させ、該キーワードに対応づけて登録することに
より前記第1リストを生成する第1生成手段を更に備え
ることを特徴とする請求項1に記載の文書検索装置。
4. A first generating means for generating the first list by deriving a reduced keyword having a smaller number of characters than the keyword from the keyword registered in the word dictionary and registering the reduced keyword in association with the keyword. The document search device according to claim 1, further comprising:
【請求項5】 前記単語辞書に新たなキーワードが登録
された場合に、前記第1生成手段を起動する起動手段を
更に備えることを特徴とする請求項4に記載の文書検索
装置。
5. The document search device according to claim 4, further comprising an activation unit that activates the first generation unit when a new keyword is registered in the word dictionary.
【請求項6】 登録すべき文書の文字列と前記単語辞書
に基づいて該登録すべき文書のキーワードを抽出し、該
登録すべき文書を該抽出されたキーワードに対応づけて
登録することにより前記第2リストを生成する第2生成
手段を更に備えることを特徴とする請求項1に記載の文
書検索装置。
6. The keyword of the document to be registered is extracted based on the character string of the document to be registered and the word dictionary, and the document to be registered is registered in association with the extracted keyword. The document search device according to claim 1, further comprising a second generation unit that generates a second list.
【請求項7】 前記第1リストに登録される縮小キーワ
ードは、全て同じ文字数であり、2文字以上の長さを有
することを特徴とする請求項1乃至6のいずれかに記載
の文書検索装置。
7. The document search device according to claim 1, wherein the reduced keywords registered in the first list all have the same number of characters and have a length of 2 or more characters. .
【請求項8】 文書検索に用いる複数のキーワードが登
録された単語辞書と、 前記単語辞書に登録されているキーワードと、該キーワ
ードより派生した、より少ない文字数の縮小キーワード
とを対応づけて登録した第1リストと、 複数の文書と前記単語辞書より選択されたキーワードと
を対応づけて登録した第2リストとを有する文書検索装
置における文書検索方法であって、 入力された検索用のキーワードより検索用の縮小キーワ
ードを生成する生成工程と、 前記検索用の縮小キーワードから派生元として対応づけ
られているキーワードを前記第1リストから獲得し、獲
得されたキーワードを用いて前記第2リストを検索して
文書検索を行う検索工程と、 前記検索工程において複数の縮小キーワードを用いて行
われた検索の結果に基づいて、各文書のキーワードの前
記検索用キーワードに対する一致度数を算出する算出工
程と、を備えることを特徴とする文書検索方法。
8. A word dictionary in which a plurality of keywords used for document retrieval are registered, a keyword registered in the word dictionary, and a reduced keyword derived from the keyword and having a smaller number of characters are registered in association with each other. A document search method in a document search device, comprising: a first list; and a second list in which a plurality of documents and keywords selected from the word dictionary are registered in association with each other. Generating a reduced keyword for search, obtaining a keyword associated with the reduced keyword for search as a derivation source from the first list, and searching the second list using the obtained keyword. Based on the result of the search step of performing a document search with a plurality of reduced keywords in the search step , Document search method characterized by and a calculating step of calculating a coincidence degree for the search keyword of the keyword in each document.
【請求項9】 前記算出工程は、前記検索工程で用いら
れた縮小キーワードの数と、縮小キーワードに基づいて
獲得された派生元のキーワードによって検索された回数
との割合を一致度数として求めることを特徴とする請求
項8に記載の文書検索方法。
9. The calculating step includes obtaining, as a matching frequency, a ratio of the number of reduced keywords used in the searching step and the number of times of retrieval by a derivation source keyword acquired based on the reduced keywords. The document search method according to claim 8, wherein the document search method is a document search method.
【請求項10】 前記検索工程によって検索された文書
を前記算出工程で算出された一致度数とともに表示する
表示工程をさらに備えることを特徴とする請求項8又は
9に記載の文書検索方法。
10. The document search method according to claim 8, further comprising a display step of displaying the document searched by the search step together with the matching frequency calculated in the calculation step.
【請求項11】 前記単語辞書に登録されているキーワ
ードから、該キーワードより少ない字数の縮小キーワー
ドを派生させ、該キーワードに対応づけて登録すること
により前記第1リストを生成する第1工程を更に備える
ことを特徴とする請求項8に記載の文書検索装置。
11. A first step of generating the first list by deriving a reduced keyword having a smaller number of characters than the keyword from the keyword registered in the word dictionary and registering the reduced keyword in association with the keyword. The document search device according to claim 8, further comprising:
【請求項12】 前記単語辞書に新たなキーワードが登
録された場合に、前記第1生成工程を起動する起動工程
を更に備えることを特徴とする請求項11に記載の文書
検索方法。
12. The document search method according to claim 11, further comprising an activation step of activating the first generation step when a new keyword is registered in the word dictionary.
【請求項13】 登録すべき文書の文字列と前記単語辞
書に基づいて該登録すべき文書のキーワードを抽出し、
該登録すべき文書を該抽出されたキーワードに対応づけ
て登録することにより前記第2リストを生成する第2生
成工程を更に備えることを特徴とする請求項8に記載の
文書検索方法。
13. A keyword of a document to be registered is extracted based on a character string of the document to be registered and the word dictionary,
9. The document search method according to claim 8, further comprising a second generation step of generating the second list by registering the document to be registered in association with the extracted keyword.
【請求項14】 前記第1リストに登録される縮小キー
ワードは、全て同じ文字数であり、2文字以上の長さを
有することを特徴とする請求項8乃至13のいずれかに
記載の文書検索方法。
14. The document search method according to claim 8, wherein the reduced keywords registered in the first list all have the same number of characters and have a length of 2 or more characters. .
JP8081345A 1996-04-03 1996-04-03 Document retrieval device/method Pending JPH09269952A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8081345A JPH09269952A (en) 1996-04-03 1996-04-03 Document retrieval device/method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8081345A JPH09269952A (en) 1996-04-03 1996-04-03 Document retrieval device/method

Publications (1)

Publication Number Publication Date
JPH09269952A true JPH09269952A (en) 1997-10-14

Family

ID=13743786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8081345A Pending JPH09269952A (en) 1996-04-03 1996-04-03 Document retrieval device/method

Country Status (1)

Country Link
JP (1) JPH09269952A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
US7194460B2 (en) 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
JP2008158631A (en) * 2006-12-21 2008-07-10 Canon Inc Information processing apparatus, and method for controlling the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6321192B1 (en) * 1998-10-22 2001-11-20 International Business Machines Corporation Adaptive learning method and system that matches keywords using a parsed keyword data structure having a hash index based on an unicode value
US7194460B2 (en) 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
JP2008158631A (en) * 2006-12-21 2008-07-10 Canon Inc Information processing apparatus, and method for controlling the same
US8218876B2 (en) 2006-12-21 2012-07-10 Canon Kabushiki Kaisha Information processing apparatus and control method

Similar Documents

Publication Publication Date Title
JPH0628403A (en) Document retrieving device
JPH0773197A (en) Supporting system for preparing different notation word dictionary
JPH09269952A (en) Document retrieval device/method
JP3929418B2 (en) Information search program and medium on which information search program is recorded
JP3727995B2 (en) Document processing method and apparatus
JP3945075B2 (en) Electronic device having dictionary function and storage medium storing information retrieval processing program
JP3222193B2 (en) Information retrieval device
JPS6378228A (en) Information retrieving device
JPS6325774A (en) Information registering/retrieving device
JPH08314974A (en) Automatic key work extracting device and document retrieving device
JP3787384B2 (en) Document retrieval apparatus and method
JPH06223113A (en) Electronic filing device
JPH0944521A (en) Index generating device and document retrieval device
JPH0514304B2 (en)
JPH05181912A (en) Document retrieving device
JP3498635B2 (en) Information retrieval method and apparatus, and computer-readable recording medium
JPH08115340A (en) Document retrieval device and generating device for index file used for the same
JPH07296005A (en) Japanese text registration/retrieval device
JPH09259132A (en) Device and method for information registration and retrieval
JP2000311170A (en) Text information extracting method
JPH09146968A (en) Document retrieving method
JPH06309368A (en) Document retrieving device
JPH05158984A (en) Device for extracting character string
JPH07230469A (en) Retrieval device
JP2001052022A (en) Data totalization and reference type retrieval system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060516