JP2932667B2 - Information retrieval method and information storage device - Google Patents

Information retrieval method and information storage device

Info

Publication number
JP2932667B2
JP2932667B2 JP2285023A JP28502390A JP2932667B2 JP 2932667 B2 JP2932667 B2 JP 2932667B2 JP 2285023 A JP2285023 A JP 2285023A JP 28502390 A JP28502390 A JP 28502390A JP 2932667 B2 JP2932667 B2 JP 2932667B2
Authority
JP
Japan
Prior art keywords
character
information
character string
string
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2285023A
Other languages
Japanese (ja)
Other versions
JPH04158478A (en
Inventor
伸一 田中
茂 松川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2285023A priority Critical patent/JP2932667B2/en
Publication of JPH04158478A publication Critical patent/JPH04158478A/en
Application granted granted Critical
Publication of JP2932667B2 publication Critical patent/JP2932667B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、画像情報として入力される文書を電子的に
蓄積する情報蓄積装置と情報の検索方法に関するもので
ある。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information storage device for electronically storing a document input as image information and a method for searching for information.

従来の技術 近年、文書や図面を画像情報として入力してこれを電
子的に蓄積する文書ファイル装置と呼ばれる情報蓄積装
置が、文書や図面の管理を専業とする部署を中心に普及
し始めている。
2. Description of the Related Art In recent years, an information storage device called a document file device that inputs a document or a drawing as image information and electronically stores the image information has begun to spread, mainly in a department dedicated to managing the document or the drawing.

以下、図面を参照しながら、上述した従来の情報蓄積
装置の一例について説明する。
Hereinafter, an example of the above-described conventional information storage device will be described with reference to the drawings.

第5図は従来の情報蓄積装置の動作を示すフローチャ
ートである。第5図a)は文書の登録時、第5図b)は
検索時の動作をそれぞれ示すものである。
FIG. 5 is a flowchart showing the operation of the conventional information storage device. FIG. 5 (a) shows the operation at the time of registering a document, and FIG. 5 (b) shows the operation at the time of retrieval.

以上のように動作する情報蓄積装置について、以下そ
の動作をさらに詳しく説明をする。
The operation of the information storage device that operates as described above will be described in more detail below.

まず、文書を登録するときには、イメージスキャナな
どの画像入力装置で、文書情報を画像情報として取り込
む。取り込んだ画像情報は光ディスク装置などの記憶装
置に蓄積される。続いて、蓄積した画像情報の文書名、
分類、作成者、キーワードなどの検索に利用する補助情
報をキーボードから入力し、この補助情報に対応する画
像情報を示す情報を付加して所定の場所に記憶する。
First, when registering a document, document information is captured as image information by an image input device such as an image scanner. The captured image information is stored in a storage device such as an optical disk device. Next, the document name of the stored image information,
Auxiliary information used for searching for a classification, a creator, a keyword, and the like is input from a keyboard, and information indicating image information corresponding to the auxiliary information is added and stored in a predetermined location.

このようにして蓄積された画像情報を検索するときに
は、キーボードから補助情報を限定する検索条件を入力
し、所定の場所に記憶された補助情報の中でこれに合致
する補助情報を検索する。このようにして検索しようと
する文書情報の補助情報が特定されると、これに対応す
る文書を読み出すことができる。(例えば、オーム社
「オフィスオートメーション入門」111〜113ページ) 発明が解決しようとする課題 しかしながら上記のような動作では、文書を登録する
ときに必ず検索のために補助情報を入力する必要があ
り、登録に手間がかかるばかりでなく、複数の人で文書
を登録したり検索したりするときには、各人の間でキー
ワードの整合性や一貫性をとる必要もあり、キーワード
体系の管理が大変であるという問題点を有していた。
When searching for the image information stored in this manner, a search condition for limiting the auxiliary information is input from the keyboard, and the auxiliary information stored in a predetermined location is searched for the auxiliary information that matches the search condition. When the auxiliary information of the document information to be searched is specified in this way, the corresponding document can be read. (For example, Ohm “Introduction to Office Automation,” pages 111 to 113) Problems to be Solved by the Invention However, in the operation described above, it is necessary to input auxiliary information for search without fail when registering a document. Not only does it take time to register, but when registering and retrieving documents with multiple people, it is necessary to ensure consistency and consistency of keywords among each person, and it is difficult to manage the keyword system There was a problem that.

本発明は上記問題点に鑑み、文書を登録するときに、
検索のために補助情報をわざわざ入力しなくても後で検
索することが可能な情報の検索方法および情報蓄積装置
を提供するものである。
The present invention has been made in view of the above problems, and when registering a document,
It is an object of the present invention to provide an information search method and an information storage device that can be searched later without having to input auxiliary information for the search.

課題を解決するための手段 上記課題を解決するために、本発明の情報の検索方法
および情報蓄積装置は、画像情報として入力される文書
情報から文字を認識した文字コード情報から所定の文字
列を検索しようとするもので、検索すべき文字列を含む
文書の画像情報からこの文字列を認識するとき、認識の
アルゴリズムに付随する不完全性のためにこの文字列を
誤認識する可能性のある他の文字列と正しい文字列のい
ずれかに合致する文字列を検索するようにしたものであ
る。
Means for Solving the Problems In order to solve the above problems, an information search method and an information storage device of the present invention provide a method of forming a predetermined character string from character code information in which characters are recognized from document information input as image information. When recognizing this character string from the image information of the document that contains the character string to be searched, the character string may be erroneously recognized due to imperfections associated with the recognition algorithm. It is designed to search for a character string that matches any of the other character strings and the correct character string.

作用 本発明は上記した方法によって、文書の画像情報を文
字認識して得られる文字コード情報の中で所定の文字列
を認識するので、文書情報に検索用のキーワードなどの
補助情報を付加しなくても直接文書情報から検索するこ
とが可能であり、文字認識の不完全性を補うように検索
の条件を拡大するので、誤認識に伴う検索漏れを回避す
ることが可能となる。
Function The present invention recognizes a predetermined character string in character code information obtained by character recognition of image information of a document by the above-described method, so that auxiliary information such as a search keyword is not added to document information. However, the search can be directly performed from the document information, and the search conditions are expanded so as to compensate for the incompleteness of the character recognition. Therefore, it is possible to avoid a search omission due to erroneous recognition.

認識の不完全性を補う方法について、その原理をさら
に説明する。
The principle of the method of compensating for imperfect recognition will be further described.

第3図は、理想的に文字認識できる場合を示す概念図
である。同図において、実線で囲んだ領域a〜領域h
は、それぞれ、仮想的な文字a〜文字hのパターンの存
在範囲を示すもので、破線で囲んだ領域A〜領域Bは、
それぞれ、文字a〜文字hと認識されるパターンの範囲
を示すものである。この場合には、領域a〜領域hは、
それぞれ、領域A〜領域Hに完全に含包含されており、
文字a〜文字hがすべて正しく認識されることは明らか
である。
FIG. 3 is a conceptual diagram showing a case where a character can be ideally recognized. In the figure, regions a to h surrounded by solid lines
Indicates the existence range of the pattern of the virtual characters a to h, respectively.
They respectively indicate the range of patterns recognized as characters a to h. In this case, the areas a to h are:
Each is completely included in the region A to the region H,
It is clear that the letters a to h are all correctly recognized.

一方、第4図は認識が正しく行われない場合を示す概
念図である。第3図の場合と同様に、実線で囲んだ領域
i〜領域pは、それぞれ、仮想的な文字i〜文字pのパ
ターンの存在範囲を示し、破線で囲まれた領域I〜領域
Pは、それぞれ、文字i〜文字pと認識されるパターン
の範囲を示すものである。なお、領域X〜領域Zは、ど
の文字にも認識できない領域を示すものである。この場
合には、すべての文字i〜文字pが領域I〜領域Pに1
完全に包含されているわけではなく、完全な文字認識を
行うのは不可能である。例えば、文字iは、ほとんどの
場合、文字iと正しく認識されるが、文字jや文字nに
近いパターンで書かれていると、それぞれ文字jや文字
nに誤認識されることとなる。また、文字mと文字o
は、存在し得るパターンの領域が重なっており、文脈な
どから意味を理解するような、パターン認識以外の手段
を併用する以外に誤認識を避ける方法はない。このよう
なことは、異なる文字体系が混在する場合におこり得る
ものである。例えば、漢字の‘入’とジリシャ文字のλ
や、数字の‘0'とアルファベットの‘O'などがその好例
である。
FIG. 4 is a conceptual diagram showing a case where recognition is not performed correctly. Similarly to the case of FIG. 3, the regions i to p surrounded by solid lines indicate the existence ranges of the patterns of the virtual characters i to p, respectively, and the regions I to P surrounded by broken lines are: They respectively indicate the range of patterns recognized as characters i to p. It should be noted that the areas X to Z indicate areas where no character can be recognized. In this case, all the characters i to p are set to 1 in the regions I to P.
It is not completely contained and it is impossible to perform full character recognition. For example, in most cases, the character i is correctly recognized as the character i. However, if the character i is written in a pattern close to the character j or the character n, the character i is erroneously recognized as the character j or the character n, respectively. Also, the letter m and the letter o
Has a pattern area that can exist, and there is no way to avoid erroneous recognition except by using means other than pattern recognition to understand the meaning from context or the like. This can occur when different character systems are mixed. For example, the kanji character 'On' and the Jirisha character λ
And the number '0' and the letter 'O' are good examples.

このような誤認識が、どの文字に対してどのように発
生するかということは、認識アルゴリズム固定の傾向を
有しており、その傾向さえ把握できておれば、検索のと
きにその欠点を補うことが可能である。例えば、文字i
が文字jに誤認識さたとしよう。この場合、その認識結
果を印刷や表示などの形で出力すると支障があるが、文
字iで検索する場合には、(文字i+文字j+文字n)
で検索すれば検索漏れは回避される。検索範囲を拡大す
ることによって、余分なものも検索されてしまうが、検
索条件を変えて絞り込みを行えばほとんど支障はなくな
る。また、実際には、1文字で検索することはほとんど
なく、数文字を組み合わせた熟語で検索されるので、検
索範囲は実質的にはそれほど極端に拡大されることはな
い。例えば、‘入力’という文字列で検索する場合、
‘入’という文字を‘入+λ’に、‘力’を‘力+カ’
にそれぞれ拡大しても、文字列としては‘入力+λ力+
入カ+λカ’に拡大されるだけで、‘入力’、‘入
カ’、‘λカ’などはほとんど存在しないので、実質的
な検索範囲の拡大は極わずかとなる。
How such erroneous recognition occurs for which character has a tendency to fix the recognition algorithm, and if the tendency can be grasped, the defect is compensated at the time of retrieval. It is possible. For example, the letter i
Is misrecognized by the letter j. In this case, there is a problem if the recognition result is output in the form of printing, display, or the like. However, when searching by the character i, (character i + character j + character n)
If you search with, search omission is avoided. By expanding the search range, extra items are also searched. However, if the search conditions are changed to narrow down the search, there is almost no problem. Further, in practice, the search is hardly performed by one character, but by a idiom combining several characters. Therefore, the search range is not substantially greatly expanded. For example, to search for the string 'input',
The word "On" is replaced by "On + λ", and "Power" is replaced by "Power + Power"
Even if each is enlarged, the character string is' input + λ force +
Since only “input + λ power” is expanded and “input”, “input power”, “λ power”, etc., hardly exist, the actual expansion of the search range is extremely small.

このように、検索時に文字認識の不完全性を補うこと
によって、検索漏れという不都合な事態を大幅に減少さ
せることが可能となる。
As described above, by compensating for the imperfectness of character recognition at the time of retrieval, it is possible to greatly reduce the inconvenience of retrieval omission.

実 施 例 以下本発明の一実施例の情報の検索方法について、図
面を参照しながら説明する。
Embodiment Hereinafter, a method for searching for information according to an embodiment of the present invention will be described with reference to the drawings.

第1図は本発明の第1の実施例における情報蓄積装置
のブロック図を示すものである。第1図において、1は
画像入力手段で、手書きあるいは印刷された文書から画
像として情報を取り込む。2は情報処理手段、で情報の
入出力の制御きさまざまな処理を行う。3は記憶手段
で、情報処理手段2の取り扱う情報を必要に応じて記憶
する。4はコード入力手段で、画像入力手段1から入力
された画像情報の補助情報や、検索のための文字列など
を入力する。5は文字列認識手段で、情報処理手段2か
ら送られてくる画像情報から文字を切り出して認識し、
文字認識して得られる文字コードを情報処理手段2に返
す。6は出力手段で、コード入力手段4から入力される
指示に従って、指示された特定の情報や指示に従って検
索して抽出された情報などを出力する。
FIG. 1 is a block diagram of an information storage device according to a first embodiment of the present invention. In FIG. 1, reference numeral 1 denotes an image input unit which captures information as an image from a handwritten or printed document. Reference numeral 2 denotes information processing means for performing various processes for controlling input and output of information. A storage unit 3 stores information handled by the information processing unit 2 as necessary. Reference numeral 4 denotes a code input unit for inputting auxiliary information of image information input from the image input unit 1, a character string for search, and the like. Reference numeral 5 denotes a character string recognizing unit, which cuts out and recognizes characters from the image information sent from the information processing unit 2,
A character code obtained by character recognition is returned to the information processing means 2. Reference numeral 6 denotes an output unit, which outputs specific information instructed according to the instruction input from the code input unit 4, information retrieved and extracted in accordance with the instruction, and the like.

以上のように構成された情報蓄積装置について、以
下、第1図および第2図を用いてその動作を説明する。
The operation of the information storage device configured as described above will be described below with reference to FIGS. 1 and 2.

まず、第2図は本実施例における情報蓄積装置の動作
のフローチャートを示したものであって、第2図a)
は、文書情報を蓄積する場合、第2図b)は、所望する
文書情報を検索する場合をそれぞれ示すものである。文
書情報を蓄積するときには、まず、手書きあるいは印刷
された文書を、イメージスキャナのような画像入力手段
1で画像情報として読み取り、情報処理手段2に転送す
る。情報処理手段2は、この画像情報のフォーマットを
整え、記憶手段3に転送してファイルとして記憶させ
る。さらに、必要に応じて、キーワードなどの補助情報
をコード入力手段4から入力して、情報処理手段2はこ
の補助情報を所定のフォーマットに整えて、記憶手段3
に送出して所定の場所に記憶させる。一方、情報処理手
段2は、文字認識手段5にも情報画像情報を送出する。
文字認識手段5は、この画像情報から文字を順次切り出
して、これを認識し、文字コードに変換する。文字認識
手段5は、認識して得た文字コード情報を情報処理手段
2に返す。情報処理手段2は、この文字コード情報を所
定のフォーマットに整えた後、記憶手段3に送出して、
所定の場所に記録させる。
First, FIG. 2 shows a flowchart of the operation of the information storage device in the present embodiment, and FIG.
FIG. 2B shows a case where document information is stored, and FIG. 2B) shows a case where desired document information is searched. When storing document information, first, a handwritten or printed document is read as image information by an image input unit 1 such as an image scanner and transferred to the information processing unit 2. The information processing means 2 arranges the format of the image information, transfers the image information to the storage means 3 and stores it as a file. Further, if necessary, auxiliary information such as a keyword is input from the code input means 4, and the information processing means 2 prepares the auxiliary information into a predetermined format, and
And store it in a predetermined location. On the other hand, the information processing means 2 also sends information image information to the character recognition means 5.
The character recognizing means 5 sequentially cuts out characters from the image information, recognizes them, and converts them into character codes. The character recognition means 5 returns the character code information obtained by the recognition to the information processing means 2. The information processing means 2 arranges the character code information in a predetermined format, and then sends the information to the storage means 3,
Record in the designated place.

以上のようにして蓄積された文書情報から、所望の情
報を検索するときは、まず、検索を行う対象とするファ
イルを限定するために必要に応じてキーワードなどによ
る制限条件をコード入力手段4から入力する。もちろ
ん、すべてのファイルを対象にするときには、このよう
な制限条件の入力は必要としない。次に、検索すべき文
字列を再びコード入力手段4から入力する。この文字列
は、情報処理手段2に転送され、情報処理手段2は、内
蔵する対応表に基づいて、この文字列の範囲を拡大す
る。この、文字列の範囲を拡大する過程を、さらに詳し
く説明する。
When searching for desired information from the document information stored as described above, first, if necessary, restricting conditions such as keywords are limited from the code input means 4 in order to limit files to be searched. input. Of course, when targeting all files, it is not necessary to input such a restriction condition. Next, a character string to be searched is input from the code input means 4 again. This character string is transferred to the information processing means 2, and the information processing means 2 expands the range of this character string based on a built-in correspondence table. The process of expanding the range of the character string will be described in more detail.

対応表とは、文字認識手段5が各文字を認識するとき
に誤認識する可能性のある文字を、各文字に対応させた
表である。例えば、第3図に示すように、文字i〜文字
pのパターンの範囲および文字i〜文字pと認識される
パターンの範囲である領域I〜領域Pが分布していると
すれば、これらの文字に関する対応表は表1のようにな
る。
The correspondence table is a table in which characters that may be erroneously recognized when the character recognizing unit 5 recognizes each character are associated with each character. For example, as shown in FIG. 3, assuming that a range of a pattern of characters i to p and a range of regions I to P, which are ranges of a pattern recognized as characters i to p, are distributed, The correspondence table for characters is as shown in Table 1.

この対応表は、実際にはそれぞれの文字を表す文字コ
ードで構成されており、文字?は、認識できなかった文
字に割り当てる特殊コードを意味する。
This correspondence table is actually composed of character codes representing each character. Means a special code assigned to the unrecognized character.

検索する文字列が‘文字j文字m文字o'の3文字から
成る文字列であるとすれば、文字jは、文字jと文字n
と文字?との和集合に置き換え、文字oは文字oと文字
mとの和集合に置き換える。したがって、検索は、 ‘文字j文字m文字o' ‘文字j文字m文字m' ‘文字n文字m文字o' ‘文字n文字m文字m' ‘文字?文字m文字o' ‘文字?文字m文字m' の6種類の文字列の和集合で行われることとなる。
Assuming that the character string to be searched is a character string composed of three characters of “character j character m character o”, character j is character j and character n
And letters? And the character o is replaced with the union of the characters o and m. Therefore, the search is based on 'character j character m character o''character j character m character m''character n character m character o''character n character m character m''character? Letter m letter o '' letter? This is performed by the union of six types of character strings of the character m and the character m '.

さて、情報処理手段2は、以上のようにして、検索す
べき文字列の範囲を拡大し、記憶手段3から、指定され
た範囲の文字コード情報を読み出しながら、範囲の拡大
された文字列のいずれかと一致する文字列を検索する。
情報処理手段2は検索によって抽出された文書情報を、
出力手段6に送出する。出力手段6が、例えばCRTの場
合には、それに表示され、プリンタの場合には、その情
報が印刷される。
As described above, the information processing unit 2 expands the range of the character string to be searched, and reads out the character code information of the specified range from the storage unit 3 while retrieving the expanded character string. Search for a character string that matches any of them.
The information processing means 2 converts the document information extracted by the search into
It is sent to output means 6. If the output means 6 is, for example, a CRT, it is displayed on the output means, and if it is a printer, the information is printed.

以上のように本実施例によれば、画像情報として入力
された文書情報を文字認識した文字コード情報から文字
列を検索するとき、文字認識のアルゴリズムに固有の誤
認識の傾向を表すテーブルである対応表を参照して、上
記文字列を、この文字列とこれを誤認識する可能性のあ
るすべての文字列との和集合に置き換えることによっ
て、実質的に範囲を拡大して検索することにより、例え
文字認識手段5が誤認識しても、詮索漏れの頻度を大幅
に減少させることができる。
As described above, according to the present embodiment, when searching for a character string from character code information obtained by character recognition of document information input as image information, the table represents the tendency of misrecognition inherent to a character recognition algorithm. By referring to the correspondence table and replacing the character string with the union of this character string and all character strings that may be erroneously recognized, the search is performed with the range expanded substantially. Even if the character recognizing means 5 misrecognizes, the frequency of prying omissions can be greatly reduced.

なお、上記の実施例においては、対応表に基づいて検
索文字列を、誤認識し易い他の文字列との和集合に置き
換えて検索するように構成したが、本発明の主旨は、文
字認識した文字コードを検索にだけ用いるときには、検
索のときに、認識の不完全性を補うようにすれば、誤認
識は大きな問題とはならないことに着眼して、検索すべ
き文字列を、認識の不完全性を補うように実質的に文字
列の範囲を拡大して検索しようとするものである。した
がって、検索する文字列の範囲を実質的に拡大する手段
はどのような手段であっても特に限定されるものではな
い。
In the embodiment described above, the search character string is replaced with the union of other character strings that are easily misrecognized on the basis of the correspondence table, and the search is performed. When using a character code that has just been used for search, if the search is made to compensate for imperfections in recognition, erroneous recognition will not be a major problem. It is intended to substantially expand the range of the character string so as to compensate for the incompleteness and to search for it. Therefore, any means for substantially expanding the range of the character string to be searched is not particularly limited.

発明の効果 以上のように本発明は、文書を文字認識して得られた
文字コードから文字列を検索するとき、文字認識の不完
全を補うように検索の文字列を実質的に拡大して検索す
ることによって、検索漏れの頻度を大幅に減少させるこ
とができる。
Effect of the Invention As described above, the present invention substantially expands a search character string to compensate for incomplete character recognition when searching for a character string from a character code obtained by character recognition of a document. By performing a search, the frequency of search omissions can be significantly reduced.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の一実施例における情報蓄積装置のブロ
ック図、第2図は上記実施例における情報蓄積装置の動
作を示すフローチャート、第3図は理想的な文字認識の
場合を示す概念図、第4図は不完全な文字認識の場合を
示す概念図、第5図は従来の情報蓄積装置の動作を示す
フローチャートである。 2……情報処理手段、3……記憶手段、4……コード入
力手段、5……文字認識手段。
FIG. 1 is a block diagram of an information storage device according to one embodiment of the present invention, FIG. 2 is a flowchart showing the operation of the information storage device in the above embodiment, and FIG. 3 is a conceptual diagram showing an ideal character recognition case. FIG. 4 is a conceptual diagram showing the case of incomplete character recognition, and FIG. 5 is a flowchart showing the operation of a conventional information storage device. 2 ... information processing means, 3 ... storage means, 4 ... code input means, 5 ... character recognition means.

フロントページの続き (56)参考文献 特開 平2−17573(JP,A) 特開 昭62−11932(JP,A) 特開 平1−279324(JP,A) 特開 平4−70967(JP,A) 特開 昭62−44878(JP,A) (58)調査した分野(Int.Cl.6,DB名) G06F 17/30 Continuation of the front page (56) References JP-A-2-17573 (JP, A) JP-A-62-11932 (JP, A) JP-A-1-279324 (JP, A) JP-A-4-70967 (JP) , A) JP-A-62-44878 (JP, A) (58) Fields investigated (Int. Cl. 6 , DB name) G06F 17/30

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】画像情報として入力された情報を文字認識
して得られた結果を蓄積した文字コード情報のなかで、
指定された文字列を検索する検索方法であって、前記文
字列を構成する各文字に対して、前記文字列を構成する
文字と前記文字を誤認識する可能性のある文字とを含む
文字集合を設定し、各文字集合の中から任意の1文字を
選択して得られる文字列群のいずれかと一致する文字列
を指定された文字列と一致するとみなして、前記文字コ
ード情報を検索することを特徴とする情報蓄積装置のた
めの情報の検索方法。
1. Character code information in which results obtained by character recognition of information input as image information are stored.
A search method for searching for a specified character string, wherein a character set including, for each character constituting the character string, a character constituting the character string and a character which may be erroneously recognized as the character And searching the character code information by regarding a character string that matches any one of character strings obtained by selecting an arbitrary character from each character set as a specified character string. A method for retrieving information for an information storage device characterized by the following.
【請求項2】画像情報として入力される文書情報を蓄積
する画像蓄積手段と、前記文書情報に含まれる文字を認
識する認識手段と、前記認識手段から出力されるコード
情報を蓄積する補助情報蓄積手段と、指定された文字列
を前記補助情報蓄積手段に蓄積されたコード情報内で検
索する検索手段とを具備し、前記検索手段は、検索すべ
き文字列の各文字に対して、前記文字列を構成する文字
と前記文字を誤認識する可能性のある文字とを含む文字
集合を設定し、各文字集合の中から任意の1文字を選択
して得られる文字列群のいずれかと一致する文字列を指
定された文字列と一致するとみなして、前記文字コード
情報を検索することを特徴とする情報蓄積装置。
2. An image storage device for storing document information input as image information, a recognition device for recognizing characters included in the document information, and an auxiliary information storage for storing code information output from the recognition device. Means for searching for a specified character string in the code information stored in the auxiliary information storage means, wherein the search means performs, for each character of the character string to be searched, Set a character set that includes the characters that make up the string and characters that may misrecognize the character, and match any one of the character strings obtained by selecting any one character from each character set An information storage device, wherein a character string is regarded as matching a specified character string, and the character code information is searched.
JP2285023A 1990-10-22 1990-10-22 Information retrieval method and information storage device Expired - Fee Related JP2932667B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2285023A JP2932667B2 (en) 1990-10-22 1990-10-22 Information retrieval method and information storage device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2285023A JP2932667B2 (en) 1990-10-22 1990-10-22 Information retrieval method and information storage device

Publications (2)

Publication Number Publication Date
JPH04158478A JPH04158478A (en) 1992-06-01
JP2932667B2 true JP2932667B2 (en) 1999-08-09

Family

ID=17686157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2285023A Expired - Fee Related JP2932667B2 (en) 1990-10-22 1990-10-22 Information retrieval method and information storage device

Country Status (1)

Country Link
JP (1) JP2932667B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3689455B2 (en) * 1995-07-03 2005-08-31 キヤノン株式会社 Information processing method and apparatus
JP2002189747A (en) 2000-12-19 2002-07-05 Hitachi Ltd Retrieving method for document information
JP4006239B2 (en) 2002-02-21 2007-11-14 株式会社日立製作所 Document search method and search system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515726B2 (en) * 1985-07-10 1996-07-10 株式会社日立製作所 Information retrieval method and device
JPH0217573A (en) * 1988-07-06 1990-01-22 Mitsubishi Electric Corp Filing device

Also Published As

Publication number Publication date
JPH04158478A (en) 1992-06-01

Similar Documents

Publication Publication Date Title
JP4260790B2 (en) Filing / retrieval apparatus and filing / retrieval method
US6549913B1 (en) Method for compiling an image database, an image database system, and an image data storage medium
JP3491962B2 (en) Document search method and system
JPH0773190A (en) Pictograph naming for pen base computer system
JPH06111056A (en) System and method for data processing, which corrects error in character recognition of digital image of document format
JP2005018678A (en) Form data input processing device, form data input processing method, and program
JPH07200786A (en) Filing device
JP2006343870A (en) Document retrieval device, method and storage medium
JPH07200631A (en) Electronic filing device
JP2932667B2 (en) Information retrieval method and information storage device
JP4208566B2 (en) Document image search apparatus and method, document image search system, and program
JP2000231505A (en) Automatically naming method for data object group and its storage medium
JP2000322417A (en) Device and method for filing image and storage medium
JPH09282328A (en) Document image processor and method therefor
JPS63249267A (en) Electronic filing system
JPH06290251A (en) Document image processing method of electronic file device
JP2001320571A (en) System and method for processing handwritten slip data
JPH10187751A (en) Recognition data processor and its program recording medium
JP2020047031A (en) Document retrieval device, document retrieval system and program
JPH06103402A (en) Business card recognizing device
JPH04199467A (en) Information accumulation device
JPH07152856A (en) Optical character reader
JP3193249B2 (en) Keyword search method
JPH05210635A (en) Input device
JP3251704B2 (en) Recognition processing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090528

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees