JP2996823B2 - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JP2996823B2
JP2996823B2 JP4353042A JP35304292A JP2996823B2 JP 2996823 B2 JP2996823 B2 JP 2996823B2 JP 4353042 A JP4353042 A JP 4353042A JP 35304292 A JP35304292 A JP 35304292A JP 2996823 B2 JP2996823 B2 JP 2996823B2
Authority
JP
Japan
Prior art keywords
character
recognition
character string
type
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4353042A
Other languages
Japanese (ja)
Other versions
JPH06180767A (en
Inventor
英明 磯貝
Original Assignee
英明 磯貝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英明 磯貝 filed Critical 英明 磯貝
Priority to JP4353042A priority Critical patent/JP2996823B2/en
Publication of JPH06180767A publication Critical patent/JPH06180767A/en
Application granted granted Critical
Publication of JP2996823B2 publication Critical patent/JP2996823B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、イメージスキャナによ
って読取られたイメージデータやファクシミリ装置によ
り伝送されたイメージデータから、所定の箇所に記入さ
れた文字を切り出し、文字認識処理する文字認識装置に
関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognizing device for cutting out characters written in predetermined places from image data read by an image scanner or image data transmitted by a facsimile machine, and performing character recognition processing.

【0002】[0002]

【従来の技術】従来から、コンピュータに必要なデータ
を入力するための装置としてOCR(光学式文字読取装
置)が知られている。OCRでは、帳票の所定位置に記
入された文字・記号・マーク等の認識対象を、文字認識
処理や位置検出処理によって認識し、コンピュータに入
力し得る所定のデータに変換する。また、最近では、帳
票を直接OCRに入力する他に、ファクシミリ装置等を
使用して遠隔場所から伝送された帳票のイメージデータ
から認識対象を切り出して認識処理するシステムも使用
されるようになってきた。
2. Description of the Related Art Conventionally, an OCR (optical character reader) has been known as a device for inputting necessary data to a computer. In OCR, a recognition target such as a character, a symbol, or a mark written in a predetermined position of a form is recognized by character recognition processing or position detection processing, and is converted into predetermined data that can be input to a computer. In recent years, in addition to directly inputting a form into an OCR, a system that uses a facsimile machine or the like to cut out a recognition target from image data of a form transmitted from a remote place and perform recognition processing has also been used. Was.

【0003】ところで、一般的な文字認識装置では、イ
メージデータから文字情報の部分を検出し、切り出した
のち、文字認識及び単語認識を行うことにより、認識対
象を同定していくことがなされている。この場合、文字
が1字でも特定できないと、単語認識が不可能になる。
[0003] In a general character recognition device, a character information portion is detected from image data, cut out, and then character recognition and word recognition are performed to identify a recognition target. . In this case, if even one character cannot be specified, word recognition becomes impossible.

【0004】一方、例えば郵便番号の読取装置等では、
郵便番号と住所のように、認識対象の特定に際して相互
に補填し合う2種類の文字情報を利用し、郵便番号の読
取りが不能であった場合に、住所の認識結果を利用して
郵便番号を特定することにより、郵便番号の読取精度を
高める方式も提案されている(特開平2-242389号)。
On the other hand, for example, in a postal code reader,
Like the postal code and the address, two types of character information that complement each other are used to identify the recognition target. If the postal code cannot be read, the postal code is used by using the address recognition result. A method has also been proposed in which the reading accuracy of the postal code is increased by specifying (Japanese Patent Laid-Open No. 2-242389).

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上述し
た従来の方式では、2種類の文字情報のうち、一方が確
実に認識できることが条件となっている。このため、2
種類の文字情報の双方が読取不能であった場合には、認
識も失敗するという問題点がある。
However, in the above-mentioned conventional system, it is a condition that one of the two types of character information can be reliably recognized. Therefore, 2
When both types of character information cannot be read, there is a problem that the recognition also fails.

【0006】本発明はこのような問題点を解決するため
になされたもので、認識対象の特定に際して相互に補填
し合う複数種類の文字列がいずれも読取不能であって
も、文字列の認識を可能にすることができ、文字列の認
識率を格段に向上させることができる文字認識装置を提
供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve such a problem. Even when any of a plurality of types of character strings that complement each other when specifying a recognition target cannot be read, character string recognition is performed. It is an object of the present invention to provide a character recognition device that can make character recognition possible and can significantly improve a character string recognition rate.

【0007】[0007]

【課題を解決するための手段】本発明に係る文字認識装
置は、認識対象の特定に際して相互に補填し合う複数種
類の文字列のイメージをそれぞれ文字認識処理して所定
値以上の確かさで認識された文字とその位置の情報とを
含む文字列の不完全な認識結果をそれぞれ出力する複数
の文字認識処理手段と、認識対象となり得る各種類の文
字列を他の種類の文字列と対応させて記憶してなる補填
辞書と、前記各文字認識処理手段で得られた各種類の文
字列の不完全な認識結果に基づいて前記認識された文字
を認識された位置に含む同種類の文字列を前記補填辞書
参照しこれらに対応する他の種類の文字列の文字列候
補を前記補填辞書から相互に抽出し前記各文字認識処理
手段に相互に供給する補填処理手段とを備え、前記各文
字認識処理手段は、前記補填処理手段から供給された文
字列候補によって認識対象の範囲を絞り込みながら前記
文字列の完全な認識結果が確定するまで認識処理を繰返
すものであることを特徴とする。
SUMMARY OF THE INVENTION A character recognition apparatus according to the present invention performs character recognition processing on a plurality of types of character string images which are mutually complemented when specifying a recognition target, and performs recognition with a certain degree of certainty or more. Character recognition processing means for outputting an incomplete recognition result of a character string including the extracted character and information on its position, and each type of sentence that can be recognized
Compensation by storing character strings in association with other types of character strings
A dictionary and the same type of character string including the recognized character at a recognized position based on the incomplete recognition result of each type of character string obtained by each of the character recognition processing means are included in the supplementary dictionary.
And a supplementary processing means for mutually extracting character string candidates of other types of character strings corresponding to these from the supplementary dictionary and supplying the extracted character string candidates to the respective character recognition processing means. Is characterized in that the recognition processing is repeated until the complete recognition result of the character string is determined while narrowing the range of the recognition target by the character string candidate supplied from the compensation processing means.

【0008】また、本発明に係る他の文字認識装置は、
認識対象の特定に際して相互に補填し合う複数種類の文
字列のイメージをそれぞれ文字認識処理する複数の文字
認識処理手段と、前記各文字認識処理手段で得られた各
種類の文字列の不完全な認識結果の組合せ情報から、前
記各種類の文字列の完全な認識結果を得る補填処理テー
ブルとを具備してなることを特徴とする。
Further, another character recognition device according to the present invention comprises:
A plurality of character recognition processing means for respectively performing character recognition processing on a plurality of types of character string images which are mutually complemented when specifying a recognition target; and an incomplete character string of each type obtained by each of the character recognition processing means. And a compensation processing table for obtaining a complete recognition result of each type of character string from the combination information of the recognition results.

【0009】[0009]

【作用】本発明によれば、認識対象の特定に際して相互
に補填し合う複数種類の文字列のイメージを複数の文字
認識処理手段で認識処理した結果、これらの文字認識処
理手段でそれぞれ完全な認識結果が得られない場合で
も、不完全な認識結果から他の種類の文字列に関するい
くつかの文字列候補が相互に抽出される。そして、各文
字認識処理手段は、他の文字認識処理手段での不完全な
認識結果から求められたこれらの文字列候補を相互に参
照して自己が認識する文字列を段階的に絞り込んでい
き、最終的に完全な認識結果を得ることができる。この
ため、本発明によれば、個々の文字認識処理手段から不
完全な認識結果しか得られない場合でも、複数種類の文
字列が持つ相互補完性によって、最終的には完全な認識
結果を得ることが可能となる。
According to the present invention, when a plurality of types of character string images which are mutually complemented when a recognition target is specified are recognized by a plurality of character recognition processing means, complete recognition is performed by the character recognition processing means. Even when the result is not obtained, some character string candidates for other types of character strings are mutually extracted from the incomplete recognition result. Then, each character recognition processing means narrows down the character strings recognized by itself by mutually referring to these character string candidates obtained from the incomplete recognition results of the other character recognition processing means. Finally, a complete recognition result can be obtained. Therefore, according to the present invention, even when only incomplete recognition results can be obtained from individual character recognition processing means, a complete recognition result is finally obtained due to the mutual complementarity of a plurality of types of character strings. It becomes possible.

【0010】また、本発明の他の文字認識装置によれ
ば、複数種類の文字列に関する不完全な認識結果の組合
せ情報から、各種類の文字列の完全な認識結果を一度に
求める補完処理テーブルを持つことにより、高速に認識
結果を求めることができる。
According to another character recognition apparatus of the present invention, a complementary processing table for obtaining a complete recognition result of each type of character string at once from combination information of incomplete recognition results regarding a plurality of types of character strings. , The recognition result can be obtained at high speed.

【0011】なお、ここで複数の文字認識処理手段と
は、必ずしも物理的に複数設けるという必要ではなく、
各種類の文字列の認識処理が順番に実行される場合に
は、各文字列の認識処理ステップがそれぞれ文字認識処
理手段に該当することを意味するものである。
Here, the plurality of character recognition processing means does not necessarily need to be physically provided in plurality.
When the recognition processing of each type of character string is executed in order, this means that each character string recognition processing step corresponds to a character recognition processing unit.

【0012】[0012]

【実施例】以下、添付の図面を参照して本発明の実施例
について説明する。図1は本発明の一実施例に係る文字
認識装置を示す機能ブロック図である。図示しないイメ
ージスキャナで所定の帳票を読取ることによって得られ
たイメージデータは、文字検出切出部1に供給される。
文字検出切出部1は、イメージデータの特定領域のX方
向及びY方向の射影から、文字を検出し切り出す。文字
検出切出部1で切り出されたイメージデータのうち、第
1種類の文字列は、文字認識部2に供給され、第2種類
の文字列は、文字認識部3に供給される。文字認識部
2,3では、それぞれ文字認識辞書4,5を参照して、
切り出された文字列のイメージデータから各文字を認識
処理する。文字認識部2,3からの文字認識結果は、そ
れぞれ単語認識部6,7に供給される。単語認識部6,
7は、それぞれ単語認識辞書8,9を参照して文字認識
結果に基づく単語認識処理を実行する。文字認識部2、
文字認識辞書4、単語認識部6及び単語認識辞書8は、
第1の文字認識処理手段15を構成し、文字認識部3、
文字認識辞書5、単語認識部7及び単語認識辞書9は、
第2の文字認識処理手段16を構成している。
Embodiments of the present invention will be described below with reference to the accompanying drawings. FIG. 1 is a functional block diagram showing a character recognition device according to one embodiment of the present invention. Image data obtained by reading a predetermined form with an image scanner (not shown) is supplied to the character detection cutout unit 1.
The character detection cutout unit 1 detects and cuts out a character from the projection of the specific area of the image data in the X and Y directions. Among the image data cut out by the character detection cutout unit 1, a first type of character string is supplied to a character recognition unit 2, and a second type of character string is supplied to a character recognition unit 3. The character recognition units 2 and 3 respectively refer to the character recognition dictionaries 4 and 5 and
Recognize each character from the extracted character string image data. The character recognition results from the character recognition units 2 and 3 are supplied to word recognition units 6 and 7, respectively. Word recognition unit 6,
7 executes word recognition processing based on the character recognition result with reference to the word recognition dictionaries 8 and 9, respectively. Character recognition unit 2,
The character recognition dictionary 4, the word recognition unit 6, and the word recognition dictionary 8
The first character recognition processing means 15 constitutes the character recognition unit 3,
The character recognition dictionary 5, the word recognition unit 7, and the word recognition dictionary 9
The second character recognition processing means 16 is constituted.

【0013】単語認識部6の単語認識結果は、単語補填
処理部10に供給され、単語認識部7の単語認識結果
は、単語補填処理部11に供給されている。単語補填処
理部10は、単語認識部6で得られた不完全な単語認識
結果から、補填辞書12を参照して第1種類の文字列に
ついての文字列候補を求め、これらの文字列候補から特
定される第2種類の文字列候補を文字認識辞書5、単語
認識部7及び単語認識辞書9にそれぞれ供給する。同様
に、単語補填処理部11は、単語認識部7で得られた不
完全な認識結果から、補填辞書12を参照して第2種類
の文字列についての文字列候補を求め、これらの文字列
候補から特定される第1種類の文字列候補を文字認識辞
書4、単語認識部6及び単語認識辞書8にそれぞれ供給
する。
The word recognition result of the word recognition unit 6 is supplied to a word compensation processing unit 10, and the word recognition result of the word recognition unit 7 is supplied to a word compensation processing unit 11. The word compensation processing unit 10 obtains character string candidates for the first type of character string from the incomplete word recognition result obtained by the word recognizing unit 6 with reference to the supplementation dictionary 12, and from these character string candidates. The specified second type of character string candidate is supplied to the character recognition dictionary 5, the word recognition unit 7, and the word recognition dictionary 9, respectively. Similarly, from the incomplete recognition result obtained by the word recognizing unit 7, the word compensation processing unit 11 refers to the compensation dictionary 12 to find a character string candidate for the second type of character string, and The first type of character string candidate specified from the candidate is supplied to the character recognition dictionary 4, the word recognition unit 6, and the word recognition dictionary 8, respectively.

【0014】そして、文字認識部2,3及び単語認識部
6,7では、これら供給された第1種類及び第2種類の
文字列候補に基づいて再度認識処理を実行し、文字列候
補を絞りこんでいく。
The character recognizing units 2 and 3 and the word recognizing units 6 and 7 perform recognition processing again based on the supplied first type and second type character string candidates, and narrow down the character string candidates. I will go in.

【0015】いま、第1種類の文字列が郵便番号、第2
種類の文字列が区市町村名であるとした場合、この装置
では次のように認識処理が実行されていく。即ち、文字
認識部2が最初に認識処理を行った結果が「??7」で
あり、文字認識部3が最初に認識処理を行った結果が
「?川?」であったとすると、これらの認識結果だけで
は、単語認識部6,7では、直ちに所望する認識結果を
得ることができない。そこで、単語補填処理部11は、
3文字構成で2番目の文字が「川」である区市町村名を
補填辞書12から検索する。その検索結果として、例え
ば「立川市」、「秋川市」、「荒川区」及び「品川区」
が得られると、次に、単語補填処理部11は、これらの
文字列から特定される第1種類の文字列候補、即ち郵便
番号を単語補填辞書12から検索する。その検索結果が
「190」、「197」、「116」及び「142」で
あったとすると、これらが第1種類の文字列候補とな
る。
Now, the first type of character string is a postal code,
Assuming that the type of character string is the name of a ward, city, town or village, this device performs the recognition process as follows. That is, assuming that the result of the first recognition performed by the character recognition unit 2 is "?? 7" and the result of the first recognition performed by the character recognition unit 3 is "???" With the recognition results alone, the word recognition units 6 and 7 cannot immediately obtain a desired recognition result. Therefore, the word compensation processing unit 11
A ward, municipal, and municipal name in which the second character is “river” in a three-character configuration is searched from the supplementary dictionary 12. As the search results, for example, “Tachikawa City”, “Akikawa City”, “Arakawa Ward” and “Shinagawa Ward”
Is obtained, the word compensation processing unit 11 next searches the word supplement dictionary 12 for a first type of character string candidate identified from these character strings, that is, a postal code. Assuming that the search results are “190”, “197”, “116”, and “142”, these are character string candidates of the first type.

【0016】こうして求められた第1種類の文字列候補
「190」、「197」、…は、単語認識部6に供給さ
れる。単語認識部6では、「??7」という認識結果
と、単語補填処理部11から供給された文字列候補「1
90」、「197」、「116」及び「142」とか
ら、第1種類の文字列が「197」であると認識する。
The first type character string candidates "190", "197",... Thus obtained are supplied to the word recognition section 6. The word recognizing unit 6 recognizes “?? 7” and the character string candidate “1” supplied from the word replenishment processing unit 11.
From “90”, “197”, “116”, and “142”, it is recognized that the first type of character string is “197”.

【0017】次に、単語補填処理部10は、単語認識部
6で認識された第1種類の文字列である「197」とい
う郵便番号から特定される第2種類の文字列を補填辞書
12から検索し、「秋川市」及び「福生市」という文字
列候補を得る。この第2種類の文字列候補は単語認識部
7に供給される。単語認識部7では、「?川?」という
認識結果と、単語補填処理部10から供給された文字列
候補「秋川市」及び「福生市」とから、第2種類の文字
列が「秋川市」であると認識する。このように、第1種
類の文字列候補と第2種類の文字列候補とで各種類の不
完全な文字認識結果を相互に補填し合うことにより、不
完全な認識結果から完全な認識結果を得ることができ
る。
Next, the word supplementation processing unit 10 reads the second type character string identified by the postal code “197”, which is the first type character string recognized by the word recognition unit 6, from the complement dictionary 12. A search is performed to obtain character string candidates of “Akigawa City” and “Fussa City”. This second type of character string candidate is supplied to the word recognition unit 7. In the word recognition unit 7, the second type of character string is “Akikawa city” from the recognition result “? Kawa?” And the character string candidates “Akikawa city” and “Fussa city” supplied from the word compensation processing unit 10. Is recognized. In this way, the first type of character string candidate and the second type of character string candidate complement each other with incomplete character recognition results of each type, so that a complete recognition result can be obtained from an incomplete recognition result. Obtainable.

【0018】なお、単語補填処理部10,11で高速に
文字列候補を検索するためには、補填辞書12にインデ
ックスファイルを使用すればよい。即ち、図2に示すよ
うに、第2種類の文字列のうち、1字のみが読取可、2
字のみが読取可、その位置、その文字等の条件の組合せ
毎に、インデックスファイル211 ,212 ,213,
…,21n を作成し、これらのインデックスファイル2
11 〜21n に、マスターデータベースファイル22に
記憶された対応する文字列へのインデックスやポインタ
等を記憶しておく。これにより、第2種類の不完全な認
識結果から第1種類の文字列候補を直ちに検索すること
ができる。また、第1種類の認識結果から第2種類の文
字列候補を検索する場合にも同様のファイル構成として
おけばよい。
In order to search the character string candidates at high speed in the word supplement processing units 10 and 11, an index file may be used for the supplement dictionary 12. That is, as shown in FIG. 2, only one character of the second type of character string is readable.
The index files 211, 212, 213, and
…, 21n are created and these index files 2
11 to 21n store indices and pointers to the corresponding character strings stored in the master database file 22. This makes it possible to immediately search for the first type of character string candidate from the second type of incomplete recognition result. A similar file configuration may be used when searching for a second type of character string candidate from a first type of recognition result.

【0019】検索の速度を更に高めるためには、例えば
図3に示すように、第1及び第2種類の不完全な認識結
果を入力とし、その組合せ情報から特定される第1及び
第2種類の完全な認識結果を出力とする補填処理テーブ
ル31を作成すればよい。
In order to further increase the search speed, for example, as shown in FIG. 3, the first and second types of incomplete recognition results are input, and the first and second types specified by the combination information are input. It is sufficient to create a compensation processing table 31 that outputs a complete recognition result of the above.

【0020】認識率を更に高めるためには、文字認識部
2,3及び単語認識部6,7で所定のマッチングレベル
に達しなかったもので疑わしいと思われる候補も含めて
再度認識処理を実行することが考えられる。例えば、文
字認識部2での文字列の各文字の認識結果が、下記表1
のように求められたとする。
In order to further increase the recognition rate, the character recognizing units 2 and 3 and the word recognizing units 6 and 7 perform the recognizing process again, including candidates that have not reached the predetermined matching level and are considered suspicious. It is possible. For example, the recognition result of each character of the character string in the character recognition unit 2 is shown in Table 1 below.
Suppose you are asked as follows.

【0021】[0021]

【表1】 [Table 1]

【0022】この場合、認識結果として出力する閾値を
0.75とすると、文字認識部2から出力される認識結果
は、前述したように「??7」となる。ここで、単語補
填処理部11から文字列候補として例えば「190」、
「197」、「116」、「142」が供給されたら、
各文字列について、マッチングレベルの総計を計算す
る。例えば「190」の総計は1.05、「197」の総計
は1.63となる。そして、最も数値の高いものを認識結果
とする。これにより、認識率を更に向上させることがで
きる。また、このような認識処理の結果、特定の文字に
ついてのマッチングレベルが常に低いという傾向が見ら
れたときには、文字認識辞書4,5及び単語認識辞書
7,8をマッチングレベルを引き上げるように更新する
ようにしてもよい。
In this case, the threshold output as the recognition result is
If it is 0.75, the recognition result output from the character recognition unit 2 is “?? 7” as described above. Here, for example, “190” as a character string candidate from the word
When "197", "116", and "142" are supplied,
For each string, calculate the sum of the matching levels. For example, the total of “190” is 1.05, and the total of “197” is 1.63. Then, the one with the highest numerical value is set as the recognition result. Thereby, the recognition rate can be further improved. Further, as a result of such recognition processing, when a tendency is observed that the matching level for a specific character is always low, the character recognition dictionaries 4 and 5 and the word recognition dictionaries 7 and 8 are updated so as to increase the matching level. You may do so.

【0023】なお、上記の実施例では、まず第2種類の
文字列の認識結果「?川?」から第1種類の文字列候補
「190」、「197」、…を抽出したが、第1種類の
文字列の認識結果「??7」から第2種類の文字列候補
を抽出するようにしてもよい。いずれを先に行うかは、
候補数の数等により適宜設定すればよい。
In the above embodiment, the first type character string candidates "190", "197",... Are first extracted from the recognition result "? Kawa?" Of the second type character string. A second type of character string candidate may be extracted from the type character string recognition result “?? 7”. Which one to do first?
What is necessary is just to set suitably according to the number of candidates etc.

【0024】また、例えば郵便番号、住所、フリガナ、
電話番号の市外局番等、相互に補填し合う更に多くの種
類の文字列を使用して認識処理を行う場合には、例えば
図4に示すように、文字認識部42、文字認識辞書4
3、単語認識部44及び単語認識辞書45からなる文字
認識処理手段の系統481 〜48n を文字列の種類分だ
け備え、単語補填処理部46からからフィードバックさ
れる更に多くの文字列候補を使用して再認識処理を実行
すればよい。これにより、更に多くの情報に基づいてよ
り高精度の認識処理を実行することができる。
Further, for example, a postal code, an address, a reading,
When performing recognition processing using more types of character strings that complement each other, such as the area code of a telephone number, for example, as shown in FIG.
3. A system of character recognition processing means 481 to 48n comprising a word recognition section 44 and a word recognition dictionary 45 is provided for each type of character string, and more character string candidates fed back from the word compensation processing section 46 are used. The re-recognition process may be executed. As a result, more accurate recognition processing can be performed based on more information.

【0025】[0025]

【発明の効果】以上述べたように、本発明によれば、個
々の文字認識処理手段から不完全な認識結果しか得られ
ない場合でも、これらの不完全な情報から得られる複数
の文字列候補で各文字列の認識処理を相互に補填するよ
うにしているので、認識対象の特定に際し、相互に補填
し合う複数種類の文字列がいずれも読取不能であって
も、文字列の認識を可能にすることができ、文字列の認
識率を格段に向上させることが可能になる。
As described above, according to the present invention, even when only incomplete recognition results can be obtained from individual character recognition processing means, a plurality of character string candidates obtained from these incomplete information can be obtained. The recognition process of each character string is complemented by each other, so that when identifying the recognition target, even if any of multiple types of character strings that complement each other cannot be read, character strings can be recognized. , And the character string recognition rate can be significantly improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の実施例に係る文字認識装置の機能ブ
ロック図である。
FIG. 1 is a functional block diagram of a character recognition device according to an embodiment of the present invention.

【図2】 同装置における補填辞書の構成例を示す図で
ある。
FIG. 2 is a diagram showing a configuration example of a supplement dictionary in the device.

【図3】 同装置における補填処理部の他の構成例を示
す機能ブロック図である。
FIG. 3 is a functional block diagram showing another configuration example of the compensation processing unit in the apparatus.

【図4】 本発明の他の実施例に係る文字認識装置の機
能ブロック図である。
FIG. 4 is a functional block diagram of a character recognition device according to another embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1,41…文字検出切出部、2,3,42…文字認識
部、4,5,43…文字認識辞書、6,7,44…単語
認識部、8,9,45…単語認識辞書、10,11,4
6…単語補填処理部、12,47…単語補填辞書、15
…第1の文字認識処理手段、16…第2の文字認識処理
手段、481 〜48n…文字認識処理手段。
1, 41: character detection cutout section, 2, 3, 42: character recognition section, 4, 5, 43 ... character recognition dictionary, 6, 7, 44 ... word recognition section, 8, 9, 45 ... word recognition dictionary, 10,11,4
6 ... word supplement processing unit, 12, 47 ... word supplement dictionary, 15
.., First character recognition processing means, 16... Second character recognition processing means, 481 to 48n.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 認識対象の特定に際して相互に補填し合
う複数種類の文字列のイメージをそれぞれ文字認識処理
して所定値以上の確かさで認識された文字とその位置の
情報とを含む文字列の不完全な認識結果をそれぞれ出力
する複数の文字認識処理手段と、認識対象となり得る各種類の文字列を他の種類の文字列
と対応させて記憶してなる補填辞書と、 前記各文字認識処理手段で得られた各種類の文字列の不
完全な認識結果に基づいて前記認識された文字を認識さ
れた位置に含む同種類の文字列を前記補填辞書で参照し
これらに対応する他の種類の文字列の文字列候補を前記
補填辞書から相互に抽出し前記各文字認識処理手段に相
互に供給する補填処理手段とを備え、 前記各文字認識処理手段は、前記補填処理手段から供給
された文字列候補によって認識対象の範囲を絞り込みな
がら前記文字列の完全な認識結果が確定するまで認識処
理を繰返すものであることを特徴とする文字認識装置。
1. A string containing the characters identify when an image of a plurality of types of character strings mutually compensate each other recognized each character recognition process at a predetermined value or more certainty of the recognition target and the information of the position A plurality of character recognition processing means for outputting incomplete recognition results of each character string, and converting each type of character string that can be recognized into another type of character string
And a supplementary dictionary stored in association with the same type including the recognized character at a recognized position based on an incomplete recognition result of each type of character string obtained by each of the character recognition processing units. Referring to the character string in the compensation dictionary the character string candidates of other types of character strings corresponding to these
Compensation processing means for mutually extracting from the compensation dictionary and supplying each of the character recognition processing means to each other, wherein each of the character recognition processing means determines a range of a recognition target by a character string candidate supplied from the compensation processing means. A character recognizing device that repeats recognition processing while narrowing down until a complete recognition result of the character string is determined.
JP4353042A 1992-12-11 1992-12-11 Character recognition device Expired - Fee Related JP2996823B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4353042A JP2996823B2 (en) 1992-12-11 1992-12-11 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4353042A JP2996823B2 (en) 1992-12-11 1992-12-11 Character recognition device

Publications (2)

Publication Number Publication Date
JPH06180767A JPH06180767A (en) 1994-06-28
JP2996823B2 true JP2996823B2 (en) 2000-01-11

Family

ID=18428179

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4353042A Expired - Fee Related JP2996823B2 (en) 1992-12-11 1992-12-11 Character recognition device

Country Status (1)

Country Link
JP (1) JP2996823B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4574823B2 (en) * 2000-09-21 2010-11-04 株式会社東芝 Delivery processing apparatus and delivery processing method

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63268082A (en) * 1987-04-27 1988-11-04 Toshiba Corp Pattern recognizing device
JP2732593B2 (en) * 1988-07-13 1998-03-30 株式会社東芝 Character reading system

Also Published As

Publication number Publication date
JPH06180767A (en) 1994-06-28

Similar Documents

Publication Publication Date Title
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
EA003619B1 (en) System and method for searching electronic documents created with optical character recognition
JPH0682403B2 (en) Optical character reader
JP3309174B2 (en) Character recognition method and device
JP2996823B2 (en) Character recognition device
JP3531222B2 (en) Similar character string search device
JPH06215184A (en) Labeling device for extracted area
JP2001283156A (en) Device and method for recognizing address and computer readable recording medium stored with program for allowing computer to execute the same method
JP2000090193A (en) Character recognition device and item classifying method
JP3924899B2 (en) Text search apparatus and text search method
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JPH09265509A (en) Matching read address recognition system
JP3241854B2 (en) Automatic word spelling correction device
JP2003296354A (en) Dictionary creation device
JP2530659B2 (en) Optical character reading system
JPH113401A (en) Information processor and its method
JPH0528323A (en) Character recognition device
JPH05120494A (en) Character recognizing method and its device
JPH07160730A (en) Entire text retrieval device
JPS63282586A (en) Character recognition device
JP3468199B2 (en) English word recognition device
JPH0652367A (en) Post-processing method for character recognition result
JPH0757059A (en) Character recognition device
JPS63138479A (en) Character recognizing device
JPH03273361A (en) Electronic dictionary

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091029

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101029

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121029

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees