JPH04280394A - Character recognizing device and recognized character fixing method - Google Patents

Character recognizing device and recognized character fixing method

Info

Publication number
JPH04280394A
JPH04280394A JP3043844A JP4384491A JPH04280394A JP H04280394 A JPH04280394 A JP H04280394A JP 3043844 A JP3043844 A JP 3043844A JP 4384491 A JP4384491 A JP 4384491A JP H04280394 A JPH04280394 A JP H04280394A
Authority
JP
Japan
Prior art keywords
character
item
characters
recognized
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3043844A
Other languages
Japanese (ja)
Inventor
Shigeki Ozawa
茂樹 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3043844A priority Critical patent/JPH04280394A/en
Publication of JPH04280394A publication Critical patent/JPH04280394A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

PURPOSE:To present the character recognizing device and the recognized character fixing method, which can obtain correct character recognition with much higher probability, concerning the device and the method to fix recognized characters by processing (post-processing) character data from an OCR (optical character reader). CONSTITUTION:A character reader 2 is provided to read characters described in the respective plural items of a slip 1, and a recognition processing device 3 is provided to fix the recognized characters from the character data read by the character reader 2. The recognition processing device 3 specifies character candidates to be recognized as the characters described in the respective plural items for each item and converts the character candidate to be recognized as the character described in the first item to the character candidate to be recognized as the character described in the second item related to the first item. Further, the specified character candidate to be recognized as the character described in the second item is compared with the converted character candidate, and the coincident character candidate is recognized and fixed as the character described in the second item.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、OCR(光学文字読み
取り)読取装置からの文字データを処理(後処理)して
、認識文字を確定する文字認識装置及び認識文字確定方
法に関する。OCR読取装置等の普及に伴い、オペレー
タの修正なしに読み取りデータの処理を行い、手書き文
字をより正確に認識できることが望まれている。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device and method for determining recognized characters by processing (post-processing) character data from an OCR (optical character reading) reading device. With the spread of OCR reading devices and the like, it is desired that read data can be processed without operator correction and handwritten characters can be recognized more accurately.

【0002】0002

【従来の技術】図6は、従来の文字認識装置及びその動
作を説明する図である。1は銀行等における取扱伝票の
一例であり、複数の項目記載欄(項目No1〜3)があ
る。
2. Description of the Related Art FIG. 6 is a diagram illustrating a conventional character recognition device and its operation. 1 is an example of a transaction slip at a bank, etc., and has a plurality of item entry columns (items No. 1 to No. 3).

【0003】項目No1は、氏名のフリガナの記入欄で
ある。項目No2は、氏名を漢字で記載する欄である。 更に、項目No3は、住所の記載欄である。通常これら
の項目欄には手書きで文字が記載される。
[0003] Item No. 1 is a field for entering the furigana of the name. Item No. 2 is a field in which the name is written in Kanji. Furthermore, item No. 3 is a column for writing an address. Normally, characters are written by hand in these item columns.

【0004】銀行等において、かかる手書きの伝票又は
帳票からデータをOCR読取装置2で読み取り業務処理
が行われる。したがって、手書きの文字は正確に読み取
られ認識されることが必要である。さもないとオペレー
タによる修正作業が大きく業務処理が非効率となる。
[0004] In banks and the like, data is read from such handwritten slips or forms using an OCR reader 2 and business processing is performed. Therefore, it is necessary that handwritten characters be accurately read and recognized. Otherwise, the operator will have to do a lot of correction work and business processing will become inefficient.

【0005】手書き伝票1の各項目欄に記載の文字は、
OCR読取装置2により読み取られ認識処理装置3に導
かれる。認識処理装置3は、項目欄毎に認識候補文字を
特定する。
[0005] The characters written in each item column of the handwritten slip 1 are as follows:
It is read by the OCR reader 2 and guided to the recognition processing device 3. The recognition processing device 3 identifies recognition candidate characters for each item field.

【0006】項目No1には、カタカナで「ヤマモト」
の四文字が手書き記載されている。認識処理装置3にお
いて、OCR読取装置2の読み取りデータを基に「ヤ」
の文字に対して、「ヤ」又は「ア」の候補文字が特定さ
れる。「マ」の文字に対しては、「ア」又は「マ」の候
補文字が特定される。更に、「モ」の文字に対しては、
「モ」と「サ」の候補文字が特定され、「ト」は、「ト
」のみが候補文字に特定される。
[0006] Item No. 1 is ``Yamamoto'' in katakana.
The four characters are handwritten. In the recognition processing device 3, “Y” is detected based on the data read by the OCR reading device 2.
A candidate character of "ya" or "a" is specified for the character. For the character "ma", candidate characters "a" or "ma" are identified. Furthermore, for the character “mo”,
Candidate characters for "mo" and "sa" are specified, and only "to" for "to" is specified as a candidate character.

【0007】候補文字欄aは、90%、候補文字欄bは
、80%、そして候補文字欄cは、70%の認識確率で
ある。かかる各文字の組合せで「ヤマモト」の四文字に
対応する候補文字は、「ヤアモト」〜「ママサト」の8
通りの組合せ(7)が得られる。
The recognition probability is 90% for candidate character field a, 80% for candidate character field b, and 70% for candidate character field c. The candidate characters corresponding to the four characters of "Yamamoto" in combination of each character are the eight characters from "Yamoto" to "Mamasato".
The correct combination (7) is obtained.

【0008】認識処理装置3は、更にこれら8通りの組
合せの各々に対し、図示しないメモリ辞書を検索する(
8)。検索の結果、辞書に存在しない組合せは「×」、
存在する組合せは「○」で示されている。
The recognition processing device 3 further searches a memory dictionary (not shown) for each of these eight combinations (
8). As a result of the search, combinations that do not exist in the dictionary are marked with an "×",
Existing combinations are indicated by "○".

【0009】即ち、「ヤマモト」と「ヤマサト」は辞書
に存在する。「ヤマモト」は、認識確率が、90%×7
0%×90%×90%であり、「ヤマサト」は、認識確
率が、90%×70%×80%×90%である。したが
って、辞書に存在する組合せのうち「ヤマモト」の認識
確率が最大である。
That is, "Yamamoto" and "Yamasato" exist in the dictionary. "Yamamoto" has a recognition probability of 90% x 7
0% x 90% x 90%, and the recognition probability of "Yamasato" is 90% x 70% x 80% x 90%. Therefore, among the combinations existing in the dictionary, "Yamamoto" has the highest recognition probability.

【0010】一方、項目No2は、漢字「山本」が手書
き記載されている。項目No1の手書き文字と同様に処
理がされる。したがって、「山」の文字は、「小」と「
山」、「本」の文字は、「本」と「木」の候補文字が特
定される。これら候補文字から、「小本」〜「山木」の
4通りの組合せ(7)が得られる。
On the other hand, in item No. 2, the Chinese character "Yamamoto" is handwritten. Processing is performed in the same way as the handwritten characters in item No. 1. Therefore, the characters for ``yama'' are ``small'' and ``yama''.
For the characters ``mountain'' and ``hon'', candidate characters ``hon'' and ``tree'' are identified. From these candidate characters, four combinations (7) of "Komoto" to "Yamaki" are obtained.

【0011】更に、これら4通りの組合せが辞書検索さ
れる(8)。その結果、「小木」「山本」「山木」の組
合せが辞書に存在する。認識確率は、「小木」と「山本
」で同じであり、「山木」の認識確率は、最も小さい。
Furthermore, a dictionary is searched for these four combinations (8). As a result, the combination of "Ogi", "Yamamoto", and "Yamaki" exists in the dictionary. The recognition probabilities are the same for "Ogi" and "Yamamoto," and the recognition probability for "Yamaki" is the smallest.

【0012】従来の実施例では、辞書に存在する文字候
補のうち認識確率の最大のものを認識文字として確定す
る(9)。したがって、項目No1に記載の文字に対し
ては「ヤマモト」が認識文字として確定される。項目N
o2に記載の文字に対しては、「小木」と「山本」の認
識確率が同じであるので、この場合は、先の出現頻度が
高い組合せが優先され、「小木」が認識文字として決定
される。
In the conventional embodiment, the character with the highest recognition probability among the character candidates existing in the dictionary is determined as the recognized character (9). Therefore, for the characters listed in item No. 1, "Yamamoto" is determined as the recognized character. Item N
Regarding the characters listed in o2, the recognition probabilities for "Ogi" and "Yamamoto" are the same, so in this case, the combination with the highest appearance frequency is given priority, and "Ogi" is determined as the recognized character. Ru.

【0013】したがって、かかる従来の装置における認
識文字確定方法では、互いに関連する項目No1、No
2でありながら、項目No2の認識結果に誤りが生じ、
項目No1とNo2の認識結果の矛盾も無視されること
になる。
[0013] Therefore, in the recognition character confirmation method in such a conventional device, mutually related items No. 1 and No.
2, an error occurs in the recognition result of item No. 2,
The discrepancy between the recognition results for items No. 1 and No. 2 is also ignored.

【0014】[0014]

【発明が解決しようとする課題】従来の装置においては
、図6において説明したように認識確率のみを基準とし
て最終の認識文字を決定している。したがって、候補と
なる文字が多くある場合、従来の方法ではより高い確率
で正しい文字認識を期待することは困難である。本発明
は、かかる問題を解決し、より高い確率で正しい文字認
識が得られる文字認識装置及び認識文字確定方法を提供
することを目的とする。
In the conventional apparatus, as explained in FIG. 6, the final recognized character is determined based only on the recognition probability. Therefore, when there are many candidate characters, it is difficult to expect correct character recognition with a higher probability using conventional methods. SUMMARY OF THE INVENTION An object of the present invention is to solve such problems and provide a character recognition device and a method for determining recognized characters, which can achieve correct character recognition with a higher probability.

【0015】[0015]

【課題を解決するための手段】図1は本発明の原理図を
示す。図において、1は、伝票または帳票であり、複数
項目(項目1〜3)に手書きの文字が記載されている。 項目1と項目2には、例えば、氏名とそのフリガナとの
関係のように互いに関連する項目データ文字が手書き記
載されている。
Means for Solving the Problems FIG. 1 shows a diagram of the principle of the present invention. In the figure, 1 is a slip or a form, and handwritten characters are written in a plurality of items (items 1 to 3). In item 1 and item 2, item data characters related to each other, such as the relationship between a name and its furigana, are handwritten.

【0016】2はOCR読取装置であり、伝票1の各項
目に記載の手書きの文字を読み取る。3は認識処理装置
であり、OCR読取装置2により読み取られた文字デー
タに対し、後処理を行い認識文字を決定する。
Reference numeral 2 denotes an OCR reading device, which reads handwritten characters written in each item of the slip 1. 3 is a recognition processing device, which performs post-processing on character data read by the OCR reading device 2 to determine recognized characters.

【0017】本発明では、認識処理装置3は、OCR読
取装置2で読み取った文字データから複数の項目の各々
に記載の文字として認識すべき文字候補を項目毎に特定
する手段4を有する。一つの手書き文字に対して、複数
の文字候補が与えられる。
In the present invention, the recognition processing device 3 has means 4 for specifying, for each item, character candidates to be recognized as characters described in each of a plurality of items from the character data read by the OCR reading device 2. Multiple character candidates are given for one handwritten character.

【0018】更に、第一の項目(項目1)に記載の文字
として認識すべき複数の文字候補を第一の項目と関連す
る第二の項目に記載の文字として認識すべき文字候補に
変換する手段5を有する。例えば、第二の項目に記載さ
れた文字が氏名漢字であり、第一の項目に記載された文
字がそのフリガナであるという関連を持つ場合、第一の
項目に記載の文字として認識すべき文字候補である複数
のフリガナ文字は、手段5により第二の項目に記載の文
字として認識すべき漢字の文字候補に変換される。
Furthermore, a plurality of character candidates to be recognized as characters listed in the first item (item 1) are converted into character candidates to be recognized as characters listed in the second item related to the first item. It has means 5. For example, if the characters listed in the second item are the kanji of the name and the characters listed in the first item are their furigana, the characters should be recognized as the characters listed in the first item. The plurality of furigana characters that are candidates are converted by the means 5 into Kanji character candidates to be recognized as characters listed in the second item.

【0019】次いで、手段5により変換された漢字の文
字候補と手段4において、特定されている第二の項目に
記載の文字として認識すべき文字候補と変換手段5によ
り変換された文字候補とを比較する。比較の結果、一致
した文字候補を第二の項目に記載の文字として認識確定
する手段6を有する。
Next, the character candidates of the Kanji characters converted by the means 5, the character candidates to be recognized as the characters specified in the second item in the means 4, and the character candidates converted by the converting means 5 are compared. compare. It has means 6 for recognizing and confirming character candidates that match as a result of the comparison as characters described in the second item.

【0020】[0020]

【作用】本発明は、第一の項目に記載の文字として認識
すべき文字候補を関連する第二の項目に記載の文字とし
て認識すべき文字候補に変換し、特定された第二の項目
に記載の文字として認識すべき文字候補と比較を行う。 例えば、第一の項目に記載の文字はカタカナ又はひらが
なであり、第二の項目に記載の文字は、第一の項目に記
載の文字に関連する漢字である。
[Operation] The present invention converts a character candidate to be recognized as a character described in a first item into a character candidate to be recognized as a character described in a related second item, and Compare with character candidates that should be recognized as written characters. For example, the characters listed in the first item are katakana or hiragana, and the characters listed in the second item are kanji related to the characters listed in the first item.

【0021】第一の項目のカタカナ又はひらがなを関連
する漢字に変換して第二の項目に記載の文字として認識
すべき漢字文字候補と比較している。比較により一致が
取れた漢字文字候補を第二の項目に記載の文字として確
定する。漢字に対し、カタカナ又はひらがなは、正しく
読み取り認識できる確率が高い。
Katakana or Hiragana in the first item is converted into related Kanji characters and compared with Kanji character candidates to be recognized as characters listed in the second item. The kanji character candidates that match through the comparison are determined as the characters listed in the second item. Compared to kanji, katakana and hiragana have a higher probability of being correctly read and recognized.

【0022】したがって、本発明は、このように第一の
項目に記載の文字と第二の項目に記載の文字との関連性
を利用しているので第二の項目に記載の文字の読み取り
認識の確実性を高めることが出来る。
Therefore, since the present invention utilizes the relationship between the characters described in the first item and the characters described in the second item, it is possible to read and recognize the characters described in the second item. It is possible to increase the certainty of

【0023】[0023]

【実施例】図2は、本発明の実施例を示す。本発明の原
理図である図1及び従来例である図6と同一又は同様の
部位には同一の番号を付してある。図6に示す従来例と
同様に、1は伝票の例であり、項目No2に漢字氏名、
項目No1にそのフリガナ及び項目No3に住所が手書
き記載されている。
Embodiment FIG. 2 shows an embodiment of the present invention. The same or similar parts as in FIG. 1, which is a diagram of the principle of the present invention, and FIG. 6, which is a conventional example, are given the same numbers. 1 is an example of a slip, as in the conventional example shown in FIG.
The furigana is handwritten in item No. 1, and the address is handwritten in item No. 3.

【0024】2はOCR読取装置であり、伝票1の各項
目の手書き記載文字を読み取り認識処理装置3に送る。 認識処理装置3は、OCR認識装置2で読み取った文字
を認識確定するための後処理を行う。認識処理装置3に
おいて、本発明にかかる後処理機能である認識処理動作
は図示しないROM(読み取り専用メモリ)に記憶され
たソフトウエア命令に基づいて行われる。このソフトウ
エア命令に基づく動作フローは、図3、図4に示される
Reference numeral 2 denotes an OCR reading device which reads the handwritten characters of each item on the slip 1 and sends it to the recognition processing device 3. The recognition processing device 3 performs post-processing to recognize and confirm the characters read by the OCR recognition device 2. In the recognition processing device 3, the recognition processing operation, which is a post-processing function according to the present invention, is performed based on software instructions stored in a ROM (read-only memory), not shown. The operational flow based on this software instruction is shown in FIGS. 3 and 4.

【0025】認識処理装置3の後処理動作は、伝票1の
各項目についての定義体に対応して実行される。図5は
、伝票1に対する各項目の定義体の例を示す(10)。 定義体の内容は、項目の種類(A)、項目の伝票上の行
位置(B)、桁位置(C)、関連する項目No(D)が
示される。
The post-processing operation of the recognition processing device 3 is executed in accordance with the definitions for each item of the slip 1. FIG. 5 shows an example of the definition of each item for slip 1 (10). The contents of the definition include the type of item (A), the line position of the item on the slip (B), the column position (C), and the related item number (D).

【0026】項目No1には、氏名のフリガナが記載さ
れる。したがって、関連項目No(D)には、漢字氏名
が記載される項目No2が関連項目として定義されてい
る。伝票1の各項目についての定義体は、磁気ディスク
11に格納されている。この定義体は、磁気ディスク1
1から読出され、認識処理装置3の図示しないRAM(
書き込み可能メモリ)に記憶(ロード)される。
[0026] In item No. 1, the furigana of the name is written. Therefore, in related item No. (D), item No. 2 in which the Kanji name is written is defined as a related item. Definitions for each item of the slip 1 are stored in the magnetic disk 11. This definition body is the magnetic disk 1
1 and is read from the RAM (not shown) of the recognition processing device 3.
(writable memory).

【0027】したがって、認識処理装置3は、定義体が
RAMにロード済であるかどうかを先ず確認し(図3ス
テップS1)、ロード済でない場合は、磁気ディスク1
1から読出し、RAMにロードする(図3ステップS2
)。OCR読取装置2が読み取ったデータからこの定義
体に従って処理対象項目の対応する項目情報を取得する
(図3ステップS3)。
Therefore, the recognition processing device 3 first checks whether the definition program has been loaded into the RAM (step S1 in FIG. 3), and if it has not been loaded, the recognition processing device 3
1 and loaded into the RAM (step S2 in Figure 3).
). From the data read by the OCR reading device 2, item information corresponding to the item to be processed is acquired according to this definition body (step S3 in FIG. 3).

【0028】即ち、項目No1を処理対象項目とする場
合、記載文字「ヤマモト」に対応するOCR読取装置2
の読み取りデータを入力し、各文字の候補文字から候補
文字組合せ(図2−7)を求め、候補文字組合せ毎に辞
書を検索(図2−8)する。その結果、候補文字組合せ
が辞書に存在する場合は「○」、存在しない場合は「×
」で示される。かかる処理動作は、図6に示す従来装置
の動作と同様である。
That is, when item No. 1 is the item to be processed, the OCR reading device 2 corresponding to the written character "Yamamoto"
The candidate character combinations (FIG. 2-7) are obtained from the candidate characters of each character, and the dictionary is searched for each candidate character combination (FIG. 2-8). As a result, if the candidate character combination exists in the dictionary, "○" is displayed, and if it does not exist, "×"
” is indicated. This processing operation is similar to the operation of the conventional device shown in FIG.

【0029】項目No1の定義体により、関連する項目
が項目No2であることが定義されている。したがって
、認識処理装置3は、次の処理として関連する項目であ
る項目No2の項目情報を取得する(図3ステップS4
)。
The definition of item No. 1 defines that the related item is item No. 2. Therefore, the recognition processing device 3 acquires the item information of item No. 2, which is a related item, as the next process (step S4 in FIG. 3).
).

【0030】項目No2には漢字氏名「山本」が記載さ
れている。記載文字「山本」に対応するOCR読取装置
2の読み取りデータを入力し、各文字の候補文字から候
補文字組合せ(図2−7)を求め、候補文字組合せごと
に辞書を検索(図2−8)する。項目No1の記載文字
の場合と同様に候補文字組合せが辞書に存在する場合は
「○」、存在しない場合は「×」で示される。
[0030] In item No. 2, the Kanji name "Yamamoto" is written. Input the read data of the OCR reader 2 corresponding to the written character "Yamamoto", find candidate character combinations (Figure 2-7) from the candidate characters of each character, and search the dictionary for each candidate character combination (Figure 2-8). )do. As in the case of the written characters in item No. 1, if the candidate character combination exists in the dictionary, it is indicated by "○", and if it does not exist, it is indicated by "x".

【0031】本発明に従うと、次に処理対象項目である
項目No1の候補文字(カタカナ)を関連する項目No
2の文字(漢字)に変換する(図4ステップS5)。こ
の結果、候補文字「ヤマモト」は、「山本」と「山元」
に変換され、候補文字「ヤマサト」は、「山里」に変換
される(図2─5)。
According to the present invention, the candidate character (katakana) of item No. 1, which is the item to be processed, is then changed to the related item No.
2 (kanji) (step S5 in FIG. 4). As a result, the candidate characters "Yamamoto" are "Yamamoto" and "Yamamoto".
The candidate character ``Yamasato'' is converted to ``Yamazato'' (Figure 2-5).

【0032】次いで、変換された文字「山本」「山元」
「山里」は、比較元データとされ、一方、項目No2の
辞書検索により存在した候補文字「小木」「山本」「山
木」が比較先データとされ、順次対比し比較される(ス
テップS6、7、8、9)。
[0032] Next, the converted characters “Yamamoto” and “Yamamoto”
"Yamazato" is used as the comparison source data, and on the other hand, the candidate characters "Ogi", "Yamamoto", and "Yamaki" that existed through the dictionary search for item No. 2 are used as the comparison destination data, and are compared and compared in order (steps S6 and 7). , 8, 9).

【0033】比較の結果、比較元データと比較先データ
とが一致した時、一致した文字が項目No2の認識文字
として決定される(ステップS10、11)。最終的に
不一致の場合は、項目No1、項目No2それぞれに認
識確率の高い文字を認識文字と決定する(ステップS1
0、12、7、8、6、13)。図2の実施例では、「
山本」の文字で一致がとれるので、項目No1は「ヤマ
モト」、項目No2は「山本」が認識文字として決定さ
れる(図2─6)。
As a result of the comparison, when the comparison source data and comparison target data match, the matching character is determined as the recognized character of item No. 2 (steps S10, 11). If there is a final mismatch, characters with high recognition probabilities are determined for each of item No. 1 and item No. 2 as recognized characters (step S1
0, 12, 7, 8, 6, 13). In the example of FIG.
Since a match can be made with the characters ``Yamamoto'', ``Yamamoto'' is determined as the recognized character for item No. 1, and ``Yamamoto'' is determined as the recognized character for item No. 2 (Figures 2-6).

【0034】上記本発明の実施例では、漢字を比較の対
象としているが、項目No2の漢字の候補文字をカタカ
ナに変換して、項目No1のカタカナの候補文字と比較
するようにしても同様の結果が得られる。
In the above embodiment of the present invention, kanji are the objects of comparison, but the same result can be obtained even if the kanji candidate characters in item No. 2 are converted to katakana and compared with the katakana candidate characters in item No. 1. Get results.

【0035】更に、「郵便番号」あるいは「銀行コード
」の記載項目を第一の項目とし、氏名、住所等の記載項
目を第二の項目として比較するようにしてもよい。 「郵便番号」あるいは「銀行コード」の認識率は、98
〜99%と高いのでかかる場合は、第二の項目の文字認
識の確率を高めるために特に有利である。
[0035] Furthermore, the entry items such as "zip code" or "bank code" may be used as the first item, and the entry items such as name, address, etc. may be used as the second item for comparison. The recognition rate for "postal code" or "bank code" is 98
Since the rate is as high as ~99%, this case is particularly advantageous for increasing the probability of character recognition for the second item.

【0036】[0036]

【効果】以上詳細に説明したように、本発明によって、
OCR読取装置から読み取られた文字データに対し、複
数の認識文字候補がある場合であっても、関連ある項目
の文字候補との比較を行い、的確な文字候補を選択でき
る。これによりより正確な文字認識ができる文字認識装
置が提供される。
[Effect] As explained in detail above, the present invention provides
Even if there are a plurality of recognized character candidates for character data read by an OCR reading device, an accurate character candidate can be selected by comparing with character candidates of related items. This provides a character recognition device that can perform more accurate character recognition.

【図面の簡単な説明】[Brief explanation of the drawing]

【図1】本発明の原理図である。FIG. 1 is a diagram showing the principle of the present invention.

【図2】本発明の実施例である。FIG. 2 is an embodiment of the present invention.

【図3】図2の実施例における動作フローチャートの前
半部であり、従来例における動作と共通する。
FIG. 3 is the first half of an operation flowchart in the embodiment of FIG. 2, and is common to the operation in the conventional example.

【図4】図2の実施例における動作フローチャートの後
半部であり、本発明の特徴とする動作フローチャート部
分を示す。
FIG. 4 is the second half of the operation flowchart in the embodiment of FIG. 2, and shows a portion of the operation flowchart that is a feature of the present invention.

【図5】図2の実施例における伝票の各項目についての
定義体の説明図である。
FIG. 5 is an explanatory diagram of a definition body for each item of a slip in the embodiment of FIG. 2;

【図6】従来の認識装置の一例である。FIG. 6 is an example of a conventional recognition device.

【符号の説明】[Explanation of symbols]

1  伝票 2  文字読取装置 3  認識処理装置 1. Slip 2 Character reading device 3 Recognition processing device

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】  伝票(1) の複数の項目の各々に記
載の文字を読み取る文字読取装置(2) と該文字読取
装置(2) で読み取った文字データから認識文字を確
定する認識処理装置(3) とを有し、該認識処理装置
(3) は、複数の項目の各々に記載の文字として認識
すべき文字候補を項目毎に特定する手段(4) と、第
一の項目に記載の文字として認識すべき文字候補を該第
一の項目と関連する第二の項目に記載の文字として認識
すべき文字候補に変換する手段(5) と、該認識すべ
き文字候補を項目毎に特定する手段(4) により特定
された該第二の項目に記載の文字として認識すべき文字
候補と該変換手段(5) により変換された文字候補と
を比較し、一致した文字候補を該第二の項目に記載の文
字として認識確定する手段(6) とを有することを特
徴とする文字認識装置。
[Claim 1] A character reading device (2) that reads the characters written in each of the plurality of items of the slip (1), and a recognition processing device (2) that determines recognized characters from the character data read by the character reading device (2). 3), and the recognition processing device (3) includes means (4) for specifying, for each item, character candidates to be recognized as the characters described in each of the plurality of items, and means (5) for converting a character candidate to be recognized as a character into a character candidate to be recognized as a character described in a second item related to the first item; and specifying the character candidate to be recognized for each item. The character candidates to be recognized as the characters specified in the second item specified by the means for converting (4) and the character candidates converted by the converting means (5) are compared, and the matching character candidates are converted into the second item. A character recognition device comprising: (6) means for recognizing and confirming characters as described in item (6).
【請求項2】  伝票(1) の複数の項目の各々に記
載の文字を読み取り、読み取った文字を項目毎に認識確
定する認識文字確定方法であって、複数の項目の各々に
記載の文字として認識すべき文字候補を項目毎に特定し
(4) 、第一の項目に記載の文字として認識すべき文
字候補を該第一の項目と関連する第二の項目に記載の文
字として認識すべき文字候補に変換し(5) 、特定さ
れた該第二の項目に記載の文字として認識すべき文字候
補と該変換された文字候補とを比較し、一致した文字候
補を該第二の項目に記載の文字として認識確定する(6
)ことを特徴とする認識文字確定方法。
[Claim 2] A recognition character confirmation method that reads the characters written in each of a plurality of items of a slip (1), and recognizes and confirms the read characters for each item, as the characters written in each of the plurality of items. Identify character candidates to be recognized for each item (4), and recognize character candidates to be recognized as characters listed in the first item as characters listed in the second item related to the first item. Convert to character candidates (5), compare the character candidates to be recognized as characters listed in the specified second item and the converted character candidates, and convert the matched character candidates to the second item. Recognition and confirmation as written characters (6
) A method for determining recognized characters.
【請求項3】  第一の項目に記載の文字はカタカナ又
はひらがなであり、該第二の項目に記載の文字は、該第
一の項目に記載の文字に対応する漢字であることを特徴
とする請求項1記載の文字認識装置。
Claim 3: The characters listed in the first item are katakana or hiragana, and the characters listed in the second item are kanji corresponding to the characters listed in the first item. The character recognition device according to claim 1.
【請求項4】  第一の項目に記載の文字はカタカナ又
はひらがなであり、該第二の項目に記載の文字は、該第
一の項目に記載の文字に対応する漢字であることを特徴
とする請求項2記載の認識文字確定方法。
Claim 4: The characters listed in the first item are katakana or hiragana, and the characters listed in the second item are kanji corresponding to the characters listed in the first item. 3. The method for determining recognized characters according to claim 2.
JP3043844A 1991-03-08 1991-03-08 Character recognizing device and recognized character fixing method Pending JPH04280394A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3043844A JPH04280394A (en) 1991-03-08 1991-03-08 Character recognizing device and recognized character fixing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3043844A JPH04280394A (en) 1991-03-08 1991-03-08 Character recognizing device and recognized character fixing method

Publications (1)

Publication Number Publication Date
JPH04280394A true JPH04280394A (en) 1992-10-06

Family

ID=12675046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3043844A Pending JPH04280394A (en) 1991-03-08 1991-03-08 Character recognizing device and recognized character fixing method

Country Status (1)

Country Link
JP (1) JPH04280394A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119206A (en) * 2019-01-23 2020-08-06 富士ゼロックス株式会社 Information processor and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5347733A (en) * 1976-10-14 1978-04-28 Fujitsu Ltd Recognizing device for hand-written kana and chinese characters

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5347733A (en) * 1976-10-14 1978-04-28 Fujitsu Ltd Recognizing device for hand-written kana and chinese characters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119206A (en) * 2019-01-23 2020-08-06 富士ゼロックス株式会社 Information processor and program

Similar Documents

Publication Publication Date Title
US7623715B2 (en) Holistic-analytical recognition of handwritten text
US5305396A (en) Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
JPH05108883A (en) Method and device for character recognition
JP3485020B2 (en) Character recognition method and apparatus, and storage medium
JPH04280394A (en) Character recognizing device and recognized character fixing method
JPH06215184A (en) Labeling device for extracted area
JP2671985B2 (en) Information recognition method
JPS58192180A (en) Character reader
JP2000132635A (en) Recognizing data confirming method
JPH067394B2 (en) Pattern recognizer
JP2003115028A (en) Method for automatically generating document identification dictionary and document processing system
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JP2845463B2 (en) Pattern recognition device
KR100473660B1 (en) Word recognition method
JP3151866B2 (en) English character recognition method
JP2939945B2 (en) Roman character address recognition device
JP2942375B2 (en) Character reader
JP2639314B2 (en) Character recognition method
JPH07271920A (en) Character recognizing device
JPH11120294A (en) Character recognition device and medium
JP2875678B2 (en) Post-processing method of character recognition result
JPS5933584A (en) Character recognizer
Radeva Third Int. Workshop on GNs, Sofia, 1 Oct. 2002, 7-13
JP2002149641A (en) Handwritten character recognition device and recording medium with handwritten character recognition program recorded thereon
JPH05298489A (en) System for recognizing character

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19970715