JPH05151384A - Correcting method for recognition character - Google Patents

Correcting method for recognition character

Info

Publication number
JPH05151384A
JPH05151384A JP3310482A JP31048291A JPH05151384A JP H05151384 A JPH05151384 A JP H05151384A JP 3310482 A JP3310482 A JP 3310482A JP 31048291 A JP31048291 A JP 31048291A JP H05151384 A JPH05151384 A JP H05151384A
Authority
JP
Japan
Prior art keywords
character
memory
pattern
correction
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3310482A
Other languages
Japanese (ja)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3310482A priority Critical patent/JPH05151384A/en
Publication of JPH05151384A publication Critical patent/JPH05151384A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To execute a correction by making the memory capacity for storing correcting information small, and decreasing the number of execution times of similar operations, in a correction processing of a recognized character. CONSTITUTION:By an image input part 1, a character pattern is inputted, and by a character recognizing part 2, a reject code for giving a feature quantity of the pattern, a candidate character and erroneous recognition information is detected, from the reject code, with regard to only the pattern whose possibility of erroneous recognition is high, the feature quantity, and the candidate character and a character pattern coordinate are stored in a feature quantity memory 5v and a reject information memory 9, respectively. The candidate character of the reject information memory 9 is displayed as a correction object on a display part 4, and corrected after an operator's confirmation. Also, a candidate character of the pattern being similar to its corrected candidate character is subjected to similar operation, and extracted and displayed, and it is also corrected after the operator's confirmation. By storing only the information of the pattern whose possibility of erroneous recognition is high, the storage capacity is curtailed.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文字認識の際の認識文字
の修正方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method of correcting recognized characters in character recognition.

【0002】[0002]

【従来の技術】近年、文字認識装置が開発されている
が、その認識精度が課題であり、認識した文字を修正す
る機能を備えたものが多い。
2. Description of the Related Art In recent years, character recognition devices have been developed, but their recognition accuracy is a problem, and many of them have a function of correcting recognized characters.

【0003】以下、従来の文字認識装置における認識文
字の修正方法について図面を参照しながら説明する。図
5は従来の文字修正が可能な文字認識装置の構成をブロ
ック図で示す。図において、文字認識部2から出力され
た認識文字の文字コード、文字パターン、特徴量および
リジェクトコードをそれぞれ文字コードメモリ3、文字
パターンメモリ10、特徴量メモリ5およびリジェクト
情報メモリ9に文字パターンの数だけ記憶する。つぎ
に、誤認識の可能性の高い認識文字とその文字パターン
を文字コードメモリ3と文字パターンメモリ10から読
み出し、表示部4で操作者に提示する。操作者がこの文
字コードを修正するために正しい文字コードを修正情報
入力部6から入力した場合、および操作者が修正を指示
しない文字パターンであっても特徴量メモリ5中の文字
パターンの特徴量と他の文字パターンの特徴量との類似
度を演算により求め、所定値より大きい類似度の文字パ
ターンと文字コードを操作者に表示し、その文字コード
を修正するか否かを確認部8で操作者に対して確認さ
せ、操作者が修正を許可したときに修正を行なうように
する。
A method of correcting a recognized character in a conventional character recognition device will be described below with reference to the drawings. FIG. 5 is a block diagram showing the structure of a conventional character recognition device capable of correcting characters. In the figure, the character code, the character pattern, the feature amount, and the reject code of the recognized character output from the character recognition unit 2 are stored in the character code memory 3, the character pattern memory 10, the feature amount memory 5, and the reject information memory 9, respectively. Remember only the number. Next, the recognized character and the character pattern thereof having a high possibility of being erroneously recognized are read from the character code memory 3 and the character pattern memory 10 and presented to the operator on the display unit 4. When the operator inputs a correct character code to correct this character code from the correction information input unit 6, and even when the operator does not instruct the correction, the feature amount of the character pattern in the feature amount memory 5 And the similarity with the feature amount of another character pattern are calculated, the character pattern and the character code having a similarity greater than a predetermined value are displayed to the operator, and the confirmation unit 8 determines whether or not to correct the character code. The operator is asked to confirm, and the correction is made when the operator permits the correction.

【0004】[0004]

【発明が解決しようとする課題】このような従来の認識
文字の修正方法では、すべての文字について特徴量やリ
ジェクトコードをメモリに記憶しておかねばならないの
で、大きなメモリ容量が必要であり、また、誤認識の可
能性が低い文字でも一律に類似度演算を行なうので処理
時間が長くかかるという問題点があった。
In such a conventional recognition character correction method, a feature amount and a reject code must be stored in a memory for all characters, so that a large memory capacity is required. However, there is a problem that the processing time is long because the similarity calculation is uniformly performed even for a character having a low possibility of being erroneously recognized.

【0005】本発明は上記の課題を解決するもので、記
憶メモリ容量が小さくてすみ、類似度演算の回数の少な
くてすむ認識文字の修正方法を提供することを目的とす
る。
An object of the present invention is to solve the above problems, and an object thereof is to provide a method of correcting a recognized character which requires only a small storage memory capacity and requires a small number of times of similarity calculation.

【0006】[0006]

【課題を解決するための手段】本発明は上記の目的を達
成するために、画像入力手段により文字のパターンを読
み取り、文字認識手段によりそのパターンの特徴量を抽
出するとともに、前記特徴量から文字コードおよびリジ
ェクトコードを求め、前記文字コードを第1の記憶手段
に記憶し、前記リジェクトコードにより誤認識の可能性
が高いと判別した特定文字の特徴量および修正に要する
情報とを第2の記憶手段に記憶し、文字修正処理におい
て、前記第2の記憶手段の前記特定文字を表示手段によ
り操作者に表示し、操作者が表示された特定文字のうち
の任意の第1の文字を他の第2の文字に修正したとき、
前記第2の記憶手段中の文字であって前記第1の文字に
所定値以上に類似するものを類似演算により求めて表示
し、その文字を操作者が確認して前記第2の文字または
他の文字に修正するようにした認識文字の修正方法であ
る。
In order to achieve the above-mentioned object, the present invention reads a character pattern by image input means, extracts the feature quantity of the pattern by character recognition means, and extracts the character from the feature quantity. A code and a reject code are obtained, the character code is stored in the first storage means, and a characteristic amount of a specific character determined to have a high possibility of being misrecognized by the reject code and information required for correction are stored in the second storage. In the character correction process, the specific character of the second storage means is displayed to the operator by the display means, and the operator selects an arbitrary first character of the displayed specific characters from other characters. When you change to the second character,
Characters in the second storage means, which are similar to the first character with a predetermined value or more, are obtained by a similarity calculation and displayed, and the operator confirms the character to display the second character or other characters. This is a method of correcting the recognized character so that the character is corrected to.

【0007】[0007]

【作用】本発明は上記の構成において、第2の記憶手段
が誤認識の可能性の高い特定文字の特徴量および修正に
要する情報を記憶し、文字修正処理において前記特定文
字を操作者に表示し、操作者がその特定文字のうちの任
意の第1の文字を他の第2の文字に変更したとき、第2
の記憶手段中の文字であって第1の文字に類似した文字
を求めて表示し、操作者の選択で第2の文字または他の
文字に修正する。
According to the present invention, in the above configuration, the second storage means stores the characteristic amount of the specific character having a high possibility of being erroneously recognized and the information required for the correction, and displays the specific character to the operator in the character correction process. Then, when the operator changes any first character of the specific characters to another second character, the second character
A character in the storage means that is similar to the first character is sought and displayed, and is corrected to the second character or another character by the operator's selection.

【0008】[0008]

【実施例】【Example】

(実施例1)以下、本発明の一実施例の認識文字の修正
方法について図面を参照しながら説明する。
(Embodiment 1) Hereinafter, a method of correcting a recognized character according to an embodiment of the present invention will be described with reference to the drawings.

【0009】図1は本発明の一実施例の認識文字の修正
方法を用いた文字認識装置の構成をブロック図で示す。
図において、1は文書を光電変換して2値化データを文
書パターンメモリ11に出力する画像入力部、2は上記
2値化データに前処理、特徴抽出、特徴量から文字コー
ドおよびリジェクトコードを求めるマッチングなどの文
字認識処理を行い、文書パターンメモリ11における文
字パターンの座標、特徴量、候補文字およびリジェクト
情報を出力する文字認識部、3は文字認識部2で認識さ
れた候補文字を蓄える候補文字メモリ、4は文書パター
ンメモリ11の内容、候補文字メモリ3中の候補文字お
よび確認部8からの修正確認のメッセージなどを表示す
る表示部、5は文字認識部2が出力する特徴量を記憶す
る特徴量メモリ、6は操作者が修正情報を入力する修正
情報入力部、7は確認部8で操作者が修正を了承した場
合にマッチング部10を制御するとともに候補文字メモ
リ3の内容を修正する制御部、9は文字認識部2が出力
するリジェクト情報を蓄えるリジェクト情報メモリ、1
0は特徴量メモリ5中の特徴量を互いに照合するマッチ
ング部、11は文字入力部1からの2値データを蓄える
文書パターンメモリ、12は文字認識部2から出力され
た文字のうち、リジェクトされた文字に関する情報だけ
をリジェクト情報メモリ9と特徴量メモリ5に書き込む
ためのANDゲートである。なお、実施例では候補文字
は文字コード、リジェクト情報はリジェクトコードおよ
び特徴量などで記憶するが、他の文字フォントなどの手
段でもよい。
FIG. 1 is a block diagram showing the configuration of a character recognition apparatus using a method for correcting recognized characters according to an embodiment of the present invention.
In the figure, 1 is an image input unit that photoelectrically converts a document and outputs binarized data to the document pattern memory 11. Reference numeral 2 is preprocessing, feature extraction, and a character code and a reject code from the feature amount for the binarized data. A character recognition unit 3 which performs character recognition processing such as matching to output character pattern coordinates, feature amounts, candidate characters, and reject information in the document pattern memory 11, and 3 is a candidate for storing the candidate characters recognized by the character recognition unit 2. A character memory, 4 is a display unit for displaying the contents of the document pattern memory 11, candidate characters in the candidate character memory 3, a message for confirmation of correction from the confirmation unit 8, and the like, and 5 is a feature amount stored by the character recognition unit A feature amount memory, 6 is a correction information input section for the operator to input correction information, and 7 is a confirmation section 8 which is a matching section when the operator approves the correction. Control unit for modifying the contents of the candidate character memory 3 to control the 0, the reject information memory for storing a reject information output by the character recognition unit 2 9, 1
0 is a matching unit for collating the feature amounts in the feature amount memory 5 with each other, 11 is a document pattern memory for storing the binary data from the character input unit 1, and 12 is a character output from the character recognition unit 2 and is rejected. It is an AND gate for writing only the information regarding the characters written in the reject information memory 9 and the feature amount memory 5. Although the candidate character is stored as a character code and the reject information is stored as a reject code and a feature amount in the embodiment, other means such as a character font may be used.

【0010】図2は本発明の一実施例の認識文字の修正
方法を用いた文字認識装置の記憶手段と、その周辺装置
の構成をブロック図で示す。図において、21は文書を
読み取り、ビットデータに変換して出力するイメージス
キャナ、22はRAMであり、イメージスキャナ21が
出力するビットデータを記憶する文書パターンメモリ1
1と、認識文字を記憶する候補文字メモリ3と、候補文
字メモリ3内の候補文字のうち誤認識の可能性の高い文
字の特徴量を記憶する特徴量メモリ5と、リジェクトに
関する情報を記憶するリジェクト情報メモリ9と、処理
に使用するレジスタ領域27と、操作者からの誤認識文
字に対する修正情報を記憶する修正情報領域28とを備
えている。23はROMであり、特徴量とそれに対応す
る文字コードとを記憶した辞書領域30と、修正動作を
制御するプログラムを記憶したプログラム記憶領域31
とを備えている。24はプログラム記憶領域31に記憶
された制御プログラムに従って処理を行なう処理回路、
25はデータを入力するキーボート、4は表示部であ
る。
FIG. 2 is a block diagram showing the configuration of the storage means of the character recognition apparatus using the method for correcting the recognized characters according to the embodiment of the present invention and the peripheral devices thereof. In the figure, reference numeral 21 is an image scanner for reading a document, converting it into bit data and outputting it, and 22 is a RAM, which is a document pattern memory 1 for storing bit data output by the image scanner 21.
1, a candidate character memory 3 for storing a recognized character, a feature amount memory 5 for storing a feature amount of a character having a high possibility of being erroneously recognized among the candidate characters in the candidate character memory 3, and information about a reject. The reject information memory 9 includes a register area 27 used for processing, and a correction information area 28 for storing correction information for an erroneously recognized character from the operator. Reference numeral 23 denotes a ROM, which is a dictionary area 30 that stores a feature amount and a character code corresponding to the ROM, and a program storage area 31 that stores a program for controlling the correction operation.
It has and. Reference numeral 24 denotes a processing circuit that performs processing in accordance with the control program stored in the program storage area 31,
Reference numeral 25 is a keyboard for inputting data, and 4 is a display unit.

【0011】以下、上記構成要素の相互関係と動作につ
いて図面を参照しながら説明する。まず、修正のための
先行処理について説明する。図3は修正のための先行処
理動作をフローチャートで示す。ステーップs100で
動作の順番をカウントするカウンタのiおよびjをそれ
ぞれ1に設定して初期化する。なお、iは認識処理する
文字の順序であり、jは特徴量メモリ5およびリジェク
ト情報メモリ9の格納順序である。処理はi=1すなわ
ち候補文字列の1番目の文字から開始する。ステップs
101で画像入力部1から入力した文書の2値化データ
にノイズ除去、文字切り出しなどの前処理を行なってス
テップs102に移行する。ステップs102で認識処
理すべきi番目の文字パターンが存在しないときはステ
ップs110に移行し、存在するときはステップs10
3に移行して、文字認識処理によりその文字パターンの
特徴量e[i]とそれに対応する候補文字を抽出し、ス
テップs104に移行する。ステップs104では候補
文字のコードa[i]を候補文字メモリ3に格納し、ス
テップ105に移行して認識された文字パターンのリジ
ェクトコードを基に誤認識の可能性を判定し、高い場合
にはリジェクトすべき文字パターンとしてステップs1
06に移行し、リジェクトしない場合にはステップs1
09に移行する。なお、ステップs105における誤認
識可能性判定に、あらかじめ定めた特定の文字パターン
を誤認識しやすいものとする手段を用いてもよい。
The mutual relationship and operation of the above-mentioned components will be described below with reference to the drawings. First, the preceding process for correction will be described. FIG. 3 is a flowchart showing the preceding processing operation for correction. At step s100, i and j of counters for counting the order of operations are set to 1 and initialized. Note that i is the order of characters to be recognized, and j is the storage order of the feature amount memory 5 and the reject information memory 9. The process starts from i = 1, that is, the first character of the candidate character string. Step s
In step 101, the binary data of the document input from the image input unit 1 is subjected to preprocessing such as noise removal and character segmentation, and the process proceeds to step s102. If the i-th character pattern to be recognized in step s102 does not exist, the process proceeds to step s110, and if it exists, step s10.
In step 3, the character recognition process extracts the characteristic amount e [i] of the character pattern and the candidate character corresponding to the characteristic amount, and then proceeds to step s104. In step s104, the candidate character code a [i] is stored in the candidate character memory 3, the process proceeds to step 105, and the possibility of erroneous recognition is determined based on the reject code of the recognized character pattern. Step s1 as a character pattern to be rejected
If the process proceeds to 06 and does not reject, step s1
Move to 09. It should be noted that the erroneous recognition possibility determination in step s105 may be performed by using a unit that makes it easy to erroneously recognize a predetermined specific character pattern.

【0012】ステップs106ではi番目の文字パター
ンがj個目にリジェクトする文字パターンであるとき、
その特徴量e[i]を特徴量メモリ5に記憶し、ステッ
プs107で、候補文字メモリ3にa[i]を格納した
アドレス、特徴メモリ5にe[j]を格納したアドレ
ス、および文書パターンメモリ11における文字パター
ンの座標とをそれぞれリジェクト情報メモリ9のb
[j]、c[j]およびd[j]領域に記憶する。つぎ
に、ステップs108に移行してjに1を加算してステ
ップs109に移行し、iの値に1を加算してステップ
102に戻り、つぎのi+1番目の文字パターンの認識
処理に移行する。以上の処理を最後の文字パターンまで
順次繰り返すことにより、誤認識される可能性の高い文
字パターンの情報が、その数だけリジェクト情報メモリ
9に格納される。すべての文字パターンについて処理を
終了するとステップs110に移行し、リジェクト情報
の最後を示すために、b[j]に0を記憶させる。な
お、後述の修正処理過程で修正済みとした候補文字につ
いてはb[j]=1に設定するものとし、したがって、
候補文字の候補文字メモリ3におけるアドレスは0と1
以外のアドレスを有するものとする。なお、表示部4は
文書パターンメモリ11の内容と、候補文字メモリ3内
の文字コードまたはこれに対応する文字フォントを表示
する。
In step s106, when the i-th character pattern is the j-th character pattern to be rejected,
The feature amount e [i] is stored in the feature amount memory 5, and in step s107, the address storing a [i] in the candidate character memory 3, the address storing e [j] in the feature memory 5, and the document pattern. The coordinates of the character pattern in the memory 11 and b of the reject information memory 9 are
Store in the [j], c [j], and d [j] areas. Next, the process proceeds to step s108, 1 is added to j, the process proceeds to step s109, 1 is added to the value of i, the process returns to step 102, and the process for recognizing the next (i + 1) th character pattern is performed. By sequentially repeating the above processing until the last character pattern, the number of pieces of character pattern information that are likely to be erroneously recognized are stored in the reject information memory 9. When the processing is completed for all the character patterns, the process proceeds to step s110, and 0 is stored in b [j] to indicate the end of the reject information. Note that b [j] = 1 is set for candidate characters that have been corrected in the correction process described below, and therefore,
The addresses of the candidate characters in the candidate character memory 3 are 0 and 1.
Have an address other than. The display unit 4 displays the content of the document pattern memory 11 and the character code in the candidate character memory 3 or the character font corresponding thereto.

【0013】以上の先行処理を終了すると、つぎの修正
処理に移行する。以下、修正処理について図面を参照し
ながら説明する。図4は修正処理の動作をフローチャー
トで示す。修正処理はリジェクト情報メモリ9の情報を
もとに、その格納順序jに従って実行する。まず、ステ
ップs10でカウンタのjを1を設定して初期化する。
ステップs11でリジェクト情報メモリ9に記憶された
b[j]の内容を参照し、b[j]=0の場合は修正対
象の候補文字が残っていないので処理を終了する。b
[j]≠0の場合にはステップs12に移行し、b
[j]が与えるアドレスで候補メモリ3に記憶されてい
る候補文字がすでに修正済みの文字か否かを判断する。
すなわち、前述のようにb[j]=1であれば修正済み
の文字とするのでステップs25に移行し、[j]≠1
であれば未修正なのでステップs13に移行して、操作
者にリジェクト情報メモリ9のd[j]が与える座標の
文字パターンを表示部4に表示し、ステップ14に移行
して操作者の修正判断を求める。表示された文字を別の
文字に修正する場合にはステップs15に移行し、修正
しない場合にはステップs25に移行する。修正する場
合、ステップs15に移行し、b[j]与えるアドレス
で候補メモリ3に格納されている候補文字を操作者が入
力した文字に置き換え、以下に説明するステップ16以
降の処理により、いま修正された元の候補文字と類似し
た候補文字を未処理の候補文字の中から探し出し、操作
者の確認で修正処理を行う。ステップs14で修正しな
い場合、ステップs25に移行してjに1を加算し、ス
テップs11に戻ってつぎのj+1番目のリジェクト情
報の処理に移行する。
Upon completion of the preceding processing, the next correction processing is started. The correction process will be described below with reference to the drawings. FIG. 4 is a flowchart showing the operation of the correction process. The correction process is executed according to the storage order j based on the information in the reject information memory 9. First, in step s10, the counter j is set to 1 and initialized.
In step s11, the contents of b [j] stored in the reject information memory 9 are referred to. If b [j] = 0, there is no candidate character to be modified, so the process ends. b
If [j] ≠ 0, the process proceeds to step s12, and b
It is determined whether the candidate character stored in the candidate memory 3 at the address given by [j] has already been corrected.
That is, as described above, if b [j] = 1, it is determined as a corrected character, so the process proceeds to step s25 and [j] ≠ 1.
If so, the process moves to step s13, the character pattern of the coordinates given by d [j] of the reject information memory 9 to the operator is displayed on the display unit 4, and the process proceeds to step 14 to judge the operator's correction. Ask for. If the displayed character is to be modified to another character, the process proceeds to step s15, and if not, the process proceeds to step s25. In the case of correction, the process proceeds to step s15, the candidate character stored in the candidate memory 3 at the address given by b [j] is replaced with the character input by the operator, and the correction is now performed by the processing of step 16 and subsequent steps described below. A candidate character similar to the original candidate character thus obtained is searched from unprocessed candidate characters, and correction processing is performed by confirmation of the operator. If not corrected in step s14, the process proceeds to step s25, 1 is added to j, and the process returns to step s11 to proceed to the next j + 1-th reject information process.

【0014】前記ステップs15でアドレスb[j]の
候補文字を修正した場合、b[j]に続くアドレスb
[j+1」、b[j+2」、・・・の未修正候補文字の
中で、アドレスb[j]の文字に類似した候補文字を類
似演算により検索し、操作者の確認で修正する処理に移
行する。そのために、まずステップs16でカウンタk
にj+1を代入し、ステップs19でk(=j+1)の
アドレスで特徴量メモリ5に記憶している特徴量e
[k]をいま修正された元の文字パターンの特徴量e
[j]と比較演算する。その前にステップs17でリジ
ェクト情報メモリ9にkに対応するリジェクト情報が残
っているかを調べ、ステップs18でkに対応する文字
が修正済みであるかを調べ、残っていない場合はステッ
プs25に移行し、修正済みであればステップs23に
移行する。
When the candidate character of the address b [j] is corrected in step s15, the address b following b [j]
Of the uncorrected candidate characters [j + 1], b [j + 2], ..., Candidate characters similar to the character at the address b [j] are searched for by a similar operation, and the process moves to a process for correction by confirmation by the operator. To do. Therefore, first, in step s16, the counter k
Substituting j + 1 for the feature quantity e stored in the feature quantity memory 5 at the address k (= j + 1) in step s19.
The feature amount e of the original character pattern in which [k] is now corrected
[J] is compared and calculated. Before that, it is checked in step s17 whether the reject information corresponding to k remains in the reject information memory 9, and in step s18 it is checked whether the character corresponding to k has been corrected. If not, the process proceeds to step s25. If it has been corrected, the process proceeds to step s23.

【0015】ステップs19でリジェクト情報メモリ9
内のb[j]とb[k]が与えるアドレスで特徴量メモ
リ5に格納されているj番目の文字の特徴量e[j]と
k番目の文字の特徴量e[k]との類似度を計算し、類
似度があらかじめ定めたしきい値より大きいが否かを判
断する。大きい場合にはステップs20に移行して操作
者にその候補文字を提示し、修正したいときはステップ
s22で修正し、ステップs24で修正済みとしてアド
レスb[k]に1を設定し、ステップs23でkに1を
加算してつぎのアドレスb[j+2]の文字の特徴量を
アドレスb[j]の特徴量と比較する。このように、修
正したアドレスb[j]の文字に対してアドレスb[j
+1]、b[j+2]、・・・の文字について類似比較
し、類似したものを表示して操作者の確認で修正する。
In step s19, the reject information memory 9
Of the feature quantity e [j] of the jth character and the feature quantity e [k] of the kth character stored in the feature quantity memory 5 at the address given by b [j] and b [k] in The degree is calculated, and it is determined whether the degree of similarity is larger than a predetermined threshold value. If it is larger, the process moves to step s20, the candidate character is presented to the operator, and if it is desired to correct it, it is corrected in step s22, 1 is set in the address b [k] as corrected in step s24, and in step s23. 1 is added to k, and the characteristic amount of the character at the next address b [j + 2] is compared with the characteristic amount at the address b [j]. In this way, for the corrected character at the address b [j], the address b [j]
Characters such as +1], b [j + 2], ... Are compared for similarity, and similar characters are displayed and corrected by the operator's confirmation.

【0016】以下、7文字の文字列「あかいあさがお」
を例に、その動作を具体的に説明する。以下の説明にお
いて、文字パターン”あ”と”お”はその特徴量が類似
していることにより誤認識の可能性が高いパターンであ
るとし、「おかいおさがお」と誤認識されるものとして
説明する。
Below, the 7-character string "Akaasao"
The operation will be specifically described with reference to FIG. In the following description, it is assumed that the character patterns “a” and “o” are patterns that are likely to be erroneously recognized because their feature amounts are similar, and are erroneously recognized as “okai osasa”. I will explain as things.

【0017】画像入力部1で、認識対象文字列パターン
を2値画像データとして文書パターンメモリ11に記憶
する。つぎに、ステップs101で文書パターンメモリ
11に記憶された画像にノイズ除去、文字切り出しなど
の前処理を実行し、切り出した文字パターンに対して1
番目の文字パターンから順次ステップs102以降の先
行処理を実行する。その結果、候補文字メモリ3に候補
文字が格納される。(表1)は候補文字メモリ3の構成
を表で示す。
The image input unit 1 stores the character string pattern to be recognized as binary image data in the document pattern memory 11. Next, in step s101, preprocessing such as noise removal and character cutout is performed on the image stored in the document pattern memory 11, and 1 is applied to the cut out character pattern.
The preceding process after step s102 is sequentially executed from the th character pattern. As a result, the candidate character is stored in the candidate character memory 3. Table 1 shows the configuration of the candidate character memory 3 in a table.

【0018】[0018]

【表1】 [Table 1]

【0019】(表1)において番号iは認識処理する文
字列の文字順序であり、a[i]は候補文字の内容、す
なわち候補文字のコードである。実施例の場合、文字パ
ターン”あ”が”お”に誤認識されて格納されている。
In Table 1, the number i is the character sequence of the character string to be recognized, and a [i] is the content of the candidate character, that is, the code of the candidate character. In the case of the embodiment, the character pattern "a" is erroneously recognized as "o" and stored.

【0020】また、誤認識される可能性の高い文字パタ
ーンについては、ステップs104により特徴量メモリ
5に特徴量が格納される。(表2)は特徴量メモリ5の
構成を表で示す。
For a character pattern which is likely to be erroneously recognized, the characteristic amount is stored in the characteristic amount memory 5 in step s104. Table 2 shows the configuration of the feature amount memory 5 in a table.

【0021】[0021]

【表2】 [Table 2]

【0022】(表2)において、番号jは誤認識の可能
性が高い文字パターンとしてリジェクトしたj個目の文
字パターンを意味し、その特徴量e[j]がメモリのj
番目に記憶される。実施例の場合、文字パターン”あ”
を認識処理して抽出した特徴量が誤認識される可能性が
高いとして、検出した順にe[1]、e[2]、e
[3]として格納されている。
In Table 2, the number j means the jth character pattern rejected as a character pattern with a high possibility of being erroneously recognized, and its feature amount e [j] is j in the memory.
Remembered th. In the case of the embodiment, the character pattern "a"
Is assumed to have a high possibility of being erroneously recognized, and e [1], e [2], e
It is stored as [3].

【0023】また、(表3)はリジェクト情報メモリの
構成を表で示す。
Further, (Table 3) is a table showing the structure of the reject information memory.

【0024】[0024]

【表3】 [Table 3]

【0025】(表3)において、番号jはリジェクトし
た文字パターンがj個目であることを意味し、リジェク
ト情報メモリのj番目にも対応する。&a[j]はリジ
ェクトした文字のコードa[i]の候補文字メモリ3に
おけるアドレス、&c[i]はリジェクトした文字の特
徴量e[j]の特徴量メモリ5におけるアドレス、d
[j]はリジェクトした文字の文字パターンメモリ11
における座標である。j=4では以降にリジェクト情報
が無いことを示すために、アドレス値0をb[4]に格
納している。
In Table 3, the number j means that the rejected character pattern is the jth character pattern and also corresponds to the jth character in the reject information memory. & A [j] is the address of the rejected character code a [i] in the candidate character memory 3, & c [i] is the address of the rejected character's feature amount e [j] in the feature amount memory 5, d
[J] is the character pattern memory 11 of the rejected character
Is the coordinate at. When j = 4, the address value 0 is stored in b [4] to indicate that there is no reject information thereafter.

【0026】修正処理は(表3)に示したリジェクト情
報メモリのj=1から順に行なう。j=1の与えるアド
レスb[1]値(=&a[1])で候補文字メモリ3に
格納している候補文字を表示すると、”お”が表示され
るので、操作者は”あ”に修正する。このとき、値c
[1](=&e[1])の与えるアドレスの特徴量と類
似する特徴量を有する候補文字をj=2、j=3の中で
順に類似演算により検出して表示し、検出するたびに操
作者の判断で修正する。実施例の場合、文字列の1番目
の”あ”を”お”に修正したとき、4番目の”お”が表
示され、それを”あ”に修正し、つぎに”7番目の”
お”が表示され、これは修正しないで”お”のままとす
る。つぎに、j=4でアドレス値b[4]が0であるの
でリジェクト情報がなく、修正処理を終了する。
The correction process is performed in order from j = 1 of the reject information memory shown in (Table 3). When the candidate character stored in the candidate character memory 3 is displayed at the address b [1] value (= & a [1]) given by j = 1, "O" is displayed. Fix it. At this time, the value c
Each time a candidate character having a feature quantity similar to the feature quantity of an address given by [1] (= & e [1]) is detected and displayed by a similar operation in j = 2 and j = 3, each time it is detected, Correct at the operator's discretion. In the case of the embodiment, when the first "A" of the character string is corrected to "O", the fourth "O" is displayed, and it is corrected to "A" and then "7th".
“O” is displayed and remains “O” without correction. Next, since j = 4 and the address value b [4] is 0, there is no reject information and the correction process ends.

【0027】以上のように本発明の実施例の認識文字の
修正方法によれば、誤認識の可能性の高い文字だけにつ
いて、その特徴量と修正に必要な情報を記憶することに
より、メモリ容量が小さくてすむとともに、類似度演算
も回数が少なくてすみ、従来に比べてコストパーフォマ
ンスの高い認識文字の修正処理が実現できる。
As described above, according to the recognized character correction method of the embodiment of the present invention, the memory capacity is stored by storing the characteristic amount and the information necessary for the correction only for the character having a high possibility of erroneous recognition. Is small, and the number of times of similarity calculation is small, so that it is possible to realize recognition character correction processing with higher cost performance than in the past.

【0028】なお、本実施例では文字認識を例に説明し
たが、音声認識の場合においても適用可能なことは言う
までもない。
In the present embodiment, character recognition has been described as an example, but it goes without saying that it can be applied to the case of voice recognition.

【0029】[0029]

【発明の効果】以上の実施例から明かなように、本発明
は画像入力手段により文字のパターンを読み取り、文字
認識手段によりそのパターンの特徴量を抽出するととも
に、前記特徴量から文字コードおよびリジェクトコード
を求め、前記文字コードを第1の記憶手段に記憶し、前
記リジェクトコードにより誤認識の可能性が高いと判別
した特定文字の特徴量および修正に要する情報とを第2
の記憶手段に記憶し、文字修正処理において、前記第2
の記憶手段の前記特定文字を表示手段により操作者に表
示し、操作者が表示された特定文字のうちの任意の第1
の文字を他の第2の文字に修正したとき、前記第2の記
憶手段中の文字であって前記第1の文字に所定値以上に
類似するものを類似演算により求めて表示し、その文字
を操作者が確認して前記第2の文字または他の文字に修
正するようにした認識文字の修正方法とすることによ
り、誤認識の可能性の高い文字だけに対して、原文字パ
ターンから抽出された特徴量と修正に必要な情報を記憶
するので、従来に比べてマッチング計算の対象文字数が
少なくなり、メモリ容量とマッチング計算の量が少なく
て済み、コストパーフォマンスの高い認識文字の修正処
理が実現できる。
As is apparent from the above-described embodiments, the present invention reads a character pattern by the image input means, extracts the characteristic amount of the pattern by the character recognition means, and extracts the character code and the reject from the characteristic amount. A code is obtained, the character code is stored in the first storage means, and the characteristic amount of the specific character determined to have a high possibility of being erroneously recognized by the reject code and the information required for correction are secondly stored.
In the character correction process, the second
The specific character of the storage means of the above is displayed to the operator by the display means, and the operator selects any first of the displayed specific characters.
When the character of is modified to another second character, the character in the second storage means which is similar to the first character by a predetermined value or more is obtained and displayed by a similarity calculation, and the character is displayed. Is confirmed by the operator and corrected to the second character or another character, thereby extracting from the original character pattern only the character with a high possibility of being erroneously recognized. Since the stored feature amount and the information necessary for correction are stored, the number of target characters for matching calculation is smaller than in the past, the memory capacity and the amount of matching calculation are less, and the correction process of recognized characters with high cost performance is performed. realizable.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の認識文字の修正方法を用い
た文字認識装置の構成を示すブロック図
FIG. 1 is a block diagram showing a configuration of a character recognition device using a method for correcting a recognized character according to an embodiment of the present invention.

【図2】本発明の一実施例の認識文字の修正方法を用い
た文字認識装置における記憶手段とその周辺装置の構成
を示すブロック図
FIG. 2 is a block diagram showing a configuration of a storage unit and its peripheral device in a character recognition device using a method for correcting a recognized character according to an embodiment of the present invention.

【図3】本発明の一実施例の認識文字の修正方法におけ
る先行処理の動作を示すフローチャート
FIG. 3 is a flowchart showing an operation of a preceding process in the recognition character correction method according to the embodiment of the present invention.

【図4】本発明の一実施例の認識文字の修正方法におけ
る文字修正処理の動作を示すフローチャート
FIG. 4 is a flowchart showing the operation of a character correction process in the recognized character correction method according to the embodiment of the present invention.

【図5】従来の認識文字の修正方法を用いた文字認識装
置の構成を示すブロック図
FIG. 5 is a block diagram showing a configuration of a character recognition device using a conventional method for correcting recognized characters.

【符号の説明】[Explanation of symbols]

1 画像入力部(画像入力手段) 2 文字認識部(文字認識手段) 3 候補文字メモリ(第1の記憶手段) 4 表示部(表示手段) 5 特徴量メモリ(第2の記憶手段) 9 リジェクト情報メモリ(第2の記憶手段) DESCRIPTION OF SYMBOLS 1 image input section (image input means) 2 character recognition section (character recognition means) 3 candidate character memory (first storage means) 4 display section (display means) 5 feature amount memory (second storage means) 9 reject information Memory (second storage means)

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 画像入力手段により文字のパターンを読
み取り、文字認識手段によりそのパターンの特徴量を抽
出するとともに、前記特徴量から文字コードおよびリジ
ェクトコードを求め、前記文字コードを第1の記憶手段
に記憶し、前記リジェクトコードにより誤認識の可能性
が高いと判別した特定文字の特徴量および修正に要する
情報とを第2の記憶手段に記憶し、文字修正処理におい
て、前記第2の記憶手段の前記特定文字を表示手段によ
り操作者に表示し、操作者が表示された特定文字のうち
の任意の第1の文字を他の第2の文字に修正したとき、
前記第2の記憶手段中の文字であって前記第1の文字に
所定値以上に類似するものを類似演算により求めて表示
し、その文字を操作者が確認して前記第2の文字または
他の文字に修正するようにした認識文字の修正方法。
1. A character pattern is read by an image input unit, a feature amount of the pattern is extracted by a character recognition unit, a character code and a reject code are obtained from the feature amount, and the character code is stored in a first storage unit. Stored in the second storage means, the characteristic amount of the specific character determined to have a high possibility of being erroneously recognized by the reject code and the information required for correction are stored in the second storage means, and in the character correction processing, the second storage means is stored. The specific character is displayed to the operator by the display means, and the operator corrects an arbitrary first character of the displayed specific characters to another second character,
Characters in the second storage means, which are similar to the first character with a predetermined value or more, are obtained by a similarity calculation and displayed, and the operator confirms the character to display the second character or other characters. How to correct the recognized character so that it will be corrected to the character.
JP3310482A 1991-11-26 1991-11-26 Correcting method for recognition character Pending JPH05151384A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3310482A JPH05151384A (en) 1991-11-26 1991-11-26 Correcting method for recognition character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3310482A JPH05151384A (en) 1991-11-26 1991-11-26 Correcting method for recognition character

Publications (1)

Publication Number Publication Date
JPH05151384A true JPH05151384A (en) 1993-06-18

Family

ID=18005767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3310482A Pending JPH05151384A (en) 1991-11-26 1991-11-26 Correcting method for recognition character

Country Status (1)

Country Link
JP (1) JPH05151384A (en)

Similar Documents

Publication Publication Date Title
JP2607457B2 (en) Pattern recognition device
JPH0696263A (en) Pattern recognizing device
JPH05151384A (en) Correcting method for recognition character
JP2917748B2 (en) Character input device
JP4633271B2 (en) Dictionary learning method and dictionary learning program
JP3416975B2 (en) Character recognition device and method of correcting recognized characters
JPH0573709A (en) Correcting method for recognized character
JP2899377B2 (en) Character recognition device
JP3037727B2 (en) OCR system
JPH03268089A (en) Optical character reader
JP2918380B2 (en) Post-processing method of character recognition result
JPH0850631A (en) Character recognition device
JPH04268684A (en) Method for correcting recognition character
JPH07271920A (en) Character recognizing device
JP2851865B2 (en) Character recognition device
JPH0830717A (en) Character recognition method and device therefor
JPH0467282A (en) Correcting method for recognition character
JPH0355874B2 (en)
JP2953162B2 (en) Character recognition device
JPH06337966A (en) Character recognizing device
JPH04138583A (en) Character recognizing device
JPH06251186A (en) Method and device for correcting character recognition error
JPH041882A (en) Character recognition and device for the same
JPH05120472A (en) Character recognizing device
JPH03123989A (en) Character recognition device