JP2867382B2 - Font determination method in character recognition device - Google Patents

Font determination method in character recognition device

Info

Publication number
JP2867382B2
JP2867382B2 JP63048168A JP4816888A JP2867382B2 JP 2867382 B2 JP2867382 B2 JP 2867382B2 JP 63048168 A JP63048168 A JP 63048168A JP 4816888 A JP4816888 A JP 4816888A JP 2867382 B2 JP2867382 B2 JP 2867382B2
Authority
JP
Japan
Prior art keywords
font
character
candidate
value
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63048168A
Other languages
Japanese (ja)
Other versions
JPH01222388A (en
Inventor
博行 上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63048168A priority Critical patent/JP2867382B2/en
Publication of JPH01222388A publication Critical patent/JPH01222388A/en
Application granted granted Critical
Publication of JP2867382B2 publication Critical patent/JP2867382B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明はフォント別の認識辞書を備えた活字文字認識
装置におけるフォント決定方法の改良に関する。
Description: TECHNICAL FIELD The present invention relates to an improvement in a font determining method in a type character recognition apparatus having a recognition dictionary for each font.

(従来の技術) 複数フォント文字の認識方法として、複数個の単一フ
ォント読み取り機構で得られた各々の読み取り結果に対
して単語照合を用いて最終結果を決定することで複数フ
ォントを認識する方法(IEEE TRANSACTIONS ON COMPUTE
RS.VOL.C−27,NO.8,PP.721の“A Multifont Word Recog
nition System for Postal Address Reading",以下では
文献1と呼ぶ)、複数のフォントで共通な特徴を用いて
認識する方法(IEEE TRANSACTIONS ON PATTERN ANALYSI
S AND MACHINE INTELLIGENCE,VOL.PAMI−9,NO.2,PP.274
の“On the Recognition of Printed Characters of An
y Font and Size",以下では文献2と呼ぶ)等が知られ
ている。
(Prior Art) As a method of recognizing a plurality of font characters, a method of recognizing a plurality of fonts by determining a final result using word matching for each of the read results obtained by a plurality of single font reading mechanisms. (IEEE TRANSACTIONS ON COMPUTE
RS.VOL.C-27, NO.8, PP.721 “A Multifont Word Recog
nition System for Postal Address Reading ", hereinafter referred to as Document 1), a method for recognizing using multiple fonts using common features (IEEE TRANSACTIONS ON PATTERN ANALYSI)
S AND MACHINE INTELLIGENCE, VOL.PAMI-9, NO.2, PP.274
“On the Recognition of Printed Characters of An
y Font and Size ", hereinafter referred to as Document 2).

電子通信学会、パターン認識と理解研究会資料PRU86
−76の「階層化判別法とその文字認識システムPC−OC
R」(以下では文献3と呼ぶ)では、文字列と文字の切
り出しには画像を投影して得られる画素の頻度分布より
塊と検出された分布上の位置を利用し、特徴抽出には判
別分析を用い、また距離値による判定を行なっている。
IEICE, Pattern Recognition and Understanding Workshop PRU86
-76 "Hierarchy determination method and its character recognition system PC-OC
R ”(hereinafter referred to as Document 3), character strings and characters are cut out by using positions on a distribution detected as lumps from the frequency distribution of pixels obtained by projecting an image, and discrimination is used for feature extraction. Analysis is used, and judgment is made based on the distance value.

(発明が解決しようとする課題) 文献1はシングルフォント読み取りを基本にしている
ので辞書作成は容易となるが、文書の文字認識装置とし
ては照合すべき単語数が多くなり、大規模な装置となっ
てしまうという問題がある。また文献2の方法は文字認
識辞書を小さくできる可能性があるが、フォントの違い
では一定でかつ文字種間では異なる特徴を決めにくいと
いう問題がある。さらに有効な特徴がないと、認識性能
の向上が困難という問題がある。
(Problem to be Solved by the Invention) Since Document 1 is based on single font reading, it is easy to create a dictionary, but as a character recognition device for a document, the number of words to be collated increases, and a large-scale device is required. There is a problem that it becomes. Although the method of Document 2 can reduce the size of the character recognition dictionary, it has a problem in that it is difficult to determine a feature that is constant for different fonts and different between character types. If there are no more effective features, there is a problem that it is difficult to improve recognition performance.

(課題を解決するための手段) 本願の発明によれば、文字列の間隔値が等しい画像領
域あるいは一文字列の画像領域からなる認識対象範囲ご
とに、その中の文字列の一文字目に対し各フォント別辞
書による判定処理結果の整合値を求め、得られた整合値
または累積した整合値からの平均整合値を用い整合値の
小さい一個のフォントを削除することで候補フォントを
絞り、二文字目では絞られた候補フォントの各フォント
の辞書による判定処理結果の整合値または累積した整合
値からの平均整合値を用いることで同様に次の候補フォ
ントを絞り、候補フォント数が一個となるまで前記処理
をくりかえし、最後の候補フォントを前記認識対象範囲
の文字フォントとする複数フォントの活字文字認識装置
におけるフォント決定方法が得られる。
(Means for Solving the Problems) According to the invention of the present application, for each recognition target range consisting of an image area having an equal character string interval value or an image area of one character string, each of the first characters of the character string in each of the recognition areas is recognized. The matching value of the judgment processing result by the font-specific dictionary is obtained, and the candidate font is narrowed down by deleting one font having a small matching value by using the obtained matching value or the average matching value from the accumulated matching value, thereby narrowing down the candidate font. In the same manner, the next candidate font is narrowed down by using the matching value of the judgment processing result by the dictionary of each font of the narrowed candidate font or the average matching value from the accumulated matching value, and the above-described processing is performed until the number of candidate fonts becomes one. By repeating the processing, it is possible to obtain a font determination method in a multiple-character type character recognition apparatus in which the last candidate font is a character font in the recognition target range.

(作用) 文書が認識対象で複数行からなる節あるいは一行を読
み取りの単位とすると、各単位内では単一フォント文字
が使われることが多い。シングルフォント読み取りは辞
書作成が容易で認識性能の向上を計りやすいことから、
節あるいは一行を単位としてまづ読み取り単位内の文字
フォントを決定し、その後で選択されたフォントの認識
辞書による文字認識(シングルフォント文字認識)を行
なうという方法を採用することで、認識性能の向上を計
りやすいマルチフォント文字認識方式とすることが可能
となる。フォントの決定方法としては、各フォントの認
識辞書での照合結果を用いる方法が考えられる。文献3
の判別分析法は辞書作成に用いた学習パタンと異なる形
の文字を判定すると判定結果が大きな最小距離値となる
性質を持っている。第4図は、一フォントの文字データ
に対していくつかのフォントの認識辞書で照合して得ら
れた最小距離値の一例を示す図である。第4図によれ
ば、同一フォント内での最小距離値は、比較的小さな値
に分布するが、別フォントでは大きな値に分布している
ことがわかる。そこで、フォントごとに作成した辞書で
判定した最小距離値を比較することによりフォントを決
めるフォント決定方法が考えられる。ところで、入力文
字パタンはその文字の印字状態や画像入力部の状態ある
いは画像の正規化により、学習に用いた文字パタンとは
完全には一致しない。それ故、一個のみの最小距離値に
よるフォント選択では誤ったフォント決定が起こる可能
性が高い。そこで、次に全フォントで数文字分を判定
し、判定結果全部から最適なフォントを選択する方法が
考えられる。ただこの方法ではフォント決定に必要な処
理がフォント数と線形に関係するので、フォント数が多
い場合には利用できない。
(Operation) If a document is to be recognized and a section or one line consisting of a plurality of lines is set as a unit of reading, a single font character is often used in each unit. Single font reading makes it easy to create a dictionary and easily improve recognition performance.
Improve recognition performance by adopting a method in which a character font in a reading unit is first determined in units of clauses or one line, and then character recognition (single font character recognition) is performed using a recognition dictionary for the selected font. It is possible to use a multi-font character recognition method that is easy to measure. As a method of determining the font, a method of using the result of matching of each font in the recognition dictionary can be considered. Reference 3
Has the property that when a character having a different shape from the learning pattern used to create the dictionary is determined, the determination result becomes a large minimum distance value. FIG. 4 is a diagram showing an example of a minimum distance value obtained by collating character data of one font with recognition dictionaries of several fonts. According to FIG. 4, the minimum distance value in the same font is distributed to a relatively small value, but is distributed to a large value in another font. Therefore, a font deciding method that determines a font by comparing the minimum distance value determined by a dictionary created for each font is conceivable. By the way, the input character pattern does not completely match the character pattern used for learning due to the printing state of the character, the state of the image input unit, or the normalization of the image. Therefore, there is a high possibility that erroneous font determination will occur in font selection based on only one minimum distance value. Therefore, a method of judging several characters in all fonts and selecting an optimum font from all the judgment results can be considered. However, in this method, the processing required for determining the font is linearly related to the number of fonts, and thus cannot be used when the number of fonts is large.

しかし次のような方法を採用すると、フォント決定に
必要な処理量の増加を抑えてフォントを決定できる。
However, if the following method is adopted, the font can be determined while suppressing an increase in the processing amount required for determining the font.

最初の文字に対する全フォントの辞書による判定で得
られる最小距離値を比較し最小距離値の大きい1個のフ
ォントを全フォントから除くことで候補フォントを絞
る。次の文字に対しては候補フォントだけの判定で得ら
れる最小距離値を比較することで同じように次の候補フ
ォントを絞る。文字ごとの判定を繰り返すことにより候
補フォント数を絞り、1個になったときにフォントが決
定したとする方法である。この方法では判定を繰り返す
たびに候補フォントが減少するので、処理の増加を抑え
ることができる。
The candidate fonts are narrowed down by comparing the minimum distance values obtained by the dictionary determination of all fonts for the first character, and excluding one font having the largest minimum distance value from all fonts. Similarly, the next candidate font is narrowed down by comparing the minimum distance value obtained by determining only the candidate font for the next character. This is a method in which the number of candidate fonts is reduced by repeating the determination for each character, and the font is determined when it becomes one. In this method, the number of candidate fonts decreases each time the determination is repeated, so that an increase in processing can be suppressed.

また、各文字に対する判定結果である最小距離値をフ
ォントごとに累積した累積距離値より得られる平均最小
距離値を比較することで、候補フォントを絞ることが可
能となる。さらに、最小距離値と平均最小距離値を組み
合わせ、フォントごとの最小距離値の違いが少ないとき
には、平均最小距離値を比較することで、候補フォント
を絞ることができる。
Also, by comparing the average minimum distance value obtained from the accumulated distance value obtained by accumulating the minimum distance value as the determination result for each character for each font, it is possible to narrow down the candidate fonts. Furthermore, when the minimum distance value and the average minimum distance value are combined and the difference between the minimum distance values for each font is small, the candidate fonts can be narrowed down by comparing the average minimum distance values.

上記説明では整合は距離値を評価尺度としたが、相関
値を評価尺度とした場合も同じである。
In the above description, the matching is performed using the distance value as the evaluation scale, but the same applies when the correlation value is used as the evaluation scale.

(実施例) 以下、本願発明の実施例を図面を参照して説明する。(Example) Hereinafter, an example of the present invention will be described with reference to the drawings.

第1図は、本願発明の文字認識装置におけるフォント
決定方法の一実施例を示すフローチャートである。以下
の説明では( )内の番号は、フローチャートの番号と
対応している。
FIG. 1 is a flowchart showing one embodiment of a font determining method in the character recognition device of the present invention. In the following description, the numbers in parentheses correspond to the numbers in the flowchart.

一つの認識対象範囲は、同一属性をもつ文字列画像の
領域あるいは一文字列の画像領域とする。文字列の間隔
を属性とすると、一つ認識対象範囲内にある文字列の間
隔値は等しい。文献3にあるような、投影による文字列
位置の決定という公知技術を文字認識装置に用いた場
合、前述のフォント決定処理は第1図に示したフローチ
ャートに示した処理で行える。
One recognition target range is an area of a character string image having the same attribute or an image area of one character string. Assuming that character string intervals are attributes, the character string interval values within one recognition target range are equal. When a known technique of determining a character string position by projection as described in Document 3 is used in a character recognition device, the above-described font determination processing can be performed by the processing shown in the flowchart shown in FIG.

まず画像の水平方向(あるいは垂直方向)の投影で得
られる文字を構成する画素数の分布からその分布上で画
素の連続している位置の幅を塊として各塊の開始と終了
の位置を各文字列の領域を決める座標とし、隣会う文字
列の座標値の差から得られる文字列間の間隔値より間隔
値の等しい複数個の文字列を求め、複数文字列の座標値
の最大値と最小値より認識対象範囲を決定する(10
1)。間隔値が等しくないときには、一文字列の座標値
を認識対象範囲とする。
First, from the distribution of the number of pixels constituting the character obtained by projecting the image in the horizontal direction (or the vertical direction), the width of the position where the pixels are continuous on the distribution is regarded as a chunk, Using the coordinates that determine the area of the character string, find a plurality of character strings with the same interval value from the interval value between the character strings obtained from the difference between the coordinate values of the adjacent character strings, and calculate the maximum value of the coordinate values of the multiple character strings. Determine the recognition range from the minimum value (10
1). When the interval values are not equal, the coordinate value of one character string is set as the recognition target range.

文字認識装置に用意されている認識辞書のフォントを
候補フォントとする(102)。ここで候補フォント数パ
ラメータをCとする。前述のように一つの認識対象範囲
には1個以上の文字列がありまた各文字列の領域を示す
文字列座標値は認識対象範囲決定の際に求められている
ので、一個の文字列座標値を読みだす(103)。読みだ
した文字列の座標値で示される領域にある画像より、文
字列決定と同様にして投影により文字切り出し位置の座
標値を求める(104)。切り出し位置検出方法として
は、文献3や多くの公知技術があり、本願発明は切り出
し手法により制約されないので、これ以上の説明は省略
する。一つの文字列で検出された文字数と文字制御のパ
ラメータをそれぞれMとNとする。
The font of the recognition dictionary prepared in the character recognition device is set as a candidate font (102). Here, the candidate font number parameter is C. As described above, there is one or more character strings in one recognition target range, and the character string coordinate value indicating the area of each character string is obtained at the time of determining the recognition target range. Read the value (103). From the image in the area indicated by the coordinate value of the read character string, the coordinate value of the character cutout position is obtained by projection in the same manner as in the determination of the character string (104). There are a clipping position detecting method in the literature 3 and many known techniques, and the present invention is not limited by the clipping method, so that further description is omitted. The number of characters detected in one character string and the parameters of character control are M and N, respectively.

文字制御パラメータNが文字列内の文字数Mより大き
くなった場合には、認識対象範囲内の次の文字列に進め
る(105)。
When the character control parameter N becomes larger than the number M of characters in the character string, the process proceeds to the next character string in the recognition target range (105).

候補フォントの各々の認識辞書を使った文字列内のN
文字目の判定を行い、判定結果として各フォントでの最
大整合値を出力する(106)。それぞれのフォントでの
最大整合値を比較し、最大整合値の小さい1個のフォン
トを候補フォントから除くこと(候補フォント数は1だ
け減少するので、候補フォント数パラメータはC=C−
1となる)で次の候補フォントを決定する(107)。
N in the character string using the recognition dictionary for each of the candidate fonts
The character is determined, and the maximum matching value for each font is output as the determination result (106). The maximum matching value of each font is compared, and one font having a small maximum matching value is excluded from the candidate fonts (the number of candidate fonts is reduced by 1, so the candidate font number parameter is C = C−
1) to determine the next candidate font (107).

次に文字制御パラメータNを1だけ進め(108)、候
補フォント数が2個以上あるか調べ(109)、2個以上
ある場合には上述の処理を繰り返し、候補フォント数が
1個になると認識対象範囲のフォントが決まる。
Next, the character control parameter N is advanced by one (108), and it is checked whether there are two or more candidate fonts (109). If there are two or more, the above processing is repeated and it is recognized that the number of candidate fonts becomes one. The font of the target area is determined.

第2図は、本願発明の文字認識装置におけるフォント
決定方法の別の実施例を示すフローチャートであり、文
字ごとの整合値と平均整合値とを組み合わせた方法を示
すものである。
FIG. 2 is a flowchart showing another embodiment of the font determining method in the character recognition device of the present invention, and shows a method of combining a matching value and an average matching value for each character.

まず画像の水平方向(あるいは垂直方向)の投影で得
られる文字を構成する画素数の分布からその分布上で画
素の連続している位置の幅を塊として各塊の開始と終了
の位置を各文字列の領域を決める座標とし、隣会う文字
列の座標値の差から得られる文字列間の間隔値より間隔
値の等しい複数個の文字列を求め、複数文字列の座標値
の最大値と最小値より認識対象範囲を決定する(20
1)。間隔値が等しくないときには、一文字列の座標値
を認識対象範囲とする。
First, from the distribution of the number of pixels constituting the character obtained by projecting the image in the horizontal direction (or the vertical direction), the width of the continuous position of the pixels on the distribution is regarded as a chunk, and the start and end positions of each chunk are determined. Using the coordinates that determine the area of the character string, find a plurality of character strings with the same interval value from the interval value between the character strings obtained from the difference between the coordinate values of the adjacent character strings, and calculate the maximum value of the coordinate values of the multiple character strings. Determine the recognition target range from the minimum value (20
1). When the interval values are not equal, the coordinate value of one character string is set as the recognition target range.

文字認識装置に用意されている認識辞書のフォントを
候補フォントし、各候補フォントの累積整合値をゼロに
する(202)。辞書のフォント数が候補フォント数パラ
メータCにセットされる。前述のように一つの認識対象
範囲には1個以上の文字列がありまた各文字列の領域を
示す文字列座標値は認識対象範囲決定の際に求められて
いるので、一個の文字列座標値を読みだす(203)。読
み出した文字列の座標値で示される領域にある画像よ
り、文字列決定と同様にして投影により文字切り出し位
置の座標値を求める(204)。一つの文字列で検出され
た文字数と文字制御のパラメータをそれぞれMとNとす
る。
The fonts of the recognition dictionary prepared in the character recognition device are candidate fonts, and the cumulative matching value of each candidate font is set to zero (202). The number of fonts in the dictionary is set in the candidate font number parameter C. As described above, there is one or more character strings in one recognition target range, and the character string coordinate value indicating the area of each character string is obtained at the time of determining the recognition target range. Read the value (203). From the image in the area indicated by the read coordinate value of the character string, the coordinate value of the character cutout position is obtained by projection in the same manner as the character string determination (204). The number of characters detected in one character string and the parameters of character control are M and N, respectively.

文字制御パラメータNが文字列内の文字数Mより大き
くなった場合には、認識対象範囲内の次の文字列に進め
る(205)。
When the character control parameter N is larger than the number M of characters in the character string, the process proceeds to the next character string in the recognition target range (205).

候補フォントの各々の認識辞書を使った文字列内のN
文字目の判定を行い、判定結果として各フォントでの整
合値を出力する(206)。それぞれのフォントでの整合
値より最小の整合値(V1とする)と次最小の整合値(V
2)とを求める(207)。次に、前記V1とV2との差といき
値との比較を行い(208)、前記差がいき値以上のとき
には前記V1側のフォントを除くことで候補フォントを選
択する(210)。前記差がいき値未満であれば前記V1とV
2の両フォントにおける累積の整合値からの平均整合値
(S1とS2とする)を比較し(209)、小さい側のフォン
トを候補フォントから除くことで次の候補フォントを決
定し各候補フォントの累積整合値の更新を行う(210,21
1)。例えば候補フォントが3つ以上にある場合には、
フォントとしては最小の整合値(V1)をとるフォント
(F1)、次最小の整合値(V2)をとるフォント(F2)、
残りのフォント群(1個以上のフォントが残る)に分か
れる。V1とV2の差が大きければV1のフォント(F1)を削
除し(210)、大きくなければV1とV2のフォントに対応
する平均整合値S1とS2とを比較し(209)、平均整合値S
1が平均整合値S2以下であればV1のフォント(F1)を削
除し(210)、そうでなければV2のフォント(F2)を削
除する(211)。この処理により、候補フォント数が1
個づつ減っていくことになる。次に、候補フォント各々
の整合値を加算することで累積整合値を更新すると同時
に文字制御パラメータNを1だけすすめ(212)、候補
フォント数が2個以上あるか調べ(213)、2個以上あ
る場合には上述の処理を繰り返し、候補フォント数が1
個になると認識対象範囲のフォントが決まる。
N in the character string using the recognition dictionary for each of the candidate fonts
The character number is determined, and a matching value for each font is output as the determination result (206). The minimum matching value (V1) and the next minimum matching value (V1)
2) and (207). Next, the difference between V1 and V2 is compared with a threshold value (208). When the difference is equal to or greater than the threshold value, a candidate font is selected by excluding the font on the V1 side (210). If the difference is less than the threshold, V1 and V
The average matching value (S1 and S2) from the accumulated matching values of both fonts 2 is compared (209), and the next smaller font is determined by excluding the smaller font from the candidate fonts. Update the cumulative matching value (210, 21
1). For example, if there are three or more candidate fonts,
Fonts (F1) that take the smallest matching value (V1), fonts (F2) that take the next smallest matching value (V2),
It is divided into the remaining font groups (one or more fonts remain). If the difference between V1 and V2 is large, the font (F1) of V1 is deleted (210). If not large, the average matching values S1 and S2 corresponding to the fonts of V1 and V2 are compared (209).
If 1 is equal to or less than the average matching value S2, the font (F1) of V1 is deleted (210), otherwise the font (F2) of V2 is deleted (211). By this processing, the number of candidate fonts is 1
It will decrease one by one. Next, the cumulative matching value is updated by adding the matching values of the candidate fonts, and at the same time, the character control parameter N is increased by 1 (212), and it is checked whether the number of candidate fonts is 2 or more (213). In some cases, the above processing is repeated until the number of candidate fonts is 1
When the number of fonts is reached, the font in the recognition target range is determined.

文字認識装置では、ある認識対象範囲のフォントが決
まると、そのフォントの認識辞書で認識対象範囲の判定
を行い、最大整合値をとるカテゴリ名を判定結果とす
る。
In the character recognition device, when a font in a certain recognition target range is determined, the recognition target range is determined by the recognition dictionary of the font, and the category name having the maximum matching value is determined as a determination result.

第3図は本願発明を適用する文字認識装置の一例を示
すブロック図であり、第1図と第2図にフローチャート
で示したフォント決定の制御処理は制御手段で行なう文
字認識装置である。
FIG. 3 is a block diagram showing an example of a character recognition apparatus to which the present invention is applied. The control processing of the font determination shown in the flowcharts of FIGS. 1 and 2 is performed by a control means.

画像入力手段1は帳票上を光学的に走査し得られる映
像信号をディジタル信号に変換して出力する。制御手段
2は前記画像入力手段1から出力されるディジタル信号
は画像記憶手段3に転送され、前記ディジタル信号は画
像として記憶される。画像が記憶されると、第1図で説
明した認識対象範囲の決定とその範囲のフォント決定を
行なう。
The image input means 1 converts a video signal obtained by optically scanning a form into a digital signal and outputs the digital signal. The control means 2 transfers the digital signal output from the image input means 1 to an image storage means 3 and stores the digital signal as an image. When the image is stored, the determination of the recognition target range and the font of the range described with reference to FIG. 1 are performed.

制御手段2は画像記憶手段3の画像を読みだし、読み
だされた画像に対する前述の投影処理から各認識対象範
囲における文字列の座標値を求め、得られた座標値を座
標記憶手段4に記憶する。次に制御手段2は前記座標記
憶手段4にある一つの認識対象範囲の一つの文字列の座
標値を読みだす。さらに得られた座標値で示される領域
の画像を画像記憶手段3より読みだし、投影処理により
文字切り出し位置を求め、得られた切り出しの座標値を
座標記憶手段4に記憶する。また制御手段2はフォント
辞書記憶手段5に記憶されている認識辞書のフォントを
候補フォントとして記憶する。
The control means 2 reads the image of the image storage means 3, obtains the coordinate values of the character strings in each recognition target range from the above-described projection processing on the read image, and stores the obtained coordinate values in the coordinate storage means 4. I do. Next, the control means 2 reads out the coordinate values of one character string in one recognition target range in the coordinate storage means 4. Further, the image of the area indicated by the obtained coordinate values is read out from the image storage means 3, a character cutout position is obtained by projection processing, and the obtained cutout coordinate values are stored in the coordinate storage means 4. The control means 2 stores the font of the recognition dictionary stored in the font dictionary storage means 5 as a candidate font.

制御手段2は、前述の文字数Mと初期値が1である文
字制御パラメータNとの比較を行い、文字制御パラメー
タNが文字数Mより大きいと、前記認識対象範囲での次
の文字列座標値を読みだし、文字切り出しまでの処理を
繰り返す。文字制御パラメータNが文字数M以下であれ
ば、制御手段2はフォント辞書記憶手段5に記憶されて
いる候補フォント辞書によるN文字目の判定処理を文字
認識手段6で行なうように制御する。
The control means 2 compares the character number M with the character control parameter N whose initial value is 1, and if the character control parameter N is larger than the character number M, the next character string coordinate value in the recognition target range is calculated. Read and repeat the process up to character segmentation. If the character control parameter N is equal to or less than the number of characters M, the control means 2 controls the character recognition means 6 to perform the Nth character determination process based on the candidate font dictionary stored in the font dictionary storage means 5.

文字認識手段6は文字制御パラメータNをもとに座標
値記憶手段4にあるN文字目の文字切り出し座標値を読
みだし、得られた座標値で示された領域の文字画像を画
像記憶手段3より読みだし、各候補フォント辞書ごとに
判定結果である最大整合値を出力する。制御手段2は文
字認識手段6からの出力である候補フォントごとの最大
整合値を受取り、複数個の最大整合値を比較し、値の小
さい1個以上のフォントを記憶している候補フォントか
ら除くことで次の候補フォントとする。
The character recognizing means 6 reads the character cut-out coordinate value of the Nth character stored in the coordinate value storing means 4 based on the character control parameter N, and stores the character image in the area indicated by the obtained coordinate value in the image storing means 3. Then, the maximum matching value, which is the determination result, is output for each candidate font dictionary. The control means 2 receives the maximum matching value for each candidate font output from the character recognizing means 6, compares a plurality of maximum matching values, and removes one or more fonts having smaller values from the candidate fonts storing the fonts. This makes the next candidate font.

制御手段2は制御パラメータNの値を更新し、候補フ
ォント数が一個になるまで上記処理を繰り返す。
The control means 2 updates the value of the control parameter N and repeats the above processing until the number of candidate fonts becomes one.

候補フォント数が一個になると、制御手段2は文字認
識手段6が前記認識対象範囲内の各文字画像を候補フォ
ントの認識辞書で判定するように制御し、文字認識手段
6から出力される最大整合値に対応するカテゴリ名を各
文字画像の判定結果とし認識結果記憶手段7に記憶す
る。
When the number of candidate fonts becomes one, the control unit 2 controls the character recognizing unit 6 to determine each character image in the recognition target range by using the recognition dictionary of the candidate font, and controls the maximum matching output from the character recognizing unit 6. The category name corresponding to the value is stored in the recognition result storage means 7 as the determination result of each character image.

制御手段2が認識対象範囲それぞれに上記処理を行な
うように制御することで、最終的には認識結果記憶手段
7に記憶されている結果が入力した帳票全体の判定結果
となる。
By controlling the control means 2 to perform the above-described processing for each of the recognition target ranges, the result stored in the recognition result storage means 7 finally becomes the determination result of the entire input form.

ここで、第3図で説明した処理はスキャナを備えたパ
ーソナルコンピュータシステムのソフトウェアで行える
というのは言うまでもない。
Here, it goes without saying that the processing described in FIG. 3 can be performed by software of a personal computer system having a scanner.

(発明の効果) 以上に説明したように本願発明によれば、フォント決
定にはシングルフォント辞書での照合結果を使うのでフ
ォント判定用の特殊な特徴が不用であり、フォント数が
多い場合でもフォント決定に必要な処理量の増加は少な
く、フォント選択後はシングルフォント認識で読み取り
を行なうので辞書作成が簡単でしかも高性能が得られる
という効果がある。
(Effects of the Invention) As described above, according to the present invention, a font is determined based on the result of comparison using a single font dictionary, so that special features for font determination are unnecessary. There is little increase in the processing amount required for determination, and reading is performed by single font recognition after font selection, so that dictionary creation is simple and high performance is obtained.

【図面の簡単な説明】[Brief description of the drawings]

第1図および第2図は本願発明の文字認識装置でのフォ
ント決定における処理手順の例をそれぞれ示すフローチ
ャート、第3図は文字認識装置の例を示すブロック図、
第4図は一フォントのデータに対する数フォントの辞書
による照合結果である最大整合値に対応するカテゴリ別
の最小距離値を分布例を示す図である。 図において、1は画像入力手段、2は制御手段、3は画
像記憶手段、4は座標位置記憶手段、5はフォント辞書
記憶手段、6は文字認識手段、7は認識結果記憶手段で
ある。
1 and 2 are flowcharts respectively showing an example of a processing procedure in determining a font in the character recognition device of the present invention, FIG. 3 is a block diagram showing an example of the character recognition device,
FIG. 4 is a diagram showing an example of distribution of the minimum distance value for each category corresponding to the maximum matching value which is the result of collation of data of one font with a dictionary of several fonts. In the figure, 1 is an image input unit, 2 is a control unit, 3 is an image storage unit, 4 is a coordinate position storage unit, 5 is a font dictionary storage unit, 6 is a character recognition unit, and 7 is a recognition result storage unit.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】フォント別に用意した辞書から一つのフォ
ントを選択し判定を行う文字認識装置におけるフォント
決定方法であって、認識対象ごとに、前記認識対象範囲
内の一文字目に対する各フォント別辞書による判定処理
結果の整合値を求め、該整合値を用い、少なくとも1個
のフォントを除くことで候補フォントを選び、前記認識
対象範囲内の2文字目では前記選択した候補フォントの
各フォントの辞書による判定処理結果の整合値または累
積した整合値からの平均整合値を用い、少なくとも1個
のフォントを除くことで次の候補フォントを選び、候補
フォント数が1個となるまで前記認識対象範囲内の文字
判定処理と整合値または平均整合値の比較とを繰り返
し、最後の候補フォントを前記認識対象範囲の文字フォ
ントとすることを特徴とする文字認識装置におけるフォ
ント決定方法。
1. A font determining method in a character recognition device for selecting one font from a dictionary prepared for each font and making a determination, wherein the font-based dictionary for the first character in the recognition target range is used for each recognition target. A matching value of the determination processing result is obtained, and a candidate font is selected by using the matching value and excluding at least one font. The second character in the recognition target range is determined according to the dictionary of each font of the selected candidate font. The next candidate font is selected by removing at least one font using the matching value of the determination processing result or the average matching value from the accumulated matching values, and the next candidate font is selected until the number of candidate fonts becomes one. It is characterized in that the character determination processing and the comparison of the matching value or the average matching value are repeated, and the last candidate font is set as the character font in the recognition target range. Font determination method in the character recognition device to.
JP63048168A 1988-02-29 1988-02-29 Font determination method in character recognition device Expired - Lifetime JP2867382B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63048168A JP2867382B2 (en) 1988-02-29 1988-02-29 Font determination method in character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63048168A JP2867382B2 (en) 1988-02-29 1988-02-29 Font determination method in character recognition device

Publications (2)

Publication Number Publication Date
JPH01222388A JPH01222388A (en) 1989-09-05
JP2867382B2 true JP2867382B2 (en) 1999-03-08

Family

ID=12795863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63048168A Expired - Lifetime JP2867382B2 (en) 1988-02-29 1988-02-29 Font determination method in character recognition device

Country Status (1)

Country Link
JP (1) JP2867382B2 (en)

Also Published As

Publication number Publication date
JPH01222388A (en) 1989-09-05

Similar Documents

Publication Publication Date Title
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5410611A (en) Method for identifying word bounding boxes in text
US5465304A (en) Segmentation of text, picture and lines of a document image
US5245674A (en) Image processing using distance as a function of direction
KR101114135B1 (en) Low resolution ocr for camera acquired documents
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
JPH05242292A (en) Separating method
JP2001283152A (en) Device and method for discrimination of forms and computer readable recording medium stored with program for allowing computer to execute the same method
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
CN102870399A (en) Segmentation of a word bitmap into individual characters or glyphs during an OCR process
US5835634A (en) Bitmap comparison apparatus and method using an outline mask and differently weighted bits
US6947596B2 (en) Character recognition method, program and recording medium
US5923782A (en) System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings
Kim et al. Word segmentation of printed text lines based on gap clustering and special symbol detection
US20020006224A1 (en) Computer automated process for vectorization of raster images
US4853885A (en) Method of compressing character or pictorial image data using curve approximation
JP2867382B2 (en) Font determination method in character recognition device
JP3574562B2 (en) Method for recognizing and detecting deformation of a series of patterns in an image and recording medium storing the program
JP2902097B2 (en) Information processing device and character recognition device
JP3100825B2 (en) Line recognition method
JP3428504B2 (en) Character recognition device
JP3345469B2 (en) Word spacing calculation method, word spacing calculation device, character reading method, character reading device
JP2755299B2 (en) Image processing method
JPS6343788B2 (en)