JPH0749926A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH0749926A
JPH0749926A JP5212352A JP21235293A JPH0749926A JP H0749926 A JPH0749926 A JP H0749926A JP 5212352 A JP5212352 A JP 5212352A JP 21235293 A JP21235293 A JP 21235293A JP H0749926 A JPH0749926 A JP H0749926A
Authority
JP
Japan
Prior art keywords
character
noise
character image
image
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5212352A
Other languages
Japanese (ja)
Inventor
Kiyoshi Tashiro
潔 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP5212352A priority Critical patent/JPH0749926A/en
Publication of JPH0749926A publication Critical patent/JPH0749926A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To provide the character recognizing device with enhanced recognition accuracy by improving character recognition speed, and also, decreasing misrecognition caused by an erroneous noise elimination processing. CONSTITUTION:A character image segmented by a character segmenting means 1 is retained in a character image storage means 2. A character discriminating means 3 executes a discrimination processing with respect to an image in the character image storage means 2, and outputs a result of discrimination and a degree of conviction. A character recognition result output means 4 decides whether the result of discrimination is outputted as a result of recognition or not, from the degree of conviction obtained from the character discriminating means 3, and also, in the case it can not be outputted as the result of recognition, a noise elimination processing is executd by a noise eliminating means 5, it is retained in the character image storage means 2, and with respect to the image to which the noise elimination processng is executed, the discrimination processing executed by the character discriminating means 3.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、入力画像から、文字画
像を切り出し、文字を認識する文字認識装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for recognizing a character by cutting out a character image from an input image.

【0002】[0002]

【従来の技術】文字認識装置では、入力画像中にノイズ
が混入すると、そのノイズの影響により誤認識するな
ど、認識率が低下するという問題がある。従来、このよ
うなノイズの影響による誤認識を減らすため、例えば、
平成2年度科学研究費補助金研究成果報告書「イメージ
型と論理型情報処理を統合した高速・高精度の知的文字
システムの研究開発」8ページ等に示されているよう
に、多くの文字認識装置では、切り出された文字画像に
対して、認識処理を行なう前に一律にノイズ除去を行な
う方法が用いられてきた。あるいは、例えば、「文字認
識概論」オーム社,15〜44ページに示されているよ
うに、ノイズが含まれていても影響を受けにくいような
特徴抽出、識別計数を用いる方法がある。
2. Description of the Related Art In a character recognition device, if noise is mixed in an input image, there is a problem that the recognition rate is lowered, such as erroneous recognition due to the influence of the noise. Conventionally, in order to reduce false recognition due to the influence of such noise, for example,
As shown on page 8 of the FY1990 Scientific Research Grants Research Results Report "R & D of high-speed and high-accuracy intelligent character system integrating image-type and logical-type information processing," In a recognition device, a method of uniformly removing noise from a cut-out character image before performing recognition processing has been used. Alternatively, for example, as shown in "Introduction to Character Recognition", Ohmsha Co., Ltd., pp. 15-44, there is a method of using feature extraction and identification counting that are not easily affected by noise.

【0003】しかし、切り出された画像に対して一律に
ノイズ除去処理を行なう方法では、ノイズ除去処理に費
やされる計算量により、全体としての文字認識速度が低
下するという欠点があった。特に、画像中にノイズが含
まれる割合が少ない場合には、ノイズ除去処理の大半は
無駄に行なわれることになる。また、文字画像中の文字
に含まれるべき部分がノイズ除去処理により誤って変更
されてしまい、誤認識が発生する場合があるという欠点
もある。
However, the method of uniformly performing the noise removal processing on the cut out image has a drawback that the character recognition speed as a whole is lowered due to the amount of calculation spent for the noise removal processing. In particular, when the proportion of noise included in the image is small, most of the noise removal processing is wasted. In addition, there is a drawback that a portion of the character image that should be included in the character may be erroneously changed by the noise removal process, resulting in erroneous recognition.

【0004】一方、ノイズが含まれていても影響を受け
にくいような特徴抽出、識別関数は、処理が複雑であ
り、必要とする計算処理が多く、文字認識速度が低下す
るという欠点がある。この場合も、ノイズが含まれてい
ない画像は、より簡素な特徴抽出、識別関数を用いても
十分な認識精度で認識することができるので、画像中に
ノイズが含まれる割合が少ない場合には無駄な処理が多
いことになる。
On the other hand, the feature extraction / discrimination function that is not easily affected by noise is complicated in processing, requires a lot of calculation processing, and has a drawback that the character recognition speed decreases. Also in this case, an image that does not contain noise can be recognized with sufficient recognition accuracy even by using a simpler feature extraction and identification function. Therefore, when the ratio of noise included in the image is small, There are many wasteful processes.

【0005】[0005]

【発明が解決しようとする課題】本発明は、上述した事
情に鑑みてなされたもので、必要であるときにのみノイ
ズ除去処理を行なうことにより、全体としての文字認識
速度を向上し、また、誤ったノイズ除去処理による誤認
識を減少させて認識精度を向上した文字認識装置を提供
することを目的とするものである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and improves the character recognition speed as a whole by performing noise removal processing only when it is necessary. An object of the present invention is to provide a character recognition device in which erroneous recognition due to erroneous noise removal processing is reduced to improve recognition accuracy.

【0006】[0006]

【課題を解決するための手段】本発明は、請求項1に記
載の発明においては、入力画像より文字を切り出し認識
する文字認識装置において、入力画像から文字画像を切
り出す文字切り出し手段と、該文字切り出し手段により
得られた文字画像を保存する文字画像記憶手段と、該文
字画像記憶手段中の文字画像から文字を識別し識別結果
と確信度を出力する文字識別手段と、前記文字画像記憶
手段中の文字画像からノイズを除去して前記文字画像記
憶手段に保存するノイズ除去手段と、前記確信度があら
かじめ決められた値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の文字画像からノイズ
を除去した画像を前記文字画像記憶手段に保存させ前記
文字画像記憶手段中のノイズを除去した画像を前記文字
識別手段により識別してその識別結果を認識結果として
出力する認識結果出力手段を有することを特徴とするも
のである。
According to a first aspect of the present invention, in a character recognition device for recognizing a character from an input image, a character slicing means for slicing a character image from an input image and the character slicing means are provided. A character image storing means for storing the character image obtained by the cutting means; a character identifying means for identifying a character from the character image in the character image storing means and outputting an identification result and a certainty factor; Noise removal means for removing noise from the character image and storing it in the character image storage means, and if the certainty factor is greater than a predetermined value, the identification result is output as a recognition result and otherwise. Is an image in which noise is removed from the character image in the character image storage means by the noise removal means, and the image is stored in the character image storage means. It is characterized in that the image noise was removed with a recognition result output means for outputting as a recognition result and the identification result identified by said character recognition means.

【0007】請求項2に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の文字画像からノイズを除去した画像を前記
文字画像記憶手段に保存させ前記文字画像記憶手段中の
ノイズを除去した画像を前記文字識別手段により識別し
確信度があらかじめ決められた第2の値より大きい場合
にはその識別結果を認識結果として出力しそれ以外の場
合にはリジェクトを表すコードを認識結果として出力す
る認識結果出力手段を有することを特徴とするものであ
る。
According to the second aspect of the invention, in the character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means; and, if the certainty factor is greater than a predetermined first value, outputs the identification result as a recognition result. In other cases, the noise removal means stores the image from which noise has been removed from the character image in the character image storage means in the character image storage means, and the image from which noise has been removed in the character image storage means is identified as the character. If the certainty factor is larger than the second value determined in advance by the means, the identification result is output as the recognition result, and otherwise, rejected. It is characterized in that it has a recognition result output means for outputting a code indicating a recognition result.

【0008】請求項3に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中の画像
を再度前記文字識別手段により識別し確信度が予め決め
られた第2の値より大きい場合にはその識別結果を認識
結果として出力しそれ以外の場合には再度前記ノイズ除
去手段によるノイズ除去処理及び前記文字識別手段によ
る識別処理を行なわせる認識結果出力手段を有すること
を特徴とするものである。
According to a third aspect of the invention, in the character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means; and, if the certainty factor is greater than a predetermined first value, outputs the identification result as a recognition result. In other cases, the image from which noise has been removed from the image in the character image storage means by the noise removal means is stored in the character image storage means, and the image in the character image storage means is identified again by the character identification means. When the certainty factor is larger than the predetermined second value, the identification result is output as the recognition result, and in other cases, the noise removal means again uses the noise. It is characterized in that it has a recognition result output means for causing the identification process by the removal process and the character identification means.

【0009】請求項4に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別し確信
度が予め決められた第2の値より大きいかあるいは前記
ノイズ除去手段において除去すべきノイズがない場合に
はその識別結果を認識結果として出力しそれ以外の場合
には再度前記ノイズ除去手段によるノイズ除去処理及び
前記文字識別手段による識別処理を行なわせる認識結果
出力手段を有することを特徴とするものである。
In a fourth aspect of the present invention, in a character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means; and, if the certainty factor is greater than a predetermined first value, outputs the identification result as a recognition result. In other cases, the image from which noise is removed from the image in the character image storage means by the noise removal means is stored in the character image storage means, and the image from which noise is removed in the character image storage means is the character identification means. When the certainty factor is larger than the second value determined in advance or there is no noise to be removed by the noise removing means, the identification result is If output as identification results otherwise is characterized in that it has a recognition result output means to perform the identification processing by the noise removal processing and the character identification means by said noise removing means again.

【0010】請求項5に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別し確信
度が予め決められた第2の値以下でありかつ前記ノイズ
除去手段において除去すべきノイズが存在する場合には
再度前記ノイズ除去手段によるノイズ除去処理及び前記
文字識別手段による識別処理を行なわせそれ以外の場合
には確信度が予め決められた第3の値より大きいときそ
の識別結果を認識結果として出力しそれ以外の場合には
リジェクトを表わすコードを認識結果として出力する認
識結果出力手段を有することを特徴とするものである。
According to a fifth aspect of the present invention, in a character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means; and, if the certainty factor is greater than a predetermined first value, outputs the identification result as a recognition result. In other cases, the image from which noise is removed from the image in the character image storage means by the noise removal means is stored in the character image storage means, and the image from which noise is removed in the character image storage means is the character identification means. If the certainty factor is less than or equal to a predetermined second value and noise to be removed by the noise removal means exists, the noise removal is performed again. The noise removal processing by the means and the identification processing by the character identification means are performed. In other cases, when the certainty factor is larger than a predetermined third value, the identification result is output as the recognition result, and in other cases. Has a recognition result output means for outputting a code representing a reject as a recognition result.

【0011】請求項6に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた値より大き
い場合には前記識別結果を認識結果として出力しそれ以
外の場合には前記ノイズ除去手段により文字画像記憶手
段中の画像からノイズを除去した画像を前記文字画像記
憶手段に保存させ前記文字画像記憶手段中のノイズを除
去した画像を前記文字識別手段により識別する処理を前
記ノイズ除去手段において除去すべきノイズがなくなる
まで繰り返し行ない得られた複数の識別結果のうち最も
確信度の大きい識別結果を認識結果として出力する認識
結果出力手段を有することを特徴とするものである。
According to a sixth aspect of the invention, in a character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means, and if the certainty factor is greater than a predetermined value, the identification result is output as a recognition result and other In this case, an image from which noise has been removed from the image in the character image storage means by the noise removal means is stored in the character image storage means, and the image from which noise has been removed in the character image storage means is identified by the character identification means. The process which is repeated until the noise to be removed by the noise removing means is eliminated, and the identification with the highest certainty factor among the plurality of identification results obtained. It is characterized in that it has a recognition result output means for outputting the result as recognition result.

【0012】請求項7に記載の発明においては、入力画
像より文字を切り出し認識する文字認識装置において、
入力画像から文字画像を切り出す文字切り出し手段と、
該文字切り出し手段により得られた文字画像を保存する
文字画像記憶手段と、該文字画像記憶手段中の文字画像
から文字を識別し識別結果と確信度を出力する文字識別
手段と、前記文字画像記憶手段中の文字画像からノイズ
を除去して前記文字画像記憶手段に保存するノイズ除去
手段と、前記確信度があらかじめ決められた第1の値よ
り大きい場合には前記識別結果を認識結果として出力し
それ以外の場合には前記ノイズ除去手段により文字画像
記憶手段中の画像からノイズを除去した画像を前記文字
画像記憶手段に保存させ前記文字画像記憶手段中のノイ
ズを除去した画像を前記文字識別手段により識別する処
理を前記ノイズ除去手段において除去すべきノイズがな
くなるまで繰り返し行ない得られた複数の確信度の最大
値があらかじめ決められた第2の値より大きい場合には
確信どの値が最も大きい識別結果を認識結果として出力
しそれ以外の場合にはリジェクトを表わすコードを認識
結果として出力する認識結果出力手段を有することを特
徴とするものである。
According to a seventh aspect of the present invention, in a character recognition device for recognizing a character cut out from an input image,
Character cutout means to cut out a character image from the input image,
A character image storage means for storing the character image obtained by the character cutting means, a character identification means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and the character image storage Noise removal means for removing noise from the character image in the means and storing it in the character image storage means; and, if the certainty factor is greater than a predetermined first value, outputs the identification result as a recognition result. In other cases, the image from which noise is removed from the image in the character image storage means by the noise removal means is stored in the character image storage means, and the image from which noise is removed in the character image storage means is the character identification means. The noise removal means repeats the process for identifying the noise until there is no more noise to be removed, and the maximum value of the plurality of certainty factors obtained is determined in advance. A recognition result output means for outputting the identification result having the largest certainty value as the recognition result when the value is larger than the determined second value, and outputting the code representing the reject as the recognition result otherwise. It is what

【0013】請求項8に記載の発明においては、請求項
1乃至7のいずれか1項に記載の文字認識装置におい
て、前記ノイズ除去手段は、前記文字画像記憶手段に保
存されている文字画像からノイズ候補を検出するノイズ
候補検出手段と、該ノイズ候補検出手段で検出された各
ノイズ候補に対してその候補がノイズであると推定され
る評価値を計算する評価値計算手段と、前記ノイズ候補
検出手段により2つ以上のノイズ候補が検出された場合
は前記評価値計算手段による各ノイズ候補の評価値の最
も大きいノイズ候補に対してのみ文字画像からノイズの
除去処理を行ない前記ノイズ候補検出手段によりただ1
つのノイズ候補が検出された場合には検出されたノイズ
候補に対して文字画像からノイズの除去処理を行ない前
記ノイズ候補検出手段によりノイズ候補が検出されない
場合はノイズの除去処理を行なわないノイズ候補削除手
段を備えていることを特徴とするものである。
According to an eighth aspect of the present invention, in the character recognition apparatus according to any one of the first to seventh aspects, the noise removing means is configured to detect a character image stored in the character image storage means. Noise candidate detecting means for detecting noise candidates, evaluation value calculating means for calculating an evaluation value for each noise candidate detected by the noise candidate detecting means, which is estimated to be noise, and the noise candidate When two or more noise candidates are detected by the detection means, the noise candidate detection means performs noise removal processing from the character image only on the noise candidate having the largest evaluation value of each noise candidate by the evaluation value calculation means. By only 1
When one noise candidate is detected, noise removal processing is performed on the detected noise candidate from the character image, and when no noise candidate is detected by the noise candidate detection means, noise removal processing is not performed It is characterized by having means.

【0014】[0014]

【作用】本発明によれば、入力画像から文字画像を切り
出し、初回はノイズ除去処理を行なわずに、文字を識別
する。文字の識別の際には、文字識別手段は識別結果と
ともに、確信度を出力する。この確信度があらかじめ決
められた値より大きい場合には、そのまま識別結果を認
識結果として出力する。これにより、ノイズがないある
いは少ない場合には、ノイズ除去処理を行なわずに文字
の認識が行なわれ、文字認識速度を向上することができ
る。
According to the present invention, a character image is cut out from an input image, and the character is identified without performing noise removal processing for the first time. When identifying a character, the character identifying means outputs a certainty factor together with the identification result. When the certainty factor is larger than a predetermined value, the identification result is output as it is as the recognition result. As a result, when there is no noise or there is little noise, character recognition is performed without performing noise removal processing, and the character recognition speed can be improved.

【0015】また、初回の文字の識別による確信度が、
あらかじめ決められた値以下の場合には、ノイズ除去処
理を行ない、改めて文字の識別を行なうことにより、初
回の処理においてノイズの影響による誤認識を防ぐこと
ができる。
Further, the certainty factor by the first character identification is
When the value is equal to or smaller than a predetermined value, noise removal processing is performed and the character is identified again to prevent erroneous recognition due to the influence of noise in the first processing.

【0016】請求項2では、さらに、2回目の文字の識
別による確信度があらかじめ決められた値以下の場合に
は、ノイズ除去を行なっても文字が識別できなかったも
のとして、リジェクトを表わすコードを認識結果として
出力することにより、誤まった認識結果の出力を減少さ
せることができる。
In the second aspect of the present invention, when the certainty factor due to the second character identification is equal to or less than a predetermined value, it is determined that the character could not be identified even if the noise removal is performed, and a code representing the reject. By outputting as the recognition result, it is possible to reduce the output of the erroneous recognition result.

【0017】請求項3では、2回目の文字の識別による
確信度があらかじめ決められた値以下の場合には、確信
度があらかじめ決められた値を越えるまで、繰り返しノ
イズ除去及び文字の識別を行なって、認識結果をより確
実なものとすることができる。
In the third aspect, when the certainty factor by the second character identification is less than or equal to a predetermined value, noise removal and character identification are repeatedly performed until the certainty factor exceeds a predetermined value. As a result, the recognition result can be made more reliable.

【0018】請求項4では、さらに、除去すべきノイズ
の有無を判定し、除去するべきノイズがなくなった場合
には、その時点の識別結果を認識結果として出力するこ
とにより、無限にノイズ除去及び文字の識別を繰り返す
ことを防止している。
According to the present invention, it is further determined whether or not there is noise to be removed, and when there is no more noise to be removed, the identification result at that time is output as a recognition result, so that noise removal can be performed infinitely. It prevents repeated identification of characters.

【0019】請求項5では、さらに、出力すべき識別結
果が決定した段階で、その確信度があらかじめ決められ
た値以下の場合には、文字が認識できなかったものとし
て、リジェクトを表わすコードを認識結果として出力す
ることにより、誤った認識結果の出力を減少させること
ができる。
According to a fifth aspect of the present invention, when the identification result to be output is determined, and the certainty factor is less than or equal to a predetermined value, a code indicating reject is determined as a character that cannot be recognized. By outputting the recognition result, it is possible to reduce the output of incorrect recognition result.

【0020】請求項6では、初回の文字の識別による確
信度があらかじめ決められた値以下の場合に、ノイズの
除去処理および文字の識別処理を、除去すべきノイズが
なくなるまで繰り返して行ない、その間に得られた複数
の確信度が最大の識別結果を認識結果として出力するこ
とにより、ノイズ除去処理を繰り返すうちに誤ったノイ
ズ除去処理が行なわれて誤認識が発生するのを減少さ
せ、認識精度を向上させることができる。
According to a sixth aspect of the present invention, when the certainty factor due to the first character identification is less than or equal to a predetermined value, the noise removal process and the character identification process are repeated until there is no noise to be removed, during which time. By outputting the identification result with the highest certainty factor as the recognition result, it is possible to reduce the occurrence of erroneous recognition due to erroneous noise removal processing during repeated noise removal processing. Can be improved.

【0021】請求項7では、さらに、最大の確信度があ
らかじめ決められた値以下の場合には、文字が認識でき
なかったものとして、リジェクトを表わすコードを認識
結果として出力することにより、誤った認識結果の出力
を減少させることができる。
Further, in the seventh aspect, when the maximum certainty factor is equal to or less than a predetermined value, it is determined that the character cannot be recognized, and the code representing the reject is output as the recognition result, thereby making an error. The output of the recognition result can be reduced.

【0022】上述のノイズ除去手段においては、例え
ば、文字画像からノイズ候補を検出し、検出されたノイ
ズ候補を、その評価値の大きいものから1つずつ除去し
ていくように構成することができ、段階的にノイズを除
去することができる。これにより、上述の各請求項に記
載の文字認識装置で繰り返してノイズを除去する過程に
おいて、適正な文字画像を得ることができる。
The above-mentioned noise removing means can be configured, for example, to detect noise candidates from the character image and remove the detected noise candidates one by one from the one having the largest evaluation value. , The noise can be removed in stages. This makes it possible to obtain an appropriate character image in the process of repeatedly removing noise with the character recognition device described in each of the above claims.

【0023】[0023]

【実施例】図1は、本発明の文字認識装置の一実施例を
示すブロック図である。図中、1は文字切り出し手段、
2は文字画像記憶手段、3は文字識別手段、4は文字認
識結果出力手段、5はノイズ除去手段である。文字切り
出し手段1は、複数の文字が含まれる入力画像中から、
文字が1つ含まれる領域を切り出して文字画像を得る。
文字画像記憶手段2は、文字切り出し手段1あるいはノ
イズ除去手段5により得られた画像を保存する。文字識
別手段3は、文字画像記憶手段2から得られる画像に対
して識別処理を行ない、候補文字のコードあるいはリジ
ェクトを表すコードで構成される識別結果と確信度を出
力する。識別処理の方法としては、公知の方法を用いる
ことができ、例えば、パターンマッチング法でもよい
し、特徴抽出法を用いた認識法を採用してもよい。文字
認識結果出力手段4は、文字識別手段3から得られる確
信度から、識別結果を認識結果として出力するか否かを
判定するとともに、認識結果として出力できない場合に
は、ノイズ除去手段5を動作させノイズ除去処理を行な
わせるとともに、ノイズ除去処理の行なわれた画像に対
して文字識別手段3により識別処理を行なわせる。この
動作は、ある場合には、繰り返し行なう。ノイズ除去手
段5は、文字画像記憶手段2から得られる画像に対し
て、ノイズを検出して除去し、ノイズが除去された画像
を出力する。処理によっては、除去すべきノイズがない
場合に、その旨を文字認識結果出力手段4に出力するこ
とができる。
1 is a block diagram showing an embodiment of a character recognition device of the present invention. In the figure, 1 is a character cutting means,
Reference numeral 2 is a character image storage means, 3 is a character identification means, 4 is a character recognition result output means, and 5 is a noise removal means. The character cutting-out means 1 selects from the input image including a plurality of characters,
An area containing one character is cut out to obtain a character image.
The character image storage means 2 stores the image obtained by the character cutout means 1 or the noise removal means 5. The character identification means 3 performs identification processing on the image obtained from the character image storage means 2 and outputs an identification result and a certainty factor which are composed of a code of a candidate character or a code representing a reject. A known method can be used as the identification processing method. For example, a pattern matching method or a recognition method using a feature extraction method may be adopted. The character recognition result output means 4 determines from the certainty factor obtained from the character recognition means 3 whether or not to output the recognition result as a recognition result, and when the recognition result cannot be output, operates the noise removal means 5. In addition to performing the noise removal processing, the character identification means 3 performs the identification processing on the image subjected to the noise removal processing. This operation is repeated in some cases. The noise removing unit 5 detects and removes noise from the image obtained from the character image storage unit 2, and outputs the image from which the noise is removed. Depending on the processing, when there is no noise to be removed, the fact can be output to the character recognition result output means 4.

【0024】文字識別手段3によって出力される確信度
は、文字識別手段3に入力された画像と、文字の標準サ
ンプルとの整合した度合いを表す。すなわち、整合度が
大きいほど、確信度の値は高くなる。最も確信度の値が
高い文字を識別結果として出力する。このとき用いる標
準サンプルとしては、ノイズが含まれていない文字画像
を用いることができる。そのため、文字識別手段3に入
力された画像にノイズが含まれていない場合には、入力
画像と、正解である文字の標準サンプルとの整合度は大
きく、文字識別手段3により出力される確信度の値は大
きくなる。逆に、ノイズが含まれている場合には、入力
画像と、各文字の標準サンプルとの整合度はいずれも小
さく、確信度の値は小さくなる。したがって、あらかじ
め閾値を決めておき、その閾値より大きいか否かで画像
中にノイズが含まれていたか否かを推定することができ
る。
The certainty factor output by the character identifying means 3 represents the degree of matching between the image input to the character identifying means 3 and the standard sample of characters. That is, the greater the matching degree, the higher the certainty value. The character with the highest confidence value is output as the identification result. As the standard sample used at this time, a character image containing no noise can be used. Therefore, when the image input to the character identifying unit 3 does not include noise, the degree of matching between the input image and the standard sample of the correct character is large, and the certainty factor output by the character identifying unit 3 is high. The value of becomes large. On the contrary, when noise is included, the degree of matching between the input image and the standard sample of each character is small, and the value of the certainty factor is small. Therefore, it is possible to predetermine the threshold value and estimate whether or not the image contains noise depending on whether or not the threshold value is larger than the threshold value.

【0025】図2は、文字識別手段3の一例を示すブロ
ック構成図である。図中、11は画像正規化手段、12
は特徴抽出手段、13は標準特徴記憶手段、14は類似
度計算手段である。画像正規化手段11は、入力された
画像中の全黒画素を包含するような外接矩形を検出し、
外接矩形があらかじめ決められた大きさになるように、
縦横それぞれの方向へ拡大または縮小し、得られる正規
化画像を出力する。特徴抽出手段12は、画像正規化手
段11により得られた正規化画像から、粗いメッシュ特
徴を抽出し、出力する。粗いメッシュ特徴とは、画像を
メッシュ状の矩形領域に分割し、分割された各矩形領域
ごとに、矩形領域に含まれる画像の特徴を抽出したもの
である。各矩形領域から抽出する特徴としては、公知の
特徴を用いることができ、例えば、画素値の和を求め、
これを特徴とすることができる。このとき、粗いメッシ
ュ特徴は、画素値の和のマトリクスとして得られる。標
準特徴記憶手段13は、認識対象とする各文字につい
て、あらかじめ用意された標準特徴を記憶し、要求に応
じて各文字に対応する標準特徴を出力する。標準特徴
は、あらかじめ各文字につき少なくとも1つ用意した標
準サンプル画像を、それぞれ画像正規化手段11による
処理と同等の処理により正規化した正規化画像から、特
徴抽出手段12による処理と同等の処理により抽出され
た特徴を平均して求めておくことができる。類似度計算
手段14は、特徴抽出手段12で得られる特徴と、標準
特徴記憶手段13から得られる各文字の標準特徴との間
の類似度をそれぞれ計算し、最も大きな値の類似度が得
られた標準特徴に対応する文字コードと、確信度として
最も大きい類似度の値を出力する。
FIG. 2 is a block diagram showing an example of the character identifying means 3. In the figure, 11 is an image normalizing means, 12
Is a feature extracting means, 13 is a standard feature storing means, and 14 is a similarity calculating means. The image normalization means 11 detects a circumscribed rectangle that includes all black pixels in the input image,
So that the circumscribed rectangle has a predetermined size,
The normalized image obtained by enlarging or reducing in the vertical and horizontal directions is output. The feature extraction unit 12 extracts a coarse mesh feature from the normalized image obtained by the image normalization unit 11 and outputs it. The coarse mesh feature is obtained by dividing the image into mesh-shaped rectangular regions and extracting the features of the image included in the rectangular region for each of the divided rectangular regions. Known features can be used as the features extracted from each rectangular area. For example, the sum of pixel values is calculated,
This can be characterized. At this time, the coarse mesh features are obtained as a matrix of sums of pixel values. The standard feature storage means 13 stores standard features prepared in advance for each character to be recognized, and outputs the standard feature corresponding to each character in response to a request. The standard features are obtained by normalizing at least one standard sample image prepared in advance for each character by a process equivalent to the process by the image normalizing means 11, and then performing a process equivalent to the process by the feature extracting means 12. The extracted features can be averaged and obtained. The similarity calculation unit 14 calculates the similarity between the feature obtained by the feature extraction unit 12 and the standard feature of each character obtained from the standard feature storage unit 13, and the similarity having the largest value is obtained. The character code corresponding to the standard feature and the maximum similarity value as the certainty factor are output.

【0026】図3は、ノイズ除去手段5の一例を示すブ
ロック構成図である。図中、21は孤立黒画素検出手
段、22は孤立黒画素削除手段である。孤立黒画素検出
手段21は、画像中から隣接する画素が全て白画素であ
るような黒画素を検出し、その画像中での位置を出力す
る。条件を満たす黒画素が検出されなかった場合には、
未検出を示すコードを出力する。孤立黒画素削除手段2
2は、孤立黒画素検出手段21で得られた、孤立黒画素
の画像中での位置を用いて、該当する画素を白画素に置
き換える。孤立黒画素検出手段21で未検出を示すコー
ドが得られた場合には何も行なわない。
FIG. 3 is a block diagram showing an example of the noise removing means 5. In the figure, 21 is an isolated black pixel detection means, and 22 is an isolated black pixel deletion means. The isolated black pixel detection means 21 detects a black pixel in which all the adjacent pixels are white pixels in the image, and outputs the position in the image. If no black pixels satisfying the conditions are detected,
Outputs a code indicating undetected. Isolated black pixel deleting means 2
2 uses the position of the isolated black pixel in the image obtained by the isolated black pixel detection means 21 to replace the corresponding pixel with a white pixel. If the isolated black pixel detecting means 21 obtains a code indicating that it has not been detected, nothing is done.

【0027】このノイズ除去手段の一例において、孤立
黒画素検出手段21で検出される黒画素の大きさを、ノ
イズ除去手段の動作回数に応じて変化させることができ
る。例えば、初回の動作では、1画素のみが孤立して黒
である画素を検出し、2回目の動作では、連続した2画
素が孤立している画素を検出するように動作させること
ができる。もちろん、所定の大きさの黒画素群から、し
だいに小さくしていくこともできる。
In one example of this noise removing means, the size of the black pixel detected by the isolated black pixel detecting means 21 can be changed according to the number of times of operation of the noise removing means. For example, the first operation can detect a pixel in which only one pixel is isolated and black, and the second operation can detect a pixel in which two consecutive pixels are isolated. Of course, the black pixel group having a predetermined size can be gradually reduced.

【0028】図4は、ノイズ除去手段5の別の例を示す
ブロック構成図である。図中、31はノイズ候補検出手
段、32は評価値計算手段、33はノイズ候補除去手段
である。この例では、ノイズ除去手段5は、文字画像記
憶手段2から得られる画像中の、ノイズであると推定さ
れる評価値が最も大きいノイズ候補に対してのみノイズ
除去処理を行なうものである。このノイズ除去手段5が
繰り返し動作する場合に、ノイズであると推定される評
価値が大きいノイズ候補から順に除去処理が行なわれ
る。
FIG. 4 is a block diagram showing another example of the noise removing means 5. In the figure, 31 is a noise candidate detecting means, 32 is an evaluation value calculating means, and 33 is a noise candidate removing means. In this example, the noise removing means 5 performs the noise removing processing only on the noise candidate having the largest evaluation value estimated to be noise in the image obtained from the character image storing means 2. When the noise removing means 5 operates repeatedly, the removal processing is performed in order from the noise candidate having the largest evaluation value estimated to be noise.

【0029】ノイズ候補検出手段31は、画像中からあ
らかじめ決められた条件を満たすノイズ候補を検出す
る。評価値計算手段32は、ノイズ候補検出手段31で
検出された各ノイズ候補に対して、そのノイズ候補がノ
イズであると推定される評価値を計算する。ノイズ候補
除去手段33は、ノイズ候補検出手段31で検出された
ノイズ候補の1つに対して、画像中からそのノイズ候補
を除去する処理を行なう。
The noise candidate detecting means 31 detects noise candidates satisfying a predetermined condition from the image. The evaluation value calculation unit 32 calculates, for each noise candidate detected by the noise candidate detection unit 31, an evaluation value estimated that the noise candidate is noise. The noise candidate removing unit 33 performs a process of removing the noise candidate from the image for one of the noise candidates detected by the noise candidate detecting unit 31.

【0030】この例において、ノイズ候補検出手段31
におけるノイズ候補の検出方法としては、例えば、画像
中において、黒画素が連続した黒画素塊のうち、面積が
あらかじめ決められた値より小さいものを全てノイズ候
補として検出するという方法を用いることができる。ま
た、評価値計算手段32における評価値の計算は、例え
ば、ノイズ候補の面積の逆数と、ノイズ候補から最も近
い黒画素塊までの距離を、それぞれに定数を乗じた上で
加算して求めることができる。ノイズ候補削除手段33
において除去するノイズ候補は、例えば、評価値計算手
段32において計算された評価値が、最も大きいまたは
最も小さいノイズ候補を選択することができる。選択さ
れたノイズ候補に対応する黒画素塊を構成する黒画素が
全て白画素に置き換えられる。上述のノイズ候補の検出
方法、評価値の計算方法、ノイズ候補の除去方法は、そ
れぞれ、これらの方法に限らず、他の手法を用いること
も可能である。ノイズがなく、ノイズ候補検出手段31
においてノイズ候補が検出されないときは、ノイズ除去
の処理は行なわれず、入力される画像をそのまま出力す
る。
In this example, the noise candidate detecting means 31
As a method of detecting noise candidates in, for example, a method of detecting all black pixel clusters in which black pixels are continuous in the image and having an area smaller than a predetermined value as noise candidates can be used. . Further, the evaluation value calculation means 32 calculates the evaluation value by, for example, obtaining the reciprocal of the area of the noise candidate and the distance from the noise candidate to the closest black pixel block after multiplying each by a constant. You can Noise candidate deletion means 33
As the noise candidate to be removed in step 1, for example, the noise candidate having the largest or smallest evaluation value calculated by the evaluation value calculation means 32 can be selected. All the black pixels forming the black pixel block corresponding to the selected noise candidate are replaced with white pixels. The noise candidate detection method, the evaluation value calculation method, and the noise candidate removal method described above are not limited to these methods, and other methods can be used. There is no noise, and the noise candidate detection means 31
When no noise candidate is detected in, the noise removal process is not performed and the input image is output as it is.

【0031】図5は、図4に示したノイズ除去手段の例
におけるノイズ除去動作の説明図である。図中、41は
ノイズ除去前の画像、42,43はノイズ、44はノイ
ズ除去後の画像である。図5(A)に示すように、ノイ
ズ除去前の画像41には、ノイズ42及びノイズ43が
存在する。ノイズ43は、文字の線の一部が切れてしま
ったために発生したノイズである。ノイズ候補検出手段
31により、ノイズ42及びノイズ43がノイズ候補と
して検出される。検出された2つのノイズ候補は、評価
値計算手段32において、評価値が計算される。計算さ
れた評価値の例を図5(B)に示す。例えば、評価値の
大きいノイズ候補から選択するものとすれば、ノイズ4
2に対応するノイズ候補が選択され、ノイズ候補削除手
段33により、ノイズ42が除去される。ノイズ42が
除去された画像の例を図5(C)に示す。このように、
文字の要素となるべく関係の薄いノイズから順に除去す
ることができる。
FIG. 5 is an explanatory diagram of the noise removing operation in the example of the noise removing means shown in FIG. In the figure, 41 is an image before noise removal, 42 and 43 are noises, and 44 is an image after noise removal. As shown in FIG. 5A, noise 42 and noise 43 exist in the image 41 before noise removal. The noise 43 is the noise generated because a part of the character line is cut off. The noise candidate detection means 31 detects noise 42 and noise 43 as noise candidates. The evaluation values of the two detected noise candidates are calculated by the evaluation value calculation means 32. An example of the calculated evaluation value is shown in FIG. For example, if noise candidates with a large evaluation value are selected, noise 4
The noise candidate corresponding to 2 is selected, and the noise 42 is removed by the noise candidate deletion means 33. An example of an image from which the noise 42 has been removed is shown in FIG. in this way,
It is possible to remove noises that are least related to the character elements in order.

【0032】また、図5(C)に示す文字画像のよう
に、ノイズ43を含んでいる方が、例えば上述の図2で
示した文字識別手段3における粗いメッシュ特徴の抽出
及び識別においては、評価値が大きく、良好な結果を得
ることができる。すなわち、従来のように、認識処理の
前にノイズを消去してしまうと、ノイズ43のような文
字の一部をも消去してしまい、誤認識のもととなってい
るが、本発明の文字認識装置では、ノイズ除去処理を行
なう前に文字識別処理を行なっているので、図5(C)
のような、文字の一部がノイズとして消去されるような
場合でも、正確に認識することができる。
Further, as in the character image shown in FIG. 5C, when the noise 43 is included, for example, in the extraction and identification of the coarse mesh feature in the character identification means 3 shown in FIG. The evaluation value is large, and good results can be obtained. That is, if the noise is erased before the recognition process as in the conventional art, a part of the character such as the noise 43 is also erased, which causes erroneous recognition. Since the character recognition device performs the character identification process before performing the noise removal process, the character recognition device shown in FIG.
Even in the case where a part of the character is erased as noise, it can be accurately recognized.

【0033】図3乃至図4において、文字識別手段3及
びノイズ除去手段5の例を示したが、本発明はこれらの
例に示す構成に限るものではなく、公知の種々の手法を
用いることができる。
3 to 4, examples of the character identifying means 3 and the noise removing means 5 are shown, but the present invention is not limited to the configurations shown in these examples, and various known methods may be used. it can.

【0034】以下、本発明の文字認識装置の一実施例に
おけるいくつかの動作例を、図1、および、図6乃至図
12を用いて説明する。図6は、本発明の文字認識装置
の一実施例における第1の動作例を説明するフローチャ
ートである。まず、S51において、文字切り出し手段
1により入力画像から1文字ごとの文字画像を切り出
し、得られた文字画像を文字画像記憶手段2に保存す
る。S52において、文字画像記憶手段2に保存されて
いる文字画像に対し、文字識別手段3により識別処理を
行なう。識別結果及び確信度が文字認識結果出力手段4
に出力される。S53において、識別結果の確信度と、
あらかじめ決められた値T1とを比較し、確信度が値T
1より大きい場合には、画像中にノイズがなかったと推
定して、S56において、識別結果を認識結果として出
力し、切り出された文字に対する認識処理を終了する。
S53において、識別結果の確信度があらかじめ決めら
れた値T1より大きくない場合には、画像中にノイズが
あったと推定して、ノイズ除去手段5によるノイズ除去
処理を含む一連の処理を行なう。この第1の動作例で
は、S54において、文字画像記憶手段2に保存されて
いる画像に対してノイズ除去手段5によりノイズ除去処
理を行ない、得られる画像を文字画像記憶手段2に保存
する。その画像に対し、S55において、文字識別手段
3により識別処理を行ない、その結果得られる識別結果
を、S56において、認識結果として出力し、切り出さ
れた文字に対する認識処理を終了する。
Some operation examples of the embodiment of the character recognition apparatus of the present invention will be described below with reference to FIGS. 1 and 6 to 12. FIG. 6 is a flow chart for explaining a first operation example in one embodiment of the character recognition device of the present invention. First, in step S51, the character cutout unit 1 cuts out a character image for each character from the input image, and the obtained character image is stored in the character image storage unit 2. In step S52, the character image stored in the character image storage unit 2 is subjected to an identification process by the character identification unit 3. The identification result and the certainty factor are character recognition result output means 4
Is output to. In S53, the certainty factor of the identification result,
Compared with a predetermined value T1, the confidence factor is the value T1.
If it is greater than 1, it is estimated that there is no noise in the image, the identification result is output as the recognition result in S56, and the recognition process for the cut out character ends.
In S53, when the certainty factor of the identification result is not larger than the predetermined value T1, it is estimated that there is noise in the image, and a series of processes including the noise removing process by the noise removing unit 5 is performed. In the first operation example, in S54, the noise removal processing is performed on the image stored in the character image storage means 2 by the noise removal means 5, and the obtained image is stored in the character image storage means 2. In step S55, the character identification means 3 performs an identification process on the image, and the resulting identification result is output as a recognition result in step S56, and the recognition process for the cut out character ends.

【0035】図7は、本発明の文字認識装置の一実施例
における第2の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、第1の動作例と同様、ノ
イズがあったと推定して、S54において、文字画像記
憶手段2に保存されている画像に対してノイズ除去手段
5によりノイズ除去処理を行ない、得られる画像を文字
画像記憶手段2に保存する。その画像に対し、S55に
おいて、文字識別手段3により識別処理を行なう。その
結果得られる確信度と、あらかじめ決められた値T3と
をS57において比較し、確信度が値T3より大きい場
合には、S56において、S55における識別処理によ
り得られた識別結果を認識結果として出力し、切り出さ
れた文字に対する認識処理を終了する。また、S57に
おいて、確信度が値T3より大きくない場合には、ノイ
ズ除去処理を行なっても認識できなかったものとして、
S58において、リジェクトを表わすコードを認識結果
として出力し、切り出された文字に対する認識処理を終
了する。
FIG. 7 is a flow chart for explaining a second operation example in one embodiment of the character recognition device of the present invention. The processing when the certainty factor is larger than the predetermined value T1 in S51, S52, and S53 is the same as that of the above-described first operation example, and thus the description thereof is omitted. S53
If the certainty factor of the identification result is not larger than the predetermined value T1, the noise is estimated to be present and is stored in the character image storage means 2 in S54, as in the first operation example. Noise removal means 5 performs noise removal processing on the image, and the obtained image is stored in the character image storage means 2. In step S55, the character identifying means 3 performs identification processing on the image. The certainty factor obtained as a result is compared with a predetermined value T3 in S57, and if the certainty factor is larger than the value T3, the identification result obtained by the identification process in S55 is output as a recognition result in S56. Then, the recognition process for the cut-out character ends. Further, in S57, if the certainty factor is not larger than the value T3, it is determined that the noise cannot be recognized even if the noise removal processing is performed.
In S58, the code indicating the reject is output as the recognition result, and the recognition process for the cut out character is completed.

【0036】図8は、本発明の文字認識装置の一実施例
における第3の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、第1の動作例と同様、ノ
イズがあったと推定して、S54において、文字画像記
憶手段2に保存されている画像に対してノイズ除去手段
5によりノイズ除去処理を行ない、得られる画像を文字
画像記憶手段2に保存する。その画像に対し、S55に
おいて、文字識別手段3により識別処理を行なう。その
結果得られる確信度と、あらかじめ決められた値T2と
をS59において比較し、確信度が値T2より大きくな
い場合には、S54に戻り、ノイズ除去処理及びS55
における文字識別処理を繰り返して行なう。そして、確
信度があらかじめ決められた値T2より大きくなったと
S59において判定された場合に、繰り返しの処理が終
了する。その時に得られた識別結果を認識結果として、
S56において出力し、切り出された文字に対する認識
処理を終了する。
FIG. 8 is a flow chart for explaining a third operation example in one embodiment of the character recognition device of the present invention. The processing when the certainty factor is larger than the predetermined value T1 in S51, S52, and S53 is the same as that of the above-described first operation example, and thus the description thereof is omitted. S53
If the certainty factor of the identification result is not larger than the predetermined value T1, the noise is estimated to be present and is stored in the character image storage means 2 in S54, as in the first operation example. Noise removal means 5 performs noise removal processing on the image, and the obtained image is stored in the character image storage means 2. In step S55, the character identifying means 3 performs identification processing on the image. The certainty factor obtained as a result is compared with a predetermined value T2 in S59, and when the certainty factor is not larger than the value T2, the process returns to S54 to perform the noise removal processing and S55.
The character identification process in is repeated. Then, when it is determined in S59 that the certainty factor is larger than the predetermined value T2, the repetitive process ends. The identification result obtained at that time is used as the recognition result,
The recognition processing for the extracted character is output in S56, and the processing ends.

【0037】図9は、本発明の文字認識装置の一実施例
における第4の動作例を説明するフローチャートであ
る。この動作例は、上述の第3の動作例とほぼ同様であ
るが、S59において、S55における識別処理の結果
得られた確信度が、あらかじめ決められた値T2より大
きくない場合に、さらに、S60において、除去するノ
イズがあるか否かを判定している。そのため、S54に
おけるノイズ除去処理と、S55における文字識別処理
の繰り返しの処理は、確信度があらかじめ決められた値
T2より大きくなるか、または、文字画像記憶手段2に
保存されている画像に、除去すべきノイズがなくなった
場合に終了する。このS60における判定によって、識
別不能によりノイズ除去処理と文字識別処理が無限に繰
り返されるのを防ぐことができる。繰り返しの処理が終
了した時に得られた識別結果を認識結果として、S56
において出力し、切り出された文字に対する認識処理を
終了する。
FIG. 9 is a flow chart for explaining the fourth operation example in the embodiment of the character recognition apparatus of the present invention. This operation example is almost the same as the above-mentioned third operation example, but in S59, when the certainty factor obtained as a result of the identification processing in S55 is not larger than the predetermined value T2, S60 is further added. In, it is determined whether or not there is noise to be removed. Therefore, in the noise removal processing in S54 and the repeated processing of the character identification processing in S55, the certainty factor becomes larger than a predetermined value T2, or the image stored in the character image storage unit 2 is removed. It ends when there is no more noise to be used. By the determination in S60, it is possible to prevent the noise removal processing and the character identification processing from being endlessly repeated due to the inability to be identified. The identification result obtained when the iterative processing is completed is used as the recognition result, and S56
And the recognition processing for the cut-out character ends.

【0038】図10は、本発明の文字認識装置の一実施
例における第5の動作例を説明するフローチャートであ
る。この動作例は、上述の第4の動作例とほぼ同様であ
るが、ノイズ除去処理と文字識別処理の繰り返しの処理
が終了した時点で、確信度とあらかじめ決められた値T
3との比較を行なっている。すなわち、S59におい
て、S55における識別処理の結果得られた確信度が、
あらかじめ決められた値T2より大きい場合、あるい
は、S60において、除去すべきノイズが存在しないと
判断された場合、S61において、そのときの確信度と
あらかじめ決められた値T3とを比較する。比較の結
果、確信度が値T3よりも大きい場合には、S56にお
いて、識別結果を認識結果として出力し、確信度が値T
3よりも大きくない場合には、認識不能として、S62
において、リジェクトを表わすコードを認識結果として
出力し、切り出された文字に対する認識処理を終了す
る。
FIG. 10 is a flow chart for explaining a fifth operation example in one embodiment of the character recognition device of the present invention. This operation example is almost the same as the above-described fourth operation example, except that the certainty factor and a predetermined value T are determined at the time when the repeated processing of the noise removal processing and the character identification processing is completed.
3 is being compared. That is, in S59, the certainty factor obtained as a result of the identification processing in S55 is
If it is larger than the predetermined value T2, or if it is determined in S60 that there is no noise to be removed, the certainty factor at that time is compared with the predetermined value T3 in S61. If the certainty factor is larger than the value T3 as a result of the comparison, the identification result is output as the recognition result in S56, and the certainty factor is the value T3.
If it is not larger than 3, it is determined as unrecognizable and S62.
At, the code representing the reject is output as the recognition result, and the recognition process for the cut-out character ends.

【0039】この第5の動作例において、あらかじめ決
められた値T2が値T3より大きい場合には、確信度が
値T2より大きいときには値T3よりも大きいことは自
明であるから、S59において確信度が値T2より大き
い場合に、S61の判定を行なわずに、S56における
認識結果の出力処理を行なうように動作させることも可
能である。
In the fifth operation example, when the predetermined value T2 is larger than the value T3, it is obvious that when the certainty factor is larger than the value T2, it is larger than the value T3. When is larger than the value T2, it is also possible to operate so as to output the recognition result in S56 without performing the determination in S61.

【0040】図11は、本発明の文字認識装置の一実施
例における第6の動作例を説明するフローチャートであ
る。S51,S52及びS53において確信度があらか
じめ決められた値T1より大きい場合の処理は、上述の
第1の動作例と同様であるので説明を省略する。S53
において、識別結果の確信度があらかじめ決められた値
T1より大きくない場合には、S54において、文字画
像記憶手段2に保存されている画像に対してノイズ除去
手段5によりノイズ除去処理を行ない、得られる画像を
文字画像記憶手段2に保存し、S55において、その画
像に対し文字識別手段3により識別処理を行なうという
処理を、除去すべきノイズがなくなるまで繰り返し行な
う。このとき、S52において行なわれた文字識別処理
と、S55において行なわれる文字識別処理ごとに、文
字識別手段3から出力される識別結果および確信度が保
管される。S60において、除去すべきノイズがなくな
ったことが判定されると、繰り返しの処理を終了し、S
63において、繰り返しの処理によって得られた複数の
識別結果のうち、確信度の値が最も大きい識別結果を認
識結果として出力し、切り出された文字に対する認識処
理を終了する。
FIG. 11 is a flow chart for explaining a sixth operation example in the embodiment of the character recognition apparatus of the present invention. The processing when the certainty factor is larger than the predetermined value T1 in S51, S52, and S53 is the same as that of the above-described first operation example, and thus the description thereof is omitted. S53
When the certainty factor of the identification result is not larger than the predetermined value T1, the noise removal processing is performed by the noise removal means 5 on the image stored in the character image storage means 2 in S54, and the obtained value is obtained. The image to be stored is stored in the character image storage means 2, and in S55, the processing of performing the identification processing by the character identification means 3 on the image is repeated until there is no noise to be removed. At this time, the identification result and the certainty factor output from the character identification means 3 are stored for each of the character identification processing performed in S52 and the character identification processing performed in S55. When it is determined in S60 that there is no noise to be removed, the iterative process is terminated, and S
At 63, of the plurality of identification results obtained by the iterative processing, the identification result with the highest certainty value is output as the recognition result, and the recognition processing for the cut-out character ends.

【0041】図12は、本発明の文字認識装置の一実施
例における第7の動作例を説明するフローチャートであ
る。この動作例は、上述の第6の動作例とほぼ同様であ
るが、S54におけるノイズ除去処理およびS55にお
ける文字識別処理の繰り返し処理を終了した後、S64
において、S52及びS55の文字識別処理で得られた
複数の確信度のうち、値が最大のものと、あらかじめ決
められた値T3とを比較し、最大の確信度が値T3より
大きい場合には、S63において、その確信度に対応す
る識別結果を認識結果として出力する。また、最大の確
信度が値T3より大きくない場合には、S65におい
て、認識不能としてリジェクトを表わすコードを認識結
果として出力し、切り出された文字に対する認識処理を
終了する。
FIG. 12 is a flow chart for explaining the seventh operation example in the embodiment of the character recognition apparatus of the present invention. This operation example is almost the same as the above-described sixth operation example, but after the repetition processing of the noise removal processing in S54 and the character identification processing in S55 is completed, S64 is performed.
In the above, among the plurality of certainty factors obtained by the character identification processing of S52 and S55, the one having the largest value is compared with the predetermined value T3, and if the maximum certainty factor is larger than the value T3, , S63, the identification result corresponding to the certainty factor is output as the recognition result. When the maximum certainty factor is not larger than the value T3, in S65, a code indicating reject as unrecognizable is output as a recognition result, and the recognition process for the cut out character is ended.

【0042】上述の各動作例において、あらかじめ決め
られた値T1,T2,T3は、それぞれ、認識結果の正
当率等を勘案して決めればよく、すべて違う値でもよい
し、2つあるいは3つが同じ値に設定されてもよい。
In each of the above-described operation examples, the predetermined values T1, T2, T3 may be determined in consideration of the correctness rate of the recognition result, all of them may be different values, or two or three. It may be set to the same value.

【0043】本発明の文字認識装置の一実施例における
具体的な動作について説明する。ここでは、簡単のた
め、上述した動作例のうち、第1の動作例について、具
体的な例を用いながら説明するが、他の動作例について
も、同様に考えることができる。また、文字識別手段3
としては、図2に示す構成を用いた場合を例に説明す
る。
A specific operation in one embodiment of the character recognition device of the present invention will be described. Here, for simplification, the first operation example among the above-described operation examples will be described using a specific example, but the same can be considered for other operation examples. Also, the character identification means 3
As an example, a case where the configuration shown in FIG. 2 is used will be described.

【0044】図13は、文字画像の例の説明図である。
文字切り出し手段により、入力画像から1文字ごとに切
り出され、図13に示すような文字画像として、文字画
像記憶手段に保存される。図13(A)は、ノイズのな
い文字画像を示しており、図13(B)は、ノイズの存
在する文字画像を示している。以下の説明では、この2
つの文字画像についての処理を説明する。
FIG. 13 is an explanatory diagram of an example of a character image.
The character cut-out means cuts out each character from the input image and saves it in the character image storage means as a character image as shown in FIG. FIG. 13A shows a character image without noise, and FIG. 13B shows a character image with noise. In the following explanation, this 2
The processing for one character image will be described.

【0045】図14は、正規化画像の例の説明図であ
る。文字識別手段3において、画像正規化手段11で、
文字画像に対して正規化処理が行なわれる。正規化処理
は、上述のように、文字画像中の全黒画素を包含するよ
うな外接矩形を検出し、外接矩形があらかじめ決められ
た大きさになるように、縦横それぞれの方向へ拡大また
は縮小し、得られる正規化画像を出力する。この例で
は、ほぼ正方形となるように、正規化処理を行なってい
る。図13(A)に示したノイズのない文字画像を正規
化した正規化画像を図14(A)に、図13(B)に示
したノイズを含む文字画像を正規化した正規化画像を図
14(B)に示す。文字画像にノイズが存在すると、ノ
イズによって外接矩形の大きさが規定されてしまう場合
があり、その場合には、図14(B)に示すように、正
しく正規化できないことになる。
FIG. 14 is an explanatory diagram of an example of a normalized image. In the character identification means 3, in the image normalization means 11,
Normalization processing is performed on the character image. As described above, the normalization process detects a circumscribing rectangle that includes all black pixels in the character image, and enlarges or reduces the circumscribing rectangle in each of the vertical and horizontal directions so that the circumscribed rectangle has a predetermined size. Then, the obtained normalized image is output. In this example, the normalization processing is performed so that the shape becomes almost square. A normalized image obtained by normalizing the noise-free character image shown in FIG. 13A is shown in FIG. 14A, and a normalized image obtained by normalizing the noise-containing character image shown in FIG. 13B is shown. 14 (B). If there is noise in the character image, the size of the circumscribed rectangle may be regulated by the noise, and in that case, normalization cannot be performed correctly, as shown in FIG.

【0046】図15は、特徴抽出手段により得られた粗
いメッシュ特徴の例の説明図である。特徴抽出手段12
において、正規化画像から粗いメッシュ特徴を抽出す
る。図15では、正規化画像を4×4の領域に分割し、
各領域内に含まれる画素数をそれぞれの領域の特徴と
し、各領域から得られる16個の特徴値により、粗いメ
ッシュ特徴を構成している。図15(A)は、図14
(A)に示すノイズのない正規化画像から抽出した粗い
メッシュ特徴を示している。また、図15は(B)は、
図14(B)に示すノイズを含んだ正規化画像から抽出
した粗いメッシュ特徴を示している。このように、2つ
の粗いメッシュ特徴は、相違する部分が多く存在する異
になる。
FIG. 15 is an explanatory diagram of an example of the coarse mesh feature obtained by the feature extracting means. Feature extraction means 12
At, coarse mesh features are extracted from the normalized image. In FIG. 15, the normalized image is divided into 4 × 4 regions,
The number of pixels included in each area is used as a characteristic of each area, and the 16 mesh feature values obtained from each area constitute a coarse mesh characteristic. FIG. 15A is the same as FIG.
It shows the coarse mesh features extracted from the noiseless normalized image shown in (A). In addition, FIG.
It shows a rough mesh feature extracted from the normalized image containing noise shown in FIG. Thus, the two coarse mesh features are different with many different parts.

【0047】図16は、標準特徴記憶手段に記憶される
標準特徴の例の説明図である。標準特徴記憶手段13に
記憶される標準特徴も、図13乃至図15に示した過程
と同様にして作成される。ここでは、数字について、そ
の標準特徴の作成過程を示しているが、他の文字、記号
についても同様である。図16(A)は、標準特徴を得
るために用意されたノイズのない標準的な文字画像であ
る。それぞれの文字画像を正規化した正規化画像の例を
図16(B)に示している。さらに、それぞれの正規化
画像から抽出された粗いメッシュ特徴の例を図16
(C)に示している。この図16(C)に示した粗いメ
ッシュ特徴を標準特徴として、標準特徴記憶手段13に
記憶される。
FIG. 16 is an explanatory diagram of an example of standard features stored in the standard feature storage means. The standard features stored in the standard feature storage means 13 are also created in the same manner as the process shown in FIGS. Here, the process of creating the standard features is shown for numbers, but the same applies to other characters and symbols. FIG. 16 (A) is a standard character image without noise prepared to obtain standard features. An example of a normalized image obtained by normalizing each character image is shown in FIG. Further, FIG. 16 shows an example of coarse mesh features extracted from each normalized image.
It is shown in (C). The rough mesh features shown in FIG. 16C are stored in the standard feature storage means 13 as standard features.

【0048】図17は、類似度の計算による文字の識別
結果と確信度の出力の説明図である。図15に示された
それぞれの粗いメッシュ特徴と、図16に示されたそれ
ぞれの標準特徴との類似度を、類似度計算手段14によ
り計算する。計算された類似度の中で、最も大きい値を
有するものを確信度とし、それに対応する文字コードを
求め、これを識別結果とする。図17(A)は、図13
(A)に示すノイズが含まれていない場合の類似度計算
の結果である。最大の類似度は、「2」の0.99であ
る。識別結果として「2」を示すコードが出力されると
ともに、確信度として0.99が出力される。また、図
17(B)は、図13(B)に示すノイズの含まれてい
る場合の類似度計算の結果である。最大の類似度は、
「5」の0.76である。識別結果として「5」を示す
コードが出力されるとともに、確信度として0.76が
出力される。
FIG. 17 is an explanatory diagram of the result of character identification by the calculation of the similarity and the output of the certainty factor. The similarity between the coarse mesh features shown in FIG. 15 and the standard features shown in FIG. 16 is calculated by the similarity calculation means 14. Among the calculated similarities, the one having the largest value is set as the certainty factor, the corresponding character code is obtained, and this is set as the identification result. FIG. 17A is the same as FIG.
It is the result of the similarity calculation when the noise shown in (A) is not included. The maximum similarity is 0.99 of “2”. A code indicating "2" is output as the identification result, and 0.99 is output as the certainty factor. In addition, FIG. 17B shows the result of the similarity calculation when the noise shown in FIG. 13B is included. The maximum similarity is
It is 0.76 of "5". A code indicating "5" is output as the identification result, and 0.76 is output as the certainty factor.

【0049】このように、図13(A)に示すような画
像中にノイズが含まれていない場合は、図17(A)に
示すように、正解である文字「2」と、値の大きな確信
度0.99が得られる。しかし、図13(B)に示すよ
うに画像中にノイズが含まれていた場合は、図17
(B)に示すように、誤りである文字「5」と、値の小
さい確信度0.76が得られてしまう。したがって、例
えば、あらかじめ閾値として0.95を設定し、確信度
が閾値である0.95より大きい場合には、ノイズが含
まれていなかったと推定し、それ以外の場合にはノイズ
が含まれていたと推定すればよい。確信度が0.95よ
り大きい場合には、識別結果を文字認識装置の認識結果
として出力する。それ以外の場合は、文字画像記憶手段
中の画像に対してノイズ除去手段5によってノイズを除
去し、再び文字識別手段により識別を行なう。
In this way, when noise is not included in the image as shown in FIG. 13A, the correct character "2" and a large value are obtained as shown in FIG. 17A. A certainty factor of 0.99 is obtained. However, when noise is included in the image as shown in FIG.
As shown in (B), an erroneous character "5" and a certainty factor of 0.76 with a small value are obtained. Therefore, for example, a threshold value of 0.95 is set in advance, and when the certainty factor is larger than the threshold value of 0.95, it is estimated that the noise is not included. In other cases, the noise is included. It can be estimated that When the certainty factor is greater than 0.95, the identification result is output as the recognition result of the character recognition device. In other cases, the noise in the image in the character image storage means is removed by the noise removing means 5, and the character identifying means again identifies the image.

【0050】図18は、ノイズ除去処理を行なった後の
文字画像の認識過程の説明図である。図13(B)に示
されたノイズを含む文字画像に対して、ノイズ除去手段
5によってノイズ除去処理を行なう。その結果、図18
(A)に示すように、ノイズを含まない文字画像が、文
字画像記憶手段2に保存される。以下、上述した処理と
同様の過程により、識別処理がなされる。まず、図18
(A)に示したノイズを含まない文字画像に対して、画
像正規化手段11により正規化処理を行ない、図18
(B)に示す正規化画像を得る。その正規化画像から特
徴抽出手段12により、図18(C)に示す粗いメッシ
ュ特徴が抽出される。抽出された粗いメッシュ特徴と、
図16(C)に示した標準特徴との類似度を類似度計算
手段14により計算する。計算結果を図18(D)に示
す。ここで、最大の類似度は0.99であり、この値を
確信度とし、対応する文字コード「2」を識別結果とし
て出力する。この確信度は、あらかじめ決められた閾値
0.95より大きいので、「2」を文字認識装置の認識
結果として出力する。このように、ノイズ除去手段5に
よってノイズが除去されたことにより、正解である認識
結果「2」を得ることができた。
FIG. 18 is an explanatory diagram of a process of recognizing a character image after the noise removing process is performed. The noise removal processing is performed by the noise removal unit 5 on the character image including noise shown in FIG. As a result, FIG.
As shown in (A), a character image containing no noise is stored in the character image storage unit 2. Hereinafter, the identification process is performed by the same process as the above-mentioned process. First, FIG.
The character normalization image shown in FIG. 18A is subjected to the normalization processing by the image normalization means 11, and the image shown in FIG.
The normalized image shown in (B) is obtained. From the normalized image, the feature extracting means 12 extracts the coarse mesh features shown in FIG. 18 (C). The extracted coarse mesh features,
The similarity calculation means 14 calculates the similarity with the standard feature shown in FIG. The calculation result is shown in FIG. Here, the maximum similarity is 0.99, and this value is used as the certainty factor, and the corresponding character code “2” is output as the identification result. Since this certainty factor is greater than the predetermined threshold value 0.95, "2" is output as the recognition result of the character recognition device. As described above, since the noise is removed by the noise removing unit 5, the correct recognition result “2” can be obtained.

【0051】[0051]

【発明の効果】以上の説明から明らかなように、本発明
によれば、画像中にノイズが含まれていなかった場合に
はノイズ除去処理を行なわずに認識結果を認識結果とし
て出力することができ、従来技術では無駄に行なわれて
いたノイズ処理を省略できるので、文字認識速度を向上
することができる。
As is apparent from the above description, according to the present invention, when the image contains no noise, the recognition result can be output as the recognition result without performing the noise removal processing. Since it is possible to omit the noise processing which is wasteful in the conventional technique, the character recognition speed can be improved.

【0052】また、画像中において文字に含まれるべき
部分が、ノイズとして誤って判定される状態であって
も、まずノイズ除去処理を行なわずに識別処理を行なう
ことにより、従来発生していた誤ったノイズ除去処理に
よる誤認識をほとんどなくすことができ、文字認識精度
を向上させることができる。
Further, even if the portion of the image that should be included in the character is erroneously determined as noise, by performing the identification process without performing the noise removal process, the error that has conventionally occurred is eliminated. The erroneous recognition due to the noise removal processing can be almost eliminated, and the character recognition accuracy can be improved.

【0053】さらに、ノイズであると推定される評価値
の大きいノイズ候補から順に除去するノイズ除去手段を
有することにより、無駄なノイズ除去処理をさらに減少
させるとともに、誤ったノイズ除去処理をさらに減少さ
せることができ、文字認識速度、文字認識精度がより一
層向上するという効果がある。
Further, by providing a noise removing means for removing noise candidates having a large evaluation value estimated to be noise in order, unnecessary noise removing processing is further reduced and erroneous noise removing processing is further reduced. Therefore, the character recognition speed and the character recognition accuracy are further improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の文字認識装置の一実施例を示すブロ
ック図である。
FIG. 1 is a block diagram showing an embodiment of a character recognition device of the present invention.

【図2】 文字識別手段3の一例を示すブロック構成図
である。
FIG. 2 is a block diagram showing an example of a character identifying means 3.

【図3】 ノイズ除去手段5の一例を示すブロック構成
図である。
FIG. 3 is a block diagram showing an example of a noise removing unit 5.

【図4】 ノイズ除去手段5の別の例を示すブロック構
成図である。
FIG. 4 is a block diagram showing another example of the noise removing means 5.

【図5】 図4に示したノイズ除去手段の例におけるノ
イズ除去動作の説明図である。
5 is an explanatory diagram of a noise removing operation in the example of the noise removing unit shown in FIG.

【図6】 本発明の文字認識装置の一実施例における第
1の動作例を説明するフローチャートである。
FIG. 6 is a flowchart illustrating a first operation example in one embodiment of the character recognition device of the present invention.

【図7】 本発明の文字認識装置の一実施例における第
2の動作例を説明するフローチャートである。
FIG. 7 is a flowchart illustrating a second operation example in the embodiment of the character recognition device of the present invention.

【図8】 本発明の文字認識装置の一実施例における第
3の動作例を説明するフローチャートである。
FIG. 8 is a flowchart illustrating a third operation example of the embodiment of the character recognition device of the present invention.

【図9】 本発明の文字認識装置の一実施例における第
4の動作例を説明するフローチャートである。
FIG. 9 is a flowchart illustrating a fourth operation example of the embodiment of the character recognition device of the present invention.

【図10】 本発明の文字認識装置の一実施例における
第5の動作例を説明するフローチャートである。
FIG. 10 is a flowchart illustrating a fifth operation example of the embodiment of the character recognition device of the present invention.

【図11】 本発明の文字認識装置の一実施例における
第6の動作例を説明するフローチャートである。
FIG. 11 is a flowchart illustrating a sixth operation example of the embodiment of the character recognition device of the present invention.

【図12】 本発明の文字認識装置の一実施例における
第7の動作例を説明するフローチャートである。
FIG. 12 is a flowchart illustrating a seventh operation example of the embodiment of the character recognition device of the present invention.

【図13】 文字画像の例の説明図である。FIG. 13 is an explanatory diagram of an example of a character image.

【図14】 正規化画像の例の説明図である。FIG. 14 is an explanatory diagram of an example of a normalized image.

【図15】 特徴抽出手段により得られた粗いメッシュ
特徴の例の説明図である。
FIG. 15 is an explanatory diagram of an example of coarse mesh features obtained by the feature extraction means.

【図16】 標準特徴記憶手段に記憶される標準特徴の
例の説明図である。
FIG. 16 is an explanatory diagram of an example of standard features stored in a standard feature storage unit.

【図17】 類似度の計算による文字の識別結果と確信
度の出力の説明図である。
FIG. 17 is an explanatory diagram of an output of a character identification result and a certainty factor by calculation of similarity.

【図18】 ノイズ除去処理を行なった後の文字画像の
認識過程の説明図である。
FIG. 18 is an explanatory diagram of a process of recognizing a character image after performing noise removal processing.

【符号の説明】[Explanation of symbols]

1 文字切り出し手段、2 文字画像記憶手段、3 文
字識別手段、4 文字認識結果出力手段、5 ノイズ除
去手段、11 画像正規化手段、12 特徴抽出手段、
13 標準特徴記憶手段、14 類似度計算手段、21
孤立黒画素検出手段、22 孤立黒画素削除手段、3
1 ノイズ候補検出手段、32 評価値計算手段、33
ノイズ候補除去手段。
1 character cutout means, 2 character image storage means, 3 character identification means, 4 character recognition result output means, 5 noise removal means, 11 image normalization means, 12 feature extraction means,
13 standard feature storage means, 14 similarity calculation means, 21
Isolated black pixel detection means, 22 isolated black pixel deletion means, 3
1 noise candidate detecting means, 32 evaluation value calculating means, 33
Noise candidate removal means.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた値より大きい場合には前記識別結果を認識結
果として出力しそれ以外の場合には前記ノイズ除去手段
により文字画像記憶手段中の文字画像からノイズを除去
した画像を前記文字画像記憶手段に保存させ前記文字画
像記憶手段中のノイズを除去した画像を前記文字識別手
段により識別してその識別結果を認識結果として出力す
る認識結果出力手段を有することを特徴とする文字認識
装置。
1. A character recognition device for recognizing a character from an input image, the character slicing means for slicing a character image from the input image, a character image storing means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is larger than a predetermined value, the identification result is output as a recognition result, and in other cases, the noise removing means removes noise from the character image in the character image storage means. The stored image is stored in the character image storage means and the noise-free image in the character image storage means is identified by the character identification means. A character recognition device having a recognition result output means for outputting the identification result of 1. as a recognition result.
【請求項2】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた第1の値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の文字画像からノイズ
を除去した画像を前記文字画像記憶手段に保存させ前記
文字画像記憶手段中のノイズを除去した画像を前記文字
識別手段により識別し確信度があらかじめ決められた第
2の値より大きい場合にはその識別結果を認識結果とし
て出力しそれ以外の場合にはリジェクトを表すコードを
認識結果として出力する認識結果出力手段を有すること
を特徴とする文字認識装置。
2. A character recognition device for recognizing a character from an input image, the character slicing means for slicing a character image from the input image, the character image storing means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is greater than a predetermined first value, the identification result is output as a recognition result, and in other cases, the noise removing means extracts the character image from the character image in the character image storage means. A noise-removed image is stored in the character image storage means, and the noise-removed image in the character image storage means is identified by the character identification means. If the certainty factor is larger than a predetermined second value, the identification result is output as a recognition result, and in other cases, the recognition result output means outputs a code representing the reject as the recognition result. Characterized character recognition device.
【請求項3】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた第1の値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の画像からノイズを除
去した画像を前記文字画像記憶手段に保存させ前記文字
画像記憶手段中の画像を再度前記文字識別手段により識
別し確信度が予め決められた第2の値より大きい場合に
はその識別結果を認識結果として出力しそれ以外の場合
には再度前記ノイズ除去手段によるノイズ除去処理及び
前記文字識別手段による識別処理を行なわせる認識結果
出力手段を有することを特徴とする文字認識装置。
3. A character recognition device for recognizing a character from an input image, a character slicing means for slicing a character image from an input image, a character image storage means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is larger than a predetermined first value, the identification result is output as a recognition result, and in other cases, the noise removing means outputs noise from the image in the character image storage means. The image from which the characters have been removed is stored in the character image storage means, and the image in the character image storage means is again identified by the character identification means to determine the certainty factor beforehand. If it is larger than the determined second value, the recognition result is output as a recognition result, and in the other cases, the recognition result output is made to perform the noise removal processing by the noise removal means and the recognition processing by the character identification means again. A character recognition device having means.
【請求項4】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた第1の値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の画像からノイズを除
去した画像を前記文字画像記憶手段に保存させ前記文字
画像記憶手段中のノイズを除去した画像を前記文字識別
手段により識別し確信度が予め決められた第2の値より
大きいかあるいは前記ノイズ除去手段において除去すべ
きノイズがない場合にはその識別結果を認識結果として
出力しそれ以外の場合には再度前記ノイズ除去手段によ
るノイズ除去処理及び前記文字識別手段による識別処理
を行なわせる認識結果出力手段を有することを特徴とす
る文字認識装置。
4. A character recognition device for recognizing a character from an input image, the character slicing means for slicing a character image from the input image, the character image storage means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is larger than a predetermined first value, the identification result is output as a recognition result, and in other cases, the noise removing means outputs noise from the image in the character image storage means. The image from which the noise is removed is stored in the character image storage means, and the image in the character image storage means from which noise is removed is identified by the character identification means. If the reliability is larger than a second predetermined value or there is no noise to be removed by the noise removing means, the identification result is output as a recognition result, and in other cases, the noise removing means again A character recognition device comprising a recognition result output means for performing a noise removal processing and an identification processing by the character identification means.
【請求項5】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた第1の値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の画像からノイズを除
去した画像を前記文字画像記憶手段に保存させ前記文字
画像記憶手段中のノイズを除去した画像を前記文字識別
手段により識別し確信度が予め決められた第2の値以下
でありかつ前記ノイズ除去手段において除去すべきノイ
ズが存在する場合には再度前記ノイズ除去手段によるノ
イズ除去処理及び前記文字識別手段による識別処理を行
なわせそれ以外の場合には確信度が予め決められた第3
の値より大きいときその識別結果を認識結果として出力
しそれ以外の場合にはリジェクトを表わすコードを認識
結果として出力する認識結果出力手段を有することを特
徴とする文字認識装置。
5. A character recognition device for recognizing a character from an input image, the character slicing means for slicing a character image from the input image, the character image storing means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is larger than a predetermined first value, the identification result is output as a recognition result, and in other cases, the noise removing means outputs noise from the image in the character image storage means. The image from which the noise is removed is stored in the character image storage means, and the image in the character image storage means from which noise is removed is identified by the character identification means. If the reliability is less than or equal to the predetermined second value and there is noise to be removed by the noise removal means, the noise removal processing by the noise removal means and the identification processing by the character identification means are performed again. Otherwise, the certainty factor is the third
A character recognition device having a recognition result output means for outputting the identification result as a recognition result when the value is larger than the value of, and otherwise outputting a code representing a reject as the recognition result.
【請求項6】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた値より大きい場合には前記識別結果を認識結
果として出力しそれ以外の場合には前記ノイズ除去手段
により文字画像記憶手段中の画像からノイズを除去した
画像を前記文字画像記憶手段に保存させ前記文字画像記
憶手段中のノイズを除去した画像を前記文字識別手段に
より識別する処理を前記ノイズ除去手段において除去す
べきノイズがなくなるまで繰り返し行ない得られた複数
の識別結果のうち最も確信度の大きい識別結果を認識結
果として出力する認識結果出力手段を有することを特徴
とする文字認識装置。
6. A character recognition device for recognizing a character from an input image, the character slicing means for slicing a character image from the input image, the character image storage means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is greater than a predetermined value, the identification result is output as a recognition result, and in other cases, the noise removing means removes noise from the image in the character image storage means. A process of storing an image in the character image storage means and identifying an image in the character image storage means from which noise is removed by the character identification means. A character recognition device comprising a recognition result output means for outputting, as a recognition result, an identification result having the highest certainty among a plurality of identification results obtained by repeating the noise removal means until there is no noise to be removed. .
【請求項7】 入力画像より文字を切り出し認識する文
字認識装置において、入力画像から文字画像を切り出す
文字切り出し手段と、該文字切り出し手段により得られ
た文字画像を保存する文字画像記憶手段と、該文字画像
記憶手段中の文字画像から文字を識別し識別結果と確信
度を出力する文字識別手段と、前記文字画像記憶手段中
の文字画像からノイズを除去して前記文字画像記憶手段
に保存するノイズ除去手段と、前記確信度があらかじめ
決められた第1の値より大きい場合には前記識別結果を
認識結果として出力しそれ以外の場合には前記ノイズ除
去手段により文字画像記憶手段中の画像からノイズを除
去した画像を前記文字画像記憶手段に保存させ前記文字
画像記憶手段中のノイズを除去した画像を前記文字識別
手段により識別する処理を前記ノイズ除去手段において
除去すべきノイズがなくなるまで繰り返し行ない得られ
た複数の確信度の最大値があらかじめ決められた第2の
値より大きい場合には確信どの値が最も大きい識別結果
を認識結果として出力しそれ以外の場合にはリジェクト
を表わすコードを認識結果として出力する認識結果出力
手段を有することを特徴とする文字認識装置。
7. A character recognizing device for recognizing a character from an input image, a character slicing means for slicing a character image from an input image, a character image storage means for storing the character image obtained by the character slicing means, Character identifying means for identifying a character from the character image in the character image storage means and outputting an identification result and a certainty factor, and noise for removing noise from the character image in the character image storage means and storing it in the character image storage means Removing means, and if the certainty factor is larger than a predetermined first value, the identification result is output as a recognition result, and in other cases, the noise removing means outputs noise from the image in the character image storage means. The image from which the noise is removed is stored in the character image storage means, and the image from which the noise in the character image storage means is removed is identified by the character identification means. The process is repeated until there is no more noise to be removed by the noise removing means, and when the maximum value of the plurality of certainty factors obtained is larger than the second predetermined value, the identification result having the highest certainty value is recognized. A character recognition device comprising a recognition result output means for outputting as a result and otherwise outputting a code representing a reject as a recognition result.
【請求項8】 前記ノイズ除去手段は、前記文字画像記
憶手段に保存されている文字画像からノイズ候補を検出
するノイズ候補検出手段と、該ノイズ候補検出手段で検
出された各ノイズ候補に対してその候補がノイズである
と推定される評価値を計算する評価値計算手段と、前記
ノイズ候補検出手段により2つ以上のノイズ候補が検出
された場合は前記評価値計算手段による各ノイズ候補の
評価値の最も大きいノイズ候補に対してのみ文字画像か
らノイズの除去処理を行ない前記ノイズ候補検出手段に
よりただ1つのノイズ候補が検出された場合には検出さ
れたノイズ候補に対して文字画像からノイズの除去処理
を行ない前記ノイズ候補検出手段によりノイズ候補が検
出されない場合はノイズの除去処理を行なわないノイズ
候補削除手段を備えていることを特徴とする請求項1乃
至7のいずれか1項に記載の文字認識装置。
8. The noise removing means detects a noise candidate from a character image stored in the character image storage means, and a noise candidate detecting means for each noise candidate detected by the noise candidate detecting means. Evaluation value calculation means for calculating an evaluation value estimated to be noise, and when the noise candidate detection means detects two or more noise candidates, the evaluation value calculation means evaluates each noise candidate. Noise removal processing is performed on the character image only for the noise candidate having the largest value, and when only one noise candidate is detected by the noise candidate detection means, noise is detected from the character image for the detected noise candidate. A noise candidate deleting unit is provided which does not perform noise removing process when no noise candidate is detected by the noise candidate detecting unit. The character recognition device according to claim 1, wherein the character recognition device is a character recognition device.
JP5212352A 1993-08-04 1993-08-04 Character recognizing device Pending JPH0749926A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5212352A JPH0749926A (en) 1993-08-04 1993-08-04 Character recognizing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5212352A JPH0749926A (en) 1993-08-04 1993-08-04 Character recognizing device

Publications (1)

Publication Number Publication Date
JPH0749926A true JPH0749926A (en) 1995-02-21

Family

ID=16621126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5212352A Pending JPH0749926A (en) 1993-08-04 1993-08-04 Character recognizing device

Country Status (1)

Country Link
JP (1) JPH0749926A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003008899A (en) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd Image processor
US6605392B2 (en) 1998-06-19 2003-08-12 Canon Kabushiki Kaisha X-ray mask structure, and X-ray exposure method and apparatus using the same
JP2010020394A (en) * 2008-07-08 2010-01-28 Canon Inc Image processing apparatus and method
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6605392B2 (en) 1998-06-19 2003-08-12 Canon Kabushiki Kaisha X-ray mask structure, and X-ray exposure method and apparatus using the same
JP2003008899A (en) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd Image processor
JP2010020394A (en) * 2008-07-08 2010-01-28 Canon Inc Image processing apparatus and method
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy
US9792495B2 (en) 2015-04-03 2017-10-17 Fuji Xerox Co., Ltd. Character recognition apparatus, character recognition processing system, and non-transitory computer readable medium
US11361529B2 (en) * 2019-01-24 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US8014603B2 (en) System and method for characterizing handwritten or typed words in a document
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US5768417A (en) Method and system for velocity-based handwriting recognition
US6128410A (en) Pattern matching apparatus and method that considers distance and direction
US5862259A (en) Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
US6327385B1 (en) Character segmentation device and character segmentation system
US5621818A (en) Document recognition apparatus
JP4300098B2 (en) Object identification method and apparatus, program and recording medium
Rebelo et al. Staff line detection and removal in the grayscale domain
JP2000113103A (en) Method and device for discriminating direction of document image and recording medium
JPH0749926A (en) Character recognizing device
JPH08190690A (en) Method for determining number plate
JP3415342B2 (en) Character cutout method
JP3209197B2 (en) Character recognition device and recording medium storing character recognition program
JP2993252B2 (en) Homomorphic character discrimination method and apparatus
JP3220226B2 (en) Character string direction determination method
KR910007032B1 (en) A method for truncating strings of characters and each character in korean documents recognition system
JP4215385B2 (en) PATTERN RECOGNIZING DEVICE, PATTERN RECOGNIZING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
JP3665435B2 (en) Character recognition device and character recognition method
JPH1011541A (en) Character recognition device
JPS6111886A (en) Character recognition system
JP2792063B2 (en) Character recognition dictionary creation method
JPH03219384A (en) Character recognizing device