JP2001175809A - Character reader, reading method, and reading program recording medium - Google Patents

Character reader, reading method, and reading program recording medium

Info

Publication number
JP2001175809A
JP2001175809A JP36360399A JP36360399A JP2001175809A JP 2001175809 A JP2001175809 A JP 2001175809A JP 36360399 A JP36360399 A JP 36360399A JP 36360399 A JP36360399 A JP 36360399A JP 2001175809 A JP2001175809 A JP 2001175809A
Authority
JP
Japan
Prior art keywords
character
stain
image
density
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36360399A
Other languages
Japanese (ja)
Other versions
JP3721034B2 (en
Inventor
Toshinori Hase
俊徳 長谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP36360399A priority Critical patent/JP3721034B2/en
Publication of JP2001175809A publication Critical patent/JP2001175809A/en
Application granted granted Critical
Publication of JP3721034B2 publication Critical patent/JP3721034B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

PROBLEM TO BE SOLVED: To accurately read characters even if a relatively large stain such an unerased character left when a character written with a pencil is erased with an eraser is present. SOLUTION: A character density decision part 3113 decides a character density section on a multi-valued image obtained by inputting a character image to be read on a document. A stain decision threshold calculation part 3114 calculates a stain decision threshold for discriminating an entry character to be read on the multi-valued document and a stain such as an unerased character left when the entry character is erased with an eraser. A stain decision part 3121 decides which of a character stroke and a stain connecting block pixels on the binary image are and removes the connecting black pixels judged to be a stain as noise.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は文字読取り装置、文
字読取り方法及び文字読取りプログラムを記録した記録
媒体に関し、特に鉛筆で記入した文字を消しゴムで消し
た際に生じる消し残し等の汚れを除去するノイズ除去処
理を具備する文字読取り装置、文字読取り方法及び文字
読取りプログラムを記録した記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character reading device, a character reading method, and a recording medium on which a character reading program is recorded, and more particularly, to removing stains such as unerased characters generated when characters written with a pencil are erased with an eraser. The present invention relates to a character reading device having a noise removing process, a character reading method, and a recording medium on which a character reading program is recorded.

【0002】[0002]

【従来の技術】文字読取り装置においては、帳票上の読
取り対象となる文字の多値画像を、何らかの方法で定め
た二値化しきい値で二値化し、その二値化画像に対して
文字認識処理を行うのが一般的である。しかし、文字の
周辺に汚れ等がある場合、多値画像を二値化する際にそ
れらが文字とともに二値画像上にノイズとして現れる事
がある。このような二値画像に対するノイズ除去処理と
しては、所定の大きさ以下の孤立した連結黒画素を検出
し、それをノイズとして除去するという処理が一般的で
ある。この処理により、文字周辺の微小なノイズは除去
することが可能である。しかしながら、この処理では、
鉛筆で記入した文字を消しゴムで消したとき等に生じる
消し残し等の比較的大きな汚れを除去することが出来な
かった。
2. Description of the Related Art In a character reading apparatus, a multivalued image of a character to be read on a form is binarized by a binarization threshold value determined by some method, and character recognition is performed on the binarized image. Generally, processing is performed. However, when there are stains and the like around the character, when binarizing the multi-valued image, they may appear as noise on the binary image together with the character. As a noise removal process for such a binary image, a process of detecting an isolated connected black pixel of a predetermined size or less and removing it as noise is general. By this processing, minute noise around the character can be removed. However, in this process,
It was not possible to remove relatively large stains, such as unerased characters, which are generated when characters written with a pencil are erased with an eraser.

【0003】そこで、上記のような比較的大きな汚れを
除去する従来の技術として、特開平6−274693号
公報や特開平5−6461号公報に開示されている。
[0003] Conventional techniques for removing such relatively large stains are disclosed in JP-A-6-274693 and JP-A-5-6461.

【0004】特開平6−274693号公報では、文字
画像上の文字の存在位置に線状の領域を設定し、この領
域内に存在する連結黒画素を種情報として、その線状の
領域を走査して種情報と接続している黒画素を抽出する
という操作を行っている。すなわち、文字を構成する黒
画素の連結性に着目して、孤立した比較的大きな連結黒
画素を汚れ等のノイズと判断し、これを除去している。
In Japanese Patent Application Laid-Open No. 6-274693, a linear region is set at the position of a character on a character image, and the connected linear pixel is used as seed information to scan the linear region. Then, an operation of extracting a black pixel connected to the seed information is performed. That is, focusing on the connectivity of black pixels constituting a character, isolated relatively large connected black pixels are determined to be noise such as dirt, and are removed.

【0005】特開平5−6461号公報では、文字画像
を2分の1に圧縮した圧縮画像から最大画素ブロックを
文字として抽出し、この最大画素ブロックを再び元の画
像サイズに拡大したのちに、これと元の文字画像とのア
ンドを取ることにより、比較的大きな連結黒画素をノイ
ズとして除去している。
In Japanese Patent Laid-Open Publication No. Hei 5-6461, a maximum pixel block is extracted as a character from a compressed image obtained by compressing a character image by half, and after expanding this maximum pixel block to the original image size again, By taking the AND of this and the original character image, relatively large connected black pixels are removed as noise.

【0006】[0006]

【発明が解決しようとする課題】しかし、特開平6−2
74693号公報では、文字が1つの連結黒画素で表さ
れるという前提のもとに文字かノイズかの判断を行って
いるため、特に手書きで記入された文字を読取る場合
等、複数個のそれぞれ分離したストロークで表現される
文字が容易に起こり得るため適用が難しい。
However, Japanese Patent Laid-Open No. 6-2 / 1994
In Japanese Patent Application Laid-Open No. 74693, it is determined whether a character is a character or a noise based on the assumption that the character is represented by one connected black pixel. It is difficult to apply because characters represented by separate strokes can easily occur.

【0007】また、特開平5−6461号公報では、最
大画素ブロックという矩形領域の内か外かで文字とノイ
ズの判別を行っているため、1文字が複数の分離したス
トロークで表現される場合や文字のすぐ近くに汚れが存
在している場合に文字ストロークと汚れを正しく判別す
ることが難しいという問題がある。
In Japanese Patent Laid-Open Publication No. Hei 5-6461, characters and noise are determined inside or outside a rectangular area called a maximum pixel block. Therefore, when one character is represented by a plurality of separate strokes. There is a problem that it is difficult to correctly determine a character stroke and a dirt when the dirt exists in the vicinity of a character or a character.

【0008】そのため、上記のような従来の技術では、
消しゴムによる消し残し等の汚れがうまく除去できない
ため、そのようなノイズが文字の誤読あるいは不読の原
因となっていた。
[0008] Therefore, in the conventional technology as described above,
Such noises have caused misreading or unreading of characters because stains such as unerased parts due to an eraser cannot be removed properly.

【0009】本発明は上述した従来技術の欠点を解決す
るためになされたものであり、その目的は鉛筆で記入す
る際に文字を消しゴムで消したときに生じる消し残し等
の汚れをノイズとして除去することにより、汚れ等があ
っても正確に文字の読取りを行うことができる文字読取
り装置、文字読取り方法及び文字読取りプログラムを記
録した記録媒体を提供することである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned drawbacks of the prior art, and has as its object to remove noise such as unerased residue generated when a character is erased with an eraser when writing with a pencil as noise. Accordingly, it is an object of the present invention to provide a character reading device, a character reading method, and a recording medium on which a character reading program is recorded, which can accurately read characters even if there is dirt or the like.

【0010】[0010]

【課題を解決するための手段】本発明による文字読取り
装置は、帳票に記載された手書き文字を読取る文字読取
り装置であって、前記帳票に対して画像読取りを行った
多値画像上の文字についてその濃度の区分である濃度区
分を判定する文字濃度判定部と、前記多値画像内の読取
り対象である文字とその文字以外の汚れとを判別するた
めの汚れ判別しきい値を算出する汚れ判別しきい値算出
部と、前記多値画像を二値化した二値画像上の連結黒画
素が汚れか文字ストロークかを判別する汚れ判別部とを
含むことを特徴とする。また、上記汚れは、消しゴムで
消した際に生じる消し残し等の汚れであり、前記汚れ判
別部は、前記多値画像の画素値に基づいて前記連結黒画
素を汚れとして判別することを特徴とする。
SUMMARY OF THE INVENTION A character reading apparatus according to the present invention is a character reading apparatus for reading handwritten characters written on a form, wherein the character is read on a multi-valued image obtained by reading an image on the form. A character density determination unit that determines a density category that is a category of the density; and a dirt determination threshold that calculates a dirt determination threshold for determining a character to be read in the multi-valued image and a dirt other than the character. It is characterized by including a threshold value calculation unit and a stain determination unit that determines whether a connected black pixel on the binary image obtained by binarizing the multi-valued image is a stain or a character stroke. Further, the stain is a stain such as an unerased residue generated when erased with an eraser, and the stain determination unit determines the connected black pixel as a stain based on a pixel value of the multi-valued image. I do.

【0011】本発明による文字読取り方法は、帳票に記
載された手書き文字を読取る文字読取り方法であって、
前記帳票に対して画像読取りを行った多値画像上の文字
についてその濃度の区分である濃度区分を判定する文字
濃度判定ステップと、前記多値画像内の読取り対象であ
る文字とその文字以外の汚れとを判別するための汚れ判
別しきい値を算出する汚れ判別しきい値算出ステップ
と、前記多値画像を二値化した二値画像上の連結黒画素
が汚れか文字ストロークかを判別する汚れ判別ステップ
とを含むことを特徴とする。また、上記汚れは、消しゴ
ムで消した際に生じる消し残し等の汚れであり、前記汚
れ判別ステップにおいては、前記多値画像の画素値に基
づいて前記連結黒画素を汚れとして判別することを特徴
とする。
[0011] A character reading method according to the present invention is a character reading method for reading handwritten characters written on a form,
A character density determination step of determining a density category, which is a density category, of a character on a multi-valued image obtained by reading an image on the form; and a character to be read in the multi-valued image and a character other than the character. A dirt determination threshold value calculating step of calculating a dirt determination threshold value for determining dirt; and determining whether a connected black pixel on the binary image obtained by binarizing the multi-valued image is dirt or a character stroke. And a dirt determination step. In addition, the stain is a stain such as an unerased residue generated when the stain is erased with an eraser, and in the stain determination step, the connected black pixel is determined as a stain based on a pixel value of the multi-valued image. And

【0012】本発明による記録媒体は、コンピュータに
よって、帳票に記載された手書き文字を読取るための文
字読取りプログラムを記録した記録媒体であって、該プ
ログラムは、コンピュータに、前記帳票に対して画像読
取りを行った多値画像上の文字についてその濃度の区分
である濃度区分を判定する文字濃度判定ステップと、前
記多値画像内の読取り対象である文字とその文字以外の
汚れとを判別するための汚れ判別しきい値を算出する汚
れ判別しきい値算出ステップと、前記多値画像を二値化
した二値画像上の連結黒画素が汚れか文字ストロークか
を判別する汚れ判別ステップとを含むことを特徴とす
る。また、上記汚れは、消しゴムで消した際に生じる消
し残し等の汚れであり、前記汚れ判別ステップにおいて
は、前記多値画像の画素値に基づいて前記連結黒画素を
汚れとして判別することを特徴とする。
[0012] A recording medium according to the present invention is a recording medium in which a computer reads a character reading program for reading handwritten characters written on a form, and the program reads an image from the form with the computer. And a character density determination step of determining a density category, which is a density category, of a character on the multi-valued image, and determining a character to be read in the multi-valued image and stains other than the character. A dirt determining threshold value calculating step of calculating a dirt determining threshold value; and a dirt determining step of determining whether a connected black pixel on the binary image obtained by binarizing the multi-valued image is a dirt or a character stroke. It is characterized by. In addition, the stain is a stain such as an unerased residue generated when the stain is erased with an eraser, and in the stain determination step, the connected black pixel is determined as a stain based on a pixel value of the multi-valued image. And

【0013】[0013]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1を参照すると、
本発明の実施の形態は、帳票上の読取り対象の文字イメ
ージを多値画像として取込むスキャナ等の画像入力装置
1と、情報を記憶する記憶装置2と、プログラム制御に
より動作するデータ処理装置3と、ディスプレイ装置等
の出力装置4から構成されている。
Next, embodiments of the present invention will be described in detail with reference to the drawings. Referring to FIG.
An embodiment of the present invention includes an image input device 1 such as a scanner that takes in a character image to be read on a form as a multi-valued image, a storage device 2 that stores information, and a data processing device 3 that operates under program control. And an output device 4 such as a display device.

【0014】記憶装置2は、画像記憶部21と文字認識
辞書部22を含む。画像記憶部21は、画像入力装置に
て取り込んだ文字の多値画像を記憶する。文字認識辞書
部22は、文字認識処理に使用する辞書を記憶する。
The storage device 2 includes an image storage unit 21 and a character recognition dictionary unit 22. The image storage unit 21 stores a multi-value image of a character captured by the image input device. The character recognition dictionary unit 22 stores a dictionary used for character recognition processing.

【0015】データ処理装置3は、文字認識のための前
処理を行う前処理部31と、この前処理部31により生
成された二値画像から文字認識のための特徴を抽出する
特徴抽出部32と、この特徴抽出部32により抽出され
た特徴と文字認識辞書部22に格納された文字特徴とを
比較することにより文字認識を行う文字認識部33とを
含んで構成されている。
The data processing device 3 includes a pre-processing unit 31 for performing pre-processing for character recognition, and a feature extracting unit 32 for extracting a feature for character recognition from the binary image generated by the pre-processing unit 31. And a character recognition unit 33 that performs character recognition by comparing the features extracted by the feature extraction unit 32 with the character features stored in the character recognition dictionary unit 22.

【0016】前処理部31は、二値化部311とノイズ
除去部312とを含んで構成されている。二値化部31
1は、濃度ヒストグラム生成部3111と、二値化しき
い値算出部3112と文字濃度判定部3113と汚れ判
別しきい値算出部3114と二値画像生成部3115と
を含んで構成されている。
The pre-processing unit 31 includes a binarizing unit 311 and a noise removing unit 312. Binarization unit 31
1 includes a density histogram generation unit 3111, a binarization threshold value calculation unit 3112, a character density determination unit 3113, a stain determination threshold value calculation unit 3114, and a binary image generation unit 3115.

【0017】濃度ヒストグラム生成部3111は、画像
記憶部21に記憶された多値画像の各画素値毎の画素数
をカウントした濃度ヒストグラムを生成する。二値化し
きい値算出部3112は、この濃度ヒストグラムを基に
多値画像を二値化するための二値化しきい値を算出す
る。文字濃度判定部3113は、この濃度ヒストグラム
を基に多値画像上の文字の濃さ区分を判定する。汚れ判
別しきい値算出部3114は、上記濃度ヒストグラムを
基に汚れと文字とを判別するための汚れ判別しきい値を
算出する。二値画像生成部3115は、上記二値化しき
い値により上記多値画像を二値化した二値画像を生成す
る。
The density histogram generation unit 3111 generates a density histogram in which the number of pixels for each pixel value of the multivalued image stored in the image storage unit 21 is counted. The binarization threshold calculator 3112 calculates a binarization threshold for binarizing the multi-valued image based on the density histogram. The character density determination unit 3113 determines a character density division on the multi-valued image based on the density histogram. The dirt discrimination threshold calculator 3114 calculates a dirt discrimination threshold for discriminating between dirt and characters based on the density histogram. The binary image generation unit 3115 generates a binary image obtained by binarizing the multi-value image using the binary threshold.

【0018】ノイズ除去部312は、汚れ判別部312
1と連結黒画素除去部3122とを含んで構成されてい
る。汚れ判別部3121は、二値画像上の連結黒画素が
汚れか文字ストロークかを判定する。連結黒画素除去部
3122は、汚れ判別部3121で汚れと判定された連
結黒画素または所定の大きさ以下の連結黒画素を上記二
値画像上から除去する。
The noise removing unit 312 includes a stain determining unit 312
1 and a connected black pixel removing unit 3122. The stain determination unit 3121 determines whether the connected black pixel on the binary image is stain or a character stroke. The connected black pixel removing unit 3122 removes, from the binary image, the connected black pixels determined as dirty by the stain determining unit 3121 or the connected black pixels having a predetermined size or less.

【0019】次に、図1の他、図2〜図4、図6及び図
7のフローチャート更には図5を参照して本実施の形態
の全体の動作について詳細に説明する。
Next, in addition to FIG. 1, the overall operation of the present embodiment will be described in detail with reference to the flowcharts of FIGS.

【0020】図2を参照し、まず、画像入力装置1によ
り帳票上の読取り対象となる文字イメージが多値画像I
MGとして取り込まれ、画像記憶部21に格納される
(ステップS1)。多値画像IMGは、画素値が大きい
ほど、その画素の明るさが明るいものとする。
Referring to FIG. 2, first, a character image to be read on a form by the image input device 1 is a multi-valued image I.
The image is captured as MG and stored in the image storage unit 21 (step S1). In the multi-valued image IMG, the larger the pixel value is, the brighter the pixel is.

【0021】次に、二値化部311は、多値画像IMG
を二値化した二値画像IMBを生成する(ステップS
2)。この場合、図3に示されているように、まず、濃
度ヒストグラム生成部3111は、この多値画像IMG
に対して、画素値毎の画素数をカウントした濃度ヒスト
グラムを生成する(図3のステップS20)。
Next, the binarizing section 311 outputs the multi-valued image IMG
To generate a binary image IMB (step S
2). In this case, as shown in FIG. 3, first, the density histogram generation unit 3111
, A density histogram is generated by counting the number of pixels for each pixel value (step S20 in FIG. 3).

【0022】次に、二値化しきい値算出部3112は、
上記濃度ヒストグラムを基に上記多値画像IMGを二値
化するためのしきい値BTHを算出する(ステップS2
1)。二値化しきい値BTHは、1980年、電子通信
学会論文誌Vol.J63−D、No.4、pp.34
9−356で大津の提案した判別分析法により求める。
この大津の提案した方法は、例えば文字と背景という2
つのカテゴリを含む画像において、それぞれのカテゴリ
内の分散を最小にし、かつカテゴリ間の分散を最大にす
るようにしきい値を選定する方法である。
Next, the binarization threshold value calculation unit 3112
A threshold value BTH for binarizing the multi-valued image IMG is calculated based on the density histogram (step S2).
1). The binarization threshold value BTH is described in 1980, IEICE Transactions Vol. J63-D, No. 4, pp. 34
In 9-356, it is determined by the discriminant analysis method proposed by Otsu.
The method proposed by Otsu is, for example, the use of text and background.
This is a method of selecting a threshold value in an image including two categories so as to minimize the variance within each category and maximize the variance between categories.

【0023】多値画像IMGの二値化は次のようにして
行う。多値画像IMGのある画素の画素値が二値化しき
い値BTHより小さければ、その画素に対応する二値画
像IMB上の画素の画素値を‘1’すなわち‘黒’と
し、多値画像IMGのある画素の画素値が二値化しきい
値BTH以上であれば、その画素に対応する二値画像I
MB上の画素の画素値を‘0’すなわち‘白’とする。
The binarization of the multi-valued image IMG is performed as follows. If the pixel value of a certain pixel of the multi-valued image IMG is smaller than the binarization threshold value BTH, the pixel value of the pixel on the binary image IMB corresponding to the pixel is set to “1”, that is, “black”, and the multi-valued image IMG If the pixel value of a certain pixel is equal to or greater than the binarization threshold BTH, the binary image I corresponding to that pixel
The pixel value of the pixel on the MB is “0”, that is, “white”.

【0024】次に、文字濃度判定部3113は、多値画
像IMG上の文字の濃度区分を判定する(ステップS2
2)。文字の濃度区分としては、‘空白’、‘薄い’、
‘濃い’の3つの区分があるものとする。
Next, the character density determination unit 3113 determines the density classification of the character on the multi-valued image IMG (step S2).
2). The character density categories are 'blank', 'light',
It is assumed that there are three sections of “dark”.

【0025】文字濃度判定部3113は、図4に示され
ているように、まず、多値画像IMG上の画素値の分散
Vrを求める(図4のステップS220)。次に、分散
Vrと予め定められたしきい値BR_THとを比較する
(ステップS221)。ステップS221の分散Vrと
しきい値BR_THとを比較した結果、Vr<BR_T
Hが成り立つ場合は、その文字濃度区分を‘空白’と判
定する(ステップS223)。
As shown in FIG. 4, the character density determining section 3113 first obtains the variance Vr of the pixel values on the multi-valued image IMG (step S220 in FIG. 4). Next, the variance Vr is compared with a predetermined threshold value BR_TH (step S221). As a result of comparing the variance Vr of step S221 with the threshold value BR_TH, Vr <BR_T
If H holds, the character density section is determined to be “blank” (step S223).

【0026】ステップS221において分散Vrとしき
い値BR_THとを比較した結果、Vr<BR_THが
成り立たない場合は、分散Vrと予め定められたしきい
値KOSA_THとを比較する(ステップS222)。
ステップS222において分散Vrとしきい値KOSA
_THとを比較した結果、Vr<KOSA_THが成り
立つ場合は、文字濃度区分を‘薄い’と判定する(ステ
ップS224)。ステップS222において分散Vrと
しきい値KOSA_THとを比較した結果、Vr<KO
SA_THが成り立たない場合は、文字濃度区分を‘濃
い’と判定する(ステップS225)。そして、文字濃
度判定部3113はこのフローチャートの処理、すなわ
ち図3のステップS22を終了する。
If the result of comparing the variance Vr and the threshold value BR_TH in step S221 does not satisfy Vr <BR_TH, the variance Vr is compared with a predetermined threshold value KOSA_TH (step S222).
In step S222, the variance Vr and the threshold value KOSA
If Vr <KOSA_TH holds as a result of comparison with _TH, the character density section is determined to be “light” (step S224). As a result of comparing the variance Vr with the threshold value KOSA_TH in step S222, Vr <KO
If SA_TH does not hold, the character density section is determined to be “dark” (step S225). Then, the character density determining unit 3113 ends the processing of this flowchart, that is, the step S22 of FIG.

【0027】次に、二値化部311は、変数KOSAを
‘0’で初期化する(図3のステップS23)。変数K
OSAは、KOSA=0ならば、上記文字濃度区分が
‘空白’もしくは‘薄い’であり、KOSA=1ならば
上記文字濃度区分が‘濃い’であることを示すための変
数である。
Next, the binarizing section 311 initializes the variable KOSA to '0' (step S23 in FIG. 3). Variable K
OSA is a variable for indicating that if KOSA = 0, the character density section is “blank” or “light”, and if KOSA = 1, the character density section is “dark”.

【0028】次に、文字濃度判定部3113により判定
された文字濃度区分を参照し、濃度区分が‘空白’かど
うか調べる(ステップS24)。濃度区分が‘空白’で
あれば、二値画像生成部3115は、上記多値画像IM
Gを二値化した画像として、画素値が全て‘0’、すな
わち全て白画素の二値画像IMBを生成する(ステップ
S29)。ステップS24において文字濃度区分が‘空
白’でなければ、次に、文字濃度区分が‘薄い’かどう
か調べる(ステップS25)。ステップS25において
文字濃度区分が‘薄い’であれば、二値画像生成部31
15は、上記多値画像IMGを上記二値化しきい値BT
Hで二値化した二値画像IMBを生成する(ステップS
28)。ステップS25において文字濃度区分が‘薄
い’でない場合、すなわち文字濃度区分が‘濃い’であ
る場合は、汚れ判別しきい値算出部3114は、二値画
像IMB上の連結黒画素が汚れか文字ストロークかを判
別するための汚れ判別しきい値DTHを算出する(ステ
ップS26)。
Next, referring to the character density division determined by the character density determination section 3113, it is checked whether the density division is "blank" (step S24). If the density classification is “blank”, the binary image generation unit 3115 determines that the multi-valued image IM
As a binary image of G, a binary image IMB having all pixel values of '0', that is, all white pixels is generated (step S29). If the character density section is not "blank" in step S24, it is next checked whether the character density section is "light" (step S25). If the character density division is “light” in step S25, the binary image generation unit 31
15 is to convert the multi-valued image IMG into the binary threshold value BT.
Generate a binary image IMB binarized with H (step S
28). If the character density category is not “light” in step S25, that is, if the character density category is “dark”, the stain determination threshold value calculation unit 3114 determines whether the connected black pixel on the binary image IMB is dirty or character stroke. A dirt determination threshold value DTH for determining whether the dirt is present is calculated (step S26).

【0029】汚れ判別しきい値算出部3114は、図5
のように、上記濃度ヒストグラム上の上記二値化しきい
値BTH未満の画素値に対して上述した判別分析法を適
用し、上記二値化しきい値BTH未満の画素を濃い画素
(画素値小)と薄い画素(画素値大)とに分離するしき
い値を見つけ、これを汚れ判別しきい値DTHとする
(ステップS26)。次に、変数KOSAに‘1’を代
入する(ステップS27)。二値画像生成部3115
は、上記多値画像IMGを上記二値化しきい値BTHで
二値化した二値画像IMBを生成する(ステップS2
8)。そして、二値化部311は、このフローチャート
の処理、すなわち図2のステップS2を終了する。
The dirt discriminating threshold value calculating unit 3114 operates as shown in FIG.
As described above, the above-described discriminant analysis method is applied to pixel values on the density histogram that are smaller than the binarization threshold BTH, and pixels that are smaller than the binarization threshold BTH are dark pixels (small pixel values). And a threshold value for separating the pixel into a thin pixel (large pixel value), and this is set as a dirt determination threshold value DTH (step S26). Next, '1' is substituted for the variable KOSA (step S27). Binary image generation unit 3115
Generates a binary image IMB obtained by binarizing the multi-value image IMG with the binary threshold value BTH (step S2).
8). Then, the binarizing unit 311 ends the processing of this flowchart, that is, the step S2 of FIG.

【0030】次に、ノイズ除去部312は、上記二値画
像IMBに対してノイズ除去を行う(図2のステップS
3)。ノイズ除去部312はまず、上記二値画像IMB
に対して画像内に存在する全ての連結黒画素を検出する
(図5のステップS30)。連結黒画素を見つけるため
の処理は、例えば公知の技術であるラベリング処理によ
って実現できる。次に、検出した連結黒画素の内の1つ
を選択し、これを連結黒画素BLKとする(ステップS
31)。
Next, the noise removing unit 312 removes noise from the binary image IMB (step S in FIG. 2).
3). The noise elimination unit 312 first performs the binary image IMB
, All connected black pixels existing in the image are detected (step S30 in FIG. 5). The process for finding a connected black pixel can be realized by, for example, a labeling process which is a known technique. Next, one of the detected connected black pixels is selected and set as a connected black pixel BLK (Step S).
31).

【0031】次に、上記連結黒画素BLKの高さH及び
幅Wと予め定められたしきい値SIZE_Sとを比較す
る(ステップS32)。しきい値SIZE_Sは、連結
黒画素BLKを微小ノイズと見なすかどうかをその連結
黒画素BLKの幅W及び高さHから判定するためのしき
い値である。幅W及び高さHが共にしきい値SIZE_
S以下であれば、連結黒画素除去部3122はその連結
黒画素BLKを微小ノイズとして除去し(ステップS3
6)、ステップS30にて検出した連結黒画素を全て選
択し終わったかどうか判定する(ステップS37)。未
選択の連結黒画素が存在すると判定された場合は、ステ
ップS31に戻り、未選択の連結黒画素を1つ選択した
のち、ステップS32以降を実行する。
Next, the height H and width W of the connected black pixel BLK are compared with a predetermined threshold value SIZE_S (step S32). The threshold value SIZE_S is a threshold value for determining whether or not to consider the connected black pixel BLK as minute noise from the width W and height H of the connected black pixel BLK. Both the width W and the height H are equal to the threshold value SIZE_
If not more than S, the connected black pixel removing unit 3122 removes the connected black pixel BLK as minute noise (step S3).
6) It is determined whether all the connected black pixels detected in step S30 have been selected (step S37). If it is determined that there is an unselected connected black pixel, the process returns to step S31, selects one unselected connected black pixel, and executes step S32 and subsequent steps.

【0032】ステップS32で、連結黒画素BLKの幅
W及び高さHのいずれかがしきい値SIZE_Sよりも
大きければ、次に幅W及び高さHと予め定められたしき
い値SIZE_Mとを比較し、さらに変数KOSAの値
が‘1’かどうか調べる(ステップS33)。しきい値
SIZE_Mは、ある連結黒画素に対して汚れと見なす
かどうかをその連結黒画素BLKの幅W及び高さHから
判断するためのしきい値である。
In step S32, if either the width W or the height H of the connected black pixel BLK is larger than the threshold value SIZE_S, then the width W and the height H and a predetermined threshold value SIZE_M are set. Then, it is checked whether the value of the variable KOSA is “1” (step S33). The threshold value SIZE_M is a threshold value for judging whether or not a certain connected black pixel is regarded as dirty based on the width W and height H of the connected black pixel BLK.

【0033】なお、上記しきい値SIZE_Sはしきい
値SIZE_Mよりも小さい値を設定するものとする。
連結黒画素BLKの幅W及び高さHのいずれかがしきい
値SIZE_Mよりも大きいか、もしくは変数KOSA
の値が‘0’である場合は、ステップS37に進み、ス
テップS30にて検出した連結黒画素を全て選択し終わ
ったかどうか判定する。一方、ステップS33で連結黒
画素BLKの幅W及び高さHが共にしきい値SIZE_
M以下であり、かつ変数KOSAの値が‘1’である場
合、汚れ判別部3121はその連結黒画素BLKが汚れ
かどうかの判定を行う(ステップS34)。
The threshold SIZE_S is set to a value smaller than the threshold SIZE_M.
Either the width W or the height H of the connected black pixel BLK is larger than the threshold SIZE_M or the variable KOSA
Is "0", the process proceeds to step S37, and it is determined whether all the connected black pixels detected in step S30 have been selected. On the other hand, in step S33, both the width W and the height H of the connected black pixel BLK are equal to the threshold SIZE_.
If the difference is equal to or less than M and the value of the variable KOSA is “1”, the stain determination unit 3121 determines whether the connected black pixel BLK is dirty (step S34).

【0034】この場合、汚れ判別部3121は、図7に
示されているように、変数BK_CNTとTK_CNT
にそれぞれ0を代入する(図7のステップS340)。
変数BK_CNTはその連結黒画素BLKを構成する黒
画素の数を格納する変数である。また、変数TK_CN
Tはその連結黒画素BLKを構成する黒画素のうち、多
値画像IMG上で汚れ判別しきい値DTH未満の画素値
を持つ画素の個数を格納する変数である。
In this case, as shown in FIG. 7, the dirt discriminating unit 3121 controls the variables BK_CNT and TK_CNT.
Are respectively substituted for 0 (step S340 in FIG. 7).
The variable BK_CNT is a variable for storing the number of black pixels constituting the connected black pixel BLK. Also, the variable TK_CN
T is a variable that stores the number of pixels having a pixel value less than the dirt determination threshold value DTH on the multi-value image IMG among the black pixels constituting the connected black pixel BLK.

【0035】次に、その連結黒画素BLKを構成する黒
画素の1つを選択する(ステップS341)。次に、ス
テップS341で選択した黒画素に対応する多値画像I
MG上の画素の画素値BK_Gを求める。すなわち、選
択した黒画素に対して、二値化を行う前の多値の画素値
を求める(ステップS342)。次に、上記画素値BK
_Gと上記汚れ判別しきい値DTHとを比較する(ステ
ップS343)。ステップS343における比較の結
果、BK_G<DTHが成り立つ場合は、変数TK_C
NTの値を1増加させる(ステップS344)。ステッ
プS343における比較の結果、BK_G<DTHが成
り立たない場合は、ステップS345に進む。次に、変
数BK_CNTの値を1増加させる(ステップS34
5)。
Next, one of the black pixels constituting the connected black pixel BLK is selected (step S341). Next, the multi-value image I corresponding to the black pixel selected in step S341
The pixel value BK_G of the pixel on the MG is obtained. That is, a multi-valued pixel value before binarization is obtained for the selected black pixel (step S342). Next, the pixel value BK
_G is compared with the dirt determination threshold value DTH (step S343). If BK_G <DTH holds as a result of the comparison in step S343, the variable TK_C
The value of NT is increased by 1 (step S344). If BK_G <DTH does not hold as a result of the comparison in step S343, the process proceeds to step S345. Next, the value of the variable BK_CNT is increased by 1 (step S34).
5).

【0036】次に、ステップS341においてその連結
黒画素BLKの構成黒画素が全て選択済みがどうか判定
する(ステップS346)。ステップS346における
判定の結果、未選択の黒画素があると判定された場合
は、ステップS341に戻り、未選択の黒画素を1つ選
択したのち、ステップS342以降を実行する。ステッ
プS346における判定の結果、未選択の黒画素がない
と判定された場合は、式(1)により汚れ評価値TK_
RTOの値を計算する(ステップS347)。
Next, in step S341, it is determined whether all the constituent black pixels of the connected black pixel BLK have been selected (step S346). If it is determined in step S346 that there is an unselected black pixel, the process returns to step S341, selects one unselected black pixel, and executes step S342 and subsequent steps. If it is determined in step S346 that there is no unselected black pixel, the dirt evaluation value TK_
The value of RTO is calculated (step S347).

【0037】 TK_RTO=TK_CNT/BK_CNT … (1) 次に、汚れ評価値TK_RTOと予め設定された汚れ評
価しきい値DTK_THとを比較し、TK_RTO<D
TK_THが成り立つかどうか判定する(ステップS3
48)。ステップS348で汚れ評価値TK_RTOと
予め設定された汚れ評価しきい値DTK_THとを比較
した結果、TK_RTO<DTK_THが成り立つ場合
は、その連結黒画素BLKを‘汚れ’であると判定する
(ステップS349)。ステップS348での評価の結
果、TK_RTO<DTK_THが成り立たない場合
は、その連結黒画素BLKを‘文字ストローク’である
と判定する(ステップS34a)。そして、汚れ判別部
3121はこのフローチャートの処理、すなわち図5中
のステップS34を終了する。
TK_RTO = TK_CNT / BK_CNT (1) Next, the dirt evaluation value TK_RTO is compared with a preset dirt evaluation threshold value DTK_TH, and TK_RTO <D
It is determined whether TK_TH holds (step S3)
48). As a result of comparing the dirt evaluation value TK_RTO with a preset dirt evaluation threshold value DTK_TH in step S348, if TK_RTO <DTK_TH holds, it is determined that the connected black pixel BLK is "dirty" (step S349). . If TK_RTO <DTK_TH does not hold as a result of the evaluation in step S348, it is determined that the connected black pixel BLK is a “character stroke” (step S34a). Then, the stain determination unit 3121 ends the process of this flowchart, that is, step S34 in FIG.

【0038】次に、ノイズ除去部312は、ステップS
34における汚れ判別部3121の判定結果が‘汚れ’
であるかどうか調べる(図5のステップS35)。ステ
ップS35において、汚れ判別部3121の判定結果が
‘汚れ’であった場合は、連結黒画素除去部3122は
その連結黒画素BLKを上記二値画像IMB上から除去
する(ステップS36)。
Next, the noise removing unit 312 determines in step S
The determination result of the dirt determination unit 3121 at 34 is “dirt”.
Is checked (step S35 in FIG. 5). In step S35, when the determination result of the stain determination unit 3121 is “dirt”, the connected black pixel removal unit 3122 removes the connected black pixel BLK from the binary image IMB (step S36).

【0039】次に、ステップS37に進み、ステップS
31で上記二値画像IMB上の連結黒画素を全て選択済
みかどうか判定する。ステップS35において、汚れ判
別部3121の判定結果が‘汚れ’でなかった場合は、
ステップS37に進み、ステップS31で上記二値画像
IMB上の連結黒画素を全て選択済みかどうか判定す
る。ステップS37において、上記二値画像IMB上の
連結黒画素を全て選択済みであると判定された場合は、
ノイズ除去部312はこのフローチャートの処理、すな
わち図2のステップS3を終了する。未選択の連結黒画
素が存在すると判定された場合は、ステップS31に戻
り、未選択の連結黒画素を1つ選択したのち、ステップ
S32以降を実行する。
Next, the process proceeds to step S37,
At 31, it is determined whether all the connected black pixels on the binary image IMB have been selected. In step S35, when the determination result of the dirt determination unit 3121 is not “dirt”,
Proceeding to step S37, it is determined in step S31 whether all connected black pixels on the binary image IMB have been selected. In step S37, when it is determined that all the connected black pixels on the binary image IMB have been selected,
The noise removing unit 312 ends the processing of this flowchart, that is, the step S3 in FIG. If it is determined that there is an unselected connected black pixel, the process returns to step S31, selects one unselected connected black pixel, and executes step S32 and subsequent steps.

【0040】次に、特徴抽出部32は、前処理部31に
より生成されたその二値画像IMBから文字認識に必要
な特徴を抽出する(図2のステップS4)。次に、文字
認識部33は、上記特徴抽出部32により抽出された特
徴と文字認識辞書部22に記憶された文字特徴とを比較
し、文字認識処理を行う(ステップS5)。そして、出
力装置4は、文字認識部33による文字認識結果を上記
多値画像IMGの読取り結果として出力する(ステップ
S6)。なお、特徴抽出部32及び文字認識部33は公
知の技術を適用して実現できる。
Next, the feature extracting unit 32 extracts features necessary for character recognition from the binary image IMB generated by the preprocessing unit 31 (step S4 in FIG. 2). Next, the character recognition unit 33 compares the features extracted by the feature extraction unit 32 with the character features stored in the character recognition dictionary unit 22 and performs a character recognition process (step S5). Then, the output device 4 outputs the result of character recognition by the character recognition unit 33 as a result of reading the multi-valued image IMG (step S6). Note that the feature extraction unit 32 and the character recognition unit 33 can be realized by applying a known technique.

【0041】以上説明した文字読取り装置では、図2〜
図7に示されている文字読取り方法が実現されている。
すなわち、帳票に記載された手書き文字を読取る方法で
あり、帳票に対して画像読取りを行った多値画像上の文
字についてその濃度の区分である濃度区分を判定し、多
値画像内の読取り対象である文字とその文字以外の汚れ
とを判別するための汚れ判別しきい値を算出し、多値画
像を二値化した二値画像上の連結黒画素が汚れか文字ス
トロークかを判別する文字読取り方法が実現されている
ことになる。そして、上記の汚れは、消しゴムで消した
際に生じる消し残し等の汚れであり、多値画像の画素値
に基づいて連結黒画素を汚れとして判別するのである。
In the character reader described above, FIGS.
The character reading method shown in FIG. 7 is realized.
In other words, this is a method of reading handwritten characters written on a form, determining a density division which is a division of the density of a character on a multi-valued image obtained by reading an image on the form, and reading the object to be read in the multi-valued image. A character that calculates a stain determination threshold value for determining a character that is a character and stains other than the character, and determines whether a connected black pixel on the binary image obtained by binarizing the multi-valued image is a stain or a character stroke. The reading method has been realized. The above-mentioned stains are unerasable stains or the like generated when erased with an eraser, and the connected black pixels are determined as stains based on the pixel values of the multi-valued image.

【0042】以上のように、本実施の形態による文字読
取り装置では、画像入力装置1から取り込まれ画像記憶
部21に記憶された多値画像を二値化した二値画像にお
いて、消しゴムで文字を消したときに生じる消し残し等
の汚れが比較的大きな連結黒画素を形成している場合、
汚れ判別部3121により、上記多値画像の画素値を基
にその連結黒画素を汚れとして判別することができる。
そして、そのような汚れを二値画像上から除去すること
により、誤って汚れを文字の一部と見なして文字認識処
理を行うことを避けることができる。したがって、消し
残し等の汚れに頑健な高精度の文字読取りを実現できる
のである。
As described above, in the character reading device according to the present embodiment, in the binary image obtained by binarizing the multivalued image fetched from the image input device 1 and stored in the image storage unit 21, characters are erased with an eraser. When stains such as unerased parts generated when erasing are forming relatively large connected black pixels,
The dirt determining unit 3121 can determine the connected black pixel as dirt based on the pixel value of the multi-valued image.
Then, by removing such dirt from the binary image, it is possible to avoid performing the character recognition processing by erroneously considering dirt as a part of the character. Therefore, high-precision character reading that is robust against stains such as unerased parts can be realized.

【0043】[0043]

【実施例】次に、具体的な実施例を用いて本実施の形態
の動作を詳細に説明する。ここでは、図8に示されてい
るような、数字の「5」の読取りを行う場合について説
明する。図8を参照すると、帳票等に記載されている読
取り対象は、数字の「5」を構成する文字成分100と
文字成分101と、例えば消しゴムで一度記入した文字
を消した際に残ってしまった汚れである汚れ成分102
と同じく汚れ成分103から構成されている。図8に示
す数字の「5」のイメージを画像入力装置1により取込
み、多値画像IMGとして画像記憶部21に格納する
(図2のステップS1)。
Next, the operation of this embodiment will be described in detail with reference to specific examples. Here, the case of reading the numeral "5" as shown in FIG. 8 will be described. Referring to FIG. 8, a reading target described in a form or the like remains when a character component 100 and a character component 101 constituting the number “5” are erased, for example, a character once written with an eraser. Soil component 102 which is a stain
And a dirt component 103. The image of the numeral “5” shown in FIG. 8 is captured by the image input device 1 and stored in the image storage unit 21 as a multi-valued image IMG (step S1 in FIG. 2).

【0044】次に、二値化部311はこの多値画像IM
Gを二値化した二値画像IMBを生成する処理を行う
(ステップS2)。濃度ヒストグラム生成部3111
は、上記多値画像IMGの濃度ヒストグラムを生成する
(図3のステップS20)。次に、二値化しきい値算出
部3112は、上記濃度ヒストグラムを基に多値画像I
MGを二値化するための二値化しきい値BTHを算出す
る(ステップS21)。その結果、BTH=12であっ
たとする。
Next, the binarizing section 311 outputs the multi-valued image IM
A process of generating a binary image IMB obtained by binarizing G is performed (step S2). Density histogram generation unit 3111
Generates a density histogram of the multi-valued image IMG (step S20 in FIG. 3). Next, the binarization threshold value calculation unit 3112 uses the multi-valued image I based on the density histogram.
A binarization threshold value BTH for binarizing the MG is calculated (step S21). As a result, it is assumed that BTH = 12.

【0045】次に、文字濃度判定部3113は、多値画
像IMG上の文字の濃度区分を判定する(ステップS2
2)。文字濃度判定部3113は、まず、多値画像IM
G上の全ての画素の画素値の分散Vrを求める(図4の
ステップS220)。このとき、分散Vr=2.4であ
ったとする。次に、Vr<BR_THが成り立つかどう
か調べる(ステップS221)。BR_THは多値画像
IMGが‘空白’かどうかを分散Vrに基づいて判定す
るために予め設定されたしきい値であり、ここではBR
_TH=0.2に設定されているものする。
Next, the character density determination unit 3113 determines the density classification of the character on the multi-valued image IMG (step S2).
2). First, the character density determination unit 3113
The variance Vr of the pixel values of all the pixels on G is obtained (Step S220 in FIG. 4). At this time, it is assumed that the variance Vr is 2.4. Next, it is checked whether or not Vr <BR_TH holds (step S221). BR_TH is a preset threshold value for determining whether or not the multi-valued image IMG is “blank” based on the variance Vr.
It is assumed that _TH is set to 0.2.

【0046】したがって、Vr<BR_THが成り立た
ないため、ステップS222に進む。次に、Vr<KO
SA_THが成り立つかどうか判定する(ステップS2
22)。KOSA_THは多値画像IMG上の文字の濃
度区分が‘濃い’か‘薄い’かを分散Vrに基づいて判
定する予め設定されたしきい値であり、ここではKOS
A_TH=1.0と設定されているものとする。したが
って、Vr<KOSA_THが成り立たないため、多値
画像IMGに写っている文字の濃度区分は‘濃い’であ
ると判定する。
Therefore, since Vr <BR_TH does not hold, the process proceeds to step S222. Next, Vr <KO
It is determined whether SA_TH holds (step S2).
22). KOSA_TH is a preset threshold value for determining whether the character density division on the multi-valued image IMG is “dark” or “light” based on the variance Vr.
It is assumed that A_TH = 1.0. Therefore, since Vr <KOSA_TH does not hold, it is determined that the density classification of the character appearing in the multi-value image IMG is “dark”.

【0047】次に、二値化部311は、変数KOSAを
0で初期化する(図3のステップS23)。次に、文字
濃度判定部3113の判定した文字濃度区分が‘空白’
かどうか判定する(ステップS24)。ここでは、文字
濃度区分は‘濃い’であるため、ステップS25に進
み、上記文字濃度区分が‘薄い’かどうか判定する。文
字濃度区分は‘濃い’なので、汚れ判別しきい値算出部
3114は、上記濃度ヒストグラムを基に、汚れ判別し
きい値の算出を行う(ステップS26)。
Next, the binarizing unit 311 initializes a variable KOSA with 0 (step S23 in FIG. 3). Next, the character density classification determined by the character density determination unit 3113 is “blank”.
It is determined whether it is (Step S24). Here, since the character density category is “dark”, the process proceeds to step S25, and it is determined whether the character density category is “light”. Since the character density category is “dark”, the stain determination threshold value calculation unit 3114 calculates a stain determination threshold value based on the density histogram (step S26).

【0048】すなわち、BTH=12であるため、図5
に示した濃度ヒストグラムの画素値が0から11までの
部分に対して上述した判別分析法を適用し、汚れ判別し
きい値DTHを求める。ここでは、DTH=10が得ら
れたとする。次に、二値化部311は、変数KOSAに
1を代入する(ステップS27)。そして、二値画像生
成部3115は、多値画像IMGを二値化しきい値BT
Hで二値化し、図9の二値画像IMBを生成する(ステ
ップS28)。もし、ステップS24の文字濃度区分が
‘空白’かどうかの判定で‘空白’であると判定された
場合は、多値画像IMGの二値画像として、全ての画素
が白画素の二値画像IMBを生成する。
That is, since BTH = 12, FIG.
The above-described discriminant analysis method is applied to the portion where the pixel value of the density histogram shown in FIG. Here, it is assumed that DTH = 10 is obtained. Next, the binarizing unit 311 substitutes 1 for a variable KOSA (Step S27). Then, the binary image generation unit 3115 converts the multi-valued image IMG into a binary threshold BT.
H is used to generate a binary image IMB shown in FIG. 9 (step S28). If it is determined in step S24 that the character density section is “blank” in the determination of “blank”, the binary image IMB in which all pixels are white pixels is determined as the binary image of the multi-level image IMG. Generate

【0049】次に、ノイズ除去部312は、上記二値画
像IMBに対して連結黒画素を検出する(図5のステッ
プS30)。その結果、図9に示されている4つの連結
黒画素110〜113が検出される。これら4つの連結
黒画素の内、まず連結黒画素110を選択する(ステッ
プS31)。このとき、連結黒画素110の大きさは、
幅W=20ピクセル、高さH=35ピクセルであったと
する。
Next, the noise removing unit 312 detects a connected black pixel from the binary image IMB (step S30 in FIG. 5). As a result, four connected black pixels 110 to 113 shown in FIG. 9 are detected. Among these four connected black pixels, first, the connected black pixel 110 is selected (step S31). At this time, the size of the connected black pixel 110 is
It is assumed that the width W is 20 pixels and the height H is 35 pixels.

【0050】次に、この幅Wと高さHが共に予め設定さ
れたしきい値SIZE_S以下であるかどうか判定する
(ステップS32)。ここでは、しきい値SIZE_S
=5に設定されているものとする。この場合、幅Wと高
さHは共にSIZE_Sよりも大きいため、次に、幅W
及び高さHが予め設定されたしきい値SIZE_M以下
であり、かつ変数KOSA=1であるかどうか判定する
(ステップS33)。ここでは、しきい値SIZE_M
=10に設定されているものとする。
Next, it is determined whether or not both the width W and the height H are equal to or smaller than a preset threshold value SIZE_S (step S32). Here, the threshold value SIZE_S
= 5. In this case, since both the width W and the height H are larger than SIZE_S,
Then, it is determined whether or not the height H is equal to or smaller than a preset threshold value SIZE_M and the variable KOSA = 1 (step S33). Here, the threshold value SIZE_M
= 10 is assumed to be set.

【0051】この場合、幅W及び高さHは共にしきい値
SIZE_Mよりも大きいため、ステップS37に進
み、連結黒画素が全て選択済みかどうか判定する。しか
し、まだ連結黒画素111〜113が選択されていない
ので、ステップS31に戻り、連結黒画素111を選択
する。連結黒画素の大きさは、幅W=10、高さH=4
であったとする。すると、ステップS32での大きさ判
定では、幅W及び高さHが共にしきい値SIZE_S以
下という条件を満たさないため、ステップS33に進
む。ステップS33での大きさ判定では、幅Wと高さH
が共にSIZE_M以下という条件を満たすため、汚れ
判別部3121は、連結黒画素111が汚れかどうかの
判定を行う(ステップS34)。
In this case, since both the width W and the height H are larger than the threshold value SIZE_M, the flow advances to step S37 to determine whether all the connected black pixels have been selected. However, since the connected black pixels 111 to 113 have not been selected yet, the process returns to step S31, and the connected black pixel 111 is selected. The size of the connected black pixel is as follows: width W = 10, height H = 4
Assume that Then, in the size determination in step S32, since both the width W and the height H do not satisfy the condition that the width W and the height H are equal to or smaller than the threshold SIZE_S, the process proceeds to step S33. In the size determination in step S33, the width W and the height H
Satisfy the condition that both are equal to or smaller than SIZE_M, the stain determination unit 3121 determines whether or not the connected black pixel 111 is dirty (step S34).

【0052】次に、汚れ判別部3121は、変数BK_
CNTと変数TK_CNTを共に0で初期化する(図7
のステップS340)。次に、連結黒画素111を構成
する黒画素の内の1つを選択する(ステップS34
1)。次に、図10に示されているように、選択した黒
画素に対応する画素の画素値BK_Gを、画像記憶部2
1に記憶された多値画像IMGを参照することにより求
める(ステップS342)。なお、図10には、二値画
像IMB上の連結黒画像BLKと、多値画像IMGとが
示されている。
Next, the dirt determining unit 3121 sets the variable BK_
Both CNT and the variable TK_CNT are initialized to 0 (FIG. 7)
Step S340). Next, one of the black pixels constituting the connected black pixel 111 is selected (step S34).
1). Next, as shown in FIG. 10, the pixel value BK_G of the pixel corresponding to the selected black pixel is stored in the image storage unit 2.
It is determined by referring to the multi-valued image IMG stored in No. 1 (step S342). FIG. 10 shows a connected black image BLK on the binary image IMB and a multi-value image IMG.

【0053】この選択した黒画素に対応する画素の画素
値BK_Gを求める場合、図9に示されている連結黒画
素111に対応する図8の文字成分101を参照する。
ここでは、BK_G=4であったとする。次に、このB
K_Gと汚れ判別しきい値算出部3114により算出さ
れた汚れ判別しきい値DTHとを比較し、BK_G<D
THが成り立つかどうか判定する(ステップS34
3)。汚れ判別しきい値DTHは上述した通りDTH=
10が得られていると仮定しているので、BK_G<D
THが成り立つ。従って、変数TK_CNTの値を1増
加させる(ステップS344)。そして、変数BK_C
NTの値を1増加させる(ステップS345)。
When determining the pixel value BK_G of the pixel corresponding to the selected black pixel, reference is made to the character component 101 of FIG. 8 corresponding to the connected black pixel 111 shown in FIG.
Here, it is assumed that BK_G = 4. Next, this B
K_G is compared with the dirt determination threshold DTH calculated by the dirt determination threshold calculator 3114, and BK_G <D
It is determined whether or not TH is satisfied (step S34)
3). As described above, the dirt determination threshold DTH is DTH =
10, BK_G <D
TH holds. Therefore, the value of the variable TK_CNT is increased by 1 (step S344). And the variable BK_C
The value of NT is increased by 1 (step S345).

【0054】次に、全ての黒画素を選択済みかどうか調
べる(ステップS346)。ここでは、まだ未選択の黒
画素があるとして、ステップS341に戻り、未選択の
黒画素を1つ選択する。そして、この黒画素に対応する
多値画像IMG上の画素の画素値をBK_Gを求める
(ステップS342)。ここでは、この画素値BK_G
=12であったとする。次に、画素値BK_Gと汚れ判
別しきい値DTHとを比較し、BK_G<DTHが成り
立つかどうか判定する(ステップS343)。しかし、
BK_G<DTHが成り立たないので、ステップS34
4をとばしてステップS345に進み変数BK_CNT
の値を1増加させる。
Next, it is checked whether or not all the black pixels have been selected (step S346). Here, assuming that there is still an unselected black pixel, the process returns to step S341, and one unselected black pixel is selected. Then, the pixel value of the pixel on the multi-valued image IMG corresponding to the black pixel is determined as BK_G (step S342). Here, this pixel value BK_G
= 12. Next, the pixel value BK_G is compared with the dirt determination threshold value DTH to determine whether BK_G <DTH holds (step S343). But,
Since BK_G <DTH does not hold, step S34 is performed.
4 is skipped and the process advances to step S345 to set the variable BK_CNT.
Is incremented by one.

【0055】そして、ステップS346で、全ての黒画
素を選択済みかどうか判定する。このようにして、ステ
ップS341で連結黒画素111を構成する全ての黒画
素を選択するまでステップS341からステップS34
6間での処理を繰り返す。全ての黒画素を選択し終わっ
た時点で、ステップS347に進み、TK_RTOの値
を計算する。ここで、TK_CNT=20、BK_CN
T=25であったとすると、TK_RTO=0.8とな
る。次に、このTK_RTOと予め設定されたしきい値
DTK_THとを比較する。ここでは、DTK_TH=
0.1に設定してあるものとする。すると、ステップS
348でTK_RTOとDTK_THとを比較した結
果、TK_RTO<DTK_THが成り立たないため、
連結黒画素111を‘文字ストローク’であると判定す
る(ステップS34a)。
Then, in a step S346, it is determined whether or not all the black pixels have been selected. In this manner, steps S341 to S34 are performed until all the black pixels constituting the connected black pixel 111 are selected in step S341.
The processing between 6 is repeated. When all the black pixels have been selected, the process proceeds to step S347, and the value of TK_RTO is calculated. Here, TK_CNT = 20, BK_CN
If T = 25, TK_RTO = 0.8. Next, TK_RTO is compared with a preset threshold value DTK_TH. Here, DTK_TH =
It is assumed that it is set to 0.1. Then, step S
As a result of comparing TK_RTO and DTK_TH in 348, since TK_RTO <DTK_TH does not hold,
It is determined that the connected black pixel 111 is a “character stroke” (step S34a).

【0056】そして、図5のステップS35に進み、汚
れ判別部3121の判別結果が‘汚れ’かどうか判定す
る。この場合、汚れ判別部3121は、連結黒画素11
1は‘文字ストローク’であると判定しているので、ス
テップS37に進む。ステップS37で連結黒画素を全
て選択したかどうか判定する。この場合、連結黒画素が
112と連結黒画素113が未選択であるので、ステッ
プS31に戻り、連結黒画素112を選択する。
Then, the process proceeds to step S35 in FIG. 5, and it is determined whether or not the determination result of the dirt determining unit 3121 is "dirt". In this case, the stain determination unit 3121 determines that the connected black pixel 11
Since 1 is determined to be a “character stroke”, the process proceeds to step S37. In step S37, it is determined whether all the connected black pixels have been selected. In this case, since the connected black pixel 112 and the connected black pixel 113 have not been selected, the process returns to step S31, and the connected black pixel 112 is selected.

【0057】連結黒画素112の大きさは、幅W=5,
高さH=8であったとする。すると、ステップS32に
おける判定では、幅W及び高さHが共にSIZE_S以
下という条件を満たさないため、ステップS33に進
む。ステップS33における判定では、幅W及び高さH
が共にSIZE_M以下であり、かつ変数KOSA=1
を満たすので、汚れ判別部3121は、連結黒画素11
2が汚れかどうかの判定を行う(ステップS34)。
The size of the connected black pixel 112 is W = 5,
Assume that the height H = 8. Then, in the determination in step S32, since the condition that both the width W and the height H do not satisfy the condition that the width W and the height H are equal to or smaller than SIZE_S is satisfied, the process proceeds to step S33. In the determination in step S33, the width W and the height H
Are smaller than or equal to SIZE_M, and the variable KOSA = 1
Is satisfied, the stain determination unit 3121 determines that the connected black pixel 11
It is determined whether 2 is dirty (step S34).

【0058】次に、汚れ判別部3121は、上記連結黒
画素111に対して行った場合と同様に、図7のステッ
プS340からステップS346までの処理を連結黒画
素112に対して行う。その結果、TK_CNT=2、
BK_CNT=32が得られたとすると、TK_RTO
=0.0625となる。次に、このTK_RTOと上記
しきい値DTK_THとを比較する(ステップS34
8)。ここでは、DTK_TH=0.1に設定してある
ので、ステップS348でTK_RTO<DTK_TH
が成り立つため、連結黒画素112を‘汚れ’であると
判定する(ステップS349)。そして、図5のステッ
プS35に進み、汚れ判別部3121の判別結果が‘汚
れ’かどうか判定する。この場合、汚れ判別部3121
は、連結黒画素112を‘汚れ’であると判定している
ので、連結黒画素除去部3122は連結黒画素112を
二値画像IMB上から除去する(ステップS36)。
Next, the stain determination unit 3121 performs the processing from step S340 to step S346 in FIG. As a result, TK_CNT = 2,
If BK_CNT = 32 is obtained, TK_RTO
= 0.0625. Next, this TK_RTO is compared with the threshold value DTK_TH (step S34).
8). Here, DTK_TH = 0.1, so that in step S348, TK_RTO <DTK_TH
Holds, it is determined that the connected black pixel 112 is “dirty” (step S349). Then, the process proceeds to step S35 in FIG. 5, and it is determined whether or not the determination result of the dirt determining unit 3121 is “dirty”. In this case, the stain determination unit 3121
Has determined that the connected black pixel 112 is 'dirty', the connected black pixel removing unit 3122 removes the connected black pixel 112 from the binary image IMB (step S36).

【0059】次に、ステップS37で連結黒画素を全て
選択したかどうか判定する。連結黒画素が113が未選
択であるので、ステップS31に戻り、連結黒画素11
3を選択する。連結黒画素113の大きさは、幅W=
3、高さH=4であるとする。すると、ステップS32
の判定で、幅Wと高さHが共にSIZE_S以下である
ので、連結黒画素除去部3122は連結黒画素113を
二値画像IMB上から除去する(ステップS36)。次
に、ステップS37で、連結黒画素を全て選択済みかど
うか判定する。このとき、二値画像IMB上の連結黒画
素110から113は全て選択済みであるので、ノイズ
除去部312はその処理(図2のステップS3)を終了
する。
Next, in step S37, it is determined whether all the connected black pixels have been selected. Since the connected black pixel 113 has not been selected, the process returns to step S31, and the connected black pixel 11
Select 3. The size of the connected black pixel 113 is represented by the width W =
3, height H = 4. Then, step S32
Since the width W and the height H are both equal to or smaller than SIZE_S in the determination of (1), the connected black pixel removing unit 3122 removes the connected black pixel 113 from the binary image IMB (step S36). Next, in step S37, it is determined whether all the connected black pixels have been selected. At this time, since all of the connected black pixels 110 to 113 on the binary image IMB have already been selected, the noise removing unit 312 ends the processing (Step S3 in FIG. 2).

【0060】次に、特徴抽出部32は、前処理部31か
ら図11に示すノイズ除去後の二値画像IMBを受け取
り、文字認識部33で文字認識処理を行う際に用いる特
徴を抽出する(図2のステップS4)。
Next, the feature extraction unit 32 receives the noise-removed binary image IMB shown in FIG. 11 from the pre-processing unit 31 and extracts features used when the character recognition unit 33 performs the character recognition processing ( Step S4 in FIG. 2).

【0061】次に、文字認識部33は、特徴抽出部32
にて抽出された特徴と文字認識辞書部22に格納された
文字特徴とを比較し、文字認識処理を行う(ステップS
5)。そして、文字認識処理の結果得られた、多値画像
IMGの属すべきカテゴリ名を、文字読取り結果として
出力装置4に出力する。
Next, the character recognizing unit 33 includes the feature extracting unit 32
Are compared with the character features stored in the character recognition dictionary unit 22 to perform a character recognition process (step S).
5). Then, the category name to which the multi-value image IMG belongs, which is obtained as a result of the character recognition processing, is output to the output device 4 as a character reading result.

【0062】なお、以上説明した実施の形態では、プロ
グラム制御により動作するデータ処理装置3が、メモリ
に記憶されたプログラムを実行することによって、前処
理部31から文字認識部33までの機能が実現されてい
た。これに対し、図12に示すように、データ処理装置
3が実行するプログラムを記録した記録媒体5を備え、
この記録媒体5からプログラムをデータ処理装置3のメ
モリに読込ませ、データ処理装置3の動作を制御するよ
うにしても良い。
In the embodiment described above, the functions from the preprocessing unit 31 to the character recognition unit 33 are realized by the data processing device 3 operating under program control executing the program stored in the memory. It had been. On the other hand, as shown in FIG. 12, a recording medium 5 storing a program to be executed by the data processing device 3 is provided.
A program may be read from the recording medium 5 into the memory of the data processing device 3 to control the operation of the data processing device 3.

【0063】つまり、上述した図2〜図4、図6及び図
7の処理を実現するためのプログラムを記録した記録媒
体を用意し、これを用いて図12の各部を制御すれば、
上述と同様の文字読取り動作を行うことができることは
明白である。この記録媒体5には、半導体メモリ、磁気
ディスク装置の他、種々の記録媒体を用いることができ
る。
That is, by preparing a recording medium on which a program for realizing the processes of FIGS. 2 to 4, 6 and 7 described above is prepared, and using this to control each part of FIG. 12,
Obviously, a character reading operation similar to that described above can be performed. As the recording medium 5, various recording media other than the semiconductor memory and the magnetic disk device can be used.

【0064】また、同記録媒体に記録されているプログ
ラムによってコンピュータを制御すれば、上述と同様に
文字読取り動作を行うことができることは明白である。
この記録媒体には、半導体メモリ、磁気ディスク装置の
他、種々の記録媒体を用いることができる。
If the computer is controlled by the program recorded on the recording medium, it is apparent that the character reading operation can be performed in the same manner as described above.
As this recording medium, various recording media other than the semiconductor memory and the magnetic disk device can be used.

【0065】[0065]

【発明の効果】以上説明したように本発明は、二値画像
上のある程度大きな連結黒画素に対して汚れか文字スト
ロークかを、二値化する前の多値画像上の濃度情報を参
照することによって判別するようにしたので、文字スト
ロークを誤って除去することなく、汚れのみを除去する
ことができ、消しゴムで一度記入した文字を消したとき
などに生じる消し残し等の汚れに強い安定した文字読取
り装置を実現できるという効果がある。
As described above, the present invention refers to density information on a multi-valued image before binarization, to determine whether a certain large connected black pixel on the binary image is a stain or a character stroke. As a result, it is possible to remove only the dirt without mistakenly removing the character stroke, and it is stable against stains such as unerased characters that occur when characters written once with the eraser are erased. There is an effect that a character reading device can be realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による文字読取り装置の実施の形態の構
成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of a character reading device according to the present invention.

【図2】図1中の各部の動作を示すフローチャートであ
る。
FIG. 2 is a flowchart showing the operation of each unit in FIG.

【図3】図1中の二値化部311の動作を示すフローチ
ャートである。
FIG. 3 is a flowchart showing an operation of a binarizing unit 311 in FIG.

【図4】図1中の文字濃度判定部3113の動作を示す
フローチャートである。
FIG. 4 is a flowchart illustrating an operation of a character density determination unit 3113 in FIG. 1;

【図5】図1中の濃度ヒストグラム生成部3111で生
成される濃度ヒストグラムの例を示す図である。
FIG. 5 is a diagram illustrating an example of a density histogram generated by a density histogram generation unit 3111 in FIG. 1;

【図6】図1中のノイズ除去部312の動作を示すフロ
ーチャートである。
FIG. 6 is a flowchart showing an operation of a noise removing unit 312 in FIG.

【図7】図1中の汚れ判別部3121の動作を示すフロ
ーチャートである。
FIG. 7 is a flowchart showing an operation of a stain determination unit 3121 in FIG.

【図8】多値画像IMGの例を示す図である。FIG. 8 is a diagram illustrating an example of a multi-valued image IMG.

【図9】多値画像IMGを二値化した二値画像IMBの
例を示す図である。
FIG. 9 is a diagram illustrating an example of a binary image IMB obtained by binarizing a multi-value image IMG.

【図10】二値画像IMB上の連結黒画素BLK上の画
素から、その画素に対応する多値画像IMG上の画素の
画素値BK_Gを参照する処理を示す図である。
FIG. 10 is a diagram illustrating a process of referring to a pixel value BK_G of a pixel on the multi-value image IMG corresponding to the pixel from a pixel on the connected black pixel BLK on the binary image IMB.

【図11】図1中のノイズ除去部312によるノイズ除
去後の二値画像IMBの例を示す図である。
11 is a diagram illustrating an example of a binary image IMB after noise removal by a noise removal unit 312 in FIG. 1;

【図12】本発明による文字読取り装置の他の実施の形
態を示すブロック図である。
FIG. 12 is a block diagram showing another embodiment of the character reading device according to the present invention.

【符号の説明】[Explanation of symbols]

1 画像入力装置 2 記憶装置 21 画像記憶部 22 文字認識辞書部 3 データ処理部 31 前処理部 311 二値化部 3111 濃度ヒストグラム生成部 3112 二値化しきい値算出部 3113 文字濃度判定部 3114 汚れ判別しきい値算出部 3115 二値画像生成部 312 ノイズ除去部 3121 汚れ判別部 3122 連結黒画素除去部 32 特徴抽出部 33 文字認識部 4 出力装置 5 記録媒体 100,101 文字成分 102,103 汚れ成分 110,111,112,113 連結黒画素 Reference Signs List 1 image input device 2 storage device 21 image storage unit 22 character recognition dictionary unit 3 data processing unit 31 preprocessing unit 311 binarization unit 3111 density histogram generation unit 3112 binarization threshold calculation unit 3113 character density determination unit 3114 dirt discrimination Threshold calculator 3115 Binary image generator 312 Noise remover 3121 Stain determiner 3122 Concatenated black pixel remover 32 Feature extractor 33 Character recognizer 4 Output device 5 Recording medium 100, 101 Character component 102, 103 Dirt component 110 , 111,112,113 connected black pixel

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 帳票に記載された手書き文字を読取る文
字読取り装置であって、前記帳票に対して画像読取りを
行った多値画像上の文字についてその濃度の区分である
濃度区分を判定する文字濃度判定部と、前記多値画像内
の読取り対象である文字とその文字以外の汚れとを判別
するための汚れ判別しきい値を算出する汚れ判別しきい
値算出部と、前記多値画像を二値化した二値画像上の連
結黒画素が汚れか文字ストロークかを判別する汚れ判別
部とを含むことを特徴とする文字読取り装置。
1. A character reading apparatus for reading handwritten characters written on a form, wherein a character for determining a density category is determined for a character on a multi-valued image obtained by reading an image on the form. A density determination unit, a stain determination threshold value calculation unit that calculates a stain determination threshold value for determining a character to be read in the multi-valued image and a stain other than the character, A character reading device, comprising: a dirt determining unit that determines whether a connected black pixel on the binarized binary image is a dirt or a character stroke.
【請求項2】 前記汚れは、消しゴムで消した際に生じ
る消し残し等の汚れであることを特徴とする請求項1記
載の文字読取り装置。
2. The character reading device according to claim 1, wherein the stain is a stain such as an unerased part generated when the stain is erased with an eraser.
【請求項3】 前記汚れ判別部は、前記多値画像の画素
値に基づいて前記連結黒画素を汚れとして判別すること
を特徴とする請求項1又は2記載の文字読取り装置。
3. The character reading device according to claim 1, wherein the stain determining unit determines the connected black pixel as a stain based on a pixel value of the multi-valued image.
【請求項4】 帳票に記載された手書き文字を読取る文
字読取り方法であって、前記帳票に対して画像読取りを
行った多値画像上の文字についてその濃度の区分である
濃度区分を判定する文字濃度判定ステップと、前記多値
画像内の読取り対象である文字とその文字以外の汚れと
を判別するための汚れ判別しきい値を算出する汚れ判別
しきい値算出ステップと、前記多値画像を二値化した二
値画像上の連結黒画素が汚れか文字ストロークかを判別
する汚れ判別ステップとを含むことを特徴とする文字読
取り方法。
4. A character reading method for reading a handwritten character written on a form, wherein a character on a multi-valued image obtained by reading an image on the form determines a density classification which is a density classification. A density determination step; a dirt determination threshold value calculation step of calculating a dirt determination threshold value for determining a character to be read in the multi-valued image and a dirt other than the character; A stain determining step of determining whether a connected black pixel on the binarized binary image is a stain or a character stroke.
【請求項5】 前記汚れは、消しゴムで消した際に生じ
る消し残し等の汚れであることを特徴とする請求項4記
載の文字読取り方法。
5. The character reading method according to claim 4, wherein the stain is an unerasable stain or the like generated when the stain is erased with an eraser.
【請求項6】 前記汚れ判別ステップにおいては、前記
多値画像の画素値に基づいて前記連結黒画素を汚れとし
て判別することを特徴とする請求項4又は5記載の文字
読取り方法。
6. The character reading method according to claim 4, wherein in the dirt determining step, the connected black pixels are determined as dirt based on pixel values of the multi-valued image.
【請求項7】 コンピュータによって、帳票に記載され
た手書き文字を読取るための文字読取りプログラムを記
録した記録媒体であって、該プログラムは、コンピュー
タに、前記帳票に対して画像読取りを行った多値画像上
の文字についてその濃度の区分である濃度区分を判定す
る文字濃度判定ステップと、前記多値画像内の読取り対
象である文字とその文字以外の汚れとを判別するための
汚れ判別しきい値を算出する汚れ判別しきい値算出ステ
ップと、前記多値画像を二値化した二値画像上の連結黒
画素が汚れか文字ストロークかを判別する汚れ判別ステ
ップとを含むことを特徴とする記録媒体。
7. A recording medium on which a computer reads a character reading program for reading handwritten characters written on a form, the program comprising: A character density determining step of determining a density category which is a density category of a character on an image; and a stain determination threshold value for determining a character to be read in the multi-valued image and a stain other than the character. And a stain determining step of determining whether a connected black pixel on the binary image obtained by binarizing the multi-valued image is a stain or a character stroke. Medium.
【請求項8】 前記汚れは、消しゴムで消した際に生じ
る消し残し等の汚れであることを特徴とする請求項7記
載の記録媒体。
8. The recording medium according to claim 7, wherein the stain is an unerasable stain or the like generated when the stain is erased with an eraser.
【請求項9】 前記汚れ判別ステップにおいては、前記
多値画像の画素値に基づいて前記連結黒画素を汚れとし
て判別することを特徴とする請求項7又は8記載の記録
媒体。
9. The recording medium according to claim 7, wherein in the stain determination step, the connected black pixel is determined as stain based on a pixel value of the multi-valued image.
JP36360399A 1999-12-22 1999-12-22 Character reading device, reading method, and reading program recording medium Expired - Fee Related JP3721034B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36360399A JP3721034B2 (en) 1999-12-22 1999-12-22 Character reading device, reading method, and reading program recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36360399A JP3721034B2 (en) 1999-12-22 1999-12-22 Character reading device, reading method, and reading program recording medium

Publications (2)

Publication Number Publication Date
JP2001175809A true JP2001175809A (en) 2001-06-29
JP3721034B2 JP3721034B2 (en) 2005-11-30

Family

ID=18479724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36360399A Expired - Fee Related JP3721034B2 (en) 1999-12-22 1999-12-22 Character reading device, reading method, and reading program recording medium

Country Status (1)

Country Link
JP (1) JP3721034B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356389C (en) * 2002-12-26 2007-12-19 富士通株式会社 Video text processing apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100356389C (en) * 2002-12-26 2007-12-19 富士通株式会社 Video text processing apparatus

Also Published As

Publication number Publication date
JP3721034B2 (en) 2005-11-30

Similar Documents

Publication Publication Date Title
JP3904840B2 (en) Ruled line extraction device for extracting ruled lines from multi-valued images
US8417033B2 (en) Gradient based background segmentation and enhancement of images
CN101593276B (en) Video OCR image-text separation method and system
US20090202152A1 (en) Area extraction program, character recognition program, and character recognition device
JP2002298085A (en) Character recognition device, character recognition method, and record medium
KR20080095787A (en) Apparatus and method of determining similar image
US9076225B2 (en) Image processing device, an image processing method and a program to be used to implement the image processing
EP0877335B1 (en) Character recognition method, character recognition apparatus
CN100369051C (en) Grayscale character dictionary generation apparatus
JP2001175809A (en) Character reader, reading method, and reading program recording medium
JP2700131B2 (en) Pattern recognition method
JP2871590B2 (en) Image extraction method
JP2001291056A (en) Document picture recognizing device and recording medium
JPH10232926A (en) Image processor and its method
Radha et al. Threshold based segmentation using median filter for sign language recognition system
JP2894111B2 (en) Comprehensive judgment method of recognition result in optical type character recognition device
JP3209197B2 (en) Character recognition device and recording medium storing character recognition program
JP3095437B2 (en) Character line detection cutout device and character reading device
JPH1166240A (en) Method and device for character recognition
JP4995507B2 (en) Image processing system, character recognition system, and image processing program
JP2002279345A (en) Image processing device and method, and computer- readable storage medium with stored program
JP3687999B2 (en) Character recognition device
JP2674475B2 (en) Character reader
JPH10233930A (en) Image processor
Mahmor et al. Image Thresholding for Malay Ancient Manuscript (Terengganu Inscribed Stone)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050823

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050909

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080916

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080916

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees