JP2001291056A - Document picture recognizing device and recording medium - Google Patents

Document picture recognizing device and recording medium

Info

Publication number
JP2001291056A
JP2001291056A JP2000102968A JP2000102968A JP2001291056A JP 2001291056 A JP2001291056 A JP 2001291056A JP 2000102968 A JP2000102968 A JP 2000102968A JP 2000102968 A JP2000102968 A JP 2000102968A JP 2001291056 A JP2001291056 A JP 2001291056A
Authority
JP
Japan
Prior art keywords
image
binarization
area
character
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000102968A
Other languages
Japanese (ja)
Other versions
JP4409713B2 (en
Inventor
Masaki Hamaguchi
昌己 濱口
Katsuto Fujimoto
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000102968A priority Critical patent/JP4409713B2/en
Publication of JP2001291056A publication Critical patent/JP2001291056A/en
Application granted granted Critical
Publication of JP4409713B2 publication Critical patent/JP4409713B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To properly and quickly binarize a character picture and the other picture area whose characteristics are different from an inputted multi-level picture. SOLUTION: In this document picture recognizing device equipped with a picture binarizing means 10a for preparing a binary picture from an input multi- level picture 1 and a picture recognizing means 14a for recognizing the prepared binary picture, the picture binarizing means 10a separates an input multi-level picture 1 into a character picture area and a background picture area, and binarizes each separated character picture area, and decides the binarization threshold of the background picture area from the binarization threshold at the time of the binarization processing, and binarizes the background picture area.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、スキャナやデジタ
ルカメラ等で取り込んだ多値画像から、文字を認識する
文書画像認識装置及び記録媒体に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a document image recognition apparatus and a recording medium for recognizing characters from a multi-valued image captured by a scanner, a digital camera, or the like.

【0002】[0002]

【従来の技術】画像の特徴を解析するとき、多値画像か
ら対象図形と背景を分離した2値画像を作成して取り扱
うことが多い。画像の2値化は、多値画像の階調値がし
きい値以下のときは黒とし、しきい値を超えるときは白
とするしきい値処理によって行われる。通常、2値画像
の黒の部分は対象図形を、白の部分は背景を表してい
る。
2. Description of the Related Art When analyzing features of an image, a binary image in which a target graphic and a background are separated from a multi-valued image is often created and handled. The binarization of the image is performed by a threshold value process in which when the gradation value of the multi-valued image is equal to or smaller than the threshold value, the image is set to black, and when it exceeds the threshold value, it is set to white. Usually, the black part of the binary image represents the target figure, and the white part represents the background.

【0003】しきい値を決める手法には、与えられた多
値画像の階調ヒストグラムを求めた結果、2つのピーク
をもつ分布になる場合、この2つの山の間の谷をしきい
値とするモード法や、階調ヒストグラムにおいて、階調
値の集合をしきい値tで2つのクラス(t以上とt未
満)に分割したと仮定したとき、2つのクラス間の分離
(分散値)が最も良くなるようにパラメータ(しきい値
t)を決める(文献:電子情報通信学会論文誌80/4
Vol.J63−D No.4,p.349−356参
照)、判別分析における判別基準を用いた2値化処理な
どがある。
[0003] As a method of determining a threshold value, when a distribution having two peaks is obtained as a result of obtaining a gradation histogram of a given multi-valued image, a valley between these two peaks is defined as a threshold value. Assuming that a set of tone values is divided into two classes (more than t and less than t) by a threshold value t in a mode method or a tone histogram, the separation (variance value) between the two classes is Determine the parameter (threshold value t) to be the best (literature: IEICE Transactions on Electronics 80/4
Vol. J63-D No. 4, p. 349-356), and binarization processing using a discriminant criterion in discriminant analysis.

【0004】文書画像認識装置では、このような2値化
処理によって作成された2値画像を認識用画像として扱
い、文字の抽出(コード化)が行われていた。
In a document image recognition apparatus, a binary image created by such a binarization process is treated as a recognition image, and characters are extracted (coded).

【0005】[0005]

【発明が解決しようとする課題】前記従来のものには、
次のような課題があった。
SUMMARY OF THE INVENTION
There were the following issues.

【0006】従来の2値化処理では、抽出対象である文
字画像の背景に色が付いている場合、読み取られた文字
画像と背景色の濃度が近くなるため、適切なしきい値を
求めることが困難となり、作成された2値画像において
背景領域の一部が文字画像と共に黒画素として表される
ことがあった。このような2値画像を用いて文字認識を
行うと認識精度が低くなるといった問題が発生してい
た。また、このような2値画像は、見やすさといった点
から、表示用の画像としては適さないといった問題があ
った。
In the conventional binarization process, if the background of a character image to be extracted has a color, the density of the read character image and the background color are close to each other. It became difficult, and a part of the background area was sometimes represented as a black pixel together with the character image in the created binary image. When character recognition is performed using such a binary image, there has been a problem that recognition accuracy is reduced. In addition, such a binary image has a problem that it is not suitable as an image for display from the point of viewability.

【0007】本発明は、このような従来の課題を解決
し、入力された多値画像から文字画像とそれ以外の性質
の異なる画像領域を適切に、かつ高速に2値化すること
を目的とする。
An object of the present invention is to solve such a conventional problem and appropriately and rapidly binarize a character image and other image regions having different properties from an input multi-valued image. I do.

【0008】[0008]

【課題を解決するための手段】図1は本発明の原理説明
図である。図1中、1は入力多値画像、10aは画像2
値化手段、14aは画像認識手段である。
FIG. 1 is a diagram illustrating the principle of the present invention. In FIG. 1, 1 is an input multi-value image, 10a is an image 2
The value conversion means 14a is an image recognition means.

【0009】本発明は前記従来の課題を解決するため次
のように構成した。
The present invention is configured as follows in order to solve the above-mentioned conventional problems.

【0010】(1):入力多値画像1から2値画像を作
成する画像2値化手段10aと、該作成した2値画像の
認識を行う画像認識手段14aとを備えた文書画像認識
装置において、前記画像2値化手段10aは、前記入力
多値画像1を文字画像領域と背景画像領域とに分離し、
該分離した各文字画像領域に対して2値化処理を行い、
該2値化処理時の2値化しきい値から前記背景画像領域
の2値化しきい値を決定して前記背景画像領域の2値化
処理を行う。
(1): A document image recognition apparatus provided with an image binarizing means 10a for creating a binary image from an input multi-valued image 1 and an image recognizing means 14a for recognizing the created binary image. The image binarizing means 10a separates the input multi-valued image 1 into a character image area and a background image area,
Performing a binarization process on each of the separated character image regions;
The binarization threshold of the background image area is determined from the binarization threshold at the time of the binarization processing, and the binarization processing of the background image area is performed.

【0011】(2):前記(1)の文書画像認識装置に
おいて、前記画像2値化手段10aは、前記入力多値画
像1に含まれる低階調の代表値を選んで2値化処理を行
い、該作成された2値画像から文字画像を多く含む文字
画像領域とそれ以外の背景画像領域とに分離する。
(2): In the document image recognition device of (1), the image binarizing means 10a selects a low gradation representative value included in the input multi-valued image 1 and performs a binarizing process. Then, the generated binary image is separated into a character image region including many character images and a background image region other than the character image region.

【0012】(3):前記(1)の文書画像認識装置に
おいて、前記画像2値化手段10aは、前記分離した文
字画像領域内が全て文字画像の単一階調である場合、該
単一階調の文字画像領域に背景画像が含まれるように該
文字画像領域を変更して、2値化処理を行う。
(3) In the document image recognition apparatus of (1), the image binarizing means 10a is configured to determine whether the separated character image area has a single gradation when the entire character image area has a single gradation. The character image area is changed so that the background image is included in the gradation character image area, and the binarization process is performed.

【0013】(4):前記(1)の文書画像認識装置に
おいて、前記画像2値化手段10aは、前記分離した各
文字画像領域に対して行った2値化処理時の各2値化し
きい値を求め、前記2値化処理された領域を含むように
拡大した矩形内の領域を前記求めた2値化しきい値で2
値化処理する。
(4) In the document image recognition apparatus of (1), the image binarizing means 10a performs each binarization threshold in the binarization processing performed on each of the separated character image areas. The area within the rectangle enlarged to include the binarized area is calculated by the obtained binarization threshold value.
Perform value processing.

【0014】(5):入力多値画像を文字画像領域と背
景画像領域とに分離し、該分離した各文字画像領域に対
して2値化処理を行い、該2値化処理時の2値化しきい
値から前記背景画像領域の2値化しきい値を決定して前
記背景画像領域の2値化処理を行う画像2値化手段10
aと、該2値化処理で作成した2値画像の認識を行う画
像認識手段14aと、してコンピュータを機能させるた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体とする。
(5): The input multi-valued image is separated into a character image region and a background image region, and a binarization process is performed on each of the separated character image regions. Image binarizing means 10 for determining a binarization threshold value of the background image region from a binarization threshold value and performing binarization processing of the background image region
a, and an image recognizing unit 14a for recognizing the binary image created by the binarization process, and a computer-readable recording medium storing a program for causing a computer to function.

【0015】(作用)前記構成に基づく作用を説明す
る。
(Operation) The operation based on the above configuration will be described.

【0016】画像2値化手段10aで入力多値画像1か
ら2値画像を作成し、画像認識手段14aで作成した2
値画像の認識を行う文書画像認識装置において、前記画
像2値化手段10aで、前記入力多値画像1を文字画像
領域と背景画像領域とに分離し、該分離した各文字画像
領域に対して2値化処理を行い、該2値化処理時の2値
化しきい値から前記背景画像領域の2値化しきい値を決
定して前記背景画像領域の2値化処理を行う。このた
め、文字画像の背景に色が付いている画像であっても高
精度に2値化でき、かつ一定しきい値で2値化処理を行
うため高速に2値化することができる。
A binary image is created from the input multivalued image 1 by the image binarizing means 10a, and the binary image created by the image recognizing means 14a.
In a document image recognition apparatus for recognizing a value image, the input multi-valued image 1 is separated into a character image region and a background image region by the image binarizing means 10a. A binarization process is performed, and a binarization threshold of the background image region is determined from the binarization threshold value at the time of the binarization process, and the binarization process of the background image region is performed. For this reason, even if the image of the character image has a color on the background, the image can be binarized with high accuracy, and the binarization can be performed at a high speed because the binarization process is performed with a fixed threshold value.

【0017】また、前記画像2値化手段10aで、前記
入力多値画像1に含まれる低階調の代表値を選んで2値
化処理を行い、該作成された2値画像から文字画像を多
く含む文字画像領域とそれ以外の背景画像領域とに分離
する。このため、低階調である黒い部分のみ2値化し
て、容易に文字画像領域を分離することができる。
Further, the image binarizing means 10a selects a low gradation representative value included in the input multi-valued image 1 and performs a binarizing process, and converts a character image from the created binary image. It is separated into a character image area including many and a background image area other than that. For this reason, it is possible to binarize only a black portion having a low gradation and easily separate a character image region.

【0018】さらに、前記画像2値化手段10aで、前
記分離した文字画像領域内が全て文字画像の単一階調で
ある場合、該単一階調の文字画像領域に背景画像が含ま
れるように該文字画像領域を変更して、2値化処理を行
う。このため、文字画像領域内が全て文字画像の場合で
も、文字画像が細く出力されることを防止し、適切な2
値化を行うことができる。
Further, in the image binarizing means 10a, when the separated character image area has a single gradation of the character image, the background image is included in the single gradation character image area. Then, the character image area is changed and the binarization process is performed. For this reason, even when the entire character image area is a character image, it is possible to prevent the character image from being output thinly,
Value conversion can be performed.

【0019】また、前記画像2値化手段10aで、前記
分離した各文字画像領域に対して行った2値化処理時の
各2値化しきい値を求め、前記2値化処理された領域を
含むように拡大した矩形内の領域を前記求めた2値化し
きい値で2値化処理する。このため、文字画像領域とし
て、抽出されなかった文字画像部分を適切に2値化処理
することができる。
The image binarizing means 10a obtains each binarization threshold value at the time of the binarization process performed on each of the separated character image regions, and determines the binarized region. The area within the rectangle enlarged so as to be included is subjected to binarization processing using the obtained binarization threshold. For this reason, a character image portion that has not been extracted can be appropriately binarized as a character image region.

【0020】さらに、入力多値画像を文字画像領域と背
景画像領域とに分離し、該分離した各文字画像領域に対
して2値化処理を行い、該2値化処理時の2値化しきい
値から前記背景画像領域の2値化しきい値を決定して前
記背景画像領域の2値化処理を行う画像2値化手段10
aと、該2値化処理で作成した2値画像の認識を行う画
像認識手段14aと、してコンピュータを機能させるた
めのプログラムを記録したコンピュータ読み取り可能な
記録媒体とする。このため、この記録媒体のプログラム
をコンピュータにインストールすることで、文字画像の
背景に色が付いている画像であっても高精度に2値化で
き、かつ高速に2値化することができる文書画像認識装
置を容易に提供することができる。
Further, the input multi-valued image is separated into a character image region and a background image region, and each of the separated character image regions is subjected to a binarization process, and a binarization threshold in the binarization process. Image binarization means 10 for determining a binarization threshold value of the background image area from the value and performing a binarization process of the background image area
a, and an image recognizing unit 14a for recognizing the binary image created by the binarization process, and a computer-readable recording medium storing a program for causing a computer to function. Therefore, by installing the program on the recording medium into a computer, a document that can be binarized with high precision and at high speed even if the image has a character image with a colored background. An image recognition device can be easily provided.

【0021】[0021]

【発明の実施の形態】本発明の文書画像認識装置は、入
力多値画像から文字画像を多く含む画像領域とそれ以外
の画像領域に分離し、該分離された2種類の画像領域に
対して異なる画像処理を行い、高速に2値画像を作成す
る2値化処理手段を備えるものである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A document image recognition apparatus according to the present invention separates an input multi-valued image into an image area containing many character images and an image area other than the image area. It is provided with a binarization processing means for performing different image processing and creating a binary image at high speed.

【0022】また、入力多値画像の文字画像に含まれる
低階調(黒)の代表値を選んで2値化処理を行い、該作
成された2値画像から文字画像に含まれる画素を抽出
し、文字画像を多く含む画像領域とそれ以外の背景画像
領域を分離する2値画像領域分離手段を備えるものであ
る。
Also, a low gradation (black) representative value included in the character image of the input multi-valued image is selected and binarized, and pixels included in the character image are extracted from the generated binary image. And a binary image area separating means for separating an image area containing many character images from other background image areas.

【0023】さらに、前記2値画像領域分離手段により
求められた文字画像を多く含む画像領域に対して個々に
判別分析における判別基準を用いた2値化処理を行い、
2値画像を作成する文字画像領域2値化手段と、該文字
画像領域2値化手段で求められた文字画像領域の分散値
から、その文字画像領域内が単一階調であることを判断
する単一階調画像領域判別手段と、該単一階調画像領域
判別手段により単一階調と判断された文字画像領域に、
背景画像が含まれるように文字画像領域を膨張し、再度
判別分析における判別基準を用いた2値化処理を行う単
一階調画像領域2値化手段とを備えるものである。
Further, a binarization process using a discrimination criterion in discriminant analysis is individually performed on an image region containing a large number of character images obtained by the binary image region separating means,
From the character image area binarizing means for creating a binary image and the variance of the character image area obtained by the character image area binarizing means, it is determined that the inside of the character image area has a single gradation. A single tone image area determining means, and a character image area determined to be a single tone by the single tone image area determining means,
A single-tone image area binarizing means for expanding a character image area so as to include a background image and performing binarization processing again using a criterion in the discriminant analysis.

【0024】また、前記文字画像領域2値化手段により
求められた個々の文字画像領域のしきい値から最適なし
きい値を求め、前記文字画像領域2値化手段により2値
化処理された領域を含むn×m矩形内の背景画像領域を
2値化することで、文字画像領域に含まれなかった文字
画像部分を2値化処理する背景画像領域2値化手段を備
えるものである。
Further, an optimum threshold value is obtained from the threshold values of the individual character image areas obtained by the character image area binarizing means, and the binarized area is obtained by the character image area binarizing means. The background image area is binarized by binarizing the background image area in the n × m rectangle including the character image area, thereby performing a binarization process on a character image portion not included in the character image area.

【0025】このような手段を備えることにより、入力
された多値画像から文字画像とそれ以外の性質の異なる
画像領域とに分離された2値画像が作成されるため、従
来技術で問題になっていた背景色のある文字画像の適切
な2値化を行うことができる。
By providing such means, a binary image separated from a character image and an image region having other properties from an input multi-valued image is created, which is a problem in the prior art. Suitable binarization of a character image having a background color can be performed.

【0026】以下、図面を参照して本発明の実施の形態
を説明する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.

【0027】(1):文書画像認識装置の構成の説明 図2は本発明の実施の形態における文書画像認識装置の
構成の説明図である。図2において、文書画像認識装置
には、多値画像2値化部10と2値画像認識部14が設
けてある。また、多値画像2値化部10には、文字画像
領域検出部11、文字画像領域2値化部12、背景画像
領域2値化部13が設けてある。
(1) Description of the Configuration of the Document Image Recognition Apparatus FIG. 2 is an explanatory diagram of the configuration of the document image recognition apparatus according to the embodiment of the present invention. In FIG. 2, the document image recognition apparatus includes a multi-value image binarization unit 10 and a binary image recognition unit 14. The multi-value image binarizing unit 10 includes a character image region detecting unit 11, a character image region binarizing unit 12, and a background image region binarizing unit 13.

【0028】この文書画像認識装置は、多値画像(グレ
ースケールイメージ)を入力とし、多値画像2値化部1
0で各画素を文字画像領域と背景画像領域のいずれかを
意味する値を持つ2値画像に変換するものである。
This document image recognition device receives a multi-valued image (gray scale image) as an input,
At 0, each pixel is converted into a binary image having a value meaning either the character image area or the background image area.

【0029】文字画像領域検出部11は、グレースケー
ルイメージ全体に代表的なしきい値で2値化処理を実行
し、文字画像を多く含む領域を決定するものである。文
字画像領域2値化部12は、文字画像を多く含む領域に
ついて個々に2値化処理を実行するものである。背景画
像領域2値化部13は、文字画像領域のしきい値を基に
背景画像領域の2値化処理を実行し、最終的な2値画像
を出力するものである。2値画像認識部14は、多値画
像2値化部10で作成した2値画像から文字を認識し、
認識結果を出力するものである。
The character image area detecting section 11 executes a binarization process on the entire gray scale image with a typical threshold value to determine an area containing a large number of character images. The character image area binarizing unit 12 individually performs a binarization process on an area including many character images. The background image area binarization unit 13 performs a binarization process on the background image area based on the threshold value of the character image area, and outputs a final binary image. The binary image recognizing unit 14 recognizes a character from the binary image created by the multi-value image binarizing unit 10,
It outputs the recognition result.

【0030】(2):多値画像2値化部の文字画像領域
検出部の説明 図3は文字画像領域検出部の処理の説明図である。図3
において、文字画像領域検出部11の処理は、先ず一定
しきい値2値化処理S1を行い、次にラベリング処理S
2を行い、最後に有効セグメント領域抽出処理(文字画
像領域検出)S3を行うものである(2値画像領域分離
手段)。
(2) Description of Character Image Area Detecting Section of Multivalued Image Binarizing Section FIG. 3 is an explanatory diagram of processing of the character image area detecting section. FIG.
In the processing of the character image area detecting section 11, first, a constant threshold value binarization processing S1 is performed, and then a labeling processing S1 is performed.
2, and finally, an effective segment area extraction process (character image area detection) S3 is performed (binary image area separation means).

【0031】一定しきい値2値化処理S1では、入力グ
レースケールイメージに対して、一定しきい値で2値化
を行う。このときのしきい値は、文字画像の中でもより
黒い部分のみが2値化される階調を選ぶ。
In the constant threshold binarization process S1, binarization is performed on the input gray scale image with a constant threshold. As the threshold value at this time, a gradation is selected at which only the darker part in the character image is binarized.

【0032】ラベリング処理S2では、前記一定しきい
値2値化処理S1で得られた2値画像の連結成分の集合
をラベリング処理により抽出する。
In the labeling process S2, a set of connected components of the binary image obtained in the constant threshold binarization process S1 is extracted by a labeling process.

【0033】有効セグメント領域抽出処理(文字画像領
域検出)S3では、文字画像に適さないサイズの連結部
分を排除する(サイズにより罫線や1ドットのゴミ等を
除く)ことで、有効なセグメントを選び、その選んだセ
グメントの外接矩形をとり、文字画像領域とする。
In the effective segment area extraction processing (character image area detection) S3, an effective segment is selected by eliminating connected portions of a size unsuitable for a character image (excluding ruled lines and 1-dot dust depending on the size). Then, a circumscribed rectangle of the selected segment is taken as a character image area.

【0034】(具体的イメージによる説明)図4は2値
画像領域分離手段のイメージによる説明図であり、図4
(a)は入力グレースケールイメージである。図4
(a)において、文字画像は、薄い黒い部分(灰色部
分)a1、b1とより黒い部分a2、b2とから成り、
背景は白い部分である。
FIG. 4 is an explanatory diagram based on an image of the binary image area separating means.
(A) is an input grayscale image. FIG.
In (a), the character image is composed of light black parts (gray parts) a1, b1 and darker parts a2, b2,
The background is the white part.

【0035】図4(b)は一定しきい値2値化処理S1
の処理結果である。図4(b)において、一定しきい値
2値化処理S1の処理で、一定しきい値で2値化処理し
て文字画像中のより黒い部分a2、b2のみを2値化
し、ラベリング処理S2、文字画像領域検出S3を行っ
て、より黒い部分a2、b2の外接矩形(点線で示して
ある)を抽出する。
FIG. 4B shows a constant threshold value binarization process S1.
Is the processing result. In FIG. 4B, in the process of the constant threshold value binarization process S1, only the darker portions a2 and b2 in the character image are binarized by the constant threshold value, and the labeling process S2 is performed. Then, the character image area detection S3 is performed to extract a circumscribed rectangle (shown by a dotted line) of the darker portions a2 and b2.

【0036】図4(c)は背景領域と文字画像領域に分
離したグレースケールイメージの説明である。図4
(c)において、図4(b)の外接矩形座標をグレース
ケールイメージ(図4(a)参照))に適応して、背景
領域を含んだ文字画像領域(点線内)と、他の背景領域
(点線外)とに分離する。
FIG. 4C illustrates a gray scale image separated into a background area and a character image area. FIG.
In (c), the circumscribed rectangular coordinates of FIG. 4 (b) are adapted to a grayscale image (see FIG. 4 (a)), and a character image area including a background area (within a dotted line) and another background area (Outside the dotted line).

【0037】このように外接矩形を取るのは、文字画像
中のより黒い部分以外の文字画像領域と背景画像領域を
部分2値化領域に含ませるためである。本実施の形態の
2値化処理で使用している、判別分析における判別基準
を用いた2値化処理では、抽出対象階調画像(文字画
像)と非抽出対象画像(背景画像)を含む領域にするこ
とで、最適な2値化が行われるからである。
The reason why the circumscribed rectangle is obtained in this way is to include the character image area and the background image area other than the blacker part in the character image in the partial binarized area. In the binarization processing using the discriminant criterion in the discriminant analysis used in the binarization processing of the present embodiment, an area including an extraction target gradation image (character image) and a non-extraction target image (background image) By doing so, the optimal binarization is performed.

【0038】また、文字画像領域を決める従来の方法と
して、文字画像全体のエッジを抽出する(画素間の階調
の変化量を計算する)ようなソーベルフィルタ処理が用
いられることがある。これに対し、本発明では、一定し
きい値2値化処理を用いることで計算量を減らし、より
高速な文字画像領域の検出を行っている。
As a conventional method for determining a character image area, a Sobel filter process for extracting edges of the entire character image (calculating a change in gradation between pixels) may be used. On the other hand, in the present invention, the amount of calculation is reduced by using the constant threshold value binarization processing, and the character image area is detected at higher speed.

【0039】(3):多値画像2値化部の文字画像領域
2値化部の説明 文字画像領域2値化部12では、文字画像領域検出部1
1で決定した文字画像を多く含む領域(外接矩形の文字
画像領域)について、領域毎に判別分析における判別基
準を用いた2値化処理を行うものである。
(3): Explanation of the character image area binarization section of the multi-value image binarization section In the character image area binarization section 12, the character image area detection section 1
The binarization process is performed on a region including a large number of character images determined in step 1 (character image region of a circumscribed rectangle) using a discrimination criterion in discriminant analysis for each region.

【0040】図5は文字画像領域2値化部の説明図であ
り、図5(a)は文字画像領域2値化部の処理の説明で
ある。図5(a)において、文字画像領域2値化部12
の処理は、先ず文字画像領域の2値化しきい値・分散値
算出処理S11を行い、次に文字画像領域に背景が含ま
れているかを領域内分散値により判定S12を行う。こ
の判定で、文字画像領域に背景が含まれている場合は文
字画像領域内の2値化処理S13を行い、もし背景が含
まれていない場合は文字画像領域膨張処理S14を行い
再度文字画像領域の2値化しきい値・分散値算出処理S
11に戻る。
FIG. 5 is an explanatory diagram of the character image area binarizing section, and FIG. 5A is an explanatory diagram of the processing of the character image area binarizing section. In FIG. 5A, the character image area binarization unit 12
First, the binarization threshold value / variance value calculation processing S11 of the character image area is performed, and then the determination S12 is performed based on the variance value in the area to determine whether the background is included in the character image area. In this determination, if the background is included in the character image area, the binarization processing S13 in the character image area is performed. If the background is not included, the character image area expansion processing S14 is performed and the character image area is re-executed. Thresholding / variance calculating process S
Return to 11.

【0041】・この文字画像領域の2値化しきい値・分
散値算出処理S11では、先ず各文字画像領域につい
て、判別分析における判別基準を用いた2値化しきい値
の算出とクラス内分散値の算出処理が行われる。
In the character image area binarization threshold value / variance calculation processing S11, first, for each character image area, the binarization threshold value is calculated using the criterion in the discriminant analysis, and the in-class variance value is calculated. Calculation processing is performed.

【0042】(2値化しきい値とクラス内分散値の算出
方法の説明)以下、2値化しきい値とクラス内分散値の
算出方法を説明する。図5(b)は階調ヒストグラムの
説明である。図5(b)において、横軸は階調、縦軸は
画素数を示している。なお、階調は左から右方向に黒か
ら白に変化するものである。
(Description of Calculation Method of Binarization Threshold and Intra-Class Variance Value) Hereinafter, a method of calculating the binarization threshold value and the in-class variance value will be described. FIG. 5B is an explanation of the gradation histogram. In FIG. 5B, the horizontal axis represents the gradation, and the vertical axis represents the number of pixels. Note that the gradation changes from black to white from left to right.

【0043】与えられた領域のしきい値をtとして、t
以上の階調を持つ画素と、それより小さな値を持つ画素
の2つのグループに分ける。この2つのグループをクラ
ス1、クラス2とする。クラス1の画素数をω1(t)、ク
ラス1の平均階調をM1(t)、クラス2の画素数をω
2(t)、クラス2の平均階調をM2(t)とおき、全画素の平
均階調をMT とおくと、クラス間分散σB2 は次の式で
与えられる。
Assuming that the threshold value of a given region is t, t
Pixels having the above-mentioned gradation and pixels having smaller values are divided into two groups. These two groups are referred to as class 1 and class 2. The number of pixels of class 1 is ω 1 (t), the average gradation of class 1 is M 1 (t), and the number of pixels of class 2 is ω
2 (t), the average gradation of class 2 is M 2 (t), and the average gradation of all pixels is M T , the inter-class variance σB 2 is given by the following equation.

【0044】σB2 =ω1(M1 −MT )2+ω2(M2 −M
T )2=ω1 ω2(M1 −M2)2 ここで、tを変化させてクラス間分散σB2 を最大にす
るtの値を求め、その領域内の2値化しきい値とする。
ΣB 2 = ω 1 (M 1 −M T ) 2 + ω 2 (M 2 −M
T ) 2 = ω 1 ω 2 (M 1 −M 2 ) 2 Here, the value of t that maximizes the inter-class variance σB 2 by changing t is determined, and is set as a binarization threshold value in the region. .

【0045】(文字画像領域に背景が含まれているかの
判定の説明) ・次に文字画像領域に背景が含まれているかを領域内分
散値による判定S12を行う(単一階調画像領域判別手
段)。これは、文字画像領域内がすべて文字画像で背景
画像を含まない場合、上記の判別分析における判別基準
を用いた2値化しきい値の算出方法では、微小な階調差
を感知してしきい値を求めてしまうため、そのしきい値
で正しく2値化できずに文字画像が細く出力されるとい
った現象が起きる。
(Explanation of Judgment of Whether Background is Included in Character Image Area) Next, judgment S12 is performed based on the variance value within the area to determine whether the background is included in the character image area (single gradation image area determination). means). This is because when the entire character image area does not include a background image as a character image, the above-described method of calculating the binarization threshold using the criterion in the discriminant analysis senses a small gradation difference. Since the value is obtained, a phenomenon occurs in which the character image cannot be correctly binarized at the threshold value and the character image is output thinly.

【0046】図6は判別分析における判別基準を用いた
2値化処理例の説明図であり、図6(a)は領域内がす
べて文字画像で背景画像を含まない例の説明である。図
6(a)において、文字画像領域内がすべて文字画像
で、a1の階調の画素とa2の階調の画素よりなり、文
字画像領域内の画素がすべて2値化対象の階調となって
いる。この場合、その領域内で2値化しきい値を求めて
しまうため、図6(a)の右図のように文字画像が細く
出力される(a2の階調の画素のみ出力される)ことに
なる。このため、判別分析における判別基準を用いた2
値化処理では正しく2値化できないことになる。
FIG. 6 is a diagram illustrating an example of a binarization process using a discriminant criterion in discriminant analysis. FIG. 6A is a diagram illustrating an example in which the entire area is a character image and does not include a background image. In FIG. 6A, the entire character image area is a character image, and is composed of pixels of a1 gradation and pixels of a2 gradation, and all the pixels in the character image area are binarization target gradations. ing. In this case, since the binarization threshold value is obtained in the area, the character image is output thinly (only the pixels of the gradation of a2 are output) as shown in the right diagram of FIG. Become. For this reason, 2 using the discriminant criterion in discriminant analysis
In the binarization processing, binarization cannot be correctly performed.

【0047】・文字画像領域内がすべて文字画像で背景
画像を含まない場合、このような領域のクラス間分散値
は、背景を含む領域に比べ小さい値を取ることから判断
できる。このため、クラス間分散しきい値を定め、その
しきい値以下の領域に対しては、周囲の背景を取り込む
ように領域膨張を行い(文字画像領域膨張処理S1
4)、該膨張した新たな領域について2値化しきい値と
クラス間分散値の算出を再度行う。
When the entire character image area is a character image and does not include a background image, it can be determined from the fact that the inter-class variance of such an area takes a smaller value than that of the area including the background. For this reason, the inter-class variance threshold value is determined, and for an area equal to or less than the threshold value, area expansion is performed to capture the surrounding background (character image area expansion processing S1).
4) The binarization threshold and the inter-class variance are calculated again for the expanded new area.

【0048】図6(b)は単一階調画像領域2値化手段
の説明である。図6(b)において、図6(b)の左の
ように、文字画像領域内のすべての画素(a1の階調の
画素とa2の階調の画素)が2値化対象の階調となって
いる場合、図6(b)の中央のように、領域を広げて
(膨張して)背景画像(白い部分)を取り込む。次に、
広げた領域について、再度、判別分析における判別基準
を用いた2値化しきい値とクラス間分散値の算出を行
う。
FIG. 6B is an illustration of the single-tone image area binarizing means. In FIG. 6B, as shown on the left side of FIG. 6B, all the pixels in the character image area (the pixel of the gray scale of a1 and the pixel of the gray scale of a2) correspond to the gray scale to be binarized. If so, the background image (white portion) is captured by expanding (expanding) the area as shown in the center of FIG. 6B. next,
For the expanded area, the binarization threshold and the inter-class variance are calculated again using the criterion in the discriminant analysis.

【0049】・クラス間分散がクラス間分散しきい値よ
り大きく、文字画像領域内に背景画像が含まれると判断
した領域については、求めた2値化しきい値により、2
値画像を作成する(文字画像領域2値化手段)。
For an area where the inter-class variance is larger than the inter-class variance threshold and the background image is determined to be included in the character image area, the obtained binarization threshold
A value image is created (character image area binarization means).

【0050】図6(c)は領域内に文字画像と背景画像
が含まれると判断した領域の例の説明である。図6
(c)において、左図のように文字画像領域内に背景
(白い部分)が含まれている場合は、判別分析における
判別基準を用いた2値化処理で適切なしきい値が求ま
り、右図のように適切な2値化処理が行われる。
FIG. 6C is an explanation of an example of an area determined to include a character image and a background image in the area. FIG.
In (c), if the background (white portion) is included in the character image area as shown in the left diagram, an appropriate threshold value is obtained by binarization processing using the discrimination standard in discriminant analysis. An appropriate binarization process is performed as shown in FIG.

【0051】以上の処理を文字画像領域検出部11で決
定した全ての文字画像領域に対して行うことで、文字画
像の2値化が行われる。
By performing the above processing on all the character image areas determined by the character image area detection unit 11, the character image is binarized.

【0052】(4):背景画像領域2値化部の説明 前記(3)では文字画像領域検出部11で検出した領域
について2値化処理を行った。しかし、この領域は、文
字画像の中でもより黒い部分の外接矩形であるため、こ
の領域外にも文字画像が含まれている可能性がある。し
たがって、背景画像領域2値化部13では、背景画像領
域について2値化を行い、この領域に含まれる文字画像
の抽出を行う。
(4) Description of Background Image Area Binarization Unit In (3), the area detected by the character image area detection unit 11 was subjected to binarization processing. However, since this area is a circumscribed rectangle of a darker portion in the character image, the character image may be included outside this area. Therefore, the background image area binarization unit 13 binarizes the background image area and extracts a character image included in this area.

【0053】図7は背景画像領域2値化部の処理の説明
図である。図7において、先ず、文字画像領域2値化し
きい値を用いて背景画像領域の2値化しきい値を算出す
る(S21)。次に、該算出した2値化しきい値を用い
て背景画像領域の2値化処理を行う(S22)。
FIG. 7 is an explanatory diagram of the processing of the background image area binarization unit. In FIG. 7, first, the binarization threshold value of the background image area is calculated using the binarization threshold value of the character image area (S21). Next, a binarization process is performed on the background image area using the calculated binarization threshold (S22).

【0054】(背景画像領域の2値化例の説明) a:文字画像領域2値化しきい値から代表例を選ぶ方法
(第1の方法) 第1の方法として、文字画像領域検出部11で求めた各
領域のしきい値(記憶装置等に記憶しておく)から代表
値を選び、背景画像領域全面に適応する方法である。例
えば、各領域のしきい値から最も低い(黒い)階調を背
景画像領域のしきい値とする。このしきい値が文字画像
領域検出部11で用いた一定しきい値の階調より高い
(白い)場合、本来掠れるはずであった背景画像領域中
の文字画像が2値化されるため、より文字らしくなる。
なお、しきい値の選び方として、各領域のしきい値の平
均、又は、最も高い(白い)階調を用いることもでき
る。
(Description of Binarization Example of Background Image Area) a: Method of Selecting a Representative Example from Character Image Area Binarization Threshold (First Method) As a first method, the character image area detection unit 11 In this method, a representative value is selected from the obtained threshold values (stored in a storage device or the like) of each area, and is applied to the entire background image area. For example, the lowest (black) gradation from the threshold value of each area is set as the threshold value of the background image area. If this threshold value is higher (white) than the fixed threshold gradation used in the character image area detection unit 11, the character image in the background image area that should have been blurred is binarized. It becomes more character-like.
As a method of selecting the threshold value, an average of the threshold values of the respective regions or the highest (white) gradation can be used.

【0055】図8は背景画像領域2値化の例1の説明図
である。図8において、先ず、上図ののように、2値
画像領域分離手段を用いて、文字画像領域(点線内の領
域1、領域2)を求める。次に、中図ののように、各
文字画像領域内を文字画像領域2値化手段、及び単一階
調画像領域2値化手段を用いて2値化する。この時、領
域1内の2値化しきい値をt1 、領域2内の2値化しき
い値をt2 とする(t 1 >t2 )。最後に、下図のの
ように、文字画像領域内の2値化しきい値のうち最も階
調が低いt2 で背景画像領域の2値化を行い、文字画像
部分の抽出を行う。
FIG. 8 is an explanatory view of Example 1 of the binarization of the background image area.
It is. In FIG. 8, first, as shown in the above figure,
The character image area (the area within the dotted line) is
The area 1 and the area 2) are obtained. Next, as shown in the middle figure,
A character image area binarizing means in the character image area, and a single floor
Binarization is performed using a tonal image area binarization unit. At this time,
Let the binarization threshold in region 1 be t1, Binarize in area 2
TTwo(T 1> TTwo). Finally, in the figure below
As described above, of the binarization thresholds in the character image area,
Low toneTwoPerforms binarization of the background image area with
Extract the part.

【0056】b:文字画像領域2値化部で求めた各領域
のしきい値をその領域の周囲の背景画像領域に適応させ
る方法(第2の方法) 第2の方法として、文字画像領域2値化部で求めた各領
域のしきい値をその領域の周囲の背景画像領域に適応さ
せる方法である。この方法では、狭い領域で求めた2値
化しきい値がその周囲にのみ用いられるため、1文字毎
の2値化がより適切に行えるようになる。
B: Method of adapting the threshold value of each area obtained by the character image area binarization unit to the background image area surrounding the area (second method) As a second method, the character image area 2 This is a method in which the threshold value of each area obtained by the value conversion unit is adapted to a background image area around the area. In this method, since the binarization threshold value obtained in a narrow region is used only around the narrow region, binarization for each character can be performed more appropriately.

【0057】図9は背景画像領域2値化の例2の説明図
である。図9において、先ず、上図ののように、2値
画像領域分離手段を用いて、文字画像領域(点線内の領
域1、領域2)を求める。次に、中図ののように、各
文字画像領域内を文字画像領域2値化手段、及び単一階
調画像領域2値化手段を用いて2値化する。この時、領
域1内の2値化しきい値をt1 、領域2内の2値化しき
い値をt2 とする(t 1 >t2 )。最後に、下図のの
ように、各文字画像領域を含むn×m領域(一点鎖線
内)を各文字画像領域内の2値化しきい値で2値化す
る。即ち、領域1を含むn×m領域は2値化しきい値t
1 で2値化し、領域2を含むn×m領域は2値化しきい
値t2 で2値化する。これにより、背景画像領域内に残
った文字画像部分を2値化する。なお、領域n×mの範
囲は、文字となると予測できる範囲まで拡大するもので
ある。また、2値化の結果は黒で示してある。
FIG. 9 is an explanatory diagram of Example 2 of the binarization of the background image area.
It is. In FIG. 9, first, as shown in the above figure,
The character image area (the area within the dotted line) is
The area 1 and the area 2) are obtained. Next, as shown in the middle figure,
A character image area binarizing means in the character image area, and a single floor
Binarization is performed using a tonal image area binarization unit. At this time,
Let the binarization threshold in region 1 be t1, Binarize in area 2
TTwo(T 1> TTwo). Finally, in the figure below
As described above, an nxm area including each character image area (dashed line
Is binarized by the binarization threshold in each character image area.
You. That is, the n × m region including the region 1 is a binarization threshold value t.
1And the n × m region including the region 2 is binarized by
Value tTwoTo binarize. As a result, the image remains in the background image area.
The digitized character image portion is binarized. Note that the range of the area n × m
The box expands to a range that can be predicted to be characters.
is there. The result of binarization is shown in black.

【0058】以上、実施の形態で説明したように、入力
された多値画像から文字画像とそれ以外の性質の異なる
画像領域(背景画像領域)とに分離し、先ず、分離した
各文字画像領域に対して2値化処理を行い、該2値化処
理時の2値化しきい値から背景画像領域の2値化しきい
値を決定して背景画像領域の2値化処理を行い、2値画
像を作成する。そのため、従来できなかった文字画像の
背景に色が付いているような画像であっても、高精度か
つ高速に2値画像が作成できる。また、この2値画像を
用いることで認識精度を向上することができる。
As described in the above embodiment, the input multi-valued image is separated into a character image and an image region having other properties (background image region). , A binary threshold value of the background image area is determined from the binary threshold value at the time of the binary processing, and the binary image processing is performed on the background image area. Create For this reason, a binary image can be created with high accuracy and high speed even for an image in which the background of a character image, which has not been conventionally possible, has a colored background. The recognition accuracy can be improved by using the binary image.

【0059】(5):プログラムのインストールの説明 画像2値化手段10a、画像認識手段14a、多値画像
2値化部10、文字画像領域検出部11、文字画像領域
2値化部12、背景画像領域2値化部13、2値画像認
識部14等は、プログラムで構成でき、主制御部(CP
U)が実行するものであり、主記憶に格納されているも
のである。このプログラムは、一般的な、コンピュータ
で処理されるものである。このコンピュータは、主制御
部、主記憶、ファイル装置、表示装置、キーボード等の
入力手段である入力装置などのハードウェアで構成され
ている。
(5): Description of installation of program Image binarizing means 10a, image recognizing means 14a, multi-value image binarizing section 10, character image area detecting section 11, character image area binarizing section 12, background The image area binarizing unit 13, the binary image recognizing unit 14, and the like can be configured by a program, and can be configured by a main control unit (CP
U) is executed and stored in the main memory. This program is generally processed by a computer. This computer is configured by hardware such as a main control unit, a main memory, a file device, a display device, and an input device such as a keyboard.

【0060】このコンピュータに、本発明のプログラム
をインストールする。このインストールは、フロッピ
ィ、光磁気ディスク等の可搬型の記録(記憶)媒体に、
これらのプログラムを記憶させておき、コンピュータが
備えている記録媒体に対して、アクセスするためのドラ
イブ装置を介して、或いは、LAN等のネットワークを
介して、コンピュータに設けられたファイル装置にイン
ストールされる。そして、このファイル装置から処理に
必要なプログラムステップを主記憶に読み出し、主制御
部が実行するものである。
The program of the present invention is installed on this computer. This installation is performed on portable recording (storage) media such as floppy disks, magneto-optical disks, etc.
These programs are stored and installed in a file device provided in the computer via a drive device for accessing a recording medium provided in the computer or via a network such as a LAN. You. Then, the program steps necessary for the processing are read out from the file device to the main memory, and are executed by the main control unit.

【0061】[0061]

【発明の効果】以上説明したように、本発明によれば次
のような効果がある。
As described above, the present invention has the following effects.

【0062】(1):画像2値化手段で、入力多値画像
を文字画像領域と背景画像領域とに分離し、該分離した
各文字画像領域に対して2値化処理を行い、該2値化処
理時の2値化しきい値から前記背景画像領域の2値化し
きい値を決定して前記背景画像領域の2値化処理を行う
ため、文字画像の背景に色が付いている画像であっても
高精度に2値化でき、かつ一定しきい値で2値化処理を
行うため高速に2値化することができる。
(1): The input multi-valued image is separated into a character image region and a background image region by an image binarizing means, and each of the separated character image regions is subjected to a binarization process. The binarization threshold value of the background image area is determined from the binarization threshold value at the time of the binarization processing, and the binarization processing of the background image area is performed. Even if there is, binarization can be performed with high accuracy, and binarization can be performed at high speed because the binarization process is performed with a fixed threshold value.

【0063】(2):画像2値化手段で、入力多値画像
に含まれる低階調の代表値を選んで2値化処理を行い、
該作成された2値画像から文字画像を多く含む文字画像
領域とそれ以外の背景画像領域とに分離するため、低階
調である黒い部分のみ2値化して、容易に文字画像領域
を分離することができる。
(2): The image binarization means selects a low gradation representative value included in the input multi-valued image and performs binarization processing.
In order to separate the created binary image into a character image region containing a large number of character images and a background image region other than the character image region, only the black portion having a low gradation is binarized to easily separate the character image region. be able to.

【0064】(3):画像2値化手段で、分離した文字
画像領域内が全て文字画像の単一階調である場合、該単
一階調の文字画像領域に背景画像が含まれるように該文
字画像領域を変更して、2値化処理を行うため、文字画
像領域内が全て文字画像の場合でも、文字画像が細く出
力されることを防止し、適切な2値化を行うことができ
る。
(3): When the image data is binarized by the image binarizing means, when the character image area of the separated character image has a single gradation, the background image is included in the character image area of the single gradation. Since the character image area is changed and the binarization process is performed, even if the entire character image area is a character image, it is possible to prevent the character image from being output thinly and perform appropriate binarization. it can.

【0065】(4):画像2値化手段で、分離した各文
字画像領域に対して行った2値化処理時の各2値化しき
い値を求め、前記2値化処理された領域を含むように拡
大した矩形内の領域を前記求めた2値化しきい値で2値
化処理するため、文字画像領域として、抽出されなかっ
た文字画像部分を適切に2値化処理することができる。
(4): The image binarization means finds each binarization threshold value in the binarization processing performed on each of the separated character image areas, and includes the binarized area. Since the area within the rectangle thus enlarged is subjected to the binarization processing using the obtained binarization threshold value, the character image area that has not been extracted can be appropriately binarized as the character image area.

【0066】(5):入力多値画像を文字画像領域と背
景画像領域とに分離し、該分離した各文字画像領域に対
して2値化処理を行い、該2値化処理時の2値化しきい
値から前記背景画像領域の2値化しきい値を決定して前
記背景画像領域の2値化処理を行う画像2値化手段と、
該2値化処理で作成した2値画像の認識を行う画像認識
手段と、してコンピュータを機能させるためのプログラ
ムを記録したコンピュータ読み取り可能な記録媒体とす
るため、この記録媒体のプログラムをコンピュータにイ
ンストールすることで、文字画像の背景に色が付いてい
る画像であっても高精度に2値化でき、かつ高速に2値
化することができる文書画像認識装置を容易に提供する
ことができる。
(5): The input multi-valued image is separated into a character image area and a background image area, and each of the separated character image areas is subjected to binarization processing. Image binarization means for determining a binarization threshold value of the background image region from a binarization threshold value and performing binarization processing of the background image region;
An image recognizing means for recognizing the binary image created by the binarization process and a computer-readable recording medium on which a program for causing a computer to function are recorded. By installing the document image recognition device, it is possible to easily provide a document image recognition device that can binarize a character image with high accuracy even if the image has a colored background, and that can binarize it at high speed. .

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理説明図である。FIG. 1 is a diagram illustrating the principle of the present invention.

【図2】実施の形態における文書画像認識装置の構成の
説明図である。
FIG. 2 is an explanatory diagram of a configuration of a document image recognition device according to an embodiment.

【図3】実施の形態における文字画像領域検出部の処理
の説明図である。
FIG. 3 is an explanatory diagram of processing of a character image area detection unit according to the embodiment.

【図4】実施の形態における2値画像領域分離手段のイ
メージによる説明図である。
FIG. 4 is an explanatory diagram based on an image of a binary image area separating unit in the embodiment.

【図5】実施の形態における文字画像領域2値化部の説
明図である。
FIG. 5 is an explanatory diagram of a character image area binarizing unit according to the embodiment.

【図6】実施の形態における判別分析における判別基準
を用いた2値化処理例の説明図である。
FIG. 6 is an explanatory diagram of an example of a binarization process using a discriminant criterion in discriminant analysis according to the embodiment;

【図7】実施の形態における背景画像領域2値化部の処
理の説明図である。
FIG. 7 is an explanatory diagram of processing of a background image area binarizing unit according to the embodiment;

【図8】実施の形態における背景画像領域2値化の例1
の説明図である。
FIG. 8 is an example 1 of binarization of a background image area in the embodiment.
FIG.

【図9】実施の形態における背景画像領域2値化の例2
の説明図である。
FIG. 9 illustrates an example 2 of binarization of a background image area according to the embodiment.
FIG.

【符号の説明】[Explanation of symbols]

1 入力多値画像 10a 画像2値化手段 14a 画像認識手段 DESCRIPTION OF SYMBOLS 1 Input multivalued image 10a Image binarization means 14a Image recognition means

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B029 AA01 CC29 DD07 EE17 5C077 LL18 MP05 PP27 PP28 PQ08 RR02 RR16  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B029 AA01 CC29 DD07 EE17 5C077 LL18 MP05 PP27 PP28 PQ08 RR02 RR16

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】入力多値画像から2値画像を作成する画像
2値化手段と、 該作成した2値画像の認識を行う画像認識手段とを備え
た文書画像認識装置において、 前記画像2値化手段は、前記入力多値画像を文字画像領
域と背景画像領域とに分離し、該分離した各文字画像領
域に対して2値化処理を行い、該2値化処理時の2値化
しきい値から前記背景画像領域の2値化しきい値を決定
して前記背景画像領域の2値化処理を行うことを特徴と
した文書画像認識装置。
1. A document image recognizing apparatus comprising: an image binarizing unit for generating a binary image from an input multi-valued image; and an image recognizing unit for recognizing the generated binary image. The binarizing means separates the input multi-valued image into a character image region and a background image region, performs a binarization process on each of the separated character image regions, and performs a binarization threshold in the binarization process. A document image recognition apparatus, wherein a threshold value for binarizing the background image area is determined from a value, and a binarization process is performed on the background image area.
【請求項2】前記画像2値化手段は、前記入力多値画像
に含まれる低階調の代表値を選んで2値化処理を行い、
該作成された2値画像から文字画像を多く含む文字画像
領域とそれ以外の背景画像領域とに分離することを特徴
とした請求項1記載の文書画像認識装置。
2. The image binarizing means selects a low gradation representative value included in the input multi-valued image and performs a binarizing process.
2. The document image recognition apparatus according to claim 1, wherein the generated binary image is separated into a character image region including many character images and a background image region other than the character image region.
【請求項3】前記画像2値化手段は、前記分離した文字
画像領域内が全て文字画像の単一階調である場合、該単
一階調の文字画像領域に背景画像が含まれるように該文
字画像領域を変更して、2値化処理を行うことを特徴と
した請求項1記載の文書画像認識装置。
3. The image binarizing means according to claim 1, wherein when the separated character image area is entirely a single tone of the character image, the character image area of the single tone includes a background image. 2. The document image recognition apparatus according to claim 1, wherein the character image area is changed to perform a binarization process.
【請求項4】前記画像2値化手段は、前記分離した各文
字画像領域に対して行った2値化処理時の各2値化しき
い値を求め、前記2値化処理された領域を含むように拡
大した矩形内の領域を前記求めた2値化しきい値で2値
化処理することを特徴とした請求項1記載の文書画像認
識装置。
4. The image binarizing means obtains each binarization threshold value at the time of the binarization process performed on each of the separated character image regions, and includes the binarized region. 2. The document image recognition apparatus according to claim 1, wherein the area within the rectangle thus enlarged is binarized by the obtained binarization threshold value.
【請求項5】入力多値画像を文字画像領域と背景画像領
域とに分離し、該分離した各文字画像領域に対して2値
化処理を行い、該2値化処理時の2値化しきい値から前
記背景画像領域の2値化しきい値を決定して前記背景画
像領域の2値化処理を行う画像2値化手段と、 該2値化処理で作成した2値画像の認識を行う画像認識
手段と、 してコンピュータを機能させるためのプログラムを記録
したコンピュータ読み取り可能な記録媒体。
5. An input multi-valued image is separated into a character image region and a background image region, a binarization process is performed on each of the separated character image regions, and a binarization threshold in the binarization process. Image binarization means for determining a binarization threshold value of the background image area from the values and performing binarization processing of the background image area; and an image for recognizing the binary image created by the binarization processing. A computer-readable recording medium that stores a program for causing a computer to function as a recognition unit.
JP2000102968A 2000-04-05 2000-04-05 Document image recognition apparatus and recording medium Expired - Lifetime JP4409713B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000102968A JP4409713B2 (en) 2000-04-05 2000-04-05 Document image recognition apparatus and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000102968A JP4409713B2 (en) 2000-04-05 2000-04-05 Document image recognition apparatus and recording medium

Publications (2)

Publication Number Publication Date
JP2001291056A true JP2001291056A (en) 2001-10-19
JP4409713B2 JP4409713B2 (en) 2010-02-03

Family

ID=18616743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000102968A Expired - Lifetime JP4409713B2 (en) 2000-04-05 2000-04-05 Document image recognition apparatus and recording medium

Country Status (1)

Country Link
JP (1) JP4409713B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100703284B1 (en) 2003-01-30 2007-04-03 삼성전자주식회사 Device and method for binarization of image using quadratic filter and improved quadratic filter
CN1330203C (en) * 2002-09-11 2007-08-01 三星电子株式会社 Apparatus and method for recognizing a character image from an image screen
JP6173542B1 (en) * 2016-08-10 2017-08-02 株式会社Pfu Image processing apparatus, image processing method, and program
WO2018151043A1 (en) * 2017-02-15 2018-08-23 ソフネック株式会社 Image processing method and computer program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1330203C (en) * 2002-09-11 2007-08-01 三星电子株式会社 Apparatus and method for recognizing a character image from an image screen
US7773808B2 (en) 2002-09-11 2010-08-10 Samsung Electronics Co., Ltd. Apparatus and method for recognizing a character image from an image screen
KR100703284B1 (en) 2003-01-30 2007-04-03 삼성전자주식회사 Device and method for binarization of image using quadratic filter and improved quadratic filter
JP6173542B1 (en) * 2016-08-10 2017-08-02 株式会社Pfu Image processing apparatus, image processing method, and program
US10049291B2 (en) 2016-08-10 2018-08-14 Pfu Limited Image-processing apparatus, image-processing method, and computer program product
WO2018151043A1 (en) * 2017-02-15 2018-08-23 ソフネック株式会社 Image processing method and computer program

Also Published As

Publication number Publication date
JP4409713B2 (en) 2010-02-03

Similar Documents

Publication Publication Date Title
Parker et al. An approach to license plate recognition
JP3768052B2 (en) Color image processing method, color image processing apparatus, and recording medium therefor
US7379594B2 (en) Methods and systems for automatic detection of continuous-tone regions in document images
Gllavata et al. A robust algorithm for text detection in images
KR100647284B1 (en) Apparatus and method for extracting character of image
JPH10506733A (en) Method and apparatus for separating foreground from background in text-containing images
JP2008148298A (en) Method and apparatus for identifying regions of different content in image, and computer readable medium for embodying computer program for identifying regions of different content in image
JP2003132358A (en) Image processing method, device and system
JP5337563B2 (en) Form recognition method and apparatus
US6269186B1 (en) Image processing apparatus and method
JP2000207489A (en) Character extracting method and device and record medium
JP4441300B2 (en) Image processing apparatus, image processing method, image processing program, and recording medium storing the program
EP1296283A2 (en) Half-tone dot elimination method and system thereof
JPH0565911B2 (en)
JP2001291056A (en) Document picture recognizing device and recording medium
JP6377214B2 (en) Text detection method and apparatus
JP3544324B2 (en) CHARACTER STRING INFORMATION EXTRACTION DEVICE AND METHOD, AND RECORDING MEDIUM CONTAINING THE METHOD
EP0632404B1 (en) Pattern recognition by generating and using zonal features and anti-features
JPH10285399A (en) Binarization method for image
JP3150762B2 (en) Gradient vector extraction method and character recognition feature extraction method
JPH10232926A (en) Image processor and its method
KR100713335B1 (en) Method for recognizing of picture in wireless terminal
JP2960468B2 (en) Method and apparatus for binarizing grayscale image
US20220021787A1 (en) Apparatus, method, and storage medium for removing shading dots
JPH08185477A (en) Picture sorting device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090507

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090507

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091008

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091112

R150 Certificate of patent or registration of utility model

Ref document number: 4409713

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121120

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131120

Year of fee payment: 4

EXPY Cancellation because of completion of term