JP3127676B2 - Image processing apparatus and image processing method - Google Patents

Image processing apparatus and image processing method

Info

Publication number
JP3127676B2
JP3127676B2 JP05232271A JP23227193A JP3127676B2 JP 3127676 B2 JP3127676 B2 JP 3127676B2 JP 05232271 A JP05232271 A JP 05232271A JP 23227193 A JP23227193 A JP 23227193A JP 3127676 B2 JP3127676 B2 JP 3127676B2
Authority
JP
Japan
Prior art keywords
area
image
character
binary image
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05232271A
Other languages
Japanese (ja)
Other versions
JPH0765123A (en
Inventor
一郎 中尾
磨理子 竹之内
穂 高倉
里志 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP05232271A priority Critical patent/JP3127676B2/en
Publication of JPH0765123A publication Critical patent/JPH0765123A/en
Application granted granted Critical
Publication of JP3127676B2 publication Critical patent/JP3127676B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は文字画像を含む濃淡画像
を文字部と背景部に二値化する画像処理装置及び画像処
理方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus and an image processing method for binarizing a grayscale image including a character image into a character portion and a background portion.

【0002】[0002]

【従来の技術】従来、画像処理装置では、文書等の画像
データに対して画像データ中の濃度情報に基づいて二値
化閾値を決定し単一の閾値で黒部分(文字部)と白部分
(背景部)に分離し二値画像を生成する方法や、文書画
像を文字の存在する領域と写真等の領域に分割し写真等
の領域と文字領域それぞれの領域に関する閾値を決定し
それぞれの領域に対し二値画像を生成するという方法が
多くとられている。
2. Description of the Related Art Conventionally, an image processing apparatus determines a binarization threshold for image data of a document or the like based on density information in the image data, and uses a single threshold for a black portion (character portion) and a white portion. (A background part), a method of generating a binary image, and a method of dividing a document image into an area including a character and an area such as a photograph and determining a threshold value for each of an area such as a photograph and an area including a character and determining each area. In many cases, a method of generating a binary image is used.

【0003】[0003]

【発明が解決しようとする課題】しかしながら上記のよ
うな構成では、文字領域に関しては画像内で濃淡ムラが
発生する場合や、文字の濃度が不均一な場合、二値化画
像において文字によっては文字線のつぶれやかすれが発
生するという問題点を有していた。また、背景濃度が全
体の背景濃度と異なる領域ではその領域全体が黒部分と
なり文字部が抽出できないという問題点を有していた。
However, in the above-described configuration, in the case where unevenness in shading occurs in the image with respect to the character area, or when the density of the character is non-uniform, depending on the character in the binarized image, There is a problem that the lines are crushed or blurred. Further, in a region where the background density is different from the entire background density, there is a problem that the entire region becomes a black portion and a character portion cannot be extracted.

【0004】本発明は上記問題点に鑑み、文字画像の全
体領域を単一の閾値で二値化した後、個々の1文字毎の
領域を抽出し1文字毎に最適な二値化閾値によって再度
二値画像を生成することによって、画像内で濃淡ムラが
発生する場合や、文字の濃度が不均一な場合でも文字線
のつぶれやかすれの少い良好な二値画像を生成すること
を目的とする。また背景部の濃度が画像内の場所により
異なる場合でも文字部を黒部分、背景部を白部分として
二値化することができる。
In view of the above problems, the present invention binarizes the entire area of a character image using a single threshold, extracts an area for each individual character, and sets an optimum binarization threshold for each character. By generating a binary image again, the purpose is to generate a good binary image with less collapse and blurring of character lines even when shading unevenness occurs in the image or when the density of characters is uneven. And Further, even when the density of the background portion varies depending on the location in the image, the character portion can be binarized as a black portion and the background portion as a white portion.

【0005】[0005]

【課題を解決するための手段】上記問題点を解決するた
めに、本発明の画像処理方法は、文書等の文字画像を含
む濃淡画像データに対し、二値化する画像領域を指定す
る領域指定ステップと、指定された領域に対して領域内
濃度情報に基づいて二値化閾値を決定する二値化閾値決
定ステップと、前記領域指定ステップにおいて指定され
た画像領域を、前記二値化閾値決定ステップにおいて決
定された二値化閾値で二値化し、当該画像領域の二値画
像を生成する二値画像生成ステップと、前記二値画像生
成ステップにより生成された画像領域が1文字領域であ
るかどうかを判定する領域判定ステップと、前記領域判
定ステップによって、1文字領域でないと判断された場
合に前記二値画像を黒部分の存在する領域毎に分割し、
前記領域指定ステップに分割された各領域を渡す領域分
割ステップと、前記1文字領域判定ステップによって、
1文字領域であると判定された各領域を合成して最終二
値画像とする二値画像合成ステップとを包含する、とい
う構成を備えたものである。
In order to solve the above-mentioned problems, an image processing method according to the present invention specifies an image area to be binarized for gray image data including a character image such as a document .
Area specifying step, and within the area for the specified area
Binarization threshold determination that determines a binarization threshold based on density information
Setting step and the area specifying step
The image area determined in the binarization threshold determination step is determined.
Binarization using the set binarization threshold
Generating a binary image, and generating the binary image.
The image area generated by the forming step is a one-character area.
Area determination step of determining whether or not the
If it is determined that the area is not one character area
In this case, the binary image is divided into regions where black portions exist,
The area to pass each area divided in the area specifying step
A dividing step and the one-character area determining step,
The areas determined to be one character area are combined to form the final two
And a binary image synthesizing step as a value image .

【0006】また、本発明の画像処理方法は、前記二値
化閾値決定ステップは、指定された二値化領域に対して
領域内濃度情報及び領域サイズ情報の双方を用いて二値
化閾値を決定する、という構成を備えたものである。
Further , the image processing method of the present invention is characterized in that the binary
Thresholding step is performed for the specified binarization area.
Binary using both density information in area and area size information
It is provided with a configuration for determining the activation threshold .

【0007】本発明の画像処理装置は、文章等の文字画
像を含む濃淡画像データに二値画像データに変換する画
像処理方法を実行する画像処理装置であって、前記画像
処理装置は、文書等の文字画像を含む濃淡画像データ中
の指定された領域に対して二値化閾値に基づき二値画像
を生成する二値画像生成部と、指定された複数の領域の
二値画像を合成する二値画像合成部とを備え、前記画像
処理方法は、文書等の文字画像を含む濃淡画像データに
対し、二値化する画像領域を指定する領域指定ステップ
と、指定された領域に対して領域内濃度情報に基づいて
二値化閾値を決定する二値化閾値決定ステップと、前記
領域指定ステップにおいて指定された画像領域を、前記
二値化閾値決定ステップにおいて決定された二値化閾値
で二値化し、当該画像領域の二値画像を前記二値画像生
成部により生成する二値画像生成ステップと、前記二値
画像生成ステップにより生成された画像領域が1文字領
域であるかどうかを判定する領域判定ステップと、前記
領域判定ステップによって、1文字領域でないと判断さ
れた場合に前記二値画像を黒部分の存在する領域毎に分
割し、前記領域指定ステップに分割された各領域を渡す
領域分割ステップと、前記1文字領域判定ステップによ
って、1文字領域であると判定された各領域を指定し、
前記二値画像合成部により合成して最終二値画像とする
二値画像合成ステップとを包含する、という構成を備え
たものである。 また、本発明の画像処理装置は、前記二
値化閾値決定ステップは、指定された二値化領域に対し
て領域内濃度情報及び領域サイズ情報の双方を用いて二
値化閾値を決定する、という構成を備えたものである。
[0007] The image processing apparatus of the present invention can be used for character images such as sentences.
Image to be converted to binary image data
An image processing apparatus for performing an image processing method, wherein the image
The processing device is used for processing grayscale image data including character images such as documents.
Image based on the binarization threshold for the specified area
And a binary image generation unit for generating a plurality of specified regions.
A binary image synthesizing unit for synthesizing a binary image, wherein the image
The processing method is applied to grayscale image data including character images such as documents.
On the other hand, an area specifying step for specifying an image area to be binarized
And the specified area based on the density information in the area
A binarization threshold determining step of determining a binarization threshold,
The image area specified in the area specifying step is
Binarization threshold determined in the binarization threshold determination step
And binarize the binary image of the image area with the binary image
Generating a binary image generated by the component,
The image area generated by the image generation step is one character area
An area determining step of determining whether the area is an area,
In the area determination step, it is determined that the area is not a one-character area.
The binary image is divided into regions where black portions exist.
And pass each divided area to the area designation step
An area dividing step and the one-character area determining step.
Therefore, each area determined to be one character area is designated,
The final binary image is synthesized by the binary image synthesizing unit.
And a binary image synthesizing step.
It is a thing. Further, the image processing apparatus of the present invention is characterized in that
The thresholding step for determining the binarization threshold is performed for the specified binarization area.
Using both the intra-area density information and the area size information
It is provided with a configuration for determining a valuation threshold.

【0008】[0008]

【作用】本発明は上記した構成によって、濃淡画像中か
ら抽出された1文字領域毎に最適な二値化閾値を求め、
1文字領域毎に求められた個々の閾値で各領域を二値化
し二値画像を作成することにより文字線のつぶれやかす
れの少い品質の良い二値画像が得られることとなる。ま
た、二値画像から黒部分の存在する領域毎に分割し、各
領域毎に二値化閾値を求め再度二値画像を生成するとい
う操作を繰り返すことにより背景部の濃度が場所により
異なる場合でも確実に背景部が白部分となるように二値
化することができることとなる。また、二値化閾値を決
定する際、二値化する領域の領域サイズと濃度情報の双
方を用いることにより、細かく二値化閾値を設定でき、
初期段階で決定された二値化閾値による文字線のかすれ
等によって1文字が複数の領域に分割されることを防ぐ
ことができ品質の良い二値画像が得られることとなる。
According to the present invention, an optimum binarization threshold value is obtained for each character area extracted from a grayscale image by the above-described structure.
By binarizing each area with an individual threshold value obtained for each character area and creating a binary image, a high-quality binary image with little collapse or blurring of character lines can be obtained. Further, even if the density of the background portion differs depending on the location by repeating the operation of dividing the binary image into regions where black portions are present, obtaining a binarization threshold for each region and generating a binary image again, The binarization can be performed so that the background portion becomes a white portion without fail. Further, when determining the binarization threshold, by using both the area size and the density information of the area to be binarized, the binarization threshold can be set finely,
It is possible to prevent a single character from being divided into a plurality of areas due to blurring of a character line or the like based on a binarization threshold determined in an initial stage, and to obtain a high-quality binary image.

【0009】[0009]

【実施例】以下本発明の実施例を、図面を参照しながら
説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0010】図1は本発明の実施例1における画像処理
装置の構成図を示すものである。図1において、11は
二値化閾値決定部であり、文字画像を含む濃淡画像デー
タ16中の指定された領域に対して領域内濃度情報に基
づいて二値化閾値を決定する。12は全体画像生成部で
あり、二値化閾値決定部11に対し濃淡画像全体領域を
指定し二値化閾値決定部11で決定された単一の閾値で
全体を二値化し二値画像を生成する。13は文字領域抽
出部であり、全体二値画像生成部12によって生成され
た二値画像から1文字毎の文字画像領域を抽出する。1
4は部分二値画像生成部であり、文字領域抽出部13に
おいて抽出された濃淡画像データ中の各1文字画像領域
を二値化閾値決定部11に指定し、二値化閾値決定部1
1において各領域毎に決定された個々の二値化閾値でそ
れぞれの領域の部分二値画像を生成する。15は二値画
像合成部であり、部分二値画像生成部14において生成
された各領域の二値画像を合成して全体の二値画像を再
構成する。
FIG. 1 is a block diagram of an image processing apparatus according to a first embodiment of the present invention. In FIG. 1, reference numeral 11 denotes a binarization threshold value determination unit which determines a binarization threshold value for a designated region in the grayscale image data 16 including a character image based on the in-region density information. Reference numeral 12 denotes an entire image generation unit, which designates the entire gray-scale image area for the binarization threshold determination unit 11 and binarizes the whole with a single threshold determined by the binarization threshold determination unit 11 to convert the binary image Generate. Reference numeral 13 denotes a character area extracting unit that extracts a character image area for each character from the binary image generated by the entire binary image generating unit 12. 1
Reference numeral 4 denotes a partial binary image generation unit which designates each one-character image region in the grayscale image data extracted by the character region extraction unit 13 to the binarization threshold value determination unit 11;
In step 1, a partial binary image of each region is generated with each binarization threshold determined for each region. Reference numeral 15 denotes a binary image synthesizing unit which synthesizes the binary images of the respective regions generated by the partial binary image generating unit 14 to reconstruct the entire binary image.

【0011】以上のように構成された画像処理装置につ
いて、以下図1、図2、図3、図4、及び図5を用いて
その動作を説明する。図2は入力された濃淡画像データ
を示すものであって、21は濃淡画像データ全体、2
2、23、24は画像中の各文字領域を示すものであ
る。濃淡画像は各画素が濃度値で表現され、濃度値が高
い数値ほど白に近く、低い数値ほど黒に近いものとす
る。
The operation of the image processing apparatus configured as described above will be described below with reference to FIGS. 1, 2, 3, 4, and 5. FIG. 2 shows the input gray-scale image data.
Reference numerals 2, 23, and 24 indicate respective character areas in the image. In the grayscale image, each pixel is represented by a density value, and the higher the density value, the closer to white and the lower the value, the closer to black.

【0012】まず、全体二値画像生成部12は二値化閾
値決定部11に対し入力された濃淡画像データ全体領域
21を指定する。二値化閾値決定部11は指定された全
体領域の濃淡情報に基づいて二値化閾値を決定する。例
えば、指定された領域内の濃度毎の分布(画素数)を計
数し黒部分が全体領域の一定割合になるような値を閾値
とする方法や、黒とされる部分の画素数をN1、濃度値
の平均をm1、白とされる部分の画素数をN2、濃度値
の平均をm2としたとき、N1×N2×(m1−m2)
×(m1−m2)で示される白部分と黒部分の平均値の
分散が最大になるような閾値を二値化閾値として決定す
る方法(判別分析法)、あるいは予め複数個の閾値を用
意し指定された領域内の平均濃度に応じて閾値を選択す
る方法、等がある。本実施例では画像の濃度値の平均に
よって予め用意された複数個の閾値から選択するものと
する。例えば、濃淡画像データ21内の各画素の濃度値
が0(黒)〜255(白)の256レベルで与えられて
いる時、二値化閾値決定部11は領域中の平均濃度値
が、170以下ならば閾値170、171〜180なら
ば閾値180、181〜190ならば閾値190、19
0〜210ならば閾値200、210以上ならば220
に決定するものとする。例えば、前記全体二値画像生成
部12によって指定された全体領域21の平均濃度が2
05であった場合閾値200が選択され、全体二値画像
生成部12に閾値200が渡される。全体二値画像生成
部12は、前記二値化閾値決定部11において決定され
た閾値によって濃淡画像データ全体領域21に対し閾値
以下の画素を黒部分(文字部)、閾値以上の画素を白部
分(背景部)とし全体二値画像31を生成する。
First, the entire binary image generation unit 12 specifies the entire gray-scale image data area 21 input to the binarization threshold value determination unit 11. The binarization threshold determination unit 11 determines a binarization threshold based on the grayscale information of the specified entire area. For example, a method of counting a distribution (number of pixels) for each density in a designated area and setting a threshold value such that a black portion becomes a constant ratio of the entire area, a method of setting the number of pixels of a black portion to N1, When the average of the density values is m1, the number of pixels in a white portion is N2, and the average of the density values is m2, N1 × N2 × (m1-m2)
A method of determining a threshold value that maximizes the variance of the average value of the white portion and the black portion represented by × (m1−m2) as a binarization threshold value (discrimination analysis method), or preparing a plurality of threshold values in advance There is a method of selecting a threshold value according to the average density in the designated area, and the like. In the present embodiment, it is assumed that the image is selected from a plurality of thresholds prepared in advance by averaging the image density values. For example, when the density value of each pixel in the grayscale image data 21 is given at 256 levels from 0 (black) to 255 (white), the binarization threshold determination unit 11 sets the average density value in the area to 170 If it is less than or equal to the threshold 170, if it is 171 to 180, it is the threshold 180, if it is 181-190, it is the threshold 190, 19
0 to 210, threshold value 200, 210 or more, 220
Shall be determined. For example, if the average density of the entire area 21 specified by the entire binary image generation unit 12 is 2
If it is 05, the threshold value 200 is selected, and the threshold value 200 is passed to the entire binary image generation unit 12. The entire binary image generation unit 12 uses the threshold value determined by the binarization threshold value determination unit 11 to define pixels below the threshold value in the black portion (character portion) and pixels above the threshold value in the white portion in the entire grayscale image data area 21. (Background portion), and the entire binary image 31 is generated.

【0013】図3は、全体二値画像生成部によって生成
された二値画像を示すものであって、31は画像データ
全体、32、33、34は文字領域抽出部13によって
抽出された1文字領域の例を示すものである。前記全体
二値画像生成部12によって生成された二値画像は、文
字領域抽出部13によって各文字領域が抽出される。例
えば、全体二値画像31に対し水平方向に画像を走査し
黒画素の存在する部分を検出することにより文字行を検
出し、さらに検出された文字行毎に垂直方向に画像を走
査し黒画素の存在する部分を検出し1文字毎の領域を検
出する。例えば、図4(a)は全体二値画像を各ライン
毎に水平方向に走査した結果を示したもので、41、4
2、43は黒画素が存在する部分を示したものである。
図4(b)は文字行41、43部分を垂直方向に走査し
た結果を示したもので44、45、46は検出された各
文字領域の例である。部分二値画像生成部14は、前記
文字領域抽出部13で抽出された各1文字領域を二値化
閾値決定部11に対し指定し、二値化閾値決定部11は
指定された各1文字領域の濃淡情報に基づいて各領域の
閾値を個々に決定する。例えば、図4(b)の45、4
6、47に示される各1文字領域の平均濃度がそれぞれ
182、189、220であった場合、前記二値化閾値
決定部11によって各領域の閾値がそれぞれ190、1
90、220と決定される。決定された閾値に従って部
分二値画像生成部14は個々の1文字領域を二値化し図
5の52、53、53に示されるような部分二値画像を
生成する。前記部分二値画像生成部14によって生成さ
れた部分二値画像は、二値画像合成部15によって再構
成され全体の二値画像が生成される。例えば、全体二値
画像31は、個々の1文字領域の部分二値画像を再構成
することにより最終的な二値画像、図5の51が得られ
る。
FIG. 3 shows a binary image generated by the entire binary image generating unit, where 31 is the entire image data, and 32, 33 and 34 are one characters extracted by the character area extracting unit 13. It shows an example of a region. From the binary image generated by the overall binary image generation unit 12, each character region is extracted by a character region extraction unit 13. For example, the image is scanned in the horizontal direction with respect to the whole binary image 31 to detect a character line by detecting a portion where a black pixel exists, and further, the image is scanned in the vertical direction for each detected character line and a black pixel is scanned. Is detected, and an area for each character is detected. For example, FIG. 4A shows the result of scanning the entire binary image in the horizontal direction for each line.
Reference numerals 2 and 43 indicate portions where black pixels exist.
FIG. 4B shows the result of scanning the character lines 41 and 43 in the vertical direction. 44, 45, and 46 are examples of the detected character regions. The partial binary image generation unit 14 specifies each one-character area extracted by the character area extraction unit 13 to the binarization threshold determination unit 11, and the binarization threshold determination unit 11 The threshold of each area is individually determined based on the density information of the area. For example, 45, 4 in FIG.
If the average density of each one-character area shown in FIGS. 6 and 47 is 182, 189, and 220, respectively, the threshold value of each area is set to 190, 1
90 and 220 are determined. In accordance with the determined threshold value, the partial binary image generation unit 14 binarizes each one-character area and generates a partial binary image as shown by 52, 53, and 53 in FIG. The partial binary image generated by the partial binary image generator 14 is reconstructed by the binary image synthesizer 15 to generate the entire binary image. For example, the entire binary image 31 is obtained by reconstructing a partial binary image of each one-character area to obtain a final binary image, 51 in FIG.

【0014】図6は本発明の実施例2における画像処理
装置における画像処理方法の構成図を示すものである。
画像処理装置は実施例1と同様に二値画像生成部と二値
画像合成部を有する。図6において、61は領域指定ス
テップであり、濃淡画像データ67中の二値化する領域
を指定する。62は二値化閾値決定ステップであり、濃
淡画像データ67中の指定された領域に対し領域内濃度
情報に基づいて二値化閾値を決定する。63は二値画像
生成部である二値画像生成ステップであり、領域指定ス
テップ61で指定された濃淡画像の領域に対し二値化閾
値決定ステップ62で決定された二値化閾値で二値化し
二値画像を生成する。64は領域判定ステップであり、
二値画像生成部であるステップ63で生成された領域に
対し1文字領域であるかどうかを判定する。65は領域
分割ステップであり、領域判定ステップ64で1文字領
域でないと判断された領域に対する二値画像を黒部分の
連続する領域毎に分割する。66は二値画像合成部であ
ステップであり、領域判定ステップ64で1文字領域
であると判定された各領域の二値画像を合成し最終二値
画像68を生成する。
FIG. 6 shows image processing according to the second embodiment of the present invention.
FIG. 2 is a diagram illustrating a configuration of an image processing method in the apparatus .
The image processing device includes a binary image generation unit and a binary
It has an image synthesis unit. In FIG. 6, reference numeral 61 denotes an area specifying step, which specifies an area to be binarized in the gray image data 67. Reference numeral 62 denotes a binarization threshold determination step for determining a binarization threshold for a designated area in the grayscale image data 67 based on the in-area density information. Reference numeral 63 denotes a binary image generation step which is a binary image generation unit, which binarizes the area of the grayscale image specified in the area specification step 61 with the binary threshold determined in the binary threshold determination step 62. Generate a binary image. 64 is a region determination step,
It is determined whether or not the area generated in step 63, which is the binary image generation unit , is a one-character area. An area dividing step 65 divides a binary image corresponding to an area determined to be not a one-character area in the area determining step 64 for each area where black portions are continuous. 66 binary image synthesizing unit der
The binary image of each area determined to be a one-character area in the area determination step 64 is synthesized to generate a final binary image 68.

【0015】以上のように構成された画像処理方法につ
いて、以下図6、図7、図8、図9を用いてその動作を
説明する。図7は入力された濃淡画像データを示すもの
であって、71は濃淡画像データ全体、72は濃度値の
異なる背景部を示すものである。まず、濃淡画像71は
領域指定ステップ61で画像全体領域を指定され二値化
閾値決定ステップ62に渡される。二値化閾値決定ステ
ップ62は実施例1で示したように濃淡画像71中の濃
淡情報に基づいて二値化閾値を決定する。例えば、濃淡
画像の71の全体の平均濃度が205である場合、その
一部である背景部72の濃度値が190である場合であ
っても、二値化閾値決定ステップ62で濃淡画像71の
平均濃度に基づき閾値200と決定され、二値画像生成
ステップによって閾値以下の画素を黒部分、閾値以上の
画素を白部分とし二値化し二値画像81を生成する。図
8は二値画像生成部であるステップ63によって生成さ
れた全体の二値画像を示すものであって、81は画像デ
ータ全体、82は濃度値の異なる背景部を持つ領域72
の二値化結果の例を示すものである。二値画像生成部
あるステップ63によって生成された二値画像は、領域
判定ステップ64によって1文字領域であるかどうか判
定される。例えば、二値化された領域が一定サイズ以上
であるかどうかによって1文字領域であるかどうかを判
定する。二値画像データ領域81が、1文字領域でない
と判定された場合、領域分割ステップ65によって黒部
分の連続する領域に分割される。例えば、実施例1で示
したように二値画像領域を水平方向に走査することによ
り、図9(a)で示される黒部分の連続する領域91、
92、93、94に分割される。さらに水平方向に走査
することにより、例えば領域93は図9(b)に示され
る各領域に分割される。分割された各領域は、再度領域
指定ステップに渡され各領域毎に二値化閾値決定ステッ
プ62により二値化閾値が決定され二値画像生成部であ
るステップ63で各領域の二値画像が生成される。例え
ば図9の領域95部の平均濃度値が160であった場
合、閾値170となり、背景部72は白に二値化され図
9(c)で示される領域95部の二値画像96が生成さ
れる。二値画像96は領域判定ステップ64によって1
文字領域であるかどうか判定され、さらに領域分割ステ
ップ65によって図3(c)の各領域に分割される。領
域判定ステップ65によって1文字領域であると判定さ
れた各領域は、二値画像合成部であるステップ66によ
って合成され最終二値画像68が生成される。なお、実
施例2において、二値化閾値決定ステップ62は、複数
個の閾値を用意し指定された領域の濃度の平均値によっ
て二値化閾値を選択し決定するとしたが、領域サイズ毎
に平均濃度値に応じた閾値を用意し、領域サイズと領域
内の平均濃度に基づいて二値化閾値を決定してもよい。
例えば、領域サイズが1文字領域より大きい場合に場合
に高めの閾値を用意し、1文字領域である場合に低い閾
値を用意することもできる。
The operation of the image processing method configured as described above will be described below with reference to FIGS. 6, 7, 8, and 9. FIG. 7 shows the input grayscale image data, 71 indicates the entire grayscale image data, and 72 indicates a background portion having different density values. First, the entire image area of the grayscale image 71 is specified in the area specifying step 61 and is passed to the binarization threshold value determining step 62. In the binarization threshold determination step 62, the binarization threshold is determined based on the grayscale information in the grayscale image 71 as described in the first embodiment. For example, if the overall average density of 71 of the grayscale image is 205 ,
Der If the density value of the background portion 72 which is a portion of which is 190
What is also of gray-scale image 71 by binarization threshold determination step 62
The threshold value 200 is determined based on the average density, and a binary image 81 is generated by binarizing pixels below the threshold into a black portion and pixels above the threshold into a white portion in a binary image generation step. FIG. 8 shows the entire binary image generated in step 63 which is a binary image generating unit , where 81 is the entire image data, and 82 is an area 72 having a background portion with different density values.
5 shows an example of the binarization result of the above . In the binary image generating unit
An area determination step 64 determines whether the binary image generated in a certain step 63 is a one-character area. For example, it is determined whether or not the binarized area is a one-character area based on whether or not the binarized area has a certain size or more. If it is determined that the binary image data area 81 is not a one-character area, the area is divided into areas in which black portions continue by an area dividing step 65. For example, by scanning the binary image area in the horizontal direction as shown in the first embodiment, the continuous area 91 of the black portion shown in FIG.
It is divided into 92, 93 and 94. By further scanning in the horizontal direction, for example, the region 93 is divided into the regions shown in FIG. Each divided region is, the binary image generating unit der determined binarization threshold by binarization threshold determination step 62 for each of the regions is passed back to area designation step
In step 63, a binary image of each area is generated. For example, when the average density value of the 95 parts of the area in FIG. 9 is 160, the threshold value becomes 170, the background part 72 is binarized to white, and the binary image 96 of the 95 parts of the area shown in FIG. Is done. The binary image 96 is 1
It is determined whether or not the area is a character area, and the area is further divided into the areas shown in FIG. Each area determined to be a one-character area by the area determination step 65 is synthesized by a binary image synthesizing step 66 to generate a final binary image 68. In the second embodiment, in the binarization threshold determination step 62, a plurality of thresholds are prepared and the binarization threshold is selected and determined based on the average value of the density of the designated area. A threshold corresponding to the density value may be prepared, and the binarization threshold may be determined based on the area size and the average density in the area.
For example, a higher threshold can be prepared when the area size is larger than one character area, and a lower threshold can be prepared when the area size is one character area.

【0016】[0016]

【発明の効果】以上のように本発明によれば、濃淡画像
中から抽出された1文字領域毎に最適な二値化閾値を求
め、領域毎に求められた個々の閾値で各領域を二値化し
二値画像を作成することができ文字線のつぶれやかすれ
の少い品質の良い二値画像が得られることとなる。
According to the present invention as described above, according to the present invention, determine the optimum binarization threshold for each character region extracted from the concentrated light in the image, each region with a particular threshold determined for each region A binary image can be created by binarization, and a high-quality binary image with little collapse and blurring of character lines can be obtained.

【0017】また、本発明によれば、二値画像を黒部分
の存在する領域毎に分割し、各領域毎に二値化閾値を求
め再度二値画像を生成するという操作を繰り返すことに
より背景部の濃度が場所により異なる場合でも確実に背
景部が白部分となるように二値化することができるとと
もに、1文字領域毎に最適な二値化閾値を求め、領域毎
に求められた個々の閾値で各領域を二値化し二値画像を
作成することができ文字線のつぶれやかすれの少い品質
の良い二値画像が得られることとなる。
Further, according to the present invention, the operation of dividing the binary image into regions where black portions are present, obtaining a binarization threshold value for each region, and generating a binary image again is repeated, thereby obtaining a background image. Even when the density of a part differs from place to place, binarization can be performed so that the background part is a white part without fail, and an optimal binarization threshold value is determined for each character area, and individual values determined for each area are determined. Each area is binarized with the threshold value of, and a binary image can be created, so that a high-quality binary image with little collapse or blurring of character lines can be obtained.

【0018】さらに、本発明によれば、二値化閾値決定
ステップにおいて、指定された二値化領域に対して領域
内濃度情報及び領域サイズ情報の双方を用いて二値化閾
値を決定する二値化閾値決定ステップを設けることによ
り、細かく二値化閾値を設定でき、初期段階で決定され
た二値化閾値による文字線のかすれ等によって1文字が
複数の領域に分割されることを防ぐことができ品質の良
い二値画像が得られることとなる。
Further , according to the present invention , in the binarization threshold value determining step , the binarization threshold value is determined for the designated binarization region using both the intra-region density information and the region size information. By providing the binarization threshold determination step, the binarization threshold can be set finely, and it is possible to prevent a character from being divided into a plurality of regions due to blurring of a character line due to the binarization threshold determined in the initial stage. And a high quality binary image can be obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例1における画像処理装置の構成
FIG. 1 is a configuration diagram of an image processing apparatus according to a first embodiment of the present invention.

【図2】本発明の実施例1における入力画像の写真FIG. 2 is a photograph of an input image according to the first embodiment of the present invention.

【図3】本発明の実施例1における全体二値化結果を示
す画像を示す図
FIG. 3 is a diagram showing an image showing an overall binarization result according to the first embodiment of the present invention.

【図4】本発明の実施例1における文字領域抽出結果を
示す図
FIG. 4 is a diagram showing a character area extraction result according to the first embodiment of the present invention;

【図5】本発明の実施例1における最終二値化結果を示
す画像を示す図
FIG. 5 is a diagram showing an image showing a final binarization result in the first embodiment of the present invention.

【図6】本発明の実施例2における画像処理方法の構成
FIG. 6 is a configuration diagram of an image processing method according to a second embodiment of the present invention.

【図7】本発明の実施例2における入力画像を示す写真FIG. 7 is a photograph showing an input image in Embodiment 2 of the present invention.

【図8】本発明の実施例2における全体二値化結果を示
す画像を示す図
FIG. 8 is a diagram showing an image showing an overall binarization result according to the second embodiment of the present invention.

【図9】本発明の実施例2における画像領域領域分割結
果を示す図
FIG. 9 is a diagram showing a result of dividing an image area into regions according to the second embodiment of the present invention.

【符号の説明】[Explanation of symbols]

11 二値化閾値決定部 12 全体二値画像生成部 13 文字領域抽出部 14 部分位置画像生成部 15 二値画像合成部 16 濃淡画像データ 17 二値画像 21 濃淡画像データ全体 22 1文字領域の例 23 1文字領域の例 24 1文字領域の例 31 全体二値画像 32 1文字領域の例 33 1文字領域の例 34 1文字領域の例 41 検出された文字行 42 検出された文字行 43 検出された文字行 44 検出された文字行 45 検出された1文字領域の例 46 検出された1文字領域の例 47 検出された1文字領域の例 51 最終二値化画像 52 部分二値画像の例 53 部分二値画像の例 54 部分二値画像の例 61 領域指定ステップ 62 二値化閾値決定ステップ 63 二値画像生成ステップ 64 領域判定ステップ 65 領域分割ステップ 66 二値画像合成ステップ 67 濃淡画像データ 71 濃淡画像データ全体 72 濃度値の異なる背景部 81 全体二値画像 82 濃度値の異なる背景部の二値化結果 91 水平方向に分割された領域 92 水平方向に分割された領域 93 水平方向に分割された領域 94 水平方向に分割された領域 95 垂直方向に分割された領域 96 濃度値の異なる背景部の二値化結果 DESCRIPTION OF SYMBOLS 11 Binarization threshold value determination part 12 Whole binary image generation part 13 Character area extraction part 14 Partial position image generation part 15 Binary image synthesis part 16 Gray image data 17 Binary image 21 Total gray image data 22 Example of one character area 23 Example of one character area 24 Example of one character area 31 Whole binary image 32 Example of one character area 33 Example of one character area 34 Example of one character area 41 Detected character line 42 Detected character line 43 Detected Detected character line 44 Detected character line 45 Detected one-character area example 46 Detected one-character area example 47 Detected one-character area example 51 Final binarized image 52 Partial binary image example 53 Example of partial binary image 54 Example of partial binary image 61 Area designation step 62 Binarization threshold determination step 63 Binary image generation step 64 Area determination step 65 Area division step Step 66 Binary image synthesizing step 67 Gray-scale image data 71 Total gray-scale image data 72 Background part with different density values 81 Whole binary image 82 Binary result of background part with different density values 91 Horizontally divided area 92 Horizontal Region divided in the direction 93 region divided in the horizontal direction 94 region divided in the horizontal direction 95 region divided in the vertical direction 96 binarization result of the background portion having different density values

───────────────────────────────────────────────────── フロントページの続き (72)発明者 江村 里志 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平4−268988(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04N 1/403 G06K 9/38 ────────────────────────────────────────────────── ─── Continued on the front page (72) Inventor Satoshi Emura 1006 Kazuma Kadoma, Kadoma City, Osaka Inside Matsushita Electric Industrial Co., Ltd. (56) References JP-A-4-268988 (JP, A) (58) Survey Field (Int.Cl. 7 , DB name) H04N 1/403 G06K 9/38

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 文書等の文字画像を含む濃淡画像データ
に対し、二値化する画像領域を指定する領域指定ステッ
プと、 指定された領域に対して領域内濃度情報に基づいて二値
化閾値を決定する二値化閾値決定ステップと、 前記領域指定ステップにおいて指定された画像領域を、
前記二値化閾値決定ステップにおいて決定された二値化
閾値で二値化し、当該画像領域の二値画像を生成する二
値画像生成ステップと、 前記二値画像生成ステップにより生成された画像領域が
1文字領域であるかどうかを判定する領域判定ステップ
と、 前記領域判定ステップによって、1文字領域でないと判
断された場合に前記二値画像を黒部分の存在する領域毎
に分割し、前記領域指定ステップに分割された各領域を
渡す領域分割ステップと、 前記1文字領域判定ステップによって、1文字領域であ
ると判定された各領域を合成して最終二値画像とする二
値画像合成ステップ包含することを特徴とする画像
処理方法。
1. An area specifying step of specifying an image area to be binarized for grayscale image data including a character image such as a document, and a binarization threshold based on density information in the area for the specified area. A binarization threshold value determining step of determining the image area specified in the area specifying step,
A binary image generation step of binarizing with the binarization threshold determined in the binarization threshold determination step and generating a binary image of the image area, and an image area generated by the binary image generation step An area determining step of determining whether the area is a one-character area; and if the area determining step determines that the area is not a one-character area, the binary image is divided for each area where a black portion exists, and the area specification is performed. a region dividing step of passing the respective regions divided into the step, by said one character area determination step, each region is determined to be a single character area combined to the binary image synthesis step of the final binary image image processing method characterized by comprising.
【請求項2】 前記二値化閾値決定ステップは、指定さ
れた二値化領域に対して領域内濃度情報及び領域サイズ
情報の双方を用いて二値化閾値を決定することを特徴と
する請求項記載の画像処理方法。
Wherein said binarization threshold determination step, claims and determines the binarization threshold using both the area density information and area size information for a given binarized region Item 10. The image processing method according to Item 1 .
【請求項3】 文章等の文字画像を含む濃淡画像データ
に二値画像データに変換する画像処理方法を実行する画
像処理装置であって、 前記画像処理装置は、 文書等の文字画像を含む濃淡画像データ中の指定された
領域に対して二値化閾値に基づき二値画像を生成する二
値画像生成部と、 指定された複数の領域の二値画像を合成する二値画像合
成部とを備え、 前記画像処理方法は、 文書等の文字画像を含む濃淡画像データに対し、二値化
する画像領域を指定する領域指定ステップと、 指定された領域に対して領域内濃度情報に基づいて二値
化閾値を決定する二値 化閾値決定ステップと、 前記領域指定ステップにおいて指定された画像領域を、
前記二値化閾値決定ステップにおいて決定された二値化
閾値で二値化し、当該画像領域の二値画像を前記二値画
像生成部により生成する二値画像生成ステップと、 前記二値画像生成ステップにより生成された画像領域が
1文字領域であるかどうかを判定する領域判定ステップ
と、 前記領域判定ステップによって、1文字領域でないと判
断された場合に前記二値画像を黒部分の存在する領域毎
に分割し、前記領域指定ステップに分割された各領域を
渡す領域分割ステップと、 前記1文字領域判定ステップによって、1文字領域であ
ると判定された各領域を指定し、前記二値画像合成部に
より合成して最終二値画像とする二値画像合成ステップ
を包含する、画像処理装置。
3. Gray-scale image data including a character image such as a sentence
To execute the image processing method to convert to binary image data
An image processing apparatus, wherein the image processing apparatus includes a designated image data in gray image data including a character image such as a document.
Generate a binary image based on a binarization threshold for a region
A binary image generating unit for combining binary images of a plurality of designated areas with a binary image generating unit;
And an image processing method , wherein the image processing method binarizes grayscale image data including a character image such as a document.
Area specifying step for specifying an image area to be processed, and binary processing based on the density information in the area for the specified area.
Binarization threshold value determining step of determining a binarization threshold, and the image region designated in the region designation step,
Binarization determined in the binarization threshold determination step
Binarize with a threshold, and convert the binary image of the image area to the binary image
A binary image generating step generated by an image generating unit, and an image area generated by the binary image generating step is
Area determination step for determining whether the area is a one-character area
The area determination step determines that the area is not a one-character area.
When the binary image is cut off, the binary image is
And each area divided in the area specifying step is
In the area dividing step to be passed and the one-character area determining step, the one-character area is determined.
Each area determined to be
Image compositing step for compositing to make the final binary image
An image processing apparatus, comprising:
【請求項4】 前記二値化閾値決定ステップは、指定さ4. The method according to claim 1, wherein the step of determining a binarization threshold value comprises
れた二値化領域に対して領域内濃度情報及び領域サイズDensity information and area size for the selected binarized area
情報の双方を用いて二値化閾値を決定することを特徴とDetermining the binarization threshold using both of the information
する請求項3記載の画像処理装置。The image processing apparatus according to claim 3, wherein:
JP05232271A 1993-08-24 1993-08-24 Image processing apparatus and image processing method Expired - Fee Related JP3127676B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05232271A JP3127676B2 (en) 1993-08-24 1993-08-24 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05232271A JP3127676B2 (en) 1993-08-24 1993-08-24 Image processing apparatus and image processing method

Publications (2)

Publication Number Publication Date
JPH0765123A JPH0765123A (en) 1995-03-10
JP3127676B2 true JP3127676B2 (en) 2001-01-29

Family

ID=16936632

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05232271A Expired - Fee Related JP3127676B2 (en) 1993-08-24 1993-08-24 Image processing apparatus and image processing method

Country Status (1)

Country Link
JP (1) JP3127676B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4077094B2 (en) 1998-12-11 2008-04-16 富士通株式会社 Color document image recognition device
JP2001060247A (en) 1999-06-14 2001-03-06 Fuji Xerox Co Ltd Device and method for image processing
KR100703284B1 (en) * 2003-01-30 2007-04-03 삼성전자주식회사 Device and method for binarization of image using quadratic filter and improved quadratic filter
JP6171167B2 (en) * 2012-12-28 2017-08-02 日本電産サンキョー株式会社 Character recognition device, character recognition method, and character recognition program

Also Published As

Publication number Publication date
JPH0765123A (en) 1995-03-10

Similar Documents

Publication Publication Date Title
US6393150B1 (en) Region-based image binarization system
US6298151B1 (en) Method and apparatus for automatic image segmentation using template matching filters
Fu et al. Data hiding in halftone images by stochastic error diffusion
US6144461A (en) Method for generating rendering tags to facilitate the printing of antialiased images
JP2967014B2 (en) Image processing device
JP3176195B2 (en) Image processing device
US5177795A (en) Image processing apparatus
JP3886727B2 (en) Image processing device
JP3127676B2 (en) Image processing apparatus and image processing method
JPS58220563A (en) Character and pattern picture image extracting system
JPH0725064A (en) Picture forming equipment of electrophotographic printer
JP2514309B2 (en) Method and apparatus for generating a bi-level image representation
JP3262425B2 (en) Image processing device
JPH0335374A (en) Method and instrument for discriminating between character region and photograph region in document
JP3045555B2 (en) Binarization processing method for multi-tone image information
Ciobanu et al. Image restoration for halftone pattern printed pictures in old books
JP3358133B2 (en) Image processing device
JP2522310B2 (en) Optical character reader
JP3036244B2 (en) Image signal processing device
KR100242298B1 (en) Image processing method for converting gray-scale image of text document into binary image
JP3225138B2 (en) Image processing apparatus and image processing method
Fu et al. A set of mutually watermarked halftone images
JPH06152947A (en) Image processor
JP3054315B2 (en) Image processing method and apparatus
JP4081957B2 (en) Image processing device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees